專利名稱:一對轉(zhuǎn)錄激活子樣效應因子核酸酶l3和r1及其編碼基因與應用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及基因工程領(lǐng)域,尤其涉及一對轉(zhuǎn)錄激活子樣效應因子核酸酶及其編碼基因與應用。
背景技術(shù):
常見的血型系統(tǒng)除了 ABO血型,還有Rh血型。Rh血型分為Rh+和Rh-。RH陽性者可以接受RH陰性者的血液,但RH陰性者不能接受RH陽性者血液,因為RH陽性血液中的抗原將刺激RH陰性人體產(chǎn)生RH抗體。如果再次輸入RH陽性血液,即可導致溶血性輸血反應。而根據(jù)有關(guān)資料介紹,Rh陽性血型在中國漢族及大多數(shù)民族人中約占99. 7%,所以造成在我國Rh-的血型極為稀少,有很多病人因為沒有合適配型的血液而失去生命。因此Rh-血 也有熊貓血之稱。已經(jīng)鑒定出的Rh血型系統(tǒng)的抗原有50多種,其中抗原D,C,c,E,和e是最要的。其中抗原D由RHD基因表達,抗原C,c,E,e由RHCE基因表達,如果能把該兩個基因敲除,則RH陽性的血液則變成RH陰性。因RHD基因和RHCE基因同源性較高,本發(fā)明針對RHD基因和RHCE基因中的一段完全相同的序列,設(shè)計TALEN,已達到基因敲除的目的按照人類的意愿對基因組進行定向靶向修飾一直是許多科學家的夢想。在內(nèi)源的基因組上特異地刪除或加入我們需要的序列,這樣可以構(gòu)建出各種動物模型用于生物學基礎(chǔ)研究和疾病機理研究人們一直沒有找到簡單高效的方法對基因組進行基因組靶向修飾。傳統(tǒng)的基因打靶技術(shù)依賴于細胞內(nèi)自然發(fā)生的同源染色體隨機交換,其打靶效率非常低,通常只有10_6-10_8,這種打靶方法只在小鼠中得到了廣泛了應用,而在其他模式動物及大型哺乳動物中都因效率太低而得不到廣泛應用。近年發(fā)展很快的序列特異的核酸酶可以用于精確的基因組靶向修飾。一般由序列特異的核酸酶由一個DNA識別結(jié)構(gòu)域和一個非特異性核酸內(nèi)切酶結(jié)構(gòu)域構(gòu)成。原理是首先由DNA識別域把核酸酶定位到需要編輯的基因組區(qū)域,然后非特異性核酸內(nèi)切酶切斷雙鏈DNA從而造成DNA雙鏈斷裂(double-strand break,DSB),引入的DSB激活的DNA自我修復可以引起基因的突變和促進該位點DNA同源重組。鋅指核酸酶(Zinc-finger nucleases,ZFN)是現(xiàn)在研究最清楚也是應用最廣的序列特異的核酸酶。其原理是兩個鋅指蛋白特異識別兩段相隔5-7bp的DNA序列,并把與之融合表達的非特異性DNA切割蛋白Fokl的兩個單聚體定位到了一起,DNA切割蛋白形成雙聚體時可以切斷該位置的雙鏈DNA,從而造成DSB。ZFN的出現(xiàn)使基因組靶向修飾技術(shù)向前邁進了一大步,然而,ZFN技術(shù)還存在靶向不確定性、效率低、拖把率高等問題,研究者很難自行設(shè)計出特異和高效的靶向基因組目的序列的鋅指核酸酶仍然是制約ZFN廣泛應用的瓶頸。而商業(yè)購買高效特異的鋅指核酸酶又價格昂貴(20萬人民幣/基因),一般研究者或商業(yè)公司根本無法承受這筆費用。
2009年兩個研究組發(fā)現(xiàn)植物病原體Xanthomonas中的一種可以調(diào)節(jié)植物基因表達的轉(zhuǎn)錄激活子樣效應因子(transcription activator-like effector,TALE)表現(xiàn)出DNA結(jié)合特異性,而其識別密碼具有模塊化和簡單化的特點,為科學家們開發(fā)出更簡易的新型基因組祀向修飾技術(shù)帶來了新希望。TALE與Fokl融合后即形成轉(zhuǎn)錄激活子樣效應因子核酸酶(transcriptionactivator-like effector nucleases, TALEN)。TALEN 的打祀原理與 ZFN 相同,只是識別特異DNA的蛋白不同。TALEs由數(shù)十個特異性識別DNA的串聯(lián)“蛋白模塊”和兩側(cè)的N-末端及C-末端序列組成。每個“蛋白模塊”包含34個氨基酸,第12和13位殘基是靶向識別的關(guān)鍵位點,被稱作重復可變的di-residues (RVDs)位點。然而不同于每個鋅指蛋白識別特異性的三聯(lián)體堿基,TALEs上的每個RVDs僅能識別一個堿基。Sangamo BioSciences公司和哈佛大學的兩個研究小組分別利用TALEs技術(shù)進行了基因組靶向修飾相關(guān)研究,兩篇研究論文發(fā)表在同一期的《自然生物技術(shù)》(Nature
Biotechnology)雜志上。Edward Rebar領(lǐng)導的研究小組將帶有不同C-末端TALE的截短片段連接到核酸酶FokI的催化結(jié)構(gòu)域上。當研究人員將構(gòu)建的TALENs靶向內(nèi)源性的人類NTF3和CCR5基因時,證實TALENs能夠特異性地對這些基因片段進行剪切。哈佛大學研究小組開發(fā)了一種基于分層連接的策略來構(gòu)建包含12個重復模塊的TALEs。他們在保留RVDs的基礎(chǔ)上減少了每個模塊的DNA序列,同時將剩余序列的重復性降到最低。進而通過12重PCR獲得了帶有特異性連接序列的單體,并將其克隆至包含TALE N-末端和C-末端序列的骨架載體中。為了構(gòu)建TALE轉(zhuǎn)錄因子,研究人員又將TALE融合到一個轉(zhuǎn)錄因子的激活域。在接下來的靶向性檢測中,研究人員證實其能特異地使四個檢測內(nèi)源基因中的兩個基因表達上調(diào)。今年7月MIT的Rudolf Jaenisch小組也驗證了 TALEN在人胚胎干細胞和人iPSC中的打靶效果。其通過在五個位點的TALENs與之前其在相同位置的ZFNs的打靶效果作對t匕,得出五組TALENs在打靶效率和精確度上都與從Sangamo BioSciences公司購買的ZFNs相似,進一步驗證了 TALENs是非常好的基因組編輯工具。
發(fā)明內(nèi)容
本發(fā)明提供了一對短肽,利用這對短肽構(gòu)建獲得的一對轉(zhuǎn)錄激活子樣效應因子(TALE)能夠特異性地識別人RHD基因或RHCE基因組上的二段相鄰核苷酸;利用這對轉(zhuǎn)錄激活子樣效應因子構(gòu)建獲得的一對轉(zhuǎn)錄激活子樣效應因子核酸酶(TALEN),能夠?qū)θ薘HD基因或RHCE基因進行準確、高效地打靶。一對短肽,所述一對短肽分別具有如SEQ ID NO. I和SEQ ID NO. 2所示的氨基酸序列。本發(fā)明提供了一對多核苷酸,所述一對多核苷酸分別編碼上述的一對短肽。優(yōu)選地,所述一對多核苷酸分別具有如SEQ ID NO. 3和SEQ ID NO. 4所示的堿基序列。其中,所述的多核苷酸由分別識別人RHCE基因或RHD基因上核苷酸序列中相應堿基的TALENs識別模塊依序連接而成,其中,識別堿基A的TALENs識別模塊為NIA,識別堿基T的TALENs識別模塊為NG-T,識別堿基C的TALENs識別模塊為HD-C,識別堿基G的TALENs識別模塊為NK-G。本發(fā)明還提供了一對蛋白質(zhì),所述一對蛋白質(zhì)由上述的一對短肽兩端分別加上轉(zhuǎn)錄激活子樣效應因子氨基酸序列框架的N端和C端組成;其中,所述的轉(zhuǎn)錄激活子樣效應因子氨基酸序列框架的N端和C端為天然的或經(jīng)過人工改造的序列。這對蛋白質(zhì)可以分別特異性地識別人RHD基因或RHCE基因上的二段核苷酸序列,所述二段核苷酸序列分別選自以下二個核苷酸序列(l)ctcattctcctct (SEQ ID NO: 17序列)或者該序列的一個或二個核苷酸經(jīng)過取代所衍生的核苷酸序列;(2) ctaaggaagcgtcatagt (SEQ ID NO: 18序列)或該序列的一個或二個核苷酸經(jīng)過取代所衍生的核苷酸序列。優(yōu)選地,所述的這對蛋白質(zhì)分別具有如SEQ ID NO. 5和SEQ ID NO. 6所示的氨基·酸序列。該蛋白質(zhì)為轉(zhuǎn)錄激活子樣效應因子,命名為RH-TALE-L3和RH-TALE-Rl。本發(fā)明還提供了一對多核苷酸,所述一對多核苷酸分別編碼上述的一對蛋白質(zhì)。優(yōu)選地,所述一對多核苷酸分別具有如SEQ ID NO. 7和SEQ ID NO. 8所示的堿基序列。本發(fā)明還提供了一對融合蛋白,所述一對融合蛋白由上述的一對蛋白質(zhì)分別與DNA切割蛋白融合而成。優(yōu)選地,所述的DNA切割蛋白為DNA內(nèi)切酶。優(yōu)選地,所述的一對蛋白質(zhì)分別與DNA切割蛋白的二個亞基融合。更優(yōu)選地,所述的DNA切割蛋白為天然的或經(jīng)過人工改造的Fokl DNA內(nèi)切酶。最優(yōu)選地,所述一對融合蛋白分別具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列。該融合蛋白為轉(zhuǎn)錄激活子樣效應因子核酸酶,命名為RH-TALEN-L3和RH-TALEN-R1。本發(fā)明還提供了一對多核苷酸,所述一對多核苷酸分別編碼上述的一對融合蛋白質(zhì)。優(yōu)選地,所述一對多核苷酸分別具有如SEQ ID NO. 11和SEQ ID NO. 12所示的堿
基序列。本發(fā)明還提供了一種包含上述一對多核苷酸中的任意一條多核苷酸的重組載體。優(yōu)選地,可以先將能特異性識別SEQ ID NO. 17或SEQ ID NO. 22所示堿基序列的多核苷酸連接到中間載體pCMV-NLS-TALE backbone-Fokl (R) -intermediate上,再將該中間載體連接到最終載體 pEFla-NLS-TALE backbone-Fokl (R) -pA 或最終載體 pEFIa-NLS-TALEbackbone-Fokl (L) -IRES-PUROpA上,構(gòu)建獲得包含編碼轉(zhuǎn)錄激活子樣效應因子核酸酶基因的質(zhì)粒載體,能表達轉(zhuǎn)錄激活子樣效應因子核酸酶。本發(fā)明還提供了一種用上述重組載體轉(zhuǎn)化的宿主細胞。優(yōu)選地,所述宿主細胞為人離體細胞;更優(yōu)選地,所述宿主細胞為人293T細胞。本發(fā)明還提供了一種上述一對融合蛋白或上述一對多核苷酸在對人RHD基因或RHCE基因靶向修飾中的應用。優(yōu)選地,所述一對融合蛋白分別具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列;所述一對多核苷酸分別具有如SEQ ID NO. 11和SEQ ID NO. 12所示的堿基序列。
本發(fā)明還提供了一種人RHD基因或RHCE基因基因打靶的方法,包括將上述一對融合蛋白或者上述一對多核苷酸或者含有這對多核苷酸的載體轉(zhuǎn)入人離體細胞,于30-37°C擴增培養(yǎng)1-4天,得到朊蛋白基因被靶向修飾的細胞。優(yōu)選地,所述一對融合蛋白分別具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列;所述一對多核苷酸分別具有如SEQ ID NO. 11和SEQ ID NO. 12所示的堿基序列。優(yōu)選地,所述人離體細胞中還轉(zhuǎn)入有抗puro蛋白或能表達抗puro蛋白的質(zhì)粒,便于篩選。本發(fā)明針對人RHD基因或RHCE基因的一個位點設(shè)計了一對轉(zhuǎn)錄激活子樣效應因子核酸酶(RH-TALEN-L3和RH-TALEN-R1 ),這對TALENs分別由可以識別RHD或RHCE基因上一段核苷酸的DNA識別結(jié)構(gòu)域與一個Fokl DNA內(nèi)切酶的兩個異源亞基融合得到。將這對轉(zhuǎn)錄激活子樣效應因子核酸酶同時轉(zhuǎn)入宿主細胞時,其能對宿主細胞RHD基因或RHCE基因的位點打靶,并使打靶位點發(fā)生基因突變,包括堿基缺失、堿基插入等,從而實現(xiàn)對人RHD 基因或RHCE基因的靶向修飾,具有特異性強、打靶效率高、準確度高等優(yōu)點。
圖I為人工設(shè)計的轉(zhuǎn)錄激活子樣效應因子核酸酶識別的DNA序列及位點;圖2為18個識別模塊連接策略示意圖;其中,A =PCR為每個識別模塊添加酶切識別序列和連接接頭過程示意圖;B =PCR為每個識別模塊添加酶切識別序列和連接接頭后示意圖;C =PCR擴增6模塊片段與中間載體示意圖;D:最終構(gòu)建的TALEN質(zhì)粒示意圖;圖3 為中間載體 pCMV-NLS-TALE backbone-Fokl (R)-intermediate 不意圖;圖4 為最終載體 pEFla-NLS-TALE backboneFokl (R) pA 不意圖;圖5 為最終載體 pEF la-NLS-TALE backboneFokl (L) -IRESPUR0-pA 示意圖;圖6為基因在打靶位點的基因型變化;其中,-表示堿基缺失,+表示堿基插入。
具體實施例方式以下實施例中所使用的技術(shù),包括PCR擴增與檢測、細胞轉(zhuǎn)染等分子生物學技術(shù),以及細胞培養(yǎng)、檢測技術(shù)等,除非特別說明,均為本領(lǐng)域內(nèi)的技術(shù)人員已知的常規(guī)技術(shù);所使用的儀器設(shè)備、試劑和細胞系等,除非是本說明書特別注明,均為一般本領(lǐng)域的研究和技術(shù)人員可以通過公共途徑獲得的。實施例ITALENs靶序列的設(shè)計I、從NCBI 上下載人RHCE基因(GENE ID :6006)和 RHD基因組序列(GENE ID :6007)2、設(shè)計引物并PCR擴增基因組上打靶位點片段,并測序,其中,PCR引物及測序引物見表I ;表I
權(quán)利要求
1.一對短肽,其特征在于,所述一對短肽分別具有如SEQ ID NO. I和SEQ ID NO. 2所示的氨基酸序列。
2.—對多核苷酸,其特征在于,所述一對多核苷酸分別編碼如權(quán)利要求I所述的一對短肽。
3.權(quán)利要求2所述一對多核苷酸,其特征在于,所述一對多核苷酸分別具有如SEQIDNO. 3和SEQ ID NO. 4所不的喊基序列。
4.一對蛋白質(zhì),其特征在于,所述一對蛋白質(zhì)由權(quán)利要求I所述的一對短肽兩端分別加上轉(zhuǎn)錄激活子樣效應因子氨基酸序列框架的N端和C端組成;其中,所述的轉(zhuǎn)錄激活子樣效應因子氨基酸序列框架的N端和C端為天然的或經(jīng)過人工改造的序列。
5.權(quán)利要求4所述一對蛋白質(zhì),其特征在于,所述一對蛋白質(zhì)分別具有如SEQID NO. 5和SEQ ID NO. 6所示的氨基酸序列。
6.—對多核苷酸,其特征在于,所述一對多核苷酸分別編碼如權(quán)利要求4或5所述的一對蛋白質(zhì)。
7.權(quán)利要求6所述一對多核苷酸,其特征在于,所述一對多核苷酸分別具有如SEQIDNO. 7和SEQ ID NO. 8所示的堿基序列。
8.一對融合蛋白,其特征在于,所述一對融合蛋白為轉(zhuǎn)錄激活子樣效應因子核酸酶,由權(quán)利要求4所述的一對蛋白質(zhì)分別與DNA切割蛋白融合而成。
9.權(quán)利要求8所述一對融合蛋白,其特征在于,由權(quán)利要求4所述的一對蛋白質(zhì)分別與DNA切割蛋白的二個亞基融合。
10.權(quán)利要求9所述一對融合蛋白,其特征在于,所述的DNA切割蛋白為天然的或經(jīng)過人工改造的Fokl DNA內(nèi)切酶。
11.權(quán)利要求8 10任一權(quán)利要求所述一對融合蛋白,其特征在于,所述一對融合蛋白分別具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列。
12.—對多核苷酸,其特征在于,所述一對多核苷酸分別編碼如權(quán)利要求8 10任一權(quán)利要求所述的一對融合蛋白。
13.—對多核苷酸,其特征在于,所述一對多核苷酸分別編碼如權(quán)利要求11所述的一對融合蛋白。
14.權(quán)利要求13所述的一對多核苷酸,其特征在于,所述一對多核苷酸分別具有如SEQID NO. 11和SEQ ID NO. 12所示的堿基序列。
15.—種重組載體,其特征在于,包含權(quán)利要求2、3、6、7、13或14任一權(quán)利要求所述一對多核苷酸中的任意一條多核苷酸。
16.一種宿主細胞,其特征在于,含有權(quán)利要求15所述重組載體。
17.—種重組載體,其特征在于,包含權(quán)利要求12所述一對多核苷酸中的任意一條多核苷酸。
18.一種宿主細胞,其特征在于,含有權(quán)利要求17所述重組載體。
19.權(quán)利要求16或18所述的宿主細胞,其特征在于,所述宿主細胞為人離體細胞。
20.權(quán)利要求11所述一對融合蛋白在對人RHD基因或RHCE基因靶向修飾中的應用。
21.如權(quán)利要求14所述一對多核苷酸在對人RHD基因或RHCE基因靶向修飾中的應用。
22.—種人RHD基因或RHCE基因打靶的方法,其特征在于,包括將權(quán)利要求11所述一對融合蛋白或者權(quán)利要求13或14所述一對多核苷酸或者含有權(quán)利要求13或14所述一對多核苷酸的重組載體轉(zhuǎn)入人離體細胞,于30-37°C擴增培養(yǎng)3-7天,得到RHD基因或RHCE基因被靶向修飾的細胞。
23.權(quán)利要求22所述的方法,其特征在于,所述人離體細胞中還轉(zhuǎn)入有抗puro蛋白或能表達抗puro蛋白的質(zhì)粒。蛋白、寡核苷酸或質(zhì)粒轉(zhuǎn)入細胞后并加入puro藥殺篩選成功轉(zhuǎn)入的細胞,于37°C藥殺3天,30-37°C擴增培養(yǎng)1_4天,得到RHD基因或RHCE基因被靶向修飾的細胞
全文摘要
本發(fā)明公開了一對轉(zhuǎn)錄激活子樣效應因子核酸酶及其編碼基因與應用。這對轉(zhuǎn)錄激活子樣效應因子核酸酶(TALEN)由一對DNA識別蛋白分別與Fok1DNA內(nèi)切酶的兩個異源亞基融合得到,可以特異性地識別人RHD或RHCE基因exon1上的兩個相鄰位點。將這對轉(zhuǎn)錄激活子樣效應因子核酸酶同時轉(zhuǎn)入宿主細胞時,其能對宿主細胞基因的exon1位點打靶,并使打靶位點發(fā)生基因突變,從而實現(xiàn)對人RHCE或RHD基因的靶向修飾,具有特異性強、打靶效率高、準確度高等優(yōu)點。
文檔編號C12N15/55GK102850444SQ20121025591
公開日2013年1月2日 申請日期2012年7月21日 優(yōu)先權(quán)日2012年7月21日
發(fā)明者吳昭, 趙金龍 申請人:上海斯丹賽生物技術(shù)有限公司