Tale蛋白及其應(yīng)用的制作方法
【專利摘要】本發(fā)明提供一種新型的TALE蛋白及其應(yīng)用,通過對(duì)400種不同RVD的篩選,成功鑒定出特異性結(jié)合某種DNA堿基,或同時(shí)結(jié)合一種以上DNA堿基的新型RVD,并檢測(cè)了它們的結(jié)合效率,將這些新型RVD用于合成高特異性和高效結(jié)合DNA靶位點(diǎn)的TALE蛋白,使TALE蛋白靶位點(diǎn)的選擇更加多樣化,并降低可能的脫靶效應(yīng)。
【專利說明】TALE蛋白及其應(yīng)用
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及基因工程領(lǐng)域,具體地說,涉及一種新型TALE蛋白及其應(yīng)用。
【背景技術(shù)】
[0002]TALEs (Transcription activator like effectors)是由多種黃單胞菌屬(Xanthomonas)細(xì)菌產(chǎn)生的用于激活宿主基因表達(dá)或促進(jìn)自身群落化的第三類分泌蛋白(Boch and Bonas, 2010; Bogdanove et al., 2010; Scholze and Boch, 2011) 0 有報(bào)道證明TALEs蛋白核酸結(jié)合域的氨基酸序列與其靶位點(diǎn)的核酸序列有較恒定的關(guān)系,TALEs蛋白中含有高度保守,以33-35個(gè)氨基酸為單元組成的串聯(lián)重復(fù)序列,而每個(gè)單元中第12、13位氨基酸具有可變性,稱為RVD (repeat-variable diresidue),負(fù)責(zé)識(shí)別和特異結(jié)合單個(gè)核苷酸(例如,NI識(shí)別A,HD識(shí)別C,NG識(shí)別T,NN識(shí)別G或A)。通過RVD與核苷酸的相互作用,TALEs 可以特異性結(jié)合革巴點(diǎn) DNA (Boch et al., 2009; Moscou and Bogdanove, 2009)。TALEs是目前將效應(yīng)蛋白帶到特定核酸序列的最有效方法之一(Bogdanove and Voytas, 2011)?;赥ALE蛋白的這一特性,已經(jīng)發(fā)展出多種應(yīng)用,用于定點(diǎn)修飾或編輯真核基因表達(dá),包括 TALE-nuclease chimeras (TALENs)技術(shù)(用于基因敲除)(Miller et al., 2011), TALE介導(dǎo)的特定基因的轉(zhuǎn)錄激活(Miller et al., 2011)或抑制(Cong et al., 2012;Garg etal.,2012;Mahfouz et al.,2012)。
[0003]自然界中存在的TALEs蛋白的RVD中,出現(xiàn)頻率最高的是NI (Asn-1le),NG(Asn-Gly),HD(His-Asp)和 NN(Asn-Asn),分別結(jié)合 A、T、C 以及 G 或 A 喊基(Boch etal., 2009; Moscou and Bogdanove, 2009)。在人工合成的TALEN或TALE轉(zhuǎn)錄因子表達(dá)基因時(shí),也是根據(jù)要結(jié)合的靶DNA序列設(shè)計(jì)對(duì)應(yīng)的TALEs RVD序列,以達(dá)到定點(diǎn)相互作用的效果。然而,盡管可以根據(jù)RVD的特異性來預(yù)測(cè)TALEs的靶位點(diǎn),許多天然的TALEs蛋白卻含有與結(jié)合位點(diǎn)并不匹配的RVD.,標(biāo)志著RVD與DNA堿基結(jié)合的特異性不是完全嚴(yán)格的。RVD特異性的不足限制了人工合成的TALE蛋白的應(yīng)用,尤其是用于結(jié)合G堿基的NN同時(shí)也以很高的親和性與A堿基結(jié)合,使得TALE設(shè)計(jì)中,對(duì)靶位點(diǎn)選擇的自由度大大降低,TALE蛋白與靶位點(diǎn)結(jié)合的效率受到影響,潛在的脫靶效應(yīng)可能性增加,尤其是在與治療相關(guān)的對(duì)脫靶效應(yīng)要求很高的應(yīng)用中難以設(shè)計(jì)與靶位點(diǎn)結(jié)合非常嚴(yán)格的TALE蛋白。
[0004]2012年,Jens Boch小組和Feng Zhang小組分別鑒定了 NH為特異性識(shí)別G堿基的RVD,但與G結(jié)合的效率低于NN,此外NK也特異性與G結(jié)合,但效率更低(Streubel, J.,C.Blucher, et al.(2012) ;Cong, L., R.Zhou, et al.(2012))。
[0005]Boch小組的研究還揭示了 N1、NG與堿基結(jié)合的親和力較弱,HD、NN與堿基結(jié)合的親和力較強(qiáng),NH則介于兩者之間,并將這幾種RVD分別稱為弱、強(qiáng)和中等RVD。對(duì)于較短的TALE蛋白,如含有10.5個(gè)重復(fù)單位的,若所含RVD都是弱和中等RVD,則TALE蛋白很難有效地結(jié)合到DNA序列上;對(duì)于較長的TALE蛋白,如含有17.5個(gè)重復(fù)單位的,若所含RVD都是弱RVD,也很難結(jié)合到DNA序列上。
[0006]TALE蛋白的結(jié)構(gòu)分析顯示,RVD中第二位氨基酸殘基(每個(gè)重復(fù)單位的第13個(gè)殘基)直接與DNA堿基發(fā)生相互作用,而第一位氨基酸殘基(每個(gè)重復(fù)單位的第12個(gè)殘基)則起到穩(wěn)定 RVD 環(huán)的作用(Deng, D.,C.Yan, et al.(2012) ;Mak, A.N., P.Bradley, etal.(2012))。
【發(fā)明內(nèi)容】
[0007]本發(fā)明的目的是提供一種新型TALE蛋白。
[0008]本發(fā)明的另一目的是提供所述TALE蛋白在基因工程領(lǐng)域中的應(yīng)用。
[0009]為了實(shí)現(xiàn)本發(fā)明目的,本發(fā)明的一種新型TALE蛋白,其氨基酸序列為:LTPEQVVAIASXX? GGKQALETVQRLLPVLCQAHG ;其中,XX’ 為 K1、R1、RG、KG、KA、CA、FA、YA、RA、PA、AA、RN、KN、CN、WN、HN、KH、GH、CH、QH、YR、QR、FR、WR、NR、ER、IR、HR、HQ、RQ、YK、WK、KK、FK、QK、RK、CK、SG、HC、KC、KS、KP、FS、KF、GR、KR、KQ、RL、MS、TT、TC、MH、LR、RC、CR、HS、HT、KT、HV、KV、FQ、RH、LQ、VR、CS、RT 或 RV。
[0010]優(yōu)選地,XX’為特異性結(jié)合A堿基的KI或RI ;特異性結(jié)合T堿基的RG、KG、KA、CA、FA、YA、RA、PA 或 AA ;特異性結(jié)合 G 堿基的 RN、KN、CN、WN、HN、KH、GH、CH、QH、YR、QR、FR、WR、NR、ER、IR、HR、HQ、RQ、YK、WK、KK、FK、QK、RK 或 CK。
[0011]更優(yōu)選地,XX’為KN、RG或KI。
[0012]最優(yōu)選地,XX’為KN或RG。
[0013]本發(fā)明還提供編碼所述TALE蛋白的基因。
[0014]本發(fā)明還提供含有編碼所述TALE蛋白的基因的載體、工程菌或宿主細(xì)胞。
[0015]本發(fā)明進(jìn)一步提供 所述的TALE蛋白在基因工程領(lǐng)域,例如基因定點(diǎn)修飾、基因捕猶、基因敲除、基因敲入、基因沉默、基因打祀等技術(shù)中的應(yīng)用。
[0016]本發(fā)明通過對(duì)400種不同RVD(即基于20種氨基酸中任意2種氨基酸的不同組合)的篩選鑒定了一系列特異性結(jié)合DNA堿基的新型RVD,并檢測(cè)了它們的結(jié)合效率。其中,KN和RG能夠顯著提升結(jié)合效率及分別特異性與G堿基和T堿基結(jié)合。
[0017]具體地,本發(fā)明建立了一整套篩選體系,包括表達(dá)TALE-VP64融合蛋白的質(zhì)粒文庫及四種報(bào)告質(zhì)粒。該文庫中共有400個(gè)不同的TALE-VP64表達(dá)質(zhì)粒(即基于20種氨基酸中任意2種氨基酸的不同組合,共400種RVD),稱為TALE-(XX’)3。這些TALE在重復(fù)序列的中間位置有三個(gè)連續(xù)的重復(fù)單位,這三個(gè)單位含有同一種新型RVD (XX’ ),400個(gè)TALE-(XX’)3對(duì)應(yīng)于400種不同的RVD。四種報(bào)告質(zhì)粒中均含有minCMV啟動(dòng)子(即將人巨細(xì)胞病毒CMV啟動(dòng)子中的增強(qiáng)子區(qū)去掉后余下的啟動(dòng)子序列)和EGFP報(bào)告基因,在minCMV啟動(dòng)子的5’端是TALE-VP64融合蛋白結(jié)合位點(diǎn)CTGGCCNNNTACGTA,其中,NNN對(duì)應(yīng)于TALE-(XX’ )3中的三個(gè)XX’。對(duì)于四種報(bào)告質(zhì)粒,結(jié)合位點(diǎn)中的N分別指代A、T、C或G。TALE-(XX’)3中的VP64序列后用2A自剪切蛋白的序列連接了 mCherry編碼基因,用于標(biāo)準(zhǔn)化EGFP蛋白的表達(dá)(圖1)。
[0018]將文庫中任一種TALE-(XX’)3與上述四種報(bào)告質(zhì)粒中的一種共轉(zhuǎn)染到HEK293T細(xì)胞后,如果含有三個(gè)新型RVD (XX’ )的重復(fù)單位能有效地結(jié)合到報(bào)告質(zhì)粒的NNN序列上,就可以顯著提高報(bào)告蛋白EGFP的表達(dá)量,可通過流式細(xì)胞儀來分析EGFP表達(dá)情況,從而鑒定出有效結(jié)合DNA堿基的新型RVD。
[0019]采用上述方法,本發(fā)明鑒定出了表I所示的新型RVD (圖2和圖3):[0020]表I鑒定得到的新型RVD
[0021]
【權(quán)利要求】
1.一種 TALE 蛋白,其氨基酸序列為:LTPEQVVAIASXX’ GGKQALETVQRLLPVLCQAHG ; 其中,XX,為 K1、R1、RG、KG、KA、CA、FA、YA、RA、PA、AA、RN、KN、CN、WN、HN、KH、GH、CH、QH、YR、QR、FR、WR、NR、ER、IR、HR、HQ、RQ、YK、WK、ΚΚ、FK、QK、RK、CK、SG、HC、KC、KS、KP、FS、KF、GR、KR、KQ、RL、MS、TT、TC、MH、LR、RC、CR、HS、HT、KT、HV、KV、FQ、RH、LQ、VR、CS、RT 或RV。
2.根據(jù)權(quán)利要求1所述的TALE蛋白,其特征在于,XX,為K1、R1、RG、KG、KA、CA、FA、YA、RA、PA、AA、RN、KN、CN、WN、HN、KH、GH、CH、QH、YR、QR、FR、WR、NR、ER、IR、HR、HQ、RQ、YK、WK、KK、FK、QK、RK*CK。
3.根據(jù)權(quán)利要求2所述的TALE蛋白,其特征在于,XX’為KN、RG或KI。
4.根據(jù)權(quán)利要求3所述的TALE蛋白,其特征在于,XX’為KN或RG。
5.編碼權(quán)利要求1-4任一項(xiàng)所述TALE蛋白的基因。
6.含有權(quán)利要求5所述基因的載體。
7.含有權(quán)利要求5所述基因的宿主細(xì)胞。
8.權(quán)利要求1-4任一項(xiàng)所述的TALE蛋白在基因定點(diǎn)修飾、基因捕獲、基因敲除、基因敲入、基因沉默、基因打靶中的應(yīng)用。
【文檔編號(hào)】C12N15/31GK103435691SQ201310351482
【公開日】2013年12月11日 申請(qǐng)日期:2013年8月13日 優(yōu)先權(quán)日:2013年8月13日
【發(fā)明者】魏文勝, 楊君嬌, 張媛 申請(qǐng)人:北京大學(xué)