本發(fā)明涉及基因編輯領(lǐng)域,特別是規(guī)律成簇的間隔短回文重復(fù)(crispr)。具體而言,本發(fā)明涉及一種活性提高的突變的cas12j蛋白及其應(yīng)用。
背景技術(shù):
::1、crispr/cas技術(shù)是一種被廣泛使用的基因編輯技術(shù),它通過(guò)rna引導(dǎo)對(duì)基因組上的靶序列進(jìn)行特異性結(jié)合并切割dna產(chǎn)生雙鏈斷裂,利用生物非同源末端連接或同源重組進(jìn)行定點(diǎn)基因編輯。2、crispr/cas9系統(tǒng)是最常用的ii型crispr系統(tǒng),它識(shí)別3’-ngg的pam基序,對(duì)靶標(biāo)序列進(jìn)行平末端切割。crispr/cas?type?v系統(tǒng)是一類(lèi)新發(fā)現(xiàn)的crispr系統(tǒng),它具有5’-ttn的基序,對(duì)靶標(biāo)序列進(jìn)行粘性末端切割,例如cpf1,c2c1,casx,casy。然而目前存在的不同的crispr/cas各有不同的優(yōu)點(diǎn)和缺陷。例如cas9,c2c1和casx均需要兩條rna進(jìn)行指導(dǎo)rna,而cpf1只需要一條指導(dǎo)rna而且可以用來(lái)進(jìn)行多重基因編輯。casx具有980個(gè)氨基酸的大小,而常見(jiàn)的cas9,c2c1,casy和cpf1通常大小在1300個(gè)氨基酸左右。此外,cas9,cpf1,casx,casy的pam序列都比較復(fù)雜多樣,而c2c1識(shí)別嚴(yán)謹(jǐn)?shù)?’-ttn,因此它的靶標(biāo)位點(diǎn)比其他系統(tǒng)容易被預(yù)測(cè)從而降低了潛在的脫靶效應(yīng)。3、中國(guó)發(fā)明專(zhuān)利cn111770992b中公開(kāi)了一種cas蛋白cas12j.19,還公開(kāi)了該蛋白可以在真核細(xì)胞中進(jìn)行基因編輯,但是,其編輯活性并不高,為了提高該蛋白的編輯效率,本技術(shù)對(duì)該蛋白進(jìn)行了優(yōu)化,提高了其在真核細(xì)胞中的編輯效率。技術(shù)實(shí)現(xiàn)思路1、本技術(shù)的發(fā)明人經(jīng)過(guò)大量實(shí)驗(yàn)和反復(fù)摸索,通過(guò)對(duì)cas12j.19(本技術(shù)中將其稱(chēng)之為,cas12j19)蛋白的定點(diǎn)突變,提高了其編輯活性,擴(kuò)展了其應(yīng)用范圍。2、cas效應(yīng)蛋白3、一方面,本發(fā)明提供了一種活性改善或活性提高的cas突變蛋白,所述突變蛋白與親本cas蛋白的氨基酸序列相比,在對(duì)應(yīng)于seq?id?no.1所示氨基酸序列的以下任一或任意幾個(gè)氨基酸位點(diǎn)處存在突變:第3位、第4位、第99位、第154位、第228位、第231位、第400位、第411位、第647位、第649位或第658位。4、在一個(gè)實(shí)施方式中,所述突變蛋白與親本cas蛋白的氨基酸序列相比,在對(duì)應(yīng)于seq?id?no.1所示氨基酸序列的以下任一或任意幾個(gè)氨基酸位點(diǎn)處存在突變:第3位、第4位、第99位、第154位、第228位、第231位、第400位、第411位、第647位、第649位或第658位;所述任意幾個(gè)選自:任意2個(gè)、任意3個(gè)、任意4個(gè)、任意5個(gè)、任意6個(gè)、任意7個(gè)、任意8個(gè)、任意9個(gè)、任意10個(gè)或任意11個(gè)。5、在一個(gè)實(shí)施方式中,所述cas突變蛋白與親本cas蛋白的氨基酸序列相比,在對(duì)應(yīng)于seq?id?no.1所示氨基酸序列還包括以下氨基酸位點(diǎn)的突變:第100位。6、在一個(gè)實(shí)施方式中,所述cas突變蛋白與親本cas蛋白的氨基酸序列相比,在對(duì)應(yīng)于seq?id?no.1所示氨基酸序列的以下氨基酸位點(diǎn)處存在突變:7、第100位氨基酸和第3位氨基酸同時(shí)突變;8、或,第100位氨基酸和第99位氨基酸同時(shí)突變;9、或,第100位氨基酸和第154位氨基酸同時(shí)突變;10、或,第100位氨基酸和第231位氨基酸同時(shí)突變;11、或,第100位氨基酸和第400位氨基酸同時(shí)突變;12、或,第100位氨基酸和第411位氨基酸同時(shí)突變;13、或,第100位氨基酸和第647位氨基酸同時(shí)突變;14、或,第100位氨基酸和第649位氨基酸同時(shí)突變;15、或,第100位氨基酸和第658位氨基酸同時(shí)突變;16、或,第100位氨基酸、第400位氨基酸和第763位氨基酸同時(shí)突變;17、或,第100位氨基酸、第400為氨基酸、第763位氨基酸和第45位氨基酸同時(shí)突變。18、在一個(gè)實(shí)施方式中,所述第3位氨基酸突變?yōu)榉莝的氨基酸,例如,a,v,g,l,d,f,w,y,n,e,q,k,m,t,c,p,h,r,i;優(yōu)選,突變?yōu)閞。19、在一個(gè)實(shí)施方式中,所述第4位氨基酸突變?yōu)榉莥的氨基酸,例如,a,v,g,l,d,f,w,s,n,e,q,k,m,t,c,p,h,r,i;優(yōu)選,突變?yōu)閞。20、在一個(gè)實(shí)施方式中,所述第99位氨基酸突變?yōu)榉莑的氨基酸,例如,a,v,g,y,d,f,w,s,n,e,q,k,m,t,c,p,h,r,i;優(yōu)選,突變?yōu)閞。21、在一個(gè)實(shí)施方式中,所述第154位氨基酸或第231位氨基酸突變?yōu)榉莂的氨基酸,例如,l,v,g,y,d,f,w,s,n,e,q,k,m,t,c,p,h,r,i;優(yōu)選,突變?yōu)閞。22、在一個(gè)實(shí)施方式中,所述第228位氨基酸或第400位氨基酸突變?yōu)榉莝的氨基酸,例如,a,v,g,y,d,f,w,l,n,e,q,k,m,t,c,p,h,r,i;優(yōu)選,突變?yōu)閞。23、在一個(gè)實(shí)施方式中,所述第411位氨基酸或第647位氨基酸突變?yōu)榉莟的氨基酸,例如,a,v,g,l,d,f,w,y,n,e,q,k,m,s,c,p,h,r,i;優(yōu)選,突變?yōu)閞。24、在一個(gè)實(shí)施方式中,所述第649位氨基酸或第658位氨基酸突變?yōu)榉莇的氨基酸,例如,a,v,g,l,s,f,w,y,n,e,q,k,m,t,c,p,h,r,i;優(yōu)選,突變?yōu)閞。25、在一個(gè)實(shí)施方式中,所述第100位氨基酸突變?yōu)榉莈的氨基酸,例如,a,v,g,l,s,f,w,y,n,d,q,k,m,t,c,p,h,r,i;優(yōu)選,突變?yōu)閗。26、在一個(gè)實(shí)施方式中,所述第763位氨基酸突變?yōu)榉莑的氨基酸,例如,a,v,g,y,d,f,w,s,n,e,q,k,m,t,c,p,h,r,i;優(yōu)選,突變?yōu)閞。27、在一個(gè)實(shí)施方式中,所述第45位氨基酸突變?yōu)榉莝的氨基酸,例如,a,v,g,y,d,f,w,l,n,e,q,k,m,t,c,p,h,r,i;優(yōu)選,突變?yōu)閠。28、在一個(gè)實(shí)施方式中,所述親本cas蛋白的氨基酸序列與seq?id?no.1相比具有至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、或至少99.9%的序列同一性。29、在一個(gè)實(shí)施方式中,所述親本cas蛋白為cas12家族的cas蛋白,優(yōu)選,cas12j家族的cas蛋白,例如,cn111770992b公開(kāi)的cas12j.3-cas12j.22等;在優(yōu)選的實(shí)施方式中,所述親本cas蛋白為cas12j19;所述cas12j19的氨基酸序列與seq?id?no.1相比具有至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、或至少99.9%或100%的序列同一性。30、來(lái)自多種生物體的cas蛋白或cas12j蛋白都可以用作親本cas蛋白,在一些實(shí)施方式中,所述親本cas蛋白或cas12j蛋白具有核酸酶活性。在一些實(shí)施方案中,所述親本cas蛋白是核酸酶,即切割靶雙螺旋核酸(例如,雙螺旋dna)的兩條鏈。在一些實(shí)施方案中,所述親本cas蛋白是切口酶,即切割靶雙螺旋核酸(例如,雙螺旋dna)的單鏈。31、在一些實(shí)施方案中,所述親本cas蛋白為天然野生型cas蛋白;在其他的實(shí)施方式中,所述親本cas蛋白為經(jīng)過(guò)工程化改造后的cas蛋白。32、本領(lǐng)域技術(shù)人員清楚,可以改變蛋白質(zhì)的結(jié)構(gòu)而不對(duì)其活性和功能性產(chǎn)生不利影響,例如,可以在蛋白質(zhì)氨基酸序列中引入一個(gè)或多個(gè)保守性氨基酸取代,而不會(huì)對(duì)蛋白質(zhì)分子的活性和/或三維結(jié)構(gòu)產(chǎn)生不利影響。本領(lǐng)域技術(shù)人員清楚保守性氨基酸取代的實(shí)例以及實(shí)施方式。具體的說(shuō),可以用與待取代位點(diǎn)屬于相同組的另一氨基酸殘基取代該氨基酸殘基,即用非極性氨基酸殘基取代另一非極性氨基酸殘基,用極性不帶電荷的氨基酸殘基取代另一極性不帶電荷的氨基酸殘基,用堿性氨基酸殘基取代另一堿性氨基酸殘基,和用酸性氨基酸殘基取代另一酸性氨基酸殘基。這樣的取代的氨基酸殘基可以是也可以不是由遺傳密碼編碼的。只要取代不導(dǎo)致蛋白質(zhì)生物活性的失活,則一種氨基酸被屬于同組的其他氨基酸替換的保守取代落在本發(fā)明的范圍內(nèi)。因此,本發(fā)明的蛋白可以在氨基酸序列中包含一個(gè)或多個(gè)保守性取代,這些保守性取代最好根據(jù)表1進(jìn)行替換而產(chǎn)生。另外,本發(fā)明也涵蓋還包含一個(gè)或多個(gè)其他非保守取代的蛋白,只要該非保守取代不顯著影響本發(fā)明的蛋白質(zhì)的所需功能和生物活性即可。33、保守氨基酸置換可以在一個(gè)或多個(gè)預(yù)測(cè)的非必需氨基酸殘基處進(jìn)行。“非必需”氨基酸殘基是可以發(fā)生改變(缺失、取代或置換)而不改變生物活性的氨基酸殘基,而“必需”氨基酸殘基是生物活性所需的?!氨J匕被嶂脫Q”是其中氨基酸殘基被具有類(lèi)似側(cè)鏈的氨基酸殘基替代的置換。氨基酸置換可以在上述cas突變蛋白的非保守區(qū)域中進(jìn)行。一般而言,此類(lèi)置換不對(duì)保守的氨基酸殘基,或者不對(duì)位于保守基序內(nèi)的氨基酸殘基進(jìn)行,其中此類(lèi)殘基是蛋白質(zhì)活性所需的。然而,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,功能變體可以具有較少的在保守區(qū)域中的保守或非保守改變。34、表135、
最初的殘基
代表性的取代
優(yōu)選的取代
ala(a)
val;leu;ile
val
arg(r)
lys;gln;asn
lys
asn(n)
gln;his;lys;arg
gln
asp(d)
glu
glu
cys(c)
ser
ser
gln(q)
asn
asn
glu(e)
asp
asp
gly(g)
pro;ala
ala
his(h)
asn;gln;lys;arg
arg
ile(i)
leu;val;met;ala;phe
leu
leu(l)
ile;val;met;ala;phe
ile
lys(k)
arg;gln;asn
arg
met(m)
leu;phe;ile
leu
phe(f)
leu;val;ile;ala;tyr
leu
pro(p)
ala
ala
ser(s)
thr
thr
thr(t)
ser
ser
trp(w)
tyr;phe
tyr
tyr(y)
trp;phe;thr;ser
phe
val(v)
ile;leu;met;phe;ala
leu
36、本領(lǐng)域熟知,可以從蛋白質(zhì)的n和/或c末端改變(置換、刪除、截短或插入)一或多個(gè)氨基酸殘基而仍保留其功能活性。因此,從cas蛋白的n和/或c末端改變了一或多個(gè)氨基酸殘基、同時(shí)保留了其所需功能活性的蛋白,也在本發(fā)明的范圍內(nèi)。這些改變可以包括通過(guò)現(xiàn)代分子方法例如pcr而引入的改變,所述方法包括借助于在pcr擴(kuò)增中使用的寡核苷酸之中包含氨基酸編碼序列而改變或延長(zhǎng)蛋白質(zhì)編碼序列的pcr擴(kuò)增。37、應(yīng)認(rèn)識(shí)到,蛋白質(zhì)可以以各種方式進(jìn)行改變,包括氨基酸置換、刪除、截短和插入,用于此類(lèi)操作的方法是本領(lǐng)域通常已知的。例如,可以通過(guò)對(duì)dna的突變來(lái)制備上述蛋白的氨基酸序列變體。還可以通過(guò)其他誘變形式和/或通過(guò)定向進(jìn)化來(lái)完成,例如,使用已知的誘變、重組和/或改組(shuffling)方法,結(jié)合相關(guān)的篩選方法,來(lái)進(jìn)行單個(gè)或多個(gè)氨基酸取代、缺失和/或插入。38、領(lǐng)域技術(shù)人員能夠理解,本發(fā)明cas蛋白中的這些微小氨基酸變化可以出現(xiàn)(例如天然存在的突變)或者產(chǎn)生(例如使用r-dna技術(shù))而不損失蛋白質(zhì)功能或活性。如果這些突變出現(xiàn)在蛋白的催化結(jié)構(gòu)域、活性位點(diǎn)或其它功能結(jié)構(gòu)域中,則多肽的性質(zhì)可改變,但多肽可保持其活性。如果存在的突變不接近催化結(jié)構(gòu)域、活性位點(diǎn)或其它功能結(jié)構(gòu)域中,則可預(yù)期較小影響。39、本領(lǐng)域技術(shù)人員可以根據(jù)本領(lǐng)域已知的方法,例如定位誘變或蛋白進(jìn)化或生物信息系的分析,來(lái)鑒定本發(fā)明cas突變蛋白的必需氨基酸。蛋白的催化結(jié)構(gòu)域、活性位點(diǎn)或其它功能結(jié)構(gòu)域也能夠通過(guò)結(jié)構(gòu)的物理分析而確定,如通過(guò)以下這些技術(shù):如核磁共振、晶體學(xué)、電子衍射或光親和標(biāo)記,結(jié)合推定的關(guān)鍵位點(diǎn)氨基酸的突變來(lái)確定。40、本發(fā)明中,氨基酸殘基可以用單字母表示,也可以用三字母表示,例如:丙氨酸(ala,a),纈氨酸(val,v),甘氨酸(gly,g),亮氨酸(leu,l),谷酰胺酸(gln,q),苯丙氨酸(phe,f),色氨酸(trp,w),酪氨酸(tyr,y),天冬氨酸(asp,d),天冬酰胺(asn,n),谷氨酸(glu,e),賴(lài)氨酸(lys,k),甲硫氨酸(met,m),絲氨酸(ser,s),蘇氨酸(thr,t),半胱氨酸(cys,c),脯氨酸(pro,p),異亮氨酸(ile,i),組氨酸(his,h),精氨酸(arg,r)。41、術(shù)語(yǔ)“axxb”表示第xx位的氨基酸a變?yōu)榘被醔,如無(wú)特別說(shuō)明,均是從n端起第xx位的氨基酸a變?yōu)榘被醔。例如,e100k表示第100位的e突變?yōu)閗。多個(gè)氨基酸位點(diǎn)同時(shí)存在突變時(shí),可以采用e100k-s3r類(lèi)似的形式進(jìn)行表述,例如,e100k-s3r代表第100位e突變?yōu)閗同時(shí)第3位s突變?yōu)閞。42、本發(fā)明所述蛋白質(zhì)內(nèi)的特定氨基酸位置(編號(hào))是利用標(biāo)準(zhǔn)序列比對(duì)工具通過(guò)將目標(biāo)蛋白質(zhì)的氨基酸序列與seq?id?no.1進(jìn)行比對(duì)而確定的,譬如用smith-waterman運(yùn)算法則或用clustalw2運(yùn)算法則比對(duì)兩個(gè)序列,其中當(dāng)比對(duì)得分最高時(shí)認(rèn)為所述序列是對(duì)準(zhǔn)的。比對(duì)得分可依照wilbur,w.j.and?lipman,d.j.(1983)rapid?similarity?searchesofnucleic?acid?and?protein?data?banks.proc.natl.acad.sci.usa,80:726-730中所述的方法進(jìn)行計(jì)算。在clustalw2(1.82)運(yùn)算法則中優(yōu)選使用默認(rèn)參數(shù):蛋白質(zhì)缺口開(kāi)放罰分=10.0;蛋白質(zhì)缺口延伸罰分=0.2;蛋白質(zhì)矩陣=gonnet;蛋白質(zhì)/dna端隙=-1;蛋白質(zhì)/dnagapdist=4。優(yōu)選采用alignx程序(vectornti組中的一部分),以適于多重比對(duì)的默認(rèn)參數(shù)(缺口開(kāi)放罰分:10og缺口延伸罰分0.05)通過(guò)將蛋白質(zhì)的氨基酸序列與seq?idno.1進(jìn)行比來(lái)確定本發(fā)明所述蛋白質(zhì)內(nèi)特定氨基酸的位置。43、在一個(gè)實(shí)施方式中,所述cas突變蛋白選自以下i-iii任意一組:44、i、由seq?id?no.1所示氨基酸序列在包含以下任一或任意幾個(gè)氨基酸位點(diǎn)處產(chǎn)生突變得到的cas突變蛋白:第3位、第4位、第99位、第154位、第228位、第231位、第400位、第411位、第647位、第649位或第658位;45、ii、與i所述的cas突變蛋白相比,具有i中所述的突變位點(diǎn);并且,與i所述的cas突變蛋白相比,具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性的cas突變蛋白;46、iii、與i所述的cas突變蛋白相比,具有i中所述的突變位點(diǎn);并且,與i所述的cas突變蛋白相比,具有一個(gè)或多個(gè)氨基酸的置換、缺失或添加的序列;所述一個(gè)或多個(gè)氨基酸包括1個(gè),2個(gè),3個(gè),4個(gè),5個(gè),6個(gè),7個(gè),8個(gè),9個(gè)或10個(gè)氨基酸的置換、缺失或添加。47、在一個(gè)實(shí)施方式中,所述cas突變蛋白選自以下i-iii任意一組:48、i、由seq?id?no.1所示氨基酸序列在包含以下任一或任意幾個(gè)氨基酸位點(diǎn)處產(chǎn)生突變得到的cas突變蛋白:第3位、第4位、第99位、第154位、第228位、第231位、第400位、第411位、第647位、第649位或第658位;并且,所述cas突變蛋白還在對(duì)應(yīng)于seq?id?no.1所示氨基酸序列的第100位、第763位或第43位氨基酸的任一或任意幾個(gè)氨基酸位點(diǎn)存在突變;49、ii、與i所述的cas突變蛋白相比,具有i中所述的突變位點(diǎn);并且,與i所述的cas突變蛋白相比,具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性的cas突變蛋白;50、iii、與i所述的cas突變蛋白相比,具有i中所述的突變位點(diǎn);并且,與i所述的cas突變蛋白相比,具有一個(gè)或多個(gè)氨基酸的置換、缺失或添加的序列;所述一個(gè)或多個(gè)氨基酸包括1個(gè),2個(gè),3個(gè),4個(gè),5個(gè),6個(gè),7個(gè),8個(gè),9個(gè)或10個(gè)氨基酸的置換、缺失或添加。51、在一個(gè)實(shí)施方式中,所述cas突變蛋白選自以下i-iii任意一組:52、i、由seq?id?no.1所示氨基酸序列在包含以下任一或任意幾個(gè)氨基酸位點(diǎn)處產(chǎn)生突變得到的cas突變蛋白:第3位、第4位、第99位、第154位、第228位、第231位、第400位、第411位、第647位、第649位或第658位;并且,所述cas突變蛋白在對(duì)應(yīng)于seq?id?no.1所示氨基酸序列的第100位氨基酸位點(diǎn)為k;53、ii、與i所述的cas突變蛋白相比,具有i中所述的突變位點(diǎn);并且,與i所述的cas突變蛋白相比,具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性的cas突變蛋白;54、iii、與i所述的cas突變蛋白相比,具有i中所述的突變位點(diǎn);并且,與i所述的cas突變蛋白相比,具有一個(gè)或多個(gè)氨基酸的置換、缺失或添加的序列;所述一個(gè)或多個(gè)氨基酸包括1個(gè),2個(gè),3個(gè),4個(gè),5個(gè),6個(gè),7個(gè),8個(gè),9個(gè)或10個(gè)氨基酸的置換、缺失或添加。所述cas蛋白的生物學(xué)功能包括但不限于,與指導(dǎo)rna結(jié)合的活性、核酸內(nèi)切酶活性、在指導(dǎo)rna引導(dǎo)下與靶序列特定位點(diǎn)結(jié)合并切割的活性,包括但不限于cis切割活性和trans切割活性。55、本發(fā)明中,“cas突變蛋白”也可以稱(chēng)之為突變的cas蛋白,或者cas蛋白變體。56、本發(fā)明還提供了一種融合蛋白,所述融合蛋白包括如上所述的cas突變蛋白和其他的修飾部分。57、在一個(gè)實(shí)施方式中,所述修飾部分選自另外的蛋白或多肽、可檢測(cè)的標(biāo)記或其任意組合。58、在一個(gè)實(shí)施方式中,所述修飾部分選自表位標(biāo)簽、報(bào)告基因序列、核定位信號(hào)(nls)序列、靶向部分、轉(zhuǎn)錄激活結(jié)構(gòu)域(例如,vp64)、轉(zhuǎn)錄抑制結(jié)構(gòu)域(例如,krab結(jié)構(gòu)域或sid結(jié)構(gòu)域)、核酸酶結(jié)構(gòu)域(例如,fok1),以及具有選自下列的活性的結(jié)構(gòu)域:核苷酸脫氨酶,腺苷脫氨酶,胞苷脫氨酶,甲基化酶活性,去甲基化酶,轉(zhuǎn)錄激活活性,轉(zhuǎn)錄抑制活性,轉(zhuǎn)錄釋放因子活性,組蛋白修飾活性,核酸酶活性,單鏈rna切割活性,雙鏈rna切割活性,單鏈dna切割活性,雙鏈dna切割活性和核酸結(jié)合活性;以及其任意組合。所述nls序列是本領(lǐng)域技術(shù)人員熟知的,其實(shí)例包括但不限于所述,sv40大t抗原,egl-13,c-myc以及tus蛋白。59、在一個(gè)實(shí)施方式中,所述nls序列位于、靠近或接近本發(fā)明的cas蛋白的末端(例如,n端、c端或兩端)。60、所述表位標(biāo)簽(epitope?tag)是本領(lǐng)域技術(shù)人員熟知的,包括但不限于his、v5、flag、ha、myc、vsv-g、trx等,并且本領(lǐng)域技術(shù)人員可以選擇其他合適的表位標(biāo)簽(例如,純化、檢測(cè)或示蹤)。61、所述報(bào)告基因序列是本領(lǐng)域技術(shù)人員熟知的,其實(shí)例包括但不限于gst、hrp、cat、gfp、hcred、dsred、cfp、yfp、bfp等。62、在一個(gè)實(shí)施方式中,本發(fā)明的融合蛋白包含能夠與dna分子或細(xì)胞內(nèi)分子結(jié)合的結(jié)構(gòu)域,例如麥芽糖結(jié)合蛋白(mbp)、lex?a的dna結(jié)合結(jié)構(gòu)域(dbd)、gal4的dbd等。63、在一個(gè)實(shí)施方式中,本發(fā)明的融合蛋白包含可檢測(cè)的標(biāo)記,例如熒光染料,例如fitc或dapi。64、在一個(gè)實(shí)施方式中,本發(fā)明的cas蛋白任選地通過(guò)接頭與所述修飾部分偶聯(lián)、綴合或融合。65、在一個(gè)實(shí)施方式中,所述修飾部分直接連接至本發(fā)明的cas蛋白的n端或c端。66、在一個(gè)實(shí)施方式中,所述修飾部分通過(guò)接頭連接至本發(fā)明的cas蛋白的n端或c端。這類(lèi)接頭是本領(lǐng)域熟知的,其實(shí)例包括但不限于包含一個(gè)或多個(gè)(例如,1個(gè),2個(gè),3個(gè),4個(gè)或5個(gè))氨基酸(如,glu或ser)或氨基酸衍生物(如,ahx、β-ala、gaba或ava)的接頭,或peg等。67、本發(fā)明的cas蛋白、蛋白衍生物或融合蛋白不受其產(chǎn)生方式的限定,例如,其可以通過(guò)基因工程方法(重組技術(shù))產(chǎn)生,也可以通過(guò)化學(xué)合成方法產(chǎn)生。68、cas蛋白的核酸69、另一方面,本發(fā)明提供了一種分離的多核苷酸,其包含:70、(a)編碼本發(fā)明的cas突變蛋白或融合蛋白的多核苷酸序列;71、或者,與(a)所述的多核苷酸互補(bǔ)的多核苷酸。72、在一個(gè)實(shí)施方式中,所述的核苷酸序列經(jīng)密碼子優(yōu)化用于在原核細(xì)胞中進(jìn)行表達(dá)。在一個(gè)實(shí)施方式中,所述的核苷酸序列經(jīng)密碼子優(yōu)化用于在真核細(xì)胞中進(jìn)行表達(dá)。73、在一個(gè)實(shí)施方式中,所述細(xì)胞是動(dòng)物細(xì)胞,例如,哺乳動(dòng)物細(xì)胞。74、在一個(gè)實(shí)施方式中,所述細(xì)胞是人類(lèi)細(xì)胞。75、在一個(gè)實(shí)施方式中,所述細(xì)胞是植物細(xì)胞,例如栽培植物(如木薯、玉米、高粱、小麥或水稻)、藻類(lèi)、樹(shù)或蔬菜具有的細(xì)胞。76、在一個(gè)實(shí)施方式中,所述的多核苷酸優(yōu)選是單鏈的或雙鏈的。77、指導(dǎo)rna(grna)78、另一方面,本發(fā)明提供了一種grna,所述grna包括第一區(qū)段和第二區(qū)段;所述第一區(qū)段又稱(chēng)為“骨架區(qū)”、“蛋白質(zhì)結(jié)合區(qū)段”、“蛋白質(zhì)結(jié)合序列”、或者“同向重復(fù)(directrepeat)序列”;所述第二區(qū)段又稱(chēng)為“靶向核酸的靶向序列”或者“靶向核酸的靶向區(qū)段”,或者“靶向靶序列的引導(dǎo)序列”。79、所述grna的第一區(qū)段能夠與本發(fā)明的cas蛋白相互作用,從而使cas蛋白和grna形成復(fù)合物。80、在優(yōu)選的實(shí)施方式中,所述第一區(qū)段為如上所述的同向重復(fù)序列。81、本發(fā)明靶向核酸的靶向序列或靶向核酸的靶向區(qū)段包含與靶核酸中的序列互補(bǔ)的核苷酸序列。換言之,本發(fā)明靶向核酸的靶向序列或靶向核酸的靶向區(qū)段經(jīng)過(guò)雜交(即,堿基配對(duì))以序列特異性方式與靶核酸相互作用。因此,靶向核酸的靶向序列或靶向核酸的靶向區(qū)段可改變,或可被修飾以雜交靶核酸內(nèi)的任何希望的序列。所述核酸選自dna或rna。82、靶向核酸的靶向序列或靶向核酸的靶向區(qū)段與靶核酸的靶序列之間的互補(bǔ)百分比可為至少60%(例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%、至少99%或100%)。83、本發(fā)明grna的“骨架區(qū)”、“蛋白質(zhì)結(jié)合區(qū)段”、“蛋白質(zhì)結(jié)合序列”、或者“同向重復(fù)序列”可以與crispr蛋白(或者,cas蛋白)相互作用。本發(fā)明grna經(jīng)過(guò)靶向核酸的靶向序列的作用將其相互作用的cas蛋白引導(dǎo)至靶核酸內(nèi)的特異性核苷酸序列。84、優(yōu)選的,所述指導(dǎo)rna從5’至3’方向包含第一區(qū)段和第二區(qū)段。85、本發(fā)明中,所述第二區(qū)段還可以理解為與靶序列雜交的引導(dǎo)序列。86、本發(fā)明的grna能夠與所述cas蛋白形成復(fù)合物。87、載體88、本發(fā)明還提供了一種載體,其包含如上述的cas突變蛋白、分離的核酸分子或多核苷酸;優(yōu)選的,其還包括與之可操作連接的調(diào)控元件。89、在一個(gè)實(shí)施方式中,所述的調(diào)控元件選自下組中的一種或多種:增強(qiáng)子、轉(zhuǎn)座子、啟動(dòng)子、終止子、前導(dǎo)序列、多腺苷酸序列、標(biāo)記基因。90、在一個(gè)實(shí)施方式中,所述的載體包括克隆載體、表達(dá)載體、穿梭載體、整合載體。91、在一些實(shí)施方案中,所述系統(tǒng)中包括的載體是病毒載體(例如逆轉(zhuǎn)錄病毒載體,慢病毒載體,腺病毒載體,腺相關(guān)載體和單純皰疹載體),還可以是質(zhì)粒、病毒、粘粒、噬菌體等類(lèi)型,它們是本領(lǐng)域技術(shù)人員所熟知的。92、crispr系統(tǒng)93、本發(fā)明提供了一種工程化的非天然存在的載體系統(tǒng),或者是crispr-cas系統(tǒng),該系統(tǒng)包括cas突變蛋白或編碼所述cas突變蛋白的核酸序列以及編碼一種或多種指導(dǎo)rna的核酸。94、在一種實(shí)施方式中,所述編碼所述cas突變蛋白的核酸序列和編碼一種或多種指導(dǎo)rna的核酸是人工合成的。95、在一種實(shí)施方式中,所述編碼所述cas突變蛋白的核酸序列和編碼一種或多種指導(dǎo)rna的核酸并不共同天然存在。96、該一種或多種指導(dǎo)rna在細(xì)胞中靶向一個(gè)或多個(gè)靶序列。所述一個(gè)或多個(gè)靶序列與編碼一種或多種基因產(chǎn)物的dna分子的基因組座位雜交,并且引導(dǎo)該cas蛋白到達(dá)所述一種或多種基因產(chǎn)物的dna分子的基因組座位部位,cas蛋白到達(dá)靶序列位置后對(duì)靶序列進(jìn)行修飾、編輯或切割,由此該一種或多種基因產(chǎn)物的表達(dá)被改變或修飾。97、本發(fā)明的細(xì)胞包括動(dòng)物、植物或微生物中的一種或多種。98、在一些實(shí)施例中,該cas蛋白是密碼子優(yōu)化的,用于在細(xì)胞中進(jìn)行表達(dá)。99、在一些實(shí)施例中,該cas蛋白指導(dǎo)切割在該靶序列位置處的一條或兩條鏈。100、本發(fā)明還提供了一種工程化的非天然存在的載體系統(tǒng),該載體系統(tǒng)可以包括一種或多種載體,該一種或多種載體包括:101、a)第一調(diào)控元件,該第一調(diào)控元件可操作地與grna連接,102、b)第二調(diào)控元件,該第二調(diào)控元件可操作地與所述cas蛋白連接;103、其中組分(a)和(b)位于該系統(tǒng)的相同或不同載體上。104、所述第一和第二調(diào)控元件包括啟動(dòng)子(例如,組成型啟動(dòng)子或誘導(dǎo)型啟動(dòng)子)、增強(qiáng)子(例如35s?promoter或35s?enhanced?promoter)、內(nèi)部核糖體進(jìn)入位點(diǎn)(ires)、和其他表達(dá)控制元件(例如轉(zhuǎn)錄終止信號(hào),如多聚腺苷酸化信號(hào)和多聚u序列)。105、在一些實(shí)施方案中,所述系統(tǒng)中的載體是病毒載體(例如逆轉(zhuǎn)錄病毒載體,慢病毒載體,腺病毒載體,腺相關(guān)載體和單純皰疹載體),還可以是質(zhì)粒、病毒、粘粒、噬菌體等類(lèi)型,它們是本領(lǐng)域技術(shù)人員所熟知的。106、在一些實(shí)施例中,本文提供的系統(tǒng)處于遞送系統(tǒng)中。在一些實(shí)施方案中,遞送系統(tǒng)是納米顆粒,脂質(zhì)體,外體,微泡和基因槍。107、在一個(gè)實(shí)施方式中,所述靶序列是來(lái)自原核細(xì)胞或真核細(xì)胞的dna或rna序列。在一個(gè)實(shí)施方式中,所述靶序列是非天然存在的dna或rna序列。108、在一個(gè)實(shí)施方式中,所述靶序列存在于細(xì)胞內(nèi)。在一個(gè)實(shí)施方式中,所述靶序列存在于細(xì)胞核內(nèi)或細(xì)胞質(zhì)(例如,細(xì)胞器)內(nèi)。在一個(gè)實(shí)施方式中,所述細(xì)胞是真核細(xì)胞。在其他實(shí)施方式中,所述細(xì)胞是原核細(xì)胞。109、在一個(gè)實(shí)施方式中,所述cas蛋白連接有一個(gè)或多個(gè)nls序列。在一個(gè)實(shí)施方式中,所述融合蛋白包含一個(gè)或多個(gè)nls序列。在一個(gè)實(shí)施方式中,所述nls序列連接至所述蛋白的n端或c端。在一個(gè)實(shí)施方式中,所述nls序列融合至所述蛋白的n端或c端。110、另一方面,本發(fā)明涉及一種工程化的crispr系統(tǒng),所述系統(tǒng)包含上述cas蛋白以及一種或多種指導(dǎo)rna,其中,所述指導(dǎo)rna包括同向重復(fù)序列和能夠與靶核酸雜交的間隔序列,所述cas蛋白能夠結(jié)合所述指導(dǎo)rna并靶向與間隔序列互補(bǔ)的靶核酸序列。111、蛋白-核酸復(fù)合物/組合物112、另一方面,本發(fā)明提供了一種復(fù)合物或者組合物,其包含:113、(i)蛋白組分,其選自:上述cas蛋白、衍生化蛋白或融合蛋白,及其任意組合;和114、(ii)核酸組分,其包含(a)能夠與靶序列雜交的引導(dǎo)序列;以及(b)能夠與本發(fā)明的cas蛋白結(jié)合的同向重復(fù)序列。115、所述蛋白組分與核酸組分相互結(jié)合形成復(fù)合物。116、在一個(gè)實(shí)施方式中,所述核酸組分是crispr-cas系統(tǒng)中的指導(dǎo)rna。117、在一個(gè)實(shí)施方式中,所述復(fù)合物或組合物是非天然存在的或經(jīng)修飾的。在一個(gè)實(shí)施方式中,所述復(fù)合物或組合物中的至少一個(gè)組分是非天然存在的或經(jīng)修飾的。在一個(gè)實(shí)施方式中,所述第一組分是非天然存在的或經(jīng)修飾的;和/或,所述第二組分是非天然存在的或經(jīng)修飾的。118、活化的crispr復(fù)合物119、另一方面,本發(fā)明還提供了一種活化的crispr復(fù)合物,所述活化的crispr復(fù)合物包含:(1)蛋白組分,其選自:本發(fā)明的cas蛋白、衍生化蛋白或融合蛋白,及其任意組合;(2)grna,其包含(a)能夠與靶序列雜交的引導(dǎo)序列;以及(b)能夠與本發(fā)明的cas蛋白結(jié)合的同向重復(fù)序列;以及(3)結(jié)合在grna上的靶序列。優(yōu)選的,所述結(jié)合為通過(guò)grna上的靶向核酸的靶向序列與靶核酸進(jìn)行的結(jié)合。120、本文所用術(shù)語(yǔ)“活化的crispr復(fù)合物”,“活化復(fù)合物”或“三元復(fù)合物”是指crispr系統(tǒng)中cas蛋白、grna與靶核酸結(jié)合或修飾后的復(fù)合物。121、本發(fā)明的cas蛋白和grna可以形成二元復(fù)合物,該二元復(fù)合物在與核酸底物結(jié)合時(shí)被活化,形成活化的crispr復(fù)合物該核酸底物與grna中的間隔序列(或者稱(chēng)之為,與靶核酸雜交的引導(dǎo)序列)互補(bǔ)。在一些實(shí)施方案中,grna的間隔序列與靶底物完全匹配。在其它實(shí)施方案中,grna的間隔序列與靶底物的部分(連續(xù)或不連續(xù))匹配。122、在優(yōu)選的實(shí)施方式中,所述活化的crispr復(fù)合物可以表現(xiàn)出側(cè)枝核酸酶切活性,所述側(cè)枝核酸酶切活性是指活化的crispr復(fù)合物表現(xiàn)的對(duì)單鏈核酸的非特異切割活性或亂切活性,在本領(lǐng)域又稱(chēng)之為trans切割活性。123、遞送及遞送組合物124、本發(fā)明的cas蛋白、grna、融合蛋白、核酸分子、載體、系統(tǒng)、復(fù)合物和組合物,可以通過(guò)本領(lǐng)域已知的任何方法進(jìn)行遞送。此類(lèi)方法包括但不限于,電穿孔、脂轉(zhuǎn)染、核轉(zhuǎn)染、顯微注射、聲孔效應(yīng)、基因槍、磷酸鈣介導(dǎo)的轉(zhuǎn)染、陽(yáng)離子轉(zhuǎn)染、脂質(zhì)體轉(zhuǎn)染、樹(shù)枝狀轉(zhuǎn)染、熱激轉(zhuǎn)染、核轉(zhuǎn)染、磁轉(zhuǎn)染、脂轉(zhuǎn)染、穿刺轉(zhuǎn)染、光學(xué)轉(zhuǎn)染、試劑增強(qiáng)性核酸攝取、以及經(jīng)由脂質(zhì)體、免疫脂質(zhì)體、病毒顆粒、人工病毒體等的遞送。125、因此,在另一個(gè)方面,本發(fā)明提供了一種遞送組合物,其包含遞送載體,以及選自下列的一種或任意幾種:本發(fā)明的cas蛋白、融合蛋白、核酸分子、載體、系統(tǒng)、復(fù)合物和組合物。126、在一個(gè)實(shí)施方式中,所述遞送載體是粒子。127、在一個(gè)實(shí)施方式中,所述遞送載體選自脂質(zhì)顆粒、糖顆粒、金屬顆粒、蛋白顆粒、脂質(zhì)體、外泌體、微泡、基因槍或病毒載體(例如,復(fù)制缺陷型逆轉(zhuǎn)錄病毒、慢病毒、腺病毒或腺相關(guān)病毒)。128、宿主細(xì)胞129、本發(fā)明還涉及一種體外的、離體的或體內(nèi)的細(xì)胞或細(xì)胞系或它們的子代,所述細(xì)胞或細(xì)胞系或它們的子代包含:本發(fā)明所述的cas蛋白、融合蛋白、核酸分子、蛋白-核酸復(fù)合物、活化的crispr復(fù)合物、載體、本發(fā)明遞送組合物。130、在某些實(shí)施方案中,所述細(xì)胞是原核細(xì)胞。131、在某些實(shí)施方案中,所述細(xì)胞是真核細(xì)胞。在某些實(shí)施方案中,所述細(xì)胞是哺乳動(dòng)物細(xì)胞。在某些實(shí)施方案中,所述細(xì)胞是人類(lèi)細(xì)胞。某些實(shí)施方案中,所述細(xì)胞是非人哺乳動(dòng)物細(xì)胞,例如非人靈長(zhǎng)類(lèi)動(dòng)物、牛、羊、豬、犬、猴、兔、嚙齒類(lèi)(如大鼠或小鼠)的細(xì)胞。在某些實(shí)施方案中,所述細(xì)胞是非哺乳動(dòng)物真核細(xì)胞,例如家禽鳥(niǎo)類(lèi)(如雞)、魚(yú)類(lèi)或甲殼動(dòng)物(如蛤蜊、蝦)的細(xì)胞。在某些實(shí)施方案中,所述細(xì)胞是植物細(xì)胞,例如單子葉植物或雙子葉植物具有的細(xì)胞或栽培植物或糧食作物如木薯、玉米、高粱、大豆、小麥、燕麥或水稻具有的細(xì)胞,例如藻類(lèi)、樹(shù)或生產(chǎn)植物、果實(shí)或蔬菜(例如,樹(shù)類(lèi)如柑橘樹(shù)、堅(jiān)果樹(shù);茄屬植物、棉花、煙草、番茄、葡萄、咖啡、可可等)。132、在某些實(shí)施方案中,所述細(xì)胞是干細(xì)胞或干細(xì)胞系。133、在某些情況下,本發(fā)明的宿主細(xì)胞包含基因或基因組的修飾,該修飾是在其野生型中不存在的修飾。134、基因編輯方法和應(yīng)用135、本發(fā)明的cas突變蛋白、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物或上述活化的crispr復(fù)合物或者上述宿主細(xì)胞可用于以下任一或任意幾個(gè)用途:靶向和/或編輯靶核酸;切割雙鏈dna、單鏈dna或單鏈rna;非特異性切割和/或降解側(cè)枝核酸;非特異性切割單鏈核酸;核酸檢測(cè);檢測(cè)目標(biāo)樣品中的核酸;特異性地編輯雙鏈核酸;堿基編輯雙鏈核酸;堿基編輯單鏈核酸。在其他的實(shí)施方式中,還可以用于制備用于上述任一或任意幾個(gè)用途的試劑或試劑盒。136、本發(fā)明還提供了上述cas蛋白、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物或上述活化的crispr復(fù)合物在基因編輯、基因靶向或基因切割中的應(yīng)用;或者,在制備用于基因編輯、基因靶向或基因切割的試劑或試劑盒中的用途。137、在一個(gè)實(shí)施方式中,所述基因編輯、基因靶向或基因切割為在細(xì)胞內(nèi)和/或細(xì)胞外進(jìn)行基因編輯、基因靶向或基因切割。138、本發(fā)明還提供了一種編輯靶核酸、靶向靶核酸或切割靶核酸的方法,所述方法包括將靶核酸與上述cas蛋白、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物或上述活化的crispr復(fù)合物進(jìn)行接觸。在一個(gè)實(shí)施方式中,所述方法為在細(xì)胞內(nèi)或細(xì)胞外編輯靶核酸、靶向靶核酸或切割靶核酸。139、所述基因編輯或編輯靶核酸包括修飾基因、敲除基因、改變基因產(chǎn)物的表達(dá)、修復(fù)突變、和/或插入多核苷酸、基因突變。140、所述編輯可以在原核細(xì)胞和/或真核細(xì)胞中進(jìn)行編輯。141、另一方面,本發(fā)明還提供了上述cas蛋白、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物或上述活化的crispr復(fù)合物在核酸檢測(cè)中的應(yīng)用,或在制備用于核酸檢測(cè)的試劑或試劑盒中的用途。142、另一方面,本發(fā)明還提供了一種切割單鏈核酸的方法,所述方法包括,使核酸群體與上述cas蛋白和grna接觸,其中所述核酸群體包含靶核酸和多個(gè)非靶單鏈核酸,所述cas蛋白切割所述多個(gè)非靶單鏈核酸。143、所述grna能夠結(jié)合所述cas蛋白。144、所述grna能夠靶向所述靶核酸。145、所述接觸可以是在體外、離體或體內(nèi)的細(xì)胞內(nèi)部。146、優(yōu)選的,所述切割單鏈核酸為非特異性的切割。147、另一方面,本發(fā)明還提供了上述cas蛋白、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物或上述活化的crispr復(fù)合物在非特異性的切割單鏈核酸中的應(yīng)用,或在制備用于非特異性的切割單鏈核酸的試劑或試劑盒中的用途。148、另一方面,本發(fā)明還提供了一種用于基因編輯、基因靶向或基因切割的試劑盒,所述試劑盒包括上述cas蛋白、grna、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物、上述活化的crispr復(fù)合物或上述宿主細(xì)胞。149、另一方面,本發(fā)明還提供了一種用于檢測(cè)樣品中的靶核酸的試劑盒,所述試劑盒包含:(a)cas蛋白,或編碼所述cas蛋白的核酸;(b)指導(dǎo)rna,或編碼所述指導(dǎo)rna的核酸,或包含所述指導(dǎo)rna的前體rna,或編碼所述前體rna的核酸;和(c)為單鏈的且不與所述指導(dǎo)rna雜交的單鏈核酸檢測(cè)器。150、本領(lǐng)域知曉,前體rna可被切割或加工成為上述成熟的指導(dǎo)rna。151、另一方面,發(fā)明提供了上述cas蛋白、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物、上述活化的crispr復(fù)合物或上述宿主細(xì)胞在制備制劑或試劑盒中的用途,所述制劑或試劑盒用于:152、(i)基因或基因組編輯;153、(ii)靶核酸檢測(cè)和/或診斷;154、(iii)編輯靶基因座中的靶序列來(lái)修飾生物或非人類(lèi)生物;155、(iv)疾病的治療;156、(iv)靶向靶基因。157、優(yōu)選的,上述基因或基因組編輯為在細(xì)胞內(nèi)或細(xì)胞外進(jìn)行基因或基因組編輯。158、優(yōu)選的,所述靶核酸檢測(cè)和/或診斷為在體外進(jìn)行靶核酸檢測(cè)和/或診斷。159、優(yōu)選的,所述疾病的治療為治療由靶基因座中的靶序列的缺陷引起的病癥。160、另一個(gè)方面,本發(fā)明提供了一種檢測(cè)樣品中靶核酸的方法,所述方法包括將樣品與所述cas蛋白、grna(指導(dǎo)rna)和單鏈核酸檢測(cè)器接觸,所述grna包括與所述cas蛋白結(jié)合的區(qū)域和與靶核酸雜交的指導(dǎo)序列;檢測(cè)由所述cas蛋白切割單鏈核酸檢測(cè)器產(chǎn)生的可檢測(cè)信號(hào),從而檢測(cè)靶核酸;所述單鏈核酸檢測(cè)器不與所述grna雜交。161、特異性修飾靶核酸的方法162、另一方面,本發(fā)明還提供了一種特異性修飾靶核酸的方法,方法包括:使靶核酸與上述cas蛋白、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物或上述活化的crispr復(fù)合物接觸。163、該特異性修飾可以發(fā)生在體內(nèi)或者體外。164、該特異性修飾可以發(fā)生在細(xì)胞內(nèi)或者細(xì)胞外。165、在一些情況下,細(xì)胞選自原核細(xì)胞或真核細(xì)胞,例如,動(dòng)物細(xì)胞、植物細(xì)胞或微生物細(xì)胞。166、在一個(gè)實(shí)施方式中,所述修飾是指所述靶序列的斷裂,如,dna的單鏈/雙鏈斷裂,或者rna的單鏈斷裂。167、在一些情況下,所述方法還包括使靶核酸與供體多核苷酸接觸,其中將供體多核苷酸、供體多核苷酸的部分、供體多核苷酸的拷貝或供體多核苷酸的拷貝的部分整合到靶核酸中。168、在一個(gè)實(shí)施方式中,所述修飾還包括將編輯模板(例如外源核酸)插入所述斷裂中。169、在一個(gè)實(shí)施方式中,所述方法還包括:將編輯模板與所述靶核酸接觸,或者遞送至包含所述靶核酸的細(xì)胞中。在此實(shí)施方式中,所述方法通過(guò)與外源模板多核苷酸同源重組修復(fù)所述斷裂的靶基因;在一些實(shí)施方式中,所述修復(fù)導(dǎo)致一種突變,包括所述靶基因的一個(gè)或多個(gè)核苷酸的插入、缺失、或取代,在其他的實(shí)施方式中,所述突變導(dǎo)致在從包含該靶序列的基因表達(dá)的蛋白質(zhì)中的一個(gè)或多個(gè)氨基酸改變。170、檢測(cè)(非特異切割)171、另一方面,本發(fā)明提供了一種檢測(cè)樣品中靶核酸的方法,所述方法包括將樣品與上述cas蛋白、核酸、上述組合物、上述cirspr/cas系統(tǒng)、上述載體系統(tǒng)、上述遞送組合物或上述活化的crispr復(fù)合物和單鏈核酸檢測(cè)器接觸;檢測(cè)由所述cas蛋白切割單鏈核酸檢測(cè)器產(chǎn)生的可檢測(cè)信號(hào),從而檢測(cè)靶核酸。172、本發(fā)明中,所述靶核酸包括核糖核苷酸或脫氧核糖核苷酸;包括單鏈核酸、雙鏈核酸,例如單鏈dna、雙鏈dna、單鏈rna、雙鏈rna。173、在一個(gè)實(shí)施方式中,所述靶核酸來(lái)源于病毒、細(xì)菌、微生物、土壤、水源、人體、動(dòng)物、植物等樣品。優(yōu)選的,所述靶核酸為pcr、nasba、rpa、sda、lamp、had、near、mda、rca、lcr、ram等方法富集或擴(kuò)增的產(chǎn)物。174、在一個(gè)實(shí)施方式中,所述靶核酸為病毒核酸、細(xì)菌核酸、與疾病相關(guān)的特異核酸,如特定的突變位點(diǎn)或snp位點(diǎn)或與對(duì)照有差異的核酸;優(yōu)選地,所述病毒為植物病毒或動(dòng)物病毒,例如,乳頭瘤病毒,肝dna病毒,皰疹病毒,腺病毒,痘病毒,細(xì)小病毒,冠狀病毒;優(yōu)選地,所述病毒為冠狀病毒,優(yōu)選地,sars、sars-cov2(covid-19)、hcov-229e、hcov-oc43、hcov-nl63、hcov-hku1、mers-cov。175、本發(fā)明中,所述grna與靶核酸上的靶序列至少有50%的匹配度,優(yōu)選至少60%,優(yōu)選至少70%,優(yōu)選至少80%,優(yōu)選至少90%。176、在一個(gè)實(shí)施方式中,當(dāng)所述的靶序列含有一個(gè)或多個(gè)特征位點(diǎn)(如特定的突變位點(diǎn)或snp)時(shí),所述的特征位點(diǎn)與grna完全匹配。177、在一個(gè)實(shí)施方式中,所述檢測(cè)方法中可以包含一種或多種導(dǎo)向序列互不相同的grna,其靶向不同的靶序列。178、本發(fā)明中,所述單鏈核酸檢測(cè)器包括但不限于單鏈dna、單鏈rna、dna-rna雜交體、核酸類(lèi)似物、堿基修飾物、以及含有無(wú)堿基間隔物的單鏈核酸檢測(cè)器等;“核酸類(lèi)似物”包括但不限于:鎖核酸、橋核酸、嗎啉核酸、乙二醇核酸、己糖醇核酸、蘇糖核酸、阿拉伯糖核酸、2’氧甲基rna、2’甲氧基乙酰基rna、2’氟rna、2’氨基rna、4’硫rna及其組合,包括任選的核糖核苷酸或脫氧核糖核苷酸殘基。179、本發(fā)明中,所述可檢測(cè)信號(hào)通過(guò)以下方式實(shí)現(xiàn):基于視覺(jué)的檢測(cè),基于傳感器的檢測(cè),顏色檢測(cè),基于熒光信號(hào)的檢測(cè),基于金納米顆粒的檢測(cè),熒光偏振,膠體相變/分散,電化學(xué)檢測(cè)和基于半導(dǎo)體的檢測(cè)。180、本發(fā)明中,優(yōu)選的,所述單鏈核酸檢測(cè)器的兩端分別設(shè)置熒光基團(tuán)和淬滅基團(tuán),當(dāng)所述單鏈核酸檢測(cè)器被切割后,可以表現(xiàn)出可檢測(cè)的熒光信號(hào)。所述熒光基團(tuán)選自fam、fitc、vic、joe、tet、cy3、cy5、rox、texas?red或lc?red460中的一種或任意幾種;所述淬滅基團(tuán)選自bhq1、bhq2、bhq3、dabcy1或tamra中的一種或任意幾種。181、在其他的實(shí)施方式中,所述單鏈核酸檢測(cè)器的5’端和3’端分別設(shè)置不同的標(biāo)記分子,通過(guò)膠體金檢測(cè)的方式,檢測(cè)所述單鏈核酸檢測(cè)器被cas蛋白切割前和被cas蛋白切割后的膠體金測(cè)試結(jié)果;所述單鏈核酸檢測(cè)器被cas蛋白切割前和被cas蛋白切割后在膠體金的檢測(cè)線(xiàn)和質(zhì)控線(xiàn)上將表現(xiàn)出不同的顯色結(jié)果。182、在一些實(shí)施方案中,檢測(cè)靶核酸的方法還可以包括將可檢測(cè)信號(hào)的電平與參考信號(hào)電平進(jìn)行比較,以及基于可檢測(cè)信號(hào)的電平確定樣品中靶核酸的量。183、在一些實(shí)施方案中,檢測(cè)靶核酸的方法還可以包括在不同的通道上使用rna報(bào)告核酸和dna報(bào)告核酸(例如,熒光顏色),并通過(guò)測(cè)量rna和dna報(bào)告分子的信號(hào)電平,以及通過(guò)測(cè)量rna和dna報(bào)告分子中靶核酸的量來(lái)確定可檢測(cè)信號(hào)的電平,基于組合(例如,使用最小或乘積)可檢測(cè)信號(hào)的電平來(lái)采樣。184、在一個(gè)實(shí)施方式中,所述靶基因存在于細(xì)胞內(nèi)。185、在一個(gè)實(shí)施方式中,所述細(xì)胞是原核細(xì)胞。186、在一個(gè)實(shí)施方式中,所述細(xì)胞是真核細(xì)胞。187、在一個(gè)實(shí)施方式中,所述細(xì)胞是動(dòng)物細(xì)胞。188、在一個(gè)實(shí)施方式中,所述細(xì)胞是人類(lèi)細(xì)胞。189、在一個(gè)實(shí)施方式中,所述細(xì)胞是植物細(xì)胞,例如栽培植物(如木薯、玉米、高粱、小麥或水稻)、藻類(lèi)、樹(shù)或蔬菜具有的細(xì)胞。190、在一個(gè)實(shí)施方式中,所述靶基因存在于體外的核酸分子(例如,質(zhì)粒)中。191、在一個(gè)實(shí)施方式中,所述靶基因存在于質(zhì)粒中。192、術(shù)語(yǔ)定義193、在本發(fā)明中,除非另有說(shuō)明,否則本文中使用的科學(xué)和技術(shù)名詞具有本領(lǐng)域技術(shù)人員所通常理解的含義。并且,本文中所用的分子遺傳學(xué)、核酸化學(xué)、化學(xué)、分子生物學(xué)、生物化學(xué)、細(xì)胞培養(yǎng)、微生物學(xué)、細(xì)胞生物學(xué)、基因組學(xué)和重組dna等操作步驟均為相應(yīng)領(lǐng)域內(nèi)廣泛使用的常規(guī)步驟。同時(shí),為了更好地理解本發(fā)明,下面提供相關(guān)術(shù)語(yǔ)的定義和解釋。194、本文中的核酸切割或切割核酸包括:由本文所述cas酶產(chǎn)生的靶核酸中的dna或rna斷裂(cis切割)、dna或rna在側(cè)枝核酸底物(單鏈核酸底物)中的斷裂(即非特異性或非靶向性,trans切割)。在一些實(shí)施方式中,所述切割是雙鏈dna斷裂。在一些實(shí)施方案中,切割是單鏈dna斷裂或單鏈rna斷裂。195、crispr系統(tǒng)196、如本文中所使用的,術(shù)語(yǔ)“規(guī)律成簇的間隔短回文重復(fù)(crispr)-crispr-相關(guān)(cas)(crispr-cas)系統(tǒng)”或“crispr系統(tǒng)”可互換地使用并且具有本領(lǐng)域技術(shù)人員通常理解的含義,其通常包含與crispr相關(guān)(“cas”)基因的表達(dá)有關(guān)的轉(zhuǎn)錄產(chǎn)物或其他元件,或者能夠指導(dǎo)所述cas基因活性的轉(zhuǎn)錄產(chǎn)物或其他元件。197、crispr/cas復(fù)合物198、如本文中所使用的,術(shù)語(yǔ)“crispr/cas復(fù)合物”是指,指導(dǎo)rna(guide?rna)或成熟crrna與cas蛋白結(jié)合所形成的復(fù)合體,其包含雜交到靶序列的引導(dǎo)序列上并且與cas蛋白結(jié)合的同向重復(fù)序列,該復(fù)合體能夠識(shí)別并切割能與該指導(dǎo)rna或成熟crrna雜交的多核苷酸。199、指導(dǎo)rna(guide?rna,grna)200、如本文中所使用的,術(shù)語(yǔ)“指導(dǎo)rna(guide?rna,grna)”、“成熟crrna”、“指導(dǎo)序列”可互換地使用并且具有本領(lǐng)域技術(shù)人員通常理解的含義。一般而言,指導(dǎo)rna可以包含同向重復(fù)序列(direct?repeat)和引導(dǎo)序列,或者基本上由或由同向重復(fù)序列和引導(dǎo)序列組成。201、在某些情況下,指導(dǎo)序列是與靶序列具有足夠互補(bǔ)性從而與所述靶序列雜交并引導(dǎo)crispr/cas復(fù)合物與所述靶序列的特異性結(jié)合的任何多核苷酸序列。在一個(gè)實(shí)施方式中,當(dāng)最佳比對(duì)時(shí),指導(dǎo)序列與其相應(yīng)靶序列之間的互補(bǔ)程度為至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少99%。確定最佳比對(duì)在本領(lǐng)域的普通技術(shù)人員的能力范圍內(nèi)。例如,存在公開(kāi)和可商購(gòu)的比對(duì)算法和程序,諸如但不限于clustalw、matlab中的史密斯-沃特曼算法(smith-waterman)、bowtie、geneious、biopython以及seqman。202、靶序列203、“靶序列”是指被grna中的引導(dǎo)序列所靶向的多核苷酸,例如與該引導(dǎo)序列具有互補(bǔ)性的序列,其中靶序列與引導(dǎo)序列之間的雜交將促進(jìn)crispr/cas復(fù)合物(包括cas蛋白和grna)的形成。完全互補(bǔ)性不是必需的,只要存在足夠互補(bǔ)性以引起雜交并且促進(jìn)一種crispr/cas復(fù)合物的形成即可。204、靶序列可以包含任何多核苷酸,如dna或rna。在某些情況下,所述靶序列位于細(xì)胞內(nèi)或細(xì)胞外。在某些情況下,所述靶序列位于細(xì)胞的細(xì)胞核或細(xì)胞質(zhì)中。在某些情況下,該靶序列可位于真核細(xì)胞的一個(gè)細(xì)胞器例如線(xiàn)粒體或葉綠體內(nèi)??杀挥糜谥亟M到包含該靶序列的靶基因座中的序列或模板被稱(chēng)為“編輯模板”或“編輯多核苷酸”或“編輯序列”。在一個(gè)實(shí)施方式中,所述編輯模板為外源核酸。在一個(gè)實(shí)施方式中,該重組是同源重組。205、在本發(fā)明中,“靶序列”或“靶多核苷酸”或“靶核酸”可以是對(duì)細(xì)胞(例如,真核細(xì)胞)而言任何內(nèi)源或外源的多核苷酸。例如,該靶多核苷酸可以是一種存在于真核細(xì)胞的細(xì)胞核中的多核苷酸。該靶多核苷酸可以是一個(gè)編碼基因產(chǎn)物(例如,蛋白質(zhì))的序列或一個(gè)非編碼序列(例如,調(diào)節(jié)多核苷酸或無(wú)用dna)。在某些情況下,該靶序列應(yīng)該與原間隔序列臨近基序(pam)相關(guān)。206、單鏈核酸檢測(cè)器207、本發(fā)明所述的單鏈核酸檢測(cè)器是指含有2-200個(gè)核苷酸的序列,優(yōu)選,具有2-150個(gè)核苷酸,優(yōu)選,3-100個(gè)核苷酸,優(yōu)選,3-30個(gè)核苷酸,優(yōu)選,4-20個(gè)核苷酸,更優(yōu)選,5-15個(gè)核苷酸。優(yōu)選為單鏈dna分子、單鏈rna分子或單鏈dna-rna雜交體。208、所述的單鏈核酸檢測(cè)器兩端包括不同的報(bào)告基團(tuán)或標(biāo)記分子,當(dāng)其處于初始狀態(tài)(即未被切割狀態(tài)時(shí))不呈現(xiàn)報(bào)告信號(hào),當(dāng)該單鏈核酸檢測(cè)器被切割后,呈現(xiàn)出可檢測(cè)的信號(hào),即切割后與切割前表現(xiàn)出可檢測(cè)的區(qū)別。209、在一個(gè)實(shí)施方式中,所述的報(bào)告基團(tuán)或標(biāo)記分子包括熒光基團(tuán)和淬滅基團(tuán),所述熒光基團(tuán)選自fam、fitc、vic、joe、tet、cy3、cy5、rox、texas?red或lc?red460中的一種或任意幾種;所述淬滅基團(tuán)選自bhq1、bhq2、bhq3、dabcy1或tamra中的一種或任意幾種。210、在一個(gè)實(shí)施方式中,所述的單鏈核酸檢測(cè)器具有連接至5’端第一分子(如fam或fitc)和連接至3’端的第二分子(如生物素)。所述的含有單鏈核酸檢測(cè)器的反應(yīng)體系與流動(dòng)條配合用以檢測(cè)靶核酸(優(yōu)選,膠體金檢測(cè)方式)。所述的流動(dòng)條被設(shè)計(jì)為具有兩條捕獲線(xiàn),在樣品接觸端(膠體金)設(shè)有結(jié)合第一分子的抗體(即第一分子抗體),在第一線(xiàn)(control?line)處含有結(jié)合第一分子抗體的抗體,在第二線(xiàn)(test?line)處含有與第二分子結(jié)合的第二分子的抗體(即第二分子抗體,如親和素)。當(dāng)反應(yīng)沿著條帶流動(dòng)時(shí),第一分子抗體與第一分子結(jié)合攜帶切割或未切割的寡核苷酸至捕獲線(xiàn),切割的報(bào)告子將在第一個(gè)捕獲線(xiàn)處結(jié)合第一分子抗體的抗體,而未切割的報(bào)告子將在第二捕獲線(xiàn)處結(jié)合第二分子抗體。報(bào)告基團(tuán)在各條線(xiàn)的結(jié)合將導(dǎo)致強(qiáng)讀出/信號(hào)(例如顏色)。隨著更多的報(bào)告子被切割,更多的信號(hào)將在第一捕獲線(xiàn)處累積,并且在第二線(xiàn)處將出現(xiàn)更少的信號(hào)。在某些方面,本發(fā)明涉及如本文所述的流動(dòng)條用于檢測(cè)核酸的用途。在某些方面,本發(fā)明涉及用本文定義的流動(dòng)條檢測(cè)核酸的方法,例如(側(cè))流測(cè)試或(側(cè))流免疫色譜測(cè)定。在某些方面,所述單鏈核酸檢測(cè)器中的分子可相互替換,或改變分子的位置,只要其報(bào)告原理與本發(fā)明相同或相近,所改進(jìn)的方式也均包含在本發(fā)明中。211、本發(fā)明所述的檢測(cè)方法,可用于待檢測(cè)靶核酸的定量檢測(cè)。所述的定量檢測(cè)指標(biāo)可以根據(jù)報(bào)告基團(tuán)的信號(hào)強(qiáng)弱進(jìn)行定量,如根據(jù)熒光基團(tuán)的發(fā)光強(qiáng)度,或根據(jù)顯色條帶的寬度等。212、野生型213、如本文中所使用的,術(shù)語(yǔ)“野生型”具有本領(lǐng)域技術(shù)人員通常理解的含義,其表示生物、菌株、基因的典型形式或者當(dāng)它在自然界存在時(shí)區(qū)別于突變體或變體形式的特征,其可從自然中的來(lái)源分離并且沒(méi)有被人為有意地修飾。214、衍生化215、如本文中所使用的,術(shù)語(yǔ)“衍生化”是指,對(duì)氨基酸、多肽或蛋白的化學(xué)修飾,其中一個(gè)或多個(gè)取代基已與所述氨基酸、多肽或蛋白共價(jià)連接。取代基也可稱(chēng)為側(cè)鏈。216、衍生化的蛋白是該蛋白的衍生物,通常,蛋白的衍生化不會(huì)不利影響該蛋白的期望活性(例如,與指導(dǎo)rna結(jié)合的活性、核酸內(nèi)切酶活性、在指導(dǎo)rna引導(dǎo)下與靶序列特定位點(diǎn)結(jié)合并切割的活性),也就是說(shuō)蛋白的衍生物與蛋白有相同的活性。217、衍生化蛋白218、又稱(chēng)“蛋白衍生物”,是指蛋白的經(jīng)修飾形式,例如其中所述蛋白的一個(gè)或多個(gè)氨基酸可以被缺失、插入、修飾和/或取代。219、非天然存在的220、如本文中所使用的,術(shù)語(yǔ)“非天然存在的”或“工程化的”可互換地使用并且表示人工的參與。當(dāng)這些術(shù)語(yǔ)用于描述核酸分子或多肽時(shí),其表示該核酸分子或多肽至少基本上從它們?cè)谧匀唤缰谢蛉绨l(fā)現(xiàn)于自然界中的與其結(jié)合的至少另一種組分游離出來(lái)。221、直系同源物(orthologue,ortholog)222、如本文中所使用的,術(shù)語(yǔ)“直系同源物(orthologue,ortholog)”具有本領(lǐng)域技術(shù)人員通常理解的含義。作為進(jìn)一步指導(dǎo),如本文中所述的蛋白質(zhì)的“直系同源物”是指屬于不同物種的蛋白質(zhì),該蛋白質(zhì)執(zhí)行與作為其直系同源物的蛋白相同或相似的功能。223、同一性224、如本文中所使用的,術(shù)語(yǔ)“同一性”用于指兩個(gè)多肽之間或兩個(gè)核酸之間序列的匹配情況。當(dāng)兩個(gè)進(jìn)行比較的序列中的某個(gè)位置都被相同的堿基或氨基酸單體亞單元占據(jù)時(shí)(例如,兩個(gè)dna分子的每一個(gè)中的某個(gè)位置都被腺嘌呤占據(jù),或兩個(gè)多肽的每一個(gè)中的某個(gè)位置都被賴(lài)氨酸占據(jù)),那么各分子在該位置上是同一的。兩個(gè)序列之間的“百分?jǐn)?shù)同一性”是由這兩個(gè)序列共有的匹配位置數(shù)目除以進(jìn)行比較的位置數(shù)目×100的函數(shù)。例如,如果兩個(gè)序列的10個(gè)位置中有6個(gè)匹配,那么這兩個(gè)序列具有60%的同一性。例如,dna序列ctgact和caggtt共有50%的同一性(總共6個(gè)位置中有3個(gè)位置匹配)。通常,在將兩個(gè)序列比對(duì)以產(chǎn)生最大同一性時(shí)進(jìn)行比較。這樣的比對(duì)可通過(guò)使用,例如,可通過(guò)計(jì)算機(jī)程序例如align程序(dnastar,inc.)方便地進(jìn)行的needleman等人(1970)j.mol.biol.48:443-453的方法來(lái)實(shí)現(xiàn)。還可使用已整合入align程序(版本2.0)的e.meyers和w.miller(comput.applbiosci.,4:11-17(1988))的算法,使用pam120權(quán)重殘基表(weight?residue?table)、12的缺口長(zhǎng)度罰分和4的缺口罰分來(lái)測(cè)定兩個(gè)氨基酸序列之間的百分?jǐn)?shù)同一性。此外,可使用已整合入gcg軟件包(可在www.gcg.com上獲得)的gap程序中的needleman和wunsch(j?moibiol.48:444-453(1970))算法,使用blossum?62矩陣或pam250矩陣以及16、14、12、10、8、6或4的缺口權(quán)重(gap?weight)和1、2、3、4、5或6的長(zhǎng)度權(quán)重來(lái)測(cè)定兩個(gè)氨基酸序列之間的百分?jǐn)?shù)同一性。225、載體226、術(shù)語(yǔ)“載體”是指一種核酸分子,它能夠運(yùn)送與其連接的另一種核酸分子。載體包括但不限于,單鏈、雙鏈、或部分雙鏈的核酸分子;包括一個(gè)或多個(gè)自由端、無(wú)自由端(例如環(huán)狀的)的核酸分子;包括dna、rna、或兩者的核酸分子;以及本領(lǐng)域已知的其他多種多樣的多核苷酸。載體可以通過(guò)轉(zhuǎn)化,轉(zhuǎn)導(dǎo)或者轉(zhuǎn)染導(dǎo)入宿主細(xì)胞,使其攜帶的遺傳物質(zhì)元件在宿主細(xì)胞中獲得表達(dá)。一種載體可以被引入到宿主細(xì)胞中而由此產(chǎn)生轉(zhuǎn)錄物、蛋白質(zhì)、或肽,包括由如本文所述的蛋白、融合蛋白、分離的核酸分子等(例如,crispr轉(zhuǎn)錄物,如核酸轉(zhuǎn)錄物、蛋白質(zhì)、或酶)。一種載體可以含有多種控制表達(dá)的元件,包括但不限于,啟動(dòng)子序列、轉(zhuǎn)錄起始序列、增強(qiáng)子序列、選擇元件及報(bào)告基因。另外,載體還可含有復(fù)制起始位點(diǎn)。227、一種類(lèi)型的載體是“質(zhì)?!保涫侵钙渲锌梢岳缤ㄟ^(guò)標(biāo)準(zhǔn)分子克隆技術(shù)插入另外的dna片段的環(huán)狀雙鏈dna環(huán)。228、另一種類(lèi)型的載體是病毒載體,其中病毒衍生的dna或rna序列存在于用于包裝病毒(例如,逆轉(zhuǎn)錄病毒、復(fù)制缺陷型逆轉(zhuǎn)錄病毒、腺病毒、復(fù)制缺陷型腺病毒、以及腺相關(guān)病毒)的載體中。病毒載體還包含由用于轉(zhuǎn)染到一種宿主細(xì)胞中的病毒攜帶的多核苷酸。某些載體(例如,具有細(xì)菌復(fù)制起點(diǎn)的細(xì)菌載體和附加型哺乳動(dòng)物載體)能夠在它們被導(dǎo)入的宿主細(xì)胞中自主復(fù)制。229、其他載體(例如,非附加型哺乳動(dòng)物載體)在引入宿主細(xì)胞后整合到該宿主細(xì)胞的基因組中,并且由此與該宿主基因組一起復(fù)制。而且,某些載體能夠指導(dǎo)它們可操作連接的基因的表達(dá)。這樣的載體在此被稱(chēng)為“表達(dá)載體”。230、宿主細(xì)胞231、如本文中所使用的,術(shù)語(yǔ)“宿主細(xì)胞”是指,可用于導(dǎo)入載體的細(xì)胞,其包括但不限于,如大腸桿菌或枯草菌等的原核細(xì)胞,如微生物細(xì)胞、真菌細(xì)胞、動(dòng)物細(xì)胞和植物細(xì)胞的真核細(xì)胞。232、本領(lǐng)域技術(shù)人員將理解,表達(dá)載體的設(shè)計(jì)可取決于諸如待轉(zhuǎn)化的宿主細(xì)胞的選擇、所希望的表達(dá)水平等因素。233、調(diào)控元件234、如本文中所使用的,術(shù)語(yǔ)“調(diào)控元件”旨在包括啟動(dòng)子、增強(qiáng)子、內(nèi)部核糖體進(jìn)入位點(diǎn)(ires)、和其他表達(dá)控制元件(例如轉(zhuǎn)錄終止信號(hào),如多聚腺苷酸化信號(hào)和多聚u序列),其詳細(xì)描述可參考戈德?tīng)?goeddel),《基因表達(dá)技術(shù):酶學(xué)方法》(gene?expressiontechnology:methods?in?enzymology)185,學(xué)術(shù)出版社(academic?press),圣地亞哥(sandiego),加利福尼亞州(1990)。在某些情況下,調(diào)控元件包括指導(dǎo)一個(gè)核苷酸序列在許多類(lèi)型的宿主細(xì)胞中的組成型表達(dá)的那些序列以及指導(dǎo)該核苷酸序列只在某些宿主細(xì)胞中表達(dá)的那些序列(例如,組織特異型調(diào)節(jié)序列)。組織特異型啟動(dòng)子可主要指導(dǎo)在感興趣的期望組織中的表達(dá),所述組織例如肌肉、神經(jīng)元、骨、皮膚、血液、特定的器官(例如肝臟、胰腺)、或特殊的細(xì)胞類(lèi)型(例如淋巴細(xì)胞)。在某些情況下,調(diào)控元件還可以時(shí)序依賴(lài)性方式(如以細(xì)胞周期依賴(lài)性或發(fā)育階段依賴(lài)性方式)指導(dǎo)表達(dá),該方式可以是或者可以不是組織或細(xì)胞類(lèi)型特異性的。在某些情況下,術(shù)語(yǔ)“調(diào)控元件”涵蓋的是增強(qiáng)子元件,如wpre;cmv增強(qiáng)子;在htlv-i的ltr中的r-u5’片段((mol.cell.biol.,第8(1)卷,第466-472頁(yè),1988);sv40增強(qiáng)子;以及在兔β-珠蛋白的外顯子2與3之間的內(nèi)含子序列(proc.natl.acad.sci.usa.,第78(3)卷,第1527-31頁(yè),1981)。235、啟動(dòng)子236、如本文中所使用的,術(shù)語(yǔ)“啟動(dòng)子”具有本領(lǐng)域技術(shù)人員公知的含義,其是指一段位于基因的上游能啟動(dòng)下游基因表達(dá)的非編碼核苷酸序列。組成型(constitutive)啟動(dòng)子是這樣的核苷酸序列:當(dāng)其與編碼或者限定基因產(chǎn)物的多核苷酸可操作地相連時(shí),在細(xì)胞的大多數(shù)或者所有生理?xiàng)l件下,其導(dǎo)致細(xì)胞中基因產(chǎn)物的產(chǎn)生。誘導(dǎo)型啟動(dòng)子是這樣的核苷酸序列,當(dāng)可操作地與編碼或者限定基因產(chǎn)物的多核苷酸相連時(shí),基本上只有當(dāng)對(duì)應(yīng)于所述啟動(dòng)子的誘導(dǎo)物在細(xì)胞中存在時(shí),其導(dǎo)致所述基因產(chǎn)物在細(xì)胞內(nèi)產(chǎn)生。組織特異性啟動(dòng)子是這樣的核苷酸序列:當(dāng)可操作地與編碼或者限定基因產(chǎn)物的多核苷酸相連時(shí),基本上只有當(dāng)細(xì)胞是該啟動(dòng)子對(duì)應(yīng)的組織類(lèi)型的細(xì)胞時(shí),其才導(dǎo)致在細(xì)胞中產(chǎn)生基因產(chǎn)物。237、nls238、“核定位信號(hào)”或“核定位序列”(nls)是對(duì)蛋白質(zhì)“加標(biāo)簽”以通過(guò)核轉(zhuǎn)運(yùn)導(dǎo)入細(xì)胞核的氨基酸序列,即,具有nls的蛋白質(zhì)被轉(zhuǎn)運(yùn)至細(xì)胞核。典型地,nls包含暴露在蛋白質(zhì)表面的帶正電荷的lys或arg殘基。示例性核定位序列包括但不限于來(lái)自以下的nls:sv40大t抗原,egl-13,c-myc以及tus蛋白。在一些實(shí)施例中,該nls包含pkkkrkv序列。在一些實(shí)施例中,該nls包含avkrpaatkkagqakkkkld序列。在一些實(shí)施例中,該nls包含paakrvkld序列。在一些實(shí)施例中,該nls包含msrrrkanptklsenakklakeven序列。在一些實(shí)施例中,該nls包含klkikrpvk序列。其他核定位序列包括但不限于hnrnp?a1的酸性m9結(jié)構(gòu)域、酵母轉(zhuǎn)錄抑制子matα2中的序列kipik和py-nls。239、可操作地連接240、如本文中所使用的,術(shù)語(yǔ)“可操作地連接”旨在表示感興趣的核苷酸序列以一種允許該核苷酸序列的表達(dá)的方式被連接至該一種或多種調(diào)控元件(例如,處于一種體外轉(zhuǎn)錄/翻譯系統(tǒng)中或當(dāng)該載體被引入到宿主細(xì)胞中時(shí),處于該宿主細(xì)胞中)。241、互補(bǔ)性242、如本文中所使用的,術(shù)語(yǔ)“互補(bǔ)性”是指核酸與另一個(gè)核酸序列借助于傳統(tǒng)的沃森-克里克或其他非傳統(tǒng)類(lèi)型形成一個(gè)或多個(gè)氫鍵的能力?;パa(bǔ)百分比表示一個(gè)核酸分子中可與一個(gè)第二核酸序列形成氫鍵(例如,沃森-克里克堿基配對(duì))的殘基的百分比(例如,10個(gè)之中有5、6、7、8、9、10個(gè)即為50%、60%、70%、80%、90%、和100%互補(bǔ))?!巴耆パa(bǔ)”表示一個(gè)核酸序列的所有連續(xù)殘基與一個(gè)第二核酸序列中的相同數(shù)目的連續(xù)殘基形成氫鍵。如本文使用的“基本上互補(bǔ)”是指在一個(gè)具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50個(gè)或更多個(gè)核苷酸的區(qū)域上至少為60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、或100%的互補(bǔ)程度,或者是指在嚴(yán)格條件下雜交的兩個(gè)核酸。243、嚴(yán)格條件244、如本文中所使用的,對(duì)于雜交的“嚴(yán)格條件”是指與靶序列具有互補(bǔ)性的一個(gè)核酸主要地與該靶序列雜交并且基本上不雜交到非靶序列上的條件。嚴(yán)格條件通常是序列依賴(lài)性的,并且取決于許多因素而變化。一般而言,該序列越長(zhǎng),則該序列特異性地雜交到其靶序列上的溫度就越高。245、雜交246、術(shù)語(yǔ)“雜交”或“互補(bǔ)的”或“基本上互補(bǔ)的”是指核酸(例如rna、dna)包含使其能夠非共價(jià)結(jié)合的核苷酸序列,即以序列特異性,反平行的方式(即核酸特異性結(jié)合互補(bǔ)核酸)與另一核酸形成堿基對(duì)和/或g/u堿基對(duì),“退火”或“雜交”。247、雜交需要兩個(gè)核酸含有互補(bǔ)序列,盡管堿基之間可能存在錯(cuò)配。兩個(gè)核酸之間雜交的合適條件取決于核酸的長(zhǎng)度和互補(bǔ)程度,這是本領(lǐng)域公知的變量。典型地,可雜交核酸的長(zhǎng)度為8個(gè)核苷酸或更多(例如,10個(gè)核苷酸或更多,12個(gè)核苷酸或更多,15個(gè)核苷酸或更多,20個(gè)核苷酸或更多,22個(gè)核苷酸或更多,25個(gè)核苷酸或更多,或30個(gè)核苷酸或更多)。248、應(yīng)當(dāng)理解,多核苷酸的序列不需要與其靶核酸的序列100%互補(bǔ)以特異性雜交。多核苷酸可包含60%或更高,65%或更高,70%或更高,75%或更高,80%或更高,85%或更高,90%或更高,95%或更高,98%或更高,99%或更高,99.5%或更高,或與其雜交的靶核酸序列中的靶區(qū)域的序列互補(bǔ)性為100%。249、靶序列與grna的雜交代表靶序列和grna的核酸序列至少60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的可以雜交,形成復(fù)合物;或者代表靶序列和grna的核酸序列至少有12個(gè)、15個(gè)、16個(gè)、17個(gè)、18個(gè)、19個(gè)、20個(gè)、21個(gè)、22個(gè)或更多個(gè)堿基可以互補(bǔ)配對(duì),雜交形成復(fù)合物。250、表達(dá)251、如本文中所使用的,術(shù)語(yǔ)“表達(dá)”是指,藉此從dna模板轉(zhuǎn)錄成多核苷酸(如轉(zhuǎn)錄成mrna或其他rna轉(zhuǎn)錄物)的過(guò)程和/或轉(zhuǎn)錄的mrna隨后藉此翻譯成肽、多肽或蛋白質(zhì)的過(guò)程。轉(zhuǎn)錄物和編碼的多肽可以總稱(chēng)為“基因產(chǎn)物”。如果多核苷酸來(lái)源于基因組dna,表達(dá)可以包括真核細(xì)胞中mrna的剪接。252、接頭253、如本文中所使用的,術(shù)語(yǔ)“接頭”是指,由多個(gè)氨基酸殘基通過(guò)肽鍵連接形成的線(xiàn)性多肽。本發(fā)明的接頭可以為人工合成的氨基酸序列,或天然存在的多肽序列,例如具有鉸鏈區(qū)功能的多肽。此類(lèi)接頭多肽是本領(lǐng)域眾所周知的(參見(jiàn)例如,holliger,p.等人(1993)proc.natl.acad.sci.usa?90:6444-6448;poljak,r.j.等人(1994)structure?2:1121-1123)。254、治療255、如本文中所使用的,術(shù)語(yǔ)“治療”是指,治療或治愈病癥,延緩病癥的癥狀的發(fā)作,和/或延緩病癥的發(fā)展。256、受試者257、如本文中所使用的,術(shù)語(yǔ)“受試者”包括但不限于各種動(dòng)物、植物和微生物。258、動(dòng)物259、例如哺乳動(dòng)物,例如??苿?dòng)物、馬科動(dòng)物、羊科動(dòng)物、豬科動(dòng)物、犬科動(dòng)物、貓科動(dòng)物、兔科動(dòng)物、嚙齒類(lèi)動(dòng)物(例如,小鼠或大鼠)、非人靈長(zhǎng)類(lèi)動(dòng)物(例如,獼猴或食蟹猴)或人。在某些實(shí)施方式中,所述受試者(例如人)患有病癥(例如,疾病相關(guān)基因缺陷所導(dǎo)致的病癥)。260、植物261、術(shù)語(yǔ)“植物”應(yīng)理解為能夠進(jìn)行光合作用的任何分化的多細(xì)胞生物,在包括處于任何成熟或發(fā)育階段的作物植物,特別是單子葉或雙子葉植物,蔬菜作物,包括洋薊、球莖甘藍(lán)、芝麻菜、韭蔥、蘆筍、萵苣(例如,結(jié)球萵苣、葉萵苣、長(zhǎng)葉萵苣)、小白菜(bok?choy)、黃肉芋、瓜類(lèi)(例如,甜瓜、西瓜、克倫肖瓜(crenshaw)、白蘭瓜、羅馬甜瓜)、油菜作物(例如,球芽甘藍(lán)、卷心菜、花椰菜、西蘭花、羽衣甘藍(lán)、無(wú)頭甘藍(lán)、大白菜、小白菜)、刺菜薊、胡蘿卜、洋白菜(napa)、秋葵、洋蔥、芹菜、歐芹、鷹嘴豆、歐洲防風(fēng)草、菊苣、胡椒、馬鈴薯、葫蘆(例如,西葫蘆、黃瓜、小西葫蘆、倭瓜、南瓜)、蘿卜、干球洋蔥、蕪菁甘藍(lán)、紫茄子(也稱(chēng)為茄子)、婆羅門(mén)參、苣菜、青蔥、苦苣、大蒜、菠菜、綠洋蔥、倭瓜、綠葉菜類(lèi)(greens)、甜菜(糖甜菜和飼料甜菜)、甘薯、唐萵苣、山葵、西紅柿、蕪菁、以及香辛料;水果和/或蔓生作物,如蘋(píng)果、杏、櫻桃、油桃、桃、梨、李子、西梅、櫻桃、榅桲、杏仁、栗子、榛子、山核桃、開(kāi)心果、胡桃、柑橘、藍(lán)莓、博伊增莓(boysenberry)、小紅莓、穗醋栗、羅甘莓、樹(shù)莓、草莓、黑莓、葡萄、鱷梨、香蕉、獼猴桃、柿子、石榴、菠蘿、熱帶水果、梨果、瓜、芒果、木瓜、以及荔枝;大田作物,如三葉草、苜蓿、月見(jiàn)草、白芒花、玉米/玉蜀黍(飼料玉米、甜玉米、爆米花)、啤酒花、荷荷芭、花生、稻、紅花、小粒谷類(lèi)作物(大麥、燕麥、黑麥、小麥等)、高粱、煙草、木棉、豆科植物(豆類(lèi)、小扁豆、豌豆、大豆)、含油植物(油菜、芥菜、橄欖、向日葵、椰子、蓖麻油植物、可可豆、落花生)、擬南芥屬、纖維植物(棉花、亞麻、黃麻)、樟科(肉桂、莰酮)、或一種植物如咖啡、甘蔗、茶、以及天然橡膠植物;和/或花壇植物,如開(kāi)花植物、仙人掌、肉質(zhì)植物和/或觀賞植物,以及樹(shù)如森林(闊葉樹(shù)和常綠樹(shù),如針葉樹(shù))、果樹(shù)、觀賞樹(shù)、以及結(jié)堅(jiān)果的樹(shù)(nut-bearing?tree)、以及灌木和其他苗木。262、發(fā)明的有益效果263、本發(fā)明通過(guò)突變提高了cas12j19蛋白的活性,具有廣泛的應(yīng)用前景。264、下面將結(jié)合附圖和實(shí)施例對(duì)本發(fā)明的實(shí)施方案進(jìn)行詳細(xì)描述,但是本領(lǐng)域技術(shù)人員將理解,下列附圖和實(shí)施例僅用于說(shuō)明本發(fā)明,而不是對(duì)本發(fā)明的范圍的限定。根據(jù)附圖和優(yōu)選實(shí)施方案的下列詳細(xì)描述,本發(fā)明的各種目的和有利方面對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō)將變得顯然。當(dāng)前第1頁(yè)12當(dāng)前第1頁(yè)12