欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

新型CRISPR-Casδ酶和系統(tǒng)

文檔序號:40513542發(fā)布日期:2024-12-31 13:22閱讀:6來源:國知局
本發(fā)明涉及核酸編輯領域,特別是規(guī)律成簇的間隔短回文重復(crispr)。具體而言,本發(fā)明涉及cas效應蛋白,包含此類蛋白的融合蛋白,以及編碼它們的核酸分子。本發(fā)明還涉及用于核酸編輯(例如,基因或基因組編輯)的復合物和組合物,其包含本發(fā)明的蛋白或融合蛋白,或編碼它們的核酸分子。本發(fā)明還涉及用于核酸編輯(例如,基因或基因組編輯)的方法,其使用包含本發(fā)明的蛋白或融合蛋白。
背景技術
::1、crispr/cas技術是一種被廣泛使用的基因編輯技術,它通過rna引導對基因組上的靶序列進行特異性結合并切割dna產生雙鏈斷裂,利用生物非同源末端連接或同源重組進行定點基因編輯。2、crispr/cas9系統(tǒng)是最常用的ii型crispr系統(tǒng),它識別3’-ngg的pam基序,對靶標序列進行平末端切割。crispr/cas?type?v系統(tǒng)是一類近兩年新發(fā)現(xiàn)的crispr系統(tǒng),它具有5’-ttn的基序,對靶標序列進行粘性末端切割,例如cpf1,c2c1,casx,casy。然而目前存在的不同的crispr/cas各有不同的優(yōu)點和缺陷。例如cas9,c2c1和casx均需要兩條rna進行導向rna,而cpf1只需要一條導向rna而且可以用來進行多重基因編輯。casx具有980個氨基酸的大小,而常見的cas9,c2c1,casy和cpf1通常大小在1300個氨基酸左右。此外,cas9,cpf1,casx,casy的pam序列都比較復雜多樣,而c2c1識別嚴謹?shù)?’-ttn,因此它的靶標位點比其他系統(tǒng)容易被預測從而降低了潛在的脫靶效應。3、總之,鑒于目前可獲得的crispr/cas系統(tǒng)都受限于一些缺陷,開發(fā)一種更穩(wěn)健的、具有多方面良好性能的新型crispr/cas系統(tǒng)對生物技術的發(fā)展具有重要意義。技術實現(xiàn)思路1、本技術的發(fā)明人經過大量實驗和反復摸索,出人意料地發(fā)現(xiàn)了一種新型rna指導的核酸內切酶?;谶@一發(fā)現(xiàn),本發(fā)明人開發(fā)了新的crispr/cas系統(tǒng)以及基于該系統(tǒng)的基因編輯方法。2、cas效應蛋白3、因此,在第一方面,本發(fā)明提供了一種蛋白,其具有seq?id?no:1、2、3任一項所示的氨基酸序列或其直系同源物、同源物、變體或功能性片段;其中,所述直系同源物、同源物、變體或功能性片段基本保留了其所源自的序列的生物學功能。4、在本發(fā)明中,上述序列的生物學功能包括但不限于,與導向rna結合的活性、核酸內切酶活性、在導向rna引導下與靶序列特定位點結合并切割的活性。5、在某些實施方案中,所述直系同源物、同源物、變體與其所源自的序列相比具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性。6、在某些實施方案中,所述直系同源物、同源物、變體與seq?id?no:1、2、3任一項所示的序列相比具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性,并且基本保留了其所源自的序列的生物學功能(例如,與導向rna結合的活性、核酸內切酶活性、在導向rna引導下與靶序列特定位點結合并切割的活性)。7、在某些實施方案中,所述蛋白是crispr/cas系統(tǒng)中的效應蛋白。8、在某些實施方案中,本發(fā)明的蛋白包含選自下列的序列,或由選自下列的序列組成:9、(i)seq?id?no:1、2、3任一項所示的序列;10、(ii)與seq?id?no:1、2、3任一項所示的序列相比具有一個或多個氨基酸的置換、缺失或添加(例如1個,2個,3個,4個,5個,6個,7個,8個,9個,10個,11個,12個,13個,14個,15個,16個,17個,18個,19個,20個,21個,22個,23個,24個,25個,26個,27個,28個,29個,30個,31個,32個,33個,34個,35個,36個,37個,38個,39個以及40個氨基酸的置換、缺失或添加)的序列;或11、(iii)與seq?id?no:1、2、3任一項所示的序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性的序列。12、蛋白截短體13、在第二方面,本發(fā)明提供了蛋白截短體,所述蛋白截短體與第一方面所述的蛋白相比,在n端和/或c端截短了1個或多個氨基酸(例如,1-10個,11-20個,21-30個,31-40個,41-50個,51-60個或更多個氨基酸)。14、在某些實施方案中,所述蛋白截短體與第一方面所述的蛋白相比,在n端截短了31個氨基酸。15、在某些實施方案中,所述蛋白截短體與seq?id?no:1、2任一項所示的序列相比,在n端截短了31個氨基酸。16、在某些實施方案中,術語“在n端截短了31個氨基酸”是指從n端的起始氨基酸連續(xù)的截短31個氨基酸。17、在某些實施方案中,所述蛋白截短體包含選自下列的序列,或由選自下列的序列組成:18、(i)seq?id?no:3所示的序列;19、(ii)與seq?id?no:3所示的序列相比具有一個或多個氨基酸的置換、缺失或添加(例如1個,2個,3個,4個,5個,6個,7個,8個,9個,10個,11個,12個,13個,14個,15個,16個,17個,18個,19個,20個,21個,22個,23個,24個,25個,26個,27個,28個,29個,30個,31個,32個,33個,34個,35個,36個,37個,38個,39個以及40個氨基酸的置換、缺失或添加)的序列;或20、(iii)與seq?id?no:3所示的序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性的序列。21、在某些實施方案中,所述蛋白截短體具有seq?id?no:3所示的氨基酸序列。22、衍生的蛋白23、本發(fā)明的蛋白或蛋白截短體可進行衍生化,例如被連接至另一個分子(例如另一個多肽或蛋白)。通常,蛋白的衍生化(例如,標記)不會不利影響該蛋白的期望活性(例如,與導向rna結合的活性、核酸內切酶活性、在導向rna引導下與靶序列特定位點結合并切割的活性)。因此,本發(fā)明的蛋白還意欲包括此類衍生化的形式。例如,可以將本發(fā)明的蛋白功能性連接(通過化學偶合、基因融合、非共價連接或其它方式)于一個或多個其它分子基團,例如另一個蛋白或多肽,檢測試劑,藥用試劑等。24、特別地,可以將本發(fā)明的蛋白連接其他功能性單元。例如,可以將其與核定位信號(nls)序列連接,以提高本發(fā)明的蛋白進入細胞核的能力。例如,可以將其與靶向部分連接,以使得本發(fā)明的蛋白具有靶向性。例如,可以將其與可檢測的標記連接,以便于對本發(fā)明的蛋白進行檢測。例如,可以將其與表位標簽連接,以便于本發(fā)明的蛋白的表達、檢測、示蹤和/或純化。25、綴合物26、因此,在第三方面,本發(fā)明提供了一種綴合物,其包含如上所述的蛋白或蛋白截短體和修飾部分。27、在某些實施方案中,所述修飾部分選自另外的蛋白或多肽、可檢測的標記或其任意組合。28、在某些實施方案中,所述另外的蛋白或多肽選自表位標簽、報告基因序列、核定位信號(nls)序列、靶向部分、轉錄激活結構域(例如,vp64)、轉錄抑制結構域(例如,krab結構域或sid結構域)、核酸酶結構域(例如,fok1),具有選自下列的活性的結構域:核苷酸脫氨酶、甲基化酶活性,去甲基化酶,轉錄激活活性,轉錄抑制活性,轉錄釋放因子活性,組蛋白修飾活性,核酸酶活性,單鏈rna切割活性,雙鏈rna切割活性,單鏈dna切割活性,雙鏈dna切割活性和核酸結合活性;以及其任意組合。29、在某些實施方案中,本發(fā)明的綴合物包含一個或多個nls序列,例如sv40病毒大t抗原的nls。在某些示例性實施方案中,所述nls序列如seq?id?no:27所示。在某些實施方案中,所述nls序列位于、靠近或接近本發(fā)明的蛋白或蛋白截短體的末端(例如,n端或c端)。在某些示例性實施方案中,所述nls序列位于、靠近或接近本發(fā)明的蛋白或蛋白截短體的c端。30、在某些實施方案中,本發(fā)明的綴合物包含表位標簽(epitope?tag)。這類表位標簽是本領域技術人員熟知的,其實例包括但不限于his、v5、flag、ha、myc、vsv-g、trx等,并且本領域技術人員已知如何根據(jù)期望目的(例如,純化、檢測或示蹤)選擇合適的表位標簽。31、在某些實施方案中,本發(fā)明的綴合物包含報告基因序列。這類報告基因是本領域技術人員熟知的,其實例包括但不限于gst、hrp、cat、gfp、hcred、dsred、cfp、yfp、bfp等。32、在某些實施方案中,本發(fā)明的綴合物包含能夠與dna分子或細胞內分子結合的結構域,例如麥芽糖結合蛋白(mbp)、lex?a的dna結合結構域(dbd)、gal4的dbd等。33、在某些實施方案中,本發(fā)明的綴合物包含可檢測的標記,例如熒光染料,例如fitc或dapi。34、在某些實施方案中,本發(fā)明的蛋白或蛋白截短體任選地通過接頭與所述修飾部分偶聯(lián)、綴合或融合。35、在某些實施方案中,所述修飾部分直接連接至本發(fā)明的蛋白或蛋白截短體的n端或c端。36、在某些實施方案中,所述修飾部分通過接頭連接至本發(fā)明的蛋白或蛋白截短體的n端或c端。這類接頭是本領域熟知的,其實例包括但不限于包含一個或多個(例如,1個,2個,3個,4個或5個)氨基酸(如,glu或ser)或氨基酸衍生物(如,ahx、β-ala、gaba或ava)的接頭,或peg等。37、融合蛋白38、在第四方面,本發(fā)明提供了一種融合蛋白,其包含第一方面所述的蛋白或第二方面所述的蛋白截短體以及另外的蛋白或多肽。39、在某些實施方案中,所述另外的蛋白或多肽選自表位標簽、報告基因序列、核定位信號(nls)序列、靶向部分、轉錄激活結構域(例如,vp64)、轉錄抑制結構域(例如,krab結構域或sid結構域)、核酸酶結構域(例如,fok1),具有選自下列的活性的結構域:核苷酸脫氨酶、甲基化酶活性,去甲基化酶,轉錄激活活性,轉錄抑制活性,轉錄釋放因子活性,組蛋白修飾活性,核酸酶活性,單鏈rna切割活性,雙鏈rna切割活性,單鏈dna切割活性,雙鏈dna切割活性和核酸結合活性;以及其任意組合。40、在某些實施方案中,本發(fā)明的融合蛋白包含一個或多個nls序列,例如sv40病毒大t抗原的nls。在某些實施方案中,所述nls序列位于、靠近或接近本發(fā)明的蛋白或蛋白截短體的末端(例如,n端或c端)。在某些示例性實施方案中,所述nls序列位于、靠近或接近本發(fā)明的蛋白或蛋白截短體的c端。41、在某些實施方案中,本發(fā)明的融合蛋白包含表位標簽。42、在某些實施方案中,本發(fā)明的融合蛋白包含報告基因序列。43、在某些實施方案中,本發(fā)明的融合蛋白包含能夠與dna分子或細胞內分子結合的結構域。44、在某些實施方案中,本發(fā)明的蛋白或蛋白截短體任選地通過接頭與所述另外的蛋白或多肽融合。45、在某些實施方案中,所述另外的蛋白或多肽直接連接至本發(fā)明的蛋白或蛋白截短體的n端或c端。46、在某些實施方案中,所述另外的蛋白或多肽通過接頭連接至本發(fā)明的蛋白或蛋白截短體的n端或c端。47、在某些示例性實施方案中,本發(fā)明的融合蛋白具有如seq?id?no:28-30任一項所示的氨基酸序列。48、本發(fā)明的蛋白、本發(fā)明的綴合物或本發(fā)明的融合蛋白不受其產生方式的限定,例如,其可以通過基因工程方法(重組技術)產生,也可以通過化學合成方法產生。49、同向重復序列50、在第五方面,本發(fā)明提供了一種分離的核酸分子,其包含選自下列的序列,或由選自下列的序列組成:51、(i)seq?id?no:7、8、9、10、11、12、13、14、15或16任一項所示的序列;52、(ii)與seq?id?no:7、8、9、10、11、12、13、14、15或16任一項所示的序列相比具有一個或多個堿基的置換、缺失或添加(例如1個,2個,3個,4個,5個,6個,7個,8個,9個或10個堿基的置換、缺失或添加)的序列;53、(iii)與seq?id?no:7、8、9、10、11、12、13、14、15或16任一項所示的序列具有至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%的序列同一性的序列;54、(iv)在嚴格條件下與(i)-(iii)任一項中所述的序列雜交的序列;或55、(v)(i)-(iii)任一項中所述的序列的互補序列;56、并且,(ii)-(v)中任一項所述的序列基本保留了其所源自的序列的生物學功能,所述序列的生物學功能是指,作為crispr-cas系統(tǒng)中的同向重復序列的活性。57、在某些實施方案中,所述分離的核酸分子是crispr-cas系統(tǒng)中的同向重復序列。58、在某些實施方案中,所述核酸分子包含選自下列的序列,或由選自下列的序列組成:59、(a)seq?id?no:7、8、9、10、11、12、13、14、15或16任一項所示的核苷酸序列;60、(b)在嚴格條件下與(a)中所述的序列雜交的序列;或61、(c)(a)中所述的序列的互補序列。62、在某些實施方案中,所述分離的核酸分子是rna。在某些實施方案中,所述分離的核酸分子是crispr/cas系統(tǒng)中的同向重復序列。63、crispr/cas復合物64、在第六方面,本發(fā)明提供了一種復合物,其包含:65、(i)蛋白組分,其選自:本發(fā)明的蛋白、蛋白截短體、綴合物或融合蛋白,及其任意組合;和66、(ii)核酸組分,其從5’至3’方向包含如上文所述的分離的核酸分子和能夠與靶序列雜交的導向序列,67、其中,所述蛋白組分與核酸組分相互結合形成復合物。68、在某些實施方案中,所述導向序列連接于所述核酸分子的3’端。69、在某些實施方案中,所述導向序列包含所述靶序列的互補序列。70、在某些實施方案中,所述核酸組分是crispr-cas系統(tǒng)中的導向rna。71、在某些實施方案中,所述核酸分子是rna。72、在某些實施方案中,所述復合物不包含反式作用crrna(tracrrna)。73、在某些實施方案中,所述導向序列在長度上為至少5個、至少10個、至少15個、至少20個、至少25個、至少30個核苷酸。在某些實施方案中,所述導向序列在長度上為10-30個、或15-25個、或15-22個、或19-25個或19-22個核苷酸。74、在某些實施方案中,所述分離的核酸分子在長度上為55-70個核苷酸,例如55-65個核苷酸,例如60-65個核苷酸,例如62-65個核苷酸,例如63-64個核苷酸。在某些實施方案中,所述分離的核酸分子在長度上為15-30個核苷酸,例如15-25個核苷酸,例如20-25個核苷酸,例如22-24個核苷酸,例如23個核苷酸。75、編碼核酸、載體及宿主細胞76、在第七方面,本發(fā)明提供了一種分離的核酸分子,其包含:77、(i)編碼本發(fā)明的蛋白、蛋白截短體或融合蛋白的核苷酸序列;78、(ii)編碼如第五方面所述的分離的核酸分子的核苷酸序列;或79、(iii)包含(i)和(ii)的核苷酸序列。80、在某些實施方案中,(i)-(iii)任一項中所述的核苷酸序列經密碼子優(yōu)化用于在原核細胞中進行表達。在某些實施方案中,(i)-(iii)任一項中所述的核苷酸序列經密碼子優(yōu)化用于在真核細胞中進行表達。81、在第八方面,本發(fā)明還提供了一種載體,其包含如第七方面所述的分離的核酸分子。本發(fā)明的載體可以是克隆載體,也可以是表達載體。在某些實施方案中,本發(fā)明的載體是例如質粒,粘粒,噬菌體,柯斯質粒等等。在某些實施方案中,所述載體能夠在受試者(例如哺乳動物,例如人)體內表達本發(fā)明的蛋白、蛋白截短體、融合蛋白、如第五方面所述的分離的核酸分子或如第六方面所述的復合物。82、在第九方面,本發(fā)明還提供了包含如上所述的分離的核酸分子或載體的宿主細胞。此類宿主細胞包括但不限于,原核細胞例如大腸桿菌細胞,以及真核細胞例如酵母細胞,昆蟲細胞,植物細胞(例如,木薯、玉米、高粱、大豆、小麥、燕麥或水稻細胞)和動物細胞(如哺乳動物細胞,例如小鼠細胞、人細胞等)。本發(fā)明的細胞還可以是細胞系,例如293t細胞。83、組合物及載體組合物84、在第十方面,本發(fā)明還提供了一種組合物,其包含:85、(i)第一組分,其選自:本發(fā)明的蛋白、蛋白截短體、綴合物、融合蛋白、編碼所述蛋白、蛋白截短體或融合蛋白的核苷酸序列,以及其任意組合;和86、(ii)第二組分,其為包含導向rna的核苷酸序列,或者編碼所述包含導向rna的核苷酸序列的核苷酸序列;87、其中,所述導向rna從5’至3’方向包含同向重復序列和導向序列,所述導向序列能夠與靶序列雜交;88、所述導向rna能夠與(i)中所述的蛋白、蛋白截短體、綴合物或融合蛋白形成復合物。89、在某些實施方案中,所述同向重復序列是如第五方面所定義的分離的核酸分子。90、在某些實施方案中,所述導向序列連接至所述同向重復序列的3’端。在某些實施方案中,所述導向序列包含所述靶序列的互補序列。91、在某些實施方案中,所述組合物不包含crrna(tracrrna)。92、在某些實施方案中,所述組合物是非天然存在的或經修飾的。在某些實施方案中,所述組合物中的至少一個組分是非天然存在的或經修飾的。在某些實施方案中,所述第一組分是非天然存在的或經修飾的;和/或,所述第二組分是非天然存在的或經修飾的。93、在某些實施方案中,當所述靶序列為dna時,所述靶序列位于原間隔序列臨近基序(pam)的3’端,并且所述pam具有5’-ryr所示的序列,其中r選自a或者g,y選自t或者c。在某些實施方案中,所述pam的序列選自atg,acg,gtg,ata,aca,gca,gta和/或gcg。94、在某些實施方案中,當所述靶序列為rna時,所述靶序列不具有pam結構域限制。95、在某些實施方案中,所述靶序列是來自原核細胞或真核細胞的dna或rna序列。在某些實施方案中,所述靶序列是非天然存在的dna或rna序列。96、在某些實施方案中,所述靶序列存在于細胞內。在某些實施方案中,所述靶序列存在于細胞核內或細胞質(例如,細胞器)內。在某些實施方案中,所述細胞是真核細胞。在某些實施方案中,所述細胞是原核細胞。97、在某些實施方案中,所述蛋白或蛋白截短體連接有一個或多個nls序列。在某些實施方案中,所述綴合物或融合蛋白包含一個或多個nls序列。在某些實施方案中,所述nls序列連接至所述蛋白的n端或c端。在某些實施方案中,所述nls序列融合至所述蛋白的n端或c端。98、在第十一方面,本發(fā)明還提供了一種組合物,其包含一種或多種載體,所述一種或多種載體包含:99、(i)第一核酸,其包含編碼本發(fā)明的蛋白、蛋白截短體或融合蛋白的核苷酸序列;任選地所述第一核酸可操作地連接至第一調節(jié)元件;以及100、(ii)第二核酸,其包含編碼導向rna的核苷酸序列;任選地所述第二核酸可操作地連接至第二調節(jié)元件;101、其中:102、所述第一核酸與第二核酸存在于相同或不同的載體上;103、所述導向rna從5’至3’方向包含同向重復序列和導向序列,所述導向序列能夠與靶序列雜交;104、所述導向rna能夠與(i)中所述的蛋白、蛋白截短體或融合蛋白形成復合物。105、在某些實施方案中,所述同向重復序列是如第五方面所定義的分離的核酸分子。106、在某些實施方案中,所述導向序列連接至所述同向重復序列的3’端。在某些實施方案中,所述導向序列包含所述靶序列的互補序列。107、在某些實施方案中,所述組合物不包含反式作用crrna(tracrrna)。108、在某些實施方案中,所述組合物是非天然存在的或經修飾的。在某些實施方案中,所述組合物中的至少一個組分是非天然存在的或經修飾的。109、在某些實施方案中,所述第一調節(jié)元件是啟動子,例如誘導型啟動子。110、在某些實施方案中,所述第二調節(jié)元件是啟動子,例如誘導型啟動子。111、在某些實施方案中,當所述靶序列為dna時,所述靶序列位于原間隔序列臨近基序(pam)的3’端,并且所述pam具有5’-ryr所示的序列,其中,r為a或者g,y為t或者c。112、在某些實施方案中,所述pam的序列選自atg,acg,gtg,ata,aca,gca,gta和/或gcg。113、在某些實施方案中,當所述靶序列為rna時,所述靶序列不具有pam結構域限制。114、在某些實施方案中,所述靶序列是來自原核細胞或真核細胞的dna或rna序列。在某些實施方案中,所述靶序列是非天然存在的dna或rna序列。115、在某些實施方案中,所述靶序列存在于細胞內。在某些實施方案中,所述靶序列存在于細胞核內或細胞質(例如,細胞器)內。在某些實施方案中,所述細胞是真核細胞。在某些實施方案中,所述細胞是原核細胞。116、在某些實施方案中,所述蛋白連接有一個或多個nls序列。在某些實施方案中,所述綴合物或融合蛋白包含一個或多個nls序列。在某些實施方案中,所述nls序列連接至所述蛋白的n端或c端。在某些實施方案中,所述nls序列融合至所述蛋白的n端或c端。117、在某些實施方案中,一種類型的載體是質粒,其是指其中可以例如通過標準分子克隆技術插入另外的dna片段的環(huán)狀雙鏈dna環(huán)。另一種類型的載體是病毒載體,其中病毒衍生的dna或rna序列存在于用于包裝病毒(例如,逆轉錄病毒、復制缺陷型逆轉錄病毒、腺病毒、復制缺陷型腺病毒、以及腺相關病毒)的載體中。病毒載體還包含由用于轉染到一種宿主細胞中的病毒攜帶的多核苷酸。某些載體(例如,具有細菌復制起點的細菌載體和附加型哺乳動物載體)能夠在它們被導入的宿主細胞中自主復制。其他載體(例如,非附加型哺乳動物載體)在引入宿主細胞后整合到該宿主細胞的基因組中,并且由此與該宿主基因組一起復制。而且,某些載體能夠指導它們可操作連接的基因的表達。這樣的載體在此被稱為“表達載體”。在重組dna技術中使用的普通表達栽體通常是質粒形式。118、重組表達載體可包含處于適合于在宿主細胞中的核酸表達的形式的本發(fā)明的核酸分子,這意味著這些重組表達載體包含基于待用于表達的宿主細胞而選擇的一種或多種調節(jié)元件,所述調節(jié)元件可操作地連接至待表達的核酸序列。119、遞送及遞送組合物120、本發(fā)明的蛋白、蛋白截短體、綴合物、融合蛋白、如第五方面所述的分離的核酸分子、本發(fā)明的復合物、如第七方面所述的分離的核酸分子、如第八方面所述的載體、如第十方面及第十一方面所述的組合物,可以通過本領域已知的任何方法進行遞送。此類方法包括但不限于,電穿孔、脂轉染、核轉染、顯微注射、聲孔效應、基因槍、磷酸鈣介導的轉染、陽離子轉染、脂質體轉染、樹枝狀轉染、熱激轉染、核轉染、磁轉染、脂轉染、穿刺轉染、光學轉染、試劑增強性核酸攝取、以及經由脂質體、免疫脂質體、病毒顆粒、人工病毒體等的遞送。121、因此,在第十二方面,本發(fā)明提供了一種遞送組合物,其包含遞送載體,以及選自下列的一種或多種:本發(fā)明的蛋白、蛋白截短體、綴合物、融合蛋白、如第五方面所述的分離的核酸分子、本發(fā)明的復合物、如第七方面所述的分離的核酸分子、如第八方面所述的載體、如第十方面及第十一方面所述的組合物。122、在某些實施方案中,所述遞送載體是粒子。123、在某些實施方案中,所述遞送載體選自脂質顆粒、糖顆粒、金屬顆粒、蛋白顆粒、脂質體、外泌體、微泡、基因槍或病毒載體(例如,復制缺陷型逆轉錄病毒、慢病毒、腺病毒或腺相關病毒)。124、試劑盒125、在另一個方面,本發(fā)明提供了一種試劑盒,其包含如上所述的組分中的一種或多種。在某些實施方案中,所述試劑盒包含一種或多種選自下列的組分:本發(fā)明的蛋白、蛋白截短體、綴合物、融合蛋白、如第五方面所述的分離的核酸分子、本發(fā)明的復合物、如第七方面所述的分離的核酸分子、如第八方面所述的載體、如第十方面及第十一方面所述的組合物。126、在某些實施方案中,本發(fā)明的試劑盒包含如第十方面所述的組合物。在某些實施方案中,所述試劑盒還包含使用所述組合物的說明書。127、在某些實施方案中,本發(fā)明的試劑盒包含如第十一方面所述的組合物。在某些實施方案中,所述試劑盒還包含使用所述組合物的說明書。128、在某些實施方案中,本發(fā)明的試劑盒中包含的組分可以被提供于任何適合的容器中。129、在某些實施方案中,所述試劑盒還包含一種或多種緩沖液。緩沖液可以是任何緩沖液,包括但不限于碳酸鈉緩沖液、碳酸氫鈉緩沖液、硼酸鹽緩沖液、tris緩沖液、mops緩沖液、hepes緩沖液及其組合。在某些實施方案中,該緩沖液是堿性的。在某些實施方案中,該緩沖液具有從約7至約10的ph。130、在某些實施方案中,該試劑盒還包括一個或多個寡核苷酸,該一個或多個寡核苷酸對應于一個用于插入進載體中的導向序列,以便可操作地連接該導向序列和調節(jié)元件。在某些實施方案中,該試劑盒包括同源重組模板多核苷酸。131、方法及用途132、在另一個方面,本發(fā)明提供了一種修飾靶基因的方法,其包括:將本發(fā)明的復合物、如第十方面及第十一方面所述的組合物與所述靶基因接觸,或者遞送至包含所述靶基因的細胞中;其中,靶序列存在于所述靶基因中。133、在某些實施方案中,所述方法用于體外(in?vitro)或離體(ex?vivo)修飾靶基因。在某些實施方案中,所述方法不是通過療法來治療人或動物的方法。在某些實施方案中,所述方法不包括修飾人類種系遺傳特性的步驟。134、在某些實施方案中,所述靶基因存在于細胞內。在某些實施方案中,所述細胞是原核細胞。在某些實施方案中,所述細胞是真核細胞。在某些實施方案中,所述細胞是哺乳動物細胞。在某些實施方案中,所述細胞是人類細胞。在某些實施方案中,所述細胞選自非人靈長類動物、牛、豬或嚙齒類動物細胞。在某些實施方案中,所述細胞是非哺乳動物真核細胞,例如家禽或魚等。在某些實施方案中,所述細胞是植物細胞,例如栽培植物(如木薯、玉米、高粱、小麥或水稻)、藻類、樹或蔬菜具有的細胞。135、在某些實施方案中,所述靶基因存在于體外的核酸分子(例如,質粒)中。在某些實施方案中,所述靶基因存在于質粒中。136、在某些實施方案中,所述方法導致靶序列斷裂(例如,使dna雙鏈斷裂或rna單鏈斷裂)。在某些實施方案中,所述斷裂導致靶基因的轉錄降低。137、在某些實施方案中,所述方法還包括:將編輯模板(例如外源核酸)與所述靶基因接觸,或者遞送至包含所述靶基因的細胞中。在此類實施方案中,所述方法通過與編輯模板(例如外源核酸)同源重組修復所述斷裂的靶基因,其中所述修復導致一種突變,包括所述靶基因的一個或多個核苷酸的插入、缺失、或取代。在某些實施方案中,所述突變導致在從包含該靶序列的基因表達的蛋白質中的一個或多個氨基酸改變。138、因此,在某些實施方案中,所述修飾還包括將編輯模板(例如外源核酸)插入所述斷裂中。139、在某些實施方案中,所述的蛋白、蛋白截短體、綴合物、融合蛋白、分離的核酸分子、復合物、載體或組合物包含于遞送載體中。140、在某些實施方案中,所述遞送載體選自脂質顆粒、糖顆粒、金屬顆粒、蛋白顆粒、脂質體、外泌體、病毒載體(如復制缺陷型逆轉錄病毒、慢病毒、腺病毒或腺相關病毒)。141、在某些實施方案中,所述方法其用于改變靶基因或編碼靶基因產物的核酸分子中的一個或多個靶序列來修飾細胞、細胞系或生物體。142、在另一個方面,本發(fā)明提供了一種改變基因產物的表達的方法,其包括:將本發(fā)明的復合物、如第十方面及第十一方面所述的組合物與編碼所述基因產物的核酸分子接觸,或者遞送至包含所述核酸分子的細胞中;其中,靶序列存在于所述核酸分子中。143、在某些實施方案中,所述方法用于體外或離體改變基因產物的表達。在某些實施方案中,所述方法不是通過療法來治療人或動物的方法。在某些實施方案中,所述方法不包括修飾人類種系遺傳特性的步驟。144、在某些實施方案中,所述核酸分子存在于細胞內。在某些實施方案中,所述細胞是原核細胞。在某些實施方案中,所述細胞是真核細胞。在某些實施方案中,所述細胞是哺乳動物細胞。在某些實施方案中,所述細胞是人類細胞。在某些實施方案中,所述細胞選自非人靈長類動物、牛、豬或嚙齒類動物細胞。在某些實施方案中,所述細胞是非哺乳動物真核細胞,例如家禽或魚等。在某些實施方案中,所述細胞是植物細胞,例如栽培植物(如木薯、玉米、高粱、小麥或水稻)、藻類、樹或蔬菜具有的細胞。145、在某些實施方案中,所述核酸分子存在于體外的核酸分子(例如,質粒)中。在某些實施方案中,所述核酸分子存在于質粒中。146、在某些實施方案中,所述基因產物的表達被改變(例如,增強或降低)。在某些實施方案中,所述基因產物的表達被增強。在某些實施方案中,所述基因產物的表達被降低。147、在某些實施方案中,所述基因產物是蛋白。148、在某些實施方案中,所述的蛋白、蛋白截短體、綴合物、融合蛋白、分離的核酸分子、復合物、載體或組合物包含于遞送載體中。149、在某些實施方案中,所述遞送載體選自脂質顆粒、糖顆粒、金屬顆粒、蛋白顆粒、脂質體、外泌體、病毒載體(如復制缺陷型逆轉錄病毒、慢病毒、腺病毒或腺相關病毒)。150、在某些實施方案中,所述方法其用于改變靶基因或編碼靶基因產物的核酸分子中的一個或多個靶序列來修飾細胞、細胞系或生物體。151、在另一個方面,本發(fā)明涉及如第一方面所述的蛋白、如第二方面所述的蛋白截短體、如第三方面所述的綴合物、如第四方面所述的融合蛋白、如第五方面所述的分離的核酸分子、如第六方面所述的復合物、如第七方面所述的分離的核酸分子、如第八方面所述的載體、如第十方面所述的組合物、如第十方面所述的組合物、本發(fā)明的試劑盒,在制備制劑中的用途,所述制劑用于核酸編輯(例如,體外或離體核酸編輯)。152、在某些實施方案中,待被編輯的核酸存在于細胞內。在某些實施方案中,所述細胞是原核細胞或真核細胞。在某些實施方案中,待被編輯的核酸存在于體外的核酸分子(例如,質粒)中。153、在某些實施方案中,所述核酸編輯包括基因或基因組編輯,例如修飾基因、敲除基因、改變基因產物的表達、修復突變、和/或插入多核苷酸。在某些實施方案中,所述基因或基因組編輯不包括修飾人類種系遺傳特性的步驟。在某些實施方案中,所述用途不是通過療法來治療人或動物的方法。154、在某些實施方案中,所述用途還包括通過與外源模板多核苷酸的同源重組來修復被編輯的靶序列,其中所述修復可以產生該靶序列的突變,包括一個或多個核苷酸的插入、缺失或取代。155、在另一個方面,本發(fā)明涉及如第一方面所述的蛋白、如第二方面所述的蛋白截短體、如第三方面所述的綴合物、如第四方面所述的融合蛋白、如第五方面所述的分離的核酸分子、如第六方面所述的復合物、如第七方面所述的分離的核酸分子、如第八方面所述的載體、如第十方面所述的組合物、如第十方面所述的組合物、本發(fā)明的試劑盒,在制備制劑中的用途,所述制劑用于:(i)體外或離體dna檢測;(ii)編輯靶基因座中的靶序列來修飾生物或非人類生物(例如,原核生物)。156、在某些實施方案中,所述制劑用于單鏈dna或雙鏈dna的檢測(例如原核細胞中的單鏈或雙鏈dna的檢測)。157、在某些實施方案中,所述dna檢測用于檢測腫瘤、病毒或細菌。不限制于理論,認為由于casδ蛋白在靶dna識別后對單鏈dna的非特異性切割特性,當靶dna(例如,腫瘤特異性標記、病毒或細菌特異性標記)存在時,通過加入可被檢測的單鏈dna并檢測該單鏈dna被非特異性切割的情況,可以實現(xiàn)對腫瘤、埃博拉、禽流感、非洲豬瘟等病毒或細菌的檢測。158、在另一方面,本發(fā)明還提供一種檢測樣品中是否存在靶核酸的方法,其包括以下步驟:159、(1)將所述樣品與帶有標記的dna探針、以及以下任一組分接觸:本發(fā)明的復合物、如第十方面及第十一方面所述的組合物或本發(fā)明所述的試劑盒;160、其中,所述復合物、組合物或試劑盒包含的導向序列能夠與靶核酸雜交,并且,所述dna探針不與所述導向序列雜交;161、在某些實施方案中,所述dna探針被切割后發(fā)出可檢測信號;162、(2)檢測由所述復合物、組合物或試劑盒所包含的蛋白或蛋白截短體切割所述dna探針產生的可檢測信號,從而確定所述樣品中是否存在靶核酸。163、在某些實施方案中,所述dna探針的一端(例如,5’端)經熒光基團標記,另一端(例如,3’端)經淬滅基團標記。164、在某些實施方案中,所述靶核酸的序列為獲自病原物的序列。在某些實施方案中,所述病原物選自病毒、細菌、真菌、原生動物、寄生蟲或其任意組合。165、在某些實施方案中,所述靶核酸的序列獲自腫瘤細胞的基因組。166、本技術所檢測的靶核酸可以是dna也可以是rna。因此,在某些實施方案中,所述方法還包括將所述樣品與用于逆轉錄的試劑接觸的步驟。在某些實施方案中,所述用于逆轉錄的試劑選自逆轉錄酶、寡核苷酸引物、dntp或其任意組合。167、在某些實施方案中,所述靶核酸是單鏈或雙鏈的。在某些實施方案中,所述靶核酸的序列是來自原核細胞或真核細胞的dna或rna序列;或者,所述靶核酸的序列是非天然存在的dna或rna序列。168、在某些實施方案中,所述可檢測信號通過選自下列的一種或多種方法測定:基于成像的檢測,基于傳感器的檢測,顏色檢測,基于金納米顆粒的檢測,熒光偏振,膠體相變/分散,電化學檢測和基于半導體的傳感。169、在某些實施方案中,所述方法還包括擴增樣品中所述靶核酸的步驟。170、細胞及細胞子代171、在某些情況下,由本發(fā)明的方法引入到細胞的修飾可以使得細胞和其子代被改變以改進其生物產物(如抗體、淀粉、乙醇或其他期望的細胞輸出物)的產生。在某些情況下,由本發(fā)明的方法引入到細胞的修飾可以使得細胞和其子代包括使所生產生物產物發(fā)生變化的改變。172、因此,在另一方面,本發(fā)明還涉及如上所述的方法獲得的細胞或其子代,其中所述細胞含有在其野生型中不存在的修飾。173、本發(fā)明還涉及如上所述的細胞或其子代的細胞產物。174、本發(fā)明還涉及一種體外的、離體的或體內的細胞或細胞系或它們的子代,所述細胞或細胞系或它們的子代包含:如第一方面所述的蛋白、如第二方面所述的蛋白截短體、如第三方面所述的綴合物、如第四方面所述的融合蛋白、如第五方面所述的分離的核酸分子、如第六方面所述的復合物、如第七方面所述的分離的核酸分子、如第八方面所述的載體、如第十方面所述的組合物、如第十一方面所述的組合物。175、在某些實施方案中,所述細胞是原核細胞。176、在某些實施方案中,所述細胞是真核細胞。在某些實施方案中,所述細胞是哺乳動物細胞。在某些實施方案中,所述細胞是人類細胞。某些實施方案中,所述細胞是非人哺乳動物細胞,例如非人靈長類動物、牛、羊、豬、犬、猴、兔、嚙齒類(如大鼠或小鼠)的細胞。在某些實施方案中,所述細胞是非哺乳動物真核細胞,例如家禽鳥類(如雞)、魚類或甲殼動物(如蛤蜊、蝦)的細胞。在某些實施方案中,所述細胞是植物細胞,例如單子葉植物或雙子葉植物具有的細胞或栽培植物或糧食作物如木薯、玉米、高粱、大豆、小麥、燕麥或水稻具有的細胞,例如藻類、樹或生產植物、果實或蔬菜(例如,樹類如柑橘樹、堅果樹;茄屬植物、棉花、煙草、番茄、葡萄、咖啡、可可等)。177、在某些實施方案中,所述細胞是干細胞或干細胞系。178、術語定義179、在本發(fā)明中,除非另有說明,否則本文中使用的科學和技術名詞具有本領域技術人員所通常理解的含義。并且,本文中所用的分子遺傳學、核酸化學、化學、分子生物學、生物化學、細胞培養(yǎng)、微生物學、細胞生物學、基因組學和重組dna等操作步驟均為相應領域內廣泛使用的常規(guī)步驟。同時,為了更好地理解本發(fā)明,下面提供相關術語的定義和解釋。180、在本發(fā)明中,表述“casδ”是指,本發(fā)明人首次發(fā)現(xiàn)并鑒定的一種cas效應蛋白,其具有選自下列的氨基酸序列:181、(i)seq?id?no:1、2、3任一項所示的序列;182、(ii)與seq?id?no:1、2、3任一項所示的序列相比具有一個或多個氨基酸的置換、缺失或添加(例如1個,2個,3個,4個,5個,6個,7個,8個,9個,10個,11個,12個,13個,14個,15個,16個,17個,18個,19個,20個,21個,22個,23個,24個,25個,26個,27個,28個,29個,30個,31個,32個,33個,34個,35個,36個,37個,38個,39個以及40個氨基酸的置換、缺失或添加)的序列;或183、(iii)與seq?id?no:1、2、3任一項所示的序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性的序列。184、本發(fā)明的casδ是一種在導向rna引導下與靶序列特定位點結合并切割的核酸內切酶。185、如本文中所使用的,術語“規(guī)律成簇的間隔短回文重復(crispr)-crispr-相關(cas)(crispr-cas)系統(tǒng)”或“crispr系統(tǒng)”可互換地使用并且具有本領域技術人員通常理解的含義,其通常包含與crispr相關(“cas”)基因的表達有關的轉錄產物或其他元件,或者能夠指導所述cas基因活性的轉錄產物或其他元件。此類轉錄產物或其他元件可以包含編碼cas效應蛋白的序列和包含crispr?rna(crrna)的導向rna,以及在crispr-cas9系統(tǒng)中所含有的反式作用crrna(tracrrna)序列,或來自crispr基因座的其他序列或轉錄產物。在本發(fā)明所述的基于casδ的crispr系統(tǒng)中,不需要tracrrna序列。186、如本文中所使用的,術語“cas效應蛋白”、“cas效應酶”可互換地使用并且是指,crispr-cas系統(tǒng)中呈現(xiàn)的任一種大于長度800個氨基酸的蛋白質。在某些情況下,這類蛋白是指從cas基因座中鑒定的蛋白。187、如本文中所使用的,術語“導向rna(guide?rna)”、“成熟crrna”可互換地使用并且具有本領域技術人員通常理解的含義。一般而言,導向rna可以包含同向(direct)重復序列和導向序列(guide?sequence),或者基本上由或由同向重復序列和導向序列(在內源性crispr系統(tǒng)背景下也稱為間隔序列(spacer))組成。在某些情況下,導向序列是與靶序列具有足夠互補性從而與所述靶序列雜交并引導crispr/cas復合物與所述靶序列的特異性結合的任何多核苷酸序列。在某些實施方案中,當最佳比對時,導向序列與其相應靶序列之間的互補程度為至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少99%。確定最佳比對在本領域的普通技術人員的能力范圍內。例如,存在公開和可商購的比對算法和程序,諸如但不限于clustalw、matlab中的史密斯-沃特曼算法(smith-waterman)、bowtie、geneious、biopython以及seqman。188、在某些情況下,所述導向序列在長度上為至少5個、至少10個、至少15個、至少16個、至少17個、至少18個、至少19個、至少20個、至少21個、至少22個、至少23個、至少24個、至少25個、至少26個、至少27個、至少28個、至少29個、至少30個、至少35個、至少40個、至少45個或至少50個核苷酸。在某些情況下,所述導向序列在長度上為不超過50個、45個、40個、35個、30個、25個、24個、23個、22個、21個、20個、15個、10個或更少個核苷酸。在某些實施方案中,所述導向序列在長度上為10-30個、或15-25個、或15-22個、或19-25個或19-22個核苷酸。189、在某些情況下,所述同向重復序列在長度上為至少10個、至少15個、至少16個、至少17個、至少18個、至少19個、至少20個、至少21個、至少22個、至少23個、至少24個、至少25個、至少26個、至少27個、至少28個、至少29個、至少30個、至少35個、至少40個、至少45個、至少50個、至少55個、至少56個、至少57個、至少58個、至少59個、至少60個、至少61個、至少62個、至少63個、至少64個、至少65個或至少70個核苷酸。在某些情況下,所述同向重復序列在長度上為不超過70個、65個、64個、63個、62個、61個、60個、59個、58個、57個、56個、55個、50個、45個、40個、35個、30個、29個、28個、27個、26個、25個、24個、23個、22個、21個、20個、15個、10個或更少個核苷酸。在某些實施方案中,所述同向重復序列在長度上為55-70個核苷酸,例如55-65個核苷酸,例如60-65個核苷酸,例如62-65個核苷酸,例如63-64個核苷酸。在某些實施方案中,所述同向重復序列在長度上為15-30個核苷酸,例如15-25個核苷酸,例如20-25個核苷酸,例如22-24個核苷酸,例如23個核苷酸。190、如本文中所使用的,術語“crispr/cas復合物”是指,導向rna(guide?rna)或成熟crrna與cas蛋白結合所形成的核糖核蛋白復合體,其包含雜交到靶序列上并且與cas蛋白結合的導向序列。該核糖核蛋白復合體能夠識別并切割能與該導向rna或成熟crrna雜交的多核苷酸。191、因此,在形成crispr/cas復合物的情況下,“靶序列”是指被設計為具有靶向性的導向序列所靶向的多核苷酸,例如與該導向序列具有互補性的序列,其中靶序列與導向序列之間的雜交將促進crispr/cas復合物的形成。完全互補性不是必需的,只要存在足夠互補性以引起雜交并且促進一種crispr/cas復合物的形成即可。靶序列可以包含任何多核苷酸,如dna或rna。在某些情況下,所述靶序列位于細胞的細胞核或細胞質中。在某些情況下,該靶序列可位于真核細胞的一個細胞器例如線粒體或葉綠體內??杀挥糜谥亟M到包含該靶序列的靶基因座中的序列或模板被稱為“編輯模板”或“編輯多核苷酸”或“編輯序列”。在某些實施方案中,所述編輯模板為外源核酸。在某些實施方案中,該重組是同源重組。192、在本發(fā)明中,表述“靶序列”或“靶多核苷酸”可以是對細胞(例如,真核細胞)而言任何內源或外源的多核苷酸。例如,該靶多核苷酸可以是一種存在于真核細胞的細胞核中的多核苷酸。該靶多核苷酸可以是一個編碼基因產物(例如,蛋白質)的序列或一個非編碼序列(例如,調節(jié)多核苷酸或無用dna)。在某些情況下,據(jù)信該靶序列應該與原間隔序列臨近基序(pam)相關。對pam的精確序列和長度要求取決于使用的cas效應酶而不同,但是pam典型地是臨近原間隔序列(也即,靶序列)的2-5個堿基對序列。本領域技術人員能夠鑒定與給定的cas效應蛋白一起使用的pam序列。在本文中,“cas蛋白所識別的特定的基序序列”或“基序序列”即指代pam序列。193、在某些情況下,靶序列或靶多核苷酸可以包括多個疾病相關基因和多核苷酸以及信號傳導生化途徑相關基因和多核苷酸。此類靶序列或靶多核苷酸的非限制性實例,包括分別提交于2012年12月12日和2013年1月2日的美國臨時專利申請61/736,527和61/748,427、提交于2013年12月12日的國際申請pct/us2013/074667中所列舉的那些,其全部通過引用并入本文。194、在某些情況下,靶序列或靶多核苷酸的實例包括與信號傳導生化途徑相關的序列,例如信號傳導生化途徑相關基因或多核苷酸。靶多核苷酸的實例包括疾病相關基因或多核苷酸。“疾病相關”基因或多核苷酸是指與非疾病對照的組織或細胞相比,在來源于疾病影響的組織的細胞中以異常水平或以異常形式產生轉錄或翻譯產物的任何基因或多核苷酸。在改變的表達與疾病的出現(xiàn)和/或進展相關的情況下,它可以是一個以異常高的水平被表達的基因;或者,它可以是一個以異常低的水平被表達的基因。疾病相關基因還指具有一個或多個突變或直接負責或與一個或多個負責疾病的病因學的基因連鎖不平衡的遺傳變異的基因。轉錄的或翻譯的產物可以是已知的或未知的,并且可以處于正?;虍惓K健?95、如本文中所使用的,術語“野生型”具有本領域技術人員通常理解的含義,其表示生物、菌株、基因的典型形式或者當它在自然界存在時區(qū)別于突變體或變體形式的特征,其可從自然中的來源分離并且沒有被人為有意地修飾。196、如本文中所使用的,術語“非天然存在的”或“工程化的”可互換地使用并且表示人工的參與。當這些術語用于描述核酸分子或多肽時,其表示該核酸分子或多肽至少基本上從它們在自然界中或如發(fā)現(xiàn)于自然界中的與其結合的至少另一種組分游離出來。197、如本文中所使用的,術語“直系同源物(orthologue,ortholog)”具有本領域技術人員通常理解的含義。作為進一步指導,如本文中所述的蛋白質的“直系同源物”是指屬于不同物種的蛋白質,該蛋白質執(zhí)行與作為其直系同源物的蛋白相同或相似的功能。198、如本文中所使用的,術語“同一性”用于指兩個多肽之間或兩個核酸之間序列的匹配情況。當兩個進行比較的序列中的某個位置都被相同的堿基或氨基酸單體亞單元占據(jù)時(例如,兩個dna分子的每一個中的某個位置都被腺嘌呤占據(jù),或兩個多肽的每一個中的某個位置都被賴氨酸占據(jù)),那么各分子在該位置上是同一的。兩個序列之間的“百分數(shù)同一性”是由這兩個序列共有的匹配位置數(shù)目除以進行比較的位置數(shù)目×100的函數(shù)。例如,如果兩個序列的10個位置中有6個匹配,那么這兩個序列具有60%的同一性。例如,dna序列ctgact和caggtt共有50%的同一性(總共6個位置中有3個位置匹配)。通常,在將兩個序列比對以產生最大同一性時進行比較。這樣的比對可通過使用,例如,可通過計算機程序例如align程序(dnastar,inc.)方便地進行的needleman等人(1970)j.mol.biol.48:443-453的方法來實現(xiàn)。還可使用已整合入align程序(版本2.0)的e.meyers和w.miller(comput.applbiosci.,4:11-17(1988))的算法,使用pam120權重殘基表(weight?residue?table)、12的缺口長度罰分和4的缺口罰分來測定兩個氨基酸序列之間的百分數(shù)同一性。此外,可使用已整合入gcg軟件包(可在www.gcg.com上獲得)的gap程序中的needleman和wunsch(j?moibiol.48:444-453(1970))算法,使用blossum?62矩陣或pam250矩陣以及16、14、12、10、8、6或4的缺口權重(gap?weight)和1、2、3、4、5或6的長度權重來測定兩個氨基酸序列之間的百分數(shù)同一性。199、如本文中所使用的,術語“載體”是指,可將多聚核苷酸插入其中的一種核酸運載工具。當載體能使插入的多核苷酸編碼的蛋白獲得表達時,載體稱為表達載體。載體可以通過轉化,轉導或者轉染導入宿主細胞,使其攜帶的遺傳物質元件在宿主細胞中獲得表達。載體是本領域技術人員公知的,包括但不限于:質粒;噬菌粒;柯斯質粒;人工染色體,例如酵母人工染色體(yac)、細菌人工染色體(bac)或p1來源的人工染色體(pac);噬菌體如λ噬菌體或m13噬菌體及動物病毒等??捎米鬏d體的動物病毒包括但不限于,逆轉錄酶病毒(包括慢病毒)、腺病毒、腺相關病毒、皰疹病毒(如單純皰疹病毒)、痘病毒、桿狀病毒、乳頭瘤病毒、乳頭多瘤空泡病毒(如sv40)。一種載體可以含有多種控制表達的元件,包括但不限于,啟動子序列、轉錄起始序列、增強子序列、選擇元件及報告基因。另外,載體還可含有復制起始位點。200、如本文中所使用的,術語“宿主細胞”是指,可用于導入載體的細胞,其包括但不限于,如大腸桿菌或枯草菌等的原核細胞,如酵母細胞或曲霉菌等的真菌細胞,如s2果蠅細胞或sf9等的昆蟲細胞,或者如纖維原細胞,cho細胞,cos細胞,nso細胞,hela細胞,bhk細胞,hek?293細胞或人細胞等的動物細胞。201、本領域技術人員將理解,表達載體的設計可取決于諸如待轉化的宿主細胞的選擇、所希望的表達水平等因素。一種載體可以被引入到宿主細胞中而由此產生轉錄物、蛋白質、或肽,包括由如本文所述的蛋白、融合蛋白、分離的核酸分子等(例如,crispr轉錄物,如核酸轉錄物、蛋白質、或酶)。202、如本文中所使用的,術語“調節(jié)元件”旨在包括啟動子、增強子、內部核糖體進入位點(ires)、和其他表達控制元件(例如轉錄終止信號,如多聚腺苷酸化信號和多聚u序列),其詳細描述可參考戈德爾(goeddel),《基因表達技術:酶學方法》(gene?expressiontechnology:methods?in?enzymology)185,學術出版社(academic?press),圣地亞哥(sandiego),加利福尼亞州(1990)。在某些情況下,調節(jié)元件包括指導一個核苷酸序列在許多類型的宿主細胞中的組成型表達的那些序列以及指導該核苷酸序列只在某些宿主細胞中表達的那些序列(例如,組織特異型調節(jié)序列)。組織特異型啟動子可主要指導在感興趣的期望組織中的表達,所述組織例如肌肉、神經元、骨、皮膚、血液、特定的器官(例如肝臟、胰腺)、或特殊的細胞類型(例如淋巴細胞)。在某些情況下,調節(jié)元件還可以時序依賴性方式(如以細胞周期依賴性或發(fā)育階段依賴性方式)指導表達,該方式可以是或者可以不是組織或細胞類型特異性的。在某些情況下,術語“調節(jié)元件”涵蓋的是增強子元件,如wpre;cmv增強子;在htlv-i的ltr中的r-u5’片段((mol.cell.biol.,第8(1)卷,第466-472頁,1988);sv40增強子;以及在兔β-珠蛋白的外顯子2與3之間的內含子序列(proc.natl.acad.sci.usa.,第78(3)卷,第1527-31頁,1981)。203、如本文中所使用的,術語“啟動子”具有本領域技術人員公知的含義,其是指一段位于基因的上游能啟動下游基因表達的非編碼核苷酸序列。組成型(constitutive)啟動子是這樣的核苷酸序列:當其與編碼或者限定基因產物的多核苷酸可操作地相連時,在細胞的大多數(shù)或者所有生理條件下,其導致細胞中基因產物的產生。誘導型啟動子是這樣的核苷酸序列,當可操作地與編碼或者限定基因產物的多核苷酸相連時,基本上只有當對應于所述啟動子的誘導物在細胞中存在時,其導致所述基因產物在細胞內產生。組織特異性啟動子是這樣的核苷酸序列:當可操作地與編碼或者限定基因產物的多核苷酸相連時,基本上只有當細胞是該啟動子對應的組織類型的細胞時,其才導致在細胞中產生基因產物。204、如本文中所使用的,術語“可操作地連接”旨在表示感興趣的核苷酸序列以一種允許該核苷酸序列的表達的方式被連接至該一種或多種調節(jié)元件(例如,處于一種體外轉錄/翻譯系統(tǒng)中或當該載體被引入到宿主細胞中時,處于該宿主細胞中)。205、如本文中所使用的,術語“互補性”是指核酸與另一個核酸序列借助于傳統(tǒng)的沃森-克里克或其他非傳統(tǒng)類型形成一個或多個氫鍵的能力?;パa百分比表示一個核酸分子中可與一個第二核酸序列形成氫鍵(例如,沃森-克里克堿基配對)的殘基的百分比(例如,10個之中有5、6、7、8、9、10個即為50%、60%、70%、80%、90%、和100%互補)?!巴耆パa”表示一個核酸序列的所有連續(xù)殘基與一個第二核酸序列中的相同數(shù)目的連續(xù)殘基形成氫鍵。如本文使用的“基本上互補”是指在一個具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50個或更多個核苷酸的區(qū)域上至少為60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、或100%的互補程度,或者是指在嚴格條件下雜交的兩個核酸。206、如本文中所使用的,對于雜交的“嚴格條件”是指與靶序列具有互補性的一個核酸主要地與該靶序列雜交并且基本上不雜交到非靶序列上的條件。嚴格條件通常是序列依賴性的,并且取決于許多因素而變化。一般而言,該序列越長,則該序列特異性地雜交到其靶序列上的溫度就越高。嚴格條件的非限制性實例描述于蒂森(tijssen)(1993)的《生物化學和分子生物學中的實驗室技術-核酸探針雜交》(laboratory?techniques?inbiochemistryand?molecular?biology-hybridization?with?nucleic?acid?probes),第i部分,第二章,“雜交原理概述和核酸探針分析策略”(“overview?of?principles?ofhybridization?andthe?strategy?of?nucleic?acid?probe?assay”),愛思唯爾(elsevier),紐約。207、如本文中所使用的,術語“雜交”是指其中一個或多個多核苷酸反應形成一種復合物的反應,該復合物經由這些核苷酸殘基之間的堿基的氫鍵鍵合而穩(wěn)定化。氫鍵鍵合可以借助于沃森-克里克堿基配對、hoogstein結合或以任何其他序列特異性方式而發(fā)生。該復合物可包含形成一個雙鏈體的兩條鏈、形成多鏈復合物的三條或多條鏈、單個自我雜交鏈、或這些的任何組合。雜交反應可以構成一個更廣泛的過程(如pcr的開始、或經由一種酶的多核苷酸的切割)中的一個步驟。能夠與一個給定序列雜交的序列被稱為該給定序列的“互補物”。208、如本文中所使用的,術語“表達”是指,藉此從dna模板轉錄成多核苷酸(如轉錄成mrna或其他rna轉錄物)的過程和/或轉錄的mrna隨后藉此翻譯成肽、多肽或蛋白質的過程。轉錄物和編碼的多肽可以總稱為“基因產物”。如果多核苷酸來源于基因組dna,表達可以包括真核細胞中mrna的剪接。209、如本文中所使用的,術語“接頭”是指,由多個氨基酸殘基通過肽鍵連接形成的線性多肽。本發(fā)明的接頭可以為人工合成的氨基酸序列,或天然存在的多肽序列,例如具有鉸鏈區(qū)功能的多肽。此類接頭多肽是本領域眾所周知的(參見例如,holliger,p.等人(1993)proc.natl.acad.sci.usa?90:6444-6448;poljak,r.j.等人(1994)structure?2:1121-1123)。210、如本文中所使用的,術語“治療”是指,治療或治愈病癥,延緩病癥的癥狀的發(fā)作,和/或延緩病癥的發(fā)展。211、如本文中所使用的,術語“受試者”包括但不限于各種動物,例如哺乳動物,例如??苿游?、馬科動物、羊科動物、豬科動物、犬科動物、貓科動物、兔科動物、嚙齒類動物(例如,小鼠或大鼠)、非人靈長類動物(例如,獼猴或食蟹猴)或人。在某些實施方式中,所述受試者(例如人)患有病癥(例如,疾病相關基因缺陷所導致的病癥)。212、發(fā)明的有益效果213、與現(xiàn)有技術相比,本發(fā)明的cas蛋白及系統(tǒng)具有顯著的有利方面。例如,本發(fā)明的cas效應蛋白分子大小上小于cas9、c2c1、casy和cpf1蛋白,因此轉染效率上優(yōu)于cas9、c2c1、casy和cpf1蛋白。例如,本發(fā)明的cas效應蛋白的pam結構域為5’-ryr結構,(r為a或者g,y為t或者c),共可識別的pam組合有8種,分別為atg,acg,ata,aca,gtg,gta,gcg以及gca,比目前已經報道的spcas9識別的ngg?pam以及l(fā)bcas12a識別的ttn?pam具有更寬泛的識別位點。214、下面將結合附圖和實施例對本發(fā)明的實施方案進行詳細描述,但是本領域技術人員將理解,下列附圖和實施例僅用于說明本發(fā)明,而不是對本發(fā)明的范圍的限定。根據(jù)附圖和優(yōu)選實施方案的下列詳細描述,本發(fā)明的各種目的和有利方面對于本領域技術人員來說將變得顯然。當前第1頁12當前第1頁12
當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
曲松县| 武乡县| 英超| 达日县| 武清区| 富平县| 博野县| 甘德县| 柳河县| 张家港市| 静海县| 英吉沙县| 安远县| 张家川| 大安市| 香港 | 龙江县| 本溪| 南充市| 峨眉山市| 黄陵县| 山东省| 邯郸市| 新兴县| 湖南省| 涞源县| 巴林左旗| 奇台县| 金寨县| 龙南县| 如皋市| 易门县| 青龙| 绵阳市| 开阳县| 安图县| 从江县| 永和县| 衡水市| 安顺市| 新河县|