欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于多元RNA引導的基因組編輯和其它RNA技術的方法和組合物與流程

文檔序號:11595792閱讀:848來源:國知局
發(fā)明領域本發(fā)明涉及在分子生物學和遺傳工程領域內用于基因靶向和基因組編輯的方法。更具體地,本發(fā)明描述了使用trna加工系統(tǒng)來使得能夠進行基于多元rna的或多元rna引導的基因組工程、基因抑制等。發(fā)明背景用于特異性基因靶向或精準基因組編輯的方法學對于植物或動物基因的功能性表征而言是非常重要的。近年來,已經開發(fā)了序列特異性核酸酶來提高基因靶向或基因組編輯在植物、動物或微生物體系中的效率。近來,基于成簇的規(guī)律間隔的短回文重復序列(crispr)-相關核酸酶系統(tǒng),已經在微生物和哺乳動物體系中開發(fā)了新的基因組編輯工具。所述crispr-相關核酸酶是細菌和古細菌獲得性免疫的一部分。cas9內切核酸酶,釀膿鏈球菌(streptococcuspyogenes)ii型crispr/cas系統(tǒng)的成分,與稱為crisprrna(crrna)和反式激活crrna(transcrrna)的兩個短rna分子形成復合物,所述rna分子引導核酸酶在特異性位點對非自身dna的兩條鏈進行切割。所述crrna-transcrrna異源雙鏈體可以由一個嵌合rna(所謂的引導rna(grna))來取代,其繼而可以被編排至靶向的特定位點。編排grna-cas9的最小限制為經改造的5’-rna和靶向的dna之間至少15個堿基配對且無錯配,以及在靶向的dna序列中跟隨堿基配對區(qū)的ngg基序(所謂的前間區(qū)序列鄰近基序或pam)。一般而言,grna區(qū)的5’末端中的15-22nt是用于指導cas9核酸酶來在特定位點產生dsb。crispr/cas系統(tǒng)對于人類、小鼠、斑馬魚、酵母和細菌中的基因組編輯已經得到了證明。與重組分子(dna、rna或蛋白質)可以直接進行轉化而用于cas9-介導的基因組編輯的動物、酵母、或細菌細胞不同,重組質粒dna由于細胞壁的存在通常是經過土壤桿菌(agrobacterium)介導的轉化、基因槍轟擊、或原生質體轉化而遞送至植物細胞內的。因而,需要創(chuàng)建專用的分子工具和方法,以有利于用于植物和動物細胞中基因組編輯的質粒dna的構建和遞送以及cas9和grna的有效表達。用于制備和使用crispr-cas系統(tǒng)的組合物和方法在題目為“用于改變基因產物的表達的crispr-cas系統(tǒng)和方法”的美國專利號no.8,697,359中有描述,其以整體援引加入本文。原則上,多元遺傳操縱可以通過表達多個針對相應靶向位點的grna和cas9(或cas9衍生的效應物)來實現。然而,由于遞送方法和目前grna表達裝置的局限,在植物、動物、或微生物生物體中同時產生許多種grna依然是種挑戰(zhàn)。本發(fā)明的目標是提供這樣的策略,使用細胞的內源trna加工系統(tǒng)作為有效且精準的手段來從單一多核苷酸構建體/合成基因產生許多種grna,由此加強crispr/cas9或其它用于基因組工程的rna介導的遺傳操縱工具的多元編輯能力。在另一方面,本發(fā)明涉及包含上文所述核酸的多核苷酸構建體、表達盒、載體或經修飾的受體細胞。本發(fā)明的另外的目標、特征或優(yōu)勢是提供這樣的組合物和方法,其用于操縱多個靶基因,或者單一靶基因中的多個位置,其引入單一表達盒,所述表達盒包括在受體細胞中利用trna系統(tǒng)的序列。另外的目標、特征和優(yōu)勢會在本文所包含的公開內容的基礎上顯而易見。發(fā)明概述申請人已經產生了材料和方法來從一個多核苷酸構建體(合成基因)產生許多小rna,以促進rna-引導的多元基因組編輯、表達抑制、遺傳學或表觀遺傳學修飾、以及其它基于rna的技術。所述合成基因/多核苷酸構建體編碼由trna所分開的多順反子rna組件,并且優(yōu)選還包括調節(jié)組件如啟動子或終止子,以形成表達盒。一旦在細胞中經轉錄,轉錄物經內源trna加工系統(tǒng)而被細胞加工成多個rna分子。本發(fā)明的方法可用于改良任何基于rna的基因組編輯和調節(jié)技術,使得可以經單一的多核苷酸構建體和內源trna加工系統(tǒng)產生和分離出多元的rna。此類方法可包括但不限于cas9-介導的基因組編輯、人工微rna介導的基因沉默、以及其它rna-介導的機制等等。根據本發(fā)明,用于在受體細胞中產生多元rna遺傳操縱的方法包括,提供異源多核苷酸序列,其具有兩個或更多個與一或多個trna切割序列(trna前體)串聯的rna介導的遺傳操縱序列。該多核苷酸通過許多標準技術中任何技術來引入至受體細胞,并且經表達,所述受體細胞trna加工系統(tǒng)在trna序列處切割該異源多核苷酸。具體而言本發(fā)明提供了trna切割序列,其用于rna-核酸裂解活性(如在trna前體剪接中)、3'末端mrna前體內切核酸酶活性、trna前體切割活性、和/或核糖體rna前體切割活性。所述rna遺傳操縱序列和所述rna切割序列可操作地連接至用于在受體細胞中表達的調節(jié)序列,如啟動子和終止子序列。trna切割序列包括與細胞的內源trna系統(tǒng)(如rnasep、rnasez和rnasee(細菌))有活性地相互作用(并被其切割)的任何序列和/或結構基序。這可包括結構識別元件如受體莖、d-環(huán)臂,tψc環(huán)以及特定的序列基序。有許多trna活性序列和基序是本領域技術人員已知的并可用的,如通過trna-se程序等資源,其可得自萬維網lowelab.ucsc.edu/trnacan-se/或萬維網trna.bioinf.uni-leipzig.de/dataoutput/organisms(對于所有生物體),或萬維網plantrna.ibmp.cnrs.fr/(對于植物)。許多文章和genbank資源也是可用的并且在本文中引用。本發(fā)明還包括用于多元rna遺傳操縱的多核苷酸構建體、表達構建體、載體和受體細胞(已經過操縱)。所述構建體包含多核苷酸序列,其編碼兩個或更多個rna介導的遺傳操縱序列,所述rna介導的遺傳操縱序列與編碼trna切割序列的序列串聯。在一個實施方案中,該rna介導的遺傳操縱序列包括用于cas9-介導的基因組編輯的引導rna。該引導rna(或grna)與內切核酸酶一起引入,在此情形中是crispr相關(cas)核酸酶cas9。該引導rna提供支架(scaffold)和與靶點位互補的間隔區(qū)(spacer)序列。在另一實施方案中該rna遺傳操縱序列是干擾rna如sirna,或根據本領域中的標準方法設計為用于基因沉默的微rna序列。該構建體還包括一或多個trna切割序列,其可以由細胞內的內源trna切割系統(tǒng)進行有活性地加工。所述構建體優(yōu)選是表達構建體或合成基因(其包括啟動子和終止子序列)。出乎意料地,申請人已發(fā)現當與crispr系統(tǒng)使用時,rna切割組件提供多達30倍的更高的表達(很可能是由于內部trna啟動子元件)。本發(fā)明還包括已經過遺傳操縱的細胞及其后代,此類細胞可包括基因組插入或缺失或者通過基因沉默對基因表達的操縱。此類細胞的后代可以用于開發(fā)株系,以及植物和動物育種材料。在一些實施方案中所述細胞是人類細胞。雖然公開了多個實施方案,本領域技術人員從下文的詳述(顯示和描述了本發(fā)明說明性的實施方案)還可以了解本發(fā)明其它的實施方案。因此,附圖和詳述應視為說明性質的而不是限制性的。附圖詳述圖1.改造內源trna系統(tǒng)用于由crispr/cas9進行的多元基因組編輯。(a)具有5’前導序列和3’尾隨序列的真核trna前體被rnasep和rnasez在特定的位點切割。(b)trna基因由rna聚合酶iii(poliii)進行的轉錄。trna基因中的框a和框b的元件功能為內部轉錄元件并由轉錄因子iiic(tfiiic)所結合,其招募tfiiib和poliii來起始轉錄。(c)用于同時靶向多個位點的ptg/cas9方法的示意圖。合成的ptg由串聯排列的trna-grna單元組成,且每個grna含有靶特異性的間隔區(qū)(用不同顏色標記為菱形)和保守的grna支架(矩形)。含有框a和b元件的trna顯示為圓角矩形。ptg的初級轉錄物經內源rnasep和rnasez(標記為剪刀)切割以釋放成熟grna和trna(三葉草結構的紅線)。經剪切的成熟grna將cas9引導至多個靶。圖2.功能性grna在體內從合成ptg基因的精準剪切。(a)兩個sgrna基因和四個ptg的架構以產生一個grna。(b)ptg基因的trna-grna-trna融合的序列和預測的2級rna結構(seqidno:87)。trna區(qū)的堿基用紅色表示,并且trna5’-前導序列顯示為小寫。所述grna用黑色表示并且grna間隔區(qū)序列顯示為n。(c-f)用crt-pcr對從sgrna或ptg產生的成熟grna的檢驗。來自表達原生質體的空載體的總rna被用作對照(ck)。箭頭表示通過crt-pcr擴增的成熟grna,并且星表示非特異性擴增的rrna。(g)根據來自crt-pcr的作圖的grna末端的ptg(seqidno:88)中剪切位點的總結(參見si附錄,圖s3-s5)。箭頭表示ptg中的切割位點以釋放grna。在所有的crt-pcr結果中準確地在trna-grna融合位點從ptg剪切成熟grna5’-末端,而其3’-末端在trna5’前導序列(小寫)內遷移了1-4nt。(h)從u3p:sgrna產生的grna(seqidno:89)。所有經檢測的u3p:sgrna產生的grna以核糖核苷酸a起始并以多個u終止。(i)在水稻原生質體中通過ptg1:cas9或ptg2:cas9將插入/缺失引入至期望的位點(如pcr/re所示)。箭頭表示抗re消化的突變片段。插入/缺失頻率標在下方。(j)sgrna1/2和ptg1/2in在水稻原生質體中的相對表達。數據代表均值±sd。nd,未檢測的。ck,空載體對照。圖18.psico-sgrna-ef1a-mcherry-t2a-cas9載體的示意圖譜。引導序列或ptg基因可以在插入此載體的bbsi位點后進行表達。紅色字母表示克隆位點中的懸突。圖19.從hptg基因精準地產生具有期望的引導序列的成熟grna。(a)crt-pcr產物在丙烯酰胺凝膠中的電泳。紅箭頭表示從hptg1和hptg2產生的成熟grna。vec,空載體對照。(b)通過crt-pcr和dna測序反映的成熟grna序列的色譜。箭頭表示成熟grna的5’末端的第一個核苷酸。(c)hptg1和hptg2中根據crt-pcr結果作圖的切割位點。剪刀表示trna加工系統(tǒng)經切割的位點。藍色字母,trna;紅色字母,grna引導序列;小寫字母,grna支架序列;加下劃線的字母,poliii終止子。圖20.在hdac基因座的染色體片段靶向缺失。(a和b)在表達cas9-hptg構建體的人類細胞中各個hdac基因座處通過截短的pcr產物(由箭頭表示)反映染色體片段缺失。(c)表達不同數目的grna的hptg構建體的缺失效率。圖21.在hdac基因的基因座具有染色體缺失的擴增子的dna序列。圖22.多順反子trna-grna基因(ptg)加工系統(tǒng)的示意圖以及用于靶向4個水稻mpk的ptg的設計。a:多順反子trna-grna基因(ptg)由串聯排列的trna-grna重復序列組成,且具有poliii啟動子來起始轉錄(通過poliii終止子來終止)。細胞的內源rnasep和rnasez可識別初級轉錄物內trna的二級結構并從該轉錄物剪接多個功能性grna。經加工的grna可以與cas9內切核酸酶復合以同時靶向多個獨立的基因組位點。b:設計了8個grna來靶向4個緊密相關的水稻mpk基因以用于基因敲除。在核苷酸的小插入和缺失之外,在每個基因上都可以通過非同源末端連接而發(fā)生染色體缺失,因為每個基因被兩個grna所靶向。c:在此研究中使用了共表達1至8個grna的總共8個ptg。ptg2和ptg6靶向mpk5。ptg3、ptg4、和ptg5分別靶向mpk1、mpk2、和mpk6。ptg7和ptg8靶向mpk1/mpk5和mpk2/mpk6以創(chuàng)建雙突變。ptg9共表達了8個grna以同時靶向所有的4個mpk基因。圖23.4個ptgb9株系的t1代水稻植株在4個基因中攜帶有8個雙等位基因突變。a:經pcr-re測定法在5個位點檢測突變。突變dna的pcr產物不能被適宜的限制性內切酶(re;在b中藍色名稱且加下劃線)所消化。在所有4株t1植株中相應基因的pcr產物都對消化有抗性(紅箭頭)并且剪刀表示在這些位點的插入/缺失突變。注意mpk2具有兩個econi位點并且對來自突變的dna的pcr產物的消化產生兩個條帶而不是野生型dna對照中的3個條帶。ck:野生型dna對照。b:在4個ptgb9株系的t1植株中所有8個靶向的位點處的準確插入/缺失突變。通過對pcr產物或ta克隆(對植株1-2的mpk6序列序列的情形)的直接測序獲得序列。植株號碼后面的小寫字母a和b表示不同的等位基因。序列顯示出re位點(藍色下劃線)和所有剩余的靶位點都經突變。剪刀表示pam3bp下游的預測的dsb位點(以紅色字母標注)。用于靶向的前間區(qū)序列以綠色進行突出。橫線表示當與野生型相比時缺失的核苷酸,并且小寫字母表示插入的或取代的核苷酸。mpk1wt(seqidno:79);mpk11-2a(seqidno:135);mpk11-2b(seqidno:136);mpk12-1(seqidno:137);mpk13-2a(seqidno:138);mpk13-2b(seqidno:139);mpk14-2(seqidno:140);mpk2wt(seqidno:81);mpk21-2(seqidno:141);mpk22-1(seqidno:142);mpk23-1(seqidno:143);mpk24-2(seqidno:144);mpk24-2b(seqidno:145);mpk5wt(seqidno:82);mpk51-2(seqidno:146);mpk52-1(seqidno:147);mpk53-2(seqidno:148);mpk54-2(seqidno:149);mpk6wt(seqidno:84);mpk61-2a(seqidno:150);mpk61-2b(seqidno:151);mpk62-1(seqidno:152);mpk63-2(seqidno:153);mpk64-2a(seqidno:154);mpk64-2b(seqidno:155)。圖24.ptg/cas9誘導的插入和缺失以及其頻率。所顯示的是在來自獨立突變事件的54個序列的樣品中檢測到的插入/缺失突變以及其觀察到的頻率的總結。插入的框顯示出經計算的所有插入對比所有缺失的頻率。圖25.染色體缺失在t1和t2代植株中的遺傳。a:在t0代突變植株上對全長(mpk5)和染色體缺失(δ)等位基因的檢測。通過截短的pcr產物(藍箭頭)與全長pcr產物(綠箭頭)相比顯示出在靶向的mpk5基因座處的染色體缺失。如全長和截短的pcr產物的擴增所示,株系5、4、和6對于缺失是雜合的。b:染色體缺失遺傳至t1代。注意植株4-2和6-1每株僅遺傳了兩個等位基因之一并且變成純合的。c:固定的缺失遺傳至t2代。在植株6-1的后代中僅檢測到顯示缺失的截短的pcr產物。ck:野生型dna對照。圖26.mpk1和mpk6基因座中的突變傾向于保持序列的開放閱讀框(orf)。a:在ptgb9t1植株的4個基因中的8個靶向的位點上orf保留的突變對比非保留的突變的頻率。b:當僅考慮外顯子中靶位點時orf保留的突變的頻率。c:突變體等位基因的預測的mpk1蛋白序列(小寫)(seqidno156-158)與野生型序列(大寫)(seqidno:80)比較。mpk1中的突變在mpk1蛋白中缺失了1至5個氨基酸,但卻將預測的蛋白激酶結構域(其在野生型蛋白中從氨基酸67開始)保持完整。d:突變體等位基因的預測的mpk5蛋白序列(seqidno159-162)與野生型序列(seqidno:83)比較。所有等位基因中的突變都在野生型蛋白預測的蛋白激酶結構域(從氨基酸35開始)之前產生提早的終止。e:來自愈傷組織的ptgb3t0代植株(在mpk1上對染色體缺失是純合的)與空載體對照比較。成熟植株4-a和4-b與對照相比保持嚴重矮化和無生育能力。在主圖中尺度條是5cm而在放大的插圖中是1cm。圖27.顯示4個基因mpk的靶向位點的示意??瞻拙匦伪硎镜谝粋€外顯子的5’非翻譯區(qū)而黑色實心矩形表示蛋白編碼外顯子。作為用于grna的靶位點的前間區(qū)序列區(qū)用紅條標注。用于在pcr-re測定中檢測突變事件的限制性內切酶位點用藍條標注。注意mpk2具有2個econi位點并且對來自突變dna的pcr產物進行的消化產生兩個條帶而不是三個條帶。用于靶區(qū)域擴增的引物用褐色箭頭標注。圖28.在ptgb3愈傷組織和ptgb5植物株系中檢測誘變。a:通過pcr-re測定在4個獨立的轉基因愈傷組織片中確認了成功且完全的mpk1的編輯(紅箭頭)。株系4的愈傷組織在mpk1上攜帶有染色體缺失(如截短的pcr產物(δ)所示)。b:pcr-re測定確認了ptgb5t0代植株中成功且完全的mpk6的編輯,因為pcr產物是不可消化的(紅箭頭)。ck:野生型dna對照。圖29.ptgb2和ptgb4植物株系誘變的檢測。a:pcr-re測定確認了對經ptgb2轉化的植株的mpk5基因座成功且完全的編輯,因為來自所有9個獨立株系的pcr產物都對適宜酶的消化有抗性(紅箭頭)。b:類似地,pcr-re測定確認了所有13個經檢驗的ptgb4株系的完全的mpk2編輯。注意mpk2具有2個econi位點并且對來自突變dna的pcr產物的消化產生兩個條帶,以及株系9、10、和13的異常條帶模式是mpk2基因座上更長缺失的結果。c:未經消化的來自株系9至13的pcr產物。株系9、10、和13中檢測到的截短的pcr產物(δ)表明染色體缺失。ck:野生型dna對照。圖30.ptgb8株系中誘變的檢測。mpk6和mpk2基因座上的消化抗性條帶(紅箭頭)表示具有成功的基因組編輯的株系。注意具有成功的基因組編輯的株系的總數目理論上可以更高,因為4個grna靶位點中僅有2個能夠通過pcr-re測定進行檢驗,以及mpk2具有2個econi位點并且對來自突變dna的pcr產物的消化產生兩個條帶。綠框表示在兩個位點都同時具有突變并且是推定的mpk6/mpk2雙敲除株系的轉基因株系。ck:野生型dna對照。圖31.ptgb9株系的無轉基因t1植株。在ptgb9株系的t0和t1植株中對基因組編輯裝置(u3:ptg和cas9的1kb片段)的存在進行篩選。雖然t0株系在其基因組中含有基因組編輯裝置的拷貝,t0株系的自花授粉使得可以從t1代植株去除基因組編輯裝置。來自植株2-1、3-2、和4-2的基因組dna(藍箭頭)不含任何可檢測的u3:ptg或cas9的片段。對照pcr產物容易地從內源水稻基因loc_os05g49730擴增,表明所使用的dna具有足夠的質量用于pcr。wt:野生型dna對照。圖32.mpk5上染色體缺失的序列。所示的是來自ptgb9株系4的截短片段(δ)的測序結果(seqidno:163)。該dna精準地在pam(紅色字母,紅色下劃線)下游3bp的前間區(qū)序列靶位點的兩個預測的雙鏈斷裂位點(綠色突出,綠色下劃線)對接,在mpk5基因座上產生了727bp的染色體缺失。圖33.mpk5的全長和截短的等位基因的遺傳模式。對于來自株系4的8個t1植株,來自株系5的10個t1植株,和來自株系6的9個t1植株,篩選全長(mpk5)或截短的mpk5(δ)等位基因的遺傳。所述植株當含有兩個等位基因時分類為雜合的(h),而如果僅檢測到較長的pcr產物則對于全長(f)是純合的,或者如果僅檢測到截短的pcr產物則對于缺失(d)是純合的。ck:野生型dna對照。發(fā)明詳述本技術提供了同時操縱多個基因或dna序列的方法,其中是通過單一多核苷酸表達盒的基于rna-引導的基因組編輯或基因沉默。一般而言,常規(guī)的基因組編輯或基因沉默技術僅能夠操縱一個基因靶。目前用于多元基因組編輯的方法涉及多個啟動子/終止子和繁瑣的克隆步驟。申請人的發(fā)明提供了簡單的、精準的和有效的方法來在體內從一個多核苷酸構建體(合成基因)產生多個小rna(例如,cas9的grna、sirna或mirna),并由此為目前的工具(如crispr/cas9系統(tǒng),rnai)配備了操縱多個靶的能力。作為一般性的平臺,此方法還簡化并改善了grna:cas9/cas9-切口酶介導的基因組編輯、grna:失活-cas9介導的基因激活/阻抑/標記/表觀基因組編輯、dsrna-介導的基因沉默、人造微rna和其它小rna介導的基因沉默的性能和可靠性。在植物中此技術可以用于通過同時操縱多個必要基因或數量性狀基因座(qtl)來改善農作物產量、質量、脅迫耐受、昆蟲和疾病抗性、和/或除草劑抗性。在動物中此技術可用于提高動物的繁殖力、健康和安寧,并輔助開發(fā)具有改善性狀(如增重、飼料利用率等)的創(chuàng)始株系。在人類中此技術可以因為其緊湊的大小而有利于病毒介導的多個grna遞送,并且可以用于治療或緩解各種疾病狀態(tài)。因為此技術是基于存在于所有生物體中的trna加工系統(tǒng),其在基因組工程中的應用拓展至微生物、動物和人類,以用于工業(yè)和醫(yī)療的生物技術。定義所述方法的實施,以及本文公開的組合物的制備和用途,利用在本領域技術之內的分子生物學、生物化學、染色質結構和分析、計算化學、細胞培養(yǎng)、重組dna和相關領域的常規(guī)技術,除非另有說明。這些技術在文獻中有完整的解釋。參見例如,sambrook等人molecularcloning:alaboratorymanual,2ded.,coldspringharborlaboratorypress,1989;3ded.,2001;ausubel等人,currentprotocolsinmolecularbiology,johnwiley&sons,newyork,1987以及周期性的更新;methodsinenzymology系列,academicpress,sandiego;wolffe,chromatinstructureandfunction,thirdedition,academicpress,sandiego,1998;methodsinenzymology,vol.304,"chromatin"(p.m.wassarmananda.p.wolffe,eds.),academicpress,sandiego,1999;以及methodsinmolecularbiology,vol.119,"chromatinprotocols"(p.b.becker,ed.)humanapress,totowa,1999。術語“核酸”、“多核苷酸”、和“寡核苷酸”可互換使用并且是指脫氧核糖核苷酸或核糖核苷酸聚合物(線性或環(huán)狀的構象,以及是單鏈或雙鏈的形式)。對于本公開的目的,這些術語不應理解為是對于聚合物的長度進行限制。所述術語可涵蓋核苷酸已知的類似物,以及在堿基、糖或磷酸酯部分經修飾的核苷酸(例如,硫代磷酸酯骨架)。一般而言,特定核苷酸的類似物具有同樣的堿基配對特異性;也即,a的類似物將會與t堿基配對。術語“多肽”、“肽”和“蛋白”可互換地用于指氨基酸殘基的聚合物。所述術語還適用于其中一或多個氨基酸是相應天然存在氨基酸的化學類似物或經修飾衍生物的氨基酸聚合物?!敖Y合”是指大分子之間(例如,蛋白和核酸之間)序列特異性的、非共價的相互作用。并不是所有結合相互作用的成分都需要是序列特異性的(例如,在dna骨架中與磷酸酯殘基接觸),只要相互接觸整體上是序列特異性的。此類相互作用一般通過10-6m-1或更低的解離常數(kd)來表征?!坝H和性”是指結合的強度:提高的結合親和性對應于較低的kd?!敖Y合蛋白”是能夠非共價地結合至另一分子的蛋白。結合蛋白可以例如結合至dna分子(dna-結合蛋白)、rna分子(rna-結合蛋白)和/或蛋白分子(蛋白-結合蛋白)。對于蛋白-結合蛋白的情形,其可以結合至自身(形成同二聚體、同三聚體等)和/或其可以結合一或多個分子的不同的蛋白。結合蛋白可以具有超過一種類型的結合活性。例如,鋅指蛋白具有dna-結合、rna-結合和蛋白-結合活性。術語“序列”是指任何長度的核苷酸序列,其可以是dna或rna;可以是線性的、環(huán)狀的、或分枝的,并且可以是單鏈的或雙鏈的。術語“供體序列”是指插入基因組內的核苷酸序列。供體序列可以是任何長度的,例如長度為2至10,000個核苷酸(或者是之間或其上的任何整數),優(yōu)選長度為大約100至1,000個核苷酸(或者之間的任何整數),更優(yōu)選長度為大約200至500個核苷酸。用于確定核酸和氨基酸序列相同性的技術是本領域熟知的。通常,此類技術包括確定基因的mrna的核苷酸序列和/或確定由其所編碼的氨基酸序列,并將這些序列與第二個核苷酸或氨基酸序列進行比較?;蚪M序列也可以此方式進行確定和比較。一般而言,相同性是指兩個多核苷酸或多肽分別確切的核苷酸-對-核苷酸或氨基酸-對-氨基酸的對應。兩個或更多個序列(多核苷酸或氨基酸)可以通過確定其百分比相同性來進行比較。兩個序列(核酸或氨基酸序列)的百分比相同性,是用兩個比對的序列之間確切匹配的數目除以較短序列的長度再乘以100。smith和waterman,advancesinappliedmathematics2:482-489(1981)的局部同源性算法提供了對核酸序列的大約比對。此算法可以通過使用dayhoff,atlasofproteinsequencesandstructure,m.o.dayhoffed.,5suppl.3:353-358,nationalbiomedicalresearchfoundation,washington,d.c.,usa開發(fā)的評分矩陣而應用于氨基酸序列,并通過gribskov,nucl.acidsres.14(6):6745-6763(1986)來進行歸一化。此算法用于確定序列的百分比相同性的示例性施行由geneticscomputergroup(madison,wis.)在“bestfit"”實用應用中提供。用于此方法的缺省參數在wisconsinsequenceanalysispackageprogrammanual,version8(1995)(可得自geneticscomputergroup,madison,wis.)中有描述。在本公開的背景下建立百分比相同性的優(yōu)選方法,是使用版權歸愛丁堡大學、由johnf.collins和shanes.sturrok開發(fā)的、并由intelligenetics,inc.(mountainview,calif.)銷售的mpsrch程序包。從此套程序包可以使用smith-waterman算法,其中缺省參數用于評分表(例如,12的缺口開放罰分、1的缺口延伸罰分、以及6的缺口)。從所產生的數據中,“匹配”值反映出序列相同性。其它用于計算序列之間百分比相同性或相似性的適宜程序一般是本領域已知的,例如,另一比對程序是blast,以缺省參數使用。例如,blastn和blastp可用以下的缺省參數來進行使用:基因編碼=標準;過濾器=無;鏈=兩條;截斷值=60;預期=10;矩陣=blosum62;描述=50序列;排序=高得分;數據庫=非冗余的,genbank+embl+ddbj+pdb+genbankcds翻譯+swiss蛋白+spupdate+pir。這些程序的細節(jié)可以在以下互聯網地址找到:http://www.ncbi.nlm.gov/cgi-bin/blast。對于本文所描述的序列,序列相同性程度預期的范圍是大約80%至100%以及期間的任何整數值。通常序列之間的百分比相同性為至少70-75%、優(yōu)選80-82%、更優(yōu)選85-90%、更優(yōu)選92%、更優(yōu)選95%、以及最優(yōu)選98%的序列相同性。或者,多核苷酸之間序列相似性的程度可以通過以下來進行確定:將多核苷酸在允許同源區(qū)域之間形成穩(wěn)定雙鏈體的條件下進行雜交,隨后用單鏈特異性的核酸酶進行消化,并確定經消化片段的大小。當序列在給定長度的分子上展現出至少約70%-75%、優(yōu)選80%-82%、更優(yōu)選85%-90%、更優(yōu)選92%、更優(yōu)選95%、以及最優(yōu)選98%的序列相同性(使用上文的方法確定)時,則兩個核酸、或兩個多肽序列基本上是同源的。如本文所用,基本上同源也是指顯示出對指定的dna或多肽序列完全的相同性的序列?;旧贤吹膁na序列可以(在例如對該特定系統(tǒng)而定義的嚴格條件下)于southern雜交實驗中進行鑒定。定義適宜的雜交條件是本領域的技術。參見例如,sambrook等人,supra;nucleicacidhybridization:apracticalapproach,editorsb.d.hamesands.j.higgins,(1985)oxford;washington,d.c.;irlpress)。兩個核酸片段的選擇性雜交可以如下進行確定。兩個核酸分子之間的序列相同性程度影響此類分子之間雜交的效率和強度。部分相同的核酸序列將至少部分地抑制完全相同的序列對靶分子的雜交。完全相同序列雜交的抑制可以使用本領域熟知的雜交測定來進行評估(例如,southern(dna)印跡、northern(rna)印跡、溶液雜交,或者類似的等,參見sambrook,等人,molecularcloning:alaboratorymanual,secondedition,(1989)coldspringharbor,n.y.)。此類測定可以使用不同程度的選擇性來進行,例如,使用從低到高嚴格性變化的條件。如果使用低嚴格性的條件,可以使用甚至缺乏部分程度的序列相同性的第二探針(例如,與靶分子具有低于大約30%序列相同性的探針)來評估非特異性結合的,從而,在缺乏非特異性結合事件時,所述第二探針將不會雜交至靶。當利用基于雜交的檢測系統(tǒng)時,選擇與參考核酸序列互補的核酸探針,并繼而通過選擇適宜的條件使所述探針和所述參考序列選擇性地彼此雜交、或結合以形成雙鏈分子。能夠在中等嚴格雜交條件下選擇性地雜交至參考序列的核酸分子,通常在使得能夠檢測長度至少約10-14核苷酸的核酸序列(與選擇的核酸探針序列具有至少大約70%的序列相同性)的條件下雜交。嚴格雜交條件通常使得能夠檢測長度至少約10-14核苷酸的靶核酸序列(與選擇的核酸探針序列具有超過大約90-95%的序列相同性)。用于探針/參考序列雜交的雜交條件(其中所述探針和參考序列具有特定程度的序列相同性),可以如本領域中已知的那樣進行確定(參見,例如,nucleicacidhybridization:apracticalapproach,editorsb.d.hamesands.j.higgins,(1985)oxford;washington,d.c.;irlpress)。用于雜交的條件是本領域技術人員熟知的。雜交嚴格性是指雜交條件不利于含錯配核苷酸的雜合體形成的程度,且較高的嚴格性對應于對錯配雜合體較低的容忍度。影響雜交嚴格性的因素是本領域技術人員熟知的,且包括但不限于,溫度、ph、離子強度、以及有機溶劑(如例如甲酰胺和二甲基亞砜)的濃度。如本領域技術人員所知的那樣,通過更高的溫度、更低的離子強度和更低的溶劑濃度來提高雜交嚴格性。對于雜交的嚴格性條件,本領域熟知的是可以使用許多等同的條件來建立特定的嚴格性,例如,通過改變以下因素:序列的長度和性質、各種序列的堿基組成、鹽和其它雜交溶液成分的濃度、雜交溶液中封閉劑(例如,硫酸葡聚糖、和聚乙二醇)的存在或缺乏、雜交反應溫度和時間參數、以及改變洗滌條件。特定雜交條件組的選擇依照本領域中的標準方法來進行選擇(參見,例如,sambrook,等人,molecularcloning:alaboratorymanual,secondedition,(1989)coldspringharbor,n.y.)?!扒懈睢笔侵竏na分子共價骨架的斷裂。切割可以通過各種方法來起始,包括但不限于,磷酸二酯鍵的酶活化學水解。單鏈的切割和雙鏈的切割都是可能的,并且雙鏈的切割可以作為兩個不同的單鏈切割事件的結果來發(fā)生。dna切割可導致產生平滑的末端或交錯的末端。在某些實施方案中,融合多肽用于靶向的雙鏈dna的切割。“染色體”是包含細胞的所有或部分基因組的染色質復合物。細胞的基因組常常通過其核型來表征,其是包含細胞的基因組的所有染色體的集合。細胞的基因組可包含一或多個染色體。“靶位點”或“靶序列”是定義結合分子所將結合的核酸部分(只要存在結合的充分條件)的核酸序列。例如,序列5'-gaattc-3'是ecori限制性內切核酸酶的靶位點?!巴庠础被颉爱愒础狈肿邮峭ǔ2淮嬖谟诩毎械强梢酝ㄟ^一或多種遺傳學、生物化學或其它方法來引入細胞中的分子?!巴ǔ4嬖谟诩毎小笔轻槍毎奶囟òl(fā)育階段和環(huán)境條件來確定的。因而,例如,僅在肌肉的胚胎發(fā)育期間存在的分子對于成年肌肉細胞而言是外源分子。類似地,通過熱休克誘導的分子對于非熱休克細胞而言是外源分子。相反,“內源”分子是在特定的發(fā)育階段于特定的環(huán)境條件下通常存在于細胞中的分子。例如,內源核酸可包含染色體,線粒體、葉綠體或其它細胞器的基因組,或者天然發(fā)生的附加體核酸。另外的內源分子可包括蛋白,例如,轉錄因子和酶。“基因表達”是指基因中所含的信息轉換成基因產物?;虍a物可以是基因的直接轉錄產物(例如,mrna、trna、rrna、反義rna、核酶、結構rna或任何其它類型的rna)或通過mrna的翻譯產生的蛋白。基因產物還包括通過如加帽、多腺苷酸化、甲基化、和編輯的方法而經修飾的rna,以及通過例如甲基化、乙?;?、磷酸化、泛素化、adp-核糖基化、十四烷基化、和糖基化而經修飾的蛋白?;虮磉_的“調節(jié)”是指基因活性的改變。表達的調節(jié)可包括,但不限于,基因激活和基因抑制。術語“操作性連接”和“操作性地連接”(或“可操作地連接”)可互換地用于指兩個或更多個成分(如序列元件)的毗鄰,其中所述成分經過安排從而使得兩個成分都功能正常并使得至少一個所述成分有可能介導對至少一個其它成分所發(fā)揮的功能。作為說明,如果轉錄調節(jié)序列因應一或多個轉錄調節(jié)因子的存在或缺失而控制編碼序列的轉錄水平,則該轉錄調節(jié)序列,如啟動子,可操作地連接至編碼序列。轉錄調節(jié)序列一般以順式與編碼序列可操作地連接,但卻并不必需是直接與其相鄰。例如,增強子是與編碼序列可操作地連接的轉錄調節(jié)序列,盡管它們并不緊鄰。如本文所用,術語“編碼區(qū)”和“編碼序列”可互換使用并且是指編碼多肽(并且當置于適當的調節(jié)序列的控制下時表達所編碼的多肽)的核苷酸序列。編碼區(qū)的邊界一般是通過在其5'末端的翻譯起始密碼子和在其3'末端的翻譯終止密碼子來確定的。“調節(jié)序列”是調節(jié)其可操作地連接的編碼序列的核苷酸序列。調節(jié)序列的非限制性實例包括啟動子、增強子、轉錄起始位點、翻譯起始位點、翻譯終止位點、和轉錄終止子。包括編碼區(qū)的多核苷酸可包括在編碼區(qū)一側或兩側的異源核苷酸。如本文所用,“異源核苷酸”是指通常不存在于編碼區(qū)(其存在于野生型細胞中)旁側的核苷酸。例如,在野生型微生物中存在的并且編碼cas9多肽的編碼區(qū)旁側為同源序列,而在編碼區(qū)旁側的任何其它核苷酸序列則認為是異源的。異源核苷酸的實例包括,但不限于調節(jié)序列。通常,通過使用本領域技術人員熟知的標準遺傳學和/或重組方法來使異源核苷酸存在于本文公開的多核苷酸中。本文公開的多核苷酸可以包括在適宜的載體中。如本文所用,“經遺傳修飾的細胞”是指已經“通過人工”來改變的細胞。經遺傳修飾的細胞,包括其中已經引入外源多核苷酸的細胞、愈傷組織、組織、植株、或動物。經遺傳修飾的細胞,也是指已經過遺傳操縱從而使內源核苷酸改變?yōu)榘ㄍ蛔?如缺失、插入、轉換、顛換、或其組合)的細胞。例如,內源編碼區(qū)可以被缺失。此類突變可以導致與內源多核苷酸所編碼的多肽具有不同氨基酸序列的多肽。經遺傳修飾的細胞、愈傷組織、組織、植株、或動物的另一實例是具有改變的調節(jié)序列,如啟動子,以導致可操作連接的內源編碼區(qū)表達提高或降低。除非另有指明,“一(a)”、“一(an)”、“所述”和“至少一”可互換使用并且意味著一個或超過一個。在本文中還有,通過端點來提及的數值范圍包括歸入該范圍內的所有數值(例如,1至5包括1、1.5、2、2.75、3、3.80、4、5等)。如本文所用,術語“trna切割序列”是指由trna剪接內切核酸酶,如rnasep、rnasez或rnasee,所識別和剪切的任何核苷酸序列。如本文所用,術語“trna剪接內切核酸酶”是指負責識別trna前體中所含有的剪接位點以及切割trna前體中存在的內含子的酶。古細菌trna剪接內切核酸酶識別古細菌trna前體中的凸起-螺旋-凸起基序。真核trna剪接內切核酸酶通過測量從成熟結構域到剪接位點的距離還識別trna前體中所含有的剪接位點。表述“反義rna”表示能夠結合至靶核酸序列(dna或rna)從而限制或阻止其發(fā)揮功能的rna;具體而言,反義rna能夠結合至靶信使rna從而阻止其翻譯(參見,例如,tafech等人(2006)curr.med.chem.13:863-881)。表述“干擾rna”表示能夠通過干擾現象來阻止或限制靶基因表達的rna(參見,例如,tafech等人(2006)curr.med.chem.13:863-881)。本發(fā)明的方法和組合物trnatrna的一般特征是本領域技術人員熟知的。優(yōu)選地,trna是由單一的核糖核苷酸鏈(其能夠折疊以采取特征性的、所謂的三葉草二級結構)形成的。此特征性的二級結構包含:(i)由核糖核苷酸鏈5'末端的前7個核糖核苷酸和核糖核苷酸鏈3'末端最后4個核糖核苷酸之前的7個核糖核苷酸所組成的受體莖,由此形成包含6或7對核糖核苷酸的雙鏈結構,由核糖核苷酸鏈5'末端的第一個核糖核苷酸和核糖核苷酸鏈3'末端最后4個核糖核苷酸之前的核糖核苷酸所組成的核糖核苷酸可以不配對;ii)由4對核糖核苷酸組成的d臂和由8至10個核糖核苷酸組成的d環(huán),通過跟隨核糖核苷酸鏈5'末端前7個核糖核苷酸之后的部分核糖核苷酸鏈的折疊所形成;(iii)由5對核糖核苷酸組成的反密碼子的莖,和由7個核糖核苷酸組成的反密碼子的環(huán)(反密碼子的莖-環(huán)),通過跟隨d臂和d環(huán)之后的部分核糖核苷酸鏈的折疊所形成;(iv)由4至21個核糖核苷酸組成的并且由跟隨反密碼子的莖和反密碼子的環(huán)之后的部分核糖核苷酸鏈所形成的可變環(huán);(v)由5對核糖核苷酸組成的t臂,和由8個核糖核苷酸組成的t環(huán),通過跟隨可變環(huán)之后且在核糖核苷酸鏈3'末端參與受體莖組成的核糖核苷酸之前的部分核糖核苷酸鏈的折疊所形成;同樣優(yōu)選地,從5'末端朝向3'末端的方向,在核糖核苷酸鏈5'末端的前7個核糖核苷酸與d臂和環(huán)之間存在2個核糖核苷酸,一方面在d臂和環(huán)之間、另一方面在反密碼子的莖和環(huán)之間存在1個核糖核苷酸,以及一方面在反密碼子的莖和環(huán)之間、另一方面可變環(huán)存在1個核糖核苷酸。優(yōu)選地,并且根據本領域技術人員熟知的且由sprinzl等人(1998)"compilationoftrnasequencesandsequencesoftrnagenes".nucleicacidsres.26:148-153所定義的編號,trna包含17個核糖核苷酸,確保trna的三維結構以及被細胞的酶所識別,也即:u.sub.8、a.sub.14、(a或g).sub.15、g.sub.18、g.sub.19、a.sub.21、g.sub.53、u.sub.54、u.sub.55、c.sub.56、(a或g).sub.57、a.sub.58、(c或u).sub.60、c.sub.61、c.sub.74、c.sub.75、a.sub.76。所示的核糖核苷酸對應于由細胞器對某些核糖核苷酸進行任何轉錄后修飾之前所轉錄的trna的序列。具體而言,上文定義的trna可以選自以下組:古細菌、細菌、病毒、原生動物、真菌、藻類、植物、或動物trna??梢愿鶕景l(fā)明使用的trna還包括sprinzl等人(1998)"compilationoftrnasequencesandsequencesoftrnagenes".nucleicacidsres.26:148-153所描述的所有trna或者可以得自以下站點的那些trna:http://www.uni-bayreuth.de/departments/biochemie/trna/。在本發(fā)明的背景下,術語“trna”還包括通過對上文所定義的trna進行修飾而獲得的結構,或者上文所定義的trna的天然變體,只要這些經修飾的結構或那些變體保留未經修飾的trna的功能性,也即特別是與蛋白的相互作用,所述蛋白如ef-tu因子(參見,例如,rodnina等人(2005)febs.lett.579:938-942)或ccase(參見,例如,augustin等人(2003)j.mol.biol.328:985-994)。有許多trna活性序列和基序是通過以下資源使本領域技術人員已知且可得的:如可得自萬維網lowelab.ucsc.edu/trnacan-se/的trna-se程序或萬維網trna.bioinf.uni-leipzig.de/dataoutput/organisms(對于所有生物體),或萬維網plantrna.ibmp.cnrs.fr/(對于植物)。許多文章和genbank資源也是可得的并在本文中提及。用于rnase的trna內切核酸酶的底物可以通過本領域技術人員熟知的任何方法來產生。例如,所述底物可以通過使用亞磷酰胺或其它溶液或固相方法來化學合成。用于通過亞磷酰胺方法形成多核苷酸的化學的詳細描述是已知的(參見例如,caruthers等熱,u.s.pat.nos.4,458,066和4,415,732;caruthers等熱,1982,geneticengineering4:1-17;user’smanualmodel392and394polynucleotidesynthesizers,1990,頁碼6-1至6-22,appliedbiosystems,partno.901237;ojwang,等人,1997,biochemistry,36:6033-6045)。在合成之后,所述底物可以使用本領域技術人員熟知的標準技術來進行純化(參見hwang等人,1999,proc.natl.acad.sci.usa96(23):12997-13002以及其中引用的參考文獻)。根據所述底物的長度以及其合成方法,此類純化技術包括但不限于,反相高效液相色譜(“反相hplc”)、快速高效液相色譜(“fplc”)、和凝膠純化。本領域技術人員有許多rnase資源可用,包括以下:rnasee1.soderbomf,svardsg,kirsebomla.2005.rnaseecleavageinthe5'leaderofatrnaprecursor.jmolbiol352(1):22-27.2.nakajiman,ozekih,shimuray.1981.organizationandstructureofane.colitrnaoperoncontainingseventrnagenes.cell23(1):239-249.3.liz,deutschermp.2002.rnaseeplaysanessentialroleinthematurationofescherichiacolitrnaprecursors.rna8(1):97-109.rnasep1.kirsebomla.2007.rnaseprnamediatedcleavage:substraterecognitionandcatalysis.biochimie89(10):1183-1194.2.gutmannb,goberta,giegep.2012.prorpproteinssupportrnasepactivityinbothorganellesandthenucleusinarabidopsis.genesdev.26(10):1022-1027.3.forsterac,altmans.1990.externalguidesequencesforanrnaenzyme.science249(4970):783-786.4.yuany,altmans.1995.substraterecognitionbyhumanrnasep:identificationofsmall,modelsubstratesfortheenzyme.emboj14(1):159-168.rnasez1.kruszkak,barnechef,guyotr,ailhasj,meneaui,schiffers,marchfeldera,echeverriam.2003.plantdicistronictrna-snornagenes:anewmodeofexpressionofthesmallnucleolarrnasprocessedbyrnasez.emboj22(3):621-632.2.schiffers,roschs,marchfeldera.2002.assigningafunctiontoaconservedgroupofproteins:thetrna3'-processingenzymes.emboj21(11):2769-2777.3.barbeziern,caninog,rodorj,jobete,saez-vasquezj,marchfeldera,echeverriam.2009.processingofadicistronictrna-snornaprecursor:combinedanalysisinvitroandinvivorevealsalternatepathwaysandcouplingtoassemblyofsnornp.plantphysiol150(3):1598-1610.4.caninog,bociane,barbeziern,echeverriam,fornerj,binders,marchfeldera.2009.arabidopsisencodesfourtrnasezenzymes.plantphysiol150(3):1494-1502如本文所用,表述“3'末端mrna前體內切核酸酶的底物”是指由3'末端mrna前體內切核酸酶識別并剪切的任何核苷酸序列。例如,包含切割位點上游的序列aauaaa的六核苷酸以及下游的富含g/u的序列元件的核苷酸序列,可以在本文所述的測定用作3'末端mrna前體內切核酸酶的底物。由3'末端mrna前體內切核酸酶識別并剪切的核苷酸序列,可包含10個核苷酸、15個核苷酸、20個核苷酸、25個核苷酸、25個核苷酸、30個核苷酸、40核苷酸。45個核苷酸、50個核苷酸、55個核苷酸、60個核苷酸、65個核苷酸、75核苷酸、100個核苷酸、125個核苷酸、150核苷酸、或更多。在具體的實施方案中,本文所述測定中所使用的3'末端mrna前體內切核酸酶包含切割和多腺苷酸化位點。載體和核酸多種核酸可以被引入細胞內用于本發(fā)明的目的。如本文所用,術語核酸包括dna、rna、和核酸類似物,以及雙鏈的或單鏈的核酸(也即,有義或反義單鏈)。核酸類似物可以在堿基部分、糖部分、或磷酸酯骨架進行修飾,以改善例如核酸的穩(wěn)定性、雜交、或溶解度。在堿基部分的修飾包括脫氧尿苷代替脫氧胸苷,以及5-甲基-2'-脫氧胞苷和5-溴-2'-脫氧胞苷代替脫氧胞苷。糖部分的修飾包括修飾核糖的2'羥基以形成2'-o-甲基或2'-o-烯丙基糖。脫氧核糖磷酸酯骨架可以經過修飾以產生嗎啉代核酸,其中每個堿基部分連接至六元的嗎啉環(huán)、或肽核酸,其中脫氧磷酸酯骨架被偽肽骨架所取代并且保留四種堿基。參見,summerton和weller(1997)antisensenucleicaciddrugdev.7(3):187;和hyrup等人(1996)bioorgan.med.chem.4:5。另外,可以用例如,硫代磷酸酯或二硫代磷酸酯骨架、亞磷酰胺、或烷基磷酸三酯骨架來取代脫氧磷酸酯骨架。所述核酸序列可以是可操作地連接至調節(jié)區(qū)如啟動子。調節(jié)區(qū)可以是豬調節(jié)區(qū)或者是來自其它物種。如本文所用,可操作地連接是指調節(jié)區(qū)相對于核酸序列的位置是允許或促進靶核酸轉錄的方式。任何類型的啟動子都能可操作地連接至靶核酸序列。啟動子的實例包括且不限于,組織特異性啟動子、組成性啟動子、可誘導啟動子、以及對特定刺激應答或不應答的啟動子。適宜的組織特異性啟動子可以導致核酸轉錄物在β細胞中的優(yōu)先表達,并且包括例如人胰島素啟動子。其它組織特異性啟動子可導致例如在肝細胞或心臟組織中的優(yōu)先表達,并且可分別包括白蛋白或α-肌球蛋白重鏈啟動子。在其它實施方案中,可以使用促進核酸分子表達而無顯著的組織或時間特異性的啟動子(也即,組成性啟動子)。例如,可以使用β-肌動蛋白啟動子如雞β-肌動蛋白基因啟動子、泛素啟動子,minicag啟動子,甘油醛-3-磷酸脫氫酶(gapdh)啟動子、或3-磷酸甘油酸激酶(pgk)啟動子,以及病毒啟動子如單純皰疹病毒胸苷激酶(hsv-tk)啟動子、sv40啟動子、或巨細胞病毒(cmv)啟動子。在一些實施方案中,使用雞β-肌動蛋白基因啟動子和cmv增強子的融合作為啟動子。參見,例如,xu等人(2001)hum.genether.12:563;andkiwakietal.(1996)hum.genether.7:821??捎糜诤怂針嫿w的另外的調節(jié)區(qū)包括但不限于,多腺苷酸化序列、翻譯控制序列(例如,內部核糖體進入區(qū)段,ires)、增強子、可誘導元件、或內含子。此類調節(jié)區(qū)可以不是必需的,雖然它們可以通過影響轉錄、mrna的穩(wěn)定性、翻譯效率等等來提高表達。此類調節(jié)區(qū)可以包括在核酸構建體中以期望獲得核酸在細胞中的最佳表達。然而,有時沒有此類額外元件時可以獲得充分的表達??梢允褂镁幋a信號肽或可選擇標志物的核酸構建體??梢允褂眯盘栯膹亩鴮⑺幋a的多肽引導至特定的細胞部位(例如,細胞表面)。可選擇標志物的非限制性實例包括嘌呤霉素、更昔洛韋、腺甙脫氨酶(ada)、氨基糖苷磷酸轉移酶(neo,g418,aph)、二氫葉酸還原酶(dhfr)、潮霉素-b-磷酸轉移酶、胸苷激酶(tk)、和黃嘌呤鳥嘌呤磷酸核糖轉移酶(xgprt)。此類標志物可用于在培養(yǎng)物中選擇穩(wěn)定的轉化體。其它可選擇標志物包括熒光多肽,如綠色熒光蛋白或黃色熒光蛋白。核酸可以摻入載體中。載體是廣義的術語,其包括設計為從運載體移動進入靶dna的任何特定的dna區(qū)段。載體可以是指表達載體,或載體系統(tǒng),其是將dna插入帶至基因組或其它靶向的dna序列(如附加體、質粒、或者甚至是病毒/噬菌體dna區(qū)段)的一組部件。用于在動物中遞送基因的載體系統(tǒng)如病毒載體(例如,逆轉錄病毒,腺相關病毒和整合噬菌體病毒),和非病毒載體(例如,轉座子)具有兩個基本部件:1)由dna(或者是逆轉錄成cdna的rna)組成的載體和2)轉座酶、重組酶、或者其它識別載體和dna靶序列并將載體插入至靶dna序列中的整合酶。載體最經常含有一或多個表達盒(包含一或多個表達控制序列),其中表達控制序列是分別控制和調節(jié)另一dna序列或mrna的轉錄和/或翻譯的dna序列。許多不同類型的載體是已知的。例如,質粒和病毒載體,例如,逆轉錄病毒載體,是已知的。多核苷酸構建體可以通過許多常規(guī)技術來引入至期望的受體或受體細胞的基因組中。對于此類技術的綜述,參見,例如,weissbach&weissbachmethodsforcell,molecularbiology(1988,academicpress,n.y.)sectionviii,pp。421-463;和grierson&corey,cellmolecularbiology(1988,2ded.),blackie,london,ch.7-9。例如,可以使用技術如電穿孔和顯微注射來將所述dna構建體直接引入至細胞的基因組dna中,可以使用基因槍方法如dna粒子轟擊來將所述dna構建體直接引入至植物或動物(參見例如,klein等人(1987)nature327:70-73)?;蛘撸鰀na構建體可以與適宜的t-dna側翼區(qū)結合并被引入至常規(guī)的根瘤土壤桿菌(agrobacteriumtumefaciens)宿主載體中。根瘤土壤桿菌-介導的轉化技術,包括卸甲(disarming)和使用雙元載體,在科學文獻中有很好的描述。參見例如horsch等人(1984)science233:496-498,和fraley等人(1983)proc.nat'l.acad.sci.usa80:4803。當細胞使用雙元tdna載體(bevan(1984)nuc.acidres.12:8711-8721)或共培養(yǎng)過程(horsch等人(1985)science227:1229-1231)而受到細菌感染時,根瘤土壤桿菌宿主的毒力功能將直接引導所述構建體和相鄰的標志物進入細胞dna。參見hernalsteen等人(1984)emboj3:3039-3041;hooykass-vanslogteren等人(1984)nature311:763-764;grimsley等人(1987)nature325:1677-179;boulton等人(1989)cellmol.biol.12:31-40;和gould等人(1991)cellphysiol.95:426-434。另外的基因轉移和轉化方法包括但不限于,通過鈣-、聚乙二醇(peg)-、或電穿孔-介導的裸dna攝取進行的原生質體轉化(參見paszkowski等人(1984)emboj3:2717-2722,potrykus等人(1985)molec.gen.genet.199:169-177;fromm等人(1985)proc.nat.acad.sci.usa82:5824-5828;和shimamoto(1989)nature338:274-276)和細胞、植物或動物組織的電穿孔(d'halluin等人(1992)cell,4:1495-1505)。用于細胞轉化的另外的方法包括顯微注射,碳化硅介導的dna攝取(kaeppler等人(1990)cellreporter9:415-418),和微粒轟擊(參見klein等人(1988)proc.nat.acad.sci.usa85:4305-4309;和gordon-kamm等人(1990)cell2:603-618)。可以通過選擇或篩選經修飾的細胞、植物或動物材料由轉化dna上存在的標志物基因所編碼的性狀,來對經轉化的細胞、愈傷組織、組織植物或動物進行鑒定和分離。例如,可以通過使經修飾的細胞在含有一致性量的抗生素或除草劑(轉化基因對其賦予抗性)的培養(yǎng)基上生長來進行篩選。另外,還可以通過篩選重組核酸構建體上存在的任何可視標志物基因的活性(例如,β-葡萄糖苷酸酶、熒光素酶、b或c1基因)來鑒定經轉化的細胞。此類選擇和篩選方法學是本領域技術人員熟知的。還可以使用物理學和生物化學方法來鑒定含有插入的基因構建體的轉化體。這些方法包括但不限于:1)用于檢測和確定重組dna插入物結構的southern分析或pcr擴增;2)用于檢測和檢驗基因構建體的rna轉錄物的northern印跡、s1rnase保護、引物-延伸或逆轉錄酶-pcr擴增;3)用于檢測酶或核酶活性的酶測定,其中此類基因產物是由所述基因構建體所編碼的;4)蛋白凝膠電泳、western印跡技術、免疫沉淀、或酶聯免疫測定,其中所述基因構建體產物是蛋白。另外的技術,如原位雜交、酶染色、和免疫染色,也可用于檢測檢測在具體細胞、植物或動物器官和組織中重組構建體的存在或表達。用于進行所述這些測定的方法都是本領域技術人員熟知的?;蚪M改變包括穩(wěn)定摻入細胞中的多核苷酸、或通過基因編輯創(chuàng)建的插入/缺失,可以例如使用標準育種技術來引入至其它的細胞、組織、植物或動物中。通過任何上述轉化技術所制備的經遺傳修飾的細胞可以進行培養(yǎng),以再生具有轉化的基因型并因而具有期望表型的完整植物或動物組織。此類再生技術依賴于組織培養(yǎng)生長培養(yǎng)基中特定植物激素的操縱,通常依賴于已經與期望的核苷酸序列一起引入的殺蟲劑和/或除草劑標志物。從培養(yǎng)的原生質體再生植物或動物在handbookofcell,plantoranimalcellculture,pp.124-176,macmillianpublishingcompany,newyork,1983中evans等人的"protoplastsisolationandculture";以及binding,regenerationofprotoplasts,pp.21-73,crcpress,bocaraton,1985中有描述。再生也可以從愈傷組織,外植細胞(excell),器官、花粉、胚胎或其部分來獲得。此類再生技術一般在klee等人(1987)ann.rev.ofcell,plantoranimalphys.38:467-486中有描述。引入至細胞內的核酸,可用于將期望的性狀賦予基本上任何細胞、植物或動物。可以使用本公開的核酸構建體和上文提到的各種轉化方法來修飾多種多樣的細胞、植物或動物系統(tǒng),以獲得本文所述的期望的生理學和農藝學特征。在優(yōu)選的實施方案中,用于在植物中進行修飾的靶細胞可以包括但不限于,那些單子葉植物和雙子葉植物細胞,植物或動物,如農作物包括谷類作物(例如,小貓、玉米、水稻、粟、大麥),果蔬作物(例如,番茄、蘋果、梨、草莓、桔子),飼料作物(例如,苜蓿),根菜作物(例如,胡蘿卜、馬鈴薯、甜菜、山藥)、葉菜作物(例如,生菜、菠菜);開花細胞、植物或動物(例如,矮牽牛、玫瑰、菊花),針葉樹和松樹(例如,松杉,云杉);用于植物修復的細胞、植物或動物(例如,重金屬積累細胞、植物或動物);油料作物(例如,向日葵、油菜籽)以及用于實驗目的的細胞、植物或動物(例如,擬南芥)。因而,所公開的方法和組合物在廣泛的細胞、植物或動物中有用途,包括但不限于來自以下屬的種類:蘆筍屬、燕麥屬、蕓苔屬、柑桔屬、西瓜屬、辣椒屬、南瓜屬、胡蘿卜屬屬、大豆屬、大麥屬、萵苣屬、番茄屬、蘋果屬、木薯屬、煙草屬、稻屬、鱷梨屬、豌豆屬、梨屬、李屬、蘿卜屬、黑麥屬、茄屬、高粱屬、小麥屬、葡萄、豇豆屬、和玉蜀黍屬。本領域技術人員會意識到,在表達盒穩(wěn)定摻入轉基因細胞、植物或動物中并確認是可操作的之后,其可以通過有性雜交而引入至其它的細胞、植物或動物中。可以使用許多標準育種技術中的任何技術(取決于要進行雜交的物種)。使用本文公開的方法進行的基因操縱可以通過以下進行觀測,例如,分離自感興趣組織的rna(例如,mrna)的northern印跡。通常,如果mrna的量提高了,可以推定相應的內源基因在以比之前更高的速率表達。可以使用其它測量基因活性的方法??梢允褂貌煌愋偷拿笢y定,取決于所使用的底物和檢測反應產物或副產物增加或減少的方法。另外,所表達的水平和/或蛋白可以通過免疫化學進行測量,也即,elisa、ria、eia和本領域技術人員熟知的其它基于抗體的測定,如通過電泳檢測測定(用染色或蛋白印跡)。轉基因可以在一些組織中或者在某些發(fā)育階段選擇性地表達,或者轉基因可以在基本上所有細胞中表達,基本上在其整個生命周期。然而,任何組合表達的模式也是適用的。本公開還涵蓋了上文所述轉基因細胞的后代、克隆、細胞系或細胞,其中所述后代、克隆、細胞系或細胞具有轉基因或基因構建體或者已經過編輯。用于基因靶向和基因組編輯的質粒載體根據本發(fā)明的一個方面,提供了使得能夠在細胞中進行基因靶向和基因組編輯的組合物。在一個方面,提供了具體的rna-引導的基因組編輯載體。在優(yōu)選的實施方案中,所述載體包括在植物或動物細胞中可操作的第一調節(jié)元件,其可操作地連接至至少一個編碼crispr-cas系統(tǒng)引導rna(其與靶序列雜交)的核苷酸序列;和在植物或動物細胞中可操作的第二調節(jié)元件,其可操作地連接至編碼ii型crispr-相關的核酸酶的核苷酸序列。所述編碼crispr-cas系統(tǒng)引導rna的核苷酸序列和事實編碼ii型crispr-相關的核酸酶的核苷酸序列可以在系統(tǒng)的相同或不同載體上。所述引導rna靶向靶序列,并且所述crispr-相關的核酸酶切割dna分子,其中至少一種基因產物的表達經改變。在優(yōu)選的實施方案中,所述載體包括核苷酸序列,該核苷酸序列包含依賴dna的rna聚合酶iii啟動子,其中所述啟動子可操作地連接至grna分子和poliii終止子序列,其中所述grna分子包括dna靶序列;和包括核苷酸序列,該核苷酸序列包含依賴dna的rna聚合酶ii啟動子,其中所述啟動子可操作地連接至編碼ii型crispr-相關核酸酶的核酸序列。所述crispr-相關核酸酶優(yōu)選是cas9蛋白。在另一實施方案中,提供了用于土壤桿菌-介導的瞬時表達或者植物或動物組織中穩(wěn)定轉化的載體。具體而言,用于在原生質體、組織培養(yǎng)物中瞬時表達的質粒載體含有:(1)依賴dna的rna聚合酶iii(poliii)啟動子(例如,水稻snornau3或u6啟動子)來控制細胞、植物或動物細胞中經改造grna分子的表達,其中通過poliii終止子(poliiiterm)來終止轉錄,(2)依賴dna的rna聚合酶ii(polii)啟動子(例如,35s啟動子)來控制cas9蛋白的表達;(3)位于poliii啟動子和grna支架之間的多克隆位點(mcs),其用于插入15-30bpdna序列以產生經改造的grna。為了有利于土壤桿菌-介導的轉化,提供了雙元載體(例如,pcambia1300載體),其中grna支架/cas9盒經土壤桿菌轉化而插入至植物、動物和真菌細胞內。為了編排grna,可以將與靶基因組序列互補的15-30bp長的合成dna序列插入至載體的mcs位點內。將改造的grna-cas9構建體引入細胞基因組基因組編輯和遺傳修飾的方法根據本發(fā)明的另一方面,可以通過各種方法將攜帶grna-cas9核酸酶的基因構建體引入細胞內,其包括但不限于peg-或電穿孔-介導的原生質體轉化,組織培養(yǎng)或者通過基因槍轟擊進行的細胞、植物或動物組織轉化,或者土壤桿菌-介導的瞬時和穩(wěn)定轉化。所述轉化可以是瞬時或穩(wěn)定轉化。用于基因組編輯和遺傳修飾的靶基因序列可以使用現有技術中已知的、且在此申請的其它部分描述的方法來進行選擇。在優(yōu)選的實施方案中,鑒定包括或接近前間區(qū)序列鄰近基序(pam)的靶序列。一旦經鑒定,可以通過合成一對靶特異性dna寡核苷酸(具有適當的克隆接頭)來靶向該具體序列,并將所述寡核苷酸磷酸化、退火、并連接至經消化的質粒載體內,如本文中所述。包含靶特異性寡核苷酸的質粒載體可以繼而用于細胞、植物或動物的轉化。設計具有最小脫靶風險的特異性grna的方法根據一個方面,本發(fā)明提供了設計dna/rna序列的方法,所述dna/rna序列引導cas9核酸酶以高特異性靶向期望的位點。經修飾的grna的特異性可以通過其間隔區(qū)序列與所靶向的生物體的基因組序列的序列比對來進行計算。制備非轉基因的、經遺傳修飾的植物或動物的手段使用前述的質粒載體和遞送方法,可以通過特異性的基因靶向和基因組編輯來制備經遺傳修飾的細胞、植物或動物。在許多情形中,所得到的經遺傳修飾的農作物不含有外源基因并且基本上是非轉基因的。通過此技術可以將編碼grna的dna序列設計為特異性地靶向任何基因或dna序列,以用于經插入或缺失或其它修飾(例如,轉錄激活和阻抑、甲基化和去甲基化、標記)而進行的定向突變。在細胞、植物或動物基因組中有效地且特異性地創(chuàng)建定向突變或修飾的能力大大地輔助具有改善的或新的性狀的許多新后代的開發(fā)。因為所述crispr/cas基因構建體在原生質體中僅僅瞬時表達并且未整合至基因組內,從原生質體再生的經遺傳修飾的植物或動物不含有外源dna并且基本上是非轉基因的。另外,可以在基因組編輯的轉基因株系回交或自交之后通過遺傳分離來獲得無轉基因的植物或動物。其它基于rna的遺傳操縱技術本發(fā)明可同樣地適用于其它rna介導的遺傳操縱技術,如基于rna的基因表達抑制。通常,能夠產生抑制至少一種多肽的轉錄和/或翻譯的rna分子的表達盒包括在本發(fā)明內。在本發(fā)明的一些實施方案中,用能夠表達多核苷酸(其抑制多肽的表達)的表達盒來轉化細胞。術語“表達”如本文所用是指基因產物的生物合成,包括所述基因產物的轉錄和/或翻譯。蛋白或多肽從dna分子的“表達”或“產生”是指編碼序列的轉錄和翻譯以產生所述蛋白或多肽,而蛋白或多肽從rna分子的“表達”或“產生”是指rna編碼序列的翻譯以產生蛋白或多肽。抑制多肽表達的多核苷酸的實例包括有義抑制/共抑制,其中表達盒設計為表達相應于所有或部分以“有義”方向編碼多肽的信使rna的rna分子,并且所述rna分子的過表達可導致天然基因表達的降低;反義抑制,其中表達盒設計為表達與所有或部分編碼acc合酶多肽的信使rna互補的rna分子,并且所述反義rna分子的過表達可導致天然基因表達的降低;雙鏈rna干擾,其中如上文所述用于共抑制的有義rna分子、以及與所述有義rna分子完全或部分互補的反義rna分子,在同一細胞中表達,導致相應內源信使rna、發(fā)夾rna干擾和含有內含子的發(fā)夾rna干擾表達的抑制,其中所述表達盒設計為表達與自身雜交已形成發(fā)夾結構(包含單鏈的環(huán)區(qū)和堿基配對的莖)的rna分子、小干擾rna或微rna,其中所述表達盒設計為表達仿照內源mirna基因的rna分子。另外,本發(fā)明中所描述的多元grna-介導的基因組編輯可以與失活的cas蛋白一起使用,來用于多個基因的轉錄激活和抑制、多個位點或基因的表觀基因組編輯(例如,甲基化和去甲基化)、基因組元件的標記、以及其它活生物體中的多元遺傳操縱。實施例實施例1所述crispr/cas9系統(tǒng)正在被利用為在基礎研究、分子療法和作物改良中用于基因組工程的有力工具。此系統(tǒng)利用小引導rna(grna)來將cas9內切核酸酶導向特定的dna位點,因而其靶向能力大大地受到grna表達裝置的局限。申請人開發(fā)了從單一的多順反子基因產生許多grna的一般策略。將精準切割trna前體兩個末端的內源trna加工系統(tǒng),改造為簡單的且強力的平臺以加強crispr/cas9系統(tǒng)的靶向和多元編輯能力。申請人在本文中證明了,具有串聯排列的trna-grna架構的合成基因在體內被高效且精準地加工為具有期望的5’靶向序列的grna,其引導cas9來編輯多個染色體靶。使用此策略,在穩(wěn)定的轉基因水稻植株中容易地以高效率(高達100%)實現多元基因組編輯和染色體片段缺失。因為trna以及其加工體系實際上在多有存活生物體中都是保守的,此方法可以廣泛用于加強crispr/cas9工具包的靶向能力和編輯效率。較高等的生物體通常利用具有功能上冗余的基因的復雜遺傳網絡,以對細胞過程進行微調。因此,具有同時操縱多個基因的能力的分子工具,在遺傳工程的基礎研究和實踐應用中都具有很高的價值。近來,細菌ii型規(guī)律成簇的間隔短回文重復序列(crispr)和crispr-相關蛋白(cas)系統(tǒng)正在成為用于此目的的有前景的工具。來自釀膿鏈球菌的cas9內切核酸酶(偶合有人工的引導rna(grna)),能夠靶向5’-n20-ngg-3’(n表示任何堿基)的dna序列,其中n20與grna5’序列的20個堿基相同(下文稱作grna間隔區(qū))和ngg為前間區(qū)序列鄰近基序(pam)(1-3)。簡單的rna-引導的可編排規(guī)則以及基因組中pam的高出現率,使得cas9-grna能夠容易地靶向幾乎所有遺傳元件用于基因組編輯。由于其簡便性和高效性,已經迅速開發(fā)基于cas9的工具以用于基因組/表觀基因組編輯、轉錄調節(jié)以及其它遺傳工程中的應用(4-6)。原則上,多元基因組編輯可以通過將cas9(或cas9衍生的效應子)與用于各個靶位點的多個grna一起表達來實現。常規(guī)遞送方法包括顯微注射或含有多個用于多元基因組編輯的單一grna(sgrna)表達盒的基因構建體的表達(2,3,7-11)。體外合成的grna和cas9蛋白(或cas9mrna)直接顯微注射至細胞或胚胎內僅適宜用于很少的系統(tǒng)。結果,最常見的策略是在一個質粒構建體中堆積多個sgrna表達盒,或者使用多個構建體。一個sgrna表達盒通常的大小是大約400-500bp并且由rna聚合酶iii(poliii)啟動子、grna和poliii終止子組成。由于遞送方法和質粒載體容量的限制,對于大部分生物體來說以此種grna表達策略同時產生許多grna都會是種挑戰(zhàn)。另外,真核poliii轉錄的rna必須要以減少cas9/grna可靶向位點的特定核糖核苷酸來開始。先進的策略是將多個grna壓至一個合成基因中并改造rna加工系統(tǒng)來從初級轉錄物剪切個體grna?;诖朔N策略的唯一經證實的方法是將csy4內切核糖核酸酶(endo-rnase)與cas9表達來加工含有grna(融合有csy4-可切割的rna)的轉錄物(12,13)。盡管如此,仍然需要用于同時產生多個grna的更有力和精確的方法,以改善多元編輯能力和促進更精密的cas9應用。rna是基礎的細胞成分并且其制備是通過不同生物體中保守且精確的rna加工系統(tǒng)來保證的。這激發(fā)了我們改造內源rna加工系統(tǒng)以從單一轉錄物產生多個grna,而不是與cas9/grna成分一起引入任何另外的rnase。申請人在本文中證明了,在通過內源rnase體內精準剪切轉錄物之后,可以從具有trna-grna架構的單一合成基因有效產生多個grna。此grna表達策略顯示出不僅使得能夠進行多元靶向,還改善了crispr/cas9系統(tǒng)在植物中的編輯效率。因為trna加工系統(tǒng)存在于幾乎所有生物體中,此策略可以廣泛用于加強用于基因組工程的crispr/cas9工具的多元編輯能力。結果改造trna加工系統(tǒng)用于產生許多grna的策略為了從一個初級轉錄物同時產生多個grna,我們目的是將一簇具有不同的間隔區(qū)的grna壓至一個多順反子基因中,并操控內源rna加工系統(tǒng)來將此轉錄物切割成核中的個體grna。在搜尋潛在符合此要求的rna和內源-rnase的過程中,trna因為其以下的特征而吸引了我們的注意。(i)在核質中,trna前體(trna前體)在真核細胞中于特定的位點分別被rnasep和rnasez(或在細菌中為rnasee)切割以去除5’和3’附加序列(圖1a)(14-18)。(ii)rnasep和rnasez識別trna結構,不論是否trna前體序列(17,18)。此前的研究反映出,對于trna前體的rnasep和rnasez切割,只有trna的受體莖、d-環(huán)臂、和tψc-環(huán)臂是必需的(16-19)。(iii)trna在細菌的多順反子轉錄單位中發(fā)現(20)以及時而會在真核細胞中發(fā)現(19,21),表明trna加工系統(tǒng)很可能被用作固有的機制,以從來自單一多順反子基因的trna(19)產生不同的小rna(例如,snorna)。(iv)由于trna是最豐富的細胞成分之一,因而內源trna加工系統(tǒng)應當很強力,以便加工大量的底物。(v)trna基因含有內部啟動子元件(框a和b)來募集rna聚合酶iii(poliii)復合物(圖1b)(22,23)。因而trna序列也可以充當用于poliii的潛在轉錄增強子。基于這些特征,我們假定內源trna系統(tǒng)能被改造為用于grna的精準加工的一般平臺。為了將內源trna系統(tǒng)用于以cas9/grna進行的多元基因組編輯,我們設計了多順反子的trna-grna(ptg)基因,以用于同時產生許多grna。如圖1c中所示,此ptg基因由trna-grna的串聯重復序列組成,并且將會在poliii啟動子的控制下被轉錄為正常的snorna或sgrna基因。加工trna的內源rnase(例如,植物中的rnasep和rnasez)將會識別trna成分,并從ptg轉錄物剪切個體grna。所得的grna將繼而引導cas9至多個靶位點以進行基因組編輯(圖1c)。將ptg精準加工以產生具有期望靶序列的功能性grna為了探究合成的ptg基因是否會如我們所預期的那樣轉錄、加工和發(fā)揮功能(圖1c),我們合成了4種具有trna-grna(ptg1和ptg2)或trna-grna-trna(ptg1.1和ptg2.1,圖2a)結構的ptg基因。這4種ptg基因設計為產生此前已用sgrna基因(sgrna1和sgrna2)在cas9-介導的基因組編輯中(實施例2,圖5a和參見表2.1中的基因序列)經過測試的grna1(ptg1和ptg1.1)和grna2(ptg2和ptg2.1)(24)。兩種grna都靶向于水稻mpk5基因,該基因編碼參與生物和非生物信號通路的絲裂原-激活的蛋白激酶(mapk)。這些ptg用77-bp長的trna前體gly基因來構建,該基因識別ggc密碼子并廣泛存在于各種生物體中(25)。所選擇的trna前體gly序列由5’前導序列(5’-aacaaa-3’,6bp)和成熟trna(71bp)組成(圖2b)。ptg中的此種trna-grna融合模擬了植物中的天然trna-snorna43雙順反子(19)。在此研究中,我們使用了質粒載體(實施例2,圖6),其中sgrna或ptg用水稻u3snorna啟動子(u3p)來表達,而cas9用水稻泛素啟動子外加完整的5’非翻譯區(qū)(ubip)來表達。在用含有u3p:sgrna或u3p:ptg的質粒轉染水稻原生質體之后,進行了循環(huán)的逆轉錄pcr(crt-pcr)(26,27)以對成熟grna5’-末端和3’-末端作圖(crt-pcr的原理參見si附錄,圖s7和表s2)。從表達ptg或sgrna的原生質體檢測到具有預期大小的成熟grna(圖2c-2f)。然而,來自ptg的trna-grna融合的轉錄物通過crt-pcr不能檢測,可能是由于強力的trna加工系統(tǒng)將大部分的(如果不是全部的話)ptg初級轉錄物切割。對crt-pcr產物的序列分析反映出所有4種ptg轉錄物都精準地在trna-grna接合處切割,并產生攜帶期望的5’間隔區(qū)序列(無附加的核苷酸)的成熟grna(圖2g和實施例2,圖8和9)。另一方面,成熟grna的3’-末端攜帶有1-7nt長的聚(u)尾(如果其出現在poliii終止子之前的話)(sgrna,ptg1和ptg2,參見實施例2,圖8)、或者1-4nt的來自trna-前導序列的核糖核苷酸(當其出現在trna之前時)(ptg1.1和ptg2.1,參見實施例2,圖9)。所述crt-pcr數據還確認了從u3p:sgrna轉錄的grna必須要以核苷酸a開始,而u3p:ptg產生的grna沒有第一個核苷酸的限制(實施例2,圖8和9)。歸納來說,從ptg產生的grna是與sgrna相同的,但是卻并不必須要以特定的核苷酸開始(圖2g和2h)。通過檢驗插入/缺失(插入缺失)突變(通過在預測的cas9:grna切割位點進行修復的非同源末端連接(nhej)所引入)來確認了ptg1和ptg2的功能性。因為grna1和grna2靶分別含有kpni和saci限制性內切酶(re)位點(實施例2,圖5a),由ptg1/cas9和ptg2/cas9所誘導的突變可以容易地通過對pcr產物(涵蓋靶向的位點及相應的re)的消化來進行分析(pcr/re測定)。在用ptg1/cas9和ptg2/cas9轉染的水稻原生質體中,發(fā)現分別有15%和9%的靶位點攜帶插入缺失(圖2i),這比我們此前使用的sgrna:cas9構建體的突變率略高(24)。與我們的假設(trna可以作用為poliii的轉錄增強子)一致,用grna特異性引物進行的定量rt-pcr反映出,ptg1和ptg2的轉錄物水平分別比原生質體中的sgrna1和sgrna2高大約3和31倍(圖2j)??偠灾覀兊慕Y果證明了內源trna系統(tǒng)可以被用作精準且有力地工具,來從ptg產生grna以用于cas9-介導的基因組編輯。在水稻原生質體中經ptg/cas9的有效多元基因組編輯為了測試ptg系統(tǒng)的靶向能力和效率,將高達8個grna(grna1-grna8,實施例2,表2.3和圖5)串聯排列來構建ptg以用于靶向4個同源的水稻mapk(mpk1/2/5/6),所述基因可以冗余地在多樣的細胞信號通路中發(fā)揮作用。將這些grna分為4對,并且每對靶向于基因座內的兩個基因組位點(它們之間有350-750bp的距離)(實施例2,圖5)。通過組合不同的grna對,我們設計了編碼2個(ptg3/4/5/6)、4個(ptg7/8)、和8個(ptg9)grna的ptg基因,以相應地同時靶向于1個、2個、和4個mpk基因座(圖3a和實施例2,表2.1)。我們預期此種設計可能會導致兩個cas9切割位點之間短染色體片段的缺失,并使我們能夠容易地檢驗ptg的效力。為了合成具有重復trna-grna架構的ptg,我們基于goldengate拼裝策略的原則,設計了可擴展的且彈性的手段來從pcr成分拼裝ptg(28)(細節(jié)參見實施例2,圖10和11)。我們的基因拼裝手段使得能夠對具有來自共同寡核苷酸引物的不同grna組合的ptg進行快速合成。使用一部或兩步拼裝,我們合成了ptg3-ptg9基因并將他們克隆至crispr/cas9表達載體中(實施例2,圖6和表2.1-2.3)。我們繼而用含有u3p:ptg3-ptg9和ubip:cas9的質粒轉染水稻原生質體。我們在以4%–45%的效率表達各ptg的原生質體中檢測到于4個mapk基因座處的染色體片段缺失,其通過用靶特異性引物進行的截短的pcr產物的擴增而得到反映(圖3b)。雖然從ptg9同時產生8個grna,但是它們依然引導cas9在所有4個靶向的基因座以4%–20%的頻率有效地剪切染色體片段(圖3b)。在mpk5基因座的片段缺失效率進一步通過使用涵蓋grna2切割位點的引物的定量pcr而得到了確認(si附錄,表s4)。對這些截短的pcr產物的測序確認了兩個grna/cas9切割之間的片段是從靶向的基因座(有或無額外的插入/缺失)剪切的(圖3c)。一般而言,片段缺失效率與兩個配對位點之間的距離負相關(相關的效率r=-0.95),但是不同的grna可具有變化的效率。我們注意到一個ptg中grna的總數目在原生質體中不同的靶處以可變的程度影響缺失效率(圖3b)。在3個靶向基因座(mpk2/5/6),含有2個grna的ptg(ptg4/5/6)展現出比具有4個(ptg7/8)和8個(ptg9)grna的tg稍高的效率。但是在mpk1基因座處,ptg3(2個grna)顯示出了比ptg7(4個grna)或ptg9(8個grna)高~2倍的缺失頻率。具有較高grna數目的ptg效率的此種降低可能是由于grna之間對cas9的競爭。盡管如此,具有串聯排列的trna-grna架構的ptg能夠以高效率同時產生許多grna并引導cas9至多個染色體靶。在具有ptg/cas9的穩(wěn)定轉基因植物中改善多元基因組編輯因為許多植物,包括重要的農作物如水稻,并不能容易地從原生質體再生,我們使用了常規(guī)的土壤桿菌-介導的轉化來產生穩(wěn)定的轉基因株系,并評估了ptg/cas9系統(tǒng)在完整的水稻植物中用于多元基因組編輯的效力。在表達sgrna1:cas9、sgrna2:cas9、ptg6:cas9或ptg7:cas9的轉基因植物中grna1和grna2靶處的誘變頻率,在t0代進行了檢驗。在sgrna1:cas9(n=32)和sgrna2:cas9植物的t0代中(n=20),其中分別有44%和60%攜帶插入/缺失而分別有13%和20%具有雙等位基因突變(表1和實施例2,圖12)。相反,在包含35%(grna1)和76%(grna2)雙等位基因突變的所有ptg6:cas9植物中(100%,n=17),檢測了兩個位點處的插入缺失(表1和實施例2,圖13)。但是用pcr在ptg6:cas9植物中未檢測到grna1和grna2靶位點之間的染色體片段缺失,其在再生的愈傷組織/植物中可以比在原生質體中更低的頻率發(fā)生。盡管如此,結果顯示出ptg6不僅同時表達兩種grna,還在個體靶處比sgrna增強了誘變效率(studentt-檢驗p<0.01,表1和實施例2,圖12和13)。當靶的總數在ptg7:cas9植物中增加至4個的時候,在grna1位點處觀測到了與sgrna1:cas9植物相當的插入/缺失頻率,但是在grna2位點處發(fā)現了比sgrna2:cas9顯著更高的插入/缺失頻率(表1和實施例2,圖14)。有趣的是,我們獲得了一個ptg7:cas9株系(6%),其攜帶有在mpk1中~350bp的雙等位基因缺失和在mpk5中~750bp的單等位基因缺失(圖4a和4b)。這促使我們進一步檢驗了ptg9:cas9株系中所有8個grna的效率。在其突變會破壞re位點的5個grna靶(grna1/2/3/5/7)處,50%(n=14)的ptg9:cas9t0株系在所有5個靶處攜帶有雙等位基因突變(實施例2,圖15)。有趣的是,pcr/re測定表明這5個grna展現出相當的效率,并且它們所有的都顯示出了比我們在sgrna1/2:cas9株系中觀察到的顯著更高的誘變活性(表1)。對來自ptg9:cas9植物的4個mpk基因座的片段進行的sanger測序確認了突變被引入至所有8個位點(實施例2,圖16)。然而,僅在兩個ptg9:cas9株系中的mpk2和mpk5基因座處檢測到片段缺失(實施例2,圖15)。與原生質體相比,成對的grna/cas9切割位點之間靶向的染色體片段缺失的效率在轉基因植物中較低,這可能是由于grna和cas9在水稻愈傷組織/再生的植物中相對較低的表達(在土壤桿菌介導的轉化之后通常僅有單拷貝的轉基因被整合至水稻基因組中)。我們的數據證明了ptg方法不僅增加了grna數目和靶向位點,還可能在個體位點增強誘變效率,尤其是當使用ptg表達多個grna的時候。為了進一步證實用ptg/cas9進行的誘變的高效率,我們合成了具有兩個grna(grna9和grna10)的ptg10,以靶向水稻八氫番茄紅素去飽和酶(pds)基因(實施例2,圖13a)。pds經常被用作便捷的基因靶來檢驗敲除效率,因為具有功能性pds的植物會導致可見的光致褪色的表型。引人注目的是,從愈傷組織再生的所有ptg10:cas9轉基因幼苗(t0代,n=15)都顯示出光致褪色表型,并且其中的13株是完全白化的,表明這些植物沒有攜帶功能性的pds(圖4c)。雖然我們僅僅鑒定了在兩個grna靶向的位點之間攜帶有染色體缺失的一個株系,對來自所述株系pds靶的測序確認了插入/缺失被引入至靶位點處(實施例2,圖13)。通過將這些數據與此前報道的sgrna/cas9系統(tǒng)的效率(9,11,29-32)進行比較,就我們所知,ptg/cas9手段產生了在植物中靶向誘變的最高效率(高達100%,圖4和表1)。我們的結果也證明了用ptg用兩個grna靶向一個基因,將會大大提高完整基因敲除的效率。討論我們開發(fā)了一般性的策略和平臺,以通過操控內源trna加工系統(tǒng)而從單一的合成ptg基因產生多個grna(圖1)。我們還提供了框架來設計、合成和利用ptg來用cas9進行多元基因組編輯。這些ptg用poliii啟動子(例如u3p)以與sgrna基因相同的方式表達,但是卻并不必需要以特定的核苷酸起始(圖2)。結果,目前用于表達sgrna的crispr/cas9載體可以直接用于表達多元基因組編輯的ptg,如我們在此研究中證明的那樣。通過從單一多順反子基因產生多個grna,ptg技術可以用于改善多個基因組基因座的同時誘變或短染色體片段的缺失(圖3和4)。此種基因組工程手段可以導致同時敲除多個蛋白編碼基因、或非編碼rna區(qū)和其它遺傳元件的缺失。在靶向誘變/缺失之外,所述ptg手段可以促進其它基于cas9的應用(其中需要多個grna)。例如,ptg可以用于以cas9切口酶來改善靶向可靠性(13,33,34),或者以失活的cas9轉錄激活劑或抑制劑來操縱多個基因表達(35,36)。考慮到我們觀測到的rnasep和rnasez的高加工準確性和能力(圖2),trna加工系統(tǒng)也可以用作一般性的平臺來從單一的合成基因產生其它調節(jié)性rna(例如短發(fā)夾rna或人工微rna)。這些不同類別的調節(jié)性rna,如grna和短發(fā)夾rna,也可以被壓至單一的多順反子基因中以開發(fā)更加精密的設備用于遺傳工程。近來,融合了具有28ntrna的grna(稱作grna-28nt)的多順反子轉錄物被成功地用于在人了細胞中引導cas9靶向高達4個靶(12,13)。具有grna-28nt架構的合成基因產生了具有28nt附加3’序列的成熟grna,并且還需要共表達來自綠膿假單胞菌(pseudomonasaeruginosa)的內切核酸酶csy4以切割轉錄物。與grna-28nt策略相比,我們的手段利用有力的內源trna加工系統(tǒng),其使得可以精準產生僅具有在grna3’末端1-4nt的附加序列的grna(圖1和2),并且不會給受體帶來內切核酸酶csy4毒性的額外風險??紤]到具有可變序列的trna基因的極大數目以及rnasep和rnasez精準識別具有類trna結構的rna底物這一情況(18,37),有許多trna序列的選擇來嵌入ptg中。另外,trna加工系統(tǒng)在所有活生物體中是通用的,因而ptg技術可以直接調適用于其它生物體進行cas9-介導的基因組工程。當通過ptg/cas9在水稻植物中產生多個dsb時,易錯nhej修復所導致的插入缺失比直接連接兩個dsb所產生的片段缺失更加頻繁地發(fā)生(實施例2,圖14和15)。目前,兩個dsb直接連接在一起在體內產生染色體易位或片段缺失的分子機制大多都還不清楚。我們推測導致此種染色體異常的過程可能以同樣的時間間隔來需要兩個dsb,并且可能通過grna/cas9切割和內源dna修復之間的高度動態(tài)相互作用、以及還通過dsb之間的距離來確定。由于grna和cas9的遞送、表達和活性的差異,因而在原生質體(圖3b)和穩(wěn)定的轉基因植物之間以及在不同的ptg轉基因株系中發(fā)現片段缺失頻率的一些出入并不是出乎意料的(圖4a和實施例2,圖13-15)。因為ptg技術使得能夠在基因組dna中產生許多dsb,其可以提供有效的工具來輔助剖析染色體缺失的分子過程。更重要的是,所述ptg技術顯著改善多元編輯能力和效率,并且預期會有助于更加復雜的cas9應用,如冗余基因或基因元件的靶向誘變和缺失、多個基因和通路的轉錄調節(jié)、許多基因組位點的修飾和標記、位點特異性整合和基因置換。材料和方法植物材料水稻(oryzasatival.ssp)kitaake和nipponbare栽培種用于此研究。水稻植物在溫室或生長箱中以28℃白天/23℃夜晚(且12h的光照)進行種植。質粒載體構建質粒載體prge32用于在水稻原生質體中瞬時表達u3p:sgrna或u3p:ptg(與ubip:cas9一起),而prgeb32用于土壤桿菌-介導的水稻轉化(實施例2,圖6)。對于質粒載體構建的細節(jié),參見實施例2,si方法。sgrna:cas9和ptg:cas9表達構建體u3p:sgrna1和u3p:sgrna2構建體如此前所述進行制備(24)。用于grna3-grna8的具體間隔區(qū)序列(實施例2,表2.3),是使用萬維網genome.arizona.edu\crispr\的crispr-plant數據庫進行選擇的(38)。ptg基因和u3p:ptg構建體如實施例2,si方法中所述產生,圖10-11和表2.3。所合成的ptg被插入至bsai消化的prge32或prgeb32中,以分別用于瞬時原生質體表達或穩(wěn)定的水稻轉化。此研究中使用的sgrna1、sgrna2和ptg基因的序列在實施例2,表2.1中列出。水稻原生質體轉染水稻原生質體的制備和轉染如此前所述那樣進行(24)。簡言之,20μg的質粒dna被用于以~40%-50%的轉染效率轉染2×105原生質體。在轉染后36h從原生質體樣品提取總水稻基因組dna,并繼而用于pcr和序列分析。土壤桿菌介導的水稻轉化根據常規(guī)方案,通過根瘤土壤桿菌-介導的轉化使用水稻成熟種子衍生的愈傷組織來產生轉基因水稻植物(39)?;蚪Mdna提取和pcr/re測定如此前所述用ctab方法提取水稻基因組dna(24)。為了在期望的位點檢測誘變,以特定的引物使用gotaqdna聚合酶(promega)擴增靶向區(qū)(對于引物序列參見實施例2,表2.2)。pcr產物在1%的瓊脂糖凝膠中分離并用溴化乙錠染色以檢測染色體片段缺失。為了用pcr/re在特定的位點檢測插入/缺失,將涵蓋靶位點的pcr產物用適宜的限制性酶(re)消化5小時,并繼而用1%瓊脂糖凝膠電泳和溴化乙錠染色進行分析。經染色的凝膠使用geldocxrs系統(tǒng)(bio-rad)成像,并用quantityone4.6程序(bio-rad)來進行定量。將經過選擇的pcr產物克隆至pgemt-easy載體(promega)用于dna測序。rna提取,crt-pcr和定量pcr細節(jié)參見實施例2,si方法。genebank中的基因登錄號基因以及它們的genebankrefseq登錄號如下:mpk1,os06g0154500;mpk2,os08g0157000;mpk5,os03g0285800;mpk6,os10g0533600;ubi,os02g0161900;和pds,os03g0184000。文獻1.jinekm,etal.(2012)aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.science337(6096):816-821.2.congl,etal.(2013)multiplexgenomeengineeringusingcrispr/cassystems.science339(6121):819-823.3.malip,etal.(2013)rna-guidedhumangenomeengineeringviacas9.science339(6121):823-826.4.malip,esveltkm,churchgm(2013)cas9asaversatiletoolforengineeringbiology.natmethods10(10):957-963.5.sanderjd,joungjk(2014)crispr-cassystemsforediting,regulatingandtargetinggenomes.natbiotechnol32(4):347-355.6.hsupd,landeres,zhangf(2014)developmentandapplicationsofcrispr-cas9forgenomeengineering.cell157(6):1262-1278.7.wangh,etal.(2013)one-stepgenerationofmicecarryingmutationsinmultiplegenesbycrispr/cas-mediatedgenomeengineering.cell153(4):910-918.8.jinekm,etal.(2013)rna-programmedgenomeeditinginhumancells.elife2:e00471.9.lijf,etal.(2013)multiplexandhomologousrecombination-mediatedgenomeeditinginarabidopsisandnicotianabenthamianausingguidernaandcas9.natbiotechnol31(8):688-691.10.zhouh,liub,weeksdp,spaldingmh,yangb(2014)largechromosomaldeletionsandheritablesmallgeneticchangesinducedbycrispr/cas9inrice.nucleicacidsresearch42(17):10903-10914.11.shanq,etal.(2013)targetedgenomemodificationofcropplantsusingacrispr-cassystem.natbiotechnol31(8):686-688.12.nissiml,perlisd,fridkina,perez-pinerap,lutk(2014)multiplexedandprogrammableregulationofgenenetworkswithanintegratedrnaandcrispr/castoolkitinhumancells.molcell54(4):698-710.13.tsaisq,etal.(2014)dimericcrisprrna-guidedfokinucleasesforhighlyspecificgenomeediting.natbiotechnol32(6):569-576.14.phizickyem,hopperak(2010)trnabiologychargestothefront.genesdev24(17):1832-1860.15.schiffers,roschs,marchfeldera(2002)assigningafunctiontoaconservedgroupofproteins:thetrna3'-processingenzymes.emboj21(11):2769-2777.16.gutmannb,goberta,giegep(2012)prorpproteinssupportrnasepactivityinbothorganellesandthenucleusinarabidopsis.genesdev26(10):1022-1027.17.barbeziern,etal.(2009)processingofadicistronictrna-snornaprecursor:combinedanalysisinvitroandinvivorevealsalternatepathwaysandcouplingtoassemblyofsnornp.plantphysiol150(3):1598-1610.18.caninog,etal.(2009)arabidopsisencodesfourtrnasezenzymes.plantphysiol150(3):1494-1502.19.kruszkak,etal.(2003)plantdicistronictrna-snornagenes:anewmodeofexpressionofthesmallnucleolarrnasprocessedbyrnasez.emboj22(3):621-632.20.nakajiman,ozekih,shimuray(1981)organizationandstructureofane.colitrnaoperoncontainingseventrnagenes.cell23(1):239-249.21.nakaarv,dareao,hongd,ullue,tschudic(1994)upstreamtrnagenesareessentialforexpressionofsmallnuclearandcytoplasmicrnagenesintrypanosomes.molcellbiol14(10):6736-6742.22.whiterj(2011)transcriptionbyrnapolymeraseiii:morecomplexthanwethought.natrevgenet12(7):459-463.23.diecig,fiorinog,castelnuovom,teichmannm,paganoa(2007)theexpandingrnapolymeraseiiitranscriptome.trendsgenet23(12):614-622.24.xiek,yangy(2013)rna-guidedgenomeeditinginplantsusingacrispr-cassystem.molplant6(6):1975-1983.25.chanpp,lowetm(2009)gtrnadb:adatabaseoftransferrnagenesdetectedingenomicsequence.nucleicacidsres37(databaseissue):d93-97.26.kuhnj,binders(2002)rt-pcranalysisof5'to3'-end-ligatedmrnasidentifiestheextremitiesofcox2transcriptsinpeamitochondria.nucleicacidsres30(2):439-446.27.yokoboris,paabos(1995)transferrnaeditinginlandsnailmitochondria.procnatlacadsciusa92(22):10432-10435.28.englerc,kandziar,marillonnets(2008)aonepot,onestep,precisioncloningmethodwithhighthroughputcapability.plosone3(11):e3647.29.nekrasovv,staskawiczb,weigeld,jonesjd,kamouns(2013)targetedmutagenesisinthemodelplantnicotianabenthamianausingcas9rna-guidedendonuclease.natbiotechnol31(8):691-693.30.fengz,etal.(2014)multigenerationanalysisrevealstheinheritance,specificity,andpatternsofcrispr/cas-inducedgenemodificationsinarabidopsis.procnatlacadsciusa111(12):4632-4637.31.wangy,etal.(2014)simultaneouseditingofthreehomoeoallelesinhexaploidbreadwheatconfersheritableresistancetopowderymildew.natbiotechnol32(9):947-951.32.zhangh,etal.(2014)thecrispr/cas9systemproducesspecificandhomozygoustargetedgeneeditinginriceinonegeneration.plantbiotechnolj12(6):797-807.33.ranfa,etal.(2013)doublenickingbyrna-guidedcrisprcas9forenhancedgenomeeditingspecificity.cell154(6):1380-1389.34.guilingerjp,thompsondb,liudr(2014)fusionofcatalyticallyinactivecas9tofokinucleaseimprovesthespecificityofgenomemodification.natbiotechnol32(6):577-582.35.gilbertla,etal.(2013)crispr-mediatedmodularrna-guidedregulationoftranscriptionineukaryotes.cell154(2):442-451.36.malip,etal.(2013)cas9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.natbiotechnol31(9):833-838.37.forsterac,altmans(1990)externalguidesequencesforanrnaenzyme.science249(4970):783-786.38.xiek,zhangj,yangy(2014)genome-widepredictionofhighlyspecificguidernaspacersforcrispr-cas9-mediatedgenomeeditinginmodelplantsandmajorcrops.molplant7(5):923-926.39.hieiy,komarit(2008)agrobacterium-mediatedtransformationofriceusingimmatureembryosorcalliinducedfrommatureseed.natprotoc3(5):824-834.表1.ptg:cas9對比sgrna:cas9植物中的定向突變效率對于在轉基因株系中靶向位點處的突變(mut.)和雙等位基因突變(bi-mut.)的頻率進行了檢驗,并基于pcr/re測定進行了計算(實施例2,圖s8-s11)。在sgrna和ptg植物之間比較了grna1和grna2靶處的編輯頻率。**,studentt-檢驗p<0.01;*,studentt-檢驗p<0.05;n.a.,不適用。實施例2支持信息質粒載體的構建為了構建prge32,用特定的引物對(ubi-f和ubi-r,引物序列參見表s2),從nipponbare栽培變種的基因組dna擴增水稻ubip片段。在用引物ugw-u3-f和ugw-grna-r從prge31(addgene質粒50929)擴增u3p-grna片段之后,用引物ugw-u3-f和ubi-r通過重疊延伸pcr將u3p-grna和ubip片段連接在一起。繼而通過gibsoncloning(newenglandbiolabs)構建了prge32,以用u3p-grna-ubip取代prge31中的u3p-grna-35s片段。用于土壤桿菌介導的水稻轉化的prgeb32雙元載體(載體圖譜參見圖6),是通過用gibsoncloning(newenglandbiolabs)將來自prge32的u3p-grna-ubip-cas9片段插入至pcambia1301-bsai來創(chuàng)建的。所述pcambia1300-bsai是通過定點誘變去除所有的bsai位點之后而衍生自pcambia1300的。質粒構建中使用的引物在表2.2中列出。此研究中,使用含有grna-trna融合片段的pgtr質粒,作為模板來合成ptg。為了構建pgtr,通過pcr使用特定的引物對(bsa-grna-f和grna-r)來擴增grna支架片段,而trnagly片段被擴增為g-trna-f和trna-r的引物二聚體。繼而使用引物bsa-grna-f和trna-r通過重疊延伸pcr,將這兩個片段融合為grna-trna。重疊pcr產物從瓊脂糖凝膠中分離并純化,并繼而被插入至pgem-teasy(promega)來產生pgtr質粒。pgtr中grna-trna融合的序列在表s1中示出。質粒構建中使用的引物在表2.2中列出。rna提取、crt-pcr和定量pcr使用trizolreagent(lifetechnologies)根據廠商指引從原生質體提取總rna。crt-pcr在圖7中有示意性的圖示,并如下進行。為了將rna環(huán)化,將1μg的總rna在20μl的反應中進行溫育,所述反應含有1×t4rna連接酶緩沖劑(newenglandbiolabs)、50μmofatp、10%peg8000、20u的rnase抑制劑(newenglandbiolabs)和10u的t4rna連接酶(newenglandbiolabs)。連接在25℃進行4h。繼而將10u的dnasei(newenglandbiolabs)添加至連接反應,以在25℃去除基因組dna污染物20min。繼而用trizolreagent(lifetechnologies)將環(huán)化的rna純化,并溶解于無核酸酶得水中。將總共200ng環(huán)化的rna與0.5mm的dntp和1μm的特異于grna間隔區(qū)的寡核苷酸(grna1-r和grna2-r,參見表s2)混合,并在70℃變性5min。在冰上冷卻后,添加1×mumlv逆轉錄酶緩沖液、20u的rnase抑制劑(newenglandbiolabs)、和10u的mumlv逆轉錄酶(newenglandbiolabs),以在42℃合成1stcdna達1小時。也對所有樣品進行了沒有添加mumlv逆轉錄酶的陰性對照(-rt)。在逆轉錄之后,將mumlv在70℃失活10min。繼而用以下的50μl反應進行pcr:二十分之一的1stcdna、1×phusionhf緩沖液、0.2mmdntp、0.5μm的正向引物、0.5μm的反向引物、和1u的phusiondna聚合酶(thermoscientific)。所得的pcr產物用2%的瓊脂糖凝膠電泳進行分析。繼而在克隆至pgem-teasy載體(promega)中之后,將crt-pcr產物測序。用于crt-pcr的引物序列參見表2.2。對于定量rt-pcr,使用特定的引物grna-r與mumlv(newenglandbiolabs)一起,依照廠商指引,將經過dnasei處理的總rna逆轉錄,以產生cdna。使用gotaqqpcrmastermix(promega)在steponeplusrealtimepcr系統(tǒng)(lifetechnologies)中,進行了實時pcr。grna1-f和grna-r引物用于sgrna1和ptg1,而grna2-f和grna-r引物用于sgrna2和ptg2。水稻ubi基因用作內部參考以用于相對定量。引物序列參見表s2。為了對缺失效率進行定量,使用10ng的基因組dna作為模板來進行定量pcr,以在mpk5或ubi基因座內擴增片段。涵蓋grna2切割位點的特定的引物對(mpk5-qf和mpk5-r611,表s2)用于擴增mpk5不含有片段缺失的拷貝(圖s1a)。使用ubi作為參考基因,對不具有缺失的mpk5片段的相對量(rq)進行了計算。因為只有不具有缺失的mpk5片段被擴增,片段缺失的效率可以估算為100%-rq(表2.4)。通過goldengate拼裝來合成多順反子trna-grna(ptg)基因基于goldengate(gg)拼裝原理合成了ptg基因,所述goldengate(gg)拼裝原理廣泛用于拼裝dna的部分,如定制化的轉錄激活子樣效應因子(tale)。我們的拼裝手段使得可以使用相同的成分以grna的不同組合來合成ptg。例如,我們用相同組的寡聚物引物(表s3)制備了ptg3-ptg9。通過分等級的gg拼裝反應,可以將ptg拼裝在一起,以創(chuàng)建較長的ptg(如ptg9)。具有不超過6個grna的ptg(例如ptg1-ptg8)可以通過一步gg拼裝(1級,圖10)來合成,而具有超過6個grna的ptg(例如,ptg9)則需要兩個或更多個gg拼裝步驟(2級,圖11)。ptg合成手段的示意圖在圖10和11中示出,而引物設計、gg拼裝和質粒構建的細節(jié)在下文中描述。步驟1.設計引物來擴增grna-trna部分為了將多個dna部分以期望的順序連接起來,gg拼裝需要獨特的4-bp懸突以在用bsai(或其它的ii型內切核酸酶如aari、bbsi、bsmai、bsmbi)消化之后連接兩個dna部分。grna間隔區(qū)是ptg中僅有的獨特序列(圖1c),因而ptg應當分為grna間隔區(qū)內的dna部分。如圖10a和10b中所示,將grna間隔區(qū)分為具有4bp重疊兩部分,并且間隔區(qū)的每一半在具有bsai位點的寡聚物引物內合成。設計grna特異性引物的細節(jié)如下所述:1.1.在gg拼裝中,每個grna間隔區(qū)內選擇4-bp長的序列作為bsai懸突。所述懸突可以是grna間隔區(qū)的任何4個連續(xù)的核苷酸。值得注意的是,在相同的gg反應中拼裝的dna部分應當具有獨特的4-bp懸突,并且不可以是5’-ggca-3’或5’-aaac-3’,其在末端銜接子中用于克隆至prge32和prgeb32(圖6)。1.2.如下設計引物序列(也參見圖6):在此實例中,選擇grna[x]的20nt長的間隔區(qū)中第9至第12個核苷酸作為bsai懸突用于gg克隆:5’-n1-n2-n3-n4-n5-n6-n7-n8--n13-n14-n15-n16-n17-n18-n19-n20-3’所述引物應為:grna[x]-f(正向引物,退火至grna支架的5’-末端):5’-ta-ggtctc-n-n13n14n15n16n17n18n19n20-gttttagagctagaa-3’grna[x]-r(反向引物,退火至trna前體的3’-末端):5’-cg-ggtctc-n-n8n7n6n5n4n3n2n1-tgcaccagccggg-3’注意:間隔區(qū)中任何4個連續(xù)的核苷酸都可以被選擇作為用于gg拼裝的懸突。這是的可以對gg拼裝中每個dna部分選擇特定的懸突。兩個5’-端堿基(顯示為小寫)是隨機添加的核苷酸,以增強pcr產物的bsai消化。紅色表示間隔區(qū)的反向互補序列。在3’-末端的小寫字母表示退火至grna(正向引物)或trna(反向引物)的堿基。步驟2.1級gg拼裝(ptg1-ptg8基因的構建)對于ptg的1級gg拼裝的整體策略參見參見圖s6c。2.1.設定50μl的pcr反應來擴增用于ptg構建的dna部分。pgtr質粒0.1ng5xphusionhf緩沖液10μldntps(10mm)1μl正向引物(10μm)2.5μl反向引物(10μm)2.5μlphusion(2u/μl,neb)0.5μlh2oxμltotal50μl為了構建用于此研究的ptg,擴增1級部分的正向和反向引物如下進行添加:pcr以如下程序運行:2.2.用spincolumnpcr產物purification試劑盒(biobasic)來純化pcr產物。2.3.通過gg拼裝用以下反應將個體部分連接在一起:對于構建ptg1-ptg8的gg拼裝反應,1級部分如下進行添加:2.4.gg反應如下進行,在循環(huán)變溫加熱器(bio-rad)中溫育30-50循環(huán)的:37℃,5min和20℃,10min;并繼而保持在20℃1小時。2.5.將gg反應產物用180μl的h2o稀釋。2.6.在50μlpcr反應中擴增1級gg拼裝產物:pcr在循環(huán)變溫加熱器(bio-rad)中以如下程序運行:2.7.用spincolumnpcrproductpurification試劑盒(biobasic)來純化pcr產物。2.8.用foki(neb)消化純化的pcr產物。2.9.在1%瓊脂糖凝膠中分離foki消化的產物;從凝膠剪切具有期望大小的dna條帶,并繼而用spincolumndnagelextraction試劑盒(biobasic)來對其進行純化。2.10.用t4dna連接酶將foki消化的gg片段連接至bsai消化的prge32或prgeb32載體。2.11.將連接產物轉化至大腸桿菌dh5α,純化重組的質粒并通過sanger測序對構建體進行確認。步驟3.2級gg拼裝(通過兩步gg拼裝構建ptg9)2級gg拼裝的示意圖在圖11中示出。2級gg拼裝用于合成具有超過6個grna的ptg。此種大ptg是通過將兩個較小的ptg(2級parts)連接在一起而構建的。這兩個小ptg是通過1級gg拼裝合成的并且含有一個重疊的grna作為橋接(橋接grna,圖11),以在下一個gg拼裝反應中連接2級部分。為了從1級拼裝的ptg擴增2級部分,需要僅退火至橋接grna間隔區(qū)的特定引物對用于終端銜接子引物的pcr(s5ad5-f和s3ad5-r)。在此研究中,以此手段合成ptg9并且使用grna7作為橋接grna。3.1.設計橋接grna間隔區(qū)-特異性引物來擴增2級部分。橋接grna間隔區(qū):5’-n1-n2-n3-n4-n5-n6-n7-n8-n13-n14-n15-n16-n17-n18-n19-n20-3’任何連續(xù)的4-bp可以選擇作為用于gg拼裝的懸突。在此實例中,選擇n9-n10-n11-n12作為懸突。ln-gr[x]-f(正向引物,僅退火至橋接grna間隔區(qū)):5’-ta-ggtctc-nn13n14n15n16n17n18n19n20-3’ln-gr[x]-r(反向引物,僅退火至橋接grna間隔區(qū)):5’-cg-ggtctc-n-n8n7n6n5n4n3n2n1-3’注意:兩個5’-端堿基(顯示為小寫)是隨機添加的核苷酸,以增強pcr產物的bsai消化。紅色表示間隔區(qū)的反向互補序列。3.2.用從2.1-2.2產生的以下1級部分設定gg反應:以與步驟2.4-2.5相同的方式進行1級拼裝。3.3.用以下引物和模板擴增2級dna部分:pct條件與步驟2.6相同3.4.在1%瓊脂糖凝膠中分離pcr產物;從凝膠剪切具有期望大小的dna條帶,并繼而用spincolumndnagelextraction試劑盒(biobasic)來對其進行純化。3.5.設定gg拼裝反應將兩個dna部分(l2-p1和l2-p2)連接在一起。3.6.在循環(huán)變溫加熱器(bio-rad)中使用以下程序來進行pcr:25個循環(huán)的:37℃,5min;20℃,10min;和20℃進行1小時。3.7.擴增用s5ad5-f和s3ad5-r拼裝的2級gg,繼而使用與步驟2.6-2.11相同的程序將擴增的產物插入至prge32或prgeb32中。實施例2表格表2.1此研究中所使用的合成基因的序列所述序列經如下標注:u3p(seqidno:14的最后10bp:加下劃線grna支架:粗體trna前體(seqidno:13):經框出,粗斜體grna間隔區(qū):斜體poliii終止子(tttt..t):灰色背景表2.2用于質粒構建、crt-pcr、和基因分型的引物表2.3用于合成ptg基因的寡核苷酸a經框出的字母表示goldengate拼裝中的懸突序列。b前兩個字母是隨機添加的核苷酸。斜粗體序列表示bsai位點(5’-ggtctcn-3’,n表示任何核苷酸),加下劃線的序列是grna間隔區(qū)的部分,而粗體加下劃線的序列是bsai消化之后的懸突。關于引物設計和ptg拼裝的細節(jié)參見si方法。小寫字母的序列是特異于grna支架(5’-gttttagagctagaa-3’,正向引物中)或trna(5’-tgcaccagccggg-3’,反向引物中)。表2.4.通過qpcr對水稻原生質體中mpk5基因座處染色體片段缺失頻率進行確定使用基因組dna作為模板以及涵蓋mpk5內grna2切割位點的特定引物對,以qpcr來評估在mpk5基因座處的片段缺失效率(圖s1a)。因為具有片段缺失的mpk5基因座將會被擴增,缺失(del.)效率可以估算為100%-rq。使用圖3b中的基因組dna,并且ubi基因作為參考用于相對定量。ct,閾值循環(huán);sd,標準偏差;rq,相對定量;rq-min和rq-max表示rq的95%的置信區(qū)間。實施例3多順反子的trna和crispr引導rna使得能夠在人類細胞中進行高效率的多元化基因組工程在過去的三年期間,規(guī)律成簇的間隔短回文重復序列(crispr)和crispr-相關的蛋白核酸酶已經成為在許多生物體中進行基因組編輯的最有力工具(1-4)。用于基因組編輯的最常用的cas內切核酸酶是釀膿鏈球菌cas9(下文稱為cas9)。該cas9蛋白由人工短引導rna(grna)引導以切割dna,所述dna其序列與grna的5’-末端互補并且其之前為前間區(qū)序列鄰近基序(pam,5’-ngg-3’)(5-7)。此種簡單的由rna引導的dna靶向系統(tǒng)從根本上增強了我們對用于遺傳操縱的特定基因組位點進行評估的能力。所述crispr-cas9系統(tǒng)已經過改造以用于靶向誘變、dna片段的位點特異性整合、以及染色體的精準操縱如大區(qū)段的缺失和易位等。核酸酶缺陷型cas9(dcas9)和grna也經過改造,以在體內控制所靶向的基因的表達(8-11)以及對染色體具體基因座的標記(12)。這些基于cas9的工具在各種醫(yī)療和農業(yè)領域大大地促進了基礎研究以及生物技術的實施。有力地且有效的cas9-介導的基因組工程需要在體內對cas9和grna的表達進行控制。cas9的表達可以容易地且精準地用dna聚合酶ii啟動子來進行控制,而作為小的非編碼rna的grna的有效表達,依然是瓶頸。特別是,許多基于cas9的應用需要多個grna的同時表達。例如,需要一對grna來編輯cas9切口酶中的一個位點(13,14),并且dcas9-foki(15,16)介導的基因組編輯有助于降低與原本的crispr-cas9系統(tǒng)相關聯的脫靶風險。在dcas9介導的轉錄調節(jié)中,需要多個grna以用于有力的基因激活或抑制,或者產生精密的轉錄線路裝備(10,17,18)。一般而言,grna表達受聚合酶iii啟動子驅動,如廣泛使用的snornau3和u6基因啟動子。然而,這些poliii啟動子從特定核苷酸開始轉錄grna酸。例如,u3啟動子從“a”轉錄而u6啟動子以“g”起始轉錄物。這限制了cas9-grna的靶向間隔區(qū)。因此,需要更有力的grna表達策略來加強crispr-cas9工具的能力。近來,我們證明了內源轉運rna(trna)加工系統(tǒng)可以經過改造,以加強cas9多元靶向能力(19)。多個grna從人工多順反子的-trna-grna(ptg)基因串聯表達。內源rnasep和z識別trna并精準切割ptg以釋放trna和grna。此系統(tǒng)不僅使得能夠同時表達許多grna,還增強了poliii轉錄,因為trna也作用為內部增強子或啟動子。ptg系統(tǒng)在植物中實施,但是我們推測其會在所有生物體中發(fā)揮功能,因為trna加工系統(tǒng)在所有生物體中是高度保守的。在此研究中,我們將cas9-ptg技術針對人類基因組編輯進行了調適。使ptg基因同時表達2至6個grna以用于對1至4個組蛋白去乙?;?hdac)基因進行精準的基因組編輯。我們的研究證明trna系統(tǒng)可以被改造為通用的工具以用于在人類和動物系統(tǒng)中進行有效的和多元的基因組編輯。材料和方法質粒載體構建為了構建psicor-sgrna-mcherry-cas9載體,將psico-ef1-mch-puro(addgene質粒31845)(20)中的嘌呤霉素片段于來自px260(addgene質粒42229)的nls-cas9-nls片段融合。繼而將具有克隆位點(含由兩個bbsi位點)的grna支架插入至u6啟動子的下游。psico-sgrna-mcherry-cas9載體的示意圖在圖18中顯示。ptg基因的拼裝為了在人類細胞中編輯hdac基因(hdac1/2/3/4/6),基于pam的存在和前間區(qū)序列特異性,對每個基因選擇了由250-500bp分開的一對靶位點(表3.1)。使用合成的寡核苷酸(表3.3)在體外拼裝了總共7個ptg基因(hptg1至hptg7,表3.2)。hptg基因的體外合成如此前所述那樣進行(19)。細胞培養(yǎng)物和轉染將人胚胎腎293(hek293)細胞在具有10%胎牛血清(atlantabiologicals)、10單位/ml青霉素和10μg/ml鏈霉素(gibco)的dmem(sigma)中進行培養(yǎng)。每2天更換培養(yǎng)基,并在細胞達到80%至90%鋪滿時進行亞培養(yǎng)。為進行轉染,在6孔平板中以每孔3x105細胞來培養(yǎng)hek293細胞。在達到70%鋪滿之后,用質粒和聚乙烯亞胺(pei)來轉染細胞。簡言之,在轉染前一小時用新鮮培養(yǎng)基培養(yǎng)細胞。接著,將3μg的質粒dna和12μg的pei添加至每孔。將經轉染的細胞在co2溫育箱內溫育5小時,并用新鮮培養(yǎng)基再培養(yǎng)48小時。crt-pcr和定量rt-pcr用trizolreagent(lifetechnologies)從hek293細胞提取總rna并用dnasei(newenglandlabs)進行處理。為了擴增grna,如此前所述進行了crt-pcr。簡言之,總rna用t4rna連接酶(newenglandlabs)進行了自身連接,并繼而用trizolreagent進行了純化。使用grna特異性的引物和mmlv逆轉錄酶(newenglandlabs)來將連接的總rna逆轉錄。使用特異性引物(序列參見表3.3)擴增cdna并將其克隆至pgem-teasy(promega)中用于進行sanger測序。dna提取和pcr用磷酸緩沖鹽水洗滌經轉染的細胞,并在溶解緩沖液(10mmtrisph8.0,100mmnacl和10mmedta)中進行了溶解,繼而用異丙醇將基因組dna沉淀。為了檢測每個基因內兩個靶位點之間的片段缺失,對每個hdac基因設計了涵蓋靶位點的pcr引物(表s2)。在含有800ng基因組dna、0.2mmdntp、0.4um引物、1xpcr緩沖劑和1單位dreamtaqdna聚合酶(thermofisherscientific)的反應中,進行了pcr擴增。pcr產物在含有溴化乙錠的1.5%瓊脂糖凝膠中進行分離,以檢測染色體片段缺失。用imagej(http://rsb.info.nih.gov/ij/)評估片段缺失效率。另外,將pcr片段克隆至pgem-teasy(promega)中用于進行sanger測序。結果和討論ptg使得能夠在人類細胞中有效產生多個grna我們此前證明了具有串聯排列trna-grna的ptg不僅使得能夠對多個grna進行精準加工和高效制備,還使得cas9能夠在植物中同時靶向多個基因組位點。我們推測ptg基因應當也加強crispr/cas9在動物中的靶向效率,因為trna和其加工系統(tǒng)在所有生物體中是高度保守的。為了證明在動物系統(tǒng)中ptg用于基因組編輯的用途,我們首先檢驗了在人類細胞中grna從hptg1和hptg2轉基因的剪切準確性。每個人工ptg基因編碼兩個grna。hptg1表達hdac1-sg1和hdac2-sg2,而hptg2表達hdac2-sg1和hdac2-sg2(表3.2)。在hptg1和hptg2構建體轉染至hek293細胞內之后,進行了crt-pcr以對成熟grna的5’和3’末端作圖。在crt-pcr中檢測到單一grna具有預期大小的預測cdna產物(~96nt),盡管有一些非特異性擴增的產物存在。(圖19a)。如圖19a和19c中所示,對這些cdna產物進行的dna測序表明,從hptg基因精準地加工了具有期望的5’-末端(含有靶向引導序列)的成熟grna。如我們此前在植物中觀測的那樣,衍生自ptg的grna,如果其在trna之前的話則在3’-末端具有兩個額外的核苷酸(5’-aa-3’),或如果其在poliii終止子之前的話則具有兩個額外的t。我們還在成熟hdac2-sg2的3’-末端檢測到了推定的多腺苷酸。這些結果表明ptg基因可以由人類trna加工系統(tǒng)進行加工,以產生多個grna。cas9-ptg使得在人類細胞中能夠進行多元基因組編輯為了檢驗用于多元基因組編輯的ptg方法的效率,我們用7個表達不同hptg基因和cas9的質粒構建體來轉染人類細胞。這些hptg基因編碼多個grna,所述grna靶向位于不同染色體中的5個hdac基因。hptg1至hptg5用于對hdac1、2、3、4、和6內的每個基因靶向兩個基因組位點;而hptg6和hptg7設計為分別同時靶向hdac3和2(表3.2)。因為我們使用了兩個grna來編輯一個基因,可以通過測量每個靶向基因內染色體片段缺失的頻率來確定cas9-ptg的效率。如所預測的那樣,在所有樣品中檢測到截短的pcr擴增子(圖20)。dna序列分析進一步確認了這些染色體缺失是通過cas9-ptg引入至經轉染細胞中的(圖21)?;赿na條帶強度的計算,兩個grna靶向位點之間的缺失頻率為40-50%。有趣的是,具有變化數目靶的不同hptg基因的效率是相當的。例如,hptg2(2個grna)和hptg6(6個grna)以~40%的頻率從hdac2基因座導致片段缺失,雖然他們在grna數目上有差異。我們的結果證明了ptg方法可以用于不僅在植物中、還在人類細胞中有效地表達多個grna以及同時編輯多個位點。因為ptg策略并不使用多個啟動子和終止子,因而起大大降低了grna構建體的大小。結果,其對于各種基因編輯目的(如病毒介導的用于人類基因療法的多個grna的遞送)而言更加適宜和有效。參考文獻1.doudna,j.a.andcharpentier,e.(2014)genomeediting.thenewfrontierofgenomeengineeringwithcrispr-cas9.science,346,1258096.2.hsu,p.d.,lander,e.s.andzhang,f.(2014)developmentandapplicationsofcrispr-cas9forgenomeengineering.cell,157,1262-1278.3.sander,j.d.andjoung,j.k.(2014)crispr-cassystemsforediting,regulatingandtargetinggenomes.nat.biotechnol.,32,347-355.4.mali,p.,esvelt,k.m.andchurch,g.m.(2013)cas9asaversatiletoolforengineeringbiology.nat.methods,10,957-963.5.jinek,m.,chylinski,k.,fonfara,i.,hauer,m.,doudna,j.a.andcharpentier,e.(2012)aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.science,337,816-821.6.mali,p.,yang,l.,esvelt,k.m.,aach,j.,guell,m.,dicarlo,j.e.,norville,j.e.andchurch,g.m.(2013)rna-guidedhumangenomeengineeringviacas9.science,339,823-826.7.cong,l.,ran,f.a.,cox,d.,lin,s.,barretto,r.,habib,n.,hsu,p.d.,wu,x.,jiang,w.,marraffini,l.a.etal.(2013)multiplexgenomeengineeringusingcrispr/cassystems.science,339,819-823.8.gilbert,l.a.,larson,m.h.,morsut,l.,liu,z.,brar,g.a.,torres,s.e.,stern-ginossar,n.,brandman,o.,whitehead,e.h.,doudna,j.a.etal.(2013)crispr-mediatedmodularrna-guidedregulationoftranscriptionineukaryotes.cell,154,442-451.9.qi,l.s.,larson,m.h.,gilbert,l.a.,doudna,j.a.,weissman,j.s.,arkin,a.p.andlim,w.a.(2013)repurposingcrisprasanrna-guidedplatformforsequence-specificcontrolofgeneexpression.cell,152,1173-1183.10.cheng,a.w.,wang,h.,yang,h.,shi,l.,katz,y.,theunissen,t.w.,rangarajan,s.,shivalila,c.s.,dadon,d.b.andjaenisch,r.(2013)multiplexedactivationofendogenousgenesbycrispr-on,anrna-guidedtranscriptionalactivatorsystem.cellres.,23,1163-1171.11.mali,p.,aach,j.,stranges,p.b.,esvelt,k.m.,moosburner,m.,kosuri,s.,yang,l.andchurch,g.m.(2013)cas9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.nat.biotechnol.,31,833-838.12.chen,b.,gilbert,l.a.,cimini,b.a.,schnitzbauer,j.,zhang,w.,li,g.w.,park,j.,blackburn,e.h.,weissman,j.s.,qi,l.s.etal.(2013)dynamicimagingofgenomiclociinlivinghumancellsbyanoptimizedcrispr/cassystem.cell,155,1479-1491.13.ran,f.a.,hsu,p.d.,lin,c.y.,gootenberg,j.s.,konermann,s.,trevino,a.e.,scott,d.a.,inoue,a.,matoba,s.,zhang,y.etal.(2013)doublenickingbyrna-guidedcrisprcas9forenhancedgenomeeditingspecificity.cell,154,1380-1389.14.shen,b.,zhang,w.,zhang,j.,zhou,j.,wang,j.,chen,l.,wang,l.,hodgkins,a.,iyer,v.,huang,x.etal.(2014)efficientgenomemodificationbycrispr-cas9nickasewithminimaloff-targeteffects.nat.methods,11,399-402.15.tsai,s.q.,wyvekens,n.,khayter,c.,foden,j.a.,thapar,v.,reyon,d.,goodwin,m.j.,aryee,m.j.andjoung,j.k.(2014)dimericcrisprrna-guidedfokinucleasesforhighlyspecificgenomeediting.nat.biotechnol.,32,569-576.16.guilinger,j.p.,thompson,d.b.andliu,d.r.(2014)fusionofcatalyticallyinactivecas9tofokinucleaseimprovesthespecificityofgenomemodification.nat.biotechnol.,32,577-582.17.maeder,m.l.,linder,s.j.,cascio,v.m.,fu,y.,ho,q.h.andjoung,j.k.(2013)crisprrna-guidedactivationofendogenoushumangenes.nat.methods,10,977-979.18.perez-pinera,p.,kocak,d.d.,vockley,c.m.,adler,a.f.,kabadi,a.m.,polstein,l.r.,thakore,p.i.,glass,k.a.,ousterout,d.g.,leong,k.w.etal.(2013)rna-guidedgeneactivationbycrispr-cas9-basedtranscriptionfactors.nat.methods,10,973-976.19.xie,k.,minkenberg,b.andyang,y.(2015)boostingcrispr/cas9multiplexeditingcapabilitywiththeendogenoustrna-processingsystem.pnas,112,3570-3575.20.salomonis,n.,schlieve,c.r.,pereira,l.,wahlquist,c.,colas,a.,zambon,a.c.,vranizan,k.,spindler,m.j.,pico,a.r.,cline,m.s.etal.(2010)alternativesplicingregulatesmouseembryonicstemcellpluripotencyanddifferentiation.pnas,107,10514-10519.表格和圖注表3.1用于基因組編輯的靶序列表3.2hptg基因的結構表3.3a用于hptg合成的引物表3.3b用于基因分型的引物序列實施例4多個緊密相關水稻基因上通過ptg/cas9介導的基因組編輯所創(chuàng)建的可遺傳突變的表征在此研究中,通過在四個水稻絲裂原相關蛋白激酶(mpk)基因的不同組合創(chuàng)建1至8個突變(效率為66-100%),我們顯示了ptg/cas9對于緊密相關的基因進行突變是有力的工具。ptg/cas9通過自花授粉去除,并且無轉基因t1和t2植株攜帶有所有的8個突變或者染色體缺失。所誘導的突變是得自多個堿基對的缺失或插入以及有時是得自染色體缺失。我們證明了ptg/cas9可靠地產生多個突變,所述突變可以穩(wěn)定地傳播至后代。新的基因組編輯工具近來有希望使給定基因組中的幾乎任何基因成熟?;虻耐蛔兪峭ㄟ^(由細胞所修復的)靶位點誘導的雙鏈斷裂(dsb)來實現的。有缺陷的非同源末端連接(nhej)通路是普遍的dsb修復通路,并且其有缺陷的性質導致了在修復期間核苷酸的插入或缺失(插入缺失)。如果突變阻止或改變了基因的轉錄或翻譯,則這些插入/缺失可引起基因敲除。如果存在與dsb位點具有足夠同源性的供體模板,那么經同源重組來進行更精確地修復理論上是可能的,但是高等植物具有低內在同源性重組率(voytas,2013)。在基因組中實現定點dsb的主要工具是鋅指核酸酶(zfn)、轉錄激活因子樣核酸酶(talen)、以及最近的細菌ii型規(guī)律成簇的間隔短回文重復序列(crispr)和crispr-相關的蛋白9核酸酶(cas9)系統(tǒng)。zfn和talen的靶向能力依賴于蛋白:dna相互作用,因而需要設計新的結合結構域來改變核酸酶的靶位點(voytas,2013)。crispr/cas9系統(tǒng)更加容易進行編排,因為cas9內切核酸酶可以循環(huán)切割不同的靶位點(基于所謂的單一引導rna的rna:dna相互作用)(grna;jinek等人,2012)。grna5’-末端的20個堿基(grna間隔區(qū)),與緊接在前間區(qū)序列鄰近基序(pam,對于釀膿鏈球菌cas9的情形是5’-ngg-3’;jinek等人,2012;cong等人,2013;mali等人,2013)之后的基因組靶dna序列(前間區(qū)序列)互補。crispr/cas9系統(tǒng)已經成功地用于擬南芥、煙草、本氏煙草(n.benthiama)、馬鈴薯、番茄、大豆、甜橙、地錢、玉米、高粱、小麥、和水稻的基因組編輯以敲除基因(brooks等人,2014;cai等人,2015;jia和wang,2014;jiang等人,2013;li等人,2013;miao等人,2013;shan等人,2013;sugano等人,2014;xie和yang,2013)。除了其容易設計之外,crispr/cas9系統(tǒng)可以用于靶向幾乎任何基因。當使用spcas9時,擬南芥中所有轉錄單元的97.1%和水稻中所有轉錄單元的89.6%可以用高度特異性的grna間隔區(qū)來進行靶向(xie等人,2014a)。其余的基因依然可以由對于特異性grna具有不同的pam-要求的cas9變體來進行靶向。crispr/cas9系統(tǒng)的最大優(yōu)勢之一可能是其用于多元基因組編輯的能力。如果若干個grna共表達,那么cas9內切核酸酶理論上可以同時靶向多個靶。這使得研究者能夠靶向多個基因進行敲除以及在單一步驟中創(chuàng)建雙重突變體、三重突變體、或者甚至是十重突變體。然而,大多數多元編輯載體使用若干個grna表達盒,其用自己的poliii啟動子和終止子推動每個grna(li等人,2013;lowder等人,2015;ma等人,2015a)。每個單一grna表達盒具有500至820bp的典型長度,并且使多元基因組編輯在植物中依然是種挑戰(zhàn),因為同時可表達的grna的數目受到載體容量和克隆效率的限制。即使可以疊加超過6個此類表達盒,拼裝依然是低效的且常常失敗(lowder等人,2015)。常見的植物轉化技術通常將基因組編輯裝置作為質粒經原生質體轉染或粒子轟擊來進行遞送,或者是作為t-dna經土壤桿菌來進行遞送。從單一轉錄物而不是多個個體盒表達多個grna是克服此限制的有希望的選擇。通過引入從單一人工基因產生多個grna的多順反子trna-grna基因(ptg),我們此前增強了crispr/cas9基因組編輯的多元能力(圖1;xie等人,2015)。此基因由串聯排列的trna-grna序列(其之前是poliii啟動子以及之后是poliii終止子)組成。所使用的trna序列,如實施例1和2中公開的水稻甘氨酸t(yī)rna前體,已經成功地用于各種生物體,包括用于多元基因組編輯的線蟲(c.elegans)、果蠅和哺乳動物細胞。每個串聯重復序列長度少于180bp(相較于個體盒所需的至少500bp)。每個grna可以含有識別不同靶的獨特的間隔區(qū),使得可以在一次轉化中同時靶向多個基因組位點(圖22)。內源rnasep和rnasez識別trna的二級結構(barbezier等人,2009;canino等人,2009;gutmann等人,2012;phizicky和hopper,2010;schiffer等人,2002),并且在特定位點切割trna以釋放成熟的grna(其引導cas9內切核酸酶至多個特異性的靶)(圖22)。另外,具有ptg的grna的表達可以比用簡單的poliii啟動子表達高出達30倍,可能是因為trna的a-和b-框可以增強ptg初級轉錄物的轉錄(xie等人,2015)。同時突變若干個基因的能力在分析緊密相關的基因(會具有類似或重疊的功能)時尤其有用。研究者目前需要找到可靠的突變體株系,并將其雜交以獲得雙重突變體或更高階的突變體。ptg/cas9技術可以顯著改善緊密相關基因的分析,因為多個基因的高數目可以在單一轉化內被有效地進行靶向。在此研究中,通過在單一、雙重、和四重突變體的組合中(具有高達8個共表達的grna)成功地突變了水稻tey-型絲裂原-相關蛋白激酶(mpk)基因家族的4個成員,我們測試了ptg/cas9創(chuàng)建突變體資源用于研究緊密相關基因的能力。mpk是重要的信號轉導者,其已知在擬南芥中具有部分重疊的功能(beckers等人,2009;pitzschke等人,2009)。我們還顯示出誘導的突變具有高度的多樣性,并且突變和染色體缺失可靠地遺傳至無轉基因的后代。我們在mpk1的實例中發(fā)現必要基因很難進行敲除,因為突變傾向于保留現有的開飯放閱讀框。此研究證明了,使用多元ptg/cas9技術,可以同時對緊密相關的基因進行編輯和突變,并且可以通過穩(wěn)定遺傳獲得無轉基因的、多基因突變體以用于研究復雜的基因家族和基因網絡。結果和討論用ptg/cas9對四個緊密相關的水稻mpk基因的高度有效的靶向我們設計了用于土壤桿菌介導的轉化的基因構建體,以突變單個或組合的水稻中脅迫反應性mpk,并且探索ptg是否能可靠地產生穩(wěn)定的突變,以便剖析緊密相關基因和基因家族的功能(表1)。擬南芥中的直系同源mpk基因在其功能上有重疊,并且在單突變體中彼此部分彌補(asai等人,2002;beckers等人,2009)。攜帶有基因構建體的ptg/cas9被設計為靶向單一的mpk基因或者它們的組合(在雙重和四重突變體中)(表4.1)。ptgb3、ptgb4、ptgb5、和ptgb6攜帶有水稻泛素啟動子(ubip:cas9)推動的cas9以及和水稻u3啟動子(u3p:ptg)推動的ptg,以分別靶向mpk1、mpk2、mpk6、和mpk5,以用于創(chuàng)建單突變體(表4.1)。單突變體的ptg編碼靶向一個基因的兩個grna。另外的構建體,ptgb2,靶向在前間區(qū)序列2(ps2;圖17)處僅具有一個grna的mpk5。ptgb7和ptgb8含有ptg,其中每四個靶向mpk5/mpk1和mpk6/mpk2的grna創(chuàng)建雙重突變體(表4.1)。我們選擇了這些mpk基因對,其中是基于它們在水稻mpk家族中緊密的系統(tǒng)發(fā)生學關系(reyna和yang,2006)。創(chuàng)建水稻mpk基因的雙重突變可能有助于揭示類似的冗余功能性(如此前在擬南芥中所觀測到的那樣)。ptgb9包括了8個grna的ptg,以在單一轉化事件中突變所有4個緊密相關的水稻mpk基因。我們此前的研究確認了水稻原生質體中使用的所有grna的功能性,并確定了ptgb6(mpk5)、ptgb7(mpk5/1)、和ptgb9(mpk5/1/6/2)在經土壤桿菌介導的轉化產生的轉基因水稻植物中的突變效率(86–100%)(xie等人,2015)。在此研究中,我們靶向了mpk1、mpk2、mpk6和mpk6/2以研究我們是否能夠以類似的高百分比的基因組編輯的植物,來突變這些單一的和組合的mpk基因。用ptgb3(mpk1)、ptgb4(mpk2)、和ptgb5(mpk6)轉化每個對經測試的株系產生了100%的基因組編輯效率(表4.1;圖28和29)。然而,當同時靶向mpk6和mpk2時(ptgb8),效率較低,其中mpk6為83%而mpk2基因座為66%(圖30)。我們僅在每個基因兩個靶位點中的一個測試了轉化效率,因為僅有一個前間區(qū)序列提供了用于pcr-re測定的方便的限制性內切酶(re)位點(圖27)。因此,如果所有4個靶位點都予以考慮,那么ptgb8的實際編輯效率可以比測量的83%和66%高。ptgb8轉化的主要目標是獲得mpk6/mpk2雙重突變體。高百分比的66%顯示出兩個基因處的基因組編輯,其產生了推定的雙重突變體(圖30)?,F在這些推定的雙重突變體株系中,75%在mpk6和mpk1上同時具有雙等位基因突變。當用ptgb4、ptgb6、ptgb2、ptgb7、ptgb8和ptgb9進行的轉化產生了有充分潮霉素抗性的和推定經編輯的愈傷組織細胞時,僅以ptgb3突變mpk1或以ptgb5突變mpk6的嘗試不太成功。在每個構建提總共600個經轉化的愈傷組織中(對每種載體有200個愈傷組織的三個獨立重讀),對于ptgb3我們僅能回收4個潮霉素抗性的愈傷組織,而對于ptgb5則僅有2個抗性愈傷組織。盡管如此,我們仍顯示出有低百分比的回收株系以100%的效率突變(表4.1;圖28)。因此,ptg/cas9可以設計為在緊密相關的基因和它們的組合中誘導基因特異性的突變(66–100%的效率)。研究可能被冗余基因遮蔽的表型的一個關鍵目標是,在單一株系中成功獲得多個突變的基因。對ptgb8的分析顯示出,所獲得的所有株系中的50%在兩個靶向的基因都攜帶有雙等位基因突變。我們此前的研究當同時編輯4個基因時甚至實現了更高的效率,其中所有株系的86%在所有四個靶向的基因攜帶有雙等位基因突變(xie等人,2015)。雙等位基因突變在所有靶的這種高頻率應當使得篩選多個敲除事件所需的時間和努力最小化。我們的結果表明ptg/cas9技術是用于通過多基因敲除來研究基因家族或冗余基因功能的可行工具。無轉基因t1水稻植株從其親代繼承了所有8個同時誘導的突變在我們此前顯示出ptg/cas9可僅使用單一轉化事件而同時在8個基因組位點誘導突變(xie等人,2015)之后,現在我們研究當去除基因組編輯裝置時這些突變是否能夠遺傳至下一代。我們選擇分析自花授粉的t0ptgb9植株(此前顯示出雙等位基因突變)的種子。這些雙等位基因突變體的t1代易于進行基因分型,因為8個靶向的基因組位點中有5個涵蓋了re位點(其在兩個等位基因處都被引入的突變所破壞)(圖23;;圖27)。自花授粉也可以通過t-dna片段的遺傳分離來去除基因組編輯裝置。在這些無轉基因植物中檢測到的任何突變,都應當是遺傳的結果,因為不再存在基因組編輯裝置來誘導新的突變。我們分析了四種不同ptgb9株系的一株t1代植株,其中三種植物是無轉基因的。功能性ptg/cas9系統(tǒng)由多個grna編碼ptg和cas9蛋白組成。無轉基因植物不應當含有編碼ptg或cas9蛋白的任何dna。用擴增u3:ptg盒和cas9基因的1kb片段的引物所進行的pcr,確認了植物2-1、3-2和4-2缺乏基因組編輯裝置(圖31,藍箭頭)。相反,所有4個t1株系的轉基因親代植物(t0)都顯示出在其基因組dna中存在u3:ptg和cas9dna(圖31)。擴增內源水稻基因的引物確認了所有樣品中的dna都有良好的質量,因為從轉基因和無轉基因植物提取的基因組dna可以容易地擴增出pcr產物(圖30,對照)。為了對t1代株系的突變進行基因分型,我們繼而擴增了涵蓋所靶向的8個前間區(qū)序列的4個基因的片,以用于pcr-re測定。如果兩個突變的等位基因都如預期那樣得到遺傳,那么雙等位基因t0ptgb9株系的t1后代在pcr-re測定期間應產生完全可消化的pcr產物。實際上,pcr-re測定發(fā)現,在前間區(qū)序列ps3、ps5、ps2、ps1、和ps7處所攜帶的突變(圖27),正常傳播至t1代(圖23a,23b)。雖然適當的re會消化來自野生型dna的pcr產物,但是該處理并不會影響來自任何雙等位基因t0植物經測試的后代的pcr產物,表明是破壞re位點的突變(圖23a,紅箭頭)。我們進一步測試了在其余的三個靶向的位點是否也能發(fā)現突變。因為用pcr-re測定不可能在ps4、ps6、和ps8檢測到突變(圖22),且t7核酸內切酶i測定不適宜用于檢測純合突變(xie等人,2014b),我們決定對pcr產物直接測序。pcr產物直接測序的結果也可以告知t1突變體植物的接合性。如果兩個等位基因都攜帶相同的突變并且是純合的,那么測序結果就會由清晰的單峰組成。如果基因在每個等位基因上攜帶不同突變并且是雜合的,那么結果就會由模糊的雙峰組成,通常從cas9靶向位點開始。來自雜合突變的雙峰可以用簡并序列解碼來進行破譯(ma等人,2015b)。對pcr產物的測序反映出在ptgb9的t1代植株中4個mpk基因的所有8個基因組靶位點處的突變,并確認了8個突變都忠實地遺傳至后代(圖23b)。然而,每株植物都具有不同程度的雜合性。植株2-1在所有4個基因攜帶有8個純合的突變。植株3-2對于mpk2、mpk5、和mpk6是純合的,但是對于mpk1上的ps4是雜合的。植株1-2對于mpk2和mpk5是純合的,但是在mpk1和mpk6的所有4個ps區(qū)上都是雜合的。植株4-2對于mpk1和mpk5攜帶有純合的突變,但是對于mpk2的ps6和mpk6的ps7是雜合的(圖18b)。除了攜帶8個突變之外,經檢驗的t1代植株中有3株還是無轉基因的,由缺乏可檢測的來自基因組dna的u3:ptg和cas9片段可知(圖31)。我們顯示出ptg/cas9技術對于同時突變基因家族的若干成員是高度有效的工具,其中效率高達100%(表4.1)并且無轉基因t1代在所有靶向的位點攜帶有突變(圖23;圖30)。近來,lowder等人(2015)顯示出他們基于僅有一個grna的個體表達盒(每個盒長度達820bp)的模塊系統(tǒng)可以疊加至8個盒,但是6個或更多個盒的拼裝常常失敗并效率低下。另外,該研究僅分析了同時表達最多達3個grna的構建體,并且不知道用個體盒表達更多的grna是否會導致令人滿意的基因組編輯效力(lowder等人,2015)。相反,我們的ptg,從單一表達盒表達多個grna并且操控有力的內源trna加工器來講初級轉錄物轉化成多功能的grna(圖22)。即使是從一個ptg同時表達8個grna的時候,在穩(wěn)定的轉基因株系中所有8個靶位點實現了86%的編輯效力(表1;xie等人,2015)。因此,ptg/cas9是高度有效的基因組編輯裝置,其使得能快速且可靠的進行多個基因的誘變。ptg/cas9產生多種突變此前在擬南芥和水稻中使用crispr/cas9系統(tǒng)的大多數研究,都報道了在經穩(wěn)定轉化的t0植物中靶向的基因上有1bp的插入/缺失突變的強傾向性(endo等人,2014;feng等人,2014;hyun等人,2014;mikami等人,2015;zhang等人,2014)。相反,其它研究鑒定了較長的缺失(≥3bp)作為主要的突變類型(xu等人,2015;zhou等人,2014)。我們分析了來自ptg/cas9-突變的t0株系的所有可得的測序結果(n=54),來研究我們的多元基因組編輯系統(tǒng)是否能主要產生1bp的插入/缺失或者更多樣的突變。在總共54個獨立位點中,ptg/cas9-誘導的突變稍微偏向于1bp的插入(29.6%;圖24),但是程度上要比此前的報道低很多(37-54%;feng等人,2014;zhang等人,2014)。近來的研究發(fā)現talen(轉錄激活因子樣效應物核酸酶)產生69.9%的缺失,有81.1%影響多個堿基對(zhang等人,2015)。然而,整體突變效率talen僅達到25%,即使支架已經對于靶向水稻而進行了優(yōu)化(zhang等人,2015)。在我們的ptg/cas9系統(tǒng)中,缺失占所檢測突變的64.8%(圖24)所有檢測到的突變中有59.3%影響多個堿基對。此突變率顯示出ptg/cas9豐富了突變的多樣性(類似于talen)(圖24),但是卻有利地展現出更高的靶向效率(66-100%,即使是在多個基因組位點上)(表4.1)。缺失在突變類型方面展示出最高的多樣性(高達74bp受影響)(表4.2)。相反,插入和轉換分別僅觀測到達到4或3bp。突變的多樣性對于mpk5和mpk6基因座(74至1和48至1bp)要比mpk1和mpk2(15至1bp和11至1bp)更高,表明靶區(qū)至少部分地影響了突變多樣性(表4.2)。zhang等人(2015)聲稱talen和crispr/cas9之間突變類型的差異是由于dsb的性質。talen產生兩個間隔開的單鏈斷裂以誘導dsb,而cas9蛋白在同一位置切割兩條鏈。然而,似乎可以通過增強其編輯效率,從而使crispr/cas9的突變模式發(fā)生變遷(表4.2;圖24)。crispr/cas9在原生質體中的早期結果(其中認為成分會高表達),顯示出多種多樣的突變模式(li等人,2013;shan等人,2013;xie和yang,2013)。相較于常規(guī)方法,ptg系統(tǒng)大大提高了細胞內grna的量(xie等人,2015)。我們假設grna的高滴度引起了所觀測到的高效率和多堿基對突變的富集。ptg/cas9系統(tǒng)對于talen而言是優(yōu)選的工具,即便是必須要突變多個堿基對的時候,因為其提供了易于使用的具有高效率和突變多樣性的多元基因組編輯裝置。另外,可以對ptg/cas9系統(tǒng)進行編排以缺失若干個較小或較大的染色體片段。這使得研究者能夠從基因組去除整個基因或調節(jié)元件。水稻mpk基因由ptg-誘導的染色體缺失忠實地遺傳至t1和t2代ptg提供了便捷和有效的方法來同時表達多個grna。以兩個grna靶向染色體區(qū)域可以導致兩個位點之間片段的缺失。我們此前的研究顯示出,ptg/cas9可以在瞬時轉化的原生質體中以及穩(wěn)定轉化的水稻愈傷組織中誘導染色體缺失(xie等人,2015)。但是目前尚未知后代是否會遺傳這些ptg-誘導的缺失,以及遺傳是否遵循孟德爾遺傳學。我們分析了對于mpk5中的片段缺失是雜合體的ptgb9株系的t1后代,以解決此問題。我們推斷如果引物的pcr產物在兩個靶位點側翼,那么全長的等位基因將會與從野生型序列所預測的是同樣大小。另一方面,727bp的較小的pcr產物將表明染色體缺失。兩個條帶同時出現則理解為是雜合子。t0ptgb9株系4、5、和6在一個等位基因上攜帶有完整大小的mpk5基因,以及在另一個等位基因上是具有727bp缺失的拷貝,如通過測序所確認的(圖25a;圖32)。缺失的發(fā)生是作為預測的ps1和ps2斷裂位點(前間區(qū)序列鄰近基序上游3bp)的準確接合(圖32)。選擇株系3作為對照,并且其對于全長基因是純合的(圖25a)。來自每個株系的兩株t1植物的基因分型,已經反映出染色體缺失是忠實遺傳的(圖25b)。t1植株4-2和6-1對于全長等位基因或者具有缺失的等位基因都分別是純合的,顯示出可以通過自花授粉來將每個等位基因固定在基因組中。為了研究全長和缺失等位基因是否會由t1植株以孟德爾的方式遺傳,我們進一步分析了株系4、5、和6的后代。對于雜合的t0植物在t1后代中的預期比例為d:h:f是1:2:1(d:缺失,純合的;h:雜合的;f:全長,純合的)。我們測試了來自株系4的8株t1植物、來自株系5的10株t1植物、和來自株系6的9株t1植物子集。株系4和株系6展示出大致符合預期的比例,分別為0.8:2:0.4(d:h:f)和1.5:2:1(d:h:f),而株系5的后代稍稍富集了雜合的植物,比例為0.25:2:0.25(d:h:f;圖33)。株系5中稍微偏離比例可能是所測試后代數目較小的結果。但是即使該子集較小,我們依然從所有經測試的株系檢測到了至少1株t1植株對于缺失是純合的或者對于全長等位基因是純合的(圖33)。另外,t1植株6-1,其對于缺失是純合的,產生了僅顯示出具有缺失的大小較小的片段的t2后代(圖25c)。此結果進一步證明了6-1實際上是在mpk5基因中攜帶有純合缺失的植株,并且這些缺失可以遺傳至t2代。我們在此顯示出,用兩個ptg編碼的grna靶向單一的基因,可以在t0代中引起染色體缺失,其可以孟德爾的方式遺傳至后代。如果t0植株對于缺失是雜合的,其自花授粉可以產生具有純合缺失的后代并且隨后的那些代將會保持純合,如植株6-1的后代所示。此前一項對于煙草中類似的染色體缺失的報道僅僅顯示出在原生質體轉染中的缺失(gao等人,2015)。另一報道顯示出t0代水稻植株中較大的缺失,但是卻并未證明缺失遺傳周后代(zhou等人,2014)。另外,兩項研究都使用了以其自己的啟動子和終止子來表達每個grna的系統(tǒng),這限制了可以同時共表達的grna的數目,在煙草中限制為2個grna而在誰要研究中限制為4個grna(gao等人,2015;zhou等人,2014)。在此研究中使用的新ptg/cas9系統(tǒng)使得能夠表達高得多數目的grna,并且還提高了細胞內grna的滴度(xie等人,2015)。理論上來說,我們的系統(tǒng)能夠允許4個染色體缺失(當8個gran同時共表達時)以及允許2個缺失(當4個grna共表達時)。然而,在ptgb7t0株系中(1個ptg中4個grna),我們此前僅檢測到一個株系同時攜帶有mpk1中的單等位基因缺失和mpk5中的雙等位基因缺失(xie等人,2015)。ptgb9t0株系(1個ptg中8個grna)顯示出mpk5中片段缺失具有類似的趨勢,但是其它三個靶向的mpk基因卻不是這樣(xie等人,2015)??赡苄枰罅康幕蚪M編輯的植物來鑒定具有2個或4個基因的同時缺失的株系。另外,除了基因-靶向效率之外的因素也可以影響染色體缺失的形成。缺失主要在mpk5中檢測到,這表明對于片段缺失效率有潛在的位置效應??紤]到mpk在植物發(fā)育和脅迫反應中的重要性,也可能是兩個或更多個緊密相關mpk基因中的染色體缺失可導致極端的或有害的表型。此類致命表型可能防止了在單一再生植物中多個缺失的形成。mpk1和mpk6偏好可保留蛋白功能的突變與此前對于突變或缺失在一些水稻mpk基因中不利的推測一致,在ptgb9株系的4株經分析的t1植物中,我們在mpk1和mpk6中檢測到了可以除以3而無余數的突變的富集(圖26)。此類突變可能會保留編碼序列的開放閱讀框,因為3個堿基構成了1個氨基酸的編碼單元。相反,在mpk2和mpk5中檢測到的所有突變都是可能中斷序列的開放閱讀框的插入/缺失。67%的mpk1突變影響了3或3的倍數個堿基對(圖26a),而mpk6中的突變具有此種突變類型的更高傾向性,有75%(圖25a)。然而,當僅考慮外顯子中的突變時,mpk1中100%的突變保留了開放閱讀框,但在mpk6中僅有66.7%(圖26b)。此結果表明,在水稻植物中,保留功能性的蛋白對于mpk1基因可能比對于mpk6基因更重要。為了預測mpk1中突變的作用,我們將突變體的編碼序列翻譯成蛋白序列,并將前60個氨基酸與野生型序列進行比較(圖26c)。植株1-2具有兩個不同的突變體等位基因,其中一個翻譯成的蛋白縮短5個氨基酸(qatls;1-2a)而另一個翻譯成的蛋白縮短了1個氨基酸(s;1-2b)。植株2-1、3-2、和4-2攜帶有來自1-2b的不同的核苷酸突變,但是翻譯成相同的蛋白序列(縮短了位置45上的絲氨酸)(圖26c)。用interproscan進行的分析反映出,所有三種蛋白序列的突變保留預測的蛋白激酶結構域(其在野生型蛋白中從氨基酸67開始)完整。與mpk1等位基因的結果相反,ptgb9株系中檢測到的所有mpk5等位基因導致mpk5蛋白在野生型蛋白預測的蛋白激酶結構域(從氨基酸35開始)之前提早終止(圖26d)。結果表明mpk1在水稻中發(fā)揮重要的作用,而mpk1基因中的突變產生有害的或致命的表型。實際上,當我們嘗試用ptgb3(兩個grna靶向mpk1)來突變愈傷組織時,我們遇到了問題。雖然ptgb3株系1(ptgb3-1)和ptgb3-2在再生培養(yǎng)基上產生了正常的幼苗,株系ptgb3-3和ptgb3-4的愈傷組織在培養(yǎng)基上變黑并且大部分死亡。ptgb3-3不能再生成幼苗。有趣的是,雖然株系ptgb3-4的愈傷組織在mpk1基因上攜帶有純合的缺失(圖28a),但是我們能夠從再生培養(yǎng)基恢復兩株幼苗(圖26e)。然而,所恢復的幼苗一直嚴重矮化并且僅產生一個不育的穗,支持了mpk1的敲除引起有害或致命作用的假設(圖26e)。對于也靶向mpk1的ptgb7和ptgb9的株系,我們并未觀測到任何負面作用。但是如對于ptgb9所示,所有經分析的t1突變體植物的確攜帶有mpk1等位基因,其中具有保留現有開放閱讀框的突變(圖26c)。這些其它株系可攜帶有突變的但是依然具有功能的mpk1蛋白,其防止幼苗遭受所觀測到的株系ptgb3-3和ptgb3-4的有害表型。此前其它組的報道在其研究中使用了mpk1敲除突變體細胞系,其是通過插入反轉錄子tos17而誘導的(kishi-kaboshi等人,2010;kurusu等人,2005)。很可能是mpk1可以在組織分化或植物發(fā)育中發(fā)揮目前未知的且關鍵的作用。核酸酶誘導的突變與經t-dna或tos17的插入突變相比的一個差異是,核酸酶如crispr/cas9僅切割dna,但是引起敲除的突變依賴于細胞的修復機制。我們發(fā)現在mpk1的情形中,在存活的t1代上的突變總是保留現有的開放閱讀框(圖26b),而mpk1的染色體缺失引起了愈傷組織提早死亡或產生嚴重矮化的和不育的植物(圖26e)。雖然真正關鍵的基因的敲除由于致命性而在定義上是不可能的,但是似乎crispr/cas9也未能可靠地對重要的但并非真正關鍵的基因進行敲除。當敲除若干成員可引起極端表型但是轉化和突變系統(tǒng)在一或多個靶向的基因中卻選擇保留突變的開放閱讀框時,這對于分析基因家族或冗余基因可能會帶來問題。雖然研究者希望發(fā)現此極端表型,但是其可能一直檢測不到,因為所述突變不能敲除所有的基因。shi等人(2015)通過陰性篩選在癌細胞中鑒別關鍵基因的嘗試中有過類似的觀察。當他們用crispr/cas9靶向此前已知的關鍵基因的5’編碼外顯子時,所誘導的突變常常保留現有的開放閱讀框并且變體都保留功能性(shi等人,2015)。他們通過直接靶向蛋白結構域而不是5’外顯子來克服了這一局限,并用此策略實現了更嚴苛的陰性篩選表型。因此,當研究基因家族或冗余基因時,建議用ptg/cas9來靶向關鍵蛋白結構域,以提高基因對真正的敲除突變體進行評定的可能性?;蛘?,可以產生單等位基因突變或雜合的突變體株系,并將其用于研究關鍵或致命基因。材料和方法植物材料和生長條件水稻kitaake栽培變種(oryzasativaspp.japonica)用于此研究。種子于45℃在食品脫水器中干燥36-48h,以便在萌發(fā)之前前打斷休眠期,所述萌發(fā)是在37℃溫水中萌發(fā)兩天。將萌發(fā)的種子種植在metromix360soil(sungrohorticulture,agawam,ma)中,并在溫室內生長(以28℃日/23℃夜的溫度,每天12h補充光照)。所述植物在第一周之后用0.25%的尿素和0.1%的sprint鐵溶液施肥,并在隨后的周內用0.25%的尿素施肥脂質開花。ptg/cas9基因構建體ptg構建體ptgb6、ptgb7、和ptgb9此前有描述(xie等人,2015)。通過將此前描述和拼裝的ptg(ptg3、ptg4、ptg5、ptg2、和ptg8)(xie等人,2015)插入bsai-digestedprgeb32雙元載體(addgene質粒#63142)內,來構建ptgb3、ptgb4、ptgb5、ptgb2、和ptgb8。土壤桿菌介導的水稻轉化經電穿孔將雙元載體轉化至根瘤土壤桿菌菌株eha105中。用土壤桿菌介導的方法根據此前描述的方案(hiei和komari,2008),來對衍生自kitaake栽培變種的種子的水稻愈傷組織進行轉化。基因組dna提取通過添加0.9ml的預溫的ctab緩沖劑(140mmsorbitol,220mmtris-hclph8.0,22mmedta、800mmnacl、34mm肌氨酰、和22mmctab)并在65℃于1.5ml的反應管中溫育1h,從而從100-200μl體積的n2-磨碎的葉材料提取基因組dna。在添加400μl的氯仿:異戊醇(24:1)后將樣品渦旋,并在轉動器上于室溫混合20min,之后在12,000rpm離心15min。將2/3體積的異丙醇添加至上層水相,之后在-20℃冷育30min以使dna沉淀。通過在12,000rpm離心30sec至5min來使dna沉淀成丸,并用70%的乙醇洗滌沉淀丸,之后用含有0.1mg/mlrnasea的te緩沖劑在37℃溫育30min。通過添加1/10體積的3m乙酸鈉ph5.2和2-2.5體積的無水乙醇,使dna再次沉淀,并在-20℃冷育過夜。使dna沉淀成丸并用70%的乙醇洗滌,之后將干燥的沉淀丸溶解于適當量的te緩沖液。通過分光光度計來測量濃度。所有的pcr都用gotaqdna聚合酶在gotaq反應緩沖劑(promega,madison,wi)中進行。通過用1%瓊脂糖凝膠和用溴化乙錠染色的電泳來分析pcr產物和消化。用于基因分型的引物可以在附錄的表4.1中找到?;蚪M編輯裝置在后代中的存在或缺乏通過使用特異于u3p:ptg的引物的pcr來檢測。通過使用每個基因兩個靶位點側翼的引物的pcr來檢測染色體缺失。如果發(fā)生了染色體缺失,則產物大小會降低具體數目的堿基對。通過pcr-re測定來檢測靶位點上由基因組編輯事件導致的插入缺失。用適當的re將涵蓋靶位點的pcr產物消化2-3h。突變的dna不能被re所消化。將選擇的pcr產物測序,以確定具體突變。每個等位基因中由不同突變產生的雙峰使用簡并序列解碼來進行解析(ma等人,2015b)。如果雙峰未能解碼,則通過ta克隆將pcr產物克隆至pgem-teasy載體(promega,madison,wi)中,以用于對單一等位基因進行測序。蛋白序列與功能性結構域預測的比對通過clustalomegamultiple多序列比對工具(li等人,2015),將mpk1和mpk5突變體等位基因的預測的蛋白序列與其相應的野生型序列(msurgaprelease7)進行比對。用基于網頁的interproscan工具來預測所述序列的功能蛋白結構域(jones等人,2014)?;虻卿浱柊谢虻膅enbankrefseq登錄號是os06g0154500(mpk1)、os08g0157000(mpk2)、os03g0285800(mpk5)、和os10g0533600(mpk6)。表格表4.1:ptg/cas9基因構建體靶向四個緊密相關的mpk基因的設計和效率。1此前在xie等人,pnas2015中有描述2經基因組編輯的t0株系相對于經測試的t0株系總數目的百分比,經測試株系的總數目在括號中表4.2:在所有經測序的來自突變體植株的pcr產物中觀察到的ptg/cas9誘導的突變類型的總結。-:未檢測的.表4.3:研究中使用的寡核苷酸以及其目的。mpk1-f2(seqidno:174);mpk1-r2(seqid:175);mpk2-nbf(seqidno:176);mpk2-r2(seqidno:177);mpk5-f256(seqidno:178);mpk5-nbr(seqidno:179);mpk6-f(seqidno:180);mpk6-r(seqidno:181);ugw-u3-f(seqidno:182);ugw-grna-r(seqidno:183);gtcas9-f(seqidno:184);gtcas9-r(seqidno:185);對照-f(seqidno:186);對照-r(seqidno:187)。引用的文獻asai,t.,tena,g.,plotnikova,j.,willmann,m.r.,chiu,w.-l.,gomez-gomez,l.,boller,t.,ausubel,f.m.,andsheen,j.(2002).mapkinasesignallingcascadeinarabidopsisinnateimmunity.nature415,977–983.barbezier,n.,canino,g.,rodor,j.,jobet,e.,saez-vasquez,j.,marchfelder,a.,andecheverría,m.(2009).processingofadicistronictrna-snornaprecursor:combinedanalysisinvitroandinvivorevealsalternatepathwaysandcouplingtoassemblyofsnornp.plantphysiol.150,1598–1610.beckers,g.j.m.,jaskiewicz,m.,liu,y.,underwood,w.r.,he,s.y.,zhang,s.,andconrath,u.(2009).mitogen-activatedproteinkinases3and6arerequiredforfullprimingofstressresponsesinarabidopsisthaliana.plantcell21,944–953.brooks,c.,nekrasov,v.,lippman,z.b.,andeck,j.van(2014).efficientgeneeditingintomatointhefirstgenerationusingtheclusteredregularlyinterspacedshortpalindromicrepeats/crispr-associated9system1.166,1292–1297.cai,y.,chen,l.,liu,x.,sun,s.,wu,c.,jiang,b.,han,t.,andhou,w.(2015).crispr/cas9-mediatedgenomeeditinginsoybeanhairyroots.plosone10,e0136064.canino,g.,bocian,e.,barbezier,n.,echeverría,m.,forner,j.,binder,s.,andmarchfelder,a.(2009).arabidopsisencodesfourtrnasezenzymes.plantphysiol.150,1494–1502.cong,l.,ran,f.a.,cox,d.,lin,s.,barretto,r.,habib,n.,hsu,p.d.,wu,x.,jiang,w.,marraffini,l.a.,etal.(2013).multiplexgenomeengineeringusingcrispr/cassystems.science(80-.).339,819–824.endo,m.,mikami,m.,andtoki,s.(2014).multigeneknockoututilizingoff-targetmutationsofthecrispr/cas9systeminrice.plantcellphysiol.56,41–47.feng,z.,mao,y.,xu,n.,zhang,b.,wei,p.,yang,d.-l.,wang,z.,zhang,z.,zheng,r.,yang,l.,etal.(2014).multigenerationanalysisrevealstheinheritance,specificity,andpatternsofcrispr/cas-inducedgenemodificationsinarabidopsis.proc.natl.acad.sci.u.s.a.111,4632–4637.gao,j.,wang,g.,ma,s.,xie,x.,wu,x.,zhang,x.,wu,y.,zhao,p.,andxia,q.(2015).crispr/cas9-mediatedtargetedmutagenesisinnicotianatabacum.plantmol.biol.87,99–110.gutmann,b.,gobert,a.,andgiegé,p.(2012).prorpproteinssupportrnasepactivityinbothorganellesandthenucleusinarabidopsis.genesdev.26,1022–1027.hiei,y.,andkomari,t.(2008).agrobacterium-mediatedtransformationofriceusingimmatureembryosorcalliinducedfrommatureseed.nat.protoc.3,824–834.hyun,y.,kim,j.-s.j.,cho,s.w.,choi,y.,kim,j.-s.j.,andcoupland,g.(2014).site-directedmutagenesisinarabidopsisthalianausingdividingtissue-targetedrgenofthecrispr/cassystemtogenerateheritablenullalleles.planta241,271–284.jia,h.,andwang,n.(2014).targetedgenomeeditingofsweetorangeusingcas9/sgrna.plosone9,e93806.jiang,w.,zhou,h.,bi,h.,fromm,m.,yang,b.,andweeks,d.p.(2013).demonstrationofcrispr/cas9/sgrna-mediatedtargetedgenemodificationinarabidopsis,tobacco,sorghumandrice.nucleicacidsres.41,e188.jinek,m.,chylinski,k.,fonfara,i.,hauer,m.,doudna,j.a,andcharpentier,e.(2012).aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.science337,816–821.jones,p.,binns,d.,chang,h.y.,fraser,m.,li,w.,mcanulla,c.,mcwilliam,h.,maslen,j.,mitchell,a.,nuka,g.,etal.(2014).interproscan5:genome-scaleproteinfunctionclassification.bioinformatics30,1236–1240.kishi-kaboshi,m.,okada,k.,kurimoto,l.,murakami,s.,umezawa,t.,shibuya,n.,yamane,h.,miyao,a.,takatsuji,h.,takahashi,a.,etal.(2010).aricefungalmamp-responsivemapkcascaderegulatesmetabolicflowtoantimicrobialmetabolitesynthesis.plantj.63,599–612.kurusu,t.,yagala,t.,miyao,a.,hirochika,h.,andkuchitsu,k.(2005).identificationofaputativevoltage-gatedca2+channelasakeyregulatorofelicitor-inducedhypersensitivecelldeathandmitogen-activatedproteinkinaseactivationinrice.plantj.42,798–809.li,j.-f.,norville,j.e.,aach,j.,mccormack,m.,zhang,d.,bush,j.,church,g.m.,andsheen,j.(2013).multiplexandhomologousrecombination-mediatedgenomeeditinginarabidopsisandnicotianabethamianausingguidernaandcas9.nat.biotechnol.31,688–691.li,w.,cowley,a.,uludag,m.,gur,t.,mcwilliam,h.,squizzato,s.,park,y.m.,buso,n.,andlopez,r.(2015).theembl-ebibioinformaticswebandprogrammatictoolsframework.nucleicacidsres.43,580–584.lowder,l.g.,paul,j.w.,baltes,n.j.,voytas,d.f.,zhang,y.,zhang,d.,tang,x.,zheng,x.,hsieh,t.-f.,andqi,y.(2015).acrispr/cas9toolboxformultiplexedplantgenomeeditingandtranscriptionalregulation.plantphysiol.doi:10.1104/pp.15.00636.ma,x.,zhang,q.,zhu,q.,liu,w.,chen,y.,qiu,r.,wang,b.,yang,z.,li,h.,lin,y.,etal.(2015a).arobustcrispr/cas9systemforconvenient,high-efficiencymultiplexgenomeeditinginmonocotanddicotplants.mol.plant8,1274–1284.ma,x.,chen,l.,zhu,q.,chen,y.,andliu,y.-g.(2015b).rapiddecodingofsequence-specificnuclease-inducedheterozygousandbiallelicmutationsbydirectsequencingofpcrproducts.mol.plant8,1285–1287.mali,p.,yang,l.,esvelt,k.m.,aach,j.,guell,m.,dicarlo,j.e.,norville,j.e.,andchurch,g.m.(2013).rna-guidedhumangenomeengineeringviacas9.science(80-.).339,823–827.miao,j.,guo,d.,zhang,j.,huang,q.,qin,g.,zhang,x.,wan,j.,gu,h.,andqu,l.-j.(2013).targetedmutagenesisinriceusingcrispr-cassystem.cellres.23,1233–1236.mikami,m.,toki,s.,andendo,m.(2015).parametersaffectingfrequencyofcrispr/cas9mediatedtargetedmutagenesisinrice.plantcellrep.34,1807–1815.phizicky,e.m.,andhopper,a.k.(2010).trnabiologychargestothefront.genesdev.24,1832–1860.pitzschke,a.,schikora,a.,andhirt,h.(2009).mapkcascadesignallingnetworksinplantdefence.curr.opin.plantbiol.12,421–426.reyna,n.s.,andyang,y.(2006).molecularanalysisofthericemapkinasegenefamilyinrelationtomagnaporthegriseainfection.mol.plant.microbe.interact.19,530–540.schiffer,s.,s.,andmarchfelder,a.(2002).assigningafunctiontoaconservedgroupofproteins:thetrna3′-processingenzymes.emboj.21,2769–2777.shan,q.,wang,y.,li,j.,zhang,y.,chen,k.,liang,z.,zhang,k.,liu,j.,xi,j.j.,qiu,j.-l.,etal.(2013).targetedgenomemodificationofcropplantsusingacrispr-cassystem.nat.biotechnol.31,686–688.shi,j.,wang,e.,milazzo,j.p.,wang,z.,kinney,j.b.,andvakoc,c.r.(2015).discoveryofcancerdrugtargetsbycrispr-cas9screeningofproteindomains.nat.biotechnol.33,661–667.sugano,s.s.,shirakawa,m.,takagi,j.,matsuda,y.,shimada,t.,hara-nishimura,i.,andkohchi,t.(2014).crispr/cas9-mediatedtargetedmutagenesisintheliverwortmarchantiapolymorphal.plantcellphysiol.55,475–481.voytas,d.f.(2013).plantgenomeengineeringwithsequence-specificnucleases.annu.rev.plantbiol.64,327–350.xie,k.,andyang,y.(2013).rna-guidedgenomeeditinginplantsusingacrispr-cassystem.mol.plant6,1975–1983.xie,k.,zhang,j.,andyang,y.(2014a).genome-widepredictionofhighlyspecificguidernaspacersforthecrispr-cas9-mediatedgenomeeditinginmodelplantsandmajorcrops.mol.plant7,923–926.xie,k.,minkenberg,b.,andyang,y.(2014b).targetedgenemutationinriceusingacrispr-cas9system.bio-protocol4,e1225.xie,k.,minkenberg,b.,andyang,y.(2015).boostingcrispr/cas9multiplexeditingcapabilitywiththeendogenoustrna-processingsystem.proc.natl.acad.sci.112,3570–3575.xu,r.-f.,li,h.,qin,r.-y.,li,j.,qiu,c.-h.,yang,y.-c.,ma,h.,li,l.,wei,p.-c.,andyang,j.-b.(2015).generationofinheritableand“transgeneclean”targetedgenome-modifiedriceinlatergenerationsusingthecrispr/cas9system.sci.rep.5,11491doi:10.1038/srep11491.zhang,h.,gou,f.,zhang,j.,liu,w.,li,q.,mao,y.,botella,j.r.,andzhu,j.-k.(2015).talen-mediatedtargetedmutagenesisproducesalargevarietyofheritablemutationsinrice.plantbiotechnol.j.doi:10.1111/pbi.12372.zhang,h.h.,zhang,j.,wei,p.,zhang,b.,gou,f.,feng,z.,mao,y.,yang,l.,zhang,h.h.,xu,n.,etal.(2014).thecrispr/cas9systemproducesspecificandhomozygoustargetedgeneeditinginriceinonegeneration.plantbiotechnol.j.12,797–807.zhou,h.,liu,b.,weeks,d.p.,spalding,m.h.,andyang,b.(2014).largechromosomaldeletionsandheritablesmallgeneticchangesinducedbycrispr/cas9inrice.nucleicacidsres.42,10903–10914序列表序列表序列表序列表序列表序列表<110>賓州研究基金會<120>用于多元rna引導的基因組編輯和其它rna技術的方法和組合物<130>p1123us01<150>62/065,093<151>2014-10-17<160>189<170>patentinversion3.5<210>1<211>113<212>dna<213>artificialsequence<220><223>sgrna1targetmpk5<400>1gatccgtggcaagatgtcgtagagcaggtacgttttagagctagaaatagcaagttaaaa60taaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttt113<210>2<211>115<212>dna<213>artificialsequence<220><223>sgrna2targetmpk5<400>2gatccgtggcagtctacatcgccacggagctcagttttagagctagaaatagcaagttaa60aataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttt115<210>3<211>96<212>dna<213>artificialsequence<220><223>grna1scaffoldtargetmpk5<400>3agatgtcgtagagcaggtacgttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>4<211>97<212>dna<213>artificialsequence<220><223>grna2scaffoldtargetmpk5<400>4tctacatcgccacggagctcagttttagagctagaaatagcaagttaaaataaggctagt60ccgttatcaacttgaaaaagtggcaccgagtcggtgc97<210>5<211>96<212>dna<213>artificialsequence<220><223>grna3scaffold.targetmpk1<400>5atccaggcgacgctgagccagttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>6<211>96<212>dna<213>artificialsequence<220><223>grna4scaffold.targetmpk1<400>6tggcccaccggggtataaaagttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>7<211>96<212>dna<213>artificialsequence<220><223>grna5scaffold.targetmpk2<400>7gaacccggtcgcctcaaggagttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>8<211>96<212>dna<213>artificialsequence<220><223>grna6scaffold.targetmpk2<400>8gaatgcgcagactcgtcagggttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>9<211>96<212>dna<213>artificialsequence<220><223>grna7scaffold.targetmpk6<400>9gtgtccgcttggcatcgatagttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>10<211>96<212>dna<213>artificialsequence<220><223>grna8scaffold.targetmpk6<400>10gcgggtgcgggtcaatcaaagttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>11<211>96<212>dna<213>artificialsequence<220><223>grna9scaffold.targetpds<400>11acaagccaggagaattcagcgttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>12<211>96<212>dna<213>artificialsequence<220><223>grna10scaffold.targetpds<400>12cactgcatggataactcatcgttttagagctagaaatagcaagttaaaataaggctagtc60cgttatcaacttgaaaaagtggcaccgagtcggtgc96<210>13<211>77<212>dna<213>artificialsequence<220><223>pre-trnasequence<400>13aacaaagcaccagtggtctagtggtggaatagtaccctgccacggtacagacccgggttc60gattcccggctggtgca77<210>14<211>10<212>dna<213>artificialsequence<220><223>last10bpofu3promoter<400>14gatccgtggc10<210>15<211>153<212>dna<213>artificialsequence<220><223>grna-trnainpgtrplasmid<400>15gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagt60ggcaccgagtcggtgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacg120gtacagacccgggttcgattcccggctggtgca153<210>16<211>193<212>dna<213>artificialsequence<220><223>trna-grna1<400>16gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcaagatgtcgtagagcaggtacgttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgctttttttttt193<210>17<211>194<212>dna<213>artificialsequence<220><223>trna-grna2<400>17gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcatctacatcgccacggagctcagttttagagcta120gaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcg180gtgctttttttttt194<210>18<211>270<212>dna<213>artificialsequence<220><223>trna-grna1-trna<400>18gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcaagatgtcgtagagcaggtacgttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccggg240ttcgattcccggctggtgcatttttttttt270<210>19<211>271<212>dna<213>artificialsequence<220><223>trna-grna2-trna<400>19gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcatctacatcgccacggagctcagttttagagcta120gaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcg180gtgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccgg240gttcgattcccggctggtgcatttttttttt271<210>20<211>365<212>dna<213>artificialsequence<220><223>trna-grna3-trna-grna4<400>20gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcaatccaggcgacgctgagccagttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccggg240ttcgattcccggctggtgcatggcccaccggggtataaaagttttagagctagaaatagc300aagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttt360ttttt365<210>21<211>366<212>dna<213>artificialsequence<220><223>trna-grna5-trna-grna6<400>21gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcagaacccggtcgcctcaaggagttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccggg240ttcgattcccggctggtgcagaatgcgcagactcgtcagggttttagagctagaaatagc300aagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttt360tttttt366<210>22<211>366<212>dna<213>artificialsequence<220><223>trna-grna7-trna-grna8<400>22gatgatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggta60cagacccgggttcgattcccggctggtgcagtgtccgcttggcatcgatagttttagagc120tagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagt180cggtgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagaccc240gggttcgattcccggctggtgcagcgggtgcgggtcaatcaaagttttagagctagaaat300agcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgct360tttttt366<210>23<211>367<212>dna<213>artificialsequence<220><223>trna-grna1-trna-grna2<400>23gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcaagatgtcgtagagcaggtacgttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccggg240ttcgattcccggctggtgcatctacatcgccacggagctcagttttagagctagaaatag300caagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttt360ttttttt367<210>24<211>713<212>dna<213>artificialsequence<220><223>trna-grna1-trna-grna2-trna-grna3-trna-grna4<400>24gatccgtggcaataaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcaagatgtcgtagagcaggtacgttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccggg240ttcgattcccggctggtgcatctacatcgccacggagctcagttttagagctagaaatag300caagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcaac360aaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgat420tcccggctggtgcaatccaggcgacgctgagccagttttagagctagaaatagcaagtta480aaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcaacaaagcac540cagtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgattcccggc600tggtgcatggcccaccggggtataaaagttttagagctagaaatagcaagttaaaataag660gctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttttttt713<210>25<211>711<212>dna<213>artificialsequence<220><223>trna-grna7-trna-grna8-trna-grna5-trna-grna6<400>25gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcagtgtccgcttggcatcgatagttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccggg240ttcgattcccggctggtgcagcgggtgcgggtcaatcaaagttttagagctagaaatagc300aagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcaaca360aagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgatt420cccggctggtgcagaacccggtcgcctcaaggagttttagagctagaaatagcaagttaa480aataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcaacaaagcacc540agtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgattcccggct600ggtgcagaatgcgcagactcgtcagggttttagagctagaaatagcaagttaaaataagg660ctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttttt711<210>26<211>1404<212>dna<213>artificialsequence<220><223>trna-grna1-trna-grna2-trna-grna3-trna-grna4-trna-grna7-trna-grna8-trna-grna5-trna-grna6<400>26gatccgtggcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcaagatgtcgtagagcaggtacgttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccggg240ttcgattcccggctggtgcatctacatcgccacggagctcagttttagagctagaaatag300caagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcaac360aaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgat420tcccggctggtgcaatccaggcgacgctgagccagttttagagctagaaatagcaagtta480aaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcaacaaagcac540cagtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgattcccggc600tggtgcatggcccaccggggtataaaagttttagagctagaaatagcaagttaaaataag660gctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcaacaaagcaccagtggt720ctagtggtagaatagtaccctgccacggtacagacccgggttcgattcccggctggtgca780gtgtccgcttggcatcgatagttttagagctagaaatagcaagttaaaataaggctagtc840cgttatcaacttgaaaaagtggcaccgagtcggtgcaacaaagcaccagtggtctagtgg900tagaatagtaccctgccacggtacagacccgggttcgattcccggctggtgcagcgggtg960cgggtcaatcaaagttttagagctagaaatagcaagttaaaataaggctagtccgttatc1020aacttgaaaaagcggcaccgagtcggtgcaacaaagcaccagtggtctagtggtagaata1080gtaccctgccacggtacagacccgggttcgattcccggctggtgcagaacccggtcgcct1140caaggagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttga1200aaaagtggcaccgagtcggtgcaacaaagcaccagtggtctagtggtagaatagtaccct1260gccacggtacagacccgggttcgattcccggctggtgcagaatgcgcagactcgtcaggg1320ttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtg1380gcaccgagtcggtgcttttttttt1404<210>27<211>367<212>dna<213>artificialsequence<220><223>trna-grna9-trna-grna10<400>27gatccgtggcaacaaagcaccagtggtctagtggtggaatagtaccctgccacggtacag60acccgggttcgattcccggctggtgcaacaagccaggagaattcagcgttttagagctag120aaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcgg180tgcaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccggg240tccgattcccggctggtgcacactgcatggataactcatcgttttagagctagaaatagc300aagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttt360ttttttt367<210>28<211>20<212>dna<213>artificialsequence<220><223>primergrna1-rforcrt-pcrofgrna1<400>28aaacgtacctgctctacgac20<210>29<211>20<212>dna<213>artificialsequence<220><223>primergrna2-rforcrt-pcrofgrna2<400>29aaactgagctccgtggcgat20<210>30<211>34<212>dna<213>artificialsequence<220><223>primerbsa-grna-fforcrt-pcrandamplifygrna<400>30ggagaccgaggtctcggttttagagctagaaata34<210>31<211>24<212>dna<213>artificialsequence<220><223>primergrna1-fforqrt-pcr<400>31ggcaagatgtcgtagagcaggtac24<210>32<211>22<212>dna<213>artificialsequence<220><223>primergrna2-fforqrt-pcr<400>32gtctacatcgccacggagctca22<210>33<211>18<212>dna<213>artificialsequence<220><223>primergrna-rforqrt-pcr<400>33gcaccgactcggtgccac18<210>34<211>22<212>dna<213>artificialsequence<220><223>primerubi-qfforqrt-pcr<400>34tggtcagtaatcagccagtttg22<210>35<211>22<212>dna<213>artificialsequence<220><223>primerubi-qrforqrt-pcr<400>35caaatacttgacgaacagaggc22<210>36<211>20<212>dna<213>artificialsequence<220><223>primermpk5-qfforqpcr<400>36gatcccgccgccgatccctc20<210>37<211>54<212>dna<213>artificialsequence<220><223>primerg-trna-fforconstructpgtr<400>37gcaccgagtcggtgcaacaaagcaccagtggtctagtggtagaatagtaccctg54<210>38<211>60<212>dna<213>artificialsequence<220><223>primertrna-rforconstructpgtr<400>38ctgccatgcaccagccgggaatcgaacccgggtctgtaccgtggcagggtactattctac60<210>39<211>37<212>dna<213>artificialsequence<220><223>primerubi-fforamplifyingubip<400>39tgcatgcctgcaggtccacaaattcgggtcaaggcgg37<210>40<211>41<212>dna<213>artificialsequence<220><223>primerubi-rtoamplifyubip<400>40caaacttgttgataactatctgcaagaaataatcaccaaac41<210>41<211>41<212>dna<213>artificialsequence<220><223>primerugw-u3-fforconstructprge32<400>41gaccatgattacgccaagcttaaggaatctttaaacatacg41<210>42<211>37<212>dna<213>artificialsequence<220><223>primerugw-grna-rforconstructprge32<400>42ggacctgcaggcatgcacgcgctaaaaacggactagc37<210>43<211>18<212>dna<213>artificialsequence<220><223>primermpk1-fforgenotypingofmpk1<400>43gggtcggcacagcatctc18<210>44<211>20<212>dna<213>artificialsequence<220><223>primermpk1-r2forgenotypingofmpk1<400>44tgcgcctaaaaatcgagggt20<210>45<211>21<212>dna<213>artificialsequence<220><223>primermpk2-fforgenotypingofmpk2<400>45tttgggaagcatgtatgaagc21<210>46<211>20<212>dna<213>artificialsequence<220><223>primermpk2-r2forgenotypingofmpk2<400>46tatgccagccaatgagccaa20<210>47<211>21<212>dna<213>artificialsequence<220><223>primermpk5-f256forgenotypingofmpk5<400>47gccaccttccttcctcatccg21<210>48<211>20<212>dna<213>artificialsequence<220><223>primermpk5-r611forgenotypingofmpk5<400>48gttgctcggcttcaggtcgc20<210>49<211>21<212>dna<213>artificialsequence<220><223>primermpk6-fforgenotypingofmpk6<400>49ttgacgccccaacataaataa21<210>50<211>18<212>dna<213>artificialsequence<220><223>primermpk6-rforgenotypingofmpk6<400>50tgttgctgccgcttttct18<210>51<211>20<212>dna<213>artificialsequence<220><223>primerpds-fforgenotypingofpds<400>51ggtagaaatgccatgcggga20<210>52<211>20<212>dna<213>artificialsequence<220><223>primerpds-rforgenotypingofpds<400>52attcagccgaacctcaccac20<210>53<211>46<212>dna<213>artificialsequence<220><223>primerl5ad5-fforptgsynthesisandcloning<400>53cgggtctcaggcaggatgggcagtctgggcaacaaagcaccagtgg46<210>54<211>52<212>dna<213>artificialsequence<220><223>primerl3ad5-rforptgsynthesisandcloning<400>54taggtctccaaacggatgagcgacagcaaacaaaaaaaaaagcaccgactcg52<210>55<211>31<212>dna<213>artificialsequence<220><223>primers5ad5-fforptgsynthesisandcloning<400>55cgggtctcaggcaggatgggcagtctgggca31<210>56<211>31<212>dna<213>artificialsequence<220><223>primers3ad5-rforptgsynthesisandcloning<400>56taggtctccaaacggatgagcgacagcaaac31<210>57<211>36<212>dna<213>artificialsequence<220><223>primergr1-fforsynthesisofptg<400>57taggtctcctagagcaggtacgttttagagctagaa36<210>58<211>36<212>dna<213>artificialsequence<220><223>primergr1-rforsynthesisofptg<400>58atggtctcatctacgacatcttgcaccagccgggaa36<210>59<211>36<212>dna<213>artificialsequence<220><223>primergr2-fforsynthesisofptg<400>59taggtctccccacggagctcagttttagagctagaa36<210>60<211>37<212>dna<213>artificialsequence<220><223>primergr2-rforsynthesisofptg<400>60atggtctcagtggcgatgtagatgcaccagccgggaa37<210>61<211>36<212>dna<213>artificialsequence<220><223>primergr3-fforsynthesisofptg<400>61taggtctccgacgctgagccagttttagagctagaa36<210>62<211>36<212>dna<213>artificialsequence<220><223>primergr3-rforsynthesisofptg<400>62atggtctcacgtcgcctggattgcaccagccgggaa36<210>63<211>38<212>dna<213>artificialsequence<220><223>primergr4-fforsynthesisofptg<400>63taggtctccaccggggtataaaagttttagagctagaa38<210>64<211>32<212>dna<213>artificialsequence<220><223>primergr4-rforsynthesisofptg<400>64cgggtctcacggtgggccatgcaccagccggg32<210>65<211>37<212>dna<213>artificialsequence<220><223>primergr5-fforsynthesisofptg<400>65taggtctccgtcgcctcaaggagttttagagctagaa37<210>66<211>33<212>dna<213>artificialsequence<220><223>primergr5-rforsynthesisofptg<400>66cgggtctcacgaccgggttctgcaccagccggg33<210>67<211>37<212>dna<213>artificialsequence<220><223>primergr6-fforsynthesisofptg<400>67taggtctcccagactcgtcagggttttagagctagaa37<210>68<211>33<212>dna<213>artificialsequence<220><223>primergr6-rforsynthesisofptg<400>68cgggtctcatctgcgcattctgcaccagccggg33<210>69<211>36<212>dna<213>artificialsequence<220><223>primergr7-fforsynthesisofptg<400>69taggtctccttggcatcgatagttttagagctagaa36<210>70<211>36<212>dna<213>artificialsequence<220><223>primergr7-rforsynthesisofptg<400>70atggtctcaccaagcggacactgcaccagccgggaa36<210>71<211>37<212>dna<213>artificialsequence<220><223>primergr8-fforsynthesisofptg<400>71taggtctcccgggtcaatcaaagttttagagctagaa37<210>72<211>33<212>dna<213>artificialsequence<220><223>primergr8-rforsynthesisofptg<400>72cgggtctcacccgcacccgctgcaccagccggg33<210>73<211>21<212>dna<213>artificialsequence<220><223>primerln-gr7-fforsynthesisofptg<400>73taggtctccttggcatcgata21<210>74<211>21<212>dna<213>artificialsequence<220><223>primerln-gr7-rforsynthesisofptg<400>74atggtctcaccaagcggacac21<210>75<211>38<212>dna<213>artificialsequence<220><223>primergr9-fforsynthesisofptg<400>75taggtctcccaggagaattcagcgttttagagctagaa38<210>76<211>32<212>dna<213>artificialsequence<220><223>primergr9-rforsynthesisofptg<400>76cgggtctcacctggcttgttgcaccagccggg32<210>77<211>38<212>dna<213>artificialsequence<220><223>primergr10-fartificialsynthesisofptg<400>77taggtctccatggataactcatcgttttagagctagaa38<210>78<211>32<212>dna<213>artificialsequence<220><223>primergr10-rforsynthesisofptg<400>78cgggtctcaccatgcagtgtgcaccagccggg32<210>79<211>1720<212>dna<213>oryzasativa<400>79attccgcctccactttcccttcccttcctcctccacctccacctcctcgtcgcgatccaa60atccgaatccggccatggacgccggggcgcagccgccggacacggagatggcggaggccg120gcggcgggcagcagccgcctgctgcggctgcggcggcgggggcgggggcaggggcgggga180tgatggagaacatccaggcgacgctgagccatggcgggaggttcatccagtacaacatct240tcgggaacgtgttcgaggtcaccgccaagtacaagccccccatcctccccatcggcaagg300gcgcctacggcatcgtctgctcggcgctcaactcggagacgggggagcaggtggcgatca360agaagatcgccaacgcgttcgacaacaagatcgacgccaagcgcacgctcagggagatca420agctgctccgccacatggaccacgagaatattgttgccataagggatatcatacctcctc480cacaaaggaattcattcaatgacgtttatattgcatatgaattgatggatactgatctgc540atcaaattattcgctcaaatcaagcattgtcagaggagcactgccagtatttcctttatc600agattctccgtggcttgaagtatatacattcagcaaatgtccttcaccgagacttgaagc660ccagcaacctacttttgaatgcaaattgtgacctcaaaatttgtgattttggacttgctc720gtaccacctcagaaaccgattttatgactgagtatgttgtcacaagatggtatagggcac780cggaacttctgttgaattcctctgaatatactgcagcaattgatgtgtggtctgtgggct840gtatttttatggaactcatggatcgtaaacctttgtttcctggaagagatcatgtccatc900aattacgtctactaatggagctcatcggaacgccaaatgaggctgatctggattttgtaa960atgaaaatgcaagaagatacattcgccaacttcctagacatgcaaggcagtcctttcctg1020aaaaatttccacatgttcatcctttagcaattgatctggttgaaaagatgctgacatttg1080atcctagacagagaataacagttgaaggtgcccttgcacatccttacctggcatcactgc1140atgacataagtgatgagccagtctgctcatcacccttcagctttgacttcgagcagcatg1200cattgtccgaggaacaaatgaaggatctaatctaccaagaaggccttgcgttcaaccctg1260attaccagtagctggtgttctatttcagccttggattgattctattcatatggagttttt1320tcctcctgcgccacaaaaggtcgccgacagtgatcactagttgtaaataattgcctcacc1380tgaaaaatcctccctggttcaaagctgaaggtgttgttctaagagtagaaatgtactttg1440tgatcaagttcctgggtagctgctatgccattcttatgcttatgtatgttgtttaatgtg1500ggatttttttccatcttaaatgtttttagtcccttttgtaagaagagttagttcatgaac1560gatgacggcctaaattctgcggttatcatcaaattccccattttcttgtcgattcatgga1620tttctcatggttttacttaatgctccatgttgtaagacgtggtcaatggaagaggatata1680ttgactcttgattcagtggtggcagtttggagttgatcgt1720<210>80<211>398<212>prt<213>oryzasativa<400>80metaspalaglyalaglnproproaspthrglumetalaglualagly151015glyglyglnglnproproalaalaalaalaalaalaglyalaglyala202530glyalaglymetmetgluasnileglnalathrleuserhisglygly354045argpheileglntyrasnilepheglyasnvalphegluvalthrala505560lystyrlysproproileleuproileglylysglyalatyrglyile65707580valcysseralaleuasnsergluthrglygluglnvalalailelys859095lysilealaasnalapheaspasnlysileaspalalysargthrleu100105110arggluilelysleuleuarghismetasphisgluasnilevalala115120125ileargaspileileproproproglnargasnserpheasnaspval130135140tyrilealatyrgluleumetaspthraspleuhisglnileilearg145150155160serasnglnalaleuserglugluhiscysglntyrpheleutyrgln165170175ileleuargglyleulystyrilehisseralaasnvalleuhisarg180185190aspleulysproserasnleuleuleuasnalaasncysaspleulys195200205ilecysasppheglyleualaargthrthrsergluthraspphemet210215220thrglutyrvalvalthrargtrptyrargalaprogluleuleuleu225230235240asnserserglutyrthralaalaileaspvaltrpservalglycys245250255ilephemetgluleumetasparglysproleupheproglyargasp260265270hisvalhisglnleuargleuleumetgluleuileglythrproasn275280285glualaaspleuaspphevalasngluasnalaargargtyrilearg290295300glnleuproarghisalaargglnserpheproglulyspheprohis305310315320valhisproleualaileaspleuvalglulysmetleuthrpheasp325330335proargglnargilethrvalgluglyalaleualahisprotyrleu340345350alaserleuhisaspileseraspgluprovalcysserserprophe355360365serpheaspphegluglnhisalaleuserglugluglnmetlysasp370375380leuiletyrglngluglyleualapheasnproasptyrgln385390395<210>81<211>1577<212>dna<213>oryzasativa<400>81gggttcgtttcttggctggttttcttgggcggcgatcgatcgatgcgcatggagggcggc60ggcggcggcggccatggccatcacggcggcggcggcggtggccatggccatcacggtggc120atcggaggaggggaggcgcagatcaaggggacgctgacgcacggcgggaggtacgtgcag180tacaacgtgtatggtaacctgttcgaggtttcgtccaagtacgtccctcccatccgcccc240gtcggccgcggcgcctgcggcatcatctgtgcggttgtgaatgcgcagactcgtcaggag300gtggcaatcaagaagatcggcaacgcgttcgacaaccagatcgacgccaagcgcaccctg360cgagagatcaagctgcttcggcacatggatcatgataatgtcatctcaataaaggacatc420atacggccaccaaggagggagaacttcaatgatgtctacattgtctatgagctcatggac480actgatcttcaccaccttcttcgatcaaaccagccactaacagatgatcactgtcagtat540tttctctatcaggtactacgaggattgaagtatgtgcattcagcaaatgtcttgcacaga600gacctcaggccaagtaatttgctgctgaatgcgaaatgcgatcttaagatcggagacttt660ggattagcaaggaccacaaatgaaactgacttcatgatggagtatgttgttactcgatgg720tacagggcacctgaactcctgctaaactgctcagagtacactgcagctattgatatctgg780tcggtaggctgcatccttggtgagatcgttacaagggagcctttgtttcctggaaaggat840tatgtccatcagctgaggctaataactgagttaataggctcacctgatgactcgagcctt900gggtttcttcgaagcgacaacgcccgcagatatgtgaggtcgcttcctcaataccccaag960caacaattccgtgcacggttccccactatgtctagtggtgccatggatttgcttgagagg1020atgcttgtgtttgatcccagcaaaaggattactgttgatgaagctctgtgccatccatac1080ttggcatcccttcatgagatatatgatgaaccagtctgcccagcgcctttcagcttcgat1140ttcgagcagccgtcgctcaccgaagaagatatcaaggagatcatatggagggaggcactt1200aagttcaaccctgaaccaattcactagatgaatttccaatgaagaacggaagcagatcac1260actggcagatgatcatccatccactccttggggaagacatgagccaacagcatgatgtat1320agttgatcaccctctcagcatctcatcttgtggcttgtcagcgacaccctgacatcgcaa1380attcggacatttatgaaaacaagaaaagcttgatcaaataatttgtagtacgaaaaaaat1440caggagcttaactgtatcttcttgttagatttgtatctatcccatttggttgtatgctta1500agaaacctgggagcttgtcactagttatggaggtacagcaatctccagatactcttcagt1560catcagttcagttcacc1577<210>82<211>1489<212>dna<213>oryzasativa<400>82agcgatcacaaattgtgccaattcacaaaccgccgcccccttccctttttaatagctgcc60ttcgcctctcgtcccctctccctcatcgccttgctgtctctgcgaatcgagagagagtca120gataaggtcgttaattaggtttgtcaattcggctgcttgcggcgagagaagaggaggagg180gattagggatggacggggcgccggtggcggagttcaggccgacgatgacgcacggcggcc240ggtacctgctctacgacatcttcgggaacaagttcgaggtgacgaacaagtaccagccgc300ccatcatgcccattggccgcggcgcctacgggatcgtctgctccgtgatgaactttgaga360cgagggagatggtggcgataaagaagatcgccaacgcgttcaacaacgacatggacgcca420agcgcacgctccgggagatcaagctcctcaggcacctcgaccacgagaacatcataggca480tcagggatgtgatcccgccgccgatccctcaggcgttcaacgacgtctacatcgccacgg540agctcatggacaccgacctccatcacatcatccgctccaaccaagaactgtcagaagagc600actgccagtatttcctgtaccagatcctgcgggggctcaagtacatccactcggcgaacg660tgatccaccgcgacctgaagccgagcaacctgctgctgaacgccaactgcgacctcaaga720tctgcgacttcgggctggcgcggccgtcgtcggagagcgacatgatgacggagtacgtgg780tcacccggtggtaccgcgcgccggagctgctgctcaactccaccgactactccgccgcca840tcgacgtctggtccgtcggctgcatcttcatggagctcatcaaccgccagccgctcttcc900ccggcagggaccacatgcaccagatgcgcctcatcaccgaggtgatcgggacgccgacgg960acgacgagctggggttcatacggaacgaggacgcgaggaagtacatgaggcacctgccgc1020agtacccgcgccggacgttcgcgagcatgttcccgcgggtgcagcccgccgcgctcgacc1080tcatcgagaggatgctcaccttcaacccgctgcagagaatcacagttgaggaggcgctcg1140atcatccttacctagagagattgcacgacatcgccgatgagcccatctgcctggagccct1200tctccttcgacttcgagcagaaggctctaaacgaggaccaaatgaagcagctgatcttca1260acgaagcgatcgagatgaacccaaacatccggtactagattgaatcaccatggaaatgag1320atcccgtctatacctgctttgtacatatgatcaagattgagagccgggtagactgaacat1380tgcatttgtttgtttgttgatgttcgaaacccacattctctgcaagttgtggctgctttg1440tatgatatatggtactatgttcgaataaaagggtttggaactttggatt1489<210>83<211>369<212>prt<213>oryzasativa<400>83metaspglyalaprovalalaglupheargprothrmetthrhisgly151015glyargtyrleuleutyraspilepheglyasnlysphegluvalthr202530asnlystyrglnproproilemetproileglyargglyalatyrgly354045ilevalcysservalmetasnphegluthrargglumetvalalaile505560lyslysilealaasnalapheasnasnaspmetaspalalysargthr65707580leuarggluilelysleuleuarghisleuasphisgluasnileile859095glyileargaspvalileproproproileproglnalapheasnasp100105110valtyrilealathrgluleumetaspthraspleuhishisileile115120125argserasnglngluleuserglugluhiscysglntyrpheleutyr130135140glnileleuargglyleulystyrilehisseralaasnvalilehis145150155160argaspleulysproserasnleuleuleuasnalaasncysaspleu165170175lysilecysasppheglyleualaargprosersergluseraspmet180185190metthrglutyrvalvalthrargtrptyrargalaprogluleuleu195200205leuasnserthrasptyrseralaalaileaspvaltrpservalgly210215220cysilephemetgluleuileasnargglnproleupheproglyarg225230235240asphismethisglnmetargleuilethrgluvalileglythrpro245250255thraspaspgluleuglypheileargasngluaspalaarglystyr260265270metarghisleuproglntyrproargargthrphealasermetphe275280285proargvalglnproalaalaleuaspleuilegluargmetleuthr290295300pheasnproleuglnargilethrvalgluglualaleuasphispro305310315320tyrleugluargleuhisaspilealaaspgluproilecysleuglu325330335propheserpheaspphegluglnlysalaleuasngluaspglnmet340345350lysglnleuilepheasnglualaileglumetasnproasnilearg355360365tyr<210>84<211>1560<212>dna<213>oryzasativa<400>84attccgcggtcgccgcccgagtcaaaaagagggggaagcttctcccaccatagtcctcct60cctcctcctcctactcccatcaacgactagtcgcggcgaccaagagccaaaccctacgcc120tcctcccctccccctccacctcgtcctccccgcgagcggcggcggccatggattcctcct180ccggcggcgcgggcggcggcggcggcgcgcagatcaaggggatggggacgcacgggggcc240gctacgtgctgtacaacgtgtacgggaacttcttcgaggtctcctccaagtacgcccctc300ccatccgccccatcggccggggcgcctacggcattgtctgcgcggctgttaactcggaga360acggcgaggaagttgccatcaagaagattggcaatgcattcgacaaccatatcgatgcca420agcggacactgagagaaatcaagctgcttcgccacatggaccacgagaatattattgcca480taaaggacataattcgccccccaagaagagacaactttaatgatgtttacattgtttctg540agttgatggatactgatctccatcagatcatacgctcaaatcaaccattgactgatgacc600actgccagtacttcctgtaccagttgctacgagggctaaaatatgtgcactcggcaaatg660tcttgcaccgtgatctgaagccaagcaatttgttccttaatgcaaattgtgatctcaaga720ttgctgattttgggcttgcaagaaccactacggagactgacctcatgacagagtatgtgg780tcactcgttggtatcgagcaccagagctgctgttgaactgctcgcagtatactgctgcta840ttgatgtctggtcagttggatgcatacttggtgaaattgtgactcgtcaacccctgtttc900ctggaagggattacattcagcaactaaaattgatcactgagctgatagggtcgccagatg960actcaagcctagggtttcttcggagtgataatgcaagaagatacatgaaacagctaccac1020agtacccaaggcaggacttccgcttgcgcttccgcaacatgtctgctggtgcagtcgatc1080tgttagagaaaatgctggtgtttgacccaagcagacggataactgttgatgaggctcttc1140atcacccatacttggcttctcttcatgacatcaatgaagaacccacctgcccagcacctt1200tcagctttgattttgagcaaccatcctttactgaagaacatataaaagaactcatctgga1260gggaatccttggcatttaatccggatcctccctactaagagctcagagcaatttatcaat1320gctggcatctgaagatcggtagctctagaaaagccaaatccccttgctttgtgcatctat1380taattttatgcccacttgttgggcgaatgagcatggattattgttatagtgacaattttt1440cttaaggcctgtctaaagaaacaacatttgtattccttatcagatagcctgaacttgggc1500ctgtattataccggttgattgcataactgttcttatgtatctaagcctgtaattgtcttc1560<210>85<211>1641<212>dna<213>oryzasativa<400>85gcatcagctccacccccgaaaaatttctccccaatctcgcgaggctctcgtcgtcgaatc60gaatcctctcgcgtcctcaagatgcagatctttgtgaagacattgaccggcaagactatc120accctcgaggtggagtcctctgacaccatcgataatgtcaaggctaagatccaagataag180gagggcatccccccggaccagcagcgtctcatcttcgctggcaagcagctggaggatggc240aggacccttgctgactacaacatccagaaggagtcgacccttcaccttgtcctccgcctc300cgtggtggcatgcagatctttgtcaagactctgaccggcaagactatcacccttgaggtg360gagtcttctgacaccatcgacaacgtcaaggccaagatccaggacaaagagggcatcccc420ccagaccagcagcgtctcatcttcgccggcaagcagctggaggatggcaggacccttgct480gactacaacatccagaaggagtccaccctccaccttgtcctccgcctccgtggtggcatg540cagatctttgtcaagacactgaccggcaagaccatcaccctcgaggtggaatcttctgac600accatcgacaacgtcaaggccaagatccaggacaaggagggcattcccccggaccagcag660cgtctcatctttgccggcaagcagcttgaggacggcaggacccttgctgactacaacatc720cagaaggagtcaacgcttcaccttgtcctccgtctcaggggaggcatgcaaatcttcgtg780aagactctgaccggcaagaccatcaccctcgaggtggagtcttctgataccatcgacaat840gtcaaggccaagatccaggacaaggagggcattcccccggaccagcagcgcctcatcttt900gctggcaagcagctggaggatggcaggacccttgctgactacaacatccagaaggagtcc960accctccaccttgtgctccgccttcgtggtggtatgcagatctttgtcaagaccctcaca1020ggcaagaccatcaccctggaggttgagagctcggacaccatcgacaacgtcaaggccaag1080atccaggacaaggagggcatccccccagaccagcagcgtctcatcttcgccggcaagcag1140ctcgaggatggccgcaccctcgccgactacaacatccagaaggagtctaccctccacctg1200gtgcttcgtctccgtggtggtatgcagatcttcgtgaagaccttgactgggaagaccatc1260actttggaggttgagagctccgacaccattgataatgtgaaggccaagatccaggacaag1320gaggggattcccccagaccagcagcgtctgatcttcgctggcaagcagctggaggatgga1380cgcaccctcgccgactacaacatccagaaggagtccaccctccacctggtgctccgcctc1440cgtggtggtcagtaatcagccagtttggtggagctgccgatgtgcctggtcgtcccgagc1500ctctgttcgtcaagtatttgtggtgctgatgtctacttgtgtctggtttaatggaccatc1560gagtccgtatgatatgttagttttatgaaacagtttcctgtgggacagcagtatgcttta1620tgaataagttggatttgaacc1641<210>86<211>1971<212>dna<213>oryzasativa<400>86ggacaacttcctactcataggtgcttcgcaagtagcagcatccaagcactgaaaagtagt60cagcatgtgagctttggagtgaaatctcttgtcttaaggaataaaggaaaaagattccgt120cggaggctcggtgctctacaggttgtttgccaggactttccaagacctccactagaaaac180acaataaactttttggaagctggacaactatcttcatttttcagaaacagtgaacaaccc240actaaaccattacaggtcgtgattgctggagcaggattagctggtttatcaacggcaaaa300tatctggcagatgctggtcataaacccatattgcttgaggcaagggatgttttgggtgga360aagatagctgcttggaaggatgaagatggagattggtatgaaactgggcttcatatcttt420tttggagcttatcccaacatacagaacttgtttggcgagcttggtattaatgatcggttg480caatggaaggaacactccatgatatttgccatgccaaacaagccaggagaattcagccgg540tttgattttcctgaaacattgcctgcacccttaaatggaatatgggccatactaagaaac600aatgaaatgctaacttggccagagaaggtgaagtttgctcttggacttttgccagcaatg660gttggtggccaagcttatgttgaagctcaagatggttttactgtttctgagtggatgaaa720aagcagggtgttcctgatcgagtgaacgatgaggttttcattgcaatgtcaaaggcactt780aatttcataaatcctgatgagttatccatgcagtgcattctgattgctttaaaccgattt840cttcaggagaagcatggttctaagatggcattcttggatggtaatcctcctgaaaggtta900tgcatgcctattgttgaccatgttcgctctttgggtggtgaggttcggctgaattctcgt960attcagaaaatagaacttaatcctgatggaacagtgaaacactttgcacttactgatgga1020actcaaataactggagatgcttatgtttttgcaacaccagttgatatcttgaagcttctt1080gtacctcaagagtggaaagaaatatcttatttcaagaagctggagaagttggtgggagtt1140cctgttataaatgttcatatatggtttgatagaaaactgaagaacacatatgaccacctt1200cttttcagcaggagttcacttttaagtgtttatgcggacatgtcagtaacttgcaaggaa1260tactatgatccaaaccgttcaatgctggagttggtctttgctcctgcagaggaatgggtt1320ggacggagtgacactgaaatcatcgaagcaactatgcaagagctagccaagctatttcct1380gatgaaattgctgctgatcagagtaaagcaaagattctgaagtatcatgttgtgaagaca1440ccaagatctgtttacaagactatcccggactgtgaaccttgccgacctctgcaaagatca1500ccgattgaagggttctatctagctggtgactacacaaagcagaaatatttggcttcgatg1560gagggtgcagttctatctgggaagctttgtgctcagtctgtagtggaggattataaaatg1620ctatctcgtaggagcctgaaaagtctgcagtctgaagttcctgttgcctcctagttgtag1680tcaggactattcccaatggtgtgtgtgtcatcatcccctagtcagtttttttctatttag1740tgggtgcccaactctccaccaatttacacatgatggaacttgaaagatgcctattttggt1800cttatcatatttctgtaaagttgatttgtgactgagagctgatgccgatatgccatgctg1860gagaaaaagaacattatgtaaaacgacctgcatagtaattcttagacttttgcaaaaggc1920aaaaggggtaaagcgaccttttttttctatgtgaagggattaagagacctt1971<210>87<211>250<212>rna<213>artificialsequence<220><223>trna-grna-trnascheme<220><221>misc_feature<222>(78)..(97)<223>nisa,c,g,oru<400>87aacaaagcaccaguggucuagugguagaauaguacccugccacgguacagacccggguuc60gauucccggcuggugcannnnnnnnnnnnnnnnnnnnguuuuagagcuagaaauagcaag120uuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcaacaaag180caccaguggucuagugguagaauaguacccugccacgguacagacccggguucgauuccc240ggcuggugca250<210>88<211>100<212>rna<213>artificialsequence<220><223>grnafromptggene<220><221>misc_feature<222>(1)..(20)<223>nisa,c,g,oru<400>88nnnnnnnnnnnnnnnnnnnnguuuuagagcuagaaauagcaaguuaaaauaaggcuaguc60cguuaucaacuugaaaaaguggcaccgagucggugcaaca100<210>89<211>100<212>rna<213>artificialsequence<220><223>grnafromsgrnagene<220><221>misc_feature<222>(2)..(20)<223>nisa,c,g,oru<400>89annnnnnnnnnnnnnnnnnnguuuuagagcuagaaauagcaaguuaaaauaaggcuaguc60cguuaucaacuugaaaaaguggcaccgagucggugcuuuu100<210>90<211>27<212>dna<213>oryzasativa<400>90ccaaccattttccatggcgggaggttc27<210>91<211>26<212>dna<213>oryzasativa<400>91ccaaccatttccatggcgggaggttc26<210>92<211>26<212>dna<213>oryzasativa<400>92ttctccctccaggaggtggcaatcaa26<210>93<211>61<212>dna<213>oryzasativa<400>93ttctccctcctaatctggaccaaagtgctgtccgcctacaacaagaggaggtggcaatca60a61<210>94<211>29<212>dna<213>oryzasativa<400>94ttctcccctcctcaggaggtggcaatcaa29<210>95<211>27<212>dna<213>oryzasativa<400>95gcggccggtactcatggacaccgacct27<210>96<211>26<212>dna<213>oryzasativa<400>96gcggccggtatcatggacaccgacct26<210>97<211>24<212>dna<213>oryzasativa<400>97atcaccctttggccaagcggacac24<210>98<211>23<212>dna<213>oryzasativa<400>98atcaccctttgccaagcggacac23<210>99<211>27<212>dna<213>oryzasativa<400>99atcaccctttcgatgccaagcggacac27<210>100<211>31<212>dna<213>oryzasativa<400>100gcacggcggccggtatcatggacaccgacct31<210>101<211>32<212>dna<213>oryzasativa<400>101cgcgtgccaaccatttgccatggcgggaggtt32<210>102<211>85<212>dna<213>oryzasativa<400>102cgcacggcgccggtacctgctctacgacatcttcgggaacaagttcaacgacgtctacat60cgccacggagctcatggacaccgac85<210>103<211>87<212>dna<213>oryzasativa<400>103gtcggtgtccatgagctccgtggcgatgtagacgtcgttgaaacttgttcccgaagatgt60cgtagagcaggtaccggccgccgtgcg87<210>104<211>78<212>dna<213>oryzasativa<400>104gccaaccattttataccccggtgggccaccacccccacctatggagaacatccaggcgac60gctgagccatggcgggag78<210>105<211>78<212>dna<213>oryzasativa<400>105ctcccgccatggctcagcgtcgcctccatgttctccataggtgggggtggtggcccaccg60gggtataaaatggttggc78<210>106<211>92<212>dna<213>oryzasativa<400>106cctccttctccctccttgaggcgaccgggttcgtttcttggctgtgcggttgtgaatgcg60cagactcgtcaggaggtggcaatcaagaagat92<210>107<211>92<212>dna<213>oryzasativa<400>107atcttcttgattgccacctcctgacgagtctgcgcattcacaaccgcacagccaagaaac60gaacccggtcgcctcaaggagggagaaggagg92<210>108<211>86<212>dna<213>oryzasativa<400>108tgatcaaccctttgattgacccgcacccgcatccctttccccattcgacaaccatatcga60tgccaagcggacactgagagaaatca86<210>109<211>83<212>dna<213>oryzasativa<400>109tgatttctcagtgtccgcttggcatcgatatggttgtcgaatggggaaagggatgcgggt60gcgggtcaatcaaagggtgatca83<210>110<211>100<212>dna<213>artificialsequence<220><223>vector<400>110aaggaatctttaaacatgatttaaaagagttgtgcagatgatccgtggcaggagaccgag60gtctcggttttagagctagaaaccgagtcggtgctttttt100<210>111<211>100<212>dna<213>artificialsequence<220><223>vector<400>111aaaaaagcaccgactcggtttctagctctaaaaccgagacctcggtctcctgccacggat60catctgcacaactcttttaaatcatgtttaaagattcctt100<210>112<211>44<212>dna<213>oryzasativa<400>112agtggcaccgagtcggtgctttaagatgtcgtagagcaggtacg44<210>113<211>42<212>dna<213>oryzasativa<400>113agtggcaccgagtcggtgctaagatgtcgtagagcaggtacg42<210>114<211>43<212>dna<213>oryzasativa<400>114agtggcaccgagtcggtgcttaagatgtcgtagagcaggtacg43<210>115<211>46<212>dna<213>oryzasativa<400>115gtggcaccgagtcggtgctttttttagatgtcgtagagcaggtacg46<210>116<211>37<212>dna<213>oryzasativa<400>116ggcaccgagtcggtgctttacatcgccacggagctca37<210>117<211>44<212>dna<213>oryzasativa<400>117aagtggcaccgagtcggtgctttctacatcgccacggagctcag44<210>118<211>46<212>dna<213>oryzasativa<400>118agtggcaccgagtcggtgcaaagatgtcgtagagcaggtacaatcg46<210>119<211>47<212>dna<213>oryzasativa<400>119aaaagtggcaccgagtcggtgcaatctacatcgccacggagctcagt47<210>120<211>67<212>dna<213>oryzasativa<400>120cgcgtgccaaccatttataccccggtgggccacatccaggcgacgctgaaaccatggcgg60gaggttc67<210>121<211>63<212>dna<213>oryzasativa<400>121cgcgtgccaaccatttataccccggtgggccacatccaggcgacgctccatggcgggagg60ttc63<210>122<211>65<212>dna<213>oryzasativa<400>122cgcgtgccaaccatttataccccggtgggccacatccaggcgacgctgaccatggcggga60ggttc65<210>123<211>39<212>dna<213>oryzasativa<400>123tcctccttctccctcctgaggcgaccgggttcgaatgcg39<210>124<211>68<212>dna<213>oryzasativa<400>124tcctccttctccctcctttgaggcgaccgggttcgaatgcgcagactcgtctaggaggtg60gcaatcaa68<210>125<211>56<212>dna<213>oryzasativa<400>125tcctccttaggcgaccgggttcgaatgcgcagactcgtctaggaggtggcaatcaa56<210>126<211>61<212>dna<213>oryzasativa<400>126cgcacggcggccggtatacgacatcttctacatcgccacggagcatcatggacaccgacc60t61<210>127<211>52<212>dna<213>oryzasativa<400>127cgcacggcggccggtattctacatcgccacggagcttcatggacaccgacct52<210>128<211>32<212>dna<213>oryzasativa<400>128cgcacggcggccggtatcatggacaccgacct32<210>129<211>59<212>dna<213>oryzasativa<400>129ggtgtgatcacccttttacccgcacccgccattcgacaaccatattgccaagcggacac59<210>130<211>58<212>dna<213>oryzasativa<400>130ggtgtgatcaccctttatgacccgcacccgccattcgacaaccataccaagcggacac58<210>131<211>64<212>dna<213>oryzasativa<400>131ggtgtgatcaccctttagacccgcacccgccattcgacaaccatatacgatgccaagcgg60acac64<210>132<211>76<212>dna<213>oryzasativa<400>132gccatgccaaacaagccaggagaattcagccggtttgaaaatcctgatgagttatccatg60cagtgcattctgattg76<210>133<211>26<212>dna<213>oryzasativa<400>133ccatgccaaacaagccagccggttga26<210>134<211>31<212>dna<213>oryzasativa<400>134aaatcctgatatccatgcagtgcattctgat31<210>135<211>50<212>dna<213>oryzasativa<400>135cgcgtgccaaccatttataccccggtggccacatccatggcgggaggttc50<210>136<211>62<212>dna<213>oryzasativa<400>136cgcgtgccaaccaggggaccccggtgggccacatccaggcgacgctgaatggcgggaggt60tc62<210>137<211>68<212>dna<213>oryzasativa<400>137cgcgtgccaaccaaccattttataccccggtgggccacatccaggcgacgctccatggcg60ggaggttc68<210>138<211>65<212>dna<213>oryzasativa<400>138cgcgtgccaaccatttatataccccggtgggccacatccaggcgacgctccatggcggga60ggttc65<210>139<211>64<212>dna<213>oryzasativa<400>139cgcgtgccaaccattttatatcccggtgggccacatccaggcgacgctccatggcgggag60gttc64<210>140<211>63<212>dna<213>oryzasativa<400>140cgcgtgccaaccatttgtgccccggtgggccacatccaggcgacgctccatggcgggagg60ttc63<210>141<211>66<212>dna<213>oryzasativa<400>141tcctccttctccctccgaggcgaccgggttcgaatgcgcagactcgtcaaaggaggtggc60aatcaa66<210>142<211>68<212>dna<213>oryzasativa<400>142tcctccttctccctcctttgaggcgaccgggttcgaatgcgcagactcgtctaggaggtg60gcaatcaa68<210>143<211>68<212>dna<213>oryzasativa<400>143tcctccttctccctcctttgaggcgaccgggttcgaatgcgcagactcgtccaggaggtg60gcaatcaa68<210>144<211>54<212>dna<213>oryzasativa<400>144tcctccttaggcgaccgggttcgaatgcgcagactcgtcggaggtggcaatcaa54<210>145<211>54<212>dna<213>oryzasativa<400>145tcctccttaggcgaccgggttcgaatgcgcagactcgtcggaggtggcaatcaa54<210>146<211>71<212>dna<213>oryzasativa<400>146cgcacggcggccggtatcctgctctacgacatcttctctacatcgccacggagcctcatg60gacaccgacct71<210>147<211>57<212>dna<213>oryzasativa<400>147cgcacggcggccgcttctctacgacatcttctctacatcgctcatggacaccgacct57<210>148<211>56<212>dna<213>oryzasativa<400>148cgcacggcggccgctatctacgacatcttctctacatcgctcatggacaccgacct56<210>149<211>65<212>dna<213>oryzasativa<400>149cgcacggcggccgctatctacgacatcttctctacatcgccacggagcttcatggacacc60gacct65<210>150<211>58<212>dna<213>oryzasativa<400>150ggtgtgatcaccttgacccgcagggcgattcgacaaccatccgatgccaagcggacac58<210>151<211>26<212>dna<213>oryzasativa<400>151acccgcacccgctgccaagcggacac26<210>152<211>58<212>dna<213>oryzasativa<400>152ggtgtgatcaccctttaacccgcacccgcattcgacaaccatattgccaagcggacac58<210>153<211>53<212>dna<213>oryzasativa<400>153ggtgtgatcaccctttacacccgcattcgacaaccatattgccaagcggacac53<210>154<211>53<212>dna<213>oryzasativa<400>154ggtgtgatcaccctttacacccgcattcgacaaccatattgccaagcggacac53<210>155<211>57<212>dna<213>oryzasativa<400>155ggtgtgatcaccctttacacccgcattcgacaaccatatacgatgccaagcggacac57<210>156<211>55<212>prt<213>oryzasativa<400>156metaspalaglyalaglnproproaspthrglumetalaglualagly151015glyglyglnglnproproalaalaalaalaalaalaglyalaglyala202530glyalaglymetmetgluasnilehisglyglyargpheileglntyr354045asnilepheglyasnvalphe5055<210>157<211>59<212>prt<213>oryzasativa<400>157metaspalaglyalaglnproproaspthrglumetalaglualagly151015glyglyglnglnproproalaalaalaalaalaalaglyalaglyala202530glyalaglymetmetgluasnileglnalathrleuhisglyglyarg354045pheileglntyrasnilepheglyasnvalphe5055<210>158<211>59<212>prt<213>oryzasativa<400>158metaspalaglyalaglnproproaspthrglumetalaglualagly151015glyglyglnglnproproalaalaalaalaalaalaglyalaglyala202530glyalaglymetmetgluasnileglnalathrleuasnglyglyarg354045pheileglntyrasnilepheglyasnvalphe5055<210>159<211>21<212>prt<213>oryzasativa<400>159metaspglyalaprovalalaglupheargprothrmetthrhisgly151015glyargtyrproala20<210>160<211>19<212>prt<213>oryzasativa<400>160metaspglyalaprovalalaglupheargprothrmetthrhisgly151015glyargtyr<210>161<211>19<212>prt<213>oryzasativa<400>161metaspglyalaprovalalaglupheargprothrmetthrhisgly151015glyargtyr<210>162<211>19<212>prt<213>oryzasativa<400>162metaspglyalaprovalalaglupheargprothrmetthrhisgly151015glyargphe<210>163<211>31<212>prt<213>oryzasativa<400>163glycysalacysglyglycysglyglycyscysglyglythralathr151015cysalathrglyglyalacysalacyscysglyalacyscysthr202530<210>164<211>20<212>dna<213>artificialsequence<220><223>sg1targethumanhdac1<400>164gtaagaccaccgcactaggc20<210>165<211>20<212>dna<213>artificialsequence<220><223>sg2targethumanhdac1<400>165gccctgcagctattaccatt20<210>166<211>20<212>dna<213>artificialsequence<220><223>sg1targethumanhdac2<400>166gtattttaggatattggtgc20<210>167<211>20<212>dna<213>artificialsequence<220><223>sg2targethumanhdac2<400>167tgtttcaatctaacagtcaa20<210>168<211>20<212>dna<213>artificialsequence<220><223>sg1targethumanhdac3<400>168gagcagaactcaaagagccc20<210>169<211>20<212>dna<213>artificialsequence<220><223>sg2targethumanhdac3<400>169gctcaagtaagtagcccagg20<210>170<211>20<212>dna<213>artificialsequence<220><223>sg1targethumanhdac4<400>170gagctcctgaatacgtcgca20<210>171<211>20<212>dna<213>artificialsequence<220><223>sg2targethumanhdac4<400>171gctcctttgccgtccccgag20<210>172<211>20<212>dna<213>artificialsequence<220><223>sg1targethumanhdac6<400>172cgactggcagcaggacgtgc20<210>173<211>20<212>dna<213>artificialsequence<220><223>sg2targethumanhdac6<400>173caagctgatcctgtctctgg20<210>174<211>20<212>dna<213>artificialsequence<220><223>primer:genotypingofmpk1<400>174cctcgtgtttggtgttgctg20<210>175<211>20<212>dna<213>artificialsequence<220><223>primer:genotypingofmpk2<400>175tgcgcctaaaaatcgagggt20<210>176<211>21<212>dna<213>artificialsequence<220><223>primer:genotypingmpk2<400>176tttgggaagcatgtatgaagc21<210>177<211>20<212>dna<213>artificialsequence<220><223>primer:gentoypingmpk2<400>177tatgccagccaatgagccaa20<210>178<211>21<212>dna<213>artificialsequence<220><223>genotypingofmpk5<400>178gccaccttccttcctcatccg21<210>179<211>20<212>dna<213>artificialsequence<220><223>genotypingofmpk5<400>179actccgtcatcatgtcgctc20<210>180<211>21<212>dna<213>artificialsequence<220><223>genotypingofmpk6<400>180ttgacgccccaacataaataa21<210>181<211>18<212>dna<213>artificialsequence<220><223>genotypingofmpk6<400>181tgttgctgccgcttttct18<210>182<211>41<212>dna<213>artificialsequence<220><223>detectionofu3:ptg<400>182gaccatgattacgccaagcttaaggaatctttaaacatacg41<210>183<211>37<212>dna<213>artificialsequence<220><223>detectionofu3:ptg<400>183ggacctgcaggcatgcacgcgctaaaaacggactagc37<210>184<211>20<212>dna<213>artificialsequence<220><223>detectionofcas9<400>184gcttgtgcgtttcgatttga20<210>185<211>20<212>dna<213>artificialsequence<220><223>detectionofcas9<400>185ccgctcgtgcttcttatcct20<210>186<211>19<212>dna<213>artificialsequence<220><223>controlfordnaquality<400>186cgctgccactctccactga19<210>187<211>20<212>dna<213>artificialsequence<220><223>controlfordnaquality<400>187agctgcttccactcgttcca20<210>188<211>77<212>dna<213>artificialsequence<220><223>trna1forptg7<400>188aataaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccgggttc60gattcccggctggtgca77<210>189<211>77<212>dna<213>artificialsequence<220><223>trnausedforptg10<400>189aacaaagcaccagtggtctagtggtggaatagtaccctgccacggtacagacccgggttc60gattcccggctggtgca77當前第1頁12當前第1頁12
當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
高台县| 长岭县| 南昌市| 双辽市| 泽普县| 开原市| 遵义市| 临猗县| 固原市| 曲麻莱县| 上高县| 江山市| 商洛市| 城步| 胶南市| 达孜县| 静海县| 蓬溪县| 包头市| 仙游县| 卫辉市| 闽清县| 临漳县| 永清县| 屯留县| 商河县| 通山县| 台北县| 丹棱县| 稷山县| 普安县| 大城县| 吴堡县| 南溪县| 福鼎市| 金华市| 惠水县| 大洼县| 砀山县| 阳春市| 壤塘县|