本申請要求享受2013年11月4日遞交的美國臨時專利申請第61/899,598號在35U.S.C.§119(e)下的權(quán)益,將上述申請的內(nèi)容全部通過并入本申請。對電子提交的序列表的援引序列表的正式拷貝作為ASCII格式的序列表通過EFS-Web電子遞交,文件名為“7560232316_SeqList_ST25.txt”,于2014年10月31日提交,大小為13兆字節(jié),與說明書同時提交。該ASCII格式文檔中包含的序列表是說明書的一部分,在此通過提述將其全文并入本申請。對電子提交的表格列表的援引表格列表的正式拷貝以.PDF格式的表格列表的形式通過EFS-Web電子提交,文件名為“Table3”,于2013年11月4日生成,大小為8兆字節(jié),與說明書同時提交。該.PDF格式文檔中包含的序列表是說明書的一部分,在此通過提述將其全文并入本申請。背景人們在1990年代早期即已成功地用轉(zhuǎn)基因轉(zhuǎn)化了玉米基因組。在過去的二十年內(nèi),人們已經(jīng)開發(fā)了多種用于轉(zhuǎn)化玉米基因組的方法學(xué),例如其中轉(zhuǎn)基因被穩(wěn)定地整合到玉米基因組中。玉米轉(zhuǎn)化方法學(xué)的這種演變的結(jié)果是人們有能力成功地將包含農(nóng)藝性狀的轉(zhuǎn)基因?qū)雴巫尤~植物,例如玉米的基因組內(nèi)。在1990年代晚期實現(xiàn)的單子葉植物內(nèi)昆蟲抗性和除草劑耐受性狀的導(dǎo)入為生產(chǎn)者提供了一項新穎而方便的技術(shù)革新用于控制昆蟲和廣譜的雜草,這當(dāng)時在種植農(nóng)業(yè)方法中是無可匹敵的。目前,轉(zhuǎn)基因玉米在全世界都有市售,且新的轉(zhuǎn)基因玉米產(chǎn)品,例如EnlistTM玉米,為日益嚴(yán)峻的雜草挑戰(zhàn)提供了改進(jìn)的解決方案。若非有轉(zhuǎn)基因方法學(xué)的研發(fā)和改進(jìn),轉(zhuǎn)基因玉米在現(xiàn)代農(nóng)藝學(xué)實踐中的利用是不可能的。然而,現(xiàn)有的轉(zhuǎn)基因玉米轉(zhuǎn)化方法學(xué)依賴轉(zhuǎn)基因在玉米基因組中的隨機(jī)插入。依賴基因在基因組中的隨機(jī)插入有若干不利之處。轉(zhuǎn)基因事件可能隨機(jī)地整合在基因轉(zhuǎn)錄序列中,進(jìn)而破壞內(nèi)源性狀的表達(dá)并改變玉米植物的生長和發(fā)育。此外,轉(zhuǎn)基因事件可能無差別地整合到玉米基因組中容易受到基因沉默的位置內(nèi),以第一代或后續(xù)世代的轉(zhuǎn)基因玉米植物中轉(zhuǎn)基因表達(dá)的減少或完全抑制告終。最后,轉(zhuǎn)基因在玉米基因組內(nèi)的隨機(jī)整合需要可觀的工作量和成本來鑒定轉(zhuǎn)基因事件的位置并選擇如設(shè)計的那樣表現(xiàn)、不對植物產(chǎn)生農(nóng)藝學(xué)影響的轉(zhuǎn)基因事件。需要持續(xù)開發(fā)新的測定法來為每種轉(zhuǎn)基因事件,例如玉米事件,確定整合的轉(zhuǎn)基因的確切位置。植物轉(zhuǎn)化方法學(xué)的隨機(jī)性導(dǎo)致整合的轉(zhuǎn)基因的“位置效應(yīng)”,阻礙了玉米轉(zhuǎn)化方法學(xué)的有效性和效率。植物的靶向基因組修飾已經(jīng)成為應(yīng)用研究和基礎(chǔ)研究的一個長期未能達(dá)到且難以達(dá)到的目標(biāo)。將基因和基因堆疊靶向到玉米基因組中的特定位置將會改善轉(zhuǎn)基因事件的質(zhì)量,降低產(chǎn)生轉(zhuǎn)基因事件的相關(guān)成本,并提供制造轉(zhuǎn)基因植物產(chǎn)品的新方法,例如順序性基因堆疊??偟膩碚f,將轉(zhuǎn)基因靶向特定基因組位點很可能是商業(yè)上有利的。過去幾年中,用于通過位點特異性核酸酶(例如鋅指核酸酶(ZFN)、大范圍核酸酶、轉(zhuǎn)錄激活物樣效應(yīng)物核酸酶(TALENS)、以及成簇規(guī)則間隔短回文重復(fù)/CRISPR-相關(guān)核酸酶(CRISPR/Cas)結(jié)合工程化crRNA/tracrRNA)靶向和切割基因組DNA,以誘導(dǎo)靶向突變、誘導(dǎo)細(xì)胞DNA的靶向刪除、以及易化外源供體DNA多核苷酸在預(yù)定的基因組座位內(nèi)的靶向重組的方法和組合物的開發(fā)已經(jīng)取得了顯著的進(jìn)展。參見例如,美國專利公開號20030232410;20050208489;20050026157;20050064474;和20060188987,和國際專利公開號WO2007/014275,將它們的公開通過提述并入本申請用于所有目的。美國專利公開號20080182332描述了非經(jīng)典鋅指核酸酶(ZFN)用于植物基因組的靶向修飾的用途,美國專利公開號20090205083描述了植物EPSP基因組座位的ZFN介導(dǎo)的靶向修飾。現(xiàn)有的外源DNA靶向插入的方法涉及用含有至少一種轉(zhuǎn)基因的供體DNA多核苷酸與位點特異性核酸酶(例如ZFN)共轉(zhuǎn)化植物組織,其中位點特異性核酸酶設(shè)計為結(jié)合并切割活躍轉(zhuǎn)錄的編碼序列的特定基因組座位。這導(dǎo)致供體DNA多核苷酸穩(wěn)定地插入被切割的基因組座位內(nèi),結(jié)果實現(xiàn)在包含活躍轉(zhuǎn)錄的編碼序列的規(guī)定基因組座位處的靶向基因添加。一種替代的途徑是將轉(zhuǎn)基因靶向到玉米基因組預(yù)先選擇的靶標(biāo)非基因座位。近年來,已經(jīng)開發(fā)出數(shù)種將轉(zhuǎn)基因靶向投遞到玉米基因組中的技術(shù),并在植物細(xì)胞中加以應(yīng)用。然而,關(guān)于適合靶向的基因組位點的屬性則知之甚少。過去歷來用基因組中的非關(guān)鍵基因及病原體(病毒)整合位點作為靶向的座位。此類位點在基因組中的數(shù)目相當(dāng)有限,因此有需要鑒定和表征能夠用于靶向供體多核苷酸序列的最優(yōu)可靶向基因組座位。除了易于靶向之外,預(yù)期最優(yōu)基因組座位是中性位點,能夠支持轉(zhuǎn)基因表達(dá)和育種應(yīng)用。需要組合物和方法來界定玉米基因組內(nèi)供靶向轉(zhuǎn)基因整合用的最優(yōu)非基因座位的鑒定標(biāo)準(zhǔn)。概要依照一個實施方案,提供一種重組序列,其包含最優(yōu)非基因玉米基因組序列和外源序列,其中外源序列插入在最優(yōu)非基因玉米基因組序列中。在一個實施方案中,本主題公開涉及一種重組序列,其包含:至少1Kb的核酸序列,其與選自下組的非基因序列具有至少90%、95%或99%序列同一性:loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053),loci_136086_G1(SEQIDNO:4425),loci_203704_G1(SEQIDNO:2033),loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_291068_G1(SEQIDNO:3230),loci_232222_G1(SEQIDNO:3357),loci_43577_G1(SEQIDNO:3428),loci_204726_G1(SEQIDNO:424),loci_232228_G1(SEQIDNO:4529),且所述非基因序列中插入有感興趣的DNA。在一個實施方案中,最優(yōu)非基因玉米基因組序列中感興趣的DNA的插入通過改變插入位點鄰近處的非基因座位而修飾該非基因座位的原始序列。這樣的修飾包括,例如,缺失、倒位、插入、和非基因座位序列的重復(fù)。在一個進(jìn)一步的方面,一個實施方案涉及一種感興趣的DNA,其中該感興趣的DNA插入在所述非基因序列中。在另一個方面,一個實施方案包括所述重組序列,其中感興趣的DNA插入在表8的鋅指靶位點的鄰近處。在另一個方面,一個實施方案包括所述重組序列,其中感興趣的DNA插入在表8的鋅指靶位點處。在另一個實施方案中,所述重組序列包含插入的感興趣的DNA,該感興趣的DNA進(jìn)一步包含分析域。在另一個實施方案中,所述重組序列包含插入的感興趣的DNA,該感興趣的DNA不編碼肽。在進(jìn)一步的一個實施方案中,所述重組序列包含感興趣的DNA,該感興趣的DNA編碼肽。在又一個實施方案中,所述重組序列包含感興趣的DNA,該感興趣的DNA進(jìn)一步包含基因表達(dá)盒。在一個實施方案中,所述基因表達(dá)盒含有基因,包括殺蟲劑抗性基因、除草劑耐性基因、氮利用效率基因、水分利用效率基因、營養(yǎng)品質(zhì)基因、DNA結(jié)合基因、和選擇標(biāo)志物基因。在進(jìn)一步的一個實施方案中,所述重組序列包含兩個或更多個基因表達(dá)盒。在另一個實施方案中,所述重組序列包含兩個或更多個所述非基因序列,每個非基因序列均包含插入的感興趣的DNA,從而產(chǎn)生兩個或更多個重組序列,其中該兩個或更多個重組序列位于相同的染色體上。在額外一個實施方案中,所述重組序列包含感興趣的DNA和/或非基因序列,其在所述感興趣的DNA插入該非基因序列的過程中被修飾。在另一個實施方案中,本主題公開涉及包含重組序列的玉米植物、玉米植物部分、或玉米植物細(xì)胞,所述重組序列包含這樣的核酸序列,核酸序列為至少1Kb,且與選自下組的非基因序列具有至少90%、95%或99%序列同一性:loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053),loci_136086_G1(SEQIDNO:4425),loci_203704_G1(SEQIDNO:2033),loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_291068_G1(SEQIDNO:3230),loci_232222_G1(SEQIDNO:3357),loci_43577_G1(SEQIDNO:3428),loci_204726_G1(SEQIDNO:424),loci_232228_G1(SEQIDNO:4529),且所述非基因序列中插入有感興趣的DNA。在進(jìn)一步的一個實施方案中,本公開涉及一種制造包含感興趣的DNA的轉(zhuǎn)基因植物細(xì)胞的方法。在該公開的另一個方面,該方法包括選擇與選自下組的靶非基因玉米基因組座位具有至少90%、95%或99%序列同一性的靶非基因玉米基因組座位:loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053),loci_136086_G1(SEQIDNO:4425),loci_203704_G1(SEQIDNO:2033),loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_291068_G1(SEQIDNO:3230),loci_232222_G1(SEQIDNO:3357),loci_43577_G1(SEQIDNO:3428),loci_204726_G1(SEQIDNO:424),和loci_232228_G1(SEQIDNO:4529);選擇特異性結(jié)合并切割所述靶非基因玉米基因組座位的位點特異性核酸酶;將所述位點特異性核酸酶導(dǎo)入玉米植物細(xì)胞中;將感興趣的DNA導(dǎo)入所述植物細(xì)胞中;將該感興趣的DNA插入所述靶非基因玉米基因組座位中;并且,選擇包含靶向到所述非基因座位中的感興趣的DNA的轉(zhuǎn)基因植物細(xì)胞。在一個進(jìn)一步的方面,一個實施方案涉及一種制造轉(zhuǎn)基因植物細(xì)胞的方法。在另一個實施方案中,感興趣的DNA包含分析域。在一個實施方案中,感興趣的DNA不編碼肽。在又一個實施方案中,感興趣的DNA編碼肽。在進(jìn)一步的一個實施方案中,感興趣的DNA包含基因表達(dá)盒,所述基因表達(dá)盒包含轉(zhuǎn)基因。在另一個實施方案中,感興趣的DNA包含兩個或更多個基因表達(dá)盒。在一個接下來的實施方案之后,位點特異性核酸酶選自鋅指核酸酶、CRISPR核酸酶、TALEN、歸巢內(nèi)切核酸酶、或大范圍核酸酶。在一個實施方案中,感興趣的DNA通過同源性指導(dǎo)的修復(fù)整合法整合在所述非基因座位內(nèi)。在另一個實施方案中,感興趣的DNA通過非同源末端連接整合法插入在所述非基因座位內(nèi)。在進(jìn)一步的一個實施方案中,制造轉(zhuǎn)基因植物細(xì)胞的方法提供兩個或更多個所述感興趣的DNA,它們插入在兩個或更多個所述的靶非基因玉米基因組座位內(nèi)。在另一個實施方案中,制造轉(zhuǎn)基因植物細(xì)胞的方法包括兩個或更多個所述的靶非基因玉米基因組座位,它們位于相同的染色體上。在額外一個實施方案中,制造轉(zhuǎn)基因植物細(xì)胞的方法包括感興趣的DNA和/或非基因序列,它們在所述感興趣的DNA插入該非基因序列的過程中被修飾。依照一個實施方案,本文中公開一種純化的玉米多核苷酸座位,其中該純化的序列包含至少1Kb的非基因序列。在一個實施方案中,該非基因序列是低甲基化的,例示(ememplify)重組的證據(jù),并且在玉米基因組中位于表達(dá)的基因區(qū)的鄰近位置。在一個實施方案中,非基因區(qū)具有約1Kb至約8.4Kb的長度。在一個實施方案中,感興趣的DNA包含外源DNA序列,包括例如調(diào)控序列、限制性切割序列、RNA編碼區(qū)或蛋白質(zhì)編碼區(qū)。在一個實施方案中,感興趣的DNA包含基因表達(dá)盒,所述基因表達(dá)盒包含一個或多個轉(zhuǎn)基因。在另一個實施方案中,純化的序列包含這樣的非基因序列,該非基因序列與選自下組的非基因序列具有至少90%、95%或99%序列同一性:loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053),loci_136086_G1(SEQIDNO:4425),loci_203704_G1(SEQIDNO:2033),loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_291068_G1(SEQIDNO:3230),loci_232222_G1(SEQIDNO:3357),loci_43577_G1(SEQIDNO:3428),loci_204726_G1(SEQIDNO:424),andloci_232228_G1(SEQIDNO:4529).在進(jìn)一步的一個實施方案中,所述純化的非基因玉米基因組座位包含感興趣的DNA,其中該感興趣的DNA插入在所述非基因序列中。在另一個方面,一個實施方案包括所述純化的非基因玉米基因組座位,其中所述感興趣的DNA插入在表8所示的鋅指靶位點鄰近處。在一個不同的方面,一個實施方案包含所述純化的非基因玉米基因組座位,其中所述感興趣的DNA插入在成對的選自表8的鋅指靶位點之間。在又一個方面,一個實施方案包含所述純化的非基因玉米基因組座位以及插入在所述非基因玉米基因組座位中的感興趣的DNA,其中所述感興趣的DNA包含分析域。在另一個方面,一個實施方案包括純化的重組非基因玉米基因組座位,其中所述感興趣的DNA不編碼肽。在一個接下來的方面,一個實施方案包括純化的重組非基因玉米基因組座位,其中所述感興趣的DNA編碼肽。在一個實施方案中,純化的重組非基因玉米基因組座位包含基因表達(dá)盒,其中該基因表達(dá)盒包含基因,該基因包括,例如,殺蟲劑抗性基因、除草劑耐性基因、氮利用效率基因、水分利用效率基因、營養(yǎng)品質(zhì)基因、DNA結(jié)合基因、和選擇標(biāo)志物基因。在一個實施方案中,使用位點特異性核酸酶將感興趣的DNA插入在所述非基因玉米基因組座位中,其中該位點特異性核酸酶選自鋅指核酸酶、CRISPR核酸酶、TALEN、歸巢內(nèi)切核酸酶、或大范圍核酸酶。在一個實施方案中,感興趣的DNA通過同源性指導(dǎo)的修復(fù)整合法整合在所述非基因序列內(nèi)。在另一個實施方案中,感興趣的DNA通過非同源末端連接整合法插入在所述非基因序列內(nèi)。在進(jìn)一步的一個實施方案中,感興趣的DNA包含兩個或更多個基因表達(dá)盒。在進(jìn)一步的一個實施方案中,兩個或更多個感興趣的DNA插入在兩個或更多個所述靶非基因玉米基因組座位中。在一個實施方案中,提供兩個或更多個所述靶非基因玉米基因組座位,其中每一個均包含插入的感興趣的DNA,從而產(chǎn)生兩個或更多個重組序列,其中所述靶非基因玉米基因組座位位于相同的染色體上。在額外一個實施方案中,純化的非基因玉米基因組包含感興趣的DNA和/或非基因序列,其在所述感興趣的DNA插入該非基因序列的過程中被修飾。在另一個實施方案中,感興趣的DNA通過同源性指導(dǎo)的修復(fù)或非同源末端連接修復(fù)機(jī)制而插入。在另一個實施方案中,本主題公開提供包含重組序列的植物,所述重組序列包括:感興趣的DNA,以及與非基因序列具有至少90%、95%或99%序列同一性的核酸序列,其中感興趣的DNA插入在所述非基因序列中。在另一個實施方案中,所述非基因序列選自下組:loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053),loci_136086_G1(SEQIDNO:4425),loci_203704_G1(SEQIDNO:2033),loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_291068_G1(SEQIDNO:3230),loci_232222_G1(SEQIDNO:3357),loci_43577_G1(SEQIDNO:3428),loci_204726_G1(SEQIDNO:424),和loci_232228_G1(SEQIDNO:4529)。在額外一個實施方案中,該植物包含兩個或多個所述的重組序列。在一個進(jìn)一步的實施方案中,該植物包含位于相同染色體上的兩個重組序列。在另一個實施方案中,該植物包含插入在表8的鋅指靶位點的鄰近處的感興趣的DNA。在一個實施方案中,該植物包含插入在成對的選自表8的鋅指靶位點之間的感興趣的DNA。在一個實施方案中,所述感興趣的DNA包含分析域。在進(jìn)一步的一個實施方案中,所述感興趣的DNA不編碼肽。在又一個實施方案中,所述感興趣的DNA編碼肽。在接下來的一個實施方案中,所述感興趣的DNA包含基因表達(dá)盒,該基因表達(dá)盒編碼基因產(chǎn)物,包括例如,殺蟲劑抗性基因、除草劑耐性基因、氮利用效率基因、水分利用效率基因、營養(yǎng)品質(zhì)基因、DNA結(jié)合基因、和選擇標(biāo)志物基因。在另一個實施方案中,所述植物包含包含感興趣的DNA和/或非基因序列,其在所述感興趣的DNA插入該非基因序列的過程中被修飾。在一個實施方案中,本主題公開涉及一種重組序列,其包括:至少1Kb的核酸序列,其與選自下組的非基因序列具有至少90%、95%或99%序列同一性:loci_137693_G1(SEQIDNO:387),loci_203075_G1(SEQIDNO:2030),和loci_204637_G1(SEQIDNO:2731),且感興趣的DNA插入在所述非基因序列中。在一個實施方案中,本主題公開涉及一種重組序列,其包含:至少1Kb的核酸序列,其與選自下組的非基因序列具有至少90%、95%或99%序列同一性:loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),和loci_232484_G1(SEQIDNO:2053),且感興趣的DNA插入在所述非基因序列中。在一個實施方案中,主題公開涉及一種重組序列,其包含:至少1Kb的核酸序列,其與選自下組的非基因序列具有至少90%、95%或99%序列同一性:loci_127268_G1(SEQIDNO:2709),loci_232222_G1(SEQIDNO:3357),和loci_204726_G1(SEQIDNO:424),且感興趣的DNA插入在所述非基因序列中。在一個實施方案中,主題公開涉及一種重組序列,其包含:至少1Kb的核酸序列,其與選自下組的非基因序列具有至少90%、95%或99%序列同一性:loci_136086_G1(SEQIDNO:4425),loci_203704_G1(SEQIDNO:2033),loci_291068_G1(SEQIDNO:3230),loci_43577_G1(SEQIDNO:3428),和loci_232228_G1(SEQIDNO:4529),且感興趣的DNA插入在所述非基因序列中。在一個實施方案中,主題公開涉及一種重組序列,其包含:至少1Kb的核酸序列,其與選自下組的非基因序列具有至少90%、95%或99%序列同一性:loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053),和loci_204637_G1(SEQIDNO:2731),且感興趣的DNA插入在所述非基因序列中。在一個實施方案中,主題公開涉及一種重組序列,其包含:至少1Kb的核酸序列,其與選自下組的非基因序列具有至少90%、95%或99%序列同一性:loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053),loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_232222_G1(SEQIDNO:3357),和loci_204726_G1(SEQIDNO:424),且感興趣的DNA插入在所述非基因序列中。在一個實施方案中,主題公開涉及一種重組序列,其包含:至少1Kb的核酸序列,其與選自下組的非基因序列具有至少90%、95%或99%序列同一性:loci_136086_G1(SEQIDNO:4425),loci_203704_G1(SEQIDNO:2033),loci_127268_G1(SEQIDNO:2709),loci_291068_G1(SEQIDNO:3230),loci_232222_G1(SEQIDNO:3357),loci_43577_G1(SEQIDNO:3428),loci_204726_G1(SEQIDNO:424),和loci_232228_G1(SEQIDNO:4529),且感興趣的DNA插入在所述非基因序列中。附圖簡要說明圖1:從玉米栽培種B73之1號染色體獲得的根和芽組織的DNA甲基化概貌的擺動作圖(wiggleplot)的截屏樣本。圖2:所得的玉米栽培種B73基因組中低甲基化基因組位置的多核苷酸序列長度的分布圖3.呈現(xiàn)一幅5,286個最優(yōu)玉米座位的三維圖。利用主成分分析(PCA)統(tǒng)計學(xué)手段將該組5,286個鑒定出的最優(yōu)基因組座位基于它們的特征值聚類為32個獨特的類簇(見實施例1)。在PCA過程中,生成了5個主成分(PC),最高的三個PC包含了該數(shù)據(jù)集中總變異的約90%。在如圖3中所示的一幅三維作圖中,使用這三個最高的PCA來圖形表示該32個類簇。圖4.提供了81個最優(yōu)基因組座位的染色體分布的示意圖,以及它們在玉米染色體上的相對位置。圖5.提供了顯示72個最優(yōu)基因組座位在為靶向驗證而選擇的玉米B104栽培種及Hi-II栽培種的基因組數(shù)據(jù)庫內(nèi)的覆蓋度的圖。圖6.提供了為靶向驗證而選擇的72個最優(yōu)基因組座位的玉米染色體位置的示意圖。圖7.提供了pDAB111845(SEQIDNO:5418)的質(zhì)粒圖。帶數(shù)字的元件(即,5,7,8,9,10,11,12,15,16,25和26)對應(yīng)長度約20-35個堿基對的鋅指核酸酶結(jié)合序列,它們被相應(yīng)的鋅指核酸酶蛋白識別和切割。這些鋅指結(jié)合序列以及經(jīng)注釋的“UZI序列”(其是100-150bp的模板區(qū),含有限制位點和用于引物設(shè)計的DNA序列或編碼序列)構(gòu)成通用供體盒。圖8.用于通過非同源末端連接(NHEJ)整合的通用供體多核苷酸序列的展示。提供了兩種建議的載體,其中感興趣的DNA(DNAX)包含位于該感興趣的DNA的任意末端的一個或多個(即“1-N”)鋅指結(jié)合位點(ZFNBS)。垂直箭頭顯示獨特的限制性位點,水平箭頭代表潛在的PCR引物位點。圖9.用于通過同源定向修復(fù)(HDR)的整合的通用供體多核苷酸序列的展示。感興趣的DNA序列(DNAX)包含兩個側(cè)翼于感興趣的DNA序列的同源序列(HA)區(qū)域,而鋅指核酸酶結(jié)合位點(ZFN)包夾所述DNAX和HA序列。垂直的箭頭顯示獨特的限制性位點,水平的箭頭表示潛在的PCR引物位點。圖10A-10C。例示了用于靶向和驗證在玉米最優(yōu)基因組座位的靶向和驗證內(nèi)的通用供體多核苷酸系統(tǒng)整合的構(gòu)建體。圖10A)ZFN設(shè)計空間,其中ZFN對的位置如前文圖5的pDAB111845中所示。各ZFN對以數(shù)字標(biāo)記,對應(yīng)于被ZFN蛋白特異性識別以結(jié)合和切割的特異性ZFN結(jié)合序列。圖10B)ZFN表達(dá)構(gòu)建體的構(gòu)造。該ZFN表達(dá)構(gòu)建體含有一組成型植物啟動子(ZmUbil),用于驅(qū)動ZFN蛋白的表達(dá)。該ZFN蛋白含有核定位序列(ZLS)、鋅指蛋白(ZFP-L和ZFP-R,其中L表示左手結(jié)合ZFN蛋白,R表示右手結(jié)合ZFN蛋白),F(xiàn)ok-1內(nèi)切核酸酶(Fok1),以及自水解2A(2A)。圖10C)用于玉米最優(yōu)基因組座位的NHEJ介導(dǎo)靶向的通用供體多核苷酸。Z1-Z6代表對玉米最優(yōu)基因組座位靶標(biāo)特異性的ZFN結(jié)合位點。ZFN位點的數(shù)目可在3-6之間變化。豎直的箭頭顯示獨特的限制位點,水平的箭頭代表潛在的PCR引物位點。該通用供體多核苷酸系統(tǒng)是一個短(110bp)序列,是用于在玉米最優(yōu)基因組座位內(nèi)整合的各供體所共有的。圖11.pDAB8393的質(zhì)粒圖。圖12.玉米的選定基因組座位靶標(biāo)處的ZFN切割活性。切割活性表示為每1百萬個高品質(zhì)讀段中在ZFN切割位點處具有插入缺失(插入和缺失)的序列的數(shù)目。圖13.利用基于NHEJ的快速靶向分析(RTA)法對玉米選定基因組座位靶標(biāo)的驗證。圖14和14B.藉由隨機(jī)整合轉(zhuǎn)化到玉米中的質(zhì)粒構(gòu)建體,它們包含用于側(cè)翼序列分析和轉(zhuǎn)基因表達(dá)研究的事件。圖14代表pDAB105817,一個1871bp片段的插入;圖14B代表了pEPS105817的6128pb片段的插入。圖15.pDAB111846(SEQIDNO:5419)的質(zhì)粒圖。帶數(shù)字的元件(即,1,2,5,6,11,12,15,16,21,22,29和30)對應(yīng)于長度約20-35個堿基對、被相應(yīng)的鋅指核酸酶蛋白切割的鋅指核酸酶結(jié)合序列。這些鋅指結(jié)合序列和標(biāo)注的“UZI序列”(100-150bp的模板區(qū),含有限制位點和用于引物設(shè)計的DNA序列或編碼序列)構(gòu)成通用供體盒。圖16.pDAB117415(SEQIDNO:5420)的質(zhì)粒圖。帶數(shù)字的元件(即,ZFN51和ZFN52)對應(yīng)于長度約20至35個堿基對的鋅指核酸酶結(jié)合序列,其被相應(yīng)的鋅指核酸酶蛋白質(zhì)識別并切割。這些鋅指結(jié)合序列以及被標(biāo)注的“UZI序列”(其為100-150bp的模板區(qū),含有限制性位點和用于引物設(shè)計的DNA或編碼序列)構(gòu)成通用供體盒。該質(zhì)粒設(shè)計還包含“104113重疊”,其是與質(zhì)粒載體有同源性的序列,用于通用供體盒在質(zhì)粒載體內(nèi)的高通量組裝(即通過Gibson組裝)。圖17.pDAB117416(SEQIDNO:5421)的質(zhì)粒圖。帶數(shù)字的元件(即,ZFN54和ZFN53)對應(yīng)于長度約20至35個堿基對的鋅指核酸酶結(jié)合序列,其被相應(yīng)的鋅指核酸酶蛋白質(zhì)識別并切割。這些鋅指結(jié)合序列以及被標(biāo)注的“UZI序列”(其為100-150bp的模板區(qū),含有限制性位點和用于引物設(shè)計的DNA或編碼序列)構(gòu)成通用供體盒。該質(zhì)粒設(shè)計還包含“104113重疊”,其是與質(zhì)粒載體有同源性的序列,用于通用供體盒在質(zhì)粒載體內(nèi)的高通量組裝(即通過Gibson組裝)。圖18.pDAB117417(SEQIDNO:5422)的質(zhì)粒圖。帶數(shù)字的元件(即,ZFN55)對應(yīng)于長度約20至35個堿基對的鋅指核酸酶結(jié)合序列,其被相應(yīng)的鋅指核酸酶蛋白質(zhì)識別并切割。這些鋅指結(jié)合序列以及被標(biāo)注的“UZI序列”(其為100-150bp的模板區(qū),含有限制性位點和用于引物設(shè)計的DNA或編碼序列)構(gòu)成通用供體盒。該質(zhì)粒設(shè)計還包含“104113重疊”,其是與質(zhì)粒載體有同源性的序列,用于通用供體盒在質(zhì)粒載體內(nèi)的高通量組裝(即通過Gibson組裝)。圖19.pDAB117419(SEQIDNO:5423)的質(zhì)粒圖。帶數(shù)字的元件(即,ZFN59和ZFN60)對應(yīng)于長度約20至35個堿基對的鋅指核酸酶結(jié)合序列,其被相應(yīng)的鋅指核酸酶蛋白質(zhì)識別并切割。這些鋅指結(jié)合序列以及被標(biāo)注的“UZI序列”(其為100-150bp的模板區(qū),含有限制性位點和用于引物設(shè)計的DNA或編碼序列)構(gòu)成通用供體盒。該質(zhì)粒設(shè)計還包含“104113重疊”,其是與質(zhì)粒載體有同源性的序列,用于通用供體盒在質(zhì)粒載體內(nèi)的高通量組裝(即通過Gibson組裝)。圖20pDAB117434(SEQIDNO:5424)的質(zhì)粒圖。帶數(shù)字的元件(即,ZFN66,ZFN67,ZFN68和ZFN69)對應(yīng)于長度約20至35個堿基對的鋅指核酸酶結(jié)合序列,其被相應(yīng)的鋅指核酸酶蛋白質(zhì)識別并切割。這些鋅指結(jié)合序列以及被標(biāo)注的“UZI序列”(其為100-150bp的模板區(qū),含有限制性位點和用于引物設(shè)計的DNA或編碼序列)構(gòu)成通用供體盒。該質(zhì)粒設(shè)計還包含“104113重疊”,其是與質(zhì)粒載體有同源性的序列,用于通用供體盒在質(zhì)粒載體內(nèi)的高通量組裝(即通過Gibson組裝)。圖21pDAB117418(SEQIDNO:5425)的質(zhì)粒圖。帶數(shù)字的元件(即,ZFN56,ZFN57,和ZFN58)對應(yīng)于長度約20至35個堿基對的鋅指核酸酶結(jié)合序列,其被相應(yīng)的鋅指核酸酶蛋白質(zhì)識別并切割。這些鋅指結(jié)合序列以及被標(biāo)注的“UZI序列”(其為100-150bp的模板區(qū),含有限制性位點和用于引物設(shè)計的DNA或編碼序列)構(gòu)成通用供體盒。該質(zhì)粒設(shè)計還包含“104113重疊”,其是與質(zhì)粒載體有同源性的序列,用于通用供體盒在質(zhì)粒載體內(nèi)的高通量組裝(即通過Gibson組裝)。圖22.pDAB117420(SEQIDNO:5426)的質(zhì)粒圖。帶數(shù)字的元件(即,ZFN61和ZFN62)對應(yīng)于長度約20至35個堿基對的鋅指核酸酶結(jié)合序列,其被相應(yīng)的鋅指核酸酶蛋白質(zhì)識別并切割。這些鋅指結(jié)合序列以及被標(biāo)注的“UZI序列”(其為100-150bp的模板區(qū),含有限制性位點和用于引物設(shè)計的DNA或編碼序列)構(gòu)成通用供體盒。該質(zhì)粒設(shè)計還包含“104113重疊”,其是與質(zhì)粒載體有同源性的序列,用于通用供體盒在質(zhì)粒載體內(nèi)的高通量組裝(即通過Gibson組裝)。圖23.pDAB117421(SEQIDNO:5427)的質(zhì)粒圖。帶數(shù)字的元件(即,PPL17對3,PPL17對1,和PPL17對2)對應(yīng)于長度約20至35個堿基對的鋅指核酸酶結(jié)合序列,其被相應(yīng)的鋅指核酸酶蛋白質(zhì)識別并切割。這些鋅指結(jié)合序列以及被標(biāo)注的“UZI序列”(其為100-150bp的模板區(qū),含有限制性位點和用于引物設(shè)計的DNA或編碼序列)構(gòu)成通用供體盒。該質(zhì)粒設(shè)計還包含“104113重疊”,其是與質(zhì)粒載體有同源性的序列,用于通用供體盒在質(zhì)粒載體內(nèi)的高通量組裝(即通過Gibson組裝)。圖24A-24C.鑒定出的最優(yōu)非基因玉米座位的特征(長度、在座位40Kb以內(nèi)的編碼區(qū)的表達(dá),以及重組頻率)的直方圖。圖24A圖示了最優(yōu)基因組座位(OGL)的多核苷酸序列長度的分布。圖24B圖示了表達(dá)的核酸序列相對于它們與各最優(yōu)基因組座位(OGL)之接近度(log標(biāo)度)的分布。圖24C圖示了各最優(yōu)非基因玉米座位相對于它們的重組頻率的分布。圖25A和25B.鑒定出的最優(yōu)非基因玉米座位的特征(相距活躍轉(zhuǎn)錄的內(nèi)源基因的距離,以及相距著絲粒的距離)的直方圖。圖25A圖示了各最優(yōu)非基因組座位序列相對于它們與活躍轉(zhuǎn)錄的內(nèi)源基因之距離的分布。圖25B圖示了各最優(yōu)基因組座位序列相對于它們距染色體著絲粒之距離的分布。詳細(xì)說明定義在描述本發(fā)明并為本發(fā)明請求保護(hù)的過程中,下列術(shù)語將根據(jù)其在下文中給出的定義使用。如本文使用的,術(shù)語“約”意指比言明的值或值的范圍大或小10%,但并不意在將任何值或值的范圍僅指向到該更寬泛的定義。術(shù)語“約”之后的任何值或值的范圍也意在涵蓋所言明的絕對值或值的范圍的實施方案。植物:如本文所使用的,術(shù)語“植物”包括整個植物及植物的任何后代、細(xì)胞、組織、或部分。術(shù)語“植物部分”包括植物的任何部分,包括,例如但不限于:種子(包括成熟種子和未成熟種子);植物插條;植物細(xì)胞;植物細(xì)胞培養(yǎng)物;植物器官(如花粉、胚、花、果實、芽(shoot)、葉、根、莖、和外植體)。植物組織或植物器官可以是種子、愈傷組織、或者任何其他被組織成一定結(jié)構(gòu)或功能單元的植物細(xì)胞群。植物細(xì)胞或組織培養(yǎng)物可能能夠再生出具有該細(xì)胞或組織所來源的植物的生理學(xué)和形態(tài)學(xué)特征的植物,并且可能能夠再生出與該植物具有基本上相同的基因型的植物。與之相反,一些植物細(xì)胞不能夠再生產(chǎn)生植物。植物細(xì)胞或組織培養(yǎng)物中的可再生細(xì)胞可以是胚、原生質(zhì)體、分生組織細(xì)胞、愈傷組織、花粉、葉、花藥、根、根尖、須、花、果仁、穗、穗軸、殼、或莖。植物部分包括可收獲的部分和可用于繁殖后代植物的部分??捎糜诜敝车闹参锊糠职?,例如但不限于:種子;果實;插條;苗;塊莖;和根砧木。植物的可收獲部分可以是植物的任何有用部分,包括,例如但不限于:花;花粉;苗;塊莖;葉;莖;果實;種子;和根。植物細(xì)胞是植物的結(jié)構(gòu)和生理的單位,植物細(xì)胞,如本文中使用的,包括原生質(zhì)體和帶有細(xì)胞壁的原生質(zhì)體。植物細(xì)胞可以是分離的單細(xì)胞或細(xì)胞聚集體的形式(例如,松散型(friable)愈傷組織和培養(yǎng)細(xì)胞),并且可以是更高級有組織單元的一部分(例如,植物組織、植物器官、和植物)。因此,植物細(xì)胞可以是原生質(zhì)體、配子產(chǎn)生細(xì)胞、或可以再生成完整植物的細(xì)胞或細(xì)胞集合。因此,種子,因其包括多個植物細(xì)胞并能夠再生為完整植物,在本文的實施方案中被認(rèn)為是一種“植物部分”。術(shù)語“原生質(zhì)體”,如本文中使用的,是指細(xì)胞壁完全或部分被去除,其脂質(zhì)雙層膜裸露的細(xì)胞。典型地,原生質(zhì)體是沒有細(xì)胞壁的分離的植物細(xì)胞,其具有再生成為細(xì)胞培養(yǎng)物或全植物的能力。如本文所使用的,術(shù)語“天然的”或“自然的”定義自然界中發(fā)現(xiàn)的狀態(tài)?!疤烊籇NA序列”是存在于自然界中的DNA序列,其通過自然手段或傳統(tǒng)育種技術(shù)產(chǎn)生,而不是通過遺傳工程(例如利用分子生物學(xué)/轉(zhuǎn)化技術(shù))生成。如本文中使用的,“內(nèi)源序列”定義多核苷酸、基因或多肽的在生物體中其自然位置或者生物體的基因組中的天然形式。術(shù)語“分離的”,如本文中使用的,意指已經(jīng)從其自然環(huán)境中移出。如本文所使用的,術(shù)語“純化的”是指分子或化合物以基本上沒有在本身或自然環(huán)境下通常與該分子或化合物相關(guān)聯(lián)的污染物的形式分離,并且意味著由于與原始組合物的其他組分分離而導(dǎo)致純度增加。術(shù)語“純化的核酸”在本文中用于描述這樣的核酸序列:其與包括但不僅限于多肽、脂質(zhì)和碳水化合物的其他化合物分離。術(shù)語“多肽”、“肽”和“蛋白質(zhì)”可互換使用,指氨基酸殘基的聚合物。該術(shù)語還適用于這樣的氨基酸聚合物,其中一個或多個氨基酸是相應(yīng)的天然存在的氨基酸的化學(xué)類似物或修飾衍生物。如本文中使用的,“最優(yōu)玉米基因組座位”、“最優(yōu)非基因玉米座位”、“最優(yōu)非基因座位”或“最優(yōu)基因組座位(OGL)”可互換使用,指在玉米的核基因組中發(fā)現(xiàn)的天然DNA序列,其具有下列性質(zhì):非基因(nongenic)、低甲基化(hypomethylated)、可靶向(targetable)、且位于與基因區(qū)域(genicregion)鄰近的位置,其中最優(yōu)玉米基因組座位周圍的基因組區(qū)域例示重組的證據(jù)。如本文中使用的,術(shù)語“非基因玉米序列”或“非基因玉米基因組序列”可互換使用,指在玉米植物的核基因組中發(fā)現(xiàn)的天然DNA序列,長度至少為1Kb,且沒有任何開放閱讀框、基因序列、或基因調(diào)控序列。此外,非基因單子葉植物序列不包括任何內(nèi)含子序列(即內(nèi)含子被排除在“非基因”的定義之外)。非基因序列無法轉(zhuǎn)錄或翻譯為蛋白質(zhì)。許多植物基因組含有非基因區(qū)。基因組的多達(dá)95%可以是非基因的,且這些區(qū)域可能主要由重復(fù)DNA構(gòu)成。如本文中使用的,“基因區(qū)”定義為包含編碼RNA和/或多肽的開放閱讀框的多核苷酸序列?;騾^(qū)可能還涵蓋涉及開放閱讀框的表達(dá)調(diào)控的任何可識別的相鄰5’和3’非編碼核苷酸序列,直到編碼區(qū)上游約2Kb及編碼區(qū)下游1Kb,但可能更上游或更下游?;騾^(qū)還包括基因區(qū)中可能存在的任何內(nèi)含子。此外,基因區(qū)可包含單一基因序列,或多個基因序列,中間散在有非基因序列的短節(jié)段(少于1Kb)。如本文中使用的,“感興趣的核酸序列”、“感興趣的DNA”、或“供體”定義為已被選擇用來位點定向地、靶向地插入玉米基因組的核酸/DNA序列。感興趣的核酸可以是任何長度,例如長度為2到50,000(或之間或其上的任何整數(shù)值)個核苷酸,優(yōu)選長度為約1,000到5,000(或之間的任何整數(shù)值)個核苷酸。感興趣的核酸可包含一個或多個基因表達(dá)盒,所述基因表達(dá)盒進(jìn)一步包含活躍轉(zhuǎn)錄和/或翻譯的基因序列。反過來,感興趣的核酸可包括這樣的多核苷酸序列,其不包含功能性基因表達(dá)盒或完整基因(例如可僅包含調(diào)控序列,如啟動子),或者可能不包含任何可識別的基因表達(dá)元件或任何活躍轉(zhuǎn)錄的基因序列。感興趣的核酸任選地還可含有分析域。一旦感興趣的核酸插入或玉米基因組,則將插入的序列稱為“插入的感興趣的DNA”。此外,感興趣的核酸可以是DNA或RNA,可以是線性的或環(huán)狀的,且可以是單鏈或雙鏈的。它可以作為裸核酸、作為與一種或多種投遞劑(例如脂質(zhì)體、泊洛沙姆、用蛋白質(zhì)包囊的T鏈,等等)的復(fù)合物,或包含在細(xì)菌或病毒投遞載體,例如根癌土壤桿菌或腺病毒或腺伴隨病毒(AAV)中投遞到細(xì)胞中。如本文中使用的,術(shù)語“分析域”限定含有這樣的功能元件的核酸序列,所述功能元件幫助核酸序列的靶向插入。例如,分析域可含有特別設(shè)計的限制酶位點、鋅指結(jié)合位點、工程化著陸臺(landingpads)或工程化轉(zhuǎn)基因整合平臺,且可以包含也可以不包含基因調(diào)節(jié)元件或開放閱讀框。參見,例如美國專利公開20110191899,通過提述將其整體并入本申請。如本文中使用的,術(shù)語“選定的玉米序列”限定這樣的玉米天然基因組DNA序列,該序列已被選定用于分析,以確定該序列是否適格為最優(yōu)非基因玉米基因組座位。如本文中使用的,術(shù)語“低甲基化”或“低甲基化的”,當(dāng)指某個DNA序列時,定義給定的DNA序列中甲基化DNA核苷酸堿基的減少狀態(tài)。通常,減少的甲基化涉及甲基化的腺嘌呤或胞嘧啶殘基的數(shù)目,相對于玉米基因組中存在的非基因序列中所見的平均甲基化水平。如本文中使用的,“可靶向的序列”是這樣的多核苷酸序列,它在核基因組中足夠獨特,以容許感興趣的核酸位點特異性地、靶向地插入一條具體的序列中。如本文中使用的,術(shù)語“非重復(fù)的”(non-repeating)序列定義為長度至少1Kb、與玉米基因組內(nèi)的任何其他序列有少于40%同一性的序列。序列同一性的計算可以使用本領(lǐng)域技術(shù)人員已知的任何標(biāo)準(zhǔn)技術(shù)來確定,包括例如,利用基于BLASTTM的同源性搜索,針對玉米B73栽培種基因組掃描玉米基因組序列,搜索使用NCBIBLASTTM+軟件(2.2.23版本),用默認(rèn)的參數(shù)設(shè)定運行該軟件(StephenF.Altschuletal(1997),″GappedBLASTandPSI-BLAST:anewgenerationofproteindatabasesearchprograms″,NucleicAcidsRes.25:3389-3402)。例如,當(dāng)對選定的玉米序列(例如玉米栽培種B73基因組)進(jìn)行分析時,從該搜索鑒定出的第一個BLASTTM命中代表了玉米栽培種B73序列本身。為每個選定的玉米序列鑒定第二個BLASTTM命中,并用該命中的比對覆蓋度(以選定的玉米序列被BLASTTM命中所覆蓋的百分比表示)作為該選定的玉米序列在來自玉米基因組內(nèi)的獨特性的量度。第二BLASTTM命中的這些比對覆蓋度值從最小0%至最大39.98%序列同一性不等。任何以更高的序列同一性水平比對的序列均不予考慮。術(shù)語“位于與非基因區(qū)域鄰近(處)的位置”當(dāng)就某一非基因序列而言時,定義了該非基因序列與某個基因區(qū)的相對位置。具體而言,分析了40Kb鄰近區(qū)域(即在距選定的最優(yōu)玉米基因組座位序列的任意末端的40Kb之內(nèi))以內(nèi)的基因區(qū)的數(shù)目。該分析通過評析基因注釋信息和自玉米基因組數(shù)據(jù)庫(MaizeGenomicDatabase)提取的已知基因在玉米基因組中的位置來完成。對于5,286個最優(yōu)非基因玉米基因組座位中的每一個,定義一個圍繞最優(yōu)基因組座位序列的40Kb窗口,并計數(shù)具有與該窗口重疊的位置的已注釋基因。基因區(qū)域的數(shù)目在40Kb的鄰近區(qū)域內(nèi)從最少1個基因到最大18個基因不等。術(shù)語“已知的玉米編碼序列”,如本文中使用的,涉及任何從玉米基因組數(shù)據(jù)庫(訪問來源www.maizegdb.org以及Monaco,M.,etal.,MaizeMetabolicNetworkConstructionandTranscriptomeAnalysis.doi:10.3835/plantgenome2012.09.0025;2013年1月23日在線發(fā)布)中鑒定出的多核苷酸序列,其在內(nèi)含子序列加工之前或之后包含開放閱讀框,且其當(dāng)被置于合適的遺傳調(diào)控元件的控制之下時被轉(zhuǎn)錄為mRNA,并任選地被翻譯成蛋白質(zhì)序列。已知的玉米編碼序列可以是cDNA序列或者是基因組序列。在一些情況下,已知的玉米編碼序列可以作為功能性蛋白被注釋。在其他情況下,已知的玉米編碼序列可能不被注釋。術(shù)語“預(yù)測的玉米編碼序列”,如本文中使用的,涉及在玉米基因組數(shù)據(jù)庫(MaizeGenomicDatabase)中描述的任何表達(dá)序列標(biāo)簽(EST)多核苷酸序列。EST是從利用寡聚(dT)引物引導(dǎo)反轉(zhuǎn)錄酶進(jìn)行第一鏈合成而構(gòu)建的cDNA文庫中鑒定出來的。所得到的EST是少于500bp的單通過(single-pass)測序讀段,自cDNA插入物的5’或3’末端獲得。多個EST可以比對形成單一重疊群。鑒定出的EST序列被上傳到玉米基因組數(shù)據(jù)庫,并且可以通過生物信息學(xué)方法加以檢索以預(yù)測相應(yīng)的包含編碼序列的基因組多核苷酸序列,所述編碼序列當(dāng)被置于合適的遺傳調(diào)控元件的控制之下時被轉(zhuǎn)錄為mRNA,并任選地被翻譯成蛋白質(zhì)序列。術(shù)語“重組的證據(jù)”如本文中使用的,涉及任意成對的玉米的基因組標(biāo)志物,在整個包含選定的玉米序列的染色體區(qū)域上的減數(shù)分裂重組頻率。重組頻率基于標(biāo)志物之間的遺傳距離(以厘摩(cM)計)與標(biāo)志物之間的物理距離(以兆堿基(Mb)計)之比來計算。選定的玉米序列要具有重組的證據(jù),其必須包含位于該選定的玉米序列側(cè)翼的兩個標(biāo)志物之間的至少一個重組,如使用從多重定位群體產(chǎn)生的高分辨率標(biāo)志物數(shù)據(jù)集所測得的。(參見,例如JafarMammadov,WeiChen,AnastasiaChueva,KarthikMuthuraman,RuihuaRen,DavidMeyer,andSivaKumpatla.2011.DistributionofRecombinantFrequenciesacrosstheMaizeGenome.52ndAnnualMaizeGeneticsConference)。如本文中使用的,術(shù)語“相對位置值”是一種計算值,其限定某個基因組座位與其相應(yīng)的染色體著絲粒的距離。對于每個選定的玉米序列,測量從該選定的玉米序列的天然位置到該序列所在的染色體的著絲粒的基因組距離(以Bp計)。選定的玉米序列在染色體上的相對位置表示為該序列與著絲粒的基因組距離相對于該序列所在的具體染色體臂(以Bp計)的長度之比。最優(yōu)非基因玉米基因組座位數(shù)據(jù)集的這些相對位置值的范圍為從最小0.00373到最大0.99908的基因組距離比值。“外源DNA序列”,如本文中使用的,是任何這樣的核酸序列,其已從其天然位置被移出并插入到新的位置,從而改變被移動的該核酸序列側(cè)翼的序列。例如,外源DNA序列可包含來自其他物種的序列?!敖Y(jié)合”指大分子之間(例如蛋白質(zhì)核酸之間)的序列特異性相互作用。并非結(jié)合相互作用的所有組成部分都需要是序列特異性的(例如與DNA骨架中的磷酸殘基接觸),只要相互作用作為一個整體是序列特異性的即可。這樣的相互作用通常用解離常數(shù)(Kd)來表征。“親和力”是指結(jié)合的強(qiáng)度:增加的結(jié)合親和力與較低的結(jié)合常數(shù)(Kd)相關(guān)聯(lián)?!敖Y(jié)合蛋白”是一種能夠結(jié)合另一分子的蛋白質(zhì)。結(jié)合蛋白可以結(jié)合,例如,DNA分子(DNA結(jié)合蛋白)、RNA分子(RNA結(jié)合蛋白)、和/或蛋白質(zhì)分子(蛋白質(zhì)結(jié)合蛋白)。在蛋白質(zhì)結(jié)合蛋白的情形下,它可結(jié)合自身(以形成同二聚體、同三聚體,等等),和/或它能結(jié)合不同蛋白質(zhì)(一種或多種)的一個或多個分子。結(jié)合蛋白可具有多于一種結(jié)合活性。例如,鋅指蛋白具有DNA結(jié)合、RNA結(jié)合和蛋白質(zhì)結(jié)合活性。如本文中使用的,術(shù)語“鋅指”限定DNA結(jié)合蛋白結(jié)合域內(nèi)的氨基酸序列區(qū)域,其結(jié)構(gòu)通過鋅離子的配位而被穩(wěn)定化?!颁\指DNA結(jié)合蛋白”(或結(jié)合域)是一種蛋白質(zhì),或某種更大的蛋白質(zhì)中的域,其藉由一個或多個鋅指以序列特異性的方式結(jié)合DNA,其中鋅指是該結(jié)合域內(nèi)的氨基酸序列區(qū)域,其結(jié)構(gòu)通過鋅離子的配位而被穩(wěn)定化。術(shù)語“鋅指DNA結(jié)合蛋白”??s略為鋅指蛋白或ZFP。鋅指結(jié)合域可以被“工程化”而結(jié)合預(yù)定的核苷酸序列。工程化鋅指蛋白的方法的非限定例子是設(shè)計和選擇。設(shè)計的鋅指蛋白是自然界中不存在的蛋白質(zhì),其設(shè)計/組成主要是通過合理標(biāo)準(zhǔn)得來的。設(shè)計的合理標(biāo)準(zhǔn)包括取代原則的應(yīng)用和用于加工數(shù)據(jù)庫中信息的計算機(jī)化算法,所述數(shù)據(jù)庫存儲現(xiàn)有ZFP設(shè)計和結(jié)合數(shù)據(jù)的信息。參見,例如,美國專利號6,140,081;6,453,242;6,534,261和6,794,136;另見WO98/53058;WO98/53059;WO98/53060;WO02/016536和WO03/016496?!癟ALEDNA結(jié)合域”或“TALE”是包含一個或多個TALE重復(fù)域/單元的多肽。所述重復(fù)域參與TALE與其關(guān)聯(lián)靶DNA序列的結(jié)合。單個“重復(fù)單元”(又稱“重復(fù)”)典型地為33-35個氨基酸長,并與天然TALE蛋白內(nèi)的其他TALE重復(fù)序列顯示至少一些序列同源性。參見例如美國專利公開號20110301073,將其通過提述整體并入本申請。CRISPR(成簇規(guī)律間隔短回文重復(fù)序列)/Cas(CRISPR相關(guān))核酸酶系統(tǒng)。簡而言之,“CRISPRDNA結(jié)合域”是一種短鏈RNA分子,其與CAS酶協(xié)同作用,可選擇性地識別、結(jié)合和切割基因組DNA。CRISPR/Cas系統(tǒng)可以被工程化以在基因組的期望靶標(biāo)處產(chǎn)生雙鏈斷裂(DSB),且DSB的修復(fù)可被使用修復(fù)抑制物所影響,導(dǎo)致易錯修復(fù)(errorpronerepair)的增加。參見例如Jineketal(2012)Science337,p.816-821,Jineketal,(2013),eLife2:e00471,andDavidSegal,(2013)eLife2:e00563)。鋅指、CRISPR和TALE結(jié)合域可以被“工程化”從而結(jié)合預(yù)定的核苷酸序列,例如通過工程化天然存在的鋅指的識別螺旋區(qū)(改變其一個或多個氨基酸)。類似地,可以將TALE“工程化”以結(jié)合預(yù)定的核苷酸序列,例如通過工程化DNA結(jié)合中涉及的氨基酸(重復(fù)可變二殘基或RVD區(qū))。因此,工程化的DNA結(jié)合蛋白(鋅指或TALE)是非天然存在的蛋白質(zhì)。用于工程化DNA結(jié)合蛋白的方法的非限制性實例是設(shè)計和選擇。設(shè)計的DNA結(jié)合蛋白是在自然界不出現(xiàn)的蛋白質(zhì),其設(shè)計/組成主要是通過合理標(biāo)準(zhǔn)得來的。設(shè)計的合理標(biāo)準(zhǔn)包括取代原則的應(yīng)用和用于加工數(shù)據(jù)庫中信息的計算機(jī)化算法,所述數(shù)據(jù)庫存儲現(xiàn)有ZFP和/或TALE設(shè)計和結(jié)合數(shù)據(jù)的信息。參見例如,美國專利6,140,081;6,453,242;和6,534,261;另見WO98/53058;WO98/53059;WO98/53060;WO02/016536和WO03/016496及美國公開號20110301073、20110239315和20119145940。“選定的”鋅指蛋白、CRISPR或TALE是自然界中不存在的蛋白質(zhì),其產(chǎn)生主要是經(jīng)驗性過程,例如噬菌體展示、相互作用陷阱(interactiontrap)或雜交選擇的結(jié)果。參見例如美國專利號5,789,538;US5,925,523;US6,007,988;US6,013,453;US6,200,759;WO95/19431;WO96/06166;WO98/53057;WO98/54311;WO00/27878;WO01/60970WO01/88197和WO02/099084,以及美國公開號20110301073、20110239315和20119145940?!爸亟M”指兩個多核苷酸之間遺傳信息交換的過程,包括但不限于通過非同源末端連接(NHEJ)的供體捕捉和同源重組。為了本公開文本的目的,“同源重組(HR)”指例如細(xì)胞中經(jīng)同源性指導(dǎo)修復(fù)機(jī)制的雙鏈斷裂修復(fù)期間發(fā)生的此類交換的特化形式。這種過程要求核苷酸序列同源性,使用“供體”分子作為“靶”分子(即經(jīng)歷雙鏈斷裂的核苷酸序列)修復(fù)的模板,而且有“非交叉基因轉(zhuǎn)換”或“短束基因轉(zhuǎn)換”等不同稱謂,因為它引起遺傳信息自供體轉(zhuǎn)移至靶。不希望受任何特定理論束縛,此類轉(zhuǎn)移可涉及斷裂的靶和供體之間形成的異源雙鏈體DNA的錯配校正,和/或“合成依賴性鏈退火”,其中使用供體來再合成會變成靶一部分的遺傳信息,和/或相關(guān)過程。此類特化的HR常常導(dǎo)致靶分子的序列改變,使得供體多核苷酸的部分或整個序列并入靶多核苷酸。對于HR指導(dǎo)的整合,供體分子含有至少2個長度為至少50-100個堿基對的與基因組具有同源性的區(qū)域(“同源臂”)。參見例如美國專利公開號20110281361。在本公開文本的方法中,本文中描述的一種或多種靶向核酸酶在靶序列(例如細(xì)胞染色質(zhì))中在預(yù)定位點處創(chuàng)建雙鏈斷裂,而且可以將“供體”多核苷酸引入細(xì)胞,所述“供體”多核苷酸與斷裂區(qū)域中的核苷酸序列具有同源性以便于HR介導(dǎo)的整合,或者與斷裂區(qū)域中的核苷酸序列沒有同源性以便于NHEJ介導(dǎo)的整合。雙鏈斷裂的存在已經(jīng)顯示出推動供體序列整合。供體序列可以物理整合,或者,供體多核苷酸作為模板用于經(jīng)同源重組修復(fù)斷裂,導(dǎo)致供體中的整個或部分核苷酸序列引入細(xì)胞染色質(zhì)。如此,細(xì)胞染色質(zhì)中的第一序列可以改變,而且,在某些實施方案中,可以轉(zhuǎn)變成供體多核苷酸中存在的序列。如此,術(shù)語“替換”的使用可理解為表示一種核苷酸序列用另一種核苷酸序列替換,(即信息意義上的序列替換),而且并非必然要求一種多核苷酸用另一種多核苷酸物理或化學(xué)替換。在本文所述的任何方法中,可以使用額外的鋅指蛋白、CRISPRS或TALEN,以便對細(xì)胞內(nèi)額外的靶位點進(jìn)行額外的雙鏈切割。本文中描述的任何方法均可用于插入任何大小的供體和/或通過靶向整合供體序列破壞感興趣的基因的表達(dá)來導(dǎo)致細(xì)胞中一種或多種靶序列的部分或完全失活。還提供了具有部分或完全失活的基因的細(xì)胞系。此外,如本文中描述的靶向整合方法還可以用于整合一種或多種外源序列。外源核酸序列可包含,例如,一個或多個基因或cDNA分子,或任何類型的編碼或非編碼序列,以及一種或多種控制元件(例如啟動子)。此外,外源核酸序列(轉(zhuǎn)基因)可產(chǎn)生一個或多個RNA分子(例如小發(fā)夾RNA(shRNA)、抑制性RNA(RNAi)、微小RNA(miRNA),等等)或蛋白質(zhì)?!扒懈睢比绫疚闹惺褂玫模xDNA分子的磷酸-糖骨架的斷裂。切割可以通過多種方式引發(fā),包括但不限于磷酸二酯鍵的酶促或化學(xué)水解。單鏈切割和雙鏈切割都是可能的,且雙鏈切割可以作為兩個迥異的單鏈切割事件的結(jié)果而發(fā)生。在特定的實施方案中,靶向雙鏈DNA切割使用融合肽。“切割域”包含一個或多個具備DNA切割催化活性的多肽序列。且各域可包含在單一多肽鏈中,或者切割活性可以由兩條(或更多條)多肽的締合所導(dǎo)致?!扒懈畎胗颉笔沁@樣的多肽序列,其與第二多肽(相同或者不同的)一道形成具有切割活性(優(yōu)選雙鏈切割活性)的復(fù)合物。術(shù)語“第一和第二切割半域”、“+和-切割半域”,以及“右和左切割半域”可互換使用來指代成對的二聚體化的切割半域。“工程化的切割半域”是這樣的切割半域,其已經(jīng)被修飾以與另一切割半域(例如另一工程化切割半域)形成專性異二聚體(obligateheterodimer)。參見例如美國專利公開2005/0064474,20070218528,2008/0131962和2011/020105,通過提述將它們整體并入本申請?!鞍形稽c”或“靶序列”指核酸中的部分,如果存在結(jié)合的充分條件,則結(jié)合分子將會結(jié)合該部分。核酸包括DNA和RNA,可以是單鏈或雙鏈的,可以是線性的、分支的或環(huán)狀的,且可以是任何長度。核酸包括能夠形成雙鏈體者,也包括形成三鏈體的核酸。參見例如美國專利5,176,996和5,422,251。蛋白質(zhì)包括,但不限于DNA結(jié)合蛋白、轉(zhuǎn)錄因子、染色體重塑因子、甲基化DNA結(jié)合蛋白、聚合酶、甲基化酶、去甲基化酶、乙酰化酶、去乙?;?、激酶、磷酸酶、整合酶、重組酶、連接酶、拓?fù)洚悩?gòu)酶、促旋酶和螺旋酶?!巴庠春怂岬漠a(chǎn)物”包括多核苷酸產(chǎn)物和多肽產(chǎn)物二者,例如,轉(zhuǎn)錄產(chǎn)物(多核苷酸如RNA)和翻譯產(chǎn)物(多肽)?!叭诤稀狈肿又钙渲杏袃蓚€或更多個亞單位分子連接,例如共價連接的分子。亞單位分子可以是相同化學(xué)類型的分子,或者可以是不同化學(xué)類型的分子。第一類融合分子的例子包括但不限于融合蛋白(例如ZFPDNA結(jié)合域和切割域之間的融合物)和融合核酸(例如編碼上文描述的融合蛋白的核酸)。第二類融合分子的例子包括但不限于三鏈體形成核酸和多肽之間的融合物,和小溝結(jié)合物和核酸之間的融合物。細(xì)胞中融合蛋白的表達(dá)可以是將融合蛋白投遞到細(xì)胞中的結(jié)果,或者可以通過將編碼融合蛋白的多核苷酸投遞到細(xì)胞而實現(xiàn),其中多核苷酸被轉(zhuǎn)錄,轉(zhuǎn)錄物被翻譯以生成融合蛋白。細(xì)胞中蛋白質(zhì)的表達(dá)還可以涉及反式剪接、多肽切割和多肽連接。在本公開內(nèi)容中別處呈現(xiàn)了用于對細(xì)胞的多核苷酸和多肽投遞的方法。為本公開內(nèi)容的目的,“基因”包括編碼基因產(chǎn)物的DNA區(qū)(見下文),及調(diào)節(jié)基因產(chǎn)物生成的所有DNA區(qū),無論此類調(diào)控序列在編碼和/或轉(zhuǎn)錄序列附近與否。因而,基因包括但不必限于啟動子序列、終止子、翻譯調(diào)控序列,諸如核糖體結(jié)合位點和內(nèi)部核糖體進(jìn)入位點、增強(qiáng)子、沉默子、絕緣子、邊界元件、復(fù)制起點、基質(zhì)附著位點和座位控制區(qū)?!盎虮磉_(dá)”指將基因中含有的信息轉(zhuǎn)化成基因產(chǎn)物?;虍a(chǎn)物可以是基因的直接轉(zhuǎn)錄產(chǎn)物(例如mRNA、tRNA、rRNA、反義RNA、干擾RNA、核酶、結(jié)構(gòu)RNA或任何其它類型的RNA)或通過mRNA翻譯生成的蛋白質(zhì)?;虍a(chǎn)物還包括通過諸如加帽、多聚腺苷酸化、甲基化和編輯等過程修飾的RNA,和經(jīng)過修飾,例如甲基化、乙?;?、磷酸化、泛素化、ADP-核糖基化、豆蔻?;?、和糖基化修飾的蛋白質(zhì)。序列同一性:術(shù)語“序列同一性”或“同一性”,如在兩個核酸或多肽序列的語境中使用的,指當(dāng)兩個序列被比對以在規(guī)定的比較窗口上實現(xiàn)最大對應(yīng)時,兩個序列中相同的殘基數(shù)。如本文中使用的,術(shù)語“序列同一性的百分比”是指通過在比較窗口上比較兩個最優(yōu)比對的序列(例如核酸序列和氨基酸序列)而確定的值,其中為了兩個序列的最優(yōu)比對,比較窗口中的序列部分與參照序列(其不包含添加或刪除)相比可以包括添加或刪除(即缺口)。百分比通過如下計算:確定在兩個序列中均出現(xiàn)相同核苷酸或氨基酸殘基的位置的數(shù)目,以產(chǎn)生匹配位置數(shù),用匹配位置數(shù)除以比較窗口中的總位置數(shù),將結(jié)果乘以100以產(chǎn)生序列同一性的百分比。用于對齊序列以供比較的方法在本領(lǐng)域中是公知的。多種程序和比對算法記載于,例如:SmithandWaterman(1981)Adv.Appl.Math.2:482;NeedlemanandWunsch(1970)J.Mol.Biol.48:443;PearsonandLipman(1988)Proc.Natl.Acad.Sci.U.S.A.85:2444;HigginsandSharp(1988)Gene73:237-44;HigginsandSharp(1989)CABIOS5:1513;Corpetetal.(1988)NucleicAcidsRes.16:10881-90;Huangetal.(1992)Comp.Appl.Biosci.8:155-65;Pearsonetal.(1994)MethodsMol.Biol.24:307-31;Tatianaetal.(1999)FEMSMicrobiol.Lett.174:247-50中。序列比對方法和同源性計算的詳細(xì)討論可以參見,例如,Altschuletal.(1990)J.Mol.Biol.215:403-10。美國國家生物技術(shù)信息中心(NationalCenterforBiotechnologyInformation)(NCBI)基礎(chǔ)本地比對搜索工具(BasicLocalAlignmentSearchTool)(BLASTTM;Altschul等(1990))可從幾個來源獲得,包括美國國家生物技術(shù)信息中心(Bethesda,MD)和在互聯(lián)網(wǎng)上,與幾個序列分析程序聯(lián)合使用。關(guān)于如何使用該程序來測定序列同一性的描述可在因特網(wǎng)上BLASTTM的“幫助”部分獲得。對于核酸序列的比較,可使用缺省參數(shù)來采用BLASTTM(Blastn)程序的“Blast2sequences”函數(shù)。在通過此方法評估時,與參照序列具有越大的相似性的核酸序列將顯示越高的序列同一性。能夠特異性雜交/能夠特異性互補(bǔ):如本文所使用的,術(shù)語“能夠特異性雜交”和“能夠特異性互補(bǔ)”是表明互補(bǔ)性的程度充分,使得在核酸分子和靶核酸分子之間產(chǎn)生穩(wěn)定而特異的結(jié)合的術(shù)語。兩個核酸分子之間的雜交涉及在兩個核酸分子的核酸序列之間形成反平行對齊。兩個分子隨后能夠與相對鏈的相應(yīng)堿基形成氫鍵,從而形成一個二聚體分子,如果它足夠穩(wěn)定,則可以使用本領(lǐng)域眾所周知的方法進(jìn)行檢測。核酸分子不需要與靶分子100%互補(bǔ)才能特異性雜交。然而,發(fā)生特異性雜交必須存在的序列互補(bǔ)性的量因雜交條件而變化。導(dǎo)致特定程度的嚴(yán)格性的雜交條件會取決于所選雜交方法的性質(zhì)和雜交核酸序列的組成及長度而變化。一般而言,雜交的溫度和雜交緩沖液的離子強(qiáng)度(特別是Na+和/或Mg++濃度)將確定雜交的嚴(yán)格性,盡管清洗次數(shù)也會影響嚴(yán)格性。獲得特定程度的嚴(yán)格性所要求的雜交條件的計算方法是本領(lǐng)域普通技術(shù)人員已知的,例如,參見Sambrooketal.(ed.)MolecularCloning:ALaboratoryManual,2nded.,vol.1-3,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY,1989,chapters9and11;和HamesandHiggins(eds.)NucleicAcidHybridization,IRLPress,Oxford,1985。關(guān)于核酸雜交的更加詳細(xì)的說明和指導(dǎo)可以參見,例如,Tijssen,“Overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassays,”inLaboratoryTechniquesinBiochemistryandMolecularBiology-HybridizationwithNucleicAcidProbes,PartI,Chapter2,Elsevier,NY,1993;和Ausubeletal.,Eds.,CurrentProtocolsinMolecularBiology,Chapter2,GreenePublishingandWiley-Interscience,NY,1995。如本文所使用的,“嚴(yán)格條件”包括在其中只有當(dāng)雜交分子與靶核酸分子內(nèi)的序列之間的錯配小于20%時才發(fā)生雜交的條件?!皣?yán)格條件”包括進(jìn)一步特定水平的嚴(yán)格性。因此,如本文所使用的,“中等嚴(yán)格”條件是指在其中序列錯配超過20%的分子將不會雜交的條件;“高嚴(yán)格”條件是指在其中序列錯配超過10%的分子將不會雜交的條件;“極高嚴(yán)格”條件是指在其中序列錯配超過5%的分子將不會雜交的條件。下面是代表性的、非限制的雜交條件:高嚴(yán)格條件(檢測具有至少90%序列同一性的序列):在65℃的5xSSC緩沖液(其中SCC緩沖液含有去污劑如SDS,以及其他試劑如鮭精DNA,EDTA等等)中雜交16小時;在室溫下用2xSSC緩沖液(其中SCC緩沖液含有去污劑如SDS,以及其他試劑如鮭精DNA,EDTA等等)清洗2次,每次15分鐘;和在65℃的0.5xSSC緩沖液(其中SCC緩沖液含有去污劑如SDS,以及其他試劑如鮭精DNA,EDTA等等)中清洗2次,每次20分鐘。中等嚴(yán)格條件(檢測具有至少80%序列同一性的序列):在65-70℃的5x-6xSSC緩沖液(其中SCC緩沖液含有去污劑如SDS,以及其他試劑如鮭精DNA,EDTA等等)中雜交16-20小時;在室溫下用2xSSC緩沖液(其中SCC緩沖液含有去污劑如SDS,以及其他試劑如鮭精DNA,EDTA等等)清洗2次,每次5-20分鐘;和在55-70℃的1xSSC緩沖液(其中SCC緩沖液含有去污劑如SDS,以及其他試劑如鮭精DNA,EDTA等等)中清洗2次,每次30分鐘。非嚴(yán)格對照條件(檢測具有至少50%序列同一性的序列):在55℃的6xSSC緩沖液(其中SCC緩沖液含有去污劑如SDS,以及其他試劑如鮭精DNA,EDTA等等)中雜交16-20小時;在室溫至55℃下用2x-3xSSC緩沖液(其中SCC緩沖液含有去污劑如SDS,以及其他試劑如鮭精DNA,EDTA等等)清洗至少2次,每次20-30分鐘。如本文關(guān)于連續(xù)核酸序列所使用的,術(shù)語“基本上同源的”或“基本上同源”是指這樣的連續(xù)核苷酸序列,其在嚴(yán)格條件下與參考核酸序列雜交。例如,與參考核酸序列基本上同源的核酸序列是如下的核酸序列,其在嚴(yán)格條件下(例如,上文示明的中等嚴(yán)格條件)與參考核酸序列雜交。基本上同源的序列可具有至少80%序列同一性。例如,基本上同源的序列可具有大約80%-100%的序列同一性,例如大約81%;大約82%;大約83%;大約84%;大約85%;大約86%;大約87%;大約88%;大約89%;大約90%;大約91%;大約92%;大約93%;大約94%;大約95%;大約96%;大約97%;大約98%;大約98.5%;大約99%;大約99.5%;和大約100%?;旧贤吹男再|(zhì)與特異性雜交密切相關(guān)。例如,當(dāng)具有充分程度的互補(bǔ)性,從而在期望特異性結(jié)合的條件下(例如嚴(yán)格雜交條件下)避免核酸與非靶序列的非特異性結(jié)合時,核酸分子是能夠特異性雜交的。在一些情況下“同源的”可用來指第一種基因和第二種基因自共同的祖先DNA序列下溯而來的關(guān)系。在這樣的情況中,術(shù)語“同源物”(homolog)表示由物種形成事件(見直向同源物)分隔的基因之間的關(guān)系,或者由基因復(fù)制事件分隔的基因之間的關(guān)系(見旁系同源物)。在其他情況中,“同源的”可用來指一個或多個多核苷酸序列之間的序列同一性水平,在這樣的情況下,所述一個或多個多核苷酸序列不一定從共同的祖先DNA序列下溯而來。本領(lǐng)域技術(shù)人員知曉術(shù)語“同源的”的可互換性,并能理解該術(shù)語的適宜應(yīng)用。如本文中使用的,術(shù)語“直向同源物”(或“直向同源的)指兩個或更多個物種中由共同的祖先核苷酸序列演化而來的、且可以在該兩個或更多個物種中保持相同功能的基因。如本文中使用的,術(shù)語“旁系同源物”指通過在基因組內(nèi)的復(fù)制而具有親緣關(guān)系的基因。直向同源物在進(jìn)化過程中保持相同的功能,而旁系同源物演化出新的功能,即使這些新功能與原來的基因功能無關(guān)。如本文所使用的,對于兩個核酸分子而言,當(dāng)沿著5’-3’方向閱讀的序列的每一個核苷酸均與沿著3’-5’方向閱讀的另一個序列的每一個核苷酸互補(bǔ)時,則稱這兩個核酸分子顯示“完全互補(bǔ)性”。與參考核苷酸序列互補(bǔ)的核苷酸序列將顯示與參考核苷酸序列的反向互補(bǔ)序列相同的序列。這些術(shù)語和描述在本領(lǐng)域中有確切的定義,且本領(lǐng)域的普通技術(shù)人員容易理解。在確定氨基酸序列之間的百分比序列同一性時,本領(lǐng)域技術(shù)人員周知,在不影響包含該對齊序列的多肽的期望性質(zhì)的情況下,某個對齊所提供的給定位置上的氨基酸的同一性可以不同。在這些情況下,可以調(diào)整百分比序列同一性以解釋被保守取代的氨基酸之間的相似性。這些調(diào)整是本領(lǐng)域技術(shù)人員眾所周知并且普遍使用的。見,例如MyersandMiller(1988),ComputerApplicationsinBiosciences4:11-7。統(tǒng)計學(xué)方法是本領(lǐng)域已知的,且可用于對鑒定的5,286個最優(yōu)基因組座位的分析中。作為一個實施方案,鑒定出的最優(yōu)基因組座位,它們包含5,286個單獨的最優(yōu)基因組座位序列,可以通過F-分布檢驗來分析。在概率理論和統(tǒng)計學(xué)中,F(xiàn)-分布是一種連續(xù)概率分布。F-分布檢驗是具有F-分布的統(tǒng)計學(xué)顯著性檢驗,當(dāng)比較已經(jīng)適配于數(shù)據(jù)集的多個統(tǒng)計學(xué)模型時使用來鑒定最佳適配的模型。F-分布是一種連續(xù)概率分布,又稱Snedecor氏F-分布或Fisher-Snedecor分布。F-分布經(jīng)常作為檢驗統(tǒng)計量的零分布出現(xiàn),最顯著的是在方差分析中。F-分布是一種右偏(right-skewed)分布。F-分布是不對稱分布,最小值為0,但沒有最大值。曲線在0右側(cè)不遠(yuǎn)處達(dá)到峰值,然后隨著F值變大逐漸接近水平軸。F-分布趨近但絕不完全接觸水平軸。應(yīng)當(dāng)理解的是,在其他實施方案中,本領(lǐng)域技術(shù)人員能夠得出并使用該等式的變化形式,或者乃至不同的等式,且它們可以應(yīng)用于5,286個單獨的最優(yōu)基因組座位序列的分析。可操作連接:當(dāng)?shù)谝缓塑账嵝蛄信c第二核苷酸序列存在功能關(guān)系時,則該第一核苷酸序列與第二核苷酸序列“可操作連接”。例如,如果啟動子影響編碼序列的轉(zhuǎn)錄或表達(dá),則啟動子與該編碼序列可操作地連接。如果可操作地連接的核苷酸序列是重組產(chǎn)生的,則這些核苷酸序列通常是連續(xù)的,并且在需要連接兩個蛋白編碼區(qū)時,這些核苷酸序列將共閱讀框。然而,可操作地連接的核苷酸序列不一定連續(xù)的。術(shù)語“可操作地連接的”,在用來指基因調(diào)控序列和編碼序列時,其意思是調(diào)控序列影響所連接的編碼序列的表達(dá)?!罢{(diào)控序列”、“調(diào)控元件”或“控制元件”是指影響轉(zhuǎn)錄的時機(jī)和水平/量,RNA加工或穩(wěn)定性,或相關(guān)編碼序列的翻譯的核苷酸序列。調(diào)控序列可以包括啟動子;翻譯前導(dǎo)序列;內(nèi)含子;增強(qiáng)子;莖環(huán)結(jié)構(gòu);阻遏物結(jié)合序列;終止序列;多聚腺苷酸化識別序列;等。特定的調(diào)控序列可位于與之可操作地連接的編碼序列的上游和/或下游。此外,與編碼序列可操作地連接的特定調(diào)控序列可位于雙鏈核酸分子的相關(guān)互補(bǔ)鏈上。當(dāng)用來指兩條或更多條氨基酸序列時,術(shù)語“可操作連接”意指第一氨基酸序列與至少一條其他氨基酸序列處于功能性關(guān)系中。公開的方法和組合物包括融合蛋白,其包含與DNA結(jié)合域(例如ZFP)可操作連接的切割域,其中所述DNA結(jié)合域通過結(jié)合玉米最優(yōu)基因組座位中的序列將該切割域的活性引導(dǎo)到所述序列的附近,由此在最優(yōu)基因組座位中誘導(dǎo)雙鏈斷裂。如本公開文本中他處陳述的,鋅指域可以被工程化從而結(jié)合幾乎任何期望的序列。相應(yīng)地,一個或多個DNA結(jié)合域可以被工程化從而結(jié)合最優(yōu)基因組座位中的一個或多個序列。包含DNA結(jié)合域和切割域的融合蛋白在細(xì)胞中的表達(dá)導(dǎo)致靶位點處或附近的切割。實施方案將轉(zhuǎn)基因和轉(zhuǎn)基因堆疊靶向到玉米基因組中的特定位置,將改善轉(zhuǎn)基因事件的質(zhì)量、減少與轉(zhuǎn)基因事件的產(chǎn)生相關(guān)的成本,并提供制造轉(zhuǎn)基因植物產(chǎn)品的新方法,例如順序基因堆疊??偟膩碚f,將轉(zhuǎn)基因靶向到特定的基因組位點可能是產(chǎn)業(yè)上有益的。最近幾年,新的位點特異性核酸酶,如ZFN、CRISPR和TALEN的開發(fā)已經(jīng)取得了顯著的進(jìn)展,這些位點特異性核酸酶能夠易化供體多核苷酸對植物和其他基因組中預(yù)先選定的位點的添加。然而,關(guān)于適合靶向的基因組位點的屬性則知之甚少。過去歷來用基因組中的非關(guān)鍵基因及病原體(病毒)整合位點作為靶向的座位。此類位點在基因組中的數(shù)目相當(dāng)有限,因此有需要鑒定和表征能夠用于靶向供體多核苷酸序列的最優(yōu)可靶向基因組座位。除了易于靶向之外,預(yù)期最優(yōu)基因組座位是中性位點,能夠支持轉(zhuǎn)基因表達(dá)和育種應(yīng)用。申請人已經(jīng)意識到更多的關(guān)于插入位點的標(biāo)準(zhǔn)是理想的,并且已經(jīng)將這些標(biāo)準(zhǔn)合并起來以鑒定并選擇玉米基因組中最優(yōu)的位點,用于插入外源序列。為了靶向的目的,選定的插入的位點需要是獨特的,并且需要在玉米基因組的非重復(fù)區(qū)中。類似地,供插入用的最優(yōu)基因組位點應(yīng)當(dāng)具備最少的不良表型效應(yīng),并容易發(fā)生重組事件,以便于利用傳統(tǒng)育種技術(shù)滲入農(nóng)藝學(xué)上優(yōu)良的品系。為了鑒定符合列出標(biāo)準(zhǔn)的基因組座位,利用定制的生物信息學(xué)途徑和基因組規(guī)模數(shù)據(jù)集來掃描玉米基因組,鑒定出了具備對于多核苷酸供體序列之整合及插入的編碼序列之后續(xù)表達(dá)有利的特征的新基因組座位。I.非基因玉米基因組座位的鑒定依照一個實施方案,提供一種鑒定用于插入外源序列的最優(yōu)非基因玉米基因組序列的方法。該方法包括下述步驟:首先鑒定長度至少1Kb的、低甲基化的玉米基因組序列。在一個實施方案中,低甲基化的基因組序列的長度為1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、10、11、12、13、14、15、16或17Kb。在一個實施方案中,低甲基化的基因組序列長度為約1至約4Kb,且在一個進(jìn)一步的實施方案中,長度為約2Kb。如果某個序列內(nèi)的DNA甲基化少于1%,則認(rèn)為該序列是低甲基化的。在一個實施方案中,測量甲基化狀態(tài)的基礎(chǔ)是:選定的玉米序列內(nèi)一個或多個CpG二核苷酸、CHG或CHH三核苷酸處的5-甲基胞嘧啶的存在,相對于在正常對照DNA樣品內(nèi)的相應(yīng)CpG二核苷酸、CHG或CHH三核苷酸處發(fā)現(xiàn)的總胞嘧啶量。CHH甲基化表示5-甲基胞嘧啶后隨兩個可能不是鳥嘌呤的核苷酸,而CHG甲基化指5-甲基胞嘧啶后隨腺嘌呤、胸腺嘧啶或胞嘧啶,然后是鳥嘌呤。更具體地,在一個實施方案中,選定的玉米序列在該選定的玉米序列中每500個核苷酸具有少于1個、2個或3個甲基化核苷酸。在一個實施方案中,選定的玉米序列在該選定的玉米序列中每500個核苷酸具有少于1個、2個或3個CpG二核苷酸處的5-甲基胞嘧啶。在一個實施方案中,選定的玉米序列長度為1-4Kb,且包含1Kb沒有5-甲基胞嘧啶的序列。在一個誒中,選定的玉米序列長度為1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、或8.5Kb,且在其全長上含有1個或0個甲基化核苷酸。在一個實施方案中,選定的玉米序列長度為1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、或8.5Kb,且在其全長上在CpG二核苷酸處不含有5-甲基胞嘧啶。根據(jù)一個實施方案,選定的玉米序列的甲基化可基于來源組織而變化。在這樣的實施方案中,用于確定序列是否為低甲基化的甲基化水平代表了從兩種或更多種組織(例如從根和芽)分離的序列中的平均甲基化量。除了最優(yōu)基因組位點須為低甲基化這一要求之外,選定的玉米序列還必須是非基因的。相應(yīng)地,對所有低甲基化的基因組序列進(jìn)一步篩選以淘汰含有基因區(qū)的低甲基化序列。這包括任何開放閱讀框,無論轉(zhuǎn)錄物是否編碼蛋白質(zhì)。將包含基因區(qū)-包括任何可識別的牽涉開放閱讀框的表達(dá)調(diào)控的鄰近5’和3’非編碼核苷酸序列以及基因區(qū)中可能存在的任何內(nèi)含子-的低甲基化基因組序列,排除在本公開的最優(yōu)非基因玉米基因組座位之外。最優(yōu)非基因玉米基因組座位還必須是已表現(xiàn)了重組的證據(jù)的序列。在一個實施方案中,選定的玉米序列必須是其中在該選定的玉米序列側(cè)翼的兩個標(biāo)志物之間已檢測到至少一個重組事件,如利用從多重定位群體生成的高分辨標(biāo)志物數(shù)據(jù)集所檢測的。在一個實施方案中,使用位于包含選定的玉米序列的0.5、1、1.5Mb玉米基因組序列的成對標(biāo)志物來計算該選定的玉米序列的重組頻率。每對標(biāo)志物之間的重組頻率(以厘摩(cM)量度)比該對標(biāo)志物之間的基因組物理距離(以Mb計)必須大于0cM/Mb。在一個實施方案中,包含選定的玉米序列的1Mb玉米基因組序列的重組頻率在約0.00041cM/Mb至約4.0的范圍。在一個實施方案中,包含選定的玉米序列的1Mb玉米基因組序列的重組頻率在約0.5至約5.0的范圍。在一個實施方案中,最優(yōu)基因組座位是在選定的玉米序列中已經(jīng)檢測到重組事件者。最優(yōu)非基因玉米基因組座位還會是可靶向的序列,即在玉米基因組中相對獨特的序列,使得靶定選定的玉米序列的基因?qū)H插入玉米基因組的一個位置。在一個實施方案中,最優(yōu)基因組序列的全長與玉米基因組中包含的長度相似的其他序列享有的序列同一性小于30%、35%或40%。相應(yīng)地,在一個實施方案中,選定的玉米序列不能包含與玉米基因組中包含的其他1Kb序列享有多于25%,30%,35%或40%序列同一性的1Kb序列。在一個進(jìn)一步的實施方案中,選定的玉米序列不能包含與玉米基因組中包含的其他500bp序列享有多于30%,35%或40%序列同一性的500bp序列。在一個實施方案中,選定的玉米序列不能包含與玉米基因組中包含的其他1Kb序列享有多于40%序列同一性的1Kb序列。最優(yōu)非基因玉米基因組座位還將鄰近于基因區(qū)。更具體地說,選定的玉米序列必須位于基因區(qū)的附近(例如,如在天然基因組中所見的,基因區(qū)必須在側(cè)翼于且鄰接于選定的玉米序列之任一末端的40Kb基因組序列之內(nèi))。在一個實施方案中,如在天然玉米基因組中所見的,基因區(qū)在鄰接于選定玉米序列之任一末端的10、20、30或40Kb的基因組序列之內(nèi)。在一個實施方案中,兩個或更多個基因區(qū)位于選定玉米序列的兩個末端側(cè)翼的10、20、30或40Kb的鄰接基因組序列之內(nèi)。在一個實施方案中,1-9個基因區(qū)位于選定的玉米序列的兩個末端側(cè)翼的10、20、30或40Kb的鄰接基因組序列之內(nèi)。在一個實施方案中,兩個或更多個基因區(qū)位于包含選定的玉米序列的20、30或40Kb基因組序列之內(nèi)。在一個實施方案中,1-9個基因區(qū)位于包含選定的玉米序列的40Kb基因組序列之內(nèi)。在一個實施方案中,位于選定的玉米序列側(cè)翼的10、20、30或40Kb的鄰接基因組序列之內(nèi)的基因區(qū)包含玉米基因組中的已知基因。依照一個實施方案,提供修飾的非基因玉米基因組座位,其中該座位的長度為至少1Kb,是非基因的,不包含甲基化胞嘧啶殘基,在涵蓋玉米基因組座位的1Mb基因組區(qū)域上具有大于0.00041cM/Mb的重組頻率,且該玉米基因組座位的1Kb序列與該玉米基因組中包含的任何其他1Kb序列享有少于40%序列同一性,其中該非基因玉米基因組座位被該非基因玉米基因組座位中感興趣的DNA序列的插入所修飾。依照一個實施方案,提供了一種鑒定最優(yōu)非基因玉米基因組座位的方法。在一個實施方案中,該方法首先包括篩選玉米基因組以生成第一池的選定玉米序列,這些序列的最小長度為1Kb且是低甲基化的,任選地其中基因組序列具有少于1%甲基化,或者其中該基因組序列沒有任何甲基化的胞嘧啶殘基??梢赃M(jìn)一步篩選該第一池選定的玉米序列以淘汰不符合最優(yōu)非基因玉米基因組座位的要求的座位。將編碼玉米轉(zhuǎn)錄物、與具有相似長度的其他序列享有大于40%或更高的序列同一性、不顯示重組的證據(jù)、且在距該選定玉米序列40Kb以內(nèi)不具有已知的開放閱讀框的玉米基因組序列,例如玉米基因組序列,從第一池序列中淘汰,留下適格為最優(yōu)非基因玉米作為的第二池序列。在一個實施方案中,從所述第一池序列中淘汰任何如下所述的選定玉米序列:其在距所述非基因序列的一端40Kb之內(nèi)不具有已知的玉米基因亦不具有包含已知的玉米基因的2Kb上游和/或1Kb下游區(qū)的序列。在一個實施方案中,淘汰任何如下所述的選定玉米序列:其在距該選定的玉米序列40Kb之內(nèi)不含有編碼蛋白質(zhì)的已知基因。在一個實施方案中,淘汰任何如下所述的選定玉米序列:其不具有大于0.00041cM/Mb的重組頻率。利用這些選擇標(biāo)準(zhǔn),申請人已經(jīng)鑒定了可充當(dāng)最優(yōu)非基因玉米基因組座位的選定玉米的最優(yōu)基因組座位,它們的序列作為SEQIDNO:1-SEQIDNO:5,286公開。本公開內(nèi)容還涵蓋所鑒定的最優(yōu)非基因玉米基因組座位的自然變體或修飾衍生物,其中所述變體或衍生座位包含與SEQIDNO:1-SEQIDNO:5,286的任何序列相差1、2、3、4、5、6、7、8、9或10個核苷酸的序列。在一個實施方案中,供依照本公開使用的最優(yōu)非基因玉米基因組座位包含選自SEQIDNO:1-SEQIDNO:5,286的序列或者與選自SEQIDNO:1-SEQIDNO:7,018的序列享有90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在另一個實施方案中,供用于依照本公開使用的最優(yōu)非基因玉米基因組座位包含選自任何品種的玉米植物的序列。在一個進(jìn)一步的實施方案中,供用于依照本公開使用的最優(yōu)非基因玉米基因組座位包含選自黃玉米(yellowcorn)近交物的序列。相應(yīng)地,黃玉米近交物包括臼齒形(dent)或硬質(zhì)(flint)黃玉米近交植物,包括其農(nóng)藝學(xué)優(yōu)良品種。在一個接下來的實施方案中,供用于依照本公開使用的最優(yōu)非基因玉米基因組座位包含選自可轉(zhuǎn)化玉米系的序列。在一個實施方案中,代表性的可轉(zhuǎn)化玉米系包括:Hi-II、B73、B104、Mo17、W22、A188、H99、及其衍生物。本領(lǐng)域技術(shù)人員會理解,作為系統(tǒng)發(fā)生趨異的結(jié)果,各種玉米品系不包含相同的基因組DNA序列,且在基因組序列內(nèi)可存在多態(tài)性或等位基因變異。在一個實施方案中,本公開涵蓋鑒定出的最優(yōu)非基因玉米基因組座位的這樣的多態(tài)性或等位基因變異,其中所述多態(tài)性或等位基因變包含與SEQIDNO:1-SEQIDNO:5,286中的任何序列相差1,2,3,4,5,6,7,8,9或10個核苷酸的序列。在一個進(jìn)一步的實施方案中,本公開涵蓋鑒定出的最優(yōu)非基因玉米基因組座位的這樣的多態(tài)性或等位基因變異,其中所述多態(tài)性或等位基因變異與SEQIDNO:1-SEQIDNO:5,286的任何序列享有90%,91%,92%,93%,94%,95%,96%,97%,98%或99%序列同一性。通過使用多元分析方法加以分析,可以將鑒定出的包含5,286個序列的最優(yōu)基因組座位分類為不同亞群。任何多元分析統(tǒng)計程序的應(yīng)用被用于發(fā)現(xiàn)一組變量的潛在結(jié)構(gòu)(維度)??梢允褂枚喾N不同類型的多元算法,例如,可以用多元回歸分析、邏輯斯蒂回歸分析、判別分析、多元方差分析(MANOVA)、因子分析(包括共同因子分析和主成分分析二者)、聚類分析、多維量表法、對應(yīng)分析、聯(lián)合分析、典型分析(canonicalanalysis)、典型相關(guān)、以及結(jié)構(gòu)等式建模(structuralequationmodeling)。依照一個實施方案,使用多元數(shù)據(jù)分析,如主成分分析(PCA)對所述最優(yōu)非基因玉米基因組座位進(jìn)一步分析。這里只會簡短說明,更多信息可見H.Martens,T.Naes,MultivariateCalibration,Wiley,N.Y.,1989。PCA評估數(shù)據(jù)的基礎(chǔ)維度(潛在變量(latentvariables)),并給出對數(shù)據(jù)中的優(yōu)勢模式和主要趨勢的概覽。在一個實施方案中,可以通過主成分分析(PCA)統(tǒng)計學(xué)方法將所述最優(yōu)非基因玉米基因組座位分選為類簇。PCA是一種數(shù)學(xué)程序,利用正交變換將一組可能相關(guān)的變量的觀察結(jié)果轉(zhuǎn)變成一組線性非相關(guān)的變量(稱為主成分)的值。主成分的數(shù)目少于或等于原始變量的數(shù)目。這種變換如此定義,使得第一個主成分具有最大的可能方差(即,盡可能多地解釋數(shù)據(jù)中的變異性),后續(xù)的每一個成分在其與在先組分正交(即與在先組分不相關(guān))的約束條件下依次具有最高的可能方差。主成分分析保證是獨立的,如果數(shù)據(jù)集是聯(lián)合正態(tài)分布的。PCA對原始變量的相對比例敏感。利用PCA基于一組實體的特征對該組實體聚類的實例包括:Ciampitti,I.etal.,(2012)CropScience,52(6);2728-2742,Chemometrics:APracticalGuide,KennethR.Beebe,RandyJ.Pell,andMaryBethSeasholtz,Wiley-Interscience,1edition,1998,美國專利號8,385,662,和歐洲專利號2,340,975。依照一個實施方案,對5,286個最優(yōu)玉米基因組座位進(jìn)行了主成分分析(PCA),其中對于每個鑒定出的最優(yōu)玉米基因組座位使用下面的10個特征:1.最優(yōu)基因組座位(OGL)周圍的低甲基化區(qū)域的長度a.用甲基化敏感的限制酶(Wangetal.,(2009)Genome-WideandOrgan-SpecificLandscapesofEpigeneticModificationsandTheirRelationshipstomRNAandSmallRNATranscriptomesinMaize.PlantCell21(4):1053-1069)消化基因組DNA之后,利用Illumina/Solexa1G平行測序數(shù)據(jù),建立根和芽組織的全基因組甲基化概貌。序列被定位到基因組上則表明在定位的位置上存在DNA甲基化,而沒有被定位的序列的染色體節(jié)段表明不存在甲基化(低甲基化)。利用描述的甲基化概貌來計算每個OGL周圍低甲基化區(qū)域的長度。2.OGL周圍1MB區(qū)域中的重組率a.對于每個OGL,鑒定位于該OGL的每一側(cè)上1Mb窗口以內(nèi)的一對標(biāo)志物?;跇?biāo)志物之間的遺傳距離(以厘摩(cM)計)對標(biāo)志物之間的基因組物理距離(以Mb計)計算在整個染色體上每對標(biāo)志物之間的重組頻率。3.OGL序列獨特性的水平a.對于每個OGL,利用基于BLAST的同源性檢索將OGL的核苷酸序列對玉米栽培種B73基因組掃描。由于這些OGL序列是從玉米栽培種B73基因組鑒定出來的,通過此檢索鑒定的第一個BLAST命中代表的是OGL序列本身。為每個OGL鑒定第二個BLAST命中,并使用該命中的比對覆蓋度(alignmentcoverage)作為該OGL序列在玉米基因組中的獨特性的量度。4.從OGL到其相鄰區(qū)域中的最接近基因的距離a.從已知的玉米基因組數(shù)據(jù)庫(www.maizegdb.org),提取基因注釋信息和已知基因在玉米栽培種B73基因組中的位置。對于每個OGL,鑒定其上游或下游附近的最接近的已注釋基因,并測量OGL序列與該基因的距離(以bp計)。5.OGL相鄰區(qū)域中的GC%a.對于每個OGL,分析核苷酸序列以估計存在的鳥嘌呤和胞嘧啶堿基的數(shù)目。該計數(shù)以占每個OGL的序列長度的百分比表示,且提供了GC%的量度。6.OGL周圍40Kb相鄰區(qū)域中的基因數(shù)a.從單子葉植物基因組數(shù)據(jù)庫,例如玉米基因組數(shù)據(jù)庫(www.maizegdb.org),提取基因注釋信息和已知基因在單子葉植物基因組(例如玉米栽培種B73基因組)中的位置。對于每個OGL,定義OGL周圍的一個40Kb窗口,計算具有與該窗口重疊的位置的已注釋基因的數(shù)目。7.OGL周圍40Kb相鄰區(qū)域中的平均基因表達(dá)a.使用RNAseq技術(shù),通過分析從單子葉植物(例如玉米栽培種B73)根和芽組織產(chǎn)生的轉(zhuǎn)錄組概貌數(shù)據(jù)來測量單子葉植物基因的轉(zhuǎn)錄物水平表達(dá)。對于每種OGL,鑒定在該單子葉植物基因組(例如玉米栽培種B73基因組)中該OGL周圍40Kb相鄰區(qū)域中存在的已注釋基因。從前面的引文中描述的轉(zhuǎn)錄組概貌中提取每個基因的表達(dá)水平,并計算平均基因表達(dá)水平。8.OGL周圍的核小體占據(jù)水平a.對特定核苷酸的核小體占據(jù)水平的辨析可提供關(guān)于染色體功能和序列的基因組環(huán)境的信息。NuPoPTM統(tǒng)計學(xué)程序包提供了一種用戶友好的軟件工具,用于為任何大小的基因組序列預(yù)測核小體占據(jù)和最似然的核小體定位圖(Xi,L.,F(xiàn)ondufe-Mittendor,Y.,Xia,L.,F(xiàn)latow,J.,Widom,J.andWang,J.-P.,PredictingnucleosomepositioningusingadurationHiddenMarkovModel,BMCBioinformatics,2010,doi:10.1186/1471-2105-11-346)。對于每個OGL,將核苷酸序列提交給NuPoPTM軟件,計算核小體占據(jù)得分。9.染色體內(nèi)的相對位置(對著絲粒的接近度)a.從玉米基因組數(shù)據(jù)庫(www.maizegdb.org),提取關(guān)于著絲粒在每個玉米染色體中的位置,以及染色體臂的長度的信息。對于每個OGL,測量從OGL序列到其所在的染色體的著絲粒的基因組距離(以bp計)。OGL在染色體內(nèi)的相對位置表示為其到著絲粒的基因組距離相對于其所在的具體染色體臂的長度之比。10.OGL周圍1Mb區(qū)域中OGL的數(shù)目a.對于每個OGL,定義OGL位置周圍的1Mb基因組窗口,并統(tǒng)計該玉米植物1KbOGL數(shù)據(jù)集中基因組位置與該窗口重疊的OGL的數(shù)目。實施例2的表3中進(jìn)一步描述了每個最優(yōu)非基因玉米基因組座位的特征和屬性的得分的結(jié)果或值。使用所得的數(shù)據(jù)集在PCA統(tǒng)計學(xué)方法中將5,286個鑒定的最優(yōu)非基因玉米基因組座位聚類為類簇。在聚類過程中,在估計了最優(yōu)基因組座位的“p”主成分之后,將最優(yōu)基因組座位指配到32個類簇之一的過程在“p”維歐幾里得空間中進(jìn)行。將每個“p”軸分解為“k”個區(qū)間。將被指配到相同區(qū)間的最優(yōu)基因組座位組合到一起形成類簇。使用該分析,每個PCA軸被分為兩個區(qū)間,根據(jù)關(guān)于實驗驗證所需的類簇數(shù)的事先信息加以選擇。所有分析和對所得的類簇的可視化均使用來自ChemicalComputingGroupInc.(Montreal,Quebec,Canada)的MolecularOperatingEnvironmentTM(MOE)軟件來實施。利用該P(yáng)CA途徑將5,286個最優(yōu)玉米基因組座位基于它們的特征值(如上所述)聚類成32個獨特的類簇。在PCA過程中,產(chǎn)生了5個主成分(PC),其中最先3個PC含有數(shù)據(jù)集中總變異的約90%(表4)。用這3個PC在3維作圖中圖形化表現(xiàn)所述32個類簇(見圖3)。在聚類過程完成之后,從每個類簇選擇一個代表性的最優(yōu)基因組座位。這通過用計算機(jī)方法選擇每個類簇內(nèi)與該類簇的形心最接近的選定最優(yōu)基因組座位來實現(xiàn)(表4)。32個代表性的最優(yōu)基因組座位的染色體位置在玉米染色體中分布均勻,如圖4所示。依照一個實施方案,提供一種純化的最優(yōu)非基因序列,其中該純化序列的長度為至少1Kb,且與從實施例8表15中所述的任何序列中選出的非基因序列具有至少90,95%或99%序列同一性。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是選自loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053),loci_136086_G1(SEQIDNO:4425),loci_203704_G1(SEQIDNO:2033),loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_291068_G1(SEQIDNO:3230),loci_232222_G1(SEQIDNO:3357),loci_43577_G1(SEQIDNO:3428),loci_204726_G1(SEQIDNO:424)和loci_232228_G1(SEQIDNO:4529)的基因組序列。在一個實施方案中,純化序列的長度為至少1Kb,并且與選自下組的非基因序列中存在的序列具有至少90%,95%,或99%序列同一性:loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053),loci_136086_G1(SEQIDNO:4425),loci_203704_G1(SEQIDNO:2033),loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_291068_G1(SEQIDNO:3230),loci_232222_G1(SEQIDNO:3357),loci_43577_G1(SEQIDNO:3428),loci_204726_G1(SEQIDNO:424),和loci_232228_G1(SEQIDNO:4529)。在一個實施方案中,提供純化的序列,其長度為至少1Kb,且與選自下組的非基因序列具有至少90%,95%,或99%序列同一性:(SEQIDNO:2731),optimal_loci_136086(SEQIDNO:4425),optimal_loci_232484(SEQIDNO:2053),optimal_loci_203075(SEQIDNO:2030),optimal_loci_3733(SEQIDNO:1268),optimal_loci_168286(SEQIDNO:573),optimal_loci_128078(SEQIDNO:560),optimal_loci_265551(SEQIDNO:463),optimal_loci_127268(SEQIDNO:2709),optimal_loci_204726(SEQIDNO:424),和optimal_loci_232222(SEQIDNO:3357)。在一個實施方案中,提供純化的序列,其長度為至少1Kb,且與選自下組的非基因序列具有至少90%,95%,或99%序列同一性:optimalloci_204637(SEQIDNO:2731),optimal_loci_136086(SEQIDNO:4425),optimal_loci_232484(SEQIDNO:2053),optimal_loci_203075(SEQIDNO:2030),optimal_loci_3733(SEQIDNO:1268),optimal_loci_168286(SEQIDNO:573),optimal_loci_128078(SEQIDNO:560)和optimal_loci_265551(SEQIDNO:463)。在一個實施方案中,提供純化的序列,其長度為至少1Kb,且與選自下組的非基因序列具有至少90%,95%,或99%序列同一性:optimalloci_204637(SEQIDNO:2731),optimal_loci_203075(SEQIDNO:2030)和optimal_loci_128078(SEQIDNO:560)。在一個實施方案中提供純化的序列,其包含與選自下組的非基因序列中存在的序列相同的1Kb序列:optimalloci_204637(SEQIDNO:2731),optimal_loci_136086(SEQIDNO:4425),optimal_loci_232484(SEQIDNO:2053),optimal_loci_203075(SEQIDNO:2030),optimal_loci_3733(SEQIDNO:1268),optimal_loci_168286(SEQIDNO:573),optimal_loci_128078(SEQIDNO:560)和optimal_loci_265551(SEQIDNO:463).在一個實施方案中,提供純化的序列,其包含與選自下組的非基因序列中存在的序列相同的1Kb序列:optimalloci_204637(SEQIDNO:2731),optimal_loci_203075(SEQIDNO:2030)和optimal_loci_128078(SEQIDNO:560)。在一個實施方案中,本主題公開涉及重組序列,其包含至少1Kb的核酸序列,該核酸序列與選自下組的非基因序列具有至少90%、95%或99%序列同一性:loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053),和loci_204637_G1(SEQIDNO:2731),所述非基因序列中插入有感興趣的DNA。依照一個實施方案,提供修飾的最優(yōu)非基因玉米基因組座位,其中該最優(yōu)非基因玉米基因組座位已經(jīng)被修飾,從而包含一個或多個核苷酸取代、缺失或插入。在一個實施方案中,所述最優(yōu)非基因玉米基因組座位通過感興趣的DNA序列的插入而被修飾,任選地伴隨基因組座位序列的進(jìn)一步的核苷酸重復(fù)、缺失或倒位。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是選自實施例8表15的任何序列的基因組序列。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是選自下述座位的基因組序列:137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053),loci_136086_G1(SEQIDNO:4425),loci_203704_G1(SEQIDNO:2033),loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_291068_G1(SEQIDNO:3230),loci_232222_G1(SEQIDNO:3357),loci_43577_G1(SEQIDNO:3428),loci_204726_G1(SEQIDNO:424),和loci_232228_G1(SEQIDNO:4529)。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是來自loci_137693_G1(SEQIDNO:387)的基因組序列。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是來自loci_265551_G1(SEQIDNO:463)的基因組序列。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是來自loci_128078_G1(SEQIDNO:560)的基因組序列。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是來自loci_168286_G1(SEQIDNO:573)的基因組序列。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是來自loci_3733_G1(SEQIDNO:1268)的基因組序列。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是來自loci_203075_G1(SEQIDNO:2030)的基因組序列。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是來自loci_232484_G1(SEQIDNO:2053)的基因組序列。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是來自loci_136086_G1(SEQIDNO:4425)的基因組序列。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是來自loci_203704_G1(SEQIDNO:2033)的基因組序列。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是來自loci_127268_G1(SEQIDNO:2709)的基因組序列。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是來自loci_204637_G1(SEQIDNO:2731)的基因組序列。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是來自loci_291068_G1(SEQIDNO:3230)的基因組序列。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是來自loci_232222_G1(SEQIDNO:3357)的基因組序列。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是來自loci_43577_G1(SEQIDNO:3428)的基因組序列。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是來自loci_204726_G1(SEQIDNO:424)的基因組序列。在一個實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是來自loci_232228_G1(SEQIDNO:4529)的基因組序列。在一個進(jìn)一步的實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是選自loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053),loci_136086_G1(SEQIDNO:4425)和loci_203704_G1(SEQIDNO:2033)的基因組序列。在一個進(jìn)一步的實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是選自loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053)和loci_136086_G1(SEQIDNO:4425)的基因組序列。在一個進(jìn)一步的實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是選自loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030)和loci_232484_G1(SEQIDNO:2053)的基因組序列。在一個進(jìn)一步的實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是選自loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268)和loci_203075_G1(SEQIDNO:2030)的基因組序列。在一個進(jìn)一步的實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是選自loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573)和loci_3733_G1(SEQIDNO:1268)的基因組序列。在一個進(jìn)一步的實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是選自loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560)和loci_168286_G1(SEQIDNO:573)的基因組序列。在一個進(jìn)一步的實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是選自loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),和loci_128078_G1(SEQIDNO:560)的基因組序列。在一個進(jìn)一步的實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是選自loci_137693_G1(SEQIDNO:387)和loci_265551_G1(SEQIDNO:463)的基因組序列。在一個進(jìn)一步的實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是選自loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_291068_G1(SEQIDNO:3230),loci_232222_G1(SEQIDNO:3357),loci_43577_G1(SEQIDNO:3428),loci_204726_G1(SEQIDNO:424)和loci_232228_G1(SEQIDNO:4529)的基因組序列。在一個進(jìn)一步的實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是選自loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_291068_G1(SEQIDNO:3230),loci_232222_G1(SEQIDNO:3357),loci_43577_G1(SEQIDNO:3428)和loci_204726_G1(SEQIDNO:424)的基因組序列。在一個進(jìn)一步的實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是選自loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_291068_G1(SEQIDNO:3230),loci_232222_G1(SEQIDNO:3357)和loci_43577_G1(SEQIDNO:3428)的基因組序列。在一個進(jìn)一步的實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是選自loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_291068_G1(SEQIDNO:3230)和loci_232222_G1(SEQIDNO:3357)的基因組序列。在一個進(jìn)一步的實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是選自loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731)和loci_291068_G1(SEQIDNO:3230)的基因組序列。在一個進(jìn)一步的實施方案中,要修飾的最優(yōu)非基因玉米基因組座位是選自loci_127268_G1(SEQIDNO:2709)和loci_204637_G1(SEQIDNO:2731)的基因組序列。在一個實施方案中,最優(yōu)非基因玉米基因組座位選自基因組序列l(wèi)oci_59517_G1(SEQIDNO:1),loci_159525_G1(SEQIDNO:199),loci_9811_G1(SEQIDNO:365),loci_7507_G1(SEQIDNO:543),loci_178978_G1(SEQIDNO:687),loci_285621_G1(SEQIDNO:875),loci_221721_G1(SEQIDNO:1089),loci_83937_G1(SEQIDNO:1233),loci_37146_G1(SEQIDNO:1369),loci_156393_G1(SEQIDNO:1571),loci_343678_G1(SEQIDNO:1795),loci_60209_G1(SEQIDNO:1980),loci_282323_G1(SEQIDNO:2171),loci_64542_G1(SEQIDNO:2349),loci_162531_G1(SEQIDNO:2557),loci_337001_G1(SEQIDNO:2693),loci_66202_G1(SEQIDNO:2855),loci_185454_G1(SEQIDNO:3004),loci_239863_G1(SEQIDNO:3151),loci_257541_G1(SEQIDNO:3289),loci_217939_G1(SEQIDNO:3455),loci_326869_G1(SEQIDNO:3586),loci_31710_G1(SEQIDNO:3731),loci_81941_G1(SEQIDNO:3849),loci_198387_G1(SEQIDNO:3981),loci_197372_G1(SEQIDNO:4192),loci_106202_G1(SEQIDNO:4401),loci_232228_G1(SEQIDNO:4529),loci_244324_G1(SEQIDNO:4646),loci_157315_G1(SEQIDNO:4836),loci_137489_G1(SEQIDNO:5046),和loci_31764_G1(SEQIDNO:5162)。在一個實施方案中,最優(yōu)非基因玉米基因組座位選自基因組序列l(wèi)oci_59517_G1(SEQIDNO:1),loci_25001_G1(SEQIDNO:100),loci_112632_G1(SEQIDNO:203),loci_28905_G1(SEQIDNO:295),loci_129164_G1(SEQIDNO:384),loci_204726_G1(SEQIDNO:424),loci_2425_G1(SEQIDNO:451),loci_122036_G1(SEQIDNO:547),loci_5735_G1(SEQIDNO:671),loci_178978_G1(SEQIDNO:687),loci_288388_G1(SEQIDNO:781),loci_60310_G1(SEQIDNO:843),loci_285621_G1(SEQIDNO:875),loci_243330_G1(SEQIDNO:967),loci_127038_G1(SEQIDNO:1107),loci_262784_G1(SEQIDNO:1147),loci_344662_G1(SEQIDNO:1190),loci_153894_G1(SEQIDNO:1252),loci_28771_G1(SEQIDNO:1300),loci_1098_G1(SEQIDNO:1371),loci_97772_G1(SEQIDNO:1569),loci_156393_G1(SEQIDNO:1571),loci_236662_G1(SEQIDNO:1663),loci_139485_G1(SEQIDNO:1822),loci_301175_G1(SEQIDNO:1906),loci_152337_G1(SEQIDNO:2003),loci_202616_G1(SEQIDNO:2027),loci_203704_G1(SEQIDNO:2033),loci_282323_G1(SEQIDNO:2171),loci_262782_G1(SEQIDNO:2256),loci_64542_G1(SEQIDNO:2349),loci_236455_G1(SEQIDNO:2428),loci_162531_G1(SEQIDNO:2557),loci_301774_G1(SEQIDNO:2632),loci_344663_G1(SEQIDNO:2649),loci_337001_G1(SEQIDNO:2693),loci_204637_G1(SEQIDNO:2731),loci_238100_G1(SEQIDNO:2753),loci_66202_G1(SEQIDNO:2855),loci_264359_G1(SEQIDNO:2934),loci_282653_G1(SEQIDNO:3086),loci_80282_G1(SEQIDNO:3139),loci_291068_G1(SEQIDNO:3230),loci_56395_G1(SEQIDNO:3270),loci_200497_G1(SEQIDNO:3334),loci_232222_G1(SEQIDNO:3357),loci_43577_G1(SEQIDNO:3428),loci_5607_G1(SEQIDNO:3435),loci_114664_G1(SEQIDNO:3457),loci_228254_G1(SEQIDNO:3497),loci_120993_G1(SEQIDNO:3593),loci_53137_G1(SEQIDNO:3702),loci_31710_G1(SEQIDNO:3731),loci_344664_G1(SEQIDNO:3815),loci_81941_G1(SEQIDNO:3849),loci_321514_G1(SEQIDNO:3939),loci_198387_G1(SEQIDNO:3981),loci_301180_G1(SEQIDNO:4113),loci_197372_G1(SEQIDNO:4192),loci_348776_G1(SEQIDNO:4350),loci_244439_G1(SEQIDNO:4458),loci_348258_G1(SEQIDNO:4487),loci_232228_G1(SEQIDNO:4529),loci_322501_G1(SEQIDNO:4610),loci_244324_G1(SEQIDNO:4646),loci_97232_G1(SEQIDNO:4832),loci_157315_G1(SEQIDNO:4836),loci_282499_G1(SEQIDNO:4953),loci_155031_G1(SEQIDNO:5060),loci_301773_G1(SEQIDNO:5110),loci_283161_G1(SEQIDNO:5213),loci_55524_G1(SEQIDNO:5264),loci_127268_G1(SEQIDNO:21492709),loci_136086_G1(SEQIDNO:34844425),loci_232484_G1(SEQIDNO:34172053),loci_3733_G1(SEQIDNO:36261923),loci_168286_G1(SEQIDNO:3473571),loci_128078_G1(SEQIDNO:3047560),loci_265551_G1(SEQIDNO:3547463)和loci_137693_G1(SEQIDNO:387)。在一個實施方案中,用感興趣的DNA序列靶向所述最優(yōu)非基因玉米基因組座位,其中該感興趣的DNA序列整合到鋅指核酸酶靶位點之內(nèi)或附近。依照該實施方案,在表8中給出了最優(yōu)玉米選定基因組座位的示例性鋅指靶位點。依照一個實施方案,感興趣的DNA序列的整合在下述示例性靶位點之內(nèi)或附近發(fā)生:111879ZFN5和111879ZFN7;111885ZFN1和111885ZFN2;SIG115737_31v1和SIG115737_32v1;SIG120523_11v1和SIG120523_12v1;SIG115246_5和SIG115246_6;SIG115636_1v1和SIG115636_2v1;SIG120417_11v1和SIG120417_12v1;SIG120621_15v1和SIG120621_16v1;SIG12078_11v1和SIG12078_12v1;以及,SIG157315_1v1和SIG157315_2v1,ZFN_binding_1和ZFN_binding_2,ZFN_binding_3和ZFN_binding_4,ZFN_binding_5和ZFN_binding_6,ZFN_binding_7和ZFN_binding_8,ZFN_binding_9和ZFN_binding_10,ZFN_binding_11和ZFN_binding_12,ZFN_binding_13和ZFN_binding_14,ZFN_binding_15和ZFN_binding_16,ZFN_binding_17和ZFN_binding_18,ZFN_binding_19和ZFN_binding_20,ZFN_binding_21和ZFN_binding_22,ZFN_binding_23和ZFN_binding_24,ZFN_binding_25和ZFN_binding_26,ZFN_binding_27和ZFN_binding_28,ZFN_binding_29和ZFN_binding_30,ZFN_binding_31和ZFN_binding_32,ZFN_binding_33和ZFN_binding_34,ZFN_binding_35和ZFN_binding_36,ZFN_binding_37和ZFN_binding_38,ZFN_binding_39和ZFN_binding_40,ZFN_binding_41和ZFN_binding_42,ZFN_binding_43和ZFN_binding_44,ZFN_binding_45和ZFN_binding_46,ZFN_binding_47和ZFN_binding_48,ZFN_binding_49和ZFN_binding_50,ZFN_binding_51和ZFN_binding_52,ZFN_binding_53和ZFN_binding_54,ZFN_binding_55和ZFN_binding_56,ZFN_binding_57和ZFN_binding_58,ZFN_binding_59和ZFN_binding_60,ZFN_binding_61和ZFN_binding_62,ZFN_binding_63和ZFN_binding_64,ZFN_binding_65和ZFN_binding_66,ZFN_binding_67和ZFN_binding_68,ZFN_binding_69和ZFN_binding_70,ZFN_binding_71和ZFN_binding_72,ZFN_binding_73和ZFN_binding_74,ZFN_binding_75和ZFN_binding_76,ZFN_binding_77和ZFN_binding_78,ZFN_binding_79和ZFN_binding_80,ZFN_binding_81和ZFN_binding_82,ZFN_binding_83和ZFN_binding_84,ZFN_binding_85和ZFN_binding_86,ZFN_binding_87和ZFN_binding_88,ZFN_binding_89和ZFN_binding_90,ZFN_binding_91和ZFN_binding_92,ZFN_binding_93和ZFN_binding_94,ZFN_binding_95和ZFN_binding_96,ZFN_binding_97和ZFN_binding_98,ZFN_binding_99和ZFN_binding_100,ZFN_binding_101和ZFN_binding_102,ZFN_binding_103和ZFN_binding_104,ZFN_binding_105和ZFN_binding_106,ZFN_binding_107和ZFN_binding_108,ZFN_binding_109和ZFN_binding_110,ZFN_binding_111和ZFN_binding_112,ZFN_binding_113和ZFN_binding_114,ZFN_binding_115和ZFN_binding_116,ZFN_binding_117和ZFN_binding_118,ZFN_binding_119和ZFN_binding_120,ZFN_binding_121和ZFN_binding_122,ZFN_binding_123和ZFN_binding_124,ZFN_binding_125和ZFN_binding_126,ZFN_binding_127和ZFN_binding_128,ZFN_binding_129和ZFN_binding_130,ZFN_binding_131和ZFN_binding_132。依照一個實施方案,鋅指核酸酶結(jié)合所述鋅指靶位點并切割獨特的玉米基因組多核苷酸靶位點,此時該感興趣的DNA序列整合到玉米基因組多核苷酸靶位點之內(nèi)或附近。在一個實施方案中,在鋅指靶位點之內(nèi)的感興趣的DNA序列發(fā)生整合可能導(dǎo)致重排。依照一個實施方案,重排可包括缺失、插入、倒位和重復(fù)。在一個實施方案中,感興趣的DNA序列整合到鋅指靶位點附近。根據(jù)該實施方案的一個方面,該DNA的整合發(fā)生在鋅指靶位點的附近,且可以整合在距該鋅指靶位點1.5Kb,1.25Kb,1.0Kb,0.75Kb,0.5Kb,或0.25Kb之內(nèi)。插入鋅指靶位點附近的基因組區(qū)域之內(nèi)是本領(lǐng)域已知的,見美國專利公開號2010/0257638A1(通過提述將其整體并入本文)。根據(jù)一個實施方案,選定的非基因序列包括下述特征:a)該非基因序列在該序列內(nèi)不含有多于1%DNA甲基化;b)該非基因序列的相對位置值為0.0984到0.973的距玉米染色體著絲粒的基因組距離比值;c)該非基因序列具有34.38至61.2%的鳥嘌呤/胞嘧啶百分比含量范圍;知d)該非基因序列的長度為約1Kb至約4.9Kb。II.鑒定出的最優(yōu)非基因玉米基因組座位的重組衍生物依照一個實施方案,在將玉米植物的基因組座位鑒定為插入多核苷酸供體序列的高度理想位置之后,可以將一個或多個感興趣的核酸序列插入鑒定出的基因組座位。在一個實施方案中,感興趣的核酸包含外源基因序列或其他理想的多核苷酸供體序列。在另一個實施方案中,在將玉米的基因組座位鑒定為插入多核苷酸供體序列的高度理想位置之后,可以任選地刪除、切除或移除該最優(yōu)非基因玉米基因組座位的一個或多個感興趣的核酸,然后整合感興趣的DNA序列到鑒定出的基因組座位中。在一個實施方案中,最優(yōu)非基因玉米基因組座位中感興趣的核酸的插入包括外源基因序列或其他理想的多核苷酸供體序列的移除、刪除或切除。本公開還涉及用于利用ZFN和多核苷酸供體構(gòu)建體靶向整合到選定的玉米基因組座位中的方法和組合物。用于將感興趣的核酸序列插入最優(yōu)非基因玉米基因組座位的方法,除非另有說明,使用分子生物學(xué)、生物化學(xué)、染色質(zhì)結(jié)構(gòu)和分析、細(xì)胞培養(yǎng)、重組DNA和相關(guān)領(lǐng)域中的常規(guī)技術(shù),如本領(lǐng)域技術(shù)人員能夠?qū)嵤┑?。這些技術(shù)在文獻(xiàn)中有充分說明。參見例如,Sambrooketal.MOLECULARCLONING:ALABORATORYMANUAL,Secondedition,ColdSpringHarborLaboratoryPress,1989及Thirdedition,2001;Ausubeletal.,CURRENTPROTOCOLSINMOLECULARBIOLOGY,JohnWiley&Sons,NewYork,1987及定期更新;METHODSINENZYMOLOGY系列,AcademicPress,SanDiego;Wolfe,CHROMATINSTRUCTUREANDFUNCTION,Thirdedition,AcademicPress,SanDiego,1998;METHODSINENZYMOLOGY,Vol.304,″Chromatin″(P.M.WassarmanandA.P.Wolffe,eds.),AcademicPress,SanDiego,1999;和METHODSINMOLECULARBIOLOGY,Vol.119,″ChromatinProtocols″(P.B.Becker,ed.)HumanaPress,Totowa,1999。用于向玉米基因組中插入核酸的方法任何公知的用于將多核苷酸供體序列和核酸酶作為DNA構(gòu)建體導(dǎo)入宿主細(xì)胞中的規(guī)程均可根據(jù)本公開使用。這些包括使用磷酸鈣轉(zhuǎn)染、聚凝胺(polybrene)、原生質(zhì)體融合、PEG、電穿孔、超聲方法(例如聲孔處理(sonoporation))、脂質(zhì)體、顯微注射、裸DNA、質(zhì)粒載體、病毒載體(附加體和整合型兩者),和任何其它公知的用于將克隆基因組DNA、cDNA、合成DNA或其它外來遺傳材料導(dǎo)入宿主細(xì)胞中的方法(參見例如Sambrook等.,見上文)。必需的僅是,使用的特定核酸插入規(guī)程能夠?qū)⒅辽僖环N基因成功導(dǎo)入能夠表達(dá)選擇蛋白質(zhì)的宿主細(xì)胞中。如上文指出的,可以通過多種常規(guī)技術(shù)將DNA構(gòu)建體導(dǎo)入期望植物物種的基因組中。關(guān)于此類技術(shù)的綜述,參見例如Weissbach&WeissbachMethodsforPlantMolecularBiology(1988,AcademicPress,N.Y.)SectionVIII,pp.421-463;及Grierson&Corey,PlantMolecularBiology(1988,2dEd.),Blackie,London,Ch.7-9。可以使用諸如電穿孔和顯微注射植物細(xì)胞原生質(zhì)體,通過用碳化硅顯微攪拌(參見美國專利5,302,523和5,464,765)等技術(shù)將DNA構(gòu)建體直接導(dǎo)入植物細(xì)胞的基因組DNA中,或者可以生物射彈法,諸如DNA顆粒轟擊(參見例如Klein等.(1987)Nature327:70-73)將DNA構(gòu)建體直接導(dǎo)入植物組織中?;蛘?,可以經(jīng)由納米顆粒轉(zhuǎn)化(參見例如美國專利公開文本No.20090104700,其通過提及完整并入本文)將DNA構(gòu)建體導(dǎo)入植物細(xì)胞中?;蛘撸梢詫NA構(gòu)建體與合適的T-DNA邊界/側(cè)翼區(qū)組合,并且導(dǎo)入常規(guī)的根癌土壤桿菌(Agrobacteriumtumefaciens)宿主載體中。根癌土壤桿菌介導(dǎo)的轉(zhuǎn)化技術(shù)(包括二元載體的卸甲(disarming)和使用)在科學(xué)文獻(xiàn)中有充分描述。參見例如Horschetal.(1984)Science233:496-498和Fraleyetal.(1983)Proc.Nat′l.Acad.Sci.USA80:4803。另外,可以使用非土壤桿菌細(xì)菌或病毒諸如根瘤菌(Rhizobiumsp.)NGR234、苜蓿中華根瘤菌(Sinorhizoboiummeliloti)、百脈根根瘤菌(Mesorhizobiumloti)、馬鈴薯病毒X、花椰菜花葉病毒和木薯脈花葉病毒和/或煙草花葉病毒實現(xiàn)基因轉(zhuǎn)移。參見例如Chungetal.(2006)TrendsPlantSci.11(1):1-4。根癌土壤桿菌宿主的毒力功能會在使用二元TDNA載體(Bevan(1984)Nuc.AcidRes.12:8711-8721)或共培養(yǎng)規(guī)程(Horsch等(1985)Science227:1229-1231)通過細(xì)菌感染細(xì)胞時指導(dǎo)含有構(gòu)建體和相鄰標(biāo)志物的T鏈插入植物細(xì)胞DNA中。一般地,使用土壤桿菌轉(zhuǎn)化系統(tǒng)工程化改造雙子葉植物(Bevanetal.(1982)Ann.Rev.Genet.16:357-384;Rogersetal.(1986)MethodsEnzymol.118:627-641)。也可以使用土壤桿菌轉(zhuǎn)化系統(tǒng)將DNA轉(zhuǎn)化及轉(zhuǎn)移到單子葉植物和植物細(xì)胞。參見美國專利5,591,616;Hernalsteenetal.(1984)EMBOJ.3:3039-3041;Hooykass-VanSlogterenetal.(1984)Nature311:763-764;Grimsleyetal.(1987)Nature325:1677-179;Boultonetal.(1989)PlantMol.Biol.12:31-40;和Gouldetal.(1991)PlantPhysiol.95:426-434。備選的基因轉(zhuǎn)移和轉(zhuǎn)化方法包括但不限于經(jīng)由鈣、聚乙二醇(PEG)或電穿孔介導(dǎo)的裸DNA攝取的原生質(zhì)體轉(zhuǎn)化(參見Paszkowskietal.(1984)EMBOJ.3:2717-2722,Potrykusetal.(1985)Molec.Gen.Genet.199:169-177;Frommetal.(1985)Proc.Nat.Acad.Sci.USA82:5824-5828;和Shimamoto(1989)Nature338:274-276)和植物組織的電穿孔(D′Halluinetal.(1992)PlantCell4:1495-1505)。用于植物細(xì)胞轉(zhuǎn)化的其它方法包括顯微注射、碳化硅介導(dǎo)的DNA攝取(Kaeppleretal.(1990)PlantCellReporter9:415-418)、和微粒轟擊(Kleinetal.(1988)Proc.Nat.Acad.Sci.USA85:4305-4309;andGordon-Kammetal.(1990)PlantCell2:603-618)。在一個實施方案中,導(dǎo)入宿主細(xì)胞中用于靶向插入基因組的感興趣的核酸在被靶向的感興趣核酸的一個或兩個末端包含同源側(cè)翼序列。在這樣的實施方案中,同源側(cè)翼序列含有足夠水平的與玉米基因組序列的序列同一性,以支持該序列與該序列有同源性的基因組序列之間的同源重組。供體與基因組序列之間大約25,50,100,200,500,750,1000,1500,或2000個核苷酸,或者更高的序列同一性,范圍從70%至100%,(或者10與200個核苷酸之間的任何整數(shù)值,或更多)將支持二者之間的同源重組。在另一個實施方案中,被靶向的感興趣的核酸缺少同源側(cè)翼序列,且被靶向的感興趣的核酸與基因組序列享有低到極低水平的序列同一性。在用于對細(xì)胞染色質(zhì)中所關(guān)注的區(qū)域內(nèi)的序列進(jìn)行靶向重組和/或替換和/或改變的其他實施方案中,通過與外源“供體”核苷酸序列的同源重組來改變?nèi)旧w序列。如果存在與斷裂區(qū)域同源的序列,則細(xì)胞染色質(zhì)中雙鏈斷裂的存在會刺激此類同源重組。細(xì)胞染色質(zhì)中的雙鏈斷裂還可以刺激非同源末端連接的細(xì)胞機(jī)制。在本文所述的任何方法中,第一核苷酸序列(“供體序列”)可以含與所關(guān)注的區(qū)域中的基因組序列同源但不相同的序列,從而刺激同源重組以在所關(guān)注的區(qū)域中插入不相同序列。因此,在某些實施方案中,與所關(guān)注的區(qū)域中序列同源的供體序列的某些部分顯示出與被替換基因組序列約80,85,90,95,97.5,至99%(或其間任意整數(shù))的序列相同性。在其它實施方案中,供體與基因組序列間的同源性高于99%,例如,如果在100個毗連堿基對上僅有I個核苷酸不同的話。在某些情況下,供體序列的非同源部分能包含感興趣區(qū)域中不存在的序列,從而將新序列引入感興趣區(qū)域。這些情況下,所述非同源序列一般側(cè)接有50-2,000個堿基對(或其間任何整數(shù))或大于2,000的任何堿基對數(shù)目的序列,所述序列與感興趣區(qū)域的序列同源或相同。在其他實施方式中,供體序列與感興趣的區(qū)域不同源,并通過非同源重組機(jī)制插入基因組。依照一個實施方案,使用鋅指核酸酶(ZFN)來在被靶向的基因組座位中導(dǎo)入雙鏈斷裂以易化感興趣的核酸的插入。例如,可以依照美國專利6,453,242中公開的方法實現(xiàn)選定的基因組座位中用于被鋅指域結(jié)合的靶位點的選擇,該專利的公開通過提述并入本文,其還公開了用于設(shè)計鋅指蛋白(ZFP)以結(jié)合選定序列的方法。本領(lǐng)域技術(shù)人員會清楚的是,也可以使用對核苷酸序列的簡單目測檢查來選擇靶位點。因而,用于靶位點選擇的任何手段都可以在本文中描述的方法中使用。對于ZFPDNA結(jié)合域,靶位點一般由多個相鄰的靶亞位點構(gòu)成。靶亞位點指被單個鋅指結(jié)合的序列,通常是核苷酸三聯(lián)體或核苷酸四聯(lián)體,其可以與相鄰的四聯(lián)體有一個核苷酸重疊。參見例如WO02/077227,將其公開內(nèi)容通過提述并入本文。靶位點一般具有至少9個核苷酸的長度,且相應(yīng)地被包含至少3個鋅指的鋅指結(jié)合域結(jié)合。然而,例如,4指結(jié)合域?qū)?2個核苷酸的靶位點、5指結(jié)合域?qū)?5個核苷酸的靶位點或6指結(jié)合域?qū)?8個核苷酸的靶位點的結(jié)合也是有可能的。容易想到的是,更大的結(jié)合域(例如7、8、9指和更多)對更長的靶位點的結(jié)合與本公開也是一致的。依照一個實施方案,靶位點不必是多個三核苷酸。在發(fā)生交叉鏈相互作用的情況中參見例如美國專利6,453,242和WO02/077227),多指結(jié)合域的一個或多個鋅指個體可以結(jié)合重疊的四聯(lián)體亞位點。因此,三指蛋白質(zhì)可以結(jié)合10個核苷酸的序列,其中第10個核苷酸是被末端指結(jié)合的四聯(lián)體的部分,四指蛋白質(zhì)可以結(jié)合13個核苷酸的序列,其中第13個核苷酸是被末端指結(jié)合的四聯(lián)體的部分,等等。多指結(jié)合域中鋅指個體間的氨基酸接頭序列的長度和性質(zhì)也影響對靶序列的結(jié)合。例如,多指結(jié)合域中相鄰鋅指間所謂的″非規(guī)范接頭″、″長接頭″或″有結(jié)構(gòu)的接頭″的存在可以容許那些指結(jié)合不直接相鄰的亞位點。此類接頭的非限制性例子記載于例如美國專利No.6,479,626和WO01/53480。因而,鋅指結(jié)合域的靶位點中的一個或多個亞位點彼此可以相隔1、2、3、4、5或更多個核苷酸。一個非限定性實例可以是可結(jié)合13個核苷酸的靶位點的四指結(jié)合域,其在序列上包含兩個連續(xù)的3核苷酸亞位點、1個居間核苷酸、和2個連續(xù)的三聯(lián)體亞位點。盡管從自然界中存在的蛋白質(zhì)中鑒定的DNA結(jié)合多肽通常與離散的核苷酸序列或基序(例如,共有識別序列)結(jié)合,但是在本領(lǐng)域中存在并且知曉有方法來修飾許多這樣的DNA結(jié)合多肽從而識別不同的核苷酸序列或基序。DNA結(jié)合多肽包括,例如但不僅限于:鋅指DNA結(jié)合域;亮氨酸拉鏈;UPADNA結(jié)合域;GAL4;TAL;LexA;Tet抑制子;LacR;和類固醇激素受體。在一些實例中,DNA結(jié)合多肽是鋅指。單獨的鋅指基序可以被設(shè)計成靶向并特異性結(jié)合多種多樣的DNA位點中的任何種。規(guī)范的Cys2His2(以及非規(guī)范的Cys3His)鋅指多肽通過將α-螺旋插入到靶DNA雙螺旋的大溝中來結(jié)合DNA。鋅指識別DNA是模塊性的;每個指主要與靶中的三個連續(xù)堿基對接觸,并由多肽中的少數(shù)關(guān)鍵殘基介導(dǎo)識別。通過在靶向性核酸內(nèi)切酶中包含多個鋅指DNA結(jié)合域,靶向性核酸內(nèi)切酶的DNA結(jié)合特異性可以被進(jìn)一步提高(因此,由其賦予的任何基因調(diào)節(jié)效應(yīng)的特異性也被提高)。見例如Urnovetal.(2005)Nature435:646-51。因此,可以工程構(gòu)建并使用一個或多個鋅指DNA結(jié)合多肽,使得引入到宿主細(xì)胞中的靶向性核酸內(nèi)切酶與宿主細(xì)胞基因組內(nèi)獨特的DNA序列相互作用。優(yōu)選地,鋅指蛋白是非天然存在的,即其是被工程構(gòu)建為結(jié)合所選的靶位點的。參見,例如Beerlietal.(2002)NatureBiotechnol.20:135-141;Paboetal.(2001)Ann.Rev.Biochem.70:313-340;Isalanetal.(2001)NatureBiotechnol.19:656-660;Segaletal.(2001)Curr.Opin.Biotechnol.12:632-637;Chooetal.(2000)Curr.Opin.Struct.Biol.10:411-416;美國專利Nos.6,453,242;6,534,261;6,599,692;6,503,717;6,689,558;7,030,215;6,794,136;7,067,317;7,262,054;7,070,934;7,361,635;7,253,273;和美國專利公開Nos.2005/0064474;2007/0218528;2005/0267061,本文通過提述并入其全部內(nèi)容。與天然存在的鋅指蛋白相比,工程化的鋅指結(jié)合域可以具有新的結(jié)合特異性。工程化方法包括,但不僅限于,合理設(shè)計和各種類型的選擇。合理設(shè)計包括,例如,使用包含三鏈體(或四鏈體)核苷酸序列和單個鋅指氨基酸序列的數(shù)據(jù)庫,其中每個三鏈體或四鏈體核苷酸序列與結(jié)合該特定三鏈體或四鏈體序列的一個或多個鋅指氨基酸序列相關(guān)。參見,例如共同擁有的美國專利6,453,242和6,534,261,文通過提述并入其全部內(nèi)容?;蛘?,DNA結(jié)合域可來源于核酸酶。例如,歸巢內(nèi)切核酸酶和大范圍核酸酶如I-SceI,I-CeuI,PI-PspI,PI-Sce,I-SceIV,I-CsmI,I-PanI,I-SceII,I-PpoI,I-SceIII,I-CreI,I-TevI,I-TevII及I-TevIII的識別序列是已知的。另參見美國專利號5,420,032;美國專利號6,833,252;Belfortetal.(1997)NucleicAcidsRes.25:3379-3388;Dujonetal.(1989)Gene82:115-118;Perleretal.(1994)NucleicAcidsRes.22,1125-1127;Jasin(1996)TrendsGenet.12:224-228;Gimbleetal.(1996)J.Mol.Biol.263:163-180;Argastetal.(1998)J.Mol.Biol.280:345-353,以及NewEnglandBiolabs目錄。此外,歸巢核酸酶和大范圍核酸酶的DNA結(jié)合特異性可以被工程化,從而結(jié)合非天然靶位點。參見,例如,Chevalieretal.(2002)Molec.Cell10:895-905;Epinatetal.(2003)NucleicAcidsRes.31:2952-2962;Ashworthetal.(2006)Nature441:656-659;Paquesetal.(2007)CurrentGeneTherapy7:49-66;美國專利公開號20070117128。作為另一替代,DNA結(jié)合域可衍生自亮氨酸拉鏈蛋白。亮氨酸拉鏈?zhǔn)且活悈⑴c在多種真核生物調(diào)控蛋白(所述調(diào)控蛋白是與基因表達(dá)相關(guān)的重要轉(zhuǎn)錄因子)中蛋白-蛋白的相互作用的蛋白質(zhì)。亮氨酸拉鏈指在這些跨越包括動物、植物、酵母等多個界的轉(zhuǎn)錄因子中共享的共同結(jié)構(gòu)基序。亮氨酸拉鏈由兩條多肽(同二聚體或異二聚體)形成,所述多肽以其中亮氨酸殘基在α-螺旋中均勻地隔開,使得兩條多肽的亮氨酸殘基在螺旋的同一面上結(jié)束的方式結(jié)合特定的DNA序列??稍诒疚闹泄_的DNA結(jié)合域中利用所述亮氨酸拉鏈的DNA結(jié)合特異性。在一些實施方案中,DNA結(jié)合域是來自衍生于植物病原菌黃單胞菌(Xanthomonas)的TAL效應(yīng)子的工程化域(見Miller等人,(2011)NatureBiotechnology29(2):143-8;Boch等人,(2009)Science29Oct2009(10.1126/science.117881)和Moscou和Bogdanove,(2009)Science29Oct2009(10.1126/science.1178817;和美國專利公開號20110239315,20110145940和20110301073)。CRISPR(間隔規(guī)律的成簇短回文重復(fù))/Cas(CRISPR相關(guān)的)核酸酶系統(tǒng)是最近工程化的核酸酶系統(tǒng),該系統(tǒng)基于能用于基因組工程的細(xì)菌系統(tǒng)。其基于多種細(xì)菌和古細(xì)菌的部分適應(yīng)性免疫應(yīng)答。當(dāng)病毒或質(zhì)粒入侵細(xì)菌時,入侵者DNA的片段通過“免疫”應(yīng)答被轉(zhuǎn)換成CRISPRRNA(crRNA)。這種crRNA之后通過部分互補(bǔ)區(qū)域與另一類稱為tracrRNA的RNA相關(guān)聯(lián)以引導(dǎo)Cas9核酸酶到與目標(biāo)DNA中crRNA同源的區(qū)域中(稱為“protospacer”)。Cas9切割DNA以在DSB中由包含于crRNA轉(zhuǎn)錄本中的20-核苷酸引導(dǎo)序列所指定的位點處產(chǎn)生平末端。Cas9需要crRNA和tracrRNA兩者進(jìn)行位點特定性的DNA識別和切割。該系統(tǒng)現(xiàn)在已經(jīng)被工程化從而可以將crRNA和tracrRNA合并到一個分子內(nèi)(“單一引導(dǎo)RNA”),且所述單一引導(dǎo)RNA的crRNA等同部分可被工程化以引導(dǎo)Cas9核酸酶靶向任何期望序列(見Jinek等人(2012)Science337,p.816-821,Jinek等人,(2013),eLife2:e00471,和DavidSegal,(2013)eLife2:e00563)。因此CRISPR/Cas系統(tǒng)可被工程化以在基因組的期望靶點處創(chuàng)建雙鏈斷裂(DSB),以及可通過使用修復(fù)抑制劑影響DSB的修復(fù)以導(dǎo)致易錯修復(fù)的增加。在某些實施方案中,Cas蛋白可以是天然存在Cas蛋白的“功能性衍生物”。天然序列多肽的“功能性衍生物”指具有與天然序列多肽共同的定性生物學(xué)特性的化合物?!肮δ苄匝苌铩卑ǖ幌抻谔烊恍蛄械钠魏吞烊恍蛄卸嚯募捌淦蔚难苌铮疤崾撬鼈兙哂信c相應(yīng)天然序列多肽共同的生物學(xué)活性。本文中涵蓋的生物學(xué)活性指功能性衍生物將DNA底物水解成片段的能力。術(shù)語“衍生物”涵蓋多肽的氨基酸序列變體、共價修飾二者及其融合。Cas多肽或其片段的合適衍生物包括但不限于Cas蛋白或其片段的突變體、融合物、共價修飾。Cas蛋白(包括Cas蛋白或其片段)以及Cas蛋白或其片段的衍生物可得自細(xì)胞或化學(xué)合成或通過這兩種規(guī)程的組合來獲得。該細(xì)胞可以是天然生成Cas蛋白的細(xì)胞,或天然生成Cas蛋白且經(jīng)遺傳工程改造成以更高表達(dá)水平生成內(nèi)源Cas蛋白或自外源引入的核酸(該核酸編碼與內(nèi)源Cas相同或不同的Cas)生成Cas蛋白的細(xì)胞。在一些情況中,該細(xì)胞并非天然生成Cas蛋白且經(jīng)遺傳工程改造成生成Cas蛋白。通過將Cas核酸酶與向?qū)NA共表達(dá)來將Cas蛋白部署在哺乳動物細(xì)胞中(且推定地,在植物細(xì)胞內(nèi))??墒褂脙煞N形式的向?qū)NA來易化Cas介導(dǎo)的基因組切割,如LeCong,F(xiàn).,etal.,(2013)Science339(6121):819-823中公開的。在其他實施方案中,DNA結(jié)合域可與切割(核酸酶)域聯(lián)合。例如,歸巢內(nèi)切核酸酶可以在其DNA結(jié)合特異性中修飾,并保留核酸酶功能。此外,鋅指蛋白可同樣與切割域融合以形成鋅指核酸酶(ZFN)。本文中公開的融合蛋白的切割域部分可從任何核酸內(nèi)切酶或核酸外切酶中獲得。示例性的可衍生切割域的核酸內(nèi)切酶包括,但不限于,限制性核酸內(nèi)切酶和歸巢核酸內(nèi)切酶。見,例如2002-2003CatalogueNewEnglandBiolabs,MA;和Belfort等人,(1997)NucleicAcidsRes。其他的切割DNA的酶是已知的(如S1核酸酶;綠豆核酸酶;胰DNA酶I;微球菌核酸酶;酵母HO內(nèi)切核酸酶;也參見Linn等人,(編)Nucleases,ColdSpringHarborLaboratoryPress,1993)).歸巢內(nèi)切核酸酶和大范圍核酸酶的非限定的例子包括I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII是已知的。還見美國專利號5,420,032;美國專利號:6,833,252;Belfort等人,(1997)NucleieAcidsRes.25:3379-3388;Dujon等人,(1989)Gene82:115-118;Perler等人,(1994)NucleicAcidsRes.22,1125-1127;Jasin(1996)TrendsGenet.12:224-228;Gimble等人,(1996)JMol.Bioi.263:163-180;Argast等人,(1998)JMol.Biol.280:345-353和NewEnglandBiolabscatalogue。可將一種或多種的這些酶(或其功能性片段)用作切割域和切割半-域的來源。限制性核酸內(nèi)切酶(限制性酶)存在于許多物種中且能夠序列特異性的結(jié)合DNA(在識別位點),并在結(jié)合位點處或結(jié)合位點附近切割DNA。一些限制酶(如IIS型)在從識別位點移除的位點處切割DNA并具有可分開的結(jié)合與切割域。例如,IIS型酶FokI催化DNA的雙鏈切割,切割在一條鏈上距離結(jié)合位點9個核苷酸,而在另一條鏈上距其識別位點13個核苷酸。參見,例如美國專利5,356,802;5,436,150和5,487,994;以及Li等人,(1992)Proc.Natl.AeadSci.USA89:4275-4279;Li等人,(1993)Proc.Natl.Acad.Sci.USA90:2764-2768;Kim等人,(1994a)Proc.Natl.AeadSci.USA91:883-887;Kim等人,(1994b)J.Biol.Chem.269:31,978-31,982。因此,在一個實施方案中,融合蛋白包含來自至少一種IIS型限制酶的切割域(或切割半域)和一種或多種鋅指結(jié)合域,其可以是工程化的或未工程化的。一種示例性的切割域與結(jié)合域可分開的IIS型限制酶是FokI。這一特別的酶作為二聚體發(fā)揮活性。Bitinaite等人,(1998)ProcNatl.Acad.Sci.USA95:10,570-10,575。因此,為本發(fā)明公開的目的,用在公開的融合蛋白中的FokI酶的部分被認(rèn)為是切割的半域。因此,為了使用鋅指-FokI融合進(jìn)行靶向性雙鏈切割和/或靶向性細(xì)胞序列的替換,兩個融合蛋白(每個包含F(xiàn)okI切割半域)可被用于重構(gòu)催化活性的切割域。或者,也可使用包含鋅指結(jié)合域和兩個FokI切割半域的單一多肽分子。使用鋅指-FokI融合進(jìn)行靶向性切割和靶向性序列變換(alteration)的參數(shù)在本公開的別處提供。切割域或切割半域可以是蛋白的任何部分,其保留切割活性,或其保留多聚化(如二聚化)以形成有功能的切割域的能力。IIS型限制酶的例子描述于國際公開WO2007/014275中,通過引用將其全文納入本文。為了增強(qiáng)切割特異性,切割域還可以被修飾。在一些實施方案中,使用切割半域的變體,這些變體最小化或防止切割半域的同二聚化。這種修飾的切割半域的非限制性例子詳細(xì)描述于WO2007/014275中,通過引用將其全文納入本文。在一些實施方案中,切割域包括工程化的切割半域(也指二聚化域變體),其最小化或阻止二聚化。這樣的實施方案是本領(lǐng)域技術(shù)人員所知曉的,且在例如美國專利公開號20050064474;20060188987;20070305346和20080131962中有描述,通過提述將其全部內(nèi)容納入本文。位于FokI的446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537和538位的氨基酸殘基均是用于影響FokI切割半域二聚化的靶點。另外的工程化的FokI的切割半域(其形成專性異二聚體)同樣可被用于描述于本文的ZFN中。示例性的工程化的形成專性異二聚體的FokI的切割半域包括一對切割半域,其中第一個切割半域包括在FokI位點490和538的氨基酸殘基處的突變以及第二個切割半域包括在486和499位的氨基酸殘基處的突變。因此,在一個實施方案中,位于490位置的突變,將Glu(E)替換為Lys(K);位于538位置的突變,將Iso(I)替換為Lys(K);位于486位置的突變,將Gln(Q)替換為(Glu)(E);以及位于499位置的突變,將Iso(I)替換為Lys(K)。特別是,本文描述的工程化的切割半域通過突變一個切割半域中的位置490(E→K)和538(I→K)以產(chǎn)生工程化的切割半域(命名為“E490K:I538K”),以及通過突變在另一個切割半域中的位置486(Q→E)和499(I→L)以產(chǎn)生工程化的切割半域(命名為“Q486E:I499L”)。本文中描述的所述工程化的切割半域為專性異二聚體突變體,其中異常切割被最小化或被消除。例如,見美國專利公開號2008/0131962,通過引用整體將其全文納入用于所有目的。在一些實施方案中,所述工程化的切割半域包括在486、499和496位置(相對于野生型FokI編號)的突變,例如在486位置處用Glu(E)殘基替換野生型Gln(Q)殘基、在499位置處用Leu(L)殘基替換野生型Iso(I)殘基,在496位置處用Asp(D)或Glu(E)殘基替換野生型Asn(N)殘基(亦分別稱為“ELD”和“ELE”域)。在其他實施方案中,所述工程化的切割半域包括在位置490,538和537處的突變(相對于野生型FokI編號),例如在490位置處用Lys(K)殘基替換野生型Glu(E)殘基、在538位置處用Lys(K)殘基替換野生型Iso(I)殘基以及在537位置處用Lys(K)或Arg(R)殘基替換野生型His(H)殘基(亦分別稱為“KKK”和“KKR”域)。在其他實施方案中,所述工程化的切割半域包括在位置490和537處的突變(相對于野生型FokI編號),例如在490位置處用Lys(K)殘基替換野生型Glu(E)殘基以及在537位置處用Lys(K)或Arg(R)殘基替換野生型His(H)殘基(亦分別稱為“KIK”和“KIR”域)。(見美國專利公開號20110201055)。在其他實施方案中,所述工程化的切割半域包括“Sharkey”和/或“Sharkey’”突變(見Guo等人,(2010)JMol.Biol.400(1):96-107)??墒褂萌魏魏线m的方法來制備本文中公開的工程化的切割半域,例如通過描述于美國專利公開號20050064474;20080131962;和20110201055的對野生型切割半域(FokI)的定點誘變來制備?;蛘?,可使用所謂的“分裂-酶”技術(shù)在體內(nèi)于核酸靶位點處組裝核酸酶(參見例如,美國專利公開號20090068164)。這樣的分裂酶的組分可以在分開的表達(dá)載體上表達(dá),或可以被連接入一個開放閱讀框中表達(dá)(其中例如由自切割2A肽或IRES序列分隔每個組分)。組分可以是單獨鋅指結(jié)合域或大范圍核酸酶核酸結(jié)合域的域。在使用前可(例如在基于酵母的染色體系統(tǒng)中(描述于WO2009/042163和WO20090068164))篩選核酸酶的活性。可通過使用本領(lǐng)域已知方法容易地設(shè)計出核酸酶表達(dá)構(gòu)建體。參見,例如美國專利公開20030232410;20050208489;20050026157;20050064474;20060188987;20060063231;和國際公開WO071014275??梢栽诮M成型啟動子或可誘導(dǎo)啟動子(例如半乳糖激酶啟動子,其在棉子糖和/或半乳糖的存在下被激活(去抑制),在葡萄糖的存在下被抑制)的控制下表達(dá)核酸酶?!鞍形稽c之間的距離”指介于兩個靶位點之間的核苷酸或核苷酸對的數(shù)目,從各序列最接近彼此的邊緣測量。在切割依賴于兩個鋅指域/切割半域融合分子的結(jié)合來分隔各靶位點的特定實施方案中,兩個靶位點可以位于相對的DNA鏈上。在其他實施方案中,兩個靶位點位于同一DNA鏈上。為了靶向整合到最優(yōu)基因組座位中,將一個或多個ZFP工程化,使之結(jié)合預(yù)定切割位點處或其附近的靶位點,并在細(xì)胞中表達(dá)包含該工程化DNA結(jié)合域和切割域的融合單標(biāo)。當(dāng)該融合蛋白的鋅指蛋白部分結(jié)合到靶位點時,該切割域在靶位點附近切割DNA,優(yōu)選介由雙鏈斷裂。最優(yōu)基因組座位中雙鏈斷裂的存在幫助外源序列通過同源重組的整合。因此,在一個實施方案中,包含要插入到被靶定的基因組座位的感興趣的核酸序列的多核苷酸將包括一個或多個與被靶定的基因組座位具有同源性的區(qū)域,以幫助同源重組。除了本文中描述的融合分子,對選定的基因組序列的靶向替換還涉及供體序列的導(dǎo)入。多核苷酸供體序列可以在融合蛋白的表達(dá)之前、同時、后之后導(dǎo)入細(xì)胞。在一個實施方案中,供體多核苷酸含有足夠水平的與最優(yōu)基因組座位的同源性,以支持該序列與該序列有同源性的最優(yōu)基因組座位之間的同源重組。供體與基因組序列之間大約25,50,100,200,500,750,1000,1500,或2000個核苷酸,或者10與2000個核苷酸之間的任何整數(shù)值,或更多,將支持同源重組。在特定實施方案中,同源臂的長度小于1000個堿基對。在其他實施方案中,同源臂長度小于750個堿基對。在一個實施方案中,供體多核苷酸序列可包含載體分子,載體分子含有與細(xì)胞染色質(zhì)中感興趣的區(qū)域不同源的序列。供體多核苷酸分子可含有數(shù)個不連續(xù)的與細(xì)胞染色質(zhì)具有同源性的區(qū)域。例如,為了靶向插入在感興趣的區(qū)域中通常不存在的序列,所述序列可以存在于供體核酸分子中,被與感興趣的區(qū)域有同源性的區(qū)域所側(cè)翼包夾。供體多核苷酸可以是DNA或RNA,單鏈或雙鏈,且可以呈線性或環(huán)狀形式導(dǎo)入細(xì)胞。參見美國專利公開號20100047805,20110281361,20110207221和美國專利申請?zhí)?3/889,162。如果是以線性形式導(dǎo)入的,供體序列的末端可以通過本領(lǐng)域技術(shù)人員知曉的方法加以保護(hù)(例如防止外切核酸水解降解)。例如,將一個或多個雙脫氧核苷酸殘基添加到線性分子的3’末端,和/或?qū)⒆晕一パa(bǔ)的寡核苷酸連接到一個或兩個末端。參見例如,Changetal.(1987)Proc.Natl.Acad.Sci.USA84:4959-4963;Nehlsetal.(1996)Science272:886-889。其他用于保護(hù)外源多核苷酸不受降解的方法包括,但不限于,添加末端氨基基團(tuán),以及使用修飾的核苷酸間連接,例如硫代磷酸酯、氨基磷酸酯、以及O-甲基核糖或脫氧核糖殘基。依照一個實施方案,提供一種用于制備轉(zhuǎn)基因轉(zhuǎn)基因玉米植物的方法,其中感興趣的DNA已經(jīng)插入了最優(yōu)非基因玉米基因組座位。該方法包括下述步驟:a.選擇最優(yōu)非基因玉米座位作為插入感興趣的核酸的靶標(biāo);b.向玉米植物細(xì)胞中導(dǎo)入位點特異性核酸酶,其中位點特異性核酸酶切割所述非基因序列;c.將感興趣的DNA導(dǎo)入植物細(xì)胞,和d.選擇包含被靶向到所述非基因序列的感興趣的DNA的轉(zhuǎn)基因植物細(xì)胞。依照一個實施方案,提供一種用于制備轉(zhuǎn)基因玉米原生質(zhì)體細(xì)胞的方法,其中感興趣的DNA已經(jīng)插入了最優(yōu)非基因玉米基因組座位。該方法包括下述步驟:a.選擇最優(yōu)非基因玉米座位作為插入感興趣的核酸的靶標(biāo);b.向玉米原生質(zhì)體細(xì)胞中導(dǎo)入位點特異性核酸酶,其中位點特異性核酸酶切割所述非基因序列;c.將感興趣的DNA導(dǎo)入玉米原生質(zhì)體細(xì)胞;和d.選擇包含被靶向到所述非基因序列的感興趣的DNA的轉(zhuǎn)基因玉米原生質(zhì)體細(xì)胞。在一個實施方案中,位點特異性核酸酶選自鋅指核酸酶、CRISPR核酸酶、TALEN核酸酶、或大范圍核酸酶,且更具體地,在一個實施方案中,位點特異性核酸酶是鋅指核酸酶。依照一個實施方案,感興趣的DNA介由同源性引導(dǎo)修整合方法整合到所述非基因序列內(nèi)?;蛘?,在一些實施方案中感興趣的DNA通過非同源末端連接整合法整合到所述非基因序列內(nèi)。在其他實施方案中,感興趣的DNA通過先前未有描述的方法整合到所述非基因序列內(nèi)。在一個實施方案中,該方法包括選擇用于該興趣的DNA的靶向插入的最優(yōu)非基因玉米基因組座位,其具有下述特征中的2、3、4、5、6、7或8種:a.該非基因序列長度為至少1Kb,且該序列內(nèi)不含有大于1%DNA甲基化,b.在玉米基因組內(nèi),該非基因序列顯示0.00041至62.42cM/Mb的重組率;c.在玉米基因組內(nèi),該非基因序列顯示0至0.962的核小體占據(jù)水平;d.該非基因組序列與該玉米基因組內(nèi)的任何其他序列享有少于40%的序列同一性;e.該非基因序列的相對位置值為0.00373至0.99908的距玉米染色體著絲粒遺傳距離比;f.該非基因序列的鳥嘌呤/胞嘧啶百分比含量范圍為25.17至68.3%;g.該非基因序列位于基因序列附近;和h.包含所述非基因序列的玉米基因組序列的1Mb區(qū)域包含一個或多個其他非基因序列。在一個實施方案中,所述最優(yōu)非基因玉米座位選自類簇1,2,3,4,5,6,7,8,9,10,11,2,3,4,5,6,7,8,9,20,21,22,23,24,25,26,27,28,29,30,31或32的座位。投遞本申請中公開的供體分子通過靶向的同源性非依賴和/或同源性依賴方法整合到細(xì)胞的基因組中。對于這樣的靶向整合,使用核酸酶,例如,DNA結(jié)合域(例如鋅指結(jié)合域、CRISPR或TAL效應(yīng)物域被工程化從而結(jié)合預(yù)定的切割位點處或附近的靶位點)和核酸酶域(例如切割域或切割半域)之間的融合物,在期望的位置(或多個位置)切割基因組。在特定的實施方案中,兩個融合蛋白,每個融合蛋白包含DNA結(jié)合域和切割半域,在細(xì)胞中表達(dá),并結(jié)合多個靶位點,這些靶位點以一定的方式被并置,從而重建出功能性切割域,且DNA在這些靶位點附近被切割。在一個實施方案中,切割在兩個DNA結(jié)合域的靶位點之間發(fā)生。DNA結(jié)合域之一或者二者可以是工程化的。另外參見美國專利號7,888,121;美國專利公開號20050064474和國際專利公開號WO05/084190,WO05/014791和WO03/080809。如本文中描述的核酸酶可以作為多肽和/或多核苷酸導(dǎo)入。例如,可以將分別包含編碼上述多肽之一的序列的兩個多核苷酸導(dǎo)入細(xì)胞,且當(dāng)這些多肽表達(dá)并分別結(jié)合于其靶序列時,在靶序列處或其附近發(fā)生切割?;蛘?,將包含編碼兩個融合多肽的序列的一條多核苷酸導(dǎo)入細(xì)胞。多核苷酸可以是DNA、RNA或任何修飾的形式或類似物或DNA和/或RNA。在將雙鏈斷裂引入感興趣的區(qū)域中后,在對雙鏈供體分子線性化后,將轉(zhuǎn)基因以靶向的方式經(jīng)由非同源性依賴的方法(例如,非同源末端連接(NHEJ))整合到感興趣的區(qū)域中,如本文所描述的。優(yōu)選地利用核酸酶在體內(nèi)將雙鏈供體進(jìn)行線性化,例如,用于將雙鏈斷裂引入基因組中的一種或多種相同的或不同的核酸酶。染色體和供體在細(xì)胞中的同步切割可限制供體DNA降解(與在導(dǎo)入到細(xì)胞之前供體分子的線性化相比較)。用于使供體線性化的核酸酶靶位點優(yōu)選地不破壞轉(zhuǎn)基因序列??梢砸杂珊怂崦竿怀龆说暮唵芜B接所預(yù)期的方向(命名為“正向”或“AB”方向)或以交替的方向(命名為“反向”或“BA”方向)將轉(zhuǎn)基因整合到基因組中。在某些實施方案中,轉(zhuǎn)基因在將供體和染色體突出端的正確連接之后整合。在另外的實施方案中,轉(zhuǎn)基因以BA方向或AB方向的整合產(chǎn)生了若干核苷酸的缺失。通過應(yīng)用諸如這些技術(shù)的技術(shù),可穩(wěn)定轉(zhuǎn)化幾乎任何種類的細(xì)胞。在一些實施方案中,轉(zhuǎn)化DNA整合到宿主細(xì)胞的基因組中。在多細(xì)胞種類的情況下,可將轉(zhuǎn)基因細(xì)胞再生為轉(zhuǎn)基因生物體。任何這些技術(shù)可用于產(chǎn)生轉(zhuǎn)基因植物,例如,在轉(zhuǎn)基因植物的基因組中包括一種或多種供體多核苷酸序列的轉(zhuǎn)基因植物。在本發(fā)明的實施方案中,可通過本領(lǐng)域技術(shù)人員已知的任何方法在將DNA、RNA、肽和/或蛋白或核酸和肽的組合遞送植物細(xì)胞的方法中將核酸遞送到植物細(xì)胞中,所述方法包括,例如,但不限于:通過轉(zhuǎn)化原生質(zhì)體(參見,美國專利5,508,184);通過脫水(desiccation)/抑制介導(dǎo)的DNA攝入(參見,例如Potrykus等人(1985)Mol.Gen.Genet.199:183-8);通過電穿孔(參見,例如,美國專利5,384,253);通過利用碳化硅纖維振蕩(參見,美國專利5,302,523和5,464,765);通過土壤桿菌(Agrobacterium)介導(dǎo)的轉(zhuǎn)化(參見,例如,美國專利5,563,055、5,591,616、5,693,512、5,824,877、5,981,840和6,384,301);通過DNA包覆的顆粒的加速(參見,例如,美國專利5,015,580、5,550,318、5,538,880、6,160,208、6,399,861和6,403,865)和通過納米顆粒、納米載體和細(xì)胞穿透肽(WO201126644A2;WO2009046384A1;WO2008148223A1)。最廣泛應(yīng)用的將表達(dá)載體導(dǎo)入到植物中的方法基于土壤桿菌的天然轉(zhuǎn)化系統(tǒng)。根癌土壤桿菌(A.tumefaciens)和發(fā)根土壤桿菌(A.rhizogenes)是在遺傳上轉(zhuǎn)化植物細(xì)胞的植物病原性土壤細(xì)菌。根癌土壤桿菌和發(fā)根土壤桿菌各自的Ti和Ri攜帶負(fù)責(zé)植物的遺傳轉(zhuǎn)化的基因。Ti(腫瘤誘導(dǎo)性)質(zhì)粒包含稱作T-DNA的大區(qū)段,其轉(zhuǎn)移到轉(zhuǎn)化的植物中。Ti質(zhì)粒的另一區(qū)段vir區(qū)負(fù)責(zé)T-DNA轉(zhuǎn)移。T-DNA區(qū)以左手和右手邊界為邊界,每個邊界由末端重復(fù)核苷酸序列組成。在一些修飾的二元載體中,腫瘤誘導(dǎo)基因已經(jīng)是缺失的,且使用vir區(qū)的功能來轉(zhuǎn)移以T-DNA邊界序列為邊界的外源DNA。T區(qū)域還可包含例如用于轉(zhuǎn)基因植物和細(xì)胞的有效回收的可選擇性標(biāo)志物,和用于插入用于轉(zhuǎn)移諸如編碼本發(fā)明的融合蛋白的核酸的序列的多克隆位點。因此,在一些實施方案中,植物轉(zhuǎn)化載體源自根癌土壤桿菌的Ti質(zhì)粒(參見,例如,美國專利第4,536,475號、第4,693,977號、第4,886,937號、和第5,501,967號;和歐洲專利EP0122791)或發(fā)根土壤桿菌的Ri質(zhì)粒。另外的植物轉(zhuǎn)化載體包括,例如,但不限于,由以下中所描述的那些:Herrera-Estrella等人(1983)Nature303:209-13;Bevan等人(1983),同上;Klee等人(1985)Bio/Technol.3:637-42;和歐洲專利EP0120516,和源自任何上述的那些。與植物天然相互作用的其他細(xì)菌諸如中華根瘤菌(Sinorhizobium)、根瘤菌(Rhizobium)和中慢生根瘤菌(Mesorhizobium)可經(jīng)修飾以介導(dǎo)基因轉(zhuǎn)移到大量的多種植物。這些植物相關(guān)的共生細(xì)菌可制備成有基因轉(zhuǎn)移能力的,其通過獲得卸甲(disarmed)Ti質(zhì)粒和適宜的二元質(zhì)粒二者進(jìn)行。感興趣的核酸用于玉米基因組座位內(nèi)靶向插入的多核苷酸供體序列的長度范圍通常為約10至約5000個核苷酸。然而,可以使用顯著更長的核苷酸,長達(dá)20,000個核苷酸,包括長度約5,6,7,8,9,10,11和12Kb的序列。另外,供體序列可以包含含有與替換區(qū)不同源的序列的載體分子。在一個實施方案中,感興趣的核酸將包含一個或多個與被靶向的基因組座位享有同源性的區(qū)域。一般地,感興趣的核酸序列的同源區(qū)會與期望與之重組的基因組序列具有至少50%序列同一性。在某些實施方案中,感興趣的核酸的同源區(qū)與位于被靶向的基因組座位中的序列享有60%、70%、80%、90%、95%、98%、99%、或99.9%序列同一性。然而,任何1%與100%之間數(shù)值的序列同一性均可能存在,這取決于感興趣的核酸的長度。感興趣的核酸可以含有幾個不連續(xù)的與細(xì)胞染色質(zhì)享有相對高序列同一性的區(qū)域。例如,為了靶向插入通常不存在于被靶向的基因組座位中的序列,這些獨特的序列可以存在于供體核酸分子中,且其側(cè)翼有與被靶向的基因組座位中的序列享有相對高序列同一性的區(qū)域。也可以將感興趣的核酸分子插入被靶向的基因組座位中以充當(dāng)供以后使用的儲備庫。例如,可以在被靶向的基因組座位中插入第一核酸序列,其包含與玉米基因組的非基因區(qū)同源的序列,但包含感興趣的核酸(任選地編碼處于可誘導(dǎo)啟動子控制之下的ZFN)。接著,向細(xì)胞中引入第二核酸序列以誘導(dǎo)感興趣的DNA插入最優(yōu)非基因玉米基因組座位。所述第一核酸序列包含對所述最優(yōu)非基因玉米基因組座位特異性的ZFN,而所述第二核酸序列包含感興趣的DNA序列,或反之。在一個實施方案中,ZFN會切割所述最優(yōu)非基因玉米基因組座位和感興趣的核酸二者。所產(chǎn)生的基因組中的雙鏈斷裂接下來可以變?yōu)樽运鲎顑?yōu)基因組座位釋放的供體分子的整合位點?;蛘?,可以在導(dǎo)入感興趣的DNA之后誘導(dǎo)已經(jīng)位于基因組中的ZFN的表達(dá),以在基因組中誘導(dǎo)雙鏈斷裂,然后該斷裂可以成為導(dǎo)入的感興趣核酸的整合位點。這樣,感興趣的DNA在任何感興趣區(qū)域處的靶向整合效率可以大大提高,因為方法不依賴于編碼ZFN的核酸與感興趣的DNA兩者的同時攝取。也可以將感興趣的核酸插入最優(yōu)非基因玉米基因組座位中以充當(dāng)后續(xù)插入的靶位點。例如,可以將由含有其他ZFN設(shè)計的識別位點的DNA序列構(gòu)成的感興趣核酸插入該座位中。隨后,可以生成其他ZFN設(shè)計,并在細(xì)胞中表達(dá),使得原先的感興趣核酸被切割,并且通過修復(fù)或同源重組修飾。這樣,在最優(yōu)非基因玉米基因組座位處可以發(fā)生感興趣核酸的反復(fù)整合。例示性的外源序列包括但不限于任何多肽編碼序列(例如cDNA)、啟動子、增強(qiáng)子和其它調(diào)控序列(例如干擾RNA序列、shRNA表達(dá)盒、附加表位、標(biāo)志物基因、切割酶識別位點和各種類型的表達(dá)構(gòu)建體)。此類序列可以容易地使用標(biāo)準(zhǔn)分子生物學(xué)技術(shù)(克隆、合成等)獲得,和/或是商品化的。為了表達(dá)ZFN,通常將編碼融合蛋白的序列亞克隆入含有啟動子以指導(dǎo)轉(zhuǎn)錄的表達(dá)載體中。合適的原核和真菌啟動子是本領(lǐng)域中公知的,并且記載于例如Sambrook等,MolecularCloning,ALaboratoryManual(2nded.1989;3.sup.rded,2001);Kriegler,GeneTransferandExpression:ALaboratoryManual(1990);及CurrentProtocolsinMolecularBiology(Ausubel等,見上文。用于表達(dá)ZFN的細(xì)菌表達(dá)系統(tǒng)在例如大腸桿菌(E.coli)、芽孢桿菌屬物種(Bacillussp.)、和沙門氏菌屬(Salmonella)中可得到(Palva等,Gene22:229-235(1983))。用于此類表達(dá)系統(tǒng)的試劑盒是商品化的。用于哺乳動物細(xì)胞、酵母和昆蟲細(xì)胞的真核表達(dá)系統(tǒng)是本領(lǐng)域技術(shù)人員公知的,并且也是商品化的??紤]融合蛋白的意圖用途,例如在植物、動物、細(xì)菌、真菌、原生動物等中的表達(dá),來選擇用于將遺傳材料轉(zhuǎn)運到細(xì)胞中的特定表達(dá)載體(參見下文描述的表達(dá)載體)。標(biāo)準(zhǔn)的細(xì)菌和動物表達(dá)載體是本領(lǐng)域中已知的,并且詳細(xì)記載于例如美國專利公開文本20050064474A1和國際專利公開文本W(wǎng)005/084190、W005/014791和W003/080809中??梢允褂脴?biāo)準(zhǔn)轉(zhuǎn)染方法來生成表達(dá)大量蛋白質(zhì)的細(xì)菌、哺乳動物、酵母或昆蟲細(xì)胞系,然后可以使用標(biāo)準(zhǔn)技術(shù)(參見例如Colley等,J.Biol.Chem.264:17619-17622(1989);GuidetoProteinPurification,收錄于MethodsinEnzymology,vol.182(Deutscher,ed.,1990))純化所述蛋白質(zhì)。依照標(biāo)準(zhǔn)技術(shù)(參見例如Morrison,J.Bact.132:349-351(1977);Clark-Curtiss&Curtiss,MethodsinEnzymology101:347-362(Wu等編輯,1983)實施真核和原核細(xì)胞的轉(zhuǎn)化。公開的方法和組合物可以用于將多核苷酸供體序列插入預(yù)定的位置,例如最優(yōu)非基因玉米基因組座位之一。這是有用的,因為導(dǎo)入玉米基因組的轉(zhuǎn)基因的表達(dá)關(guān)鍵地取決于其整合位點。相應(yīng)地,可以通過靶向重組來插入編碼除草劑耐性、昆蟲抗性、營養(yǎng)物、抗生素或治療性分子的基因。在一個實施方案中,感興趣的核酸可以和基因編碼序列組合或“疊加”,其中所述基因編碼序列可提供針對草甘膦或其它除草劑的額外的耐受性或抗性,和/或提供對選定的昆蟲或疾病的抗性,和/或提供營養(yǎng)強(qiáng)化,和/或提供改良的農(nóng)藝特征,和/或可用于飼料、食物、工業(yè)、藥物或其它用途的蛋白質(zhì)或其它產(chǎn)物。植物基因組中兩個或多個感興趣的核酸序列的“疊加”可以通過例如下列手段來實現(xiàn):使用兩個或更多個事件的常規(guī)植物育種、用含有感興趣的序列的構(gòu)建體轉(zhuǎn)化植物、轉(zhuǎn)基因植物的再轉(zhuǎn)化、或通過借助同源重組的導(dǎo)向整合來添加新的性狀。這樣的感興趣的多核苷酸供體核苷酸序列包括,但不限于下面給出的那些實例:1.賦予害蟲或疾病抗性的基因或編碼序列(例如iRNA)(A)植物疾病抗性基因。植物防御經(jīng)常通過植物中疾病抗性基因(R)的產(chǎn)物與病原體中相應(yīng)的無毒性(Avr)基因的產(chǎn)物的特異相互作用而被激活??梢杂每寺〉目剐曰蜣D(zhuǎn)化植物品種,從而工程構(gòu)建對特定病原體株有抗性的植物。這些基因的實例包括:提供黃枝孢霉(Cladosporiumfulvum)抗性的番茄Cf-9基因(Jonesetal.,1994Science266:789);,提供丁香假單胞桿菌番茄致病變種抗性的番茄Pto基因,其編碼一種蛋白激酶(Martinetal.,1993Science262:1432),和提供丁香假單胞菌抗性的擬南芥RSSP2基因(Mindrinosetal.,1994Cell78:1089)。(B)蘇云金芽孢桿菌蛋白質(zhì)、其衍生物或以其為模本的人造多肽,例如Btδ-內(nèi)毒素基因的多核苷酸序列(Geiseretal.,1986Gene48:109)和植物殺蟲(VIP)基因(見,例如,Estruchetal.(1996)Proc.Natl.Acad.Sci.93:5389-94)。此外,編碼δ-內(nèi)毒素基因的DNA分子可以從美國典型培養(yǎng)物保藏中心(Rockville,Md.)購得,ATCC登錄號為40098,67136,31995和31998。(C)植物凝集素,例如,多種君子蘭(Cliviaminiata)甘露糖結(jié)合性植物凝集素基因的核苷酸序列(VanDammeetal.,1994PlantMolec.Biol.24:825)。(D)維生素結(jié)合蛋白質(zhì),例如親和素及親和素同源物,其可用作針對昆蟲類害蟲的殺幼蟲劑。見美國專利No.5,659,026。(E)酶抑制劑,例如蛋白酶抑制劑或淀粉酶抑制劑。這些基因的實例包括水稻半胱氨酸蛋白質(zhì)酶抑制劑(Abeetal.,1987J.Biol.Chem.262:16793),煙草蛋白酶抑制劑I(Huubetal.,1993PlantMolec.Biol.21:985),和α-淀粉酶抑制劑(Sumitanietal.,1993Biosci.Biotech.Biochem.57:1243)。(F)昆蟲特異性激素或信息素,例如蛻皮激素和保幼激素或其變體、基于它們的模擬物,或其拮抗劑或激動劑,例如桿狀病毒表達(dá)的克隆保幼激素酯酶,保幼激素的失活子(Hammocketal.,1990Nature344:458)。(G)昆蟲特異性肽或神經(jīng)肽,其在表達(dá)時會擾亂受影響的害蟲的生理機(jī)能(J.Biol.Chem.269:9)。這些基因的實例包括昆蟲利尿激素受體(Regan,1994),在太平洋折翅蠊(Diplopterapunctata)中鑒定的咽側(cè)體抑制素(allostatin)(Pratt,1989),和昆蟲特異性麻痹神經(jīng)毒素(美國專利No.5,266,361)。(H)在自然界中由蛇、馬蜂等產(chǎn)生的昆蟲特異性毒液,例如蝎子昆蟲毒性肽(Pang,1992Gene116:165)。(I)負(fù)責(zé)超富集單萜、倍半萜、甾體、異羥肟酸、苯丙烷衍生物或其它具有殺蟲活性的非蛋白質(zhì)分子的酶。(J)參與生物活性分子修飾(包括翻譯后修飾)的酶;例如糖酵解酶、蛋白質(zhì)水解酶、脂肪分解酶、核酸酶、環(huán)化酶、轉(zhuǎn)氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、彈性蛋白酶、幾丁質(zhì)酶和葡聚糖酶,無論是天然的還是人造的。這些基因的實例包括馬蹄蓮(callas)基因(PCT公開的申請WO93/02197),幾丁質(zhì)酶編碼序列(其可以從例如ATCC以登錄號3999637和67152獲得),煙草鉤蟲幾丁質(zhì)酶(Krameretal.,1993InsectMolec.Biol.23:691),和歐芹ubi4-2多聚泛素基因(Kawallecketal.,1993PlantMolec.Biol.21:673)。(K)刺激信號轉(zhuǎn)導(dǎo)的分子。這些分子的實例包括綠豆鈣調(diào)蛋白cDNA克隆的核苷酸序列(Botellaetal.,1994PlantMolec.Biol.24:757),和玉米鈣調(diào)蛋白cDNA克隆的核苷酸序列(Griessetal.,1994PlantPhysiol.104:1467)。(L)疏水矩肽(hydrophobicmomentpeptide)。見例如美國專利Nos.5,659,026和5,607,914,后者教導(dǎo)了賦予疾病抗性的人造抗微生物肽。(M)膜透性酶,通道形成劑或通道阻斷劑,例如殺菌肽-β裂解肽類似物(Jaynesetal.,1993PlantSci.89:43),其使轉(zhuǎn)基因煙草植物對青枯病有抗性。(N)病毒侵襲性蛋白質(zhì)或由其衍生的復(fù)雜毒素。例如,在經(jīng)轉(zhuǎn)化的植物細(xì)胞中,病毒衣殼蛋白的積累可賦予針對該衣殼蛋白所來源的病毒以及相關(guān)病毒所致的病毒感染和/或疾病發(fā)展的抗性。已經(jīng)給轉(zhuǎn)化植物賦予了衣殼蛋白介導(dǎo)的,針對苜蓿花葉病毒、黃瓜花葉病毒、煙草條紋病毒、馬鈴薯X病毒、馬鈴薯Y病毒、煙草蝕紋病毒、煙草脆裂病毒和煙草花葉病毒的抗性。參見,例如,Beachyetal.(1990)Ann.Rev.Phytopathol.28:451。(O)昆蟲特異性抗體或由其衍生的免疫毒素。因此,靶向昆蟲腸道關(guān)鍵代謝功能的抗體可以使受影響的酶失活,殺死昆蟲。例如,Taylor等人(1994),在第七屆國際分子植物-微生物相互作用研討會(SeventhInt′l.SymposiumonMolecularPlantMicrobeInteractions)上的第497號摘要顯示了轉(zhuǎn)基因煙草中通過產(chǎn)生單鏈抗體片段的酶失活。(P)病毒特異性抗體。見例如Tavladorakietal.(1993)Nature266:469,其顯示了表達(dá)重組抗體基因的轉(zhuǎn)基因植物被保護(hù)免于病毒攻擊。(Q)由病原體或寄生物自然產(chǎn)生的發(fā)育阻滯(developmental-arrestive)蛋白質(zhì)。因此,真菌內(nèi)切α-1,4-D多聚半乳糖醛酸酶通過溶解植物細(xì)胞壁的均聚-α-1,4-D-半乳糖醛酸而促進(jìn)真菌定殖和植物營養(yǎng)素釋放(Lambetal.,1992)Bio/Technology10:1436。Toubart等(1992PlantJ.2:367)描述了豆類內(nèi)切多聚半乳糖醛酸酶抑制蛋白的編碼基因的克隆和表征。(R)由植物自然產(chǎn)生的發(fā)育阻滯(developmental-arrestive)蛋白質(zhì),例如大麥核糖體失活基因,其提供了增加的針對真菌疾病的抗性(Longemannetal.,1992).Bio/Technology10:3305。(S)RNA干擾,其中用RNA分子抑制靶基因的表達(dá)。一個實施例中的RNA分子是部分或完全雙鏈的,其觸發(fā)沉默響應(yīng),導(dǎo)致dsRNA被切割成小的干擾RNA,它們隨后被納入到靶向復(fù)合體中,靶向復(fù)合體破壞同源的mRNA。見例如Fire等人,美國專利6,506,559;Graham等人,6,573,099。2.賦予除草劑抗性的基因(A)編碼針對抑制生長點或分生組織的除草劑,例如咪唑啉酮類(imidazalinone)、磺酰苯胺類(sulfonanilide)或磺酰脲類除草劑的抗性或耐受性的基因。這類基因的實例編碼一種突變的乙酰乳酸合酶(ALS)(Leeetal.,1988EMBOJ.7:1241),也稱乙酰羥酸合酶(AHAL)(Mikietal.,1990Theor.Appl.Genet.80:449)。(B)一種或多種額外的編碼針對草甘膦抗性或耐受性的基因,所述抗性或耐受性是由突變體EPSP合酶和aroA基因賦予的,或者是通過一些基因如DGT-28、2mEPSPS、GAT(草甘膦乙酰轉(zhuǎn)移酶)或GOX(草甘膦氧化酶)和其它膦?;衔?,如草胺膦(pat、bar、和dsm-2基因),和芳氧基苯氧基丙酸和環(huán)己二酮(ACC酶抑制劑編碼基因)所致的代謝失活而獲得的。見例如美國專利No.4,940,835,其公開了可賦予草甘膦抗性的EPSP形式的核苷酸序列。編碼突變體aroA基因的DNA分子能夠以ATCC登錄號39256獲得,突變體基因的核苷酸序列在美國專利No.4,769,061中公開。歐洲專利申請No.0333033和美國專利No.4,975,374公開了可賦予除草劑如L-草銨膦抗性的谷氨酰胺合酶基因的核苷酸序列。歐洲專利申請No.0242246提供了草銨膦乙酰轉(zhuǎn)移酶基因的核苷酸序列。DeGreefetal.(1989)Bio/Technology7:61中描述了表達(dá)編碼草銨膦乙酰轉(zhuǎn)移酶活性的嵌合bar基因的轉(zhuǎn)基因植物的產(chǎn)生。賦予針對芳氧基苯氧基丙酸和環(huán)己二酮如稀禾定和甲禾靈(haloxyfop)的抗性的示例性基因是Accl-S1,Accl-S2和Accl-S3基因,如Marshalletal.(1992)Theor.Appl.Genet.83:435所述。(C)編碼針對可抑制光合作用的除草劑例如三嗪(psbA和gs+基因)和芐腈(腈水解酶基因)的抗性的基因。Przibillaetal.(1991)PlantCell3:169描述了使用編碼突變體psbA基因的質(zhì)粒轉(zhuǎn)化衣藻。在美國專利No.4,810,648中公開了腈水解酶基因的核苷酸序列,含有這些基因的DNA分子可以通過ATCC登錄號53435、67441和67442獲得。Hayesetal.(1992)Biochem.J.285:173中描述了編碼谷胱甘肽S-轉(zhuǎn)移酶的DNA的克隆和表達(dá)。(D)編碼針對可結(jié)合羥基苯基丙酮酸二加氧酶(HPPD)的除草劑的抗性基因,HPPD是催化對-羥基苯基丙酮酸(HPP)轉(zhuǎn)化形成尿黑酸的反應(yīng)的酶。這包括例如異噁唑(EP418175,EP470856,EP487352,EP527036,EP560482,EP682659,美國專利No.5,424,276),特別是異噁唑草酮,其是玉米的選擇性除草劑,二酮腈(diketonitrile)(EP496630,EP496631),特別是2-氰基-3-環(huán)丙基-1-(2-SO2CH3-4-CF3苯基)丙烷-1,3-二酮和2-氰基-3-環(huán)丙基-1-(2-SO2CH3-4-2,3C12苯基)丙烷-1,3-二酮,三酮類(EP625505,EP625508,美國專利No.5,506,195),特別是磺草酮、和pyrazolinate等除草劑。在植物中產(chǎn)生過量HPPD的基因能夠提供針對這些除草劑的耐受性或抗性,包括例如美國專利Nos.6,268,549和6,245,968和美國專利申請公開No.20030066102中描述的基因。(E)編碼針對苯氧基生長素除草劑,如2,4-二氯苯氧基乙酸(2,4-D)的抗性或耐受性的基因,其也可以賦予針對芳氧基苯氧基丙酸類(AOPP)除草劑的抗性或耐受性。這些基因的實例包括α-酮戊二酸依賴性的雙加氧酶(aad-1)基因,如美國專利No.7,838,733所述。(F)編碼針對苯氧基生長素除草劑如2,4-二氯苯氧基乙酸(2,4-D)的抗性或耐受性的基因,其也可以賦予針對吡啶基氧基生長素除草劑,如氟草煙或綠草定的抗性或耐受性。這些基因的實例包括α-酮戊二酸依賴性的雙加氧酶(aad-12)基因,如WO2007/053482-A2所述。(G)編碼針對麥草畏的抗性或耐受性的基因(見例如美國專利公開No.20030135879)。(H)編碼針對抑制原卟啉原氧化酶(PPO)的除草劑的抗性或耐受性的基因(見美國專利No.5,767,373)。(I)提供針對可結(jié)合光系統(tǒng)II反應(yīng)中心(PSII)核心蛋白質(zhì)的三嗪除草劑(例如莠去津)和尿素衍生物(如敵草隆)除草劑的抗性或耐受性的基因。見Brussianetal.,(1989)EMBOJ.1989,8(4):1237-1245。3.可賦予或貢獻(xiàn)數(shù)量疊加性狀(ValueAddedTrait)的基因(A)修飾的脂肪酸代謝,例如通過用反義基因或硬脂酰-ACP去飽和酶轉(zhuǎn)化玉米或蕓苔屬植物從而增加植物的硬脂酸含量(Knultzonetal.,1992)Proc.Nat.Acad.Sci.USA89:2624。(B)降低的植酸含量(1)引入植酸酶編碼基因,如黑曲霉植酸酶基因(VanHartingsveldtetal.,1993Gene127:87),提高植酸降解,向被轉(zhuǎn)化植物添加更多游離磷酸鹽。(2)可引入降低植酸含量的基因。在玉米植物中,這可以通過,例如,克隆然后重新導(dǎo)入如下所述的單個等位基因的相關(guān)DNA來實現(xiàn):該單個等位基因?qū)е乱灾菜崴降蜑樘卣鞯挠衩淄蛔凅w的原因(Raboyetal.,1990Maydica35:383)。(C)改良的碳水化合物組成,例如通過用編碼改變淀粉的分支模式的酶的基因轉(zhuǎn)化植物而實現(xiàn)。這些酶的實例包括,粘液鏈球菌(Streptococcusmucus)果糖基轉(zhuǎn)移酶基因(Shirozaetal.,1988)J.Bacteriol.170:810,枯草芽孢桿菌果聚糖蔗糖酶基因(Steinmetzetal.,1985Mol.Gen.Genel.200:220),地衣芽孢桿菌α-淀粉酶(Penetal.,1992Bio/Technology10:292),番茄轉(zhuǎn)化酶基因(Elliotetal.,1993),大麥淀粉酶基因(Sogaardetal.,1993J.Biol.Chem.268:22480),和玉米胚乳淀粉分支酶II(Fisheretal.,1993PlantPhysiol.102:10450)。III.重組構(gòu)建體如本文中公開的,本公開提供了重組基因組序列,其包含至少1Kb的最優(yōu)非基因玉米基因組序列和感興趣的DNA,其中感興趣的插入DNA被插入到所述非基因序列中。在一個實施方案中,感興趣的DNA是分析域、賦予針對有害生物或疾病的抗性的基因或編碼序列(例如iRNA)、賦予對除草劑抗性的基因、或賦予或貢獻(xiàn)于增值性狀的基因,且所述最優(yōu)非基因玉米基因組序列包含下述特征中的1、2、3、4、5、6、7或8種:a.該非基因序列長度為約1Kb至約8.3Kb,且不含有甲基化多核苷酸;b.玉米基因組內(nèi),該非基因序列顯示0.00041至62.42cM/Mb的重組率;c.在玉米基因組內(nèi),該非基因序列顯示0至0.962的核小體占據(jù)水平;d.該非基因組序列與該玉米基因組內(nèi)的任何其他序列享有少于40%的序列同一性;e.該非基因序列的相對位置值為0.00373至0.99908的距玉米染色體著絲粒遺傳距離比;f.該非基因序列的鳥嘌呤/胞嘧啶百分比含量范圍為25.17至68.3%;g.該非基因序列位于基因序列附近,基因序列包含已知的或預(yù)測的玉米編碼序列,位于包含該天然非基因序列的40Kb的毗連基因組DNA內(nèi);和h.該非基因序列位于玉米基因組序列的1Mb區(qū)域中,該區(qū)域包含至少第二非基因序列。在一個實施方案中,所述最優(yōu)非基因玉米基因組序列的進(jìn)一步特征是具有這樣的基因區(qū),該基因區(qū)包含1-9個已知的或預(yù)測的玉米編碼序列,在包含該天然非基因序列的40Kb的毗連基因組DNA內(nèi)。在一個實施方案中,所述最優(yōu)非基因玉米座位選自類簇1,2,3,4,5,6,7,8,9,10,11,2,3,4,5,6,7,8,9,20,21,22,23,24,25,26,27,28,29,30,31或32的座位。IV.轉(zhuǎn)基因植物依照本公開的一個實施方案,還提供了包含重組的最優(yōu)非基因玉米座位的轉(zhuǎn)基因植物。此類轉(zhuǎn)基因植物可以使用本領(lǐng)域技術(shù)人員知曉的技術(shù)來制備。轉(zhuǎn)化的玉米細(xì)胞、愈傷組織、組織或植物可以通過選擇和篩選工程化植物材料中由存在于轉(zhuǎn)化DNA上的標(biāo)記基因編碼的性狀而進(jìn)行鑒定和分離。例如,選擇可以通過在含有抑制量的抗生素或除草劑(轉(zhuǎn)化基因構(gòu)建體賦予對其的抗性)的培養(yǎng)基中生長工程化的植物材料而進(jìn)行。進(jìn)一步地,轉(zhuǎn)化的細(xì)胞也可以通過篩選任何可見的標(biāo)記基因(例如黃色熒光蛋白、綠色熒光蛋白、紅色熒光蛋白、β-葡糖醛酸糖苷酶,螢光素酶,B或CI基因)的活性而鑒定,其中標(biāo)記基因可以出現(xiàn)在重組核酸構(gòu)建體上。這樣的選擇和篩選方法是本領(lǐng)域技術(shù)人員所公知的。物理和生化方法也可以用于鑒定含有插入的基因構(gòu)建體的植物或植物細(xì)胞轉(zhuǎn)化體。這些方法包括但不限于:1)Southern分析或PCR擴(kuò)增用于檢測和測定重組DNA插入的結(jié)構(gòu);2)Northern印跡,S1核糖核酸酶保護(hù)(SIRNaseprotection),引物延伸或逆轉(zhuǎn)錄PCR擴(kuò)增用于檢測或檢查基因構(gòu)建體的RNA轉(zhuǎn)錄本;3)檢測酶或核酶活性的酶學(xué)分析,其中這類基因產(chǎn)物由基因構(gòu)建體編碼;4)蛋白凝膠電泳,Western印跡技術(shù),免疫沉淀,或酶聯(lián)免疫測定(ELISA),其中基因構(gòu)建體產(chǎn)物是蛋白質(zhì)。其它的技術(shù),例如原位雜交、酶染色和免疫染色,也可以用于檢測特定植物器官或組織內(nèi)重組構(gòu)建體的存在或表達(dá)。用于實施所有這些測定的方法都是本領(lǐng)域技術(shù)人員所公知的。使用本文公開的方法進(jìn)行基因操作的效果可以通過例如對自感興趣組織分離的RNA(例如mRNA)的northern印跡觀察到。通常,如果mRNA出現(xiàn)或mRNA量增加,可以推定對應(yīng)的轉(zhuǎn)基因在進(jìn)行表達(dá)??梢允褂脺y量基因和/或編碼的多肽活性的其它方法。根據(jù)所使用的底物和檢測反應(yīng)產(chǎn)品或副產(chǎn)物的增加或降低的方法,可以使用不同類型的酶學(xué)測定。此外,表達(dá)的多肽的水平可以通過免疫化學(xué)檢測,即ELISA,RIA,EIA和其他本領(lǐng)域技術(shù)人員所知曉的基于抗體的檢測,例如電泳檢測方法(結(jié)合染色或western印跡)。作為一個非限制性例子,使用ELISA測定檢測AAD-1(芳基氧基鏈烷酸雙加氧酶,見WO2005/107437)和PAT(膦絲菌素-N-乙酰轉(zhuǎn)移酶(PAT))蛋白記載于美國專利公開號20090093366,通過引用將其全文納入本文。轉(zhuǎn)基因可以在植物某些組織或某些發(fā)育階段進(jìn)行選擇性的表達(dá),或者轉(zhuǎn)基因基本在所有的植物組織中表達(dá),基本伴隨其整個生命周期。但是,任何組合的表達(dá)模式也是可應(yīng)用的。本領(lǐng)域技術(shù)人員會認(rèn)識到,在外源多核苷酸供體序列穩(wěn)定摻入轉(zhuǎn)基因植物并被確認(rèn)有功能之后,它可以通過有性雜交導(dǎo)入其他植物中。多種育種技術(shù)中的任意種均可適用,取決于要雜交的物種。本發(fā)明公開還包括如上面所記載的轉(zhuǎn)基因植物的種子,其中種子具有所述轉(zhuǎn)基因或基因構(gòu)建體。本發(fā)明公開進(jìn)一步包括如上面所述的轉(zhuǎn)基因植物的后代、克隆、細(xì)胞系或細(xì)胞,其中所述的后代、克隆、細(xì)胞系或細(xì)胞具有插入到最優(yōu)基因組座位中的所述轉(zhuǎn)基因或基因構(gòu)建體。由上面任何一種轉(zhuǎn)化技術(shù)所制備的轉(zhuǎn)化植物細(xì)胞能培養(yǎng)并再生為具備轉(zhuǎn)化的基因型和由此所期望的表型的完整植物。這樣的再生技術(shù)依賴于對組織培養(yǎng)生長培養(yǎng)基中某些植物激素的操縱,典型地依賴于已與期望的核苷酸序列一起導(dǎo)入的生物殺滅劑和/或除草劑標(biāo)志物。從培養(yǎng)的原生質(zhì)體的植物再生記載于Evans等人,“ProtoplastsIsolationandCulture”于HandbookofPlantCellCulture,pp.124-176,MacmillianPublishingCompany,NewYork,1983;和Binding,RegenerationofPlants,PlantProtoplasts,pp.21-73,CRCPress,BocaRaton,1985中。再生還可以獲自植物愈傷組織、外植體、器官、花粉、胚,或其部分。這樣的再生技術(shù)常記載于Klee等人(1987)Ann.Rev.ofPlantPhys.38:467-486中。包含編碼多肽的轉(zhuǎn)基因植物或植物材料在某些實施方案中可顯示下述的一項或多項特征:在該植物的細(xì)胞中表達(dá)所述多肽;在該植物的細(xì)胞的質(zhì)體中表達(dá)該多肽的一部分;將該多肽從該植物的細(xì)胞的胞質(zhì)溶膠導(dǎo)入到該細(xì)胞的質(zhì)體中;該多肽在該植物的細(xì)胞中的質(zhì)體特異性表達(dá);和/或該多肽定位在該植物的細(xì)胞中。這樣的植物除了表達(dá)該被編碼的多肽之外可還具有一種或多種期望的性狀。這樣的性狀可包括,例如:對昆蟲、其他有害生物、或致病介質(zhì)的抗性;對除草劑的耐性;強(qiáng)化的穩(wěn)定性、產(chǎn)率或貨架期;環(huán)境耐受性;藥物生產(chǎn);工業(yè)產(chǎn)物生產(chǎn);以及營養(yǎng)強(qiáng)化。依照一個實施方案,提供轉(zhuǎn)基因玉米原生質(zhì)體細(xì)胞,其包含重組最優(yōu)非基因玉米座位。更具體地,提供玉米原生質(zhì)體植物細(xì)胞,其包含插入到該玉米原生質(zhì)體細(xì)胞的最優(yōu)非基因玉米基因組座位中的感興趣的DNA,其中所述非基因玉米基因組座位的長度為約1Kb到約8.3Kb,且缺少任何甲基化核苷酸。在一個實施方案中,所述轉(zhuǎn)基因玉米原生質(zhì)體細(xì)胞包含插入到最優(yōu)非基因玉米基因組座位中的感興趣的DNA,其中該感興趣的DNA包含分析域和/或開放閱讀框。在一個實施方案中,插入的感興趣的DNA編碼肽,在一個進(jìn)一步的實施方案中,感興趣的DNA包含至少一個包含轉(zhuǎn)基因的基因表達(dá)盒。依照一個實施方案,提供了轉(zhuǎn)基因玉米植物、玉米植物部分或玉米植物細(xì)胞,其包含重組最優(yōu)非基因玉米座位。更具體地,提供了玉米植物、玉米植物部分或玉米植物細(xì)胞,其包含插入到該玉米植物、玉米植物部分或玉米植物細(xì)胞的最優(yōu)非基因玉米基因組座位中的感興趣的DNA,其中所述非基因玉米基因組座位的長度為約1Kb到約8.5Kb,且缺少任何甲基化核苷酸。在一個實施方案中,所述轉(zhuǎn)基因玉米植物、玉米植物部分或玉米植物細(xì)胞包含插入到所述最優(yōu)非基因玉米基因組座位中的感興趣的DNA,其中該感興趣的DNA包含分析域和/或開放閱讀框。在一個實施方案中,插入的感興趣的DNA編碼肽,且在一個進(jìn)一步的實施方案中,感興趣的DNA包含至少一個包含轉(zhuǎn)基因的基因表達(dá)盒。依照實施方案1,提供了一種重組序列,其中所述重組序列包含:與選自loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053),loci_136086_G1(SEQIDNO:4425),loci_203704_G1(SEQIDNO:2033),loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_291068_G1(SEQIDNO:3230),loci_232222_G1(SEQIDNO:3357),loci_43577_G1(SEQIDNO:3428),loci_204726_G1(SEQIDNO:424),loci_232228_G1(SEQIDNO:4529)的非基因序列有至少90%、95%或99%序列同一性的至少1Kb的核酸序列,以及感興趣的DNA,其中感興趣的DNA插入在所述非基因序列中以產(chǎn)生所述重組序列。依照實施方案2,提供了實施方案1的重組序列,其中所述感興趣的DNA插入在對該非基因序列特異的鋅指靶位點、更具體地說表8的鋅指靶位點的鄰近處。依照實施方案3,提供了實施方案1的重組序列,其中還所述感興趣的DNA插入在成對的對所述非基因序列特異的鋅指靶位點之間,更具體地說是成對的來自表8的鋅指靶位點之間。依照一個實施方案,提供了一種重組序列,其中所述重組序列由這樣的核酸序列組成:至少1Kb,且與存在于選自loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053),loci_136086_G1(SEQIDNO:4425),loci_203704_G1(SEQIDNO:2033),loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_291068_G1(SEQIDNO:3230),loci_232222_G1(SEQIDNO:3357),loci_43577_G1(SEQIDNO:3428),loci_204726_G1(SEQIDNO:424),loci_232228_G1(SEQIDNO:4529)的非基因序列中的序列有100%同一性,以及感興趣的DNA,其中該感興趣的DNA插入在所述非基因序列中以產(chǎn)生所述的重組序列。依照實施方案4,提供了實施方案1、2或3中任一項的重組序列,其中所述感興趣的DNA包含分析域。依照實施方案5,提供了實施方案1、2或3中任一項的重組序列,其中所述感興趣的DNA不編碼肽。依照實施方案6,提供了實施方案1、2或3中任一項的重組序列,其中所述感興趣的DNA編碼肽。依照實施方案7,提供了實施方案6的重組序列,其中所述感興趣的DNA包含基因表達(dá)盒,所述基因表達(dá)盒包含殺蟲劑抗性基因、除草劑耐性基因、氮利用效率基因、水分利用效率基因、營養(yǎng)品質(zhì)基因、DNA結(jié)合基因、或選擇標(biāo)志物基因。依照實施方案8,提供實施方案1-7中任一項的重組序列,其中所述感興趣的DNA包含兩個或多個基因表達(dá)盒。依照實施方案9,提供實施方案8的重組序列,其中兩個或更多個所述的非基因序列各自包含感興趣的DNA,以產(chǎn)生兩個或更多個重組序列,其中該兩個或更多個重組序列位于相同的染色體上。依照實施方案10,提供實施方案1-7中任一項的重組序列,其中所述感興趣的DNA和/或所述非基因序列在所述感興趣的DNA插入所述非基因序列的過程中被修飾。依照實施方案11,提供玉米植物、玉米植物部分或玉米植物細(xì)胞,其包含實施方案1-10中任一項的重組序列。依照實施方案12,提供一種制造包含感興趣的DNA的轉(zhuǎn)基因植物細(xì)胞的方法,其中所述方法包括從loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053),loci_136086_G1(SEQIDNO:4425),loci_203704_G1(SEQIDNO:2033),loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_291068_G1(SEQIDNO:3230),loci_232222_G1(SEQIDNO:3357),loci_43577_G1(SEQIDNO:3428),loci_204726_G1(SEQIDNO:424),loci_232228_G1(SEQIDNO:4529)中選擇具有至少90%、95%或99%序列同一性的靶非基因玉米基因組座位,選擇特異性結(jié)合并切割所述靶非基因玉米基因組座位的位點特異性核酸酶,任選地,自表8選出的位點特異性核酸酶,將所述位點特異性核酸酶導(dǎo)入玉米植物細(xì)胞,將該感興趣的DNA插入所述靶非基因玉米基因組座位中,并選擇包含被靶向到所述非基因座位的感興趣的DNA的轉(zhuǎn)基因植物細(xì)胞。依照實施方案18,實施方案12的制造轉(zhuǎn)基因植物細(xì)胞的方法,其中所述位點特異性核酸酶選自下組:鋅指核酸酶、CRISPR核酸酶、TALEN、歸巢內(nèi)切核酸酶、或大范圍核酸酶。依照實施方案19,實施方案12或18的制造轉(zhuǎn)基因植物細(xì)胞的方法,其中所述感興趣的DNA通過同源性指導(dǎo)的修復(fù)重組法整合在所述非基因座位內(nèi)。依照實施方案20,實施方案12或18的制造轉(zhuǎn)基因植物細(xì)胞的方法,其中所述感興趣的DNA通過非同源末端連接整合法整合在所述非基因座位內(nèi)。依照實施方案21,實施方案12、18、19或20的制造轉(zhuǎn)基因植物細(xì)胞的方法,其中兩個或更多個所述的感興趣的DNA插入在兩個或更多個所述的靶非基因玉米基因組座位內(nèi),任選地,其中兩個或多個所述的靶非基因玉米基因組座位位于相同的染色體上。依照實施方案1,提供至少1Kb的純化的非基因玉米序列,其與選自下組的非基因序列具有至少90%、95%、或99%序列同一性:loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053),loci_136086_G1(SEQIDNO:4425),loci_203704_G1(SEQIDNO:2033),loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_291068_G1(SEQIDNO:3230),loci_232222_G1(SEQIDNO:3357),loci_43577_G1(SEQIDNO:3428),loci_204726_G1(SEQIDNO:424),loci_232228_G1(SEQIDNO:4529)。依照一個實施方案,提供純化的非基因玉米序列,其中所述序列由至少1Kb的核酸序列組成,所述核酸序列與存在于選自下組的非基因序列中的序列具有100%百分比同一性:loci_137693_G1(SEQIDNO:387),loci_265551_G1(SEQIDNO:463),loci_128078_G1(SEQIDNO:560),loci_168286_G1(SEQIDNO:573),loci_3733_G1(SEQIDNO:1268),loci_203075_G1(SEQIDNO:2030),loci_232484_G1(SEQIDNO:2053),loci_136086_G1(SEQIDNO:4425),loci_203704_G1(SEQIDNO:2033),loci_127268_G1(SEQIDNO:2709),loci_204637_G1(SEQIDNO:2731),loci_291068_G1(SEQIDNO:3230),loci_232222_G1(SEQIDNO:3357),loci_43577_G1(SEQIDNO:3428),loci_204726_G1(SEQIDNO:424),loci_232228_G1(SEQIDNO:4529)。實施例實施例1:玉米中可靶向的座位座位的鑒定利用生物信息學(xué)手段篩選玉米基因組,使用特定的標(biāo)準(zhǔn)來選擇用于多核苷酸供體靶向的最優(yōu)基因組座位。用于選擇基因組座位的特定標(biāo)準(zhǔn)是應(yīng)用下述各項開發(fā)的:為了轉(zhuǎn)基因在植物基因組內(nèi)的最優(yōu)表達(dá)的考慮因素、為了位點特異性DNA結(jié)合蛋白與基因組DNA最優(yōu)結(jié)合的考慮因素、以及轉(zhuǎn)基因植物產(chǎn)物開發(fā)要求。為了鑒定和選擇基因組座位,使用生物信息學(xué)手段掃描玉米基因組的基因組數(shù)據(jù)集和表基因組數(shù)據(jù)集,基因組的基因組數(shù)據(jù)集和表基因組數(shù)據(jù)集的掃描結(jié)果得到了符合下述標(biāo)準(zhǔn)的選定座位:1)低甲基化且長度大于1Kb;2)可通過多核苷酸供體的位點特異性核酸酶介導(dǎo)整合而靶向;3)農(nóng)藝學(xué)上中性或非基因性;4)整合的轉(zhuǎn)基因可以從其表達(dá)的區(qū)域;和5)在座位內(nèi)/周圍有重組的區(qū)域。相應(yīng)地,使用這些特定的標(biāo)準(zhǔn)鑒定了共7018個基因組座位(SEQIDNO:1-SEQIDNO:5,286)。這些特定標(biāo)準(zhǔn)在下文中進(jìn)一步詳細(xì)描述。低甲基化掃描玉米基因組以選擇大于1Kb的DNA低甲基化的最優(yōu)基因組座位。利用IlluminaTM/SolexaTM1G平行測序數(shù)據(jù),通過生物信息學(xué)方法全面調(diào)查從玉米栽培種B73分離的芽和根組織的基因組范圍DNA甲基化水平。根據(jù)Wangetal.,(2009)Genome-WideandOrgan-SpecificLandscapesofEpigeneticModificationsandTheirRelationshipstomRNAandSmallRNATranscriptomesinMaize.PlantCell21(4):1053-1069)中詳述的規(guī)程,從分離自上述的玉米植物組織的基因組DNA產(chǎn)生數(shù)據(jù)。這些數(shù)據(jù)可以在NCBIGenbank,AccessionNo;GEO:GSE15286訪問。利用如KruegerF,AndrewsSR(2011)Bismark:aflexiblealignerandmethylationcallerforBisulfite-Seqapplications.(Bioinformatics27:1571-1572)中描述的BismarkTM定位軟件將原始測序讀段收集并定位到玉米栽培種B73參照基因組?;蚪M中每個胞嘧啶的甲基化水平作為定位到特定胞嘧啶堿基位置的甲基化讀段的數(shù)目占定位到該位置的讀段的總數(shù)的百分比來計算。下面的假設(shè)情況解釋了如何計算玉米基因組內(nèi)的每個堿基的甲基化水平。例如,設(shè)想在玉米栽培種B73參照序列的染色體1中第100位上有一個胞嘧啶堿基。如果總共有20個讀段定位到第100位的胞嘧啶堿基,且這些讀段中10個是甲基化的,則估計染色體1中第100位的胞嘧啶堿基的甲基化水平為50%。相應(yīng)地,計算了獲自玉米的根和芽組織的所有基因組DNA堿基對的甲基化概貌。無法正確定位到玉米基因組中的獨特位置的讀段與玉米基因組中廣泛分布的重復(fù)序列相符,已知這些讀段大多是甲基化的。使用上述的規(guī)程,測量了玉米栽培種B73基因組的甲基化水平。如此,玉米基因組中含有甲基化讀段的區(qū)域表明玉米基因組的這些區(qū)域是甲基化的。反過來,玉米基因組的沒有甲基化讀段的區(qū)域表明玉米基因組的這些區(qū)域是非甲基化的。來自芽和根組織的玉米基因組中的非甲基化、且不含有任何甲基化讀段的區(qū)域視為“低甲基化”區(qū)域。為了讓根和芽甲基化概貌能夠用于可視化,對每個玉米栽培種B73染色體生成了擺動作圖(wiggleplots)(http://useast.ensembl.org/info/website/upload/wig.html)。圖1中顯示了從玉米栽培種B73染色體1號染色體獲得的根和芽組織的DNA甲基化概貌的擺動作圖。將如上所述建立的玉米栽培種B73根和芽組織的甲基化概貌合并成為共有(consensus)甲基化概貌,用來鑒定玉米栽培種B73基因組中的低甲基化區(qū)。對所得的玉米基因組共有甲基化概貌進(jìn)行掃描以鑒定沒有甲基化證據(jù),即不含有被定位的甲基化讀段的基因組位置。鑒定了長度大于100bp的低甲基化的基因組DNA節(jié)段。通過確定兩個顯示甲基化證據(jù)的基因組區(qū)域之間的總堿基對數(shù)來計算這些低甲基化區(qū)的具體長度。表1總結(jié)了鑒定出的低甲基化區(qū)。此外,圖2中顯示了玉米栽培種B37基因組的低甲基化區(qū)的長度的分布情況。表1.玉米栽培種B73基因組的低甲基化概貌對玉米栽培種B73基因組的這些低甲基化區(qū)域進(jìn)一步表征以鑒定并選擇特定的基因組座位,因為這些區(qū)域的無甲基化的環(huán)境提示開放的染色質(zhì)的存在。如此,所有后續(xù)的分析均對鑒定出的低甲基化區(qū)域進(jìn)行??砂邢蛐?targetability)進(jìn)一步分析在玉米栽培種B73中鑒定出的低甲基化位點,以確定哪些位點可通過位點特異性核酸酶介導(dǎo)的多核苷酸供體重組來靶向。本領(lǐng)域知曉玉米基因組含有大段的甲基化的高度重復(fù)DNA,且具有高水平的序列重復(fù)。從玉米基因組數(shù)據(jù)庫(來源:http://www.maizegdb.org/,以及Lawrence,CJetal(2008)MaizeGDB:TheMaizeModelOrganismDatabaseforBasic,Translational,andAppliedResearch.IntJPlantGenomics.2008:496957)收集玉米基因組中已知的重復(fù)區(qū)域的注釋信息。相應(yīng)地,對上文鑒定的低甲基化位點進(jìn)行篩選,以去除任何與玉米基因組上已注釋的已知重復(fù)區(qū)域?qū)R的位點。接下來利用基于BLASTTM的玉米基因組數(shù)據(jù)庫同源性檢索對通過此初篩后剩余的低甲基化位點進(jìn)行掃描,檢索使用NCBIBLASTTM+軟件(2.2.23版本)以默認(rèn)的參數(shù)設(shè)定來運行(StephenF.Altschuletal(1997)GappedBLASTandPSI-BLAST:anewgenerationofproteindatabasesearchprograms.NucleicAcidsRes.25:3389-3402)。該BLASTTM篩選的結(jié)果是,任何在基因組中別處有顯著匹配,序列比對覆蓋率超過40%的低甲基化位點均被從進(jìn)一步研究除去。農(nóng)藝學(xué)中性或非基因性進(jìn)一步分析玉米栽培種B73中鑒定出的低甲基化位點以確定哪些位點是農(nóng)藝學(xué)中性或非基因性的。如此,對上文描述的低甲基化位點進(jìn)行了篩選,以去除與任何已知的或預(yù)測的玉米栽培種B73編碼序列重疊、或含有任何已知的或預(yù)測的玉米栽培種B73編碼序列的任何位點。為此目的,從“玉米基因組數(shù)據(jù)庫”(來源:www.maizegdb.org以及Monaco,M.,etal.,MaizeMetabolicNetworkConstructionandTranscriptomeAnalysis.doi:10.3835/plantgenome2012.09.0025;2013年1月23日在線公布)收集已知基因的注釋數(shù)據(jù)和表達(dá)序列標(biāo)簽(EST)數(shù)據(jù)的定位信息。任何在某一開放閱讀框的直接2Kb上游和1Kb下游的基因組區(qū)域也加以考慮。這些上游和下游區(qū)域可能含有已知的或未知的對基因功能必不可少的保守調(diào)控元件。對前面已描述的低甲基化位點分析已知基因(包括2Kb上游和1Kb下游區(qū)域)和EST的存在。將任何與已知基因(包括2Kb上游和1Kb下游區(qū)域)或EST對齊或重疊的低甲基化位點從下游分析中去除。表達(dá)進(jìn)一步分析玉米栽培種B73中鑒定出的低甲基化位點以確定哪些位點處于表達(dá)的玉米基因的鄰近。通過對利用RNAseqTM技術(shù)從玉米栽培種B73根和芽組織產(chǎn)生的轉(zhuǎn)錄組概貌數(shù)據(jù)加以分析來測量玉米基因的轉(zhuǎn)錄物表達(dá)水平,RNAseqTM技術(shù)如Wangetal.,(2009)Genome-WideandOrgan-SpecificLandscapesofEpigeneticModificationsandTheirRelationshipstomRNAandSmallRNATranscriptomesinMaize.PlantCell.21(4):1053-1069所述。對于每個低甲基化位點完成了分析,鑒定出在該低甲基化位點鄰近40Kb區(qū)域內(nèi)的任何已注釋的基因,并鑒定位于該低甲基化位點鄰近的已注釋基因的平均表達(dá)水平。將與具有非零平均表達(dá)水平的已注釋基因相距大于40Kb的低甲基化位點確定為不與表達(dá)的玉米基因鄰近,將這些位點從進(jìn)一步的分析移除。重組進(jìn)一步分析玉米栽培種B73中鑒定出的低甲基化位點以確定哪些位點具有重組的證據(jù),并能夠幫助最優(yōu)基因組座位通過常規(guī)育種向其他玉米品系中的滲入。在常規(guī)育種中為了開發(fā)含有具備農(nóng)藝學(xué)意義的性狀的、新的改良玉米品系,經(jīng)常將多種多樣的玉米基因型雜交。因此,通過植物介導(dǎo)的轉(zhuǎn)基因轉(zhuǎn)化而滲入到玉米品系中最優(yōu)基因組座位內(nèi)的農(nóng)藝學(xué)性狀應(yīng)當(dāng)能夠通過常規(guī)植物育種中的減數(shù)分裂重組而進(jìn)一步滲入到其他玉米品系,尤其是優(yōu)良品系中。對上述的低甲基化位點進(jìn)行了篩選,以鑒定并選擇具備一定水平的減數(shù)分裂重組的位點。鑒定并去除被表征為重組“冷點”(cold-spots)的染色體區(qū)域內(nèi)存在的任何低甲基化位點。在玉米中,這些冷點使用從多重定位群體(JafarMammadov,WeiChen,AnastasiaChueva,KarthikMuthuraman,RuihuaRen,DavidMeyer,andSivaKumpatla.2011.DistributionofRecombinantFrequenciesacrosstheMaizeGenome.52ndAnnualMaizeGeneticsConference))產(chǎn)生的高分辨率標(biāo)記物數(shù)據(jù)集來定義?;跇?biāo)記物之間的遺傳距離(以厘摩(cM)計)與標(biāo)記物之間的物理距離(以兆堿基數(shù)(Mb)計)的比計算了整個染色體上任何成對的玉米基因組標(biāo)記物之間的減數(shù)分裂重組頻率。例如,如果一對標(biāo)記物之間的遺傳距離是1cM,且同一對標(biāo)記物之間的物理距離是2Mb,則計算的重組頻率確定為0.5cM/Mb。對于上面鑒定的每個低甲基化位點,選擇一對分開至少1Mb的標(biāo)記物,計算重組頻率。利用這種方法的調(diào)用來計算低甲基化位點的重組頻率。鑒定任何重組頻率0.00041cM/Mb的低甲基化位點,并將其從進(jìn)一步的分析去除。選擇剩下的包含大于0.00041cM/Mb重組頻率的低甲基化區(qū)域用于進(jìn)一步分析。最優(yōu)基因組座位的鑒定應(yīng)用上文所述的選擇標(biāo)準(zhǔn)的結(jié)果,從玉米基因組鑒定了總共52,885個最優(yōu)基因組座位。表2總結(jié)了鑒定的最優(yōu)基因組座位的長度。這些最優(yōu)基因組座位具有下述特征:1)長度大于1Kb的低甲基化基因組座位;2)可通過多核苷酸供體的位點特異性核酸酶介導(dǎo)整合而靶向的基因組座位;3)農(nóng)藝學(xué)上中性或非基因性的基因組座位;4)可以從其表達(dá)轉(zhuǎn)基因的基因組座位;和5)該基因組座位內(nèi)重組的證據(jù)。在表2中描述的所有最優(yōu)基因組座位中,只有長度大于1Kb的最優(yōu)基因組座位得到進(jìn)一步分析并用于供體多核苷酸序列的靶向。這些最優(yōu)基因組座位的序列作為SEQIDNO:1-SEQIDNO:5,286公開??偟膩碚f,這些最優(yōu)基因組座位是玉米基因組內(nèi)能夠用供體多核苷酸序列靶向的位置,如本文下面要進(jìn)一步展示的。表2列出了在玉米基因組中鑒定的低甲基化、顯示重組的證據(jù)、可靶向、農(nóng)藝學(xué)中性或非基因性、且位于表達(dá)的內(nèi)源基因附近的最優(yōu)基因組座位的大小范圍。大于100Bp的最優(yōu)基因組座位數(shù)52,885大于1Kb的最優(yōu)基因組座位數(shù)5,286大于2Kb的最優(yōu)基因組座位數(shù)770大于4Kb的最優(yōu)基因組座位數(shù)16實施例2:用于聚類來自玉米的最優(yōu)基因組座位的F-分布和主成分分析對5,286個鑒定的最優(yōu)基因組座位(SEQIDNO:1-SEQIDNO:5,286)使用F-分布和主成分分析統(tǒng)計學(xué)方法進(jìn)一步加以分析,以定義用于將這些最優(yōu)基因組座位分組的代表性群體和類簇。F-分布分析使用連續(xù)概率分布統(tǒng)計學(xué)分析來對鑒定出的5,286個最優(yōu)基因組座位進(jìn)行統(tǒng)計學(xué)分析。作為連續(xù)概率分布統(tǒng)計學(xué)分析的一個實施方案,完成了F-分布檢驗來確定最優(yōu)基因組座位的代表性數(shù)目。F-分布檢驗分析使用本領(lǐng)域技術(shù)人員知曉的等式和方法來完成。關(guān)于更多的指導(dǎo),K.MRemund,D.Dixon,DL.WrightandLR.Holden.Statisticalconsiderationsinseedpuritytestingfortransgenictraits.SeedScienceResearch(2001)11,101-119(通過提述將其并入本文)中描述的F-分布檢驗分析是F-分布檢驗的一個非限定性實例。F-分布檢驗假定對最優(yōu)基因組座位的隨機(jī)取樣,使得任何無效的座位在全部5,286個最優(yōu)基因組座位中均勻分布,且使得被取樣的最優(yōu)基因組座位數(shù)目是5,286個最優(yōu)基因組座位群體總數(shù)的10%或更少。F-分布分析表明5,286個最優(yōu)基因組座位中的72個可提供該5,286個最優(yōu)基因組座位的代表性數(shù)目,置信水平為95%。相應(yīng)地,該F-分布分析顯示,如果測試72個最優(yōu)基因組座位且它們?nèi)靠捎霉w多核苷酸序列靶定,那么這些結(jié)果可說明該5,286個最優(yōu)基因組座位中的96%或更多在95%置信水平上是陽性的。對5,286個最優(yōu)基因組座位驗證有效的總百分比的最佳估計是:如果72個受檢驗的最優(yōu)基因組座位100%是可靶向的。相應(yīng)地,96%真正是95%置信水平下驗證有效的真實百分比的下邊界。該下邊界對95%置信水平而言是基于F-分布的0.95百分位(RemundK,DixonD,WrightD,andHoldenL.Statisticalconsiderationsinseedpuritytestingfortransgenictraits.SeedScienceResearch(2001)11,101-119)。主成分分析接下來,完成了主成分分析(PCA)統(tǒng)計學(xué)方法,以進(jìn)一步評估并可視化包含5,286個鑒定出的最優(yōu)基因組座位的數(shù)據(jù)集的相似性和差異,以使得對多樣性的座位取樣用于靶向驗證成為可能。PCA涉及一種數(shù)學(xué)算法,其將大數(shù)目的相關(guān)變量轉(zhuǎn)換為較小數(shù)目的不相關(guān)變量,后者稱為主成分。如下所述對5,286個鑒定出的最優(yōu)基因組座位完成PCA:產(chǎn)生一組能夠用來描述該5,286個鑒定出的最優(yōu)基因組座位的可計算的特征或者屬性。每種特征都是可以數(shù)值計算的,并且專門加以定義以捕捉該5,286個鑒定出的最優(yōu)基因組座位的基因組及表基因組環(huán)境。為每個玉米最優(yōu)基因組座位鑒定了一組10個特征,它們在下文中更詳細(xì)地描述。1.最優(yōu)基因組座位的長度a.該數(shù)據(jù)集中最優(yōu)基因組座位的長度范圍從最小1,000Bp到最大8,267Bp。2.最優(yōu)基因組座位周圍1MB區(qū)域中的重組頻率a.在玉米中,染色體位置的重組頻率用從多重定位群體生成的內(nèi)部高分辨率標(biāo)記組數(shù)據(jù)集來定義(JafarMammadov,WeiChen,AnastasiaChueva,KarthikMuthuraman,RuihuaRen,DavidMeyer,andSivaKumpatla.2011.DistributionofRecombinantFrequenciesacrosstheMaizeGenome.52ndAnnualMaizeGeneticsConference)。b.整個染色體上任何成對標(biāo)記物的重組頻率基于標(biāo)記物之間的遺傳距離(以厘摩(cM)計)與標(biāo)記物之間的物理距離(以Mb計)之比來計算。例如,如果一對標(biāo)記物的遺傳距離是1cM,且同一對標(biāo)記物之間的物理距離是2Mb,則計算得到的遺傳頻率是0.5cM/Mb。對于每個最優(yōu)基因組座位,選擇分開至少1Mb的一對標(biāo)記物,并以該方式計算重組頻率。這些重組值的范圍從最小0.00041cM/Mb到最大62.42cM/Mb不等。3.最優(yōu)基因組座位序列獨特性的水平a.對于每個最優(yōu)基因組座位,利用基于BLASTTM的同源性檢索將該最優(yōu)基因組座位的核苷酸序列對玉米栽培種B73基因組進(jìn)行掃描,檢索使用NCBIBLASTTM+軟件(2.2.23版本)以默認(rèn)的參數(shù)設(shè)定來運行(StephenF.Altschuletal(1997),″GappedBLASTandPSI-BLAST:anewgenerationofproteindatabasesearchprograms″,NucleicAcidsRes.25:3389-3402)。因為這些最優(yōu)基因組座位序列是從玉米栽培種B73基因組鑒定出來的,故通過該檢索鑒定出來的第一個BLASTTM命中代表玉米栽培種B73序列本身。鑒定出每個最優(yōu)基因組座位的第二個BLASTTM命中,并使用該命中的對齊覆蓋度(用該最優(yōu)基因組座位被該BLASTTM命中所覆蓋的百分比表示)作為該最優(yōu)基因組座位在玉米基因組中獨特性的量度。第二個BLASTTM的這些對齊覆蓋度值的范圍是從最小0%到最大39.98%序列同一性。任何以更高的序列同一性水平對齊的序列均不予考慮。4.最優(yōu)基因組座位到其附近的最接近基因的距離a.從玉米基因組數(shù)據(jù)庫(來源www.maizegdb.org,以及Monaco,M.,etal.,MaizeMetabolicNetworkConstructionandTranscriptomeAnalysis.doi:10.3835/plantgenome2012.09.0025;2013年1月23日在線公布)提取基因注釋信息和玉米基因組中已知基因的位置。對于每個最優(yōu)基因組座位,鑒定最接近的已注釋基因,其中上游和下游位置均考慮在內(nèi),并測量最優(yōu)基因組座位序列與該基因之間的距離(以Bp計)。例如,如果最優(yōu)基因組座位位于染色體1上從第500位到1500位,且與該最優(yōu)基因組座位最接近的基因位于染色體1上從第2000位到第3000位,則從最優(yōu)基因組座位到該最接近基因的距離算得為500Bp。對于所有5,286個最優(yōu)基因組座位數(shù)據(jù)集,這些值的范圍從最小1001Bp到最大34,809Bp。5.最優(yōu)基因組座位中的GC%a.對于每個最優(yōu)基因組座位,分析核苷酸序列以估計存在的鳥嘌呤和胞嘧啶堿基數(shù)。該計數(shù)表示為占每個最優(yōu)基因組座位的序列長度的百分比,且提供了GC%的一個量度。玉米最優(yōu)基因組座位數(shù)據(jù)集的這些GC%值的范圍是25.17%至68.3%。6.最優(yōu)基因組座位序列周圍40Kb附近區(qū)域中的基因數(shù)a.從玉米基因組數(shù)據(jù)庫提取基因注釋信息和已知基因在玉米栽培種B73基因組中的位置。對于5,286個最優(yōu)基因組座位中的每一個,定義最優(yōu)基因組座位序列周圍的一個40Kb窗口,計算具有與該窗口重疊的位置的已注釋基因的數(shù)目。這些值的范圍從在40Kb附近區(qū)域中最少1個基因到最多9個基因。7.最優(yōu)基因組座位周圍40Kb附近區(qū)域的平均基因表達(dá)a.使用RNAseqTM技術(shù),通過分析從玉米栽培種B73根和芽組織產(chǎn)生的轉(zhuǎn)錄組概貌數(shù)據(jù)來測量玉米基因的轉(zhuǎn)錄物表達(dá)水平(Mortazavi,A.etal.,MappingandquantifyingmammaliantranscriptomesbyRNA-Seq.Nat.Methods.5,621-628(2008);Wangetal.,Genome-WideandOrgan-SpecificLandscapesofEpigeneticModificationsandTheirRelationshipstomRNAandSmallRNATranscriptomesinMaize.PlantCell.2009April;21(4):1053-1069)。從玉米座位數(shù)據(jù)庫提取基因注釋信息和已知基因在玉米栽培種B73基因組中的位置。對于每個最優(yōu)基因組座位,鑒定在玉米栽培種B73基因組中該最優(yōu)基因組座位周圍40Kb附近區(qū)域中存在的已注釋基因。從前面的引文中描述的轉(zhuǎn)錄組概貌中提取這些基因中每一個的表達(dá)水平,并計算平均基因表達(dá)水平。所有基因在玉米的基因組中的表達(dá)值變化巨大。最小表達(dá)值為0,最大表達(dá)值為2511.397,平均表達(dá)值為18.489,中位表達(dá)值為3.604。對于全部5,286個最優(yōu)基因組座位數(shù)據(jù)集,平均表達(dá)值的范圍從最小0.00369到最大2233.06。8.最優(yōu)基因組座位周圍的核小體占據(jù)水平a.對特定核苷酸序列的核小體占據(jù)水平的理解可提供關(guān)于染色體功能和該序列的基因組環(huán)境的信息。使用NuPoPTM統(tǒng)計學(xué)程序包為任何大小的基因組序列預(yù)測核小體占據(jù)和最似然的核小體定位圖(Xi,L.,F(xiàn)ondufe-Mittendor,Y.,Xia,L.,F(xiàn)latow,J.,Widom,J.andWang,J.-P.,PredictingnucleosomepositioningusingadurationHiddenMarkovModel,BMCBioinformatics,2010,doi:10.1186/1471-2105-11-346)。對于5,286個最優(yōu)基因組座位中的每一個,將核苷酸序列提交供NuPoPTM軟件分析,計算核小體占據(jù)得分。最優(yōu)玉米基因組座位數(shù)據(jù)集的這些核小體占據(jù)得分的范圍從最小0到最大0.962。9.染色體內(nèi)的相對位置(對著絲粒的接近度)a.著絲粒是染色體上連接兩個姐妹染色單體的區(qū)域。著絲粒每一側(cè)的染色體部分被稱為染色體臂。在已公布的玉米栽培種B73參照序列(Schnable,P.,etal.,(2009)TheB73maizegenome:complexity,diversityanddynamics.Science,326(5956):1112-1115)中鑒定了全部10條玉米染色體上著絲粒的基因組位置。從玉米基因組數(shù)據(jù)庫提取了關(guān)于著絲粒在每個玉米染色體中的位置,以及染色體臂的長度的信息。對于每個最優(yōu)基因組座位,測量從最優(yōu)基因組座位序列到其所在的染色體的著絲粒的基因組距離(以bp計)。最優(yōu)基因組座位在染色體內(nèi)的相對位置表示為其到著絲粒的基因組距離相對于其所在的具體染色體臂的長度之比。該玉米最優(yōu)基因組座位數(shù)據(jù)集的這些相對位置值的范圍從最小0.00373到最大0.99908的基因組距離比。10.最優(yōu)基因組座位周圍1Mb區(qū)域中最優(yōu)基因組座位的數(shù)目a.對于每個最優(yōu)基因組座位,定義最優(yōu)基因組座位位置周圍的1Mb基因組窗口,并統(tǒng)計該區(qū)域內(nèi)存在的或與該區(qū)域重疊的其他更多的最優(yōu)基因組座位,包括在考慮中的最優(yōu)基因組座位。1Mb中最優(yōu)基因組座位的數(shù)目范圍從最小1到最大22。使用如上所述的特征和屬性分析了全部5,286個最優(yōu)基因組座位。表3(通過提述將其作為另行電子提交的文件并入)中進(jìn)一步描述了每個最優(yōu)基因組座位的特征和屬性評分的結(jié)果或值。將所得的數(shù)據(jù)集用于PCA統(tǒng)計學(xué)方法以將該5,286個鑒定出的最優(yōu)基因組座位聚類成類簇。在聚類過程中,在估計了最優(yōu)基因組座位的“p”主成分之后,將最優(yōu)基因組座位指配到32個類簇之一的過程在“p”維歐幾里得空間中進(jìn)行。將每個“p”軸分解為“k”個區(qū)間。將被指配到相同區(qū)間的最優(yōu)基因組座位組合到一起形成類簇。使用該分析,每個PCA軸被分為兩個區(qū)間,根據(jù)關(guān)于實驗驗證所需的類簇數(shù)的事先信息加以選擇。所有分析和對所得的類簇的可視化均使用來自ChemicalComputingGroupInc.(Montreal,Quebec,Canada)的MolecularOperatingEnvironmentTM(MOE)軟件來實施。利用該P(yáng)CA途徑將5,286個最優(yōu)玉米基因組座位基于它們的特征值(如上所述)聚類成32個獨特的類簇。在PCA過程中,產(chǎn)生了5個主成分(PC),其中最先3個PC含有數(shù)據(jù)集中總變異的約90%(表4)。用這3個PC在3維作圖中圖形化表現(xiàn)所述32個類簇(見圖3)。在聚類過程完成之后,從每個類簇選擇一個代表性的最優(yōu)基因組座位。這通過用計算機(jī)方法選擇每個類簇內(nèi)與該類簇的形心最接近的選定最優(yōu)基因組座位來進(jìn)行(表4)。32個代表性的最優(yōu)基因組座位的染色體位置在10個玉米染色體中分布均勻且不偏向任何特定的基因組位置,如圖4所示。表4.從PCA鑒定的32種玉米代表性最優(yōu)基因組座位的描述用于靶向多核苷酸供體多核苷酸序列的72個基因組座位的最終選擇從聚類成32個獨特類簇的5,286個基因組座位中鑒定并選擇了總共72個基因組座位,以用于供體多核苷酸序列的靶向。對于該32個類簇中的每一個,選擇了代表性的基因組座位(與該類簇的形心最近的32個代表性基因組座位,如上文表4中所述)以及每個類簇內(nèi)的額外基因組座位。所述額外最優(yōu)基因組座位是通過下述方式選擇的:首先用5,286個選定的最優(yōu)基因組序列篩選一個全基因組數(shù)據(jù)庫,該數(shù)據(jù)庫由玉米栽培種Hi-II(靶向篩選系)和玉米栽培種B104(轉(zhuǎn)化系)的基因組DNA序列數(shù)據(jù)構(gòu)成,以確定覆蓋度(有多少最優(yōu)基因組座位在兩種基因組中均存在)和來自這兩個系的基因組中的序列同一性的百分比。選擇具有100%覆蓋度(最優(yōu)座位的序列全長在兩種基因組之間對齊)且在Hi-II和B104基因組數(shù)據(jù)庫中均有100%同一性的額外最優(yōu)基因組座位用于靶向驗證(圖5)。相比之下,少數(shù)代表性基因組座位在Hi-II和B104基因組數(shù)據(jù)庫中均具有少于100%覆蓋度和同一性的序列同一性(圖5)。其他標(biāo)準(zhǔn),如基因組座位大小,獨特性的程度,GC%含量和最優(yōu)基因組座位的染色體分布,也在選擇其他最優(yōu)基因組座位時考慮。72個選定最優(yōu)基因組座位的染色體位置以及每個玉米最優(yōu)基因組座位的具體基因組構(gòu)型分別示于圖6和表5。表5.選用于靶向驗證的選定玉米最優(yōu)基因組座位的描述。在該表中列出的這些最優(yōu)基因組座位中,72個玉米最優(yōu)基因組座位可以代表總共5,286個經(jīng)鑒定的玉米選定最優(yōu)基因組座位。使用精密基因組工程化技術(shù)(precisiongenomeengineeringtechnologies)在玉米基因組中鑒定了一大組5,286個基因組位置,作為用供體多核苷酸序列靶向的最優(yōu)基因組座位。利用統(tǒng)計學(xué)分析途徑將選出的5,286基因組座位分組成72個具有相似的基因組上下文的類簇,并鑒定出了能代表該5,286個選定的基因組座位的集合的72個選定的基因組座位。通過用供體多核苷酸序列進(jìn)行靶向,驗證了這32個代表性座位是最優(yōu)基因組座位。為前述的十組特征或?qū)傩陨闪藬?shù)值,對這些數(shù)值進(jìn)行了PCA統(tǒng)計學(xué)分析,由此將這十種特征或?qū)傩杂嬎愠删哂休^少維數(shù)的PCA成分。如此,PCA成分被降低為可代表如上所述的十種特征或?qū)傩缘?個維度(表6)。每個PCA成分等同于上述十種特征或?qū)傩缘囊粋€組合。從這些包含5個維度的PCA成分,如通過PCA統(tǒng)計學(xué)分析所計算的,確定出所述32個類簇。實施例3:用于結(jié)合玉米中的基因組座位的鋅指的設(shè)計如前人所述設(shè)計針對鑒定出的代表性基因組座位的DNA序列的鋅指蛋白。參見例如Urnovetal.,(2005)Nature435:646-551。示例性的靶序列和識別螺旋示于表7(識別螺旋區(qū)域設(shè)計)及表8(靶位點)。在表8中,靶位點中被ZFP識別螺旋所接觸的核苷酸以大寫字母表示,非接觸的核苷酸以小寫字母表示。對前述的所有72個選定的基因組座位設(shè)計了鋅指核酸酶(ZFN)靶位點。開發(fā)并測試了許多ZFP設(shè)計并加以測試,以鑒定以最高水平的效率與如上所述在玉米中鑒定并選出的72種不同的代表性基因組座位靶位點結(jié)合的鋅指。將與鋅指識別序列以最高效率水平結(jié)合的特定ZFP識別螺旋(表7)用于供體序列在玉米基因組內(nèi)的靶向和整合。表7.針對玉米選定的基因組座位的鋅指設(shè)計(N/A表示“不適用”)。應(yīng)當(dāng)注意,用星號(*)標(biāo)識的ZFP識別螺旋是設(shè)計為靶向并整合供體序列,但在這些基因組座位中的供體整合尚未完成。表8.玉米選定的基因組座位的鋅指蛋白靶位點將玉米代表性基因組座位鋅指設(shè)計組入到鋅指表達(dá)載體中,該載體編碼具有至少一個具有CCHC結(jié)構(gòu)的指的蛋白。參見,美國專利公開號2008/0182332。具體地,每個蛋白的最后一個指具有用于識別螺旋的CCHC骨架。將編碼非經(jīng)典鋅指的序列與IIS型限制酶FokI的核酸酶域(Wahetal.,(1998)Proc.Natl.Acad.Sci.USA95:10564-10569的序列的氨基酸384-579)介由四個氨基酸的ZC接頭及來源于玉米的opaque-2核定位信號融合,形成鋅指核酸酶(ZFN)。參見美國專利7,888,121。選擇針對各種功能域的鋅指供體內(nèi)使用。在設(shè)計、產(chǎn)生并測試對推定的基因組靶位點的結(jié)合的多種ZFN中,表8中所述的ZFN被鑒定為具有體內(nèi)活性,并被定性為在植物體中能夠高效地結(jié)合并切割獨特的玉米基因組多核苷酸靶位點。ZFN構(gòu)建體組裝利用本領(lǐng)域公知的技術(shù)和工藝(參見例如Ausubel或Maniatis)設(shè)計并完成了如前所述鑒定的含有ZFN基因表達(dá)構(gòu)建體的質(zhì)粒載體。將每個ZFN編碼序列與編碼opaque-2核定位信號的序列融合(Maddalonietal.,(1989)Nuc.AcidsRes.17:7532),后者定位于鋅指核酸酶的上游。非經(jīng)典鋅指編碼序列融合于IIS型限制酶FokI的核酸酶域(Wahetal.(1998)Proc.Natl.Acad.Sci.USA95:10564-10569的序列的氨基酸384-579)。融合蛋白的表達(dá)由玉米泛素基因-1的強(qiáng)組成型啟動子(其包括5’非翻譯區(qū)(UTR)(Tokietal.,(1992)PlantPhysiology100;1503-07))驅(qū)動。該表達(dá)盒還包括來自玉米過氧化物酶5基因(Per5)基因(美國專利公布號2004/0158887)的3’UTR(包括轉(zhuǎn)錄終止子和多腺苷酸化位點)。在克隆到該構(gòu)建體內(nèi)的兩個鋅指核酸酶融合蛋白之間添加來自明脈扁刺蛾(Thoseaasigna)病毒編碼自水解性2A的核苷酸序列(Szymczaketal.,(2004)NatBiotechnol.22:760-760)。使用IN-FUSIONTMAdvantageTechnology(Clontech,MountainView,CA)組裝質(zhì)粒載體。限制性內(nèi)切核酸酶獲自NewEnglandBioLabs(Ipswich,MA),DNA連接使用T4DNA連接酶(Invitrogen,Carlsbad,CA)。質(zhì)粒的制備使用PlasmidKit(Macherey-NagelInc.,Bethlehem,PA)或PlasmidMidiKit(Qiagen)根據(jù)供應(yīng)商的說明進(jìn)行。在瓊脂糖Tris-乙酸鹽凝膠電泳后使用QIAquickGelExtractionKitTM(Qiagen)分離DNA片段。所有連接反應(yīng)的菌落通過小提DNA的限制酶消化來初步篩選。將選出的克隆的質(zhì)粒DNA交由測序供應(yīng)商(EurofinsMWGOperon,Huntsville,AL)測序。使用SEQUENCHERTM軟件(GeneCodesCorp.,AnnArbor,MI)組合并分析序列數(shù)據(jù)。通過限制酶消化且通過DNA測序構(gòu)建并驗證了質(zhì)粒。通過自動化工作流程的鋅指克隆鋅指核酸酶載體的一個子集是通過自動化DNA構(gòu)建管道來克隆的??偟膩碚f,通過自動化管道構(gòu)建的載體的ZFN構(gòu)架與前文所述的相同。將每個鋅指單體-其賦予ZFN的DNA結(jié)合特異性-在KPF氨基酸基序處分割為2-3個獨特的序列。修飾ZFN片段的5’和3’末端以包含BsaI識別位點(GGTCTCN)以及衍生的突出端。突出端的分布使得包含6-8個部分的組裝體只會產(chǎn)生期望的全長表達(dá)克隆。修飾的DNA片段從頭合成(SyntheticGenomicsIncorporated,LaJolla,CA)。在所有玉米ZFN構(gòu)建物中使用單一的玉米骨架,pDAB118791。它含有ZmUbi1啟動子以及Opaque2NLS,還有FokI域以及ZmPer53’UTR。在Opaque2NLS和FokI域之間克隆有被BsaI側(cè)翼的來自枯草桿菌的SacB基因。將推定的連接事件在含蔗糖的培養(yǎng)基上鋪板之后,SacB盒充當(dāng)減少或消除載體骨架污染的負(fù)選擇劑。另一種在所有構(gòu)建物中被重復(fù)使用的部分是pDAB117462。該載體含有第一單體Fok1域、t2A反向螺旋序列(stuttersequence),以及第二單體Opaque2NLS,它們都被BsaI位點側(cè)翼。使用這些材料作為ZFNDNA部分文庫,由一臺FreedomEvo(TECAN,Mannedorf,Switzerland)操作從帶2D條形碼的管向PCR平板中(ThermoFisher,Waltham,MA)添加75-100ng的每種DNA質(zhì)粒或合成片段。向反應(yīng)中加入補(bǔ)充有牛血清白蛋白(NEB,Ipswich,MA)及T4DNA連接酶緩沖液(NEB,Ipswich,MA)的BsaI(NEB,Ipswich,MA)和T4DNA連接酶(NEB,Ipswich,MA)。將反應(yīng)置于C1000TouchThermo(BioRad,HerculesCA)中進(jìn)行37℃溫育3分鐘和16℃4分鐘的循環(huán)(25X)。連接后的材料在Top10(LifeTechnologiesCarlsbad,CA)中通過手工或使用Qpix460菌落挑取器和LabChip(PerkinElmer,Waltham,MA)進(jìn)行轉(zhuǎn)化和篩選。對正確消化的菌落進(jìn)行序列驗證并提供用于植物轉(zhuǎn)化。通用供體構(gòu)建體組裝為了支持對大數(shù)目的靶座位的快速測試,設(shè)計并構(gòu)建了一種新的、靈活的通用供體系統(tǒng)序列。該通用供體多核苷酸序列與高通量載體構(gòu)建方法學(xué)及分析兼容。通用載體系統(tǒng)由至少三個模塊域組成:一個可變的ZFN結(jié)合域,一個不可變的分析與用戶定義特征域,以及一個用于載體規(guī)模放大的簡單質(zhì)粒骨架。非可變通用供體多核苷酸序列對所有供體是相同的,這樣就能夠設(shè)計可以在所有玉米靶位點中通用的有限的一組測定,從而為靶向評估提供均一性,并減少分析循環(huán)次數(shù)。這些域的模塊性為高通量供體組裝提供了條件。此外,通用供體多核苷酸序列有其他以簡化下游分析和改善結(jié)果解釋為目標(biāo)的獨特特征。它含有不對稱的限制性位點序列,借助該序列可以將PCR產(chǎn)物消化到診斷性預(yù)測得出的大小。處于包含預(yù)期在PCR擴(kuò)增中會出問題的二級結(jié)構(gòu)的序列。通用供體多核苷酸序列的尺寸小(低于3.0Kb)。最后,將通用供體多核苷酸序列構(gòu)建到高拷貝pUC19骨架上,這樣可以及時地集聚大量的測試DNA。作為一個實施方案,提供了SEQIDNO:5418和圖7作為包含通用供體多核苷酸序列的質(zhì)粒的一個實例。在一個其他實施方案中,提供:pDAB11846,SEQIDNO:5419,圖15;pDAB117415,SEQIDNO:5420,圖16;pDAB117416,SEQIDNO:5421,圖17;pDAB117417,SEQIDNO:5422,圖18;pDAB117419,SEQIDNO:5423,圖19;pDAB117434SEQIDNO:5424,圖20;pDAB117418,SEQIDNO:5425,圖21;pDAB117420,SEQIDNO:5426,圖22;和pDAB117421,SEQIDNO:5427,圖23,作為通用供體多核苷酸序列。在另一個實施方案中,可以構(gòu)建其他包含所述通用載體多核苷酸序列、具有功能性表達(dá)的編碼序列或非功能性(無啟動子)表達(dá)的編碼序列的序列。在另一個實施方案中,通用供體多核苷酸序列是作為質(zhì)粒被投遞的一種2-3Kb的模塊化小型供體系統(tǒng)。這是一種最小供體,包含任何數(shù)目的ZFN結(jié)合位點,稱為“DNAX”或“UZI序列”(SEQIDNO:5428)的短的100-150bp模板區(qū)域,其攜帶限制性位點和用于引物設(shè)計的DNA序列或編碼序列,以及簡單的質(zhì)粒骨架(圖8)。通過雙鏈DNA在合適的ZFN結(jié)合位點斷裂后的NHEJ插入整個質(zhì)粒;ZFN結(jié)合位點可以依次一一組入。通用供體多核苷酸序列的這個實施方案對于靶位點和ZFN的快速篩選是最適合的,且最大程度地減少了供體中難于擴(kuò)增的序列。在一個進(jìn)一步的實施方案中,通用供體多核苷酸序列由至少4個模塊組成,且攜帶ZFN結(jié)合位點、同源臂、DNAX以及僅約100bp的分析片斷或編碼序列。通用供體多核苷酸序列的這個實施方案適合用于用數(shù)種ZFN在多種不同的靶位點處查詢HDR介導(dǎo)的基因插入(圖9)。通用供體多核苷酸序列可以與所有具有明確的DNA結(jié)合域的靶向性分子一起使用,靶向供體插入有兩種模式(NHEJ/HDR)。如此,當(dāng)通用供體多核苷酸序列與合適的ZFN表達(dá)構(gòu)建體共投遞時,供體載體和玉米基因組在一個特定的位置被切割,該位置由該具體的ZFN的結(jié)合所決定。一旦被線性化,供體就可以通過NHEJ或HDR組入到基因組中。然后可以利用載體設(shè)計中的不同分析考慮因素來確定將靶向整合的高效投遞最大化的鋅指(圖10)。實施例4:玉米轉(zhuǎn)化程序在投遞到玉米Hi-II原生質(zhì)體之前,利用PureYieldPlasmidMaxiprep(PromegaCorporation,Madison,WI)或PlasmidMaxi(Qiagen,Valencia,CA)根據(jù)供應(yīng)商的說明從大腸桿菌培養(yǎng)物制備每種ZFN構(gòu)建體的質(zhì)粒DNA。原生質(zhì)體分離玉米栽培品種Hi-II懸浮細(xì)胞以3.5天進(jìn)度表進(jìn)行保持,收集4mL細(xì)胞壓積體積(packedcellvolume)(PCV)的細(xì)胞并轉(zhuǎn)移到含有20mL酶溶液(0.6%PectolyaseTM,6%CellulaseTM(“Onozuka”R10;YakultPharmaceuticals,Japan),4mMMES(pH5.7),0.6M甘露醇,15mMMgCl2)的50mL無菌錐形管中(FisherScientific)。將培養(yǎng)物加蓋,并用PARAFILMTM包裹并放置在平臺搖床上(ThermoScientific,可變混合平臺搖臂),設(shè)置速度為10,在室溫下溫育16-18小時,直至原生質(zhì)體釋放。溫育后,在顯微鏡下檢查一滴細(xì)胞,以檢查消化的質(zhì)量,并將消化后的細(xì)胞通過一100μm細(xì)胞濾網(wǎng)過濾,用10mLW5培養(yǎng)基[2mMMES(pH5.7),205mMNaCl,167mMCaCl2,6.7mMKCl]漂洗,然后再通過70μm和40μm的細(xì)胞濾網(wǎng)過濾。該100μm和40μm的細(xì)胞濾網(wǎng)用10mLW5培養(yǎng)基漂洗。將過濾的原生質(zhì)體與漂洗培養(yǎng)基一起收集到一個50ml離心管中,終體積為大約40mL。向原生質(zhì)體/酶溶液的底部緩慢加入8mL“重梯度溶液”[500mM蔗糖,1mMCaCl2,5mMMES(pH6.0)],使用帶懸掛吊籃式轉(zhuǎn)子的離心機(jī)以300-350×g離心15分鐘。離心后,移出大約7-8mL原生質(zhì)體帶,用25mLW5清洗,并在180-200×g下離心15分鐘。然后將原生質(zhì)體重新懸浮在10mLMMG溶液中[4mMMES(pH5.7),0.6M甘露醇,15mMMgCl2]。使用血球計數(shù)或流式細(xì)胞儀對原生質(zhì)體進(jìn)行計數(shù),并用MMG稀釋至167萬個/毫升。使用PEG轉(zhuǎn)化玉米栽培種Hi-II懸浮培養(yǎng)遞送的原生質(zhì)體將大約50萬個原生質(zhì)體(在300μLMMG溶液中)轉(zhuǎn)移到2mL管中,與40μLDNA混合,并在室溫下溫育5-10分鐘。接著,添加300μL新鮮制備的PEG溶液[36%PEG4000,0.3M甘露醇,0.4MCaCl2],將混合物在室溫下溫育15-20分鐘,定期顛倒混合。溫育之后,緩慢加入1mLW5清洗液,并輕柔混合,通過180-200×g離心15分鐘沉淀原生質(zhì)體。將離心沉淀物重懸在1mlWI培養(yǎng)基[4mMMES(pH5.7),0.6M甘露醇,20MKCL]中,用鋁箔包裹含有原生質(zhì)體的管子并在室溫下過夜溫育大約16小時。ZFN和供體轉(zhuǎn)化對表5的每個選定的基因座,用yfp基因表達(dá)對照、僅ZFN、僅供體、以及1∶10比例(重量比)的ZFN和供體混合物轉(zhuǎn)染玉米原生質(zhì)體。轉(zhuǎn)染50萬個原生質(zhì)體的DNA總量為80μg。所有處理均進(jìn)行了3次或6次重復(fù)。所用的YFP基因表達(dá)對照是pDAB8393(圖11),其含有玉米泛素1啟動子-黃色熒光蛋白編碼序列-玉米Per53′UTR和水稻Actin1啟動子-pat編碼序列-玉米脂肪酶3′UTR基因表達(dá)盒。為了為每次轉(zhuǎn)染提供一致的總DNA量,在需要時使用鮭精或者含yfp基因的質(zhì)粒作為填充物。在典型的靶向?qū)嶒炛?,將單獨?μgZFN、或者4μgZFN與36μg供體轉(zhuǎn)染,并加入適宜量的鮭精或pUC19質(zhì)粒DNA以使總DNA量達(dá)到80μg。通過加入YFP基因表達(dá)質(zhì)粒作為補(bǔ)充物,可以評估多個基因座和重復(fù)處理中的轉(zhuǎn)染質(zhì)量。實施例5:借助鋅指核酸酶在玉米中切割基因組座位在轉(zhuǎn)染24小時后,將ZFN轉(zhuǎn)染的玉米栽培種Hi-II原生質(zhì)體通過1600rpm離心收集在2mlEppendorfTM管中,并徹底除去上清液。使用QiagenPlantDNAExtractionKitTM(Qiagen,Valencia,CA)從原生質(zhì)體離心沉淀中提取基因組DNA。將分離的DNA重懸浮在50μL水中,借助(Invitrogen,GrandIsland,NY)確定濃度。通過在0.8%瓊脂糖凝膠電泳上跑膠估算樣品中DNA的完整性。將所有樣品標(biāo)準(zhǔn)化(20-25ng/μL)用于PCR擴(kuò)增,以產(chǎn)生用于測序的擴(kuò)增子(Illumina,Inc.,SanDiego,CA)。設(shè)計用來從處理組和對照組樣品擴(kuò)增涵蓋每個測試ZFN識別序列的區(qū)域的條形碼引物并從IDT(Coralville,IA,HPLC純化)購買。在23.5μL反應(yīng)中使用0.2μM合適的條形碼引物、ACCUPRIMEPFXSUPERMIXTM(Invitrogen,Carlsbad,CA)和100ng的基因組DNA模板,通過梯度PCR確定最佳擴(kuò)增條件。循環(huán)參數(shù)為:在95℃預(yù)變性95℃(5min),接著是35個循環(huán)的變性(95℃,15sec),退火(55-72℃,30sec),延伸(68℃,1min),和最終延伸(68℃,7min)。擴(kuò)增產(chǎn)物在用3.5%TAE瓊脂糖凝膠上進(jìn)行分析,確定每個引物組合的合適退火溫度,并用于從對照和ZFN處理樣品擴(kuò)增擴(kuò)增子,如上文所述。所有擴(kuò)增子在3.5%瓊脂糖凝膠上純化,用水洗脫,并通過NANODROPTM確定濃度。為了進(jìn)行二代測序,收集大約100ng來自ZFN處理的玉米原生質(zhì)體及相應(yīng)的玉米原生質(zhì)體對照的PCR擴(kuò)增子,并使用Illumina二代測序(NGS)進(jìn)行測序。測定了合適的ZFN在每個玉米選定基因組座位的切割活性。從處理組和對照組原生質(zhì)體的基因組DNA擴(kuò)增了涵蓋ZFN切割位點的短擴(kuò)增子,并進(jìn)行IlluminaNGS。ZFN誘導(dǎo)切割或DNA雙鏈斷裂被細(xì)胞NHEJ修復(fù)途徑通過在切割位點處插入或缺失核苷酸(indels)所消解,因此切割位點處插入缺失的存在是ZFN活性的量度,通過NGS加以確定。使用NGS分析軟件估算每1百萬個高品質(zhì)序列中帶有插入缺失的序列的數(shù)目,作為靶特異性ZFN的切割活性(專利公開2012-0173,153,DNA序列的數(shù)據(jù)分析)(圖12)。對于玉米選定基因組座位靶點觀察到了高于對照5-100倍范圍的活性,這進(jìn)一步被序列比對所證實,序列比對顯示了每個ZFN切割位點處插入缺失的多樣性足跡。這個數(shù)據(jù)表明,玉米選定基因組座位能夠被ZFN切割。每個靶點的差異性活性反映了其染色質(zhì)的狀態(tài)和對切割的適應(yīng)性,以及每種ZFN的表達(dá)效率。實施例6:多核苷酸供體的整合的快速靶向分析利用半高通量基于原生質(zhì)體的快速測試分析方法驗證通用供體多核苷酸序列介由非同源末端連接(NHEJ)介導(dǎo)的供體插入在玉米選定基因組座位靶標(biāo)內(nèi)的靶向。對于每個玉米選定靶基因組座位,測試了3-6種ZFN設(shè)計,并通過二代測序方法(圖12)測量ZFN介導(dǎo)的切割和通過接點內(nèi)-外PCR測量供體插入(圖13)來對靶向進(jìn)行評估。將在兩個測定中均為陽性的玉米選定基因組座位鑒定為可靶向的座位。ZFN供體插入快速測試分析為了確定玉米選定基因組座位靶點是否能夠被靶向以用于供體插入,將ZFN構(gòu)建體和通用供體多核苷酸構(gòu)建體共投遞到玉米原生質(zhì)體中,溫育24個小時,之后提取基因組DNA進(jìn)行分析。如果表達(dá)的ZFN在玉米選定基因組座位靶標(biāo)處和在供體中均能夠切割靶結(jié)合位點,則線性化的供體會通過非同源末端連接(NHEJ)途徑插入到玉米基因組中經(jīng)切割的靶位點中。玉米選定基因組座位靶標(biāo)處的靶向插入的確認(rèn)根據(jù)“內(nèi)-外”PCR策略完成,其中“內(nèi)”引物識別天然最優(yōu)基因組座位處的序列,“外”引物則結(jié)合供體DNA內(nèi)的序列。引物的設(shè)計方式使得僅當(dāng)供體DNA插入在玉米選定基因組座位靶標(biāo)處時,PCR測定才會產(chǎn)生具有預(yù)期大小的擴(kuò)增產(chǎn)物。在插入接點的5′-和3′-端均進(jìn)行內(nèi)-外PCR測定。用于分析被整合的多核苷酸供體序列的引物提供于表9中。利用巢式“內(nèi)-外”PCR將ZFN供體插入在靶座位所有PCR擴(kuò)增均使用TAKARAEXTAQHSTM試劑盒(Clonetech,MountainView,CA)進(jìn)行。第一輪內(nèi)-外PCR在20μL最終反應(yīng)體積中實施,其含有1XTaKaRaExTaqHSTM緩沖液,0.2mMdNTP,0.2μM“外”引物(表9),0.05μM“內(nèi)”引物(根據(jù)上述的通用供體盒設(shè)計而得),0.75單位TaKaRaExTaqHSTM聚合酶和10ng提取的玉米原生質(zhì)體DNA。然后使用如下組成的PCR程序進(jìn)行反應(yīng):94℃2min,20個循環(huán)的98℃12sec、68℃12min,隨后是72℃10min,并在4℃保持。最終的PCR產(chǎn)物與1KBPLUSDNALADDERTM(LifeTechnologies,GrandIsland,NY)一起跑瓊脂糖凝膠,以便可視化觀察。巢式內(nèi)-外PCR在20μL最終反應(yīng)體積中進(jìn)行,其含有1XTaKaRaExTAQHSTM緩沖液,0.2mMdNTP,0.2μM“外”引物(表9),0.1μM“內(nèi)”引物(根據(jù)上述的通用供體盒設(shè)計而得,表10),0.75單位的TaKaRaExTAQHSTM聚合酶,和1μL第一PCR產(chǎn)物。然后使用如下組成的PCR程序進(jìn)行反應(yīng):94℃2min,31個循環(huán)的98℃12sec,66℃30sec和68℃45sec,隨后是72℃10min,并在4℃保持。最終的PCR產(chǎn)物與1KBPLUSDNALADDERTM(LifeTechnologies,GrandIsland,NY)一起跑瓊脂糖凝膠,以便可視化觀察。表9.用于最優(yōu)基因組座位的巢式內(nèi)-外PCR分析的所有“外”引物的列表。表10.用于最優(yōu)基因組座位的巢式內(nèi)-外PCR分析的所有“內(nèi)”引物的列表。表11.用于ZFN切割活性的引物。在原生質(zhì)體靶向系統(tǒng)中開展內(nèi)-外PCR測定是特別具有挑戰(zhàn)性的,因為轉(zhuǎn)染要使用大量的質(zhì)粒DNA,而大量DNA保留在原生質(zhì)體靶向系統(tǒng)中,并隨后與細(xì)胞基因組DNA一起被提取。殘余的質(zhì)粒DNA可能稀釋基因組DNA的相對濃度,降低檢測的總體靈敏度,并且還可能是非特異性異常PCR反應(yīng)的重要原因。ZFN誘導(dǎo)的基于NHEJ的供體插入通常以正向或反向取向發(fā)生。對正向插入的DNA內(nèi)-外PCR分析經(jīng)常顯示假陽性條帶,這可能是由于靶和供體的ZFN結(jié)合位點附近具有同源區(qū)域,這會導(dǎo)致在擴(kuò)增過程中非整合的供體DNA的引發(fā)和延伸。在探查反向插入產(chǎn)物的分析中沒有見到假陽性,因此在RTA中進(jìn)行的所有靶向供體整合分析均查詢反向供體插入。為了進(jìn)一步增加特異性和減少背景,還采用巢式PCR策略。巢式PCR策略使用第二PCR擴(kuò)增反應(yīng)來擴(kuò)增第一PCR反應(yīng)的第一擴(kuò)增產(chǎn)物內(nèi)的一個較短區(qū)域。通過使用不對稱量的“內(nèi)”和“外”引物進(jìn)一步優(yōu)化接點PCR,以便在選定的基因組座位實施快速靶向分析。在瓊脂糖凝膠上觀察內(nèi)-外PCR分析結(jié)果。對表12的所有玉米選定基因組座位,“ZFN+供體處理”在5′和3′端均產(chǎn)生了接近預(yù)期大小的條帶。ZFN對照或單獨供體處理在PCR中是陰性的,提示該方法對至少72種最優(yōu)非基因玉米基因組座位的靶位點處的供體整合的評分是特異性的。所有處理均重復(fù)3-6次,并且利用在多次重復(fù)(在兩端均≥2)中均有預(yù)期的PCR產(chǎn)物的存在來證實靶向。通過NHEJ的供體插入常常產(chǎn)生強(qiáng)度較低的副產(chǎn)物,此類產(chǎn)物的產(chǎn)生是由于靶標(biāo)和/或供體ZFN位點處線性化末端的加工所導(dǎo)致。此外,觀察發(fā)現(xiàn),不同的ZFN產(chǎn)生的靶向整合的效率水平不同,其中一些ZFN產(chǎn)生一致高水平的供體整合,一些ZFN產(chǎn)生的供體整合水平的一致性較低,而其他ZFN則未導(dǎo)致整合??傮w言之,證實了每個被測試的玉米選定基因組座位靶標(biāo),均可通過一個或多個ZFN靶向整合在玉米的代表性基因組座位靶標(biāo)內(nèi),這證實了這些基因座的每一個均是可靶向的。而且,每一個玉米選定基因組座位靶標(biāo)均適于進(jìn)行精確基因轉(zhuǎn)化。這些玉米選定基因組座位靶標(biāo)的驗證經(jīng)過多次重復(fù)實驗進(jìn)行驗證,每次均得到了相似的結(jié)果,從而證實了包括質(zhì)粒設(shè)計和構(gòu)建、原生質(zhì)體轉(zhuǎn)化、樣品處理、和樣本分析在內(nèi)的確認(rèn)過程的可重復(fù)性。結(jié)論將供體質(zhì)粒和一個設(shè)計為特異性切割玉米選定基因組座位靶點的ZFN轉(zhuǎn)染到玉米栽培種Hi-II原生質(zhì)體中,并在24小時后收集細(xì)胞。通過內(nèi)-外接點PCR對從對照組、ZFN處理組、及ZFN與供體處理組的原生質(zhì)體分離的DNA進(jìn)行分析,結(jié)果顯示由于ZFN切割基因組DNA所導(dǎo)致的通用供體多核苷酸靶向插入(表12)。這些研究表明,該通用供體多核苷酸系統(tǒng)可以用來評估內(nèi)源位點處的靶向和用來篩選候選的ZFN。最后,該基于原生質(zhì)體的快速靶向分析和新型通用供體多核苷酸序列系統(tǒng)提供了一種快捷的途徑來篩選用于在植物中進(jìn)行精確基因組工程化工作的基因組靶標(biāo)和ZFN。該方法可以推廣到在任何感興趣的系統(tǒng)中使用任何可誘導(dǎo)DNA雙鏈或單鏈斷裂的核酸酶對位點特異性切割和供體插入進(jìn)行評估。表12.說明該通用供體多核苷酸序列在玉米選定基因組座位靶標(biāo)內(nèi)的整合結(jié)果。如下面的*所示,OGL73內(nèi)的供體插入僅通過5’接點序列的PCR反應(yīng)所確認(rèn)。實施例7:多核苷酸供體序列在玉米的基因組座位內(nèi)的表達(dá)通過用美國專利7,838,733中描述的含有aad-1轉(zhuǎn)基因的pDAB105817和pEPS1027質(zhì)粒(圖14)進(jìn)行轉(zhuǎn)化,產(chǎn)生了隨機(jī)整合的玉米轉(zhuǎn)化事件。產(chǎn)生了大數(shù)目的事件,并通過如美國專利申請2012/0258867中描述的基因組側(cè)翼分析法分析了1027個穩(wěn)定事件,以確定在這些事件中是否有任何事件在玉米選定基因組座位內(nèi)含有隨機(jī)整合的轉(zhuǎn)基因。如此,將223個事件中整合的轉(zhuǎn)基因的染色體位置定位到了玉米基因組中。表13的數(shù)據(jù)表明,整合的轉(zhuǎn)基因的染色體位置證實了在低甲基化區(qū)中的整合(45-73%),以及在至少1Kb的區(qū)域之下游的轉(zhuǎn)錄單位(啟動子/基因/3’UTR)中的整合(60%)。表13.1027個定位的事件的基因組和表基因組背景對經(jīng)過定位的事件,用如實施例1和2描述的最優(yōu)座位預(yù)測標(biāo)準(zhǔn)(低甲基化區(qū),獨特區(qū),非基因,非重復(fù),在40kB附近區(qū)域中鄰近于基因,在根/芽中活躍表達(dá)的證據(jù),重組的證據(jù)),在玉米選定基因組座位靶中鑒定出了數(shù)個隨機(jī)整合的事件(表14)。例如,分別通過使用快速測試分析(RapidTestingAnalysis)和通過植物內(nèi)靶向(inplantatargeting),證實了在玉米選定基因組座位靶標(biāo)optimal_loci_232222及optimal_loci_127268內(nèi)的靶向。實驗用的玉米選定基因組座位靶標(biāo)的平均長度大約為1Kb,在每個玉米選定基因組座位靶標(biāo)處觀察到了不同程度的aad-1表達(dá)(表14)。在T1植物轉(zhuǎn)化階段,借助對分離的轉(zhuǎn)基因葉材料的實時PCR分析進(jìn)行了平均aad-1表達(dá)分析。如此,玉米基因組內(nèi)的隨機(jī)整合事件能夠在實驗用的玉米選定基因組座位靶標(biāo)內(nèi)表達(dá)轉(zhuǎn)基因。表14.在最優(yōu)基因組座位內(nèi)隨機(jī)整合的aad-1轉(zhuǎn)基因的表達(dá)。顯示了座位處的aad-1標(biāo)志物的位置、長度和RNA表達(dá)。實施例8:用于轉(zhuǎn)基因整合的最優(yōu)非基因玉米基因組座位從5,286個最優(yōu)非基因玉米基因組座位中鑒定出一個系列的最優(yōu)非基因玉米基因組座位,以便選擇多個座位用于基因表達(dá)盒的位點特異性靶向,以及用于產(chǎn)生基因表達(dá)盒的堆疊。采用下面的標(biāo)準(zhǔn)過濾最優(yōu)非基因玉米基因組座位池,并選擇一系列最優(yōu)非基因玉米基因組座位:1)長度大于3Kb。最優(yōu)非基因玉米基因組座位可以用至少兩組基因表達(dá)盒的整合來靶向。2)重組頻率為0.5至1.0,其小于鑒定出的5,286個最優(yōu)非基因玉米基因組座位的平均重組頻率(平均重組頻率為約2.0)。3)在鑒定出的5,286個最優(yōu)非基因玉米基因組座位40Kb以內(nèi)的內(nèi)源基因的高于平均的表達(dá)。在芽和根組織中40Kb區(qū)域內(nèi)的基因的平均表達(dá)為6.30,是所有非基因玉米基因組座位的第48百分位。4)玉米栽培種B104和玉米栽培種Hi-II之間的序列覆蓋度和序列同一性大于90%。應(yīng)用了上述每一條標(biāo)準(zhǔn)來選擇一系列最優(yōu)非基因玉米基因組座位。圖24提供了該標(biāo)準(zhǔn)的三個示例性的示意圖,以及這些選定的最優(yōu)非基因玉米基因組座位如何比較。使用該標(biāo)準(zhǔn)鑒定了九個長度至少3Kb的最優(yōu)非基因玉米基因組座位(optimal_loci_137693_G1,optimal_loci_265551_G1,optimal_loci_128078_G1,optimal_loci_168286_G1,optimal_loci_3733_G1,optimal_loci_203075_G1,optimal_loci_232484_G1,optimal_loci_136086_G1,和optimal_loci_203704_G1)。見表15。通過將大小限制縮小到≥2Kb,鑒定了其他最優(yōu)非基因玉米基因組座位(optimal_loci_291068_G1,和optimal_loci_43577_G1),將這些座位添加到上述最優(yōu)非基因玉米基因組座位系列中。將另外一組最優(yōu)非基因玉米基因組座位添加到所述最優(yōu)非基因玉米基因組座位系列中,因為在這些座位處有通過土壤桿菌轉(zhuǎn)化隨機(jī)整合的轉(zhuǎn)基因的表達(dá)的證據(jù)(optimal_loci_232222_G1和optimal_loci_127268_G1)。鑒于optimal_loci_204637_G1和optimal_loci_204726_G1基因組座位的減數(shù)分裂重組單位特征,將它們添加到該系列中。此外,已經(jīng)成功地靶向optimal_loci_204637_G1與optimal_loci_204726_G1整合了供體多核苷酸。類似地,將optimal_loci_232228納入該系列中,因為該最優(yōu)非基因玉米基因組座位已經(jīng)被成功地靶向以整合供體多核苷酸,且該序列的長度為3.9Kb。接下來,對所有最優(yōu)非基因玉米基因組座位的到鄰近基因的距離和相距著絲粒的距離進(jìn)行表征(圖25)。該組選定的最優(yōu)非基因座位距離鄰近的基因約1-15Kb,并且位于染色體末端附近(與著絲粒的距離>0.70)(表16,圖25)。最后,探查了數(shù)量性狀座位的干擾,以完整地表征該最優(yōu)非基因玉米基因組座位系列。表15.最優(yōu)非基因玉米基因組座位系列表16:最優(yōu)非基因玉米基因組座位特征OGLID到最近基因的距離到著絲粒的距離optimal_loci_137693_G14070.70444101optimal_loci_265551_G19252.94191056optimal_loci_128078_G12491.87326872optimal_loci_168286_G11710.84128147optimal_loci_3733_G114910.856875optimal_loci_203075_G11001.75612998optimal_loci_232484_G11001.80656755optimal_loci_136086_G14381.7859925optimal_loci_203704_G12001.788019optimal_loci_127268_G12758.84500724optimal_loci_204637_G12874.83827931optimal_loci_291068_G14243.77879798optimal_loci_232222_G12832.79463887optimal_loci_43577_G12001.73018748optimal_loci_204726_G111370.84166127對于使用上面描述的標(biāo)準(zhǔn)選出的最優(yōu)非基因玉米基因組座位,通過整合含有選擇標(biāo)志物/報告標(biāo)志物的基因表達(dá)構(gòu)建體進(jìn)行了驗證。通過利用位點特異性核酸酶的基因組靶向,將該基因表達(dá)盒穩(wěn)定地整合到玉米植物中。對于所生成的被打靶且含有可表達(dá)轉(zhuǎn)基因的最優(yōu)非基因玉米基因組座位進(jìn)行分析,以鑒定出含有全長的整合基因表達(dá)盒的單拷貝事件。通過qRT-PCR、Western印跡、ELISA、LC-MSMS、以及其他已知的RNA或蛋白質(zhì)檢測方法,經(jīng)過多個植物世代(例如T1和T2世代)分析最優(yōu)非基因玉米基因組座位的表達(dá)概貌。此外,測定最優(yōu)非基因玉米基因組座位內(nèi)轉(zhuǎn)基因表達(dá)盒的整合對相鄰基因表達(dá)的影響。最后,測定最優(yōu)非基因玉米基因組座位內(nèi)轉(zhuǎn)基因表達(dá)盒的整合對玉米植物農(nóng)藝學(xué)性質(zhì)的影響。當(dāng)前第1頁1 2 3 當(dāng)前第1頁1 2 3