植物 的方法。并且利用本發(fā)明的5-烯醇丙酮莽草酸-3-磷酸合成酶可以清除受到草甘膦污染 的材料,如土壤、水、其他植株等,該酶可從微生物或轉(zhuǎn)基因宿主細(xì)胞中得到。
[0026] 本發(fā)明所涉及的術(shù)語定義如下:
[0027] "基因"是指編碼一種特定蛋白的全部或部分的核酸片段,并包括該編碼區(qū)前面和 后面的調(diào)控序列。"外源基因"是指正常情況下宿主生物中沒有的、通過基因轉(zhuǎn)移導(dǎo)入的 基因;也可指正常存在于宿主生物中的,但又被重新導(dǎo)入其基因組中其天然基因座之外的 另一基因座的基因,這種變化會導(dǎo)致一種內(nèi)原基因的編碼序列的一個或幾個額外拷貝的出 現(xiàn)。
[0028] "啟動子"是指可與RNA聚合酶及其他一些影響轉(zhuǎn)錄的反式因子結(jié)合而準(zhǔn)確有效 地起始轉(zhuǎn)錄的DNA序列。其通常存在于編碼序列的上游(5'),能夠引導(dǎo)核酸序列轉(zhuǎn)錄為 mRNA。啟動子包括轉(zhuǎn)錄起始位點、轉(zhuǎn)錄起始因子和RNA聚合酶的結(jié)合位點,并能夠含有可以 結(jié)合基因表達(dá)調(diào)控蛋白的各種其它位點。"組成型啟動子"是能驅(qū)動目的基因在生物體各發(fā) 育階段和不同部位表達(dá),且表達(dá)水平?jīng)]有明顯差異的一類啟動子。"組織特異性啟動子"是 指驅(qū)動目的基因在生物體特定器官中表達(dá)的一類啟動子。"誘導(dǎo)性啟動子"是指在一定的外 界條件下誘導(dǎo)驅(qū)動目的基因表達(dá)的一類啟動子。
[0029] "復(fù)合啟動子"是不同啟動子之間或啟動子與調(diào)控序列共同構(gòu)成的。調(diào)控元件包括 能增強外源基因表達(dá)或調(diào)控基因在植物中表達(dá)部位的各種來源的DNA序列。
[0030] "增強子"是能夠增強啟動子轉(zhuǎn)錄活性的一段順式調(diào)控序列。內(nèi)含子是一段不轉(zhuǎn)錄 的DNA序列,某些基因的個別內(nèi)含子能增強啟動子的轉(zhuǎn)錄活性。
[0031] "變體"是指對一個目的DNA序列進(jìn)行一個或多個堿基的任何取代,變異,修飾,替 換,缺失或者添加所產(chǎn)生的序列,該序列仍然表現(xiàn)出類似于所述的目的DNA序列的活性。
[0032] 本文中"序列同源性"是指通過序列比對,即對兩個蛋白質(zhì)序列進(jìn)行比較,找出兩 者之間的最大相似性配比。進(jìn)一步比對,是將多個蛋白質(zhì)或核酸同時進(jìn)行比較,尋找這些有 進(jìn)化關(guān)系的序列之間共同的保守區(qū)域、位點和特征普,從而探索導(dǎo)致它們產(chǎn)生共同功能的 序列模式。比對之后就可以得出同源性的大小,對它們進(jìn)行比較分析。此處所述序列包括 氨基酸序列和核苷酸序列??墒褂帽绢I(lǐng)域已知的各種方法測定序列同源性百分比。氨基酸 序列同源性相當(dāng)高的蛋白質(zhì)一般具有相同的功能,因此與序列表中SEQ ID No: 1所示氨基 酸序列具有90%以上同源性的基因都可以與其有相似的功能。
[0033] 本文中"核酸構(gòu)建體"指一些單鏈或雙鏈核酸分子,它們是從天然基因或已經(jīng)過改 變而含有以自然界不存在的方式結(jié)合和并列的核酸片段中分離的或已經(jīng)過改變而含有以 自然界不存在的方式結(jié)合和并列的核酸片段,例如:包含人工合成密碼子優(yōu)化的有利于在 植物中表達(dá)的核苷酸序列。。
[0034] 本文中"調(diào)控序列"就是一段控制基因表達(dá)的DNA片段,本發(fā)明中涉及到酶基因的 編碼需要調(diào)控序列的參與。每一種調(diào)控序列可以是編碼該多肽的核酸序列天然具有的,或 是外來的。這種調(diào)控序列包括前導(dǎo)序列、聚腺苷酸化序列、前肽序列、啟動子和轉(zhuǎn)錄終止子。 調(diào)控序列最少由啟動子以及轉(zhuǎn)錄和翻譯的終止信號組成。導(dǎo)入特異的限制性酶切位點有助 于調(diào)控序列和編碼異源多肽的核酸序列的編碼區(qū)進(jìn)行連接,因此需要制備帶有接頭的調(diào)控 序列。
[0035] 本文中"調(diào)控區(qū)域",意指任何涉及驅(qū)動轉(zhuǎn)錄和控制給定DNA序列轉(zhuǎn)錄時間和水平 的DNA,給定DNA序列例如編碼蛋白質(zhì)或多肽的DNA。
[0036] 本文中"可操作地連接"是指兩個或多個核酸區(qū)域或核酸序列的功能性的空間排 列。具體指將本發(fā)明分離的核酸序列,通過一定方式,如通過限制性內(nèi)切酶的酶切而使它們 分離,然后再與相對于該序列同源或異源的其它序列重組,形成一種新的能編碼一種產(chǎn)物 的核酸序列。
[0037] 本文中"宿主細(xì)胞"指能夠攝取本發(fā)明所述分離的核酸序列,或是含有該序列的 構(gòu)建體或載體,并使其穩(wěn)定維持的受體細(xì)胞。從原核到真核,從簡單的真核到高等的動植物 細(xì)胞已經(jīng)都能作為基因工程的受體細(xì)胞。將本發(fā)明所述分離的核酸序列轉(zhuǎn)入宿主細(xì)胞后, 該宿主細(xì)胞便能獲得由該序列編碼的性狀或特征,即草甘膦耐受性。
[0038] 本發(fā)明人從浙江省德清縣附近的一個草甘膦生產(chǎn)廠周圍土壤及污水中采樣,用含 有一定濃度草甘膦的培養(yǎng)基進(jìn)行有效分離,其中一種菌株可以在草甘膦限制性培養(yǎng)基上生 長,選擇此菌株進(jìn)行研究。進(jìn)一步分離出一種新型的抗草甘膦基因 EPSPS,并且對該基因進(jìn) 行克隆、測序,在本文中公開了該基因的序列結(jié)果,如序列表中SEQ ID No:l所示的氨基酸 序列和SEQ ID No :2所示的核苷酸序列。
[0039] 本發(fā)明一方面,本發(fā)明涉及一種新分離的核苷酸序列,其含序列表中SEQ ID No:2 的核苷酸序列并且可以編碼抗草甘膦的5-烯醇丙酮莽草酸-3-磷酸合成酶。
[0040] 本發(fā)明另一方面,本發(fā)明還涉及了上述序列表中SEQ ID No:2所示序列的改變,如 剪切、插入或取代一個或多個核苷酸而產(chǎn)生新的核酸序列,且該核酸序列能編碼具有5-烯 醇丙酮莽草酸-3-磷酸合成酶活性和草甘膦耐受性的蛋白。這里所述的核苷酸改變、剪切 或插入屬于本領(lǐng)域技術(shù)范疇。
[0041] 本發(fā)明還涉及與用上述序列表中SEQ ID No:2所限定的核酸序列,或與用上述序 列核苷酸所限定的核酸序列具有一定同源性的核酸序列,如同源性至少約65%,優(yōu)選至少 約70 %,更優(yōu)選至少約80 %同源性的核苷酸,只要這些序列能編碼具有草甘膦耐受性的活 性蛋白就屬于本發(fā)明的范圍。
[0042] 按照本發(fā)明實施例部分所述方法可從自然界分離克隆本發(fā)明所述的核酸序列???隆方法包括:用限制性內(nèi)切酶把含有編碼目標(biāo)蛋白的核酸序列的預(yù)期核酸片段切割并分離 出來,將該片段整合入載體分子中,再將該重組載體導(dǎo)入宿主細(xì)胞,從而使該核酸序列在該 宿主細(xì)胞中復(fù)制出多個拷貝或克隆??寺》椒ㄒ舶ǎ篜CR擴增或者一些傳統(tǒng)的分子生物 學(xué)方法。
[0043] 本發(fā)明的核酸序列可以DNA形式或RNA形式。DNA形式包括。DNA、基因組DNA或 人工合成的DNA。
[0044] 本發(fā)明另一方面還涉及能編碼具有EPSPS活性和草甘膦耐受性的蛋白產(chǎn)物的分 離的核酸序列,其中所述蛋白產(chǎn)物具有序列表中SEQ ID No: 1所示氨基酸序列。本發(fā)明的 SEQ ID No: 1所示氨基酸序列與土壤桿菌CP4(Agrobacterium sp.CP4)的草甘膦耐受型的 已知序列只有47. 8%同源性。
[0045] 本發(fā)明還涉及分離出的能編碼具有EPSPS活性和草甘膦耐受性的蛋白產(chǎn)物的核 酸序列,其中所述蛋白產(chǎn)物的氨基酸序列相對于上述序列表中SEQ ID No: 1所示氨基酸序 列,可以取代、缺失和/或添加一個或多個氨基酸,但該產(chǎn)物仍具有EPSPS活性和草甘膦耐 受性。涉及氨基酸的取代、缺失和/或添加的常規(guī)技術(shù)都是本領(lǐng)域可以完成的。優(yōu)選這種 氨基酸變化為:小的特性改變,即不顯著影響蛋白的折疊和/或活性的保守氨基酸取代;小 的缺失,通常約1-30個氨基酸的缺失;小的氨基或羧基端延伸,例如氨基端延伸一個甲硫 氨酸殘基;小的連接肽,例如約20-25個殘基長。
[0046] 在下列氨基酸組內(nèi)發(fā)生的取代是保守序列的取代:酸性氨基酸(如天冬氨酸和谷 氨酸)、堿性氨基酸(如精氨酸、組氨酸和賴氨酸)、芳香氨基酸(如色氨酸、酪氨酸和苯丙 氨酸)、疏水性氨基酸(如纈氨酸、亮氨酸和異亮氨酸)、極性氨基酸(如谷氨酰胺、天冬酰 胺),以及小分子氨基酸(如丙氨酸、甘氨酸、蘇氨酸、絲氨酸和甲硫氨酸)。通常不改變特 定活性的那些氨基酸取代在本領(lǐng)域是眾所周知。
[0047] 最常見的互換有 Ala/Ser, Ala/Thr, Ala/Val, Ala/Gly,Ala/Glu,Ala/Pro, Val/ lie, Asp/Glu, Thr/Ser, Ser/Asn, Ser/Gly, Tyr/Phe, Lys/Arg, Leu/Ile, Leu/Ile, Leu/Val, Asp/Asn和Asp/Gly,以及它們相反的互換。
[0048] 本發(fā)明中上述這種取代可以發(fā)生在對分子功能起重要作用的區(qū)域之外,而且仍會 有活性多肽產(chǎn)生。對于本發(fā)明中的分離的核酸序列編碼的多肽,其活性必需的并因此選擇 不被取代的氨基酸殘基,可以利用本領(lǐng)域已知的方法,如丙氨酸掃描誘變或定點誘變進(jìn)行 鑒定。前一技術(shù)是在分子中每一個帶正電荷的殘基處引入突變,檢測所得突變分子的草甘 膦耐受性EPSPS活性,從而將對該分子活性而言重要的氨基酸殘基確定。
[0049] 本發(fā)明還涉及與上述序列表中SEQ ID No: 1所示氨基酸序列具有一定同源性的 氨基酸序列,如同源性至少90 %,優(yōu)選至少91 %,優(yōu)選至少92 %,優(yōu)選至少93 %,優(yōu)選至少 94 %,優(yōu)選至少95 %,優(yōu)選至少