專利名稱:在植物中優(yōu)化聚糖生成的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于優(yōu)化含有N-聚糖的糖蛋白的細(xì)胞或生物體,特別是植物的聚糖生成方法,從而得到一種糖蛋白,其具有高甘露糖型的N-聚糖,雜合型或優(yōu)選復(fù)合型的N-聚糖,包括但不限于雙觸角N-聚糖,并在N-聚糖的至少一個(gè)臂上含有半乳糖殘基,不含有(或者減少)木糖和海藻糖殘基。本發(fā)明還涉及得到的所述糖蛋白和特別是含有該蛋白的植物宿主系統(tǒng)。
背景技術(shù):
N-聯(lián)聚糖(N-Linked glycans)是連接到糖蛋白的天冬酰胺殘基上的特定寡糖結(jié)構(gòu),能夠顯著地影響蛋白質(zhì)的性質(zhì),進(jìn)而影響生物體的特性。植物蛋白具有N-聯(lián)聚糖,但是極其不同于哺乳動(dòng)物,它們所影響的生物學(xué)過(guò)程幾乎是未知的。
N-聯(lián)聚糖的生物生成起始于脂聯(lián)寡糖成分(Glc3Man9GlcNAc2-)的合成,該成分全部被轉(zhuǎn)移給內(nèi)質(zhì)網(wǎng)(ER)中的新生多肽鏈。通過(guò)內(nèi)質(zhì)網(wǎng)和順式高爾基體區(qū)室中的一系列外切糖苷酶的修剪(trimming),形成所謂的“高甘露糖”型聚糖(由Man9GlcNAc2變成Man5GlcNAc2)。隨后,由GnTI將第一個(gè)GlcNAc轉(zhuǎn)移到Man5GlcNAc2,接著通過(guò)甘露糖苷酶II(ManII)修剪來(lái)形成GlcNAcMan3GlcNAc2,開始形成復(fù)合型聚糖。當(dāng)在一些其他的糖基轉(zhuǎn)移酶的作用下,通過(guò)分泌路徑在高爾基體中由GnTII將第二個(gè)GlcNAc殘基以及其他單糖殘基轉(zhuǎn)移到GlcNAcMan3GlcNAc2上,繼續(xù)復(fù)合型聚糖的生物合成。
植物和哺乳動(dòng)物在復(fù)合聚糖形成方面是不同的(見附圖1,比較植物和哺乳動(dòng)物中的糖蛋白的糖基化路徑)。在植物中,復(fù)合型聚糖的特征在于存在連接到Man-3的β(1,2)-木糖殘基和/或連接到GlcNAc-1的α(1,3)-海藻糖殘基,不具有連接到GlcNAc-l的α(1,6)-海藻糖殘基。編碼相應(yīng)的木糖基(XylT)和海藻糖基(FucT)轉(zhuǎn)移酶的基因已經(jīng)被分離[Strasser等,“擬南芥β1,2-木糖基轉(zhuǎn)移酶cDNA的分子克隆和功能性表達(dá)”,F(xiàn)EBS Lett.472105(2000);Leiter等,“從綠豆中純化、cDNA克隆和表達(dá)GDP-L-FucAsn聯(lián)GlcNAcα1,3-海藻糖轉(zhuǎn)移酶”,生物學(xué)化學(xué)雜志(J.Biol.Chem.)27421830(1999)]。植物不能生成β(1,4)-半乳糖基轉(zhuǎn)移酶和α(2,6)唾液酸轉(zhuǎn)移酶,結(jié)果植物聚糖缺乏常見于哺乳動(dòng)物聚糖的β(1,4)-半乳糖和末端的α(2,6)NeuAc殘基。
最終的聚糖結(jié)構(gòu)不僅僅由存在的參與聚糖生物合成和轉(zhuǎn)運(yùn)的酶來(lái)決定,還在更大的范圍內(nèi)由各種酶促反應(yīng)的特定順序來(lái)確定。在后一種情況中,是受這些酶在整個(gè)內(nèi)質(zhì)網(wǎng)和高爾基中的分散隔離和相對(duì)位置來(lái)控制,這是通過(guò)轉(zhuǎn)移酶的決定因子相互作用和亞高爾基體區(qū)室無(wú)轉(zhuǎn)移酶的特定特征調(diào)節(jié)的。許多采用雜合分子的研究已經(jīng)證明一些糖基轉(zhuǎn)移酶的跨膜結(jié)構(gòu)域在其亞高爾基分類中起主要作用,包括β(1,4)-半乳糖基轉(zhuǎn)移酶的跨膜結(jié)構(gòu)域[Grabenhorst等,生物學(xué)化學(xué)雜志(J.Biol.Chem.)27436107(1999);Colley,K.,糖生物學(xué)(Glycobiology)71(1997);Munro,S.,細(xì)胞生物學(xué)趨勢(shì)(Trends Cell Biol.)811(1998);Gleeson,P.A.,組織化學(xué)細(xì)胞生物學(xué)(Histochem.Cell Biol.)109517(1998)]。
雖然植物和哺乳動(dòng)物在相對(duì)較早以前就分化了,N聯(lián)糖基化似乎至少部分地保守。這由聚糖結(jié)構(gòu)雖然不同但是類似以及哺乳動(dòng)物的GlcNAcTI基因染色體(complement)不具有GlcNAcTI活性的擬南芥的突變體證實(shí),反之亦然。聚糖結(jié)構(gòu)的差異具有重要作用。例如,已知木糖和α(1,3)-海藻糖抗原決定簇具有極高的免疫原性,并且在某些情況下可能引起過(guò)敏,這在用植物生產(chǎn)治療性糖蛋白時(shí)帶來(lái)了問題。而且,在許多敏感癥患者的血液血清中含有直接抵抗這些抗原決定簇的IgE,而且50%的非敏感癥血液供體在其血清中含有特異于核心-木糖的抗體,而25%含有特異于核心-α1,3-海藻糖的抗體(Bardor等,2002,在版,糖生物學(xué)(Glycobiology))(2002年12月17日預(yù)先Access出版),這使得這些個(gè)體冒險(xiǎn)采用由植物制備的含有海藻糖和/或木糖的重組蛋白處理。此外,由于有證據(jù)表明這些糖特異的IgE與致敏反應(yīng)無(wú)關(guān),在血清中指示IgE的這種糖會(huì)在使用植物提取物的體外試驗(yàn)中引起假陽(yáng)性反應(yīng)??傊褂弥参锷a(chǎn)的糖蛋白的治療失敗可能是由于加速清除具有木糖和/或海藻糖的重組糖蛋白。
因此,需要更好地控制植物中的糖基化,特別是用于治療用途的糖蛋白的糖基化。
定義為了方便本發(fā)明的理解,在本說(shuō)明書中采用多種術(shù)語(yǔ)定義如下。
術(shù)語(yǔ)“載體”是指任何遺傳元件,例如質(zhì)粒、噬菌體、轉(zhuǎn)位子、粘粒、染色體、逆轉(zhuǎn)錄病毒、病毒子、或類似遺傳元件,當(dāng)與恰當(dāng)調(diào)控元件結(jié)合時(shí),其能夠復(fù)制,并將基因序列轉(zhuǎn)移到細(xì)胞內(nèi)和/或在細(xì)胞之間轉(zhuǎn)移。因此,該術(shù)語(yǔ)包括克隆載體和表達(dá)載體,以及病毒載體。
在此所用術(shù)語(yǔ)“表達(dá)載體”是指重組DNA分子,其含有期望的編碼序列—例如下文更加詳細(xì)描述的雜合酶的編碼序列—和在特定宿主細(xì)胞或生物體中表達(dá)可操作連接的編碼序列所必需的適宜核酸序列。原核細(xì)胞中表達(dá)所必需的核酸序列通常包括啟動(dòng)子、操作子(可選擇的)和核糖體結(jié)合位點(diǎn),常常還有其他序列。已知真核細(xì)胞利用啟動(dòng)子、增強(qiáng)子、終止子和聚腺苷?;盘?hào)。這不是將本發(fā)明限制在特定的表達(dá)載體或具有特定元件的表達(dá)載體。
當(dāng)用于涉及細(xì)胞時(shí),術(shù)語(yǔ)“轉(zhuǎn)基因的”是指含有轉(zhuǎn)基因的細(xì)胞,或者其基因組已經(jīng)通過(guò)導(dǎo)入轉(zhuǎn)基因被改變。當(dāng)用于涉及、組織或植物時(shí),術(shù)語(yǔ)“轉(zhuǎn)基因的”分別是指包含轉(zhuǎn)基因的細(xì)胞、組織或植物,其中該組織的一個(gè)或多個(gè)細(xì)胞含有轉(zhuǎn)基因(例如編碼本發(fā)明的雜合酶的基因),或基因組通過(guò)引入轉(zhuǎn)基因而被改變的植物。轉(zhuǎn)基因細(xì)胞、組織和植物可以通過(guò)一些方法制備,包括將包含核酸(通常DNA)的“轉(zhuǎn)基因”導(dǎo)入目標(biāo)細(xì)胞中或者通過(guò)人為介入將轉(zhuǎn)基因整合到目標(biāo)細(xì)胞的染色體中,例如通過(guò)本文描述的方法。
在此所用術(shù)語(yǔ)“轉(zhuǎn)基因”是指任何核酸序列,其通過(guò)試驗(yàn)操作被導(dǎo)入到細(xì)胞的基因組中。轉(zhuǎn)基因可以是“內(nèi)源DNA序列”或“異源DNA序列”(即“外源DNA”)。術(shù)語(yǔ)“內(nèi)源DNA序列”是指天然存在于其被導(dǎo)入的細(xì)胞的核苷酸序列,只要該核苷酸序列不含有相對(duì)于天然序列的修飾(例如點(diǎn)突變、存在選擇性標(biāo)記基因或其他類似修飾)。術(shù)語(yǔ)“異源DNA序列”是指被連接到或者被加工來(lái)連接到一條核酸序列上的核苷酸序列,自然條件下該核苷酸不與該核酸序列連接或者在不同位點(diǎn)上連接。異源DNA對(duì)于其所導(dǎo)入的細(xì)胞來(lái)說(shuō)不是內(nèi)源的,而是得自其他細(xì)胞。異源DNA還包括具有某些修飾的內(nèi)源DNA序列。雖然不是必要地,但是一般地,異源DNA在細(xì)胞中被表達(dá),編碼該細(xì)胞通常不能生產(chǎn)的RNA和蛋白質(zhì)。異源DNA的例子包括報(bào)道基因、轉(zhuǎn)錄和翻譯調(diào)控序列、選擇性標(biāo)記蛋白(如賦予藥物抗性的蛋白)、或其他類似元件。
術(shù)語(yǔ)“外源基因”是指通過(guò)試驗(yàn)操作被導(dǎo)入細(xì)胞基因組的任何核酸(如基因序列),包括存在于該細(xì)胞中的基因序列,只要被導(dǎo)入的基因序列具有相對(duì)于天然序列的某些修飾(例如點(diǎn)突變、存在選擇性標(biāo)記基因或其他類似修飾)。
術(shù)語(yǔ)“融合蛋白”是指其中至少一部分來(lái)自第一種蛋白質(zhì)和另一部分來(lái)自第二種蛋白質(zhì)的蛋白質(zhì)。術(shù)語(yǔ)“雜合酶”是指一種功能性酶的融合蛋白,其中至少一部分是來(lái)自第一種類和另一部分來(lái)自第二種類。本發(fā)明的優(yōu)選雜合酶是功能性糖基轉(zhuǎn)移酶(或其部分),其中至少一部分來(lái)自植物和另一部分來(lái)自哺乳動(dòng)物(如人類)。
術(shù)語(yǔ)“導(dǎo)入細(xì)胞”或“導(dǎo)入宿主細(xì)胞”涉及核酸(如載體)時(shí),是包括本領(lǐng)域所謂的“轉(zhuǎn)化”或“轉(zhuǎn)染”或“轉(zhuǎn)導(dǎo)”。細(xì)胞的轉(zhuǎn)化是穩(wěn)定的或瞬時(shí)的—和本發(fā)明提供在一定條件下導(dǎo)入載體,一方面可以穩(wěn)定表達(dá),另一方面僅僅是瞬時(shí)表達(dá)。術(shù)語(yǔ)“瞬時(shí)轉(zhuǎn)化”或“瞬時(shí)地被轉(zhuǎn)化”是指將一個(gè)或多個(gè)轉(zhuǎn)基因?qū)爰?xì)胞中,而不將轉(zhuǎn)基因整合導(dǎo)宿主細(xì)胞的基因組中。瞬時(shí)轉(zhuǎn)化可以例如通過(guò)酶聯(lián)免疫吸收分析(ELISA)來(lái)檢測(cè),檢測(cè)是否存在由一種或多種轉(zhuǎn)基因編碼的多肽??商娲兀矔r(shí)轉(zhuǎn)化可以通過(guò)檢測(cè)由轉(zhuǎn)基因(如抗體基因)編碼的蛋白質(zhì)的活性(如抗體的抗原結(jié)合)來(lái)檢測(cè)。術(shù)語(yǔ)“瞬時(shí)轉(zhuǎn)化”是指瞬時(shí)并入一種或多種轉(zhuǎn)基因的細(xì)胞。相反,術(shù)語(yǔ)“穩(wěn)定轉(zhuǎn)化”或“穩(wěn)定地被轉(zhuǎn)化”是指將一種或多種轉(zhuǎn)基因?qū)牖蛘系郊?xì)胞的基因組中。細(xì)胞的穩(wěn)定轉(zhuǎn)化可以通過(guò)細(xì)胞的基因組DNA與能夠結(jié)合到一種或多種轉(zhuǎn)基因的核酸序列的Southern印跡雜交來(lái)檢測(cè)??商娲?,細(xì)胞的穩(wěn)定轉(zhuǎn)化還通過(guò)細(xì)胞基因組DNA的聚合酶鏈?zhǔn)椒磻?yīng)(PCR)來(lái)擴(kuò)增轉(zhuǎn)基因序列來(lái)檢測(cè)。術(shù)語(yǔ)“穩(wěn)定轉(zhuǎn)化”是指穩(wěn)定地將一個(gè)或多個(gè)轉(zhuǎn)基因整合到基因組DNA的細(xì)胞。因此,穩(wěn)定轉(zhuǎn)化區(qū)別于瞬時(shí)轉(zhuǎn)化,其中穩(wěn)定轉(zhuǎn)化的基因組DNA含有一種或多種轉(zhuǎn)基因,瞬時(shí)轉(zhuǎn)化的基因組DNA不含有轉(zhuǎn)基因。
術(shù)語(yǔ)“宿主細(xì)胞”包括哺乳動(dòng)物細(xì)胞(如人B細(xì)胞克隆、中國(guó)倉(cāng)鼠卵巢細(xì)胞、肝細(xì)胞)和非哺乳動(dòng)物細(xì)胞(如昆蟲細(xì)胞、細(xì)菌細(xì)胞、植物細(xì)胞)。在一個(gè)實(shí)施方案中,宿主細(xì)胞是哺乳動(dòng)物細(xì)胞,并且導(dǎo)入表達(dá)本發(fā)明的雜合蛋白(如TmGnTII-GalT)的載體抑制(或至少降低)所述哺乳動(dòng)物細(xì)胞中的海藻糖基化(fucosylation)。
術(shù)語(yǔ)“目標(biāo)核苷酸序列”是指任何核苷酸序列,對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō),由于任何原因(如賦予提高質(zhì)量、用于制備治療性蛋白質(zhì)),其處理被認(rèn)為是期望的。這種核苷酸序列包括但不限于結(jié)構(gòu)基因的編碼序列(如報(bào)道基因,選擇標(biāo)記基因、致癌基因、抗體基因、藥物抗性基因、生長(zhǎng)因子和其他類似基因),和不編碼mRNA或蛋白產(chǎn)物的非編碼調(diào)控序列(如啟動(dòng)子序列、聚腺苷酸序列、終止子序列、增強(qiáng)子序列、和其他類似序列)。本發(fā)明提供表達(dá)由目標(biāo)核苷酸序列編碼的異源蛋白的宿主細(xì)胞以及一種或多種雜合酶。
當(dāng)用于涉及核酸時(shí),如在“分離的核酸序列”中,術(shù)語(yǔ)“分離的”是指被鑒定和從一種或多種其他成分中被分離的核酸序列(如從含有該核酸的細(xì)胞中分離,或者從至少一種雜質(zhì)核酸中分離,或者從一種或多種蛋白、一種或多種脂肪中分離),在天然來(lái)源中核酸通常與這些成分結(jié)合在一起。分離的核酸是以不同于其在自然界中見到的形式或裝配(setting)存在的核酸。相反,未被分離的核酸是如以天然存在的狀態(tài)被發(fā)現(xiàn)的DNA和RNA的核酸。例如,在接近于鄰近基因的宿主細(xì)胞染色體上發(fā)現(xiàn)特定的DNA序列(如基因);RNA序列,如編碼特定蛋白質(zhì)的特定mRNA被發(fā)現(xiàn)在細(xì)胞中與大量編碼許多蛋白質(zhì)的其他mRNA混合在一起。但是,包含SEQ ID NO1的分離核酸序列包括,作為例子,通常含有SEQ ID N01的細(xì)胞中這種核酸序列,其中核酸序列在區(qū)別于天然細(xì)胞的染色體的或染色體外的位置上,或者被不同天然存在的核酸序列側(cè)面連接。分離的核酸序列可能以單鏈或雙鏈形式存在。當(dāng)分離的核酸序列被用于表達(dá)蛋白質(zhì)時(shí),該核酸序列將最小地至少含有有義鏈或編碼鏈的一部分(即該核酸序列可以是單鏈的)。可替代地,可以同時(shí)含有有義鏈和反義鏈(即該核酸序列是雙鏈的)。
此處所用術(shù)語(yǔ)“純化的”是指核酸或者氨基酸序列分子,從其天然環(huán)境中被取出,被分離或被分開。因此“分離的核酸序列”是被純化的核酸序列?!盎旧霞兓摹狈肿又辽?0%,優(yōu)選至少70%和更加優(yōu)選的至少90%沒有該分子天然地結(jié)合的其他成分。本發(fā)明提供純化的(包括基本上純化的)和未純化的雜合酶(將在下文中更詳細(xì)描述)。
在此所用術(shù)語(yǔ)“互補(bǔ)的”或“互補(bǔ)性”被用于指根據(jù)堿基配對(duì)原則是相關(guān)的核苷酸序列。例如,序列5’-AGT-3’與序列5’-ACT-3’互補(bǔ)?;パa(bǔ)性可以是“部分的”或“全部的”。“部分”互補(bǔ)性是其中一個(gè)或多個(gè)核苷酸堿基按照堿基配對(duì)原則是不匹配的。兩條核酸之間的“全部的”或者“完全的”互補(bǔ)性是其中每個(gè)核酸堿基依據(jù)堿基配對(duì)原則與另一個(gè)堿基匹配。兩條核酸鏈之間的互補(bǔ)程度顯著地影響核酸鏈之間的雜交效率和強(qiáng)度。
在此所用的核酸序列的“互補(bǔ)物”是指核酸與核酸序列的核酸具有全部互補(bǔ)性的核苷酸序列。例如,本發(fā)明提供SEQ ID NO1,3,5,9,27,28,29,30,31,32,33,34,35,37,38,40,41和43的互補(bǔ)物。
當(dāng)用于涉及核酸時(shí),術(shù)語(yǔ)“同源性”是指互補(bǔ)程度??赡苁遣糠滞葱?即部分同一性)或完全同源性(即完全同一性)。部分互補(bǔ)的序列是至少部分地抑制完全互補(bǔ)的序列雜交到目標(biāo)核酸的序列,參照采用功能術(shù)語(yǔ)“基本上同源的”。可以在低嚴(yán)緊性條件下進(jìn)行雜交分析(Southern或Northern印跡、溶液雜交等)來(lái)檢測(cè)對(duì)完全互補(bǔ)序列與目標(biāo)序列雜交的抑制。在低嚴(yán)緊條件下,基本上同源的序列或探針(即能夠雜交到另一條目標(biāo)寡核苷酸的寡核苷酸)將競(jìng)爭(zhēng)和抑制完全同源的序列結(jié)合(即雜交)到目標(biāo)上。這并不是說(shuō)低嚴(yán)緊條件是可以進(jìn)行非特異性結(jié)合的條件;低嚴(yán)緊條件要求兩條序列相互結(jié)合是特異性的(即選擇性的)互作??梢圆捎蒙踔敛痪哂胁糠只パa(bǔ)性(如小于約30%的同一性)的第二條目標(biāo)序列來(lái)檢測(cè)是否存在非特異性的結(jié)合;沒有非特異性結(jié)合時(shí),探針不會(huì)雜交到第二條非互補(bǔ)的目標(biāo)鏈上。
當(dāng)被用于涉及雙鏈核酸序列如cDNA或基因組克隆時(shí),術(shù)語(yǔ)“基本上同源的”是指在上文描述的低嚴(yán)緊條件下能夠雜交到雙鏈核酸的一條或兩條鏈上的任何探針。
當(dāng)被用于涉及單鏈核酸序列時(shí),術(shù)語(yǔ)“基本上同源的”是指在上文描述的低嚴(yán)緊條件下能夠雜交到單鏈核酸序列上的任何探針。
在此所用術(shù)語(yǔ)“雜交”包括“通過(guò)堿基配對(duì)將核酸的一條鏈結(jié)合到互補(bǔ)的鏈上的任何過(guò)程”[Coombs J(1994)生物工藝學(xué)詞典(Dictionary of Biotechnology),Stockton出版社,紐約]。雜交和雜交強(qiáng)度(即核酸之間的結(jié)合強(qiáng)度)受核酸之間的互補(bǔ)程度、涉及的條件的嚴(yán)緊度、形成的雜合體的Tm、核酸中的G∶C比等因素的影響。
此處所用術(shù)語(yǔ)“Tm”用于指“解鏈溫度”。解鏈溫度是大量雙鏈核酸分子半數(shù)分離成單鏈時(shí)的溫度。計(jì)算核酸的Tm的方程在本領(lǐng)域是熟知的。如標(biāo)準(zhǔn)參考文獻(xiàn)中指出。當(dāng)核酸在1M NaCl的水溶液中時(shí),Tm的簡(jiǎn)單估計(jì)值可以通過(guò)方程Tm=81.5+0.41(%G+C)計(jì)算[見如,Anderson和Young,定量濾過(guò)雜交核酸雜交(Nucleic Acid Hybridization)(1985)]。其他的參考文獻(xiàn)包括更加精確的計(jì)算,將結(jié)構(gòu)特征以及序列特征考慮在內(nèi)來(lái)計(jì)算Tm。
用于涉及核酸雜交時(shí),低嚴(yán)緊條件包含的條件等價(jià)于當(dāng)采用長(zhǎng)度約100到約1000個(gè)核苷酸的DNA探針時(shí),在68℃下在由5X SSPE(鹽、磷酸鈉、EDTA)(43.8g/l NaCl、6.9g/l NaH2PO4·H2O和1.85g/l EDTA(乙二胺四乙酸),用NaOH調(diào)節(jié)pH為7.4),0.1%SDS(十二烷基硫酸鈉),5X Denhardt試劑[每500ml的50XDenhardt中含有5gFicoll(Type400,Pharmacia),5gBSA(牛血清白蛋白)(Fraction V;Sigma)]和100μg/ml變性的鮭魚精子DNA組成的溶液中結(jié)合或雜交,接著室溫下在包含0.2X-2.0X SSPE和0.1%SDS的溶液中洗滌。
用于涉及核酸雜交時(shí),高嚴(yán)緊條件包含的條件等價(jià)于當(dāng)采用長(zhǎng)度約100到約1000個(gè)核苷酸的DNA探針時(shí),在68℃下在由5X SSPE,5X Denhardt試劑和100μg/ml變性的鮭魚精子DNA組成的溶液中結(jié)合或雜交,接著在68℃下在包含0.2X-2.0X SSPE和0.1%SDS的溶液中洗滌。
當(dāng)用于涉及與目標(biāo)雜交條件相關(guān)的雜交條件時(shí),術(shù)語(yǔ)“等價(jià)于”是指雜交條件和目標(biāo)雜交條件引起具有相同范圍的百分同源性的核酸序列的雜交。例如,目標(biāo)雜交條件引起第一條核酸序列與另一條與第一條核酸序列具有50%-70%同源性的核酸序列的雜交,那么,如果另一種雜交條件也引起第一條核酸序列與另一條與第一條核酸序列具有50%-70%同源性的序列雜交,這種雜交條件被認(rèn)為等價(jià)于目標(biāo)雜交條件。
當(dāng)用于涉及核酸雜交時(shí),本領(lǐng)域技術(shù)人員知曉許多等價(jià)條件可被用于構(gòu)成低的或高的嚴(yán)緊條件;考慮如探針的長(zhǎng)度和性質(zhì)(DNA、RNA,堿基組成)和靶點(diǎn)的性質(zhì)(DNA、RNA,堿基組成,存在于溶液中或者是固定的)以及鹽和其他成分濃度(如是否存在甲酰胺、硫酸葡聚糖、聚乙二醇)等因素,而且可以改變雜交溶液來(lái)產(chǎn)生區(qū)別、但等價(jià)于上面所列的條件的低嚴(yán)緊的或高嚴(yán)緊的雜交條件。
在此所用的術(shù)語(yǔ)“啟動(dòng)子”、“啟動(dòng)子元件”或“啟動(dòng)子序列”是指DNA序列,當(dāng)被連接到目標(biāo)核苷酸序列時(shí),能夠控制目標(biāo)核苷酸序列轉(zhuǎn)錄為mRNA。雖然不是必須的,但是啟動(dòng)子通常位于目標(biāo)核苷酸序列的5’端(即上游),該目標(biāo)核苷酸序列轉(zhuǎn)錄成mRNA,啟動(dòng)子控制和提供用于起始轉(zhuǎn)錄的RNA聚合酶和其他轉(zhuǎn)錄因子的特異性結(jié)合位點(diǎn)。
啟動(dòng)子可以是組織特異性的或細(xì)胞特異性的。當(dāng)應(yīng)用于啟動(dòng)子時(shí),術(shù)語(yǔ)“組織特異性的”是指啟動(dòng)子能夠指導(dǎo)目標(biāo)核苷酸序列選擇性地表達(dá)到特定組織類型(如花瓣),而同一目標(biāo)核苷酸序列在不同組織類型中(如根)相對(duì)地不表達(dá)。啟動(dòng)子的組織特異性可以被評(píng)價(jià),如通過(guò)將報(bào)道基因可操作地連接到啟動(dòng)子序列上來(lái)產(chǎn)生報(bào)道構(gòu)建體,將該報(bào)道構(gòu)建體導(dǎo)入植物的基因組中,使得該報(bào)道構(gòu)建體被整合到所得到的轉(zhuǎn)基因植物的每個(gè)組織中,在轉(zhuǎn)基因植物的不同組織中檢測(cè)報(bào)道基因的表達(dá)(如檢測(cè)mRNA、蛋白質(zhì)、或由報(bào)道基因編碼的蛋白質(zhì)的活性)。在一個(gè)或多個(gè)組織中檢測(cè)到比其他組織中報(bào)道基因的表達(dá)水平更高的報(bào)道基因的表達(dá)水平,表明啟動(dòng)子對(duì)于檢測(cè)到較高表達(dá)水平的組織來(lái)說(shuō)是特異的。術(shù)語(yǔ)“細(xì)胞類型特異的”應(yīng)用于啟動(dòng)子是指啟動(dòng)子能夠指導(dǎo)目標(biāo)核苷酸序列在特定類型細(xì)胞中選擇性地表達(dá),而同一目標(biāo)核苷酸序列在相同組織的不同類型的細(xì)胞中相對(duì)地不表達(dá)。術(shù)語(yǔ)“細(xì)胞類型特異的”應(yīng)用于啟動(dòng)子還指啟動(dòng)子能夠促進(jìn)目標(biāo)核苷酸序列在單一組織的某個(gè)區(qū)中選擇性地表達(dá)。啟動(dòng)子的細(xì)胞特異性可以采用本領(lǐng)域熟知的方法來(lái)評(píng)價(jià),如免疫組織化學(xué)染色。簡(jiǎn)而言之,組織切片被包埋在石蠟中,石蠟切片與特異于目標(biāo)核苷酸序列所編碼的多肽產(chǎn)物的第一抗體反應(yīng),該多肽的表達(dá)受啟動(dòng)子調(diào)控。特異于第一抗體的標(biāo)記(如過(guò)氧化物酶偶聯(lián))第二抗體與組織切片結(jié)合,并且通過(guò)顯微鏡檢測(cè)特異性結(jié)合(如用抗生物素蛋白/生物素)。
啟動(dòng)子可以是組成型的或調(diào)控型的。當(dāng)術(shù)語(yǔ)“組成型的”用于涉及啟動(dòng)子時(shí)是指缺乏刺激(如熱休克、化學(xué)藥品、光照或類似刺激)時(shí),啟動(dòng)子能夠指導(dǎo)被可操作連接的核酸序列的轉(zhuǎn)錄。典型地,組成型啟動(dòng)子能夠在幾乎任何細(xì)胞和任何組織中指導(dǎo)轉(zhuǎn)基因的表達(dá)。相反,“調(diào)控型的”啟動(dòng)子是在存在刺激(如熱休克、化學(xué)藥品、光照或類似刺激)時(shí)能夠指導(dǎo)可操作地連接的核酸序列的一定水平的轉(zhuǎn)錄,其不同于缺乏刺激時(shí)的可操作地連接的核酸序列的轉(zhuǎn)錄水平。
術(shù)語(yǔ)用細(xì)菌“感染”(infecting)和“感染”(infection)是指目標(biāo)生物樣本在一定條件下與細(xì)菌共培養(yǎng),使得包含在細(xì)菌內(nèi)的核酸序列被導(dǎo)入目標(biāo)生物樣本的一個(gè)或多個(gè)細(xì)胞中。
術(shù)語(yǔ)“農(nóng)桿菌”是指土壤中產(chǎn)生的、革蘭氏陰性的、桿狀的致植物病細(xì)菌,其引起冠癭病。術(shù)語(yǔ)“農(nóng)桿菌”包括但不限于根癌農(nóng)桿菌(通常在被感染的植物中引起冠癭病)和毛根農(nóng)桿菌(其在被感染的宿主植物中引起發(fā)根疾病)。用農(nóng)桿菌感染植物細(xì)胞通常導(dǎo)致被感染的細(xì)胞生成冠癭堿(如胭脂堿、農(nóng)桿堿、章魚堿)。因此,導(dǎo)致生成胭脂堿的農(nóng)桿菌菌株(如菌株LBA4301、C58、A208)稱作為“胭脂堿型”農(nóng)桿菌;導(dǎo)致生成農(nóng)桿堿的農(nóng)桿菌菌株(如菌株LBA4404、Ach5、B6)稱作為“農(nóng)桿堿型”農(nóng)桿菌;導(dǎo)致生成章魚堿的農(nóng)桿菌菌株(如菌株EHA105、EHA101、A281)稱作為“章魚堿型”農(nóng)桿菌。
術(shù)語(yǔ)“轟擊”(bombarding)、“轟擊”(bombardment)和“基因槍轟擊”(biolistic bombardment)是指加速粒子轟擊目標(biāo)生物樣本(如細(xì)胞、組織、植物的部分如葉子或完整的植物)的方法,來(lái)實(shí)現(xiàn)創(chuàng)傷目標(biāo)生物樣本的細(xì)胞的細(xì)胞膜/或使粒子進(jìn)入目標(biāo)生物樣本?;驑屴Z擊的方法在本領(lǐng)域是已知的(如美國(guó)專利5,584,807和5,141,131,這兩篇專利的內(nèi)容在此引入作為參考),并且可以購(gòu)買得到(如氦氣生成微發(fā)射加速器(PDS-1000/He)(BioRad)。
當(dāng)術(shù)語(yǔ)“微創(chuàng)”(microwounding)用于涉及植物組織時(shí)是指在該組織中引入細(xì)微的創(chuàng)傷。微創(chuàng)可以通過(guò)例如本文描述的粒子轟擊來(lái)實(shí)現(xiàn)。本發(fā)明特別地提供采用微創(chuàng)來(lái)引入核酸的方案。
在此所用的術(shù)語(yǔ)“生物體”是指所用的生物體,并且特別是含有具有N-聯(lián)聚糖的糖蛋白的生物體。
在此所用的術(shù)語(yǔ)“植物”是指充分地分化為存在于植物發(fā)育的任何階段的一種結(jié)構(gòu)的大量植物細(xì)胞。這種結(jié)構(gòu)包括但不限于果實(shí)、芽、莖、根、葉、種子、花瓣或類似結(jié)構(gòu)。術(shù)語(yǔ)“植物組織”包括分化的和未分化的植物組織,包括但不限于根、芽、葉、花粉、種子、瘤組織和各種類型培養(yǎng)細(xì)胞(如單細(xì)胞、原生質(zhì)體、胚胎、愈傷組織、原始球莖樣體和其他類型的細(xì)胞)。植物組織可能是in pLanta的、器官培養(yǎng)、組織培養(yǎng)或細(xì)胞培養(yǎng)中的。類似地,“植物細(xì)胞”可以是培養(yǎng)中的細(xì)胞或是植物的一部分。
糖基轉(zhuǎn)移酶是催化決定細(xì)胞寡糖結(jié)構(gòu)的加工反應(yīng)的酶,包括糖蛋白上的寡糖。在此所用“糖基轉(zhuǎn)移酶”是指包括甘露糖苷酶,既便這些酶修飾聚糖而不“轉(zhuǎn)移”單糖。糖基轉(zhuǎn)移酶具有II型膜定位的特性。每種糖基轉(zhuǎn)移酶由氨基末端細(xì)胞質(zhì)尾區(qū)(以下由一串專門用“X”標(biāo)記氨基酸組成用于說(shuō)明目的—而不是表示該區(qū)的實(shí)際大小)、信號(hào)錨定結(jié)構(gòu)域(以下由一串用“H”標(biāo)記的氨基酸組成表示疏水—而不是說(shuō)明該結(jié)構(gòu)域的實(shí)際大小,也不表示該結(jié)構(gòu)域僅由疏水氨基酸組成)其跨過(guò)細(xì)胞膜(在此稱作“跨膜結(jié)構(gòu)域”)、接著是腔莖(以下用由一串專門用“S”標(biāo)記的氨基酸組成表示—不是表示該區(qū)的實(shí)際大小)或柄區(qū)、和羧基末端的催化結(jié)構(gòu)域(以下用一串專門用“C”標(biāo)記的氨基組成表示—不是表示該結(jié)構(gòu)域的實(shí)際大小NH2-XXXXXXHHHHHHHHSSSSSSSSCCCCCCCC總的來(lái)說(shuō),胞質(zhì)尾區(qū)-跨膜-莖或“CTS”(已經(jīng)在上述示意圖中用下劃線標(biāo)注來(lái)說(shuō)明)(或其部分)可以被用于本發(fā)明提供的實(shí)施方案中,其中催化結(jié)構(gòu)域與來(lái)自其他分子的相應(yīng)催化結(jié)構(gòu)域(或這種區(qū)/結(jié)構(gòu)域的部分)調(diào)換或“交換”來(lái)生成雜合蛋白。
例如,在一個(gè)優(yōu)選實(shí)施方案中,本發(fā)明提供編碼雜合酶的核酸(以及含有這種核酸的載體、含有這種載體的宿主細(xì)胞和雜合酶本身),所述雜合酶至少包含第一個(gè)糖基轉(zhuǎn)移酶(如植物糖基轉(zhuǎn)移酶)的CTS區(qū)的一部分[如,胞質(zhì)尾區(qū)(“C”)、跨膜結(jié)構(gòu)域(“T”)、胞質(zhì)尾區(qū)以及跨膜結(jié)構(gòu)域(“CT”)、跨膜結(jié)構(gòu)域以及莖(“TS”)、或者完整的CTS區(qū)],和至少第二個(gè)糖基轉(zhuǎn)移酶(如哺乳動(dòng)物糖基轉(zhuǎn)移酶)的催化區(qū)的一部分。為了建立這種實(shí)施方案,整個(gè)CTS區(qū)(或其部分)的編碼序列從編碼哺乳動(dòng)物糖基轉(zhuǎn)移酶的核酸中被刪除,用植物糖基轉(zhuǎn)移酶的完整CTS區(qū)(或其部分)的編碼序列取代。另一方面,不同的方法可以被用于建立這種實(shí)施方案;例如,整個(gè)催化結(jié)構(gòu)域(或其部分)的編碼序列從植物糖基轉(zhuǎn)移酶的編碼序列中刪除,并且用哺乳動(dòng)物糖基轉(zhuǎn)移酶的完整催化結(jié)構(gòu)域(或其部分)的編碼序列取代。在這種情況下,得到的雜合酶具有植物糖基轉(zhuǎn)移酶的氨基末端胞質(zhì)尾區(qū),其連接到以野生型植物酶的一般形式連接在植物糖基轉(zhuǎn)移酶的莖干區(qū)的植物糖基轉(zhuǎn)移酶跨膜結(jié)構(gòu)域上—但是莖干區(qū)將被連接到哺乳動(dòng)物糖基轉(zhuǎn)移酶的催化結(jié)構(gòu)域(或其部分)上。
無(wú)意將本發(fā)明僅限于上面描述的兩種方法。包括該方法中的其他改變。例如,為了生成編碼雜合酶的核酸,所述雜合酶包含至少植物糖基轉(zhuǎn)移酶的跨膜區(qū)的一部分和至少哺乳動(dòng)物糖基轉(zhuǎn)移酶催化區(qū)的一部分,可能采用小于CTS區(qū)的整個(gè)編碼序列(如僅植物糖基轉(zhuǎn)移酶的跨膜結(jié)構(gòu)域,或完整的胞質(zhì)尾區(qū)以及全部或部分跨膜結(jié)構(gòu)域,或完整的胞質(zhì)尾區(qū)以及整個(gè)跨膜結(jié)構(gòu)域以及莖干區(qū)的部分)。可以刪除哺乳動(dòng)物的整個(gè)胞質(zhì)尾區(qū)的編碼序列以及跨膜結(jié)構(gòu)域的編碼序列(或其部分)—接著用相應(yīng)的植物糖基轉(zhuǎn)移酶的胞質(zhì)尾區(qū)和跨膜結(jié)構(gòu)域(或其部分)的編碼序列取代。在這種情況下,得到的雜合酶具有連接到植物糖基轉(zhuǎn)移酶跨膜結(jié)構(gòu)域(或其部分)的哺乳動(dòng)物糖基轉(zhuǎn)移酶的莖干區(qū),其接著被連接到植物糖基轉(zhuǎn)移酶的氨基末端的胞質(zhì)尾區(qū)上,而莖干區(qū)被連接到哺乳動(dòng)物糖基轉(zhuǎn)移酶的催化結(jié)構(gòu)域上(即四個(gè)區(qū)/結(jié)構(gòu)域中的兩個(gè)是植物來(lái)源的,而另外兩個(gè)是哺乳動(dòng)物來(lái)源的)。
在另一個(gè)實(shí)施方案中,本發(fā)明提供編碼雜合酶的核酸(以及載體、含有該載體的宿主細(xì)胞、含有該宿主細(xì)胞的植物或植物部分),所述雜合酶包含至少植物糖基轉(zhuǎn)移酶的氨基末端的胞質(zhì)尾區(qū)的一部分和至少哺乳動(dòng)物糖基轉(zhuǎn)移酶的催化區(qū)的一部分。在該實(shí)施方案中,由核酸編碼的雜合酶可能含有或不含有其他植物序列(如跨膜結(jié)構(gòu)域或其部分、莖干區(qū)或其部分)。例如,為了建立該實(shí)施方案,整個(gè)胞質(zhì)尾區(qū)(或其部分)的編碼序列被從編碼哺乳動(dòng)物糖基轉(zhuǎn)移酶的核酸中刪除,并且用植物糖基轉(zhuǎn)移酶的整個(gè)胞質(zhì)尾區(qū)結(jié)構(gòu)域(或其部分)的編碼序列取代。在這種情況下,得到的雜合酶具有連接到哺乳動(dòng)物糖基轉(zhuǎn)移酶跨膜結(jié)構(gòu)域的植物糖基轉(zhuǎn)移酶的氨基末端的胞質(zhì)尾區(qū)(或其部分),其接著被連接到哺乳動(dòng)物糖基轉(zhuǎn)移酶的莖干區(qū)上,該莖干區(qū)被連接到哺乳動(dòng)物的催化結(jié)構(gòu)域上。另一方面,采用不同的方法來(lái)建立該實(shí)施方案;例如,整個(gè)催化結(jié)構(gòu)域(或其部分)的編碼序列從植物糖基轉(zhuǎn)移酶的編碼序列中刪除,并且用哺乳動(dòng)物糖基轉(zhuǎn)移酶的整個(gè)催化結(jié)構(gòu)域(或其部分)的編碼序列取代。在這種情況下,得到的雜合酶以野生型植物酶的方式,植物糖基轉(zhuǎn)移酶的氨基末端的胞質(zhì)尾區(qū)被連接到植物糖基轉(zhuǎn)移酶的跨膜結(jié)構(gòu)域,跨膜結(jié)構(gòu)域連接到植物糖基轉(zhuǎn)移酶的莖干區(qū),但是莖干區(qū)將被連接到哺乳動(dòng)物糖基轉(zhuǎn)移酶的催化結(jié)構(gòu)域(或其部分)。
在上述討論中,采用用語(yǔ)“或其部分”特別指在特定情況下可以使用小于完整的區(qū)/結(jié)構(gòu)域(如可以使用一個(gè)片段)。例如,糖基轉(zhuǎn)移酶的胞質(zhì)尾區(qū)長(zhǎng)度范圍在5-50個(gè)氨基酸,更典型的是15-30個(gè)氨基酸,這取決于特定的轉(zhuǎn)移酶。胞質(zhì)尾區(qū)的“一部分”在此定義為不少于四個(gè)氨基酸,并且可以達(dá)到比該區(qū)/結(jié)構(gòu)域全長(zhǎng)少一個(gè)氨基酸。期望部分的功能在某種意義上類似于全長(zhǎng)的區(qū)/結(jié)構(gòu)域—但不必起到相同程度的功能。例如,在一定程度上,全長(zhǎng)胞質(zhì)尾區(qū)作為高爾基滯留區(qū)或內(nèi)質(zhì)網(wǎng)滯留信號(hào),期望在上述實(shí)施方案中采用的部分還作為高爾基或內(nèi)質(zhì)網(wǎng)滯留區(qū),雖然可能不如全長(zhǎng)區(qū)一樣有效。
類似地,跨膜結(jié)構(gòu)域的長(zhǎng)度典型地為15-25個(gè)氨基酸,主要由疏水氨基酸組成。跨膜結(jié)構(gòu)域的一部分在此定義為不少于10個(gè)氨基酸,可以達(dá)到用比全長(zhǎng)的區(qū)/結(jié)構(gòu)域少一個(gè)氨基酸(對(duì)于特定轉(zhuǎn)移酶)的長(zhǎng)度。期望部分功能在某種意義上類似于全長(zhǎng)的區(qū)/結(jié)構(gòu)域—但不必起到相同程度的功能。例如,在一定程度上,全長(zhǎng)跨膜區(qū)作為高爾基滯留區(qū)或內(nèi)質(zhì)網(wǎng)滯留信號(hào),期望在上述實(shí)施方案中采用的部分還作為高爾基或內(nèi)質(zhì)網(wǎng)保留區(qū),雖然可能不如全長(zhǎng)區(qū)一樣有效。本發(fā)明特別提供保守性取代來(lái)生成野生型跨膜結(jié)構(gòu)域或其部分的變體。例如,本發(fā)明提供用一個(gè)或多個(gè)不同的氨基酸,優(yōu)選還是疏水性氨基酸,來(lái)取代一個(gè)或多個(gè)疏水性氨基酸(在上述方案中表示為“H”)。
催化結(jié)構(gòu)域的一部分可以比該結(jié)構(gòu)域的全長(zhǎng)少一個(gè)氨基酸。雖然,催化結(jié)構(gòu)域來(lái)自β1,4-半乳糖基轉(zhuǎn)移酶,優(yōu)選該部分包括最小殘基345-365,一般認(rèn)為其參與產(chǎn)生寡糖受體結(jié)合位點(diǎn)的構(gòu)象(優(yōu)選該部分最小包括這個(gè)區(qū),并且兩側(cè)有5-10個(gè)氨基酸以保證正確的構(gòu)象)。
本發(fā)明還提供合成的CTS區(qū)和其部分。CTS的“一部分”必須至少包括一個(gè)(可以包括一個(gè)以上)完整的結(jié)構(gòu)域(如完整的跨膜結(jié)構(gòu)域),但小于整個(gè)CTS區(qū)。
重要的是,使用術(shù)語(yǔ)“CTS區(qū)”或“跨膜結(jié)構(gòu)域”并不是說(shuō)僅包括野生型的序列。事實(shí)上,本發(fā)明不限于天然的糖基轉(zhuǎn)移酶和參與糖基化的酶,還包括采用具有相同或相似功能的合成酶。在一個(gè)實(shí)施方案中,野生型結(jié)構(gòu)域被改變(如通過(guò)缺失、插入、取代等)。
最后,當(dāng)涉及特定雜合體(如″TmXyl-)時(shí)使用指示“Tm”,包括完整的跨膜/CTS結(jié)構(gòu)域(改變或未改變野生型序列)以及部分(改變或未改變野生型序列)。
發(fā)明概述本發(fā)明提供編碼雜合酶(或“融合蛋白”)的核酸(DNA或RNA)、含有這種核酸的載體、含有這種載體的表達(dá)雜合酶的宿主細(xì)胞(包括但不限于植物組織和整個(gè)植物中的細(xì)胞),和分離的雜合酶本身。在一個(gè)實(shí)施方案中,所述雜合酶(或“融合蛋白”)的表達(dá)導(dǎo)致糖基化的改變,例如,但不限于糖成分如木糖、海藻糖、LewisA/B/X或其他糖結(jié)構(gòu)的下降,妨礙期望的糖型的沉積。在一個(gè)實(shí)施方案中,本發(fā)明提供編碼雜合酶的核酸,所述雜合酶包含糖基轉(zhuǎn)移酶(包括但不限于植物糖基轉(zhuǎn)移酶)的CTS區(qū)(或其部分)和非植物糖基轉(zhuǎn)移酶(如哺乳動(dòng)物、魚、兩棲類、真菌)的糖基轉(zhuǎn)移酶的催化區(qū)(或其部分)。優(yōu)選地,當(dāng)被表達(dá)時(shí)CTS區(qū)(或其部分)被(直接或間接地)可操作結(jié)合地連接到所述催化區(qū)(或其部分)。連接優(yōu)選是共價(jià)的,而結(jié)合是可操作的,其中催化區(qū)具有催化功能(即使所述催化功能相對(duì)于野生型酶降低了)。連接的方式是使得不插入氨基酸或其他區(qū)/結(jié)構(gòu)域。另一方面,進(jìn)行連接使得在兩者之間插入氨基酸(或其他化學(xué)基團(tuán))和/或其他區(qū)/結(jié)構(gòu)域。當(dāng)然,用于制備編碼上述雜合酶的核酸的核酸可以由酶促?gòu)奶烊恍蛄?如基因組DNA、cDNA等)獲得或者可選擇地采用參比序列(如電子的或硬拷貝的序列)作為向?qū)Ш铣伞?br>
在一個(gè)特定的實(shí)施方案中,本發(fā)明提供編碼雜合酶的核酸,所述雜合酶包括植物糖基轉(zhuǎn)移酶的跨膜區(qū)(如至少一個(gè)跨膜區(qū)和可選擇地CTS區(qū)的多個(gè)區(qū))和非植物(如哺乳動(dòng)物)糖基轉(zhuǎn)移酶的催化區(qū)(或其部分)。此外,優(yōu)選當(dāng)被表達(dá)時(shí),這些區(qū)域被可操作結(jié)合地(直接或間接)連接。在還有一個(gè)實(shí)施方案中,本發(fā)明提供編碼雜合酶的核酸,所述雜合酶包括植物糖基轉(zhuǎn)移酶的跨膜結(jié)構(gòu)域(或其部分)和哺乳動(dòng)物糖基轉(zhuǎn)移酶的催化區(qū)(或其部分)。另外,優(yōu)選當(dāng)被表達(dá)時(shí),這些區(qū)域以可操作結(jié)合被(直接或間接地)連接。
無(wú)意將本發(fā)明限定于特定的轉(zhuǎn)移酶。在一個(gè)實(shí)施方案中,植物糖基轉(zhuǎn)移酶是木糖基轉(zhuǎn)移酶。在另一個(gè)實(shí)施方案中,植物糖基轉(zhuǎn)移酶是N-乙酰葡糖胺基轉(zhuǎn)移酶(N-acetylglucosaminyltransferase)。在另一個(gè)實(shí)施方案中,植物糖基轉(zhuǎn)移酶是海藻糖基轉(zhuǎn)移酶。在一個(gè)優(yōu)選實(shí)施方案中,哺乳動(dòng)物糖基轉(zhuǎn)移酶是人半乳糖基轉(zhuǎn)移酶(如由SEQ ID NO1編碼的人β1,4-半乳糖基轉(zhuǎn)移酶,其中編碼跨膜結(jié)構(gòu)域的核苷酸被刪除和取代)。
無(wú)意將本發(fā)明限制于使用植物來(lái)源的糖基轉(zhuǎn)移酶CTS結(jié)構(gòu)域和人糖基轉(zhuǎn)移酶催化結(jié)構(gòu)域,而是反之亦然,采用糖基轉(zhuǎn)移酶的任何CTS-結(jié)構(gòu)域與至少另一種糖基轉(zhuǎn)移酶的催化片段結(jié)合。事實(shí)上,在一個(gè)實(shí)施方案中,本發(fā)明廣泛地包括編碼雜合酶的核酸,所述雜合酶包含第一個(gè)糖基轉(zhuǎn)移酶的跨膜區(qū)和第二個(gè)糖基轉(zhuǎn)移酶的催化區(qū)。優(yōu)選地,所述第一個(gè)和第二個(gè)糖基轉(zhuǎn)移酶是來(lái)自不同種類(可以來(lái)自不同屬或甚至來(lái)自不同的門)。在一個(gè)實(shí)施方案中,所述第一個(gè)糖基轉(zhuǎn)移酶包含植物糖基轉(zhuǎn)移酶。在另一個(gè)實(shí)施方案中,所述植物糖基轉(zhuǎn)移酶是木糖基轉(zhuǎn)移酶。在還有一個(gè)實(shí)施方案中,所述植物糖基轉(zhuǎn)移酶是海藻糖基轉(zhuǎn)移酶。在一個(gè)優(yōu)選實(shí)施方案中,所述第二個(gè)糖基轉(zhuǎn)移酶包含哺乳動(dòng)物糖基轉(zhuǎn)移酶。在一個(gè)特別優(yōu)選的實(shí)施方案中,所述糖基轉(zhuǎn)移酶是人半乳糖基轉(zhuǎn)移酶。
無(wú)意將本發(fā)明限制在第一和第二個(gè)糖基轉(zhuǎn)移酶分別是植物的和非植物的情況。在一個(gè)實(shí)施方案中,所述第一個(gè)糖基轉(zhuǎn)移酶包含第一個(gè)哺乳動(dòng)物糖基轉(zhuǎn)移酶和所述第二個(gè)糖基轉(zhuǎn)移酶包含第二個(gè)哺乳動(dòng)物糖基轉(zhuǎn)移酶。在優(yōu)選實(shí)施方案中,所述第一個(gè)哺乳動(dòng)物糖基轉(zhuǎn)移酶是非人類的糖基轉(zhuǎn)移酶,所述第二個(gè)哺乳動(dòng)物的糖基轉(zhuǎn)移酶是人糖基轉(zhuǎn)移酶。
無(wú)意將本發(fā)明限制在載體類型。在一個(gè)實(shí)施方案中,本發(fā)明提供包含編碼上述雜合酶的核酸的表達(dá)載體。
也無(wú)意將本發(fā)明限制于宿主細(xì)胞的類型。各種原核的和真核的宿主細(xì)胞可以購(gòu)買到,用于表達(dá)蛋白。在一個(gè)實(shí)施方案中,本發(fā)明提供含有包含編碼上述雜合酶的核酸的載體的宿主細(xì)胞(含有或不含有其他載體或其他編碼其他雜合酶或糖基轉(zhuǎn)移酶的核酸)。在一個(gè)優(yōu)選實(shí)施方案中,宿主細(xì)胞是植物細(xì)胞。在特別優(yōu)選的實(shí)施方案中,本發(fā)明提供一種包含這種宿主細(xì)胞的植物。
無(wú)意將本發(fā)明限制在使宿主細(xì)胞表達(dá)本發(fā)明的雜合酶的方法。在一個(gè)實(shí)施方案中,本發(fā)明提供一種方法包含a)提供i)一種宿主細(xì)胞(如植物細(xì)胞,或者是培養(yǎng)的或是植物組織的部分或甚至是完整生長(zhǎng)植物的部分),和ii)一種包含編碼雜合酶的核酸的表達(dá)載體,所述雜合酶包含至少植物糖基轉(zhuǎn)移酶的CTS區(qū)的一部分(如跨膜結(jié)構(gòu)域)和至少哺乳動(dòng)物糖基轉(zhuǎn)移酶的催化區(qū)的一部分;和b)在一定條件下,將所述表達(dá)載體導(dǎo)入所述植物細(xì)胞中,使得所述雜合酶被表達(dá)。此外,無(wú)意將本發(fā)明限定于特定的轉(zhuǎn)移酶。在一個(gè)實(shí)施方案中,用于上述方法中的植物糖基轉(zhuǎn)移酶是木糖基轉(zhuǎn)移酶。在另一個(gè)實(shí)施方案中,植物糖基轉(zhuǎn)移酶是N-乙酰葡糖胺基轉(zhuǎn)移酶。在另一個(gè)實(shí)施方案中,植物糖基轉(zhuǎn)移酶是海藻糖基轉(zhuǎn)移酶。在一個(gè)優(yōu)選實(shí)施方案中,被用于實(shí)施方法的哺乳動(dòng)物糖基轉(zhuǎn)移酶是人半乳糖基轉(zhuǎn)移酶(如由SEQ ID NO1編碼的人β1,4-半乳糖基轉(zhuǎn)移酶,其中編碼跨膜結(jié)構(gòu)域的核苷酸被刪除和取代)(或簡(jiǎn)而言之,其中SEQ ID NO1中編碼催化結(jié)構(gòu)域或其部分的核苷酸被取出并連接到編碼植物糖基轉(zhuǎn)移酶的CTS區(qū)或其部分的核苷酸上)。
無(wú)意將本發(fā)明限制在用上述雜合酶控制異源蛋白的糖基化的特定方案中。在一個(gè)實(shí)施方案中,本發(fā)明提供一種方法,包含a)提供i)一種宿主細(xì)胞(如植物細(xì)胞),ii)包含編碼雜合酶的核酸的第一種表達(dá)載體,所述雜合酶包含至少第一個(gè)(如植物)糖基轉(zhuǎn)移酶的CTS區(qū)的一部分(如至少跨膜結(jié)構(gòu)域)和至少第二個(gè)(如哺乳動(dòng)物)糖基轉(zhuǎn)移酶的催化區(qū)的一部分;和iii)包含編碼異源糖蛋白(或其部分)的核酸的第二個(gè)表達(dá)載體;和b)在一定條件下,將所述第一個(gè)和第二個(gè)表達(dá)載體導(dǎo)入所述植物細(xì)胞中,使得所述雜合酶和所述異源蛋白被表達(dá)??蛇x擇地,采用具有編碼雜合酶(或多種雜合酶)和異源糖蛋白的核酸的單一載體。無(wú)論采用何種方法,在一個(gè)實(shí)施方案中,本發(fā)明包括分離異源蛋白以及被分離的蛋白本身作為一種組合物的額外步驟(c)。
另一方面,本發(fā)明還包括將不同載體導(dǎo)入不同植物細(xì)胞(無(wú)論是培養(yǎng)中的細(xì)胞、植物組織的部分、或甚至是完整生長(zhǎng)植物的部分)。在一個(gè)實(shí)施方案中,本發(fā)明提供一種方法,包括a)提供i)包含第一種表達(dá)載體的第一種植物,所述第一個(gè)載體包含編碼雜合酶(或編碼兩種或兩種以上雜合酶)的核酸,所述雜合酶包含至少植物糖基轉(zhuǎn)移酶的CTS區(qū)的一部分(如約N-末端的前40-60個(gè)氨基酸)和至少哺乳動(dòng)物糖基轉(zhuǎn)移酶的催化區(qū)的一部分,和ii)包含第二個(gè)表達(dá)載體的第二種植物,所述第二個(gè)載體包含編碼異源蛋白(或其部分)的核酸;和雜交所述第一種植物和第二種植物來(lái)制備表達(dá)所述雜合酶和所述異源蛋白的子代。當(dāng)然,這種子代可以被分離、生長(zhǎng)和分析是否存在各種(或兩種)蛋白。事實(shí)上,異源蛋白(典型地首先被純化,基本上不含有植物細(xì)胞物質(zhì))可被治療性地(如施用給人或動(dòng)物,無(wú)論通過(guò)口服、靜脈內(nèi)、經(jīng)皮膚或者其他施用路徑)用于治療或預(yù)防疾病。
無(wú)意將本發(fā)明限制在特定的異源蛋白。在一個(gè)實(shí)施方案中,提供任何對(duì)宿主細(xì)胞(或生物體)來(lái)說(shuō)不是內(nèi)源的肽或蛋白。在一個(gè)實(shí)施方案中,異源蛋白是抗體或抗體片段。在特別優(yōu)選實(shí)施方案中,抗體是在植物中高產(chǎn)量地表達(dá)的人抗體或“人源化的”抗體?!叭嗽椿摹笨贵w通常從非人抗體(如嚙齒類抗體)中制備,將非人類的抗體的超變區(qū)(也稱作CDRs)取出,并將它們“移植”到人的構(gòu)架中。整個(gè)操作可以是人工的(假設(shè)序列是已知的),可以從共同的人的構(gòu)架的數(shù)據(jù)庫(kù)中選擇構(gòu)架。多數(shù)情況下,除非架構(gòu)序列被修飾或CDRs被修飾,否則制備過(guò)程中會(huì)損失親合性。實(shí)際上,當(dāng)CDRs被系統(tǒng)地突變(例如,通過(guò)隨機(jī)化操作)和試驗(yàn)時(shí),可以反映親合性升高。
本發(fā)明上下文中的異源蛋白是特別有用的,在一個(gè)實(shí)施方案中,本發(fā)明的雜合酶可用于改變內(nèi)源性蛋白的糖基化,即通常由宿主細(xì)胞或生物體表達(dá)的蛋白。
本發(fā)明特別包括植物本身。在一個(gè)實(shí)施方案中,本發(fā)明提供包含第一個(gè)和第二個(gè)表達(dá)載體的植物,所述第一個(gè)載體包含編碼雜合酶的核酸,所述雜合酶包含至少植物糖基轉(zhuǎn)移酶的CTS區(qū)的一部分(如胞質(zhì)尾區(qū)以及至少跨膜結(jié)構(gòu)域的一部分)和至少哺乳動(dòng)物糖基轉(zhuǎn)移酶的催化區(qū)的一部分,所述第二個(gè)表達(dá)載體包含編碼異源蛋白(或其部分)的核酸。在一個(gè)優(yōu)選實(shí)施方案中,通過(guò)與本發(fā)明的雜合酶(或多種雜合酶)一起表達(dá),異源蛋白與在缺乏雜合酶(或多種雜合酶)的植物中異源蛋白的表達(dá)相比,表現(xiàn)為α1,3-海藻糖基化下降(10%-99%)(甚至無(wú)海藻糖基化)。在一個(gè)優(yōu)選實(shí)施方案中,通過(guò)與本發(fā)明的雜合酶(或多種雜合酶)一起表達(dá),異源蛋白與在缺乏雜合酶(或多種雜合酶)的植物中異源蛋白的表達(dá)相比,表現(xiàn)為木糖基化下降(10%-99%)(甚至無(wú)木糖基化)。在一個(gè)優(yōu)選實(shí)施方案中,通過(guò)與本發(fā)明的雜合酶(或多種雜合酶)一起表達(dá),異源蛋白與在缺乏雜合酶(或多種雜合酶)的植物中異源蛋白的表達(dá)相比,表現(xiàn)為海藻糖和木糖都下降。
無(wú)意將本發(fā)明限制在實(shí)現(xiàn)降低海藻糖和/或木糖的特定理論中。關(guān)于植物中的亞高爾基分類機(jī)制知道得極少。由于哺乳動(dòng)物特異的β(1,4)-半乳糖基轉(zhuǎn)移酶(GaIT)產(chǎn)生通常未見于植物中的聚糖結(jié)構(gòu),其已經(jīng)被用作最佳第一標(biāo)記來(lái)研究這種表型(見下文實(shí)施例)。表達(dá)半乳糖基轉(zhuǎn)移酶的植物的聚糖結(jié)構(gòu)已經(jīng)與來(lái)自表達(dá)嵌合半乳糖基轉(zhuǎn)移酶的植物的聚糖結(jié)構(gòu)比較,其CTS結(jié)構(gòu)域換成了植物木糖基轉(zhuǎn)移酶的CTS結(jié)構(gòu)域(或其部分)。觀察到的聚糖結(jié)構(gòu)的變化表明半乳糖基轉(zhuǎn)移酶在哺乳動(dòng)物中局限在植物高爾基的亞區(qū)室。不將本發(fā)明限制于任何特定機(jī)制,植物和哺乳動(dòng)物的分類機(jī)制在某種程度上顯然是保守的,植物不識(shí)別的糖基轉(zhuǎn)移酶被運(yùn)載到高爾基中的特定類似位置上。該位置在內(nèi)源性木糖基、海藻糖基和GlcNAcTII(GnTII)轉(zhuǎn)移酶的位置之后。
這些表達(dá)再定位的GalT變體的植物中的N-聚糖含有極少的木糖和海藻糖,這種發(fā)現(xiàn)也是具有生物技術(shù)相關(guān)性的。對(duì)于用于在哺乳動(dòng)物如人中的治療用途的糖蛋白,本發(fā)明的一些實(shí)施方案中的方法提供用于在植物中控制糖蛋白的N聯(lián)糖基化的方法和組合物,使得可以得到一種糖蛋白,其基本上不含有木糖和海藻糖,而含有至少一個(gè)雙觸角N-聚糖(但不限于雙觸角,還包括三觸角等)和在N-聚糖的至少一個(gè)臂上的(至少一個(gè))半乳糖殘基。因此,無(wú)意將本發(fā)明限制在雙觸角N-聚糖,而是包括平分的雙觸角N-聚糖、三觸角N-聚糖等。此外,本發(fā)明不限于復(fù)合型的N-聚糖,還包括雜合型的N-聚糖以及其他類型的N-聚糖。本發(fā)明包括這種生成的糖蛋白。此外,本發(fā)明的方法和組合物可以被應(yīng)用于植物和非植物系統(tǒng),其中除了木糖、海藻糖之外,LewisA/B/X類型的N-聚糖修飾物(β1-3-GalT、α1-4-FucT等)或其他糖類干擾期望的糖型的沉積。
在一個(gè)實(shí)施方案中,本發(fā)明提供通過(guò)調(diào)節(jié)參與高爾基體中聚糖生物合成的酶的定位來(lái)控制植物的N聯(lián)糖基化。特別地,本發(fā)明的實(shí)施方案是在植物宿主體系中制備糖蛋白的方法,包括(a)阻止(或抑制)在所述糖蛋白的聚糖核心中增加木糖和海藻糖和(b)在所述臂上添加一個(gè),優(yōu)選兩個(gè)半乳糖殘基。該糖蛋白具有雙觸角聚糖,在至少一個(gè)臂上含有至少一個(gè)半乳糖殘基,不含有(或降低)木糖和海藻糖。
通過(guò)將編碼雜合酶的核酸導(dǎo)入到所述植物宿主系統(tǒng)中,可以減少或甚至阻止向所述異源糖蛋白中添加木糖和海藻糖,該雜合酶包含一種蛋白特別是一種酶如植物木糖基轉(zhuǎn)移酶的CTS區(qū)(或其部分)和通常不存在于植物的半乳糖基轉(zhuǎn)移酶或者其中跨膜部分被去除而插入內(nèi)質(zhì)網(wǎng)滯留信號(hào)的被修飾的半乳糖基轉(zhuǎn)移酶的催化區(qū)(或其部分),其中所述蛋白質(zhì)或酶早期在所述植物宿主系統(tǒng)中的植物細(xì)胞的高爾基體中起作用,而不是作為所述半乳糖基轉(zhuǎn)移酶。優(yōu)選半乳糖基轉(zhuǎn)移酶是哺乳動(dòng)物半乳糖基轉(zhuǎn)移酶,特別是人半乳糖基轉(zhuǎn)移酶。在最特別的實(shí)施方案中,所述半乳糖基轉(zhuǎn)移酶是人β1,4-半乳糖基轉(zhuǎn)移酶(GalT)。在一個(gè)優(yōu)選的實(shí)施方案中,所述木糖基轉(zhuǎn)移酶是β1,2-木糖基轉(zhuǎn)移酶。用于替換哺乳動(dòng)物糖基轉(zhuǎn)移酶(如半乳糖基轉(zhuǎn)移酶)的CTS區(qū)或CTS片段的是早期在高爾基體中起作用而不是作為半乳糖基轉(zhuǎn)移酶的酶之一,包括但不限于導(dǎo)致含有不期望的木糖和海藻糖殘基的聚糖的顯著降低的XylT、FucT、GnTI、GnTII、GnTIII、GnTIV、GnTV、GnTVI、ManI、ManII和ManIII(見附圖2)。此外,半乳糖基化增加而聚糖多樣性降低。雖然不限于任何特定的機(jī)制,既不含有木糖也不含有海藻糖的半乳糖基化的聚糖增加被認(rèn)為主要是由于GalGNMan5、GNMan5或GaIGNMan4沉積。此外,半乳糖基化僅在一個(gè)聚糖臂上發(fā)生。顯然,高爾基中早期的半乳糖基化抑制由甘露糖酶II(ManII)將所述糖型修飾為的GaIGNMan3。還抑制由GlcNAcTII(GnTII)增加第二個(gè)GlcNAc。
因此,在一個(gè)實(shí)施方案中,包括獲得期望的雙臂被半乳糖基化而基本上不含有木糖和海藻糖的糖蛋白的其他步驟。因此,在一個(gè)實(shí)施方案中,如上指出的本發(fā)明的方法還包含增加半乳糖殘基到所述糖蛋白的臂上(見附圖3)。在本發(fā)明的一個(gè)實(shí)施方案中,半乳糖殘基被加到兩個(gè)臂上,采取往所述植物宿主系統(tǒng)中導(dǎo)入(a)編碼包含GnTI的CTS區(qū)(或片段,如包括跨膜結(jié)構(gòu)域的片段)和GnTII的活性結(jié)構(gòu)域(或其部分)的第一個(gè)雜合酶的核酸序列;(b)編碼包含GnTI的CTS區(qū)(或片段,如包括跨膜結(jié)構(gòu)域的片段)和ManII的活性結(jié)構(gòu)域的第二個(gè)雜合酶的核酸序列;和(c)編碼包含XylT的CTS區(qū)(或片段,如包括跨膜結(jié)構(gòu)域的片段)和人半乳糖基轉(zhuǎn)移酶(TmXyl-GaIT)的活性結(jié)構(gòu)域(或其部分)的第三個(gè)雜合酶的核酸序列。在本發(fā)明的另一個(gè)實(shí)施方案中,半乳糖殘基被增加到雙臂上,通過(guò)往所述植物宿主系統(tǒng)中導(dǎo)入(a)編碼包含ManI的CTS區(qū)(或片段,如包括跨膜結(jié)構(gòu)域的片段)和GnTI的活性結(jié)構(gòu)域(或其部分)的第一個(gè)雜合酶的核酸序列;b)編碼包含ManI的CTS區(qū)(或片段,如包括跨膜結(jié)構(gòu)域的片段)和GnTII的活性結(jié)構(gòu)域(或其部分)的第二個(gè)雜合酶的核酸序列;(c)編碼包含ManI的CTS區(qū)(或片段,如包括跨膜結(jié)構(gòu)域的片段)和ManII的活性結(jié)構(gòu)域(或其部分)的第三個(gè)雜合酶的核酸序列和(d)編碼包含XylT的CTS區(qū)(或片段,如包括跨膜結(jié)構(gòu)域的片段)和人半乳糖基轉(zhuǎn)移酶(TmXyl-GalT)的活性結(jié)構(gòu)域(或其部分)的第四個(gè)雜合酶的核酸序列。
無(wú)意將本發(fā)明限制于特定的雜合酶的組合或者應(yīng)用在單個(gè)細(xì)胞、植物組織或植物中的這種雜合酶的數(shù)量中。在一個(gè)優(yōu)選實(shí)施方案中,本發(fā)明包括表達(dá)TmXyl-GaIT和TmGnTI-GnTII及TmGnTI-ManII的宿主細(xì)胞。在本發(fā)明的一個(gè)實(shí)施方案中,半乳糖殘基被增加到所述臂,通過(guò)往所述植物宿主系統(tǒng)中導(dǎo)入(a)編碼包含一種蛋白特別是一種酶包括但不限于N-乙酰葡糖胺基轉(zhuǎn)移酶I(GnTI)的CTS區(qū)(或其片段)和甘露糖苷酶II(ManII)的催化區(qū)(或其部分)的第一個(gè)雜合酶的核酸序列,其中所述酶早期在所述植物宿主系統(tǒng)中的植物細(xì)胞的高爾基體中起作用,而不是作為甘露糖苷酶II或者其中跨膜部分被刪除而插入內(nèi)質(zhì)網(wǎng)滯留信號(hào)的被修飾的甘露糖苷酶II和(b)編碼包含包括但不限于N-乙酰葡糖胺基轉(zhuǎn)移酶I(GnTI)的CTS區(qū)(或片段,如包括跨膜結(jié)構(gòu)域的片段)和N-乙酰葡糖胺基轉(zhuǎn)移酶II(GnTII)的催化區(qū)(或其部分)的第二個(gè)雜合酶的核酸序列,其中所述酶早期在所述植物宿主系統(tǒng)中的植物細(xì)胞的高爾基體中起作用,而不是作為N-乙酰葡糖胺基轉(zhuǎn)移酶II(GnTII)或者其中跨膜部分被刪除而插入內(nèi)質(zhì)網(wǎng)滯留信號(hào)的被修飾的N-乙酰葡糖胺基轉(zhuǎn)移酶II(GnTII)。編碼N-乙酰葡糖胺基轉(zhuǎn)移酶或甘露糖苷酶或所述跨膜片段的序列來(lái)自植物或來(lái)自真核的非植物生物體(如哺乳動(dòng)物)。
還有在另一個(gè)優(yōu)選實(shí)施方案中,本發(fā)明包括表達(dá)TmXyl-GaIT和TmGnTI-GnTI及TmGnTI-ManII和TmGnTI-GnTII的宿主細(xì)胞。在本發(fā)明的另一個(gè)實(shí)施方案中,半乳糖殘基被添加到所述臂,通過(guò)往所述植物宿主系統(tǒng)中導(dǎo)入(a)編碼包含一種蛋白特別是一種酶包括但不限于甘露糖苷酶I(ManI)的CTS區(qū)(或其片段,如包括跨膜結(jié)構(gòu)域的片段)和N-乙酰葡糖胺基轉(zhuǎn)移酶I(GnTI)的催化區(qū)(或其部分)的第一個(gè)雜合酶的核酸序列,其中所述酶早期在所述植物宿主系統(tǒng)中的植物細(xì)胞的高爾基體中起作用,而不是作為N-乙酰葡糖胺基轉(zhuǎn)移酶I(GnTI)或者其中跨膜部分被刪除而插入內(nèi)質(zhì)網(wǎng)滯留信號(hào)的被修飾的N-乙酰葡糖胺基轉(zhuǎn)移酶I(GnTI)和(b)編碼包含包括一種酶但不限于甘露糖苷酶I(ManI)的CTS區(qū)(或片段,如包括跨膜結(jié)構(gòu)域的片段)和甘露糖苷酶II(ManII)的催化區(qū)(或其部分)的第二個(gè)雜合酶的核酸序列,其中所述酶早期在所述植物宿主系統(tǒng)中的植物細(xì)胞的高爾基體中起作用,而不是作為甘露糖苷酶II(ManII)或者其中跨膜部分被刪除而插入內(nèi)質(zhì)網(wǎng)滯留信號(hào)的被修飾的甘露糖苷酶II(ManII)和(c)編碼包含包括一種酶但不限于甘露糖苷酶I(ManI)的CTS區(qū)(或片段,如包括跨膜結(jié)構(gòu)域的片段)和N-乙酰葡糖胺基轉(zhuǎn)移酶II(GnTII)的催化區(qū)(或其部分)的第三個(gè)雜合酶的核酸序列,其中所述酶早期在所述植物宿主系統(tǒng)中的植物細(xì)胞的高爾基體中起作用,而不是作為N-乙酰葡糖胺基轉(zhuǎn)移酶II(GnTII)或者其中跨膜部分被刪除而插入內(nèi)質(zhì)網(wǎng)滯留信號(hào)的被修飾的N-乙酰葡糖胺基轉(zhuǎn)移酶II(GnTII)。編碼N-乙酰葡糖胺基轉(zhuǎn)移酶或甘露糖苷酶或所述跨膜片段的序列來(lái)自植物或來(lái)自真核的非植物生物體(如哺乳動(dòng)物)。
還有在另一個(gè)優(yōu)選實(shí)施方案中,本發(fā)明包括表達(dá)TmXyl-GaIT及ManIII的宿主細(xì)胞。在本發(fā)明的另一個(gè)實(shí)施方案中,半乳糖殘基被增加到所述臂上,通過(guò)往所述植物宿主體系中導(dǎo)入(a)編碼甘露糖苷酶III(ManIII的核酸序列,野生型基因序列但不限于以及具有內(nèi)質(zhì)網(wǎng)滯留信號(hào)的ManIII;具有早期(順式)高爾基體糖基轉(zhuǎn)移酶(GnTI、ManI、GnTIII)的跨膜片段的ManIII。這些編碼甘露糖苷酶III的序列來(lái)源于昆蟲,優(yōu)選來(lái)自草地夜蛾(Spodoptera fiugiperda)或黑腹果蠅(Drosophilamelanogaster)(不限于此)、人或來(lái)自其他生物體。
在還有另一個(gè)優(yōu)選實(shí)施方案中,本發(fā)明包括表達(dá)TmXyl-GalT和ManIII及TmGnTI-GnTII的宿主細(xì)胞。在還有另一個(gè)優(yōu)選實(shí)施方案中,本發(fā)明包括表達(dá)TmXyl-GalT和ManIII及TmManI-GnTI及TmManI-GnTII的宿主細(xì)胞。
在一個(gè)實(shí)施方案中,本發(fā)明的方法可選擇地包含,往所述植物宿主體系中導(dǎo)入哺乳動(dòng)物N-乙酰葡糖胺基轉(zhuǎn)移酶(GnTIII),優(yōu)選為人GnTIII或包含哺乳動(dòng)物GnTIII的催化部分,和一種蛋白質(zhì)的跨膜部分的雜合蛋白,所述蛋白質(zhì)位于真核細(xì)胞的ER或高爾基體的早期區(qū)室中。例如,在一個(gè)實(shí)施方案中,包括雜合酶TmXyl-GnTIII(以及編碼這種雜合酶的核酸,含有這種核酸的載體,含有這種載體的宿主細(xì)胞和含有這種宿主細(xì)胞的植物或植物部分)。在另一個(gè)實(shí)施方案中,包括雜合酶TmFuc-GnTIII(以及編碼這種雜合酶的核酸,含有這種核酸的載體,含有這種載體的宿主細(xì)胞和含有這種宿主細(xì)胞的植物或植物部分)。本發(fā)明特別地包括表達(dá)這種雜合酶(含有或不含有其他的雜合酶或其他糖基轉(zhuǎn)移酶)的宿主細(xì)胞。
本發(fā)明還提供所述雜合酶或被修飾的酶,編碼所述雜合酶的核酸序列,包含所制核酸序列的載體和獲得所述雜合酶的方法。此外,本發(fā)明提供包含異源糖蛋白的植物宿主系統(tǒng),該糖蛋白優(yōu)選具有復(fù)合型雙觸角聚糖并至少在一個(gè)臂上含有至少一個(gè)半乳糖殘基,不含木糖和海藻糖?!爱愒刺堑鞍住笔莵?lái)源于一個(gè)非植物宿主系統(tǒng)的種類的糖蛋白。糖蛋白包括但不限于抗體、激素、生長(zhǎng)因子和生長(zhǎng)因子受體和抗原。
實(shí)際上,本發(fā)明特別可用于控制異源糖蛋白的糖基化,如抗體或抗體片段(單鏈抗體,F(xiàn)ab片段、Fab2片段、Fv片段等)。為了控制抗體的糖基化,編碼本發(fā)明的雜合酶的基因構(gòu)建體(如TmXyl-GaIT基因構(gòu)建體)被導(dǎo)入到表達(dá)一種抗體(如單克隆抗體)或抗體片段的轉(zhuǎn)基因植物中。另一方面,編碼抗體(或抗體片段)的基因通過(guò)轉(zhuǎn)化表達(dá)TmXyl-GaIT基因構(gòu)建體來(lái)被導(dǎo)入。在還有一個(gè)實(shí)施方案中,含有TmXyl-GaIT表達(dá)盒的雙元載體與含有在單一T-DNA上包含單克隆抗體的輕鏈和重鏈序列的表達(dá)盒的植物雙元載體或者與含有在各個(gè)T-DNA上分別包含單克隆抗體的輕鏈和重鏈序列的表達(dá)盒的植物雙元載體被共轉(zhuǎn)化到植物中。在一個(gè)實(shí)施方案中,本發(fā)明特別地包括將表達(dá)抗體的植物與本發(fā)明的表達(dá)雜合型糖基轉(zhuǎn)移酶的植物雜交。
“宿主系統(tǒng)”包括但不限于含有具有N-聚糖的糖蛋白的任何生物體。
“植物宿主系統(tǒng)”包括但不限于植物或其部分,其包括但不限于植物細(xì)胞、植物器官/或植物組織。植物可以是單子葉植物(monocot),是一種開花植物,其種胚具有一片子葉(cotyledon)或子葉(seed leaf),包括但不限于百合、禾本科植物、玉米(Zea mays)、水稻、谷物包括燕麥、小麥和大麥,蘭花、鷲尾、洋蔥和棕櫚??蛇x擇地,植物可以是雙子葉植物(dicot),其包括但不限于煙草(Nicotiana)、番茄、馬鈴薯、豆類(如紫花苜蓿和大豆)、玫瑰、雛菊(daises)、仙人掌、紫羅蘭和浮萍。植物也可以是一種苔蘚,包括但不限于Physcomitrellapaterls。
本發(fā)明還提供獲得所述植物系統(tǒng)的方法。該方法包含將表達(dá)異源糖蛋白的植物與包含雜合酶(a)、(b)和(c)的植物雜交,雜合酶(a)包含通常不存在于植物中的半乳糖基轉(zhuǎn)移酶的催化區(qū)(或其部分)和一種蛋白質(zhì)的CTS區(qū)(或其片段,如包括跨膜結(jié)構(gòu)域的片段),其中所述蛋白質(zhì)早期在所述植物宿主系統(tǒng)的植物細(xì)胞的高爾基體中起作用而不是作為半乳糖基轉(zhuǎn)移酶或其中其跨膜部分已經(jīng)被刪除而插入內(nèi)質(zhì)網(wǎng)滯留信號(hào)的被修飾的半乳糖基轉(zhuǎn)移酶;雜合酶(b)包含一種蛋白質(zhì)特別是一種酶包括但不限于N-乙酰葡糖胺基轉(zhuǎn)移酶I(GnTI)的CTS區(qū)(或其片段,如包括跨膜結(jié)構(gòu)域的片段)和甘露糖苷酶II(ManII)的催化區(qū)(或其部分),其中所述酶早期在所述植物宿主系統(tǒng)的植物細(xì)胞的高爾基體中起作用而不是作為甘露糖苷酶II或其中其跨膜部分已經(jīng)被刪除而插入內(nèi)質(zhì)網(wǎng)滯留信號(hào)的被修飾的甘露糖苷酶II和雜合酶(c)至少包含一種酶包括但不限于N-乙酰葡糖胺基轉(zhuǎn)移酶I(GnTI)的糖基轉(zhuǎn)移酶的跨膜區(qū)(如N末端的前40-60個(gè)氨基酸)和N-乙酰葡糖胺基轉(zhuǎn)移酶II的催化區(qū),其中所述酶早期在所述植物宿主系統(tǒng)的植物細(xì)胞的高爾基體中起作用而不是作為N-乙酰葡糖胺基轉(zhuǎn)移酶II(GnTII)或其中其跨膜部分已經(jīng)被刪除而插入內(nèi)質(zhì)網(wǎng)滯留信號(hào)的被修飾的N-乙酰葡糖胺基轉(zhuǎn)移酶II(GnTII),從所述雜交中收獲子代并篩選期望的子代植物,其表達(dá)所述異源糖蛋白。
本發(fā)明還提供構(gòu)成植物宿主系統(tǒng)的所述植物或其部分。所述植物宿主系統(tǒng)還包含哺乳動(dòng)物GnTIII酶或者包含哺乳動(dòng)物GnTIII的催化部分和一種蛋白質(zhì)的跨膜部分的雜合蛋白,所述蛋白質(zhì)位于真核細(xì)胞的ER或高爾基體的早期區(qū)室中。
此外,本發(fā)明還提供植物宿主體系來(lái)制備期望的糖蛋白或其功能性片段的用途。本發(fā)明還提供獲得期望糖蛋白或其功能性片段的方法,包含培養(yǎng)按照本發(fā)明的細(xì)胞直到所述植物已經(jīng)達(dá)到收獲階段,例如生長(zhǎng)足以有利收獲的生物量,然后采用本領(lǐng)域已知的已有方法收獲所述植物,用本領(lǐng)域已知的已有的技術(shù)分級(jí)所述植物材料,至少部分地從所述被分級(jí)的植物材料中分離所述糖蛋白。
此外,獲得包含所述異源糖蛋白的所述植物宿主細(xì)胞體系還可以通過(guò)往植物宿主細(xì)胞體系或其部分中導(dǎo)入(a)編碼包含通常不存在于植物中的半乳糖基轉(zhuǎn)移酶的催化區(qū)和至少一種蛋白質(zhì)的跨膜區(qū)(或CTS的更多部分)的雜合酶的核酸序列,所述蛋白質(zhì)早期在所述植物宿主系統(tǒng)的植物細(xì)胞的高爾基體中起作用而不是作為半乳糖基轉(zhuǎn)移酶或其中跨膜部分已經(jīng)被刪除而插入內(nèi)質(zhì)網(wǎng)滯留信號(hào)的被修飾的半乳糖基轉(zhuǎn)移酶;(b)編碼包含至少一種蛋白質(zhì)特別是一種酶包括但不限于N-乙酰葡糖胺基轉(zhuǎn)移酶I(GnTI)的跨膜區(qū)(如果需要可以是CTS區(qū)的更多部分)和甘露糖苷酶II(ManII)的催化區(qū)的第一個(gè)雜合酶的核酸序列,其中所述酶早期在所述植物宿主系統(tǒng)的植物細(xì)胞的高爾基體中起作用而不是作為甘露糖苷酶II或其中跨膜部分已經(jīng)被刪除而插入內(nèi)質(zhì)網(wǎng)滯留信號(hào)的被修飾的甘露糖苷酶II和(c)編碼包含至少一種蛋白質(zhì)特別是一種酶包括但不限于N-乙酰葡糖胺基轉(zhuǎn)移酶I(GnTI)的跨膜區(qū)(如果需要可以是CTS區(qū)的大部分)和N-乙酰葡糖胺基轉(zhuǎn)移酶II(GnTII)的催化區(qū)的第二個(gè)雜合酶的核酸序列,其中所述酶早期在所述植物宿主系統(tǒng)的植物細(xì)胞的高爾基體中起作用而不是作為N-乙酰葡糖胺基轉(zhuǎn)移酶II(GnTII)或其中跨膜部分已經(jīng)被刪除而插入內(nèi)質(zhì)網(wǎng)滯留信號(hào)的被修飾的N-乙酰葡糖胺基轉(zhuǎn)移酶II(GnTII),和分離表達(dá)所述異源糖蛋白(或其部分)的植物或其部分。在一個(gè)實(shí)施方案中,包含所用核酸序列的載體被導(dǎo)入所述植物宿主系統(tǒng)中。在另一個(gè)實(shí)施方案中,每種核酸序列被插入各個(gè)載體中,并且這些載體被導(dǎo)入所述植物宿主系統(tǒng)中。在另一個(gè)實(shí)施方案中,兩個(gè)或多個(gè)核酸序列的組合被插入到各個(gè)載體中,然后這些載體通過(guò)再轉(zhuǎn)化或共轉(zhuǎn)化或雜交被結(jié)合到所述植物宿主系統(tǒng)中。
本發(fā)明還提供使用本發(fā)明的這種植物來(lái)源的糖蛋白或其功能性片段來(lái)制備組合物,特別是藥物組合物的用途,例如用抗體、激素、疫苗抗原、酶等處理患者。還提供這種包含糖蛋白或其功能性片段的藥物組合物。
最后,可以預(yù)期上述的方法可以用于降低表達(dá)一種或多種本發(fā)明的雜合酶的植物中的聚糖的總體差異性(與野生型植物或僅用哺乳動(dòng)物GaIT簡(jiǎn)單轉(zhuǎn)化的植物比較)。
附圖1比較植物和哺乳動(dòng)物中的糖蛋白的糖基化路徑。
附圖2顯示用木糖基轉(zhuǎn)移酶置換半乳糖基轉(zhuǎn)移酶的CTS片段的效果。
附圖3表示再定位甘露糖苷酶II和GlcNAcTII的其他影響。
附圖4的上面組表示含有編碼聚糖被修飾的酶的基因的T-DNA構(gòu)建體,其有效生成不含有免疫原性的木糖和海藻糖的半乳糖基化的聚糖,下邊組表示具有抗體輕鏈和重鏈基因的T-DNA構(gòu)建體。
附圖5表示人半乳糖基轉(zhuǎn)移酶(人B1,4-半乳糖基轉(zhuǎn)移酶-GaIT)的核酸序列(SEQ ID NO1)。
附圖6表示附圖5的核酸序列以及相應(yīng)的氨基酸序列(SEQ ID NO2)。
附圖7表示來(lái)自人半乳糖基轉(zhuǎn)移酶的野生型氨基酸序列(SEQ ID NO2)的示意性的突變序列(SEQ ID NO59),其中絲氨酸從胞質(zhì)尾區(qū)被去除,而重復(fù)基序G-I-Y。當(dāng)然這種變化僅僅是闡明本發(fā)明的保護(hù)范圍內(nèi)的多種可能的變化。例如,在一個(gè)實(shí)施方案中,本發(fā)明包括突變序列,其中僅進(jìn)行(一次或多次)刪除(如胞質(zhì)尾區(qū)或莖干結(jié)構(gòu)域中的刪除)—沒有插入或重復(fù)。類似地,在一個(gè)實(shí)施方案中,本發(fā)明包括突變序列,其中僅進(jìn)行(一次或多次)插入或置換(如在跨膜結(jié)構(gòu)域)—沒有刪除。
附圖8表示編碼包含人半乳糖基轉(zhuǎn)移酶(人B1,4-半乳糖基轉(zhuǎn)移酶-GaIT)的雜合酶的核酸序列(SEQ ID NO3)。大寫字母是擬南芥的β1,2-木糖基轉(zhuǎn)移酶的mRNA的核苷酸(數(shù)據(jù)庫(kù)登錄EMBLATH277603,所用的TmXyl片段包括這個(gè)數(shù)據(jù)庫(kù)的序列的核苷酸135-297)。
附圖9表示附圖8的核酸序列以及相應(yīng)的氨基酸序列(SEQ ID NO4)。
附圖10表示由附圖8中的核酸編碼的雜合酶的氨基酸序列(SEQ ID NO4)。
附圖11表示人糖基轉(zhuǎn)移酶GnTIII的核酸序列(SEQ ID NO5)(以及編碼myc-標(biāo)記的其他序列)(原始登錄號(hào)(primary accession number)Q09327 GNT3 HUMAN)。
附圖12表示附圖11的核酸序列以及相應(yīng)的氨基酸序列(SEQ ID NO6)。
附圖13表示人GnTIII的氨基酸序列(SEQ ID NO6)(以及myc抗原決定簇標(biāo)記的其他氨基酸序列SEQ ID NO7)。
附圖14表示編碼本發(fā)明的雜合酶的一個(gè)實(shí)施方案的核酸序列(SEQ ID NO9),所述雜合酶包含植物木糖基轉(zhuǎn)移酶(TmXyl-)的跨膜結(jié)構(gòu)域和人GnTIII(TmXyl-GnTIII)(以及編碼myc-標(biāo)記的其他序列)的催化結(jié)構(gòu)域(以及其他區(qū)域)。
附圖15表示附圖14的核酸序列以及相應(yīng)的氨基酸序列(SEQ ID NO10)。
附圖16表示由附圖14的核酸序列編碼的雜合酶的氨基酸序列(SEQ ID NO10)(以及myc抗原決定簇標(biāo)記SEQ ID NO7的其他序列)。
附圖17表示編碼雜合酶TmXyl-GaIT和TmGnTI-GnTII及TmGnTI-ManII的表達(dá)盒的完整核酸序列(SEQ ID NO27)。
附圖18表示編碼雜合酶TmGnTI-ManII的表達(dá)盒的完整核酸序列(SEQ IDNO28)(具有SEQ ID NO39所示RbcSl啟動(dòng)子序列)。
附圖19表示編碼雜合酶TmGnTI-ManII的核酸序列(SEQ ID NO29)。
附圖20表示編碼雜合酶TmGnTI-GnTII的核酸序列(SEQ ID NO30)。
附圖21表示編碼雜合酶TmGnTI-GnTII的核酸序列(SEQ ID NO31),其中跨膜片段(被消化的TmGntI)具有SEQ ID NO32所示核酸序列。
附圖22A表示編碼跨膜結(jié)構(gòu)域片段(TmGnTI)的一個(gè)實(shí)施方案的核酸序列(SEQ ID NO32)。附圖22B表示編碼跨膜結(jié)構(gòu)域片段(TmManI)的另一個(gè)實(shí)施方案的核酸序列(SEQ ID NO33)。
附圖23表示本發(fā)明的三個(gè)表達(dá)盒的實(shí)施方案的完整核酸序列(SEQ IDNO34)。
附圖24表示雜合基因表達(dá)盒(TmManI-GnTI)的核酸序列(SEQ ID NO35)。
附圖25表示組蛋白3.1啟動(dòng)子的核酸序列(SEQ ID NO36)。
附圖26表示雜合基因融合(TmManI-TmGnTI)的核酸序列(SEQ ID NO37)。
附圖27表示雜合基因融合TmManI-ManII的核酸序列(SEQ ID NO38)(具有SEQ ID NO39所示RbcSl啟動(dòng)子序列)。
附圖28表示RbcSl啟動(dòng)子的核酸序列(SEQ ID NO39)。
附圖29表示雜合基因TmManI-ManII的核酸序列(SEQ ID NO40),其中顯示編碼跨膜區(qū)片段的核酸序列(SEQ ID NO33)。
附圖30表示雜合基因TmManI-GnTII的核酸序列(SEQ ID NO41)。
附圖31表示Lhca啟動(dòng)子的核酸序列(SEQ ID NO42)。
附圖32表示雜合基因TmManI-GnTII的核酸序列(SEQ ID NO43),其中顯示編碼跨膜片段的核酸序列(SEQ ID NO33)。
附圖33表示所用終止子序列(見下文)的核酸序列(SEQ ID NO44)。
附圖34是與對(duì)照植物比較,檢測(cè)本發(fā)明的植物總蛋白糖基化的蛋白質(zhì)印跡。
附圖35用RCA對(duì)雜交植物的子代F1進(jìn)行血凝素印跡,所述子代按照本發(fā)明的一個(gè)實(shí)施方案制備。
附圖36是蛋白質(zhì)印跡。組A是用抗IgG抗體分析,組B用抗HRP的抗體分析,組C用特異性抗Xyl抗體片段分析。組D是用特異性抗海藻糖抗體片段分析。組E用血凝素RCA分析。
附圖37表示雜合基因的核酸序列(SEQ ID NO49,其中昆蟲甘露糖苷酶III的氨基末端CTS區(qū)用小鼠信號(hào)肽取代,并且添加羧基末端的內(nèi)質(zhì)網(wǎng)滯留信號(hào)(KDEL)。
附圖38表示附圖37的核酸序列的相應(yīng)氨基酸序列(SEQ ID NO50)。
附圖39表示雜合基因的核酸序列(SEQ ID NO51),其中人β1,4-半乳糖基轉(zhuǎn)移酶(GalT)基因的氨基末端的CTS區(qū)用小鼠信號(hào)肽取代,并且添加羧基末端的內(nèi)質(zhì)網(wǎng)滯留信號(hào)(KDEL)。
附圖40表示附圖39的核酸序列的相應(yīng)氨基酸序列(SEQ ID NO52)。
附圖41表示雜合基因的核酸序列(SEQ ID NO53),其中擬南芥GnTI基因的氨基末端的CTS區(qū)用小鼠信號(hào)肽取代,并且添加羧基末端的內(nèi)質(zhì)網(wǎng)滯留信號(hào)(KDEL)。
附圖42表示附圖41的核酸序列的相應(yīng)氨基酸序列(SEQ ID NO54)。
附圖43表示雜合基因的核酸序列(SEQ ID NO55),其中擬南芥GnTII基因的氨基末端的CTS區(qū)用小鼠信號(hào)肽取代,并且添加羧基末端的內(nèi)質(zhì)網(wǎng)滯留信號(hào)(KDEL)。
附圖44表示附圖43的核酸序列的相應(yīng)氨基酸序列(SEQ ID NO56)。
附圖45表示雜合酶的核酸序列(SEQ ID NO57),其中人β1,4-半乳糖基轉(zhuǎn)移酶(GalT)基因的氨基末端的CTS區(qū)用人的GnTI基因的CTS區(qū)取代。
附圖46表示附圖45的核酸序列的相應(yīng)氨基酸序列(SEQ ID NO58)。
附圖47是酶如何定位于高爾基體的示意圖。
附圖48是轉(zhuǎn)移酶的區(qū)域“交換”如何引起再定位的非限制性的假定示意圖。
發(fā)明詳述雜合酶采用本領(lǐng)域已知的各種重組DNA操作,如多聚酶鏈?zhǔn)椒磻?yīng)或篩選表達(dá)文庫(kù)來(lái)刪除具有相同結(jié)構(gòu)特征的克隆DNA片段,可以獲得編碼各種糖基化酶如甘露糖苷酶、GicNAcTs、半乳糖基轉(zhuǎn)移酶的核酸序列。參見,如Innis等,1990,PCR方法和應(yīng)用指南(A Guide to Methods and Application),學(xué)院出版社,紐約??梢圆捎闷渌怂釘U(kuò)增操作如連接酶鏈?zhǔn)椒磻?yīng)(LCR),連接激活轉(zhuǎn)錄(LAT)和核酸序列擴(kuò)增(NASBA)或遠(yuǎn)程PCR。
一旦生成DNA片段,通過(guò)各種方式實(shí)現(xiàn)確定具有期望基因的特定DNA片段。例如,可以得到一定含量的基因的部分或其特定RNA或其片段,并被純化和標(biāo)記,可以通過(guò)核酸雜交到標(biāo)記探針來(lái)篩選生成的DNA片段[Benton和Davis,科學(xué)196180(1977);Grunstein和Hogness,美國(guó)國(guó)家科學(xué)院匯編723961(1975)]。此外,可以通過(guò)基于表達(dá)產(chǎn)物的物理、化學(xué)或免疫特性的分析來(lái)檢測(cè)基因的存在。例如,選擇雜交篩選恰當(dāng)mRNA的cDNA克隆或DNA克隆,其制備一種蛋白質(zhì),具有與目標(biāo)蛋白已知的相似或相同的電泳遷移率、等電聚焦活性、蛋白水解消化圖譜或抗原特性。
可如下獲得編碼包含第一個(gè)酶的跨膜部分和第二個(gè)酶的催化部分的雜合酶的核酸序列。編碼跨膜部分的序列從第二個(gè)酶中去除,使得核酸序列包含編碼第二個(gè)酶的C末端部分的序列,包括催化部位。編碼第一個(gè)酶的跨膜部分的序列通過(guò)PCR被分離或得到,連接到編碼包含第二個(gè)酶的C末端部分的序列的序列上。
被修飾的酶去除編碼跨膜片段的序列,用甲硫氨酸密碼子(起始翻譯)取代,和在半乳糖基轉(zhuǎn)移酶的最后一個(gè)密碼子和終止密碼子之間插入編碼ER滯留信號(hào)的核酸序列,如編碼KDEL的序列(氨基酸殘基序列賴氨酸-天冬氨酸-亮氨酸)[Rothman,細(xì)胞50521(1987)],獲得編碼蛋白質(zhì)特別是酶的核酸序列,如滯留在ER中的半乳糖基轉(zhuǎn)移酶、甘露糖苷酶和N-乙酰葡胺基轉(zhuǎn)移酶。
使用其結(jié)構(gòu)域和部分如上指出,詞語(yǔ)“至少一部分”或“其片段”是指蛋白或肽保持其性質(zhì)和天然功能所必需的最小氨基酸序列。例如,酶的功能是指其酶促或催化作用,在高爾基體中錨定一種蛋白質(zhì)的能力,或作為一種信號(hào)肽。因此,詞語(yǔ)“至少跨膜結(jié)構(gòu)域的一部分”或“跨膜結(jié)構(gòu)域的一個(gè)片段”分別指較大跨膜結(jié)構(gòu)域的最小氨基酸片段,其仍然保留至少一部分天然的跨膜功能(例如,功能雖然降低了,但是明顯的)。作為另一個(gè)例子,詞語(yǔ)“至少催化區(qū)的一部分”或“催化區(qū)的一個(gè)片段”分別指較大催化結(jié)構(gòu)域的最小氨基酸片段,其仍然至少保留部分的天然催化功能(例如,既便有所降低,但是存在)。如在此所討論,本領(lǐng)域的技術(shù)人員將知曉一種蛋白質(zhì)或肽保持至少一些天然蛋白質(zhì)或肽功能的最小氨基酸片段。
根據(jù)所轉(zhuǎn)移的糖類型,糖基轉(zhuǎn)移酶典型地分成兩個(gè)家族(半乳糖基轉(zhuǎn)移酶,唾液酸轉(zhuǎn)移酶等)。根據(jù)氨基酸相似性和立體化學(xué)的反應(yīng)過(guò)程,糖基轉(zhuǎn)移酶可以被分為至少27個(gè)和可能多達(dá)47個(gè)家族[Campbell等,生物化學(xué)雜志(Biochem.J.)326929-939(1997),生物化學(xué)雜志(Biochem.J.)329719(1998)]。至今被克隆的大多數(shù)糖基轉(zhuǎn)移酶是II型跨膜蛋白質(zhì)(即在胞質(zhì)中具有NH2末端和在高爾基體的內(nèi)腔具有COOH末端的單一的跨膜結(jié)構(gòu)域)。無(wú)論將它們?nèi)绾畏诸?,所有糖基轉(zhuǎn)移酶具有某些共同的結(jié)構(gòu)特征短的NH2-末端胞質(zhì)尾區(qū),16-20個(gè)氨基酸信號(hào)錨或跨膜結(jié)構(gòu)域,和擴(kuò)展的莖干區(qū),后面接著大的COOH-末端催化結(jié)構(gòu)域。胞質(zhì)尾似乎參與一些類型的糖基轉(zhuǎn)移酶特異地定位于高爾基體[Milland等,生物學(xué)化學(xué)雜志(J.Biol.Chem.)27710374-10378]。信號(hào)錨定結(jié)構(gòu)域可以作為不可裂解的信號(hào)肽和作為跨膜區(qū),指導(dǎo)糖基轉(zhuǎn)移酶的催化結(jié)構(gòu)域進(jìn)入高爾基體的內(nèi)腔。
在本發(fā)明的一個(gè)實(shí)施方案中,由Nicotiana benthamiana(煙草)乙酰葡糖胺基轉(zhuǎn)移酶I的N-末端的77個(gè)氨基酸定義的部分被包含,用于雜合酶,由于該部分被發(fā)現(xiàn)足以在植物高爾基體中指向和保持報(bào)道蛋白[Essl等,F(xiàn)EBSLett453169-173(1999)]。在煙草中,由假定的胞質(zhì)的、跨膜的和莖干結(jié)構(gòu)域構(gòu)成的各種融合蛋白的亞細(xì)胞定位表明,僅胞質(zhì)—跨膜結(jié)構(gòu)域就足以保持β1,2-木糖基轉(zhuǎn)移酶滯留在高爾基體中,而不需要任何腔序列的幫助[Dirnberger等,植物分子生物學(xué)(Plant Mol.Biol.)50273-281(2002)]。因此,如上指出,本發(fā)明的一些實(shí)施方案采用僅包括胞質(zhì)—跨膜結(jié)構(gòu)域(或其部分)的CTS區(qū)部分,而未使用CTS區(qū)的莖干區(qū)。但是,一些類型糖基轉(zhuǎn)移酶滯留高爾基體時(shí)主要依賴于其跨膜結(jié)構(gòu)域,其他類型需要其跨膜區(qū)和該區(qū)的一端或兩端的側(cè)翼序列[Colley,糖生物學(xué)(Glycobiology)71-13(1997)]。例如,包含氨基酸1-32的N末端肽似乎是足以將β1,6N-乙酰葡糖胺基轉(zhuǎn)移酶定位在高爾基體中的最小靶向信號(hào)。該肽組成這種酶的胞質(zhì)結(jié)構(gòu)域和跨膜結(jié)構(gòu)域[Zerfaoui等,糖生物學(xué)(Glycobiology)1215-24]。
大量特定糖基轉(zhuǎn)移酶結(jié)構(gòu)域的氨基酸序列的信息是可以獲得的。例如,由GenBank登錄號(hào)AAM17731提供的哺乳動(dòng)物半乳糖基轉(zhuǎn)移酶的氨基酸序列具有分別包括殘基19-147和殘基148-397的“莖”結(jié)構(gòu)域和“催化”結(jié)構(gòu)域[美國(guó)專利6,416,988,在此引入作為參考]和在一些實(shí)施方案中,本發(fā)明特別地包括將這些部分用于雜合酶。GenBank登錄號(hào)AAC91156提供的大鼠肝臟唾液酸轉(zhuǎn)移酶的氨基酸序列具有9個(gè)氨基酸的NH2末端胞質(zhì)尾區(qū)、17個(gè)氨基酸的信號(hào)錨定結(jié)構(gòu)域,和包括暴露的莖區(qū)的腔結(jié)構(gòu)域,接著是41kDa的催化結(jié)構(gòu)域[Hudgin等,加拿大生物化學(xué)雜志(Can.J.Biochem.)49829-837(1971);美國(guó)專利5,032,519和5,776,772,在此引入作為參考]。已知的人和小鼠β1,3-半乳糖基轉(zhuǎn)移酶具有催化結(jié)構(gòu)域,其具有8個(gè)保守區(qū)[Kolbinger等,生物學(xué)化學(xué)雜志(J.Biol.Chem.)273433-440(1998);Hennet等,生物學(xué)化學(xué)雜志(J.Biol.Chem.)27358-65(1998);美國(guó)專利5,955,282,在此引入作為參考]。例如,由GenBank登錄號(hào)NM020026提供的小鼠UDP-半乳糖β-N-乙酰氨基葡萄糖β1,3-半乳糖基轉(zhuǎn)移酶-I的氨基酸序列具有如下催化區(qū)從殘基78-83的區(qū)1;從殘基93-102的區(qū)2;從殘基116-119的區(qū)3;從殘基147-158的區(qū)4;從172-183的區(qū)5;從殘基203-206的區(qū)6;從殘基236-246的區(qū)7;和從殘基264-275的區(qū)8.[Hennet等,同上文]-所有這些區(qū)都被包含在本發(fā)明的一些實(shí)施方案中,作為上面討論的雜合酶的有用部分。
先前在已知的糖基轉(zhuǎn)移酶的cDNA克隆之間的比較表明,酶之間序列的同源性極低[Paulson等,生物化學(xué)雜志(J.Biol.Chem.)26417615-618(1989)],最新進(jìn)展使得可能推導(dǎo)出特異性不同的糖基轉(zhuǎn)移酶中的保守結(jié)構(gòu)域[Kapitonov等,糖生物學(xué)(Glycobiology)9961-978(1999)]。例如,通過(guò)采用由所得到的完整基因組序列提供的序列數(shù)據(jù),已經(jīng)確定各種生物體的大量糖基轉(zhuǎn)移酶的核酸和氨基酸序列,如現(xiàn)代人(人類)、Caehorhabditis elegans(土壤線蟲)、擬南芥(thale cress,芥菜)和Oryza sativa(水稻)。
作為廣泛研究的結(jié)果,已經(jīng)推導(dǎo)出各種糖基轉(zhuǎn)移酶家族的一致結(jié)合位點(diǎn)的共同氨基酸序列。例如,唾液酸轉(zhuǎn)移酶具有唾液酸基序(sialyl motif),其似乎參與共同底物CMP-硅酸的識(shí)別[Paulson等,生物學(xué)化學(xué)雜志(J.Biol.Chem.),26417615-17618(1989);Datta等,生物學(xué)化學(xué)雜志(J.Biol.Chem.),2701497-1500(1995);Katsutoshi,糖科學(xué)糖技術(shù)趨勢(shì)(Trends Glycosci.Glycotech.)8195-215(1996)]。Galα1-3半乳糖基轉(zhuǎn)移酶中的六肽RDKKND和GIcNAcβ1-4半乳糖基轉(zhuǎn)移酶中的RDKKNE被認(rèn)為是UDP-Gal的結(jié)合位點(diǎn)[(Joziasse等,生物學(xué)化學(xué)雜志(J.Biol.Chem.),2604941-4951(1985),生物學(xué)化學(xué)雜志(J.Biol.Chem.),26414290-14297(1989);Joziasse,糖生物學(xué)(Glycobiology),2271-277(1992))。
由兩個(gè)天門冬氨酸殘基構(gòu)成小的高保守性基序(DXD),通常被親水區(qū)包圍,已經(jīng)在大量不同真核生物轉(zhuǎn)移酶中被確定,包括α-1,3-甘露糖基轉(zhuǎn)移酶,β-1,4-半乳糖基轉(zhuǎn)移酶,α-1,3-半乳糖基轉(zhuǎn)移酶,葡糖醛酸基轉(zhuǎn)移酶,海藻糖基轉(zhuǎn)移酶,糖原引物(glycogenins)等[Wiggins等,美國(guó)國(guó)家科學(xué)院匯編(Proc.Natl.Acad.Sci.U.S.A.)957945-7950(1998)]。突變?cè)囼?yàn)表明這個(gè)基序是酶促活性所必需的[Busch等,生物學(xué)化學(xué)雜志(J.Biol.Chem.)27319566-19572(1998);Wang等,生物學(xué)化學(xué)雜志(J.Biol.Chem.)27718568-18573(2002)]。多重肽對(duì)比表明一些對(duì)應(yīng)于假定催化區(qū)的基序在所有β3-半乳糖基轉(zhuǎn)移酶家族的成員中是保守的,也就是II型跨膜結(jié)構(gòu)域,保守性DxD基序,N-糖基化位點(diǎn)和五個(gè)保守性胱氨酸[Gromova等,分子致癌性(Mol.Carcinog.)3261-72(2001)]。
通過(guò)BLAST檢索和多重對(duì)比,發(fā)現(xiàn)E-X7-E基序在滯留糖基轉(zhuǎn)移酶的四個(gè)家族的成員中是高度保守的。[Cid等,生物學(xué)化學(xué)雜志(J.Biol.Chem.)27533614-33621(2000)]。O-連接乙酰葡糖胺基轉(zhuǎn)移酶(GIcNAc)將一個(gè)P-N-乙酰氨基葡萄糖成分添加到特定絲氨酸或蘇氨酸羥基上。BLAST分析、相同的二級(jí)結(jié)構(gòu)預(yù)測(cè)和折疊識(shí)別研究表明,第二個(gè)Rossmann結(jié)構(gòu)域中的保守基序?qū)?yīng)UDP-GicNAc供體-結(jié)合位點(diǎn)[Wrabl等,分子生物學(xué)雜志(J.Mol.Biol.)314365-374(2001)]。迄今確定的β1,3-糖基轉(zhuǎn)移酶共有一些保守區(qū)和保守半胱氨酸殘基,都位于假定的催化區(qū)。定點(diǎn)突變鼠β3GatT-I基因(登錄號(hào)為AF029790)表明,保守性殘基W101和W162參與UDP-半乳糖供體的結(jié)合,殘基W315參與N-乙酰氨基葡萄糖β-p-硝基酚受體結(jié)合,包括E264的結(jié)構(gòu)域似乎參與這兩種底物的結(jié)合[Malissard等,歐洲生物化學(xué)雜志(Eur.J.Biochem.)269233-239(2002)]。
在植物宿主系統(tǒng)中表達(dá)目標(biāo)蛋白按照本發(fā)明的一些實(shí)施方案,編碼雜合或改進(jìn)的酶或其他異源蛋白質(zhì)如異源糖蛋白的核酸被插入到合適的表達(dá)載體中,即包含插入的編碼序列的轉(zhuǎn)錄和翻譯所需元件的載體,或者為RNA病毒載體的情況下,復(fù)制和翻譯的必需元件,以及選擇性標(biāo)記。這些包括但不限于啟動(dòng)子區(qū),信號(hào)序列,5’不翻譯序列,起始密碼子(取決于結(jié)構(gòu)基因是否攜帶一個(gè)),和轉(zhuǎn)錄和翻譯終止序列。獲得這些載體的方法在本領(lǐng)域是已知的(參見WO 01/29242作為綜述)。
適合于植物中的表達(dá)的啟動(dòng)子序列在現(xiàn)有技術(shù)中被描述,如WO 91/198696。包括非組成型啟動(dòng)子或組成型啟動(dòng)子,如胭脂堿合成酶和章魚堿合成酶啟動(dòng)子、花椰菜花葉病毒(CaMV)19S、35S啟動(dòng)子和玄參花葉病毒(FMV)35啟動(dòng)子(見美國(guó)專利5,352,605和6,051,753,都在此引入作為參考)。所用的啟動(dòng)子可以是組織特異性啟動(dòng)子,如靶向胚乳、糊粉層、胚胎、果皮、莖、葉、塊莖、根等。
信號(hào)序列使蛋白質(zhì)被恰當(dāng)?shù)丶庸ず娃D(zhuǎn)移。信號(hào)來(lái)源于植物或者是非植物信號(hào)序列。信號(hào)肽指引初生多肽到內(nèi)質(zhì)網(wǎng),隨后多肽在此進(jìn)行翻譯后的修飾。信號(hào)肽可由本領(lǐng)域技術(shù)人員常規(guī)地確定。信號(hào)肽通常具有三聯(lián)結(jié)構(gòu),在N末端具有正電荷氨基酸,接著是疏水區(qū),然后在低疏水性區(qū)內(nèi)具有裂解位點(diǎn)。
轉(zhuǎn)錄末端通常在轉(zhuǎn)錄起始調(diào)控區(qū)的相反端。其可能與轉(zhuǎn)錄起始區(qū)相關(guān),來(lái)自不同基因,被選擇用來(lái)增強(qiáng)表達(dá)。一個(gè)例子是來(lái)自農(nóng)桿菌Ti質(zhì)粒的NOS終止子和水稻α-淀粉酶終止子。還可以添加聚腺苷酸尾。例子包括但不限于農(nóng)桿菌章魚堿合成酶信號(hào)[Gielen等,EMBO J.3835-846(1984)]或相同種類的胭脂堿合成酶[Depicker等,分子應(yīng)用遺傳學(xué)(Mol.Appl.Genet.)l561-573(1982)]。
可以包括增強(qiáng)子來(lái)提高和/或最大化異源蛋白質(zhì)的轉(zhuǎn)錄。這些包括但不限于肽排出信號(hào)序列、密碼子選擇、內(nèi)含子、聚腺苷?;娃D(zhuǎn)錄終止位點(diǎn)(見WO01/29242)。
標(biāo)記優(yōu)選包括原核生物的選擇性標(biāo)記。這種標(biāo)記包括抗生素抗性如氨卡青霉素、四環(huán)素、卡那霉素和奇霉素。特別的例子包括但不限于編碼鏈霉素抗性的鏈霉素磷酸轉(zhuǎn)移酶(spt)基因、編碼卡那霉素或遺傳抗性的新霉素磷酸轉(zhuǎn)移酶(nptII)基因、編碼潮霉素抗性的潮霉素磷酸轉(zhuǎn)移酶(hpt)基因。
采用本領(lǐng)域已知的方法(參見WO 01/29242和WO 01/31045),將所構(gòu)建的載體導(dǎo)入植物宿主系統(tǒng)中。載體被改進(jìn)為介導(dǎo)植物轉(zhuǎn)化質(zhì)粒,含有與根癌農(nóng)桿菌載體同源的區(qū)域、來(lái)自根癌農(nóng)桿菌的T-DNA邊界區(qū)??蛇x擇地,用于本發(fā)明的方法的載體可以是農(nóng)桿菌載體。導(dǎo)入載體的方法包括但不限于微注射,用具有核酸的小顆粒速度彈道穿透,核酸在小珠或顆粒的基質(zhì)中或者在表面,以及電穿孔。載體被導(dǎo)入植物細(xì)胞、組織或器官中。在一個(gè)特別的實(shí)施方案中,一旦確定存在異源基因,可用本領(lǐng)域的已知方法再生植物??梢圆捎帽绢I(lǐng)域已知的方法篩選期望的蛋白,優(yōu)選采用篩選分析,其中以產(chǎn)生可檢測(cè)的信號(hào)的方式來(lái)檢測(cè)生物學(xué)活性位點(diǎn)。該信號(hào)可以直接或間接產(chǎn)生。這種分析的例子包括ELISA或放射免疫分析。
瞬時(shí)表達(dá)本發(fā)明特別包括上述雜合酶的穩(wěn)定表達(dá)和瞬時(shí)表達(dá)。用于轉(zhuǎn)化大量各種高等植物種類來(lái)瞬時(shí)表達(dá)表達(dá)盒的技術(shù)是已知的[見如Weising等,Ann.Rev.Genet.22421-477(1988)]。不同系統(tǒng)的變量包括被轉(zhuǎn)化的核酸類型(DNA、RNA、質(zhì)粒、病毒)、被轉(zhuǎn)化的組織類型、導(dǎo)入轉(zhuǎn)基因的方法和轉(zhuǎn)化條件。例如可以采用從電轉(zhuǎn)化、PEG poration、粒子轟擊、硅纖維呈遞、植物細(xì)胞原生質(zhì)體或胚愈傷組織或其他植物組織微注射,或者農(nóng)桿菌介導(dǎo)轉(zhuǎn)化等范圍內(nèi)的技術(shù)[Hiei等,植物雜志(Plant J.)6271-282(1994)],將核酸構(gòu)建體直接導(dǎo)入植物細(xì)胞中。由于轉(zhuǎn)化效率是變化的,常常采用內(nèi)參(如35S-Luc)來(lái)規(guī)格化轉(zhuǎn)化效率。
用于瞬時(shí)分析的表達(dá)構(gòu)建體包括質(zhì)粒和病毒載體。可以用作載體的各種植物病毒在本領(lǐng)域是已知的,包括花椰菜花葉病毒(CaMV)、雙粒病毒組、雀麥草花葉病毒和煙草花葉病毒。
適合于瞬時(shí)表達(dá)的植物組織包括培養(yǎng)的細(xì)胞,或者是完整的或者作為原生質(zhì)體(其中細(xì)胞被去除)、培養(yǎng)的組織、培養(yǎng)的植物和植物組織如葉子。
一些瞬時(shí)表達(dá)的方法采用通過(guò)電轉(zhuǎn)化或聚乙二醇介導(dǎo)將基因轉(zhuǎn)化到植物細(xì)胞原生質(zhì)體中。這些方法需要制備和培養(yǎng)植物原生質(zhì)體,包括在原生質(zhì)體上形成穿孔,核酸通過(guò)該孔被轉(zhuǎn)化到原生質(zhì)體的內(nèi)部。
示例性的電轉(zhuǎn)化技術(shù)在Fromm等,美國(guó)國(guó)家科學(xué)院(Proc.Natl.Acad.Sci.)825824(1985)中被描述。采用聚乙二醇穿透的DNA構(gòu)建體導(dǎo)入在Paszkowski等,EMBO J.32717-2722(1984)中被描述。煙草原生質(zhì)體的PEG-介導(dǎo)轉(zhuǎn)化在Lyck等,(1997)植物界(Planta)202117-125和Scharf等,(1998)分子細(xì)胞生物學(xué)(Mol Cell Biol)182240-2251,和Kirschner等,(2000)植物雜志(The PlantJ)24(3)397-411中被描述,包括原生質(zhì)體的分離、純化和轉(zhuǎn)化的步驟。這些方法已經(jīng)被用于例如確定由外部刺激激活的啟動(dòng)子中的順式作用元件,Abel和Theologis(1994),植物雜志(Plant J)5421-427;Hattori等,(1992)遺傳發(fā)育(Genes Dev)6609-618;Sablowski等,(1994)EMBO J 13128-137;和Solano等,(1995)EMBO J 141773-1784),以及其他的基因表達(dá)研究(美國(guó)專利6,376,747,在此引入作為參考)。
彈道轉(zhuǎn)化技術(shù)在Klein等,(1987)自然(Nature)32770-73中被描述。彈道瞬時(shí)轉(zhuǎn)化用于懸浮細(xì)胞或植物器官。例如,其已經(jīng)被開發(fā)用于煙草葉子,Godon等,(1993)Biochimie 75(7)591-595。其還用于研究植物啟動(dòng)子,(Baum等,(1997)植物雜志(Plant J)12463-469;Stromvik等,(1999)植物分子生物學(xué)(PlantMol Biol)41(2)217-31,Tuerck和Fromm(1994)植物細(xì)胞(Plant Cell)61655-1663;和美國(guó)專利5,847,102,在此引入作為參考),和用于表征轉(zhuǎn)錄因子(Goff等,(1990)EMBO J 92517-2522;Gubler等,(1999)植物雜志(Plant J)171-9;和Sainz等,(1997)植物細(xì)胞(Plant Cell)9611-625)。
另一種方法可以原位可視化基因的瞬時(shí)表達(dá),例如洋蔥表皮剝落,其中可以觀察到GFP在各種細(xì)胞腔室內(nèi)表達(dá)(Scott等,(1999)生物技術(shù)(Biotechniques)26(6)1128-1132。
還可以通過(guò)直接注射將核酸導(dǎo)入植物中。瞬時(shí)基因表達(dá)可以通過(guò)將DNA注射到植物的繁殖器官中來(lái)實(shí)現(xiàn)(見如,Pena等,(1987)自然,325274),如將DNA轉(zhuǎn)化到花粉中(見如Zhou等,(1983)酶學(xué)中的方法(Methods inEnzymology),10l433;D.Hess(1987)Intern Rev.Cytol.,107367;Luo等,(1988)植物分子生物學(xué)報(bào)道(Plant Mol.Biol.Reporter),6165。DNA還可以直接注射到未成熟的胚胎的細(xì)胞中(見如,Neuhaus等,(1987)Theor.Appl.Genet7530;和Benbrook等,(1986)Proceedings Bio Expo 1986,Butterworth,Stoneham,Mass,27-54)。
農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化可以應(yīng)用于雙子葉植物和單子葉植物。用于禾本科植物如水稻和玉米的農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化的最佳方法和載體已經(jīng)被描述(見如,Heath等,(1997)分子植物微生物互作(Mol.Plant-Microbe Interact.)10221-227;Hiei等,(1994)植物雜志(Plant J.)6271-282和Ishida等,(1996)自然生物技術(shù)(Nat.Biotech.)14745-750)。玉米轉(zhuǎn)化的效率受到各種因素的影響,包括感染的組織的類型和階段、農(nóng)桿菌濃度、組織培養(yǎng)液、Ti載體和玉米基因型。
另一種有效的基本轉(zhuǎn)化操作包括結(jié)合粒子轟擊創(chuàng)傷,接著用農(nóng)桿菌呈遞DNA(見如,Bidney等,(1992)植物分子生物學(xué)(Plant Mol.Biol.)18301-313)。完整的分生轉(zhuǎn)化和斷裂分生轉(zhuǎn)化也是已知的(美國(guó)專利6,300,545在此引入作為參考)。
利用農(nóng)桿菌的其他方法包括農(nóng)桿菌感染法和農(nóng)桿菌滲入。通過(guò)將病毒基因組插入T-DNA,農(nóng)桿菌可用于介導(dǎo)植物的病毒感染(見如,美國(guó)專利6,300,545在此引入作為參考)。在將T-DNA轉(zhuǎn)入植物細(xì)胞后,成功病毒感染要求病毒基因組從T-DNA上切除(轉(zhuǎn)移)。這種用于將病毒導(dǎo)入植物宿主的農(nóng)桿菌介導(dǎo)方法被稱作農(nóng)桿菌感染(見,如,Grimsley,“農(nóng)桿菌感染”,325-342,分子生物學(xué)中的方法(Methods in Molecular Biology),第44卷農(nóng)桿菌操作,Gartland和Davey編輯,Humana Press,Inc.,Totowa,新澤西州;Grisley(1990)Physiol.Plant.79147-153)。
用于在植物中表達(dá)外源基因的植物病毒基因載體的發(fā)展提供了一種方法,在短時(shí)間內(nèi)產(chǎn)生高水平的基因表達(dá)。適宜的表達(dá)復(fù)制子包括來(lái)自具有雙鏈DNA基因組的病毒的雙鏈DNA或者復(fù)制介質(zhì)。被切除的病毒DNA可以獨(dú)立地或者與翻譯中添加因子一起作為復(fù)制子和復(fù)制介質(zhì)。病毒DNA編碼或不編碼感染性的病毒顆粒,還可以具有插入、刪除、取代、重排或其他修飾。病毒DNA含有異源DNA,可以是任何非病毒的或來(lái)自不同病毒的DNA。例如,異源DNA可以包含目標(biāo)蛋白或RNA的表達(dá)盒。
具有農(nóng)桿菌A28l和A348的病毒基因的超級(jí)雙元載體可以用于單子葉植物的高效轉(zhuǎn)化。但是,既便不采用高效的載體,已經(jīng)證明T-DNA能有效地轉(zhuǎn)化玉米,雖然不形成細(xì)胞瘤,但是產(chǎn)生由農(nóng)桿菌誘導(dǎo)的病毒的系統(tǒng)性感染(Grimsley等,(1989)Mol.Gen.Genet.217309-316)。這是由于含有病毒基因組的T-DNA的整合不要求病毒增殖,切除的病毒基因組作為獨(dú)立的復(fù)制子。
另一種農(nóng)桿菌介導(dǎo)的瞬時(shí)病毒分析基于農(nóng)桿菌介導(dǎo)轉(zhuǎn)化in planta的煙草葉片(Yang等,(2000)植物學(xué)雜志(The Plant J)22(6)543-551)。這種方法采用含有質(zhì)粒構(gòu)建體的農(nóng)桿菌侵入煙草葉片中,稱作為農(nóng)桿菌侵入;已經(jīng)被用于體內(nèi)分析在2-3天內(nèi)的啟動(dòng)子和轉(zhuǎn)錄因子的表達(dá)。也可以原位檢測(cè)外部刺激,如病原體感染和環(huán)境應(yīng)激對(duì)啟動(dòng)子活性的影響。
實(shí)施例1采用先前描述的基于親緣種選擇操作的PCR[Bakker等,BBRC 261829(1999)],從cDNA文庫(kù)中分離編碼β1,2-木糖基轉(zhuǎn)移酶的擬南芥cDNA。用從兔抗辣根過(guò)氧化酶抗血清中純化的木糖特異性抗體免疫染色被轉(zhuǎn)化的CHO細(xì)胞,確定木糖基轉(zhuǎn)移酶活性。用引物XylTpvuFATACTCGAGTTAACAATGAGTAAACGGAATC(SEQ ID NO45)和XylTpvuRTTCTCGATCGCCGATTGGTTATTC(SEQ ID NO46)擴(kuò)增含有木糖基轉(zhuǎn)移酶的N末端部分的DNA片段,在起始密碼子的前面引入XhoI和HpaI限制性位點(diǎn),而在相反末端引入PvuI。用引物GalTpvuFGCCGCCGCGATCGGGCAGTCCTCC(SEQ ID NO47)和GalTrevAACGGATCCACGCTAGCTCGGTGTCCCGAT(SEQ ID NO48)擴(kuò)增人β1,4半乳糖基轉(zhuǎn)移酶(登錄號(hào)x55415,Aoki 1992)的C末端片段,然后引入PvuI和BamHI位點(diǎn)。將XhoI/PvuI和PvuI/BamHI的消化的PCR片段連接到用XhoI/BamHI消化的pBluescriptSK+上并測(cè)序。得到的開放閱讀框編碼融合蛋白,其含有與人β1,4半乳糖基轉(zhuǎn)移酶的69-398氨基酸融合的擬南芥β1,2-木糖基轉(zhuǎn)移酶的前54個(gè)氨基酸,稱作為TmXyl-GalT。用HpaI/BamHI,將該片段克隆到植物表達(dá)載體中,位于CaMV35S啟動(dòng)子和Nos終止子之間。如天然的人β1,4半乳糖基轉(zhuǎn)移酶[Bakker等,美國(guó)國(guó)家科學(xué)院匯編(Proc.Nat.Acad.Sci.USA)982899(2001)]一樣,該克隆被導(dǎo)入煙草(samsun NN)中。
如描述[Bakker等,美國(guó)國(guó)家科學(xué)院匯編(Proc.Nat.Acad.Sci.USA)982899(2001)],進(jìn)行轉(zhuǎn)基因植物蛋白質(zhì)的提取和蛋白質(zhì)印跡。根據(jù)血凝素RCA的反應(yīng),通過(guò)MALDI-TOF[Elbers等,植物生理學(xué)(Plant Physiology)1261314(2001)],選擇表達(dá)TmXylGalT的轉(zhuǎn)基因植物用于進(jìn)一步分析聚糖,并與從表達(dá)天然β1,4半乳糖基轉(zhuǎn)移酶的植物中分離的聚糖比較,以及與野生型植物的聚糖比較。表1中給出MALDI-TOF質(zhì)譜的相對(duì)峰值區(qū)。也就是說(shuō),表1是對(duì)照煙草(“Tobacco”)、表達(dá)人β1,4-半乳糖基轉(zhuǎn)移酶的轉(zhuǎn)基因煙草(“GalT”),以及CTS區(qū)用β-1,2-木糖基轉(zhuǎn)移酶的CTS區(qū)取代的表達(dá)β-1.4-糖基轉(zhuǎn)移酶的轉(zhuǎn)基因煙草植物(“TmXyl-GaIT”)的內(nèi)源性糖蛋白的N聚糖的質(zhì)譜(MALDI-TOF)分析結(jié)果的比較。
這些數(shù)據(jù)表明1.在TmXylGalT植物中,聚糖的木糖基化和海藻糖基化顯著地降低與14%野生型植物相比,82%聚糖不攜帶木糖或海藻糖。
2.半乳糖苷化從GaIT植物的9%增加到TmXylGalT植物的32%。
實(shí)施例2
根據(jù)生物素標(biāo)記RCA(Vector Laboratories,伯林蓋姆,加利福尼亞)的血凝素印跡,篩選表達(dá)所述TmXyl-GaIT基因的轉(zhuǎn)基因植物(TmXyl-GaIT-12植物)(如上)。用抗HRP(辣根過(guò)氧化酶)多克隆抗體(已知具有高抗木糖和抗海藻糖的反應(yīng)性),比較MGR48轉(zhuǎn)基因植物(對(duì)照)、表達(dá)未被修飾的人β1,4-半乳糖基轉(zhuǎn)移酶基因的被選擇的轉(zhuǎn)基因植物和TmXyl-GalT-12植物的蛋白質(zhì)提取物中含有的木糖和海藻糖,結(jié)果表明木糖和海藻糖減少(附圖34“抗辣根”)。采用抗HRP的抗木糖片段和抗海藻糖片段的蛋白質(zhì)印跡(每種都在適宜的配體上通過(guò)親合層析制備)表明,與對(duì)照植物相比,尤其降低了木糖(附圖34“抗-Fuc”和“抗-Xyl”)。
實(shí)施例3TmXyl-GaIT-12植物與來(lái)自單一T-DNA整合事件的表達(dá)單克隆抗體MGR48的轉(zhuǎn)基因植物(MGR48-31)雜交,首先通過(guò)選擇不能由卡那霉素抗性標(biāo)記和抗體產(chǎn)物分離的子代植物來(lái)純合(MGR48-31-4)。用MGR48-31-4的花粉給去雄的TmXyl-GaIT-12植物授粉。相反,用TmXyl-GalT-12植物的花粉給去雄的MGR48-31-4植物授粉。通過(guò)蛋白質(zhì)印跡,分析大量的F1植物是否存在MGR48,并采用RCA通過(guò)血凝素印跡分析內(nèi)源性糖蛋白的半乳糖基化(附圖35)。選擇一種表達(dá)MGR48并具有內(nèi)源性糖蛋白的半乳糖基化的植物,用于進(jìn)一步分析。該植物稱作為XGM8.
種植TmXyl-GalT-12( )×MGR48-31-4( )的種子,采用先前描述的常規(guī)技術(shù),通過(guò)蛋白質(zhì)印跡分析子代植物(XGM)的抗體產(chǎn)量和用生物素標(biāo)記的RCA120(Vector Labs.,伯林蓋姆,加利福尼亞)通過(guò)血凝素印跡分析半乳糖基化。所有植物如預(yù)期表達(dá)單克隆抗體MGR48,并且如RCA120的血凝素印跡所示,大部分植物還具有半乳糖基化的聚糖。個(gè)別表達(dá)抗體MGR48并具有半乳糖基化的N-聚糖的植物被選擇用于進(jìn)一步分析(XGM8)(TmXyl-GaIT-12×MGR48-31-4子代植物8)。如先前描述,從該植物中純化到單克隆重組MGR48抗體,用于MALDI-TOF的N-聚糖分析。
簡(jiǎn)而言之,在最佳條件下,將XGM8植物種植在溫室里來(lái)生產(chǎn)抗體[Elbers等,植物生理學(xué)(Plant Physiology)1261314(2001)]。進(jìn)行轉(zhuǎn)基因植物XGM8葉片的蛋白質(zhì)提取,如所述[Bakker等,美國(guó)國(guó)家科學(xué)院匯編(Proc.Nat.Acad.Sci.USA)982899(2001)],用G蛋白層析純化單克隆抗體。純化的單克隆抗體的N-聚糖的MALDI-TOF被描述(Elbers等,2001,同上文)。如所述的采用牛睪丸β-半乳糖通過(guò)酶測(cè)序來(lái)確定聚糖上是否存在半乳糖(Bakker等,2001,同上文;表2)。表2(下文)是對(duì)TmXyl-GaIT-12植物與生產(chǎn)rec-mAb(MGR48)的植物的F1雜合子的內(nèi)源性糖蛋白(“Xyl-GaIT Endo”)的N-聚糖和通過(guò)蛋白G層析從所述F1雜合子純化的rec-mAB的N-聚糖的質(zhì)譜分析(MALDI-TOF)的結(jié)構(gòu)的比較。
這些數(shù)據(jù)表明1.在F1雜合子中,聚糖的木糖基化和海藻糖基化顯著下降,內(nèi)源性糖蛋白的43%聚糖不含木糖和海藻糖,而野生型煙草植物僅為14%。
2.這種F1雜合子的純化mAb的聚糖的木糖和海藻糖降低了47%,而野生型煙草為14%,見附圖36組B-D。
3.F1雜合子的內(nèi)源性糖蛋白的半乳糖基化從Ga1T植物的9%增加到F1TmXyl-GaIT X MGR48植物的37%。見附圖35。
4.從所述F1中純化的rec-mAb的半乳糖基化升高(見附圖36組A);即46%具有半乳糖。見附圖36組E。
但是應(yīng)當(dāng)指出,所觀察到的數(shù)量(MALDI-TOF)并不必然地反映體內(nèi)所述糖型的分子比例?;贛ALDI-TOF的量化可能是過(guò)低估計(jì)或過(guò)高估計(jì),取決于所試驗(yàn)的特定糖型。此外,由于Gal和Man之間不存在分子量的差異,一些峰不能被清楚地被標(biāo)注,除非在半乳糖苷酶處理前后特定分子的相對(duì)高度具有顯著差別。
實(shí)施例4通過(guò)檢測(cè)來(lái)自雜交瘤、轉(zhuǎn)基因煙草和TmXyl-GaIT轉(zhuǎn)基因煙草中的MGR48IgG抗體,可以直接比較木糖、海藻糖和半乳糖的含量。如上所述,TmXyl-GaIT-12植物與表達(dá)MGR48IgG的煙草植物(MGR48煙草)雜交,產(chǎn)生具有MGR48 TmXyl-GaIT的F1雜合子。F1植物被選擇用于提取和純化MGR48IgG。采用G蛋白層析(Elbers等,2001.植物生理學(xué)(Plant Physiology)1261314-1322)分離和純化來(lái)自所述植物(煙草和TmXyl-GaIT)的抗體。將300ng的各種雜交瘤MGR48和植物來(lái)源的重組MGR48加載到預(yù)制的12%SDS-PAGE凝膠上(BioRad),進(jìn)行電泳。各個(gè)泳道的內(nèi)容物如下泳道1,雜交瘤MGR48;泳道2,從普通轉(zhuǎn)基因煙草植物中純化的重組MGR48;泳道3,從TmXyl-GaIT轉(zhuǎn)基因植物中純化的重組MGR48。在SDS-PAGE之后,用CAPS緩沖液將蛋白質(zhì)轉(zhuǎn)移到硝化纖維上。斑點(diǎn)與A,抗小鼠IgG;B,多克隆兔抗-HRP(抗木糖/α1,3-海藻糖);C,抗木糖;D,抗(α1,3-)海藻糖抗體;和E,生物素化RCA一起溫育。在與HRP標(biāo)記的綿羊抗小鼠(組A)或山羊抗兔(組B-D)抗體和HRP-標(biāo)記的鏈霉抗生物素(E)溫育后,在Lumi圖像儀中用Lumi光進(jìn)行檢測(cè)。
組A表明,在所有泳道中加載了幾乎相同含量的MGR48IgG。L是指MGR48IgG輕鏈,H是指MGR48IgG的重鏈。組B表示MGR48抗體重鏈在泳道2(煙草)中如期望的與抗HRP激烈反應(yīng),而來(lái)自雜交瘤的MGR48的重鏈(泳道1)不反應(yīng)(如預(yù)期)。來(lái)源雜交瘤的抗體不含有木糖和α1,3-海藻糖殘基。特別地,來(lái)自TmXyl-GaIT煙草植物的MGR48抗體也不反應(yīng),表明來(lái)自這種植物的抗體的重鏈的N-聚糖上的木糖和海藻糖的含量顯著降低(約90%或更多)。這得到組C(抗木糖)和D(抗海藻糖)表示的試驗(yàn)的證實(shí)。組E表明雜交瘤的MGR48抗體的重鏈(泳道1)具有半乳糖基化的N-聚糖,而煙草來(lái)源的MGR48(泳道2)沒有,兩個(gè)結(jié)果都是預(yù)期的。由于存在表達(dá)雜合酶的構(gòu)建體,來(lái)自TmXyl-GalT植物MGR48重鏈(泳道3)也具有半乳糖基化的N-聚糖。
這些數(shù)據(jù)與從先前所示采用從類似植物(煙草和TmXyl-GaIT-12植物)提取的總蛋白的類似試驗(yàn)得到的數(shù)據(jù)一致,說(shuō)明由TmXyl-GaIT基因的表達(dá)而引入煙草的新特性可以被穩(wěn)定地傳遞給子代和重組單克隆抗體。
實(shí)施例5用β-半乳糖苷酶處理來(lái)進(jìn)一步表征上述F1雜合子。表3是在用β-半乳糖苷酶處理聚糖前后,用G蛋白層析從TmXyl-GaIT和MGR48植物的F1雜合子純化的rec-mAbs的N-聚糖的質(zhì)譜分析(MALDI-TOF)結(jié)果的比較。
這些數(shù)據(jù)表明1.來(lái)自F1雜合子的Rec-mAb含有半乳糖,這可以從在β-牛乳糖處理后所觀察的特定糖型(含半乳糖)的減少和不含有半乳糖的糖型的增加推導(dǎo)出。觀察到m/z 1622從6%降低到1%,同時(shí)m/z 1460從10%升高到14%,這是由于從GalGNM5去除半乳糖而加上了GNM5所致。m/z 1768(3%降低到1%)和相應(yīng)的m/z 1606峰(從4%增加到6%)情況也如此。見附圖36組E。
2.類似地,大量的峰是由于牛乳糖處理使含有半乳糖的聚糖減少導(dǎo)致的,特別是m/z 1501,1647和1663,說(shuō)明存在半乳糖。
實(shí)施例6在另一個(gè)實(shí)施方案中,昆蟲甘露糖苷酶III基因(登錄號(hào)AF005034;錯(cuò)誤地標(biāo)注為甘露糖苷酶II基因!)的氨基末端的CTS區(qū)用進(jìn)入內(nèi)質(zhì)網(wǎng)的小鼠信號(hào)肽編碼序列取代(見附圖37)。編碼完全活性的信號(hào)肽的信號(hào)肽序列通常存在于IgG序列的氨基末端,先前已經(jīng)在植物和其他生物體中成功地被使用。而且,編碼所謂的內(nèi)質(zhì)網(wǎng)滯留序列(KDEL)的人工序列被添加到編碼ER滯留的催化片段的基因部分的羧基末端。因此,由該基因序列編碼的雜合型甘露糖苷酶III優(yōu)選沉積在內(nèi)質(zhì)網(wǎng)中。
實(shí)施例7在另一個(gè)實(shí)施方案中,人β-1,4半乳糖基轉(zhuǎn)移酶(GalT)基因(登錄號(hào)A52551)的氨基末端CTS區(qū)用編碼進(jìn)入內(nèi)質(zhì)網(wǎng)的小鼠信號(hào)肽的編碼序列取代(見附圖39)。編碼完全活性的信號(hào)肽的信號(hào)肽序列通常存在于IgG序列的氨基末端,已經(jīng)在植物和其他生物體中成功地被使用。而且,編碼所謂內(nèi)質(zhì)網(wǎng)滯留序列(KDEL)的合成序列被添加到編碼ER滯留的催化片段的基因部分的羧基末端。由該基因序列編碼的雜合β-1,4半乳糖基轉(zhuǎn)移酶蛋白將優(yōu)選地沉積在內(nèi)質(zhì)網(wǎng)中。
實(shí)施例8在另一個(gè)實(shí)施方案中,擬南芥GnTI(登錄號(hào)AJ243198)的氨基末端的CTS區(qū)用編碼進(jìn)入內(nèi)質(zhì)網(wǎng)的小鼠信號(hào)肽編碼序列取代(見附圖41)。編碼完全活性的信號(hào)肽的信號(hào)肽序列通常存在于IgG序列的氨基末端,已經(jīng)在植物和其他生物體中成功使用。而且,編碼所謂內(nèi)質(zhì)網(wǎng)滯留序列(KDEL)的人工序列被添加到編碼ER滯留的催化片段的基因部分的羧基末端。由該基因序列編碼的雜合GnTI蛋白將優(yōu)選地沉積在內(nèi)質(zhì)網(wǎng)中。
實(shí)施例9
在另一個(gè)實(shí)施方案中,擬南芥GnTII(登錄號(hào)AJ249274)的氨基末端的CTS區(qū)用編碼進(jìn)入內(nèi)質(zhì)網(wǎng)的小鼠信號(hào)肽編碼序列取代(見附圖43)。編碼完全活性的信號(hào)肽的信號(hào)肽序列通常存在于IgG序列的氨基末端,已經(jīng)在植物和其他生物體中成功地使用。而且,編碼所謂內(nèi)質(zhì)網(wǎng)滯留序列(KDEL)的人工序列被添加到編碼ER滯留的催化片段的基因部分的羧基末端。由該基因序列編碼的雜合GnTII蛋白將優(yōu)選地沉積在內(nèi)質(zhì)網(wǎng)中。
實(shí)施例10在另一個(gè)實(shí)施方案中,人β-1,4-半乳糖基轉(zhuǎn)移酶(GalT)基因氨基末端的CTS區(qū)用人GnTI(TmhuGnTI-GaIT)的CTS區(qū)基因取代(見附圖45)。
應(yīng)當(dāng)理解,本發(fā)明不限于任何特定機(jī)制。也不需要理解該機(jī)制來(lái)成功應(yīng)用本發(fā)明的各種實(shí)施方案。但是,一般認(rèn)為,高爾基體酶是連續(xù)分布的(附圖47),植物糖基轉(zhuǎn)移酶的跨膜結(jié)構(gòu)域的交換引起重新定位(附圖48)。
一般認(rèn)為,本發(fā)明不限于在此描述的特定方法、操作、細(xì)胞系、載體和試劑,它們是可改變的。還應(yīng)當(dāng)理解,在此所用的術(shù)語(yǔ)僅是用于描述特定實(shí)施方案的目的,而不是限定本發(fā)明的保護(hù)范圍。應(yīng)當(dāng)指出,在此和附加的權(quán)利要求中,除非文章中清楚指出,單數(shù)形式包括復(fù)數(shù)形式。除非另外定義,在此所用的所有科技術(shù)語(yǔ)具有本發(fā)明所屬領(lǐng)域的普通技術(shù)人員通常理解的相同意義。
由于實(shí)施方案是用于闡明本發(fā)明的各個(gè)方面,在此描述和要求保護(hù)的發(fā)明不被限定在本文描述的特定實(shí)施例中。任何等價(jià)的實(shí)施方案被認(rèn)為在本發(fā)明的保護(hù)范圍內(nèi)。實(shí)際上,除了本文給出和描述的內(nèi)容,本發(fā)明的各種改進(jìn)對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō)根據(jù)先前描述的是顯而易見的。這種改進(jìn)也被認(rèn)為落入附加權(quán)利要求的保護(hù)范圍中。
本文引用的各種參考文獻(xiàn)及其公開的內(nèi)容全部被引入作為參考。
序列表<110>國(guó)際植物研究所<120>在植物中優(yōu)化聚糖生成<130>62861A-P033486W0<150>US-60/365,735<151>2002-03-19<160>59<170>PatentIn version 3.2<210>1<211>1197<212>DNA<213>類人<400>1atgaggcttc gggagccgct cctgagcggc agcgccgcga tgccaggcgc gtccctacag60cgggcctgcc gcctgctcgt ggccgtctgc gctctgcacc ttggcgtcac cctcgtttac120tacctggctg gccgcgacct gagccgcctg ccccaactgg tcggagtctc cacaccgctg180cagggcggct cgaacagtgc cgccgccatc gggcagtcct ccggggagct ccggaccgga240ggggcccggc cgccgcctcc tctaggcgcc tcctcccagc cgcgcccggg tggcgactcc300agcccagtcg tggattctgg ccctggcccc gctagcaact tgacctcggt cccagtgccc360cacaccaccg cactgtcgct gcccgcctgc cctgaggagt ccccgctgct tgtgggcccc420atgctgattg agtttaacat gcctgtggac ctggagctcg tggcaaagca gaacccaaat480gtgaagatgg gcggccgcta tgcccccagg gactgcgtct ctcctcacaa ggtggccatc540atcattccat tccgcaaccg gcaggagcac ctcaagtact ggctatatta tttgcaccca600gtcctgcagc gccagcagct ggactatggc atctatgtta tcaaccaggc gggagacact660atattcaatc gtgctaagct cctcaatgtt ggctttcaag aagccttgaa ggactatgac720tacacctgct ttgtgtttag tgacgtggac ctcattccaa tgaatgacca taatgcgtac780aggtgttttt cacagccacg gcacatttcc gttgcaatgg ataagtttgg attcagccta840ccttatgttc agtattttgg aggtgtctct gctctaagta aacaacagtt tctaaccatc900aatggatttc ctaataatta ttggggctgg ggaggagaag atgatgacat ttttaacaga960ttagttttta gaggcatgtc tatatctcgc ccaaatgctg tggtcgggag gtgtcgcatg1020atccgccact caagagacaa gaaaaatgaa cccaatcctc agaggtttga ccgaattgca1080cacacaaagg agacaatgct ctctgatggt ttgaactcac tcacctacca ggtgctggat1140gtacagagat acccattgta tacccaaatc acagtggaca tcgggacacc gagctag 1197<210>2<211>398<212>PRT<213>類人<400>2Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala Ala Met Pro Gly1 5 10 15Ala Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val Cys Ala Leu20 25 30His Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg Asp Leu Ser35 40 45Arg Leu Pro Gln Leu Val Gly Val Ser Thr Pro Leu Gln Gly Gly Ser50 55 60Asn Ser Ala Ala Ala Ile Gly Gln Ser Ser Gly Glu Leu Arg Thr Gly
65 70 75 80Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg Pro85 90 95Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala Ser100 105 110Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu Pro115 120 125Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile Glu130 135 140Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro Asn145 150 155 160Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro His165 170 175Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu Lys180 185 190Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu Asp195 200 205Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe Asn Arg210 215 220Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr Asp225 230 235 240Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asn Asp245 250 255His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val Ala260 265 270Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe Gly Gly275 280 285Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe Pro290 295 300Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn Arg305 310 315 320Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val Val Gly325 330 335Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro Asn340 345 350Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu Ser355 360 365Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg Tyr370 375 380Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser385 390 395<210>3<211>1152<212>DNA<213>雜合體
<400>3atgagtaaac ggaatccgaa gattctgaag atttttctgt atatgttact tctcaactct 60ctctttctca tcatctactt cgtttttcac tcatcgtcgt tttcaccgga gcagtcacag 120cctcctcata tataccacgt ttcagtgaat aaccaatcgg cgatcgggca gtcctccggg 180gagctccgga ccggaggggc ccggccgccg cctcctctag gcgcctcctc ccagccgcgc 240ccgggtggcg actccagccc agtcgtggat tctggccctg gccccgctag caacttgacc 300tcggtcccag tgccccacac caccgcactg tcgctgcccg cctgccctga ggagtccccg 360ctgcttgtgg gccccatgct gattgagttt aacatgcctg tggacctgga gctcgtggca 420aagcagaacc caaatgtgaa gatgggcggc cgctatgccc ccagggactg cgtctctcct 480cacaaggtgg ccatcatcat tccattccgc aaccggcagg agcacctcaa gtactggcta 540tattatttgc acccagtcct gcagcgccag cagctggact atggcatcta tgttatcaac 600caggcgggag acactatatt caatcgtgct aagctcctca atgttggctt tcaagaagcc 660ttgaaggact atgactacac ctgctttgtg tttagtgacg tggacctcat tccaatgaat 720gaccataatg cgtacaggtg tttttcacag ccacggcaca tttccgttgc aatggataag 780tttggattca gcctacctta tgttcagtat tttggaggtg tctctgctct aagtaaacaa 840cagtttctaa ccatcaatgg atttcctaat aattattggg gctggggagg agaagatgat 900gacattttta acagattagt ttttagaggc atgtctatat ctcgcccaaa tgctgtggtc 960gggaggtgtc gcatgatccg ccactcaaga gacaagaaaa atgaacccaa tcctcagagg1020tttgaccgaa ttgcacacac aaaggagaca atgctctctg atggtttgaa ctcactcacc1080taccaggtgc tggatgtaca gagataccca ttgtataccc aaatcacagt ggacatcggg1140acaccgagct ag1152<210>4<211>383<212>PRT<213>雜合體<400>4Met Ser Lys Arg Asn Pro Lys Ile Leu Lys Ile Phe Leu Tyr Met Leu1 5 10 15Leu Leu Asn Ser Leu Phe Leu Ile Ile Tyr Phe Val Phe His Ser Ser20 25 30Ser Phe Ser Pro Glu Gln Ser Gln Pro Pro His Ile Tyr His Val Ser35 40 45Val Asn Asn G1n Ser Ala Ile Gly Gln Ser Ser Gly Glu Leu Arg Thr50 55 60Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg65 70 75 80Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala85 90 95Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu100 105 110Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile115 120 125Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro130 135 140Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro145 150 155 160His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu165 170 175Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu180 185 190Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala3Gly Asp Thr Ile Phe Asn195 200 205
Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr210 215 220Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asn225 230 235 240Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val245 250 255Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val G1n Tyr Phe Gly260 265 270Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe275 280 285Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn290 295 300Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Va1 Val305 310 315 320Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro325 330 335Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu340 345 350Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg355 360 365Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser370 375 380<210>5<211>1642<212>DNA<213>類人<400>5ccatggtgat gagacgctac aagctctttc tcatgttctg tatggccggc ctgtgcctca60tctccttcct gcacttcttc aagaccctgt cctatgtcac cttcccccga gaactggcct120ccctcagccc taacctggtg tccagctttt tctggaacaa tgccccggtc acgccccagg180ccagccccga gccaggaggc cctgacctgc tgcgtacccc actctactcc cactcgcccc240tgctgcagcc gctgccgccc agcaaggcgg ccgaggagct ccaccgggtg gacttggtgc300tgcccgagga caccaccgag tatttcgtgc gcaccaaggc cggcggcgtc tgcttcaaac360ccggcaccaa gatgctggag aggccgcccc cgggacggcc ggaggagaag cctgaggggg420ccaacggctc ctcggcccgg cggccacccc ggtacctcct gagcgcccgg gagcgcacgg480ggggccgagg cgcccggcgc aagtgggtgg agtgcgtgtg cctgcccggc tggcacggac540ccagctgcgg cgtgcccact gtggtgcagt actccaacct gcccaccaag gagcggctgg600tgcccaggga ggtgccgcgc cgcgtcatca acgccatcaa cgtcaaccac gagttcgacc660tgctggacgt gcgcttccac gagctgggcg acgtggtgga cgcctttgtg gtgtgcgagt720ccaacttcac ggcttatggg gagccgcggc cgctcaagtt ccgggagatg ctgaccaatg780gcaccttcga gtacatccgc cacaaggtgc tctatgtctt cctggaccac ttcccgcccg840gcggccggca ggacggctgg atcgccgacg actacctgcg caccttcctc acccaggacg900gcgtctcgcg gctgcgcaac ctgcggcccg acgacgtctt catcattgac gatgcggacg960agatcccggc ccgtgacggc gtccttttcc tcaagctcta cgatggctgg accgagccct1020tcgccttcca catgcgcaag tcgctctacg gcttcttctg gaagcagccg ggcaccctgg1080aggtggtgtc aggctgcacg gtggacatgc tgcaggcagt gtatgggctg gacggcatcc1140gcctgcgccg ccgccagtac tacaccatgc ccaacttcag acagtatgag aaccgcaccg1200gccacatcct ggtgcagtgg tcgctgggca gccccctgca cttcgccggc tggcactgct1260cctggtgctt cacgcccgag ggcatctact tcaagctcgt gtccgcccag aatggcgact1320tcccacgctg gggtgactac gaggacaagc gggacctgaa ctacatccgc ggcctgatcc1380gcaccggggg ctggttcgac ggcacgcagc aggagtaccc gcctgcagac cccagcgagc1440acatgtatgc gcccaagtac ctgctgaaga actacgaccg gttccactac ctgctggaca1500acccctacca ggagcccagg agcacggcgg cgggcgggtg gcgccacagg ggtcccgagg1560gaaggccgcc cgcccggggc aaactggacg aggcggaagt cgaacaaaaa ctcatctcag1620
aagaggatct gaattaggat cc 1642<210>6<211>544<212>PRT<213>類人<400>6Met Val Met Arg Arg Tyr Lys Leu Phe Leu Met Phe Cys Met Ala Gly1 5 10 15Leu Cys Leu Ile Ser Phe Leu His Phe Phe Lys Thr Leu Ser Tyr Val20 25 30Thr Phe Pro Arg Glu Leu Ala Ser Leu Ser Pro Asn Leu Val Ser Ser35 40 45Phe Phe Trp Asn Asn Ala Pro Val Thr Pro Gln Ala Ser Pro Glu Pro50 55 60Gly Gly Pro Asp Leu Leu Arg Thr Pro Leu Tyr Ser His Ser Pro Leu65 70 75 80Leu Gln Pro Leu Pro Pro Ser Lys A1a Ala Glu Glu Leu His Arg Val85 90 95Asp Leu Val Leu Pro Glu Asp Thr Thr Glu Tyr Phe Val Arg Thr Lys100 105 110Ala Gly Gly Val Cys Phe Lys Pro Gly Thr Lys Met Leu Glu Arg Pro115 120 125Pro Pro Gly Arg Pro Glu Glu Lys Pro Glu Gly Ala Asn Gly Ser Ser130 135 140Ala Arg Arg Pro Pro Arg Tyr Leu Leu Ser Ala Arg Glu Arg Thr Gly145 150 155 160Gly Arg Gly Ala Arg Arg Lys Trp Val Glu Cys Val Cys Leu Pro Gly165 170 175Trp His Gly Pro Ser Cys Gly Val Pro Thr Val Val Gln Tyr Ser Asn180 185 190Leu Pro Thr Lys Glu Arg Leu Val Pro Arg Glu Val Pro Arg Arg Val195 200 205Ile Asn Ala Ile Asn Val Asn His Glu Phe Asp Leu Leu Asp Val Arg210 215 220Phe His Glu Leu Gly Asp Val Val Asp Ala Phe Val Val Cys Glu Ser225 230 235 240Asn Phe Thr Ala Tyr Gly Glu Pro Arg Pro Leu Lys Phe Arg Glu Met245 250 255Leu Thr Asn Gly Thr Phe Glu Tyr Ile Arg His Lys Val Leu Tyr Val260 265 270Phe Leu Asp His Phe Pro Pro Gly Gly Arg Gln Asp Gly Trp Ile Ala275 280 285Asp Asp Tyr Leu Arg Thr Phe Leu Thr Gln Asp Gly Val Ser Arg Leu290 295 300Arg Asn Leu Arg Pro Asp Asp Val Phe Ile Ile5Asp Asp Ala Asp Glu
305 310 315 320Ile Pro Ala Arg Asp Gly Val Leu Phe Leu Lys Leu Tyr Asp Gly Trp325 330 335Thr Glu Pro Phe Ala Phe His Met Arg Lys Ser Leu Tyr Gly Phe Phe340 345 350Trp Lys Gln Pro Gly Thr Leu Glu Val Val Ser Gly Cys Thr Val Asp355 360 365Met Leu Gln Ala Val Tyr Gly Leu Asp Gly Ile Arg Leu Arg Arg Arg370 375 380Gln Tyr Tyr Thr Met Pro Asn Phe Arg Gln Tyr Glu Asn Arg Thr Gly385 390 395 400His Ile Leu Val Gln Trp Ser Leu Gly Ser Pro Leu His Phe Ala Gly405 410 415Trp His Cys Ser Trp Cys Phe Thr Pro Glu Gly Ile Tyr Phe Lys Leu420 425 430Val Ser Ala Gln Asn Gly Asp Phe Pro Arg Trp Gly Asp Tyr Glu Asp435 440 445Lys Arg Asp Leu Asn Tyr Ile Arg Gly Leu Ile Arg Thr Gly Gly Trp450 455 460Phe Asp Gly Thr Gln Gln Glu Tyr Pro Pro Ala Asp Pro Ser Glu His465 470 475 480Met Tyr Ala Pro Lys Tyr Leu Leu Lys Asn Tyr Asp Arg Phe His Tyr485 490 495Leu Leu Asp Asn Pro Tyr Gln Glu Pro Arg Ser Thr Ala Ala Gly Gly500 505 510Trp Arg His Arg Gly Pro Glu Gly Arg Pro Pro Ala Arg Gly Lys Leu515 520 525Asp Glu Ala Glu Val Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn530 535 540<210>7<211>10<212>PRT<213>人工序列<220>
<223>合成的<400>7Glu Gln Lys Leu IIe Ser Glu Glu Asp Leu1 5 10<210>8<211>31<212>PRT<213>類人<400>8Gln Glu Pro Arg Ser Thr Ala Ala Gly Gly Trp Arg His Arg Gly Pro1 5 10 l5
Glu Gly Arg Pro Pro Ala Arg Gly Lys Leu Asp Glu Ala Glu Val20 25 30<210>9<211>1614<212>DNA<213>雜合體<400>9catgagtaaa cggaatccga agattctgaa gatttttctg tatatgttac ttctcaactc60tctctttctc atcatctact tcgtttttca ctcatcgtcg ttttcaccgg agcagtcaca120gcctcctcat atataccacg tttcagtgaa taaccaatcg gcacatggag gccctgacct180gctgcgtacc ccactctact cccactcgcc cctgctgcag ccgctgccgc ccagcaaggc240ggccgaggag ctccaccggg tggacttggt gctgcccgag gacaccaccg agtatttcgt300gcgcaccaag gccggcggcg tctgcttcaa acccggcacc aagatgctgg agaggccgcc360cccgggacgg ccggaggaga agcctgaggg ggccaacggc tcctcggccc ggcggccacc420ccggtacctc ctgagcgccc gggagcgcac ggggggccga ggcgcccggc gcaagtgggt480ggagtgcgtg tgcctgcccg gctggcacgg acccagctgc ggcgtgccca ctgtggtgca540gtactccaac ctgcccacca aggagcggct ggtgcccagg gaggtgccgc gccgcgtcat600caacgccatc aacgtcaacc acgagttcga cctgctggac gtgcgcttcc acgagctggg660cgacgtggtg gacgcctttg tggtgtgcga gtccaacttc acggcttatg gggagccgcg720gccgctcaag ttccgggaga tgctgaccaa tggcaccttc gagtacatcc gccacaaggt780gctctatgtc ttcctggacc acttcccgcc cggcggccgg caggacggct ggatcgccga840cgactacctg cgcaccttcc tcacccagga cggcgtctcg cggctgcgca acctgcggcc900cgacgacgtc ttcatcattg acgatgcgga cgagatcccg gcccgtgacg gcgtcctttt960cctcaagctc tacgatggct ggaccgagcc cttcgccttc cacatgcgca agtcgctcta1020cggcttcttc tggaagcagc cgggcaccct ggaggtggtg tcaggctgca cggtggacat1080gctgcaggca gtgtatgggc tggacggcat ccgcctgcgc cgccgccagt actacaccat1140gcccaacttc agacagtatg agaaccgcac cggccacatc ctggtgcagt ggtcgctggg1200cagccccctg cacttcgccg gctggcactg ctcctggtgc ttcacgcccg agggcatcta1260cttcaagctc gtgtccgccc agaatggcga cttcccacgc tggggtgact acgaggacaa1320gcgggacctg aactacatcc gcggcctgat ccgcaccggg ggctggttcg acggcacgca1380gcaggagtac ccgcctgcag accccagcga gcacatgtat gcgcccaagt acctgctgaa1440gaactacgac cggttccact acctgctgga caacccctac caggagccca ggagcacggc1500ggcgggcggg tggcgccaca ggggtcccga gggaaggccg cccgcccggg gcaaactgga1560cgaggcggaa gtcgaacaaa aactcatctc agaagaggat ctgaattagg atcc 1614<210>10<211>535<212>PRT<213>雜合體<400>10Met Ser Lys Arg Asn Pro Lys Ile Leu Lys Ile Phe Leu Tyr Met Leu1 5 10 15Leu Leu Asn Ser Leu Phe Leu Ile Ile Tyr Phe Val Phe His Ser Ser20 25 30Ser Phe Ser Pro Glu Gln Ser Gln Pro Pro His Ile Tyr His Val Ser35 40 45Val Asn Asn Gln Ser Ala His Gly Gly Pro Asp Leu Leu Arg Thr Pro50 55 60Leu Tyr Ser His Ser Pro Leu Leu Gln Pro Leu Pro Pro Ser Lys Ala65 7O 75 80Ala Glu Glu Leu His Arg Val Asp Leu Val Leu Pro Glu Asp Thr Thr85 90 95Glu Tyr Phe Val Arg Thr Lys Ala Gly Gly Val Cys Phe Lys Pro Gly100 105 110
Thr Lys Met Leu Glu Arg Pro Pro Pro Gly Arg Pro Glu Glu Lys Pro115 120 125Glu Gly Ala Asn Gly Ser Ser Ala Arg Arg Pro Pro Arg Tyr Leu Leu130 135 140Ser Ala Arg Glu Arg Thr Gly Gly Arg Gly Ala Arg Arg Lys Trp Val145 150 155 160Glu Cys Val Cys Leu Pro Gly Trp His Gly Pro Ser Cys Gly Val Pro165 170 175Thr Val Val Gln Tyr Ser Asn Leu Pro Thr Lys Glu Arg Leu Val Pro180 185 190Arg Glu Val Pro Arg Arg Val Ile Asn Ala Ile Asn Val Asn His Glu195 200 205Phe Asp Leu Leu Asp Val Arg Phe His Glu Leu Gly Asp Val Val Asp210 215 220Ala Phe Val Val Cys Glu Ser Asn Phe Thr Ala Tyr Gly Glu Pro Arg225 230 235 240Pro Leu Lys Phe Arg Glu Met Leu Thr Asn Gly Thr Phe Glu Tyr Ile245 250 255Arg His Lys Val Leu Tyr Val Phe Leu Asp His Phe Pro Pro Gly Gly260 265 270Arg Gln Asp Gly Trp Ile Ala Asp Asp Tyr Leu Arg Thr Phe Leu Thr275 280 285Gln Asp Gly Val Ser Arg Leu Arg Asn Leu Arg Pro Asp Asp Val Phe290 295 300Ile Ile Asp Asp Ala Asp Glu Ile Pro Ala Arg Asp Gly Val Leu Phe305 310 315 320Leu Lys Leu Tyr Asp Gly Trp Thr Glu Pro Phe Ala Phe His Met Arg325 330 335Lys Ser Leu Tyr Gly Phe Phe Trp Lys Gln Pro Gly Thr Leu Glu Val340 345 350Val Ser Gly Cys Thr Val Asp Met Leu Gln Ala Val Tyr Gly Leu Asp355 360 365Gly Ile Arg Leu Arg Arg Arg Gln Tyr Tyr Thr Met Pro Asn Phe Arg370 375 380Gln Tyr Glu Asn Arg Thr Gly His Ile Leu Val Gln Trp Ser Leu Gly385 390 395 400Ser Pro Leu His Phe Ala Gly Trp His Cys Ser Trp Cys Phe Thr Pro405 410 415Glu Gly Ile Tyr Phe Lys Leu Val Ser Ala Gln Asn Gly Asp Phe Pro420 425 430Arg Trp Gly Asp Tyr Glu Asp Lys Arg Asp Leu Asn Tyr Ile Arg Gly435 440 445Leu Ile Arg Thr Gly Gly Trp Phe Asp Gly Thr Gln Gln Glu Tyr Pro450 455 460Pro Ala Asp Pro Ser Glu His Met Tyr Ala Pro Lys Tyr Leu Leu Lys465 470 475 480
Asn Tyr Asp Arg Phe His Tyr Leu Leu Asp Asn Pro Tyr Gln Glu Pro485 490 495Arg Ser Thr Ala Ala Gly Gly Trp Arg His Arg Gly Pro Glu Gly Arg500 505 510Pro Pro Ala Arg Gly Lys Leu Asp Glu Ala Glu Val Glu Gln Lys Leu515 520 525Ile Ser Glu Glu Asp Leu Asn530 535<210>11<211>13<212>DNA<213>人工序列<220>合成的<223>
<400>11aatacttcca ccc 13<210>12<211>34<212>DNA<213>人工序列<220>
<223>合成的<400>12ccacccgtta acaatgaagatgagacgcta caag 34<210>13<211>29<212>DNA<213>人工序列<220>
<223>合成的<400>13gggccatgga gatgagacgc tacaagctc 29<210>14<211>28<212>DNA<213>人工序列<220>合成的<223>
<400>14ggatccaatg aagatgagac gctacaag 28<210>15<211>41<212>DNA<213>人工序列<220>
<223>合成的<400>15gggcccggga gatcctaatt cagatcctct tctgagatga g 41<210>16<211>35<212>DNA<213>人工序列<220>
<223>合成的<400>16cccggatcct aattcagatc ctcttctgag atgag 35<210>17<211>38<212>DNA<213>人工序列<220>
<223>合成的<400>17gggtctagat cctaattcag atcctcttct gagatgag 38<210>18<211>35<212>DNA<213>人工序列<220>
<223>合成的<400>18ccacccgtta acaatgagta aacggaatcc gaaga 35<210>19<211>35<212>DNA<213>人工序列<220>
<223>合成的<400>19gggccatggg taaacggaat ccgaagattc tgaag 35<210>20<211>34<212>DNA<213>人工序列<220>
<223>合成的<400>20cccggatcca tgagtaaacg gaatccgaag attc 34<210>21<211>29
<212>DNA<213>人工序列<220>
<223>合成的<400>21gcgccccggg acgctagctc ggtgtcccg 29<210>22<211>25<212>DNA<213>人工序列<220>
<223>合成的<400>22cccggatcca cgctagctcg gtgtc 25<210>23<211>31<212>DNA<213>人工序列<220>
<223>合成的<400>23gggtctagat ccacgctagc tcggtgtccc g31<210>24<211>39<212>DNA<213>人工序列<220>
<223>合成的<400>24ccacccgtta acaatgaggc ttcgggagcc gctcctgag39<210>25<211>31<212>DNA<213>人工序列<220>
<223>合成的<400>25gggccatggg gcttcgggag ccgctcctga g31<210>26<211>35<212>DNA<213>人工序列<220>
<223>合成的<400>26cccggatcca tgaggcttcg ggagccgctc ctgagll 35
<210>27<211>7155<212>DNA<213>雜合體<400>27ggcgcgcctc gaggcgatcg cagatctaat ctaaccaatt acgatacgct ttgggtacac60ttgatttttg tttcagtggt tacatatatc ttgttttata tgctatcttt aaggatctgc120acaaagatta tttgttgatg ttcttgatgg ggctcagaag atttgatatg atacactcta180atctttagga gataccagcc aggattatat tcagtaagac aatcaaattt tacgtgttca240aactcgttat cttttcattc aaaggatgag ccagaatctt tatagaatga ttgcaatcga300gaatatgttc ggccgatatg cctttgttgg cttcaatatt ctacatatca cacaagaatc360gaccgtattg taccctcttt ccataaagga aaacacaata tgcagatgct tttttcccac420atgcagtaac atataggtat tcaaaaatgg ctaaaagaag ttggataaca aattgacaac480tatttccatt tctgttatat aaatttcaca acacacaaaa gcccgtaatc aagagtctgc540ccatgtacga aataacttct attatttggt attgggccta agcccagctc agagtacgtg600ggggtaccac atataggaag gtaacaaaat actgcaagat agccccataa cgtaccagcc660tctccttacc acgaagagat aagatataag acccaccctg ccacgtgtca catcgtcatg720gtggttaatg ataagggatt acatccttct atgtttgtgg acatgatgca tgtaatgtca780tgagccacag gatccaatgg ccacaggaac gtaagaatgt agatagattt gattttgtcc840gttagatagc aaacaacatt ataaaaggtg tgtatcaata ggaactaatt cactcattgg900attcatagaa gtccattcct cctaagtatc tagaaaccat ggcgaggatc tcgtgtgact960tgagatttct tctcatcccg gcagctttca tgttcatcta catccagatg aggcttttcc1020agacgcaatc acagtatgca gatcgcctca gttccgctat cgaatctgag aaccattgca1080ctagtcaaat gcgaggcctc atagatgaag ttagcatcaa acagtcgcgg attgttgccc1140tcgaagatat gaagaaccgc caggacgaag aacttgtgca gcttaaggat ctaatccaga1200cgtttgaaaa aaaaggaata gcaaaactca ctcaaggtgg agccatggat tccaattcag1260gcgccgtcgt tgatatcaca actaaagatc tatacgatag gattgagttt cttgatacag1320atggtggtcc atggaaacaa ggttggagag ttacgtataa agacgatgag tgggagaaag1380agaagctcaa aatcttcgtt gttcctcatt ctcataacga tcctggttgg aaattgactg1440tagaggagta ttatcagaga caatccagac atattcttga caccattgtt gagactttat1500ctaaggtatg acgaaagttt ttgcttttgg ttttaatatt ttaattctct cccatggttal560tcccgtgaac aatcttaaat gtcttaaaat tctcatgacg tcattaaact ctataaccaa1620acttctttgc tgggttctgt ttttttttag tttcgtgatg aaacagagtt ctagaagttc1680gttcttttgg aaaatttgaa gtctttggag ctaaagtttg tttttttatt actgggtttt1740gagattgaag gatagctaga atcttatttg tgtgggggtt tgttttgaat atgtttaata1800ggattcaaga agaaagttta tatgggagga gatgtcatat ctggagagat ggtggagaga1860cgcttcacct aataaacaag aagctttgac taaattggtt aaggatgggc agctagagat1920tgttggaggt ggctgggtta tgaatgatga ggctaattca cattattttg ccataattga1980acagatagca gagggtaata tgtggctgaa tgacacaatt ggggttattc ctaagaattc2040ttgggctata gatccctttg gctattcatc aaccatggct tatcttctcc ggcgtatggg2100ttttgaaaac atgcttattc aaaggactca ttacgagctc aagaaagacc ttgcccagca2160taagaatctt gaatatattt ggcgtcagag ctgggatgct atggaaacca cagatatctt2220tgttcatatg atgccgtttt attcatacga tatcccacac acttgtggac cagagcctgc2280aatttgctgt cagtttgatt tcgctcggat gcggggattt aagtatgaac tttgtccatg2340gggaaagcac ccagtggaga ccacactaga aaatgtgcag gagagggcat taaagcttct2400ggatcaatac aggaaaaaat ccactctata tcgaactaat acacttctta tacctcttgg2460agatgatttt aggtacatta gtatcgatga agccgaggct cagttccgta actaccagat2520gttgtttgat cacatcaact ctaatcctag tctaaacgca gaagcaaagt ttggtacttt2580ggaggattat ttcagaacag tccgagaaga agcagacaga gtgaattatt ctcgtcctgg2640tgaggttggc tctggtcagg ttgttggttt cccttctctg tcaggtgact tctttacata2700tgcagatagg caacaagact attggagtgg ttattatgtt tcaagacctt tcttcaaagc2760tgttgatcgt gtgctcgagc atacccttcg tggagctgag atcatgatgt catttctgct2820aggttattgc catcgaattc aatgtgagaa atttccaaca agttttacgt ataagttgac2880tgctgcaaga agaaatctgg ctcttttcca gcaccatgat ggggtaactg gaactgctaa2940ggattatgtg gtacaagatt acggcacccg gatgcatact tcattgcaag accttcagat3000ctttatgtct aaagcaatcg aagttcttct tgggatccgc cacgagaaag aaaaatctga3060tcaatcccca tcatttttcg aggcagagca aatgagatca aagtatgatg ctcggccagt3120tcacaagcca attgctgccc gggaaggaaa ttcgcacaca gttatactct tcaatccatc3180agaacagacg agagaggagg tggtgacggt tgttgttaac cgcgctgaaa tctcggtttt3240ggactcaaac tggacttgtg tccctagcca aatttctcct gaagtgcagc atgacgatac3300caaactattc accggcagac atcgccttta ctggaaagct tccatcccag ctcttggtct3360gagaacatat ttcattgcta atgggaatgt cgagtgtgag aaagctactc cgtctaaact3420caaatacgct tctgagtttg acccatttcc ttgtcctcct ccatattcct gctccaaact3480ggacaacgac gttactgaga tccgaaatga acatcagact cttgtgtttg atgtgaagaa3540cggatcactg cggaagatag tccatagaaa cggatcagag actgttgtgg gagaagagat3600
aggtatgtac tctagtccag agagtggagc ttacctgttc aaaccagatg gtgaagctca3660gccaattgtt caacctgatg gacatgtagt cacctctgag ggtctgctgg ttcaagaagt3720cttctcttac cctaaaacca aatgggagaa atcacccctc tctcagaaaa ctcgtcttta3780cactggaggt aatacgcttc aggatcaagt ggtcgagata gaatatcatg ttgagcttct3840tggtaatgat tttgatgacc gggaattgat tgtccggtac aagactgatg ttgacaacaa3900gaaggtcttc tattcagatc tcaatggttt ccaaatgagc aggagagaaa cttatgataa3960gatccctctt caaggaaact actacccaat gccatctctc gcatttatcc aaggatccaa4020tggtcagaga ttctccgtgc actctcgtca atctctcggt gttgcaagcc tcaaagaggg4080ttggttggag attatgctgg acagacggtt ggttcgtgat gacggacggg gtctagggca4140aggtgtgatg gataaccgcg caatgaccgt ggtatttcac cttcttgcgg aatctaacat4200ttctcaagca gaccctgctt ccaacactaa cccgaggaac ccttcgcttc tctctcacct4260cataggtgct cacttaaact accccataaa cacattcatt gccaagaaac cgcaagacat4320atctgtgcgt gttccacaat acggttcctt tgctccttta gccaaaccgt taccatgtga4380cctccacatt gtaaatttca aggttcctcg tccatccaaa tactctcagc aattggaaga4440agacaagcca aggttcgctc ttatcctcaa tagacgagct tgggattcag cttattgcca4500taaaggaaga caagtaaact gcacaagcat ggctaatgaa ccagtaaact tttccgacat4560gttcaaagat cttgcagctt caaaggtaaa accaacttca ctgaatctct tgcaagaaga4620tatggagatt cttgggtacg atgaccaaga gctacctcga gatagttcac agccacggga4680aggacgtgtc tcgatctctc ccatggaaat acgagcttat aagcttgaac tgcgacctca4740caagtgaacc tgctgaagat ccgctagagt ccgcaaaaat caccagtctc tctctacaaa4800tctatctctc tctatttttc tccagaataa tgtgtgagta gttcccagat aagggaatta4860gggttcttat agggtttcgc tcatgtgttg agcatataag aaacccttag tatgtatttg4920tatttgtaaa atacttctat caataaaatt tctaatccta aaaccaaaat cccgcgcgcg4980cctcgaggcg atcgcagatc tcattatacc gttagaagca tagttaaaat ctaaagcttg5040tcgttaattc tagtcatttt acattgttgg gttctacatt attaatgaat tttctaatgc5100aaatacagaa tttaaatcaa aattgttgaa ttatgctaaa catgtaacat acgtatatct5160ccgccttgtg tgttgtatta acttgaagtt atcataagaa ccacaaatac actagtaaat5220ctatgagaag gcaggtggca acacaaacaa gagtatctaa gattttcatt tgtgactata5280ggaatataat atctcttatc tgatttaatg aatccacatg ttcacttctc atttgtccac5340aagatcacaa ctttatcttc aatattcaca acttgttata tccaccacaa tttcattctt5400ttcacttagc cccacaaaat actttgtccc cttatttgcc accttttgta tttaatttat5460tcttgtggag ctaagtgttc atattattct tcttctcaaa aaaacaaaaa caaaaaaaaa5520gagaagaaaa ccatggcgag gatctcgtgt gacttgagat ttcttctcat cccggcagct5580ttcatgttca tctacatcca gatgaggctt ttccagacgc aatcacagta tgcagatcgc5640ctcagttccg ctatcgaatc tgagaaccat tgcactagtc aaatgcgagg cctcatagat5700gaagttagca tcaaacagtc gcggattgtt gccctcgaag atatgaagaa ccgccaggac5760gaagaacttg tgcagcttaa ggatctaatc cagacgtttg aaaaaaaagg aatagcaaaa5820ctcactcaag gtggagccat ggctctaagg ttgcatagaa ggaaccattt ttcgcctaga5880aatacggatc tgttcccgga tttggcaaaa gatcgtgtgg ttatcgtctt gtatgtgcat5940aatcgggctc agtattttcg agtcacagtg gaaagtttgt cgaaggttaa aggtataagt6000gagacattgt tgattgttag tcatgatggt tactttgaag agatgaatag gattgtggag6060agtattaagt tttgtcaagt gaaacagatt ttctcgcctt attcgcctca tatatatcgt6120actagcttcc cgggtgtgac cctgaatgat tgtaagaaca agggtgatga ggcaaagggg6180cattgtgaag gtaatcctga tcagtatggg aatcatcggt ctccgaagat tgtatctttg6240aagcatcact ggtggtggat gatgaacact gtatgggatg ggttggaaga gactaaagga6300catgaggggc atatcctttt cattgaagaa gatcattttc tgtttcctaa tgcctatcgt6360aacatacaga ctcttacgag gctgaaaccc gcaaagtgtc ctgactgttt tgctgctaat6420ttagcaccgt ctgatgtgaa gtcaagagga gaagggcttg aaagtttggt tgcagagaga6480atgggaaatg ttgggtattc ttttaataga agtgtgtggg agaatattca tcagaaggca6540agagagtttt gtttctttga tgattacaac tgggatataa cgatgtgggc aacggttttc6600ccgtcgtttg gttccccggt gtacacattg cgagggccta ggactagtgc ggtacacttt6660ggaaaatgtg ggttgcatca aggtagagga gatgagggtg attgcatcga taatggggtc6720gtaaacatag aagttaagga aacagataaa gttgtgaaca taaaagaagg atggggagtt6780cgggtgtata agcatcaagc gggttataaa gccggtttcg aaggttgggg aggttggggc6840gatgataggg accgacattt atgtttggat tttgccacta tgtatcgtta cagcagtagc6900agtgcatctc catgaaacgg atccgctaga gtccgcaaaa atcaccagtc tctctctaca6960aatctatctc tctctatttt tctccagaat aatgtgtgag tagttcccag ataagggaat7020tagggttctt atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt7080tgtatttgta aaatacttct atcaataaaa tttctaatcc taaaaccaaa atcccgcgag7140agacctctta attaa 7155<210>28<211>4993<212>DNA<213>雜合體<400>28
ggcgcgcctc gaggcgatcg cagatctaat ctaaccaatt acgatacgct ttgggtacac 60ttgatttttg tttcagtggt tacatatatc ttgttttata tgctatcttt aaggatctgc 120acaaagatta tttgttgatg ttcttgatgg ggctcagaag atttgatatg atacactcta 180atctttagga gataccagcc aggattatat tcagtaagac aatcaaattt tacgtgttca 240aactcgttat cttttcattc aaaggatgag ccagaatctt tatagaatga ttgcaatcga 300gaatatgttc ggccgatatg cctttgttgg cttcaatatt ctacatatca cacaagaatc 360gaccgtattg taccctcttt ccataaagga aaacacaata tgcagatgct tttttcccac 420atgcagtaac atataggtat tcaaaaatgg ctaaaagaag ttggataaca aattgacaac 480tatttccatt tctgttatat aaatttcaca acacacaaaa gcccgtaatc aagagtctgc 540ccatgtacga aataacttct attatttggt attgggccta agcccagctc agagtacgtg 600ggggtaccac atataggaag gtaacaaaat actgcaagat agccccataa cgtaccagcc 660tctccttacc acgaagagat aagatataag acccaccctg ccacgtgtca catcgtcatg 720gtggttaatg ataagggatt acatccttct atgtttgtgg acatgatgca tgtaatgtca 780tgagccacag gatccaatgg ccacaggaac gtaagaatgt agatagattt gattttgtcc 840gttagatagc aaacaacatt ataaaaggtg tgtatcaata ggaactaatt cactcattgg 900attcatagaa gtccattcct cctaagtatc tagaaaccat ggcgaggatc tcgtgtgact 960tgagatttct tctcatcccg gcagctttca tgttcatcta catccagatg aggcttttcc 1020agacgcaatc acagtatgca gatcgcctca gttccgctat cgaatctgag aaccattgca 1080ctagtcaaat gcgaggcctc atagatgaag ttagcatcaa acagtcgcgg attgttgccc 1140tcgaagatat gaagaaccgc caggacgaag aacttgtgca gcttaaggat ctaatccaga 1200cgtttgaaaa aaaaggaata gcaaaactca ctcaaggtgg agccatggat tccaattcag 1260gcgccgtcgt tgatatcaca actaaagatc tatacgatag gattgagttt cttgatacag 1320atggtggtcc atggaaacaa ggttggagag ttacgtataa agacgatgag tgggagaaag 1380agaagctcaa aatcttcgtt gttcctcatt ctcataacga tcctggttgg aaattgactg 1440tagaggagta ttatcagaga caatccagac atattcttga caccattgtt gagactttat 1500ctaaggtatg acgaaagttt ttgcttttgg ttttaatatt ttaattctct cccatggtta 1560tcccgtgaac aatcttaaat gtcttaaaat tctcatgacg tcattaaact ctataaccaa 1620acttctttgc tgggttctgt ttttttttag tttcgtgatg aaacagagtt ctagaagttc 1680gttcttttgg aaaatttgaa gtctttggag ctaaagtttg tttttttatt actgggtttt 1740gagattgaag gatagctaga atcttatttg tgtgggggtt tgttttgaat atgtttaata 1800ggattcaaga agaaagttta tatgggagga gatgtcatat ctggagagat ggtggagaga 1860cgcttcacct aataaacaag aagctttgac taaattggtt aaggatgggc agctagagat 1920tgttggaggt ggctgggtta tgaatgatga ggctaattca cattattttg ccataattga 1980acagatagca gagggtaata tgtggctgaa tgacacaatt ggggttattc ctaagaattc 2040ttgggctata gatccctttg gctattcatc aaccatggct tatcttctcc ggcgtatggg 2100ttttgaaaac atgcttattc aaaggactca ttacgagctc aagaaagacc ttgcccagca 2160taagaatctt gaatatattt ggcgtcagag ctgggatgct atggaaacca cagatatctt 2220tgttcatatg atgccgtttt attcatacga tatcccacac acttgtggac cagagcctgc 2280aatttgctgt cagtttgatt tcgctcggat gcggggattt aagtatgaac tttgtccatg 2340gggaaagcac ccagtggaga ccacactaga aaatgtgcag gagagggcat taaagcttct 2400ggatcaatac aggaaaaaat ccactctata tcgaactaat acacttctta tacctcttgg 2460agatgatttt aggtacatta gtatcgatga agccgaggct cagttccgta actaccagat 2520gttgtttgat cacatcaact ctaatcctag tctaaacgca gaagcaaagt ttggtacttt 2580ggaggattat ttcagaacag tccgagaaga agcagacaga gtgaattatt ctcgtcctgg 2640tgaggttggc tctggtcagg ttgttggttt cccttctctg tcaggtgact tctttacata 2700tgcagatagg caacaagact attggagtgg ttattatgtt tcaagacctt tcttcaaagc 2760tgttgatcgt gtgctcgagc atacccttcg tggagctgag atcatgatgt catttctgct 2820aggttattgc catcgaattc aatgtgagaa atttccaaca agttttacgt ataagttgac 2880tgctgcaaga agaaatctgg ctcttttcca gcaccatgat ggggtaactg gaactgctaa 2940ggattatgtg gtacaagatt acggcacccg gatgcatact tcattgcaag accttcagat 3000ctttatgtct aaagcaatcg aagttcttct tgggatccgc cacgagaaag aaaaatctga 3060tcaatcccca tcatttttcg aggcagagca aatgagatca aagtatgatg ctcggccagt 3120tcacaagcca attgctgccc gggaaggaaa ttcgcacaca gttatactct tcaatccatc 3180agaacagacg agagaggagg tggtgacggt tgttgttaac cgcgctgaaa tctcggtttt 3240ggactcaaac tggacttgtg tccctagcca aatttctcct gaagtgcagc atgacgatac 3300caaactattc accggcagac atcgccttta ctggaaagct tccatcccag ctcttggtct 3360gagaacatat ttcattgcta atgggaatgt cgagtgtgag aaagctactc cgtctaaact 3420caaatacgct tctgagtttg acccatttcc ttgtcctcct ccatattcct gctccaaact 3480ggacaacgac gttactgaga tccgaaatga acatcagact cttgtgtttg atgtgaagaa 3540cggatcactg cggaagatag tccatagaaa cggatcagag actgttgtgg gagaagagat 3600aggtatgtac tctagtccag agagtggagc ttacctgttc aaaccagatg gtgaagctca 3660gccaattgtt caacctgatg gacatgtagt cacctctgag ggtctgctgg ttcaagaagt 3720cttctcttac cctaaaacca aatgggagaa atcacccctc tctcagaaaa ctcgtcttta 3780cactggaggt aatacgcttc aggatcaagt ggtcgagata gaatatcatg ttgagcttct 3840tggtaatgat tttgatgacc gggaattgat tgtccggtac aagactgatg ttgacaacaa 3900gaaggtcttc tattcagatc tcaatggttt ccaaatgagc aggagagaaa cttatgataa 3960gatccctctt caaggaaact actacccaat gccatctctc gcatttatcc aaggatccaa 4020tggtcagaga ttctccgtgc actctcgtca atctctcggt gttgcaagcc tcaaagaggg 4080
ttggttggag attatgctgg acagacggtt ggttcgtgat gacggacggg gtctagggca4140aggtgtgatg gataaccgcg caatgaccgt ggtatttcac cttcttgcgg aatctaacat4200ttctcaagca gaccctgctt ccaacactaa cccgaggaac ccttcgcttc tctctcacct4260cataggtgct cacttaaact accccataaa cacattcatt gccaagaaac cgcaagacat4320atctgtgcgt gttccacaat acggttcctt tgctccttta gccaaaccgt taccatgtga4380cctccacatt gtaaatttca aggttcctcg tccatccaaa tactctcagc aattggaaga4440agacaagcca aggttcgctc ttatcctcaa tagacgagct tgggattcag cttattgcca4500taaaggaaga caagtaaact gcacaagcat ggctaatgaa ccagtaaact tttccgacat4560gttcaaagat cttgcagctt caaaggtaaa accaacttca ctgaatctct tgcaagaaga4620tatggagatt cttgggtacg atgaccaaga gctacctcga gatagttcac agccacggga4680aggacgtgtc tcgatctctc ccatggaaat acgagcttat aagcttgaac tgcgacctca4740caagtgaacc tgctgaagat ccgctagagt ccgcaaaaat caccagtctc tctctacaaa4800tctatctctc tctatttttc tccagaataa tgtgtgagta gttcccagat aagggaatta4860gggttcttat agggtttcgc tcatgtgttg agcatataag aaacccttag tatgtatttg4920tatttgtaaa atacttctat caataaaatt tctaatccta aaaccaaaat cccgcgagag4980acctcttaat taa 4993<210>29<211>3825<212>DNA<213>雜合體<400>29ccatggcgag gatctcgtgt gacttgagat ttcttctcat cccggcagct ttcatgttca60tctacatcca gatgaggctt ttccagacgc aatcacagta tgcagatcgc ctcagttccg120ctatcgaatc tgagaaccat tgcactagtc aaatgcgagg cctcatagat gaagttagca180tcaaacagtc gcggattgtt gccctcgaag atatgaagaa ccgccaggac gaagaacttg240tgcagcttaa ggatctaatc cagacgtttg aaaaaaaagg aatagcaaaa ctcactcaag300gtggagccat ggattccaat tcaggcgccg tcgttgatat cacaactaaa gatctatacg360ataggattga gtttcttgat acagatggtg gtccatggaa acaaggttgg agagttacgt420ataaagacga tgagtgggag aaagagaagc tcaaaatctt cgttgttcct cattctcata480acgatcctgg ttggaaattg actgtagagg agtattatca gagacaatcc agacatattc540ttgacaccat tgttgagact ttatctaagg tatgacgaaa gtttttgctt ttggttttaa600tattttaatt ctctcccatg gttatcccgt gaacaatctt aaatgtctta aaattctcat660gacgtcatta aactctataa ccaaacttct ttgctgggtt ctgttttttt ttagtttcgt720gatgaaacag agttctagaa gttcgttctt ttggaaaatt tgaagtcttt ggagctaaag780tttgtttttt tattactggg ttttgagatt gaaggatagc tagaatctta tttgtgtggg840ggtttgtttt gaatatgttt aataggattc aagaagaaag tttatatggg aggagatgtc900atatctggag agatggtgga gagacgcttc acctaataaa caagaagctt tgactaaatt960ggttaaggat gggcagctag agattgttgg aggtggctgg gttatgaatg atgaggctaa1020ttcacattat tttgccataa ttgaacagat agcagagggt aatatgtggc tgaatgacac1080aattggggtt attcctaaga attcttgggc tatagatccc tttggctatt catcaaccat1140ggcttatctt ctccggcgta tgggttttga aaacatgctt attcaaagga ctcattacga1200gctcaagaaa gaccttgccc agcataagaa tcttgaatat atttggcgtc agagctggga1260tgctatggaa accacagata tctttgttca tatgatgccg ttttattcat acgatatccc1320acacacttgt ggaccagagc ctgcaatttg ctgtcagttt gatttcgctc ggatgcgggg1380atttaagtat gaactttgtc catggggaaa gcacccagtg gagaccacac tagaaaatgt1440gcaggagagg gcattaaagc ttctggatca atacaggaaa aaatccactc tatatcgaac1500taatacactt cttatacctc ttggagatga ttttaggtac attagtatcg atgaagccga1560ggctcagttc cgtaactacc agatgttgtt tgatcacatc aactctaatc ctagtctaaa1620cgcagaagca aagtttggta ctttggagga ttatttcaga acagtccgag aagaagcaga1680cagagtgaat tattctcgtc ctggtgaggt tggctctggt caggttgttg gtttcccttc1740tctgtcaggt gacttcttta catatgcaga taggcaacaa gactattgga gtggttatta1800tgtttcaaga cctttcttca aagctgttga tcgtgtgctc gagcataccc ttcgtggagc1860tgagatcatg atgtcatttc tgctaggtta ttgccatcgaattcaatgtg agaaatttcc 1920aacaagtttt acgtataagt tgactgctgc aagaagaaat ctggctcttt tccagcacca1980tgatggggta actggaactg ctaaggatta tgtggtacaa gattacggca cccggatgca2040tacttcattg caagaccttc agatctttat gtctaaagca atcgaagttc ttcttgggat2100ccgccacgag aaagaaaaat ctgatcaatc cccatcattt ttcgaggcag agcaaatgag2160atcaaagtat gatgctcggc cagttcacaa gccaattgct gcccgggaag gaaattcgca2220cacagttata ctcttcaatc catcagaaca gacgagagag gaggtggtga cggttgttgt2280taaccgcgct gaaatctcgg ttttggactc aaactggact tgtgtcccta gccaaatttc2340tcctgaagtg cagcatgacg ataccaaact attcaccggc agacatcgcc tttactggaa2400agcttccatc ccagctcttg gtctgagaac atatttcatt gctaatggga atgtcgagtg2460tgagaaagct actccgtcta aactcaaata cgcttctgag tttgacccat ttccttgtcc2520tcctccatat tcctgctcca aactggacaa cgacgttact gagatccgaa atgaacatca2580gactcttgtg tttgatgtga agaacggatc actgcggaag atagtccata gaaacggatc2640
agagactgtt gtgggagaag agataggtat gtactctagt ccagagagtg gagcttacct2700gttcaaacca gatggtgaag ctcagccaat tgttcaacct gatggacatg tagtcacctc2760tgagggtctg ctggttcaag aagtcttctc ttaccctaaa accaaatggg agaaatcacc2820cctctctcag aaaactcgtc tttacactgg aggtaatacg cttcaggatc aagtggtcga2880gatagaatat catgttgagc ttcttggtaa tgattttgat gaccgggaat tgattgtccg2940gtacaagact gatgttgaca acaagaaggt cttctattca gatctcaatg gtttccaaat3000gagcaggaga gaaacttatg ataagatccc tcttcaagga aactactacc caatgccatc3060tctcgcattt atccaaggat ccaatggtca gagattctcc gtgcactctc gtcaatctct3120cggtgttgca agcctcaaag agggttggtt ggagattatg ctggacagac ggttggttcg3180tgatgacgga cggggtctag ggcaaggtgt gatggataac cgcgcaatga ccgtggtatt3240tcaccttctt gcggaatcta acatttctca agcagaccct gcttccaaca ctaacccgag3300gaacccttcg cttctctctc acctcatagg tgctcactta aactacccca taaacacatt3360cattgccaag aaaccgcaag acatatctgt gcgtgttcca caatacggtt cctttgctcc3420tttagccaaa ccgttaccat gtgacctcca cattgtaaat ttcaaggttc ctcgtccatc3480caaatactct cagcaattgg aagaagacaa gccaaggttc gctcttatcc tcaatagacg3540agcttgggat tcagcttatt gccataaagg aagacaagta aactgcacaa gcatggctaa3600tgaaccagta aacttttccg acatgttcaa agatcttgca gcttcaaagg taaaaccaac3660ttcactgaat ctcttgcaag aagatatgga gattcttggg tacgatgacc aagagctacc3720tcgagatagt tcacagccac gggaaggacg tgtctcgatc tctcccatgg aaatacgagc3780ttataagctt gaactgcgac ctcacaagtg aacctgctga agatc3825<210>30<211>2181<212>DNA<213>雜合體<400>30ggcgcgcctc gaggcgatcg cagatctcat tataccgtta gaagcatagt taaaatctaa60agcttgtcgt taattctagt cattttacat tgttgggttc tacattatta atgaattttc120taatgcaaat acagaattta aatcaaaatt gttgaattat gctaaacatg taacatacgt180atatctccgc cttgtgtgtt gtattaactt gaagttatca taagaaccac aaatacacta240gtaaatctat gagaaggcag gtggcaacac aaacaagagt atctaagatt ttcatttgtg300actataggaa tataatatct cttatctgat ttaatgaatc cacatgttca cttctcattt360gtccacaaga tcacaacttt atcttcaata ttcacaactt gttatatcca ccacaatttc420attcttttca cttagcccca caaaatactt tgtcccctta tttgccacct tttgtattta480atttattctt gtggagctaa gtgttcatat tattcttctt ctcaaaaaaa caaaaacaaa540aaaaaagaga agaaaaccat ggcgaggatc tcgtgtgact tgagatttct tctcatcccg600gcagctttca tgttcatcta catccagatg aggcttttcc agacgcaatc acagtatgca660gatcgcctca gttccgctat cgaatctgag aaccattgca ctagtcaaat gcgaggcctc720atagatgaag ttagcatcaa acagtcgcgg attgttgccc tcgaagatat gaagaaccgc780caggacgaag aacttgtgca gcttaaggat ctaatccaga cgtttgaaaa aaaaggaata840gcaaaactca ctcaaggtgg agccatggct ctaaggttgc atagaaggaa ccatttttcg900cctagaaata cggatctgtt cccggatttg gcaaaagatc gtgtggttat cgtcttgtat960gtgcataatc gggctcagta ttttcgagtc acagtggaaa gtttgtcgaa ggttaaaggt1020ataagtgaga cattgttgat tgttagtcat gatggttact ttgaagagat gaataggattl080gtggagagta ttaagttttg tcaagtgaaa cagattttct cgccttattc gcctcatata1140tatcgtacta gcttcccggg tgtgaccctg aatgattgta agaacaaggg tgatgaggca1200aaggggcatt gtgaaggtaa tcctgatcag tatgggaatc atcggtctcc gaagattgta1260tctttgaagc atcactggtg gtggatgatg aacactgtat gggatgggtt ggaagagact1320aaaggacatg aggggcatat ccttttcatt gaagaagatc attttctgtt tcctaatgcc1380tatcgtaaca tacagactct tacgaggctg aaacccgcaa agtgtcctga ctgttttgct14440gctaatttag caccgtctga tgtgaagtca agaggagaag ggcttgaaag tttggttgca1500gagagaatgg gaaatgttgg gtattctttt aatagaagtg tgtgggagaa tattcatcag1560aaggcaagag agttttgttt ctttgatgat tacaactggg atataacgat gtgggcaacg1620gttttcccgt cgtttggttc cccggtgtac acattgcgag ggcctaggac tagtgcggta1680cactttggaa aatgtgggtt gcatcaaggt agaggagatg agggtgattg catcgataat1740ggggtcgtaa acatagaagt taaggaaaca gataaagttg tgaacataaa agaaggatgg1800ggagttcggg tgtataagca tcaagcgggt tataaagccg gtttcgaagg ttggggaggt1860tggggcgatg atagggaccg acatttatgt ttggattttg ccactatgta tcgttacagc1920agtagcagtg catctccatg aaacggatcc gctagagtcc gcaaaaatca ccagtctctc1980tctacaaatc tatctctctc tatttttctc cagaataatg tgtgagtagt tcccagataa2040gggaattagg gttcttatag ggtttcgctc atgtgttgag catataagaa acccttagta2100tgtatttgta tttgtaaaat acttctatca ataaaatttc taatcctaaa accaaaatcc2160cgcgagagac ctcttaatta a 2181<210>31
<211>1394<212>DNA<213>雜合體<400>31ccatggcgag gatctcgtgt gacttgagat ttcttctcat cccggcagct ttcatgttca 60tctacatca gatgaggctt ttccagacgc aatcacagta tgcagatcgc ctcagttccg 120ctatcgaatc tgagaaccat tgcactagtc aaatgcgagg cctcatagat gaagttagca 180tcaaacagtc gcggattgtt gccctcgaag atatgaagaa ccgccaggac gaagaacttg 240tgcagcttaa ggatctaatc cagacgtttg aaaaaaaagg aatagcaaaa ctcactcaag 300gtggagccat ggctctaagg ttgcatagaa ggaaccattt ttcgcctaga aatacggatc 360tgttcccgga tttggcaaaa gatcgtgtgg ttatcgtctt gtatgtgcat aatcgggctc 420agtattttcg agtcacagtg gaaagtttgt cgaaggttaa aggtataagt gagacattgt 480tgattgttag tcatgatggt tactttgaag agatgaatag gattgtggag agtattaagt 540tttgtcaagt gaaacagatt ttctcgcctt attcgcctca tatatatcgt actagcttcc 600cgggtgtgac cctgaatgat tgtaagaaca agggtgatga ggcaaagggg cattgtgaag 660gtaatcctga tcagtatggg aatcatcggt ctccgaagat tgtatctttg aagcatcact 720ggtggtggat gatgaacact gtatgggatg ggttggaaga gactaaagga catgaggggc 780atatcctttt cattgaagaa gatcattttc tgtttcctaa tgcctatcgt aacatacaga 840ctcttacgag gctgaaaccc gcaaagtgtc ctgactgttt tgctgctaat ttagcaccgt 900ctgatgtgaa gtcaagagga gaagggcttg aaagtttggt tgcagagaga atgggaaatg 960ttgggtattc ttttaataga agtgtgtggg agaatattca tcagaaggca agagagtttt 1020gtttctttga tgattacaac tgggatataa cgatgtgggc aacggttttc ccgtcgtttg 1080gttccccggt gtacacattg cgagggccta ggactagtgc ggtacacttt ggaaaatgtg 1140ggttgcatca aggtagagga gatgagggtg attgcatcga taatggggtc gtaaacacag 1200aagttaagga aacagataaa gttgtgaaca taaaagaagg atggggagtt cgggtgtata 1260agcatcaagc gggttataaa gccggtttcg aaggttgggg aggttggggc gatgataggg 1320accgacattt atgtttggat tttgccacta tgtatcgtta cagcagtagc agtgcatctc 1380catgaaacgg atcc 1394<210>32<211>312<212>DNA<213>擬南芥<400>32ccatggcgag gatctcgtgt gacttgagat ttcttctcat cccggcagct ttcatgttca 60tctacatcca gatgaggctt ttccagacgc aatcacagta tgcagatcgc ctcagttccg 120ctatcgaatc tgagaaccat tgcactagtc aaatgcgagg cctcatagat gaagttagca 180tcaaacagtc gcggattgtt gccctcgaag atatgaagaa ccgccaggac gaagaacttg 240tgcagcttaa ggatctaatc cagacgtttg aaaaaaaagg aatagcaaaa ctcactcaag 300gtggǎgccat gg312<210>33<211>276<212>DNA<213>Glycine max<400>33ccatggcgag agggagcaga tcagtgggta gcagcagcag caaatggagg tactgcaacc 60cttcctatta cttgaagcgc ccaaagcgtc ttgctctgct cttcatcgtt ttcgtttgtg 120tctctttcgt tttctgggac cgtcaaactc tcgtcagaga gcaccaggtt gaaatttctg 180agctgcagaa agaagtgact gatttgaaaa atttggtgga tgatttaaat aacaaacaag 240gtggtacctc tgggaaaact gacttgggga ccatgg 276<210>34<211>9240<212>DNA<213>雜合體<400>34ggcgcgcctc gaggcgatcg cagatccgat ataacaaaat ttgaatcgca cagatcgatc 60tctttggaga ttctatacct agaaaatgga gacgattttc aaatctctgt aaaaattctg 120gtttcttctt gacggaagaa gacgacgact ccaatatttc ggttagtact gaaccggaaa 180gtttgactgg tgcaaccaat ttaatgtacc gtacgtaacg caccaatcgg attttgtatt 240
caatgggcct tatctgtgag cccattaatt gatgtgacgg cctaaactaa atccgaacgg 300tttatttcag cgatccgcga cggtttgtat tcagccaata gcaatcaatt atgtagcagt 360ggtgatcctc gtcaaaccag taaagctaga tctggaccgt tgaattggtg caagaaagca 420catgttgtga tatttttacc cgtacgatta gaaaacttga gaaacacatt gataatcgat 480aaaaaccgtc cgatcatata aatccgcttt accatcgttg cctataaatt aatatcaata 540gccgtacacg cgtgaagact gacaatatta tctttttcga attcggagct caagtttgaa 600attcggagaa gctagagagt tttctgataa ccatggcgag agggagcaga tcagtgggta 660gcagcagcag caaatggagg tactgcaacc cttcctatta cttgaagcgc ccaaagcgtc 720ttgctctgct cttcatcgtt ttcgtttgtg tctctttcgt tttctgggac cgtcaaactc 780tcgtcagaga gcaccaggtt gaaatttctg agctgcagaa agaagtgact gatttgaaaa 840atttggtgga tgatttaaat aacaaacaag gtggtacctc tgggaaaact gacttgggga 900ccatgggaca gatgcctgtg gctgctgtag tggttatggc ctgcagtcgt gcagactatc 960ttgaaaggac tgttaaatca gttttaacat atcaaactcc cgttgcttca aaatatcctc 1020tatttatatc tcaggatgga tctgatcaag ctgtcaagag caagtcattg agctataatc 1080aattaacata tatgcagcac ttggattttg aaccagtggt cactgaaagg cctggcgaac 1140tgactgcgta ctacaagatt gcacgtcact acaagtgggc actggaccag ttgttttaca 1200aacacaaatt tagtcgagtg attatactag aagatgatat ggaaattgct ccagacttct 1260ttgattactt tgaggctgca gctagtctca tggataggga taaaaccatt atggctgctt 1320catcatggaa tgataatgga cagaagcagt ttgtgcatga tccctatgcg ctataccgat 1380cagatttttt tcctggcctt gggtggatgc tcaagagatc gacttgggat gagttatcac 1440caaagtggcc aaaggcttac tgggatgatt ggctgagact aaaggaaaac cataaaggcc 1500gccaattcat tcgaccggaa gtctgtagaa catacaattt tggtgaacat gggtctagtt 1560tgggacagtt tttcagtcag tatctggaac ctataaagct aaacgatgtg acggttgact 1620ggaaagcaaa ggacctggga tacctgacag agggaaacta taccaagtac ttttctggct 1680tagtgagaca agcacgacca attcaaggtt ctgaccttgt cttaaaggct caaaacataa 1740aggatgatgt tcgtatccgg tataaagacc aagtagagtt tgaacgcatt gcaggggaat 1800ttggtatatt tgaagaatgg aaggatggtg tgcctcgaac agcatataaa ggagtagtgg 1860tgtttcgaat ccagacaaca agacgtgtat tcctggttgg gccagattct gtaatgcagc 1920ttggaattcg aaattcctga tgcggatccg ctagagtccg caaaaatcac cagtctctct 1980ctacaaatct atctctctct atttttctcc agaataatgt gtgagtagtt cccagataag 2040ggaattaggg ttcttatagg gtttcgctca tgtgttgagc atataagaaa cccttagtat 2100gtatttgtat ttgtaaaata cttctatcaa taaaatttct aatcctaaaa ccaaaatccc 2160gcgcctcgag gcgatcgcag atctaatcta accaattacg atacgctttg ggtacacttg 2220atttttgttt cagtggttac atatatcttg ttttatatgc tatctttaag gatctgcaca 2280aagattattt gttgatgttc ttgatggggc tcagaagatt tgatatgata cactctaatc 2340tttaggagat accagccagg attatattca gtaagacaat caaattttac gtgttcaaac 2400tcgttatctt ttcattcaaa ggatgagcca gaatctttat agaatgattg caatcgagaa 2460tatgttcggc cgatatgcct ttgttggctt caatattcta catatcacac aagaatcgac 2520cgtattgtac cctctttcca taaaggaaaa cacaatatgc agatgctttt ttcccacatg 2580cagtaacata taggtattca aaaatggcta aaagaagttg gataacaaat tgacaactat 2640ttccatttct gttatataaa tttcacaaca cacaaaagcc cgtaatcaag agtctgccca 2700tgtacgaaat aacttctatt atttggtatt gggcctaagc ccagctcaga gtacgtgggg 2760gtaccacata taggaaggta acaaaatact gcaagatagc cccataacgt accagcctct 2820ccttaccacg aagagataag atataagacc caccctgcca cgtgtcacat cgtcatggtg 2880gttaatgata agggattaca tccttctatg tttgtggaca tgatgcatgt aatgtcatga 2940gccacaggat ccaatggcca caggaacgta agaatgtaga tagatttgat tttgtccgtt 3000agatagcaaa caacattata aaaggtgtgt atcaatagga actaattcac tcattggatt 3060catagaagtc cattcctcct aagtatctag aaaccatggc gagagggagc agatcagtgg 3120gtagcagcag cagcaaatgg aggtactgca acccttccta ttacttgaag cgcccaaagc 3180gtcttgctct gctcttcatc gttttcgttt gtgtctcttt cgttttctgg gaccgtcaaa 3240ctctcgtcag agagcaccag gttgaaattt ctgagctgca gaaagaagtg actgatttga 3300aaaatttggt ggatgattta aataacaaac aaggtggtac ctctgggaaa actgacttgg 3360ggaccatgga ttccaattca ggcgccgtcg ttgatatcac aactaaagat ctatacgata 3420ggattgagtt tcttgataca gatggtggtc catggaaaca aggttggaga gttacgtata 3480aagacgatga gtgggagaaa gagaagctca aaatcttcgt tgttcctcat tctcataacg 3540atcctggttg gaaattgact gtagaggagt attatcagag acaatccaga catattcttg 3600acaccattgt tgagacttta tctaaggtat gacgaaagtt tttgcttttg gttttaatat 3660tttaattctc tcccatggtt atcccgtgaa caatcttaaa tgtcttaaaa ttctcatgac 3720gtcattaaac tctataacca aacttctttg ctgggttctg ttttttttta gtttcgtgat 3780gaaacagagt tctagaagtt cgttcttttg gaaaatttga agtctttgga gctaaagttt 3840gtttttttat tactgggttt tgagattgaa ggatagctag aatcttattt gtgtgggggt 3900ttgttttgaa tatgtttaat aggattcaag aagaaagttt atatgggagg agatgtcata 3960tctggagaga tggtggagag acgcttcacc taataaacaa gaagctttga ctaaattggt 4020taaggatggg cagctagaga ttgttggagg tggctgggtt atgaatgatg aggctaattc 4080acattatttt gccataattg aacagatagc agagggtaat atgtggctga atgacacaat 4140tggggttatt cctaagaatt cttgggctat agatcccttt ggctattcat caaccatggc 4200ttatcttctc cggcgtatgg gttttgaaaa catgcttatt caaaggactc attacgagct 4260caagaaagac cttgcccagc ataagaatct tgaatatatt tggcgtcaga gctgggatgc 4320
tatggaaacc acagatatct ttgttcatat gatgccgttt tattcatacg atatcccaca4380cacttgtgga ccagagcctg caatttgctg tcagtttgat ttcgctcgga tgcggggatt4440taagtatgaa ctttgtccat ggggaaagca cccagtggag accacactag aaaatgtgca4500ggagagggca ttaaagcttc tggatcaata caggaaaaaa tccactctat atcgaactaa4560tacacttctt atacctcttg gagatgattt taggtacatt agtatcgatg aagccgaggc4620tcagttccgt aactaccaga tgttgtttga tcacatcaac tctaatccta gtctaaacgc4680agaagcaaag tttggtactt tggaggatta tttcagaaca gtccgagaag aagcagacag4740agtgaattat tctcgtcctg gtgaggttgg ctctggtcag gttgttggtt tcccttctct4800gtcaggtgac ttctttacat atgcagatag gcaacaagac tattggagtg gttattatgt4860ttcaagacct ttcttcaaag ctgttgatcg tgtgctcgag catacccttc gtggagctga4920gatcatgatg tcatttctgc taggttattg ccatcgaatt caatgtgaga aatttccaac4980aagttttacg tataagttga ctgctgcaag aagaaatctg gctcttttcc agcaccatga5040tggggtaact ggaactgcta aggattatgt ggtacaagat tacggcaccc ggatgcatac5100ttcattgcaa gaccttcaga tctttatgtc taaagcaatc gaagttcttc ttgggatccg5160ccacgagaaa gaaaaatctg atcaatcccc atcatttttc gaggcagagc aaatgagatc5220aaagtatgat gctcggccag ttcacaagcc aattgctgcc cgggaaggaa attcgcacac5280agttatactc ttcaatccat cagaacagac gagagaggag gtggtgacgg ttgttgttaa5340ccgcgctgaa atctcggttt tggactcaaa ctggacttgt gtccctagcc aaatttctcc5400tgaagtgcag catgacgata ccaaactatt caccggcaga catcgtcttt actggaaagc5460ttccatccca gctcttggtc tgagaacata tttcattgct aatgggaatg tcgagtgtga5520gaaagctact ccgtctaaac tcaaatacgc ttctgagttt gacccatttc cttgtcctcc5580tccatattcc tgctccaaac tggacaacga cgttactgag atccgaaatg aacatcagac5640tcttgtgttt gatgtgaaga acggatcact gcggaagata gtccatagaa acggatcaga5700gactgttgtg ggagaagaga taggtatgta ctctagtcca gagagtggag cttacctgtt5760caaaccagat ggtgaagctc agccaattgt tcaacctgat ggacatgtag tcacctctga5820gggtctgctg gttcaagaag tcttctctta ccctaaaacc aaatgggaga aatcacccct5880ctctcagaaa actcgtcttt acactggagg taatacgctt caggatcaag tggtcgagat5940agaatatcat gttgagcttc ttggtaatga ttttgatgac cgggaattga ttgtccggta6000caagactgat gttgacaaca agaaggtctt ctattcagat ctcaatggtt tccaaatgag6060caggagagaa acttatgata agatccctct tcaaggaaac tactacccaa tgccatctct6120cgcatttatc caaggatcca atggtcagag attctccgtg cactctcgtc aatctctcgg6180tgttgcaagc ctcaaagagg gttggttgga gattatgctg gacagacggt tggttcgtga6240tgacggacgg ggtctagggc aaggtgtgat ggataaccgc gcaatgaccg tggtattaaa6300ccttcttgcg gaatctaaca tttctcaagc agaccctgct tccaacacta acccgagaaa6360cccttcgctt ctctctcacc tcataggtgc tcacttaaac taccccataa acacattaat6420tgccaagaaa ccgcaagaca tatctgtgcg tgttccacaa tacggttcct ttgctccact6480agccaaaccg ttaccatgtg acctccacat tgtaaatttc aaggttcctc gtccatccaa6540atactctcag caattggaag aagacaagcc aaggttcgct cttatcctca atagacgagc6600ttgggattca gcttattgcc ataaaggaag acaagtaaac tgcacaagca tggctaatga6660accagtaaac ttttccgaca tgttcaaaga tcttgcagct tcaaaggtaa aaccaacttc6720actgaatctc ttgcaagaag atatggagat tcttgggtac gatgaccaag agctacctcg6780agatagttca cagccacggg aaggacgtgt ctcgatctct cccatggaaa tacgagctta6840taagcttgaa ctgcgacctc acaagtgaac ctgctgaaga tccgctagag tccgcaaaaa6900tcaccagtct ctctctacaa atctatttct ctctattttt ctccagaata atgtgtgagt6960agttcccaga taagggaatt agggttctta tagggtttcg ctcatgtgtt gagcatataa7020gaaaccctta gtatgtattt gtatttgtaa aatacttcta tcaataaaat ttctaatcct7080aaaaccaaaa tcccgcgcgc gcctcgaggc gatcgcagat ctcattatac cgttagaagc7140atagttaaaa tctaaagctt gtcgttaatt ctagtcattt tacattgttg ggttctacat7200tattaatgaa ttttctaatg caaatacaga atttaaatca aaattgttga attatgctaa7260acatgtaaca tacgtatatc tccgccttgt gtgttgtatt aacttgaagt tatcataaga7320accacaaata cactagtaaa tctatgagaa ggcaggtggc aacacaaaca agagtatcta7380agattttcat ttgtgactat aggaatataa tatctcttat ctgatttaat gaatccacat7440gttcacttct catttgtcca caagatcaca actttatctt caatattcac aacttgttat7500atccaccaca atttcattct tttcacttag ccccacaaaa tactttgtcc ccttatttgc7560caccttttgt atttaattta ttcttgtgga gctaagtgtt catattattc ttcttctcaa7620aaaaacaaaa acaaaaaaaa agagaagaaa accatggcga gagggagcag atcagtgggt7680agcagcagca gcaaatggag gtactgcaac ccttcctatt acttgaagcg cccaaagcgt7740cttgctctgc tcttcatcgt tttcgtttgt gtctctttcg ttttctggga ccgtcaaact7800ctcgtcagag agcaccaggt tgaaatttct gagctgcaga aagaagtgac tgatttgaaa7860aatttggtgg atgatttaaa taacaaacaa ggtggtacct ctgggaaaac tgacttgggg7920accatggctc taaggttgca tagaaggaac catttttcgc ctagaaatac ggatctgttc7980ccggatttgg caaaagatcg tgtggttatc gtcttgtatg tgcataatcg ggctcagtat8040tttcgagtca cagtggaaag tttgtcgaag gttaaaggta taagtgagac attgttgatt8100gttagtcatg atggttactt tgaagagatg aataggattg tggagagtat taagttttgt8160caagtgaaac agattttctc gccttattcg cctcatatat atcgtactag cttcccgggt8220gtgaccctga atgattgtaa gaacaagggt gatgaggcaa aggggcattg tgaaggtaat8280cctgatcagt atgggaatca tcggtctccg aagattgtat ctttgaagca tcactggtgg8340tggatgatga acactgtatg ggatgggttg gaagagacta aaggacatga ggggcatatc8400
cttttcattg aagaagatca ttttctgttt cctaatgcct atcgtaacat acagactctt8460acgaggctga aacccgcaaa gtgtcctgac tgttttgctg ctaatttagc accgtctgat8520gtgaagtcaa gaggagaagg gcttgaaagt ttggttgcag agagaatggg aaatgttggg8580tattctttta atagaagtgt gtgggagaat attcatcaga aggcaagaga gttttgtttc8640tttgatgatt acaactggga tataacgatg tgggcaacgg ttttcccgtc gtttggttcc8700ccggtgtaca cattgcgagg gcctaggact agtgcggtac actttggaaa atgtgggttg8760catcaaggta gaggagatga gggtgattgc atcgataatg gggtcgtaaa catagaagtt8820aaggaaacag ataaagttgt gaacataaaa gaaggatggg gagttcgggt gtataagcat8880caagcgggtt ataaagccgg tttcgaaggt tggggaggtt ggggcgatga tagggaccga8940catttatgtt tggattttgc cactatgtat cgttacagca gtagcagtgc atctccatga9000aacggatccg ctagagtccg caaaaatcac cagtctctct ctacaaatct atctctctct9060atttttctcc agaataatgt gtgagtagtt cccagataag ggaattaggg ttcttatagg9120gtttcgctca tgtgttgagc atataagaaa cccttagtat gtatttgtat ttgtaaaata9180cttctatcaa taaaatttct aatcctaaaa ccaaaatccc gcgagagacc tcttaattaa9240<210>35<211>2180<212>DNA<213>雜合體<400>35ggcgcgcctc gaggcgatcg cagatccgat ataacaaaat ttgaatcgca cagatcgatc60tctttggaga ttctatacct agaaaatgga gacgattttc aaatctctgt aaaaattctg120gtttcttctt gacggaagaa gacgacgact ccaatatttc ggttagtact gaaccggaaa180gtttgactgg tgcaaccaat ttaatgtacc gtacgtaacg caccaatcgg attttgtatt240caatgggcct tatctgtgag cccattaatt gatgtgacgg cctaaactaa atccgaacgg300tttatttcag cgatccgcga cggtttgtat tcagccaata gcaatcaatt atgtagcagt360ggtgatcctc gtcaaaccag taaagctaga tctggaccgt tgaattggtg caagaaagca420catgttgtga tatttttacc cgtacgatta gaaaacttga gaaacacatt gataatcgat480aaaaaccgtc cgatcatata aatccgcttt accatcgttg cctataaatt aatatcaata540gccgtacacg cgtgaagact gacaatatta tctttttcga attcggagct caagtttgaa600attcggagaa gctagagagt tttctgataa ccatggcgag agggagcaga tcagtgggta660gcagcagcag caaatggagg tactgcaacc cttcctatta cttgaagcgc ccaaagcgtc720ttgctctgct cttcatcgtt ttcgtttgtg tctctttcgt tttctgggac cgtcaaactc780tcgtcagaga gcaccaggtt gaaatttctg agctgcagaa agaagtgact gatttgaaaa840atttggtgga tgatttaaat aacaaacaag gtggtacctc tgggaaaact gacttgggga900ccatgggaca gatgcctgtg gctgctgtag tggttatggc ctgcagtcgt gcagactatc960ttgaaaggac tgttaaatca gttttaacat atcaaactcc cgttgcttca aaatatcctc1020tatttatatc tcaggatgga tctgatcaag ctgtcaagag caagtcattg agctataatc1080aattaacata tatgcagcac ttggattttg aaccagtggt cactgaaagg cctggcgaac1140tgactgcgta ctacaagatt gcacgtcact acaagtgggc actggaccag ttgttttaca1200aacacaaatt tagtcgagtg attatactag aagatgatat ggaaattgct ccagacttct1260ttgattactt tgaggctgca gctagtctca tggataggga taaaaccatt atggctgctt1320catcatggaa tgataatgga cagaagcagt ttgtgcatga tccctatgcg ctataccgatl380cagatttttt tcctggcctt gggtggatgc tcaagagatc gacttgggat gagttatcac1440caaagtggcc aaaggcttac tgggatgatt ggctgagact aaaggaaaac cataaaggccl500gccaattcat tcgaccggaa gtctgtagaa catacaattt tggtgaacat gggtctagtt1560tgggacagtt tttcagtcag tatctggaac ctataaagct aaacgatgtg acggttgact1620ggaaagcaaa ggacctggga tacctgacag agggaaacta taccaagtac ttttctggct1680tagtgagaca agcacgacca attcaaggtt ctgaccttgt cttaaaggct caaaacataa1740aggatgatgt tcgtatccgg tataaagacc aagtagagtt tgaacgcatt gcaggggaat1800ttggtatatt tgaagaatgg aaggatggtg tgcctcgaac agcatataaa ggagtagtgg1860tgtttcgaat ccagacaaca agacgtgtat tcctggttgg gccagattct gtaatgcagc1920ttggaattcg aaattcctga tgcggatccg ctagagtccg caaaaatcac cagtctctct1980ctacaaatct atctctctct atttttctcc agaataatgt gtgagtagtt cccagataag2040ggaattaggg ttcttatagg gtttcgctca tgtgttgagc atataagaaa cccttagtat2100gtatttgtat ttgtaaaata cttctatcaa taaaatttct aatcctaaaa ccaaaatccc2160gcgagagacc tcttaattaa 2180<210>36<211>615<212>DNA<213>擬南芥<400>36ggatccgata taacaaaatt tgaatcgcac agatcgatct ctttggagat tctataccta60
gaaaatggag acgattttca aatctctgta aaaattctgg tttcttcttg acggaagaag120acgacgactc caatatttcg gttagtactg aaccggaaag tttgactggt gcaaccaatt180taatgtaccg tacgtaacgc accaatcgga ttttgtattc aatgggcctt atctgtgagc240ccattaattg atgtgacggc ctaaactaaa tccgaacggt ttatttcagc gatccgcgac300ggtttgtatt cagccaatag caatcaatta tgtagcagtg gtgatcctcg tcaaaccagt360aaagctagat ctggaccgtt gaattggtgc aagaaagcac atgttgtgat atttttaccc420gtacgattag aaaacttgag aaacacattg ataatcgata aaaaccgtcc gatcatataa480atccgcttta ccatcgttgc ctataaatta atatcaatag ccgtacacgc gtgaagactg540acaatattat ctttttcgaa ttcggagctc aagtttgaaa ttcggagaag ctagagagtt600ttctgataac catgg 615<210>37<211>1319<212>DNA<213>雜合體<400>37ccatggcgag agggagcaga tcagtgggta gcagcagcag caaatggagg tactgcaacc50cttcctatta cttgaagcgc ccaaagcgtc ttgctctgct cttcatcgtt ttcgtttgtg120tctctttcgt tttctgggac cgtcaaactc tcgtcagaga gcaccaggtt gaaatttctg180agctgcagaa agaagtgact gatttgaaaa atttggtgga tgatttaaat aacaaacaag240gtggtacctc tgggaaaact gacttgggga ccatgggaca gatgcctgtg gctgctgtag300tggttatggc ctgcagtcgt gcagactatc ttgaaaggac tgttaaatca gttttaacat360atcaaactcc cgttgcttca aaatatcctc tatttatatc tcaggatgga tctgatcaag420ctgtcaagag caagtcattg agctataatc aattaacata tatgcagcac ttggattttg480aaccagtggt cactgaaagg cctggcgaac tgactgcgta ctacaagatt gcacgtcact540acaagtgggc actggaccag ttgttttaca aacacaaatt tagtcgagtg attatactag600aagatgatat ggaaattgct ccagacttct ttgattactt tgaggctgca gctagtctca660tggataggga taaaaccatt atggctgctt catcatggaa tgataatgga cagaagcagt720ttgtgcatga tccctatgcg ctataccgat cagatttttt tcctggcctt gggtggatgc730tcaagagatc gacttgggat gagttatcac caaagtggcc aaaggcttac tgggatgatt840ggctgagact aaaggaaaac cataaaggcc gccaattcat tcgaccggaa gtctgtagaa900catacaattt tggtgaacat gggtctagtt tgggacagtt tttcagtcag tatctggaac960ctataaagct aaacgatgtg acggttgact ggaaagcaaa ggacctggga tacctgacag1020agggaaacta taccaagtac ttttctggct tagtgagaca agcacgacca attcaaggtt1080ctgaccttgt cttaaaggct caaaacataa aggatgatgt tcgtatccgg tataaagacc1140aagtagagtt tgaacgcatt gcaggggaat ttggtatatt tgaagaatgg aaggatggtg1200tgcctcgaac agcatataaa ggagtagtgg tgtttcgaat ccagacaaca 3gacgtgtat1260tcctggttgg gccagattct gtaatgcagc ttggaattcg aaattcctga tgcggatcc 1319<210>38<211>4957<212>DNA<213>雜合體<400>38ggcgcgcctc gaggcgatcg cagatctaat ctaaccaatt acgatacgct ttgggtacac60ttgatttttg tttcagtggt tacatatatc ttgttttata tgctatcttt aaggatctgc120acaaagatta tttgttgatg ttcttgatgg ggctcagaag atttgatatg atacactcta180atctttagga gataccagcc aggattatat tcagtaagac aatcaaattt tacgtgttca240aactcgttat cttttcattc aaaggatgag ccagaatctt tatagaatga ttgcaatcga300gaatatgttc ggccgatatg cctttgttgg cttcaatatt ctacatatca cacaagaatc360gaccgtattg taccctcttt ccataaagga aaacacaata tgcagatgct tttttcccac420atgcagtaac atataggtat tcaaaaatgg ctaaaagaag ttggataaca aattgacaac480tatttccatt tctgttatat aaatttcaca acacacaaaa gcccgtaatc aagagtctgc540ccatgtacga aataacttct attatttggt attgggccta agcccagctc agagtacgtg600ggggtaccac atataggaag gtaacaaaat actgcaagat agccccataa cgtaccagcc660tctccttacc acgaagagat aagatataag acccaccctg ccacgtgtca catcgtcatg720gtggttaatg ataagggatt acatccttct atgtttgtgg acatgatgca tgtaatgtca780tgagccacag gatccaatgg ccacaggaac gtaagaatgt agatagattt gattttgtcc840gttagatagc aaacaacatt ataaaaggtg tgtatcaata ggaactaatt cactcattgg900attcatagaa gtccattcct cctaagtatc tagaaaccat ggcgagaggg agcagatcag960tgggtagcag cagcagcaaa tggaggtact gcaacccttc ctattacttg aagcgcccaa1020agcgtcttgc tctgctcttc atcgttttcg tttgtgtctc tttcgttttc tgggaccgtc1080aaactctcgt cagagagcac caggttgaaa tttctgagct gcagaaagaa gtgactgatt1140tgaaaaattt ggtggatgat ttaaataaca aacaaggtgg tacctctggg aaaactgact1200
tggggaccat ggattccaat tcaggcgccg tcgttgatat cacaactaaa gatctatacg1260ataggattga gtttcttgat acagatggtg gtccatggaa acaaggttgg agagttacgt1320ataaagacga tgagtgggag aaagagaagc tcaaaatctt cgttgttcct cattctcata1380acgatcctgg ttggaaattg actgtagagg agtattatca gagacaatcc agacatattc1440ttgacaccat tgttgagact ttatctaagg tatgacgaaa gtttttgctt ttggttttaa1500tattttaatt ctctcccatg gttatcccgt gaacaatctt aaatgtctta aaattctcat1560gacgtcatta aactctataa ccaaacttct ttgctgggtt ctgttttttt ttagtttcgt1620gatgaaacag agttctagaa gttcgttctt ttggaaaatt tgaagtcttt ggagctaaag1680tttgtttttt tattactggg ttttgagatt gaaggatagc tagaatctta tttgtgtggg1740ggtttgtttt gaatatgttt aataggattc aagaagaaag tttatatggg aggagatgtc1800atatctggag agatggtgga gagacgcttc acctaataaa caagaagctt tgactaaatt1860ggttaaggat gggcagctag agattgttgg aggtggctgg gttatgaatg atgaggctaa1920ttcacattat tttgccataa ttgaacagat agcagagggt aatatgtggc tgaatgacac1980aattggggtt attcctaaga attcttgggc tatagatccc tttggctatt catcaaccat2040ggcttatctt ctccggcgta tgggttttga aaacatgctt attcaaagga ctcattacga2100gctcaagaaa gaccttgccc agcataagaa tcttgaatat atttggcgtc agagctggga2160tgctatggaa accacagata tctttgttca tatgatgccg ttttattcat acgatatccc2220acacacttgt ggaccagagc ctgcaatttg ctgtcagttt gatttcgctc ggatgcgggg2280atttaagtat gaactttgtc catggggaaa gcacccagtg gagaccacac tagaaaatgt2340gcaggagagg gcattaaagc ttctggatca atacaggaaa aaatccactc tatatcgaac2400taatacactt cttatacctc ttggagatga ttttaggtac attagtatcg atgaagccga2460ggctcagttc cgtaactacc agatgttgtt tgatcacatc aactctaatc ctagtctaaa2520cgcagaagca aagtttggta ctttggagga ttatttcaga acagtccgag aagaagcaga2580cagagtgaat tattctcgtc ctggtgaggt tggctctggt caggttgttg gtttcccttc2640tctgtcaggt gacttcttta catatgcaga taggcaacaa gactattgga gtggttatta2700tgtttcaaga cctttcttca aagctgttga tcgtgtgctc gagcataccc ttcgtggagc2760tgagatcatg atgtcatttc tgctaggtta ttgccatcga attcaatgtg agaaatttcc2820aacaagtttt acgtataagt tgactgctgc aagaagaaat ctggctcttt tccagcacca2880tgatggggta actggaactg ctaaggatta tgtggtacaa gattacggca cccggatgca2940tacttcattg caagaccttc agatctttat gtctaaagca atcgaagttc ttcttgggat3000ccgccacgag aaagaaaaat ctgatcaatc cccatcattt ttcgaggcag agcaaatgag3060atcaaagtat gatgctcggc cagttcacaa gccaattgct gcccgggaag gaaattcgca3120cacagttata ctcttcaatc catcagaaca gacgagagag gaggtggtga cggttgttgt3180taaccgcgct gaaatctcgg ttttggactc aaactggact tgtgtcccta gccaaatttc3240tcctgaagtg cagcatgacg ataccaaact attcaccggc agacatcgcc tttactggaa3300agcttccatc ccagctcttg gtctgagaac atatttcatt gctaatggga atgtcgagtg3360tgagaaagct actccgtcta aactcaaata cgcttctgag tttgacccat ttccttgtcc3420tcctccatat tcctgctcca aactggacaa cgacgttact gagatccgaa atgaacatca3480gactcttgtg tttgatgtga agaacggatc actgcggaag atagtccata gaaacggatc3540agagactgtt gtgggagaag agataggtat gtactctagt ccagagagtg gagcttacct3600gttcaaacca gatggtgaag ctcagccaat tgttcaacct gatggacatg tagtcacctc3660tgagggtctg ctggttcaag aagtcttctc ttaccctaaa accaaatggg agaaatcacc3720cctctctcag aaaactcgtc tttacactgg aggtaatacg cttcaggatc aagtggtcga3780gatagaatat catgttgagc ttcttggtaa tgattttgat gaccgggaat tgattgtccg3840gtacaagact gatgttgaca acaagaaggt cttctattca gatctcaatg gtttccaaat3900gagcaggaga gaaacttatg ataagatccc tcttcaagga aactactacc caatgccatc3960tctcgcattt atccaaggat ccaatggtca gagattctcc gtgcactctc gtcaatctct4020cggtgttgca agcctcaaag agggttggtt ggagattatg ctggacagac ggttggttcg4080tgatgacgga cggggtctag ggcaaggtgt gatggataac cgcgcaatga ccgtggtatt4140tcaccttctt gcggaatcta acatttctca agcagaccct gcttccaaca ctaacccgag4200gaacccttcg cttctctctc acctcatagg tgctcactta aactacccca taaacacatt4260cattgccaag aaaccgcaag acatatctgt gcgtgttcca caatacggtt cctttgctcc4320tttagccaaa ccgttaccat gtgacctcca cattgtaaat ttcaaggtta ctcgtccatc4380caaatactct cagcaattgg aagaagacaa gccaaggttc gctcttatcc tcaatagacg4440agcttgggat tcagcttatt gccataaagg aagacaagta aactgcacaa gcatggctaa4500tgaaccagta aacttttccg acatgttcaa agatcttgca gcttcaaagg taaaaccaac4560ttcactgaat ctcttgcaag aagatatgga gattcttggg tacgatgacc aagagctacc4620tcgagatagt tcacagccac gggaaggacg tgtctcgatc tctcccatgg aaatacgagc4680ttataagctt gaactgcgac ctcacaagtg aacctgctga agatccgcta gagtccgcaa4740aaatcaccag tctctctcta caaatctatc tctctctatt tttctccaga ataatgtgtg4800agtagttccc agataaggga attagggttc ttatagggtt tcgctcatgt gttgagcata4860taagaaaccc ttagtatgta tttgtatttg taaaatactt ctatcaataa aatttctaat4920cctaaaacca aaatcccgcg agagacctct taattaa 4957<210>39<211>921<212>DNA
<213>Chrysanthemum x morifolium<400>39agatctaatc taaccaatta cgatacgctt tgggtacact tgatttttgt ttcagtggtt60acatatatct tgttttatat gctatcttta aggatctgca caaagattat ttgttgatgt120tcttgatggg gctcagaaga tttgatatga tacactctaa tctttaggag ataccagcca180ggattatatt cagtaagaca atcaaatttt acgtgttcaa actcgttatc ttttcattca240aaggatgagc cagaatcttt atagaatgat tgcaatcgag aatatgttcg gccgatatgc300ctttgttggc ttcaatattc tacatatcac acaagaatcg accgtattgt accctctttc360cataaaggaa aacacaatat gcagatgctt ttttcccaca tgcagtaaca tataggtatt420caaaaatggc taaaagaagt tggataacaa attgacaact atttccattt ctgttatata480aatttcacaa cacacaaaag cccgtaatca agagtctgcc catgtacgaa ataacttcta540ttatttggta ttgggcctaa gcccagctca gagtacgtgg gggtaccaca tataggaagg600taacaaaata ctgcaagata gccccataac gtaccagcct ctccttacca cgaagagata660agatataaga cccaccctgc cacgtgtcac atcgtcatgg tggttaatga taagggatta720catccttcta tgtttgtgga catgatgcat gtaatgtcat gagccacagg atccaatggc780cacaggaacg taagaatgta gatagatttg attttgtccg ttagatagca aacaacatta840taaaaggtgt gtatcaatag gaactaattc actcattgga ttcatagaag tccattcctc900ctaagtatct agaaaccatg g 921<210>40<211>3789<212>DNA<213>雜合體<400>40ccatggcgag agggagcaga tcagtgggta gcagcagcag caaatggagg tactgcaacc60cttcctatta cttgaagcgc ccaaagcgtc ttgctctgct cttcatcgtt ttcgtttgtg120tctctttcgt tttctgggac cgtcaaactc tcgtcagaga gcaccaggtt gaaatttctg180agctgcagaa agaagtgact gatttgaaaa atttggtgga tgatttaaat aacaaacaag240gtggtacctc tgggaaaact gacttgggga ccatggattc caattcaggc gccgtcgttg300atatcacaac taaagatcta tacgatagga ttgagtttct tgatacagat ggtggtccat360ggaaacaagg ttggagagtt acgtataaag acgatgagtg ggagaaagag aagctcaaaa420tcttcgttgt tcctcattct cataacgatc ctggttggaa attgactgta gaggagtatt480atcagagaca atccagacat attcttgaca ccattgttga gactttatct aaggtatgac540gaaagttttt gcttttggtt ttaatatttt aattctctcc catggttatc ccgtgaacaa600tcttaaatgt cttaaaattc tcatgacgtc attaaactct ataaccaaac ttctttgccg660ggttctgttt ttttttagtt tcgtgatgaa acagagttct agaagttcgt tcttttggaa720aatttgaagt ctttggagct aaagtttgtt tttttattac tgggttttga gattgaagga780tagctagaat cttatttgtg tgggggtttg ttttgaatat gtttaatagg attcaagaag840aaagtttata tgggaggaga tgtcatatct ggagagatgg tggagagacg cttcacctaa900taaacaagaa gctttgacta aattggttaa ggatgggcag ctagagattg ttggaggtgg960ctgggttatg aatgatgagg ctaattcaca ttattttgcc ataattgaac agatagcaga1020gggtaatatg tggctgaatg acacaattgg ggttattcct aagaattctt gggctataga1080tccctttggc tattcatcaa ccatggctta tcttctccgg cgtatgggtt ttgaaaacat1140gcttattcaa aggactcatt acgagctcaa gaaagacctt gcccagcata agaatcttga1200atatatttgg cgtcagagct gggatgctat ggaaaccaca gatatctttg ttcatatgat1260gccgttttat tcatacgata tcccacacac ttgtggacca gagcctgcaa tttgctgtca1320gtttgatttc gctcggatgc ggggatttaa gtatgaactt tgtccatggg gaaagcaccc1380agtggagacc acactagaaa atgtgcagga gagggcatta aagcttctgg atcaatacag1440gaaaaaatcc actctatatc gaactaatac acttcttata cctcttggag atgattttag1500gtacattagt atcgatgaag ccgaggctca gttccgtaac taccagatgt tgtttgatcal560catcaactct aatcctagtc taaacgcaga agcaaagttt ggtactttgg aggattattt1620cagaacagtc cgagaagaag cagacagagt gaattattct cgtcctggtg aggttggctc1680tggtcaggtt gttggtttcc cttctctgtc aggtgacttc tttacatatg cagataggca1740acaagactat tggagtggtt attatgtttc aagacctttc ttcaaagctg ttgatcgtgt1800gctcgagcat acccttcgtg gagctgagat catgatgtca tttctgctag gttattgcca1860tcgaattcaa tgtgagaaat ttccaacaag ttttacgtat aagttgactg ctgcaagaag1920aaatctggct cttttccagc accatgatgg ggtaactgga actgctaagg attatgtggt1980acaagattac ggcacccgga tgcatacttc attgcaagac cttcagatct ttatgtctaa2040agcaatcgaa gttcttcttg ggatccgcca cgagaaagaa aaatctgatc aatccccatc2100atttttcgag gcagagcaaa tgagatcaaa gtatgatgct cggccagttc acaagccaat2160tgctgcccgg gaaggaaatt cgcacacagt tatactcttc aatccatcag aacagacgag2220agaggaggtg gtgacggttg ttgttaaccg cgctgaaatc tcggttttgg actcaaactg2280gacttgtgtc cctagccaaa tttctcctga agtgcagcat gacgatacca aactattcac2340cggcagacat cgcctttact ggaaagcttc catcccagct cttggtctga gaacatattt2400cattgctaat gggaatgtcg agtgtgagaa agctactccg tctaaactca aatacgcttc2460
tgagtttgac ccatttcctt gtcctcctcc atattcctgc tccaaactgg acaacgacgt2520tactgagatc cgaaatgaac atcagactct tgtgtttgat gtgaagaacg gatcactgcg2580gaagatagtc catagaaacg gatcagagac tgttgtggga gaagagatag gtatgtactc2640tagtccagag agtggagctt acctgttcaa accagatggt gaagctcagc caattgttca2700acctgatgga catgtagtca cctctgaggg tctgctggtt caagaagtct tctcttaccc2760taaaaccaaa tgggagaaat cacccctctc tcagaaaact cgtctttaca ctggaggtaa2820tacgcttcag gatcaagtgg tcgagataga atatcatgtt gagcttcttg gtaatgattt2880tgatgaccgg gaattgattg tccggtacaa gactgatgtt gacaacaaga aggtcttcta2940ttcagatctc aatggtttcc aaatgagcag gagagaaact tatgataaga tccctcttca3000aggaaactac tacccaatgc catctctcgc atttatccaa ggatccaatg gtcagagatt3060ctccgtgcac tctcgtcaat ctctcggtgt tgcaagcctc aaagagggtt ggttggagat3120tatgctggac agacggttgg ttcgtgatga cggacggggt ctagggcaag gtgtgatgga3180taaccgcgca atgaccgtgg tatttcacct tcttgcggaa tctaacattt ctcaagcaga3240ccctgcttcc aacactaacc cgaggaaccc ttcgcttctc tctcacctca taggtgctca3300cttaaactac cccataaaca cattcattgc caagaaaccg caagacatat ctgtgcgtgt3360tccacaatac ggttcctttg ctcctttagc caaaccgtta ccatgtgacc tccacattgt3420aaatttcaag gttcctcgtc catccaaata ctctcagcaa ttggaagaag acaagccaag3480gttcgctctt atcctcaata gacgagcttg ggattcagct tattgccata aaggaagaca3540agtaaactgc acaagcatgg ctaatgaacc agtaaacttt tccgacatgt tcaaagatct3600tgcagcttca aaggtaaaac caacttcact gaatctcttg caagaagata tggagattct3660tgggtacgat gaccaagagc tacctcgaga tagttcacag ccacgggaag gacgtgtctc3720gatctctccc atggaaatac gagcttataa gcttgaactg cgacctcaca agtgaacctg3780ctgaagatc3789<210>41<211>2145<212>DNA<213>雜合體<400>41ggcgcgcctc gaggcgatcg cagatctcat tataccgtta gaagcatagt taaaatctaa 60agcttgtcgt taattctagt cattttacat tgttgggttc tacattatta atgaattttc120taatgcaaat acagaattta aatcaaaatt gttgaattat gctaaacatg taacatacgt180atatctccgc cttgtgtgtt gtattaactt gaagttatca taagaaccac aaatacacta240gtaaatctat gagaaggcag gtggcaacac aaacaagagt atctaagatt ttcatttgtg300actataggaa tataatatct cttatctgat ttaatgaatc cacatgttca cttctcattt360gtccacaaga tcacaacttt atcttcaata ttcacaactt gttatatcca ccacaatttc420attcttttca cttagcccca caaaatactt tgtcccctta tttgccacct tttgtattta480atttattctt gtggagctaa gtgttcatat tattcttctt ctcaaaaaaa caaaaacaaa540aaaaaagaga agaaaaccat ggcgagaggg agcagatcag tgggtagcag cagcagcaaa600tggaggtact gcaacccttc ctattacttg aagcgcccaa agcgtcttgc tctgctcttc660atcgttttcg tttgtgtctc tttcgttttc tgggaccgtc aaactctcgt cagagagcac720caggttgaaa tttctgagct gcagadagaa gtgactgatt tgaaaaattt ggtggatgat780ttaaataaca aacaaggtgg tacctctggg aaaactgact tggggaccat ggctctaagg840ttgcatagaa ggaaccattt ttcgcctaga aatacggatc tgttcccgga tttggcaaaa900gatcgtgtgg ttatcgtctt gtatgtgcat aatcgggctc agtattttcg agtcacagtg960gaaagtttgt cgaaggttaa aggtataagt gagacattgt tgattgttag tcatgatggt1020tactttgaag agatgaatag gattgtggag agtattaagt tttgtcaagt gaaacagatt1080ttctcgcctt attcgcctca tatatatcgt actagcttcc cgggtgtgac cctgaatgat1140tgtaagaaca agggtgatga ggcaaagggg cattgtgaag gtaatcctga tcagtatggg1200aatcatcggt ctccgaagat tgtatctttg aagcatcact ggtggtggat gatgaacact1260gtatgggatg ggttggaaga gactaaagga catgaggggc atatcctttt cattgaagaa1320gatcattttc tgtttcctaa tgcctatcgt aacatacaga ctcttacgag gctgaaaccc1380gcaaagtgtc ctgactgttt tgctgctaat ttagcaccgt ctgatgtgaa gtcaagagga1440gaagggcttg aaagtttggt tgcagagaga atgggaaatg ttgggtattc ttttaataga1500agtgtgtggg agaatattca tcagaaggca agagagtttt gtttctttga tgattacaac1560tgggatataa cgatgtgggc aacggttttc ccgtcgtttg gttccccggt gtacacattg1620cgagggccta ggactagtgc ggtacacttt ggaaaatgtg ggttgcatca aggtagagga1680gatgagggtg attgcatcga taatggggtc gtaaacatag aagttaagga aacagataaa1740gttgtgaaca taaaagaagg atggggagtt cgggtgtata agcatcaagc gggttataaa1800gccggtttcg aaggttgggg aggttggggc gatgataggg accgacattt atgtttggat1860tttgccacta tgtatcgtta cagcagtagc agtgcatctc catgaaacgg atccgctaga1920gtccgcaaaa atcaccagtc tctctctaca aatctatctc tctctatttt tctccagaat1980aatgtgtgag tagttcccag ataagggaat tagggttctt atagggtttc gctcatgtgt2040tgagcatata agaaaccctt agtatgtatt tgtatttgta aaatacttct atcaataaaa2100tttctaatcc taaaaccaaa atcccgcgag agacctctta attaa2145
<210>42<211>541<212>DNA<213>Solanum tuberosum<400>42agatctcatt ataccgttag aagcatagtt aaaatctaaa gcttgtcgtt aattctagtc60attttacatt gttgggttct acattattaa tgaattttct aatgcaaata cagaatttaa120atcaaaattg ttgaattatg ctaaacatgt aacatacgta tatctccgcc ttgtgtgttg180tattaacttg aagttatcat aagaaccaca aatacactag taaatctatg agaaggcagg240tggcaacaca aacaagagta tctaagattt tcatttgtga ctataggaat ataatatctc300ttatctgatt taatgaatcc acatgttcac ttctcatttg tccacaagat cacaacttta360tcttcaatat tcacaacttg ttatatccac cacaatttca ttcttttcac ttagccccac420aaaatacttt gtccccttat ttgccacctt ttgtatttaa tttattcttg tggagctaag480tgttcatatt attcttcttc tcaaaaaaac aaaaacaaaa aaaaagagaa gaaaaccatg540g541<210>43<211>1358<212>DNA<213>雜合體<400>43ccatggcgag agggagcaga tcagtgggta gcagcagcag caaatggagg tactgcaacc60cttcctatta cttgaagcgc ccaaagcgtc ttgctctgct cttcatcgtt ttcgtttgtg120tctctttcgt tttctgggac cgtcaaactc tcgtcagaga gcaccaggtt gaaatttctg180agctgcagaa agaagtgact gatttgaaaa atttggtgga tgatttaaat aacaaacaag240gtggtacctc tgggaaaact gacttgggga ccatggctct aaggttgcat agaaggaacc300atttttcgcc tagaaatacg gatctgttcc cggatttggc aaaagatcgt gtggttatcg360tcttgtatgt gcataatcgg gctcagtatt ttcgagtcac agtggaaagt ttgtcgaagg420ttaaaggtat aagtgagaca ttgttgattg ttagtcatga tggttacttt gaagagatga480ataggattgt ggagagtatt aagttttgtc aagtgaaaca gattttctcg ccttattcgc540ctcatatata tcgtactagc ttcccgggtg tgaccctgaa tgattgtaag aacaagggtg600atgaggcaaa ggggcattgt gaaggtaatc ctgatcagta tgggaatcat cggtctccga660agattgtatc tttgaagcat cactggtggt ggatgatgaa cactgtatgg gatgggttgg720aagagactaa aggacatgag gggcatatcc ttttcattga agaagatcat tttctgtttc780ctaatgccta tcgtaacata cagactctta cgaggctgaa acccgcaaag tgtcctgact840gttttgctgc taatttagca ccgtctgatg tgaagtcaag aggagaaggg cttgaaagtt900tggttgcaga gagaatggga aatgttgggt attcttttaa tagaagtgtg tgggagaata960ttcatcagaa ggcaagagag ttttgtttct ttgatgatta caactgggat ataacgatgt1020gggcaacggt tttcccgtcg tttggttccc cggtgtacac attgcgaggg cctaggacta1080gtgcggtaca ctttggaaaa tgtgggttgc atcaaggtag aggagatgag ggtgattgca1140tcgataatgg ggtcgtaaac atagaagtta aggaaacaga taaagttgtg aacataaaag1200aaggatgggg agttcgggtg tataagcatc aagcgggtta taaagccggt ttcgaaggtt1260ggggaggttg gggcgatgat agggaccgac atttatgttt ggattttgcc actatgtatc1320gttacagcag tagcagtgca tctccatgaa acggatcc1358<210>44<211>237<212>DNA<213>人工序列<220>
<223>合成的<400>44ggatccgcta gagtccgcaa aaatcaccag tctctctcta caaatctatc tctctctatt 60tttctccaga ataatgtgtg agtagttccc agataaggga attagggttc ttatagggtt 120tcgctcatgt gttgagcata taagaaaccc ttagtatgta tttgtatttg taaaatactt 180ctatcaataa aatttctaat cctaaaacca aaatcccgcg agagacctct taattaa 237<210>45<211>31<212>DNA
<213>人工序列<220>
<223>合成的<400>45atactcgagt taacaatgag taaacggaat c 31<210>46<211>24<212>DNA<213>人工序列<220>
<223>合成的<400>46ttctcgatcg ccgattggtt attc 24<210>47<211>24<212>DNA<213>人工序列<220>
<223>合成的<400>47gccgccgcga tcgggcagtc ctcc 24<210>48<211>30<212>DNA<213>人工序列<220>
<223>合成的<400>48aacggatcca cgctagctcg gtgtcccgat 30<210>49<211>3327<212>DNA<213>雜合體<400>49atgggcatca agatggagac acattctcag gtctttgtat acatgttgct gtggttgtct60ggtgtcgaca tgaagcactt caaatcttcc ctcactcaca ccgtcaagag ccgagacgag120ccaactccgg atcaatgccc tgcattgaag gaaagcgaag cggacatcga caccgtggcg180atatacccaa cttttgattt tcagccgagc tggttgcgta caaaggaatt ttgggacaag240tccttcgagg atcggtatga aagaattcat aacgacacta cacggcctag actgaaggta300atcgtggttc ctcactcaca caacgacccg ggatggctga agacgtttga acagtacttc360gagtggaaga ccaagaacat tatcaacaac atagtgaaca aactgcacca gtaccccaac420atgaccttca tttggaccga gatatcgttt ctgaatgcct ggtgggaaag gtcgcaccct480gtcaaacaaa aggcattgaa aaaacttatc aaagaaggtc gtctcgagat cacgacgggc540ggctgggtga tgccggacga agcctgcacg catatctatg cgctaattga ccagtttatt600gaaggacatc actgggtgaa aactaatctc ggcgtcatcc cgaagacagg atggtctatt660gaccccttcg gccacggggc cactgtgcct tacctgctag accagagcgg ccttgaggga720accattatac agagaatcca ttatgcgtgg aaacagtggc tggcggagcg acagattgag780gagttttact ggctggcgag ttgggctact acgaagccgt ccatgatagt gcacaatcag840ccgtttgata tttattcaat aaaaagcacg tgtggcccgc acccttcaat ttgtctcagt900ttcgacttca ggaagattcc cggcgaatat tctgaataca cagctaagca cgaagacatc960acggaacaca acttgcacag caaggcaaag actttgatag aggagtacga ccgtatcggg1020
tccctgactc cacacaacgt ggtgctggtg ccgctcggag acgacttcag atacgagtac 1080agcgtcgagt ttgatgccca atacgtcaat tatatgaaaa tgtttaacta catcaatgct 1140cacaaggaaa tcttcaacgc tgacgtacag ttcggaactc ctctcgatta ctttaacgcc 1200atgaaagaaa gacatcaaaa tatacccagc ttaaagggag atttcttcgt ttactccgat 1260attttcagcg aaggtaaacc agcgtactgg tcaggttact acactactag accctaccaa 1320aaaatcctcg cccgtcagtt cgaacaccaa ctgcgatcgg cagagatttt attcaccctt 1380gtatcgaact acatcagaca gatgggtcgc caaggagagt tcggagcttc tgagaaaaag 1440ttagaaaaat cttacgagca gcttatctat gctcgacgga acttgggtct gtttcaacat 1500cacgatgcga ttactggaac atcaaagtcc agtgtgatgc aagattacgg aaccaaactg 1560ttcacaagtc tgtatcactg catccgcctg caggaggccg cgctcaccac catcatgttg 1620cctgaccagt cgttgcactc gcagagcatt atacaaagcg aggttgagtg ggaaacttac 1680ggaaaaccgc ccaagaagct gcaagtgtcc ttcattgaca agaagaaagt tatacttttt 1740aatccgttgg ctgagactcg aactgaagtg gtcacggtta gatccaacac gtccaacatc 1800cgggtgtacg atacacacaa gaggaagcac gtcttgtatc agataatgcc cagcatcaca 1860atccaagaca acggcaagag tatcgtaagc gacaccacgt tcgacataat gttcgtggcc 1920accatcccgc ccctcacctc catctcgtac aagctgcagg agcacaccaa cacttcccac 1980cactgcgtca ttttctgcaa caactgcgaa caataccaga aatccaatgt gttccaaatt 2040aagaaaatga tgcctggtga catacaatta gaaaatgcag tgctaaaact tctcgttaat 2100aggaacaccg gctttctgag acaagtctat agaaaggaca tccggaagag aactgtcgtt 2160gacgtacaat tcggcgcata tcaaagtgcc caaagacatt ctggtgctta cctcttcatg 2220cctcattacg actcacctga gaagaatgtt ctgcatccct acactaatca gaacaacatg 2280caagatgata acataatcat agtgtccgga cctatttcta cggaaatcac gaccatgtac 2340ttgcccttct tggtgcacac tattaggata tacaacgtgc cggacccggt actgtcgcgt 2400gctattctat tagagaccga tgtagatttc gaggcgccac ctaagaacag agagactgag 2460ttatttatga gattacagac tgatatacaa aacggtgaca ttcccgaatt ttacaccgat 2520cagaacggat tccagtacca aaagagggtc aaagtgaata aactaggaat agaagctaat 2580tactacccga tcactaccat ggcgtgcctg caagacgagg agacccggct cactctgctg 2640acgaaccacg ctcaaggcgc tgctgcatac gaaccaggac gcttagaagt catgctcgat 2700cgtcgaactc tttatgatga cttcagagga atcggtgaag gagtagtcga taacaaaccg 2760acgactttcc agaactggat tttaattgaa tccatgccag gcgtgacgcg agccaagaga 2820gacactagtg aaccaggttt caaatttgtt aatgaacgtc gttttggccc cggccagaag 2880gaaagccctt accaagtacc gtcgcagact gcggactacc tgagcaggat gttcaattac 2940ccggtgaacg tgtacctggt ggacactagc gaggttggcg agatcgaggt gaagccgtac 3000cagtcgttcc tgcagagctt cccgcccggc atccacctgg tcaccctgcg caccatcacc 3060gacgacgtgc tcgaactctt ccccagcaac gaaagctaca tggtactgca ccgaccagga 3120tacagctgcg ctgtcggaga gaagccagtc gccaagtctc ccaagttttc g tccaaaacc 3180aggttcaatg gtctgaacat tcagaacatc actgcagtca gcctgaccggcctgaagtca 3240ctccgacctc tcacaggtct gagtgacatc cacctgaacg ctatggaggt aaaaacttac 3300aagatcaggt ttaaggacga gctttaa 3327<210>50<211>1108<212>PRT<213>雜合體<400>50Met Gly Ile Lys Met Glu Thr His Ser Gln Val Phe Val Tyr Met Leu1 5 10 15Leu Trp Leu Ser Gly Val Asp Met Lys His Phe Lys Ser Ser Leu Thr20 25 30His Thr Val Lys Ser Arg Asp Glu Pro Thr Pro Asp Gln Cys Pro Ala35 40 45Leu Lys Glu Ser Glu Ala Asp Ile Asp Thr Val Ala Ile Tyr Pro Thr50 55 60Phe Asp Phe Gln Pro Ser Trp Leu Arg Thr Lys Glu Phe Trp Asp Lys65 70 75 80Ser Phe Glu Asp Arg Tyr Glu Arg Ile His Asn Asp Thr Thr Arg Pro85 90 95Arg Leu Lys Val Ile Val Val Pro His Ser His Asn Asp Pro Gly Trp100 105 110
Leu Lys Thr Phe Glu Gln Tyr Phe Glu Trp Lys Thr Lys Asn Ile Ile115 120 125Asn Asn Ile Val Asn Lys Leu His Gln Tyr Pro Asn Met Thr Phe Ile130 135 140Trp Thr Glu Ile Ser Phe Leu Asn Ala Trp Trp Glu Arg Ser His Pro145 150 155 160Val Lys Gln Lys Ala Leu Lys Lys Leu Ile Lys Glu Gly Arg Leu Glu165 170 175Ile Thr Thr Gly Gly Trp Val Met Pro Asp Glu Ala Cys Thr His Ile180 185 190Tyr Ala Leu Ile Asp Gln Phe Ile Glu Gly His His Trp Val Lys Thr195 200 205Asn Leu Gly Val Ile Pro Lys Thr Gly Trp Ser Ile Asp Pro Phe Gly210 215 220His Gly Ala Thr Val Pro Tyr Leu Leu Asp Gln Ser Gly Leu Glu Gly225 230 235 240Thr Ile Ile Gln Arg Ile His Tyr Ala Trp Lys Gln Trp Leu Ala Glu245 250 255Arg Gln Ile Glu Glu Phe Tyr Trp Leu Ala Ser Tro Ala Thr Thr Lys260 265 270Pro Ser Met Ile Val His Asn Gln Pro Phe Asp Ile Tyr Ser Ile Lys275 280 285Ser Thr Cys Gly Pro His Pro Ser Ile Cys Leu Ser Phe Asp Phe Arg290 295 300Lys Ile Pro Gly Glu Tyr Ser Glu Tyr Thr Ala Lys His Glu Asp Ile305 310 315 320Thr Glu His Asn Leu His Ser Lys Ala Lys Thr Leu Ile Glu Glu Tyr325 330 335Asp Arg Ile Gly Ser Leu Thr Pro His Asn Val Val Leu Val Pro Leu340 345 350Gly Asp Asp Phe Arg Tyr Glu Tyr Ser Val Glu Phe Asp Ala Gln Tyr355 360 365Val Asn Tyr Met Lys Met Phe Asn Tyr Ile Asn Ala His Lys Glu Ile370 375 380Phe Asn Ala Asp Val Gln Phe Gly Thr Pro Leu Asp Tyr Phe Asn Ala385 390 395 400Met Lys Glu Arg His Gln Asn Ile Pro Ser Leu Lys Gly Asp Phe Phe405 410 415Val Tyr Ser Asp Ile Phe Ser Glu Gly Lys Pro Ala Tyr Trp Ser Gly420 425 430Tyr Tyr Thr Thr Arg Pro Tyr Gln Lys Ile Leu Ala Arg Gln Phe Glu435 440 445His Gln Leu Arg Ser Ala Glu Ile Leu Phe Thr Leu Val Ser Asn Tyr450 455 460Ile Arg Gln Met Gly Arg Gln Gly Glu Phe Gly Ala Ser Glu Lys Lys
465 470 475 480Leu Glu Lys Ser Tyr Glu Gln Leu Ile Tyr Ala Arg Arg Asn Leu Gly485 490 495Leu Phe Gln His His Asp Ala Ile Thr Gly Thr Ser Lys Ser Ser Val500 505 510Met Gln Asp Tyr Gly Thr Lys Leu Phe Thr Ser Leu Tyr His Cys Ile515 520 525Arg Leu Gln Glu Ala Ala Leu Thr Thr Ile Met Leu Pro Asp Gln Ser530 535 540Leu His Ser Gln Ser Ile Ile Gln Ser Glu Val Glu Trp Glu Thr Tyr545 550 555 560Gly Lys Pro Pro Lys Lys Leu Gln Val Ser Phe Ile Asp Lys Lys Lys565 570 575Val Ile Leu Phe Asn Pro Leu Ala Glu Thr Arg Thr Glu Val Val Thr580 585 590Val Arg Ser Asn Thr Ser Asn Ile Arg Val Tyr Asp Thr His Lys Arg595 600 605Lys His Val Leu Tyr Gln Ile Met Pro Ser Ile Thr Ile Gln Asp Asn610 615 620Gly Lys Ser Ile Val Ser Asp Thr Thr Phe Asp Ile Met Phe Val Ala625 630 635 640Thr Ile Pro Pro Leu Thr Ser Ile Ser Tyr Lys Leu Gln Glu His Thr645 650 655Asn Thr Ser His His Cys Val Ile Phe Cys Asn Asn Cys Glu Gln Tyr660 665 670Gln Lys Ser Asn Val Phe Gln Ile Lys Lys Met Met Pro Gly Asp Ile675 680 685Gln Leu Glu Asn Ala Val Leu Lys Leu Leu Val Asn Arg Asn Thr Gly690 695 700Phe Leu Arg Gln Val Tyr Arg Lys Asp Ile Arg Lys Arg Thr Val Val705 710 715 720Asp Val Gln Phe Gly Ala Tyr Gln Ser Ala Gln Arg His Ser Gly Ala725 730 735Tyr Leu Phe Met Pro His Tyr Asp Ser Pro Glu Lys Asn Val Leu His740 745 750Pro Tyr Thr Asn Gln Asn Asn Met Gln Asp Asp Asn Ile Ile Ile Val755 760 765Ser Gly Pro Ile Ser Thr Glu Ile Thr Thr Met Tyr Leu Pro Phe Leu770 775 780Val His Thr Ile Arg Ile Tyr Asn Val Pro Asp Pro Val Leu Ser Arg785 790 795 800Ala Ile Leu Leu Glu Thr Asp Val Asp Phe Glu Ala Pro Pro Lys Asn805 810 815Arg Glu Thr Glu Leu Phe Met Arg Leu Gln Thr Asp Ile Gln Asn Gly820 825 830
Asp Ile Pro Glu Phe Tyr Thr Asp Gln Asn Gly Phe Gln Tyr Gln Lys835 840 845Arg Val Lys Val Asn Lys Leu Gly Ile Glu Ala Asn Tyr Tyr Pro Ile850 855 860Thr Thr Met Ala Cys Leu Gln Asp Glu Glu Thr Arg Leu Thr Leu Leu865 870 875 880Thr Asn His Ala Gln Gly Ala Ala Ala Tyr Glu Pro Gly Arg Leu Glu885 890 895Val Met Leu Asp Arg Arg Thr Leu Tyr Asp Asp Phe Arg Gly Ile Gly900 905 910Glu Gly Val Val Asp Asn Lys Pro Thr Thr Phe Gln Asn Trp Ile Leu915 920 925Ile Glu Ser Met Pro Gly Val Thr Arg Ala Lys Arg Asp Thr Ser Glu930 935 940Pro Gly Phe Lys Phe Val Asn Glu Arg Arg Phe Gly Pro Gly Gln Lys945 950 955 960Glu Ser Pro Tyr Gln Val Pro Ser Gln Thr Ala Asp Tyr Leu Ser Arg965 970 975Met Phe Asn Tyr Pro Val Asn Val Tyr Leu Val Asp Thr Ser Glu Val980 985 990Gly Glu Ile Glu Val Lys Pro Tyr Gln Ser Phe Leu Gln Ser Phe Pro99510001005Pro Gly Ile His Leu Val Thr Leu Arg Thr Ile Thr Asp Aso Val10101015 1020Leu Glu Leu Phe Pro Ser Asn Glu Ser Tyr Met Val Leu His Arg10251030 1035Pro Gly Tyr Ser Cys Ala Val Gly Glu Lys Pro Val Ala Lys Ser10401045 1050Pro Lys Phe Ser Ser Lys Thr Arg Phe Asn Gly Leu Asn Ile Gln10551060 1065Asn Ile Thr Ala Val Ser Leu Thr Gly Leu Lys Ser Leu Arg Pro10701075 1080Leu Thr Gly Leu Ser Asp Ile His Leu Asn Ala Met Glu Val Lys10851090 1095Thr Tyr Lys Ile Arg Phe Lys Asp Glu Leu11001105<210>51<211>1068<212>DNA<213>雜合體<400>51atgggcatca agatggagac acattctcag gtctttgtat acatgttgct gtggttgtct 60ggtgtcgaca tgcagtcctc cggggagctc cggaccggag gggcccggcc gccgcctcct 120ctaggcgcct cctcccagcc gcgcccgggt ggcgactcca gcccagtcgt ggattctggc 180cctggccccg ctagcaactt gacctcggtc ccagtgcccc acaccaccgc actgtcgctg 240cccgcctgcc ctgaggagtc cccgctgctt gtgggcccca tgctgattga gtttaacatg 300cctgtggacc tggagctcgt ggcaaagcag aacccaaatg tgaagatggg cggccgctat 360gcccccaggg actgcgtctc tcctcacaag gtggccatca tcattccatt ccgcaaccgg 420
caggagcacc tcaagtactg gctatattat ttgcacccag tcctgcagcg ccagcagctg480gactatggca tctatgttat caaccaggcg ggagacacta tattcaatcg tgctaagctc540ctcaatgttg gctttcaaga agccttgaag gactatgact acacctgctt tgtgtttagt600gacgtggacc tcattccaat gaatgaccat aatgcgtaca ggtgtttttc acagccacgg660cacatttccg ttgcaatgga taagtttgga ttcagcctac cttatgttca gtattttgga720ggtgtctctg ctctaagtaa acaacagttt ctaaccatca atggatttcc taataattat780tggggctggg gaggagaaga tgatgacatt tttaacagat tagtttttag aggcatgtct840atatctcgcc caaatgctgt ggtcgggagg tgtcgcatga tccgccactc aagagacaag900aaaaatgaac ccaatcctca gaggtttgac cgaattgcac acacaaagga gacaatgctc960tctgatggtt tgaactcact cacctaccag gtgctggatg tacagagata cccattgtat1020acccaaatca cagtggacat cgggacaccg agcaaggacg agctttag 1068<210>52<211>355<212>PRT<213>雜合體<400>52Met Gly Ile Lys Met Glu Thr His Ser Gln Val Phe Val Lyr Met Leu1 5 10 15Leu Trp Leu Ser Gly Val Asp Met Gln Ser Ser Gly Glu Leu Arg Thr20 25 30Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg35 40 45Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala50 55 60Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu65 70 75 80Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile85 90 95Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro100 105 110Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro115 120 125His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu130 135 140Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu145 150 155 160Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe Asn165 170 175Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr180 185 190Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asn195 200 205Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val210 215 220Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe Gly225 230 235 240Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe245 250 255
Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn260 265 270Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val Val275 280 285Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro290 295 300Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu305 310 315 320Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg325 330 335Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser Lys340 345 350Asp Glu Leu355<210>53<211>1119<212>DNA<213>雜合體<400>53atgggcatca agatggagac acattctcag gtctttgtat acatgttgct gtggttgtct60ggtgtcgaca tgggacagat gcctgtggct gctgtagtgg ttatggcctg cagtcgtgca120gactatcttg aaaggactgt taaatcagtt ttaacatatc aaactcccgt tgcttcaaaa180tatcctctat ttatatctca ggatggatct gatcaagctg tcaagagcaa gtcattgagc240tataatcaat taacatatat gcagcacttg gattttgaac cagtggtcac tgaaaggcct300ggcgaactga ctgcgtacta caagattgca cgtcactaca agtgggcact ggaccagttg360ttttacaaac acaaatttag tcgagtgatt atactagaag atgatatgga aattgctcca420gacttctttg attactttga ggctgcagct agtctcatgg atagggataa aaccattatg480gctgcttcat catggaatga taatggacag aagcagtttg tgcatgatcc ctatgcgcta540taccgatcag atttttttcc tggccttggg tggatgctca agagatcgac ttgggatgag600ttatcaccaa agtggccaaa ggcttactgg gatgattggc tgagactaaa ggaaaaccat660aaaggccgcc aattcattcg accggaagtc tgtagaacat acaattttgg tgaacatggg720tctagtttgg gacagttttt cagtcagtat ctggaaccta taaagctaaa cgatgtgacg780gttgactgga aagcaaagga cctgggatac ctgacagagg gaaactatac caagtacttt840tctggcttag tgagacaagc acgaccaatt caaggttctg accttgtctt aaaggctcaa900aacataaagg atgatgttcg tatccggtat aaagaccaag tagagtttga acgcattgca960ggggaatttg gtatatttga agaatggaag gatggtgtgc ctcgaacagc atataaagga1020gtagtggtgt ttcgaatcca gacaacaaga cgtgtattcc tggttgggcc agattctgta1080atgcagcttg gaattcgaaa ttccaaggac gagctttga 1119<210>54<211>372<212>PRT<213>雜合體<400>54Met Gly Ile Lys Met Glu Thr His Ser Gln Val Phe Val Tyr Met Leu1 5 10 15Leu Trp Leu Ser Gly Val Asp Met Gly Gln Met Pro Val Ala Ala Val20 25 30Val Val Met Ala Cys Ser Arg Ala Asp Tyr Leu Glu Arg Thr Val Lys35 40 45Ser Val Leu Thr Tyr Gln Thr Pro Val Ala Ser Lys Tyr Pro Leu Phe50 55 60
Ile Ser Gln Asp Gly Ser Asp Gln Ala Val Lys Ser Lys Ser Leu Ser65 70 75 80Tyr Asn Gln Leu Thr Tyr Met Gln His Leu Asp Phe Glu Pro Val Val85 90 95Thr Glu Arg Pro Gly Glu Leu Thr Ala Tyr Tyr Lys Ile Ala Arg His100 105 110Tyr Lys Trp Ala Leu Asp Gln Leu Phe Tyr Lys His Lys Phe Ser Arg115 120 125Val Ile Ile Leu Glu Asp Asp Met Glu Ile Ala Pro Asp Phe Phe Asp130 135 140Tyr Phe Glu Ala Ala Ala Ser Leu Met Asp Arg Asp Lys Thr Ile Met145 150 155 160Ala Ala Ser Ser Trp Asn Asp Asn Gly G1n Lys Gln Phe Val His Asp165 170 175Pro Tyr Ala Leu Tyr Arg Ser Asp Phe Phe Pro Gly Leu Gly Trp Met180 185 190Leu Lys Arg Ser Thr Trp Asp Glu Leu Ser Pro Lys Trp Pro Lys Ala195 200 205Tyr Trp Asp Asp Trp Leu Arg Leu Lys Glu Asn His Lys Gly Arg Gln210 215 220Phe Ile Arg Pro Glu Val Cys Arg Thr Tyr Asn Phe Gly Glu His Gly225 230 235 240Ser Ser Leu Gly Gln Phe Phe Ser Gln Tyr Leu Glu Pro Ile Lys Leu245 250 255Asn Asp Val Thr Val Asp Trp Lys Ala Lys Asp Leu Gly Tyr Leu Thr260 265 270Glu Gly Asn Tyr Thr Lys Tyr Phe Ser Gly Leu Val Arg Gln Ala Arg275 280 285Pro Ile Gln Gly Ser Asp Leu Val Leu Lys Ala Gln Asn Ile Lys Asp290 295 300Asp Val Arg Ile Arg Tyr Lys Asp Gln Val Glu Phe Glu Arg Ile Ala305 310 315 320Gly Glu Phe Gly Ile Phe Glu Glu Trp Lys Asp Gly Val Pro Arg Thr325 330 335Ala Tyr Lys Gly Val Val Val Phe Arg Ile Gln Thr Thr Arg Arg Val340 345 350Phe Leu Val Gly Pro Asp Ser Val Met Gln Leu Gly Ile Arg Asn Ser355 360 365Lys Asp Glu Leu370<210>55<211>1158<212>DNA<213>雜合體<400>55atgggcatca agatggagac acattctcag gtctttgtat acatgttgct gtggttgtct60
ggtgtcgaca tggctctaag gttgcataga aggaaccatt tttcgcctag aaatacggat120ctgttcccgg atttggcaaa agatcgtgtg gttatcgtct tgtatgtgca taatcgggct180cagtattttc gagtcacagt ggaaagtttg tcgaaggtta aaggtataag tgagacattg240ttgattgtta gtcatgatgg ttactttgaa gagatgaata ggattgtgga gagtattaag300ttttgtcaag tgaaacagat tttctcgcct tattcgcctc atatatatcg tactagcttc360ccgggtgtga ccctgaatga ttgtaagaac aagggtgatg aggcaaaggg gcattgtgaa420ggtaatcctg atcagtatgg gaatcatcgg tctccgaaga ttgtatcttt gaagcatcac480tggtggtgga tgatgaacac tgtatgggat gggttggaag agactaaagg acatgagggg540catatccttt tcattgaaga agatcatttt ctgtttccta atgcctatcg taacatacag600actcttacga ggctgaaacc cgcaaagtgt cctgactgtt ttgctgctaa tttagcaccg660tctgatgtga agtcaagagg agaagggctt gaaagtttgg ttgcagagag aatgggaaat720gttgggtatt cttttaatag aagtgtgtgg gagaatattc atcagaaggc aagagagttt780tgtttctttg atgattacaa ctgggatata acgatgtggg caacggtttt cccgtcgttt840ggttccccgg tgtacacatt gcgagggcct aggactagtg cggtacactt tggaaaatgt900gggttgcatc aaggtagagg agatgagggt gattgcatcg ataatggggt cgtaaacata960gaagttaagg aaacagataa agttgtgaac ataaaagaag gatggggagt tcgggtgtat1020aagcatcaag cgggttataa agccggtttc gaaggttggg gaggttgggg cgatgatagg1080gaccgacatt tatgtttgga ttttgccact atgtatcgtt acagcagtag cagtgcatct1140ccaaaggacg agctttga 1158<210>56<211>385<212>PRT<213>雜合體<400>56Met Gly Ile Lys Met Glu Thr His Ser Gln Val Phe Val Tyr Met Leu1 5 10 15Leu Trp Leu Ser Gly Val Asp Met Ala Leu Arg Leu His Arg Arg Asn20 25 30His Phe Ser Pro Arg Asn Thr Asp Leu Phe Pro Asp Leu Ala Lys Asp35 40 45Arg Val Val Ile Val Leu Tyr Val His Asn Arg Ala Gln Tyr Phe Arg50 55 60Val Thr Val Glu Ser Leu Ser Lys Val Lys Gly Ile Ser Glu Thr Leu65 70 75 80Leu Ile Val Ser His Asp Gly Tyr Phe Glu Glu Met Asn Arg Ile Val85 90 95Glu Ser Ile Lys Phe Cys Gln Val Lys Gln Ile Phe Ser Pro Tyr Ser100 105 110Pro His Ile Tyr Arg Thr Ser Phe Pro Gly Val Thr Leu Asn Asp Cys115 120 125Lys Asn Lys Gly Asp Glu Ala Lys Gly His Cys Glu Gly Asn Pro Asp130 135 140Gln Tyr Gly Asn His Arg Ser Pro Lys Ile Val Ser Leu Lys His His145 150 155 160Trp Trp Trp Met Met Asn Thr Val Trp Asp Gly Leu Glu Glu Thr Lys165 170 175Gly His Glu Gly His Ile Leu Phe Ile Glu Glu Asp His Phe Leu Phe180 185 190Pro Asn Ala Tyr Arg Asn Ile Gln Thr Leu Thr Arg Leu Lys Pro Ala195 200 205Lys Cys Pro Asp Cys Phe Ala Ala Asn Leu Ala Pro Ser Asp Val Lys
210 215 220Sar Arg Gly Glu Gly Leu Glu Ser Leu Val Ala Glu Arg Met Gly Asn225 230 235 24DVa1 Gly Tyr Ser Phe Asn Arg Ser Val Trp Glu Asn Ile His Gln Lys245 250 255Ala Arg Glu Phe Cys Phe Phe Asp Asp Tyr Asn Trp Asp Ile Thr Met260 265 270Trp Ala Thr Val Phe Pro Ser Phe Gly Ser Pro Val Tyr Thr Leu Arg275 280 285Gly Pro Arg Thr Ser Ala Val His Phe Gly Lys Cys Gly Leu His Gln290 295 300Gly Arg Gly Asp Glu Gly Asp Cys Ile Asp Asn Gly Val Val Asn Ile305 310 315 320Glu Val Lys Glu Thr Asp Lys Val Val Asn Ile Lys Glu Gly Trp Gly325 330 335Val Arg Val Tyr Lys His Gln Ala Gly Tyr Lys Ala Gly Phe Glu Gly340 345 350Trp Gly Gly Trp Gly Asp Asp Arg Asp Arg His Leu Cys Leu Asp Phe355 360 365Ala Thr Met Tyr Arg Tyr Ser Ser Ser Ser Ala Ser Pro Lys Asp Glu370 375 380Leu385<210>57<211>1152<212>DNA<213>類人<400>57atgctgaaga agcagtctgc agggcttgtg ctgtggggcg ctatcctctt tgtggcctgg 60aatgccctgc tgctcctctt cttctggacg cgcccagcac ctggcaggcc accctcagtc120agcgctctcg atggcgaccc cgccagcctc acccgggaag tcgacatgca gtcctccggg160gagctccgga ccggaggggc ccggccgccg cctcctctag gcgcctcctc ccagccgcgc240ccgggtggcg actccagccc agtcgtggat tctggccctg gccccgctag caacttgacc300tcggtcccag tgccccacac caccgcactg tcgctgcccg cctgccctga ggagtccccg360ctgcttgtgg gccccatgct gattgagttt aacatgcctg tggacctgga gctcgtggca420aagcagaacc caaatgtgaa gatgggcggc cgctatgccc ccagggactg cgtctctcct480cacaaggtgg ccatcatcat tccattccgc aaccggcagg agcacctcaa gtactggcta540tattatttgc acccagtcct gcagcgccag cagctggact atggcatcta tgttatcaac600caggcgggag acactatatt caatcgtgct aagctcctca atgttggctt tcaagaagcc660ttgaaggact atgactacac ctgctttgtg tttagtgacg tggacctcat tccaatgaat720gaccataatg cgtacaggtg tttttcacag ccacggcaca tttccgttgc aatggataag780tttggattca gcctacctta tgttcagtat tttggaggtg tctctgctct aagtaaacaa840cagtttctaa ccatcaatgg atttcctaat aattattggg gctggggagg agaagatgat900gacattttta acagattagt ttttagaggc atgtctatat ctcgcccaaa tgctgtggtc960gggaggtgtc gcatgatccg ccactcaaga gacaagaaaa atgaacccaa tcctcagagg1020tttgaccgaa ttgcacacac aaaggagaca atgctctctg atggtttgaa ctcactcacc1080taccaggtgc tggatgtaca gagataccca ttgtataccc aaatcacagt ggacatcggg1140acaccgagct ag1152<210>58<211>383<212>PRT<213>類人
<400>58Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu1 5 10 15Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro20 25 30Ala Pro Gly Arg Pro Pro Ser Val Ser Ala Leu Asp Gly Asp Pro Ala35 40 45Ser Leu Thr Arg Glu Val Asp Met Gln Ser Ser Gly Glu Leu Arg Thr50 55 60Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg65 70 75 80Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala85 90 95Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu100 105 110Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile115 120 125Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro130 135 140Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro145 150 155 160His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu165 170 175Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu180 185 190Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe Asn195 200 205Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr210 215 220Asp Tyr Thr Cys Phe Va1 Phe Ser Asp Val Asp Leu Ile Pro Met Asn225 230 235 240Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val245 250 255Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe Gly260 265 270Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe275 280 285Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn290 295 300Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val Val305 310 315 320Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro325 330 335Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu340 345 350
Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg355 360 365Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser370 375 380<210>59<211>400<212>PRT<213>類人<400>59Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ala Ala Met Pro Gly AIa1 5 10 15Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val Cys Ala Leu His20 25 30Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg Asp Leu Ser Arg35 40 45Leu Pro Gln Leu Val Gly Val Ser Thr Pro Leu Gln Gly Gly Ser Asn50 55 60Ser Ala Ala Ala Ile Gly Gln Ser Ser Gly Glu Leu Arg Thr Gly Gly65 70 75 80Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg Pro Gly85 90 95Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala Ser Asn100 105 110Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu Pro Ala115 120 125Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile Glu Phe130 135 140Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro Asn Val145 150 155 160Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro His Lys165 170 175Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu Lys Tyr180 185 190Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu Asp Tyr195 200 205Gly Ile Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe210 215 220Asn Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp225 230 235 240Tyr Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met245 250 255Asn Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser260 265 270Val Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe275 280 285
Gly Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly290 295 300Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe305 310 315 320Asn Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val325 330 335Val Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu340 345 350Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met355 360 365Leu Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln370 375 380Arg Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser385 390 395 400
權(quán)利要求
1.編碼雜合酶的核酸,所述雜合酶包含植物糖基轉(zhuǎn)移酶的跨膜區(qū)和哺乳動(dòng)物糖基轉(zhuǎn)移酶的催化區(qū)。
2.權(quán)利要求1的核酸,其中所述植物糖基轉(zhuǎn)移酶是木糖基轉(zhuǎn)移酶。
3.權(quán)利要求1的核酸,其中所述植物糖基轉(zhuǎn)移酶是N-乙酰葡糖胺基轉(zhuǎn)移酶。
4.權(quán)利要求1的核酸,其中所述植物糖基轉(zhuǎn)移酶是海藻糖基轉(zhuǎn)移酶。
5.權(quán)利要求1的核酸,其中所述哺乳動(dòng)物糖基轉(zhuǎn)移酶是人半乳糖基轉(zhuǎn)移酶。
6.權(quán)利要求5的核酸,其中所述人半乳糖基轉(zhuǎn)移酶是由至少SEQ ID NO1的核酸序列的一部分編碼。
7.一種表達(dá)載體,包含權(quán)利要求1的核酸。
8.一種用權(quán)利要求7的載體轉(zhuǎn)染的宿主細(xì)胞。
9.權(quán)利要求8的宿主細(xì)胞,其中所述宿主細(xì)胞是植物細(xì)胞。
10.一種細(xì)胞懸浮液,包含權(quán)利要求9的宿主細(xì)胞。
11.由權(quán)利要求9的植物細(xì)胞表達(dá)的雜合酶。
12.包含權(quán)利要求9的宿主細(xì)胞的植物。
13.編碼一種雜合酶的核酸,所述雜合酶包含第一個(gè)糖基轉(zhuǎn)移酶的跨膜區(qū)和第二個(gè)糖基轉(zhuǎn)移酶的催化區(qū)。
14.權(quán)利要求13的核酸,其中所述第一個(gè)糖基轉(zhuǎn)移酶包含植物糖基轉(zhuǎn)移酶。
15.權(quán)利要求14的核酸,其中所述植物糖基轉(zhuǎn)移酶是木糖基轉(zhuǎn)移酶。
16.權(quán)利要求14的核酸,其中所述植物糖基轉(zhuǎn)移酶是海藻糖基轉(zhuǎn)移酶。
17.權(quán)利要求13的核酸,其中所述第二個(gè)糖基轉(zhuǎn)移酶包含哺乳動(dòng)物糖基轉(zhuǎn)移酶。
18.權(quán)利要求17的核酸,其中所述哺乳動(dòng)物糖基轉(zhuǎn)移酶是人半乳糖基轉(zhuǎn)移酶。
19.權(quán)利要求13的核酸,其中所述第一個(gè)糖基轉(zhuǎn)移酶包含第一個(gè)哺乳動(dòng)物糖基轉(zhuǎn)移酶和所述第二個(gè)糖基轉(zhuǎn)移酶包含第二個(gè)哺乳動(dòng)物糖基轉(zhuǎn)移酶。
20.權(quán)利要求19的核酸,其中所述第一個(gè)哺乳動(dòng)物糖基轉(zhuǎn)移酶是非人類糖基轉(zhuǎn)移酶。
21.權(quán)利要求19的核酸,其中所述第二個(gè)哺乳動(dòng)物糖基轉(zhuǎn)移酶是人糖基轉(zhuǎn)移酶。
22.一種方法,包含a)提供i)一種植物細(xì)胞,和ii)一種包含編碼雜合酶的核酸的表達(dá)載體,所述雜合酶包含植物糖基轉(zhuǎn)移酶的跨膜區(qū)和哺乳動(dòng)物糖基轉(zhuǎn)移酶的催化區(qū);和b)在使得所述雜合酶被表達(dá)的條件下,將所述表達(dá)載體導(dǎo)入所述植物細(xì)胞。
23.權(quán)利要求22的方法,其中所述植物糖基轉(zhuǎn)移酶是木糖基轉(zhuǎn)移酶。
24.權(quán)利要求23的方法,其中所述植物糖基轉(zhuǎn)移酶是N-乙酰葡糖胺基轉(zhuǎn)移酶。
25.權(quán)利要求23的方法,其中所述植物糖基轉(zhuǎn)移酶是海藻糖基轉(zhuǎn)移酶。
26.權(quán)利要求22的方法,其中所述哺乳動(dòng)物糖基轉(zhuǎn)移酶是人半乳糖基轉(zhuǎn)移酶。
27.權(quán)利要求26的方法,其中所述人半乳糖基轉(zhuǎn)移酶是由至少SEQ ID NO1的核酸序列的一部分編碼。
28.一種方法,包含a)提供i)一種植物細(xì)胞,和ii)包含編碼雜合酶的核酸的第一種表達(dá)載體,所述雜合酶包含植物糖基轉(zhuǎn)移酶的跨膜區(qū)和哺乳動(dòng)物糖基轉(zhuǎn)移酶的催化區(qū);和iii)包含編碼異源糖蛋白的核酸的第二個(gè)表達(dá)載體,和;b)在使得所述雜合酶被表達(dá)的條件下,將所述第一和第二種載體導(dǎo)入所述植物細(xì)胞。
29.權(quán)利要求28的方法,其中所述異源蛋白是一種抗體或抗體片段。
30.一種方法,包含a)提供i)包含第一種表達(dá)載體的第一種植物,所述第一個(gè)載體包含編碼雜合酶的核酸,所述雜合酶包含至少植物糖基轉(zhuǎn)移酶的跨膜區(qū)的一部分和至少哺乳動(dòng)物糖基轉(zhuǎn)移酶的催化區(qū)的一部分,和ii)包含第二個(gè)表達(dá)載體的第二種植物,所述第二個(gè)載體包含編碼異源蛋白的核酸;和b)雜交所述第一種植物和第二種植物來(lái)制備表達(dá)所述雜合酶和所述異源蛋白的子代。
31.一種植物,包含第一個(gè)和第二個(gè)表達(dá)載體,所述第一個(gè)載體包含編碼雜合酶的核酸,所述雜合酶包含至少植物糖基轉(zhuǎn)移酶的跨膜區(qū)的一部分和至少哺乳動(dòng)物糖基轉(zhuǎn)移酶的催化區(qū)的一部分,所述第二個(gè)載體包含編碼異源蛋白的核酸。
32.權(quán)利要求31的植物,其中所述異源蛋白與異源蛋白在無(wú)所述雜合酶的植物中被表達(dá)相比,表現(xiàn)為海藻糖含量降低。
33.權(quán)利要求31的植物,其中異源蛋白與所述異源蛋白在無(wú)所述雜合酶的植物中的表達(dá)相比,表現(xiàn)為木糖含量降低。
34.權(quán)利要求31的植物,其中異源蛋白與所述異源蛋白在無(wú)所述雜合酶的植物中的表達(dá)相比,表現(xiàn)為海藻糖和木糖含量都降低。
35.權(quán)利要求31的植物,其中異源蛋白具有復(fù)合型雙觸角聚糖,并且至少一個(gè)臂上含有半乳糖殘基。
36.編碼雜合酶的核酸,所述雜合酶包含被修飾的哺乳動(dòng)物糖基轉(zhuǎn)移酶,其中跨膜部分被刪除而插入內(nèi)質(zhì)網(wǎng)滯留信號(hào)。
37.編碼雜合酶的核酸,所述雜合酶包含植物糖基轉(zhuǎn)移酶的CTS區(qū)或其部分和哺乳動(dòng)物糖基轉(zhuǎn)移酶的催化區(qū),其中所述CTS區(qū)來(lái)自N-乙酰葡糖胺基轉(zhuǎn)移酶I(GnT I),所述催化區(qū)來(lái)自甘露糖苷酶II(Man II)。
38.編碼雜合酶的核酸,所述雜合酶包含植物糖基轉(zhuǎn)移酶的CTS區(qū)或其部分和哺乳動(dòng)物糖基轉(zhuǎn)移酶的催化區(qū),其中所述CTS區(qū)或其部分來(lái)自N-乙酰葡糖胺基轉(zhuǎn)移酶I(GnT I),所述催化區(qū)來(lái)自N-乙酰葡糖胺基轉(zhuǎn)移酶II(GnT II)。
39.一種植物宿主系統(tǒng),包含(a)編碼甘露糖苷酶III糖基轉(zhuǎn)移酶的核酸序列;(b)編碼雜合酶的核酸序列,所述雜合酶包含植物糖基轉(zhuǎn)移酶的CTS區(qū)或其部分和哺乳動(dòng)物糖基轉(zhuǎn)移酶的催化區(qū)。
40.一種方法,包含(a)往所述植物宿主系統(tǒng)中導(dǎo)入一個(gè)載體,其包含i)編碼雜合酶的核酸序列,雜合酶包含通常不存在于植物的半乳糖基轉(zhuǎn)移酶的催化區(qū)和一種蛋白的跨膜區(qū),ii)編碼包含N-乙酰葡糖胺基轉(zhuǎn)移酶I(GnT I)的跨膜區(qū)和甘露糖苷酶II(Man II)的催化區(qū)的雜合酶的核酸序列,iii)編碼包含N-乙酰葡糖胺基轉(zhuǎn)移酶I(GnT I)的跨膜區(qū)和N-乙酰葡糖胺基轉(zhuǎn)移酶II(GnT II)的催化區(qū)的雜合酶的核酸序列;和(b)分離表達(dá)所述核酸序列的植物或其部分。
41.一種方法,包含(a)提供i)一種宿主細(xì)胞,和ii)包含編碼雜合酶的核酸的表達(dá)載體,所述雜合酶包含第一個(gè)糖基轉(zhuǎn)移酶的跨膜區(qū)和第二個(gè)糖基轉(zhuǎn)移酶的催化區(qū);和(b)在使得所述雜合酶被表達(dá)的條件下,將所述表達(dá)載體導(dǎo)入所述宿主系統(tǒng)中。
42.權(quán)利要求41的方法,其中所述第一個(gè)糖基轉(zhuǎn)移酶包含植物糖基轉(zhuǎn)移酶。
43.權(quán)利要求42的方法,其中所述植物糖基轉(zhuǎn)移酶是木糖基轉(zhuǎn)移酶。
44.權(quán)利要求42的方法,其中所述植物糖基轉(zhuǎn)移酶是N-乙酰葡糖胺基轉(zhuǎn)移酶。
45.權(quán)利要求42的方法,其中所述植物糖基轉(zhuǎn)移酶是海藻糖基轉(zhuǎn)移酶。
46.權(quán)利要求41的方法,其中所述第二個(gè)糖基轉(zhuǎn)移酶包含哺乳動(dòng)物糖基轉(zhuǎn)移酶。
47.權(quán)利要求46的方法,其中所述哺乳動(dòng)物糖基轉(zhuǎn)移酶是人半乳糖基轉(zhuǎn)移酶。
48.一種方法,包含(a)提供i)一種宿主細(xì)胞,和ii)包含編碼雜合酶的核酸的第一種表達(dá)載體,所述雜合酶包含第一個(gè)糖基轉(zhuǎn)移酶的跨膜區(qū)和第二個(gè)糖基轉(zhuǎn)移酶的催化區(qū);和iii)包含編碼異源糖蛋白的核酸的第二個(gè)表達(dá)載體;和(b)在使得所述雜合酶和異源蛋白被表達(dá)的條件下,將所述第一種和第二種表達(dá)載體導(dǎo)入所述宿主系統(tǒng)中,。
49.權(quán)利要求48的方法,其中所述異源蛋白是抗體或抗體片段。
50.權(quán)利要求48的方法,還包括步驟c)分離所述異源蛋白。
51.按照權(quán)利要求50的方法制備的分離的異源蛋白。
52.一種宿主細(xì)胞,包含第一種和第二種表達(dá)載體,所述第一個(gè)載體包含編碼雜合酶的核酸,所述雜合酶包含至少第一個(gè)糖基轉(zhuǎn)移酶的跨膜部分的一部分和至少第二個(gè)糖基轉(zhuǎn)移酶的催化區(qū)的一部分,所述第二個(gè)載體包含編碼異源蛋白的核酸。
53.從權(quán)利要求52的宿主細(xì)胞分離的異源蛋白。
全文摘要
本發(fā)明涉及優(yōu)化生物體(特別是植物中)的聚糖生成方法,以獲得具有復(fù)合型雙觸角聚糖的糖蛋白,并且在雙臂上含有5半乳糖殘基而不含有(或減少)木糖和海藻糖。本發(fā)明還涉及獲得的所述糖蛋白和含有所述蛋白的宿主系統(tǒng)。
文檔編號(hào)A01H5/00GK1756844SQ03806547
公開日2006年4月5日 申請(qǐng)日期2003年3月18日 優(yōu)先權(quán)日2002年3月19日
發(fā)明者H·A·C·巴克, D·E·A·弗洛拉克, H·J·博斯, G·J·A·魯文德爾 申請(qǐng)人:國(guó)際植物研究所