欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

生物素的制備方法

文檔序號:452840閱讀:5333來源:國知局
專利名稱:生物素的制備方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種包括具有序列SEQ ID No.1或SEQ ID No.3的生物素基因的基因構(gòu)建體、含有這種基因構(gòu)建體的生物體、用于制備生物素的這些序列或所述基因構(gòu)建體的用途以及一種用于制備生物素的方法。
生物素(維生素H)在酶催化的羧化和脫羧反應(yīng)中作為輔酶起主要作用。由此生物素在活細(xì)胞中是一種必需的因子。幾乎所有的動物和某些微生物必須從外界攝取生物素,這是因為它們自身不能合成生物素。因此,它對于這些生物體來說是一處必需的維生素。相反,細(xì)菌、酵母和植物自身能夠從前體合成生物素(Brown等《生物技術(shù)遺傳工程回顧》(Biotechnol.Genet.Eng.Rev.)9,1991295-326,DeMoll,E.,《大腸桿菌和沙門氏菌屬》(Escherichia coli andSalmonella),Neidhardt,F(xiàn).C.等編輯,ASM出版社出版,華盛頓特區(qū),美國,1996704-708,ISBN 1-55581-084-5)。
已經(jīng)研究了細(xì)菌生物體、特別是在革蘭氏陰性菌大腸桿菌中和在革蘭氏陽性菌球形芽孢桿菌中的生物素合成(Brown等《生物技術(shù)遺傳工程回顧》(Biotechnol.Genet.Eng.Rev.)9,1991295-326)。認(rèn)為目前在大腸桿菌中公知的第一種中間體是庚二酰輔酶A(Pm-CoA),它來源于脂肪酸的合成(DeMoll,E.,《大腸桿菌和沙門氏菌屬》(Escherichia coli and Salmonella),Neidhardt,F(xiàn).C.等編輯,ASM出版社出版,華盛頓特區(qū),美國1996704-708,ISBN1-55581-084-5 1996)。目前實際上還不了解大腸桿菌中這種生物素前體的合成途徑(Ifuku 1993,Lemoine,1996)。已經(jīng)鑒定了兩種基因、即bioC和bioH,它們的相應(yīng)蛋白質(zhì)是導(dǎo)致合成Pm-CoA的原因。目前還不了解所述基因產(chǎn)物BioH和BioC的酶功能(Lemoine等《分子微生物學(xué)》(Mol.Microbio.)19,1996645-647,DeMoll,E.,《大腸桿菌和沙門氏菌屬》(Escherichia coli andSalmonella),Neidhardt,F(xiàn).C.等編輯,ASM出版社出版,華盛頓特區(qū),美國1996704-708,ISBN 1-55581-084-5)。在4個進(jìn)一步的酶促步驟中將Pm-CoA轉(zhuǎn)化成生物素。最初從Pm-CoA與丙氨酸的縮合開始而得到7-酮基-8-氨基壬酸(KAPA)。針對這種轉(zhuǎn)化的基因產(chǎn)物是BioF(KAPA合成酶)。通過BioA(KAPA氨基轉(zhuǎn)移酶)與共底物S-腺苷甲硫氨酸使KAPA轉(zhuǎn)氨基化而得到7,8-二氨基壬酸。在ATP-依賴性羧化反應(yīng)后,下一步產(chǎn)生去硫生物素(DTB)并由BioD(去硫生物素合酶)催化。在最后的步驟中,DTB被轉(zhuǎn)化成生物素。該步驟由BioB(生物素合成酶)催化。在大腸桿菌內(nèi)的雙向操縱子上編碼用于編碼已經(jīng)描述的蛋白質(zhì)的基因bioF、bioA、bioD和bioB。這種操縱子位于大腸桿菌染色體上的λ附著位點與uvrB基因的基因座之間約17分鐘。(Berlyn等19961715-1902)。另外在這種操縱子上編碼兩種其它的基因,其中之一bioC具有在合成Pm-CoA中已進(jìn)行了描述的功能,而它仍已不可能給予位于bioA之后的可讀框的功能(WO94/8023,Otsuka等《生物化學(xué)雜志》(J.Biol.Chem.)263,198819577-85)。已經(jīng)在球形芽孢桿菌、枯草芽孢桿菌、集胞藍(lán)細(xì)菌屬(SyneCcocystis sp.)(Brown等《生物技術(shù)遺傳工程回顧》(Biotechnol.Genet.Eng.Rev.)9,1991295-326,Bower等《細(xì)菌學(xué)雜志》(J.Bacteriol.)175,19964122-4130,Kaneko等《DNA研究》(DNA Res.)3,3,1996109-136)、諸如詹氏甲烷球菌(Methanococcus janaschi)這樣的古生菌綱、諸如啤酒糖酵母這樣的酵母(Zhang等《生物化學(xué)和生物物理學(xué)記錄》(Arch.Biochem.Biophys.)309,1,199429-35)或在諸如鼠耳芥(Baldet等,C.R.Acad.Sci.III,Sci.Vie.319,2,199699-106)這樣的植物中發(fā)現(xiàn)了與大腸桿菌蛋白質(zhì)BioF、A、D、B的高度保守的同系物。
看起來Pm-CoA的合成不同地發(fā)生在迄今已經(jīng)被研究過的兩種革蘭氏陽性微生物中而不是在大腸桿菌中。已經(jīng)不可能發(fā)現(xiàn)bioH和bioC的任何同系物了(Brown等《生物技術(shù)遺傳工程回顧》(Biotechnol.Genet.Eng.Rev.)9,1991295-326)。
生物素是一種具有三個手性中心的旋光物。目前在商業(yè)上僅用一種多級昂貴的化學(xué)合成法來制備生物素。
作為一種可替換這種化學(xué)合成的方法,已經(jīng)進(jìn)行了許多種嘗試來確定使用微生物制備生物素的發(fā)酵方法。通過在多拷貝質(zhì)粒上克隆生物素操縱子已經(jīng)能夠在用這些基因轉(zhuǎn)化的微生物中增加生物素的合成。通過經(jīng)篩選birA突變體使生物素基因表達(dá)失去調(diào)節(jié)已經(jīng)實現(xiàn)了生物素合成的進(jìn)一步增加(Pai C.H.,《細(xì)菌學(xué)雜志》(J.Bacteriol.)112,19721280-1287)。將兩種方法結(jié)合使用、即在一種調(diào)節(jié)缺陷的菌株中表達(dá)編碼質(zhì)粒的生物合成基因(EP-B-0 236429)這一過程導(dǎo)致產(chǎn)量的進(jìn)一步提高。在這種情況中,生物素操縱子可以在其天然雙向啟動子的控制下保留下來(EP-B-0 236 429);或者可以將其基因置于一種可被外部調(diào)節(jié)的啟動子的控制下(WO94/8023)。
通過以前經(jīng)在大腸桿菌中發(fā)酵而制備生物素的方法已不可能在商業(yè)上得到足夠的產(chǎn)量。已經(jīng)顯示通過發(fā)酵制備生物素的產(chǎn)量是由BioB基因產(chǎn)物(生物素合酶)將DTB不完全轉(zhuǎn)化成生物素而導(dǎo)致的。在bioB基因中隱藏突變的細(xì)胞不能夠在DTB上生長且由此不能將DTB轉(zhuǎn)化成生物素。目前對將DTB轉(zhuǎn)化成生物素的化學(xué)和酶的機(jī)理僅僅被不完全地理解和解釋。
目前的精細(xì)的遺傳研究已不能夠鑒定參與反應(yīng)的另外的蛋白質(zhì)。迄今僅在細(xì)菌和植物細(xì)胞提取物中進(jìn)行了DTB轉(zhuǎn)化成生物素的特性記述(WO94/8023,EP-B-0 449 724,Sanyal等《生物化學(xué)和生物物理學(xué)記錄》(Arch.Biochem.Biophys.)第326卷第1期,199648-56和《生物化學(xué)》(Biochemistry)33,19943625-3631,Baldet等《歐洲生物化學(xué)雜志》(Europ.J.Biochem.)217,1,1993479-485,Mejean等《生物化學(xué)和生物物理學(xué)研究通訊》(Biochem.Biophys.Res.Commun.)第217卷第3期19951231-1237,Ohshiro等《生物科學(xué)、生物技術(shù)和生物化學(xué)》(Biosci.Biotechnol.Biochem.)58,9,19941738-1741)。
這些研究已經(jīng)證實低分子量的因子諸如S-腺苷甲硫氨酸、NADPH、半胱氨酸、硫胺素、Fe2+、天冬酰胺、絲氨酸、果糖-1,6-二磷酸可刺激生物素的合成(Ohshiro等《生物科學(xué)、生物技術(shù)和生物化學(xué)》(Biosci.Biotechnol.Biochem.)58,9,19941738-1741,Birch等《生物化學(xué)雜志》(J.Biol.Chem.)270,32,199519158-19165,Ifuk等《生物科學(xué)、生物技術(shù)和生物化學(xué)》(Biosci.Biotechnol.Biochem.)59,2,1995185-189)。除這些低分子量的因子外,還鑒定了在BioB存在的情況下刺激從DTB合成生物素的其它蛋白質(zhì)。它們是黃素氧還蛋白和黃素氧還蛋白-NADPH還原酶(Birch等《生物化學(xué)雜志》(J.Biol.Chem.)270,32,199519158-19165,Ifuku等《生物科學(xué)、生物技術(shù)和生物化學(xué)》(Biosci.Biotechnol.Biochem.)59,2,1995185-189,Sanyal等《生物化學(xué)和生物物理學(xué)記錄》(Arch.Biochem.Biophys.)326,1,199648-56)。
生物素的合成和硫辛酸的合成顯示出巨大的同源性。在兩種合成途徑中,在合成最后階段的非活化碳原子之間插入了一個硫原子或兩個硫原子。不過,目前硫辛酸的合成僅僅不充分地進(jìn)行了特征記述(DeMoll,E.,《大腸桿菌和沙門氏菌屬》(Escherichia coli andSalmonella),Neidhardt,F(xiàn).C.等編輯,ASM出版社出版,華盛頓特區(qū),美國1996704-708,ISBN 1-55581-084-5)。目前,僅在大腸桿菌中鑒定了兩種必須的基因lipA和lipB。兩種基因均位于一個操縱子中,在兩種基因之間有一個仍未進(jìn)行特征鑒定的可讀框(=ORF)。另一種基因lplA能夠通過硫辛酰-AMP中間體將硫辛酸轉(zhuǎn)化成賴氨酸。由此這種反應(yīng)與birA的活性類似。通過LipA和BioB之間的序列比較已經(jīng)鑒定了氨基酸序列中的同源區(qū)。它們包括、特別是半胱氨酸簇。已經(jīng)證實LipA催化將兩個硫原子引入硫辛酸的過程(DeMoll,E.,《大腸桿菌和沙門氏菌屬》(Escherichia coli andSalmonella),Neidhardt,F(xiàn).C.等編輯,ASM出版社出版,華盛頓特區(qū),美國1996704-708,ISBN 1-55581-084-5)。
與生物素分子中硫原子來源相關(guān)的結(jié)果是矛盾的。在整個細(xì)胞提取物中對生物素合成的研究證實在35S-標(biāo)記的半胱氨酸存在的情況下放射性被引入生物素中;用35S-標(biāo)記的甲硫氨酸或用S-腺苷甲硫氨酸將硫原子引入生物素分子是檢測不到的(Ifuku等《生物科學(xué)、生物技術(shù)和生物化學(xué)》(Biosci.Biotechnol.Biochem.)59,2,1995184-189,Birch等《生物化學(xué)雜志》(J.Biol.Chem.)270,32,199519158-19165)。
這與在有35S-標(biāo)記的半胱氨酸存在且沒有添加細(xì)胞提取物的情況下對純化的BioB蛋白質(zhì)的研究相反,在這種情況中,盡管觀察到了生物素的合成,但是沒有將放射性引入生物素分子(Sanyal等《生物化學(xué)和生物物理學(xué)記錄》(Arch.Biochem.Biophys.)326,1,199648-56,Mejean等《生物化學(xué)和生物物理學(xué)研究通訊》(Biochem.Biophys.Res.Commun.)2127,3,19951231-1237)。在這些合成條件下(沒有添加細(xì)胞提取物),所形成的生物素的量很小且相應(yīng)的最大量為約2mol的生物素/mol的BioB(Sanyal等《生物化學(xué)和生物物理學(xué)記錄》(Arch.Biochem.Biophys.)326,1,199648-56)或0.1mol的生物素/mol的BioB(Mejean等《生物化學(xué)和生物物理學(xué)研究通訊》(Biochem.Biophys.Res.Commun.)2127,3,19951231-1237)。根據(jù)這些研究結(jié)果,可以將硫引入生物素而不用將半胱氨酸用作硫的供體。這種沒有硫的外部來源的生物素形成可以被解釋為已經(jīng)在BioB中檢測到的從2Fe-2S簇中硫的轉(zhuǎn)移。用于生物素合成的硫的實際來源仍然是不清楚的。由此已不可能證明體外BioB的真正催化活性。
盡管有大量的方法,但是來自微生物發(fā)酵的生物素產(chǎn)量對于工業(yè)化生產(chǎn)來說目前是不足的。
本發(fā)明的一個目的是開發(fā)一種用于通過發(fā)酵制備生物素的工業(yè)化方法,該方法盡可能使去硫生物素轉(zhuǎn)化成生物素達(dá)到最佳化并由此使得生物素的合成得到改進(jìn)成為可能。
我們已經(jīng)發(fā)現(xiàn)通過用于制備生物素的新方法來實現(xiàn)這一目的,所述的新方法包括下列步驟在能夠合成生物素的原核或真核宿主生物體內(nèi)表達(dá)一種具有序列SEQ ID No.1或SEQ ID No.3的生物素基因及其功能性變體、類似物或衍生物;培養(yǎng)這種生物體并在分離生物量后或純化生物素后直接使用合成的生物素。
將在新方法中所用并具有序列SEQ ID No.1或SEQ ID No.3的生物素基因分別保存在SwissProt數(shù)據(jù)庫中并給予其登記號AE000364和D90811。序列D90811已經(jīng)另外由Aiba等在《DNA研究》(DNA Res.)3,6,1996363-377中進(jìn)行了描述。對于所述數(shù)據(jù)庫中的兩種序列來說,已經(jīng)注意到它們與Nifs蛋白質(zhì)同源。有關(guān)這些序列的進(jìn)一步的信息無法從所述數(shù)據(jù)庫或出版物中得到。
通過在原核或真核宿主生物體內(nèi)表達(dá)序列SEQ ID No.1和/或SEQ ID No.3可以顯著增加生物素合成的產(chǎn)量。與不含這些基因的對照組比較,所述基因的表達(dá)使得從去硫生物素合成生物素提高了至少2倍,優(yōu)選超過3倍。優(yōu)選使用序列SEQ ID No.1。
在分離和測序后,可能獲得在新方法中所用的生物素基因或其等位變體,所述基因具有核苷酸序列SEQ ID No.1和SEQ ID No.3并且編碼SEQ ID No.2和SEQ ID No.4中表示的氨基酸序列。等位變體指的是在氨基酸水平上顯示有40-100%同源性的SEQ ID No.1或SEQ ID No.3的變體,優(yōu)選50-100%,特別優(yōu)選80-100%。等位變體包括、特別是通過缺失、插入或置換來自SEQ ID No.1或SEQ ID No.3中所述序列的核苷酸而獲得的功能性變體,然而,其中仍保留了酶活性。
SEQ ID No.1或SEQ ID No.3的類似物指的是例如它們的細(xì)菌、真菌、植物或酵母的同系物、截短的序列、編碼和非編碼DNA序列的單鏈DNA或RNA。
衍生物指的是例如啟動子變體。位于所述核苷酸序列之前的啟動子可通過一個或多個核苷酸的交換、通過插入和/或缺失來改變,然而,這不會對所述啟動子的功能或活性有副作用。此外,所述啟動子可以通過改變其序列使其活性增加或者被更有效的、甚至來源于異源生物體的啟動子完全取代。
衍生物還指某些變體,其核苷酸序列已經(jīng)在起始密碼子前-1--30區(qū)中以基因表達(dá)和/或蛋白質(zhì)表達(dá)得到增加這樣一種方式被改變。它受到改變SD序列的有利影響。
在新方法中合適的原核宿主生物體一般是所有合成生物素的革蘭氏陰性菌或革蘭氏陽性菌??梢蕴峒暗母锾m氏陰性菌的實例是腸桿菌科(Enterobacteriaceae),諸如埃希氏桿菌屬、氣桿菌屬、腸桿菌屬、檸檬桿菌屬、志賀氏菌屬、克雷白氏桿菌屬、沙雷氏菌屬、歐文氏桿菌屬或沙門氏菌屬;假單胞菌科,諸如假單胞菌屬、黃單胞菌屬、伯克霍爾德氏菌屬、葡糖桿菌屬、亞硝化單胞菌屬、硝化桿菌屬、甲烷單胞菌屬、叢毛單胞菌屬、纖維單胞菌屬或醋桿菌屬;固氮菌科,諸如固氮菌屬、氮單胞菌屬、拜葉林克氏菌屬或德克斯氏菌屬;奈瑟氏球菌科,諸如莫拉氏菌屬、不動桿菌屬、金氏菌屬、奈瑟氏球菌屬或布蘭漢氏球菌屬;根瘤菌科,諸如根瘤菌屬或土壤桿菌屬;或者革蘭氏陰性的發(fā)酵單胞菌屬、色桿菌屬或黃桿菌屬??梢蕴峒暗母锾m氏陽性菌的實例是形成內(nèi)生孢子的革蘭氏陽性需氧或厭氧菌,諸如芽孢桿菌屬、乳孢芽孢桿菌屬或梭狀芽孢桿菌屬;棒狀桿菌的細(xì)菌,諸如節(jié)桿菌屬、纖維單胞菌屬、短小桿菌屬、科里氏桿菌屬、短桿菌屬、微桿菌屬或庫特氏菌屬;放線菌目,諸如分枝桿菌屬、紅球菌屬、鏈霉菌屬或諾卡氏菌屬;乳桿菌科,諸如乳桿菌屬或乳球菌屬;革蘭氏陽性球菌,諸如微球菌屬或葡萄球菌屬。
所述新方法中優(yōu)選使用的細(xì)菌是埃希氏桿菌屬、檸檬桿菌屬、沙雷氏菌屬、克雷白氏桿菌屬、沙門氏菌屬、假單胞菌屬、叢毛單胞菌屬、不動桿菌屬、固氮桿菌屬、色桿菌屬、芽孢桿菌屬、梭狀芽孢桿菌屬、節(jié)桿菌屬、棒狀桿菌屬、短桿菌屬、乳球菌屬、乳芽孢桿菌屬、鏈霉菌屬、根瘤菌屬、土壤桿菌屬或葡萄球菌屬。
特別優(yōu)選的屬和種是大腸桿菌、弗勞地氏檸檬桿菌、粘質(zhì)沙雷氏菌、鼠傷寒沙門氏菌、門多茜娜假單胞菌、銅綠假單胞菌、Pseudomonasmutabilis、綠葉假單胞菌、熒光假單胞菌、食酸叢毛單胞菌、睪丸酮叢毛單胞菌、醋酸鈣不動桿菌、棕色固氮桿菌、紫色桿菌、枯草芽孢桿菌、球形芽孢桿菌、嗜熱脂肪芽孢桿菌、短小芽孢桿菌、地衣形芽孢桿菌、解淀粉芽孢桿菌、巨大芽孢桿菌、蠟狀芽孢桿菌、蘇云芽孢桿菌、檸檬色節(jié)桿菌、石蠟節(jié)桿菌、谷氨酸棒狀桿菌、Corynebacterium primorioxydans、棒狀桿菌屬、酮戊二酸短桿菌、亞麻短桿菌、短桿菌屬、變青鏈霉菌、豌豆根瘤菌或根癌土壤桿菌。可有利使用的是已經(jīng)增加了天然生物素產(chǎn)量的細(xì)菌。
近年來已經(jīng)對所述屬的分類定位進(jìn)行了重大改變且仍然不斷進(jìn)行改變,這是因為將不正確的屬和種名進(jìn)行了改正。過去對細(xì)菌分類范圍內(nèi)的所述屬進(jìn)行分類重新編制的這種頻繁需求指的是非上述的科、屬和種也適合于新方法。
用于新方法的合適的真核宿主生物體一般是所有合成生物素的生物體,諸如真菌、酵母、植物或植物細(xì)胞。作為優(yōu)選提及的酵母是紅酵母屬、Yarrowia、擲孢酵母屬、糖酵母屬或裂殖糖酵母屬。特別優(yōu)選的屬和種是深紅酵母、膠粘紅酵母、禾木科紅酵母、Yarrowialipolytica、赭色擲孢酵母、Sporobolomyces shibatanus或啤酒糖酵母。
原則上能夠使用所有的植物作為宿主生物體,且優(yōu)選的植物是那些在家蓄飼養(yǎng)或人體營養(yǎng)中重要的植物,諸如玉米、小麥、大麥、黑麥、馬鈴薯、豌豆、黃豆、向日葵、棕櫚、小米、芝麻、干椰子肉或油菜。諸如鼠耳芥或薰衣草這樣的植物也是合適的。特別優(yōu)選的是植物細(xì)胞培養(yǎng)物、來自植物的原生質(zhì)體或愈傷組織的培養(yǎng)物。
有利的是在新方法中使用微生物,諸如細(xì)菌、真菌、酵母或植物細(xì)胞,它們能夠?qū)⑸锼胤置谌肱囵B(yǎng)基且在合適的情況下它們另外具有增加的天然生物素的合成。對于這些生物體來說,還可能且有利的是使對其生物素生物合成調(diào)節(jié)的缺乏,即對所述的合成沒有調(diào)節(jié)或僅有很小的調(diào)節(jié)。這種調(diào)節(jié)的缺乏導(dǎo)致這些生物體具有顯著較高的生物素產(chǎn)量。例如,對于作為birA缺損突變體的大腸桿菌來說這種類型的調(diào)節(jié)缺乏是公知的且應(yīng)優(yōu)選存在于呈可受外部影響而誘導(dǎo)(例如是溫度誘導(dǎo)的)的缺損形式的細(xì)胞中。在已用生物素基因轉(zhuǎn)化后,原則上也可以使用不能天然生產(chǎn)生物素的生物體。
為了進(jìn)一步提高總生物素的產(chǎn)量,有利的是新方法中的生物體應(yīng)另外含有至少一種其它的生物素基因,該基因選自下列基因組成的組bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY或bioR。這種附加的基因或這些附加的基因可以一個或多個拷貝存在于細(xì)胞內(nèi)。它們可以位于與序列SEQ ID No.1和/或SEQ ID No.3的相同載體上,或者它們已經(jīng)被整合在單個載體上或者另外已經(jīng)被整合入染色體。還可以將序列SEQ ID No.1和/或SEQ ID No.3插入所述的基因組。
新型基因構(gòu)建體指的是生物素基因序列SEQ ID No.1和SEQ IDNo.3及其功能性變體、類似物或衍生物,在功能上它們與一種或多種調(diào)節(jié)信號連接以增加基因的表達(dá)。除這些新型調(diào)節(jié)序列外,在實際結(jié)構(gòu)基因前的這些序列的天然調(diào)節(jié)可以依然存在,且如果合適,已經(jīng)將它們進(jìn)行遺傳修飾以便阻斷天然調(diào)節(jié)并已經(jīng)增加了所述基因的表達(dá)。然而,所述基因構(gòu)建體還可以具有一種較為簡單的結(jié)構(gòu),即在序列SEQ ID No.1和/或SEQ ID No.3前沒有插入另外的調(diào)節(jié)信號,且具有這種調(diào)節(jié)的天然啟動子沒有缺失。而可以由生物素不再進(jìn)行任何調(diào)節(jié)這樣一種方式使天然調(diào)節(jié)序列突變,且基因的表達(dá)得到了增加。也可能在DNA序列的3’端插入另外有利的調(diào)節(jié)元件。具有序列SEQ ID No.1和/或SEQ ID No.3的生物素基因可以以一個或多個拷貝存在于所述基因構(gòu)建體中。
例如,用于新方法的有利的調(diào)節(jié)序列存在于諸如cos、tac、trp、tet、trp-tet、lpp、lac、lpp-lac、lacIq-、T7、T5、T3、gal、trc、ara、SP6、λ-PR或λ-PL啟動子這樣的啟動子中,有利的是它們用于革蘭氏陰性菌中。例如另外有利的調(diào)節(jié)序列存在于革蘭氏陽性啟動子amy和SPO2、酵母啟動子ADC1、MFα、AC、P-60、CYC1、GAPDH或植物啟動子CaMV/35S、SSU、OCS、lib4、usp、STLS1、B33、nos或遍在蛋白或菜豆蛋白啟動子中。
原則上可能將具有與如上所述類似的其調(diào)節(jié)序列的所有天然啟動子用于新方法。此外,使用合成的啟動子是可能和有利的。
基因構(gòu)建體可以以一個或多個拷貝含有另外的生物素基因,這些基因選自下列基因組成的組bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY或bioR,它們中的每一種均可以帶有其自身的啟動子,否則,它們中的每一種均可以處于序列SEQ ID No.1或SEQ ID No.3的啟動子的控制下。
為了在上述宿主生物體中表達(dá),將基因構(gòu)建體有利地插入一種宿主特異性載體中,該載體使得所述基因在宿主中的最佳表達(dá)成為可能。在大腸桿菌中的合適載體的實例是pLG338、pACYC184、pBR322、pUC18、pUC19、pKC30、pRep4、pHS1、pHS2、pPLc236、pMBL24、pLG200、pUR290、pIN-III113-B1、λgtll或pBdCI;在鏈霉菌屬中的合適載體的實例是pIJ101、pIJ364、pIJ702或pIJ361;在芽孢桿菌屬中合適的載體的實例是pUB110、pC194或pBD214;在棒狀桿菌屬中合適的載體的實例是pSA77或pAJ667;在真菌中合適的載體的實例是pALS1、pIL2或pBB116;在酵母中合適的載體的實例是YEp6、YEp13或pEMBLYe23;或者在植物中合適的載體的實例是pLGV23、pGHlac+、pBIN19、pAK2004或pDH51。所說的載體代表選自可能載體中的一小部分。另外的載體對于本領(lǐng)域技術(shù)人員來說是眾所周知的且例如可以在《克隆載體》(Cloning Vectors)(Pouwels P.H.等編輯,Elsevier,阿姆斯特丹-紐約-牛津1985,ISBN 0444 904018)一書中找到。
表達(dá)系統(tǒng)指的是上述通過實例所述的宿主生物體與適于生物體的載體(諸如質(zhì)粒、病毒或噬菌體,諸如T7 RNA聚合酶/啟動子系統(tǒng)或具有針對噬菌體λ的調(diào)節(jié)序列的載體)的結(jié)合體。
術(shù)語表達(dá)系統(tǒng)優(yōu)選指的是大腸桿菌及其質(zhì)粒和噬菌體和相關(guān)啟動子的結(jié)合體以及芽孢桿菌屬及其質(zhì)粒和啟動子的結(jié)合體。
另外適于SEQ ID No.1和SEQ ID No.3的有利的新型表達(dá)的是其它3’和/或5’末端的調(diào)節(jié)序列。
將這些調(diào)節(jié)序列用來使得生物素基因的特異性表達(dá)和蛋白質(zhì)的表達(dá)成為可能。例如,這可能意味著隨著宿主生物體的不同僅在誘導(dǎo)后將基因進(jìn)行表達(dá)或超表達(dá)或者迅速將基因進(jìn)行表達(dá)和/或超表達(dá)。
此外,調(diào)節(jié)序列和因子可以優(yōu)選對生物素基因的表達(dá)有有利的作用且由此增加生物素基因的表達(dá)。因此,通過使用強(qiáng)轉(zhuǎn)錄信號(諸如啟動子和/或“增強(qiáng)子”)而能夠并有利地促進(jìn)調(diào)節(jié)元件的轉(zhuǎn)錄水平。不過,除此之外,還能夠通過例如改進(jìn)mRNA的穩(wěn)定性而促進(jìn)翻譯。
“增強(qiáng)子”指的是例如通過RNA聚合酶與DNA之間改進(jìn)的相互作用而顯示出的生物素基因表達(dá)增加的DNA序列。
例如,通過與原始酶進(jìn)行比較、通過經(jīng)由經(jīng)典的誘變(諸如UV照射或用化學(xué)誘變劑處理)和/或經(jīng)由特異性誘變(諸如定點誘變、缺失、插入和/或置換)修飾相應(yīng)的基因序列或其同源序列,可以達(dá)到來源于序列SEQ ID No.1或SEQ ID No.3的蛋白質(zhì)及其酶活性的增加。除所述的基因擴(kuò)增外,通過消除阻抑酶生物合成的因子和/或通過合成活性的而不是非活性的酶也可以實現(xiàn)酶活性的增強(qiáng)。
所述的新方法通過經(jīng)載體已被克隆入生物體和/或克隆入染色體的具有序列SEQ ID No.1或SEQ ID No.3的生物素基因而有利于增加DTB轉(zhuǎn)化成生物素并由此整體上增加了生物素的產(chǎn)量。
在所述的新方法中,將包括SEQ ID No.1和/或SEQ ID No.3的微生物在一種可以使這些生物體生長的培養(yǎng)基中培養(yǎng)。該培養(yǎng)基可以是一種合成的或一種天然的培養(yǎng)基。使用對于本領(lǐng)域技術(shù)人員來說是公知的并取決于所述生物體的培養(yǎng)基。用于使微生物生長的培養(yǎng)基包括碳源、氮源、無機(jī)鹽和(如果合適)小量的維生素和微量元素。
有利的碳源的實例是糖類,諸如單糖、二糖或多糖,諸如葡萄糖、果糖、甘露糖、木糖、半乳糖、核糖、山梨糖、核酮糖、乳糖、麥芽糖、蔗糖、棉子糖、淀粉或纖維素;復(fù)合來源的糖類,諸如糖蜜;磷酸糖類,諸如果糖-1,6-二磷酸;糖醇類,諸如甘露糖醇;多元醇,諸如甘油;醇類,諸如甲醇或乙醇;羧酸類,諸如檸檬酸、乳酸或乙酸;脂肪類,諸如大豆油或菜子油;氨基酸類,諸如谷氨酸或天冬氨酸;或氨基糖類,也可將它們用作氮源。
有利的氮源是有機(jī)或無機(jī)氮化合物或含有這些化合物的物質(zhì)。它們的實例是銨鹽,諸如NH4Cl或(NH4)2SO4、硝酸鹽、脲;或復(fù)合的氮源,諸如玉米漿、釀造酵母自溶物、大豆粉、面筋、酵母提取物、肉膏、酪蛋白水解物、酵母或馬鈴薯蛋白,它們通常也可起到氮源的作用。
無機(jī)鹽的實例是鈣鹽、鎂鹽、鈉鹽、錳鹽、鉀鹽、鋅鹽、銅鹽和鐵鹽。應(yīng)特別提及的這些鹽中的陰離子是氯離子、硫酸根離子和磷酸根離子。在新方法中增加產(chǎn)量的重要因素是向生產(chǎn)培養(yǎng)基中添加Fe2+或Fe3+鹽和/或鉀鹽。
如果合適,向營養(yǎng)培養(yǎng)基中添加其它的生長因子,諸如維生素類或生長促進(jìn)劑類,諸如核黃素、硫胺素、葉酸、煙酸、泛酸鹽或吡哆醇;氨基酸類,諸如丙氨酸、半胱氨酸、天冬酰胺、天冬氨酸、谷氨酰胺、絲氨酸、甲硫氨酸或賴氨酸;羧酸類,諸如檸檬酸、甲酸、庚二酸或乳酸;或者諸如二硫蘇糖醇這樣的物質(zhì)。
如果合適,能夠向培養(yǎng)基中添加抗生素以使細(xì)胞內(nèi)具有生物素基因的載體保持穩(wěn)定。
所說營養(yǎng)物的混合比例取決于發(fā)酵的方式并根據(jù)各種情況來確定??赡艿那闆r是在發(fā)酵開始時存在已被分別滅菌或一起滅菌(如果必要)后的所有培養(yǎng)基成分,否則,根據(jù)需要在發(fā)酵過程中添加它們。
確定培養(yǎng)條件以便生物體以最佳方式生長并獲得最佳的可能的產(chǎn)量。優(yōu)選的培養(yǎng)溫度為15℃-40℃。
溫度在25℃-37℃是特別有利的。優(yōu)選將pH保持在3-9的范圍。pH在5-8之間是特別有利的。一般足夠的培養(yǎng)時間為8-240小時,優(yōu)選8-120小時。在此期間,在所述培養(yǎng)基中累積了最大量的生物素和/或在細(xì)胞破裂后可以得到它們。
可以連續(xù)或分批實施制備生物素的新方法。如果完整的植物從用生物素基因轉(zhuǎn)化的植物細(xì)胞中再生,那么可以根據(jù)所述的新方法使這些植物完全正常地生長和繁殖。
實施例除BioB和其它公知的輔因子外,基于DTB轉(zhuǎn)化成生物素的過程可能涉及一種Fe-S簇再生酶的考慮,已經(jīng)做了鑒定并克隆這樣一種假擬基因的嘗試。
Nifs基因能夠使涉及氮固定的蛋白質(zhì)Fe-S簇中的硫原子再生(Zheng等《美國國家科學(xué)院學(xué)報》(Proc.Natl.Acad.Sci.USA)90,19932754-2758和《生物化學(xué)》(Biochemistry)33,19944714-4720)。按照megalign模式,通過使用Lasergene程序包(DNA-Star Inc.)比較Swiss-Prot和PIR數(shù)據(jù)庫中所有公知的Nifs類蛋白質(zhì),可能鑒定出具有氨基酸序列HK(I,L)xGPxG(x相當(dāng)于保守性較低或沒有得到保持的氨基酸)的那些蛋白質(zhì)的嚴(yán)格保守區(qū)。這種序列具有完整的保守性這一事實表明這些氨基酸(=Aa)在這些蛋白質(zhì)的功能性上是重要的。將這些保守的氨基酸在下文稱作基元I。
將這種方式中所述的Aa基元用作進(jìn)一步分析Swiss-Prot/PIR93或94版數(shù)據(jù)庫的比較序列,以便檢索出其中這種Nifs功能序列是完全保守的蛋白質(zhì)或ORFS(=可讀框)。用于序列分析的程序是來自DNA-Star包的Geneman程序。將分析參數(shù)規(guī)定如下共有序列菜單中含有80%保守性的基元。
除已被鑒定為Nifs同源蛋白的蛋白質(zhì)外,這種檢索導(dǎo)致這樣一項發(fā)現(xiàn),即存在具有這種序列基元的其它蛋白質(zhì)或ORFS。在數(shù)據(jù)庫中存在的其它序列中,可能鑒定出一種來自大腸桿菌的可讀框,所述的可讀框具有共有序列的顯著保守性并參與生物素的合成(這正如的我們的研究表明的)。稱作ECU29581_24(=SEQ ID No.1=ORF401)的這種可讀框編碼一種來源于這種序列的401Aa的假擬蛋白。F.Blattner及合作者(《DNA-研究》1996)的研究顯示出該序列已作為大腸桿菌基因組測序的一部分進(jìn)行了測序而尚未識別其功能。將該序列(SEQ ID No.1)在下文稱作BioS1。
BioS1的蛋白質(zhì)序列與來自棕色固氮桿菌的Nifs蛋白質(zhì)序列的比較結(jié)果(程序DNA-Star“megalign”模式配對Lipman-Pearson校正,分析參數(shù)k-元組2,缺口補償4,缺口長度補償12)證實ECU29581_24還與在218 Aa范圍內(nèi)所述序列其它區(qū)中的來自棕色固氮桿菌的Nifs具有27.6%的同源性。與鑒定為來自莢膜紅球菌Nifs的蛋白質(zhì)具有的同源性在376 Aa的范圍內(nèi)為25.3%。
可能在SwissProt/PIR數(shù)據(jù)庫中鑒別出與ECU29581_24具有同源性的另外的序列(Geneman程序/序列相似性模式;默認(rèn)設(shè)置)。對ECU29581_24序列發(fā)現(xiàn)的最大相似性由從流感嗜血桿菌(數(shù)據(jù)庫中的名稱為HIU00082_62)翻譯的ORF(=可讀框)來證實。發(fā)現(xiàn)在兩種蛋白質(zhì)的全長內(nèi)BioS1與HIU00082_62具有45.5%的序列同源性。由此所述兩種蛋白質(zhì)的序列相似性或同源性均顯著高于ECU29581_24(=BioSI)與來自莢膜紅球菌或棕色固氮桿菌的Nifs間的相似性或同源性。因此,所述蛋白質(zhì)可能是BioS1的流感嗜血桿菌同系物。
Fleischmann等(《科學(xué)》(Science),269,1995495-512)在流感嗜血桿菌中以其與Nifs序列的相似性為基礎(chǔ)不僅發(fā)現(xiàn)了ORFHIU00082_62、而且發(fā)現(xiàn)了另一種ORF(HIU00072_10)。
以Fleischmann等的這種描述為基礎(chǔ)得出結(jié)論除bioS1外,另一種Nifs類基因也存在于大腸桿菌中。已將這種假擬基因稱作bioS2。
1.載體pHS1和pHS2的構(gòu)建質(zhì)粒pHS1和pHS2由攜帶復(fù)制起點、抗性彈夾、啟動子、克隆位點和終止子的各種彈夾組成。該質(zhì)粒由各種DNA片段組裝。使用各種質(zhì)粒作為模板、通過PCR來制備為此所需的所述DNA片段。
a.)使用復(fù)制起點制備所述彈夾為了從含P15A復(fù)制子的質(zhì)粒中提供復(fù)制起點作為可以克隆的彈夾,使用質(zhì)粒pRep4(Quiagen)與寡核苷酸P15A,1(5’-GGCCCCTAGGGGATATATTCCGCTTCCTCGC-3’)和P15A,2(5’-GGCCACTAGTAACAACTTATATCGTATGGGG-3’)、通過PCR從所述質(zhì)粒中分離出具有919個堿基長度的DNA片段。在一種合適的緩沖液中用限制酶AvrII和SpeI切下所述片段。
PCR條件在100μl溶液中使用2.5U的Taq聚合酶和15pmol的寡核苷酸來從質(zhì)粒pRep4中分離復(fù)制彈夾。在50℃下使寡核苷酸退火。鏈延伸在72℃下進(jìn)行1分鐘、30個循環(huán)以上。
b.)卡那霉素抗性彈夾的制備為了提供一種卡那霉素抗性彈夾作為克隆彈夾,從含有卡那霉素抗性彈夾的質(zhì)粒(pRep4,Quiagen)中、用寡核苷酸Kan-R,1(5’-GGCCGAGCTCTCGAACCCCAGAGTCCCGCT-3’)和Kan-R,2(5’-GGCCGACGTCGGAATTGCCAGCTGGGGCGC-3’)通過PCR來分離具有952個堿基長度的DNA片段。在一種合適的緩沖液中用AatII和SacI切割所述片段。
PCR條件在100μl溶液中使用2.5U的Taq聚合酶和15pmol的寡核苷酸來從質(zhì)粒pRep4中分離卡那霉素抗性彈夾。在50℃下使寡核苷酸退火。鏈延伸在72℃下進(jìn)行1分鐘、30個循環(huán)以上。
c.)終止區(qū)的制備*為了從噬菌體λ提供終止子T0作為克隆彈夾,使用質(zhì)粒pDS12-luzi(Schroder H.等《歐洲分子生物學(xué)組織雜志》(EMBOJournal.)12,11,19934137-4144)作為模板與寡核苷酸T0,1(5’-GGCCGAGCTCGCTTGGACTCCTGTTGATAG-3’)和T0,2(5’-GGCCACTAGTGCTTGGATTCTCACCAATAAAAAACGCCC-3’)一起通過PCR來分離具有120個堿基長度的DNA片段。在一種合適的緩沖液中用酶SpeI和SacI切割所述片段。
針對T0pDS12-luzi的模板在100μl溶液中使用2.5U的Taq聚合酶和15pmol的寡核苷酸來從質(zhì)粒pDS12-luzi中分離終止區(qū)。在50℃下使寡核苷酸退火。鏈延伸在72℃下進(jìn)行0.5分鐘、30個循環(huán)以上。然后將120bp大小的片段進(jìn)行分離和純化。用SpeI和SacI各20U來消化該片段。
為了從rrnB操縱子中提供終止子T1作為克隆彈夾,使用質(zhì)粒pDS12-luzi(Schroder H.等,參見上述文獻(xiàn))作為模板并借助于寡核苷酸T1,1(5’-GGCCCCTAGGTCTAGGGCGGCGGATTTGTCC-3’)和T1,2(5’-GGCCTCTAGAGGCATCAAATAAAACGAAAGGC-3’)通過PCR來分離具有120bp長度的DNA片段。在一種合適的緩沖液中用酶XbaI和AvrII切割所述片段。
針對T1pDS12-luzi的模板在100μl溶液中使用2.5U的Taq聚合酶和15pmol的寡核苷酸來從質(zhì)粒pDS12-luzi中分離終止區(qū)。在50℃下使寡核苷酸退火。鏈延伸在72℃下進(jìn)行0.5分鐘、30個循環(huán)以上。然后將120bp大小的片段進(jìn)行分離和純化。用XbaI和AvrII各20U來消化該片段。
d.)針對pHS1和pHS2的啟動子的制備
通過化學(xué)合成來制備寡核苷酸PPHS1,1(5’-TCGAGATAGCATTTTTATCCATAAGATTAGCCGATCCTAAGGTTTACAATTGTGAGCGCTCACAATTATGATAGATTCAATTGTGAGCGGATAACAATTTCACACACGCTAGCGGTAC-3’)和PPHS1,2(5’-CGCTAGCGTGTGTGAAATTGTTATCCGCTCACAATTGAATCTATCATAATTGTGAGCGCTCACAATTGTAAACCTTAGGATCGGCTAATCTTATGGATAAAAATGCTATC-3’)以及PPHS2,1(5’-AATTCTCCCTATCAGTGATAGAGATTGACATCCCTATCAGTGATAGAGATACTGAGACATCACCAGGACGCACTGACCG-3’)和PPHS 2,2(5’-AATTCGGTCAGTGCGTCCTGGTGATGTCTCAGTATCTCTATCACTGATAGGGATGTCAATCTCTATCACTGATAGGGAGG-3’)。分別以1μg/μl的濃度混合寡核苷酸PPHS1,1和PPHS1,2以及PPHS2,1和PPHS2,2、將它們在95℃下培養(yǎng)5分鐘且然后緩慢冷卻。在連接中使用的退火的寡核苷酸濃度為10ng/μl。寡核苷酸PPHS1,1和PPHS1,2形成針對質(zhì)粒pHS1的啟動子,而寡核苷酸PPHS2,1和PPHS2,2形成針對質(zhì)粒pHS2的啟動子。
e.)克隆位點的制備為了構(gòu)建克隆位點,合成兩種寡核苷酸PMCS1,1(5’-GTACCGGGCCCCCCCTCGAGGTCGACGGTATCGATAAGCTTGATATCGAATTCCTGCAGCCCGGGGGATCCCATGGTA-3’)和PMCS1,2(5’-ACGCGTACCATGGGATCCCCCGGGCTGCAGGAATTCGATATCAAGCTTATCGATACCGTCGACCTCGAGGGGGGGCCCGGTACC-3’)。以1μg/μl的濃度混合所述的兩種寡核苷酸、將它們在95℃下培養(yǎng)5分鐘且然后緩慢冷卻。在連接中使用的退火的寡核苷酸濃度為10ng/μl。
f.)用于克隆pHS1和pHS2的過程從pDS12 luci開始,通過SacI/AatII消化而將所述質(zhì)粒的ampR彈夾切下并用相應(yīng)的含有卡那霉素抗性彈夾的SacI/AatII片段來取代。使轉(zhuǎn)化和分離陽性克隆后獲得的載體進(jìn)行SpeI/SacI消化并將PCR擴(kuò)增的終止子T0插入作為卡那霉素抗性彈夾下游的SpeI/SacI片段。用XbaI/AvrII消化轉(zhuǎn)化和分離陽性克隆后獲得的載體并將PCR擴(kuò)增的終止子T1插入作為XbaI/AvrII片段。將所得載體用XhoI/EcoRI消化并分別與退火的啟動子寡核苷酸(PPHS1,1和PPHS1,2以及PPHS2,1和PPHS2,2)連接。使所得的載體進(jìn)行XbaI消化并使用克列諾片段補平,在KpnI消化后分離出不含luziferase片段的載體帶。將兩種另外退火的含有所述克隆位點的寡核苷酸(PMCS1,1PMCS1,2)與用這種方式消化的所述載體連接。
2.bioS1(ECU29851_24,SEQ ID No.1)的克隆在提供優(yōu)化過的翻譯信號的條件下,通過PCR、從大腸桿菌染色體中擴(kuò)增編碼BioS1的基因并將其克隆入使得所述基因在大腸桿菌菌株中的超表達(dá)成為可能的載體中。
a.)用于從大腸桿菌染色體中擴(kuò)增bioS1基因的寡核苷酸的研制將BioS1擴(kuò)增為一種表達(dá)彈夾,該彈夾由核糖體結(jié)合位點、編碼序列的起始密碼子和用于限制酶的兩種識別位點間的終止密碼子組成。對兩種限制切割位點選擇MluI的識別序列。借助于寡核苷酸PbioS1,1(5’-CGCACGCGTGAGGAGTACCATGAACGT-3’)和PbioS1,2(5’-CGCACGCGTTTAATCCACCAATAATT-3’)來克隆bioS1基因。
PCR過程條件將0.5μg來自大腸桿菌W3110的染色體DNA用作模板。所使用的寡核苷酸PbioS1,1和PbioS1,2的濃度各自為15pM。dNTPs的濃度為200μM。將溶于制造商提供的反應(yīng)緩沖液的2.5U的Pwo DNA聚合酶(Boehringer Mannheim)用作聚合酶。用于PCR的體積為100μl。
擴(kuò)增條件使DNA在94℃下變性2分鐘。然后在55℃下使寡核苷酸退火30秒。鏈延伸在72℃下進(jìn)行45秒。將所述的PCR進(jìn)行30個循環(huán)以上。
將具有1200bp大小的所得DNA產(chǎn)物純化并在一種合適的緩沖液中通過MluI來消化。
通過MluI消化5μg的載體pHS1并通過shrimp堿性磷酸酶(SAP)(Boehringer Mannheim)使其去磷酸化。在使SAP變性后,通過快速DNA連接試劑盒、按照制造商的說明以1∶3的摩爾比將所述載體與片段進(jìn)行連接。將連接混合物轉(zhuǎn)入菌株大腸桿菌XLl-blue中。通過質(zhì)粒的制備和限制酶切分析來鑒定陽性克隆。通過限制酶切消化和測序來確定pHS1中bioS1片段的正確取向。將所得構(gòu)建體稱作pHS1 bioS1(附

圖1)。pHS1 bioS1的序列是在SEQ ID No.5中被發(fā)現(xiàn)的。載體中衍生的bioS1的氨基酸序列是在SEQ ID No.6中被發(fā)現(xiàn)的。用MluI消化2μg的載體pHS1 bioS1并通過瓊脂糖凝膠分離基因bioS1。用MluI消化載體pHS2、用SAP使其去磷酸化并以接合連接方式與片段bioS1連接。將所述的連接混合物轉(zhuǎn)入XLl-blue,并通過質(zhì)粒分離和限制酶切消化來鑒定以正確取向的陽性克隆。將所得載體稱作pHS2 bioS1(附圖2)。PHS2 bioS1的序列是在SEQ ID No.9中被發(fā)現(xiàn)的。載體中衍生的bioS1的氨基酸序列是在SEQ ID No.10中被發(fā)現(xiàn)的。
3.bioS2(SEQ ID No.3)的克隆克隆入編碼涉及Fe-S簇裝配的基因產(chǎn)物的大腸桿菌另外的基因的方式如下和與來自棕色固氮桿菌的NifS蛋白質(zhì)高度同源(>40%)的SwissProt/PIR數(shù)據(jù)庫中蛋白質(zhì)的Aa序列進(jìn)行的序列比較(Megalign程序,群體模式)證實除上述的序列基元I外,這些蛋白質(zhì)的N末端也表現(xiàn)出顯著的保守性。將Aa序列MIYLDNXATT鑒定為典型的Nifs族蛋白質(zhì)N末端的保守序列并稱作基元IIa。
SwissProt/PIR數(shù)據(jù)庫對高于80%保守性的該序列的分析證實了公知該蛋白質(zhì)N末端序列中大腸桿菌11Aa內(nèi)的另一種蛋白質(zhì)來源于Edman降解(數(shù)據(jù)庫中的名稱UP06_Ecoli)。將這種蛋白質(zhì)看作假擬Nifs的同系物并在下文稱作BioS2(與BioS1相似)。
對蛋白質(zhì)BioS2的基因克隆和測序的方式如下。從蛋白質(zhì)序列HIU00072_10開始,一方面將保守的氨基酸基元I、而另一方面將上述UP06_Ecoli的Aa序列用于制備能夠擴(kuò)增bioS2基因片段的簡并的寡核苷酸。為達(dá)到這一目的,將兩種Aa基元HIU00072_10(基元I)和UP06_Ecoli(基元IIb,MKLPIYLDYSAT)反向翻譯成相應(yīng)的DNA序列。通過這種方式,從基元II合成簡并寡核苷酸PbioS2,1(5’-ATGAARYTNCCNATHTAYYTNGAYTAYWSNGCNAC-3’),并從基元I合成簡并寡核苷酸PbioS2,2(5’-cccaghggrccrtgcagyttrtgrccrga-3’)。
PCR過程將來自大腸桿菌W3110的染色體DNA作為模板。使寡核苷酸PbioS2,1和PbioS2,2各0.5μg在各自情況下與15pmol的核苷酸混合物、2.5U溶于制造商提供的反應(yīng)緩沖液的Pwo DNA聚合酶(Boehringer Mannheim)反應(yīng)。用于PCR的體積為100μl。
擴(kuò)增條件變性過程在94℃下進(jìn)行2分鐘。在45℃下進(jìn)行所述寡核苷酸的退火并在72℃下使鏈延伸進(jìn)行45秒。使PCR進(jìn)行30個循環(huán)以上。通過PCR可能選擇性地擴(kuò)增三種片段,其中之一具有來自序列比較所預(yù)期的600bp的大小。通過瓊脂糖凝膠純化來分離這種DNA片段并使用寡核苷酸PbioS2,2對其進(jìn)行測序。在所有六種可能的讀框內(nèi)翻譯所得的DNA序列。然后將所得翻譯的Aa序列與翻譯的HIU00072_10的Aa序列和來自棕色固氮桿菌的Nifs進(jìn)行比較。翻譯的讀框之一顯示出與所述ORF HIU00072_10的Aa序列的高度同源性并稱作bioS2。
測定并克隆bioS2完整的DNA序列(=SEQ ID No.3)的方式如下首先,制備與bioS2同源的標(biāo)記的DNA探針。該步驟使用PCR-DIG標(biāo)記試劑盒(Boehringer Mannheim)來進(jìn)行。用于制備DIG-DNA探針的模板是由寡核苷酸PbioS2,1和PbioS2,2制備的所述PCR產(chǎn)物。
PCR的條件是所用物質(zhì)如下1μl的PCR模板,5μl的核苷酸DIG-dUTP混合物,寡核苷酸PbioS2,1和PbioS2,2各15pmol,來自含有1.75mMMgCl2的試劑盒的緩沖液,0.75μl的擴(kuò)展聚合酶混合物(BoehringerMannheim)。
擴(kuò)增條件DNA在94℃下解鏈2分鐘;DNA在94℃下解鏈10秒;在45℃下退火30秒;在68℃下鏈延伸3.30分鐘、持續(xù)10個循環(huán)以上;DNA在94℃下解鏈10秒;在45℃下退火30秒;在68℃下鏈延伸3.30分鐘;每個循環(huán)鏈延伸延長20秒、持續(xù)20個循環(huán)以上。用PCR純化試劑盒來純化所述DIG-標(biāo)記的片段。
4.用染色體DNA進(jìn)行的bioS2的Southern分析在進(jìn)一步的步驟中,用限制酶消化基因組DNA并使用標(biāo)記的DNA探針、通過Southern雜交來對其進(jìn)行分析。
用下列限制酶來完全消化大腸桿菌W3110染色體DNA(10μg)EcoRI、BamHI、Acc65I、HindIII、SalI。所述混合物的體積為50μl,且每一種酶的用量為30U。將所述的混合物培養(yǎng)4小時。通過TBE緩沖液中1%的瓊脂糖凝膠來對以該方式消化的DNA進(jìn)行分級分離(Sambrook,J.Fritsch,E F.Maniatis,T.第二版,冷泉港實驗室出版社,1989,ISBN0-87969-373-8)并借助于一種壓力轉(zhuǎn)化室(Stratagene)將其轉(zhuǎn)移到一種尼龍膜上(Boehringer Mannheim)且通過UV照射(Stratalinker Stratagene)以共價鍵的方式固定在該膜上。與DIG-標(biāo)記的DNA探針的雜交在65℃下、DIG Easyhyb緩沖液(Boehringer Mannheim)中進(jìn)行15小時。按照制造商提供的說明印跡的顯影表明BioS2 DIG-DNA探針與條帶進(jìn)行了雜交,在Acc65I、EcoRI和HindIII的情況下測定所述條帶大小約為3-4kb。BamHI消化的DNA證明了與帶有相當(dāng)高分子量的片段的bioS2探針雜交的過程。優(yōu)選將3-4kb的片段用于進(jìn)一步的克隆步驟。
通過反向PCR克隆bioS2在用EcoRI消化的情況中,鑒定了隱藏著被尋找基因的約4kb的片段。然后通過反向PCR技術(shù)擴(kuò)增并克隆完整的基因。在反向PCR的第一個步驟中,用EcoRI完全消化大腸桿菌染色體DNA。在第二個步驟中,在從統(tǒng)計學(xué)的觀點來看存在分子內(nèi)鍵的條件下,然后從前述的限制酶切消化中,將EcoRI消化的DNA通過連接酶以共價鍵的方式在低DNA濃度(約20ng/ml)下連接。在第三個步驟中,使用寡核苷酸進(jìn)行PCR,所述的寡核苷酸的序列對所尋找的靶基因具有特異性。
可以將特異性擴(kuò)增的DNA片段以其大小為基礎(chǔ)進(jìn)行鑒定,所述的DNA片段的大小從來自Southern分析的限制片段的大小和來自所述基因公知部分中寡核苷酸的定位來顯示。然后將以這種方式鑒定的片段克隆入一種諸如pBS SK Bluescript/pCR Script(Stratagene)這樣的合適載體中并對其進(jìn)行測序。
實驗步驟用15U、50μl體積的EcoRI(Boehringer Mannheim)將來自菌株W3110的1μg染色體DNA完全消化。通過將30μl裝上瓊脂糖凝膠來檢測消化的完全性。在15℃下,將100μl體積的來自這種染色體DNA消化的片段(10μl的消化物=200ng)與10μl的連接緩沖液和2U的T4連接酶(Boehringer Mannheim)一起溫育15小時(分子內(nèi)連接反應(yīng))。在該連接反應(yīng)后,通過在65℃下溫育20分鐘來使T4連接酶失活。將5μl的這種連接混合物用作PCR的模板。從bioS2的序列開始合成引物PbioS2,3(5’-GCGTGGGTAAACTGCCTATCGACCTGAGCC-3’)和PbioS2,4(5’-CTACGCTTC CTTCAGCCTGCCAGCCGAAA-3’)。
使寡核苷酸PbioS2,3在bioS2的5’端上雜交并導(dǎo)致在3’方向上在互補鏈的5’端上進(jìn)行編碼序列的擴(kuò)增延伸。
使寡核苷酸PbioS2,4在bioS2的3’端上雜交并導(dǎo)致在3’方向上在編碼鏈的3’端上進(jìn)行編碼序列的擴(kuò)增延伸。
所用的物質(zhì)如下5μl的連接混合物,1.75μl的脫氧核苷酸混合物(350μmol,Boehringer Mannheim),寡核苷酸PbioS2,5和PbioS2,6各15pmol,來自含有1.75mM MgCl2的試劑盒的緩沖液1,0.75μl的擴(kuò)展聚合酶混合物。
用引物PbioS2,3/PbioS2,4擴(kuò)增連接的大腸桿菌DNA的條件。擴(kuò)展試劑盒(Boehringer Mannheim),DNA在94℃下解鏈2分鐘;DNA在94℃下解鏈10秒;在61℃下退火30秒;在68℃下鏈延伸3.30分鐘、持續(xù)10個循環(huán)以上;DNA在94℃下解鏈10秒;在61℃下退火30秒;在68℃下鏈延伸3.30分鐘;每個循環(huán)鏈延伸伸長20秒、持續(xù)20個循環(huán)以上。
所述的擴(kuò)增產(chǎn)生約3kb的PCR產(chǎn)物。這種DNA片段證明了在嚴(yán)格條件下與上述bioS2-DIG-DNA探針的Southern雜交是顯著的。
設(shè)想這種DNA片段含有與bioS2高度同源的DNA序列。由此將這種DNA片段克隆入一種載體以便進(jìn)一步對其進(jìn)行特征鑒定并對其測序。使用pCR Script試劑盒(Stratagene),首先將所述的DNA片段按照制造商提供的說明用Pfu聚合酶進(jìn)行處理,然后將其連入載體pCR Script。將該連接混合物轉(zhuǎn)入XL1-blue細(xì)胞(Stratagene)并鋪在LB-Amp上。通過小量制備分析來鑒定隱藏片段的陽性克隆。測序結(jié)果顯示出如SEQ ID No.3(=bioS2)所述的完整的序列。
然后將BioS2作為類似于bioS1的表達(dá)彈夾來擴(kuò)增并克隆。為了達(dá)到這一目的,通過使用寡核苷酸PbioS2,5(5’-CATGACGCGTAAAGAGGAGAAATTAACTATGAAATTACCGATTTATTTGG-3’)和PbioS2,6(5’-GCGACGCGTGATTAATGATGAGCCCAT-3’)的PCR而將MluI識別位點和最優(yōu)化的SD序列添加到所述基因的5’端上并將MluI識別位點添加到所述基因的3’端上。
PCR過程將來自W3110的0.5μg染色體DNA用作模板。所用的寡核苷酸PbioS2,5和PbioS2,6的濃度各為15pM。dNTPS的濃度為200μM。在制造商提供的反應(yīng)緩沖液中將2.5U的Pwo DNA聚合酶(Boehringer Mannheim)用作聚合酶。用于PCR的體積為100μl。
擴(kuò)增條件變性過程在94℃下進(jìn)行2秒。寡核苷酸在55℃下退火30秒,鏈延伸在72℃下進(jìn)行45秒。使PCR進(jìn)行30個循環(huán)以上。
用PCR純化試劑盒(Boehringer Mannheim)來純化所得具有約1200bp正確大小的DNA產(chǎn)物并用溶于合適緩沖液的MluI對其進(jìn)行消化。
通過MluI消化5μg的載體pHS2并通過shrimp堿性磷酸酶(SAP)(Boehringer Mannheim)使其去磷酸化。在使SAP變性后,通過快速DNA連接試劑盒、按照制造商的說明以1∶3的摩爾比將所述載體與片段進(jìn)行連接。將該連接混合物轉(zhuǎn)入菌株XL1-blue中。通過質(zhì)粒的制備和限制酶切分析來鑒定陽性克隆。通過限制酶切消化和測序來確定pHS2中bioS2片段的正確取向。將所述載體稱作pHS2bioS2(附圖3)。pHS2 bioS2的序列是在SEQ ID No.11中被發(fā)現(xiàn)的。載體中衍生的bioS2的氨基酸序列是在SEQ ID No.12中被發(fā)現(xiàn)的。以一種類似的方式將bioS2克隆入載體pHS1。 pHS1 bioS2的序列是在SEQ ID No.7中被發(fā)現(xiàn)的(附圖4)。載體中衍生的bioS2的氨基酸序列是在SEQ ID No.8中被發(fā)現(xiàn)的。
5.質(zhì)粒pHBbio14的構(gòu)建用一種轉(zhuǎn)導(dǎo)λ噬菌體在體內(nèi)克隆Bio操縱子。通過將大腸桿菌bio-陰性菌株轉(zhuǎn)導(dǎo)成bio+來篩選λbio+噬菌體。繁殖所分離的bio+轉(zhuǎn)導(dǎo)λ噬菌體并純化λDNA。隨后從λ噬菌體DNA中切下具有完整生物素操縱子的8.7kb EcoRI/HindIII片段并將所述片段連入已用EcoRI/HindIII切割的pBR322。通過質(zhì)粒的制備和限制酶切分析來鑒定陽性克隆。
1.2kb的bioD的3’片段的缺失使bioD基因3’端上的非必須基因序列缺失。為了達(dá)到這一目的,通過PCR將EcoRI切割位點引入bioD終止密碼子之后。根據(jù)Otsuka等所述的操縱子序列(《生物化學(xué)雜志》(J.Bio.Chem.)263,198819577-85)開發(fā)了用于該PCR的寡核苷酸Pbio1,1(5’-AATAAGGAATTCTTATGTACTTTCCGGTTGCCG-3’)和Pbio1,2(5’-AACAGCAGCCTGCAGCTGGATTA-3’)。
PCR的條件使2.5U Taq聚合酶(Perkin Elmer)與15pmol的每一種引物在100μl的體積中反應(yīng)。在50℃下進(jìn)行退火并使鏈延伸在72℃下進(jìn)行1分鐘、30個循環(huán)以上。分離488bp的片段并在瓊脂糖凝膠上純化。用EcoRI/PstI消化所得的片段。用EcoRI/PstI消化pHBbio1。分離得到9.5kb的片段。
將所述的9.5kb的片段連入488bp的片段并轉(zhuǎn)入XL1-blue細(xì)胞。通過質(zhì)粒的制備并通過使用酶EcoRI和HindIII對所述質(zhì)粒DNA的限制酶切分析來分析所得的克隆,并鑒定了隱藏5.9kb片段的陽性克隆。分離一種克隆并稱作pHBbio2。從該克隆中獲得質(zhì)粒DNA。用EcoRI/HindIII消化5μg的pHBbio2,并分離出含有完整生物素生物合成基因的5.9kb片段。
用EcoRI和HindIII消化5μg的質(zhì)粒pAT153。將所得的含有生物素生物合成基因的5.9kb片段與所消化的載體pAT153連接并轉(zhuǎn)入XL1-blue。通過質(zhì)粒的制備并通過使用酶EcoRI和HindIII對所述質(zhì)粒DNA的限制酶切分析來分析所得的克隆。鑒定陽性克隆,且分離一種克隆并稱作pHBbio14。
6.通過超表達(dá)bioS1增加生物素的產(chǎn)量通過使用已生長在隱藏recATn10的菌株上的P1裂解物的P1轉(zhuǎn)導(dǎo)而將菌株BM4092(Barker和Campbell)轉(zhuǎn)導(dǎo)成recA-。通過陽性轉(zhuǎn)導(dǎo)體UV敏感性的增加來檢測轉(zhuǎn)導(dǎo)是否成功。然后用質(zhì)粒pHBbio14、通過CaCl2法來轉(zhuǎn)化所得菌株LU8091并在含氨芐青霉素100μg/ml的LB上進(jìn)行培養(yǎng)。分離一種克隆并各自用質(zhì)粒pHS1 bioS1和pHS2 bioS2、通過CaCl2法將其轉(zhuǎn)化并在含氨芐青霉素100μg/ml和卡那霉素25μg/ml的LB瓊脂上進(jìn)行篩選。
將各轉(zhuǎn)化體中的一個菌落接種入含有合適抗生素的DYT培養(yǎng)基中并培養(yǎng)12小時。取10ml放置過夜的培養(yǎng)物用于接種入含有合適抗生素的TB培養(yǎng)基(Sambrook,J.Fritsch,E F.Maniatis,T.第二版,冷泉港實驗室出版社,1989 ISBN0-87969-373-8)并培養(yǎng)24小時。生長完成后,通過離心從培養(yǎng)上清液中取出細(xì)胞并使用所述上清液中的鏈霉抗生物素蛋白和抗生物素蛋白、通過ELISA來測定生物素和去硫生物素的濃度。該測定結(jié)果可以在表I中找到。
表I生物素和去硫生物素濃度的測定結(jié)果<
>
序列表(1)一般信息(i)申請人(A)姓名BASF Aktiengesellschaft(B)街Carl BoSch Strasse(C)城市Ludwigshafen(D)州Rheinland-Pfalz(E)國家德國(F)郵政編碼D-67056(ii)發(fā)明名稱生物素的制備方法(iii)序列數(shù)12(iv)計算機(jī)可讀形式(A)媒體類型軟盤(B)計算機(jī)IBM PC兼容機(jī)(C)操作系統(tǒng)PC-DOS/MS-DOS(D)軟件PatentIn Release#1.0,版本#1.25(EPO)(2)SEQ ID NO1的信息(i)序列特征(A)長度1217個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假擬結(jié)構(gòu)無(iv)反義無(vi)原始來源(A)生物體大腸桿菌(B)菌株W3110(ix)特征(A)名稱/關(guān)鍵詞5’UTR(B)位置1..11
(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置12..1217(xi)序列描述SEQ ID NO1CGAGGAGTAC C ATG AAC GTT TTT AAT CCC GCG CAG TTT CGC GCC CAG TTT 50Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe1 5 10CCC GCA CTA CAG GAT GCG GGC GTC TAT CTC GAC AGC GCC GCG ACC GCG 98Pro Ala Leu Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala15 20 25CTT AAA CCT GAA GCC GTG GTT GAA GCC ACC CAA CAG TTT TAC AGT CTG 146Leu Lys Pro Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu30 35 40 45AGC GCC GGA AAC GTC CAT CGC AGC CAG TTT GCC GAA GCC CAA CGC CTG 194Ser Ala Gly Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu50 55 60ACC GCG CGT TAT GAA GCT GCA CGA GAG AAA GTG GCG CAA TTA CTG AAT 242Thr Ala Arg Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn65 70 75GCA CCG GAT GAT AAA ACT ATC GTC TGG ACG CGC GGC ACC ACT GAA TCC 290Ala Pro Asp Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser80 85 90ATC AAC ATG GTG GCA CAA TGC TAT GCG CGT CCG CGT CTG CAA CCG GGC 338Ile Asn Met Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly95 100 105GAT GAG ATT ATT GTC AGC GTG GCA GAA CAC CAC GCC AAC CTC GTC CCC 386Asp Glu Ile Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro110 115 120 125TGG CTG ATG GTC GCC CAA CAA ACT GGA GCC AAA GTG GTG AAA TTG CCG 434Trp Leu Met Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro130 135 140CTT AAT GCG CAG CGA CTG CCG GAT GTC GAT TTG TTG CCA GAA CTG ATT 482Leu Asn Ala Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile145 150 155ACT CCC CGT AGT CGG ATT CTG GCG TTG GGT CAG ATG TCG AAC GTT ACT 530Thr Pro Arg Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr160 165 170GGC GGT TGC CCG GAT CTG GCG CGA GCG ATT ACC TTT GCT CAT TCA GCC 578Gly Gly Cys Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala175 180 185GGG ATG GTG GTG ATG GTT GAT GGT GCT CAG GGG GCA GTG CAT TTC CCC 626Gly Met Val Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro190 195 200 205GCG GAT GTT CAG CAA CTG GAT ATT GAT TTC TAT GCT TTT TCA GGT CAC 674Ala Asp Val Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His210 215 220AAA CTG TAT GGC CCG ACA GGT ATC GGC GTG CTG TAT GGT AAA TCA GAA 722Lys Leu Tyr Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu225 230 235CTG CTG GAG GCG ATG TCG CCC TGG CTG GGC GGC GGC AAA ATG GTT CAC 770Leu Leu Glu Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His240 245 250GAA GTG AGT TTT GAC GGC TTC ACG ACT CAA TCT GCG CCG TGG AAA CTG 818Glu Val Ser Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu255 260 265GAA GCT GGA ACG CCA AAT GTC GCT GGT GTC ATA GGA TTA AGC GCG GCG 866Glu Ala Gly Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala270 275 280 285CTG GAA TGG CTG GCA GAT TAC GAT ATC AAC CAG GCC GAA AGC TGG AGC 914Leu Glu Trp Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser290 295 300CGT AGC TTA GCA ACG CTG GCG GAA GAT GCG CTG GCG AAA CGT CCC GGC 962Arg Ser Leu Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly305 310 315TTT CGT TCA TTC CGC TGC CAG GAT TCC AGC CTG CTG GCC TTT GAT TTT 1010Phe Arg ser Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe320 325 330GCT GGC GTT CAT CAT AGC GAT ATG GTG ACG CTG CTG GCG GAG TAC GGT 1058Ala Gly Val His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly335 340 345ATT GCC CTG CGG GCC GGG CAG CAT TGC GCT CAG CCG CTA CTG GCA GAA 1106Ile Ala Leu Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu350 355 360 365TTA GGC GTA ACC GGC ACA CTG CGC GCC TCT TTT GCG CCA TAT AAT ACA 1154Leu Gly Val Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr370 375 380AAG AGT GAT GTG GAT GCG CTG GTG AAT GCC GTT GAC CGC GCG CTG GAA 1202Lys Ser Asp Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu385 390 395TTA TTG GTG GAT TA1217Leu Leu Val Asp400(2)SEQ ID NO2的信息(i)序列特征(A)長度401個氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO2Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu15 10 15Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro20 25 30Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly35 40 45Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg50 55 60Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp65 70 75 80Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met85 90 95Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile100 105 110Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met115 120 125Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala130 135 140Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg145 150 155 160Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys165 170 175Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val180 185 190Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val195 200 205Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr210 215 220Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu225 230 235 240Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser245 250 255Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly260 265 270Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp275 280 285Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu290 295 300Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser305 310 315 320Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val325 330 335His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu340 345 350Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu Leu Gly Val355 360 365Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp370 375 380Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val385 390 395 400Asp(2)SEQ ID NO3的信息(i)序列特征(A)長度1233個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假擬結(jié)構(gòu)無
(iv)反義無(vi)原始來源(A)生物體大腸桿菌(B)菌株W3110(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置19..1233(ix)特征(A)名稱/關(guān)鍵詞5’UTR(B)位置1..18(xi)序列描述SEQ ID NO3AAAGAGGAGA AATTAACT ATG AAA TTA CCG ATT TAT CTC GAC TAC TCC GCA 51Met Lys Leu Pro Ile Tyr Leu Asp Tyr Ser Ala15 10ACC ACG CCG GTG GAC CCG CGT GTT GCC GAG AAA ATG ATG CAG TTT ATG 99Thr Thr Pro Val Asp Pro Arg Val Ala Glu Lys Met Met Gln Phe Met15 20 25ACG ATG GAC GGA ACC TTT GGT AAC CCG GCC TCC CGT TCT CAC CGT TTC 147Thr Met Asp Gly Thr Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe30 35 40GGC TGG CAG GCT GAA GAA GCG GTA GAT ATC GCC CGT AAT CAG ATT GCC 195Gly Trp Gln Ala Glu Glu Ala Val Asp Ile Ala Arg Asn Gln Ile Ala45 50 55GAT CTG GTC GGC GCT GAT CCG CGT GAA ATC GTC TTT ACC TCT GGT GCA 243Asp Leu Val Gly Ala Asp Pro Arg Glu Ile Val Phe Thr Ser Gly Ala60 65 70 75ACC GAA TCT GAC AAC CTG GCG ATC AAA GGT GCA GCC AAC TTT TAT CAG 291Thr Glu Ser Asp Asn Leu Ala Ile Lys Gly Ala Ala Asn Phe Tyr Gln80 85 90AAA AAA GGC AAG CAC ATC ATC ACC AGC AAA ACC GAA CAC AAA GCG GTA 339Lys Lys Gly Lys His Ile Ile Thr Ser Lys Thr Glu His Lys Ala Val95 100 105CTG GAT ACC TGC CGT CAG CTG GAG CGC GAA GGT TTT GAA GTC ACC TAC 387Leu Asp Thr Cys Arg Gln Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr110 115 120CTG GCA CCG CAG CGT AAC GGC ATT ATC GAC CTG AAA GAA CTT GAA GCA 435Leu Ala Pro Gln Arg Asn Gly Ile Ile Asp Leu Lys Glu Leu Glu Ala125 130 135GCG ATG CGT GAC GAC ACC ATC CTC GTG TCC ATC ATG CAC GTA AAT AAC 483Ala Met Arg Asp Asp Thr Ile Leu Val Ser Ile Met His Val Asn Asn140 145 150 155GAA ATC GGC GTG GTG CAG GAT ATC GCG GCT ATC GGC GAA ATG TGC CGT 531Glu Ile Gly Val Val Gln Asp Ile Ala Ala Ile Gly Glu Met Cys Arg160 165 170GCT CGT GGC ATT ATC TAT CAC GTT GAT GCA ACC CAG AGC GTG GGT AAA 579Ala Arg Gly Ile Ile Tyr His Val Asp Ala Thr Gln Ser Val Gly Lys175 180 185CTG CCT ATC GAC CTG AGC CAG TTG AAA GTT GAC CTG ATG TCT TTC TCC 627Leu Pro Ile Asp Leu Ser Gln Leu Lys Val Asp Leu Met Ser Phe Ser190 195 200GGT CAC AAA ATC TAT GGC CCG AAA GGT ATC GGT GCG CTG TAT GTA CGT 675Gly His Lys Ile Tyr Gly Pro Lys Gly Ile Gly Ala Leu Tyr Val Arg205 210 215CGT AAA CCG CGC GTA CGC ATC GAA GCG CAA ATG CAC GGC GGC GGT CAC 723Arg Lys Pro Arg Val Arg Ile Glu Ala Gln Met His Gly Gly Gly His220 225 230 235GAG CGC GGT ATG CGT TCC GGC ACT CTG CCT GTT CAC CAG ATC GTC GGA 771Glu Arg Gly Met Arg Ser Gly Thr Leu Pro Val His Gln Ile Val Gly240 245 250ATG GGC GAG GCC TAT CGC ATC GCA AAA GAA GAG ATG GCG ACC GAG ATG 819Met Gly Glu Ala Tyr Arg Ile Ala Lys Glu Glu Met Ala Thr Glu Met255 260 265GAA CGT CTG CGC GGC CTG CGT AAC CGT CTG TGG AAC GGC ATC AAA GAT 867Glu Arg Leu Arg G1y Leu Arg Asn Arg Leu Trp Asn Gly Ile Lys Asp270 275 280ATC GAA GAA GTT TAC CTG AAC GGT GAC CTG GAA CAC GGT GCG CCG AAC 915Ile Glu Glu Val Tyr Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn285 290 295ATT CTC AAC GTC AGC TTC AAC TAC GTT GAA GGT GAG TCG CTG ATT ATG 963Ile Leu Asn Val Ser Phe Asn Tyr Val Glu Gly Glu Ser Leu Ile Met300 305 310 315GCG CTG AAA GAC CTC GCA GTT TCT TCA GGT TCC GCC TGT ACG TCA GCA 1011Ala Leu Lys Asp Leu Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala320 325 330AGC CTC GAA CCG TCC TAC GTG CTG CGC GCG CTG GGG CTG AAC GAC GAG 1059Ser Leu Glu Pro Ser Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu335 340 345CTG GCA CAT AGC TCT ATC CGT TTC TCT TTA GGT CGT TTT ACT ACT GAA 1107Leu Ala His Ser Ser Ile Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu350 355 360GAA GAG ATC GAC TAC ACC ATC GAG TTA GTT CGT AAA TCC ATC GGT CGT 1155Glu Glu Ile Asp Tyr Thr Ile Glu Leu Val Arg Lys Ser Ile Gly Arg365 370 375CTG CGT GAC CTT TCT CCG CTG TGG GAA ATG TAC AAG CAG GGC GTG GAT 1203Leu Arg Asp Leu Ser Pro Leu Trp Glu Met Tyr Lys Gln Gly Val Asp380 385 390 395CTG AAC AGC ATC GAA TGG GCT CAT CAT TA1233Leu Asn Ser Ile Glu Trp Ala His His400 405(2)SEQ ID NO4的信息(i)序列特征(A)長度404個氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO4Met Lys Leu Pro Ile Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp1 5 10 15Pro Arg Val Ala Glu Lys Met Met Gln Phe Met Thr Met Asp Gly Thr20 25 30Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gln Ala Glu35 40 45Glu Ala Val Asp Ile Ala Arg Asn Gln Ile Ala Asp Leu Val Gly Ala50 55 60Asp Pro Arg Glu Ile Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn65 70 75 80Leu Ala Ile Lys Gly Ala Ala Asn Phe Tyr Gln Lys Lys Gly Lys His85 90 95Ile Ile Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg100 105 110Gln Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gln Arg115 120 125Asn Gly Ile Ile ASp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp130 135 140Thr Ile Leu Val Ser Ile Met His Val Asn Asn Glu Ile Gly Val Val145 150 155 160Gln Asp Ile Ala Ala Ile Gly Glu Met Cys Arg Ala Arg Gly Ile Ile165 170 175Tyr His Val Asp Ala Thr Gln Ser Val Gly Lys Leu Pro Ile Asp Leu180 185 190Ser Gln Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys Ile Tyr195 200 205Gly Pro Lys Gly Ile Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val210 215 220Arg Ile Glu Ala Gln Met His Gly Gly Gly His Glu Arg Gly Met Arg225 230 235 240Ser Gly Thr Leu Pro Val His Gln Ile Val Gly Met Gly Glu Ala Tyr245 250 255Arg Ile Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly260 265 270Leu Arg Asn Arg Leu Trp Asn Gly Ile Lys Asp Ile Glu Glu Val Tyr275 280 285Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn Ile Leu Asn Val Ser290 295 300Phe Asn Tyr Val Glu Gly Glu Ser Leu Ile Met Ala Leu Lys Asp Leu305 310 315 320Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser325 330 335Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser340 345 350Ile Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu Ile Asp Tyr355 360 365Thr Ile Glu Leu Val Arg Lys Ser Ile Gly Arg Leu Arg Asp Leu Ser370 375 380Pro Leu Trp Glu Met Tyr Lys Gln Gly Val Asp Leu Asn Ser Ile Glu385 390 395 400Trp Ala His His(2)SEQ ID NO5的信息(i)序列特征(A)長度3794個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)環(huán)狀(ii)分子類型DNA(基因組)(iii)假擬結(jié)構(gòu)無(iv)反義無(vii)直接來源(B)克隆pHS1bioS1(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置601..1806(xi)序列描述SEQ ID NO5GACGTCTGTG TGGAATTGTG AGCGGATAAC AATTTCACAC AGGGCCCTCG GACACCGAGG 60AGAATGTCAA GAGGCGAACA CACAACGTCT TGGAGCGCCA GAGGAGGAAC GAGCTAAAAC 120GGAGCTTTTT TGCCCTGCGT GACCAGATCC CGGAGTTGGA AAACAATGAA AAGGCCCCCA 180AGGTAGTTAT CCTTAAAAAA GCCACAGCAT ACATCCTGTC CGTCCAAGCA GAGGAGCAAA 240AGCTCATTTC TGAAGAGGAC TTGTTGCGGA AACGACGAGA ACAGTTGAAA CACAAACTTG 300AACAGCTACG GAACTCTTGT GCGTAAGGAA AAGTAAGGAA AACGATTCCT TCTAACAGAA 360ATGTCCTGAG CAATCACCTA TGAACTGTCG ACTCGAGATA GCATTTTTAT CCATAAGATT 420AGCCGATCCT AAGGTTTACA ATTGTGAGCG CTCACAATTA TGATAGATTC AATTGTGAGC 480GGATAACAAT TTCACACACG CTAGCGGTAC CGGGCCCCCC CTCGAGGTCG ACGGTATCGA 540TAAGCTTGAT ATCGAATTCC TGCAGCCCGG GGGATCCCAT GGTACGCGTC GAGGAGTACC 600ATG AAC GTT TTT AAT CCC GCG CAG TTT CGC GCC CAG TTT CCC GCA CTA648Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu15 10 15CAG GAT GCG GGC GTC TAT CTC GAC AGC GCC GCG ACC GCG CTT AAA CCT696Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro20 25 30GAA GCC GTG GTT GAA GCC ACC CAA CAG TTT TAC AGT CTG AGC GCC GGA 744Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly35 40 45AAC GTC CAT CGC AGC CAG TTT GCC GAA GCC CAA CGC CTG ACC GCG CGT 792Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg50 55 60TAT GAA GCT GCA CGA GAG AAA GTG GCG CAA TTA CTG AAT GCA CCG GAT 840Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp65 70 75 80GAT AAA ACT ATC GTC TGG ACG CGC GGC ACC ACT GAA TCC ATC AAC ATG 888Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met85 90 95GTG GCA CAA TGC TAT GCG CGT CCG CGT CTG CAA CCG GGC GAT GAG ATT 936Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile100 105 110ATT GTC AGC GTG GCA GAA CAC CAC GCC AAC CTC GTC CCC TGG CTG ATG 984Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met115 120 125GTC GCC CAA CAA ACT GGA GCC AAA GTG GTG AAA TTG CCG CTT AAT GCG 1032Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala130 135 140CAG CGA CTG CCG GAT GTC GAT TTG TTG CCA GAA CTG ATT ACT CCC CGT 1080Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg145 150 155 160AGT CGG ATT CTG GCG TTG GGT CAG ATG TCG AAC GTT ACT GGC GGT TGC 1128Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys165 170 175CCG GAT CTG GCG CGA GCG ATT ACC TTT GCT CAT TCA GCC GGG ATG GTG 1176Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val180 185 190GTG ATG GTT GAT GGT GCT CAG GGG GCA GTG CAT TTC CCC GCG GAT GTT 1224Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val195 200 205CAG CAA CTG GAT ATT GAT TTC TAT GCT TTT TCA GGT CAC AAA CTG TAT 1272Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr210 215 220GGC CCG ACA GGT ATC GGC GTG CTG TAT GGT AAA TCA GAA CTG CTG GAG 1320Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu225 230 235 240GCG ATG TCG CCC TGG CTG GGC GGC GGC AAA ATG GTT CAC GAA GTG AGT 1368Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser245 250 255TTT GAC GGC TTC ACG ACT CAA TCT GCG CCG TGG AAA CTG GAA GCT GGA 1416Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly260 265 270ACG CCA AAT GTC GCT GGT GTC ATA GGA TTA AGC GCG GCG CTG GAA TGG1464Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp275 280 285CTG GCA GAT TAC GAT ATC AAC CAG GCC GAA AGC TGG AGC CGT AGC TTA1512Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu290 295 300GCA ACG CTG GCG GAA GAT GCG CTG GCG AAA CGT CCC GGC TTT CGT TCA1560Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser305 310 315 320TTC CGC TGC CAG GAT TCC AGC CTG CTG GCC TTT GAT TTT GCT GGC GTT1608Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val325 330 335CAT CAT AGC GAT ATG GTG ACG CTG CTG GCG GAG TAC GGT ATT GCC CTG1656His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu340 345 350CGG GCC GGG CAG CAT TGC GCT CAG CCG CTA CTG GCA GAA TTA GGC GTA1704Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu Leu Gly Val355 360 365ACC GGC ACA CTG CGC GCC TCT TTT GCG CCA TAT AAT ACA AAG AGT GAT1752Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp370 375 380GTG GAT GCG CTG GTG AAT GCC GTT GAC CGC GCG CTG GAA TTA TTG GTG1800Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val385 390 395 400GAT TAAACGCGTG CTAGAGGCAT CAAATAAAAC GAAAGGCTCA GTCGAAAGAC 1853AspTGGGCCTTTC GTTTTATCTG TTGTTTGTCG GTGAACGCTC TCCTGAGTAG GACAAATCCG 1913CCGCCCTAGA CCTAGGGGAT ATATTCCGCT TCCTCGCTCA CTGACTCGCT ACGCTCGGTC 1973GTTCGACTGC GGCGAGCGGA AATGGCTTAC GAACGGGGCG GAGATTTCCT GGAAGATGCC 2033AGGAAGATAC TTAACAGGGA AGTGAGAGGG CCGCGGCAAA GCCGTTTTTC CATAGGCTCC 2093GCCCCCCTGA CAAGCATCAC GAAATCTGAC GCTCAAATCA GTGGTGGCGA AACCCGACAG 2153GACTATAAAG ATACCAGGCG TTTCCCCCTG GCGGCTCCCT CGTGCGCTCT CCTGTTCCTG 2213CCTTTCGGTT TACCGGTGTC ATTCCGCTGT TATGGCCGCG TTTGTCTCAT TCCACGCCTG 2273ACACTCAGTT CCGGGTAGGC AGTTCGCTCC AAGCTGGACT GTATGCACGA ACCCCCCGTT 2333CAGTCCGACC GCTGCGCCTT ATCCGGTAAC TATCGTCTTG AGTCCAACCC GGAAAGACAT 2393GCAAAAGCAC CACTGGCAGC AGCCACTGGT AATTGATTTA GAGGAGTTAG TCTTGAAGTC 2453ATGCGCCGGT TAAGGCTAAA CTGAAAGGAC AAGTTTTGGT GACTGCGCTC CTCCAAGCCA 2513GTTACCTCGG TTCAAAGAGT TGGTAGGTCA GAGAACCTTC GAAAAACCGC CCTGCAAGGC 2573GGTTTTTTCG TTTTCAGAGC AAGAGATTAC GCGCAGACCA AAACGATCTC AAGAAGATCA 2633TCTTATTAAT CAGATAAAAT ATTTCTAGAT TTCAGTGCAA TTTATCTCTT CAAATGTAGC 2693ACCTGAAGTC AGCCCCATAC GATATAAGTT GTTACTAGTG CTTGGATTCT CACCAATAAA 2753AAACGCCCGG CGGCAACCGA GCGTTCTGAA CAAATCCAGA TGGAGTTCTG AGGTCATTAC 2813TGGATCTATC AACAGGAGTC CAAGCGAGCT CTCGAACCCC AGAGTCCCGC TCAGAAGAAC 2873TCGTCAAGAA GGCGATAGAA GGCGATGCGC TGCGAATCGG GAGCGGCGAT ACCGTAAAGC 2933ACGAGGAAGC GGTCAGCCCA TTCGCCGCCA AGCTCTTCAG CAATATCACG GGTAGCCAAC 2993GCTATGTCCT GATAGCGGTC CGCCACACCC AGCCGGCCAC AGTCGATGAA TCCAGAAAAG 3053CGGCCATTTT CCACCATGAT ATTCGGCAAG CAGGCATCGC CATGGGTCAC GACGAGATCC 3113TCGCCGTCGG GCATGCGCGC CTTGAGCCTG GCGAACAGTT CGGCTGGCGC GAGCCCCTGA 3173TGCTCTTCGT CCAGATCATC CTGATCGACA AGACCGGCTT CCATCCGAGT ACGTGCTCGC 3233TCGATGCGAT GTTTCGCTTG GTGGTCGAAT GGGCAGGTAG CCGGATCAAG CGTATGCAGC 3293CGCCGCATTG CATCAGCCAT GATGGATACT TTCTCGGCAG GAGCAAGGTG AGATGACAGG 3353AGATCCTGCC CCGGCACTTC GCCCAATAGC AGCCAGTCCC TTCCCGCTTC AGTGACAACG 3413TCGAGCACAG CTGCGCAAGG AACGCCCGTC GTGGCCAGCC ACGATAGCCG CGCTGCCTCG 3473TCCTGCAGTT CATTCAGGGC ACCGGACAGG TCGGTCTTGA CAAAAAGAAC CGGGCGCCCC 3533TGCGCTGACA GCCGGAACAC GGCGGCATCA GAGCAGCCGA TTGTCTGTTG TGCCCAGTCA 3593TAGCCGAATA GCCTCTCCAC CCAAGCGGCC GGAGAACCTG CGTGCAATCC ATCTTGTTCA 3653ATCATGCGAA ACGATCCTCA TCCTGTCTCT TGATCAGATC TTGATCCCCT GCGCCATCAG 3713ATCCTTGGCG GCAAGAAAGC CATCCAGTTT ACTTTGCAGG GCTTCCCAAC CTTACCAGAG 3773GGCGCCCCAG CTGGCAATTC C3794(2)SEQ ID NO6的信息(i)序列特征(A)長度401個氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO6Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu15 10 15Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro20 25 30Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly35 40 45Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg50 55 60Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp65 70 75 80Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met85 90 95Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile100 105 110Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met115 120 125Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala130 135 140Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg145 150 155 160Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys165 170 175Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val180 185 190Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val195 200 205Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr210 215 220Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu225 230 235 240Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser245 250 255Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly260 265 270Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp275 280 285Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu290 295 300Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser305 310 315 320Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Pne Asp Phe Ala Gly Val325 330 335His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu340 345 350Arg Ala Gly Gln His Cys Ala Gln pro Leu Leu Ala Glu Leu Gly Val355 360 365Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp370 375 380Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val385 390 395 400Asp(2)SEQ ID NO7的信息(i)序列特征(A)長度3810個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)環(huán)狀(ii)分子類型DNA(基因組)(iii)假擬結(jié)構(gòu)無(iv)反義無(vii)直接來源(B)克隆pHS1bioS2(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置608..1822(xi)序列描述SEQ ID NO7GACGTCTGTG TGGAATTGTG AGCGGATAAC AATTTCACAC AGGGCCCTCG GACACCGAGG 60AGAATGTCAA GAGGCGAACA CACAACGTCT TGGAGCGCCA GAGGAGGAAC GAGCTAAAAC 120GGAGCTTTTT TGCCCTGCGT GACCAGATCC CGGAGTTGGA AAACAATGAA AAGGCCCCCA 180AGGTAGTTAT CCTTAAAAAA GCCACAGCAT ACATCCTGTC CGTCCAAGCA GAGGAGCAAA 240AGCTCATTTC TGAAGAGGAC TTGTTGCGGA AACGACGAGA ACAGTTGAAA CACAAACTTG 300AACAGCTACG GAACTCTTGT GCGTAAGGAA AAGTAAGGAA AACGATTCCT TCTAACAGAA 360ATGTCCTGAG CAATCACCTA TGAACTGTCG ACTCGAGATA GCATTTTTAT CCATAAGATT 420AGCCGATCCT AAGGTTTACA ATTGTGAGCG CTCACAATTA TGATAGATTC AATTGTGAGC 480GGATAACAAT TTCACACACG CTAGCGGTAC CGGGCCCCCC CTCGAGGTCG ACGGTATCGA 540TAAGCTTGAT ATCGAATTCC TGCAGCCCGG GGGATCCCAT GGTACGCGTA AAGAGGAGAA 600ATTAACT ATG AAA TTA CCG ATT TAT CTC GAC TAC TCC GCA ACC ACG CCG649Met Lys Leu Pro Ile Tyr Leu Asp Tyr Ser Ala Thr Thr Pro1 5 10GTG GAC CCG CGT GTT GCC GAG AAA ATG ATG CAG TTT ATG ACG ATG GAC697Val Asp Pro Arg Val Ala Glu Lys Met Met Gln Phe Met Thr Met Asp15 20 25 30GGA ACC TTT GGT AAC CCG GCC TCC CGT TCT CAC CGT TTC GGC TGG CAG745Gly Thr Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gln35 40 45GCT GAA GAA GCG GTA GAT ATC GCC CGT AAT CAG ATT GCC GAT CTG GTC793Ala Glu Glu Ala Val Asp Ile Ala Arg Asn Gln Ile Ala Asp Leu Val50 55 60GGC GCT GAT CCG CGT GAA ATC GTC TTT ACC TCT GGT GCA ACC GAA TCT841Gly Ala Asp Pro Arg Glu Ile Val Phe Thr Ser Gly Ala Thr Glu Ser65 70 75GAC AAC CTG GCG ATC AAA GGT GCA GCC AAC TTT TAT CAG AAA AAA GGC889Asp Asn Leu Ala Ile Lys Gly Ala Ala Asn Phe Tyr Gln Lys Lys Gly80 85 90AAG CAC ATC ATC ACC AGC AAA ACC GAA CAC AAA GCG GTA CTG GAT ACC937Lys His Ile Ile Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr95 100 105 110TGC CGT CAG CTG GAG CGC GAA GGT TTT GAA GTC ACC TAC CTG GCA CCG985Cys Arg Gln Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro115 120 125CAG CGT AAC GGC ATT ATC GAC CTG AAA GAA CTT GAA GCA GCG ATG CGT1033Gln Arg Asn Gly Ile Ile Asp Leu Lys Glu Leu Glu Ala Ala Met Arg130 135 140GAC GAC ACC ATC CTC GTG TCC ATC ATG CAC GTA AAT AAC GAA ATC GGC1081Asp Asp Thr Ile Leu Val Ser Ile Met His Val Asn Asn Glu Ile Gly145 150 155GTG GTG CAG GAT ATC GCG GCT ATC GGC GAA ATG TGC CGT GCT CGT GGC1129Val Val Gln Asp Ile Ala Ala Ile Gly Glu Met Cys Arg Ala Arg Gly160 165 170ATT ATC TAT CAC GTT GAT GCA ACC CAG AGC GTG GGT AAA CTG CCT ATC1177Ile Ile Tyr His Val Asp Ala Thr Gln Ser Val Gly Lys Leu Pro Ile175 180 185 190GAC CTG AGC CAG TTG AAA GTT GAC CTG ATG TCT TTC TCC GGT CAC AAA 1225Asp Leu Ser Gln Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys195 200 205ATC TAT GGC CCG AAA GGT ATC GGT GCG CTG TAT GTA CGT CGT AAA CCG 1273Ile Tyr Gly Pro Lys Gly Ile Gly Ala Leu Tyr Val Arg Arg Lys Pro210 215 220CGC GTA CGC ATC GAA GCG CAA ATG CAC GGC GGC GGT CAC GAG CGC GGT 1321Arg Val Arg Ile Glu Ala Gln Met His Gly Gly Gly His Glu Arg Gly225 230 235ATG CGT TCC GGC ACT CTG CCT GTT CAC CAG ATC GTC GGA ATG GGC GAG 1369Met Arg Ser Gly Thr Leu Pro Val His Gln Ile Val Gly Met Gly Glu240 245 250GCC TAT CGC ATC GCA AAA GAA GAG ATG GCG ACC GAG ATG GAA CGT CTG 1417Ala Tyr Arg Ile Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu255 260 265 270CGC GGC CTG CGT AAC CGT CTG TGG AAC GGC ATC AAA GAT ATC GAA GAA 1465Arg Gly Leu Arg Asn Arg Leu Trp Asn Gly Ile Lys Asp Ile Glu Glu275 280 285GTT TAC CTG AAC GGT GAC CTG GAA CAC GGT GCG CCG AAC ATT CTC AAC 1513Val Tyr Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn Ile Leu Asn290 295 300GTC AGC TTC AAC TAC GTT GAA GGT GAG TCG CTG ATT ATG GCG CTG AAA 1561Val Ser Phe Asn Tyr Val Glu Gly Glu Ser Leu Ile Met Ala Leu Lys305 310 315GAC CTC GCA GTT TCT TCA GGT TCC GCC TGT ACG TCA GCA AGC CTC GAA 1609Asp Leu Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu320 325 330CCG TCC TAC GTG CTG CGC GCG CTG GGG CTG AAC GAC GAG CTG GCA CAT 1657Pro Ser Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His335 340 345 350AGC TCT ATC CGT TTC TCT TTA GGT CGT TTT ACT ACT GAA GAA GAG ATC 1705Ser Ser Ile Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu Ile355 360 365GAC TAC ACC ATC GAG TTA GTT CGT AAA TCC ATC GGT CGT CTG CGT GAC 1753Asp Tyr Thr Ile Glu Leu Val Arg Lys Ser Ile Gly Arg Leu Arg Asp370 375 380CTT TCT CCG CTG TGG GAA ATG TAC AAG CAG GGC GTG GAT CTG AAC AGC 1801Leu Ser Pro Leu Trp Glu Met Tyr Lys Gln Gly Val Asp Leu Asn Ser385 390 395ATC GAA TGG GCT CAT CAT TAAACGCGTG CTAGAGGCAT CAAATAAAAC 1849Ile Glu Trp Ala His His400 405GAAAGGCTCA GTCGAAAGAC TGGGCCTTTC GTTTTATCTG TTGTTTGTCG GTGAACGCTC 1909TCCTGAGTAG GACAAATCCG CCGCCCTAGA CCTAGGGGAT ATATTCCGCT TCCTCGCTCA 1969CTGACTCGCT ACGCTCGGTC GTTCGACTGC GGCGAGCGGA AATGGCTTAC GAACGGGGCG 2029GAGATTTCCT GGAAGATGCC AGGAAGATAC TTAACAGGGA AGTGAGAGGG CCGCGGCAAA 2089GCCGTTTTTC CATAGGCTCC GCCCCCCTGA CAAGCATCAC GAAATCTGAC GCTCAAATCA 2149GTGGTGGCGA AACCCGACAG GACTATAAAG ATACCAGGCG TTTCCCCCTG GCGGCTCCCT 2209CGTGCGCTCT CCTGTTCCTG CCTTTCGGTT TACCGGTGTC ATTCCGCTGT TATGGCCGCG 2269TTTGTCTCAT TCCACGCCTG ACACTCAGTT CCGGGTAGGC AGTTCGCTCC AAGCTGGACT 2329GTATGCACGA ACCCCCCGTT CAGTCCGACC GCTGCGCCTT ATCCGGTAAC TATCGTCTTG 2389AGTCCAACCC GGAAAGACAT GCAAAAGCAC CACTGGCAGC AGCCACTGGT AATTGATTTA 2449GAGGAGTTAG TCTTGAAGTC ATGCGCCGGT TAAGGCTAAA CTGAAAGGAC AAGTTTTGGT 2509GACTGCGCTC CTCCAAGCCA GTTACCTCGG TTCAAAGAGT TGGTAGCTCA GAGAACCTTC 2569GAAAAACCGC CCTGCAAGGC GGTTTTTTCG TTTTCAGAGC AAGAGATTAC GCGCAGACCA 2629AAACGATCTC AAGAAGATCA TCTTATTAAT CAGATAAAAT ATTTCTAGAT TTCAGTGCAA 2689TTTATCTCTT CAAATGTAGC ACCTGAAGTC AGCCCCATAC GATATAAGTT GTTACTAGTG 2749CTTGGATTCT CACCAATAAA AAACGCCCGG CGGCAACCGA GCGTTCTGAA CAAATCCAGA 2809TGGAGTTCTG AGGTCATTAC TGGATCTATC AACAGGAGTC CAAGCGAGCT CTCGAACCCC 2869AGAGTCCCGC TCAGAAGAAC TCGTCAAGAA GGCGATAGAA GGCGATGCGC TGCGAATCGG 2929GAGCGGCGAT ACCGTAAAGC ACGAGGAAGC GGTCAGCCCA TTCGCCGCCA AGCTCTTCAG 2989CAATATCACG GGTAGCCAAC GCTATGTCCT GATAGCGGTC CGCCACACCC AGCCGGCCAC 3049AGTCGATGAA TCCAGAAAAG CGGCCATTTT CCACCATGAT ATTCGGCAAG CAGGCATCGC 3109CATGGGTCAC GACGAGATCC TCGCCGTCGG GCATGCGCGC CTTGAGCCTG GCGAACAGTT 3169CGGCTGGCGC GAGCCCCTGA TGCTCTTCGT CCAGATCATC CTGATCGACA AGACCGGCTT 3229CCATCCGAGT ACGTGCTCGC TCGATGCGAT GTTTCGCTTG GTGGTCGAAT GGGCAGGTAG 3289CCGGATCAAG CGTATGCAGC CGCCGCATTG CATCAGCCAT GATGGATACT TTCTCGGCAG 3349GAGCAAGGTG AGATGACAGG AGATCCTGCC CCGGCACTTC GCCCAATAGC AGCCAGTCCC 3409TTCCCGCTTC AGTGACAACG TCGAGCACAG CTGCGCAAGG AACGCCCGTC GTGGCCAGCC 3469ACGATAGCCG CGCTGCCTCG TCCTGCAGTT CATTCAGGGC ACCGGACAGG TCGGTCTTGA 3529CAAAAAGAAC CGGGCGCCCC TGCGCTGACA GCCGGAACAC GGCGGCATCA GAGCAGCCGA 3589TTGTCTGTTG TGCCCAGTCA TAGCCGAATA GCCTCTCCAC CCAAGCGGCC GGAGAACCTG 3649CGTGCAATCC ATCTTGTTCA ATCATGCGAA ACGATCCTCA TCCTGTCTCT TGATCAGATC 3709TTGATCCCCT GCGCCATCAG ATCCTTGGCG GCAAGAAAGC CATCCAGTTT ACTTTGCAGG 3769GCTTCCCAAC CTTACCAGAG GGCGCCCCAG CTGGCAATTC C 3810(2)SEQ ID NO8的信息(i)序列特征(A)長度404個氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO8Met Lys Leu Pro Ile Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp1 5 10 15Pro Arg Val Ala Glu Lys Met Met Gln Phe Met Thr Met Asp Gly Thr20 25 30Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gln Ala Glu35 40 45Glu Ala Val Asp Ile Ala Arg Asn Gln Ile Ala Asp Leu Val Gly Ala50 55 60Asp Pro Arg Glu Ile Val phe Thr Ser Gly Ala Thr Glu Ser Asp Asn65 70 75 80Leu Ala Ile Lys Gly Ala Ala Asn Phe Tyr Gln Lys Lys Gly Lys His85 90 95Ile Ile Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg100 105 110Gln Leu Glu Arg Glu Gly phe Glu Val Thr Tyr Leu Ala Pro Gln Arg115 120 125Asn Gly Ile Ile Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp130 135 140Thr Ile Leu Val Ser Ile Met His Val Asn Asn Glu Ile Gly Val Val145 150 155 160Gln Asp Ile Ala Ala Ile Gly Glu Met Cys Arg Ala Arg Gly Ile Ile165 170 175Tyr His Val Asp Ala Thr Gln Ser Val Gly Lys Leu Pro Ile Asp Leu180 185 190Ser Gln Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys Ile Tyr195 200 205Gly Pro Lys Gly Ile Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val210 215 220Arg Ile Glu Ala Gln Met His Gly Gly Gly His Glu Arg Gly Met Arg225 230 235 240Ser Gly Thr Leu Pro Val His Gln Ile Val Gly Met Gly Glu Ala Tyr245 250 255Arg Ile Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly260 265 270Leu Arg Asn Arg Leu Trp Asn Gly Ile Lys Asp Ile Glu Glu Val Tyr275 280 285Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn Ile Leu Asn Val Ser290 295 300Phe Asn Tyr Val Glu Gly Glu Ser Leu Ile Met Ala Leu Lys Asp Leu305 310 315 320Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser325 330 335Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser340 345 350Ile Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu Ile Asp Tyr355 360 365Thr Ile Glu Leu Val Arg Lys Ser Ile Gly Arg Leu Arg Asp Leu Ser370 375 380Pro Leu Trp Glu Met Tyr Lys Gln Gly Val Asp Leu Asn Ser Ile Glu385 390 395 400Trp Ala His His
(2)SEQ ID NO9的信息(i)序列特征(A)長度3465個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)環(huán)狀(ii)分子類型DNA(基因組)(iii)假擬結(jié)構(gòu)無(iv)反義無(vii)直接來源(B)克隆pHS2bioSl(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置272..1477(xi)序列描述SEQ ID NO9GACGTCTAAG AAACCATTAT TATCATGACA TTAACCTATA AAAATAGGCG TATCACGAGG 60CCCTTTCGTC TTCACCTCGA GTCCCTATCA GTGATAGAGA TTGACATCCC TATCAGTGAT 120AGAGATACTG AGCACATCAG CAGGACGCAC TGACCGAATT CATTAAAGAG GAGAAAGGTA 180CCGGGCCCCC CCTCGAGGTC GACGGTATCG ATAAGCTTGA TATCGAATTC CTGCAGCCCG 240GGGGATCCCA TGGTACGCGT CGAGGAGTAC C ATG AAC GTT TTT AAT CCC GCG 292Met Asn Val Phe Asn Pro Ala1 5CAG TTT CGC GCC CAG TTT CCC GCA CTA CAG GAT GCG GGC GTC TAT CTC340Gln Phe Arg Ala Gln Phe Pro Ala Leu Gln Asp Ala Gly Val Tyr Leu10 15 20GAC AGC GCC GCG ACC GCG CTT AAA CCT GAA GCC GTG GTT GAA GCC ACC388Asp Ser Ala Ala Thr Ala Leu Lys Pro Glu Ala Val Val Glu Ala Thr25 30 35CAA CAG TTT TAC AGT CTG AGC GCC GGA AAC GTC CAT CGC AGC CAG TTT436Gln Gln phe Tyr Ser Leu Ser Ala Gly Asn Val His Arg Ser Gln Phe40 45 50 55GCC GAA GCC CAA CGC CTG ACC GCG CGT TAT GAA GCT GCA CGA GAG AAA484Ala Glu Ala Gln Arg Leu Thr Ala Arg Tyr Glu Ala Ala Arg Glu Lys60 65 70GTG GCG CAA TTA CTG AAT GCA CCG GAT GAT AAA ACT ATC GTC TGG ACG 532Val Ala Gln Leu Leu Asn Ala Pro Asp Asp Lys Thr Ile Val Trp Thr75 80 85CGC GGC ACC ACT GAA TCC ATC AAC ATG GTG GCA CAA TGC TAT GCG CGT 580Arg Gly Thr Thr Glu Ser Ile Asn Met Val Ala Gln Cys Tyr Ala Arg90 95 100CCG CGT CTG CAA CCG GGC GAT GAG ATT ATT GTC AGC GTG GCA GAA CAC 628Pro Arg Leu Gln Pro Gly Asp Glu Ile Ile Val Ser Val Ala Glu His105 110 115CAC GCC AAC CTC GTC CCC TGG CTG ATG GTC GCC CAA CAA ACT GGA GCC 676His Ala Asn Leu Val Pro Trp Leu Met Val Ala Gln Gln Thr Gly Ala120 125 130 135AAA GTG GTG AAA TTG CCG CTT AAT GCG CAG CGA CTG CCG GAT GTC GAT 724Lys Val Val Lys Leu Pro Leu Asn Ala Gln Arg Leu Pro Asp Val Asp140 145 150TTG TTG CCA GAA CTG ATT ACT CCC CGT AGT CGG ATT CTG GCG TTG GGT 772Leu Leu Pro Glu Leu Ile Thr Pro Arg Ser Arg Ile Leu Ala Leu Gly155 160 165CAG ATG TCG AAC GTT ACT GGC GGT TGC CCG GAT CTG GCG CGA GCG ATT 820Gln Met Ser Asn Val Thr Gly Gly Cys Pro Asp Leu Ala Arg Ala Ile170 175 180ACC TTT GCT CAT TCA GCC GGG ATG GTG GTG ATG GTT GAT GGT GCT CAG 868Thr Phe Ala His Ser Ala Gly Met Val Val Met Val Asp Gly Ala Gln185 190 195GGG GCA GTG CAT TTC CCC GCG GAT GTT CAG CAA CTG GAT ATT GAT TTC 916Gly Ala Val His Phe Pro Ala Asp Val Gln Gln Leu Asp Ile Asp Phe200 205 210 215TAT GCT TTT TCA GGT CAC AAA CTG TAT GGC CCG ACA GGT ATC GGC GTG 964Tyr Ala Phe Ser Gly His Lys Leu Tyr Gly Pro Thr Gly Ile Gly Val220 225 230CTG TAT GGT AAA TCA GAA CTG CTG GAG GCG ATG TCG CCC TGG CTG GGC 1012Leu Tyr Gly Lys Ser Glu Leu Leu Glu Ala Met Ser Pro Trp Leu Gly235 240 245GGC GGC AAA ATG GTT CAC GAA GTG AGT TTT GAC GGC TTC ACG ACT CAA 1060Gly Gly Lys Met Val His Glu Val Ser Phe Asp Gly Phe Thr Thr Gln250 255 260TCT GCG CCG TGG AAA CTG GAA GCT GGA ACG CCA AAT GTC GCT GGT GTC 1108Ser Ala Pro Trp Lys Leu Glu Ala Gly Thr Pro Asn Val Ala Gly Val265 270 275ATA GGA TTA AGC GCG GCG CTG GAA TGG CTG GCA GAT TAC GAT ATC AAC 1156Ile Gly Leu Ser Ala Ala Leu Glu Trp Leu Ala Asp Tyr Asp Ile Asn280 285 290 295CAG GCC GAA AGC TGG AGC CGT AGC TTA GCA ACG CTG GCG GAA GAT GCG 1204Gln Ala Glu Ser Trp Ser Arg Ser Leu Ala Thr Leu Ala Glu Asp Ala300 305 310CTG GCG AAA CGT CCC GGC TTT CGT TCA TTC CGC TGC CAG GAT TCC AGC 1252Leu Ala Lys Arg Pro Gly Phe Arg Ser Phe Arg Cys Gln Asp Ser Ser315 320 325CTG CTG GCC TTT GAT TTT GCT GGC GTT CAT CAT AGC GAT ATG GTG ACG 1300Leu Leu Ala Phe Asp Phe Ala Gly Val His His Ser Asp Met Val Thr330 335 340CTG CTG GCG GAG TAC GGT ATT GCC CTG CGG GCC GGG CAG CAT TGC GCT 1348Leu Leu Ala Glu Tyr Gly Ile Ala Leu Arg Ala Gly Gln His Cys Ala345 350 355CAG CCG CTA CTG GCA GAA TTA GGC GTA ACC GGC ACA CTG CGC GCC TCT 1396Gln Pro Leu Leu Ala Glu Leu Gly Val Thr Gly Thr Leu Arg Ala Ser360 365 370 375TTT GCG CCA TAT AAT ACA AAG AGT GAT GTG GAT GCG CTG GTG AAT GCC 1444Phe Ala Pro Tyr Asn Thr Lys Ser Asp Val Asp Ala Leu Val Asn Ala380 385 390GTT GAC CGC GCG CTG GAA TTA TTG GTG GAT TAAACGCGTG CTAGAGGCAT 1494Val Asp Arg Ala Leu Glu Leu Leu Val Asp395 400CAAATAAAAC GAAAGGCTCA GTCGAAAGAC TGGGCCTTTC GTTTTATCTG TTGTTTGTCG 1554GTGAACGCTC TCCTGAGTAG GACAAATCCG CCGCCCTAGA CCTAGGGGAT ATATTCCGCT 1614TCCTCGCTCA CTGACTCGCT ACGCTCGGTC GTTCGACTGC GGCGAGCGGA AATGGCTTAC 1674GAACGGGGCG GAGATTTCCT GGAAGATGCC AGGAAGATAC TTAACAGGGA AGTGAGAGGG 1734CCGCGGCAAA GCCGTTTTTC CATAGGCTCC GCCCCCCTGA CAAGCATCAC GAAATCTGAC 1794GCTCAAATCA GTGGTGGCGA AACCCGACAG GACTATAAAG ATACCAGGCG TTTCCCCCTG 1854GCGGCTCCCT CGTGCGCTCT CCTGTTCCTG CCTTTCGGTT TACCGGTGTC ATTCCGCTGT 1914TATGGCCGCG TTTGTCTCAT TCCACGCCTG ACACTCAGTT CCGGGTAGGC AGTTCGCTCC 1974AAGCTGGACT GTATGCACGA ACCCCCCGTT CAGTCCGACC GCTGCGCCTT ATCCGGTAAC 2034TATCGTCTTG AGTCCAACCC GGAAAGACAT GCAAAAGCAC CACTGGCAGC AGCCACTGGT 2094AATTGATTTA GAGGAGTTAG TCTTGAAGTC ATGCGCCGGT TAAGGCTAAA CTGAAAGGAC 2154AAGTTTTGGT GACTGCGCTC CTCCAAGCCA GTTACCTCGG TTCAAAGAGT TGGTAGCTCA 2214GAGAACCTTC GAAAAACCGC CCTGCAAGGC GGTTTTTTCG TTTTCAGAGC AAGAGATTAC 2274GCGCAGACCA AAACGATCTC AAGAAGATCA TCTTATTAAT CAGATAAAAT ATTTCTAGAT 2334TTCAGTGCAA TTTATCTCTT CAAATGTAGC ACCTGAAGTC AGCCCCATAC GATATAAGTT 2394GTTACTAGTG CTTGGATTCT CACCAATAAA AAACGCCCGG CGGCAACCGA GCGTTCTGAA 2454CAAATCCAGA TGGAGTTCTG AGGTCATTAC TGGATCTATC AACAGGAGTC CAAGCGAGCT 2514CTCGAACCCC AGAGTCCCGC TCAGAAGAAC TCGTCAAGAA GGCGATAGAA GGCGATGCGC 2574TGCGAATCGG GAGCGGCGAT ACCGTAAAGC ACGAGGAAGC GGTCAGCCCA TTCGCCGCCA 2634AGCTCTTCAG CAATATCACG GGTAGCCAAC GCTATGTCCT GATAGCGGTC CGCCACACCC 2694AGCCGGCCAC AGTCGATGAA TCCAGAAAAG CGGCCATTTT CCACCATGAT ATTCGGCAAG 2754CAGGCATCGC CATGGGTCAC GACGAGATCC TCGCCGTCGG GCATGCGCGC CTTGAGCCTG 2814GCGAACAGTT CGGCTGGCGC GAGCCCCTGA TGCTCTTCGT CCAGATCATC CTGATCGACA 2874AGACCGGCTT CCATCCGAGT ACGTGCTCGC TCGATGCGAT GTTTCGCTTG GTGGTCGAAT 2934GGGCAGGTAG CCGGATCAAG CGTATGCAGC CGCCGCATTG CATCAGCCAT GATGGATACT 2994TTCTCGGCAG GAGCAAGGTG AGATGACAGG AGATCCTGCC CCGGCACTTC GCCCAATAGC 3054AGCCAGTCCC TTCCCGCTTC AGTGACAACG TCGAGCACAG CTGCGCAAGG AACGCCCGTC 3114GTGGCCAGCC ACGATAGCCG CGCTGCCTCG TCCTGCAGTT CATTCAGGGC ACCGGACAGG 3174TCGGTCTTGA CAAAAAGAAC CGGGCGCCCC TGCGCTGACA GCCGGAACAC GGCGGCATCA 3234GAGCAGCCGA TTGTCTGTTG TGCCCAGTCA TAGCCGAATA GCCTCTCCAC CCAAGCGGCC 3294GGAGAACCTG CGTGCAATCC ATCTTGTTCA ATCATGCGAA ACGATCCTCA TCCTGTCTCT 3354TGATCAGATC TTGATCCCCT GCGCCATCAG ATCCTTGGCG GCAAGAAAGC CATCCAGTTT 3414ACTTTGCAGG GCTTCCCAAC CTTACCAGAG GGCGCCCCAG CTGGCAATTC C 3465(2)SEQ ID NO10的信息(i)序列特征(A)長度401個氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO10Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu1 5 10 15Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro20 25 30Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly35 40 45Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg50 55 60Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp65 70 75 80Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met85 90 95Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile100 105 110Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met115 120 125Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala130 135 140Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg145 150 155 160Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys165 170 175Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val180 185 190Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val195 200 205Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr210 215 220Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu225 230 235 240Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser245 250 255Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly260 265 270Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp275 280 285Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu290 295 300Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser305 310 315 320Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val325 330 335His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu340 345 350Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu Leu Gly Val355 360 365Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp370 375 380Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val385 390 395 400Asp(2)SEQ ID NO11的信息(i)序列特征(A)長度3481個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)環(huán)狀(ii)分子類型DNA(基因組)(iii)假擬結(jié)構(gòu)無(iv)反義無(vi)直接來源(B)克隆pHS2bioS2(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置279..1493(xi)序列描述SEQ ID NO11GACGTCTAAG AAACCATTAT TATCATGACA TTAACCTATA AAAATAGGCG TATCACGAGG 60CCCTTTCGTC TTCACCTCGA GTCCCTATCA GTGATAGAGA TTGACATCCC TATCAGTGAT 120AGAGATACTG AGCACATCAG CAGGACGCAC TGACCGAATT CATTAAAGAG GAGAAAGGTA 180CCGGGCCCCC CCTCGAGGTC GACGGTATCG ATAAGCTTGA TATCGAATTC CTGCAGCCCG 240GGGGATCCCA TGGTACGCGT AAAGAGGAGA AATTAACT ATG AAA TTA CCG ATT 293Met Lys Leu Pro Ile1 5TAT CTC GAC TAC TCC GCA ACC ACG CCG GTG GAC CCG CGT GTT GCC GAG341Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp Pro Arg Val Ala Glu10 15 20AAA ATG ATG CAG TTT ATG ACG ATG GAC GGA ACC TTT GGT AAC CCG GCC 389Lys Met Met Gln Phe Met Thr Met Asp Gly Thr Phe Gly Asn Pro Ala25 30 35TCC CGT TCT CAC CGT TTC GGC TGG CAG GCT GAA GAA GCG GTA GAT ATC 437Ser Arg Ser His Arg Phe Gly Trp Gln Ala Glu Glu Ala Val Asp Ile40 45 50GCC CGT AAT CAG ATT GCC GAT CTG GTC GGC GCT GAT CCG CGT GAA ATC 485Ala Arg Asn Gln Ile Ala Asp Leu Val Gly Ala Asp Pro Arg Glu Ile55 60 65GTC TTT ACC TCT GGT GCA ACC GAA TCT GAC AAC CTG GCG ATC AAA GGT 533Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn Leu Ala Ile Lys Gly70 75 80 85GCA GCC AAC TTT TAT CAG AAA AAA GGC AAG CAC ATC ATC ACC AGC AAA 581Ala Ala Asn Phe Tyr Gln Lys Lys Gly Lys His Ile Ile Thr Ser Lys90 95 100ACC GAA CAC AAA GCG GTA CTG GAT ACC TGC CGT CAG CTG GAG CGC GAA 629Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg Gln Leu Glu Arg Glu105 110 115GGT TTT GAA GTC ACC TAC CTG GCA CCG CAG CGT AAC GGC ATT ATC GAC 677Gly Phe Glu Val Thr Tyr Leu Ala Pro Gln Arg Asn Gly Ile Ile Asp120 125 130CTG AAA GAA CTT GAA GCA GCG ATG CGT GAC GAC ACC ATC CTC GTG TCC 725Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp Thr Ile Leu Val Ser135 140 145ATC ATG CAC GTA AAT AAC GAA ATC GGC GTG GTG CAG GAT ATC GCG GCT 773Ile Met His Val Asn Asn Glu Ile Gly Val Val Gln Asp Ile Ala Ala150 155 160 165ATC GGC GAA ATG TGC CGT GCT CGT GGC ATT ATC TAT CAC GTT GAT GCA 821Ile Gly Glu Met Cys Arg Ala Arg Gly Ile Ile Tyr His Val Asp Ala170 175 180ACC CAG AGC GTG GGT AAA CTG CCT ATC GAC CTG AGC CAG TTG AAA GTT 869Thr Gln Ser Val Gly Lys Leu Pro Ile Asp Leu Ser Gln Leu Lys Val185 190 195GAC CTG ATG TCT TTC TCC GGT CAC AAA ATC TAT GGC CCG AAA GGT ATC 917Asp Leu Met Ser Phe Ser Gly His Lys Ile Tyr Gly Pro Lys Gly Ile200 205 210GGT GCG CTG TAT GTA CGT CGT AAA CCG CGC GTA CGC ATC GAA GCG CAA 965Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val Arg Ile Glu Ala Gln215 220 225ATG CAC GGC GGC GGT CAC GAG CGC GGT ATG CGT TCC GGC ACT CTG CCT 1013Met His Gly Gly Gly His Glu Arg Gly Met Arg Ser Gly Thr Leu Pro230 235 240 245GTT CAC CAG ATC GTC GGA ATG GGC GAG GCC TAT CGC ATC GCA AAA GAA1061Val His Gln Ile Val Gly Met Gly Glu Ala Tyr Arg Ile Ala Lys Glu250 255 260GAG ATG GCG ACC GAG ATG GAA CGT CTG CGC GGC CTG CGT AAC CGT CTG1109Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly Leu Arg Asn Arg Leu265 270 275TGG AAC GGC ATC AAA GAT ATC GAA GAA GTT TAC CTG AAC GGT GAC CTG1157Trp Asn Gly Ile Lys Asp Ile Glu Glu Val Tyr Leu Asn Gly Asp Leu280 285 290GAA CAC GGT GCG CCG AAC ATT CTC AAC GTC AGC TTC AAC TAC GTT GAA1205Glu His Gly Ala Pro Asn Ile Leu Asn Val Ser Phe Asn Tyr Val Glu295 300 305GGT GAG TCG CTG ATT ATG GCG CTG AAA GAC CTC GCA GTT TCT TCA GGT1253Gly Glu Ser Leu Ile Met Ala Leu Lys Asp Leu Ala Val Ser Ser Gly310 315 320 325TCC GCC TGT ACG TCA GCA AGC CTC GAA CCG TCC TAC GTG CTG CGC GCG1301Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser Tyr Val Leu Arg Ala330 335 340CTG GGG CTG AAC GAC GAG CTG GCA CAT AGC TCT ATC CGT TTC TCT TTA1349Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser Ile Arg Phe Ser Leu345 350 355GGT CGT TTT ACT ACT GAA GAA GAG ATC GAC TAC ACC ATC GAG TTA GTT1397Gly Arg Phe Thr Thr Glu Glu Glu Ile Asp Tyr Thr Ile Glu Leu Val360 365 370CGT AAA TCC ATC GGT CGT CTG CGT GAC CTT TCT CCG CTG TGG GAA ATG1445Arg Lys Ser Ile Gly Arg Leu Arg Asp Leu Ser Pro Leu Trp Glu Met375 380 385TAC AAG CAG GGC GTG GAT CTG AAC AGC ATC GAA TGG GCT CAT CAT TAAACGCGTG 1500Tyr Lys Gln Gly Val Asp Leu Asn Ser Ile Glu Trp Ala His His390 395 400 405CTAGAGGCAT CAAATAAAAC GAAAGGCTCA GTCGAAAGAC TGGGCCTTTC GTTTTATCTG 1560TTGTTTGTCG GTGAACGCTC TCCTGAGTAG GACAAATCCG CCGCCCTAGA CCTAGGGGAT 1620ATATTCCGCT TCCTCGCTCA CTGACTCGCT ACGCTCGGTC GTTCGACTGC GGCGAGCGGA 1680AATGGCTTAC GAACGGGGCG GAGATTTCCT GGAAGATGCC AGGAAGATAC TTAACAGGGA 1740AGTGAGAGGG CCGCGGCAAA GCCGTTTTTC CATAGGCTCC GCCCCCCTGA CAAGCATCAC 1800GAAATCTGAC GCTCAAATCA GTGGTGGCGA AACCCGACAG GACTATAAAG ATACCAGGCG 1860TTTCCCCCTG GCGGCTCCCT CGTGCGCTCT CCTGTTCCTG CCTTTCGGTT TACCGGTGTC 1920ATTCCGCTGT TATGGCCGCG TTTGTCTCAT TCCACGCCTG ACACTCAGTT CCGGGTAGGC 1980AGTTCGCTCC AAGCTGGACT GTATGCACGA ACCCCCCGTT CAGTCCGACC GCTGCGCCTT 2040ATCCGGTAAC TATCGTCTTG AGTCCAACCC GGAAAGACAT GCAAAAGCAC CACTGGCAGC 2100AGCCACTGGT AATTGATTTA GAGGAGTTAG TCTTGAAGTC ATGCGCCGGT TAAGGCTAAA 2160CTGAAAGGAC AAGTTTTGGT GACTGCGCTC CTCCAAGCCA GTTACCTCGG TTCAAAGAGT 2220TGGTAGCTCA GAGAACCTTC GAAAAACCGC CCTGCAAGGC GGTTTTTTCG TTTTCAGAGC 2280AAGAGATTAC GCGCAGACCA AAACGATCTC AAGAAGATCA TCTTATTAAT CAGATAAAAT 2340ATTTCTAGAT TTCAGTGCAA TTTATCTCTT CAAATGTAGC ACCTGAAGTC AGCCCCATAC 2400GATATAAGTT GTTACTAGTG CTTGGATTCT CACCAATAAA AAACGCCCGG CGGCAACCGA 2460GCGTTCTGAA CAAATCCAGA TGGAGTTCTG AGGTCATTAC TGGATCTATC AACAGGAGTC 2520CAAGCGAGCT CTCGAACCCC AGAGTCCCGC TCAGAAGAAC TCGTCAAGAA GGCGATAGAA 2580GGCGATGCGC TGCGAATCGG GAGCGGCGAT ACCGTAAAGC ACGAGGAAGC GGTCAGCCCA 2640TTCGCCGCCA AGCTCTTCAG CAATATCACG GGTAGCCAAC GCTATGTCCT GATAGCGGTC 2700CGCCACACCC AGCCGGCCAC AGTCGATGAA TCCAGAAAAG CGGCCATTTT CCACCATGAT 2760ATTCGGCAAG CAGGCATCGC CATGGGTCAC GACGAGATCC TCGCCGTCGG GCATGCGCGC 2820CTTGAGCCTG GCGAACAGTT CGGCTGGCGC GAGCCCCTGA TGCTCTTCGT CCAGATCATC 2880CTGATCGACA AGACCGGCTT CCATCCGAGT ACGTGCTCGC TCGATGCGAT GTTTCGCTTG 2940GTGGTCGAAT GGGCAGGTAG CCGGATCAAG CGTATGCAGC CGCCGCATTG CATCAGCCAT 3000GATGGATACT TTCTCGGCAG GAGCAAGGTG AGATGACAGG AGATCCTGCC CCGGCACTTC 3060GCCCAATAGC AGCCAGTCCC TTCCCGCTTC AGTGACAACG TCGAGCACAG CTGCGCAAGG 3120AACGCCCGTC GTGGCCAGCC ACGATAGCCG CGCTGCCTCG TCCTGCAGTT CATTCAGGGC 3180ACCGGACAGG TCGGTCTTGA CAAAAAGAAC CGGGCGCCCC TGCGCTGACA GCCGGAACAC 3240GGCGGCATCA GAGCAGCCGA TTGTCTGTTG TGCCCAGTCA TAGCCGAATA GCCTCTCCAC 3300CCAAGCGGCC GGAGAACCTG CGTGCAATCC ATCTTGTTCA ATCATGCGAA ACGATCCTCA 3360TCCTGTCTCT TGATCAGATC TTGATCCCCT GCGCCATCAG ATCCTTGGCG GCAAGAAAGC 3420CATCCAGTTT ACTTTGCAGG GCTTCCCAAC CTTACCAGAG GGCGCCCCAG CTGGCAATTC 3480C 3481(2)SEQ ID NO12的信息(i)序列特征(A)長度404個氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO12Met Lys Leu Pro Ile Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp1 5 10 15Pro Arg Val Ala Glu Lys Met Met Gln Phe Met Thr Met Asp Gly Thr20 25 30Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gln Ala Glu35 40 45Glu Ala Val Asp Ile Ala Arg Asn Gln Ile Ala Asp Leu Val Gly Ala50 55 60Asp Pro Arg Glu Ile Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn65 70 75 80Leu Ala Ile Lys Gly Ala Ala Asn Phe Tyr Gln Lys Lys Gly Lys His85 90 95Ile Ile Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg100 105 110Gln Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gln Arg115 120 125Asn Gly Ile Ile Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp130 135 140Thr Ile Leu Val Ser Ile Met His Val Asn Asn Glu Ile Gly Val Val145 150 155 160Gln Asp Ile Ala Ala Ile Gly Glu Met Cys Arg Ala Arg Gly Ile Ile165 170 175Tyr His Val Asp Ala Thr Gln Ser Val Gly Lys Leu Pro Ile Asp Leu180 185 190Ser Gln Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys Ile Tyr195 200 205Gly Pro Lys Gly Ile Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val210 215 220Arg Ile Glu Ala Gln Met His Gly Gly Gly His Glu Arg Gly Met Arg225 230 235 240Ser Gly Thr Leu Pro Val His Gln Ile Val Gly Met Gly Glu Ala Tyr245 250 255Arg Ile Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly260 265 270Leu Arg Asn Arg Leu Trp Asn Gly Ile Lys Asp Ile Glu Glu Val Tyr275 280 285Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn Ile Leu Asn Val Ser290 295 300Phe Asn Tyr Val Glu Gly Glu Ser Leu Ile Met Ala Leu Lys Asp Leu305 310 315 320Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser325 330 335Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser340 345 350Ile Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu Ile Asp Tyr355 360 365Thr Ile Glu Leu Val Arg Lys Ser Ile Gly Arg Leu Arg Asp Leu Ser370 375 380Pro Leu Trp Glu Met Tyr Lys Gln Gly Val Asp Leu Asn Ser Ile Glu385 390 395 400Trp Ala His His
權(quán)利要求
1.一種用于制備生物素的方法,包括下列步驟在能夠合成生物素的原核或真核宿主生物體內(nèi)表達(dá)一種具有序列SEQ ID No.1或SEQID No.3的生物素基因及其功能性變體、類似物或衍生物;培養(yǎng)這種生物體并在分離生物量后或純化生物素后直接使用所述合成的生物素。
2.一種如權(quán)利要求1中所述的方法,其中權(quán)利要求1中所述生物素基因的表達(dá)導(dǎo)致去硫生物素向生物素的轉(zhuǎn)化提高。
3.一種如權(quán)利要求1或2中所述的方法,其中所述變體是這樣的變體,它在來源于權(quán)利要求1中所述序列的氨基酸水平上具有40-100%同源性的基因且該基因使得生物素合成的增加成為可能。
4.一種如權(quán)利要求1-3中任意一項中所述的方法,其中所用的宿主生物體是一種選自下列屬組成的組中的生物體埃希氏桿菌屬、檸檬桿菌屬、沙雷氏菌屬、克雷白氏桿菌屬、沙門氏菌屬、假單胞菌屬、叢毛單胞菌屬、不動桿菌屬、固氮桿菌屬、色桿菌屬、芽孢桿菌屬、梭狀芽孢桿菌屬、節(jié)桿菌屬、棒狀桿菌屬、短桿菌屬、乳球菌屬、乳芽孢桿菌屬、鏈霉菌屬、根瘤菌屬、土壤桿菌屬、葡萄球菌屬、紅酵母屬、擲孢酵母屬、Yarrowia、裂殖糖酵母屬或糖酵母屬。
5.一種如權(quán)利要求1-4中任意一項所述的方法,其中將一種生物素調(diào)節(jié)缺損型突變體用作宿主生物體。
6.一種如權(quán)利要求1-5中任意一項所述的方法,其中在原核或真核宿主生物體內(nèi)存在著如權(quán)利要求1中所述生物素基因的至少一個拷貝的單獨表達(dá)或與至少一種其它生物素基因的一個或多個拷貝一起表達(dá),所述的其它生物素基因選自下列基因組成的組bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY或bioR。
7.一種包括具有SEQ ID No.1或SEQ ID No.3的生物素基因及其功能性變體、類似物或衍生物的基因構(gòu)建體,其中將其有效地上與一種或多種調(diào)節(jié)信號連接以增加基因的表達(dá)和/或蛋白質(zhì)的表達(dá)和/或已經(jīng)將其自然調(diào)節(jié)阻斷。
8.一種如權(quán)利要求7中所述的基因構(gòu)建體,其中將其插入適合于在原核或真核宿主生物體內(nèi)表達(dá)所述基因的載體中。
9.一種如權(quán)利要求7或8中所述的基因構(gòu)建體,其中如權(quán)利要求7中所述的生物素基因在所述載體內(nèi)以一個或多個拷貝與至少一種其它基因的一個或多個拷貝同時存在,所述的其它基因選自下列基因組成的組bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY或bioR。
10.一種包括如權(quán)利要求7-9中任意一項所述基因構(gòu)建體的生物體。
11.一種如權(quán)利要求1中所述的序列用于制備生物素的用途。
12.一種如權(quán)利要求7-9中任意一項所述基因構(gòu)建體用于制備生物素的用途。
全文摘要
本發(fā)明描述了一種包括具有序列SEQ ID No.1或SEQ ID No.3的生物素基因的基因構(gòu)建體、含有這種基因構(gòu)建體的生物體、這些序列或所述基因構(gòu)建體用于制備生物素的用途以及一種用于制備生物素的方法。
文檔編號C12N5/10GK1265147SQ98807467
公開日2000年8月30日 申請日期1998年7月2日 優(yōu)先權(quán)日1997年7月22日
發(fā)明者H·施勒德爾, B·豪爾 申請人:Basf公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
清流县| 新巴尔虎左旗| 佛冈县| 民和| 文山县| 华池县| 潍坊市| 息烽县| 资源县| 贵溪市| 惠来县| 岑溪市| 绍兴县| 若羌县| 白河县| 仪陇县| 临湘市| 来凤县| 阿拉善右旗| 巴中市| 巨鹿县| 沂南县| 广南县| 黄平县| 资溪县| 本溪| 平阴县| 青川县| 前郭尔| 盐亭县| 交口县| 德州市| 土默特右旗| 五家渠市| 榆林市| 山丹县| 伊春市| 元谋县| 杭锦后旗| 巍山| 焉耆|