專利名稱:曲霉屬膽色素原合酶和編碼該酶的核酸的制作方法
技術領域:
本發(fā)明涉及曲霉屬膽色素原合酶和包含編碼膽色素原合酶的核酸序列的分離核酸片段。本發(fā)明也涉及核酸構建體、載體和包含該核酸序列的宿主細胞以及產(chǎn)生該膽色素原合酶的方法。
相關技術描述血紅素(一種原卟啉IX和鐵的螯合物)用作為血紅素蛋白的輔基。原卟啉IX由為四個甲基、兩個乙烯基和兩個丙酸基團所取代的卟啉環(huán)組成,該卟啉環(huán)獲得一個鐵原子以形成血紅素。由甘氨酸和琥珀酰-CoA生物合成血紅素包括八個酶促步驟。該途徑中的第二種酶是膽色素原合酶(也稱為乙酰丙氨酸脫水酶),該膽色素原合酶催化兩個5-乙酰丙氨酸分子的縮合而形成膽色素原。膽色素原合酶在粗糙脈孢菌和釀酒酵母的血紅素生物合成途徑中是限速酶。
從脫輔基蛋白質到血紅素蛋白的轉化取決于血紅素生物合成途徑所提供的血紅素的可用性。脫輔基蛋白質形式的血紅素蛋白與血紅素結合產(chǎn)生活性血紅素蛋白?;钚匝t素蛋白獲得一種構象,該構象使血紅素蛋白比受蛋白水解作用的脫輔基蛋白質更穩(wěn)定。如果微生物產(chǎn)生的血紅素量遠小于產(chǎn)生的脫輔基蛋白質量,那么脫輔基蛋白質將積累并經(jīng)過蛋白水解降解降低活性血紅素蛋白的產(chǎn)率。
為了克服這一問題,Jensen顯示把血紅素或者含血紅素材料添加至發(fā)酵培養(yǎng)基,可導致米曲霉的過氧化物酶產(chǎn)率的大量增加(WO93/19195)。當血紅素添加至發(fā)酵培養(yǎng)基時,可導致血紅素蛋白產(chǎn)率的很大提高,但大規(guī)模實行起來卻不合適,而且很昂貴、很困難。
得自釀酒酵母的膽色素原合酶基因的克隆與表達已經(jīng)公開(Labbe-Bois和Labbe,1990,In,Dailey,H.A.,編輯,血紅素和葉綠素的生物合成,McGraw-Hill,Inc.,紐約,258頁)。
本發(fā)明的目的是提供新的膽色素原合酶和編碼該酶的基因。
發(fā)明概要本發(fā)明涉及得自曲霉屬的基本上純化的膽色素原合酶和包含編碼曲霉屬膽色素原合酶的核酸序列的分離核酸片段。本發(fā)明還提供了核酸構建體、載體和包含本發(fā)明的核酸片段的重組宿主細胞以及產(chǎn)生膽色素原合酶的方法。
附圖簡要描述
圖1顯示質粒pAJ005-1的限制性酶切圖。
圖2顯示米曲霉膽色素原合酶基因的核苷酸與推定的氨基酸序列(分別見SEQ ID NO1和2)。有下劃線的是CAAT盒,方框里的是TATA盒。用點線標明的是推定的內含子,用虛線標明的是推定的鋅指結構域。文庫探針用黑色實線標明,圈起來的是活性賴氨酸。
圖3顯示得自枯草芽孢桿菌、大腸桿菌、人、豌豆、大鼠、菠菜、酵母和米曲霉的膽色素原合酶的推定氨基酸序列(分別見SEQ ID NO22、20、18、21、19、23、17和2)的對比。
圖4顯示pAJ023的限制性酶切圖。
圖5顯示質粒pJVi9的構建。
圖6顯示質粒pJeRS6的限制性酶切圖。
圖7顯示質粒pJRoC50的限制性酶切圖。
發(fā)明的詳細描述如上所述,本發(fā)明涉及得自曲霉菌株的膽色素原合酶,例如得自包括但不限于以下曲霉的菌株的膽色素原合酶臭曲霉、日本曲霉、構巢曲霉、黑曲霉和米曲霉。公眾很容易從一些培養(yǎng)物保藏中心獲取這些物種的菌株,如美國典型培養(yǎng)物保藏中心(ATCC)、聯(lián)邦德國微生物保藏中心(DSM)、荷蘭真菌菌種保藏中心(CBS)、國際微生物研究所(IMI)、農(nóng)業(yè)研究機構專利培養(yǎng)物保藏中心、北方地區(qū)研究中心(NRRL)以及日本大阪發(fā)酵研究所(IFO)。
在一優(yōu)選的實施方案中,本發(fā)明涉及得自曲霉的膽色素原合酶。在一更優(yōu)選的實施方案中,本發(fā)明涉及得自米曲霉的膽色素原合酶。在一最優(yōu)選的實施方案中,本發(fā)明涉及得自米曲霉IFO4177或者其突變體菌株的膽色素原合酶,例如具有SEQ ID NO2中描述的氨基酸序列的膽色素原合酶。
本發(fā)明也涉及為在高度嚴格條件下(即在45℃條件下,在5X SSPE、0.3%SDS、200μg/ml的剪切和變性鮭精DNA以及50%甲酰胺中進行預雜交和雜交)能夠與探針雜交的核酸序列所編碼的膽色素原合酶,所說的探針在相同條件下與SEQ ID NO1描述的核酸序列雜交。該基因或基于它的寡核苷酸可以在Southern雜交中用作為探針來分離任一曲霉屬物種的同源基因。特別是,這樣的探針可用于按照標準Southern印跡過程與所感興趣物種的基因組或cDNA雜交,以便鑒定并分離其中相應的膽色素原合酶基因。簡并的PCR引物(寡核苷酸)與基因組DNA或cDNA片段可一起用來擴增膽色素原合酶特異性基因片段。
得自不同于那些本文具體舉例說明的來源的膽色素原合酶基因的鑒定和分離,可通過利用本例子所描述的方法,用公眾可獲得的曲霉菌株來完成。
對于本發(fā)明來說,術語″得自″意指膽色素原合酶由特定來源(例如曲霉菌株)或者由得自該來源的編碼膽色素原合酶的基因已插入其中的細胞產(chǎn)生。
本發(fā)明也包含膽色素原合酶變體,其與SEQ ID NO2所描述的氨基酸序列有至少大約50%、優(yōu)選大約55%、更優(yōu)選大約60%、甚至更優(yōu)選大約65%,以及甚至優(yōu)選大約70%、更優(yōu)選大約75%、甚至更優(yōu)選大約80%、最優(yōu)選大約85%、甚至最優(yōu)選大約90%、最最優(yōu)選大約95%的同源性,并且其定性地保持這里所描述的膽色素原合酶活性。本發(fā)明也涉及膽色素原合酶變體,該變體的氨基酸序列與SEQ ID NO2所描述的氨基酸序列有三個氨基酸(優(yōu)選地有兩個氨基酸、更優(yōu)選地有一個氨基酸)不同。每一種差異可能是氨基酸的插入或者缺失或者不同氨基酸對氨基酸殘基的取代。以上定義的分類范圍內的有用變體包括,例如那些在其中已進行了保守氨基酸取代的變體,該取代作用并不嚴重影響蛋白質的活性。保守替換意味著相同種類的氨基酸可能被同類的另一氨基酸取代。例如非極性脂肪族殘基Ala、Val、Leu和Ile可能進行相互取代,堿性殘基Lys和Arg,或者酸性殘基Asp和Glu也可能進行相互取代。同樣地,Ser和Thr進行相互地保守替換,Asn和Gln也一樣。
利用本領域已知的各種技術可確定本發(fā)明的膽色素原合酶的物理化學性質,這些技術包括但不限于SDS-PAGE、等電聚焦以及交叉反應免疫鑒定檢驗方法。本發(fā)明的膽色素原合酶可利用本領域已知的方法分析。
本發(fā)明的膽色素原合酶可由本領域已知的各種方法純化,這些方法包括但不限于層析法(例如離子交換法、親和法、疏水法、層析聚焦法以及大小排阻法)、電泳法(例如制備性等電點聚焦)、差別溶解法(例如硫酸銨沉淀)或者抽提法(參見,例如蛋白質純化,編者J.-C.Janson和LarsRyden,VCH出版社,紐約,1989)。如本文所定義的,″基本上純化的″膽色素原合酶是指本質上無其它非膽色素原合酶蛋白質的膽色素原合酶,例如由SDS-PAGE所確定的純度為至少大約20%,優(yōu)選為大約40%,更優(yōu)選為大約60%,甚至更優(yōu)選為大約80%,最優(yōu)選為大約90%,甚至最優(yōu)選為至少大約95%。
本發(fā)明也涉及包含編碼本發(fā)明的膽色素原合酶的核酸序列的核酸片段和包含本發(fā)明核酸片段的核酸構建體。
在一優(yōu)選的實施方案中,核酸序列編碼得自曲霉的膽色素原合酶。在一更優(yōu)選的實施方案中,核酸序列編碼得自米曲霉的膽色素原合酶。在最為優(yōu)選的實施方案中,核酸序列編碼得自米曲霉IFO4177的膽色素原合酶,例如SEQ ID NO1所描述的核酸序列。本發(fā)明也涉及編碼膽色素原合酶的核酸序列,該膽色素原合酶具有SEQ ID NO2所描述的氨基酸序列,這種序列以其遺傳密碼的簡并而區(qū)別于SEQ ID NO1中描述的氨基酸序列。本發(fā)明的核酸序列既包含本文中所描述的基因組序列及對應的cDNA與RNA序列,也包含本文所使用的術語“核酸序列”(其在本文中將理解為包含包括合成DNA在內的所有這類變體)。
本發(fā)明也涉及包含本發(fā)明核酸片段的核酸構建體。一般將“核酸構建體”理解為意指一個單鏈或者雙鏈的核酸分子,該核酸分子從天然存在的基因中分離或者經(jīng)修飾而含有核酸的片段,這種核酸片段以實際上并不存在的方式組合和并列。在一優(yōu)選的實施方案中,將該核酸構建體與能夠指導膽色素原合酶在合適表達宿主中表達的調節(jié)區(qū)可操作地連接。
本發(fā)明也提供了包含本發(fā)明核酸構建體的重組載體。在一較優(yōu)選的實施方案中,將核酸序列可操作地連接于啟動子序列上。在另一較優(yōu)選的實施方案中,本發(fā)明的載體還包含轉錄終止信號和/或選擇性標記。
本發(fā)明的重組載體有益于以活性形式表達曲霉屬膽色素原合酶基因。有用的載體包含一元件(使載體能夠穩(wěn)定整合進入宿主細胞基因組或者使載體能夠獨立于宿主細胞基因組在宿主細胞中進行自我復制)以及優(yōu)選的是包含一或多個表型標記(使轉化的宿主細胞易于選擇)。載體也可以包括控制序列(如啟動子)、核糖體結合位點、翻譯起始信號以及選擇性地包括可選擇性標記或各種激活物或阻抑序列。為了使所表達的蛋白質能夠分泌,可將編碼信號序列的核酸插入該基因的編碼序列之前。對于控制序列指導下的表達,以一定方法使將要按照本發(fā)明使用的膽色素原合酶基因可操作地連接于控制序列上,通過這一方法可在與控制序列相容的條件下完成對編碼序列的表達。
攜帶本發(fā)明的核酸構建體的載體可以是便于經(jīng)受重組DNA過程的任何載體。對載體的選擇典型地取決于載體將要引入其中的宿主細胞。載體可以是能夠進行自我復制的載體(即作為染色體外實體存在的載體,其復制獨立于染色體復制),例如質粒、染色體外元件、微型染色體或者人工染色體。可選擇地,載體可以是這樣一種載體,當將它引入宿主細胞時,其被整合進入宿主細胞基因組并與其已整合進入的染色體一道復制。載體系統(tǒng)可以是單個載體或質粒,或者是兩個或多個載體或質粒(共同包含將要整合進入基因組的整個DNA)。
在載體中,DNA序列應該可操作地連接于合適的啟動子序列上。啟動子可以是任何在所選擇的宿主細胞中顯示轉錄活性的DNA序列,并且其可以得自編碼宿主細胞的同源或者異源蛋白質的基因。用于指導本發(fā)明核酸構建體轉錄的合適啟動子的例子(尤其是在細菌宿主中)是大腸桿菌乳糖操縱子的啟動子、天藍色鏈霉菌瓊脂糖酶基因dagA啟動子、地衣芽孢桿菌α-淀粉酶基因(amyL)啟動子、嗜熱脂肪芽孢桿菌產(chǎn)麥芽糖淀粉酶基因(amyM)的啟動子、解淀粉芽孢桿菌α-淀粉酶(amyQ)啟動子、枯草芽孢桿菌xylA和xylB基因啟動子、原核β-內酰胺酶啟動子(Villa-Kamaroff等,1978,美國國家科學院院報753727-3731)或者tac啟動子(DeBoer等,1983,美國國家科學院院報8021-25)。另外一些啟動子描述在以下文獻中“來自重組細菌的有用蛋白質”,美國科學,1980,24274-94;和Sambrook等,分子克隆,實驗室手冊,第二版,冷泉港,紐約,1989。在酵母宿主中,有用啟動子是eno-l啟動子。對于在真菌宿主中的轉錄,有用啟動子的例子是得自編碼以下蛋白質的基因的啟動子米曲霉TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩(wěn)定性α-淀粉酶、黑曲霉或者泡盛曲霉葡糖淀粉酶(glaA)、Rhizomucor miehei脂肪酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構酶或者構巢曲霉乙酰胺酶。優(yōu)選的啟動子是TAKA淀粉酶、NA2-tpi以及glaA啟動子。
本發(fā)明的載體也可以包含合適的轉錄終止子和在真核細胞中與編碼本發(fā)明膽色素原合酶的DNA序列可操作地連接的聚腺苷酸化序列。終止子和聚腺苷酸化序列與啟動子具有相同的來源。載體還可包含能夠使載體在所討論的宿主細胞中進行復制的DNA序列。這種序列的例子有質粒pUC19、pACYC177、pUB110、pE194、pAMB1以及pIJ702的復制起點。
優(yōu)選的本發(fā)明載體含有一個或多個便于選擇轉化細胞的選擇性標記。選擇性標記是一種基因,其產(chǎn)物具有殺生物劑抗性或病毒抗性、對重金屬的抗性和從原養(yǎng)型變?yōu)闋I養(yǎng)缺陷型及其類似情況。選擇性標記可選自但不限于由以下物質組成的組中amdS、pyrG、argB、niaD、sC、trpC、bar和hygB。優(yōu)選用于曲霉細胞中的是構巢曲霉或者米曲霉的amdS和pyrG標記以及吸水鏈霉菌的bar標記。此外,可通過共轉化作用完成選擇,例如正如在WO91/17243中所描述的一樣(其中選擇性標記包含在一單個載體中)。
本發(fā)明的優(yōu)選載體也包含信號肽編碼區(qū),其編碼與血紅素生物合成酶的氨基末端連接的氨基酸序列,從而使膽色素原合酶得以定位于特定的細胞區(qū)室。信號肽編碼區(qū)可以天然地存在于編碼膽色素原合酶的第一核酸序列中或者得自外源。第一核酸序列的編碼序列的5’端可以固有地包含信號肽編碼區(qū),其在翻譯讀框中自然地與編碼定位的膽色素原合酶的編碼區(qū)的片段連接。此外,編碼序列的5’端可包含編碼信號肽編碼區(qū)的核酸,該信號肽編碼區(qū)對于編碼定位的膽色素原合酶的編碼序列的部分來說是屬于外源的。信號肽編碼區(qū)可得自粗糙脈孢菌ATP酶基因(Viebrock等,1982,EMBO雜志1565-571)或者釀酒酵母細胞色素C過氧化物酶基因(Kaput等,1982,生物化學雜志25715054-15058)。然而,能夠使5-乙酰丙氨酸合酶定位于選擇的絲狀真菌宿主中的任何信號肽編碼區(qū)都可用于本發(fā)明。
為了避免破壞細胞來獲得所表達的膽色素原合酶的必要性,以及最大限度地減少細胞內的所表達的膽色素原合酶的可能降解的量,優(yōu)選的是膽色素原合酶基因的表達產(chǎn)生細胞外分泌的產(chǎn)物。就這一目的而言,本發(fā)明的膽色素原合酶可因此包含使所表達的蛋白質得以分泌到培養(yǎng)基中的前區(qū)。如果需要,這一前區(qū)可以天然存在于本發(fā)明的膽色素原合酶中或者為不同的前區(qū)或信號序列所取代(方便地由編碼各自前區(qū)的DNA序列的取代來完成)。例如,前區(qū)可得自葡糖淀粉酶或曲霉物種的淀粉酶基因、芽孢桿菌物種的淀粉酶基因、Rhizomucor miehei的脂肪酶或蛋白酶基因、釀酒酵母的α-因子基因或小牛前凝乳酶原基因。更優(yōu)選的是米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、芽孢桿菌NCIB11837的產(chǎn)麥芽糖淀粉酶、嗜熱脂肪芽孢桿菌α-淀粉酶或者地衣芽孢桿菌枯草桿菌蛋白酶的前區(qū)。真菌宿主的有效信號序列是米曲霉TAKA淀粉酶信號、Rhizomucor miehei天冬氨酸蛋白酶信號或者Rhizomucor miehei脂肪酶信號。
對于本領域的普通技術人員來說,用于連接本發(fā)明的核酸構建體、啟動子、終止子和其它元件的方法以及把這些元件插入包含必要復制信息的合適載體中的方法都是已知的(例如,參見Sambrook等,見上)。
本發(fā)明也涉及包含本發(fā)明的核酸構建體或者表達載體的宿主細胞,這些核酸構建體或者表達載體有益地用于本發(fā)明膽色素原合酶的重組產(chǎn)生過程。細胞可經(jīng)本發(fā)明的核酸構建體轉化,該核酸構建體方便地整合進入宿主染色體中。一般視該整合作用為優(yōu)點,因為該序列更可能穩(wěn)定地存在于細胞中。例如通過同源或異源重組,按照常規(guī)方法可完成構建體進入宿主染色體的整合?;蛘呒毎捎扇缦旅枋龅谋磉_載體(與不同類型宿主細胞關連的)轉化。
宿主細胞和載體的選擇在很大程度上取決于膽色素原合酶和它的來源。宿主細胞可從原核細胞中選擇,如細菌細胞。合適的細菌例子是格蘭氏陽性細菌、諸如枯草芽孢桿菌、地衣芽孢桿菌、遲緩芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、嗜堿性芽孢桿菌、解淀粉芽孢桿菌、凝結芽孢桿菌、環(huán)狀芽孢桿菌、燦爛芽孢桿菌、巨大芽孢桿菌、蘇云金芽孢桿菌、淺青紫鏈霉菌、鼠灰鏈霉菌或者格蘭氏陰性細菌(如大腸桿菌)。通過例如原生質體轉化或者通過以本領域已知的方式利用感受態(tài)細胞,可以實現(xiàn)細菌的轉化。
宿主細胞優(yōu)選如哺乳動物細胞、昆蟲細胞、植物細胞的真核細胞,或者優(yōu)選包括酵母和絲狀真菌的真菌細胞。例如,有用的哺乳動物細胞包括CHO或者COS細胞。酵母宿主細胞可選自酵母屬或裂殖酵母屬的物種,例如釀酒酵母。有用的絲狀真菌可選自曲霉屬的物種,例如米曲霉或黑曲霉。此外,鐮刀菌屬物種的菌株(如尖鐮孢或禾谷鐮孢)可以用作為宿主細胞。真菌細胞可由包括利用本領域已知方式的原生質體形成、原生質體轉化和細胞壁再生在內的方法來轉化。曲霉宿主細胞的轉化的合適方法已在EP238023中進行了描述。鐮刀菌屬物種轉化的合適方法由Malardier等,1989,基因78147-156描述或者描述在共同懸而未決的美國系列號08/269,449中。
在一特別優(yōu)選的實施方案中,膽色素原合酶基因的表達在真菌宿主細胞(如曲霉)中完成。將膽色素原合酶基因連接到優(yōu)選包含米曲霉TAKA淀粉酶啟動子或者黑曲霉中性淀粉酶NA2啟動子和amdS或pyrG作為選擇性標記的質粒中。此外,選擇性標記可以在一單個質粒上并用于共轉化中。按照Yelton等,1984,美國國家科學院院報811470-1474中所描述的方法,質粒用來轉化如米曲霉或者黑曲霉的曲霉屬物種宿主細胞。
本發(fā)明也涉及產(chǎn)生本發(fā)明的膽色素原合酶的方法,該方法包括(a)在營養(yǎng)培養(yǎng)基中培養(yǎng)曲霉菌株以產(chǎn)生膽色素原合酶,以及(b)回收膽色素原合酶。
本發(fā)明也涉及重組產(chǎn)生本發(fā)明的膽色素原合酶的方法,該方法包括(a)培養(yǎng)包含核酸構建體的宿主細胞,該核酸構建體包含在有助于酶生成的條件下編碼膽色素原合酶的核酸序列,以及(b)回收膽色素原合酶。如果表達系統(tǒng)分泌膽色素原合酶進入發(fā)酵培養(yǎng)基中,那么可直接從培養(yǎng)基中回收該酶。如果沒有分泌重組膽色素原合酶,則從細胞溶胞產(chǎn)物中回收膽色素原合酶。
可利用本領域已知的任何培養(yǎng)細胞方法實現(xiàn)對本發(fā)明膽色素原合酶的表達或者分離。例如,可將培養(yǎng)過程理解為包含搖瓶培養(yǎng)、在實驗室或者工業(yè)發(fā)酵罐中在合適培養(yǎng)基中和在一定條件(使該膽色素原合酶得以表達和分離)下完成的小或大規(guī)模發(fā)酵(包括連續(xù)的、成批的、分批補料的或固態(tài)的發(fā)酵)。利用本領域已知的方法在合適的營養(yǎng)培養(yǎng)基(包含碳和氮源及無機鹽)中進行培養(yǎng)(參見,例如Bennett,J.W.和LaSure,L.編輯,真菌中的多基因操縱,科學院出版社,加拿大,1991)。合適的培養(yǎng)基可由商家提供或者按照公開的組成(例如在美國典型培養(yǎng)物保藏中心的目錄中)制備。
由包括但不限于離心、過濾、噴霧干燥、蒸發(fā)或者沉淀的常規(guī)方法,可從發(fā)酵培養(yǎng)基中回收用上述方法產(chǎn)生的膽色素原合酶。然后由例如離子交換層析、凝膠過濾層析、親和性層析或者類似方法的各種層析方法可以進一步純化所回收的蛋白質。
本發(fā)明也涉及利用膽色素原合酶的方法。
通過在宿主細胞中超表達編碼膽色素原合酶的核酸序列,本發(fā)明的膽色素原合酶可用來增加由宿主細胞產(chǎn)生的血紅素蛋白的產(chǎn)率,其中的膽色素原合酶在宿主細胞中血紅素產(chǎn)生過程中是一限速步驟。該方法包括(a)引入到宿主細胞中,該宿主細胞能夠產(chǎn)生血紅素蛋白、一或多個編碼膽色素原合酶的核酸序列拷貝,其中的核酸序列可操作地連接到能夠指導膽色素原合酶表達的調節(jié)區(qū)上;
(b)在適合于產(chǎn)生血紅素蛋白和膽色素原合酶的營養(yǎng)培養(yǎng)基中培養(yǎng)細胞;以及(c)從上述細胞的營養(yǎng)培養(yǎng)基中回收血紅素蛋白。
下列例子進一步描述本發(fā)明,但這些例子并不構成限制本發(fā)明的范圍。
實施例實施例1米曲霉菌株A1560基因組DNA提取在32℃和250rpm條件下使米曲霉菌株A1560(IFO 4177)在25ml的0.5%酵母提取液-2%葡萄糖(YEG)培養(yǎng)基中生長24小時。然后由通過Miracloth(Calbiochem,La Jolla,加拿大)的過濾收集菌絲體,并用25ml的10mM Tris-1 mM EDTA(TE)緩沖液洗滌一次。從菌絲體中排出過量緩沖液,隨后將菌絲體凍結于液氮中。在電動咖啡研磨機上將凍結的菌絲體研磨成精細粉末,并將粉末加入在一次性塑料離心管中的20ml TE緩沖液和5ml的20%w/v十二烷基硫酸鈉(SDS)中。和緩地倒轉混合物幾次以確?;旌暇鶆?,用相同體積的苯酚∶氯仿∶異戊醇(25∶24∶1 v/v/v)混合液提取兩次。加入乙酸鈉(3M溶液)至終濃度為0.3 M,其后加入2.5倍體積的用冰預冷的乙醇來沉淀核酸。然后通過在15,000xg下離心該管30分鐘使核酸成粒狀沉淀。在重懸浮于0.5ml的TE緩沖液中之前,使粒狀沉淀風干30分鐘。加入無DNA酶的核糖核酸酶A至濃度為100μg/ml并在37℃條件下溫育混合物30分鐘。然后加入濃度為200μg/ml的蛋白酶K并在37℃條件下再溫育混合物一小時。最后,在如前述的用乙酸鈉和乙醇沉淀DNA之前,用苯酚∶氯仿∶異戊醇(25∶24∶1 v/v/v)提取混合物兩次。使DNA粒狀沉淀在真空下干燥、重懸浮于TE緩沖液中、并在4℃條件下保存直到進一步利用。
實施例2通過PCR的基因組hemB探針的產(chǎn)生基于側接米曲霉126bp hemB片段的氨基酸序列(Jesper Vind,1994,博士論文,丹麥,哥本哈根,哥本哈根大學)以及酵母和人hemB克隆的同源區(qū)(Myers等,1987,生物化學雜志26216822-16829;Wetmur等,1986,美國國家科學院院報837703-7707),設計簡并PCR引物。寡核苷酸引物利用應用生物系統(tǒng)394型DNA/RNA合成儀合成。將有義5′-GT(AGCT)GC(AGCT)CC(AGCT)(AT)(CG)(AGCT)GA(CT)ATGATGGA-3′(SEQ ID NO3)和反義5′-GC(AG)TC(AGCT)CG/T(AG)AA(AGCT)CC(AG)TA-3′(SEQ ID NO4)引物用于利用pJVi 60(Vind,1994,見上)作為模板來PCR擴增hemB片段。PCR反應物(50μl)由10mM Tris-HCl pH8.3,50mM KCl,1.5mM MgCl2,0.01%w/v明膠,各200μM的dATP、dCTP、dGTP和dTTP,500ng的pJVi 60以及50 pmol的上述各PCR引物組成。上述反應物在95℃下溫育3分鐘并冷卻至80℃。然后加入5個單位的Taq聚合酶。在設定為35個循環(huán)的Perkin-Elmer 9600熱循環(huán)儀中溫育該反應物,其中每一循環(huán)為95℃下30秒、45℃下1分鐘及72℃下1分鐘。在最后一循環(huán)后接著在72℃條件下溫育反應物5分鐘。預計的126bphemB PCR產(chǎn)物克隆進入pCRII載體,從而產(chǎn)生質粒pAJ005-1(圖1)。
實施例3米曲霉菌株A1560 DNA文庫和膽色素原合酶(hemB)克隆的鑒定利用作為宿主(用于平板培養(yǎng)和純化重組噬菌體)的大腸桿菌Y1090ZL細胞和用于切除個體pZL1-hemA克隆的大腸桿菌DH10Bzip,按照廠商的指導利用噬菌體克隆載體λZipLox(生命技術,Gaithersburg,MD)來構建米曲霉菌株A1560基因組DNA文庫。用Tsp509I部分地消化以如實施例1中描述的方法制備的全部細胞DNA,并用50mM Tris-50 mM硼酸鹽-1mM乙二胺四乙酸二鈉(TBE)緩沖液在1%瓊脂糖凝膠上對其進行大小分級分離。切除在4-7kb大小范圍內遷移的DNA片段,并利用Prep-a-Gene試劑(BioRad實驗室,Hercules,加拿大)將其從凝膠上洗脫。將洗脫的DNA片段與EcoRI切割的并脫磷酸的λZipLox載體臂連接,利用商業(yè)包裝提取物(Stratagene,La Jolla,加拿大)把連接混合物包裝起來。在大腸桿菌Y1090ZL細胞中平板培養(yǎng)和擴增包裝的DNA文庫。未擴增的基因組文庫包含1×106pfu/ml。
將得自大約8×104噬斑的噬菌體DNA轉移以復制環(huán)狀Nytran Plus膜(Schleicher&Schuell,Keene,NH),并用32P標記的PCR產(chǎn)物進行探測,該PCR產(chǎn)物按照Mertz和Rashtchian(1994,分析生物化學221160-165)的方法通過擴增pAJ005-1的hemB片段(參見例2)而得到。擴增反應物(50μl)包含下列組分10mM Tris-HCl pH8.3,50mMKCl,1.5mM MgCl2,0.01%(w/v)明膠,各0.04mM的dATP、dCTP、dGTP及dTTP,5μl的32P-dCTP(3000 Ci/mmole,3.3μM;Amersham,Arlington Heigths,IL)以及各50pmole的有義引物5’-GTGGCTCCGAGTGATAT-3’(SEQ ID NO5)和反義引物5’-GCATCGCGAAAAGGACCG-3’(SEQ ID NO6)。將反應物加熱到95℃并保持3分鐘,隨后加入5個單位的Taq聚合酶。然后在設定為30個循環(huán)的Perkin-Elmer熱循環(huán)儀中溫育該反應物,其中每一循環(huán)為95℃下1分鐘,55℃下1分鐘以及72℃下1分鐘。使反應溶液通過葡聚糖凝膠G50柱(Pharmacia,Alameda,加拿大)以除去未摻入的核苷酸,隨后使其變性并將其加入到雜交緩沖液中。在雜交緩沖液中加入變性探針(106cpm/ml),并用預雜交膜溫育一夜。在5X SSC,50mM磷酸鈉pH7,5X Denhardt溶液,0.1%(w/v)SDS,5mM EDTA pH8,10μg/mL變性鮭精DNA以及50%甲酰胺中,在42℃條件下進行預雜交和雜交。在42℃的0.1X SSC,0.1%SDS溶液中將膜洗滌四次(共15分鐘)。第二次篩選給出陽性信號的主要噬斑,并按照廠商的指導對其進行純化。按照廠商的指導(Bethesda研究實驗室,Inc.,Bethesda,MD)從作為pZL衍生物的λZipLox載體中切除產(chǎn)生陽性信號的10個基因組克隆,以及按照Hattori及Sakaki的方法(1986,分析生物化學152232-237)測序。指定pZL衍生物為pAJ007-1直至pAJ007-10。大腸桿菌DH5αpAJ007-6克隆包含基于限制酶切圖的3.7kb的基因組片段,并且對它進行了進一步分析。
實施例4膽色素原合酶(hemB)基因的表征按照實施例2所描述的方法對實施例2所描述的大腸桿菌DH5αpAJ007-6進行了DNA測序。
克隆的米曲霉A1560 hemB基因的核苷酸序列顯示出如圖2(SEQ IDNO1)所示的1308核苷酸的開放讀框,該開放讀框編碼如圖2(SEQ IDNO2)所示的具有40kDa預計分子量的374氨基酸多肽。上述核苷酸序列包含一個由剪接位點共有序列側連的48bp推定內含子,并包含由有關文獻(Unkles,1992,絲狀真菌的應用分子遺傳學,第2章,J.R.Kinghorn和G.Turner,編輯,Blackie Academic and ProfessionalPublications)所預計的內部共有序列。3’剪接位點(TAG)定位于Met下游的254 bp處,5’剪接位點(GTCCGC)定位于3’剪接位點上游的46bp處,內部共有序列(TCTAAC)定位于5’剪接位點下游的30bp處。5’非翻譯區(qū)在-377和-233位包含兩個CAAT基元,其可在轉錄調節(jié)中起重要的作用(Gurr等,1987,見上)。另外,在3’非翻譯區(qū)(-117、-208、-650)發(fā)現(xiàn)幾個推定的TATA樣盒。正如所料,hemB在N未端似乎并不包含前導序列,這是由于它在除植物以外的其它有機體中屬于胞質所致(Bottemley和Muller-Eberhard,1988,血液學報告25282-302)。
圖3中顯示的是米曲霉hemB基因(SEQ ID NO2)與其它hemB基因的氨基酸序列對比。來自酵母(SEQ ID NO17;Myers等,1987,見上)、人(SEQ ID NO18;Wetmur等,1986,見上)、大鼠(SEQ IDNO19;Bishop等,1989,核酸研究1410115)和大腸桿菌(SEQ IDNO20;Li等,2989,基因75177-184)的推定hemB氨基酸序列分別有63%、55%、55%和40%完全等同于米曲霉hemB氨基酸序列。來自豌豆(SEQ ID NO21;Bsese等,1991,生物化學的雜志26617060-17066)、枯草芽孢桿菌(SEQ ID NO22;Hansson等,1991,細菌學雜志1732590-2599)和菠菜(SEQ ID NO23;Scharmburg和Schneider-Poetsch,1991,EMBL數(shù)據(jù)文庫)的推定hemB氨基酸序列具有較小的相似度(分別為40%、39%和33%的等同性)。然而,由于豌豆和菠菜hemB氨基酸序列含有N端葉綠體信號序列,如果將它們作為成熟多肽進行對比,那么它們與米曲霉hemB序列的相似性將明顯增加?;谶@些序列對比,米曲霉hemB的活性賴氨酸位點定位在299氨基酸處(Jaffe,1995,生物能和生物膜雜志27169-179),并且如Berg(1986,自然319264-265)所預測的保守鋅指樣結構域定位于氨基酸166-180處。有人認為鋅指通過結合Zn2+而在活性部位阻止巰基的氧化(Jaffe,1995,見上)。有人提出在植物hemB中的對應結構域結合Mg2+而非Zn2+(Bsese等,1991,見上)。令人感興趣的是,hemB指結構域的第一個殘基是Thr(在位置166),其對于植物金屬結合域中的這一位置來說是保守的。然而,hemB鋅指結構域中的其余位置都是保守的。
實施例5pAJ023的構建通過PCR擴增米曲霉hemB編碼區(qū)并將其亞克隆到米曲霉表達載體pBANE6中來構建質粒pAJ023(圖4)。設計擴增產(chǎn)物以包含5’SwaI和3’PacI限制位點,從而有利于其克隆到pBANe6中。擴增反應物(50μl)包含下列組分10mM Tris-HCl pH 8.3,50mM KCl,1.5 mM,MgCl2,0.01%(w/v)明膠,各200μM的dATP、dCTP、dGTP和dTTP,200ng的pAJ007-6 DNA以及如下所示的各50pmol的PCR引物PBG10(有義)5’-GCATATTTAAATGATGTCCTTTTCTAATCTCGT-3’(SEQ ID NO7)PBGI1A(反義)5’-ATATTAATTAATCCATCTAGCTAAATCATT-3’(SEQ ID NO8)PBG10和PBG11A的劃線區(qū)分別包含克隆限制序列SwaI與PacI。在95℃下溫育反應物3分鐘并冷卻至80℃。加入五個單位的PWO(BM)聚合酶。在設定為30個循環(huán)的Perkin-Elmer 9600熱循環(huán)儀中溫育反應物,其中每一循環(huán)為95℃下30秒、57℃下1分鐘以及72℃下1分鐘。在最后一循環(huán)后,接著在72℃下溫育反應物5分鐘。凝膠純化最后的PCR產(chǎn)物,用SwaI和PacI消化其,并將其連接到用SwaI和PacI消化的載體pBANE6中以產(chǎn)生pAJ023。
實施例6米曲霉菌株JRoC50.3.18A的構建以如下方法構建包含質粒pJRoC50的米曲霉菌株JRoC50.3.18A。利用基于長根鬼傘過氧化物酶(Baunsgaard等,1993,歐洲生物化學雜志213605-611)的氨基酸序列構建的、如下所示(Saiki等,1988,科學239487-491)的特異性寡核苷酸引物,由PCR制備灰蓋鬼傘IFO8371過氧化物酶cDNA片段1.5’-GCGCGAATTCGTNGGNATNGGNATNAA(CT)CA(CT)GG-3’(SEQ ID NO9)2.3’-TACAGNTT(GA)AC(GA)GGNGGCCTAGGCG-5’(SEQ ID NO10)3.5′-GCGAATTCACNCCNCA(GA)GTNTT(CT)GA(CT)AC-3’(SEQID NO11)4.3′-GGNAA(GA)GGNCCNCT(CT)AA(GA)CCTAGGCG-5’(SEQ IDNO12)5.5′-GCGCGAATTCTGGCA(GA)TCNAC-3′(SEQ ID NO13)6.5′-GCGCGAATTCTGGCA(GA)AGNATG-3′(SEQ ID NO14)7.3′-CGNTACCGNTT(CT)TACAGCCTAGG-5′(SE Q ID NO15)利用Gene Amp Kit與儀器(Perkin Elmer Cetus,Norwalk,CT),按照廠商的指導完成PCR,例外情況是在28℃下進行反應的前三個循環(huán)以便獲得與第一條鏈cDNA(由得自灰蓋鬼傘菌株IFO 8371的mRNA制備)的更好雜交,隨后在65℃下進行的30個PCR循環(huán)。
引物的結合情況如下1和2、3和4、5和7、6和7、1和4以及3和7。用5’端EcoRI位點和3’端BamHI位點伸展PCR片段。在1%瓊脂糖-TBE凝膠上分析反應物,在所有的反應中均發(fā)現(xiàn)所需大小的DNA帶。為了檢驗對應于過氧化物酶特異性序列的DNA帶,對凝膠進行Southern印跡,并使之與包含如下序列(位于引物3和4之間)的寡核苷酸探針雜交5’-GT(CT)TC(GA)AT(GA)TAGAA(CT)TG-3’(SEQ ID NO16)發(fā)現(xiàn)探針與大約130bp、420 bp、540 bp以及240bp的帶雜交,由此確認觀察到的DNA帶對應于過氧化物酶序列。
用EcoRI和BamHI消化得自各種PCR反應的DNA,并將其克隆到質粒pUC19(新英格蘭生物實驗室,Beverly,MA)中。利用上述的寡核苷酸探針(SEQ ID NO16)通過雜交來鑒定包含正確PCR片段的菌落。通過限制性酶切圖和如Sanger等(1977,美國國家科學院院報745463-5467)所描述的部分DNA序列分析來分析得自陽性菌落的DNA。來自克隆體(通過利用引物1和4獲得的)之一的430bp片段用于篩選如下所述的灰蓋鬼傘cDNA文庫。
從勻化的灰蓋鬼傘菌株IFO 8371菌絲體中提取整個RNA,并按照Boel等(1984,EMBO雜志31097-1102)和Chirgwin等(1979,生物化學185294-5299)所描述的方法在過氧化物酶活性最大時收集該RNA。在Aviv和Leder(1972,美國國家科學院院報691408-1412)所描述的在低聚(dT)-纖維素上,通過兩個循環(huán)的親和層析獲得包含Poly(A)的RNA。按照廠商的指導利用cDNA合成試劑盒(Invitrogen,San Diego,加拿大)來合成cDNA。將來源于灰蓋鬼傘cDNA文庫的大約50,000個大腸桿菌重組體轉移到Whatman 540濾紙上。如Gerger等所描述的(1979,核酸研究72115-2135)一樣,裂解和固定上述菌落。在0.2 X SSC-0.1%SDS中使濾膜與用32p-標記的430bp過氧化物酶特異性探針雜交。在65℃下進行濾膜的雜交和洗滌,其后用增感屏使之放射自顯影24小時。放射自顯影之后,在不斷升高的溫度下洗滌濾膜,而后用增感屏使之放射自顯影24小時。按照這一方法,可鑒定超過50個陽性菌落。利用標準方法(Birnboim和D0ly,1979,核酸研究71513-1523)把小量制備質粒DNA與雜交菌落分離,并利用Sanger的雙脫氧方法(Sanger等,1977,美國國家科學院院報745463-5467)確定cDNA插入片段的DNA序列。選擇上述菌落之一,并指定該載體為pCiP。通過利用BamHI/XhoI的切割來從該載體上切除過氧化物酶cDNA片段,并由瓊脂糖凝膠電泳純化其,電洗脫之并準備用于連接反應。cDNA片段連接到BamHI/XhoI消化的pHD414上從而產(chǎn)生pJVi9,其中的cDNA處于米曲霉的TAKA啟動子和如圖5中所示的黑曲霉的AMGTM(NovoNordiskA/S,Bagsvard,丹麥)終止子的轉錄控制之下。
從質粒pJVi9上切除編碼灰蓋鬼傘過氧化物酶的cDNA作為BamHI/XhoI片段,并將其克隆到質粒pJeRS6(圖6)中從而產(chǎn)生質粒pJRoC50(圖7),質粒pJRoC50包含作為選擇性標記的pyrG、TAKA啟動子及amdS終止子。
利用5μg的純化質粒pJRoC50(如下所述)通過如下修改,制備米曲霉菌株HowB425轉化體。省略瓊脂覆蓋,并將原生質體直接平板接種在基本培養(yǎng)基平板上。在每ml 2×107原生質體的濃度下用原生質體進行轉化。將100μl原生質體與5μgDNA在冰上放置30分鐘。加入1ml的SPTC(40%PEG 4000,0.8M山梨醇,0.05M Tris pH8.0,0.05MCaCl2),并在34℃下培養(yǎng)原生質體20分鐘。將轉化物直接接種在包含基本培養(yǎng)基的平板上。每升基本培養(yǎng)基(pH6.5)由6g NaNO3、0.52g KCl、1.52g KH2PO4、1ml痕量金屬、1g葡萄糖、500mg MgSO4-7H2O、342.3g蔗糖以及20g純凈瓊脂組成。每升痕量金屬溶液(1000X)由22gZnSO4-7H2O、11g H3BO3、5g MnCl2-4H2O、5g FeSO4-7H2O、1.6g CoC12-5H2O、1.6g(NH4)6Mo7O24以及50g Na4EDTA組成。在34℃下溫育平板5-7天。將轉化體轉移到相同培養(yǎng)基的平板上并在37℃下培養(yǎng)3-5天。
利用下列酶分析方法測定66個轉化體的過氧化物酶活性將180μl底物緩沖液{20ml 0.1M磷酸鉀-0.01 Tween-80 pH7.0,250μl2,2’-連氮-雙-(3-乙基苯并噻唑啉-6-磺酸酯)(ABTS)溶液(22mg/ml)以及2μl的30%過氧化氫}加至20μl的以1∶900比例稀釋的培養(yǎng)物上清液中,隨后迅速利用Molecular Devices Thermomax Microplate Reader(Molecular Devices,Sunnyvale,加拿大)在25℃下測定其在405nm處的吸光度。在伴隨混合的2分鐘時間內每10秒記錄一次測定結果,并用SOFT max程序(Molecular Devices,Sunnyvale,加拿大)計算Vmax值。利用標準曲線(以已知量的灰蓋鬼傘過氧化物酶繪制的)作為標準來估算每ml中的過氧化物酶單位(POXU)。一個POXU的定義為30℃下每分鐘催化1.0μmole的0.88mM H2O2、1.67mM ABTS、0.1M磷酸鹽pH7.0轉化的酶量。在與上述相同的條件下利用相同的平板,通過劃線孢子和挑取分離的菌落來孢子純化表達最高水平的四個轉化體。
在搖瓶中進行最終的評價,其中每一轉化體的大約5×106個孢子接種到25ml的MY25培養(yǎng)基上,該培養(yǎng)基包含1%酵母提取物、2.5%麥芽糖、0.2%尿素和1X MY鹽pH6.5。每升1X MY鹽由2g MgSO4-7H2O、2g K2PO4、10g KH2PO4、2g檸檬酸、0.5ml痕量金屬溶液、1ml10%CaCl2-2H2O組成。每升痕量金屬溶液由13.9g FeSO4-7H2O、8.5g MnSO4-H2O、14.28g ZnSO4-7H2O、1.63g CuSO4、0.24gNiCl2-6H2O以及3.0g檸檬酸組成。加入氯高鐵血紅素(得自在50mMNaOH中制備的10mg/ml新鮮貯存物)至終濃度為0.01mg/ml。在34℃和200rpm條件下溫育搖瓶7-8天。指定最好的過氧化物酶產(chǎn)生者為JRoC50.3.18A。
實施例7利用pAJ023的米曲霉JRoC50.3.18A的轉化為了確定米曲霉hemB基因的超表達是否增加過氧化物酶的產(chǎn)量,用pAJ023轉化米曲霉菌株JRoC50.3.18A。作為對照,pBANe6也用于轉化米曲霉JRoc 50.3.18A。
在每ml 2×107原生質體的濃度下用原生質體進行轉化。在冰上將100μl原生質體與10μg DNA、200μl 60%PEG 4000-10mM HEPES-10mM CaCl2溶液一起溫育30分鐘。加入1ml的SPTC(40%PEG 4000、0.8 M山梨醇、0.05M Tris pH8.0、0.05M CaCl2),并在34℃下溫育原生質體20分鐘。在接種到用于amdS轉化的COVE轉化平板(每升0.52g KCl、0.52g MgSO4-7H2O、1.52g KH2PO4、1ml如實施例6所描述的痕量金屬溶液、342.3g蔗糖、25g純凈瓊脂、10ml 1M乙酰胺以及10ml的3M CsCl)上之前,將0.25ml轉化物的等分試樣加至15ml COVE瓊脂覆蓋物(與COVE培養(yǎng)基+0.7%低熔點瓊脂相同)上。在室溫下溫育平板5-7天。將轉化體轉移到相同培養(yǎng)基的平板上,在37℃溫育3-5天。在相同條件下利用相同的平板通過劃線孢子和挑取分離的菌落來純化上述轉化體。
實施例8hemB初級轉化體產(chǎn)生的過氧化物酶產(chǎn)量使總共20種米曲霉hemB轉化體和42種對照轉化體(有米曲霉表達載體而無米曲霉hemB的JRoC 50.3.18A的轉化體)在24個孔平板上生長,并如實施例6中所述的一樣分析其過氧化物酶產(chǎn)量。
過氧化物酶分析的結果顯示產(chǎn)生較高水平的過氧化物酶活性的轉化體相對于對照轉化體,在數(shù)量上無任何增加。
微生物保藏下列菌株按照布達佩斯條約保藏在美國農(nóng)業(yè)研究機構專利培養(yǎng)物保藏中心(NRRL),北方研究實驗室,1815大學街,Peoria,Illinois61604,美國。
菌株 登記號保藏日期大腸桿菌DH5α(pAJ007-6) NRRL B-21564 1996年4月22日在一定條件下存放菌株,該條件要確保在此專利申請的懸而未決期間對于由按照37C.F.R.§1.14和35 U.S.C.§122授權的專利與商標委員所確定的人員來說可獲得培養(yǎng)物的使用權。保藏物表示每一種存放菌株的基本上純化的培養(yǎng)物。保藏物可按照提交主題申請或其子申請的國家的專利法要求而得到。然而,應該理解保存物的可使用權并不包括許可侵犯政府授予的專利權而實施主題發(fā)明。
這里所描述的和所要求的本發(fā)明,并不限于這里所公開的具體實施方案范圍,由于這些實施方案旨在說明本發(fā)明的幾個方面。任何等同的實施方案都意欲包含在本發(fā)明范圍之內。的確,除這里所描述和示例的修改方案之外,有關本發(fā)明的其他各種修改方案從以上描述看對本領域技術人員來說都是很明顯的。這些修改方案也意欲包含在附屬的權利要求范圍之內。
這里引用各種參考文獻,它們的公開內容均與本文一并參考。
序列表(1)一般信息(i)申請人(A)名稱Novo Nordisk生物技術公司(B)街道1445 Drew路(C)城市Davis,加利福尼亞(D)國家美利堅合眾國(E)郵編(ZIP)95616-4880(F)電話(916)757-8100(G)傳真(916)758-0317(ii)發(fā)明名稱曲霉屬膽色素原合酶和編碼該酶的核酸(iii)序列數(shù)23(iv)通訊地址(A)收信人北美的Novo Nordisk,Inc.
(B)街道405 Lexington路(C)城市紐約(D)州紐約(E)國家美國(F)郵編10174(v)計算機可讀形式(A)媒介類型軟盤(B)計算機可兼容的IBM(C)操作系統(tǒng)DOS(D)軟件FastSEQ Windows 2.0版本(vii)在先的申請數(shù)據(jù)(A)申請?zhí)?0/019,529(B)申請日10-JUN-1996(C)分類(viii)律師/代理人信息
(A)姓名Lambiris,Elias J.
(B)登記號33,728(C)證書號4809.204-WO(ix)電訊信息(A)電話212-867-0123(B)傳真212-878-9655(2)SEQ ID NO1的信息(i)序列特征(A)長度1807對堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線型(xi)序列描述SEQ ID NO1CTGGACCAAT GGTAACCCTC CGTAATTGCC TTACAGATTT AGCCCAGGGG GGTTATGGTA 60TCCTTGGGTA TTGAGGCCTG GAAATTTTTT TAGCCACCAG TTTACAGCCA GTTTCCGTTT 120GTAAATATTT CACATCCCCC GACCCTGTCC CAATACAATA ATTTTTTCGC TATATATAAC 180GCCCCTAGCG TTGTTTTATG ATCCTTAAAT CCTTACTTGT ACCTGAAAAT TGCAACAAAT 240GTACTGACCT GGATCGCTGG CCATTTATAT CATTGCCCTG CGAAGTCGTA TTCTGCCAGT 300GGCACAGGCG CTATTCTCTT TTCTTCCCTC CACCGCGTTT CTATCTTCCA TAGCACCCCA 360CTTGCTTGCC GCTCCTGTCA TTATGTCCTT TTCTAATCTC GTCTCTGACC TCGCCTTCAG 420AGATTCTCAT GATGACCGAA GTTCTCAGAT ATCTCAGGTA CAATCGCAAG CCACTGCACG 480ATCGTATACA AGCACAGCTG CCACAAGCGT CAGCATATCT GGCGACATCT CAAGCCAGCT 540TCATTCCGGT TACAGCCATC CACTGAGCCG ATCATGGCAG GCTGAAAGAC AGTTGACTAA 600AGTCCGCATT TTCTTTTGTA TTTACTGAGC TGCTCTAACC CCGAGATAGG AAATGCTTAT 660TTATCCTCTC TTCATCACCG ATAATCCCGA TGAGGAGACT CCTATCCCGT CTCTCCCTGG 720ACAGTATCGT CGAGGATTAA ACCGTCTAGT TCCTTTCATC AAACCACTTG CCCACAAGGG 780GCTACGCTCA GTCATCCTGT TTGGCGTCCC ACTACACCCC TCTGCGAAGG ATGCACTAGG 840TACCGCTGCA GACGATCCAT CTGGACCGGT AATTCAAGCT ATTCGCTTGC TTAGGTCGCG 900GTTTCCTCAA CTTTATATCG TGACAGATGT GTGCCTTTGC GAGTATACTT CGCATGGCCA 960CTGTGGGATA CTGCGAGAAG ATGGGACTCT TGATAATACA CAGTCTGTGG ATCGGATTTC1020GGATGTTGCT CTGGCTTATG CTGCCGCCGG AGCCCATTGT GTCGCTCCGT CTGATATGAA1080TGATGGGCGA GTGCGTGCTA TAAAACTGAA GCTTATTGAA GCCGGGATGG CCCACCGTGT1140CCTACTGATG TCCTACAGCG CCAAATTTAG CGGTTGTTTG TACGGCCCTT TCCGTGATGC1200AGCGGGGTCC TGCCCATCAT TCGGGGATCG CAGATGCTAC CAGTTACCAC CCGGAGGCCG1260TGGACTTGCT CGGCGCGCTA TACAGAGAGA TATAGGCGAA GGGGCAGACA TCATAATGGT1320AAAGCCGGCG AGCAGCTACC TGGACATTAT CAGAGACGCA AAAGAAATTG CCAAAGACAT1380TCCCATTGCT GCTTACCAGG TCAGCGGTGA GTATGCTATG ATACATGCTG GTGCCAAGGC1440GGGCGTATTT GACTTGAAAT CCATGGCCTT TGAAAGTACT GAAGGGATTA TAAGGGCTGG1500TGCTGGGATT ATAGTAAGCT ATTTCGTGCC TGATTTTCTA GATTGGCTTT CGAAATGATT1560TAGCTAGATG GAGCGTGATG AAAGCATCCA CCAGATAAAT AGCAGTGACG ATCGCGTTTG1620AATCATACCT ATTGGAGTAG AAGTCTCGGT ATCTCGTTGG GGATTCTCTA GGTTGCTTAT1680TTAACGTAAT GCCACGCCAT GTGTTATATA TTGCCTAAAT ACTTTTATAA AAGATACACC1740AAGCTGATGG TGCCAAGTGA CCACTTCTAA TAAATACAAT TATACCAATT CCTCCGAAAT1800ATGCGGG 1807
(2)SEQ ID NO2的信息(i)序列特征(A)長度375個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線型(ii)分子類型蛋白質(v)片段類型內部(xi)序列描述SEQ ID NO2Met Ser Phe Ser Asn Leu Val Ser Asp Leu Ala Phe Arg Asp Ser His1 5 10 15Asp Asp Arg Ser Ser Gln Ile Ser Gln Val Gln Ser Gln Ala Thr Ala20 25 30Arg Ser Tyr Thr Ser Thr Ala Ala Thr Ser Val Ser Ile Ser Gly Asp35 40 45Ile Ser Ser Gln Leu His Ser Gly Tyr Ser His Pro Leu Ser Arg Ser50 55 60Trp Gln Ala Glu Arg Gln Leu Thr Lys Glu Met Leu Ile Tyr Pro Leu65 70 75 80Phe Ile Thr Asp Asn Pro Asp Glu Glu Thr Pro Ile Pro Ser Leu Pro85 90 95Gly Gln Tyr Arg Arg Gly Leu Asn Arg Leu Val Pro Phe Ile Lys Pro100 105 110Leu Ala His Lys Gly Leu Arg Ser Val Ile Leu Phe Gly Val Pro Leu115 120 125His Pro Ser Ala Lys Asp Ala Leu Gly Thr Ala Ala Asp Asp Pro Ser130 135 140Gly Pro Val Ile Gln Ala Ile Arg Leu Leu Arg Ser Arg Phe Pro Gln145 150 155 160Leu Tyr Ile Val Thr Asp Val Cys Leu Cys Glu Tyr Thr Ser His Gly165 170 175His Cys Gly Ile Leu Arg Glu Asp Gly Thr Leu Asp Asn Thr Gln Ser180 185 190Val Asp Arg Ile Ser Asp Val Ala Leu Ala Tyr Ala Ala Ala Gly Ala195 200 205His Cys Val Ala Pro Ser Asp Met Asn Asp Gly Arg Val Arg Ala Ile210 215 220Lys Leu Lys Leu Ile Glu Ala Gly Met Ala His Arg Val Leu Leu Met225 230 235 240Ser Tyr Ser Ala Lys Phe Ser Gly Cys Leu Tyr Gly Pro Phe Arg Asp245 250 255Ala Ala Gly Ser Cys Pro Ser Phe Gly Asp Arg Arg Cys Tyr Gln Leu260 265 270Pro Pro Gly Gly Arg Gly Leu Ala Arg Arg Ala Ile Gln Arg Asp Ile275 280 285Gly Glu Gly Ala Asp Ile Ile Met Val Lys Pro Ala Ser Ser Tyr Leu290 295 300Asp Ile Ile Arg Asp Ala Lys Glu Ile Ala Lys Asp Ile Pro Ile Ala305 310 315 320Ala Tyr Gln Val Ser Gly Glu Tyr Ala Met Ile His Ala Gly Ala Lys325 330 335Ala Gly Val Phe Asp Leu Lys Ser Met Ala Phe Glu Ser Thr Glu Gly340 345 350
Ile Ile Arg Ala Gly Ala Gly Ile Ile Val Ser Tyr Phe Val Pro Asp355 360 365Phe Leu Asp Trp Leu Ser Lys370 375(2)SEQ ID NO3的信息(i)序列特征(A)長度23對堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線型(xi)序列描述SEQ ID NO3GTNGCNCCNW SNGAYATGAT GGA 23(2)SEQ ID NO4的信息(i)序列特征(A)長度18對堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線型(xi)序列描述SEQ ID NO4GCRTCNCGTR AANCCRTA 18(2)SEQ ID NO5的信息(i)序列特征(A)長度17對堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線型(xi)序列描述SEQ ID NO5GTGGCTCCGA GTGATAT17(2)SEQ ID NO6的信息(i)序列特征
(A)長度18對堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線型(xi)序列描述SEQ ID NO6GCATCGCGAA AAGGACCG18(2)SEQ ID NO7的信息(i)序列特征(A)長度33對堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線型(xi)序列描述SEQ ID NO7GCATATTTAA ATGATGTCCT TTTCTAATCT CGT33(2)SEQ ID NO8的信息(i)序列特征(A)長度30對堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線型(xi)序列描述SEQ ID NO8ATATTAATTA ATCCATCTAG CTAAATCATT30(2)SEQ ID NO9的信息(i)序列特征(A)長度33對堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線型(xi)序列描述SEQ ID NO9
GCGCGAATTC GTNGGNATNG GNATNAAYCA YGG33(2)SEQ ID NO10的信息(i)序列特征(A)長度25對堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線型(xi)序列描述SEQ ID NO10GCGGATCCGG NGGRCARTTN GACAT 25(2)SEQ ID NO11的信息(i)序列特征(A)長度28對堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線型(xi)序列描述SEQ ID NO11GCGAATTCAC NCCNCARGTN TTYGAYAC28(2)SEQ ID NO12的信息(i)序列特征(A)長度26對堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線型(xi)序列描述SEQ ID NO12GCGGATCCRA AYTCNCCNGG RAANGG 26(2)SEQ ID NO13的信息(i)序列特征(A)長度21對堿基對(B)類型核酸
(C)鏈型單鏈(D)拓撲結構線型(xi)序列描述SEQ ID NO13GCGCGAATTC TGGCARTCNA C 21(2)SEQ ID NO14的信息(i)序列特征(A)長度22對堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線型(xi)序列描述SEQ ID NO14GCGCGAATTC TGGCARAGNA TG 22(2)SEQ ID NO15的信息(i)序列特征(A)長度23對堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線型(xi)序列描述SEQ ID NO15GGATCCGACA TYTTNGCCAT NGC 23(2)SEQ ID NO16的信息(i)序列特征(A)長度17對堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線型(ii)分子類型cDNA(xi)序列描述SEQ ID NO16GTYTCRATRT AGAAYTG 17
(2)SEQ ID NO17的信息(i)序列特征(A)長度342個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線型(ii)分子類型無(xi)序列描述SEQ ID NO17Met His Thr Ala Glu Phe Leu Glu Thr Glu Pro Thr Glu Ile Ser Ser1 5 10 15Val Leu Ala Gly Gly Tyr Asn His Pro Leu Leu Arg Gln Trp Gln Ser20 25 30Glu Arg Gln Leu Thr Lys Asn Met Leu Ile Phe Pro Leu Phe Ile Ser35 40 45Asp Asn Pro Asp Asp Phe Thr Glu Ile Asp Ser Leu Pro Asn Ile Asn50 55 60Arg Ile Gly Val Asn Arg Leu Lys Asp Tyr Leu Lys Pro Leu Val Ala65 70 75 80Lys Gly Leu Arg Ser Val Ile Leu Phe Gly Val Pro Leu Ile Pro Gly85 90 95Thr Lys Asp Pro Val Gly Thr Ala Ala Asp Asp Pro Ala Gly Pro Val100 105 110Ile Gln Gly Ile Lys Phe Ile Arg Glu Tyr Phe Pro Glu Leu Tyr Ile115 120 125Ile Cys Asp Val Cys Leu Cys Glu Tyr Thr Ser His Gly His Cys Gly130 135 140Val Leu Tyr Asp Asp Gly Thr Ile Asn Arg Glu Arg Ser Val Ser Arg145 150 155 160Leu Ala Ala Val Ala Val Asn Tyr Ala Lys Ala Gly Ala His Cys Val165 170 175Ala Pro Ser Asp Met Ile Asp Gly Arg Ile Arg Asp Ile Lys Arg Gly180 185 190Leu Ile Asn Ala Asn Leu Ala His Lys Thr Phe Val Leu Ser Tyr Ala195 200 205Ala Lys Phe Ser G1y Asn Leu Tyr Gly Pro Phe Arg Asp Ala Ala Cys210 215 220Ser Ala Pro Ser Asn Gly Asp Arg Lys Cys Tyr Gln Leu Pro Pro Ala225 230 235 240Gly Arg Gly Leu Ala Arg Arg Ala Leu Glu Arg Asp Met Ser Glu Gly245 250 255Ala Asp Gly Ile Ile Val Lys Pro Ser Thr Phe Tyr Leu Asp Ile Met260 265 270Arg Asp Ala Ser Glu Ile Cys Lys Asp Leu Pro Ile Cys Ala Tyr His275 280 285Val Ser Asp Glu Tyr Ala Met Leu His Ala Ala Ala Glu Lys Gly Val290 295 300Val Asp Leu Lys Thr Ile Ala Phe Glu Ser His Gln Gly Phe Leu Arg305 310 315 320Ala Gly Ala Arg Leu Ile Ile Thr Tyr Leu Ala Pro Glu Phe Leu Asp325 330 335Trp Leu Asp Glu Glu Asn340
(2)SEQ ID NO18的信息(i)序列特征(A)長度330個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線型(ii)分子類型無(xi)序列描述SEQ ID NO18Met Gln Pro Gln Ser Val Leu His Ser Gly Tyr Phe His Pro Leu Leu1 5 10 15Arg Ala Trp Gln Thr Ala Thr Thr Thr Leu Asn Ala Ser Asn Leu Ile20 25 30Tyr Pro Ile Phe Val Thr Asp Val Pro Asp Asp Ile Gln Pro Ile Thr35 40 45Ser Leu Pro Gly Val Ala Arg Tyr Gly Val Lys Arg Leu Glu Glu Met50 55 60Leu Arg Pro Leu Val Glu Glu Gly Leu Arg Cys Val Leu Ile Phe Gly65 70 75 80Val Pro Ser Arg Val Pro Lys Asp Glu Arg Gly Ser Ala Ala Asp Ser85 90 95Glu Glu Ser Pro Ala Ile Glu Ala Ile His Leu Leu Arg Lys Thr Phe100 105 110Pro Asn Leu Leu Val Ala Cys Asp Val Cys Leu Cys Pro Tyr Thr Ser115 120 125His Gly His Cys Gly Leu Leu Ser Glu Asn Gly Ala Phe Arg Ala Glu130 135 140Glu Ser Arg Gln Arg Leu Ala Glu Val Ala Leu Ala Tyr Ala Lys Ala145 150 155 160Gly Cys Gln Val Val Ala Pro Ser Asp Met Met Asp Gly Arg Val Glu165 170 175Ala Ile Lys Glu Ala Leu Met Ala His Gly Leu Gly Asn Arg Val Ser180 185 190Val Met Ser Tyr Ser Ala Lys Phe Ala Ser Cys Phe Tyr Gly Pro Phe195 200 205Arg Asp Ala Ala Lys Ser Ser Pro Ala Phe Gly Asp Arg Arg Cys Tyr210 215 220Gln Leu Pro Pro Gly Ala Arg Gly Leu Ala Leu Arg Ala Val Asp Arg225 230 235 240Asp Val Arg Glu Gly Ala Asp Met Leu Met Val Lys Pro Gly Met Pro245 250 255Tyr Leu Asp Ile Val Arg Glu Val Lys Asp Lys His Pro Asp Leu Pro260 265 270Leu Ala Val Tyr His Val Ser Gly Glu Phe Ala Met Leu Trp His Gly275 280 285Ala Gln Ala Gly Ala Phe Asp Leu Lys Ala Ala Val Leu Glu Ala Met290 295 300Thr Ala Phe Arg Arg Ala Gly Ala Asp Ile Ile Ile Thr Tyr Tyr Thr305 310 315 320Pro Gln Leu Leu Gln Trp Leu Lys Glu Glu325 330
(2)SEQ ID NO19的信息(i)序列特征(A)長度330個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線型(ii)分子類型無(xi)序列描述SEQ ID NO19Met His His Gln Ser Val Leu His Ser Gly Tyr Phe His Pro Leu Leu1 5 10 15Arg Ala Trp Gln Thr Thr Pro Ser Thr Val Ser Ala Thr Asn Leu Ile20 25 30Tyr Pro Ile Phe Val Thr Asp Val Pro Asp Asp Val Gln Pro Ile Ala35 40 45Ser Leu Pro Gly Val Ala Arg Tyr Gly Val Asn Gln Leu Glu Glu Met50 55 60Leu Arg Pro Leu Val Glu Ala Gly Leu Arg Cys Val Leu Ile Phe Gly65 70 75 80Val Pro Ser Arg Val Pro Lys Asp Glu Gln Gly Ser Ala Ala Asp Ser85 90 95Glu Asp Ser Pro Thr Ile Glu Ala Val Arg Leu Leu Arg Lys Thr Phe100 105 110Pro Thr Leu Leu Val Ala Cys Asp Val Cys Leu Cys Pro Tyr Thr Ser115 120 125His Gly His Cys Gly Leu Leu Ser Glu Asn Gly Ala Phe Leu Ala Glu130 135 140Glu Ser Arg Gln Arg Leu Ala Glu Val Ala Leu Ala Tyr Ala Lys Ala145 150 155 160Gly Cys Gln Val Val Ala Pro Ser Asp Met Met Asp Gly Arg Val Glu165 170 175Ala Ile Lys Ala Ala Leu Leu Lys His Gly Leu Gly Asn Arg Val Ser180 185 190Val Met Ser Tyr Ser Ala Lys Phe Ala Ser Cys Phe Tyr Gly Pro Phe195 200 205Arg Asp Ala Ala Gln Ser Ser Pro Ala Phe Gly Asp Arg Arg Cys Tyr210 215 220Gln Leu Pro Pro Gly Ala Arg Gly Leu Ala Leu Arg Ala Val Ala Arg225 230 235 240Asp Ile Gln Glu Gly Ala Asp Ile Leu Met Val Lys Pro Gly Leu Pro245 250 255Tyr Leu Asp Met Val Gln Glu Val Lys Asp Lys His Pro Glu Leu Pro260 265 270Leu Ala Val Tyr Gln Val Ser Gly Glu Phe Ala Met Leu Trp His Gly275 280 285Ala Lys Ala Gly Ala Phe Asp Leu Arg Thr Ala Val Leu Glu Ser Met290 295 300Thr Ala Phe Arg Arg Ala Gly A la Asp Ile Ile Ile Thr Tyr Phe Ala305 310 315 320Pro Gln Leu Leu Lys Trp Leu Lys Glu Glu325 330
(2)SEQ ID NO20的信息(i)序列特征(A)長度323個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線型(ii)分子類型無(xi)序列描述SEQ ID NO20Thr Asp Leu Ile Gln Arg Pro Arg Arg Leu Arg Lys Ser Pro Ala Leu1 5 10 15Pro Arg Met Phe Glu Glu Thr Thr Leu Ser Leu Asn Asp Leu Val Leu20 25 30Pro Ile Phe Val Glu Glu Glu Ile Asp Asp Tyr Lys Ala Val Glu Ala35 40 45Met Pro Gly Val Met Arg Ile Pro Glu Lys His Leu Ala Arg Glu Ile50 55 60Glu Arg Ile Ala Asn Ala Gly Ile Arg Ser Val Met Thr Phe Gly Ile65 70 75 80Ser His His Thr Asp Glu Thr Gly Glu Arg Ala Trp Arg Glu Asp Gly85 90 95Leu Val Ala Arg Met Ser Arg Ile Cys Lys Gln Thr Val Pro Glu Met100 105 110Ile Val Met Ser Asp Thr Cys Phe Cys Glu Tyr Thr Ser His Gly His115 120 125Cys Gly Val Leu Cys Glu His Gly Val Asp Asn Asp Ala Thr Leu Glu130 135 140Asn Leu Gly Lys Gln Ala Val Val Ala Ala Ala Ala Gly Ala Asp Phe145 150 155 160Ile Ala Pro Ser Ala Ala Met Asp Gly Gln Val Gln Ala Ile Arg Gln165 170 175Ala Leu Asp Ala Ala Gly Phe Lys Asp Thr Ala Ile Met Ser Tyr Ser180 185 190Thr Lys Phe Ala Ser Ser Phe Tyr Gly Pro Phe Arg Glu Ala Ala Gly195 200 205Ser Ala Leu Lys Gly Asp Arg Lys Ser Tyr Gln Met Asn Pro Met Asn210 215 220Arg Ala Glu Gly Ile Ala Glu Tyr Leu Leu Asp Glu Ala Gln Gly Ala225 230 235 240Asp Cys Leu Met Val Lys Pro Ala Gly Ala Tyr Leu Asp Ile Val Arg245 250 255Glu Leu Arg Glu Arg Thr Glu Leu Pro Ile Gly Ala Tyr Gln Val Ser260 265 270Gly Glu Tyr Ala Met Ile Lys Phe Ala Ala Leu Ala Gly Ala Ile Asp275 280 285Glu Glu Lys Val Val Leu Glu Ser Leu Gly Ser Ile Lys Arg Ala Gly290 295 300Ala Asp Leu Ile Phe Ser Tyr Phe Ala Leu Asp Leu Ala Glu Lys Lys305 310 315 320Ile Leu Arg(2)SEQ ID NO21的信息(i)序列特征
(A)長度398個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線型(ii)分子類型無(xi)序列描述SEQ ID NO21His Thr Phe Val Asp Leu Lys Ser Pro Phe Thr Leu Ser Asn Tyr Leu1 5 10 15Ser Phe Ser Ser Ser Lys Arg Arg Gln Pro Pro Ser Leu Phe Thr Val20 25 30Arg Ala Ser Asp Ser Asp Phe Glu Ala Ala Val Val Ala Gly Lys Val35 40 45Pro Glu Ala Pro Pro Val Pro Pro Thr Pro Ala Ser Pro Ala Gly Thr50 55 60Pro Val Val Pro Ser Leu Pro Ile Gln Arg Arg Pro Arg Arg Asn Arg65 70 75 80Arg Ser Pro Ala Leu Arg Ser Ala Phe Gln Glu Thr Thr Leu Ser Pro85 90 95Ala Asn Phe Val Tyr Pro Leu Phe Ile His Glu Gly Glu Glu Asp Thr100 105 110Pro Ile Gly Ala Met Pro Gly Cys Tyr Arg Leu Gly Trp Arg His Gly115 120 125Leu Leu Glu Glu Val Ala Lys Ala Arg Asp Val Gly Val Asn Ser Val130 135 140Val Leu Phe Pro Lys Ile Pro Asp Ala Leu Lys Thr Pro Thr Gly Asp145 150 155 160Glu Ala Tyr Asn Glu Asp Gly Leu Val Pro Arg Ser Ile Arg Leu Leu165 170 175Lys Asp Lys Tyr Pro Asp Leu Ile Ile Tyr Thr Asp Val Ala Leu Asp180 185 190Pro Tyr Ser Ser Asp Gly His Asp Gly Ile Val Arg Glu Asp Gly Val195 200 205Ile Met Asn Asp Glu Thr Val His Gln Leu Cys Lys Gln Ala Val Ala210 215 220Gln Ala Arg Ala Gly Ala Asp Val Val Ser Pro Ser Asp Met Met Asp225 230 235 240Gly Arg Val Gly Ala Met Arg Val Ala Leu Asp Ala Glu Gly Phe Gln245 250 255His Val Ser Ile Met Ser Tyr Thr Ala Lys Tyr Ala Ser Ser Phe Tyr260 265 270Gly Pro Phe Arg Glu Ala Leu Asp Ser Asn Pro Arg Phe Gly Asp Lys275 280 285Lys Thr Tyr Gln Met Asn Pro Ala Asn Tyr Arg Glu Ala Leu Thr Glu290 295 300Met Arg Glu Asp Glu Ser Glu Gly Ala Asp Ile Leu Leu Val Lys Pro305 310 315 320Gly Leu Pro Tyr Leu Asp Ile Ile Arg Leu Leu Arg Asp Asn Ser Pro325 330 335Leu Pro Ile Ala Ala Tyr Gln Val Ser Gly Glu Tyr Ser Met Ile Lys340 345 350Ala Gly Gly Ala Leu Lys Met Ile Asp Glu Glu Lys Val Met Met Glu355 360 365Ser Leu Leu Cys Leu Arg Arg Ala Gly Ala Asp Ile Ile Leu Thr Tyr370 375 380Phe Ala Leu Gln Ala Ala Arg Thr Leu Cys Gly Glu Lys Arg385 390 395
(2)SEQ ID NO22的信息(i)序列特征(A)長度323個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線型(ii)分子類型無(xi)序列描述SEQ ID NO22Met Ser Gln Ser Phe Asn Arg His Arg Arg Leu Arg Thr Ser Lys Ala1 5 10 15Met Arg Glu Met Val Lys Glu Thr Arg Leu His Pro Ser Asp Phe Ile20 25 30Tyr Pro Ile Phe Val Val Glu Gly Leu Glu Gly Lys Lys Ala Val Pro35 40 45Ser Met Pro Asp Val His His Val Ser Leu Asp Leu Leu Lys Asp Glu50 55 60Val Ala Glu Leu Val Lys Leu Gly Ile Gln Ser Val Ile Val Phe Gly65 70 75 80Ile Pro Glu Glu Lys Asp Asp Cys Gly Thr Gln Ala Tyr His Asp His85 90 95Gly Ile Val Gln Lys Ala Ile Thr Glu Ile Lys Glu His Phe Pro Glu100 105 110Met Val Val Val Ala Asp Thr Cys Leu Cys Glu Tyr Thr Asp His Gly115 120 125His Cys Gly Leu Val Lys Asp Gly Val Ile Leu Asn Asp Glu Ser Leu130 135 140Glu Leu Leu Ala Gln Thr Ala Val Ser Gln Ala Lys Ala Gly Ala Asp145 150 155 160Ile Ile Ala Pro Ser Asn Met Met Asp Gly Phe Val Thr Val Ile Arg165 170 175Glu Ala Leu Asp Lys Glu Gly Phe Val Asn Ile Pro Ile Met Ser Tyr180 185 190Ala Val Lys Tyr Ser Ser Glu Phe Tyr Gly Pro Phe Arg Asp Ala Ala195 200 205Asn Ser Thr Pro Gln Phe Gly Asp Arg Lys Thr Tyr Gln Met Asp Pro210 215 220Ala Asn Arg Met Glu Ala Leu Arg Glu Ala Gln Ser Asp Val Glu Glu225 230 235 240Gly Ala Asp Phe Leu Ile Val Lys Pro Ser Leu Ser Tyr Met Asp Ile245 250 255Met Arg Asp Val Lys Asn Glu Phe Thr Leu Pro Leu Val Ala Tyr Val260 265 270Ser Gly Glu Tyr Ser Met Val Lys Ala Ala Ala Gln Asn Gly Trp Ile275 280 285Lys Glu Lys Glu Ile Val Leu Glu Ile Leu Thr Ser Met Lys Arg Ala290 295 300Gly Ala Asp Leu Ile Ile Thr Tyr His Ala Lys Asp Ala Ala Lys Trp305 310 315 320Leu Ala Glu(2)SEQ ID NO23的信息(i)序列特征
(A)長度424個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線型(ii)分子類型無(xi)序列描述SEQ ID NO23Met Met Ala Ser Thr Phe Asn Ile Pro Cys Asn Ala Gly Thr Ile Lys1 5 10 15Asn Phe Asn Asn Ser Gln Arg Asn Leu Gly Phe Ser Ser Asn Leu Gly20 25 30Ile Asn Phe Ala Lys Thr Arg Phe Ser Asn Cys Gly Asp Ser Gly Arg35 40 45Ile Pro Ser Gln Leu Val Val Arg Ala Ser Glu Arg Arg Asp Asn Leu50 55 60Thr Gln Gln Lys Thr Gly Leu Ser Ile Glu Glu Cys Glu Ala Ala Val65 70 75 80Val Ala Gly Asn Ala Pro Ser Ala Pro Pro Val Pro Pro Thr Pro Lys85 90 95Ala Pro Ser Gly Thr Pro Ser Val Ser Pro Leu Ser Leu Gly Arg Arg100 105 110Pro Arg Arg Asn Arg Thr Ser Pro Val Phe Arg Ala Ala Phe Gln Glu115 120 125Thr Thr Leu Ser Pro Ala Asn Val Val Tyr Pro Leu Phe Ile His Glu130 135 140Gly Glu Glu Asp Thr Pro Ile Gly Ala Met Pro Gly Cys Tyr Arg Leu145 150 155 160Gly Trp Arg His Gly Leu Val Glu Glu Val Ala Lys Ala Arg Asp Val165 170 175Val Val Asn Ser Ile Val Val Phe Pro Lys Pro Asp Ala Leu Lys Ser180 185 190Pro Thr Gly Asp Glu Ala Tyr Asn Glu Asn Gly Leu Val Pro Arg Thr195 200 205Ile Arg Met Leu Lys Asp Lys Phe Pro Asp Leu Ile Ile Tyr Thr Asp210 215 220Val Ala Leu Asp Pro Tyr Tyr Tyr Asp Gly His Asp Gly Ile Val Thr225 230 235 240Gln His Gly Val Ile Met Asn Asp Glu Thr Val His Gln Leu Cys Lys245 250 255Gln Ala Val Ala Gln Ala Arg Ala Gly Ala Asp Val Val Ser Pro Ser260 265 270Asp Met Met Asp Gly Arg Val Gly Ala Ile Arg Ala Ala Leu Asp Ala275 280 285Glu Gly Tyr Ser Asn Val Ser Ile Met Ser Tyr Thr Ala Lys Tyr Ala290 295 300Ser Ser Phe Tyr Pro Arg Phe Gly Asp Lys Lys Thr Tyr Gln Met Asn305 310 315 320Pro Ala Asn Tyr Arg Glu Ala Leu Ile Glu Thr Gln Glu Asp Glu Ser325 330 335Glu Gly Ala Asp Ile Leu Leu Val Lys Pro Gly Leu Pro Tyr Leu Asp340 345 350Ile Ile Arg Leu Leu Arg Asp Asn Ser Asp Leu Pro Ile Ala Ala Tyr355 360 365Gln Val Ser Gly Glu Tyr Ser Met Ile Lys Ala Gly Gly Val Leu Lys370 375 380Met Ile Asp Glu Glu Lys Val Met Leu Glu Ser Leu Leu Cys Leu Arg385 390 395 400Arg Ala Gly Ala Asp Ile Ile Leu Thr Tyr Phe Ala Leu Gln Ala Ala405 410 415Arg Cys Leu Cys Gly Glu Lys Arg420
權利要求
1.一種基本上純化的膽色素原合酶,該酶(a)得自一種曲霉菌株;(b)具有一個氨基酸序列,該氨基酸序列與SEQ ID NO2所描述的氨基酸序列有至少50%同源性;或者(c)為一個核酸序列所編碼,該核酸序列能夠在高度嚴格條件下與一種探針進行雜交,該探針在所說的條件下與SEQ ID NO1所描述的核酸序列雜交。
2.按照權利要求1的膽色素原合酶,該膽色素原合酶得自一種米曲霉菌株。
3.按照權利要求2的膽色素原合酶,該膽色素原合酶得自米曲霉IFO4177或其突變體菌株。
4.按照權利要求1的膽色素原合酶,該膽色素原合酶具有與SEQ IDNO2所描述的氨基酸序列有至少50%、優(yōu)選為至少60%、更優(yōu)選為至少70%、更優(yōu)選為至少80%、以及最優(yōu)選為至少90%的同源性的一個氨基酸序列。
5.按照權利要求4的膽色素原合酶,該酶具有SEQ ID NO2所描述的氨基酸序列。
6.按照權利要求1的膽色素原合酶,該酶為一個核酸序列所編碼,該核酸序列能夠在高度嚴格條件下與一種探針進行雜交,該探針在所說的條件下與SEQ ID NO1所描述的核酸序列雜交。
7.一種分離的核酸片段,該核酸片段包含編碼權利要求1的膽色素原合酶的核酸序列。
8.按照權利要求7的核酸片段,其中的核酸序列編碼得自米曲霉的膽色素原合酶。
9.按照權利要求8的核酸片段,其中的核酸序列編碼得自米曲霉IFO4177的膽色素原合酶。
10.按照權利要求9的核酸片段,其中的核酸序列描述在SEQ IDNO1中。
11.按照權利要求7的核酸片段,該核酸片段包含編碼膽色素原合酶的核酸序列,該膽色素原合酶具有與SEQ ID NO2所描述的氨基酸序列有至少50%、優(yōu)選為至少60%、更優(yōu)選為至少70%、更優(yōu)選為至少80%、以及最優(yōu)選為至少90%的同源性的一個氨基酸序列。
12.按照權利要求7的核酸片段,該核酸片段能夠在高度嚴格條件下與一種探針進行雜交,該探針在所說的條件下與SEQ ID NO1所描述的核酸序列雜交。
13.一種包含權利要求7的核酸片段的核酸構建體,該核酸片段可操作地連接到能夠指導上述膽色素原合酶在合適的表達宿主中表達的調節(jié)區(qū)上。
14.一種包含權利要求13的核酸構建體的重組載體。
15.按照權利要求14的載體,其中的核酸序列可操作地連接到一個啟動子序列上。
16.按照權利要求15的載體,該載體還包含一個轉錄終止信號。
17.按照權利要求15的載體,該載體還包含一個選擇性標記。
18.一種包含權利要求13的核酸構建體的重組宿主細胞。
19.按照權利要求18的宿主細胞,其中的核酸構建體包含在一個載體上。
20.按照權利要求18的宿主細胞,其中的宿主細胞是細菌細胞。
21.按照權利要求18的宿主細胞,其中的宿主細胞是真菌細胞。
22.按照權利要求21的宿主細胞,其中的真菌細胞是絲狀真菌細胞。
23.按照權利要求22的宿主細胞,其中的絲狀真菌細胞是頂孢霉屬、曲霉屬、鐮刀菌屬、腐質霉屬、毀絲霉屬、毛霉屬、脈孢菌屬、青霉菌屬、梭孢殼屬、Tolypocladium或者木霉屬物種的細胞。
24.按照權利要求21的宿主細胞,其中的真菌細胞是酵母細胞。
25.按照權利要求24的宿主細胞,其中的酵母細胞是酵母屬或者裂殖酵母屬的菌株。
26.按照權利要求18的宿主細胞,其中的核酸構建體被整合到宿主細胞基因組中。
27.一種產(chǎn)生權利要求1的膽色素原合酶的方法,該方法包括(a)培養(yǎng)曲霉屬菌株以產(chǎn)生膽色素原合酶;以及(b)回收膽色素原合酶。
28.一種產(chǎn)生權利要求1的膽色素原合酶的方法,該方法包括(a)培養(yǎng)包含核酸構建體的宿主細胞,該核酸構建體包含在有助于膽色素原合酶表達的條件下編碼膽色素原合酶的核酸序列;以及(b)回收膽色素原合酶。
全文摘要
本發(fā)明涉及曲霉屬膽色素原合酶和包含核酸序列的分離核酸片段,所說的核酸序列編碼該膽色素原合酶,也編碼核酸構建體、載體和包含該核酸序列的重組宿主細胞。本發(fā)明也涉及到產(chǎn)生膽色素原合酶的方法。
文檔編號C12N9/10GK101024841SQ200610093680
公開日2007年8月29日 申請日期1997年6月9日 優(yōu)先權日1996年6月10日
發(fā)明者A·瓊斯, J·R·查瑞 申請人:諾沃奇梅茲有限公司