專利名稱:超熱穩(wěn)定蛋白酶基因的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種編碼用于工業(yè)用途的超熱穩(wěn)定的蛋白酶的基因以及用基因工程方法生產(chǎn)該酶的方法。
背景技術(shù):
蛋白酶是可以裂解蛋白質(zhì)中肽鍵的酶并且已經(jīng)在動(dòng)物、植物和微生物中發(fā)現(xiàn)了各種蛋白酶。它們不僅被用作研究工作和醫(yī)療用品的試劑,而且還在工業(yè)領(lǐng)域中被用作如洗滌劑、食品加工和利用其逆反應(yīng)的化學(xué)合成中的添加劑,并且從工業(yè)角度看它們可以說是很重要的酶。對用于工業(yè)領(lǐng)域的蛋白酶來說,由于要求很高的物理和化學(xué)穩(wěn)定性,因此特別優(yōu)選使用具有高的熱穩(wěn)定性的酶。目前,在工業(yè)領(lǐng)域中主要使用的是產(chǎn)自芽胞桿菌屬細(xì)菌的蛋白酶,因?yàn)樗鼈兙哂邢鄬Ω叩臒岱€(wěn)定性。
但是,仍需要具有更進(jìn)一步的優(yōu)良性狀的酶,并且已試圖從可在高溫下生長的微生物和芽胞桿菌屬的嗜熱菌中獲取酶。
另一方面,一種稱為超嗜熱菌(hyperthermophiles)的微生物很適于高溫環(huán)境,因此它們被希望成為提供各種熱穩(wěn)定酶的來源。已知這些超嗜熱菌的一種,Pyrococcus furiosus,可產(chǎn)生蛋白酶[應(yīng)用與環(huán)境微生物學(xué),56,1992-1998(1990);歐洲微生物學(xué)聯(lián)合會(huì)微生物學(xué)快報(bào)(FEMS Microbiol.Letters),71,17-20(1990);普通微生物學(xué)雜志,137,1193-1199(1991)]。
另外,對Thermococcus,Staphylothermus和Thermobacteroides屬的超嗜熱菌來說,也已知其是產(chǎn)蛋白酶的[應(yīng)用微生物學(xué)和生物工程學(xué),34,715-719,(1991)]。
發(fā)明目的因?yàn)檫@些超嗜熱菌所產(chǎn)的蛋白酶具有高的熱穩(wěn)定性,它們被期望可用于其它任何已知的酶未曾用到過的新的應(yīng)用中。但是,上述的公開僅僅說明熱穩(wěn)定的蛋白酶活性存在于無細(xì)胞提取物中或來自培養(yǎng)上清的粗酶溶液中,沒有關(guān)于分離純化的酶性質(zhì)等的公開。而且,因?yàn)闉榱藦倪@些超嗜熱菌中獲取酶,必需在高溫下培養(yǎng)微生物,所以在這些酶的工業(yè)生產(chǎn)中仍存在問題。為了解決上述的問題,本發(fā)明的一個(gè)目的就是分離一種編碼一種超嗜熱菌的蛋白酶的基因。本發(fā)明的另一個(gè)目的是提供一種通過使用該基因的遺傳工程方法而制備該蛋白酶的方法。
發(fā)明公開為了獲取超熱穩(wěn)定的蛋白酶基因,本發(fā)明人試圖從Pyrococcus furiousDSM 3638的微生物細(xì)胞和培養(yǎng)上清中純化一種蛋白酶以便獨(dú)立地確定該酶的部分氨基酸序列。但是,無論使用微生物細(xì)胞或培養(yǎng)上清,純化該蛋白酶都是十分困難的,并且本發(fā)明人未能獲得具有足夠純度的用于確定其部分氨基酸序列的酶樣品。
作為一種克隆無任何關(guān)于該酶的一級結(jié)構(gòu)信息的目標(biāo)酶的基因的方法,存在一種表達(dá)克隆的方法,例如,根據(jù)這種方法獲取了源自PyrococcusWoesei的支鏈淀粉酶基因(WO 92/02614)。但是,在表達(dá)克隆方法中,通常使用質(zhì)粒載體并且,在這種情況下,必須使用可將目標(biāo)基因切割為相對小的DNA片段的限制酶,以便在不切割目標(biāo)基因任何內(nèi)部位點(diǎn)的情況下將片段插入質(zhì)粒載體中。并且該方法并不是對克隆各種酶基因都是可用的。而且,必須檢測大量克隆的酶活性,而該操作是很復(fù)雜的。
本發(fā)明人已嘗試通過使用柯斯質(zhì)粒載體并研究文庫中的柯斯質(zhì)??寺碚页霰磉_(dá)蛋白酶活性的克隆而分離蛋白酶基因,其中柯斯質(zhì)粒載體能替代質(zhì)粒載體保持大的DNA片段(30-50kb)以制備Pyrococcusfuriosus基因組的柯斯質(zhì)粒文庫。通過使用柯斯質(zhì)粒載體,除降低了該酶基因內(nèi)部位點(diǎn)的裂解可能性之外,減少了需要篩選的轉(zhuǎn)化體的個(gè)數(shù)。另一方面,由于柯斯質(zhì)粒載體在宿主中的拷貝不如質(zhì)粒載體的高,可能會(huì)使所表達(dá)的酶的量太少而不足以檢測其酶活。
從目標(biāo)酶的高的熱穩(wěn)定性來看,首先本發(fā)明人已分別培養(yǎng)了柯斯質(zhì)粒文庫中獨(dú)立的轉(zhuǎn)化體,并且將該步驟與制備僅含來自由此得到的微生物細(xì)胞的熱穩(wěn)定蛋白的溶胞產(chǎn)物的步驟結(jié)合起來。這一組溶胞產(chǎn)物被稱為柯斯質(zhì)粒蛋白文庫。通過在檢測酶活性中使用柯斯質(zhì)粒蛋白文庫,檢測敏感性比使用轉(zhuǎn)化體克隆的方法得到了提高。
另外,本發(fā)明通過用含明膠的凝膠進(jìn)行SDS聚丙烯酰胺凝膠電泳而使對痕量酶活性的檢測成為可能。根據(jù)該方法,可高敏感性地檢測濃縮在凝膠中的一條帶的樣品中的痕量蛋白酶活性。
用這種方法,本發(fā)明人已篩選了一個(gè)源自Pyrococcus furiosus的柯斯質(zhì)粒蛋白文庫并得到了幾個(gè)表達(dá)蛋白酶活性的柯斯質(zhì)??寺?。
而且,本發(fā)明人已用各種基因工程技術(shù)成功地從包含在該等克隆中的插入的DNA片段中分離了超熱穩(wěn)定的蛋白酶基因,并且還發(fā)現(xiàn)了該基因的表達(dá)產(chǎn)物是抗表面活性劑的。
將從該基因的核苷酸序列推測而來的超熱穩(wěn)定的蛋白酶的氨基酸序列與已知的來自微生物的蛋白酶的氨基酸序列進(jìn)行比較,該基因編碼的蛋白酶的前半部分的氨基酸序列與一組堿性蛋白酶的氨基酸序列同源,已表明堿性蛋白酶的代表性的例子是枯草蛋白酶,尤其是,發(fā)現(xiàn)在圍繞這四個(gè)已知對酶的催化活性很重要的殘基的區(qū)域中是高度同源的。因此,由于已證明產(chǎn)自Pyrococcus furiosus的蛋白酶保留有與來自的常溫菌(mesophiles)相似的結(jié)構(gòu),這也提示類似的蛋白酶也可由Pyrococcusfuriosus之外的其它超嗜熱菌產(chǎn)生,其中產(chǎn)自Pyrococcus furiosus的蛋白酶在如此高的溫度下仍是有活性的,而來自常溫菌的這些蛋白酶在此溫度下則是無活性的。
而且,本發(fā)明人已注意到這種可能性,即在所得到的超熱穩(wěn)定蛋白酶基因的核苷酸序列中,編碼區(qū)的核苷酸序列與枯草蛋白酶高度同源并且其類似物可被用作研究超熱穩(wěn)定蛋白酶基因的探針,并已試圖用PCR去檢測超嗜熱菌中的蛋白酶基因,其中PCR使用以上述核苷酸序列為基礎(chǔ)設(shè)計(jì)的合成的DNA為引物來克隆含蛋白酶基因的DNA片段。結(jié)果是,本發(fā)明人在一種超嗜熱菌Thermococcus celer DSM 2476中發(fā)現(xiàn)了一種蛋白酶基因并得到含該基因的DNA片段。而且,本發(fā)明人已確定由該DNA片段編碼的氨基酸序列包含與序列表中SEQ ID No.1所表示的超熱穩(wěn)定蛋白酶的氨基酸序列具有高度同源性的氨基酸序列。這樣,本發(fā)明人即完成了本發(fā)明。
也就是說,本發(fā)明提供了一種源自Pyrococcus furiosus的分離的超熱穩(wěn)定的蛋白酶基因,具體地說,是一種包含由序列表中SEQ ID No.1所表示的氨基酸序列的熱穩(wěn)定蛋白酶基因或其編碼該超熱穩(wěn)定蛋白酶活性部位的一部分,特別是,具有序列表中的SEQ ID No.2所表示的DNA序列的超熱穩(wěn)定蛋白酶基因。
另外,本發(fā)明提供了可與上述超熱穩(wěn)定蛋白酶基因雜交的超熱穩(wěn)定蛋白酶基因。例如,本發(fā)明提供了含有如序列表中SEQ ID No.7中所示的核苷酸序列的超熱穩(wěn)定蛋白酶基因。
而且,本發(fā)明提供了一種生產(chǎn)超熱穩(wěn)定蛋白酶的方法,包括培養(yǎng)用重組質(zhì)粒轉(zhuǎn)化的轉(zhuǎn)化體,并從培養(yǎng)物中收集超熱穩(wěn)定蛋白酶,其中本發(fā)明的超熱穩(wěn)定的蛋白酶基因已被插入到該重組質(zhì)粒中。
可通過篩選超嗜熱菌的基因文庫而獲取本發(fā)明的超熱穩(wěn)定蛋白酶基因。做為超嗜熱菌,可使用屬于Pyrococcus屬的細(xì)菌并且可通過對Pyrococcus furiosus基因組的柯斯質(zhì)粒文庫的篩選而得到所希望的基因。
例如,可使用Pyrococcus furiosus,DSM3638作為Pyrococcus furiosus,并且該菌株可從德意志微生物保藏中心獲得。
Pyrococcus furiosus的柯斯質(zhì)粒文庫的例子可按如下方法獲得用限制酶Sau3AI(Takara Shuzo有限公司生產(chǎn))部分消化Pyrococcusfuriosus的基因組DNA,得到DNA片段,用三螺旋柯斯質(zhì)粒載體(Stratagene生產(chǎn))連接DNA片段并使用體外包裝方法將其包裝入λ噬菌體顆粒中。接著,將該文庫轉(zhuǎn)導(dǎo)進(jìn)入合適的大腸桿菌如大腸桿菌DH5αMCR(BRL生產(chǎn))中。以獲得轉(zhuǎn)化體,接著培養(yǎng)它們,收集微生物細(xì)胞,將其進(jìn)行熱處理(100℃10分鐘),超聲破碎并接著再進(jìn)行熱處理(100℃10分鐘)。可通過進(jìn)行含明膠的SDS-聚酰胺凝膠電泳而對所得到的溶胞產(chǎn)物進(jìn)行蛋白酶活性篩選。
用這種方法,可以獲得一種含一種能表達(dá)蛋白酶的超熱穩(wěn)定的蛋白酶基因的柯斯質(zhì)??寺?,其中所表達(dá)的蛋白酶抗上述的熱處理。
進(jìn)一步,從上面所得的柯斯質(zhì)粒克隆制得的柯斯質(zhì)粒DNA可被合適的限制酶消化以產(chǎn)生片段,以制備將由此所得到的各片段插入其中的重組質(zhì)粒??赏ㄟ^用上述得到的質(zhì)粒轉(zhuǎn)化一個(gè)合適的微生物并測試所得到的轉(zhuǎn)化體所表達(dá)的蛋白酶活性而獲得含所希望的超熱穩(wěn)定蛋白酶基因的重組質(zhì)粒。
也就是說,從上面得到的柯斯質(zhì)粒克隆之一制備的柯斯質(zhì)粒DNA可被SphI(Takara Shuzo有限公司生產(chǎn))消化,接著將得到的DNA片段插入到一個(gè)質(zhì)粒載體pUC119(Takara Shuzo有限公司生產(chǎn))的Sph I位點(diǎn)以獲得重組質(zhì)粒。接下來,重組質(zhì)粒被導(dǎo)入大腸桿菌JM109中(Takara Shuzo有限公司生產(chǎn))并用篩選柯斯蛋白文庫的相同的方法檢測所得到的轉(zhuǎn)化體的蛋白酶活性。其有活性的轉(zhuǎn)化體被用于制備質(zhì)粒。
從下文的實(shí)施例中可以看到,重組質(zhì)粒之一被稱為pTPR1并且用該質(zhì)粒轉(zhuǎn)化的大腸桿菌JM109并稱為大腸桿菌JM109/pTPR1。
圖1示質(zhì)粒pTPR1的限制性圖譜。在圖1中,粗實(shí)線表示插入到質(zhì)粒載體pUC119中的DNA片段。重組質(zhì)粒含約7.0kb的SphI片段。
另外,大約2.5kb的不含超熱穩(wěn)定蛋白酶基因的DNA片段可被從重組質(zhì)粒中去除。也就是說,在三個(gè)約2.5kb,3.3kb和4.3kb的用Xba I(Takara Shuzo有限公司生產(chǎn))消化上述質(zhì)粒pTPR1而獲得的片段中,只有約2.5kb的片段被去除而其余的片段被連接并被導(dǎo)入大腸桿菌JM109中。用篩選柯斯質(zhì)粒蛋白文庫同樣的方法檢測所得到的轉(zhuǎn)化體的蛋白酶活性。所得到的具有蛋白酶活性的轉(zhuǎn)化體被用于制備質(zhì)粒。該質(zhì)粒被稱為pTPR9,用該質(zhì)粒轉(zhuǎn)化的大腸桿菌JM109被稱為大腸桿菌JM109/pTPR9。圖2示質(zhì)粒pTPR9的限制性圖譜。在圖2中,粗實(shí)線代表插入到質(zhì)粒載體pUC119中的DNA片段。
質(zhì)粒pTPR1和pTPR9所表達(dá)的蛋白酶活性都表現(xiàn)出很高的熱穩(wěn)定性。但是,由于在含明膠的SDS-聚丙烯酰胺凝膠上所看到的活性與上述柯斯質(zhì)??寺∷磉_(dá)的蛋白酶活性位置不同,估計(jì)這些質(zhì)粒在柯斯質(zhì)粒DNA的蛋白酶基因上有部分缺損??赏ㄟ^例如使用上述質(zhì)粒pTPR9的部分插入DNA片段為探針,從柯斯質(zhì)粒DNA獲得含蛋白酶基因全長的DNA片段。即,將用于制備質(zhì)粒pTPR1的柯斯質(zhì)粒DNA用Not I和幾個(gè)不切割任何插入到質(zhì)粒pTPR1中的DNA片段的內(nèi)部位點(diǎn)的限制酶(Takara Shuzo有限公司生產(chǎn))消化在瓊脂糖凝膠電泳之后,膠中的DNA片段被印跡到尼龍膜上。關(guān)于如上得到的膜,通過用得自插入到質(zhì)粒pTPR9中的DNA片段的約0.7kb的PstI-XbaI片段為探針去檢測含與PstI-XbaI片段的相同序列的DNA片段來進(jìn)行雜交。
在用兩個(gè)酶,Not I和Pvu II(Takara Shuzo有限公司生產(chǎn))消化的柯斯質(zhì)粒DNA中,一個(gè)約7.5kb的DNA片段可與PstI-XbaI片段雜交。該7.5kb的片段可被分離插入到質(zhì)粒載體pUC19(Takara Shuzo有限公司生產(chǎn))中,其中在該質(zhì)粒的HincII位點(diǎn)即在NotI和SmaI位點(diǎn)的中間被導(dǎo)入Not I接頭(Takara Shuzo有限公司生產(chǎn))。該質(zhì)粒被稱為pTPR12,用該質(zhì)粒轉(zhuǎn)化的大腸桿菌JM109被命名和稱為大腸桿菌JM109/pTPR12。根據(jù)布達(dá)佩斯條約該菌株于1994年5月24日(原始保藏日期)被保藏在國際貿(mào)易和工業(yè)省,工業(yè)科學(xué)和技術(shù)廳,國立生命科學(xué)和人體技術(shù)研究所,保藏號為FEPM BP-5103。
大腸桿菌JM109/pTPR12的溶胞產(chǎn)物表明在含明膠的SDS-聚丙烯酰胺凝膠電泳上其蛋白酶活性與柯斯質(zhì)??寺〉幕钚韵嗤?。圖3示質(zhì)粒pTPR12的限制性圖譜。在圖3中,粗實(shí)線是插入到質(zhì)粒載體pUC19中的DNA片段。
圖4示來源自Pyrococcus furiosus的分別被插入到質(zhì)粒pTPR1、pTPR9和pTPR12中的DNA片段和限制性圖譜。根據(jù)圖4,一個(gè)大約1kb的不含超熱穩(wěn)定蛋白酶基因的片段可被從插入到質(zhì)粒pTPR12中的DNA片段中去除。即,質(zhì)粒pTPR12被Xba I和Kpn I(Takara Shuzo,有限公司生產(chǎn))消化并且由此得到的約3.3kb的Xba I-Xba I片段和約3.2kb的Xba I-Kpn I片段被分別分離。接下來,首先,約3.2kb的Xba I-Kpn I片段被在Xba I和Kpn I之間的位點(diǎn)插入到質(zhì)粒載體pUC19中以制備重組質(zhì)粒。該質(zhì)粒被稱為pTPR14。圖5示其限制性圖譜。在圖5中,粗實(shí)線代表插入到質(zhì)粒載體pUC19中的DNA片段。
接下來,上述的約3.3kb的Xba I-Xba I片段被在Xba I位點(diǎn)插入到質(zhì)粒pTPR14中并且被導(dǎo)入大腸桿菌JM109中。用篩選柯斯質(zhì)粒蛋白文庫相同的方法檢測轉(zhuǎn)化體的蛋白酶活性。用具有活性的轉(zhuǎn)化體制備質(zhì)粒。該質(zhì)粒被稱為pTPR15,用該質(zhì)粒轉(zhuǎn)化的大腸桿菌JM109被稱為大腸桿菌JM109/pTPR15。圖6示pTPR15的限制性圖譜。在圖6中,粗實(shí)線代表被插入到質(zhì)粒載體pTPR19中的DNA片段。
而且,在來源自Pyrococcus furiosus并插入到質(zhì)粒pTPR15中的DNA片段的核苷酸序列中,約4.8kb的位于兩個(gè)Dra I位點(diǎn)之間的DNA片段的核苷酸序列示于序列表SEQ ID No.8中。即,序列表中的SEQ ID No.8是本發(fā)明的超熱穩(wěn)定的蛋白酶基因的核苷酸序列的一個(gè)例子。并且,自SEQID No.8的核苷酸序列推導(dǎo)的該基因產(chǎn)物的一個(gè)氨基酸序列被示于序列表SEQ ID No.9中。即,序列表中的SEQ ID No.9是用根據(jù)本發(fā)明得到的超熱穩(wěn)定蛋白酶基因產(chǎn)生的酶蛋白的氨基酸序列的一個(gè)實(shí)例。
因?yàn)橐呀?jīng)發(fā)現(xiàn)本發(fā)明的超熱穩(wěn)定蛋白酶基因被在包含在插入到上述質(zhì)粒pTPR15中的DNA片段中的Dra I片段中,所以可以制備僅包含該Dra I段的重組質(zhì)粒。
即,用Dra I(Takara Shuzo有限公司制)消化上述的質(zhì)粒pTPR15以分離所得到的約4.8kb的DNA片段。接著,可將片段在Sma I位點(diǎn)插入到質(zhì)粒載體pUC19k以制得重組質(zhì)粒。重組質(zhì)粒被稱為pTPR13,用該質(zhì)粒轉(zhuǎn)化的大腸桿菌JM109被稱為大腸桿菌JM109/pTPR13。
在一個(gè)含明膠的SDS-聚丙烯酰胺凝膠上,大腸桿菌JM109/pTPR13的溶胞產(chǎn)物表現(xiàn)出與柯斯質(zhì)??寺∪馨a(chǎn)物同樣的蛋白酶活性。圖7示質(zhì)粒pTPR13的限制性圖譜。在圖7中,粗實(shí)線代表插入到質(zhì)粒載體pUC19中的DNA片段。
另外,本發(fā)明的超熱穩(wěn)定蛋白酶基因可在枯草桿菌中表達(dá)。對枯草桿菌來說,枯草桿菌DB104可被使用,并且該菌株為描述在《基因》,Vol,83,pp 215-233(1989)的已知菌株。做為克隆載體,可使用質(zhì)粒pUB18-P43,并且該質(zhì)粒由Calgary大學(xué)Dr.Sui-Lam Wong贈(zèng)送。該質(zhì)粒含一個(gè)卡那霉素抗性基因做為選擇標(biāo)記。
上述的質(zhì)粒pTPR13可被Kpn I(Takara Shuzo有限公司產(chǎn))和BamHI(Takara Shuzo有限公司產(chǎn))消化以獲得約408kb的DNA片段,接著分離并將該片段連接在質(zhì)粒pUB 18-P43的KpnI和BamHI位點(diǎn)之間以得到重組質(zhì)粒。該質(zhì)粒被稱為pUBP13,被該質(zhì)粒轉(zhuǎn)化的枯草桿菌DB104并稱為枯草桿菌DB104/pUBP13。在一個(gè)含明膠的SDS-聚丙烯酰胺凝膠上,枯草桿菌DB104/pUBP 13的溶胞產(chǎn)物表現(xiàn)出與柯斯質(zhì)粒克隆的溶胞產(chǎn)物同樣的蛋白酶活性。圖8示質(zhì)粒pUBP13的限制性圖譜。在圖8中,粗實(shí)線代表插入到質(zhì)粒載體pUB18-P43中的DNA片段。
通過將序列表中SEQ ID No.9中所示的氨基酸序列同來自已知微生物的蛋白酶的氨基酸序列進(jìn)行比較,證明本發(fā)明的超熱穩(wěn)定蛋白酶的前半部分序列和一組堿性絲氨酸蛋白酶的序列具有同源性,其中堿性絲氨酸蛋白酶代表性的實(shí)例是枯草蛋白酶I《蛋白質(zhì)工程》,Vol,4,pp.719-737(1991)],更具體地說,在每個(gè)圍繞四個(gè)已知對蛋白酶活性起重要作用的氨基酸殘基的區(qū)域之間有高度的同源性。另一方面,在氨基酸序列的后半部分之間觀察不到這樣的同源性,并且因此認(rèn)為這一部分對蛋白酶活性來說可能不是必須的。因此,一個(gè)從其后半部分去掉了一個(gè)合適的肽鏈的突變蛋白酶可期望其有酶的活性。這類突變蛋白酶的實(shí)例包括含有對應(yīng)于序列表中SEQ ID No.9的氨基酸序列,其中第904位的氨基酸Ser及以后的序列已被去除的蛋白酶。該酶可用下述方法制得。
首先,從上面的質(zhì)粒pTPRl3制備一個(gè)約2.8kb的其EcoRI位點(diǎn)已被平末端的Kpn I-EcoR I片段并且該片段被連接在質(zhì)粒載體pUCl9的KpnI位點(diǎn)和平末端的Xba I位點(diǎn)之間。由此得到的包含在重組質(zhì)粒中的蛋白酶基因編碼對應(yīng)于序列表中SEQ ID No.9的氨基酸序列,除了編碼904位氨基酸Ser的TCA密碼子已被終止密碼子TAG取代并且后面的核苷酸序列已被刪去之外。該質(zhì)粒被稱為pTPR36,被質(zhì)粒轉(zhuǎn)化的大腸桿菌JM109被稱為JM109/pTPR36。在含明膠的SDS-聚丙烯凝膠上大腸桿菌JM109/pTPR36表現(xiàn)出蛋白酶活性。圖9示質(zhì)粒pTPR36的限制性圖譜。在圖9中,粗實(shí)線代表插入到質(zhì)粒載體pUC 119中的DNA片段。序列表中的SEQ ID No.2是包含在插入到質(zhì)粒pTPR36中的DNA片段的開放閱讀框的核苷酸序列。即,序列表中SEQ ID No.2是本發(fā)明所獲得的超熱穩(wěn)定的蛋白酶基因的核苷酸序列的一個(gè)實(shí)例。另外,序列表中SEQ ID No.1是由SEQ ID No.2的核苷酸序列的推導(dǎo)而來的基因產(chǎn)物的氨基酸序列。即,序列表中SEQ ID No.1是用本發(fā)明的超熱穩(wěn)定的蛋白酶基因制得的酶蛋白的氨基酸序列的一個(gè)實(shí)例。
如上所述,已經(jīng)發(fā)現(xiàn)通常存在于來自常溫菌的堿性絲氨酸蛋白酶中的區(qū)域在產(chǎn)自超嗜熱菌Pyrococcus furiosus的超熱穩(wěn)定蛋白酶的氨基酸序列中是保守的。因此,期望在Pyrococcus furiosus之外的超嗜熱菌所產(chǎn)的同樣類型的蛋白酶中有這樣的區(qū)域存在。即,有可能通過以序列表中SEQID No.2的部分核苷酸序列為基礎(chǔ)制備合適的合成DNA片段并用它們?yōu)樘结樆蛞锒玫脚c上述的超熱穩(wěn)定的蛋白酶相類似的超熱穩(wěn)定的蛋白酶的基因,其中合成DNA片段編碼與這些枯草蛋白酶等的氨基酸序列有高度同源性的氨基酸序列。
圖10、11和12示與本發(fā)明的與枯草蛋白酶等氨基酸序列有高度同源性的超熱穩(wěn)定的蛋白酶的氨基酸序列的區(qū)域中氨基酸序列,本發(fā)明的編碼這些區(qū)域的超熱穩(wěn)定蛋白酶基因的核苷酸序列,和以上述序列為基礎(chǔ)分別合成的寡核苷酸PRO-1F,PRO-2F,PRO-2R和PRO-4R的核苷酸序列之間的關(guān)系。另外,序列表中的SEQ ID No.3,4,5和6示寡核苷酸PRO-1F,PRO-2F,PRO-2R和PRO-4R的核苷酸序列。即,序列表的SEQ ID No.3,4,5和6是可用于通過雜交而檢測本發(fā)明的超熱穩(wěn)定蛋白酶基因的寡核苷酸的實(shí)例。
上述寡核苷酸的結(jié)合可被用作引物以各種超嗜熱菌的基因組DNA為模板來進(jìn)行PCR以檢測存在于超嗜熱菌中的蛋白酶基因。對超嗜熱菌來說,屬于Pyrococcus,Thermococcus,Staphylothermus,Thermobacteroides等屬的細(xì)菌可被利用。由于Thermococcus celer DSM2476屬于Thermococcus屬細(xì)菌,它可被使用并且該菌株可從德意志微生物保藏中心獲得。當(dāng)用Thermococcus celer DSM2476的基因組DNA為模板并以上面的寡核苷酸PRO-1F和PRO-2R的結(jié)合或PRO-2F和PRO-4R的結(jié)合做為引物進(jìn)行PCR時(shí),可看到DNA片段的特異性擴(kuò)增并可提示蛋白酶基因的存在。另外,可通過將該片段與合適的質(zhì)粒載體相連以制備重組質(zhì)粒并用雙脫氧法確定所插入的DNA片段的核苷酸序列來估測該片段所編碼的氨基酸序列的情況。
將用寡核苷酸PRO-1F和PRO-2R擴(kuò)增的約150bp的DNA片段和用寡核苷酸PRO-2F和PRO-4R擴(kuò)增的約550bp的DNA片段分別連入質(zhì)粒載體pUC18的Hinc II位點(diǎn)以獲得重組質(zhì)粒。重組質(zhì)粒分別稱為PIF-2R(2)和p2F-4R。序列表中SEQ ID 10示插入到質(zhì)粒p1F-2R(2)中的DNA片段的核苷酸序列以及由其推導(dǎo)而來的氨基酸的序列。序列表中的SEQ ID NO11示插入到質(zhì)粒p2F-4R中的DNA片段的核苷酸序列和由其推導(dǎo)而來的氨基酸序列。在序列表的SEQ ID NO 10所示的核苷酸序列中,第1位到第21位的核苷酸序列,第113位至第145位的核苷酸序列,在序列表的SEQ ID NO 11所示的核苷酸序列中,第1位到第32位的核苷酸序列和從第532位到第564位的核苷酸序列分別是來源自做為引物的寡核苷酸(分別對應(yīng)于寡核苷酸PRO-1F,PRO-2R,PRO-2F和PRO-4R)的核苷酸序列。在SEQ ID NO 10和11所示的氨基酸序列中,在來源于自本發(fā)明的Pyrococcus furiosus的超熱穩(wěn)定蛋白酶的氨基酸序列和來源于各種微生物的堿性絲氨酸蛋白酶之間的序列具有同源性,并且已知表明上述用PCR擴(kuò)增的DNA片段是用該蛋白酶基因?yàn)槟0鍞U(kuò)增的。
圖13示質(zhì)粒p2F-4R的限制性圖譜。在圖13中,粗實(shí)線表示插入到質(zhì)粒載體pUC18中的DNA片段。
另一方面,當(dāng)用Thermobacteroids Proteoliticus DSM5265和Staphylothermus Marinus DSM3639的基因組DNA作為模板時(shí),在Thermococcus celer中所觀察到的擴(kuò)增未被識別。
業(yè)已知PCR的基因擴(kuò)增的效率受引物31末端部分和模板DNA的退火效率的影響。甚至當(dāng)在上述的PCR中觀察不到擴(kuò)增的DNA片段時(shí),也可通過合成具不同的序列但編碼相同的氨基酸序列的寡核苷酸并用它們作為引物來對蛋白酶基因進(jìn)行檢測。另外,也可用這些寡核苷酸為探針對各種超嗜熱菌的基因組DNA進(jìn)行Southern雜交而對蛋白酶基因進(jìn)行檢測。
然后,上述的寡核苷酸或由上面的PCR得到的擴(kuò)增的DNA片段可被用作探針對超嗜熱菌的基因組DNA文庫進(jìn)行篩選以得到超熱穩(wěn)定蛋白酶基因,例如由Thermococcus celer制得的超熱穩(wěn)定蛋白酶基因。
做為Thermococcus celer的基因組DNA文庫的一個(gè)實(shí)例,可這樣制備一個(gè)文庫;用限制酶Sau 3AI部分消化Thermococcus celer DSM 2476的基因組DNA以獲得DNA片段,將片段與λGEM-11載體(Promega產(chǎn))連接并根據(jù)體外包裝方法將其包裝入λ噬菌體顆粒中。然后,該文庫被轉(zhuǎn)導(dǎo)進(jìn)入合適的大腸桿菌,如大腸桿菌LE592(Promega產(chǎn))中以在平板上形成噬菌斑,然后用上述PCR中獲得的擴(kuò)增的DNA片段進(jìn)行噬菌斑雜交。以這種方法,可以得到含超熱穩(wěn)定蛋白酶基因的噬菌體克隆。
而且,由如此得到的克隆制備的噬菌體DNA被合適的限制酶消化,在進(jìn)行瓊脂糖凝膠電泳后,凝膠中的DNA片段被印跡到尼龍膜上。使用如此得到的膜,用根據(jù)上面PCR而獲得的擴(kuò)增的DNA片段為探針進(jìn)行雜交以檢測含蛋白酶基因的DNA片段。
當(dāng)上述的噬菌體DNA用KpnI消化時(shí),一個(gè)約9kb的DNA片段與探針雜交并且該約9kb片段可被分離并插入到質(zhì)粒載體pUC 119的KpnI位點(diǎn)中以獲得重組質(zhì)粒。該質(zhì)粒被稱為pTC1,被該質(zhì)粒轉(zhuǎn)化的大腸桿菌JM109被稱為大腸桿菌JM109/pTC1。
圖14示質(zhì)粒pTC1的限制性圖譜。在圖14中,粗實(shí)線代表插入到質(zhì)粒載體pUC119中的DNA片段。
而且,可以將約4kb的不含超熱穩(wěn)定的蛋白酶基因的DNA片段從質(zhì)粒pTC1中去掉。即,將質(zhì)粒pTC1用Kpn I和幾個(gè)切割插入到質(zhì)粒pTC1中的片段內(nèi)的區(qū)域的限制酶消化,并且在瓊脂糖凝膠電泳之后,根據(jù)上面的用于噬菌體DNA的相同的方式檢測含蛋白酶基因的DNA片段。當(dāng)質(zhì)粒pTC4被KpnI和Bam HI消化時(shí),一個(gè)約5kb的DNA片段與探針雜交并且該約5kb的片段可被分離并導(dǎo)入質(zhì)粒載體pUC119的KpnI-BamH位點(diǎn)以獲得一個(gè)重組質(zhì)粒。該質(zhì)粒被稱為pTC3,被該質(zhì)粒轉(zhuǎn)化的大腸桿菌JM109被稱為大腸桿菌JM109/pTC3。圖15示質(zhì)粒pTC3的限制性圖譜。在圖15中,粗實(shí)線代表插入到質(zhì)粒載體pUC 119中的DNA片段。
包含在插入到質(zhì)粒pTC3中的DNA片段中的超熱穩(wěn)定蛋白酶基因的核苷酸序列可通過使用特異的引物即以序列表中SEQ ID NO 10和11所示的核苷酸序列為基礎(chǔ)的合成的合適的寡核苷酸做為引物進(jìn)行確定。SEQ ID NO 12,13,14,15,16和17代表曾被用作用于確定該超熱穩(wěn)定蛋白酶基因的核苷酸序列的引物的寡核苷酸TCE-2,TCE-4,SEF-3,SER-1,SER-3和TCE-6R的核苷酸序列。另外,序列表中SEQ ID NO 7代表由此得到的超熱穩(wěn)定性的蛋白酶基因的部分核苷酸序列。而且,SEQ ID N018代表本發(fā)明所得到的超熱穩(wěn)定蛋白酶基因編碼的酶的氨基酸序列的一個(gè)實(shí)例。在插入到質(zhì)粒pTC3的DNA片段中,來自λGEM-11載體的序列與由序列表中SEQ ID NO 7所代表的核苷酸序列的5′端相鄰,這提示在蛋白酶基因5′區(qū)的一部分具有陷損。另外,通過將該核苷酸序列與序列表中SEQ ID NO 10和11的核苷酸序列進(jìn)行比較,發(fā)現(xiàn)插入到質(zhì)粒pTC3中的DNA片段包含SEQ ID NO 10所表示的核苷酸序列中第41位和以后的核苷酸以及包含SEQ ID NO 11的全部的核苷酸序列。
盡管從Thermococcus celer得到的超熱穩(wěn)定蛋白酶基因是部分缺損的,但對本領(lǐng)域的技術(shù)人員顯而易見的是,可以這樣得到含超熱穩(wěn)定蛋白酶基因的全長的DNA片段,例如(1)通過重復(fù)篩選基因組DNA文庫,(2)通過對基因組DNA做Southern雜交,(3)通過使用盒(Cassette)(Takara Shuzo有限公司產(chǎn))和盒樣引物(Takara Shuzo有限公司制)的PCR獲得5′上游區(qū)的DNA片段(Takara Shuzo基因產(chǎn)品指南,1994-1995版.,250-251頁),等等。
一個(gè)含超熱穩(wěn)定蛋白酶基因的重組質(zhì)粒被導(dǎo)入其中的轉(zhuǎn)化體,如,大腸桿菌JM109/pTPR13或大腸桿菌JM109/pTPR36可被培養(yǎng)在常規(guī)條件下,如將轉(zhuǎn)化體在37℃培養(yǎng)在含100μg/ml氨芐青霉素的LB培養(yǎng)基中[胰蛋白胨(10g/升),酵母提取物(5g/升),NaCl(5g/升),pH7.2]中以在培養(yǎng)物中表達(dá)超熱穩(wěn)定的蛋白酶。在培養(yǎng)完成后,收集培養(yǎng)的細(xì)胞并將其超聲破碎并離心。將上清在100℃熱處理5分鐘以變性和去除污染蛋白。用這種方法,可得到粗酶樣品。由此從大腸桿菌JM109/pTPR13和大腸桿菌JM109/pTPR36得到的粗酶樣品被稱為PF-13和PF-36。
另外,含超熱穩(wěn)定蛋白酶基因的重組質(zhì)粒被轉(zhuǎn)導(dǎo)進(jìn)入其中的轉(zhuǎn)化體,枯草桿菌DB104/pUBP13可被培養(yǎng)在常規(guī)條件下,例如,將其培養(yǎng)在37℃含10μg/ml卡那霉素的LB培養(yǎng)基中以在培養(yǎng)物中表達(dá)超熱穩(wěn)定的蛋白酶。在完成培養(yǎng)之后,收集培養(yǎng)細(xì)胞并超聲破碎和離心。將上清100℃熱處理5分鐘以變性和去除污染蛋白,接著用硫酸銨鹽析后并透析。用這種方法,可得到部分純化的酶樣品。由此由枯草桿菌DB104/pUBP13得到的粗純化的酶樣品被稱為PF-BS13.
由轉(zhuǎn)化體生產(chǎn)的超熱穩(wěn)定蛋白酶樣品如PF-13,PF-36,和PF-BS13的酶促和物理化學(xué)特性如下所示,其中轉(zhuǎn)化體是將含本發(fā)明的來自Pyrococcus furiosus的超熱穩(wěn)定蛋白酶基因的重組質(zhì)粒被導(dǎo)入其中的轉(zhuǎn)化體。
(1)活化本發(fā)明獲得的酶水解明膠而形成短鏈多肽。另外,該酶等可水解酪蛋白而形成短鏈多肽。
(2)酶活檢測方法酶活的檢測是通過在SDS-聚丙烯酰胺凝膠上檢測該酶對明膠的水解而進(jìn)行。即,將待測酶樣品適當(dāng)稀釋并且向10μl樣品稀釋溶液中加入2.5μl樣品緩沖液(50mM Tris-HCl pH 7.6,5%SDS,5%2-巰基乙醇,0.005%溴酚蘭,50%甘油)。將混合液在100℃熱處理5分鐘,然后用含0.05%明膠的0.1%SDS-10%聚丙烯酰胺進(jìn)行電泳。在電泳結(jié)束之后,將凝膠浸在50mM的磷酸鉀緩沖液(pH7.0)中,并在95℃溫育2小時(shí)進(jìn)行酶促反應(yīng)。然后,將凝膠用溶于25%乙醇和10%乙酸的2.5%考馬斯亮蘭R250染色30分鐘,進(jìn)一步將凝膠轉(zhuǎn)移到25%乙醇和7%乙酸中3~15小時(shí)以去除多余的染料。被蛋白酶水解成肽的明膠在酶促反應(yīng)中擴(kuò)散到凝膠外,其相應(yīng)的位置不被考馬斯亮蘭染色,從而檢出蛋白酶活性的存在。本發(fā)明獲得的酶樣品PF-13,PF-36和PF-BF13在95℃具有明膠水解活性。
另外,除了使用了含0.05%酪蛋白的0.1%SDS-10%聚丙烯酰胺凝膠之外,根據(jù)上述的同樣方法檢測了酪蛋白水解活性。本發(fā)明得到的酶樣品PF-13,PF-36,和PF-BS13在95℃具有酪蛋白水解活性。
而且,用下述方法確定了本發(fā)明獲得的酶樣品PF-BS13的酪蛋白水解活性。向100μl 0.1M的含0.2%酪蛋白的磷酸鉀緩沖液中(pH7.0)加入100μ1適當(dāng)稀釋的酶溶液并在95℃溫育1小時(shí)。向其中加入100μl 15%三氯乙酸終止反應(yīng)并離心反應(yīng)混合物。通過測定280nm的吸光率確定包含在上清中的酸可溶的短鏈多肽的量,并且與不含酶的對照的吸光率進(jìn)行比較而確定酶活。本發(fā)明的酶樣品,PF-BS13在95℃pH7.0的實(shí)驗(yàn)條件下具有酪蛋白水解活性。
(3)穩(wěn)定性酶的穩(wěn)定性是通過用含明膠的SDS-聚丙烯酰胺凝膠的上述的方法(2)檢測被熱處理的酶的殘留的酶促活性而測定的。即,將酶樣品在95℃處理3小時(shí),然后對其合適量進(jìn)行酶活檢測,并與其未在95℃處理的樣品的活性相比較。盡管由于在95℃的溫育而使凝膠上酶活的位置有所改變,但卻幾乎沒有看到酶活的降低。本發(fā)明獲得的酶樣品PF-13,PF-36和PF-BS13在95℃熱處理3小時(shí)后仍是穩(wěn)定的。
另外,測試了本發(fā)明得到的酶樣品PF-13和PF-36在表面活性劑存在下的穩(wěn)定性。即,向酶樣品中加入終濃度為0.1%的Triton X-100,SDS或氯化芐烷銨。將混合物在95℃溫育3小時(shí)并取其合適量做酶活檢測。對每種表面活性劑來說,與不存在表面活性劑時(shí)相比,酶活性基本無變化。因此,本發(fā)明得到的酶樣品PF13和PF-36在表面活性劑的存在下在95℃熱處理3小時(shí)仍是穩(wěn)定的。
而且,用下述方法對本發(fā)明獲得的酶樣品,PF-BS13的穩(wěn)定性進(jìn)行了測試。即,這樣的酶樣品或加有1%終濃度的SDS的酶樣品在95℃溫育不同的時(shí)間段,并且用上述的以酸可溶多肽的量的增加為基礎(chǔ)的分光光度方法(2)來確定殘留的活性。圖16示本發(fā)明獲得的酶樣品,PF-BS13的熱穩(wěn)定性??v坐標(biāo)示殘留活性1%,而橫坐標(biāo)示溫育時(shí)間(hr)。在圖16中,空心三角代表不加SDS時(shí)得到的結(jié)果而實(shí)心三角代表含0.1%SDS時(shí)的結(jié)果。從圖16可看出,在95℃溫育4小時(shí)后不管0.1%SDS的存在與否,PF-BS13保留有幾乎100%的活性。
(4)各種試劑的影響將酶樣品加入到含明膠的SDS-聚丙烯酰胺凝膠上,然后在含2mMEDTA或2mM苯甲基磺酰氟(PMSF)的50mM磷酸鉀緩沖液(pH7.0)中進(jìn)行酶促反應(yīng)以檢測試劑對酶活的影響。本發(fā)明獲得的酶樣品PF-13,PF-36和PF-BS13在所觀察的含2mM EDTA和只含50mM磷酸鉀緩沖液之間的酶活性基本無差別。另一方面,當(dāng)使用含2mM PMSF的緩沖液時(shí),在所有樣品中的凝膠中水解的明膠的量減少,這表明酶樣品的活性被PMSF抑制。
(5)分子量在含明膠的SDS-聚丙烯酰胺凝膠上對本發(fā)明所得到的酶樣品的分子量進(jìn)行了估測。酶樣品,PF-13在95KD~51KD有多個(gè)活性帶。盡管由于根據(jù)所用樣品的量的不同等而使遷移距離有變化,84KDa,79KDa,66KDa,54KDa和51KDa的主要的帶都出現(xiàn)了。當(dāng)酶樣品在終濃度0.1%的SDS的存在下在95℃熱處理3小時(shí)后進(jìn)行電泳時(shí),63KDa和51KDa的帶增強(qiáng)了。對于酶樣品PF-BS13來說,獲得了與上面的酶樣品PF-13同樣的結(jié)果。對于酶樣品PF-36來說,除了63KDa和59KDa的主帶之外,還觀察到了幾個(gè)次要的帶。
(6)最適pH對本發(fā)明所獲得的酶樣品PF-13和PF-36的最適pH進(jìn)行了測試。在將酶樣品進(jìn)行含明膠的SDS-聚丙烯酰胺凝膠電泳之后,將凝膠浸在不同pH值的緩沖液中,進(jìn)行酶促反應(yīng)以測試最適pH。對于緩沖液,使用了pH4.0到6.0的50mM的乙酸鈉緩沖液,pH6.0到8.0的50mM的磷酸鉀緩沖液,pH9.0到10.0的50mM的硼酸鈉緩沖液。兩個(gè)酶樣品都在pH6.0到10.0具有明膠水解活性,其最適pH是pH8.0到9.0。
另外,用基于酸可溶多肽的量的增加的上述的分光光度法(2)對本發(fā)明獲得的酶樣品,PF-BF13的最適pH進(jìn)行了測定。用pH4.0~6.0的0.1M的乙酸鈉緩沖液,pH6.0~8.0的0.1M的磷酸鉀緩沖液,pH9.0~10.0的0.1M的在硼酸鈉緩沖液和pH11.0的0.1M的磷酸鈉氫氧化鈉緩沖液配制測定用的0.2%的酪蛋白溶液。圖17示本發(fā)明獲得的酶樣品PF-BS13的酪蛋白水解活性與pH之間的關(guān)系??v坐標(biāo)示相對活性而橫坐標(biāo)示pH。在圖17中,空心圓圈,實(shí)心圓圈,空心方塊和實(shí)心方塊代表通過使用分別用0.1M乙酸鈉緩沖液,0.1M磷酸鉀緩沖液、0.1M硼酸鈉緩沖液和0.1M磷酸鈉-氫氧化鈉緩沖液配制的底物溶液所得到的結(jié)果。從圖17可得到,酶樣品PF-BS13,在pH5.0~11.0有酪蛋白分解活性,其最適pH是9.0~10.0。
如上文所詳細(xì)描述的,根據(jù)本發(fā)明,可提供編碼超熱穩(wěn)定蛋白酶的基因以及用該基因生產(chǎn)超熱穩(wěn)定蛋白酶的工業(yè)方法。該酶具有高的熱穩(wěn)定性,并且還表現(xiàn)出對表面活性劑的抗性。因此,它們特別有用于對在高溫下對蛋白質(zhì)的熱處理。
另外,通過與本發(fā)明的分離基因雜交而得到的DNA片段或作為探針的該分離基因的部分核苷酸序列可被轉(zhuǎn)導(dǎo)入合適的微生物中,并且可根據(jù)對柯斯質(zhì)粒蛋白文庫所描述的同樣的方法制備其熱處理過的溶胞產(chǎn)物。然后,用適當(dāng)?shù)姆椒z測蛋白酶的活性。用這種方法,一種編碼一種其序列與上述的酶不同但卻具有類似活性的酶的超熱穩(wěn)定蛋白酶基因可被得到。
上述的雜交可在如下的條件下進(jìn)行。即,將固定在膜上的DNA在6×SSC中與探針一起在50℃溫育12-20小時(shí),其中6×SSC中含有0.5%SDS,0.1%牛血清白蛋白,0.1%聚乙烯吡咯烷酮,0.1%Ficoll 400,和0.01%變性鮭精DNA(1×SSC指0.15M NaCl和0.015M檸檬酸鈉,pH7.0)。在溫育結(jié)束之后,用如下方法洗膜開始用含0.5%SDS的2×SSC,在37℃洗,接著改變SSC的濃度至0.1×,并使溫度達(dá)50℃洗膜,直到來自固定的DNA的信號可與背景信號區(qū)別開來為止。
而且,本發(fā)明分離的基因,用部分分離的基因?yàn)橐锿ㄟ^體外基因擴(kuò)增方法獲得的DNA片段,或者通過用上面擴(kuò)增得到的片段為探針而雜交獲得的DNA片段被轉(zhuǎn)導(dǎo)入合適的微生物中,并且根據(jù)上述同樣的方法進(jìn)行蛋白酶活性測定。用這種方法,可獲得編碼其活性不與上述酶相同但卻相似的熱穩(wěn)定蛋白酶基因。
下面的實(shí)施例用于進(jìn)一步說明本發(fā)明,但不應(yīng)理解為對發(fā)明范圍的限制。在實(shí)施例中,所有的“百分比”都指重量百分比。
實(shí)施例1Pyrococcus furiosus基因組DNA的制備Pvrococcus furiosus DSM3638的培養(yǎng)如下。
將培養(yǎng)用培養(yǎng)基放入2升培養(yǎng)基的培養(yǎng)瓶中并在120℃滅菌20分鐘,其中培養(yǎng)基的組成有1%胰蛋白胨,0.5%酵母提取物,1%可溶性淀粉,3.5%Jamarin S·Solid(Jamarin實(shí)驗(yàn)室制)0.5%JamarinS·Liquid(Jamarin實(shí)驗(yàn)室制),0.03%MgSO4,0.001%NaCl,0.0001%FeSO4·7H2O,0.0001%CoSO4,0.0001%CaCl2·7H2O,0.0001%ZnSO4,0.1ppm CuSO4·5H2O,0.1ppm KAl(SO4)2,0.1ppm H3BO3,0.1ppmNa2MoO4·2H2O和0.25ppm NiCl2·6H2O。然后,向培養(yǎng)基中吹入氮?dú)庖詳D出溶解氧,并將上述菌轉(zhuǎn)接到培養(yǎng)基中,接著在95℃做平臺(tái)期培養(yǎng)16小時(shí)。培養(yǎng)結(jié)束后,離心收集細(xì)菌細(xì)胞。
接著,將收集的細(xì)胞懸于4ml含25%蔗糖的0.05M的Tris-HCl(pH8.0)中。并向該懸液中加入0.8ml溶菌酶[5mg/ml,0.25M Tris-HCl(pH8.0)]和2ml 0.2M EDTA。將混合物在20℃溫育1小時(shí)。然后,向混合物中加入24ml SET溶液[150mM NaCl,1mM EDTA和20mM Tris-HCl(pH8.0)]。以及進(jìn)一步加入4ml 5%SDS和400μl蛋白酶K(10mg/ml),并將混合物在37℃溫育1小時(shí)。在反應(yīng)結(jié)束之后,將反應(yīng)混合物用苯酚-氯仿抽提并用乙醇沉淀以制備約3.2mg基因組DNA。
柯斯質(zhì)粒蛋白文庫的制備將400μg Pyrococcus furiosus DSM3633的基因組DNA用Sau3AI部分消化并通過密度梯度超離心35~50 kb的大N1分級分離。然后,將1μg三股螺旋柯斯質(zhì)粒載體用XbaI消化,用堿性磷酸酶(Takara Shuzo有限公司產(chǎn))脫磷酸化,并進(jìn)一步用Bam HI消化。該載體與140μg上述被分級分離的35~50kb的DNA連接。Pyrococcus furiosus的基因組DNA片段被使用Gigapack Gold(Stratagene產(chǎn))的體外包裝方法包裝入λ噬菌體顆粒中以制備一個(gè)文庫。然后,使用這樣獲得的部分文庫,進(jìn)行向大腸桿菌DH5α MCR的轉(zhuǎn)導(dǎo),在所獲得的轉(zhuǎn)化體中,選擇幾個(gè)轉(zhuǎn)化體以制備柯斯質(zhì)粒DNA。在確定了有合適大小的插入片段的存在之后,從上述文庫中再選擇約500個(gè)轉(zhuǎn)化體,并將其獨(dú)立地培養(yǎng)在150ml含100μg/ml氨芐青霉素的LB培養(yǎng)基(胰蛋白胨·10g/升,酵母提取物5g/升,NaCl 5g/升,pH7.2)中。將每個(gè)培養(yǎng)物離心,回收的微生物細(xì)胞被懸浮于1ml20mM Tris-HCl(pH8.0)中,將該懸液在100℃熱處理10分鐘。然后,將懸液超聲破碎并再熱處理10分鐘。離心后作為上清得到的溶胞產(chǎn)物被用作柯斯質(zhì)粒蛋白文庫。
含超熱穩(wěn)定蛋白酶基因的柯斯質(zhì)粒的篩選蛋白酶活性的檢測是通過對聚丙烯酰胺凝膠中的水解明膠的測試而實(shí)現(xiàn)的。
即,從來自上面柯斯質(zhì)粒蛋白文庫的溶胞產(chǎn)物中取出5μl等分級分,并用含0.05%明膠的0.1%SDS-10%的聚丙烯酰胺凝膠進(jìn)行電泳。電泳結(jié)束后,將凝膠在50mM磷酸鉀緩沖液(pH7.0)中在95℃溫育2小時(shí)。將凝膠在25%乙醇和10%乙酸,和2.5%考馬斯亮蘭R-250中染色30分鐘。然后,將凝膠轉(zhuǎn)移到25%甲醇和7%乙酸中脫色3~15小時(shí)。篩選了8個(gè)具有蛋白酶活性的柯斯質(zhì)粒克隆,這些克隆在凝膠上顯示出由于明膠的水解而未被考馬斯亮蘭R250染色的帶。
含超熱穩(wěn)定蛋白酶基因的質(zhì)粒pTPR1的制備在8個(gè)具有蛋白酶活性的柯斯質(zhì)??寺≈羞x擇一個(gè)柯斯質(zhì)粒(304號柯斯質(zhì)粒)用于制備柯斯質(zhì)粒DNA,用Sph1消化柯斯質(zhì)粒DNA,然后將其連接到質(zhì)粒載體pUC119的SphI位點(diǎn)上。該重組質(zhì)粒被轉(zhuǎn)導(dǎo)進(jìn)入大腸桿菌JM109中,并根據(jù)用于柯斯質(zhì)粒蛋白文庫篩選的同樣方法對所得到的轉(zhuǎn)化體進(jìn)行了蛋白酶活性測定。從具有蛋白酶活性的轉(zhuǎn)化體制備了一種質(zhì)粒,所得到的重組質(zhì)粒被稱為pTPR1。該質(zhì)粒轉(zhuǎn)化的大腸桿菌JM109被稱為大腸桿菌JM109/pTPR1。
圖1示質(zhì)粒pTPR1的限制性圖譜。
含超熱穩(wěn)定蛋白酶基因的質(zhì)粒pTPR9的制備將上述的質(zhì)粒pTPR1用XbaI消化并進(jìn)行瓊脂糖凝膠電泳以分離為約2.5kb,3.3kb和4.3kb的三個(gè)DNA片段。在三個(gè)如此分離的片段中,回收為約3.3kb和4.3kb的兩個(gè)片段。將約4.3kb的DNA片段用堿性磷酸酶(Takara Shuzo有限公司生產(chǎn))脫磷酸化,然后與約3.3kb的DNA片段混合以使它們相互連接。將其轉(zhuǎn)導(dǎo)進(jìn)入大腸桿菌JM109中。用篩選柯斯質(zhì)粒蛋白文庫同樣的方法對所得到的轉(zhuǎn)化體蛋白酶活性進(jìn)行檢測。從具有蛋白酶活性的轉(zhuǎn)化體制備了一種質(zhì)粒。該質(zhì)粒稱為pTPR9,被該質(zhì)粒轉(zhuǎn)化的大腸桿菌JM109被稱為大腸桿菌JM109/pTPR9。
圖2示質(zhì)粒pTPR9的限制性圖譜對含全長的超熱穩(wěn)定蛋白酶基因的DNA片段的檢測將用于制備上述質(zhì)粒pTPR1的柯斯質(zhì)粒DNA用Not I消化,然后進(jìn)一步分別用Bam HI,Bln I,EcoT22I,Nsp(7524)V,PvuII,SalI,SmaI和SpeI消化。然后,將消化的DNA進(jìn)行0.8%的瓊脂糖凝膠電泳。在電泳后,將凝膠溶于含1.5M NaCl的0.5N NaOH中以變性凝膠中的DNA片段,然后在含3M NaCl的0.5M Tris-HCl(pH7.5)中將凝膠中和。通過Southern印跡將凝膠中的DNA片段印跡到Hybond-N+尼龍膜(Amasham制)上。在印跡之后,用6×SSC洗膜(1×SSC指0.15M NaCl,0.015M檸檬酸鈉,pH7.0),空氣干燥,用一個(gè)紫外透射儀(Transilluminator)用紫外照線3分鐘而將DNA固定在膜上。
另一方面,將質(zhì)粒pTPR9用Pst I和XbaI消化,并進(jìn)行1%的瓊脂糖凝膠電泳,回收分離的約0.7kb的DNA片段。通過用該DNA片段為模板,使用隨機(jī)引物DNA標(biāo)記試劑盒Ver 2(Takara Shuzo有限公司產(chǎn))和[α-32p]dCTP(Amasham產(chǎn)),制備一種32p標(biāo)記的DNA探針。
將上述的用于固定DNA的膜用雜交緩沖液(含0.5%SDS,0.1%牛血清白蛋白,0.1%聚乙烯吡咯烷酮,0.1%Ficoll 400和0.01%變性鮭精的6×SSC)在68℃處理2小時(shí)。然后,將其轉(zhuǎn)入同樣的含32p標(biāo)記DNA探針的雜交緩中液中在68℃雜交14小時(shí)。在雜交結(jié)束后,用含0.5%SDS的2×SSC在室溫洗膜,然后用含0.5%SDS的0.1×SSC在68℃洗膜。在用0.1×SSC漂洗膜之后,將其空氣干燥。用X-光膠片對膜在-80℃曝光60小時(shí)。將膠片顯影以制成放射自顯影圖。該放射自顯影圖表明在由NotI和PvuII消化柯斯質(zhì)粒DNA所獲得的約7.5kb的DNA片段中存在該蛋白酶基因。
含全長超熱穩(wěn)定蛋白酶基因的質(zhì)粒pTPR12的制備將用于制備上述質(zhì)粒pTPR1的柯斯質(zhì)粒DNA用NotI和PvuII消化,并進(jìn)行0.8%的瓊脂糖凝膠電泳以一起回收約7~8kb的DNA片段。將這些DNA片段與質(zhì)粒載體pUC19混合,其中在質(zhì)粒載體pUC19的Hinc II位點(diǎn)導(dǎo)入了一個(gè)Not I接頭并且其已被Not I和Sma I消化。然后,進(jìn)行連接反應(yīng)。重組質(zhì)粒被轉(zhuǎn)導(dǎo)進(jìn)入大腸桿菌JM109中,并且通過如用于篩選柯斯質(zhì)粒蛋白文庫的同樣的方法對所得到的轉(zhuǎn)化體的蛋白酶活性進(jìn)行檢測。從具有蛋白酶活性的轉(zhuǎn)化體中制備了一種質(zhì)粒。該質(zhì)粒被稱為pTPR12,被該質(zhì)粒轉(zhuǎn)化的大腸桿菌JM109稱為大腸桿菌JM109/pTPR12。
圖3示質(zhì)粒pTPR12的限制性圖譜。
含全長超熱穩(wěn)定蛋白酶基因的質(zhì)粒pTPR15的制備將上述的質(zhì)粒pTPR12用XbaI消化,并進(jìn)行1%瓊脂糖凝膠電泳以分別回收分離的約為3.3kb和7kb的兩個(gè)DNA片段。然后,將回收的約7kb的DNA片段用KpnI消化,再次進(jìn)行1%瓊脂糖凝膠電泳以分離約為3.2kb和3.8kb的兩個(gè)片段。在這些片段中,回收約3.2kb的片段并將其與用Xba I和Kpn I消化的質(zhì)粒載體pUC19連接。將其轉(zhuǎn)導(dǎo)入大腸桿菌JM109中。制備了得到的轉(zhuǎn)化體中所含的質(zhì)粒,并篩選了僅含單分子的上述3.2kb片段的質(zhì)粒。該質(zhì)粒被稱為pTPR14。
圖5示質(zhì)粒pTPR14的限制性圖譜。
然后,上述的質(zhì)粒pTPR14被XbaI消化并被用堿性磷酸酶去磷酸化。將其與上述的約3.3Kb的片段混合以進(jìn)行連接,并將其導(dǎo)入大腸桿菌JM109中。通過使用如用于柯斯質(zhì)粒蛋白文庫的篩選的同樣的方法對所獲得的轉(zhuǎn)化體的蛋白酶的活性進(jìn)行了篩選。從具有蛋白酶活性的轉(zhuǎn)化體制備了一種質(zhì)粒。該質(zhì)粒被稱為pTPR15,被該質(zhì)粒轉(zhuǎn)化的大腸桿菌JM109稱為大腸桿菌JM109/pTPR15。
圖6示質(zhì)粒pTPR15的限制性圖譜。
實(shí)施例2超熱穩(wěn)定蛋白酶基因核苷酸序列的確定為了確定插入上述質(zhì)粒pTPR15中的超熱穩(wěn)定蛋白酶基因的核苷酸序列,用Kilo。序列缺失試劑盒(Takara Shuzo有限公司產(chǎn))制備了插入到質(zhì)粒中的DNA片段部分被以各種長度缺失的缺失突變體。其中,選擇了幾個(gè)具適宜缺失長度的突變體,并用Bca BEST以雙脫氧測序試劑盒(由Takara Shuzo有限公司產(chǎn))通過雙脫氧法對各自插入DNA片段部分的核苷酸序列進(jìn)行了確定。綜合這些結(jié)果,包含于質(zhì)粒pIPR15中的插入DNA片段的核苷酸序列即被確定。在獲得的核苷酸序列中,序列表中的SEQ ID NO 8顯示了位于兩個(gè)Dra I位點(diǎn)之間的4765 bp的片段。而且,SEQ ID NO 9顯示了包含于上述核苷酸序列中的開放閱讀框所編碼的超熱穩(wěn)定蛋白酶的氨基酸序列。
含超熱穩(wěn)定蛋白酶基因的質(zhì)粒pTPR13的制備將上面的質(zhì)粒pTPR15用Dra I消化并進(jìn)行1%瓊脂糖凝膠電泳,接著回收約48kb的分離的DNA片段。然后,將質(zhì)粒載體pUC 9用SmaI消化,并且,在被堿性磷酸酶去磷酸化后,將其與上面的約48kb的DNA片段混合進(jìn)行連接并且被轉(zhuǎn)導(dǎo)進(jìn)入大腸桿菌JM109中。通過如用于柯斯質(zhì)粒蛋白文庫篩選的相同的方法對所得到的轉(zhuǎn)化體的蛋白酶活性進(jìn)行了檢測。從具有蛋白酶活性的轉(zhuǎn)化體中制備了一種質(zhì)粒。該質(zhì)粒被稱為pTPR13,該質(zhì)粒轉(zhuǎn)化的大腸桿菌JM109稱為大腸桿菌JM109/pTPR13。
圖7示質(zhì)粒pTPR13的限制性圖譜。
含超熱穩(wěn)定蛋白酶基因的用于枯草桿菌轉(zhuǎn)化的質(zhì)粒pUB13的制備將上面的質(zhì)粒pTPR13用KpnI和BamHI消化,然后進(jìn)行1%瓊脂糖凝膠電泳,接著回收分離約48 kb的DNA片段。然后,將質(zhì)粒載體pUB18-P43用KpnI和BamHI消化并與上面的約48kb的DNA片段混合以進(jìn)行連接。將其轉(zhuǎn)導(dǎo)進(jìn)入枯草桿菌DB104中。通過如用于柯斯質(zhì)粒蛋白文庫篩選的同樣的方法對所獲得含卡那霉素抗性的轉(zhuǎn)化體的蛋白酶活性進(jìn)行了檢測。從具有活性的轉(zhuǎn)化體中制備了一種質(zhì)粒。該質(zhì)粒被稱為pUB13,被該質(zhì)粒轉(zhuǎn)化的枯草桿菌DB104稱為枯草桿菌DB104/pUBP13。
圖8示質(zhì)粒pUBP13的限制性圖譜。
含后半部分缺失的超熱穩(wěn)定蛋白酶基因的質(zhì)粒pTPR36的制備將上述質(zhì)粒pTPR13用EcoRI消化,并將所得到的末端用DNA末端平齊試劑盒(Takara Shuzo有限公司造)進(jìn)行平齊化。進(jìn)一步,將其用KpnI消化并進(jìn)行1%瓊脂糖凝膠電泳,接著回收約2.8kb的分離的DNA片段。接下來,將質(zhì)粒載體pUC119用XbaI消化,并將所得開端平齊化。進(jìn)一步用KpnI消化,接著與上面的約2.8kb的DNA片段混合以進(jìn)行連接。并被轉(zhuǎn)導(dǎo)進(jìn)入大腸桿菌JM109中。
用柯斯質(zhì)粒蛋白文庫篩選的同樣方法對所獲得的轉(zhuǎn)化體的蛋白酶活性進(jìn)行了檢測。從具有活性的轉(zhuǎn)化體制備了一種質(zhì)粒。該質(zhì)粒被稱為pTPR36,被該質(zhì)粒轉(zhuǎn)化的大腸桿菌JM109稱為大腸桿菌JM109/pTPR36。
圖9示質(zhì)粒pTPR36的限制性圖譜。序列表中SEQ ID NO 2示插入到質(zhì)粒pTPR36中的DNA片段的核苷酸序列。而且,SEQ ID NO 1示可由該核苷酸序列編碼的超熱穩(wěn)定蛋白酶的氨基酸序列。
實(shí)施例3用于檢測超熱穩(wěn)定蛋白酶基因的寡核苷酸的制備通過將本發(fā)明實(shí)施例2中所得到的超熱穩(wěn)定蛋白酶的所估測的氨基酸序列與來自微生物的已知的堿性組氨酸蛋白酶的氨基酸序列相比較,發(fā)現(xiàn)通常在這些酶中有同源的氨基酸序列。其中,篩選了三個(gè)區(qū)域,并設(shè)計(jì)了在通過PCR檢測超熱穩(wěn)定蛋白酶基因中用作引物的寡核苷酸。
圖10、11和12示對應(yīng)于本發(fā)明的超熱穩(wěn)定蛋白酶的上述三個(gè)區(qū)域的氨基酸序列,編碼上述區(qū)域的本發(fā)明的超熱穩(wěn)定蛋白酶的核苷酸序列,以及以上述核苷酸序列為基礎(chǔ)合成的寡核苷酸PRO-1F,PRO-2F,PRO-2R和PRO-4R的核苷酸序列之間的關(guān)系。而且,SEQ NO3、4、5和6分別示PRO-1F,PRO-2F,PRO-2R和PRO-4R的核苷酸序列。
Thermococcus celer基因組DNA的制備通過離心從10ml獲自德意志微生物保藏中心的Thermococcus celerDSM 2476的培養(yǎng)肉湯中收集微生物細(xì)胞并將其懸于100μl含25%蔗糖的50mM的Tris-HCl(pH8.0)中。向懸液中加入20μl 0.5M EDTA和10μl溶菌酶(10mg/ml)并將懸液在20℃溫育1小時(shí)。向其中加入800μlSET溶液(150mM NaCl,1mM EDTA,20mM Tris-HCl,pH8.0),50μl 10%SDS和10μl蛋白酶K(20mg/ml),并將懸液在37℃繼續(xù)溫育37℃。用苯酚-氯仿抽提以終止反應(yīng)。將反應(yīng)混合物進(jìn)行乙醇沉淀并將回收的DNA溶解于50μl TE緩沖液中以獲得基因組DNA溶液。
通過PCR檢測超熱穩(wěn)定蛋白酶從上面的Thermococus celer的基因組DNA和寡核苷酸PRO-1F和PRO-2R或寡核苷酸PRO-2R和PRO-4R制備PCR反應(yīng)混合物,并進(jìn)行PCR反應(yīng)(一個(gè)循環(huán)是94℃1分鐘-55℃1分鐘-72℃1分鐘,35個(gè)循環(huán))。當(dāng)將反應(yīng)混合物的等分級分進(jìn)行瓊脂糖凝膠電泳后,在使用寡核苷酸PRO-1F和PRO-2R的情況下三個(gè)DNA片段的擴(kuò)增以及在使用寡核苷酸PRO-2F和PRO-4R的條件下一個(gè)DNA片段的擴(kuò)增被觀察到。從瓊脂糖凝膠上回收這些擴(kuò)增的片段并用DNA平齊化試劑盒將DNA末端平齊化,接著用T4多核苷酸激酶將其磷酸化(TakaraShuzo有限公司制)。然后,用Hinc II消化質(zhì)粒載體pUC18并用堿性磷酸酶將其去磷酸化。將其與上面的PCR擴(kuò)增的DNA片段混合以進(jìn)行連接,然后轉(zhuǎn)導(dǎo)進(jìn)入大腸桿菌JM109中。從所獲得的轉(zhuǎn)化體中制備質(zhì)粒,并篩選將合適的DNA片段插入其中的質(zhì)粒。插入DNA片段的核苷酸序列由雙脫氧法確定。在這些質(zhì)粒中,當(dāng)考慮到含用寡核苷酸PRO-1F和PRO-2R擴(kuò)增的約150bp的DNA片段的質(zhì)粒p1F-2R(2)和含用寡核苷酸PRO-2F和PRO-4R擴(kuò)增的約550bp的DNA片段的質(zhì)粒p2F-4R時(shí)發(fā)現(xiàn)由所得核苷酸序列推測而來的氨基酸序列含與來自本發(fā)明的Pyrococcus furiosus的超熱穩(wěn)定蛋白酶、枯草蛋白酶等的氨基酸序列具有同源性的氨基酸序列。
序列表中SEQ NO 10示插入到質(zhì)粒p1F-2R(2)中的DNA片段的核苷酸序列和由這核苷酸序列推導(dǎo)而來的氨基酸序列。而且,序列表中SEQ NO 11示插入到p2F-4R中的DNA片段的核苷酸序列和由該核苷酸序列推測而來的氨基酸序列。在序列表中SEQ NO 10所示的核苷酸序列中,從第1位到第21位的核苷酸序列以及從113位到145位的核苷酸序列,序列表中SEQ NO 11中第1位到32位核苷酸序列和從532位到564位核苷酸的序列是用于PCR的引物的序列(分別對應(yīng)于寡核苷酸PRO-1F,PRO-2R,PRO-2F和PRO-4R)。
圖13 p2F-4R的限制性圖譜。
對來自Thermococus Celer的蛋白酶基因的篩選上述的Thermococcus celer基因組DNA被Sau3AI部分消化并在dATP和dGTP的存在下被用klenow片段(由Takara Shuzo有限公司產(chǎn))處理以部分修復(fù)其DNA末端。將該DNA片段與λGEM-11 Xho I半位點(diǎn)臂載體(由Promega產(chǎn))混合以進(jìn)行連接。然后,將其通過Grgapack Gold進(jìn)行體外包裝以制備含Thermococcus celer基因組DNA的λ噬菌體文庫。部分文庫被轉(zhuǎn)導(dǎo)入大腸桿菌LE 392中以在平板上形成噬菌斑,將噬菌斑轉(zhuǎn)移到Hybond-N+膜上。在轉(zhuǎn)移之后,將膜用含1.5M NaCl的0.5NNaOH處理,并接著用含3M NaCl的0.5 Tris-HCl(pH 7.5)處理。進(jìn)一步,用6×SSC漂洗,空氣干燥而且在紫外透射儀上用紫外線照線以便將噬菌體的DNA固定在膜上。
另一方面,將質(zhì)粒p2F-4R用Pma CI(Takara Shuzo有限公司產(chǎn))和Stu I(Takara Shuzo有限公司產(chǎn))消化并上1%瓊脂糖凝膠電泳以回收約0.5kb的分離的DNA片段。用該片段為模板并使用隨機(jī)引物DNA標(biāo)記試劑盒Ver 2和[α-32P]dGTP制備了32P標(biāo)記的DNA探針。
將上面的固定有DNA的膜在雜交緩沖液(含0.5%SDS,0.1%牛血清白蛋白,0.1%聚乙烯吡咯烷酮,0.1 Ficoll 400和0.01%變性鮭精DNA的6×SSC)在50℃溫育2小時(shí)。將其轉(zhuǎn)到相同的含32P標(biāo)記DNA探針(prove)的緩沖液中在50℃雜交15小時(shí)。雜交結(jié)束后,用含0.5%SDS的2×SSC在室溫洗膜并且接著用含0.5%SDS的1×SSC在50℃洗膜。而且,在用1×SSC將膜漂洗后,空氣干燥并將X-光膠片在-80℃曝光6小時(shí)以制備放射自顯圖。篩選了約4,000個(gè)噬菌斑。結(jié)果得到了一個(gè)含蛋白酶基因的克隆。以放射自顯影的信號為基礎(chǔ),找到該噬菌斑克隆的位置,并且相應(yīng)于平板上用于轉(zhuǎn)膜的噬菌斑被分離進(jìn)入1ml含1%氯仿的SM緩沖液中[50mM Tris-HCl,0.1M NaCl,8mM MgSO4.0.01%明膠(pH 7.5)]。
含蛋白酶基因的噬菌體DNA片段的檢測將上面的噬菌體克隆轉(zhuǎn)導(dǎo)進(jìn)入大腸桿菌LE392中并將轉(zhuǎn)化體在37℃在NZCYM培養(yǎng)基中(由Bto 101產(chǎn))培養(yǎng)15小時(shí)以獲得培養(yǎng)肉湯。收集培養(yǎng)物肉湯的上清并且用QIAGEN-λ試劑盒(由DIAGEN)制備噬菌體DNA。分別用Bam HI,EcoRI,EcoRV,HincII,KpnI,NcoI,PstI,SacI,SalI,SmaI和SphI(都由Takara Shuzo有限公司產(chǎn))消化所得到的噬菌體DNA,并上1%瓊脂糖凝膠電泳。然后,用實(shí)施例1中用于檢測含超熱穩(wěn)定蛋白酶基因全長的DNA片段的同樣的方法制備了固定有DNA片段的膜。將膜用雜交緩沖液在56℃處理4小時(shí),然后轉(zhuǎn)移到與上述篩選來自Thermococcus celer的蛋白酶基因同樣的32P標(biāo)記的DNA探針的同樣的雜交的緩沖液中。然后,在50℃進(jìn)行雜交18小時(shí)。雜交結(jié)束后,用含0.5%SDS的1×SSC在50℃洗膜并用1×SSC漂洗。將膜用空氣干燥并用X-光膠片在-80℃日曝光2小時(shí)以進(jìn)行放射自顯影。根據(jù)這放射自顯圖發(fā)現(xiàn),在用KpnI消化的噬菌體DNA中,該蛋白酶基因被包含在一個(gè)約9kb的DNA片段中。
含蛋白酶基因的質(zhì)粒pTC1的制備將上述的含蛋白酶基因的噬菌體DNA用KpnI消化并進(jìn)行1%瓊脂糖凝膠電泳以便從凝膠中回收約9kb的DNA片段。接著將質(zhì)粒載體pUC119用KpnI消化,并用堿性磷酸酶去磷酸化,隨后將其與上述約9kb的DNA片段混合以進(jìn)行連接。然后,將其轉(zhuǎn)導(dǎo)入大腸桿菌JM109中。從所得到的轉(zhuǎn)化體中制備質(zhì)粒并篩選了只含上面的約9kb的DNA片段的質(zhì)粒。該質(zhì)粒被稱為pTC1,被該質(zhì)粒轉(zhuǎn)化的大腸桿菌JM109被稱為大腸桿菌JM109/pTC1。
圖14示質(zhì)粒pTC1的限制性圖譜。
含超熱穩(wěn)定蛋白酶基因的質(zhì)粒pTC3的制備將上述質(zhì)粒pTC1用KpnI消化并進(jìn)一步分別用Bam HI,Pst I和SphI消化。在1%瓊脂糖凝膠電泳后,按照檢測含上面的蛋白酶基因的噬菌體DNA片段的同樣的操作,將DNA片段轉(zhuǎn)移到膜上并進(jìn)行含超熱穩(wěn)定蛋白酶基因的DNA片段的檢測。根據(jù)所得到的放射自顯影圖的信號,表明通過將質(zhì)粒pTC1用KpnI和Bam HI消化而獲得的約5kb的DNA片段含有該超熱穩(wěn)定蛋白酶基因。
然后,將質(zhì)粒pTC1用Kpn I和Bam HI消化,接著上1%瓊脂糖凝膠電泳以分離一個(gè)約5kb的DNA片段。將質(zhì)粒載體使pUC119用Kpn I和Bam HI消化并與上述的約5kb的DNA片段混合以進(jìn)行連接。將其轉(zhuǎn)導(dǎo)入大腸桿菌JM109中。從所得到的轉(zhuǎn)化體制備質(zhì)粒并篩選了一個(gè)含上述約5kb的DNA片段的質(zhì)粒。該質(zhì)粒被稱為pTC3,被該質(zhì)粒轉(zhuǎn)化的大腸桿菌JM109稱為大腸桿菌JM109/pTC3。
圖15示質(zhì)粒pTC3的限制性圖譜。
包含于質(zhì)粒pTC3中的超熱穩(wěn)定蛋白酶基因的核苷酸序列的確定為了確定包含于上面的質(zhì)粒pTC3中的超熱穩(wěn)定蛋白酶基因的核苷酸序列,分別以序列表中SEQ NO 10和11中所示的核苷酸序列為基礎(chǔ)合成36個(gè)寡核苷酸。合成的寡核苷酸TCE-2,TCE-4,SEF-3,SER-1,SER-3和TCE-6R的核苷酸序列由序列表中SEQ NO 12,13,14,15,16和17所示。將用上面的寡核苷酸作為引物以及質(zhì)粒pTC3為模板的雙脫氧法獲得的結(jié)果綜合起來確定該超熱穩(wěn)定蛋白酶基因的核苷酸序列。
序列表中的SEQ ID NO 7示所得的核苷酸序列的一部分。另外,序列表中的SEQ OD NO 18示由推測的該核苷酸序列編碼的氨基酸的序列。
實(shí)施例4酶樣品的制備將含有本發(fā)明的實(shí)施例2中所獲得的超熱穩(wěn)定蛋白酶基因的質(zhì)粒pTPR36轉(zhuǎn)導(dǎo)入大腸桿菌JM109中而得到的大腸桿菌JM109/pTPR36并在37℃振蕩培養(yǎng)在含100μg/ml氨芐青霉素的5ml LB培養(yǎng)基(胰蛋白胨10g/L,酵母提取物5g/L,NaCl 5g/L,pH7.2)中達(dá)14小時(shí)。在一個(gè)1L的三角燒瓶中加入200ml同樣的培養(yǎng)基并接種入2ml上述的培養(yǎng)肉湯并且在37℃振蕩培養(yǎng)10小時(shí)。離心培養(yǎng)肉湯。將收獲的微生物細(xì)胞(濕重1.6g)懸于2ml 20mM的Tris-HCl(pH 8.0)中,并超聲破碎和離心以獲得上清。將上清在100℃處理5分鐘并再次離心。得到的上清被用做粗酶溶液酶樣品PF-36)。
另外,用同樣的方法,含本發(fā)明的超熱穩(wěn)定蛋白酶基因的質(zhì)粒pTPR13被轉(zhuǎn)導(dǎo)入大腸桿菌JM109中而得到的大腸桿菌JM109/pTPR13被用于制備粗酶溶液(酶樣品PF-13)。
而且,將含本發(fā)明的超熱穩(wěn)定蛋白酶基因的質(zhì)粒pUBP13轉(zhuǎn)導(dǎo)枯草桿菌DB104而得到的枯草桿菌DB104/pUBP13在37℃振蕩培養(yǎng)5ml含10μg/ml卡那霉素的LB培養(yǎng)基中達(dá)14小時(shí)。向兩個(gè)2L的三角瓶中分別接種600ml同樣的培養(yǎng)基。向每個(gè)培養(yǎng)瓶中分別接種2ml上面的培養(yǎng)肉湯并在37℃振蕩培養(yǎng)26小時(shí)。離心培養(yǎng)肉湯。將得到的微生物細(xì)胞懸浮于15ml 20mM Tris-HCl(pH8.0)中,超聲破碎并離心得到上清。將上清在100℃處理5分鐘并再次離心。向所得的上清中加入硫酸銨達(dá)到50%的飽和度并離心回收所得到的沉淀。將回收和沉淀懸浮于2ml 20mMTris-HCl(pH8.0)中并將懸液用同樣的緩沖液透析。所得到的內(nèi)部溶液被用作部分純化的酶樣品(酶樣品PF-B513)根據(jù)上面的用含明膠的SDS-聚丙烯酰胺凝膠檢測酶活性的方法對這些酶樣品和用于制備質(zhì)粒的柯斯質(zhì)??寺∪馨a(chǎn)物的蛋白酶活性進(jìn)行檢測。
圖16示本發(fā)明獲得的超熱穩(wěn)定蛋白酶的熱穩(wěn)定性。圖17示本發(fā)明所獲得的超熱穩(wěn)定蛋白酶的最適pH。而且,圖18示在每個(gè)樣品(酶樣品PF-36,PF-13和PF-BS13和溶胞產(chǎn)物)在SDS-聚丙烯酰胺凝膠電泳之后的結(jié)果。在存在SDS時(shí),每一樣品在95℃以顯示出活性。
如上文所描述的,根據(jù)本發(fā)明獲得了編碼在95℃表現(xiàn)活性的超熱穩(wěn)定蛋白酶的基因。這些基因便提供大量的高純度的超熱穩(wěn)定蛋白酶成為可能。
附圖簡述圖1示質(zhì)粒pTPR1的限制性圖譜。
圖2示質(zhì)粒pTPR9的限制性圖譜。
圖3示質(zhì)粒pTPR12的限制性圖譜。
圖4示包含于質(zhì)粒中的來自Pyrococcus furiosus的DNA的限制性圖譜的比較。
圖5示質(zhì)粒pTPR14的限制性圖譜。
圖6示質(zhì)粒pTPR15的限制性圖譜。
圖7示質(zhì)粒pTPR13的限制性圖譜。
圖8示質(zhì)粒pUBP13的限制性圖譜。
圖9示質(zhì)粒pUBR36的限制性圖譜。
圖10示寡核苷酸pRO-1F的設(shè)計(jì)。
圖11示寡核苷酸pRO-2F和pRO-2R的設(shè)計(jì)。
圖12示寡核苷酸pRO-4R的設(shè)計(jì)。
圖13示質(zhì)粒p2F-4R的限制性圖譜。
圖14示質(zhì)粒pTC1的限制性圖譜圖15示質(zhì)粒pTC3的限制性圖譜。
圖16示本發(fā)明所得到的超熱穩(wěn)定蛋白酶的熱穩(wěn)定性。
圖17示本發(fā)明所得到的超熱穩(wěn)定蛋白酶的最適pH。
圖18示本發(fā)明所獲得的超熱穩(wěn)定蛋白酶在含明膠的SDS-聚丙烯酰胺凝膠電泳后的活性染色圖。
序列表SEQ ID NO1序列長度903序列類型氨基酸鏈型單拓?fù)鋵W(xué)線性分子類型肽序列描述Met Asn Lys Lys Gly Leu Thr Val Leu Phe Ile Ala Ile Met Leu5 10 15Leu Ser Val Val Pro Val His Phe Val Ser Ala Glu Thr Pro Pro15 20 30Val Ser Ser Glu Asn Ser Thr Thr Ser Ile Leu Pro Asn Gln Gln35 40 45Val Val Thr Lys Glu Val Ser Gln Ala Ala Leu Asn Ala Ile Met50 55 60Lys Gly Gln Pro Asn Met Val Leu Ile Ile Lys Thr Lys Glu Gly65 70 75Lys Leu Glu Glu Ala Lys Thr Glu Leu Glu Lys Leu Gly Ala Glu80 85 90Ile Leu Asp Glu Asn Arg Val Leu Asn Met Leu Leu Val Lys Ile95 100 105Lys Pro Glu Lys Val Lys Glu Leu Asn Tyr Ile Ser Ser Leu Glu110 115 120Lys Ala Trp Leu Asn Arg Glu Val Lys Leu Ser Pro Pro Ile Val125 130 135Glu Lys Asp Val Lys Thr Lys Glu Pro Ser Leu Glu Pro Lys Met140 145 150Tyr Asn Ser Thr Trp Val Ile Asn Ala Leu Gln Phe Ile Gln Glu155 160 165Phe Gly Tyr Asp Gly Ser Gly Val Val Val Ala Val Leu Asp Thr170 175 180Gly Val Asp Pro Asn His Pro Phe Leu Ser Ile Thr Pro Asp Gly185 190 195Arg Arg Lys Ile Ile Glu Trp Lys Asp Phe Thr Asp Glu Gly Phe200 205 210Val Asp Thr Ser Phe Ser Phe Set Lys Val Val Asn Gly Thr Leu215 220 225Ile Ile Asn Thr Thr Phe Gln Val Ala Ser Gly Leu Thr Leu Asn230 235 240Glu Ser Thr Gly Leu Met Glu Tyr Val Val Lys Thr Val Tyr Val245 250 255Ser Asn Val Thr Ile Gly Asn Ile Thr Ser Ala Asn Gly Iie Tyr260 265 270His Phe Gly Leu Leu Pro Glu Arg Tyr Phe Asp Leu Asn Phe Asp275 280 285Gly Asp Gln Glu Asp Phe Tyr Pro Val Leu Leu Val Asn Ser Thr290 295 300Gly Asn Gly Tyr Asp Ile Ala Tyr Val Asp Thr Asp Leu Asp Tyr305 310 315Asp Phe Thr Asp Glu Val Pro Leu Gly Gln Tyr Asn Val Thr Tyr320 325 330Asp Val Ala Val Phe Ser Tyr Tyr Tyr Gly Pro Leu Asn Tyr Val335 340 345Leu Ala Glu Ile Asp Pro Asn Gly Glu Tyr Ala Val Phe Gly Trp350 355 360Asp Gly His Gly His Gly Thr His Val Ala Gly Thr Val Ala Gly365 370 375Tyr Asp Ser Asn Asn Asp Ala Trp Asp Trp Leu Ser Met Tyr Ser380 385 390Gly Glu Trp Glu Val Phe Ser Arg Leu Tyr Gly Trp Asp Tyr Thr395 400 405Asn Val Thr Thr Asp Thr Val Gln Gly Val Ala Pro Gly Ala Gln410 415 420Ile Met Ala Ile Arg Val Leu Arg Ser Asp Gly Arg Gly Ser Met425 430 435Trp Asp Ile Ile Glu Gly Met Thr Tyr Ala Ala Thr His Gly Ala440 445 450Asp Val Ile Ser Met Ser Leu Gly Gly Asn Ala Pro Tyr Leu Asp455 460 465Gly Thr Asp Pro Glu Ser Val Ala Val Asp Glu Leu Thr Glu Lys470 475 480Tyr Gly Val Val Phe Val Ile Ala Ala Gly Asn Glu Gly Pro Gly485 490 495Ile Asn Ile Val Gly Ser Pro Gly Val Ala Thr Lys Ala Ile Thr500 505 510Val Gly Ala Ala Ala Val Pro Ile Asn Val Gly Val Tyr Val Ser515 520 525Gln Ala Leu Gly Tyr Pro Asp Tyr Tyr Gly Phe Tyr Tyr Phe Pro530 535 540Ala Tyr Thr Asn Val Arg Ile Ala Phe Phe Ser Ser Arg Gly Pro545 550 555Arg Ile Asp Gly Glu Ile Lys Pro Asn Val Val Ala Pro Gly Tyr560 565 570Gly Ile Tyr Ser Ser Leu Pro Met Trp Ile Gly Gly Ala Asp Phe575 580 585Met Ser Gly Thr Ser Met Ala Thr Pro His Val Ser Gly Val Val590 595 600Ala Leu Leu Ile Ser Gly Ala Lys Ala Glu Gly Ile Tyr Tyr Asn605 610 615Pro Asp Ile Ile Lys Lys Val Leu Glu Ser Gly Ala Thr Trp Leu620 625 630Glu Gly Asp Pro Tyr Thr Gly Gln Lys Tyr Thr Glu Leu Asp Gln635 640 645Gly His Gly Leu Val Asn Val Thr Lys Ser Trp Glu Ile Leu Lys650 655 660Ala Ile Asn Gly Thr Thr Leu Pro Ile Val Asp His Trp Ala Asp665 670 675Lys Ser Tyr Ser Asp Phe Ala Glu Tyr Leu Gly Val Asp Val Ile680 685 690Arg Gly Leu Tyr Ala Arg Asn Ser Ile Pro Asp Ile Val Glu Trp695 700 705His Ile Lys Tyr Val Gly Asp Thr Glu Tyr Arg Thr Phe Glu Ile710 715 720Tyr Ala Thr Glu Pro Trp Ile Lys Pro Phe Val Ser Gly Ser Val725 730 735Ile Leu Glu Asn Asn Thr Glu Phe Val Leu Arg Val Lys Tyr Asp740 745 750Val Glu Gly Leu Glu Pro Gly Leu Tyr Val Gly Arg Ile Ile Ile755 760 765Asp Asp Pro Thr Thr Pro Val Ile Glu Asp Glu Ile Leu Asn Thr770 775 780Ile Val Ile Pro Glu Lys Phe Thr Pro Glu Asn Asn Tyr Thr Leu785 790 795Thr Trp Tyr Asp Ile Asn Gly Pro Glu Met Val Thr His His Phe800 805 810Phe Thr Val Pro Glu Gly Val Asp Val Leu Tyr Ala Met Thr Thr815 820 825Tyr Trp Asp Tyr Gly Leu Tyr Arg Pro Asp Gly Met Phe Val Phe830 835 840Pro Tyr Gln Leu Asp Tyr Leu Pro Ala Ala Val Ser Asn Pro Met845 850 855Pro Gly Asn Trp Glu Leu Val Trp Thr Gly Phe Asn Phe Ala Pro860 865 870Leu Tyr Glu Ser Gly Phe Leu Val Arg Ile Tyr Gly Val Glu Ile875 880 885Thr Pro Ser Val Trp Tyr Ile Asn Arg Thr Tyr Leu Asp Thr Asn890 895 900Thr Glu PheSEQ ID NO 2序列長度2835序列類型核酸鏈型雙拓?fù)鋵W(xué)線性分子類型基因組DNA序列描述TTTAAATTAT AAGATATAAT CACTCCGAGT GATGAGTAAG ATACATCATT ACAGTCCCAA 60AATGTTTATA ATTGGAACGC AGTGAATATA CAAAATGAAT ATAACCTCGG AGGTGACTGT 120AGAATGAATA AGAAGGGACT TACTGTGCTA TTTATAGCGA TAATGCTCCT TTCAGTAGTT 180CCAGTGCACT TTGTGTCCGC AGAAACACCA CCGGTTAGTT CAGAAAATTC AACAACTTCT 240ATACTCCCTA ACCAACAAGT TGTGACAAAA GAAGTTTCAC AAGCGGCGCT TAATGCTATA 300ATGAAAGGAC AACCCAACAT GGTTCTTATA ATCAAGACTA AGGAAGGCAA ACTTGAAGAG 360GCAAAAACCG AGCTTGAAAA GCTAGGTGCA GAGATTCTTG ACGAAAATAG AGTTCTTAAC 420ATGTTGCTAG TTAAGATTAA GCCTGAGAAA GTTAAAGAGC TCAACTATAT CTCATCTCTT 480GAAAAAGCCT GGCTTAACAG AGAAGTTAAG CTTTCCCCTC CAATTGTCGA AAAGGACGTC 540AAGACTAAGG AGCCCTCCCT AGAACCAAAA ATGTATAACA GCACCTGGGT AATTAATGCT 600CTCCAGTTCA TCCAGGAATT TGGATATGAT GGTAGTGGTG TTGTTGTTGC AGTACTTGAC 660ACGGGAGTTG ATCCGAACCA TCCTTTCTTG AGCATAACTC CAGATGGACG CAGGAAAATT 720ATAGAATGGA AGGATTTTAC AGACGAGGGA TTCGTGGATA CATCATTCAG CTTTAGCAAG 780GTTGTAAATG GGACTCTTAT AATTAACACA ACATTCCAAG TGGCCTCAGG TCTCACGCTG 840AATGAATCGA CAGGACTTAT GGAATACGTT GTTAAGACTG TTTACGTGAG CAATGTGACC 900ATTGGAAATA TCACTTCTGC TAATGGCATC TATCACTTCG GCCTGCTCCC AGAAAGATAC 960ATTGGAAATA TCACTTCTGC TAATGGCATC TATCACTTCG GCCTGCTCCC AGAAAGATAC 960TTCGACTTAA ACTTCGATGG TGATCAAGAG GACTTCTATC CTGTCTTATT AGTTAACTCC 1020ACTGGCAATG GTTATGACAT TGCATATGTG GATACTGACC TTGACTACGA CTTCACCGAC 1080GAAGTTCCAC TTGGCCAGTA CAACGTTACT TATGATGTTG CTGTTTTTAG CTACTACTAC 1140GGTCCTCTCA ACTACGTGCT TGCAGAAATA GATCCTAACG GAGAATATGC AGTATTTGGG 1200TGGGATGGTC ACGGTCACGG AACTCACGTA GCTGGAACTG TTGCTGGTTA CGACAGCAAC 1260AATGATGCTT GGGATTGGCT CAGTATGTAC TCTGGTGAAT GGGAAGTGTT CTCAAGACTC 1320TATGGTTGGG ATTATACGAA CGTTACCACA GACACCGTGC AGGGTGTTGC TCCAGGTGCC 1380CAAATAATGG CAATAAGAGT TCTTAGGAGT GATGGACGGG GTAGCATGTG GGATATTATA 1440GAAGGTATGA CATACGCAGC AACCCATGGT GCAGACGTTA TAAGCATGAG TCTCGGTGGA 1500AATGCTCCAT ACTTAGATGG TACTGATCCA GAAAGCGTTG CTGTGGATGA GCTTACCGAA 1560AAGTACGGTG TTGTATTCGT AATAGCTGCA GGAAATGAAG GTCCTGGCAT TAACATCGTT 1620GGAAGTCCTG GTGTTGCAAC AAAGGCAATA ACTGTTGGAG CTGCTGCAGT GCCCATTAAC 1680GTTGGAGTTT ATGTTTCCCA AGCACTTGGA TATCCTGATT ACTATGGATT CTATTACTTC 1740CCCGCCTACA CAAACGTTAG AATAGCATTC TTCTCAAGCA GAGGGCCGAG AATAGATGGT 1800GAAATAAAAC CCAATGTAGT GGCTCCAGGT TACGGAATTT ACTCATCCCT GCCGATGTGG 1860ATTGGCGGAG CTGACTTCAT GTCTGGAACT TCGATGGCTA CTCCACATGT CAGCGGTGTC 1920GTTGCACTCC TCATAAGCGG GGCAAAGGCC GAGGGAATAT ACTACAATCC AGATATAATT 1980AAGAAGGTTC TTGAGAGCGG TGCAACCTGG CTTGAGGGAG ATCCATATAC TGGGCAGAAG 2040TACACTGAGC TTGACCAAGG TCATGGTCTT GTTAACGTTA CCAAGTCCTG GGAAATCCTT 2100AAGGCTATAA ACGGCACCAC TCTCCCAATT GTTGATCACT GGGCAGACAA GTCCTACAGC 2160GACTTTGCGG AGTACTTGGG TGTGGACGTT ATAAGAGGTC TCTACGCAAG GAACTCTATA 2220CCTGACATTG TCGAGTGGCA CATTAAGTAC GTAGGGGACA CGGAGTACAG AACTTTTGAG 2280ATCTATGCAA CTGAGCCATG GATTAAGCCT TTTGTCAGTG GAAGTGTAAT TCTAGAGAAC 2340AATACCGAGT TTGTCCTTAG GGTGAAATAT GATGTAGAGG GTCTTGAGCC AGGTCTCTAT 2400GTTGGAAGGA TAATCATTGA TGATCCAACA ACGCCAGTTA TTGAAGACGA GATCTTGAAC 2460ACAATTGTTA TTCCCGAGAA GTTCACTCCT GAGAACAATT ACACCCTCAC CTGGTATGAT 2520ATTAATGGTC CAGAAATGGT GACTCACCAC TTCTTCACTG TGCCTGAGGG AGTGGACGTT 2580CTCTACGCGA TGACCACATA CTGGGACTAC GGTCTGTACA GACCAGATGG AATGTTTGTG 2640TTCCCATACC AGCTAGATTA TCTTCCCGCT GCAGTCTCAA ATCCAATGCC TGGAAACTGG 2700GAGCTAGTAT GGACTGGATT TAACTTTGCA CCCCTCTATG AGTCGGGCTT CCTTGTAAGG 2760ATTTACGGAG TAGAGATAAC TCCAAGCGTT TGGTACATTA ACAGGACATA CCTTGACACT 2820AACACTGAAT TCTAG 2835SEQ ID NO3序列長度35序列類型核酸鏈型單拓?fù)鋵W(xué)線性分子類型其它核酸(合成的DNA)序列描述GGWWSDRRTG TTRRHGTHGC DGTDMTYGAC ACSGG35SEQ ID NO4序列長度32序列類型核酸鏈型單拓?fù)鋵W(xué)線性分子類型其它核酸(合成的DNA)序列描述KSTCACGGAA CTCACGTDGC BGGMACDGTT GC 32SEQ ID NO5序列長度33序列類型核酸鏈型單拓?fù)鋵W(xué)線性分子類型其它核酸(合成的DNA)序列描述ASCMGCAACH GTKCCVGCHA CGTGAGTTCC GTG33SEQ ID NO6序列長度34序列類型核酸鏈型單拓?fù)鋵W(xué)線性分子類型其它核酸(合成的DNA)序列描述CHCCGSYVAC RTGBGGAGWD GCCATBGAVG TDCC 34SEQ ID NO7序列長度898序列類型核酸鏈型雙拓?fù)鋵W(xué)線性分子類型基因組DNA序列描述GATCTGAAGG GCAAGGTCAT AGGCTGGTAC GACGCCGTCA ACGGCAGGTC GACCCCCTAC 60GATGACCAGG GACACGGAAC CCACGTTGCG GGTATCGTTG CCGGAACCGG CAGCGTTAAC 120TCCCAGTACA TAGGCGTCGC CCCCGGCGCG AAGCTCGTCG GCGTCAAGGT TCTCGGTGCC 180GACGGTTCGG GAAGCGTCTC CACCATCATC GCGGGTGTTG ACTGGGTCGT CCAGAACAAG 240GACAAGTACG GGATAAGGGT CATCAACCTC TCCCTCGGCT CCTCCCAGAG CTCCGACGGA 300ACCGACTCCC TCAGTCAGGC CGTCAACAAC GCCTGGGACG CCGGTATAGT AGTCTGCGTC 360GCCGCCGGCA ACAGCGGGCC GAACACCTAC ACCGTCGGCT CACCCGCCGC CGCGAGCAAG 420GTCATAACCG TCGGTGCAGT TGACAGCAAC GACAACATCG CCAGCTTCTC CAGCAGGGGA 480CCGACCGCGG ACGGAAGGCT CAAGCCGGAA GTCGTCGCCC CCGGCGTTGA CATCATAGCC 540CCGCGCGCCA GCGGAACCAG CATGGGCACC CCGATAAACG ACTACTNCAA CAAGGGCTCT 600GGATCCAGCA TGGACACCCC GCACGTTTCG GGCGTTGGCG GGCTCATCCT CCAGGCCCAC 660CCGAGCTGGA CCCCGGACAA GGTGAAGACG CCCTCATCGA GACCGCCGAC ATAGTCGNCC 720CCAAGGAGAT AGCGGACATC GCCTACGGTG CGGGTAGGGT GAACGTCTTC AAGGGCATCA 780AGTNCGACGA CTACGNCAAG NTCACCTTCA CCGGNTCCGT CGGCGACAAG GGAAGGGGCA 840CCACACCTTC GACGTCAGNG GGGGCACTTC GTGAACGNCA CCCTCTNCTN GGACANGG898SEQ ID NO8序列長度4765序列類型核酸鏈型雙拓?fù)鋵W(xué)線性分子類型基因組DNA序列描述TTTAAATTAT AAGATATAAT CACTCCGAGT GATGAGTAAG ATACATCATT ACAGTCCCAA 60AATGTTTATA ATTGGAACGC AGTGAATATA CAAAATGAAT ATAACCTCGG AGGTGACTGT120AGAATGAATA AGAAGGGACT TACTGTGCTA TTTATAGCGA TAATGCTCCT TTCAGTAGTT180CCAGTGCACT TTGTGTCCGC AGAAACACCA CCGGTTAGTT CAGAAAATTC AACAACTTCT240ATACTCCCTA ACCAACAAGT TGTGACAAAA GAAGTTTCAC AAGCGGCGCT TAATGCTATA300ATGAAAGGAC AACCCAACAT GGTTCTTATA ATCAAGACTA AGGAAGGCAA ACTTGAAGAG360GCAAAAACCG AGCTTGAAAA GCTAGGTGCA GAGATTCTTG ACGAAAATAG AGTTCTTAAC420ATGTTGCTAG TTAAGATTAA GCCTGAGAAA GTTAAAGAGC TCAACTATAT CTCATCTCTT480GAAAAAGCCT GGCTTAACAG AGAAGTTAAG CTTTCCCCTC CAATTGTCGA AAAGGACGTC540AAGACTAAGG AGCCCTCCCT AGAACCAAAA ATGTATAACA GCACCTGGGT AATTAATGCT600CTCCAGTTCA TCCAGGAATT TGGATATGAT GGTAGTGGTG TTGTTGTTGC AGTACTTGAC660ACGGGAGTTG ATCCGAACCA TCCTTTCTTG AGCATAACTC CAGATGGACG CAGGAAAATT720ATAGAATGGA AGGATTTTAC AGACGAGGGA TTCGTGGATA CATCATTCAG CTTTAGCAAG780GTTGTAAATG GGACTCTTAT AATTAACACA ACATTCCAAG TGGCCTCAGG TCTCACGCTG840AATGAATCGA CAGGACTTAT GGAATACGTT GTTAAGACTG TTTACGTGAG CAATGTGACC900ATTGGAAATA TCACTTCTGC TAATGGCATC TATCACTTCG GCCTGCTCCC AGAAAGATAC960TTCGACTTAA ACTTCGATGG TGATCAAGAG GACTTCTATC CTGTCTTATT AGTTAACTCC 1020ACTGGCAATG GTTATGACAT TGCATATGTG GATACTGACC TTGACTACGA CTTCACCGAC 1080GAAGTTCCAC TTGGCCAGTA CAACGTTACT TATGATGTTG CTGTTTTTAG CTACTACTAC 1140GGTCCTCTCA ACTACGTGCT TGCAGAAATA GATCCTAACG GAGAATATGC AGTATTTGGG 1200TGGGATGGTC ACGGTCACGG AACTCACGTA GCTGGAACTG TTGCTGGTTA CGACAGCAAC 1260AATGATGCTT GGGATTGGCT CAGTATGTAC TCTGGTGAAT GGGAAGTGTT CTCAAGACTC 1320TATGGTTGGG ATTATACGAA CGTTACCACA GACACCGTGC AGGGTGTTGC TCCAGGTGCC 1380CAAATAATGG CAATAAGAGT TCTTAGGAGT GATGGACGGG GTAGCATGTG GGATATTATA 1440GAAGGTATGA CATACGCAGC AACCCATGGT GCAGACGTTA TAAGCATGAG TCTCGGTGGA 1500AATGCTCCAT ACTTAGATGG TACTGATCCA GAAAGCGTTG CTGTGGATGA GCTTACCGAA 1560AAGTACGGTG TTGTATTCGT AATAGCTGCA GGAAATGAAG GTCCTGGCAT TAACATCGTT 1620GGAAGTCCTG GTGTTGCAAC AAAGGCAATA ACTGTTGGAG CTGCTGCAGT GCCCATTAAC 1680GTTGGAGTTT ATGTTTCCCA AGCACTTGGA TATCCTGATT ACTATGGATT CTATTACTTC 1740CCCGCCTACA CAAACGTTAG AATAGCATTC TTCTCAAGCA GAGGGCCGAG AATAGATGGT 1800GAAATAAAAC CCAATGTAGT GGCTCCAGGT TACGGAATTT ACTCATCCCT GCCGATGTGG 1860ATTGGCGGAG CTGACTTCAT GTCTGGAACT TCGATGGCTA CTCCACATGT CAGCGGTGTC 1920GTTGCACTCC TCATAAGCGG GGCAAAGGCC GAGGGAATAT ACTACAATCC AGATATAATT 1980AAGAAGGTTC TTGAGAGCGG TGCAACCTGG CTTGAGGGAG ATCCATATAC TGGGCAGAAG 2040TACACTGAGC TTGACCAAGG TCATGGTCTT GTTAACGTTA CCAAGTCCTG GGAAATCCTT 2100AAGGCTATAA ACGGCACCAC TCTCCCAATT GTTGATCACT GGGCAGACAA GTCCTACAGC 2160GACTTTGCGG AGTACTTGGG TGTGGACGTT ATAAGAGGTC TCTACGCAAG GAACTCTATA 2220CCTGACATTG TCGAGTGGCA CATTAAGTAC GTAGGGGACA CGGAGTACAG AACTTTTGAG 2280ATCTATGCAA CTGAGCCATG GATTAAGCCT TTTGTCAGTG GAAGTGTAAT TCTAGAGAAC 2340AATACCGAGT TTGTCCTTAG GGTGAAATAT GATGTAGAGG GTCTTGAGCC AGGTCTCTAT 2400GTTGGAAGGA TAATCATTGA TGATCCAACA ACGCCAGTTA TTGAAGACGA GATCTTGAAC 2460ACAATTGTTA TTCCCGAGAA GTTCACTCCT GAGAACAATT ACACCCTCAC CTGGTATGAT 2520ATTAATGGTC CAGAAATGGT GACTCACCAC TTCTTCACTG TGCCTGAGGG AGTGGACGTT 2580CTCTACGCGA TGACCACATA CTGGGACTAC GGTCTGTACA GACCAGATGG AATGTTTGTG 2640TTCCCATACC AGCTAGATTA TCTTCCCGCT GCAGTCTCAA ATCCAATGCC TGGAAACTGG 2700GAGCTAGTAT GGACTGGATT TAACTTTGCA CCCCTCTATG AGTCGGGCTT CCTTGTAAGG 2760ATTTACGGAG TAGAGATAAC TCCAAGCGTT TGGTACATTA ACAGGACATA CCTTGACACT 2820AACACTGAAT TCTCAATTGA ATTCAATATT ACTAACATCT ATGCCCCAAT TAATGCAACT 2880CTAATCCCCA TTGGCCTTGG AACCTACAAT GCGAGCGTTG AAAGCGTTGG TGATGGAGAG 2940TTCTTCATAA AGGGCATTGA AGTTCCTGAA GGCACCGCAG AGTTGAAGAT TAGGATAGGC 3000AACCCAAGTG TTCCGAATTC AGATCTAGAC TTGTACCTTT ATGACAGTAA AGGCAATTTA 3060GTGGCCTTAG ATGGAAACCC AACAGCAGAA GAAGAGGTTG TAGTTGAGTA TCCTAAGCCT 3120GGAGTTTATT CAATAGTAGT ACATGGTTAC AGCGTCAGGG ACGAAAATGG TAATCCAACG 3180ACAACCACCT TTGACTTAGT TGTTCAAATG ACCCTTGATA ATGGAAACAT AAAGCTTGAC 3240AAAGACTCGA TTATTCTTGG AAGCAATGAA AGCGTAGTTG TAACTGCAAA CATAACAATT 3300GATAGAGATC ATCCTACAGG AGTATACTCT GGTATCATAG AGATTAGAGA TAATGAGGTC 3360TACCAGGATA CAAATACTTC AATTGCGAAA ATACCCATAA CTTTGGTAAT TGACAAGGCG 3420GACTTTGCCG TTGGTCTCAC ACCAGCAGAG GGAGTACTTG GAGAGGCTAG AAATTACACT 3480CTAATTGTAA AGCATGCCCT AACACTAGAG CCTGTGCCAA ATGCTACAGT GATTATAGGA 3540AACTACACCT ACCTCACAGA CGAAAACGGT ACAGTGACAT TCACGTATGC TCCAACTAAG 3600TTAGGCAGTG ATGAAATCAC AGTCATAGTT AAGAAAGAGA ACTTCAACAC ATTAGAGAAG 3660ACCTTCCAAA TCACAGTATC AGAGCCTGAA ATAACTGAAG AGGACATAAA TGAGCCCAAG 3720CTTGCAATGT CATCACCAGA AGCAAATGCT ACCATAGTAT CAGTTGAGAT GGAGAGTGAG 3780GGTGGCGTTA AAAAGACAGT GACAGTGGAA ATAACTATAA ACGGAACCGC TAATGAGACT 3840GCAACAATAG TGGTTCCTGT TCCTAAGAAG GCCGAAAACA TCGAGGTAAG TGGAGACCAC 3900GTAATTTCCT ATAGTATAGA GGAAGGAGAG TACGCCAAGT ACGTTATAAT TACAGTGAAG 3960TTTGCATCAC CTGTAACAGT AACTGTTACT TACACTATCT ATGCTGGCCC AAGAGTCTCA 4020ATCTTGACAC TTAACTTCCT TGGCTACTCA TGGTACAGAC TATATTCACA GAAGTTTGAC 4080GAATTGTACC AAAAGGCCCT TGAATTGGGA GTGGACAACG AGACATTAGC TTTAGCCCTC 4140AGCTACCATG AAAAAGCCAA AGAGTACTAC GAAAAGGCCC TTGAGCTTAG CGAGGGTAAC 4200ATAATCCAAT ACCTTGGAGA CATAAGACTA TTACCTCCAT TAAGACAGGC ATACATCAAT 4260GAAATGAAGG CAGTTAAGAT ACTGGAAAAG GCCATAGAAG AATTAGAGGG TGAAGAGTAA 4320TCTCCAATTT TTCCCACTTT TTCTTTTATA ACATTCCAAG CCTTTTCTTA GCTTCTTCGC 4380TCATTCTATC AGGAGTCCAT GGAGGATCAA AGGTAAGTTC AACCTCCACA TCTCTTACTC 4440CTGGGATTTC GAGTACTTTC TCCTCTACAG CTCTAAGAAG CCAGAGAGTT AAAGGACACC 4500CAGGAGTTGT CATTGTCATC TTTATATATA CCGTTTTGTC AGGATTAATC TTTAGCTCAT 4560AAATTAATCC AAGGTTTACA ACATCCATCC CAATTTCTGG GTCGATAACC TCCTTTAGCT 4620TTTCCAGAAT CATTTCTTCA GTAATTTCAA GGTTCTCATC TTTGGTTTCT CTCACAAACC 4680CAATTTCAAC CTGCCTGATA CCTTCTAACT CCCTAAGCTT GTTATATATC TCCAAAAGAG 4740TGGCATCATC AATTTTCTCT TTAAA 3′4765SEQ ID NO9序列長度1398序列類型氨基酸鏈型單拓?fù)鋵W(xué)線性分子類型肽序列描述Met Asn Lys Lys Gly Leu Thr Val Leu Phe Ile Ala Ile Met Leu5 10 15Leu Ser Val Val Pro Val His Phe Val Ser Ala Glu Thr Pro Pro20 25 30Val Ser Ser Glu Asn Ser Thr Thr Ser Ile Leu Pro Asn Gln Gln35 40 45Val Val Thr Lys Glu Val Ser Gln Ala Ala Leu Asn Ala Ile Met50 55 60Lys Gly Gln Pro Asn Met Val Leu Ile Ile Lys Thr Lys Glu Gly65 70 75Lys Leu Glu Glu Ala Lys Thr Glu Leu Glu Lys Leu Gly Ala Glu80 85 90Ile Leu Asp Glu Asn Arg Val Leu Asn Met Leu Leu Val Lys Ile95 100 105Lys Pro Glu Lys Val Lys Glu Leu Asn Tyr Ile Ser Ser Leu Glu110 115 120Lys Ala Trp Leu Asn Arg Glu Val Lys Leu Ser Pro Pro Ile Val125 130 135Glu Lys Asp Val Lys Thr Lys Glu Pro Ser Leu Glu Pro Lys Met140 145 150Tyr Asn Ser Thr Trp Val Ile Asn Ala Leu Gln Phe Ile Gln Glu155 160 165Phe Gly Tyr Asp Gly Ser Gly Val Val Val Ala Val Leu Asp Thr170 175 180Gly Val Asp Pro Ash His Pro Phe Leu Ser Ile Thr Pro Asp Gly185 190 195Arg Arg Lys Ile Ile Glu Trp Lys Asp Phe Thr Asp Glu Gly Phe200 205 210Val Asp Thr Ser Phe Ser Phe Ser Lys Val Val Asn Gly Thr Leu215 220 225Ile Ile Asn Thr Thr Phe Gln Val Ala Ser Gly Leu Thr Leu Asn230 235 240Glu Ser Thr Gly Leu Met Glu Tyr Val Val Lys Thr Val Tyr Val245 250 255Ser Asn Val Thr Ile Gly Asn Ile Thr Ser Ala Asn Gly Ile Tyr260 265 270His Phe Gly Leu Leu Pro Glu Arg Tyr Phe Asp Leu Asn Phe Asp275 280 285Gly Asp Gln Glu Asp Phe Tyr Pro Val Leu Leu Val Asn Ser Thr290 295 300Gly Asn Gly Tyr Asp Ile Ala Tyr Val Asp Thr Asp Leu Asp Tyr305 310 315Asp Phe Thr Asp Glu Val Pro Leu Gly Gln Tyr Asn Val Thr Tyr320 325 330Asp Val Ala Val Phe Ser Tyr Tyr Tyr Gly Pro Leu Asn Tyr Val335 340 345Leu Ala Glu Ile Asp Pro Asn Gly Glu Tyr Ala Val Phe Gly Trp350 355 360Asp Gly His Gly His Gly Thr His Val Ala Gly Thr Val Ala Gly365 370 375Tyr Asp Ser Asn Asn Asp Ala Trp Asp Trp Leu Ser Met Tyr Ser380 385 390Gly Glu Trp Glu Val Phe Ser Arg Leu Tyr Gly Trp Asp Tyr Thr395 400 405Asn Val Thr Thr Asp Thr Val Gln Gly Val Ala Pro Gly Ala Gln410 415 420Ile Met Ala Ile Arg Val Leu Arg Ser Asp Gly Arg Gly Ser Met425 430 435Trp Asp Ile Ile Glu Gly Met Thr Tyr Ala Ala Thr His Gly Ala440 445 450Asp Val Ile Ser Met Ser Leu Gly Gly Asn Ala Pro Tyr Leu Asp455 460 465Gly Thr Asp Pro Glu Ser Val Ala Val Asp Glu Leu Thr Glu Lys470 475 480Tyr Gly Val Val Phe Val Ile Ala Ala Gly Asn Glu Gly Pro Gly485 490 495Ile Asn Ile Val Gly Ser Pro Gly Val Ala Thr Lys Ala Ile Thr500 505 510Val Gly Ala Ala Ala Val Pro Ile Asn Val Gly Val Tyr Val Ser515 520 525Gln Ala Leu Gly Tyr Pro Asp Tyr Tyr Gly Phe Tyr Tyr Phe Pro530 535 540Ala Tyr Thr Asn Val Arg Ile Ala Phe Phe Ser Ser Arg Gly Pro545 550 555Arg Ile Asp Gly Glu Ile Lys Pro Asn Val Val Ala Pro Gly Tyr560 565 570Gly Ile Tyr Ser Ser Leu Pro Met Trp Ile Gly Gly Ala Asp Phe575 580 585Met Ser Gly Thr Ser Met Ala Thr Pro His Val Ser Gly Val Val590 595 600Ala Leu Leu Ile Ser Gly Ala Lys Ala Glu Gly Ile Tyr Tyr Asn605 610 615Pro Asp Ile Ile Lys Lys Val Leu Glu Ser Gly Ala Thr Trp Leu620 625 630Glu Gly Asp Pro Tyr Thr Gly Gln Lys Tyr Thr Glu Leu Asp Gln635 640 645Gly His Gly Leu Val Asn Val Thr Lys Ser Trp Glu Ile Leu Lys650 655 660Ala Ile Asn Gly Thr Thr Leu Pro Ile Val Asp His Trp Ala Asp665 670 675Lys Ser Tyr Ser Asp Phe Ala Glu Tyr Leu Gly Val Asp Val Ile680 685 690Arg Gly Leu Tyr Ala Arg Asn Ser Ile Pro Asp Ile Val Glu Trp695 700 705His Ile Lys Tyr Val Gly Asp Thr Glu Tyr Arg Thr Phe Glu Ile710 715 720Tyr Ala Thr Glu Pro Trp Ile Lys Pro Phe Val Ser Gly Ser Val725 730 735Ile Leu Glu Asn Asn Thr Glu Phe Val Leu Arg Val Lys Tyr Asp740 745 750Val Glu Gly Leu Glu Pro Gly Leu Tyr Val Gly Arg Ile Ile Ile755 760 765Asp Asp Pro Thr Thr Pro Val Ile Glu Asp Glu Ile Leu Asn Thr770 775 780Ile Val Ile Pro Glu Lys Phe Thr Pro Glu Asn Asn Tyr Thr Leu785 790 795Thr Trp Tyr Asp Ile Ash Gly Pro Glu Met Val Thr His His Phe800 805 810Phe Thr Val Pro Glu Gly Val Asp Val Leu Tyr Ala Met Thr Thr815 820 825Tyr Trp Asp Tyr Gly Leu Tyr Arg Pro Asp Gly Met Phe Val Phe830 835 840Pro Tyr Gln Leu Asp Tyr Leu Pro Ala Ala Val Ser Asn Pro Met845 850 855Pro Gly Asn Trp Glu Leu Val Trp Thr Gly Phe Asn Phe Ala Pro860 865 870Leu Tyr Glu Ser Gly Phe Leu Val Arg Ile Tyr Gly Val Glu Ile875 880 885Thr Pro Ser Val Trp Tyr Ile Asn Arg Thr Tyr Leu Asp Thr Asn890 895 900Thr Glu Phe Ser Ile Glu Phe Asn Ile Thr Asn Ile Tyr Ala Pro905 910 915Ile Asn Ala Thr Leu Ile Pro Ile Gly Leu Gly Thr Tyr Asn Ala920 925 930Ser Val Glu Ser Val Gly Asp Gly Glu Phe Phe Ile Lys Gly Ile935 940 945Glu Val Pro Glu Gly Thr Ala Glu Leu Lys Ile Arg Ile Gly Asn950 955 960Pro Ser Val Pro Asn Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Ser965 970 975Lys Gly Asn Leu Val Ala Leu Asp Gly Asn Pro Thr Ala Glu Glu980 985 990Glu Val Val Val Glu Tyr Pro Lys Pro Gly Val Tyr Ser Ile Val99510001005Val His Gly Tyr Ser Val Arg Asp Glu Asn Gly Asn Pro Thr Thr101010151020Thr Thr Phe Asp Leu Val Val Gln Met Thr Leu Asp Asn Gly Asn102510301035Ile Lys Leu Asp Lys Asp Ser Ile Ile Leu Gly Ser Asn Glu Ser104010451050Val Val Val Thr Ala Asn Ile Thr Ile Asp Arg Asp His Pro Thr105510601065Gly Val Tyr Ser Gly Ile Ile Glu Ile Arg Asp Asn Glu Val Tyr107010751080Gln Asp Thr Asn Thr Ser Ile Ala Lys Ile Pro Ile Thr Leu Val108510901095Ile Asp Lys Ala Asp Phe Ala Val Gly Leu Thr Pro Ala Glu Gly110011051110Val Leu Gly Glu Ala Arg Asn Tyr Thr Leu Ile Val Lys His Ala111511201125Leu Thr Leu Glu Pro Val Pro Ash Ala Thr Val Ile Ile Gly Asn113011351140Tyr Thr Tyr Leu Thr Asp Glu Asn Gly Thr Val Thr Phe Thr Tyr114511501155Ala Pro Thr Lys Leu Gly Ser Asp Glu Ile Thr Val Ile Val Lys116011651170Lys Glu Asn Phe Asn Thr Leu Glu Lys Thr Phe Gln Ile Thr Val117511801185Ser Glu Pro Glu Ile Thr Glu Glu Asp Ile Asn Glu Pro Lys Leu119011951200Ala Met Set Ser Pro Glu Ala Asn Ala Thr Ile Val Ser Val Glu120512101215Met Glu Ser Glu Gly Gly Val Lys Lys Thr Val Thr Val Glu Ile122012251230Thr Ile Asn Gly Thr Ala Asn Glu Thr Ala Thr Ile Val Val Pro123512401245Val Pro Lys Lys Ala Glu Asn Ile Glu Val Ser Gly Asp His Val125012551260Ile Ser Tyr Ser Ile Glu Glu Gly Glu Tyr Ala Lys Tyr Val Ile126512701275Ile Thr Val Lys Phe Ala Ser Pro Val Thr Val Thr Val Thr Tyr128012851290Thr Ile Tyr Ala Gly Pro Arg Val Ser Ile Leu Thr Leu Asn Phe129513001305Leu Gly Tyr Ser Trp Tyr Arg Leu Tyr Ser Gln Lys Phe Asp Glu131013151320Leu Tyr Gln Lys Ala Leu Glu Leu Gly Val Asp Asn Glu Thr Leu132513301335Ala Leu Ala Leu Ser Tyr His Glu Lys Ala Lys Glu Tyr Tyr Glu134013451350Lys Ala Leu Glu Leu Ser Glu Gly Asn Ile Ile Gln Tyr Leu Gly135513601365Asp Ile Arg Leu Leu Pro Pro Leu Arg Gln Ala Tyr Ile Asn Glu137013751380Met Lys Ala Val Lys Ile Leu Glu Lys Ala Ile Glu Glu Leu Glu138513901395Gly Glu GluSEQ ID NO10序列長度145序列類型核酸鏈型雙拓?fù)鋵W(xué)線性分子類型其它核酸(PCR片段)反義無序列描述A GTT GCG GTA ATT GAC ACG GGT ATA GAC GCG AAC CAC CCC GAT CTG46Val Ala Val Ile Asp Thr Gly Ile Asp Ala Asn His Pro Asp Leu5 10 15AAG GGC AAG GTC ATA GGC TGG TAC GAC GCC GTC AAC GGC AGG TCG91Lys Gly Lys Val Ile Gly Trp Tyr Asp Ala Val Asn Gly Arg Ser20 25 30ACC CCC TAC GAT GAC CAG GGA CAC GGA ACT CAC GTN GCN GGA ACN 136Thr Pro Tyr Asp Asp Gln Gly His Gly Thr His Val Ala Gly Thr35 40 45GTT GCT GGT 145Val Ala GlySEQ ID NO11序列長度564序列類型核酸鏈型雙拓?fù)鋵W(xué)線性分子類型其它核酸(PCR片段)反義無序列描述TCT CAC GGA ACT CAC GTG GCG GGA ACA GTT GCC GGA ACA GGC AGC 45Ser His Gly Thr His Val Ala Gly Thr Val Ala Gly Thr Gly Ser5 10 15GTT AAC TCC CAG TAC ATA GGC GTC GCC CCC GGC GCG AAG CTC GTC 90Val Asn Ser Gln Tyr Ile Gly Val Ala Pro Gly Ala Lys Leu Val20 25 30GGT GTC AAG GTT CTC GGT GCC GAC GGT TCG GGA AGC GTC TCC ACC 135Gly Val Lys Val Leu Gly Ala Asp Gly Ser Gly Ser Val Ser Thr35 40 45ATC ATC GCG GGT GTT GAC TGG GTC GTC CAG AAC AAG GAT AAG TAC 180Ile Ile Ala Gly Val Asp Trp Val Val Gln Ash Lys Asp Lys Tyr50 55 60GGG ATA AGG GTC ATC AAC CTC TCC CTC GGC TCC TCC CAG AGC TCC 225Gly Ile Arg Val Ile Asn Leu Ser Leu Gly Ser Ser Gln Ser Ser65 70 75GAC GGA GCC GAC TCC CTC AGT CAG GCC GTC AAC AAC GCC TGG GAC 270Asp Gly Ala Asp Ser Leu Ser Gln Ala Val Asn Asn Ala Trp Asp80 85 90GCC GGT ATA GTA GTC TGC GTC GCC GCC GGC AAC AGC GGG CCG AAC 315Ala Gly Ile Val Val Cys Val Ala Ala Gly Asn Ser Gly Pro Asn95 100 105ACC TAC ACC GTC GGC TCA CCC GCC GCC GCG AGC AAG GTC ATA ACC 360Thr Tyr Thr Val Gly Ser Pro Ala Ala Ala Ser Lys Val Ile Thr110 115 120GTC GGT GCA GTT GAC AGC AAC GAC AAC ATC GCC AGC TTC TCC AGC 405Val Gly Ala Val Asp Ser Asn Asp Asn Ile Ala Ser Phe Ser Ser125 130 135AGG GGA CCG ACC GCG GAC GGA AGG CTC AAG CCG GAA GTC GTC GCC 450Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu Val Val Ala140 145 150CCC GGC GTT GAC ATC ATA GCC CCG CGC GCC AGC GGA ACC AGC ATG 495Pro Gly Val Asp Ile Ile Ala Pro Arg Ala Ser Gly Thr Ser Met155 160 165GGC ACC CCG ATA AAC GAC TAC TAC ACC AAG GCC TCT GGA ACC TCA 540Gly Thr Pro Ile Asn Asp Tyr Tyr Thr Lys Ala Ser Gly Thr Ser170 175 180ATG GCC ACT CCC CAT GTT ACC GGT 564Met Ala Thr Pro His Val Thr Gly185SEQ ID NO12序列長度20序列類型核酸鏈型單拓?fù)鋵W(xué)線性分子類型其它核酸(合成的DNA)序列描述GGCAAGGTCA TAGGCTGGTA 20SEQ ID NO13序列長度20序列類型核酸鏈型單拓?fù)鋵W(xué)線性分子類型其它核酸(合成的DNA)序列描述CCAGAACAAG GATAAGTACG 20SEQ ID NO14序列長度20序列類型核酸鏈型單拓?fù)鋵W(xué)線性分子類型其它核酸(合成的DNA)序列描述GGCACCCCGA TAAACGACTA 20SEQ ID NO15序列長度20序列類型核酸鏈型單拓?fù)鋵W(xué)線性分子類型其它核酸(合成的DNA)序列描述ACGCCTATGT ACTGGGAGTT 20SEQ ID NO16序列長度20序列類型核酸鏈型單拓?fù)鋵W(xué)線性分子類型其它核酸(合成的DNA)序列描述CGTACTTATC CTTGTTCTGG 20SEQ ID NO17序列長度20序列類型核酸鏈型單拓?fù)鋵W(xué)線性分子類型其它核酸(合成的DNA)序列描述TGTAGTAGTC GTTTATCGGG 20SEQ ID NO18序列長度237序列類型氨基酸鏈型單拓?fù)鋵W(xué)線性分子類型肽序列描述Asp Leu Lys Gly Lys Val Ile Gly Trp Tyr Asp Ala Val Asn Gly5 10 15Arg Ser Thr Pro Tyr Asp Asp Gln Gly His Gly Thr His Val Ala20 25 30Gly Ile Val Ala Gly Thr Gly Ser Val Asn Ser Gln Tyr Ile Gly35 40 45Val Ala Pro Gly Ala Lys Leu Val Gly Val Lys Val Leu Gly Ala50 55 60Asp Gly Ser Gly Ser Val Ser Thr Ile Ile Ala Gly Val Asp Trp65 70 75Val Val Gln Asn Lys Asp Xaa Tyr Gly Ile Arg Val Ile Asn Leu80 85 90Ser Leu Gly Ser Ser Gln Ser Ser Asp Gly Thr Asp Ser Leu Ser95 100 105Gln Ala Val Asn Asn Ala Trp Asp Ala Gly Ile Val Val Cys Val110 115 120Ala Ala Gly Asn Ser Gly Pro Asn Thr Tyr Thr Val Gly Ser Pro125 130 135Ala Ala Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Ser Asn140 145 150Asp Asn Ile Ala Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly155 160 165Arg Leu Lys Pro Glu Val Val Ala Pro Gly Val Asp Ile Ile Ala170 175 180Pro Arg Ala Ser Gly Thr Ser Met Gly Thr Pro Ile Asn Asp Tyr185 190 195Xaa Asn Lys Gly Ser Gly Ser Ser Met Asp Thr Pro His Val Ser200 205 210Gly Val Gly Gly Leu Ile Leu Gln Ala His Pro Ser Trp Thr Pro215 220 225Asp Lys Val Lys Thr Pro Ser Ser Arg Pro Pro Thr230 23權(quán)利要求
1.一種分離的來自Pyrococcus furiosus的超熱穩(wěn)定蛋白酶基因。
2.權(quán)利要求1的超熱穩(wěn)定蛋白酶基因,其編碼由序列表中SEQID NO 1中所表示的氨基酸序列,或編碼具有超熱穩(wěn)定蛋白酶活性的由序列表中SEQ ID NO 1所表示的部分氨基酸序列。
3.權(quán)利要求1的超熱穩(wěn)定蛋白酶基因,其包含序列表中SEQ IDNO 2中所表示的核苷酸序列。
4.一種超熱穩(wěn)定蛋白酶基因,其可與權(quán)利要求2的超熱穩(wěn)定蛋白酶基因或與為權(quán)利要求2的一部分超熱穩(wěn)定蛋白酶基因的選自序列表中的SEQ ID NO 3,4,5和6所表示的核苷酸序列的DNA雜交。
5.權(quán)利要求4的包含SEQ ID NO 7所表示的核苷酸序列的超熱穩(wěn)定蛋白酶基因。
6.一種生產(chǎn)超熱穩(wěn)定蛋白酶的方法,它包括培育一種用權(quán)利要求1的超熱穩(wěn)定蛋白酶基因轉(zhuǎn)導(dǎo)的質(zhì)粒所轉(zhuǎn)化的轉(zhuǎn)化體,并從培養(yǎng)物中收獲該超熱穩(wěn)定的蛋白酶。
7.一種生產(chǎn)超熱穩(wěn)定蛋白酶的方法,它包括培養(yǎng)用權(quán)利要求4的超熱穩(wěn)定蛋白酶基因轉(zhuǎn)導(dǎo)的質(zhì)粒所轉(zhuǎn)化的轉(zhuǎn)化體,并從培養(yǎng)物中收獲該超熱穩(wěn)定的蛋白酶。
全文摘要
一種源自Pyrococcus furiosus的超熱穩(wěn)定蛋白酶基因,具體地說,是一種包括序列表中SEQ ID NO.1所表示的全部氨基酸序列并編碼蛋白酶活性部位的超熱穩(wěn)定的蛋白酶基因;以及一種通過培養(yǎng)轉(zhuǎn)化體而產(chǎn)生蛋白酶的方法,其中轉(zhuǎn)化體是通過使用將上述基因整合至其中的質(zhì)粒而制備的。
文檔編號C12N9/52GK1154717SQ9519448
公開日1997年7月16日 申請日期1995年6月5日 優(yōu)先權(quán)日1994年6月13日
發(fā)明者三田正范, 山本克彥, 森下美男, 淺田起代藏, 綱澤進(jìn), 加藤郁之進(jìn) 申請人:寶酒造株式會(huì)社