專利名稱:轉(zhuǎn)錄因子、轉(zhuǎn)錄因子基因、含有轉(zhuǎn)錄因子基因的重組載體、由所述載體轉(zhuǎn)化的曲霉、和所述 ...的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種能夠調(diào)節(jié)硫同化基因表達(dá)的轉(zhuǎn)錄因子、一種編碼這種轉(zhuǎn)錄因子的基因,一種包含這種轉(zhuǎn)錄因子基因的重組載體,其中由這種載體轉(zhuǎn)化的硫同化基因表達(dá)被去抑制的曲霉,以及這種曲霉的應(yīng)用。
背景技術(shù):
有機體能夠相應(yīng)于環(huán)境因子例如營養(yǎng)或其它各種因子而調(diào)節(jié)基因的表達(dá)?;虻谋磉_(dá)在各種不同的時相被調(diào)節(jié),例如轉(zhuǎn)錄的起始、轉(zhuǎn)錄的連續(xù)、mRNA的穩(wěn)定性、翻譯的起始和翻譯的連續(xù)。
硫是含硫氨基酸的一種組分,并且對于有機體來說它還是一種重要的營養(yǎng)素。已進(jìn)行了大量有關(guān)涉及真核微生物的硫同化的基因(硫同化基因)的調(diào)節(jié)的研究。許多涉及阻遏劑和活化劑的事實已被闡明,特別是從基于例如,粗糙鏈孢霉(Neurospora crassa)的突變體和基因分離的分析的研究中(Review;Marzluf等,Anuu.Rev.Microbiol.5173-96,1997)。
轉(zhuǎn)錄活化劑Cys3和轉(zhuǎn)錄抑制劑Scon1和Scon2已知是涉及粗糙鏈孢霉硫同化的轉(zhuǎn)錄因子。Cys3結(jié)合cys-3基因或scon-2基因的上游區(qū)域并激活它們的表達(dá)。Cys3還可結(jié)合涉及硫吸收或同化的基因的上游區(qū)域,例如ars基因或cys-14基因,以激活它們的表達(dá)。
同時,還進(jìn)行了大量有關(guān)涉及構(gòu)巢曲霉(Aspergillus nidulans)硫同化的基因調(diào)節(jié)的研究。盡管在構(gòu)巢曲霉上花費了很多的精力,但沒有鑒定出與粗糙鏈孢霉的Cys3相當(dāng)?shù)霓D(zhuǎn)錄因子。然而,1999年報道了轉(zhuǎn)錄因子MetR。一種metR突變體能夠僅利用甲硫氨酸作為硫來源。MetR被發(fā)現(xiàn)在DNA-結(jié)合位點上與Cys3高度同源,盡管在其它的區(qū)域二者基本上不同源。Cys-3基因不能互補于metR突變體的表型(Naorff等,F(xiàn)ungal Genet.Newsl.46(Suppl),59,1999)。而且,人們認(rèn)為存在4種類型的轉(zhuǎn)錄抑制劑(Natorff等,Molec.Gen.Genet.238185-192,1993)。上述中,SconB和SconC已被分離。
曲霉,例如黃-綠曲霉,如米曲霉(Aspergillus oryzae)、醬油曲霉(Aspergillus sojae)和溜曲霉(Aspergillus tamarii);黑曲霉,如黑曲霉(Aspergillus niger)、泡盛曲霉(Aspergillusawamori)、宇佐美曲霉(Aspergillus usamii)、和Aspergillussaitoi和白曲霉,如Aspergillus kawachii,已用于發(fā)酵、釀造或酶生產(chǎn)相當(dāng)長的時間了。它們作為高度安全的微生物非常有用。然而,涉及這類微生物的硫同化基因的調(diào)節(jié)尚未充分闡明。這些有用的曲霉不同于上述構(gòu)巢曲霉(也就是說,它屬于具有有性階段的裸胞殼Emericella(子囊菌)屬的構(gòu)巢曲霉的無性階段),例如,由于其有性階段沒有鑒定出來(USP No.6,090,607)。因此,有關(guān)構(gòu)巢曲霉的研究結(jié)果不總能適用。
黃-綠曲霉米曲霉和醬油曲霉分泌很多水解酶,包括蛋白水解酶。因此,通過蛋白水解作用它們被用于調(diào)味品,例如醬油或豆醬的生產(chǎn)。已知在米曲霉中由于缺乏任何一種碳、氮和硫源將導(dǎo)致胞外蛋白酶的生產(chǎn)被誘導(dǎo)或被去抑制。在米曲霉中,由于碳和氮源缺乏引起的蛋白酶表達(dá)的遺傳機制已被報道,但是由于硫源缺乏導(dǎo)致的蛋白酶表達(dá)的機制尚未闡明。就構(gòu)巢曲霉來說,已經(jīng)進(jìn)行了一些有關(guān)由硫源缺乏引起的蛋白酶表達(dá)的分析,但其機制尚無報道。硫源與胞外外肽酶例如黃-綠曲霉中的氨肽酶或羧肽酶的表達(dá)的調(diào)節(jié)的關(guān)系是未知的。
發(fā)明的公開本發(fā)明的目的是提供一種能夠在培養(yǎng)過程中調(diào)節(jié)曲霉硫同化基因的表達(dá)的轉(zhuǎn)錄因子及其編碼它的基因。本發(fā)明的另一個目的是提供一種利用曲霉生產(chǎn)蛋白水解酶的有效方法。本發(fā)明還有一個目的是提供一種通過利用前述生產(chǎn)蛋白水解酶的方法來生產(chǎn)食品的有效方法。
為了達(dá)到上述目的本發(fā)明人進(jìn)行了集中的研究。結(jié)果,他們成功地從黃-綠曲霉中克隆出能夠調(diào)節(jié)硫-同化基因表達(dá)的轉(zhuǎn)錄因子基因。這使得本發(fā)明得以完成。
特別的,本發(fā)明是如下逐一進(jìn)行的1)如下(a)或(b)的一種蛋白
(a)一種蛋白,其含有如SEQ ID NO3所示的氨基酸序列;或(b)一種蛋白,其含有通過缺失、取代或增加一個或多個氨基酸殘基從如SEQ ID NO3所示的氨基酸序列衍生的氨基酸序列,并且其具有轉(zhuǎn)錄因子的功能。
2)一種蛋白,該蛋白含有與如SEQ ID NO3所示的氨基酸序列具有70%或更高的序列同源性的氨基酸序列或其片段,并且其具有轉(zhuǎn)錄因子的功能。
3)一種轉(zhuǎn)錄因子基因,其編碼如下蛋白(a)或(b)(a)一種蛋白,其含有如SEQ ID NO3所示的氨基酸序列;或(b)一種蛋白,其含有通過缺失、取代或增加一個或多個氨基酸殘基,從如SEQ ID NO3所示的氨基酸序列衍生的氨基酸序列,并且其具有轉(zhuǎn)錄因子的功能。
4)一種轉(zhuǎn)錄因子基因,其含有如下DNA(a)或(b)(a)DNA,其含有如SEQ ID NO2所示的核苷酸序列;或(b)DNA,其在嚴(yán)格條件下與包含與含有如SEQ ID NO2所示的核苷酸序列的DNA互補的核苷酸序列的DNA雜交,并且其編碼具有轉(zhuǎn)錄因子功能的蛋白質(zhì)。
5)一種基因,其編碼根據(jù)上述2)所述的蛋白質(zhì)。
6)一種轉(zhuǎn)錄因子基因,其含有如下DNA(a)或(b)(a)DNA,其含有編碼如SEQ ID NO3所示的氨基酸序列的核酸;或(b)DNA,其在嚴(yán)格條件下與包含與含有編碼如SEQ ID NO3所示的氨基酸序列的核酸的DNA互補的核酸的DNA雜交,并且其編碼能夠調(diào)節(jié)硫-同化基因表達(dá)的蛋白質(zhì)。
7)一種轉(zhuǎn)錄因子基因,其具有與含有如SEQ ID NO2所示的核苷酸序列的DNA具有80%或更高的序列同源性的DNA,并且其編碼具有轉(zhuǎn)錄因子功能的蛋白質(zhì)。
8)一種重組載體,其含有根據(jù)上述3)、4)、5)、6)或7)所述的基因。
9)一種曲霉,其含有根據(jù)上述8)所述的重組載體,
10)一種曲霉,其中根據(jù)上述3)、4)、5)、6)或7)所述的基因在低分子量含硫物質(zhì)存在的條件下表達(dá)。
11)根據(jù)上述9)或10)所述的曲霉,其能夠在低分子量含硫物質(zhì)存在的情況下產(chǎn)生胞外蛋白酶。
12)根據(jù)上述9)或10)所述的曲霉,其能夠在低分子量含硫物質(zhì)存在的情況下產(chǎn)生胞外蛋白酶和胞外外肽酶。
13)一種曲霉,其中硫-同化基因的表達(dá)被去抑制。
14)根據(jù)上述9)、10)、11)或12)所述的曲霉,其中硫-同化基因的表達(dá)被去抑制。
15)一種生產(chǎn)蛋白酶和/或外肽酶的方法,其包括在培養(yǎng)基中培養(yǎng)根據(jù)上述9)-14)中任何一項所述的曲霉,并且從獲得的培養(yǎng)物中任選地收集蛋白酶和/或外肽酶。
16)一種降解含蛋白質(zhì)的物質(zhì)的方法,其包括用根據(jù)上述9)-14)中任何一項所述的曲霉來降解含蛋白質(zhì)的物質(zhì)。
17)一種生產(chǎn)含蛋白質(zhì)物質(zhì)的降解產(chǎn)物的方法,它包括培養(yǎng)根據(jù)上述9)-14)中任何一項所述的曲霉,用獲得的產(chǎn)物降解含蛋白質(zhì)的物質(zhì),和從中任選地收集含蛋白質(zhì)物質(zhì)的降解產(chǎn)物。
18)根據(jù)上述15)所述的方法,其中培養(yǎng)基含有0.5mM或更多低分子量的含硫物質(zhì)。
在下文中,將詳細(xì)描述本發(fā)明。
本申請包括日本專利申請No.2002-045090中公開的全部內(nèi)容,并因此本申請要求優(yōu)先權(quán)。
本發(fā)明中,在用于發(fā)酵、釀造、酶生產(chǎn)等的曲霉屬中的微生物(曲霉)中,鑒定了硫同化基因的轉(zhuǎn)錄調(diào)節(jié)因子(轉(zhuǎn)錄因子)及編碼該因子的基因,其功能被闡明,并說明了這種轉(zhuǎn)錄因子與產(chǎn)生胞外蛋白酶或胞外外肽酶的能力的關(guān)系。因此,根據(jù)本發(fā)明,成功獲得了一種能夠在低分子量含硫物質(zhì)存在的情況下將硫同化基因的表達(dá)去抑制、并從而增強宿主曲霉產(chǎn)生胞外蛋白酶或胞外外肽酶能力的轉(zhuǎn)錄因子,以及編碼它的基因。使用本發(fā)明的轉(zhuǎn)錄因子和/或編碼該因子的基因采用曲霉可實現(xiàn)良好的發(fā)酵、釀造、酶生產(chǎn)等等。
在本發(fā)明中,術(shù)語“曲霉”是指用于食品生產(chǎn)的曲霉。其例子包括,但不僅限于,黃-綠曲霉,例如米曲霉、醬油曲霉和溜曲霉;黑曲霉,如黑曲霉(Aspergillus niger)、泡盛曲霉(Aspergillus awamori)、宇佐美曲霉(Aspergillus usamii)、和Aspergillus saitoi;和白曲霉,如Aspergillus kawachii。本發(fā)明所使用的曲霉優(yōu)選的是一種黃-綠曲霉,例如米曲霉、醬油曲霉或溜曲霉,更優(yōu)選為一種黃-綠曲霉,如米曲霉或醬油曲霉,最優(yōu)選為米曲霉。
1.本發(fā)明的轉(zhuǎn)錄因子和轉(zhuǎn)錄因子基因術(shù)語“本發(fā)明的轉(zhuǎn)錄因子”是指能夠調(diào)節(jié)硫同化基因的表達(dá)的轉(zhuǎn)錄因子蛋白。在本申請的說明書中,術(shù)語“硫同化基因”是指涉及硫同化作用的基因。更具體的,這種基因編碼一種蛋白質(zhì),該蛋白質(zhì)涉及從培養(yǎng)基中吸收低分子量含硫物質(zhì)進(jìn)入細(xì)胞,及其降解,或向含硫氨基酸合成途徑提供硫。其例子包括芳基硫酸酯酶基因、膽堿酯酶基因、硫酸鹽通透酶基因和硫酸鹽還原酶基因。本發(fā)明采用的硫同化基因優(yōu)選為芳基硫酸酯酶基因或膽堿酯酶基因,而芳基硫酸酯酶基因是特別優(yōu)選的。本說明書中,術(shù)語“能夠調(diào)節(jié)硫同化基因的表達(dá)”是指通過起轉(zhuǎn)錄因子的作用改變硫同化基因的表達(dá)模式的能力。這種能力的具體例子包括基因表達(dá)的增強、這種表達(dá)的去抑制、這種表達(dá)的降低、這種表達(dá)的抑制和這種表達(dá)時相的改變。是否本發(fā)明的轉(zhuǎn)錄因子“能夠調(diào)節(jié)硫同化基因的表達(dá)”可通過,例如,觀察在具有本發(fā)明的轉(zhuǎn)錄因子和不具有本發(fā)明的轉(zhuǎn)錄因子的情況下一個特定的硫同化基因表達(dá)模式變化的途徑來進(jìn)行鑒定。更具體地說,例如,當(dāng)根據(jù)常規(guī)方法測定前述基因的mRNA或由該基因編碼的蛋白質(zhì)的量或活性的變化或者表達(dá)時相的變化時,可以觀察到硫同化基因表達(dá)模式的這種改變。一個被分析例子是由芳基硫酸酯酶基因編碼的芳基硫酸酯酶的酶的活性。
本發(fā)明的轉(zhuǎn)錄因子當(dāng)行使轉(zhuǎn)錄因子功能時,優(yōu)選地提供一種具有生產(chǎn)蛋白酶或外肽酶能力的宿主曲霉。該蛋白酶或外肽酶優(yōu)選為細(xì)胞外蛋白酶或細(xì)胞外外肽酶。在本說明書中,術(shù)語“行使轉(zhuǎn)錄因子功能”和“具有轉(zhuǎn)錄因子功能”表示一種蛋白能夠與具有特定核苷酸序列的DNA結(jié)合并調(diào)節(jié)相應(yīng)基因的表達(dá)。具體地說,本發(fā)明的蛋白質(zhì)是否“具有轉(zhuǎn)錄因子功能”可用如下方式進(jìn)行鑒定。例如,可通過證明本發(fā)明的蛋白質(zhì)可與含有位于sconB基因上游的SEQ ID NO25的核苷酸序列的DNA結(jié)合來進(jìn)行鑒定,即可根據(jù)有關(guān)在粗糙鏈孢霉(Neurosporacrassa)中Cys3蛋白與位于scon-2基因上游的序列的結(jié)合(Proc.Natl.Acad.Sci.,USA.,92(8)3343-3347,1995),或者SEQ ID NO26的核苷酸序列與之互補的研究推導(dǎo)出與MetR蛋白結(jié)合。蛋白質(zhì)與特異DNA結(jié)合可通過,例如凝膠移位分析來證實。
在一個具體的實施例中,本發(fā)明的轉(zhuǎn)錄因子是一種含有如SEQ IDNO3所示的氨基酸序列的蛋白質(zhì)。但是,本發(fā)明的轉(zhuǎn)錄因子不限于前述的蛋白,只要它具有上述轉(zhuǎn)錄因子的功能即可。本發(fā)明的轉(zhuǎn)錄因子可以是含有通過缺失、取代或增加一個或多個(優(yōu)選的2-50個,更優(yōu)選的2-10個,進(jìn)一步優(yōu)選為幾個)氨基酸殘基,衍生自如SEQ ID NO3所示的氨基酸序列并具有轉(zhuǎn)錄因子功能的蛋白質(zhì)。此外,本發(fā)明的轉(zhuǎn)錄因子可以是含有與如SEQ ID NO3所示的氨基酸序列具有70%或更高的序列同源性的氨基酸序列,或其片段并具有轉(zhuǎn)錄因子功能的蛋白質(zhì)。而且,本發(fā)明轉(zhuǎn)錄因子可以是能夠調(diào)節(jié)硫同化基因表達(dá)的蛋白質(zhì)。
術(shù)語“本發(fā)明的轉(zhuǎn)錄因子基因”是指編碼前述的本發(fā)明的轉(zhuǎn)錄因子蛋白的基因。在一具體的實施例中,本發(fā)明的轉(zhuǎn)錄因子基因含有包含如SEQ ID NO2所示的核苷酸序列的DNA。然而,本發(fā)明的轉(zhuǎn)錄因子基因不僅限于前述的基因,只要其編碼前述的本發(fā)明的轉(zhuǎn)錄因子蛋白即可。本發(fā)明的轉(zhuǎn)錄因子基因可編碼含有如SEQ ID NO3所示的氨基酸序列的蛋白質(zhì),或含有通過缺失、取代或增加一個或多個(優(yōu)選的2-50個,更優(yōu)選的2-10個,進(jìn)一步優(yōu)選為幾個)氨基酸殘基,衍生自如SEQ ID NO3所示的氨基酸序列并具有轉(zhuǎn)錄因子功能的蛋白質(zhì)。此外,本發(fā)明的轉(zhuǎn)錄因子基因可含有包含SEQ ID NO2所示的核苷酸序列的DNA,或者在嚴(yán)格條件下與含有互補于包含SEQ ID NO2所示的核苷酸序列的DNA的核苷酸序列的DNA雜交,并編碼具有轉(zhuǎn)錄因子功能的蛋白質(zhì)的DNA。此外,本發(fā)明的轉(zhuǎn)錄因子基因可編碼含有與如SEQ ID NO3所示的氨基酸序列具有70%或更高的序列同源性的氨基酸序列或其片段并具有轉(zhuǎn)錄因子功能的蛋白質(zhì)。另外,本發(fā)明的轉(zhuǎn)錄因子基因可含有包含編碼如SEQ ID NO3所示的氨基酸序列的核苷酸的DNA,或者在嚴(yán)格條件下與含有互補于含有編碼如SEQ ID NO3所示的氨基酸序列的核苷酸的DNA的核苷酸序列的DNA雜交,并編碼能夠調(diào)節(jié)硫同化基因表達(dá)的蛋白質(zhì)的DNA。
本發(fā)明的轉(zhuǎn)錄因子基因可通過本領(lǐng)域熟練的技術(shù)人員已知的基因表達(dá)技術(shù)來表達(dá)從而生產(chǎn)本發(fā)明的轉(zhuǎn)錄因子。
2.本發(fā)明轉(zhuǎn)錄因子基因的獲得本發(fā)明的轉(zhuǎn)錄因子基因的例子用SEQ ID NO1和SEQ ID NO2表示。本發(fā)明的轉(zhuǎn)錄因子基因可,例如(但不僅限于)通過從曲霉中分離來制備。例如,本發(fā)明的轉(zhuǎn)錄因子基因可按如下方式從曲霉中分離。首先,依據(jù)常規(guī)方法從曲霉中制備的基因組DNA或cDNA被作為模板通過PCR擴增轉(zhuǎn)錄因子基因部分。然后,確定擴增產(chǎn)物的核苷酸序列,隨后用引物步移方法(primer walking method)確定周圍的核苷酸序列。這樣,獲得轉(zhuǎn)錄因子基因的全長核苷酸序列?;谠摵塑账嵝蛄?,然后在全長轉(zhuǎn)錄因子基因可被擴增的位置設(shè)計一個引物。使用上述引物進(jìn)行PCR,并使用依據(jù)常規(guī)技術(shù)從曲霉制備的基因組DNA或cRNA作為模板,并且回收擴增產(chǎn)物并純化,這完成了本發(fā)明的轉(zhuǎn)錄因子基因的制備。由最初的PCR擴增的部分被在基因的適當(dāng)位置上設(shè)計的一對PCR引物夾在中間。這些PCR引物優(yōu)選的在已被鑒定為在本發(fā)明的轉(zhuǎn)錄因子基因中高度保守的區(qū)域內(nèi)設(shè)計。這種區(qū)域可通過比較轉(zhuǎn)錄因子基因的核苷酸序列來確定,例如SEQ ID NO1和2的序列、本發(fā)明的轉(zhuǎn)錄因子基因的其它核苷酸序列、和其它轉(zhuǎn)錄因子基因的核苷酸序列。高度保守的區(qū)域可依據(jù)本領(lǐng)域熟練的技術(shù)人員已知的技術(shù)容易地鑒定,包括更具體的,例如使用多重序列對比程序(例如CLASTALV和CLASTAL W;例如也可從包括日本國家遺傳學(xué)研究所(NationalInstitute of Genetics,Japan)(httpwww.ddbj.nig.ac.jp)的主頁在內(nèi)的國際互聯(lián)網(wǎng)的網(wǎng)站上獲得CLASTAL W)。一旦從有機體獲得了基因組克隆,從其獲得了感興趣的基因,基因組上基因的編碼區(qū)域可隨后利用通過RT-PCR獲得的cDNA克隆鑒定。
分離本發(fā)明的轉(zhuǎn)錄因子基因的另一個方法的例子如下。含有如SEQID NO1或2所示的核苷酸序列或其互補序列的標(biāo)記的DNA或RNA被作為探針,并且在嚴(yán)格條件下與之雜交的克隆被從依據(jù)常規(guī)技術(shù)制備的上述曲霉的基因組DNA文庫或cDNA文庫中篩選得到。在這種情況下,探針可含有全長或部分的上述序列。此外,使用有機體的基因組DNA或cDNA作為模板通過PCR擴增的高度保守的序列制備得到的片段可用做探針。嚴(yán)格條件是指允許特異性雜交信號區(qū)別于非特異性雜交信號的條件,雖然該條件變化取決于雜交系統(tǒng)及其類型、序列、以及使用的探針的長度。該嚴(yán)格條件可通過雜交溫度、洗滌溫度或鹽濃度的改變而建立。例如,如果非特異性雜交被不利地檢測為強烈信號,則可通過在洗滌步驟過程中提高雜交和洗滌溫度并任選地降低鹽濃度來提高雜交特異性。如果連特異性雜交信號都不能檢測到,則可通過在洗滌步驟過程中降低雜交和洗滌溫度并任選地增加鹽濃度來穩(wěn)定雜交。這種優(yōu)化可由本領(lǐng)域的研究人員容易地進(jìn)行。
一個嚴(yán)格條件的特異性例子如下。采用一個DNA探針,并用5x的SSC、1.0%(W/V)核酸雜交封閉溶液(Boehringer Mannheim)、0.1%(W/V)N-十二烷酰肌氨酸和0.02%(W/V)SDS雜交過夜(大約8-16小時)。用0.1-0.5x的SSC、0.1%(W/V)SDS洗滌兩次,優(yōu)選每次用0.1x的SSC和0.1%(W/V)SDS洗滌15分鐘。雜交溫度和洗滌溫度為55℃或更高,優(yōu)選60℃或更高,更優(yōu)選65℃或更高,最優(yōu)選68℃或更高。
包含于本發(fā)明的轉(zhuǎn)錄因子基因范圍內(nèi)的DNA,例如編碼含有與SEQID NO3所示的氨基酸序列具有60%或更高,優(yōu)選的70%或更高,更優(yōu)選的80%或更高,最優(yōu)選的90%或更高的序列同源性的氨基酸序列或其片段,并具有本發(fā)明的轉(zhuǎn)錄因子功能的蛋白質(zhì)的DNA;同時編碼顯示與SEQ ID NO2所示的核苷酸序列的DNA具有60%或更高,優(yōu)選的70%或更高,更優(yōu)選80%或更高,和最優(yōu)選90%或更高的序列同源性,并具有轉(zhuǎn)錄因子功能的蛋白質(zhì)的DNA,可基于上述的雜交來進(jìn)行鑒定。換句話說,這種DNA可容易地得到,例如,從通過基因組序列分析或其它方法獲得的具有未知功能的DNA組或在公共數(shù)據(jù)庫中累積的核苷酸序列信息中,使用BLAST軟件進(jìn)行同源性檢索。通過用適當(dāng)?shù)南拗泼笍暮猩鲜鯠NA的質(zhì)粒克隆中將其剪切,或通過PCR擴增含有該DNA的區(qū)域,基于雜交或序列分析鑒定的DNA可被分離作為含有本發(fā)明的轉(zhuǎn)錄因子基因的DNA片段。這樣分離的本發(fā)明的轉(zhuǎn)錄因子基因的核苷酸序列可通過多種常規(guī)誘變技術(shù)進(jìn)行修飾(例如定點誘變)。本發(fā)明包括本發(fā)明的轉(zhuǎn)錄因子基因,該基因中只要其編碼具有轉(zhuǎn)錄因子功能的蛋白質(zhì)就可引入這種修飾。
在上述序列分析中,序列被預(yù)處理,從而形成最佳的對比條件用于確定兩個氨基酸序列之間,或者兩個核苷酸序列之間的序列同源性。例如,一個缺口被引入其中一個序列,使之最適合與另一個序列對齊。此后,在各個位點上的氨基酸殘基或核苷酸進(jìn)行比較。當(dāng)?shù)谝粋€序列中特定的位點上與第二個序列中相應(yīng)的位點上的氨基酸殘基或核苷酸相同時,則這些序列在該位點上彼此相同。兩個序列之間的序列同源性表示為序列之間相同位點的數(shù)量相對于全部位點數(shù)量(全部氨基酸殘基或核苷酸)的百分比。
基于上述原則,兩個氨基酸序列之間或兩個核苷酸序列之間的序列同源性通過Karlin和Altschul算法來測定(Proc.Natl.Acad.Sci.U.S.A.,872264-2268,1990;和Proc.Natl.Acad.Sci.U.S.A.,905873-5877,1993)。利用這種算法的BLAST程序由Altschul等開發(fā)(J.Mol.Biol.215403-410,1990)。此外,Gapped BLAST是一種比BLAST程序具有更高的靈敏度的測定序列同源性的程序(Nucleic Acids Res.253389-3402,1997)。上述程序主要用于檢索與數(shù)據(jù)庫中特定的序列具有高度同源性的序列。這些程序通常采用參數(shù)的缺省值(default value)。這些程序可以在網(wǎng)站上獲得,例如,國際互連網(wǎng)上的美國國家生物技術(shù)信息中心(National Center for Bilotechnology Information,U.S.A)。
當(dāng)用BLAST軟件不能找到具有顯著序列同源性的序列時,可使用更高靈敏度的FASTA軟件在數(shù)據(jù)庫中檢索同源序列(W.R.Pearson和D.J.Lipman,Proc.Natl.Acad.Sci.,852444-2448,1988)。FASTA軟件可在例如GenomeNet的網(wǎng)站上使用。在這種情況下也可使用參數(shù)缺省值。例如,使用nr-nt數(shù)據(jù)庫并在檢索核苷酸序列時ktup值被設(shè)定在6。
上述各個方法主要用于檢索數(shù)據(jù)庫中的同源序列。在本發(fā)明中,使用Genetyx Mac Ver.11.1(軟件開發(fā)有限公司SoftwareDevelopment Co.,Ltd)的同源性分析可用于測定各個序列組合的序列同源性。該程序利用基于Lipman-Pearson方法(Science,2271435-1441,1985)的步驟,由于它的高精確性和高靈敏度此方法經(jīng)常被使用。當(dāng)測定核苷酸序列間的序列同源性時,如果可能,使用蛋白編碼區(qū)(CDS或ORF)。作為參數(shù),比較用單位大小(Unit Size)設(shè)定為2,挑選位置(Pick up Location)被設(shè)定為5,結(jié)果以百分比來表示。顯示最高值的序列對齊的序列同源性被作為結(jié)果。當(dāng)查詢序列和與之排列的序列之間沒有觀察到30%、50%或70%或更高的重疊時,這些序列常常被推斷出功能相互關(guān)聯(lián),并因此在這種情況下獲得的值不被作為顯示這兩個序列之間的序列同源性的值。例如,如果有這樣一個區(qū)域,該區(qū)域僅含有約幾個核苷酸或氨基酸殘基在兩個序列中完全相互一致,這很可能是偶然的。當(dāng)兩個序列中相同的區(qū)域僅占整個序列的百分之幾時,難以認(rèn)為這些序列作為一個整體具有相似的功能,即使上述區(qū)域具有特異性功能基元序列。
下面的敘述可證實由這樣獲得的本發(fā)明的轉(zhuǎn)錄因子基因編碼的蛋白質(zhì)具有轉(zhuǎn)錄因子的功能和調(diào)節(jié)硫同化基因表達(dá)的功能。
本發(fā)明的轉(zhuǎn)錄因子可通過表達(dá)本發(fā)明的轉(zhuǎn)錄因子基因制得。本發(fā)明轉(zhuǎn)錄因子基因的表達(dá),以及蛋白質(zhì)的回收和純化可采用本領(lǐng)域熟練技術(shù)人員已知的技術(shù)進(jìn)行。在表達(dá)本發(fā)明的轉(zhuǎn)錄因子基因的一般方法中,首先制備含有整合了上述基因的重組載體。本發(fā)明還包括含有整合了本發(fā)明的轉(zhuǎn)錄因子基因的重組載體,該載體采用如下的方式制備。
3.重組載體的制備本發(fā)明的重組載體可通過連接本發(fā)明的轉(zhuǎn)錄因子基因至適當(dāng)?shù)妮d體獲得。可使用任何載體,只要它能使本發(fā)明的轉(zhuǎn)錄因子在以此轉(zhuǎn)化的宿主中的產(chǎn)生。例如,可使用質(zhì)粒、粘粒、噬菌體、病毒、染色體整合載體或人工染色體載體。
上述載體可包括能使轉(zhuǎn)化細(xì)胞進(jìn)行選擇的標(biāo)記基因。標(biāo)記基因的例子包括宿主的營養(yǎng)缺陷型互補基因,例如URA3和niaD,和藥物抗性基因例如氨芐青霉素、卡那霉素或寡霉素抗性基因。重組載體優(yōu)選的含有能使本發(fā)明的基因在宿主細(xì)胞中表達(dá)的啟動子,或其它調(diào)控序列(例如,增強子序列、終止子序列和聚腺苷酸化序列)。啟動子的具體例子包括GAL1啟動子、amyB啟動子和lac啟動子。當(dāng)本發(fā)明的重組載體用于體外蛋白質(zhì)合成時,其在宿主中產(chǎn)生本發(fā)明的轉(zhuǎn)錄因子的能力不是必需的。在這種情況下,該載體可含有適合于所使用的體外蛋白質(zhì)合成系統(tǒng)的轉(zhuǎn)錄和翻譯起始位點。這種載體的一個例子為pIVEX2.3-MCS(Roche Diagnostics)。
4.體外蛋白質(zhì)合成本發(fā)明的轉(zhuǎn)錄因子可體外合成,例如,通過常規(guī)體外蛋白質(zhì)合成技術(shù),使用通過整合本發(fā)明的轉(zhuǎn)錄因子基因至用于如上所述的體外蛋白質(zhì)合成載體制備的重組載體。這種體外合成可,例如,根據(jù)試劑盒的介紹使用快速翻譯系統(tǒng)RTS 100 E.coll HY Kit(RocheDiagnostics)來進(jìn)行。
5.凝膠移位分析可通過,例如,凝膠移位分析證實本發(fā)明的轉(zhuǎn)錄因子是一種具有轉(zhuǎn)錄因子功能的蛋白質(zhì)。這種凝膠移位分析可依據(jù)常規(guī)步驟使用本發(fā)明的純化轉(zhuǎn)錄因子或體外合成的本發(fā)明的轉(zhuǎn)錄因子來進(jìn)行。探針DNA可以是一種標(biāo)記的雙鏈DNA,該DNA含有結(jié)合了本發(fā)明的轉(zhuǎn)錄因子并具有適合于所采用方法的長度的核苷酸序列。例如,可使用退火合成的DNA、PCR-擴增的DNA、從質(zhì)粒等上剪切的DNA。結(jié)合了本發(fā)明的轉(zhuǎn)錄因子的序列的例子包括位于已知與粗糙鏈孢霉中MetR蛋白結(jié)合的sconB基因上游的如SEQ ID NO25所示的核苷酸序列以及與前述序列互補的、如SEQ ID NO26所示的核苷酸序列。
在凝膠移位分析中,例如,具有結(jié)合了本發(fā)明的轉(zhuǎn)錄因子的核苷酸序列的DNA在其5’-末端用熒光、熱-變性進(jìn)行標(biāo)記,然后逐漸冷卻退火。將退火的產(chǎn)物與體外合成的本發(fā)明的轉(zhuǎn)錄因子一起加入結(jié)合反應(yīng)溶液中,使該混合物在室溫下反應(yīng)20分鐘。反應(yīng)產(chǎn)物在8%的聚丙烯酰胺凝膠上進(jìn)行電泳,使用檢測熒光性的檢測儀,例如4200L型測序儀(Model 4200L Sequencer)(LI-COR)觀察到一個條帶。如果觀察到在本發(fā)明的轉(zhuǎn)錄因子存在的情況下以序列特異性方式已經(jīng)移位的移位條帶,即發(fā)現(xiàn)本發(fā)明的轉(zhuǎn)錄因子與序列的DNA特異性地結(jié)合該序列DNA。
6.轉(zhuǎn)化體的獲得本發(fā)明的轉(zhuǎn)化體可通過用含有整合了本發(fā)明的轉(zhuǎn)錄因子基因的重組載體來轉(zhuǎn)化宿主獲得。使用的宿主可以是曲霉。曲霉包括黃-綠曲霉如米曲霉(Aspergillus oryzae)醬油曲霉、(Aspergillus sojae)和溜曲霉(Aspergillus tamarii);黑曲霉,如黑曲霉(Aspergillusniger)、泡盛曲霉(Aspergillus awamori)、宇佐美曲霉(Aspergillususamii)、和Asergillus saitoi;和白曲霉,如Aspergilluskawachii。本發(fā)明中使用的上述曲霉優(yōu)選為黃-綠曲霉,如米曲霉、醬油曲霉或溜曲霉,更優(yōu)選為黃綠曲霉,例如米曲霉或醬油曲霉,最優(yōu)選為米曲霉。
可通過已知的轉(zhuǎn)化曲霉的方法進(jìn)行轉(zhuǎn)化。例如,可通過包括形成原生質(zhì)體然后使用聚乙二醇和氯化鈣的方法來進(jìn)行(Mol.Gen.Genet.,21899-104,1989).
在這樣獲得的曲霉中,本發(fā)明的轉(zhuǎn)錄因子基因的表達(dá)可通過使用可在曲霉中表達(dá)上述基因的重組載體得以增強。在這種情況下,可在曲霉中增強本發(fā)明的轉(zhuǎn)錄因子基因表達(dá)的重組載體可包含如能誘導(dǎo)重組載體中基因的表達(dá)的啟動子的序列元件。
其中本發(fā)明的轉(zhuǎn)錄因子基因表達(dá)被增強的曲霉也可采用不同于上述利用含有整合了本發(fā)明的轉(zhuǎn)錄因子基因的重組載體的轉(zhuǎn)化技術(shù)的方法制備。具體地說,其中本發(fā)明的轉(zhuǎn)錄因子基因的表達(dá)被增強的曲霉可通過,例如,紫外線照射或輻射曲霉或用誘變劑例如亞硝基胍或甲基磺酸乙酯處理曲霉來獲得。
本發(fā)明包括通過使用含有如上述整合了本發(fā)明的轉(zhuǎn)錄因子基因的重組載體獲得的轉(zhuǎn)化體以及其中本發(fā)明的轉(zhuǎn)錄因子基因的表達(dá)被增強的曲霉。
7.硫-代謝基因表達(dá)的去抑制在上述部分6獲得的曲霉中,硫同化基因表達(dá)的模式被改變。在一個具體的實施例中,由低分子量含硫物質(zhì)造成的硫同化基因表達(dá)的抑制,在低分子量含硫物質(zhì)存在于本發(fā)明的曲霉中的情況下,被本發(fā)明的轉(zhuǎn)錄因子提高了。這可用如下的方式證實。
被檢測的曲霉菌株和野生型菌株(宿主菌株)在含有低分子量含硫物質(zhì)的培養(yǎng)基中被單獨預(yù)培養(yǎng)。培養(yǎng)物被轉(zhuǎn)移到含低分子量含硫物質(zhì)的培養(yǎng)基以及不含該物質(zhì)的培養(yǎng)基中進(jìn)一步培養(yǎng)??墒褂萌魏晤愋偷牡头肿恿亢蛭镔|(zhì),只要它們可以抑制野生型菌株中硫同化基因的表達(dá)。可采用的例子包括甲硫氨酸和硫酸鹽。低分子量含硫物質(zhì)的濃度是,例如為0.5mM或更高,優(yōu)選1mM或更高,更優(yōu)選5mM或更高,和最優(yōu)選10mM或更高。從這些培養(yǎng)物中回收細(xì)胞,然后將其溶解。細(xì)胞溶解可通過,例如,將細(xì)胞置于充滿液氮的研缽中,用研杵研磨細(xì)胞,將其轉(zhuǎn)移到含有緩沖液和玻璃珠的微管中,使用多珠振蕩器(Multi-beads shocker)MB-200(Yasui Kikai Corporation)來溶解細(xì)胞。隨后,測定通過離心制備的溶解產(chǎn)物或其上清液中硫同化基因產(chǎn)物的酶活。當(dāng)被檢測的菌株的酶活比在低分子量含硫物質(zhì)存在的情況下的野生型菌株中的酶活高至少1.5倍,優(yōu)選至少2倍,更優(yōu)選至少3倍,更優(yōu)選至少5倍和最優(yōu)選至少10倍時,可以說由低分子量含硫物質(zhì)造成的硫同化基因表達(dá)的抑制被提高了。當(dāng)?shù)头肿恿亢蛭镔|(zhì)存在時培養(yǎng)的硫同化基因產(chǎn)物的酶活比該物質(zhì)不存在時培養(yǎng)的硫同化基因產(chǎn)物的酶活高至少10%,優(yōu)選20%,最優(yōu)選30%時,可以說抑制被提高了。在某些條件下,已知一些類型的酶在野生型菌株的生長過程中似乎被暫時地去抑制(Biochem.J.,166415-420,1977),在這種條件下測得的結(jié)果不采用。為了確定這種情況,需要使用野生型菌株在對照實驗中證實酶的活性。被測定的硫同化基因產(chǎn)物的酶活包括芳基硫酸酯酶的活性。芳基硫酸酯酶的活性可通過將p-硫酸硝基酚作為底物的方法來測定(Biochem.J.,166411-413,1977)。
8.具有比親本菌株高的生產(chǎn)胞外蛋白酶和胞外外肽酶的能力的曲霉在低分子量含硫物質(zhì)存在的情況下,本發(fā)明的曲霉能夠產(chǎn)生胞外蛋白酶和胞外外肽酶。特別地,在低分子量含硫物質(zhì)存在的情況下,硫同化基因的表達(dá)被本發(fā)明的轉(zhuǎn)錄因子去抑制的曲霉具有比在向宿主引入上述遺傳修飾中使用的親本菌株高的生產(chǎn)胞外蛋白酶和胞外外肽酶的能力。這被本發(fā)明所詳細(xì)闡明。相應(yīng)地,具有比親本菌株高的生產(chǎn)胞外蛋白酶和胞外外肽酶能力的曲霉可通過制備本發(fā)明的曲霉來獲得,例如以上述的方式。生產(chǎn)這些酶的能力可通過,例如,依據(jù)下面描述的生產(chǎn)酶的方法來培養(yǎng)曲霉,并通過常規(guī)技術(shù)測定培養(yǎng)基中蛋白酶和外肽酶的活性來進(jìn)行檢測。蛋白酶的活性可通過,例如,使用偶氮酪蛋白作為底物的方法來測定(the Journal of the SoysauceInformation Center,1686-89,1990)。外肽酶例如氨肽酶的活性可通過,例如,日本專利出版物(Kokai)No.11-34677 A(1999)中公開的方法來測定,其中亮氨酸-p-硝基苯胺或亮氨酰-雙甘氨肽被作為底物。
9.生產(chǎn)本發(fā)明的酶的方法生產(chǎn)本發(fā)明的酶的方法包括,在培養(yǎng)基中培養(yǎng)本發(fā)明的曲霉,并可選地從培養(yǎng)物中回收酶(例如,蛋白酶或外肽酶)。培養(yǎng)可使用液體或固體培養(yǎng)技術(shù)進(jìn)行。所使用的培養(yǎng)基可含有低分子量含硫物質(zhì)(即一種具有低分子量或可容易地降解為小分子的含硫物質(zhì))。在這種培養(yǎng)基中,野生型曲霉中的硫同化基因的表達(dá)被抑制。相反,這種基因的表達(dá)在本發(fā)明的曲霉中被去抑制,并且產(chǎn)生胞外蛋白酶或胞外外肽酶的能力可被增強。當(dāng)培養(yǎng)基中低分子量含硫物質(zhì)的濃度至少為0.5mM,優(yōu)選至少為1mM,更優(yōu)選至少為2mM,進(jìn)一步優(yōu)選至少為3mM,更優(yōu)選至少為5mM和最優(yōu)選至少為10mM時,該效果特別顯著。根據(jù)調(diào)節(jié)本發(fā)明的轉(zhuǎn)錄因子基因表達(dá)所使用的啟動子的類型,一種針對啟動子的誘導(dǎo)的底物優(yōu)選地按需要存在于培養(yǎng)基中,考慮到曲霉中本發(fā)明的轉(zhuǎn)錄因子的表達(dá)被本發(fā)明的重組載體增強,培養(yǎng)基中其抑制劑的濃度最好較低??墒褂玫膯幼拥睦訛榈矸勖富騿幼印T谶@種情況下,當(dāng)誘導(dǎo)的底物,例如淀粉、糊精或麥芽糖的量被認(rèn)為較少時,可加入任何誘導(dǎo)的物質(zhì)來促進(jìn)本發(fā)明轉(zhuǎn)錄因子的表達(dá)。假在這種情況下,葡萄糖的濃度最好較低。
可使用任何培養(yǎng)溫度和培養(yǎng)周期,只要在這種條件下可以生產(chǎn)出感興趣的酶。當(dāng)生產(chǎn)出的酶包含于培養(yǎng)物中時,可根據(jù)計劃的用途使用。換句話說,根據(jù)常規(guī)技術(shù)可選的從培養(yǎng)物中提取酶,隨后在使用前部分或全部純化。
10.本發(fā)明的曲霉在含蛋白物質(zhì)的降解中的應(yīng)用本發(fā)明的曲霉可用于降解含蛋白物質(zhì)。具體地說,本發(fā)明的曲霉具有高的生產(chǎn)胞外蛋白酶和胞外外肽酶的能力。因此,它的使用能使高效率地降解含蛋白質(zhì)物質(zhì)。在本說明書中,術(shù)語“含蛋白質(zhì)的物質(zhì)”是指包含蛋白質(zhì)作為其組分的物質(zhì)。其例子包括含植物蛋白的物質(zhì),例如大豆、脫脂大豆、小麥和面筋;含動物蛋白的物質(zhì),例如牛奶、脫脂乳、乳酪蛋白、動物肉和動物膠;含魚衍生蛋白的物質(zhì),例如魚肉或魚蛋白;含微生物衍生蛋白的物質(zhì),例如酵母和小球藻;以及它們的加工產(chǎn)品。在本發(fā)明的降解含蛋白質(zhì)物質(zhì)的方法中,可首先根據(jù)上述部分9中描述的生產(chǎn)酶的方法來培養(yǎng)本發(fā)明的曲霉,生產(chǎn)出的酶可與含蛋白的物質(zhì)混合以促進(jìn)降解反應(yīng)。換句話說,可用本發(fā)明的曲霉接種含蛋白的物質(zhì),使曲霉在含蛋白的物質(zhì)中生長,從而在其中產(chǎn)生酶。在這種情況下,可通過適當(dāng)?shù)募庸みM(jìn)一步加速反應(yīng),例如曲霉生長后與鹽混合。這樣的例子等同于,例如,生產(chǎn)醬油或豆瓣醬的加工過程中,曲霉制造和搗碎步驟。特別地,在用于生產(chǎn)醬油或豆瓣醬的培養(yǎng)基中的野生型曲霉中,即含蛋白的物質(zhì)中,常常含有豐富的含硫物質(zhì),該物質(zhì)具有低分子量或能被容易地降解為小分子,上述表達(dá)被低分子量含硫物質(zhì)所抑制。相反,硫同化酶在其中的表達(dá)在低分子量含硫物質(zhì)存在的情況下被去抑制的本發(fā)明的曲霉非常有用,因為它可在,例如上述涉及含蛋白的物質(zhì)降解的、生產(chǎn)醬油或豆瓣醬的過程中高效率地生產(chǎn)蛋白水解酶,例如蛋白酶。本發(fā)明還包括使用本發(fā)明的曲霉降解含蛋白的物質(zhì)的方法。根據(jù)采用本發(fā)明的曲霉降解含蛋白物質(zhì)的方法,含蛋白物質(zhì)的降解產(chǎn)物可首先制備成降解混合物。含蛋白物質(zhì)的降解產(chǎn)物可根據(jù)需要以這種混合物形式使用。換句話說,如果需要,感興趣的降解產(chǎn)物在使用前可從上述降解混合物中分離得到。
實施本發(fā)明的最佳方式參考下列的實施例從而更詳細(xì)地描述本發(fā)明,盡管本發(fā)明的技術(shù)范圍并不局限于這些實施例。
調(diào)節(jié)黃綠曲霉米曲霉(Aspergillus oryzae)的硫同化基因的轉(zhuǎn)錄因子基因的獲得黃綠曲霉米曲霉RIB40菌株(ATCC42149)的孢子接種至100ml的YPD培養(yǎng)基上并在30℃振蕩培養(yǎng)過夜。隨后,根據(jù)Iimura的方法提取基因組DNA(Argric.Biol.Chem.,323-328,51(1987))。使用該基因組DNA片段作模板并且使用基于metR和cys-3的核苷酸序列合成的下列引物進(jìn)行PCR,其中metR是構(gòu)巢曲霉(Aspergillusnidulans)的硫同化基因的調(diào)節(jié)因子基因,cys-3是粗糙鏈孢霉(Neurospora crassa)的硫同化基因的調(diào)節(jié)因子基因。
5’-ACCGC(T/C)GC(T/C)AGCGC(T/C)CG(A/G)TT-3’(SEQ IDNO7)5’-(G/C)GA(G/T)CC(A/G)TG(T/C)TTCTC(A/G)GT-3’(SEQID NO8)PCR采用Expand-HF(Roche Diagnostics)在DNA熱循環(huán)儀(DNAThermal Cycler)中進(jìn)行反應(yīng)(Takara Shuzo Co.,Ltd.)。反應(yīng)溶液組分顯示如下。
(試劑/使用的體積/終濃度)H2O/36μl10x反應(yīng)緩沖液/5μl/1xdNTP混合物(2.5mM)/5μl/250μM引物/2種類型各1μl/20μM模板(0.5μg的DNA)/1μlExpand-HF DNA聚合酶混合物/1μl/3.5U/每個實驗全部液體體積50μl上述反應(yīng)溶液(50μl)的組分在-0.2ml的反應(yīng)試管中混合,該試管被固定在DNA熱循環(huán)儀上,PCR在下列溫度條件下進(jìn)行94℃3分鐘一循環(huán)94℃1分鐘,50℃1分鐘,和72℃1分鐘30次循環(huán);以及72℃7分鐘1循環(huán)。
擴增產(chǎn)物經(jīng)1.5%的瓊脂糖凝膠電泳證實,分離、純化感興趣的DNA片段,隨后與用于TA克隆的pT7Blue T-載體連接(Novagen)。用得到的載體轉(zhuǎn)化E.coli JM 109菌株(ATCC 53323)并克隆。從具有感興趣的DNA片段的E.coli克隆中制備質(zhì)粒,分析克隆的DNA片段的核苷酸序列,使用NCBI blastx進(jìn)行同源性分析(http//www.ncbi.nlm.nih.gov/BLAST/)。結(jié)果發(fā)現(xiàn),該序列與構(gòu)巢曲霉的MetR同源。
然后根據(jù)Chenchik等的方法(Biotechniques,21526-534,1996)獲得含有全長基因的基因組DNA克隆。
具體地說,提取的基因組DNA用各種限制性酶完全消化,這些限制性酶包括EcoRV、ScaI、DraI、PvuII和SspI,它們識別并剪切-6-bp的序列以產(chǎn)生平頭末端。隨后,(P)5’-ACCTGCCC-3’(NH2)(SEQ IDNO9)和5’-CTAATACGACTCACTATAGGGCTCGAGCGGCCGCCCGGGCAGGT-3’(SEQ ID NO10)的接頭被連接到基因組DNA片段的兩端。使用該基因組DNA片段作為模板,并使用基于上述確定的核苷酸序列合成的引物以及具有接頭序列部分的引物5’-CTAATACGACTCACTATAGGGC-3’(SEQ ID NO11)進(jìn)行PCR。當(dāng)獲得5’區(qū)域時使用下列2個引物。
5’-TTTTCCATCTCCAGCTGGGCTACGCG-3’(SEQ ID NO12)5’-AGGGATCTGCGTGCTGTACTTGGTGTGT-3’(SEQ ID NO13)當(dāng)獲得3’區(qū)域時使用下列引物。
5’-TGGAACGGACAGTGCGAGAGACTA-3’(SEQ ID NO14)采用Expand-HF在DNA熱循環(huán)儀中進(jìn)行PCR。當(dāng)獲得5’區(qū)域和3’區(qū)域時采用DraI。反應(yīng)溶液的組分顯示如下。
(試劑/使用的量/終濃度)H2O/18.25μl10x反應(yīng)緩沖液/2.5μl/1xdNTP混合物(2.5mM)/2.5μl/250μM引物/2種類型各0.25μl/5μM模板(0.2μg的DNA)/1μlExpand-HF DNA聚合酶混合物/0.25μl/1.25U/每個實驗全部液體體積25μl上述反應(yīng)溶液(25μl)的成分在0.2ml的反應(yīng)試管中混合,該試管被固定在DNA熱循環(huán)儀上,在下列溫度條件下進(jìn)行下階梯PCR(step-down PCR)。
95℃1分鐘1循環(huán);95℃30秒,74℃15秒,和70℃3分鐘循環(huán)3次;95℃30秒,70℃15秒,和70℃3分鐘循環(huán)3次;95℃30秒,66℃15秒,和70℃3分鐘循環(huán)3次;95℃30秒,62℃15秒,和70℃3分鐘循環(huán)3次;95℃30秒,58℃15秒,和70℃3分鐘循環(huán)3次;和95℃30秒,54℃15秒,和70℃3分鐘循環(huán)20次;擴增產(chǎn)物通過1%的瓊脂糖凝膠電泳證實,分離、純化感興趣的DNA片段,然后與用于TA克隆的pT7Blue T-載體連接。E.coli JM 109菌株用得到的載體轉(zhuǎn)化并克隆。從具有感興趣的DNA片段的E.coli克隆中制備質(zhì)粒,分析克隆的DNA片段的核苷酸序列。該核苷酸序列如SEQ ID NO1所示。使用NCBI blastx對該序列進(jìn)行同源性搜索(http//www.ncbi.nlm.nih.gov/BLAST)。結(jié)果發(fā)現(xiàn),該序列與構(gòu)巢曲霉MetR同源。
為了確定上述基因的cDNA的核苷酸序列,使用RT-PCR擴增cDNA。米曲霉RIB 40菌株的孢子被接種至100ml的YPD培養(yǎng)基中,并在30℃培養(yǎng)20小時。隨后,回收細(xì)胞,然后根據(jù)Chigwin等的方法(Biochemistry 185294-8299,1979)提取總RNA。接著使用寡(dT)纖維素柱(Amersham)獲得mRNA。此后,使用Ready-To-Go RT-PCRBeads合成cDNA(Amersham)。使用下列2個引物。
5’-ATGTCAGATGAGCACATCGCTCGTCAG-3’(SEQ ID NO15)5’-CTAGTTATCGGTGCCCACACCCTTC-3’(SEQ ID NO16)根據(jù)試劑盒標(biāo)準(zhǔn)組分確定反應(yīng)溶液的組成。反應(yīng)條件如下42℃30分鐘;95℃5分鐘;和95℃30秒,55℃1分鐘,和72℃1分鐘32個循環(huán)。
擴增產(chǎn)物通過1%的瓊脂糖凝膠電泳證實,分離、純化感興趣的DNA片段,然后與用于TA克隆的pT7Blue T-載體連接(Novagen)。用得到的載體轉(zhuǎn)化E.coli JM 109菌株并克隆。從具有感興趣的DNA片段的E.coli克隆中制備質(zhì)粒,分析克隆的DNA片段的核苷酸序列。存在于上述確定的染色體上的該基因的序列中,但不存在于該克隆片段上的部分被確定為一個內(nèi)含子。分析該cDNA的核苷酸序列,從而揭示831-bp的開放閱讀框的存在(以下簡稱為“ORF”)。此ORF的核苷酸序列如SEQ ID NO2所示。前述在上文核苷酸測序中獲得的染色體DNA的蛋白質(zhì)基因和cDNA的蛋白質(zhì)基因進(jìn)行相互比較。結(jié)果發(fā)現(xiàn),一個732-bp的內(nèi)含子存在于染色體DNA上。從cDNA的核苷酸序列推導(dǎo)出的氨基酸序列以SEQ ID NO3所示。該氨基酸序列分析的結(jié)果顯示在蛋白質(zhì)C-末端附近存在一亮氨酸拉鏈結(jié)構(gòu)。這表明本發(fā)明的蛋白質(zhì)是一種DNA-結(jié)合蛋白。從常規(guī)的氨基酸序列數(shù)據(jù)庫中檢索與這個氨基酸序列具有高度的序列一致性的序列。使用NCBI blastp(http//www.ncbi.nlm.nih.gov/BLAST/)和指定的nr數(shù)據(jù)庫進(jìn)行檢索。結(jié)果發(fā)現(xiàn)沒有匹配的序列,而構(gòu)巢曲霉(入藏登記號AAD 38380)具有最高的序列同源性。使用Genetyx Mac Ver.11.1對這些序列進(jìn)行同源性搜索,發(fā)現(xiàn)在257-殘基重疊中共有28.8%的序列同源性。由于該序列同源性低至28.8%,因此,僅基于序列同源性難以推定由獲得的基因編碼的蛋白質(zhì)具有與MetR的蛋白質(zhì)相似的功能。
搜索與SEQ ID NO2所示的核苷酸序列高度同源的序列。使用NCBIblastn(http//www.ncbi.nlm.nih.gov/BLAST/)和指定的nr數(shù)據(jù)庫進(jìn)行檢索。粗糙鏈孢霉的cys-3基因被發(fā)現(xiàn)與其具有最高的同源性,但匹配的區(qū)域有限。而且,構(gòu)巢曲霉的metR基因不包括在該檢索結(jié)果中。因此,使用具有更高靈敏度的FASTA進(jìn)一步進(jìn)行檢索。使用GenomeNet的FASTA檢索服務(wù)(http//www.genome.ad.jp),并使用nr-nt數(shù)據(jù)庫。結(jié)果,發(fā)現(xiàn)構(gòu)巢曲霉的metR基因(入藏登記號AF148535)具有最高的序列同源性。CDS區(qū)域(ORF區(qū)域)從該序列中被提取出來,并使用Genetyx Mac Ver.11.1通過同源性搜索進(jìn)行研究,序列被發(fā)現(xiàn)在793-核苷酸的重疊中共有50%的同源。
此外,進(jìn)一步搜索編碼與SEQ ID NO3所示的氨基酸序列同源的氨基酸序列的DNA。采用NCBI tblastn(http//www.ncbi.nlm.nih.gov/BLAST/)和指定的nr數(shù)據(jù)庫進(jìn)行搜索。結(jié)果發(fā)現(xiàn)構(gòu)巢曲霉的metR基因(入藏登記號AF148535)與其具有最高的序列同源性,在氨基酸水平上的序列同源性如上文所述。
黃綠曲霉sconB基因的部分序列的測定絲狀真菌米曲霉RIB 40菌株(ATCC 42149)的孢子被接種至100ml的YPD培養(yǎng)基中,并在30℃振蕩培養(yǎng)過夜。隨后,根據(jù)上述Iimura的方法提取基因組DNA。采用該基因組DNA片段作為模板,并使用下列兩個引物進(jìn)行PCR,這兩個引物是基于構(gòu)巢曲霉和粗糙鏈孢霉的meaB基因的核苷酸序列合成的。
5’-CG(G/A)ATGTG(T/C)GAACAACAC-3’(SEQ ID NO17)5’-CAA(A/C)CCCTC(G/C)AGGTG(A/C)CCGAA-3’(SEQ ID NO18)
使用Expand-HF在DNA熱循環(huán)儀中進(jìn)行PCR。反應(yīng)溶液組分顯示如下.
(試劑/使用的體積/終濃度)H2O/36μl10x反應(yīng)緩沖液/5μl/1xdNTP混合物(2.5mM)/5μl/250μM引物/2種類型各1μl/20μM模板(0.5μg的DNA)/1μlExpand-HF DNA聚合酶混合物/1μl/3.5U/每個實驗全部液體體積50μl上述反應(yīng)溶液(50μl)的組分在0.2ml的反應(yīng)試管中混合,該試管被固定在DNA熱循環(huán)儀上,PCR在下列溫度條件下進(jìn)行。
94℃3分鐘一循環(huán)94℃1分鐘,55℃1分鐘,和72℃1分鐘循環(huán)30次;以及72℃7分鐘1循環(huán)。
擴增產(chǎn)物通過1.0%的瓊脂糖凝膠電泳證實,分離、純化感興趣的DNA片段,然后與pT7Blue T-載體連接用于TA克隆。用得到的載體轉(zhuǎn)化E.coli JM 109菌株并克隆。從具有感興趣的DNA片段的E.coli克隆中制備質(zhì)粒,分析克隆的DNA片段的核苷酸序列,使用NCBIblastx進(jìn)行同源性檢索(http//www.ncbi.nlm.nih.gov/BLAST/)。結(jié)果發(fā)現(xiàn),該序列與構(gòu)巢曲霉SconB高度同源。
然后根據(jù)Chenchik等的方法(Biotechniques,21526-534,1996)獲得含有全長基因的基因組DNA克隆。
具體地說,提取的基因組DNA用各種限制性酶完全消化,這些限制性酶包括EcoRV、ScaI、DraI、PvuII和SspI,它們識別并剪切6-bp的序列從而產(chǎn)生平頭末端。隨后,(P)5’-ACCTGCCC-3’(NH2)(SEQ IDNO9)和5’-CTAATACGACTCACTATAGGGCTCGAGCGGCCGCCCGGGCAGGT-3’(SEQ ID NO10)的接頭被連接到基因組DNA片段的兩端。采用該基因組DNA片段作為模板,并使用基于上述確定的核苷酸序列合成的引物,以及具有接頭序列部分的引物5’-CTAATACGACTCACTATAGGGC-3’(SEQ ID NO11)進(jìn)行PCR。當(dāng)獲得5’區(qū)域時使用下列引物。
5’-AGGAAGCCCCCAGCCACATTTCTTGC-3’(SEQ ID NO19)
當(dāng)獲得3’區(qū)域時使用下列引物。
5’-ACGATTCTTGCCTCAGCCTCCG-3’(SEQ ID NO20)使用Expand-HF在DNA熱循環(huán)儀中進(jìn)行PCR。當(dāng)獲得5’區(qū)域和3’區(qū)域時使用DraI。反應(yīng)溶液的組分顯示如下。
(試劑/使用的量/終濃度)H2O/18.25μl10x反應(yīng)緩沖液/2.5μl/1xdNTP混合物(2.5mM)/2.5μl/250μM引物/2種類型各0.25μl/5μM模板(0.2μg的DNA)/1μlExpand-HF DNA聚合酶混合物/0.25μl/1.25U/每個實驗全部液體體積25μl上述反應(yīng)溶液(25μl)的成分在0.2ml的反應(yīng)試管中混合,該試管被固定在DNA熱循環(huán)儀上,下階梯PCR(step-down PCR)在下列溫度條件下進(jìn)行。
95℃1分鐘1循環(huán);95℃30秒,74℃15秒,和70℃3分鐘循環(huán)3次;95℃30秒,70℃15秒,和70℃3分鐘循環(huán)3次;95℃30秒,66℃15秒,和70℃3分鐘循環(huán)3次;95℃30秒,62℃15秒,和70℃3分鐘循環(huán)3次;95℃30秒,58℃15秒,和70℃3分鐘循環(huán)3次;和95℃30秒,54℃15秒,和70℃3分鐘循環(huán)20次;擴增產(chǎn)物通過1%的瓊脂糖凝膠電泳證實,一大約1-2kb的DNA片段被分離、純化得到,隨后與pT7Blue T-載體連接用于TA克隆。用得到的載體轉(zhuǎn)化E.coli JM 109菌株并克隆。從具有感興趣的DNA片段的E.coli克隆中制備質(zhì)粒,分析克隆的DNA片段的核苷酸序列。該核苷酸序列如SEQ ID NO4所示。使用NCBI blastx對該序列進(jìn)行同源性搜索(http//www.ncbi.nlm.nih.gov/BLAST)。結(jié)果發(fā)現(xiàn),該序列與構(gòu)巢曲霉SconB同源。
為了確定上述基因的cDNA的核苷酸序列,采用RT-PCR擴增cDNA。米曲霉RIB 40菌株的孢子被接種至100ml的YPD培養(yǎng)基中,并在30℃下培養(yǎng)20小時。此后,回收細(xì)胞,然后根據(jù)Chigwin等的方法提取總RNA。接著使用寡(dT)纖維素柱獲得mRNA(Amersham)。此后,使用Ready-To-Go RT-PCR Beads合成cDNA。使用下列2個引物。
5’-ATGGCCCAACCGACCGGAGAACTTAC-3’(SEQ ID NO21)5’-TTAATTGCGGAAACTGTACATGCGCA-3’(SEQ ID NO22)根據(jù)試劑盒的標(biāo)準(zhǔn)組分確定反應(yīng)溶液的組成。反應(yīng)條件如下42℃30分鐘;95℃5分鐘;和95℃30秒,55℃1分鐘,和72℃1分鐘32個循環(huán)。
擴增產(chǎn)物通過1%的瓊脂糖凝膠電泳證實,分離、純化感興趣的DNA片段,然后與pT7Blue T-載體連接用于TA克隆。E.coli JM 109菌株用得到的載體轉(zhuǎn)化并克隆。從具有感興趣的DNA片段的E.coli克隆中制備質(zhì)粒,并分析克隆的DNA片段的核苷酸序列。存在于上述測定的染色體DNA-衍生核苷酸序列中,但不存在于該克隆片段上的部分被確定為一個內(nèi)含子。分析該cDNA的核苷酸序列。該分析揭示了2,055-bp的開放閱讀框的存在。其核苷酸序列如SEQ ID NO5所示。前述在上文核苷酸測序中獲得的染色體DNA的蛋白質(zhì)基因和cDNA的蛋白質(zhì)基因進(jìn)行相互比較。結(jié)果發(fā)現(xiàn),一個48-bp的內(nèi)含子存在于染色體DNA中。從上述核苷酸序列推導(dǎo)出的氨基酸序列如SEQ ID NO6所示。從常規(guī)的氨基酸序列數(shù)據(jù)庫中檢索與這個氨基酸序列具有高度序列一致性的序列。使用NCBI blastp (http//www.ncbi.nlm.nih.gov/BLAST/)和指定的nr數(shù)據(jù)庫進(jìn)行檢索。結(jié)果發(fā)現(xiàn)沒有匹配的序列,而構(gòu)巢曲霉的SconB蛋白(入藏登記號Q00659)具有最高的序列同源性。使用Genetyx Mac Ver.11.1對這些序列進(jìn)行同源性檢索,并且發(fā)現(xiàn)這些序列在677-殘基重疊中共有80.1%的序列同源性。由獲得的基因編碼的蛋白相對于整個序列來說、在大約99%的重疊中與構(gòu)巢曲霉的SconB高度同源;因此,這些序列被認(rèn)為基本上具有相同的功能。
檢索與SEQ ID NO4所示的核苷酸序列具有高度同源的序列。使用NCBI blastn(http//www.ncbi.nlm.nih.gov/BLAST/)和指定的nr數(shù)據(jù)庫進(jìn)行檢索。發(fā)現(xiàn)構(gòu)巢曲霉的SconB基因(入藏登記號U21220)顯示了最高的同源性。因此,從該序列中提取CDS區(qū)域(ORF區(qū)域)并用Genetyx Mac Ver.11.1通過同源性檢索進(jìn)行研究。結(jié)果發(fā)現(xiàn),這些序列在2,036-核苷酸重疊中共有73.2%的序列的同源性。
此外,進(jìn)一步檢索編碼與SEQ ID NO6所示的氨基酸序列同源的氨基酸序列的DNA。使用NCBI tblastn(http//www.ncbi.nlm.nih.gov/BLAST/)和指定的nr數(shù)據(jù)庫進(jìn)行檢索。結(jié)果發(fā)現(xiàn),構(gòu)巢曲霉的SconB基因(入藏登記號U21220)顯示最高的序列同源性,同時在氨基酸水平上的序列同源性如上文所述。
體外蛋白質(zhì)合成采用實施例1中制備的cDNA作為模板,并使用下列兩個引物進(jìn)行PCR反應(yīng)。
5’-GAAGGAGATATACATATGGATTACGACCAG-3’(SEQ ID NO23)5’-CCCCCGGGAGCTCCTAGTTATCGGTGCCCA-3’(SEQ ID NO24)擴增片段被插入表達(dá)載體pIVEX2.3-MCS(Roche Diagnostics)的NdeI-SacI位點。使用快速翻譯系統(tǒng)(Rapid Translation System)RTS 100 E.coli HY試劑盒(Roche Diagnostics)使反應(yīng)在30℃下持續(xù)4小時。這樣,具有如SEQ ID NO3所示的氨基酸序列的蛋白質(zhì)被表達(dá)。
反應(yīng)系統(tǒng)包括下列部分。
12μl的E.coli溶菌產(chǎn)物10μl的反應(yīng)混合物12μl的氨基酸1μl的甲硫氨酸5μl的重組緩沖液1μl的模板DNA這些成分相互混合,該混合物的最終體積經(jīng)添加不含DNA酶/RNA酶的蒸餾水被調(diào)整至50μl。
在體外蛋白合成系統(tǒng)中表達(dá)的蛋白質(zhì)被用于如下凝膠移位分析。
凝膠移位分析一個亮氨酸拉鏈結(jié)構(gòu)存在于如SEQ ID NO3所示的氨基酸序列的C-末端一側(cè)。為了證實本發(fā)明的蛋白質(zhì)具有轉(zhuǎn)錄因子功能,具體地說,蛋白質(zhì)具有DNA-結(jié)合蛋白的功能,采用sconB基因的啟動子區(qū)域作為探針進(jìn)行凝膠移位分析。
使用雙鏈DNA作為用于凝膠移位分析的探針。該雙鏈DNA通過在94℃加熱在其5’端用IRDye-800標(biāo)記的5’-GGACGACTGCTACCACGGTAGCGCGCGGGC-3’(SEQ ID NO25)和未標(biāo)記的5’-GCCCGCGCGCTACCGTGGTAGCAGTCGTCC-3’(SEQ ID NO26)5分鐘,然后逐漸冷卻至退火來制備。在結(jié)合反應(yīng)中,將上述反應(yīng)中制備的160fmol的探針和1μl實施例3中制備的蛋白質(zhì)加入結(jié)合反應(yīng)溶液中(10mM Tris-HCl(pH7.5),50mM NaCl,0.5mM DTT,0.5mM EDTA,2mM MgCl2,4%的甘油和0.2mg/ml BSA),使之在室溫下反應(yīng)20分鐘,在8%的聚丙烯酰胺凝膠(791)上進(jìn)行電泳,為了檢測,使用LI-COR4200L測序儀(LI-COR)來觀察移位的條帶。結(jié)果,相對于該序列觀察到一以序列特異性方式移動的條帶。這有力地表明具有如SEQ IDNO3所示的氨基酸序列的蛋白質(zhì)與sconB基因的啟動子區(qū)域結(jié)合并涉及其轉(zhuǎn)錄的調(diào)節(jié)。此實驗的結(jié)果證實含有SEQ ID NO3顯示的氨基酸序列的蛋白質(zhì)具有DNA-結(jié)合蛋白的功能。
曲霉表達(dá)載體的構(gòu)建制備一種質(zhì)粒其中在具有米曲霉的淀粉酶啟動子的表達(dá)載體質(zhì)粒pMAR5中的argB基因(一標(biāo)記基因)(Biosci.Biotech.Biochem.,561674-1675,1992)被米曲霉的pyrG基因取代。pMAR5用SphI消化,平端化,進(jìn)一步用SalI消化,并在0.7%的瓊脂糖凝膠上電泳以獲得大約4-kb的片段。另外,ppyrG-26(日本專利申請(Kokai)No.2001-46053A)用BamHI消化,平端化,進(jìn)一步用SalI消化,并在0.7%的瓊脂糖凝膠上電泳以獲得包含pyrG基因的約2.2kb的DNA片段。這些片段互相連接從而產(chǎn)生載體,且用該載體轉(zhuǎn)化E.coliJM 109菌株。獲得的質(zhì)粒被稱做pAP。這個質(zhì)粒是一種表達(dá)載體,它包含pyrG基因作為選擇標(biāo)記,并在淀粉酶基因的啟動子和終止子之間具有SmaI位點。該質(zhì)??稍诘矸勖富騿幼拥目刂葡峦ㄟ^在與啟動子相同的方向?qū)⒒虻腛RF插入進(jìn)入SmaI位點并用它轉(zhuǎn)化曲霉從而表達(dá)感興趣的基因。
用實施例1中獲得的RNA作為模板,并使用RNA LA-PCR試劑盒(Takara Shuzo Co.,Ltd)來進(jìn)行RT-PCR,從而獲得包含具有如SEQID NO2所示的核苷酸序列的ORF的DNA片段。
與試劑盒結(jié)合的引物被用于進(jìn)行逆轉(zhuǎn)錄,該引物包含在oligo(dT)的3’一側(cè)上的一個接頭序列。反應(yīng)溶液的組分根據(jù)試劑盒的標(biāo)準(zhǔn)組分來確定。
逆轉(zhuǎn)錄在如下溫度條件下進(jìn)行30℃10分鐘,50℃30分鐘,99℃5分鐘,和5℃5分鐘組成。
隨后,根據(jù)試劑盒的說明,向逆轉(zhuǎn)錄產(chǎn)物中加入引物、熱穩(wěn)定聚合酶和其它物質(zhì)來進(jìn)行PCR反應(yīng)。使用試劑盒附帶的接頭引物以及下列引物,并且從緊靠5’端的起始密碼子前的位置和3’端的poly(A)位點開始擴增反應(yīng)。
5’-CAAGCTTCCAATATGTCAGATGAGCA-3’(SEQ ID NO27)在如下條件下進(jìn)行PCR94℃2分鐘,94℃10秒,53℃20秒,72℃1分鐘20秒進(jìn)行15個循環(huán),隨后72℃5分鐘。使用DNA EnginePCT-200(MJ Research)的熱循環(huán)儀,其中溫度通過計算控制的方法控制。
隨后,采用上述RT-PCR的擴增產(chǎn)物作為模板,并使用上述引物(SEQID NO28)和下列引物進(jìn)行PCR反應(yīng)。從緊靠5’端的起始密碼子前的位置和緊靠3’端的終止密碼子后的位置開始擴增。
5’-AAGCTCTAGATACACAAGGTAACAGA-3’(SEQ ID NO28)修飾被引入到各個引物中,這樣擴增的序列在其5’端含有限制酶HindIII的識別序列,而在3’端含有限制酶XbaI的識別序列。Tbr EXTDNA聚合酶(Fynnzymes)被用作熱穩(wěn)定DNA聚合酶,而反應(yīng)溶液組分則根據(jù)附著在聚合酶上的說明來確定。
在如下條件下進(jìn)行PCR94℃2分鐘,94℃10秒,53℃20秒,72℃1分鐘共30個循環(huán),隨后72℃5分鐘。擴增產(chǎn)物的一部分在0.7%的瓊脂糖凝膠上進(jìn)行電泳,并觀察到一約0.9-kb的條帶。
隨后,使用TOPO TA Cloning試劑盒,采用TOP 10細(xì)胞(Invitrogen)將擴增產(chǎn)物插入pCR2.1-TOPO載體中。試劑盒附帶的E.coli TOP 10菌株用該載體轉(zhuǎn)化,隨后獲得8個轉(zhuǎn)化體的克隆。從每一轉(zhuǎn)化體中提取質(zhì)粒,用限制酶HindIII和XbaI進(jìn)行酶切,并在0.7%的瓊脂糖凝膠上電泳。結(jié)果,在全部克隆中均觀察到約0.9kb的片段。測定了這8個克隆的核苷酸序列,鑒別出不含PCR-引入錯誤的一個克隆。
該質(zhì)粒用HindIII和XbaI消化,平端化,并在0.7%的瓊脂糖凝膠上電泳,然后提取到約0.9-kb的片段。該片段與SmaI-消化的pAP連接從而產(chǎn)生載體,E.coli JM 109菌株用該載體進(jìn)行轉(zhuǎn)化。從E.coli轉(zhuǎn)化體的6個克隆中制備質(zhì)粒,并檢測插入片段的方向。結(jié)果,發(fā)現(xiàn)6個克隆中的2個在相對于淀粉酶啟動子的合適方向上具有插入片段。其中1個被命名為pAM1。2002年2月19日,pAM1被保藏在國家先進(jìn)工業(yè)科學(xué)和技術(shù)研究所(National Institute of AdvancedIndustrial Science and Technology),國際專利生物保藏機構(gòu)(International Patent Organism Depositary),(Tsukuba Central6,1-1-1Higashi,Tsukuba,Igaraki,日本),入藏登記號為FERMBP-7907. 曲霉轉(zhuǎn)化體的獲得利用日本專利出版物(Kokai)No.2001-46053 A中公開的方法,采用pMA1轉(zhuǎn)化從米曲霉1764菌株(IFO4206,IAM2636)中來源的pyrG-缺乏的菌株。通過涉及原生質(zhì)形成的方法(Mol.Gen.Genet.,21899-104,1989),并使用聚乙二醇和氯化鈣進(jìn)行轉(zhuǎn)化。pyrG-缺乏的菌株使用5μg的pAM1轉(zhuǎn)化,轉(zhuǎn)化體在基本培養(yǎng)基中進(jìn)行篩選,獲得大約1,000個克隆。這些克隆中,12個克隆在基本培養(yǎng)基中被重復(fù)用于單個分生孢子的分離以穩(wěn)定它們的性狀。這些菌株的分生孢子被從瓊脂培養(yǎng)基上刮下,懸浮于100μl的0.05%的Triton X-100的TE緩沖液,然后在-80℃的深度冷凍器中冷凍并在室溫下解凍3次。該步驟重復(fù)3次以獲得可作為PCR模板的染色體DNA。使用這種染色體DNA作為模板,以及如下所示的序列的引物進(jìn)行PCR,該引物相當(dāng)于位于淀粉酶啟動子上游的載體區(qū)域的序列,且該引物具有插入基因的3’末端上游方向上的如SEQ ID NO28所示的序列。
5’-GAGCGGATAACAATTTCACACAGG-3’(SEQ ID NO29)
Tbr EXT DNA聚合酶(Fynnzymes)被作為熱穩(wěn)定DNA聚合酶,并且反應(yīng)溶液的組分根據(jù)附著在聚合酶上的說明來確定。
PCR在如下條件下進(jìn)行94℃2分鐘,接著94℃10秒,60℃20秒和72℃2分鐘共45個循環(huán)。擴增產(chǎn)物的一部分在0.7%的瓊脂糖凝膠上電泳,并在10個樣品中觀察到約2kb的條帶。這樣,發(fā)現(xiàn)這些菌株具有從淀粉酶啟動子到插入基因的3’末端的沒有中斷的區(qū)域。其中一個菌株被命名為TFM1。
曲霉硫同化基因的去抑制大約106個TMF1菌株和米曲霉1764親本菌株(硫同化基因調(diào)節(jié)系統(tǒng)的野生型表型)的分生孢子細(xì)胞被接種到40ml的添加了10mM甲硫氨酸的蛋白胨糊精培養(yǎng)基中,在150rpm和30℃下分別旋轉(zhuǎn)振蕩培養(yǎng)24小時。細(xì)胞通過離心沉淀并除去上清液。將細(xì)胞懸浮于40ml的冰水冷凍的無菌超純水中并再次離心,用于洗滌。這樣洗滌重復(fù)3次后,將細(xì)胞分別懸浮于50ml的抑制培養(yǎng)基(10mM甲硫氨酸存在于在不含硫源的基本培養(yǎng)基中)和50ml的去抑制培養(yǎng)基中(不含硫源的基本培養(yǎng)基)。將生成物被移至錐形瓶中,并在30℃下和150rpm進(jìn)行旋轉(zhuǎn)振蕩培養(yǎng)。細(xì)胞通過離心14小時后,采用上述相同的方式用40ml冰水冷凍的無菌超純水洗滌3次分離。洗滌的細(xì)胞用紙巾完全吸干水分,轉(zhuǎn)移至充滿液氮的研缽中,并用研杵使細(xì)胞溶解。大約一半體積的溶解細(xì)胞被轉(zhuǎn)移到含有0.7ml的Tris-順丁烯二酸緩沖液(添加了0.2M順丁烯二酸的0.2M的Tris(pH6.9))的微管中,向其中加入0.35g的玻璃珠,并使用多珠振蕩器MB-200(Yasui Kikai公司)以80%的功率輸出進(jìn)行細(xì)胞溶解10分鐘。在10,000xg離心2分鐘,使玻璃珠和不溶物質(zhì)沉淀,回收溶解產(chǎn)物的上清液。溶解產(chǎn)物上清液中的蛋白質(zhì)濃度采用蛋白質(zhì)測定試劑盒II(Bio-Rad)測定,并用Tris-順丁烯二酸緩沖液將上清液稀釋到0.4mg/ml。20mM的硫酸對硝基苯酚Tris-順丁烯二酸緩沖液(150μl)被加入25μl的溶解產(chǎn)物上清液中,并在37℃下培養(yǎng)15分鐘。然后加入0.5M的氫氧化鈉水溶液(150μl)并攪動從而終止反應(yīng)。在盲試中,溶解產(chǎn)物是在氫氧化鈉加入后加入的,而不是在氫氧化鈉加入前加入。測定各個樣品以及盲試樣品在402nm處的吸光度,樣品和盲試樣品之間吸光度的差異被確定為芳基硫酸酯酶的活性值(以任意單位)。結(jié)果顯示于下表1中。
表1
當(dāng)1764菌株在抑制培養(yǎng)基中的活性為在去抑制培養(yǎng)基中的2.5%時,TFM1菌株在抑制培養(yǎng)基中的活性高達(dá)在去抑制培養(yǎng)基中的36.9%。TFM1菌株的活性在抑制培養(yǎng)基中比親本菌株的活性高約19倍,在去抑制培養(yǎng)基中比親本菌株的活性高約1.3倍。這表明在該曲霉中,硫同化基因表達(dá)的抑制被低分子量含硫化合物提高。
曲霉培養(yǎng)和胞外酶活性的測定TFM1菌株和米曲霉1764菌株在各種培養(yǎng)基中培養(yǎng),并且測定胞外酶活性。
a.在麥麩培養(yǎng)基上進(jìn)行固體培養(yǎng)將水或20mM甲硫氨酸水溶液(2.22ml)加入2.78g麥麩中,將其充分混合,混合物在150ml-錐形瓶中通過高壓滅菌器在120℃滅菌60分鐘。向其中接種上述曲霉分生孢子(約106個細(xì)胞),在30℃下靜置培養(yǎng)。隨后該容器被振蕩20小時,以使培養(yǎng)基充分分散,培養(yǎng)再繼續(xù)進(jìn)行32小時。培養(yǎng)完成后,加入50ml蒸餾水,使該溶液在5℃下靜置12小時,使用#2濾紙(Toyo Roshi Kaisha,Ltd.)從中除去培養(yǎng)基和細(xì)胞從而獲得酶提取物。酶提取物的蛋白酶活性和氨肽酶活性分別采用偶氮酪蛋白和L-亮氨酸-p-硝基苯胺作為底物來進(jìn)行測定。結(jié)果證實,甲硫氨酸的添加使兩種菌株的兩種酶活都降低了,而TFM1菌株的活性在所有條件下都較高。
b.大豆粉培養(yǎng)基中進(jìn)行的液體培養(yǎng)采用含有1.5%的經(jīng)加熱和加壓膨脹的脫脂大豆粉,和1.5%的磷酸二氫鉀的大豆粉液體培養(yǎng)基以及通過向上述培養(yǎng)基中加入10mM甲硫氨酸、20mM谷氨酸和1.5%的麥芽糖一水化物制備的培養(yǎng)基來進(jìn)行液體培養(yǎng)。將上述曲霉分生孢子(約106個細(xì)胞)接種到培養(yǎng)基上,在30℃和130rpm旋轉(zhuǎn)振蕩培養(yǎng)48小時。采用#2濾紙(Toyo Roshi Kaisha,Ltd.)除去培養(yǎng)基中的細(xì)胞和一些不溶物質(zhì)從而獲得培養(yǎng)上清液。該培養(yǎng)上清液的蛋白酶活性和氨肽酶活性分別使用偶氮酪蛋白和L-亮氨酸-p-硝基苯胺作為底物來進(jìn)行測定。結(jié)果證實,甲硫氨酸、谷氨酰胺和麥芽糖的加入使兩種菌株的兩種酶活性都減低,而TFM1菌株的活性在所有條件下都較高。特別地,當(dāng)加入甲硫氨酸、谷氨酰胺和麥芽糖時,1764菌株兩種酶的活性都被降低至基本上難以察覺的水平,而TFM1菌株的活性降低至沒有加入這些物質(zhì)中的任何一種時的活性的約一半。
上述部分a.和b.證實,TFM1菌株具有生產(chǎn)胞外蛋白酶和胞外氨肽酶的改善的能力。
這里引用的所有出版物、專利和專利申請以其全文引入作為參考。
工業(yè)適用性本發(fā)明提供了調(diào)節(jié)曲霉硫同化基因表達(dá)的轉(zhuǎn)錄調(diào)節(jié)因子及其基因。這能使曲霉硫同化基因表達(dá)的調(diào)節(jié)得到修飾。而且,它顯示硫同化基因表達(dá)的增強可導(dǎo)致其中胞外蛋白酶活性和胞外外肽酶活性被增強的曲霉的生產(chǎn)。使用本發(fā)明的曲霉可改善含蛋白質(zhì)物質(zhì)的降解效率。因此,本發(fā)明在工業(yè)上非常有用。
不含正文的序列列表SEQ ID NOs7、8、11、12到24,和27到29分別表示引物DNA。
SEQ ID NOs9和10分別表示接頭DNA。
SEQ ID NOs25和26分別表示探針DNA。
序列表序列表<110>NODA INSTITUTE FOR SCIENTIFIC RESEARCHNATIONAL INSTITUTE OF ADVANCED INDUSTRIAL SCIENCE AND TECHNOLOGY<120>轉(zhuǎn)錄因子、轉(zhuǎn)錄因子基因、含有轉(zhuǎn)錄因子基因的重組載體、由所述載體轉(zhuǎn)化的曲霉、和所述曲霉的用途<130>PH-1627-PCT<140>PCT/JP02/08376<141>2002-08-20<150>JP 2002-045090<151>2002-02-21<160>29<170>PatentIn.Ver.2.1<210>1<211>3392<212>DNA<213>米曲霉<220>
<221>CDS<222>(349)..(612)<220>
<221>CDS<222>(1346)..(1912)<400>1atctttgcga caaatcatac aatcttggac ctgtgaaatt tgtgcattcc tggaccaatt60ccgagctttc ccctctttga gccgatctgg ggtttgactt tcttctctgg ttcaagcttg120ttctggcgcc atcgccatcc agtctggttc ctgctcttct ccaaagaaga agcagtccaa180aaaaaaatta aattaaatta ggtgggcgca agaggtaatt cagaagaagg aaaaagaaaa240aaaagaaaaa ttaccagaaa cttaaattaa agaggcaagg atcaaaacga ggccattacc300agaacggacg cagctctaaa acctctaaaa acccatcgcg cgagcaat atg tca gat 357Met Ser Asp1gag cac atc gct cgt cag aca gcg tca agc ctc gat agg ctt gag aat 405Glu His Ile Ala Arg Gln Thr Ala Ser Ser Leu Asp Arg Leu Glu Asn
5 10 15ttc aac ttc tta ctc tcc cga cac gat cct gcc ctg gca aag agt cga 453Phe Asn Phe Leu Leu Ser Arg His Asp Pro Ala Leu Ala Lys Ser Arg20 25 30 35cat tac tct ttc gac gca gac gcg gcc ggc ttg gct cct ttt caa aac 501His Tyr Ser Phe Asp Ala Asp Ala Ala Gly Leu Ala Pro Phe Gln Asn40 45 50ctg agc atg gat tac gac cag act gag gga atg ggc ggt att tcc gtc 549Leu Ser Met Asp Tyr Asp Gln Thr Glu Gly Met Gly Gly Ile Ser Val55 60 65agt tcc tac gat agc att gag gat gaa cgg aac ccg atc gat gtg aga 597Ser Ser Tyr Asp Ser Ile Glu Asp Glu Arg Asn Pro Ile Asp Val Arg70 75 80ggg tat ccc tat cat ggtaagtctg agcttttatg actctcaatg ttgcattgtt 652Gly Tyr Pro Tyr His85tgcgccatct tctcgatccc tggttcgtgt ctcaattttg tggcctttgc ggcattaggt712ggaaatggta gagctattgc tgaggcgcac tcggatcgtg gccaaagctg atctcgttcg772tctccatcta aatatctcct ttcccttttt ccggggaaaa gcttcttctt gtttgttgtg832ccattagctt gtttgcaatt gttaatcgtg gctgtcattg ttggcgttgc tgtccaactc892ttatcgctcg tggatcactc catactttat tacccataac ctgttaaagt cgaggtttaa952ctttgggctc atgtatgttt tgcttcatct atctccctat tgtttttgcc tgtttttttt1012ttctcttttc tttttttaat ttgccaattt tcttataccc ctttggttgt attctcatct1072gcacccgcat gcctggttga tcacggagac gagcacgcaa tccatcacac caatgacaac1132gtcggtaacc ttgtcgttgg tgttgccgga cccttagcca cgcatctccc tctgttcatc1192taaagctccc caccaagggt cttatgtccc ccttggagct tccctcgtgt gataacactt1252gctccttctt tctgtcttat caccttgcta gatctatgcc tacagcgttg ctgtcctaga1312ttctgctcat tccgttgctt acatctattc cca gca gct gat aaa cac atc aac 1366Ala Ala Asp Lys His Ile Asn90 95tac tcc ctc ccc gac caa atg atc tca tat cca gct cac ccg atc tac 1414Tyr Ser Leu Pro Asp Gln Met Ile Ser Tyr Pro Ala His Pro Ile Tyr100 105 110cct cca atc tct tat gga cct gat gat ctg ggt cat gcc ccg ggg gct 1462Pro Pro Ile Ser Tyr Gly Pro Asp Asp Leu Gly His Ala Pro Gly Ala115 120 125ctg aca ccc tcg gac gtt tca tca tcc ata tca ccc ccg aat ggt caa 1510Leu Thr Pro Ser Asp Val Ser Ser Ser Ile Ser Pro Pro Asn Gly Gln130 135 140ctc gga cac acc aag tac agc acg cag atc cct ggt gat cac ctc gct 1558Leu Gly His Thr Lys Tyr Ser Thr Gln Ile Pro Gly Asp His Leu Ala145 150 155tct gca ctt tcg caa gaa gag cat gtt cgt cgt gct gct gaa gaa gac 1606Ser Ala Leu Ser Gln Glu Glu His Val Arg Arg Ala Ala Glu Glu Asp
160 165 170 175cgc cgg cgg cga aac acc gcg gct agc gcc cgg ttt cgc atg aaa aag 1654Arg Arg Arg Arg Asn Thr Ala Ala Ser Ala Arg Phe Arg Met Lys Lys180 185 190aag cag cgt gag cag acg ctg gaa cgg aca gtg cga gag act acg gag 1702Lys Gln Arg Glu Gln Thr Leu Glu Arg Thr Val Arg Glu Thr Thr Glu195 200 205aag aac gct act ctc gag gcc cgc gta gcc cag ctg gag atg gaa aat 1750Lys Asu Ala Thr Leu Glu Ala Arg Val Ala Gln Leu Glu Met Glu Asn210 215 220cga tgg ttg aag aat ctc ttg act gag aaa cac gaa tcg acg agt agt 1798Arg Trp Leu Lys Asn Leu Leu Thr Glu Lys His Glu Ser Thr Ser Ser225 230 235cgc atg ccg ccc cca ccg gaa gac agt aca gcc ttg aac caa aaa ggc 1846Arg Met Pro Pro Pro Pro Glu Asp Ser Thr Ala Leu Asn Gln Lys Gly240 245 250 255aac agt ggc gga aac ggc caa aaa cac atc cag cca aaa aag aag ggt 1894Asn Ser Gly Gly Asn Gly Gln Lys His Ile Glu Pro Lys Lys Lys Gly260 265 270gtg ggc acc gat aac tag agactaaaac gaagaagtct tgtttttctg 1942Val Gly Thr Asp Asn275ttaccttgtg tatcttcagc ttttccttct gtctctctcc ctcctctccc tcctctctct2002ccttccgaca ttactacatg ctcatgcttt gggcgttggt tccagtttcc ctcttcgcat2062ctgtcttcat atcctctatc tatttttggg ctggtcatcc gtcctatgat ggaggcactt2122gacgatgtaa tgacctttca tcatttttgt ttctgctgtg cgcgagtgcg agtgcgcgac2182ctgagacacg gtatcatttt ctaggctgtt tggaacgttt ttgttttttt ttccctgttt2242ctcttgctcg cccttctgtt cgttctttct tattagtcat gcttggtgaa tcttgcaggc2302aaattggggg tgatctacag ttttcttgag tcttcacgga tcagggtcag ggtctcctcc2362gccctgtcac ccgcaatcgg agtataagga tgggatttag ttattgtcgg tgttgaattt2422ggcaaaccta tatcgcacgt tggacttaca acatacgagc ctaccgtgcc cgcagtagct2482cggcttaaat ctctgatagg gactagagct gagaatcaac tgattggcgt tcaaatttca2542ttcatccgaa gtttgtccta aacccctccg cgtatagatt gcaggcgaga ggtatacaga2602atatatgaat cacacacagg atccaggaca caggcacatt cgagcaaatt gggtttgtgt2662cttgaaatat atatggggag tgttttcttg aacatacatt cgcaagggac tcggagctca2722tcaggctgca atgtttgcct tgctcttttt ttatcctagg gctgttctat cttggcgctt2782gttacggagt actggctata cgttttgaat agtgactaca tacatatcag gcttcagctt2842ttcatctttg gacaagagat ccaaccgcaa aaacagtatt gtactctact acaatccacg2902ggtcgccttt gtaagtctct gaaaagaaaa gaaaaagaaa agaaaagtac cgtagggagc2962agatatgtcc tctagaatca ataaaaacaa aacaccccca gaagtgatca tcaccctcga3022ccgaagaaaa gcggtcggtc gaaagtgtag aatccgggga acaacaaaag caacgaatgg3082agcatgggcg ttgacatcat actcgtcggc tattcatggt ccagaaggaa gttccggggc3142ggctaacgat aatcagtacc gaaacagtcc acgatcacgg ggacgtacgg cgatagttga3202gtttcgagtt gtctcgagtt gaaatagtca cgggattggc atttccatat gatacctgcc3262
cgggcggccg ctcgagccct atagtgagtc gtattaggat ggaatccata tgactagtag3322atcctctaga gtcgacctgc aggcatgcaa gctttcccta tagtgagtcg tattagagct3382tggcgtaatc 3392<210>2<211>831<212>DNA<213>米曲霉<220>
<221>CDS<222>(1)..(831)<400>2atg tca gat gag cac atc gct cgt cag aca gcg tca agc ctc gat agg 48Met Ser Asp Glu His Ile Ala Arg Gln Thr Ala Ser Ser Leu Asp Arg1 5 10 15ctt gag aat ttc aac ttc tta ctc tcc cga cac gat cct gcc ctg gca 96Leu Glu Asn Phe Asn Phe Leu Leu Ser Arg His Asp Pro Ala Leu Ala20 25 30aag agt cga cat tac tct ttc gac gca gac gcg gcc ggc ttg gct cct 144Lys Ser Arg His Tyr Ser Phe Asp Ala Asp Ala Ala Gly Leu Ala Pro35 40 45ttt caa aac ctg agc atg gat tac gac cag act gag gga atg ggc ggt 192Phe Gln Asn Leu Ser Met Asp Tyr Asp Gln Thr Glu Gly Met Gly Gly50 55 60att tcc gtc agt tcc tac gat agc att gag gat gaa cgg aac ccg atc 240Ile Ser Val Ser Ser Tyr Asp Ser Ile Glu Asp Glu Arg Asn Pro Ile65 70 75 80gat gtg aga ggg tat ccc tat cat gca gct gat aaa cac atc aac tac 288Asp Val Arg Gly Tyr Pro Tyr His Ala Ala Asp Lys His Ile Asn Tyr85 90 95tcc ctc ccc gac caa atg atc tca tat cca gct cac ccg atc tac cct 336Ser Leu Pro Asp Gln Met Ile Ser Tyr Pro Ala His Pro Ile Tyr Pro100 105 110cca atc tct tat gga cct gat gat ctg ggt cat gcc ccg ggg gct ctg 384Pro Ile Ser Tyr Gly Pro Asp Asp Leu Gly His Ala Pro Gly Ala Leu115 120 125aca ccc tcg gac gtt tca tca tcc ata tca ccc ccg aat ggt caa ctc 432Thr Pro Ser Asp Val Ser Ser Ser Ile Ser Pro Pro Asn Gly Gln Leu130 135 140gga cac acc aag tac agc acg cag atc cct ggt gat cac ctc get tct 480Gly His Thr Lys Tyr Ser Thr Gln Ile Pro Gly Asp His Leu Ala Ser145 150 155 160
gca ctt tcg caa gaa gag cat gtt cgt cgt gct gct gaa gaa gac cgc 528Ala Leu Ser Gln Glu Glu His Val Arg Arg Ala Ala Glu Glu Asp Arg165 170 175cgg cgg cga aac acc gcg gct agc gcc cgg ttt cgc atg aaa aag aag 576Arg Arg Arg Asn Thr Ala Ala Ser Ala Arg Phe Arg Met Lys Lys Lys180 185 190cag cgt gag cag acg ctg gaa cgg aca gtg cga gag act acg gag aag 624Gln Arg Glu Gln Thr Leu Glu Arg Thr Val Arg Glu Thr Thr Glu Lys195 200 205aac gct act ctc gag gcc cgc gta gcc cag ctg gag atg gaa aat cga 672Asn Ala Thr Leu Glu Ala Arg Val Ala Gln Leu Glu Met Glu Asn Arg210 215 220tgg ttg aag aat ctc ttg act gag aaa cac gaa tcg acg agt agt cgc 720Trp Leu Lys Asn Leu Leu Thr Glu Lys His Glu Ser Thr Ser Ser Arg225 230 235 240atg ccg ccc cca ccg gaa gac agt aca gcc ttg aac caa aaa ggc aac 768Met Pro Pro Pro Pro Glu Asp Ser Thr Ala Leu Asn Gln Lys Gly Asn245 250 255agt ggc gga aac ggc caa aaa cac atc cag cca aaa aag aag ggt gtg 816Ser Gly Gly Asn Gly Gln Lys His Ile Gln Pro Lys Lys Lys Gly Val260 265 270ggc acc gat aac tag 831Gly Thr Asp Asn275<210>3<211>276<212>PRT<213>米曲霉<400>3Met Ser Asp Glu His Ile Ala Arg Gln Thr Ala Ser Ser Leu Asp Arg1 5 10 15Leu Glu Asn Phe Asn Phe Leu Leu Ser Arg His Asp Pro Ala Leu Ala20 25 30Lys Ser Arg His Tyr Ser Phe Asp Ala Asp Ala Ala Gly Leu Ala Pro35 40 45Phe Gln Asn Leu Ser Met Asp Tyr Asp Gln Thr Glu Gly Met Gly Gly50 55 60Ile Ser Val Ser Ser Tyr Asp Ser Ile Glu Asp Glu Arg Asn Pro Ile65 70 75 80Asp Val Arg Gly Tyr Pro Tyr His Ala Ala Asp Lys His Ile Asn Tyr85 90 95Ser Leu Pro Asp Gln Met Ile Ser Tyr Pro Ala His Pro Ile Tyr Pro
100 105 110Pro Ile Ser Tyr Gly Pro Asp Asp Leu Gly His Ala Pro Gly Ala Leu115 120 125Thr Pro Ser Asp Val Ser Ser Ser Ile Ser Pro Pro Asn Gly Gln Leu130 135 140Gly His Thr Lys Tyr Ser Thr Gln Ile Pro Gly Asp His Leu Ala Ser145 150 155 160Ala Leu Ser Gln Glu Glu His Val Arg Arg Ala Ala Glu Glu Asp Arg165 170 175Arg Arg Arg Asn Thr Ala Ala Ser Ala Arg Phe Arg Met Lys Lys Lys180 185 190Gln Arg Glu Gln Thr Leu Glu Arg Thr Val Arg Glu Thr Thr Glu Lys195 200 205Asn Ala Thr Leu Glu Ala Arg Val Ala Gln Leu Glu Met Glu Asn Arg210 215 220Trp Leu Lys Asn Leu Leu Thr Glu Lys His Glu Ser Thr Ser Ser Arg225 230 235 240Met Pro Pro Pro Pro Glu Asp Ser Thr Ala Leu Asn Gln Lys Gly Asn245 250 255Ser Gly Gly Asn Gly Gln Lys His Ile Gln Pro Lys Lys Lys Gly Val260 265 270Gly Thr Asp Asn275<210>4<211>2660<212>DNA<213>米曲霉<220>
<221>CDS<222>(443)..(814)<220>
<221>CDS<222>(864)..(2546)<400>4atcttttctt tcgggcgcat ccttctgcac gtgtttcgaa tttggctgga ccattgaaga60cagaaagaag aagaccctac tcctctcttc catacaccct ctctctgtcg ctttcgcttt120ccccatcccc gcctatcaac cactaaatct ccttatcgcg cgacctatca atccccgacg180gtcgccactg tcactcccct atcggcgcac aaccggatac cgcagtattg actttagact240tcaacaaacc ttgaagaagg tagtcgctgg cgtgatattt cgtcgtcttc tcgattttct300caaggttctt cattaccttc tcgggacgac tgctaccacg gtagcgcgcg ggcggtagga360
acctcgttcc agtcacacga tgcagttcga cgaccgatca gtgcgtgaag gtagcgactc420ttcgcagact ttcttgatga aa atg gcc caa ccg acc gga gaa ctt aca cat 472Met Ala Gln Pro Thr Gly Glu Leu Thr His1 5 10cca tcg caa caa caa caa cta caa cta caa cag cag ttc ttc cag tct 520Pro Ser Gln Gln Gln Gln Leu Gln Leu Gln Gln Gln Phe Phe Gln Ser15 20 25atc ttt ggc ggc gca tcg gac acc act gag gag att gac acc gag acc 568Ile Phe Gly Gly Ala Ser Asp Thr Thr Glu Glu Ile Asp Thr Glu Thr30 35 40gat tct aac cat cga agg ccc cac agt ttc ggt gcc gct gcg acg act 616Asp Ser Asn His Arg Arg Pro His Ser Phe Gly Ala Ala Ala Thr Thr45 50 55ccc gca aag ctt gca aac aag aat gtc gca cca ttt ctc gtc aaa cac 664Pro Ala Lys Leu Ala Asn Lys Asn Val Ala Pro Phe Leu Val Lys His60 65 70atc ccc gaa caa tac ggt ccc ttg ggg tcg cga aga acc gac aag ttg 712Ile Pro Glu Glu Tyr Gly Pro Leu Gly Ser Arg Arg Thr Asp Lys Leu75 80 85 90gag gat ttg agc agc ccg aac tcg aag ttt tgc tat cgc cac cgg cca 760Glu Asp Leu Ser Ser Pro Asn Ser Lys Phe Cys Tyr Arg His Arg Pro95 100 105gac ctt aaa tgc aga cga cag gca gac gaa ccg tcc atg gat aaa cta 808Asp Leu Lys Cys Arg Arg Gln Ala Asp Glu Pro Ser Met Asp Lys Leu110 115 120cag agg gtagggtttc ttagggcttg tcatgtttct cttagctaat gggtcatag gaa866Gln Arg Glu125ttg gaa acg ctg cct ccc agc gac caa caa ggc att gcc cat gta tgg 914Leu Glu Thr Leu Pro Pro Ser Asp Gln Gln Gly Ile Ala His Val Trp130 135 140tct ctg ttt tcg gcc gct ccg gcc aag cac cgc aaa ttg atc ctc cag 962Ser Leu Phe Ser Ala Ala Pro Ala Lys His Arg Lys Leu Ile Leu Gln145 150 155ggg atc atg gct cag tgc tgt ttc ccg caa ctt tcg ttc gtg tcc gct 1010Gly Ile Met Ala Gln Cys Cys Phe Pro Gln Leu Ser Phe Val Ser Ala160 165 170acc gtt cga gac ctc atc cga atc gac ttt ctg acc gct ctt cca ccg 1058Thr Val Arg Asp Leu Ile Arg Ile Asp Phe Leu Thr Ala Leu Pro Pro175 180 185gag atc tcg ttc aaa att ctg tgc tac ctc gac acc acc tcg ctg tgc 1106Glu Ile Ser Phe Lys Ile Leu Cys Tyr Leu Asp Thr Thr Ser Leu Cys190 195 200 205aaa gcc gcc cag gtg tcc agc cgc tgg cgg gca ctg gca gat gat gat 1154
Lys Ala Ala Gln Val Ser Ser Arg Trp Arg Ala Leu Ala Asp Asp Asp210 215 220gtg gtt tgg cat cgg atg tgc gaa caa cac atc cac cgc aaa tgc aag 1202Val Val Trp His Arg Met Cys Glu Gln His Ile His Arg Lys Cys Lys225 230 235aaa tgt ggc tgg ggg ctt cct ctt ctg gag cgg aaa cgt ctg cgg gag 1250Lys Cys Gly Trp Gly Leu Pro Leu Leu Glu Arg Lys Arg Leu Arg Glu240 245 250tcc aag cgc gaa att gaa ttg cgt gcc acc acc tgg gac gtc agc gga 1298Ser Lys Arg Glu Ile Glu Leu Arg Ala Thr Thr Trp Asp Val Ser Gly255 260 265ccc gcg cag aac gca gga ggt gcc gag tgc agt gca cca cat gcg gac 1346Pro Ala Gln Asn Ala Gly Gly Ala Glu Cys Ser Ala Pro His Ala Asp270 275 280 285gat gtg att acc cag aaa cgg aag gcg gat tcg agc gac gat gag acg 1394Asp Val Ile Thr Gln Lys Arg Lys Ala Asp Ser Ser Asp Asp Glu Thr290 295 300gca atc gtg aag cgg cat tgt tcc tcg ctg gat gct cga ccg gag cca 1442Ala Ile Val Lys Arg His Cys Ser Ser Leu Asp Ala Arg Pro Glu Pro305 310 315gat gag gat tac tat acg act cgg tat cgg ccg tgg aag gag gtc tac 1490Asp Glu Asp Tyr Tyr Thr Thr Arg Tyr Arg Pro Trp Lys Glu Val Tyr320 325 330aag gac cga ttc aag gtc ggc acg aat tgg aaa tac ggc cgg tgt tcc 1538Lys Asp Arg Phe Lys Val Gly Thr Asn Trp Lys Tyr Gly Arg Cys Ser335 340 345acc aag gtg ttc aaa ggc cac acc aac gga gtg atg tgc ttg caa ttc 1586Thr Lys Val Phe Lys Gly His Thr Asn Gly Val Met Cys Leu Gln Phe350 355 360 365gag gac aac att ttg gcg act ggt tca tac gac gcg acc atc aag att 1634Glu Asp Asn Ile Leu Ala Thr Gly Ser Tyr Asp Ala Thr Ile Lys Ile370 375 380tgg gat act gaa acc gga gaa gag ctg cgt acc cta cgc gga cac caa 1682Trp Asp Thr Glu Thr Gly Glu Glu Leu Arg Thr Leu Arg Gly His Gln385 390 395tcc ggt att cgc tgt ctc cag ttc gac gac aca aaa ttg atc agc ggc 1730Ser Gly Ile Arg Cys Leu Gln Phe Asp Asp Thr Lys Leu Ile Ser Gly400 405 410agt atg gac cgc agc ttg aag gtg tgg aat tgg cgt acg ggc gag tgc 1778Ser Met Asp Arg Ser Leu Lys Val Trp Asn Trp Arg Thr Gly Glu Cys415 420 425att tcc acc tac acg ggt cac cgt ggt gga gtg atc gga ctg cac ttt 1826Ile Ser Thr Tyr Thr Gly His Arg Gly Gly Val Ile Gly Leu His Phe430 435 440 445
gat gca acg att ctt gcc tca gcc tcc gtt gat aag acg gtc aag att 1874Asp Ala Thr Ile Leu Ala Ser Ala Ser Val Asp Lys Thr Val Lys Ile450 455 460tgg aac ttc gag gat aag tcg aca ttt ctc ctg cgc gga cac acc gat 1922Trp Asn Phe Glu Asp Lys Ser Thr Phe Leu Leu Arg Gly His Thr Asp465 470 475tgg gtc aac gcg gtc cga gtg gac acg act tct cga acg gtg ttc tcg 1970Trp Val Asn Ala Val Arg Val Asp Thr Thr Ser Arg Thr Val Phe Ser480 485 490gct tcg gac gac tgc acc gtt cgc ttg tgg gac ttg gac acc aag gca 2018Ala Ser Asp Asp Cys Thr Val Arg Leu Trp Asp Leu Asp Thr Lys Ala495 500 505tgt ctc cgg acc ttc cat ggc cat gtc ggc caa gtc caa cag gtg gtt 2066Cys Leu Arg Thr Phe His Gly His Val Gly Gln Val Gln Gln Val Val510 515 520 525cct ttg ccc cgg gag ttc gag ttc gaa gac cac gac gct gaa tgt gat 2114Pro Leu Pro Arg Glu Phe Glu Phe Glu Asp His Asp Ala Glu Cys Asp530 535 540aac gat aac atg agc acc aca tct gga gac acg gaa tca aac tcc ctt 2162Asn Asp Asn Met Ser Thr Thr Ser Gly Asp Thr Glu Ser Asn Ser Leu545 550 555cag gca acg ctc gga ctg gag tcg aac gcc act gag acg tct gtc ttt 2210Gln Ala Thr Leu Gly Leu Glu Ser Asn Ala Thr Glu Thr Ser Val Phe560 565 570ggc ccc tca ttt gac aat ggc cgc cca gcc cca cca cgc tac att gtc 2258Gly Pro Ser Phe Asp Asn Gly Arg Pro Ala Pro Pro Arg Tyr Ile Val575 580 585acg agc goc tta gat tcc acc att cgt ctc tgg gag acc acg acc ggt 2306Thr Ser Ala Leu Asp Ser Thr Ile Arg Leu Trp Glu Thr Thr Thr Gly590 595 600 605cgc tgc ctg cgt acc ttc ttc ggt cac ctc gag ggc gtt tgg gcg ctc 2354Arg Cys Leu Arg Thr Phe Phe Gly His Leu Glu Gly Val Trp Ala Leu610 615 620ggt gct gat act ctc cga atc gtg tcc ggt gcg gaa gac cgg atg gtc 2402Gly Ala Asp Thr Leu Arg Ile Val Ser Gly Ala Glu Asp Arg Met Val625 630 635aag atc tgg gat ccc aga acc ggt aaa tgc gag cgc acc ttc acc ggc 2450Lys Ile Trp Asp Pro Arg Thr Gly Lys Cys Glu Arg Thr Phe Thr Gly640 645 650cat tcc ggc cca gtg acc tgt atc ggt ctc ggc gac agt cgg ttt gcg 2498His Ser Gly Pro Val Thr Cys Ile Gly Leu Gly Asp Ser Arg Phe Ala655 660 665acc ggc agt gag gat tgc gaa gtg cgc atg tac agt ttc cgc aat taa 2546Thr Gly Ser Glu Asp Cys Glu Val Arg Met Tyr Ser Phe Arg Asn
670 675 680 685atattctgcc ttcttttttc ttcttctcgt ggcccgtctc ctgtggagac atgatgcgcc2606tatgtttaat gtgctttggt tacaaatacc cttcaagttg gcgctagggt cagg 2660<210>5<211>2055<212>DNA<213>米曲霉<220>
<221>CDS<222>(1)..(2055)<400>5atg gcc caa ccg acc gga gaa ctt aca cat cca tcg caa caa caa caa 48Met Ala Glu Pro Thr Gly Glu Leu Thr His Pro Ser Gln Gln Gln Gln1 5 10 15cta caa cta caa cag cag ttc ttc cag tct atc ttt ggc ggc gca tcg 96Leu Gln Leu Gln Gln Gln Phe Phe Gln Ser Ile Phe Gly Gly Ala Ser20 25 30gac acc act gag gag att gac acc gag acc gat tct aac cat cga agg 144Asp Thr Thr Glu Glu Ile Asp Thr Glu Thr Asp Ser Asn His Arg Arg35 40 45ccc cac agt ttc ggt gcc gct gcg acg act ccc gca aag ctt gca aac 192Pro His Ser Phe Gly Ala Ala Ala Thr Thr Pro Ala Lys Leu Ala Asn50 55 60aag aat gtc gca cca ttt ctc gtc aaa cac atc ccc gaa caa tac ggt 240Lys Asn Val Ala Pro Phe Leu Val Lys His Ile Pro Glu Gln Tyr Gly65 70 75 80ccc ttg ggg tcg cga aga acc gac aag ttg gag gat ttg agc agc ccg 288Pro Leu Gly Ser Arg Arg Thr Asp Lys Leu Glu Asp Leu Ser Ser Pro85 90 95aac tcg aag ttt tgc tat cgc cac cgg cca gac ctt aaa tgc aga cga 336Asn Ser Lys Phe Cys Tyr Arg His Arg Pro Asp Leu Lys Cys Arg Arg100 105 110cag gca gac gaa ccg tcc atg gat aaa cta cag agg gaa ttg gaa acg 384Gln Ala Asp Glu Pro Ser Met Asp Lys Leu Gln Arg Glu Leu Glu Thr115 120 125ctg cct ccc agc gac caa caa ggc att gcc cat gta tgg tct ctg ttt 432Leu Pro Pro Ser Asp Gln Gln Gly Ile Ala His Val Trp Ser Leu Phe130 135 140tcg gcc gct ccg gcc aag cac cgc aaa ttg atc ctc cag ggg atc atg 480Ser Ala Ala Pro Ala Lys His Arg Lys Leu Ile Leu Gln Gly Ile Met145 150 155 160
gct cag tgc tgt ttc ccg caa ctt tcg ttc gtg tcc gct acc gtt cga 528Ala Gln Cys Cys Phe Pro Gln Leu Ser Phe Val Ser Ala Thr Val Arg165 170 175gac ctc atc cga atc gac ttt ctg acc gct ctt cca ccg gag atc tcg 576Asp Leu Ile Arg Ile Asp Phe Leu Thr Ala Leu pro Pro Glu Ile Ser180 185 190ttc aaa att ctg tgc tac ctc gac acc acc tcg ctg tgc aaa gcc gcc 624Phe Lys Ile Leu Cys Tyr Leu Asp Thr Thr Ser Leu Cys Lys Ala Ala195 200 205cag gtg tcc agc cgc tgg cgg gca ctg gca gat gat gat gtg gtt tgg 672Gln Val Ser Ser Arg Trp Arg Ala Leu Ala Asp Asp Asp Val Val Trp210 215 220cat cgg atg tgc gaa caa cac atc cac cgc aaa tgc aag aaa tgt ggc 720His Arg Met Cys Glu Gln His Ile His Arg Lys Cys Lys Lys Cys Gly225 230 235 240tgg ggg ctt cct ctt ctg gag cgg aaa cgt ctg cgg gag tcc aag cgc 768Trp Gly Leu Pro Leu Leu Glu Arg Lys Arg Leu Arg Glu Ser Lys Arg245 250 255gaa att gaa ttg cgt gcc acc acc tgg gac gtc agc gga ccc gcg cag 816Glu Ile Glu Leu Arg Ala Thr Thr Trp Asp Val Ser Gly Pro Ala Gln260 265 270aac gca gga ggt gcc gag tgc agt gca cca cat gcg gac gat gtg att 864Asn Ala Gly Gly Ala Glu Cys Ser Ala Pro His Ala Asp Asp Val Ile275 280 285acc cag aaa cgg aag gcg gat tcg agc gac gat gag acg gca atc gtg 912Thr Gln Lys Arg Lys Ala Asp Ser Ser Asp Asp Glu Thr Ala Ile Val290 295 300aag cgg cat tgt tcc tcg ctg gat gct cga ccg gag cca gat gag gat 960Lys Arg His Cys Ser Ser Leu Asp Ala Arg Pro Glu Pro Asp Glu Asp305 310 315 320tac tat acg act cgg tat cgg ccg tgg aag gag gtc tac aag gac cga 1008Tyr Tyr Thr Thr Arg Tyr Arg Pro Trp Lys Glu Val Tyr Lys Asp Arg325 330 335ttc aag gtc ggc acg aat tgg aaa tac ggc cgg tgt tcc acc aag gtg 1056Phe Lys Val Gly Thr Asn Trp Lys Tyr Gly Arg Cys Ser Thr Lys Val340 345 350ttc aaa ggc cac acc aac gga gtg atg tgc ttg caa ttc gag gac aac 1104Phe Lys Gly His Thr Asn Gly Val Met Cys Leu Gln Phe Glu Asp Asn355 360 365att ttg gcg act ggt tca tac gac gcg acc atc aag att tgg gat act 1152Ile Leu Ala Thr Gly Ser Tyr Asp Ala Thr Ile Lys Ile Trp Asp Thr370 375 380gaa acc gga gaa gag ctg cgt acc cta cgc gga cac caa tcc ggt att 1200Glu Thr Gly Glu Glu Leu Arg Thr Leu Arg Gly His Gln Ser Gly Ile
385 390395 400cgc tgt ctc cag ttc gac gac aca aaa ttg atc agc ggc agt atg gac 1248Arg Cys Leu Gln Phe Asp Asp Thr Lys Leu Ile Ser Gly Ser Met Asp405 410 415cgc agc ttg aag gtg tgg aat tgg cgt acg ggc gag tgc att tcc acc 1296Arg Ser Leu Lys Val Trp Asn Trp Arg Thr Gly Glu Cys Ile Ser Thr420 425 430tac acg ggt cac cgt ggt gga gtg atc gga ctg cac ttt gat gca acg 1344Tyr Thr Gly His Arg Gly Gly Val Ile Gly Leu His Phe Asp Ala Thr435 440 445att ctt gcc tca gcc tcc gtt gat aag acg gtc aag att tgg aac ttc 1392Ile Leu Ala Ser Ala Ser Val Asp Lys Thr Val Lys Ile Trp Asn Phe450 455 460gag gat aag tcg aca ttt ctc ctg cgc gga cac acc gat tgg gtc aac 1440Glu Asp Lys Ser Thr Phe Leu Leu Arg Gly His Thr Asp Trp Val Asn465 470 475 480gcg gtc cga gtg gac acg act tct cga acg gtg ttc tcg gct tcg gac 1488Ala Val Arg Val Asp Thr Thr Ser Arg Thr Val Phe Ser Ala Ser Asp485 490 495gac tgc acc gtt cgc ttg tgg gac ttg gac acc aag gca tgt ctc cgg 1536Asp Cys Thr Val Arg Leu Trp Asp Leu Asp Thr Lys Ala Cys Leu Arg500 505 510acc ttc cat ggc cat gtc ggc caa gtc caa cag gtg gtt cct ttg ccc 1584Thr Phe His Gly His Val Gly Gln Val Gln Glu Val Val Pro Leu Pro515 520 525cgg gag ttc gag ttc gaa gac cac gac gct gaa tgt gat aac gat aac 1632Arg Glu Phe Glu Phe Glu Asp His Asp Ala Glu Cys Asp Asn Asp Asn530 535 540atg agc acc aca tct gga gac acg gaa tca aac tcc ctt cag gca acg 1680Met Ser Thr Thr Ser Gly Asp Thr Glu Ser Asn Ser Leu Gln Ala Thr545 550 555 560ctc gga ctg gag tcg aac gcc act gag acg tct gtc ttt ggc ccc tca 1728Leu Gly Leu Glu Ser Asn Ala Thr Glu Thr Ser Val Phe Gly Pro Ser565 570 575ttt gac aat ggc cgc cca gcc cca cca cgc tac att gtc acg agc gcc 1776Phe Asp Asn Gly Arg Pro Ala Pro Pro Arg Tyr Ile Val Thr Ser Ala580 585 590tta gat tcc acc att cgt ctc tgg gag acc acg acc ggt cgc tgc ctg 1824Leu Asp Ser Thr Ile Arg Leu Trp Glu Thr Thr Thr Gly Arg Cys Leu595 600 605cgt acc ttc ttc ggt cac ctc gag ggc gtt tgg gcg ctc ggt gct gat 1872Arg Thr Phe Phe Gly His Leu Glu Gly Val Trp Ala Leu Gly Ala Asp610 615 620act ctc cga atc gtg tcc ggt gcg gaa gac cgg atg gtc aag atc tgg 1920
Thr Leu Arg Ile Val Ser Gly Ala Glu Asp Arg Met Val Lys Ile Trp625 630 635 640gat ccc aga acc ggt aaa tgc gag cgc acc ttc acc ggc cat tcc ggc 1968Asp Pro Arg Thr Gly Lys Cys Glu Arg Thr Phe Thr Gly His Ser Gly645 650 655cca gtg acc tgt atc ggt ctc ggc gac agt cgg ttt gcg acc ggc agt 2016Pro Val Thr Cys Ile Gly Leu Gly Asp Ser Arg Phe Ala Thr Gly Ser660 665 670gag gat tgc gaa gtg cgc atg tac agt ttc cgc aat taa 2055Glu Asp Cys Glu Val Arg Met Tyr Ser Phe Arg Asn675 680 685<210>6<211>684<212>PRT<213>米曲霉<400>6Met Ala Gln Pro Thr Gly Glu Leu Thr His Pro Ser Gln Gln Gln Gln1 5 10 15Leu Gln Leu Gln Gln Gln Phe Phe Gln Ser Ile Phe Gly Gly Ala Ser20 25 30Asp Thr Thr Glu Glu Ile Asp Thr Glu Thr Asp Ser Asn His Arg Arg35 40 45Pro His Ser Phe Gly Ala Ala Ala Thr Thr Pro Ala Lys Leu Ala Asn50 55 60Lys Asn Val Ala Pro Phe Leu Val Lys His Ile Pro Glu Gln Tyr Gly65 70 75 80Pro Leu Gly Ser Arg Arg Thr Asp Lys Leu Glu Asp Leu Ser Ser Pro85 90 95Asn Ser Lys Phe Cys Tyr Arg His Arg Pro Asp Leu Lys Cys Arg Arg100 105 110Gln Ala Asp Glu Pro Ser Met Asp Lys Leu Gln Arg Glu Leu Glu Thr115 120 125Leu Pro Pro Ser Asp Gln Gln Gly Ile Ala His Val Trp Ser Leu Phe130 135 140Ser Ala Ala Pro Ala Lys His Arg Lys Leu Ile Leu Gln Gly Ile Met145 150 155 160Ala Gln Cys Cys Phe Pro Gln Leu Ser Phe Val Ser Ala Thr Val Arg165 170 175Asp Leu Ile Arg Ile Asp Phe Leu Thr Ala Leu Pro Pro Glu Ile Ser180 185 190Phe Lys Ile Leu Cys Tyr Leu Asp Thr Thr Set Leu Cys Lys Ala Ala195 200 205
Gln Val Ser Ser Arg Trp Arg Ala Leu Ala Asp Asp Asp Val Val Trp210 215220His Arg Met Cys Glu Gln His Ile His Arg Lys Cys Lys Lys Cys Gly225 230 235 240Trp Gly Leu Pro Leu Leu Glu Arg Lys Arg Leu Arg Glu Ser Lys Arg245 250 255Glu Ile Glu Leu Arg Ala Thr Thr Trp Asp Val Ser Gly Pro Ala Gln260 265 270Asn Ala Gly Gly Ala Glu Cys Ser Ala Pro His Ala Asp Asp Val Ile275 280 285Thr Gln Lys Arg Lys Ala Asp Ser Ser Asp Asp Glu Thr Ala Ile Val290 295 300Lys Arg His Cys Ser Ser Leu Asp Ala Arg Pro Glu Pro Asp Glu Asp305 310 315 320Tyr Tyr Thr Thr Arg Tyr Arg Pro Trp Lys Glu Val Tyr Lys Asp Arg325 330 335Phe Lys Val Gly Thr Asn Trp Lys Tyr Gly Arg Cys Ser Thr Lys Val340 345 350Phe Lys Gly His Thr Asn Gly Val Met Cys Leu Gln Phe Glu Asp Asn355 360 365Ile Leu Ala Thr Gly Ser Tyr Asp Ala Thr Ile Lys Ile Trp Asp Thr370 375 380Glu Thr Gly Glu Glu Leu Arg Thr Leu Arg Gly His Gln Ser Gly Ile385 390 395 400Arg Cys Leu Gln Phe Asp Asp Thr Lys Leu Ile Ser Gly Ser Met Asp405 410 415Arg Ser Leu Lys Val Trp Asn Trp Arg Thr Gly Glu Cys Ile Ser Thr420 425 430Tyr Thr Gly His Arg Gly Gly Val Ile Gly Leu His Phe Asp Ala Thr435 440 445Ile Leu Ala Ser Ala Ser Val Asp Lys Thr Val Lys Ile Trp Asn Phe450 455 460Glu Asp Lys Ser Thr Phe Leu Leu Arg Gly His Thr Asp Trp Val Asn465 470 475 480Ala Val Arg Val Asp Thr Thr Ser Arg Thr Val Phe Ser Ala Ser Asp485 490 495Asp Cys Thr Val Arg Leu Trp Asp Leu Asp Thr Lys Ala Cys Leu Arg500 505 510Thr Phe His Gly His Val Gly Gln Val Gln Gln Val Val Pro Leu Pro515 520 525Arg Glu Phe Glu Phe Glu Asp His Asp Ala Glu Cys Asp Asn Asp Asn530 535 540Met Ser Thr Thr Ser Gly Asp Thr Glu Ser Asn Ser Leu Gln Ala Thr545 550 555 560
Leu Gly Leu Glu Ser Asn Ala Thr Glu Thr Ser Val Phe Gly Pro Ser565 570 575Phe Asp Asn Gly Arg Pro Ala Pro Pro Arg Tyr Ile Val Thr Ser Ala580 585 590Leu Asp Ser Thr Ile Arg Leu Trp Glu Thr Thr Thr Gly Arg Cys Leu595 600 605Arg Thr Phe Phe Gly His Leu Glu Gly Val Trp Ala Leu Gly Ala Asp610 615 620Thr Leu Arg Ile Val Ser Gly Ala Glu Asp Arg Met Val Lys Ile Trp625 630 635 640Asp Pro Arg Thr Gly Lys Cys Glu Arg Thr Phe Thr Gly His Ser Gly645 650 655Pro Val Thr Cys Ile Gly Leu Gly Asp Ser Arg Phe Ala Thr Gly Ser660 665 670Glu Asp Cys Glu Val Arg Met Tyr Ser Phe Arg Asn675 680<210>7<211>10<212>DNA<213>人工序列<220>
<223>人工序列描述引物DNA<400>7accgcygcya gcgcycgrtt10<210>8<211>18<212>DNA<213>人工序列<220>
<223>人工序列描述引物DNA<400>8sgakccrtgy ttctcrgt18<210>9<211>8<212>DNA<213>人工序列
<220>
<223>人工序列描述接頭DNA<400>9acctgccc8<210>10<211>44<212>DNA<213>人工序列<220>
<223>人工序列描述接頭DNA<400>10ctaatacgac tcactatagg gctcgagcgg ccgcccgggc aggt44<210>11<211>22<212>DNA<213>人工序列<220>
<223>人工序列描述引物DNA<400>11ctaatacgac tcactatagg gc 22<210>12<211>26<212>DNA<213>人工序列<220>
<223>人工序列描述引物DNA<400>12ttttccatct ccagctgggc tacgcg26<210>13<211>28<212>DNA<213>人工序列
<220>
<223>人工序列描述引物DNA<400>13agggatctgc gtgctgtact tggtgtgt28<210>14<211>24<212>DNA<213>人工序列<220>
<223>人工序列描述引物DNA<400>14tggaacggac agtgcgagag acta24<210>15<211>27<212>DNA<213>人工序列<220>
<223>人工序列描述引物DNA<400>15atgtcagatg agcacatcgc tcgtcag27<210>16<211>25<212>DNA<213>人工序列<220>
<223>人工序列描述引物DNA<400>16ctagttatcg gtgcccacac ccttc25<210>17<211>18<212>DNA<213>人工序列
<220>
<223>人工序列描述引物DNA<400>17cgratgtgyg aacaacac18<210>18<211>21<212>DNA<213>人工序列<220>
<223>人工序列描述引物DNA<400>18caamccctcs aggtgmccga a21<210>19<211>26<212>DNA<213>人工序列<220>
<223>人工序列描述引物DNA<400>19aggaagcccc cagccacatt tcttgc26<210>20<211>22<212>DNA<213>人工序列<220>
<223>人工序列描述引物DNA<400>20acgattcttg cctcagcctc cg22<210>21<211>26<212>DNA<213>人工序列
<220>
<223>人工序列描述引物DNA<400>21atggcccaac cgaccggagaacttac26<210>22<211>26<212>DNA<213>人工序列<220>
<223>人工序列描述引物DNA<400>22ttaattgcgg aaactgtaca tgcgca26<210>23<211>30<212>DNA<213>人工序列<220>
<223>人工序列描述引物DNA<400>23gaaggagata tacatatgga ttacgaccag30<210>24<211>30<212>DNA<213>人工序列<220>
<223>人工序列描述引物DNA<400>24cccccgggag ctcctagtta tcggtgccca30<210>25<211>30<212>DNA<213>人工序列
<220>
<223>人工序列描述探針DNA<400>25ggacgactgc taccacggta gcgcgcgggc30<210>26<211>30<212>DNA<213>人工序列<220>
<223>人工序列描述探針DNA<400>26gcccgcgcgc taccgtggta gcagtcgtcc30<210>27<211>27<212>DNA<213>人工序列<220>
<223>人工序列描述引物DNA<400>27caagcttcc aatatgtcag atgagca27<210>28<211>26<212>DNA<213>人工序列<220>
<223>人工序列描述引物DNA<400>28aagctctaga tacacaaggt aacaga26<210>29<211>24<212>DNA
<213>人工序列<220>
<223>人工序列描述引物DNA<400>29gagcggataa caatttcaca cagg2權(quán)利要求
1.如下(a)或(b)的一種蛋白(a)一種蛋白,其特征在于其含有如SEQ ID NO3所示的氨基酸序列;或(b)一種蛋白,其特征在于其含有通過缺失、取代或增加一個或多個氨基酸殘基從如SEQ ID NO3所示的氨基酸序列衍生的氨基酸序列,并且所述蛋白具有轉(zhuǎn)錄因子的功能。
2.一種蛋白,其特征在于其含有與如SEQ ID NO3所示的氨基酸序列具有70%或更高的序列同源性的氨基酸序列或其片段,并且所述蛋白具有轉(zhuǎn)錄因子功能。
3.一種轉(zhuǎn)錄因子基因,其編碼如下蛋白(a)或(b)(a)一種蛋白,其含有如SEQ ID NO3所示的氨基酸序列;或(b)一種蛋白,其含有通過缺失、取代或增加一個或多個氨基酸殘基,從如SEQ ID NO3所示的氨基酸序列衍生的氨基酸序列,并且該蛋白具有轉(zhuǎn)錄因子的功能。
4.一種轉(zhuǎn)錄因子基因,其含有如下DNA(a)或(b)(a)DNA,其含有如SEQ ID NO2所示的核苷酸序列;或(b)DNA,其在嚴(yán)格條件下與包含與含有如SEQ ID NO2所示的核苷酸序列的DNA互補的核苷酸序列的DNA雜交,并且該DNA編碼具有轉(zhuǎn)錄因子功能的蛋白質(zhì)。
5.一種基因,其編碼如權(quán)利要求2所述的蛋白質(zhì)。
6.一種轉(zhuǎn)錄因子基因,其含有如下DNA(a)或(b)(a)DNA,其含有編碼如SEQ ID NO3所示的氨基酸序列的核酸;或(b)DNA,其在嚴(yán)格條件下與包含與含有編碼如SEQ ID NO3所示的氨基酸序列的核酸的DNA互補的核酸的DNA雜交,并且該DNA編碼能夠調(diào)節(jié)硫-同化基因表達(dá)的蛋白質(zhì)。
7.一種轉(zhuǎn)錄因子基因,其具有與含有如SEQ ID NO2所示的核苷酸序列的DNA具有80%或更高的序列同源性的DNA,并且該基因編碼具有轉(zhuǎn)錄因子功能的蛋白質(zhì)。
8.一種重組載體,其含有如權(quán)利要求3、4、5、6或7所述的基因。
9.一種曲霉,其含有如權(quán)利要求8所述的重組載體。
10.一種曲霉,其中如權(quán)利要求3、4、5、6或7所述的基因在低分子量含硫物質(zhì)存在的情況下表達(dá)。
11.如權(quán)利要求9或10所述的曲霉,其能夠在低分子量含硫物質(zhì)存在的情況下產(chǎn)生胞外蛋白酶。
12.如權(quán)利要求9或10所述的曲霉,其能夠在低分子量含硫物質(zhì)存在的情況下產(chǎn)生胞外蛋白酶和胞外外肽酶。
13.一種曲霉,其中硫-同化基因的表達(dá)被去抑制。
14.如權(quán)利要求9、10、11或12所述的曲霉,其中硫-同化基因的表達(dá)被去抑制。
15.一種生產(chǎn)蛋白酶和/或外肽酶的方法,其包括在培養(yǎng)基中培養(yǎng)根據(jù)權(quán)利要求9-14中任何一項所述的曲霉,并且從獲得的培養(yǎng)物中任選地收集蛋白酶和/或外肽酶。
16.一種降解含蛋白質(zhì)物質(zhì)的方法,其包括用如權(quán)利要求9-14中任何一項所述的曲霉來降解含蛋白質(zhì)的物質(zhì)。
17.一種生產(chǎn)含蛋白質(zhì)物質(zhì)的降解產(chǎn)物的方法,其包括培養(yǎng)如權(quán)利要求9-14中任何一項所述的曲霉,用獲得的培養(yǎng)物降解含蛋白質(zhì)的物質(zhì),并從中任選地收集含蛋白質(zhì)物質(zhì)的降解產(chǎn)物。
18.如權(quán)利要求15所述的方法,所述培養(yǎng)基含有0.5mM或更多低分子量的含硫物質(zhì)。
全文摘要
本發(fā)明提供了在培養(yǎng)過程中具有調(diào)節(jié)曲霉硫同化基因表達(dá)的功能的轉(zhuǎn)錄因子,以及編碼該蛋白的基因。換句話說,涉及了含有如SEQ IDNO3所示的氨基酸序列的蛋白質(zhì),以及編碼如SEQ ID NO3所示的氨基酸序列或含有如SEQ ID NO2所示的堿基序列的基因。
文檔編號C07K14/37GK1625596SQ02828790
公開日2005年6月8日 申請日期2002年8月20日 優(yōu)先權(quán)日2002年2月21日
發(fā)明者海附玄龍, 畑本修, 原精一, 增田力, 佐野元昭, 町田雅之 申請人:財團(tuán)法人野田產(chǎn)業(yè)科學(xué)研究所, 獨立行政法人產(chǎn)業(yè)技術(shù)綜合研究所