專利名稱:編碼杜仲的甲羥戊酸途徑的酶的基因的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及參與杜仲的類異戊二烯化合物的生物合成的基因群。
背景技術(shù):
作為類異戊二烯化合物之一的聚異戊二烯(橡膠)根據(jù)異戊二烯單元的聚合方式的不同而分為順式和反式。生產(chǎn)長鏈順式聚異戊二烯的植物已知有蒲公英、山萵苣等很多植物。巴西橡膠樹(Hevea brasiliensis)所生產(chǎn)的順式聚異戊二烯作為天然橡膠在商業(yè)上廣泛應(yīng)用。而關(guān)于長鏈反式聚異戊二烯,已知天然中有膠木等少數(shù)植物生產(chǎn),但商業(yè)上并未利用。目前,反式聚異戊二烯是化學合成,應(yīng)用于高爾夫球外皮、繃帶、運動保護器具等中。 反式聚異戊二烯是顯示低熔點和高彈性的熱塑性彈性體,可用作絕緣體。類異戊二烯化合物通過與碳原子數(shù)為5的化合物_異戊烯焦磷酸(IPP)為單元的縮合反應(yīng)生成。甲羥戊酸途徑是類異戊二烯化合物的生物合成中的初期合成途徑之一。在動物、植物、菌類中可通過甲羥戊酸途徑生物合成IPP。作為IPP生物合成途徑,除了甲羥戊酸途徑之外還存在非甲羥戊酸途徑。在植物中,在細胞質(zhì)中是甲羥戊酸途徑發(fā)揮作用,在色素體中是非甲羥戊酸途徑發(fā)揮作用。通過甲羥戊酸途徑發(fā)揮作用的酶的基因在各種植物中都是公知的。例如 Kutki (胡黃連)(Picrorhiza kurrooa)中(根較多含有環(huán)烯醚萜苷)登錄了乙酰-CoA C-乙酰轉(zhuǎn)移酶(堿基序列在GenBank的登錄號為DQ347964,氨基酸序列的登錄號為 ABC74567),巴西橡膠樹(合成順式聚異戊二烯)中登錄了 HMG-CoA合成酶(堿基序列的登錄號為AF429389,氨基酸序列登錄號為AAS46245) ,HMT-CoA還原酶(堿基序列登錄號為 X54659,氨基酸序列的登錄號為P29057)、甲羥戊酸激酶(堿基序列登錄號為AF429384,氨基酸序列登錄號為AAL18925)、磷酸甲羥戊酸激酶(堿基序列登錄號為AF429385,氨基酸序列登錄號為AAL18926)、以及甲羥戊酸焦磷酸脫羧酶(堿基序列登錄號AF429386,氨基酸序列的登錄號為AAL18927)。中國原產(chǎn)的木本植物杜仲(Eucommia ulmoides Oliver)生產(chǎn)纖維狀的長鏈反式聚異戊二烯。杜仲的葉、樹皮和種皮中含有大量反式聚異戊二烯(非專利文獻1)。杜仲的樹皮作為滋養(yǎng)強壯和高血壓的民間治療藥物,自古以來一直被使用。杜仲中含有類異戊二烯化合物的一種-環(huán)烯醚萜的苷(京尼平苷酸)(非專利文獻2和3),其具有降血壓作用。如上所述,杜仲含有如反式聚異戊二烯和環(huán)烯醚萜苷等有用的類異戊二烯化合物。為了制備橡膠高含量的植物,人們希望獲得參與杜仲中IPP生物合成途徑的基因。以往,在從目標生物種中獲得具有某種功能的同源基因時,是利用使用公知基因的DNA片段的雜交篩選、或者是利用公知基因的堿基序列的縮聚PCR與接下來的5’ -RACE、 3’ -RACE和RP-PCR組合的方法。但是,這些方法的準確性低,很麻煩。特別是目標基因的保守區(qū)域不明確時,則難于采用這些方法。對杜仲的基因序列進行了分析(非專利文獻4和5)。非專利文獻4中報道了參與甲羥戊酸途徑的酶之一-HMG-CoA還原酶的基因及其序列。但是參與甲羥戊酸途徑的除此之外的酶則未見報道。非專禾丨J文獻 1 Bamba T, Fukusaki E, Nakazawa Y, and Kobatashi A, In-situ chemical analyses of tran-polyisoprene by histochemical stainingand Fourier transform infrared microapectroscopy in a rubber-producingplant, Eucommia ulmoides Oliver. Planta 215:934-939(2002)非專利文獻 2 :Kawasaki, Τ. , Uezono, K. , and Nakazawa, Y. , Antihypertensive mechanism of food for specified health use;"Eucommia leaf glycoside"and its clinical application, J. Health Sci.,22,29-36(2000)非專禾丨J文獻 3 Nakmura, Τ. , Nakazawa, Y. , Onozuka, S. , Tanaka, C. , Yahara, S. and Nohara, Τ. , Studies on the constituents of Eucommia ulmoides iridoids from the leaves, Natural Medicines,51,275277(1997)非專禾U 文獻 4 Jiang J, Kai G, Gao X,and Chen F, Molecular cloning of a HMG-CoA reductase gene from Eucommia ulmoides Oliver.Biosci Rep 26: 171-181(2006)非專利文獻4 :Hou H-W,Zhou Y-T, Mwang K-N, Li ff-F, He X_Q,禾口 Cui K-M, ABPl expression regulated by IAA and ABA is associated with the cambium periodicity in Eucommia ulmoides Oliv. J Exp Bot 57 :3857_3867 (2006)
發(fā)明內(nèi)容
本發(fā)明的目的在于提供參與杜仲的類異戊二烯化合物的生物合成的基因群。本發(fā)明提供參與由杜仲的甲羥戊酸合成異戊烯焦磷酸的基因。上述基因編碼選自含有SEQ ID N0. 2的氨基酸序列1位-408位氨基酸的蛋白質(zhì)、含有SEQ ID N0. 4的氨基酸序列1位-408位氨基酸的蛋白質(zhì)、含有SEQID N0. 6的氨基酸序列1位-463位氨基酸的蛋白質(zhì)、含有SEQ ID N0. 8的氨基酸序列1位-466位氨基酸的蛋白質(zhì)、含有SEQ ID N0. 12 的氨基酸序列1位-629位氨基酸的蛋白質(zhì)、含有SEQ ID N0. 14的氨基酸序列1位-591位氨基酸的蛋白質(zhì)、含有SEQ ID N0. 16的氨基酸序列1位-387位氨基酸的蛋白質(zhì)、含有SEQ ID N0. 18的氨基酸序列1位-506位氨基酸的蛋白質(zhì)、含有SEQ ID N0. 20的氨基酸序列1 位-418位氨基酸的蛋白質(zhì)的蛋白質(zhì)。在一個實施方案中,上述基因選自含有SEQ ID NO. 1的堿基序列101位-1327位核苷酸的基因、含有SEQ ID N0. 3的堿基序列128位-1354位核苷酸的基因、含有SEQ ID N0. 5的堿基序列172位-1563位核苷酸的基因、含有SEQ ID N0. 7的堿基序列216位-1616 位核苷酸的基因、含有SEQ IDN0. 11的堿基序列32位-1921位核苷酸的基因、含有SEQ ID N0. 13的堿基序列60位-1835位核苷酸的基因、含有SEQ ID N0. 15的堿基序列61位-1224 位核苷酸的基因、含有SEQ ID N0. 17的堿基序列682位-2202位核苷酸的基因、含有SEQID NO. 19的堿基序列68位-1324位核苷酸的基因。在另外的實施方案中,上述基因選自含有SEQ ID NO. 1的堿基序列1位-1516位核苷酸的基因、含有SEQ ID NO. 3的堿基序列1位-1757位核苷酸的基因、含有SEQ ID NO. 5 的堿基序列1位-1892位核苷酸的基因、含有SEQ ID NO. 7的堿基序列1位-1833位核苷酸的基因、含有SEQ ID N0. 9的堿基序列1位-1825位核苷酸的基因、含有SEQ ID NO. 11 的堿基序列1位-2057位核苷酸的基因、含有SEQ ID N0. 13的堿基序列1位-2225位核苷酸的基因、含有SEQ ID N0. 15的堿基序列1位-1341位核苷酸的基因、含有SEQ ID N0. 17 的堿基序列1位-2432位核苷酸的基因、含有SEQ IDN0. 19的堿基序列1位-1542位核苷酸的基因。本發(fā)明提供參與由杜仲的甲羥戊酸合成異戊烯焦磷酸的基因。
具體實施例方式本發(fā)明提供參與由杜仲的甲羥戊酸合成異戊烯焦磷酸(IPP)的基因。IPP的合成通過類異戊二烯化合物的生物合成的初期合成途徑-甲羥戊酸途徑進行。以下的酶參與甲羥戊酸途徑⑴乙酰-CoA C-乙酰轉(zhuǎn)移酶;⑵3-羥基-3-甲基戊二酰-CoA(HMG-CoA)合成酶;(3) HMG-CoA還原酶;(4)甲羥戊酸激酶;(5)磷酸甲羥戊酸激酶;以及(6)甲羥戊酸焦磷酸脫羧酶(也稱為“焦磷酸甲羥戊酸脫羧酶”)。甲羥戊酸途徑中,通過(1)乙酰-CoA C-乙酰轉(zhuǎn)移酶,由乙酰-CoA合成乙酰乙酰-CoA,通過(2)HMG-CoA合成酶,由乙酰乙酰-CoA 合成HMG-CoA,通過(3) HMG-CoA還原酶,將HMG-CoA轉(zhuǎn)變?yōu)榧琢u戊酸,通過(4)甲羥戊酸激酶和(5)磷酸甲羥戊酸激酶,將甲羥戊酸轉(zhuǎn)變?yōu)榧琢u戊酸5-焦磷酸,然后通過(6)甲羥戊酸焦磷酸脫羧酶生成異戊烯焦磷酸(IPP)。本發(fā)明的基因編碼選自含有SEQ ID NO. 2的氨基酸序列1位_408位氨基酸的蛋白質(zhì)(以下也稱為“SEQ ID NO. 2的蛋白質(zhì)”);含有SEQ IDN0. 4的氨基酸序列1位-408位氨基酸的蛋白質(zhì)(以下也稱為“SEQ IDN0. 4的蛋白質(zhì)”);含有SEQ ID NO. 6的氨基酸序列 1位-463位氨基酸的蛋白質(zhì)(以下也稱為“SEQ ID NO. 6的蛋白質(zhì)”);含有SEQ ID NO. 8 的氨基酸序列1位-466位氨基酸的蛋白質(zhì)(以下也稱為“SEQ ID N0.8的蛋白質(zhì)”);含有SEQ ID NO. 12的氨基酸序列1位-629位氨基酸的蛋白質(zhì)(以下也稱為“SEQ ID NO. 12 的蛋白質(zhì)”);含有SEQ ID NO. 14的氨基酸序列1位-591位氨基酸的蛋白質(zhì)(以下也稱為 "SEQ ID NO. 14的蛋白質(zhì)”);含有SEQ ID NO. 16的氨基酸序列1位-387位氨基酸的蛋白質(zhì)(以下也稱為“SEQ ID NO. 16的蛋白質(zhì)”);含有SEQ ID NO. 18的氨基酸序列1位-506 位氨基酸的蛋白質(zhì)(以下也稱為“SEQ ID NO. 18的蛋白質(zhì)”);含有SEQ IDN0. 20的氨基酸序列1位-418位氨基酸的蛋白質(zhì)(以下也稱為“SEQ IDN0.20的蛋白質(zhì)”)的蛋白質(zhì)。含有SEQ ID NO. 10的1位-466位的氨基酸的蛋白質(zhì)與SEQ ID N0. 8的蛋白質(zhì)相同。SEQ ID N0. 2的蛋白質(zhì)和SEQ ID N0. 4的蛋白質(zhì)是(1)乙酰-CoA C-乙酰轉(zhuǎn)移酶。 SEQ ID NO. 2的蛋白質(zhì)由含有SEQ ID NO. 1的堿基序列101位-1327位的核苷酸的基因編碼所得。該基因例如可含有SEQ ID NO. 1的全部堿基序列(1位-1516位)。SEQ ID N0. 4 的蛋白質(zhì)可由含有SEQ IDN0. 3的堿基序列128位-1354位的核苷酸的基因編碼獲得。該基因例如可含有SEQ ID N0. 3的全部堿基序列(1位-1757位)。SEQ ID N0. 6 的蛋白質(zhì)和 SEQ ID N0. 8 的蛋白質(zhì)是(2) HMG-CoA 合成酶。SEQ IDNO. 6的蛋白質(zhì)由含有SEQ ID NO. 5的堿基序列172位-1563位的核苷酸的基因編碼所得。 該基因例如可含有SEQ ID NO. 5的全部堿基序列(1位-1892位)。SEQ ID NO. 8的蛋白質(zhì)可由含有SEQ ID NO. 7的堿基序列216位-1616位(或SEQ ID NO. 9的堿基序列216 位-1616位)的核苷酸的基因編碼獲得。該基因中包含例如含有SEQ ID NO. 7的堿基序列 1位-1833位的核苷酸的基因、以及含有SEQ ID NO. 9的堿基序列1位-1825位的核苷酸的基因。具有SEQ ID NO. 9所示堿基序列的基因在其1689位-1825位的區(qū)內(nèi),相對于具有 SEQ ID NO. 7所示的堿基序列的基因的1689位-1833位的區(qū),具有6處(SEQ ID NO. 7的堿基序列1689位、1709位、1713位、1745位、1756位和1820位)的置換和1處(SEQ ID NO. 7 的堿基序列1777位)的缺失以及3’末端的聚腺苷部位的縮短。SEQ ID N0. 12 的蛋白質(zhì)和 SEQ ID N0. 14 的蛋白質(zhì)是(3) HMG-CoA 還原酶。SEQ ID N0. 12的蛋白質(zhì)由含有SEQ ID NO. 11的堿基序列32位-1921位的核苷酸的基因編碼所得。 該基因例如可含有SEQ ID NO. 11的全部堿基序列(1位-2057位)。SEQ ID N0. 14的蛋白質(zhì)可由含有SEQ IDN0. 13的堿基序列60位-1835位的核苷酸的基因編碼獲得。該基因例如可含有SEQ ID N0. 13的全部堿基序列(1位-2225位)。SEQ ID N0. 16的蛋白質(zhì)是(4)甲羥戊酸激酶。SEQ ID N0. 16的蛋白質(zhì)由含有SEQ ID N0. 15的堿基序列61位-1224位的核苷酸的基因編碼所得。該基因例如可含有SEQ ID N0. 15的全部堿基序列(1位-1341位)。SEQ ID N0. 18的蛋白質(zhì)是(5)磷酸甲羥戊酸激酶。SEQ ID N0. 18的蛋白質(zhì)由含有SEQ ID N0. 17的堿基序列682位-2202位的核苷酸的基因編碼所得。該基因例如可含有SEQ ID N0. 17的全部堿基序列(1位-2432位)。SEQ ID N0. 20的蛋白質(zhì)是(6)甲羥戊酸焦磷酸脫羧酶。SEQ IDN0. 20的蛋白質(zhì)由含有SEQ ID N0. 19的堿基序列68位-1324位的核苷酸的基因編碼所得。該基因例如可含有SEQ ID N0. 19的全部堿基序列(1位-1542位)。本發(fā)明的基因只要可以表達與具有上述氨基酸序列的酶功能性同等的酶、或者是可與具有上述堿基序列的基因發(fā)揮同樣功能即可,可以編碼一個或多個氨基酸殘基不同的蛋白質(zhì),或者可以有一個或多個堿基不同。上述序列的不同可以由于堿基的置換、缺失和/ 或插入獲得,或者發(fā)生天然誘變或者是人工誘變(例如定點突變導入法的應(yīng)用)的任意方式?;虻墓δ艿拇_定例如可采用如以下實施例2所記載的基本方法的、本領(lǐng)域技術(shù)人員通常使用的方法進行。本發(fā)明的基因是本領(lǐng)域技術(shù)人員采用通常所使用的方法,按照本說明書記載的序列信息制備探針或引物,以杜仲的染色體DNA或cDNA為模板,通過PCR獲得目標片段。當然也可以以RNA為模板,利用反轉(zhuǎn)錄PCR。本發(fā)明的基因除DNA、RNA等天然多核苷酸之外, 也可以是含有人工的核苷酸衍生物的人工分子。本發(fā)明的基因還可以是DNA-RNA的嵌合分子。本發(fā)明的基因可以使用本領(lǐng)域技術(shù)人員通常所采用的方法,導入到酵母等微生物或植物中。本發(fā)明的基因可在宿主中轉(zhuǎn)化,以表達1個或多個、或者是全部。例如其構(gòu)成可以是表達存在于甲羥戊酸途徑中的一組酶(上述(1)至(6))中的至少一個。本發(fā)明的基因適合用于制備大量含有反式聚異戊二烯或環(huán)烯醚萜的基因重組植物(例如杜仲)。本發(fā)明的基因例如通過轉(zhuǎn)化杜仲,可用于制備較多含有橡膠的植物。
實施例以下給出實施例,進一步具體說明本發(fā)明,但本發(fā)明并不限于此。(實施例1杜仲中的EST分析)(材料)作為杜仲植物體試樣,使用在5月下旬、從愛媛縣生名村生長的杜仲標準樹采集的當年幼枝的韌皮部(樹皮)和木質(zhì)部。酵母的突變株文庫使用市售的YKO Heterozygous Essential Strain Collection-Glycerol Stocks (Open Biosystems 公司)。(由杜仲中提取RNA)將約4g杜仲植物體試樣(當年枝的韌皮部和木質(zhì)部)邊用液氮冷卻,邊用乳缽、 研磨棒破碎,懸浮于試樣的10倍量(w/v)的2XCTAB溶液(2% (w/v)十六烷基三甲基溴化銨(CTAB)、1% (w/v) 2-巰基乙醇、0. IM Tris-HCl(pH 9. 5)、1.4M NaCl、20mM EDTA。將其在65°C下溫育10分鐘,接著用氯仿/異戊醇處理(洗滌)(反復兩次)。向回收的水層中加入1/4(ν/ν)量的IOM LiCl并混合,在_20°C下溫育2小時,進行RNA的選擇性沉淀。將其離心,將沉淀溶解于適量的Tris-EDTA(TE)緩沖液中,離心分離,回收上清,排除多糖類。 將回收的上清進行苯酚處理、苯酚/氯仿處理和氯仿/異戊醇處理,再次通過LiCl進行RNA 的選擇性沉淀。將沉淀用70%乙醇洗滌,減壓干燥,接著溶解于焦碳酸二乙酯(DEPC)處理水中。通過吸光度測定對所得RNA進行定量,通過電泳確認。由約4g木質(zhì)部中獲得0.84mg RNA,由約4g韌皮部中獲得2mgRNA(260nm和280nm下的吸收比分別為1. 956和1. 990)。(杜仲cDNA文庫的制備)通過日立計測器服務(wù)株式會社的G- * 7 O 7方法,由來自杜仲韌皮部和木質(zhì)部的RNA試樣制備cDNA文庫。來自韌皮部的cDNA文庫的文庫大小為3. 8 X 105,插入率為 88% (24個樣品/瓊脂糖凝膠電泳),全長率86% (對于插入的克隆)。來自木質(zhì)部的cDNA 的文庫大小為2. 2 X 105,插入率為79% (24個樣品/瓊脂糖凝膠電泳),全長率63% (相對于有插入的克隆)。(EST序列的序列分析)在北里大學北里生命科學研究所基因組情報學研究室中,對于來自杜仲韌皮部和木質(zhì)部的cDNA文庫的各約20000個克隆進行序列分析。根據(jù)由序列分析得到的序列信息, 除去未保有插入的克隆和無法閱讀序列的克隆,獲得精度高的序列信息。對于韌皮部和木質(zhì)部的文庫,分別得到了 16567和16113長度的精度高的EST序列(合計32680)。對于所得序列進行分組(聚類)(clustering)和注解(annotation)?!胺纸M”是在EST序列中,將同一序列、類似序列分成一組。為了進行分組,使用NTT軟件的VISUALBI0 clustering?!白⒔狻笔峭ㄟ^與已知基因比較,對EST序列進行注解。注解時使用采用NCBI BLAST的同源性檢索。檢索時所使用的數(shù)據(jù)庫是nr(All non-redundant GenBank CDS trgmsliitions+PDB+SwissProt+PIR(月太·歹))。根據(jù)分組和注解所得的信息,發(fā)現(xiàn)了推定為編碼乙酰-CoA C-乙酰轉(zhuǎn)移酶、 HMG-CoA合成酶、HMG-CoA還原酶、甲羥戊酸激酶和甲羥戊酸焦磷酸脫羧酶的EST序列。這些酶均是參與杜仲的類異戊二烯化合物的生物合成中初期合成途徑的酶。(實施例2編碼乙酰-CoA C-乙酰轉(zhuǎn)移酶的基因1)
(全長cDNA的獲得)通過3,-RACE (cDNA末端的快速擴增,RACE),由通過實施例1的分析得到的序列確定3’末端一側(cè)的序列,獲得全長cDNA。3,-RACE使用3,-Full RACE Core Set (夕力,”λ才株式會社制備)。反轉(zhuǎn)錄反應(yīng)中使用oligo-dT弓丨物。PCR擴增使用與oligo-dT的引物和與已知序列的一部分為相同的序列的有義引物。有義引物根據(jù)推定為實施例1所得的編碼乙酰-CoA C-乙酰轉(zhuǎn)移酶的 EST序列信息設(shè)計。以實施例1所得的RNA為模板,第1次是使用N192-82-tree_1968_3R_ Sl (SEQ IDN0. 21)作為有義引物,第 2 次是使用 m92-82_tree_1968_3R_s2 (SEQ IDN0. 22) 作為有義引物,按照說明書進行PCR。將反轉(zhuǎn)錄反應(yīng)和由PCR得到的擴增片段TA克隆到 pT7Blue載體中,進行序列分析。所得全長cDNA具有SEQ ID NO. 1的堿基序列。SEQ ID NO. 1所述的堿基序列146 位-1299位的核苷酸所示的區(qū)域的堿基序列與Kutki的乙酰-CoA C-乙酰轉(zhuǎn)移酶(GenBank 登錄號DQ347964)具有82%的同源性。開放閱讀框是101位-1327位。由該cDNA編碼的推定的氨基酸序列如SEQID N0. 2所示。SEQ ID N0. 2的全長氨基酸序列(1位-408位)與 Kutki的乙酰-CoA C-乙酰轉(zhuǎn)移酶(登錄號ABC74567)具有89%的同源性。(使用酵母突變株文庫的互補性試驗)使用用酵母突變株文庫進行的互補性試驗確認所得cDNA的功能。該互補性試驗如下進行。使用附加有與pYES2載體(invitrogen制備)的多克隆位點的40 bp為相同序列的有義引物和反義引物,進行PCR(95°C下將5分鐘作為1個循環(huán);然后95°C下將1分鐘、 54°C下將1分鐘和72°C下將1分鐘作為30個循環(huán);在72°C下將7分鐘作為1個循環(huán);以及 4°C下將⑴作為1個循環(huán)),擴增目標基因的翻譯區(qū)序列。將該擴增片段和用限制酶處理成直鏈狀的PYES2載體導入到Ursi的酵母株 Y22800 (EUR0SCARF制備)中。作為分析對象的乙酰-CoA C-乙酰轉(zhuǎn)移酶基因?qū)τ诮湍傅纳L來說是必須的,因此,作為互補試驗的背景,該酵母使用只有一側(cè)的對位基因缺失目標基因的雜合二倍體?;?qū)霑r使用 Frozen-EZ Yeast Transformation II (ΖΥΜ0 RESEARCH 制備)。將轉(zhuǎn)化后的酵母接種于極限完全培養(yǎng)基(無尿嘧啶),在30°C下培養(yǎng)。將生長的集落接種于新的極限完全培養(yǎng)基(無尿嘧啶)中,接著在30°C下培養(yǎng)。酵母突變株是尿嘧啶需求性,PYES2載體中含有URA3基因(編碼乳清苷5’ -磷酸脫羧酶)的序列,因此只有轉(zhuǎn)化的菌體可以生長。生長的菌體通過PCR檢查其是否含有插入片段,接著,將該菌體轉(zhuǎn)移至YPDA培養(yǎng)基中,在30°C下培養(yǎng)。將其轉(zhuǎn)移至孢子形成培養(yǎng)基,在25°C下培養(yǎng),將所得孢子進行四分體分析。插入到pYES2載體的多克隆位點上的目標基因上的上游存在GALl啟動子,因此, 目標基因只在半乳糖存在下誘導表達。因此,判定是否在YPD培養(yǎng)基或YPG培養(yǎng)基(碳源 半乳糖)上進行生長。在YPD培養(yǎng)基中,來自突變株的二分體致死,只有來自野生型的二分體生長。而在YPG培養(yǎng)基(碳源半乳糖)上,具有GALl啟動子的pYES2載體誘導插入基因的表達,因此,如果功能互補,則來自突變株的可以存活,三分體或四分體生長。這樣,通過進行互補的確認,可以進行目標基因的功能確定。并且,將由四分體分析得到的來自八孢子囊的集落(可認為是單倍體)影印到(A)YPG培養(yǎng)基(碳源半乳糖)、(B)極限完全培養(yǎng)基(碳源半乳糖、不含有尿嘧啶)、(C)YPG 培養(yǎng)基(碳源半乳糖,含有抗生素G418)、或(D)YPG培養(yǎng)基(碳源葡萄糖)上。保有質(zhì)粒的培養(yǎng)株在⑶的極限完全培養(yǎng)基(碳源半乳糖,不含尿嘧啶)中生長。突變株具有G418抗性基因,因此可認為在(C)YPG培養(yǎng)基(碳源半乳糖,含有抗生素 G418)中生長。由這些培養(yǎng)基中的生長結(jié)果可以判別出保有質(zhì)粒的單倍體突變株。在(D) 的YPD培養(yǎng)基(碳源葡萄糖)中,保有質(zhì)粒的突變株(單倍體)應(yīng)無法生長,但實際上難以判定其生長的有無。因此通過篩選判別生長的有無。本實施例中,使用N219-36-tree_1968_S(SEQ ID NO. 23)作為有義引物,使用 N219-36-tree_1968_a(SEQ ID NO. 24)作為反義引物,以上述“完全cDNA的獲得”中得到的 cDNA作為模板,進行PCR,擴增目標翻譯區(qū)的序列。將該擴增片段供給上述互補性試驗。在四分體分析中觀察到在YPG培養(yǎng)基(碳源半乳糖)上的生長。并且通過使用來自八孢子囊的集落的生長觀察,觀察到在(B)極限完全培養(yǎng)基(碳源半乳糖,不含尿嘧啶)上的生長。結(jié)果,通過互補,確定了乙酰-CoA C-乙酰轉(zhuǎn)移酶基因的功能。(實施例3編碼乙酰-CoA C-乙酰轉(zhuǎn)移酶的基因2)使用根據(jù)實施例1得到的推定為編碼乙酰-CoA C-乙酰轉(zhuǎn)移酶的EST序列的信息設(shè)計的 N192-84-tree_11012_3R_sl(SEQ ID NO. 25)(第 1 次)和 N192-84_tree_11012_3R_ s2(SEQ ID N0.26)(第2次)作為3’-RACE用的有義引物,除此之外與實施例2同樣,得到全長cDNA。所得全長cDNA具有SEQ ID NO. 3的堿基序列。SEQ ID NO. 3的堿基序列173 位-1305位的核苷酸所示的區(qū)域的堿基序列與Kutki的乙酰-CoAC-乙酰轉(zhuǎn)移酶(登錄號 DQ347964)具有83%的同源性。開放閱讀框為128位-1354位。由該cDNA編碼的推定氨基酸序列如SEQ ID N0. 4所示。SEQID N0. 4的全長氨基酸序列(1位-408位)與Kutki的乙酰-CoA C-乙酰轉(zhuǎn)移酶(登錄號ABC74567)具有87%的同源性。本實施例中,使用N219-36_tree_11012_s(SEQ ID NO. 27)作為有義引物,使用 N-219-36-tree_11012_a(SEQ ID NO. 28)作為反義引物,以上述所得cDNA為模板,除此之外與實施例2同樣進行PCR,擴增目標翻譯區(qū)的序列。將該擴增片段與實施例2同樣供給互補性試驗,得到了與實施例2同樣的結(jié)果。在四分體分析中觀察到在YPG培養(yǎng)基(碳源半乳糖)上的生長。并且,通過使用來自八孢子囊的集落的生長觀察,觀察到在(B)極限完全培養(yǎng)基(碳源半乳糖,不含尿嘧啶)上的生長。結(jié)果,通過互補確定了乙酰-CoA C-乙酰轉(zhuǎn)移酶基因的功能。(實施例4編碼HMG-CoA合成酶的基因1)。使用基于實施例1所得的推定為編碼HMG-CoA合成酶的EST序列的信息設(shè)計的 N192-71-tree_6098_3R_sl (SEQ ID Ν0· 29)(第 1 次)和N192-71_tree_6098_3R_s2 (SEQ ID NO. 30)(第2次)作為3,-RACE的有義引物,除此之外與實施例2同樣,得到全長cDNA。所得的全長cDNA具有SEQ ID N0. 5的堿基序列。SEQ ID N0. 5的堿基序列172 位-1187位的核苷酸所示的區(qū)域和1390位-1439位的核苷酸所示的區(qū)域的堿基序列,分別與巴西橡膠樹的HMG-CoA合成酶(登錄號AF429389)具有83%和86%的同源性。開放閱讀框是172位-1563位。由該cDNA編碼的推定氨基酸序列如SEQ ID N0. 6所示。SEQ ID N0. 6的全長氨基酸序列(1位-463位)與巴西橡膠樹的HMG-CoA合成酶(登錄號AAS46245)具有85%的同源性。本實施例中,有義引物使用N219-36_tree_6098_s(SEQ ID NO. 31),反義引物使用 N219-36-tree_6098_a (SEQ ID NO. 32),以上述所得cDNA為模板,除此之外與實施例2同樣進行PCR,擴增目標翻譯區(qū)的序列。與實施例2同樣,將該擴增片段供給互補性試驗。突變株使用Ura-的HMG-CoA合成酶缺損株Y26527 (EUR0SCARF制備)。在四分體分析中觀察到在YPG培養(yǎng)基(碳源半乳糖)上的生長。并且,在使用來自八孢子囊的集落的生長觀察中,觀察到在(B)極限完全培養(yǎng)基(碳源半乳糖,不含尿嘧啶)上的生長。結(jié)果,通過互補確定了 HMG-CoA合成酶基因的功能。(實施例5編碼HMG-CoA合成酶的基因2)使用實施例1所得的推定編碼HMG-CoA合成酶的EST序列的信息設(shè)計的 N192-36-tree_10370_3R_sl (SEQ ID NO. 33)(第 1 次)和 N192-36_tree_10370_3R_s2 (SEQ ID NO. 34)(第2次),作為3,-RACE用的有義引物,除此之外與實施例2同樣得到全長cDNA。 得到了兩個全長cDNA。所得的第一全長cDNA具有SEQ ID NO. 7的堿基序列。SEQ ID N0. 7的堿基序列 234位-1496位的核苷酸所示區(qū)域的堿基序列與巴西橡膠樹的HMG-CoA合成酶(登錄號 AF429389)具有81%的同源性。所得第二全長cDNA具有SEQ ID N0. 9的堿基序列。該第二 cDNA在其1689位-1825位的區(qū)域內(nèi),對應(yīng)第一 cDNA的1689位-1833位的區(qū)域有6處(第一 cDNA 的 1689 位、1709 位、1713 位、1745 位、1756 位和 1820 位)置換和 1 處(第一 cDNA 的1777位)缺失、以及3’末端的聚腺苷部位的縮短。SEQ ID N0. 9的堿基序列也與SEQ ID N0. 7的堿基序列同樣,與巴西橡膠樹的HMG-CoA合成酶(登錄號AF429389)具有81% 的同源性。開放閱讀框在兩個堿基序列均為216位-1616位。由這些cDNA編碼的推定氨基酸序列分別如SEQ ID N0.8和10所示,它們是相同的序列。該推定氨基酸序列在SEQ ID N0. 8的6位-452位的氨基酸區(qū)域中,與巴西橡膠樹的HMG-CoA合成酶(登錄號AAS46245) 具有84%的同源性。本實施例中,使用N219-36_tree_10370_s(SEQ ID NO. 35)作為有義引物,使用 N219-36-tree_10370_a(SEQ ID NO. 36)作為反義引物,以上述所得cDNA作為模板,除此之外與實施例2同樣進行PCR,擴增目標翻譯區(qū)的序列。與實施例2同樣,將該擴增片段供給互補性試驗。突變株使用Ura-的HMG-CoA合成酶缺損株Y26527(EUR0SCARF制備)。在四分體分析中觀察到Y(jié)PG培養(yǎng)基(碳源半乳糖)上的生長。并且,在使用來自八孢子囊的集落的生長觀察中,觀察到在(B)極限完全培養(yǎng)基(碳源半乳糖,不含尿嘧啶)上的生長。 結(jié)果,通過互補,確定了 HMG-CoA合成酶基因的功能。(實施例6編碼HMG-CoA還原酶的基因1)關(guān)于編碼HMG-CoA還原酶的基因,為了獲得全長cDNA,采用5,RACE、3,RACE和反轉(zhuǎn)錄反應(yīng)組合的方法。該方法中,使用5,-FullRACE Core Set (TaKaRa制備)和3,-Full RACE Core Set (TaKaRa制備)。根據(jù)實施例1所得的推定為編碼HMG-CoA還原酶的EST序列設(shè)計 m92-45-tree_8220_5R_al(SEQ ID NO. 37)(第一次)和 m92-45_tree_8220_5R_ a2 (SEQ ID NO. 38)(第二次)作為 5,RACE 用的反義引物,N192-45-tree_8220_5R_3R_ si (SEQ ID NO. 39)(第一次)和 m92-45_tree_8220_5R_3R_s2 (SEQ ID NO. 40)(第二次) 作為3,-RACE用的有義引物,N192-45-tree_8220_5R_p (SEQ ID NO. 41)作為反轉(zhuǎn)錄反應(yīng)用。以實施例1所得的RNA為模板,與實施例2同樣地,將它們反應(yīng)所得的擴增片段TA克隆到pTCBlue載體上,進行序列分析。所得全長cDNA具有SEQ ID NO. 11的堿基序列。SEQ ID NO. 11的堿基序列260 位-303位的核苷酸所示區(qū)域、773位-936位的核苷酸所示區(qū)域、以及1148位-1845位的核苷酸所示的的區(qū)域的堿基序列分別與蘋果(Malus χ domestica)的HMG-CoA還原酶(登錄號AF315713)具有88%、82%和81 %的同源性。開放閱讀框是32位-1921位。由該cDNA 編碼的推定氨基酸序列如SEQ ID NO. 12所示。在SEQ ID NO. 12的33位-612位的氨基酸區(qū)域中,該推定氨基酸序列與喜樹(Camptotheca acuminata)的HMG-CoA還原酶(登錄號 P48021)具有78%的同源性。SEQ ID N0. 12的33位-612位的氨基酸區(qū)域與非專利文獻4 的HMG-CoA還原酶(登錄號AAV54051)具有73%的同源性。因此,可以認為序列號11的堿基序列是來自與非專利文獻4的基因不同的基因座的HMG-CoA還原酶基因。(實施例7編碼HMG-CoA還原酶的基因2)根據(jù)實施例1所得的推定為編碼HMG-CoA還原酶的EST序列設(shè)計 N192-47-tree_13453_5R_al (SEQ ID NO. 42)(第一次)和 Nl92_47_tree_l3453_5R_a2 (SEQ ID NO. 43)(第二次)作為 5,RACE 用的反義引物,N192-47-tree_13453_5R_3R_sl (SEQ ID NO. 44)(第一次)和 N192-47-tree_13453_5R_3R_s2 (SEQ ID NO. 45)(第二次)作為 3,-RACE用的有義引物,N192-47-tree_13453_5R_p(SEQ ID NO. 46)作為反轉(zhuǎn)錄反應(yīng)用,除此之外與實施例6同樣,得到全長cDNA。所得全長cDNA具有SEQ ID N0. 13的堿基序列。SEQ ID N0. 13的堿基序列169 位-373位的核苷酸所示區(qū)域、751位-1600位的核苷酸所示區(qū)域、以及1637位-1720位的核苷酸所示的的區(qū)域的堿基序列,分別與喜樹的HMG-CoA還原酶(登錄號U72145)具有 79%、80%和89%的同源性。開放閱讀框是60位-1835位。由該cDNA編碼的推定氨基酸序列如SEQ IDN0. 14所示。在SEQ ID N0. 14的1位-588位的氨基酸區(qū)域中,該推定氨基酸序列與煙草(Nicotiana tabacum)的HMG-CoA還原酶(登錄號AAB87727)具有78%的同源性。SEQ ID N0. 14的1位-589位的氨基酸區(qū)域與非專利文獻4的HMG-CoA還原酶(登錄號AAV54051)具有75%的同源性。因此,可以認為序列號13的堿基序列也是來自與非專利文獻4的基因不同的基因座的HMG-CoA還原酶基因。(實施例8編碼甲羥戊酸激酶的基因)3’ -RACE用的有義引物使用基于實施例1所得的推定為編碼甲羥戊酸激酶的EST 序列的信息設(shè)計的tree 1729引物(SEQ ID Ν0· 47)(第一次)和tree 1729引物套(SEQ ID NO. 48)(第二次),除此之外與實施例2同樣,得到全長cDNA.所得全長cDNA具有SEQ ID N0. 15的堿基序列。SEQ ID N0. 15的堿基序列 616位-1104位的核苷酸所示區(qū)域的堿基序列與巴西橡膠樹的甲羥戊酸激酶(登錄號 AF429384)具有83%的同源性。開放閱讀框是61位-1224位。由該cDNA編碼的推定氨基酸序列如SEQ ID N0. 16所示。SEQ IDN0. 16全長氨基酸序列(1位-387位)與巴西橡膠樹的甲羥戊酸激酶(登錄號AAL18925)具有77%的同源性。本實施例中,使用N219-36_tree_1729_s(SEQ ID NO. 49)作為有義引物,使用 N219-36-tree_1729_a(SEQ ID NO. 50)作為反義引物,以上述所得cDNA作為模板,除此之外與實施例2同樣進行PCR,擴增目標翻譯區(qū)的序列。將該擴增片段與實施例2同樣地供給互補性試驗。突變株使用Ura-的甲羥戊酸激酶缺損株Y20794 (EUR0SCARF制備)。在四分體分析中觀察到在YPG培養(yǎng)基(碳源半乳糖)上的生長。并且,在使用來自八孢子囊的集落的生長觀察中,觀察到在(B)極限完全培養(yǎng)基(碳源半乳糖,不含尿嘧啶)上的生長。結(jié)果,通過互補,確定了甲羥戊酸激酶基因的功能。(實施例9編碼磷酸甲羥戊酸激酶的基因)以實施例1所得cDNA文庫作為模板,使用以下引物進行PCR,獲得部分序列。該簡并PCR中使用的引物如下第一次使用S_No. 243_Ρ· 10_1 (SEQ ID NO. 51)作為有義引物和使用 AS_No. 243_P. 10_1 (SEQ IDNO. 52)作為反義引物;第一次使用 S_No. 243_P. 10_2 (SEQ ID NO. 53)作為有義引物和使用AS_No. 243_P. 10_2(SEQ ID NO. 54)作為反義引物,引物的設(shè)計基于 BAD93946(擬南芥,Arabidopsis thaliana)、AAL18926(巴西橡膠樹,Hevea brasiliensis)、CAB52264(粟酒裂殖酵母,Schizosaccharomyces pombe)、NP593421 (粟酒裂殖酵母,Schizosaccharomyces pombe)、P24521 (酉良酒酵母,Saccharomyces cerevisiae) 和XP329795(粗糙脈孢霉,Neurospora crassa)的六個氨基酸序列的保守區(qū)域進行。PCR 的條件如下(第一次PCR)95 0C 5分鐘進行一個循環(huán);將95 °C 1分鐘、55°C 1分鐘、72°C 1分30秒進行30個循環(huán);72°C 7分鐘進行一個循環(huán);4°Cc 進行一個循環(huán);(第二次PCR)95 0C 5分鐘進行一個循環(huán);將95 °C 1分鐘、55°C 1分鐘、72°C 1分30秒進行30個循環(huán);72°C 7分鐘進行一個循環(huán);4°Cc 進行一個循環(huán);上述部分序列中未得到3’末端和5’末端的堿基序列信息,因此,以實施例1所得的RNA作為模板,進行5’ -RACE,3' -RACE和反轉(zhuǎn)錄反應(yīng)。該方法中使用5’ -Full RACE Core Set (Takara)和3’_Full RACE Core Set (Takara)。根據(jù)所得部分片段的信息設(shè)計第一次的 No. 243_P. 51_race_al (SEQ ID NO. 56)和第二次的 No. 243_P. 51_race_a2 (SEQ ID NO. 55)作為 5’ -RACE 用的反義引物,第一次的 No. 243P. 51_race_sl(SEQ IDNO. 57)和第二次的 No. 243_P. 51_race_s2(SEQ ID NO. 58)作為 3,-RACE 用的有義引物,No. 243_P. 51_ race_p (SEQ ID NO. 59)作為反轉(zhuǎn)錄反應(yīng)用。由此得到3,末端和5,末端的堿基序列信息。根據(jù)3’末端和5’末端的堿基序列信息,設(shè)計cDNA文庫篩選用探針,使用SEQ ID N0. 60的引物作為有義引物,使用SEQ ID N0. 61的引物作為反義引物,進行PCR。以所得片段作為探針,篩選實施例1所得的cDNA文庫。將所得片段TA克隆到pT7Blue載體上,進行序列分析。所得cDNA片段的全部堿基序列如SEQ ID N0. 17所示。SEQ IDN0. 17的堿基序列 681位-886位的核苷酸所示的區(qū)域、922位-1000位的核苷酸所示的區(qū)域、1042位-1285 位的核苷酸所示的區(qū)域、1339位-1732位的核苷酸所示的區(qū)域、以及1807位-2054位的核苷酸所示區(qū)域的堿基序列分別與巴西橡膠樹的磷酸甲羥戊酸激酶(登錄號AF429385)具有 83 %、84 %、81 %、81 %和78 %的同源性。開放閱讀框為682位-2202位。由該cDNA編碼的推定氨基酸序列如SEQ ID N0. 18所示。SEQ ID N0. 18的全長氨基酸序列(1位-506位) 與巴西橡膠樹的磷酸甲羥戊酸激酶(登錄號AAL18926)具有78%的同源性。本實施例中,使用SEQ ID N0. 62的引物作為有義引物,使用SEQ IDN0. 63的引物作為反義引物,以上述所得CDNA作為模板,除此之外與實施例2同樣進行PCR,擴增目標翻譯區(qū)的序列。將該擴增片段與實施例2同樣供給互補性試驗。突變株使用Ursi的磷酸甲羥戊酸激酶缺損株Y20806 (EUR0SCARF制備)。在四分體分析中觀察到在YPG培養(yǎng)基(碳源 半乳糖)上的生長。并且,在使用來自八孢子囊的集落的生長觀察中,觀察到在(B)極限完全培養(yǎng)基(碳源半乳糖,不含尿嘧啶)上的生長。結(jié)果,通過互補,確定了磷酸甲羥戊酸激酶基因的功能。(實施例10編碼甲羥戊酸焦磷酸脫羧酶的基因)使用基于實施例1所得的推定為甲羥戊酸焦磷酸脫羧酶的EST序列的信息設(shè)計的 Nl92-102_tree_l3103_3R_sl(SEQ ID NO. Μ)(第一次)和 Nl92-102_tree_l3103_3R_ s2(SEQ ID N0.65)(第二次)作為3’-RACE用的有義引物,除此之外與實施例2同樣,得到全長cDNA。所得全長cDNA具有SEQ ID NO. 19的堿基序列。SEQ ID NO. 1的堿基序列100 位-1325位的核苷酸所示區(qū)域的堿基序列與巴西橡膠樹的甲羥戊酸焦磷酸脫羧酶(登錄號 AF429386)具有80%的同源性。開放閱讀框為68位-1324位。由該cDNA編碼的推定氨基酸序列如SEQ ID NO. 20所示。在SEQ ID NO. 20的5位-418位的氨基酸區(qū)域中,該推定氨基酸序列與巴西橡膠樹的甲羥戊酸焦磷酸脫羧酶(登錄號AAL18927)具有84%的同源性。本實施例中,使用N219-36_tree_13103_s(SEQ ID NO. 66)作為有義引物,使用 N219-36-tree_13103_a(SEQ ID NO. 67)作為反義引物,以上述所得cDNA作為模板,除此之外與實施例2同樣進行PCR,擴增目標翻譯區(qū)的序列。將該擴增片段與實施例2同樣供給互補性試驗。突變株使用Ursi的甲羥戊酸焦磷酸脫羧酶缺損株Y25418 (EUR0SCARF制備)。 在四分體分析中觀察到在YPG培養(yǎng)基(碳源半乳糖)上的生長。并且,在使用來自八孢子囊的集落的生長觀察中,觀察到在(B)極限完全培養(yǎng)基(碳源半乳糖,不含尿嘧啶)上的生長。結(jié)果,通過互補,確定了甲羥戊酸焦磷酸脫羧酶基因的功能。產(chǎn)業(yè)實用性本發(fā)明提供編碼杜仲的類異戊二烯化合物的生物合成中的初期合成途徑_甲羥戊酸途徑的各種酶的基因。本發(fā)明的基因適合用于制備大量含有反式異戊二烯或環(huán)烯醚萜的基因重組植物(例如杜仲)。
權(quán)利要求
1.基因,該基因是參與由杜仲的甲羥戊酸合成異戊烯焦磷酸的基因,該基因是由SEQ ID NO. 6的氨基酸序列中第1位-463位的氨基酸、或SEQ ID NO. 8的氨基酸序列中第1 位-466位的氨基酸組成的、編碼HMG-CoA合成酶的基因。
2.如權(quán)利要求1所述的基因,其中,所述基因為含有SEQID NO. 5的堿基序列中第172 位-1563位的核苷酸的基因、或含有SEQ ID NO. 7的堿基序列中第216位-1616位核苷酸的基因。
3.如權(quán)利要求2所述的基因,其中,所述述基因為含有SEQIDW). 5的堿基序列中第1 位-1892位核苷酸的基因、或含有SEQ ID NO. 7的堿基序列中第1位-1833位核苷酸的基因、或含有SEQ ID NO. 9的堿基序列中第1位-1825位核苷酸的基因。
全文摘要
本發(fā)明提供參與杜仲的類異戊二烯化合物生物合成的基因群。本發(fā)明還提供參與由杜仲的甲羥戊酸合成異戊烯焦磷酸的基因。本發(fā)明的基因編碼杜仲的乙酰-CoA C-乙酰轉(zhuǎn)移酶、HMG-CoA合成酶、HMG-CoA還原酶、甲羥戊酸激酶、磷酸甲羥戊酸激酶或甲羥戊酸焦磷酸脫羧酶。
文檔編號C12N15/54GK102492701SQ20111035856
公開日2012年6月13日 申請日期2008年6月20日 優(yōu)先權(quán)日2007年6月21日
發(fā)明者中澤慶久, 小林昭雄, 福崎英一郎, 西河貴史, 馬場健史 申請人:國立大學法人大阪大學, 日立造船株式會社