專利名稱:一種纖維素酶及其編碼基因與應(yīng)用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種纖維素酶及其編碼基因與應(yīng)用。
背景技術(shù):
纖維素主要是植物利用二氧化碳和水在太陽(yáng)能作用下通過(guò)光合作用合成的地球上最豐富的可再生的生物質(zhì)(biomass)資源。據(jù)報(bào)道,全球每年通過(guò)光合作用產(chǎn)生的纖維素高達(dá)1.55×109噸,其中89%尚未被人類利用(Dunlap C,Chiang GC.Utilization and recycle of agriculture wastes and residues.Shuler M L. BocaRaton,F(xiàn)lorida.USACRC Press Inc.1980.19)。纖維素是多個(gè)葡萄糖殘基以β-1,4-糖苷鍵連接而成的多聚物,其基本重復(fù)單位為纖維二糖。天然纖維素的基本結(jié)構(gòu)是由原纖維構(gòu)成的微纖維束集合而成。原纖維是由15-40根有結(jié)晶區(qū)和非結(jié)晶區(qū)構(gòu)成的纖維素分子長(zhǎng)鏈所組成。纖維素的結(jié)晶部分是由纖維素分子進(jìn)行非常整齊規(guī)劃地折迭排列形成。在天然纖維素中,木質(zhì)素和半纖維素形成牢固結(jié)合層,緊密地包圍纖維素。纖維素酶是能將纖維素轉(zhuǎn)化成葡萄糖的一系列酶的總稱,包括三類酶即內(nèi)切-β-1,4-葡聚糖酶(endo-β-1,4-glucanase,EC 3.2.1.4)、外切葡聚糖酶(exoglucanase,又叫纖維二糖水解酶cellobiohydrolase,EC3.2.1.91)和β-葡萄糖苷酶(β-glucosidase,EC3.2.1.21),這三種酶協(xié)同作用能將纖維素轉(zhuǎn)化成葡萄糖。內(nèi)切葡聚糖酶作用于纖維素長(zhǎng)鏈分子的內(nèi)部將長(zhǎng)纖維切成短纖維,外切葡聚糖酶作用于纖維素分子的一端,以兩個(gè)葡萄糖殘基為單位進(jìn)行切割生成纖維二糖,β-葡萄糖苷酶切割纖維二糖生成葡萄糖(Tomme P,Warren R A J,Gilkes N R.1995.Cellulose hydrolysis by bacteria and fungi.Adv.Microbiol.Physiol.,371-81.1995;Bhat M K,Bhat S.1997.Cellulose degrading enzymes and their potentialindustrial applications.Biotechnology Advances,15583-620)。葡萄糖可作為重要的工業(yè)原料生產(chǎn)酒精、丙酮等化工產(chǎn)品。纖維素的利用與轉(zhuǎn)化對(duì)于解決世界能源危機(jī)、糧食和飼料短缺、環(huán)境污染等問(wèn)題具有重要意義。纖維素酶可廣泛應(yīng)用于釀酒、飼料、食品、紡織、造紙等行業(yè)。如纖維素酶作為飼料添加劑可增加飼料的可消化性,減少排泄的糞便量。纖維素酶可取代浮石進(jìn)行牛仔褲的“石洗”處理,也可處理其它含纖維織物以降低粗糙度和增加光亮。纖維素酶可添加到洗滌劑中以提高洗滌劑的清潔能力(Bhat M K.2000.Cellulases and related enzymes in biotechnology.Biotechnology Advances,18355-383)。由于纖維素酶的廣泛用途以及針對(duì)不同的用途需要使用不同性質(zhì)的纖維素酶,更由于纖維素酶的效率低、價(jià)格高而使以纖維素為原料生產(chǎn)燃料酒精的成本太高以至于無(wú)法真正實(shí)現(xiàn)產(chǎn)業(yè)化,因此,需要新的纖維素酶。
纖維素酶屬于糖基水解酶類(glycosyl hydrolases),許多糖基水解酶由一個(gè)催化功能域和一個(gè)或更多個(gè)其它的功能域如碳水化合物結(jié)合組件(carbohydrate-binding modules,CBMs)組成,根據(jù)催化功能域的氨基酸序列相似性,糖基水解酶類被劃分成不同的家族(families)(Davies G.,Henrissat B.1995.Structures and mechanisms of glycosyl hydrolases.Structure 3853-859;Henrissat B.1991.A classification of glycosyl hydrolases based on amino-acidsequence similarities.Biochem.J.280309-316;Henrissat B.,Bairoch A.1993New families in the classification of glycosyl hydrolases based on amino-acidsequence similarities.Biochem.J.293781-788;Henrissat B.,Bairoch A.1996.Updating the sequence-based classification of glycosyl hydrolases.Biochem.J.316695-696)。根據(jù)Cazy服務(wù)器(server)(http//afmb.cnrs-mrs.fr/CAZY/)上所列糖基水解酶類的最新清單,目前糖基水解酶類有100個(gè)家族,纖維素酶分屬于糖基水解酶類家族1、3、5、6、7、8、9、10、12、26、44、45、48、51、61、74。將未知的纖維素酶與已知的纖維素酶做序列同源性比較可對(duì)其進(jìn)行分類。
目前除Rees等(Rees HC,Grant S,Jones B,Grant WD,Heaphy S.2003.Detectingcellulase and esterase enzyme activities encoded by novel genes present inenvironmental DNA libraries.Extremophiles.7(5)415-421)報(bào)道從湖水和湖床沉積物未培養(yǎng)微生物中克隆到2個(gè)纖維素酶基因CRATCEL和HKCEL以及Voget等(Voget S,Leggewie C,Uesbeck A,Raasch C,Jaeger KE,Streit WR.2003.Prospecting for novel biocatalysts in a soil metagenome.Appl EnvironMicrobiol.,69(10)6235-6242)報(bào)道從土壤未培養(yǎng)微生物中克隆到2個(gè)纖維素酶基因gnuB和uvs080外,人類所克隆的所有其它纖維素酶基因都是從人類所培養(yǎng)的微生物中來(lái)的,但并不是自然界中所有微生物都是可以被分離、培養(yǎng)的,一般認(rèn)為可培養(yǎng)的微生物種類只占自然界中微生物種類的1%(Amann R I,Ludwig W,Schleifer K H.1995.Phylogenetic identification and in situ detection of individualmicrobial cells without cultivation.Microbiol.Rev.59143-169),那么剩余的99%的不可培養(yǎng)的微生物中蘊(yùn)藏著大量的基因資源。近年來(lái)從環(huán)境樣品未培養(yǎng)微生物提取基因組DNA然后構(gòu)建混合基因組DNA文庫(kù)以分離基因已是成熟技術(shù)(LorenzP,Schleper C.2002.Metagenome-a challenging source of enzyme discovery.Journal of Molecular Catalysis BEnzymatic 19-2013-19)。由于造紙廠土壤富含大量紙漿,是纖維素被活躍降解的地方,有大量的微生物在進(jìn)行纖維素、半纖維素、果膠物質(zhì)等的分解,但這些分解性的微生物只有極少部分已被培養(yǎng),還有極大部分未被培養(yǎng)??梢酝茰y(cè)這些未培養(yǎng)微生物中一定含有大量的基因資源如纖維素酶基因資源,其中很可能有些就是優(yōu)于目前所發(fā)現(xiàn)的最好的纖維素酶的高效酶的基因。通過(guò)構(gòu)建土壤未培養(yǎng)微生物的宏基因組DNA文庫(kù),極有可能從中篩選得到比目前已知的最好的纖維素酶還要好的酶的基因。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種纖維素酶及其編碼基因與應(yīng)用。
本發(fā)明所提供的纖維素酶,名稱為Umcel6A,來(lái)源于土壤未培養(yǎng)細(xì)菌,是具有下述氨基酸殘基序列之一的蛋白質(zhì)1)序列表中的SEQ ID №2;2)將序列表中SEQ ID №2的氨基酸殘基序列經(jīng)過(guò)一個(gè)或幾個(gè)氨基酸殘基的取代和/或缺失和/或添加且具有纖維素酶活性的蛋白質(zhì)。
其中,序列表中的序列2由465個(gè)氨基酸殘基組成。自N端的第26-48位氨基酸為跨膜功能域(transmembrane domain),自N端的第59-331位氨基酸為家族6糖基水解酶(glycosyl hydrolase)功能域,自N端的第371-463位氨基酸為碳水化合物結(jié)合組件(carbohydrate-binding modules,CBMs)。和Umcel6A催化功能域同源性最高的為嗜高溫放線菌(Thermobifida fusca)的β-1,4-纖維二糖水解酶A(1,4-β-D-glucan cellobiohydrolase A)(GenBank索引號(hào)23018004)的同源性最高,兩者的相似性為54%、相同性為41%。
所述一個(gè)或幾個(gè)氨基酸殘基的取代和/或缺失和/或添加是指不多于十個(gè)氨基酸殘基的取代和/或缺失和/或添加。
上述纖維素酶編碼基因(umcel6A)也屬于本發(fā)明的保護(hù)范圍。
上述纖維素酶的基因組基因,可具有下述核苷酸序列之一1)序列表中SEQ ID №1的DNA序列;2)編碼序列表中SEQ ID №2蛋白質(zhì)序列的多核苷酸;3)在高嚴(yán)謹(jǐn)條件下可與序列表中SEQ ID №1限定的DNA序列雜交的核苷酸序列。
上述高嚴(yán)謹(jǐn)條件可為在0.1×SSPE(或0.1×SSC),0.1%SDS的溶液中,在65℃下雜交并洗膜。
其中,序列表中的SEQ ID №1由1526個(gè)脫氧核苷酸組成,自5’端的第57至1454位核苷酸為umcel6A的開(kāi)放閱讀框(Open Reading Frame,ORF),自5’端的第57至59位核苷酸為umcel6A基因的起始密碼子ATG,自5’端的第1452至1454位核苷酸為umcel6A基因的終止密碼子TGA。
含有本發(fā)明基因的表達(dá)載體、細(xì)胞系及宿主菌均屬于本發(fā)明的保護(hù)范圍。
本發(fā)明通過(guò)構(gòu)建土壤未培養(yǎng)微生物的宏基因組DNA文庫(kù)和文庫(kù)克隆的纖維素酶活性平板檢測(cè)篩選法,得到了新的纖維素酶基因,可在宿主細(xì)胞中大量表達(dá)該基因以生產(chǎn)該纖維素酶,用于纖維素的降解。本發(fā)明所提供新的纖維素酶及其編碼基因在纖維素的降解中具有廣泛的用途。
圖1為從土壤樣品中提取的未培養(yǎng)微生物的宏基因組DNA。
圖2為土壤未培養(yǎng)微生物基因文庫(kù)克隆的限制性內(nèi)切酶BamHI酶切分析圖。
圖3為土壤未培養(yǎng)微生物基因文庫(kù)克隆的篩選,陽(yáng)性克隆EPI100/pGXNL2所在的平板圖。
圖4為能降解羧甲基纖維素的文庫(kù)克隆質(zhì)粒pGXNL2的BamHI酶切帶型。
圖5為初篩獲得的重組質(zhì)粒pGXNL2轉(zhuǎn)化大腸桿菌后得到的轉(zhuǎn)化子能降解羧甲基纖維素(右),而空載體pWEB∷TNC轉(zhuǎn)化大腸桿菌后得到的轉(zhuǎn)化子不能降解羧甲基纖維素(左)。
圖6為umcel6A基因部分DNA序列的PCR擴(kuò)增結(jié)果。
圖7為pGXNumcel6A重組質(zhì)粒經(jīng)BamHI和HindIII雙酶切后電泳圖。
圖8為重組大腸桿菌M15/pGXNumcel6A能降解羧甲基纖維素(右),而含有空載體的大腸桿菌M15/pQE30不能降解羧甲基纖維素(左)。
具體實(shí)施例方式
下述實(shí)施例中的實(shí)驗(yàn)方法,如無(wú)特別說(shuō)明,均為常規(guī)方法。
下述實(shí)施例中的百分含量,如無(wú)特別說(shuō)明,均為質(zhì)量百分含量。
在本發(fā)明的實(shí)施例中所用到的材料包括大腸桿菌(Escherichia coli)株系EPI100(購(gòu)自Epicentre公司);大腸桿菌(Escherichia coli)株系M15(購(gòu)自QIAGEN公司);大腸桿菌E.coli XL1-blue(購(gòu)自Stratagene公司);柯斯質(zhì)粒載體pWEB∷TNC(購(gòu)自Epicentre公司);文庫(kù)制備試劑盒(購(gòu)自Epicentre公司,pWEB∷TNC cosmidcloning kit,目錄號(hào)WEBC931);克隆載體pBluescript M13(+)(購(gòu)自Stratagene公司);表達(dá)載體pQE-30(購(gòu)自QIAGEN公司);限制性內(nèi)切酶、修飾酶及聚合酶等試劑(購(gòu)自Promega、Stratagene、SIGMA、QIAGEN、MBI)。
實(shí)施例1、纖維素酶Umcel6A及其編碼基因的獲得一、土壤未培養(yǎng)微生物宏基因組文庫(kù)的構(gòu)建取50g造紙廠土壤,懸浮在100ml的0.18M磷酸鉀緩沖液(pH7.2)中,充分混勻后在Beckman Coulter Avanti J-E離心機(jī)(購(gòu)自Beckman Coulter公司,目錄號(hào)369003)JA-10轉(zhuǎn)頭上用600g離心力離心10分鐘,收集上清液,加入40ml PVPP(聚乙烯聚吡咯烷酮,polyvinylpolypyrrolidone)溶液(購(gòu)自Sigma公司,目錄號(hào)P-6755)(PVPP溶液每100mg PVPP與1ml 0.18M磷酸鉀緩沖液(pH7.2)混勻),振蕩30秒,再加入200μl 3M CaCl2溶液,振蕩30秒后,600g離心力離心5分鐘,收集上清液于另一個(gè)離心管中。再用同樣的離心機(jī)、轉(zhuǎn)頭用8000g離心力離心15分鐘收集上清液中的細(xì)菌細(xì)胞。將收集到的菌體充分懸浮在1ml TE(10mM Tris/HCl,pH8.0,1mM EDTA,pH8.0)溶液中,加入100μl溶菌酶(20mg/ml,溶于TE溶液),在37℃下作用30分鐘,在Eppendorf 5417C離心機(jī)(購(gòu)自Eppendorf公司,目錄號(hào)19718)上以10000g離心1分鐘以沉淀細(xì)胞,再將細(xì)胞充分懸浮在600μl PUREGENE公司的基因組DNA純化試劑盒(Genomic DNA Purification Kit,目錄號(hào)R-5500A)的細(xì)胞裂解緩沖液(Cell LysisSolution)中,置80℃水浴鍋5分鐘以裂解細(xì)胞,待樣品冷卻到室溫后,加入200μl上述試劑盒中的蛋白質(zhì)沉淀溶液(Protein Precipitation Solution),充分混勻后13000g離心3分鐘,將上清液轉(zhuǎn)移到一個(gè)新的1.5ml微量離心管中,加入600μl 100%異丙醇,充分混勻后即見(jiàn)DNA絮狀沉淀析出,挑出DNA絮狀沉淀,用70%乙醇洗2次DNA,干燥后將DNA溶于500μl TE溶液即得DNA粗提物。
將DNA粗提物加到含有Sephadex G200(購(gòu)自Pharmacia公司,目錄號(hào)17-0080-01)和2%PVPP(購(gòu)自Sigma公司,目錄號(hào)P-6755)的層析柱(200mm×10mm)上,用TE緩沖液洗脫,按每組分1ml分部收集洗脫液,每一組分加入100μl的3M醋酸鈉溶液(pH4.8)及1ml異丙醇沉淀DNA,把沉淀物溶于TE中,合并所得DNA溶液,0.7%瓊脂糖凝膠電泳后切下含30kb以上的DNA的凝膠,用電洗脫法回收純化DNA,回收純化的DNA如圖1,其中泳道1為λDNA(48.5kb);泳道2為λDNA用EcoRI酶切(片段大小從大到小依次為21.2kb,7.4kb,5.8kb,5.6kb,4.9kb,3.5kb);泳道3為從土壤中提取的DNA粗提物;泳道4為經(jīng)過(guò)Sephadex G-200凝膠初步純化的DNA;泳道5為經(jīng)過(guò)低熔點(diǎn)瓊脂糖凝膠回收得到的30kb以上的DNA。為了用這些純化的DNA制作基因文庫(kù),首先對(duì)這些DNA進(jìn)行末端修補(bǔ)以產(chǎn)生平頭末端而和文庫(kù)制備試劑盒中已處理好的同樣具平頭末端的pWEB∷TNC載體相連,依次在冰上向一個(gè)新的滅過(guò)菌的微量離心管中加入6μl 10×末端修補(bǔ)緩沖液(330mM Tris-醋酸[pH7.8],660mM醋酸鉀,100mM醋酸鎂,5mM DTT),6μl 2.5mM dNTP混合物(每種2.5mM),6μl 10mM ATP,40μl 30kb以上的DNA(0.2μg/μl),2μl末端修補(bǔ)酶混合物(T4DNA聚合酶和T4多聚核苷酸激酶)。25℃下放置45分鐘,再轉(zhuǎn)移到70℃水浴鍋放置10分鐘以終止酶反應(yīng),1.0%低熔點(diǎn)瓊脂糖凝膠電泳后切下含30kb-45kb的DNA的凝膠進(jìn)行DNA回收,為了使回收片段與文庫(kù)制備試劑盒中已處理好的具平頭末端的載體在T4DNA連接酶的作用下連接起來(lái),依次在冰上向一個(gè)新的滅過(guò)菌的微量離心管中加入12μl無(wú)菌水,2μl 10倍快速連接緩沖液(10×Fast-Link Ligation Buffer)(屬購(gòu)自Epicentre公司的文庫(kù)制備試劑盒pWEB∷TNC cosmid cloning kit(目錄號(hào)WEBC931)的一個(gè)組分),1μl 10mM ATP,1μl pWEB∷TNC載體(0.5μg),3μl低熔點(diǎn)瓊脂糖凝膠回收的30kb-45kb的DNA(0.1μg/μl),1μl快速連接DNA連接酶(Fast-Link DNA Ligase,2單位/μl)(屬購(gòu)自Epicentre公司的文庫(kù)制備試劑盒pWEB∷TNC cosmid cloning kit(目錄號(hào)WEBC931)的一個(gè)組分),混勻后在25℃下放置2個(gè)小時(shí),再在70℃放置10分鐘以終止酶反應(yīng)。為了將連接反應(yīng)產(chǎn)物用λ包裝蛋白包裝,將在冰上剛剛?cè)芑摩税b提取物(購(gòu)自Epicentre公司的文庫(kù)制備試劑盒pWEB∷TNC cosmid cloning kit(目錄號(hào)WEBC931)的一個(gè)組分)25μl立即轉(zhuǎn)移到一個(gè)新的滅過(guò)菌的微量離心管中并快速置于冰上,再往其中加入10μl連接反應(yīng)產(chǎn)物,充分混勻后置于30℃90分鐘后,再往其中加入25μ1溶化的λ包裝提取物(屬購(gòu)自Epicentre公司的文庫(kù)制備試劑盒pWEB∷TNC cosmid cloning kit(目錄號(hào)WEBC931)的一個(gè)組分),充分混勻后置于30℃ 90分鐘,向其中加入500μl噬菌體稀釋緩沖液(10mM Tris-HCl[pH 8.3],100mM NaCl,10mM MgCl2),再將該560μl包裝反應(yīng)產(chǎn)物加入到5.6mL的OD600=1.0的宿主大腸桿菌EPI100培養(yǎng)液(培養(yǎng)基為L(zhǎng)B[每升含胰蛋白胨(Oxoid),10g;酵母浸出粉(Difco),5g;NaCl,5g;pH7.0]+10mM MgSO4)中,25℃下放置20分鐘讓上述得到的包裝的λ噬菌體吸附和侵染宿主細(xì)胞E.coliEPI100,在含氨芐青霉素(100μg/mL)的LA平板(LA培養(yǎng)基配方為[每升含胰蛋白胨(Oxoid),10g;酵母浸出粉(Difco),5g;NaCl,5g;瓊脂粉,15g]pH7.0)上篩選轉(zhuǎn)化子。結(jié)果共獲得約15,000個(gè)轉(zhuǎn)化子,任意提取14個(gè)克隆的質(zhì)粒DNA,限制性內(nèi)切酶BamHI酶切后用0.7%瓊脂糖凝膠進(jìn)行電泳分析,結(jié)果所有質(zhì)粒除都有一個(gè)5.8kb的載體片段外,都含有插入片段,且沒(méi)有發(fā)現(xiàn)有兩個(gè)質(zhì)粒具有相同的酶切帶型,酶切結(jié)果如圖2所示,其中泳道1為λDNA用EcoRI酶切片段(片段大小從大到小依次為21.2kb,7.4kb,5.8kb,5.6kb,4.9kb,3.5kb);泳道2為1kb ladder(片段大小從大到小依次為10.0kb,8.0kb,6.0kb,5.0kb,4.0kb,3.5kb,3.0kb,2.5kb,2.0kb,1.5kb);其它泳道分別為使用限制性內(nèi)切酶BamHI酶切的文庫(kù)克隆質(zhì)粒。結(jié)果表明文庫(kù)含有非常隨機(jī)的插入DNA片段,插入片段最大的為45kb,最小的為23kb,平均大小為36kb。說(shuō)明文庫(kù)的克隆容量也是相當(dāng)大的,文庫(kù)的質(zhì)量相當(dāng)好。
二、從土壤未培養(yǎng)微生物的宏基因組文庫(kù)中篩選表達(dá)纖維素酶活性的克隆用平板影印法將含氨芐青霉素的LA平板上得到的轉(zhuǎn)化子(每平板約200個(gè)菌落左右)分別影印到含0.5%羧甲基纖維素(carboxylmethylcellulose,CMC)(購(gòu)自Sigma公司,目錄號(hào)C-5678)的LA平板、含氨芐青霉素(100μg/mL)的LA平板上,將平板倒置于37℃培養(yǎng)箱培養(yǎng)24小時(shí)后,將長(zhǎng)滿菌落的含氨芐青霉素的LA平板置于4℃冰箱保存,將長(zhǎng)滿菌落的含羧甲基纖維素的LA平板用0.5%剛果紅溶液染色15分鐘,用1M的NaCl溶液脫色15分鐘,然后檢測(cè)菌落周圍有無(wú)水解圈,結(jié)果如圖3所示,箭頭所指的菌落為周圍有水解圈的克隆。表明篩選到1個(gè)菌落周圍有水解圈的克隆(EPIl00/pGXNL2),進(jìn)一步提取該克隆的質(zhì)粒DNA并將其命名為pGXNL2,用限制性內(nèi)切酶BamHI完全酶切pGXNL2后,進(jìn)行0.7%瓊脂糖凝膠電泳分析,結(jié)果如圖4所示,pGXNL2除有一個(gè)5.8kb的載體片段外,還有另外5條BamHI片段,大小分別為17.0kb,14.5kb,8.2kb,4.2kb,1kb,結(jié)果表明pGXNL2含有45.2kb的插入片段。其中,泳道1為λ用EcoRI酶切后的片段(片段大小從大到小依次為21.2kb,7.4kb,5.8kb,5.6kb,4.9kb,3.5kb);泳道2為1kb ladder(片段大小從大到小依次為10.0kb,8.0kb,6.0kb,5.0kb,4.0kb,3.5kb,3.0kb,2.5kb,2.0kb,1.5kb);泳道3為pGXNL2/BamHI(從上至下分別為17.0kb,14.5kb,8.2kb,5.8kb,4.2kb,1kb)。為了證實(shí)pGXNL2的插入片段確實(shí)含有纖維素酶基因,用pGXNL2質(zhì)粒DNA和空載體pWEB∷TNC分別轉(zhuǎn)化E.coli EPI100,在含氨芐青霉素(100μg/mL)的LA平板上篩選轉(zhuǎn)化子,隨機(jī)挑取由每個(gè)質(zhì)粒轉(zhuǎn)化得到的10個(gè)轉(zhuǎn)化子點(diǎn)接到含0.5%羧甲基纖維素的LA平板上,37℃培養(yǎng)24小時(shí)后,用0.5%剛果紅溶液染色15分鐘,用1M的NaCl溶液脫色,然后觀察菌落周圍有無(wú)水解圈,結(jié)果表明所有10個(gè)由空載體pWEB∷TNC轉(zhuǎn)化得到的轉(zhuǎn)化子周圍都沒(méi)有水解圈,所有10個(gè)由pGXNL2轉(zhuǎn)化得到的轉(zhuǎn)化子周圍都有水解圈,其中一個(gè)轉(zhuǎn)化子的檢測(cè)結(jié)果如圖5所示。結(jié)果表明重組質(zhì)粒pGXNL2的插入片段上確實(shí)含有纖維素酶基因。
為了測(cè)定重組質(zhì)粒pGXNL2上纖維素酶基因的DNA序列,采用亞克隆的方法對(duì)該基因進(jìn)行定位。先后使用限制性內(nèi)切酶BamHI、EcoRI及KpnI對(duì)重組質(zhì)粒pGXNL2酶切第一步,對(duì)pGXNL2用BamHI進(jìn)行完全酶切,把酶切的產(chǎn)物抽提沉淀,然后使用T4DNA ligase(購(gòu)自Promega公司)連接,連接產(chǎn)物轉(zhuǎn)化E.coli EPI100,在含0.5%羧甲基纖維素的LA平板上篩選菌落周圍有水解圈的轉(zhuǎn)化子,提取質(zhì)粒并使用BamHI酶切,結(jié)果表明含有14kb外源DNA片段的轉(zhuǎn)化子菌落周圍有水解圈,把只含有5.8kb載體帶和一條14kb外源帶的質(zhì)粒命名為pGXNB2;第二步,對(duì)pGXNB2用EcoRI進(jìn)行完全酶切,用0.7%的瓊脂糖凝膠電泳分析,發(fā)現(xiàn)由4條帶組成9.5kb和5kb的外源帶,載體pWEB∷TNC被切成3kb和2.8kb兩條帶。同樣抽提沉淀,連接,轉(zhuǎn)化E.coli EPI100,在含0.5%羧甲基纖維素的LA平板上篩選菌落周圍有水解圈的轉(zhuǎn)化子(同第一步),提取質(zhì)粒并使用EooRI酶切,含有9.5kb外源DNA片段的轉(zhuǎn)化子菌落周圍有水解圈。把只含有3kb載體帶和一條9.5kb外源帶的質(zhì)粒命名為pGXNE1;第三步,對(duì)pGXNE1用EcoRI和Kpn I雙酶切,分別得到一條8kb和一條1.5kb的外源片段。將回收的8kb和1.5kb的DNA片段分別與用EcoRI和KpnI雙酶切的克隆載體pBluescriptM13(+)連接,將得到的兩個(gè)連接產(chǎn)物分別轉(zhuǎn)入E.coli EPI100后,發(fā)現(xiàn)含1.5kb外源片段的轉(zhuǎn)化子在含0.5%羧甲基纖維素的LA平板上周圍有水解圈,將含1.5kb DNA片段的重組質(zhì)粒命名為pGXN1500。最終將靶基因定位在用EcoRI和KpnI酶切pGXNE1得到的1.5kb的外源DNA片段上。將含有pBluescripM13(+)與1.5kb外源的重組質(zhì)粒pGXN1500寄送大連寶生物工程公司采用雙脫氧核苷酸法對(duì)該基因進(jìn)行雙向雙鏈測(cè)序。用軟件DNAStar(DNASTAR公司,版本5)對(duì)序列進(jìn)行拼接,用NCBI(National Centerfor Biotechnology Information,http//www.ncbi.nlm.nih.gov)上的軟件對(duì)DNA序列進(jìn)行分析,如Blast(http//www.ncbi.nlm.nih.gov/BLAST)。得到纖維素酶的編碼基因,該基因具有序列表中序列1的DNA序列,命名為umcel6A。序列表中序列1的DNA自5’端的第57-1454位核苷酸為基因umcel6A的開(kāi)放閱讀框(open readingframe,ORF),由1398個(gè)核苷酸組成,自5’端的第57-59位核苷酸為umcel6A基因的起始密碼子ATG,自5’端的第1452-1454位核苷酸為umcel6A基因的終止密碼子TGA。
纖維素酶基因umcel6A編碼一個(gè)含465個(gè)氨基酸的蛋白質(zhì)Umcel6A,用DNAStar軟件預(yù)測(cè)該蛋白質(zhì)的理論分子量大小為48,026.38道爾頓,等電點(diǎn)pI為3.98。用簡(jiǎn)單組件結(jié)構(gòu)研究工具(Simple Modular Architecture Research Tool,SMART,http//smart.embl-heidelberg.de)分析纖維素酶Umcel6A的組件結(jié)構(gòu),結(jié)果是自N端的第26-48位氨基酸為跨膜功能域(transmembrane domain),自N端的第59-331位氨基酸為家族6糖基水解酶(glycosyl hydrolase)功能域,自N端的第371-463位氨基酸為碳水化合物結(jié)合組件(carbohydrate-binding modules,CBMs)。和Umcel6A催化功能域同源性最高的為嗜高溫放線菌(Thermobifida fusca)的-1,4-纖維二糖水解酶A(1,4-β-D-glucan cellobiohydrolase A)(GenBank索引號(hào)23018004)的同源性最高,兩者的相似性為54%、相同性為41%。
實(shí)施例2、umcel6A在大腸桿菌中的表達(dá)
1、umcel6A的開(kāi)放閱讀框(open reading frame,ORF)及蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)使用NCBI上的ORF Finder(Open reading frame finder)對(duì)測(cè)序所獲得DNA序列(序列表中的SEQ ID №1,由1526個(gè)脫氧核苷酸組成)上可能存在的ORF進(jìn)行預(yù)測(cè),結(jié)果顯示自5’端的第57至1454位核苷酸為umcel6A的開(kāi)放閱讀框(OpenReading Frame,ORF),自5’端的第57至59位核苷酸為umcel6A基因的起始密碼子ATG,自5’端的第1452至1454位核苷酸為umcel6A基因的終止密碼子TGA,纖維素酶基因umcel6A的開(kāi)放閱讀框全長(zhǎng)為1.398kb,可編碼465個(gè)氨基酸。使用DNAStar軟件預(yù)測(cè)該蛋白質(zhì)的理論分子量大小為48,026.38道爾頓,等電點(diǎn)pI為3.98。用簡(jiǎn)單組件結(jié)構(gòu)研究工具(Simple Modular Architecture Research Tool,SMART,http//smart.embl-heidelberg.de)分析纖維素酶Umcel6A的組件結(jié)構(gòu),結(jié)果是自N端的第26-48位氨基酸為跨膜功能域(transmembrane domain),自N端的第59-331位氨基酸為家族6糖基水解酶(glycosyl hydrolase)功能域,自N端的第371-463位氨基酸為碳水化合物結(jié)合組件(carbohydrate-binding modules,CBMs)。
2、擴(kuò)增umcel6A基因的PCR引物設(shè)計(jì)帶有跨膜功能域的基因在體內(nèi)表達(dá)后很有可能將表達(dá)產(chǎn)物分泌到細(xì)胞外。為避免表達(dá)產(chǎn)物分泌到細(xì)胞外,只需要擴(kuò)增umcel6A基因的自5′端第201位堿基到終止密碼子間的序列,即umcel6A基因中除編碼跨膜功能域外的DNA序列(序列1的自5′端第201位至1454位堿基),共1254bp,預(yù)計(jì)所擴(kuò)增片段編碼蛋白的分子量為43.176KDa,等電點(diǎn)pI為3.794。結(jié)合載體pQE-30上的多克隆位點(diǎn),用Vector NTI軟件搜索基因上的有關(guān)酶切位點(diǎn),設(shè)計(jì)引物。在正向引物GX1500F2和反向引物GX1500R1的5’端的分別加上BaiI和HindIII酶切位點(diǎn)(GX1500F2和GX1500R1中帶下劃線的字母)。預(yù)計(jì)PCR反應(yīng)將特異地?cái)U(kuò)增出一條大約為1254bp的DNA條帶。擴(kuò)增基因的PCR正向引物和反向引物分別為GX1500F25’ACTGGATCCACGGCGTCCGCCCAAGGC 3’GX1500R15’CGTAAGCTTTCAGGCGCTGCACTCCACTGT 3’3、umcel6A基因的PCR擴(kuò)增用pGXN1500(實(shí)施例1中制備,是載體pBluescriptM13(+)克隆有含umcel6A基因的1.5kb DNA片段的重組質(zhì)粒)作模板,以GX1500F2和GX1500R1為正反向引物作PCR擴(kuò)增反應(yīng)。反應(yīng)體系為模板10ng,1μl正向引物(10pmol/μl),1μl反向引物(10pmol/μl),dNTP0.25mM,pfu buffer 2.5μl,pfu polymerase0.4unit(購(gòu)自MBI公司),加ddH2O至25μl。PCR反應(yīng)程序?yàn)榈谝浑A段預(yù)變性95℃,5min;第二階段變性95℃,30sec;退火55℃,30sec;延伸72℃,2min,共30個(gè)循環(huán)。第三階段延伸,72℃延伸10分鐘。PCR反應(yīng)特異地?cái)U(kuò)增出一條為1254bp DNA條帶,結(jié)果附圖6。其中泳道1為1kb ladder(片段大小從大到小依次為10.0kb,8.0kb,6.0kb,5.0kb,4.0kb,3.5kb,3.0kb,2.5kb,2.0kb,1.5kb);泳道2為PCR反應(yīng)特異地?cái)U(kuò)增出的一條1254bp的DNA條帶。將PCR產(chǎn)物純化后經(jīng)bamHI和HindIII分別酶切后,然后進(jìn)行瓊脂糖凝膠電泳分離片段,用電洗脫法回收雙酶切后PCR產(chǎn)物。
4.pGXNumcel6A重組質(zhì)粒的構(gòu)建及鑒定將雙酶切后的PCR產(chǎn)物和同樣雙酶切后的載體pQE-30,用T4DNA連接酶16℃連接過(guò)夜,連接產(chǎn)物轉(zhuǎn)化E.coli XLl-blue,提取重組質(zhì)粒進(jìn)行酶切鑒定。圖7是重組質(zhì)粒的酶切電泳圖譜,可以看到重組質(zhì)粒經(jīng)BamHI和HindIII雙酶切后釋放出一條3.4kb的載體帶和一條與PCR產(chǎn)物同樣大小1.254kb的外源插入片段。泳道1為1kbladder(片段大小從大到小依次為10.0kb,8.0kb,6.0kb,5.0kb,4.0kb,3.5kb,3.0kb,2.5kb,2.0kb,1.5kb);泳道2為重組質(zhì)粒經(jīng)BamHI和HindIII雙酶切后結(jié)果。把該重組質(zhì)粒命名為pGXNumcel6A。
5.umcel6A基因在E.coli M15中的表達(dá)把pGXNumcel6A轉(zhuǎn)化至E.coli M15中得到轉(zhuǎn)化子M15/pGXNumcel6A,挑取M15/pGXNumcel6A單菌落于LA平板上(含氨芐青霉素25μg/mL,卡那霉素25μg/ml,IPTG1.0mmol/L),同時(shí)用M15/pQE30(轉(zhuǎn)入pQE30的E.coli M15)作為空白對(duì)照,37℃培養(yǎng)24小時(shí)。菌體經(jīng)氯仿破壁后用0.5%剛果紅溶液染色15分鐘,用1mol/L的NaCl溶液脫色,然后觀察菌落周圍有無(wú)水解圈。附圖8結(jié)果顯示重組菌M15/pGXNumcel6A周圍有水解圈,而空白對(duì)照M15/pQE30周圍無(wú)水解圈,說(shuō)明靶基因在E.coli M15中已經(jīng)高效表達(dá)出了有纖維素降解活性的蛋白質(zhì)產(chǎn)物。
序列表<160>2<210>1<211>1526<212>DNA<213>未知<220>
<223>
<400>1gaattcgacg ccccctgtcg acatccttca gtggtagcgc taccatcaat atatcgatgt 60atgtgaattt caccgctcgc atcggtggag tcgacaccac gaaggagcaa ctcgtgaatc 120gaagaaagag actcgcggcg atcgccgcgg cggcgggcgc cgcgggattg gccgcggcca 180ccgcgctcct gctggcccct acggcgtccg cccaaggcga gagcctgtgg gccgacccca 240ctacccaggc ggccgagtgg gccgccgaga acccgaacga ctaccgggcc gaactcatcg 300gcgagcgcat cgggcagacc ccggcgggcg tctggttcac ccagcacaac ccggtcggcg 360gcatccaggc gcaggtcgcg aacgtcgtat cggccgccgc cgctgacggc gacacgccga 420tcatggtcgt ctacaacatc cccgaccgcg actgcggcgg ccactccggc ggcggcgccc 480ccagccacag cgcctaccgc gactggatcg accagttcgc cgccggcctc tcgggcccgg 540cctacatcat cctcgaaccc gacaccctcc cgcacaactg cgccgacccc gccgagcgca 600accagtcgct cacccacgcg gtccaggcgc tcaagtccgc ctcctcgcag gcccgcgtct 660acctcgacat cggcaactcc gcctggctcg agcccggcga ggcggccagc cgcctccagg 720gcgccggcat ccagtacgcc gacggcttcg cgatcaacgt ctccaactac cgcaccaccc 780aggaggcgac ctcctacgcc caccagatcc agaacgtcgt cggctccgac aagggcgcgg 840tgatcgacac cagccgcaac ggcaacgggc cgctcgaccc gcccgacccc aacgactggt 900gcgacccgcc cggccgcgcc atcggggact acccgaccac ctcgaccggc gtgagcggca 960tcgacgccta cctgtgggtc aagctccccg gcgaggccga cggctgcgcc ggctcggccg1020gccagttcat ccccgacctg gcctatgagc tcgccaacaa cgccggggcc gactggcccg1080gcgacgtccc ggtcgacccg accgacccga ccaccgaccc cgacgacccg accaccgacc1140
ccgggaccga tccgggcacc ggcgactgca ccgccgagat cgtcgtcgtc agcgactggg1200gctcgggctg gcagggcgat gtgcacatca ccgccggcga cgcctccctc aacggctgga1260ccctcacctg gacctggaac agcggccagt ccgtctccag ctcctggaac gtcgacatct1320cccagtcggg gacctcggtg accgccacgg acgtcggctg gaacggcgcc atcgcgtccg1380gacagtcccg aaatgccttc ggtttcatcg ccaacggctc cagcgcggtg ccgacagtgg1440agtgcagcgc ctgacccacg cctcacttca cccccggtgt ccggcctgtg tcgcagttgt1500gggacctaca ctgtccgtgt ggtacc 1526<210>2<211>465<212>PRT<213>未知<220>
<223>
<400>2Met Tyr Val Asn Phe Thr Ala Arg Ile Gly Gly Val Asp Thr Thr Lys1 5 10 15Glu Gln Leu Val Asn Arg Arg Lys Arg Leu Asx Ala Ile Ala Ala Ala20 25 30Ala Gly Ala Ala Gly Leu Asx Ala Ala Thr Ala Leu Leu Leu Asx Pro35 40 45Thr Ala Ser Ala Gln Gly Glu Ser Leu Trp Ala Asp Pro Thr Thr Gln50 55 60Ala Ala Glu Trp Ala Ala Glu Asn Pro Asn Asp Tyr Arg Ala Glu Leu65 70 75 80Ile Gly Glu Arg Ile Gly Gln Thr Pro Ala Gly Val Trp Phe Thr Gln85 90 95His Asn Pro Val Gly Gly Ile Gln Ala Gln Val Ala Asn Val Val Ser100 105 110
Ala Ala Ala Ala Asp Gly Asp Thr Pro Ile Met Val Val Tyr Asn Ile115 120 125Pro Asp Arg Asp Cys Gly Gly His Ser Gly Gly Gly Ala Pro Ser His130 135 140Ser Ala Tyr Arg Asp Trp Ile Asp Gln Phe Ala Ala Gly Leu Ser Gly145 150 155 160Pro Ala Tyr Ile Ile Leu Glu Pro Asp Thr Leu Pro His Asn Cys Ala165 170 175Asp Pro Ala Glu Arg Asn Gln Ser Leu Thr His Ala Val Gln Ala Leu180 185 190Lys Ser Ala Ser Ser Gln Ala Arg Val Tyr Leu Asp Ile Gly Ash Ser195 200 205Ala Trp Leu Glu Pro Gly Glu Ala Ala Ser Arg Leu Gln Gly Ala Gly210 215 220Ile Gln Tyr Ala Asp Gly Phe Ala Ile Asn Val Ser Asn Tyr Arg Thr225 230 235 240Thr Gln Glu Ala Thr Ser Tyr Ala His Gln Ile Gin Asn Val Val Gly245 250 255Ser Asp Lys Gly Ala Val Ile Asp Thr Ser Arg Asn Gly Ash Gly Pro260 265 270Leu Asp Pro Pro Asp Pro Asn Asp Trp Cys Asp Pro Pro Gly Arg Ala275 280 285Ile Gly Asp Tyr Pro Thr Thr Ser Thr Gly Val Ser Gly Ile Asp Ala290 295 300Tyr Leu Trp Val Lys Leu Pro Gly Glu Ala Asp Gly Cys Ala Gly Ser305 310 315 320Ala Gly Gln Phe Ile Pro Asp Leu Asx Tyr Glu Leu Asx Asn Asn Ala325 330 335Gly Ala Asp Trp Pro Gly Asp Val Pro Val Asp Pro Thr Asp Pro Thr340 345 350Thr Asp Pro Asp Asp Pro Thr Thr Asp Pro Gly Thr Asp Pro Gly Thr355 360 365
Gly Asp Cys Thr Ala Glu Ile Val Val Val Ser Asp Trp Gly Ser Gly370 375 380Trp Gln Gly Asp Val His Ile Thr Ala Gly Asp Ala Ser Leu Asn Gly385 390 395 400Trp Thr Leu Thr Trp Thr Trp Asn Ser Gly Gln Ser Val Ser Ser Ser405 410 415Trp Asn Val Asp Ile Ser Gln Ser Gly Thr Ser Val Thr Ala Thr Asp420 425 430Val Gly Trp Asn Gly Ala Ile Ala Ser Gly Gln Ser Arg Asn Ala Phe435 440 445Gly Phe Ile Ala Asn Gly Ser Ser Ala Val Pro Thr Val Glu Cys Ser450 455 460Ala46權(quán)利要求
1.一種纖維素酶,是具有下述氨基酸殘基序列之一的蛋白質(zhì)1)序列表中的SEQ ID №2;2)將序列表中SEQ ID №2的氨基酸殘基序列經(jīng)過(guò)一個(gè)或幾個(gè)氨基酸殘基的取代和/或缺失和/或添加且具有纖維素酶活性的蛋白質(zhì)。
2.根據(jù)權(quán)利要求1所述的纖維素酶,其特征在于所述纖維素酶具有序列表中序列2的氨基酸殘基序列。
3.權(quán)利要求1或2所述的纖維素酶的編碼基因。
4.根據(jù)權(quán)利要求3所述的編碼基因,其特征在于所述纖維素酶的編碼基因具有下述核苷酸序列之一1)序列表中SEQ ID №1的DNA序列;2)編碼序列表中SEQ ID №2蛋白質(zhì)序列的多核苷酸;3)在高嚴(yán)謹(jǐn)條件下可與序列表中SEQ ID №1限定的DNA序列雜交的核苷酸序列。
5.含有權(quán)利要求3或4所述的纖維素酶編碼基因的表達(dá)載體。
6.含有權(quán)利要求3或4所述的纖維素酶編碼基因的細(xì)胞系。
7.含有權(quán)利要求3或4所述的纖維素酶編碼基因的宿主菌。
8.權(quán)利要求1或2所述的纖維素酶在纖維素降解中的應(yīng)用。
9.權(quán)利要求3或4所述的纖維素酶編碼基因在纖維素降解中的應(yīng)用。
全文摘要
本發(fā)明公開(kāi)了一種纖維素酶及其編碼基因與應(yīng)用。本發(fā)明提供的一種纖維素酶,是具有下述氨基酸殘基序列之一的蛋白質(zhì)1)序列表中的SEQ ID №2;2)將序列表中SEQ ID №2的氨基酸殘基序列經(jīng)過(guò)一個(gè)或幾個(gè)氨基酸殘基的取代和/或缺失和/或添加且具有纖維素酶活性的蛋白質(zhì)。本發(fā)明的纖維素酶及其編碼基因在纖維素的降解中具有廣泛的用途。
文檔編號(hào)C12N15/63GK1772888SQ20051010910
公開(kāi)日2006年5月17日 申請(qǐng)日期2005年10月18日 優(yōu)先權(quán)日2005年10月18日
發(fā)明者馮家勛, 段承杰, 靳振江, 許躍強(qiáng), 龐浩, 張鵬, 封毅, 唐紀(jì)良 申請(qǐng)人:廣西大學(xué)