欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

具有纖維素酶活性的多肽的制作方法

文檔序號:391994閱讀:584來源:國知局
專利名稱:具有纖維素酶活性的多肽的制作方法
技術(shù)領(lǐng)域
本公開內(nèi)容涉及生物分子工程和設(shè)計,以及工程化的蛋白和核酸。背景纖維素酶混合物在生物質(zhì)轉(zhuǎn)化過程中的表現(xiàn)除了取決于纖維素底物的物理狀態(tài)和組成以外,還取決于許多酶特性,包括穩(wěn)定性、產(chǎn)物抑制、不同纖維素酶組分之間的協(xié)作、 生產(chǎn)‘性結(jié)合(productive binding)才目對__生產(chǎn)個生吸附(nonproductive adsorption)、以及 PH依賴性。鑒于纖維素水解的多變量性質(zhì),具有多樣的纖維素酶選擇來優(yōu)化用于不同應(yīng)用和原料的酶制劑是令人期望的。概述本公開內(nèi)容提供了具有纖維素酶活性以及與野生型蛋白相比增加的熱穩(wěn)定性和活性的重組多肽。本公開內(nèi)容提供并顯示CBHII嵌合體和在C端末端(例如,取決于天然蛋白序列,見例如,SEQ ID NO :2和SEQ IDNO :4,在大約氨基酸310-315)具有Cys到Ser的突變的天然酶在長時間水解測定中比天然酶水解更致密的纖維素。本公開提供了在包含序列(iECDG (SEQ ID NO :2的312-316)的基序的C端區(qū)域中包含C — S取代的重組多肽,其中該變體與野生型纖維二糖水解酶相比具有增加的熱穩(wěn)定性和纖維素酶活性。例如,本公開內(nèi)容提供了具有增加的熱穩(wěn)定性和纖維素酶活性的多肽,該多肽包含的序列是包含C314S的至少85%、90%、95%、98%、99%相同的SEQ ID NO :2 ;是包含C311S的至少85%、90%、95%、98%、99%相同的SEQ ID NO :4 ;是包含C310S的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO :12 ;是包含 C312S 的至少 85%、90%、95%、 98%、99%相同的 SEQ ID NO :13 ;是包含 C314S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID N0:14;是包含C315S的至少85%、90%、95%、98%、99%相同的SEQ ID N0:15;是包含C313S的至少85%、90%、95%、98%、99%相同的SEQ ID NO :16 ;是包含C311S的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO :17 ;是包含 C313S 的至少 85%、90%、95%、 98%、99%相同的 SEQ ID N0:19;是包含C312S的至少85%、90%、95%、98%、99%相同的 SEQ ID NO :21 ;是包含 C311S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO :22 ;是包含C400S的至少85%、90%、95%、98%、99%相同的SEQ ID NO :64 ;是包含C407S的至少85%、90%、95%、98%、99%相同的 SEQ ID NO :65 ;是包含 C394S 的至少 85%、90%、95%、 98%、99%相同的 SEQ ID NO :66 ;是包含 C400S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID N0:67;是包含C400S的至少85%、90%、95%、98%、99%相同的SEQ ID NO :68 ;是包含C400S的至少85%、90%、95%、98%、99%相同的SEQ ID NO :69 ;是包含C400S的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO :70 ;是包含 C400S 的至少 85%、90%、95%、 98%、99%相同的 SEQ ID NO :71 ;是包含 C400S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID N0:72;是包含C400S的至少85%、90%、95%、98%、99%相同的SEQ ID NO :73 ;是包含C400S的至少85%、90%、95%、98%、99%相同的SEQ ID NO :74 ;是包含C400S的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO :75 ;是包含 C407S 的至少 85%、90%、95%、 98%、99%相同的 SEQ ID NO :76 ;是包含 C394S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID N0:77;或是包含C412S的至少85%、90%、95%、98%、99%相同的SEQ ID NO 78 ; 其中前述多肽具有纖維素酶活性和與其對應(yīng)的缺乏Cys — Ser突變的親本(野生型)蛋白相比改進的熱穩(wěn)定性。本公開內(nèi)容還提供了重組產(chǎn)生、合成制備或以其他方式非天然產(chǎn)生的基本上純化的多肽,其中該多肽包括除了在其中存在C —S取代的以下已鑒定的位置之外具有1-10 個、10-20個或20-30個保守氨基酸取代的以下列出的序列包含C314S的SEQ ID NO :2 ;包含 C311S 的 SEQ ID NO 4 ;包含 C310S 的 SEQ ID NO 12 ;包含 C312S 的 SEQ ID NO 13 ;包含 C314S 的 SEQ ID NO 14 ;包含 C315S 的 SEQ ID NO 15 ;包含 C313S 的 SEQ IDNO 16 ;包含 C311S 的 SEQ ID NO 17 ;包含 C313S 的 SEQ ID NO 19 ;包含 C312S 的 SEQ ID NO 21 ;包含 C311S 的 SEQ ID NO 22 ;包含 C400S 的 SEQ ID NO 64 ;包含 C407S 的 SEQ ID NO 65 ;包含 C394S 的 SEQ IDNO 66 ;包含 C400S 的 SEQ ID NO 67 ;包含 C400S 的 SEQ ID NO :68 ;包含 C400S 的 SEQ ID NO 69 ;包含 C400S 的 SEQ ID NO 70 ;包含 C400S 的 SEQ ID NO 71 ;包含 C400S 的 SEQ ID NO -J2 ;包含 C400S 的 SEQ IDNO 73 ;包含 C400S 的 SEQ ID NO 74 ;包含 C400S 的 SEQ ID NO 75 ;包含 C407S 的 SEQ ID NO 76 ;包含 C394S 的 SEQ ID NO 77 或包含 C412S 的 SEQ ID NO :78。本公開提供了包含選自由以下組成的組的序列的重組多肽(a)具有對SEQ ID NO 2的至少85%或更大的同一性、在314位具有kr的多肽,并且其中該多肽具有纖維素酶活性;(b)具有對SEQ ID NO 4的至少70%或更大的同一性、在311位具有kr的多肽, 并且其中該多肽具有纖維素酶活性;(c)對選自由以下組成的組的序列具有70%或更大的同一性的多肽⑴SEQ ID NO 12且在310位具有kr,(ii)SEQ ID NO :13且在312位具 WSer, (iii)SEQ ID NO : 14 且在 314 位具有 kr,(iv) SEQ ID NO : 15 且在 315 位具有 kr, (v)SEQ ID NO :16 且在 313 位具有 kr,(vi)SEQ ID NO :17 且在 311 位具有 kr,(vii) SEQ ID NO :19 且在 313 位具有 kr,(viii)SEQ IDNO :21 且在 312 位具有 kr,以及(ix)SEQ ID NO 22且在311位具有kr,并且其中前述多肽的每一種都具有纖維素酶活性;以及(d)包含來自兩個不同的親本纖維二糖水解酶多肽的至少兩個結(jié)構(gòu)域的嵌合多肽,其中這些結(jié)構(gòu)域從N端到C端包含(區(qū)段1)-(區(qū)段(區(qū)段;3)-(區(qū)段4)-(區(qū)段(區(qū)段6)-(區(qū)段 7)-(區(qū)段 8);其中區(qū)段 1 包含對 SEQ ID NO 2( “1”)、SEQ IDNO 4( “2”)或 SEQ ID N0:6( “3”)的氨基酸殘基大約1到大約X1具有至少50-100%同一性的序列;區(qū)段2包含對 SEQ ID NO 2( “1,,)、SEQ ID NO :4( “2,,)或 SEQ ID NO 6( “3,,)的氨基酸殘基 X1到大約&具有至少50-100%同一性的序列;區(qū)段3包含對SEQ ID NO :2 ( “ 1”)、SEQ ID NO 4( “2”)或SEQID N0:6( “3”)的氨基酸殘基&到大約知具有至少50-100%同一性的序列;區(qū)段 4 包含對 SEQ ID NO 2( “1”)、SEQ ID NO 4( “2”)或 SEQ ID NO 6( “3”) 的氨基酸殘基知到大約&具有至少50-100%同一性的序列;區(qū)段5包含對SEQ ID NO 2( “1”)、SEQ ID NO :4( “2”)或SEQ ID N0:6( “3”)的大約氨基酸殘基&到大約&具有至少50-100%同一性的序列;區(qū)段6包含對SEQ IDNO 2( “1”)、SEQ ID NO :4( “2”)或 SEQ ID NO :6( “3”)的氨基酸殘基&到大約&具有至少50-100%同一性的序列;區(qū)段7 包含對SEQ ID NO 2 (“1”)或SEQ ID N0:4( “2”)的氨基酸殘基知到大約X7具有至少 50-100%同一性的序列;并且區(qū)段8包含對SEQ ID NO :2 ( “ 1”)或SEQ ID NO 4( "2") 的氨基酸殘基X7到大約X8具有至少50-100%同一性的序列;其中X1是SEQ IDNO 2的殘基 43、44、45、46 或 47,或是 SEQ ID NO :4 或 SEQ ID NO :6 的殘基 42、43、44、45 或 46 ;x2 是 SEQ ID NO :2 的殘基 70、71、72、73 或 74,或是 SEQ ID NO :4 或 SEQ ID NO :6 的殘基 68、69、 70、71、72、73 或 74 ;知是 SEQ ID NO :2 的殘基 113、114、115、116、117 或 118,或是 SEQ ID NO :4 或 SEQ ID NO :6 的殘基 110、111、112、113、114、115 或 116 是 SEQ ID NO :2 的殘基 153、154、155、156 或 157,或是 SEQID NO :4 或 SEQ ID NO :6 的殘基 149、150、151、152、 153、154、155 或 156 是 SEQ ID NO :2 的殘基 220、221、222、223 或 224,或是 SEQ IDNO 4 或 SEQ ID NO :6 的殘基 216、217、218、219、220、221、222 或 223 是 SEQ ID NO 2 的殘基
256、257、258、259、260或 1,或是SEQIDNO :4 或 SEQ ID NO :6 的殘基 253、254、255、256、
257、258、259或洸0 ;x7 是 SEQ ID NO :2 的殘基 312、313、314、315 或 316,或是 SEQ ID NO: 4 的殘基 309、310、311、312、313、314、315 或 318 ;并且 X8 是對應(yīng)于具有序列 SEQ ID NO :2、 SEQ ID NO 4或SEQ ID NO 6的多肽的C端的氨基酸殘基,其中該嵌合多肽在SEQ ID NO 2的314位或在SEQ ID NO :4的311位具有kr,并且其中該嵌合多肽具有纖維素酶活性和與包含SEQ IDNO :2、4或6的CBH II多肽相比改進的熱穩(wěn)定性和/或pH穩(wěn)定性。在重組多肽的一個實施方案中,區(qū)段1包括來自SEQ ID NO :2( “1”)、SEQ ID N0:4(“2”)或 SEQ ID NO :6( “3”)的氨基酸殘基大約1到大約X1并具有1_10個保守氨基酸取代;區(qū)段 2 來自 SEQ ID NO 2( “1”)、SEQ ID NO :4( “2”)或 SEQID NO 6( “3”)的大約氨基酸殘基X1到大約&并具有大約1-10個保守氨基酸取代;區(qū)段3來自SEQ ID NO :2 ( “ 1 ”)、SEQ ID NO :4( “2”)或SEQ ID NO :6 ( “3”)的大約氨基酸殘基&到大約知并具有大約1-10 個保守氨基酸取代;區(qū)段4來自SEQ ID NO 2( “1”)、SEQ ID NO :4( “2”)或SEQ ID NO 6( “3”)的大約氨基酸殘基&到大約&并具有大約1-10個保守氨基酸取代;區(qū)段5來自 SEQ ID NO 2( “1”)、SEQ ID NO :4( “2”)或 SEQ ID NO 6( “3”)的大約氨基酸殘基 & 到大約&并具有大約1-10個保守氨基酸取代;區(qū)段6來自SEQ ID NO :2( “1”)、SEQ ID NO: 4( “2”)或SEQ ID NO 6( “3”)的大約氨基酸殘基、到大約&并具有大約1_10個保守氨基酸取代;區(qū)段 7 來自 SEQ IDNO 2( “1”)、SEQ ID NO :4( “2”)或 SEQ ID NO 6( “3”) 的大約氨基酸殘基&到大約X7并具有大約1-10個保守氨基酸取代;并且區(qū)段8來自SEQ IDNO 2( “1”)、SEQ ID NO :4( “2”)或 SEQ ID NO 6( “3”)的大約氨基酸殘基 X7 到大約 X8 并且除了在 SEQ ID NO 2 的 314 位、SEQ ID NO 4 的 311 位或 SEQ ID NO 6 的 313 位以外具有大約1-10個保守氨基酸取代。又在另一個實施方案中,嵌合多肽包含與選自由SEQ ID NO :12-62和SEQ ID NO :63組成的組的序列至少80%、90%、95%、98%或99%相同的序列。本公開內(nèi)容還提供了由SEQ ID NO 12-62或SEQ ID NO 63中所列出的序列組成
的重組多肽。本公開內(nèi)容還提供了編碼以上所述的任何多肽的多核苷酸、包含該多核苷酸的載體和包含該多核苷酸或載體的宿主細胞。本公開內(nèi)容還提供了包含以基本上純化的形式或作為細胞裂解物的一部分的多肽的酶制備物。本公開內(nèi)容還提供了處理包括纖維素的生物質(zhì)的方法,該方法包括使該生物質(zhì)與本公開內(nèi)容的多肽或酶制備物接觸。附圖簡述圖IA-B候選的CBH II親本基因酵母表達培養(yǎng)上清液的SDS-PAGE凝膠。㈧凝膠泳道(左到右)1-紅褐肉座菌(H. jeCOrina),2-空載體,3-特異腐質(zhì)霉(H. insolens), 4-嗜熱毛殼菌(C. therm0philum),5-紅褐肉座菌(第二份),6-黃孢原毛平革菌 (P. chrysosporium),7-埃默森籃狀菌(T. emersonii),8-空載體(第2份),9-紅褐肉座菌 (第三份)。凝膠底部的數(shù)字代表在2小時、50°C PASC水解測定之后在反應(yīng)中存在的還原糖(ug/mL)的濃度。隨后用BSA標準品進行的SDS-PAGE比較允許5-10mg/L的特異腐質(zhì)霉表達水平的估計。(B)顯示釀酒酵母(S. cerevisiaeKBH II表達培養(yǎng)上清液的SDS-PAGE 凝膠分析。CBH II條帶只出現(xiàn)在60kDa分子量標準品之下。泳道,左到右,1_野生型紅褐肉座菌,2-紅褐肉座菌B7P3,3-紅褐肉座菌C311S,4-野生型嗜熱毛殼菌,5-野生型特異腐質(zhì)霉,6-特異腐質(zhì)霉B7P3,7-特異腐質(zhì)霉C314S。數(shù)字表示在與PASC(lmg/mL)在50°C在 50mM醋酸鈉pH 4. 8中100分鐘孵育期間產(chǎn)生的每mLSDCAA表達培養(yǎng)上清液當量的μ g葡萄糖當量/mL反應(yīng)體積。泳道1-4的值已除以2以校正上樣的濃縮培養(yǎng)上清液的兩倍體積, 如果省略這種校正將使得特異腐質(zhì)霉的比活性值顯得人為降低。圖2A-C顯示CBH II嵌合體文庫區(qū)塊(block)邊界的圖解。(A)具有靠顏色區(qū)分的區(qū)塊的特異腐質(zhì)霉CBH II催化結(jié)構(gòu)域帶狀圖(ribbon diagram)。CBH II酶與纖維二糖來源的異桑葉生物堿(isofagomine)糖苷酶抑制劑復合。(B)顯示二級結(jié)構(gòu)元件、二硫鍵和由黑色箭頭表示的區(qū)塊分割的特異腐質(zhì)霉催化結(jié)構(gòu)域的線性表示。(C)表示能夠在重組后破裂的接觸(在4. 5 A內(nèi)的側(cè)鏈重原子)的側(cè)鏈接觸圖。大多數(shù)的破裂接觸發(fā)生在相鄰的區(qū)塊之間。圖3顯示了 23種分泌的/活性的和15種不分泌的/無活性的樣品集嵌合體的破裂接觸的數(shù)目(E)和與最近親本的突變(m)的數(shù)目。圖4顯示了親本CBH II酶和三種熱穩(wěn)定的嵌合體的作為pH的函數(shù)的標準化至 PH 5.0的比活性。呈現(xiàn)的數(shù)據(jù)是兩個重復的平均值,其中HJPlus和紅褐肉座菌的誤差棒表示兩個獨立試驗的值。16小時反應(yīng)、300ug酶/gPASC、50°C、所示pH的12. 5mM檸檬酸鈉 /12. 5mM磷酸鈉緩沖液。圖5顯示在一定溫度范圍內(nèi)親本和熱穩(wěn)定的嵌合體的長時間纖維素水解測定結(jié)果(μ g葡萄糖還原糖當量/μ g CBH II酶)。誤差棒指示HJPlus和特異腐質(zhì)霉CBH II酶的三個重復的標準誤差。40小時反應(yīng),100 μ g酶/g PASC, 50mM醋酸鈉,pH 4. 8。圖6顯示在63°C孵育12小時后驗證集嵌合體的標準化殘留活性。在用PASC作底物、50°C、25mM醋酸鈉緩沖液pH 4. 8的2小時測定中確定CBH II酶在濃縮培養(yǎng)上清液中的殘留活性。圖7親本和嵌合體CBH II酶表達載體hp352/PGK91-l-ss的圖譜。繪出的載體包含野生型紅褐肉座菌cel6a(CBH II酶)基因。對于嵌合的和親本的CBH II酶來說,在 ss Lys-Arg Kex2位點后面的CBD/接頭氨基酸序列是ASCSSVWGQCGGQNWSGPTCCASGSTCVYSNDYYSQCLPGAASSSSSTRAASTTSRVSPTTSRSSSATP PPGSTTTRVPPVGSGTATYS(SEQ IDNO 8)。圖8顯示CBH II親本和51CBH II嵌合體的觀察到的T5tl值和預測的T5tl值。線表示線性回歸模型方程(表7中的參數(shù))。親本CBH II T5tl值被表示為正方形。圖9A-C顯示作為溫度的函數(shù)的針對微晶纖維素(Avicel)的CBH II比活性。(a) CBH II親本和嵌合體的比活性。(b)CBH II親本、C311S突變體和B7P3單區(qū)塊取代嵌合體的比活性。反應(yīng)在具有15mg/mL的微晶纖維素濃度的50mM醋酸鈉pH 4. 8中運行16小時。 (c)作為溫度的函數(shù)的針對微晶纖維素的CBH II親本、單點突變體和單區(qū)塊取代嵌合體活性(μ g/葡萄糖/mL反應(yīng))。反應(yīng)在具有15mg/mL的微晶纖維素濃度的50mM醋酸鈉pH 4. 8 中運行150分鐘。在55°C配制CBH II酵母培養(yǎng)上清液以達到粗略相等的還原糖產(chǎn)物濃度。 呈現(xiàn)的數(shù)據(jù)是兩個獨立重復的平均值,其中誤差棒指示每個溫度點的雙份活性值。

圖10顯示來自親本1特異腐質(zhì)霉和親本3嗜熱毛殼菌的區(qū)塊7的ClustalW多重序列比對。箭頭表示在回復突變體中改變的殘基。圖11顯示21111331嵌合體點突變體的T5tl值。值顯示為兩個獨立重復的平均值, 誤差棒指示每個點突變體的雙份T5tl值。在50mM醋酸鈉緩沖液PH 4. 8中、在所測試的溫度下進行10分鐘失活。通過在50°C在以上緩沖液中與lg/L磷酸膨脹纖維素(PASC)孵育 100分鐘來確定殘留活性。圖12顯示特異腐質(zhì)霉和紅褐肉座菌的親本CBH II、Ser單點突變體和B7P3區(qū)塊取代嵌合體的T5tl值,值顯示為三個獨立重復的平均值,誤差棒指示每個CBH II的一倍標準偏差。在50mM醋酸鈉緩沖液pH 4. 8中、在所測試的溫度下進行10分鐘失活。通過在50°C 在以上緩沖液中與lg/L磷酸膨脹纖維素(PASC)孵育100分鐘來確定殘留活性。圖13顯示CBH II嵌合體31311112、13231111和來自黃孢原毛平革菌且從釀酒酵母異源分泌的野生型CBH II催化結(jié)構(gòu)域(融合至紅褐肉座菌CBM)的T5tl值。值顯示為兩個獨立的重復,其中誤差棒指示每個試驗的值。在50mM醋酸鈉緩沖液pH 4. 8中、在所測試的溫度下進行10分鐘失活。通過在50°C在以上緩沖液中與lg/L磷酸膨脹纖維素(PASC) 孵育100分鐘來確定殘留活性。圖14A-D顯示CBH II重組區(qū)塊界面。(a)其中可能存在新穎的非親本殘基對 (連接球)的區(qū)塊間位點通常被表面暴露,潛在地容許溶劑篩選相互作用。(b)實例界面 (B5-B6)圖解了主鏈(對齊的紅褐肉座菌和特異腐質(zhì)霉的漫畫)的保守、在表面上的可變殘基以及在殘基173和殘基253(箭頭)的新穎的埋藏的疏水對的比較稀少的可能性。(c) 雖然在B3部分(黃色)中觀察到與底物結(jié)合有關(guān)的移動(箭頭),來自紅褐肉座菌的區(qū)塊 1-4(黑色漫畫)匹配同源的特異腐質(zhì)霉區(qū)塊(顏色標記的漫畫)而沒有大的偏差。(d)同源的區(qū)塊5-8也是相似的,但在B6、B7接合處的indel (箭頭)將需要構(gòu)象改變。圖15顯示了 C314S突變的結(jié)構(gòu)分析及其穩(wěn)定作用。(a)向高分辨率特異腐質(zhì)霉結(jié)構(gòu)(Iocn)的氫位添加 REDUCE. 1 (b)在 PyMOL(http: (//)www. pymol. org)中對模擬的絲氨酸結(jié)構(gòu)的重構(gòu)幾何學建模。在SHARPEN2建模平臺中的側(cè)鏈優(yōu)化(用所有原子Rosetta能量函數(shù))還表明,Cys314和kr314將貢獻出氫鍵給ftx)339的羰基,并接受來自Gly316的酰胺的氫鍵。絲氨酸優(yōu)異的氫鍵合能力可能在包含絲氨酸的變體的更大穩(wěn)定性中起作用。另一種可能的解釋是幾何互補性。具體地說,Iocn的Cys位顯示構(gòu)象應(yīng)力(conformational strain)的證據(jù),因為側(cè)鏈被顯著彎曲(S卩,N-C-C α-C β的非正常二面角(improper dihedral angle)是距標準位置6° ),增加了距離Pro羰基的距離。圖中前面沒有字母的數(shù)字表示氫鍵距離(A )。詳述如在此處和在所附權(quán)利要求書中所用的那樣,除非上下文另外清楚地指明,否則單數(shù)形式“一種”、“一個”和“該”包括多個指稱。因此,例如,提及“結(jié)構(gòu)域”包括多個這樣的結(jié)構(gòu)域,提及“蛋白,,包括提及一種或更多種蛋白,等等。同樣,除非另外聲明,“或”表示“和/或”。類似地,“包含(comprise)”、“包含 (comprises) ”、“包含(comprising),,、“包括(include) ”、“包括(includes)” 和“包括 (including)”是可互換的并且不旨在限制。還應(yīng)理解,在各實施方案的描述使用術(shù)語“包含”時,本領(lǐng)域技術(shù)人員將理解在一些具體情況下,實施方案能夠可替代地使用語言“基本上由...組成”或“由...組成”描述。盡管在本公開的方法和組合物的實施中可使用與本文所述的方法和材料相似或等同的方法和材料,但在此處描述了示例性方法、裝置和材料。除非另外定義,否則本文所用的所有技術(shù)術(shù)語和科學術(shù)語具有與本公開所屬技術(shù)領(lǐng)域的普通技術(shù)人員所通常理解的相同的含義。因此,如本申請通篇所使用的,以下術(shù)語應(yīng)具有以下含義。最近的研究已證明在實驗室規(guī)模的生物質(zhì)轉(zhuǎn)化工程中來自嗜熱真菌的纖維素酶相對于嗜溫真菌的纖維素酶的優(yōu)異表現(xiàn),在實驗室規(guī)模的生物質(zhì)轉(zhuǎn)化工程中增強的穩(wěn)定性導致在適中的溫度和高溫下在更長的時間段內(nèi)保留活性。真菌纖維素酶是有吸引力的,因為它們具有高度活性并且能夠以高達40g/L的水平表達在真菌宿主如紅褐肉座菌(無性型里氏木霉(Trichoderma reesei))的上清液中。不幸地,證明的熱穩(wěn)定的真菌纖維素酶集很小。在進行性(processive)纖維二糖水解酶II類(CBH II)酶的情況下,在CAZy數(shù)據(jù)庫中注釋了少于10種天然的熱穩(wěn)定基因序列。如在此更完整地描述的,使用遞歸的嵌合多肽的產(chǎn)生和分析鑒定了具有賦予的熱穩(wěn)定性和改進的活性的特別穩(wěn)定的結(jié)構(gòu)域和最終的具體氨基酸。如在以下更詳細地描述的,本發(fā)明至少部分地基于催化纖維素水解的新穎的酶的產(chǎn)生和表達。在一個實施方案中,提供了已被工程化以便在增加的溫度下水解纖維素的新穎的多肽。這些多肽包括已被改變而在指定的殘基處包括氨基酸取代的纖維二糖水解酶變體。盡管這些變體將在以下更詳細地描述,應(yīng)理解本公開的多肽可包含一個或更多個修飾的氨基酸。存在修飾的氨基酸可能在例如以下方面是有利的(a)提高多肽的半衰期,(b) 熱穩(wěn)定性,以及(c)增加的底物轉(zhuǎn)換。氨基酸在重組生產(chǎn)期間被例如共翻譯地或翻譯后地修飾(例如,在哺乳動物細胞中表達期間在N-X-S/T基序處的N連接的糖基化)或者通過合成手段修飾。因此,“突變的”、“變異的”或“修飾的”蛋白、酶、多核苷酸、基因或細胞表示已從親本的蛋白、酶、多核苷酸、基因或細胞改變或衍生、或以某種方式不同或變化的蛋白、 酶、多核苷酸、基因或細胞。突變的或修飾的蛋白或酶通常但不一定由突變的多核苷酸或基因表達?!巴蛔儭北硎緦е峦蛔兊牡鞍住⒚?、多核苷酸、基因或細胞的任何過程或機制。這包括其中蛋白、酶、多核苷酸或基因序列被改變的任何突變以及從這種突變產(chǎn)生的細胞的任何可檢出的改變。通常,突變通過一個或多個核苷酸殘基的點突變、缺失或添加而發(fā)生在多核苷酸或基因序列中。突變包括在基因的蛋白編碼區(qū)內(nèi)出現(xiàn)的多核苷酸變化以及在蛋白編碼序列之外的區(qū)域中的變化,所述蛋白編碼序列之外的區(qū)域包括但不限于調(diào)節(jié)序列或啟動子序列?;蛑械耐蛔兛梢允恰俺聊摹保?,在表達后不反映在氨基酸變化中,產(chǎn)生該基因的“序列保守性”變體。這一般在一個氨基酸對應(yīng)于多于一個密碼子時發(fā)生。修飾的氨基酸的非限制性實例包括糖基化的氨基酸、硫酸化的氨基酸、異戊二烯基化的(法尼基化的、香葉基香葉基化的)氨基酸、乙?;陌被?、?;陌被?、聚乙二醇化的氨基酸、生物素?;陌被?、羧基化的氨基酸、磷酸化的氨基酸等等。在氨基酸修飾上足以指導本領(lǐng)域技術(shù)人員的參考文獻在本文中是充足的。實例方案見于Walker (1998) Protein Protocols on CD-ROM(光盤上的蛋白質(zhì)實驗方案)(Humana Press, Towata, N. J.)。本文描述了用于產(chǎn)生和分離本公開內(nèi)容的修飾的纖維二糖水解酶多肽的重組方法。除了重組產(chǎn)生之外,該多肽可通過使用固相技術(shù)的直接肽合成來產(chǎn)生(例如, Mewart 等人(I969)Solid-Phase Peptide Synthesis (固相肽合成)(WH Freeman Co, San Francisco);和 Merrifield(196 J. Am. Chem. Soc. 85 :2149-2154)。肽合成可通過利用人工技術(shù)或通過自動化來進行。自動化合成可例如利用Applied Biosystems 431A肽合成器 (Perkin Elmer, Foster City, Calif.)根據(jù)制造商提供的說明來實現(xiàn)?!袄w維二糖水解酶II”或“CBH II酶”表示廣泛分布于細菌和真菌的纖維素酶家族 6蛋白中的一種酶。這種酶參與纖維素的水解。所謂“纖維素酶活性”表示能夠水解纖維素的酶。纖維素酶是指由真菌、細菌和原生動物產(chǎn)生的催化纖維素的水解的一類酶。然而,還存在由其他類型生物如植物和動物產(chǎn)生的纖維素酶。這組酶的EC編號是EC 3.2. 1.4?;诖呋姆磻?yīng)類型,存在五種一般的纖維素酶類型內(nèi)切纖維素酶(endo-cellulase);外切纖維素酶(exo-cellulase),在這個類別中存在兩種主要的外切纖維素酶類型(或纖維二糖水解酶,縮寫CBH)- —種類型從纖維素的還原端漸進地起作用,并且一種類型從纖維素的非還原端漸進地起作用;纖維二糖酶或β-葡糖苷酶水解酶;氧化性纖維素酶;以及利用磷酸代替水來解聚纖維素的纖維素磷酸化酶。大多數(shù)真菌纖維素酶具有兩個結(jié)構(gòu)域由柔性接頭連接的催化結(jié)構(gòu)域和纖維素結(jié)合結(jié)構(gòu)域。在本公開的具體實施方案中,纖維素酶活性是CBH活性。在一些情況下,本文所述的序列包括纖維素結(jié)合結(jié)構(gòu)域和催化結(jié)構(gòu)域二者,或只包括催化結(jié)構(gòu)域。在只提供催化結(jié)構(gòu)域序列的這種情況下,應(yīng)認識到,纖維素結(jié)合結(jié)構(gòu)域(CBD)如在SEQ ID NO :8中提供的纖維素結(jié)合結(jié)構(gòu)域可以直接地或通過接頭與催化結(jié)構(gòu)域功能性相連(作為編碼序列的一部分或在后面融合)。“蛋白”或“多肽”這些術(shù)語在本文可互換地使用,包括由被稱為肽鍵的化學鍵連接在一起的稱為氨基酸的化學結(jié)構(gòu)單元的一個或多個鏈。“酶”表示催化或促進(具體地或多或少)一種或多種化學反應(yīng)或生物化學反應(yīng)的任何物質(zhì),優(yōu)選全部或大部分由蛋白組成。 “天然”或“野生型”蛋白、酶、多核苷酸、基因或細胞表示在自然界中出現(xiàn)的蛋白、酶、多核苷酸、基因或細胞?!鞍被嵝蛄小笔前被岬木酆衔?蛋白、多肽等等)或代表氨基酸聚合物的字符串,這取決于上下文。術(shù)語“蛋白”、“多肽”和“肽1本文可互換地使用?!鞍被帷笔蔷哂腥缦陆Y(jié)構(gòu)的分子其中中心碳原子與氫原子、羧酸基團(其碳原子在此稱為“羧基碳原子”)、 氨基基團(其氮原子在此稱為“氨基氮原子”)和側(cè)鏈基團R相連。當加入到肽、多肽或蛋白中時,在連接一個氨基酸與另一個氨基酸的脫水反應(yīng)中氨基酸失去其氨基酸羧基的一個或多個原子。結(jié)果,當加入到蛋白中時,氨基酸被稱為“氨基酸殘基”。給定蛋白的具體氨基酸序列(即,當從氨基端到羧基端書寫時為多肽的“一級結(jié)構(gòu)”)由mRNA的編碼部分的核苷酸序列決定,mRNA進而由遺傳信息指定,所述遺傳信息通常為基因組DNA (包括細胞器DNA,例如線粒體DNA或葉綠體DNA)。因此,確定基因的序列幫助預測對應(yīng)的多肽的一級序列和更特別的是預測由該基因或多核苷酸序列編碼的多肽或蛋白的作用或活性。特定序列的“保守的氨基酸取代”或簡單地說“保守變化”是指一個氨基酸或一系列氨基酸由基本上相同的氨基酸序列替換。本領(lǐng)域技術(shù)人員將認識到,改變、添加或缺失單個氨基酸或在編碼的序列中的氨基酸百分比的單個取代、缺失或添加導致“保守變化”,其中該變化導致氨基酸的缺失、氨基酸的添加或氨基酸被化學上相似的氨基酸取代。提供功能上相似的氨基酸的保守取代表是本領(lǐng)域公知的。例如,一個保守取代組包括丙氨酸(A)、絲氨酸( 和蘇氨酸(T)。另一個保守取代組包括天冬氨酸(D)和谷氨酸 (E)。另一個保守取代組包括天冬酰胺(N)和谷氨酰胺⑴)。又另一個保守取代組包括精氨酸(R)和賴氨酸(K)。另一個保守取代組包括異亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)和纈氨酸(V)。另一個保守取代組包括苯丙氨酸(F)、酪氨酸(Y)和色氨酸(W)。因此,列出的多肽序列(例如,SEQ ID NO :2、4、6和SEQ ID NO 12-78)的“保守氨基酸取代”包括該多肽序列的氨基酸百分比(通常小于10% )被保守選擇的同一保守取代組的氨基酸取代。因此,本公開內(nèi)容的多肽的保守取代的變化可包含100、75、50、25或10 個同一保守取代組的保守取代的變化的取代。應(yīng)理解不改變核酸分子的編碼活性的序列的添加,如非功能序列或非編碼序列的添加是基本核酸的保守變化。酶的“活性”是其催化反應(yīng)即“起作用”的能力的量度,并且可表示為產(chǎn)生反應(yīng)產(chǎn)物的速率。例如,酶活性可被表示為每單位時間或每單位酶產(chǎn)生的產(chǎn)物的量(例如,濃度或重量),或者以親和力或解離常數(shù)表示。在本文可互換使用的“纖維二糖水解酶活性或纖維素酶活性”、“纖維二糖水解酶或纖維素酶的生物活性”或“纖維二糖水解酶或纖維素酶的功能活性”是指由根據(jù)標準技術(shù)在體內(nèi)或體外確定的,對纖維素底物具有纖維素酶活性以及在特定實施方案中具有纖維二糖水解酶活性的蛋白、多肽所發(fā)揮的活性。本領(lǐng)域技術(shù)人員將理解,公開的核酸構(gòu)建體的許多保守變化產(chǎn)生功能上相同的構(gòu)建體。例如,如以上所討論的,由于遺傳密碼的簡并性,“沉默取代”(即,不導致編碼多肽的變化的核酸序列中的取代)是編碼氨基酸的每個核酸序列的暗含的特征。類似地,在氨基酸序列中一個或若干個氨基酸的“保守氨基酸取代”被具有高度相似特性的不同氨基酸取代,也容易被鑒定為與公開的構(gòu)建體高度相似。每條公開序列的這種保守變化是本文提供的多肽的特征?!氨J刈凅w”是如下蛋白或酶其中給定氨基酸殘基已被改變但沒有改變該蛋白或酶的總體構(gòu)象和功能,包括但不限于,氨基酸被具有相似特性的氨基酸替換,所述相似特性包括極性或非極性特征、大小、形狀和電荷。除了表明為保守的氨基酸之外的氨基酸可能在蛋白或酶中不同,以使得在具有相似功能的任何兩種蛋白之間的蛋白或氨基酸序列相似性百分比可以改變,并且可以是,例如,至少30 %、至少50 %、至少70 %、至少80 %或至少 90%,如根據(jù)比對方案所確定的。如本文提及的“序列相似性”表示核苷酸序列或蛋白序列相關(guān)的程度。兩條序列之間的相似性程度可基于序列同一性百分比和/或序列保守性百分比?!靶蛄型恍浴北疚谋硎緝蓚€核苷酸序列或氨基酸序列不變的程度?!靶蛄斜葘Α北硎境鲇谠u定相似性程度的目的,將兩條或更多條序列對齊以達到最大的同一性水平(并且在氨基酸序列的情況下,為保守性水平)的方法。許多用于比對序列和評定相似性/同一性的方法是本領(lǐng)域已知的,諸如,例如,其中相似性是基于MEGALIGN算法的Cluster方法,以及 BLASTN、BLASTP 和 FASTA(Lipman 和 Pearson,1985 ;Pearson 和 Lipman,1988)。當使用所有這些程序時,優(yōu)選的設(shè)置是那些導致最高的序列相似性的設(shè)置。特定多肽的非保守修飾是取代不被表征為保守取代的任何氨基酸的修飾。例如, 跨越六個組的界限的任何取代在以上列出。這些取代包括堿性氨基酸或酸性氨基酸取代中性氨基酸(例如,Asp、Glu、Asn或Gln取代Val、lie、Leu或Met),芳香族氨基酸取代堿性氨基酸或酸性氨基酸(例如,Phe, Tyr或Trp取代Asp、Asn, Glu或Gln),或者不用同類的氨基酸替換氨基酸的任何其他取代。堿性側(cè)鏈包括賴氨酸(K)、精氨酸00、組氨酸(H);酸性側(cè)鏈包括天冬氨酸(D)、谷氨酸(E);不帶電的極性側(cè)鏈包括甘氨酸(G)、天冬酰胺(N)、 谷氨酰胺⑴)、絲氨酸(S)、蘇氨酸(T)、酪氨酸(Y)、半胱氨酸(C);非極性側(cè)鏈包括丙氨酸 (A)、纈氨酸(V)、亮氨酸(L)、異亮氨酸(I)、脯氨酸(P)、苯丙氨酸(F)、甲硫氨酸(M)、色氨酸(W) 分支的側(cè)鏈包括蘇氨酸(T)、纈氨酸(V)、異亮氨酸(I);芳香族側(cè)鏈包括酪氨酸 (Y)、苯丙氨酸(F)、色氨酸(W)、組氨酸(H)?!坝H本”蛋白、酶、多核苷酸、基因或細胞是使用任何方法、工具或技術(shù)從其獲取或制備任何其他蛋白、酶、多核苷酸、基因或細胞的任何蛋白、酶、多核苷酸、基因或細胞,而不論該親本本身是天然的還是突變的。親本多核苷酸或基因編碼親本蛋白或酶。除了提供CBH II多肽的變體以外,還提供了包含以下結(jié)構(gòu)域的嵌合多肽1)分離自第一親本鏈并且被修飾以包含氨基酸取代的變異結(jié)構(gòu)域;以及2)分離自第二親本鏈的未被修飾或被修飾以包括新活性或補充該結(jié)構(gòu)域的活性的結(jié)構(gòu)域。本文還公開了用于將本公開內(nèi)容的嵌合多肽工程化的方法。本公開內(nèi)容提供了相比于野生型蛋白或親本蛋白具有增加的熱穩(wěn)定性的纖維素酶和纖維二糖水解酶(CBH)II變體、突變體和嵌合體,其中所述野生型蛋白由SEQ ID NO 2、4或6組成。該變體在包含其中X是C、A或G的序列GE)(DG (SEQ ID NO 107)的基序的 C端區(qū)域中包含絲氨酸,其中X被絲氨酸取代,該變體包含纖維素酶活性并且其中該多肽與在序列GEXDG(SEQ ID NO 107)中缺乏絲氨酸的野生型纖維素酶相比具有增加的熱穩(wěn)定性。 在一個實施方案中,該變體在見于大多數(shù)纖維素酶和纖維二糖水解酶II蛋白(如以下更完整的描述的)的基序GE⑶G(見,例如,SEQ ID NO :2的氨基酸312-316)中包含至少一個 Cys — Ser突變,并且可包含改進熱穩(wěn)定性或活性的另外的突變。纖維素酶之間的同一性可能相當?shù)?。如以上所述的絲氨酸取代可適用于具有SEQ ID NO :107的基序的任何纖維素酶 (例如,其中該多肽具有與SEQ ID NO 2或SEQ ID NO 4的至少60%或更大的同一性)。例如,本公開內(nèi)容提供了具有增加的熱穩(wěn)定性和纖維素酶活性的多肽,該多肽包含的序列是包含C314S的至少85%、90%、95%、98%、99%相同的SEQ ID NO :2 ;是包含 C311S的至少85%、90%、95%、98%、99%相同的SEQ ID NO :4 ;是包含 C310S 的至少 85%、 90%、95%、98%、99%相同的 SEQ ID NO :12 ;是包含 C312S 的至少 85%、90%、95%、98%、 99%相同的 SEQ ID NO :13 ;是包含 C314S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID N0:14;是包含C315S的至少85%、90%、95%、98%、99%相同的SEQ ID N0:15;是包含 C313S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO :16 ;是包含 C311S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO :17 ;是包含 C313S 的至少 85%、90%、95%、 98%、99%相同的 SEQ ID NO :19 ;是包含 C312S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO :21 ;是包含 C311S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO :22 ;是包含C400S的至少85%、90%、95%、98%、99%相同的SEQ ID NO :64 ;是包含C407S的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO :65 ;是包含 C394S 的至少 85%、90%、95%、 98%、99%相同的 SEQ ID NO :66 ;是包含 C400S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO :67 ;是包含 C400S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO :68 ;是包含C400S的至少85%、90%、95%、98%、99%相同的SEQ ID NO :69 ;是包含C400S的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO :70 ;是包含 C400S 的至少 85%、90%、95%、 98%、99%相同的 SEQ ID NO :71 ;是包含 C400S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID N0:72;是包含C400S的至少85%、90%、95%、98%、99%相同的SEQ ID NO :73 ;是包含C400S的至少85%、90%、95%、98%、99%相同的SEQ ID NO :74 ;是包含C400S的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO :75 ;是包含 C407S 的至少 85%、90%、95%、 98%、99%相同的 SEQ ID NO :76 ;是包含 C394S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID N0:77;或是包含C412S的至少85%、90%、95%、98%、99%相同的SEQ ID NO 78 ; 其中前述多肽具有纖維素酶活性和與其對應(yīng)的缺乏Cys — Ser突變的親本(野生型)蛋白相比改進的熱穩(wěn)定性。又在另一個實施方案中,本公開內(nèi)容提供了如以上所述的多肽,然而,它們還包含至少一個可通過與SEQ ID NO :64比對而確定的添加突變,其中SEQ ID NO :64在413位包含 ftx),或在231位包含Ser或Thr,或在305位包含Ser或Thr,或在410位包含Gln或Asn, 或在82位包含Glu,或包含前述的任意組合。類似的取代可通過SEQ ID NO :64的氨基酸序列與SEQ ID NO :2、4、6、SEQ ID NO 12-63以及SEQ ID NO :65-78的氨基酸序列的序列比對來確定。本公開內(nèi)容還提供了重組產(chǎn)生、合成制備或以其他方式非天然產(chǎn)生的基本上純化的多肽,其中該多肽包括除了在其中存在C — S取代的以下鑒定的位置之外具有1-10個、 10-20個或20-30個保守氨基酸取代的以下列出的序列包含C314S 的 SEQ ID NO 2 ;包含C311S 的 SEQ ID NO 4 ;[0066 [0067 [0068 [0069 [0070 [0071 [0072 [0073 [0074 [0075 [0076 [0077 [0078 [0079 [0080 [0081 [0082 [0083 [0084 [0085 [0086 [0087 [0088 [0089 [0090多肽.
包含C310S 包含C312S 包含C314S 包含C315S 包含C313S 包含C311S 包含C313S 包含C312S 包含C311S 包含C400S 包含C407S 包含C394S 包含C400S 包含C400S 包含C400S 包含C400S 包含C400S 包含C400S 包含C400S 包含C400S 包含C400S 包含C407S 包含C394S 包含C412S
的的 的的 的的 的的 的的 的的 的的 的的 的的 的的 的的 的的
SEQ SEQ SEQ SEQ SEQ SEQ SEQ SEQ SEQ SEQ SEQ SEQ SEQ SEQ SEQ SEQ SEQ SEQ SEQ SEQ SEQ SEQ SEQ SEQ
ID ID ID ID ID ID ID ID ID ID ID ID ID ID ID ID ID ID ID ID ID ID ID ID
NO NO NO NO NO NO NO NO NO NO NO NO NO NO NO NO NO NO NO NO NO NO NO NO
12
13
14
15
16 17 19 21 22 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78,

“分離的多肽”是指與其天然伴隨的其他污染物例如蛋白、脂質(zhì)和多核苷酸分離的該術(shù)語包括已自其天然存在環(huán)境或表達系統(tǒng)(例如,宿主細胞或體外合成)中移出或純化的多肽?!盎旧霞兊亩嚯摹笔侵溉缦陆M合物在其中多肽物類是存在的優(yōu)勢物類(即,在摩爾基礎(chǔ)或重量基礎(chǔ)上它比該組合物中的任何其他個體大分子物類更豐富),并且當目標物類構(gòu)成存在的大分子物類的按摩爾或重量%計至少約50%時一般是基本上純化的組合物。一般而言,基本上純的多肽組合物將構(gòu)成該組合物中所存在的所有大分子物類的按摩爾或重量%計的約60%或更多、約70%或更多、約80%或更多、約90%或更多、約95%或更多以及約98%或更多。在一些實施方案中,將目標物類純化至基本的均一性(即,通過常規(guī)檢測方法不能在組合物中檢測出污染物類),其中組合物基本上由單一大分子物類組成。 溶劑物類、小分子(< 500道爾頓)、以及元素離子物類不被認為是大分子物類?!皡⒖夹蛄小笔侵赣米餍蛄斜容^的基礎(chǔ)的限定序列。參考序列可以是較大序列的子部分(subset),例如,全長基因或多肽序列的區(qū)段。一般而言,參考序列長度可為至少20 個核苷酸或氨基酸殘基,至少25個核苷酸或殘基,至少50個核苷酸或殘基,或核酸或多肽的全長。因為兩個多核苷酸或多肽可以各自(1)包括在這兩條序列之間相似的序列(即完
15整序列的一部分),以及⑵還可以包括在這兩條序列之間相異的序列,所以在兩條(或多條)多核苷酸或多肽之間的序列比較通常是通過在“比較窗口”比較這兩條多核苷酸或多肽的序列而進行的,以識別和比較局部區(qū)域的序列相似性?!靶蛄型恍浴北硎驹诒容^窗口上兩條氨基酸序列基本上相同(即,在逐個氨基酸的基礎(chǔ)上)。術(shù)語“序列相似性”是指共有相同的生物物理特點的相似氨基酸。術(shù)語“序列同一性百分比”或“序列相似性百分比”是通過如下方式計算的在比較窗口比較兩條最佳比對的序列,確定相同的殘基(或相似的殘基)在兩條多肽序列中都存在的位置的數(shù)目以得出匹配的位置的數(shù)目,用匹配的位置的數(shù)目除以比較窗口中的位置的總數(shù)目(即,窗口大小),并且將結(jié)果乘以100得出序列同一性百分比(或序列相似性百分比)。關(guān)于多核苷酸序列,這些術(shù)語序列同一性和序列相似性具有對于蛋白質(zhì)序列所述的類似的含義,其中術(shù)語“序列同一性的百分比”指示在比較窗口上兩條多核苷酸序列是相同的(在逐個核苷酸的基礎(chǔ)上)。這樣,還可以計算多核苷酸序列同一性的百分比(或多核苷酸序列相似性的百分比,例如,對于沉默取代或其他取代來說的,基于分析算法的)。最大對應(yīng)可通過使用本文所述的序列算法之一(或本領(lǐng)域普通技術(shù)人員可用的其他算法)或通過視覺檢查來確定。當應(yīng)用于多肽時,術(shù)語基本的同一性或基本的相似性表示兩條多肽序列當例如通過使用缺省空位權(quán)重(default gap weight)的程序BLAST、GAP或BESTFIT或通過視覺檢查進行最優(yōu)比對時共有序列同一性或序列相似性。類似地,在應(yīng)用于兩條核酸的語境時,術(shù)語基本的同一性或基本的相似性表示這兩條核酸序列當例如通過使用缺省空位權(quán)重(如本文其他地方描述的)的程序BLAST、GAP或BESTFIT或通過視覺檢查進行最優(yōu)比對時共有序列同一性或序列相似性。適于確定序列同一性百分比或序列相似性百分比的算法的一個實例是FASTA算法,它描述于 Pearson,W. R.&Lipman,D.J.,(1988) Proc. Natl. Acad. Sci. USA 85:2444。還參見 W. R. Pearson,(1996)Methods Enzymology266 :227_258。在計算同一性百分比或相似性百分比的DNA序列的FASTA比對中使用的優(yōu)選的參數(shù)被優(yōu)化,BL50 Matrix 15 :_5, k-tuple = 2 ;連接罰分(joining penalty) = 40,最優(yōu)=28 ;空位罰分-12,空位長度罰分 =-2 ;以及寬度=16。有用的算法的另一個實例是PILEUP。PILEUP利用漸進的配對比對從一組相關(guān)序列中創(chuàng)建多序列比對來顯示關(guān)系和序列同一性百分比或序列相似性百分比。它還繪制樹圖或系統(tǒng)樹圖,顯示用于創(chuàng)建比對的聚類關(guān)系。PILEUP利用Feng&Doolittle,(1987) J. Mol. Evo 1. 35 =351-360的漸進比對方法的簡化形式。所用的方法與Higgins&Siarp,CABIOS 5 151-153,1989所述的方法類似。該程序可比對高達300條序列,各具有5,000個核苷酸或氨基酸的最大長度。多重比對步驟開始于兩條最相似序列的配對比對,產(chǎn)生兩條比對序列的簇。然后這種簇與下一個最相近的序列或比對的序列的簇進行比對。通過兩個個體序列的配對比對的簡單延伸對序列的兩個簇進行比對。通過一系列漸進的配對比對實現(xiàn)最終的比對。通過指定具體的序列及其序列比對區(qū)域的氨基酸或核苷酸坐標和通過指定程序參數(shù)來運行該程序。使用PILEUP,利用以下參數(shù)將參考序列與其他測試序列進行比較來確定序列同一性百分比(或序列相似性百分比)關(guān)系缺省空位權(quán)重(3. 00)、缺省空位長度權(quán)重 (0. 10)以及權(quán)重端空位(weighted end gap)。PILEUP可以從GCG序列分析軟件包例如7. 0版本獲得(Devereaux 等人,(1984) Nuc. Acids Res. 12 :387-395)。適于多重DNA和氨基酸序列比對的算法的另一個實例是CLUSTALW程序 (Thompson,J. D.等人,(1994) Nuc. Acids Res. 22 :4673-4680)。CLUSTALW 在序列組之間進行多重配對比較并且基于序列同一性將它們裝配成多重比對??瘴粠苑帕P分(Gap open penalty)和空位擴展罰分(Gap extension penalty)分別是10和0· 05。對于氨基酸比對來說,BLOSUM算法可用作蛋白權(quán)重矩陣(protein weight matrix) (Henikoff 和 Henikoff, (1992) Proc. Natl. Acad. Sci. USA 89 :10915-10919)。如以上所提到的,可通過序列比對和在基序GE⑶G(見,例如,SEQID NO 2的氨基酸312-316)進行的取代來鑒定纖維二糖水解酶和纖維素酶家族成員。然后可如下所述在不同的溫度和條件下對修飾的多肽的活性進行測定來鑒定引入有利活性的那些修飾。示例性序列可見于以下GenBmk登錄號,它們的序列通過引用并入本文。
權(quán)利要求
1.一種重組多肽,所述重組多肽在C端區(qū)域中在包含其中X是C、A或G的序列 GEXDG(SEQ ID NO 107)的基序中包含絲氨酸,其中X被絲氨酸取代,其中所述變體包含纖維素酶活性并且其中所述多肽與在序列GE)(DG (SEQ ID NO 107)中缺乏絲氨酸的野生型纖維素酶相比具有增加的熱穩(wěn)定性。
2.如權(quán)利要求1所述的重組多肽,其中所述多肽包含如下序列所述序列是包含C314S 的至少85%、90%、95%、98%、99%相同的SEQ ID NO :2 ;是包含 C311S 的至少 85%、90%、 95%、98%、99%相同的 SEQ ID NO :4 ;是包含 C310S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID N0:12;是包含C312S的至少85%、90%、95%、98%、99%相同的SEQ ID NO: 13 ;是包含 C314S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO :14 ;是包含 C315S 的至少85%、90%、95%、98%、99%相同的 SEQ ID NO :15 ;是包含C313S 的至少85%、90%、 95%、98%、99%相同的 SEQ ID NO :16 ;是包含C311S 的至少85%、90%、95%、98%、99%相同的 SEQ ID N0:17;是包含C313S的至少85%、90%、95%、98%、99%相同的SEQ ID NO: 19 ;是包含 C312S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO :21 ;是包含 C311S 的至少85%、90%、95%、98%、99%相同的 SEQ ID NO :22 ;是包含C400S 的至少85%、90%、 95%、98%、99%相同的 SEQ ID NO :64 ;是包含C407S 的至少85%、90%、95%、98%、99%相同的 SEQ ID N0:65;是包含C394S的至少85%、90%、95%、98%、99%相同的SEQ ID NO: 66;是包含C400S的至少85%、90%、95%、98%、99%相同的SEQ ID NO :67 ;是包含 C400S 的至少85%、90%、95%、98%、99%相同的 SEQ ID NO :68 ;是包含C400S 的至少85%、90%、 95%、98%、99%相同的 SEQ ID NO :69 ;是包含C400S 的至少85%、90%、95%、98%、99%相同的 SEQ ID N0:70;是包含C400S的至少85%、90%、95%、98%、99%相同的SEQ ID NO: 71;是包含C400S的至少85%、90%、95%、98%、99%相同的SEQ ID NO :72 ;是包含 C400S 的至少85%、90%、95%、98%、99%相同的 SEQ ID NO :73 ;是包含C400S 的至少85%、90%、 95%、98%、99%相同的 SEQ ID NO :74 ;是包含 C400S 的至少 85%、90%、95%、98%、99% 相同的 SEQ ID NO :75 ;是包含 C407S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO :76 ;是包含 C394S 的至少 85%、90%、95%、98%、99%相同的 SEQ ID NO 77 ;或是包含 C412S的至少85%、90%、95%、98%、99%相同的SEQ ID NO :78 ;其中前述多肽具有纖維素酶活性和與其對應(yīng)的缺乏Cys — Ser突變的親本(野生型)蛋白相比改進的熱穩(wěn)定性。
3.—種重組多肽,所述重組多肽包含除了在其中存在C — S取代的以下已鑒定的位置之外具有1-10個、10-20個或20-30個保守氨基酸取代的以下列出的序列包含C314S的 SEQ ID NO 2 ;包含 C311S 的 SEQ IDNO 4 ;包含 C310S 的 SEQ ID NO 12 ;包含 C312S 的 SEQ ID NO 13 ;包含 C314S 的 SEQ ID NO 14 ;包含 C315S 的 SEQ ID NO 15 ;包含 C313S 的 SEQ ID NO :16 ;包含 C311S 的 SEQ ID NO :17 ;包含 C313S 的 SEQ IDNO 19 ;包含 C312S 的 SEQ ID NO 21 ;包含 C311S 的 SEQ ID NO 22 ;包含 C400S 的 SEQ ID NO 64 ;包含 C407S 的 SEQ ID NO 65 ;包含 C394S 的 SEQ ID NO 66 ;包含 C400S 的 SEQ ID NO 67 ;包含 C400S 的 SEQ IDNO :68 ;包含 C400S 的 SEQ ID NO :69 ;包含 C400S 的 SEQ ID NO 70 ;包含 C400S 的 SEQ ID NO 71 ;包含 C400S 的 SEQ ID NO 72 ;包含 C400S 的 SEQ ID NO 73 ;包含 C400S 的 SEQ ID NO 74 ;包含 C400S 的 SEQ IDNO 75 ;包含 C407S 的 SEQ ID NO 76 ;包含 C394S 的 SEQ ID NO 77 或包含 C412S 的 SEQ ID NO :78。
4.如權(quán)利要求1所述的重組多肽,所述重組多肽包含選自由以下組成的組的序列(a)具有對SEQID NO :2的至少85%或更大的同一性的、在314位具有kr的多肽,并且其中所述多肽具有纖維素酶活性;(b)具有對SEQID NO :4的至少70%或更大的同一性的、在311位具有kr的多肽,并且其中所述多肽具有纖維素酶活性;(c)對選自由以下組成的組的序列具有70%或更大的同一性的多肽(i)SEQID NO 12 且在 310 位具有 kr,(ii) SEQ ID NO 13 且在 312 位具有 kr,(iii) SEQ ID NO :14 且在 314 位具有 kr,(iv)SEQ ID NO :15 且在 315 位具有 kr,(ν) SEQ ID NO :16 且在 313 位具 WSer, (vi)SEQ ID NO :17 且在 311 位具有 kr,(vii) SEQ ID NO : 19 且在 313 位具有 kr, (viii)SEQ IDNO :21 且在 312 位具有 kr,以及(ix)SEQ ID NO :22 且在 311 位具有 kr,并且其中前述多肽的每一種都具有纖維素酶活性;(d)包含來自兩個不同的親本纖維二糖水解酶多肽的至少兩個結(jié)構(gòu)域的嵌合多肽,其中所述結(jié)構(gòu)域從N端到C端包含(區(qū)段1)-(區(qū)段幻-(區(qū)段幻-(區(qū)段4)-(區(qū)段幻-(區(qū)段6)-(區(qū)段7)-(區(qū)段8);其中區(qū)段 1 包含對 SEQ ID NO :2( “1”)、SEQ ID NO 4( “2”)或 SEQ ID NO 6( “3”)的氨基酸殘基大約1到大約X1具有至少50-100%同一性的序列;區(qū)段2包含對SEQ ID NO 2(“1”)、SEQ ID NO :4( “2”)或SEQ ID N0:6(“3,,)的氨基酸殘基X1到大約&具有至少 50-100% 同一性的序列;區(qū)段 3 包含對 SEQID NO 2( “1”)、SEQ ID NO :4( “2”)或 SEQ ID N0:6(“3”)的氨基酸殘基&到大約知具有至少50-100%同一性的序列;區(qū)段4包含對 SEQ ID NO 2( “1”)、SEQ ID NO :4( “2”)或 SEQ ID NO 6( “3”)的氨基酸殘基知到大約X4具有至少50-100%同一性的序列;區(qū)段5包含對SEQ ID NO 2( “1”)、SEQID NO 4( “2”)或SEQ ID N0:6( “3”)的大約氨基酸殘基&到大約、具有至少50-100%同一性的序列;區(qū)段 6 包含對 SEQ ID NO 2( “1”)、SEQ ID NO 4( “2”)或 SEQ ID NO 6( “3”) 的氨基酸殘基X5到大約&具有至少50-100%同一性的序列;區(qū)段7包含對SEQ ID NO 2( “1”)、SEQ ID NO :4( “2”)或SEQID N0:6( “3”)的氨基酸殘基知到大約X7具有至少 50-100%同一性的序列;并且區(qū)段8包含對SEQ ID NO 2( “1”)、SEQ ID NO :4( “2”)或 SEQ ID N0:6( “3”)的氨基酸殘基X7到大約知具有至少50-100%同一性的序列;其中 X1 是 SEQ ID NO :2 的殘基 43、44、45、46 或 47,或是 SEQ ID NO :4 或 SEQ ID NO 6 的殘基 42、43、44、45 或 46 是 SEQ ID NO :2 的殘基 70、71、72、73 或 74,或是 SEQ ID N0: 4 或 SEQ ID NO :6 的殘基 68、69、70、71、72、73 或 74 ;知是 SEQ ID NO :2 的殘基 113、114、 115、116、117 或 118,或是 SEQ ID NO :4 或 SEQ ID NO :6 的殘基 110、111、112、113、114、115 或 116; 是 SEQ ID NO :2 的殘基 153、154、155、156 或 157,或是 SEQ ID NO :4 或 SEQ ID NO 6 的殘基 149、150、151、152、153、154、155 或 156 ;X5 是 SEQ ID NO 2 的殘基 220,221, 222、223 或 224,或是 SEQ ID NO :4 或 SEQ ID NO :6 的殘基 216、217、218、219、220、221、222 或 223; 是 SEQ ID NO :2 的殘基 256、257、258、259、260 或洸1,或是 SEQ ID NO :4 或 SEQ ID NO :6 的殘基253、254、255、256、257、258、259或洸0 ;X7 是SEQ ID NO :2 的殘基 312、313、 314、315 或 316,或是 SEQ ID NO :4 或 SEQ ID NO :6 的殘基 309、310、311、312、313、314、315 或318 ;并且知是對應(yīng)于具有序列SEQ ID NO :2、SEQ ID NO 4或SEQ IDNO 6的多肽的C 端的氨基酸殘基,其中所述嵌合多肽在SEQ ID NO 2的314位或在SEQ ID NO 4的311位包含kr,并且其中所述嵌合多肽具有纖維素酶活性和與包含SEQ IDNO 2, SEQ ID NO :4或SEQ ID NO: 6的CBH II多肽相比改進的熱穩(wěn)定性和/或pH穩(wěn)定性。
5.如權(quán)利要求4所述的重組多肽,其中區(qū)段1包括來自SEQID N0:2( “1”)、SEQ ID NO 4( “2”)或SEQ ID NO :6( “3”)的氨基酸殘基大約1到大約X1并具有1-10個保守氨基酸取代;區(qū)段 2 來自 SEQ ID NO 2( “1”)、SEQ IDNO :4( “2”)或 SEQ ID NO 6( “3”)的大約氨基酸殘基X1到大約&并具有大約1-10個保守氨基酸取代;區(qū)段3來自SEQ ID NO 2(“1”)、SEQ ID NO :4( “2”)或SEQ ID NO :6( “3,,)的大約氨基酸殘基&到大約知并具有大約1-10個保守氨基酸取代;區(qū)段4來自SEQ ID N0:2( “1”)、SEQ ID NO :4( “2,,) 或SEQID NO 6 (“3”)的大約氨基酸殘基&到大約&并具有大約1_10個保守氨基酸取代; 區(qū)段 5 來自 SEQ ID NO 2( “1”)、SEQ ID NO :4( “2”)或 SEQ ID NO 6( “3”)的大約氨基酸殘基A到大約、并具有大約1-10個保守氨基酸取代;區(qū)段6來自SEQ ID N0:2(“l(fā)”)、 SEQ ID NO :4( “2”)或SEQ ID NO :6 ( “3”)的大約氨基酸殘基&到大約&并具有大約 1-10 個保守氨基酸取代;區(qū)段 7 來自 SEQ ID NO :2( “1”)、SEQ ID NO :4( “2”)或 SEQ ID NO 6 (“3”)的大約氨基酸殘基&到大約X7并具有大約1-10個保守氨基酸取代;并且區(qū)段 8 來自 SEQ ID NO 2( “1”)、SEQ ID NO :4( “2”)或 SEQ ID NO 6( “3”)的大約氨基酸殘基X7到大約知并且除了在SEQ ID NO 2的314位、SEQ ID NO 4的311位或SEQ ID NO 6的313位以外具有大約1-10個保守氨基酸取代。
6.如權(quán)利要求4所述的重組多肽,其中所述嵌合多肽包含與選自由SEQID NO 12-62 和SEQ ID NO :63組成的組的序列至少80%、90%、95%、98%或99%相同的序列。
7.如權(quán)利要求1所述的重組多肽,其中所述多肽包含與SEQIDNO :79-105或SEQ ID NO 106具有至少85%同一性并且在序列SEQ IDNO :107中的X處具有絲氨酸的序列。
8.一種多核苷酸,所述多核苷酸編碼權(quán)利要求1、2、3、4或7所述的多肽。
9.一種載體,所述載體包含權(quán)利要求8所述的多核苷酸。
10.一種宿主細胞,所述宿主細胞包含權(quán)利要求8所述的多核苷酸。
11.一種宿主細胞,所述宿主細胞包含權(quán)利要求9所述的載體。
12.—種酶制備物,所述酶制備物包含權(quán)利要求1、2、3、4或7所述的多肽。
13.一種酶制備物,所述酶制備物包含由權(quán)利要求10所述的宿主細胞產(chǎn)生的多肽。
14.一種處理包含纖維素的生物質(zhì)的方法,所述方法包括使所述生物質(zhì)接觸權(quán)利要求 1、2、3、4或7所述的多肽。
15.一種處理包含纖維素的生物質(zhì)的方法,所述方法包括使所述生物質(zhì)接觸權(quán)利要求 12所述的酶制備物。
全文摘要
本公開內(nèi)容涉及CBH II嵌合體融合多肽、編碼該多肽的核酸以及用于產(chǎn)生這種多肽的宿主細胞。
文檔編號C12P19/04GK102369284SQ201080015610
公開日2012年3月7日 申請日期2010年4月6日 優(yōu)先權(quán)日2009年4月6日
發(fā)明者弗朗西斯·H·阿諾德, 皮特·海因策爾曼 申請人:加州理工學院
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
乌海市| 包头市| 通海县| 五常市| 米泉市| 石屏县| 景谷| 余干县| 府谷县| 宣恩县| 酒泉市| 政和县| 巫溪县| 顺昌县| 彩票| 陇西县| 浦江县| 郎溪县| 常宁市| 云阳县| 宁晋县| 左贡县| 蚌埠市| 义马市| 毕节市| 白城市| 菏泽市| 象州县| 洛南县| 林西县| 渝北区| 抚州市| 乐陵市| 汉沽区| 江城| 黎城县| 吴江市| 宣城市| 洛浦县| 东乡族自治县| 固原市|