專利名稱:用于從纖維素生物質(zhì)產(chǎn)生可發(fā)酵的糖的重組嗜熱子囊菌β-葡糖苷酶變體的制作方法
技術(shù)領(lǐng)域:
本發(fā)明提供了用于表達(dá)重組P -葡糖苷酶變體的組合物和方法及其在從纖維素生物質(zhì)產(chǎn)生可發(fā)酵的糖中的用途。發(fā)明背景
纖維素生物質(zhì)是用于生成糖類的重要的可再生資源。這些糖類的發(fā)酵可產(chǎn)生有商業(yè)價(jià)值的終產(chǎn)物,包括生物燃料和目前從石油獲取的化學(xué)品。雖然將單糖發(fā)酵為乙醇相對(duì)直接,但將纖維素生物質(zhì)有效轉(zhuǎn)化為可發(fā)酵的糖諸如葡萄糖是有挑戰(zhàn)的(見,例如,Ladisch等人,Enz. Microb. Technol. ,5 :82[1983])。纖維素可以用化學(xué)方法、機(jī)械方法或用其他方法進(jìn)行預(yù)處理以提高纖維素對(duì)水解的敏感性。這種預(yù)處理之后可以是使用專門打破纖維素的3 -1-4糖苷鍵的酶進(jìn)行的纖維素到纖維二糖、纖維寡糖、葡萄糖和類似物的酶促轉(zhuǎn)化。這些酶總稱為“纖維素酶”。纖維素酶被分為三個(gè)亞類的酶1,4-P-D-葡聚糖葡聚糖水解酶(“內(nèi)切葡聚糖酶”或“EG”);1,4-3-D-葡聚糖纖維二糖水解酶(“外切葡聚糖酶”、“纖維二糖水解酶”或“CBH”);和“ P -D-葡糖苷-葡糖水解酶”(“ P -葡糖苷酶”、“纖維二糖酶”或“Bgl”)。內(nèi)切葡聚糖酶隨機(jī)地攻擊內(nèi)部部分并主要攻擊纖維素的無定形區(qū)域,主要產(chǎn)生葡萄糖、纖維三糖、以及纖維二糖,纖維二糖是一種水溶性¢-1,4-連接的葡萄糖二聚體。外切葡聚糖酶通過結(jié)合葡聚糖末端并從纖維素聚合物的末端主要釋放纖維二糖單元而逐漸縮短葡聚糖分子。3-葡糖苷酶將纖維二糖分裂為兩個(gè)葡萄糖單元。用于加工纖維素生物質(zhì)的纖維素酶的有效產(chǎn)生將會(huì)降低成本并提高生物燃料和其他有商業(yè)價(jià)值的化合物的生產(chǎn)效率。發(fā)明概述本發(fā)明提供了用于表達(dá)重組P -葡糖苷酶變體的組合物和方法,及其在從纖維素生物質(zhì)產(chǎn)生可發(fā)酵的糖中的用途。在一些實(shí)施方案中,本發(fā)明提供了包括如下氨基酸序列的分離或重組的嗜熱子囊菌(T. aurantiacus) ^ -葡糖苷酶變體所述氨基酸序列與SEQ ID NO 2 (野生型嗜熱子囊菌¢-葡糖苷酶)至少約70%相同,或由在嚴(yán)格條件下與SEQ ID N0:1的精確互補(bǔ)序列(exact complement)雜交的核酸編碼,并且具有至少一種相對(duì)于SEQ ID NO :2的本文所述的氨基酸殘基取代,其中該變體具有比SEQ ID NO :2中給出的酶的酶活性更大的酶活性。在其他一些實(shí)施方案中,本發(fā)明提供了包括如下氨基酸序列的分離的P -葡糖苷酶多肽變體所述氨基酸序列與SEQ ID NO :4至少約70%相同,并且具有至少一種相對(duì)于SEQ IDNO :4的本文所述的氨基酸殘基取代,其中該變體具有比SEQ ID NO :4中給出的酶的酶活性更大的酶活性。還提供了編碼所述3 -葡糖苷酶變體的多核苷酸、包含所述多核苷酸的表達(dá)載體、以及用所述表達(dá)載體轉(zhuǎn)化的宿主細(xì)胞。本發(fā)明還提供了通過將用編碼至少一種0 -葡糖苷酶變體的至少一種多核苷酸轉(zhuǎn)化的宿主細(xì)胞在適于表達(dá)所述3-葡糖苷酶變體的條件下培養(yǎng)來產(chǎn)生至少一種¢-葡糖苷酶變體(即,多肽變體)的方法。在一些實(shí)施方案中,從培養(yǎng)基或從轉(zhuǎn)化和培養(yǎng)的細(xì)胞回收¢-葡糖苷酶變體。本發(fā)明還提供包含分離或重組的嗜熱子囊菌¢-葡糖苷酶變體的酶組合物。在一些實(shí)施方案中,酶組合物還包括至少一種另外的纖維素酶。在另外一些實(shí)施方案中,酶組合物包括至少一種另外的纖維素酶和/或至少一種另外的酶。 在一些實(shí)施方案中,本發(fā)明提供了通過使¢-葡糖苷酶變體與生物質(zhì)基質(zhì)(biomass substrate)在適于產(chǎn)生可發(fā)酵的糖的條件下接觸來將該生物質(zhì)基質(zhì)(如纖維二糖)轉(zhuǎn)化成可發(fā)酵的糖的方法。在一些實(shí)施方案中,生物質(zhì)基質(zhì)被保持在包含表達(dá)至少一種¢-葡糖苷酶變體的細(xì)胞的介質(zhì)中。在一些實(shí)施方案中,表達(dá)至少一種¢-葡糖苷酶變體的重組宿主細(xì)胞還表達(dá)至少一種其他重組纖維素酶和/或至少一種其他重組或天然的酶。在一些實(shí)施方案中,在使生物質(zhì)基質(zhì)與3 -葡糖苷酶變體或多于一種3 -葡糖苷酶變體接觸之前,任選地對(duì)該生物質(zhì)基質(zhì)進(jìn)行預(yù)處理。在一些實(shí)施方案中,本發(fā)明提供了包括如下氨基酸序列的¢-葡糖苷酶變體所述氨基酸序列具有至少一種修飾、與SEQ ID NO :2至少約70%相同或由在嚴(yán)格條件下與SEQ ID NO :1的互補(bǔ)序列雜交的核酸編碼,其中該變體具有比SEQ ID NO :2更大的酶活性。在一些實(shí)施方案中,該3 -葡糖苷酶變體在選自以下的位置包括至少一種氨基酸殘基取代A478、D203、E344、F287、H684、K100、K291、K342、K456、K54、L149、N355、N650、P739、P790、R330、S408、S86、T150、Y331、Y641、Y679 和 Y746。在一些可選的實(shí)施方案中,本發(fā)明提供了包括如下氨基酸序列的¢-葡糖苷酶變體所述氨基酸序列與SEQ ID NO :4至少約70%相同并且具有至少一種相對(duì)于SEQ IDNO 4的本文所述的氨基酸殘基的修飾,其中該變體具有比SEQ ID NO 4更大的酶活性。在一些實(shí)施方案中,該3 -葡糖苷酶變體在選自以下的位置包括至少一種氨基酸殘基取代A479、D204、E345、F288、H685、KlOU K292、K343、K457、K55、L150、Ml、N356、N651、P740、P791、R331、S409、S87、T151、Y332、Y642、Y680、和 Y747。在一些實(shí)施方案中,該 3 -葡糖苷酶變體包括選自以下的至少一種氨基酸取代T151S、Y642N、N651K、K101R、T151S、K343R、N356S、S409N、Y642N、N651K、K101R、T151S、K343R、N356S、S409N、Y642N、N651K、MIT、K55R、K101R、T151S、R331K、Y332C、K343R、N356S、S409N、Y642N、M1T、K101R、T151S、K292E、K343R、S409N、Y642N、P740S、M1T、T151S、K343R、S409N、A479V、Y642N、Y680F、L150V、T151S、K343R、S409N、K457R, Y642N、N651K、S87N、T151S、F288Y、Y642N、和 N651K。在另外一些實(shí)施方案中,該¢-葡糖苷酶變體包括選自以下的至少一種氨基取代T151S、Y642N、N651K、D204G、K292I、E345V、Y747C、H685YJPP791T。在另外一些實(shí)施方案中,編碼P _葡糖苷酶變體的多核苷酸序列包括選自tl044c、tl656a、t2052c和a2520g的至少一種堿基改變。在又另外一些實(shí)施方案中,編碼P -葡糖苷酶變體的多核苷酸序列包括選自al515g、gl65a、t651c和726c的至少一種堿基改變。在另外一些實(shí)施方案中,3 -葡糖苷酶變體包括選自取代組合(substitution set)T151S-Y642N-N651K、D204G-K292I-E345V_Y747C和H685Y-P791T 的至少一種氨基酸取代。在另外一些實(shí)施方案中,3-葡糖苷酶變體包括選自以下取代組合的至少一種氨基酸取代T151S-Y642N-N651K、K101R-T151S-K343R-N356S-S409N
-Y642N-N651K、M1T-K55R-K101R-T151S-R331K-Y332C-K343R-N356S-S409N-Y642
N、M1T-K101R-T151S-K292E-K343R-S409N-Y642N-P740S,MlT-Tl
5IS-K343R-S409N-A479V-Y642N-Y680F、 LI50V-TI5IS-K343R-S409N-K4
57R-Y642N-N651K、和 S87N-T151S-F288Y-Y642N-N651K。本發(fā)明還提供了編碼本文提供的¢-葡糖苷酶變體的多核苷酸序列。本發(fā)明還提供了包含表達(dá)至少一種¢-葡糖苷酶變體的至少一種多核苷酸序列的表達(dá)載體。本發(fā)明還 提供了包括包含表達(dá)至少一種3-葡糖苷酶變體的至少一種多核苷酸序列的表達(dá)載體的宿主細(xì)胞。本發(fā)明還提供了用于產(chǎn)生至少一種¢-葡糖苷酶變體的方法,該方法包括提供宿主細(xì)胞和包含編碼至少一種3-葡糖苷酶變體的至少一種多核苷酸序列的表達(dá)載體,將該表達(dá)載體引入該宿主細(xì)胞以產(chǎn)生被轉(zhuǎn)化的宿主細(xì)胞,并且在使得至少一種3 -葡糖苷酶變體被表達(dá)的條件下培養(yǎng)所述被轉(zhuǎn)化的宿主細(xì)胞。認(rèn)為多種宿主細(xì)胞將在本發(fā)明中具有用途。在一些實(shí)施方案中,使用一種表達(dá)載體,而在其他實(shí)施方案中使用多于一種表達(dá)載體。而且,在一些實(shí)施方案中,表達(dá)載體包含單一 3 -葡糖苷酶變體,而在其他一些實(shí)施方案中,表達(dá)載體包括多于一種3 -葡糖苷酶變體。此外,在一些實(shí)施方案中,表達(dá)載體包括編碼至少一種另外的酶的至少一種多核苷酸序列,所述至少一種另外的酶包括但不限于至少一種纖維素酶。在一些實(shí)施方案中,方法還包括分離產(chǎn)生的3 -葡糖苷酶變體的步驟。在另外一些實(shí)施方案中,方法還包括分離使用所述方法產(chǎn)生的至少一種另外的酶。本發(fā)明還提供了包含至少一種¢-葡糖苷酶變體的組合物。在一些實(shí)施方案中,組合物包括至少一種緩沖劑、表面活性劑、精練劑(scouring agent)和/或其他劑。在一些實(shí)施方案中,組合物還包括至少一種另外的酶。在一些實(shí)施方案中,所述至少一種另外的酶是纖維素酶。認(rèn)為由本發(fā)明提供的¢-葡糖苷酶變體將在眾多適合的組合物中具有用途。實(shí)際上,意圖在于本文提供的¢-葡糖苷酶變體將在多種應(yīng)用中具有用途。本發(fā)明還提供了轉(zhuǎn)化生物質(zhì)基質(zhì)以產(chǎn)生至少一種可發(fā)酵的糖的方法,該方法包括提供至少一種3 -葡糖苷酶變體和生物質(zhì)基質(zhì),并且在該至少一種3 -葡糖苷酶變體使該生物質(zhì)基質(zhì)轉(zhuǎn)化為至少一種可發(fā)酵的糖的條件下將該生物質(zhì)基質(zhì)暴露于該至少一種3 -葡糖苷酶變體。在一些實(shí)施方案中,通過3 -葡糖苷酶變體的作用從生物質(zhì)基質(zhì)產(chǎn)生的可發(fā)酵的糖是葡萄糖。在另外一些實(shí)施方案中,產(chǎn)生葡萄糖以外的糖。在其他一些實(shí)施方案中,產(chǎn)生糖的混合物。在一些實(shí)施方案中,產(chǎn)生包括葡萄糖的糖的混合物。在其他一些實(shí)施方案中,產(chǎn)生包含除葡萄糖之外的糖的混合物的組合。在另外一些實(shí)施方案中,在將生物質(zhì)基質(zhì)暴露于至少一種3 -葡糖苷酶變體之前,對(duì)生物質(zhì)基質(zhì)進(jìn)行預(yù)處理。附圖
簡(jiǎn)述圖I提供了顯示使用補(bǔ)充P -葡糖苷酶的C. Iucknowense (Cl)發(fā)酵培養(yǎng)液從AV1CEL 纖維素產(chǎn)生葡萄糖的圖。在該圖中,“Cl”和“TaB6”分別代表來自Cl-真菌發(fā)酵培養(yǎng)液和嗜熱子囊菌Bgll衍生變體TaB6的樣品。反應(yīng)條件是65°C,pH 5,200g/LAVlCELf)纖維素,100g/L木糖。添加的¢-葡糖苷酶的量是基于克干重粉末,而不是活性¢-葡糖苷酶的量。發(fā)明描述
本發(fā)明提供了用于表達(dá)重組P -葡糖苷酶變體的組合物和方法,及其在從纖維素生物質(zhì)產(chǎn)生可發(fā)酵的糖中的用途。定義提供以下定義來幫助讀者。除非另外定義,否則領(lǐng)域內(nèi)的所有技術(shù)、科學(xué)和其他術(shù)語(yǔ)均旨在具有分子生物學(xué)領(lǐng)域、發(fā)酵領(lǐng)域、微生物學(xué)領(lǐng)域和相關(guān)領(lǐng)域的技術(shù)人員所通常理解的含義。在一些情況下,具有通常理解含義的術(shù)語(yǔ)為了清晰和/或?yàn)榱爽F(xiàn)成參考而在此定義,并且在此包含此類定義不應(yīng)一定被認(rèn)作代表與相關(guān)領(lǐng)域一般理解的術(shù)語(yǔ)定義相比有實(shí)質(zhì)差異。本文提到的所有專利和出版物,包括在這些專利和出版物中公開的所有序列均通過引用明確地并入本文。除非另外指明,否則本發(fā)明的實(shí)施涉及在分子生物學(xué)領(lǐng)域、發(fā)酵領(lǐng)域、微生物學(xué)領(lǐng)域和相關(guān)領(lǐng)域中通常使用的常規(guī)技術(shù),這些技術(shù)是所屬領(lǐng)域普通技術(shù)人員 已知的。盡管在本發(fā)明的實(shí)施或試驗(yàn)中可使用與本文所述的方法和材料相似或等同的任何方法和材料,但描述了一些優(yōu)選的方法和材料。實(shí)際上,意圖在于本發(fā)明不限于本文所述的特定方法學(xué)、方案和試劑,因?yàn)檫@些可隨使用它們的背景而改變。本文提供的標(biāo)題不是對(duì)本發(fā)明的多個(gè)方面或?qū)嵤┓桨傅南拗?。盡管如此,為了促進(jìn)對(duì)本發(fā)明的理解,以下定義了若干術(shù)語(yǔ)。數(shù)值范圍包括限定范圍的數(shù)字。這樣,本文公開的每個(gè)數(shù)值范圍旨在包括落在這種較寬的數(shù)值范圍內(nèi)的每個(gè)較窄的數(shù)值范圍,如同這種較窄的數(shù)值范圍全部被明確寫在本文一樣。意圖還在于本文公開的每個(gè)最大(或最小)的數(shù)值限制包括每個(gè)較低(或較高)的數(shù)值限制,如同這種較低(或較高)的數(shù)值限制被明確地寫在本文一樣。如本文所用,術(shù)語(yǔ)“包括”及其同源詞以其包含的意義使用(即,等同于術(shù)語(yǔ)“包含”及其對(duì)應(yīng)的同源詞)。如在此處和在所附權(quán)利要求中所用,除非上下文另外清楚地表示,否則單數(shù)“一(a)”、“一(an)”和“該(the) ”包括復(fù)數(shù)指代。因此,例如,提到“宿主細(xì)胞”包括多個(gè)此類
宿主細(xì)胞。除非另外指明,否則分別以5'至3'方向從左到右書寫核酸;以氨基到羧基方向從左到右書寫氨基酸序列。本文提供的標(biāo)題不是對(duì)可通過參照作為整體的說明書而具有的本發(fā)明的多個(gè)方面或?qū)嵤┓桨傅南拗?。?jù)此,通過參照作為整體的說明書更完全地定義以下所定義的術(shù)語(yǔ)。如本文所用,術(shù)語(yǔ)“分離的”和“純化的”用于指從與之天然締合的至少一種另外的組分(例如,其他蛋白、核酸、細(xì)胞、合成試劑等等)中被除去(即,部分或完全分開)的分子(例如,分尚的核酸、多肽等等)或其他組分。如本文所用,術(shù)語(yǔ)“衍生酶(derivative enzyme) ”(例如“酶衍生物”或“ P -葡糖苷酶衍生物”)是指保留野生型酶、天然酶或參考酶(例如3 -葡糖苷酶)的特征活性達(dá)到該衍生物可用于與野生型形式、天然形式或參考形式相似的目的的程度的酶?!?葡糖苷酶的“功能衍生物”包括具有本發(fā)明的P -葡糖苷酶的一般特征的自然存在的、合成的或重組產(chǎn)生的多肽或肽片段。如本文所用,術(shù)語(yǔ)“過表達(dá)”旨在包括將蛋白的表達(dá)提高到大于細(xì)胞正常產(chǎn)生的水平。意欲使該術(shù)語(yǔ)包括內(nèi)源蛋白以及異源蛋白的過表達(dá)。
如本文所用,術(shù)語(yǔ)“纖維二糖”具有其普通含義并且是指具有式C12H22O11的二糖。如本文所用,術(shù)語(yǔ)“纖維素酶”是指能夠?qū)⒗w維素(3-1,4-葡聚糖或3-D-葡糖苷鍵)水解成較短低聚糖、纖維二糖和/或葡萄糖的一類酶。如本文所用,術(shù)語(yǔ)“ ¢-葡糖苷酶”或“纖維二糖酶”被互換使用并且是指催化糖二聚體包括但不限于纖維二糖的水解同時(shí)釋放對(duì)應(yīng)的糖單體的3 -D-葡糖苷葡糖水解酶。在一些實(shí)施方案中,^ -葡糖苷酶是催化纖維二糖水解為葡萄糖的分類為E. C. 3. 2. I. 21的^ -葡糖苷酶葡糖水解酶。一些P -葡糖苷酶還具有水解P -D-半乳糖苷、^ -L-阿拉伯糖苷和/或P-D-巖藻糖苷的能力,并且另外一些¢-葡糖苷酶可作用于a-l,4_底物如淀粉。3 -葡糖苷酶活性可通過方法本領(lǐng)域已知的任何適宜方法來測(cè)量,包括本文以下描述的測(cè)定。如本文所用,術(shù)語(yǔ)“ P -葡糖苷酶多肽”是指具有P -葡糖苷酶活性的多肽。如本文所用,術(shù)語(yǔ)“ P -葡糖苷酶多核苷酸”是指編碼具有P -葡糖苷酶活性的多肽的多核苷酸。如本文所用,“纖維素水解活性”包括外切葡聚糖酶活性(CBH)、內(nèi)切葡聚糖酶(EG)活性和/或3 -葡糖苷酶活性。如本文所用,術(shù)語(yǔ)“外切葡聚糖酶”、“外切纖維二糖水解酶”、或“CBH”是指分類為E. C. 3. 2. I. 91的一組纖維素酶。這些酶從纖維素的還原末端或非還原末端水解纖維二糖。如本文所用,術(shù)語(yǔ)“內(nèi)切葡聚糖酶”或“EG”是指分類為E. C. 3. 2. I. 4的一組纖維素酶。這些酶水解纖維素內(nèi)部的¢-1,4糖苷鍵。如本文所用,術(shù)語(yǔ)“野生型(wildtype) ”和“野生-型(wild-type) ”當(dāng)應(yīng)用于多肽(蛋白)時(shí)是指由自然存在的微生物諸如細(xì)菌或絲狀真菌表達(dá)的多肽(蛋白)。當(dāng)應(yīng)用于微生物時(shí),術(shù)語(yǔ)“野生型”和“野生-型”是指天然的非重組微生物。如本文所用,術(shù)語(yǔ)“野生型基因”和“野生型多核苷酸序列”是指宿主細(xì)胞中天然的或自然存在的多核苷酸序列。在一些實(shí)施方案中,野生型序列是指為蛋白工程項(xiàng)目的起點(diǎn)的感興趣的序列。野生型序列可編碼同源蛋白(即,細(xì)胞在沒有干預(yù)的情況下產(chǎn)生的蛋白)或異源蛋白(即,細(xì)胞本來不產(chǎn)生但在干預(yù)下而產(chǎn)生的蛋白)。如本文所用,術(shù)語(yǔ)“自然存在的酶”是指具有未修飾的氨基酸序列(即,與自然界發(fā)現(xiàn)的氨基酸序列相同的序列)的酶。自然存在的酶包括被自然表達(dá)的那些酶。如本文所用,術(shù)語(yǔ)“修飾的多核苷酸序列”、“修飾的核苷酸序列”和“修飾的基因”是指包括感興趣的自然存在的或起始的核酸序列的缺失、插入、取代或間斷(interruption)的核苷酸序列。在一些實(shí)施方案中,修飾的序列的表達(dá)產(chǎn)物是截短的蛋白(例如,如果修飾是起始序列的缺失或間斷的話)。在一些實(shí)施方案中,截短的蛋白保留生物學(xué)活性。在一些可選實(shí)施方案中,修飾的序列的表達(dá)產(chǎn)物是延長(zhǎng)的蛋白(例如,修飾包括向起始核酸序列中插入)。在一些實(shí)施方案中,插入導(dǎo)致截短的蛋白(例如,當(dāng)插入導(dǎo)致終止密碼子的形成時(shí))。因而,插入可導(dǎo)致截短的蛋白或延長(zhǎng)的蛋白作為表達(dá)產(chǎn)物。在一些實(shí)施方案中,修飾是起始序列中至少一個(gè)核酸殘基的取代。如本文所用,“修飾的多肽序列”和“修飾的蛋白”是指包括感興趣的自然存在的或 起始的多肽序列的缺失、插入、取代或間斷的多肽序列。在一些實(shí)施方案中,修飾的序列是截短的蛋白(例如,如果修飾是起始序列的缺失或間斷的話)。在一些實(shí)施方案中,截短的蛋白保留生物學(xué)活性。在一些可選實(shí)施方案中,修飾的序列是延長(zhǎng)的蛋白(例如,修飾包括在起始序列中插入)。在一些實(shí)施方案中,修飾是起始序列中至少一個(gè)氨基酸殘基的取代。如本文所用,“感興趣的蛋白”和“感興趣的多肽”是指期望的和/或所評(píng)價(jià)的蛋白和/或多肽。如本文所用,術(shù)語(yǔ)“感興趣的起始序列”和“起始序列”是指充當(dāng)用于比較或用于工程目的的起始點(diǎn)的核酸(例如,“感興趣的起始多核苷酸”)或氨基酸序列(例如,“感興 趣的起始多肽”)。在一些實(shí)施方案中,起始序列被稱為“參考序列”。在一些實(shí)施方案中,起始序列是野生型序列,而在其他實(shí)施方案中,起始序列是修飾的序列(即,重組序列)。如本文所用,術(shù)語(yǔ)“ P -葡糖苷酶變體”、“ ^ -葡糖苷酶變體多肽”和“ P -葡糖苷酶變體蛋白”是指在多肽或多核苷酸中包括相對(duì)于野生型¢-葡糖苷酶(Bgll)多肽或野生型多核苷酸的一個(gè)或多個(gè)特定的氨基酸殘基或者一個(gè)或多個(gè)特定的核苷酸或密碼子的一個(gè)或多個(gè)修飾(例如,取代、缺失、插入、和/或截短)的¢-葡糖苷酶多肽或編碼¢-葡糖苷酶的多核苷酸。在一些實(shí)施方案中,¢-葡糖苷酶變體是嗜熱子囊菌¢-葡糖苷酶變體。如本文所用,“參考P -葡糖苷酶序列”是指用作序列比較的基礎(chǔ)或用作“起始序列”的限定序列,諸如SEQ ID NO :2或SEQ ID NO :4。在一些實(shí)施方案中,參考P _葡糖苷酶序列包括較大序列的子集(subset)。一般地說,參考序列為多肽的至少約25個(gè)氨基酸殘基長(zhǎng)度、至少約50個(gè)殘基長(zhǎng)度、至少約100個(gè)殘基長(zhǎng)度、至少約150個(gè)殘基長(zhǎng)度、至少約 200個(gè)殘基長(zhǎng)度、至少約300個(gè)殘基長(zhǎng)度、至少約350個(gè)殘基長(zhǎng)度、至少約500個(gè)殘基長(zhǎng)度、至少約600個(gè)殘基長(zhǎng)度、至少約700個(gè)殘基長(zhǎng)度、或多肽的全長(zhǎng)。如本文所用,術(shù)語(yǔ)“重組”是指宿主細(xì)胞中非自然存在的多核苷酸或多肽。重組分子可包含以非自然存在的方式連接在一起的兩個(gè)或多個(gè)自然存在的序列。重組細(xì)胞包含重組的多核苷酸或多肽。核酸(諸如多核苷酸)、多肽或細(xì)胞當(dāng)是人工的或工程改造的,或衍生自或包含人工的或工程改造的蛋白或核酸時(shí),它們是“重組的”。例如,多核苷酸被插入到載體中或任何其他異源位置(例如,重組生物的基因組中)以使其不與自然界發(fā)現(xiàn)的正常情況下在該多核苷酸兩側(cè)的核苷酸序列相締合,這樣的多核苷酸是重組多核苷酸。從重組多核苷酸體外或體內(nèi)表達(dá)的蛋白是重組多肽的實(shí)例。同樣,不在自然界出現(xiàn)的多核苷酸序列(例如,自然存在的基因的變體)是重組的。如本文所用,“改進(jìn)的特性”是指與野生型嗜熱子囊菌P -葡糖苷酶(Bgll) (SEQ IDNO :2)相比展示任何特性上的改進(jìn)的¢-葡糖苷酶多肽。改進(jìn)的特性包括但不限于增加的蛋白表達(dá)、熱活性、熱穩(wěn)定性、PH活性、pH穩(wěn)定性、產(chǎn)物特異性、提高的比活度、底物特異性、對(duì)底物或終產(chǎn)物抑制的提高的抗性、改變的PH/溫度曲線和/或化學(xué)穩(wěn)定性。如本文所用,“具有改進(jìn)的P -葡糖苷酶活性的變體”是指顯示在指定的時(shí)間在指定的反應(yīng)條件下發(fā)生的底物水解的量相對(duì)于參考3-葡糖苷酶增加的變體??墒褂帽绢I(lǐng)域已知的多種方法測(cè)量¢-葡糖苷酶活性,包括但不限于本文所述的纖維二糖測(cè)定。為了比較兩個(gè)重組表達(dá)的蛋白的¢-葡糖苷酶活性,可比較比活度(即,每摩爾酶的酶活性或每克酶的酶活性)。可選地,在相同條件下培養(yǎng)表達(dá)和分泌重組蛋白的細(xì)胞并且比較每體積培養(yǎng)基的¢-葡糖苷酶活性。術(shù)語(yǔ)“百分比同一性(percentidentity) ”、“*% 同一性”、“百分比同一(percentidentical) ”和“ %同一”在本文被互換使用是指通過ClustalW分析(例如,可從EuropeanBioinformatics Institute, Cambridge, UK獲得的WL 8版)獲得的百分比氨基酸序列同一性計(jì)算比對(duì)中相同匹配的數(shù)目并用此相同匹配的數(shù)目除以參考序列的長(zhǎng)度,并且使用以下缺省ClustalW參數(shù)以達(dá)到緩慢的/準(zhǔn)確的逐對(duì)最佳比對(duì)-空位開放罰分(Gap OpenPenalty) :10;空位延伸罰分(Gap Extension Penalty) :0. 10;蛋白權(quán)重矩陣(Proteinweight matrix) :Gonnet 系列;DNA 權(quán)重矩陣IUB ;Toggle 慢 / 快逐對(duì)比對(duì)=SLOW 或 FULL比對(duì)。兩條序列當(dāng)以下時(shí)候是“最佳比對(duì)的”:為相似性評(píng)分使用限定的氨基酸取代矩陣(例如,BL0SUM62)、空位存在罰分和空位延伸罰分對(duì)這兩條序列進(jìn)行比對(duì)以達(dá)到該序列對(duì)可能的最高分?jǐn)?shù)。氨基酸取代矩陣及其在定量?jī)蓷l序列之間的相似性上的應(yīng)用是本領(lǐng)域熟知的(見,例如,Dayhoff 等人,Atlas Prot. Seq. Struct. ,5, Suppl. 3 :345-352[1978];和 Henikoff 等人,Proc. Natl. Acad. Sci. ,89 :10915-10919 [1992],二者均通過引用并入本文)。BL0SUM62矩陣在序列比對(duì)方案諸如Gapped BLAST 2. 0中通常用作缺省評(píng)分取代矩陣(default scoring substitution matrix)。空位存在罰分用于在比對(duì)序列之一引入單個(gè)氨基酸空位,而空位延伸罰分用于被插入到已開放的空位中的每個(gè)另外的氨基酸空位 置。通過比對(duì)開始和結(jié)束所在的每條序列的氨基酸位置以及任選地通過在一條或兩條序列中插入一個(gè)空位或多個(gè)空位以達(dá)到最高可能評(píng)分,來限定比對(duì)。盡管最佳比對(duì)和評(píng)分可手動(dòng)完成,但通過使用計(jì)算機(jī)執(zhí)行的比對(duì)算法(例如,Gapped BLAST 2. 0 ;見Altschul,等人,Nucl. Acids Res.,25 :3389-3402 [1997],通過引用并入本文)促進(jìn)該過程,并且該算法在美國(guó)國(guó)立生物技術(shù)中心(National Center for Biotechnology Information)網(wǎng)站為公眾可用??墒褂萌菀撰@得的程序諸如PSI-BLAST ;Altschul等人,上文,準(zhǔn)備最佳比對(duì),包括多重比對(duì)。如本文所用,術(shù)語(yǔ)“對(duì)應(yīng)于”、“參考”和“相對(duì)于”在對(duì)給定的氨基酸序列或多核苷酸序列編號(hào)的背景下使用時(shí),是指在給定的氨基酸序列或多核苷酸序列與參考序列比較時(shí)對(duì)指定的參考序列的殘基編號(hào)。氨基酸或核苷酸堿基的“位置”由根據(jù)其相對(duì)于N末端的位置順序地辨別每個(gè)氨基酸(或核苷酸堿基)的編號(hào)表示。由于在確定最佳比對(duì)時(shí)必須被考慮的缺失、插入、截短、融合等,通過簡(jiǎn)單地從N末端計(jì)數(shù)而確定的測(cè)試序列中的氨基酸殘基編號(hào)不一定與其在參考序列中的對(duì)應(yīng)位置的編號(hào)相同。例如,在比對(duì)的測(cè)試序列中存在缺失的情況下,在缺失位點(diǎn)將不存在對(duì)應(yīng)于參考序列中的位置的氨基酸。在比對(duì)的參考序列中存在插入的情況下,該插入將不會(huì)對(duì)應(yīng)于參考序列中的任何氨基酸位置。在截短或融合的情況下,在參考序列或比對(duì)序列中可存在不對(duì)應(yīng)于對(duì)應(yīng)序列中的任何氨基酸的氨基酸串(stretches of aminoacids)。當(dāng)核酸締合,通常在溶液中締合時(shí),它們“雜交”。核酸雜交是由于各種被很好表征的物理-化學(xué)力,諸如氫鍵鍵合、溶劑排斥(solvent exclusion)、堿基堆積等。如本文所用,在核酸雜交實(shí)驗(yàn)諸如Southern雜交或Northern雜交的背景下術(shù)語(yǔ)“嚴(yán)格的雜交洗漆條件”是序列依賴性的,并且在不同環(huán)境參數(shù)下是不同的。雜交方法是本領(lǐng)域熟知的并且任何適宜方法在本發(fā)明中具有用途。對(duì)于至少100個(gè)核苷酸長(zhǎng)度的多核苷酸而言,對(duì)低嚴(yán)格條件到極高嚴(yán)格條件限定如下在標(biāo)準(zhǔn)的DNA印跡程序后,在42°C在5XSSPE,0. 3% SDS,200 u g/ml剪切和變性的鮭魚精DNA,以及對(duì)于低嚴(yán)格性的25%甲酰胺,對(duì)于中等和中-高嚴(yán)格性的35%甲酰胺,或?qū)τ诟邍?yán)格性和極高嚴(yán)格性的50%甲酰胺中預(yù)雜交和雜交。對(duì)于至少100個(gè)核苷酸長(zhǎng)度的多核苷酸,使用2XSSC,0. 2% SDS至少在50°C (低嚴(yán)格性)、至少在55°C (中等嚴(yán)格性)、至少在60°C (中-高嚴(yán)格性)、至少在65°C (高嚴(yán)格性)以及至少在70°C (極高嚴(yán)格性)將載體材料最終洗滌三次,每次15分鐘。如本文所用,術(shù)語(yǔ)“培養(yǎng)(culturing) ”和“培養(yǎng)(cultivation) ”指在液體、半固體或固體培養(yǎng)基中在適宜的條件下使微生物細(xì)胞的群體生長(zhǎng)。在一些實(shí)施方案中,“培養(yǎng)”指纖維素底物發(fā)酵性地生物轉(zhuǎn)化為終產(chǎn)物。當(dāng)用于指酶活性時(shí),術(shù)語(yǔ)“接觸”是指將酶放置在與相應(yīng)的底物足夠靠近的位置以使酶能夠?qū)⒌孜镛D(zhuǎn)化成產(chǎn)物。本領(lǐng)域中的技術(shù)人員將認(rèn)識(shí)到將酶的溶液與相應(yīng)的底物相混合將實(shí)現(xiàn)“接觸”?!敖佑|”還包括在包含酶底物的介質(zhì)中孵育分泌酶的細(xì)胞。如本文所用,^ -葡糖苷酶變體多肽在其具有P -葡糖苷酶活性時(shí)是“有酶活性的 (enzymatically active)”。 如本文所用,當(dāng)提及細(xì)胞時(shí)使用的術(shù)語(yǔ)“轉(zhuǎn)化的(transformed) ”和“轉(zhuǎn)化(transformation) ”表示細(xì)胞具有整合入其基因組的非天然核酸序列或具有作為經(jīng)過多代被維持的游離型質(zhì)粒。術(shù)語(yǔ)“引入”在將核酸序列插入細(xì)胞中的背景下表示該細(xì)胞已被轉(zhuǎn)染、轉(zhuǎn)導(dǎo)或轉(zhuǎn)化(統(tǒng)稱為“轉(zhuǎn)化”)或該核酸以其他方式并入到細(xì)胞的基因組或作為附加體被保持在細(xì)胞內(nèi)。如本文所用,“可操作地連接”是指如下配置在該配置中控制序列被適當(dāng)安放在相對(duì)于DNA序列的編碼序列的位置以使得該控制序列影響多肽的表達(dá)。如本文所用,術(shù)語(yǔ)“編碼序列”旨在包括直接編碼其蛋白產(chǎn)物的氨基酸序列的核苷酸序列。編碼序列的邊界一般由開放閱讀框確定,開放閱讀框通常以ATG起始密碼子開始。在一些實(shí)施方案中,編碼序列包括DNA、cDNA和/或重組核苷酸序列。啟動(dòng)子序列、信號(hào)肽、或其他序列當(dāng)可操作地連接于在自然界與該啟動(dòng)子、信號(hào)肽或其他序列不相關(guān)的核酸或蛋白序列時(shí),它們是“異源的”。如本文所用,術(shù)語(yǔ)“表達(dá)”包括多肽的產(chǎn)生所涉及的任何步驟,包括但不限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾和分泌。如本文所用,術(shù)語(yǔ)“表達(dá)載體”在本文是指包括編碼本發(fā)明的多肽的區(qū)段并且可操作地連接于提供其轉(zhuǎn)錄的另外區(qū)段的線型或環(huán)狀的DNA分子。如本文所用,術(shù)語(yǔ)“前蛋白(pre-protein) ”是指包括附加的氨基末端信號(hào)肽(或前導(dǎo)序列)區(qū)域的蛋白。在分泌之前信號(hào)肽酶將信號(hào)肽從前蛋白上切割以產(chǎn)生“成熟的”或“分泌的”蛋白。如本文所用,“起始密碼子”是編碼蛋白的第一個(gè)氨基酸殘基(甲硫氨酸)的ATG密碼子。以下命名法在描述參考序列中相對(duì)參考序列的取代或變異的多肽或核酸序列上具有用途“R-#_V,”,其中#是指在參考序列中的位置,R是指在參考序列中該位置處的氨基酸(或堿基),并且V是指在變異序列中該位置處的氨基酸(或堿基)。例如,對(duì)于參考SEQ ID NO :4而描述的多肽變體而言,“A479V”表示在該多肽變體中,在該參考序列第479位的丙氨酸被纈氨酸取代,其中通過該變異序列與SEQ ID NO :4的最佳比對(duì)來確定氨基酸位置。以下習(xí)慣用來描述Bgll變體中的氨基酸位置。相對(duì)于參考序列SEQ ID N0:2或SEQ ID NO :4對(duì)氨基酸位置進(jìn)行編號(hào),SEQ ID NO 2是野生型(WT)Bgll分泌蛋白,SEQ IDNO 4是本文描述的WTm形式。SEQ ID NO 6提供了野生型成熟蛋白的氨基酸序列,包括信號(hào)肽。SEQ ID NO : I提供了野生型成熟蛋白的DNA序列,而SEQ ID NO: 3提供了 WTm蛋白的DNA序列,并且SEQ ID NO : 5提供了野生型序列的DNA序列,包括信號(hào)肽序列。以下提供了編碼野生型嗜熱子囊菌P -葡糖苷酶蛋白(分泌形式)的多核苷酸AAGGATGACTTGGCCTACTCGCCGCCTTTCTACCCGTCGCCGTGGATGGACGGAAACGGAGAGTGGGCGGAGGCCTACCGCAGGGCTGTCGACTTCGTCTCGCAGCTGACCCTCGCGGAGAAGGTCAACCTGACGACCGGTGTCGGGTGGATGCAGGAGAAATGTGTCGGTGAAACGGGCAGCATTCCGAGGCTGGGGTTCCGTGGACTGTGCCTCCAAGACT CGCCCCTTGGTGTCAGATTTGCTGACTACGTTTCTGCCTTCCCCGCCGGTGTCAACGTCGCTGGAACGTGGGATAAGAACCTCGCCTACCTTCGTGGGAAGGCGATGGGTGAGGAACACCGTGGTAAGGGCGTCGACGTCCAGCTGGGACCTGTCGCCGGCCCTCTTGGCAGACACCCCGACGGTGGCAGAAACTGGGAGGGTTTCTCTCCTGACCCCGTCCTGACCGGTGTGCTTATGGCGGAGACGATCAAGGGTATCCAGGACGCCGGTGTGATTGCTTGCGCCAAGCACTTCATTGGTAACGAGATGGAGCACTTCCGGCAAGCCAGTGAGGCTGTTGGTTATGGTTTCGATATTACCGAGAGTGTCAGCTCAAATATCGACGACAAGACGCTTCACGAGCTGTACCTTTGGCCCTTTGCGGATGCTGTTCGCGCTGGCGTTGGTTCGTTCATGTGCTCCTACAACCAGGTTAACAACAGCTACAGCTGCTCGAACAGCTACCTCCTAAACAAGTTGCTCAAATCGGAGCTTGATTTTCAGGGCTTCGTGATGAGTGACTGGGGAGCGCACCACAGCGGCGTTGGAGCTGCCCTGGCTGGCCTTGACATGTCGATGCCAGGAGACACCGCCTTTGGTACCGGCAAATCCTTCTGGGGAACCAACCTGACCATCGCCGTTCTCAACGGCACTGTTCCGGAATGGCGTGTGGATGACATGGCTGTTCGCATCATGGCGGCCTTTTACAAGGTTGGTCGCGACCGTTACCAGGTGCCGGTCAACTTCGACTCGTGGACGAAGGATGAATACGGTTACGAGCACGCACTGGTTGGCCAGAACTATGTCAAGGTCAATGACAAGGTGGATGTTCGTGCCGACCATGCGGACATCATCCGTCAAATTGGGTCTGCTAGTGTTGTCCTTCTTAAGAACGATGGAGGACTCCCATTGACCGGCTATGAAAAGTTCACCGGAGTTTTTGGAGAGGATGCCGGATCGAACCGTTGGGGCGCTGACGGCTGCTCTGATCGTGGTTGCGACAACGGCACGTTGGCAATGGGTTGGGGCAGTGGCACTGCTGACTTCCCCTACCTTGTCACTCCCGAGCAGGCAATCCAGAATGAAATCCTTTCCAAGGGGAAGGGGTTAGTGAGTGCTGTCACCGACAATGGTGCCCTGGACCAGATGGAACAGGTTGCGTCTCAGGCCAGCGTTTCTATCGTTTTCGTCAACGCCGACTCTGGTGAAGGCTACATCAACGTTGATGGCAACGAAGGTGATCGGAAGAACCTCACCCTCTGGAAGGGAGGCGAGGAGGTGATCAAGACTGTTGCAGCCAACTGCAACAACACCATTGTTGTGATGCACACTGTGGGACCTGTCTTGATCGATGAGTGGTATGACAACCCCAACGTCACCGCCATCGTCTGGGCCGGTCTTCCAGGCCAGGAGAGCGGCAACAGTCTCGTCGATGTGCTCTACGGCCGTGTCAGCCCCGGAGGAAAGACGCCGTTTACGTGGGGAAAGACTCGCGAGTCGTACGGCGCTCCTCTGCTCACCAAACCCAACAACGGCAAGGGTGCCCCCCAGGACGACTTCACCGAGGGCGTCTTCATCGACTACAGAAGGTTCGACAAGTACAACGAGACGCCCATCTATGAGTTCGGGTTTGGTCTGAGTTATACCACTTTTGAATACTCGGACATCTACGTCCAGCCCCTTAACGCACGACCTTACACCCCAGCCTCCGGCAGCACCAAGGCGGCTCCTACCTTTGGGAACATCAGCACGGACTATGCAGATTACTTGTACCCTGAGGATATACACAAGGTCCCATTATACATCT ATCCTTGGCTTAACACGACGGACCCGAAGAAGTCCTCCGGCGATCCCGACTACGGAATGAAGGCCGAGGACTACATCCCATCTGGCGCGACTGATGGATCTCCTCAGCCCATCCTTCCGGCAGGCGGTGCTCCTGGTGGCAACCCGGGTCTCTATGATGAGATGTACAGGGTATCTGCAATCATCACCAACACCGGTAACGTTGTTGGTGATGAGGTTCCTCAGCTGTATGTCTCTCTTGGTGGTCCAGATGACCCCAAGGTCGTGCTCCGCAACTTTGACCGCATCACGCTCCACCCCGGCCAGCAGACAATGTGGACCACGACATTGACGCGACGCGATATCTCGAACTGGGACCCTGCCTCCCAGAATTGGGTTGTGACCAAATATCCCAAGACAGTCTACATCGGCAGCTCTTCGCGGAAACTGCACCTGCAGGCACCGCTTCCCCCTTAC(SEQIDNO 1)以 下提供了編碼野生型嗜熱子囊菌P -葡糖苷酶蛋白(分泌形式)的多肽序列KDDLAYSPPFYPSPWMDGNGEWAEAYRRAVDFVSQLTLAEKVNLTTGVGWMQEKCVGETGSIPRLGFRGLCLQDSPLGVRFADYVSAFPAGVNVAATWDKNLAYLRGKAMGEEHRGKGVDVQLGPVAGPLGRHPDGGRNWEGFSPDPVLTGVLMAETIKGIQDAGVIACAKHFIGNEMEHFRQASEAVGYGFDITESVSSNIDDKTLHELYLWPFADAVRAGVGSFMCSYNQVNNSYSCSNSYLLNKLLKSELDFQGFVMSDWGAHHSGVGAALAGLDMSMP⑶TAFGTGKSFWGTNLTIAVLNGTVPEWRVDDMAVRIMAAFYKVGRDRYQVPVNFDSWTKDEYGYEHALVGQNYVKVNDKVDVRADHADIIRQIGSASVVLLKNDGGLPLTGYEKFTGVFGEDAGSNRWGADGCSDRGCDNGTLAMGWGSGTADFPYLVTPEQAIQNEILSKGKGLVSAVTDNGALDQMEQVASQASVSIVFVNADSGEGYINVDGNE⑶RKNLTLWKGGEEVIKTVAANCNNTIVVMHTVGPVLIDEWYDNPNVTAIVWAGLPGQESGNSLVDVLYGRVSPGGKTPFTWGKTRESYGAPLLTKPNNGKGAPQDDFTEGVFIDYRRFDKYNETPIYEFGFGLSYTTFEYSDIYVQPLNARPYTPASGSTKAAPTFGNISTDYADYLYPEDIHKVPLYIYPWLNTTDPKKSS⑶PDYGMKAEDYIPSGATDGSPQPILPAGGAPGGNPGLYDEMYRVSAIITNTGNVVGDEVPQLYVSLGGPDDPKVVLRNFDRITLHPGQQTMWTTTLTRRDISNWDPASQNWVVTKYPKTVYIGSSSRKLHLQAPLPPY(SEQ ID NO 2)以下顯示了編碼嗜熱子囊菌P -葡糖苷酶蛋白(WTm形式)的多核苷酸序列ATGAAGGATGACTTGGCCTACTCGCCGCCTTTCTACCCGTCGCCGTGGATGGACGGAAACGGAGAGTGGGCGGAGGCCTACCGCAGGGCTGTCGACTTCGTCTCGCAGCTGACCCTCGCGGAGAAGGTCAACCTGACGACCGGTGTCGGGTGGATGCAGGAGAAATGTGTCGGTGAAACGGGCAGCATTCCGAGGCTGGGGTTCCGTGGACTGTGCCTCCAAGACTCGCCCCTTGGTGTCAGATTTGCTGACTACGTTTCTGCCTTCCCCGCCGGTGTCAACGTCGCTGCAACGTGGGATAAGAACCTCGCCTACCTTCGTGGGAAGGCGATGGGTGAGGAACACCGTGGTAAGGGCGTCGACGTCCAGCTGGGACCTGTCGCCGGCCCTCTTGGCAGACACCCCGACGGTGGCAGAAACTGGGAGGGTTTCTCTCCTGACCCCGTCCTGACCGGTGTGCTTATGGCGGAGACGATCAAGGGTATCCAGGACGCCGGTGTGATTGCTTGCGCCAAGCACTTCATTGGTAACGAGATGGAGCACTTCCGGCAAGCCAGTGAGGCTGTTGGTTATGGTTTCGATATTACCGAGAGTGTCAGCTCAAATATCGACGACAAGACGCTTCACGAGCTGTACCTTTGGCCCTTTGCGGATGCTGTTCGCGCTGGCGTTGGTTCGTTCATGTGCTCCTACAACCAGGTTAACAACAGCTACAGCTGCTCGAACAGCTACCTCCTAAACAAGTTGCTCAAATCGGAGCTTGATTTTCAGGGCTTCGTGATGAGTGACTGGGGAGCGCACCACAGCGGCGTTGGAGCTGCCCTGGCTGGCCTTGACATGTCGATGCCAGGAGACACCGCCTTTGGTACCGGCAAATCCTTCTGGGGAACCAACCTGACCATCGCCGTTCTCAACGGCACTGTTCCGGAATGGCGTGTGGATGACATGGCTGTTCGCATCATGGCGGCCTTTTACAAGGTTGGTCGCGACCGTTACCAGGTGCCGGTCAACTTCGACTCGTGGACGAAGGATGAATACGGTTACGAGCACGCACTGGTTGGCCAGAACTATGTCAAGGTCAATGACAAGGTGGATGTTCGTGCCGACCATGCGGACATCATCCGTCAAATTGGGTCTGCTAGTGTTGTCCTTCTTAAGAACGATGGAGGACTCCCATTGACCGGCTATGAAAAGTTCACCGGAGTTTTTGGAGAGGATGCCGGATCGAACCGTTGGGGCGCTGACGGCTGCTCTGATCGTGGTTGCGACAACGGCACGTTGGCAATGGGTTGGGGCAGTGGCACTGCTGACTTCCCCTACCTTGTCACTCCCGAGCAGGCAATCCAGAATGAAATCCTTTCCAAGGGGAAGGGGTTAGTGAGTGCTGTCACCGACAATGGTGCCCTGGACCAGATGGAACAGGTTGCGTCTCAGGCCAGCGTTTCTATCGTTTTCGTCAACGCCGACTCTGGTGAAGGCTACATCAACGTTGATGGCAACGAAGGTGATCGGAAGAACCTCACCCTCTGGAAGGGAGGCGAGGAGGTGATCAAGACTGTTGCAGCCAACTGCAACAACACCATTGTTGTGATGCACACTGTGGGACCTGTCTTGATCGATGAGTGGTATGACAACCCCAACGTCACCGCCATCGTCTGGGCCGGTCTTCCAGGCCAGGAGAGCGGCAACAGTCTCGTCGATGTGCTCTACGGCCGTGTCAGCCCCGGAGGAAAGACGCCGTTTACGTGGGGAAAGACTCGCGAGTCGTACGGCGCTCCTCTGCTCACCAAACCCAACAACGGCAAGGGTGCCCCCCAGGACGACTTCACCGAGGGCGTCTTCATCGACTACAGAAGGTTCGACAAGTACAACGAGACGCCCATCTATGAGTTCGGGTTTGGTCTGAGTTATACCACTTTTGAATACTCGGACATCTACGTCCAGCCCCTTAACGCACGACCTTACACCCCAGCCTCCGGCAGCACCAAGGCGGCTCCTACCTTTGGGAACATCAGCACGGACTATGCAGATTACTTGTACCCTGAGGATATACACAAGGTCCCATTATACATCTATCCTTGGCTTAACACGACGGACCCGAAGAAGTCCTCCGGCGATCCCGACTACGGAATGAAGGCCGAGGACTACATCCCATCTGGCGCGACTGATGGATCTCCTCAGCCCATCCTTCCGGCAGGCGGTGCTCCTGGTGGCAACCCGGGTCTCTATGATGAGATGTACAGGGTATCTGCAATCATCACCAACACCGGTAACGTTGTTGGTGATGAGGTTCCTCAGCTGTATGTCTCTCTTGGTGGTCCAGATGACCCCAAGGTCGTGCTCCGCAACTTTGACCGCATCACGCTCCACCCCGGCCAGCAGACAATGTGGACCACGACATTGACGCGACGCGATATCTCGAACTGGGACCCTGCCTCCCAGAATTGGGTTGTGACCAAATATCCCAAGACAGTCTACATCGGCAGCTCTTCGCGGAAACTGCACCTGCAGGCACCGCTTCCCCCTTAC(SEQID NO 3)
以下顯示了嗜熱子囊菌¢-葡糖苷酶蛋白WTm形式的多肽序列MKDDLAYSPPFYPSPWMDGNGEWAEAYRRAVDFVSQLTLAEKVNLTTGVGWMQEKCVGETGSIPRLGFRGLCLQDSPLGVRFADYVSAFPAGVNVAATWDKNLAYLRGKAMGEEHRGKGVDVQLGPVAGPLGRHPDGGRNWEGFSPDPVLTGVLMAETIKGIQDAGVIACAKHFIGNEMEHFRQASEAVGYGFDITESVSSNIDDKTLHELYLWPFADAVRAGVGSFMCSYNQVNNSYSCSNSYLLNKLLKSELDFQGFVMSDWGAHHSGVGAALAGLDMSMP⑶TAFGTGKSFWGTNLTIAVLNGTVPEWRVDDMAVRIMAAFYKVGRDRYQVPVNFDSWTKDEYGYEHALVGQNYVKVNDKVDVRADHADIIRQIGSASVVLLKNDGGLPLTGYEKFTGVFGEDAGSNRWGADGCSDRGCDNGTLAMGWGSGTADFPYLVTPEQAIQNEILSKGKGLVSAVTDNGALDQMEQVASQASVSIVFVNADSGEGYINVDGNE⑶RKNLTLWKGGEEVIKTVAANCNNTIVVMHTVGPVLIDEWYDNPNVTAIVWAGLPGQESGNSLVDVLYGRVSPGGKTPFTWGKTRESYGAPLLTKPNNGKGAPQDDFTEGVFIDYRRFDKYNETPIYEFGFGLSYTTFEYSDIYVQPLNARPYTPASGSTKAAPTFGNISTDYADYLYPEDIHKVPLYIYPWLNTTDPKKSS⑶PDYGMKAEDYIPSGATDGSPQPILPAGGAPGGNPGLYDEMYRVSAIITNTGNVVGDEVPQLYVSLGGPDDPKVVLRNFDRITLHPGQQTMWTTTLTRRDISNWDPASQNWVVTKYPKTVYIGSSSRKLHLQAPLPPY(SEQ ID NO 4)以下顯示了編碼嗜熱子囊菌¢-葡糖苷酶前蛋白的多核苷酸ATGAGGCTTGGGTGGCTGGAGCTGGCCGTCGCGGCGGCCGCGACCGTCGCCAGCGCCAAGGATGACTTGGCCTACTCGCCGCCTTTCTACCCGTCGCCGTGGATGGACGGAAACGGAGAGTGGGCGGAGGCCTACCGCAGGGCTGTCGACTTCGTCTCGCAGCTGACCCTCGCGGAGAAGGTCAACCTGACGACCGGTGTCGGGTGGATGCAGGAGAAATGTGTCGGTGAAACGGGCAGCATTCCGAGGCTGGGGTTCCGTGGACTGTGCCTCCAAGACTCGCCCCTTGGTGTCAGATTTGCTGACTACGTTTCTGCCTTCCCCGCCGGTGTCAACGTCGCTGCAACGTGGGATAAGAACCTCGCCTACCTTCGTGGGAAGGCGATGGGTGAGGAACACCGTGGTAAGGGCGTCGACGTCCAGCTGGGACCTGTCGCCGGCCCTCTTGGCAGACACCCCGACGGTGGCAGAAACTGGGAGGGTTTCTCTCCTGACCCCGTCCTGACCGGTGTGCTTATGGCGGAGACGATCAAGGGTATCCAGGACGCCGGTGTGATTGCTTGCGCCAAGCACTTCATTGGTAACGAGATGGAGCACTTCCGGCAAGCCAGTGAGGCTGTTGGTTATGGTTTCGATATTACCGAGAGTGTCAGCTCAAATATCGACGACAAGACGCTTCACGAGCTGTACCTTTGGCCCTTTGCGGATGCTGTTCGCGCTGGCGTTGGTTCGTTCATGTGCTCCTACAACCAGGTTAACAACAGCTACAGCTGCTCGAACAGCTACCTCCTAAACAAGTTGCTCAAATCGGAGCTTGATTTTCAGGGCTTCGTGATGAGTGACTGGGGAGCGCACCACAGCGGCGTTGGAGCTGCCCTGGCTGGCCTTGACATGTCGATGCCAGGAGACACCGCCTTTGGTACCGGCAAATCCTTCTGGGGAACCAACCTGACCATCGCCGTTCTCAACGGCACTGTTCCGGAATGGCGTGTGGATGACATGGCTGTTCGCATCATGGCGGCCTTTTACAAGGTTGGTCGCGACCGTTACCAGGTGCCGGTCAACTTCGACTCGTGGACGAAGGATGAATACGGTTACGAGCACGCACTGGTTGGCCAGAACTATGTCAAGGTCAATGACAAGGTGGATGTTCGTGCCGACCATGCGGACATCATCCGTCAAATTGGGTCTGCTAGTGTTGTCCTTCTTAAGAACGATGGAGGACTCCCATTGACCGGCTATGAAAAGTTCACCGGAGTTTTTGGAGAGGATGCCGGATCGAACCGTTGGGGCGCTGACGGCTGCTCTGATCGTGGTTGCGACAACGGCACGTTGGCAATGGGTTGGGGCAGTGGCACTGCTGACTTCCCCTACCTTGTCACTCCCGAGCAGGCAATCCAGAATGAAATCCTTTCCAAGGGGAAGGGGTTAGTGAGTGCTGTCACCGACAATGGTGCCCTGGACCAGATGGAACAGGTTGCGTCTCAGGCCAGCGTTTCTATCGTTTTCGTCAACGCCGACTCTGGTGAAGGCTACATCAACGTTGATGGCAACGAAGGTGATCGGAAGAACCTCACCCTCTGGAAGGGAGGCGAGGAGGTGATCAAGACTGTTGCAGCCAACTGCAACAACACCATTGTTGTGATGCACACTGTGGGACCTGTCTTGATCGATGAGTGGTATGACAACCCCAACGTCACCGCCATCGTCTGGGCCGGTCTTCCAGGCCAGGAGAGCGGCAACAGTCTCGTCGATGTGCTCTACGGCCGTGTCAGCCCCGGAGGAAAGACGCCGTTTACGTGGGGAAAGACTCGCGAGTCGTACGGCGCTCCTCTGCTCA CCAAACCCAACAACGGCAAGGGTGCCCCCCAGGACGACTTCACCGAGGGCGTCTTCATCGACTACAGAAGGTTCGACAAGTACAACGAGACGCCCATCTATGAGTTCGGGTTTGGTCTGAGTTATACCACTTTTGAATACTCGGACATCTACGTCCAGCCCCTTAACGCACGACCTTACACCCCAGCCTCCGGCAGCACCAAGGCGGCTCCTACCTTTGGGAACATCAGCACGGACTATGCAGATTACTTGTACCCTGAGGATATACACAAGGTCCCATTATACATCTATCCTTGGCTTAACACGACGGACCCGAAGAAGTCCTCCGGCGATCCCGACTACGGAATGAAGGCCGAGGACTACATCCCATCTGGCGCGACTGATGGATCTCCTCAGCCCATCCTTCCGGCAGGCGGTGCTCCTGGTGGCAACCCGGGTCTCTATGATGAGATGTACAGGGTATCTGCAATCATCACCAACACCGGTAACGTTGTTGGTGATGAGGTTCCTCAGCTGTATGTCTCTCTTGGTGGTCCAGATGACCCCAAGGTCGTGCTCCGCAACTTTGACCGCATCACGCTCCACCCCGGCCAGCAGACAATGTGGACCACGACATTGACGCGACGCGATATCTCGAACTGGGACCCTGCCTCCCAGAATTGGGTTGTGACCAAATATCCCAAGACAGTCTACATCGGCAGCTCTTCGCGGAAACTGCACCTGCAGGCACCGCTTCCCCCTTAC(SEQ ID NO :5)以下顯示了嗜熱子囊菌P -葡糖苷酶前蛋白的多肽序列MRLGffLELAVAAAATVASAKDDLAYSPPFYPSPWMDGNGEWAEAYRRAVDFVSQLTLAEKVNLTTGVGWMQEKCVGETGSIPRLGFRGLCLQDSPLGVRFADYVSAFPAGVNVAATWDKNLAYLRGKAMGEEHRGKGVDVQLGPVAGPLGRHPDGGRNWEGFSPDPVLTGVLMAETIKGIQDAGVIACAKHFIGNEMEHFRQASEAVGYGFDITESVSSNIDDKTLHELYLWPFADAVRAGVGSFMCSYNQVNNSYSCSNSYLLNKLLKSELDFQGFVMSDWGAHHSGVGAALAGLDMSMP⑶TAFGTGKSFWGTNLTIAVLNGTVPEWRVDDMAVRIMAAFYKVGRDRYQVPVNFDSWTKDEYGYEHALVGQNYVKVNDKVDVRADHADIIRQIGSASVVLLKNDGGLPLTGYEKFTGVFGEDAGSNRWGADGCSDRGCDNGTLAMGWGSGTADFPYLVTPEQAIQNEILSKGKGLVSAVTDNGALDQMEQVASQASVSIVFVNADSGEGYINVDGNE⑶RKNLTLWKGGEEVIKTVAANCNNTIVVMHTVGPVLIDEWYDNPNVTAIVWAGLPGQESGNSLVDVLYGRVSPGGKTPFTWGKTRESYGAPLLTKPNNGKGAPQDDFTEGVFIDYRRFDKYNETPIYEFGFGLSYTTFEYSDIYVQPLNARPYTPASGSTKAAPTFGNISTDYADYLYPEDIHKVPLYIYPWLNTTDPKKSS⑶PDYGMKAEDYIPSGATDGSPQPILPAGGAPGGNPGLYDEMYRVSAIITNTGNW ⑶ EVPQLYVSLGGPDDPKVVLRNFDRITLHPGQQTMWTTTLTRRDISNWDPASQNWWTKYPKTVYIGSSSRKLHLQAPLPPY(SEQ ID NO 6)以下顯示了被設(shè)計(jì)為具有在釀酒酵母(Saccharomyces cerevisiae)中表達(dá)的密碼子偏倚性的編碼WTm的多核苷酸序列TGAAAGATGATTTGGCTTATAGTCCACCTTTCTACCCATCACCTTGGATGGACGGTAACGGAGAATGGGCTGAAGCCTATAGAAGAGCCGTCGATTTCGTATCCCAATTGACATTGGCAGAGAAGGTAAATTTGACAACCGGAGTGGGTTGGATGCAGGAAAAGTGTGTAGGCGAAACTGGTTCTATACCAAGATTAGGCTTTAGGGGTTTGTGCTTACAAGATTCTCCCTTAGGTGTAAGATTCGCCGACTACGTAAGTGCTTTTCCTGCAGGAGTTAACGTTGCAGCAACTTGGGATAAAAACCTTGCATATTTGAGAGGTAAGGCAATGGGTGAAGAACATCGTGGCAAGGGTGTCGATGTGCAGTTAGGCCCAGTTGCTGGACCATTGGGAAGACATCCCGACGGCGGAAGAAACTGGGAGGGTTTTAGTCCAGACCCCGTTTTGACTGGAGTCTTGATGGCAGAGACTATCAAAGGTATACAAGACGCTGGAGTGATTGCTTGTGCTAAACATTTCATTGGTAACGAAATGGAACATTTCAGACAAGCCTCCGAAGCAGTTGGCTATGGTTTTGATATTACTGAGTCCGTTTCATCAAACATAGATGACAAAACCCTTCACGAACTA TATTTATGGCCATTCGCTGATGCCGTCAGAGCTGGTGTAGGTTCTTTCATGTGTTCATACAACCAAGTCAACAACTCTTATTCATGCTCTAATTCCTACTTGTTGAACAAATTATTAAAGTCAGAACTTGACTTTCAAGGTTTCGTAATGTCCGACTGGGGTGCTCACCATTCCGGAGTTGGTGCAGCTTTGGCCGGTTTAGACATGTCAATGCCAGGTGATACTGCATTTGGAACGGGTAAATCCTTTTGGGGTACCAATCTAACCATCGCCGTCCTTAATGGTACAGTTCCTGAATGGAGAGTAGATGATATGGCTGTTAGAATCATGGCCGCATTTTACAAAGTTGGTAGAGATAGGTACCAAGTGCCTGTCAACTTTGACTCCTGGACCAAAGATGAATATGGTTATGAACACGCATTGGTGGGCCAGAATTATGTTAAGGTCAATGATAAAGTGGATGTGAGAGCTGACCACGCTGATATTATCCGTCAGATTGGTAGTGCATCAGTTGTTTTGTTAAAAAATGACGGAGGACTTCCTTTAACTGGTTATGAGAAGTTCACAGGCGTATTCGGCGAAGATGCCGGTAGTAATCGTTGGGGTGCTGACGGATGCAGTGACAGAGGCTGCGATAATGGTACCCTTGCCATGGGTTGGGGATCTGGAACGGCCGACTTTCCTTACTTAGTTACGCCAGAGCAGGCTATACAAAATGAGATTTTGTCTAAAGGCAAGGGACTTGTCTCTGCCGTGACGGATAACGGAGCTTTAGACCAAATGGAACAGGTCGCTTCCCAAGCTTCTGTAAGTATTGTTTTTGTTAATGCCGACTCAGGAGAAGGCTATATTAACGTTGATGGAAATGAAGGTGATAGGAAAAATCTAACTCTTTGGAAGGGTGGTGAAGAGGTCATTAAGACAGTCGCAGCCAATTGTAACAATACCATCGTCGTAATGCACACCGTTGGACCTGTGTTAATAGATGAATGGTATGATAATCCTAATGTCACTGCAATTGTTTGGGCAGGCTTGCCTGGTCAGGAATCCGGTAATTCTCTTGTTGATGTCCTATATGGAAGGGTGTCCCCTGGTGGAAAAACTCCCTTTACTTGGGGCAAGACACGTGAAAGTTATGGAGCACCATTATTAACAAAACCAAACAACGGAAAGGGAGCTCCTCAAGATGATTTTACAGAGGGTGTTTTCATCGACTACAGGCGTTTCGACAAGTATAACGAGACTCCTATATATGAGTTCGGATTTGGTCTATCCTACACAACTTTTGAGTACTCAGATATCTACGTACAGCCCTTGAACGCACGTCCATACACCCCTGCTTCAGGTTCTACTAAGGCCGCCCCAACGTTTGGAAATATATCTACTGATTACGCTGATTACCTATACCCAGAGGATATTCATAAAGTTCCACTTTATATCTACCCATGGCTTAATACGACAGACCCAAAAAAGTCAAGTGGTGATCCAGATTACGGAATGAAAGCTGAAGATTACATTCCTTCAGGCGCTACGGACGGCTCTCCCCAACCAATTCTACCAGCTGGAGGTGCTCCAGGTGGTAATCCTGGCTTGTATGATGAGATGTATAGGGTTTCTGCTATAATTACAAATACAGGTAACGTTGTTGGTGATGAGGTACCTCAACTATACGTGTCTTTAGGTGGTCCCGATGACCCCAAGGTAGTTTTGCGTAACTTTGACAGAATCACTTTGCATCCAGGACAACAAACCATGTGGACTACGACTTTGACAAGAAGAGATATATCTAATTGGGACCCTGCATCTCAGAATTGGGTTGTGACAAAGTACCCAAAAACTGTCTATATCGGCTCAAGTTCCAGGAAGCTTCACTTGCAGGCCCCTCTACCCCCATACTAA(SEQ ID NO 7)真菌嗜熱子囊菌(Thermoascus aurantiacus)產(chǎn)生一致地起作用來催化纖維素的解晶和水解以產(chǎn)生可溶性糖類的多種酶。在這些酶中有嗜熱子囊菌¢-葡糖苷酶I (Bgll)(Parry等人,Biochem. J. 353 :117 [2001],通過引用并入本文)。嗜熱子囊菌P _葡糖苷酶蛋白序列被提供在 Hong 等人,Appl. Microbiol. Biotechnol. ,73 :1331 [2007]中,其通過引用并入本文。Hong等人(Hong等人NCBI登錄號(hào)DQl 14396. I ;Genbank登錄號(hào)AAZ95588)報(bào)告了 bgll基因的序列。嗜熱子囊菌野生型¢-葡糖苷酶cDNA序列以GenBank登錄號(hào)DQl 14397 提供(也見,Hong 等人,J. Biotechnol.,130 114-23[2007]),并且在本文作為SEQ ID NO :6在此給出。嗜熱子囊菌¢-葡糖苷酶前蛋白(SEQ ID NO 6)包括19-殘基信號(hào)肽,MRLGWLELAVAAAATVASA,對(duì)應(yīng)于SEQ ID NO 6的殘基1_19 (編碼這種前蛋白的多核苷酸在SEQ ID NO 5中提供)。本文描述的嗜熱子囊菌3 -葡糖苷酶變體對(duì)于從纖維素生物質(zhì)產(chǎn)生可發(fā)酵的糖是極其有用的。在一些實(shí)施方案中,本發(fā)明提供了通過使包含纖維二糖的組合物與至少一種重組表達(dá)的嗜熱子囊菌3-葡糖苷酶變體在其中纖維二糖被酶促轉(zhuǎn)化為葡萄糖的條件下接觸來產(chǎn)生葡萄糖的方法。在一些實(shí)施方案中,將表達(dá)至少一種3 -葡糖苷酶變體的重組宿主細(xì)胞與纖維二糖在其中3-葡糖苷酶被細(xì)胞表達(dá)(和優(yōu)選地分泌)的條件下組合。在一些可選實(shí)施方案中,將純化的或部分純化的重組3 -葡糖苷酶與纖維二糖接觸。在本發(fā)明的一些實(shí)施方案中,接觸包括在包含從纖維素原料產(chǎn)生的纖維二糖的培養(yǎng)基中培養(yǎng)重組宿主細(xì)胞。例如,本文描述的嗜熱子囊菌3-葡糖苷酶變體顯示與其他纖維素酶聯(lián)合的在糖化反應(yīng)中的益處,所述其他纖維素酶諸如里氏木霉(T.reesei)纖維素酶(例如,里氏木霉CBHl、CBH2和/或EGl或其變體,和/或里氏木霉培養(yǎng)液)和C. Iucknowense纖維素酶(美國(guó)專利第6,015,707號(hào)、5,811,381號(hào)和6,573,086號(hào);美國(guó)專利公布第2007/0238155號(hào)、2008/0194005 號(hào)、2009/0099079 號(hào);以及 WO 2008/073914 和 WO 98/15633,其全部通過引用并入本文)。
在一些實(shí)施方案中,本發(fā)明提供了通過將包括含編碼嗜熱子囊菌Bgll變體的核酸序列的載體的宿主細(xì)胞培養(yǎng)在其中3-葡糖苷酶蛋白或其酶活性片段被表達(dá)的條件下來表達(dá)¢-葡糖苷酶的方法。在一些實(shí)施方案中,表達(dá)的蛋白包含在分泌酶時(shí)被細(xì)胞除去的信號(hào)肽。在一些實(shí)施方案中,編碼嗜熱子囊菌Bgll變體的序列的轉(zhuǎn)錄受可操作地連接的異源啟動(dòng)子控制。P-葡糖苷酶多肽變體本發(fā)明提供了為嗜熱子囊菌¢-葡糖苷酶(Bgll)變體的新穎的酶。本發(fā)明的3 -葡糖苷酶多肽變體是顯示P -葡糖苷酶活性、通常是比野生型嗜熱子囊菌P -葡糖苷酶(SEQ ID N02)或WTm嗜熱子囊菌P -葡糖苷酶(SEQ ID NO 4)更大的P -葡糖苷酶活性的Bgll的變體。還包括在商業(yè)化糖化工藝相關(guān)的條件下顯示更大穩(wěn)定性的¢-葡糖苷酶多肽變體。本發(fā)明提供了具有比野生型嗜熱子囊菌Bgll蛋白更大的活性并且具有在本文所述的顯示提高的活性的變體中發(fā)現(xiàn)的至少一種取代的Bgll變體。如在本文更詳細(xì)討論的,制備了編碼野生型(WT)嗜熱子囊菌Bgll蛋白(SEQ ID NO 2)或通過在成熟蛋白的氨基末端增添甲硫氨酸而修飾的野生型嗜熱子囊菌Bgll蛋白(WTm;SEQ ID NO 4)的多核苷酸。多核苷酸連同編碼異源信號(hào)肽的序列被插入表達(dá)載體中,如實(shí)施例所述。通過誘變和定向進(jìn)化制備編碼Bgll蛋白變體的多核苷酸的文庫(kù),并且評(píng)價(jià)個(gè)體Bgll變體的特性(例如,^-葡糖苷酶活性),如實(shí)施例所述。在具有比野生型酶活性更大活性的變體中鑒定了許多氨基酸取代和取代的組合。還旨在本發(fā)明包括包含相比于參考序列(例如SEQ ID N0:2或4)的至少一個(gè)插入和/或缺失的Bgll變體。更具體地說,本發(fā)明提供了具有提高的活性的分離的和/或重組的P -葡糖苷酶多肽變體,其包括與野生型嗜熱子囊菌葡糖苷酶多肽(Bgll) (SEQ ID NO 2)至少約70%相同且在選自以下的位置具有至少一種氨基酸殘基取代的氨基酸序列A478、D203、E344、F287、H684、K100、K291、K342、K456、K54、L149、N355、N650、P739、P790、R330、S408、386、!150、¥331、¥641、¥679、¥746(其中通過與5£0 ID NO :2最佳比對(duì)來確定氨基酸位置)。本發(fā)明還提供了包括如下氨基酸序列的分離的和/或重組的0-葡糖苷酶多肽變體所述氨基酸序列與WTm嗜熱子囊菌P -葡糖苷酶多肽(Bgll) (SEQ ID NO 4)至少約70%相同且在選自以下的位置具有至少一種氨基酸殘基取代或缺失A479、D204、E345、F288、H685、K101、K292、K343、K457、K55、L150、M1、N356、N651、P740、P791、R331、S409、S87、T151、Y332、Y642、Y680、和Y747(其中通過與SEQID NO 4最佳比對(duì)來確定氨基酸位置)。“取代”在該背景下表示該變體蛋白中的殘基是除了參考序列(例如SEQ ID NO:2或4)中此位置處的殘基以外的任何殘基。例如,“A479X”表示在第479位包含除了丙氨酸以外的氨基酸(即,另外19個(gè)自然存在的氨基酸之一)的變體。在一些實(shí)施方案中,蛋白變體中的氨基酸既不是野生型殘基也不是為該野生型殘基的保守性替代物(substitute)的殘基。如以下指出的,在該背景下,殘基的保守性替代物是在同一組(即,堿性氨基酸,諸如精氨酸、賴氨酸或組氨酸;酸性氨基酸,諸如谷氨酸或天冬氨酸;極性氨基酸,諸如谷氨酰胺或天冬酰胺;疏水氨基酸,諸如亮氨酸、異亮氨酸或纈氨酸;芳香族氨基酸,諸如苯丙氨酸、色氨酸或酪氨酸;或小氨基酸,諸如甘氨酸、丙氨酸、絲氨酸、蘇氨酸、脯氨酸、半胱氨酸或甲硫氨酸)中的另一個(gè)殘基。在一些實(shí)施方案中,蛋白變體中的氨基酸既不是野生型殘基也不是為如以下的對(duì)所限定的那樣通常與該野生型殘基交換的殘基的殘基Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu 和 Asp/Gly。在一些實(shí)施方案中,本發(fā)明提供了具有比野生型(WT)嗜熱子囊菌Bgll蛋白更大的活性和/或熱穩(wěn)定性并且包括如下氨基酸序列的分離的和/或重組的P-葡糖苷酶多肽變體該氨基酸序列與野生型嗜熱子囊菌¢-葡糖苷酶(Bgll) (SEQ ID NO 2)至少約70%相同并且具有選自以下的至少一種氨基酸殘基取代A478V、D203G、E344V、F287Y、H684Y、K100R、K291E、K291I、K342R、K456R、K54R、L149V、N355S、N650K、P739S、P790T、R330K、S408N、S86N、T150S、Y331C、Y641N、Y679F、Y746C (其中通過與 SEQ ID NO 2 最佳比對(duì)來確定氨基酸位置)。以上列出的發(fā)明的有益組合包括在以上鑒定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、或 24 或更多個(gè)位置處的取代的任何組
八
口 o本發(fā)明還提供了具有比野生型(WT)嗜熱子囊菌Bgll蛋白更大的活性和/或熱穩(wěn)定性并且包括如下氨基酸序列的分離的和/或重組的P-葡糖苷酶多肽變體該氨基酸序列與WTm嗜熱子囊菌P -葡糖苷酶(Bgll) (SEQ ID NO 4)至少約70%相同并且在選自以下位置具有至少一種氨基酸殘基取代A479V、D204G、E345V、F288Y、H685Y、K101R、K292E、K292I、K343R、K457R、K55R、L150V、MIT、N356S、N651K、P740S、P791T、R331K、S409N、S87N、T151S、Y332C、Y642N、Y680F、和Y747C(其中通過與SEQ ID NO 4最佳比對(duì)來確定氨基酸位置)。以上列出的發(fā)明的有益組合包括在以上鑒定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、或24或更多個(gè)位置處的取代的任何組合。在一些實(shí)施方案中,本發(fā)明提供了具有由在嚴(yán)格條件下與SEQ ID NO 1的互補(bǔ)序列雜交(例如,在與SEQ ID NO 1精確互補(bǔ)的核酸的實(shí)質(zhì)上整個(gè)長(zhǎng)度上雜交)的核酸編碼的氨基酸序列的分離的和/或重組的P -葡糖苷酶多肽變體,其中該編碼多肽在選自以下的位置具有至少一種或多種取代或缺失A478、D203、E344、F287、H684、K100、K291、K342、K456、K54、L149、N355、N650、P739、P790、R330、S408、S86、T150、Y331、Y641、Y679、Y746(其中通過與SEQ ID NO :2最佳比對(duì)來確定氨基酸位置)。本發(fā)明還提供了具有由在嚴(yán)格條件下與SEQ ID NO: I的互補(bǔ)序列雜交(例如,在與SEQ ID NO :1精確互補(bǔ)的核酸的實(shí)質(zhì)上整個(gè)長(zhǎng)度上雜交)的核酸編碼的氨基酸序列的分離的和/或重組的P-葡糖苷酶多肽變體,其中該編碼多肽在選自以下的位置具有至少一種或多種取代或缺失A479、D204、E345、F288、H685、K101、K292、K343、K457、K55、L150、M1、N356、N651、P740、P791、R331、S409、S87、T151、Y332、Y642、Y680和Y747(其中通過與SEQ ID NO :4最佳比對(duì)來確定氨基酸位置)。本發(fā)明還提供了具有由在嚴(yán)格條件下與SEQ ID NO 1的互補(bǔ)序列雜交(例如,在與SEQ ID NO :1精確互補(bǔ)的核酸的實(shí)質(zhì)上整個(gè)長(zhǎng)度上雜交)的核酸編碼的氨基酸序列的分離的和/或重組的P -葡糖苷酶多肽變體,其中該編碼多肽在選自以下的位置具有至少一種或多種取代或缺失A478V、D203G、E344V、F287Y、H684Y、K100R、K291E、K291I、K342R、K456R、K54R、L149V、N355S、N650K、P739S、P790T、R330K、S408N、S86N、T150S、Y331C、Y641N、Y679F、Y746C和Y747C (其中通過與SEQ ID NO :2最佳比對(duì)來確定氨基酸位置),或其在選自以下的位置具有至少一種氨基酸殘基取代或缺失A479V、D204G、E345V、F288Y、H685Y、K101R、K292E、K292I、K343R、K457R、K55R、L150V、MIT、N356S、N651K、P740S、P791T、R331K、 S409N、S87N、T151S、Y332C、Y642N、Y680F (其中通過與 SEQ ID NO 4 最佳比對(duì)來確定氨基酸位置)。以上列出的發(fā)明的有益組合包括在以上鑒定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、或 24 或更多個(gè)位置處的取代的任何組
八
口 o旨在本文提供的Bgll變體包括除以上列出的氨基酸取代以外的另外的氨基酸取代(例如,另外的保守性取代)并且與野生型嗜熱子囊菌Bgll蛋白相比可小于全長(zhǎng)。因而,在一些實(shí)施方案中,本發(fā)明的Bgll變體包括相對(duì)于SEQ ID NO :2的插入和/或缺失(例如,在氨基端和/或羧基端截短)。嗜熱子囊菌Bgll蛋白的野生型分泌形式為約842個(gè)殘基長(zhǎng)度;本發(fā)明的變體可比野生型蛋白更長(zhǎng)或更短。為了舉例說明且非限制,在一些實(shí)施方案中,變體可比野生型長(zhǎng)度長(zhǎng)或短達(dá)約10%、達(dá)約5%、達(dá)約4%、達(dá)約3%、達(dá)約2%、或約達(dá)1%。根據(jù)本領(lǐng)域已知的方法(見WO 03/075129和美國(guó)專利申請(qǐng)序列第10/379,378號(hào),以及 Fox 等人,Protein Eng. ,16(8) :589-597[2003];和 Fox 等人,J. Theor.Biol. 234(2) :187-199 [2005],其全部通過引用并入本文)進(jìn)行變體的序列-活性分析,以鑒定可能提供對(duì)活性的最顯著影響的取代。本發(fā)明的一些3 -葡糖苷酶變體具有在第287位和第86位中的任一個(gè)或兩個(gè)位置包括至少一種氨基酸殘基取代(例如,F(xiàn)287Y和S86N)的氨基酸序列。本發(fā)明的一些¢-葡糖苷酶變體具有在選自以下的位置包括至少一種氨基酸殘基取代的氨基酸序列H684Y、K342R、P790T、S408N、T150S和Y641N,所述取代顯示是非常有益的取代。本發(fā)明的一些3-葡糖苷酶變體具有在選自以下的位置包括至少一種氨基酸殘基取代的氨基酸序列A478V、D203G、E344V、K291E、K291I、K456R、K54R、L149V、P739S、Y679F、和Y746C。另外,一些變體包括在SEQ ID NO :2的氨基末端增添蘇氨酸殘基的序列。應(yīng)認(rèn)識(shí)到,使用SEQ ID NO 2的編號(hào)提及上述有益的取代。使用SEQ ID NO 4的編號(hào),高度有益的取代包括F288Y和S87N,極其有益的取代包括H685Y、K343R、P791T、S409N、T151S和Y642N,并且另外的有益取代包括 A479V、D204G、E345V、K292E、K292I、K457R、K55R、L150V、M1T、P740S、Y680F和Y747C。適宜的組合包括在以上鑒定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18或更多個(gè)位置處的取代的任何組合。在一些實(shí)施方案中,本發(fā)明的¢-葡糖苷酶變體還具有其中在對(duì)應(yīng)于N356(使用SEQ ID NO :2的編號(hào))的位置沒有作出取代的氨基酸序列。在一些實(shí)施方案中,本發(fā)明的分離的和/或重組的¢-葡糖苷酶多肽變體與野生型嗜熱子囊菌Bgll或FfBgll至少約70%相同,并且包括選自以下的取代組 合T150S+Y641N+N650K;K100R+T150S+K291E+K342R+S408N+Y641N+P739S ;T150S+K342R+S408N+A478V+Y641N+Y679F ;L149V+T150S+K342R+S408N+K456R+Y641N+N650K;S86N+T150S+F287Y+Y641N+N650K ;K100R+T150S+K342R+N355S+S408N+Y641N+N650K ;S86N+T150S+F287Y+Y641N+N650K ;K54R+K100R+T150S+R330K+Y331C+K342R+N355S+S408N+Y641N ;D203G+K2911+E344V+Y746C ;和H684Y+P790T (其中通過與 SEQ ID NO :2最佳比對(duì)來確定氨基酸位置),或 T151S+Y642N+N651K ;M1T+K101R+T151S+K292E+K343R+S409N+Y642N+P740S ;M1T+T151S+K343R+S409N+A479V+Y642N+Y680F ;L150V+T151S+K343R+S409N+K457R+Y642N+N651K ;S87N+T151S+F288Y+Y642N+N651K ;K101R+T151S+K343R+N356S+S409N+Y642N+N65IK ;M1T+K55R+K101R+T151S+R331K+Y332C+K343R+N356S+S409N+Y642N ;K101R+T151S+K343R+N356S+S409N+Y642N+N65IK ;D204G+K292I+E345V+Y747C ;和 H685Y+P791T (其中通過與 SEQID NO 4最佳比對(duì)來確定氨基酸位置)。如以上指出的,本發(fā)明包括的P -葡糖苷酶多肽具有與SEQ ID NO :2或與SEQ IDNO :4至少約70%的序列同一性。在一些實(shí)施方案中,本發(fā)明包括的¢-葡糖苷酶多肽包括具有與SEQ ID NO: 2或與SEQ ID NO :4至少約71 %相同、至少約72%相同、至少約73%相同、至少約73%相同、至少約74%相同、至少約75%相同、至少約76%相同、至少約77%相同、至少約78%相同、至少約79%相同、至少約80%相同、至少約81%相同、至少約82%相同、至少約83%相同、至少約84%相同、至少約85%相同、至少約86%相同、至少約87%相同、至少約88%相同、至少約89%相同、至少約90%相同、至少約91%相同、至少約92%相同、至少約93%相同、至少約94%相同、至少約95%相同、至少約96%相同、至少約97%相同、至少約98%相同或至少約99%相同的氨基酸序列的P -葡糖苷酶多肽。本文的每個(gè)“至少約70% ”敘述應(yīng)理解成還可選地包括以上更高值中的任何一個(gè)。如以上所指出的,在一些實(shí)施方案中,本發(fā)明的Bgl I變體還包括除以上列出的取代之外的另外的氨基酸取代,包括,例如具有在氨基酸序列中作出的一個(gè)或多個(gè)另外的保守性取代的變體。保守性取代的實(shí)例在堿性氨基酸(精氨酸、賴氨酸或組氨酸)、酸性氨基酸(谷氨酸或天冬氨酸)、極性氨基酸(谷氨酰胺和天冬酰胺)、疏水氨基酸(亮氨酸、異亮氨酸和纈氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)以及小氨基酸(甘氨酸、丙氨酸、絲氨酸、蘇氨酸、脯氨酸、半胱氨酸和甲硫氨酸)的組內(nèi)。一般不改變比活度(specificactivity)的氨基酸取代是本領(lǐng)域已知的。最常出現(xiàn)的交換包括但不限于Ala/Ser、Val/lie、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和 Asp/Gly,以及這些對(duì)顛倒過來。本發(fā)明的¢-葡糖苷酶多肽變體的保守取代的變異包括用同一保守取代組的保守選擇的氨基酸取代小百分比、通常少于約5%、更通常少于約2%、并且通常少于約1%的多肽序列的氨基酸。不改變編碼的¢-葡糖苷酶活性的序列的增添,諸如非功能性或非編碼序列的增添被認(rèn)為是0-葡糖苷酶多核苷酸的保守變異。本發(fā)明還提供了本文描述的¢-葡糖苷酶多肽變體的酶活性片段,其中該片段具有¢-葡糖苷酶活性和本文描述的至少一種取代。本發(fā)明還包括含截短的氨基末端和/或羧基末端的P-葡糖苷酶變體。據(jù)此,本發(fā)明還提供了具有如下氨基酸序列的分離的和/或重組的P -葡糖苷酶變體所述氨基酸序列具有相對(duì)于SEQ ID NO :2或4的來自羧基(C-)末端、氨基(N-)末端、或二者的約I個(gè)至約50個(gè)氨基酸殘基的缺失(即,來自N末端或C末端中任一個(gè)或二者的 1、2、3、4、5、6、7、8、9、10、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、
49、或50個(gè)氨基酸殘基的缺失)。在一些實(shí)施方案中,缺失是來自N末端的約I個(gè)至約15個(gè)氨基酸殘基和/或來自C末端的約I個(gè)至約40個(gè)氨基酸殘基。這些¢-葡糖苷酶片段在本文還分別稱為“N末端截短的”和“C末端截短的” P -葡糖苷酶多肽變體。在一些實(shí)施方案中,缺失是來自C末端、N末端或兩個(gè)末端的約I個(gè)至約30個(gè)、或約I個(gè)至約20個(gè)、或 約I個(gè)至約10個(gè)殘基、或約I個(gè)至約5個(gè)殘基。與SEQ ID NO :2具有至少約70%序列同一性和本文公開的一個(gè)或多個(gè)取代的本發(fā)明的一些3-葡糖苷酶變體除本文具體給出的那些以外還具有一個(gè)或多個(gè)取代、缺失或插入。此類取代、缺失或插入對(duì)3 -葡糖苷酶活性和熱穩(wěn)定性的作用(如果有的話)可使用本領(lǐng)域已知的任何適宜的測(cè)定來確定。為了舉例說明,TaB2具有以下相對(duì)于SEQ IDNO :2的取代T151S+Y642N+N651K。為了確定為了確定另外的取代(例如,SEQ ID NO:2第4位的亮氨酸被纈氨酸替代)的作用,表達(dá)了變體(在該實(shí)例中,SEQ ID N0:2,具有L4V+T151S+Y642N+N651K)并將其性質(zhì)與親本(在該實(shí)例中,TaB2)進(jìn)行比較。在一些實(shí)施方案中,產(chǎn)生了 ¢-葡糖苷酶多肽變體(以及編碼變體的多核苷酸)的文庫(kù)并篩選(例如,使用高通量篩選)¢-葡糖苷酶活性的存在。在一些實(shí)施方案中,本領(lǐng)域已知的誘變和定向進(jìn)化方法被應(yīng)用于編碼本文示例的P-葡糖苷酶變體的多核苷酸來產(chǎn)生變體文庫(kù),使用任何適宜的方法包括本文描述的那些方法對(duì)所述變體文庫(kù)進(jìn)行表達(dá)、篩選和測(cè)定。誘變和定向進(jìn)化方法是本領(lǐng)域熟知的(見,例如,Ling,等人,Anal. Biochem.,254 :157-78 [1999] ;Dale 等人,Methods Mol. Biol. ,57 :369-74[1996] ;Smith, Ann. Rev.Genet. ,19 :423-462[1985] ;Botstein 等人,Science,229 :1193-1201[1985] ;Carter,Biochem. J.,237 :1_7[1986] ;Kramer 等人,Cell, 38 :879-887[1984] ;ffells 等人,Gene,34 315-323[1985] ;Minshull 等人,Curr. Op. Chem. Biol. , 3 :284-290[1999] ;Christians等人,Nat. Biotechnol. , 17 :259-264 [1999] ;Crameri 等人,Nature, 391 :288-291 [1998];Crameri 等人,Nat. Biotechnol.,15 :436-438 [1997] ;Zhang 等人,Proc. Nat. Acad. Sci.,U. S. A.,94 :45-4-4509[1997] ;Crameri 等人,Nat.Biotechnol.,14 :315-319[1996];Stemmer, Nature,370 :389-391 [1994] ;Stemmer, Proc. Nat. Acad.Sci. , U. S. A. ,91 10747-10751[1994] ;W095/22625 ;W0 97/0078 ;W0 97/35966 ;W0 98/27230 ;W0 00/42651 ;和TO 01/75767,其全部通過引用并入本文)。在產(chǎn)生在除上文描述的那些以外的位置包括取代、插入或缺失的變體時(shí),普通熟練的實(shí)踐者將認(rèn)識(shí)到¢-葡糖苷酶蛋白的某些區(qū)域?qū)θ〈?尤其是非保守性取代)的耐受性比其他區(qū)域更小。因而,在一些實(shí)施方案中,Bgll蛋白變體保留來自親本的保守性殘基和功能結(jié)構(gòu)域。例如,幾個(gè)糖基水解酶第3家族(CH3型)的酶包括嗜熱子囊菌P -葡糖苷酶I的比對(duì)在確定用于修飾的位點(diǎn)方面具有用途。在這些比對(duì)的一些中,確定了 GH3活性位點(diǎn)、催化殘基和該家族中保守的(相似的)或高度保守的(相同的)的殘基(見,例如,Bhatia 等人,Crit Rev Biotechnol. ,22 :375-407 [2002];和 Hong 等人,上文;二者均通過引用并入本文)。在本發(fā)明的一些實(shí)施方案中,蛋白變體保留了來自親本的這些殘基或殘基類別中的一些或全部(即,不存在對(duì)一些或全部保守位置的取代)。
權(quán)利要求
1.ー種β-葡糖苷酶變體,包括具有至少ー種修飾的與SEQ ID NO :2至少約70%相同或由在嚴(yán)格條件下與SEQ ID NO :1的互補(bǔ)序列雜交的核酸編碼的氨基酸序列,其中所述變體具有比SEQ ID NO :2更大的酶活性。
2.ー種β -葡糖苷酶變體,包括與SEQ ID NO 4至少約70 %相同并且具有至少ー種相對(duì)于SEQ ID NO :4的本文所述的氨基酸殘基的修飾的氨基酸序列,其中所述變體具有比SEQ ID NO :4更大的酶活性。
3.如權(quán)利要求I所述的葡糖苷酶變體,其中所述多肽在選自Α478、D203、Ε344、F287、Η684、Κ100、Κ291、Κ342、Κ456、Κ54、L149、Ν355、Ν650、Ρ739、Ρ790、R330、S408、S86、Τ150、Υ331、Υ641、Υ679和Υ746的位置包括至少ー種氨基酸殘基取代。
4.如權(quán)利要求2所述的β-葡糖苷酶變體,其中所述多肽在選自Α479、D204、Ε345、F288、H685、K101、K292、K343、K457、K55、L150、M1、N356、N651、P740、P791、R331、S409、S87、T151、Y332、Y642、Y680和Y747的位置包括至少ー種氨基酸殘基取代。
5.如權(quán)利要求4所述的β-葡糖苷酶變體,其中所述至少一種氨基取代選自T151S、Υ642Ν、Ν651Κ、D204G、Κ292Ι、E345V、Y747C、Η685Υ、和 Ρ791Τ。
6.如權(quán)利要求5所述的β-葡糖苷酶變體,其中編碼所述變體的多核苷酸序列包括選自tl044c、tl656a、t2052c和a2520g的至少ー種堿基改變。
7.如權(quán)利要求2所述的β-葡糖苷酶變體,其中所述至少一種氨基酸取代選自T151S、Υ642Ν、Ν651Κ、K101R、T151S、K343R、N356S、S409N、Υ642Ν、Ν651Κ、K101R、T151S、K343R、N356S、S409N、Υ642Ν、Ν651Κ、MIT、K55R、K101R、T151S、R331K、Y332C、K343R、N356S、S409N、Υ642Ν、MIT、K101R、T151S、Κ292Ε、K343R、S409N、Υ642Ν、P740S、MIT、T151S、K343R、S409N、A479V、Y642N、Y680F、L150V、T151S、K343R、S409N、K457R、Y642N、N651K、S87N、T151S、F288Y、Y642N 和 N651K。
8.如權(quán)利要求2、4、5和6中任一項(xiàng)所述的β-葡糖苷酶變體,其中編碼所述變體的多核苷酸序列包括選自al515g、gl65a、t651c和726c的至少一種堿基改變。
9.如權(quán)利要求2、4、5和6中任一項(xiàng)所述的β-葡糖苷酶變體,其中所述至少一種氨基酸取代選自取代組合 T151S-Y642N-N651K、D204G-K292I-E345V-Y747C 和 H685Y-P791T。
10.如權(quán)利要求2、4、7和8中任一項(xiàng)所述的β-葡糖苷酶變體,其中所述至少ー種氨基酸取代選自以下取代組合T151S-Y642N-N651K、K101R-T151S-K343R-N356S-S409N-Y642N-N651K 、M1T-K55R-K101R-T151S-R331K-Y332C-K343R-N356S-S409N-Y642N、M1T-K101R-T151S-K292E-K343R-S409N-Y642N-P740S、MlT-T 151S-K343R-S409N-A479V-Y642N-Y680F 、 LI50V-TI5IS-K343R-S409N-K457R-Y642N-N65IK 和 S87N-T 151S-F288Y-Y642N-N651K。
11.ー種多核苷酸序列,編碼權(quán)利要求1-10中任一項(xiàng)給出的所述β-葡糖苷酶變體。
12.—種表達(dá)載體,包括至少ー種權(quán)利要求11所述的多核苷酸序列。
13.—種宿主細(xì)胞,包含權(quán)利要求12所述的表達(dá)載體。
14.一種用于產(chǎn)生至少ー種β_葡糖苷酶多肽變體的方法,所述方法包括提供包含所述權(quán)利要求12的表達(dá)載體的所述權(quán)利要求13的宿主細(xì)胞,并且在使得所述β -葡糖苷酶多肽變體被表達(dá)的條件下培養(yǎng)所述轉(zhuǎn)化的宿主細(xì)胞。
15.如權(quán)利要求14所述的方法,還包括分離所述β-葡糖苷酶變體的步驟。
16.—種組合物,其包括至少ー種在權(quán)利要求1-10任ー項(xiàng)中提供的β-葡糖苷酶變體。
17.如權(quán)利要求16所述的組合物,還包括至少ー種另外的酶。
18.如權(quán)利要求17所述的組合物,其中所述至少ー種另外的酶是纖維素酶。
19.ー種轉(zhuǎn)化生物質(zhì)基質(zhì)以產(chǎn)生至少ー種可發(fā)酵的糖的方法,所述方法包括提供權(quán)利要求1-10中任一項(xiàng)所述的至少ー種β -葡糖苷酶變體和生物質(zhì)基質(zhì),并且在使得所述至少ー種β-葡糖苷酶變體將所述生物質(zhì)基質(zhì)轉(zhuǎn)化為至少ー種可發(fā)酵的糖的條件下將所述生物質(zhì)基質(zhì)暴露于所述至少ー種β-葡糖苷酶變體。
20.如權(quán)利要求19所述的方法,其中所述至少ー種可發(fā)酵的糖是葡萄糖。
21.如權(quán)利要求19和/或權(quán)利要求20所述的方法,其中在所述生物質(zhì)基質(zhì)暴露于所述至少ー種β -葡糖苷酶變體之前,所述生物質(zhì)基質(zhì)被預(yù)處理。
全文摘要
本發(fā)明提供了用于表達(dá)重組β-葡糖苷酶變體的組合物和方法以及重組β-葡糖苷酶變體在從纖維素生物質(zhì)產(chǎn)生可發(fā)酵的糖中的用途。
文檔編號(hào)C12N9/42GK102666848SQ201080051889
公開日2012年9月12日 申請(qǐng)日期2010年11月19日 優(yōu)先權(quán)日2009年11月25日
發(fā)明者利薩·M·紐曼, 蒂普納斯·貝德亞洛伊, 路易斯·克拉克 申請(qǐng)人:科德克希思公司