專利名稱:應用嗜糖假單胞菌g4-淀粉酶和其變體獲得乙醇的無葡糖淀粉酶的方法
應用嗜糖假單胞菌G4-淀粉酶和其變體獲得乙醇的無葡糖
淀粉酶的方法與相關申請的交叉引用本申請要求2008年1月2日提交的美國臨時申請61/006,240號的優(yōu)先權權益, 其在此引入作為參考。序列表附上包含SEQ ID NO :1_45的序列表,并且其在此引入作為參考。 發(fā)明領域來自嗜糖假單胞菌(Pseudomonas saccharophila)的α -淀粉酶、其熱穩(wěn)定突變 和編碼它們的核酸尤其在液化和糖化玉米漿以制備乙醇的方法中有用。背景將植物淀粉,尤其是玉米淀粉轉化為乙醇是迅速發(fā)展的工業(yè)。當前的方法由兩個 順次的酶催化步驟組成,其導致產(chǎn)生葡萄糖。然后應用酵母將葡萄糖發(fā)酵為乙醇。第一個酶催化步驟是淀粉液化。一般地,通過快速加熱至85°C或更高使淀粉懸液 膠化。α -淀粉酶(EC 3. 2. 1. 1)用于將該粘的液化物降解為麥芽糖糊精。α _淀粉酶是內(nèi) 切水解酶,其催化內(nèi)部a-l,4_D-糖苷鍵的隨機切割。隨著α-淀粉酶降解淀粉,粘度下 降。由于液化通常在高溫下進行,熱穩(wěn)定α-淀粉酶諸如來自芽孢桿菌屬(Bacillus sp.) 的α-淀粉酶對于這一步驟是優(yōu)選的。以這一方式產(chǎn)生的麥芽糖糊精一般不能被酵母發(fā)酵形成醇。因此需要第二個酶催 化的糖化步驟以降解麥芽糖糊精。葡糖淀粉酶和/或生麥芽糖α-淀粉酶通常用于催化液 化后形成的麥芽糖糊精非還原末端的水解,釋放D-葡萄糖、麥芽糖和異麥芽糖。脫支酶諸 如支鏈淀粉酶可用于幫助糖化。糖化通常在升高的溫度下在酸性條件下進行,例如60°C, pH 4. 3。用于產(chǎn)生乙醇的酵母之一是釀酒酵母(Saccharomyces cerevisiae)。釀酒酵 母含有α-葡糖苷酶,已顯示其利用單糖、二糖和三糖作為底物。Yoon等,Carbohydrate Res. 338 1127-32 (2003)。釀酒酵母利用三糖的能力可通過補充Mg2+和過量表達AGTl透 酶(Stambuck 等,Lett. Appl. Microbiol. 43 :370_76 (2006))、過量表達 MTTl 和 MTTlalt 以 增加麥芽三糖攝入(Dietvorst等,Yeast 22 :775_88 (2005))、或在細胞表面表達麥芽糖酶 MAL32 (Dietvorst等,Yeast 24 =27-38(2007))而得以改善。如果液化步驟產(chǎn)生充足水平的 單糖、二糖或三糖并且使用釀酒酵母或其遺傳修飾變體用于發(fā)酵步驟的話,則可完全省略 糖化步驟。嗜糖假單胞菌表達形成麥芽四糖的麥芽四糖水解酶(EC 3. 2. 1. 60 ;G4-形成淀粉 酶;G4-淀粉酶;本文稱為“Amy3A”或“PS4” )。已確定了編碼PS4的嗜糖假單胞菌基因的 核苷酸序歹1J ° Zhou 等人,“Nucleotide sequenceof the maltotetraohydrolase gene from Pseudomonas saccharophila, "FEBSLett. 255 37-41 (1989) ;GenBank 登錄號 X16732。PS4 作為具有N端21個殘基信號肽的前體蛋白質(zhì)表達。PS4的成熟形式如SEQ ID NO :1所示,其含有530個氨基酸殘基,在N端具有催化結構域以及在C端具有淀粉結合結構域。PS4展 示出內(nèi)切和外切α-淀粉酶活性。內(nèi)切α-淀粉酶活性可用于降低膠化淀粉的粘度,以及 外切α-淀粉酶活性可用于將麥芽糖糊精降解為更小的糖。然而已認為PS4的外切α-淀 粉酶活性僅產(chǎn)生麥芽四糖,其不是釀酒酵母α-葡糖苷酶的合適底物。由于這一原因,已認 為PS4在液化玉米漿以產(chǎn)生乙醇的方法中是不適合的。概述與這一觀念相反,以及從如本文所述的新的發(fā)現(xiàn)中,提供了新的條件,在這一條件 下嗜糖假單胞菌G4-形成淀粉酶(PS4)可有利地用于酶催化的液化步驟,以從淀粉(例如, 玉米淀粉、小麥淀粉或大麥淀粉)產(chǎn)生乙醇。在本發(fā)明的方法中,野生型PS4產(chǎn)生顯著量的 麥芽三糖,其可在隨后的發(fā)酵步驟中被釀酒酵母利用以產(chǎn)生乙醇。PS4的這一特性有利地允 許在沒有糖化步驟的情況下從液化淀粉中產(chǎn)生乙醇。一般地,在 85°C進行淀粉液化。然而,PS4的熔解溫度(Tm)在pH 5. 5是65°C。 然而,在一個實施方案中,PS4可在以下方法中液化玉米淀粉將淀粉預加熱至70°C,然后 與PS4混合并迅速加熱至85 °C,并且在這一溫度下保持30分鐘。這一液化產(chǎn)物的HPLC分 析顯示,除了麥芽四糖之外,PS4還產(chǎn)生了顯著量的麥芽三糖。在另一實施方案中,比野生型PS4更熱穩(wěn)定的PS4變體在液化中顯示出改善的性 能,如通過液化物的粘度所測量的那樣。特定的變體包括其中移除了 C端淀粉結合結構域 的PS4的截短形式。其它熱穩(wěn)定變體包含對野生型PS4酶序列的一個或多個氨基酸修飾, 或?qū)端截短的PS4變體序列的修飾。與野生型PS4相比較,PS4變體可有利地產(chǎn)生比麥芽四糖更多的麥芽三糖。此 外,PS4變體甚至比當前使用的淀粉酶,諸如SPEZYME Xtra(Danisco US Inc.,Genencor Division)產(chǎn)生更多的葡萄糖和麥芽糖。這導致觀察到的更高的來自發(fā)酵的乙醇產(chǎn)量,在應 用發(fā)酵葡萄糖和麥芽糖的酵母的實施方案中其可超過2. 5% ν/ν乙醇。預期可應用能代謝 麥芽三糖的酵母株諸如釀酒酵母可進一步增加通過發(fā)酵由PS4變體產(chǎn)生的液化物的乙醇 產(chǎn)量。因此,本公開提供了加工淀粉的方法,其包括通過添加嗜糖假單胞菌淀粉酶(PS4) 變體而液化淀粉和/或糖化淀粉液化物以形成糖漿,其中所述的變體包含與SEQ ID NO=U SEQ ID NO :1的殘基1至429或SEQ ID NO :2的氨基酸序列具有至少90%、91 %、92%、 93%、94%、95%、96%、97%、98% 或 99% 序列同一性的序列。與 SEQ ID NO =USEQ ID NO: 1的殘基1-429或SEQ ID NO 2的氨基酸序列相比,該PS4變體可具有經(jīng)改變的熱穩(wěn)定 性、經(jīng)改變的內(nèi)切淀粉酶活性、經(jīng)改變的外切淀粉酶活性、和/或經(jīng)改變的外切與內(nèi)切淀粉 酶活性的比。該PS4變體可包含一個或多個以下氨基酸替換SEQ ID N0:l、2、3、4、5或6 的 N33Y、D34N、G70D、K71R、V113I、G121A/D/F、G134R、A141P、N145D、Y146G、I157L、G158T、 S161A、L178F、A179T、Y198F、G223A/E/F、S229P、H272Q、V290I、G303E、H307K/L、A309P、 S334P、W339E和/或D343E。該PS4變體可包含SEQ ID NO :3、4、5或6的氨基酸序列。該 PS4變體可在以下位置處包含一個或多個氨基酸替換SEQ ID NO :1、2、3、4、5或6的7、8、 32、38、49、62、63、64、67、72、73、74、75、76、104、106、107、110、112、116、119、122、123、124、 125、126、128、130、137、138、140、142、143、144、148、149、150、151、154、156、163、164、168、 169、182、183、192、195、196、200、202、208、213、220、222、225、226、227、232、233、234、236、
8237、239、253、255、257、260、264、267、269、271、276、282、285、295、297、300、302、305、308、 312、323、324、325、341、358、367、379、390 ;一個或多個以下氨基酸替換:SEQ ID NO :1、2、3、 4、5 或 6 的 A3T、G9A、H13R、I46F、D68E、G69A/E/H/I/K/M/R/T、G70A/E/L/P/Q/S/V、K71M、 G100A/S、G121I/P/R、A131T、G134C、A141S、N145S、Y146D/E、G153A/D、G158C/F/I/L/P/Q/ V、S161G/H/K/P/R/T/V、G166N、1170E/K/L/M/N、L178N/Q/W、A179E/N/P/R/S、A179S、G184Q、 G188A、A199P、G223C/F/H/M/N/Q/W/Y、S229N、W238E/G/K/P/Q/R、G303L、H307D/E/F/G/K/M/ P/Q/R/S/W/Y、A309E/I/M/T/V、S334A/H/K/L/M/Q/R/T 和 / 或 H335M ;和 / 或在 SEQ IDNO 1 的420、422和/或424位置處的一個或多個氨基酸替換。本發(fā)明公開的PS4變體可包含一 個或多個以下氨基酸替換:SEQ ID NO :1、2、3、4、5 或 6 的 A3T、P7S、A8N、G9A、H13R、P32S、 I38M、I46F、D49V、D62N、F63A/D/E/L/V、S64N/T、T67G/H/K/N/Q/R/V、D68E、G69A/E/H/I/K/ M/R/T、G70A/E/L/P/Q/S/V、K71M、S72E/K/N/T、G73D/E/L/M/N/S/T、G74S、G75C/E/F/R/S/W/ Y、E76V、G100A/S、G104N/R、G106K、V107M、L110F、D112E、N116D、N119E/G/S/Y、G121I/P/R、 Y122A/E/Q/W、P123S、D124S、K125A/D/E/G/P/Q/W、E126D/N、N128E、P130S、A131T、G134C、 R137C、N138D/E/S、C140A/R、A141S、D142E/G/N、P143T、G144E、N145S、Y146D/E、N148K/S、 D149H/L/V、C150A、D151A/V/W、G153A/D、D154E/G/Y、F156Y、G158C/F/I/L/P/Q/V、S161G/H/ K/P/R/T/V、L163M、N164R、G166N、P168L、Q169D/E/G/K/N/R/V、I170E/K/L/M/N、L178N/Q/ W、A179E/N/P/R/S、R182D/G/H/M/S、S183G、G184Q、G188A、F192M/Y、V195D、R196A/G/K/P/ Q/S/T/V/Y、A199P、P200A/G、R202K、S208T、S213N、L220A/T、K222M/Y、G223C/F/H/M/N/Q/ W/Y、S225E/G/V、E226C/D/G/W、Y227C/D/G/K/T、S229N、W232F/G/H/I/K/L/N/P/Q/R/S/T/Y, R233H、N234R、A236E、S237D/G、W238E/G/K/P/Q/R、Q239L、V253G、D255V、A257V、E260K/R、 N264D、V267I、D269N/S/V、K271A/L/Q、G276R、W282S、V285A、T295C、Y297H、G300E、N302K、 G303L、Q305E/L/T、H307D/E/F/G/K/M/P/Q/R/S/W/Y, W308A/C/G/K/N/Q/R/S/T, A309E/I/M/ T/V、D312E、W323M、T324A/L/M、S325G、S334A/H/K/L/M/Q/R/T、H335M、Y341C/E、R358A/E/ G/L/N/Q/T/V、S367Q/R、S379G 和 / 或 D390E ;和 / 或 SEQ ID NO 1 的 S420G、D422N/P/Q 和 /或G424D/S中的一個或多個替換。一方面,PS4變體可包含在以下位置處的一個或多個 氨基酸替換:SEQ ID NO :1、2、3、4、5 或 6 的 7、32、49、62、63、64、72、73、74、75、76、107、110、 112、116、119、122、123、125、128、130、137、138、140、142、143、144、148、149、150、151、154、 156、163、164、168、169、182、183、192、195、196、202、220、222、226、227、232、233、234、236、 237、239、253、255、257、260、264、269、271、276、282、285、297、300、302、305、308、312、323、 324、325、341、358、367 和/ 或 379 ;—個或多個以下氨基酸替換SEQ ID NO :1、2、3、4、5 或6 的 A3T、H13R、I38M、I46F、T67G/H/K/N/Q/R/V、G69A/E/H/I/K/M/R/T、G70E/L/P/Q/V、K71M、 G100A/S、G104R、G106K、G121I/P/R、D124S、E126D/N、A131T、G134C、A141S、N145S、Y146D/ E、G153A/D、G158C/F/I/L/P/Q/V、S161G/H/K/P/R/T/V、G166N、I170E/K/L/M/N、L178N/Q/W、 A179E/N/P/R/S、G188A、A199P、P200A、G223C/F/H/M/N/Q/W/Y、S225E/G/V、W238E/G/K/P/ Q/R、T295C、G303L、H307D/G/M/P/S、A309E/I/M/T/V、S334A/H/K/L/M/Q/R/T、H335M 和 / 或 D390E ;SEQ ID NO 1的S420G和/或D422/N/P/Q中的一個或多個氨基酸替換;和/或在 SEQ IDNO :1的位置424處的氨基酸替換。另一方面,PS4變體可包含一個或多個以下氨基 酸替換:SEQ ID NO :1、2、3、4、5 或 6 的 A3T、P7S、H13R、P32S、I38M、I46F、D49V、D62N、F63A/ D/E/L/V、S64N/T、T67G/H/K/N/Q/R/V、G69A/E/H/I/K/M/R/T、G70E/L/P/Q/V、K71M、S72E/K/
9N/T、G73D/E/L/M/N/S/T、G74S、G75C/E/F/R/S/W/Y、E76V, G100A/S、G104R、G106K、V107M、 Ll10F、Dl12E、Nl16D、Nl19E/G/S/Y、G1211/P/R、Y122A/E/Q/W、P123S、D124S、K125A/D/E/G/ P/Q/W、E126D/N、N128E、P130S、A131T、G134C、R137C、N138D/E/S、C140A/R、A141S、D142E/G/ N、P143T、G144E、N145S、Y146D/E、N148K/S、D149H/L/V、C150A、D151A/V/W、G153A/D、D154E/ G/Y、F156Y、G158C/F/I/L/P/Q/V、S161G/H/K/P/R/T/V、L163M、N164R、G166N、P168L、Q169D/ E/G/K/N/R/V、1170E/K/L/M/N、L178N/Q/W、A179E/N/P/R/S、R182D/G/H/M/S、S183G、G188A、 F192M/Y、V195D、R196A/G/K/P/Q/S/T/V/Y、A199P、P200A、R202K、L220A/T、K222M/Y、G223C/ F/H/M/N/Q/W/Y、S225E/G/V、E226C/D/G/W、Y227C/D/G/K/T、W232F/G/H/I/K/L/N/P/Q/R/S/ T/Y、R233H、N234R、Α236Ε、S237D/G、W238E/G/K/P/Q/R、Q239L、V253G、D255V、A257V、Ε260Κ/ R、N264D、D269N/S/V、K271A/L/Q、G276R、W282S、V285A、T295C、Y297H、G300E、N302K、G303L、 Q305E/L/T、H307D/G/M/P/S、W308A/C/G/K/N/Q/R/S/T、A309E/I/M/T/V、D312E、W323M、 T324A/L/M、S325G、S334A/H/K/L/M/Q/R/T, H335M、Y341C/E、R358A/E/G/L/N/Q/T/V, S367Q/ R、S379G和/或D390E ;和/或一個或多個以下氨基酸替換SEQ ID NO 1的S420G、D422N/ P/Q和/或G424D/S。在其它方面,PS4變體可包含在以下位置處的一個或多個氨基酸替換 SEQID NO :1、2、3、4、5、或 6 的 49、62、63、64、72、73、74、75、76、107、112、116、119、122、123、 125、128、130、137、140、143、144、148、149、150、151、154、156、163、164、168、169、182、183、 192、195、196、202、257、282、285、297、300、305、308、312、323 和 / 或 325 ;一個或多個以下 氨基酸替換:SEQ ID NO :1、2、3、4、5 或 6 的 A3T、P7S、H13R、I38M、I46F、T67G/H/K/N/Q/R/ V、G69A/E/H/I/K/M/R/T、G70E/L/P/Q/V、K71M、G100A/S、G104R、G106K、L110F、G121I/P/R、 D124S、E126D/N、A131T、G134C、N138D/E、D142/E/G/N、N145S、Y146D/E、G153A/D、G158C/F/ I/L/P/Q/V、S161G/H/K/P/R/T/V、G166N、1170E/K/L/M、L178N/Q/W、A179E/N/P/R/S、G188A、 A199P、P200A、L220T、K222M/Y、G223C/F/H/M/N/Q/W/Y、S225E/V、E226C/D/G/W、Y227C/D/ G/K/T、W232F/G/H/1/K/N/P/Q/R/S/T/Y, R233H、N234R、A236E、S237D/G、W238E/G/K/P/Q/R、 Q239L、V253G、D255V、E260K/R、N264D、D269N/S/V、K271A/L/Q、G276R、T295C、N302K、G303L、 H307D/G/M/P/S、A309E/I/M/T/V、T324L/M、S334A/H/K/L/M/Q/R/T、H335M、Y341C/E、R358A/ E/G/L/N/Q/T/V、S367Q/R、S379G 和 / 或 D390E ;和一個或多個以下氨基酸替換SEQ ID NO 1的S420G、D422/N/P/Q和/或G424S。在再另一方面,PS4變體可包含一個或多個以下氨基 酸替換:SEQ ID NO :1、2、3、4、5 或 6 的 A3T、P7S、H13R、I38M、I46F、D49V、D62N、F63A/D/E/ L/V、S64N/T、T67G/H/K/N/Q/R/V、G69A/E/H/I/K/M/R/T、G70E/L/P/Q/V、K71M、S72E/K/N/T、 G73D/E/L/M/N/S/T、G74S、G75C/E/F/R/S/W/Y、E76V、G100A/S、G104R、G106K、V107M、Ll 10F、 Dl12E、Nl16D、Nl19E/G/S/Y、G1211/P/R、Y122A/E/Q/W、P123S、D124S、K125A/D/E/G/P/Q/W、 E126D/N、N128E、P130S、A131T、G134C、R137C、N138D/E、C140A/R、D142E/G/N、P143T、G144E、 N145S、Y146D/E、N148K/S、D149H/L/V、C150A、D151A/V/W、G153A/D、D154E/G/Y、F156Y、 G158C/F/I/L/P/Q/V、S161G/H/K/P/R/T/V、L163M、N164R、G166N、P168L、Q169E/G/K/N/R/V、 1170E/K/L/M、L178N/Q/W、A179E/N/P/R/S、R182D/G/H/M/S、S183G、G188A、F192M/Y、V195D、 R196A/G/K/P/Q/S/T/V/Y、A199P、P200A、R202K、L220T、K222M/Y、G223C/F/H/M/N/Q/W/Y、 S225E/V、E226C/D/G/W, Y227C/D/G/K/T、W232F/G/H/I/K/N/P/Q/R/S/T/Y、R233H、N234R、 A236E、S237D/G、W238E/G/K/P/Q/R、Q239L、V253G、D255V、A257V、E260K/R、N264D、D269N/S/ V、K271A/L/Q、G276R、W282S、V285A、T295C、Y297H、G300E、N302K、G303L、Q305E/L/T、H307D/G/M/P/S、W308A/C/G/K/N/Q/R/S/T、A309E/I/M/T/V、D312E、W323M、T324L/M、S325G、S334A/ H/K/L/M/Q/R/T、H335M、Y341C/E、R358A/E/G/L/N/Q/T/V、S367Q/R、S379G 和 / 或 D390E,和 /或一個或多個以下氨基酸替換SEQ ID NO 1的420G、D422N/P/Q和/或G424S。與SEQ ID NO :1、2、3、4、5或6的氨基酸序列相比較,該PS4變體可具有多達25、23、21、19、17、15、 13或11個氨基酸的缺失、添加、插入或替換。本發(fā)明考慮了在以下位置處包含額外的一個或多個氨基酸替換的PS4變體SEQ ID NO :1 或 2 的 N33、D34、G70、G121、G134、A141、Y146、I157、S161、L178、A179、G223、S229、 H307、A309和/或S334。一方面,PS4變體包含一個或多個以下氨基酸替換SEQ ID NO 1 或 2 的 N33Y、D34N、G70D、G121F、G134R、A141P、Y146G、I157L、S161A、L178F、A179T、G223E、 S229P、H307K、A309P 和 / 或 S334P。本發(fā)明還考慮了與SEQ ID NO =USEQ ID NO 1的殘基1至429或SEQ ID NO :2的 氨基酸序列相比具有改變的熱穩(wěn)定性的PS4變體。該PS4變體可比SEQ ID NO=U SEQ ID NO 1的殘基1至429或SEQ ID NO 2的氨基酸序列更熱穩(wěn)定。一方面,該更熱穩(wěn)定的PS4 變體可包含一個或多個以下氨基酸替換SEQ ID NO :1或2的A3T、I38M、G70L、Q169K/R、 R182G/H、P200G、G223N、S237D、D269V、K271A/Q、S367Q/R、S379G 和 / 或 S420G。另一方面, 更熱穩(wěn)定的PS4變體可包含額外的在以下位置處的一個或多個氨基替換SEQ ID N0:1或 2的G134、A141、I157、G223、H307、S334和/或D343。在其它方面,更熱穩(wěn)定的PS4變體可 包含一個或多個以下氨基酸替換:SEQ ID NO :1或2的G134R、A141P、I157L、G223A、H307L、 S334P和/或D343E。在再另一方面,該PS4變體還可包含一個或多個在以下位置處的氨基 酸替換SEQ ID N0:1或2的N33、D34、K71、L178和/或A179。該PS4變體可包含一個或 多個氨基酸替換SEQ ID N0:1或2的N33Y、D34N、K71R、L178F和/或A179T。本發(fā)明還考慮了與SEQ ID NO =USEQ ID NO 1的殘基1至429或SEQ ID NO :2的 氨基酸序列相比可具有改變的內(nèi)切淀粉酶活性、改變的外切淀粉酶活性和/或改變的外切 與內(nèi)切淀粉酶活性比的PS4變體。該PS4變體可包含一個或多個以下氨基酸替換SEQ ID NO :1 或 2 的 A3T、G69K、G70E、K71M、G73D/E、G75C/E、Y122A、C140A、G144E、Y146D/E、N148K、 C150A、D151A/V/W、G153A、G158I/P、S161G/H/K/P/R、Q169D/E/G/N/R、R196Q/S/T、R202K、 S208T、S213N、K222M、G223C/F/H/M/Q/W/Y、E226D、Y227D/G/K/T、S229N、W232Q/S/T、T295C、 Q305T、W308A/C/G/Q/R/S/T、A309I/V、W323M、T324L/M、S334A/H/M/Q 和 / 或 R358E/L/N/Q/ T/V。該PS4變體可包含額外的一個或多個在以下位置處的氨基酸替換SEQ ID N0:1或2 的 W66、I157、E160、S161、R196、W221、K222、E226、D254、Q305、H307 和 / 或 W308。該 PS4 變 體可包含一個或多個以下氨基酸替換SEQ ID NO :1或2的W66S、E160F/G/L/P/R/S、S161A、 R196H/P/V、W221A、K222T、Q305T/L、H307L 和 / 或 W308A/L/S。 在一個方面,與SEQ ID NO =USEQ ID NO 1的殘基1至429或SEQID NO 2的氨基 酸序列相比較,PS4變體可具有升高的內(nèi)切淀粉酶活性或降低的外切與內(nèi)切淀粉酶活性比。 該PS4變體可包含一個或多個以下氨基酸替換SEQ ID NO :1或2的G69K、G73D/E、Y122A、 C140A、C150A、G153A、G158I/P、S161G/H/K/P/R、Q169R、S208T、S229N、T295C、Q305T 和 / 或 R358E/L/Q/T/V。該PS4變體可包含額外的一個或多個在以下位置處的氨基酸替換SEQ ID NO 1 或 2 的 W66S、R196H/P/V、W221A、K222T、H307L 和 / 或 W308。 另一方面,與SEQ ID NO =USEQ ID NO 1的殘基1至429或SEQID NO 2的氨基酸序列相比較,PS4變體可具有升高的外切淀粉酶活性或升高的外切與內(nèi)切淀粉酶活性比。該 PS4變體可包含一個或多個以下氨基酸替換SEQ ID NO :1或2的A3T、G70E、K71M、G75C/E、 G144E、Y146D/E、N148K、D151A/V/W、Q169D/E/G/N、R196Q/S/T、R202K、S213N、K222M、G223C/ F/H/M/Q/W/Y、E226D、Y227D/G/K/T、W232Q/S/T、W308A/C/G/Q/R/S/T、A309I/V、W323M、 T324L/M、S334A/H/M/Q和/或R358N。該PS4變體可包含額外的一個或多個以下氨基酸替 換=SEQ ID NO :1 或 2 的 E160F/G/L/P/R/S、S161A 和 / 或 Q305T/L。在其它方面,該淀粉加工方法還可包括添加脫支酶、異淀粉酶、支鏈淀粉酶、蛋白 酶、纖維素酶、半纖維素酶、脂肪酶、角質(zhì)酶或所述酶的任一組合至淀粉液化物。該淀粉加工 方法可適于來自玉米、玉米穗、小麥、大麥、黑麥、蜀黍、西米、木薯、木薯粉、高粱、稻、豌豆、 豆、香蕉或馬鈴薯的淀粉。在再另一方面,公開的淀粉加工方法可包括發(fā)酵糖漿以產(chǎn)生乙醇。該公開的方法 還可包括回收乙醇??赏ㄟ^蒸餾該淀粉獲得乙醇,其中發(fā)酵和蒸餾同時、分別或順次進行。附圖簡述附圖并入本文并且組成這一說明書的一部分,并且闡釋各實施方案。在下圖中, “PS4”由縮寫“SAS”替換。該縮寫指代同樣的蛋白質(zhì)并且可互換。
圖1描述了液化性能,作為時間(分鐘)的函數(shù)以粘度(PNm)測量,應用野生型 Amy3A G4-淀粉酶(SEQ ID NO 1)或熱穩(wěn)定的PS4變體CF135 (在C端融合有SEQ ID NO: 1 的殘基 419-429 的 SEQ ID NO 3)和 CF143 (在 C 端融合有 SEQ ID NO 1 的殘基 419-429 的 SEQ ID NO :4)。圖2描述了作為時間(小時)函數(shù)的乙醇產(chǎn)量(% v/v),應用熱穩(wěn)定PS4變體 CF149(在C端融合有SEQ ID NO 1的殘基419-429的SEQ ID NO 5)和CF154(在C端融合 有 SEQ ID NO :1 的殘基 419-429 的 SEQ ID NO :6),與用 SPEZYME Xtra (Danisco US Inc., Genencor Division)產(chǎn)生的液化物相比較。圖3描述了在與圖2所使用的相同條件下的作為時間(小時)函數(shù)的葡萄糖利用 w/v)。圖4描述了在與圖2所使用的相同條件下的作為時間(小時)函數(shù)的二糖(DP-2) 的% w/v的變化。圖5描述了在由CF149(在C端融合有SEQ ID NO :1的殘基419-429的SEQ ID NO 5)、CF154(在 C 端融合有 SEQ ID NO 1 的殘基 419-429 的 SEQ ID NO 6)或 Xtra 催化 的反應中乙醇的積累(% ν/ν)。圖6描述了在由CF149(在C端融合有SEQ ID NO :1的殘基419-429的SEQ ID NO 5)、CF154(在 C 端融合有 SEQ ID NO 1 的殘基 419-429 的 SEQ ID NO 6)或 Xtra 催化 的反應中葡萄糖的利用率(% w/v)。圖7描述了在由CF149(在C端融合有SEQ ID NO :1的殘基419-429的SEQ ID NO 5)、CF154(在 C 端融合有 SEQ ID NO 1 的殘基 419-429 的 SEQ ID NO 6)或 Xtra 催化 的反應中DP-2的利用率(% w/v)。圖8描述了具有阿卡波糖結合的PS4的晶體結構。圖9描述了 PS4與結合至活性部位裂口的阿卡波糖之間的相互作用。顯示了阿卡 波糖的糖位置+3至_3。
發(fā)明詳述提供了 PS4、其C端截短變體及其熱穩(wěn)定變體。PS4和其變體可用于加工淀粉,有 利地產(chǎn)生顯著量的麥芽三糖,所述麥芽三糖可在隨后的發(fā)酵步驟中被釀酒酵母或其遺傳工 程改造的變體所利用以產(chǎn)生乙醇。該產(chǎn)生乙醇的方法有利地不需要在糖化步驟中應用葡糖 淀粉酶和/或生麥芽糖α-淀粉酶以將麥芽糖糊精轉化為單糖、二糖和三糖。在說明書和 附圖中,PS4可偶爾作為SAS提及。“PS4”和“SAS”是同義的。1.定義和縮寫根據(jù)這一發(fā)明詳述,以下縮寫和定義適用。應當指出如本文中所用,單數(shù)形式“一 個”、“一種”和“該”包括復數(shù)稱謂,除非上下文另外清楚地說明。因此,例如,對“一種酶” 的提及包括多種此類酶,并且對“該制劑”的提及包括對本領域技術人員已知的一種或多種 制劑及其等價物的提及等。除非另外定義,本文中所用的全部技術及科學術語具有與本領域普通技術人員通 常所理解的相同意義。下文提供了以下術語。1. 1.定義“淀粉酶”尤其指能夠催化淀粉降解的酶。內(nèi)切作用淀粉酶活性以隨機方式切割淀 粉分子內(nèi)部α-D-(1 — 4)0-糖苷鍵。相反,外切作用解淀粉酶從底物的非還原末端切割淀 粉分子。當所述概念與PS4相關聯(lián)時,“內(nèi)切作用淀粉酶活性”、“內(nèi)切活性”、“內(nèi)切特異性活 性”、“內(nèi)切特異性”是同義的。對于外切活性的相應術語也是相同的。“變體”指多肽或核酸。術語“變體”可與術語“突變體”互換使用。變體包括分別 在氨基酸或核酸序列的一個或多個位置處的插入、替換、轉換、截短和/或顛換。術語“變體 多肽”和“變體酶”意思是這樣的PS4蛋白,其具有已從野生型PS4的氨基酸序列進行修飾的 氨基酸序列。變體多肽包括與親本酶具有某些百分比序列同一性的多肽,例如80%、85%、 90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%。如本文所使用的那樣,“親本 酶”、“親本序列”、“親本多肽”、“野生型PS4”和“親本多肽”的意思是變體多肽所基于的酶 和多肽,例如SEQ IDN0:1的PS4?!坝H本核酸”的意思是編碼親本多肽的核酸序列?!耙吧?型” PS4天然存在并且包括SEQ ID NO :1的PS4的天然存在的等位基因變體。“變體”的信 號序列可與野生型PS4的相同(SEQ ID NO 8)或不同。變體可表達為含有異源多肽的融合 多肽。例如,該變體可包含另一蛋白質(zhì)的信號肽或設計以幫助鑒定或純化所表達的融合蛋 白的序列,諸如His-標簽序列。為描述所考慮的被本發(fā)明包含的各種PS4變體,采用了以下命名法以易于指代。 當替換包括數(shù)字和字母時,例如141P,則這表示{根據(jù)編號系統(tǒng)的位置/替換的氨基酸}。 因此,例如將位置141位上的氨基酸替換為脯氨酸標記為141P。當替換包括字母、數(shù)字和字 母時,例如A141P,則這表示{原始氨基酸/根據(jù)編號系統(tǒng)的位置/替換的氨基酸}。因此, 例如,將141位上的丙氨酸替換為脯氨酸標記為A141P。當在特定位置處兩個和多個替換是可能時,這將通過連續(xù)的字母標記,其任選地 通過斜杠“/”分開,例如,G303ED和G303E/D。應用本領域已知的標準技術(例如,參見Smith和Waterman,Adv. App 1. Math. 2 482(1981) ;Needleman 禾口 Wunsch,J. Mol. Biol. 48 443(1970) ;Pearson 禾口 Lipman,Proc. Natl. Acad. Sci. USA 85:2444(1988);程序,諸如在 Wisconsin Genetics 軟件包中的 GAP、BESTHT、FASTA和 TFASTA (Genetics Computer Group,Madison, WI)和 Devereux 等,Nucleic Acid Res.,12 :387_395 (1984))確定序列同一性?!昂怂嵝蛄型恍园俜直?% ) ”和“氨基酸序列同一性百分比(% ) ”是指候選序 列中與初始序列(例如,PS4)的核苷酸殘基或氨基酸殘基相同的核苷酸殘基或氨基酸殘基 的百分比。可在初始序列的全長上測量序列同一性?!靶蛄型恍浴痹诒疚闹型ㄟ^序列比對方法得以確定。為本發(fā)明的目的,比對的 方法是由 Altschul (Altschul 等,J. Mol. Biol. 215 :403_410 (1990)和 Karlin 等,Proc. Natl. Acad. Sci. USA 90:5873-5787(1993))等描述的 BLAST。尤其有用的 BLAST 程序是 WU-BLAST-2 程序(參見 Altschul 等,Meth. Enzymol. 266 :460_480 (1996))。WU-BLAST-2 應 用若干個搜索參數(shù),其大多數(shù)設置為缺省值??稍O置的參數(shù)設置為以下值重疊跨度=1、 重疊部分=0.125、字閾值(T) = 11。HSP S和HSP S2參數(shù)是動態(tài)值并且通過程序自身依 據(jù)特定序列的組成和針對其對目的序列進行檢測的特定數(shù)據(jù)庫的組成建立。然而,可調(diào)節(jié) 該值以增加敏感性。々%氨基酸序列同一性值通過將匹配的同一殘基的數(shù)目除以在比對區(qū) 域“更長”序列的總殘基數(shù)得以確定?!案L”的序列是在比較區(qū)域具有最多真實殘基的序 列(忽略由WU-Blast-2為了最大化比對得分而引入的空位)?!白凅w核酸”可包括這樣的序列,所述序列與能夠與本文所示的核苷酸序列雜交的 序列互補。例如,變體序列與能夠在嚴格條件下(例如50°c和0. 2X SSCdX SSC = 0. 15M NaCl,0.015M檸檬酸鈉,pH 7. 0))和本文所示的核苷酸序列雜交的序列互補。更特別地, 術語變體包含這樣的序列,即其與在高嚴格條件下(例如65°C和0. IX SSC)和本文所示 的核苷酸序列雜交的序列互補。變體核酸的解鏈溫度(Tm)可比野生型核酸的Tm低約1、2 或3°C。變體核酸包括與編碼親本酶的核酸具有特定百分比例如80%、85%、90%、95%或 99 %序列同一性的多核苷酸。如本文所使用的術語“表達”是指通過其基于基因的核酸序列產(chǎn)生多肽的過程。該 過程包括轉錄和翻譯?!胺蛛x的”意思是該序列至少基本上沒有至少一種與該序列天然相關聯(lián)并且在自 然中發(fā)現(xiàn)的其它成分,例如基因組序列?!凹兓摹币馑际窃撐镔|(zhì)處于相對純的狀態(tài),例如至少約90%純、至少約95%純或 至少約98%純。“熱穩(wěn)定”的意思是酶在暴露于升高的溫度后仍然保持活性。通過其半壽期(t1/2) 測量酶的熱穩(wěn)定性,其中酶通過半壽期喪失了一半的酶活性。在確定的條件下通過測量剩 余淀粉酶活性計算半壽期值。為確定酶的半壽期,將樣本加熱至測試溫度1-10分鐘,并且 應用對于PS4活性的標準測定法,諸如Betamyl 測定法(Megazyme,Ireland)來測量活 性。如本文所使用的,“最佳pH”是指在pH范圍內(nèi)測量的這樣的pH,即PS4或PS4變 體在該PH處在PS4活性的標準測定法中展現(xiàn)出活性。如本文所使用的那樣,“氨基酸序列”與術語“多肽”和/或術語“蛋白質(zhì)”同義。 在一些情況下,術語“氨基酸序列”與術語“肽”同義,在一些情況下,術語“氨基酸序列”與 術語“酶”同義。如本文所用的那樣,“核苷酸序列”或“核酸序列”指寡核苷酸序列或多核苷酸序列
14和其變體、同源物、片段和衍生物。核苷酸序列可以是基因組、合成或重組來源的并且可以 是雙鏈或單鏈的,無論是表示有義或反義鏈。如本文所使用的那樣,術語“核苷酸序列”包 括基因組DNA、cDNA、合成DNA和RNA?!巴次铩钡囊馑际桥c主題氨基酸序列和主題核苷酸序列具有一定程度的同一性 或“同源性”的實體?!巴葱蛄小卑ㄅc另一序列具有一定百分比,例如80%、85%、90%、 95%或99%序列同一性的多核苷酸或多肽。同一性百分比的意思是,當比對時,當比較兩個 序列時相同的堿基或氨基酸殘基的百分比。當與主題序列相比較替換、缺失或添加了氨基 酸時,氨基酸序列不是同一的。通常關于主題蛋白質(zhì)的成熟序列測量序列同一性百分比,即 例如在移除了信號序列之后。一般地,同源物將包含與主題氨基酸序列相同的活性部位殘 基。同源物也保留了淀粉酶活性,盡管該同源物可能具有與野生型PS4不同的酶特性。如本文所使用的,“雜交”包括這樣的過程,即核酸鏈通過該過程與互補鏈通過堿 基配對結合在一起,以及包括了如在聚合酶鏈反應(PCR)技術中進行擴增的過程。變體核 酸可作為單鏈或雙鏈DNA或RNA、RNA/DNA異源雙鏈體或RNA/DNA共聚物存在。如本文所使 用的那樣,“共聚物”是指包含核糖核酸和脫氧核糖核酸的單核酸鏈??蓪ψ凅w核酸進行密 碼子優(yōu)化以進一步增加表達。如本文所使用的那樣,“合成的”化合物是通過體外化學或酶合成產(chǎn)生的。其包括 但不限于,用宿主生物的最優(yōu)密碼子使用制造的變體核酸,所述宿主生物諸如酵母細胞宿 主或所選擇的其它表達宿主。如本文所使用的那樣,“轉化的細胞”包括已通過應用重組DNA技術進行轉化的細 胞,包括細菌和真菌細胞。通常通過將一個或多個核苷酸序列插入細胞進行轉化。所插入的 核苷酸序列可以是異源核苷酸序列,即對待轉化的細胞而言非天然的序列,諸如融合蛋白。如本文所使用的那樣,“有效連接的”的意思是所描述的元件處于允許它們以其預 期的方式行使功能的關系當中。例如,與編碼序列有效連接的調(diào)控序列以這樣的方式連接, 使得在與該控制序列相容的條件下實現(xiàn)該編碼序列的表達。如本文所使用的那樣,“生物活性的”是指與天然存在的序列具有類似的結構、調(diào) 控或生物化學功能的序列,盡管不必要具有相同的程度。如本文所使用的那樣,術語“淀粉”是指包含植物(諸如玉米)的復雜多糖碳水化 合物的任何材料,其包含具有式(C6HltlO5)x的直連淀粉和支鏈淀粉,其中X可以是任意數(shù)字。 術語“粒狀淀粉”是指生的即未煮過的淀粉,例如,未進行膠化的淀粉。術語“液化”是指淀粉轉化過程中的轉化階段,其中水解膠化淀粉以得到低分子 量可溶糊精。如本文所使用的那樣,術語“糖化”是指淀粉至葡萄糖的酶轉化。術語“聚合 度”(DP)是指給定糖中脫水吡喃葡萄糖單位的數(shù)量(n)。DPI的實例是單糖葡萄糖和果糖。 DP2的實例是二糖麥芽糖和蔗糖。如本文所使用的,術語“干固體含量”(ds)是指在干重百分比基礎上的漿體的總固 體。術語“漿體”是指含有不可溶固體的水性混合物。術語“同時糖化和發(fā)酵(SSF) ”是指在生物化學生產(chǎn)中的過程,其中微生物諸如產(chǎn) 乙醇微生物和至少一種酶諸如PS4或其變體存在于同一個過程步驟期間。SSF是指同時水 解粒狀淀粉底物為糖以及發(fā)酵該糖為醇,例如,在同一個反應容器中。如本文所使用的“產(chǎn)乙醇微生物”是指具有將糖或寡糖轉化為乙醇的能力的微生
15物。 0068
0069
0070
0071
0072
0073
0074
0075
0076
0077
0078
0079
0080 0081 0082
0083
0084
0085
0086
0087
0088
0089
0090
0091
0092
0093
0094
0095
0096
0097
0098
0099
0100 0101 0102
0103
0104
1.2縮寫
除非另外指出,否則使用以下縮寫
ADA
Amy3A
cDNA
CGTase
DEAE
dH20
DNA
DP-n
ds
偶氮二酰胺
野生型嗜糖假單胞菌G4-形成淀粉酶 互補DNA 環(huán)糊精葡聚糖轉移酶 二乙氨乙醇 去離子水 脫氧核糖核酸 具有η個亞單位的聚合度
干固體 ds-DNA 雙鏈 DNA
EC
FGSC G121F
HPLC LU
mRNA
PCR
PDB
PEG
ppm
PS4
酶分類酶學委員會 真菌遺傳保存中心
SEQ ID NO 2的位置121的甘氨酸(G)殘基被苯丙氨 酸(F)殘基替換,其中通過本領域公知的單字母縮寫表 示氨基酸。 高效液相色譜法
脂肪酶單位,每單位質(zhì)量酶的磷脂酶活性測量
信使核糖核酸
聚合酶鏈反應
蛋白質(zhì)數(shù)據(jù)庫
聚乙二醇
百萬分之一
嗜糖假單胞菌G4-形成淀粉酶
RT-PCR 逆轉錄酶聚合酶鏈反應 SAS嗜糖假單胞菌G4-形成淀粉酶
SDS-PAGE十二烷基硫酸鈉-聚丙烯酰胺凝膠電泳 0. 15M NaCl,0. 015M 檸檬酸鈉,pH 7.0 同時糖化和發(fā)酵 半壽期
50%的主題蛋白質(zhì)熔解的熔解溫度(V ) Tm的。C增加 重量/體積 重量/重量 2.嗜糖假單胞菌α -淀粉酶(PS4)和其變體 提供了分離的和/或純化的包含PS4或其變體的多肽。在-
IX SSC SSF
tl/2 Tm Δ Tm w/v w/w
-個實施方案中,PS4是
多肽的成熟形式(SEQ ID NO :1),其中切割了 21個氨基酸的前導序列,因此使得該多肽的N
16端在天冬氨酸(D)處開始。變體PS4包括其中C端淀粉結合結構域已被移除的PS4。其中 已移除淀粉結合結構域的成熟PS4變體的代表性氨基酸序列是具有SEQ ID N0:1的殘基1 至429、或在C端融合有SEQ ID NO 1的殘基419-429的SEQ ID NO 2的氨基酸序列的序 列。其它PS4變體包括其中相對于野生型PS4或具有SEQ IDNO 1的殘基1-429的氨基酸 序列的PS4,或在C端融合有SEQ ID NO :1的殘基419-429的SEQ ID N0:2添加或缺失了 1 至約25個氨基酸殘基的變體。在一個方面,PS4變體具有SEQ ID NO 1的殘基1-429的氨 基酸序列,其中替換了 1至約25之間任意數(shù)量的氨基酸。這些變體的代表性實施方案包括 CF135 (C 端融合有 SEQ ID NO 1 的殘基 419-429 的 SEQ ID NO 3)、CF143 (C 端融合有 SEQ ID NO :1 的殘基 419-429 的 SEQ ID NO :4)、CF149 (C 端融合有 SEQ ID NO 1 的殘基 419-429 的 SEQ ID NO 5)和 CF154(C 端融合有 SEQ ID NO 1 的殘基 419-429 的 SEQ ID NO 6)。在另一方面,PS4變體具有野生型PS4的序列,其中替換了 1至約25之間任意數(shù)量 的氨基酸。具有單氨基酸替換的PS4變體的代表性實例顯示于表3。具有氨基酸替換組合 的PS4變體的實例顯示于表4和7。表4描述了已被修飾以形成核心變體序列的各種氨基 酸,所述核心變體序列還如表7所列的PS4變體所示的那樣額外地被修飾。表7還概述了 各種突變體對內(nèi)切和外切淀粉酶活性以及外切與內(nèi)切淀粉酶活性比的影響。除了在表3-4 中列出的氨基酸殘基修飾,其它可進行修飾的特定PS4殘基包括A3、S44、A93、G103、V109、 Gl72、A211、G265、N302、G313和G342。PS4變體可具有本文所公開的氨基酸替換的各種組 合。應用PS4變體的方法可包含單個PS4變體或PS4變體的組合或混合物的應用。PS4變體可有利地產(chǎn)生比麥芽四糖更多的麥芽三糖。此外,PS4變體可比當前使用 的淀粉酶諸如 SPEZYME Xtra(Danisco US Inc.,Genencor Division)產(chǎn)生更多的葡萄糖 和麥芽糖。這導致觀察到的更高的來自發(fā)酵的乙醇產(chǎn)量,在應用發(fā)酵葡萄糖和麥芽糖的酵 母的實施方案中其可超過2. 5% ν/ν乙醇。提供了與野生型PS4相比較具有相當高的內(nèi)切 淀粉酶活性和/或與野生型PS4相比較具有更低的外切與內(nèi)切淀粉酶活性比的PS4變體。 當單獨使用或與其它PS4變體組合時,此類PS4變體在液化過程中尤其有用,其中復雜支鏈 糖的內(nèi)部切割使底物的粘度更低。維持或增加熱穩(wěn)定性的氨基酸替換的代表性實例包括對變體CF135、CF143、CF149 和CF154實施的替換。PS4變體CF135具有在C端融合有SEQ ID NO :1殘基419-429的SEQ ID NO 3的氨基酸序列。這一變體含有氨基酸替換A141P。變體CF143具有在C端融合有 SEQ ID NO :1殘基419-429的SEQ ID NO :4的氨基酸序列,其具有額外的替換G223A。變體 CF149具有在C端融合有SEQ ID NO 1殘基419-429的SEQ ID NO 5的氨基酸序列,其具 有 7 個替換G134R、A141P、G223A、I157L、H307L、S334P 和 D343E。變體 CF154 具有在 C 端 融合有SEQ ID NO 1殘基419-429的SEQ ID NO 6的氨基酸序列,其具有與CF149相同的 7個替換,以及還有替換N33Y、D34N、K71R、L178F和A179T。其它特別有用的變體包括其中已替換了影響底物結合的殘基的那些變體。參與 底物結合的PS4殘基包括在圖9中描述的那些。特別的殘基包括W66、1157、E160、S161、 R196、W221、K222、H307和W308。替換影響底物結合的殘基可影響PS4變體內(nèi)切或外切活 性的相對程度。增加外切活性的替換例如有利地促進DP3糖的形成,其中DP3糖可在玉米 淀粉的發(fā)酵過程中被釀酒酵母代謝以制得乙醇。影響底物結合的突變的代表性實例包括 E160G、E160P、E160F、E160R、E160S、E160L、W66S、R196V、R196H、R196P、H307L、W221A、W308A、W308S、W308L、W308S和K222T。還預期對殘基D254、R196和E226 (其參與和K222的離子對 網(wǎng)絡)的突變也是有用的,因為這些突變將間接地影響K222與底物的相互作用。提供了影 響-4、-3、-2、+2和+3糖結合部位的特定PS4變體。變體包括影響這些位點子集的那些, 尤其是影響_3、-2、+2或+3位置的那些??紤]了應用影響不同糖結合部位的突變的組合的 方法。影響糖結合部位的具體突變公開于實施例中。PS4 變體可包含與 SEQ ID NO :1、SEQ ID NO 1 的殘基 1 至 429、或 SEQ ID NO 2 的氨基酸序列具有至少 80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%序列同一性的序列。與SEQID NO =USEQ ID NO 1的殘基1-429或SEQ ID NO 2的氨 基酸序列相比較,該PS4變體可能具有經(jīng)改變的熱穩(wěn)定性、經(jīng)改變的內(nèi)切淀粉酶活性、經(jīng)改 變的外切淀粉酶活性、和/或經(jīng)改變的外切與內(nèi)切淀粉酶活性的比。該PS4變體可包含一 個或多個以下氨基酸替換:SEQ ID NO :1、2、3、4、5 或 6 的 N33Y、D34N、G70D、K71R、V113I、 G121A/D/F、G134R、A141P、N145D、Y146G、I157L、G158T、S161A、L178F、A179T、Y198F、G223A/ E/F、S229P、H272Q、V290I、G303E、H307K/L、A309P、S334P、W339E 和 / 或 D343E。PS4 變體可 包含SEQ ID NO :3、4、5或6的氨基酸序列。在一些實施方案中,PS4變體可包含一個或多個在以下位置處的氨基酸替換SEQ ID NO :1、2、3、4、5或6 的7、8、32、38、49、62、63、64、67、72、73、74、75、76、104、106、107、110、 112、116、119、122、123、124、125、126、128、130、137、138、140、142、143、144、148、149、150、 151、154、156、163、164、168、169、182、183、192、195、196、200、202、208、213、220、222、225、 226、227、232、233、234、236、237、239、253、255、257、260、264、267、269、271、276、282、285、 295、297、300、302、305、308、312、323、324、325、341、358、367、379、390 ;一個或多個以下氨 基酸替換:SEQ ID NO :1、2、3、4、5 或 6 的 A3T、G9A、H13R、I46F、D68E、G69A/E/H/I/K/M/R/ T、G70A/E/L/P/Q/S/V、K71M、G100A/S、G121I/P/R、A131T、G134C、A141S、N145S、Y146D/E、 G153A/D、G158C/F/I/L/P/Q/V、S161G/H/K/P/R/T/V、G166N、1170E/K/L/M/N、L178N/Q/W、 A179E/N/P/R/S、A179S、G184Q、G188A、A199P、G223C/F/H/M/N/Q/W/Y、S229N、W238E/G/K/P/ Q/R、G303L、H307D/E/F/G/K/M/P/Q/R/S/W/Y、A309E/I/M/T/V、S334A/H/K/L/M/Q/R/T 和 / 或 H335M ;和/或在SEQ ID NO 1的位置420、422和/或424的一個或多個氨基酸替換。代 表性的替換可包括:SEQ ID NO :1、2、3、4、5 或 6 的 A3T、P7S、A8N、G9A、H13R、P32S、I38M、 I46F、D49V、D62N、F63A/D/E/L/V、S64N/T、T67G/H/K/N/Q/R/V、D68E、G69A/E/H/I/K/M/R/T、 G70A/E/L/P/Q/S/V、K71M、S72E/K/N/T、G73D/E/L/M/N/S/T、G74S、G75C/E/F/R/S/W/Y、E76V、 G100A/S、G104N/R、G106K、V107M、L110F、D112E、N116D、N119E/G/S/Y、G121I/P/R、Y122A/ E/Q/W、P123S、D124S、K125A/D/E/G/P/Q/W、E126D/N、N128E、P130S、A131T、G134C、R137C、 N138D/E/S、C140A/R、A141S、D142E/G/N、P143T、G144E、N145S、Y146D/E、N148K/S、D149H/ L/V、C150A、D151A/V/W、G153A/D、D154E/G/Y、F156Y、G158C/F/I/L/P/Q/V、S161G/H/K/P/R/ T/V、L163M、N164R、G166N、P168L、Q169D/E/G/K/N/R/V、1170E/K/L/M/N、L178N/Q/W、A179E/ N/P/R/S、R182D/G/H/M/S、S183G、G184Q、G188A、F192M/Y、V195D、R196A/G/K/P/Q/S/T/V/Y、 A199P、P200A/G、R202K、S208T、S213N、L220A/T、K222M/Y、G223C/F/H/M/N/Q/W/Y、S225E/G/ V、E226C/D/G/W、Y227C/D/G/K/T、S229N、W232F/G/H/1/K/L/N/P/Q/R/S/T/Y, R233H、N234R、 A236E、S237D/G、W238E/G/K/P/Q/R、Q239L、V253G、D255V、A257V、E260K/R、N264D、V267I、 D269N/S/V、K271A/L/Q、G276R、W282S、V285A、T295C、Y297H、G300E、N302K、G303L、Q305E/L/T、H307D/E/F/G/K/M/P/Q/R/S/W/Y、W308A/C/G/K/N/Q/R/S/T、A309E/I/M/T/V、D312E、 W323M, T324A/L/M、S325G、S334A/H/K/L/M/Q/R/T、H335M、Y341C/E、R358A/E/G/L/N/Q/T/V、 S367Q/R、S379G 和 / 或 D390E,和 / 或 SEQ ID NO 1 的 S420G、D422N/P/Q 和 / 或 G424D/S 中 的一個或多個替換。在一些實施方案中,PS4變體可包含一個或多個在以下位置處的氨基替換SEQ ID N0:l、2、3、4、5 或 6 的 7、32、49、62、63、64、72、73、74、75、76、107、110、112、116、119、122、 123、125、128、130、137、138、140、142、143、144、148、149、150、151、154、156、163、164、168、 169、182、183、192、195、196、202、220、222、226、227、232、233、234、236、237、239、253、255、 257、260、264、269、271、276、282、285、297、300、302、305、308、312、323、324、325、341、358、 367 和 / 或 379 ;SEQ ID NO :1、2、3、4、5 或 6 的 A3T、H13R、I38M、I46F、T67G/H/K/N/Q/R/ V、G69A/E/H/I/K/M/R/T、G70E/L/P/Q/V、K71M、G100A/S、G104R、G106K、G121I/P/R、D124S、 E126D/N、A131T、G134C、A141S、N145S、Y146D/E、G153A/D、G158C/F/I/L/P/Q/V、S161G/H/K/ P/R/T/V、G166N、1170E/K/L/M/N、L178N/Q/W、A179E/N/P/R/S、G188A、A199P、P200A、G223C/ F/H/M/N/Q/W/Y、S225E/G/V、W238E/G/K/P/Q/R、T295C、G303L、H307D/G/M/P/S、A309E/I/ M/T/V、334A/H/K/L/M/Q/R/T、H335M 和 / 或 D390E ;SEQ ID NO 1 的一個或多個氨基酸替換 S420G和/或D422/N/P/Q ;和/或在SEQ ID NO=I的位置424處的氨基酸替換。代表性的 替換可包括:SEQ ID NO :1、2、3、4、5 或 6 的 A3T、P7S、H13R、P32S、I38M、I46F、D49V、D62N、 F63A/D/E/L/V、S64N/T、T67G/H/K/N/Q/R/V、G69A/E/H/I/K/M/R/T、G70E/L/P/Q/V、K71M、 S72E/K/N/T、G73D/E/L/M/N/S/T、G74S、G75C/E/F/R/S/W/Y、E76V, G100A/S、G104R、G106K、 V107M、Ll10F、Dl12E、Nl16D、Nl19E/G/S/Y、G121I/P/R、Y122A/E/Q/W、P123S、D124S、K125A/ D/E/G/P/Q/W、E126D/N、N128E、P130S、A131T、G134C、R137C、N138D/E/S、C140A/R、A141S、 D142E/G/N、P143T、G144E、N145S、Y146D/E、N148K/S、D149H/L/V、C150A、D151A/V/W、G153A/ D、D154E/G/Y、F156Y、G158C/F/I/L/P/Q/V、S161G/H/K/P/R/T/V、L163M、N164R、G166N、 P168L、Q169D/E/G/K/N/R/V、I170E/K/L/M/N、L178N/Q/W、A179E/N/P/R/S、R182D/G/H/M/ S、S183G、G188A、F192M/Y、V195D、R196A/G/K/P/Q/S/T/V/Y、A199P、P200A、R202K、L220A/ Τ、K222M/Y、G223C/F/H/M/N/Q/W/Y、S225E/G/V、E226C/D/G/W、Y227C/D/G/K/T、W232F/G/H/ I/K/L/N/P/Q/R/S/T/Y、R233H、N234R、A236E、S237D/G、W238E/G/K/P/Q/R、Q239L、V253G、 D255V、A257V、E260K/R、N264D、D269N/S/V、K271A/L/Q、G276R、W282S、V285A、T295C、Y297H、 G300E、N302K、G303L、Q305E/L/T、H307D/G/M/P/S、W308A/C/G/K/N/Q/R/S/T、A309E/I/M/T/ V、D312E、W323M、T324A/L/M、S325G、S334A/H/K/L/M/Q/R/T、H335M、Y341C/E、R358A/E/G/L/ N/Q/T/V、S367Q/R、S379G和/或D390E ;和/或一個或多個以下氨基酸替換=SEQ ID NO 1 的 S420G、D422N/P/Q 和 / 或 G424D/S。在其它實施方案中,PS4變體可包含在以下位置處的一個或多個氨基酸替換SEQ ID NO :1、2、3、4、5 或 6 的 49、62、63、64、72、73、74、75、76、107、112、116、119、122、123、125、 128、130、137、140、143、144、148、149、150、151、154、156、163、164、168、169、182、183、192、 195、196、202、257、282、285、297、300、305、308、312、323和/或325 ;—個或多個以下氨基酸 替換=SEQ ID NO :1、2、3、4、5 或 6 的 A3T、P7S、H13R、I38M、I46F、T67G/H/K/N/Q/R/V、G69A/ E/H/I/K/M/R/T、G70E/L/P/Q/V、K71M、G100A/S、G104R、G106K、L110F、G121I/P/R、D124S、 E126D/N、A131T、G134C、N138D/E、D142/E/G/N、N145S、Y146D/E、G153A/D、G158C/F/I/L/P/Q/V、S161G/H/K/P/R/T/V、G166N、I170E/K/L/M、L178N/Q/W、A179E/N/P/R/S、G188A、A199P、 P200A、L220T、K222M/Y、G223C/F/H/M/N/Q/W/Y、S225E/V、E226C/D/G/W、Y227C/D/G/K/T、 W232F/G/H/1/K/N/P/Q/R/S/T/Y, R/33H、N234R、A236E、S237D/G、W238E/G/K/P/Q/R、Q239L、 V253G、D255V、E260K/R、N264D、D269N/S/V、K271A/L/Q、G276R、T295C、N302K、G303L、H307D/ G/M/P/S、A309E/I/M/T/V、T324L/M、S334A/H/K/L/M/Q/R/T、H335M、Y341C/E、R358A/E/G/L/ N/Q/T/V、S367Q/R、S379G和/或D390E ;以及一個或多個以下氨基酸替換=SEQ ID NO 1的 S420G、D422/N/P/Q 和 / 或 G424S。代表性替換可包括:SEQ ID NO :1、2、3、4、5 或 6 的 A3T、 P7S、H13R、I38M、I46F、D49V、D62N、F63A/D/E/L/V、S64N/T、T67G/H/K/N/Q/R/V、G69A/E/H/I/ K/M/R/T、G70E/L/P/Q/V、K71M、S72E/K/N/T、G73D/E/L/M/N/S/T、G74S、G75C/E/F/R/S/W/Y、 E76V、G100A/S、G104R、G106K、V107M、L110F、D112E、N116D、N119E/G/S/Y、G121I/P/R、Y122A/ E/Q/W、P123S、D124S、K125A/D/E/G/P/Q/W、E126D/N、N128E、P130S、A131T、G134C、R137C、 N138D/E、C140A/、D142E/G/N、P143T、G144E、N145S、Y146D/E、N148K/S、D149H/L/V、C150A、 D151A/V/W、G153A/D、D154E/G/Y、F156Y、G158C/F/I/L/P/Q/V、S161G/H/K/P/R/T/V、L163M、 N164R、G166N、P168L、Q169E/G/K/N/R/V、1170E/K/L/M、L178N/Q/W、A179E/N/P/R/S、R182D/ G/H/M/S、S183G、G188A、F192M/Y、V195D、R196A/G/K/P/Q/S/T/V/Y、A199P、P200A、R202K、 L220T、K222M. Y、G223C/F/H/M/N/Q/W/Y、S225E/V、E226C/D/G/W、Y227C/D/G/K/T、W232F/G/ H/1/K/N/P/Q/R/S/T/Y、R233H、N234R、A236E、S237D/G、W238E/G/K/P/Q/R、Q239L、V253G、 D255V、A257V、E260K/R、N264D、D269N/S/V、K271A/L/Q、G276R、W282S、V285A、T295C、Y297H、 G300E、N302K、G303L、Q305E/L/T、H307D/G/M/P/S、W308A/C/G/K/N/Q/R/S/T、A309E/I/M/T/ V、D312E、W323M、T324L/M、S325G、S334A/H/K/L/M/Q/R/T、H335M、Y341C/E、R358A/E/G/L/N/ Q/T/V、S367Q/R、S379G和/或D390E,和/或一個或多個以下氨基酸替換SEQ ID N0:1的 S420G、D422N/P/Q 和 / 或 G424S。與SEQ ID NO :1、2、3、4、5或6的氨基酸序列相比較,PS4變體可具有達25、23、21、 19、17、15、13或11個氨基酸缺失、添加、插入或替換。PS4變體可包含額外的一個或多個在以下位置處的氨基酸替換SEQID NO :1或2 的 N33、D34、G70、G121、G134、A141、Y146、1157、S161、L178、A179、G223、S229、H307、A309 和 / 或 S334。代表性的替換可包括SEQ ID NO :1 或 2 的 N33Y、D34N、G70D、G121F、G134R、 A141P、Y146G、I157L、S161A、L178F、A179T、G223E、S229P、H307K、A309P 和 / 或 S334P。在其它實施方案中,與SEQ ID NO =USEQ ID NO 1的殘基1至429或SEQ ID NO: 2的氨基酸序列相比較,PS4變體可具有經(jīng)改變的熱穩(wěn)定性。與SEQ ID NO=USEQ ID NO 1 的殘基1至429或SEQ ID NO :2的氨基酸序列相比較,該經(jīng)改變的熱穩(wěn)定性可以是升高的 熱穩(wěn)定性。更熱穩(wěn)定的PS4變體可包含一個或多個以下氨基酸替換SEQ ID N0:1或2的 A3T、I38M、G70L、Q169K/R、R182G/H、P200G、G223N、S237D、D269V、K271A/Q、S367Q/R、S379G 和/或S420G。此外,該PS4變體可包含額外的一個或多個在以下位置處的氨基酸替換SEQ ID N0:1 或 2 的 G134、A141、1157、G223、H307、S334 和 / 或 D343。代表性的替換可包括 SEQ ID NO :1 或 2 的 G134R、A141P、I157L、G223A、H307L、S334P 和 / 或 D343E。該 PS4 變體 可還包含一個或多個在以下位置處的氨基酸替換SEQ ID NO :1或2的N33、D34、K71、L178 和/或A179。代表性的替換可包括SEQ ID NO 1或2的N33Y、D34N、K71R、L178F和/或 A179T。
在再另一實施方案中,與SEQ ID NO =USEQ ID NO :1的殘基1至429或SEQ ID NO: 2的氨基酸序列相比較,PS4變體可具有經(jīng)改變的內(nèi)切淀粉酶活性、經(jīng)改變的外切淀粉酶活 性和/或經(jīng)改變的外切與內(nèi)切淀粉酶活性比。該PS4變體可包含一個或多個以下氨基酸替 換SEQ ID NO :1 或2 的A3T、G69K、G70E、K71M、G73D/E、G75C/E、Y122A、C140A、G144E、Y146D/ Ε、N148K、C150A、D151A/V/W、G153A、G158I/P、S161G/H/K/P/R、Q169D/E/G/N/R、R196Q/S/T、 R202K、S208T、S213N、Κ222Μ、G223C/F/H/M/Q/W/Y、E226D、Y227D/G/K/T、S229N、W232Q/S/T、 T295C、Q305T、W308A/C/G/Q/R/S/T、A309I/V、W323M、T324L/M、S334A/H/M/Q 和 / 或 R358E/ L/N/Q/T/V。此外,該PS4變體可包含額外的一個或多個在以下位置處的氨基酸替換SEQ ID NO :1 或 2 的 W66、1157、E160、S161、R196、W22U K222、E226、D254、Q305、H307 和 / 或 W308。代表性的替換可包括SEQ ID NO 1 或 2 的 W66S、E160F/G/L/P/R/S、S161A、R196H/ P/V、W221A、K222T、Q305T/L、H307L 和 / 或 W308A/L/S。本公開還涉及如表4所述的每一個和任一個核心變體序列或骨架,其包含如表7 中為每一變體所示的替換模式。本公開還涉及精確敘述的如表4所示的具有如在表7中所 述替換的變體,即僅含有如表7所示突變或替換模式的核心變體序列。本公開還涉及包含 SEQ ID NO =USEQ ID NO 1的殘基1至429或SEQ ID NO 2的氨基酸序列,并且包含如表 7所示替換模式的PS4變體。此外,本公開還涉及包含SEQ ID NO :1、SEQ ID NO 1的殘基 1至429或SEQ ID NO 2的氨基酸序列,并且僅包含如表7所示替換模式的PS4變體。還提供了編碼上述多肽的核酸。在一個實施方案中,編碼PS4變體的核酸是編碼 包含SEQ ID NO 1的殘基1至429氨基酸序列的蛋白質(zhì)的cDNA。例如,該cDNA可以具有 SEQ ID NO :7所示天然mRNA的相應序列。參見GenBank登錄號X16732。如本領域技術人 員所理解的那樣,遺傳密碼是簡并性的,意味著在一些情況下多個密碼子可能編碼相同的 氨基酸。核酸包括編碼PS4變體的基因組DNA、mRNA和cDNA。2. 1.PS4 變體表征酶變體可通過它們的核酸和一級多肽序列、通過三維結構模建和/或通過它們的 特定活性得以表征。PS4變體的其它特征例如包括穩(wěn)定性、pH范圍、氧化穩(wěn)定性和熱穩(wěn)定 性??蓱帽绢I域技術人員公知的標準測定法評估表達和酶活性水平。另一方面,變體展 現(xiàn)出相對于野生型酶的經(jīng)改良的表現(xiàn)特征,諸如在高溫例如65-85°C的改良的穩(wěn)定性。PS4 變體對于在液化或其它需要升高溫度的方法(諸如烘烤)中使用是有利的。例如,熱穩(wěn)定 PS4變體可在約55°C至約85°C或更高的溫度下降解淀粉。表達特征的意思是當在特定宿主細胞中產(chǎn)生變體時,該變體的經(jīng)改變的表達水 平。表達一般地與在給定時間量中可用本領域公知的標準技術從發(fā)酵肉湯中移除的活性變 體的量相關。表達還可與在宿主細胞中產(chǎn)生的或通過該宿主分泌的變體的量或速率相關。 表達還可與編碼該變體酶的mRNA的翻譯速率相關。提供了與編碼本文所示的任意PS4變體的核酸互補的核酸。此外,還提供了能與 該互補體雜交的核酸。在另一實施方案中,在本文描述的方法和組合物中使用的序列是合 成的序列。其包括但不限于用在宿主生物(諸如酵母)用于表達的最佳密碼子使用產(chǎn)生的 序列。3.PS4變體的產(chǎn)生可根據(jù)本領域公知的方法合成地或通過在宿主細胞細胞中重組表達本文提供的PS4變體。表達的PS4變體任選地在使用之前分離。在另一實施方案中,在表達之后 純化PS4變體。遺傳修飾和重組產(chǎn)生PS4變體的方法例如描述于美國專利號7,371,552、 7,166,453 ;6,890,572 和 6,667,065 ;以及美國專利
發(fā)明者A·H·凱雷-史密斯, A·肖, K·M·克拉格, R·金 申請人:丹尼斯科美國公司