專利名稱:具有改變的性質的葡糖淀粉酶變體的制作方法
技術領域:
本發(fā)明涉及具有改變的性質(例如,改善的熱穩(wěn)定性和/或比活性)的親本葡糖 淀粉酶的變體。具體地,本發(fā)明提供包含變體葡糖淀粉酶的組合物,包括淀粉水解組合物, 動物飼料組合物和清潔組合物。本發(fā)明也涉及編碼所述變體的DNA構建體和在宿主細胞中 生產所述葡糖淀粉酶變體的方法。
背景技術:
葡糖淀粉酶(葡聚糖1,4-α-葡糖水解酶,EC3.2. 1.3)是淀粉水解外切糖酶,其 催化從淀粉或相關寡糖和多糖分子的非還原性末端去除連續(xù)的葡萄糖單元。葡糖淀粉酶可 以水解線性的和分枝的糖苷鍵連接的淀粉(例如,直鏈淀粉和支鏈淀粉)。葡糖淀粉酶可以通過多種株系的細菌,真菌,酵母和植物生產。尤其有趣和商業(yè) 上重要的是,葡糖淀粉酶是細胞外產生的真菌酶,例如來自曲霉屬(Svensson等,(1983) Carlsberg Res.Commun. 48 :529_544 ;Boel 等·,(1984)EMBO J. 3 1097-1102 ;Hayashida 等·,(1989)Agric BiolChem. 53 923~929 ;USP 5024,941 ;USP4,794,175 和 W088/09795); 踝節(jié)菌屬(USP4, 247,637 ;USP6, 255,084 和 USP6, 620,924);根霉屬(Ashikari 等·, (1986)Agric. Biol. Chem. 50 957-964 ;Ashikari 等·, (1989)App. Microbiol.禾口 Biotech. 32 129-133 和 USP4, 863,864);腐質霉屬(W005/052148 和 USP4, 618579)和毛霉 菌(Houghton-Larsen 等·,(2003) Appl. Microbiol. Biotechnol. 62 :210_217)的菌株。編 碼這些酶的很多基因已經在酵母,真菌和/或細菌細胞內被克隆和表達。葡糖淀粉酶是商業(yè)上非常重要的酶,并已經應用于需要淀粉水解的各種應用(例 如,從淀粉產生葡萄糖和其它單糖)。葡糖淀粉酶用于產生高果糖漿甜味劑,其構成美國超 過50%的甜味劑市場。一般來說,葡糖淀粉酶可以,并且通常與α-淀粉酶一起用于淀粉水 解過程,以水解淀粉為糊精,然后水解為葡萄糖。接著葡萄糖可以由其它酶(例如,葡萄糖 異構酶)轉化為果糖;結晶化;或用于發(fā)酵以產生多種終產物(例如,乙醇,檸檬酸,乳酸, 琥珀酸,抗壞血酸中間體,谷氨酸,甘油和1,3_丙二醇)。通過在淀粉和/或包含纖維素材 料的發(fā)酵中使用葡糖淀粉酶產生的乙醇可以用做燃料或用于酒精消費。盡管葡糖淀粉酶已經成功用于商業(yè)用途多年,對具有改變性質的新葡糖淀粉酶的 需要仍然存在。發(fā)明概述在有些方面,本發(fā)明涉及分離的葡糖淀粉酶變體,其在對應于SEQ IDNO 2或SEQ ID NO :3 殘基位置 10,14,15,23,42,45,46,59,60,61,67,68,72,73,97,98,99,102,108, 110,113,114,122,124,125,133,140,144,145,147,152,153,164,175,182,204,205,214,216,219,228,229,230,231,236,239,240,241,242,244,263,264,265,268,269,276,284, 291,300,301,303,310,311,313,316,338,342,344,346,349,359,361,364,379,382,390, 391,393,394,408,410,415,417,418,430,431,433,436,442,443,444,448 和 451 的位置上 或親本葡糖淀粉酶的等同位置上具有一個或多個氨基酸取代。在一些實施方案中,親本葡糖淀粉酶包含SEQ ID ΝΟ:1,4,5,6,7,8或9的序列。在一些實施方案中,親本葡糖淀粉酶 包含SEQ ID NO :2。在一些實施方案中,親本葡糖淀粉酶獲自木霉菌,曲霉菌,腐質霉菌,青 霉菌,踝節(jié)菌,或裂殖酵母菌。在另外的實施方案中,親本的等同位置通過序列同一性確定。 在其它的實施方案中,親本葡糖淀粉酶具有與SEQ IDNO :2至少80%的序列同一性。在另外 的實施方案中,親本的等同位置通過與SEQ ID NO :2或3的結構同一性確定。在此方面的其 它實施方案中,變體在選自 SEQ ID NO :2 或 SEQ ID NO :3 的 T10D/F/G/K/L/M/P/R/S ;L14E/ H ;N15D/N ;P23A/G ;F59A/G ;K60F/H ;N61D/I/L/Q/V/W ;R65A/C/G/I/K/M/S/V/Y ;T67C/I/K/ M/T ;E68I/M/W ;A72E/G/L/M/Q/R/W/Y ;G73C/L/W ;S97F/M/N/P/R/S/V/W/Y ;L98H/M ;A99C/ L/M/N/P ;S102A/C/1/L/M/N/R/V/W/Y;E110Q/S/W ;L113E/N ;Kl 14C/D/E/L/M/Q/S/T/V ; I133K/R/S/T ;K140A/E/F/H/K/L/M/N/Q/R/S/V/W/Y ;N144C/D/E/I/K ;N145A/C/E/I/K/L/M/ Q/R/V/W/Y;Y147A/M/R ;S152H/M ;N153C/D/K/L/W/Y ;N164A/G ;N182C/E/K/P/R ;A204C/D/ G/I/M/Q/T ; T205A/D/H/1/Κ/Μ/Ν/Ρ/Q/S/V/ff/Y ;S214P/T ;V216C/G/H/K/N/Y ; Q219D/G/H/N/ P/S ;W228A/F/G/H/I/L/M/Q/S/T/V/Y ;V229E/I/M/N/Q ;S230C/D/E/F/G/H/I/K/L/N/P/Q/R/ T/V/Y ; S231C/D/F/L/M/N/Q/R/S/V/Y ;D236F/G/L/M/N/P/S/T/V ; I239M/Q/S/V/W/Y ;T241C/ E/H/L/M/P/S/T/V ;N242C/F/H/M/T/V/W ;N263H/K/P ;L264A/C/E/F/L/S ;G265E/G/H/I/K/R/ T ;A268C/D/E/F/G/I/K/L/P/R/T/W ;G269E ;D276S ;V284R/T/V/Y/A/E/F/H/K/N/P/W ;P300K/ R ;A301E/K/L/P/S/W ;A303C/D/F/H/I/K/L/N/R/T/V/W/Y;A311N/P/Q/S/Y ;V338P/Q/S/ Y;T342N/V ;S344A/T ;T346G/H/M/N/P/Q/Y ;A349L/I/K/M/N/Q/R/W ;G361H/L/R ;A364M/W ; N379A/C/D/G/I/M/P/S ; S382A/N/P/V/W ; S390A/Y ;E391A/E/1/K/L/M/Q/R/V/W/Y ;A393E/G/ H/1/K/L/M/N/Q/R/S/T/V/ff/Y ;K394A/H/K/L/M/Q/R/S/T/V/W ; S410E/H/N ; L417A/D/E/F/G/ I/K/Q/R/S/T/V/ff/Υ ;H418E/M ;T430A/E/F/G/H/1/K/M/N/Q/R/V ;A431C/E/H/I/L/M/Q/R/S/ ff/Υ ;R433A/C/E/F/G/K/L/M/N/S/V/W/Y ; I436E/F/G/H/K/P/R/S/T/V/Y ;S444M/N/P/Q/R/T/ V/W ;T448F/G/I/P/Q/T/V ;和S451E/H/K/L/Q/T的位置上或親本葡糖淀粉酶的等同位置上 具有取代。 在另一方面,本發(fā)明涉及分離的葡糖淀粉酶變體,其在對應于SEQ IDNO 2或SEQ ID NO 3 的位置 10,14,15,23,42,45,46,59,60,61,67,68,72,73,97,98,99,102,108,110, 113,114,122,124,125,133,140,144,145,147,152,153,164,175,182,204,205,214,216, 219,228,229,230,231,236,239,240,241,242,244,263,264,265,268,269,276,284,291, 300,301,303,310,311,313,316,338,342,344,346,349,359,361,364,379,382,390,391, 393,394,408,410,415,417,418,430,431,433,436,442,443,444,448 和 451 上包含一個或 多個氨基酸取代。在此方面的一個實施方案中,葡糖淀粉酶變體在對應于選自SEQ ID NO 2 或 3 的 10,14,15,23,59,60,61,65,67,68,72,73,97,98,99,102,110,113,133,140,144, 145,147,152,153,164,182,204,205,214,216,219,228,229,230,231,236,239,241,242, 263,264,265,268,269,276,284,291,300,301,303,311,338,342,344,346,349,359,361, 364,379,382,390,391,393,394,410,417,418,430,431,433,442,444,448 和 451 上包含一個或多個氨基酸取代。在該方面的其它實施方案中,葡糖淀粉酶變體在對應于SEQ ID NO 2 或 SEQ ID NO 3 的位置 61,67,72,97,102,133,205,219,228,230,231,239,263,268,291, 342,394,430,431和451上包含一個或多個氨基酸取代。在此方面的另外的實施方案中,葡 糖淀粉酶變體具有一個或多個氨基酸取代,其對應于SEQ ID NO 2或SEQ ID NO 3的至少 一個下列取代:T67M, A72Y, S97N, S102M, I133T, T205Q, Q219S, W228M, S230F, S230G, S230N, S230R, S231L, I239V, I239Y, N263P, A268C, A268G, A268K, S291A, T342V, K394S, T430K, A431Q, S451K。在另一方面,與親本葡糖淀粉酶相比,本發(fā)明的葡糖淀粉酶變體具有改變的性質。 在一些實施方案中,比較于包含SEQ ID NO :2、SEQ ID NO 3的序列的葡糖淀粉酶或與SEQ ID NO :2有至少80%序列同一性的親本葡糖淀粉酶,改變的性質為比活性的增加。在一些 實施方案中,比較于包含SEQ ID NO :2的葡糖淀粉酶,葡糖淀粉酶變體具有增加的比活性。 在此方面的其它實施方案中,葡糖淀粉酶變體在對應于選自SEQ ID而2或3的10,14,15, 23,59,60,61,65,67,68,72,73,97,98,99,102,110,113,133,140,144,145,147,152,153, 164,182,204,205,214,216,219,228,229,230,231,236,239,241,242,263,264,265,268, 269,276,284,291,300,301,303,311,338,342,344,346,349,359,361,364,379,382,390, 391,393,394,410,417,418,430,431,433,442,444,448,和 451 的位置上包含一個或多個 氨基酸取代。在其它的方面,比較于包含SEQ ID NO :2、SEQ ID NO 3的序列的葡糖淀粉酶或與 SEQ ID NO :2有至少80%序列同一性的親本葡糖淀粉酶,本發(fā)明的葡糖淀粉酶變體具有增 加的熱穩(wěn)定性。在一些實施方案中,比較于包含SEQ ID NO :2或SEQ ID NO :3的葡糖淀粉 酶,葡糖淀粉酶變體具有增加的熱穩(wěn)定性。在此方面的一些實施方案中,本發(fā)明的葡糖淀粉 酶變體在對應于選自 SEQ ID NO :2 或 SEQ ID NO :3 的位置 10,15,23,42,59,60,61,68,72, 73,97,98,99,102,114,133,140,144,147,152,153,164,182,204,205,214,216,228,229, 230,231,236,241,242,263,264,265,268,269,276,284,291,300,301,303,311,338,342, 344,346,349,359,361,364,379,382,390,391,393,394,410,417,430,431,433,436,442, 443,444,448和451的位置上包含一個或多個氨基酸取代。在此方面的其它實施方案中,本 發(fā)明的葡糖淀粉酶變體在對應于選自SEQ ID NO :2或SEQ ID NO :3的位置10,42,68,73, 97,114,153, 229, 231, 236, 264, 291, 301, 344, 361, 364,417, ^P 433 的位置上包含一個或多 個氨基酸取代。在此方面的其它實施方案中,本發(fā)明的葡糖淀粉酶變體在對應于選自SEQ ID NO :2 或 SEQ ID NO :3 的位置 68,73,114,153,236,344,361,364 和 433 的位置上包含一 個或多個氨基酸取代。在此方面的又一些實施方案中,葡糖淀粉酶變體包含一個或多個氨 基酸取代,其對應于至少一個下面的SEQ ID NO 2或SEQ ID NO 3的T10S,T42V,E68C, E68M, G73F, G73W, K114M, K114T, N153A, N153S, N153V, W228V, D236R, G361D, G361E, G361P, G361Y, A364D, A364E, A364F, A364G, A364K, A365L, A365R, R433C, R433G, R433L, R433N, R433S, R433V,和 I436H。在另外的方面,比較于包含SEQ ID NO 2或SEQ ID NO 3序列的葡糖淀粉酶或與 SEQ ID NO :2有至少80%序列同一性的親本葡糖淀粉酶,本發(fā)明的葡糖淀粉酶變體具有增 強的比活性和增加的熱穩(wěn)定性。在此方面的一些實施方案中,本發(fā)明的葡糖淀粉酶變體在 對應于選自 SEQ ID NO :2 或SEQ ID NO :3 的位置10,15,59,61,68,72,73,97,99,102,133,140,153,182,204,205,214,228,229,230,231,236,241,242,264,265,268,275,284,291, 300,301,303,311,338,344,346,359,361,364,370,382,391,393,394,410,417,430,431, 433,444,448,和451的位置上包含一個或多個氨基酸取代。在此方面的另外實施方案中, 葡糖淀粉酶變體在對應于選自SEQ IDNO :2或SEQ ID NO :3的位置228,230,231,268,291, 417,433和451的位置上包含一個或多個氨基酸取代。在此方面的另外實施方案中,葡糖淀 粉酶變體包含一個或多個氨基酸取代,其對應于至少一個下面的取代SEQID NO 2或SEQ ID NO 3 的 W228A, W228F, W228H, W228M, S230F, S230G, S230R, S231L, A268C, A268G,S291A, L417R, R433Y,和 S451K。在另一方面,本發(fā)明涉及編碼涵蓋在本發(fā)明中的任何一種葡糖淀粉酶變體的分離 的多核苷酸。在一些實施方案中,本發(fā)明涉及一種宿主細胞,其包含編碼涵蓋在本發(fā)明中的 葡糖淀粉酶的多核苷酸。在其它的方面,本發(fā)明涉及酶組合物,其包含一種或多種涵蓋在本發(fā)明中的葡糖 淀粉酶變體。在一些實施方案中,所述酶組合物將包括另外的酶,例如一種或多種α-淀粉 酶。在一些實施方案中,所述酶組合物可以用于淀粉轉化方法,乙醇發(fā)酵方法和/或動物飼 料配制。在有些方面,本發(fā)明涉及生產涵蓋在本發(fā)明中的變體葡糖淀粉酶的方法,包括用 編碼本發(fā)明的葡糖淀粉酶變體的多核苷酸轉化宿主細胞;在適于表達和生產所述葡糖淀粉 酶變體的條件下培養(yǎng)該宿主細胞并生產所述變體。在一些實施方案中,所述葡糖淀粉酶變 體從培養(yǎng)基中回收。
圖1顯示了具有632個氨基酸(SEQ ID NO 1)的里氏木霉葡糖淀粉酶(TrGA)。信 號肽加下劃線,以氨基酸殘基SVDDFI (SEQ ID NO 12)開始,并具有453個氨基酸殘基的催 化區(qū)(SEQ ID NO 3)以粗體顯示;接頭區(qū)域以斜體顯示,淀粉結合區(qū)(SBD)以斜體顯示并加 下劃線。包括催化區(qū)(SEQ ID Ν0:3),接頭區(qū)(SEQ ID NO 10)和淀粉結合區(qū)(SEQ IDNO 11)的成熟蛋白由SEQ ID NO 2表示。圖IB顯示了編碼TrGA的cDNA(SEQ ID NO 4)。圖 IC顯示了 TrGA前體和成熟蛋白結構域。圖 2 顯示了包括 TrGA 的 cDNA(SEQ ID NO 4)的目的質粒 pDONR-TrGA。圖 3 顯示了質粒 pTTT-Dest。圖4顯示了最終的表達載體pTTT-TrGA。圖5A-5B顯示了親本葡糖淀粉酶催化區(qū)的比對比較,所含葡糖淀粉酶包括來源于 泡盛曲霉(Aspergillus awamori) (AaGA) (SEQ ID NO 5);黑曲霉(Aspergillus niger) (AnGA) (SEQ ID NO 6);米曲霉(Aspergillusoryzae) (AoGA) (SEQ ID NO 7);里氏木霉 (Trichoderma reesei) (TrGA) (SEQ ID NO 3);灰腐質霉(Humicola grisea) (HgGA) (SEQID NO 8)和Hypocrea vinosa(HvGA) (SEQ ID NO 9)的葡糖淀粉酶。相同的氨基酸通過星號 (女)指出。圖5C顯示了踝節(jié)菌葡糖淀粉酶(TeGA)成熟蛋白序列(SEQ IDNO 308)。圖6是從側面觀察的木霉菌葡糖淀粉酶(黑色)(SEQ ID NO 2)和泡盛曲霉葡糖淀 粉酶(灰色)三維結構的比較。根據(jù)活性中心測定側面并且活性中心入口在該分子的“頂部”。圖7是從頂部觀察木霉菌葡糖淀粉酶(黑色)和泡盛曲霉葡糖淀粉酶(灰色)三 維結構的比較?;钚灾行娜肟谠谠摲肿拥摹绊敳俊?。發(fā)明詳述定義除非另有定義,本文使用的所有技術和科學術語具有與本發(fā)明所屬技術領域的 普通技術人員通常理解相同的含義。Singleton等,DICTI0NARY0F MICROBIOLOGY AND MOLECULAR BIOLOGY, 2D ED.,JohnWiley 和 Sons, New York (1994),和 Hale&Markham,The HARPERCOLLINS DICTIONARY OF BIOLOGY,Harper Perennial,N. Y. (1991)為技術人員提供 本文應用的很多術語的通常含義。但為了清楚和便于參考,仍在下面定義某些術語。本文所使用的術語“葡糖淀粉酶(EC3. 2.1.3) ”是指催化從淀粉和相關寡糖和多糖 的非還原性末端釋放D-葡萄糖的酶。本文所使用的術語“親本“或“親本序列”指的是與TrGA具有序列和/或結構同 一性的序列(例如,SEQ ID N0:l,2和/或3)和宿主細胞內天然的或自然出現(xiàn)的序列。本文所使用的術語“TrGA”指的是具有SEQ ID NO 2中顯示的成熟蛋白序列的里 氏木霉葡糖淀粉酶序列,其包括具有SEQ ID NO :3中顯示序列的催化區(qū)。W02006/060062 和2006年5月4日公開的美國專利號2006/0094080中描述了 TrGA的分離,克隆和表達, 其并入本文做為參考。TrGA也被認為是親本葡糖淀粉酶序列。在一些實施方案中,親本序 列指的是做為蛋白質工程的起點的TrGA。本文中葡糖淀粉酶氨基酸的編號基于TrGA葡糖 淀粉酶序歹Ij (SEQ ID NO 2 和 SEQ ID NO :3)。短語“蛋白質或多肽的成熟形式”指的是蛋白質或多肽的最終功能形式。舉例來 說,TrGA成熟形式包括催化區(qū),接頭區(qū)和淀粉結合區(qū),具有SEQ ID NO 2的氨基酸序列。術語“木霉菌葡糖淀粉酶同源物”指的是具有與TrGA序列(SEQ IDN0:1, SEQ ID NO :2或SEQ ID NO 3)至少80%氨基酸序列同一性的親本葡糖淀粉酶,其中該葡糖淀粉酶 保持了葡糖淀粉酶的功能性特征。本文中使用的“同源序列”意思是為了比較進行最佳序列比對時,與一種核酸序 列或多肽序列具有至少100%,至少99%,至少98%,至少97%,至少96%,至少95%,至 少94%,至少93%,至少92%,至少91%,至少90%,至少88%,至少85%,至少80%,至少 75 %,至少70 %,至少65 %,至少60 %,至少55 %,至少50 %或至少45 %序列同一性的核酸 或多肽序列,其中候選核酸序列或多肽序列的功能與和所述候選同源序列相比較的核酸序 列或多肽序列基本相同。在一些實施方案,同源序列具有85%和100%之間的序列同一性, 而在其它的實施方案中具有90%和100%之間的序列同一性,在其它的實施方案中,具有 95%和100%的序列同一性。在一些實施方案中,候選同源序列或親本與TrGA核酸序列或 成熟蛋白序列比較。序列同一性可以經由親本或同源序列的全長測定。本文中使用的術語“葡糖淀粉酶變體”,“變體”和“TrGA變體”用于與親本葡糖淀粉酶序列相似的葡糖淀粉酶(例如,TrGA或木霉菌葡糖淀粉酶同源物),但在其氨基酸序 列中具有使其在序列上不同于親本葡糖淀粉酶的至少一個取代,缺失或插入。在一些情況 中,它們已經被操作/改造以在它們的氨基酸序列中包括至少一個取代,缺失或插入,其使 得它們的序列不同于親本葡糖淀粉酶。
本文中使用的術語“催化區(qū)”指的是多肽的結構區(qū),其包含底物水解的活性位點。術語“接頭”指的是通常具有3到40個之間氨基酸殘基的短氨基酸序列,其共價 連接包含淀粉結合區(qū)的氨基酸序列和包含催化區(qū)的氨基酸序列。術語“淀粉結合區(qū)”指的是優(yōu)選結合于淀粉底物的氨基酸序列。本文中使用的術語“突變序列,,和“突變基因”可互換使用,指的是一種多核苷酸 序列,其具有發(fā)生于宿主細胞親本序列中的至少一個密碼子內的改變。突變序列的表達產 物為相對于親本具有改變的氨基酸序列的變體蛋白。所述表達產物可以具有改變的功能容 量(例如,增強的酶活性)。在多肽背景下,本文應用的術語“性質”或其語法上的等同對應詞指的是能夠被選 擇或檢測的多肽的任何特點或屬性。這些性質包括,但不限于氧化穩(wěn)定性,底物特異性,催 化活性,熱穩(wěn)定性,PH活性曲線,對蛋白降解的抗性,KM, Kcat, Kcat/Km比率,蛋白折疊,結合底 物的能力和分泌能力。在核酸背景下,本文應用的術語“性質”或其語法上的等同對應詞指的是能夠被選 擇或檢測的核酸的任何特點或屬性。這些性質包括,但不限于,影響基因轉錄的性質(例 如,啟動子強度和啟動子識別),影響RNA加工的性質(例如,RNA剪接和RNA穩(wěn)定性),影 響翻譯的性質(例如,調控,結合mRNA到核糖體蛋白)。
術語“熱穩(wěn)定的”和“耐熱的”指的是在淀粉底物水解過程中普通的條件下,本發(fā) 明的葡糖淀粉酶變體在給定的時段暴露于確認的溫度后,例如暴露于改變的溫度后,保持 特定量的酶活性。在性質例如熱穩(wěn)定性的背景下,術語“增強的穩(wěn)定性”指的是比較于另一個參照 (例如,親本)葡糖淀粉酶,隨時間推移維持的更高的淀粉水解活性。在性質例如熱穩(wěn)定性的背景下,術語“降低的穩(wěn)定性”指的是比較于另一個參照葡 糖淀粉酶,隨時間推移維持的更低的淀粉水解活性。術語“比活性”被定義為每毫克葡糖淀粉酶蛋白的活性。在一些實施方案中,葡糖 淀粉酶的活性通過本文描述的乙醇試驗測定并表達為從淀粉底物產生的葡萄糖的量。在一 些實施方案中,蛋白質濃度可以使用本文描述的Caliper試驗測定。術語“活性”和“生物活性”指的是與某具體蛋白相關的生物活性。由此可見,給 定蛋白的生物活性指的是由本領域技術人員通常歸因于該蛋白的任何生物活性。例如,與 葡糖淀粉酶相關的酶活性是水解的,于是活性葡糖淀粉酶具有水解活性。術語“多核苷酸”和“核酸”,在本文中互換使用,指的是任何長度核苷酸的聚合形 式,或者核糖核苷酸或者脫氧核糖核苷酸。這些術語包括,但不限于,單_,雙_,或三-鏈 DNA,基因組DNA,cDNA, RNA, DNA-RNA雜合物,或包含嘌呤和嘧啶堿基的聚合物,或其他天然 的,化學,生物化學修飾的,非天然的或者衍化的核苷酸堿基。本文中使用的術語“DNA構建體” “轉化DNA”和“表達載體”互換使用,指的是用 于引入序列到宿主細胞或生物的DNA。所述DNA可以通過PCR或本領域技術人員已知的任 何其它合適的技術在體外產生。DNA構建體,轉化DNA或重組表達盒可以被摻入到質粒,染 色體,線粒體DNA,質體DNA,病毒或核酸片段。通常地,表達載體的重組表達盒部分,DNA構 建體或轉化DNA包括,除其它序列外,被轉錄的核酸序列和啟動子。在實施方案中,表達載 體具有在宿主細胞中摻入和表達異源DNA片段的能力。
本文中使用的術語“載體”指的是設計用于引入核酸到一種或多種細胞類型的多 核苷酸構建體。載體包括克隆載體,表達載體,穿梭載體,質粒,表達盒等等。在引入核酸序列到細胞內的背景下,本文使用的術語“引入”指的是適合轉移核酸 序列到細胞內的任何方法。這些引入方法方法包括但不限于原生質體融合,轉染,轉化,接 合,和轉導。本文中使用的術語“轉化的”和“穩(wěn)定轉化的”指的是細胞,其具有整合入其基因 組的非天然(異源的)多核苷酸序列或做為維持至少兩代的游離質粒。本文中使用的術語“選擇標記”和“選擇性標記”指的是能夠在宿主細胞內表達的 核酸(例如,基因),其允許容易地選擇那些包含載體的宿主。通常,選擇標記是賦予宿主細 胞抗生素抗性或代謝優(yōu)勢的基因,以在轉化過程中允許包含外源DNA的細胞與未接受任何 外源序列的細胞區(qū)分開來。本文中使用的術語“啟動子”指的是具有指導下游基因轉錄作用的核酸序列。啟 動子,和其他轉錄和翻譯調節(jié)核酸序列(也稱為“控制序列”)一起對于表達給定基因是必 須的。通常,轉錄和翻譯調節(jié)序列包括,但不限于啟動子序列,核糖體結合位點,轉錄起始和 終止序列,翻譯起始和終止序列,和增強子或激活子序列。當其置于與另外一個核酸序列的功能關系中時,核酸被“有效連接”。例如,如果 編碼分泌前導序列(即,信號肽)的DNA表達為參與多肽分泌的前導蛋白,那么編碼分泌前 導序列(即,信號肽)的DNA有效地連接于多肽的DNA。通常,“有效連接”意思是被連接的 DNA序列是相鄰的,并且至于分泌前導序列,是相鄰的并且在閱讀相內。本文中使用的術語“基因”指的是多核苷酸(例如,DNA片段),其編碼多肽,并包 括編碼區(qū)之前和之后的區(qū)域以及單個編碼區(qū)段(外顯子)之間的間插序列(內含子)。本文中使用的“同源基因”指的是來自不同,但通常相關的物種的一對基因,其相 互對應并且彼此相同或非常近似。該術語包括由物種形成(即新物種發(fā)展)分離的基因 (例如,直向同源基因),以及已經由基因復制分離的基因(例如,旁系同源基因)。本文中使用的“直向同源物”和“直向同源基因”指的是通過物種形成從共同的祖 先基因(S卩,同源基因)進化而來的不同物種中的基因。通常,直向同源物在進化過程中保 持相同的功能。直向同源物的鑒定在新近測序的基因組中可靠預測基因功能中得到應用。本文中使用的“旁系同源物”和“旁系同源基因”指的是基因組內通過復制相關的 基因。盡管直向同源物在進化過程中保持相同的功能,但是旁系同源物進化新功能,盡管一 些功能通常與最初的基因相關。旁系同源基因的實例包括,但不限于編碼胰蛋白酶,胰凝乳 蛋白酶,彈性蛋白酶和凝血酶的基因,其都是絲氨酸蛋白酶并在同一物種內一起發(fā)生。本文中使用的術語“同源性”指的是序列相似性或同一性,優(yōu)選同一性。該同源 性使用本領域已知的標準技術確定(參見,例如,Smith和Waterman,(1981)Adv. Appl. Math. ,2482 ;Needleman 禾口 Wunsch, (1988)J. Mol. Biol. ,48443 ;Pearson 禾口 Lipman, (1988) Proc. Natl. Acad. Sci. USA 85:2444;程序,如 Wisconsin Genetics Software Package (GeneticsComputer Group, Madison, WI)中的 GAP,BESTFIT,F(xiàn)ASTA,和 TFASTA ;禾口 Devereux et al.,(1984)Nucl. Acid Res.,12 :387_395)。“核酸序列同一性百分數(shù)(% ) ”或“氨基酸序列同一性百分數(shù)(% ) ”被定義為候 選序列中與起始序列(如,TrGA)的核苷酸殘基或氨基酸殘基相同的核苷酸殘基或氨基酸殘基的百分比。序列同一性可以在起始序列全長(即,TrGA SEQ ID NO :2或3)上測量。同源序列由已知的序列比對方法確定。通常使用的比對方法是由Altschul等 (Altschul 等,(1990) J. Mol.Biol.,215 403-410 ;禾口 Karl in 等,(1993) Proc. Natl. Acad. Sci.USA 90 5873-5787)描述的BLAST。一個尤其有用的BLAST程序是WU-BLAST-2程序(參 見,Altschul 等,(1996)Meth. Enzymol.,266 460-480)。WU-BLAST-2 使用幾個檢索參數(shù), 其大多數(shù)被設定為默認值??烧{整的參數(shù)設定為下列值,重疊間隔=1,重疊部分=0. 125, 字段閾值(T) =11。HSPS和HSP S2參數(shù)是動態(tài)值并通過程序本身建立,其依賴于具體序 列的組成和目的序列被檢索的具體數(shù)據(jù)庫的組成。但是,這些值可以被調整以增加靈敏性。 氨基酸序列同一性值由匹配的相同殘基的數(shù)目除以比對區(qū)內“更長”序列的殘基總數(shù)來 確定?!案L”序列是在比對區(qū)中具有大多數(shù)實際殘基的序列(忽略由WU-Blast-2為最大 化比對得分而引入的空位)。其它的方法也應用于比對序列。一個有用算法的例子是PILEUP。PILEUP使用漸 進的逐對比對從一組相關序列產生多個序列比對。PILEUP使用Feng和Doolittle的漸進 式比對方法的簡化形式(Feng和Doolittle,(1987) J. Mol. Evol. ,35 :351_360)。該方法與 Higgins 和 Sharp 描述的方法相似(Higgins 和 Sharp,(1989)CABI0S 5 151-153)。有用的 PILEUP參數(shù)包括默認的空位權重3. 00,默認的空位長度權重0. 10和加權的末端空位。術語“最優(yōu)比對”指的是提供最高同一性百分率得分的比對?!暗韧恢谩敝傅氖?兩個序列之間的最優(yōu)比對。例如利用圖5D和5E,TrGA(SEQID NO 2)中491位是C491 ;黑 曲霉的等同位置是C509位;泡盛曲霉的等同位置是Q538位。對于三維序列的示例性比對 參見圖8。本文中使用的術語“雜交”指的是如本領域所知,核酸鏈與互補鏈通過堿基配對結 合的過程。如果在中等到高嚴格度雜交和洗滌條件下,兩個序列互相特異地雜交,則認為核 酸序列對于參考序列是“選擇性雜交的”。雜交條件是以核酸結合復合體或探針的解鏈溫度 (Tm)為基礎的。例如,“最大嚴格性”通常發(fā)生在約Tm-5°C (低于探針Tm 5°C );“高嚴格 性”在低于Tm約5-10°C ;“中等嚴格性”在低于探針Tm約10_20°C ;“低嚴格性”在低于Tm 約20-25°C。功能上來說,最大嚴格性條件可以用于鑒定與雜交探針具有嚴格同一性或接近 嚴格同一性的序列;而中等或低嚴格性條件可以用于鑒定或檢測多核苷酸序列同源物。中等和高嚴格性雜交條件是本領域公知的。高嚴格性條件的一個例子包括在約 42°C,在 50% 甲酰胺,5XSSC,5XDenhardt,s 液,0. 5% SDS 和 100 ii g/ml 變性載體 DNA 中雜 交,之后在室溫下,2XSSC和0. 5%SDS中洗滌兩次,并在42°C,0. IX SSC和0. 5%SDS中洗滌 另外兩次。中等嚴格性條件的一個例子包括37°C,在包含20%甲酰胺,5X SSC(150mMNaCl, 15mM檸檬酸三鈉),50mM磷酸鈉(pH7. 6),5XDenhardt,s液,10%硫酸葡聚糖和20mg/ml變 性的剪切鮭精DNA的溶液中溫育,之后在約37-50°C,lX SSC中洗滌濾膜。本領域技術人員 知曉如何調整溫度,離子強度等,其對于適應例如探針長度等等的因素是必須的。本文中使用的“重組”包括涉及的細胞或載體,其通過引入異源的或同源的核酸序 列被修飾或所述細胞來源于此種修飾的細胞。這樣,例如,作為人類有意干預的結果,重組 細胞表達天然(非重組)形式細胞內未發(fā)現(xiàn)相同形式的基因,或表達天然基因,其否則異常 表達,低表達或根本不表達。
在本發(fā)明的一些實施方案中,突變的DNA序列通過在至少一個密碼子中位點飽和 誘變產生。在其它的實施方案中,位點飽和誘變實施于兩個或更多的密碼子。在另一實施 方案中,突變的DNA序列具有與親本序列超過50 %,超過55 %,超過60%,超過65%,超過 70%,超過75%,超過80%,超過85%,超過90%,超過95%,超過98%或超過99%的同源 性。在備選實施方案中,突變DNA使用任何已知的誘變方法如,舉例來說,輻射,亞硝基胍等 等在體內產生。希望DNA序列于是被分離和在本文提供的方法中使用。本文中使用的“異源蛋白”指的是非宿主細胞內自然發(fā)生的蛋白質或多肽。本文中使用的“同源蛋白”指的是細胞內天然或自然發(fā)生的蛋白質或多肽,并包括 由重組DNA技術或者細胞內天然過表達的天然蛋白質。如果酶在細胞內以比其在相應野生型細胞內表達的水平更高的水平表達,酶即為 在宿主細胞內“過表達”。術語“蛋白質”和“多肽”在本文中可互換使用。在本公開和權利要求中,使用用 于氨基酸殘基的常規(guī)單字母和三字母代碼。氨基酸三字母代碼定義與IUPAC-IUB生物化學 命名聯(lián)合委員會(JCBN) —致。也可以理解的是,由于基因密碼的簡并性,多肽可以由不止 一個核苷酸序列編碼。通過下面的命名法描述本發(fā)明的變體[原始氨基酸殘基/位置/取代的氨基酸 殘基]。例如在76位用亮氨酸取代精氨酸被表示為R76L。當多于一個氨基酸在給定位置 被取代,該取代被表示為DQ172C, Q172D或Q172R ;2)Q172C, D,R或c)Q172C/D/R??梢岳?解的是,當本文鑒定的適合取代的位置沒有推薦的特定氨基酸,那么任何氨基酸殘基可以 取代該位置上存在的氨基酸殘基。與其它葡糖淀粉酶相比,變體葡糖淀粉酶包含缺失時,該 缺失以標示。例如,位置R76的缺失被表示為R76 *。兩個或更多個連續(xù)氨基酸的缺 失被標示為,例如(76-78) *?!扒靶蛄小笔切盘栃蛄泻统墒斓鞍字g對于蛋白質分泌必需的氨基酸序列。切割前 序列將產生成熟有活性的蛋白質。術語“信號序列”或“信號肽”指的是可以參與成熟或前體形式蛋白質分泌的任何 核苷酸和/或氨基酸序列。信號序列的該定義是功能性定義,意味著包括由所述蛋白基因 的N-末端部分編碼的所有那些氨基酸序列,其參與蛋白分泌的完成。其經常,但不總是,結 合于蛋白質的N-末端部分或前體蛋白的N-末端部分。信號序列可以是內源的或外源的。 信號序列可以通常情況下結合于所述蛋白質(例如,葡糖淀粉酶)或可以來自編碼另一分 泌蛋白的基因。術語蛋白質或肽的“前體”形式指的是具有有效連接于該蛋白質的氨基或羰基末 端的前序列的成熟形式的蛋白質。前體也可以具有有效連接于前序列氨基末端的“信號” 序列。前體也可以具有參與翻譯后活動(例如,從中切割以產生成熟形式蛋白質或肽的多 肽)的另外的多肽?!八拗骶辍被颉八拗骷毎敝傅氖前鶕?jù)本發(fā)明DNA的表達載體的適宜宿主。術語“來自”和“獲自,,不僅指由討論中的生物株系產生或可產生的葡糖淀粉酶, 也指由分離自如此株系的DNA序列編碼的和在包含如此DNA序列的宿主生物中產生的葡糖 淀粉酶。此外,該術語指由合成的和/或cDNA來源的DNA序列編碼的并且具有討論中的葡 糖淀粉酶確認特征的葡糖淀粉酶。
該定義范圍內的“衍生物”通常保持野生型,天然的或親本形式中觀察到的特征性 水解活性到這樣的程度,其使該衍生物可用于與野生型,天然的或親本形式相似的目的。葡 糖淀粉酶功能性的衍生物包含自然發(fā)生的,合成地或重組產生的肽或肽片段,其具有本發(fā) 明的葡糖淀粉酶的一般特征。術語“分離的”或“純化的”指的是從其起始環(huán)境中被移開的物質(例如自然環(huán) 境,如果其是自然發(fā)生地)。在一些實施方案中,如通過SDS-PAGE確定,分離的蛋白質是超 過10%純的,優(yōu)選超過20%純的,和更優(yōu)選超過30%純的。本發(fā)明另外的方面包括如通過 SDS-PAGE確定的高度純化形式的蛋白質(即超過40 %純的,超過60 %純的,超過80 %純 的,超過90 %純的,超過95 %純的,超過97 %純的,和甚至超過99 %純的)。本文中使用的術語“組合誘變”指的是產生起始序列的變體文庫的方法。在這些 文庫內,變體包含選自預先確定的一組突變的一個或幾個突變。除此之外,方法提供了引 入隨機突變的手段,所述隨機突變不是預先確定的一組突變的成員。在一些實施方案中, 所述方法包括USP6,582,914中闡述的那些方法,在此并入作為參考。在備選的實施方案 中,組合誘變方法包括商業(yè)上可獲得的試劑盒(例如,QUIKCHANGE MUltisite, Stratagene, San Diego, CA)0本文中使用的術語“突變體文庫”指的是細胞群體,其基因組的大多數(shù)相同,但包 括一個或多個基因的不同同源物。這樣的文庫可以用于,例如,鑒定具有改良性狀的基因或 操縱子。本文中使用的術語“干燥固體含量(DS或ds) ”指的是漿液的總固體基于干重的百 分比。本文中使用的術語“起始命中”指的是通過篩選組合共有誘變文庫鑒定的變體。在 實施方案中,與起始基因相比,起始命中具有改善的性能特征。本文中使用的術語“改善的命中”指的是通過篩選增強的組合共有誘變文庫鑒定 的變體。本文中使用的術語“目標特性”指的是將被改變的起始基因的特性。并不意圖將 本發(fā)明限定于任何具體的目標特性。但是,在一些實施方案中,目標特性是基因產物的穩(wěn)定 性(例如,對變性,蛋白水解或其它降解因素的抗性),而在其它的實施方案中,生產宿主中 的產物的水平改變。事實上,預期起始基因的任何特性都在本發(fā)明中得到應用。術語的其 它定義可在說明書的各處出現(xiàn)。在更詳細描述示例性的實施方案之前,應當理解的是,本發(fā)明不限于本文描述的 具體實施方案,因為這些可以變化。也應當理解,本文中使用的術語只是為了描述具體的實 施方案,并無限制性意圖。當提供數(shù)值范圍時,應當理解,除非上下文另有明確規(guī)定,該范圍的上限和下限之 間的每個中間值,直至下限單位的十分之一,也被具體地公開。任何陳述值之間的每個更小 范圍或陳述范圍內的中間值和任何其它公開的或所述公開范圍內的中間值都包括在本發(fā) 明內。這些更小范圍的上限或下限可以獨立地包括于或排除于該范圍,兩個端點之一,兩個 端點都不或都包括在更小范圍的每個范圍也包括在本發(fā)明之內,其受限于公開范圍內任何 具體排除的界限。如果公開的范圍排除一個或兩個端點,排除一個或者兩個所述被包括端 點的范圍也包括在本發(fā)明內。
盡管與本文描述的那些方法和材料相似或等同的任何方法和材料可以用于實施或測試本發(fā)明,現(xiàn)在仍描述示例性的和優(yōu)選的方法和材料。本文提到的所有出版物并入本 文作為參考,以公開和描述與引用的出版物有關的方法和/或材料。除非上下文另有明確規(guī)定,單數(shù)形式包括復數(shù)指代。這樣,例如,提到“一個基因” 包括多個這樣的候選基因,提到“細胞”包括涉及一個或多個細胞和本領域技術人員知曉的 等同物,等等。本文中討論的出版物只有其公開早于本申請的申請日,才被提供。本文不承認本 發(fā)明無權由于是在先發(fā)明而早于此類出版物。詳述的實施方案本發(fā)明的目的是改變親本葡糖淀粉酶,尤其是里氏木霉葡糖淀粉酶(TrGA)的特 性,例如熱穩(wěn)定性和/或比活性,以獲得具有改變特性的葡糖淀粉酶變體,其將會用于多種 應用,例如淀粉轉化或乙醇發(fā)酵過程。親本葡糖淀粉酶在一些實施方案中,本發(fā)明提供了親本葡糖淀粉酶的葡糖淀粉酶變體。親本葡糖 淀粉酶可以包含與TrGA(SEQ ID NOs :2和/或3)有序列和/或結構同一性的序列。在一 些實施方案中,親本葡糖淀粉酶包含如SEQ IDNOs :1,2,3,5,6,7,8或9中顯示的氨基酸序 列。在一些實施方案中,親本葡糖淀粉酶是同源物。在一些實施方案中,親本葡糖淀粉酶具 有與SEQ ID NO :2的TrGA氨基酸序列至少50%的序列同一性,至少60%的序列同一性, 至少70%的序列同一性,至少80%的序列同一性,至少85%的序列同一性,至少88%的序 列同一性,至少90%的序列同一性,至少93%的序列同一性,至少95%的序列同一性,至少 96 %的序列同一性,至少97 %的序列同一性,至少98 %的序列同一性,和至少99 %的序列 同一性。在一些實施方案中,親本葡糖淀粉酶包含催化區(qū),其具有與SEQ IDNO =1,2,3,5,6, 7或8中顯示的一個或多個氨基酸序列有至少50%的氨基酸序列同一性,至少60%的氨基 酸序列同一性,至少70%的氨基酸序列同一性,至少80%的氨基酸序列同一性,至少85% 的氨基酸序列同一性,至少90 %的氨基酸序列同一性,至少93 %的氨基酸序列同一性,至 少95%的氨基酸序列同一性,至少97%的氨基酸序列同一性和至少99%的氨基酸序列同 一性的氨基酸序列。在其它的實施方案中,親本葡糖淀粉酶將具有與SEQ IDNO :3的TrGA 氨基酸序列的催化區(qū)至少80%的序列同一性,至少85%的序列同一性,至少90%的序列同 一性,至少95%的序列同一性,至少97%的序列同一性,和至少98%的序列同一性。親本葡糖淀粉酶可以由DNA序列編碼,其在中等或高嚴格性條件下與編碼具有 SEQ ID N0:l,2或3的一個氨基酸序列的葡糖淀粉酶的DNA雜交。在一些實施方案中,具 有至少50%序列同一性,至少60%的氨基酸序列同一性,至少70%的氨基酸序列同一性, 至少80%的氨基酸序列同一性,至少90%的氨基酸序列同一性,至少95%的氨基酸序列同 一性和至少97%的氨基酸序列同一性的親本葡糖淀粉酶也具有與SEQ ID NOs :2和/或3 的結構同一性。盡管親本葡糖淀粉酶是宿主細胞內天然的或自然發(fā)生的序列,但在一些實 施方案中,親本葡糖淀粉酶是自然發(fā)生的變體。在一些實施方案中,親本葡糖淀粉酶是改造 的變體和/或雜合葡糖淀粉酶。葡糖淀粉酶的預測結構和已知序列在真菌物種中是保守的(Coutinho等,(1994)Protein Eng. ,7 :393_400 和 Coutinho 等· , (1994), ProteinEng. ,7 :749_760)。在一 些實施方案中,親本葡糖淀粉酶是絲狀真菌葡糖淀粉酶。在一些實施方案中,親本葡 糖淀粉酶獲自木霉屬菌株(例如,里氏木霉,長梗木霉(T. longibrachiatum),嚴緊木 霉(T. strictipilis),棘胞木霉(T. asperellum),康長木霉(T. koni langbra)和哈茨 木霉(T.hazianum)),曲霉屬菌株(例如黑曲霉,構巢曲霉,A. kawachi,泡盛曲霉和米曲 霉),踝節(jié)菌屬株(例如埃默森踝節(jié)菌(T. emersonii),濕熱踝節(jié)菌(T. thermophilus) 和T. duponti),肉座菌屬菌株(例如膠質肉座菌(H. gelatinosa),東方肉座菌 (H. orientalis),H. vinosa,H. citrina),鐮孢屬菌株(例如,尖鐮孢(F. oxysporum),粉紅 鐮孢(F. roseum)和F. venenatum),脈孢菌屬菌株(例如粗糙脈孢菌(N. crassa))和腐質霉 屬菌株(例如,灰腐質霉,特異腐質霉(H. insolens)和H. lanuginosa),青霉屬菌株(例如 點青霉或產黃青霉),或復膜孢酵母屬菌株(例如S. fibuligera)。在一些實施方案中,親本葡糖淀粉酶是細菌葡糖淀粉酶。例如,多肽可以獲自革蘭氏陽性菌株,例如芽孢桿菌(例如,嗜堿芽孢桿菌(B. alkalophilus),解淀粉芽孢桿菌 (B. amyloliquefaciens),遲緩芽孢桿菌(B. Ientus),地衣芽孢桿菌(B. Iicheniformis), 嗜熱脂肪芽孢桿菌(B. stearothermophilus),枯草芽孢桿菌(B. subtilis)和蘇云金芽孢 桿菌(B. thuringiensis))或鏈霉屬菌株(例如,淺青紫鏈霉菌(S. Iividans))。在一些其它實施方案中,親本葡糖淀粉酶將包含與SEQ ID NO :5或SEQ ID NO 6 的曲霉親本葡糖淀粉酶的催化區(qū)有至少90%序列同一性,至少93%序列同一性,至少95% 序列同一性,至少96%序列同一性,至少97%序列同一性,至少98%序列同一性和至少 99 %序列同一性的氨基酸序列。在其它實施方案中,親本葡糖淀粉酶將包含與SEQ ID NO 8的灰腐質霉(HgGA)親 本葡糖淀粉酶的催化區(qū)有至少90%序列同一性,至少95%序列同一性,至少97%序列同一 性和至少99%序列同一性的氨基酸序列。在一些實施方案中,親本葡糖淀粉酶具有與SEQ ID NO :2或3的TrGA氨基酸序列 至少50%的序列同一性,至少60%的序列同一性,至少70%的序列同一性,至少80%的序 列同一性,至少85 %的序列同一性,至少88 %的序列同一性,至少90 %的序列同一性,至少 93 %的序列同一性,至少95 %的序列同一性,至少96 %的序列同一性,至少97 %的序列同 一性,至少98%的序列同一性和至少99%的序列同一性,并具有與SEQ IDNO :2或3的葡糖 淀粉酶的結構同一性。在另外的實施方案中,木霉屬葡糖淀粉酶同源物可以獲自木霉屬或肉座菌屬的菌 株。有些木霉葡糖淀粉酶同源物在美國專利
發(fā)明者C·弗勒門, I·尼古拉耶夫, M·謝弗斯, P·范索林恩, R·R·博特, W·埃赫勒 申請人:丹尼斯科美國公司