專利名稱:葡糖淀粉酶變體的制作方法
葡糖淀粉酶變體相關(guān)申請的交叉引用本申請要求2007年10月9日提出的國際專利申請PCT/USOT/^ieSS的優(yōu)先權(quán),而 該國際專利申請要求2006年10月10日提出的美國臨時申請60/850,431的優(yōu)先權(quán),兩個 專利申請的內(nèi)容整體納入本文做為參考。 發(fā)明領(lǐng)域本發(fā)明涉及葡糖淀粉酶變體。具體地,本發(fā)明涉及葡糖淀粉酶的淀粉結(jié)合區(qū)(SBD) 中的變體。本發(fā)明還涉及與對應(yīng)的親本葡糖淀粉酶相比具有改變的性質(zhì)(例如,提高的熱 穩(wěn)定性和/或增加的比活性)的變體。本發(fā)明還提供了包含變體葡糖淀粉酶的酶組合物;包 含編碼所述變體的多核苷酸的DNA構(gòu)建體;和在宿主細胞中產(chǎn)生葡糖淀粉酶變體的方法。
背景技術(shù):
葡糖淀粉酶(葡聚糖1,4-α-葡糖水解酶,EC3.2. 1.3)是淀粉水解外切糖酶,其 催化從淀粉或相關(guān)寡糖和多糖分子的非還原性末端去除連續(xù)的葡萄糖單元。葡糖淀粉酶可 以水解線性的和分枝的糖苷鍵連接的淀粉(例如,直鏈淀粉和支鏈淀粉)。葡糖淀粉酶可以通過多種株系的細菌,真菌,酵母和植物生產(chǎn)。尤其有趣和商業(yè) 上重要的是,葡糖淀粉酶是細胞外產(chǎn)生的真菌酶,例如來自曲霉屬(Svensson等,(1983) Carlsberg Res.Commun. 48 :529_544 ;Boel 等·,(1984)EMBO J. 3 1097-1102 ;Hayashida 等·,(1989)Agric BiolChem. 53 923~929 ;USP 5024,941 ;USP4,794,175 和 W088/09795); 踝節(jié)菌屬(USP4, 247,637 ;USP6, 255,084 和 USP6, 620,924);根霉屬(Ashikari 等·, (1986)Agric. Biol. Chem. 50 957-964 ;Ashikari 等·, (1989)App. Microbiol.禾口 Biotech. 32 129-133 和 USP4, 863,864);腐質(zhì)霉屬(W005/052148 和 USP4, 618579)和毛霉 菌(Houghton-Larsen 等.,(2003) Appl. Microbiol. Biotechnol. 62 :210_217)的菌株。編 碼這些酶的很多基因已經(jīng)在酵母,真菌和/或細菌細胞內(nèi)被克隆和表達。葡糖淀粉酶是商業(yè)上非常重要的酶,并已經(jīng)應(yīng)用于需要淀粉水解的各種應(yīng)用(例 如,從淀粉產(chǎn)生葡萄糖和其它單糖)。葡糖淀粉酶用于產(chǎn)生高果糖漿甜味劑,其構(gòu)成美國超 過50%的甜味劑市場。一般來說,葡糖淀粉酶可以,并且通常與α-淀粉酶一起用于淀粉水 解過程,以水解淀粉為糊精,然后水解為葡萄糖。接著葡萄糖可以由其它酶(例如,葡萄糖 異構(gòu)酶)轉(zhuǎn)化為果糖;結(jié)晶化;或用于發(fā)酵以產(chǎn)生多種終產(chǎn)物(例如,乙醇,檸檬酸,乳酸, 琥珀酸,抗壞血酸中間體,谷氨酸,甘油和1,3_丙二醇)。通過在淀粉和/或包含纖維素材 料的發(fā)酵中使用葡糖淀粉酶產(chǎn)生的乙醇可以用做燃料或用于酒精消費。盡管葡糖淀粉酶已經(jīng)成功地用于商業(yè)應(yīng)用許多年,但是仍然需要具有改變的性 質(zhì),如提高的比活性和增加的熱穩(wěn)定性的新的葡糖淀粉酶。發(fā)明概述一方面,本發(fā)明涉及分離的葡糖淀粉酶變體,其包含催化區(qū)和淀粉結(jié)合區(qū)(SBD), 所述SBD在對應(yīng)于 SEQ ID NO :2 的位置 493,494,495,501,502,503,508,511,517,518,519, 520,525,527,531,533,535,536,537,538,539,540,545,546,547,549,551,561,563,567,569,577,579,和583或?qū)?yīng)于親本葡糖淀粉酶中等同位置的位置上包含一個或多個氨基 酸取代。在一些實施方案中,通過序列同一性確定親本葡糖淀粉酶中的等同位置,所述親本 葡糖淀粉酶與SEQ ID NO 2有至少80%氨基酸序列同一性和少于100%氨基酸序列同一 性。在其他實施方案中,親本葡糖淀粉酶與SEQ IDNO :2有至少90%或至少95%氨基酸序 列同一性。在額外實施方案中,通過與SEQ ID NO :2或SEQ ID NO :11的結(jié)構(gòu)同一性確定 等同位置。在一些實施方案中,親本葡糖淀粉酶包含與選自SEQ ID NO :11,SEQ IDNO 385, SEQ ID NO :386,SEQ ID NO :387,SEQ ID NO :388,或 SEQ IDNO 389 的 SBD 有至少 95%氨 基酸序列同一性的SBD。在其他實施方案中,催化區(qū)與SEQ ID NO :3的序列有至少90%氨 基酸序列同一性。在其他實施方案中,一個或多個氨基酸取代對應(yīng)于SEQ ID N0:2的位置 520,535或539。在再一個實施方案中,一個或多個氨基酸取代對應(yīng)于SEQ ID NO :2的位置 519和/或563。在再一個實施方案中,分離的葡糖淀粉酶變體還包含在對應(yīng)于SEQ ID NO: 2 或 SEQ ID NO 3 的 10,14,15,23,42,45,46,59,60,61,67,68,72,73,97,98,99,102,108, 110,113,114,122,124,125,133,140,144,145,147,152,153,164,175,182,204,205,214, 216,219,228,229,230,23 1,236,239,240,241,242,244,263,264,265,268,269,276,284, 291,300,301,303,310,311,313,316,338,342,344,346,349,359,361,364,379,382,390, 391,393,394,408,410,415,417,418,430,431,433,436,442,443,444,448 和 451 的殘基位 置的位置上的一個或多個氨基酸取代。
在另一方面,本發(fā)明涉及包含催化區(qū)和SBD的分離的葡糖淀粉酶變體,所述SBD在 對應(yīng)于 SEQ ID NO 2 的位置 493,494,495,502,503,508,511,518,519,520,527,531,535, 536,537,539,563,和577或?qū)?yīng)于親本葡糖淀粉酶中等同位置的位置上包含一個或多個 氨基酸取代。在一些實施方案中,親本葡糖淀粉酶與SEQ ID NO :2有至少90%序列同一 性。在進一步實施方案中,一個或多個氨基酸取代對應(yīng)于SEQ ID N0:2的T493C,T493M, T493N, T493Q, T493Y, P494H, P494I, P494M, P494N, P494Q, P494W, T495M, T495P, T495R, H502A, H502M, H502S, H502V, E503C, E503D, E503H, E503S, E503W, Q508N, Q508P, Q508Y, Q511C, Q511G, Q511H, Q511I, Q511K, Q511T, Q511V, N518P, N518T, A519I, A520C, A520E, A520L, A520P, A520Q, A520R, A520W, V531A, V5311L, V531N, V531R, V531S, V531T, A535E, A535F, A535G, A535K, A535L, A535N, A535P, A535R, A535S, A535T, A535V, A535W, A535Y, V536C, V536E, V536I V536L, V536M, V536Q, V536S, A539E, A539M, A539R, A539S,和 A539W, 或者親本葡糖淀粉酶中的等同位置。在進一步實施方案中,一個或多個氨基酸取代對應(yīng)于 SEQ ID NO 2 的位置 T495R, E503C, E503S, Q511H, V531L,或 V536I。在還進一步的實施方 案中,一個或多個氨基酸取代對應(yīng)于SEQ ID NO :2的位置494,511,520,527,531,535,536, 537,563 和 577。在其他方面,本發(fā)明涉及包含催化區(qū)和SBD的葡糖淀粉酶變體,所述SBD在對應(yīng) 于 SEQ ID NO 2 的位置 T493I, T495K, T495R, T495S, E503A, E503C, E503S, E503T, E503V, Q508H, Q508R, Q508S, Q508T, Q511A, Q511D, Q511H, Q511N, Q511S, N518S, A519E, A519K, A519R, A519T, A519V, A519Y, A520C, A520L, A520P, T527A, T527V, V531L, A535D, A535K, A535N, A535P, A535R, V536I, V536R, N537W, A539E, A539H, A539M, A539R, A539S, N563A, N563C, N563E, N563I, N563K, N563L, N563Q, N563T, N563V, N577A, N577K, N577P, N577R,和 N577V的位置或親本葡糖淀粉酶中的等同位置上包含一個或多個氨基酸取代。在一些實施方案中,親本葡糖淀粉酶具有SEQ ID NO :2的至少90%序列。在再一方面,本發(fā)明涉及包含催化區(qū)和SBD的葡糖淀粉酶變體,所述SBD在對應(yīng)于SEQ ID NO :2的位置503,511,519,531,535,539,563,和577的位置上包含一個或多個氨 基酸取代。在一些實施方案中,一個或多個氨基酸取代選自SEQ ID N0:2的E503A,E503C, E503V, Q511H, A519K, A519R, A519Y, V531L, A535K, A535N, A535P, A535R, A539E, A539R, A539S, N563C, N563E, N563I, N563K, N563L, N563Q, N563T, N563V, N577K, N577P,和 N577R。在另一方面,本發(fā)明涉及包含催化區(qū)和淀粉結(jié)合區(qū)(SBD)的葡糖淀粉酶變體,a) 所述催化區(qū)包含與SEQ ID NO 3的氨基酸序列有至少85%序列同一性和b)所述SBD在對 應(yīng)于 SEQ ID NO 11 的位置 3,4,5,11,12,13,18,21,27,28,29,30,35,37,41,43,45,46,47, 48,49,50,55,56,57,59,61,71,73,77,79,87,89,和93的位置上包含一個或多個氨基酸取 代或所述SBD在親本葡糖淀粉酶SBD的SEQ ID NO 11的等同位置上包含一個或多個氨基 酸取代。在一些實施方案中,催化區(qū)與SEQ ID NO :3的氨基酸序列有至少90%序列同一 性。在進一步實施方案中,催化區(qū)與SEQ ID NO :3的氨基酸序列有至少95%序列同一性。 在額外實施方案中,SBD在對應(yīng)于SEQ ID NO 11的位置3,4,5,11,12,13,18,21,27,28,29, 30,35,37,41,43,45,46,47,48,49,50,55,56,57,59,61,71,73,77,79,87,89,和 93 的位置 上包含一個或多個氨基酸取代。在其他實施方案中,SBD在對應(yīng)于SEQID NO=Il的位置3, 4,5,12,13,18,21,28,29,30,37,41,45,46,47,49,73,和 87 或親本葡糖淀粉酶的等同位置 上包含一個或多個氨基酸取代。在其他實施方案中,一個或多個氨基酸取代對應(yīng)于SEQ ID NO 11 的位置 3,5,13,18,21,28,29,30,37,41,45,46,47,49,73,和 87。在其他實施方案中, 一個或多個氨基酸取代對應(yīng)于選自SEQ ID N0:11的位置5,13,21,30,41,45,46,和49的 位置。在本發(fā)明的額外方面,葡糖淀粉酶變體與對應(yīng)的親本葡糖淀粉酶相比將具有至少 一種改變的性質(zhì)。在一些實施方案中,改變的性質(zhì)是增加的比活性。在進一步實施方案中, 改變的性質(zhì)是增加的熱穩(wěn)定性。在額外實施方案中,改變的性質(zhì)是增加的比活性和增加的 熱穩(wěn)定性。在本發(fā)明的其他方面,親本葡糖淀粉酶選自得自木霉、曲霉、腐質(zhì)霉、青霉、踝節(jié)菌 或裂殖酵母的葡糖淀粉酶。在一些實施方案中,親本葡糖淀粉酶包含SEQ ID N0s:2,3,4, 5,6,7,8,或9的序列。本發(fā)明的其他方面包括編碼本發(fā)明包含的葡糖淀粉酶變體的多核苷酸和包含所 述多核苷酸的宿主細胞。本發(fā)明的其他方面包括包含本發(fā)明包含的葡糖淀粉酶變體的酶組合物。
圖1顯示了具有632個氨基酸(SEQ ID NO 1)的里氏木霉葡糖淀粉酶(TrGA)。信 號肽加下劃線,以氨基酸殘基SVDDFI (SEQ ID NO 12)開始,并具有453個氨基酸殘基的催 化區(qū)(SEQ ID NO 3)以粗體顯示;接頭區(qū)域以斜體顯示,淀粉結(jié)合區(qū)(SBD)以斜體顯示并加 下劃線。包括催化區(qū)(SEQ ID N0:3),接頭區(qū)(SEQ ID NO 10)和淀粉結(jié)合區(qū)(SEQ IDNO 11)的成熟蛋白由SEQ ID N0:2表示。關(guān)于TrGA葡糖淀粉酶分子的SBD編號,本公開中參 照a)成熟TrGA的SEQ ID NO 2中的位置491到599和/或SEQ ID NO 11中的位置1到109,其代表成熟TrGA的分離的SBD序列。關(guān)于TrGA分子的催化區(qū)編號,參考SEQ ID NO 2 禾口 SEQ IDNO :3ο圖IB顯示了編碼TrGA的cDNA(SEQ ID NO 4)。圖IC顯示了 TrGA前體和成熟蛋 白結(jié)構(gòu)域。圖 2 顯示了包括 TrGA 的 cDNA(SEQ ID NO 4)的目的質(zhì)粒 pDONR-TrGA。圖 3 顯示了質(zhì)粒 pTTT-Dest。圖4顯示了最終的表達載體pTTT-TrGA。圖5A-5B顯示了親本葡糖淀粉酶催化區(qū)的比對比較,所含葡糖淀粉酶包括來源于 泡盛曲霉(Aspergillus awamori) (AaGA) (SEQ ID NO 5);黑曲霉(Aspergillus niger) (AnGA) (SEQ ID NO 6);米曲霉(Aspergillusoryzae) (AoGA) (SEQ ID NO 7);里氏木霉 (Trichoderma reesei) (TrGA) (SEQ ID NO 3);灰腐質(zhì)霉(Humicola grisea) (HgGA) (SEQ ID NO 8)和Hypocrea vinosa(HvGA) (SEQ ID NO 9)的葡糖淀粉酶。相同的氨基酸通過星 號(* )指出。圖5C顯示了踝節(jié)菌葡糖淀粉酶(TeGA)成熟蛋白序列(SEQ IDNO 384)。圖5D-5E圖解了比對,其比較了親本葡糖淀粉酶的淀粉結(jié)合區(qū)(SBD),包括里氏木 霉(SEQ ID N0:11),灰腐質(zhì)霉(HgGA) (SEQ ID NO :385),疏棉狀嗜熱絲孢菌(Thermomyces lanuginosus) (ThGA) (SEQ ID NO :386),埃默森踝節(jié)菌(Talaromyces emersonii) (TeGA) (SEQ ID N0:387),黑曲霉(AnGA) (SEQ ID NO 388);和泡盛曲霉(AaGA) (SEQ ID NO 389) 的親本葡糖淀粉酶。圖6是從側(cè)面觀察的木霉菌葡糖淀粉酶(黑色)(SEQ ID NO 2)和泡盛曲霉葡糖 淀粉酶(灰色)三維結(jié)構(gòu)的比較。根據(jù)活性中心測定側(cè)面。例如,在圖6-8中活性中心入 口定義為該分子的“頂部”。圖7是從頂部觀察木霉菌葡糖淀粉酶(黑色)和泡盛曲霉葡糖淀粉酶(灰色)三 維結(jié)構(gòu)的比較?;钚灾行娜肟谠谠摲肿拥摹绊敳俊薄D8是從側(cè)面觀察的TrGA(黑色)和黑曲霉GA(灰色)的三維結(jié)構(gòu)的比對,顯示 了結(jié)合位點1和2。圖9是阿卡波糖與圖6中所示TrGA晶體結(jié)構(gòu)的結(jié)合模型。發(fā)明詳述定義除非另有定義,本文使用的所有技術(shù)和科學術(shù)語具有與本發(fā)明所屬技術(shù)領(lǐng)域的 普通技術(shù)人員通常理解相同的含義。Singleton等,DICTI0NARY0F MICROBIOLOGY AND MOLECULAR BIOLOGY,2D ED. ,JohnWiley 和 Sons,New York(1994),和 Hale & Markham,The HARPERCOLLINS DICTIONARY OF BIOLOGY,Harper Perennial,N. Y. (1991)為技術(shù)人員提供 本文應(yīng)用的很多術(shù)語的通常含義。但為了清楚和便于參考,仍在下面定義某些術(shù)語。本文所使用的術(shù)語“葡糖淀粉酶(EC3. 2.1.3) ”是指催化從淀粉和相關(guān)寡糖和多糖 的非還原性末端釋放D-葡萄糖的酶。術(shù)語“親本”或“親本序列”指自然或天然發(fā)生的序列或者與TrGA(SEQ ID NOs 1 和/或2)有序列和/或結(jié)構(gòu)同一性的參考序列。術(shù)語“TrGA”指的是具有SEQ ID NO 2中顯示的成熟蛋白序列的親本里氏木霉葡糖淀粉酶序列,其包括具有SEQ ID NO :3中顯示序列的催化區(qū)。W02006/060062和2006年 5月4日公開的美國專利號2006/0094080中描述了 TrGA的分離,克隆和表達,其并入本文 做為參考。TrGA也被認為是親本葡糖淀粉酶序列。在一些實施方案中,親本序列指的是做 為蛋白質(zhì)工程的起點的TrGA。短語“蛋白質(zhì)或多肽的成熟形式”指的是蛋白質(zhì)或多肽的最終功能形式。舉例來 說,TrGA成熟形式包括催化區(qū),接頭區(qū)和淀粉結(jié)合區(qū),具有SEQ ID NO 2的氨基酸序列。術(shù)語“木霉菌葡糖淀粉酶同源物”指的是具有與TrGA序列(SEQ IDNO 2)至少50% 序列同一性、至少60%序列同一性、至少70%序列同一性、至少80%氨基酸序列同一性的 親本葡糖淀粉酶,其中該葡糖淀粉酶保持了葡糖淀粉酶的功能性特征。本文中使用的“同源序列,,意思是為了比較進行最佳序列比對時,與一種核酸序 列或多肽序列具有至少100%,至少99%,至少98%,至少97%,至少96%,至少95%,至 少94%,至少93%,至少92%,至少91%,至少90%,至少88%,至少85%,至少80%,至少 75%,至少70%,至少65%,至少60%,至少55%,至少50%或至少45%序列同一性的核 酸或多肽序列,其中候選核酸序列或多肽序列的功能與和所述候選同源序列相比較的核酸 序列或多肽序列基本相同。在一些實施方案,同源序列具有85%和100%之間的序列同一 性,而在其它的實施方案中具有90%和100%之間的序列同一性,在其它的實施方案中,具 有95%和100%的序列同一性。在一些實施方案中,候選同源序列(或參照序列)或親本 與TrGA核酸序列或成熟蛋白序列比較。序列同一性可以經(jīng)由親本或同源序列的全長測定。本文中使用的術(shù)語“葡糖淀粉酶變體”,"SBD變體”和“TrGA變體”用于與親本或 參照葡糖淀粉酶序列相似的葡糖淀粉酶(例如,TrGA或木霉菌葡糖淀粉酶同源物),但在其 氨基酸序列中具有使SBD在序列上不同于親本葡糖淀粉酶的至少一個取代,缺失或插入。本文中使用的術(shù)語“催化區(qū)”指的是多肽的結(jié)構(gòu)區(qū),其包含底物水解的活性位點。術(shù)語“接頭”指的是通常具有3到40個之間氨基酸殘基的短氨基酸序列,其共價 連接包含淀粉結(jié)合區(qū)的氨基酸序列和包含催化區(qū)的氨基酸序列。術(shù)語“淀粉結(jié)合區(qū)(SBD),,指的是優(yōu)選結(jié)合于淀粉底物的氨基酸序列。本文中使用的術(shù)語“突變序列,,和“突變基因”可互換使用,指的是一種多核苷酸 序列,其具有發(fā)生于宿主細胞親本序列中的至少一個密碼子內(nèi)的改變。突變序列的表達產(chǎn) 物為相對于親本具有改變的氨基酸序列的變體蛋白。所述表達產(chǎn)物可以具有改變的功能容 量(例如,增強的酶活性)。在多肽背景下,本文應(yīng)用的術(shù)語“性質(zhì)”或其語法上的等同對應(yīng)詞指的是能夠被選 擇或檢測的多肽的任何特點或?qū)傩浴_@些性質(zhì)包括,但不限于氧化穩(wěn)定性,底物特異性,催 化活性,熱穩(wěn)定性,PH活性曲線,對蛋白降解的抗性,KM, Kcat, Kcat/Km比率,蛋白折疊,結(jié)合底 物的能力和分泌能力。在核酸背景下,本文應(yīng)用的術(shù)語“性質(zhì)”或其語法上的等同對應(yīng)詞指的是能夠被選 擇或檢測的核酸的任何特點或?qū)傩浴_@些性質(zhì)包括,但不限于,影響基因轉(zhuǎn)錄的性質(zhì)(例 如,啟動子強度和啟動子識別),影響RNA加工的性質(zhì)(例如,RNA剪接和RNA穩(wěn)定性),影 響翻譯的性質(zhì)(例如,調(diào)控,結(jié)合mRNA到核糖體蛋白)。術(shù)語“比活性”定義為每mg活性葡糖淀粉酶蛋白質(zhì)的活性。使用如本文所述的乙 醇測定法測定活性。被鑒定的與親本TrGA PI相比具有性能指數(shù)(PI) > 1. 0的變體被認為具有增加的比活性。從親本(WT)與變體葡糖淀粉酶的比活性(活性/mg酶)計算PI。 它是“變體比活性/WT比活性”的商。術(shù)語“熱穩(wěn)定的”和“耐熱的”指的是在淀粉底物水解過程中普通的條件下,本發(fā) 明的葡糖淀粉酶變體在給定的時段暴露于確認的溫度后,例如暴露于改變的溫度后,保持 特定量的酶活性。在性質(zhì)例如熱穩(wěn)定性的背景下,術(shù)語“增強的穩(wěn)定性”指的是比較于另一個參照(例如,親本)葡糖淀粉酶,隨時間推移維持的更高的淀粉水解活性。在性質(zhì)例如熱穩(wěn)定性的背景下,術(shù)語“降低的穩(wěn)定性”指的是比較于其他葡糖淀粉 酶、變體和/或野生型葡糖淀粉酶,隨時間推移維持的更低的淀粉水解活性。術(shù)語“活性”和“生物活性”指的是與某具體蛋白相關(guān)的生物活性。由此可見,給 定蛋白的生物活性指的是由本領(lǐng)域技術(shù)人員通常歸因于該蛋白的任何生物活性。例如,與 葡糖淀粉酶相關(guān)的酶活性是水解的,于是活性葡糖淀粉酶具有水解活性。術(shù)語“多核苷酸”和“核酸”,在本文中互換使用,指的是任何長度核苷酸的聚合形 式,或者核糖核苷酸或者脫氧核糖核苷酸。這些術(shù)語包括,但不限于,單_,雙_,或三-鏈 DNA,基因組DNA,cDNA, RNA, DNA-RNA雜合物,或包含嘌呤和嘧啶堿基的聚合物,或其他天然 的,化學,生物化學修飾的,非天然的或者衍化的核苷酸堿基。本文中使用的術(shù)語“DNA構(gòu)建體” “轉(zhuǎn)化DNA”和“表達載體”互換使用,指的是用 于引入序列到宿主細胞或生物的DNA。所述DNA可以通過PCR或本領(lǐng)域技術(shù)人員已知的任 何其它合適的技術(shù)在體外產(chǎn)生。DNA構(gòu)建體,轉(zhuǎn)化DNA或重組表達盒可以被摻入到質(zhì)粒,染 色體,線粒體DNA,質(zhì)體DNA,病毒或核酸片段。通常地,表達載體的重組表達盒部分,DNA構(gòu) 建體或轉(zhuǎn)化DNA包括,除其它序列外,被轉(zhuǎn)錄的核酸序列和啟動子。在實施方案中,表達載 體具有在宿主細胞中摻入和表達異源DNA片段的能力。本文中使用的術(shù)語“載體”指的是設(shè)計用于引入核酸到一種或多種細胞類型的多 核苷酸構(gòu)建體。載體包括克隆載體,表達載體,穿梭載體,質(zhì)粒,表達盒等等。在引入核酸序列到細胞內(nèi)的背景下,本文使用的術(shù)語“引入”指的是適合轉(zhuǎn)移核酸 序列到細胞內(nèi)的任何方法。這些引入方法方法包括但不限于原生質(zhì)體融合,轉(zhuǎn)染,轉(zhuǎn)化,接 合,和轉(zhuǎn)導(dǎo)。本文中使用的術(shù)語“轉(zhuǎn)化的”和“穩(wěn)定轉(zhuǎn)化的”指的是細胞,其具有整合入其基因 組的非天然(異源的)多核苷酸序列或做為維持至少兩代的游離質(zhì)粒。本文中使用的術(shù)語“選擇標記”和“選擇性標記”指的是能夠在宿主細胞內(nèi)表達的 核酸(例如,基因),其允許容易地選擇那些包含載體的宿主。通常,選擇標記是賦予宿主細 胞抗生素抗性或代謝優(yōu)勢的基因,以在轉(zhuǎn)化過程中允許包含外源DNA的細胞與未接受任何 外源序列的細胞區(qū)分開來。本文中使用的術(shù)語“啟動子”指的是具有指導(dǎo)下游基因轉(zhuǎn)錄作用的核酸序列。啟 動子,和其他轉(zhuǎn)錄和翻譯調(diào)節(jié)核酸序列(也稱為“控制序列”)一起對于表達給定基因是必 須的。通常,轉(zhuǎn)錄和翻譯調(diào)節(jié)序列包括,但不限于啟動子序列,核糖體結(jié)合位點,轉(zhuǎn)錄起始和 終止序列,翻譯起始和終止序列,和增強子或激活子序列。當其置于與另外一個核酸序列的功能關(guān)系中時,核酸被“有效連接”。例如,如果 編碼分泌前導(dǎo)序列(即,信號肽)的DNA表達為參與多肽分泌的前導(dǎo)蛋白,那么編碼分泌前導(dǎo)序列(即,信號肽)的DNA有效地連接于多肽的DNA。通常,“有效連接”意思是被連接的 DNA序列是相鄰的,并且至于分泌前導(dǎo)序列,是相鄰的并且在閱讀相內(nèi)。本文中使用的術(shù)語“基因”指的是多核苷酸(例如,DNA片段),其編碼多肽,并包 括編碼區(qū)之前和之后的區(qū)域以及單個編碼區(qū)段(外顯子)之間的間插序列(內(nèi)含子)。本文中使用的“同源基因”指的是來自不同,但通常相關(guān)的物種的一對基因,其相 互對應(yīng)并且彼此相同或非常近似。該術(shù)語包括由物種形成(即新物種發(fā)展)分離的基因 (例如,直向同源基因),以及已經(jīng)由基因復(fù)制分離的基因(例如,旁系同源基因)。本文中使用的“直向同源物”和“直向同源基因”指的是通過物種形成從共同的祖 先基因(S卩,同源基因)進化而來的不同物種中的基因。通常,直向同源物在進化過程中保 持相同的功能。直向同源物的鑒定在新近測序的基因組中可靠預(yù)測基因功能中得到應(yīng)用。本文中使用的“旁系同源物”和“旁系同源基因”指的是基因組內(nèi)通過復(fù)制相關(guān)的 基因。盡管直向同源物在進化過程中保持相同的功能,但是旁系同源物進化新功能,盡管一 些功能通常與最初的基因相關(guān)。旁系同源基因的實例包括,但不限于編碼胰蛋白酶,胰凝乳 蛋白酶,彈性蛋白酶和凝血酶的基因,其都是絲氨酸蛋白酶并在同一物種內(nèi)一起發(fā)生。
本文中使用的術(shù)語“同源性”指的是序列相似性或同一性,優(yōu)選同一性。該同源 性使用本領(lǐng)域已知的標準技術(shù)確定(參見,例如,Smith andffaterman, Adv. App 1. Math.,2 482 [1981] ;Needleman and Wunsch, J. Mol. Biol. ,48 443[1970] ;Pearson and Lipman, Proc. Natl. Acad. Sci. USA85 2444 [1988];;程序,如 Wisconsin Genetics Software Package (GeneticsComputer Group, Madison, WI)中的 GAP,BESTFIT,F(xiàn)ASTA,和 TFASTA ;禾口 Devereux et al. , Nucl. Acid Res.,12 :387_395 [1984])。“核酸序列同一性百分數(shù)(% ) ”或“氨基酸序列同一性百分數(shù)(% ) ”被定義為候 選序列中與起始序列(如,TrGA)的核苷酸殘基或氨基酸殘基相同的核苷酸殘基或氨基酸 殘基的百分比。同源序列由已知的序列比對方法確定。通常使用的比對方法是由Altschul等 (Altschul 等,(1990) J. Mol. Biol.,215 403-410 ;禾口 Karlin 等,(1993) Proc. Natl. Acad. Sci. USA 90 5873-5787)描述的BLAST。一個尤其有用的BLAST程序是WU-BLAST-2程序(參 見,Altschul 等,(1996)Meth. Enzymol.,266 460-480)。WU-BLAST-2 使用幾個檢索參數(shù), 其大多數(shù)被設(shè)定為默認值??烧{(diào)整的參數(shù)設(shè)定為下列值,重疊間隔=1,重疊部分=0. 125, 字段閾值(T) = 11。HSPS和HSP S2參數(shù)是動態(tài)值并通過程序本身建立,其依賴于具體序 列的組成和目的序列被檢索的具體數(shù)據(jù)庫的組成。但是,這些值可以被調(diào)整以增加靈敏性。 氨基酸序列同一性值由匹配的相同殘基的數(shù)目除以比對區(qū)內(nèi)“更長”序列的殘基總數(shù)來 確定?!案L”序列是在比對區(qū)中具有大多數(shù)實際殘基的序列(忽略由WU-Blast-2為最大 化比對得分而引入的空位)。其它的方法也應(yīng)用于比對序列。一個有用算法的例子是PILEUP。PILEUP使用漸進 的逐對比對從一組相關(guān)序列產(chǎn)生多個序列比對。PILEUP使用Feng和Doolittle的漸進式 比對方法的簡化形式(Feng and Doolittle,J. Mol. Evol. ,35 =351-360 [1987]) 該方法與 Higgins 和 Sharp 描述的方法相似(Higgins and Sharp, CABIOS 5 151-153 [1989])。有用 的PILEUP參數(shù)包括默認的空位權(quán)重3. 00,默認的空位長度權(quán)重0. 10和加權(quán)的末端空位。術(shù)語“最優(yōu)比對”指的是提供最高同一性百分率得分的比對?!暗韧恢谩敝傅氖莾蓚€序列之間的最優(yōu)比對。例如利用圖5D和5E,TrGA(SEQID NO 2)中491位是C491 ;黑 曲霉的等同位置是C509位;泡盛曲霉的等同位置是Q538位。對于三維序列的示例性比對 參見圖8。本文中使用的術(shù)語“雜交”指的是如本領(lǐng)域所知,核酸鏈與互補鏈通過堿基配對結(jié)合的過程。如果在中等到高嚴格度雜交和洗滌條件下,兩個序列互相特異地雜交,則認為核 酸序列對于參考序列是“選擇性雜交的”。雜交條件是以核酸結(jié)合復(fù)合體或探針的解鏈溫度 (Tm)為基礎(chǔ)的。例如,“最大嚴格性”通常發(fā)生在約Tm-5°C (低于探針Tm 5°C );“高嚴格 性”在低于Tm約5-10°C ;“中等嚴格性”在低于探針Tm約10_20°C ;“低嚴格性”在低于Tm 約20-25°C。功能上來說,最大嚴格性條件可以用于鑒定與雜交探針具有嚴格同一性或接近 嚴格同一性的序列;而中等或低嚴格性條件可以用于鑒定或檢測多核苷酸序列同源物。中等和高嚴格性雜交條件是本領(lǐng)域公知的。高嚴格性條件的一個例子包括在約 42°C,在 50% 甲酰胺,5XSSC,5XDenhardt,s 液,0. 5% SDS 和 100 μ g/ml 變性載體 DNA 中雜 交,之后在室溫下,2XSSC和0. 5% SDS中洗滌兩次,并在42°C,0. IXSSC和0. 5% SDS中洗滌 另外兩次。中等嚴格性條件的一個例子包括37°C,在包含20%甲酰胺,5XSSC(150mM NaCl, 15mM檸檬酸三鈉),50mM磷酸鈉(ρΗ7· 6),5XDenhardt,s液,10%硫酸葡聚糖和20mg/ml變 性的剪切鮭精DNA的溶液中溫育,之后在約37-50°C,IXSSC中洗滌濾膜。本領(lǐng)域技術(shù)人員 知曉如何調(diào)整溫度,離子強度等,其對于適應(yīng)例如探針長度等等的因素是必須的。本文中使用的“重組”包括涉及的細胞或載體,其通過引入異源的或同源的核酸序 列被修飾或所述細胞來源于此種修飾的細胞。這樣,例如,作為人類有意干預(yù)的結(jié)果,重組 細胞表達天然(非重組)形式細胞內(nèi)未發(fā)現(xiàn)相同形式的基因,或表達天然基因,其否則異常 表達,低表達或根本不表達。在本發(fā)明的一些實施方案中,突變的DNA序列通過在至少一個密碼子中位點飽和 誘變產(chǎn)生。在其它的實施方案中,位點飽和誘變實施于兩個或更多的密碼子。在另一實施 方案中,突變的DNA序列具有與親本序列超過50 %,超過55 %,超過60%,超過65%,超過 70%,超過75%,超過80%,超過85%,超過90%,超過95%,超過98%或超過99%的同源 性。在備選實施方案中,突變DNA使用任何已知的誘變方法如,舉例來說,輻射,亞硝基胍等 等在體內(nèi)產(chǎn)生。希望DNA序列于是被分離和在本文提供的方法中使用。本文中使用的“異源蛋白”指的是非宿主細胞內(nèi)自然發(fā)生的蛋白質(zhì)或多肽。本文中使用的“同源蛋白”指的是細胞內(nèi)天然或自然發(fā)生的蛋白質(zhì)或多肽,并包括 由重組DNA技術(shù)或者細胞內(nèi)天然過表達的天然蛋白質(zhì)。如果酶在細胞內(nèi)以比其在相應(yīng)野生型細胞內(nèi)表達的水平更高的水平表達,酶即為 在宿主細胞內(nèi)“過表達”。術(shù)語“蛋白質(zhì)”和“多肽”在本文中可互換使用。在本公開和權(quán)利要求中,使用用 于氨基酸殘基的常規(guī)單字母和三字母代碼。氨基酸三字母代碼定義與IUPAC-IUB生物化學 命名聯(lián)合委員會(JCBN) —致。也可以理解的是,由于基因密碼的簡并性,多肽可以由不止 一個核苷酸序列編碼。通過下面的命名法描述本發(fā)明的變體[原始氨基酸殘基/位置/取代的氨基酸 殘基]。例如在76位用亮氨酸取代精氨酸被表示為R76L。當多于一個氨基酸在給定位置被取代,該取代被表示為1)Q172C, Q172D或Q172R ;2)Q172C, D,R或c)Q172C/D/R??梢岳?解的是,當本文鑒定的適合取代的位置沒有推薦的特定氨基酸,那么任何氨基酸殘基可以 取代該位置上存在的氨基酸殘基。與其它葡糖淀粉酶相比,變體葡糖淀粉酶包含缺失時,該 缺失以標示。例如,位置R76的缺失被表示為R76 *。兩個或更多個連續(xù)氨基酸的缺 失被標示為,例如(76-78) *?!扒靶蛄小笔切盘栃蛄泻统墒斓鞍字g對于蛋白質(zhì)分泌必需的氨基酸序列。切割前 序列將產(chǎn)生成熟有活性的蛋白質(zhì)。術(shù)語“信號序列”或“信號肽”指的是可以參與成熟或前體形式蛋白質(zhì)分泌的任何 核苷酸和/或氨基酸序列。信號序列的該定義是功能性定義,意味著包括由所述蛋白基因 的N-末端部分編碼的所有那些氨基酸序列,其參與蛋白分泌的完成。其經(jīng)常,但不總是,結(jié) 合于蛋白質(zhì)的N-末端部分或前體蛋白的N-末端部分。信號序列可以是內(nèi)源的或外源的。 信號序列可以通常情況下結(jié)合于所述蛋白質(zhì)(例如,葡糖淀粉酶)或可以來自編碼另一分 泌蛋白的基因。術(shù)語蛋白質(zhì)或肽的“前體”形式指的是具有有效連接于該蛋白質(zhì)的氨基或羰基末 端的前序列的成熟形式的蛋白質(zhì)。前體也可以具有有效連接于前序列氨基末端的“信號” 序列。前體也可以具有參與翻譯后活動(例如,從中切割以產(chǎn)生成熟形式蛋白質(zhì)或肽的多 肽)的另外的多肽?!八拗骶辍被颉八拗骷毎敝傅氖前鶕?jù)本發(fā)明DNA的表達載體的適宜宿主。術(shù)語“來自”和“獲自,,不僅指由討論中的生物株系產(chǎn)生或可產(chǎn)生的葡糖淀粉酶, 也指由分離自如此株系的DNA序列編碼的和在包含如此DNA序列的宿主生物中產(chǎn)生的葡糖 淀粉酶。此外,該術(shù)語指由合成的和/或cDNA來源的DNA序列編碼的并且具有討論中的葡 糖淀粉酶確認特征的葡糖淀粉酶。該定義范圍內(nèi)的“衍生物”通常保持野生型,天然的或親本形式中觀察到的特征性 水解活性到這樣的程度,其使該衍生物可用于與野生型,天然的或親本形式相似的目的。葡 糖淀粉酶功能性的衍生物包含自然發(fā)生的,合成地或重組產(chǎn)生的肽或肽片段,其具有本發(fā) 明的葡糖淀粉酶的一般特征。術(shù)語“分離的”或“純化的”指的是從其起始環(huán)境中被移開的物質(zhì)(例如自然環(huán) 境,如果其是自然發(fā)生地)。在一些實施方案中,如通過SDS-PAGE確定,分離的蛋白質(zhì)是超 過10%純的,優(yōu)選超過20%純的,和更優(yōu)選超過30%純的。本發(fā)明另外的方面包括如通過 SDS-PAGE確定的高度純化形式的蛋白質(zhì)(即超過40 %純的,超過60 %純的,超過80 %純 的,超過90 %純的,超過95 %純的,超過97 %純的,和甚至超過99 %純的)。本文中使用的術(shù)語“組合誘變”指的是產(chǎn)生起始序列的變體文庫的方法。在這些 文庫內(nèi),變體包含選自預(yù)先確定的一組突變的一個或幾個突變。除此之外,方法提供了引入 隨機突變的手段,所述隨機突變不是預(yù)先確定的一組突變的成員。在一些實施方案中,所述 方法包括USP6,582,914中闡述的那些方法,在此并入作為參考。在備選的實施方案中,組 合誘變方法包括商業(yè)上可獲得的試劑盒(例如,QuikChange Multisite,stratagene, San Diego, CA)。本文中使用的術(shù)語“突變體文庫”指的是細胞群體,其基因組的大多數(shù)相同,但包括一個或多個基因的不同同源物。這樣的文庫可以用于,例如,鑒定具有改良性狀的基因或操縱子。本文中使用的術(shù)語“干燥固體含量(DS或ds) ”指的是漿液的總固體基于干重的百 分比。本文中使用的術(shù)語“目標特性”指的是將被改變的起始基因的特性。并不意圖將 本發(fā)明限定于任何具體的目標特性。但是,在一些實施方案中,目標特性是基因產(chǎn)物的穩(wěn)定 性(例如,對變性,蛋白水解或其它降解因素的抗性),而在其它的實施方案中,生產(chǎn)宿主中 的產(chǎn)物的水平改變。事實上,預(yù)期起始基因的任何特性都在本發(fā)明中得到應(yīng)用。術(shù)語的其 它定義可在說明書的各處出現(xiàn)。在更詳細描述示例性的實施方案之前,應(yīng)當理解的是,本發(fā)明不限于描述的具體 實施方案,因為這些當然可以變化。也應(yīng)當理解,本文中使用的術(shù)語只是為了描述具體的實 施方案,并無限制性意圖。
當提供數(shù)值范圍時,應(yīng)當理解,除非上下文另有明確規(guī)定,該范圍的上限和下限之 間的每個中間值,直至下限單位的十分之一,也被具體地公開。任何陳述值之間的每個更小 范圍或陳述范圍內(nèi)的中間值和任何其它公開的或所述公開范圍內(nèi)的中間值都包括在本發(fā) 明內(nèi)。這些更小范圍的上限或下限可以獨立地包括于或排除于該范圍,兩個端點之一,兩個 端點都不或都包括在更小范圍的每個范圍也包括在本發(fā)明之內(nèi),其受限于公開范圍內(nèi)任何 具體排除的界限。如果公開的范圍排除一個或兩個端點,排除一個或者兩個所述被包括端 點的范圍也包括在本發(fā)明內(nèi)。盡管與本文描述的那些方法和材料相似或等同的任何方法和材料可以用于實施 或測試本發(fā)明,現(xiàn)在仍描述示例性的和優(yōu)選的方法和材料。本文提到的所有出版物并入本 文作為參考,以公開和描述與引用的出版物有關(guān)的方法和/或材料。必須指出的是,除非上下文另有明確規(guī)定,單數(shù)形式包括復(fù)數(shù)指代。這樣,例如,提 至IJ “一個基因”包括多個這樣的候選基因,提到“細胞”包括涉及一個或多個細胞和本領(lǐng)域 技術(shù)人員知曉的等同物,等等。本文中討論的出版物只有其公開早于本申請的申請日,才被提供。本文不承認本 發(fā)明無權(quán)由于是在先發(fā)明而早于此類出版物。II.實施方案親本葡糖淀粉酶在一些實施方案中,本發(fā)明提供了親本葡糖淀粉酶的葡糖淀粉酶變體。親本葡糖 淀粉酶包含催化區(qū)和淀粉結(jié)合區(qū)。親本葡糖淀粉酶可以包含與TrGA(SEQ ID NOs 2)有序 列和/或結(jié)構(gòu)同一性的序列。在一些實施方案中,親本葡糖淀粉酶包含如SEQ ID N0:l,2, 5,6,7,8,9或384中顯示的氨基酸序列。在一些實施方案中,親本葡糖淀粉酶是同源物。在 一些實施方案中,親本葡糖淀粉酶具有與SEQ ID NO :2的TrGA氨基酸序列至少50%的序列 同一性,包括至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、 至少98%、至少99%的序列同一性。在一些實施方案中,親本葡糖淀粉酶包含催化區(qū),其具有與SEQ IDNO =1,2,3,5,6, 7,8或384中顯示的一個或多個氨基酸序列有至少50%的氨基酸序列同一性的氨基酸序 列,包括與 SEQ ID NO :1,2,3,5,6,7,8 或 384 至少 60%、至少 70%、至少 80%、至少 90%、 至少95%、至少99%的序列同一性。在其它的實施方案中,親本葡糖淀粉酶具有與SEQ IDNO 3的TrGA氨基酸序列的催化區(qū)至少80%的序列同一性,至少85%的序列同一性,至少 90 %的序列同一性,至少95 %的序列同一性,至少97 %的序列同一性,至少98 %的序列同 一性和至少99%的序列同一性。在一些實施方案中,親本葡糖淀粉酶包含與SEQ ID NO :11有結(jié)構(gòu)同一性的淀粉結(jié) 合區(qū)。在一些實施方案中,親本葡糖淀粉酶包含具有與TrGA氨基酸序列SEQ ID NO :11的 SBD有至少30 %序列同一性,至少40 %序列同一性,至少50 %序列同一性,至少60 %序列同 一性,至少70 %序列同一性,至少80 %序列同一性,至少85 %序列同一性,至少90 %序列同 一性,至少95%序列同一性,至少97%序列同一性,至少98%序列同一性,和至少99%序列 同一性的氨基酸序列的淀粉結(jié)合區(qū)。親本葡糖淀粉酶可以由DNA序列編碼,該DNA序列在中等、高或嚴格條件下與編碼 包含SEQ ID NO :1,2,和/或11的氨基酸序列之一的葡糖淀粉酶的DNA雜交。在一些實施 方案中,所編碼的葡糖淀粉酶與SEQ IDNO 1,2,和/或11的氨基酸序列有至少50 %序列同 一性,至少60 %序列同一性,至少70 %序列同一性,至少80 %序列同一性,至少85 %序列同 一性,至少90%序列同一性,至少95%序列同一性,至少97%序列同一性,至少98%序列同 一性,和至少99%序列同一性。在一些實施方案中,親本葡糖淀粉酶是宿主細胞中自然或天 然發(fā)生的序列。在一些實施方案中,親本葡糖淀粉酶是天然發(fā)生的變體。在一些實施方案 中,親本葡糖淀粉酶是參考序列,其是已經(jīng)被改造的變體或者是雜合葡糖淀粉酶。葡糖淀粉酶的預(yù)測結(jié)構(gòu)和已知序列在真菌物種中是保守的(Coutinhoet al., 1994 Protein Eng.,7 :393_400 and Coutinho et al.,1994,ProteinEng.,7 :749_760)。 在一些實施方案中,親本葡糖淀粉酶是絲狀真菌葡糖淀粉酶。在一些實施方案中,親本 葡糖淀粉酶獲自木霉屬菌株(例如,里氏木霉,長梗木霉(T. longibrachiatum),嚴緊木 霉(T. strictipilis),棘胞木霉(T. asperellum),康長木霉(T. koni langbra)和哈茨 木霉(T.hazianum)),曲霉屬菌株(例如黑曲霉,構(gòu)巢曲霉,A. kawachi,泡盛曲霉和米曲 霉),踝節(jié)菌屬株(例如埃默森踝節(jié)菌(T. emersonii),濕熱踝節(jié)菌(T. thermophilus) 和T. duponti),肉座菌屬菌株(例如膠質(zhì)肉座菌(H. gelatinosa),東方肉座菌 (H. orientalis),H. vinosa,H. citrina),鐮孢屬菌株(例如,尖鐮孢(F. oxysporum),粉紅 鐮孢(F. roseum)和F. venenatum),脈孢菌屬菌株(例如粗糙脈孢菌(N. crassa))和腐質(zhì)霉 屬菌株(例如,灰腐質(zhì)霉,特異腐質(zhì)霉(H. insolens)和H. lanuginosa),青霉屬菌株(例如 點青霉或產(chǎn)黃青霉),或復(fù)膜孢酵母屬菌株(例如S. fibuligera)。在一些實施方案中,親 本葡糖淀粉酶包含如圖5A-E中圖解的那些序列的氨基酸序列。在一些實施方案中,親本葡糖淀粉酶可以是細菌葡糖淀粉酶。例如,葡糖淀粉 酶可以獲自革蘭氏陽性菌株,例如芽孢桿菌(例如,嗜堿芽孢桿菌(B. alkalophilus), 解淀粉芽孢桿菌(B. amyloliquefaciens),遲緩芽孢桿菌(B. Ientus),地衣芽孢桿 菌(B. Iicheniformis),嗜熱月旨肪芽孢桿菌(B. stearothermophilus),枯草芽孢桿菌 (B. subtilis)和蘇云金芽孢桿菌(B. thuringiensis))或鏈霉屬菌株(例如,淺青紫鏈霉菌 (S. Iividans))。在一些實施方案中,親本葡糖淀粉酶將與SEQ ID NO 2的TrGA氨基酸序列有至少 50%序列同一性,至少60%序列同一性,至少70%序列同一性,至少80%序列同一性,至少 85%序列同一性,至少88%序列同一性,至少90%序列同一性,至少93%序列同一性,至少95%序列同一性,至少96%序列同一性,至少97%序列同一性,至少98%序列同一性和至 少99%序列同一性。在一些實施方案中,親本葡糖淀粉酶也具有與SEQ ID NO :2的結(jié)構(gòu)同
一性。在另外的實施方案中,木霉屬葡糖淀粉酶同源物可以獲自木霉屬或肉座菌屬的菌 株。有些木霉葡糖淀粉酶同源物在美國專利
發(fā)明者C·弗勒門, I·尼古拉耶夫, M·謝弗斯, P·范索林恩, R·R·博特, W·埃赫勒 申請人:丹尼斯科美國公司