專利名稱::α-淀粉酶及其用途的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及具有a-淀粉酶活性的分離的多肽和編碼所述多肽的分離的多核普酸。本發(fā)明還涉及包含所述多核苷酸的核酸構(gòu)建體、載體和宿主細(xì)胞,以及用于產(chǎn)生和使用所述多肽的方法。相關(guān)領(lǐng)域描述a-淀粉酶(a-l,4-葡聚糖-4-葡聚糖水解酶,EC.3.2丄1)組成了一組酶,其催化淀粉和其他線性和具有支鏈的1,4-糖苷寡糖和多糖的水解。多年來一直為多種不同目的而使用a-淀粉酶,最重要的用途是淀粉液化、紡織品脫漿、紙和紙漿工業(yè)中淀粉的修飾,和用于釀造、乙醇生產(chǎn)和烘培。有非常多與這種在工業(yè)上非常重要的酶類有關(guān)的專利和科學(xué)文獻。從,例如,WO90/11352、WO95/10603、WO95/26397和WO96/23874,已知稱作"Termamyf樣a-淀粉酶"的很多a-淀粉酶及其變體。Termamy產(chǎn)樣a-淀粉酶是非常熱穩(wěn)定的,因此適用于在高溫進行的過程,如右旋糖生產(chǎn)工藝中的淀粉液化。另一組a-淀粉酶稱為"FungamyFM樣a-淀粉酶",其為與源自米曲霉的a-淀粉酶有關(guān)或與其同源的a-淀粉酶。Fungamyl樣a-淀粉酶具有相對低的熱穩(wěn)定性,NovozymesA/S,Denmark以商標(biāo)名FUNGAMYL出售的商業(yè)產(chǎn)品的最適溫度為約55。C,并且不適合于在高溫進行的過程。Fungamyl樣a-淀粉酶當(dāng)前用于制備糖漿,例如,用于釀造業(yè)。明顯地,有利的是提供可替換的a-淀粉酶,其具有不同于先前已知的a-淀粉酶的性質(zhì),特別是在中性或酸性pH具有高活性的a-淀粉酶。本發(fā)明的目的是提供具有a-淀粉酶活性的多肽和編碼所述多肽的多核苷3酸。發(fā)明概述本發(fā)明提供具有a-淀粉酶活性或淀粉結(jié)合活性的分離的多肽,所述多肽選自下組(a)多肽,其具有與SEQIDNO:2的氨基酸1至719有至少60%同一性的氛基酸序列;(b)多肽,其由在至少中嚴(yán)緊條件下與以下雜交的核苷酸序列編碼(i)SEQIDNO:1的核香酸1至2256,或(ii)(i)的互補《連;和(c)多肽,具有通過一個或多個氨基酸的取代(特別是保守取代)、缺失和/或插入而由SEQIDNO:2的氨基酸1至719得到的氨基酸序列。本發(fā)明還涉及分離的多核苷酸,其編碼具有a-淀粉酶活性的多肽,所述多核苦酸選自下組(a)多核苷酸,其與SEQIDNO:1的核苦酸97至2256具有至少60%同一性;和(b)多核苷酸,其在中嚴(yán)緊條件下與以下序列雜交(i)SEQIDNO:1的核苷酸97至2256,或(ii)(i)的互補《連。本發(fā)明還涉及包含所述多核苦酸的核酸構(gòu)建體、重組表達(dá)載體和重組宿主細(xì)月包。本發(fā)明還涉及用于產(chǎn)生這些具有a-淀粉酶活性的多肽的方法,其包括(a)在有益于產(chǎn)生該多肽的條件下培養(yǎng)包含核酸構(gòu)建體的重組宿主細(xì)胞,所述核酸構(gòu)建體包含編碼所述多肽的多核苷酸;和(b)回收所述多肽。本發(fā)明進一步涉及包含編碼蛋白質(zhì)的基因的核酸構(gòu)建體,其中所述基因與編碼信號肽的核普酸序列可操作地連接,該信號肽由SEQIDNO:1的核苷酸1至96組成,其中所述基因?qū)τ诰幋a所述信號序列的核苷酸序列是外源的。a-淀粉酶(具有a-淀粉酶活性的多肽)可以用在用于產(chǎn)生麥芽糊精的多種工藝中,包括將淀粉或淀粉水解物與a-淀粉酶一起溫育,從而使淀粉或淀粉水解物中的a-l,44建水解。因此,a-淀4分酶可以用于淀;盼工業(yè)、食品加工業(yè)、紡織業(yè)和洗滌劑工業(yè),例如,用于淀粉液化、液化淀粉的糖化、紡織品脫漿、紙和紙漿工業(yè)中的淀粉修飾、釀造、乙醇生產(chǎn)和烘培(baking)。a-淀粉酶可以用于產(chǎn)生酶修飾的淀粉衍生物,其中a-淀粉酶用于液化和/或糖化淀粉;用于產(chǎn)生糖漿(例如,高麥芽糖漿),其中a-淀粉酶用于淀粉液化和/或液化淀粉的糖化;用于將紡織品脫漿,其中a-淀粉酶用于處理紡織品;和用于釀造,其中在麥芽汁發(fā)酵過程中加入a-淀粉酶;用于乙醇生產(chǎn),其中a-淀粉酶用于蒸餾醪液中淀4分的液化;和用于將包含a-淀粉酶的面團烘培的工藝。a-淀粉酶可以在淀粉轉(zhuǎn)化過程使用,用于液化和/或糖化;用于在高麥芽糖漿產(chǎn)生過程中液化淀粉;用于紡織品脫漿;用于產(chǎn)生乙醇;用于釀造;和用于烘培。定義a-淀粉酶活性術(shù)語"a-淀粉酶活性"在本文中定義為1,4-葡聚糖4-葡聚糖水解酶(l,4-glucan4-glucanohydrolase)(E.C.No.3.2.U)活性,其催化淀粉和其他線性和分支的1,4-糖芬寡糖和多糖的水解。a-淀粉酶測定法如下所述。淀粉結(jié)合活性術(shù)語"淀粉結(jié)合活性"應(yīng)理解為多肽結(jié)合天然淀粉的能力。就本發(fā)明而言,淀粉結(jié)合活性應(yīng)理解為淀粉與糖結(jié)合模塊結(jié)合的結(jié)合活'l"生^口A.B.Boraston在(Boraston,A.B.等2004.Carbohydrate-bindingmodules:fme-tuningpolysacchariderecognition.Biochem.J.382:769-781)中綜述的。分離的多肽術(shù)語"分離的多肽"用于本文中指,如通過SDS-PAGE測定的,其為至少20%純,優(yōu)選至少40%純,更優(yōu)選至少60%純,甚至更優(yōu)選至少80%純,最優(yōu)選至少90%純,并且甚至最優(yōu)選至少95%純的多肽。基本上純的多肽術(shù)語"基本上純的多肽"在本文表示多肽制備物,所述多肽制備物按重量計含有至多10%,優(yōu)選至多8%,更優(yōu)選至多6%,更優(yōu)選至多5%,更優(yōu)選至多4%,更優(yōu)選至多3%,甚至更優(yōu)選至多2%,最優(yōu)選至多1%,并且甚至最優(yōu)選至多0.50/。的與其天然結(jié)合的(associated)的其它多肽材料。因此,優(yōu)選所述基本上純的多肽是按存在于制備物中的全部多肽材料的重量計至少92%純,優(yōu)選至少94%純,更優(yōu)選至少95%純,更優(yōu)選至少96%純,更優(yōu)選至少96%純,更優(yōu)選至少97%純,更優(yōu)選至少98%純,甚至更優(yōu)選至少99%純,最優(yōu)選至少99.5%純,并且甚至最4尤選100°/。純。本發(fā)明的多肽優(yōu)選是基本上純的形式。具體而言,優(yōu)選所述多肽是"基本上(essentially)純的形式",即,所述多肽制備物基本上(essentially)不含與其天然結(jié)合的其它多肽材料。這能夠通過以下方式實現(xiàn),例如,通過公知的重組方法或由經(jīng)典純化方法制備多肽。在本文中,術(shù)語"基本上純的多肽"與術(shù)語"分離的多肽"和"分離形式的多肽"同義。同一性參數(shù)"同一性"描述兩個氨基酸序列之間的相關(guān)性。就本發(fā)明而言,兩個氨基酸序列的比對通過使用來自EMBOSS軟件包(http:〃emboss.org)2.8.0版的Needle程序來確定。Needle軟件執(zhí)行Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453中所述的全局比對算法。使用的取代矩陣為BLOSUM62,缺口開放罰分為10,而缺口延伸罰分為0.5。第一和第二氨基酸序列之間的同一性程度如下計算兩個序列比對中完全匹配的數(shù)目,除以第一或第二序列其中較短者的長度。結(jié)果用百分比同一性表示。當(dāng)兩個序列在重疊的相同位置有相同的氨基酸殘基時即發(fā)生完全匹配。序列的長度是序列中氨基酸殘基的數(shù)目。就本發(fā)明而言,兩個核苷酸序列之間的同一性程度通過Wilbur-Lipman方法(Wilbur和Lipman,1983,尸raceW"^q/"」c"^few少y&/e"ceOS^80:726-730)使用LASERGENEMEGALIGNtm軟件(DNASTAR,Inc.,Madison,WI)來確定,使用同一性表和以下多重比對參數(shù)缺口罰分10和缺口長度罰分10。配對比對參數(shù)是K元組(Ktuple"3,缺口罰分=3,和窗口=20。在一個具體的實施方案中,多肽的氨基酸序列與,或?qū)?,SEQIDNO:2的氨基酸1至719的同一性百分比通過下述方式確定i)使用Needle程序比對兩個氨基酸序列,用BLOSUM62取代矩陣,缺口開放罰分為10,和缺口延伸罰分為0.5;ii)計算比對中完全匹配的數(shù)目;iii)完全匹配的數(shù)目除以兩個氨基酸序列中最短者的長度,和iv)將iii)的除法結(jié)果轉(zhuǎn)換成百分比。對,或與本發(fā)明其他序列如SEQIDNO:2的氨基酸1-719的同一性百分比以類似的方法計算。本發(fā)明的多肽具有由SEQIDNO:2的氨基酸1至719所示氨基酸序列組成的多肽的a-淀粉酶活性的至少20%,優(yōu)選至少40%,更優(yōu)選至少50%,更優(yōu)選至少60%,更優(yōu)選至少70。/。,更優(yōu)選至少80%,甚至更優(yōu)選至少90%,最優(yōu)選至少95%,并且甚至最優(yōu)選至少100%。多肽片段術(shù)語"多肽片段"在本文中定義為從SEQIDNO:2的氨基和/或羧基末端缺失一個或多個氨基酸的多肽,或其同源序列;其中所述片段具有生物活性,如a-淀粉酶活性或淀粉結(jié)合活性。等位變體(allelicvariant):術(shù)語"等位變體"在本文中表示占據(jù)相同染色體基因座的基因的任何兩種或兩種以上可選形式。等位變異通過突變天然地發(fā)生,并且可導(dǎo)致種群內(nèi)的多態(tài)性?;蛲蛔兛梢允浅聊?在編碼的多肽中無變化)或可以編碼具有改變的氨基l拼列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽?;旧霞兊亩嗪讼闼嵝g(shù)語"基本上純的多核香酸"用于本文指不含其它外來的或不期望的核苷酸的多核苷酸制備物,并且所述多核苷酸制備物處于適合于在遺傳工程改造的蛋白質(zhì)生產(chǎn)體系中使用的形式。因此,基本上純的多核苷酸按重量計含有至多10%,優(yōu)選至多8%,更優(yōu)選至多6%,更優(yōu)選至多5%,更優(yōu)選至多4%,更優(yōu)選至多3%,甚至更優(yōu)選至多2%,最優(yōu)選至多1%,并且甚至最優(yōu)選至多0.5%的與其天然結(jié)合的其它多核苷酸材料。然而,基本上純的多核芬酸可以包括天然存在的5'和3,非翻譯區(qū),例如啟動子和終止子。優(yōu)選基本上純的多核苷酸是按重量計至少90%純,優(yōu)選至少92%純,更優(yōu)選至少94%純,更優(yōu)選至少95%純,更優(yōu)選至少96%純,更優(yōu)選至少97%純,甚至更優(yōu)選至少98%純,最優(yōu)選至少99%,并且甚至最優(yōu)選至少99.5%純的。本發(fā)明所述多核苦酸優(yōu)選為基本上純的形式。具體而言,優(yōu)選本文公開的多核苷酸是"基本上(essentially)純的形式",即,所述多核苷酸制備物基本上不含與其天然結(jié)合的其它多核苷酸材料。在本文中,術(shù)語"基本上純的多核苷酸"與術(shù)語"分離的多核苷酸"和"分離形式的多核苷酸"同義。所述多核苷酸可以是基因組、cDNA、RNA、半合成、合成來源的,或它們的任何組合。核酸構(gòu)建體術(shù)語"核酸構(gòu)建體"用于本文指單鏈或雙鏈的核酸分子,所述核酸分子分離自天然存在的基因,或?qū)⑺龊怂岱肿有揎椧员緛聿淮嬖谟?nototherwiseexist)自然界中的方式含有核酸的區(qū)段。當(dāng)所述核酸構(gòu)建體含有本發(fā)明的編碼序列表達(dá)所需的調(diào)控序列時,術(shù)語核酸構(gòu)建體與術(shù)語"表達(dá)盒"同義。調(diào)控序列(controls叫uence):術(shù)語"調(diào)控序列"在本文定義為包括對編碼本發(fā)明多肽的多核苷酸表達(dá)是必需的或有利的所有組分。每種調(diào)控序列對于編碼所述多肽的核苷酸序列可以是天然的或外源的。這些調(diào)控序列包括但不限于前導(dǎo)序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉(zhuǎn)錄終止子。最少的情況,調(diào)控序列包括啟動子和轉(zhuǎn)錄和翻譯的終止信號。調(diào)控7序列可提供有用于引入特異性限制位點的接頭,所述特異性限制位點促進調(diào)控序列與編碼多肽的核苷S交序列編碼區(qū)的連接??刹僮鞯剡B接術(shù)語"可操作地連接"在本文表示這樣的構(gòu)型,其中將調(diào)控序列置于相對于多核苷酸序列的編碼序列的合適位置,使得調(diào)控序列指導(dǎo)多肽的編碼序列的表達(dá)。編碼序列當(dāng)用于本文時術(shù)語"編碼序列"的意思是直接指定其蛋白產(chǎn)物的氨基酸序列的核苷酸序列。編碼序列的邊界通常由開讀框確定,所述開讀框通常以ATG起始密碼子或可供選擇的起始密碼子例如GTG和TTG開始。編碼序列可以是DNA、cDNA或重組核苷酸序列。表達(dá)術(shù)語"表達(dá),,包括涉及多肽產(chǎn)生的任何步驟,其包括但不限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾和分泌。表達(dá)載體術(shù)語"表達(dá)載體"在本文定義為線性的或環(huán)狀的DNA分子,其包含編碼本發(fā)明多肽的多核苷酸,并且所述多核苷酸與提供用于其表達(dá)的額外核苷酸可操作地連接。宿主細(xì)胞如本文中所使用的術(shù)語"宿主細(xì)胞"包括任何細(xì)胞類型,所述細(xì)胞類型對于使用包含本發(fā)明多核苷酸的核酸構(gòu)建體的轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)等是易感的(susceptible)。修飾術(shù)語"修飾"在本文的意思是,對由SEQIDNO:2的氨基酸l至719組成的多肽的任何化學(xué)修飾,以及對編碼所述多肽的DNA的遺傳操作。所述修飾可以是一個或多個氨基酸的取代、缺失和/或插入,以及一個或多個氨基酸側(cè)鏈的置換。人工變體當(dāng)用在本文時,術(shù)語"人工變體"的意思是具有a-淀粉酶活性的多肽,所述多肽由表達(dá)修飾的SEQIDNO:1的核苷酸序列的生物體產(chǎn)生。所述修飾的核苷酸序列通過人為干預(yù)(humanintervention),通過修飾公開于SEQIDNO:1的核苷酸序列來獲得。發(fā)明詳述a-淀4分酶在第一個方面,本發(fā)明涉及具有下述氨基酸序列的分離的多肽,所述氨基酸序列與SEQIDNO:2的成熟多肽(即,氨基酸1至719)具有至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或至少97%的同一性程度,所述多肽具有a-淀粉酶活性(下文中的"同源多肽")。在優(yōu)選的方面,所述同源多肽具有的氨基酸序列與SEQIDNO:2的氨基酸1至719相差十個氨基酸,優(yōu)選相差五個氨基酸,更優(yōu)選相差四個氨基酸,甚至更優(yōu)選相差三個氨基酸,最優(yōu)選相差兩個氨基酸,并且甚至最優(yōu)選相差一個氨基酸。本發(fā)明的多肽優(yōu)選包含SEQIDNO:2的氨基酸序列或其等位變體;或其具有a-淀粉酶活性或淀粉結(jié)合活性的片段。在優(yōu)選的方面,多肽包含SEQIDNO:2的氨基酸序列。在另一個優(yōu)選方面,多肽包含SEQIDNO:2的氨基酸1至719,或其等位變體;或其具有a-淀粉酶活性的片段。在另一個優(yōu)選方面,多肽由SEQIDNO:2的氨基酸序列或其等位變體;或其具有a-淀粉酶活性的片段組成。在另一個優(yōu)選方面,多肽由SEQIDNO:2的氨基酸序列組成。在第二個方面,本發(fā)明涉及具有a-淀粉酶活性的分離的多肽,所述分離的多肽由多核苷酸編碼,所述多核苷酸在非常低嚴(yán)緊條件下,優(yōu)選低嚴(yán)緊條件下,更優(yōu)選中嚴(yán)緊條件下,更優(yōu)選中-高嚴(yán)緊條件下,甚至更優(yōu)選高嚴(yán)緊條件下,并且最優(yōu)選非常高嚴(yán)緊條件下,與以下雜交(i)SEQIDNO:1的核苷酸1至2256,(ii)(i)的亞序列,或(iii)(i)或(ii)的互補鏈(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,Mo/ecw/arC7ow/"g,」Z^0rato/7Mawwa/,第2版,ColdSpringHarbor,NewYork)。SEQIDNO:l的亞序列含有至少100個連續(xù)的核苷酸或優(yōu)選至少200個連續(xù)的核苦酸。此外,所述亞序列可編碼具有a-淀粉酶活性或淀粉結(jié)合活性的多肽片段。SEQIDNO:1的核苷酸序列或其亞序列,以及SEQIDNO:2的氨基酸序列或其片段,可用于設(shè)計核酸探針,以根據(jù)本領(lǐng)域內(nèi)公知的方法從多種生物體鑒定和克隆編碼具有a-淀粉酶活性的多肽的DNA。具體而言,根據(jù)標(biāo)準(zhǔn)的Southern印跡方法,可將這些探針用于與感興趣的屬或種的基因組或cDNA雜交,以鑒定和從其中分離相應(yīng)的基因。這些探針可明顯短于完整序列,但長度上應(yīng)為至少14,優(yōu)選至少25,更優(yōu)選至少35,并且最優(yōu)選至少70個核苷酸。然而,優(yōu)選所述核S交探針是至少100個核苷酸長度。例如,所述核酸探針長度上可以是至少200個核苷酸,優(yōu)選至少300個核苷酸,更優(yōu)選至少400個核香酸,或最優(yōu)選至少500個核苷酸。甚至可以使用更長的探針,例如,長vl是至少600個核苷酸,至少優(yōu)選至少700個核苷酸,更優(yōu)選至少800個核苷酸,或最優(yōu)選至少900個核苷酸的核酸探針。DNA和RNA探針二者均可使用。通常將探針標(biāo)記以探測相應(yīng)的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)標(biāo)記)。這些探針包含于本發(fā)明中。因而,可從由這些生物體制備的基因組DNA或cDNA文庫中篩選DNA,所述DNA與上述探針雜交并且編碼具有a-淀粉酶活性的多肽??梢酝ㄟ^瓊脂糖或聚丙烯酰胺凝膠電泳,或其它分離技術(shù)分離來自這些生物體的基因組或其它DNA??梢詫碜晕膸斓腄NA或分離的DNA轉(zhuǎn)移至硝化纖維素(nitrocellulose)或其它合適的載體材料并且固定于其上。為了鑒定與SEQIDNO:l或其亞序列同源的克隆或DNA,將所述載體材料用在Sounthern印跡中。就本發(fā)明而言,雜交表示核苷酸序列在非常低至非常高的嚴(yán)緊條件下與標(biāo)記的核酸探針雜交,所述核酸探針對應(yīng)于SEQIDNO:l所示的核苷酸序列、它的互補鏈或其亞序列。可使用X射線片(X-rayfilm)檢測在這些條件下與核酸探針雜交的分子。對于長度至少100個核苷酸的長探針,將非常低至非常高的嚴(yán)緊條件定義為在42°C,在5XSSPE、0.3%SDS、200jug/ml已剪切并且變性的鮭精DNA中,并且對于非常低和低嚴(yán)緊性為25%的曱酰胺、對于中和中-高嚴(yán)緊性為35%的曱酰胺、或?qū)τ诟吆头浅8邍?yán)緊性為50%的曱酰胺,根據(jù)標(biāo)準(zhǔn)的Southern印跡法進行預(yù)雜交和雜交最佳12至24小時。對于長度為至少100個核苷酸的長探針,使用2XSSC、0.2%SDS優(yōu)選至少在45°(3(非常低嚴(yán)緊性),更優(yōu)選至少在50。C(低嚴(yán)緊性),更優(yōu)選至少在55。C(中嚴(yán)緊性),更優(yōu)選至少在60。C(中-高嚴(yán)緊性),甚至更優(yōu)選至少在65°C(高嚴(yán)緊性),并且最優(yōu)選至少在70。C(非常高嚴(yán)緊性)將載體材料最終洗滌三次,每次15分鐘。在一個具體的實施方案中,使用0.2XSSC、0.2%SDS優(yōu)選至少在45°C(非常低嚴(yán)緊性),更優(yōu)選至少在50。C(低嚴(yán)緊性),更優(yōu)選至少在55。C(中嚴(yán)緊性),更優(yōu)選至少在60。C(中-高嚴(yán)緊性),甚至更優(yōu)選至少在65。C(高嚴(yán)緊性),并且最優(yōu)選至少在70°C(非常高嚴(yán)緊性)進行洗滌。在另一個具體的實施方案中,使用0.1XSSC、0.2%SDS優(yōu)選至少在45。C(非常低嚴(yán)緊性),更優(yōu)選至少在50。C(低嚴(yán)緊性),更優(yōu)選至少在55。C(中嚴(yán)緊性),更優(yōu)選至少在W。C(中-高嚴(yán)緊性),甚至更優(yōu)選至少在65。C(高嚴(yán)緊性),并且最優(yōu)選至少在冗。C(非常高嚴(yán)緊性)進行洗滌。對于長度大約15個核苷酸至大約70個核苷酸的短探針,將嚴(yán)緊條件定10義為在比#4居Bolton和McCarthyi十算法(1962,Pracee^wgso/AeJVo"o"a/JcWe^y0/5We"ces"&448:1390)得出的Tm低大約5。C至大約10。C,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,1xDenhardt溶液,1mM傳、石舞酸4內(nèi)(sodiumpyrophosphate),1mM石舞酸二氬4內(nèi)(sodiummonobasicphosphate),0.1mMATP和0.2mg每ml的酵母RNA中,根據(jù)標(biāo)準(zhǔn)的Southern印跡步驟進行預(yù)雜交、雜交和雜交后洗滌。對于長度大約15個核苷酸至大約70個核苷酸的短探針,將所述載體材料在6xSSC加0.1%SDS中洗滌一次15分鐘,并用6xSSC在比計算的Tm低5。C至10。C的溫度下洗滌兩次,每次15分鐘。在含鹽的雜交條件下,有效的Tm可以控制探針和結(jié)合濾膜的DNA之間用于成功雜交所需的同一性程度??梢允褂孟率龉酱_定有效的Tm,從而確定在各種嚴(yán)緊性條件下兩個DNA雜交所需的同一性程度,從而。有效的Tm=81.5+16.6(logM[Na+])+0.41(%G+C)—0.72(%曱酰胺)(參見www.ndsu.nodak.edu/instruct/mcclean/plsc731/dna/dna6.htm)SEQIDNO:1的G+C含量為約55%。對于中嚴(yán)緊性,曱酰胺為35%,并且對于5XSSPE的Na+濃度為0.75M。對這些數(shù)值應(yīng)用這一公式,得到有效Tm為76°C。另一個相關(guān)的關(guān)系是兩個DNA之間1。/。的不匹配會將Tm降低1.4°C。為了確定在42。C在中嚴(yán)緊條件下兩個DNA雜交所需的同一性程度,使用下述公式%同源性=100—[(有效Tm-雜交溫度)/1.4]對數(shù)值應(yīng)用這一公式,在42。C中嚴(yán)緊條件下兩個DNA雜交所需的同一性程度為100-[(76-42)/1.4)]=76%。在第三個方面,本發(fā)明涉及具有活性的分離的多肽,其由包含SEQIDNO:1的核苷酸97至751的多核苷酸編碼,作為唯一的基序。多肽可以提供淀粉水解的下述降解產(chǎn)物除了分子量較高的糊精之外,還有葡萄糖、麥芽糖、麥芽三糖、麥芽四糖、麥芽五糖、麥芽六糖、麥芽七糖。具體而言,可以提供淀粉水解的下述降解產(chǎn)物相似量的葡萄糖(DPl)、麥芽糖(DP2)、麥芽三糖(DP3)、麥芽四糖(DP4)、麥芽五糖(DP5)、麥芽六糖(DP6)和麥芽七糖(DP7),和大量較大的糊精(〉DP10)。多肽的分子量可以約為78kDa。可以如下所述確定淀粉分解活性。pH6.0時a-淀粉酶活性的最適溫度為約60°C,37。C時的最適pH為約6.0。多肽可以是人工變體,其具有通過取代(特別是保守取代)、缺失和/或插入一個或多個氨基酸而由SEQIDNO:2的成熟片段得到的氨基酸序列。優(yōu)選氨基酸改變對性質(zhì)是較不重要的(ofaminornature),即保守的氨基酸取代或插入,其不顯著影響蛋白質(zhì)的折疊和/或活性;小缺失,通常為l至大約30個氨基酸的小缺失;小的氨基或羧基末端延伸,如氨基末端曱硫氨酸殘基;多至大約20-25個殘基的小接頭肽;或通過改變凈電荷或其它功能來促進純化的'J、延伸(如多組氨酸區(qū)(polyhistidinetract)、抗原表位(antigenicepitope)或結(jié)合域(bindingdomain))。保守取代的實例是在以下組之內(nèi)堿性氨基酸組(精氨酸、賴氨酸和組氨酸)、酸性氨基酸組(谷氨酸和天冬氨酸)、極性氨基酸組(谷氨酰胺和天冬酰胺)、疏水性氨基酸組(亮氨酸、異亮氨酸和纈氨酸)、芳族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和曱硫氨酸)。通常不改變比活性(specificactivity)的氨基酸取代是本領(lǐng)域已知的,并且由例如H.Neurath和R丄.Hill,1979,于77ze尸rato'ra,AcademicPress,NewYork中描述。最普遍發(fā)生的交換是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、AWGly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。除了20個基本氨基酸,非基本氨基酸(如4-羥脯氨酸、6-7V-曱基賴氨酸、2-氨基異丁酸、異纈氨酸和a-曱基絲氨酸)可以取代野生型多肽的氨基酸殘基。有限數(shù)量的非保守氨基酸、不由遺傳密碼編碼的氨基酸和非天然氨基酸可以取代氨基酸殘基。"非天然氨基酸"在蛋白質(zhì)合成后已經(jīng)過修飾,和/或在它們的側(cè)鏈具有不同于基本氨基酸的化學(xué)結(jié)構(gòu)。非天然氨基酸能夠以化學(xué)方法合威,并且優(yōu)選是商業(yè)上可獲得的,包括六氫吡啶羧酸(pipecolicacid)、噻唑烷羧酸(thiazolidinecarboxylicacid)、脫氬月甫氨酸(dehydroproline)、3-和4-甲基脯氨酸,和3,3-二曱基脯氨酸??晒┻x擇的是,氨基酸改變具有這樣的性質(zhì)以使多肽的物理化學(xué)性質(zhì)改變。例如,氨基酸改變可改進多肽的熱穩(wěn)定性,改變底物特異性,改變最適pH等。能夠根據(jù)本領(lǐng)域已知的方法,例如定位誘變或丙氨酸分區(qū)誘變法(Cunningham和Wells,1989,5We"ce244:1081-1085)來鑒定親本多肽中的必需氨基酸。在后一技術(shù)中,將單一丙氨酸突變引入到分子中的每個殘基,并且測試所得突變分子的生物活性(即,a-淀粉酶活性)以鑒定對于所述分子的活性關(guān)鍵的氨基酸殘基。同樣參見Hilton等,1996,J所o/.C7zem.271:4699-4708。酶的活性部位或其它的生物相互作用也能夠通過結(jié)構(gòu)的物理分析而確定,如通過以下這些技術(shù)如核》茲共振、晶體學(xué)、電子衍射或光親和標(biāo)記,連同推定的4妻觸位點氨基酸的突變來確定。參見例如deVos等,1992,Sc/e"ce255:306-312;Smith等,1992,/Mo/.所o/.224:899-904;Wlodaver等,1992,丄e".309:59-64。必需氨基酸的同一性也能夠從與多肽的同一性分析來推斷,所述多肽與根據(jù)本發(fā)明的多肽相關(guān)。能夠使用已知的誘變、重組和/或改組(shuffling)方法,然后是有關(guān)的篩選方法,如由Reidhaar-Olson和Sauer,1988,5W騰e241:53-57;Bowie和Sauer,1989,尸rac.M^/.爿cac/.5W.86:2152-2156;WO95/17413;或WO95/22625公開的那些方法來進行并測試單個或多個氨基酸取代。能夠使用的其它方法包括易錯PCR、嗟菌體展示(例如,Lowman等,1991,所oc/^w.30:10832-10837;美國專利號5,223,409;WO92/06204)和區(qū)域定向的誘變(Derbyshire等,1986,46:145;Ner等,1988,DA^7:127)。誘變/改組方法能夠與高通量、自動化的篩選方法組合以檢測由宿主細(xì)胞表達(dá)的克隆的、誘變的多肽的活性。能夠從宿主細(xì)胞回收編碼活性多肽的誘變的DNA分子,并且使用本領(lǐng)域內(nèi)標(biāo)準(zhǔn)方法快速測序。這些方法允許快速確定感興趣的多肽中單個氨基酸殘基的重要性,并且能夠應(yīng)用于未知結(jié)構(gòu)的多肽。SEQIDNO:2的氨基酸1至719的氨基酸取代、缺失和/或插入的總數(shù)可為至多10,至多9,至多8,至多7,至多6,至多5,至多4,至多3,至多2,或者至多1。a-淀粉酶的降解譜由淀粉降解產(chǎn)生的降解產(chǎn)物依賴于降解使用的特定的a-淀粉酶。典型的真菌a-淀粉酶如米曲霉a-淀粉酶產(chǎn)生麥芽糖(DP2)、麥芽三糖(DP3)和麥芽四糖(DP4)作為主要降解產(chǎn)物,剩余大部分較大的糊精(〉DP10)。芽孢桿菌屬a-淀粉酶如嗜熱脂肪芽孢桿菌a-淀粉酶和地衣芽孢桿菌a-淀粉酶,通常產(chǎn)生葡萄糖(DP1)、麥芽糖(DP2)、麥芽三糖(DP3)、麥芽五糖(DP5)或麥芽六糖(DP6)作為主要降解產(chǎn)物,僅剩余小部分的較大糊精(〉DP10)。根據(jù)本發(fā)明的a-淀粉酶產(chǎn)生大約相似量的葡萄糖(DPl)、麥芽糖(DP2)、麥芽三糖(DP3)、麥芽四糖(DP4)、麥芽五糖(DP5)、麥芽六糖(DP6)和麥芽七糖(DP7),使用RI檢測估計,剩余大量較大的糊精(〉DP10)。因此,在另一個方面,本發(fā)明涉及a-淀粉酶,其降解淀粉提供相似量的葡萄糖(DP1)、麥芽糖(DP2)、麥芽三糖(DP3)、麥芽四糖(DP4)、麥芽五糖(DP5)、麥芽六糖(DP6)和麥芽七糖(DP7),并剩余大量較大的糊精(〉DP10)。具有(X-淀粉酶活性的多肽的來源本發(fā)明的多肽可以獲得自任何屬的生物體。優(yōu)選本發(fā)明的多肽獲得自微生物。就本發(fā)明而言,用于本文與給定的來源有關(guān)的術(shù)語"獲得自",意思是由核苷酸序列編碼的多肽通過已插入或天然存在本發(fā)明的核苷酸序列的生物體產(chǎn)生。在優(yōu)選的方面,獲得自給定來源的多肽是胞外分泌的。多核香酸本發(fā)明還涉及分離的多核苷酸,其具有編碼本發(fā)明的多肽的核苷酸序列。在優(yōu)選的方面,核苷酸序列示于SEQIDNO:1。在另一個優(yōu)選方面,核苷酸序列是SEQIDNO:1的成熟多肽編碼區(qū)。本發(fā)明還涵蓋編碼下述多肽的核苷酸序列,所述多肽具有SEQIDNO:2的氨基酸序列或其成熟多肽;由于遺傳密碼的簡并性,所述核苷酸序列不同于SEQIDNO:1。本發(fā)明還涉及SEQIDNO:1的亞序列,所述亞序列編碼具有a-淀粉酶活性的SEQIDNO:2的片段。本發(fā)明還涉及突變多核苷酸,所述突變多核苷酸在SEQIDNO:l的成熟多肽編碼序列中包含至少一個突變,其中所述突變核苷酸序列編碼由SEQIDNO:2的氨基酸1至719組成的多肽。用于分離或克隆編碼多肽的多核苷酸的技術(shù)是本領(lǐng)域內(nèi)已知的,并包括從基因組DNA分離,從cDNA制備,或其組合??赏ㄟ^例如使用熟知的聚合酶鏈?zhǔn)椒磻?yīng)(PCR)或表達(dá)文庫的抗體篩選以檢測具有共有結(jié)構(gòu)特征的克隆DNA片段,從而實現(xiàn)從這種基因組DNA克隆本發(fā)明的多核苷酸。參見,例如,Innis等,1990,PC7:爿GWtietoMef/c^AcademicPress,NewYork??梢允褂闷渌怂釘U增方法,如連接酶鏈?zhǔn)椒磻?yīng)(LCR)、連接活化轉(zhuǎn)錄(ligatedactivatedtranscription;LAT)和基于核苷酸序列的擴增(NASBA)。14在本發(fā)明中,使用元基因組(metagenomic)技術(shù)分離具有SEQIDNO:1中所示的核苷酸序列的多核香酸,即從土壤樣本純化多核苷酸,由純化的多核苷酸產(chǎn)生多核苷酸庫并篩選庫以提供包含SEQIDNO:2中所示的核苷酸序列的多核苷酸。因此不知道包含SEQIDNO:1中所示的核苷酸序列的多核苷酸源自哪種生物體。本發(fā)明還涉及具有編碼下述多肽的核苷酸序列的多核苷酸,所述多肽與SEQIDNO:1的成熟多肽編碼序列(即,核香酸97至2256)具有至少60%,優(yōu)選至少65%,更優(yōu)選至少70%,更優(yōu)選至少75%,更優(yōu)選至少80%,更優(yōu)選至少85%,更優(yōu)選至少90%,甚至更優(yōu)選至少95%,并且最優(yōu)選至少97%同一性的同一性程度,所述多核苦酸編碼活性多肽。修飾編碼本發(fā)明多肽的核苷酸序列對于合成與所述多肽基本上相似的多肽可能是必需的。術(shù)語與所述多肽"基本上相似"指多肽的非天然存在的形式。這些多肽可能以一些工程改造的方式而不同于從其天然來源分離的多肽,例如,比活性、熱穩(wěn)定性、最適pH等方面不同的人工變體??梢栽谧鳛镾EQII)NO:l的多肽編碼區(qū)存在的核苷S吏序列,例如其亞序列的基礎(chǔ)上,和/或通過引入如下核苷酸取代來構(gòu)建變體序列所述取代不產(chǎn)生由核苦酸序列編碼的多肽的另外的氨基酸序列,但是其符合意欲產(chǎn)生酶的宿主生物體的密碼子選擇;或者所述取代可產(chǎn)生不同的氨基酸序列。關(guān)于核苦酸取代的概述,參見,例^口,Ford等,1991,尸rafe/w£!xp*as^/ow尸wnycafz'ow2:95-107。對于本領(lǐng)域技術(shù)人員顯而易見的是,這些取代能夠在對于分子功能重要的區(qū)域之外進行,并且仍然產(chǎn)生活性多肽。對于由本發(fā)明的分離的多核苷酸編碼的多肽活性是關(guān)鍵的并且因此優(yōu)選不進行取代的氨基酸殘基,可以根據(jù)本領(lǐng)域公知的方法,例如定位誘變或丙氨酸分區(qū)誘變法(參見,例如,Cunningham和Wells,1989,5We"ce244:1081-1085)來鑒定。在后一的技術(shù)中,將突變引入到分子中的每個正電殘基處,并且測試所得突變分子的a-淀粉酶活性,以鑒定對于所述分子的活性關(guān)鍵的氨基酸殘基。底物-酶相互作用的位點也能夠通過分析三維結(jié)構(gòu)而確定,如通過如核磁共振分析、晶體學(xué)或光親和標(biāo)記這樣的技術(shù)來確定(參見,例如,deVos等,1992,5We"ce255:306-312;Smith等,1992,JoMrwa/o/Mo/ecw/ar傷o/ogv224:899-904;Wlodaver等,1992,F五^S丄e/化ra309:59-64)。本發(fā)明還涉及編碼本發(fā)明多肽的分離的多核苷酸,所述分離的多核苷酸在非常低嚴(yán)緊條件下,優(yōu)選低嚴(yán)緊條件,更優(yōu)選中等嚴(yán)緊條件,更優(yōu)選中-高嚴(yán)緊條件,甚至更優(yōu)選高嚴(yán)緊條件,并且最優(yōu)選非常高的嚴(yán)緊條件下,與以下序列雜交(i)SEQIDNO:1的核苷酸96至2256;或(ii)(i)的互補鏈;或它們的等位變體和亞序列(Sambrook等,1989,見上文),如本文所定義的。本發(fā)明還涉及分離的多核苷酸,其通過以下方式獲得(a)在中-高、高或非常高嚴(yán)緊條件下,將DNA的群體與以下雜交(i)SEQIDNO:1的核苷酸97至2256,或(ii)(i)的互補鏈;和(b)分離雜交的多核苷酸,其編碼具有a-淀粉酶活性的多肽。元基因組技術(shù)在本說明書和權(quán)利要求中,術(shù)語元基因組意欲表示從包含不同生物體的樣本分離的多核苷酸的集合。樣本可以是任何已知或疑似包含合適生物體的樣本,并且經(jīng)常從自然環(huán)境收集。樣本可以是土壤、水、植物材料或疑似包含可能令人感興趣的多核苷酸的其他材料的樣本。當(dāng)樣本已提供有完整基因組材料時,優(yōu)選使用例如本領(lǐng)域已知的技術(shù),如在(Ausuble等1995"CurrentprotocolsinmolecularbiologyPubl:JohnWileyandsons)中所述方法從樣本提取完整的基因組DNA。獲得的基因材料代表樣本中存在的生物體。當(dāng)已經(jīng)制備了元基因組時,可使用元基因組產(chǎn)生元基因組文庫,在其中篩選特別令人感興趣的多核苷酸序列。元基因組文庫和DNA的產(chǎn)生和篩選可以使用本領(lǐng)域公知的方法進行。所理解的,已經(jīng)開發(fā)出幾種表達(dá)載體,其包括XZAP系統(tǒng),可由Stratagene得到。根據(jù)本發(fā)明,可以使用公知的a-淀粉酶篩選系統(tǒng)篩選文庫,如將文庫涂布在含淀粉的瓊脂平板上,并且通過所述克隆周圍的透明圈鑒定包含編碼a-淀粉酶的多肽的克隆。淀粉可以是著色的,便于鑒定陽性克隆周圍的透明區(qū)域,或者可以在克隆生長后將淀粉染色,所述克隆通過,例如,將涂布有文庫克隆的平板置于包含碘蒸汽的室中生長,從而淀粉將著深色,并且透明區(qū)容易可見。當(dāng)已經(jīng)鑒定了陽性克隆時,可以使用公知的DNA操作技術(shù)如(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,Mo/ecw/arC7om'"g,爿丄a6orato^yAfo廂a/,第2版,ColdSpringHarbor,NewYork)中所述,進一步表征和操作分離的多核苷酸。核酸構(gòu)建體本發(fā)明還涉及包含本發(fā)明的分離的多核苷酸的核酸構(gòu)建體,所述分離的多核苷酸與一個或多個調(diào)控序列可操作地連接,所述調(diào)控序列在合適的宿主細(xì)胞中在與該調(diào)控序列相容的條件下指導(dǎo)編碼序列的表達(dá)。技術(shù)人員應(yīng)了解的是,在合適的宿主細(xì)胞中,包括于適合表達(dá)根據(jù)本發(fā)明的多肽的核酸構(gòu)建體中的元件依賴于特定選擇的宿主細(xì)胞。在本發(fā)明中,細(xì)齒細(xì)胞是優(yōu)選的宿主細(xì)胞,并且因此詳細(xì)描述了根據(jù)本發(fā)明的適用于細(xì)菌細(xì)胞中的核酸構(gòu)建體。然而技術(shù)人員應(yīng)了解的是,其他宿主細(xì)胞如真菌細(xì)胞、哺乳動物細(xì)胞、植物細(xì)胞或昆蟲細(xì)胞也可以根據(jù)本發(fā)明使用,并且技術(shù)人員能夠決定哪種元件適合包含于意欲與這些宿主細(xì)胞聯(lián)合使用的核酸構(gòu)建體中??梢杂迷S多方式操作編碼本發(fā)明多肽的分離的多核苷酸以提供多肽的表達(dá)。依賴于表達(dá)載體,在將多核苷酸的序列插入載體之前對其進行操作可能是理想的或必需的。使用重組DNA方法修飾多核苷酸序列的技術(shù)是本領(lǐng)域熟知的。調(diào)控序列可以是合適的啟動子序列,其是由用于表達(dá)編碼本發(fā)明多肽的多核苦酸的宿主細(xì)胞識別的核苷酸序列。啟動子序列含有介導(dǎo)多肽的表達(dá)的酸序列,包括突變的、截斷的和雜合的啟動子,并且可以從編碼與宿主細(xì)胞同源或異源的胞外或胞內(nèi)多肽的基因獲得。用于指導(dǎo)本發(fā)明的核酸構(gòu)建體轉(zhuǎn)錄,特別是在細(xì)菌宿主細(xì)胞中轉(zhuǎn)錄的合適啟動子的實例是從下述獲得的啟動子大腸桿菌/ac操縱子、天藍(lán)色鏈霉菌(&reptomyc"^》0/^)瓊脂糖酶基因(^^4)、枯草芽孢桿菌果聚糖蔗糖酶基因0ac巧、地衣芽孢桿菌a-淀粉酶基因(amy丄)、嗜熱脂肪芽孢桿菌產(chǎn)麥芽糖a-淀粉酶基因O^M)、解淀粉芽孢桿菌a-淀粉酶基因Owy0、地衣芽孢桿菌青霉素酶基因(pew尸)、枯草芽孢桿菌矽M和xy/B基因和原核P-內(nèi)酰胺酶基因(Villa-Kamaroff等,1978,尸raceW"g^o/_/Va//owa/^4ca<i,_yo/5Wewc&st/S/475:3727-3731),以及toc啟動子(DeBoer等,1983,尸rac^一o///ze淑/畫/Academy5Wewces80:21-25)。另夕卜的啟動子在"Usefulproteinsfromrecombinantbacteria"于5b/ew打yc爿wen'ca",1980,242:74-94中;和在Sambrook等,1989,見上文中有所描述。在優(yōu)選的方面,啟動子是由來自下述基因的啟動子組成的啟動子系統(tǒng)地衣芽孢桿菌a-淀粉酶基因(amy丄)、解淀粉芽孢桿菌a-淀粉酶基因(amy0和包含穩(wěn)定化序列的蘇云金芽孢桿菌C7//"啟動子,如WO99/43835中所述。調(diào)控序列也可以是合適的轉(zhuǎn)錄終止子序列,是由宿主細(xì)胞識別以終止轉(zhuǎn)錄的序列。所述終止子序列與編碼所述多肽的核苷酸序列的3'末端可操作地連接。可以將在所選宿主細(xì)胞中有功能的任何終止子用在本發(fā)明中。調(diào)控序列還可以是合適的前導(dǎo)序列,其是對于宿主細(xì)胞的翻譯重要的mRNA非翻譯區(qū)。前導(dǎo)序列可操作地連接于編碼多肽的核苷酸序列的5,-末端??梢詫⒃谒x宿主細(xì)胞中有功能的任何前導(dǎo)序列用在本發(fā)明中。調(diào)控序列還可以是信號肽編碼區(qū),其編碼與多肽的氨基末端相聯(lián)的氨基酸序列,并且指導(dǎo)編碼的多肽進入細(xì)胞的分泌途徑。核苷酸序列的編碼序列5,端可固有地包含信號肽編碼區(qū),其與編碼分泌多肽的編碼區(qū)的區(qū)段一起天然地連接在翻譯閱讀框中。可供選擇的是,編碼序列5'端可含有對于所述編碼序列是外源的信號肽編碼區(qū)。外源信號肽編碼區(qū)在編碼序列不天然地含有信號肽編碼區(qū)時可能是必需的?;蛘?,外源信號肽編碼區(qū)可以簡單地替代天然信號肽編碼區(qū)以增強多肽的分泌。然而,指導(dǎo)表達(dá)的多肽進入所選宿主細(xì)胞的分泌途徑的任何信號肽編碼區(qū)可在本發(fā)明中使用。對于細(xì)菌宿主細(xì)胞有效的信號肽編碼區(qū)是從如下酶的基因獲得的信號肽編碼區(qū)芽孢桿菌屬NCIB11837產(chǎn)麥芽糖a-淀粉酶、嗜熱脂肪芽孢桿菌a-淀粉酶、地衣芽孢桿菌枯草蛋白酶(subtilisin)、地衣芽孢桿菌|3-內(nèi)酰胺酶、嗜熱脂肪芽孢桿菌中性蛋白酶(";^r,w;^S,wpWW)和枯草芽孢桿菌jW""。另外的信號脈由Simonen和Palva,1993,7kf/craZ/o/og/ca/Aev/ems57:109-137描述。調(diào)控序列還可以是前肽編碼區(qū),其編碼位于多肽氨基末端的氨基S交序列。所得多盧稱為酶原(proenzyme)或前多肽(propolypeptide)(或在某些情況下稱為酶原(zymogen))。前多肽通常是無活性的并且能夠通過前肽的催化或自催化切割從前多肽轉(zhuǎn)化成成熟活性多肽??梢詮目莶菅挎邨U菌堿性蛋白酶(a/^;)、18枯草芽孢桿菌中性蛋白酶(w;^7)、釀酒酵母a因子、曼赫根毛霉天冬氨酸蛋白酶和嗜熱毀絲霉漆酶(WO95/33836)的基因獲得前肽編碼區(qū)。當(dāng)信號肽和前肽區(qū)二者均出現(xiàn)在多肽的氨基末端時,將前肽區(qū)置于緊接著(nextto)多肽氨基末端,并且將信號肽區(qū)置于緊接著前肽區(qū)的氨基末端。同樣理想的是添加調(diào)節(jié)序列,其允許相對于宿主細(xì)胞的生長來調(diào)節(jié)多肽的表達(dá)。調(diào)節(jié)系統(tǒng)的實例是引起基因表達(dá)響應(yīng)于化學(xué)或物理剌激,包括調(diào)節(jié)化合物的存在而開啟或關(guān)閉的那些系統(tǒng)。原核系統(tǒng)中的調(diào)節(jié)系統(tǒng)包括/ac、toc和/^操縱基因系統(tǒng)。表達(dá)載體本發(fā)明還涉及重組表達(dá)載體,所述重組表達(dá)載體包含本發(fā)明的多核苷酸、啟動子和轉(zhuǎn)錄和翻譯終止信號。上述的多種核酸和調(diào)控序列可以結(jié)合在一起以產(chǎn)生重組表達(dá)載體,所述表達(dá)載體可以包括一個或多個方便的限制位點以允許在這些位點插入或取代編碼多肽的核苷酸序列。可供選擇的是,可以通過在合適的用于表達(dá)的載體中插入包含所述序列的核苷酸序列或核酸構(gòu)建體來表達(dá)本發(fā)明的核苦酸序列。在制備表達(dá)載體的過程中,將編碼序列置于載體中,從而將該編碼序列與合適的表達(dá)調(diào)控序列可操作地連接。重組表達(dá)載體可以是任何載體(例如,質(zhì)?;虿《?,其能夠方便地進行重組DNA步驟,并且能夠產(chǎn)生核苷酸序列的表達(dá)。載體的選擇將通常依賴于載體與將引入該載體的宿主細(xì)胞的相容性。載體可以是線狀或閉合環(huán)狀質(zhì)粒。載體可以是自主復(fù)制載體,即,作為染色體外實體(entity)存在的載體,其復(fù)制獨立于染色體復(fù)制,例如,質(zhì)粒、染色體外元件、微型染色體(minichromosome)或人工染色體。載體可以含有任何用于確保自復(fù)制的手段(means)?;蛘?,載體可以是一種當(dāng)被引入宿主細(xì)胞中時,整合到基因組中并且與整合了該載體的染色體一起復(fù)制的載體。此外,可以使用單獨的載體或質(zhì)粒或兩個或更多個載體或質(zhì)粒,其共同含有待引入宿主細(xì)胞基因組的完整DNA(totalDNA),或可以使用轉(zhuǎn)座子(transposes)。本發(fā)明的載體優(yōu)選地含有一個或多個選擇性標(biāo)記,其允許簡單選擇經(jīng)轉(zhuǎn)化的細(xì)胞。選擇性標(biāo)記是基因,其產(chǎn)物提供殺生物劑或病毒抗性、對重金屬的抗性、對營養(yǎng)缺陷型的原養(yǎng)性(prototrophytoauxotrophs)等。條件必需基因可以作為非抗生素選擇性標(biāo)記起作用。細(xì)菌條件必需非抗生素選擇性標(biāo)記的非限制性實例是來自枯草芽孢桿菌、地衣芽孢桿菌或其他芽孢桿菌的tfo/基因,其僅在缺少D-丙氨酸的條件下培養(yǎng)細(xì)菌時是必需的。當(dāng)細(xì)胞在半乳糖存在的情況下或在能引起半乳糖存在的培養(yǎng)基中生長時,編碼參與UDP-半乳糖的轉(zhuǎn)換(turnover)的酶的基因也可以在細(xì)胞中作為條件必需標(biāo)記起作用。這類基因的非限制性實例是來自枯草芽孢桿菌或地衣芽孢桿菌的編碼UTP-依賴型磷酸化酶(EC2.7.7.10)、UDP-葡萄糖-依賴型脲芬酰轉(zhuǎn)移酶(EC2.7.7.12)或UDP-半乳糖差向異構(gòu)酶(EC5丄3.2)的那些。芽孢桿菌的木糖異構(gòu)酶基因如砂"也可以用作在以木糖作為唯一碳源在基本培養(yǎng)基中生長的細(xì)胞中的選擇性標(biāo)記。利用葡萄糖酸所需的基因,gnW和g"/尸也可以用作以葡萄糖酸作為唯一碳源在基本培養(yǎng)基中生長的細(xì)胞中的選擇性標(biāo)記。條件必需基因的其他實例在本領(lǐng)域中已知??股剡x擇性標(biāo)記可以賦予對這些抗生素的抗生素抗性,所述抗生素如氨千青霉素、卡那霉素、氯霉素、紅霉素、四環(huán)素、新霉素、潮霉素或曱氨蝶呤。本發(fā)明的載體優(yōu)選含有元件,其允許載體整合入宿主細(xì)胞的基因組或載體在細(xì)胞中獨立于基因組的自主復(fù)制。為了整合入宿主細(xì)胞基因組,載體可依賴編碼多肽的多核苷酸的序列或用于通過同源或非同源重組整合入基因組的任何其它載體元件?;蛘?,載體可以含有額外的核苷酸序列,用于指導(dǎo)通過同源重組整合入宿主細(xì)胞基因組染色體中的精確位置。為了增加在精確位置整合的可能性,整合元件應(yīng)該優(yōu)選含有足夠數(shù)目的核酸,如100至10,000堿基對,優(yōu)選400至10,000堿基對,并且最優(yōu)選800至10,000堿基對,其與相應(yīng)的目標(biāo)序列具有高度同一性以增強同源重組的概率。整合元件可以是任何序列,其與宿主細(xì)胞基因組中的目標(biāo)序列同源。此外,整合元件可以是非編碼或編碼的核苷酸序列。另一方面,可以將載體通過非同源重組整合到宿主細(xì)胞的基因組中。為了自主復(fù)制,載體可以進一步包含復(fù)制起點,其使載體能夠在所述的宿主細(xì)胞中自主地復(fù)制。復(fù)制起點可以是介導(dǎo)自主復(fù)制的任何質(zhì)粒復(fù)制子(replicator),其在細(xì)胞中發(fā)揮功能。術(shù)語"復(fù)制起點"或"質(zhì)粒復(fù)制子"在本文定義為能夠使質(zhì)?;蜉d體在體內(nèi)復(fù)制的核苷酸序列。細(xì)菌復(fù)制起點的實例是允許在大腸桿菌中復(fù)制的質(zhì)粒pBR322、pUC19、pACYC177和pACYC184的復(fù)制起點,和允許在芽孢桿菌屬中復(fù)制的質(zhì)粒pUB110、pE194、pTA1060和pAMBl的復(fù)制起點。可以將多于一個拷貝的本發(fā)明的多核苷酸插入宿主細(xì)胞以增加基因產(chǎn)物的產(chǎn)生。多核苷酸拷貝數(shù)的增加可通過如下方法獲得將至少一個額外拷貝的序列整合入宿主細(xì)胞基因組,或?qū)⒖蓴U增的選擇性標(biāo)記基因包括在多核苷酸中,其中可通過在合適的選擇劑(selectableagent)存在下培養(yǎng)細(xì)胞來選擇含有選擇性標(biāo)記基因的擴增的拷貝,并且由此含有多核苷酸的額外拷貝的細(xì)胞。用于連接上述元件以構(gòu)建本發(fā)明重組表達(dá)載體的方法是本領(lǐng)域技術(shù)人員熟知的(參見,例如,Sambrook等,1989,見上文)。宿主細(xì)胞本發(fā)明還涉及重組宿主細(xì)胞,所述重組宿主細(xì)胞包含本發(fā)明的多核苷酸,將其有利地用于多肽的重組產(chǎn)生中。將包含本發(fā)明多核苷酸的載體引入宿主細(xì)胞中,從而將該載體保留作為染色體整合體(chromosomalintegrant)或作為前述的自復(fù)制的染色體外載體。術(shù)語"宿主細(xì)胞"包含親本細(xì)胞的任何子代,其由于復(fù)制過程中發(fā)生的突變而與親本細(xì)胞不相同。宿主細(xì)胞的選擇將很大程度依賴于編碼多肽的基因和它的來源。宿主細(xì)胞可以是單細(xì)胞微生物,例如,原核生物,或非單細(xì)胞微生物,例:^,真4亥生物。有用的單細(xì)胞微生物是細(xì)菌細(xì)胞,例如革蘭氏陽性細(xì)菌,包括但不限于,芽孢桿菌屬細(xì)胞,例如,嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、克勞氏芽孢桿菌(^^7/wc/aww7)、凝結(jié)芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌和蘇云金芽孢桿菌;或鏈霉菌屬細(xì)胞,例如,淺青紫鏈霉菌和鼠灰鏈霉菌,或革蘭氏陰性細(xì)菌例如大腸桿菌和假單胞菌屬菌種。在優(yōu)選的方面,細(xì)菌宿主細(xì)胞是遲緩芽孢桿菌、地衣芽孢桿菌、嗜熱脂肪芽孢桿菌或枯草芽孢桿菌細(xì)胞。在另一個優(yōu)選的方面,芽孢桿菌屬細(xì)胞是嗜堿的芽孢桿菌屬??赏ㄟ^如下方法實現(xiàn)將載體導(dǎo)入細(xì)菌宿主細(xì)胞例如原生質(zhì)體轉(zhuǎn)化(參見,例如,Chang和Cohen,1979,Afo/ecw/wGe"era/Ge"e/Zcs168:111-115),4吏用感受態(tài)細(xì)月包(參見,例如,Young和Spizizen,1961,Jowma/o/5a"en'o/ogy81:823-829或Dubnau和Davidoff-Abelson,1971,Jow謂/o/Mo/腦/ar腸/ogy56:209-221),電穿孔(參見,例如,Shigekawa和Dower,1988,Aoto^m々way6:742-751)或接合(參見,例如,Koehler和Thome,1987,Jowwa/5a"en'o/ogy21169:5771-5278)。宿主細(xì)胞還可以是真核生物,例如哺乳動物、昆蟲、植物或真菌細(xì)胞。在優(yōu)選的方面,宿主細(xì)胞是真菌細(xì)胞。"真菌"用在本文包括以下門子囊菌門(Ascomycota)、4旦子菌門(Basidiomycota)、壺菌門(Chytridiomycota)禾口接合菌門(Zygomycota)(如由Hawksworth等,于爿!.mw0W/2朋t/BZsfey》Z)/c/7.o"a/"yT7zeFw"g7',第8版,1995,CABInternational,UniversityPress,Cambridge,UK所定義)以及卵菌門(Oomycota)(如Hawksworth等,1995,見上,171頁中所引用),和所有有絲分裂孢子真菌(mitosporicfongi)(Hawksworth等,1995,見上文)。在更優(yōu)選的方面,真菌宿主細(xì)胞是酵母細(xì)胞。"酵母"用在本文包括產(chǎn)子嚢酵.母(ascosporogenousyeast)(內(nèi)孑包霉目(Endomycetales))、產(chǎn)4a子酵母(basidiosporogenousyeast)禾口屬于半^口菌類(FungiImperfecti)(芽孑包纟岡(Blastomycetes))的酵母。由于酵母的分類在未來可能改變,就本發(fā)明而言,將酵母定義為如歷o/ogyJc//W/7'&so/Ife"W(Skinner,F.A.,Passmore,S.M.和Davenport,R.R.編,5bc.^/.5acfeWo/.Syw/as7'wmiSen'&sNo.9,1980)中所述。在甚至更加優(yōu)選的方面,酵母宿主細(xì)胞是4支絲酵母屬、漢遜酵母屬(//araewM/a)、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或耶氏酵母屬細(xì)月包。在最優(yōu)選的方面,酵母宿主細(xì)胞是卡爾酵母,釀酒酵母,糖化酵母,道格拉氏酵母,克魯弗酵母,諾地酵母或卵形酵母細(xì)胞。在另一個最優(yōu)選的方面,酵母宿主細(xì)胞是乳酸克魯維酵母(幻wj/veramycas/acto)細(xì)胞。在另一個最優(yōu)選的方面,酵母宿主細(xì)胞是解脂耶氏酵母(7"mw/a印o/,'ca)細(xì)胞。在另一個更優(yōu)選的方面,真菌宿主細(xì)胞是絲狀真菌細(xì)胞。"絲狀真菌,,包括真菌門(Eumycota)和卵菌門的亞門(如由Hawksworth等,1995,見上文,所定義)的所有絲狀形式。絲狀真菌通常的特征在于由殼多糖(chitin)、纖維素、葡聚糖、殼聚糖(chitosan)、甘露聚糖和其它復(fù)雜多糖組成的菌絲體壁。通過菌絲延伸進行營養(yǎng)生長,而碳分解代謝是專性需氧的。相反,酵母例如釀酒酵母的營養(yǎng)生長通過單細(xì)胞菌體的出芽生殖(budding)進行,而碳分解代謝可以是發(fā)酵的。在甚至更優(yōu)選的方面,絲狀真菌宿主細(xì)胞是枝頂孢霉屬、曲霉屬、短梗霉屬、煙管霉屬CSyeAa"t/era)、擬蠟菌屬(CeWpon'o戸&)、鬼傘屬(Opn'"w力、革蓋菌屬(Con'o/w)、隱球菌屬、Fz7oZ)osWmw、鐮孢屬、腐質(zhì)霉屬、梨孢菌屬(M3g"apwt/2e)、毛霉屬、毀絲霉屬、新考瑪脂霉屬(iVeoca肌wa幼'x)、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬(尸/2a/7erac/2"ete)、射脈菌屬(尸/2/eZ7/")、瘤胃壺菌屬(尸/raw;/cM)、側(cè)耳屬(戶/wra^s)、裂褶菌屬、踝節(jié)菌屬、嗜熱子嚢菌屬、梭孢殼屬、彎頸霉屬(ro/yjwc/at^m)、栓菌屬(rramete)或木霉屬細(xì)胞。在最優(yōu)選的方面,絲狀真菌宿主細(xì)胞是泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉或米曲霉細(xì)胞。在另外的最優(yōu)選方面,絲狀真菌宿主細(xì)胞是桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢細(xì)胞。在另外最優(yōu)選的方面,絲狀真菌宿主細(xì)胞是黑刺煙管菌(場'e^a^fera^/wto)、干擬蠟菌(Or—"'o/w7'sa"ezW"a)、干擬錯菌、Cer—".o/w/scflreg/ea、淺黃擬錯菌纟工扣乂錯菌(Cen)on'o/w^s、或蟲#以錯菌(Cen^on'o/w7'ssw6verm/5por")、灰蓋鬼傘(Co/n'm^cz'"ereu)、毛革蓋菌(Cw7'o/ms/2/raw似力、特異腐質(zhì)霉、疏棉狀腐質(zhì)霉、米赫毛霉、嗜熱毀絲霉、粗糙脈孢菌、產(chǎn)紫青霉、黃孢平革菌CP/zawerac/^etec/^sc^;on'Mw)、輻射射月永菌(尸/z/e6/ara<i/ato)、刺芽側(cè)耳(/Ve,加e,gz7)、土生梭孑包霉、長織松菌(rra,tes1v/〃asa)、變色松菌(rrawe/asvera/co/w)、哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉細(xì)胞。可以將真菌細(xì)胞通過涉及原生質(zhì)體形成、原生質(zhì)體轉(zhuǎn)化和細(xì)胞壁重建的方法以本身公知的方式轉(zhuǎn)化。用于轉(zhuǎn)化曲霉屬和木霉屬宿主細(xì)胞的合適方法在EP238023和Yelton等,1984,iVoceW,o/AeTVa/Zowa/Academy>SWewces"&481:1470-1474中描述。用于轉(zhuǎn)化鐮孢屬菌種的合適方法由Malardier等,1989,G麼78:147-156和WO96/00787描述。可以使用由如下文獻描述的方法轉(zhuǎn)化酵母Becker和Guarente,于Abelson,J.N.和Simon,M.I.Volume194,pp182-187,AcademicPress,Inc.,NewYork;Ito等,1983,/owtg(/o/Ba"en.o/ogy153:163;和Hinnen等,1978,尸raceW"gso/7Va"'owa/爿co(i證yo/Sc/e"c&y75:1920。最優(yōu)選的宿主細(xì)胞是細(xì)菌細(xì)胞如屬于芽孢桿菌屬的革蘭氏陽性細(xì)菌。23產(chǎn)生方法
技術(shù)領(lǐng)域:
:本發(fā)明還涉及用于產(chǎn)生本發(fā)明多肽的方法,其包括(a)在有益于產(chǎn)生多肽的條件下培養(yǎng)細(xì)胞,所述細(xì)胞以其野生型形式能夠產(chǎn)生所述多肽;和(b)回收所述多肽。優(yōu)選地,所述細(xì)胞是芽孢桿菌屬的細(xì)胞,并且更優(yōu)選地,所述細(xì)胞是枯草芽孢桿菌的細(xì)胞。本發(fā)明還涉及用于產(chǎn)生本發(fā)明的多肽的方法,其包括(a)在有益于產(chǎn)生多肽的條件下培養(yǎng)宿主細(xì)胞;和(b)回收所述多肽。本發(fā)明還涉及用于產(chǎn)生本發(fā)明的多肽的方法,包括(a)在有益于產(chǎn)生多肽的條件下培養(yǎng)宿主細(xì)胞,其中所述宿主細(xì)胞包含突變核苷酸序列,其在SEQIDNO:l的成熟多肽編碼區(qū)中具有至少一個突變,其中所述突變核苦酸序列編碼由SEQIDNO:2的氨基酸1至719組成的多肽,和(b)回收所述多肽。在本發(fā)明的產(chǎn)生方法中,使用本領(lǐng)域熟知的方法在適合于產(chǎn)生所述多肽的營養(yǎng)培養(yǎng)基中培養(yǎng)細(xì)胞。例如,可以通過在合適培養(yǎng)基中和允許表達(dá)和/或分離所述多肽的條件下進行的搖瓶培養(yǎng),和實驗室或工業(yè)發(fā)酵罐中的小規(guī)?;虼笠?guī)模發(fā)酵(包括連續(xù)、分批、補料分批或固態(tài)發(fā)酵)來培養(yǎng)細(xì)胞。使用本領(lǐng)域已知的方法在合適的營養(yǎng)培養(yǎng)基中進行培養(yǎng),所述營養(yǎng)培養(yǎng)基包含碳源和氮源和無機鹽。合適的培養(yǎng)基能夠從商業(yè)供應(yīng)商獲得或可以根據(jù)公開的組成制備(例如,在美國典型培養(yǎng)物保藏中心的目錄中)。如果多肽分泌到營養(yǎng)培養(yǎng)基中,該多肽能夠從所述培養(yǎng)基中直接回收。如果多肽不分泌到培養(yǎng)基中,其能夠從細(xì)胞裂解物(lysate)回收??梢允褂帽绢I(lǐng)域已知的對于所述多肽是特異性的方法來檢測多肽。這些檢測方法可包括特異性抗體的使用、酶產(chǎn)物的形成或酶底物的消失。例如,酶試驗(enzymeassay)可用于測定如本文所述的多肽的活性。所得多肽可以-使用本領(lǐng)域已知的方法回收。例如,多肽可以通過常M^方法從營養(yǎng)培養(yǎng)基中回收,所述常規(guī)方法包括但不限于離心、過濾、提取、噴霧干燥、蒸發(fā)或沉淀。本發(fā)明的多肽可以通過多種本領(lǐng)域已知的方法純化,所述方法包括-f旦不限于層析(例如,離子交換、親和、疏水、層析聚焦和大小排阻)、電泳方法(例如,制備型(preparative)等電聚焦)、差示溶解度(例如,硫酸銨沉淀)、SDS-PAGE或4是取(參見,例如,尸wnyco^'o";J.-C.Janson和LarsRyden編,VCHPublishers,NewYork,1989)。組合物本發(fā)明還涉及包含本發(fā)明的多肽的組合物。優(yōu)選地,所述組合物富含這種多肽。術(shù)語"富含"表示所述組合物的a-淀粉酶活性增加,例如,以至少1.1的富集因數(shù)(enrichmentfactor)增加。所述組合物可以包含本發(fā)明的多肽作為主要酶組分,例如,單組分組合物?;蛘撸鼋M合物可以包含多種酶活性,如氨肽酶、a-淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質(zhì)酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、a-半乳糖苷酶、|3-半乳糖苷酶、葡糖淀粉酶、a-葡糖苷酶、(3-葡糖普酶、卣素過氧化酶、轉(zhuǎn)化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果膠分解酶、肽谷氨酰胺酶(peptidoglutaminase)、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶或木聚糖酶。額外的酶可以通過例如屬于以下屬的微生物產(chǎn)生曲霉屬,優(yōu)選棘孢曲霉、泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉或米曲霉;鐮孢屬,優(yōu)選桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢;腐質(zhì)霉屬,優(yōu)選特異腐質(zhì)霉或疏棉狀腐質(zhì)霉;或木霉屬,優(yōu)選哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉??梢砸勒毡绢I(lǐng)域內(nèi)已知的方法制備多肽組合物,并且可以是液體或干組合物的形式。例如,所述多肽組合物可以是顆粒(granulate)或孩i粒(microgranulate)的形式??梢詫ㄓ谒鼋M合物中的多肽依照本領(lǐng)域內(nèi)已知方法穩(wěn)、定。以下提供的實施例是本發(fā)明多肽組合物的優(yōu)選的用途。本發(fā)明的多肽組合物的劑量和使用該組合物的其它條件可以基于本領(lǐng)域內(nèi)已知的方法確定。用途ot-淀粉酶可以用于產(chǎn)生麥芽糊精,包括在合適的條件下將淀粉或淀粉水解物與a-淀粉酶一起溫育以水解淀粉或淀粉水解物中的a-l,4鍵。麥芽糊精可以是線性或有支鏈的,并且可以包括葡萄糖(DP1)、麥芽糖(DP2)、麥芽三糖(DP"、麥芽四糖(DP4)、麥芽五糖(DP5)、麥芽六糖(DPQ和麥芽七糖(DP7)??梢酝ㄟ^如下方式制備麥芽糊精在熱穩(wěn)定的a-淀粉酶存在的情況下液化(部分水解)淀粉,然后在本發(fā)明的a-淀粉酶存在的情況下,在適于切割a-(l,4)糖苷鍵的條件下將液化淀粉糖化(進一步水解)??梢蕴幚矸浅8叩牡矸蹪舛龋?0%至40%干-固體。液化可以包括在約105。C初步水解約五分鐘,然后在85。C至90。C的溫度溫育約一小時,以得到10至15的右旋糖當(dāng)量(D.E.)。用本發(fā)明的a-淀粉酶進行的糖化可以在pH5-6.5和50-70。C進行24-72小時,優(yōu)選36-48小時。用本發(fā)明的a-淀粉酶進4亍的糖化可以在比用常規(guī)真菌淀粉酶糖化時更高的溫度和更低的pH進行。本發(fā)明的a-淀粉酶還可以用于淀粉轉(zhuǎn)化、醇生產(chǎn)、釀造和烘培。麥芽糖漿的產(chǎn)生可以包括以下步驟l)在a-淀粉酶存在的情況下液化淀粉;2)在本發(fā)明的a-淀粉酶存在的情況下糊精化;和3)回收所述糖漿;和任選地純化糖漿。步驟l)中用于液化的a-淀粉酶可以是任何a-淀粉酶。優(yōu)選的a-淀粉酶是芽孢桿菌屬a-淀粉酶,如Termamyl-樣a-淀粉酶,包括地衣芽孢桿菌a-淀粉酶(作為TermamyFM商業(yè)上可得到(Novozymes)),解淀粉芽孢桿菌a-淀粉酶(作為BAN銷售(Novozymes)),嗜熱解脂肪芽孢桿菌a-淀粉酶(作為S型TermamylTM120L銷售),源自芽孢桿菌屬菌種NCIB12289、NCIB12512、NCIB12513或DSM9375的菌抹的a-淀粉酶,所有上述菌4朱均在WO95/26397中詳細(xì)描述,和由Tsukamoto等,BiochemicalandBiophysicalResearchCommunications,151(1988),pp.25-31描述的a-淀粉酶。"Termamyl-樣a-淀粉酶"的定義中的a-淀粉酶在例如WO96/23874(Novozymes)中限定。在另一個方面,本發(fā)明涉及產(chǎn)生麥芽糖的方法,包括下述步驟l)在140-160。C在pH4-6液化淀粉;2)在60-95。C,特別是65-85。C,如70-80°C,在pH4-6,在本發(fā)明的真菌a-淀粉酶變體存在的情況下糊精化;和3)回收所述糖漿;和任選地純化所述糖漿。在本發(fā)明的一個實施方案中,在步驟(2)中加入有效量的葡糖淀粉酶。在這個實施方案(包括用葡糖淀粉酶處理)中的糖漿不是麥芽糖漿,而是具有不同糖譜(sugarprofile)的糖漿。葡糖淀粉酶可以是曲霉屬葡糖淀粉酶,具體為黑曲霉葡糖淀粉酶。或者,方法包含下述步驟1)在95-110。C在pH4-6,在芽孢桿菌屬a-淀粉酶存在的情況下液化淀粉;2)在70-95。C在pH4-6,在本發(fā)明的a-淀粉酶存在的情況下液化,然后回收和/或任選地純化獲得的產(chǎn)物。最后,本發(fā)明的一些方面涉及多種洗滌劑用途。一個方面涉及包含本發(fā)明的a-淀粉酶的洗滌添加劑,任選地為無粉塵顆粒、穩(wěn)定化液體或受保護的酶的形式。這個方面的優(yōu)選實施方案涉及包含0.02-200mg酶蛋白質(zhì)/g添加劑的洗滌添加劑。另一個優(yōu)選的實施方案涉及根據(jù)先前方面的洗滌添加劑,其額外包含另一種酶,如蛋白酶、脂肪酶、過氧化物酶、另一種淀粉分解酶和/或纖維素酶。另一個方面涉及包含本發(fā)明a-淀粉酶的洗滌組合物,并且這個方面的優(yōu)選實施方案涉及洗滌組合物,其額外包含另一種酶,如蛋白酶、脂肪酶、過氧化物酶、另一種淀粉分解酶和/或纖維素酶。另一個方面涉及包含本發(fā)明的a-淀粉酶的手動或自動洗碗洗滌劑組合物。優(yōu)選的洗^宛洗滌劑組合物額外包含另一種酶,如蛋白酶、脂肪酶、過氧化物酶、另一種淀粉分解酶和/或纖維素酶。最后一個洗滌劑相關(guān)方面是包含本發(fā)明的a-淀粉酶的手動或自動洗衣組合物。根據(jù)本發(fā)明優(yōu)選的洗衣組合物額外包含另一種酶,如蛋白酶、脂肪酶、過氧化物酶、淀粉分解酶和/或纖維素酶。淀粉結(jié)合域本發(fā)明還涉及包含編碼蛋白質(zhì)的基因的核酸構(gòu)建體,所述基因與由編碼具有淀粉結(jié)合活性的多肽的SEQIDNO:1的片段組成的核苷酸序列可操作連接,其中所述基因?qū)τ赟EQIDNO:1是外源的。本發(fā)明還涉及包含這些核酸構(gòu)建體的重組表達(dá)載體和重組宿主細(xì)胞。本發(fā)明還涉及用于產(chǎn)生蛋白質(zhì)的方法,其包括(a)在適于產(chǎn)生所述蛋白質(zhì)的條件下培養(yǎng)這種重組宿主細(xì)胞;和(b)回收所述蛋白質(zhì)。核苷酸序列可以單獨地以調(diào)控序列與外源基因可操作地連接(operablylinkedtoforeigngenesindividuallywithcontrolsequences),^口上文戶斤述。所述蛋白質(zhì)對于宿主細(xì)胞可以是天然的或異源的。術(shù)語"蛋白質(zhì)"在本文的意思不是指特定長度的編碼產(chǎn)物,并且因此涵蓋肽、寡肽和蛋白質(zhì)。術(shù)語"蛋白質(zhì)"還涵蓋組合以形成編碼產(chǎn)物的兩種或兩種以上多肽。所述蛋白質(zhì)還包括雜合多肽,其包含部分或全部多肽序列的組合,所述多肽序列從至少兩種不同的蛋白質(zhì)獲得,其中一種或多種蛋白質(zhì)對于宿主細(xì)胞可以是異源或天然的。蛋白質(zhì)進一步包括上述蛋白質(zhì)和雜合蛋白質(zhì)的天然存在的等位基因變異和工程改造的變異。27優(yōu)選地,蛋白質(zhì)是激素或其變體、酶、受體或其部分、抗體或其部分,或報道蛋白(reporter)。在更優(yōu)選的方面,所述蛋白質(zhì)是氧化還原酶、轉(zhuǎn)移酶、水解酶、裂合酶(lyase)、異構(gòu)酶或連接酶。在更加優(yōu)選的方面,所述蛋白質(zhì)是氨肽酶、ot-淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質(zhì)酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、a-半乳糖香酶、卩-半乳糖苷酶、葡糖淀粉酶、(x-葡糖苷酶、P-葡糖苷酶、轉(zhuǎn)化酶、漆酶、脂肪酶、甘露糖苷酶、變位酶(mutanase)、氧化酶、果膠分解酶、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶或木聚糖酶?;蚩梢詮娜魏卧?、真核或其它來源獲得。通過以下實施例進一步對本發(fā)明進行描述,但不應(yīng)將其理解為對本發(fā)明范圍的限制。淀粉酶試驗二硝基水楊酸法就本發(fā)明而言,可以使用二硝基水楊酸法測定a-淀粉酶活性,所述方法為由Miller,G丄.在(Miller,G.L.1959.Useofdinitrosalicylicacidfordeterminationofreducingsugar.Anal.Chem.31:426428.)中描述的用于測定還原糖的方法。PNP-G7方法或者,可以通過使用PNP-G7為底物的方法測定a-淀粉酶活性。PNP-G7(對硝基苯基-a,D-麥芽庚糖香)是封閉的(blocked)寡糖,其能被內(nèi)切淀粉酶切割。切割后,試劑盒中包括的a-葡糖苷酶消化底物以釋放游離的PNP分子,PNP分子為黃色,因此能在1=405nm.(400-420nm.)處通過可見光分光光度法測定。包含PNP-G7底物和a-葡糖苷酶的試劑盒可以從Boehringer-Mannheim獲得(目錄號1054635)。為了制備底物,向5ml緩沖液(BM1442309)中加入一并瓦底物(BM1442309)。為了制備a-葡糖苷酶,向45ml緩沖液(BM1442309)中加入一瓶a-葡糖苷酶(BM1462309)。通過將5mla-葡糖苷酶溶液與1ml底物混合制成工作溶液。通過將20pi酶溶液轉(zhuǎn)移至96孔微量滴定板并在25。C溫育而進行試驗。在25。C加入200(il工作溶液。將溶液混合并預(yù)溫育1分鐘,在3分鐘內(nèi)在OD405nm每15秒鐘測定吸收。依賴時間的吸收曲線的斜率與指定條件組下的所述a-淀粉酶的比活性(活性每mg酶)成正比。實施例用作緩沖液和底物的化學(xué)品都是至少試劑級的商業(yè)產(chǎn)品。使用Phadebas試-瞼測定a-淀4分酶活性通過使用Phadebas⑧片為底物的方法測定a-淀粉酶活性。Phadebas片(Phadebasa-淀粉酶測試,由PharmaciaDiagnostic提供)包含交聯(lián)的不可溶藍(lán)色淀粉聚合物,其已經(jīng)與牛血清白蛋白和緩沖液物質(zhì)混合并制成片劑。對于每次單獨的測試,將一片懸浮于包含5ml50mMBritton-Robinson緩沖液(50mM乙酸,50mM磷酸,50mM硼酸,0,1mMCaCl2,用NaOH將pH調(diào)至感興趣的數(shù)值)的試管中。在感興趣的溫度,在水浴中進行測試。將待測試的a-淀粉酶用xml50mMBritton-Robinson緩沖液稀釋。向5ml50mMBritton-Robinson緩沖液中加入1ml這種a-淀粉酶溶液。由a-淀粉酶水解淀粉產(chǎn)生可溶的藍(lán)色片段。在620nm處用分光光度計測定獲得的藍(lán)色溶液的吸光度,所述吸光度是a-淀粉酶活性的函數(shù)。重要的是,在溫育10或15分鐘(測試時間)后測定的620nm吸光度于620nm在0.2至2.0吸光度單位的范圍內(nèi)。在此吸光度范圍中,活性和吸光度之間有線性(Lambert-Beer定律)。因此必須調(diào)整酶的稀釋度(dilution)使其符合此標(biāo)準(zhǔn)。在特定的條件組(溫度、pH、反應(yīng)時間、緩沖液條件)下,lmg給定的a-淀粉酶將水解一定量的底物,并產(chǎn)生藍(lán)色。在620nm測定顏色強度。測得的吸光度與給定條件組下所述a-淀粉酶的比活性(活性/mg純a-淀粉酶蛋白質(zhì))成正比。培養(yǎng)基與溶液除非另外指出,限制性內(nèi)切酶和其他用于DNA操作的酶由(供應(yīng)商)提供,并且#4居制造商的說明-使用。實施例1:序列SEQIDNO:1的鑒定A.基因組文庫構(gòu)建從Denmark,Sandbjerg中的地點采集含沙土壤(sandysoil)樣本。將土壤樣本巴氏殺菌并用橄欖油富集(oliveoilenriched)。通過使用標(biāo)準(zhǔn)分子生物學(xué)技術(shù)(Ausuble等1995"CurrentprotocolsinmolecularbiologyPubl:JohnWileyandsons)從這一富集培養(yǎng)物中制備染色體DNA。用限制性內(nèi)切酶Mbol部分切割制備的DNA,并通過超速離心在蔗糖梯度中分離。提取3至10kb的片段,沉淀并重懸于合適的緩沖液中。通過^f吏用StratageneZAPExpressTM予貞消^化的載體試劑盒和StratageneZAPExpressTM預(yù)消化的Gigapack⑧克隆試劑盒(用BamHI預(yù)消化)(StratageneInc.,USA),根據(jù)銷售方的說明/推薦,制備基因組文庫。得到的lambdaZAP文庫包含200pfU/ul,收集其中的100,000pfu用于大量剪切(massexcision)。將得到的41,900,000cfli/ul大腸桿菌菌落匯集,并通過使用QiagenSpin微量制備試劑盒(Qiagen,德國)制備質(zhì)粒。B.文庫篩選將約100,000個文庫克隆均勻地涂布在包含用Cibachron紅染色的支鏈淀粉(1%,重量百分比)、LB瓊脂和卡那霉素(25微克/ml)的平板上。在37。C過夜溫育后,通過菌落周圍指示分泌淀粉降解酶的透明區(qū)(clearingzone)來鑒定陽性克隆。鑒定出這個文庫中的一個陽性克隆(pSBL0622-2),通過如下^r證這個克隆胞外產(chǎn)生淀粉降解酶使克隆在包含卡那霉素(25微克/ml)和1%(重量百分比)馬鈴薯淀粉(Sigma,S-2630)的LB平板上過夜生長,然后將淀粉進行碘蒸汽染色,當(dāng)?shù)矸劢到鈺r,其在菌落周圍指示透明區(qū)。此外,在SDS-Page凝膠上計算的分子量(78kDa)的條帶對應(yīng)于來自SEQIDNO:2位置1-719的成熟多肽的的計算的分子量,其指示了酶的表達(dá)。僅篩選宿主(大腸桿菌DH10B)本身不顯示這個蛋白質(zhì)條帶。根據(jù)制造商的推薦,通過使用Qiagen質(zhì)粒制備試劑盒,制備活性克隆的質(zhì)粒。C.基因的分析使用載體中具有退火位點的T3和T7測序引物,通過Sanger測序由質(zhì)粒獲得基因序列,根據(jù)獲得的序列設(shè)計定制的測序引物,如SEQIDNO:3-8中所示。.本發(fā)明編碼a-淀粉酶的完整DNA序列如SEQIDNO:1中所示,推定的30氨基酸序列如SEQIDNO:2中所示,并且鑒定了信號肽。分析推定的氨基酸序列,全長多肽顯示包括下述序列的域結(jié)構(gòu)能劃分為糖基水解酶家族13亞家族2的成員的a-淀粉酶蛋白質(zhì)序列(MarkR.Stam等,"Dividingthelargeglycosidehydrolasefamily13intosubfamilies:towardsimprovedfunctionalannotationsofa-alpha-amylase-relatedproteins",ProteinEngineering,Design&Selectionvol.19no.12pp.555-562,2006)并且包含N誦端信號肽序列,GH13—2域,a-淀粉酶C-端域(Pfam登錄號PF02806)和糖結(jié)合域(CBM)20(PfamPF00686)。實施例2:枯草芽孢桿菌中a-淀粉酶的克隆通過PCR融合來自地衣芽孢桿菌的a-淀粉酶(AmyL)的信號肽,使其符合編碼a-淀粉酶的基因的閱讀框。通過同源重組,將編碼獲得的編碼序列的DNA整合到枯草芽孢桿菌宿主細(xì)胞基因組上。在三啟動子系統(tǒng)(如WO99/43835中所述)的控制下表達(dá)基因構(gòu)建體,所述系統(tǒng)由來自地衣芽孢桿菌a-淀粉酶基因(amyL)的啟動子、來自解淀粉芽孢桿菌a-淀粉酶基因(amyQ)的啟動子和包括穩(wěn)定化序列的蘇云金芽孢桿菌cryIIIA啟動子組成。使用編碼氯霉素乙酰專爭移酶的基因作為才示i己(在例3口Diderichsen等,Ausefulcloningvectorforto/腸s由iPlasmid,30,p.312,1993中描述)。選捧十個具有氯霉素抗性的轉(zhuǎn)化體,在大豆基培養(yǎng)基(soybasedmedia)中的4mL培養(yǎng)物中在37。C生長3天,并將20微升上清液點樣在包含cibachron-鄉(xiāng)f標(biāo)記支鏈淀粉的瓊脂平板上。選擇一個這樣的克隆,通過DNA測序分析來一瞼i正構(gòu)建體的DNA序列正確。在旋轉(zhuǎn)搖床上,在300mL帶擋板的錐形瓶中進行a-淀粉酶表達(dá)克隆的發(fā)酵,每瓶包含補加34mg/1氯霉素的100mL大豆基培養(yǎng)基。在37。C將克隆發(fā)酵4天。使用色語,在苯基瓊脂糖柱上從上清液純化酶,然后使用鹽梯度,在Q瓊脂糖柱上洗脫。匯集物(pool)的吸收值為A280=0.79和A260=0.43,并且純化的淀粉酶為12%SDS-PAGE凝膠上的主要條帶。在實施例4、5和6中使用純化的酶。實施例3:a-淀粉酶活性的檢測A.使用二硝基水楊酸的試驗通過使用二硝基水楊酸方法進行淀粉分解活性的確定,所述方法為測定還原沖唐的方'法.(Miller,G.L.1959.Useofdinitrosalicylicacidfordeterminationofreducingsugar.Anal.Chem.31:426-428.)。B.用酶譜;險測通過加入三氯乙酸至終濃度10%,然后在冰浴中溫育30分鐘并在13,000xg離心5分鐘,將來自攜帶a-淀粉酶基因(SEQIDNO:l)的表達(dá)克隆(實施例2)的兩百微升培養(yǎng)物上清液沉淀。去除上清液,并在10%SDS-PAGE凝膠上對樣品(50jiiL)進行大小排阻。在室溫在包含100mMTrispH8和5mMCaCl2的2.5%TritonX-100中洗滌凝膠,然后在室溫在1%Paselli淀粉(Avebe,Netherlands)、100mMTrispH8和5mMCaCl2中溫育30分鐘。用Lugol溶液(溶于100mL水中的0.15gl2,1.5gKI)將凝膠染色10秒鐘,并用過量水將剩余的Lugol溶液洗去。攜帶a-淀粉酶基因(SEQIDNO:2)的表達(dá)克隆的SDS-PAGE和酶譜(zymogram)指示了期望大小(78kDa)的蛋白質(zhì)條帶和透明區(qū)。實施例4:N-端N-端序列測定為ASGQSLGPVT(SEQIDNO:2中的位置1至10)。實施例5:最適pH與最適溫度通過37。C在調(diào)至從pH2.0至pH9.0的不同pH值的緩沖液中運行Phadebas試驗,來進行關(guān)于最適pH的實驗。發(fā)現(xiàn)酶的最適pH為約pH6。相似地,在pH6,通過在從30。C至80。C的溫度運行Phadebas試驗,來進行關(guān)于最適溫度的實驗。發(fā)現(xiàn)酶的最適溫度為約60°C。實施例6:淀粉降解譜對制備于50mM乙酸緩沖液,1mMCaCl2,pH6.0(煮沸3分鐘以溶解淀粉)中的5%(重量百分比)蠟質(zhì)玉米淀粉(waxycornstarch)(Cerestar蠟質(zhì)玉蜀黍0401)進行淀粉降解譜分析。以0.2mg酶/g干物質(zhì)的量,向1ml底物加入如實施例2所制備的純化的酶,并將混合物在50。C溫育24小時。加入一滴濃HC1,并將樣品在IO(TC溫育15分鐘使酶失活。通過0.22微米濾器過濾樣品,并使用BIO-RADAminexHPX-42A柱(Cat.nr.125-0097),與1套BIO匿RADMicro-GuardDeashingcartridge(脫灰筒)(目錄號125-0118)相適合的BIO-RADDeashingHolder(支持器)(Cat.nr.125-0139),在WatersHPLC系統(tǒng)上進行分析,用兩次脫氣的蒸餾水洗脫并使用WatersRI檢測器4全測。使用RI檢測評價,降解譜顯示大約相似量的葡萄糖(DP1)、麥芽糖(DP2)、麥芽三糖(DP3)、麥芽四糖(DP4)、麥芽五糖(DP5)、麥芽六糖(DP6)和麥芽七糖(DP7),并剩余大量的(substantialamount)較大的糊精(〉DP10)。權(quán)利要求1.具有α-淀粉酶活性的分離的多肽,其選自下組(a)多肽,其具有與SEQIDNO2的氨基酸1至719有至少65%同一性的氨基酸序列;(b)多肽,其由在低嚴(yán)緊條件下與以下序列雜交的多核苷酸編碼(i)SEQIDNO1的核苷酸97至2256,或(ii)(i)的互補鏈;和(c)多肽,其具有通過取代(特別是保守取代)、缺失和/或插入一個或多個氨基酸而由SEQIDNO2的氨基酸1至719得到的氨基酸序列。2.權(quán)利要求1的多肽,其具有與SEQIDNO:2的氨基酸1至719有至少95%同一性的氨基酸序列。3.權(quán)利要求1或2的多肽,其具有包含SEQIDNO:2的氨基S臾1至719或由SEQIDNO:2的氨基酸1至719組成的氨基酸序列。4.分離的多核苷酸,其包含編碼權(quán)利要求1-3中任一項的多肽的核苷酸序列。5.分離的多核苷酸,其編碼具有a-淀粉酶活性的多肽,所述多核苷酸選自下組a)多核苷酸,其與下述核苷S交序列具有至少60%同一性(i)SEQIDNO:1的核芬酸97至2256,或(ii)(i)的互補《連;和b)多核苷酸,其在中嚴(yán)緊條件下與以下序列雜交(i)SEQIDNO:1的核芬酸97至2256,或(ii)(i)的互補鏈。6.核酸構(gòu)建體,其包含權(quán)利要求4或5的多核苷酸,所述多核苷酸與指導(dǎo)所述多肽在表達(dá)宿主中產(chǎn)生的一個或多個調(diào)控序列可操作地連接。7.重組表達(dá)載體,其包含權(quán)利要求6的核酸構(gòu)建體。8.重組宿主細(xì)胞,其包含權(quán)利要求6的核酸構(gòu)建體或權(quán)利要求7的載體。9.用于產(chǎn)生權(quán)利要求1-3中任一項的多肽的方法,其包括(a)在有益于所述多肽產(chǎn)生的條件下培養(yǎng)權(quán)利要求8的重組宿主細(xì)胞;和(b)回收所述多肽。10.權(quán)利要求1-3中任一項的多肽用于淀粉液化、紡織品脫漿、紙和紙漿工業(yè)中的淀粉修飾,用于釀造、乙醇生產(chǎn)或烘培的用途。11.用于產(chǎn)生麥芽糊精的方法,其包括將淀粉或淀粉水解物與權(quán)利要求1-3中任一項的多肽一起溫育,從而水解淀粉或淀粉水解物中的a-l,4鍵。全文摘要本發(fā)明涉及具有α-淀粉酶活性的分離的多肽和編碼所述多肽的分離的多核苷酸。本發(fā)明還涉及包含所述多核苷酸的核酸構(gòu)建體、載體和宿主細(xì)胞,以及用于制備和使用所述多肽的方法。文檔編號C12N9/28GK101600794SQ200880003832公開日2009年12月9日申請日期2008年1月31日優(yōu)先權(quán)日2007年2月1日發(fā)明者安德斯·維克索-尼爾森,馬丁·伯徹特申請人:諾維信公司