專利名稱::具有阿拉伯呋喃糖苷酶活性的多肽及其編碼多核苷酸的制作方法具有阿拉伯呋喃糖苷酶活性的多肽及其編碼多核苷酸涉及序列表本申請含有計算機(jī)可讀形式的序列表。通過提述而將計算機(jī)可讀形式并入本文。涉及生物材料的保藏本申請含有對生物材料的保藏的涉及,通過提述而將所述保藏并入本文。發(fā)明領(lǐng)域本發(fā)明涉及具有α-L-阿拉伯呋喃糖苷酶活性的分離的多肽和編碼該多肽的分離的多核苷酸。本發(fā)明還涉及包含所述多核苷酸的核酸構(gòu)建體、載體、和宿主細(xì)胞以及生成和使用所述多肽的方法。
背景技術(shù):
:一般而言,植物細(xì)胞壁多糖構(gòu)成90%的植物細(xì)胞壁,并且可以分成三組纖維素、半纖維素和果膠。纖維素代表細(xì)胞壁多糖的主要成分。半纖維素是植物細(xì)胞壁的第二豐富的成分。主要的半纖維素聚合物是木聚糖。植物細(xì)胞壁中存在的木聚糖結(jié)構(gòu)可以隨其起源而顯著不同,但是它們總含有β-1,4-連接的D-木糖主鏈。β-1,4-連接的D-木糖主鏈可以用各種側(cè)基,諸如L-阿拉伯糖、D-半乳糖、乙?;?、阿魏?;?、對香豆酰基和葡糖醛酸殘基取代。對木聚糖主鏈的生物降解依賴于兩類酶內(nèi)切木聚糖酶和β-木糖苷酶。內(nèi)切木聚糖酶(EC3.2.1.8)將木聚糖主鏈切割成較小的寡糖,其能被β-木糖苷酶(EC3.2.1.37)進(jìn)一步降解成木糖。木聚糖降解中牽涉的其它酶包括例如乙酰木聚糖酯酶、阿拉伯糖酶、α-L-阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、阿魏酸酯酶、和對香豆酸酯酶。Kaji和Tagawa,1970,Biochim.Biophys.Acta207456-464描述了來自黑曲霉(Aspergillusniger)的α-L-阿拉伯呋喃糖苷酶的純化、結(jié)晶和氨基酸組成。Kaji.和Yoshihara,1971,Biochim.Biophys.Acta250367-371描述了來自羅耳伏革菌(Corticiumrolfsii)的α-L-阿拉伯呋喃糖苷酶的特性。Tagawa和Kaji,1969,Carbohydr.Res.11293-301描述了含有L-阿拉伯糖的多糖的制備和α-L-阿拉伯呋喃糖苷酶對該多糖的作用。Filho等,1996,Appl.Environ.Microbiol.62:168_173公開了來自膠囊青霉(Penicilliumcapsulatum)的兩種α-L-阿拉伯呋喃糖苷酶的純化和表征。WO96/06935公開了來自黑曲霉的阿拉伯木聚糖降解酶。WO2006/125438描述了膠囊青霉α-L-阿拉伯呋喃糖苷酶及其多核苷酸。本發(fā)明涉及具有α-L-阿拉伯呋喃糖苷酶活性的多肽和編碼該多肽的多核苷酸。發(fā)明概述本發(fā)明涉及具有α-L-阿拉伯呋喃糖苷酶活性的分離的多肽,其選自下組(a)包含氨基酸序列的多肽,所述氨基酸序列與SEQIDNO2的成熟多肽具有至少70%序列同一性;(b)由多核苷酸編碼的多肽,所述多核苷酸在至少中-高嚴(yán)格條件下與SEQIDNO1的成熟多肽編碼序列或其全長互補(bǔ)鏈雜交;(c)由多核苷酸編碼的多肽,所述多核苷酸包含與SEQIDNO:1的成熟多肽編碼序列具有至少70%序列同一性的核苷酸序列;和(d)SEQIDNO:2的成熟多肽的包含取代、缺失和/或插入一個或多個(數(shù)個)氨基酸的變體。本發(fā)明還涉及編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽的分離的多核苷酸,其選自下組(a)編碼包含氨基酸序列的多肽的多核苷酸,所述氨基酸序列與SEQIDNO2的成熟多肽具有至少70%序列同一性;(b)多核苷酸,其在至少中_高嚴(yán)格條件下與SEQIDNO1的成熟多肽編碼序列或其全長互補(bǔ)鏈雜交;(c)多核苷酸,其包含與SEQIDNO=I的成熟多肽編碼序列具有至少70%序列同一性的核苷酸序列;和(d)編碼變體的多核苷酸,所述變體為SEQIDNO:2的成熟多肽的包含取代、缺失、和/或插入一個或多個(數(shù)個)氨基酸的變體。本發(fā)明還涉及包含所述多核苷酸的核酸構(gòu)建體、重組表達(dá)載體、重組宿主細(xì)胞,及生成具有α-L-阿拉伯呋喃糖苷酶活性的多肽的方法。本發(fā)明還涉及抑制細(xì)胞中多肽的表達(dá)的方法,包括對所述細(xì)胞施用雙鏈RNA(dsRNA)分子或者在所述細(xì)胞中表達(dá)雙鏈RNA(dsRNA)分子,其中所述dsRNA包含本發(fā)明的多核苷酸的亞序列。本發(fā)明還涉及此類雙鏈抑制性RNA(dsRNA)分子,其中任選地,所述dsRNA是siRNA或miRNA分子。本發(fā)明還涉及用于降解包含木聚糖的材料的方法。本發(fā)明還涉及包含分離的多核苷酸的植物,所述分離的多核苷酸編碼所述具有α-L-阿拉伯呋喃糖苷酶活性的多肽。本發(fā)明還涉及生成所述具有α-L-阿拉伯呋喃糖苷酶的多肽的方法,包括(a)在有益于所述多肽生成的條件下培養(yǎng)轉(zhuǎn)基因植物或植物細(xì)胞,所述轉(zhuǎn)基因植物或植物細(xì)胞包含編碼所述具有α-L-阿拉伯呋喃糖苷酶活性的多肽的多核苷酸;并(b)回收所述多肽。本發(fā)明進(jìn)一步涉及核酸構(gòu)建體,其包含編碼蛋白質(zhì)的基因,其中所述基因與編碼信號肽的核苷酸序列可操作連接,所述信號肽包含SEQIDNO:2的氨基酸1至17,或由SEQIDNO2的氨基酸1至17組成,其中所述基因?qū)τ谒龊塑账嵝蛄卸允峭鈦淼?。附圖簡述圖IA和圖IB顯示了家族62特異腐質(zhì)霉(Humicolainsolens)DSM1800α-L-阿拉伯呋喃糖苷酶的基因組DNA序列和推導(dǎo)的氨基酸序列(分別為SEQIDNO:1和2)。圖2顯示了ρ匪ar4的限制圖譜。圖3顯示了pHinsGH62A的限制圖譜。定義α-L-阿拉伯呋喃糖苷酶活性術(shù)語“α_L_阿拉伯呋喃糖苷酶活性”在本文中定義為α-L-阿拉伯呋喃糖苷阿拉伯呋喃水解酶活性(EC3.2.1.55),其催化對α_L_阿拉伯糖苷中的末端非還原性α-L-阿拉伯呋喃糖苷殘基的水解。該酶活性對α-L-阿拉伯呋喃糖苷、含有(1,3)_和/或(1,5)_鍵的α-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶也稱為阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶或α-L-阿拉伯聚糖酶。就本發(fā)明而言,根據(jù)下文所描述的方法或?qū)嵤├?0中所描述的方法來測定α-L-阿拉伯呋喃糖苷酶活性。本發(fā)明的多肽具有SEQIDNO2的成熟多肽的α-L-阿拉伯呋喃糖苷酶活性的至少20%,優(yōu)選至少40%,更優(yōu)選至少50%,更優(yōu)選至少60%,更優(yōu)選至少70%,更優(yōu)選至少80%,甚至更優(yōu)選至少90%,最優(yōu)選至少95%,并且甚至最優(yōu)選至少100%。特定阿拉伯木聚糖寡糖的制備。通過將IOOml0.IM乙酸鹽ρΗ6.0緩沖液中的Ig水不溶性小麥阿拉伯木聚糖(Megazyme,Bray,CountyWicklow,愛爾蘭)與每kg水不溶性小麥阿拉伯木聚糖6.67gSHEARZYME(棘孢曲霉(Aspergillusaculeatus)GH10內(nèi)切-1,4-β-木聚糖酶,NovozymesA/S,BagSV出rd,丹麥)一起于30°C溫育2小時來制備含有末端(1—3)連接的阿拉伯糖基基團(tuán)的寡糖。通過將IOOml0.IM乙酸鈉ρΗ6.0中的Ig水不溶性小麥阿拉伯木聚糖與每kg水不溶性小麥阿拉伯木聚糖0.03gPENTOPANMONO(疏棉狀嗜熱霉(Thermomyceslanuginosus)GHll內(nèi)切_1,4_β-木聚糖酶;NovozymesA/S,Bagsvasrd,丹麥)一起于30°C溫育2小時來制備含有內(nèi)部(1—3)連接的阿拉伯糖基基團(tuán)的寡糖。通過將IOOml0.IM乙酸鈉ρΗ6.0中的Ig水不溶性小麥阿拉伯木聚糖與每kg水不溶性小麥阿拉伯木聚糖0.03gPENTOPANMONO和每kg水溶性小麥阿拉伯木聚糖0.03gα-L-阿拉伯呋喃糖苷酶一起于30°C溫育2小時來制備含有內(nèi)部(1—2)連接的阿拉伯糖基基團(tuán)的寡糖。為了停止酶促反應(yīng),于100°c加熱混合物10分鐘。將阿拉伯木寡糖(arabinoxylo-oligosaccharide)在旋轉(zhuǎn)蒸發(fā)器上濃縮,并通過1H-NMR來評估。最佳反應(yīng)條件的測定。在雙因素Box-Behnken響應(yīng)面設(shè)計模板(Montgomery,2001,Designandanalysisofexperiments.Wiley,NewYork)中評估α-L-阿拉伯呋喃糖苷酶的最佳反應(yīng)條件。每個模板包含ρΗ(3-7)和反應(yīng)溫度(30-70°C)的數(shù)種不同組合,具有3個中心點(with3centerpoints)。將水溶性小麥阿拉伯木聚糖(0.002g;Megazyme,Bray,CountyWicklow,愛爾蘭)在2ml去離子水中溶解。然后將溶液與每kg水溶性小麥阿拉伯木聚糖每次測定0.Ig酶蛋白一起溫育。反應(yīng)正好24小時后取樣,并于100°C立即加熱10分鐘以停止酶反應(yīng)。然后以20,OOOxg離心樣品10分鐘,并通過HPAEC分析在上清液中測定阿拉伯糖水平。所報告的數(shù)值按每g小麥阿拉伯木聚糖mg計。α-L-阿拉伯呋喃糖苷酶的作用模式。將α-L-阿拉伯呋喃糖苷酶于40°C添加至Iml0.IM乙酸鈉ρΗ6.0中的0.Olg水溶性小麥阿拉伯木聚糖、0.Olg含有末端(1—3)連接的阿拉伯糖基基團(tuán)的寡糖、0.Olg含有內(nèi)部(1—3)連接的阿拉伯糖基基團(tuán)的寡糖、或0.Olg含有內(nèi)部(1—2)連接的阿拉伯糖基基團(tuán)的寡糖達(dá)2小時。于100°C使酶促反應(yīng)失活10分鐘。將樣品在旋轉(zhuǎn)蒸發(fā)器上濃縮,并通過1H-NMR來分析。HPAEC0將水解產(chǎn)物(10μ1)施用至裝配有與CARB0PACPAl預(yù)柱(4x50mm)組合的CARB0PACPAl保護(hù)柱(4x250mm)(DionexCorporation,Sunnyvale,CA,USA)的BioLC系統(tǒng)(DionexCorporation,Sunnyvale,CA,USA)上。以每分鐘Iml的流速用IOmMKOH等度分離阿拉伯糖15分鐘。通過脈沖電化學(xué)檢測器以脈沖安培計量檢測模式檢測阿拉伯糖。電極電壓編程為+0.IV(t=0-0.4s)至-2.OV(t=0.41-0.42s)至0.6V(t=0.43s)和最終的-0.IV(t=0.44-0.50s),期間級分t=0.2-0.4s所得的信號。使用阿拉伯糖(Merck,Darmstadt,德國)作為標(biāo)準(zhǔn)品。1H-NMR分析。從99.9%D2O凍干所有降解產(chǎn)物兩次,并在99.9%D2O中再溶解。對一些水解產(chǎn)物進(jìn)行透析(Spectra/Por膜截留分子量1000)以在譜分析之前除去游離的阿拉伯糖。在以400MHz操作且裝備有4-核自動可變換探針(4-nucleusauto-switchableprobe)的Varian汞-VX儀中于30°C記錄1H-匪R譜。在128-512次掃描中收集數(shù)據(jù),并使用HDO信號作為參照信號(4.67ppm)。含有木聚糖的材料術(shù)語“含有木聚糖的材料”在本文中定義為任何包含木聚糖作為成分的材料。木聚糖是含有β-1,4-連接的木糖殘基主鏈的植物細(xì)胞壁多糖。一般而言,4-0-甲基葡糖醛酸和阿拉伯糖的側(cè)鏈與乙酰基和阿魏?;鶊F(tuán)一起以不同量存在。木聚糖是半纖維素的一種主要成分。家族62或家族GH62術(shù)語“家族62”或“家族GH62”或“GH62”在本文中定義為根據(jù)HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309_316,及HenrissatandBairoch,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316695-696屬于糖苷水解酶家族62的多肽。分離的多肽如本文中所使用的,術(shù)語“分離的多肽”指自來源分離的多肽。在一個優(yōu)選的方面,如通過SDS-PAGE所測定的,多肽為至少1%純,優(yōu)選至少5%純,更優(yōu)選至少10%純,更優(yōu)選至少20%純,更優(yōu)選至少40%純,更優(yōu)選至少60%純,甚至更優(yōu)選至少80%純,并且最優(yōu)選至少90%純。基本上純的多肽術(shù)語“基本上純的多肽”在本文表示多肽制備物,所述多肽制備物含有按重量計至多10%,優(yōu)選至多8%,更優(yōu)選至多6%,更優(yōu)選至多5%,更優(yōu)選至多4%,更優(yōu)選至多3%,甚至更優(yōu)選至多2%,最優(yōu)選至多1%,并且甚至最優(yōu)選至多0.5%的與其天然或重組結(jié)合的(associated)的其它多肽材料。因此,優(yōu)選所述基本上純的多肽是按存在于制備物中的全部多肽材料的重量計至少92%純,優(yōu)選至少94%純,更優(yōu)選至少95%純,更優(yōu)選至少96%純,更優(yōu)選至少96%純,更優(yōu)選至少97%純,更優(yōu)選至少98%純,甚至更優(yōu)選至少99%純,最優(yōu)選至少99.5%純,并且甚至最優(yōu)選100%純。本發(fā)明的多肽優(yōu)選處于基本上純的形式,即所述多肽制備物基本上(essentially)沒有與其天然或重組結(jié)合的其它多肽材料。例如,這能夠通過以下實現(xiàn)通過公知的重組方法或由經(jīng)典純化方法制備多肽。成熟多肽術(shù)語“成熟多肽”在本文中定義為具有α-L-阿拉伯呋喃糖苷酶活性的多肽,所述多肽以其翻譯和任何翻譯后修飾之后的最終形式存在,所述修飾諸如N端加工、C端截短、糖基化、磷酸化等。在一個優(yōu)選的方面,成熟多肽是基于SignalP程序的SEQIDNO2的氨基酸18至387,所述SignalP程序預(yù)測SEQIDNO2的氨基酸1至17是信號肽。成熟多肽編碼序列術(shù)語“成熟多肽編碼序列”在本文中定義為編碼具有α-L-阿拉伯呋喃糖苷酶活性的成熟多肽的核苷酸序列。在一個優(yōu)選的方面,成熟多肽編碼序列是基于SignalP程序的SEQIDNO1的核苷酸52至1161,所述SignalP程序預(yù)測SEQIDΝ0:1的核苷酸1至51編碼信號肽。同一性參數(shù)“同一性”描述兩個氨基酸序列之間或兩個核苷酸序列之間的相關(guān)性。7就本發(fā)明而言,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48443-453)來測定兩個氨基酸序列之間的序列同一性程度,如EMBOSS包(EMBOSSTheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsinGenetics16:276-277)的Needle程序(優(yōu)選第3·0.0或其后版本)中所執(zhí)行的。所使用的任選參數(shù)是缺口開放罰分10,缺口延伸罰分0.5,和EBL0SUM62(BL0SUM62的EMBOSS形式)取代矩陣。使用Needle標(biāo)記為“最高同一性(longestidentity)”的輸出結(jié)果(使用-nobrief選項獲得)作為百分比同一性,并計算如下(相同的殘基XlOO)/(比對長度-比對中缺口的總數(shù))就本發(fā)明而言,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,見上文)來測定兩個脫氧核糖核苷酸序列之間的序列同一性程度,如EMBOSS包(EMBOSS=TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,見上文)的Needle程序(優(yōu)選第3.0.0或其后版本)中所執(zhí)行的。所使用的任選參數(shù)是缺口開放罰分10,缺口延伸罰分0.5,和EDNAFULL(NCBINUC4.4的EMBOSS形式)取代矩陣。使用Needle標(biāo)記為“最高同一性”的輸出結(jié)果(使用-nobrief選項獲得)作為百分比同一性,并計算如下(相同的脫氧核糖核苷酸XlOO)/(比對長度-比對中缺口的總數(shù))同源序列術(shù)語“同源序列”在本文中定義為在用SEQIDNO:2的特異腐質(zhì)霉α-L-阿拉伯呋喃糖苷酶或其成熟多肽進(jìn)行的tfasty搜索(Pearson,W.R.,1999,于BioinformaticsMethodsandProtocols,S.Misener禾口S.A.Krawetz編,第185-219頁)中E值(或期望值)小于0.001的預(yù)測蛋白質(zhì)。多肽片段術(shù)語“多肽片段”在本文中定義為從SEQIDNO:2的成熟多肽或其同源序列的氨基和/或羧基末端缺失一個或多個(數(shù)個)氨基酸的多肽;其中所述片段具有α-L-阿拉伯呋喃糖苷酶活性。在一個優(yōu)選的方面,片段含有SEQIDNO:2的成熟多肽或其同源序列的至少310個氨基酸殘基,更優(yōu)選至少330個氨基酸殘基,并且最優(yōu)選至少350個氨基酸殘基。亞序列術(shù)語“亞序列(subsequence)”在本文中定義為從SEQIDNO1的成熟多肽編碼序列或其同源序列的5’和/或3’端缺失一個或多個(數(shù)個)核苷酸的核苷酸序列;其中所述亞序列編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽片段。在一個優(yōu)選的方面,亞序列含有SEQIDNO:1的成熟多肽編碼序列或其同源序列的至少930個核苷酸,更優(yōu)選至少990個核苷酸,并且最優(yōu)選至少1050個核苷酸。等位變體(allelicvariant)術(shù)語“等位變體”在本文中表示占據(jù)相同染色體基因座的基因的任何兩種或兩種以上可選形式。等位變異通過突變天然地發(fā)生,并且可導(dǎo)致種群內(nèi)的多態(tài)性。基因突變可以是沉默的(在編碼的多肽中無變化)或可以編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。分離的多核苷酸如本文中所使用的,術(shù)語“分離的多核苷酸”指自來源分離的多核苷酸。在一個優(yōu)選的方面,如通過瓊脂糖電泳所測定的,多核苷酸為至少1%純,優(yōu)選至少5%純,更優(yōu)選至少10%純,更優(yōu)選至少20%純,更優(yōu)選至少40%純,更優(yōu)選至少60%純,甚至更優(yōu)選至少80%純,并且最優(yōu)選至少90%純?;旧霞兊亩嗪塑账崛绫疚闹兴褂玫模g(shù)語“基本上純的多核苷酸”指沒有其它外來的或不期望的核苷酸的多核苷酸制備物,并且所述多核苷酸制備物處于適合于在8遺傳工程的蛋白質(zhì)生產(chǎn)體系中使用的形式。因此,基本上純的多核苷酸含有按重量計至多10%,優(yōu)選至多8%,更優(yōu)選至多6%,更優(yōu)選至多5%,更優(yōu)選至多4%,更優(yōu)選至多3%,甚至更優(yōu)選至多2%,最優(yōu)選至多1%,并且甚至最優(yōu)選至多0.5%的與其天然或重組結(jié)合的其它多核苷酸材料。然而,基本上純的多核苷酸可以包括天然存在的5’和3’非翻譯區(qū),例如啟動子和終止子。優(yōu)選基本上純的多核苷酸是按重量計至少90%純,優(yōu)選至少92%純,更優(yōu)選至少94%純,更優(yōu)選至少95%純,更優(yōu)選至少96%純,更優(yōu)選至少97%純,甚至更優(yōu)選至少98%純,最優(yōu)選至少99%,并且甚至最優(yōu)選至少99.5%純的。本發(fā)明所述多核苷酸優(yōu)選為基本上純的形式,即所述多核苷酸制備物基本上沒有與其天然或重組結(jié)合的其它多核苷酸材料。所述多核苷酸可以是基因組、cDNA、RNA、半合成、合成來源的,或它們的任何組I=Iο編碼序列在本文中使用時,術(shù)語“編碼序列”指直接指定其蛋白質(zhì)產(chǎn)物的氨基酸序列的核苷酸序列。編碼序列的邊界通常由讀碼框決定,所述讀碼框通常以ATG起始密碼子或可選的起始密碼子例如GTG和TTG開始,并且以終止密碼子例如TAA、TAG和TGA結(jié)束。編碼序列可以是DNA、cDNA、合成的或重組的核苷酸序列。cDNA:術(shù)語“cDNA”在本文中定義為能夠通過反轉(zhuǎn)錄從得自真核細(xì)胞的成熟的、已剪接的mRNA分子制備的DNA分子。cDNA缺少可存在于相應(yīng)基因組DNA中的內(nèi)含子序列。起始的、初級的RNA轉(zhuǎn)錄物是mRNA的前體,其通過一系列的步驟加工然后作為成熟的已剪接的mRNA出現(xiàn)。這些步驟包括通過稱作剪接的過程除去內(nèi)含子序列。因而源自mRNA的cDNA缺乏任何內(nèi)含子序列。核酸構(gòu)建體如本文中所使用的,術(shù)語“核酸構(gòu)建體”指單鏈或雙鏈的核酸分子,所述核酸分子分離自天然存在的基因,或所述核酸分子以本來不存在于(nototherwiseexist)自然界中的方式修飾以含有核酸的區(qū)段,或所述核酸分子是合成的。當(dāng)所述核酸構(gòu)建體含有表達(dá)本發(fā)明的編碼序列所需的調(diào)控序列時,術(shù)語核酸構(gòu)建體與術(shù)語“表達(dá)盒”同義。調(diào)控序列(controlsequence)術(shù)語“調(diào)控序列”在本文定義為包括表達(dá)編碼本發(fā)明多肽的多核苷酸所必需的所有組分。各調(diào)控序列對于編碼所述多肽的核苷酸序列可以是天然的或外來的,或各調(diào)控序列對于彼此可以是天然的或外來的。這些調(diào)控序列包括但不限于前導(dǎo)序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉(zhuǎn)錄終止子。最少的情況,調(diào)控序列包括啟動子和轉(zhuǎn)錄和翻譯的終止信號。調(diào)控序列可以和用于引入特異性限制位點的接頭一起提供,所述特異性限制位點促進(jìn)調(diào)控序列與編碼多肽的核苷酸序列編碼區(qū)的連接??刹僮鬟B接的術(shù)語“可操作連接的”在本文表示這樣的構(gòu)型,其中將調(diào)控序列置于相對于多核苷酸序列的編碼序列的適當(dāng)位置,使得調(diào)控序列指導(dǎo)多肽編碼序列的表達(dá)。表達(dá)術(shù)語“表達(dá)”包括涉及多肽產(chǎn)生的任何步驟,其包括但不限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾和分泌。表達(dá)載體術(shù)語“表達(dá)載體”在本文定義為線性的或環(huán)狀的DNA分子,其包含編碼本發(fā)明多肽的多核苷酸,并且所述多核苷酸與提供用于其表達(dá)的額外核苷酸可操作連接。宿主細(xì)胞如本文中所使用的,術(shù)語“宿主細(xì)胞”包括任何細(xì)胞類型,所述細(xì)胞類型對于使用包含本發(fā)明多核苷酸的核酸構(gòu)建體或表達(dá)載體的轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)等是易感的(susceptible)。修飾術(shù)語“修飾”在本文中指對由SEQIDNO2的成熟多肽組成的多肽或其同源序列的任何化學(xué)修飾,以及對編碼所述多肽的DNA的遺傳操作。所述修飾可以是一個或多個(數(shù)個)氨基酸的取代、缺失和/或插入以及一個或多個(數(shù)個)氨基酸側(cè)鏈的置換。人工變體在本文中使用時,術(shù)語“人工變體”指具有α-L-阿拉伯呋喃糖苷酶活性的多肽,所述多肽由表達(dá)SEQIDNO:1的成熟多肽編碼序列或其同源序列的修飾的核苷酸序列的生物體產(chǎn)生。所述修飾的核苷酸序列通過人為干預(yù)(humanintervention),通過修飾公開于SEQIDNO1的多核苷酸序列或它們的同源序列來獲得。發(fā)明詳述具有α-L-阿拉伯呋喃糖苷酶活性的多肽在第一個方面,本發(fā)明涉及包含氨基酸序列的分離的多肽,所述氨基酸序列與SEQIDNO2的成熟多肽具有優(yōu)選至少70%,更優(yōu)選至少75%,更優(yōu)選至少80%,更優(yōu)選至少85%,甚至更優(yōu)選至少90%,最優(yōu)選至少95%,并且甚至最優(yōu)選至少96%,至少97%,至少98%,或至少99%的序列同一性程度,所述多肽具有α-L-阿拉伯呋喃糖苷酶活性(下文中的“同源多肽”)。在一個優(yōu)選的方面,所述同源多肽具有氨基酸序列,其與SEQIDΝ0:2的成熟多肽相差十個氨基酸,優(yōu)選相差五個氨基酸,更優(yōu)選相差四個氨基酸,甚至更優(yōu)選相差三個氨基酸,最優(yōu)選相差兩個氨基酸,并且甚至最優(yōu)選相差一個氨基酸。本發(fā)明的多肽優(yōu)選包含SEQIDNO2的氨基酸序列或其等位變體;或它們的具有α-L-阿拉伯呋喃糖苷酶活性的片段。在一個優(yōu)選的方面,多肽包含SEQIDNO2的氨基酸序列。在另一個優(yōu)選方面,多肽包含SEQIDNO:2的成熟多肽。在另一個優(yōu)選方面,多肽包含SEQIDNO:2的氨基酸18至387,或其等位變體;或它們的具有α-L-阿拉伯呋喃糖苷酶活性的片段。在另一個優(yōu)選方面,多肽包含SEQIDNO:2的氨基酸18至387。在另一個優(yōu)選的方面,多肽由SEQIDNO:2的氨基酸序列或其等位變體;或它們的具有α-L-阿拉伯呋喃糖苷酶活性的片段組成。在另一個優(yōu)選的方面,多肽由SEQIDNO:2的氨基酸序列組成。在另一個優(yōu)選方面,多肽由SEQIDNO:2的成熟多肽組成。在另一個優(yōu)選的方面,多肽由SEQIDNO2的氨基酸18至387或其等位變體;或它們的具有α-L-阿拉伯呋喃糖苷酶活性的片段組成。在另一個優(yōu)選的方面,多肽由SEQIDNO2的氨基酸18至387組成。在第二個方面,本發(fā)明涉及具有α-L-阿拉伯呋喃糖苷酶活性的分離的多肽,所述分離的多肽由多核苷酸編碼,所述多核苷酸在優(yōu)選非常低的嚴(yán)格條件下,更優(yōu)選低的嚴(yán)格條件下,更優(yōu)選中等嚴(yán)格條件下,更優(yōu)選中_高的嚴(yán)格條件下,甚至更優(yōu)選高的嚴(yán)格條件下,并且最優(yōu)選非常高的嚴(yán)格條件下,與以下雜交(i)SEQIDN0:1的成熟多肽編碼序列,()⑴的亞序列,或(iii)⑴或(ii)的全長互補(bǔ)鏈(J.Sambrook,E.F.Fritsch,禾口T.Maniatis,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。SEQIDNO:1的成熟多肽編碼序列的亞序列含有至少100個連續(xù)的核苷酸或優(yōu)選至少200個連續(xù)的核苷酸。此外,所述亞序列可編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽片段。在一個優(yōu)選的方面,所述互補(bǔ)鏈?zhǔn)荢EQIDNO1的成熟多肽編碼序列的全長互補(bǔ)鏈??梢允褂肧EQIDNO1的核苷酸序列或其亞序列,以及SEQIDNO2的氨基酸序列或其片段來設(shè)計核酸探針以根據(jù)本領(lǐng)域內(nèi)公知的方法從不同屬和種的菌株鑒定和克隆編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽的DNA。具體而言,遵循標(biāo)準(zhǔn)的Southern印跡方法,可將這些探針用于與感興趣的屬或種的基因組或cDNA雜交,以鑒定和從其中分離相應(yīng)的基因。此類探針可明顯短于完整序列,但長度上應(yīng)為至少14,優(yōu)選至少25,更優(yōu)選至少35,并且最優(yōu)選至少70個核苷酸。然而,優(yōu)選所述核酸探針是至少100個核苷酸長度。例如,所述核酸探針的長度可為至少200個核苷酸,優(yōu)選至少300個核苷酸,更優(yōu)選至少400個核苷酸,或最優(yōu)選至少500個核苷酸。甚至可以使用更長的探針,例如,長度是優(yōu)選至少600個核苷酸,更優(yōu)選至少700個核苷酸,甚至更優(yōu)選至少800個核苷酸,或最優(yōu)選至少900個核苷酸的核酸探針。DNA和RNA探針二者均可使用。通常將探針標(biāo)記以探測相應(yīng)的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白標(biāo)記)。本發(fā)明涵蓋此類探針。因此,可以對自此類其它菌株制備的基因組DNA或cDNA文庫篩選DNA,所述DNA與上文所描述的探針雜交并且編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽??梢酝ㄟ^瓊脂糖或聚丙烯酰胺凝膠電泳,或通過其它分離技術(shù)分離來自此類其它菌株的基因組或其它DNA??梢詫碜晕膸斓腄NA或分離的DNA轉(zhuǎn)移至硝酸纖維素或其它合適的載體材料并且固定于其上。為了鑒定與SEQIDNO:1或其亞序列同源的克隆或DNA,優(yōu)選在Southern印跡中使用載體材料。就本發(fā)明而言,雜交指明核苷酸序列在非常低至非常高的嚴(yán)格條件下與經(jīng)標(biāo)記的核酸探針雜交,所述核酸探針對應(yīng)于SEQIDNO1的成熟多肽編碼序列;其全長互補(bǔ)鏈;或它們的亞序列??墒褂美鏧射線片(X-rayfilm)來檢測在這些條件下與核酸探針雜交的分子。在一個優(yōu)選的方面,核酸探針是SEQIDNO:1的成熟多肽編碼序列。在另一個優(yōu)選的方面,核酸探針是SEQIDNO:1的核苷酸52至1161。在另一個優(yōu)選的方面,核酸探針是編碼SEQIDNO:2的多肽的多核苷酸序列,或其亞序列。在另一個優(yōu)選的方面,核酸探針是SEQIDNO:1。在另一個優(yōu)選的方面,核酸探針是質(zhì)粒pHinsGH62A中含有的多核苷酸序列,所述質(zhì)粒pHinsGH62A包含在大腸桿菌(E.coli)NRRLB-50075中,其中所述其多核苷酸序列編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽。在另一個優(yōu)選的方面,核酸探針是質(zhì)粒pHinsGH62A中含有的成熟多肽編碼區(qū),所述質(zhì)粒pHinsGH62A包含在大腸桿菌NRRLB-50075中。對于長度至少100個核苷酸的長探針,將非常低至非常高的嚴(yán)格條件定義為在42°C,在5XSSPE、0.3%SDS、200yg/ml已剪切并且變性的鮭精DNA中,并且對于非常低和低的嚴(yán)格性為25%的甲酰胺、對于中等的和中-高的嚴(yán)格性為35%的甲酰胺、或?qū)τ诟叩暮头浅8叩膰?yán)格性為50%的甲酰胺,遵循標(biāo)準(zhǔn)的Southern印跡法進(jìn)行預(yù)雜交和雜交最佳12至24小時。對于長度為至少100個核苷酸的長探針,使用2XSSC、0.2%SDS優(yōu)選于45°C(非常低的嚴(yán)格性),更優(yōu)選于50°C(低嚴(yán)格性),更優(yōu)選于55°C(中等嚴(yán)格性),更優(yōu)選于60°C(中-高嚴(yán)格性),甚至更優(yōu)選于65°C(高嚴(yán)格性),并且最優(yōu)選于70°C(非常高的嚴(yán)格性)將載體材料最終清洗三次,每次15分鐘。對于長度約15個核苷酸至約70個核苷酸的短探針,將嚴(yán)格條件定義為在比使用根據(jù)Bolton禾口McCarthy(1962,ProceedingsoftheNationalAcademyofSciencesUSA48:1390)的計算算出的Tm低約5°C至約10°C,在0.9MNaCl,0.09MTris-HClpH7.6、6mMEDTA.0.5%NP-40UXDenhardt氏溶液、ImM焦磷酸鈉(sodiumpyrophosphate)、ImM磷酸二氫鈉(sodiummonobasicphosphate),0.ImMATP和0.2mg每ml的酵母RNA中,遵循標(biāo)準(zhǔn)的Southern印跡方法進(jìn)行預(yù)雜交、雜交和雜交后清洗最佳12至24小時。對于長度約15個核苷酸至約70個核苷酸的短探針,將所述載體材料在6XSCC加0.1%SDS中清洗一次15分鐘,并使用6XSSC在比計算的Tm低5°C至10°C的溫度清洗兩次,每次15分鐘。在第三個方面,本發(fā)明涉及由多核苷酸編碼的具有α-L-阿拉伯呋喃糖苷酶活性的分離的多肽,所述多核苷酸包含核苷酸序列或由核苷酸序列組成,所述核苷酸序列與SEQIDNO1的成熟多肽編碼序列具有優(yōu)選至少70%,更優(yōu)選至少75%,更優(yōu)選至少80%,更優(yōu)選至少85%,甚至更優(yōu)選至少90%,最優(yōu)選至少95%,并且甚至最優(yōu)選至少96%,至少97%,至少98%,或至少99%的序列同一性程度,其編碼活性多肽。參見本文的多核苷酸部分。在第四個方面,本發(fā)明涉及人工變體,所述人工變體包含取代、缺失和/或插入一個或多個(數(shù)個)氨基酸的SEQIDNO2的成熟多肽;或其同源序列。優(yōu)選地,氨基酸改變對性質(zhì)是較不重要的(ofaminornature),即保守的氨基酸取代或插入,其不顯著影響蛋白質(zhì)的折疊和/或活性;通常為1至約30個氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸殘基;多至約20-25個殘基的小接頭肽;或通過改變凈電荷或其它功能來促進(jìn)純化的小延伸,諸如多組氨酸束(polyhistidinetract)、抗原性表位或結(jié)合域。保守取代的例子在以下組之內(nèi)堿性氨基酸組(精氨酸、賴氨酸和組氨酸)、酸性氨基酸組(谷氨酸和天冬氨酸)、極性氨基酸組(谷氨酰胺和天冬酰胺)、疏水性氨基酸組(亮氨酸、異亮氨酸和纈氨酸)、芳族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)。通常不改變比活性的氨基酸取代是本領(lǐng)域己知的,并且由例如H.Neurath禾PR.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍發(fā)生的交換是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr>Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe>Ala/Pro>Lys/Arg>Asp/Asn>Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。除了20種標(biāo)準(zhǔn)的氨基酸外,非標(biāo)準(zhǔn)氨基酸(例如4-羥脯氨酸、6-N-甲基賴氨酸、2_氨基異丁酸、異纈氨酸和α-甲基絲氨酸)可以取代野生型多肽的氨基酸殘基。有限數(shù)量的非保守氨基酸、不由遺傳密碼編碼的氨基酸和非天然氨基酸可以取代氨基酸殘基?!胺翘烊话被帷痹诘鞍踪|(zhì)合成后已經(jīng)過修飾,和/或在它們的側(cè)鏈具有不同于標(biāo)準(zhǔn)氨基酸的化學(xué)結(jié)構(gòu)。非天然氨基酸能夠以化學(xué)方法合成,并且優(yōu)選是商業(yè)上可獲得的,包括六氫吡啶羧酸(pipecolicacid)、噻唑烷羧酸(thiazolidinecarboxylicacid)、脫氫脯氨酸、3-和4-甲基脯氨酸和3,3-二甲基脯氨酸?;蛘撸被岣淖兙哂羞@樣的性質(zhì)以使多肽的物理化學(xué)性質(zhì)改變。例如,氨基酸改變可改進(jìn)多肽的熱穩(wěn)定性,改變底物特異性,改變最適PH等??梢愿鶕?jù)本領(lǐng)域已知的方法,諸如定點誘變或丙氨酸掃描誘變(Cunningham和Wells,1989,Science244:1081_1085)來鑒定親本多肽中的必需氨基酸。在后一種技術(shù)中,將單一丙氨酸突變引入到分子中的每個殘基,并且測試所得突變分子的生物學(xué)活性(即,α-L-阿拉伯呋喃糖苷酶活性)以鑒定對于所述分子的活性關(guān)鍵的氨基酸殘基。還可參見Hilton等,1996,J.Biol.Chem.271=4699-4708酶的活性位點或其它生物學(xué)相互作用也能通過對結(jié)構(gòu)的物理分析來測定,如通過以下這些技術(shù)如核磁共振、晶體學(xué)、電子衍射或光親和標(biāo)記,連同推定的接觸位點氨基酸的突變來測定。參見例如deVos等,1992,Science255:306_312;Smith等,1992,J.Mol.Biol.224:899_904;Wlodaver等,1992,F(xiàn)EBSLett.309:59-64。必需氨基酸的身份也能夠從與多肽的同一性分析來推斷,所述多肽與根據(jù)本發(fā)明的多肽相關(guān)??梢允褂靡阎恼T變、重組和/或改組(shuffling)方法,然后是有關(guān)的篩選方法,諸如那些由Reidhaar-Olson禾ΠSauer,1988,Science241:53_57;Bowie禾ΠSauer,1989,Proc.Natl.Acad.Sci.USA86:2152_2156;WO95/17413;或WO95/22625公開的方法來進(jìn)行并測試單個或多個氨基酸取代、缺失和/或插入??梢允褂玫钠渌椒òㄒ族ePCR、噬菌體展示(例如Lowman等,1991,Biochem.3010832-10837;美國專利號5,223,409;WO92/06204)和區(qū)域定向的誘變(Derbyshire等,1986,Gene46145;Ner等,1988,DNA7127)。誘變/改組方法可以與高通量、自動化的篩選方法組合以檢測由宿主細(xì)胞表達(dá)的克隆的、誘變的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。可以從宿主細(xì)胞回收編碼活性多肽的誘變的DNA分子,并且使用本領(lǐng)域內(nèi)標(biāo)準(zhǔn)方法快速測序。這些方法允許快速測定感興趣的多肽中單個氨基酸殘基的重要性,并且可以應(yīng)用于未知結(jié)構(gòu)的多肽。SEQIDNO2的成熟多肽,諸如SEQIDNO2的氨基酸18至387的氨基酸取代、缺失和/或插入的總數(shù)是10,優(yōu)選9,更優(yōu)選8,更優(yōu)選7,更優(yōu)選至多6,更優(yōu)選5,更優(yōu)選4,甚至更優(yōu)選3,最優(yōu)選2,并且甚至最優(yōu)選1。具有α-L-阿拉伯呋喃糖苷酶活性的多肽的來源本發(fā)明具有α-L-阿拉伯呋喃糖苷酶活性的多肽可以獲自任何屬的微生物。就本發(fā)明而言,如本文中所使用的,與給定的來源有關(guān)的術(shù)語“獲自”,應(yīng)當(dāng)意味著核苷酸序列編碼的多肽由所述來源產(chǎn)生,或由其中插入了來自所述來源的核苷酸序列的菌株產(chǎn)生。在一個優(yōu)選的方面,獲自給定來源的多肽是胞外分泌的。本發(fā)明具有α-L-阿拉伯呋喃糖苷酶活性的多肽可以是細(xì)菌多肽。例如,所述多肽可以是具有α-L-阿拉伯呋喃糖苷酶活性的革蘭氏陽性細(xì)菌多肽諸如芽孢桿菌屬(Bacillus)、鏈球菌屬(Str印tococcus)、鏈霉菌屬(Str印tomyces)、葡萄球菌屬(Staphylococcus)、腸球菌屬(Enterococcus)、乳桿菌屬(Lactobacillus)、乳球菌屬(Lactococcus)>It^M(Clostridium)>jft^ifeff^M(Geobacillus)胃屬(Oceanobacillus)多肽;或具有α-L-阿拉伯呋喃糖苷酶活性的革蘭氏陰性細(xì)菌多肽,諸如大腸桿菌(E.coli)、假單胞菌屬(Pseudomonas)、沙門氏菌屬(Salmonella)、彎曲桿菌屬(Campylobacter)lifM(Helicobacter)、黃桿菌屬(Flavobacterium)、梭桿菌屬(Fusobacterium)、泥桿菌屬(Ilyobacter)、奈瑟氏菌屬(Neisseria)或脲原體屬(Ureaplasma)多妝。在一個優(yōu)選的方面,所述多肽是具有ex-L-阿拉伯呋喃糖苷酶活性的嗜堿芽孢桿胃(Bacillusalkalophilus)、Ι定㈱Ii包If胃(Bacillusamyloliquefaciens)、失豆Ii包If菌(Bacillusbrevis)、環(huán)狀芽孢桿菌(Bacilluscirculans)、克勞氏芽孢桿菌(Bacillus13clausii)、凝結(jié)芽孢桿菌(Bacilluscoagulans)、堅強(qiáng)芽孢桿菌(Bacillusfirmus)、燦爛芽孢桿菌(Bacilluslautus)、遲緩芽孢桿菌(Bacilluslentus)、地衣芽孢桿菌(Bacilluslicheniformis)、巨大芽孢桿菌(Bacillusmegaterium)、短小芽孢桿菌(Bacilluspumilus)、嗜熱月旨肪芽孢桿菌(Bacillusstearothermophilus),枯草芽孢桿菌(Bacillussubtilis)或蘇云金芽孢桿菌(Bacillusthuringiensis)多肽。在另一個優(yōu)選的方面,所述多肽是具有α-L-阿拉伯呋喃糖苷酶活性的似馬鏈球菌(Streptococcusequisimilis)、酉良胺鏈球菌(Streptococcuspyogenes)、乳房鏈球菌(Streptococcusuberis)或馬鏈球菌獸痕亞禾中(Streptococcusequisubsp.Zooepidemicus)多月太。在另一個優(yōu)選的方面,所述多肽是具有α-L-阿拉伯呋喃糖苷酶活性的不產(chǎn)色鏈霉菌(Streptomycesachromogenes)、除蟲鏈霉菌(Streptomycesavermitilis)、天藍(lán)鏈霉菌(Streptomycescoelicolor)、灰色鏈霉菌(Streptomycesgriseus)或淺青紫鏈霉菌(Streptomyceslividans)多月太。本發(fā)明具有α-L-阿拉伯呋喃糖苷酶活性的多肽也可以是真菌多肽,并且更優(yōu)選具有α-L-阿拉伯呋喃糖苷酶活性的酵母多肽諸如念珠菌屬(Candida)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)或西洋蓍霉屬(Yarrowia)多肽;或更優(yōu)選具有α-L-阿拉伯呋喃糖苷酶活性的絲狀真菌多肽諸如枝頂孢霉屬(Acremonium)、蘑菇屬(Agaricus)、鏈格孢屬(Alternaria)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、葡萄座腔菌屬(Botryospaeria)、擬賭菌屬(Ceriporiopsis)、毛_殼屬(Chaetomidium)、金抱子菌屬(Chrysosporium)、麥角菌屬(Clavic印s)、旋孢腔菌屬(Cochliobolus)、鬼傘屬(Coprinopsis)、Coptotermes>棒囊殼屬(Corynascus)、β急叢赤殼屬(Cryphonectria)、隱球菌屬(Cryptococcus)、色二孢屬(Diplodia)、黑耳屬(Exidia)、Filibasidium、鐮孢屬(Fusarium)、赤霉屬(Gibberella)、全鞭毛蟲屬(Holomastigotoides)、腐質(zhì)霉屬(Humicola)、奉巴齒菌屬(Irpex)、香燕屬(Lentinula)、小球腔菌屬(Leptospaeria)>梨孢菌屬(Magnaporthe)、Melanocarpus、節(jié)毛菌屬(Meripilus)、毛霉屬Mucor)、毀絲霉屬(Myceliophthora)、新考瑪月旨霄屬(Neocallimastix)、脈抱菌屬(Neurospora)>擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、瘤胃壺菌屬(Piromyces)、Poitrasia,假黑盤菌屬(Pseudoplectania)、假披發(fā)蟲屬(Pseudotrichonympha)、根毛霉屬(Rhizomucor)、裂裙菌屬(Schizophyllum)、節(jié)隔孢屬/柱頂孢屬(Scytalidium)、踝節(jié)菌屬(Talaromyces)、熱子囊菌屬/嗜熱霉屬(Thermoascus)、梭抱殼屬(Thielavia)、彎頸霉屬(Tolypocladium)、木霉屬(Trichoderma)、Trichophaea、輪枝孢屬(Verticillium)、草屬(Volvariella)、或炭角菌屬(Xylaria)多肽。在一個優(yōu)選的方面,所述多肽是具有α-L-阿拉伯呋喃糖苷酶活性的卡爾酵母(Saccharomycescarlsbergensis)、酉良酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克魯弗酵母(Saccharomyceskluyveri)、諾地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多月太。14在另一個優(yōu)選方面,所述多肽是具有α-L-阿拉伯呋喃糖苷酶活性的解纖維枝丁頁抱霉(Acremoniumcellulolyticus)、棘抱曲霉(Aspergillusaculeatus)、^^ffiβ(Aspergillusawamori)Λffiβ(Aspergillusfumigatus)、1ffiβ(Aspergillusfoetidus)、曰本曲霉(Aspergillusjaponicus)、構(gòu)巢曲霉(Sspergillusnidulans)、漂曲霉(Aspergillusniger)、米曲霉(Aspergillusoryzae)、嗜角質(zhì)金抱子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、熱帶金抱子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、租金抱子菌(Chrysosporiumpannicola)、ChrysosporiumqueenslandicumΛChrvsosporiumzonatum、桿抱狀德抱(Fusariumbactridioides)、禾谷德抱(Fusariumcerealis)、庫威,廉抱(Fusariumcrookwellense)、大刀,廉抱(Fusariumculmorum)、禾本禾斗德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、異抱德抱(Fusariumheterosporum)、合歡木德抱(Fusariumnegundi)、尖德抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉紅德抱(Fusariumroseum)、接骨木,廉抱(Fusariumsambucinum)、膚色,廉?包(Fusariumsarcochroum)、擬分枝抱,廉抱(Fusariumsporotrichioides)、硫色鐮?包(Fusariumsulphureum)、圓鐮孢(Fusariumtorulosum)、擬絲孢鐮孢(Fusariumtrichothecioides)、鑲片鐮孢(Fusariumvenenatum)、白囊奉巴齒菌(Irpexlacteus)、^■€β(Mucormiehei)、口f%罾M胃(Myceliophthorathermophila)、粗糙脈孢菌(Neurosporacrassa)、繩狀青霉(Penicilliumfuniculosum)、產(chǎn)紫青霉(Penicilliumpurpurogenum)、黃抱平革菌(Phanerochaetechrysosporium)、Thielaviaachromatica、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭抱殼(Thielaviaaustraleinsis)、Thielaviafimeti、小抱梭抱殼(Thielaviamicrospora)、卵抱梭抱殼(Thielaviaovispora)、Thielaviaperuviana、罾包冑(Thielaviaspededonium)、毛梭抱殼(Thielaviasetosa)、Thielaviasubthermophila、土生梭抱霉(Thielaviaterrestris)、哈茨木毒(Trichodermaharzianum)、康寧木毒(Trichodermakoningii)、長枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或綠色木霉(Trichodermaviride)多月太。在另一個優(yōu)選的方面,所述多肽是灰色腐質(zhì)霉(Humicolagrisea)、特異腐質(zhì)霉或疏棉狀腐質(zhì)霉多肽。在一個更優(yōu)選的方面,所述多肽是具有ex-L-阿拉伯呋喃糖苷酶活性的特異腐質(zhì)霉。在一個最優(yōu)選的方面,所述多肽是具有α-L-阿拉伯呋喃糖苷酶活性的特異腐質(zhì)霉DSM1800多肽,例如包含SEQIDNO2的成熟多肽的多肽。應(yīng)當(dāng)理解的是對于前述的種,本發(fā)明涵蓋完全和不完全階段(perfectmdimperfectstates),和其它分類學(xué)的等同物(equivalent),例如無性型(mamorph),而無論它們已知的種名。本領(lǐng)域熟練技術(shù)人員將容易地識別適合的等同物的同一性。這些種的菌株在許多培養(yǎng)物保藏中心對于公眾能夠容易地取得,所述保藏中心諸如美國典型培養(yǎng)物保藏中心(theAmericanTypeCultureCollection,ATCC)、德意志微生物禾口細(xì)胞培養(yǎng)物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌種保藏中心(CentraalbureauVoorSchimmelcultures,CBS)和農(nóng)業(yè)研究機(jī)構(gòu)專利培養(yǎng)物保藏中心北區(qū)研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter,NRRL)。此外,可以使用上述的探針從其它來源,包括從自然界(例如,土壤、堆肥、水等)分離的微生物鑒定和獲得此類多肽。用于從天然生境(habitat)分離微生物的技術(shù)是本領(lǐng)域內(nèi)公知的。隨后可通過相似地篩選所述微生物的基因組或cDNA文庫來獲得所述多核苷酸。一旦用所述探針檢測到編碼多肽的多核苷酸序列,就可以使用本領(lǐng)域普通技術(shù)人員熟知的技術(shù)將所述多核苷酸分離或克隆(參見例如,Sambrook等,1989,見上文)。本發(fā)明的多肽還包括融合多肽或可切割的融合多肽,其中將另外的多肽融合到所述多肽或其片段的N末端或C末端。通過將編碼另一個多肽的核苷酸序列(或其部分)融合于本發(fā)明的核苷酸序列(或其部分)來產(chǎn)生融合的多肽。產(chǎn)生融合多肽的技術(shù)是本領(lǐng)域已知的,并包括連接編碼多肽的編碼序列以使它們在讀碼框中,并且使融合多肽的表達(dá)在相同啟動子和終止子的控制下。融合多肽還可以包括切割位點。一旦分泌了融合多肽,就切割所述位點,從融合蛋白質(zhì)釋放具有α-L-阿拉伯呋喃糖苷酶活性的多肽。切割位點的例子包括,但不限于,編碼二肽Lys-Arg的Kex2位點(Martin等,2003,J.Ind.Microbiol.Biotechnol.3568-576;Svetina,2000,J.Biotechnol.76245-251;Rasmussen-ffiIsonφ,1997,Appl.Environ.Microbiol.633488-3493;Ward等,1995,Biotechnology13498-503;和Contreras等,1991,Biotechnology9:378_381);Ile_(Glu或Asp)-Gly-Arg位點,其在精氨酸殘基后通過FactorXa蛋白酶切割(Eaton等,1986,Biochem.25:505_512);Asp-Asp-Asp-Asp-Lys位點,其在賴氨酸后通過腸激酶切割(Collins-Racie等,1995,Biotechnology13:982_987);His-Tyr-Glu位點或His-Tyr-Asp位點,其通過GenenaseI切割(Carter等,1989,ProteinsStructure,Function,andGenetics6:240_248);Leu-Val-Pro-Arg-Gly-Ser位點,其在Arg后通過凝血酶切割(Stevens,2003,DrugDiscoveryWorld435-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位點,其在Gln后通過TEV蛋白酶切割(Stevens,2003,見上文);和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位點,其在Gln后通過基因工程形式的人鼻病毒3C蛋白酶切割(Stevens,2003,見上文)。多核苷酸本發(fā)明還涉及分離的多核苷酸,其包含編碼本發(fā)明具有α-L-阿拉伯呋喃糖苷酶活性的多肽的核苷酸序列,或由所述核苷酸序列組成。在一個優(yōu)選的方面,核苷酸序列包含SEQIDNO1或由SEQIDNO=I組成。在另一個更優(yōu)選的方面,核苷酸序列包含大腸桿菌NRRLΒ-50075中所含質(zhì)粒pHinsGH62A中含有的序列,或由該序列組成。在另一個優(yōu)選的方面,核苷酸序列包含SEQIDNO:1的成熟多肽編碼序列或由SEQIDNO:1的成熟多肽編碼序列組成。在另一個優(yōu)選的方面,核苷酸序列包含SEQIDNO:1的核苷酸52至1161或由SEQIDNO:1的核苷酸52至1161組成。在另一個更優(yōu)選的方面,核苷酸序列包含質(zhì)粒pHinsGH62A中含有的成熟多肽編碼序列或由該成熟多肽編碼序列組成,所述質(zhì)粒pHinsGH62A包含在大腸桿菌NRRLB-50075中。本發(fā)明還涵蓋編碼多肽的核苷酸序列,所述多肽包含SEQIDNO:2的氨基酸序列或其成熟多肽,或由SEQIDNO:2的氨基酸序列或其成熟多肽組成;由于遺傳密碼的簡并性,所述核苷酸序列不同于SEQIDNO:1或其成熟多肽編碼序列。本發(fā)明還涉及SEQIDNO:1的亞序列,所述亞序列編碼SEQIDN0:2中具有α-L-阿拉伯呋喃糖苷酶活性的片段。本發(fā)明還涉及突變多核苷酸,所述突變多核苷酸在SEQIDNO1的成熟多肽編碼序列中包含至少一個突變或由具有至少一個突變的SEQIDNO:1的成熟多肽編碼序列組成,其中所述突變核苷酸序列編碼SEQIDNO2的成熟多肽。用于分離或克隆編碼多肽的多核苷酸的技術(shù)是本領(lǐng)域內(nèi)已知的,包括從基因組DNA分離,從cDNA制備,或其組合??赏ㄟ^例如使用熟知的聚合酶鏈?zhǔn)椒磻?yīng)(PCR)或表達(dá)文庫的抗體篩選來檢測具有共享結(jié)構(gòu)特性的克隆DNA片段,從而實現(xiàn)從這種基因組DNA克隆本發(fā)明的多核苷酸。參見例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork0可以使用其它核酸擴(kuò)增方法,諸如連接酶鏈?zhǔn)椒磻?yīng)(LCR)、連接活化轉(zhuǎn)錄(ligatedactivatedtranscription;LAT)和基于核苷酸序列的擴(kuò)增(NASBA)??梢詮母|(zhì)霉屬(Humicola)菌株,或其它或相關(guān)生物體克隆多核苷酸,并且因而可以是例如所述核苷酸序列的多肽編碼區(qū)的等位變體或種變體。本發(fā)明還涉及分離的多核苷酸,其包含下述核苷酸序列或由其組成,所述核苷酸序列與SEQIDNO:1的成熟多肽編碼序列具有優(yōu)選至少70%,更優(yōu)選至少75%,更優(yōu)選至少80%,更優(yōu)選至少85%,甚至更優(yōu)選至少90%,最優(yōu)選至少95%,并且甚至最優(yōu)選至少96%,至少97%,至少98%,或至少99%的序列同一性程度,所述多核苷酸編碼活性多肽。修飾編碼本發(fā)明多肽的核苷酸序列對于合成與所述多肽基本上相似的多肽可為必需的。術(shù)語與所述多肽“基本上相似”指多肽的非天然存在的形式。這些多肽可能以一些工程改造的方式而不同于從其天然來源分離的多肽,例如,比活性、熱穩(wěn)定性、最適PH等方面不同的人工變體??梢栽谧鳛镾EQIDNO:1的成熟多肽編碼序列呈現(xiàn)的核苷酸序列,例如其亞序列的基礎(chǔ)上,和/或通過引入如下核苷酸取代來構(gòu)建變體序列所述取代不產(chǎn)生由核苷酸序列編碼的多肽的另外的氨基酸序列,但是符合意欲產(chǎn)生酶的宿主生物體的密碼子選擇;或者所述取代可產(chǎn)生不同的氨基酸序列。關(guān)于核苷酸取代的概述,參見,例如,F(xiàn)ord等,1991,ProteinExpressionandPurification2一107。對于本領(lǐng)域技術(shù)人員顯而易見的是,這些取代能在對于分子功能重要的區(qū)域之外進(jìn)行,并且仍然產(chǎn)生活性多肽。對于由本發(fā)明的分離的多核苷酸編碼的多肽活性關(guān)鍵的并且因此優(yōu)選不進(jìn)行取代的氨基酸殘基,可以根據(jù)本領(lǐng)域公知的方法,例如定點誘變或丙氨酸掃描誘變(參見,例如,Cunningham和Wells,1989,見上文)來鑒定。在后一種技術(shù)中,將突變引入到分子中的每個帶正電荷的殘基處,并且測試所得突變分子的α-L-阿拉伯呋喃糖苷酶活性,以鑒定對于所述分子的活性關(guān)鍵的氨基酸殘基。底物_酶相互作用的位點也能夠通過分析三維結(jié)構(gòu)來測定,如通過核磁共振分析、晶體學(xué)或光親和標(biāo)記等技術(shù)所測定的(參見,例如,deVos等,1992,見上文;Smith等,1992,見上文;Wlodaver等,1992,見上文)。本發(fā)明還涉及編碼本發(fā)明多肽的分離的多核苷酸,所述分離的多核苷酸在非常低的嚴(yán)格條件下,優(yōu)選低嚴(yán)格條件,更優(yōu)選中等嚴(yán)格條件,更優(yōu)選中_高嚴(yán)格條件,甚至更優(yōu)選高嚴(yán)格條件,并且最優(yōu)選非常高的嚴(yán)格條件下,與以下序列雜交SEQIDNO:1的成熟多肽編碼序列或其全長互補(bǔ)鏈;或它們的等位變體和亞序列(Sambrook等,1989,見上文),如本文所定義的。本發(fā)明還涉及分離的多核苷酸,所述分離的多核苷酸通過以下方法獲得(a)在非常低、低、中等、中-高、高或非常高嚴(yán)格條件下,將DNA的群體與SEQIDNO:1的成熟多17肽編碼序列或其全長互補(bǔ)鏈雜交;和(b)分離雜交的多核苷酸,其編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽。核酸構(gòu)建體本發(fā)明還涉及包含本發(fā)明的分離的多核苷酸的核酸構(gòu)建體,所述分離的多核苷酸與一個或多個(數(shù)個)調(diào)控序列可操作地連接,所述調(diào)控序列在合適的宿主細(xì)胞中在與該調(diào)控序列相容的條件下指導(dǎo)編碼序列的表達(dá)。可以用許多方式操作編碼本發(fā)明多肽的分離的多核苷酸以提供多肽的表達(dá)。依賴于表達(dá)載體,在將多核苷酸的序列插入載體之前對其進(jìn)行操作可能是理想的或必需的。使用重組DNA方法修飾多核苷酸序列的技術(shù)是本領(lǐng)域熟知的。調(diào)控序列可以是適當(dāng)?shù)膯幼有蛄?,其是由用于表達(dá)編碼本發(fā)明多肽的多核苷酸的宿主細(xì)胞識別的核苷酸序列。啟動子序列含有介導(dǎo)多肽的表達(dá)的轉(zhuǎn)錄調(diào)控序列。啟動子可以是在所選的宿主細(xì)胞中顯示轉(zhuǎn)錄活性的任何核苷酸序列,包括突變的、截短的和雜合的啟動子,并且可以從編碼與宿主細(xì)胞同源或異源的胞外或胞內(nèi)多肽的基因獲得。用于指導(dǎo)本發(fā)明的核酸構(gòu)建體轉(zhuǎn)錄,特別是在細(xì)菌宿主細(xì)胞中轉(zhuǎn)錄的合適啟動子的例子是從下述獲得的啟動子大腸桿菌Iac操縱子、天藍(lán)色鏈霉菌(Str印tomycescoelicolor)瓊脂糖酶基因(dagA)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、地衣芽孢桿菌α-淀粉酶基因(amyL)、嗜熱脂肪芽孢桿菌產(chǎn)麥芽淀粉酶基因(amyM)、解淀粉芽孢桿菌α-淀粉酶基因(amyQ)、地衣芽孢桿菌青霉素酶基因(penP)、枯草芽孢桿菌xylA和xylB基因和原核β-內(nèi)酰胺酶基因(Villa-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727_3731),以及tac啟動子(DeBoer等,1983,ProceedingsoftheNationalAcademyofSciencesUSA80:21-25)。另外的啟動子在"Usefulproteinsfromrecombinantbacteria,,于ScientificAmerican,1980,242:74_94中;禾口在Sambrook等,1989,見上文中描述。用于指導(dǎo)本發(fā)明的核酸構(gòu)建體在絲狀真菌宿主細(xì)胞中轉(zhuǎn)錄的合適啟動子的例子是從下列酶的基因獲得的啟動子米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩(wěn)定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構(gòu)酶、構(gòu)巢曲霉乙酰胺酶、鑲片鐮孢淀粉葡糖苷酶(W000/56900)、鑲片鐮孢Daria(WC)00/56900)、鑲片鐮孢Quirm(W000/56900)、尖鐮孢胰蛋白酶樣蛋白酶(W096/00787)、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉纖維二糖水解酶II、里氏木霉內(nèi)切葡聚糖酶I、里氏木霉內(nèi)切葡聚糖酶II、里氏木霉內(nèi)切葡聚糖酶III、里氏木霉內(nèi)切葡聚糖酶IV、里氏木霉內(nèi)切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi啟動子(來自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸異構(gòu)酶基因的啟動子的雜合體);和它們的突變的、截短的和雜合的啟動子。在酵母宿主中,有用的啟動子從如下酶的基因獲得釀酒酵母烯醇化酶(ΕΝ0-1)、釀酒酵母半乳糖激酶(GALl)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH1,ADH2/GAP)、釀酒酵母丙糖磷酸異構(gòu)酶(TPI)、釀酒酵母金屬硫蛋白(CUPl)和釀酒酵母3-磷酸甘油酸激酶。對于酵母宿主細(xì)胞其它有用的啟動子由Romanos等,1992,Yeast8:423_488描述。18調(diào)控序列也可以是合適的轉(zhuǎn)錄終止子序列,是由宿主細(xì)胞識別以終止轉(zhuǎn)錄的序列。所述終止子序列與編碼所述多肽的核苷酸序列的3’末端可操作地連接??梢詫⒃谒x宿主細(xì)胞中有功能的任何終止子用在本發(fā)明中。對于絲狀真菌宿主細(xì)胞優(yōu)選的終止子從如下酶的基因獲得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構(gòu)巢曲霉鄰氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖鐮孢胰蛋白酶樣蛋白酶。對于酵母宿主細(xì)胞優(yōu)選的終止子從如下酶的基因獲得釀酒酵母烯醇化酶、釀酒酵母細(xì)胞色素C(CYCl)和釀酒酵母甘油醛-3-磷酸脫氫酶。對于酵母宿主細(xì)胞其它有用的終止子由Romanos等,1992,見上文描述。調(diào)控序列還可以是合適的前導(dǎo)序列,其是對于宿主細(xì)胞的翻譯重要的mRNA非翻譯區(qū)。前導(dǎo)序列可操作地連接于編碼多肽的核苷酸序列的5’-末端??梢詫⒃谒x宿主細(xì)胞中有功能的任何前導(dǎo)序列用在本發(fā)明中。對于絲狀真菌宿主細(xì)胞優(yōu)選的前導(dǎo)序列從如下酶的基因獲得米曲霉TAKA淀粉酶和構(gòu)巢曲霉丙糖磷酸異構(gòu)酶。對于酵母宿主細(xì)胞合適的前導(dǎo)序列從如下酶的基因獲得釀酒酵母烯醇化酶(ΕΝ0-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)。調(diào)控序列也可以是聚腺苷酸化序列,其是與核苷酸序列的3,末端可操作地連接的序列,并且在轉(zhuǎn)錄時,宿主細(xì)胞將其識別為將聚腺苷殘基添加至轉(zhuǎn)錄的mRNA的信號??梢詫⒃谒x宿主細(xì)胞中有功能的任何聚腺苷酸化序列在本發(fā)明中使用。對于絲狀真菌宿主細(xì)胞優(yōu)選的聚腺苷酸化序列從如下酶的基因獲得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構(gòu)巢曲霉鄰氨基苯甲酸合酶、尖鐮孢胰蛋白酶樣蛋白酶和黑曲霉α-葡糖苷酶。對于酵母宿主細(xì)胞有用的聚腺苷酸化序列由Guo和Sherman,1995,MolecularCellularBiology15:5983_5990描述。調(diào)控序列還可以是信號肽編碼序列,其編碼與多肽的氨基末端相連的氨基酸序列,并且指導(dǎo)編碼的多肽進(jìn)入細(xì)胞分泌途徑。核苷酸序列的編碼序列5’端可固有地包含信號肽編碼序列,其與編碼分泌多肽的編碼序列片段一起天然地連接在翻譯閱讀框中?;蛘?,編碼序列5’端可含有對于所述編碼序列異源的信號肽編碼序列。異源信號肽編碼序列在編碼序列不天然地含有信號肽編碼序列時可為必需的?;蛘?,外源信號肽編碼序列可以簡單地取代天然信號肽編碼序列以增強(qiáng)多肽的分泌。然而,指導(dǎo)表達(dá)的多肽進(jìn)入所選宿主細(xì)胞的分泌途徑(即,分泌至培養(yǎng)基中)的任何信號肽編碼序列可在本發(fā)明中使用。對于細(xì)菌宿主細(xì)胞有效的信號肽編碼序列是從如下酶的基因獲得的信號肽編碼序列芽孢桿菌屬NCIB11837產(chǎn)麥芽糖淀粉酶、嗜熱脂肪芽孢桿菌α-淀粉酶、地衣芽孢桿菌枯草蛋白酶(subtilisin)、地衣芽孢桿菌β-內(nèi)酰胺酶、嗜熱脂肪芽孢桿菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢桿菌prsA。另外的信號肽由Simonen和Palva,1993,MicrobiologicalReviews57109-137描述。對于絲狀真菌宿主細(xì)胞有效的信號肽編碼序列是從如下酶的基因獲得的信號肽編碼序列米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特異腐質(zhì)霉纖維素酶、特異腐質(zhì)霉內(nèi)切葡聚糖酶V和疏棉狀腐質(zhì)霉脂肪酶。對于酵母宿主細(xì)胞有用的信號肽從釀酒酵母α因子和釀酒酵母轉(zhuǎn)化酶的基因獲得。其它有用的信號肽編碼序列由Romanos等,1992,見上文描述。在一個優(yōu)選的方面,信號肽包含SEQIDNO:2的氨基酸1至17或者由SEQIDNO:2的氨基酸1至17組成。在另一個優(yōu)選的方面,信號肽編碼區(qū)包含SEQIDNO1的核苷酸1至51或者由SEQIDNO1的核苷酸1至51組成。調(diào)控序列還可以是前肽編碼序列,其編碼位于多肽氨基末端的氨基酸序列。所得多肽稱為酶原(proenzyme)或前多肽(propolyp印tide)(或在某些情況下稱為酶原(zymogen))0前多肽通常是無活性的并且能夠通過前肽的催化或自催化切割從前多肽轉(zhuǎn)化為成熟活性多肽。可以從枯草芽孢桿菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、釀酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜熱毀絲霉漆酶(W095/33836)的基因獲得前肽編碼序列。當(dāng)信號肽和前肽序列二者均出現(xiàn)在多肽的氨基末端時,將前肽序列置于緊接著(nextto)多肽氨基末端,并且將信號肽序列置于緊接著前肽序列的氨基末端。同樣理想的是添加調(diào)節(jié)序列,其允許相對于宿主細(xì)胞的生長來調(diào)節(jié)多肽的表達(dá)。調(diào)節(jié)系統(tǒng)的例子是引起基因表達(dá)響應(yīng)化學(xué)或物理刺激物,包括調(diào)節(jié)化合物的存在而開啟或關(guān)閉的那些系統(tǒng)。原核系統(tǒng)中的調(diào)節(jié)系統(tǒng)包括lac、tac和trp操縱基因系統(tǒng)。在酵母中,可以使用ADH2系統(tǒng)或GALl系統(tǒng)。在絲狀真菌中,可以使用TAKAα-淀粉酶啟動子、黑曲霉葡糖淀粉酶啟動子和米曲霉葡糖淀粉酶啟動子作為調(diào)節(jié)序列。調(diào)節(jié)序列的其它例子是那些允許基因擴(kuò)增的序列。在真核系統(tǒng)中,這些調(diào)節(jié)序列包括在氨甲蝶呤(methotrexate)存在下擴(kuò)增的二氫葉酸還原酶基因,和以重金屬(withheavymetal)擴(kuò)增的金屬硫蛋白基因。在這些情況下,編碼多肽的核苷酸序列將與調(diào)節(jié)序列可操作地連接。表達(dá)載體本發(fā)明還涉及重組表達(dá)載體,所述重組表達(dá)載體包含本發(fā)明的多核苷酸、啟動子和轉(zhuǎn)錄和翻譯終止信號。本文所述的多種核酸和調(diào)控序列可以結(jié)合在一起以產(chǎn)生重組表達(dá)載體,所述表達(dá)載體可以包括一個或多個(數(shù)個)方便的限制位點以允許在這些位點插入或取代編碼多肽的核苷酸序列。可供選擇的是,可以通過在適當(dāng)?shù)挠糜诒磉_(dá)的載體中插入包含所述序列的核苷酸序列或核酸構(gòu)建體來表達(dá)本發(fā)明的核苷酸序列。在制備表達(dá)載體的過程中,將編碼序列置于載體中,從而將該編碼序列與適當(dāng)?shù)谋磉_(dá)調(diào)控序列可操作地連接。重組表達(dá)載體可以是任何載體(例如,質(zhì)?;虿《?,其能夠方便地進(jìn)行重組DNA步驟,并且能夠產(chǎn)生核苷酸序列的表達(dá)。載體的選擇將通常依賴于載體與將引入該載體的宿主細(xì)胞的相容性。載體可以是線狀或閉合環(huán)狀質(zhì)粒。載體可以是自主復(fù)制載體,即,作為染色體外實體(entity)存在的載體,其復(fù)制獨立于染色體復(fù)制,例如,質(zhì)粒、染色體外元件、微型染色體(minichromosome)或人工染色體。載體可以含有任何用于確保自復(fù)制的手段(means)?;蛘撸d體可以是一種當(dāng)被引入宿主細(xì)胞中時,整合到基因組中并且與整合了該載體的染色體一起復(fù)制的載體。此外,可以使用單獨的載體或質(zhì)粒或兩個或更多個載體或質(zhì)粒,其共同含有待引入宿主細(xì)胞基因組的完整DNA(totalDNA),或可以使用轉(zhuǎn)座子(transposon)。本發(fā)明的載體優(yōu)選地含有一個或幾個選擇性標(biāo)記,其允許簡單選擇經(jīng)轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)等的細(xì)胞。選擇性標(biāo)記是基因,其產(chǎn)物提供殺生物劑或病毒抗性、對重金屬的抗性、對營養(yǎng)缺陷型的原養(yǎng)性(prototrophytoauxotrophs)等。細(xì)菌選擇性標(biāo)記的例子是來自枯草芽孢桿菌或地衣芽孢桿菌的dal基因,或賦予抗生素抗性的標(biāo)記,所述抗生素抗性例如氨芐青霉素、卡那霉素、氯霉素或四環(huán)素抗性。對于酵母宿主細(xì)胞合適的標(biāo)記是ADE2、HIS3、LEU2、LYS2、MET3、TRPl和URA3。用于絲狀真菌宿主細(xì)胞的選擇性標(biāo)記包括但不限于amdS(乙酰胺酶)、argB(鳥氨酸氨甲?;D(zhuǎn)移酶)、bar(草銨膦(phosphinothricin)乙酰轉(zhuǎn)移酶)、hph(潮霉素磷酸轉(zhuǎn)移酶)、niaD(硝酸還原酶)(nitratereductase)、pyrG(乳清酸核苷-5,-磷酸脫羧酶)(orotidine-5’-phosphatedecarboxylase)、sC(硫酸腺苷酰轉(zhuǎn)移酶)和trpC(鄰氨基苯甲酸合酶(anthraniIatesynthase))以及它們的等價物。優(yōu)選用在曲霉屬細(xì)胞中的是構(gòu)巢曲霉或米曲霄的amdS禾口pyrG基因禾口吸水鏈霄菌(Streptomyceshygroscopicus)的bar基因。本發(fā)明的載體優(yōu)選含有元件,其允許載體整合入宿主細(xì)胞基因組或載體在細(xì)胞中獨立于基因組的自主復(fù)制。為了整合入宿主細(xì)胞基因組,載體可依賴編碼多肽的多核苷酸的序列或用于通過同源或非同源重組整合入基因組的任何其它載體元件?;蛘?,載體可以含有額外的核苷酸序列,用于指導(dǎo)通過同源重組整合入宿主細(xì)胞基因組染色體中的精確位置。為了增加在精確位置整合的可能性,整合元件應(yīng)優(yōu)選含有足夠數(shù)量的核酸,如100至10,000堿基對,優(yōu)選400至10,000堿基對,并且最優(yōu)選800至10,000堿基對,其與相應(yīng)的目標(biāo)序列具有高度序列同一性以增強(qiáng)同源重組的概率。整合元件可以是任何序列,其與宿主細(xì)胞基因組中的目標(biāo)序列同源。此外,整合元件可以是非編碼或編碼的核苷酸序列。另一方面,可以將載體通過非同源重組整合到宿主細(xì)胞的基因組中。為了自主復(fù)制,載體可以還包含復(fù)制起點,其使載體能夠在所述的宿主細(xì)胞中自主地復(fù)制。復(fù)制起點可以是介導(dǎo)自主復(fù)制的任何質(zhì)粒復(fù)制子(r印licator),其在細(xì)胞中發(fā)揮功能。術(shù)語“復(fù)制起點”或“質(zhì)粒復(fù)制子”在本文定義為能夠使質(zhì)?;蜉d體體內(nèi)復(fù)制的核苷酸序列。細(xì)菌復(fù)制起點的例子是允許在大腸桿菌中復(fù)制的質(zhì)粒pBR322、pUC19、pACYC177和pACYC184的復(fù)制起點,和允許在芽孢桿菌屬中復(fù)制的質(zhì)粒pUBllO、pE194、pTA1060和ρΑΜβ1的復(fù)制起點。用于酵母宿主細(xì)胞中的復(fù)制起點的例子是2微米復(fù)制起點,ARSl,ARS4,ARSl和CEN3的組合,和ARS4和CEN6的組合。在絲狀真菌細(xì)胞中有用的復(fù)制起點的例子是AMAl和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsResearch159163-9175;WO00/24883)。分離AMAl基因和構(gòu)建包含該基因的質(zhì)?;蜉d體能夠根據(jù)公開于WO00/24883中的方法完成??梢詫⒍嘤谝粋€拷貝的本發(fā)明的多核苷酸插入宿主細(xì)胞以增加基因產(chǎn)物的產(chǎn)生。多核苷酸拷貝數(shù)的增加可通過如下方法獲得將至少一個額外拷貝的序列整合入宿主細(xì)胞基因組,或?qū)⒖蓴U(kuò)增的選擇性標(biāo)記基因包括于多核苷酸,其中可通過在合適的選擇劑(selectableagent)存在下培養(yǎng)細(xì)胞來選擇含有選擇性標(biāo)記基因的擴(kuò)增拷貝,從而含有多核苷酸的額外拷貝的細(xì)胞。用于連接上述元件以構(gòu)建本發(fā)明的重組表達(dá)載體的方法是本領(lǐng)域技術(shù)人員熟知21的(參見,例如,Sambrook等,1989,見上文)。宿主細(xì)胞本發(fā)明還涉及重組宿主細(xì)胞,其包含本發(fā)明的分離的多核苷酸,所述重組宿主細(xì)胞在所述多肽的重組生產(chǎn)中有利使用。將包含本發(fā)明多核苷酸的載體導(dǎo)入宿主細(xì)胞中,使得載體作為染色體整合物或者作為自我復(fù)制的染色體外載體維持,如較早所描述的。術(shù)語“宿主細(xì)胞”涵蓋由于復(fù)制過程中發(fā)生的突變而與親本細(xì)胞不同的親本細(xì)胞的任何后代。宿主細(xì)胞的選擇會很大程度上取決于編碼多肽的基因及其來源。宿主細(xì)胞可以是在本發(fā)明的多肽的重組產(chǎn)生中有用的任何細(xì)胞,例如,原核或真核細(xì)胞。原核宿主細(xì)胞可以是任何革蘭氏陽性細(xì)菌或革蘭氏陰性細(xì)菌。革蘭氏陽性細(xì)菌包括但不限于,芽孢桿菌屬、鏈球菌屬、鏈霉菌屬、葡萄球菌屬、腸球菌屬、乳桿菌屬、乳球菌屬、梭菌屬、地芽孢桿菌屬和海洋芽孢桿菌屬。革蘭氏陰性細(xì)菌包括但不限于,大腸桿菌、假單胞菌屬、沙門氏菌屬、彎曲桿菌屬、螺桿菌屬、黃桿菌屬、梭桿菌屬、泥桿菌屬、奈瑟氏菌屬和脲原體屬。細(xì)菌宿主細(xì)胞可以是任何芽孢桿菌屬細(xì)胞。在本發(fā)明的實施中有用的芽孢桿菌屬細(xì)胞包括但不限于,嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、克勞氏芽孢桿菌、凝結(jié)芽孢桿菌、堅強(qiáng)芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌和蘇云金芽孢桿菌細(xì)胞。在一個優(yōu)選的方面,細(xì)菌宿主細(xì)胞是解淀粉芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、嗜熱脂肪芽孢桿菌或枯草芽孢桿菌細(xì)胞。在一個更優(yōu)選的方面,細(xì)菌宿主細(xì)胞是解淀粉芽孢桿菌細(xì)胞。在另一個更優(yōu)選的方面,細(xì)菌宿主細(xì)胞是克勞氏芽孢桿菌細(xì)胞。在另一個更優(yōu)選的方面,細(xì)菌宿主細(xì)胞是地衣芽孢桿菌細(xì)胞。在另一個更優(yōu)選的方面,細(xì)菌宿主細(xì)胞是枯草芽孢桿菌細(xì)胞。細(xì)菌宿主細(xì)胞還可以是任何鏈球菌屬細(xì)胞。在本發(fā)明的實施中有用的鏈球菌屬細(xì)胞包括但不限于,似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌和馬鏈球菌獸瘟亞種細(xì)胞。在一個優(yōu)選的方面,細(xì)菌宿主細(xì)胞是似馬鏈球菌細(xì)胞。在另一個優(yōu)選的方面,細(xì)菌宿主細(xì)胞是釀膿鏈球菌細(xì)胞。在另一個優(yōu)選的方面,細(xì)菌宿主細(xì)胞是乳房鏈球菌細(xì)胞。在另一個優(yōu)選的方面,細(xì)菌宿主細(xì)胞是馬鏈球菌獸瘟亞種細(xì)胞。細(xì)菌宿主細(xì)胞還可以是任何鏈霉菌屬細(xì)胞。在本發(fā)明的實施中有用的鏈霉菌屬細(xì)胞包括但不限于,不產(chǎn)色鏈霉菌、除蟲鏈霉菌、天藍(lán)鏈霉菌、灰色鏈霉菌和淺青紫鏈霉菌細(xì)胞。在一個優(yōu)選的方面,細(xì)菌宿主細(xì)胞是不產(chǎn)色鏈霉菌細(xì)胞。在另一個優(yōu)選的方面,細(xì)菌宿主細(xì)胞是除蟲鏈霉菌細(xì)胞。在另一個優(yōu)選的方面,細(xì)菌宿主細(xì)胞是天藍(lán)鏈霉菌細(xì)胞。在另一個優(yōu)選的方面,細(xì)菌宿主細(xì)胞是灰色鏈霉菌細(xì)胞。在另一個優(yōu)選的方面,細(xì)菌宿主細(xì)胞是淺青紫鏈霉菌細(xì)胞??赏ㄟ^如下方法實現(xiàn)將DNA引入到芽孢桿菌屬細(xì)胞例如原生質(zhì)體轉(zhuǎn)化(參見,例如,Chang和Cohen,1979,MolecularGeneralGenetics168:111_115),使用感受態(tài)細(xì)胞(參見,例如,Young禾口Spizizen,1961,JournalofBacteriology81:823_829或Dubnau和Davidoff-Abelson,1971,JournalofMolecularBiology56:209_221),電穿孔(參見,例如,Shigekawa和Dower,1988,Biotechniques6:742_751)或接合(參見,例如,Koehler禾口Thorne,1987,JournalofBacteriologyl69:5771_5278)??赏ㄟ^如下方法實現(xiàn)將DNA引入到大腸桿菌細(xì)胞例如原生質(zhì)體轉(zhuǎn)化(參見,例如,Hanahan,1983,J.Mol.Biol.166557-580)或電穿孔(參見,例如,Dower等,1988,NucleicAcidsRes.166127-6145)。可通過如下方法實現(xiàn)將DNA引入到鏈霉菌屬細(xì)胞例如原生質(zhì)體轉(zhuǎn)化和電穿孔(參見,例如,Gong等,2004,F(xiàn)oliaMicrobiol.(Praha)49:399_405),接合(參見,例如,Mazodier等,1989,J.Bacteriol.171:3583_3585),或轉(zhuǎn)導(dǎo)(參見,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98=6289-6294)。可通過如下方法實現(xiàn)將DNA引入到假單胞菌細(xì)胞例如電穿孔(參見,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(參見,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51_57)??赏ㄟ^如下方法實現(xiàn)將DNA引入到鏈球菌屬細(xì)胞例如天然感受態(tài)(naturalcompetence)(參見,例如,Perry和Kuramitsu,1981,Infect.Immun.321295-1297),原生質(zhì)體轉(zhuǎn)化(參見,例如,Cart和Jollick,1991,Microbios.68189-2070),電穿孔(參見,例如,Buckley等,1999,Appl.Environ.Microbiol.653800-3804)或接合(參見,例如,Clewell,1981,Microbiol.Rev.45409-436)。然而,可以使用本領(lǐng)域已知的將DNA導(dǎo)入宿主細(xì)胞中的任何方法。宿主細(xì)胞還可以是真核生物,如哺乳動物、昆蟲、植物或真菌細(xì)胞。在一個優(yōu)選的方面,宿主細(xì)胞是真菌細(xì)胞。“真菌”用在本文包括以下門子囊菌門(Ascomycota)、擔(dān)子菌門(Basidiomycota)、壺菌門(Chytridiomycota)禾口接合菌門(Zygomycota)(如由Hawksworth等,于AinsworthandBisby'sDictionaryofTheFungi,第8版,1995,CABInternational,UniversityPress,Cambridge,UK中所定義)以及卵菌門(Oomycota)(如Hawksworth等,1995,見上,171頁中所引用),和所有有絲分裂孢子真菌(mitosporicfungi)(Hawksworth等,1995,見上)。在一個更優(yōu)選的方面,真菌宿主細(xì)胞是酵母細(xì)胞?!敖湍浮庇迷诒疚陌óa(chǎn)子囊酵母(ascosporogenousyeast)(內(nèi)孢霉目(Endomycetales))、產(chǎn)擔(dān)子酵母(basidiosporogenousyeast)禾口屬于半知菌類(FungiImperfecti)(芽抱綱(Blastomycetes))的酵母。由于酵母的分類在未來可能改變,就本發(fā)明而言,將酵母定義為如BiologyandActivitiesofYeast(Skinner,F(xiàn).A.,Passmore,S.Μ·,禾口Davenport,R.R編,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。在一個甚至更加優(yōu)選的方面,酵母宿主細(xì)胞是念珠菌屬、漢遜酵母屬(Hansenula)、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或西洋蓍霉屬細(xì)胞。在一個最優(yōu)選的方面,酵母宿主細(xì)胞是卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母或卵形酵母細(xì)胞。在另一個最優(yōu)選的方面,酵母宿主細(xì)胞是乳酸克魯維酵母(Kluyveromyceslactis)細(xì)胞。在另一個最優(yōu)選的方面,酵母宿主細(xì)胞是解脂西洋蓍霉(Yarrowialipolytica)細(xì)胞。在另一個更優(yōu)選的方面,真菌宿主細(xì)胞是絲狀真菌細(xì)胞。“絲狀真菌”包括真菌門(Eumycota)和卵菌門的亞門(如由Hawksworth等,1995,見上文,所定義)的所有絲狀形式。絲狀真菌通常的特征在于由殼多糖(chitin)、纖維素、葡聚糖、殼聚糖(chitosan)、甘露聚糖和其它復(fù)雜多糖組成的菌絲體壁。通過菌絲延伸進(jìn)行營養(yǎng)生長,而碳分解代謝是專性需氧的。相反,酵母例如釀酒酵母的營養(yǎng)生長通過單細(xì)胞菌體的出芽生殖(budding)進(jìn)23行,而碳分解代謝可以是發(fā)酵的。在一個甚至更優(yōu)選的方面,絲狀真菌宿主細(xì)胞是枝頂孢霉屬、曲霉屬、短梗霉屬、煙管霉屬(Bjerkandera)、擬蠟菌屬、金孢子菌屬、鬼傘屬(Coprinus)、革蓋菌屬(Coriolus)、隱球菌屬、Filibasidium、鐮孢屬、腐質(zhì)霉屬、梨孢菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬(Phanerochaete)、射脈菌屬(Phlebia)、瘤胃壺菌屬、側(cè)耳屬(Pleurotus)、裂褶菌屬、踝節(jié)菌屬、嗜熱子囊菌屬/嗜熱霉屬、梭孢殼屬、彎頸霉屬、栓菌屬(Trametes)或木霉屬細(xì)胞。在一個最優(yōu)選的方面,絲狀真菌宿主細(xì)胞是泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉或米曲霉細(xì)胞。在另一個最優(yōu)選方面,絲狀真菌宿主細(xì)胞是桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢細(xì)胞。在另一個最優(yōu)選的方面,絲狀真菌宿主細(xì)胞是黑刺煙管菌(Bjerkanderaadusta)、干(Ceriporiopsisaneirina)、干if^lii、Ceriporiopsiscaregiea>Ceriporiopsisgilvescens>Ceriporiopsispannocinta>Ceriporiopsisrivulosa、Ceriporiopsissubrufa>Ceriporiopsissubvermispora、B譽(yù)角質(zhì)金包子菌、Chrysosporiumlucknowense、熱帶金抱子菌、Chrysosporiummerdarium、Chrysosporiuminops、|£金包子菌、Chrysosporiumqueenslandicum>Chrysosporiumzonatum、灰蓋鬼傘(Coprinuscinereus)、毛革蓋菌(Coriolushirsutus)、特異腐質(zhì)霉、疏棉狀腐質(zhì)霉、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、產(chǎn)紫青霉、黃孢平革菌、輻射射脈菌(Phlebiaradiata),刺芹側(cè)耳(Pleurotuseryngii)、土生梭孢霉、長絨毛栓菌(Trametesvillosa)、變色栓菌(Trametesversicolor)、哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉細(xì)胞??梢詫⒄婢?xì)胞通過涉及原生質(zhì)體形成、原生質(zhì)體轉(zhuǎn)化和細(xì)胞壁重建的方法以本身公知的方式轉(zhuǎn)化。用于轉(zhuǎn)化曲霉屬和木霉屬宿主細(xì)胞的合適方法在EP238023和Yelton^,1984,ProceedingsoftheNationalAcademyofSciencesUSA811470-1474中描述。用于轉(zhuǎn)化鐮孢屬菌種的合適方法由Malardier等,1989,Gene78:147-156和WO96/00787描述??梢允褂糜扇缦挛墨I(xiàn)描述的方法轉(zhuǎn)化酵母=Becker和Guarente,于Abelson,J.N.禾口Simon,Μ.I.編,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volumel94,pp182—187,AcademicPress,Inc.,NewYork;Ito等,1983,JournalofBacteriology153:163;禾口Hinnen等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:1920o生產(chǎn)方法本發(fā)明還涉及用于生產(chǎn)本發(fā)明多肽的方法,其包括(a)在有益于生產(chǎn)多肽的條件下培養(yǎng)細(xì)胞,所述細(xì)胞以其野生型形式產(chǎn)生所述多肽;和(b)回收所述多肽。在一個優(yōu)選的方面,所述細(xì)胞是腐質(zhì)霉屬細(xì)胞。在一個更優(yōu)選的方面,所述細(xì)胞是特異腐質(zhì)霉。在一個最優(yōu)選的方面,所述細(xì)胞是特異腐質(zhì)霉DSM1800。本發(fā)明還涉及用于生產(chǎn)本發(fā)明的多肽的方法,其包括(a)在有益于生產(chǎn)多肽的條件下培養(yǎng)重組宿主細(xì)胞,如本文所描述的;和(b)回收所述多肽。本發(fā)明還涉及用于生產(chǎn)本發(fā)明的多肽的方法,其包括(a)在有益于生產(chǎn)多肽的條件下培養(yǎng)重組宿主細(xì)胞,其中所述宿主細(xì)胞包含突變核苷酸序列,其在SEQIDN0:1的成熟多肽編碼序列中具有至少一個突變,其中所述突變核苷酸序列編碼多肽,所述多肽包含SEQIDNO:2的成熟多肽或由該成熟多肽組成,和(b)回收所述多肽。在本發(fā)明的生產(chǎn)方法中,使用本領(lǐng)域熟知的方法在適合于生產(chǎn)所述多肽的營養(yǎng)培養(yǎng)基中培養(yǎng)細(xì)胞。例如,可以通過在合適培養(yǎng)基中和允許表達(dá)和/或分離所述多肽的條件下進(jìn)行的搖瓶培養(yǎng),和實驗室或工業(yè)發(fā)酵罐中的小規(guī)?;虼笠?guī)模發(fā)酵(包括連續(xù)、分批、補(bǔ)料分批或固態(tài)發(fā)酵)來培養(yǎng)細(xì)胞。使用本領(lǐng)域已知的方法在合適的營養(yǎng)培養(yǎng)基中進(jìn)行培養(yǎng),所述營養(yǎng)培養(yǎng)基包含碳源和氮源和無機(jī)鹽。合適的培養(yǎng)基能夠從商業(yè)供應(yīng)商獲得或可以根據(jù)公開的組成制備(例如,在美國典型培養(yǎng)物保藏中心的目錄中)。如果多肽分泌到營養(yǎng)培養(yǎng)基中,該多肽能夠從所述培養(yǎng)基中直接回收。如果多肽不分泌到培養(yǎng)基中,其能夠從細(xì)胞裂解物(Iysate)回收??梢允褂帽绢I(lǐng)域已知的對于所述多肽是特異性的方法來檢測多肽。這些檢測方法可包括特異性抗體的使用、酶產(chǎn)物的形成或酶底物的消失。例如,酶試驗(enzymeassay)可用于測定如本文所述的多肽的活性。所得多肽可以使用本領(lǐng)域已知的方法回收。例如,多肽可以通過常規(guī)方法從營養(yǎng)培養(yǎng)基中回收,所述常規(guī)方法包括但不限于離心、過濾、提取、噴霧干燥、蒸發(fā)或沉淀。本發(fā)明的多肽可以通過多種本領(lǐng)域已知的方法純化以獲得基本上純的多肽,所述方法包括但不限于層析(例如,離子交換、親和、疏水、層析聚焦和大小排阻)、電泳方法(例如,制備型(pr印arative)等電聚焦)、差示溶解度(例如,硫酸銨沉淀)、SDS_PAGE或提取(參見,例如,ProteinPurification,J.-C.Janson禾口LarsRyden編,VCHPublishers,NewYork,1989)。植物本發(fā)明還涉及植物,例如,轉(zhuǎn)基因植物、植物部分或植物細(xì)胞,其包含分離的多核苷酸,所述多核苷酸編碼本發(fā)明具有α-L-阿拉伯呋喃糖苷酶活性的多肽,從而以可回收的量表達(dá)和產(chǎn)生所述多肽。多肽可從植物或植物部分回收?;蛘撸瑯涌梢詫⒑性撝亟M多肽的植物或植物部分用于改進(jìn)食品或飼料的質(zhì)量,例如,改進(jìn)營養(yǎng)價值、適口性(palatability)和流變性質(zhì)(rheologicalproperties),或用于破壞抗?fàn)I養(yǎng)因子。轉(zhuǎn)基因植物可以是雙子葉的(雙子葉植物)或單子葉的(單子葉植物)。單子葉植物的例子是草(grasses),如草地早熟禾(meadowgrass)(藍(lán)草(bluegrass),早熟禾屬(Poa));飼用牧草(foragegrass)如羊茅屬(Festuca)、黑麥草屬(Lolium);寒地型牧草(temperategrass),如Agrostis(剪股穎屬);和谷類,例如,小麥、燕麥、黑麥、大麥、稻(rice)、高粱和玉蜀黍(maize)(玉米)。雙子葉植物的例子是煙草(tobacco),豆類(legumes),如羽扇豆(lupins),馬鈴薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜籽(rapeseed)和緊密相關(guān)的模型生物體擬南芥(Arabidopsisthaliana)。植物部分的例子是莖(stem)、愈傷組織(calIus)、葉(leaf)、根(root)、果實(fruit)、種子(seed)和塊莖(tuber),以及包含這些部分的獨立組織,例如,表皮(epidermis)、葉肉(mesophyll)、薄壁組織(parenchyme)、維管組織(vasculartissue)、分生組織(meristem)。具體的植物細(xì)胞區(qū)室(compartments),如葉綠體(chloroplast)、質(zhì)外體(apoplast)、線粒體(mitochondria)、液泡(vacuole)、過氧化物酶體(peroxisome)禾口細(xì)胞質(zhì)(cytoplasm)也被認(rèn)為是植物部分。此外,任何植物細(xì)胞,無論什么組織來源,都被認(rèn)為是植物部分。同樣地,植物部分,如分離以促進(jìn)本發(fā)明的應(yīng)用的具體組織和細(xì)胞也被認(rèn)為是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和種皮(seedcoat)。同樣包含于本發(fā)明范圍內(nèi)的還有這些植物、植物部分和植物細(xì)胞的子代。表達(dá)本發(fā)明多肽的轉(zhuǎn)基因植物或植物細(xì)胞可以依照本領(lǐng)域已知方法構(gòu)建。簡而言之,通過如下方法構(gòu)建所述植物或植物細(xì)胞將編碼本發(fā)明多肽的一個或多個(數(shù)個)表達(dá)構(gòu)建體并入植物宿主基因組或葉綠體基因組,并且將所得的修飾植物或植物細(xì)胞繁殖為轉(zhuǎn)基因植物或植物細(xì)胞。表達(dá)構(gòu)建體便利地是包含編碼本發(fā)明多肽的多核苷酸的核酸構(gòu)建體,所述多核苷酸與在選擇的植物或植物部分中表達(dá)該多核苷酸序列所需的適當(dāng)?shù)恼{(diào)節(jié)序列可操作地連接。此外,表達(dá)構(gòu)建體可以包含對于鑒定宿主細(xì)胞有用的選擇性標(biāo)記,在所述宿主細(xì)胞中整合了表達(dá)構(gòu)建體和將該構(gòu)建體引入到所述植物中所必需的DNA序列(后者依賴于使用的DNA引入方法)。調(diào)節(jié)序列的選擇,例如啟動子和終止子序列和任選地信號或轉(zhuǎn)運序列的選擇,舉例來說,基于期望何時、何處以及如何表達(dá)多肽而確定。例如,編碼本發(fā)明多肽的基因的表達(dá)可以是組成型的或誘導(dǎo)型的,或可以是發(fā)育、階段或組織特異性的,并且基因產(chǎn)物可以靶向特定的組織或植物部分例如種子或葉。調(diào)節(jié)序列由例如Tague等,1988,PlantPhysiology86:506所述。對于組成性表達(dá),可以使用35S_CaMV、玉米泛素1和稻肌動蛋白1啟動子(Franck等,1980,Cell21:285_294,Christensen等,1992,PlantMo.Biol.18:675_689;Zhang等,1991,PlantCell3:1155_1165)。器官特異性啟動子可以是例如來自貯藏庫組織(storagesinktissue)例如種子、馬鈴薯塊蓮和果實的啟動子(Edwards&Coruzzi,1990,Ann.Rev.Genet.24:275_303),或來自代謝庫組織(metabolicsinktissue)例如分生組織的啟動子(Ito等,1994,PlantMol.Biol.24:863_878),種子特異性啟動子諸如來自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)啟動子(Wu等,1998,PlantandCellPhysiology39:885_889),來自豆球蛋白(Iegumin)B4和蠶豆(Viciafaba)的未知的種子蛋白基因的蠶豆啟動子(Conrad等,1998,JournalofPlantPhysiology152:708_711)、來自種子油體蛋白(oilbodyprotein)的啟動子(Chen等,1998,PlantandCellPhysiology39:935_941),來自歐洲油菜(Brassicanapus)的貯藏蛋白napA啟動子,或本
技術(shù)領(lǐng)域:
公知的任何其他種子特異性的啟動子,例如,在TO91/14772中所描述的。此外,啟動子可為葉特異性的啟動子,如來自稻或番茄的rbcs啟動子(Kyozuka等,1993,PlantPhysiology102:991_1000),小球藻病毒(chlorellavirus)腺嘌呤甲基轉(zhuǎn)移酶(adeninemethyltransferase)基因啟動子(Mitra和Higgins,1994,PlantMolecularBiology26:85_93),或來自稻的aldP基因啟動子(Kagaya等,1995,Molecularandgeneralgenetics248:668_674),或傷口誘導(dǎo)的啟動子,如馬鈴薯pin2啟動子(Xu等,1993,PlantMolecularBiology22:573-588)。同樣地,所述啟動子可通過非生物的處理誘導(dǎo),所述非生物的處理諸如溫度、干旱或鹽度變化,或通過外源施加的激活所述啟動子的物質(zhì)誘導(dǎo),例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙26烯、脫落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金屬。啟動子增強(qiáng)子元件也可以用于實現(xiàn)本發(fā)明多肽在植物中的較高表達(dá)。例如,啟動子增強(qiáng)子元件可以是內(nèi)含子,其置于啟動子和編碼本發(fā)明多肽的核苷酸序列之間。例如Xu等,1993,見上,公開了使用稻肌動蛋白1基因的第一內(nèi)含子以增強(qiáng)表達(dá)。選擇性標(biāo)記基因和表達(dá)構(gòu)建體的任何其它部分可以選自本領(lǐng)域內(nèi)可用的那些。將核酸構(gòu)建體根據(jù)本領(lǐng)域已知的常規(guī)技術(shù)并入植物基因組,所述常規(guī)技術(shù)包括土壤桿菌屬(Agrobacterium)介導(dǎo)的轉(zhuǎn)化、病毒介導(dǎo)的轉(zhuǎn)化、顯微注射(microinjection)、粒子轟擊、生物射彈轉(zhuǎn)化和電穿孔(Gasser等,1990,Science2441293;Potrykus,1990,Bio/Technology8535;Shimamoto等,1989,Nature338274)。目前,根癌土壤桿菌(Agrobacteriumtumefaciens)介導(dǎo)的基因轉(zhuǎn)移(genetransfer),是產(chǎn)生轉(zhuǎn)基因雙子葉植物的優(yōu)選方法(為了參考,見Hooykas和Schilperoort,1992,PlantMolecularBiology19:15_38),而且它也可以用于轉(zhuǎn)化單子葉植物,雖然對于這些植物其他的轉(zhuǎn)化方法是常用的。目前,產(chǎn)生轉(zhuǎn)基因單子葉植物的優(yōu)選的方法,是用粒子(用轉(zhuǎn)化DNA涂覆的微觀的金或鎢粒子)轟擊胚愈傷組織(embryoniccalli)或發(fā)育中的胚(developingembryos)(Christou,1992,PlantJournal2:275-281;Shimamoto,1994,CurrentOpinionBiotechnology5158-162;Vasil等,1992,Bio/Technology10:667_674)。轉(zhuǎn)化單子葉植物的可供選擇的方法是基于原生質(zhì)體轉(zhuǎn)化,如由Omirulleh等,1993,PlantMolecularBiology21:415_428所描述的。轉(zhuǎn)化之后,根據(jù)本領(lǐng)域熟知的方法選擇具有并入的表達(dá)構(gòu)建體的轉(zhuǎn)化體并且再生成為完整植物。通常設(shè)計轉(zhuǎn)化方法用于通過如下方法在再生期間或在后續(xù)世代中選擇性消除選擇基因例如,使用帶有兩種獨立的T-DNA構(gòu)建體的共轉(zhuǎn)化或通過特異性重組酶位點特異性地切除選擇基因。本發(fā)明還涉及用于生產(chǎn)本發(fā)明多肽的方法,其包括(a)在有益于生產(chǎn)所述多肽的條件下培養(yǎng)包含多核苷酸的轉(zhuǎn)基因植物或植物細(xì)胞,所述多核苷酸編碼本發(fā)明具有α-L-阿拉伯呋喃糖苷酶活性的多肽;和(b)回收所述多肽。去除或減少α-L-阿拉伯呋喃糖苷酶活性本發(fā)明還涉及用于產(chǎn)生親本細(xì)胞突變體的方法,其包括破壞或缺失編碼本發(fā)明的多肽的多核苷酸序列或其部分,所述方法導(dǎo)致在相同條件下培養(yǎng)時,與親本細(xì)胞相比突變的細(xì)胞產(chǎn)生較少的所述多肽。可以使用本領(lǐng)域熟知的方法通過減少或消除編碼本發(fā)明多肽的核苷酸序列的表達(dá),所述方法例如,插入、破壞、替代或缺失來構(gòu)建突變細(xì)胞。在一個優(yōu)選的方面,所述核苷酸序列是失活的。待修飾或失活的核苷酸序列可以是,例如,編碼區(qū)或其對活性關(guān)鍵的部分,或表達(dá)編碼區(qū)所需的調(diào)節(jié)元件。這種調(diào)節(jié)或調(diào)控序列的例子可以是啟動子序列或其功能部分,即,足以影響核苷酸序列表達(dá)的部分。用于可能的修飾的其它調(diào)控序列包括但不限于前導(dǎo)序列、聚腺苷酸化序列、前肽序列、信號肽序列、轉(zhuǎn)錄終止子和轉(zhuǎn)錄激活子??梢酝ㄟ^向親本細(xì)胞施以誘變,并且選擇其中已將所述核苷酸序列的表達(dá)減少或消除的突變細(xì)胞來進(jìn)行核苷酸序列的修飾或失活。誘變可能是特異性的或隨機(jī)的,可以通過例如使用合適的物理或化學(xué)誘變劑進(jìn)行,通過使用合適的寡核苷酸進(jìn)行,或通過將所述DNA序列進(jìn)行PCR產(chǎn)生的誘變來進(jìn)行。此外,可以通過使用這些誘變劑的任何組合來進(jìn)行誘27變。適合于本發(fā)明目的的物理或化學(xué)誘變劑的例子包括紫外(UV)照射、羥胺、N-甲基-N,-硝基-N-亞硝基胍(MNNG)、0_甲基羥胺、亞硝酸、乙基甲烷磺酸酯(ethylmethanesulphonate)(EMS)、亞硫酸氫鈉、甲酸和核苷酸類似物。當(dāng)使用這些試劑時,通常通過如下方法來進(jìn)行所述誘變在合適條件下存在優(yōu)選的誘變劑時溫育待誘變的親本細(xì)胞,并篩選和/或選擇顯示基因表達(dá)減少的或無基因表達(dá)的突變體細(xì)胞。通過導(dǎo)入、取代或去除基因中的一個或多個(數(shù)個)核苷酸或其轉(zhuǎn)錄或翻譯所需的調(diào)控元件可以實現(xiàn)所述核苷酸序列的修飾或失活。例如,可以插入或去除核苷酸從而導(dǎo)致引入終止密碼子,去除起始密碼子,或改變開放閱讀框。按照本領(lǐng)域已知的方法通過定位誘變或PCR產(chǎn)生的誘變可以實現(xiàn)這種修飾或失活。盡管在理論上所述修飾可以在體內(nèi)進(jìn)行,即,直接在表達(dá)待修飾核苷酸序列的細(xì)胞上進(jìn)行,但優(yōu)選如下面所示例的那樣在體外進(jìn)行所述修飾。消除或減少核苷酸序列通過細(xì)胞表達(dá)的便利方式的例子是基于基因取代,基因缺失,或基因破壞的技術(shù)。例如,在基因破壞方法中,將相應(yīng)于內(nèi)源核苷酸序列的核酸序列在體外進(jìn)行誘變以產(chǎn)生缺陷性的核酸序列,隨后將其轉(zhuǎn)化入親本細(xì)胞中以產(chǎn)生缺陷基因。通過同源重組,所述缺陷性核酸序列替代了內(nèi)源性核苷酸序列。理想的是所述缺陷性核苷酸序列還編碼標(biāo)記,其可用于選擇其中核苷酸序列被修飾或破壞的轉(zhuǎn)化子。在一個特別優(yōu)選的方面,用可選擇的標(biāo)記(如本文所述的那些)來破壞所述核苷酸序列?;蛘?,可以使用與所述核苷酸序列互補(bǔ)的序列通過確定的反義或RNAi技術(shù)來進(jìn)行所述核苷酸序列的修飾或失活。更具體地,通過導(dǎo)入與所述基因的核苷酸序列互補(bǔ)的序列可以減少或消除所述核苷酸序列通過細(xì)胞的表達(dá),所述序列可以在細(xì)胞中轉(zhuǎn)錄并且能夠與細(xì)胞中產(chǎn)生的mRNA雜交。在允許所述互補(bǔ)反義核苷酸序列與mRNA雜交的條件下,由此減少或消除翻譯的蛋白質(zhì)的量。本發(fā)明進(jìn)一步涉及親本細(xì)胞的突變體細(xì)胞,其包含編碼多肽的核苷酸序列或其調(diào)控序列的破壞或缺失,這導(dǎo)致與親本細(xì)胞相比突變體細(xì)胞產(chǎn)生更少的多肽或不產(chǎn)生多肽。這樣生成的多肽缺陷型突變細(xì)胞作為表達(dá)天然和/或異源多肽的宿主細(xì)胞特別有用。所以,本發(fā)明進(jìn)一步涉及生產(chǎn)天然或異源多肽的方法,其包括(a)在有益于生產(chǎn)多肽的條件下培養(yǎng)突變細(xì)胞;和(b)回收所述多肽。術(shù)語“異源多肽”在本文中定義為對宿主細(xì)胞不是天然的多肽,進(jìn)行了修飾以改變天然序列的天然蛋白,或作為通過重組DNA技術(shù)對宿主細(xì)胞操作的結(jié)果其表達(dá)在量上改變的天然蛋白。在另一方面,本發(fā)明涉及通過發(fā)酵可產(chǎn)生本發(fā)明的多肽以及目標(biāo)蛋白產(chǎn)物的細(xì)胞來生產(chǎn)基本上無α-L-阿拉伯呋喃糖苷酶活性的蛋白質(zhì)產(chǎn)品的方法在發(fā)酵之前、過程中或發(fā)酵完成之后向發(fā)酵液(fermentationbroth)中添加有效量的能夠抑制α-L-阿拉伯呋喃糖苷酶活性的試劑,從發(fā)酵液中回收目標(biāo)產(chǎn)物,并且任選地將回收的產(chǎn)物進(jìn)行進(jìn)一步純化。在另一方面,本發(fā)明涉及通過如下生產(chǎn)基本上無α-L-阿拉伯呋喃糖苷酶活性的蛋白質(zhì)產(chǎn)物的方法在允許產(chǎn)物表達(dá)的條件下培養(yǎng)細(xì)胞,將得到的培養(yǎng)液進(jìn)行組合的PH和溫度處理以基本上減少α-L-阿拉伯呋喃糖苷酶活性,和從發(fā)酵液中回收產(chǎn)物。或者,可以將從培養(yǎng)液回收的酶制備物進(jìn)行組合的PH和溫度處理。所述組合的PH和溫度處理可任選地與α-L-阿拉伯呋喃糖苷酶抑制劑處理組合使用。依照本發(fā)明的這個方面,可能去除至少60%,優(yōu)選至少75%,更優(yōu)選至少85%,還更優(yōu)選至少95%,并且最優(yōu)選至少99%的α-L-阿拉伯呋喃糖苷酶活性??墒褂么朔椒ǐ@得α-L-阿拉伯呋喃糖苷酶活性的完全去除。組合的ρΗ和溫度處理優(yōu)選在2-4或9-11范圍內(nèi)的ρΗ和至少60_70°C范圍內(nèi)的溫度進(jìn)行一段足夠的時間以達(dá)到期望的效果,通常30至60分鐘是足夠的。用于培養(yǎng)和純化感興趣的產(chǎn)物的方法可以通過本領(lǐng)域已知的方法進(jìn)行。用于產(chǎn)生基本上無α-L-阿拉伯呋喃糖苷酶產(chǎn)物的本發(fā)明的方法在真核多肽,特別是真菌蛋白質(zhì)例如酶的產(chǎn)生中是特別令人有興趣的。所述酶可以選自,例如,淀粉分解酶(amylolyticenzyme)、脂肪分解酶、蛋白水解酶、纖維素分解酶(cellulolyticenzyme)、氧化還原酶或植物細(xì)胞壁降解酶。這些酶的例子包括氨肽酶、淀粉酶、淀粉葡糖苷酶、糖酶、羧肽酶、過氧化氫酶、纖維二糖水解酶、纖維素酶、幾丁質(zhì)酶(chitinase)、角質(zhì)酶(cutinase)、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、內(nèi)切葡聚糖酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖氧化酶、葡糖苷酶、商素過氧化酶、半纖維素酶、轉(zhuǎn)化酶、異構(gòu)酶、漆酶、連接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果膠分解酶、過氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)移酶、轉(zhuǎn)谷氨酰胺酶或木聚糖酶。α-L-阿拉伯呋喃糖苷酶缺陷細(xì)胞也可以用于表達(dá)在制藥上引起興趣的異源蛋白質(zhì)如激素、生長因子、受體等??衫斫獾氖切g(shù)語“真核多肽”不僅包括天然多肽,也包括那些多肽例如酶,其通過氨基酸取代、缺失或添加或其它這樣的修飾而被修飾以增強(qiáng)活性、熱穩(wěn)定性、PH耐受性等。在另外的方面,本發(fā)明涉及基本上無α-L-阿拉伯呋喃糖苷酶活性的蛋白質(zhì)產(chǎn)物,其通過本發(fā)明的方法產(chǎn)生。抑制多肽表達(dá)的方法本發(fā)明還涉及抑制多肽在細(xì)胞中表達(dá)的方法,其包括對細(xì)胞施用雙鏈RNA(dsRNA)分子或者在細(xì)胞中表達(dá)雙鏈RNA(dsRNA)分子,其中dsRNA包含本發(fā)明多核苷酸的亞序列。在一個優(yōu)選的方面,dsRNA長約15、16、17、18、19、20、21、22、23、24、25或更多的雙鏈體核苷酸。dsRNA優(yōu)選是小干擾RNA(siRNA)或微RNA(miRNA)。在一個優(yōu)選的方面,dsRNA是用于抑制轉(zhuǎn)錄的小干擾RNA(SiRNA)。在另一個優(yōu)選的方面,dsRNA是用于抑制翻譯的微RNA(miRNA)。本發(fā)明還涉及所述雙鏈RNA(dsRNA)分子,其包含SEQIDNO1的成熟多肽編碼序列中用于抑制多肽在細(xì)胞中表達(dá)的部分。本發(fā)明不受到任何特定作用機(jī)制的限制,dsRNA能進(jìn)入細(xì)胞,并引起相似或相同序列的單鏈RNA(ssRNA)的降解,所述RNA包括內(nèi)源mRNA。當(dāng)細(xì)胞接觸dsRNA時,來自同源基因的mRNA選擇性地受到稱為RNA干擾(RNAi)的過程的降解。本發(fā)明的dsRNA可以用于基因沉默療法。在一個方面,本發(fā)明提供使用本發(fā)明的dsRNAi選擇性地降解RNA的方法。所述過程可以在體外、在活體外(exvivo)或在體內(nèi)進(jìn)行。在一個方面,dsRNA分子能夠用于產(chǎn)生細(xì)胞、器官或動物中的功能缺失突變(loss-of-functionmutation)。制備或使用選擇性降解RNA的dsRNA分子的方法在本領(lǐng)域中公知,參見,例如,美國專利號6,506,559;美國專利號6,511,824;美國專利號6,515,109;和美國專利號6,489,127。組合物本發(fā)明還涉及包含本發(fā)明的多肽的組合物。優(yōu)選地,所述組合物富含這種多肽。術(shù)語“富含”表示所述組合物的α-L-阿拉伯呋喃糖苷酶活性,例如,以至少1.1的富集因數(shù)(enrichmentfactor)增力口。所述組合物可以包含本發(fā)明的多肽作為主要酶成分,例如,單成分組合物?;蛘撸鼋M合物可以包含多種酶活性,如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質(zhì)酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、鹵素過氧化物酶、轉(zhuǎn)化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果膠分解酶、肽谷氨酰胺酶(peptidoglutaminase)、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶或木聚糖酶。額外的酶可以通過例如屬于以下屬或種的微生物產(chǎn)生曲霉屬,優(yōu)選棘孢曲霉、泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉或米曲霉;鐮孢屬,優(yōu)選桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢;腐質(zhì)霉屬,優(yōu)選特異腐質(zhì)霉或疏棉狀腐質(zhì)霉;或木霉屬,優(yōu)選哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉??梢砸勒毡绢I(lǐng)域內(nèi)已知的方法制備多肽組合物,并且可以是液體或干組合物的形式。例如,所述多肽組合物可以是顆粒(granulate)或微粒(microgranulate)的形式。可以依照本領(lǐng)域內(nèi)已知方法將包括于所述組合物中的多肽穩(wěn)定化。下面給出的是本發(fā)明多肽組合物的優(yōu)選的用途的實例。本發(fā)明的多肽組合物的劑量和使用該組合物的其它條件可以基于本領(lǐng)域內(nèi)已知的方法確定。用途本發(fā)明還涉及使用具有α-L-阿拉伯呋喃糖苷酶活性的多肽或其組合物的方法??梢栽跀?shù)種應(yīng)用中使用本發(fā)明具有α-L-阿拉伯呋喃糖苷酶活性的多肽來降解或轉(zhuǎn)化含有木聚糖的材料,其通過用有效量的所述多肽處理所述材料來進(jìn)行(參見例如WO2002/18561)。優(yōu)選地,在必須降解木聚糖的方法中與其它木聚糖降解酶諸如木聚糖酶、乙酰木聚糖酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、阿魏酸酯酶、葡糖醛酸糖苷酶,和其組合聯(lián)合使用本發(fā)明的多肽。由于脫酰反應(yīng),木聚糖對木聚糖酶和其它木聚糖降解酶的易接近性變得更好。具有α-L-阿拉伯呋喃糖苷酶活性的多肽在許多應(yīng)用中是有用的體內(nèi)修飾含有木聚糖的動物飼料以改善消化率;在例如燃料和/或可飲乙醇的生產(chǎn)中源于生物量降解或轉(zhuǎn)化成可發(fā)酵糖類的普遍應(yīng)用;紙漿和紙脫木質(zhì)化中使用的加工助劑;紡織品的酶促煮煉(scouring)系統(tǒng)的成分;食物應(yīng)用,例如烘焙,與其它酶促功能性組合以改善烘焙物品的物理特性;和與其它酶功能性組合的洗衣洗滌劑應(yīng)用??梢栽诟鶕?jù)美國專利號5,658,765的用于處理Kraft漿的方法中使用多肽。一般而言,通常用木聚糖酶處理Kraft漿以除去紙產(chǎn)品制備物中的木質(zhì)素。當(dāng)在木聚糖酶處理前或與木聚糖酶處理同時用α-L-阿拉伯呋喃糖苷酶處理紙漿時,木聚糖酶的效率得到很大地提高。也可以在根據(jù)美國專利號5,658,765的用于生成木糖或木寡糖的方法中使用所述多肽。所述多肽也可以作為根據(jù)美國專利號6,245,546的飼料增強(qiáng)酶使用,所述飼料增強(qiáng)酶改良飼料消化率以提高其利用效率。α-L-阿拉伯呋喃糖苷酶在飼料中的使用可以降低飼料組分的溶解度,由此減少粘性,并降低戊聚糖(pentosanes)的抗?fàn)I養(yǎng)效果。也可以在根據(jù)美國專利號5,693,518的烘焙中使用所述多肽??梢赃M(jìn)一步在根據(jù)WO2002/24926的釀造中使用所述多肽,其中可以使用此酶與其它酶的組合來降解生物細(xì)胞壁材料以在涉及果汁或啤酒制備的應(yīng)用中提高溶解度或流動特征。因此,本發(fā)明還涉及降解木聚糖的方法,包括用所述具有α-L-阿拉伯呋喃糖苷酶活性的多肽處理含有木聚糖的材料。在一個優(yōu)選的方面,進(jìn)一步用一種或多種木聚糖降解酶處理含有木聚糖的材料。信號月太本發(fā)明還涉及核酸構(gòu)建體,所述核酸構(gòu)建體包含編碼蛋白質(zhì)的基因,其中所述基因與編碼信號肽的核苷酸序列可操作地連接,所述信號肽包含SEQIDNO2的氨基酸1至17,或由SEQIDNO2的氨基酸1至17組成,其中所述基因?qū)τ谠摵塑账嵝蛄惺峭庠吹摹T谝粋€優(yōu)選的方面,所述核苷酸序列包括SEQIDNO=I的核苷酸1至51或由SEQIDNO1的核苷酸1至51組成。本發(fā)明還涉及包含這種核酸構(gòu)建體的重組表達(dá)載體和重組宿主細(xì)胞。本發(fā)明還涉及用于產(chǎn)生蛋白質(zhì)的方法,包括(a)在適合于產(chǎn)生所述蛋白質(zhì)的條件下培養(yǎng)這樣的重組宿主細(xì)胞;和(b)回收所述蛋白質(zhì)。所述蛋白質(zhì)對于宿主細(xì)胞可以是天然的或異源的。術(shù)語“蛋白質(zhì)”在本文的意思不是指特定長度的編碼產(chǎn)物,并且因此包含肽、寡肽和蛋白質(zhì)。術(shù)語“蛋白質(zhì)”還包含組合以形成編碼產(chǎn)物的兩種以上多肽。所述蛋白質(zhì)還包括雜合多肽,其包含部分或全部多肽序列的組合,所述多肽序列從至少兩種不同的蛋白質(zhì)獲得,其中一個或多個(數(shù)個)對于宿主細(xì)胞可以是異源或天然的。蛋白質(zhì)進(jìn)一步包括上述蛋白質(zhì)和雜合蛋白質(zhì)天然存在的等位基因變異和工程改造的變異。優(yōu)選蛋白質(zhì)是激素或其變體、酶、受體或其部分、抗體或其部分,或報告蛋白(reporter)。在一個更優(yōu)選的方面,所述蛋白質(zhì)是氧化還原酶、轉(zhuǎn)移酶、水解酶、裂合酶(lyase)、異構(gòu)酶或連接酶。在一個更加優(yōu)選的方面,所述蛋白質(zhì)是氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質(zhì)酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、轉(zhuǎn)化酶、漆酶、另外的脂肪酶、甘露糖苷酶、變位酶(mutanase)、氧化酶、果膠分解酶、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶或木聚糖酶?;蚩梢詮娜魏卧?、真核或其它來源獲得。通過以下實施例進(jìn)一步對本發(fā)明進(jìn)行描述,但不應(yīng)將其理解為對本發(fā)明范圍的限制。31實施例材料作為緩沖液和底物使用的化學(xué)品是至少試劑級的商業(yè)產(chǎn)品。菌株使用特異腐質(zhì)霉DSM1800作為編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽的家族62基因的來源。使用黑曲霉MBinl20菌株(W02004/090155)來表達(dá)編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽的特異腐質(zhì)霉基因。培養(yǎng)基PDA平板每升由39g馬鈴薯右旋糖瓊脂組成。YP培養(yǎng)基每升由IOg酵母提取物和20g細(xì)菌用蛋白胨組成。COVEA尿素-乙酰胺+平板每升由20mlCOVEA鹽溶液、220g山梨糖醇、IOg葡萄糖、IOmlIM乙酰胺、和30g細(xì)菌pH5.2。COVEA鹽溶液每升由26gKCl、26gMgS04、76gKH2PO4、和50mlCOVEA痕量元素溶液組成。COVEA痕量元素溶液每升由0.04gNa2B4O7·10Η20、0·4gCuSO4·5Η20、0·8gFeSO4·7Η20、0·7gMnSO4·H20,0.8gNa2MoO2·2H20、10gZnSO4·7H20、禾口IOg檸檬酸組成。M410培養(yǎng)基每升由50g麥芽糖、50g葡萄糖、2gMgSO4·7H20、2gKH2PO4,4g檸檬酸無水粉末、8g酵母提取物、2g尿素、0.5gAMG痕量金屬溶液和0.5gCaCl2組成;pH6.0。AMG痕量金屬溶液每升由14.3gZnSO4·7Η20、2·5gCuSO4·5Η20、0·5gNiCl2·6Η20、13.8gFeSO4·7Η20、8·5gMnSO4·7Η20和3g檸檬酸組成。LB培養(yǎng)基每升由IOg胰蛋白胨、5g酵母提取物和5gNaCl組成。實施例1具有α-L-阿拉伯呋喃糖苷酶活性的特異腐質(zhì)霉GH62A多肽的鑒定ULTRAFL0L的蛋白質(zhì)分級。首先使用HIPREP26/10脫鹽柱(GEHealthcare,Piscataway,NJ,USA)來將2ml等分試樣的ULTRAFLOUNovozymesA/S,Bagsvaerd,丹麥)緩沖液交換入150mM氯化鈉-20mM乙酸鈉pH5中。然后通過用裝備有3,000道爾頓截留分子量膜(VivascienceAG,Hannover,德國)的VIVASPIN20旋轉(zhuǎn)柱進(jìn)行超濾來將所得的經(jīng)緩沖液交換的材料(18.5ml)濃縮至3ml。然后通過在與等度洗脫相同的緩沖液條件下在HIL0AD26/60SUPERDEX200制備級大小排阻柱(GEHealthcare,Piscataway,NJ,USA)上進(jìn)行大小排阻層析來分級2ml等分試樣的經(jīng)緩沖液交換并且濃縮的ULTRAFLOL材料。將在280nm處顯示UV吸光度的級分組合成來自不同洗脫時間的六份不同匯合物,每份范圍為20-40ml總體積。通過用裝備有3,OOODa截留分子量膜的VIVASPIN20旋轉(zhuǎn)柱進(jìn)行超濾來將匯合的級分濃縮至l_5ml。在CRITERION8-16%Tris-HClSDS-PAGE凝膠(Bio-RadLaboratories,Inc.,Hercules,CA,USA)上根據(jù)制造商建議的條件分離20μ1每種濃縮的匯合級分。使用PRECISIONPLUSPROTEIN標(biāo)準(zhǔn)品(Bio-RadLaboratories,Inc.,Hercules,CA,USA)作為分子量標(biāo)志物。從盒取出凝膠,并用考馬斯藍(lán)(G250)蛋白質(zhì)染料(ΒΙΟ-SAFE考馬斯染料,Bio-RadLaboratories,Inc.,Hercules,CA,USA)染色,并用剃刀刀片切割可見條帶,用于蛋白質(zhì)鑒定分析。對多肽的凝膠內(nèi)消化以進(jìn)行肽測序。使用MultiPROBEΠ液體操作機(jī)器人(LiquidHandlingRobot)(PerkinElmerLifeandAnalyticalSciences,Boston,MA,32USA)來實施凝膠內(nèi)消化。用50μ1在IOOmM碳酸氫銨ρΗ8.0中的IOmM二硫蘇糖醇(DTT)來還原45kDa蛋白質(zhì)凝膠條帶30分鐘。還原后,用50μ1在IOOmM碳酸氫銨ρΗ8.0中的55mM碘乙酰胺來使凝膠塊烷基化20分鐘。容許干燥的凝膠塊在25μ1在50mM碳酸氫銨PH8中的胰蛋白酶消化溶液(6ng/l·!1測序級胰蛋白酶;Promega,Madison,WI,USA)中于室溫膨脹30分鐘,接著于40°C消化8小時。上文所描述的每個反應(yīng)步驟之后是遵循制造商的標(biāo)準(zhǔn)方案用合適的溶液進(jìn)行的許多清洗和預(yù)清洗。使用50μ1乙腈來使各反應(yīng)間的凝膠塊脫水,并在各步驟間風(fēng)干凝膠塊。用HPLC級水中的甲酸/2%乙腈提取肽兩次達(dá)30分鐘。將肽提取溶液轉(zhuǎn)移至96孔有緣PCR型平板(ABGene,Rochester,NY,USA),其已經(jīng)冷卻至10-15°C,并用96孔板蓋(PerkinElmerLifeandAnalyticalSciences,Boston,ΜΑ,USA)覆蓋以阻止蒸發(fā)。于4°C進(jìn)一步貯存平板,直至可以實施質(zhì)譜術(shù)分析。蛋白質(zhì)鑒定。為了通過串聯(lián)質(zhì)譜術(shù)進(jìn)行從頭肽測序,使用Q-T0FMICR0,即混合IE交四極飛時1、司質(zhì)i普儀(hybridorthogonalquadrupo1etime—of—flightmassspectrometer)(WatersMicromassMSTechnologies,Milford,MA)jftSifLC/MS/MS^>豐斤。Q-TOFMICRO裝備有ULTIMATE毛細(xì)管和納流(nano-flow)HPLC系統(tǒng),其偶聯(lián)有FAM0S微自動取樣器和SWITCH0SII柱開關(guān)裝置(LCPackings/Dionex,Sunnyvale,CA,USA),用于使樣品濃縮和脫鹽。將樣品上樣至注射環(huán)(injectionloop)中安裝的保護(hù)柱(300μmIDX5cm,PEPMApC18)上,并使用SwitchosII泵用水中的0.1%甲酸以每分鐘40μ1清洗2分鐘。使用ΝΑΝ-75校準(zhǔn)器(calibrator)(Dionex,Sunnyvale,CA,USA)將肽在75μmIDχ15cm,C18,3μm,ΙΟΟΑPEPMAP(LCPackings,SanFrancisco,CA,USA)納流融合型毛細(xì)管柱(nanoflowfusedcapillarycolumn)上以來自175ul/分鐘的分流的175nl/分鐘的流速分離。在45分鐘時間間隔里施用0.甲酸中的5%至80%乙腈的步驟洗脫梯度。在215nm監(jiān)測柱洗脫液,并經(jīng)由安裝有納噴霧(nanospray)界面的電噴霧離子源引入Q-TOFMICRO中。Q-TOFMICRO完全受微處理器控制,其使用MASSLYNX軟件第4.1版(WatersMicromassMSTechnologies,Milford,MA,USA)來實現(xiàn)。在調(diào)查(survey)掃描模式中并且從m/z400至1990的質(zhì)量范圍及MS至MS/MS的開關(guān)標(biāo)準(zhǔn)獲得數(shù)據(jù),以包括大于每秒10.0次計數(shù)的離子強(qiáng)度和+2、+3和+4的電荷狀態(tài)??梢垣@得掃描時間為1.9秒和中間掃描時間為0.1秒的多至4個共洗脫種類的分析譜。通常使用45伏的錐孔電壓(conevoltage),并將碰撞能量編程為隨洗脫肽的質(zhì)量和電荷狀態(tài)而變化,并且在10_60伏的范圍內(nèi)。以自動方式將所獲得的譜組合,使它們平滑,并集中(center),并且產(chǎn)生峰列表。使用PR0TEINLYNXGlobalServer2.2.05軟件(WatersMicromassMSTechnologies,Milford,MA,USA)和PEAKSStudio第4·5版SPl(BioinformaticSolutionsInc.,Waterloo,Ontario,加拿大)針對選定的數(shù)據(jù)庫搜索此峰列表。評估來自PR0TEINLYNX和PEAKSStudio搜索的結(jié)果,通過評估每個感興趣離子的MS/MS譜來進(jìn)一步分析未鑒定的蛋白質(zhì),并通過鑒定y和b離子系列并將質(zhì)量差異與合適的氨基酸匹配來確定從頭序列。自凝膠內(nèi)消化的45kDa多肽凝膠條帶的數(shù)個多電荷離子(multiplychargedion)獲得從通過質(zhì)譜術(shù)進(jìn)行的從頭測序確定的肽序列。雙電荷胰蛋白酶肽離子604.26m/z序列測定為[[ILE/Leu]或Asp]-Thr-Ser-Glu-Asn-Asn-Pro-Phe-Ala-Gly-Arg(SEQIDNO:2的氨基酸249至259)。另一種雙電荷胰蛋白酶肽離子698.32m/z序列測定為[Gln/Lys]-Tyr-[Ile/Leu]-Met-[Ile/Leu]-Val-Glu-Ser-[Ile/Leu]-Gly-Ser-Arg(SEQIDNO2的氨基酸218至229)。另一種雙電荷胰蛋白酶肽離子711.32m/z序列測定為Asn-[Ile/Leu]-Trp-Val-[Ile/Leu]-Ala-Tyr-[Gln/Lys]-Trp-Gly-Arg(SEQIDNO2的氨基酸105至115)。另一種雙電荷胰蛋白酶肽離子726.84m/z序列測定為Ala-Ala-Val-Ala-Pro-Thr-Leu-Phe-Tyr-Phe-[Gln/Lys]-Pro-Lys(SEQIDNO2的氨基酸92至104)。另一種雙電荷胰蛋白酶肽離子1005.42m/z序列測定為Asn-Asp-[Ile/Leu]-Phe-Glu-Ala_Val-[Gln/Lys]-Val-Tyr-Thr-IIe-Asp-Gly-Ser-Asn-Pro-[Gln/Lys](SEQIDNO2的氨基酸200至217)。不能辨別[Ile/Leu]和[Gln/Lys],因為它們具有等同的質(zhì)量。實施例2特異腐質(zhì)霉DSM1800基因組DNA提取于45°C將特異腐質(zhì)霉DSM1800在PDA平板上培養(yǎng)至匯合。從PDA平板切割三塊4mm2正方形,并于41°C和200rpm接種入在帶擋板的125ml搖瓶中的25ml含有2%葡萄糖的YP培養(yǎng)基中達(dá)2天,期間以200rpm搖動。通過使用MIRACLOTH(Calbiochem,LaJolla,CA,USA)進(jìn)行過濾來收獲菌絲體,在去離子水中清洗兩次,并在液氮下冷凍。通過研缽和杵將冷凍的菌絲體研磨成細(xì)粉末,并使用DNEASY植物Maxi試劑盒(QIAGENInc.,Valencia,CA,USA)來分離總DNA。實施例3自特異腐質(zhì)霉DSM1800分離GH62Aα-L-阿拉伯呋喃糖苷酶基因的部分片段使用共有-簡并雜合寡核苷酸引物程序(C0DEH0P;Rose等,1998,NucleicAcidsResearch261628-1635),基于實施例1中所描述的鑒定出的肽片段將簡并引物設(shè)計成相關(guān)GH62序列的同源性區(qū)域。用于生成特異腐質(zhì)霉GH62Aα-L-阿拉伯呋喃糖苷酶基因的片段的簡并引物為引物HinsGH62sense15,-CCAAGTCGATCTGGGTNCTCGCNTAYCA-3,(SEQIDNO3)簡并引物HinsGH62sensel的蛋白質(zhì)翻譯PKSIffVLAYQ(SEQIDNO4)引物HinsGH62antil5,-AGTTGGCGCGNCCNGCRAANGG-3,(SEQIDNO5)簡并引物HinsGH62antil的蛋白質(zhì)翻譯PFAGRAN為了獲得特異腐質(zhì)霉GH62Aα-L-阿拉伯呋喃糖苷酶基因的初始DNA片段,于范圍為40°C至60°C的6個不同退火溫度實施梯度PCR。擴(kuò)增反應(yīng)(25μ1)由80ng特異腐質(zhì)霉DSM1800基因組DNA作為模板,0.4mM各種dATP、dTTP、dGTP和dCTP,50pmol各種引物HinsGH62sensel禾Π弓丨物HinsGH62antil,IXADVANTAGEGC-熔解LA緩沖液(ClontechLaboratories,Inc.,MountainView,CA,USA),和1.25個單位的ADVANTAGEGC基因組聚合酶混合物(ClontechLaboratories,Inc.,MountainView,CA,USA)組成。使用EPPENDORFMASTERCYCLER5333(EppendorfScientific,Inc.,ffestbury,NY,USA)來實施擴(kuò)增反應(yīng),所述EPPENDORFMASTERCYCLER5333編程為于95°C預(yù)變性1分鐘;各為于95°C的變性溫度達(dá)30秒;30個循環(huán),每個循環(huán)為于50°C+/-1(TC的溫度退火30秒(6個梯度選項)和于72°C延伸1分鐘;和于72°C最終延伸6分鐘。通過在TBE(每升10.8gTris堿、5.5g硼酸和4ml0.5MEDTApH8.0)緩沖液中進(jìn)行1.0%瓊脂糖凝膠電泳來分離反應(yīng)產(chǎn)物。從凝膠切割來自59.8°C退火溫度的約500bpPCR產(chǎn)物條帶,使用QIAQUICK凝膠提取試劑盒(QIAGENInc.,Valencia,CA,USA)根據(jù)制造商的說明來純化,并采用染料終止劑化學(xué)(Giesecke等,1992,JournalofVirologyMethods38:47_60)引物步行策略以Perkin-ElmerAppliedBiosystemsModel377XL自動DNA測序儀(Perkin-Elmer/AppliedBiosystems,Inc.,F(xiàn)osterCity,CA,USA)使用引物HinsGH62sensel和引物HinsGH62antil來測序。實施例4全長特異腐質(zhì)霉GH62Aα-L-阿拉伯呋喃糖苷酶基因的鑒定使用GEN0MEWALKER通用試劑盒(ClontechLaboratories,Inc.,MountainView,CA,USA)根據(jù)制造商的說明從特異腐質(zhì)霉DSM1800鑒定全長家族62α-L-阿拉伯呋喃糖苷酶基因。簡言之,用四種不同留下平端的限制酶(DraI、EcoRV,PvuII和StuI)分別消化來自特異腐質(zhì)霉DSM1800的總基因組DNA。然后分別將每批消化過的基因組DNA連接至GEN0MEWALKER銜接頭(ClontechLaboratories,Inc.,MountainView,CA,USA)以創(chuàng)建四個文庫。然后采用這四個文庫作為PCR反應(yīng)中的模板,所述PCR反應(yīng)使用下文所顯示的四種基因特異性引物,兩種用于通過編碼α-L-阿拉伯呋喃糖苷酶的N端的5’末端擴(kuò)增片段上游的初次和再次PCR,而兩種用于通過編碼α-L-阿拉伯呋喃糖苷酶的C端的3’末端擴(kuò)增片段下游的初次和再次PCR?;趤碜詫嵤├?中所描述的特異腐質(zhì)霉的部分家族62α-L-阿拉伯呋喃糖苷酶基因序列來設(shè)計下列引物。N端引物Hins_GH62_GSPl_R(初次)5’-AGCTGTCGCTGATGGAGCCCGAGAAGA-3‘引物Hins_GH62_GSP2_R(再次)5,-GAAGGCAGTCCGGCCCCATTGATATGC-3‘C-端引物Hins_GH62_GSPl_F(初次)5,-GCTCCAACCCCAAGCAGTACCTCATGC-3,(SEQIDNO8)引物Hins_GH62_GSP2_F(再次)5,-CCGCTACTTCCGCTCCTACGTCTCCAA-3,(SEQIDNO9)初次擴(kuò)增由最終體積25μ1中1μ1(約6ng)每個文庫作為模板、0.4mM各種dATP、dTTP、dGTP和dCTP、IOpmol銜接頭引物1(ClontechLaboratories,Inc.,MountainView,CA,USA)、50pmol弓丨物Hins_GH62_GSPl_R或Hins_GH62_GSPl_F、IXADVANTAGEGC-熔解LA緩沖液(ClontechLaboratories,Inc.,MountainView,CA,USA)和1.25個單位的ADVANTAGEGC基因組聚合酶混合物組成。使用EPPENDORFMASTERCYCLER5333來實施擴(kuò)增反應(yīng),編程為于95°C預(yù)變性1分鐘;7個循環(huán),每個為于95°C的溫度變性25秒;于72°C退火和延伸5分鐘;和32個循環(huán),每個為于95°C的溫度變性25秒;于67°C退火和延伸5分鐘;和于67°C最終延伸7分鐘。再次擴(kuò)增由最終體積25μ1中1μ1每種初次PCR產(chǎn)物作為模板、0.4mM各種dATP、dTTP、dGTP禾口dCTP、IOpmol祎接頭引物2(ClontechLaboratories,Inc.,MountainView,CA,USA)、50pmol弓丨物Hins_GH62_GSP2_R或Hins_GH62_GSP2_F、IXADVANTAGE(SEQIDNO6)(SEQIDNO7)35GC-熔解LA緩沖液和1.25個單位的ADVANTAGEGC基因組聚合酶混合物組成。使用EPPENDORFMASTERCYCLER5333來實施擴(kuò)增反應(yīng),編程為于95°C預(yù)變性1分鐘;5個循環(huán),每個為于95°C的溫度變性25秒;于72°C退火和延伸5分鐘;和20個循環(huán),每個為于95°C的溫度變性25秒;于67°C退火和延伸7分鐘;和于67°C最終延伸5分鐘。通過在TBE緩沖液中進(jìn)行1.0%瓊脂糖凝膠電泳來分離反應(yīng)產(chǎn)物。從5’端PCR擴(kuò)增物中,從凝膠切割來自DraI文庫的600bp產(chǎn)物條帶,使用QIAQUICK凝膠提取試劑盒根據(jù)制造商的說明來純化、并測序。從3’端PCR擴(kuò)增物中,從凝膠切割來自DraI文庫的1.Skb產(chǎn)物條帶,并從凝膠切割來自EcoRV文庫的700bp產(chǎn)物條帶,使用QIAQUICK凝膠提取試劑盒根據(jù)制造商的說明來純化、并測序。通過使用染料終止劑化學(xué)(Giesecke等,1992,見上文)的Perkin-ElmerAppliedBiosystemsModel377XL自動DNA測序儀和引物步行策略來實施PCR片段的DNA測序。使用銜接頭引物2、引物Hins_GH62_GSP2_R和引物Hins_GH62_GSP2_F來測序。對核苷酸序列數(shù)據(jù)細(xì)察質(zhì)量,并通過PHRED/PHRAP軟件(華盛頓大學(xué),Seattle,WA,USA)的幫助來彼此比較所有序列。與實施例3中所描述的來自特異腐質(zhì)霉的部分家族62α-L-阿拉伯呋喃糖苷酶基因序列比較和比對PCR片段序列結(jié)果?;诒疚暮蛯嵤├?中所獲得的基因片段來構(gòu)建基因模型,其容許用其它同源家族62α-L-阿拉伯呋喃糖苷酶測定基因的5’和3’端。實施例5全長特異腐質(zhì)霉GH62Aα-L-阿拉伯呋喃糖苷酶基因的克隆和黑曲霉表達(dá)載體的構(gòu)建設(shè)計下文所顯示的兩種合成的寡核苷酸引物以從由實施例2中制備的基因組DNAPCR擴(kuò)增出全長特異腐質(zhì)霉DSM1800α-L-阿拉伯呋喃糖苷酶基因。使用InFusion克隆試劑盒(BDBiosciences,PaloAlto,CA,USA)以將片段直接克隆入表達(dá)載體pBM120a(TO2006/078256)中。BDinfGH62有義NCO5,-ACACAACTGGCCATGAGGTCGGTTGCTGCTTTCCTC-3,(SEQIDNO10)BDinfantiGH62PACl5,-CAGTCACCTCTAGTTATTACTTACAAGGATTCGAGT-3,(SEQIDNO11)粗體字母代表編碼序列。剩余序列與pBM120a的插入位點同源。在PCR反應(yīng)中使用50皮摩爾的上述引物之每種,所述PCR反應(yīng)由25μ1最終體積中80ng特異腐質(zhì)霉基因組DNA,IXADVANTAGEGC-熔解LA緩沖液,0.4mM各種dATP、dTTP、dGTP和dCTP,和1.25個單位的ADVANTAGEGC基因組聚合酶混合物組成。使用EPPENDORFMASTERCYCLER5333來實施擴(kuò)增,編程為于94°C1分鐘的1個循環(huán);5個循環(huán),每個為于94°C30秒,50°C30秒和72°C90秒;和30個循環(huán),每個為于94°C30秒、60°C30秒和72°C90秒;和于72°C最終延伸5分鐘。然后加熱塊轉(zhuǎn)到4°C浸泡循環(huán)。通過在TBE緩沖液中進(jìn)行1.0%瓊脂糖凝膠電泳來分離反應(yīng)產(chǎn)物,其中從凝膠切割出約1.1-1.2kb產(chǎn)物條帶,并使用QIAQUICK凝膠提取試劑盒根據(jù)制造商的說明來純化。用NcoI和PacI來消化質(zhì)粒pBM120a,通過在TBE緩沖液中進(jìn)行1.0%瓊脂糖凝膠電泳來分離,并使用QIAQUICK凝膠提取試劑盒根據(jù)制造商的說明來純化。36使用InFusion克隆試劑盒(BDBiosciences,PaloAlto,CA,USA)將基因片段和消化過的載體連接在一起,產(chǎn)生pMMar4(圖2),其中α_L_阿拉伯呋喃糖苷酶基因的轉(zhuǎn)錄在來自黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸異構(gòu)酶基因的啟動子的雜合體(NA2_tpi啟動子)的控制下。連接反應(yīng)(20μ1)由IXInFusion緩沖液(BDBiosciences,PaloAlto,CA,USA),IXBSA(BDBiosciences,PaloAlto,CA,USA),1μ1InFusion酶(稀釋110)(BDBiosciences,PaloAlto,CA,USA),106ng用NcoI和PacI消化的pBM120a,禾口163ng純化的特異腐質(zhì)霉PCR產(chǎn)物組成。于室溫溫育反應(yīng)達(dá)30分鐘。使用2μ1反應(yīng)物來轉(zhuǎn)化大腸桿菌XLlOSOLOPACKGold超感受態(tài)細(xì)胞(Stratagene,LaJolla,CA,USA)。通過限制性消化來檢測含有pMMar4的大腸桿菌轉(zhuǎn)化體,并使用BIOROBOT9600(QIAGENInc.,Valencia,CA,USA)來制備質(zhì)粒DNA0使用染料_終止劑化學(xué)(Giesecke等,1992,見上文)和引物步行策略以Perkin-ElmerAppliedBiosystemsModel377XL自動DNA測序儀通過DNA測序來確認(rèn)pMMar4中的特異腐質(zhì)霉GH62A插入物。使用引物996271Na2tpi啟動子fwd和996270AMGrev(下文所顯示)來測序。996271Na2tpi啟動子fwd5,-ACTCAATTTACCTCTATCCACACTT-3,(SEQ.IDNO12)996270AMGrev5,-CTATAGCGAAATGGATTGATTGTCT-3,(SEQ.IDNO13)將含有pMMar4的克隆挑入2X50ml補(bǔ)充有每ml100μg氨芐青霉素的LB培養(yǎng)基中,并在250ml玻璃燒杯中于37°C和200rpm振動培養(yǎng)過夜。使用QIAGENMidi試劑盒根據(jù)制造商的說明從培養(yǎng)液分離質(zhì)粒pMMar4。用PmeI消化質(zhì)粒pMMar4,通過在TBE緩沖液中進(jìn)行1.0%瓊脂糖凝膠電泳來分離,并使用QIAQUICK凝膠提取試劑盒根據(jù)制造商的說明來純化含有GH62Aci-L-阿拉伯呋喃糖苷酶基因的片段以準(zhǔn)備好轉(zhuǎn)化黑曲霉MBinl20原生質(zhì)體。使用TOPOTACLONING試劑盒來將約1.1-1.2kb的片段克隆入pCR2.1-TOPO載體(Invitrogen,Carlsbad,CA,USA)中以生成pHinsGH62A(圖3)。通過DNA測序來確認(rèn)pHinsGH62A中的特異腐質(zhì)霉GH62A插入物。在2007年11月20日將大腸桿菌pHinsGH62A保藏于農(nóng)業(yè)研究機(jī)構(gòu)專利培養(yǎng)物保藏中心(AgriculturalResearchServicePatentCultureCollection),北區(qū)石if究中心(NorthernRegionalResearchCenter),Peoria,IL0實施例6編碼具有α-L-阿拉伯呋喃糖苷酶的GH62A多肽的全長特異腐質(zhì)霉基因組序列的表征對核苷酸序列數(shù)據(jù)(實施例5)細(xì)察質(zhì)量,并通過PHRED/PHRAP軟件(華盛頓大學(xué),Seattle,WA,USA)的幫助來彼此比較所有序列。圖IA和圖IB中顯示了核苷酸序列(SEQIDNO1)和推導(dǎo)的氨基酸序列(SEQIDNO2)?;蚪M片段編碼387個氨基酸的多肽。全長編碼序列和成熟編碼序列的%G+C含量分別是64.9%和65%。使用SignalP軟件程序(Nielsen等,1997,ProteinEngineering101-6),預(yù)測17個殘基的信號肽。預(yù)測的成熟蛋白含有370個氨基酸,具有40.3kDa的分子量。使用Needleman-Wunsch算法(Needleman禾口Wunsch,1970,J.Mol.Biol.48443-453)來測定氨基酸序列的比較配對全局比對,如EMBOSS的Needle程序中所執(zhí)行的,其中缺口開放罰分10,缺口延伸罰分0.5,和EBL0SUM62矩陣。比對顯示特異腐質(zhì)霉家族62α-L-阿拉伯呋喃糖苷酶基因的成熟多肽的推導(dǎo)氨基酸序列與黑曲霉阿拉伯木聚糖降解酶(GeneSeqP登錄號AAR94170)的推導(dǎo)氨基酸序列共享65.7%同一性(排除缺口)。實施例7特異腐質(zhì)霉GH62Aα-L-阿拉伯呋喃糖苷酶基因在黑曲霉MBinl20中的表達(dá)根據(jù)Christensen等,1988,Bio/Technology61419-1422的方法來制備黑曲霉MBinl20原生質(zhì)體。使用4ygPmeI消化過的pMMar4來轉(zhuǎn)化黑曲霉MBinl20。用經(jīng)PmeI消化的pMMar4轉(zhuǎn)化黑曲霉MBinl20產(chǎn)生約50個轉(zhuǎn)化體。將22個轉(zhuǎn)化體分離至各個COVEA尿素-乙酰胺+平板。從22個轉(zhuǎn)化體的匯合的COVEA尿素-乙酰胺+平板切割二塊3mm平方瓊脂塊,并分別接種入125ml塑料搖瓶中的25mlM410培養(yǎng)基中,并于34°C,250rpm溫育。溫育5天后,通過SDS-PAGE來分析6μ1來自每種培養(yǎng)物的上清液,所述SDS-PAGE使用CRITERION8-16%Tris-HClSDS-PAGE凝膠及CRITERIONCell(Bio-RadLaboratories,Inc.,Hercules,CA,USA)根據(jù)制造商的說明來進(jìn)行。用ΒΙΟ-SAFE考馬斯染料(Bio-RadLaboratories,Inc.,Hercules,CA,USA)對所得的凝膠染色。培養(yǎng)物的SDS-PAGE譜顯示約半數(shù)的轉(zhuǎn)化體具有約45kDa的主要條帶。選擇一個稱作黑曲霉MMar202的轉(zhuǎn)化體用于在黑曲霉中表達(dá)具有α_L_阿拉伯呋喃糖苷酶活性的特異腐質(zhì)霉GH62A多肽。實施例8黑曲霉MMar202的發(fā)酵搖瓶培養(yǎng)基每升由70g蔗糖和100大豆?jié)饪s物組成。痕量金屬溶液每升由13.SgFeSO4·7H20、14.3gZnSO4·7H20、11.6gMnSO4·Η20、2.5gCuSO4·5Η20、0·5gNiCl2·6H20禾口3.3g—水合檸檬酸組成。將100ml搖瓶培養(yǎng)基添加至500ml搖瓶。用來自黑曲霉MMar202的甘油孢子原液的200μ1接種搖瓶,并于30°C在軌道振蕩器上以220rpm溫育72小時。使用50ml來自4個不同搖瓶之每個的搖瓶培養(yǎng)液來接種3升發(fā)酵容器。發(fā)酵分批培養(yǎng)基每升由250g葡萄糖、5g(NH4)2S04、2.5gKH2P04、0.5gCaCl2·2H20、2gMgSO4-7H20,3gK2SO4Ug檸檬酸、Iml消沫劑和0.75ml痕量金屬溶液組成。痕量金屬溶液每升由13.8gFeSO4·7Η20、14·3gZnS04·7Η20、11·6gMnSO4·H20,2.5gCuSO4·5Η20、0·5gNiCl2·6Η20和3.3g—水合檸檬酸組成。發(fā)酵補(bǔ)料培養(yǎng)基每千克由406g麥芽糖、0.5g—水合檸檬酸、和Iml消泡劑組成。將總共2升發(fā)酵分批培養(yǎng)基添加至ApplikonBiotechnology二升玻璃夾套發(fā)酵罐(ApplikonBiotechnology,Schiedam,荷蘭)。以0至4g/l/小時的速率定量給料發(fā)酵補(bǔ)料培養(yǎng)基185小時的一段時間。將發(fā)酵容器維持于34°C的溫度,并使用Applikon1030控制系統(tǒng)(ApplikonBiotechnology,Schiedam,荷蘭)來將pH控制于設(shè)定點5.1+/-0.1。以Ivvm的速率將空氣添加至容器,并通過以IlOOrpm旋轉(zhuǎn)的Rushton葉輪來攪動培養(yǎng)液。發(fā)酵結(jié)束時,從容器收獲全培養(yǎng)液,并以3000Xg離心來除去生物量。將上清液無菌過濾,并于5至10°C貯存。實施例9具有α-L-阿拉伯呋喃糖苷酶活性的特異腐質(zhì)霉GH62A多肽的純化首先將含有黑曲霉中表達(dá)的具有α-L-阿拉伯呋喃糖苷酶活性的重組特異腐質(zhì)霉GH62A多肽的發(fā)酵培養(yǎng)液上清液(實施例8)緩沖液交換入25mM乙酸鈉pH5.1中,38其通過流過400ml在相同緩沖液中平衡的SEPHADEXG-25細(xì)樹脂(GEHealthcare,Piscataway,NJ,USA)來進(jìn)行。然后使用以相同緩沖液平衡的MONOSHR16/10柱(GEHealthcare,Piscataway,NJ,USA)來純化所得的經(jīng)緩沖液交換的材料(50ml),然后用0-0.5M氯化鈉的線性梯度來洗脫。接著,通過SDS-PAGE來分析在280nm處顯示UV吸光度的級分。在CRITERION8-16%Tris-HClSDS-PAGE凝膠上根據(jù)制造商建議的條件來分離2.5μ1級分等分試樣。使用PRECISIONPLUSPROTEIN標(biāo)準(zhǔn)品作為分子量標(biāo)志物。從盒取出凝膠,并用INSTANTBLUE考馬斯藍(lán)蛋白質(zhì)染料(ExpedeonProteinSolutions,Cambridge,UK)根據(jù)制造商建議的條件來染色。還用中等粘度小麥阿拉伯木聚糖(MegazymeInternationalIreland,Ltd.,Bray,Co.Wicklow,愛爾蘭)對在280nm處顯示UV吸光度的級分測定活性。將級分稀釋,并在96孔COSTAR微量滴定板(CorningInc.,Corning,NY,USA)中與每ml具有0.01%(w/v)TWEEN20的50mM乙酸鈉pH5中4.75mg小麥阿拉伯木聚糖在總體積200μ1中于40°C—起溫育70分鐘。通過添加50μ12%氫氧化鈉來停止反應(yīng),并使用適用于96孔微板形式的對羥基苯甲酸酰胼(PHBAH,Sigma,St.Louis,MO,USA)測定法來測定還原糖含量,如下文所述。簡言之,在96孔錐底COSTAR微量滴定板中放置100μ1等分試樣的樣品。通過將50μ1在2%NaOH中的1.5%(w/v)PHBAH添加至每孔來起始反應(yīng)。在無蓋的情況中于95°C加熱平板10分鐘。容許平板冷卻至室溫,并將50μ1H2O添加至每孔。將100μ1來自每孔的等分試樣轉(zhuǎn)移至平底96孔板,并使用SPECTRAMAX微板讀板儀(MolecularDevices,Sunnyvale,CA,USA)來測量在410nm的吸光度。使用葡萄糖標(biāo)準(zhǔn)品(0.100-0.065mg/ml)來準(zhǔn)備標(biāo)準(zhǔn)曲線以將在410nm獲得的吸光度值轉(zhuǎn)化成葡萄糖等同物,并量化測定法中釋放的還原糖量。匯集含有SDS-PAGE上40-150kD的長的擴(kuò)散條帶,而且還在小麥阿拉伯木聚糖的情況中具有活性的級分,總體積為48ml。接著使用具有IOkDa截留分子量膜的VIVASPIN20超濾濃縮器來將匯集的材料濃縮至1.5ml體積。然后使用HIL0AD26/60SUPERDEX75制備級柱(GEHealthcare,Piscataway,NJ,USA)在具有125mM氯化鈉的25mM乙酸鈉pH5中純化濃縮的材料。以與上文所描述類似的方式通過SDS-PAGE和小麥阿拉伯木聚糖活性來分析和匯集柱級分,以產(chǎn)生純化的特異腐質(zhì)霉α-L-阿拉伯呋喃糖苷酶。使用微板BCA蛋白質(zhì)測定試劑盒(Pierce,Rockford,IL,USA)來測定純化的特異腐質(zhì)霉α-L-阿拉伯呋喃糖苷酶的蛋白質(zhì)濃度。實施例10具有α-L-阿拉伯呋喃糖苷酶活性的特異腐質(zhì)霉GH62A多肽的酶活性將具有α-L-阿拉伯呋喃糖苷酶活性的純化的特異腐質(zhì)霉GH62A多肽(實施例9)稀釋,并在96孔COSTAR微量滴定板中與每mlIOOmM乙酸鈉pH5中5mg中等粘度小麥阿拉伯木聚糖(MegazymeInternationalIreland,Ltd.,Bray,Co.Wicklow,愛爾蘭)在總體積200μ1中于40°C—起溫育30分鐘。溫育后,在冰上冷卻平板,然后通過具有BIOMAX5kDa截留分子量膜(Millipore,Billerica,MA,USA)的ULTRAFREE-0.5離心濾器來過濾反應(yīng)物。然后對濾液分析糖含量。通過具有0.05%w/w苯甲酸的0.005M硫酸以每分鐘0.6ml的流速從4.6x250mmAMINEXHPX-87H柱(Bio-RadLaboratories,Inc.,Hercules,CA,USA)于65°C洗脫后,通過積分來自通過純糖樣品校準(zhǔn)的折射率檢測器(CHEMSTATION,AGILENT1100HPLC,AgilentTechnologies,SantaClara,CA,USA)的葡萄糖、阿拉伯糖和木糖信號來定量,從而測量樣品濾液的糖濃度。觀察到具有α-L-阿拉伯呋喃糖苷酶活性的特異腐質(zhì)霉多肽在測定條件下從小麥阿拉伯木聚糖釋放92.6mg阿拉伯糖/mg酶蛋白和7.4mg木糖/mg酶蛋白。生物材料保藏依據(jù)布達(dá)佩斯條約的條款,下述的生物學(xué)材料已經(jīng)保藏于農(nóng)業(yè)研究機(jī)構(gòu)專利培養(yǎng)物保藏中心(AgriculturalResearchServicePatentCultureCollection)或農(nóng)業(yè)研究培養(yǎng)物保藏中心(AgriculturalResearchCultureCollection,NRRL),北區(qū)研究中心(NorthernRegionalResearchCenter),1815UniversityStreet,Peoria,Illinois,61604,USA,并給予下述的保藏號保藏物保藏號保藏日期大腸桿菌pHinsGH62ANRRLB-500752007年11月20日所述菌株于下述條件下保藏確保在本專利申請未決期間,由外國專利法授權(quán)的人能夠獲得所述培養(yǎng)物。所述保藏物為所保藏菌株的基本上純的培養(yǎng)物。在提交了該申請的副本,或其后續(xù)文本的國家,依據(jù)該外國專利法律的要求,可以獲得所述保藏物。然而,應(yīng)當(dāng)理解,保藏物的獲得并不構(gòu)成對實施本發(fā)明的許可,實施本發(fā)明是對政府行為所授予的專利權(quán)的侵犯。通過下列編號的段落來進(jìn)一步描述本發(fā)明[1]具有α-L-阿拉伯呋喃糖苷酶活性的分離的多肽,其選自下組(a)包含氨基酸序列的多肽,所述氨基酸序列與SEQIDNO:2的成熟多肽具有至少70%序列同一性;(b)由多核苷酸編碼的多肽,所述多核苷酸在至少中-高嚴(yán)格條件下與SEQIDNO:1的成熟多肽編碼序列或其全長互補(bǔ)鏈雜交;(c)由多核苷酸編碼的多肽,所述多核苷酸包含與SEQIDNO1的成熟多肽編碼序列具有至少70%序列同一性的核苷酸序列;和(d)SEQIDNO2的成熟多肽的包含取代、缺失和/或插入一個或多個(數(shù)個)氨基酸的變體。[2]段落1的多肽,其包含與SEQIDNO2的成熟多肽具有至少70%序列同一性的氨基酸序列。[3]段落2的多肽,其包含與SEQIDNO2的成熟多肽具有至少75%序列同一性的氨基酸序列。[4]段落3的多肽,其包含與SEQIDNO2的成熟多肽具有至少80%序列同一性的氨基酸序列。[5]段落4的多肽,其包含與SEQIDNO2的成熟多肽具有至少85%序列同一性的氨基酸序列。[6]段落5的多肽,其包含與SEQIDNO2的成熟多肽具有至少90%序列同一性的氨基酸序列。[7]段落6的多肽,其包含與SEQIDNO2的成熟多肽具有至少95%序列同一性的氨基酸序列。[8]段落7的多肽,其包含與SEQIDNO2的成熟多肽具有至少97%序列同一性的氨基酸序列。[9]段落1的多肽,其包含SEQIDNO2的氨基酸序列或其具有α-L-阿拉伯呋喃糖苷酶活性的片段,或由SEQIDNO:2的氨基酸序列或其具有α-L-阿拉伯呋喃糖苷酶活性的片段組成。[10]段落9的多肽,其包含SEQIDNO2的氨基酸序列或由SEQIDNO2的氨基酸序列組成。[11]段落9的多肽,其包含SEQIDNO2的成熟多肽或由SEQIDNO2的成熟多肽組成。[12]段落1的多肽,其由多核苷酸編碼,所述多核苷酸在至少中-高嚴(yán)格條件下與SEQIDNO1的成熟多肽編碼序列或其全長互補(bǔ)鏈雜交。[13]段落12的多肽,其由多核苷酸編碼,所述多核苷酸在至少高嚴(yán)格條件下與SEQIDNO1的成熟多肽編碼序列或其全長互補(bǔ)鏈雜交。[14]段落1的多肽,其由多核苷酸編碼,所述多核苷酸包含與SEQIDN0:1的成熟多肽編碼序列具有至少70%序列同一性的核苷酸序列。[15]段落14的多肽,其由多核苷酸編碼,所述多核苷酸包含與SEQIDNO1的成熟多肽編碼序列具有至少75%序列同一性的核苷酸序列。[16]段落15的多肽,其由多核苷酸編碼,所述多核苷酸包含與SEQIDNO1的成熟多肽編碼序列具有至少80%序列同一性的核苷酸序列。[17]段落16的多肽,其由多核苷酸編碼,所述多核苷酸包含與SEQIDNO1的成熟多肽編碼序列具有至少85%序列同一性的核苷酸序列。[18]段落17的多肽,其由多核苷酸編碼,所述多核苷酸包含與SEQIDNO1的成熟多肽編碼序列具有至少90%序列同一性的核苷酸序列。[19]段落18的多肽,其由多核苷酸編碼,所述多核苷酸包含與SEQIDNO1的成熟多肽編碼序列具有至少95%序列同一性的核苷酸序列。[20]段落19的多肽,其由多核苷酸編碼,所述多核苷酸包含與SEQIDNO1的成熟多肽編碼序列具有至少97%序列同一性的核苷酸序列。[21]段落1的多肽,其由多核苷酸編碼,所述多核苷酸包含SEQIDN0:1的核苷酸序列或其編碼具有α-L-阿拉伯呋喃糖苷酶活性的片段的亞序列,或由SEQIDΝ0:1的核苷酸序列或其編碼具有α-L-阿拉伯呋喃糖苷酶活性的片段的亞序列組成。[22]段落21的多肽,其由多核苷酸編碼,所述多核苷酸包含SEQIDNO=I的核苷酸序列或由SEQIDNO1的核苷酸序列組成。[23]段落21的多肽,其由多核苷酸編碼,所述多核苷酸包含SEQIDNO=I的成熟多肽編碼序列或由SEQIDNO1的成熟多肽編碼序列組成。[24]段落1的多肽,其中所述多肽是SEQIDNO:2的成熟多肽的包含取代、缺失和/或插入一個或多個(數(shù)個)氨基酸的變體。[25]段落1的多肽,其由質(zhì)粒pHinsGH62A中所含的所述多核苷酸編碼,所述質(zhì)粒pHinsGH62A包含在大腸桿菌NRRLB-50075中。[26]段落1-25中任一項的多肽,其中所述成熟多肽是SEQIDNO2的氨基酸18至387。[27]段落1-26中任一項的多肽,其中所述成熟多肽編碼序列是SEQIDNO1的核苷酸52至1161。[28]分離的多核苷酸,其包含編碼段落1-27中任一項的多肽的核苷酸序列。[29]段落28的分離的多核苷酸,其在SEQIDNO:1的成熟多肽編碼序列中包含至少一個突變,其中所述突變核苷酸序列編碼SEQIDNO:2的成熟多肽。[30]核酸構(gòu)建體,其包含段落28或29的多核苷酸,所述多核苷酸與一個或多個(數(shù)個)調(diào)控序列可操作連接,所述調(diào)控序列指導(dǎo)多肽在表達(dá)宿主中生成。[31]重組表達(dá)載體,其包含段落30的核酸構(gòu)建體。[32]重組宿主細(xì)胞,其包含段落30的核酸構(gòu)建體。[33]生成段落1-27中任一項的多肽的方法,包括(a)在有益于所述生產(chǎn)多肽的條件下培養(yǎng)細(xì)胞,所述細(xì)胞以其野生型形式生成所述多肽;和(b)回收所述多肽。[34]生產(chǎn)段落1-27中任一項的多肽的方法,包括(a)在有益于所述生產(chǎn)多肽的條件下培養(yǎng)包含核酸構(gòu)建體的宿主細(xì)胞,所述核酸構(gòu)建體包含編碼所述多肽的核苷酸序列;和(b)回收所述多肽。[35]生成親本細(xì)胞的突變體的方法,包括破壞或缺失編碼段落1-27中任一項的多肽的核苷酸序列,得到與所述親本細(xì)胞相比產(chǎn)生更少所述多肽的突變體。[36]通過段落35的方法生成的突變細(xì)胞。[37]段落36的突變細(xì)胞,其進(jìn)一步包含編碼天然的或異源的蛋白質(zhì)的基因。[38]生產(chǎn)蛋白質(zhì)的方法,包括(a)在有益于所述蛋白質(zhì)生產(chǎn)的條件下培養(yǎng)段落37的突變細(xì)胞;和(b)回收所述蛋白質(zhì)。[39]段落28或29的分離的多核苷酸,其通過如下獲得(a)在至少中-高嚴(yán)格條件下,將DNA的群體與SEQIDNO=I的成熟多肽編碼序列或其全長互補(bǔ)鏈雜交;和(b)分離雜交的多核苷酸,其編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽。[40]段落39的分離的多核苷酸,其通過如下獲得(a)在至少高嚴(yán)格條件下,將DNA的群體與SEQIDNO=I的成熟多肽編碼序列或其全長互補(bǔ)鏈雜交;和(b)分離雜交的多核苷酸,其編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽。[41]段落39或40的分離的多核苷酸,其中所述成熟多肽編碼序列是SEQIDNO1的核苷酸52至1161。[42]生成多核苷酸的方法,所述多核苷酸包含編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽的突變核苷酸序列,所述方法包括(a)將至少一個突變引入SEQIDN0:1的成熟多肽編碼序列,其中所述突變核苷酸序列編碼多肽,該多肽包含SEQIDNO:2的成熟多肽或由SEQIDNO2的成熟多肽組成;和(b)回收包含所述突變核苷酸序列的多核苷酸。[43]通過段落42的方法生成的突變多核苷酸。[44]生產(chǎn)多肽的方法,包括(a)在有益于所述生產(chǎn)多肽的條件下培養(yǎng)細(xì)胞,所述細(xì)胞包含編碼所述多肽的段落43的突變多核苷酸;和(b)回收所述多肽。[45]生產(chǎn)段落1-27中任一項的多肽的方法,包括(a)在有益于所述生產(chǎn)多肽的條件下培養(yǎng)轉(zhuǎn)基因植物或植物細(xì)胞,其包含編碼多肽的多核苷酸;和(b)回收所述多肽。[46]轉(zhuǎn)基因植物、植物部分或植物細(xì)胞,其用編碼段落1-27中任一項的多肽的多核苷酸轉(zhuǎn)化。[47]雙鏈抑制性RNA(dsRNA)分子,其包含段落28或29的多核苷酸的亞序列,其中任選地所述dsRNA是siRNA或miRNA分子。[48]段落47的雙鏈抑制性RNA(dsRNA)分子,其長度為約15、16、17、18、19、20、21、22、23、24、25或更多個雙鏈體核苷酸。[49]抑制細(xì)胞中多肽的表達(dá)的方法,包括對所述細(xì)胞施用雙鏈RNA(dsRNA)分子或者在所述細(xì)胞中表達(dá)雙鏈RNA(dsRNA)分子,其中所述dsRNA包含段落28或29的多核苷酸的亞序列。[50]段落49的方法,其中所述dsRNA的長度為約15、16、17、18、19、20、21、22、23、24、25或更多個雙鏈體核苷酸。[51]核酸構(gòu)建體,其包含編碼蛋白質(zhì)的基因,所述基因與編碼信號肽的核苷酸序列可操作連接,所述信號肽包含SEQIDNO2的氨基酸1至17或由SEQIDNO2的氨基酸1至17組成,其中所述基因?qū)τ谒龊塑账嵝蛄卸允峭鈦淼?。[52]重組表達(dá)載體,其包含段落51的核酸構(gòu)建體。[53]重組宿主細(xì)胞,其包含段落51的核酸構(gòu)建體。[54]生產(chǎn)蛋白質(zhì)的方法,包括(a)在有益于所述蛋白質(zhì)生產(chǎn)的條件下培養(yǎng)段落53的重組宿主細(xì)胞;和(b)回收所述蛋白質(zhì)。[55]用于降解木聚糖的方法,包括用具有段落1-27中任一項的具有α-L-阿拉伯呋喃糖苷酶活性的多肽處理含有木聚糖的材料。[56]段落55的方法,其進(jìn)一步包括用一種或多種(數(shù)種)木聚糖降解酶處理所述含有木聚糖的材料。[57]段落56的方法,其中所述一種或多種(數(shù)種)木聚糖降解酶選自下組木聚糖酶、阿拉伯呋喃糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶、木糖苷酶和葡糖醛酸糖苷酶。[58]段落55的方法,其中所述含有木聚糖的材料是動物飼料。[59]段落55的方法,其中所述含有木聚糖的材料是Kraft漿。[60]段落55的方法,其中所述含有木聚糖的材料是纖維素或木素纖維素材料。本文描述和要求保護(hù)的發(fā)明并不受限于本文所公開的具體方面的范圍,因為這些方面意欲作為本發(fā)明幾個方面的說明。任何等同的方面意欲在本發(fā)明的范圍之內(nèi)。實際上,從前面的說明中,除本文所顯示和描述的之外,本發(fā)明的各種修改對于本領(lǐng)域的技術(shù)人員而言會是顯而易見的。這些修改也意欲落入所附權(quán)利要求書的范圍內(nèi)。在沖突的情況下,將以包括定義的本公開內(nèi)容為準(zhǔn)。4權(quán)利要求一種具有αL阿拉伯呋喃糖苷酶活性的分離的多肽,其選自下組(a)包含氨基酸序列的多肽,所述氨基酸序列與SEQIDNO2的成熟多肽具有至少70%序列同一性;(b)由多核苷酸編碼的多肽,所述多核苷酸在至少中高嚴(yán)格條件下與SEQIDNO1的成熟多肽編碼序列或其全長互補(bǔ)鏈雜交;(c)由多核苷酸編碼的多肽,所述多核苷酸包含與SEQIDNO1的成熟多肽編碼序列具有至少70%序列同一性的核苷酸序列;和(d)SEQIDNO2的成熟多肽的包含取代、缺失和/或插入一個或多個(數(shù)個)氨基酸的變體。2.權(quán)利要求1的多肽,其包含SEQIDNO2的氨基酸序列或其具有α-L-阿拉伯呋喃糖苷酶活性的片段,或由SEQIDNO:2的氨基酸序列或其具有α-L-阿拉伯呋喃糖苷酶活性的片段組成。3.權(quán)利要求1的多肽,其由多核苷酸編碼,所述多核苷酸包含SEQIDNO:1的核苷酸序列或其編碼具有α-L-阿拉伯呋喃糖苷酶活性的片段的亞序列,或由SEQIDNO:1的核苷酸序列或其編碼具有α-L-阿拉伯呋喃糖苷酶活性的片段的亞序列組成。4.權(quán)利要求1的多肽,其由質(zhì)粒pHinsGH62A中所含的所述多核苷酸編碼,所述質(zhì)粒pHinsGH62A包含在大腸桿菌NRRLB-50075中。5.一種分離的多核苷酸,其包含編碼權(quán)利要求1-4中任一項的多肽的核苷酸序列。6.一種核酸構(gòu)建體,其包含權(quán)利要求5的多核苷酸,所述多核苷酸與一個或多個(數(shù)個)調(diào)控序列可操作連接,所述調(diào)控序列指導(dǎo)所述多肽在表達(dá)宿主中生成。7.—種重組宿主細(xì)胞,其包含權(quán)利要求6的核酸構(gòu)建體。8.—種生成權(quán)利要求1-4中任一項的多肽的方法,包括(a)在有益于所述多肽生成的條件下培養(yǎng)細(xì)胞,所述細(xì)胞以其野生型形式生成所述多肽;并(b)回收所述多肽。9.一種生成權(quán)利要求1-4中任一項的多肽的方法,包括(a)在有益于所述多肽生成的條件下培養(yǎng)包含核酸構(gòu)建體的宿主細(xì)胞,所述核酸構(gòu)建體包含編碼所述多肽的核苷酸序列;并(b)回收所述多肽。10.一種生成親本細(xì)胞的突變體的方法,包括破壞或缺失編碼權(quán)利要求1-4中任一項的多肽的核苷酸序列,得到與所述親本細(xì)胞相比產(chǎn)生更少所述多肽的突變體。11.通過權(quán)利要求10的方法生成的突變細(xì)胞。12.—種生成權(quán)利要求1-4中任一項的多肽的方法,包括(a)在有益于所述多肽生成的條件下培養(yǎng)轉(zhuǎn)基因植物或植物細(xì)胞,所述轉(zhuǎn)基因植物或植物細(xì)胞包含編碼所述多肽的多核苷酸;并(b)回收所述多肽。13.轉(zhuǎn)基因植物、植物部分或植物細(xì)胞,其用編碼權(quán)利要求1-4中任一項的多肽的多核苷酸轉(zhuǎn)化。14.一種雙鏈抑制性RNA(dsRNA)分子,其包含權(quán)利要求5的多核苷酸的亞序列,其中任選地,所述dsRNA是siRNA或miRNA分子。15.一種抑制多肽在細(xì)胞中表達(dá)的方法,包括對所述細(xì)胞施用雙鏈RNA(dsRNA)分子或者在所述細(xì)胞中表達(dá)雙鏈RNA(dsRNA)分子,其中所述dsRNA包含權(quán)利要求5的多核苷酸的亞序列。16.一種核酸構(gòu)建體,其包含編碼蛋白質(zhì)的基因,所述基因與編碼信號肽的核苷酸序列可操作連接,所述信號肽包含SEQIDNO2的氨基酸1至17,或由SEQIDNO2的氨基酸1至17組成,其中所述基因?qū)τ谒龊塑账嵝蛄卸允峭鈦淼摹?7.—種重組宿主細(xì)胞,其包含權(quán)利要求16的核酸構(gòu)建體。18.—種生成蛋白質(zhì)的方法,包括(a)在有益于所述蛋白質(zhì)生成的條件下培養(yǎng)權(quán)利要求17的重組宿主細(xì)胞;并(b)回收所述蛋白質(zhì)。19.一種用于降解木聚糖的方法,包括用權(quán)利要求1-4中任一項的具有α-L-阿拉伯呋喃糖苷酶活性的多肽處理含有木聚糖的材料。20.權(quán)利要求19的方法,其進(jìn)一步包括用一種或多種(數(shù)種)木聚糖降解酶處理所述含有木聚糖的材料。全文摘要本發(fā)明涉及具有α-L-阿拉伯呋喃糖苷酶活性的分離的多肽和編碼該多肽的分離的多核苷酸。本發(fā)明還涉及包含所述多核苷酸的核酸構(gòu)建體、載體、和宿主細(xì)胞以及生成和使用所述多肽的方法。文檔編號C12N9/24GK101978049SQ200880125640公開日2011年2月16日申請日期2008年11月20日優(yōu)先權(quán)日2007年11月30日發(fā)明者米歇爾·馬蘭塔,詹姆斯·蘭斯頓,金伯利·布朗申請人:諾維信公司