專利名稱::蜘蛛絲蛋白和用于產(chǎn)生蜘蛛絲蛋白的方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及蛋白質(zhì)的重組產(chǎn)生的領(lǐng)域。更特別地,本發(fā)明涉及蜘蛛絲蛋白的重組產(chǎn)生。本發(fā)明提供了新的分離的大壺腹腺蛛絲蛋白(majorampullatespidroin)和大壺腹腺蛛絲蛋白融合蛋白,以及用于產(chǎn)生此類蛋白的方法和多聚核酸分子。還提供了大壺腹腺蛛絲蛋白的多聚體和用于產(chǎn)生此類多聚體的方法。發(fā)明背景蜘蛛絲是天然的高性能多聚體,由于強度和彈性的組合,其獲得了極其高的韌性。在蜘蛛中存在高達(dá)7個專門化的腺體,所述腺體產(chǎn)生多種具有不同機械性質(zhì)和功能的絲纖維類型。由大壺腹腺(majorampullategland)產(chǎn)生的拖絲(draglinesilk)是韌性最強的纖維,并且基于重量其性能優(yōu)于人造材料例如高強度鋼和芳綸(Kevlar)。拖絲的性質(zhì)在開發(fā)用于醫(yī)療或技術(shù)目的的新材料中是非常吸收人的。拖絲由兩種主要的多肽(通常稱為大壺腹腺蛛絲蛋白(MaSp)1和2,但在十字園妹(^T5/e^心a^邁"^)中稱為ADF-3和ADF-4)組成。取決于分析的取樣年齡(sampleage)和條件,這些蛋白質(zhì)具有200至720kDa的表觀分子量,但至今未報導(dǎo)過全長蜘蛛拖絲基因。在Huemmerich,D.等人,Novelassemblypropertiesofrecombinantspiderdraglinesilkproteins.Curr.Biol.14,2070-2074(2004)中描述了拖絲多肽的性質(zhì)。已知的拖絲蛛絲蛋白(spidroin)由交替出現(xiàn)的富含丙氨酸的區(qū)段(其在纖維中形成結(jié)晶P-折疊)和富含甘氨酸的區(qū)段(其更柔韌并且大部分缺乏有序結(jié)構(gòu))的高度重復(fù)的嵌段(block)組成。C-末端區(qū)域是非重復(fù)的,是物種間高度保守的,并且采取cc-螺旋構(gòu)象。拖絲蛋白的N-末端區(qū)域直至最近才得到表征,其中揭示出了在不同蛛絲蛋白之間并且還在不同蜘蛛種類之間高度保守的N-末端結(jié)構(gòu)域(Rising,A.等人,N-terminalnonrepetitivedomaincommontodragline,flagel1iform,andcylindriformspidersilkproteins.Biomacromolecules7,3120-3124(2006))。拖絲的機械性質(zhì)在物種之間是變化的;^//7roW力e/o;^s;的拖絲比來自例如十字園蛛或棒絡(luò)新婦蛛(#e/7h7ac/aw》es)的拖絲更硬、更強(需要更大的力才能扯斷)和可延伸性更低。來自^//^oW力e/7o;^M的拖絲看起來具有比來自十字園蛛的拖絲更大比例的結(jié)晶P-折疊結(jié)構(gòu),這很可能是由于^/iro^力e/2o;^MaSp在到目前為止所分析的所有種類中具有最高的聚丙氨酸含量(Pouchkina-Stantcheva,N.N.&McQueen-Mason,S.J.Molecularstudiesofanoveldraglinesilkfromanurserywebspider,Euprosthenopssp.(Pisauridae).CompBiochemPhysiolBBiochemMolBiol138,371-376(2004))。產(chǎn)生人造蜘蛛絲的嘗試已使用了天然或合成的編碼拖絲蛋白的基因片段,因為至今還未曾報導(dǎo)過全長基因。已在各種不同的系統(tǒng)(包括細(xì)菌、酵母、哺乳動物細(xì)胞、植物、昆蟲細(xì)胞、轉(zhuǎn)基因蠶和轉(zhuǎn)基因山羊)中表達(dá)重組拖絲蛋白。參見,例如Lewis,R.V.等人,Expressionandpurificationofaspidersilkproteins:anewstrategyforproducingrepetitiveproteins.ProteinExpr.Purif-7,400-406(1996);Fahnestock,S.R.&Irwin,S,L.SyntheticspiderdraglinesilkproteinsandtheirproductioninEscherichiacoli.Appl.Microbiol.Biotechnol.47,23-32(1997);Arcidiacono,S.等人,PurificationandcharacterizationofrecombinantspidersilkexpressedinEscherichiacoli.Appl,Microbiol.Biotechnol-49,31-38(1998);Fahnestock,S.R.&Bedzyk,LA.ProductionofsyntheticspiderdraglinesilkproteininPichiapastoris.Appl.Microbiol.Biotechnol.47,33-39(1997);和Lazaris,A.等人,Spidersilkfibersspun'fromsolublerecombinantsilkproducedinmammaliancells.Science295,472-476(2002)。W02004/016651(TheUniversityofYork)^^開了編碼來自^"/7roW力e力o戸sp的MaSpl蛋白的內(nèi)部重復(fù)部分的核酸序列。沒有表達(dá)蛋白質(zhì)。Huemmerich,D.等人,Primarystructureelementsofspiderdraglinesilksandtheircontributiontoproteinsolubility.Biochemistry43,13604-13612(2004)公開了合成基因"(AQ)12NR3,,,其編碼重復(fù)的富含Ala和富含Gly/Gln的片段以及非重復(fù)片段(所有片段都來源于來自園蛛屬(Jrs/2ez^)的ADF3)。該基因被表達(dá)成可溶性蛋白質(zhì)(59.8kD,>528個氨基酸),所述蛋白質(zhì)聚集但不形成多聚體或纖維。該蛋白質(zhì)的丙氨酸含量是10-15%。W003/057727公開了可溶性重組絲多肽在哺乳動物細(xì)胞系和動物中的表達(dá)。一種經(jīng)表達(dá)的絲多肽(ADF-3;60kD,652個氨基酸)由重復(fù)單元和非重復(fù)親水性結(jié)構(gòu)域組成。另一種經(jīng)表達(dá)的絲多肽(ADF-3His;63kD,677個氨基酸)由重復(fù)單元、非重復(fù)親水性結(jié)構(gòu)域、c-myc表位和六組氨酸標(biāo)簽組成。所述重復(fù)單元具有低含量的Ala(10-20%)。所獲得的絲多肽在水性介質(zhì)中展現(xiàn)出差的溶解性和/或形成沉淀。因為所獲得的絲多肽不會自發(fā)地聚合,因而需要進(jìn)行紡絲(spinning)以獲得多聚體或纖維。幾個因素使拖絲蛋白的表達(dá)變得復(fù)雜。由于基因的高度重復(fù)的性質(zhì)以及相伴隨的所述蛋白質(zhì)的受限制的氨基酸組成,因而發(fā)生轉(zhuǎn)錄和翻譯錯誤。另一個原因可能是微生物表達(dá)系統(tǒng)中tRNA庫的耗竭,以及隨后的不連續(xù)翻譯,從而導(dǎo)致蛋白質(zhì)合成的過早終止。關(guān)于蛋白質(zhì)合成的截短所討論的其他原因是mRNA的二級結(jié)構(gòu)的形成以及基因的重組。大于2.5kb的天然MaSp已顯示在細(xì)菌宿主中是不穩(wěn)定的。此外,在以可溶形式保持重組絲蛋白方面存在許多困難,因為天然來源的拖絲蛋白片段以及經(jīng)設(shè)計的嵌段共聚物特別是來源于MaSpl/ADF-4的蛋白,容易地自裝配成無定形聚集體,從而引起蛋白質(zhì)的沉淀和損失。參見Huemmerich,D.等人,Primarystructureelementsofspiderdraglinesilksandtheircontributiontoproteinsolubility.Biochemistry43,13604-13612(2004);和Uzaris,A.等人,Spidersilkfibersspunfromsolublerecombinantsilkproducedinmammaliancells.Science295,472-476(2002)。發(fā)明概述本發(fā)明的目的是提供新的蜘蛛絲蛋白,其可提供蜘蛛絲纖維。本發(fā)明的另一個目的是提供水溶性蜘蛛絲蛋白,其可容易地進(jìn)行操作以便按希望地自體聚合成纖維。這允許獨特的應(yīng)用,例如在纖維上培養(yǎng)真核細(xì)胞。此外,該性質(zhì)允許在生理條件下進(jìn)行所有下列步驟,這減少了毒性和蛋白質(zhì)變性的風(fēng)險。本發(fā)明的另外一個目的是提供新的蜘蛛絲蛋白的纖維。本發(fā)明的一個目的是以大規(guī)模提供蜘蛛絲蛋白,其可容易地進(jìn)行操作以便按希望地自體聚合成纖維。本發(fā)明的目的還在于提供用于產(chǎn)生絲蛋白和蜘蛛絲蛋白的纖維的方法。關(guān)于根據(jù)下列公開內(nèi)容將變得顯而易見的這些和其他目的,根據(jù)一個方面,本發(fā)明提供了分離的大壺腹腺蛛絲蛋白或其衍生物,其中所述蛋白質(zhì)由150至420個氨基酸殘基組成并且由式REP-CT定義,其中REP是具有80至300個氨基酸殘基的蛋白質(zhì)片段,其中所述片段選自L(AG)丄、L(AG)nAL、L(GA)丄、L(GA)nGL,其中n是4至8的整數(shù);每個獨個A區(qū)段是8至18個氨基酸殘基的氨基酸序列,其中所述氨基酸殘基中的0至3個不是Ala,而其余的氨基酸殘基是Ala;每個獨個G區(qū)段是12至30個氨基酸殘基的氨基酸序列,其中至少40%的氨基酸殘基是Gly;和每個獨個L區(qū)段是0至20個氨基酸殘基的連接體氨基酸序列;以及CT是具有70至120個氨基酸殘基的蛋白質(zhì)片段,該片段是源自大壺腹腺蛛絲蛋白的C-末端片段。本發(fā)明基于鑒定足以形成絲樣纖維的蛋白質(zhì)基元以及所述基元用于構(gòu)建重組MaSp蛋白的用途,所述重組MaSp蛋白可能在合適的宿主,例如細(xì)菌,優(yōu)選大腸桿菌co//)中產(chǎn)生。在本發(fā)明的某些實施方案中,每個獨個A區(qū)段與選自下列的氨基酸序列具有至少80%的同一性SEQIDNO:3的氨基酸殘基7-19、43-56、71-83、107-120、135-147、171-183、198-211、235-248、266-279、294-306、330-342、357-370、394-楊、421-434、458-470、489-502、517-529、553-566、581-594、618-630、648-661、676-688、712-725、740-752、776-789、804-816、840-853、868-880、904-917、932-945、969-981、999-1013、1028-1042和1060-1073;SEQIDNO:9的氨基酸殘基31-42、61-75、90-104、122-135和153-171;SEQIDNO:13的氨基酸殘基12-25、46-60、75-88、112-119、150-158和173-180;SEQIDNO:14的氨基酸殘基31-42;和SEQIDNO:15的氨基酸殘基122-135。在特定的實施方案中,每個獨個A片段是選自該組氨基酸序列的氨基酸序列。在本發(fā)明的一些實施方案中,每個獨個G區(qū)段與選自下列的氨基酸序列具有至少80°/。的同一性SEQIDNO:3的氨基酸殘基20-42、57-70、84-106、121-134、148-170、184-197、212-234、249-265、280-293、307-329、343-356、371-393、407-420、435—457、471-488、503-516、530-552、567-580、595-617、631-647、662-675、689-711、726-739、753-775、790-803、817-839、854-867、881-903、918-931、946-968、982-998、1014-1027、1043-1059和1074-1092;SEQIDNO:5;SEQIDNO:6;SEQIDNO:7;SEQIDNO:9的氨基酸殘基11-30、43-60、76-89、105-121和136-152;和SEQIDNO:13的氨基酸殘基l-ll、26-45、61-74、89-111、120-149和159-172。在特定的實施方案中,每個獨個G片段與選自該組氨基酸序列的氨基酸序列相同。在本發(fā)明的某些實施方案中,所述CT片段與SEQIDNO:8具有至少50%的同一性,或與選自SEQIDNO:4、SEQIDNO:9的氨基酸殘基172-269、SEQIDNO:13的氨基酸殘基181-276和SEQIDNO:16的氨基酸殘基172-269以及圖3的任何氨基酸序列(特別是圖3的MaSpl序列)的氨基酸序列具有至少80%的同一性。在特定的實施方案中,所述CT片段是選自改組氨基酸序列的氨基酸序列。在本發(fā)明的某些實施方案中,在所述分離的大壺腹腺蛛絲蛋白中脂多糖(LPS)和其他致熱原的含量是l個內(nèi)毒素單位(EU)/mg蛋白質(zhì)或更低。根據(jù)另一個方面,本發(fā)明提供了分離的融合蛋白,所述融合蛋白由作為大壺腹腺蛛絲蛋白的第一蛋白質(zhì)片段和第二蛋白質(zhì)片段組成,其中所述第二蛋白質(zhì)片段包含融合伙伴和切割試劑識別位點,其中所述第一蛋白質(zhì)片段通過所述切割試劑識別位點偶聯(lián)至所述融合伙伴。本發(fā)明提供了選自X-REP-CT和REP-CT-X的分離的融合蛋白,其中REP和CT是本發(fā)明的蛋白質(zhì)片段;和X是包含融合伙伴和切割試劑識別位點的蛋白質(zhì)片段;其中組合的蛋白質(zhì)片段REP-CT通過所述切割試劑識別位點偶聯(lián)至所述融合伙伴。在本發(fā)明的某些實施方案中,在所述分離的融合蛋白中LPS和其他致熱原的含量是lEU/mg蛋白質(zhì)或更低。根據(jù)另外一個方面,本發(fā)明提供了用于產(chǎn)生本發(fā)明的大壺腹腺蛛絲蛋白的方法,其包括下列步驟(i)提供本發(fā)明的融合蛋白在液體介質(zhì)中的溶液,(ii)向所述液體介質(zhì)中加入合適的切割試劑,所述切割試劑用于在切割試劑識別位點處實現(xiàn)融合蛋白的切割,從而獲得大壺腹腺蛛絲蛋白;和任選地,(iii)從所述液體介質(zhì)中分離在步驟(ii)中獲得的大壺腹腺蛛絲蛋白。本發(fā)明還提供了用于產(chǎn)生本發(fā)明的大壺腹腺蛛絲蛋白的多聚體的方法,其包括下列步驟(i)提供本發(fā)明的融合蛋白在液體介質(zhì)中的溶液,(ii)向所述液體介質(zhì)中加入合適的切割試劑,所述切割試劑用于在切割試劑識別位點處實現(xiàn)融合蛋白的切割,從而獲得大壺腹腺蛛絲蛋白;(iii)允許在步驟(ii)中獲得的大壺腹腺蛛絲蛋白在液體介質(zhì)中聚合;和任選地,(iv)從所述液體介質(zhì)中分離在步驟(iii)中獲得的多聚體。在優(yōu)選的方法中,所述步驟(iii)還包括提供所述液體介質(zhì)與選自氣相、液相和固相的另一相之間的界面,其中所述聚合在所述界面處或在圍繞所述界面的區(qū)域中開始。在優(yōu)選的方法中,所述液體介質(zhì)是水性介質(zhì),并且所述其他相選自空氣和與水不能混溶的有機溶劑。根據(jù)另一個方面,本發(fā)明提供了分離的多聚核酸分子,其包含編碼本發(fā)明的大壺腹腺蛛絲蛋白的核酸序列或其互補核酸序列。根據(jù)另外一個方面,本發(fā)明提供了分離的多聚核酸分子,其包含編碼本發(fā)明的融合蛋白的核酸序列或其互補核酸序列。本發(fā)明的另一個方面在于用于產(chǎn)生本發(fā)明的可溶性融合蛋白的方法,其包括下列步驟(i)在合適的宿主中表達(dá)編碼本發(fā)明的可溶性融合蛋白的多聚核酸分子;和(ii)分離在步驟(U中獲得的可溶性融合蛋白。任選地,分離可溶性融合蛋白的所述步驟(ii)包括除去LPS和其他致熱原。本發(fā)明還提供了用于產(chǎn)生本發(fā)明的大壺腹腺蛛絲蛋白的方法,其包括下列步驟(i)在合適的宿主中表達(dá)編碼本發(fā)明的可溶性融合蛋白的多聚核酸分子;(ii)分離在步驟(i)中獲得的可溶性融合蛋白;(iii)提供在步驟(ii)中獲得的所述可溶性融合蛋白在液體介質(zhì)中的溶液;(iv)向所述液體介質(zhì)中加入合適的切割試劑,所述切割試劑用于在切割試劑識別位點處實現(xiàn)融合蛋白的切割,從而獲得大壺腹腺蛛絲蛋白;和任選地,(v)從所述液體介質(zhì)中分離在步驟(iv)中獲得的大壺腹腺蛛絲蛋白。此外,任選地,分離可溶性融合蛋白的所述步驟(ii),和任選地,分離大壺腹腺蛛絲蛋白的所述步驟(v),包括除去LPS和其他致熱原。本發(fā)明還提供了用于產(chǎn)生本發(fā)明的大壺腹腺蛛絲蛋白的多聚體的方法,其包括下列步驟(i)在合適的宿主中表達(dá)編碼本發(fā)明的可溶性融合蛋白的多聚核酸分子;(ii)分離在步驟(i)中獲得的可溶性融合蛋白;(Hi)提供在步驟UO中獲得的所述可溶性融合蛋白在液體介質(zhì)中的溶液;(iv)向所述液體介質(zhì)中加入合適的切割試劑,所述切割試劑用于在切割試劑識別位點處實現(xiàn)融合蛋白的切割,從而獲得大壺腹腺蛛絲蛋白;(v)允許在步驟(iv)中獲得的大壺腹腺蛛絲蛋白在液體介質(zhì)中聚合;和任選地,(vi)從所述液體介質(zhì)中分離在步驟(V)中獲得的多聚體。在優(yōu)選的方法中,所述步驟(v)還包括提供所述液體介質(zhì)與選自氣相、液相和固相的另一相之間的界面,其中所述聚合在所述界面處或在圍繞所述界面的區(qū)域中開始。在優(yōu)選的方法中,所述液體介質(zhì)是水性介質(zhì),并且所述其他相選自空氣和與水不能混溶的有機溶劑。根據(jù)另一個方面,本發(fā)明提供了本發(fā)明的大壺腹腺蛛絲蛋白的多聚體。本發(fā)明還提供了可通過本發(fā)明的方法獲得的大壺腹腺蛛絲蛋白的多聚體。在優(yōu)選的實施方案中,所述多聚體是纖維。在其他優(yōu)選的實施方案中,所述多聚體形成選自泡沫、凝膠、網(wǎng)狀物或薄膜的結(jié)構(gòu)。根據(jù)另外一個方面,本發(fā)明提供了包含融合伙伴和切割試劑識別位點的蛋白質(zhì)片段在制備融合蛋白中的新用途,所述融合蛋白包含通過所述切割試劑識別位點偶聯(lián)至蜘蛛絲蛋白質(zhì)片段的所述蛋白質(zhì)片段。在優(yōu)選的實施方案中,所述蜘蛛絲蛋白片段由lso至4"個氨基酸殘基組成。根據(jù)最后的方面,本發(fā)明提供了分離的多聚核酸分子,其包含選自SEQIDNO:1和編碼SEQIDNO:2-16的核酸序列的核酸序列,或其互補核酸序列。本發(fā)明還提供了所述分離的多聚核酸分子在制備編碼蜘蛛絲蛋白的非天然基因中的用途。附圖簡述圖1是在^w;i^st力e/70/^MaSpl蛋白茛卩SEQIDNO:3的重復(fù)部分內(nèi)的區(qū)段的比對。圖2A圖解說明了細(xì)ro"力e卿sai/"ra//sMaSpl蛋白(SEQIDNO:3)的重復(fù)部分的示意性的、預(yù)測的結(jié)構(gòu)組織。圖2B圖解說明了根據(jù)實施例5-8構(gòu)建的蛛絲蛋白(SEQIDNO:9-13)的示意性的、預(yù)測的結(jié)構(gòu)組織。C-末端區(qū)域的比對,其中圖解說明了它們的保守性質(zhì)。圖4圖解說明了從根據(jù)實施例5-8構(gòu)建的蛛絲蛋白形成的纖維的肉眼可見的外觀。(A):6Gly/Ala-CT一蛋白(SEQIDNO:13)纖維,標(biāo)尺O.5cm;(B):5Gly/Ala-CTnat蛋白(SEQIDNO:9)纖維,標(biāo)尺lcm;(C):5Gly/Ala-CTnat蛋白(SEQIDNO:9)纖維,標(biāo)尺1cm。圖5顯示了從根據(jù)實施例5-8構(gòu)建的蛛絲蛋白形成的纖維的掃描電子顯微術(shù)(SEM)顯微照片。來自6Gly/Ala-CThyb(SEQIDNO:13)的單根纖維(a)和凝膠相(b、c)。在75%甲醇中進(jìn)行拉伸的、經(jīng)空氣干燥的并放置在SEM-樣品臺(SEM-stubs)上的5Gly/Ala-CTnat(SEQIDNO:9)的纖維(d、e、f)。在空氣干燥前扭曲的纖維(e),纖維的末端(f)。圖6展示了6Gly/Ala-CThyb(SEQIDNO:13)纖維的圓二色性(CD)光譜。圖7圖解說明了來自小鼠肥大細(xì)胞毒性研究的結(jié)果,所述結(jié)果顯示了在體外產(chǎn)生的絲纖維存在或不存在的情況下培養(yǎng)3天后,活細(xì)胞和死細(xì)胞的數(shù)目。圖8是在生物相容性研究中,在暴露于體外產(chǎn)生的絲纖維后HEK293細(xì)胞的照片。圖9是應(yīng)力(stress)-應(yīng)變(strain)曲線,其展示了來自5Gly/Ala-CTnat(SEQIDNO:9)的雙拉伸纖維(doubledrawnfiber)的拉伸強度(tensilestrength)。圖IO顯示了來自5Gly/Ala-CTnat(SEQIDNO:9)的重組纖維的SEM顯微照片。a、b,自發(fā)形成的纖維。特寫圖像(b)顯示了原纖維亞結(jié)構(gòu)。凸出的原纖維(箭頭)具有大約300nm的寬度。c-f,在2輪繃緊-松弛循環(huán)后的纖維。c和d顯示了不同放大倍數(shù)下的相同纖維。e顯示了經(jīng)切割的纖維末端,和f顯示了在拉伸試驗后的斷裂點。發(fā)明詳述總的來說,本發(fā)明基于鑒定足以用于重組產(chǎn)生蜘蛛絲纖維的蛛絲蛋白基元。所述基元基于從來自^"/7roW力e/70/^s〃"/^h的部分主要蛛絲蛋白1(majorspidroin1,MaSpl)的cDNA的克隆和測序中推導(dǎo)出的氨基酸序列。由此斷定,該分離的MaSplcDNA可用作用于構(gòu)建新的蛛絲蛋白基因(例如此處報導(dǎo)的那些基因)的起始點。從由所述新的蛛絲蛋白cDNA產(chǎn)生的蛋白質(zhì)形成的多聚體就它們的物理性質(zhì)特別是高強度、彈性和輕重量的有用組合而言是有用的。就它們支持細(xì)胞粘著和生長的能力而言,它們也是有用的。拖絲的性質(zhì)在開發(fā)用于醫(yī)療或技術(shù)目的的新材料方面是有吸引力的。特別地,本發(fā)明的蜘蛛絲可用于醫(yī)療裝置例如植入物,和醫(yī)療產(chǎn)品例如用作傷口閉合系統(tǒng)(woundclosuresystem)、急救繃帶(band-aid)、縫線、傷口敷料(wounddressing)以及用于組織工程和受指導(dǎo)的細(xì)胞再生的支架。本發(fā)明的蜘蛛絲還特別地可用于在例如降落傘、防彈服、座椅安全帶等中用作織品或織物。此處所使用的術(shù)語"纖維"涉及厚度為至少ljim的多聚體,優(yōu)選地涉及肉眼可見的(macroscopic)多聚體,所迷肉眼可見的多聚體是人眼可見的,即厚度為至少ljam,并且在長度上與其厚度相比具有相當(dāng)大的延伸,優(yōu)選大于5mm。術(shù)語"纖維"不包括未組織的聚集體或沉淀0術(shù)語"大壺腹腺蛛絲蛋白"、"蛛絲蛋白,,在整個本說明書中可互換使用,并且包括所有已知的"大壺腹腺蛛絲蛋白",通??s寫為"MaSp,,,或在十字園蛛的情況下縮寫為"ADF"。這些大壺腹腺蛛絲蛋白通常為兩種類型,即類型1和2。此外,這些術(shù)語還包括所附權(quán)利要求書中定義的本發(fā)明的新型蛋白質(zhì),以及與已知的大壺腹腺蛛絲蛋白具有高度同一性和/或相似性的其他非天然蛋白質(zhì)。本發(fā)明者已利用鑒定出的蛛絲蛋白基元來構(gòu)建編碼非天然蛛絲蛋白的新型基因構(gòu)建體。已發(fā)現(xiàn),由150至420個氦基酸殘基,即大于或等于150個,優(yōu)選大于或等于220個,優(yōu)選大于或等于個氨基酸殘基,并且小于或等于420個,優(yōu)選小于或等于380個,優(yōu)選小于或等于320,優(yōu)選小于或等于280個氨基酸殘基,例如220-360個氨基酸殘基組成的大壺腹腺蛛絲蛋白可以例如在細(xì)菌或其他合適的生產(chǎn)生物中重組產(chǎn)生。所得到的蛛絲蛋白自發(fā)地形成本發(fā)明的肉眼可見的絲纖維。這是令人吃驚的結(jié)果,因為天然發(fā)生的蛛絲蛋白以及先前已知的、重組產(chǎn)生的、形成纖維的蛛絲蛋白比本發(fā)明的蛋白長得多。此外,天然發(fā)生的蛛絲蛋白以及先前已知的、重組產(chǎn)生的、形成纖維的蛛絲蛋白傾向于包含大量的內(nèi)部重復(fù)序列并且需要使用紡絲和/或烈性(harsh)溶劑來進(jìn)行聚合。在此處第一次顯示了,蛛絲蛋白可自發(fā)地在體外形成纖維。此處提供的數(shù)據(jù)還顯示,只需要提供一部分的蛛絲蛋白序列來指導(dǎo)纖維形成。此外,包含^/;7roW/e/^ps重復(fù)結(jié)構(gòu)域和新婦蛛(非重復(fù)C-末端結(jié)構(gòu)域的種間雜合體(參見實施例6C)也形成纖維,這表明該基元的形成纖維的潛能是很強的。在其總的方面,本發(fā)明的大壺腹腺蛛絲蛋白由式REP-CT來定義。REP蛋白片段和CT蛋白片段通常通過肽鍵而共價偶聯(lián)。蛋白質(zhì)片段REP具有重復(fù)的特征,在富含丙氨酸的片段和富含甘氨酸的片段之間交替。REP片段通常包含大于80個,例如大于140個,并且小于300個,優(yōu)選小于240,例如小于200個氨基酸殘基,并且其本身可分成幾個L(連接體)區(qū)段、A(富含丙氨酸的)區(qū)段和G(富含甘氨酸的)區(qū)段,如將在下面更詳細(xì)地解釋的。通常,所述連接體區(qū)段(其為任選的)位于REP片段末端,而其余的區(qū)段依次為富含丙氨酸的和富含甘氨酸的區(qū)段。因此,REP片段通??删哂邢铝薪Y(jié)構(gòu)中的任一種,其中n是整數(shù)L(AGKL,伊J3口LA^iA^AsGsA^AsGsL;L(AG)nAL,例如LA^A^AsG^AsGsAsL;L(GA)丄,LdAiGaA^^^A^sAsL;或L(GA)nGL,例如LG^A^A^GsAsG^由此斷定,富含丙氨酸或富含甘氨酸的區(qū)段是否與N-末端或C-末端連接體區(qū)段相鄰不是至關(guān)重要的。優(yōu)選地,n是4至8的整數(shù),更優(yōu)選4至6的整數(shù),即n-4、r^5或n-6。在優(yōu)選的實施方案中,本發(fā)明的REP片段的丙氨酸含量高于20%,優(yōu)選高于25%,更優(yōu)選高于30%,并且低于50%,優(yōu)選低于40%,更優(yōu)選低于35%。這是有利的,因為可預(yù)見更高的丙氨酸含量提供更硬的和/或更強的和/或可延伸性更低的纖維。對此的原因可能是,更高的丙氨酸含量與纖維中更高含量的P-折疊結(jié)構(gòu)相關(guān)。因此,在優(yōu)選的實施方案中,在本發(fā)明的大壺腹腺蛛絲蛋白的多聚體例如纖維中的p-折疊含量高于50%,即該蛋白質(zhì)的超過50%的二級結(jié)構(gòu)是P-折疊形式。在某些實施方案中,REP片段缺乏脯氨酸殘基,即在REP片段中沒有Pro殘基?,F(xiàn)在轉(zhuǎn)向構(gòu)成本發(fā)明的REP片段的區(qū)段,將要強調(diào)的是,每個區(qū)段是獨個的(individual),即特定的REP片段的任何兩個A區(qū)段、任何兩個G區(qū)段或任何兩個L區(qū)段可以是相同的或可以不是相同的。因此,各類型的區(qū)段在特定REP片段內(nèi)是相同的這一點不是本發(fā)明的一般特征。相反地,下列公開內(nèi)容為本領(lǐng)域技術(shù)人員提供了關(guān)于如何設(shè)計獨個區(qū)段并將它們集合至REP片段中的指導(dǎo)方針,所述REP片段是本發(fā)明的功能性蛛絲蛋白的部分。從此處提供的實驗數(shù)據(jù)中得出結(jié)論,每個獨個A區(qū)段是具有8至18個氨基酸殘基的氨基酸序列。優(yōu)選地,每個獨個A區(qū)段包含13至15個氨基酸殘基。還可能地,大部分或超過兩個的A區(qū)段包含13至15個氨基酸殘基,以及少數(shù)例如一個或兩個A區(qū)段包含8至18個氨基酸殘基,例如8-12個或16-18個氨基酸殘基。這些氨基酸殘基的絕大部分是丙氨酸殘基。更特別地,Q至3個氨基酸殘基不是丙氨酸殘基,并且其余的氨基酸殘基是丙氨酸殘基。因此,無例外地或除了1、2或3個氨基酸殘基可以是任意氨基酸外,每個獨個A區(qū)段中的所有氨基酸殘基是丙氨酸殘基。優(yōu)選的是,取代丙氨酸的氨基酸是天然氨基酸,優(yōu)選獨個地選自絲氨酸、谷氨酸、半胱氨酸和甘氨酸,更優(yōu)選絲氨酸。當(dāng)然,可能的是,一個或多個A區(qū)段是全丙氨酸區(qū)段,而其余的A區(qū)段包含l至3個非丙氨酸殘基例如絲氨酸、谷氨酸、半胱氨酸或甘氨酸。在優(yōu)選的實施方案中,每個A區(qū)段包含13-15個氨基酸殘基,其中包括10-15個丙氨酸殘基和0-3個上述的非丙氨酸殘基。在更優(yōu)選的實施方案中,每個A區(qū)段包含13-15個氨基酸殘基,其中包括12-15個丙氨酸殘基和0—1個上述的非丙氨酸殘基。優(yōu)選地,每個獨個A區(qū)段與選自SEQIDNO:3的氨基酸殘基7-19、43-56、71-83、107-120、135-147、171-183、198-211、235-248、266-279、294-306、330-342、357-370、394-406、421-434、458-470、489-502、517-529、553-566、581-594、618-630、648-661、676-688、712-725、740-752、776-789、804-816、840-853、868-880、904-917、932-945、969-981、999-1013、1028-1042和1060-1073的氨基酸序列具有至少80%的同一性。該組的各序列相應(yīng)于^/pr0^力e/o;^sws"a/"MaSpl蛋白的天然發(fā)生的序列的區(qū)段,所述序列是從相應(yīng)的cDNA的克隆過程中推導(dǎo)出來的(參見實施例1-2和圖1-2A)。備選地,每個獨個A區(qū)段與選自SEQIDNO:9的氨基酸殘基31-42、61-75、90-104、122-135和153-171;SEQIDNO:13的氨基酸殘基12-25、46-60、75-88、112-119、150-158和173-180;SEQIDNO:14的氨基酸殘基31-42;和SEQIDNO:15的氨基酸殘基122-135的氨基酸序列具有至少80%的同一性。該組的各序列相應(yīng)于經(jīng)表達(dá)的本發(fā)明的非天然蛛絲蛋白的區(qū)段,所述蛋白具有在合適的條件下形成絲纖維的能力。參見實施例5-8、12,以及圖2B。不希望受任何特定理論的束綽,設(shè)想了,本發(fā)明的A區(qū)段形成螺旋結(jié)構(gòu)或0-折疊。如下計算了在整個說明書和所附權(quán)利要求書中所使用的術(shù)語"同一性百分比,,。使用CLUSTALW算法(Thompson,J.D.,Higgins,D.G.和Gibson,T.J.,NucleicAcidsResearch,22:4673-4680(1994))將查詢序列與靶序列進(jìn)行比對。比較每個位置上的氨基酸殘基,并將查詢序列中具有在靶序列中的相同的相應(yīng)殘基的位置的百分比報道為同一性百分比。如對于"同一性百分比"所描述的,計算在整個說明書和所附權(quán)利要求書中所使用的術(shù)語"相似性百分比",除了疏水殘基Ala、Val、Phe、Pro、Leu、Ile、Trp、Met和Cys是相似的;堿性殘基Lys、Arg和His是相似的;酸性殘基Glu和Asp是相似的;以及親水性的、不帶電荷的殘基Gln、Asn、Ser、Thr和Tyr是相似的外。在該情形下,剩下的天然氨基酸Gly與任何其他氨基酸都不相似。在整個本說明書中,本發(fā)明的備選的實施方案并不滿足指定的同一性百分比,而是滿足相應(yīng)的相似性百分比。其他備選的實施方案滿足指定的同一性百分比,以及另一個更高的相似性百分比,其選自對于各序列的優(yōu)選同一性百分比。例如,序列可以與另一個序列70%相似;或者其可以與另一個序列70%同一;或者其可以與另一個序列70%同一和90%相似。在本發(fā)明的優(yōu)選實施方案中,每個獨個A區(qū)段與選自下列的氨基酸序列具有至少90%,更優(yōu)選95°/。,最優(yōu)選100°/。的同一性SEQIDNO:3的氨基酸殘基7-19、43-56、71-83、107-120、135-147、171-183、198-211、235-248、266-279、294-306、330-342、357-370、394-406、421-434、458-470、489-502、517-529、553-566、581-594、618-630、648-661、676-688、712-725、740-752、776-789、804-816、840-853、868-880、904-917、932-945、969-981、999-1013、1028-1042和1060-1073;SEQIDNO:9的氨基酸殘基31-42、61-75、90-104、122-135和153-171;SEQIDNO:13的氨基酸殘基12-25、46-60、75-88、112-119、150-158和173-180;SEQIDNO:14的氨基酸殘基31-42;和SEQIDNO:15的氨基酸殘基122-135。因此,在本發(fā)明的某些實施方案中,每個獨個A區(qū)段與選自上述氨基酸區(qū)段的氨基酸序列相同。此外,從此處提供的實驗數(shù)據(jù)中得出結(jié)論,每個獨個G區(qū)段是l2至30個氨基酸殘基的氨基酸序列。優(yōu)選地,每個獨個G區(qū)段由14至23個氨基酸殘基組成。每個G區(qū)段的至少40%的氨基酸殘基是甘氨酸殘基。通常,每個獨個G區(qū)段的甘氨酸含量在40。/。至60y。的范圍內(nèi)。優(yōu)選地,每個獨個G區(qū)段與選自SEQIDNO:3的氨基酸殘基20-42、57-70、84-106、121-134、148-170、184—197、212-234、249—265、280-293、307-329、343-356、371-393、407-420、435-457、471-488、503-516、530-552、567-580、595-617、631-647、662-675、689-711、726-739、753-775、790-803、817-839、854-867、881-903、918-931、946-968、982-998、1014-1027、1043-1059和1074-1092的氨基酸序列具有至少80°/。的同一性。該組的各序列相應(yīng)于i^/7ro^力e"Oj^aw"ra/"MaSpl蛋白的天然發(fā)生的序列的區(qū)段,所述序列是從相應(yīng)的cDNA的克隆過程中推導(dǎo)出來的(參見實施例1-2和圖l-2A)。備選地,每個獨個G區(qū)段與選自SEQIDNO:9的氨基酸殘基11-30、43-60、76-89、105-121和136-152;和SEQIDNO:13的氨基酸殘基l-ll、26-45、61-74、89-111、120-149和159-172的氨基酸序列具有至少80%的同一性。該組的各序列相應(yīng)于經(jīng)表達(dá)的本發(fā)明的非天然蛛絲蛋白的區(qū)段,所述蛋白具有在合適的條件下形成絲纖維的能力。參見實施例5-8、12,以及圖2B。在本發(fā)明的優(yōu)選實施方案,每個獨個G區(qū)段與選自下列的氨基酸序列具有至少90%,更優(yōu)選95%,最優(yōu)選100%的同一性SEQIDNO:3的氨基酸殘基20-42、57-70、84-106、121-134、148-170、184-197、212-234、249-265、280-293、307-329、343-356、371-393、407-420、435-457、471-488、503-516、530-552、567-580、595-617、631-647、662-675、689-711、726-739、753-775、790-803、817-839、854-867、881-903、918-931、946-968、982-998、1014-1027、1043-1059和1074-1092;SEQIDNO:9的氨基酸殘基11-30、43-60、76-89、105-121和136-152;和SEQIDNO:13的氨基酸殘基1-11、26-45、61-74、89-111、120-149和159-172。因此,在本發(fā)明的某些實施方案中,每個獨個G區(qū)段與選自上述氨基酸區(qū)段的氨基酸序列相同。在某些實施方案中,本發(fā)明的每個G區(qū)段的前兩個氨基酸殘基不是-Gln-Gln-。在某些實施方案中,相應(yīng)于保守的Tyr殘基(即相應(yīng)于SEQIDNO:5中的位置16,SEQIDNO:6中的位置10,和SEQIDNO:7中的位置7)的位置在本發(fā)明的任何G區(qū)段中不是Phe。在某些實施方案中,相應(yīng)于保守的Tyr殘基(即相應(yīng)于SEQIDNO:5中的位置16,SEQIDNO:6中的位置10,和SEQIDNO:7中的位置7)的位置在本發(fā)明的每個G區(qū)段中是Tyr。由此斷定,本發(fā)明蛋白質(zhì)的某些實施方案展示了上述限制條件的組合,即本發(fā)明的每個G區(qū)段的前兩個氨基酸殘基不是-Gin-Gln-,并且保守的Tyr殘基(即相應(yīng)于SEQIDNO:5的位置16,SEQIDNO:6中的位置IO,和SEQIDNO:7中的位置7)在本發(fā)明的每個G區(qū)段中是Tyr。在某些實施方案中,上述限制條件(分開地或以任何可能的組合形式采用)可進(jìn)一步與REP片段缺乏脯氨酸殘基這一上文所述的限制條件相組合。參考圖1-2以及實施例3-4,存在3個亞型的本發(fā)明的G區(qū)段。i亥分類基于^"/7rosf力e/20psMaSpl蛋白質(zhì)序歹'J(圖1-2A)的仔細(xì)分析,并且已在構(gòu)建新的非天然蜘蛛絲蛋白中釆用和驗證了所述信息(圖2B)。本發(fā)明的G區(qū)段的第一種亞型由氨基酸單字母共有序列GQG(G/S)QGG(Q/Y)GG(L/Q)GQGGYGQGAGSS(如圖2A和SEQIDNO:5中所示的)表示。該第一種并且通常最長的G區(qū)段亞型通常包含23個氨基酸殘基,但可包含少至17個氨基酸殘基,并且不存在帶電荷的殘基或包含一個帶電荷的殘基。因此,優(yōu)選的是,該第一種G區(qū)段亞型包含17-23個氨基酸殘基,但可預(yù)見其可包含少至12個或多至30個氨基酸殘基。不希望受任何特定理論的束縛,設(shè)想了,該亞型形成巻曲結(jié)構(gòu)(coilstructure)或3廣螺旋結(jié)構(gòu)。該第一種亞型的代表性G區(qū)段是SEQIDNO:3的氨基酸殘基20-42、84-106、148-170、212-234、307-329、371-393、435-457、530-552、595-617、689-711、753-775、817-839、881-903、946-968、1043-1059和1074-1092;SEQIDNO:9的氨基酸殘基11-30、105-121和136-152;和SEQIDNO:13的氨基酸殘基26-45和89-lll。該第一種亞型的備選的G區(qū)段是SEQIDNO:13的氨基酸殘基120-149和159-172。在某些實施方案中,本發(fā)明的該第一種亞型的每個G區(qū)段的前兩個氨基酸殘基不是-Gln-Gln-。本發(fā)明的G區(qū)段的第二種亞型由氨基酸單字母共有序列GQGGQGQG(G/R)YGQG(A/S)G(S/G)S(如圖2A和SEQIDNO:6中所示的)表示。該第二種并且通常中等大小的G區(qū)段亞型通常包含17個氨基酸殘基,并且不存在帶電荷的殘基或包含一個帶電荷的殘基。優(yōu)選的是,該第二種G區(qū)段亞型包含14-20個氨基酸殘基,但可預(yù)見其可包含少至12個或多至30個氨基酸殘基。不希望受任何特定理論的束繂,設(shè)想了,該亞型形成巻曲結(jié)構(gòu)。該第二種亞型的代表性G區(qū)段是SBQIDNO:3的氨基酸殘基249-265、471-488、631-647和982-998;和SEQIDNO:9的氨基酸殘基43-60。本發(fā)明的G區(qū)段的第三種亞型由氨基酸單字母共有序列G(R/Q)GQG(G/R)YGQG(A/S/V)GGN(如圖2A和SEQIDNO:7中所示的)表示。該第三種G區(qū)段亞型通常包含14個氨基酸殘基,并且通常是最短的本發(fā)明的G區(qū)段亞型。優(yōu)選的是,該第三種G區(qū)段亞型包含12-17個氨基酸殘基,但可預(yù)見其可包含多至23個氨基酸殘基。不希望受任何特定理論的束繂,設(shè)想了,該亞型形成轉(zhuǎn)角結(jié)構(gòu)。該第三種亞型的代表性G區(qū)段是SEQIDNO:3的氨基酸殘基57-70、121-134、184-197、280-293、343-356、407-420、503-516、567-580、662-675、726-739、790-803、854-867、918-931、1014-1027;SEQIDNO:9的氨基酸殘基76-89;和SEQIDNO:13的氨基酸殘基61-74。該第三種亞型的備選的G區(qū)段是SEQIDNO:13的氨基酸殘基1-11。因此,在優(yōu)選的實施方案中,每個獨個G區(qū)段與選自SEQIDNO:5、SEQIDNO:6和SEQIDNO:7的氨基酸序列具有至少80%、優(yōu)選90%、更優(yōu)選95%的同一性。在REP片段的A和G區(qū)段的交替排列性序列的優(yōu)選實施方案中,每第二個G區(qū)段是第一種亞型,而其余的G區(qū)段是第三種亞型,例如...A1G短A2G長A3G短A4G長A5G短...。在REP片段的另一個優(yōu)選實施方案中,一個第二種亞型的G區(qū)段通過插入而打斷了G區(qū)段的規(guī)律性(regularity),例如...AG短A2G長A3G中等A4G短A5G長...。每個獨個L區(qū)段代表可有可無的連接體氨基酸序列,其可包含0至20個氨基酸殘基,例如0至IO個氨基酸殘基。雖然該區(qū)段是可有可無的,并且對于蛛絲蛋白在功能上不是至關(guān)重要的,但是其的存在仍然允許荻得完全功能性的蛛絲蛋白,從而形成本發(fā)明的蜘蛛絲纖維。在來自^7/7rost/e/K7;7sau"rs//s的MaSpl蛋白的經(jīng)推導(dǎo)的氨基酸序列的重復(fù)部分(SEQIDNO:3)中也存在連接體氨基酸序列。特別地,連接體區(qū)段的氨基酸序列可與所描述的A或G區(qū)段中任一個相似,但通常不足以滿足它們的在此處定義的標(biāo)準(zhǔn)。如圖2A中所示的,排列在REP片段的C-末端部分的連接體區(qū)段可由富含丙氨酸的氨基酸單字母共有序列ASASAAASAASTVANSVS和ASAASAAA代表。事實上,可以認(rèn)為第二種序列是本發(fā)明的A區(qū)段,而第一種序列與本發(fā)明的A區(qū)段具有高度的相似性。本發(fā)明的連接體區(qū)段的另一個實例具有單字母氨基酸序列GSAMGQGS,該序列富含甘氨酸并且與本發(fā)明的G區(qū)段具有高度的相似性。代表性的L區(qū)段是SEQIDNO:3的氨基酸殘基1-6和1093-1110;SEQIDNO:9的氨基酸殘基1-10和153-171;和SEQIDNO:13的氨基酸殘基173-180,但本領(lǐng)域技術(shù)人員將容易地認(rèn)識到,對于這些區(qū)段存在許多合適的備選的氨基酸序列。在本發(fā)明的REP片段的一個實施方案中,所述L區(qū)段之一包含O個氨基酸,即所述L區(qū)段之一是沒有的。在本發(fā)明的REP片段的另一個實施方案中,兩個L區(qū)段都包含0個氨基酸,即兩個L區(qū)段都是沒有的。因此,本發(fā)明的REP片段的這些實施方案可如下示意性地表示(AG)nL、(AG)nAL、(GA)丄、(GA)nGL;L(AG)n、L(AG)nA、L(GA)n、L(GA)nG;和(AG)。、(AG)nA、(GA)n、(GA)nG。這些REP片段中的任一片段適合于與下面定義的任何CT片段一起使用。本發(fā)明的蛛絲蛋白的C-末端(CT)片段與蛛絲蛋白的C-末端氨基酸序列具有高度的相似性。如圖3中所示的,該氨基酸序列在各種不同的物種以及蛛絲蛋白(包括MaSpl和MaSp2)中是非常保守的。在下列實施例中證明了,哪一個特定的CT片段存在于本發(fā)明的蛛絲蛋白中不是至關(guān)重要的,只要CT片段不完全丟失。因此,本發(fā)明的CT片段可選自圖3中顯示的氨基酸序列中的任一序列或具有高度相似性的序列。值得注意的是,SEQIDNO:13的CThyb片段與共有氨基酸序列SEQIDNO:8具有96。/。的同一性,而SEQIDNO:9的CX"片段只展示出與共有氨基酸序列SEQIDNO:8具有59%的同一性。這說明,各種各樣的C-末端序列可以用于本發(fā)明的蛛絲蛋白。本發(fā)明的CT片段的序列與共有氨基酸序列SEQIDNO:8(其基于圖3的氨基酸序列)具有至少50%的同一性,優(yōu)選至少60%的同一性。在優(yōu)選的實施方案中,本發(fā)明的CT片段的序列與共有氨基酸序列SEQIDNO:8的氨基酸殘基1-71具有至少65%的同一性,優(yōu)選至少70%的同一性。在優(yōu)選的實施方案中,本發(fā)明的CT片段進(jìn)一步地與共有氨基酸序列SEQIDNO:8或其氨基酸殘基1-71具有70%,優(yōu)選80%的相似性。本發(fā)明的代表性CT片段是fuproW力e/7o;^ai^m/"序列SEQIDNO:4、fw/7ro"力e/20;^SiAJ"a/2來源的SEQIDNO:9的氨基酸殘基172-269和SEQIDNO:13的氨基酸殘基181-276,其據(jù)稱來源于fz;/7ro"力e/7op";7(Pouchkina-Stantcheva,N.N.&McQueen-Mason,S.J.Molecularstudiesofanoveldraglinesilkfromanurserywebspider,五i/;ro"/fe/7o;^sp.(Pisauridae).CompBiochemPhysiolBBiochemMolBiol138,371-376(2004)),但與來自棒絡(luò)新婦妹和塞內(nèi)力口爾絡(luò)新婦珠(seiega/e/3S2's)的MaSpl具有高度的相似性。因此,根據(jù)本發(fā)明的優(yōu)選方面,CT片段與SEQIDN0:4;SEQIDNO:9的氨基酸殘基172-269;SEQIDNO:13的氨基酸殘基181-276;SEQIDNO:16的氨基酸殘基172-269;或圖3和實施例4的任何獨個MaSpl/ADF-4氨基酸序列具有至少80°/。的同一性。在本發(fā)明的優(yōu)選方面,CT片段與SEQIDNO:4;SEQIDNO:9的氨基酸殘基172-269;SEQIDNO:13的氨基酸殘基181-276;SEQIDNO:16的氨基酸殘基172-269;或圖3和實施例4中的任何獨個MaSpl/ADF-4氨基酸序列具有至少90%,例如至少95%的同一性。在本發(fā)明的優(yōu)選方面,CT片段與SEQIDNO:4;SEQIDNO:9的氨基酸殘基172-269;SEQIDNO:13的氨基酸殘基181-276;SEQIDNO:16的氨基酸殘基172-269;或圖13和實施例4的任何獨個MaSpl/ADF-4氨基酸序列相同。CT片段通常由70至120個氨基酸殘基組成。優(yōu)選的是,CT片段包含至少70個,或大于80個,優(yōu)選大于90個氨基酸殘基。也優(yōu)選的是,CT片段包含至多120個,或小于110個氨基酸殘基。典型的CT片段包含大約100個氨基酸殘基。根據(jù)另一個方面,本發(fā)明提供了分離的融合蛋白,其由作為大壺腹腺蛛絲蛋白的第一蛋白質(zhì)片段(優(yōu)選地由150至420個氨基酸殘基組成)和包含融合伙伴及切割試劑識別位點的第二蛋白質(zhì)片段組成。第一蛋白質(zhì)片段通過切割試劑識別位點偶聯(lián)至融合伙伴,即,可通過用合適的切割試劑在合適的條件下處理融合蛋白來切掉融合伙伴,從而提供大壺腹腺蛛絲蛋白,其優(yōu)選地由150至420個氨基酸殘基組成。該融合蛋白的優(yōu)點是,當(dāng)在合適的宿主,例如細(xì)菌,優(yōu)選大腸桿菌中產(chǎn)生時,可在溶液中,優(yōu)選在生理學(xué)介質(zhì)中,通常在緩沖水性介質(zhì)例如10-100mMTris-HCl緩沖液,pH6-9中產(chǎn)生大量的融合蛋白,而不引起沉淀和其他生產(chǎn)問題。溶液中的融合蛋白在長時間內(nèi),通常在數(shù)天或數(shù)周內(nèi)是溶解的,這有利于大規(guī)模生產(chǎn)且降低了蛋白質(zhì)聚集的風(fēng)險。術(shù)語"溶解的,,和"在溶液中"是指,所述蛋白質(zhì)不以可見的方式聚集,并且在60OOOxg下不會從溶劑中沉淀出來。根據(jù)所希望的,溶液中的融合蛋白可經(jīng)歷使用合適的切割試劑進(jìn)行的切割,從而提供自發(fā)形成絲纖維的大壺腹腺蛛絲蛋白。在優(yōu)選的方面,本發(fā)明提供了選自X-REP-CT和REP-CT-X的分離的融合蛋白,優(yōu)選X-REP-CT。REP和CT是本發(fā)明的蛋白質(zhì)片段,這暗示著所得到的REP-CT這種形式的MaSp蛋白是本發(fā)明的MaSp蛋白。X是此處定義的包含融合伙伴和切割試劑識別位點的蛋白質(zhì)片段。該組合的蛋白質(zhì)片段REP-CT通過切割試劑識別位點與融合伙伴偶聯(lián)。本發(fā)明的融合伙伴包括提高其伙伴蛋白質(zhì)片段(此處為本發(fā)明的MaSp蛋白)的溶解性和/或穩(wěn)定性的任何蛋白質(zhì)片段。融合伙伴也提供了用于親和純化的合適的手段。不局限于此,本發(fā)明的融合伙伴的實例包括硫氧還蛋白、麥芽糖結(jié)合蛋白、谷胱甘肽S-轉(zhuǎn)移酶(GST)、MTB32-C、Gbl、ZZ和NusA。本領(lǐng)域技術(shù)人員熟知備選的合適的融合伙伴。在本發(fā)明的優(yōu)選實施方案中,融合伙伴是與His標(biāo)簽以及S標(biāo)簽相組合的硫氧還蛋白部分(ThrX)。在本發(fā)明的一個優(yōu)選實施方案中,融合伙伴是與2個His標(biāo)簽相組合的ThrX部分,即His標(biāo)簽/ThrX/His標(biāo)簽。在本發(fā)明的另一個優(yōu)選實施方案中,融合伙伴是多克氧還蛋白部分(ThrX)。切割試劑識別位點位于偶聯(lián)至MaSp蛋白片段的該X蛋白片段末端,從而在該識別位點處的切割導(dǎo)致產(chǎn)生MaSp蛋白和融合伙伴。不局限于此,本發(fā)明的切割試劑識別位點的實例包括具有氨基酸序列LVPRGS(在R和G之間切割)的凝血酶識別位點;具有氨基酸序列DDDK(在K后切割)的腸激酶識別位點;具有氨基酸序列NG(在N和G之間切割)的羥胺識別位點;具有氨基酸序列LGVLFQGP(在Q和G之間切割)的HRV3C蛋白酶識別位點;具有氨基酸序列I(E/D)GR(在R后切割)的凝血因子Xa識別位點;具有氨基酸序列EXXYXQ(G/S),通常ENLYFQG(在Q和G/S之間切割)的TEV識別位點;具有氨基酸序列EDNLYFQG(在Q和G之間切割)的Ac-TEV識別位點;和具有氨基酸序列LEVLFQGP(在Q和G之間切割)的PreScission識別位點。其他合適的識別位點是關(guān)于胰蛋白酶、內(nèi)切蛋白酶、V8蛋白酶、胃蛋白酶和CNBr的切割位點。合適的切割識別位點的其他實例完全在本領(lǐng)域技術(shù)人員能力所達(dá)的范圍內(nèi)。在本發(fā)明的優(yōu)選實施方案中,切割試劑識別位點是凝血酶識別位點。在優(yōu)選的實施方案中,本發(fā)明的X片段具有結(jié)構(gòu)ThrX/His-標(biāo)簽/S-標(biāo)簽/凝血酶切割位點,并且X片段偶聯(lián)至本發(fā)明的REP-CT蛋白質(zhì)片段的N-末端。在一個優(yōu)選的實施方案中,本發(fā)明的X片段具有結(jié)構(gòu)His-標(biāo)簽/ThrX/His-標(biāo)簽/凝血酶切割位點,并且X片段偶聯(lián)至本發(fā)明的REP-CT蛋白質(zhì)片段的N-末端。根據(jù)另一個方面,本發(fā)明提供了用于產(chǎn)生本發(fā)明的大壺腹腺蛛絲蛋白的方法。在第一個步驟中,提供本發(fā)明的融合蛋白在液體介質(zhì)中的溶液。優(yōu)選地,融合蛋白不聚集,從而不需要再溶解過程。可重組產(chǎn)生融合蛋白,并使用在融合蛋白上的親和手段例如His-標(biāo)簽或在融合蛋白中的任何合適表位來純化所述融合蛋白。液體介質(zhì)可以是任何合適的介質(zhì),優(yōu)選生理學(xué)介質(zhì),通常為緩沖水性介質(zhì),例如10-lOOmMTris-HCl緩沖液,pH6-9。在第二個步驟中,為了在切割試劑識別位點處獲得融合蛋白的切割,向液體介質(zhì)中加入本發(fā)明的切割試劑。如上面所公開的,由此獲得本發(fā)明的大壺腹腺蛛絲蛋白。在第三個任選的步驟中,使用合適的分離技術(shù)例如層析和/或過濾從液體介質(zhì)中分離如此獲得的大壺腹腺蛛絲蛋白。根據(jù)另一個方面,本發(fā)明提供了用于產(chǎn)生本發(fā)明的大壺腹腺蛛絲蛋白的多聚體的方法。在第一個步驟中,提供本發(fā)明的融合蛋白在液體介質(zhì)中的溶液。優(yōu)選地,融合蛋白不聚集,從而不需要再溶解過程??芍亟M產(chǎn)生融合蛋白,并使用在融合蛋白上的親和手段例如His-標(biāo)簽或在融合蛋白中的任何合適表位來純化所述融合蛋白。液體介質(zhì)可以是任何合適的介質(zhì),優(yōu)選生理學(xué)介質(zhì),通常為緩沖水性介質(zhì),例如10-100mMTris-HCl緩沖液,pH6-9。在第二個步驟中,為了在切割試劑識別位點處獲得融合蛋白的切割,向液體介質(zhì)中加入本發(fā)明的切割試劑。如上面所公開的,由此獲得本發(fā)明的大壺腹腺蛛絲蛋白。在第三個步驟中,使如此獲得的大壺腹腺蛛絲蛋白在液體介質(zhì)中聚合。聚合通常在兩種不同相之間的界面例如液/空氣、液/固和水/油界面處開始。因此,該第三個步驟還可進(jìn)一步包括提供液體介質(zhì)和另一相之間的界面。所述另一相選自氣相、液相和固相。如上所述,液體介質(zhì)通常是水性介質(zhì),并且合適的其他相例如為空氣和與水不能混溶的有機溶劑,例如油,例如適合用于PCR反應(yīng)的礦物油。所得到的界面的存在刺激在該界面處或在圍繞該界面的區(qū)域中的聚合,所述區(qū)域延伸入液體介質(zhì)中,從而所述聚合在所述界面處或在所述界面區(qū)域中開始。優(yōu)選的界面包括水/空氣和水/油界面。當(dāng)在室溫下溫育時,聚合通常在數(shù)分鐘或數(shù)小時內(nèi),例如在1分鐘至5小時內(nèi)自發(fā)發(fā)生。在第四個任選的步驟中,使用合適的分離技術(shù)從液體介質(zhì)中分離如此獲得的大壺腹腺蛛絲蛋白的多聚體。如上所述,通過從融合蛋白中蛋白水解釋放小型的蛛絲蛋白來引起纖維形成。如果在從一側(cè)至另一側(cè)輕輕地?fù)u動的試管中進(jìn)行切割反應(yīng),則纖維沿著試管在空氣-水界面處形成。試管可由任何合適的材料例如塑料或玻璃制成。如果允許切割混合物靜置,則在空氣-水界面處形成薄膜。如果在水性切割混合物之上加入油,則在油-水界面處形成薄膜,其中讓其靜置或搖動。如果例如通過空氣起泡或攪打來使切割混合物發(fā)泡,則泡沫是穩(wěn)定的,并且如果允許干燥則發(fā)生凝固。通過使用本發(fā)明的方法,可能重組產(chǎn)生大量的本發(fā)明的融合蛋白,所述融合蛋白可被切割,并且被允許按所希望的進(jìn)行聚合。這提供了聚合過程的更好的控制,并允許優(yōu)化參數(shù)以獲得具有所需性質(zhì)的絲纖維。通常使用各種合適的宿主來重組產(chǎn)生本發(fā)明的大壺腹腺蛛絲蛋白。根據(jù)另一個方面,本發(fā)明因此提供了分離的多聚核酸分子,其包含編碼本發(fā)明的大壺腹腺蛛絲蛋白的核酸序列或其互補核酸序列,例如SEQIDNO:9-13,優(yōu)選SEQIDNO:9、12和13。這些多聚核酸分子以及編碼此處公開的各種不同蛋白質(zhì)的多聚核酸分子(SEQIDNO:2-16)還可用于進(jìn)一步開發(fā)非天然蛛絲蛋白或其生產(chǎn)系統(tǒng)。通常使用各種合適的宿主例如細(xì)菌、酵母、哺乳動物細(xì)胞、植物、昆蟲細(xì)胞和轉(zhuǎn)基因動物來重組產(chǎn)生本發(fā)明的融合蛋白。優(yōu)選的是,在細(xì)菌中產(chǎn)生本發(fā)明的融合蛋白。根據(jù)另一個方面,本發(fā)明因此提供了分離的多聚核酸分子,其包含編碼本發(fā)明的融合蛋白的核酸序列或其互補核酸序列。所述多聚核酸分子還可用于進(jìn)一步開發(fā)非天然蛛絲蛋白或其生產(chǎn)系統(tǒng)。本發(fā)明的多聚核酸分子可以是DM分子,包括cDNA分子或RNA分子。正如本領(lǐng)域技術(shù)人員所充分意識到的,核酸序列同樣可通過其互補核酸序列來描述。因此,與本發(fā)明的核酸序列互補的核酸序列也包括在本發(fā)明的保護(hù)范圍內(nèi)。根據(jù)一個方面,本發(fā)明提供了用于產(chǎn)生本發(fā)明的可溶性融合蛋白的方法。在第一個步驟中,在合適的宿主中表達(dá)編碼本發(fā)明的融合蛋白的多聚核酸分子。在第二個步驟中,例如使用層析和/或過濾來分離在前述步驟中如此獲得的可溶性融合蛋白。任選地,分離可溶性融合蛋白的所述第二個步驟包括除去LPS和其他致熱原。本發(fā)明還提供了用于產(chǎn)生本發(fā)明的大壺腹腺蛛絲蛋白的方法。在第一個步驟中,在合適的宿主中表達(dá)編碼本發(fā)明的融合蛋白的多聚核酸分子。在第二個步驟中,例如使用層析和/或過濾來分離如此獲得的可溶性融合蛋白。在第三個步驟中,提供所述分離的融合蛋白的溶液,并在第四個步驟中,向液體介質(zhì)中加入合適的切割試劑。這實現(xiàn)了在切割試劑識別位點處切割融合蛋白,并從而提供了大壺腹腺蛛絲蛋白。在任選的第五個步驟中,從液體介質(zhì)中分離如此獲得的大壺腹腺蛛絲蛋白。進(jìn)一步任選地,分離可溶性融合蛋白的所述第二個步驟,以及任選地,分離大壺腹腺蛛絲蛋白的所述第五個步驟,包括除去LPS和其他致熱原。本發(fā)明還提供了用于產(chǎn)生本發(fā)明的大壺腹腺蛛絲蛋白的多聚體的方法。在第一個步驟中,在合適的宿主中表達(dá)編碼本發(fā)明的融合蛋白的多聚核酸分子。在第二個步驟中,例如使用層析和/或過濾來分離如此獲得的可溶性融合蛋白。在第三個步驟中,提供所述分離的融合蛋白的溶液,并在第四個步驟中,向液體介質(zhì)中加入合適的切割試劑。這實現(xiàn)了在切割試劑識別位點處切割融合蛋白,并從而提供了大壺腹腺蛛絲蛋白。在第五個步驟中,使如此獲得的大壺腹腺蛛絲蛋白在液體介質(zhì)中聚合。聚合通常在兩種不同相之間的界面例如液/空氣、液/固和水/油界面處開始。因此,該第五個步驟還可進(jìn)一步包括提供液體介質(zhì)和另一相之間的界面。所述另一相選自氣相、液相和固相。如上所述,液體介質(zhì)通常是水性介質(zhì),并且合適的其他相例如為空氣和與水不能混溶的有機溶劑,例如油,例如適合用于PCR反應(yīng)的礦物油。所得到的界面的存在刺激在該界面處或在圍繞該界面的區(qū)域中的聚合,所述區(qū)域延伸入液體介質(zhì)中,從而所述聚合在所述界面處或在所述界面區(qū)域中開始。優(yōu)選的界面包括水/空氣和水/油界面。當(dāng)在室溫下溫育時,聚合通常在數(shù)分鐘或數(shù)小時內(nèi),例如在1分鐘至5小時內(nèi)自發(fā)發(fā)生。在任選的第六個步驟中,從液體介質(zhì)中分離如此獲得的多聚體。為了獲得具有低致熱原含量的蛋白質(zhì)(這對于用作體內(nèi)生物材料來說是強制性的),已開發(fā)了對于除去脂多糖(LPS)來說經(jīng)優(yōu)化的純化方案。為避免被所釋放的LPS污染,將生產(chǎn)性細(xì)菌細(xì)胞經(jīng)歷使用改變的CaCl2和EDTA的洗滌步驟。在細(xì)胞裂解后,在低導(dǎo)電性緩沖液中進(jìn)行所有隨后的純化步驟,以便使靶蛋白和LPS之間的疏水相互作用減少至最低。通過將蛋白質(zhì)溶液通過Endotrap柱來使LPS的含量進(jìn)一步降至最低,所述Endotrap柱具有特異性吸附LPS的配體。為了確保恒定的低含量的LPS和其他致熱原,使用體外致熱原測試(IPT)和/或鱟變形細(xì)胞溶解物(LAL)動力學(xué)測定法來分析所有批次。盡管在革蘭氏陰性細(xì)菌宿主中產(chǎn)生,但可如此純化出重組蛛絲蛋白,即LPS和其他致熱原的殘留水平低于動物測試所要求的限度,即低于25EU/植入物。在本發(fā)明的某些實施方案中,在分離的融合蛋白中LPS和其他致熱原的含量是1EU/mg蛋白質(zhì)或更低。在本發(fā)明的某些實施方案中,在分離的大壺腹腺蛛絲蛋白中LPS和其他致熱原的含量是1EU/mg蛋白質(zhì)或更低,優(yōu)選O.25EU/mg蛋白質(zhì)或更低。根據(jù)另一個方面,本發(fā)明提供了本發(fā)明的大壺腹腺蛛絲蛋白的多聚體。在優(yōu)選的實施方案中,該蛋白質(zhì)的多聚體可通過本發(fā)明的用于此的任一種方法獲得。在優(yōu)選的實施方案中,本發(fā)明的大壺腹腺蛛絲蛋白的多聚體的P一折疊含量高于50%,即該蛋白的多聚體的超過50%的二級結(jié)構(gòu)是以P-折疊形式存在的。這是有利的,因為可以預(yù)見,更高含量的P-折疊結(jié)構(gòu)提供了更硬和/或更強和/或可延伸性更低的纖維。優(yōu)選的是,本發(fā)明的蛛絲蛋白的多聚體是具有肉眼可見的大小,即具有大于1jum,優(yōu)選大于lOiam的直徑和大于5mm的長度的纖維。優(yōu)選的是,所述纖維的直徑在10-400jam,優(yōu)選60-120jim的范圍內(nèi),以及長度在0.5-300cm,優(yōu)選1-100cm的范圍內(nèi)。其他優(yōu)選的范圍是0.5-30cm和l-20cm。也優(yōu)選的是,本發(fā)明的蛛絲蛋白的多聚體具有大于1MPa,優(yōu)選大于2MPa,更優(yōu)選10MPa或更高的拉伸強度。優(yōu)選的是,本發(fā)明的蛛絲蛋白的多聚體具有大于100MPa,更優(yōu)選20GMPa或更高的拉伸強度。所述纖維具有在物理操作過程中保持完整的能力,即可用于紡絲、織造、加捻、鉤織和相似的操作。在其他優(yōu)選的實施方案中,本發(fā)明的蛛絲蛋白的多聚體形成泡沫、凝膠、網(wǎng)狀物或薄膜。根據(jù)另一個方面,本發(fā)明提供了包含融合伙伴和切割試劑識別位點的蛋白質(zhì)片段用于制備融合蛋白的新用途。所述融合蛋白包含所述蛋白質(zhì)片段和本發(fā)明的蜘蛛絲蛋白片段,并且這兩個片段通過所述切割試劑識別位點偶聯(lián)。所述蜘蛛絲蛋白片段優(yōu)選由150至420個氨基酸殘基組成。將在下面通過下列非限定性實施例來進(jìn)一步舉例說明本發(fā)明。實施例實施侈<formula>formulaseeoriginaldocumentpage32</formula>的克隆和觀,J序?qū)碜栽谀戏鞘占拇蠹s100個成年雌性^7/7roW力e/7o;sa^"a/h蜘蛛的大壺腹腺用于構(gòu)建定制的基于pD0NR222的CloneMinerc薩文庫(Invitrogen,Paisley,UK)。通過用cDNA探針篩選該文庫來獲得編碼MaSpl蛋白的cDNA克隆,所述cDNA探針編碼來源于未知亞種的^//^"^e/o;^蜘蛛的富含丙氨酸和富含甘氨酸的片段。按照廠商說明書,使用ECL直接標(biāo)記和檢測系統(tǒng)(AmershamBiosciences,Uppsala,Sweden)來進(jìn)行菌落印跡和檢測。選擇一個單個的克隆以進(jìn)行進(jìn)一步的表征。為了從該克隆中獲得cDNA插入片段的全長序列,4吏用Erase-a-Base系統(tǒng)(Promega,Southa即ton,UK)來產(chǎn)生嵌套缺失,并在MegaBase1000設(shè)備(AfflershamBiosciences)上進(jìn)行測序。所得到的3,8kbcDNA(SEQIDNO:1)編碼1207個氨基酸殘基的MaSpl蛋白(SEQIDNO:2),該蛋白包含34個富含丙氨酸和富含甘氨酸的區(qū)段的重復(fù)片段(SEQIDNO:3),以及97個氨基酸殘基的C-末端非重復(fù)片段(SEQIDNO:4)。實施例2.f";roWAe力Oj^s^"a/hMaSpl蛋白的重復(fù)片段的序列分析通過該片段的重復(fù)區(qū)段的比對來進(jìn)一步分析實施例1的A";7ro"/e/70/7sai;Wra/"MaSpl蛋白序列的重復(fù)片段(SEQIDNO:3),參見圖1。仔細(xì)查看該比對,并得出下列結(jié)構(gòu)信息。S";7r0"力e卿sfii/"r"/yMaSpl蛋白的富含丙氨酸的區(qū)段的長度為13-15個氨基酸殘基,并且只由丙氨酸殘基組成或除了一個殘基(該殘基是絲氨酸、谷氨酸或甘氨酸殘基)外全部由丙氨酸殘基組成。^/prcW力e/K/^MaSpl蛋白的重復(fù)片段還包含3個相關(guān)的、但不同的類型的富含甘氨酸的區(qū)段,參見圖2A。富含甘氨酸的區(qū)段中的兩個區(qū)段幾乎只在長度和出現(xiàn)率上不同;最常見的富含甘氨酸的區(qū)段包含23個氨基酸殘基,而豐度較低的變體包含17個氨基酸殘基。這兩種富含甘氨酸的區(qū)段通常都不包含帶電荷的殘基或包含一個帶電荷的殘基。相反地,包含14個氨基酸殘基的最短的富含甘氨酸的片段獨特地在N-末端包含序列GRGQG或GQGQG,和在C-末端包含GN。最長的富含甘氨酸的區(qū)段由氨基酸單字母共有序列GQG(G/S)QGG(Q/Y)GG(L/Q)GQGGYGQGAGSS(SEQIDNO:5)表示,并且不包含帶電荷的殘基。預(yù)測該區(qū)段形成巻曲結(jié)構(gòu)或3廣螺旋結(jié)構(gòu)。中等大小的富含甘氨酸的區(qū)段由氨基酸單字母共有序列GQGGQGQG(G/R)YGQG(A/S)G(S/G)S(SEQIDNO:6)表示,并且不包含帶電荷的殘基或包含一個帶電荷的殘基。預(yù)測該區(qū)段形成巻曲結(jié)構(gòu)。最短的富含甘氨酸的區(qū)段由氨基酸單字母共有序列G(R/Q)GQG(G/R)YGQG(A/S/V)GGN(SEQIDNO:7)表示。預(yù)測該區(qū)段形成轉(zhuǎn)角結(jié)構(gòu)。從交替的富含丙氨酸和富含甘氨酸的區(qū)段(例々口…AiGiA2G2A3G3A4G4A5G5...)建立j^//7ros^e/2o;7sai/stra//sMaSpl蛋白的重復(fù)片段。觀察到,上面鑒定的最短和最長的富含甘氨酸的區(qū)段中的每一個通常以每隔一富含甘氨酸的區(qū)段的形式出現(xiàn),例如.,.A工短A2G長A3G短A4G長A5G短...。相反地,較不豐富的、中等大小的、富含甘氨酸的片段通常在更長類型的富含甘氨酸的區(qū)段和更短類型的富含甘氨酸的區(qū)段之間出現(xiàn),例如...AiG短A^長A]G中等AX短A5G長-0實施例3.f";7roWAej70;^MaSpl蛋白的重復(fù)片段的二級和三級結(jié)構(gòu)的預(yù)測溶液中的蛛絲蛋白多肽通常通過形成發(fā)夾結(jié)構(gòu)而折疊,所述發(fā)夾結(jié)構(gòu)預(yù)示了成熟纖維的反平行P-折疊結(jié)構(gòu)。為了辨別實施例1-2的^/jW^y^e/o/^5M"a/"MaSpl蛋白的重復(fù)片段(SEQIDNO:3)的可能的折疊模式,鑒定了與發(fā)夾或轉(zhuǎn)角結(jié)構(gòu)的形成相容的蛋白質(zhì)區(qū)域。富含丙氨酸的區(qū)段不可能是轉(zhuǎn)角形成的候選者,因為它們預(yù)期形成螺旋結(jié)構(gòu),并且更重要地,這些區(qū)段在纖維中通常被保持用于構(gòu)成P-折疊。通過使用最近描述的關(guān)于轉(zhuǎn)角預(yù)測的算法(Fuchs,PF&Alix,AJ,Highaccuracypredictionofbeta-turnsandtheirtypesusingpropensitiesandmultiplealignments.Proteins59,828-839(2005)),最短的富含甘氨酸的區(qū)段顯示出關(guān)于形成II型p-轉(zhuǎn)角的高度可能性,而兩個更長的富含甘氨酸的區(qū)段預(yù)測形成巻曲結(jié)構(gòu)。在更長的富含甘氨酸的區(qū)段中高含量的GGX三聯(lián)體暗示了,它們可形成3r螺旋結(jié)構(gòu)。蛛絲蛋白氨基酸序列的重復(fù)性質(zhì)暗示了折疊模式的同樣地重復(fù)的性質(zhì)。綜合起來,這些觀察結(jié)果導(dǎo)致圖2A中所示的^//7ro^力e/3o/7Sa"〃ra/hMaSpl蛋白的重復(fù)片段的折疊。值得注意的是,帶正電荷的殘基幾乎總是位于所提及的轉(zhuǎn)角結(jié)構(gòu)中。根據(jù)^//7ro"力e/7o;^flu"ra//、MaSpl蛋白的重復(fù)區(qū)段的折疊模式,可辨別由富含丙氨酸的區(qū)段/(更長的)富含甘氨酸的巻曲區(qū)段/富含丙氨酸的區(qū)段/(更短的)富含甘氨酸的轉(zhuǎn)角區(qū)段/富含丙氨酸的區(qū)段/(更長的)富含甘氨酸的巻曲區(qū)段/富含丙氨酸的區(qū)段組成的基元(圖2A中示意性地圖解說明的)。實施例4.MaSpl蛋白的非重復(fù)C-末端片段的序列分析將實施伊J1中獲得的來自f^e力o/^aus^raJ/s的MaSpl蛋白的C-末端非重復(fù)片段(SEQIDN0:4)的一級結(jié)構(gòu)與許多已知的MaSpl和MaSp2蛋白的C-末端片段進(jìn)行比對,所述MaSpl和MaSp2蛋白尤其來自S"/7ro"力e力o/^(Pouchkina-Stantcheva,NN&McQueen-Mason,SJ,Molecularstudiesofanoveldraglinesilkfromanurserywebspider,^/pro"力e/2o;";7.(Pisauridae).CompBiochemPhysiolBBiochemMolBiol138,371-376(2004))、棒絡(luò)新婦珠P19837-5(Xu,M&Lewis,RV,Structureofaproteinsuperfiber:spiderdraglinesilk.ProcNatlAcadSciUSA87,7120-7124(1990))和其他種類。根據(jù)在圖3中顯示的從重復(fù)片段中的最后Ser開始的比對,顯而易見的是,MaSpl和MaSp2的C-末端區(qū)域是十分保守的。^/;7r^"eiK7;7ssp和才奉絡(luò)新婦妹具有95%的相同殘基;^/AToW/e/zo/^<2^"3//<和棒絡(luò)新婦蛛具有54%的相同殘基;以及^/;rc^Me/7(7j^a"s"a//、和^//7ro^力e/2o;^具有55%的相同殘基。作為SEQIDNO:8提供了MaSpl和MaSp2的C-末端區(qū)域的共有序列。在圖3中,比對了下列MaSp蛋白,它們用GenBank登錄號(使用這些登錄號可獲得這些蛋白)進(jìn)行了標(biāo)注物種和蛛絲蛋白A"jwosf力e/JOpsMaSpl(Pouchkina—Stantcheva,NN&McQueen-Mason,SJ,同前)f"/^ro"力e/Jopsaw"ra"sMaSpl(SEQIDNO:4)登錄號Cthyb—EspCTnat—Eau三帶金珠(爿i^/o/eW尸asc/"a)MaSpl皿云斑蛛(Cyr一Aora/z/o/i/cce"s/s)Spl棕寡婦蛛(Ls/:rofl^c加geo邁ef"'cws)MaSpl黑寡婦珠""rotfe""sAespe信)MaSpl赫氏沭立突妹(#acro/^e/eSpl棒絡(luò)新婦蛛MaSpl毛絡(luò)新婦珠(^ep//7a;7/7/;es)MaSpl馬達(dá)力口斯加絡(luò)新婦珠(jVep力i/s/Z7a(/agascar/e/3s/s)塞內(nèi)加爾絡(luò)新婦蛛MaSpl變異滿蛛(0c加o6ara/7s/s)Spl中華褸網(wǎng)珠(/^ec力rwss/'/2e/Js/s)Spl考艾島肖蟲肖(r"r柳"Aai:aua/e頻's)MaSpl花斑肖蟲肖(Tefi"ag/3atAaFers/co7or)MaSplMaSplAF350266-AtlAY666062.-CmlAF350273.-LglAY953074一LhlAY666068.—MhlU20329—1NclAY666076—NplAF350277一NmlAF350279一NslAY666057一0vlAY666064一PslAF350285—TklAF350286一Tvl大腹園珠(Jra刀eus6/ce/3fe/3ar/j/51)Sp2悅目金珠(Jrg/opea頂oe/a)MaSp2橙色金妹(~/,awaj7〃a)MaSp2三帶金蛛MaSp2乳頭棘腹妹((7as^eraca/fAa邁a鵬oa)MaSp2棕寡婦蛛MaSp2黑寡婦蛛MaSp2棒絡(luò)新婦蛛MaSp2馬達(dá)加斯加絡(luò)新婦蛛MaSp2塞內(nèi)加爾絡(luò)新婦蛛MaSp2ABU20328-Ab2AY365016-Aam2AF350263-Aau2AF350267—At2AF350272一Gm2AF350275-Lg2AY953075—Lh2AY654293-Nc2AF350278—Nm2AF350280—Ns2黑狡蛛("o7。邁etfes"/2e6ro禱)Fbl黑狡蛛Fb2AF350269一DtFblAF350270—DtFb2十字園蛛ADF-1十字園蛛ADF-2U47853—ADF1U47854一ADF2十字園蛛ADF-3U47855—ADF3十字園蛛ADF-4U47856—ADF4實施例5.MaSpl基因的構(gòu)建使用來自實施例1的cDNA文庫的MaSpl克隆作為模板,利用AdvantageGC2試劑盒(BDBiosciences,SanJose,CA,USA),通過PCR來擴增編碼f";7ro"力e/70;7sau"ra7/s來源的蛋白質(zhì)5Gly/Ala-CTnat(SEQIDNO:9)的DNA序列。在5,-和3,-末端分別導(dǎo)入限制性內(nèi)切酶識別位點^g/z^/和#//^///,并通過使用經(jīng)設(shè)計的引物在W/^/i7位點的上游引入終止密碼子。然后將5緒^/-1^7//4/(3-67;"-#/;^///構(gòu)建體亞克隆入按下面實施例6(C)中所述進(jìn)行制備的經(jīng)修飾的pET32載體(MerckBiosciences,Darmstadt,Germany)中。實施例6.嵌合MaSpl基因的構(gòu)建(A)REP基因片段使用編碼^//roi^7ei30i^^MaSpl蛋白的重復(fù)區(qū)域的部分cDNA克隆(Pouchkina-Stantcheva,NN&McQueen-Mason,SJ,Molecularstudiesofanoveldraglinesilkfromanurserywebspider,^"/7rc^f力e/7o/7S(Pisauridae).CompBiochemPhysiolBBiochemMolBiol138,371-376(2004))(GenBank登錄號CQ974358或CQ816656)作為模板,在甜菜堿(HenkeW等人,BetaineimprovesthePCRamplificationofGC-richDNAsequences.NucleicAcidsRes25,3957-3958(1997))存在的情況下,利用"~(TaKaRaBio;SaintGe面in-en-laye,F(xiàn)rance),通過PCR來擴增編碼標(biāo)示為3Gly/Ala和4Gly/Ala的部分重復(fù)片段(REP)的DNA序列。在5,-和3,-末端引入限制性內(nèi)切酶識別位點,從而得到下列構(gòu)建體待與CT片段(見下面)進(jìn)行連接的A^o/-3Gly/Ala_A%e/和化o/-4Gly/Ala-勵e/;和待獨個地表達(dá)的^oJ-4Gly/Ala-I力o/克隆,其中直接在J力o/位點的上游插入終止密碼子。(B)CT基因片段使用編碼C-末端MaSpl結(jié)構(gòu)域的基因組DNA克隆,通過PCR來擴增編碼來自^i/;ro^力e力o/^^的非重復(fù)C-末端結(jié)構(gòu)域(但與來自棒絡(luò)新婦蛛和塞內(nèi)加爾絡(luò)新婦蛛的MaSpl具有高度的相似性)的DNA序歹'J(Pouchkina-Stantcheva,NN&McQueen-Mason,SJ,Molecularstudiesofanoveldraglinesilkfromanurserywebspider,i"wpTC^f力e/0/7Ssp.(Pisauridae).CompBiochemPhysiolBBiochemMolBiol138,371-376(2004))。在5,-和3'-末端引入限制性內(nèi)切酶識別位點,從而得到待與3Gly/Ala和4Gly/Ala部分REP克隆(見上面)進(jìn)行連接的Ae/-2Gly/Ala-CThyb-J力o/,和待獨個地表達(dá)的#co/-2Gly/Ala-CThyb-^o/。(C)REP-CT雜合MaSpl基因的構(gòu)建使用pCR2.l-T0P(f載體(Invitrogen),將3Gly/Ala和4Gly/AlaREP克隆與CT克隆連接在一起。然后,用^co/和J力o/切出所得的融合的5Gly/Ala-CT一和6Gly/Ala-CT一克隆,并將其亞克隆入經(jīng)修飾的pET32栽休(Novagen)中,在該栽體中除去了原始凝血酶切割位點,并在腸激酶切割位點下游引入了新的凝血酶位點。實施例7.MaSpl融合蛋白的表達(dá)使用經(jīng)修飾的pET32載體編碼硫氧還蛋白/HisjS-標(biāo)簽/凝血酶切割位點/MaSpl蛋白的硫氧還蛋白-標(biāo)簽/His-標(biāo)簽/S-標(biāo)簽/凝血酶切割位點/MaSpl基因和氨千青霉素抗性基因(在T7啟動子控制下),如下將由在實施例5一6中構(gòu)建的基因編碼的MaSpl蛋白表達(dá)為融合蛋白(X-REP-CT類型)。將pET32表達(dá)載體中的不同的MaSpl構(gòu)建體轉(zhuǎn)化入大腸桿菌BL21(DE3)細(xì)胞(MerckBiosciences)中。使細(xì)胞在30。C下在含有氨芐青霉素的Luria-Bertani培養(yǎng)基中生長至1.0-1.5的OD固,用IPTG進(jìn)行誘導(dǎo),并在室溫下再溫育4小時。通過離心收獲細(xì)胞,和用在20mMTris-HCl(pH8.0)、20mM咪哇(含0.5MNaCl)中的DNA酶I和溶菌酶來進(jìn)行裂解,并通過在Ni-NTA瓊脂糖(Qiagen,WestSussex,UK)上的His-標(biāo)簽親和層析來進(jìn)一步純化。使用200mM在20mMTris-HCl(pH8.0)(含0.5MNaCl)中的咪唑從Ni-NTA柱上洗脫結(jié)合的融合蛋白,并將其針對20mMTris-HCl(pH8.Q)進(jìn)行透析。如通過經(jīng)考馬斯染色的SDS聚丙烯酰胺凝膠所判定的,所得到的融合蛋白的純度>90%,并且溶解在20mMTris-HCl(pH8.0)中。該方法產(chǎn)生大約40mg融合蛋白/l培養(yǎng)物,該融合蛋白在數(shù)周內(nèi)是穩(wěn)定的而無明顯的沉淀。在另一個實驗中,從包含有在T7啟動子控制之下的相應(yīng)基因和卡那霉素抗性基因的質(zhì)粒中,將融合蛋白表達(dá)為His6/石危氧還蛋白/HisJ凝血酶切割位點/MaSpl蛋白。實施例8.從MaSpl蛋白形成纖維在室溫下在非常溫和的搖動下,在20mMTris-HCl(pH8)中,以1:1000(w/w)的凝血酶融合蛋白比率,將標(biāo)簽從得自實施例7的融合蛋白中切除。如通過SDS-PAGE所判定的,在30至60分鐘內(nèi)完成了凝血酶切割。所得到的MaSpl蛋白(圖2B,SEQIDNO:9-13)自發(fā)地聚合成不同程度的肉眼可見的纖維,參見表1。所述纖維最初在水/空氣界面處形成。從溫育大約1小時后開始可通過棵眼觀察到這種形成(參見圖4A,4B),并且在大約5小時后沒有出現(xiàn)進(jìn)一步的纖維生長。6Gly/Ala-CT一纖維的長度直到大約2cm,并且5Gly/Ala-CTnat纖維的長度》10cm。重復(fù)的實驗產(chǎn)生長度>20cm(參見圖4C),甚至>2m的5Gly/Ala-CT組纖維。從溫育大約10分鐘后開始可通過棵眼觀察到纖維形成。分離纖維,并使用緩沖液進(jìn)行洗滌,然后使其經(jīng)歷N-末端氨基酸序列分析,所述分析只顯示了MaSpl蛋白的序列。這表明,在所述纖維中不存在經(jīng)切割的標(biāo)簽。實施例9.MaSpl蛋白纖維的分析A.拉伸強度測量如下測定實施例8的6Gly/Ala-CT一(SEQIDNO:13)和5Gly/Ala-CTnat(SEQIDNO:9)纖維的拉伸強度。為了操作較短(1-2cm)的6Gly/Ala-CThyb纖維以進(jìn)行拉伸強度測量,在將它們進(jìn)行空氣干燥之前,將它們在15%的甘油水溶液中短時間溫育。較長(IOcm)的5Gly/Ala-C乙t纖維在空氣干燥之前不進(jìn)行處理,在15%的甘油中短時間溫育,或在75%的甲醇中用手進(jìn)行拉伸。通過在ZwickMaterialTester中以10inm/分鐘的速率牽拉所述纖維來測量經(jīng)空氣干燥的纖維的拉伸強度。參見表l。經(jīng)甘油處理的、經(jīng)空氣干燥的、l-2cm長的來自6Gly/Ala-CThyb(SEQIDNO:13)的纖維的拉伸強度為大約2MPa,來自5Gly/Ala-CTnat(SEQIDNO:9)的10cm纖維的強度為4-5MPa。在空氣干燥之前在脫水溶劑甲醇中進(jìn)行拉伸的10cm長的5Gly/Ala-CT磁纖維展示出2-3MPa的拉伸強度,該拉伸強度略低于經(jīng)甘油處理的相同類型的纖維。目前測得的最高拉伸強度為10MPa,該強度是對于無進(jìn)一步處理的經(jīng)空氣千燥的10cm長的5Gly/Ala-CL"纖維而發(fā)現(xiàn)的。拉伸強度的范圍(2-10MPa)與對于再生的蜘蛛絲纖維而報導(dǎo)的較低值(2-320MPa)相當(dāng)。最長的自發(fā)形成的纖維來源于5Gly/Ala-CL"構(gòu)建本,并且此類經(jīng)空氣干燥的纖維也顯示出最大的拉伸強度。可能地,這可以是由于其12-15個殘基長的多聚Ala區(qū)段(相對于在6Gly/Ala-CThyb中的8-14個殘基的Ala區(qū)段),該區(qū)段可在先前的蛋白質(zhì)中產(chǎn)生更大比例的結(jié)晶P-折疊構(gòu)象。表l.MaSpl蛋白的纖維形成能力<table>tableseeoriginaldocumentpage41</column></row><table>n.a.=不可應(yīng)用n.d.=未測定B.掃描電子顯微術(shù)使用掃描電子顯微術(shù)(SEM)來分析6Gly/Ala-CThyb和5Gly/Ala-C乙t纖維的顯微結(jié)構(gòu)(圖5)。簡而言之,將樣品放置在SEM-樣品臺上,并用6nm的金和鉑層真空覆蓋所述樣品。使用10kV的加速電壓,在LEO1550FEGSEM中觀察試樣并進(jìn)行照相。該分析揭示出單根纖維的直徑為10-30pm,其中獨個纖維展示出相當(dāng)均一的直徑(圖5a,其顯示了6Gly/Ala-CThyb,SEQIDNO:13)。除了肉眼可見的纖維外,還發(fā)現(xiàn)了凝膠樣顆粒。于直接在SEM-樣品臺上對6Gly/Ala-CThyb的此類顆粒進(jìn)行空氣千燥后,看到直徑大約10-15|am的纖維(圖5b,c)。在75%甲醇中進(jìn)行拉伸并經(jīng)空氣干燥的5Gly/Ala-CTnat(SEQIDNO:9)的肉眼可見的纖維的直徑為60-120iam,并且它們似乎包含幾種經(jīng)排列的纖維(圖5d-f)。在空氣千燥前扭曲的纖維(圖5e),纖維的末端(圖5f)。C.圓二色性光譜學(xué)在20mM磷酸鹽緩沖液(pH7)中洗滌在實施例8中制備的由6Gly/Ala-CThyb蛋白(SEQIDNO:13)或5Gly/Ala-CTnat(SEQIDNO:9)組成的纖維,并將所述纖維懸浮于在相同緩沖液中的2。/。SDS之中。使用JascoJ-810旋光分光計,在22X:下在0.1cm光程長度的石英杯中記錄從250至190認(rèn)的圓二色性光譜。掃描速度為50認(rèn)/分鐘,響應(yīng)時間為2秒,采集間隔為0.1nm,和帶寬為1nm。圖6中顯示的光譜是6Gly/Ala-CThyb蛋白(SEQIDNO:13)的纖維的三次掃描的累積。其在220nm處展示出最小值和在195mn處展示出最大值,這些特征是反平行P-折疊結(jié)構(gòu)所特有的。對于5Gly/Ala-CT^的纖維獲得了的高度相似的光鐠(未顯示)。因此,所述自發(fā)形成的纖維展示了與天然的和再生的蜘蛛絲纖維相似的形態(tài)學(xué)和結(jié)構(gòu)。實施例10.重組蜘蛛絲的生物相容性因為希望將蜘蛛絲纖維用于生物醫(yī)學(xué)應(yīng)用,因此通過使用兩種不同細(xì)胞類型研究重組產(chǎn)生的絲的效應(yīng)來評估纖維的生物相容性。如實施例7-8中所述,在細(xì)菌中表達(dá)MaSpl蛋白5Gly/Ala-CTnat(SEQIDNO:9)。將純化的蛋白質(zhì)用于產(chǎn)生具有>10cm,甚至>20-200cm的長度和大約100nm的直徑的人造絲纖維。A.胚胎小鼠肥大細(xì)胞以兩種不同的細(xì)胞密度接種胚胎(第12.5天)小鼠肥大細(xì)胞(使用IL-8和肥大干細(xì)胞因子體外增殖8周),較高的密度為較低密度的大約4倍。這些細(xì)胞不粘著至塑料表面,但以懸浮形式生長。向小孔中加入各自大約0.5cm長的絲纖維小段。在絲纖維存在或不存在的情況下,將肥大細(xì)胞溫育3天,并在這之后在用臺盼藍(lán)染色后計數(shù)活細(xì)胞和死細(xì)胞(圖7)。這些柱條顯示了具有標(biāo)準(zhǔn)誤差的平均值,n-2,每個樣品重復(fù)計數(shù)3次。絲纖維的存在不影響肥大細(xì)胞。在3天的生長后,與在沒有絲纖維的情況下生長的負(fù)對照相比,細(xì)胞的死亡或增殖沒有顯著的差異。B.人胚胎腎(HEK)293細(xì)胞通過讓它們從小體積的緩沖液中干燥來將大約0.5cm長的絲纖維小段吸附至6孔微量滴定板的底部。當(dāng)加入細(xì)胞生長培養(yǎng)基時,纖維不脫離。然后,以不同的細(xì)胞密度將人胚胎腎(HEK)293細(xì)胞進(jìn)行鋪板,并讓其生長總共6天。HEK-293細(xì)胞粘著并生長附著至塑料小室的表面。研究HEK-293細(xì)胞在纖維附近生長的能力,和細(xì)胞對纖維的物理附著。HEK-293細(xì)胞在包含絲纖維的小孔中正常附著和生長(如在光學(xué)顯微鏡下觀察到的)。細(xì)胞非常緊密地沿著纖維邊緣生長,并且很明顯地,甚至在部分脫離的纖維下生長(圖8)。7天后,小心地從塑料表面上分離纖維,并且清楚地看到細(xì)胞群與纖維發(fā)生物理附著。纖維覆蓋了該圖的右上一半部分??吹紿EK293細(xì)胞附著至纖維的邊緣,并且也在纖維下面生長。重組絲纖維的存在不影響所研究的兩種不同的細(xì)胞類型(肥大細(xì)胞、HEK-293),即使在相當(dāng)高的數(shù)量的絲存在下亦如此。這表明,受試人造絲纖維在非毒性和生物相容性方面與^/proW力e/70/7i的野生型拖絲相似。因此,所述人造絲纖維看起來適合用于生物醫(yī)學(xué)應(yīng)用。實施例11.MaSpl蛋白纖維的機械性質(zhì)和結(jié)構(gòu)使用用于產(chǎn)生應(yīng)力-應(yīng)變曲線而實施的拉伸試驗來檢查來自5Gly/Ala-CL"(SEQIDNO:9)的纖維的機械性質(zhì)(圖9)。使用ZwickRoellZ2.5材料測試器(Zwick,Ulm,Germany)來表征拉伸性能。在環(huán)境條件(20X:和52%相對濕度)下,使用10mm/分鐘的負(fù)載速度在空氣中進(jìn)行所述試驗。直接從緩沖液中轉(zhuǎn)移出纖維小段,安放,和經(jīng)歷2輪繃緊-松弛循環(huán)。為了產(chǎn)生適合于拉伸試驗的均一的絲線,使用繃緊-松弛循環(huán)來伸長纖維。首先,通過牽拉直至O.IN的力來使纖維伸長。在松馳后,再次拉伸它們直至施加了0.25N的力。該處理產(chǎn)生具有大約80jam的直徑(通過使用MitutoyoIDC-IHB設(shè)備(MitutoyoCorp,Tokyo,Japan)進(jìn)行高度測量所確定的,并如下通過掃描電子顯微術(shù)(SEM)所確認(rèn)的)的伸長的均一纖維。在繃緊-松弛循環(huán)之前和之后,將纖維小段施加在SEM樣品臺上并在空氣干燥過夜。使用6nm的金和鉑層真空覆蓋所述樣品。使用10kV的加速電壓,用LE01550FEG顯孩吏鏡(CarlZeiss,0berkochen,Germany)觀察試樣并進(jìn)行照相。將經(jīng)拉抽的纖維切成小段,用膠(Loctite420,Loctite,G5teborg,Sweden)將所述小段的末端固定在卡紙板紙(cardboardpaper)之間。然后將纖維樣品固定在材料測試儀的夾具(grip)上,并繃緊直至它們斷裂。使用拉伸前的纖維的初始橫截面積(假定為圓形橫截面)來構(gòu)建應(yīng)力-應(yīng)變曲線。將應(yīng)力值對纖維的初始橫截面積進(jìn)行標(biāo)準(zhǔn)化。應(yīng)變相應(yīng)于dL/L。,其中L。是纖維的初始長度,和dL是纖維長度的變化。在圖9中,顯示了5Gly/Ala-CTnat(SEQIDNO:9)的雙拉伸纖維的三個不同樣品的應(yīng)力-應(yīng)變曲線,和經(jīng)測量為大約0.2GPa的它們的拉伸強度。通過SEM來分析纖維的顯微構(gòu)造(圖10)。自發(fā)形成的纖維具有均一的扁平的外觀和直至數(shù)百微米的寬度,而高度經(jīng)測量為大約10微米(圖10a,b)。在纖維經(jīng)歷繃緊-松馳循環(huán)后,它們的橫截面采取更圓的形狀,該性狀具有緊密排列的原纖維的致密的亞結(jié)構(gòu)(圖lOc-f)。切面或斷裂面的外觀(圖10e,f)進(jìn)一步證明了所產(chǎn)生的纖維的致密性。總之,自發(fā)形成的纖維顯示出與天然的或再生的蜘蛛絲纖維相似的形態(tài)學(xué)和機械性質(zhì),即使在不進(jìn)行紡絲的情況下。實施例12.蛛絲蛋白變體強的分子間相互作用被認(rèn)為促成了蜘蛛絲的令人印象深刻的拉伸強度。因此,產(chǎn)生了小型蛛絲蛋白的變體,其允許纖維中的分子間共價交聯(lián)。通過定向誘變來構(gòu)建兩種不同的突變型蛛絲蛋白,所述定向誘變分別在笫一(SEQIDNO:14,位置36和37)和第四(SEQIDNO:15,位置128和129)丙氨酸嵌段(alanineblock)中引入2個半胱氨酸殘基。表達(dá)這些變體,并使用與在實施例7-8中對于在實施例5-6中構(gòu)建的基因所描述的方案相同的方案來進(jìn)行分離。這些變體(SEQIDNO:14-15)以與5Gly/Ala-CTn"(SEQIDNO:9)相同的方式形成纖維。為了闡明C-末端結(jié)構(gòu)域的二聚化的重要性,已構(gòu)建了一種變體,其中將C-末端結(jié)構(gòu)域中的半胱氨酸殘基交換為絲氨酸殘基(SEQIDNO:16,位置222)。然而,該變體(SEQIDNO:16)以與5Gly/Ala-CTnat(SEQIDNO:9)相同的方式形成纖維。實施13.從表達(dá)的蛛絲蛋白中除去LPS和其他致熱原使用下列緩沖液來洗滌表達(dá)所需蛛絲蛋白融合蛋白的大腸桿菌細(xì)胞A.100mMTris,pH8,B5mMCaCl2,100mMTris,PH8,C10mMEDTA,100mMTris,PH8,D100mMTris,pH8,和E:100mMTris,pH8。然后,在補充有溶菌酶和DNA酶I的20mMTris(pH8)中裂解細(xì)胞。然后將蛋白質(zhì)樣品加載至Ni-sepharose基質(zhì)上,并用20mMTris,10-100mM咪唑,pH8進(jìn)行洗滌,隨后用20mMTris,100-300mM咪唑,pH8進(jìn)行洗脫。匯集相關(guān)級分,并針對20mMTris(pH8)透析過夜。然后用lOOiaMCaCl2補充蛋白質(zhì)樣品,最后使其通過事先用20mMTris,100|iMCaCl2,pH8平衡的EndoTrapBlue柱。以這種方式,可獲得致熱原含量為1EU/mg蛋白質(zhì)的蛋白質(zhì)樣品,如通過IPT和LAL動力學(xué)測定法所判定的。然后,以1:1000(w/w)凝血酶融合蛋白比例,用凝血酶通過蛋白水解來切割融合蛋白,這引起纖維形成(如上所述的)。將纖維在20niMTris(pH8)中洗滌3次,最后在水中洗滌3次。這產(chǎn)生了致熱原含量為0.25EU/mg纖維的纖維。在125。C和1.5巴下高壓滅菌10分鐘后,纖維的結(jié)構(gòu)特征未受影響,這使得能夠?qū)λ霾牧线M(jìn)行有效的滅菌。所述纖維在化學(xué)上是穩(wěn)定的,并且不能溶解于8M尿素、6MGuaHCl或純HAc中。然而,所述纖維可溶解在純HFIP或曱酸中。權(quán)利要求1.分離的大壺腹腺蛛絲蛋白,其特征在于,所述蛋白質(zhì)由150至420個氨基酸殘基組成并且由式REP-CT定義,其中REP是具有80至300個氨基酸殘基的蛋白質(zhì)片段,其中所述片段選自L(AG)nL、L(AG)nAL、L(GA)nL、L(GA)nGL,其中n是4至8的整數(shù);每個獨個A區(qū)段是8至18個氨基酸殘基的氨基酸序列,其中所述氨基酸殘基中的0至3個不是Ala,而其余的氨基酸殘基是Ala;每個獨個G區(qū)段是12至30個氨基酸殘基的氨基酸序列,其中至少40%的氨基酸殘基是Gly;和每個獨個L區(qū)段是0至20個氨基酸殘基的連接體氨基酸序列;以及CT是具有70至120個氨基酸殘基的蛋白質(zhì)片段,該片段是源自大壺腹腺蛛絲蛋白的C-末端片段。2.權(quán)利要求1的分離的蛋白質(zhì),其中每個獨個A區(qū)段與選自下列的氨基酸序列具有至少80%的同一性SEQIDNO:3的氨基酸殘基7-19、43-56、71-83、107-120、135-147、171-183、198-211、235-248、266-279、294-306、330-342、357-370、394-406、421-434、458-470、489-502、517-529、553-566、581-594、618-630、648-661、676-688、712-725、740-752、776-789、804-816、840-853、868-880、904-917、932-945、969-981、999-1013、1028-1042和1060-1073;SEQIDNO:9的氨基酸殘基31-42、61-75、90-104、122-135和153-171;SEQIDNO:13的氨基酸殘基12-25、46-60、75-88、112-119、150-158和173-180;SEQIDNO:14的氨基酸殘基31-42;和SEQIDNO:15的氨基酸殘基122-135。3.權(quán)利要求2的分離的蛋白質(zhì),其中每個獨個A區(qū)段是選自權(quán)利要求2的氨基酸序列的氨基酸序列。4.前述權(quán)利要求中任一項的分離的蛋白質(zhì),其中每個獨個G區(qū)段與選自下列的氨基酸序列具有至少80%的同一性SEQIDNO:3的氨基酸殘基20-42、57-70、84-106、121-134、148-170、184-197、212-234、249-265、280-293、307-329、343-356、371-393、407-420、435-457、471-488、503-516、530-552、567-580、595-617、631-647、662-675、689-711、726-739、753-775、790-803、817—839、854-867、881-903、918-931、946-968、982-998、1014-1027、1043-1059和1074-1092;SEQIDNO:5-7;SEQIDNO:9的氨基酸殘基11-30、43-60、76-89、105-121和136-152;和SEQIDNO:13的氨基酸殘基1-11、26-45、61-74、89-111、120-149和159-172。5.權(quán)利要求4的分離的蛋白質(zhì),其中每個獨個G區(qū)段與選自權(quán)利要求4的氨基酸序列的氨基酸序列相同。6.前述權(quán)利要求中任一項的分離的蛋白質(zhì),其中所述CT片段與SEQIDNO:8具有至少50%的同一性,或與選自SEQIDNO:4、SEQIDNO:9的氨基酸殘基172-269、SEQIDNO:13的氨基酸殘基181-276和SEQIDNO:16的氨基酸殘基172-269的氨基酸序列具有至少80%的同一性。7.權(quán)利要求6的分離的蛋白質(zhì),其中所述CT片段是選自權(quán)利要求6的氨基酸序列的氨基酸序列。8.—種分離的融合蛋白,所述融合蛋白由作為大壺腹腺蛛絲蛋白的第一蛋白質(zhì)片段和第二蛋白質(zhì)片段組成,其特征在于,所述第二蛋白質(zhì)片段包含融合伙伴和切割試劑識別位點,其中所述第一蛋白質(zhì)片段通過所述切割試劑識別位點偶聯(lián)至所述融合伙伴。9.選自X-REP-CT和REP-CT-X的分離的融合蛋白,其中REP和CT是權(quán)利要求l-7中任一項的蛋白質(zhì)片段;和X是包含融合伙伴和切割試劑識別位點的蛋白質(zhì)片段;其中組合的蛋白質(zhì)片段REP-CT通過所述切割試劑識別位點偶聯(lián)至所述融合伙伴。10.用于產(chǎn)生權(quán)利要求1-7任一項中定義的大壺腹腺蛛絲蛋白的方法,其包括下列步驟(i)提供權(quán)利要求8-9中任一項的融合蛋白在液體介質(zhì)中的溶液,(ii)向所述液體介質(zhì)中加入合適的切割試劑,所述切割試劑用于在切割試劑識別位點處實現(xiàn)融合蛋白的切割,從而獲得大壺腹腺蛛絲蛋白;和任選地(iii)從所述液體介質(zhì)中分離在步驟(ii)中獲得的大壺腹腺蛛絲蛋白。11.用于產(chǎn)生權(quán)利要求1-7任一項中定義的大壺腹腺蛛絲蛋白的多聚體的方法,其包括下列步驟(i)提供權(quán)利要求8-9中任一項的融合蛋白在液體介質(zhì)中的溶液,(ii)向所述液體介質(zhì)中加入合適的切割試劑,所述切割試劑用于在切割試劑識別位點處實現(xiàn)融合蛋白的切割,從而獲得大壺腹腺蛛絲蛋白;(iii)允許在步驟(ii)中獲得的大壺腹腺蛛絲蛋白在液體介質(zhì)中聚合;和任選地(iv)從所迷液體介質(zhì)中分離在步驟(iii)中獲得的多聚體。12.—種分離的多聚核酸分子,其包含編碼權(quán)利要求1-7中任一項的大壺腹腺蛛絲蛋白的核酸序列或其互補核酸序列。13.—種分離的多聚核酸分子,其包含編碼權(quán)利要求8-9中任一項的融合蛋白的核酸序列或其互補核酸序列。14.用于產(chǎn)生權(quán)利要求8-9中任一項的可溶性融合蛋白的方法,其包括下列步驟(i)在合適的宿主中表達(dá)權(quán)利要求13的多聚核酸分子;和(ii)分離在步驟(i)中獲得的可溶性融合蛋白。15.用于產(chǎn)生權(quán)利要求1-7中任一項的大壺腹腺蛛絲蛋白的方法,其包括下列步驟(i)在合適的宿主中表達(dá)權(quán)利要求13的多聚核酸分子;(ii)分離在步驟(i)中獲得的可溶性融合蛋白;(iii)提供在步驟(ii)中獲得的所述可溶性融合蛋白在液體介質(zhì)中的溶液;(iv)向所述液體介質(zhì)中加入合適的切割試劑,所述切割試劑用于在切割試劑識別位點處實現(xiàn)融合蛋白的切割,從而獲得大壺腹腺蛛絲蛋白;和任選地(v)從所述液體介質(zhì)中分離在步驟(iv)中獲得的大壺腹腺蛛絲蛋白。16.用于產(chǎn)生權(quán)利要求1-7的大壺腹腺蛛絲蛋白的多聚體的方法,其包括下列步驟(i)在合適的宿主中表達(dá)權(quán)利要求13的多聚核酸分子;(ii)分離在步驟(i)中獲得的可溶性融合蛋白;(iii)提供在步驟(ii)中獲得的所述可溶性融合蛋白在液體介質(zhì)中的溶液;(iv)向所述液體介質(zhì)中加入合適的切割試劑,所述切割試劑用于在切割試劑識別位點處實現(xiàn)融合蛋白的切割,從而獲得大壺腹腺蛛絲蛋白;(v)允許在步驟(iv)中獲得的大壺腹腺蛛絲蛋白在液體介質(zhì)中聚合;和任選地(vi)從所述液體介質(zhì)中分離在步驟(v)中獲得的多聚體。17.權(quán)利要求1-7中任一項的大壺腹腺蛛絲蛋白的多聚體。18.可通過權(quán)利要求11和16中任一項的方法獲得的大壺腹腺蛛絲蛋白的多聚體。19.包含融合伙伴和切割試劑識別位點的蛋白質(zhì)片段在制備融合蛋白中的用途,所述融合蛋白包含通過所述切割試劑識別位點偶聯(lián)至蜘蛛絲蛋白質(zhì)片段的所述蛋白質(zhì)片段。20.—種分離的多聚核酸分子,其包含選自SEQIDNO:1和編碼SEQIDNO:2-16的核酸序列的核酸序列,或其互補核酸序列。21.權(quán)利要求20的分離的多聚核酸分子在制備編碼蜘蛛絲蛋白的非天然基因中的用途。22.權(quán)利要求11的方法,其中允許在步驟(ii)中獲得的大壺腹腺蛛絲蛋白在液體介質(zhì)中聚合的所述步驟(iii)還包括,提供所述液體介質(zhì)與選自氣相、液相和固相的另一相之間的界面,其中所述聚合在所述界面處或在圍繞所述界面的區(qū)域中開始。23.權(quán)利要求16的方法,其中允許在步驟(iv)中獲得的大壺腹腺蛛絲蛋白在液體介質(zhì)中聚合的所述步驟(v)還包括,提供所述液體介質(zhì)與選自氣相、液相和固相的另一相之間的界面,其中所述聚合在所述界面處或在圍繞所述界面的區(qū)域中開始。24.權(quán)利要求22或權(quán)利要求23的方法,丼中所述液體介質(zhì)是水性介質(zhì),并且所述其他相選自空氣和與水不能混溶的有機溶劑。25.權(quán)利要求14的方法,其中分離可溶性融合蛋白的所述步驟(ii)包括除去LPS和其他致熱原。26.權(quán)利要求15的方法,其中分離可溶性融合蛋白的所述步驟(ii),和任選地,分離大壺腹腺蛛絲蛋白的所述步驟(v),包括除去LPS和其他致熱原。27.權(quán)利要求8或9的分離的融合蛋白,其中LPS和其他致熱原的含量為1EU/mg蛋白質(zhì)或更低。28.權(quán)利要求1-7中任一項的分離的大壺腹腺蛛絲蛋白,其中LPS和其他致熱原的含量為1EU/mg蛋白質(zhì)或更低。全文摘要本發(fā)明提供了分離的大壺腹腺蛛絲蛋白,其由150至420個氨基酸殘基組成并且由式KEP-CP定義。KEP是重復(fù)的、具有80至300個氨基酸殘基的N-末端衍生的蛋白質(zhì)片段。CT是具有70至120個氨基酸殘基的C-末端衍生的蛋白質(zhì)片段。本發(fā)明進(jìn)一步提供了分離的融合蛋白,其由作為大壺腹腺蛛絲蛋白的第一蛋白質(zhì)片段和包含融合伙伴及切割試劑識別位點的第二蛋白質(zhì)片段組成。第一蛋白質(zhì)片段通過所述切割試劑識別位點偶聯(lián)至融合伙伴。本發(fā)明還提供了用于產(chǎn)生大壺腹腺蛛絲蛋白及其多聚體的方法。文檔編號C07K14/435GK101395178SQ200680053590公開日2009年3月25日申請日期2006年12月28日優(yōu)先權(quán)日2005年12月30日發(fā)明者A·里辛,G·耶爾姆,J·約翰松,M·斯塔克,M·赫德哈馬爾,S·格里普,W·恩斯特倫申請人:思百博技術(shù)股份公司