本發(fā)明屬于合成生物學領(lǐng)域,涉及一種生產(chǎn)倍半萜化合物—longiborneol的萜類合酶及其應(yīng)用。
背景技術(shù):
萜類化合物是含有異戊二烯單元的化合物的總稱。它在自然界廣泛存在,迄今為止,人們已從動物、植物以及微生物體內(nèi)發(fā)現(xiàn)大約76000種萜類化合物。該化合物具有許多生理活性,所以被廣泛應(yīng)用于香水生產(chǎn)行業(yè)、保健品行業(yè)、農(nóng)業(yè)生產(chǎn)領(lǐng)域以及醫(yī)療行業(yè)。
萜類化合物的生產(chǎn)方法有天然提取、化學合成法和發(fā)酵法。但由于天然提取法生產(chǎn)成本居高不下,化學合成法可能的毒害作用和國際上對天然產(chǎn)物的日益推崇,人們開始大量研究利用微生物發(fā)酵法生產(chǎn)萜類化合物。
生物體利用2-甲基-赤蘚糖醇磷酸(mep途徑)或者甲羥戊酸途徑(mva途徑)的異戊烯焦磷酸異構(gòu)酶idi合成ipp以及dmapp,隨后ipp以及dmapp在異戊烯轉(zhuǎn)移酶催化下合成gpp、fpp,ggpp以及gfpp等不同鏈長的異戊二烯單元。隨后萜類合酶(terpenesynthase,ts)可以這些不同鏈長的異戊二烯單元為底物,合成單萜(c10)、倍半萜(c15)、二萜(c120)、二倍半萜(c25)、三萜(c30)、四萜(c40)以及多萜。
這其中,單萜和倍半萜為香水及香料化合物的主要來源,對有關(guān)這些化合物生物合成基因的挖掘及在萜類化合物微生物合成高產(chǎn)平臺中進行代謝工程改造,將使得我們能夠高效經(jīng)濟地實現(xiàn)這些高附加值產(chǎn)物的合成。
技術(shù)實現(xiàn)要素:
為了克服現(xiàn)有技術(shù)的缺點與不足,本發(fā)明提供一種新型的萜類合酶fgj01056及含有該萜類合酶基因的生產(chǎn)longiborneol的菌株,以實現(xiàn)倍半萜化合物longiborneol的微生物合成,提高產(chǎn)量、降低成本,為香料的制備提供更多的來源,減少毒害作用。
本發(fā)明的第一方面,提供一種萜類合酶fgj01056,其具有seqidno:1所示的氨基酸序列。
進一步地,本發(fā)明提供一種核酸分子,其編碼上述萜類合酶fgj01056,核苷酸序列如seqidno:2所示。
本發(fā)明的第二方面,提供萜類合酶fgj01056的用途,用于生產(chǎn)longiborneol。
本發(fā)明的第三方面,提供一種生產(chǎn)longiborneol的菌株,該菌株含有甲羥戊酸途徑(mva途徑)和longiborneol合成的相關(guān)基因;所述的甲羥戊酸途徑的相關(guān)基因包括(1)將乙酰輔酶a縮合為乙酰乙酰輔酶a的基因atob、(2)將乙酰輔酶a和乙酰乙酰輔酶a縮合為hmg-coa的基因erg13、(3)將hmg-coa還原為甲羥戊酸的基因thmg1、(4)將甲羥戊酸磷酸化為甲羥戊酸-5-磷酸的基因erg12、(5)將甲羥戊酸-5-磷酸磷酸化為甲羥戊酸-5-焦磷酸的基因erg8、(6)將甲羥戊酸-5-焦磷酸脫羧生成異戊烯焦磷酸的基因mvd1和(7)將異戊烯焦磷酸異構(gòu)為二甲基烯丙基焦磷酸的基因idi;所述的longiborneol合成的相關(guān)基因包括ispa和萜類合酶fgj01056基因,所述的fgj01056基因,其序列如seqidno:2所示。合成的目標萜類化合物longiborneol具有下列式(i)的結(jié)構(gòu):
所述的甲羥戊酸途徑的相關(guān)基因優(yōu)選為來源于大腸桿菌xl1-blue的atob基因(am946981.2)、idi(cp010152.1)和來源于釀酒酵母invsc1的erg13基因(cp005477.2)、thmg1(cp005464.2)、erg12(cp008027.1)、erg8(cp005426.1)、mvd1(cp005554.2)。
所述的萜類合酶fgj01056基因來源于真菌禾谷鐮刀菌j1-012(fusariumgraminearumj1-012)的fgj01056,其核苷酸序列如seqidno:2所示,其氨基酸序列為seqidno:1。
優(yōu)選的,所述的生產(chǎn)longiborneol的菌株為含有質(zhì)粒pmh1、質(zhì)粒pfz81和質(zhì)粒pgb235的大腸桿菌;所述的質(zhì)粒pmh1以pbbr1mcs為骨架載體、啟動子為lac啟動子,復制子替換為p15a復制子,包含atob、erg13和thmg1基因,pmh1的序列(不含骨架載體序列)如seqidno.3所示;所述的質(zhì)粒pfz81以pbbr1mcs-2為骨架載體、啟動子為lac啟動子、復制子為質(zhì)粒自帶的pbbr1mcs復制子,包含erg12、erg8、mvd1和idi基因,pfz81的序列(不含骨架載體序列)如seqidno.4所示;所述的質(zhì)粒pgb233以pet21為骨架載體、啟動子為t7啟動子、復制子為質(zhì)粒自帶的高拷貝的pbr322復制子,包含fgj01056、ispa、idi基因,pgb233的序列(不含骨架載體序列)如seqidno.5所示。
優(yōu)選的,所述的生產(chǎn)longiborneol的菌株原核表達時過表達來源于大腸桿菌xl1-blue的atob基因或idi基因,合成大量催化底物法尼基焦磷酸fpp。
本發(fā)明的第四方面是提供上述生產(chǎn)longiborneol的菌株在生產(chǎn)longiborneol中的應(yīng)用。
本發(fā)明相對于現(xiàn)有技術(shù)具有如下優(yōu)點和效果:本發(fā)明首次利用萜類合酶fgj01056基因結(jié)合外源的甲羥戊酸途徑獲得了穩(wěn)定生產(chǎn)longiborneol的大腸桿菌。本發(fā)明的萜類合酶具有專一性和高效性,可以提高longiborneol的產(chǎn)量,極大地克服了原料投入量大而longiborneol產(chǎn)率低的弊端,降低了研究成本,并且保證綠色環(huán)保;此外,由于longiborneol合酶抑制劑可以阻斷culmorin在真菌毒素中重要的協(xié)同增效毒力作用,通過對longiborneol的進一步研究我們可以進一步發(fā)掘出如何準確快速阻斷culmorin的毒力作用。
附圖說明
圖1為gc-ms檢測fgj01056以fpp為底物的體外反應(yīng)和fgj01056發(fā)酵(pgb233),e.colil1體外反應(yīng)色譜圖;
圖2為質(zhì)粒pmh1結(jié)構(gòu)示意圖;
圖3為質(zhì)粒pfz81結(jié)構(gòu)示意圖;
圖4為質(zhì)粒pgb148結(jié)構(gòu)示意圖;
圖5為質(zhì)粒pgb232結(jié)構(gòu)示意圖;
圖6為質(zhì)粒pgb233結(jié)構(gòu)示意圖;
圖7為菌株發(fā)酵產(chǎn)物的ms圖;
圖8為化合物(i)的譜圖,
其中a為化合物(i)的結(jié)構(gòu)示意圖;b為碳譜圖(13cnmr,cdcl3,101mhz);c為氫譜圖(1hnmr,cdcl3,400mhz)。
具體實施方式
通過以下詳細說明結(jié)合附圖可以進一步理解本發(fā)明的特點和優(yōu)點。所提供的實施例僅是對本發(fā)明方法的說明,而不以任何方式限制本發(fā)明揭示的其余內(nèi)容。
實施例中未注明具體技術(shù)或條件的,按照本領(lǐng)域內(nèi)的文獻所描述的技術(shù)或條件或者按照產(chǎn)品說明書進行。所用試劑或儀器未注明生產(chǎn)廠商者,均為可以通過市購獲得的常規(guī)產(chǎn)品。
【實施例1】體外驗證萜類合酶的功能
1、質(zhì)粒pgb148的構(gòu)建
以反轉(zhuǎn)錄的fusariumgraminearumj1-012的cdna為模板,用引物p27/p29(見表1)擴增獲得fgj01056的編碼區(qū)并連接到質(zhì)粒pet28a上獲得質(zhì)粒pgb148(圖4),用于純化蛋白。
2、蛋白的純化
將含有目的基因(seqidno:2所示的核苷酸序列)的表達載體pgb148轉(zhuǎn)化表達宿主e.colibl21(de3),轉(zhuǎn)化后挑取單克隆至含相應(yīng)抗生素的lb培養(yǎng)基中,37℃,220rpm過夜培養(yǎng)。按1%接種量轉(zhuǎn)接至1l含相應(yīng)抗生素的新鮮的lb培養(yǎng)基中,37℃,220rpm培養(yǎng)至od600約為0.6-0.8,降溫至16℃,加入終濃度為0.1mm的iptg,16℃,220rpm培養(yǎng)16-18h。8000rpm離心5min收集細胞,之后用30-40ml蛋白純化緩沖液a(buffera:50mmtris-hcl,300mmnacl,4mmβ-巰基乙醇,ph7.6)徹底重懸細胞,超聲破碎(脈沖5s,停頓8s,超聲破碎5min)。4℃,12,000g離心30min以上,收集上清,4℃,20,000rpm離心1h,收集上清,用0.45μm濾膜進行過濾,加入6%bufferb(bufferb:500mm咪唑加入到buffera中)使咪唑約為30mm,混勻備用。
使用bio-rad的biologicduoflowchromatographysystem純化組氨酸標簽蛋白。蛋白分離柱加載至fplc上加以控制,fplc的流速始終為1.5ml/min,而樣品自動上樣的流速為2ml/min。所得到的上清樣品用5mlhitraphpni-nta柱子經(jīng)biorad做第一步純化,該鎳離子螯合柱先經(jīng)過30ml(6個柱體積)緩沖液a(buffera:50mmtris-hcl,300mmnacl,4mmβ-巰基乙醇,ph7.6)的平衡,然后通過自動進樣器將準備好的30ml上清液加載到柱子上,再用20ml的緩沖液a(4個柱體積)對柱子進行清洗,這時啟動緩沖液b(50mmtris-hcl,150mmnacl,250mmimidazoleph7.6)的線性梯度,在100ml(20個柱體積)的流量內(nèi),緩沖液b由0%增長為100%,再用20ml(4個柱體積)100%的緩沖液b清洗柱子。根據(jù)紫外吸收收集并通過sds-page檢測帶有組氨酸標簽的目的蛋白。挑選比較純的組分收集起來,通過millipore公司的離心濃縮管amiconcentricon-10(分子量在10,000以下的會被濾出)來離心濃縮至2.5ml,然后通過pharmacia公司的pd-10柱子脫鹽并交換到緩沖液c(含有10%甘油的50mm磷酸緩沖液,ph7.6)中,分裝后液氮速凍并保存于-80℃冰箱。
3、體外催化反應(yīng)
我們設(shè)立了以下體外酶促反應(yīng)體系:向200μl終濃度為50mm含有10%甘油的pbbuffer(ph7.6)緩沖液中添加10μm純化的蛋白,100μm的底物gpp、fpp或ggpp,以及2mm的mg2+,30℃過夜反應(yīng)。隨后用等體積的正己烷萃取2次,合并有機相并用gc-ms檢測生成的產(chǎn)物。
萜類化合物檢測所用的gc-ms為thermotracegcultra氣相色譜配備tsqquantumxlsms,氣相色譜柱為tracetr-5ms(30m×0.25mm×0.25um)。每次分析進樣1μl,以高純的氦氣為載氣,設(shè)置流速為1ml/min。gc條件為80℃維持1min,隨后以10℃/min的速率升溫到220℃,再在220℃維持15min。進樣器和傳輸線溫度分別設(shè)定為230℃和240℃。
結(jié)果顯示,fgj01056表達的萜類合酶能夠以fpp為底物,合成倍半萜產(chǎn)物(圖1)。
【實施例2】構(gòu)建表達載體
用qiagen公司的bloodandcellculturednaminikit純化獲得大腸桿菌xl1-blue基因組dna和釀酒酵母invsc1基因組dna。
質(zhì)粒pmh1含有甲羥戊酸途徑前三個基因:來源于大腸桿菌xl1-blue的atob基因(乙酰乙酰輔酶a硫酯酶,am946981.2),來源于釀酒酵母invsc1的erg13(hmg-coasynthase,cp005477.2)和thmg1(hmg-coa還原酶,刪除了hmg1的跨膜區(qū)域,cp005464.2)。
質(zhì)粒pfz81含有甲羥戊酸途徑后四個基因:來源于釀酒酵母invsc1的erg12(甲羥戊酸激酶,cp008027.1),erg8(甲羥戊酸-5-磷酸激酶,cp005426.1)和mvd1(甲羥戊酸-5-焦磷酸激酶,cp005554.2),來源于大腸桿菌xl1-blue的idi(異戊烯焦磷酸異構(gòu)酶,cp010152.1)基因。
質(zhì)粒pgb233含有合成倍半萜化合物的三個基因,分別是來源于真菌禾谷鐮刀菌j1-012(fusariumgraminearumj1-012)的fgj01056(seqidno:2),其氨基酸序列為seqidno:1;來源于大腸桿菌xl1-blue的idi;來源于大腸桿菌xl1-blue的ispa,能夠以甲羥戊酸產(chǎn)物異戊二烯焦磷酸(ipp)和二甲烯丙基焦磷酸(dmapp)為底物合成法尼基焦磷酸,用于倍半萜的合成。
所有基因均通過pcr擴增獲得,所用引物見表1。
表1引物序列表
具體構(gòu)建方法如下:
①質(zhì)粒pmh1的構(gòu)建
首先將pbbr1mcs質(zhì)粒的復制子替換為來源于pmsd15質(zhì)粒的p15a復制子。以質(zhì)粒pbbr1mcs為模板用引物p1/p2進行擴增,同時p15a復制子用引物p3/p4擴增(引物序列見表1),經(jīng)pcr產(chǎn)物純化后用nanodrop測定dna濃度,然后將20ngpcr擴增的p15a片段和等摩爾的pbbr1mcs片段混合,經(jīng)過一輪pcr擴增,擴增條件為:98℃,2min預變性,然后30個pcr循環(huán)98℃,20s;60℃,20s;72℃,6min,最后72℃充分延伸10min。隨后轉(zhuǎn)化大腸桿菌xl1-blue獲得質(zhì)粒pbbr1mcs/p15a。
用引物p5/p6以pbbr1mcs/p15a為模板擴增pmh1質(zhì)粒骨架,同時用p7/p8、p9/p10、p11/p12為引物擴增相應(yīng)基因。經(jīng)pcr產(chǎn)物純化之后,取50ngpbbr1mcs/p15a擴增產(chǎn)物和等摩爾的各基因擴增產(chǎn)物混合,并用去離子水調(diào)整體積到5μl,隨后加入至15μl的gibson緩沖液中混勻,50℃反應(yīng)1h后轉(zhuǎn)化大腸桿菌xl1-blue,挑取克隆,并將陽性克隆測序獲得質(zhì)粒pmh1(圖2)。
②質(zhì)粒pfz81的構(gòu)建
用引物p13/p14以pbbr1mcs-2為模板擴增pfz81質(zhì)粒骨架,同時用p15/p16、p17/p18、p19/p20、p21/p22為引物擴增相應(yīng)基因。經(jīng)pcr產(chǎn)物純化之后,取50ngpbbr1mcs-2擴增產(chǎn)物和等摩爾的各基因擴增產(chǎn)物混合,并用去離子水調(diào)整體積到5μl,隨后加入至15μl的gibson緩沖液中混勻,50℃反應(yīng)1h后轉(zhuǎn)化大腸桿菌xl1-blue,挑取克隆,并將陽性克隆測序獲得質(zhì)粒pfz81(圖3)。
③質(zhì)粒pgb232的構(gòu)建
以反轉(zhuǎn)錄的fusariumgraminearumj1-012的cdna為模板,用引物p27/p28擴增獲得fgj01056的編碼區(qū)并連接到質(zhì)粒pet21a上獲得質(zhì)粒pgb232(圖5)。
④質(zhì)粒pgb233的構(gòu)建
用引物p23/p24以及p25/p26分別從e.colibl21(de3)基因組上擴增ispa以及idi基因,隨后將ispa克隆至pet21a獲得質(zhì)粒pgb305;將idi克隆至pet21a(+)獲得質(zhì)粒pgb306。分別用xbai/xhoi,spei/xhoi酶切質(zhì)粒pgb305和pgb306,隨后借助同尾酶將pgb306上酶切下來的idi片段連接至質(zhì)粒pgb305從而獲得質(zhì)粒pgb308。隨后用xbai/xhoi從pgb308上酶切下來ispa-idi片段并借助同尾酶分別將其連接至質(zhì)粒pgb232,獲得質(zhì)粒pgb233(圖6)。
【實施例3】大腸桿菌體內(nèi)合成fgj01056來源的倍半萜化合物
為了生產(chǎn)倍半萜化合物,將甲羥戊酸途徑的兩個質(zhì)粒pmh1和pfz81同時轉(zhuǎn)入大腸桿菌bl21(de3)中獲得bl21(de3)/pmh1/pfz81,命名為ps,隨后將pgb233轉(zhuǎn)化進入菌株ps中,獲得菌株l1,隨后分別挑取單克隆至10ml的lb培養(yǎng)基中(同時含有100μg/ml氨芐青霉素,50μg/ml卡那霉素和34μg/ml氯霉素),37℃,220rpm過夜培養(yǎng),隨后按1%接種量接種到新鮮的同一培養(yǎng)基中37℃,220rpm繼續(xù)培養(yǎng)至od600約為0.6~0.8時,降溫至16℃并加入終濃度為0.1mm的iptg進行誘導表達,誘導表達18h后升溫至28℃發(fā)酵72h,隨后對其進行發(fā)酵及產(chǎn)物萃取,收集菌體及發(fā)酵液用等體積的正己烷萃取2次,減壓蒸餾后甲醇復溶(加入甲醇前先加入少量dmso助溶),用于產(chǎn)物純化。
結(jié)果顯示,含有fgj01056的突變株e.colil1能夠以fpp為底物合成保留時間為11.95min的具有苔蘚氣味的化合物longiborneol(圖1、7)。
【實施例4】化合物鑒定
1hnmr和13cnmr結(jié)果顯示(圖8)gc-ms保留時間為11.95min的化合物為白色至淺黃色結(jié)晶的longiborneol。1hnmr(400mhz,cdcl3)δ3.74(td,j=4.9,1.9hz,1h),1.89–1.81(m,1h),1.83(d,j=4.3hz,1h),1.75–1.66(m,1h),1.47–1.38(m,2h),1.37–1.24(m,4h),1.23–1.16(m,1h),1.16–1.10(m,1h),0.95(d,j=4.9hz,1h),0.92(d,j=1.4hz,6h),0.85(s,3h),0.82(s,3h)。13cnmr(101mhz,cdcl3)δ79.70,64.52,51.26,50.17,44.00,40.99,35.10,33.37,30.29,29.26,28.85,26.33,22.65,22.46,12.99。倍半萜醇longiborneol的理論分子量為223.2056,高分辨質(zhì)譜檢測結(jié)果顯示其實際分子量為223.2047。
sequencelisting
<110>武漢大學
<120>一種生產(chǎn)longiborneol的萜類合酶及其應(yīng)用
<160>34
<170>patentinversion3.3
<210>1
<211>339
<212>prt
<213>禾谷鐮刀菌j1-012
<400>1
metleualathrprothrleuserasnpheasplysproserleupro
151015
sersergluglyglyaspproalaleualaalaargleuglnproleu
202530
tyrserargpheleuthraspleuaspleuglnproglutyrargarg
354045
hisgluserglulysleumetglugluvalleulysphealalysser
505560
thrglyvalprohisaspleuasnserhissertyrglnserleumet
65707580
valglytyrthrtyralaaspasncysleuprotyrhisaspileglu
859095
vallysvaltyrvalalailetyrthrtrpleualathrilecysasp
100105110
aspalaglualaleuglyileileaspaspvalglnleupheglugln
115120125
argpheileleuglyglugluglnprothrvalleuleuargalaphe
130135140
alaaspglnleulysleuthrtyrlysleutyrhisproleuvalala
145150155160
asnleuileleucysserserleuasnleuleuthrserthrserleu
165170175
valalaarglysglyilelysglulysglyasphisproserlysgly
180185190
glyasntyrphealatrptyrilearggluargaspglyvalglyglu
195200205
alatyrsertrpphethrpheprolysargglnpheproaspleuasp
210215220
ileproileglualailegluaspmetthrargpheilealatyrleu
225230235240
asnaspvalleuserphetyrlysgluserleualaglygluthrhis
245250255
asntyrileasnhisthralaalatyrgluglyvalaspseraspala
260265270
alaleuhislysthralaglnaspthrileaspcysalaargargile
275280285
gluservalleualaglylysglyglutyrglulysalatrpargleu
290295300
hisalaserglytyrleuglnmethisvalglnargglyargtyrarg
305310315320
leuilegluvalglyvalglyaspalaproaspvalhisgluvalile
325330335
lyslysile
<210>2
<211>1017
<212>dna
<213>禾谷鐮刀菌j1-012j1-012
<400>2
atgcttgctacaccgaccctgtccaacttcgacaaaccctctcttccatcctcggaggga60
ggtgatcccgcccttgcagctcgcttgcaaccactgtattcgaggtttctcacggatctt120
gatctacagccggaatatagacgtcacgaaagcgagaagcttatggaggaggtgctcaaa180
tttgcgaagagtactggtgtacctcatgatctcaactcccattcctatcaaagtctcatg240
gttggatacacatacgccgataactgcctcccatatcatgacattgaagtcaaggtttat300
gtagccatctacacatggctggcaactatttgcgatgacgccgaggcactaggcatcatt360
gatgatgttcaattgttcgaacaacgctttattctcggagaggaacagcctacggtcctc420
ctcagggcttttgccgaccaactcaaactcacctataagctgtaccacccccttgttgcg480
aatctgattctttgctcctctctgaatctgctcacttctacatcccttgtggctcgcaag540
ggtattaaagaaaagggtgatcatccatcaaagggaggcaactacttcgcctggtacatc600
cgggaacgggatggcgtcggtgaagcctattcctggttcactttccccaaacgacaattc660
cccgacctggacattcctatcgaagctattgaagatatgacacgattcattgcctatctc720
aatgatgttttatcgttttacaaagagtccctggctggcgagacacacaactacatcaac780
catacggctgcgtatgagggtgttgattcggatgctgcgcttcataaaactgctcaagac840
accatagactgtgcccgccgcattgagagtgttctcgcaggaaagggcgagtatgagaaa900
gcgtggcgacttcatgcatccggatacctccaaatgcacgtccagagaggtcgttacagg960
cttatagaggtgggcgttggtgatgcgccagatgtgcatgaagtcatcaagaagatt1017
<210>3
<211>4515
<212>dna
<213>人工序列
<400>3
gcgcgtaatacgactcactatagggcgaattggagctccaccgcggtggcggccgctcta60
gaactagtggatccttaggatttaatgcaggtgacggacccatctttcaaacgatttata120
tcagtggcgtccaaattgttaggttttgttggttcagcaggtttcctgttgtgggtcata180
tgactttgaaccaaatggccggctgctagggcagcacataaggataattcacctgccaag240
acggcacaggcaactattcttgctaattgacgtgcgttggtaccaggagcggtagcatgc300
gggcctcttacacctaataagtccaacatggcaccttgtggttctagaacagtaccacca360
ccgatggtacctacttcgatggatggcatggatacggaaattctcaaatcaccgtccact420
tctttcatcaatgttatacagttggaactttcaacattttgtgcaggatcttgtcctaat480
gccaagaaaacagctgtcactaaattagctgcatgtgcgttaaatccaccaacagaccca540
gccattgcagatccaaccaaattcttagcaatgttcaactcaaccaatgcggaaacatca600
ctttttaacacttttctgacaacatcaccaggaatagtagcttctgcgacgacactctta660
ccacgaccttcgatccagttgatggcagctggtttttttgtcggtacagtagttaccaga720
aacggagacaacctccatatcttcccagccatactcttctaccatttgctttaatgagta780
ttcgacacctttagaaatcatattcatacccattgcgtcaccagtagttgttctaaatct840
catgaagagtaaatctcctgctagacaagtttgaatatgttgcagacgtgcaaatcttga900
tgtagagttaaaagcttttttaattgcgttttgtccctcttctgagtctaaccatatctt960
acaggcaccagatcttttcaaagttgggaaacggactactgggcctcttgtcataccatc1020
cttagttaaaacagttgttgcaccaccgccagcattgattgccttacagccacgcatggc1080
agaagctaccaaacaaccctctgtagttgccattggtatatgataagatgtaccatcgat1140
aaccaaggggcctataacaccaacgggcaaaggcatgtaacctataacattttcacaaca1200
agcgccaaatacgcggtcgtagtcataatttttatatggtaaacgatcagatgctaatac1260
aggagcttctgccaaaattgaaagagccttcctacgtaccgcaaccgctctcgtagtatc1320
acctaattttttctccaaagcgtacaaaggtaacttaccgtgaataaccaaggcagcgac1380
ctctttgttcttcaattgttttgtatttccactacttaataatgcttctaattcttctaa1440
aggacgtattttcttatccaagctttcaatatcgcgggaatcatcttcctcactagatga1500
tgaaggtcctgatgagctcgattgcgcagatgataaacttttgactttcgatccagaaat1560
gactgttttattggttaaaacgaattcggatccgcgacccatttgctgtccaccagtcat1620
gctagccatatggctgccgcgcggcaccaggccgctgctgtgatgatgatgatgatggct1680
gctgcccatagtgtaatcctccttattttttaacatcgtaagatcttctaaatttgtcat1740
cgatgttggtcaagtagtaaacaccactttgcaaatgctcaatggaaccttgaggtttga1800
agttcttcttcaaatgggcattttctctcaattcgatggcagcttcgtaatcctttggag1860
tttcggtgattctcttggctaatttgttagtaatatctaattccttgataatatgttgga1920
cgtcaccaacaattttgcaagaatatagagatgcagctaaaccggaaccgtaagaaaata1980
aaccaacacgcttgccttgtaagtcgtcagatccaacatagtttaatagagatgcaaagg2040
cggcataaacagatgcggtgtacatgttacctgtgtttgttggaacaatcaaagattggg2100
caactctctctttgtggaatggcttagcaacattaacaaaagttttttcaatgttcttat2160
cggttaaagattcgtcataatcgcgagtagctaattcggcgtcaacttctgggaacaatt2220
gaggattggctctgaaatcgttatatagtaatctaccgtatgattttgtgaccaatttac2280
aggttggaacatggaaaacgttgtagtcgaaatatttcaaaacgttcaaagcatccgaac2340
cagcgggatcgctaaccaaccctttagaaatagccttcttggaataactcttgtaaactt2400
gatcaagagccttgacgtaacaagttaatgaaaaatgaccatcgacgtaaggatattcgc2460
tggtgaaatctggcttgtaaaaatcgtaggcgtgttccatgtaagaagctcttacagagt2520
caaatacaattggagcatcaggaccgatccacatagcaacagtaccggcaccaccggttg2580
gtcttgcggcacccttatcgtagatggcaatatcaccgcaaactacaatggcgtctctac2640
catcccatgcgttagattcaatccagttcaaagagttgaacaacgcgttggtaccaccgt2700
aacaggcattaagcgtgtcaataccttcgacgtcagtgttttcaccaaacaattgcatca2760
agacagacttgacagacttggacttgtcaatcagagtttcagtaccgacttctaatctac2820
caattttgttggtgtcgatgttgtaactcttgatcaacttagacaaaacagttagggaca2880
tcgagtagatatcttctctgtcattgacaaaagacatgttggtttggcccagaccaattg2940
tgtatttaccttgagaaacgccatcaaatttctctagctcagattggttgacacattgag3000
ttgggatgtaaatttggatacctttaataccgacattttgaggtctggttttttgttcag3060
cggtcttttgtttttttagttcagtcatttgcaagtttgtattgtgtaattgttgttgct3120
tttgcggcctaagtcttcctttaataccacaccaacaaagtttagttgagagtttcattt3180
agctgtcctccttaattcaaccgttcaatcaccatcgcaattccctgaccgccgccaatg3240
cacagtgttgccagccccagcgttttatcgcgtgcctgcatggcatgtaatagtgtgacc3300
agaatacgagcaccactggcaccgataggatgcccgagcgcgatggccccgccgttgaca3360
ttcactttctcagaatcaaagcccaggtttttcccaacggcaaggaactgtgcagcaaat3420
gcttcattagcctcaatgagatcaatatccgccagttgcagccccgccagttgtaacgct3480
ttttgcgtggcaggtactggccccatacccatcaatgcggggggcacgccaccgctggca3540
taacttttaatgcgagccaggggggtaaggcctgctgccagcgccgcagattcttccata3600
atcaccagagcggcagcaccgtcgttaataccagacgcgttcccagcggtgactgttcct3660
gctttatcgaaggccgggcgcaatgcacctaacgcttcagccgttgaattcgctttcggg3720
aattcgtcttgactgaagacgaaggttttctttcgagtgacaacatttaccgggacgatt3780
tcggctgtaaaagcaccggactcaattgcggctgccgctttacgctgtgaatgtagcgcc3840
agttcatcctgcatttcacgggtaattccgtactctttagccacgttttcggcggtaatc3900
cccatatgataaccatgggtggcgcacatcaggccatcgcgcaggattacgtcataaacc3960
tgtccgtctccaagacgataaccagagcgtgcttttgcatcgagtaagtagggggctaaa4020
ctcatattttccataccccccgccacaatgctctgcgcctgacctgcctgaatggcctgg4080
gcggcaagcgccacacttttaagacccgaaccacatactttattgaccgtgaatccgcac4140
accgtttctgccagcccgctttttaacagtgcctgacgcgccggattttgccccagcccg4200
gcttgtaacacgttacccataatcacttcatcaacgtgttgtgaatcgatttttgcacgt4260
tcaatggcggctttaattactgtcgcccccaggtcgatggcgctggtggaagcgagtgaa4320
ccgttaaaactaccgatagcagtacgtaccgcactgacgatgacacaatttttcatttta4380
tattcctcctagtcgactctagaggatccccgggctgcaggaattcgatatcaagcttat4440
cgataccgtcgacctcgagggggggcccggtacccagcttttgttccctttagtgagggt4500
taattgcgcgctggg4515
<210>4
<211>4667
<212>dna
<213>人工序列
<400>4
cgcgcgtaatacgactcactatagggcgaattggagctcttatttaagctgggtaaatgc60
agataatcgttttctggcttcgcgatttgtcgcctgcatcaccatccacggactgaacgc120
ccacggcgtggcatcaataccgtgtaatacatctgctaaatcacaccattgataatccat180
cacttcatcatcattgatctgtaacgcactagtggtgcgtgcggcaaataccggacacac240
ttcattttccacaatgccactcggatcggtggcgcggtagcgaaagtcaggatagataga300
ttcaggaggcgtaatttccacgccaagctcataacggcaacggcggatcactgcgtcttc360
gttgctttctcccagttgtgggtgcccacaaaccgagttagtccacacgccaggccatgc420
ttttttgctcagtgcgcggcgggtaactaataattgtcctttggcattaaacagccaact480
ggagaacgcgagatgtaagcgggtgtctgccgtgtgtgcggcatacttttccagcgtacc540
cgtgggaactccctgtgcattcaataaaatgacgtgttccgtttgcatatggctgccgcg600
cggcaccaggccgctgctgtgatgatgatgatgatggctgctgcccatatagtaatcctc660
ctcccgggctgcagttattcctttggtagaccagtctttgcgtcaatcaaagattcgttt720
gtttcttgtgggcctgaaccgacttgagttaaaatcactctggcaacatccttttgcaac780
tcaagatccaattcacgtgcagtaaagttagatgattcaaattgatggttgaaagcctca840
agctgctcagtagtaaatttcttgtcccatccaggaacagagccaaacaatttatagata900
aatgcaaagagtttcgactcattttcagctaagtagtacaacacagcatttggacctgca960
tcaaacgtgtatgcaacgattgtttctccgtaaaactgattaatggtgtggcaccaactg1020
atgatacgcttggaagtgtcattcatgtagaatattggagggaaagagtccaaacatgtg1080
gcatggaaagagttggaatccatcattgtttcctttgcaaaggtggcgaaatctttttca1140
acaatggctttacgcatgacttcaaatctctttggtacgacatgttcaattctttcttta1200
aatagttcggaggttgccacggtcaattgcataccctgagtggaactcacatccttttta1260
atatcgctgacaactaggacacaagctttcatctgaggccagtcagagctgtctgcgatt1320
tgtactgccatggaatcatgaccatcttcagcttttcccatttcccaggccacgtatccg1380
ccaaacaacgatctacaagctgaaccagacccctttcttgctattctagatatttctgaa1440
gttgactgtggtaattggtataacttagcaattgcagagaccaatgcagcaaagccagca1500
gcggaggaagctaaaccagctgctgtaggaaagttattttcggagacaatgtggagtttc1560
cattgagataatgtgggcaatgaggcgtccttcgattccatttcctttcttaattggcgt1620
aggtcgcgcagacaattttgagttctttcattgtcgatgctgtgtggttctccatttaac1680
cacaaagtgtcgcgttcaaactcaggtgcagtagccgcagaggtcaacgttctgaggtca1740
tcttgcgataaagtcactgatatggacgaattggtgggcagattcaacttcgtgtccctt1800
ttcccccaatacttaagggttgcgatgttgacgggtgcggtaacggatgctgtgtaaacg1860
gtcatgagtattacctcctatttatcaagataagtttccggatctttttctttcctaaca1920
ccccagtcagcctgagttacatccagccattgaaccttagaaaatcttttgtcattagcg1980
gtttgagccctaagatcaacatcttgcttagtaatcactgcaatggcgtcataaccacca2040
gcaccaggtattaagcaagtaagaactccttttaaggtctggcaatcatccaataagcta2100
gtttgtacgggaggttcgatatcggcaccagattctttagttatttttctaaaggaacgt2160
ctaattgtggcaactgcatctctaacttctgtgatttcaggatacttttgacaggtacag2220
tcattcctctcaagagactcaaatatctgatcgctgtaatcgtcatgagtctcgtgtaag2280
cgatctagtttagatagtccatccataaatctagaatttgcatgatcgagttctgtatat2340
attttcaagctttctggcatatgcgaatcataccaattttttaccttctggaccagtttt2400
actgtttctgaaccattcttaatatcgcccatccataaagttaatcccgaaggtaaatgg2460
ttacttttaatcgtaatattccagtcttcttcatcaaccaaatgcgccagtttactgccg2520
taagtagcacttccaatatctggcaaattagagattaatgcgggtgggaatcttctatat2580
ctgatagatccatatgctgccgccgctacatcaaacccgcttccaattttaccctgagct2640
tgacaatgagcaacttgtgctaaattatgaataacttctctatatttgtctacattattt2700
tccaggtccgatacaaaaaaggaggccaaagctgtagttaaaactgtgactaaacctgcc2760
gaggagcccagccctgttttgggaacttcttcaattctgtgcgaatgaaaactcaatctt2820
ctgttgccacgatgttcggtaacgctatcctcctgagaatggtaggcatcatcagagaaa2880
atatcaataacgaacaagtttctattgcagtagtcgtccatgttaggtttaaagtagcta2940
aatacgttagcgataactttttcaatgaaagggttcttagatccgcctatcgaaacagga3000
atgaagccacttttaggacttatatggtacagccactccccatctttaaattgtttactt3060
ttcacacgcacttcaaacttatcagacccttgcaatgaaccgtaaggatgggctacagca3120
tgcattcttgccgataatccgactacaaatgcttcatattttgtatctaaaactaaatat3180
ccaccagctagtaacgctttccctggggcactgaaggctctcaactctgacatttgatct3240
gcctcctatgaagtccatggtaaattcgtgtttcctggcaataatagatcgtcaatttgt3300
tgctttgtggtagttttattttcaaataattggaatactagggatttgattttaggatct3360
ttattcaaattttttgcgcttaacaaacagcagccagtcccacccaagtctgtttcaaat3420
gtctcgtaactaaaatcatcttgcaatttctttttgaaactgtcaatttgctcttgagta3480
atgtctcttcgtaacaaagtcaaagagcaaccgccgccaccagcaccggtaagttttgtg3540
gagccaattctcaaatcatcgctcagatttttaataagttctaatccaggatgagaaaca3600
ccgattgagacaagcagtccatgatttattcttatcaattccaatagttgttcatacagt3660
tcattattagtttctacggcctcgtcatcggtgcctttacatttacttaactttgtcatg3720
atctctaagccttgtagggcacattcacccatggcatctagaattggcttcataacttca3780
ggaaatttctcggtgaccaacacacgaacgcgagcaacaagatcttttgtagaccttgga3840
attctagtataggttaggatcattggaatggctgggaaatcatctaagaacttaaaattg3900
tttgtatttattgttccattatgtgagtctttttcaaatagcagggcattaccataagtg3960
gccacagcgttatctattcctgaaggggtaccgtgaatacacttttcacctatgaaggcc4020
cattgattcactatatgcttatcgttttctgacagcttttccaagtcattagatcctatt4080
aacccccccaagtaggccatagctaaggccagtgatacagaaatagaggcgcttgagccc4140
aacccagcaccgatgggtaaagtagactttaaagaaaacttaatattcttggcatggggg4200
cataggcaaacaaacatatacaggaaacaaaacgctgcatggtagtggaaggattcggat4260
agttgagctaacaacggatccaaaagactaacgagttcctgagacaagccatcggtggct4320
tgttgagccttggccaatttttgggagtttacttgatcctcggtgatggcattgaaatca4380
ttgatggaccacttatgattaaagctaatgtccgggaagtccaattcaatagtatctggt4440
gcagatgactcgcttattagcaggtaggttctcaacgcagacacactagcagcgacggca4500
ggcttgttgtacacagcagagtgttcaccaaaaataataacctttcccggtgcagaagtt4560
aagaacggtaatgacatggttaattcctcctactgcaggaattcgatatcaagcttatcg4620
ataccgtcgacctcgagggggggcccggtacccagcttttgttcccc4667
<210>5
<211>2971
<212>dna
<213>人工序列
<400>5
caaaaaacccctcaagacccgtttagaggccccaaggggttatgctagttattgctcagc60
ggtggcagcagccaactcagcttcctttcgggctttgttagcagccggatctcagtggtg120
gtggtggtggtgctcgagtgcggccgcaagcttgtcgacggagctcgaattcttatttaa180
gctgggtaaatgcagataatcgttttctggcttcgcgatttgtcgcctgcatcaccatcc240
acggactgaacgcccacggcgtggcatcaataccgtgtaatacatctgctaaatcacacc300
attgataatccatcacttcatcatcattgatctgtaacgcactagtggtgcgtgcggcaa360
ataccggacacacttcattttccacaatgccactcggatcggtggcgcggtagcgaaagt420
caggatagatagattcaggaggcgtaatttccacgccaagctcataacggcaacggcgga480
tcactgcgtcttcgttgctttctcccagttgtgggtgcccacaaaccgagttagtccaca540
cgccaggccatgcttttttgctcagtgcgcggcgggtaactaataattgtcctttggcat600
taaacagccaactggagaacgcgagatgtaagcgggtgtctgccgtgtgtgcggcatact660
tttccagcgtacccgtgggaactccctgtgcattcaataaaatgacgtgttccgtttgca720
tatggctgccgcgcggcaccaggccgctgctgtgatgatgatgatgatggctgctgccca780
tggtatatctccttcttaaagttaaacaaaattatttctagttatttattacgctggatg840
atgtagtccgctagcgcttccagtgccgaggtatcgagtgactgttcagccagttgtttc900
agcgactgacgggcatcgtcgatcagatcccgggctttcttccgggcttgctcaagaccc960
agaagtgcagggtaggtacttttaccaagttgctggtcggcaccctggcgttttcccaac1020
gttgcagtatctcccaccacatccaggatgtcatcctgaacctggaaggcaaggccgatg1080
ctctctgcatacttgtcgagtaccggcagagcacgacgtcctttatctccggcgcttaat1140
gcaccaaggcgaacggcggcgcgaatcaatgcgccggttttatgacgatgaatacgctca1200
agcgcgtccagaggtacgtgtttgccttccgcgtctaaatctaatgcctgaccaccgcac1260
attccggcaataccactggcgctcgccagttcagaaatcatcgaaattctgtcgcggtcc1320
gacacttccggcatatcggcatcgcttaaaatcgagaacgccagcgtttgtaaagcgtcg1380
ccagcgagaatcgcgtttgcttcgccaaacttcacatggcaggttggcaaaccgcgacgc1440
agatcgtcatcatccattgccggtaaatcatcatgaattaatgagtaagcgtggatacac1500
tcaacggcggcagcgggtgcgtccagcgtgtttgtgctaacgccgaacatatgaccggtg1560
gcataaaccaggaaaggtcgcaggcgcttaccacctaataatgcgccatactgcatggtt1620
tcgaccacgggagtgttctgaaagggcagtggggcgataaaacggctcagcgcctggttg1680
gcctgcttaacgcaggcttcgagttgctgcggaaagtccatggatccgcgacccatttgc1740
tgtccaccagtcatgctagccatatggctgccgcgcggcaccaggccgctgctgtgatga1800
tgatgatgatggctgctgcccatggtatatctccttcttaaagttaaacaaaattatttc1860
tagtcaaatcttcttgatgacttcatgcacatctggcgcatcaccaacgcccacctctat1920
aagcctgtaacgacctctctggacgtgcatttggaggtatccggatgcatgaagtcgcca1980
cgctttctcatactcgccctttcctgcgagaacactctcaatgcggcgggcacagtctat2040
ggtgtcttgagcagttttatgaagcgcagcatccgaatcaacaccctcatacgcagccgt2100
atggttgatgtagttgtgtgtctcgccagccagggactctttgtaaaacgataaaacatc2160
attgagataggcaatgaatcgtgtcatatcttcaatagcttcgataggaatgtccaggtc2220
ggggaattgtcgtttggggaaagtgaaccaggaataggcttcaccgacgccatcccgttc2280
ccggatgtaccaggcgaagtagttgcctccctttgatggatgatcacccttttctttaat2340
acccttgcgagccacaagggatgtagaagtgagcagattcagagaggagcaaagaatcag2400
attcgcaacaagggggtggtacagcttataggtgagtttgagttggtcggcaaaagccct2460
gaggaggaccgtaggctgttcctctccgagaataaagcgttgttcgaacaattgaacatc2520
atcaatgatgcctagtgcctcggcgtcatcgcaaatagttgccagccatgtgtagatggc2580
tacataaaccttgacttcaatgtcatgatatgggaggcagttatcggcgtatgtgtatcc2640
aaccatgagactttgataggaatgggagttgagatcatgaggtacaccagtactcttcgc2700
aaatttgagcacctcctccataagcttctcgctttcgtgacgtctatattccggctgtag2760
atcaagatccgtgagaaacctcgaatacagtggttgcaagcgagctgcaagggcgggatc2820
acctccctccgaggatggaagagagggtttgtcgaagttggacagggtcggtgtagcaag2880
catatgtatatctccttcttaaagttaaacaaaattatttctagaggggaattgttatcc2940
gctcacaattcccctatagtgagtcgtatta2971
<210>6
<211>52
<212>dna
<213>人工序列
<400>6
catcttattaatcagataaaatatttctcgagctccggcaaaaagtggcccc52
<210>7
<211>50
<212>dna
<213>人工序列
<400>7
catcttccaggaaatctccgccccgctcgagaaacccacggcggcaatgc50
<210>8
<211>50
<212>dna
<213>人工序列
<400>8
gcattgccgccgtgggtttctcgagcggggcggagatttcctggaagatg50
<210>9
<211>52
<212>dna
<213>人工序列
<400>9
ggggccactttttgccggagctcgagaaatattttatctgattaataagatg52
<210>10
<211>55
<212>dna
<213>人工序列
<400>10
tttgaaagatgggtccgtcacctgcattaaatcctaaggatccactagttctaga55
<210>11
<211>59
<212>dna
<213>人工序列
<400>11
ttttatattcctcctagtcgactctagaggatccccgggctgcaggaattcgatatcaa59
<210>12
<211>59
<212>dna
<213>人工序列
<400>12
cccggggatcctctagagtcgactaggaggaatataaaatgaaaaattgtgtcatcgtc59
<210>13
<211>49
<212>dna
<213>人工序列
<400>13
gttgagagtttcatttagctgtcctccttaattcaaccgttcaatcacc49
<210>14
<211>46
<212>dna
<213>人工序列
<400>14
acggttgaattaaggaggacagctaaatgaaactctcaactaaact46
<210>15
<211>49
<212>dna
<213>人工序列
<400>15
tggctgctgcccatagtgtaatcctccttattttttaacatcgtaagat49
<210>16
<211>47
<212>dna
<213>人工序列
<400>16
atgttaaaaaataaggaggattacactatgggcagcagccatcatca47
<210>17
<211>23
<212>dna
<213>人工序列
<400>17
ttaggatttaatgcaggtgacgg23
<210>18
<211>59
<212>dna
<213>人工序列
<400>18
cagaaaacgattatctgcatttacccagcttaaataagagctccaattcgccctatagt59
<210>19
<211>55
<212>dna
<213>人工序列
<400>19
ttaagaacggtaatgacatggttaattcctcctactgcaggaattcgatatcaag55
<210>20
<211>42
<212>dna
<213>人工序列
<400>20
ctgcagtaggaggaattaaccatgtcattaccgttcttaact42
<210>21
<211>44
<212>dna
<213>人工序列
<400>21
ctcaactctgacatttgatctgcctcctatgaagtccatggtaa44
<210>22
<211>51
<212>dna
<213>人工序列
<400>22
ttaccatggacttcataggaggcagatcaaatgtcagagttgagagccttc51
<210>23
<211>53
<212>dna
<213>人工序列
<400>23
gatgctgtgtaaacggtcatgagtattacctcctatttatcaagataagtttc53
<210>24
<211>50
<212>dna
<213>人工序列
<400>24
atcttgataaataggaggtaatactcatgaccgtttacacagcatccgtt50
<210>25
<211>55
<212>dna
<213>人工序列
<400>25
tgcccatatagtaatcctcctcccgggctgcagttattcctttggtagaccagtc55
<210>26
<211>51
<212>dna
<213>人工序列
<400>26
ggaataactgcagcccgggaggaggattactatatgggcagcagccatcat51
<210>27
<211>24
<212>dna
<213>人工序列
<400>27
ttatttaagctgggtaaatgcaga24
<210>28
<211>31
<212>dna
<213>人工序列
<400>28
atatggatccatggactttccgcagcaactc31
<210>29
<211>38
<212>dna
<213>人工序列
<400>29
atatgaattcactagtttatttattacgctggatgatg38
<210>30
<211>34
<212>dna
<213>人工序列
<400>30
atcgcatatgcaaacggaacacgtcattttattg34
<210>31
<211>36
<212>dna
<213>人工序列
<400>31
atatctcgagactagttatttaagctgggtaaatgc36
<210>32
<211>28
<212>dna
<213>人工序列
<400>32
atatcatatgcttgctacaccgaccctg28
<210>33
<211>38
<212>dna
<213>人工序列
<400>33
ctgagaattcggtgacctcaaatcttcttgatgacttc38
<210>34
<211>36
<212>dna
<213>人工序列
<400>34
gacgctcgagactagtcaaatcttcttgatgacttc36