本發(fā)明屬于工業(yè)生物技術領域,具體涉及一種定向改造的氨基葡萄糖合酶突變體及其應用。
背景技術:
氨基葡萄糖(glucosamine,glcn),簡稱氨糖,存在多種有機體中,能夠作為蛋白聚糖與糖蛋白的主要成分,在細胞內(nèi)通過氨基化生成6-磷酸葡萄糖。n-乙?;被咸烟?glcnac)在醫(yī)藥、食品以及日化等領域有著廣泛的應用。傳統(tǒng)生產(chǎn)工藝主要采用蝦蟹來源的甲殼素為原料,較多采用酸水解進行制備,反應需要濃酸和高溫條件,對環(huán)境污染嚴重,設備要求高,且生產(chǎn)成本偏高。隨著代謝工程與合成生物學的迅速發(fā)展,生物發(fā)酵法運用在工業(yè)上的生產(chǎn)也日趨成熟,以葡萄糖為原料直接進行氨糖的轉化,具有原料成本低、提取簡單、產(chǎn)品純度高、過程污染少等優(yōu)勢。
氨基葡萄糖合酶(簡稱氨糖合酶,gls)是glcn生物合成的關鍵酶,能夠催化6-磷酸果糖生成glcn-6-p,由谷氨酰胺作為氨基供體。該步是glcn合成途徑中第一個限速反應,gls嚴重受該合成途徑代謝產(chǎn)物glcn-6-p的反饋抑制,因而glcn-6-p在正常的代謝合成中無法大量積累。為降低這種產(chǎn)物抑制作用,在大腸桿菌e.coli體系中通常采用共表達氨糖乙?;富?,將代謝體系中的glcn-6-p轉化為刺激性較小的glcnac-6-p,產(chǎn)物glcn-6-p和glcnac-6-p均可以從胞內(nèi)轉移到胞外,并經(jīng)去磷酸化作用形成glcn和glcnac,而glcnac能在酸性條件下去乙?;俅无D化為glcn。
gls的生物合成能力偏低、對產(chǎn)物耐受能力較差是影響產(chǎn)量水平提升的主要原因。盡管目前工業(yè)生產(chǎn)上使用的菌株已遠遠突破上述水平,其中大都經(jīng)過系統(tǒng)的代謝工程技術改造和發(fā)酵優(yōu)化控制,但從有關文獻分析,其改造的重點之一是氨糖合酶。
技術實現(xiàn)要素:
本發(fā)明旨在提供一種通過基因工程的方法克隆表達氨糖合酶以及通過易錯pcr對氨基葡萄糖合酶進行定向改造,從而構建高產(chǎn)氨糖的工程菌的方法。該方法是一種簡便、有效地獲得dna序列變異的技術,主要是針對特定的基因,這在遺傳和基因改良研究中具有巨大的應用前景。該方法構建的工程菌在工業(yè)生產(chǎn)中周期短、能耗少、污染小,完全適合于工業(yè)化生產(chǎn)的要求。
本發(fā)明為探索gls新的改造策略,首先篩選出較優(yōu)的表達質粒和表達宿主,進而利用易錯pcr對gls進行非理性改造,通過培養(yǎng)基中外加氨糖作為篩選壓力,篩選出耐受性提升的突變株。此外,本發(fā)明也通過共表達氨基葡萄糖乙?;竒nal的方式,削弱glcn積累對宿主細胞的抑制效應,考察突變株的合成能力。
一種定向改造的氨基葡萄糖合酶突變體,其氨基酸序列如序列表seqidno.1所示。
上述定向改造的氨基葡萄糖合酶突變體的核苷酸序列如序列表seqidno.2所示。
包含所述氨基葡萄糖合酶突變體基因的工程菌。
上述定向改造的氨基葡萄糖合酶突變體在氨基葡萄糖生物合成中的應用,將突變體通過共表達氨基葡萄糖乙?;?,將發(fā)酵體系中的氨基葡萄糖轉化為乙?;被咸烟?,從而減少產(chǎn)物的抑制效應,提升氨基葡萄糖產(chǎn)量。
一種通過基因工程手段定向改造氨基葡萄糖合酶的方法,包括克隆表達氨基葡萄糖合酶基因,并采用連續(xù)易錯pcr,建立突變體文庫進行高通量篩選,獲得發(fā)酵性能提升的氨基葡萄糖合酶突變體m15-9。
所述定向改造的氨基葡萄糖合酶編碼基因相對于天然酶60位的丙氨酸變?yōu)榻z氨酸,128位的纈氨酸變?yōu)楸彼幔?52位的天冬氨酸變成了丙氨酸,354位的精氨酸變成半胱氨酸,422位的異亮氨酸變成蛋氨酸,432位的亮氨酸變成了纈氨酸,471位的天冬氨酸變成了谷氨酸,556位的亮氨酸變成了脯氨酸,567位的的纈氨酸變?yōu)楣劝彼?。上述突變是多輪累積的結果,結構分析結果顯示突變酶相對于野生酶疏水性明顯增加,導致酶活性中心的殘基向里或側面聚集,同時突變酶的氫鍵加強,另外帶負電荷的氨基酸明顯減少,變成了中性氨基酸,減弱了酶分子的極性,更利于酶與底物結合的區(qū)域;以上變化改變了酶的空間構象,增加了酶與底物結合的區(qū)域,提高了酶與底物的結合效率。
與現(xiàn)有技術相比,本發(fā)明具有如下有益效果:本發(fā)明通過基因工程的方法克隆表達氨糖合酶,采用基因工程手段克隆表達氨糖合酶,通過不同表達質粒和宿主的優(yōu)化篩選出最優(yōu)表達體系,以大腸桿菌e.coli為例,成功構建獲得e.colirosetta-gami(de3)-pet-24a-gls工程菌,檢測其氨糖產(chǎn)量為1.63g/l。為提升重組菌對氨糖的耐受能力,采用易錯pcr技術對氨糖合酶進行定向進化改造,通過高通量篩選方法從2700余株突變株中篩選獲得一株高產(chǎn)glcn的菌株,glcn產(chǎn)量達到3.57g/l,相比出發(fā)菌株提高1.19倍。由于glcn的積累對于氨糖合酶重組菌生長及代謝活動具有一定的抑制作用,本發(fā)明進一步通過共表達氨糖乙?;竒nal將glcn轉化為乙酰化氨糖glcnac從而減少產(chǎn)物的抑制效應,結果表明gnal與gls串聯(lián)表達能顯著提升菌株的發(fā)酵能力,glcn及glcnac累積產(chǎn)量達到7.83g/l,相比單獨表達gls時提升2.19倍。經(jīng)過初步搖瓶發(fā)酵優(yōu)化及5l罐發(fā)酵驗證,結果顯示氨糖發(fā)酵水平基本穩(wěn)定,經(jīng)過22h發(fā)酵最高產(chǎn)量可達到9.85g/l。
附圖說明
圖1為gls基因擴增產(chǎn)物電泳圖;
圖中的m為marker,lane1和lane2為pcr擴增獲得的gls基因,在1800bp左右能看到目的條帶。
圖2為表達質粒和表達宿主的優(yōu)化圖;
圖中,●:pet-28a,■:pet-24a,▲:prsfduet-1,◆:pet-22b,圖a為e.colibl21(de3)的表達宿主;圖b為e.colibl21(de3)plss;圖c為e.colirosetta-gami(de3)。
圖3為突變株的glcn產(chǎn)量;
圖中,●:原始菌株;■:第一輪最優(yōu)突變株;▲:第二輪最優(yōu)突變株;◆:第三輪最優(yōu)突變株。
圖4為野生酶和m15-9突變酶疏水性的對比;
圖中,(a)為野生酶,(b)為m15-9突變酶。
圖5為兩種酶氫鍵的對比;
圖中,(a)為野生酶,(b)為m15-9突變酶。
圖6為兩種酶電荷的對比;
圖中(a)為野生酶,(b)為m15-9突變酶。
圖7為共表達重組菌的glcn產(chǎn)量;
圖中1為gls未突變重組菌;2為gls突變后的重組菌;3為突變后的gls與gnal共表達的重組菌。
圖8為7l發(fā)酵液中的glcn和glcnac產(chǎn)量
圖中●:glcnac,▲:glcn,■:glcnac+glcnac,◆:od600,◇:ph。
具體實施方式
下面對本發(fā)明的具體實施方式進行詳細描述,但應當理解本發(fā)明的保護范圍并不受具體實施方式的限制。
實施例1
根據(jù)gls基因設計引物5’端的引物為gls(1),3‘端的引物為gls(2)。根據(jù)gnal基因設計引物5’端的引物為gnal(1),3’端的引物為gnal(2),本發(fā)明中所涉及到的引物序列如表1所示。
表1本實驗所用的引物
以引物gls(1)和gls(2)對gls基因進行克隆,反應采用extaq聚合酶進行擴增,體系為體系為50μl,pcr反應條件為:94℃預變性10min;94℃變性30s,62℃退火45s,72℃延伸60s,35個循環(huán);72℃終延伸10min。pcr反應結束后,將pcr產(chǎn)物進行1.0%的瓊脂糖凝膠電泳(圖1),對目的片段進行膠回收。將gls和pmd19-t連接構建克隆質粒,將克隆質粒和表達質粒分別用bamhi和ecori進行酶切,然后通過t4連接酶反應構建重組表達質粒。
實施例2
選擇四種不同的表達質粒,分別是pet-22b,pet-24a,pet-28a及prsfduet-1,表達質粒均采用ecori和bamhi進行酶切。通過t4連接酶將gls連接到表達質粒上,分別構建重組質粒pet-22b-gls,pet-24a-gls,pet-28a-gls和prsfduet-1-gls。以e.colirosetta-gami(de3),e.colibl21(de3),e.colibl21(de3)plss作為表達宿主,建立了不同的gls重組表達系統(tǒng),經(jīng)篩選獲得的陽性克隆加入iptg進行誘導表達,結果表明以pet-24a作為表達質粒時具有最高氨糖合成能力,在e.colibl21(de3),e.colibl21(de3)plss和e.colirosetta-gami(de3)分別達到1.31g/l,1.37g/l及1.63g/l(圖2)。
實施例3
為提升氨糖合酶的氨糖耐受能力和氨糖產(chǎn)生能力,采用易錯pcr方法對氨糖合酶進行定向進化改造。經(jīng)過優(yōu)化的易錯pcr反應體系如表2所示:
表2易錯pcr的反應體系
pcr反應條件為:94℃預變性10min;94℃變性30s,56℃退火45s,72℃延伸60s,30個循環(huán);72℃終延伸10min。pcr反應結束后,將pcr產(chǎn)物進行1.0%的瓊脂糖凝膠電泳,對目的片段割膠回收,用elutionbuffer復溶。將pcr產(chǎn)物進行1.0%的瓊脂糖凝膠電泳,對目的片段進行割膠,通過膠回收試劑盒回收。將gls和pet-24a用bamhi和ecori進行雙酶切,然后通過t4連接酶反應構建pet-24a-gls重組質粒。
實施例4
將突變的重組質粒轉化到e.colirosetta-gami(de3),轉接到5ml含有25g/l氨糖的lb培養(yǎng)基中進行馴化培養(yǎng),在37℃,220rpm的條件下培養(yǎng)10h。將培養(yǎng)后的菌液涂布于含有25g/l氨糖的lb固體平板上,放置在37℃培養(yǎng)箱中培養(yǎng)12h,實時監(jiān)測菌落的生長情況。挑取轉化子接入含有3%葡萄糖的tb液體培養(yǎng)基,在96孔深孔培養(yǎng)板中進行培養(yǎng),同時對每個挑取的菌株在孔板上做上標。每孔對應一個陽性轉化子,同時預留2孔作為對照,一孔接入出發(fā)菌株,一孔只添加培養(yǎng)基不接入任何菌種,培養(yǎng)條件為37℃、220rpm。培養(yǎng)至od600為0.6-0.8時加入終濃度為0.5mm的iptg進行產(chǎn)酶誘導,培養(yǎng)條件為25℃、220rpm。發(fā)酵24h后測定氨糖含量。
發(fā)酵結束后取出深孔板進行離心,然后向深孔板里面加入100μl乙酰丙酮試劑,然后將孔板固定在90℃的水浴鍋中水浴1h,取出待其冷卻后加入1ml的96%的乙醇,然后加入100μl的dmab試劑,然后室溫顯色1h后用排槍從深孔板中對應吸出200μl樣品到96孔板中,然后將96孔板放在酶標儀上測量530nm處的分光光度值,篩選出高于出發(fā)菌株的編號并再次從平板上挑取出進行培養(yǎng)測量glcn產(chǎn)量。
實驗以pet-24a-gls作為模板,采用易錯pcr技術對gls進行體外突變時,應用高濃度glcn進行馴化以篩選突變株,在96孔板上進行高通量篩選。第一輪易錯pcr從1152株克隆中篩選出產(chǎn)量性狀得到提升的突變株22株,經(jīng)復篩驗證,其中的編號m4-27突變株glcn生成量為2.84g/l,產(chǎn)量提升了74.2%。提取該突變株的質粒作為模板,進行下一輪突變和篩選,從864株克隆中篩選出突變株15株,產(chǎn)量最高的一株為3.39g/l(編號m6-9);第三輪實驗從691株克隆中篩選出突變株20株,最高產(chǎn)量達到3.57g/l(編號m15-9),其產(chǎn)量累計提升119%(圖3)。
實施例5
將原始菌株m0-0和最優(yōu)突變株m15-9接種到lb的種子培養(yǎng)基中,并轉接到tb(3%葡萄糖)發(fā)酵培養(yǎng)基中在37℃、220r/min的條件下發(fā)酵至菌液的od600至0.6-0.8時,向發(fā)酵液中添加終濃度為0.5mmol/l的iptg并轉移到25℃進行誘導,發(fā)酵18h后測定產(chǎn)量。野生菌及突變菌各項指標對比如表3所示。
表3菌株搖瓶發(fā)酵指標對比
本實施例通過調控反應體系中的mncl2和dgtp的含量控制堿基突變率為2-3‰,使每一輪的突變株中均可以獲得陽性突變。每一輪突變的堿基和氨基酸位點如表4所示,多輪優(yōu)勢積累最終獲得一株穩(wěn)定高產(chǎn)的菌株m15-9,該突變酶成熟蛋白的核苷酸序列如seqidno.2所示,氨基酸序列如seqidno.1所示。該氨糖合酶野生酶氨基酸序列如seqidno.3所示;氨基酸序列如seqidno.4所示。
表4突變堿基和氨基酸
氨糖合酶的模型構建:通過與蛋白質數(shù)據(jù)庫(pdb)內(nèi)同源性高的蛋白序列分析,利用在線軟件swiss-model進行同源建模,獲得氨糖合酶的立體結構模型。通過序列和結構分析得知氨糖合酶的三維結構活性中心
①疏水性的對比
在酶的氨基酸殘基變化后,導致如圖4b左下角區(qū)域中的突變酶相對于野生酶有明顯疏水性的增加,導致酶活性中心的殘基向里或側面聚集,改變了酶的空間構象,增加了酶與底物結合的區(qū)域,提高了酶的結合效率。
②氫鍵的對比
如圖5的(a)中的野生酶中含有5個氫鍵,圖5的(b)中含有7個氫鍵,活性中心的氫鍵加強。氫鍵及疏水相互作用在維系酶分子三維構象的穩(wěn)定性中起著至關重要的作用。活性中心周圍由氫鍵連接起來增強了非極性基團之間的疏水相互作用,也使得酶分子三維構象更加穩(wěn)定。殘基的改變導致氫鍵的增減和相互作用影響了酶的空間結構,從而影響了酶分子的三維構象,提升了酶和底物的催化效率。
③電荷的對比
在酶的氨基酸殘基變化后,導致如圖6的(b)左下角區(qū)域中的突變酶相對于野生酶帶負電荷的氨基酸明顯減少,變成了中性氨基酸,減弱了酶分子的極性,更利于酶與底物結合的區(qū)域,提高了酶與底物的結合效率。
實施例6
由于乙酰氨基葡萄糖對細胞刺激性小,且在下游提取過程中,用弱酸進行脫乙?;纯赊D化為glcn,所以發(fā)酵產(chǎn)物通常是乙酰氨基葡萄糖。以引物gnal(1)和gnal(2)對gnal基因進行擴增,將pcr產(chǎn)物進行1.0%的瓊脂糖凝膠電泳,對目的片段割膠回收,然后將gnal和pet-24a-gls用hindiii和xhoi進行雙酶切,然后通過t4連接酶反應構建pet-24a-gls-gnal重組質粒。并將重組質粒導入到e.colirosetta-gami(de3)中,將驗證成功后的陽性克隆子接入發(fā)酵培養(yǎng)基,在37℃、250r/min的條件下發(fā)酵至菌液的od600至0.6~0.8時,向發(fā)酵液中添加終濃度為0.5mmol/l的iptg并轉移到25℃進行誘導,發(fā)酵18h后測定glcn和glcnac的含量,結果顯示,glcn及glcnac累積產(chǎn)量達到8.57g/l,相比單獨表達gls時產(chǎn)量提升2.4倍(圖7)。
在7l數(shù)控式發(fā)酵罐中進行分批補糖發(fā)酵實驗,初始裝液量控制在4l。接種量5%,初始培養(yǎng)溫度37℃,誘導后在25℃下進行培養(yǎng)。由于發(fā)酵過程中產(chǎn)酸,實驗通過補加氨水調節(jié)ph。圖8為7l發(fā)酵罐上的分批發(fā)酵過程曲線。16h時生物量od600達到最高,而glcn、glcnac濃度要到20h后才達到最高,分別為3.93g/l、5.86g/l,二者在22h累計達到最高,為9.79g/l。
以上公開的僅為本發(fā)明的具體實施例,但是,本發(fā)明并非局限于此,任何本領域的技術人員能思之的變化都應落入本發(fā)明的保護范圍。
sequencelisting
<110>揚州日興生物科技股份有限公司;江南大學
<120>一種定向改造的氨基葡萄糖合酶突變體及其應用
<130>1111
<160>4
<170>patentinversion3.5
<210>1
<211>600
<212>prt
<213>e.coli
<400>1
metcysglyilevalglytyrileglyglnleuaspalalysgluile
151015
leuleulysglyleuglulysleuglutyrargglytyraspserala
202530
glyilealavalalaasngluglnglyilehisvalphelysglulys
354045
glyargilealaaspleuarggluvalvalaspserasnvalgluala
505560
lysalaglyileglyhisthrargtrpalathrhisglygluproser
65707580
tyrleuasnalahisprohisglnseralaleuglyargphethrleu
859095
valhisasnglyvalilegluasntyrvalglnleulysglnglutyr
100105110
leuglnaspvalgluleulysseraspthraspthrgluvalvalala
115120125
glnvalilegluglnphevalasnglyglyleugluthrglugluala
130135140
phearglysthrleuthrleuleulysglysertyralailealaleu
145150155160
pheaspasnaspasnarggluthrilephevalalalysasnlysser
165170175
proleuleuvalglyleuglyaspthrpheasnvalvalalaserasp
180185190
alametalametleuglnvalthrasnglutyrvalgluleumetasp
195200205
lysglumetvalilevalthraspaspglnvalvalilelysasnleu
210215220
aspglyaspvalilethrargalasertyrilealagluleuaspala
225230235240
seraspileglulysglythrtyrprohistyrmetleulysgluthr
245250255
aspgluglnprovalvalmetarglysileileglnthrtyrglnasp
260265270
gluasnglylysleuservalproglyaspilealaalaalavalala
275280285
glualaaspargiletyrileileglycysglythrsertyrhisala
290295300
glyleuvalglylysglntyrileglumettrpalaasnvalproval
305310315320
gluvalhisvalalasergluphesertyrasnmetproleuleuser
325330335
lyslysproleupheilepheleuserglnserglygluthralaala
340345350
sercysalavalleuvalglnvallysalaleuglyhislysalaleu
355360365
thrilethrasnvalproglyserthrleuserargglualaasptyr
370375380
thrleuleuleuhisalaglyprogluilealavalalaserthrlys
385390395400
alatyrthralaglnilealavalleualavalleualaservalala
405410415
alaasplysasnglymetasnileglypheaspleuvallysgluval
420425430
glyilealaalaasnalametglualaleucysaspglnlysaspglu
435440445
metglumetilealaargglutyrleuthrvalserargasnalaphe
450455460
pheileglyargglyleuglutyrphevalcysvalgluglyalaleu
465470475480
lysleulysgluilesertyrileglnalagluglyphealaglygly
485490495
gluleulyshisglythrilealaleuilegluglnglythrproval
500505510
phealaleualathrglngluhisvalasnleuserileargglyasn
515520525
vallysgluvalalaalaargglyalaasnthrcysileileserleu
530535540
lysglyleuaspaspalaaspaspargphevalproprogluvalasn
545550555560
proalaleualaproleugluservalvalproleuglnleuileala
565570575
tyrtyralaalaleuhisargglycysaspvalasplysproargasn
580585590
leualalysservalthrvalglu
595600
<210>2
<211>1803
<212>dna
<213>e.coli
<400>2
atgtgcggcattgtgggttatatcggccagctggatgcaaaagaaattctgctgaaaggt60
ctggaaaaactggaatatcgcggttacgatagcgcgggcattgctgtcgcgaacgaacaa120
ggtatccatgtgttcaaagaaaaaggccgtattgccgatctgcgcgaagtggttgactca180
aacgtggaagccaaagcaggcatcggtcatacccgttgggcaacgcacggcgaaccgagt240
tacctgaatgctcatccgcaccagtccgcgctgggtcgttttaccctggtgcacaacggc300
gttattgaaaattatgtgcagctgaaacaagaatacctgcaagatgttgaactgaaaagc360
gataccgacacggaagtcgtggctcaggttatcgaacaatttgtcaatggcggtctggaa420
accgaagaagcgttccgcaaaaccctgacgctgctgaaaggttcttatgctattgcgctg480
tttgataacgacaatcgtgaaacgatcttcgtggccaaaaacaaatcaccgctgctggtt540
ggcctgggtgataccttcaatgtcgtggcatcggacgcgatggcgatgctgcaggtgacg600
aacgaatatgttgaactgatggataaagaaatggttattgtcaccgatgaccaagttgtc660
atcaaaaatctggatggtgacgtgattacgcgtgcaagctacatcgctgaactggatgcg720
tctgacattgaaaaaggcacctatccgcattacatgctgaaagaaacggatgaacagccg780
gtggttatgcgcaaaattatccagacctatcaagatgaaaacggtaaactgagcgttccg840
ggcgatattgcggcggcagtcgctgaagcggaccgtatctatattatcggctgtggcacg900
tcttaccatgcgggtctggtgggcaaacagtatattgaaatgtgggccaacgtgccggtt960
gaagtccacgtggcaagtgaattttcctacaatatgccgctgctgagtaaaaaaccgctg1020
tttattttcctgagccagtctggcgaaaccgccgcttcctgcgcagttctggtccaagtg1080
aaagccctgggtcataaagcactgaccatcacgaatgtgccgggctcaaccctgtcgcgt1140
gaagctgattatacgctgctgctgcacgcgggtccggaaattgccgttgcaagcaccaaa1200
gcgtatacggcacagatcgcagtcctggcagtgctggcttctgtggctgcggataaaaac1260
ggtatgaatatcggctttgacctggttaaagaagtgggcattgccgcaaacgcgatggaa1320
gccctgtgcgatcagaaagacgaaatggaaatgattgctcgtgaatatctgaccgtgagt1380
cgcaatgcctttttcatcggccgtggtctggagtattttgtttgtgtcgaaggtgccctg1440
aaactgaaagaaatttcctacatccaggctgaaggcttcgcgggcggtgaactgaaacat1500
ggtaccattgcgctgatcgaacagggcaccccggtctttgctctggcgacgcaagaacac1560
gttaacctgtcaattcgcggtaatgttaaagaagtcgctgcgcgtggcgcaaacacctgc1620
attatctcgctgaaaggtctggatgacgcggatgaccgctttgtcccgccggaagtgaat1680
ccggcactggcaccgctggagagtgtcgtgccgctgcagctgatcgcgtattacgccgca1740
ctgcatcgcggctgtgatgttgacaaaccgcgtaacctggccaaaagcgtgaccgttgaa1800
taa1803
<210>3
<211>600
<212>prt
<213>e.coli
<400>3
metcysglyilevalglytyrileglyglnleuaspalalysgluile
151015
leuleulysglyleuglulysleuglutyrargglytyraspserala
202530
glyilealavalalaasngluglnglyilehisvalphelysglulys
354045
glyargilealaaspleuarggluvalvalaspalaasnvalgluala
505560
lysalaglyileglyhisthrargtrpalathrhisglygluproser
65707580
tyrleuasnalahisprohisglnseralaleuglyargphethrleu
859095
valhisasnglyvalilegluasntyrvalglnleulysglnglutyr
100105110
leuglnaspvalgluleulysseraspthraspthrgluvalvalval
115120125
glnvalilegluglnphevalasnglyglyleugluthrglugluala
130135140
phearglysthrleuthrleuleulysglysertyralailealaleu
145150155160
pheaspasnaspasnarggluthrilephevalalalysasnlysser
165170175
proleuleuvalglyleuglyaspthrpheasnvalvalalaserasp
180185190
alametalametleuglnvalthrasnglutyrvalgluleumetasp
195200205
lysglumetvalilevalthraspaspglnvalvalilelysasnleu
210215220
aspglyaspvalilethrargalasertyrilealagluleuaspala
225230235240
seraspileglulysglythrtyrprohistyrmetleulysgluthr
245250255
aspgluglnprovalvalmetarglysileileglnthrtyrglnasp
260265270
gluasnglylysleuservalproglyaspilealaalaalavalala
275280285
glualaaspargiletyrileileglycysglythrsertyrhisala
290295300
glyleuvalglylysglntyrileglumettrpalaasnvalproval
305310315320
gluvalhisvalalasergluphesertyrasnmetproleuleuser
325330335
lyslysproleupheilepheleuserglnserglygluthralaasp
340345350
serargalavalleuvalglnvallysalaleuglyhislysalaleu
355360365
thrilethrasnvalproglyserthrleuserargglualaasptyr
370375380
thrleuleuleuhisalaglyprogluilealavalalaserthrlys
385390395400
alatyrthralaglnilealavalleualavalleualaservalala
405410415
alaasplysasnglyileasnileglypheaspleuvallysgluleu
420425430
glyilealaalaasnalametglualaleucysaspglnlysaspglu
435440445
metglumetilealaargglutyrleuthrvalserargasnalaphe
450455460
pheileglyargglyleuasptyrphevalcysvalgluglyalaleu
465470475480
lysleulysgluilesertyrileglnalagluglyphealaglygly
485490495
gluleulyshisglythrilealaleuilegluglnglythrproval
500505510
phealaleualathrglngluhisvalasnleuserileargglyasn
515520525
vallysgluvalalaalaargglyalaasnthrcysileileserleu
530535540
lysglyleuaspaspalaaspaspargphevalleuprogluvalasn
545550555560
proalaleualaproleuvalservalvalproleuglnleuileala
565570575
tyrtyralaalaleuhisargglycysaspvalasplysproargasn
580585590
leualalysservalthrvalglu
595600
<210>4
<211>1803
<212>dna
<213>e.coli
<400>4
atgtgcggcattgtgggttatatcggccagctggatgcaaaagaaattctgctgaaaggt60
ctggaaaaactggaatatcgcggttacgatagcgcgggcattgctgtcgcgaacgaacaa120
ggtatccatgtgttcaaagaaaaaggccgtattgccgatctgcgcgaagtggttgacgca180
aacgtggaagccaaagcaggcatcggtcatacccgttgggcaacgcacggcgaaccgagt240
tacctgaatgctcatccgcaccagtccgcgctgggtcgttttaccctggtgcacaacggc300
gttattgaaaattatgtgcagctgaaacaagaatacctgcaagatgttgaactgaaaagc360
gataccgacacggaagtcgtggttcaggttatcgaacaatttgtcaatggcggtctggaa420
accgaagaagcgttccgcaaaaccctgacgctgctgaaaggttcttatgctattgcgctg480
tttgataacgacaatcgtgaaacgatcttcgtggccaaaaacaaatcaccgctgctggtt540
ggcctgggtgataccttcaatgtcgtggcatcggacgcgatggcgatgctgcaggtgacg600
aacgaatatgttgaactgatggataaagaaatggttattgtcaccgatgaccaagttgtc660
atcaaaaatctggatggtgacgtgattacgcgtgcaagctacatcgctgaactggatgcg720
tctgacattgaaaaaggcacctatccgcattacatgctgaaagaaacggatgaacagccg780
gtggttatgcgcaaaattatccagacctatcaagatgaaaacggtaaactgagcgttccg840
ggcgatattgcggcggcagtcgctgaagcggaccgtatctatattatcggctgtggcacg900
tcttaccatgcgggtctggtgggcaaacagtatattgaaatgtgggccaacgtgccggtt960
gaagtccacgtggcaagtgaattttcctacaatatgccgctgctgagtaaaaaaccgctg1020
tttattttcctgagccagtctggcgaaaccgccgattcccgcgcagttctggtccaagtg1080
aaagccctgggtcataaagcactgaccatcacgaatgtgccgggctcaaccctgtcgcgt1140
gaagctgattatacgctgctgctgcacgcgggtccggaaattgccgttgcaagcaccaaa1200
gcgtatacggcacagatcgcagtcctggcagtgctggcttctgtggctgcggataaaaac1260
ggtattaatatcggctttgacctggttaaagaactgggcattgccgcaaacgcgatggaa1320
gccctgtgcgatcagaaagacgaaatggaaatgattgctcgtgaatatctgaccgtgagt1380
cgcaatgcctttttcatcggccgtggtctggattattttgtttgtgtcgaaggtgccctg1440
aaactgaaagaaatttcctacatccaggctgaaggcttcgcgggcggtgaactgaaacat1500
ggtaccattgcgctgatcgaacagggcaccccggtctttgctctggcgacgcaagaacac1560
gttaacctgtcaattcgcggtaatgttaaagaagtcgctgcgcgtggcgcaaacacctgc1620
attatctcgctgaaaggtctggatgacgcggatgaccgctttgtcctgccggaagtgaat1680
ccggcactggcaccgctggtgagtgtcgtgccgctgcagctgatcgcgtattacgccgca1740
ctgcatcgcggctgtgatgttgacaaaccgcgtaacctggccaaaagcgtgaccgttgaa1800
taa1803