本發(fā)明涉及基因組改造技術(shù)。
背景技術(shù):
20世紀(jì)80年代以來(lái),植物甾醇微生物轉(zhuǎn)化生產(chǎn)前體如4ad、9-oh-ad和add等已逐漸成為大多數(shù)類固醇藥物(雄激素,類固醇,雌激素和皮質(zhì)類固醇)的合成原料。分枝桿菌具有復(fù)雜的膽固醇代謝途徑,可以代謝植物來(lái)源的具有復(fù)雜成份的甾醇側(cè)鏈,經(jīng)過(guò)幾十年的誘變育種和基因工程改造,已逐漸成為高效經(jīng)濟(jì)地生產(chǎn)此類中間體的主要工業(yè)菌株。
結(jié)核病是困擾全球多年的嚴(yán)重公共健康問(wèn)題,該病由結(jié)核分枝桿菌引起,每年造成約200萬(wàn)人死亡。結(jié)核分枝桿菌生長(zhǎng)緩慢,可以以膽固醇為唯一碳源生長(zhǎng),對(duì)其研究特別是開(kāi)展基因組操作存在較大的難度。恥垢分枝桿菌mc2155是分枝桿菌特別是結(jié)核分枝桿菌使用膽固醇作為唯一碳源和能量源進(jìn)行生長(zhǎng)研究的模式生物,生長(zhǎng)快速且無(wú)致病性,經(jīng)過(guò)改造后有望成為類固醇合成前體的細(xì)胞工廠。beatriz等(2016)研究表明經(jīng)過(guò)簡(jiǎn)單的敲除msmeg_6039(kshb1)和msmeg_5941(kstd1),m.smegmatismc2155即可高效地轉(zhuǎn)化植物甾醇生產(chǎn)add和4ad等類固醇激素藥物合成原料。
雖然分枝桿菌的基礎(chǔ)研究在疾病治療和工業(yè)生產(chǎn)上均具有重要價(jià)值,但由于各種原因(如可能對(duì)分枝桿菌的重要性認(rèn)識(shí)較晚),基于分枝桿菌的操作系統(tǒng)相比放線菌目?jī)?nèi)的其他屬如鏈霉菌屬分子操作手段仍顯匱乏。2000年,tanya等在結(jié)核分枝桿菌(m.tubeiculosis)中開(kāi)發(fā)了基于p2nil和pgoal質(zhì)粒的基因打靶系統(tǒng)。該系統(tǒng)由pgoal質(zhì)粒提供篩選標(biāo)記,p2nil質(zhì)粒提供多克隆位點(diǎn)以方便克隆重組交換臂及篩選標(biāo)記。該系統(tǒng)至今仍然是分枝桿菌操作的主要手段。該技術(shù)在實(shí)際操作過(guò)程中仍然相對(duì)耗時(shí)。如果需要進(jìn)行基因的插入及精準(zhǔn)突變等基因組特定位點(diǎn)的編輯,仍然非常困難且效率不高。
同源重組(homologousrecombination)廣泛存在于自然界的生命體中。同源重組的分子過(guò)程在生物體內(nèi)普遍存在,可由dna雙鏈斷裂(dsb)誘導(dǎo)自身蛋白參與的修復(fù)。i-scei是一個(gè)染色體的稀有內(nèi)切酶,亦被稱為歸巢核酸內(nèi)切酶,首先發(fā)現(xiàn)于酵母線粒體的內(nèi)含子中。i-scei識(shí)別18bp的非對(duì)稱序列(attaccctgttatcccta),在染色體上加入這個(gè)序列可以被該酶識(shí)別并切割,誘導(dǎo)宿主體內(nèi)的重組蛋白表達(dá)參與dsb的修復(fù),最終導(dǎo)致分子間的重組修復(fù)。該系統(tǒng)本質(zhì)是基于傳統(tǒng)的重組臂交換或非同源末端環(huán)化等分子機(jī)理(nhej)以達(dá)到敲除基因組上特定dna片段的技術(shù)。
dna在基因組上的敲出、敲入和替換過(guò)程傳統(tǒng)上均使用交換臂先將帶有與染色體對(duì)應(yīng)位置同源的交換臂的目的重組質(zhì)粒單交換整合至待改造微生物的基因組上,隨后使用重組質(zhì)粒上的抗性基因篩選發(fā)生另一個(gè)交換臂產(chǎn)生雙交換以去除質(zhì)粒,得到經(jīng)過(guò)改造的突變菌株,敲除臂的長(zhǎng)度通常決定了改造效率,交換臂越長(zhǎng),改造效率越高。該方法在實(shí)際使用時(shí)效率通常較低,難以得到目的dna改造后的菌株。crispr-cas9系統(tǒng)是使用靶向rna(grna)將活性cas9蛋白引導(dǎo)至基因組上的改造位點(diǎn),在該位點(diǎn)切割后造成染色體雙鏈斷裂(dsb),引發(fā)細(xì)胞的重組修復(fù)系統(tǒng)來(lái)完成特定位點(diǎn)的基因組改造工作,該系統(tǒng)由于同樣造成dna雙鏈斷裂(dsb)誘導(dǎo)細(xì)胞的重組修復(fù)系統(tǒng)參與,通常改造效率較高。與其工作原理相似,只要在目的微生物基因組上通過(guò)質(zhì)粒引入稀有內(nèi)切酶的酶切位點(diǎn),相應(yīng)的稀有內(nèi)切酶在微生物細(xì)胞內(nèi)經(jīng)表達(dá)形成活性蛋白后,同樣可以酶切染色體造成dsb以引發(fā)后期的修復(fù)改造過(guò)程。該系統(tǒng)無(wú)需靶向rna參與,更加方便,適用于基因組較小,染色體上無(wú)稀有核酸內(nèi)切酶酶切位點(diǎn)的微生物。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有分枝桿菌基因組改造手段的不足,提供一種通用于分枝桿菌的較為高效快速的基因組編輯質(zhì)粒及其方法。
歸巢核酸內(nèi)切酶是一種稀有核酸內(nèi)切酶,識(shí)別序列較普通二型限制性內(nèi)切酶長(zhǎng),所以很難在基因組內(nèi)找到相同的序列。來(lái)源:i-sceⅰ基因是有酵母21srrna基因的sclsu.1內(nèi)含子編碼的稀有核酸內(nèi)切酶。識(shí)別18bp非對(duì)稱序列:tagggataacagggtaat。
發(fā)明人在對(duì)i-scei密碼子基礎(chǔ)上進(jìn)行優(yōu)化改造,得到命名為scem的基因(seqidno:1),該基因表達(dá)酶證明能在恥垢分枝桿菌中有特定位點(diǎn)切割活性。
為此,本發(fā)明需要保護(hù)以下各技術(shù)方案為:
技術(shù)方案一
所述經(jīng)過(guò)對(duì)已有密碼子優(yōu)化改造后的scem,該酶經(jīng)本發(fā)明實(shí)驗(yàn)驗(yàn)證可用于分枝桿菌。
技術(shù)方案二(機(jī)理)
利用技術(shù)方案一中scem在分枝桿菌中有活性可以進(jìn)行基因組編輯特性,構(gòu)建分枝桿菌基因敲除系統(tǒng)。質(zhì)粒在電轉(zhuǎn)化后將借助同源重組交換臂將該系統(tǒng)中構(gòu)建的帶有同源交換臂的重組質(zhì)粒整合進(jìn)入分枝桿菌基因組。當(dāng)使用atc作為誘導(dǎo)劑,四環(huán)素啟動(dòng)子將起始scem基因的表達(dá)。當(dāng)誘導(dǎo)表達(dá)scem后,該酶將酶切質(zhì)粒上插入的唯一的酶切位點(diǎn),造成染色體在此位置特異性雙鏈斷裂(dsb),引發(fā)分枝桿菌特異修復(fù)此位點(diǎn),實(shí)現(xiàn)基因或基因組dna片段的編輯功能。
技術(shù)方案三
pmk101質(zhì)粒及其構(gòu)建方法
所述由scem基因構(gòu)成的pmk101質(zhì)粒,其特征在于,還包括:
一個(gè)pbr322的復(fù)制起始區(qū);
一個(gè)氨芐青霉素的抗性基因amp,用于大腸桿菌構(gòu)建質(zhì)粒時(shí)篩選重組質(zhì)粒;
一個(gè)控制所述scem基因表達(dá)的抑制誘導(dǎo)型啟動(dòng)子teto-tetr(已為現(xiàn)有技術(shù),非本發(fā)明首次提出),該啟動(dòng)子在atc誘導(dǎo)下可開(kāi)啟scem基因的轉(zhuǎn)錄和后續(xù)的表達(dá);
所述質(zhì)粒pmk101的基因序列為seqidno:2。
所述的pmk101質(zhì)粒,其特征在于,其構(gòu)建方法為:
步驟1,使用bglⅱ和nheⅰ雙酶切pen4.1a-t10m質(zhì)粒,得到pimyc-tetrdna片段;
使用bamhⅰ和xbaⅰ雙酶切pbluescriptsk(-)質(zhì)粒,同時(shí)加入所述pimyc-tetrdna片段連接得到pks-pimyc-tetr;
步驟2,使用ndeⅰ和kpnⅰ雙酶切plu101質(zhì)粒,將scem克隆至plu101質(zhì)粒的ndeⅰ和kpnⅰ位點(diǎn),得到plu102;隨后使用pstⅰ和ecorⅰ雙酶切plu102,得到923bp的包含ptipa+scem的dna片段;
使用pstⅰ和ecorⅰ雙酶切步驟1獲得的所述pks-pimyc-tetr質(zhì)粒,加入所述ptipa+scem的dna片段后兩者連接得到pks-pimyc-tetr-ptipa-scem;
步驟3,
3.1步驟,使用引物(teto_f:tttactgcagattggatcgtcggcaccgtca和teto_r:tttacatatggcggatcgtgctcatttcgg),以質(zhì)粒pen12a-p1為模板,得到pmyc-teto啟動(dòng)子,使用pstⅰ和ndeⅰ雙酶切,得到pmyc-teto啟動(dòng)子dna片段,備用;
3.2步驟,使用pstⅰ和ndeⅰ雙酶切步驟2中重組質(zhì)粒pks-pimyc-tetr-ptipa-scem用于去除ptipa啟動(dòng)子,并加入步驟3.1備用的所述pmyc-teto啟動(dòng)子dna片段,最終得到pks-pimyc-tetr-pmyc-scem,實(shí)現(xiàn)構(gòu)建質(zhì)粒pmk101。
技術(shù)方案四
精準(zhǔn)敲除msmeg_5228質(zhì)粒及其構(gòu)建方法
一種pmk5228質(zhì)粒,包括所述pmk101質(zhì)粒的元件,其特征在于,還包括:
一個(gè)來(lái)自于pgoal19質(zhì)粒的篩選標(biāo)記;該pgoal19質(zhì)粒的篩選標(biāo)記,包括了三個(gè)基因:一個(gè)潮霉素抗性基因,一個(gè)半乳糖苷酶篩選標(biāo)記lacz和一個(gè)基于蔗糖的反篩選標(biāo)記sacb;
一個(gè)來(lái)自于鏈霉菌pij773質(zhì)粒的阿泊拉霉素抗性篩選標(biāo)記apra。
所述的pmk5228質(zhì)粒,其特征在于,其基因序列為seqidno:3。
所述的pmk5228質(zhì)粒的構(gòu)建方法,其特征在于,
使用(引物sc_u_f:tttagaattcaacccggtgtgcgatctggt,
sc_u_r:atcgcagatgtcgcccgtg;
sc_d_r1:accctgttatccctagggttctgcgaggacgaca,
sc_d_r:gggttctgcgaggacgaca,
sc_d_r3:attttctagagcgttaattaaactagtagatctaagcttgattaccctgttatccctagggttctgcgaggacgaca)
pcr整合獲得msmeg_5228上下游分別為820bp和946bp的敲除重組交換臂,hindⅲ和ecorⅰ酶切后與hindⅲ和ecorⅰ雙酶切pmk101連接獲得pmk1011質(zhì)粒;
xbaⅰ酶切獲得pij773質(zhì)粒的apramycin抗性基因,克隆入pmk1011質(zhì)粒,獲得質(zhì)粒pmk1012;
pacⅰ酶切pgoal19質(zhì)粒,獲得hyg-lacz-sacb片段;同樣以pacⅰ酶切質(zhì)粒pmk1012,將hyg-lacz-sacb片段克隆入pmk1011,獲得最終精準(zhǔn)敲除msmeg_5228的靶向質(zhì)粒pmk5228。
技術(shù)方案五
精準(zhǔn)敲除膽固醇利用基因簇msmeg_5990-msmeg_6043質(zhì)粒及其構(gòu)建方法
一種pmk90-43質(zhì)粒,包括所述pmk101質(zhì)粒的元件,其特征在于,還包括:
敲除基因簇msmeg_5990-msmeg_6043兩側(cè)的重組交換臂;
來(lái)自于pgoal19質(zhì)粒的篩選標(biāo)記;該篩選標(biāo)記包括了三個(gè)基因:潮霉素抗性基因、半乳糖苷酶篩選標(biāo)記lacz、基于蔗糖的反篩選標(biāo)記sacb;
來(lái)自于鏈霉菌pij773質(zhì)粒的阿泊拉霉素抗性篩選標(biāo)記。
所述的pmk90-43質(zhì)粒,其特征在于,其基因序列為seqidno:4。
所述的pmk90-43質(zhì)粒的構(gòu)建方法,其特征在于,
使用(引物:
5990_sf:tttagaattctggttggcagtccgtgcaca,
5990_r:ggctcgatgaccggggtg;
90-43f1:caccccggtcatcgagccatcgacatccactcggccga,
6043_r:ggttgctgaggcggtgaatga,
6043_sr:attttctagagcgttaattaaactagtagatctaagcttgattaccctgttatccctaggttgctgaggcggtgaatga)pcr整合獲得msmeg_5228上下游分別為865bp和938-bp的敲除重組交換臂,采用hindⅲ和ecorⅰ酶切后與hindⅲ和ecorⅰ雙酶切pmk101連接獲得pmk1013質(zhì)粒;
xbaⅰ酶切獲得pij773質(zhì)粒的apramycin抗性基因,克隆入pmk1011質(zhì)粒,獲得質(zhì)粒pmk1014;
pacⅰ酶切pgoal19質(zhì)粒,獲得hyg-lacz-sacb片段;同樣以pacⅰ酶切質(zhì)粒pmk1014,將hyg-lacz-sacb片段克隆入pmk1011,獲得最終精準(zhǔn)敲除基因簇msmeg_5990-msmeg_6043的靶向質(zhì)粒pmk90-43。
技術(shù)方案六
分枝桿菌scetm基因敲除系統(tǒng)在分枝桿菌中進(jìn)行連續(xù)精準(zhǔn)基因敲除的應(yīng)用。
經(jīng)本發(fā)明驗(yàn)證,在相同敲除臂長(zhǎng)度的情況下,使用傳統(tǒng)方法在m.smegmatismc2155中均未得到敲除突變株,而使用發(fā)明的scetm系統(tǒng),在實(shí)施例中均得到了正確的改造菌株。該方法的建立可為分枝桿菌的基因組改造,進(jìn)一步了解結(jié)核分枝桿菌等病原菌的致病機(jī)理以及進(jìn)一步改造以新金分枝桿菌(mycobacteriumneoaurum)、偶發(fā)分枝桿菌(mycobacteriumfortuitum)為代表的工業(yè)微生物的基因組以提高激素藥物前體的產(chǎn)量提供了更為便捷的操作工具。
附圖說(shuō)明
圖1是pmk101構(gòu)建流程圖(實(shí)施例1)
圖2是pmk101質(zhì)粒示意圖(實(shí)施例1)
圖3是pmk5228構(gòu)建流程圖(實(shí)施例3)
圖4是pmk5228質(zhì)粒示意圖(實(shí)施例3)
圖5是pmk90-43構(gòu)建流程圖(實(shí)施例4)
圖6是pmk90-43質(zhì)粒示意圖(實(shí)施例4)
圖7是本發(fā)明基因敲除流程圖
圖8是在加入10%蔗糖的lb固體培養(yǎng)基上劃線篩選msmeg_5228敲除dna片段的m.smegmatismc2155(實(shí)施例5)
圖9是scetm系統(tǒng)敲除msmeg_5228基因的抗性驗(yàn)證圖(實(shí)施例5)
圖10是敲除菌株pcr驗(yàn)證結(jié)果(實(shí)施例5)
圖11是在加入10%蔗糖的lb固體培養(yǎng)基上劃線篩選msmeg_5990-msmeg_6043敲除dna片段的m.smegmatismc2155。(實(shí)施例6)
圖12是scetm系統(tǒng)敲除msmeg_5990-msmeg_6043基因簇的抗性驗(yàn)證圖(實(shí)施例6)
圖13是敲除菌株pcr驗(yàn)證結(jié)果(實(shí)施例6)
圖14是在加入10%蔗糖的lb固體培養(yǎng)基上劃線篩選msmeg_5228敲除dna片段的m.smegmatismc2155(實(shí)施例7)
圖15是scetm系統(tǒng)在敲除msmeg_5990-msmeg_6043基因簇的基礎(chǔ)上連續(xù)敲除msmeg_5228基因的抗性驗(yàn)證。(實(shí)施例7)
圖16是隨機(jī)挑選33株敲除菌株進(jìn)行pcr敲除結(jié)果驗(yàn)證(實(shí)施例7)
圖17是使用p2nil質(zhì)粒敲除msmeg_5228基因蔗糖平板篩選圖證(實(shí)施例8)
圖18是使用p2nil質(zhì)粒敲除msmeg_5990-msmeg_6043基因簇蔗糖平板篩選圖證(實(shí)施例8)
圖19是使用p2nil質(zhì)粒敲除msmeg_5228基因、敲除msmeg_5990-msmeg_6043基因簇的抗性驗(yàn)證圖(實(shí)施例8)
圖20是傳統(tǒng)敲除方法p2nil敲除msmeg_5228的pcr驗(yàn)證電泳跑膠圖(實(shí)施例8)
圖21是傳統(tǒng)敲除方法p2nil敲除msmeg_5990-msmeg_6043的pcr驗(yàn)證電泳跑膠圖(實(shí)施例8)
具體實(shí)施方式
本發(fā)明涉及一種能在分枝桿菌中進(jìn)行精準(zhǔn)基因組編輯的質(zhì)粒構(gòu)建及其在分枝桿菌中進(jìn)行連續(xù)精準(zhǔn)基因敲除的應(yīng)用。使用該方法進(jìn)行分枝桿菌基因組編輯的目的dna片段長(zhǎng)度理論上可從bp-mb級(jí)別且在改造后不在基因組上留下任何疤痕。該方法的建立可為高致病分枝桿菌的致病機(jī)理研究和重要甾體激素藥物前體生產(chǎn)的重要分枝桿菌工業(yè)菌株的基因組改造提供極其重要的基因組編輯手段。以下通過(guò)若干實(shí)施例對(duì)本發(fā)明技術(shù)方案做進(jìn)一步展開(kāi)和對(duì)比介紹。
實(shí)施例1構(gòu)建基于分枝桿菌的精準(zhǔn)基因組編輯基礎(chǔ)質(zhì)粒
如圖1所示的方法過(guò)程,具體如下:
步驟1,使用bglⅱ和nheⅰ雙酶切pen4.1a-t10m質(zhì)粒(pen4.1a-t10m質(zhì)粒為現(xiàn)有技術(shù),可通過(guò)采購(gòu)獲得),得到pimyc-tetrdna片段。
使用bamhⅰ和xbaⅰ雙酶切pbluescriptsk(-)質(zhì)粒(pbluescriptsk(-)質(zhì)粒為現(xiàn)有技術(shù),可通過(guò)采購(gòu)獲得),同時(shí)加入所述pimyc-tetrdna片段連接得到pks-pimyc-tetr。
步驟2,以i-scei基因?yàn)榛A(chǔ),在綜合分析結(jié)核分枝桿菌、恥垢分枝桿菌和偶發(fā)分枝桿菌等分枝桿菌的密碼子使用的基礎(chǔ)上,使用genedesigner軟件優(yōu)化合成了i-scei基因,命名為scem(702bp,seqidno:1)。使用ndeⅰ和kpnⅰ雙酶切plu101質(zhì)粒(為現(xiàn)有技術(shù),公開(kāi)于:zhiqunlu,pengfeixie,andzhongjunqin*,promotionofmarkerlessdeletionoftheactinorhodinbiosyntheticgeneclusterinstreptomyces
使用pstⅰ和ecorⅰ雙酶切步驟1獲得的所述pks-pimyc-tetr質(zhì)粒,加入所述ptipa+scem的dna片段后兩者連接得到pks-pimyc-tetr-ptipa-scem。
步驟3,
3.1步驟,使用引物(teto_f:tttactgcagattggatcgtcggcaccgtca和teto_r:tttacatatggcggatcgtgctcatttcgg),以質(zhì)粒pen12a-p1(質(zhì)粒pen12a-p1為現(xiàn)有技術(shù),可通過(guò)采購(gòu)獲得)為模板,得到pmyc-teto啟動(dòng)子,使用pstⅰ和ndeⅰ雙酶切,得到pmyc-teto啟動(dòng)子dna片段,備用;
3.2步驟,使用pstⅰ和ndeⅰ雙酶切步驟2中重組質(zhì)粒pks-pimyc-tetr-ptipa-scem用于去除ptipa啟動(dòng)子,并加入步驟3.1備用的所述pmyc-teto啟動(dòng)子dna片段,最終得到pks-pimyc-tetr-pmyc-scem(pmk101,如圖2所示)。
如圖2所示圖譜,所述質(zhì)粒pmk101的結(jié)構(gòu),主要包括:
一個(gè)pbr322的復(fù)制起始區(qū);
一個(gè)氨芐青霉素的抗性基因amp,用于大腸桿菌構(gòu)建質(zhì)粒時(shí)篩選重組質(zhì)粒;
一個(gè)經(jīng)過(guò)優(yōu)化的歸巢核酸酶i-scei基因(命名為scem,此酶被證明在分枝桿菌中有期望的定點(diǎn)酶切的功能,用于在分枝桿菌中酶切染色體,誘導(dǎo)宿主菌修復(fù)機(jī)制形成期望的重組改造進(jìn)行特定位點(diǎn)的dna編輯)。
一個(gè)控制scem基因表達(dá)的抑制誘導(dǎo)型啟動(dòng)子teto-tetr(該啟動(dòng)子在atc誘導(dǎo)下可開(kāi)啟scem基因的轉(zhuǎn)錄和后續(xù)的表達(dá))。
所述質(zhì)粒pmk101的基因序列,詳見(jiàn)seqidno:2。
實(shí)施例2
本實(shí)施例為實(shí)施例1的替換技術(shù)方案。區(qū)別技術(shù)措施僅在于:
以齒垢分枝桿菌染色體dna為模板,使用引物
psmyc_f:tttaagatctggatcgtcggcaccgtca和
psmyc_r:tttaggtaccggatcgtgctcatttcgggc,pcr得到約300bp的psmyc啟動(dòng)子片段,使用bglⅱ和kpnⅰ酶切克隆入pen4.1a-t10m質(zhì)粒,可替換pimyc啟動(dòng)子。
因?yàn)樗沫h(huán)素誘導(dǎo)啟動(dòng)子存在本底表達(dá)和誘導(dǎo)效率的問(wèn)題,兩者需要一定的平衡,主要目的在于調(diào)節(jié)scem基因的本底表達(dá)效率,但是以上兩個(gè)啟動(dòng)子替換后均能正常使用。
以實(shí)施例1獲得的pmk101為基礎(chǔ),分別構(gòu)建精準(zhǔn)敲除msmeg_5228和膽固醇利用基因簇msmeg_5990-msmeg_6043質(zhì)粒。以下通過(guò)實(shí)施例3、實(shí)施例4作為例子來(lái)介紹構(gòu)建基于分枝桿菌的精準(zhǔn)基因組編輯位點(diǎn)質(zhì)粒。但本發(fā)明不限于保護(hù)實(shí)施例所披露的內(nèi)容。
實(shí)施例3構(gòu)建精準(zhǔn)敲除msmeg_5228的靶向質(zhì)粒pmk5228
如圖3所示,pmk5228質(zhì)粒構(gòu)建流程圖,構(gòu)建過(guò)程如下:
(1)使用(引物
sc_u_f:tttagaattcaacccggtgtgcgatctggt,
sc_u_r:atcgcagatgtcgcccgtg;
sc_d_r1:accctgttatccctagggttctgcgaggacgaca,
sc_d_r:gggttctgcgaggacgaca,
sc_d_r3:attttctagagcgttaattaaactagtagatctaagcttgattaccctgttatccctagggttctgcgaggacgaca)
pcr整合獲得msmeg_5228上下游分別為820bp和946bp的敲除重組交換臂,hindⅲ和ecorⅰ酶切后與hindⅲ和ecorⅰ雙酶切pmk101(來(lái)自于實(shí)施例1構(gòu)建方法獲得)連接獲得pmk1011質(zhì)粒。xbaⅰ酶切獲得pij773質(zhì)粒的apramycin抗性基因,克隆入pmk1011質(zhì)粒,獲得質(zhì)粒pmk1012。pacⅰ酶切pgoal19質(zhì)粒(pgoal19質(zhì)粒為現(xiàn)有技術(shù),可通過(guò)采購(gòu)獲得),獲得hyg-lacz-sacb片段。同樣以pacⅰ酶切質(zhì)粒pmk1012,將hyg-lacz-sacb片段克隆入pmk1011,獲得最終精準(zhǔn)敲除msmeg_5228的靶向質(zhì)粒pmk5228(圖4)。
如圖4所示圖譜,所述質(zhì)粒pmk5228的結(jié)構(gòu):除了包括結(jié)構(gòu)質(zhì)粒pmk101的元件之外,還包括敲除基因兩側(cè)的重組交換臂(上游大小為820bp,下游大小為946bp):
一個(gè)來(lái)自于pgoal19質(zhì)粒的篩選標(biāo)記(該篩選標(biāo)記包括了三個(gè)基因,一個(gè)潮霉素抗性基因,一個(gè)半乳糖苷酶篩選標(biāo)記lacz和一個(gè)基于蔗糖的反篩選標(biāo)記sacb);
一個(gè)來(lái)自于鏈霉菌pij773質(zhì)粒(鏈霉菌pij773質(zhì)粒為現(xiàn)有技術(shù),可通過(guò)采購(gòu)獲得)的阿泊拉霉素抗性篩選標(biāo)記apra。
本實(shí)施例最終構(gòu)建的質(zhì)粒pmk5228,其基因序列詳見(jiàn)seqidno:3。
實(shí)施例4構(gòu)建精準(zhǔn)敲除基因簇msmeg_5990-msmeg_6043的靶向質(zhì)粒pmk90-43
參照實(shí)施例3中構(gòu)建pmk2558流程,本實(shí)施例與之相比唯一的區(qū)別在于需要敲除的基因在染色體上的位置不同,所以交換臂在染色體上的位置不同,導(dǎo)致敲除臂序列和pmk2558敲除臂是不一樣。其余流程都一致。如圖5所示,介紹如下:
使用(引物:
5990_sf:tttagaattctggttggcagtccgtgcaca,
5990_r:ggctcgatgaccggggtg;
90-43f1:caccccggtcatcgagccatcgacatccactcggccga,
6043_r:ggttgctgaggcggtgaatga,
6043_sr:attttctagagcgttaattaaactagtagatctaagcttgattaccctgttatccctaggttgctgaggcggtgaatga)pcr整合獲得msmeg_5228上下游分別為865bp和938-bp的敲除重組交換臂,采用hindⅲ和ecorⅰ酶切后與hindⅲ和ecorⅰ雙酶切pmk101(來(lái)自于實(shí)施例1構(gòu)建方法獲得)連接獲得pmk1013質(zhì)粒。xbaⅰ酶切獲得pij773質(zhì)粒的apramycin抗性基因,克隆入pmk1011質(zhì)粒,獲得質(zhì)粒pmk1014。pacⅰ酶切pgoal19質(zhì)粒,獲得hyg-lacz-sacb片段。同樣以pacⅰ酶切質(zhì)粒pmk1014,將hyg-lacz-sacb片段克隆入pmk1011,獲得最終精準(zhǔn)敲除基因簇msmeg_5990-msmeg_6043的靶向質(zhì)粒pmk90-43(圖6)。
如圖6所示圖譜,所述質(zhì)粒pmk90-43的結(jié)構(gòu),除了包括結(jié)構(gòu)質(zhì)粒pmk101的元件之外,還包括敲除基因簇msmeg_5990-msmeg_6043兩側(cè)的重組交換臂(上游大小為865bp,下游大小為938bp):
一個(gè)來(lái)自于pgoal19質(zhì)粒的篩選標(biāo)記(該篩選標(biāo)記包括了三個(gè)基因,一個(gè)潮霉素抗性基因;
一個(gè)半乳糖苷酶篩選標(biāo)記lacz和一個(gè)基于蔗糖的反篩選標(biāo)記sacb);
一個(gè)來(lái)自于鏈霉菌pij773質(zhì)粒的阿泊拉霉素抗性篩選標(biāo)記。
本實(shí)施例最終獲得的質(zhì)粒pmk90-43,其基因序列詳見(jiàn)seqidno:4。
實(shí)施例5應(yīng)用例
本發(fā)明基因敲除流程,如圖7所示。
使用實(shí)施例3改造后的scetm系統(tǒng)敲除m.smegmatismc2155的3β-羥基類固醇脫氫酶(msmeg_5228,1071bp)。
挑取在固體培養(yǎng)基上的m.smegmatismc2155單菌落接入lb培養(yǎng)基,30℃培養(yǎng)48h,生長(zhǎng)od600值至0.4-0.6,轉(zhuǎn)接f培養(yǎng)基:生長(zhǎng)8-9小時(shí)至od600值0.3-0.8時(shí),5000r/min離心5min收集菌體,加入15ml10%甘油重懸,5000r/min離心5min(此過(guò)程重復(fù)3次)后用200μl10%甘油重懸,加入10-100ng質(zhì)粒后置于冰上10min。將pmk5228質(zhì)粒與菌體混合物加入預(yù)冷電轉(zhuǎn)化杯,2500v/電轉(zhuǎn)后加入1mllb+甘油培養(yǎng)基放于37℃搖床復(fù)蘇2-3h,隨后涂布于含有apramycin(終濃度為50ug/ml)和x-gal(終濃度為20ug/ml)的lb+甘油固體培養(yǎng)基上,37℃培養(yǎng)箱培養(yǎng)3-5d后觀察;
待平板上菌落長(zhǎng)出藍(lán)色菌落后挑選藍(lán)色菌落劃線于含有atc(終濃度為30ng/ml)的lb+甘油固體培養(yǎng)基平板上進(jìn)行誘導(dǎo)培養(yǎng),放于37℃培養(yǎng)箱培養(yǎng)3-5d;
待平板上長(zhǎng)出單菌落后隨機(jī)挑選2-3株單菌落劃線于含有x-gal(終濃度為20ug/ml)的lb+甘油的蔗糖固體培養(yǎng)基上(其中蔗糖濃度為10%,且該培養(yǎng)基中去掉了nacl成分)放于37℃培養(yǎng)箱培養(yǎng)3-5d;
待平板上長(zhǎng)出藍(lán)白分明的單菌落后,隨機(jī)挑選平板上的白色菌落33株分別劃線apramycin(終濃度為50ug/ml)的lb+甘油的抗性平板和不含有抗生素的lb+甘油的固體培養(yǎng)基平板上進(jìn)行抗性對(duì)照,37℃條件下培養(yǎng)2-3d觀察;
挑選抗性平板上不長(zhǎng)的菌株接種于液體f培養(yǎng)基中提取其基因組dna進(jìn)行pcr驗(yàn)證其目的區(qū)段是否敲除,并挑選目的區(qū)段缺失的pcr條帶送出測(cè)序。
如圖8所示:
a為重組質(zhì)粒電轉(zhuǎn)分枝桿菌(m.smegmatismc2155)后在加有終濃度2%甘油、2%x-gal和50μg/mlapramycin抗生素的lb培養(yǎng)基上涂布長(zhǎng)出apramycin抗性菌落(3-5d)。
b為在2%甘油、2%x-gal、50-300ng/mlatc和含有10%蔗糖的lb固體平板上劃線a圖中得到的藍(lán)色單菌落篩選msmeg_5228基因敲除的m.smegmatismc2155(白色菌落)。
如圖9所示,scetm系統(tǒng)敲除msmeg_5228基因的抗性驗(yàn)證圖。
a為在加有終濃度2%甘油的lb培養(yǎng)基上劃線不同單菌落生長(zhǎng)狀況(對(duì)照);
b為在加有終濃度2%甘油和50μg/mlapramycin抗生素的lb培養(yǎng)基上同時(shí)劃線同一菌落,同樣的菌落在抗性平板上不生長(zhǎng)意味著抗性基因的丟失。
由此證明這些經(jīng)過(guò)圖8所示過(guò)程誘導(dǎo)后的單菌落基因組上重組質(zhì)??赡馨l(fā)生了預(yù)期的重組交換丟失。
如圖10所示,敲除菌株pcr驗(yàn)證結(jié)果:其中共pcr得到21個(gè)有結(jié)果條帶,確認(rèn)敲除的菌株有9個(gè)敲除效率約為42.85%(其中未被敲除菌株pcr得到一條1300bp左右大小的條帶,敲除菌株pcr得到條帶大小為500bp左右)。
實(shí)施例6應(yīng)用例
本發(fā)明基因敲除流程,如圖7所示。
使用實(shí)施例4改造后的scetm系統(tǒng)敲除m.smegmatismc2155的膽固醇利用基因簇(msmeg_5990-msmeg_6043,總長(zhǎng)約48kb):
挑取在固體培養(yǎng)基上的m.smegmatismc2155單菌落接入lb培養(yǎng)基,30℃培養(yǎng)48h,生長(zhǎng)od600值至0.4-0.6,轉(zhuǎn)接f培養(yǎng)基:生長(zhǎng)8-9小時(shí)至od600值0.3-0.8時(shí),5000r/min離心5min,收集菌體,加入15ml10%甘油重懸,5000r/min離心5min,此過(guò)程重復(fù)3次,后用200μl10%甘油重懸,加入10-100ng質(zhì)粒后置于冰上10min。
將pmk90-43質(zhì)粒與菌體混合物加入預(yù)冷電轉(zhuǎn)化杯,2500v/電轉(zhuǎn)后加入1mllb+甘油培養(yǎng)基放于37℃搖床復(fù)蘇2-3h,隨后涂布于含有apramycin(終濃度為50ug/ml)和x-gal(終濃度為20ug/ml)的lb+甘油固體培養(yǎng)基上,37℃培養(yǎng)箱培養(yǎng)3-5d后觀察;
待平板上菌落長(zhǎng)出藍(lán)色菌落后挑選藍(lán)色菌落劃線于含有atc(終濃度為30ng/ml)的lb+甘油固體培養(yǎng)基平板上進(jìn)行誘導(dǎo)培養(yǎng),放于37℃培養(yǎng)箱培養(yǎng)3-5d;
待平板上長(zhǎng)出單菌落后隨機(jī)挑選2-3株單菌落劃線于含有x-gal(終濃度為20ug/ml)的lb+甘油的蔗糖固體培養(yǎng)基上(其中蔗糖濃度為10%,且該培養(yǎng)基中去掉了nacl成分)放于37℃培養(yǎng)箱培養(yǎng)3-5d;
待平板上長(zhǎng)出藍(lán)白分明的單菌落后,隨機(jī)挑選平板上的白色菌落33株分別劃線apramycin(終濃度為50ug/ml)的lb+甘油的抗性平板和不含有抗生素的lb+甘油的固體培養(yǎng)基平板上進(jìn)行抗性對(duì)照,37℃條件下培養(yǎng)2-3d觀察;
挑選抗性平板上不長(zhǎng)的菌株接種于液體f培養(yǎng)基中提取其基因組dna進(jìn)行pcr驗(yàn)證其目的區(qū)段是否敲除,并挑選目的區(qū)段缺失的pcr條帶送出測(cè)序。經(jīng)驗(yàn)證敲除效率約為7.14%。
如圖11所示,在加入10%蔗糖的lb固體培養(yǎng)基上劃線篩選msmeg_5990-msmeg_6043敲除dna片段的m.smegmatismc2155。
a為重組質(zhì)粒電轉(zhuǎn)恥垢分枝桿菌(m.smegmatismc2155)后在加有終濃度2%甘油、2%x-gal和50μg/mlapramycin抗生素的lb培養(yǎng)基上涂布長(zhǎng)出apramycin抗性菌落(3-5d)。
b為在2%甘油、2%x-gal、50-300ng/mlatc和含有10%蔗糖的lb固體平板上劃線a圖中得到的藍(lán)色單菌落篩選msmeg_5990-msmeg_6043基因簇敲除的m.smegmatismc2155(白色菌落)。
如圖12所示,是對(duì)scetm系統(tǒng)敲除msmeg_5990-msmeg_6043基因簇的抗性驗(yàn)證圖。
a為在加有終濃度2%甘油的lb培養(yǎng)基上劃線不同單菌落生長(zhǎng)狀況(對(duì)照)。
b為在加有終濃度2%甘油和50μg/mlapramycin抗生素的lb培養(yǎng)基上同時(shí)劃線同一菌落,同樣的菌落在抗性平板上不生長(zhǎng)意味著抗性基因的丟失。由此證明這些經(jīng)過(guò)圖11所示過(guò)程誘導(dǎo)后的單菌落基因組上重組質(zhì)??赡馨l(fā)生了預(yù)期的重組交換丟失。
如圖13所示,敲除菌株pcr驗(yàn)證結(jié)果:其中共pcr測(cè)試31個(gè)樣品,共pcr得到28個(gè)有結(jié)果條帶,確認(rèn)敲除的菌株有2個(gè),敲除效率約為7.14%(由于敲除區(qū)域較長(zhǎng),基因簇敲除pcr驗(yàn)證若菌株上基因簇未被敲除,則pcr應(yīng)得不到任何條帶,由于本次引物設(shè)計(jì)特異性問(wèn)題,結(jié)果中有一條大小約為350bp左右的條帶,敲除菌株pcr得到一條750bp左右的條帶,經(jīng)測(cè)序進(jìn)一步驗(yàn)證確實(shí)為基因簇精準(zhǔn)敲除)。
應(yīng)用例7連續(xù)敲除
本實(shí)施例連續(xù)敲除的基因敲除流程,如圖7所示。
使用本發(fā)明改造后的scetm系統(tǒng)在敲除msmeg_5990-msmeg_6043基因簇的敲除子中繼續(xù)敲除msmeg_5228:
挑取在固體培養(yǎng)基上生長(zhǎng)的m.smegmatismc2155(已成功敲除msmeg_5990-msmeg_6043,經(jīng)驗(yàn)證無(wú)任何抗性)單菌落接入lb培養(yǎng)基,30℃培養(yǎng)48h,生長(zhǎng)od600值至0.4-0.6,轉(zhuǎn)接f培養(yǎng)基:生長(zhǎng)8-9小時(shí)至od600值0.3-0.8時(shí),5000r/min離心5min收集菌體,加入15ml10%甘油重懸,5000r/min離心5min(此過(guò)程重復(fù)3次)后用200μl10%甘油重懸,加入10-100ng質(zhì)粒后置于冰上10min。
將pmk5228質(zhì)粒與菌體混合物加入預(yù)冷電轉(zhuǎn)化杯,2500v/電轉(zhuǎn)后加入1mllb+甘油培養(yǎng)基放于37℃搖床復(fù)蘇2-3h,隨后涂布于含有apramycin(終濃度為50ug/ml)和x-gal(終濃度為20ug/ml)的lb+甘油固體培養(yǎng)基上,37℃培養(yǎng)箱培養(yǎng)3-5d后觀察;
待平板上菌落長(zhǎng)出藍(lán)色菌落后挑選藍(lán)色菌落劃線于含有atc(終濃度為30ng/ml)的lb+甘油固體培養(yǎng)基平板上進(jìn)行誘導(dǎo)培養(yǎng),放于37℃培養(yǎng)箱培養(yǎng)3-5d;待平板上長(zhǎng)出單菌落后隨機(jī)挑選2-3株單菌落劃線于含有x-gal(終濃度為20ug/ml)的lb+甘油的蔗糖固體培養(yǎng)基上(其中蔗糖濃度為10%,且該培養(yǎng)基中去掉了nacl成分)放于37℃培養(yǎng)箱培養(yǎng)3-5d;
待平板上長(zhǎng)出藍(lán)白分明的單菌落后,隨機(jī)挑選平板上的白色菌落33株分別劃線apramycin(終濃度為50ug/ml)的lb+甘油的抗性平板和不含有抗生素的lb+甘油的固體培養(yǎng)基平板上進(jìn)行抗性對(duì)照,37℃條件下培養(yǎng)2-3d觀察;
挑選抗性平板上不長(zhǎng)的菌株接種于液體f培養(yǎng)基中提取其基因組dna進(jìn)行pcr驗(yàn)證其目的區(qū)段是否敲除,并挑選目的區(qū)段缺失的pcr條帶送出測(cè)序。經(jīng)驗(yàn)證敲除效率約為3.33%。圖14所示,在加入10%蔗糖的lb固體培養(yǎng)基上劃線篩選msmeg_5228敲除dna片段的m.smegmatismc2155(已敲除msmeg_5990-msmeg_6043基因簇)。a為重組質(zhì)粒電轉(zhuǎn)恥垢分枝桿菌(m.smegmatismc2155,已驗(yàn)證敲除msmeg_5990-msmeg_6043基因簇)后在加有終濃度2%甘油、2%x-gal和50μg/mlapramycin抗生素的lb培養(yǎng)基上涂布長(zhǎng)出apramycin抗性菌落(3-5d)。b為在2%甘油、2%x-gal、50-300ng/mlatc和含有10%蔗糖的lb固體平板上劃線a圖中得到的藍(lán)色單菌落篩選msmeg_5990-msmeg_6043基因簇敲除的m.smegmatismc2155(白色菌落)。
如圖15所示,scetm系統(tǒng)在敲除msmeg_5990-msmeg_6043基因簇的基礎(chǔ)上連續(xù)敲除msmeg_5228基因的抗性驗(yàn)證。a為在加有終濃度2%甘油的lb培養(yǎng)基上劃線不同單菌落生長(zhǎng)狀況(對(duì)照);b為在加有終濃度2%甘油和50μg/mlapramycin抗生素的lb培養(yǎng)基上同時(shí)劃線同一菌落,同樣的菌落在抗性平板上不生長(zhǎng)意味著抗性基因的丟失。該圖證明這些經(jīng)過(guò)誘導(dǎo)后的單菌落基因組上重組質(zhì)??赡馨l(fā)生了預(yù)期的重組交換丟失。
圖16所示:隨機(jī)挑選33株敲除菌株進(jìn)行pcr敲除結(jié)果驗(yàn)證,其中共pcr得到有結(jié)果的條帶30個(gè)。與對(duì)照恥垢分枝桿菌mc2155基因組pcr結(jié)果1300bp相比,敲除菌株得到pcr條帶大小為500bp左右。由圖可以看出有一個(gè)條帶大小為500bp左右,隨后挑選該條帶送出測(cè)序,得到的測(cè)序結(jié)果確認(rèn)為目的片段缺失,最終本發(fā)明應(yīng)用scetm系統(tǒng)成功實(shí)現(xiàn)了對(duì)于恥垢分枝桿菌基因的連續(xù)敲除。
實(shí)施例8驗(yàn)證及對(duì)比
使用傳統(tǒng)的p2nil質(zhì)粒構(gòu)建重組質(zhì)粒pmkc101(敲除msmeg_5228)和pmkc102(敲除msmeg_5990-msmeg_6043)進(jìn)行dna片段的敲除。
一、使用(引物ct_u_f:tttaaagcttgagcagcaccatctcgacca,
ct_u_r:tttagaattcatcgcagatgtcgcccgtg,
ct_d_f:tttagaattcccgctgctggaaccgctt,
ct_d_r:tttaagatctgggttctgcgaggacgaca)pcr分別獲得msmeg_5228上下游分別為820bp和946bp的敲除重組交換臂,順序克隆入p2nil質(zhì)粒的hindⅲ、ecorⅰ酶和ecorⅰ、bglⅱ位點(diǎn),得到質(zhì)粒pmk1015。pacⅰ酶切pgoal19質(zhì)粒,獲得hyg-lacz-sacb片段。同樣以pacⅰ酶切質(zhì)粒pmk1014,將hyg-lacz-sacb片段克隆入pmk1011,獲得最終敲除基因msmeg_5228的靶向質(zhì)粒pmkc101。
使用p2nil質(zhì)粒敲除msmeg_5228基因,蔗糖平板篩選圖,見(jiàn)圖17。a為基于p2nil構(gòu)建的重組質(zhì)粒pmkc101電轉(zhuǎn)恥垢分枝桿菌(m.smegmatismc2155)后在加有終濃度2%甘油、2%x-gal和50μg/mlkanamycin抗生素的lb培養(yǎng)基上涂布長(zhǎng)出kanamycin抗性菌落(3-5d)。b為在2%甘油、2%x-gal和含有10%蔗糖的lb固體平板上劃線a圖中得到的藍(lán)色單菌落篩選msmeg_5228基因敲除的m.smegmatismc2155(白色菌落)。
使用p2nil質(zhì)粒敲除msmeg_5228基因的抗性驗(yàn)證圖,如圖19所示。p2nil系統(tǒng)(傳統(tǒng)方法)在敲除msmeg_5228基因簇的基礎(chǔ)上連續(xù)敲除msmeg_5228基因的抗性驗(yàn)證圖。a為在加有終濃度2%甘油的lb培養(yǎng)基上劃線不同單菌落生長(zhǎng)狀況(對(duì)照);b為在加有終濃度2%甘油和50μg/mlkanamycin抗生素的lb培養(yǎng)基上同時(shí)劃線同一菌落,同樣的菌落在抗性平板上不生長(zhǎng)意味著抗性基因的丟失。該圖證明這些經(jīng)過(guò)誘導(dǎo)后的單菌落基因組上重組質(zhì)??赡馨l(fā)生了預(yù)期的重組交換丟失。
二、使用(引物
5990_cf:tttaaagctttggttggcagtccgtgcaca,
5990_cr:tttagaattcggctcgatgaccggggtg;
6043_cf:tttagaattcatcgacatccactcggccga,
6043_cr:tttaagatctggttgctgaggcggtgaatga)pcr整合獲得msmeg_5228上下游分別為820bp和946bp的敲除重組交換臂,順序克隆入p2nil質(zhì)粒的hindⅲ、ecorⅰ酶和ecorⅰ、bglⅱ位點(diǎn),得到質(zhì)粒pmk1015。pacⅰ酶切pgoal19質(zhì)粒,獲得hyg-lacz-sacb片段。同樣以pacⅰ酶切質(zhì)粒pmk1014,將hyg-lacz-sacb片段克隆入pmk1015,獲得最終敲除基因簇msmeg_5990-msmeg_6043的靶向質(zhì)粒pmkc102。
圖18所示的蔗糖平板篩選圖(培養(yǎng)基中蔗糖濃度為10%):
a質(zhì)粒電轉(zhuǎn)結(jié)果(培養(yǎng)基加入kan和x-gal):基于p2nil構(gòu)建的重組質(zhì)粒pmkc102電轉(zhuǎn)恥垢分枝桿菌(m.smegmatismc2155)后在加有終濃度2%甘油、2%x-gal和50μg/mlkanamycin抗生素的lb培養(yǎng)基上涂布長(zhǎng)出kanamycin抗性菌落(3-5d)。
b二次重組交換藍(lán)白斑篩選圖:在2%甘油、2%x-gal和含有10%蔗糖的lb固體平板上劃線a圖中得到的藍(lán)色單菌落篩選msmeg_5990-msmeg_6043基因簇敲除的m.smegmatismc2155(白色菌落)。
使用p2nil質(zhì)粒敲除msmeg_5990-msmeg_6043基因的抗性驗(yàn)證圖,也參見(jiàn)如圖19所示。
對(duì)比及驗(yàn)證:
挑取在固體培養(yǎng)基上的m.smegmatismc2155單菌落接入lb培養(yǎng)基,30℃培養(yǎng)48h,生長(zhǎng)od600值至0.4-0.6,轉(zhuǎn)接f培養(yǎng)基:生長(zhǎng)8-9小時(shí)至od600值0.3-0.8時(shí),5000r/min離心5min收集菌體,加入15ml10%甘油重懸,5000r/min離心5min,此過(guò)程重復(fù)3次,后用200μl10%甘油重懸,加入10-100ng質(zhì)粒后置于冰上10min。
將構(gòu)建好的pmkc101(敲除msmeg_5228)和pmkc102(敲除msmeg_5990-msmeg_6043)質(zhì)粒通過(guò)電轉(zhuǎn)導(dǎo)入m.smegmatismc2155中。電轉(zhuǎn)完成后加入1mllb+甘油培養(yǎng)基放于37℃搖床復(fù)蘇2-3h,隨后涂布于含有有kanamycin(終濃度為50ug/ml)和x-gal(終濃度為20ug/ml)的lb+甘油固體培養(yǎng)基上,放于37℃培養(yǎng)箱培養(yǎng)3-5d后觀察;
待平板上菌落長(zhǎng)出藍(lán)色菌落后挑選藍(lán)色菌落劃線于lb+甘油固體培養(yǎng)基平板上,放于37℃培養(yǎng)箱培養(yǎng)3-5d;
待平板上長(zhǎng)出單菌落后隨機(jī)挑選2-3株單菌落劃線于含有x-gal(終濃度為20ug/ml)的lb+甘油的蔗糖固體培養(yǎng)基上(其中蔗糖濃度為10%,且該培養(yǎng)基中去掉了nacl成分)放于37℃培養(yǎng)箱培養(yǎng)3-5d;
待平板上長(zhǎng)出藍(lán)白分明的單菌落后,隨機(jī)挑選平板上的白色菌落33株分別畫于含有卡那霉素的lb+甘油的抗性平板和不含有抗生素的lb+甘油的固體培養(yǎng)基平板上進(jìn)行抗性對(duì)照,37℃條件下培養(yǎng)2-3天觀察;
挑選抗性平板上不長(zhǎng)的菌株接種于液體f培養(yǎng)基中提取其基因組dna進(jìn)行pcr驗(yàn)證其目的區(qū)段是否敲除,并挑選目的區(qū)段缺失的pcr條帶送出測(cè)序。使用pmkc101及pmkc102均未能得到成功敲除msmeg_5228及大片段msmeg_5990-msmeg_6043的敲除缺失菌株。
如圖20所示的傳統(tǒng)敲除方法p2nil敲除msmeg_5228的pcr驗(yàn)證電泳跑膠圖。隨機(jī)挑選33株敲除菌株進(jìn)行pcr敲除結(jié)果驗(yàn)證,其中共pcr得到有結(jié)果的條帶28個(gè),其pcr得到的條帶大小均與對(duì)照株原始恥垢分枝桿菌mc2155的條帶大小相一致均為1.3kb左右,結(jié)果表明使用傳統(tǒng)方法在敲除臂同樣長(zhǎng)度的情況下未能得到成功敲除msmeg_5228基因的菌株。
如圖21所示的傳統(tǒng)敲除方法p2nil敲除msmeg_5990-msmeg_6043的pcr驗(yàn)證電泳跑膠圖。隨機(jī)挑選33株敲除菌株進(jìn)行pcr敲除結(jié)果驗(yàn)證,由于msmeg_5990-msmeg_6043較大(約46kb),以未成功敲除基因簇菌株的基因組為模板pcr無(wú)法得到條帶。以成功敲除msmeg_5990-msmeg_6043基因簇的菌株基因組為模板應(yīng)得到目的條帶大小為750bp,結(jié)果表明使用傳統(tǒng)方法在敲除臂同樣長(zhǎng)度的情況下未能得到成功敲除msmeg_5990-msmeg_6043基因簇的菌株。
上述的對(duì)實(shí)施例的描述是為便于該技術(shù)領(lǐng)域的普通技術(shù)人員能理解和使用發(fā)明。熟悉本領(lǐng)域技術(shù)的人員顯然可以容易地對(duì)這些實(shí)施例做出各種修改,并把在此說(shuō)明的一般原理應(yīng)用到其他實(shí)施例中而不必經(jīng)過(guò)創(chuàng)造性的勞動(dòng)。因此,本發(fā)明不限于上述實(shí)施例,本領(lǐng)域技術(shù)人員根據(jù)本發(fā)明的揭示,不脫離本發(fā)明范疇所做出的改進(jìn)和修改都應(yīng)該在本發(fā)明的保護(hù)范圍之內(nèi)。
實(shí)施例附圖解釋:
一個(gè)蔗糖平板篩選圖(表明使用蔗糖平板強(qiáng)行去除質(zhì)粒在染色體上的拷貝);
一個(gè)抗性平板篩選圖(代表基因組可能發(fā)生重組去除了質(zhì)粒,因?yàn)榭剐曰蚴呛唾|(zhì)粒共存亡的);
一個(gè)pcr驗(yàn)證圖(這個(gè)圖代表成功敲除片段的效率)。
綜上,
本發(fā)明設(shè)計(jì)的實(shí)施例里包括精準(zhǔn)敲除了一個(gè)基因(代表dna小片段的操作)和敲除了一個(gè)大基因簇(代表了一個(gè)dna大片的的操作),最后還設(shè)計(jì)了上述兩個(gè)操作均用p2nil系統(tǒng)(也就是使用最多的傳統(tǒng)方法)進(jìn)行了效率比較的實(shí)施例,如此代表本發(fā)明操作方法在效率和時(shí)間上是有優(yōu)勢(shì)的。除此之外,本發(fā)明還在敲除5228基因的基礎(chǔ)上繼續(xù)使用pmk90-43質(zhì)粒在此敲除菌的基礎(chǔ)上繼續(xù)敲除90-43基因簇,也獲得了成功,表明本發(fā)明方法可用于基因組的連續(xù)dna操作。
本發(fā)明scetm系統(tǒng)機(jī)理解釋:由本申請(qǐng)的發(fā)明人發(fā)現(xiàn),scem在恥垢分枝桿菌中有活性,可以進(jìn)行基因組編輯,由于各分枝桿菌進(jìn)化上非常接近,基因組相似度較高,必然scem適用于所有分枝桿菌均能實(shí)現(xiàn)基因組層面的dna編輯過(guò)程。由于pbr322的復(fù)制起始區(qū)不能在分枝桿菌中復(fù)制,該質(zhì)粒在電轉(zhuǎn)化后將借助同源重組交換臂整合進(jìn)入分枝桿菌基因組。當(dāng)使用atc作為誘導(dǎo)劑,四環(huán)素啟動(dòng)子將起始scem基因的表達(dá)。當(dāng)誘導(dǎo)表達(dá)scem后,該酶將酶切質(zhì)粒上插入的唯一的酶切位點(diǎn),造成染色體在此位置特異性雙鏈斷裂(dsb),引發(fā)分枝桿菌特異修復(fù)此位點(diǎn),實(shí)現(xiàn)基因或基因組dna片段的編輯功能。本發(fā)明基因編輯原理和過(guò)程與現(xiàn)有的crispr-cas9有一定的相似之處,但在質(zhì)粒構(gòu)建過(guò)程中更為方便,對(duì)于分枝桿菌基因組的單個(gè)位點(diǎn)編輯也更為便捷。
所述scem基因表達(dá)能識(shí)別18個(gè)核苷酸特定序列(attaccctgttatcccta)的歸巢核酸酶。該酶經(jīng)全基因組分析,在恥垢分枝桿菌(mycobacteriumsmegmatis)、結(jié)核分枝桿菌(mycobacteriumtuberculosis)、新金分枝桿菌(mycobacteriumneoaurum)、偶發(fā)分枝桿菌(mycobacteriumfortuitum)、牝牛分枝桿菌(mycobacteriumvaccae)、牛型結(jié)核菌(mycobacteriumbovis)、鳥(niǎo)分枝桿菌(mycobacteriumavium)、麻風(fēng)分枝桿菌(mycobacteriumleprae)、海魚分枝桿菌(mycobacteriummarinum)中均不存在。這些分枝桿菌基因組中均沒(méi)有scem的酶切位點(diǎn),所有以上分枝桿菌理論上均可以使用本發(fā)明設(shè)計(jì)的scetm系統(tǒng)進(jìn)行基因組編輯。
seqidno:1
atgcaccagaagaaccaggtgatgaacctgggcccgaactcgaagctgctgaaggagtacaagtcgcagctgatcgagctgaacatcgagcagttcgaggccggcatcggcctgatcctgggcgacgcctacatccgctcgcgcgacgagggcaagacctactgcatgcagttcgagtggaagaacaaggcctacatggaccacgtgtgcctgctgtacgaccagtgggtgctgtcgccgccgcacaagaagcagcgcgtcaaccacctgggcaacctggtgatcacctggggcgcccagaccttcaagcaccaggccttcaacaagctggccaacctgttcatcgtgaacaacaagaagaccatcccgaacaacctggtggagaactacctgaccccgatgtcgctggcctactggttcatggacgacggcggcaagtgggactacaacaagaactcgaccaacaagtcgatcgtgctgaacacccagtcgttcaccttcgaggaggtggagtacctggtgaagggcctgcgcaacaagttccagctgaactgctacgtgaagatcaacaagaacaagccgatcatctacatcgactcgatgtcgtacctgatcttctacaacctgatcaagccgtacctgatcccgcagatgatgtacaagctgccgaacaccatctcgtcggagaccttcctgaagtga
seqidno:2
ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattttttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggttgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagggcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttggggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgacggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggcgctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgctacagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcctcttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcactatagggcgaattgggtaccgggccccccctcgaggtcgacggtatcgataagcttgatatcgaattcgagctcggtacctcacttcaggaaggtctccgacgagatggtgttcggcagcttgtacatcatctgcgggatcaggtacggcttgatcaggttgtagaagatcaggtacgacatcgagtcgatgtagatgatcggcttgttcttgttgatcttcacgtagcagttcagctggaacttgttgcgcaggcccttcaccaggtactccacctcctcgaaggtgaacgactgggtgttcagcacgatcgacttgttggtcgagttcttgttgtagtcccacttgccgccgtcgtccatgaaccagtaggccagcgacatcggggtcaggtagttctccaccaggttgttcgggatggtcttcttgttgttcacgatgaacaggttggccagcttgttgaaggcctggtgcttgaaggtctgggcgccccaggtgatcaccaggttgcccaggtggttgacgcgctgcttcttgtgcggcggcgacagcacccactggtcgtacagcaggcacacgtggtccatgtaggccttgttcttccactcgaactgcatgcagtaggtcttgccctcgtcgcgcgagcggatgtaggcgtcgcccaggatcaggccgatgccggcctcgaactgctcgatgttcagctcgatcagctgcgacttgtactccttcagcagcttcgagttcgggcccaggttcatcacctggttcttctggtgcatatggcggatcgtgctcatttcgggcggcgaatctctcggcgtcgaaatgatgtatgccgtgctggtcgtacacacgggtactcccagagcctatctatcactgatagggaggacaaactctatcactgatagggagttctcccgctcgtcagagacccttctcacaccgggcctgtgcgtgcgaacgcacagatcaacgccgggatggcgtagagctcactgcgcagcaccgtggggatgcggccgatcatcacgtcgcggatcgtgccgcctcccacggccgtgacggtgccgacgatccaatctgcagcccgggggatctcgtaatattggatcgtcgcaccgggttaagcctggagtgcggtggtgcctggtcggcattttcgcagtcgagggctctcgtgtagcctgggcgagttgccgacgcaggcgaccctcctgccacggatccggtaccatcaggaggaatcacttcgcaatgtcccgcctggacaagtccaaggtcatcaactccgccctggagctgctgaacgaggtcggcatcgagggcctgaccacccgcaagctggcccagaagctgggcgtcgagcagccgaccctgtactggcacgtcaagaacaagcgggccctgctcgacgccctggccatcgagatgttggaccgccaccacacccacttctgcccgctggagggcgagagctggcaggacttcctgcgcaacaacgccaagagcttccgctgcgccttgctgagccaccgcgacggcgccaaggtgcacctgggcacccggccgaccgagaagcagtacgagaccctggagaaccagttggccttcctgtgccagcagggcttctcgctggagaacgcgttgtacgccctgtcggccgtgggccacttcaccctgggctgcgtgttggaggaccaggagcaccaggtcgccaaggaggagcgcgagaccccgaccaccgacagcatgccgccgttgctgcgccaggccatcgagctgttcgaccaccagggcgccgagccggccttcttgttcggcctggagctgatcatctgcggcttggagaagcagctgaagtgcgagagcggctcctaatgaccatggtgacctcatgactcgctagagcggccgccaccgcggtggagctccagcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccac
seqidno:3
ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattttttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggttgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagggcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttggggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgacggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggcgctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgctacagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcctcttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcactatagggcgaattgggtaccgggccccccctcgaggtcgacggtatcgattctagagaataggaacttcggaataggaacttatgagctcagccaatcgactggcgagcggcatcgcattcttcgcatcccgcctctggcggatgcaggaagatcaacggatctcggcccagttgacccagggctgtcgccacaatgtcgcgggagcggatcaaccgagcaaaggcatgaccgactggaccttccttctgaaggctcttctccttgagccacctgtccgccaaggcaaagcgctcacagcagtggtcattctcgagataatcgacgcgtaccaacttgccatcctgaagaatggtgcagtgtctcggcaccccatagggaacctttgccatcaactcggcaagatgcagcgtcgtgttggcatcgtgtcccacgccgaggagaagtacctgcccatcgagttcatggacacgggcgaccgggcttgcaggcgagtgaggtggcaggggcaatggatcagagatgatctgctctgcctgtggccccgctgccgcaaaggcaaatggatgggcgctgcgctttacatttggcaggcgccagaatgtgtcagagacaactccaaggtccggtgtaacgggcgacgtggcaggatcgaacggctcgtcgtccagacctgaccacgagggcatgacgagcgtccctcccggacccagcgcagcacgcagggcctcgatcagtccaagtggcccatcttcgaggggccggacgctacggaaggagctgtggaccagcagcacaccgccgggggtaaccccaaggttgagaagctgaccgatgagctcggcttttcgccattcgtattgcacgacattgcactccaccgctgatgacatcagtcgatcatagcacgatcaacggcactgttgcaaatagtcggtggtgataaacttatcatccccttttgctgatggagctgcacatgaacccattcaaaggccggcattttcagcgtgacatcattctgtgggccgtacgctggtactgcaaatacggcatcagttaccgtgagctgcattttccgctgcataaccctgcttcggggtcattatagcgattttttcggtatatccatcctttttcgcacgatatacaggattttgccaaagggttcgtgtagactttccttggtgtatccaacggcgtcagccgggcaggataggtgaagtaggcccacccgcgagcgggtgttccttcttcactgtcccttattcgcacctggcggtgctcaacgggaatcctgctctgcgaggctggcgggaacttcgaagttcctatactttctagagcgttaattaagcggccgcggtacccaaaaaaagcccgctcattaggcgggctaattcgcctcgaggtggcttatcgaaattaatacgactcactatagggagaccggaagcttcacgtggtcgacggtatcgataagcttgatatcgaattcctgcagcccgggggatcgaaaaggttaggaatacggttagccatttgcctgcttttatatagttatatgggattcacctttatgttgataagaaataaaagaaaatgccaataggatnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnatcggcattttcttttgcgtttttatttgttaactgttaattgtccttgttcaaggatgctgtctttgacaacagatgttttcttgcctttgatgttcagcaggaagcttggcgcaaacgttgattgtttgtctgcgtagaatcctctgtttgtcatatagcttgtaatcacgacattgtttcctttcgcttgaggtacagcgaagtgtgagtaagtaaaggttacatcgttaggatcaagatccatttttaacacaaggccagttttgttcagcggcttgtatgggccagttaaagaattagaaacataaccaagcatgtaaatatcgttagacgtaatgccgtcaatcgtcatttttgatccgcgggagtcagtgaacaggtaccatttgccgttcattttaaagacgttcgcgcgttcaatttcatctgttactgtgttagatgcaatcagcggtttcatcacttttttcagtgtgtaatcatcgtttagctcaatcataccgagagcgccgtttgctaactcagccgtgcgttttttatcgctttgcagaagtttttgactttcttgacggaagaatgatgtgcttttgccatagtatgctttgttaaataaagattcttcgccttggtagccatcttcagttccagtgtttgcttcaaatactaagtatttgtggcctttatcttctacgtagtgaggatctctcagcgtatggttgtcgcctgagctgtagttgccttcatcgatgaactgctgtacattttgatacgtttttccgtcaccgtcaaagattgatttataatcctctacaccgttgatgttcaaagagctgtctgatgctgatacgttaacttgtgcagttgtcagtgtttgtttgccgtaatgtttaccggagaaatcagtgtagaataaacggatttttccgtcagatgtaaatgtggctgaacctgaccattcttgtgtttggtcttttaggatagaatcatttgcatcgaatttgtcgctgtctttaaagacgcggccagcgtttttccagctgtcaatagaagtttcgccgactttttgatagaacatgtaaatcgatgtgtcatccgcatttttaggatctccggctaatgcaaagacgatgtggtagccgtgatagtttgcgacagtgccgtcagcgttttgtaatggccagctgtcccaaacgtccaggccttttgcagaagagatatttttaattgtggacgaatcgaattcaggaacttgatatttttcatttttttgctgttcagggatttgcagcatatcatggcgtgtaatatgggaaatgccgtatgtttccttatatggcttttggttcgtttctttcatatgcgcaaacgcttgagttgcgcctcctgccagcagtgcggtagtaaaggttaatactgttgcttgttttgcaaactttttgatgttcatcgttcatgtctccttttttatgtactgtgttagcggtctgcttcttccagccctcctgtttgaagatggcaagttagttacgcacaataaaaaaagacctaaaatatgtaaggggtgacgccaaagtatcgacctcgagtcaccgggtgacggcaaccccgctacttacgctggccgggcgcagtgcccgcgacggacggctcaagttgtcctcgctgccactcgctgcgacgacgggcctggcctcaccgtcccgacctacgactcaccggtcgcgagtgccaacgttattcttagcactcgcctatgccgagtgcaagaagccccgcaccgggtcatgcccctcgttcgaccttgtcctcggccctccgatccgggtgagtatgttcggcccatgaccgccaacgacaacaagacccgtaaatggtcggccgcagacgtccccgatcaaagcgggcgcgtcgttgtggtcactcgaggggggatcccccctgcccggttattattatttttgacaccagaccaactggtaatggtagcgaccggcgctcagctggaattccgccgatactgacgggctccaggagtcgtcgccaccaatccccatatggaaaccgtcgatattcagccatgtgccttcttccgcgtgcagcagatggcgatggctggtttccatcagttgctgttgactgtagcggctgatgttgaactggaagtcgccgcgccactggtgtgggccataattcaattcgcgcgtcccgcagcgcagaccgttttcgctcgggaagacgtacggggtatacatgtctgacaatggcagatcccagcggtcaaaacaggcggcagtaaggcggtcgggatagttttcttgcggccctaatccgagccagtttacccgctctgctacctgcgccagctggcagttcaggccaatccgcgccggatgcggtgtatcgctcgccacttcaacatcaacggtaatcgccatttgaccactaccatcaatccggtaggttttccggctgataaataaggttttcccctgatgctgccacgcgtgagcggtcgtaatcagcaccgcatcagcaagtgtatctgccgtgcactgcaacaacgctgcttcggcctggtaatggcccgccgccttccagcgttcgacccaggcgttagggtcaatgcgggtcgcttcacttacgccaatgtcgttatccagcggtgcacgggtgaactgatcgcgcagcggcgtcagcagttgttttttatcgccaatccacatctgtgaaagaaagcctgactggcggttaaattgccaacgcttattacccagctcgatgcaaaaatccatttcgctggtggtcagatgcgggatggcgtgggacgcggcggggagcgtcacactgaggttttccgccagacgccactgctgccaggcgctgatgtgcccggcttctgaccatgcggtcgcgttcggttgcactacgcgtactgtgagccagagttgcccggcgctctccggctgcggtagttcaggcagttcaatcaactgtttaccttgtggagcgacatccagaggcacttcaccgcttgccagcggcttaccatccagcgccaccatccagtgcaggagctcgttatcgctatgacggaacaggtattcgctggtcacttcgatggtttgcccggataaacggaactggaaaaactgctgctggtgttttgcttccgtcagcgctggatgcggcgtgcggtcggcaaagaccagaccgttcatacagaactggcgatcgttcggcgtatcgccaaaatcaccgccgtaagccgaccacgggttgccgttttcatcatatttaatcagcgactgatccacccagtcccagacgaagccgccctgtaaacggggatactgacgaaacgcctgccagtatttagcgaaaccgccaagactgttacccatcgcgtgggcgtattcgcaaaggatcagcgggcgcgtctctccaggtagcgaaagccattttttgatggaccatttcggcacagccgggaagggctggtcttcatccacgcgcgcgtacatcgggcaaataatatcggtggccgtggtgtcggctccgccgccttcatactgcaccgggcgggaaggatcgacagatttgatccagcgatacagcgcgtcgtgattagcgccgtggcctgattcattccccagcgaccagatgatcacactcgggtgattacgatcgcgctgcaccattcgcgttacgcgttcgctcatcgccggtagccagcgcggatcatcggtcagacgattcattggcaccatgccgtgggtttcaatattggcttcatccaccacatacaggccgtagcggtcgcacagcgtgtaccacagcggatggttcggataatgcgaacagcgcacggcgttaaagttgttctgcttcatcagcaggatatcctgcaccatcgtctgctcatccatgacctgaccatgcagaggatgatgctcgtgacggttaacgcctcgaatcagcaacggcttgccgttcagcagcagcagaccattttcaatccgcacctcgcggaaaccgacatcgcaggcttctgcttcaatcagcgtgccgtcggcggtgtgcagttcaaccaccgcacgatagagattcgggatttcggcgctccacagtttcgggttttcgacgttcagacgtagtgtgacgcgatcggcataaccaccacgctcatcgataatttcaccgccgaaaggcgcggtgccgctggcgacctgcgtttcaccctgccataaagaaactgttacccgtaggtagtcacgcaactcgccgcacatctgaacttcagcctccagtacagcgcggctgaaatcatcattaaagcgagtggcaacatggaaatcgctgatttgtgtagtcggtttatgcagcaacgagacgtcacggaaaatgccgctcatccgccacatatcctgatcttccagataactgccgtcactccaacgcagcaccatcaccgcgaggcggttttctccggcgcgtaaaaatgcgctcaggtcaaattcagacggcaaacgactgtcctggccgtaaccgacccagcgcccgttgcaccacagatgaaacgccgagttaacgccatcaaaaataattcgcgtctggccttcctgtagccagctttcatcaacattaaatgtgagcgagtaacaacccgtcggattctccgtgggaacaaacggcggattgaccgtaatgggataggttacgttggtgtagatgggcgcatcgtaaccgtgcatctgccagtttgaggggacgacgacagtatcggcctcaggaagatcgcactccagccagctttccggcaccgcttctggtgccggaaaccaggcaaagcgccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcctcttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggttttcccagtcacgacgttgtaaaacgacgggatccattcttgcttccctcatcctcatctcaacgcatccatgcatgtttgggcgcatcctgaattaggtcagactgcaggcgctgggcccggcagtgctcgtgtagtcaaccacaacttcgggcgtccacccgcatcaagcgcaccgccgaaacccttatccggcggtcgttcacggccaattcgggaccgacgcgacggcctgaaggtggcatttccgcagtgtctgggcatgtgtcgtctagagcggccgccaccgcggtggagctcagccagatcctatgtattctatagtgtcacctaaatcgtatgtgtatgatacataaggttatgtattaattgtagccgcgttctaacgacaatatgtacaagcctaattgtgtagcatctggcttactgaagcagaccctatcatctctctcgtaaactgccgtcagagtcggtttggttggacgaaccttctgagtttctggtaacgccgtcccgcacccggaaatggtcagcgaaccaatcagcagggtcatcgctagaaatcatccttagcgaaagctaaggattttttttatctgaattggtaccgcggccgccgggggccgggggcggcgccgggcggcccggggcgtcaggcgccgggggcggtgtccggcggcccccagaggaactgcgccagttcctccggatcggtgaagccggagagatccagcggggtctcctcgaacacctcgaagtcgtgcaggaaggtgaaggcgagcagttcgcgggcgaagtcctcggtccgcttccactgcgccccgtcgagcagcgcggccaggatctcgcggtcgccccggaaggcgttgagatgcagttgcaccaggctgtagcgggagtctcccgcatagacgtcggtgaagtcgacgatcccggtgacctcggtcgcggccaggtccacgaagatgttggtcccgtgcaggtcgccgtggacgaaccggggttcgcggccggccagcagcgtgtccacgtccggcagccagtcctccaggcggtccagcagccggggcgagaggtagccccacccgcggtggtcctcgacggtcgccgcgcggcgttcccgcagcagttccgggaagacctcggaatggggggtgagcacggtgttcccggtcagcggcaccctgtgcagccggccgagcacccggccgagttcgcgggccagggcgagcagcgcgttccggtcggtcgtgccgtccatcgcggaccgccaggtggtgccggtcatccggctcatcaccaggtagggccacggccaggctccggtgccgggccgcagctcgccgcggccgaggaggcggggcaccggcaccggggcgtccgccaggaccgcgtacgcctccgactccgacgcgaggctctccggaccgcaccagtgctcgccgaacagcttgatcaccgggtcgggctcgccgaccagtacggggttggtgctctcgccgggcacccgcagcaccggcggcaccggcagcccgagctcctccagggctcggcgggccagcggctcccagaattcctggtcgttccgcaggctcgcgtaggaatcatccgaatcaatacggtcgagaagtaacagggattcttgtgtcacagcggacctctattcacagggtacgggccggcttaattccgcacggccggtcgcgacacggcctgtccgcaccgcggtcaggcgttgacgatgacgggctggtcggccacgtcggggacgttctcggtggtgctgcggtcgggatcgccaatctctacgggccgaccgaggcgacggtgtacgccaccgcctggttctgcgacggcgaggcgccgccaggccccgccgatcnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnctgcaggcatgcnnnnnnagatccatggatatctagatttaaagatctggtaccgcggccgcttaattaaactagtagatctaagcttgattaccctgttatccctagggttctgcgaggacgacatccacacccacgcatcggcccacgcccgcctgatggacgacggtctgatggcgaccacgggggacgcctaccgcaaccccaaggaccccaacgagccgaagatcggcgaggagatcgcggcggccagggcgctgatcgcgctgggaaccgaactgctgaactcggcgtcgatgcgcatcgaggaaggcacgcaccacccggtgcacctgtaccgctgacccgtggctctggcggtctgcctgctgttcgaccggcgctcggatcgtgcgatccgcgcgttgtgggaccgcatcgagcagcggggtgtggccagcctgcgctcacacacccacggcaggcacgtgccgcacctgtcgtatgcggtgctgcggcagtgggaccaggccgcgatcgctcaggcgttgtccggcaacgggtccggtgccgcggtcgaactgagcttcgacggggtcggggtgttccgccgcggacgcatatggctggtggccggcgtgagcgccgacgtcgcccagcgccagcagcgcgtggtcgacctggtcaccgccaccggtgccgatctgcacaagcactaccggcccggtgtctggctgccgcactgctccctcgcgccgcgagccaccctggcgcaactgcccgacgtcgtggccacggtcatggacgtgttgccgctgcgggtgacgctggaccacgccgcgctggtcgacagttccaccggcacggtgaacccgctgcccgtgctgccctgaactaggcgggccgggcctgcgcctccatctgcttgaacaggtcgacgtagtacggcaggcagtcgacgcgagcctgttcggtggtgaacagcggccggtagccgaggtcgcgggtcgccttggcgatcgagaagtagttgttgaggtaaagacgttccacggcaagcggttccagcagcggatcgcagatgtcgcccgtggcgacctcaagacccgcgtgagcgggcaggggagacggcacgcggtcgaacgaccgcacggcgtacccgcggtccagcagttcggtgaccaggttggcgccgacgaagccggaacccccggtgaccaggatccgcccgaggtcggtggtggagtcagccatgcccgcagcataactgaaacacgttccagtttcgatggtgagcggcgggcactacgcgcatttcagtcctcgtcggcctcgcgggcggcgatcgcctgctcgacgcgctgacgcgctccggctaagtgctcttcacagcgtttcgccagcgcctcgccacgctcccagagctgcagcgaatcatccaagctgagcccaccctgttccagctgctgcaccacggcgaccaactcgtcacgcgcgtcttcatagccgagttcactaatgggcttcatgtcgagctccctgtctcgtcgtcctcagtgccttcgctgcgcgcggtgaccacgccgtcggagacccgcacccgcagtcgggtgcccgccggggcgtcatccgtcgaacgcagcactgtcggcgggccggtgtcgggcaccgcctgcaccacggcgtacccgcgcgcgagcgtcgcggcaggccccagcgccgtcaaccgcgccgagaggtggccgatggtgtcggtctcgcccgcgatcagacgggtgatgtcgcgctgcgccgtcgcgcgggcgcggtggatctcgtcgccgcgcgcggtgatcgcggccagcggttgggccagcacgggcctgctgcgcaactggtcgagatggtgctgctcgaattcgagctcggtacctcacttcaggaaggtctccgacgagatggtgttcggcagcttgtacatcatctgcgggatcaggtacggcttgatcaggttgtagaagatcaggtacgacatcgagtcgatgtagatgatcggcttgttcttgttgatcttcacgtagcagttcagctggaacttgttgcgcaggcccttcaccaggtactccacctcctcgaaggtgaacgactgggtgttcagcacgatcgacttgttggtcgagttcttgttgtagtcccacttgccgccgtcgtccatgaaccagtaggccagcgacatcggggtcaggtagttctccaccaggttgttcgggatggtcttcttgttgttcacgatgaacaggttggccagcttgttgaaggcctggtgcttgaaggtctgggcgccccaggtgatcaccaggttgcccaggtggttgacgcgctgcttcttgtgcggcggcgacagcacccactggtcgtacagcaggcacacgtggtccatgtaggccttgttcttccactcgaactgcatgcagtaggtcttgccctcgtcgcgcgagcggatgtaggcgtcgcccaggatcaggccgatgccggcctcgaactgctcgatgttcagctcgatcagctgcgacttgtactccttcagcagcttcgagttcgggcccaggttcatcacctggttcttctggtgcatatggcggatcgtgctcatttcgggcggcgaatctctcggcgtcgaaatgatgtatgccgtgctggtcgtacacacgggtactcccagagcctatctatcactgatagggaggacaaactctatcactgatagggagttctcccgctcgtcagagacccttctcacaccgggcctgtgcgtgcgaacgcacagatcaacgccgggatggcgtagagctcactgcgcagcaccgtggggatgcggccgatcatcacgtcgcggatcgtgccgcctcccacggccgtgacggtgccgacgatccaatctgcagcccgggggatctcgtaatattggatcgtcgcaccgggttaagcctggagtgcggtggtgcctggtcggcattttcgcagtcgagggctctcgtgtagcctgggcgagttgccgacgcaggcgaccctcctgccacggatccggtaccatcaggaggaatcacttcgcaatgtcccgcctggacaagtccaaggtcatcaactccgccctggagctgctgaacgaggtcggcatcgagggcctgaccacccgcaagctggcccagaagctgggcgtcgagcagccgaccctgtactggcacgtcaagaacaagcgggccctgctcgacgccctggccatcgagatgttggaccgccaccacacccacttctgcccgctggagggcgagagctggcaggacttcctgcgcaacaacgccaagagcttccgctgcgccttgctgagccaccgcgacggcgccaaggtgcacctgggcacccggccgaccgagaagcagtacgagaccctggagaaccagttggccttcctgtgccagcagggcttctcgctggagaacgcgttgtacgccctgtcggccgtgggccacttcaccctgggctgcgtgttggaggaccaggagcaccaggtcgccaaggaggagcgcgagaccccgaccaccgacagcatgccgccgttgctgcgccaggccatcgagctgttcgaccaccagggcgccgagccggccttcttgttcggcctggagctgatcatctgcggcttggagaagcagctgaagtgcgagagcggctcctaatgaccatggtgacctcatgactcgctagagcggccgccaccgcggtggagctccagcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccac
seqidno:4
ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattttttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggttgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagggcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttggggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgacggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggcgctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgctacagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcctcttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcactatagggcgaattgggtaccgggccccccctcgaggtcgacggtatcgattctagagaataggaacttcggaataggaacttatgagctcagccaatcgactggcgagcggcatcgcattcttcgcatcccgcctctggcggatgcaggaagatcaacggatctcggcccagttgacccagggctgtcgccacaatgtcgcgggagcggatcaaccgagcaaaggcatgaccgactggaccttccttctgaaggctcttctccttgagccacctgtccgccaaggcaaagcgctcacagcagtggtcattctcgagataatcgacgcgtaccaacttgccatcctgaagaatggtgcagtgtctcggcaccccatagggaacctttgccatcaactcggcaagatgcagcgtcgtgttggcatcgtgtcccacgccgaggagaagtacctgcccatcgagttcatggacacgggcgaccgggcttgcaggcgagtgaggtggcaggggcaatggatcagagatgatctgctctgcctgtggccccgctgccgcaaaggcaaatggatgggcgctgcgctttacatttggcaggcgccagaatgtgtcagagacaactccaaggtccggtgtaacgggcgacgtggcaggatcgaacggctcgtcgtccagacctgaccacgagggcatgacgagcgtccctcccggacccagcgcagcacgcagggcctcgatcagtccaagtggcccatcttcgaggggccggacgctacggaaggagctgtggaccagcagcacaccgccgggggtaaccccaaggttgagaagctgaccgatgagctcggcttttcgccattcgtattgcacgacattgcactccaccgctgatgacatcagtcgatcatagcacgatcaacggcactgttgcaaatagtcggtggtgataaacttatcatccccttttgctgatggagctgcacatgaacccattcaaaggccggcattttcagcgtgacatcattctgtgggccgtacgctggtactgcaaatacggcatcagttaccgtgagctgcattttccgctgcataaccctgcttcggggtcattatagcgattttttcggtatatccatcctttttcgcacgatatacaggattttgccaaagggttcgtgtagactttccttggtgtatccaacggcgtcagccgggcaggataggtgaagtaggcccacccgcgagcgggtgttccttcttcactgtcccttattcgcacctggcggtgctcaacgggaatcctgctctgcgaggctggcgggaacttcgaagttcctatactttctagagcgttaattaagcggccgcggtacccaaaaaaagcccgctcattaggcgggctaattcgcctcgaggtggcttatcgaaattaatacgactcactatagggagaccggaagcttcacgtggtcgacggtatcgataagcttgatatcgaattcctgcagcccgggggatcgaaaaggttaggaatacggttagccatttgcctgcttttatatagttatatgggattcacctttatgttgataagaaataaaagaaaatgccaataggatnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnatcggcattttcttttgcgtttttatttgttaactgttaattgtccttgttcaaggatgctgtctttgacaacagatgttttcttgcctttgatgttcagcaggaagcttggcgcaaacgttgattgtttgtctgcgtagaatcctctgtttgtcatatagcttgtaatcacgacattgtttcctttcgcttgaggtacagcgaagtgtgagtaagtaaaggttacatcgttaggatcaagatccatttttaacacaaggccagttttgttcagcggcttgtatgggccagttaaagaattagaaacataaccaagcatgtaaatatcgttagacgtaatgccgtcaatcgtcatttttgatccgcgggagtcagtgaacaggtaccatttgccgttcattttaaagacgttcgcgcgttcaatttcatctgttactgtgttagatgcaatcagcggtttcatcacttttttcagtgtgtaatcatcgtttagctcaatcataccgagagcgccgtttgctaactcagccgtgcgttttttatcgctttgcagaagtttttgactttcttgacggaagaatgatgtgcttttgccatagtatgctttgttaaataaagattcttcgccttggtagccatcttcagttccagtgtttgcttcaaatactaagtatttgtggcctttatcttctacgtagtgaggatctctcagcgtatggttgtcgcctgagctgtagttgccttcatcgatgaactgctgtacattttgatacgtttttccgtcaccgtcaaagattgatttataatcctctacaccgttgatgttcaaagagctgtctgatgctgatacgttaacttgtgcagttgtcagtgtttgtttgccgtaatgtttaccggagaaatcagtgtagaataaacggatttttccgtcagatgtaaatgtggctgaacctgaccattcttgtgtttggtcttttaggatagaatcatttgcatcgaatttgtcgctgtctttaaagacgcggccagcgtttttccagctgtcaatagaagtttcgccgactttttgatagaacatgtaaatcgatgtgtcatccgcatttttaggatctccggctaatgcaaagacgatgtggtagccgtgatagtttgcgacagtgccgtcagcgttttgtaatggccagctgtcccaaacgtccaggccttttgcagaagagatatttttaattgtggacgaatcgaattcaggaacttgatatttttcatttttttgctgttcagggatttgcagcatatcatggcgtgtaatatgggaaatgccgtatgtttccttatatggcttttggttcgtttctttcatatgcgcaaacgcttgagttgcgcctcctgccagcagtgcggtagtaaaggttaatactgttgcttgttttgcaaactttttgatgttcatcgttcatgtctccttttttatgtactgtgttagcggtctgcttcttccagccctcctgtttgaagatggcaagttagttacgcacaataaaaaaagacctaaaatatgtaaggggtgacgccaaagtatcgacctcgagtcaccgggtgacggcaaccccgctacttacgctggccgggcgcagtgcccgcgacggacggctcaagttgtcctcgctgccactcgctgcgacgacgggcctggcctcaccgtcccgacctacgactcaccggtcgcgagtgccaacgttattcttagcactcgcctatgccgagtgcaagaagccccgcaccgggtcatgcccctcgttcgaccttgtcctcggccctccgatccgggtgagtatgttcggcccatgaccgccaacgacaacaagacccgtaaatggtcggccgcagacgtccccgatcaaagcgggcgcgtcgttgtggtcactcgaggggggatcccccctgcccggttattattatttttgacaccagaccaactggtaatggtagcgaccggcgctcagctggaattccgccgatactgacgggctccaggagtcgtcgccaccaatccccatatggaaaccgtcgatattcagccatgtgccttcttccgcgtgcagcagatggcgatggctggtttccatcagttgctgttgactgtagcggctgatgttgaactggaagtcgccgcgccactggtgtgggccataattcaattcgcgcgtcccgcagcgcagaccgttttcgctcgggaagacgtacggggtatacatgtctgacaatggcagatcccagcggtcaaaacaggcggcagtaaggcggtcgggatagttttcttgcggccctaatccgagccagtttacccgctctgctacctgcgccagctggcagttcaggccaatccgcgccggatgcggtgtatcgctcgccacttcaacatcaacggtaatcgccatttgaccactaccatcaatccggtaggttttccggctgataaataaggttttcccctgatgctgccacgcgtgagcggtcgtaatcagcaccgcatcagcaagtgtatctgccgtgcactgcaacaacgctgcttcggcctggtaatggcccgccgccttccagcgttcgacccaggcgttagggtcaatgcgggtcgcttcacttacgccaatgtcgttatccagcggtgcacgggtgaactgatcgcgcagcggcgtcagcagttgttttttatcgccaatccacatctgtgaaagaaagcctgactggcggttaaattgccaacgcttattacccagctcgatgcaaaaatccatttcgctggtggtcagatgcgggatggcgtgggacgcggcggggagcgtcacactgaggttttccgccagacgccactgctgccaggcgctgatgtgcccggcttctgaccatgcggtcgcgttcggttgcactacgcgtactgtgagccagagttgcccggcgctctccggctgcggtagttcaggcagttcaatcaactgtttaccttgtggagcgacatccagaggcacttcaccgcttgccagcggcttaccatccagcgccaccatccagtgcaggagctcgttatcgctatgacggaacaggtattcgctggtcacttcgatggtttgcccggataaacggaactggaaaaactgctgctggtgttttgcttccgtcagcgctggatgcggcgtgcggtcggcaaagaccagaccgttcatacagaactggcgatcgttcggcgtatcgccaaaatcaccgccgtaagccgaccacgggttgccgttttcatcatatttaatcagcgactgatccacccagtcccagacgaagccgccctgtaaacggggatactgacgaaacgcctgccagtatttagcgaaaccgccaagactgttacccatcgcgtgggcgtattcgcaaaggatcagcgggcgcgtctctccaggtagcgaaagccattttttgatggaccatttcggcacagccgggaagggctggtcttcatccacgcgcgcgtacatcgggcaaataatatcggtggccgtggtgtcggctccgccgccttcatactgcaccgggcgggaaggatcgacagatttgatccagcgatacagcgcgtcgtgattagcgccgtggcctgattcattccccagcgaccagatgatcacactcgggtgattacgatcgcgctgcaccattcgcgttacgcgttcgctcatcgccggtagccagcgcggatcatcggtcagacgattcattggcaccatgccgtgggtttcaatattggcttcatccaccacatacaggccgtagcggtcgcacagcgtgtaccacagcggatggttcggataatgcgaacagcgcacggcgttaaagttgttctgcttcatcagcaggatatcctgcaccatcgtctgctcatccatgacctgaccatgcagaggatgatgctcgtgacggttaacgcctcgaatcagcaacggcttgccgttcagcagcagcagaccattttcaatccgcacctcgcggaaaccgacatcgcaggcttctgcttcaatcagcgtgccgtcggcggtgtgcagttcaaccaccgcacgatagagattcgggatttcggcgctccacagtttcgggttttcgacgttcagacgtagtgtgacgcgatcggcataaccaccacgctcatcgataatttcaccgccgaaaggcgcggtgccgctggcgacctgcgtttcaccctgccataaagaaactgttacccgtaggtagtcacgcaactcgccgcacatctgaacttcagcctccagtacagcgcggctgaaatcatcattaaagcgagtggcaacatggaaatcgctgatttgtgtagtcggtttatgcagcaacgagacgtcacggaaaatgccgctcatccgccacatatcctgatcttccagataactgccgtcactccaacgcagcaccatcaccgcgaggcggttttctccggcgcgtaaaaatgcgctcaggtcaaattcagacggcaaacgactgtcctggccgtaaccgacccagcgcccgttgcaccacagatgaaacgccgagttaacgccatcaaaaataattcgcgtctggccttcctgtagccagctttcatcaacattaaatgtgagcgagtaacaacccgtcggattctccgtgggaacaaacggcggattgaccgtaatgggataggttacgttggtgtagatgggcgcatcgtaaccgtgcatctgccagtttgaggggacgacgacagtatcggcctcaggaagatcgcactccagccagctttccggcaccgcttctggtgccggaaaccaggcaaagcgccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcctcttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggttttcccagtcacgacgttgtaaaacgacgggatccattcttgcttccctcatcctcatctcaacgcatccatgcatgtttgggcgcatcctgaattaggtcagactgcaggcgctgggcccggcagtgctcgtgtagtcaaccacaacttcgggcgtccacccgcatcaagcgcaccgccgaaacccttatccggcggtcgttcacggccaattcgggaccgacgcgacggcctgaaggtggcatttccgcagtgtctgggcatgtgtcgtctagagcggccgccaccgcggtggagctcagccagatcctatgtattctatagtgtcacctaaatcgtatgtgtatgatacataaggttatgtattaattgtagccgcgttctaacgacaatatgtacaagcctaattgtgtagcatctggcttactgaagcagaccctatcatctctctcgtaaactgccgtcagagtcggtttggttggacgaaccttctgagtttctggtaacgccgtcccgcacccggaaatggtcagcgaaccaatcagcagggtcatcgctagaaatcatccttagcgaaagctaaggattttttttatctgaattggtaccgcggccgccgggggccgggggcggcgccgggcggcccggggcgtcaggcgccgggggcggtgtccggcggcccccagaggaactgcgccagttcctccggatcggtgaagccggagagatccagcggggtctcctcgaacacctcgaagtcgtgcaggaaggtgaaggcgagcagttcgcgggcgaagtcctcggtccgcttccactgcgccccgtcgagcagcgcggccaggatctcgcggtcgccccggaaggcgttgagatgcagttgcaccaggctgtagcgggagtctcccgcatagacgtcggtgaagtcgacgatcccggtgacctcggtcgcggccaggtccacgaagatgttggtcccgtgcaggtcgccgtggacgaaccggggttcgcggccggccagcagcgtgtccacgtccggcagccagtcctccaggcggtccagcagccggggcgagaggtagccccacccgcggtggtcctcgacggtcgccgcgcggcgttcccgcagcagttccgggaagacctcggaatggggggtgagcacggtgttcccggtcagcggcaccctgtgcagccggccgagcacccggccgagttcgcgggccagggcgagcagcgcgttccggtcggtcgtgccgtccatcgcggaccgccaggtggtgccggtcatccggctcatcaccaggtagggccacggccaggctccggtgccgggccgcagctcgccgcggccgaggaggcggggcaccggcaccggggcgtccgccaggaccgcgtacgcctccgactccgacgcgaggctctccggaccgcaccagtgctcgccgaacagcttgatcaccgggtcgggctcgccgaccagtacggggttggtgctctcgccgggcacccgcagcaccggcggcaccggcagcccgagctcctccagggctcggcgggccagcggctcccagaattcctggtcgttccgcaggctcgcgtaggaatcatccgaatcaatacggtcgagaagtaacagggattcttgtgtcacagcggacctctattcacagggtacgggccggcttaattccgcacggccggtcgcgacacggcctgtccgcaccgcggtcaggcgttgacgatgacgggctggtcggccacgtcggggacgttctcggtggtgctgcggtcgggatcgccaatctctacgggccgaccgaggcgacggtgtacgccaccgcctggttctgcgacggcgaggcgccgccaggccccgccgatcnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnctgcaggcatgcnnnnnnagatccatggatatctagatttaaagatctggtaccgcggccgcttaattaaactagtagatctaagcttgattaccctgttatccctaggttgctgaggcggtgaatgagccggcaccgccggaggcggtgaataggcgggcaccggcggttgcggcgggtagccggccgcgggatatcccggcgggctccacggcggcgtcgtcggcggagatggcggaggaggcggcgtcggcatcagccgcgccagttcgcggcggtgccgctcggcgagcacggccgccagcacgcactgcggcggcgcgcccggcgggggcggtggggagatccgcgacgccacctcgccgaggatgcgctggcccatcatgtcgcggatgcgggggtcgagatgctgcgcacggttcaggtactgccgcgcgagttcggcctgctcgggtcccagcccggacaactgcaacgacgacgcccaccacgccagggcgggcggcatggccggcggcggttgcatgcgtggcccacgctcgctgatcacgaccgtcccggcgaagatgtcgccgatacgtttgcctttcgacgacagcagactgcagatcaccgcggggccaccggtcagcatccagatctcgatgaagcccgagataccgcgaaacagcgcctgacggaagcgttccgggctgccgtcctcggacaccacccgtaacccgagcgccatcttgcccagggaccggccgcgcgtggcggtctccatgatcaccggatagccgacgatggccagcaccgtgaagatgatcaggatcgccgcggacaacgcctcgtccaactgggtcagcgtgatcgaccacagcagcacaccgaccacgtagaagatgaagatcgcgaagatgtcgatgaggatcgccagtacacgaacgggtagctgcgcgatcgacacgtccaggaccacggcgtccccggtcaccaccggctcgggctgggagaccataacgccccacgttaggcgattaagctcggccgagtggatgtcgatggctcgatgaccggggtgcggtcacggtcgaggcggcgttcgcgatcgcggcgctcgtggctgtgctggcgttgtgtgccggtgggctcagcgcgatctcgatgcaggtgcgctgtgtcgacgccgcgcgtgaggcggcgcggttggcggcacgcggtgacgggtccgccgcggaggtggcccggcgtatcgcgccgcgtggggcgttggtcgaggttcgcggcgacggggtgttcctggtggcccgcgtcagcgtcgatgcgccgttgccggggttcaccatcgctgccgaggcggcatcggcccgggaacctggcgtctgaccagcgtggcgtggccagtgtcatcgcggtcgcgatgatcgccgcactcctggtcctcgcaggcggtttcgcctatctcggtgccgcggtggtggcgcggcaccggtcccaggcggctgccgatctggcggcattggcggcggcgaatgtcgtggcggccgggcccgcggcggcgtgtgaacaggccgggcaggtcgcccgcaggatgcgcagcggtgtcgcggcgtgccgggtcgaggatctcgatgtggtgctcacggtcgaggtggccgtcgcgctggggcgctgggacatcggtccggccagggcatccgcgcgtgccggcccggtggggtgacacattccgcgagtgtgaagcctctgcgacgttccgcgcgatttctcgcagagacttcacactcgcgagtgcgtcgagcgcggctcaacccgaatccgcgccgacgatctcggcgtcactgggcaaccgcagcgccagcagcccggcataggtgccgggttcgagttccacgcggttgatcgtcatgtgcacggactgccaaccagaattcgagctcggtacctcacttcaggaaggtctccgacgagatggtgttcggcagcttgtacatcatctgcgggatcaggtacggcttgatcaggttgtagaagatcaggtacgacatcgagtcgatgtagatgatcggcttgttcttgttgatcttcacgtagcagttcagctggaacttgttgcgcaggcccttcaccaggtactccacctcctcgaaggtgaacgactgggtgttcagcacgatcgacttgttggtcgagttcttgttgtagtcccacttgccgccgtcgtccatgaaccagtaggccagcgacatcggggtcaggtagttctccaccaggttgttcgggatggtcttcttgttgttcacgatgaacaggttggccagcttgttgaaggcctggtgcttgaaggtctgggcgccccaggtgatcaccaggttgcccaggtggttgacgcgctgcttcttgtgcggcggcgacagcacccactggtcgtacagcaggcacacgtggtccatgtaggccttgttcttccactcgaactgcatgcagtaggtcttgccctcgtcgcgcgagcggatgtaggcgtcgcccaggatcaggccgatgccggcctcgaactgctcgatgttcagctcgatcagctgcgacttgtactccttcagcagcttcgagttcgggcccaggttcatcacctggttcttctggtgcatatggcggatcgtgctcatttcgggcggcgaatctctcggcgtcgaaatgatgtatgccgtgctggtcgtacacacgggtactcccagagcctatctatcactgatagggaggacaaactctatcactgatagggagttctcccgctcgtcagagacccttctcacaccgggcctgtgcgtgcgaacgcacagatcaacgccgggatggcgtagagctcactgcgcagcaccgtggggatgcggccgatcatcacgtcgcggatcgtgccgcctcccacggccgtgacggtgccgacgatccaatctgcagcccgggggatctcgtaatattggatcgtcgcaccgggttaagcctggagtgcggtggtgcctggtcggcattttcgcagtcgagggctctcgtgtagcctgggcgagttgccgacgcaggcgaccctcctgccacggatccggtaccatcaggaggaatcacttcgcaatgtcccgcctggacaagtccaaggtcatcaactccgccctggagctgctgaacgaggtcggcatcgagggcctgaccacccgcaagctggcccagaagctgggcgtcgagcagccgaccctgtactggcacgtcaagaacaagcgggccctgctcgacgccctggccatcgagatgttggaccgccaccacacccacttctgcccgctggagggcgagagctggcaggacttcctgcgcaacaacgccaagagcttccgctgcgccttgctgagccaccgcgacggcgccaaggtgcacctgggcacccggccgaccgagaagcagtacgagaccctggagaaccagttggccttcctgtgccagcagggcttctcgctggagaacgcgttgtacgccctgtcggccgtgggccacttcaccctgggctgcgtgttggaggaccaggagcaccaggtcgccaaggaggagcgcgagaccccgaccaccgacagcatgccgccgttgctgcgccaggccatcgagctgttcgaccaccagggcgccgagccggccttcttgttcggcctggagctgatcatctgcggcttggagaagcagctgaagtgcgagagcggctcctaatgaccatggtgacctcatgactcgctagagcggccgccaccgcggtggagctccagcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccac