專利名稱:對(duì)大腸桿菌o35型的o-抗原特異的核苷酸的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及大腸桿菌O35型(Escherichia coli O35)中控制O-抗原合成的基因簇的核苷酸全序列,特別是涉及大腸桿菌O35型中控制O-抗原合成的基因簇中的寡核苷酸,可利用這些對(duì)O-抗原特異的寡核苷酸快速、準(zhǔn)確地檢測(cè)人體及環(huán)境中的大腸桿菌O35型并鑒定這些致病菌中的O-抗原。
背景技術(shù):
O-抗原是革蘭氏陰性細(xì)菌脂多糖中的O特異性多糖成分,它由許多重復(fù)的寡糖單位組成。O-抗原的合成過程研究得較清楚先由糖基轉(zhuǎn)移酶將核苷二磷酸單糖轉(zhuǎn)移到一個(gè)固定在細(xì)胞內(nèi)膜的脂分子上,然后在內(nèi)膜的內(nèi)側(cè)合成寡糖單位,O-抗原的寡糖單位再通過轉(zhuǎn)運(yùn)酶被轉(zhuǎn)移到內(nèi)膜外側(cè),而后通過聚合酶聚合成多糖,再被連接到一個(gè)糖脂分子上形成脂多糖分子[Whitfield,C.(1995)“Biosynthesis of lipopolysaccharide O antigens”.Trends inMicrobiology.3178-185;Schnaitman,C.A.and J.D.Klena.(1993)“Genetics oflipopolysaccharide biosynthesis in entericbacteria ”.MicrobiologicalReviews,57(3)655-682]。編碼負(fù)責(zé)O-抗原合成的所有酶分子的基因一般在染色體上相鄰排列,形成一個(gè)基因簇[Reeves,P.R.,et al.(1981)“Bacterialpolysaccharide synthesis and gene nomenclature”Trends in Microbiology,4495-503]。在志賀氏菌、大腸桿菌和沙門氏菌中,O-抗原基因簇位于galF和gnd基因之間[Lei Wang.et al(2001)“Sequence analysis of four Schigella boydii O-antigenlociimplication for Escherichia coli and Schigella relationships”.Infection andImmunity,116923-6930;Lei Wang and Peter Reeves(2000)“The Escherichia coliO111 and Salmonella enterica O35 gene clustersgene clusters encoding the samecolitose-containing O antigen are highly conserved”.Journal ofBacteriology.1825256-5261]。O-抗原基因簇含有三類基因糖合成路徑基因,糖基轉(zhuǎn)移酶基因,寡糖單位處理基因,其中糖合成路徑基因編碼的酶合成O-抗原所需的核苷二磷酸單糖;糖基轉(zhuǎn)移酶基因編碼的酶將核苷二磷酸單糖及其它分子轉(zhuǎn)到單糖上從而使單糖聚合成寡糖單位;寡糖單位處理基因包括轉(zhuǎn)運(yùn)酶基因和聚合酶基因,它們將寡糖單位轉(zhuǎn)移到細(xì)菌內(nèi)膜外側(cè),再聚合成多糖。糖基轉(zhuǎn)移酶基因和寡糖單位處理基因只存在于攜帶這些基因的基因簇里。O-抗原中單糖的不同,單糖間聯(lián)結(jié)鍵的不同和寡糖單位之間聯(lián)結(jié)鍵的不同構(gòu)成了O-抗原的多樣性,而單糖的組成、單糖間的聯(lián)結(jié)鍵及寡糖單位之間的聯(lián)結(jié)鍵是由O-抗原基因簇中的基因控制著,所以O(shè)-抗原基因簇決定了O-抗原的合成,也決定了O-抗原的多樣性。
因?yàn)镺-抗原是極強(qiáng)的抗原,是大腸桿菌重要的致病因素之一,同時(shí)它又具有極強(qiáng)的多樣性,這啟示我們能研究一種快速、準(zhǔn)確地檢測(cè)大腸桿菌及其O-抗原的特異性好、靈敏度高的方法。以表面多糖為目標(biāo)的血清學(xué)免疫反應(yīng)自上世紀(jì)30年代以來一直被用于對(duì)細(xì)菌的分型和鑒定,是鑒定致病菌的唯一的手段。這種診斷方法需要大量的抗血清,而抗血清一般種類不全,數(shù)量不足,大量的抗血清在制備和儲(chǔ)存中也存在一些困難。另一方面此法耗時(shí)長、靈敏度低、漏檢率高、準(zhǔn)確性差,所以,現(xiàn)在普遍認(rèn)為這種傳統(tǒng)的血清學(xué)檢測(cè)方法將為現(xiàn)代分子生物學(xué)方法取代。1993年,Luk,J.M.C et.al用沙門氏菌(S.enterica)O-抗原基因簇的特異核苷酸序列通過PCR方法鑒定了沙門氏菌的O-抗原[Luk,J.M.C.et.al.(1993)“Selective amplification of abequose andparatose synthase genes(rfb)by polymerase chain reaction for identification ofS.enterica major serogroups(A,B,C2,andD)”,J.Clin.Microbiol.312118-2123]。Luk,et.al的方法是將相應(yīng)于沙門氏菌血清型E1,D1,A,B和C2的O-抗原內(nèi)的CDP-阿比可糖和CDP-泰威糖的合成基因的核苷酸序列排列后得到對(duì)不同血清型的沙門氏菌特異的寡核苷酸。1981年,Paton,A.W et.al用對(duì)E.coli O111的O-抗原特異的源于wbdI基因的寡核苷酸鑒定了一株產(chǎn)毒素的E.coli O111的血清型[“Molecular microbiological investigation of an outbreak of Hemolytic-Uremic Syndrome caused by dry fermented sausage contaminated with Shiga-liketoxin producing Escherichia coli”.J.Clin.Microbiol.341622-1627],但是后來的研究表明Paton,A.W et.al的用源于wbdI基因的寡核苷酸鑒定E.coli O111的血清型的方法有假陽性結(jié)果出現(xiàn)。Bastin D.A.and Reeves,P.R.認(rèn)為,這是由于wbdI基因是一個(gè)推測(cè)的糖合成路徑基因[Bastin D.A.andReeves,P.R.(1995)Sequence and analysis of the O antigen gene(rfb)cluster ofEscherichia coli O111.Gene 16417-23],而在其它細(xì)菌的O-抗原的結(jié)構(gòu)中也可能有這個(gè)糖,所以糖合成路徑基因?qū)τ贠-抗原并不是高度特異的志賀氏菌有46種血清型,但只有33種不同的O-抗原,大腸桿菌有166種不同的O-抗原[Reeves,P.R(1992)“Variation in O antigens,niche specificselection and bacterial populations”.FEMS Microbiol.Lett,100509-516],二者親緣關(guān)系非常近,并且有12種是大腸桿菌和志賀氏菌共有的[Ewing,W.H.(1986)“Edwards and Ewing’s identification of the Enterobacteriaceae”.Elsevier SciencePublishers,Amsterdam,The Netherlands;T.cheasty,et al.(1983)“Antigenicrelationships between the enteroinvasive Escherichia coli antigensO28ac,O112ac,O124,O136,O143,O144,O152 and and Shigella O antigens”J.clinMicrobiol,17(4)681-684]發(fā)明內(nèi)容本發(fā)明的目的是提供了一種對(duì)大腸桿菌O35型的O-抗原特異的核苷酸。它是大腸桿菌O35型的O-抗原基因簇中的核苷酸,是源于糖基轉(zhuǎn)移酶基因和轉(zhuǎn)運(yùn)酶基因及聚合酶基因的特異的核苷酸。
本發(fā)明的次一目的是提供了大腸桿菌O35型的O-抗原基因簇的全長核苷酸序列。
本發(fā)明的另一目的是提供了構(gòu)成大腸桿菌O35型的O-抗原基因簇的基因轉(zhuǎn)運(yùn)酶的基因即wzx基因或與wzx有相似功能的基因;聚合酶基因即wzy基因或與wzy有相似功能的基因;糖鼠李糖合成酶基因rmLBDAC,包括rmLBDAC基因或與rmLBDAC有相似功能的基因;UDP-GalNAcA(N)合成酶基因gna,gne,orf8或與gna,gne,orf8有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf9,orf10,orf12基因。
本發(fā)明的又一目的是提供了寡核苷酸,它們分別源于大腸桿菌O35型源于編碼轉(zhuǎn)運(yùn)酶的基因即wzx基因或與wzx有相似功能的基因;源于編碼聚合酶的基因即wzy基因或與wzy有相似功能的基因;它們是上述基因內(nèi)的寡核苷酸,長度在10-20nt;它們對(duì)大腸桿菌O35型的O-抗原是特異的;尤其是表1中列出的寡核苷酸,它們對(duì)大腸桿菌O35型的O-抗原是高度特異的,而且這些寡核苷酸還可重新組合,組合后的寡核苷酸對(duì)大腸桿菌O35型的O-抗原也是高度特異的。
本發(fā)明的再一目的是提供的上述寡核苷酸可作為引物用于核酸擴(kuò)增反應(yīng),或者作為探針用于雜交反應(yīng),或者用于制造基因芯片或微陣列,從而通過這些方法檢測(cè)和鑒定大腸桿菌O35型的O-抗原及檢測(cè)和鑒定大腸桿菌O35型。
本發(fā)明的還一目的是提供了分離大腸桿菌O35型的O-抗原基因簇的全序列的方法。按照本方法操作可以獲得其他細(xì)菌的O-抗原基因簇的全序列,也可以獲得編碼其他多糖抗原的細(xì)菌的基因簇的全序列。
本發(fā)明的目的是由以下技術(shù)方案實(shí)現(xiàn)的。
本發(fā)明對(duì)大腸桿菌O35型的O-抗原特異的核苷酸,其是如SEQ ID NO1所示的分離的核苷酸,全長14060個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。
前述的對(duì)大腸桿菌O35型的O-抗原特異的核苷酸,其由12個(gè)基因組成,都位于galF基因和gnd基因之間。
前述的對(duì)大腸桿菌O35型的O-抗原特異的核苷酸,其中所述的基因是轉(zhuǎn)運(yùn)酶的基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因wzy基因或與wzy有相似功能的基因;鼠李糖合成酶基因rmLBDAC,包括rmLBDAC基因或與rmLBDAC有相似功能的基因;UDP-GalNAcA(N)合成酶基因gna,gne,orf8或與gna,gne,orf8有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf9、orf10、orf12基因;其中所述的基因wzx是SEQ ID NO1中的6678至7883堿基的核苷酸;wzy是SEQ ID NO1中的11326至12348堿基的核苷酸;rmLBDAC基因分別是SEQ ID NO1中的745至1830,1830至2726,2787至3665,3668至4213堿基的核苷酸;Gna是SEQ ID NO1中的4244至5518堿基的核苷酸;Gne是SEQ ID NO1中的5543至6565堿基的核苷酸;orf8是SEQ ID NO1中的7871至9715堿基的核苷酸;orf9是SEQ ID NO1中的9712至10461堿基的核苷酸;orf10是SEQ ID NO1中的10463至11329堿基的核苷酸;orf12是SEQ ID NO1中的12370至13155堿基的核苷酸。
前述的對(duì)大腸桿菌O35型的O-抗原特異的核苷酸,其中它是源于所述的wzx基因、wzy基因、rmLBDAC基因和gna,gne,orf8;或糖基轉(zhuǎn)移酶基因orf9、orf10、orf12基因;以及它們的混合或它們的重組。
前述的對(duì)大腸桿菌O35型的O-抗原特異的核苷酸,其中所述的源于wzx基因的寡核苷酸對(duì)是SEQ ID NO1中的7301至7319堿基的核苷酸和7778至7796堿基的核苷酸;SEQ ID NO1中的6740至6758堿基的核苷酸和7275至7293堿基的核苷酸。源于wzy基因的寡核苷酸對(duì)是SEQ ID NO1中的11785至11803堿基的核苷酸和12297至12315堿基的核苷酸;SEQ ID NO1中的11706至11726堿基的核苷酸和11936至11964堿基的核苷酸。
前述的對(duì)大腸桿菌O35型的O-抗原特異的核苷酸在檢測(cè)表達(dá)O-抗原的細(xì)菌、在診斷中鑒定細(xì)菌的O-抗原和細(xì)菌的其它多糖抗原的應(yīng)用。
前述的對(duì)大腸桿菌O35型的O-抗原特異的核苷酸的重組分子,而且通過插入表達(dá)可提供表達(dá)大腸桿菌O35型的O-抗原,并成為細(xì)菌疫苗。
前述的對(duì)大腸桿菌O35型的O-抗原特異的核苷酸的應(yīng)用,其中它作為引物用于PCR、作為探針用于雜交反應(yīng)與熒光檢測(cè)、或者用于制造基因芯片或微陣列,檢測(cè)人體和環(huán)境中的細(xì)菌。
前述的對(duì)大腸桿菌O35型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O35型,離心收集細(xì)胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細(xì)胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時(shí),再加入3ul 10mg/ml的RNase,65℃溫育30分鐘,加等體積酚抽提混合物,取上清液再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提兩次,取上清液再用等體積的乙醚抽提以除去殘余的酚。上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,將DNA重懸于30ul TE中;基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測(cè);(2)通過PCR擴(kuò)增大腸桿菌O35型中的O-抗原基因簇以大腸桿菌O35型的基因組為模板通過Long PCR擴(kuò)增其O-抗原基因簇,首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇啟動(dòng)子區(qū)的JumpStart序列設(shè)計(jì)上游引物(#1523-ATT GTGGCT GCA GGG ATC AAA GAA AT),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計(jì)下游引物(#1524-TAG TCG CGT GNG CCT GGA TTA AGT TCG C);用Boehringer Mannheim公司的Expand Long Template PCR方法擴(kuò)增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘;然后94℃變性10秒,60℃退火15秒,68℃延伸15分鐘,這樣進(jìn)行30個(gè)循環(huán),最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測(cè)PCR產(chǎn)物的大小及其特異性,合并5管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫,反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進(jìn)行,酶切10分鐘使DNA片段大小集中在1.5kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng)。合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中,隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃30分鐘,將酶切產(chǎn)物補(bǔ)成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴(kuò)大為80ul,70℃反應(yīng)20分鐘,使DNA的3′端加dA尾。此混合物經(jīng)等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接10小時(shí),總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶,最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物;用Bi0-Rad公司的電轉(zhuǎn)化感受態(tài)細(xì)胞的制備方法制備感受態(tài)大腸桿菌DH5α細(xì)胞,取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到Bi0-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時(shí)間為5.0毫秒至6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上,在37℃過夜培養(yǎng),次日得到藍(lán)白菌落,將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時(shí)從每個(gè)克隆中提取質(zhì)粒,并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構(gòu)成了大腸桿菌O35型的O-抗原基因簇文庫;(4)對(duì)文庫中的克隆測(cè)序從文庫中挑選插入片段在1kb以上的96個(gè)克隆用本實(shí)驗(yàn)室ABI3730型DNA自動(dòng)測(cè)序儀對(duì)克隆中的插入片段進(jìn)行測(cè)序,序列達(dá)到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學(xué)實(shí)驗(yàn)室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O35型的O-抗原基因簇的核苷酸全長序列;序列的質(zhì)量主要由兩個(gè)方面來保證1)對(duì)大腸桿菌O35型的基因組作5個(gè)Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫,2)對(duì)每個(gè)堿基,保證3個(gè)以上高質(zhì)量的覆蓋率,在得到大腸桿菌O35型O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心(The National Center forBiotechnology Information,NCBI)的orffinder發(fā)現(xiàn)基因,找到7個(gè)開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對(duì),最后得到大腸桿菌O35型的O-抗原基因簇的結(jié)構(gòu);(6)特異基因篩選針對(duì)痢大腸桿菌O35型的O-抗原基因簇中的wzx、wzy基因設(shè)計(jì)引物;在每個(gè)基因內(nèi)各設(shè)計(jì)了兩對(duì)引物,每對(duì)引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進(jìn)行PCR,除在第13組中得到了預(yù)期大小的一條帶外,在其他組中都沒有擴(kuò)增到任何產(chǎn)物,所以wzx、wzy基因?qū)Υ竽c桿菌O35型的O-抗原都是高度特異的。
也就是,本發(fā)明的第一個(gè)方面,提供了大腸桿菌O35型的O-抗原基因簇的全長核苷酸序列,它的全序列如SEQ ID NO1所示,全長14060個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。通過本發(fā)明的方法得到了大腸桿菌O35型的O-抗原基因簇的結(jié)構(gòu),如表3所示,它總共由12個(gè)基因組成,都位于galF基因和gnd基因之間。
本發(fā)明的第二個(gè)方面,提供了大腸桿菌O35型的O-抗原基因簇中的基因,即轉(zhuǎn)運(yùn)酶基因(wzx基因或與wzx有相似功能的基因);聚合酶基因(wzy基因或與wzy有相似功能的基因);糖合成酶基因(rmLBDAC,包括rmLBDAC基因或與rmLBDAC有相似功能的基因;合成酶基因gna,gne,orf8或與gna,gne,orf8有相似功能的基因);糖基轉(zhuǎn)移酶基因(orf9、orf10、orf12);細(xì)菌多糖抗原中特殊的糖合成路徑基因,包括gne基因。它們?cè)贠-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在表4中;本發(fā)明尤其涉及到糖基轉(zhuǎn)移酶基因、轉(zhuǎn)運(yùn)酶基因和聚合酶基因,因?yàn)樘呛铣陕窂交蚣春铣珊塑斩姿釂翁堑幕颥F(xiàn)在被預(yù)示對(duì)較多胞外多糖是常見的、共同的,對(duì)細(xì)菌的O-抗原并不是很特異的,而本發(fā)明涉及到的轉(zhuǎn)運(yùn)酶基因和聚合酶基因?qū)Υ竽c桿菌O35型的O-抗原是高度特異的。
本發(fā)明的第三個(gè)方面,提供了源于大腸桿菌O35型的O-抗原基因簇中的wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因、rmLBDAC,包括rmLBDAC基因或與rmLBDAC有相似功能的基因;GalNAcA(N)合成酶基因gna,gne,orf8或與gna,gne,orf8有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf9、orf10、orfi2基因和一個(gè)未知功能的基因orf7寡核苷酸,它們是這些基因中的任何一段寡核苷酸。但是,優(yōu)先被用的是列于表1中的寡核苷酸對(duì),在表1中也列出了這些寡核苷酸對(duì)在O-抗原基因簇中的位置及以這些寡核苷酸對(duì)為引物所做的PCR反應(yīng)的產(chǎn)物的大小,這些PCR反應(yīng)可用表中的退火溫度進(jìn)行。這些引物除在第13組中得到了預(yù)期大小的一條帶外,在其他組中都沒有擴(kuò)增到任何產(chǎn)物,所以wzx、wzy基因?qū)Υ竽c桿菌O35型的O-抗原都是高度特異的。
所述的對(duì)大腸桿菌O35型的O-抗原特異的核苷酸的分離方法包括下述步驟1)基因組的提??;2)PCR擴(kuò)增大腸桿菌O35型中的O-抗原基因簇;3)構(gòu)建O-抗原基因簇文庫;4)對(duì)文庫中的克隆測(cè)序;5)核苷酸序列的拼接及分析;6)特異基因的篩選。
本發(fā)明的其他方面由于本文技術(shù)的公開,對(duì)本領(lǐng)域的技術(shù)人員而言是顯而易見的。
如本發(fā)明所用,“寡核苷酸”主要指來源于O-抗原基因簇中的編碼糖基轉(zhuǎn)移酶的基因、編碼轉(zhuǎn)運(yùn)酶的基因和編碼聚合酶的基因內(nèi)的一段核苷酸分子,它們?cè)陂L度上可改變,一般在10到20個(gè)核苷酸范圍內(nèi)改變;更確切說這些寡核苷酸是源于wzx基因(核苷酸位置是從SEQ ID NO1中的6678至7883堿基的核苷酸);wzy基因(核苷酸位置是從SEQ ID NO1中的11326至12348堿基的核苷酸);源于以上基因內(nèi)的寡核苷酸對(duì)大腸桿菌O35型是高度特異的。
此外,有時(shí)兩個(gè)遺傳相似的編碼不同O-抗原的基因簇通過基因重組或突變產(chǎn)生新的O-抗原,從而產(chǎn)生新的細(xì)菌類型,新的突變株。在這種環(huán)境中,需要篩選出多對(duì)寡核苷酸同重組基因雜交以提高檢測(cè)的特異性。因此,本發(fā)明提供了一整套多對(duì)寡核苷酸的混合物,它們?cè)从谔腔D(zhuǎn)移酶基因;源于轉(zhuǎn)運(yùn)酶和聚合酶基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。這些基因的混合物對(duì)一個(gè)特殊的細(xì)菌多糖抗原來說是特異的,從而使這套寡核苷酸對(duì)這個(gè)細(xì)菌的多糖抗原是特異的。更具體地說,這些寡核苷酸的混合物是源于糖基轉(zhuǎn)移酶基因、wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因中的寡核苷酸的組合。
在另一方面,本發(fā)明涉及寡核苷酸的鑒定,它們可以用于檢測(cè)表達(dá)O-抗原的細(xì)菌和在診斷中鑒定細(xì)菌的O-抗原。
本發(fā)明涉及到一種檢測(cè)食品中的一個(gè)或多個(gè)細(xì)菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個(gè)基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼轉(zhuǎn)運(yùn)酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個(gè)寡核苷酸能與至少一個(gè)表達(dá)特殊的O-抗原的細(xì)菌的一個(gè)以上的那樣的基因特異性雜交,這些細(xì)菌是大腸桿菌O35型??捎肞CR方法檢測(cè),更可以將本發(fā)明方法中的核苷酸標(biāo)記后作為探針通過雜交反應(yīng)如southern-blot或熒光檢測(cè),或者通過基因芯片或微陣列檢測(cè)樣品中的抗原及細(xì)菌。
本發(fā)明設(shè)計(jì)者考慮到以下情況當(dāng)單個(gè)的特異的寡核苷酸檢測(cè)無效時(shí),寡核苷酸的混合物能與靶區(qū)域特異性雜交以檢測(cè)樣品。因此本發(fā)明提供了一套寡核苷酸用于本發(fā)明所述的檢測(cè)方法。這里所說的寡核苷酸是指源于編碼糖基轉(zhuǎn)移酶的基因、編碼轉(zhuǎn)運(yùn)酶的基因和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的寡核苷酸。這套寡核苷酸對(duì)一個(gè)特殊的細(xì)菌的O-抗原來說是特異的,這一特殊的細(xì)菌O-抗原是由大腸桿菌O35型表達(dá)的。
另一方面,本發(fā)明涉及到一種檢測(cè)排泄物中的一個(gè)或多個(gè)細(xì)菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個(gè)基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼轉(zhuǎn)運(yùn)酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個(gè)寡核苷酸能與至少一個(gè)表達(dá)特殊的O-抗原的細(xì)菌的一個(gè)以上的那樣的基因特異性雜交。這些細(xì)菌是大腸桿菌O35型??捎帽景l(fā)明中的寡核苷酸作引物通過PCR的方法檢測(cè)樣品,也可將本發(fā)明中的寡核苷酸分子標(biāo)記后作為探針通過雜交反應(yīng)如southern-blot或熒光檢測(cè),或者通過基因芯片或微陣列檢測(cè)樣品中的抗原及細(xì)菌。
一般一對(duì)寡核苷酸可能與同樣的基因雜交也可與不同的基因雜交,但它們中必須有一個(gè)寡核苷酸能特異性雜交到特殊抗原型的特異序列上,另一個(gè)寡核苷酸可雜交于非特異性區(qū)域。因此,當(dāng)特殊的多糖抗原基因簇中的寡核苷酸被重新組合時(shí),至少能選出一對(duì)寡核苷酸與多糖抗原基因簇中特異基因混合物雜交,或者選出多對(duì)寡核苷酸與特異基因的混合物雜交。甚至即使當(dāng)一個(gè)特殊的基因簇中所有基因都獨(dú)一無二時(shí),此方法也能應(yīng)用于識(shí)別此基因簇內(nèi)的基因混合物的核苷酸分子。因此本發(fā)明提供了一整套用于檢測(cè)本發(fā)明方法的多對(duì)寡核苷酸,在這里多對(duì)寡核苷酸是源于編碼糖基轉(zhuǎn)移酶的基因、編碼轉(zhuǎn)運(yùn)酶和聚合酶的基因包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因,這套寡核苷酸對(duì)一個(gè)特殊的細(xì)菌多糖來說是特異的,這套寡核苷酸可能是糖合成中必須基因的核苷酸。
另一方面,本發(fā)明也涉及到一種檢測(cè)源于病人的樣品中的一個(gè)或多個(gè)細(xì)菌多糖抗原的方法。樣品中的一個(gè)或多個(gè)細(xì)菌多糖抗原可以使樣品能與以下至少一個(gè)基因中的一對(duì)寡核苷酸中的一個(gè)特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼轉(zhuǎn)運(yùn)酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個(gè)寡核苷酸能與樣品中的至少一個(gè)表達(dá)特殊的O-抗原的細(xì)菌的一個(gè)以上的那樣的基因特異性雜交,這些細(xì)菌是大腸桿菌O35型??捎帽景l(fā)明中的寡核苷酸作引物通過PCR的方法檢測(cè)樣品,也可將本發(fā)明中的寡核苷酸標(biāo)記后作為探針通過雜交反應(yīng),或者通過基因芯片或微陣列檢測(cè)樣品中的抗原及細(xì)菌。
更詳細(xì)地說,以上描述的方法可以理解為當(dāng)寡核苷酸對(duì)被使用時(shí),其中的一個(gè)寡核苷酸分子能雜交到一個(gè)并不是來源于糖基轉(zhuǎn)移酶基因、wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的序列上。此外,當(dāng)兩個(gè)寡核苷酸都能雜交上時(shí),它們可能雜交于同一基因也可能雜交到不同基因上。也即,當(dāng)交叉反應(yīng)出現(xiàn)問題時(shí),可選擇寡核苷酸的混合物來檢測(cè)混合的基因以提供檢測(cè)的特異性。
本發(fā)明者相信本發(fā)明不必限于以上所提的核苷酸序列編碼的特定的O-抗原,而且廣泛應(yīng)用于檢測(cè)所有表達(dá)O-抗原和鑒定O-抗原的細(xì)菌。而且,由于O-抗原合成和其他多糖抗原(如細(xì)菌胞外抗原)合成之間的相似性,本發(fā)明的方法和分子也應(yīng)用于這些其他的多糖抗原。
本發(fā)明首次公開了大腸桿菌O35型的O-抗原基因簇的全長序列,而且可從這個(gè)未被克隆的全長基因簇的序列中產(chǎn)生重組分子,通過插入表達(dá)可產(chǎn)生表達(dá)大腸桿菌O35型的O-抗原,并成為有用的疫苗。
具體實(shí)施例方式
下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解這些實(shí)施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件如Sambrook等人,分子克隆實(shí)驗(yàn)室手冊(cè)(NewYorkCold Spring Harbor Laboratory Press,1989)中所述的條件。
實(shí)施例1基因組的提取在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O35型,離心收集細(xì)胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細(xì)胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時(shí),再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清液再用等體積的酚∶氯仿∶異戊醇抽(25∶24∶1)混合溶液提兩次,取上清液再用等體積的乙醚抽提以除去殘余的酚,上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中?;蚪MDNA通過0.4%的瓊脂糖凝膠電泳檢測(cè)。
實(shí)施例2通過PCR擴(kuò)增大腸桿菌O35型中的O-抗原基因簇以大腸桿菌O35型的基因組為模板通過Long PCR擴(kuò)增其O-抗原基因簇。首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇啟動(dòng)子區(qū)的JumpStart序列設(shè)計(jì)上游引物(#1523-ATT GTG GCT GCA GGG ATC AAA GAA AT),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計(jì)下游引物(#1524-TAG TCG CGT GNG CCT GGATTA AGT TCG C);用Boehringer Mannheim公司的Expand Long Template PCR方法擴(kuò)增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘;然后94℃變性10秒,60℃退火15秒,68℃延伸15分鐘,這樣進(jìn)行30個(gè)循環(huán)。最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測(cè)PCR產(chǎn)物的大小及其特異性。合并5管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物。
實(shí)施例3構(gòu)建O-抗原基因簇文庫首先是連接產(chǎn)物的獲得用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫。反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進(jìn)行。酶切10分鐘使DNA片段大小集中在1.5kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng)。合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中。隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mMDTT和5單位的T4DNA聚合酶,11℃30分鐘,將酶切產(chǎn)物補(bǔ)成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴(kuò)大為80ul,70℃反應(yīng)20分鐘,使DNA的3′端加dA尾。此混合物經(jīng)等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接10小時(shí),總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶。最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物。
其次是感受態(tài)細(xì)胞的制備參照Bio-Rad公司提供的方法制備感受態(tài)細(xì)胞大腸桿菌DH5□。取一環(huán)大腸桿菌DH5□單菌落于5ml的LB培養(yǎng)基中,180rpm培養(yǎng)10小時(shí)后,取2ml培養(yǎng)物轉(zhuǎn)接到200ml的LB培養(yǎng)基中,37℃250rpm劇烈振蕩培養(yǎng)到OD600 0.5左右,然后冰浴冷卻20分鐘,于4℃4000rpm離心15分鐘。傾盡上清液,用冷的冰預(yù)冷的去離子滅菌水200ml吹散菌體,于4℃ 4000rpm離心15分鐘。再用冷的冰預(yù)冷的去離子滅菌水100ml吹散菌體,于4℃ 4000rpm離心15分鐘。用冷的冰預(yù)冷的10%的甘油懸浮細(xì)胞,4℃ 6000rpm離心10分鐘,棄上清液,最后沉淀用1ml冰預(yù)冷的10%的甘油懸浮細(xì)胞,即為感受態(tài)細(xì)胞。將制得的感受態(tài)細(xì)胞分裝為50ul一管,-70℃保存。
最后是電轉(zhuǎn)化感受態(tài)細(xì)胞取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5□混合后,轉(zhuǎn)到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5干伏,時(shí)間為5.0毫秒-6.0毫秒。電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇。然后立即將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上37℃倒置過夜培養(yǎng),次日得到藍(lán)白菌落。將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時(shí)從每個(gè)克隆中提取質(zhì)粒并用EcoRI酶切鑒定其中的插入片段的大小,得到白色克隆群構(gòu)成了大腸桿菌O35型的O-抗原基因簇文庫。
實(shí)施例4對(duì)文庫中的克隆測(cè)序從文庫中挑選插入片段在1kb以上的96個(gè)克隆用本實(shí)驗(yàn)室ABI3730型DNA自動(dòng)測(cè)序儀對(duì)克隆中的插入片段單向進(jìn)行測(cè)序,使序列達(dá)到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列。
實(shí)施例5核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學(xué)實(shí)驗(yàn)室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O35型的O-抗原基因簇的核苷酸全長序列(見序列列表)。序列的質(zhì)量主要由兩個(gè)方面來保證1)對(duì)大腸桿菌O35型的基因組作5個(gè)LongPCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫。2)對(duì)每個(gè)堿基,保證3個(gè)以上高質(zhì)量的覆蓋率。在得到大腸桿菌O35型O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心(The National Center for BiotechnologyInformation,NCBI)的orffinder發(fā)現(xiàn)基因,找到12個(gè)開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用ClustralW軟件做DNA和蛋白質(zhì)序列間的精確比對(duì),最后得到大腸桿菌O35型的O-抗原基因簇的結(jié)構(gòu),如表3所示。
通過檢索和比較,發(fā)現(xiàn)orf1編碼的蛋白與Shigella boydii O-抗原基因簇中rmlB基因編碼的蛋白有很高的氨基酸序列一致性(98%),通過對(duì)Pfam蛋白基序數(shù)據(jù)庫的搜索,發(fā)現(xiàn)orf1編碼的蛋白與已知的RmlB的共有序列的同源性預(yù)期值非常高(E value=2.7×e-68)。Off2基因編碼的蛋白與Shigella boydii O-抗原基因簇中rmlD基因編碼的蛋白有很高的氨基酸序列一致性,orf3基因編碼的蛋白與Shigella boydii O-抗原基因簇中rmlA基因編碼的蛋白有很高的氨基酸序列一致性,orf4基因編碼的蛋白與Salmonella enterica O-抗原基因簇中rmlC基因編碼的蛋白有很高的氨基酸序列一致性.rmlBDAC負(fù)責(zé)O-抗原中的一種稀有單糖dTDP-rhamnose合成.orf5編碼的與Escherichia coli O-抗原基因簇中Gna基因編碼的蛋白有很高的氨基酸序列一致性,orf6基因編碼的蛋白與Pseudomonas aeruginosa O-抗原基因簇中wbpP基因編碼的蛋白有很高的氨基酸序列一致性,為gne基因。orf8基因編碼的與Shewanella oneidensis O-抗原基因簇中氨基轉(zhuǎn)移酶基因編碼的蛋白有很高的氨基酸序列一致性。orf5,6,8基因負(fù)責(zé)O-抗原中的一種稀有單糖UDP-GalNAcAN的合成。
Orf7和orf11是大腸桿菌O35種僅有的兩個(gè)編碼存在跨膜片段的蛋白的基因。Orf7編碼的蛋白與Clostridium acetobutylicum的O-抗原轉(zhuǎn)移酶有19%的序列一致性,通過HMMTOP2.0程序分析蛋白的拓?fù)浣Y(jié)構(gòu)發(fā)現(xiàn)其含有12個(gè)均勻的跨膜片段,這是Wzx蛋白的典型特征。所以命名orf7為wzx。Orf11編碼的蛋白與Shigella boydii的O-抗原聚合酶有25%的一致性,47%的相似性,通過HMMTOP2.0程序分析蛋白的拓?fù)浣Y(jié)構(gòu)發(fā)現(xiàn)其含有9個(gè)跨膜片段,并且有一個(gè)大的(61個(gè)氨基酸)胞質(zhì)內(nèi)親水環(huán)(loop),這是Wzy蛋白的典型特征。所以命名orf11為wzy。
Orf9,10,72三個(gè)基因編碼的蛋白與其他已知的糖基轉(zhuǎn)移酶有24-36%的序列一致性和44-53%的序列相似性。通過對(duì)Pfam中糖基轉(zhuǎn)移酶基序數(shù)據(jù)庫的搜索,這三個(gè)基因編碼的蛋白與已知的糖基轉(zhuǎn)移酶家族1和2的共有序列的同源性預(yù)期值為1×e-12至5×e-17,由于這三個(gè)基因的確切功能還不能確定,因此我們將這三個(gè)基因暫命名為orf9 orf10,orf12實(shí)施例6特異基因的篩選針對(duì)大腸桿菌O35型的O-抗原基因簇中的wzx、wzy基因設(shè)計(jì)引物,這些基因在核苷酸序列中的位置見表1。
表1列出了大腸桿菌O35型的O抗原基因簇中糖基轉(zhuǎn)移酶基因和寡糖單位處理基因及基因內(nèi)的引物及PCR數(shù)據(jù)。在表中列出了大腸桿菌O35型的O抗原基因簇的糖基轉(zhuǎn)移酶基因、轉(zhuǎn)運(yùn)酶基因和聚合酶基因及它們的相應(yīng)的功能和大小。在每個(gè)基因內(nèi),我們各設(shè)計(jì)了兩對(duì)引物,每對(duì)引物分布在相應(yīng)基因內(nèi)的不同地方以確保其特異性。在表中還列出了每個(gè)引物在SEQ IDNO1中的位置和大小。以每對(duì)引物用表中所列的相應(yīng)的退火溫度以表2中的所有菌的基因組為模板進(jìn)行PCR,得到了相應(yīng)的PCR產(chǎn)物,其大小也列于表中。
表2是用于篩選特異基因的166株大腸桿菌和43株志賀氏菌及它們的來源,為了檢測(cè)的方便,我們將它們每8-10個(gè)菌分為一組,總共13組,它們的來源都列于表中。
在第13組中含有大腸桿菌O35型的基因組DNA作為陽性對(duì)照。以每組菌做模板,用表1中的每對(duì)引物按如下條件做PCR在95℃預(yù)變性5分鐘后,95℃變性30秒,退火時(shí)間是30秒,溫度見表1,72℃延伸2分鐘,這樣進(jìn)行25個(gè)循環(huán)。最后在72℃繼續(xù)延伸5分鐘,反應(yīng)體系是25ul。模板為1∶20稀釋,取1μl。反應(yīng)完畢后,取10ulPCR產(chǎn)物通過0.8%瓊脂糖凝膠電泳檢測(cè)擴(kuò)增出的片段。
對(duì)于wzx、wzy基因,每個(gè)基因都有兩對(duì)引物被檢測(cè),每對(duì)引物除了在第13組中做PCR后得到了預(yù)期大小的正確的一條帶外,在其他組中都沒有擴(kuò)增到任何大小正確的帶,也就是說,在大多數(shù)組中沒有得到任何PCR產(chǎn)物帶,所以wzx、wzy基因?qū)Υ竽c桿菌O35型及其O-抗原是高度特異的。
最后,通過PCR從大腸桿菌O35型中篩選到對(duì)大腸桿菌O35型的O-抗原高度特異的基因wzx、wzy和三個(gè)糖基轉(zhuǎn)移酶基因。而這些基因內(nèi)的任何一段10-20nt的寡核苷酸對(duì)大腸桿菌O35型的O-抗原是特異的,尤其是上述每個(gè)基因中的引物即寡核苷酸對(duì)經(jīng)PCR檢測(cè)后證實(shí)對(duì)大腸桿菌O35型是高度特異的。所有的這些寡核苷酸都可用于快速準(zhǔn)確地檢測(cè)人體和環(huán)境中的大腸桿菌O35型,并能鑒定它們的O-抗原。
表3是大腸桿菌O35型的O-抗原基因簇的結(jié)構(gòu)表,在表中列出了大腸桿菌O35型的O-抗原基因簇的結(jié)構(gòu),共由12個(gè)基因組成,每個(gè)基因用方框表示,并在方框內(nèi)寫入基因的名稱,數(shù)字表示的是O-抗原基因簇中的開放閱讀框(off)的順序。在O-抗原基因簇的兩端是galF基因和gnd基因,它們不屬于O-抗原基因簇,我們只是用它們的一段序列設(shè)計(jì)引物來擴(kuò)增O-抗原基因簇的全長序列。
表4是大腸桿菌O35型的O-抗原基因簇中的基因的位置圖,在圖中列出了大腸桿菌O35型的O-抗原基因簇中的所有開放閱讀框在全序列中的準(zhǔn)確位置,在每個(gè)開放閱讀框的起始密碼子和終止密碼子的下面劃線。在大腸桿菌中開放閱讀框的起始密碼子有兩個(gè)ATG和GTG。
SEQUENCE LISTING<110>南開大學(xué)<120>對(duì)大腸桿菌O35型的O抗原特異的核苷酸<130>對(duì)大腸桿菌O35型的O抗原特異的核苷酸<160>1<170>PatentIn version 3.2<210>1<211>14060<212>DNA<213>Escherichia coli<400>1tctgtcatcc ggaccaaaga gccgctggac cgcgaaggta aagtcagccg cattgttgaa 60tttatcgaaa aaccggatca gccgcagacg ctggactccg acatcatggc cgttggtcgc120tatgtgcttt ctgtcgatat ttggccggaa cttgaacgca cacagcctgg tgcatgggga180cgtattcagc tgactgatgc cattgctgaa ctggcgaaaa aacagtccgt tgatgccatg240ctgatgactg gtgacagcta cgactgcggt aaaaaaatgg gttatatgca ggcgtttgtg300aagtatggac tacgcaacct caaagaaggg gcgaagttcc gcaaaggtat tgagaagctg360ttaagcgaat aatgaaaatc tgactggatg taacggttga taagaaaatt ataacggcag420tgaagattcg tggcgaaagt aatttgttgc gaattttcct gccgttgttt tatataaaca480atcagaataa caacgagtta gcaataggat tttcgtcaaa gttttccagg attttccttg540tttccagagc ggattggtaa gacaattagc gtttgagttt ttcgggttta gcgcgagtgg600gtaacgctcg tcacatcgta gacatgcatg cagtgctctg gtagctgtaa agccaggggc660ggtagcgtgc attaatacct ctattaatca aactgagagc cgcttatttc acagcatgct720ctgaagtaat atggaataaa ttaagtgaaa atacttgtta ctggtggcgc aggatttatt780ggttctgctg tagttcgtca cattataaat aatacgcagg atagtgttgt taatgttgat840aaattaacgt acgccggaaa cctggaatca cttgcagatg tttctgattc cgaacgctat900gtttttgaac atgcggatat ttgtgatgta gctgcaatgg cacggatttt tgctcagcat960cagccggatg cagtgatgca cctggcagct gaaagccatg ttgaccgttc aattacaggc 1020cctgcggcat ttattgaaac caatattgtt ggtacttatg tccttttaga agcggttcgg 1080aattactggt ctgctcttga tggcgacaag aaaaatagct tccgttttca tcatatttct 1140actgacgaag tctatggtga tttgcctcat ccagatgaag taaataatac agaagaatta 1200cccttattta ctgagacaac agcttacgca ccaagcagcc cttattcttc atcaaaagcg 1260tccagcgatc atttagtccg tgcgtggaaa cgtacctatg gtttaccgac cattgtgact 1320aattgctcta acaattatgg tccttatcat ttcccggaaa aattgattcc attggttatt 1380ctcaatgctc tggaaggtaa aggattacct atttatggta aaggggatca aattcgcgac 1440tggctgtatg ttgaagatca tgcgcgtgcg ttatataccg tcgtaaccga aggtaaagcg 1500ggtgaaactt ataacattgg tgggcacaac gaaaagaaaa acatcgatgt agtgctcact 1560atttgtgatt tgttggatga gattgtcccg aaagagaaat cttaccgcga gcaaattact 1620tatgttgccg atcgtccggg acacgatcgc cgttatgcga ttgatgctga gaagattggt 1680cgcgaattgg gatggaaacc acaggaaacg tttgagagcg ggattcgtaa aacggtggaa 1740tggtacctgt ccaatacaaa atgggttgat aatgtgaaaa gtggtgccta tcaatcgtgg 1800
attgaacaga actatgaggg ccgccagtaa tgaatatcct cctttttggc aaaatagggc 1860aggtaggttg ggaactacag cgtgctctgg cacctctggg taatttgatt gctcttgatg 1920ttcactccac tgactactgt ggtgatttta gtaatcctga aggtgtagct gaaaccgtaa 1980gaagcattcg gcctgatatt attgtcaacg cagccgctca taccgcagta gacaaagcag 2040aatcagaacc gaagtttgca caattactga acgcgacgag tgtcgaagcg atcgcgaaag 2100cagccaatga agtcggcgcc tgggttattc actactctac tgactacgta tttccgggaa 2160ccggtgaaat accatggcag gaggaagatg caaccgcacc gctaaatgtt tacggtgaaa 2220ccaagttagc aggagaaaaa gcattacaag agcattgtgc gaagcacctt attttccgga 2280ccagctgggt ctatgcaggt aaaggaaata acttcgccaa aacaatgttg cgtctggcaa 2340aagagcgtga agaattagcc gttattaatg atcagtttgg tgcgccaact ggcgcagagt 2400tgctggctga ttgtacggca catgccattc gtgtggcact gaataaaccg gaagttgcag 2460gcttgtacca tctggttgct agtggtatcc acaacctgca cgattatgct gcgctggtat 2520ttgaagaggc gcgcaaagca ggcattcccc ttgcactcaa caagctcagc gcagtaccaa 2580caacagccta tcctacacca gctcgtcgtc cacataactc tcgccttaat acagaaaaat 2640atcagcagaa ctttgcgctt gtcttgcctg actggcaggt tggcgtgaaa cgaatgctta 2700acgaattatt tacgactaca gcaatttaat agtttttgca tcttgttcgt gatggtggag 2760caagatgaat taaaaggaat gatcaaatga aaacgcgtaa aggtattatt ttagcgggtg 2820gttctggtac tcgtctttat cctgtgacta tggccgtcag taaacagctg ttaccgattt 2880atgataaacc gatgatctat tacccgcttt ctacactgat gttagcgggt attcgcgata 2940ttctaattat aagtacgcca caggatactc ctcgttttca acaactgctg ggtgacggga 3000gccagtgggg gctaaatctt cagtacaaag tgcaaccgag tccagatggt cttgcgcagg 3060catttatcat cggtgaagag tttatcaatg gtgatgattg tgctttggtt ctaggtgata 3120atatctttta cggtcacgat ctgccgaagt taatggatgt cgctgttaac aaagaaagtg 3180gtgcaacggt atttgcctat cacgttaatg atcctgaacg ctacggtgtc gttgagtttg 3240ataaaaaagg tacggcaatt agcttggaag aaaaaccgtt acaaccaaaa agtaattatg 3300cggtaaccgg gctttatttc tatgataacg acgttgtcga aatggcgaaa aaccttaagc 3360cttctgcccg tggtgaactg gaaattaccg atattaaccg catttatatg gaacaggggc 3420gtttatccgt tgccatgatg ggacgtggtt atgcatggct ggacacgggg acacatcaga 3480gcctgattga ggcaagcaac tttattgcaa caattgaaga gcgccaaggg ttaaaggtat 3540cttgcctgga agagattgct tatcgtaaag gctttattga cgcagagcag gttaatgtat 3600tagccgaacc actaaagaaa aatgcttatg gtcagtatct gctaaaaatg attaaaggtt 3660actaaaaatg aatgtaatta aaactgaaat tcctgatgta ttaattttgg agccgaaagt 3720ttttggtgat gagcgcggtt tttttatgga aagctttaat cagaaagttt tcgacgaggc 3780tgtagggcgt aaggttgaat ttgttcagga taaccattcc aaatcaatta agggggtgtt 3840acgcggactg cactatcagc aggaacctta tgctcaaggt aaattagttc gttgtgtggt 3900tggagaggtc tttgatgttg cggtggacat ccgtagagac tctgaaacat ttggtaaatg 3960ggttggtgta aatctttcgg ctgaaaataa aaaacaatta tggatacctg aaggttttgc 4020tcatgggttt tatgtattga gtgatactgc tgaatttgtc tataaagcga ctaattatta 4080taattttcta tcagatcggg ggatcatttg gaatgataaa aatataaata tcaactggcc 4140aattgtcgga gatatacttc tttctgaaaa agatatgaat cataggactt ttactgaaac 4200atttaatgtt tgatattgaa acttacattt agagagataa ttaatgaaac tagaaaattt 4260aaatattggc atagtcggtt taggttacgt cggtttaccg cttgcggtcg agtttggtaa 4320aaagtttgtg acagttggtt ttgatataaa aagagcgaga gttgaagaac taaaaaataa 4380tattgattca acttatgaat gctcaagcaa tgaactacag ttggctaatt tattaaaatt 4440cacaaataac attgatgata ttaggaaatg taatgtatat attgtaactg taccaactcc 4500aatagataag tttaaacggc ctgatttatc accattaatt aatgcatcaa aattaatagg 4560
ttcagtattg aataaaggtg atgttgttat atatgagtca acagtatatc cgggggcaac 4620tgaagaagag tgtgttcctg tactagaaga acaatcaggt atgattttta ataaggattt 4680ttttgtagga tatagtcctg agagaattaa tcctggtgat aaagaacatc gtgttacttc 4740aataaagaaa gttacatctg ggtcgaccat tgaaattgcc aattttgtag attcattata 4800tgcaaccata attaatgctg ggacttataa agcaagttca ataaaagtag cagaagcggc 4860gaaagtaatt gagaatactc aacgtgattt aaatattgca ctgattaatg aattggctat 4920tatatttaat aagttaaata ttgatacaga agaggtacta aaagctgcag ggactaaatg 4980gaactttttg tcatttaaac caggacttgt tggtgggcat tgtattggag ttgatcccta 5040ttacttgaca cataaagctc aatccatcgg atataatccg gaagttatat tatcaggaag 5100aagaattaac gatgctatgg gggaatatgt ggcgtcacag ttagtaaaaa aaatgataaa 5160aaagaaaatt aaaatcgatt gtgcagatgt cttaattatg gggttagcat tcaaagaaaa 5220ctgtcctgat ctaagaaata ctaaagtaat agatattata aagtctttaa gagattataa 5280tatcaatgca gaggtttatg atccttgggt ttccccagat gaagctgccc aagaatatgg 5340tgtcaatatt aataataaag tcccgcccaa aaaatatgat gctattttgt ttgccgttgc 5400tcataatgaa tttaaagata tgacgaaaga ggaaattctc tcattaacaa aaaataatta 5460tgttatatac gatctaaagt acattatagc gtctgacttg gttattgatc gcttgtaata 5520tataggcttt gaggacgatt acatgaatta tgaagagtta caagactatc tgttaaataa 5580tcaaagaact tggttaatta ctggtgtggc tgggtttatt ggctccaact tacttgaaaa 5640acttttaaat ctaaatcaat gcgttattgg cgtggataat ttttcaactg gttttcaatc 5700aaatttaaat gaagttaaag ataatgtacc tgaatcttct tggagaagat ttaaatttat 5760tgaaggagat atctgtaatt tagatgtctg caaaaaaagt atcagtggtg tcgattatgt 5820tctgcaccaa gcagcacttg gttcagtacc gagatcaatt gagaatccca ttctgaccaa 5880tgcttcaaat attagtggtt ttttaaatgt tttagattgt gcaagaagag aaaatgtaaa 5940aagttttact tacgctgcta gtagttcgac atatggtgat catacaggtt tacctaaagt 6000tgaaaatatt ataggtaatc cactttctcc ttatgctgtg acaaaatatg taaatgagtt 6060atatgcaggt gtttatgcac taaattataa tttcaaaagt ataggtctta gatattttaa 6120tgtatttggg agaaggcaaa atcctgaagg ggcatatgcg gctgtgattc ctaaatggat 6180cctttcgata ttgaatggtg atgatctata tataaatggt gatggaaata cgagtagaga 6240tttttgttat atagataacg tagttcaagc taatctatta gcagcacttg caaatgacaa 6300cgtaaagaat aacatattta atattgctta tggacaacaa acaagtctta ataaactttt 6360taaatatatt acagttgctt taagtaatga aggagtcgaa tacaaaaaac aacctatatt 6420taaggaattt cgattaggag atgtaagaca ttcgctcgct aatattgata aagctaaaat 6480tatgttggga tatgaaccat gctataacac taaccaggga ataaagttag ctattaagtg 6540gtatataaat aatctgacca aatgaaacat agtggctgta ggctcgagat taaagtgagt 6600ctgcagttac tataatgcat caggattgaa atatatccat gccatttatt ggaatttaat 6660atgcacaaag aattcacatg tatttaaaaa tattaataga caatatttca cttgtaatcc 6720aatatttttt tggtggcata gcggtgttct atgttacacc gttaattgtg aaatctgttg 6780gtattcatac ctatggtaat ttagcaatta tgtttgctat tgttacttac atatcagtcg 6840taatacagta ttcatttaat ttgattgggc caaaattaat tgctgaagga aattgcaaaa 6900aaacatttaa tacaataata tccgctaaaa tagtactttt tttattgtca cttatttttt 6960ttctattata tttttatttc tttcaaaaca aacatgatga tgtattttta ttatttcttg 7020tttttccact ttcttgggtt tttaatagcg cttggtatct tcaaagtaaa ggttattttg 7080ttataagtag tgtgtgctca ataattggat cactaatcac atttgttatc gcgtattttt 7140ttataaatac aacaactggc ttatttgttc caatattatg tttggtttta tcttcgttta 7200taaatggcct tcttactttt ttctttgcag taaaaaataa tggacatatt gagatagtta 7260atccactacc tatgttgaaa gaaggaatgc ctctttttgt ttcccagata atctcctcgt 7320
tatatacaat gtctggtgtt tttataatta cctattttta tggagttgca tctgcaggta 7380catatgccat tgtagaacgt tttatgaact tattaatttc tttaggcgtt cttacacatg 7440tggcagccta tccaaaattg gcgaggttat tcaataaaga tagattagaa tatagaaaga 7500cattattatt tgttattgca ttatatactt tgttttcttg ttgtgtagcc atagttgttt 7560ttaactttca tcaaaacatt gtaacatata tgtttgggag cgaaagtgta aatgctaaag 7620aactaattta ctcagcgtgt atatttatat ttgtttccat atatggaccg gtagtgacag 7680ggtattttac tttaaaagta aaagggagaa tgataataac aattaatata ataatagctt 7740tgctatcttt actgctagga gtagggatgt taaaaatagt gggtagtagt ggatggttaa 7800taggactgag tctcgctcag ttactttata ttgctatctt ttttaagatt tttatttggg 7860gaagaaaaga atgtgcggtc tagttggttt ttttagtaaa gctaatcatg atacgaatat 7920aattcggaat atgttgcata aaattagaca tcgtggaccc gattcattcg ggatttgggc 7980cgatttagaa tgcaatatcc attttggcca cgttagatta tcgattgttg aattgagtag 8040cgcaggacat caaccgatgt caacttcatg tggacgattt actattatat ttaatggtga 8100gatatataac cacctcgata tacgtcggga acttggcaat aatataaagt ggtcaggaac 8160atctgatact gaaaccttac ttaaaagtat ttcgacttgg gggatttcta gcacattgaa 8220aaaaatggtt gggatgtttt cctttgcatt gtgggatagt gtagaacgaa gtttatatct 8280tgcgagagat agaatgggtg aaaaacctct ctattacggt tggtgtaatg gttcttttat 8340atttggctcg gaactgaaag cattaaaatc acatcctgat tttgatgctg aaattgactg 8400gcaggcaatt aatggatatt tgcataataa ttatatttct tcacccttaa ctatttatag 8460caagttaaaa caattgcgac ctggtcatta cattaaaatg agctatgatg atcttctctc 8520aggtaatata ccggtgctgt ataagtattg ggcattatct tttcctgtta gtgataataa 8580ctgcaggtat gttgattctg tgtcagaatt agagacttta ctaacagaat ctgtttctct 8640tcagtcgatt gctgatgtta aggttggagc ctttctatca ggtggaatag attctactac 8700catcgtagca atgttgaaaa aaagtggacg tgatgtatct acattttcta tcggaatgcc 8760taataaacaa tttgatgaat cacaccacgc cgaacagatc gcaaaatata ttggtactca 8820gcattataca catatgataa cacctcaaga agctcttgag gtaattgata atattcctgc 8880aatttgggat gagcctttcg cagatagttc tcagatacca acatacttgg ttagtaagtt 8940tgctaaagag tatgtaacag tagctttgtc tggtgatggt ggagacgagc tgttcatggg 9000atataaccaa taccctttgt taaagagaat ttgggacact agatttttat ctaatctgca 9060tttagaattt atagctaata taatgacaaa aatgggattt aaaaattcca atgtaattgt 9120aaaaagggct ttgaatttaa gtcaaggttg gcgttgcaaa actccttttt tattaaatga 9180tttttggatg gataagtatc gcaatgcaga atttccttta ttaaaaccta tacgttgtga 9240acgtgattta gatttaaatt actcagatgg aatttcagca ataactcagc acgatttaaa 9300ttattatctt tgtgatgata tattaactaa agtagacaga gcctcaatgg cggttagttt 9360agaaacgcga gctccatttt tagatcatcg cgttgttgaa tttgcgtttg ctttgccgac 9420ctcattcaaa ctggataagt ataatcagaa aaaaatactc aagtcagtat tatataaaca 9480tgttgatagt aaattattag aacgccctaa gcaagggttt tcattaccta tgaagtattg 9540gttaaaagct gagctaaaag gatgggcacg agatcgtctt gattctttac cagatgatgt 9600tttcgataaa gttgttgttg ataatatttg gaaagatcat attaatgata tcaaggataa 9660tagcgagcga atttggggtt tgagtaattt agctaatttt ttggagttac aatgaaaaag 9720attgctatat atacttgtgt taccggcggt tatgatgtag ttaaagcccc acttaaaatt 9780aatcataata tagattatat atgtttcagc gatcaaaaaa tttcagctcc ttatccttgg 9840aaagttagaa atatagcaga gcttaaaata tcgaagtcat ttgacaagaa aacaattaat 9900cgcgctatca aaatatgtcc tcaagatttt ggtctattag aagaatatga actaactatt 9960tatatagatg gctcgataga aattatggac gatctgtctt tactaattga ttttgtaaca 10020aaacaagatt acgatatttt tatgtatgaa cattttttaa gaaattgcct gtatgatgaa 10080
gctgaagagt gtcttctaat tggatatgat tggtattgga atattcaaaa gcaagttaaa 10140agatataggc agcgagggtt tccagtttca tatggtctct ttgagtgtgg gattattata 10200agaaaaaaat ctcgagactt aaatgtaata ttacaaaaat ggtttgaaga atatgtaaaa 10260ggagttaagc gtgaccagct ttcgctcacg tatatattat gggaaaatgg ttaccatttg 10320tattccttgg gggagagtga tgctagatat aaaaatagac attttaagtt acataggcat 10380tcaataaaaa gtaatgaata tctcaggaag tttaggtcta aacttaataa gttgttgtta 10440attttttggg gagggatata aagtgtacga taaagtttgt ggtattgtaa ttgtatttta 10500tcatcctaat gatgaaaata ttaatagtgc aaaaaagtta agtgagtctt ataaagtaat 10560aatagttgat aatagtgaaa aggatataac ttattccata cctaaagcgc atattataaa 10620attgaaaaga aacgtaggta tcgctgcagc actaaatatt ggaatacatt tttttattaa 10680aaataattat aaatatgctg ttttattaga tcaagatagt gaacctgata aatcactttt 10740gagttcactt atcaattatt ctgaaaattg cacggataat gtatgtttag tagcaccgtc 10800ctattatgat agagctatta ataagaatgc tgattttatt ctatgcactg aaaaaggtat 10860tattagacag cctgcaattg gaaaaaatgc gattgaagcg tcctatgtta taacttctgg 10920ttctctctta agactgtcat ctatttctaa tattggattc atggatgaag atttatttat 10980agattttgtt gatattgagt ggtgtttaag agcaaattct ttgggatata aaatattagg 11040tttgccatgg ttaaagatgt cacatgagat cggtgataaa cctattaaaa tattaaataa 11100aaagtatgtt aatcattccc caattagaca ctattactat tttagaaata tatttctgtt 11160gatgcgtatg agtcatatcc atccacaatg gaaaaaatgg gagttgataa agttattacc 11220tagatttttt gtttatgcat tttttacaaa gaataatatg aaacatattg tctctatgtt 11280aactggtgta tatgatggta ttcttgggcg tgtggggaaa aagaaatgaa tggagtagcc 11340aaacccatta taatttcttg gtttgttctt tgtactcttg tggttttctt tttatgtagt 11400ttcgaacaat tcccggatta ttattcatat ctcaactggt atgagttatc agtatctgca 11460acactgaata ataattgggt cttttttaaa gatcccggat tttatttgtt atcagttata 11520tcaaataatt ttgattttgg tatcattggg gcaatttttt tcctttttat tatatcactt 11580tcatgtaaga ttttcttttg tattaagtta cttgattggg aagtattatt ctgggtttta 11640cttttatatc tttccagact ttttattatt catgatcttg ttcaatatcg tgcaggtgct 11700tcaattggtt tatcggcatt atttgtatac ttttatttag aaaaaaaaag gattaagtct 11760ttttttttct taagtctcgc actttctatc cacctttcaa gtttgttaat ggtgtcagtc 11820atccctattg catggtttct taataggaat gtaggtggaa atataattcg acagatagca 11880atattacttt taatattgtc gttgagctta ttttttgatc cttacgttaa cttgctcaga 11940ttggtatcac agtttccctt aatgcatgaa agaattgctc cgtatttgga tggttcttat 12000cttgttagta acacatcaat gtttaatagt tttgtaataa ttaaaattat ttcatatgtg 12060attttttttg tttggatatg caaaaacaaa aatgtcgggt tgactaatga aaattactta 12120atttatcttt gtttcttcat atctattgta ggattgtttc ttttttggtg ttttagaagc 12180aatgactcac tttccatacg tttttctgat tttttcgctt tgtatgatat cgtttttttt 12240gctctattgt taaatgtttt tgatgtgttt ggaaaattta tctatagata ttgtctttta 12300gtcgtggtga ttgttttttt tatatcttca atgaagttaa taaattaatt tcttatatgt 12360gtgctaacta tgaatgttta tatatctgtt gtctctcata atcatgctaa aatgattatg 12420gaatttgatt gtttacgcaa acttgctaag aggtataaag tagttattaa aaataattct 12480gaacgcgaaa gcgttatttt gaatgattac tgtagggaaa atggaatata tataattgat 12540tatgcctata atactgggtt tggcaaaaat aataatattg tatttcaatt ttgtgtaaaa 12600aaattaggga tgactagtga tgattatttt atccttataa atcccgatgt tataattgat 12660tctattaaca ttgataaact tatttccata attgaaaagg atatggtaga tatttctgga 12720atatctctgt ataaagatga ttctttgtcg ataagagatt attcaatacg taattatcct 12780tcgctttaca ctttttttat atcgttcttc cgattccatg aaagttatcg tgtattgcca 12840
cctaatgacg attgctcaag tgtagatatg gactgggtgg ctggttcttt tatggctttt12900aaaacaaatg catattccag tttattaggt ttcgatgaaa attacttcat gtattgcgag12960gatttagata tttgttttag agccaagagt aagggcttaa atttaaagta catacccagt13020gttactggaa ttcataaggc tcagcataat aatagaagat tatttagcaa gcatttttat13080tggcatataa aaagcgcact aagattttta gttagaaaaa aaataaaatt acaagtgaaa13140tctatattga aatgatatct taatatcagt ggagttttaa agatgtcata atatatatcg13200tttgctatct atttatatta gttttaggtt agaatctatt actagataac cgcgcatatt13260ttccgcggtg accacaccag acaggagtaa acaatgtcaa agcaacagat cggcgtcgtc13320ggtatggcag tgatggggcg caaccttgcg ctcaacatcg aaagccgtgg ttataccgtc13380tctattttca accgttcccg tgagaagacg gaagaagtga ttgccgaaaa tccaggcaag13440aaattggttc cttactttac ggtgaaagag tttgttgaat ctctggaaac gcctcgtcgc13500atcctgttaa tggtgaaagc aggtgcaggc acggatgctg ctattgattc tctcaagccg13560tacctcgata aaggtgacat catcattgat ggtggtaaca ccttcttcct ggacaccatt13620cgtcgtaacc gtgagctttc ttcagaaggc tttaacttca tcggtaccgg tgtctccggt13680ggtgaagaag gtgcgctgaa aggtccttcc attatgcctg gtgggcagaa agaagcctat13740gaactggttg cgccgatcct gaccaatatc gccgccgttg ctgaagatgg cgaaccgtgt13800gttacctata ttggtgccga tggtgcgggt cactatgtga aaatggttca caacggtatt13860gaatacggtg atatgcaact gattgctgaa gcctattctc tcctgaaagg cggcctgaat13920ctctctaacg aagaactggc acagaccttt accgagtgga ataacggtga actgagcagc13980tacctgatcg acatcaccaa ggatatcttc accaaaaaag atgaagacgg taactatctg14040gttgatgtga tcctggatga14060表1大腸桿菌O35型的O抗原基因簇中的糖基轉(zhuǎn)移酶基因和寡糖單位處理基因及其中的引物及PCR數(shù)據(jù)
*只在大腸桿菌O35型中得到正確的一條帶表2 166株大腸桿菌和43株志賀氏菌及它們的來源組號(hào) 該組中含有的菌株 來源1、野生型大腸桿菌 O1,O2,O5,O7,O12,O13,O14,O15,O16,O17,O19ab,O20, IMVSaO21,O22,O23,O24,O592、野生型大腸桿菌 O25,O26,O27,O28,O29,O30,O32,O3 1,O33,O36,O37, IMVSaO38,O40,O41,O42,O433、野生型大腸桿菌 O44,O45,O46,O48,O49,O50,O51,O52,O54,O55,O56, IMVSaO57,O58,O60,O61,O624、野生型大腸桿菌 O63,O65,O65,O69,O70,O71,O74,O75,O76,O77,O78, IMVSaO79,O80,O81,O82,O835、野生型大腸桿菌 O84,O85,O86,O87,O88,O89,O91,O92,O98,O99,O101, IMVSa
O102,O103,O104,O1066、野生型大腸桿菌O107,O108,O109,O110,O111,O112ab,O112ac,O113, IMVSaO115,O116,O118,O120,O123,O125,O126,O1287、野生型大腸桿菌O129,O130,O131,O132,O133,O134,O135,O136,O137, IMVSaO138,O139,O140,O141,O142,O143,O144,O1458、野生型大腸桿菌O146,O147,O148,O150,O152,O154,O156,O157,O158, IMVSaO159,O160,O161,O163,O164,O165,O166 b9、野生型大腸桿菌O168,O169,O170,O171,O172,O173, c志賀氏菌D1,D2,D3,D4,D5,D6,D7,D8,D9,D10,D11,D12d10、野生型志賀氏菌 B1,B2,B3,B4,B6,B7,B8,B9,B10,B11,B12,B13,B14,B15, dB16,B17,B1811、野生型志賀氏菌 F1a,F(xiàn)1b,F(xiàn)2a,F(xiàn)2b,F(xiàn)3,F(xiàn)4b,F(xiàn)5(v4),F(xiàn)5(v7),F(xiàn)6,F(xiàn)X變,F(xiàn)Y變,DS,DR,d12、野生型大腸桿菌 O3,O11,O39,O59,O64,O73,O96,O95,O100,O114,O151,IMVSaO155,O12413、第2組菌株加上大腸桿菌標(biāo)準(zhǔn)菌株O35 IMVS*為了檢測(cè)的方便,我們將每13-17個(gè)菌分為一組,總共13組a. Institude of Medical and Veterinary Science,Anelaide,Australiab. Statens Serum Institut,Copenhagen,Denmarkc. O17和O173來自于Statens Serum Institut,Copenhagen,Denmark,其余來自于IMVSd. d.中國預(yù)防醫(yī)學(xué)科學(xué)院流行病學(xué)研究所表3大腸桿菌O35型O抗原基因結(jié)構(gòu)圖E.coli O35 O-antigen gene cluster galF rmlB rmlD rmlA rmlC gne gna wzx orf8 orf9orf10 wzy orf12 gnd%G+C43% 48% 43% 36% 32% 31% 29% 35% 30%29% 28% 29%表4大腸桿菌O35型O抗原基因簇基因位置TCTGTCATCC GGACCAAAGA GCCGCTGGAC CGCGAAGGTA AAGTCAGCCG CATTGTTGAA 60TTTATCGAAA AACCGGATCA GCCGCAGACG CTGGACTCCG ACATCATGGC CGTTGGTCGC120TATGTGCTTT CTGTCGATAT TTGGCCGGAA CTTGAACGCA CACAGCCTGG TGCATGGGGA180CGTATTCAGC TGACTGATGC CATTGCTGAA CTGGCGAAAA AACAGTCCGT TGATGCCATG240CTGATGACTG GTGACAGCTA CGACTGCGGT AAAAAAATGG GTTATATGCA GGCGTTTGTG300AAGTATGGAC TACGCAACCT CAAAGAAGGG GCGAAGTTCC GCAAAGGTAT TGAGAAGCTG360TTAAGCGAAT AATGAAAATC TGACTGGATG TAACGGTTGA TAAGAAAATT ATAACGGCAG420TGAAGATTCG TGGCGAAAGT AATTTGTTGC GAATTTTCCT GCCGTTGTTT TATATAAACA480ATCAGAATAA CAACGAGTTA GCAATAGGAT TTTCGTCAAA GTTTTCCAGG ATTTTCCTTG540TTTCCAGAGC GGATTGGTAA GACAATTAGC GTTTGAGTTT TTCGGGTTTA GCGCGAGTGG600GTAACGCTCG TCACATCGTA GACATGCATG CAGTGCTCTG GTAGCTGTAA AGCCAGGGGC660
GGTAGCGTGC ATTAATACCT CTATTAATCA AACTGAGAGC CGCTTATTTC ACAGCATGCT720Orf1的起始CTGAAGTAAT ATGGAATAAA TTAAGTGAAA ATACTTGTTA CTGGTGGCGC AGGATTTATT780GGTTCTGCTG TAGTTCGTCA CATTATAAAT AATACGCAGG ATAGTGTTGT TAATGTTGAT840AAATTAACGT ACGCCGGAAA CCTGGAATCA CTTGCAGATG TTTCTGATTC CGAACGCTAT900GTTTTTGAAC ATGCGGATAT TTGTGATGTA GCTGCAATGG CACGGATTTT TGCTCAGCAT960CAGCCGGATG CAGTGATGCA CCTGGCAGCT GAAAGCCATG TTGACCGTTC AATTACAGGC 1020CCTGCGGCAT TTATTGAAAC CAATATTGTT GGTACTTATG TCCTTTTAGA AGCGGTTCGG 1080AATTACTGGT CTGCTCTTGA TGGCGACAAG AAAAATAGCT TCCGTTTTCA TCATATTTCT 1140ACTGACGAAG TCTATGGTGA TTTGCCTCAT CCAGATGAAG TAAATAATAC AGAAGAATTA 1200CCCTTATTTA CTGAGACAAC AGCTTACGCA CCAAGCAGCC CTTATTCTTC ATCAAAAGCG 1260TCCAGCGATC ATTTAGTCCG TGCGTGGAAA CGTACCTATG GTTTACCGAC CATTGTGACT 1320AATTGCTCTA ACAATTATGG TCCTTATCAT TTCCCGGAAA AATTGATTCC ATTGGTTATT 1380CTCAATGCTC TGGAAGGTAA AGGATTACCT ATTTATGGTA AAGGGGATCA AATTCGCGAC 1440TGGCTGTATG TTGAAGATCA TGCGCGTGCG TTATATACCG TCGTAACCGA AGGTAAAGCG 1500GGTGAAACTT ATAACATTGG TGGGCACAAC GAAAAGAAAA ACATCGATGT AGTGCTCACT 1560ATTTGTGATT TGTTGGATGA GATTGTCCCG AAAGAGAAAT CTTACCGCGA GCAAATTACT 1620TATGTTGCCG ATCGTCCGGG ACACGATCGC CGTTATGCGA TTGATGCTGA GAAGATTGGT 1680CGCGAATTGG GATGGAAACC ACAGGAAACG TTTGAGAGCG GGATTCGTAA AACGGTGGAA 1740TGGTACCTGT CCAATACAAA ATGGGTTGAT AATGTGAAAA GTGGTGCCTA TCAATCGTGG 1800Orf1的終止 Orf2的起始ATTGAACAGA ACTATGAGGG CCGCCAGTAA TGAATATCCT CCTTTTTGGC AAAATAGGGC 1860AGGTAGGTTG GGAACTACAG CGTGCTCTGG CACCTCTGGG TAATTTGATT GCTCTTGATG 1920TTCACTCCAC TGACTACTGT GGTGATTTTA GTAATCCTGA AGGTGTAGCT GAAACCGTAA 1980GAAGCATTCG GCCTGATATT ATTGTCAACG CAGCCGCTCA TACCGCAGTA GACAAAGCAG 2040AATCAGAACC GAAGTTTGCA CAATTACTGA ACGCGACGAG TGTCGAAGCG ATCGCGAAAG 2100CAGCCAATGA AGTCGGCGCC TGGGTTATTC ACTACTCTAC TGACTACGTA TTTCCGGGAA 2160CCGGTGAAAT ACCATGGCAG GAGGAAGATG CAACCGCACC GCTAAATGTT TACGGTGAAA 2220CCAAGTTAGC AGGAGAAAAA GCATTACAAG AGCATTGTGC GAAGCACCTT ATTTTCCGGA 2280CCAGCTGGGT CTATGCAGGT AAAGGAAATA ACTTCGCCAA AACAATGTTG CGTCTGGCAA 2340AAGAGCGTGA AGAATTAGCC GTTATTAATG ATCAGTTTGG TGCGCCAACT GGCGCAGAGT 2400TGCTGGCTGA TTGTACGGCA CATGCCATTC GTGTGGCACT GAATAAACCG GAAGTTGCAG 2460GCTTGTACCA TCTGGTTGCT AGTGGTATCC ACAACCTGCA CGATTATGCT GCGCTGGTAT 2520TTGAAGAGGC GCGCAAAGCA GGCATTCCCC TTGCACTCAA CAAGCTCAGC GCAGTACCAA 2580CAACAGCCTA TCCTACACCA GCTCGTCGTC CACATAACTC TCGCCTTAAT ACAGAAAAAT 2640ATCAGCAGAA CTTTGCGCTT GTCTTGCCTG ACTGGCAGGT TGGCGTGAAA CGAATGCTTA 2700Orf2的終止ACGAATTATT TACGACTACA GCAATTTAAT AGTTTTTGCA TCTTGTTCGT GATGGTGGAG 2760Orf3的起始CAAGATGAAT TAAAAGGAAT GATCAAATGA AAACGCGTAA AGGTATTATT TTAGCGGGTG 2820GTTCTGGTAC TCGTCTTTAT CCTGTGACTA TGGCCGTCAG TAAACAGCTG TTACCGATTT 2880ATGATAAACC GATGATCTAT TACCCGCTTT CTACACTGAT GTTAGCGGGT ATTCGCGATA 2940TTCTAATTAT AAGTACGCCA CAGGATACTC CTCGTTTTCA ACAACTGCTG GGTGACGGGA 3000GCCAGTGGGG GCTAAATCTT CAGTACAAAG TGCAACCGAG TCCAGATGGT CTTGCGCAGG 3060CATTTATCAT CGGTGAAGAG TTTATCAATG GTGATGATTG TGCTTTGGTT CTAGGTGATA 3120ATATCTTTTA CGGTCACGAT CTGCCGAAGT TAATGGATGT CGCTGTTAAC AAAGAAAGTG 3180
GTGCAACGGT ATTTGCCTAT CACGTTAATG ATCCTGAACG CTACGGTGTC GTTGAGTTTG3240ATAAAAAAGG TACGGCAATT AGCTTGGAAG AAAAACCGTT ACAACCAAAA AGTAATTATG3300CGGTAACCGG GCTTTATTTC TATGATAACG ACGTTGTCGA AATGGCGAAA AACCTTAAGC3360CTTCTGCCCG TGGTGAACTG GAAATTACCG ATATTAACCG CATTTATATG GAACAGGGGC3420GTTTATCCGT TGCCATGATG GGACGTGGTT ATGCATGGCT GGACACGGGG ACACATCAGA3480GCCTGATTGA GGCAAGCAAC TTTATTGCAA CAATTGAAGA GCGCCAAGGG TTAAAGGTAT3540CTTGCCTGGA AGAGATTGCT TATCGTAAAG GCTTTATTGA CGCAGAGCAG GTTAATGTAT3600TAGCCGAACC ACTAAAGAAA AATGCTTATG GTCAGTATCT GCTAAAAATG ATTAAAGGTT3660Orf3的終止 Orf4的起始ACTAAAAATG AATGTAATTA AAACTGAAAT TCCTGATGTA TTAATTTTGG AGCCGAAAGT3720TTTTGGTGAT GAGCGCGGTT TTTTTATGGA AAGCTTTAAT CAGAAAGTTT TCGACGAGGC3780TGTAGGGCGT AAGGTTGAAT TTGTTCAGGA TAACCATTCC AAATCAATTA AGGGGGTGTT3840ACGCGGACTG CACTATCAGC AGGAACCTTA TGCTCAAGGT AAATTAGTTC GTTGTGTGGT3900TGGAGAGGTC TTTGATGTTG CGGTGGACAT CCGTAGAGAC TCTGAAACAT TTGGTAAATG3960GGTTGGTGTA AATCTTTCGG CTGAAAATAA AAAACAATTA TGGATACCTG AAGGTTTTGC4020TCATGGGTTT TATGTATTGA GTGATACTGC TGAATTTGTC TATAAAGCGA CTAATTATTA4080TAATTTTCTA TCAGATCGGG GGATCATTTG GAATGATAAA AATATAAATA TCAACTGGCC4140AATTGTCGGA GATATACTTC TTTCTGAAAA AGATATGAAT CATAGGACTT TTACTGAAAC4200Orf4的終止 Orf5的起始ATTTAATGTTTGATATTGAA ACTTACATTT AGAGAGATAA TTAATGAAAC TAGAAAATTT4260AAATATTGGC ATAGTCGGTT TAGGTTACGT CGGTTTACCG CTTGCGGTCG AGTTTGGTAA4320AAAGTTTGTG ACAGTTGGTT TTGATATAAA AAGAGCGAGA GTTGAAGAAC TAAAAAATAA4380TATTGATTCA ACTTATGAAT GCTCAAGCAA TGAACTACAG TTGGCTAATT TATTAAAATT4440CACAAATAAC ATTGATGATA TTAGGAAATG TAATGTATAT ATTGTAACTG TACCAACTCC4500AATAGATAAG TTTAAACGGC CTGATTTATC ACCATTAATT AATGCATCAA AATTAATAGG4560TTCAGTATTG AATAAAGGTG ATGTTGTTAT ATATGAGTCA ACAGTATATC CGGGGGCAAC4620TGAAGAAGAA TGTGTTCCTG TACTAGAAGA ACAATCAGGT ATGATTTTTA ATAAGGATTT4680TTTTGTAGGA TATAGTCCTG AGAGAATTAA TCCTGGTGAT AAAGAACATC GTGTTACTTC4740AATAAAGAAA GTTACATCTG GGTCGACCAT TGAAATTGCC AATTTTGTAG ATTCATTATA4800TGCAACCATA ATTAATGCTG GGACTTATAA AGCAAGTTCA ATAAAAGTAG CAGAAGCGGC4860GAAAGTAATT GAGAATACTC AACGTGATTT AAATATTGCA CTGATTAATG AATTGGCTAT4920TATATTTAAT AAGTTAAATA TTGATACAGA AGAGGTACTA AAAGCTGCAG GGACTAAATG4980GAACTTTTTG TCATTTAAAC CAGGACTTGT TGGTGGGCAT TGTATTGGAG TTGATCCCTA5040TTACTTGACA CATAAAGCTC AATCCATCGG ATATAATCCG GAAGTTATAT TATCAGGAAG5100AAGAATTAAC GATGCTATGG GGGAATATGT GGCGTCACAG TTAGTAAAAA AAATGATAAA5160AAAGAAAATT AAAATCGATT GTGCAGATGT CTTAATTATG GGGTTAGCAT TCAAAGAAAA5220CTGTCCTGAT CTAAGAAATA CTAAAGTAAT AGATATTATA AAGTCTTTAA GAGATTATAA5280TATCAATGCA GAGGTTTATG ATCCTTGGGT TTCCCCAGAT GAAGCTGCCC AAGAATATGG5340TGTCAATATT AATAATAAAG TCCCGCCCAA AAAATATGAT GCTATTTTGT TTGCCGTTGC5400TCATAATGAA TTTAAAGATA TGACGAAAGA GGAAATTCTC TCATTAACAA AAAATAATTA5460Orf5的終止TGTTATATAC GATCTAAAGT ACATTATAGC GTCTGACTTG GTTATTGATC GCTTGTAATA5520Orf6的起始TATAGGCTTT GAGGACGATT ACATGAATTA TGAAGAGTTA CAAGACTATC TGTTAAATAA5580TCAAAGAACT TGGTTAATTA CTGGTGTGGC TGGGTTTATT GGCTCCAACT TACTTGAAAA5640ACTTTTAAAT CTAAATCAAT GCGTTATTGG CGTGGATAAT TTTTCAACTG GTTTTCAATC5700
AAATTTAAAT GAAGTTAAAG ATAATGTACC TGAATCTTCT TGGAGAAGAT TTAAATTTAT5760TGAAGGAGAT ATCTGTAATT TAGATGTCTG CAAAAAAAGT ATCAGTGGTG TCGATTATGT5820TCTGCACCAA GCAGCACTTG GTTCAGTACC GAGATCAATT GAGAATCCCA TTCTGACCAA5880TGCTTCAAAT ATTAGTGGTT TTTTAAATGT TTTAGATTGT GCAAGAAGAG AAAATGTAAA5940AAGTTTTACT TACGCTGCTA GTAGTTCGAC ATATGGTGAT CATACAGGTT TACCTAAAGT6000TGAAAATATT ATAGGTAATC CACTTTCTCC TTATGCTGTG ACAAAATATG TAAATGAGTT6060ATATGCAGGT GTTTATGCAC TAAATTATAA TTTCAAAAGT ATAGGTCTTA GATATTTTAA6120TGTATTTGGG AGAAGGCAAA ATCCTGAAGG GGCATATGCG GCTGTGATTC CTAAATGGAT6180CCTTTCGATA TTGAATGGTG ATGATCTATA TATAAATGGT GATGGAAATA CGAGTAGAGA6240TTTTTGTTAT ATAGATAACG TAGTTCAAGC TAATCTATTA GCAGCACTTG CAAATGACAA6300CGTAAAGAAT AACATATTTA ATATTGCTTA TGGACAACAA ACAAGTCTTA ATAAACTTTT6360TAAATATATT ACAGTTGCTT TAAGTAATGA AGGAGTCGAA TACAAAAAAC AACCTATATT6420TAAGGAATTT CGATTAGGAG ATGTAAGACA TTCGCTCGCT AATATTGATA AAGCTAAAAT6480TATGTTGGGA TATGAACCAT GCTATAACAC TAACCAGGGA ATAAAGTTAG CTATTAAGTG6540Orf6的終止GTATATAAAT AATCTGACCA AATGAAACAT AGTGGCTGTA GGCTCGAGAT TAAAGTGAGT6600CTGCAGTTAC TATAATGCAT CAGGATTGAA ATATATCCAT GCCATTTATT GGAATTTAAT6660Orf7的起始ATGCACAAAG AATTCACATGTATTTAAAAA TATTAATAGA CAATATTTCA CTTGTAATCC6720AATATTTTTT TGGTGGCATA GCGGTGTTCT ATGTTACACC GTTAATTGTG AAATCTGTTG6780GTATTCATAC CTATGGTAAT TTAGCAATTA TGTTTGCTAT TGTTACTTAC ATATCAGTCG6840TAATACAGTA TTCATTTAAT TTGATTGGGC CAAAATTAAT TGCTGAAGGA AATTGCAAAA6900AAACATTTAA TACAATAATA TCCGCTAAAA TAGTACTTTT TTTATTGTCA CTTATTTTTT6960TTCTATTATA TTTTTATTTC TTTCAAAACA AACATGATGA TGTATTTTTA TTATTTCTTG7020TTTTTCCACT TTCTTGGGTT TTTAATAGCG CTTGGTATCT TCAAAGTAAA GGTTATTTTG7080TTATAAGTAG TGTGTGCTCA ATAATTGGAT CACTAATCAC ATTTGTTATC GCGTATTTTT7140TTATAAATAC AACAACTGGC TTATTTGTTC CAATATTATG TTTGGTTTTA TCTTCGTTTA7200TAAATGGCCT TCTTACTTTT TTCTTTGCAG TAAAAAATAA TGGACATATT GAGATAGTTA7260ATCCACTACC TATGTTGAAA GAAGGAATGC CTCTTTTTGT TTCCCAGATA ATCTCCTCGT7320TATATACAAT GTCTGGTGTT TTTATAATTA CCTATTTTTA TGGAGTTGCA TCTGCAGGTA7380CATATGCCAT TGTAGAACGT TTTATGAACT TATTAATTTC TTTAGGCGTT CTTACACATG7440TGGCAGCCTA TCCAAAATTG GCGAGGTTAT TCAATAAAGA TAGATTAGAA TATAGAAAGA7500CATTATTATT TGTTATTGCA TTATATACTT TGTTTTCTTG TTGTGTAGCC ATAGTTGTTT7560TTAACTTTCA TCAAAACATT GTAACATATA TGTTTGGGAG CGAAAGTGTA AATGCTAAAG7620AACTAATTTA CTCAGCGTGT ATATTTATAT TTGTTTCCAT ATATGGACCG GTAGTGACAG7680GGTATTTTAC TTTAAAAGTAAAAGGGAGAA TGATAAATAAC AATTAATATA ATAATAGCTT7740TGCTATCTTT ACTGCTAGGA GTAGGGATGT TAAAAATAGT GGGTAGTAGT GGATGGTTAA7800TAGGACTGAG TCTCGCTCAG TTACTTTATA TTGCTATCTT TTTTAAGATT TTTATTTGGG7860Orf8的起始Orf7的終止GAAGAAAAGAATGTGCGGTCTAGTTGGTTT TTTTAGTAAA GCTAATCATG ATACGAATAT7920AATTCGGAAT ATGTTGCATA AAATTAGACA TCGTGGACCC GATTCATTCG GGATTTGGGC7980CGATTTAGAA TGCAATATCC ATTTTGGCCA CGTTAGATTA TCGATTGTTG AATTGAGTAG8040CGCAGGACAT CAACCGATGT CAACTTCATG TGGACGATTT ACTATTATAT TTAATGGTGA8100GATATATAAC CACCTCGATA TACGTCGGGA ACTTGGCAAT AATATAAAGT GGTCAGGAAC8160ATCTGATACT GAAACCTTAC TTAAAAGTAT TTCGACTTGG GGGATTTCTA GCACATTGAA8220AAAAATGGTT GGGATGTTTT CCTTTGCATT GTGGGATAGT GTAGAACGAA GTTTATATCT8280
TGCGAGAGAT AGAATGGGTG AAAAACCTCT CTATTACGGT TGGTGTAATG GTTCTTTTAT8340ATTTGGCTCG GAACTGAAAG CATTAAAATC ACATCCTGAT TTTGATGCTG AAATTGACTG8400GCAGGCAATT AATGGATATT TGCATAATAA TTATATTTCT TCACCCTTAA CTATTTATAG8460CAAGTTAAAA CAATTGCGAC CTGGTCATTA CATTAAAATG AGCTATGATG ATCTTCTCTC8520AGGTAATATA CCGGTGCTGT ATAAGTATTG GGCATTATCT TTTCCTGTTA GTGATAATAA8580CTGCAGGTAT GTTGATTCTG TGTCAGAATT AGAGACTTTA CTAACAGAAT CTGTTTCTCT8640TCAGTCGATT GCTGATGTTA AGGTTGGAGC CTTTCTATCA GGTGGAATAG ATTCTACTAC8700CATCGTAGCA ATGTTGAAAA AAAGTGGACG TGATGTATCT ACATTTTCTA TCGGAATGCC8760TAATAAACAA TTTGATGAAT CACACCACGC CGAACAGATC GCAAAATATA TTGGTACTCA8820GCATTATACA CATATGATAA CACCTCAAGA AGCTCTTGAG GTAATTGATA ATATTCCTGC8880AATTTGGGAT GAGCCTTTCG CAGATAGTTC TCAGATACCA ACATACTTGG TTAGTAAGTT8940TGCTAAAGAG TATGTAACAG TAGCTTTGTC TGGTGATGGT GGAGACGAGC TGTTCATGGG9000ATATAACCAA TACCCTTTGT TAAAGAGAAT TTGGGACACT AGATTTTTAT CTAATCTGCA9060TTTAGAATTT ATAGCTAATA TAATGACAAA AATGGGATTT AAAAATTCCA ATGTAATTGT9120AAAAAGGGCT TTGAATTTAA GTCAAGGTTG GCGTTGCAAA ACTCCTTTTT TATTAAATGA9180TTTTTGGATG GATAAGTATC GCAATGCAGA ATTTCCTTTA TTAAAACCTA TACGTTGTGA9240ACGTGATTTA GATTTAAATT ACTCAGATGG AATTTCAGCA ATAACTCAGC ACGATTTAAA9300TTATTATCTT TGTGATGATA TATTAACTAA AGTAGACAGA GCCTCAATGG CGGTTAGTTT9360AGAAACGCGA GCTCCATTTT TAGATCATCG CGTTGTTGAA TTTGCGTTTG CTTTGCCGAC9420CTCATTCAAA CTGGATAAGT ATAATCAGAA AAAAATACTC AAGTCAGTAT TATATAAACA9480TGTTGATAGT AAATTATTAG AACGCCCTAA GCAAGGGTTT TCATTACCTA TGAAGTATTG9540GTTAAAAGCT GAGCTAAAAG GATGGGCACG AGATCGTCTT GATTCTTTAC CAGATGATGT9600TTTCGATAAA GTTGTTGTTG ATAATATTTG GAAAGATCAT ATTAATGATA TCAAGGATAA9660Orf9的起始 Orf8的終止TAGCGAGCGA ATTTGGGGTT TGAGTAATTT AGCTAATTTT TTGGAGTTAC AATGAAAAAG9720ATTGCTATAT ATACTTGTGT TACCGGCGGT TATGATGTAG TTAAAGCCCC ACTTAAAATT9780AATCATAATA TAGATTATAT ATGTTTCAGC GATCAAAAAA TTTCAGCTCC TTATCCTTGG9840AAAGTTAGAA ATATAGCAGA GCTTAAAATA TCGAAGTCAT TTGACAAGAA AACAATTAAT9900CGCGCTATCA AAATATGTCC TCAAGATTTT GGTCTATTAG AAGAATATGA ACTAACTATT9960TATATAGATG GCTCGATAGA AATTATGGAC GATCTGTCTT TACTAATTGA TTTTGTAACA 10020AAACAAGATT ACGATATTTT TATGTATGAA CATTTTTTAA GAAATTGCCT GTATGATGAA 10080GCTGAAGAGT GTCTTCTAAT TGGATATGAT TGGTATTGGA ATATTCAAAA GCAAGTTAAA 10140AGATATAAGC AGCGAGGGTT TCCAGTTTCA TATGGTCTCT TTGAGTGTGG GATTATTATA 10200AGAAAAAAAT CTCGAGACTT AAATGTAATA TTACAAAAAT GGTTTGAAGA ATATGTAAAA 10260GGAGTTAAGC GTGACCAGCT TTCGCTCACG TATATATTAT GGGAAAATGG TTACCATTTG 10320TATTCCTTGG GGGAGAGTGA TGCTAGATAT AAAAATAGAC ATTTTAAGTT ACATAGGCAT 10380TCAATAAAAA GTAATGAATA TCTCAGGAAG TTTAGGTCTA AACTTAATAA GTTGTTGTTA 10440Orf9的終止 Orf10的起始ATTTTTTGGG GAGGGATATA AAGTGTACGA TAAAGTTTGT GGTATTGTAA TTGTATTTTA 10500TCATCCTAAT GATGAAAATA TTAATAGTGC AAAAAAGTTA AGTGAGTCTT ATAAAGTAAT 10560AATAGTTGAT AATAGTGAAA AGGATATAAC TTATTCCATA CCTAAAGCGC ATATTATAAA 10620ATTGAAAAGA AACGTAGGTA TCGCTGCAGC ACTAAATATT GGAATACATT TTTTTATTAA 10680AAATAATTAT AAATATGCTG TTTTATTAGA TCAAGATAGT GAACCTGATA AATCACTTTT 10740GAGTTCACTT ATCAATTATT CTGAAAATTG CACGGATAAT GTATGTTTAG TAGCACCGTC 10800CTATTATGAT AGAGCTATTA ATAAGAATGC TGATTTTATT CTATGCACTG AAAAAGGTAT 10860TATTAGACAG CCTGCAATTG GAAAAAATGC GATTGAAGCG TCCTATGTTA TAACTTCTGG 10920
TTCTCTCTTA AGACTGTCAT CTATTTCTAA TATTGGATTC ATGGATGAAG ATTTATTTAT10980AGATTTTGTT GATATTGAGT GGTGTTTAAG AGCAAATTCT TTGGGATATA AAATATTAGG11040TTTGCCATGG TTAAAGATGT CACATGAGAT CGGTGATAAA CCTATTAAAA TATTAAATAA11100AAAGTATGTT AATCATTCCC CAATTAGACA CTATTACTAT TTTAGAAATA TATTTCTGTT11160GATGCGTATG AGTCATATCC ATCCACAATG GAAAAAATGG GAGTTGATAA AGTTATTACC11220TAGATTTTTT GTTTATGCAT TTTTTACAAA GAATAATATG AAACATATTG TCTCTATGTT11280Orf11的起始 Orf10的終止AACTGGTGTA TATGATGGTA TTCTTGGGCG TGTGGGGAAA AAGAAATGAA TGGAGTAGCC11340AAACCCATTA TAATTTCTTG GTTTGTTCTT TGTACTCTTG TGGTTTTCTT TTTATGTAGT11400TTCGAACAAT TCCCGGATTA TTATTCATAT CTCAACTGGT ATGAGTTATC AGTATCTGCA11460ACACTGAATA ATAATTGGGT CTTTTTTAAA GATCCCGGAT TTTATTTGTT ATCAGTTATA11520TCAAATAATT TTGATTTTGG TATCATTGGG GCAATTTTTT TCCTTTTTAT TATATCACTT11580TCATGTAAGA TTTTCTTTTG TATTAAGTTA CTTGATTGGG AAGTATTATT CTGGGTTTTA11640CTTTTATATC TTTCCAGACT TTTTATTATT CATGATCTTG TTCAATATCG TGCAGGTGCT11700TCAATTGGTT TATCGGCATT ATTTGTATAC TTTTATTTAG AAAAAAAAAG GATTAAGTCT11760TTTTTTTTCT TAAGTCTCGC ACTTTCTATC CACCTTTCAA GTTTGTTAAT GGTGTCAGTC11820ATCCCTATTG CATGGTTTCT TAATAGGAAT GTAGGTGGAA ATATAATTCG ACAGATAGCA11880ATATTACTTT TAATATTGTC GTTGAGCTTA TTTTTTGATC CTTACGTTAA CTTGCTCAGA11940TTGGTATCAC AGTTTCCCTT AATGCATGAA AGAATTGCTC CGTATTTGGA TGGTTCTTAT12000CTTGTTAGTA ACACATCAAT GTTTAATAGT TTTGTAATAA TTAAAATTAT TTCATATGTG12060ATTTTTTTTG TTTGGATATG CAAAAACAAA AATGTCGGGT TGACTAATGA AAATTACTTA12120ATTTATCTTT GTTTCTTCAT ATCTATTGTA GGATTGTTTC TTTTTTGGTG TTTTAGAAGC12180AATGACTCAC TTTCCATACG TTTTTCTGAT TTTTTCGCTT TGTATGATAT CGTTTTTTTT12240GCTCTATTGT TAAATGTTTT TGATGTGTTT GGAAAATTTA TCTATAGATA TTGTCTTTTA12300Orf11的終止GTCGTGGTGA TTGTTTTTTT TATATCTTCA ATGAAGTTAA TAAATTAATT TCTTATATGT12360Orf12的起始GTGCTAACTA TGAATGTTTA TATATCTGTT GTCTCTCATA ATCATGCTAA AATGATTATG12420GAATTTGATT GTTTACGCAA ACTTGCTAAG AGGTATAAAG TAGTTATTAA AAATAATTCT12480GAACGCGAAA GCGTTATTTT GAATGATTAC TGTAGGGAAA ATGGAATATA TATAATTGAT12540TATGCCTATA ATACTGGGTT TGGCAAAAAT AATAATATTG TATTTCAATT TTGTGTAAAA12600AAATTAGGGA TGACTAGTGA TGATTATTTT ATCCTTATAA ATCCCGATGT TATAATTGAT12660TCTATTAACA TTGATAAACT TATTTCCATA ATTGAAAAGG ATATGGTAGA TATTTCTGGA12720ATATCTCTGT ATAAAGATGA TTCTTTGTCG ATAAGAGATT ATTCAATACG TAATTATCCT12780TCGCTTTACA CTTTTTTTAT ATCGTTCTTC CGATTCCATG AAAGTTATCG TGTATTGCCA12840CCTAATGACG ATTGCTCAAG TGTAGATATG GACTGGGTGG CTGGTTCTTT TATGGCTTTT12900AAAACAAATG CATATTCCAG TTTATTAGGT TTCGATGAAA ATTACTTCAT GTATTGCGAG12960GATTTAGATA TTTGTTTTAG AGCCAAGAGT AAGGGCTTAA ATTTAAAGTA CATACCCAGT13020GTTACTGGAA TTCATAAGGC TCAGCATAAT AATAGAAGAT TATTTAGCAA GCATTTTTAT13080TGGCATATAA AAAGCGCACT AAGATTTTTA GTTAGAAAAA AAATAAAATT ACAAGTGAAA13140Orf12的終止TCTATATTGA AATGATATCT TAATATCAGT GGAGTTTTAA AGATGTCATA ATATATATCG13200TTTGCTATCT ATTTATATTA GTTTTAGGTT AGAATCTATT ACTAGATAAC CGCGCATATT13260TTCCGCGGTG ACCACACCAG ACAGGAGTAA ACAATGTCAA AGCAACAGAT CGGCGTCGTC13320GGTATGGCAG TGATGGGGCG CAACCTTGCG CTCAACATCG AAAGCCGTGG TTATACCGTC13380TCTATTTTCA ACCGTTCCCG TGAGAAGACG GAAGAAGTGA TTGCCGAAAA TCCAGGCAAG13440
AAATTGGTTC CTTACTTTAC GGTGAAAGAG TTTGTTGAAT CTCTGGAAAC GCCTCGTCGC13500ATCCTGTTAA TGGTGAAAGC AGGTGCAGGC ACGGATGCTG CTATTGATTC TCTCAAGCCG13560TACCTCGATA AAGGTGACAT CATCATTGAT GGTGGTAACA CCTTCTTCCT GGACACCATT13620CGTCGTAACC GTGAGCTTTC TTCAGAAGGC TTTAACTTCA TCGGTACCGG TGTCTCCGGT13680GGTGAAGAAG GTGCGCTGAA AGGTCCTTCC ATTATGCCTG GTGGGCAGAA AGAAGCCTAT13740GAACTGGTTG CGCCGATCCT GACCAATATC GCCGCCGTTG CTGAAGATGG CGAACCGTGT13800GTTACCTATA TTGGTGCCGA TGGTGCGGGT CACTATGTGA AAATGGTTCA CAACGGTATT13860GAATACGGTG ATATGCAACT GATTGCTGAA GCCTATTCTC TCCTGAAAGG CGGCCTGAAT13920CTCTCTAACG AAGAACTGGC ACAGACCTTT ACCGAGTGGA ATAACGGTGA ACTGAGCAGC13980TACCTGATCG ACATCACCAA GGATATCTTC ACCAAAAAAG ATGAAGACGG TAACTATCTG14040GTTGATGTGA TCCTGGATGA14060以上所述,僅是本發(fā)明的較佳實(shí)施例而已,并非對(duì)本發(fā)明作任何形式上的限制,凡是依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡(jiǎn)單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
1.一種對(duì)大腸桿菌O35型的O-抗原特異的核苷酸,其特征在于其是如SEQ ID NO1所示的分離的核苷酸,全長14060個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。
2.按照權(quán)利要求1所述的對(duì)大腸桿菌O35型的O-抗原特異的核苷酸,其特征在于其是由12個(gè)基因組成,都位于galF基因和gnd基因之間。
3.按照權(quán)利要求2所述的對(duì)大腸桿菌O35型的O-抗原特異的核苷酸,其特征在于,所述的基因是轉(zhuǎn)運(yùn)酶的基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因,包括wzy基因或與wzy有相似功能的基因;鼠李糖合成酶基因rmLBDAC,包括rmLBDAC基因或與rmLBDAC有相似功能的基因;UDP-GalNAcA(N)合成酶基因gna,gne,orf8或與gna,gne,orf8有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf9、orf10、orf12基因;其中所述的基因wzx是SEQ ID NO1中的6678至7883堿基的核苷酸;wzy是SEQ ID NO1中的11326至12348堿基的核苷酸;rmLBDAC基因分別是SEQ ID NO1中的745至1830,1830至2726,2787至3665,3668至4213堿基的核苷酸;Gna是SEQ ID NO1中的4244至5518堿基的核苷酸;Gne是SEQ ID NO1中的5543至6565堿基的核苷酸;orf8是SEQ ID NO1中的7871至9715堿基的核苷酸;orf9是SEQ ID NO1中的9712至10461堿基的核苷酸;orf10是SEQID NO1中的10463至11329堿基的核苷酸;orf12是SEQ ID NO1中的12370至13155堿基的核苷酸。
4.按照權(quán)利要求1或2所述的對(duì)大腸桿菌O35型的O-抗原特異的核苷酸,其特征在于它是源于所述的wzx基因、wzy基因;糖基轉(zhuǎn)移酶基因包括的orf9、orf10、orf12基因;以及它們的混合或它們的重組。
5.按照權(quán)利要求4所述的對(duì)大腸桿菌O35型的O-抗原高度特異的核苷酸,其特征在于,所述的源于wzx基因的寡核苷酸對(duì)是SEQ ID NO1中的7301至7319堿基的核苷酸和7778至7796堿基的核苷酸;SEQ ID NO1中的6740至6758堿基的核苷酸和7275至7293堿基的核苷酸;源于wzy基因的寡核苷酸對(duì)是SEQ ID NO1中的11785至11803堿基的核苷酸和12297至12315堿基的核苷酸;SEQ ID NO1中的11706至11726堿基的核苷酸和11936至11964堿基的核苷酸。
6.權(quán)利要求1所述的對(duì)大腸桿菌O35型的O-抗原特異的核苷酸在檢測(cè)表達(dá)O-抗原的細(xì)菌、在診斷中鑒定細(xì)菌的O-抗原和細(xì)菌的其它多糖抗原的應(yīng)用。
7.權(quán)利要求1所述的對(duì)大腸桿菌O35型的O-抗原特異的核苷酸的重組分子,而且通過插入表達(dá)可提供表達(dá)大腸桿菌O35型的O-抗原,并成為細(xì)菌疫苗。
8.按照權(quán)利要求1所述的對(duì)大腸桿菌O35型的O-抗原特異的核苷酸的應(yīng)用,其特征在于它作為引物用于PCR、作為探針用于雜交反應(yīng)與熒光檢測(cè)、或者用于制造基因芯片或微陣列,檢測(cè)人體和環(huán)境中的細(xì)菌。
9.權(quán)利要求1所述的對(duì)大腸桿菌O35型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O35型,離心收集細(xì)胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細(xì)胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘,之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時(shí),再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清液再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提兩次,取上清液再用等體積的乙醚抽提以除去殘余的酚,上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,將DNA重懸于30ul TE中;基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測(cè);(2)通過PCR擴(kuò)增大腸桿菌O35型中的O-抗原基因簇以大腸桿菌O35型的基因組為模板通過Long PCR擴(kuò)增其O-抗原基因簇,首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇啟動(dòng)子區(qū)的JumpStart序列設(shè)計(jì)上游引物(5’-ATT GTG GCTGCA GGG ATC AAA GAA AT-3’),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計(jì)下游引物(5’-TAG TCG CGT GNG CCT GGA TTA AGT TCG C-3’);用Boehringer Mannheim公司的Expand Long Template PCR方法擴(kuò)增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘;然后94℃變性10秒,60℃退火15秒,68℃延伸15分鐘,這樣進(jìn)行30個(gè)循環(huán),最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測(cè)PCR產(chǎn)物的大小及其特異性,合并5管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫,反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進(jìn)行,酶切10分鐘使DNA片段大小集中在1.5kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng),合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中,隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTIP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃30分鐘,將酶切產(chǎn)物補(bǔ)成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴(kuò)大為80ul,70℃反應(yīng)20分鐘,使DNA的3′端加dA尾,此混合物經(jīng)等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接10小時(shí),總體積為90ul,其中有9ul的10×buffer和25單位的T4DNA連接酶。最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物;用Bi0-Rad公司的電轉(zhuǎn)化感受態(tài)細(xì)胞的制備方法制備感受態(tài)大腸桿菌DH5α細(xì)胞,取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到Bi0-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時(shí)間為5.0毫秒至6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上,在37℃過夜培養(yǎng),次日得到藍(lán)白菌落,將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨卞青霉素的LB固體培養(yǎng)基上培養(yǎng),同時(shí)從每個(gè)克隆中提取質(zhì)粒,并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構(gòu)成了大腸桿菌O35型的O-抗原基因簇文庫;(4)對(duì)文庫中的克隆測(cè)序從文庫中挑選插入片段在1kb以上的96個(gè)克隆用本實(shí)驗(yàn)室ABI3730型DNA自動(dòng)測(cè)序儀對(duì)克隆中的插入片段進(jìn)行測(cè)序,序列達(dá)到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學(xué)實(shí)驗(yàn)室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O35型的O-抗原基因簇的核苷酸全長序列;序列的質(zhì)量主要由兩個(gè)方面來保證1)對(duì)大腸桿菌O35型的基因組作5個(gè)Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫,2)對(duì)每個(gè)堿基,保證3個(gè)以上高質(zhì)量的覆蓋率,在得到大腸桿菌O35型O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心(The National Center forBiotechnology Information,NCBI)的orffinder發(fā)現(xiàn)基因,找到7個(gè)開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對(duì),最后得到大腸桿菌O35型的O-抗原基因簇的結(jié)構(gòu);(6)特異基因的篩選針對(duì)大腸桿菌O35型的O-抗原基因簇中的wzx、wzy基因設(shè)計(jì)引物;在每個(gè)基因內(nèi)各設(shè)計(jì)了兩對(duì)引物,每對(duì)引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進(jìn)行PCR,除在第13組中得到了預(yù)期大小的一條帶外,在其他組中都沒有擴(kuò)增到任何產(chǎn)物,所以wzx、wzy基因?qū)Υ竽c桿菌O35型的O-抗原都是高度特異的。
全文摘要
本發(fā)明提供一種對(duì)大腸桿菌O35型(Escherichiacoli O35)的O-抗原特異的核苷酸,它是大腸桿菌O35型中控制O-抗原合成的基因簇的核苷酸全序列,如SEQ ID NO1所示的分離的核苷酸,全長14060個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸;還包括源于大腸桿菌O35型的O-抗原基因簇中的糖基轉(zhuǎn)移酶基因和寡糖單位處理基因的寡核苷酸;本發(fā)明通過PCR證實(shí)寡核苷酸對(duì)大腸桿菌O35型的O-抗原都有高度的特異性;本發(fā)明還公開了用本發(fā)明的寡核苷酸檢測(cè)和鑒定人體及環(huán)境中的大腸桿菌O35型的方法。
文檔編號(hào)C07H21/00GK1554763SQ20031011786
公開日2004年12月15日 申請(qǐng)日期2003年12月22日 優(yōu)先權(quán)日2003年12月22日
發(fā)明者王磊, 孔慶科, 彭霞, 王 磊 申請(qǐng)人:南開大學(xué)