專利名稱:對(duì)大腸桿菌o145型的o-抗原特異的核苷酸的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及大腸桿菌O145型(Escherichia coli O145)中控制O-抗原合成的基因簇的核苷酸全序列,特別是涉及大腸桿菌O145型中控制O-抗原合成的基因簇中的寡核苷酸,可利用這些對(duì)O-抗原特異的寡核苷酸快速、準(zhǔn)確地檢測(cè)人體及環(huán)境中的大腸桿菌O145型并鑒定這些致病菌中的O-抗原。
背景技術(shù):
O-抗原是革蘭氏陰性細(xì)菌脂多糖中的O特異性多糖成分,它由許多重復(fù)的寡糖單位組成。O-抗原的合成過(guò)程研究得較清楚先由糖基轉(zhuǎn)移酶將核苷二磷酸單糖轉(zhuǎn)移到一個(gè)固定在細(xì)胞內(nèi)膜的脂分子上,然后在內(nèi)膜的內(nèi)側(cè)合成寡糖單位,O-抗原的寡糖單位再通過(guò)轉(zhuǎn)運(yùn)酶被轉(zhuǎn)移到內(nèi)膜外側(cè),而后通過(guò)聚合酶聚合成多糖,再被連接到一個(gè)糖脂分子上形成脂多糖分子[Whitfield,C.(1995)“Biosynthesis of lipopolysaccharide O antigens”.Trends inMicrobiology.3178-185;Schnaitman,C.A.and J.D.Klena.(1993)“Genetics oflipopolysaccharide biosynthesis in entericbacteria” .MicrobiologicalReviews,57(3)655-682]。編碼負(fù)責(zé)O-抗原合成的所有酶分子的基因一般在染色體上相鄰排列,形成一個(gè)基因簇[Reeves,P.R.,et al.(1996)“Bacterialpolysaccharide synthesis and gene nomenclature”Trends in Microbiology,4495-503]。在志賀氏菌、大腸桿菌和沙門氏菌中,O-抗原基因簇上游都有一段39bp的保守序列,稱作JUMPStart序列[Reeves,P.R.,et al.(1996)“Bacterial polysaccharidesynthesis and gene nomenclature”Trends in Microbiology,4495-503]。O-抗原基因簇含有三類基因糖合成路徑基因,糖基轉(zhuǎn)移酶基因,寡糖單位處理基因,其中糖合成路徑基因編碼的酶合成O-抗原所需的核苷二磷酸單糖;糖基轉(zhuǎn)移酶基因編碼的酶將核苷二磷酸單糖及其它分子轉(zhuǎn)到單糖上從而使單糖聚合成寡糖單位;寡糖單位處理基因包括轉(zhuǎn)運(yùn)酶基因和聚合酶基因,它們將寡糖單位轉(zhuǎn)移到細(xì)菌內(nèi)膜外側(cè),再聚合成多糖。糖基轉(zhuǎn)移酶基因和寡糖單位處理基因只存在于攜帶這些基因的基因簇里。O-抗原中單糖的不同,單糖間聯(lián)結(jié)鍵的不同和寡糖單位之間聯(lián)結(jié)鍵的不同構(gòu)成了O-抗原的多樣性,而單糖的組成、單糖間的聯(lián)結(jié)鍵及寡糖單位之間的聯(lián)結(jié)鍵是由O-抗原基因簇中的基因控制著,所以O(shè)-抗原基因簇決定了O-抗原的合成,也決定了O-抗原的多樣性。
因?yàn)镺-抗原是極強(qiáng)的抗原,是大腸桿菌重要的致病因素之一,同時(shí)它又具有極強(qiáng)的多樣性,這啟示我們能研究一種快速、準(zhǔn)確地檢測(cè)大腸桿菌及其O-抗原的特異性好、靈敏度高的方法。以表面多糖為目標(biāo)的血清學(xué)免疫反應(yīng)自上世紀(jì)30年代以來(lái)一直被用于對(duì)細(xì)菌的分型和鑒定,是鑒定致病菌的唯一的手段。這種診斷方法需要大量的抗血清,而抗血清一般種類不全,數(shù)量不足,大量的抗血清在制備和儲(chǔ)存中也存在一些困難。另一方面此法耗時(shí)長(zhǎng)、靈敏度低、漏檢率高、準(zhǔn)確性差,所以,現(xiàn)在普遍認(rèn)為這種傳統(tǒng)的血清學(xué)檢測(cè)方法將為現(xiàn)代分子生物學(xué)方法取代。1993年,Luk,J.M.C et.al用沙門氏菌(S.enterica)O-抗原基因簇的特異核苷酸序列通過(guò)PCR方法鑒定了沙門氏菌的O-抗原[Luk,J.M.C.et.al.(1993)“Selective amplification of abequose andparatose synthase genes(rfb)by polymerase chain reaction for identification ofS.enterica major serogroups(A,B,C2,andD)”,J.Clin.Microbiol.31211 8-2123]。Luk,et.al的方法是將相應(yīng)于沙門氏菌血清型E1,D1,A,B和C2的O-抗原內(nèi)的CDP-阿比可糖和CDP-泰威糖的合成基因的核苷酸序列排列后得到對(duì)不同血清型的沙門氏菌特異的寡核苷酸。1996年,Paton,A.W et.al用對(duì)E.coli O111的O-抗原特異的源于wbdI基因的寡核苷酸鑒定了一株產(chǎn)毒素的E.coli O111的血清型[“Molecular microbiological investigation of an outbreak of Hemolytic-Uremic Syndrome caused by dry fermented sausage contaminated with Shiga-liketoxin producing Escherichia coli”.J.Clin.Microbiol.341622-1627],但是后來(lái)的研究表明Paton,A.W et.al的用源于wbdI基因的寡核苷酸鑒定E.coli O111的血清型的方法有假陽(yáng)性結(jié)果出現(xiàn)。Bastin D.A.and Reeves,P.R.認(rèn)為,這是由于wbdI基因是一個(gè)推測(cè)的糖合成路徑基因[Bastin D.A.andReeves,P.R.(1995)Sequence and analysis of the O antigen gene(rfb)cluster ofEscherichia coli O111.Gene 16417-23],而在其它細(xì)菌的O-抗原的結(jié)構(gòu)中也可能有這個(gè)糖,所以糖合成路徑基因?qū)τ贠-抗原并不是高度特異的志賀氏菌有46種血清型,但只有33種不同的O-抗原,大腸桿菌有166種不同的O-抗原[Reeves,P.R(1992)“Variation in O antigens,niche specificselection and bacterial ponulations”.FEMS Microbiol.Lett,100509-516],二者親緣關(guān)系非常近,并且有12種是大腸桿菌和志賀氏菌共有的[Ewing,W.H.(1986)“ Edwards and Ewing”s identification of theEnterobacteriaceae”.Elsevier Science Publishers,Amsterdam,TheNetherlands;T.cheasty,et al.(1983)“Antigenic relationships between theenteroinvasive Escherichia coli antigensO28ac,O112ac,O124,O136,O143,O144,O152 and and Shigella O antigens”J.clinMicrobiol,17(4)681-684]發(fā)明內(nèi)容本發(fā)明的目的是提供了一種對(duì)大腸桿菌O145型的O-抗原特異的核苷酸。它是大腸桿菌O145型的O-抗原基因簇中的核苷酸,是源于糖基轉(zhuǎn)移酶基因和轉(zhuǎn)運(yùn)酶基因及聚合酶基因的特異的核苷酸。
本發(fā)明的次一目的是提供了大腸桿菌O145型的O-抗原基因簇的全長(zhǎng)核苷酸序列。
本發(fā)明的另一目的是提供了構(gòu)成大腸桿菌O145型的O-抗原基因簇的基因轉(zhuǎn)運(yùn)酶的基因即wzx基因或與wzx有相似功能的基因;聚合酶基因即wzy基因或與wzy有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf7、orf14基因。
本發(fā)明的又一目的是提供了寡核苷酸,它們分別源于大腸桿菌O145型的O-抗原基因簇中編碼糖基轉(zhuǎn)移酶的基因包括orf7、orf14基因;源于編碼轉(zhuǎn)運(yùn)酶的基因即wzx基因或與wzx有相似功能的基因;源于編碼聚合酶的基因即wzy基因或與wzy有相似功能的基因;它們是上述基因內(nèi)的寡核苷酸,長(zhǎng)度在10-20nt;它們對(duì)大腸桿菌O145型的O-抗原是特異的;尤其是表1中列出的寡核苷酸,它們對(duì)大腸桿菌O145型的O-抗原是高度特異的,而且這些寡核苷酸還可重新組合,組合后的寡核苷酸對(duì)大腸桿菌O145型的O-抗原也是高度特異的。
本發(fā)明的再一目的是提供的上述寡核苷酸可作為引物用于核酸擴(kuò)增反應(yīng),或者作為探針用于雜交反應(yīng),或者用于制造基因芯片或微陣列,從而通過(guò)這些方法檢測(cè)和鑒定大腸桿菌O145型的O-抗原及檢測(cè)和鑒定大腸桿菌O145型。
本發(fā)明的還一目的是提供了分離大腸桿菌O145型的O-抗原基因簇的全序列的方法;按照本方法操作可以獲得其他細(xì)菌的O-抗原基因簇的全序列,也可以獲得編碼其他多糖抗原的細(xì)菌的基因簇的全序列。
本發(fā)明的目的是由以下技術(shù)方案實(shí)現(xiàn)的。
本發(fā)明對(duì)大腸桿菌O145型的O-抗原特異的核苷酸,其特征在于其是如SEQ ID NO1所示的分離的核苷酸,全長(zhǎng)16932個(gè)堿基;或者所述具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ IDNO1的核苷酸。
前述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸,其中包括命名為orf1,nnaB,nnaC, nnaA,wzx,wzy,orf7,orf8,orf9,orf10,fnl1,fnl2,fnl3,orf14,orf15的15個(gè)基因組成,都位于JUMPStart序列和gnd基因之間。
前述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸,其中所述基因中具有高度特異性的基因是轉(zhuǎn)運(yùn)酶基因,其包括wzx基因;聚合酶基因,其包括wzy基因;糖基轉(zhuǎn)移酶基因,其包括orf7、orf14基因;其中所述的基因wzx是SEQ ID NO1中的4369至5607堿基的核苷酸;wzy是SEQ ID NO1中的5615至6802堿基的核苷酸;orf7是SEQ ID NO1中的6805至8061堿基的核苷酸;orf14是SEQ ID NO1中的13879至15090堿基的核苷酸。
前述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸,其中還包括源于所述的wzx基因、wzy基因或糖基轉(zhuǎn)移酶基因orf7、orf14基因以及它們的混合或它們的重組。
前述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸,其特征在于,其中源于wzx基因的寡核苷酸對(duì)是SEQ ID NO1中的4468至4488堿基的核苷酸和5059至5077堿基的核苷酸;SEQ ID NO1中的5054至5074堿基的核苷酸和5532至5552堿基的核苷酸;源于wzy基因的寡核苷酸對(duì)是SEQ IDNO1中的6061至6078堿基的核苷酸和6687至6706堿基的核苷酸;SEQ IDNO1中的5849至5866堿基的核苷酸和6280至6297堿基的核苷酸。
前述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸在檢測(cè)表達(dá)O-抗原的細(xì)菌、鑒定細(xì)菌的O-抗原和細(xì)菌的其它多糖抗原中的應(yīng)用。
前述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸的重組分子,在通過(guò)插入表達(dá)而提供表達(dá)大腸桿菌O145型的O-抗原,以及制備細(xì)菌疫苗中的應(yīng)用。
前述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸的應(yīng)用,其特征在于,它作為引物用于PCR、作為探針用于雜交反應(yīng)與熒光檢測(cè)、或者用于制造基因芯片或微陣列,供檢測(cè)細(xì)菌。
前述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在培養(yǎng)基中培養(yǎng)大腸桿菌O145型,離心收集細(xì)胞;得到的基因組DNA通過(guò)瓊脂糖凝膠電泳檢測(cè);(2)通過(guò)PCR擴(kuò)增大腸桿菌O145型中的O-抗原基因簇以大腸桿菌O145型的基因組為模板通過(guò)Long PCR擴(kuò)增其O-抗原基因簇,將得到的PCR產(chǎn)物,用瓊脂糖凝膠電泳檢測(cè)PCR產(chǎn)物的大小及其特異性,合并該longPCR產(chǎn)物,并用DNA純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫(kù)將Long PCR純化產(chǎn)物應(yīng)用鳥槍法構(gòu)建O-抗原基因簇文庫(kù);(4)對(duì)文庫(kù)中的克隆測(cè)序從文庫(kù)中挑選插入片段在1kb以上的克隆用實(shí)驗(yàn)室常用的DNA自動(dòng)測(cè)序儀對(duì)克隆中的插入片段進(jìn)行測(cè)序,序列達(dá)到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析應(yīng)用生物信息學(xué)軟件拼接和編輯所有的序列,從而得到大腸桿菌O145型的O-抗原基因簇的核苷酸全長(zhǎng)序列;(6)特異基因的篩選針對(duì)大腸桿菌O145型的O-抗原基因簇中的wzx、wzy基因設(shè)計(jì)引物;在每個(gè)基因內(nèi)各設(shè)計(jì)了兩對(duì)引物,每對(duì)引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進(jìn)行PCR,確定wzx、wzy基因?qū)Υ竽c桿菌O145型的O-抗原的高度特異性;(7)引物靈敏度的檢測(cè)培養(yǎng)大腸桿菌O145,細(xì)菌計(jì)數(shù)后分別將5×103,5×102,5×101,5個(gè)和0個(gè)活菌加入到一定量的某種待檢測(cè)物中,混入細(xì)菌的待檢測(cè)物作為檢測(cè)用樣品,將樣品加入LB培養(yǎng)基,取一些與樣品混合過(guò)的LB培養(yǎng)基過(guò)濾,將過(guò)濾液進(jìn)行培養(yǎng),從培養(yǎng)好的菌液中取數(shù)毫升處理后作為PCR模板用寡核苷酸進(jìn)行PCR反應(yīng),檢測(cè)其對(duì)大腸桿菌O145的靈敏度。
前述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在5mL的LB培養(yǎng)基中37℃過(guò)夜培養(yǎng)大腸桿菌O145型,離心收集細(xì)胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細(xì)胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時(shí),再加入3ul 10mg/ml的RNase,65℃溫育30分鐘,加等體積酚抽提混合物,取上清再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提兩次,取上清再用等體積的乙醚抽提以除去殘余的酚。上清用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,將DNA重懸于30ul TE中;基因組DNA通過(guò)0.4%的瓊脂糖凝膠電泳檢測(cè);(2)通過(guò)PCR擴(kuò)增大腸桿菌O145型中的O-抗原基因簇以大腸桿菌O145型的基因組為模板通過(guò)Long PCR擴(kuò)增其O-抗原基因簇,首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇上游的JUMPStart序列設(shè)計(jì)上游引物w1-1098(5”-ATT GGTAGC TGT AAG CCA AGG GCG GTA GCG T-3’),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計(jì)下游引物w1-913(5’-TAG TCG CGT GNG CCT GGA TTA AGTTCG C-3’);用Boehringer Mannheim公司的Expand Long Template PCR方法擴(kuò)增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘;然后94℃變性10秒,60℃退火15秒,68℃延伸15分鐘,這樣進(jìn)行30個(gè)循環(huán),最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測(cè)PCR產(chǎn)物的大小及其特異性,合并5管long PCR產(chǎn)物,并用Promega公司的WizardPCR Preps純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫(kù)用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫(kù),反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul 1:2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進(jìn)行,酶切10分鐘使DNA片段大小集中在1.5kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng)。合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無(wú)水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中,隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mMDTT和5單位的T4DNA聚合酶,11℃30分鐘,將酶切產(chǎn)物補(bǔ)成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴(kuò)大為80ul,70℃反應(yīng)20分鐘,使DNA的3′端加dA尾。此混合物經(jīng)等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接10小時(shí),總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶,最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無(wú)水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物;用BiO-Rad公司的電轉(zhuǎn)化感受態(tài)細(xì)胞的制備方法制備感受態(tài)大腸桿菌DH5α細(xì)胞,取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到BiO-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時(shí)間為5.0毫秒至6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上,在37℃過(guò)夜培養(yǎng),次日得到藍(lán)白菌落,將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時(shí)從每個(gè)克隆中提取質(zhì)粒,并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構(gòu)成了大腸桿菌O145型的O-抗原基因簇文庫(kù);(4)對(duì)文庫(kù)中的克隆測(cè)序從文庫(kù)中挑選插入片段在1kb以上的96個(gè)克隆用本實(shí)驗(yàn)室ABI3730型DNA自動(dòng)測(cè)序儀對(duì)克隆中的插入片段進(jìn)行測(cè)序,序列達(dá)到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國(guó)劍橋MRC(Medical Research Council)分子生物學(xué)實(shí)驗(yàn)室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O145型的O-抗原基因簇的核苷酸全長(zhǎng)序列;序列的質(zhì)量主要由兩個(gè)方面來(lái)保證1)對(duì)大腸桿菌O145型的基因組作5個(gè)Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫(kù),2)對(duì)每個(gè)堿基,保證3個(gè)以上高質(zhì)量的覆蓋率,在得到大腸桿菌O145型O-抗原基因簇的核苷酸序列后,用美國(guó)國(guó)家生物技術(shù)信息學(xué)中心(The National Center forBiotechnology Information,NCBI)的orffinder發(fā)現(xiàn)基因,找到15個(gè)開(kāi)放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開(kāi)放的閱讀框的功能并確定它們是什么基因,再用英國(guó)sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對(duì),最后得到大腸桿菌O145型的O-抗原基因簇的結(jié)構(gòu);(6)特異基因篩選針對(duì)痢大腸桿菌O145型的O-抗原基因簇中的wzx、wzy基因基因設(shè)計(jì)引物;在每個(gè)基因內(nèi)各設(shè)計(jì)了兩對(duì)引物,每對(duì)引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進(jìn)行PCR,除在含大腸桿菌O145組中得到了預(yù)期大小的一條帶外,在其他組中都沒(méi)有擴(kuò)增到預(yù)期片段大小的正確產(chǎn)物,所以wzx、wzy基因?qū)Υ竽c桿菌O145型的O-抗原都是高度特異的。
(7)引物靈敏度的檢測(cè)購(gòu)買市場(chǎng)上的生豬肉餡,攪拌均勻,分成20g一份,存在-40℃冰箱中備用。將10μl大腸桿菌O145的凍存菌液接種到有20ml LB培養(yǎng)基的三角瓶中,于37℃,200轉(zhuǎn)/分,培養(yǎng)12小時(shí)至飽和,取少量培養(yǎng)好的菌液作106和107倍的稀釋,其余的菌液放于4℃的冰箱中備用,取50μl稀釋菌液涂布LB瓊脂平板,37度,培養(yǎng)12h,對(duì)所涂平板計(jì)數(shù),計(jì)算原液中活菌濃度。在5份生豬肉餡中分別摻入5×103,5×102,5×101,5個(gè)和0個(gè)活菌,攪拌均勻,加入200ml LB培養(yǎng)基,經(jīng)6層紗布過(guò)濾,過(guò)濾液于37℃,200轉(zhuǎn)/分,培養(yǎng)12h。從培養(yǎng)好的菌液中取3ml菌液于6,000g離心5分鐘,去上清,加100μl MQ超純水吹開(kāi)沉淀并混勻,放入100度沸水中煮15分鐘,裂解液于12,000g離心8分鐘,取1μ上清做為PCR模板。用4對(duì)寡核苷酸對(duì),SEQ ID NO1中的4468至4488堿基的核苷酸和5059至5077堿基的核苷酸;SEQ ID NO1中的5054至5074堿基的核苷酸和5532至5552堿基的核苷酸;SEQ ID NO1中的6061至6078堿基的核苷酸和6687至6706堿基的核苷酸;SEQ ID NO1中的5849至5866堿基的核苷酸和6280至6297堿基的核苷酸,進(jìn)行PCR反應(yīng),PCR反應(yīng)體系如下MQ15.7μl,Mg2+2.5μl,Buffer2.5μl,dNTP1μl,Taq 酶0.3μl,P11μl,P21μl,模板DNA1μl。PCR反應(yīng)條件為95℃5′,95℃30″,56℃45″,72℃1′,72℃5′,共30個(gè)循環(huán)。反應(yīng)結(jié)束后,取10μl反應(yīng)產(chǎn)物電泳,若有與預(yù)期大小相符的擴(kuò)增帶,則結(jié)果為陽(yáng)性,若沒(méi)有,則結(jié)果為陰性。參入了5×103,5×102,5×101,和5個(gè)活菌的每份豬肉餡均在4對(duì)引物的PCR反應(yīng)中得到陽(yáng)性結(jié)果。參入0個(gè)活菌的豬肉餡在4對(duì)引物的PCR反應(yīng)中得到陰性結(jié)果。說(shuō)明使用上述方法時(shí),這4對(duì)引物對(duì)豬肉餡中的大腸桿菌O145的檢測(cè)靈敏度均為0.25個(gè)菌/g。
也就是,本發(fā)明的第一個(gè)方面,提供了大腸桿菌O145型的O-抗原基因簇的全長(zhǎng)核苷酸序列,它的全序列如SEQ ID NO1所示,全長(zhǎng)16932個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。通過(guò)本發(fā)明的方法得到了大腸桿菌O145型的O-抗原基因簇的結(jié)構(gòu),如表3所示,它包括命名為ofr1、nnaB、nnaC、nnaA、wzx、wzy、orf7、orf8、orf9、orf10、fnl1、fnl2、orfl3、orf14、orf15的15個(gè)基因組成,都位于JUMPStart序列和gnd基因之間。
本發(fā)明的第二個(gè)方面,提供了大腸桿菌O145型的O-抗原基因簇中的基因,即轉(zhuǎn)運(yùn)酶基因(wzx基因或與wzx有相似功能的基因);聚合酶基因(wzy基因或與wzy有相似功能的基因);糖基轉(zhuǎn)移酶基因(orf7、orf14基因)。它們?cè)贠-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在表4中;本發(fā)明尤其涉及到糖基轉(zhuǎn)移酶基因、轉(zhuǎn)運(yùn)酶基因和聚合酶基因,因?yàn)樘呛铣陕窂交蚣春铣珊塑斩姿釂翁堑幕颥F(xiàn)在被預(yù)示對(duì)較多胞外多糖是常見(jiàn)的、共同的,對(duì)細(xì)菌的O-抗原并不是很特異的,而本發(fā)明涉及到的糖基轉(zhuǎn)移酶基因、轉(zhuǎn)運(yùn)酶基因和聚合酶基因?qū)Υ竽c桿菌O145型的O-抗原是高度特異的。
本發(fā)明的第三個(gè)方面,提供了源于大腸桿菌O145型的O-抗原基因簇中的wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因和糖基轉(zhuǎn)移酶基因,包括orf7、orf14基因的寡核苷酸,它們是這些基因中的任何一段寡核苷酸。但是,優(yōu)先被用的是列于表1中的寡核苷酸對(duì),在表1中也列出了這些寡核苷酸對(duì)在O-抗原基因簇中的位置以及用這些寡核苷酸對(duì)為引物所做的PCR反應(yīng)的產(chǎn)物的大小,這些PCR反應(yīng)可用表中的退火溫度進(jìn)行;這些引物除在第13組中得到了預(yù)期大小的一條帶外,在其他組中都沒(méi)有擴(kuò)增到任何產(chǎn)物,所以wzx、wzy基因?qū)Υ竽c桿菌O145型的O-抗原都是高度特異的。
所述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸的分離方法包括下述步驟1)基因組的提?。?)PCR擴(kuò)增大腸桿菌O145型中的O-抗原基因簇;3)構(gòu)建O-抗原基因簇文庫(kù);4)對(duì)文庫(kù)中的克隆測(cè)序;5)核苷酸序列的拼接及分析;6)特異基因的篩選;7)引物靈敏度的檢測(cè)。
本發(fā)明的其他方面由于本文的技術(shù)的公開(kāi),對(duì)本領(lǐng)域的技術(shù)人員而言是顯而易見(jiàn)的。
如本發(fā)明所用,“寡核苷酸”主要指來(lái)源于O-抗原基因簇中的編碼糖基轉(zhuǎn)移酶的基因、編碼轉(zhuǎn)運(yùn)酶的基因和編碼聚合酶的基因內(nèi)的一段核苷酸分子,它們?cè)陂L(zhǎng)度上可改變,一般在10到20個(gè)核苷酸范圍內(nèi)改變;更確切說(shuō)這些寡核苷酸是源于wzx基因(核苷酸位置是從SEQ ID NO1中的4369至5607堿基的核苷酸);wzy基因(核苷酸位置是從SEQ ID NO1中的5615至6802堿基的核苷酸)。源于以上基因內(nèi)的寡核苷酸對(duì)大腸桿菌O145型是高度特異的。
此外,有時(shí)兩個(gè)遺傳相似的編碼不同O-抗原的基因簇通過(guò)基因重組或突變產(chǎn)生新的O-抗原,從而產(chǎn)生新的細(xì)菌類型,新的突變株。在這種環(huán)境中,需要篩選出多對(duì)寡核苷酸同重組基因雜交以提高檢測(cè)的特異性。因此,本發(fā)明提供了一整套多對(duì)寡核苷酸的混合物,它們?cè)从谔腔D(zhuǎn)移酶基因;源于轉(zhuǎn)運(yùn)酶和聚合酶基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。這些基因的混合物對(duì)一個(gè)特殊的細(xì)菌多糖抗原來(lái)說(shuō)是特異的,從而使這套寡核苷酸對(duì)這個(gè)細(xì)菌的多糖抗原是特異的。更具體地說(shuō),這些寡核苷酸的混合物是源于糖基轉(zhuǎn)移酶基因、wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因中的寡核苷酸的組合。
在另一方面,本發(fā)明涉及寡核苷酸的鑒定,它們可以用于檢測(cè)表達(dá)O-抗原的細(xì)菌和在診斷中鑒定細(xì)菌的O-抗原。
本發(fā)明涉及到一種檢測(cè)食品中的一個(gè)或多個(gè)細(xì)菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個(gè)基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼轉(zhuǎn)運(yùn)酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個(gè)寡核苷酸能與至少一個(gè)表達(dá)特殊的O-抗原的細(xì)菌的一個(gè)以上的那樣的基因特異性雜交,這些細(xì)菌是大腸桿菌O145型??捎肞CR方法檢測(cè),更可以將本發(fā)明方法中的核苷酸標(biāo)記后作為探針通過(guò)雜交反應(yīng)如southern-blot或熒光檢測(cè),或者通過(guò)基因芯片或微陣列檢測(cè)樣品中的抗原及細(xì)菌。
本發(fā)明設(shè)計(jì)者考慮到以下情況當(dāng)單個(gè)的特異的寡核苷酸檢測(cè)無(wú)效時(shí),寡核苷酸的混合物能與靶區(qū)域特異性雜交以檢測(cè)樣品。因此本發(fā)明提供了一套寡核苷酸用于本發(fā)明所述的檢測(cè)方法。這里所說(shuō)的寡核苷酸是指源于編碼糖基轉(zhuǎn)移酶的基因、編碼轉(zhuǎn)運(yùn)酶的基因和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的寡核苷酸。這套寡核苷酸對(duì)一個(gè)特殊的細(xì)菌的O-抗原來(lái)說(shuō)是特異的,這一特殊的細(xì)菌O-抗原是由大腸桿菌O145型表達(dá)的。
另一方面,本發(fā)明涉及到一種檢測(cè)排泄物中的一個(gè)或多個(gè)細(xì)菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個(gè)基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼轉(zhuǎn)運(yùn)酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個(gè)寡核苷酸能與至少一個(gè)表達(dá)特殊的O-抗原的細(xì)菌的一個(gè)以上的那樣的基因特異性雜交。這些細(xì)菌是大腸桿菌O145型。可用本發(fā)明中的寡核苷酸作引物通過(guò)PCR的方法檢測(cè)樣品,也可將本發(fā)明中的寡核苷酸分子標(biāo)記后作為探針通過(guò)雜交反應(yīng)如southern-blot或熒光檢測(cè),或者通過(guò)基因芯片或微陣列檢測(cè)樣品中的抗原及細(xì)菌。
一般一對(duì)寡核苷酸可能與同樣的基因雜交也可與不同的基因雜交,但它們中必須有一個(gè)寡核苷酸能特異性雜交到特殊抗原型的特異序列上,另一個(gè)寡核苷酸可雜交于非特異性區(qū)域。因此,當(dāng)特殊的多糖抗原基因簇中的寡核苷酸被重新組合時(shí),至少能選出一對(duì)寡核苷酸與多糖抗原基因簇中特異基因混合物雜交,或者選出多對(duì)寡核苷酸與特異基因的混合物雜交。甚至即使當(dāng)一個(gè)特殊的基因簇中所有基因都獨(dú)一無(wú)二時(shí),此方法也能應(yīng)用于識(shí)別此基因簇內(nèi)的基因混合物的核苷酸分子。因此本發(fā)明提供了一整套用于檢測(cè)本發(fā)明方法的多對(duì)寡核苷酸,在這里多對(duì)寡核苷酸是源于編碼糖基轉(zhuǎn)移酶的基因、編碼轉(zhuǎn)運(yùn)酶和聚合酶的基因包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因,這套寡核苷酸對(duì)一個(gè)特殊的細(xì)菌多糖來(lái)說(shuō)是特異的,這套寡核苷酸可能是糖合成中必須基因的核苷酸。
另一方面,本發(fā)明也涉及到一種檢測(cè)源于病人的樣品中的一個(gè)或多個(gè)細(xì)菌多糖抗原的方法。樣品中的一個(gè)或多個(gè)細(xì)菌多糖抗原可以使樣品能與以下至少一個(gè)基因中的一對(duì)寡核苷酸中的一個(gè)特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼轉(zhuǎn)運(yùn)酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個(gè)寡核苷酸能與樣品中的至少一個(gè)表達(dá)特殊的O-抗原的細(xì)菌的一個(gè)以上的那樣的基因特異性雜交,這些細(xì)菌是大腸桿菌O145型。可用本發(fā)明中的寡核苷酸作引物通過(guò)PCR的方法檢測(cè)樣品,也可將本發(fā)明中的寡核苷酸標(biāo)記后作為探針通過(guò)雜交反應(yīng),或者通過(guò)基因芯片或微陣列檢測(cè)樣品中的抗原及細(xì)菌。
更詳細(xì)地說(shuō),以上描述的方法可以理解為當(dāng)寡核苷酸對(duì)被使用時(shí),其中的一個(gè)寡核苷酸分子能雜交到一個(gè)并不是來(lái)源于糖基轉(zhuǎn)移酶基因、wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的序列上。此外,當(dāng)兩個(gè)寡核苷酸都能雜交上時(shí),它們可能雜交于同一基因也可能雜交到不同基因上。也即,當(dāng)交叉反應(yīng)出現(xiàn)問(wèn)題時(shí),可選擇寡核苷酸的混合物來(lái)檢測(cè)混合的基因以提供檢測(cè)的特異性。
本發(fā)明者相信本發(fā)明不必限于以上所提的核苷酸序列編碼的特定的O-抗原,而且廣泛應(yīng)用于檢測(cè)所有表達(dá)O-抗原和鑒定O-抗原的細(xì)菌。而且,由于O-抗原合成和其他多糖抗原(如細(xì)菌胞外抗原)合成之間的相似性,本發(fā)明的方法和分子也應(yīng)用于這些其他的多糖抗原。
本發(fā)明首次公開(kāi)了大腸桿菌O145型的O-抗原基因簇的全長(zhǎng)序列,而且可從這個(gè)未被克隆的全長(zhǎng)基因簇的序列中產(chǎn)生重組分子,通過(guò)插入表達(dá)可產(chǎn)生表達(dá)大腸桿菌O145型的O-抗原,并成為有用的疫苗。
具體實(shí)施例方式
下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解這些實(shí)施例僅用于說(shuō)明本發(fā)明而不用于限制本發(fā)明的范圍。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件如Sambrook等人,分子克隆實(shí)驗(yàn)室手冊(cè)(NewYorkCold Spring Harbor Laboratory Press,1989)中所述的條件。
實(shí)施例1基因組的提取
在5mL的LB培養(yǎng)基中37℃過(guò)夜培養(yǎng)大腸桿菌O145型,離心收集細(xì)胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細(xì)胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時(shí),再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清再用等體積的酚∶氯仿∶異戊醇抽(25∶24∶1)混合溶液提兩次,取上清再用等體積的乙醚抽提以除去殘余的酚,上清用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中?;蚪MDNA通過(guò)O.4%的瓊脂糖凝膠電泳檢測(cè)。
實(shí)施例2通過(guò)PCR擴(kuò)增大腸桿菌O145型中的O-抗原基因簇以大腸桿菌O145型的基因組為模板通過(guò)Long PCR擴(kuò)增其O-抗原基因簇。首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇上游的JUMPStart序列設(shè)計(jì)上游引物w1-1098(5’-ATT GGT AGC TGT AAG CCA AGG GCG GTA GCG T-3’),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計(jì)下游引物w1-913(5’-TAG TCG CGT GNGCCT GGA TTA AGT TCG C-3’);用Boehringer Mannheim公司的Expand LongTemplate PCR方法擴(kuò)增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘;然后94℃變性10秒,60℃退火15秒,68℃延伸15分鐘,這樣進(jìn)行30個(gè)循環(huán)。最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測(cè)PCR產(chǎn)物的大小及其特異性。合并5管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物。
實(shí)施例3構(gòu)建O-抗原基因簇文庫(kù)首先是連接產(chǎn)物的獲得用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫(kù)。反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進(jìn)行。酶切10分鐘使DNA片段大小集中在1.5kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng)。合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無(wú)水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中。隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mMDTT和5單位的T4DNA聚合酶,11℃30分鐘,將酶切產(chǎn)物補(bǔ)成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴(kuò)大為80ul,70℃反應(yīng)20分鐘,使DNA的3′端加dA尾。此混合物經(jīng)等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接10小時(shí),總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶。最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無(wú)水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物。
其次是感受態(tài)細(xì)胞的制備參照Bio-Rad公司提供的方法制備感受態(tài)細(xì)胞大腸桿菌DH5α。取一環(huán)大腸桿菌DH5α單菌落于5ml的LB培養(yǎng)基中,180rpm培養(yǎng)10小時(shí)后,取2ml培養(yǎng)物轉(zhuǎn)接到200ml的LB培養(yǎng)基中,37℃250rpm劇烈振蕩培養(yǎng)到OD600 0.5左右,然后冰浴冷卻20分鐘,于4℃4000rpm離心15分鐘。傾盡上清,用冷的冰預(yù)冷的去離子滅菌水200ml吹散菌體,于4℃ 4000rpm離心15分鐘。再用冷的冰預(yù)冷的去離子滅菌水100ml吹散菌體,于4℃ 4000rpm離心15分鐘。用冷的冰預(yù)冷的10%的甘油懸浮細(xì)胞,4℃ 6000rpm離心10分鐘,棄上清,最后沉淀用1ml冰預(yù)冷的10%的甘油懸浮細(xì)胞,即為感受態(tài)細(xì)胞。將制得的感受態(tài)細(xì)胞分裝為50ul一管,-70℃保存。
最后是電轉(zhuǎn)化感受態(tài)細(xì)胞取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時(shí)間為5.0毫秒-6.0毫秒。電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇。然后立即將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上37℃倒置過(guò)夜培養(yǎng),次日得到藍(lán)白菌落。將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時(shí)從每個(gè)克隆中提取質(zhì)粒并用EcoRI酶切鑒定其中的插入片段的大小,得到白色克隆群構(gòu)成了大腸桿菌O145型的O-抗原基因簇文庫(kù)。
實(shí)施例4對(duì)文庫(kù)中的克隆測(cè)序從文庫(kù)中挑選插入片段在1kb以上的96個(gè)克隆用本實(shí)驗(yàn)室ABI3730型DNA自動(dòng)測(cè)序儀對(duì)克隆中的插入片段單向進(jìn)行測(cè)序,使序列達(dá)到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列。
實(shí)施例5核苷酸序列的拼接及分析用英國(guó)劍橋MRC(Medical Research Council)分子生物學(xué)實(shí)驗(yàn)室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O145型的O-抗原基因簇的核苷酸全長(zhǎng)序列(見(jiàn)序列列表)。序列的質(zhì)量主要由兩個(gè)方面來(lái)保證1)對(duì)大腸桿菌O145型的基因組作5個(gè)Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫(kù)。2)對(duì)每個(gè)堿基,保證3個(gè)以上高質(zhì)量的覆蓋率。在得到大腸桿菌O145型O-抗原基因簇的核苷酸序列后,用美國(guó)國(guó)家生物技術(shù)信息學(xué)中心(The National Center for BiotechnologyInformation,NCBI)的orffinder發(fā)現(xiàn)基因,找到15個(gè)開(kāi)放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開(kāi)放的閱讀框的功能并確定它們是什么基因,再用英國(guó)sanger中心的Artemis軟件完成基因注釋,用ClustralW軟件做DNA和蛋白質(zhì)序列間的精確比對(duì),最后得到大腸桿菌O145型的O-抗原基因簇的結(jié)構(gòu),如表3所示。
通過(guò)檢索和比較,發(fā)現(xiàn)orf1編碼的蛋白與大腸桿菌(AAK64367)O-抗原基因簇中編碼的WckD有74%的氨基酸序列一致性和88%的相似性,通過(guò)對(duì)Pfam蛋白基序數(shù)據(jù)庫(kù)的搜索,發(fā)現(xiàn)orf1編碼的蛋白與已知的Bacterialtransferase hexapeptide的共有序列的同源性預(yù)期值為0.028;由于這個(gè)基因的確切功能還不能確定,因此我們將這個(gè)基因暫命名為orf1。orf2編碼的蛋白與大腸桿菌(AAK64368)O-抗原基因簇中編碼的NeuNAc condensing enzyme有81%的氨基酸序列一致性和91%的相似性,通過(guò)對(duì)Pfam蛋白基序數(shù)據(jù)庫(kù)的搜索,發(fā)現(xiàn)orf2編碼的蛋白與已知的NeuB family的共有序列的同源性預(yù)期值為2.3e-122。因此我們將這個(gè)基因命名為nnaB。orf3編碼的蛋白與大腸桿菌(AAK64369)O-抗原基因簇中編碼的CMP-NeuNAc synthetase有56%的氨基酸序列一致性和75%的相似性,通過(guò)對(duì)Pfam蛋白基序數(shù)據(jù)庫(kù)的搜索,發(fā)現(xiàn)orf3編碼的蛋白與已知的Cytidylyltransferase的共有序列的同源性預(yù)期值為2.1e- 46。因此我們將這個(gè)基因命名為nnaC。orf4編碼的蛋白大腸桿菌(AAK64370)O-抗原基因簇中編碼的GlcNAc-2-epimerase有63%的氨基酸序列一致性和79%的相似性,通過(guò)對(duì)Pfam蛋白基序數(shù)據(jù)庫(kù)的搜索,發(fā)現(xiàn)orf4編碼的蛋白與已知的UDP-N-acetylglucosamine 2-epimerase的共有序列的同源性預(yù)期值為1e-110。因此我們將這個(gè)基因命名為nnaA。Orf7編碼的蛋白與大Pseudomonasaeruginosa(AAM27597)O-抗原基因簇中編碼的ORF_16有29%的氨基酸序列一致性和48%的相似性,由于這個(gè)基因的確切功能還不能確定,因此我們將這個(gè)基因暫命名為orf7。Orf8編碼的蛋白分別與Bdellovibrio bacteriovorus(CAE79560)O-抗原基因簇中編碼的LPS biosynthesis protein WbpG有很高68%的氨基酸序列一致性和84%的相似性,通過(guò)對(duì)Pfam蛋白基序數(shù)據(jù)庫(kù)的搜索,發(fā)現(xiàn)orf8編碼的蛋白與已知的PP-loop family的共有序列的同源性預(yù)期值為0.012。由于這個(gè)基因的確切功能還不能確定,因此我們將這個(gè)基因暫命名為orf8。Orf9編碼的蛋白分別與Vibrio vulnificus YJ016(BAC93119)的O-抗原基因簇中編碼的glutamine amidotransferase有58%的氨基酸序列一致性和76%的相似性,通過(guò)對(duì)Pfam蛋白基序數(shù)據(jù)庫(kù)的搜索,發(fā)現(xiàn)orf9編碼的蛋白與已知的Glutamine amidotransferase class-I的共有序列的同源性預(yù)期值為1e-24。由于這個(gè)基因的確切功能還不能確定,因此我們將這個(gè)基因暫命名為orf9。Orf10編碼的蛋白分別與Bdellovibrio bacteriovorus(CAE79562)的O-抗原基因簇中編碼的Imidazole glycerol phosphate synthase subunit hisF有63%的氨基酸序列一致性和78%的相似性,通過(guò)對(duì)Pfam蛋白基序數(shù)據(jù)庫(kù)的搜索,發(fā)現(xiàn)orf10編碼的蛋白與已知的Histidine biosynthesis protein的共有序列的同源性預(yù)期值為1.6e-55。由于這個(gè)基因的確切功能還不能確定,因此我們將這個(gè)基因暫命名為orf10。Orf11編碼的蛋白分別與大腸桿菌(AAN60461)的O-抗原基因簇中編碼的4,6-dehydratase,3-and 5-epimerizase有88%的氨基酸序列一致性和94%的相似性,通過(guò)對(duì)Pfam蛋白基序數(shù)據(jù)庫(kù)的搜索,發(fā)現(xiàn)orf11編碼的蛋白與已知的Polysaccharide biosynthesis protein的共有序列的同源性預(yù)期值為1.4e-3。因此我們將這個(gè)基因暫命名為fnl1。Orf12編碼的蛋白分別與大腸桿菌(AAN60462)的O-抗原基因簇中編碼的reductase有71%的氨基酸序列一致性和83%的相似性,通過(guò)對(duì)Pfam蛋白基序數(shù)據(jù)庫(kù)的搜索,發(fā)現(xiàn)orf12編碼的蛋白與已知的NAD dependent epimerase/dehYdratase family的共有序列的同源性預(yù)期值為0.00053。因此我們將這個(gè)基因暫命名為fnl2。Orf13編碼的蛋白分別與大腸桿菌(AAN60463)的O-抗原基因簇中編碼的C-2 epimerizase有89%的氨基酸序列一致性和95%的相似性,通過(guò)對(duì)Pfam蛋白基序數(shù)據(jù)庫(kù)的搜索,發(fā)現(xiàn)orf13編碼的蛋白與已知的UDP-N-acetylglucosamine 2-epimerase的共有序列的同源性預(yù)期值為1.9e-121。因此我們將這個(gè)基因命名為fnl3。Orf14編碼的蛋白分別與大腸桿菌(AAN60464)的O-抗原基因簇中編碼的L-fucosamine transferase有71%的氨基酸序列一致性和84%的相似性,由于這個(gè)基因的確切功能還不能確定,因此我們將這個(gè)基因暫命名為orf14。Orf15編碼的蛋白分別與大腸桿菌(AAN60465)的O-抗原基因簇中編碼的WbuC protein有68%的氨基酸序列一致性和87%的相似性,由于這個(gè)基因的確切功能還不能確定,因此我們將這個(gè)基因暫命名為orf15。
Orf5和orf6是大腸桿菌O145種僅有的兩個(gè)編碼存在跨膜片段的蛋白的基因。Orf5編碼的蛋白與大腸桿菌(AAO37697)的O-抗原轉(zhuǎn)移酶有22%的序列一致性,45%的相似性,通過(guò)HMMTOP2.0程序分析蛋白的拓?fù)浣Y(jié)構(gòu)發(fā)現(xiàn)其含有12個(gè)均勻的跨膜片段,這是Wzx蛋白的典型特征。所以命名orf5為wzx。Orf6編碼的蛋白與Vibrio cholerae(BAA33635)的O-抗原聚合酶有26%的一致性,45%的相似性,通過(guò)HMMTOP2.0程序分析蛋白的拓?fù)浣Y(jié)構(gòu)發(fā)現(xiàn)其含有10個(gè)跨膜片段,并且有一個(gè)大的胞質(zhì)內(nèi)親水環(huán)(1oop),這是Wzy蛋白的典型特征。所以命名orf6為wzy。
實(shí)施例6特異基因的篩選針對(duì)大腸桿菌O145型的O-抗原基因簇中的wzx、wzy基因設(shè)計(jì)引物,在每個(gè)基因內(nèi)各設(shè)計(jì)了兩對(duì)引物,每對(duì)引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進(jìn)行PCR,除在含大腸桿菌O145組中得到了預(yù)期大小的一條帶外,在其他組中都沒(méi)有擴(kuò)增到預(yù)期片段大小的正確產(chǎn)物,所以wzx、wzy基因?qū)Υ竽c桿菌O145型的O-抗原都是高度特異的;這些基因在核苷酸序列中的位置見(jiàn)表1。
實(shí)施例7引物靈敏度的檢測(cè)購(gòu)買市場(chǎng)上的生豬肉餡,攪拌均勻,分成20g一份,存在-40℃冰箱中備用。將10μl大腸桿菌O145的凍存菌液接種到有20ml LB培養(yǎng)基的三角瓶中,于37℃,200轉(zhuǎn)/分,培養(yǎng)12小時(shí)至飽和,取少量培養(yǎng)好的菌液作106和107倍的稀釋,其余的菌液放于4℃的冰箱中備用,取50μl稀釋菌液涂布LB瓊脂平板,37度,培養(yǎng)12h,對(duì)所涂平板計(jì)數(shù),計(jì)算原液中活菌濃度。在5份生豬肉餡中分別摻入5×103,5×102,5×101,5個(gè)和0個(gè)活菌,攪拌均勻,加入200ml LB培養(yǎng)基,經(jīng)6層紗布過(guò)濾,過(guò)濾液于37℃,200轉(zhuǎn)/分,培養(yǎng)12h。從培養(yǎng)好的菌液中取3ml菌液于6,000g離心5分鐘,去上清,加100μl MQ超純水吹開(kāi)沉淀并混勻,放入100度沸水中煮15分鐘,裂解液于12,000g離心8分鐘,取1μ上清做為PCR模板。用4對(duì)寡核苷酸對(duì),SEQ ID NO1中的4468至4488堿基的核苷酸和5059至5077堿基的核苷酸;SEQ ID NO1中的5054至5074堿基的核苷酸和5532至5552堿基的核苷酸;SEQ IDNO1中的6061至6078堿基的核苷酸和6687至6706堿基的核苷酸;SEQ ID NO1中的5849至5866堿基的核苷酸和6280至6297堿基的核苷酸,進(jìn)行PCR反應(yīng),PCR反應(yīng)體系如下MQ15.7μl,Mg2+2.5μl,Buffer2.5μl,dNTP1μl,Taq酶0.3μl,P11μl,P21μl,模板DNA1μl。PCR反應(yīng)條件為95℃5′,95℃30″,56℃45″,72℃1′,72℃5′,共30個(gè)循環(huán)。反應(yīng)結(jié)束后,取10μl反應(yīng)產(chǎn)物電泳,若有與預(yù)期大小相符的擴(kuò)增帶,則結(jié)果為陽(yáng)性,若沒(méi)有,則結(jié)果為陰性。參入了5×103,5×102,5×101,和5個(gè)活菌的每份豬肉餡均在4對(duì)引物的PCR反應(yīng)中得到陽(yáng)性結(jié)果。參入0個(gè)活菌的豬肉餡在4對(duì)引物的PCR反應(yīng)中得到陰性結(jié)果。說(shuō)明使用上述方法時(shí),這4對(duì)引物對(duì)豬肉餡中的大腸桿菌O145的檢測(cè)靈敏度均為0.25個(gè)菌/g。
通過(guò)對(duì)O抗原基因簇的克隆和在減毒的疫苗菌株中的表達(dá),可以組建重組疫苗。O抗原為最主要的革蘭氏陰性菌的表面抗原,可以引起強(qiáng)烈的免疫反應(yīng),是制造重組疫苗的最好的靶分子之一。在1993年Viret實(shí)驗(yàn)室成功的將志賀氏菌Sonnei的O抗原基因簇在一株沙門氏菌Tyziai疫苗菌中表達(dá),動(dòng)物實(shí)驗(yàn)證明可以引起兔子的免疫反應(yīng)(Molecular Microbiology 1993,7239-252)。中國(guó)軍事醫(yī)學(xué)科學(xué)院的小組也在從事與Viret實(shí)驗(yàn)室類似的工作。王磊實(shí)驗(yàn)室在1999年成功的將大腸桿菌O111的O抗原基因簇在沙門氏菌疫苗STM-1中表達(dá),并證明組建成的菌株可以引起小鼠的血液和體液反應(yīng)(Microbial Pathogenesis 1999,2755-59)。所以本發(fā)明O145的O抗原特異基因序列可以應(yīng)用于組建重組疫苗。
根據(jù)本發(fā)明的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸序列(SEQ IDNO1所示),構(gòu)造特異核酸探針,將其固定到芯片的載體上制成生物芯片,將要檢測(cè)的樣品適當(dāng)處理后,與生物芯片進(jìn)行雜交反應(yīng),然后利用生物芯片信號(hào)分析設(shè)備就可以得到樣品中相應(yīng)的細(xì)菌情況。這種大腸桿菌O抗原鑒定的DNA芯片將可以直接用于臨床和其它檢驗(yàn)場(chǎng)所(如食品加工和生產(chǎn)行業(yè),畜牧獸醫(yī)行業(yè)海關(guān)檢疫等的微生物檢驗(yàn))。這種芯片只需要擴(kuò)大產(chǎn)量,在完全相同的條件下就可以產(chǎn)業(yè)化。
表1列出了大腸桿菌O145型的O抗原基因簇中糖基轉(zhuǎn)移酶基因和寡糖單位處理基因及基因內(nèi)的引物及PCR數(shù)據(jù)。在表中列出了大腸桿菌O145型的O抗原基因簇的糖基轉(zhuǎn)移酶基因、轉(zhuǎn)運(yùn)酶基因和聚合酶基因及它們的相應(yīng)的功能和大小。在每個(gè)基因內(nèi),我們各設(shè)計(jì)了兩對(duì)引物,每對(duì)引物分布在相應(yīng)基因內(nèi)的不同地方以確保其特異性。在表中還列出了每個(gè)引物在SEQ IDNO1中的位置和大小。以每對(duì)引物用表中所列的相應(yīng)的退火溫度以表2中的所有菌的基因組為模板進(jìn)行PCR,得到了相應(yīng)的PCR產(chǎn)物,其大小也列于表中。
表2是用于篩選特異基因的166株大腸桿菌和43株志賀氏菌及它們的來(lái)源,為了檢測(cè)的方便,我們將它們每12-19個(gè)菌分為一組,總共12組,它們的來(lái)源都列于表中。
在第13組中含有大腸桿菌O145型的基因組DNA作為陽(yáng)性對(duì)照。以每組菌做模板,用表1中的每對(duì)引物按如下條件做PCR在95℃預(yù)變性5分鐘后,95℃變性30秒,退火時(shí)間是30秒,溫度見(jiàn)表1,72℃延伸2分鐘,這樣進(jìn)行25個(gè)循環(huán)。最后在72℃繼續(xù)延伸5分鐘,反應(yīng)體系是25ul。模板為1:20稀釋,取1μl。反應(yīng)完畢后,取10ulPCR產(chǎn)物通過(guò)0.8%瓊脂糖凝膠電泳檢測(cè)擴(kuò)增出的片段。
對(duì)于wzx、wzy基因,每個(gè)基因都有兩對(duì)引物被檢測(cè),每對(duì)引物除了在第13組中做PCR后得到了預(yù)期大小的正確的一條帶外,在其他組中都沒(méi)有擴(kuò)增到任何大小正確的帶,也就是說(shuō),在大多數(shù)組中沒(méi)有得到任何PCR產(chǎn)物帶,所以wzx、wzy基因?qū)Υ竽c桿菌O145型及其O-抗原是高度特異的。
最后,通過(guò)PCR從大腸桿菌O145型中篩選到對(duì)大腸桿菌O145型的O-抗原高度特異的基因兩個(gè)糖基轉(zhuǎn)移酶基因(orf7、orf14基因)。而這些基因內(nèi)的任何一段10-20nt的寡核苷酸對(duì)大腸桿菌O145型的O-抗原是特異的,尤其是上述每個(gè)基因中的引物即寡核苷酸對(duì)經(jīng)PCR檢測(cè)后證實(shí)對(duì)大腸桿菌O145型是高度特異的。所有的這些寡核苷酸都可用于快速準(zhǔn)確地檢測(cè)人體和環(huán)境中的大腸桿菌O145型,并能鑒定它們的O-抗原。
表3是大腸桿菌O145型的O-抗原基因簇的結(jié)構(gòu)表,在表中列出了大腸桿菌O145型的O-抗原基因簇的結(jié)構(gòu),共由15個(gè)基因組成,每個(gè)基因用方框表示,并在方框內(nèi)寫入基因的名稱,數(shù)字表示的是O-抗原基因簇中的開(kāi)放閱讀框(orf)的順序。在O-抗原基因簇的兩端是JUMPStart序列和gnd基因,它們不屬于O-抗原基因簇,我們只是用它們的一段序列設(shè)計(jì)引物來(lái)擴(kuò)增O-抗原基因簇的全長(zhǎng)序列。
表4是大腸桿菌O145型的O-抗原基因簇中的基因的位置圖,在圖中列出了大腸桿菌O145型的O-抗原基因簇中的所有開(kāi)放閱讀框在全序列中的準(zhǔn)確位置,在每個(gè)開(kāi)放閱讀框的起始密碼子和終止密碼子的下面劃線。在大腸桿菌中開(kāi)放閱讀框的起始密碼子有兩個(gè)ATG和GTG。
SEQ ID NO1序列(SEQUENCE LISTING)<110>天津生物芯片技術(shù)有限責(zé)任公司<120>對(duì)大腸桿菌O145型的O抗原特異的核苷酸<130>對(duì)大腸桿菌O145型的O抗原特異的核苷酸<160>1<170>PatentIn version 3.2<210>1<211>16932<212>DNA<213>Escherichia coli<400>1attggtagct gtaagccaag ggcggtagcg tgtgtttttg agatatttat gtattatcgt 60tgtcatgaat acaagtaaca acaaagttaa tgtgatctaa tcaaaccatt agatggtatg 120aatatgaagc aaaaattaat aattattggt gctggtggtt ttgctaaaac tgtaattgac 180agtttggatc atgaaaagta tgaaatagaa gggttcattg atacatttaa aacaggtgag 240catcaaggat accctatttt aggtgatact ttaggtgtca tagacgaacc taaccaatac 300ctatacttta ttgcaattgg agatcccgat tacagagcct tatggatgaa gttaatagaa 360gaaatgaaac tttcaactat caatgtaatt gacagaacat ctataatttc tgaacattct 420aggcttggta cctgcattta tatagggaaa atggctatca ttaactgtga ttcagaacta 480gaagatggag tggtgataaa cacaagagca ttagtagagc atgggaatta tatatcatat 540tgtacaaata tctctactaa tgttgttctt aatggtgatg tattcgttgg ggaaaaatcc 600tttataggaa gttgtaccgt tgttaatggg caactaaaga taggtaattc atcaattatt 660ggttctggtt ctgtagttat tcgtgatgtt cctgacaatg tagtagtggc cggggctcct 720acaaagttta ttagagcaag gtgattttta ttatgtcgag aatttatatt gttgctgaaa 780ttggttgtaa tcataacgga gatttcgagt tagctaagaa aatggtaaaa gaggcaaaat 840ctgccggggt agatgcagta aaattccaaa cttttaaagc tgagcaactt atctcaaaat 900atgctcctaa agcagaatat caaataaaag ttaccggtaa tgaagagact caattagaga 960tgactcgtaa gttagagttg ccatatgatg agtttatcaa gctggaagaa tatgcaaaag1020aacttgggtt ggatgtcttc tcaacaccat ttgattttga ttcaatcgat tttcttgcat1080ccagaaatca aaaagtttgg aagattccat caggcgaatt attaaattta ccatatttag1140agaaaatagc caaattgcca atcgaagata aaaaaattgt actatcaact ggtatggcaa1200cagttgatga aatcaatttg gcattaaagg tttttattga taatggcatt acacatagaa1260atataacaat attacattgt aatacagagt atccaacgcc atttgaagat gtaaatctaa1320atacaatttc tggattcaaa aaaatattta gtcaatataa tattggattt tctgatcatt1380ctccaggtta ttttgctggt attgcatcag tgccttatgg gatcactttt attgagaaac1440attttacact ggataaaaat tttgaaggtc cagatcataa agcatcagtt acacctgagg1500aacttaaatt actatgcgaa ggaatacgtg cagtagaaat ttcacttggt agctatgaaa1560agttagtaac aaattcagaa cgaaagaata aagtagtagc tcgaaaatca attgttgcta1620aatgtgcaat aaaaaaagga gatattttta cgacggaaaa tattacgaca aagcgaccag1680gaaacggaat tagtccaatg tactggtatg aggtcttagg taaaatagct gaaaaggatt1740ttgatgagga tcaactaatt gagcactctg attttagtaa acaagaggtt tgagttgtgt1800
cattaaaaaa aattgccatt atacctgctc ggtctggatc taagggctta ccaaataaaa1860atatactaat gttattggat cgcccattaa ttgcttatac tatcgaagca gcgattagct1920ctaatatatt tgataaaatt attgtttcaa cagattcatt agaatataaa tatattgcag1980agaaatatgg cgcggaagta atattacgca caaaagaatt atcgttggat tcggcaacat2040cttttatggt agttcaagat gtgcttgaaa aatgtccagg atatgattat tttgtgcttc2100tacaaccaac atcaccattt cgtaattata agcatattaa gaatgctgtt gagcaatttg2160aaaataatca cgaagcaaaa tttttggtgt ctgtggtaga aagtgataaa agttcggcgt2220taattaaacc aattgataat tcactgtcat taaggaactt tgactgtgat tttagtacat2280atcgtagaca aaataaaaaa gaatactgtc caaatggtgc gatttttatt ggttatgttt2340ctaattattt aagacaaaaa catttctttg gtgctgacag tatagcctat attatgaata2400aagaagattc tattgatatc gatgatcagt tagattttga attggcaatt ctaatccaaa2460caaaaaaaaa taaaaaaaat ttattggata atgctattat caaacgaatt gtcgataaaa2520aagatttatt taacaaagtt gagcaaatta cactgattgg acattcaatt tttgattatt2580gggatctcag caacatatgt ggaattaagg ttaacaattt aggcattgct ggcattgata2640gcgaaaaata ttacaaatac atcattgaaa aaaacatgct caccaatata ggtaagtatg2700tgctattaat ttcaggcaca aacgacattg tgaacgatgg ttggactatt gaatacacta2760taaaatggac aaaaaatctg atcaatagag taaaaattat aaatcctgat gttactatca2820ttctgctagc agtgccgcct gttcgaggaa gagttgatag ggataataat actatcaata2880aattaaatct ggcaatgaaa caatatttta gtaaattaga caatgttatt tggatgccgt2940tatctccatc tttttatgat gagttcggca atctgaatga aaattatact tatgatggtt3000tacatttcac gttacaagct tacaaacagt tagaaaatga tatttcgagt atcttaaaat3060gaaaagaaaa ttgctctatg tcaccggctc aagagctgag tacggtatta tgaaacgact3120attaaaaagt ctaaaagatg atcctgatat tgatttatca attattgcaa caggtatgca3180ttgcgattct gaatatggtt atacatataa aacaatcgag aatgatggtt tcttaattga3240aaaattaatt gatttgcagc tgaaaaataa aaccaacgca gatgttttga aaacgatgtc3300gatatgccaa caagcatttg gtgagcattt ccaagagaaa aaatatgatg ctgtcattat3360attaggtgat cgatacgaaa tattttcagt ggcagtagca gcttctatgc ataacctacc3420tattattcat cttcatggtg gagagaaaac gttagggaat tatgatgaat ttatacgaca3480ttcaataacg aaaatgagtc gtctacatct agtatcaact gatgaatatc ggaaaagggt3540tatccaactt ggtgaagatc ctaattgtgt atttaatgta ggtgcgctag gggctgaaaa3600cagtttgcaa ctagaattac cctctaaaaa ggagcttgaa aataagtacg gtgggttaaa3660tagaaaatat ttcgtagtcg tatttcatcc tgaaacgtta tcaactttac ctgttagaga3720gcagtattta gaattactag aagcattagc tagttttagc gaagaatacg attatatctt3780tattggctca aatgctgata ctggttcaga acaaataaga gaaatgactc tcgatttttg3840tagagtatat ggctgtcgat atatgatttc tgtgagacct gaagaatatc tagctttgat3900aaaatattca tatggcttaa taggcaattc gtcatctggg ttaattgagg ttccaagctt3960aaaggttccg acgattaata taggcgatcg ccaaaaagga agggttagag gtgattcggt4020aatagatacc atatgtaaaa aagaaagtat agaatgtgcc attgcttatt cacaacagaa4080aagtttcatt gaacgtgtaa aaaatgctca taatccttac tataataatg atgtaatgaa4140tagtattgtt aaaatcatta aagatttttt aacttatgaa aagttgggtt ataaagactt4200ctatgatgtt gcatatgact atagtcattt aaaataaaca acatgggtat tgtttttaat4260aagttatttg tatgatattt taaatttaaa aacctcatat taatatttaa attattgcaa4320atttaataat cacagattaa aaacttccga ttttaacatt ggccttggat gtttaatact4380atgcttaagt attactcaag tgttggatta agagggatta ctctacttac taaatttatt4440ttcattgttt tgcttgctcg acttttacca tcaacagatt taggagtgta tggattaatt4500aatgcagctg taggatatgg tattttcgtt gtaggttttg agttttatac gtattcaacg4560agagaaataa ttaactcgca aaaaaatagg ctttttttta tactaaaaaa tcaagctcta4620tttactgtta tatcttatat actatgtata ccggcattta tttttttatt atatttagaa4680atattaccat ctggaagtga atactggttt atcctacttt tattttttga gcacttatca4740caagagatta atagagttct aataacaata gaaagtcaat cgattgcaag ttttattctt4800tttgtaagac aaggtgtatg gtgttggtta gctatagctg tgatgctagt gtatccgaac4860ttaagaaata taacagttgt atttattttt tggtttggtg gtactgtgtc cgcgagtgtg4920cttggagtgg cttatatttt aaataaaaaa aaacaaagcg atattacaaa ctgggattgg4980acgtggataa aaaaaggtat aaagctgtct gtaccaatgc taattgcagc ccttgcacta5040cgaggctttt tcacgtttga tagattcgcg gtagaaaaaa tatcgggcct agaagttttg5100ggaggatata cattatttgt tagtatgact tcagctattc aatcattttt ggatactatt5160ttgatatctt tttcatttcc aaagcttgcc ttgttatatt cagggaaaaa atatataaaa5220tttaaatctg agttaagaaa attcacttat aaattaattt tactactatc tttcttgagc5280atctgttgct tttttactgg gattatattg gttaagtggt tggataaacg agattacata5340
caattatttc ctgtatttat attattaata gcagcgactt atatctattg tataagtctt5400attccacata ttgctttata cgcgatgaga gaagatcgtt acatattagt aagtcaactg5460atatcatttt tatctttttt actatttgtt ttttttagcg tatatcaaag tgatatctat5520tacttgctaa ttggtatgat agctagtttt gtattacttt tgatcttaaa aatgatcccg5580ttatataaaa ttctaaaaaa ggtttaaaat aaacgtgaat ataaagaaag ataagtttat5640aaatggagtg attttttttt ggttaattat ttcttcgtta tattacttaa atgctatttt5700ttctggtgtt gacacattaa aatataatga agatttaacg caaaaaatta taaaatatat5760agtttgctta gttataagtc taagtatctt atttatttac aagaaattta attatttttt5820tgtattgttt tttttcttgt tcctgtctgt tgcttcagcc cttttcagtg gtgcggtaac5880aatttacgca acaacaatgt tgattattgc aactatgatc agcttttgcc tgattattcc5940tctattttct tataatatgg tgaaagttaa tagagttctt ttatggacag gagttattgt6000aggcacgatt tctgtattag aattaacggt attttataat tatatggttt catattgggc6060tgccactgat gggattaggt caatatcttc tcttctgaat cctacgaata gtggtgctta6120ttcagcgatt attattttaa tcgccttggt gacaaatata aaaagtcttt ttaaaagagc6180tttatttctt ataatgccga tgataacgtt aattagcagt ggttcgcgca cagcatggtt6240atcacttggt atgacacttt tattaacagt agtattgaga gacagtgcca gcattcgctt6300gcgaaaaaaa atatttactc ttgcaagcat tggcactgtt tgcggtgcat tgtacgccat6360attttatatg ggcagtatct ctggtattga atcacaatat cgaggtctta atacgtatac6420tgcatcaatt cgagttgaaa actttctgac atatttaaat ttagttgatc tgaatatgtt6480gctacctgat tttttagata aaaatataaa tctcatttca gataactttt atctcgtaat6540gtttaattat gccggtctaa tcggcttttt tattgtttta ttaattttat tgctgcttat6600cttctggaac atacaattta aaatatttaa tgagttaatg gctgaagata tagccatttg6660gagagttgtt tttatttatt tcctaatatc cgggctttca aattcattta taaattcttt6720tcctgtaaat caattgttct ttatctcatg cggatattat atatataaat ataaattagt6780taaaagctct ataggaagat aaatatgcaa ttatcaatgt cgcaaataat agaatgttat6840ttacacgcaa cacaaaatga aatagatatc gataagtctt tatcaaaaag cattacaaaa6900aaaatgccac cacttcccag gacaagtaaa tgggctgggg aaaggtggag ttcatcgagt6960ttgcaaatta tttatgcagt gattatgttt gcctttattt ttggggggtt tttattatat7020gttatattat tttttgctaa atatatattg gctaaattta aaaattccat ttcagaaata7080aaggttgcta ataataagga aggtaaattt tactattttt cgttttcaga tttagaaatg7140aggcaaactt gctatttttt taaagataat gatagttaca aattatctcg agatgaactt7200attataataa aattaccatg ggtaaattat acaccaacga gttgtgactt taatgctatt7260aatttatatg aattaacatc gtttctagat gtggcaagag cattcttgtt atctattttt7320agttatatct attatttaaa accatcacgt ataaaatggc ttcttcatat ttatacagca7380ccttcttggt ttttggttgc tatgggaatg aataatatta aaggcaatct cgcaagtagt7440gaacattatg atcgttgggc tgttttaact gattttatat gcagaataaa aaggaaaaga7500tatatattaa ttcaacatgg ctcgttactg gcgttaaaga ctaagggtta tgaatttttc7560tctctctcat ataaactgaa agctgtatca gagctcgcta tctttaacga aattgagctt7620gaattatttt tagagcatat aatctcacag gctaatgatt acaatataaa aattcatttc7680tatcaacagc cattttatgt ttcatcaatt aataataaag gattatcaat tctaattatt7740gggcattcat tgtgtgaacg aggacaacta agtcttgggt cacaactttc aacgttatca7800gataatattg ttctttatta taaagaacat ccaaaagcta gagcatctga aaaagccaaa7860aagacaaaat ggaatttcat tacagatgat gattatttcc ctgatgtaga tattgtcatt7920tcgtatcctt ccactttggc atatcaatac aaagagttga ataaaatagt tattcttcat7980gaattagata atattgatca aaataaaatt gacgagatac ttatgaccat tagaaaaaat8040aagggcgtgt atggaaaata aaaattatca aatttgtaat cattgtatta tggatacatc8100tgatcctcat attacttttg atgatagcgg agtatgcaat tactgcgcca attataaaaa8160caatatattg ccgacatgga gaaaaggttt gttttcagat gtttctttat ctgaaatggc8220aagtaaaata aaggcggacg caaagaatag tgattttgat tgtattattg gactatcagg8280ggggcttgat agttcatatg ctgcatatat tgcaaaagaa aagatggggc tacgcccatt8340attattccat gttgatgccg gctggaatac agatcaggct gttggtaata ttgaaaaact8400tattgaaggc cttggtttag aactttatac agaggtagta aactgggagg aaatgaaaga8460tcttcaactg tctttcttaa aatcaggaat tccagatcaa gatctagttc aggacgcttc8520ctttttttca tcattatata agtttgctcg acaacataga attaaacatg tcattacggg8580gtccaatttt tctactgagt gttgtcgtga accagaagaa tggggaggat atttaggcat8640tgatactctg ttatttaatg atatccatac gaaatttgga gaaaaaccgt taaaaacttt8700tcctttagtg gatatattgg tttataaaat ttactatcag aaaattcttg gtatgaaagt8760gcatcatcca ctaaatttag ttccttttaa taagaaggat gcagaaaatg aacttaataa8820aaaatttggc tggcaaccct tccagcataa acatcatgag tcccgtttca cccggtttta8880
tgaagattat tggctgccac gcagatttgg ttatgagaaa cgaagagctc acttttcgag8940tttaattatg acgggacaaa tgtctcgtga acaagctctt gagaggattt caaaaccaga9000aatggatgag cactttctta aacaagagtt tgagtatgta gcgcacaaac ttggtattag9060tgttgaaaat ttgcaagagc tattttttat gcccaaaaaa acatataagg attataagaa9120taagcgttgg ttgattggtt taggtgcgaa tgtcttacgt gcacttggat tagaaaaaag9180gtatttcaga tgattacaat cattgattat ggtattggaa atatacaagc atttttgaat9240gtatataagc gactaggcat taatgcgggt gttgcccgtt ctgttgatga tatttttagt9300gctacacatt taataccgcc tggagttggg gcttttgatc aagctatgac tctttttaat9360aattcaggtt tacgagatag tattgaaaaa cgtgtatatg aagaaaagat tccaattatt9420ggtatctgtg tgggtatgca aatgcttgcg acctctagtg aggaggggag catgccaggt9480ttaggatgga ttccaggtac ggttcgagca tttagtagca atatctcttc acaaaacctc9540ccgatgcccc acatgggatg gaataattta attaaaagaa caagtacacc attgctgaaa9600gatttcgcag tagaaccttc attttatttt ttacactcat actattacga atgtgatgac9660acaggtgatg tattggcaac tgctaattat ggtcataatt ttcattgtat aattagcagg9720aataacatat atggtattca atgtcatcca gagaaaagcc attcatcggg atcccaacta9780ctaaaaaatt ttgcagagat ctaatagcat gcttagacca agaatcatac cctgtttact9840tatccacgat tctggcttag tcaaaacagt taattttaaa tcccctaagt atgttggtga9900tccaattaat gccgtcaaaa ttttcaatga gaaagaagct gatgaattga tggtcctaga9960tattgatgcg acatccaggg gactcgaacc taattatgat ttaataaaaa aactcgcagc 10020ggaatgccgt atgcctttat gctatggagg aggcgtaacc agcgtagcac aggctacaaa 10080aattatctct cttggtgttg aaaaggtatc aataagttca gcagctgttg aaaatcctaa 10140tcttgttaga gaattggcag aagcggttgg aaaacaaagt gttgttgttg tgctggatat 10200tatcaaacga aaaggtctat tctcaaaggg ctatgaactt tcgacaagga ataacactcg 10260caagcataaa atcgatcccg tctcgtttgc aaaggaaatg gccgatctgg gagctggaga 10320aattgtcatc aattttgtag ataatgatgg tgtcatggga ggatatgacg ttgcatattg 10380ctcaactatc aaatcgcaaa taaatattcc tgttacgttt ctcgggggcg ctggtagtta 10440tgaccatctt tctgcactga ttgaccaatg tggcatcgtt ggtgcggcag ctggtagtct 10500ttttgtattt aaagggaagt atagggcagt attgataagc tatccaacac ctgaacagaa 10560agatattatt tgtaatggtg taatgagtaa tcgtttataa ggggttatga tgttcaaaga 10620taaaatactg ttaatcactg gtggtactgg ttcatttggg aatgctgtat taaatcgctt 10680tctttccaca gatgtaaaag aaatacgcat atttagtcgt gatgaaaaaa agcaagatga 10740tatgcgtaaa aattataaca ataaaaaatt gaaattctat attggtgatg ttagagatta 10800tcgtagtatt ttgaatgcga ctcgcggagt tgattttata tatcacgcag cggcacttaa 10860gcaagttcca tcatgtgagt ttcatcctgt ggaggctgtt aaaactaatg ttcttggtac 10920agaaaatgtg cttgaagctg ctatagcgaa tgaagttaaa agggttgtgt gtcttagtac 10980tgataaagct gtatatccga tcaacgctat gggaatttca aaagctatga tggaaaaagt 11040catggttgcg aaatcgcgta atgttgactg caacaaaaca gtaatatgtg gtacccgtta 11100tgggaatgtc atggcctctc gtggatctgt tattccatta tttgttgatc ttatcaaatc 11160tggcaagcca ctaacaatta ctgaccctaa catgacccgt tttatgatga ctcttgagga 11220tgctgtagat ttagtacttt atgcattcga acatggtaat aacggagata tttttgtaca 11280aaaagctcca gctgcaacta tcgaaacatt agcaactgct ttaaaggatt tactaaatgc 11340tgctcatcac ccagtaaata ttattggtac gcgtcatggt gagaagttat ttgaagcttt 11400gctcagtcgt gaggaaatgc tctctgctga agatatgggg gattattatc gtataccacc 11460agatcttcgt gaccttaatt atggaaaata tgttgaacaa ggtgatagtc gtatatccga 11520ggttgaagat tacaactctc ataatacaca acggttgaac gttgaaggca tgaaaacgct 11580tttgctcaaa ttggatttta ttcgtgcact tcatgcaggt taacaacatg gctaagactc 11640atgatataaa aatattgatt actggtgcaa atggttttat tggccgtaat ttaagtttga 11700ggcttgagga actaggttac aagaatctta ttagaattga tcgggattca acagaacaag 11760atcttgaaca aggcttacag gacgctgatt tcatttatca tttggctgga gtcaatagac 11820caaagactga tgatgaattt aaatccggaa acagtgattt aactaaatac atagttgagt 11880atcttatttc tataggaaag aagataccaa ttatgctaag ttcttctata caagcagaac 11940ttgacaatgc ttatggggta agcaaagctt tagctgaacg ttatattgaa aaatatgcta 12000ctactagtgg ttctccatat tatattttca gatatccaaa cgtttttggc aaatggtgca 12060aaccaaatta taattctttt gttgcgactt tttgctataa tattgcgaat gatcttgcca 12120taactatcaa tgatgcatct gcgccagtta atttggttta tattgatgat gtttgtgcta 12180aagcgataga gcttctctcg ggggcaactg aaagcggata taaagctgtt gcaccaattt 12240attcaactac tgttggtgaa gttgcagaat taatttatag attcaagaat agccgttcca 12300ccctgatcac agaggctgtc gggacgggat ttacccgtgc attgtattct acatggctga 12360cttatttacc agcagagaag tttgcgtaca aggtaccttt ttatggggat gcccgcggag 12420
tcttttgtga gatgttgaaa acgccttcag cggggcagtt ttcatttttt actgctcacc 12480ctggtattac gcgtggcgga cattaccatc acagtaaaaa tgagaagttt ttggtcattc 12540gaggtcaggc atgctttaaa tttgaacatg tgattaccgg tgagcgatat gaactgaatg 12600tttcatcgga tgagttcaag attgttgaaa cagttcctgg ttggacacat gacattacaa 12660atattggaac tgaggaatta atagtcatgc tctgggcaaa tgaaattttc aaccgtgatg 12720agcccgatac tattgcgaga cctctataat gaaaaaatta aaagttatgt ctgttgttgg 12780aacccgtcct gagattatcc gtttgtcgag ggttcttgct aagtttgatg aatactgcga 12840gcatattatt gtccatactg gtcaaaatta tgattacgaa ttaaatgaag tattcttcaa 12900tgacttgggt gttcgaaaac ctgattattt tttaaatgca gcgggaaaaa atgcggcgga 12960aaccattggc caagttatta ttaaggtaga tgaagtatta gaaatcgaaa aacctgaagc 13020aatactggta ttgggcgata cgaattcatg tatttctgcc attccggcca aacgccataa 13080agttcctata tttcatatgg aagcaggtaa ccgttgtttc gatcaacgcg tgcctgaaga 13140aaccaacaga cgtattgttg accatacggc tgatatcaat atgacctaca gtgatattgc 13200tcgtgaatat ctcttggctg aaggtatccc agctgatcgg atcataaaaa ctggtagccc 13260tatgtttgag gttctttcat attatatgcc ccaaattgat ggttcagatg tgctatcgcg 13320tttgaatcta cagtctggtg agttttttgt agtaagtgcg catcgtgaag agaatgttga 13380ttctccaaaa cagctcgtaa agcttgcgaa cattctaaat actgttgctg aaaaatataa 13440tcttccagtt attgtctcca cacacccaag gacacgtaac cgaatccgtg agcaaggaat 13500tgaatttcat tcaaatataa atctactgaa accattgggt ttccatgatt ataaccactt 13560gcagaagaac tcacgagctg tgctttcaga tagcggtact atcactgaag agtcatccat 13620catgaatttc ccagcggtaa acatccggga agcgcatgag cgtccggaag gctttgagga 13680agcatccgtc atgatggtgg ggttagagtg tgaacgcgta ttacaagcgc tggatattct 13740ggcaacacaa ccgcgaggtg aagtccgtct tttacgtcag gttagtgatt acagcatgcc 13800aaatgtgtcg gataaagttg tcagaattgt tcactcttac acagattatg ttaagagagt 13860tgtctggaaa gaatattgat gaaacttgct ttaatcatag atgattacct gcccaacagt 13920actcgtgttg gtgcaaaaat gtttcatgaa cttgctcaag aatttatcca gcgtgggcac 13980gatgttacgg taattactcc tggtacgggc atgcaagaag agatttcttt tgataccttt 14040cagggggtaa aaacatggcg ttttaaaagc gggccgctca aggatgtaag taaaattcag 14100cgagtggtca atgaaacgct tttgtcctat cgggcgtgga aagccatcaa aaaatgggta 14160aaaaaagaga cctttgaggg tgtgatttat tattcacctt ccatattctg ggggtattta 14220gttaaaaaaa ttaaagctcg ttgccaatgt cctgcttatc ttattttaag agatatgttt 14280ccacaatggg taattgatgc aggaatcctt aatgctggtt ccccaataga acgctacttt 14340cgtctttttg aaaaaatatc ttgtcgtcag gcaaatcgta ttggacttat gtctgataag 14400aatcttgatg tttttcggaa agataataaa ggctatccgt gcgaagtttt gcgtaattgg 14460gcatccctaa caccaacgat catacccaag gattacatac cactacgtaa gcgacttggc 14520ctagaggata aaaccatttt cttctatggt ggaaacatag gtcatgcaca ggacatgaca 14580aacttgatgc gacttgtgag aaacatggca gcatatcctc aagctcattt cctatttatt 14640ggccagggtg atgaagttga attaattaat tcattagcct ctgagtgggc attgacgaat 14700ttcacctatt tgccctcggt taatcaggat gaatttaagt tcattttgtc ggaaatggat 14760atcggcttgt tttctctttc cgctagacac tcttcccata attttcctgg taagttatta 14820ggctatatgg ttcagtcgct acctatttta ggtagcgtaa atgccggaaa tgatttgctc 14880gacattgtca atcaaaataa tgccggatta atccatgtca atggtgagga cgataaatta 14940tgtcaatctg cgctattaat gttgcatgat attgatgtgc gccggcaact tggttcgggg 15000gcgaatatat tgttgaaaga acaattctcc gttgagtctg cggcacagac gatagaaatg 15060aggttggagg catgcaatgc gattaattga taatgaccaa ctcgacaaat tatatgatca 15120agccgagcaa tcggaacgtt tacgttccca ccttattatg cacggctcgc atcaagaaaa 15180ggtacagcgt ttacttattg cattagtaaa gggcagctat gttgaaccgc attatcacaa 15240acttcctcat cagtgggaaa tgttcattgt tatggagggg caacttcagg tttgtttgta 15300tggtagaaat ggtgaggtta taaagcaatt tatagcagga gataatattg gaataagcat 15360tgtggagttt tctccgggcg atatacacag tgtcgaatgc ctatctccgc gtgctcttat 15420ggtggaagtt aaagaggggc catttgaccc ttcttttgca aaatcgttcg tgtgatgctt 15480gtctaaagta catcttctgc tatctactca agctaaacct gagttaacat ccataccata 15540tttcaagctg cgcatatctt gcgcggtgac caccccctga caggagtatg taatgtccaa 15600gcaacagatt ggcgtagtcg gtatggcagt gatggggcgc aatcttgcgc ttaacatcga 15660aagccgtggt tataccgtct ctattttcaa ccgttcccgt gaaaagacgg aagaagtgat 15720tgccgaaaat ccaggcaaaa aactggttcc ttactatacg gtgaaagagt tcgttgaatc 15780tctggaaacg cctcgtcgca tcctgttaat ggttaaagca ggtgcaggca cggatgctgc 15840tattgattcc ctcaagccat acctcgataa aggtgacatc attattgacg gtggtaatac 15900cttcttccag gacactattc gtcgtaatcg tgagctttct gcagaaggct ttaatttcat 15960
tggtaccggt gtttccggtg gggaagaagg tgcactgaaa ggaccttcca ttatgcctgg 16020tggccagaaa gaagcctatg aactggttgc accgatcctg accaaaatcg ccgcagtggc 16080tgaagacggt gagccatgcg ttacctatat tggtgccgat ggcgcgggtc actatgtgaa 16140gatggttcac aacggtattg aatacggtga tatgcagctg attgctgaag cttattctct 16200gcttaaaggt ggcctgaacc tcaccaacga agaactggca cagaccttta ccgagtggaa 16260taacggtgaa ctgagcagct acctgatcga catcaccaaa gatatcttca ctaaaaaaga 16320tgaagacggt aactacctgg ttgatgtgat tctggatgaa gcggctaaca aaggtaccgg 16380taaatggacc agccagagcg cgctggatct cggcgaaccg ctgtcgctga ttaccgagtc 16440tgtgtttgca cgttatatct cttctctgaa agatcagcgt gttgccgcgt ctaaagttct 16500ctctggcccg caagcgcagc cagctggcra caaggctgag ttcattgaaa aagttcgtcg 16560tgcgctgtat ctgggcaaaa tcgtttctta cgctcagggc ttctctcagc tgcgtgctgc 16620gtctgaagaa tacaactggg atctgaacta cggcgaaatc gcgaagattt tccgtgctgg 16680ctgcatcatc cgtgcgcagt tcctgcagaa aatcaccgat gcctatgccg aaaatccgca 16740gatcgctaac ctgctgctgg ctccgtactt caagcaaatt gccgatgact atcagcaggc 16800gctgcgcgat gtcgttgctt atgcagtaca gaacggtatc ccggttccga ccttcgccgc 16860tgcggttgcc tattatgaca gctaccgttc cgctgttctg cctgcgaacc taatccaggc 16920gcagcgcgac ta 16932表1大腸桿菌O145型的O抗原基因簇中的糖基轉(zhuǎn)移酶基因和寡糖單位處理基因及其中的引物及PCR數(shù)據(jù)
*只在大腸桿菌O145型中得到正確的一條帶表2 166株大腸桿菌和43株志賀氏菌及它們的來(lái)源組號(hào) 該組中含有的菌株 來(lái)源1、野生型大腸桿菌O1,O2,O5,O7,O8,O9,O12,O13,O14,O15,O16,O17,O18,IMVSaO19ab,O20,O21,O22,O23,O242、野生型大腸桿菌O4,O10,O25,O26,O27,O28,O29,O30,O32,O33,O34,O35,IMVSaO36,O37,O38,O40,O41,O42,O433、野生型大腸桿菌O6,O44,O45,O46,O48,O49,O50,O51,O52,O54,O55,O56,IMVSaO57,O58,O60,O61,O62,O534、野生型大腸桿菌O63,O65,O66,O69,O70,O71,O74,O75,O76,O77,O78,IMVSaO79,O80,O81,O82,O83,O685、野生型大腸桿菌O84,O85,O86,O87,O88,O89,O90,O91,O92,O98,O99,IMVSaO101,O102,O103,O104,O105,O106,O976、野生型大腸桿菌O107,O108,O109,O110,O111,O112ab,O112ac,O113, IMVSaO115,O116,O118,O120,O123,O125,O126,O128,O1177、野生型大腸桿菌O129,O130,O131,O132,O133,O134,O135,O136,O137, IMVSaO138,O139,O141,O142,O143,O144,O1408、野生型大腸桿菌O146,O147,O148,O150,O152,O154,O156,O157,O158, IMVSaO159,O160,O161,O163,O164,O165,O166,O153 b9、野生型大腸桿菌O168,O169,O170,O171,O172,O173, c痢疾志賀氏菌 D1,D2,D3,D4,D5,D6,D7,D8,D9,D10,D11,D12,D13 d10、鮑氏志賀氏菌 B1,B2,B3,B4,B6,B7,B8,B9,B10,B11,B12,B13,B14,B15, dB16,B17,B1811、福氏志賀氏菌 F1a,F(xiàn)1b,F(xiàn)2a,F(xiàn)2b,F(xiàn)3,F(xiàn)4a,F(xiàn)4b,F(xiàn)5(v4),F(xiàn)5(v7),F(xiàn)6, dDS,DR12、野生型大腸桿菌 O3,O11,O39,O59,O64,O73,O96,O95,O100,O114,O151,O155,IMVSaO124,O167,O162,O121,O127,O149,O11913、第7組菌株加上大腸桿菌標(biāo)準(zhǔn)菌株 O145IMVSa
為了檢測(cè)的方便,每12-19個(gè)菌分為一組,總共12組,第13組作為陰性對(duì)照a. Institude of Medical and Veterinary Science,Anelaide,Australiab. Statens Serum Institut,Copenhagen,Denmarkc. O172和O173來(lái)自于Statens Serum Institut,Copenhagen,Denmark,其余來(lái)自于IMVSd. 中國(guó)預(yù)防醫(yī)學(xué)科學(xué)院流行病學(xué)研究所表3大腸桿菌O145型O抗原基因結(jié)構(gòu)圖E.coli O145 O-antigen gene cluster orf# orf1 nnaB nnaC nnaA wzxwzy orf7 orf8 orf9 orf10 fnl1 fnl2 fnl3 orf14 of15 gndG+C 34.4 32.630.1 32.8 29.3 29.329.0 34.7 36.4 39.4 37.0 38.1 40.6 40.2 41.4 50.3content表4大腸桿菌O145型O抗原基因簇基因位置ATTGGTAGCT GTAAGCCAAG GGCGGTAGCG TGTGTTTTTG AGATATTTAT GTATTATCGT 60從 Orf1的起始TGTCATGAAT ACAAGTAACA ACAAAGTTAA TGTGATCTAA TCAAACCATT AGATGGTATG120AATATGAAGC AAAAATTAAT AATTATTGGT GCTGGTGGTT TTGCTAAAAC TGTAATTGAC 180AGTTTGGATC ATGAAAAGTA TGAAATAGAA GGGTTCATTG ATACATTTAA AACAGGTGAG 240CATCAAGGAT ACCCTATTTT AGGTGATACT TTAGGTGTCA TAGACGAACC TAACCAATAC 300CTATACTTTA TTGCAATTGG AGATCCCGAT TACAGAGCCT TATGGATGAA GTTAATAGAA 360GAAATGAAAC TTTCAACTAT CAATGTAATT GACAGAACAT CTATAATTTC TGAACATTCT 420AGGCTTGGTA CCTGCATTTA TATAGGGAAA ATGGCTATCA TTAACTGTGA TTCAGAACTA 480GAAGATGGAG TGGTGATAAA CACAAGAGCA TTAGTAGAGC ATGGGAATTA TATATCATAT 540TGTACAAATA TCTCTACTAA TGTTGTTCTT AATGGTGATG TATTCGTTGG GGAAAAATCC 600TTTATAGGAA GTTGTACCGT TGTTAATGGG CAACTAAAGA TAGGTAATTC ATCAATTATT 660GGTTCTGGTT CTGTAGTTAT TCGTGATGTT CCTGACAATG TAGTAGTGGC CGGGGCTCCT 720從 Orf1的終止 orf2的起始ACAAAGTTTA TTAGAGCAAG GTGATTTTTA TTATGTCGAG AATTTATATT GTTGCTGAAA 780TTGGTTGTAA TCATAACGGA GATTTCGAGT TAGCTAAGAA AATGGTAAAA GAGGCAAAAT 840CTGCCGGGGT AGATGCAGTA AAATTCCAAA CTTTTAAAGC TGAGCAACTT ATCTCAAAAT 900ATGCTCCTAA AGCAGAATAT CAAATAAAAG TTACCGGTAA TGAAGAGACT CAATTAGAGA 960TGACTCGTAA GTTAGAGTTG CCATATGATG AGTTTATCAA GCTGGAAGAA TATGCAAAAG1020AACTTGGGTT GGATGTCTTC TCAACACCAT TTGATTTTGA TTCAATCGAT TTTCTTGCAT1080CCAGAAATCA AAAAGTTTGG AAGATTCCAT CAGGCGAATT ATTAAATTTA CCATATTTAG1140AGAAAATAGC CAAATTGCCA ATCGAAGATA AAAAAATTGT ACTATCAACT GGTATGGCAA1200CAGTTGATGA AATCAATTTG GCATTAAAGG TTTTTATTGA TAATGGCATT ACACATAGAA1260ATATAACAAT ATTACATTGT AATACAGAGT ATCCAACGCC ATTTGAAGAT GTAAATCTAA1320ATACAATTTC TGGATTCAAA AAAATATTTA GTCAATATAA TATTGGATTT TCTGATCATT1380CTCCAGGTTA TTTTGCTGGT ATTGCATCAG TGCCTTATGG GATCACTTTT ATTGAGAAAC1440ATTTTACACT GGATAAAAAT TTTGAAGGTC CAGATCATAA AGCATCAGTT ACACCTGAGG1500AACTTAAATT ACTATGCGAA GGAATACGTG CAGTAGAAAT TTCACTTGGT AGCTATGAAA1560AGTTAGTAAC AAATTCAGAA CGAAAGAATA AAGTAGTAGC TCGAAAATCA ATTGTTGCTA1620AATGTGCAAT AAAAAAAGGA GATATTTTTA CGACGGAAAA TATTACGACA AAGCGACCAG1680GAAACGGAAT TAGTCCAATG TACTGGTATG AGGTCTTAGG TAAAATAGCT GAAAAGGATT1740Orf2的終止orf3的起始TTGATGAGGA TCAACTAATT GAGCACTCTG ATTTTAGTAA ACAAGAGGTTTGAGTTGTGT 1800CATTAAAAAA AATTGCCATT ATACCTGCTC GGTCTGGATC TAAGGGCTTA CCAAATAAAA1860ATATACTAAT GTTATTGGAT CGCCCATTAA TTGCTTATAC TATCGAAGCA GCGATTAGCT1920CTAATATATT TGATAAAATT ATTGTTTCAA CAGATTCATT AGAATATAAA TATATTGCAG1980AGAAATATGG CGCGGAAGTA ATATTACGCA CAAAAGAATT ATCGTTGGAT TCGGCAACAT2040CTTTTATGGT AGTTCAAGAT GTGCTTGAAA AATGTCCAGG ATATGATTAT TTTGTGCTTC2100TACAACCAAC ATCACCATTT CGTAATTATA AGCATATTAA GAATGCTGTT GAGCAATTTG2160AAAATAATCA CGAAGCAAAA TTTTTGGTGT CTGTGGTAGA AAGTGATAAA AGTTCGGCGT2220TAATTAAACC AATTGATAAT TCACTGTCAT TAAGGAACTT TGACTGTGAT TTTAGTACAT2280ATCGTAGACA AAATAAAAAA GAATACTGTC CAAATGGTGC GATTTTTATT GGTTATGTTT2340CTAATTATTT AAGACAAAAA CATTTCTTTG GTGCTGACAG TATAGCCTAT ATTATGAATA2400AAGAAGATTC TATTGATATC GATGATCAGT TAGATTTTGA ATTGGCAATT CTAATCCAAA2460CAAAAAAAAA TAAAAAAAAT TTATTGGATA ATGCTATTAT CAAACGAATT GTCGATAAAA2520
AAGATTTATT TAACAAAGTT GAGCAAATTA CACTGATTGG ACATTCAATT TTTGATTATT2580GGGATCTCAG CAACATATGT GGAATTAAGG TTAACAATTT AGGCATTGCT GGCATTGATA2640GCGAAAAATA TTACAAATAC ATCATTGAAA AAAACATGCT CACCAATATA GGTAAGTATG2700TGCTATTAAT TTCAGGCACA AACGACATTG TGAACGATGG TTGGACTATT GAATACACTA2760TAAAATGGAC AAAAAATCTG ATCAATAGAG TAAAAATTAT AAATCCTGAT GTTACTATCA2820TTCTGCTAGC AGTGCCGCCT GTTCGAGGAA GAGTTGATAG GGATAATAAT ACTATCAATA2880AATTAAATCT GGCAATGAAA CAATATTTTA GTAAATTAGA CAATGTTATT TGGATGCCGT2940TATCTCCATC TTTTTATGAT GAGTTCGGCA ATCTGAATGA AAATTATACT TATGATGGTT3000Orf4的起始TACATTTCAC GTTACAAGCT TACAAACAGT TAGAAAATGA TATTTCGAGT ATCTTAAAAT3060Orf3的終止GAAAAGAAAA TTGCTCTATG TCACCGGCTC AAGAGCTGAG TACGGTATTA TGAAACGACT 3120ATTAAAAAGT CTAAAAGATG ATCCTGATAT TGATTTATCA ATTATTGCAA CAGGTATGCA3180TTGCGATTCT GAATATGGTT ATACATATAA AACAATCGAG AATGATGGTT TCTTAATTGA3240AAAATTAATT GATTTGCAGC TGAAAAATAA AACCAACGCA GATGTTTTGA AAACGATGTC3300GATATGCCAA CAAGCATTTG GTGAGCATTT CCAAGAGAAA AAATATGATG CTGTCATTAT3360ATTAGGTGAT CGATACGAAA TATTTTCAGT GGCAGTAGCA GCTTCTATGC ATAACCTACC3420TATTATTCAT CTTCATGGTG GAGAGAAAAC GTTAGGGAAT TATGATGAAT TTATACGACA3480TTCAATAACG AAAATGAGTC GTCTACATCT AGTATCAACT GATGAATATC GGAAAAGGGT3540TATCCAACTT GGTGAAGATC CTAATTGTGT ATTTAATGTA GGTGCGCTAG GGGCTGAAAA3600CAGTTTGCAA CTAGAATTAC CCTCTAAAAA GGAGCTTGAA AATAAGTACG GTGGGTTAAA3660TAGAAAATAT TTCGTAGTCG TATTTCATCC TGAAACGTTA TCAACTTTAC CTGTTAGAGA3720GCAGTATTTA GAATTACTAG AAGCATTAGC TAGTTTTAGC GAAGAATACG ATTATATCTT3780TATTGGCTCA AATGCTGATA CTGGTTCAGA ACAAATAAGA GAAATGACTC TCGATTTTTG3840TAGAGTATAT GGCTGTCGAT ATATGATTTC TGTGAGACCT GAAGAATATC TAGCTTTGAT3900AAAATATTCA TATGGCTTAA TAGGCAATTC GTCATCTGGG TTAATTGAGG TTCCAAGCTT3960AAAGGTTCCG ACGATTAATA TAGGCGATCG CCAAAAAGGA AGGGTTAGAG GTGATTCGGT4020AATAGATACC ATATGTAAAA AAGAAAGTAT AGAATGTGCC ATTGCTTATT CACAACAGAA4080AAGTTTCATT GAACGTGTAA AAAATGCTCA TAATCCTTAC TATAATAATG ATGTAATGAA4140TAGTATTGTT AAAATCATTA AAGATTTTTT AACTTATGAA AAGTTGGGTT ATAAAGACTT4200Orf4的終止CTATGATGTT GCATATGACT ATAGTCATTT AAAATAAACA ACATGGGTAT TGTTTTTAAT 4260AAGTTATTTG TATGATATTT TAAATTTAAA AACCTCATAT TAATATTTAA ATTATTGCAA4320Orf5的起始ATTTAATAAT CACAGATTAA AAACTTCCGA TTTTAACATT GGCCTTGGAT GTTTAATACT 4380ATGCTTAAGT ATTACTCAAG TGTTGGATTA AGAGGGATTA CTCTACTTAC TAAATTTATT4440TTCATTGTTT TGCTTGCTCG ACTTTTACCA TCAACAGATT TAGGAGTGTA TGGATTAATT4500AATGCAGCTG TAGGATATGG TATTTTCGTT GTAGGTTTTG AGTTTTATAC GTATTCAACG4560AGAGAAATAA TTAACTCGCA AAAAAATAGG CTTTTTTTTA TACTAAAAAA TCAAGCTCTA4620TTTACTGTTA TATCTTATAT ACTATGTATA CCGGCATTTA TTTTTTTATT ATATTTAGAA4680ATATTACCAT CTGGAAGTGA ATACTGGTTT ATCCTACTTT TATTTTTTGA GCACTTATCA4740CAAGAGATTA ATAGAGTTCT AATAACAATA GAAAGTCAAT CGATTGCAAG TTTTATTCTT4800TTTGTAAGAC AAGGTGTATG GTGTTGGTTA GCTATAGCTG TGATGCTAGT GTATCCGAAC4860TTAAGAAATA TAACAGTTGT ATTTATTTTT TGGTTTGGTG GTACTGTGTC CGCGAGTGTG4920CTTGGAGTGG CTTATATTTT AAATAAAAAA AAACAAAGCG ATATTACAAA CTGGGATTGG4980ACGTGGATAA AAAAAGGTAT AAAGCTGTCT GTACCAATGC TAATTGCAGC CCTTGCACTA5040CGAGGCTTTT TCACGTTTGA TAGATTCGCG GTAGAAAAAA TATCGGGCCT AGAAGTTTTG5100GGAGGATATA CATTATTTGT TAGTATGACT TCAGCTATTC AATCATTTTT GGATACTATT5160TTGATATCTT TTTCATTTCC AAAGCTTGCC TTGTTATATT CAGGGAAAAA ATATATAAAA5220TTTAAATCTG AGTTAAGAAA ATTCACTTAT AAATTAATTT TACTACTATC TTTCTTGAGC5280ATCTGTTGCT TTTTTACTGG GATTATATTG GTTAAGTGGT TGGATAAACG AGATTACATA5340CAATTATTTC CTGTATTTAT ATTATTAATA GCAGCGACTT ATATCTATTG TATAAGTCTT5400ATTCCACATA TTGCTTTATA CGCGATGAGA GAAGATCGTT ACATATTAGT AAGTCAACTG5460ATATCATTTT TATCTTTTTT ACTATTTGTT TTTTTTAGCG TATATCAAAG TGATATCTAT5520TACTTGCTAA TTGGTATGAT AGCTAGTTTT GTATTACTTT TGATCTTAAA AATGATCCCG5580Orf5的終止 orf6的起始TTATATAAAA TTCTAAAAAA GGTTTAAAAT AAACGTGAAT ATAAAGAAAG ATAAGTTTAT5640AAATGGAGTG ATTTTTTTTT GGTTAATTAT TTCTTCGTTA TATTACTTAA ATGCTATTTT5700TTCTGGTGTT GACACATTAA AATATAATGA AGATTTAACG CAAAAAATTA TAAAATATAT5760AGTTTGCTTA GTTATAAGTC TAAGTATCTT ATTTATTTAC AAGAAATTTA ATTATTTTTT5820TGTATTGTTT TTTTTCTTGT TCCTGTCTGT TGCTTCAGCC CTTTTCAGTG GTGCGGTAAC5880AATTTACGCA ACAACAATGT TGATTATTGC AACTATGATC AGCTTTTGCC TGATTATTCC5940TCTATTTTCT TATAATATGG TGAAAGTTAA TAGAGTTCTT TTATGGACAG GAGTTATTGT6000AGGCACGATT TCTGTATTAG AATTAACGGT ATTTTATAAT TATATGGTTT CATATTGGGC6060TGCCACTGAT GGGATTAGGT CAATATCTTC TCTTCTGAAT CCTACGAATA GTGGTGCTTA6120TTCAGCGATT ATTATTTTAA TCGCCTTGGT GACAAATATA AAAAGTCTTT TTAAAAGAGC6180TTTATTTCTT ATAATGCCGA TGATAACGTT AATTAGCAGT GGTTCGCGCA CAGCATGGTT6240ATCACTTGGT ATGACACTTT TATTAACAGT AGTATTGAGA GACAGTGCCA GCATTCGCTT6300GCGAAAAAAA ATATTTACTC TTGCAAGCAT TGGCACTGTT TGCGGTGCAT TGTACGCCAT6360ATTTTATATG GGCAGTATCT CTGGTATTGA ATCACAATAT CGAGGTCTTA ATACGTATAC6420TGCATCAATT CGAGTTGAAA ACTTTCTGAC ATATTTAAAT TTAGTTGATC TGAATATGTT6480
GCTACCTGAT TTTTTAGATA AAAATATAAA TCTCATTTCA GATAACTTTT ATCTCGTAAT6540GTTTAATTAT GCCGGTCTAA TCGGCTTTTT TATTGTTTTA TTAATTTTAT TGCTGCTTAT6600CTTCTGGAAC ATACAATTTA AAATATTTAA TGAGTTAATG GCTGAAGATA TAGCCATTTG6660GAGAGTTGTT TTTATTTATT TCCTAATATC CGGGCTTTCA AATTCATTTA TAAATTCTTT6720TCCTGTAAAT CAATTGTTCT TTATCTCATG CGGATATTAT ATATATAAAT ATAAATTAGT6780Orf6的終止orf7的起始TAAAAGCTCT ATAGGAAGAT AAATATGCAA TTATCAATGT CGCAAATAAT AGAATGTTAT6840TTACACGCAA CACAAAATGA AATAGATATC GATAAGTCTT TATCAAAAAG CATTACAAAA6900AAAATGCCAC CACTTCCCAG GACAAGTAAA TGGGCTGGGG AAAGGTGGAG TTCATCGAGT6960TTGCAAATTA TTTATGCAGT GATTATGTTT GCCTTTATTT TTGGGGGGTT TTTATTATAT7020GTTATATTAT TTTTTGCTAA ATATATATTG GCTAAATTTA AAAATTCCAT TTCAGAAATA7080AAGGTTGCTA ATAATAAGGA AGGTAAATTT TACTATTTTT CGTTTTCAGA TTTAGAAATG7140AGGCAAACTT GCTATTTTTT TAAAGATAAT GATAGTTACA AATTATCTCG AGATGAACTT7200ATTATAATAA AATTACCATG GGTAAATTAT ACACCAACGA GTTGTGACTT TAATGCTATT7260AATTTATATG AATTAACATC GTTTCTAGAT GTGGCAAGAG CATTCTTGTT ATCTATTTTT7320AGTTATATCT ATTATTTAAA ACCATCACGT ATAAAATGGC TTCTTCATAT TTATACAGCA7380CCTTCTTGGT TTTTGGTTGC TATGGGAATG AATAATATTA AAGGCAATCT CGCAAGTAGT7440GAACATTATG ATCGTTGGGC TGTTTTAACT GATTTTATAT GCAGAATAAA AAGGAAAAGA7500TATATATTAA TTCAACATGG CTCGTTACTG GCGTTAAAGA CTAAGGGTTA TGAATTTTTC7560TCTCTCTCAT ATAAACTGAA AGCTGTATCA GAGCTCGCTA TCTTTAACGA AATTGAGCTT7620GAATTATTTT TAGAGCATAT AATCTCACAG GCTAATGATT ACAATATAAA AATTCATTTC7680TATCAACAGC CATTTTATGT TTCATCAATT AATAATAAAG GATTATCAAT TCTAATTATT7740GGGCATTCAT TGTGTGAACG AGGACAACTA AGTCTTGGGT CACAACTTTC AACGTTATCA7800GATAATATTG TTCTTTATTA TAAAGAACAT CCAAAAGCTA GAGCATCTGA AAAAGCCAAA7860AAGACAAAAT GGAATTTCAT TACAGATGAT GATTATTTCC CTGATGTAGA TATTGTCATT7920TCGTATCCTT CCACTTTGGC ATATCAATAC AAAGAGTTGA ATAAAATAGT TATTCTTCAT7980GAATTAGATA ATATTGATCA AAATAAAATT GACGAGATAC TTATGACCAT TAGAAAAAAT8040Orf8的起始Orf7的終止AAGGGCGTGTATGGAAAATA AAAATTATCA AATTTGTAAT CATTGTATTA TGGATACATC8100TGATCCTCAT ATTACTTTTG ATGATAGCGG AGTATGCAAT TACTGCGCCA ATTATAAAAA8160CAATATATTG CCGACATGGA GAAAAGGTTT GTTTTCAGAT GTTTCTTTAT CTGAAATGGC8220AAGTAAAATA AAGGCGGACG CAAAGAATAG TGATTTTGAT TGTATTATTG GACTATCAGG8280GGGGCTTGAT AGTTCATATG CTGCATATAT TGCAAAAGAA AAGATGGGGC TACGCCCATT8340ATTATTCCAT GTTGATGCCG GCTGGAATAC AGATCAGGCT GTTGGTAATA TTGAAAAACT8400TATTGAAGGC CTTGGTTTAG AACTTTATAC AGAGGTAGTA AACTGGGAGG AAATGAAAGA8460TCTTCAACTG TCTTTCTTAA AATCAGGAAT TCCAGATCAA GATCTAGTTC AGGACGCTTC8520CTTTTTTTCA TCATTATATA AGTTTGCTCG ACAACATAGA ATTAAACATG TCATTACGGG8580GTCCAATTTT TCTACTGAGT GTTGTCGTGA ACCAGAAGAA TGGGGAGGAT ATTTAGGCAT8640TGATACTCTG TTATTTAATG ATATCCATAC GAAATTTGGA GAAAAACCGT TAAAAACTTT8700TCCTTTAGTG GATATATTGG TTTATAAAAT TTACTATCAG AAAATTCTTG GTATGAAAGT8760GCATCATCCA CTAAATTTAG TTCCTTTTAA TAAGAAGGAT GCAGAAAATG AACTTAATAA8820AAAATTTGGC TGGCAACCCT TCCAGCATAA ACATCATGAG TCCCGTTTCA CCCGGTTTTA8880TGAAGATTAT TGGCTGCCAC GCAGATTTGG TTATGAGAAA CGAAGAGCTC ACTTTTCGAG8940TTTAATTATG ACGGGACAAA TGTCTCGTGA ACAAGCTCTT GAGAGGATTT CAAAACCAGA9000AATGGATGAG CACTTTCTTA AACAAGAGTT TGAGTATGTA GCGCACAAAC TTGGTATTAG9060TGTTGAAAAT TTGCAAGAGC TATTTTTTAT GCCCAAAAAA ACATATAAGG ATTATAAGAA9120TAAGCGTTGG TTGATTGGTT TAGGTGCGAA TGTCTTACGT GCACTTGGAT TAGAAAAAAG9180Orf9的起始Orf8的終止GTATTTCAGA TGATTACAAT CATTGATTAT GGTATTGGAA ATATACAAGC ATTTTTGAAT 9240GTATATAAGC GACTAGGCAT TAATGCGGGT GTTGCCCGTT CTGTTGATGA TATTTTTAGT9300GCTACACATT TAATACCGCC TGGAGTTGGG GCTTTTGATC AAGCTATGAC TCTTTTTAAT9360AATTCAGGTT TACGAGATAG TATTGAAAAA CGTGTATATG AAGAAAAGAT TCCAATTATT9420GGTATCTGTG TGGGTATGCA AATGCTTGCG ACCTCTAGTG AGGAGGGGAG CATGCCAGGT9480TTAGGATGGA TTCCAGGTAC GGTTCGAGCA TTTAGTAGCA ATATCTCTTC ACAAAACCTC9540CCGATGCCCC ACATGGGATG GAATAATTTA ATTAAAAGAA CAAGTACACC ATTGCTGAAA9600GATTTCGCAG TAGAACCTTC ATTTTATTTT TTACACTCAT ACTATTACGA ATGTGATGAC9660ACAGGTGATG TATTGGCAAC TGCTAATTAT GGTCATAATT TTCATTGTAT AATTAGCAGG9720AATAACATAT ATGGTATTCA ATGTCATCCA GAGAAAAGCC ATTCATCGGG ATCCCAACTA9780Orf9的終止orf10的起始CTAAAAAATT TTGCAGAGAT CTAATAGCAT GCTTAGACCA AGAATCATAC CCTGTTTACT9840TATCCACGAT TCTGGCTTAG TCAAAACAGT TAATTTTAAA TCCCCTAAGT ATGTTGGTGA9900TCCAATTAAT GCCGTCAAAA TTTTCAATGA GAAAGAAGCT GATGAATTGA TGGTCCTAGA9960TATTGATGCG ACATCCAGGG GACTCGAACC TAATTATGAT TTAATAAAAA AACTCGCAGC 10020GGAATGCCGT ATGCCTTTAT GCTATGGAGG AGGCGTAACC AGCGTAGCAC AGGCTACAAA 10080AATTATCTCT CTTGGTGTTG AAAAGGTATC AATAAGTTCA GCAGCTGTTG AAAATCCTAA 10140TCTTGTTAGA GAATTGGCAG AAGCGGTTGG AAAACAAAGT GTTGTTGTTG TGCTGGATAT 10200TATCAAACGA AAAGGTCTAT TCTCAAAGGG CTATGAACTT TCGACAAGGA ATAACACTCG 10260CAAGCATAAA ATCGATCCCG TCTCGTTTGC AAAGGAAATG GCCGATCTGG GAGCTGGAGA 10320AATTGTCATC AATTTTGTAG ATAATGATGG TGTCATGGGA GGATATGACG TTGCATATTG 10380CTCAACTATC AAATCGCAAA TAAATATTCC TGTTACGTTT CTCGGGGGCG CTGGTAGTTA 10440TGACCATCTT TCTGCACTGA TTGACCAATG TGGCATCGTT GGTGCGGCAG CTGGTAGTCT 10500
TTTTGTATTT AAAGGGAAGT ATAGGGCAGT ATTGATAAGC TATCCAACAC CTGAACAGAA10560Orf10的終止orf11的起始AGATATTATT TGTAATGGTG TAATGAGTAA TCGTTTATAAGGGGTTATGA TGTTCAAAGA10620TAAAATACTG TTAATCACTG GTGGTACTGG TTCATTTGGG AATGCTGTAT TAAATCGCTT10680TCTTTCCACA GATGTAAAAG AAATACGCAT ATTTAGTCGT GATGAAAAAA AGCAAGATGA10740TATGCGTAAA AATTATAACA ATAAAAAATT GAAATTCTAT ATTGGTGATG TTAGAGATTA10800TCGTAGTATT TTGAATGCGA CTCGCGGAGT TGATTTTATA TATCACGCAG CGGCACTTAA10860GCAAGTTCCA TCATGTGAGT TTCATCCTGT GGAGGCTGTT AAAACTAATG TTCTTGGTAC10920AGAAAATGTG CTTGAAGCTG CTATAGCGAA TGAAGTTAAA AGGGTTGTGT GTCTTAGTAC10980TGATAAAGCT GTATATCCGA TCAACGCTAT GGGAATTTCA AAAGCTATGA TGGAAAAAGT11040CATGGTTGCG AAATCGCGTA ATGTTGACTG CAACAAAACA GTAATATGTG GTACCCGTTA11100TGGGAATGTC ATGGCCTCTC GTGGATCTGT TATTCCATTA TTTGTTGATC TTATCAAATC11160TGGCAAGCCA CTAACAATTA CTGACCCTAA CATGACCCGT TTTATGATGA CTCTTGAGGA11220TGCTGTAGAT TTAGTACTTT ATGCATTCGA ACATGGTAAT AACGGAGATA TTTTTGTACA11280AAAAGCTCCA GCTGCAACTA TCGAAACATT AGCAACTGCT TTAAAGGATT TACTAAATGC11340TGCTCATCAC CCAGTAAATA TTATTGGTAC GCGTCATGGT GAGAAGTTAT TTGAAGCTTT11400GCTCAGTCGT GAGGAAATGC TCTCTGCTGA AGATATGGGG GATTATTATC GTATACCACC11460AGATCTTCGT GACCTTAATT ATGGAAAATA TGTTGAACAA GGTGATAGTC GTATATCCGA11520GGTTGAAGAT TACAACTCTC ATAATACACA ACGGTTGAAC GTTGAAGGCA TGAAAACGCT11580Orf11的終止 orf12的起始TTTGCTCAAA TTGGATTTTA TTCGTGCACT TCATGCAGGTTAACAACATGGCTAAGACTC11640ATGATATAAA AATATTGATT ACTGGTGCAA ATGGTTTTAT TGGCCGTAAT TTAAGTTTGA11700GGCTTGAGGA ACTAGGTTAC AAGAATCTTA TTAGAATTGA TCGGGATTCA ACAGAACAAG11760ATCTTGAACA AGGCTTACAG GACGCTGATT TCATTTATCA TTTGGCTGGA GTCAATAGAC11820CAAAGACTGA TGATGAATTT AAATCCGGAA ACAGTGATTT AACTAAATAC ATAGTTGAGT11880ATCTTATTTC TATAGGAAAG AAGATACCAA TTATGCTAAG TTCTTCTATA CAAGCAGAAC11940TTGACAATGC TTATGGGGTA AGCAAAGCTT TAGCTGAACG TTATATTGAA AAATATGCTA12000CTACTAGTGG TTCTCCATAT TATATTTTCA GATATCCAAA CGTTTTTGGC AAATGGTGCA12060AACCAAATTA TAATTCTTTT GTTGCGACTT TTTGCTATAA TATTGCGAAT GATCTTGCCA12120TAACTATCAA TGATGCATCT GCGCCAGTTA ATTTGGTTTA TATTGATGAT GTTTGTGCTA12180AAGCGATAGA GCTTCTCTCG GGGGCAACTG AAAGCGGATA TAAAGCTGTT GCACCAATTT12240ATTCAACTAC TGTTGGTGAA GTTGCAGAAT TAATTTATAG ATTCAAGAAT AGCCGTTCCA12300CCCTGATCAC AGAGGCTGTC GGGACGGGAT TTACCCGTGC ATTGTATTCT ACATGGCTGA12360CTTATTTACC AGCAGAGAAG TTTGCGTACA AGGTACCTTT TTATGGGGAT GCCCGCGGAG12420TCTTTTGTGA GATGTTGAAA ACGCCTTCAG CGGGGCAGTT TTCATTTTTT ACTGCTCACC12480CTGGTATTAC GCGTGGCGGA CATTACCATC ACAGTAAAAA TGAGAAGTTT TTGGTCATTC12540GAGGTCAGGC ATGCTTTAAA TTTGAACATG TGATTACCGG TGAGCGATAT GAACTGAATG12600TTTCATCGGA TGAGTTCAAG ATTGTTGAAA CAGTTCCTGG TTGGACACAT GACATTACAA12660ATATTGGAAC TGAGGAATTA ATAGTCATGC TCTGGGCAAA TGAAATTTTC AACCGTGATG12720Orf12的終止orf13的起始AGCCCGATAC TATTGCGAGA CCTCTATAAT GAAAAAATTA AAAGTTATGT CTGTTGTTGG 12780AACCCGTCCT GAGATTATCC GTTTGTCGAG GGTTCTTGCT AAGTTTGATG AATACTGCGA12840GCATATTATT GTCCATACTG GTCAAAATTA TGATTACGAA TTAAATGAAG TATTCTTCAA12900TGACTTGGGT GTTCGAAAAC CTGATTATTT TTTAAATGCA GCGGGAAAAA ATGCGGCGGA12960AACCATTGGC CAAGTTATTA TTAAGGTAGA TGAAGTATTA GAAATCGAAA AACCTGAAGC13020AATACTGGTA TTGGGCGATA CGAATTCATG TATTTCTGCC ATTCCGGCCA AACGCCATAA13080AGTTCCTATA TTTCATATGG AAGCAGGTAA CCGTTGTTTC GATCAACGCG TGCCTGAAGA13140AACCAACAGA CGTATTGTTG ACCATACGGC TGATATCAAT ATGACCTACA GTGATATTGC13200TCGTGAATAT CTCTTGGCTG AAGGTATCCC AGCTGATCGG ATCATAAAAA CTGGTAGCCC13260TATGTTTGAG GTTCTTTCAT ATTATATGCC CCAAATTGAT GGTTCAGATG TGCTATCGCG13320TTTGAATCTA CAGTCTGGTG AGTTTTTTGT AGTAAGTGCG CATCGTGAAG AGAATGTTGA13380TTCTCCAAAA CAGCTCGTAA AGCTTGCGAA CATTCTAAAT ACTGTTGCTG AAAAATATAA13440TCTTCCAGTT ATTGTCTCCA CACACCCAAG GACACGTAAC CGAATCCGTG AGCAAGGAAT13500TGAATTTCAT TCAAATATAA ATCTACTGAA ACCATTGGGT TTCCATGATT ATAACCACTT13560GCAGAAGAAC TCACGAGCTG TGCTTTCAGA TAGCGGTACT ATCACTGAAG AGTCATCCAT13620CATGAATTTC CCAGCGGTAA ACATCCGGGA AGCGCATGAG CGTCCGGAAG GCTTTGAGGA13680AGCATCCGTC ATGATGGTGG GGTTAGAGTG TGAACGCGTA TTACAAGCGC TGGATATTCT13740GGCAACACAA CCGCGAGGTG AAGTCCGTCT TTTACGTCAG GTTAGTGATT ACAGCATGCC13800AAATGTGTCG GATAAAGTTG TCAGAATTGT TCACTCTTAC ACAGATTATG TTAAGAGAGT13860Orf13的終止orf14的起始TGTCTGGAAA GAATATTGAT GAAACTTGCT TTAATCATAG ATGATTACCT GCCCAACAGT 13920ACTCGTGTTG GTGCAAAAAT GTTTCATGAA CTTGCTCAAG AATTTATCCA GCGTGGGCAC13980GATGTTACGG TAATTACTCC TGGTACGGGC ATGCAAGAAG AGATTTCTTT TGATACCTTT14040CAGGGGGTAA AAACATGGCG TTTTAAAAGC GGGCCGCTCA AGGATGTAAG TAAAATTCAG14100CGAGTGGTCA ATGAAACGCT TTTGTCCTAT CGGGCGTGGA AAGCCATCAA AAAATGGGTA14160AAAAAAGAGA CCTTTGAGGG TGTGATTTAT TATTCACCTT CCATATTCTG GGGGTATTTA14220GTTAAAAAAA TTAAAGCTCG TTGCCAATGT CCTGCTTATC TTATTTTAAG AGATATGTTT14280CCACAATGGG TAATTGATGC AGGAATCCTT AATGCTGGTT CCCCAATAGA ACGCTACTTT14340CGTCTTTTTG AAAAAATATC TTGTCGTCAG GCAAATCGTA TTGGACTTAT GTCTGATAAG14400AATCTTGATG TTTTTCGGAA AGATAATAAA GGCTATCCGT GCGAAGTTTT GCGTAATTGG14460GCATCCCTAA CACCAACGAT CATACCCAAG GATTACATAC CACTACGTAA GCGACTTGGC14520
CTAGAGGATA AAACCATTTT CTTCTATGGT GGAAACATAG GTCATGCACA GGACATGACA14580AACTTGATGC GACTTGTGAG AAACATGGCA GCATATCCTC AAGCTCATTT CCTATTTATT14640GGCCAGGGTG ATGAAGTTGA ATTAATTAAT TCATTAGCCT CTGAGTGGGC ATTGACGAAT14700TTCACCTATT TGCCCTCGGT TAATCAGGAT GAATTTAAGT TCATTTTGTC GGAAATGGAT14760ATCGGCTTGT TTTCTCTTTC CGCTAGACAC TCTTCCCATA ATTTTCCTGG TAAGTTATTA14820GGCTATATGG TTCAGTCGCT ACCTATTTTA GGTAGCGTAA ATGCCGGAAA TGATTTGCTC14880GACATTGTCA ATCAAAATAA TGCCGGATTA ATCCATGTCA ATGGTGAGGA CGATAAATTA14940TGTCAATCTG CGCTATTAAT GTTGCATGAT ATTGATGTGC GCCGGCAACT TGGTTCGGGG15000GCGAATATAT TGTTGAAAGA ACAATTCTCC GTTGAGTCTG CGGCACAGAC GATAGAAATG15060Orf15的起始 Orf14的終止AGGTTGGAGG CATGCAATGC GATTAATTGATAATGACCAA CTCGACAAAT TATATGATCA15120AGCCGAGCAA TCGGAACGTT TACGTTCCCA CCTTATTATG CACGGCTCGC ATCAAGAAAA15180GGTACAGCGT TTACTTATTG CATTAGTAAA GGGCAGCTAT GTTGAACCGC ATTATCACAA15240ACTTCCTCAT CAGTGGGAAA TGTTCATTGT TATGGAGGGG CAACTTCAGG TTTGTTTGTA15300TGGTAGAAAT GGTGAGGTTA TAAAGCAATT TATAGCAGGA GATAATATTG GAATAAGCAT15360TGTGGAGTTT TCTCCGGGCG ATATACACAG TGTCGAATGC CTATCTCCGC GTGCTCTTAT15420Orf15的終止GGTGGAAGTT AAAGAGGGGC CATTTGACCC TTCTTTTGCA AAATCGTTCG TGTGATGCTT 15480GTCTAAAGTA CATCTTCTGC TATCTACTCA AGCTAAACCT GAGTTAACAT CCATACCATA15540TTTCAAGCTG CGCATATCTT GCGCGGTGAC CACCCCCTGA CAGGAGTATG TAATGTCCAA15600GCAACAGATT GGCGTAGTCG GTATGGCAGT GATGGGGCGC AATCTTGCGC TTAACATCGA15660AAGCCGTGGT TATACCGTCT CTATTTTCAA CCGTTCCCGT GAAAAGACGG AAGAAGTGAT15720TGCCGAAAAT CCAGGCAAAA AACTGGTTCC TTACTATACG GTGAAAGAGT TCGTTGAATC15780TCTGGAAACG CCTCGTCGCA TCCTGTTAAT GGTTAAAGCA GGTGCAGGCA CGGATGCTGC15840TATTGATTCC CTCAAGCCAT ACCTCGATAA AGGTGACATC ATTATTGACG GTGGTAATAC15900CTTCTTCCAG GACACTATTC GTCGTAATCG TGAGCTTTCT GCAGAAGGCT TTAATTTCAT15960TGGTACCGGT GTTTCCGGTG GGGAAGAAGG TGCACTGAAA GGACCTTCCA TTATGCCTGG16020TGGCCAGAAA GAAGCCTATG AACTGGTTGC ACCGATCCTG ACCAAAATCG CCGCAGTGGC16080TGAAGACGGT GAGCCATGCG TTACCTATAT TGGTGCCGAT GGCGCGGGTC ACTATGTGAA16140GATGGTTCAC AACGGTATTG AATACGGTGA TATGCAGCTG ATTGCTGAAG CTTATTCTCT16200GCTTAAAGGT GGCCTGAACC TCACCAACGA AGAACTGGCA CAGACCTTTA CCGAGTGGAA16260TAACGGTGAA CTGAGCAGCT ACCTGATCGA CATCACCAAA GATATCTTCA CTAAAAAAGA16320TGAAGACGGT AACTACCTGG TTGATGTGAT TCTGGATGAA GCGGCTAACA AAGGTACCGG16380TAAATGGACC AGCCAGAGCG CGCTGGATCT CGGCGAACCG CTGTCGCTGA TTACCGAGTC16440TGTGTTTGCA CGTTATATCT CTTCTCTGAA AGATCAGCGT GTTGCCGCGT CTAAAGTTCT16500CTCTGGCCCG CAAGCGCAGC CAGCTGGCTA CAAAGCTGAG TTCATTGAAA AAGTTCGTCG16560TGCGCTGTAT CTGGGCAAAA TCGTTTCTTA CGCTCAGGGC TTCTCTCAGC TGCGTGCTGC16620GTCTGAAGAA TACAACTGGG ATCTGAACTA CGGCGAAATC GCGAAGATTT TCCGTGCTGG16680CTGCATCATC CGTGCGCAGT TCCTGCAGAA AATCACCGAT GCCTATGCCG AAAATCCGCA16740GATCGCTAAC CTGCTGCTGG CTCCGTACTT CAAGCAAATT GCCGATGACT ATCAGCAGGC16800GCTGCGCGAT GTCGTTGCTT ATGCAGTACA GAACGGTATC CCGGTTCCGA CCTTCGCCGC16860TGCGGTTGCC TATTATGACA GCTACCGTTC CGCTGTTCTG CCTGCGAACC TAATCCAGGC16920GCAGCGCGAC TA16932以上所述,僅是本發(fā)明的較佳實(shí)施例而已,并非對(duì)本發(fā)明作任何形式上的限制,凡是依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡(jiǎn)單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
1.一種對(duì)大腸桿菌O145型的O-抗原特異的核苷酸,其特征在于其是如SEQ ID NO1所示的分離的核苷酸,全長(zhǎng)16932個(gè)堿基;或者所述具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ IDNO1的核苷酸。
2.按照權(quán)利要求1所述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸,其特征在于其包括命名為orf1、nnaB、nnaC、nnaA、wzx、wzy、orf7、orf8、orf9、orf10、fnl1、fnl2、fnl3、orf14、orf15的15個(gè)基因組成,都位于JUMPStart序列和gnd基因之間。
3.按照權(quán)利要求2所述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸,其特征在于,所述基因中具有高度特異性的基因是轉(zhuǎn)運(yùn)酶基因,其包括wzx基因;聚合酶基因,其包括wzy基因;糖基轉(zhuǎn)移酶基因,其包括orf7、orf14基因;其中所述的基因wzx是SEQ ID NO1中的4369至5607堿基的核苷酸;wzy是SEQ ID NO1中的5615至6802堿基的核苷酸;orf7是SEQ ID NO1中的6805至8061堿基的核苷酸;orf14是SEQ ID NO1中的13879至15090堿基的核苷酸。
4.按照權(quán)利要求1或2所述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸,其特征在于其還包括源于所述的wzx基因、wzy基因或糖基轉(zhuǎn)移酶基因orf7、orf14基因以及它們的混合或它們的重組。
5.按照權(quán)利要求4所述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸,其特征在于,其中源于wzx基因的寡核苷酸對(duì)是SEQ ID NO1中的4468至4488堿基的核苷酸和5059至5077堿基的核苷酸;SEQ ID NO1中的5054至5074堿基的核苷酸和5532至5552堿基的核苷酸;源于wzy基因的寡核苷酸對(duì)是SEQ ID NO1中的6061至6078堿基的核苷酸和6687至6706堿基的核苷酸;SEQ ID NO1中的5849至5866堿基的核苷酸和6280至6297堿基的核苷酸。
6.權(quán)利要求1所述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸在檢測(cè)表達(dá)O-抗原的細(xì)菌、鑒定細(xì)菌的O-抗原和細(xì)菌的其它多糖抗原中的應(yīng)用。
7.權(quán)利要求1所述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸的重組分子,在通過(guò)插入表達(dá)而提供表達(dá)大腸桿菌O145型的O-抗原,以及制備細(xì)菌疫苗中的應(yīng)用。
8.按照權(quán)利要求1所述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸的應(yīng)用,其特征在于,它作為引物用于PCR、作為探針用于雜交反應(yīng)與熒光檢測(cè)、或者用于制造基因芯片或微陣列,供檢測(cè)細(xì)菌。
9.權(quán)利要求1所述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在培養(yǎng)基中培養(yǎng)大腸桿菌O145型,離心收集細(xì)胞;得到的基因組DNA通過(guò)瓊脂糖凝膠電泳檢測(cè);(2)通過(guò)PCR擴(kuò)增大腸桿菌O145型中的O-抗原基因簇以大腸桿菌O145型的基因組為模板通過(guò)Long PCR擴(kuò)增其O-抗原基因簇,將得到的PCR產(chǎn)物,用瓊脂糖凝膠電泳檢測(cè)PCR產(chǎn)物的大小及其特異性,合并該long PCR產(chǎn)物,并用DNA純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫(kù)將Long PCR純化產(chǎn)物應(yīng)用鳥槍法構(gòu)建O-抗原基因簇文庫(kù);(4)對(duì)文庫(kù)中的克隆測(cè)序從文庫(kù)中挑選插入片段在1kb以上的克隆用實(shí)驗(yàn)室常用的DNA自動(dòng)測(cè)序儀對(duì)克隆中的插入片段進(jìn)行測(cè)序,序列達(dá)到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析應(yīng)用生物信息學(xué)軟件拼接和編輯所有的序列,從而得到大腸桿菌O145型的O-抗原基因簇的核苷酸全長(zhǎng)序列;(6)特異基因的篩選針對(duì)大腸桿菌O145型的O-抗原基因簇中的wzx、wzy基因設(shè)計(jì)引物;在每個(gè)基因內(nèi)各設(shè)計(jì)了兩對(duì)引物,每對(duì)引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進(jìn)行PCR,確定wzx、wzy基因?qū)Υ竽c桿菌O145型的O-抗原的高度特異性;(7)引物靈敏度的檢測(cè)培養(yǎng)大腸桿菌O145,細(xì)菌計(jì)數(shù)后分別將5×103,5×102,5×101,5個(gè)和0個(gè)活菌加入到一定量的某種待檢測(cè)物中,混入細(xì)菌的待檢測(cè)物作為檢測(cè)用樣品,將樣品加入LB培養(yǎng)基,取一些與樣品混合過(guò)的LB培養(yǎng)基過(guò)濾,將過(guò)濾液進(jìn)行培養(yǎng),從培養(yǎng)好的菌液中取數(shù)毫升處理后作為PCR模板用寡核苷酸進(jìn)行PCR反應(yīng),檢測(cè)其對(duì)大腸桿菌O145的靈敏度。
10.根據(jù)權(quán)利要求9所述的對(duì)大腸桿菌O145型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在5mL的LB培養(yǎng)基中37℃過(guò)夜培養(yǎng)大腸桿菌O145型,離心收集細(xì)胞;用pH值為8.0的500ul 50mM Tris-HCl和10ul 0.4M EDTA重懸細(xì)胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘;之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時(shí),再加入3ul 10mg/ml的RNase,65℃溫育30分鐘,加等體積酚抽提混合物,取上清再用等體積的酚∶氯仿∶異戊醇混合溶液抽提兩次,取上清再用等體積的乙醚抽提以除去殘余的酚,酚∶氯仿∶異戊醇的混合體積比例為25∶24∶1;上清用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,將DNA重懸于30ul TE中;基因組DNA通過(guò)0.4%的瓊脂糖凝膠電泳檢測(cè);(2)通過(guò)PCR擴(kuò)增大腸桿菌O145型中的O-抗原基因簇以大腸桿菌O145型的基因組為模板通過(guò)Long PCR擴(kuò)增其O-抗原基因簇,首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇上游的JUMPStart序列設(shè)計(jì)上游引物為wl-1098(5-ATT GGTAGC TGT AAG CCA AGG GCG GTA GCG T-3’),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計(jì)下游引物為wl-913(5’-TAG TCG CGT GNG CCT GGA TTAAGT TCG C-3’);用Boehringer Mannheim公司的Expand Long Template PCR方法擴(kuò)增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘;然后94℃變性10秒,60℃退火15秒,68℃延伸15分鐘,這樣進(jìn)行30個(gè)循環(huán),最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測(cè)PCR產(chǎn)物的大小及其特異性,合并5管long PCR產(chǎn)物,并用Promega公司的WizardPCR Preps純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫(kù)用被修改的Novagen DNaseI鳥槍法構(gòu)建O-抗原基因簇文庫(kù),反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進(jìn)行,酶切10分鐘使DNA片段大小集中在1.5kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng);合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇的混合溶液抽提一次,酚∶氯仿∶異戊醇的混合體積比例為25∶24∶1再用等體積的乙醚抽提一次后,用2.5倍體積的無(wú)水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中,隨后在此混合物中加入2.5uldNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃30分鐘,將酶切產(chǎn)物補(bǔ)成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴(kuò)大為80ul,70℃反應(yīng)20分鐘,使DNA的3′端加dA尾;此混合物經(jīng)等體積氯仿∶異戊醇的混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接10小時(shí),總體積為90ul,氯仿∶異戊醇的混合體積比例為24∶1;其中有9ul的10×buffer和25單位的T4DNA連接酶,最后用1/10體積的pH值為5.2的3M NaAc和2倍體積的無(wú)水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物;用Bi0-Rad公司的電轉(zhuǎn)化感受態(tài)細(xì)胞的制備方法制備感受態(tài)大腸桿菌DH5α細(xì)胞,取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到Bi0-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時(shí)間為5.0毫秒至6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上,在37℃過(guò)夜培養(yǎng),次日得到藍(lán)白菌落,將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時(shí)從每個(gè)克隆中提取質(zhì)粒,并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構(gòu)成了大腸桿菌O145型的O-抗原基因簇文庫(kù);(4)對(duì)文庫(kù)中的克隆測(cè)序從文庫(kù)中挑選插入片段在1kb以上的96個(gè)克隆用本實(shí)驗(yàn)室ABI3730型DNA自動(dòng)測(cè)序儀對(duì)克隆中的插入片段進(jìn)行測(cè)序,序列達(dá)到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國(guó)劍橋MRC分子生物學(xué)實(shí)驗(yàn)室出版的生物信息學(xué)軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O145型的O-抗原基因簇的核苷酸全長(zhǎng)序列;序列的質(zhì)量主要由兩個(gè)方面來(lái)保證1)對(duì)大腸桿菌O145型的基因組作5個(gè)Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫(kù),2)對(duì)每個(gè)堿基,保證3個(gè)以上高質(zhì)量的覆蓋率,在得到大腸桿菌O145型O-抗原基因簇的核苷酸序列后,用美國(guó)國(guó)家生物技術(shù)信息學(xué)中心的orffinder發(fā)現(xiàn)基因,找到15個(gè)開(kāi)放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開(kāi)放的閱讀框的功能并確定它們是什么基因,再用實(shí)驗(yàn)室常用的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對(duì),最后得到大腸桿菌O145型的O-抗原基因簇的結(jié)構(gòu);(6)特異基因篩選針對(duì)痢大腸桿菌O145型的O-抗原基因簇中的wzx、wzy基因基因設(shè)計(jì)引物;在每個(gè)基因內(nèi)各設(shè)計(jì)了兩對(duì)引物,每對(duì)引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進(jìn)行PCR,除在含大腸桿菌O145組中得到了預(yù)期大小的一條帶外,在其他組中都沒(méi)有擴(kuò)增到預(yù)期片段大小的正確產(chǎn)物,所以wzx、wzy基因?qū)Υ竽c桿菌O145型的O-抗原都是高度特異的;(7)引物靈敏度的檢測(cè)購(gòu)買市場(chǎng)上的生豬肉餡,攪拌均勻,分成20g一份,存在-40℃冰箱中備用;將10μl大腸桿菌O145的凍存菌液接種到有20ml LB培養(yǎng)基的三角瓶中,于37℃,200轉(zhuǎn)/分,培養(yǎng)12小時(shí)至飽和,取少量培養(yǎng)好的菌液作106和107倍的稀釋,其余的菌液放于4℃的冰箱中備用,取50μl稀釋菌液涂布LB瓊脂平板,37度,培養(yǎng)12h,對(duì)所涂平板計(jì)數(shù),計(jì)算原液中活菌濃度。在5份生豬肉餡中分別摻入5×103,5×102,5×101,5個(gè)和0個(gè)活菌,攪拌均勻,加入200ml LB培養(yǎng)基,經(jīng)6層紗布過(guò)濾,過(guò)濾液于37℃,200轉(zhuǎn)/分,培養(yǎng)12h。從培養(yǎng)好的菌液中取3ml菌液于6,000g離心5分鐘,去上清,加100μl MQ超純水吹開(kāi)沉淀并混勻,放入100度沸水中煮15分鐘,裂解液于12,000g離心8分鐘,取1μ上清做為PCR模板;用寡核苷酸對(duì)進(jìn)行PCR反應(yīng),PCR反應(yīng)體系如下MQ15.7μl,Mg2+2.5μl,Buffer2.5μl,dNTP1μl,Taq酶0.3μl,P11μl,P21μl,模板DNA1μl;PCR反應(yīng)條件為95℃5′,95℃30″,56℃45″,72℃1′,72℃5′,共30個(gè)循環(huán);反應(yīng)結(jié)束后,取10μl反應(yīng)產(chǎn)物電泳,若有與預(yù)期大小相符的擴(kuò)增帶,則結(jié)果為陽(yáng)性,若沒(méi)有,則結(jié)果為陰性;參入了5×103,5×102,5×101,和5個(gè)活菌的每份豬肉餡均在引物的PCR反應(yīng)中得到陽(yáng)性結(jié)果;參入0個(gè)活菌的豬肉餡在引物的PCR反應(yīng)中得到陰性結(jié)果;說(shuō)明使用上述方法時(shí),引物對(duì)豬肉餡中的大腸桿菌O145的檢測(cè)靈敏度均為0.25個(gè)菌/g。
全文摘要
本發(fā)明提供一種對(duì)大腸桿菌O145型(Escherichiacoli O145)的O-抗原特異的核苷酸,它是大腸桿菌型中控制O-抗原合成的基因簇的核苷酸全序列,如SEQ ID NO1所示的分離的核苷酸,全長(zhǎng)16932個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸;還包括源于大腸桿菌O145型的O-抗原基因簇中的糖基轉(zhuǎn)移酶基因和寡糖單位處理基因的寡核苷酸;本發(fā)明通過(guò)PCR證實(shí)寡核苷酸對(duì)大腸桿菌O145型的O-抗原都有高度的特異性;本發(fā)明還公開(kāi)了用本發(fā)明的寡核苷酸檢測(cè)和鑒定大腸桿菌O145型的方法。
文檔編號(hào)C12Q1/68GK1569875SQ20041001918
公開(kāi)日2005年1月26日 申請(qǐng)日期2004年5月9日 優(yōu)先權(quán)日2004年5月9日
發(fā)明者王磊, 馮露 申請(qǐng)人:天津生物芯片技術(shù)有限責(zé)任公司