欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

對大腸桿菌o41的o-抗原特異的核苷酸的制作方法

文檔序號:561991閱讀:299來源:國知局
專利名稱:對大腸桿菌o41的o-抗原特異的核苷酸的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及大腸桿菌O41(Escherichia coli O41)中控制O-抗原合成的基因簇的核苷酸全序列,特別是涉及大腸桿菌O41中控制O-抗原合成的基因簇中的寡核苷酸,可利用這些對O-抗原特異的寡核苷酸快速、準(zhǔn)確地檢測人體及環(huán)境中的大腸桿菌O41并鑒定這些致病菌中的O-抗原。
背景技術(shù)
位于大腸桿菌表面的脂多糖是大腸桿菌致病的誘因,而O-抗原是脂多糖最外層結(jié)構(gòu),是免疫系統(tǒng)識(shí)別的目標(biāo)和噬菌體吸附的位點(diǎn)。O-抗原的缺失會(huì)造成許多病原體的血清敏感,或者嚴(yán)重削弱病原體的毒力[Frank etal(1987)“The function of antibody and complement in the lysis ofbacteria”.Rev Infect Dis 1771750-1753.Pluschke G et al“Role of thecapsule and the O-antigen in resistance of O18K1Escherichia coli tocomplement-mediated king”.J Bacteriol 42907-913]。大腸桿菌是一個(gè)種,種內(nèi)的菌株一般通過O-抗原和H-抗原(有時(shí)通過K-抗原)來鑒定。其中O-抗原具有高度多樣性,大腸桿菌有166種不同的O-抗原,O-抗原的變化可能是大腸桿菌的起源和維持其多樣性的主要原因[Reeves,P.R(1992)“Variation in antigens,niche specific selection and bacterialpopulations”.FEMS Microbiol.Lett,100509-516]。
O-抗原是革蘭氏陰性細(xì)菌脂多糖中的O特異性多糖成分,它由許多重復(fù)的寡糖單位組成。O-抗原的合成過程研究得較清楚先由糖基轉(zhuǎn)移酶將核苷二磷酸單糖轉(zhuǎn)移到一個(gè)固定在細(xì)胞內(nèi)膜的脂分子上,然后在內(nèi)膜的內(nèi)側(cè)合成寡糖單位,O-抗原的寡糖單位再通過o-抗原轉(zhuǎn)運(yùn)酶被轉(zhuǎn)移到內(nèi)膜外側(cè),而后通過聚合酶聚合成多糖,再被連接到一個(gè)糖脂分子上形成脂多糖分子[Whitfield,C.(1995)“Biosynthesis of lipopolysaccharide Oantigens”.Trends in Microbiology.3178-185;Schnaitman,C.A.andJ.D.Klena.(1993)“Genetics of lipopolysaccharide biosynthesis inentericbacteria”.Microbiological Reviews,57(3)655-682]。編碼負(fù)責(zé)O-抗原合成的所有酶分子的基因一般在染色體上相鄰排列,形成一個(gè)基因簇[Reeves,P.R.,et al.(1996)“Bacterial polysaccharide synthesis and genenomenclature”Trends in Microbiology,4495-503]。在大腸桿菌、志賀氏菌和沙門氏菌中,O-抗原基因簇位于galF和gnd基因之間[Lei Wang.et al(2001)“Sequence analysis of four Shigella boydii O-antigen lociimplicationfor Escherichia coli and Shigella relationships”.Infection andImmunity,116923-6930;Lei Wang and Peter Reeves(2000)“The Escherichiacoli O111 and Salmonella enterica O35 gene clustersgene clusters encodingthe same colitose-containing O antigen are highly conserved”.Journal ofBacteriology.1825256-5261]。O-抗原基因簇含有三類基因糖合成路徑基因,糖基轉(zhuǎn)移酶基因,寡糖單位處理基因,其中糖合成路徑基因編碼的酶合成O-抗原所需的核苷二磷酸單糖;糖基轉(zhuǎn)移酶基因編碼的酶將核苷二磷酸單糖及其它分子轉(zhuǎn)到單糖上從而使單糖聚合成寡糖單位;寡糖單位處理基因包括o-抗原轉(zhuǎn)運(yùn)酶基因和聚合酶基因,它們將寡糖單位轉(zhuǎn)移到細(xì)菌內(nèi)膜外側(cè),再聚合成多糖。糖基轉(zhuǎn)移酶基因和寡糖單位處理基因只存在于攜帶這些基因的基因簇里。O-抗原中單糖的不同,單糖間聯(lián)結(jié)鍵的不同和寡糖單位之間聯(lián)結(jié)鍵的不同構(gòu)成了O-抗原的多樣性,而單糖的組成、單糖間的聯(lián)結(jié)鍵及寡糖單位之間的聯(lián)結(jié)鍵是由O-抗原基因簇中的基因控制著,所以O(shè)-抗原基因簇決定了O-抗原的合成,也決定了O-抗原的多樣性。
因?yàn)镺-抗原是極強(qiáng)的抗原,是大腸桿菌重要的致病因素之一,同時(shí)它又具有極強(qiáng)的多樣性,這啟示我們能研究一種快速、準(zhǔn)確地檢測大腸桿菌及其O-抗原的特異性好、靈敏度高的方法。以表面多糖為目標(biāo)的血清學(xué)免疫反應(yīng)自上世紀(jì)30年代以來一直被用于對細(xì)菌的分型和鑒定,是鑒定致病菌的唯一的手段。這種診斷方法需要大量的抗血清,而抗血清一般種類不全,數(shù)量不足,大量的抗血清在制備和儲(chǔ)存中也存在一些困難。另一方面此法耗時(shí)長、靈敏度低、漏檢率高、準(zhǔn)確性差,所以,現(xiàn)在普遍認(rèn)為這種傳統(tǒng)的血清學(xué)檢測方法將為現(xiàn)代分子生物學(xué)方法取代。1993年,Luk,J.M.C et.al用沙門氏菌(S.enterica)O-抗原基因簇的特異核苷酸序列通過PCR方法鑒定了沙門氏菌的O-抗原[Luk,J.M.C.et.al.(1993)“Selective amplification ofabequose and paratose synthase genes(rfb)by polymerase chain reactionfor identification of S.enterica major serogroups(A,B,C2,andD)”,J.Clin.Microbiol.312118-2123]。Luk,et.al的方法是將相應(yīng)于沙門氏菌血清型E1,D1,A,B和C2的O-抗原內(nèi)的CDP-阿比可糖和CDP-泰威糖的合成基因的核苷酸序列排列后得到對不同血清型的沙門氏菌特異的寡核苷酸。1996年,Paton,A.W et.al用對E.coli O111的O-抗原特異的源于wbdI基因的寡核苷酸鑒定了一株產(chǎn)毒素的E.coli O111的血清型[“Molecularmicrobiological investigation of an outbreak of Hemolytic-UremicSyndrome caused by dry fermented sausage contaminated with Shiga-liketoxin producing Escherichia coli”.J.Clin.Microbiol.341622-1627],但是后來的研究表明Paton,A.W et.al的用源于wbdI基因的寡核苷酸鑒定E.coli O111的血清型的方法有假陽性結(jié)果出現(xiàn)。Bastin D.A.and Reeves,P.R.認(rèn)為,這是由于wbdI基因是一個(gè)推測的糖合成路徑基因[Bastin D.A.andReeves,P.R.(1995)“Sequence and analysis of the O antigen gene(rfb)cluster of Escherichia coli O111”.Gene 16417-23],而在其它細(xì)菌的O-抗原的結(jié)構(gòu)中也可能有這個(gè)糖,所以糖合成路徑基因?qū)τ贠-抗原并不是高度特異的。

發(fā)明內(nèi)容
本發(fā)明的目的是提供了一種對大腸桿菌O41的O-抗原特異的核苷酸。它是大腸桿菌O41的O-抗原基因簇中的核苷酸,是源于o-抗原轉(zhuǎn)運(yùn)酶基因、聚合酶基因及糖基轉(zhuǎn)移酶基因的特異的核苷酸。
本發(fā)明的另一個(gè)目的是提供了大腸桿菌O41的O-抗原基因簇的全長核苷酸序列。
本發(fā)明的次一目的是提供了構(gòu)成大腸桿菌O41的O-抗原基因簇的基因轉(zhuǎn)運(yùn)酶基因即wzx基因或與wzx有相似功能的基因;聚合酶基因即wzy基因或與wzy有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf2、orf3、orf5、orf6基因;糖合成路徑基因,包括gmd,fcl,gmm,manC,manB。它們在O-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在表4中。
本發(fā)明的又一目的是提供了寡核苷酸,它們分別源于大腸桿菌O41的O-抗原基因簇中編碼轉(zhuǎn)運(yùn)酶的基因,包括wzx基因或與wzx有相似功能的基因;源于編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因;源于編碼糖基轉(zhuǎn)移酶的基因,包括orf2、orf3、orf5、orf6基因。它們是上述基因內(nèi)的寡核苷酸,長度在10-20nt;它們對大腸桿菌O41的O-抗原是特異的;尤其是表1中列出的源于編碼轉(zhuǎn)運(yùn)酶的基因和聚合酶的基因的寡核苷酸,它們對大腸桿菌O41的O-抗原是高度特異的,而且這些寡核苷酸還可重新組合,組合后的寡核苷酸對大腸桿菌O41的O-抗原也是高度特異的。
本發(fā)明的還一目的是提供的上述寡核苷酸可作為引物用于核酸擴(kuò)增反應(yīng),或者作為探針用于雜交反應(yīng),或者用于制造基因芯片或微陣列,從而通過這些方法來檢測和鑒定大腸桿菌O41的O-抗原及檢測和鑒定大腸桿菌O41。
本發(fā)明的再一目的是提供了分離大腸桿菌O41的O-抗原基因簇的全序列的方法。按照本方法操作可以獲得其他細(xì)菌的O-抗原基因簇的全序列,也可以獲得編碼其他多糖抗原的細(xì)菌的基因簇的全序列。
本發(fā)明的目的是由以下技術(shù)方案實(shí)現(xiàn)的。
本發(fā)明對大腸桿菌O41的O-抗原特異的核苷酸,其特征在于,其是如SEQID NO1所示的分離的核苷酸,全長15377個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。
前述的對大腸桿菌O41型的O-抗原特異的核苷酸,其中包括命名為wzx,orf2,orf3,wzy,orf5,orf6,gmd,fcl,gmm,manC,orf11,manB的12個(gè)基因組成,都位于galF基因和gnd基因之間。
前述的對大腸桿菌O41的O-抗原特異的核苷酸,其特征在于,所述基因中具有高度特異性的基因包括轉(zhuǎn)運(yùn)酶基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因,包括wzy基因或與wzy有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf2、orf3、orf5、orf6基因。其中所述的轉(zhuǎn)運(yùn)酶基因是SEQ ID NO1中的1114至2433堿基的核苷酸;所述的聚合酶基因是SEQ IDNO1中的4649至5845堿基的核苷酸;所述的orf2基因是SEQ ID NO1中的2433至3362堿基的核苷酸;orf3基因是SEQ ID NO1中的3374至4630堿基的核苷酸;orf5基因是SEQ ID NO1中的5842至6591堿基的核苷酸;orf6基因是SEQ ID NO1中的6588至7445堿基的核苷酸。
前述的對大腸桿菌O41的O-抗原特異的核苷酸,其特征在于,其還包括源于所述的wzx基因或wzy基因或糖基轉(zhuǎn)移酶基因的寡核苷酸;以及它們的混合或它們的重組。
前述的對大腸桿菌O41的O-抗原高度特異的核苷酸,其特征在于,所述的源于wzx基因的寡核苷酸對是SEQ ID NO1中的1805至1822堿基的核苷酸和2393至2410堿基的核苷酸,SEQ ID NO1中的1510至1527堿基的核苷酸和2106至2123堿基的核苷酸;所述的源于wzy基因的寡核苷酸對是SEQ ID NO1中的5012至5029堿基的核苷酸和5406至5389堿基的核苷酸,SEQ ID NO1中的5272至5289堿基的核苷酸和5645至5662堿基的核苷酸。
前述的對大腸桿菌O41型的O-抗原特異的核苷酸在檢測表達(dá)O-抗原的細(xì)菌、鑒定細(xì)菌的O-抗原和細(xì)菌的其它多糖抗原中的應(yīng)用。
前述的對大腸桿菌O41型的O-抗原特異的核苷酸的重組分子,在通過插入表達(dá)而提供表達(dá)大腸桿菌O41型的O-抗原,以及制備細(xì)菌疫苗中的應(yīng)用。
前述的對大腸桿菌O41型的O-抗原特異的核苷酸的應(yīng)用,其特征在于,它作為引物用于PCR、作為探針用于雜交反應(yīng)與熒光檢測、或者用于制造基因芯片或微陣列,供檢測細(xì)菌的應(yīng)用。
前述的對大腸桿菌O41的O-抗原特異的核苷酸的分離方法,其特征在于,包括下述步驟(1)基因組的提取在培養(yǎng)基中培養(yǎng)大腸桿菌O41型,離心收集細(xì)胞;得到的基因組DNA通過瓊脂糖凝膠電泳檢測;(2)通過PCR擴(kuò)增大腸桿菌O41型中的O-抗原基因簇以大腸桿菌O41型的基因組為模板通過Long PCR擴(kuò)增其O-抗原基因簇,將得到的PCR產(chǎn)物,用瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性,合并該long PCR產(chǎn)物,并用DNA純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫將Long PCR純化產(chǎn)物應(yīng)用鳥槍法構(gòu)建O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1kb以上的克隆用實(shí)驗(yàn)室常用的DNA自動(dòng)測序儀對克隆中的插入片段進(jìn)行測序,序列達(dá)到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析應(yīng)用生物信息學(xué)軟件拼接和編輯所有的序列,從而得到大腸桿菌O41型的O-抗原基因簇的核苷酸全長序列;(6)特異基因的篩選針對大腸桿菌O41型的O-抗原基因簇中的wzx、wzy基因設(shè)計(jì)引物;在每個(gè)基因內(nèi)各設(shè)計(jì)了兩對引物,每對引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進(jìn)行PCR,確定wzx、wzy基因?qū)Υ竽c桿菌O41型的O-抗原的高度特異性;(7)引物靈敏度的檢測培養(yǎng)大腸桿菌O41,細(xì)菌計(jì)數(shù)后分別將5×103,5×102,5×101,5個(gè)和0個(gè)活菌加入到一定量的某種待檢測物中,混入細(xì)菌的待檢測物作為檢測用樣品,將樣品加入LB培養(yǎng)基,取一些與樣品混合過的LB培養(yǎng)基過濾,將過濾液進(jìn)行培養(yǎng),從培養(yǎng)好的菌液中取數(shù)毫升處理后作為PCR模板用寡核苷酸進(jìn)行PCR反應(yīng),檢測其對大腸桿菌O41的靈敏度。
前述的對大腸桿菌O41的O-抗原特異的核苷酸的分離方法,其特征在于,包括下述步驟(1)基因組的提取在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O41,離心收集細(xì)胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細(xì)胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時(shí),再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清液,再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)的溶液抽提兩次,取上清液再用等體積的乙醚抽提以除去殘余的酚,上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中,基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴(kuò)增大腸桿菌O41中的O-抗原基因簇以大腸桿菌O41的基因組為模板通過Long PCR擴(kuò)增其O-抗原基因簇;首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇上游的galF基因設(shè)計(jì)上游引物(5’-ATT GTG GCT GCA GGG ATC AAAGAA ATC-3’),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計(jì)下游引物(5’-TAG TCGCGC TGN GCC TGG ATT AAG TTC GC-3’)。用Boehringer Mannheim公司的ExpandLong Template PCR方法擴(kuò)增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘,然后94℃變性10秒,60℃退火30秒,68℃延伸15分鐘,這樣進(jìn)行30個(gè)循環(huán);最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性;合并6管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫;反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進(jìn)行;酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng);合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中;隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃反應(yīng)30分鐘,將酶切產(chǎn)物補(bǔ)成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴(kuò)大為80ul,70℃反應(yīng)20分鐘,使DNA的3′端加dA尾。此混合物經(jīng)等體積氯仿∶異戊醇(24∶1)溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接24小時(shí),總體積為90ul,其中有9ul的10×buffer和25單位的T4DNA連接酶;最后用1/10體積的3MNaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物;用Bio-Rad公司的電轉(zhuǎn)化感受態(tài)細(xì)胞的制備方法制備感受態(tài)大腸桿菌DH5α細(xì)胞,取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時(shí)間為5.0毫秒-6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上37℃過夜培養(yǎng),次日得到藍(lán)白菌落,將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時(shí)從每個(gè)克隆中提取質(zhì)粒并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構(gòu)成了大腸桿菌O41的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1000bp以上的100個(gè)克隆由上海生物工程有限公司用ABI377型DNA自動(dòng)測序儀對克隆中的插入片段單向進(jìn)行測序,使序列達(dá)到80%的覆蓋率,再通過將相聯(lián)系的序列進(jìn)行反向測序及測通得到剩余20%的序列,從而獲得O-抗原基因簇的所有序列。
(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical ResearchCouncil)分子生物學(xué)實(shí)驗(yàn)室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O41的O-抗原基因簇的核苷酸全長序列,序列的質(zhì)量主要由兩個(gè)方面來保證1)對大腸桿菌O41的基因組作6個(gè)Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫。2)對每個(gè)堿基,保證3個(gè)以上高質(zhì)量的覆蓋率;在得到大腸桿菌O41的O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心(The National Center forBiotechnology Information,NCBI)的orffinder發(fā)現(xiàn)基因,找到12個(gè)開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對,最后得到大腸桿菌O41的O-抗原基因簇的結(jié)構(gòu);
(6)特異基因篩選針對大腸桿菌O41的O-抗原基因簇中wzx和wzy基因設(shè)計(jì)引物;在每個(gè)基因內(nèi)各設(shè)計(jì)兩對引物,每對引物分布在相應(yīng)基因內(nèi)不同地方以確保其特異性;用這些引物以166種血清型的大腸桿菌和43株志賀氏菌基因組為模板進(jìn)行PCR,所有引物在大腸桿菌O41中得到陽性結(jié)果,在其他組中沒有擴(kuò)增到任何大小正確的帶,也就是,在大多數(shù)組中沒有得到任何PCR產(chǎn)物帶,雖在少數(shù)組中得到PCR產(chǎn)物帶,但其大小不符合預(yù)期大小,所以wzx、wzy基因?qū)Υ竽c桿菌O41及其O-抗原都是高度特異的。
(7)引物靈敏度的檢測將大腸桿菌O41的凍存菌液接種到有LB培養(yǎng)基的三角瓶中,30℃-40℃培養(yǎng),180至250轉(zhuǎn)/分,培養(yǎng)數(shù)小時(shí)至飽和,取培養(yǎng)好的菌液稀釋,取稀釋菌液涂布LB瓊脂平板,30℃至40℃,培養(yǎng)數(shù)小時(shí)計(jì)數(shù),計(jì)算原液中活菌濃度;在5份重量均為20g的生豬肉餡中分別摻入5×103,5×102,5×101,5個(gè)和0個(gè)活菌,攪拌均勻,加入LB培養(yǎng)基,過濾,過濾液于30℃-40℃培養(yǎng),180至250轉(zhuǎn)/分,培養(yǎng)數(shù)小時(shí);從培養(yǎng)好的菌液中取數(shù)ml于6,000g離心數(shù)分鐘,去上清,加MQ超純水吹開沉淀并混勻,放入100℃沸水中煮數(shù)分鐘,裂解液于12,000g離心數(shù)分鐘,取上清做為PCR模板;用4對寡核苷酸對,SEQ ID NO1中的1805至1822堿基的核苷酸和2393至2410堿基的核苷酸,SEQ ID NO1中的1510至1527堿基的核苷酸和2106至2123堿基的核苷酸,SEQ ID NO1中的5012至5029堿基的核苷酸和5406至5389堿基的核苷酸,SEQ ID NO1中的5272至5289堿基的核苷酸和5645至5662堿基的核苷酸進(jìn)行PCR反應(yīng),PCR反應(yīng)體系如下MQ15.7μl,Mg2+2.5μl,Buffer2.5μl,dNTP1μl,Taq酶0.3μl,P11μl,P21μl,模板DNA1μl。PCR反應(yīng)條件為95℃5′,95℃30″,56℃45″,72℃1′,72℃5′,共30個(gè)循環(huán);反應(yīng)結(jié)束后,取10μl反應(yīng)產(chǎn)物電泳,若有與預(yù)期大小相符的擴(kuò)增帶,則結(jié)果為陽性,若沒有,則結(jié)果為陰性;參入了5×103,5×102,5×101,和5個(gè)活菌的每份豬肉餡均在4對引物的PCR反應(yīng)中得到陽性結(jié)果;參入0個(gè)活菌的豬肉餡在4對引物的PCR反應(yīng)中得到陰性結(jié)果;說明使用上述方法時(shí),這4對引物對豬肉餡中的大腸桿菌O41的檢測靈敏度均為0.25個(gè)菌/g。
也就是,本發(fā)明的第一個(gè)方面,提供了大腸桿菌O41的O-抗原基因簇的全長核苷酸序列,它的全序列如SEQ ID NO1所示,全長15377個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。通過本發(fā)明的方法得到了大腸桿菌O41的O-抗原基因簇的結(jié)構(gòu),如表3所述,它包括命名為wzx,orf2,orf3,wzy,orf5,orf6,gmd,fcl,gmm,manC,orf11,manB的12個(gè)基因組成,都位于galF基因和gnd基因之間。
本發(fā)明的第二個(gè)方面,提供了大腸桿菌O41的O-抗原基因簇中的基因,即轉(zhuǎn)運(yùn)酶基因(wzx基因或與wzx有相似功能的基因);聚合酶基因(wzy基因或與wzy有相似功能的基因);糖基轉(zhuǎn)移酶基因,包括orf2、orf3、orf5、orf6基因;細(xì)菌多糖抗原中特殊的糖合成路徑基因,包括gmd,fcl,gmm,manC,manB。它們在O-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在表4中。本發(fā)明尤其涉及到o-抗原轉(zhuǎn)運(yùn)酶基因和聚合酶基因,因?yàn)樘呛铣陕窂交蚣春铣珊塑斩姿釂翁堑幕颥F(xiàn)在被預(yù)示對較多胞外多糖是常見的、共同的,對細(xì)菌的O-抗原并不是特異的,而本發(fā)明涉及到的o-抗原轉(zhuǎn)運(yùn)酶基因、聚合酶基因和糖基轉(zhuǎn)移酶基因?qū)Υ竽c桿菌O41的O-抗原是特異的。
本發(fā)明的第三個(gè)方面,提供了源于大腸桿菌O41的O-抗原基因簇中的wzy基因或與wzy有相似功能的基因和wzx基因或與wzx有相似功能的基因的寡核苷酸和糖基轉(zhuǎn)移酶基因包括orf2、orf3、orf5、orf6基因的寡核苷酸,它們是這些基因中的任何一段寡核苷酸。但是,優(yōu)先被用的是列于表1中源于大腸桿菌O41的O-抗原基因簇中的wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的寡核苷酸對。在表1中也列出了這些寡核苷酸對在O-抗原基因簇中的位置及以這些寡核苷酸對為引物所做的PCR反應(yīng)的產(chǎn)物的大小,這些PCR反應(yīng)可用表中的退火溫度進(jìn)行。這些引物只在以大腸桿菌O41為模板進(jìn)行的PCR擴(kuò)增中得到預(yù)期大小的產(chǎn)物,而在以表2所列的其它菌為模板進(jìn)行的PCR擴(kuò)增中都未得到預(yù)期大小的產(chǎn)物。更詳細(xì)地說,以這些寡核苷酸對為引物所做的PCR反應(yīng)在大多數(shù)細(xì)菌中均未得到任何產(chǎn)物,所以,可以確定這些引物即表1所列的寡核苷酸對大腸桿菌O41及它們的O-抗原是高度特異的。
所述的對大腸桿菌O41的O-抗原特異的核苷酸的分離方法包括下述步驟1)基因組的提??;2)PCR擴(kuò)增大腸桿菌O41中的O-抗原基因簇;3)O-抗原基因簇文庫的構(gòu)建;4)對文庫中的克隆測序;5)核苷酸序列的拼接及分析,最終獲得O-抗原基因簇的結(jié)構(gòu);6)特異基因的篩選;7)引物靈敏度的檢測。
本發(fā)明的其他方面由于本文的技術(shù)的公開,對本領(lǐng)域的技術(shù)人員而言是顯而易見的。
如本發(fā)明所述,“寡核苷酸”主要是指來源于O-抗原基因簇中的編碼轉(zhuǎn)運(yùn)酶的基因、編碼聚合酶的基因和編碼糖基轉(zhuǎn)移酶基因內(nèi)的一段核苷酸分子,它們在長度上可改變,一般在10到20個(gè)核苷酸范圍內(nèi)改變。尤其是源于wzx基因(核苷酸位置是從SEQ ID NO1的1114至2433堿基),wzy基因(核苷酸位置是從SEQ ID NO1的4649至5845堿基)內(nèi)的寡核苷酸對大腸桿菌O41都是高度特異的。
此外,有時(shí)兩個(gè)遺傳相似的編碼不同O-抗原的基因簇通過基因重組或突變產(chǎn)生新的O-抗原,從而產(chǎn)生新的細(xì)菌類型,新的突變株。在這種環(huán)境中,需要篩選出多對寡核苷酸同重組基因雜交以提高檢測的特異性。因此,本發(fā)明提供了一整套多對寡核苷酸的混合物,它們源于轉(zhuǎn)運(yùn)酶基因,包括wzx基因或與wzx有相似功能的基因;源于聚合酶基因,包括wzy基因或與wzy有相似功能的基因;源于糖基轉(zhuǎn)移酶基因,包括orf2、orf3、orf5、orf6基因。這些基因的混合物對一個(gè)特殊的細(xì)菌多糖抗原來說是特異的,從而使這套寡核苷酸對這個(gè)細(xì)菌的多糖抗原是特異的。更具體地說,這些寡核苷酸的混合物是源于轉(zhuǎn)運(yùn)酶基因、源于聚合酶基因和源于糖基轉(zhuǎn)移酶基因中的寡核苷酸的組合。
在另一方面,本發(fā)明涉及寡核苷酸的鑒定,它們可以用于檢測表達(dá)O-抗原的細(xì)菌和在診斷中鑒定細(xì)菌的O-抗原。
本發(fā)明涉及到一種檢測食品中的一個(gè)或多個(gè)細(xì)菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個(gè)基因的寡核苷酸特異性雜交,這些基因是(i)編碼轉(zhuǎn)運(yùn)酶基因,包括wzx基因或與wzx有相似功能的基因(ii)編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因。(iii)編碼糖基轉(zhuǎn)移酶基因,包括orf2、orf3、orf5、orf6基因。在條件許可的情況下至少一個(gè)寡核苷酸能與至少一個(gè)表達(dá)特殊的O-抗原的細(xì)菌的一個(gè)以上的那樣的基因特異性雜交,這些細(xì)菌是大腸桿菌O41??捎肞CR方法檢測,更可以將本發(fā)明方法中的核苷酸標(biāo)記后作為探針通過雜交反應(yīng)如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細(xì)菌。
本發(fā)明者考慮到以下情況當(dāng)單個(gè)的特異的寡核苷酸檢測無效時(shí),寡核苷酸的混合物能與靶區(qū)域特異性雜交以檢測樣品。因此本發(fā)明提供了一套寡核苷酸用于本發(fā)明所述的檢測方法。這里所說的寡核苷酸是指源于編碼轉(zhuǎn)運(yùn)酶基因包括wzx基因或與wzx有相似功能的基因、編碼聚合酶的基因包括wzy基因或與wzy有相似功能的基因的寡核苷酸和編碼糖基轉(zhuǎn)移酶基因包括orf2、orf3、orf5、orf6基因的寡核苷酸。這套寡核苷酸對一個(gè)特殊的細(xì)菌的O-抗原來說是特異的,這一特殊的細(xì)菌O-抗原是由大腸桿菌O41表達(dá)的。
另一方面,本發(fā)明涉及到一種檢測排泄物中的一個(gè)或多個(gè)細(xì)菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個(gè)基因的寡核苷酸特異性雜交,這些基因是(i)編碼轉(zhuǎn)運(yùn)酶的基因,包括wzx基因或與wzx有相似功能的基因(ii)編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因(iii)編碼糖基轉(zhuǎn)移酶基因,包括orf2、orf3、orf5、orf6基因。在條件許可的情況下至少一個(gè)寡核苷酸能與至少一個(gè)表達(dá)特殊的O-抗原的細(xì)菌的一個(gè)以上的那樣的基因特異性雜交。這些細(xì)菌是大腸桿菌O41??捎帽景l(fā)明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發(fā)明中的寡核苷酸分子標(biāo)記后作為探針通過雜交反應(yīng)如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細(xì)菌。
一般一對寡核苷酸可能與同樣的基因雜交也可與不同的基因雜交,但它們中必須有一個(gè)寡核苷酸能特異性雜交到特殊抗原型的特異序列上,另一個(gè)寡核苷酸可雜交于非特異性區(qū)域。因此,當(dāng)特殊的多糖抗原基因簇中的寡核苷酸被重新組合時(shí),至少能選出一對寡核苷酸與多糖抗原基因簇中特異基因混合物雜交,或者選出多對寡核苷酸與特異基因的混合物雜交。甚至即使當(dāng)一個(gè)特殊的基因簇中所有基因都獨(dú)一無二時(shí),此方法也能應(yīng)用于識(shí)別此基因簇內(nèi)的基因混合物的核苷酸分子。因此本發(fā)明提供了一整套用于檢測本發(fā)明方法的多對寡核苷酸,在這里多對寡核苷酸是源于編碼轉(zhuǎn)運(yùn)酶的基因包括wzx基因或與wzx有相似功能的基因;源于編碼聚合酶的基因包括wzy基因或與wzy有相似功能的基因;源于編碼糖基轉(zhuǎn)移酶的基因包括orf2、orf3、orf5、orf6基因。這套寡核苷酸對一個(gè)特殊的細(xì)菌多糖來說是特異的,這套寡核苷酸可能是糖合成中必須基因的核苷酸。
另一方面,本發(fā)明也涉及到一種檢測源于病人的樣品中的一個(gè)或多個(gè)細(xì)菌多糖抗原的方法。樣品中的一個(gè)或多個(gè)細(xì)菌多糖抗原可以使樣品能與以下至少一個(gè)基因中的一對寡核苷酸中的一個(gè)特異性雜交,這些基因是(i)編碼轉(zhuǎn)運(yùn)酶的基因,包括wzx基因或與wzx有相似功能的基因(ii)編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因(iii)編碼糖基轉(zhuǎn)移酶基因,包括orf2、orf3、orf5、orf6基因。在條件許可的情況下至少一個(gè)寡核苷酸能與樣品中的至少一個(gè)表達(dá)特殊的O-抗原的細(xì)菌的一個(gè)以上的那樣的基因特異性雜交,這些細(xì)菌是大腸桿菌O41??捎帽景l(fā)明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發(fā)明中的寡核苷酸標(biāo)記后作為探針通過雜交反應(yīng),或者通過基因芯片或微陣列檢測樣品中的抗原及細(xì)菌。
更詳細(xì)地說,以上描述的方法可以理解為當(dāng)寡核苷酸對被使用時(shí),其中的一個(gè)寡核苷酸分子能雜交到一個(gè)并不是來源于wzx基因或與wzx有相似功能的基因及wzy基因或與wzy有相似功能的基因和糖基轉(zhuǎn)移酶基因包括orf2、orf3、orf5、orf6基因的序列上。此外,當(dāng)兩個(gè)寡核苷酸都能雜交上時(shí),它們可能雜交于同一基因也可能雜交到不同基因上。也即,當(dāng)交叉反應(yīng)出現(xiàn)問題時(shí),可選擇寡核苷酸混合物檢測混合的基因以提供檢測的特異性。
本發(fā)明者相信本發(fā)明不必限于以上所提的核苷酸序列編碼的特定的O-抗原,而且廣泛應(yīng)用于檢測所有表達(dá)O-抗原和鑒定O-抗原的細(xì)菌。由于O-抗原合成和其他多糖抗原(如細(xì)菌胞外抗原)合成之間的相似性,本發(fā)明的方法和分子也應(yīng)用于這些其他的多糖抗原。
本發(fā)明首次公開了大腸桿菌O41的O-抗原基因簇的全長序列,而且可從這個(gè)未被克隆的全長基因簇的序列中產(chǎn)生重組分子,通過插入表達(dá)可產(chǎn)生表達(dá)大腸桿菌O41的O-抗原,并成為有用的疫苗。
具體實(shí)施例方式下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解這些實(shí)施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件如Sambrook等人,分子克隆實(shí)驗(yàn)室手冊(NewYorkCold Spring Harbor Laboratory Press,1989)中所述的條件。
實(shí)施例1基因組的提取。
在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O41,離心收集細(xì)胞。用500ul50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細(xì)胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時(shí),再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清液,再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)溶液抽提兩次,取上清液,再用等體積的乙醚抽提以除去殘余的酚。上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中?;蚪MDNA通過0.4%的瓊脂糖凝膠電泳檢測。
實(shí)施例2通過PCR擴(kuò)增大腸桿菌O41中的O-抗原基因簇以大腸桿菌O41的基因組為模板通過Long PCR擴(kuò)增其O-抗原基因簇。首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇上游的galF基因設(shè)計(jì)上游引物(5’-ATTGTG GCT GCA GGG ATC AAA GAA ATC-3’),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計(jì)下游引物(5’-TAG TCG CGC TGN GCC TGG ATT AAG TTC GC-3’)。用Boehringer Mannheim公司的Expand Long Template PCR方法擴(kuò)增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘;然后94℃變性10秒,61℃退火30秒,68℃延伸15分鐘,這樣進(jìn)行30個(gè)循環(huán);最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性。合并6管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物。
實(shí)施例3構(gòu)建O-抗原基因簇文庫。
首先是連接產(chǎn)物的獲得用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫。反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進(jìn)行。酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng)。合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中。隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃反應(yīng)30分鐘,將酶切產(chǎn)物補(bǔ)成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴(kuò)大為80ul,70℃反應(yīng)20分鐘,使DNA的3′端加dA尾。此混合物經(jīng)等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接24小時(shí),總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶。最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物。
其次是感受態(tài)細(xì)胞的制備參照Bio-Rad公司提供的方法制備感受態(tài)細(xì)胞大腸桿菌DH5α。取一環(huán)大腸桿菌DH5α單菌落于5ml的LB培養(yǎng)基中,180rpm培養(yǎng)10小時(shí)后,取2ml培養(yǎng)物轉(zhuǎn)接到200ml的LB培養(yǎng)基中,37℃250rpm劇烈振蕩培養(yǎng)到OD600 0.5左右,然后冰浴冷卻20分鐘,于4℃4000rpm離心15分鐘。傾盡上清液,用冷的冰預(yù)冷的去離子滅菌水200ml吹散菌體,于4℃4000rpm離心15分鐘。再用冷的冰預(yù)冷的去離子滅菌水100ml吹散菌體,于4℃4000rpm離心15分鐘。用冷的冰預(yù)冷的10%的甘油懸浮細(xì)胞,4℃6000rpm離心10分鐘,棄上清液,最后沉淀用1ml冰預(yù)冷的10%的甘油懸浮細(xì)胞,即為感受態(tài)細(xì)胞。將制得的感受態(tài)細(xì)胞分裝為50ul一管,-70℃保存。
最后是電轉(zhuǎn)化感受態(tài)細(xì)胞取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時(shí)間為5.0毫秒-6.0毫秒。電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇。然后立即將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上37℃倒置過夜培養(yǎng),次日得到藍(lán)白菌落。將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時(shí)從每個(gè)克隆中提取質(zhì)粒并用EcpRI酶切鑒定其中的插入片段的大小,得到白色克隆群構(gòu)成了大腸桿菌O41的O-抗原基因簇文庫。
實(shí)施例4對文庫中的克隆測序。
從文庫中挑選插入片段在1000bp以上的100個(gè)克隆由上海生物工程有限公司用ABI377型DNA自動(dòng)測序儀對克隆中的插入片段單向進(jìn)行測序,使序列達(dá)到80%的覆蓋率。剩余20%的序列再通過反向測序及將有些序列測通得到,最后獲得O-抗原基因簇的所有序列。
實(shí)施例5核苷酸序列的拼接及分析。
用英國劍橋MRC(Medical Research Council)分子生物學(xué)實(shí)驗(yàn)室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O41的O-抗原基因簇的核苷酸全長序列(見序列列表)。序列的質(zhì)量主要由兩個(gè)方面來保證1)對大腸桿菌O41的基因組作6個(gè)Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫。2)對每個(gè)堿基,保證3個(gè)以上高質(zhì)量的覆蓋率。在得到大腸桿菌O41的O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心(The National Center for BiotechnologyInformation,NCBI)的orffinder發(fā)現(xiàn)基因,找到12個(gè)開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對,最后得到大腸桿菌O41的O-抗原基因簇的結(jié)構(gòu),如表3所示。
通過檢索和比較,發(fā)現(xiàn)orf1與Yersinia enterocolitica的O-抗原轉(zhuǎn)運(yùn)酶Wzx在426個(gè)氨基酸的序列中有32%的相同性,56%的相似性。并且通過Eisenberg等人的算法發(fā)現(xiàn)orf1有10個(gè)潛在的穿膜區(qū),Wzx蛋白的氨基端有一個(gè)大約40個(gè)氨基酸的保守基序,所以可以確定orf1是wzx基因,命名為wzx。Orf2與Geobacter sulfurreducens PCA的的糖基轉(zhuǎn)移酶在274個(gè)氨基酸中有28%的相同性,52%的相似性,推測orf2也是一個(gè)糖基轉(zhuǎn)移酶,將orf2暫命名為orf2。Orf3與Bacteroides thetaiotaomicron VPI-5482的糖基轉(zhuǎn)移酶在416個(gè)氨基酸中有33%的相同性,54%的相似性,在genbank中尋找保守的功能域,發(fā)現(xiàn)orf3與糖基轉(zhuǎn)移酶家族1的保守的功能域PF00534的Evalue為1.4×e-27,推測orf3也是一個(gè)糖基轉(zhuǎn)移酶,暫命名為orf3。Orf4與Drosophila simulans的O-抗原聚合酶在215個(gè)氨基酸的序列中有26%的相同性,47%的相似性。并且通過Eisenberg等人的算法[Eisenberg,D,Schwarz,E.et al(1984).Analysis of membrane and surface protein seque-nces withthe hydrophobic moment plot.J.Mol.Biol.179125-142]發(fā)現(xiàn)orf4有9個(gè)潛在的穿膜區(qū),它與許多Wzy蛋白有相似的二級結(jié)構(gòu),有一個(gè)大的loop,具有典型的O-抗原聚合酶的特征,所以確定orf4是wzy基因,命名為wzy。Orf5與Bacteroides fragilis的糖基轉(zhuǎn)移酶在218個(gè)氨基酸中有31%的相同性,53%的相似性,在genbank中尋找保守的功能域,發(fā)現(xiàn)orf5與糖基轉(zhuǎn)移酶家族2的保守的功能域PF00535的Evalue為2.1×e-27,推測orf5也是一個(gè)糖基轉(zhuǎn)移酶,暫命名為orf5。通過與GenBank中的基因比較沒有找到與Orf6相似的序列,所以不能確定Orf6的功能,暫命名為Orf6。orf7與Yersiniaenterocolitica的Gmd在271個(gè)氨基酸中有84%的相同性,93%的相似性,Gmd是一個(gè)GDP-mannose-4,6-dehydratase,高度的相同性表明orf7也是gmd基因,命名為gmd。Orf8與Yersinia pseudotuberculosis的GDP-L-fucosesynthetase在320個(gè)氨基酸中有76%的相同性,85%的相似性。GDP-L-fucosesynthetase由rmlC基因編碼,較高的相同性表明葡萄糖-1-磷酸胸苷轉(zhuǎn)移酶由fcl基因編碼,高度的相同性表明orf8也是fcl基因,命名為fcl。Orf9與Salmonella typhimurium的GDP-mannose mannosyl hydrolase在148個(gè)氨基酸中有53%的相同性,68%的相似性。GDP-mannose mannosyl hydrolase由gmm基因編碼,較高的相同性表明orf9也是gmm基因,命名為gmm。Orf10與Escherichia coli的GDP-mannose pyrophosphorylase在468個(gè)氨基酸中有81%的相同性,91%的相似性。GDP-mannose pyrophosphorylase由manC基因編碼,較高的相同性表明orf10也是manC基因,命名為manC。Orf11內(nèi)有一個(gè)終止密碼子,推測它已經(jīng)失去了功能,暫命名為orf11。Orf12與Shigella boydii的phosphomannomutase在473個(gè)氨基酸中有90%的相同性,94%的相似性。phosphomannomutase由manB基因編碼,較高的相同性表明orf12也是manB基因,命名為manB。
實(shí)施例6特異基因的篩選針對大腸桿菌O41的O-抗原基因簇中的wzx、wzy基因設(shè)計(jì)引物,這些基因在核苷酸序列中的位置見表1。
在表1中列出了大腸桿菌O41的O抗原基因簇的轉(zhuǎn)運(yùn)酶基因、聚合酶基因及它們的相應(yīng)的功能和大小。在每個(gè)基因內(nèi),我們各設(shè)計(jì)了兩對引物,每對引物分布在相應(yīng)基因內(nèi)的不同地方以確保其特異性。在表中還列出了每個(gè)引物在SEQ ID NO1中的位置和大小。以每對引物用表中所列的相應(yīng)的退火溫度以表2中的所有菌的基因組為模板進(jìn)行PCR,得到了相應(yīng)的PCR產(chǎn)物,其大小也列于表中。
mdh(malate dehydrogenase)基因是存在于所有的大腸桿菌的基因組中且高度保守的一個(gè)基因,所以我們根據(jù)mdh基因設(shè)計(jì)了引物(5′-TTC ATC CTA AACTCC TTA TT-3′)和(5′-TAA TCG CAG GGG AAA GCA GG-3′),然后從166種血清型的大腸桿菌中提取基因組,方法如前所述。用這對引物從166種血清型的大腸桿菌的基因組中PCR以鑒定大腸桿菌并檢測其基因組的質(zhì)量。
表2是用于篩選特異基因的166種血清型的大腸桿菌和43株志賀氏菌及它們的來源,為了檢測的方便,我們將它們每12-19個(gè)菌分為一組,總共13組。它們的來源都列于表中。
在第2組中含有大腸桿菌O41的基因組DNA作為陽性對照。第13組中是不含有大腸桿菌O41的基因組DNA,作為陰性對照。以每組菌做模板,用表1中的每對引物按如下條件做PCR在95℃預(yù)變性2分鐘后,95℃變性15秒,退火溫度因引物的不同而不同(參照表1),退火時(shí)間是50秒,72℃延伸2分鐘,這樣進(jìn)行30個(gè)循環(huán)。最后在72℃繼續(xù)延伸10分鐘,反應(yīng)體系是25ul。反應(yīng)完畢后,取10ulPCR產(chǎn)物通過0.8%瓊脂糖凝膠電泳檢測擴(kuò)增出的片段。
對于wzx、wzy基因,每個(gè)基因都有兩對引物被檢測,每對引物除了在第3組中做PCR后得到了預(yù)期大小的正確的一條帶外,在其他組中都沒有擴(kuò)增到任何大小正確的帶。所以wzx、wzy基因?qū)Υ竽c桿菌O41及其O-抗原都是高度特異的。
最后,通過PCR從大腸桿菌O41中篩選到對大腸桿菌O41的O-抗原高度特異的基因wzx、wzy基因。而這些基因內(nèi)的任何一段10-20nt的寡核苷酸對大腸桿菌O41的O-抗原是特異的,尤其是上述每個(gè)基因中的引物即寡核苷酸對經(jīng)PCR檢測后證實(shí)對大腸桿菌O41是高度特異的。所有的這些寡核苷酸都可用于快速準(zhǔn)確地檢測人體和環(huán)境中的大腸桿菌O41,并能鑒定它們的O-抗原。
實(shí)施例7引物靈敏度的檢測。
購買市場上的生豬肉餡,攪拌均勻,分成20g一份,存在-40℃冰箱中備用。將10μl大腸桿菌O41的凍存菌液接種到有20ml LB培養(yǎng)基的三角瓶中,于37℃,200轉(zhuǎn)/分,培養(yǎng)12小時(shí)至飽和,取少量培養(yǎng)好的菌液作106和107倍的稀釋,其余的菌液放于4℃的冰箱中備用,取50μl稀釋菌液涂布LB瓊脂平板,37度,培養(yǎng)12h,對所涂平板計(jì)數(shù),計(jì)算原液中活菌濃度。在5份生豬肉餡中分別摻入5×103,5×102,5×101,5個(gè)和0個(gè)活菌,攪拌均勻,加入200ml LB培養(yǎng)基,經(jīng)6層紗布過濾,過濾液于37℃,200轉(zhuǎn)/分,培養(yǎng)12h。從培養(yǎng)好的菌液中取3ml菌液于6,000g離心5分鐘,去上清,加100μl MQ超純水吹開沉淀并混勻,放入100度沸水中煮15分鐘,裂解液于12,000g離心8分鐘,取1μ上清做為PCR模板。用4對寡核苷酸對,SEQ IDNO1中的1805至1822堿基的核苷酸和2393至2410堿基的核苷酸,SEQ IDNO1中的1510至1527堿基的核苷酸和2106至2123堿基的核苷酸,SEQ IDNO1中的5012至5029堿基的核苷酸和5406至5389堿基的核苷酸,SEQ IDNO1中的5272至5289堿基的核苷酸和5645至5662堿基的核苷酸進(jìn)行PCR反應(yīng),PCR反應(yīng)體系如下MQ15.7μl,Mg2+2.5μl,Buffer2.5μl,dNTP1μl,Taq酶0.3μl,P11μl,P21μl,模板DNA1μl。PCR反應(yīng)條件為95℃5′,95℃30″,56℃45″,72℃1′,72℃5′,共30個(gè)循環(huán)。反應(yīng)結(jié)束后,取10μl反應(yīng)產(chǎn)物電泳,若有與預(yù)期大小相符的擴(kuò)增帶,則結(jié)果為陽性,若沒有,則結(jié)果為陰性。參入了5×103,5×102,5×101,和5個(gè)活菌的每份豬肉餡均在4對引物的PCR反應(yīng)中得到陽性結(jié)果。參入0個(gè)活菌的豬肉餡在4對引物的PCR反應(yīng)中得到陰性結(jié)果。說明使用上述方法時(shí),這4對引物對豬肉餡中的大腸桿菌O41的檢測靈敏度均為0.25個(gè)菌/g。
通過對O抗原基因簇的克隆和在減毒的疫苗菌株中的表達(dá),可以組建重組疫苗。O抗原為最主要的革蘭氏陰性菌的表面抗原,可以引起強(qiáng)烈的免疫反應(yīng),是制造重組疫苗的最好的靶分子之一。在1993年Viret實(shí)驗(yàn)室成功的將志賀氏菌Sonnei的O抗原基因簇在一株沙門氏菌Tyziai疫苗菌中表達(dá),動(dòng)物實(shí)驗(yàn)證明可以引起兔子的免疫反應(yīng)(Molecular Microbiology1993,7239-252)。中國軍事醫(yī)學(xué)科學(xué)院的小組也在從事與Viret實(shí)驗(yàn)室類似的工作。王磊實(shí)驗(yàn)室在1999年成功的將大腸桿菌O111的O抗原基因簇在沙門氏菌疫苗STM-1中表達(dá),并證明組建成的菌株可以引起小鼠的血液和體液反應(yīng)(Microbial Pathogenesis 1999,2755-59)。所以本發(fā)明O41的O抗原特異基因序列可以應(yīng)用于組建重組疫苗。
根據(jù)本發(fā)明的對大腸桿菌O41型的O-抗原特異的核苷酸序列(SEQ ID NO1所示),構(gòu)造特異核酸探針,將其固定到芯片的載體上制成生物芯片,將要檢測的樣品適當(dāng)處理后,與生物芯片進(jìn)行雜交反應(yīng),然后利用生物芯片信號分析設(shè)備就可以得到樣品中相應(yīng)的細(xì)菌情況。這種大腸桿菌O抗原鑒定的DNA芯片將可以直接用于臨床和其它檢驗(yàn)場所(如食品加工和生產(chǎn)行業(yè),畜牧獸醫(yī)行業(yè)海關(guān)檢疫等的微生物檢驗(yàn))。這種芯片只需要擴(kuò)大產(chǎn)量,在完全相同的條件下就可以產(chǎn)業(yè)化。
表3是大腸桿菌O41的O-抗原基因簇的結(jié)構(gòu)表,在表中列出了大腸桿菌O41的O-抗原基因簇的結(jié)構(gòu),共由12個(gè)基因組成,每個(gè)基因用方框表示,并在方框內(nèi)寫入基因的名稱。在O-抗原基因簇的兩端是galF基因和gnd基因,它們不屬于O-抗原基因簇,我們只是用它們的一段序列設(shè)計(jì)引物來擴(kuò)增O-抗原基因簇的全長序列。
表4是大腸桿菌O41的O-抗原基因簇中的基因的位置表,在表中列出了大腸桿菌O41的O-抗原基因簇中的所有開放閱讀框在全序列中的準(zhǔn)確位置,在每個(gè)開放閱讀框的起始密碼子和終止密碼子的下面劃線。在細(xì)菌中開放閱讀框的起始密碼子有兩個(gè)ATG和GTG。
SEQ ID NO1序列(SEQUENCE LISTING)<110>天津生物芯片有限責(zé)任公司<120>對大腸桿菌O41的O-抗原特異的核苷酸<130>對大腸桿菌O41的O-抗原特異的核苷酸<160>1<170>PatentIn version 3.1<210>1<211>15377<212>DNA<213>Escherichia coli<400>1attgtggctg cagggatcaa agaaatcctc ctggtaactc atgcgtccaa gaacgcggtc 60gaaaaccact tcgatacctc ttatgaatta gaatctctcc ttgaaatgcg cgttaagcgc120cagctgctgg cggaagtaca atctatttgc ccacctggtg tgaccattat gaacgtgcgt180cagggcgaac ctttaggttt aggccactcc attttgtgcg ccagacctgc cattggcgac240aacccatttg tagtggtgct accagacgtt gttatcgacg acgccagcgc tgacccgctg300cgctacaacc ttgctgccat gattgcgcgt ttcaacgaaa cgggccgcag ccaggttctg360gcaaaacgta tgccgggtga cctctctgag tactccgtca tccagacgaa agaaccgcta420gatcgtgaag gtaaagtcag ccgcattgtt gaatttatcg aaaaaccgga tcagccgcag480accctggatt cagacattat ggccgttggt cgctatgtgc tttctgcaga tatttggccg540gaacttgaac gcactcagcc aggtgcatgg ggacgtattc agctgactga tgccattgcc600gaactggcga aaaaacagtc tgttgatgcc atgctgatga caggtgacag ctatgactgc660ggtaaaaaaa tgggttatat gcaggcattt gtgaagtatg gactacgcaa cctgaaagaa720ggggcgaagt tccgtaaagg gattgagaag ctgttaagcg aataatgaaa atctgaccgg780atgtaacggt tgataaggaa attataacgg cagtgaagat tcgtggcgaa agtaatttgt840tgcgaatatt cctgccgttg ttttatataa acaatcagaa taacaacgag ttagcaatag900gattttagtc aaagttttcc aggattttcc ttgtttccag agcggattgg taagacaatt960agcgtttgaa tttttcgggt ttagcgcgag taggtaacgc tcgtaacatc gtagacatgc 1020
atgcagtgct ctggtagctg ttaagccagg ggcggtagcg tgtgaaatat taatcaataa 1080gaaaaacaga cgaataattt ggcctgaaat tttatgcata ttaaattaaa taaaaatata 1140tcagaagtat tatctttctc ttccattgaa aaaatagcta aaaatagtgg gtggctatta 1200atggaaagat gtactagatt aacactaggt ttattagtta gtacatggat cgctcgttat 1260ttggggccgg atcagtacgg agttttgtct tatgtaatag catttatcgc gttcttccaa 1320gctatccttc ctttaggaat ggatggtata atagtccgag atatctcaaa aaatgagaaa 1380gactctggtg ctatacttgg aactataatt attacacgat tcacacttgg attaatatta 1440tggtttgcaa tcataatttt aacgactatt atatactcac taaaaagtga atatacatta 1500ttaagtgcca taatcggagc atcacttata tttcaagccg cagacacaat agatttgtgg 1560ttccaaagtc aaagtcaaag taaaagaaca gtagtggcaa agttgcttgc ttacatatct 1620gtaaatttac ttaagatagg aatgcttatt tttaaatgcc ccctatatgc ttttgcaatt 1680gcaacactcc ttgaatttat cttttcttcc attgggctaa tcattgcttt tacgcgtttt 1740cgtccaactg ttaaattggc cttttcatct ttaattatca agaaattttt aggtgagtca 1800tggccatttc ttattagtag tatcgcaata ataatttata tgcgaattga ccaaatgttt 1860atcaagtact atttgcctct aaatgatttg ggaatatact cagcaatgtt accacttgct 1920acgctttggt catttattcc tatgactcta agcatcagtg tatctccttt tcttactaaa 1980gcaaaaatgg aaagcgaaga aaaatatcag aaaatattgt gttttacatt caagttattt 2040tcaatgttag gatggttaat ttgtattcca gtgtgtgtct tttctgatta tatagtttct 2100ctactttatg gtccgcaata tcaaacaggt gctgtagtct tatcaatatt aatattcact 2160aacttattta tataccaagg ggtggcgcag tcattatgga ttattaatga gcgaaaaggg 2220aaattaagtt tattgaaaac aatattaggc gcaattgtat gtatagttgc taatttaata 2280ttaattccga aatatggcat tattggtgca gctatatcag cagtattggc gcagtttaca 2340tcagctataa tggcaaatat tgtaatggca ccaagaatat taatattaca gatacaaagc 2400ctgttgttta taccgttgag aaaggttaat taatggaatc taaagtaagt gtgtatgctc 2460ctgtaatcct atttgtttat gctagatatg aacatacaaa aaaaacaatt gaagcgttag 2520cagataatta ttatgcaact gagacggaac ttatcattta ttctgattat tggcatgatg 2580aaaatgataa agaaaatgtt aataaagtca gaaggtatat taaaagtata aaaggattta 2640aatcaattac aataattgag agggagacta attatggctt ggcaaaaaat attatcgagg 2700gagtgacaga tgtctgtaac aagtacgaac gagtgattat tttagaagat gacttgttaa 2760catcgagatt ttttttaaag tacatgaatc acgcattgga aaaatatgag ttaaatgaag 2820aagtatggca tataagcggt tggaattatc caattgattt taactccaat aaagcctcat 2880ttttatggag agtgatgaac tgttgggggt gggcgacgtg gtcaaaccga tggcgttatt 2940ttgaaaaaaa accttcacaa ataataagtg aatgggatgc tgaaaaaatc aaagcattca 3000
atttagatgg ttatcatgat ttttttgaac aaataataat gaattatgaa ggcagaaaaa 3060atacctgggc aattttttgg tatgccacaa tatttattaa taatggtctg tgtttaaacc 3120cgataaacac atatgtcaaa aatataggat atgatggctc aggtcaaaac tgtggtgtta 3180aagatattta taagagtaag gtgtcacaat tttatattga ttcgtttcct gacatactgg 3240aagagaatga attggccgtt aaagaaataa aaaaattttt caaaaaacaa gagccttctg 3300tttttagaaa aatcgcaaga gaaatccgaa actacttaat gacattatgc aaaataaaat 3360gaactggtaa gttatgaaaa tcctaatatt atcacactct gacatctctg gtggggcatc 3420aatagcagct tatagactcc acaccgcatt gctgaaaaat aatatttatt ctagaatgat 3480ggtaagggta aagaagactg atgactttac agttattggt cctaaaggga gcgttcaaaa 3540aattttgaat aaaatccgct caccgcttgg taattgtatc aatggattat taaaaacaaa 3600aaaaacaggt tttataagcg gaaattggat gccatctgga tgggcggaaa aaattaataa 3660aatggatatt gatattgttc atcttcattg ggttggggca gaaacattat caattgagga 3720tattggtaga ataaataaac cagttatttg gactttgcat gatatgtggc cattttgcgg 3780gattgaacat tatgccccag atcttttaga aagtagatgg cgtaataatt atgaaaatca 3840ttcattctct tcatttattg atttagattt cattgtatgg aaaagaaaaa aaaattcatg 3900gaataataat attagtattg tttctccaag tacttggtta tacgattgtg caaaacatag 3960cagtttattt gaaaataata aacatgttct aattccaaat gcacttgatc tttcagtttt 4020taagccatta gataagagtt attgtcgaga gattttaaat atagacaatg ataagaaaat 4080aattcttttt ggtgcgtttg gcggaggaac tgacaagcgc aaagggtatg atttgttagt 4140taaagcatta gaattaatcg ctaaggacag taacaccttc aaaattcaat gcttagtctt 4200tggacaaagt acgccagaag aaaaaattga tcttcccatc gatataaaat ggttaggcca 4260tatatatgat aatacaacat tatctttaat ttataactca gcgaatgtaa tggttgttcc 4320atcaagacaa gataatttgc cacaaactgc tacagaagca caagcttgtg gttgccctgt 4380cgtggcattt gattgcactg gatttccaga tataatcaca cacaaggaaa cagggtatct 4440agctaaacca tacgattttg tagatttagc tagggggata ttatgggttc taaataataa 4500agatgtggaa attaatctaa gcagtaatgc agtacataaa gctcataaaa tctggtcaga 4560agatcaagta gtttctgaat atatagctct ataccaaaat attattaatg agaaaactcg 4620gaatgtttaa ttatagggcg gattacatgt gagtaaactt aaatccaagt atataagaaa 4680taactatgcc agacctggta atgatatagt tgcttctata atttcattat gcgtgattat 4740tacactacat cctttaattt ctttagtact tctgtcacta ataaacattt tcacgcgtct 4800aagtaataag atatgctatc tttactgctt agtatattca atacttattg taaatagaga 4860atatctgatt gagtttaatg agcgtagtgg tgatgatact tttcgatata tcccatttat 4920
aaaaaatata gcaacatttt catttgataa agcattaact gcagaatctg atatattcag 4980cattgagcca ttaagtcgag catattggtg gttgctatca gttttaggag ttaatatcaa 5040tgtgatatta ttgcttcaag tcttttgttg gacaacttgt ttgatggttt tagctataaa 5100aataagtgaa agatatgcaa tgattattct atgcataggc atttgctttt tttcatatac 5160aattccatac actttctttc atttatttag gcaggcatgg ggactatcat tctttattct 5220atatttgtgc aattgggata agccgggtag atttgcattt attctattag ccggattgag 5280tcatttgatg tttattccat tattgatttt tatggaaata tcaagaaaag ggatattaat 5340attaacatct aaatattttc cgttattggc tgctatcttc ctgattgcat tatatttaac 5400atataatgca ttgctaacaa aaattggaat gtattctgaa ggtgaaaaca taaactattc 5460accatttaaa tctttaattt attctctctt tttcttttct ttactgatgc tttataacaa 5520atatgaggaa aaaatatttc atctttcgaa tattaaattc aatataagtc tcacattaat 5580ttccttttat ttgtttggtc tttatattcc gttagcagat attgttaatc gatatatttt 5640attgctatca ccgcttgtta ttatgtttct taccattact aaaagcagat ttcttttatt 5700gttatttttg ttagctgcat taattaaatt gtcgatccat ttgttcgatg tagatggtaa 5760tatatatcag ttcacaatga ggggttatct tgatttttat aatgtaatgg atgcgttgta 5820tttttattta gagagaaaaa tatgaaacca ttaataaccg tgataacggt tgtctacaac 5880gatagtaaag gtttaacaaa aactataaat tcactcaagc tacaaactaa tttaacaaat 5940gttgagttta ttgttgtaga tggcaactcg agtgattcga caattgaaat aataaaaagt 6000tctaaagtta taacaaagta tatcattgaa gatgatcatg gtatatatga tgccatgaat 6060aaaggaattg atttggctac aggtaattgg atactatttt tgaatgcagg agatgttttc 6120tataatgatg atgttttacg taaattaaat gatactataa tgaatcttca cgagagcatt 6180aattttattt atagtgatta tctttctggt ggggttattt ataagcagtt ccttagttta 6240gattttttag cgtcacatat gattaatcat caaaatattg tttataagac tgaacttctc 6300aaagataaag ggtatagcac aaaatataaa ttttgctcag attataaaca catattggat 6360aattatttta ttattaatcc ttataagact ggctatatta tagcagcatt cgataataca 6420ggagttagtt cacaggttgt taataagtat aaaatgtggt tggagagatt aaatgctgtg 6480tggtcatcaa aattatcact gcaagcaaag ataaaattaa gtaaaagagg ttgggtagcc 6540ttaccttatc aattcataag atttgtcatc ataaaaatga gaatgctatg aattataatg 6600ttgagttgtt tattggtgta tgcgtaactt acgatgattt taataaatat aagctacaac 6660ttctttcttc tttaaaaaat ctatataact catttgctgg ggattgtagt gtttatattg 6720ttattcaaag tgaacgttgt tcttttgatt atcgttactc atatccaacg gattggatcg 6780aattttatga aacagattat tttggaatat caaatgcaag aaacttatgc atagaagctt 6840gtttaagaaa aaatgcgaaa tttattatct ttcatgatgc atcaatttat tggacaaagt 6900
ctgcagcaga gtttattcac aggtttagaa ataacatcga gacaccgcga atcaacctct 6960tgtttgataa aaactaccat atgcaacatg aatttaatca tcctttagac attcaaaata 7020ttcgtataga aaaatgcaat ccaatttata actcatatgt tggtggtttt ctatttagag 7080ttagtaaaat aaaggaatta agatttcatc ttggctttgg tccgggtaaa tacacgaaat 7140gtaaaagtgg tgaggatgtt ttatttttat tcgagtattt tgaacgacag aatattaccc 7200tctaccctat aaatagaaaa attgcagtta tacatccacc aaggccatct gattattcaa 7260agcatttgtt atatgcatat ggtcaagggg cattatttag atttttagtt cataaatata 7320aacgaatgag tctattttat gatttgatac ttttttttgg gaatgcactt gttagatgtt 7380tgctttttaa aaaaaaatca tttcaaattt tatataatag attaaaaggt tttattggag 7440tataatatga aaaaagcatt aattacaggc attactggtc aagatggttc ctacttggca 7500gaattccttc ttgataaagg gtatgaagtg catggcatta aacgtcgtgc atcttcgttt 7560aacacagaac gtgttgatca tatttatcaa gatcgccaca accaaaatcc aaatttcttt 7620cttcattatg gtgacttaac agattcatca aacttaatac gtctcatcaa agaaatccaa 7680ccagacgaag tttataacct tggcgctcag tctcatgtgg ctgtttcatt cgaatcacct 7740gaatatactg ctgatgtgga tgcgatgggg actttacgtc tgctggaagc gattcgtatt 7800tgtgggctag agaaaaaaac acgtttctat caggcatcaa cttctgaact ctttggctta 7860gttcaggaaa tcccacagcg agaaacaaca ccattctacc ctcgttcgcc ttatgctgtt 7920gcgaagatgt atgcatactg gattactgta aactatcgtg aatcctatgg aatgtacgcc 7980tgtaacggta ttcttttcaa ccatgaatcc ccgcgtcgtg gtgaaacatt cgtaacacgt 8040aaaatcacgc gtgctattgc aaatatttcg cagggaatcg aaaaatgtct ctatcttggc 8100aatatggatt cactgcgcga ctggggacat gcgaaagatt acgtgcgtat gcggtggatg 8160atgttgcaac aagatcaccc agaggatttt gtaattgcaa caggcaaaca aatttccgta 8220cgtgaatttg ttcgtatgtc agctaaagaa gtaggcctgg agttagaatt ctccggacaa 8280ggtgttgatg aaatagcaac tgttgtgaat aaaacatctg actgtgctat tggtgttagt 8340attggggatg taatcgttcg tgttgatccg cgttatttcc gtcctgcaga agttgaaact 8400cttcttggtg atccagcaaa agccaaaaaa gtattgggtt gggaaccaga gattacagtt 8460gaagagatgt gtgcagaaat ggttgccagt gatctggcga aagcaaaaca gcatgcactt 8520ctgaaaagcc atggttacga tgttgcagtt tctctggagc ggtaaggtat gacaaagaaa 8580cgtatctacg ttgctggtca ccgaggtatg gttggctctg ctatttgccg tcaattatca 8640ctgcgtgatg atatcgaatt agtggtcaaa acacacaaag aactcgatct aaccgtacag 8700aaagatgttg atgcattttt tgagcaagag aaaattgatc aggtttatct tgctgcggct 8760aaagttggtg gtatttatgc caacaataca tttccggcag aattcatcta tcagaatctc 8820
atgattgaga gcaatattat tcattcagct cacaaggccg gaattcaaaa attacttttt 8880ttaggctcaa gctgtattta tcctaagttt gcagagcagc cgatgaacga gtctgaactt 8940ttaacgggca tacttgagcc aactaatgag ccatacgcaa ttgctaaaat tgcgggtata 9000aaattatgtg aatcttataa ccggcaatat ggccgtgatt atcgcagtgt aatgcctact 9060aatctttatg gcataaatga taattttcat cctgaaaact ctcatgttat tccggcactc 9120atgcgtagat tccatgaagc aaaagagagt ggtgcaccag aggttgttgt ttggggaacc 9180ggaacaccga tgcgtgagtt tttatatgtt gatgatatgg ctgccgcatc tgttcatgta 9240atggaacttg atgaagcaat ttatcaacaa aatactcagc ctatgttatc tcatattaat 9300gttggtacgg gtgtggattg ttctatacgt gaaatggctg aaacaatggc ctctgtggtg 9360ggttatcaag gtaaaattgt ttttgatgct accaaacctg atggcactcc gcgtaaactt 9420atggacgtta cccggctcaa aaacctgggc tggcaatatc gctataattt gcatgaaggc 9480ttatcattaa catataaatg gtttattgag aatattaatt cttttcgggg atagttatga 9540acaagagatt ggaatgtgag ttatttaaaa caatagttga gcatactcct ctaatctcga 9600ttgatctcat aattagaaac gataaaggag aggcgctgct tgggcagcgc ctgaatcgcc 9660cagcacaaaa ttattggttt gtgcctggag ggcgaattta taaggatgag tcattcgagg 9720ttgcatttaa tcggataaca tttgaagagt tgggcgttca aattagtctt aatgacgcct 9780tatttcttgg ggtgtatgaa catttctaca atgataattt ttctgaagca gaattttcta 9840cacactatgt agtgcatgga tatgaaatcc aacttaatcc tcagcaactt cacctaccaa 9900cggtccagca taattcctac aagtggtttg atgtagtaac gttgcttaat agcactatag 9960ttcatcaata taccaaaaat tattttatac caaggtaata gatatgctac ttcccgttgt 10020catggccggt ggttctggta ccagattatg gcctctttca cgtacacttt atccgaaaca 10080atttctgtct ttaaatagtc gtttaaccat gttgcaagag acattgcggc ggcttgacaa 10140ggtcgaacat aaacccgctt tggtcatttg taacgaatca catcgcttta tcgttgctga 10200acaattgcgt aaagagggtt taaagcatag cggtattttg cttgagcctg ttggtcgtaa 10260tactgcgcct gctgtagcac tcgcagcact tcaggctatg gtaactggag atgaccctat 10320tctgttggtt cttgctgcag atcatgaaat ccaggatgag gataatttca ttgctgcagt 10380tcttgctgcc aagaattttg cagagcaggg taagcttgtt acatttggta ttgttccaac 10440atccccagag actggctatg gttacattaa gtcaggtgaa tctctggatg aacaaggtta 10500taaagttgca gcttttgttg aaaaaccaga tcttcacgtg gctcagcggt acatatcaga 10560aggcggttat ctttggaata gtgggatgtt tatgttcaga gcgtctgtat ttatcgatga 10620actgaaaaaa ttccgaccag atattttagc cagttgccaa cgctccctgt cctcttcgat 10680acaagattta gattttatcc gcctggataa cgcttcattt tcttgctgtc ctgaagagtc 10740tattgactat gccgttatgg aaaaaacagc cgaagctgtc gtcgttccat taaatgcgca 10800
atggagtgat gtcgggtcat ggtctgcatt gtgggaaata agttcaaaag accaaagcgg 10860caatgccatt cgtggtgatg tattggttga agatgctaca gatagttatc tttattcgca 10920gcatagactt attggtgccg tgggcgtaaa ggatttggtt gttgttgaaa cgaaagatgc 10980agtattagtt gctcataaag ataaagttca gcaagttaaa aatatcgtcg ctcaactaaa 11040aaagaataat cgaacagaat atttacagca tcgggaaatt tatcgacctt ggggcagtca 11100tgatactata gctgaagggg aacgattcca ggtaaagcat gtgattgtat tacctggaca 11160tattactgct aaacagatcc attaccatcg cactgagcat tgggtagttg tatcggggac 11220agctaaagtt catcttgagg ataagactta ccttgtctct gaaaatgaat caacatatat 11280acctgttggt gttccacatg ctattgaaaa tcctggcaag atcccgctcg aaataattga 11340ggttagatcg ggagtctatc tggaagagga tgatgttata agagtgttct tctctggagt 11400cggatactaa tgagaatttc gattattaca gccacttata atagtgaaaa aaccctcctt 11460gatacattac tttctctaga aaagcaaaca catccagata tcgaatatat agttatagat 11520ggagcatcaa aagataatac aatcaaacta atcaaaagta attgtacaag agtttcaaaa 11580atcatttgcg aacccgataa tggcatttat gatgcgctaa ataaaggaat tcaagccgct 11640tcgggtgatg tcattggttt tttacattct gatgacttac ttgcttatga tgatgttatt 11700gcagatatag caaaaacatt tgaaagttca ggatgtgatg ctgtttatgg cgatttggag 11760tatgttgccc aaaatgatac gactaaacgt attagattat ggaaaagtgg ctcattcagt 11820cgtttgaaga tgaaactggg ttggatgccg ccacacccat cattttatat gaaacgtgat 11880tgttatggtc agtttggttg tttttcatta gatatatcga atatctgctg attatgattc 11940attgttacgt tatattttaa aacaacgcat ttcaatagcg tatttaccgc aagtattagt 12000gaagatgcgt gttggtggaa ttagcaatcg ttcattatct tccatggtca acaagtcgat 12060ggaggatatt cgtgttatga aacagaatgg tattttctgg ccaatagctt tagcgtataa 12120aaatctatcc aaacttcctc aattcattaa aaagtaatta tcatgttaaa tgctaaaaaa 12180atcattaccg atagcaatat tgctttcgga actagtgggg cgcgtggtct cgttgtcgat 12240tttacccatg atgtttgtgc tgcgttcact catgcgtttc tttctgttat tgatgataaa 12300tacaatctta ataaagttgc cttagcaatt gataaccggc caagcagtta cgaaattgct 12360caggcatgcg ccttagctat caaacaacat gggttcactg tcgaatatca tggtgtaatt 12420cctactcctg cattagctca ttattctatg cagaaaaaca ttccctgtat aatggtcact 12480gggagccata taccttttga tcgtaatggt ttgaaattct acagaccaga tggcgaaatc 12540acaaaagagg atgaactagc aatagtaaat agtgaatatg tcttttctcc tgtagatgta 12600ttacctcatc ttgaactaag cactcaagga gcggattgct atcttaaacg ttatgtttct 12660ctttttaatt ccgatatttt gaaaggaaaa aaaataggga tatatgaaca ttctagtgca 12720
ggacgagatt tatatgctcc tctttttaat caattgggcg ctgaggtcat ttcccttggc 12780agaagtgatg aattcgtccc tattgacact gaagcagtaa gtgatgaaga tcgtatactt 12840gcaagagagt ggtctaaaaa atataatctt gatgctattt tctctacaga tggcgatggt 12900gatcgtccct tagttgccga tgaaaatggt gaatggctaa gaggcgatat tctgggatta 12960cttactgcta ttgaacttaa tatcaaggcg ttggctattc cagtcagttg taatactgca 13020attgaacaat ctaacaaatt tgcaagtgta caacggacga aaataggctc tccttatgtg 13080attgcagcgt ttgcggatct tgctaagcaa tttgattcag tcgctggttt tgaagctaat 13140ggtggttttc tgcttgcctc cgatttacaa ataaatggca aggaattaaa ttcattacct 13200acacgagatg ctgtgttacc agcattaatg ctcttaatag cttcacgcaa cagtaccatc 13260tctcaactgg ttaataatct tccacagcga ttcacttggt cagatagggt taaagatgtc 13320ccttcagagt caagtcaaca tattataaaa aatgccatat tgtcacccaa taatttcttt 13380aatagcttag gatatgaatc attatcctgt tccgctattg atgaaacgga tggtgcaaga 13440tttactttaa ataatggtga tattatacac ctccgtcctt ccggtaatgc cccagaactc 13500cgttgttatg ctgaagccag taatgaaaat caggctaagc aatatgttac gaaagtcctt 13560ggaaacatta cctctttgat ttcttgaatt ataaaaaatg ccatattgtc acccaataat 13620ttctttaata gcttaggata tgaatcatta tcctgttccg ctattgatga aacggatggt 13680gcaagattta ctttaaataa tggtgatatt atacacctcc gtccttccgg taatgcccca 13740gaactccgtt gttatgctga agccagtaat gaaaatcagg ctaagcaata tgttacgaaa 13800gtccttggaa acattacctc tttgatttct tgatgttata gatttatcta cgtttatatg 13860cgtgcgtagg tttggttaca agtagatgcc gatataaagg aagattaacg atattcgttg 13920tattagtact acacacattc gtgcaacttg agataacatc tcaatcatat tcaagtcgcg 13980catacatcgc gctgaacacc ccctgacagg agtaaacaat gtcaaagcaa cagatcggcg 14040tcgtcggtat ggcagtgatg gggcgcaacc ttgcgctgaa catcgaaagc cgtggttata 14100ccgtctctat tttcaaccgt tcccgtgaaa aaacggaaga agtgattgcc gagaacccag 14160gcaagaaact ggttccttac tacacggtga aagagtttgt tgaatctctg gaaacgcctc 14220gtcgcatcct gttaatggtg aaagcaggtg caggcacgga tgctgctatt gattccctga 14280aaccatacct cgataaaggt gacatcatca ttgatggtgg taataccttc ttccaggaca 14340ccattcgtcg taaccgtgag ctttctgcag aaggctttaa cttcatcggt accggtgttt 14400ccggtggtga agaaggcgcg ctgaaaggtc cttcaatcat gcctggcggc cagaaagaag 14460cctatgaact ggttgccccg atcctgacta aaatcgccgc tgtggccgaa gatggcgaac 14520cgtgcgtaac ctatattggt gccgatggcg caggccatta tgtgaagatg gttcacaacg 14580gtattgaata cggagatatg caactcattg ctgaagccta ttctctgctt aaaggtggcc 14640tgaacctctc caatgaagaa ctggcgcaga cctttaccga gtggaataac ggtgaactga 14700
gcagctacct aatcgacatt accaaagaca tcttcactaa aaaagatgaa gacggtaact 14760acctggttga tgtgattctg gatgaagcgg ctaacaaagg taccggtaaa tggaccagcc 14820agagcgcgct ggatctcggt gaaccgctgt cgctgattac cgagtctgtg tttgctcgtt 14880atatctcttc tctgaaagag cagcgcgttg ccgcgtctaa agttctctct ggcccgaaag 14940cacagccagc aggcgacaag actgaattca tcgaaaaagt tcgtcgtgcg ctgtatctgg 15000gcaaaatcgt ttcttacgct cagggcttct ctcagctgcg tgctgcgtct gaagagtaca 15060actgggatct gaattacggc gaaatcgcga agattttccg tgctggttgc atcatccgtg 15120cgcagttcct gcagaaaatc actgatgcat atgccgaaaa tccgcagatc gctaacctgc 15180tgctggctcc gtactttaaa caaatcgccg gtgactacca gcaggcgctg cgcgatgtcg 15240tcgcttatgc agtacagaac ggtatcccgg ttccgacctt cgccgctgcg gttgcctatt 15300acgacagcta ccgtgctgca gtactgcctg cgaacttgat ccaggcacag cgcgactatg 15360acgattgtag ctgcaga 15377表1大腸桿菌041的O抗原基因簇中wzx基因、wzy基因及其中的引物及PCR數(shù)據(jù)產(chǎn)生正PCR的基 基因的 正向引物位置反向引物位置PCR產(chǎn)物確大小退火溫功能因 堿基位置 長度 電泳帶度的組數(shù)(℃)wzx O-抗原1114-2433 1805-1822 2393-2410 605bp 0 60轉(zhuǎn)運(yùn)酶1510-1527 2106-2123 613bp 0 58wzy O-抗原4649-5845 5012-5029 5406-5389 377bp 0 58聚合酶5272-5289 5645-5662 390bp 0 60表2 166種血清型的大腸桿菌和43株志賀氏菌及它們的來源組號 該組中含有的菌株 來源1、野生型大腸桿菌O1,O2,O5,O7,O8,O9,O12,O13,O14,O15,O16,O17,O18,IMVSaO19ab,O20,O21,O22,O23,O242、野生型大腸桿菌O4,O10,O25,O26,O27,O28,O29,O30,O32,O33,O34,O35,IMVSaO36,O37,O38,O40,O41,O42,O433、野生型大腸桿菌O6,O44,O45,O46,O48,O49,O50,O51,O52,O54,O55,O56,IMVSaO57,O58,O60,O61,O62,O534、野生型大腸桿菌O63,O65,O66,O69,O70,O71,O74,O75,O76,O77,O78,IMVSaO79,O80,O81,O82,O83,O68
5、野生型大腸桿菌O84,O85,O86,O87,O88,O89,O90,O91,O92,O98,O99,IMVSaO101,O102,O103,O104,O105,O106,O97,6、野生型大腸桿菌O107,O108,O109,O110,O111,O112ab,O112ac,O113, IMVSaO115,O116,O118,O120,O123,O125,O126,O128,O1177、野生型大腸桿菌O129,O130,O131,O132,O133,O134,O135,O41,O137, IMVSaO138,O139,O141,O142,O143,O144,O145,O1408、野生型大腸桿菌O146,O147,O148,O150,O152,O154,O156,O157,O158, IMVSaO159,O160,O161,O163,O164,O165,O166,O153 b9、野生型大腸桿菌O168,O169,O170,O171,O172,O173, c痢疾志賀氏菌 D1,D2,D3,D4,D5,D6,D7,D8,D9,D10,D11,D12,D13 d10、鮑氏志賀氏菌 B1,B2,B3,B4,B6,B7,B8,B9,B10,B11,B12,B13,B14,B15, dB16,B17,B1811、福氏志賀氏菌 F1a,F(xiàn)1b,F(xiàn)2a,F(xiàn)2b,F(xiàn)3,F(xiàn)4a,F(xiàn)4b,F(xiàn)5(v4),F(xiàn)5(v7),F(xiàn)6, dDS,DR12、野生型大腸桿菌 O3,O11,O39,O59,O64,O73,O96,O95,O100,O114,O151,O155,IMVSaO124,O167,O162,O121,O127,O149,O11913、野生型大腸桿菌 去除大腸桿菌O41的第2組菌為了檢測的方便,每12-19個(gè)菌分為一組,總共12組,第13組作為陰性對照a.Institude of Medical and Veterinary Science(IMVS),Anelaide,Australiab.Statens Serum Institut,Copenhagen,Denmarkc.O172和O173來自于Statens Serum Institut,Copenhagen,Denmark,其余來自于IMVSd.中國預(yù)防醫(yī)學(xué)科學(xué)院流行病學(xué)研究所表3是大腸桿菌O41的O-抗原基因簇的結(jié)構(gòu)表 galFwzxorf2 orf3wzy orf5 orf6 gmdfcl gmmmanC orf11manBgnd1kb___表4是大腸桿菌O41的O-抗原基因簇中的基因的位置表ATTGTGGCTG CAGGGATCAA AGAAATCCTC CTGGTAACTC ATGCGTCCAA GAACGCGGTC 60GAAAACCACT TCGATACCTC TTATGAATTA GAATCTCTCC TTGAAATGCG CGTTAAGCGC120CAGCTGCTGG CGGAAGTACA ATCTATTTGC CCACCTGGTG TGACCATTAT GAACGTGCGT180CAGGGCGAAC CTTTAGGTTT AGGCCACTCC ATTTTGTGCG CCAGACCTGC CATTGGCGAC240AACCCATTTG TAGTGGTGCT ACCAGACGTT GTTATCGACG ACGCCAGCGC TGACCCGCTG300CGCTACAACC TTGCTGCCAT GATTGCGCGT TTCAACGAAA CGGGCCGCAG CCAGGTTCTG360GCAAAACGTA TGCCGGGTGA CCTCTCTGAG TACTCCGTCA TCCAGACGAA AGAACCGCTA420GATCGTGAAG GTAAAGTCAG CCGCATTGTT GAATTTATCG AAAAACCGGA TCAGCCGCAG480ACCCTGGATT CAGACATTAT GGCCGTTGGT CGCTATGTGC TTTCTGCAGA TATTTGGCCG540GAACTTGAAC GCACTCAGCC AGGTGCATGG GGACGTATTC AGCTGACTGA TGCCATTGCC600GAACTGGCGA AAAAACAGTC TGTTGATGCC ATGCTGATGA CAGGTGACAG CTATGACTGC660GGTAAAAAAA TGGGTTATAT GCAGGCATTT GTGAAGTATG GACTACGCAA CCTGAAAGAA720GGGGCGAAGT TCCGTAAAGG GATTGAGAAG CTGTTAAGCG AATAATGAAA ATCTGACCGG780ATGTAACGGT TGATAAGGAA ATTATAACGG CAGTGAAGAT TCGTGGCGAA AGTAATTTGT840TGCGAATATT CCTGCCGTTG TTTTATATAA ACAATCAGAA TAACAACGAG TTAGCAATAG900GATTTTAGTC AAAGTTTTCC AGGATTTTCC TTGTTTCCAG AGCGGATTGG TAAGACAATT960AGCGTTTGAA TTTTTCGGGT TTAGCGCGAG TAGGTAACGC TCGTAACATC GTAGACATGC1020ATGCAGTGCT CTGGTAGCTG TTAAGCCAGG GGCGGTAGCG TGTGAAATAT TAATCAATAA1080orf1的起始GAAAAACAGA CGAATAATTT GGCCTGAAAT TTTATGCATA TTAAATTAAA TAAAAATATA 1140
TCAGAAGTAT TATCTTTCTC TTCCATTGAA AAAATAGCTA AAAATAGTGG GTGGCTATTA1200ATGGAAAGAT GTACTAGATT AACACTAGGT TTATTAGTTA GTACATGGAT CGCTCGTTAT1260TTGGGGCCGG ATCAGTACGG AGTTTTGTCT TATGTAATAG CATTTATCGC GTTCTTCCAA1320GCTATCCTTC CTTTAGGAAT GGATGGTATA ATAGTCCGAG ATATCTCAAA AAATGAGAAA1380GACTCTGGTG CTATACTTGG AACTATAATT ATTACACGAT TCACACTTGG ATTAATATTA1440TGGTTTGCAA TCATAATTTT AACGACTATT ATATACTCAC TAAAAAGTGA ATATACATTA1500TTAAGTGCCA TAATCGGAGC ATCACTTATA TTTCAAGCCG CAGACACAAT AGATTTGTGG1560TTCCAAAGTC AAAGTCAAAG TAAAAGAACA GTAGTGGCAA AGTTGCTTGC TTACATATCT1620GTAAATTTAC TTAAGATAGG AATGCTTATT TTTAAATGCC CCCTATATGC TTTTGCAATT1680GCAACACTCC TTGAATTTAT CTTTTCTTCC ATTGGGCTAA TCATTGCTTT TACGCGTTTT1740CGTCCAACTG TTAAATTGGC CTTTTCATCT TTAATTATCA AGAAATTTTT AGGTGAGTCA1800TGGCCATTTC TTATTAGTAG TATCGCAATA ATAATTTATA TGCGAATTGA CCAAATGTTT1860ATCAAGTACT ATTTGCCTCT AAATGATTTG GGAATATACT CAGCAATGTT ACCACTTGCT1920ACGCTTTGGT CATTTATTCC TATGACTCTA AGCATCAGTG TATCTCCTTT TCTTACTAAA1980GCAAAAATGG AAAGCGAAGA AAAATATCAG AAAATATTGT GTTTTACATT CAAGTTATTT2040TCAATGTTAG GATGGTTAAT TTGTATTCCA GTGTGTGTCT TTTCTGATTA TATAGTTTCT2100CTACTTTATG GTCCGCAATA TCAAACAGGT GCTGTAGTCT TATCAATATT AATATTCACT2160AACTTATTTA TATACCAAGG GGTGGCGCAG TCATTATGGA TTATTAATGA GCGAAAAGGG2220AAATTAAGTT TATTGAAAAC AATATTAGGC GCAATTGTAT GTATAGTTGC TAATTTAATA2280TTAATTCCGA AATATGGCAT TATTGGTGCA GCTATATCAG CAGTATTGGC GCAGTTTACA2340TCAGCTATAA TGGCAAATAT TGTAATGGCA CCAAGAATAT TAATATTACA GATACAAAGC2400orf1的終止orf2的開始CTGTTGTTTA TACCGTTGAG AAAGGTTAATTAATGGAATC TAAAGTAAGT GTGTATGCTC2460CTGTAATCCT ATTTGTTTAT GCTAGATATG AACATACAAA AAAAACAATT GAAGCGTTAG2520CAGATAATTA TTATGCAACT GAGACGGAAC TTATCATTTA TTCTGATTAT TGGCATGATG2580AAAATGATAA AGAAAATGTT AATAAAGTCA GAAGGTATAT TAAAAGTATA AAAGGATTTA2640AATCAATTAC AATAATTGAG AGGGAGACTA ATTATGGCTT GGCAAAAAAT ATTATCGAGG2700GAGTGACAGA TGTCTGTAAC AAGTACGAAC GAGTGATTAT TTTAGAAGAT GACTTGTTAA2760CATCGAGATT TTTTTTAAAG TACATGAATC ACGCATTGGA AAAATATGAG TTAAATGAAG2820AAGTATGGCA TATAAGCGGT TGGAATTATC CAATTGATTT TAACTCCAAT AAAGCCTCAT2880TTTTATGGAG AGTGATGAAC TGTTGGGGGT GGGCGACGTG GTCAAACCGA TGGCGTTATT2940TTGAAAAAAA ACCTTCACAA ATAATAAGTG AATGGGATGC TGAAAAAATC AAAGCATTCA3000ATTTAGATGG TTATCATGAT TTTTTTGAAC AAATAATAAT GAATTATGAA GGCAGAAAAA3060ATACCTGGGC AATTTTTTGG TATGCCACAA TATTTATTAA TAATGGTCTG TGTTTAAACC3120CGATAAACAC ATATGTCAAA AATATAGGAT ATGATGGCTC AGGTCAAAAC TGTGGTGTTA3180AAGATATTTA TAAGAGTAAG GTGTCACAAT TTTATATTGA TTCGTTTCCT GACATACTGG3240AAGAGAATGA ATTGGCCGTT AAAGAAATAA AAAAATTTTT CAAAAAACAA GAGCCTTCTG3300TTTTTAGAAA AATCGCAAGA GAAATCCGAA ACTACTTAAT GACATTATGC AAAATAAAAT3360orf1的終止 orf3的起始GAACTGGTAA GTTATGAAAA TCCTAATATT ATCACACTCT GACATCTCTG GTGGGGCATC 3420AATAGCAGCT TATAGACTCC ACACCGCATT GCTGAAAAAT AATATTTATT CTAGAATGAT3480GGTAAGGGTA AAGAAGACTG ATGACTTTAC AGTTATTGGT CCTAAAGGGA GCGTTCAAAA3540AATTTTGAAT AAAATCCGCT CACCGCTTGG TAATTGTATC AATGGATTAT TAAAAACAAA3600AAAAACAGGT TTTATAAGCG GAAATTGGAT GCCATCTGGA TGGGCGGAAA AAATTAATAA3660AATGGATATT GATATTGTTC ATCTTCATTG GGTTGGGGCA GAAACATTAT CAATTGAGGA3720TATTGGTAGA ATAAATAAAC CAGTTATTTG GACTTTGCAT GATATGTGGC CATTTTGCGG3780GATTGAACAT TATGCCCCAG ATCTTTTAGA AAGTAGATGG CGTAATAATT ATGAAAATCA3840TTCATTCTCT TCATTTATTG ATTTAGATTT CATTGTATGG AAAAGAAAAA AAAATTCATG3900GAATAATAAT ATTAGTATTG TTTCTCCAAG TACTTGGTTA TACGATTGTG CAAAACATAG3960CAGTTTATTT GAAAATAATA AACATGTTCT AATTCCAAAT GCACTTGATC TTTCAGTTTT4020TAAGCCATTA GATAAGAGTT ATTGTCGAGA GATTTTAAAT ATAGACAATG ATAAGAAAAT4080AATTCTTTTT GGTGCGTTTG GCGGAGGAAC TGACAAGCGC AAAGGGTATG ATTTGTTAGT4140TAAAGCATTA GAATTAATCG CTAAGGACAG TAACACCTTC AAAATTCAAT GCTTAGTCTT4200TGGACAAAGT ACGCCAGAAG AAAAAATTGA TCTTCCCATC GATATAAAAT GGTTAGGCCA4260TATATATGAT AATACAACAT TATCTTTAAT TTATAACTCA GCGAATGTAA TGGTTGTTCC4320ATCAAGACAA GATAATTTGC CACAAACTGC TACAGAAGCA CAAGCTTGTG GTTGCCCTGT4380CGTGGCATTT GATTGCACTG GATTTCCAGA TATAATCACA CACAAGGAAA CAGGGTATCT4440AGCTAAACCA TACGATTTTG TAGATTTAGC TAGGGGGATA TTATGGGTTC TAAATAATAA4500AGATGTGGAA ATTAATCTAA GCAGTAATGC AGTACATAAA GCTCATAAAA TCTGGTCAGA4560
AGATCAAGTA GTTTCTGAAT ATATAGCTCT ATACCAAAAT ATTATTAATG AGAAAACTCG 4620Orf3的終止 orf4的起始GAATGTTTAATTATAGGGCG GATTACATGT GAGTAAACTT AAATCCAAGT ATATAAGAAA 4680TAACTATGCC AGACCTGGTA ATGATATAGT TGCTTCTATA ATTTCATTAT GCGTGATTAT 4740TACACTACAT CCTTTAATTT CTTTAGTACT TCTGTCACTA ATAAACATTT TCACGCGTCT 4800AAGTAATAAG ATATGCTATC TTTACTGCTT AGTATATTCA ATACTTATTG TAAATAGAGA 4860ATATCTGATT GAGTTTAATG AGCGTAGTGG TGATGATACT TTTCGATATA TCCCATTTAT 4920AAAAAATATA GCAACATTTT CATTTGATAA AGCATTAACT GCAGAATCTG ATATATTCAG 4980CATTGAGCCA TTAAGTCGAG CATATTGGTG GTTGCTATCA GTTTTAGGAG TTAATATCAA 5040TGTGATATTA TTGCTTCAAG TCTTTTGTTG GACAACTTGT TTGATGGTTT TAGCTATAAA 5100AATAAGTGAA AGATATGCAA TGATTATTCT ATGCATAGGC ATTTGCTTTT TTTCATATAC 5160AATTCCATAC ACTTTCTTTC ATTTATTTAG GCAGGCATGG GGACTATCAT TCTTTATTCT 5220ATATTTGTGC AATTGGGATA AGCCGGGTAG ATTTGCATTT ATTCTATTAG CCGGATTGAG 5280TCATTTGATG TTTATTCCAT TATTGATTTT TATGGAAATA TCAAGAAAAG GGATATTAAT 5340ATTAACATCT AAATATTTTC CGTTATTGGC TGCTATCTTC CTGATTGCAT TATATTTAAC 5400ATATAATGCA TTGCTAACAA AAATTGGAAT GTATTCTGAA GGTGAAAACA TAAACTATTC 5460ACCATTTAAA TCTTTAATTT ATTCTCTCTT TTTCTTTTCT TTACTGATGC TTTATAACAA 5520ATATGAGGAA AAAATATTTC ATCTTTCGAA TATTAAATTC AATATAAGTC TCACATTAAT 5580TTCCTTTTAT TTGTTTGGTC TTTATATTCC GTTAGCAGAT ATTGTTAATC GATATATTTT 5640ATTGCTATCA CCGCTTGTTA TTATGTTTCT TACCATTACT AAAAGCAGAT TTCTTTTATT 5700GTTATTTTTG TTAGCTGCAT TAATTAAATT GTCGATCCAT TTGTTCGATG TAGATGGTAA 5760TATATATCAG TTCACAATGA GGGGTTATCT TGATTTTTAT AATGTAATGG ATGCGTTGTA 5820Orf5的起始Orf4的終止TTTTTATTTA GAGAGAAAAA TATGAAACCA TTAATAACCG TGATAACGGT TGTCTACAAC 5880GATAGTAAAG GTTTAACAAA AACTATAAAT TCACTCAAGC TACAAACTAA TTTAACAAAT 5940GTTGAGTTTA TTGTTGTAGA TGGCAACTCG AGTGATTCGA CAATTGAAAT AATAAAAAGT 6000TCTAAAGTTA TAACAAAGTA TATCATTGAA GATGATCATG GTATATATGA TGCCATGAAT 6060AAAGGAATTG ATTTGGCTAC AGGTAATTGG ATACTATTTT TGAATGCAGG AGATGTTTTC 6120TATAATGATG ATGTTTTACG TAAATTAAAT GATACTATAA TGAATCTTCA CGAGAGCATT 6180AATTTTATTT ATAGTGATTA TCTTTCTGGT GGGGTTATTT ATAAGCAGTT CCTTAGTTTA 6240GATTTTTTAG CGTCACATAT GATTAATCAT CAAAATATTG TTTATAAGAC TGAACTTCTC 6300AAAGATAAAG GGTATAGCAC AAAATATAAA TTTTGCTCAG ATTATAAACA CATATTGGAT 6360AATTATTTTA TTATTAATCC TTATAAGACT GGCTATATTA TAGCAGCATT CGATAATACA 6420GGAGTTAGTT CACAGGTTGT TAATAAGTAT AAAATGTGGT TGGAGAGATT AAATGCTGTG 6480TGGTCATCAA AATTATCACT GCAAGCAAAG ATAAAATTAA GTAAAAGAGG TTGGGTAGCC 6540Orf6的起始Orf5的終止TTACCTTATC AATTCATAAG ATTTGTCATC ATAAAAATGA GAATGCTATG AATTATAATG 6600TTGAGTTGTT TATTGGTGTA TGCGTAACTT ACGATGATTT TAATAAATAT AAGCTACAAC 6660TTCTTTCTTC TTTAAAAAAT CTATATAACT CATTTGCTGG GGATTGTAGT GTTTATATTG 6720TTATTCAAAG TGAACGTTGT TCTTTTGATT ATCGTTACTC ATATCCAACG GATTGGATCG 6780AATTTTATGA AACAGATTAT TTTGGAATAT CAAATGCAAG AAACTTATGC ATAGAAGCTT 6840GTTTAAGAAA AAATGCGAAA TTTATTATCT TTCATGATGC ATCAATTTAT TGGACAAAGT 6900CTGCAGCAGA GTTTATTCAC AGGTTTAGAA ATAACATCGA GACACCGCGA ATCAACCTCT 6960TGTTTGATAA AAACTACCAT ATGCAACATG AATTTAATCA TCCTTTAGAC ATTCAAAATA 7020TTCGTATAGA AAAATGCAAT CCAATTTATA ACTCATATGT TGGTGGTTTT CTATTTAGAG 7080TTAGTAAAAT AAAGGAATTA AGATTTCATC TTGGCTTTGG TCCGGGTAAA TACACGAAAT 7140GTAAAAGTGG TGAGGATGTT TTATTTTTAT TCGAGTATTT TGAACGACAG AATATTACCC 7200TCTACCCTAT AAATAGAAAA ATTGCAGTTA TACATCCACC AAGGCCATCT GATTATTCAA 7260AGCATTTGTT ATATGCATAT GGTCAAGGGG CATTATTTAG ATTTTTAGTT CATAAATATA 7320AACGAATGAG TCTATTTTAT GATTTGATAC TTTTTTTTGG GAATGCACTT GTTAGATGTT 7380TGCTTTTTAA AAAAAAATCA TTTCAAATTT TATATAATAG ATTAAAAGGT TTTATTGGAG 7440Orf6的終止Orf7的起始TATAATATGA AAAAAGCATT AATTACAGGC ATTACTGGTC AAGATGGTTC CTACTTGGCA 7500GAATTCCTTC TTGATAAAGG GTATGAAGTG CATGGCATTA AACGTCGTGC ATCTTCGTTT 7560AACACAGAAC GTGTTGATCA TATTTATCAA GATCGCCACA ACCAAAATCC AAATTTCTTT 7620CTTCATTATG GTGACTTAAC AGATTCATCA AACTTAATAC GTCTCATCAA AGAAATCCAA 7680CCAGACGAAG TTTATAACCT TGGCGCTCAG TCTCATGTGG CTGTTTCATT CGAATCACCT 7740GAATATACTG CTGATGTGGA TGCGATGGGG ACTTTACGTC TGCTGGAAGC GATTCGTATT 7800TGTGGGCTAG AGAAAAAAAC ACGTTTCTAT CAGGCATCAA CTTCTGAACT CTTTGGCTTA 7860
GTTCAGGAAA TCCCACAGCG AGAAACAACA CCATTCTACC CTCGTTCGCC TTATGCTGTT 7920GCGAAGATGT ATGCATACTG GATTACTGTA AACTATCGTG AATCCTATGG AATGTACGCC 7980TGTAACGGTA TTCTTTTCAA CCATGAATCC CCGCGTCGTG GTGAAACATT CGTAACACGT 8040AAAATCACGC GTGCTATTGC AAATATTTCG CAGGGAATCG AAAAATGTCT CTATCTTGGC 8100AATATGGATT CACTGCGCGA CTGGGGACAT GCGAAAGATT ACGTGCGTAT GCGGTGGATG 8160ATGTTGCAAC AAGATCACCC AGAGGATTTT GTAATTGCAA CAGGCAAACA AATTTCCGTA 8220CGTGAATTTG TTCGTATGTC AGCTAAAGAA GTAGGCCTGG AGTTAGAATT CTCCGGACAA 8280GGTGTTGATG AAATAGCAAC TGTTGTGAAT AAAACATCTG ACTGTGCTAT TGGTGTTAGT 8340ATTGGGGATG TAATCGTTCG TGTTGATCCG CGTTATTTCC GTCCTGCAGA AGTTGAAACT 8400CTTCTTGGTG ATCCAGCAAA AGCCAAAAAA GTATTGGGTT GGGAACCAGA GATTACAGTT 8460GAAGAGATGT GTGCAGAAAT GGTTGCCAGT GATCTGGCGA AAGCAAAACA GCATGCACTT 8520Orf7的終止Orf8的起始CTGAAAAGCC ATGGTTACGA TGTTGCAGTT TCTCTGGAGC GGTAAGGTAT GACAAAGAAA 8580CGTATCTACG TTGCTGGTCA CCGAGGTATG GTTGGCTCTG CTATTTGCCG TCAATTATCA 8640CTGCGTGATG ATATCGAATT AGTGGTCAAA ACACACAAAG AACTCGATCT AACCGTACAG 8700AAAGATGTTG ATGCATTTTT TGAGCAAGAG AAAATTGATC AGGTTTATCT TGCTGCGGCT 8760AAAGTTGGTG GTATTTATGC CAACAATACA TTTCCGGCAG AATTCATCTA TCAGAATCTC 8820ATGATTGAGA GCAATATTAT TCATTCAGCT CACAAGGCCG GAATTCAAAA ATTACTTTTT 8880TTAGGCTCAA GCTGTATTTA TCCTAAGTTT GCAGAGCAGC CGATGAACGA GTCTGAACTT 8940TTAACGGGCA TACTTGAGCC AACTAATGAG CCATACGCAA TTGCTAAAAT TGCGGGTATA 9000AAATTATGTG AATCTTATAA CCGGCAATAT GGCCGTGATT ATCGCAGTGT AATGCCTACT 9060AATCTTTATG GCATAAATGA TAATTTTCAT CCTGAAAACT CTCATGTTAT TCCGGCACTC 9120ATGCGTAGAT TCCATGAAGC AAAAGAGAGT GGTGCACCAG AGGTTGTTGT TTGGGGAACC 9180GGAACACCGA TGCGTGAGTT TTTATATGTT GATGATATGG CTGCCGCATC TGTTCATGTA 9240ATGGAACTTG ATGAAGCAAT TTATCAACAA AATACTCAGC CTATGTTATC TCATATTAAT 9300GTTGGTACGG GTGTGGATTG TTCTATACGT GAAATGGCTG AAACAATGGC CTCTGTGGTG 9360GGTTATCAAG GTAAAATTGT TTTTGATGCT ACCAAACCTG ATGGCACTCC GCGTAAACTT 9420ATGGACGTTA CCCGGCTCAA AAACCTGGGC TGGCAATATC GCTATAATTT GCATGAAGGC 9480Orf8的終止Orf9的起始TTATCATTAA CATATAAATG GTTTATTGAG AATATTAATT CTTTTCGGGG ATAGTTATGA 9540ACAAGAGATT GGAATGTGAG TTATTTAAAA CAATAGTTGA GCATACTCCT CTAATCTCGA 9600TTGATCTCAT AATTAGAAAC GATAAAGGAG AGGCGCTGCT TGGGCAGCGC CTGAATCGCC 9660CAGCACAAAA TTATTGGTTT GTGCCTGGAG GGCGAATTTA TAAGGATGAG TCATTCGAGG 9720TTGCATTTAA TCGGATAACA TTTGAAGAGT TGGGCGTTCA AATTAGTCTT AATGACGCCT 9780TATTTCTTGG GGTGTATGAA CATTTCTACA ATGATAATTT TTCTGAAGCA GAATTTTCTA 9840CACACTATGT AGTGCATGGA TATGAAATCC AACTTAATCC TCAGCAACTT CACCTACCAA 9900CGGTCCAGCA TAATTCCTAC AAGTGGTTTG ATGTAGTAAC GTTGCTTAAT AGCACTATAG 9960Orf9的終止Orf10的起始TTCATCAATA TACCAAAAAT TATTTTATAC CAAGGTAATA GATATGCTAC TTCCGTTGT 10020CATGGCCGGT GGTTCTGGTA CCAGATTATG GCCTCTTTCA CGTACACTTT ATCCGAAACA10080ATTTCTGTCT TTAAATAGTC GTTTAACCAT GTTGCAAGAG ACATTGCGGC GGCTTGACAA10140GGTCGAACAT AAACCCGCTT TGGTCATTTG TAACGAATCA CATCGCTTTA TCGTTGCTGA10200ACAATTGCGT AAAGAGGGTT TAAAGCATAG CGGTATTTTG CTTGAGCCTG TTGGTCGTAA10260TACTGCGCCT GCTGTAGCAC TCGCAGCACT TCAGGCTATG GTAACTGGAG ATGACCCTAT10320TCTGTTGGTT CTTGCTGCAG ATCATGAAAT CCAGGATGAG GATAATTTCA TTGCTGCAGT10380TCTTGCTGCC AAGAATTTTG CAGAGCAGGG TAAGCTTGTT ACATTTGGTA TTGTTCCAAC10440ATCCCCAGAG ACTGGCTATG GTTACATTAA GTCAGGTGAA TCTCTGGATG AACAAGGTTA10500TAAAGTTGCA GCTTTTGTTG AAAAACCAGA TCTTCACGTG GCTCAGCGGT ACATATCAGA10560AGGCGGTTAT CTTTGGAATA GTGGGATGTT TATGTTCAGA GCGTCTGTAT TTATCGATGA10620ACTGAAAAAA TTCCGACCAG ATATTTTAGC CAGTTGCCAA CGCTCCCTGT CCTCTTCGAT10680ACAAGATTTA GATTTTATCC GCCTGGATAA CGCTTCATTT TCTTGCTGTC CTGAAGAGTC10740TATTGACTAT GCCGTTATGG AAAAAACAGC CGAAGCTGTC GTCGTTCCAT TAAATGCGCA10800ATGGAGTGAT GTCGGGTCAT GGTCTGCATT GTGGGAAATA AGTTCAAAAG ACCAAAGCGG10860CAATGCCATT CGTGGTGATG TATTGGTTGA AGATGCTACA GATAGTTATC TTTATTCGCA10920GCATAGACTT ATTGGTGCCG TGGGCGTAAA GGATTTGGTT GTTGTTGAAA CGAAAGATGC10980AGTATTAGTT GCTCATAAAG ATAAAGTTCA GCAAGTTAAA AATATCGTCG CTCAACTAAA11040AAAGAATAAT CGAACAGAAT ATTTACAGCA TCGGGAAATT TATCGACCTT GGGGCAGTCA11100TGATACTATA GCTGAAGGGG AACGATTCCA GGTAAAGCAT GTGATTGTAT TACCTGGACA11160TATTACTGCT AAACAGATCC ATTACCATCG CACTGAGCAT TGGGTAGTTG TATCGGGGAC11220
AGCTAAAGTT CATCTTGAGG ATAAGACTTA CCTTGTCTCT GAAAATGAAT CAACATATAT11280ACCTGTTGGT GTTCCACATG CTATTGAAAA TCCTGGCAAG ATCCCGCTCG AAATAATTGA11340GGTTAGATCG GGAGTCTATC TGGAAGAGGA TGATGTTATA AGAGTGTTCT TCTCTGGAGT11400Orf10的終止Orf11的起始CGGATACTAATGAGAATTTC GATTATTACA GCCACTTATA ATAGTGAAAA AACCCTCCTT 11460GATACATTAC TTTCTCTAGA AAAGCAAACA CATCCAGATA TCGAATATAT AGTTATAGAT11520GGAGCATCAA AAGATAATAC AATCAAACTA ATCAAAAGTA ATTGTACAAG AGTTTCAAAA11580ATCATTTGCG AACCCGATAA TGGCATTTAT GATGCGCTAA ATAAAGGAAT TCAAGCCGCT11640TCGGGTGATG TCATTGGTTT TTTACATTCT GATGACTTAC TTGCTTATGA TGATGTTATT11700GCAGATATAG CAAAAACATT TGAAAGTTCA GGATGTGATG CTGTTTATGG CGATTTGGAG11760TATGTTGCCC AAAATGATAC GACTAAACGT ATTAGATTAT GGAAAAGTGG CTCATTCAGT11820CGTTTGAAGA TGAAACTGGG TTGGATGCCG CCACACCCAT CATTTTATAT GAAACGTGAT11880Orf11的終止TGTTATGGTC AGTTTGGTTG TTTTTCATTA GATATATCGA ATATCTGCTG ATTATGATTC 11940ATTGTTACGT TATATTTTAA AACAACGCAT TTCAATAGCG TATTTACCGC AAGTATTAGT12000GAAGATGCGT GTTGGTGGAA TTAGCAATCG TTCATTATCT TCCATGGTCA ACAAGTCGAT12060GGAGGATATT CGTGTTATGA AACAGAATGG TATTTTCTGG CCAATAGCTT TAGCGTATAA12120Orf12的起始AAATCTATCC AAACTTCCTC AATTCATTAA AAAGTAATTA TCATGTTAAA TGCTAAAAAA 12180ATCATTACCG ATAGCAATAT TGCTTTCGGA ACTAGTGGGG CGCGTGGTCT CGTTGTCGAT12240TTTACCCATG ATGTTTGTGC TGCGTTCACT CATGCGTTTC TTTCTGTTAT TGATGATAAA12300TACAATCTTA ATAAAGTTGC CTTAGCAATT GATAACCGGC CAAGCAGTTA CGAAATTGCT12360CAGGCATGCG CCTTAGCTAT CAAACAACAT GGGTTCACTG TCGAATATCA TGGTGTAATT12420CCTACTCCTG CATTAGCTCA TTATTCTATG CAGAAAAACA TTCCCTGTAT AATGGTCACT12480GGGAGCCATA TACCTTTTGA TCGTAATGGT TTGAAATTCT ACAGACCAGA TGGCGAAATC12540ACAAAAGAGG ATGAACTAGC AATAGTAAAT AGTGAATATG TCTTTTCTCC TGTAGATGTA12600TTACCTCATC TTGAACTAAG CACTCAAGGA GCGGATTGCT ATCTTAAACG TTATGTTTCT12660CTTTTTAATT CCGATATTTT GAAAGGAAAA AAAATAGGGA TATATGAACA TTCTAGTGCA12720GGACGAGATT TATATGCTCC TCTTTTTAAT CAATTGGGCG CTGAGGTCAT TTCCCTTGGC12780AGAAGTGATG AATTCGTCCC TATTGACACT GAAGCAGTAA GTGATGAAGA TCGTATACTT12840GCAAGAGAGT GGTCTAAAAA ATATAATCTT GATGCTATTT TCTCTACAGA TGGCGATGGT12900GATCGTCCCT TAGTTGCCGA TGAAAATGGT GAATGGCTAA GAGGCGATAT TCTGGGATTA12960CTTACTGCTA TTGAACTTAA TATCAAGGCG TTGGCTATTC CAGTCAGTTG TAATACTGCA13020ATTGAACAAT CTAACAAATT TGCAAGTGTA CAACGGACGA AAATAGGCTC TCCTTATGTG13080ATTGCAGCGT TTGCGGATCT TGCTAAGCAA TTTGATTCAG TCGCTGGTTT TGAAGCTAAT13140GGTGGTTTTC TGCTTGCCTC CGATTTACAA ATAAATGGCA AGGAATTAAA TTCATTACCT13200ACACGAGATG CTGTGTTACC AGCATTAATG CTCTTAATAG CTTCACGCAA CAGTACCATC13260TCTCAACTGG TTAATAATCT TCCACAGCGA TTCACTTGGT CAGATAGGGT TAAAGATGTC13320CCTTCAGAGT CAAGTCAACA TATTATAAAA AATGCCATAT TGTCACCCAA TAATTTCTTT13380AATAGCTTAG GATATGAATC ATTATCCTGT TCCGCTATTG ATGAAACGGA TGGTGCAAGA13440TTTACTTTAA ATAATGGTGA TATTATACAC CTCCGTCCTT CCGGTAATGC CCCAGAACTC13500CGTTGTTATG CTGAAGCCAG TAATGAAAAT CAGGCTAAGC AATATGTTAC GAAAGTCCTT13560Orf12的終止GGAAACATTA CCTCTTTGAT TTCTTGAATT ATAAAAAATG CCATATTGTC ACCCAATAAT 13620TTCTTTAATA GCTTAGGATA TGAATCATTA TCCTGTTCCG CTATTGATGA AACGGATGGT13680GCAAGATTTA CTTTAAATAA TGGTGATATT ATACACCTCC GTCCTTCCGG TAATGCCCCA13740GAACTCCGTT GTTATGCTGA AGCCAGTAAT GAAAATCAGG CTAAGCAATA TGTTACGAAA13800GTCCTTGGAA ACATTACCTC TTTGATTTCT TGATGTTATA GATTTATCTA CGTTTATATG13860CGTGCGTAGG TTTGGTTACA AGTAGATGCC GATATAAAGG AAGATTAACG ATATTCGTTG13920TATTAGTACT ACACACATTC GTGCAACTTG AGATAACATC TCAATCATAT TCAAGTCGCG13980CATACATCGC GCTGAACACC CCCTGACAGG AGTAAACAAT GTCAAAGCAA CAGATCGGCG14040TCGTCGGTAT GGCAGTGATG GGGCGCAACC TTGCGCTGAA CATCGAAAGC CGTGGTTATA14100CCGTCTCTAT TTTCAACCGT TCCCGTGAAA AAACGGAAGA AGTGATTGCC GAGAACCCAG14160GCAAGAAACT GGTTCCTTAC TACACGGTGA AAGAGTTTGT TGAATCTCTG GAAACGCCTC14220GTCGCATCCT GTTAATGGTG AAAGCAGGTG CAGGCACGGA TGCTGCTATT GATTCCCTGA14280AACCATACCT CGATAAAGGT GACATCATCA TTGATGGTGG TAATACCTTC TTCCAGGACA14340CCATTCGTCG TAACCGTGAG CTTTCTGCAG AAGGCTTTAA CTTCATCGGT ACCGGTGTTT14400CCGGTGGTGA AGAAGGCGCG CTGAAAGGTC CTTCAATCAT GCCTGGCGGC CAGAAAGAAG14460CCTATGAACT GGTTGCCCCG ATCCTGACTA AAATCGCCGC TGTGGCCGAA GATGGCGAAC14520
CGTGCGTAAC CTATATTGGT GCCGATGGCG CAGGCCATTA TGTGAAGATG GTTCACAACG14580GTATTGAATA CGGAGATATG CAACTCATTG CTGAAGCCTA TTCTCTGCTT AAAGGTGGCC14640TGAACCTCTC CAATGAAGAA CTGGCGCAGA CCTTTACCGA GTGGAATAAC GGTGAACTGA14700GCAGCTACCT AATCGACATT ACCAAAGACA TCTTCACTAA AAAAGATGAA GACGGTAACT14760ACCTGGTTGA TGTGATTCTG GATGAAGCGG CTAACAAAGG TACCGGTAAA TGGACCAGCC14820AGAGCGCGCT GGATCTCGGT GAACCGCTGT CGCTGATTAC CGAGTCTGTG TTTGCTCGTT14880ATATCTCTTC TCTGAAAGAG CAGCGCGTTG CCGCGTCTAA AGTTCTCTCT GGCCCGAAAG14940CACAGCCAGC AGGCGACAAG ACTGAATTCA TCGAAAAAGT TCGTCGTGCG CTGTATCTGG1500QGCAAAATCGT TTCTTACGCT CAGGGCTTCT CTCAGCTGCG TGCTGCGTCT GAAGAGTACA15060ACTGGGATCT GAATTACGGC GAAATCGCGA AGATTTTCCG TGCTGGTTGC ATCATCCGTG15120CGCAGTTCCT GCAGAAAATC ACTGATGCAT ATGCCGAAAA TCCGCAGATC GCTAACCTGC15180TGCTGGCTCC GTACTTTAAA CAAATCGCCG GTGACTACCA GCAGGCGCTG CGCGATGTCG15240TCGCTTATGC AGTACAGAAC GGTATCCCGG TTCCGACCTT CGCCGCTGCG GTTGCCTATT15300ACGACAGCTA CCGTGCTGCA GTACTGCCTG CGAACTTGAT CCAGGCACAG CGCGACTATG15360ACGATTGTAG CTGCAGA 15377以上僅是本發(fā)明較佳實(shí)施例,并非對本發(fā)明作任何限制,凡依本發(fā)明技術(shù)實(shí)質(zhì)對以上實(shí)施例作修改、等同變化與修飾,均屬本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
1.一種對大腸桿菌O41的O-抗原特異的核苷酸,其特征在于,其是如SEQ ID NO1所示的分離的核苷酸,全長15377個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。
2.按照權(quán)利要求1所述的對大腸桿菌O41的O-抗原特異的核苷酸,其特征在于,其包括命名為wzx,orf2,orf3,wzy,orf5,orf6,gmd,fcl,gmm,manC,orf11,manB的12個(gè)基因組成,都位于galF基因和gnd基因之間。
3.按照權(quán)利要求2所述的對大腸桿菌O41的O-抗原特異的核苷酸,其特征在于,所述基因中具有高度特異性的基因包括轉(zhuǎn)運(yùn)酶基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因,包括wzy基因或與wzy有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf2、orf3、orf5、orf6基因。其中所述的轉(zhuǎn)運(yùn)酶基因是SEQ ID NO1中的1114至2433堿基的核苷酸;所述的聚合酶基因是SEQ ID NO1中的4649至5845堿基的核苷酸;所述的orf2基因是SEQ ID NO1中的2433至3362堿基的核苷酸;orf3基因是SEQ ID NO1中的3374至4630堿基的核苷酸;orf5基因是SEQ ID NO1中的5842至6591堿基的核苷酸;orf6基因是SEQ ID NO1中的6588至7445堿基的核苷酸。
4.按照權(quán)利要求1或2所述的對大腸桿菌O41的O-抗原特異的核苷酸,其特征在于,其還包括源于所述的wzx基因或wzy基因中的寡核苷酸或糖基轉(zhuǎn)移酶基因;以及它們的混合或它們的重組。
5.按照權(quán)利要求4所述的對大腸桿菌O41的O-抗原高度特異的核苷酸,其特征在于,所述的源于wzx基因的寡核苷酸對是SEQ ID NO1中的1805至1822堿基的核苷酸和2393至2410堿基的核苷酸,SEQ ID NO1中的1510至1527堿基的核苷酸和2106至2123堿基的核苷酸;所述的源于wzy基因的寡核苷酸對是SEQ ID NO1中的5012至5029堿基的核苷酸和5406至5389堿基的核苷酸,SEQ ID NO1中的5272至5289堿基的核苷酸和5645至5662堿基的核苷酸。
6.權(quán)利要求1所述的對大腸桿菌O41型的O-抗原特異的核苷酸在檢測表達(dá)O-抗原的細(xì)菌、鑒定細(xì)菌的O-抗原和細(xì)菌的其它多糖抗原中的應(yīng)用。
7.權(quán)利要求1所述的對大腸桿菌O41型的O-抗原特異的核苷酸的重組分子,在通過插入表達(dá)而提供表達(dá)大腸桿菌O41型的O-抗原,以及制備細(xì)菌疫苗中的應(yīng)用。
8.按照權(quán)利要求1所述的對大腸桿菌O41型的O-抗原特異的核苷酸的應(yīng)用,其特征在于,它作為引物用于PCR、作為探針用于雜交反應(yīng)與熒光檢測、或者用于制造基因芯片或微陣列,供檢測細(xì)菌。
9.權(quán)利要求1所述的對大腸桿菌O41型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在培養(yǎng)基中培養(yǎng)大腸桿菌O41型,離心收集細(xì)胞;得到的基因組DNA通過瓊脂糖凝膠電泳檢測;(2)通過PCR擴(kuò)增大腸桿菌O41型中的O-抗原基因簇以大腸桿菌O41型的基因組為模板通過Long PCR擴(kuò)增其O-抗原基因簇,將得到的PCR產(chǎn)物,用瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性,合并該long PCR產(chǎn)物,并用DNA純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫將Long PCR純化產(chǎn)物應(yīng)用鳥槍法構(gòu)建O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1kb以上的克隆用實(shí)驗(yàn)室常用的DNA自動(dòng)測序儀對克隆中的插入片段進(jìn)行測序,序列達(dá)到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析應(yīng)用生物信息學(xué)軟件拼接和編輯所有的序列,從而得到大腸桿菌O41型的O-抗原基因簇的核苷酸全長序列;(6)特異基因的篩選針對大腸桿菌O41型的O-抗原基因簇中的wzx、wzy、基因設(shè)計(jì)引物;在每個(gè)基因內(nèi)各設(shè)計(jì)了兩對引物,每對引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進(jìn)行PCR,確定wzx、wzy基因?qū)Υ竽c桿菌O41型的O-抗原的高度特異性;(7)引物靈敏度的檢測培養(yǎng)大腸桿菌O41,細(xì)菌計(jì)數(shù)后分別將5×103,5×102,5×101,5個(gè)和0個(gè)活菌加入到一定量的某種待檢測物中,混入細(xì)菌的待檢測物作為檢測用樣品,將樣品加入LB培養(yǎng)基,取一些與樣品混合過的LB培養(yǎng)基過濾,將過濾液進(jìn)行培養(yǎng),從培養(yǎng)好的菌液中取數(shù)毫升處理后作為PCR模板用寡核苷酸進(jìn)行PCR反應(yīng),檢測其對大腸桿菌O41的靈敏度。
10.權(quán)利要求9所述的對大腸桿菌O41的O-抗原特異的核苷酸的分離和鑒定方法,其特征在于,包括下述步驟(1)基因組的提取在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O41,離心收集細(xì)胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細(xì)胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時(shí),再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清液,再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)的溶液抽提兩次,取上清液再用等體積的乙醚抽提以除去殘余的酚,上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中,基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴(kuò)增大腸桿菌O41中的O-抗原基因簇以大腸桿菌O41的基因組為模板通過Long PCR擴(kuò)增其O-抗原基因簇;首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇上游的galF基因設(shè)計(jì)上游引物(5’-ATT GTG GCT GCA GGG ATC AAAGAA ATC-3’),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計(jì)下游引物(5’-TAG TCGCGC TGN GCC TGG ATT AAG TTC GC-3’)。用Boehringer Mannheim公司的ExpandLong Template PCR方法擴(kuò)增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘,然后94℃變性10秒,60℃退火30秒,68℃延伸15分鐘,這樣進(jìn)行30個(gè)循環(huán);最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性;合并6管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫;反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進(jìn)行;酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng);合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(2 5∶24∶1)溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中;隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃反應(yīng)30分鐘,將酶切產(chǎn)物補(bǔ)成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴(kuò)大為80ul,70℃反應(yīng)20分鐘,使DNA的3′端加dA尾。此混合物經(jīng)等體積氯仿∶異戊醇(24∶1)溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接24小時(shí),總體積為90ul,其中有9ul的10×buffer和25單位的T4DNA連接酶;最后用1/10體積的3MNaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物;用Bio-Rad公司的電轉(zhuǎn)化感受態(tài)細(xì)胞的制備方法制備感受態(tài)大腸桿菌DH5α細(xì)胞,取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時(shí)間為5.0毫秒-6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上37℃過夜培養(yǎng),次日得到藍(lán)白菌落,將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時(shí)從每個(gè)克隆中提取質(zhì)粒并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構(gòu)成了大腸桿菌O41的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1000bp以上的100個(gè)克隆由上海生物工程有限公司用ABI377型DNA自動(dòng)測序儀對克隆中的插入片段單向進(jìn)行測序,使序列達(dá)到80%的覆蓋率,再通過將相聯(lián)系的序列進(jìn)行反向測序及測通得到剩余20%的序列,從而獲得O-抗原基因簇的所有序列。(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical ResearchCouncil)分子生物學(xué)實(shí)驗(yàn)室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O41的O-抗原基因簇的核苷酸全長序列,序列的質(zhì)量主要由兩個(gè)方面來保證1)對大腸桿菌O41的基因組作6個(gè)Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫。2)對每個(gè)堿基,保證3個(gè)以上高質(zhì)量的覆蓋率;在得到大腸桿菌O41的O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心(The National Center forBiotechnology Information,NCBI)的orffinder發(fā)現(xiàn)基因,找到12個(gè)開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對,最后得到大腸桿菌O41的O-抗原基因簇的結(jié)構(gòu);(6)特異基因篩選針對大腸桿菌O41的O-抗原基因簇中wzx和wzy基因設(shè)計(jì)引物;在每個(gè)基因內(nèi)各設(shè)計(jì)兩對引物,每對引物分布在相應(yīng)基因內(nèi)不同地方以確保其特異性;用這些引物以166種血清型的大腸桿菌和43株志賀氏菌基因組為模板進(jìn)行PCR,所有引物在大腸桿菌O41中得到陽性結(jié)果,在其他組中沒有擴(kuò)增到任何大小正確的帶,也就是,在大多數(shù)組中沒有得到任何PCR產(chǎn)物帶,雖在少數(shù)組中得到PCR產(chǎn)物帶,但其大小不符合預(yù)期大小,所以wzx、wzy基因?qū)Υ竽c桿菌O41及其O-抗原都是高度特異的。(7)引物靈敏度的檢測將大腸桿菌O41的凍存菌液接種到有LB培養(yǎng)基的三角瓶中,30℃-40℃培養(yǎng),180至250轉(zhuǎn)/分,培養(yǎng)數(shù)小時(shí)至飽和,取培養(yǎng)好的菌液稀釋,取稀釋菌液涂布LB瓊脂平板,30℃至40℃,培養(yǎng)數(shù)小時(shí)計(jì)數(shù),計(jì)算原液中活菌濃度;在5份重量均為20g的生豬肉餡中分別摻入5×103,5×102,5×101,5個(gè)和0個(gè)活菌,攪拌均勻,加入LB培養(yǎng)基,過濾,過濾液于30℃-40℃培養(yǎng),180至250轉(zhuǎn)/分,培養(yǎng)數(shù)小時(shí);從培養(yǎng)好的菌液中取數(shù)ml于6,000g離心數(shù)分鐘,去上清,加MQ超純水吹開沉淀并混勻,放入100℃沸水中煮數(shù)分鐘,裂解液于12,000g離心數(shù)分鐘,取上清做為PCR模板;用4對寡核苷酸對,SEQ ID NO1中的1805至1822堿基的核苷酸和2393至2410堿基的核苷酸,SEQ ID NO1中的1510至1527堿基的核苷酸和2106至2123堿基的核苷酸,SEQ ID NO1中的5012至5029堿基的核苷酸和5406至5389堿基的核苷酸,SEQ ID NO1中的5272至5289堿基的核苷酸和5645至5662堿基的核苷酸進(jìn)行PCR反應(yīng),PCR反應(yīng)體系如下MQ15.7μl,Mg2+2.5μl,Buffer2.5μl,dNTP1μl,Taq酶0.3μl,P11μl,P21μl,模板DNA1μl。PCR反應(yīng)條件為95℃5′,95℃30″,56℃45″,72℃1′,72℃5′,共30個(gè)循環(huán);反應(yīng)結(jié)束后,取10μl反應(yīng)產(chǎn)物電泳,若有與預(yù)期大小相符的擴(kuò)增帶,則結(jié)果為陽性,若沒有,則結(jié)果為陰性;參入了5×103,5×102,5×101,和5個(gè)活菌的每份豬肉餡均在4對引物的PCR反應(yīng)中得到陽性結(jié)果;參入0個(gè)活菌的豬肉餡在4對引物的PCR反應(yīng)中得到陰性結(jié)果;說明使用上述方法時(shí),這4對引物對豬肉餡中的大腸桿菌O41的檢測靈敏度均為0.25個(gè)菌/g。
全文摘要
本發(fā)明提供一種對大腸桿菌O41(Escherichia coliO41)的O-抗原特異的核苷酸,它是大腸桿菌O41中控制O-抗原合成的基因簇的核苷酸全序列,如SEQ ID NO1所示的分離的核苷酸,全長15377個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸;還包括源于大腸桿菌O41的O-抗原基因簇中的寡糖單位處理基因(包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因)的寡核苷酸;本發(fā)明通過PCR證實(shí)寡核苷酸對大腸桿菌O41的O-抗原都有高度的特異性;本發(fā)明還公開了用本發(fā)明的寡核苷酸檢測和鑒定人體及環(huán)境中的大腸桿菌O41的方法。
文檔編號C12P19/34GK1563042SQ20041001902
公開日2005年1月12日 申請日期2004年4月19日 優(yōu)先權(quán)日2004年4月19日
發(fā)明者王磊, 楊靜華, 馮露 申請人:天津生物芯片技術(shù)有限責(zé)任公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
丰都县| 阜城县| 郸城县| 荔浦县| 怀宁县| 东兴市| 临澧县| 息烽县| 静宁县| 准格尔旗| 泗水县| 汉川市| 姚安县| 曲松县| 丹东市| 通州市| 曲周县| 昌都县| 萝北县| 旅游| 盐池县| 尼玛县| 闻喜县| 洛隆县| 读书| 防城港市| 兰州市| 侯马市| 新沂市| 焦作市| 菏泽市| 孝感市| 巴东县| 舞钢市| 盐城市| 临西县| 永州市| 宁海县| 满城县| 呼和浩特市| 海盐县|