專利名稱:對大腸桿菌o71型的o-抗原特異的核苷酸的制作方法
技術領域:
本發(fā)明涉及大腸桿菌O71型(Escherichia coli O71)中控制O-抗原合成的基因簇的核苷酸全序列,特別是涉及大腸桿菌O71型中控制O-抗原合成的基因簇中的寡核苷酸,可利用這些對O-抗原特異的寡核苷酸快速、準確地檢測人體及環(huán)境中的大腸桿菌O71型并鑒定這些致病菌中的O-抗原。
背景技術:
O-抗原是革蘭氏陰性細菌脂多糖中的O特異性多糖成分,它由許多重復的寡糖單位組成。O-抗原的合成過程研究得較清楚先由糖基轉移酶將核苷二磷酸單糖轉移到一個固定在細胞內膜的脂分子上,然后在內膜的內側合成寡糖單位,O-抗原的寡糖單位再通過轉運酶被轉移到內膜外側,而后通過聚合酶聚合成多糖,再被連接到一個糖脂分子上形成脂多糖分子[Whitfield,C.(1995)“Biosynthesis of lipopolysaccharide O antigens”.Trends inMicrobiology.3178-185;Schnaitman,C.A.and J.D.Klena.(1993)“Genetics oflipopolysaccharide biosynthesis in entericbacteria”.MicrobiologicalReviews,57(3)655-682]。編碼負責O-抗原合成的所有酶分子的基因一般在染色體上相鄰排列,形成一個基因簇[Reeves,P.R.,et al.(1935)“Bacterialpolysaccharide synthesis and gene nomenclature”Trends in Microbiology,4495-503]。在志賀氏菌、大腸桿菌和沙門氏菌中,O-抗原基因簇位于galF和gnd基因之間[Lei Wang.et al(2001)“Sequence analysis of four Shigella boydii O-antigenlociimplication for Escherichia coli and Shigella relationships”.Infection andImmunity,116923-6930;Lei Wang and Peter Reeves(2000)“The Escherichia coliO111 and Salmonella enterica O71 gene clustersgene clusters encoding the samecolitose-containing O antigen are highly conserved”.Journal ofBacteriology.1825256-5261]。O-抗原基因簇含有三類基因糖合成路徑基因,糖基轉移酶基因,寡糖單位處理基因,其中糖合成路徑基因編碼的酶合成O-抗原所需的核苷二磷酸單糖;糖基轉移酶基因編碼的酶將核苷二磷酸單糖及其它分子轉到單糖上從而使單糖聚合成寡糖單位;寡糖單位處理基因包括轉運酶基因和聚合酶基因,它們將寡糖單位轉移到細菌內膜外側,再聚合成多糖。糖基轉移酶基因和寡糖單位處理基因只存在于攜帶這些基因的基因簇里。O-抗原中單糖的不同,單糖間聯結鍵的不同和寡糖單位之間聯結鍵的不同構成了O-抗原的多樣性,而單糖的組成、單糖間的聯結鍵及寡糖單位之間的聯結鍵是由O-抗原基因簇中的基因控制著,所以O-抗原基因簇決定了O-抗原的合成,也決定了O-抗原的多樣性。
因為O-抗原是極強的抗原,是大腸桿菌重要的致病因素之一,同時它又具有極強的多樣性,這啟示我們能研究一種快速、準確地檢測大腸桿菌及其O-抗原的特異性好、靈敏度高的方法。以表面多糖為目標的血清學免疫反應自上世紀30年代以來一直被用于對細菌的分型和鑒定,是鑒定致病菌的唯一的手段。這種診斷方法需要大量的抗血清,而抗血清一般種類不全,數量不足,大量的抗血清在制備和儲存中也存在一些困難。另一方面此法耗時長、靈敏度低、漏檢率高、準確性差,所以,現在普遍認為這種傳統(tǒng)的血清學檢測方法將為現代分子生物學方法取代。1993年,Luk,J.M.C et.al用沙門氏菌(S.enterica)O-抗原基因簇的特異核苷酸序列通過PCR方法鑒定了沙門氏菌的O-抗原[Luk,J.M.C.et.al.(1993)“Selective amplification of abequose andparatose synthase genes(rfb)by polymerase chain reaction for identification ofS.enterica major serogroups(A,B,C2,andD)”,J.Clin.Microbiol.312118-2123]。Luk,et.al的方法是將相應于沙門氏菌血清型E1,D1,A,B和C2的O-抗原內的CDP-阿比可糖和CDP-泰威糖的合成基因的核苷酸序列排列后得到對不同血清型的沙門氏菌特異的寡核苷酸。1935年,Paton,A.W et.al用對E.coli O111的O-抗原特異的源于wbdI基因的寡核苷酸鑒定了一株產毒素的E.coli O111的血清型[“Molecular microbiological investigation of an outbreak of Hemolytic-Uremic Syndrome caused by dry fermented sausage contaminated with Shiga-liketoxin producing Escherichia coli”.J.Clin.Microbiol.341622-1627],但是后來的研究表明Paton,A.W et.al的用源于wbdI基因的寡核苷酸鑒定E.coli O111的血清型的方法有假陽性結果出現。Bastin D.A.and Reeves,P.R.認為,這是由于wbdI基因是一個推測的糖合成路徑基因[Bastin D.A.andReeves,P.R.(1995)Sequence and analysis of the O antigen gene(rfb)cluster ofEscherichia coli O111.Gene 16417-23],而在其它細菌的O-抗原的結構中也可能有這個糖,所以糖合成路徑基因對于O-抗原并不是高度特異的志賀氏菌有46種血清型,但只有33種不同的O-抗原,大腸桿菌有166種不同的O-抗原[Reeves,P.R(1992)“Variation in O antigens,niche specificselection and bacterial populations”.FEMS Microbiol.Lett,100509-516],二者親緣關系非常近,并且有12種是大腸桿菌和志賀氏菌共有的[Ewing,W.H.(1986)“Edwards and Ewing’s identification of the Enterobacteriaceae”.Elsevier SciencePublishers,Amsterdam,The Netherlands;T.cheasty,et al.(1983)“Antigenicrelationships between the enteroinvasive Escherichia coli antigensO28ac,O112ac,O124,O136,O143,O144,O152 and and Shigella O antigens”J.clinMicrobiol,17(4)681-684]發(fā)明內容本發(fā)明的目的是提供了一種對大腸桿菌O71型的O-抗原特異的核苷酸。它是大腸桿菌O71型的O-抗原基因簇中的核苷酸,是源于糖基轉移酶基因和轉運酶基因及聚合酶基因的特異的核苷酸。
本發(fā)明的次一目的是提供了大腸桿菌O71型的O-抗原基因簇的全長核苷酸序列。
本發(fā)明的另一目的是提供了構成大腸桿菌O71型的O-抗原基因簇的基因轉運酶的基因即wzx基因或與wzx有相似功能的基因;聚合酶基因即wzy基因或與wzy有相似功能的基因;鼠李糖合成酶基因,包括rmlBDAC基因或與rmlBDAC有相似功能的基因;一種稀有單糖合成酶基因,包括orf6和orf7或與orf6和orf7有相似功能的基因;乙?;D移酶基因orf12或與乙?;D移酶有相似功能的基因;糖基轉移酶基因,包括orf4、orf11基因;一個未知功能的基因orf9。
本發(fā)明的又一目的是提供了寡核苷酸,它們分別源于編碼轉運酶的基因即wzx基因或與wzx有相似功能的基因它們是上述基因內的寡核苷酸,長度在10-20nt;它們對大腸桿菌O71型的O-抗原是特異的;尤其是表1中列出的寡核苷酸,它們對大腸桿菌O71型的O-抗原是高度特異的,而且這些寡核苷酸還可重新組合,組合后的寡核苷酸對大腸桿菌O71型的O-抗原也是高度特異的。
本發(fā)明的再一目的是提供的上述寡核苷酸可作為引物用于核酸擴增反應,或者作為探針用于雜交反應,或者用于制造基因芯片或微陣列,從而通過這些方法檢測和鑒定大腸桿菌O71型的O-抗原及檢測和鑒定大腸桿菌O71型。
本發(fā)明的還一目的是提供了分離大腸桿菌O71型的O-抗原基因簇的全序列的方法。按照本方法操作可以獲得其他細菌的O-抗原基因簇的全序列,也可以獲得編碼其他多糖抗原的細菌的基因簇的全序列。
本發(fā)明的目的是由以下技術方案實現的。
本發(fā)明對大腸桿菌O71型的O-抗原特異的核苷酸,其是如SEQ ID NO1所示的分離的核苷酸,全長13743個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。
前述的對大腸桿菌O71型的O-抗原特異的核苷酸,其由12個基因組成,都位于galF基因和gnd基因之間。
前述的對大腸桿菌O71型的O-抗原特異的核苷酸,其中所述的基因是wzx是SEQ ID NO1中的6987至8261堿基的核苷酸;wzy是SEQ ID NO1中的9666至10955堿基的核苷酸;rmlBDAC分別是SEQ ID NO1中的1137至2222,2222至3121,3179至4051,4925至5473堿基的核苷酸;orf4是SEQ ID NO1中的4078至4887堿基的核苷酸;orf6是SEQ ID NO1中的5466至5864堿基的核苷酸;orf7是SEQ ID NO1中的5884至6990堿基的核苷酸;orf9是SEQ ID NO1中的8248至9666堿基的核苷酸;orf11是SEQ ID NO1中的10948至11775堿基的核苷酸;orf712是SEQ ID NO1中的11778至12248堿基的核苷酸。
前述的對大腸桿菌O71型的O-抗原特異的核苷酸,其中它是源于所述的wzx基因、wzy基因以及它們的混合或它們的重組。
前述的對大腸桿菌O71型的O-抗原特異的核苷酸,其中所述的源于wzx基因的寡核苷酸對是SEQ ID NO1中的7515至7533堿基的核苷酸和7839至7859堿基的核苷酸;SEQ ID NO1中的7139至7157堿基的核苷酸和8051至8069堿基的核苷酸。源于wzy基因的寡核苷酸對是SEQIDNO1中的10332至10350堿基的核苷酸和10581至10609堿基的核苷酸;SEQ ID NO1中的9981至9999堿基的核苷酸和10670至10688堿基的核苷酸。
前述的對大腸桿菌O71型的O-抗原特異的核苷酸在檢測表達O-抗原的細菌、在診斷中鑒定細菌的O-抗原和細菌的其它多糖抗原的應用。
前述的對大腸桿菌O71型的O-抗原特異的核苷酸的重組分子,而且通過插入表達可提供表達大腸桿菌O71型的O-抗原,并成為細菌疫苗。
前述的對大腸桿菌O71型的O-抗原特異的核苷酸的應用,其中它作為引物用于PCR、作為探針用于雜交反應與熒光檢測、或者用于制造基因芯片或微陣列,檢測人體和環(huán)境中的細菌。
前述的對大腸桿菌O71型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O71型,離心收集細胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃溫育30分鐘,加等體積酚抽提混合物,取上清液再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提兩次,取上清液再用等體積的乙醚抽提以除去殘余的酚。上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,將DNA重懸于30ul TE中;基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴增大腸桿菌O71型中的O-抗原基因簇以大腸桿菌O71型的基因組為模板通過Long PCR擴增其O-抗原基因簇,首先根據經常發(fā)現于O-抗原基因簇啟動子區(qū)的JumpStart序列設計上游引物(#1523-ATT GTGGCT GCA GGG ATC AAA GAA AT),再根據O-抗原基因簇下游的gnd基因設計下游引物(#1524-TAG TCG CGT GNG CCT GGA TTA AGT TCG C);用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應程序如下在94℃預變性2分鐘;然后94℃變性10秒,60℃退火15秒,68℃延伸15分鐘,這樣進行30個循環(huán),最后,在68℃繼續(xù)延伸7分鐘,得到PCR產物,用0.8%的瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性,合并5管longPCR產物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產物;(3)構建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構建O-抗原基因簇文庫,反應體系是300ng PCR純化產物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應在室溫中進行,酶切10分鐘使DNA片段大小集中在1.5kb-3kb之間,而后加入2ul 0.1M EDTA終止反應。合并4管同樣的反應體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中,隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mMDTT和5單位的T4DNA聚合酶,11℃30分鐘,將酶切產物補成平端,75℃終止反應后,加入5單位的Tth DNA聚合酶及其相應的緩沖液并將體系擴大為80ul,70℃反應20分鐘,使DNA的3′端加dA尾。此混合物經等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接10小時,總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶,最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產物;用Bi0-Rad公司的電轉化感受態(tài)細胞的制備方法制備感受態(tài)大腸桿菌DH5α細胞,取2-3ul連接產物與50ul感受態(tài)大腸桿菌DH5α混合后,轉到Bi0-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒至6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上,在37℃過夜培養(yǎng),次日得到藍白菌落,將得到的白色菌落即白色克隆轉到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時從每個克隆中提取質粒,并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構成了大腸桿菌O71型的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1kb以上的96個克隆用本實驗室ABI3730型DNA自動測序儀對克隆中的插入片段進行測序,序列達到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O71型的O-抗原基因簇的核苷酸全長序列;序列的質量主要由兩個方面來保證1)對大腸桿菌O71型的基因組作5個Long PCR反應,然后混合這些產物以產生文庫,2)對每個堿基,保證3個以上高質量的覆蓋率,在得到大腸桿菌O71型O-抗原基因簇的核苷酸序列后,用美國國家生物技術信息學中心(The National Center forBiotechnology Information,NCBI)的orffinder發(fā)現基因,找到12個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質序列間的精確比對,最后得到大腸桿菌O71型的O-抗原基因簇的結構;(6)特異基因篩選針對痢大腸桿菌O71型的O-抗原基因簇中的wzx、wzy基因設計引物;在每個基因內各設計了兩對引物,每對引物分布在相應基因內的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,除在第13組中得到了預期大小的一條帶外,在其他組中都沒有擴增到任何產物,所以wzx、wzy基因對大腸桿菌O71型的O-抗原都是高度特異的。
也就是,本發(fā)明的第一個方面,提供了大腸桿菌O71型的O-抗原基因簇的全長核苷酸序列,它的全序列如SEQ ID NO1所示,全長13743個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。通過本發(fā)明的方法得到了大腸桿菌O71型的O-抗原基因簇的結構,如表3所示,它總共由12個基因組成,都位于galF基因和gnd基因之間。
本發(fā)明的第二個方面,提供了大腸桿菌O71型的O-抗原基因簇中的基因,即轉運酶基因(wzx基因或與wzx有相似功能的基因);聚合酶基因(wzy基因或與wzy有相似功能的基因);鼠李糖合成酶基因(rmlBDAC基因或與rmlBDAC有相似功能的基因);一種單糖合成酶基因(orf6,7基因和orf6,7基因有相似功能的基因);一種未知功能基因;糖基轉移酶基因(orf4、orf11基因);細菌多糖抗原中特殊的糖合成路徑基因,包括orf6,7,12基因。它們在O-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在表4中;本發(fā)明尤其涉及到糖基轉移酶基因、轉運酶基因和聚合酶基因,因為糖合成路徑基因即合成核苷二磷酸單糖的基因現在被預示對較多胞外多糖是常見的、共同的,對細菌的O-抗原并不是很特異的,而本發(fā)明涉及到的糖基轉移酶基因、轉運酶基因和聚合酶基因對大腸桿菌O71型的O-抗原是高度特異的。
本發(fā)明的第三個方面,提供了源于大腸桿菌O71型的O-抗原基因簇中的wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因寡核苷酸,鼠李糖合成沒基因(rmlBDAC基因或與rmlBDAC有相似功能的基因);一種單糖合成酶基因(orf6,7基因和orf6,7基因有相似功能的基因);一種未知功能基因;糖基轉移酶基因(orf4、orf11基因);細菌多糖抗原中特殊的糖合成路徑基因,包括orf6,7,12基因它們是這些基因中的任何一段寡核苷酸。但是,優(yōu)先被用的是列于表1中的寡核苷酸對,在表1中也列出了這些寡核苷酸對在O-抗原基因簇中的位置及以這些寡核苷酸對為引物所做的PCR反應的產物的大小,這些PCR反應可用表中的退火溫度進行。這些引物除在第13組中得到了預期大小的一條帶外,在其他組中都沒有擴增到任何產物,所以wzx、wzy基因對大腸桿菌O71型的O-抗原都是高度特異的。
所述的對大腸桿菌O71型的O-抗原特異的核苷酸的分離方法包括下述步驟1)基因組的提??;2)PCR擴增大腸桿菌O71型中的O-抗原基因簇;3)構建O-抗原基因簇文庫;4)對文庫中的克隆測序;5)核苷酸序列的拼接及分析;6)特異基因的篩選。
本發(fā)明的其他方面由于本文的技術的公開,對本領域的技術人員而言是顯而易見的。
如本發(fā)明所用,“寡核苷酸”主要指來源于O-抗原基因簇中的編碼糖基轉移酶的基因、編碼轉運酶的基因和編碼聚合酶的基因內的一段核苷酸分子,它們在長度上可改變,一般在10到20個核苷酸范圍內改變;更確切說這些寡核苷酸是源于wzx基因(核苷酸位置是SEQ ID NO1中的6987至8261堿基的核苷酸);wzy基因(核苷酸位置是從wzy是SEQ ID NO1中的9666至10955堿基的核苷酸)源于以上基因內的寡核苷酸對大腸桿菌O71型是高度特異的。
此外,有時兩個遺傳相似的編碼不同O-抗原的基因簇通過基因重組或突變產生新的O-抗原,從而產生新的細菌類型,新的突變株。在這種環(huán)境中,需要篩選出多對寡核苷酸同重組基因雜交以提高檢測的特異性。因此,本發(fā)明提供了一整套多對寡核苷酸的混合物,它們源于糖基轉移酶基因;源于轉運酶和聚合酶基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。這些基因的混合物對一個特殊的細菌多糖抗原來說是特異的,從而使這套寡核苷酸對這個細菌的多糖抗原是特異的。更具體地說,這些寡核苷酸的混合物是源于糖基轉移酶基因、wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因中的寡核苷酸的組合。
在另一方面,本發(fā)明涉及寡核苷酸的鑒定,它們可以用于檢測表達O-抗原的細菌和在診斷中鑒定細菌的O-抗原。
本發(fā)明涉及到一種檢測食品中的一個或多個細菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉移酶的基因(ii)編碼轉運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交,這些細菌是大腸桿菌O71型??捎肞CR方法檢測,更可以將本發(fā)明方法中的核苷酸標記后作為探針通過雜交反應如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
本發(fā)明設計者考慮到以下情況當單個的特異的寡核苷酸檢測無效時,寡核苷酸的混合物能與靶區(qū)域特異性雜交以檢測樣品。因此本發(fā)明提供了一套寡核苷酸用于本發(fā)明所述的檢測方法。這里所說的寡核苷酸是指源于編碼糖基轉移酶的基因、編碼轉運酶的基因和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的寡核苷酸。這套寡核苷酸對一個特殊的細菌的O-抗原來說是特異的,這一特殊的細菌O-抗原是由大腸桿菌O71型表達的。
另一方面,本發(fā)明涉及到一種檢測排泄物中的一個或多個細菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉移酶的基因(ii)編碼轉運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交。這些細菌是大腸桿菌O71型??捎帽景l(fā)明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發(fā)明中的寡核苷酸分子標記后作為探針通過雜交反應如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
一般一對寡核苷酸可能與同樣的基因雜交也可與不同的基因雜交,但它們中必須有一個寡核苷酸能特異性雜交到特殊抗原型的特異序列上,另一個寡核苷酸可雜交于非特異性區(qū)域。因此,當特殊的多糖抗原基因簇中的寡核苷酸被重新組合時,至少能選出一對寡核苷酸與多糖抗原基因簇中特異基因混合物雜交,或者選出多對寡核苷酸與特異基因的混合物雜交。甚至即使當一個特殊的基因簇中所有基因都獨一無二時,此方法也能應用于識別此基因簇內的基因混合物的核苷酸分子。因此本發(fā)明提供了一整套用于檢測本發(fā)明方法的多對寡核苷酸,在這里多對寡核苷酸是源于編碼糖基轉移酶的基因、編碼轉運酶和聚合酶的基因包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因,這套寡核苷酸對一個特殊的細菌多糖來說是特異的,這套寡核苷酸可能是糖合成中必須基因的核苷酸。
另一方面,本發(fā)明也涉及到一種檢測源于病人的樣品中的一個或多個細菌多糖抗原的方法。樣品中的一個或多個細菌多糖抗原可以使樣品能與以下至少一個基因中的一對寡核苷酸中的一個特異性雜交,這些基因是(i)編碼糖基轉移酶的基因(ii)編碼轉運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與樣品中的至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交,這些細菌是大腸桿菌O71型??捎帽景l(fā)明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發(fā)明中的寡核苷酸標記后作為探針通過雜交反應,或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
更詳細地說,以上描述的方法可以理解為當寡核苷酸對被使用時,其中的一個寡核苷酸分子能雜交到一個并不是來源于糖基轉移酶基因、wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的序列上。此外,當兩個寡核苷酸都能雜交上時,它們可能雜交于同一基因也可能雜交到不同基因上。也即,當交叉反應出現問題時,可選擇寡核苷酸的混合物來檢測混合的基因以提供檢測的特異性。
本發(fā)明者相信本發(fā)明不必限于以上所提的核苷酸序列編碼的特定的O-抗原,而且廣泛應用于檢測所有表達O-抗原和鑒定O-抗原的細菌。而且,由于O-抗原合成和其他多糖抗原(如細菌胞外抗原)合成之間的相似性,本發(fā)明的方法和分子也應用于這些其他的多糖抗原。
本發(fā)明首次公開了大腸桿菌O71型的O-抗原基因簇的全長序列,而且可從這個未被克隆的全長基因簇的序列中產生重組分子,通過插入表達可產生表達大腸桿菌O71型的O-抗原,并成為有用的疫苗。
具體實施例方式
下面結合具體實施例,進一步闡述本發(fā)明。應理解這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件如Sambrook等人,分子克隆實驗室手冊(NewYorkCold Spring Harbor Laboratory Press,1989)中所述的條件。
實施例1基因組的提取在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O71型,離心收集細胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清液再用等體積的酚∶氯仿∶異戊醇抽(25∶24∶1)混合溶液提兩次,取上清液再用等體積的乙醚抽提以除去殘余的酚,上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中?;蚪MDNA通過0.4%的瓊脂糖凝膠電泳檢測。
實施例2通過PCR擴增大腸桿菌O71型中的O-抗原基因簇以大腸桿菌O71型的基因組為模板通過Long PCR擴增其O-抗原基因簇。首先根據經常發(fā)現于O-抗原基因簇啟動子區(qū)的JumpStart序列設計上游引物(#1523-ATT GTG GCT GCA GGG ATC AAA GAA AT),再根據O-抗原基因簇下游的gnd基因設計下游引物(#1524-TAG TCG CGT GNG CCT GGATTA AGT TCG C);用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應程序如下在94℃預變性2分鐘;然后94℃變性10秒,60℃退火15秒,68℃延伸15分鐘,這樣進行30個循環(huán)。最后,在68℃繼續(xù)延伸7分鐘,得到PCR產物,用0.8%的瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性。合并5管long PCR產物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產物。
實施例3構建O-抗原基因簇文庫首先是連接產物的獲得用被修改的Novagen DNaseI shot gun法構建O-抗原基因簇文庫。反應體系是300ng PCR純化產物,0.9ul 0.1M MnCl2,1ul1∶2000稀釋的1mg/ml的DNaseI,反應在室溫中進行。酶切10分鐘使DNA片段大小集中在1.5kb-3kb之間,而后加入2ul 0.1M EDTA終止反應。合并4管同樣的反應體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中。隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mMDTT和5單位的T4DNA聚合酶,11℃30分鐘,將酶切產物補成平端,75℃終止反應后,加入5單位的Tth DNA聚合酶及其相應的緩沖液并將體系擴大為80ul,70℃反應20分鐘,使DNA的3′端加dA尾。此混合物經等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接10小時,總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶。最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產物。
其次是感受態(tài)細胞的制備參照Bio-Rad公司提供的方法制備感受態(tài)細胞大腸桿菌DH5□。取一環(huán)大腸桿菌DH5□單菌落于5ml的LB培養(yǎng)基中,180rpm培養(yǎng)10小時后,取2ml培養(yǎng)物轉接到200ml的LB培養(yǎng)基中,37℃250rpm劇烈振蕩培養(yǎng)到OD600 0.5左右,然后冰浴冷卻20分鐘,于4℃4000rpm離心15分鐘。傾盡上清液,用冷的冰預冷的去離子滅菌水200ml吹散菌體,于4℃4000rpm離心15分鐘。再用冷的冰預冷的去離子滅菌水100ml吹散菌體,于4℃4000rpm離心15分鐘。用冷的冰預冷的10%的甘油懸浮細胞,4℃6000rpm離心10分鐘,棄上清液,最后沉淀用1ml冰預冷的10%的甘油懸浮細胞,即為感受態(tài)細胞。將制得的感受態(tài)細胞分裝為50ul一管,-70℃保存。
最后是電轉化感受態(tài)細胞取2-3ul連接產物與50ul感受態(tài)大腸桿菌DH5□混合后,轉到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒-6.0毫秒。電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復蘇。然后立即將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上37℃倒置過夜培養(yǎng),次日得到藍白菌落。將得到的白色菌落即白色克隆轉到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時從每個克隆中提取質粒并用EcoRI酶切鑒定其中的插入片段的大小,得到白色克隆群構成了大腸桿菌O71型的O-抗原基因簇文庫。
實施例4對文庫中的克隆測序從文庫中挑選插入片段在1kb以上的96個克隆用本實驗室ABI3730型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列。
實施例5核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O71型的O-抗原基因簇的核苷酸全長序列(見序列列表)。序列的質量主要由兩個方面來保證1)對大腸桿菌O71型的基因組作5個LongPCR反應,然后混合這些產物以產生文庫。2)對每個堿基,保證3個以上高質量的覆蓋率。在得到大腸桿菌O71型O-抗原基因簇的核苷酸序列后,用美國國家生物技術信息學中心(The National Center for BiotechnologyInformation,NCBI)的orffinder發(fā)現基因,找到12個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用ClustralW軟件做DNA和蛋白質序列間的精確比對,最后得到大腸桿菌O71型的O-抗原基因簇的結構,如表3所示。
通過檢索和比較,發(fā)現orf1,2,3編碼的蛋白與Shigella boydi抗原基因簇中rmlBDA基因編碼的蛋白有很高的氨基酸序列一致性,通過對Pfam蛋白基序數據庫的搜索,發(fā)現orf1,2,3編碼的蛋白與已知的rmlBDA的共有序列的同源性預期值非常高。rmlBDA負責合成鼠李糖O-抗原中的一種稀有單糖。Orf5和orf4編碼的蛋白與沙門氏菌的rmlC和糖基轉移酶基因編碼的蛋白有較高的相似性。orf6,7編碼的蛋白與Aneurinibacillus thermoaerophilus中合成一種單糖的基因編碼的蛋白有很高的氨基酸序列一致性,orf6,7也應該合成一種單糖,命名為orf6,7。orf12編碼的蛋白與Listonella anguillarum中編碼乙?;D移酶的基因有63%的相同性,推測orf12是乙酰基轉移酶基因,命名為orf12。
Orf8和orf10是大腸桿菌O71種僅有的兩個編碼存在跨膜片段的蛋白的基因。orf1編碼的蛋白與大腸桿菌的O-抗原轉移酶有28%的序列一致性,通過HMMTOP2.0程序分析蛋白的拓撲結構發(fā)現其含有12個均勻的跨膜片段,這是Wzx蛋白的典型特征。所以命名orf8為wzx。Orf10編碼的蛋白與Streptococcus pneumoniaeO-抗原聚合酶有20%的一致性,42%的相似性,通過HMMTOP2.0程序分析蛋白的拓撲結構發(fā)現其含有9個跨膜片段,并且有一個大的(61個氨基酸)胞質內親水環(huán)(loop),這是Wzy蛋白的典型特征。所以命名orf10為wzy。
orf4,11兩個基因編碼的蛋白與其他已知的糖基轉移酶有24-36%的序列一致性和44-53%的序列相似性。通過對Pfam中糖基轉移酶基序數據庫的搜索,這兩個基因編碼的蛋白與已知的糖基轉移酶家族1和2的共有序列的同源性預期值為1×e-12至5×e-17,因此我們推測這兩個基因編碼糖基轉移酶,而且由于每個糖基轉移酶特異性催化形成一種二糖鍵,因此我們推測大腸桿菌O71的O-抗原的寡糖單位可能由三個單糖組成。由于這三個基因的確切功能還不能確定,因此我們將這四個基因暫命名為orf4,orf11。一個未知功能的基因orf9。
實施例6特異基因的篩選針對大腸桿菌O71型的O-抗原基因簇中的wzx、wzy基因設計引物,這些基因在核苷酸序列中的位置見表1。
表1列出了大腸桿菌O71型的O抗原基因簇中糖基轉移酶基因和寡糖單位處理基因及基因內的引物及PCR數據。在表中列出了大腸桿菌O71型的O抗原基因簇的糖基轉移酶基因、轉運酶基因和聚合酶基因及它們的相應的功能和大小。在每個基因內,我們各設計了兩對引物,每對引物分布在相應基因內的不同地方以確保其特異性。在表中還列出了每個引物在SEQ IDNO1中的位置和大小。以每對引物用表中所列的相應的退火溫度以表2中的所有菌的基因組為模板進行PCR,得到了相應的PCR產物,其大小也列于表中。
表2是用于篩選特異基因的166株大腸桿菌和43株志賀氏菌及它們的來源,為了檢測的方便,我們將它們每8-10個菌分為一組,總共13組,它們的來源都列于表中。
在第13組中含有大腸桿菌O71型的基因組DNA作為陽性對照。以每組菌做模板,用表1中的每對引物按如下條件做PCR在95℃預變性5分鐘后,95℃變性30秒,退火時間是30秒,溫度見表1,72℃延伸2分鐘,這樣進行25個循環(huán)。最后在72℃繼續(xù)延伸5分鐘,反應體系是25ul。模板為1∶20稀釋,取1μl。反應完畢后,取10ulPCR產物通過0.8%瓊脂糖凝膠電泳檢測擴增出的片段。
對于wzx、wzy基因,每個基因都有兩對引物被檢測,每對引物除了在第13組中做PCR后得到了預期大小的正確的一條帶外,在其他組中都沒有擴增到任何大小正確的帶,也就是說,在大多數組中沒有得到任何PCR產物帶,所以wzx、wzy基因對大腸桿菌O71型及其O-抗原是高度特異的。
最后,通過PCR從大腸桿菌O71型中篩選到對大腸桿菌O71型的O-抗原高度特異的基因wzx、wzy基因。而這些基因內的任何一段10-20nt的寡核苷酸對大腸桿菌O71型的O-抗原是特異的,尤其是上述每個基因中的引物即寡核苷酸對經PCR檢測后證實對大腸桿菌O71型是高度特異的。所有的這些寡核苷酸都可用于快速準確地檢測人體和環(huán)境中的大腸桿菌O71型,并能鑒定它們的O-抗原。
表3是大腸桿菌O71型的O-抗原基因簇的結構表,在表中列出了大腸桿菌O71型的O-抗原基因簇的結構,共由12個基因組成,每個基因用方框表示,并在方框內寫入基因的名稱,數字表示的是O-抗原基因簇中的開放閱讀框(off)的順序。在O-抗原基因簇的兩端是galF基因和gnd基因,它們不屬于O-抗原基因簇,我們只是用它們的一段序列設計引物來擴增O-抗原基因簇的全長序列。
表4是大腸桿菌O71型的O-抗原基因簇中的基因的位置圖,在圖中列出了大腸桿菌O71型的O-抗原基因簇中的所有開放閱讀框在全序列中的準確位置,在每個開放閱讀框的起始密碼子和終止密碼子的下面劃線。在大腸桿菌中開放閱讀框的起始密碼子有兩個ATG和GTG。
SEQUENCE LISTING<110>南開大學<120>對大腸桿菌O71型的O抗原特異的核苷酸<130>對大腸桿菌O71型的O抗原特異的核苷酸<160>1
<170>PatentIn version 3.2<210>1<211>13743<212>DNA<213>Escherichia coli<400>1attgtggctg cagggatcaa agaaatcctc ctggtaactc acgcgtccaa gaacgcggtc 60gaaaaccact tcgacacctc atatgaatta gaatctctcc ttgagcagcg cgtgaagcgt120caactgcttg cggaagtgca gtccatctgt ccaccgggcg tgaccattat gaacgtgcgt180cagggcgaac ctttaggttt aggccactcc attttgtgtg cacgacccgc cattggtgac240aacccatttg tcgtggtgct gccagacgtt gtgatcgacg atgccagcgc cgacccgcta300cgctacaacc ttgctgccat gattgcgcgc ttcaatgaaa cgggccgtag ccaagtgctg360gcaaaacgta tgccgggtga cctctctgaa tactccgtca tccagaccaa agaaccgctg420gaccgtgaag gcaaagtcag ccgcattgtt gaattcatcg aaaaaccgga tcagccacac480acgctggact cagacatcat ggccgtgggt cgctatgtgc tttctgccga tatttggccg540gaacttgaac gcactcagcc tggtgcatgg gggcgtattc agctgactga tgccattgcc600gaactggcga aaaaacagtc cgttgatgcc atgctgatga caggtgacag ctacgactgc660ggtaaaaaaa tggggtatat gcaggcattt gtgaagtatg gactacgcaa cctcaaagaa720ggggcgaagt tccgtaaagg gattgagaag ctgttaagcg aataatgaaa atctgaccgg780atgtaacggt tgataagaaa attataacgg cagtgaagat tcgtggcgaa agtaatttgt840tgcgaatatt cctgccgtta ttttatataa acaatcagaa taacaacgag ttagcaatag900gattttagtc aaagttttcc aggattttcc ttgtttccag agcggattgg taagacaatt960agcgtttgaa tttttcgggt ttagcgcgag tgggcaacgc tcgtcacatc gtagacatgc 1020atgcagtgct ctggtagctg taaagccagg ggcggtagcg tgcattaata cctctcttaa 1080tcaaactaag agccgctaat ttcacagcat gctctgaagt aatatggaat aaaaaagtga 1140agatacttgt tactggtggc gcaggattta ttggttctgc tgtagttcgt cacattataa 1200ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga aacctggaat 1260cacttgctga tgtttctgat tctgaacgct atgtttttga acatgcggat atttgcgatg 1320ctgctgcaat ggcgcggatt tttgctcagc atcagccgga tgcagtgatg cacctggctg 1380ctgaaagcca tgttgaccgt tcaattacag gtcctgcggc atttattgaa accaatattg 1440ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt gatagcgaca 1500agaaaaatag cttccgtttt catcatattt ctactgacga agtctatggc gatctgcctc 1560atcctgacga agtaaataat aaagaagaat tacccctctt tactgagacg acagcttacg 1620cgccaagcag cccatattct gcttctaaag catccagcga tcatttagtc cgcgcgtgga 1680aacgtaccta tggtttaccg accattgtga ctaactgttc gaataactac ggcccttatc 1740actttccgga aaaattgatt ccgttggtaa ttcttaatgc tctggaaggt aaggcattac 1800ctatttatgg caaaggggat caaattcgtg actggctgta tgttgaagat catgcgcgtg 1860cgttatatac cgtcgtaacc gaaggtaaag cgggtggaac ttataacatt ggtggacaca 1920acgaaaagaa aaacatcgat gtagtgctca ctatttgtga tttgttggat gagattgtac 1980cgaaagagaa atcttaccgc gagcaaatca cttatgttgc cgatcgtccg ggacacgatc 2040gccgttatgc cattgatgct gagaagactg gtcgcgaatt gggatggaaa ccacaggaaa 2100cgtttgagag cgggattcgg aagacagtgg aatggtacct gtccaataca aaatgggttg 2160ttaatgtgaa aagtggtgcc tatcaatcgt ggattgaaca gaactatgag ggccgccagt 2220aatgaatatt ctccttttcg gcaaaacagg gcaggtaggt tgggaactac agcgtgctct 2280ggcacctttg ggtaatttga ttgctcttga tgttcactcc actgattatt gtggtgattt 2340tagtaatcct gaaggtgtgg ctgaaaccgt caaaaaaatt cgccctgatg ttattgttaa 2400
tgctgcggct catactgcag tagataagct gagtcagaac ccgaatttgc acaattactc 2460aatgcgacca gcgttgaatc aattgcaaaa gcggccaatg aaagttgggg cttgggtaat 2520tcattactca actgactacg tatttccggg aaccggtgaa ataccatggc tggagacgga 2580tgcaaccgca ccgctaaatg tttacggtga aaccaagtta gccggagaaa aagcgttaca 2640ggaaaattgc gcgaagcatc ttattttccg taccagctgg gtatacgcag gtaaaggaaa 2700taacttcgcc aaaacgatgt tgcgtctggc aaaagagcgc gaagaactgg ctgtgattaa 2760tgatcaattt ggtgcgccaa caggtgctga gctgctggca gattgtacgg cacatgctat 2820tcgtgtggca ctgaataaac cagaagtcgc aggcttgtat catctggtag ccagtggtac 2880cacaacttgg cacgattatg ctgcgctggt ttttgaagag gcgcgcaaag caggcattcc 2940ccttgcactc aacaagctca acgcaatatc aacaacagcc tatcctacac cagctcgtcg 3000cccacataac tctcgcctta atacagaaaa atttcagcag aactttgcgc ttgtcttgcc 3060tgactggcag gttggcgtga aacgaatgct caacgaatta tttacgacta cagcaattta 3120attgtttttg catcttgttc gtgatgatgg tgcaagatga attaaaagga atgatgaaat 3180gaaaacgcgt aaaggtatta ttttagcggg tggttctggt actcgtcttt atcctgtgac 3240tatggccgtg agtaaacaac ttctgcctat ttatgataag cctatgattt attacccgct 3300ctcaaccctg atgctggcgg gtattcgtga tattttgatt attagtacgc cacaagacac 3360accacgtttt gagcaattac tgggcgacgg tagccagtgg gggcttaatc ttcagtacaa 3420agtgcaacct agtccagatg gtctggcaca agctttcatt attggagaag attttattgg 3480tggtgatgat tgtgcgttgg tcttgggtga taatatcttt tacggtcatg acctaccaaa 3540attaatggat acagctgtta atagagagag tggcgcaacg gtatttgcct atcacgttaa 3600tgatccagaa cgttatggtg tggtggagtt tgataaaaac ggcacggcaa taagcttgga 3660agaaaaaccg cttcaaccga aaagcaatta tgcagttaca ggactttatt tctatgataa 3720tgatgtcgtg gaaatggcaa aaaaactgaa accatctgcc cgtggcgaag tcgaaatcac 3780agatattaac cgtatttata tggaacaggg gcgtttgtct gtagccatga tggggcgtgg 3840ttatgcttgg ttggacacgg gtacacatca aagtcttatt gaggcaagta acttcattgc 3900aacaatagaa gaacgccagg ggctgaaagt ttcctgtcca gaagagattg cttaccgtaa 3960agggtttatt ggaaaagagc aactagagct attagctaag tcgcttatga aaaatcaata 4020tggaaaatat cttcttaaaa tgatcgggta aataataata ctttttcagg aaatgaaatg 4080tatttcagtg tattgatgtc tctttatatt aaagagaagc ccgaatatct acatgaatgc 4140ttaaaaagtc tatatgaaca aacaaagcaa gctgatgaga tagtgcttgt ctatgatgga 4200ccaattacaa acgaattaga taaagtagtt aattattggt taaatagttt gccaataaag 4260ataataaaat taagcaaaaa tgtcggtttg ggtcaggccc tgaataaggg gttagctcaa 4320tgtgaaaatg attatgtcgc tagaatggat acggatgata tatgccatcc caagagattt 4380gaaattcaaa ttgatttttt aaataaaaac aagaatataa gtgttgttgg ttcatatata 4440gaggagtttt cagaaactat agaaaacagg ttgtcgcaaa aaattgtacc gacaacgcac 4500aatgagataa tgaaaaatat aggaaaacga aatccattta accacatgac agttgtgttc 4560aataagagtg aaataataaa ggtgggtgga tatgaacatc attatttaat ggaagattat 4620aatttatggt tgcggctttt aaaaaataat attcaggcag ccaatttgcc tttaacatta 4680gtttatgcca gaggtgggga tggcatgatt tataggaggt ccggtttacg ttatattaaa 4740agtgaatata aattgtataa gttaaaacaa agattaggat atcaaaatta tattatatcc 4800tcattggtgt tttttttaag gagtgtacca agggtttttc ctccttacat tttaaaagca 4860atttatagat tcttgcgaaa gaaataacag tataaaaatg cattatatta tttagagggg 4920gcttatgaaa tattcaagaa caacaataca agatgctata gtgattacac ctgaagtatt 4980tgctgattct agggggtatt tttttgaaag ctttaattat cgggattttc aaaggattat 5040taatcgagag atagtttttt gtcaagataa ccaatcatta tcgcataagg gagttgtcag 5100gggactacat tttcaagtaa atccaaagga acaggcaaaa ttggtaagat gtataaatgg 5160
ttcggtgtat gatgtgattg tagacttgcg caaaaactcc ccttcttata agtgttggtt 5220cggaatttta ttatcgtctg ataataaaaa acagttatgg attccagagg gatgtgctca 5280tggttttatc tcattagagg acaatacgga attattatat aagactactg aattttattc 5340tcctgaccat gaacgctgca tcatttggaa tgatcctgac ttaggaataa gttggccaga 5400atatagctat ataatttccg ataaagataa gaatggaatt tccttcgctg aatgggagag 5460cttaggtgat taaggtgaaa ttaattccac ttcaaacgca tggtgacgat agaggttcgc 5520ttgttgcttt agaagagggg tataatatac catttcaaat taaacgcgtt tattatattt 5580ttaacacaaa gaaaggagtc atgagaggtt ttcatgcaca taaaaactta aaacaggttg 5640caatagctgt tagaggaagt tgtaagttta aattagacaa tggtaccgat agtgttgagg 5700ttctactgaa tgatcctgcg caaggtctat tgatagaatc atttatttgg agagaaatgt 5760atgacttttc cgaggactgc gtattaatgg ttttagccga ctctcattac gatgagaacg 5820attacgttag agactacaat gctttcttaa atctggtggc ttaataataa taaggataca 5880ataatggtta atttcttaag tttaaaaaat ataaactcac gctataatga ggaattaaaa 5940aaagcatgtg caagagttat tgactctggc tggtatgtaa tgggggagga attacaccag 6000ttcgaaaacg agttcgctaa atattgtggt gtaaaaggtt ctctgggggt ggcgaatggg 6060ctagatgctt tgattctttc attaagagct tggcgtgaaa tggggaaaat taagccgggt 6120gatgaggtac ttgttccagc taatacatat atagcttcaa ttattgcaat tacagaaaat 6180aatctggtgc ctgtatttgt tgagccggat tataatactt ataatttaga tccagataaa 6240attgaatctg cgattactga aaaaacaaaa gtgattttac ctgttcattt gtatggacga 6300atttgtccta tggaagaaat attatcattg gcgaaaaaat ataatcttct tgtgttagag 6360gattgtgctc aggcgcatgg tgcatctctt aatggcagaa aaacaggggg gtggggagat 6420gcgggggctt ttagttttta tccaggtaaa aatttggggg cccttggtga ttctggggct 6480attactagca atgatttaga ttttctgaat gtaattcaag ctttaagaaa ttatgggtca 6540caccaaaaat atgtaaatca atatattggt gtgaatagtc gattagatga aattcaagca 6600gctatgctaa gggttaaatt aaaatacctg gatagtgata acaaaagaag gaaagaaatt 6660gctcaatatt acattgattc aataataaat cctttagtcc aattgccgaa atcatgcagt 6720aattatgatg aaaatgtttg gcatttattt gttgttaaaa ctcgatatag agagtatctt 6780caaaaattcc tgagtaaaca gagtattcaa acattaattc actatccaca ccctccacat 6840aaacaaatag cttataagca gtttaattcc atttctttgc cattgacaga aaaaatccat 6900aatgaggttt tgtctttgcc aatggatcca actctttctg aagaggagat acaaaaggtt 6960gtcaatgcgg taaatggttt tactctatga gttcattttt taagatatca ttctttagtg 7020gttgtttgac attattcaag atgttaatgg gctttttaat tgctaaagta atcgctattt 7080atacagggcc atctggtatg gccttacttg gtcagcttca aagtttagtc acaggtatta 7140atgggatcgt aaatgcacct gtaggaaatg gtatcgttaa atatactgca gagtttaaac 7200tagaaggtgc agaatgttgc tctagatggt ggaaaccagc aatcggcttt tcattccttt 7260tttgtttggt tttatcgata gtttttatac catttgcaaa taaaatatca tttattttat 7320ttggctctta tgaatatgat tatgtggtta ttatagcagt atgtaactta ccttttgcag 7380ctttcggtac tatgataatg tctattgtca atggaatggg gaagtataga ctttatatat 7440tatatgggtt tatttctaat cttataacgt cgataataat gttacttatg ctaataaaat 7500atggtattgt tggtgcatta ttagccactt caatacaata tggtcttatt ggtataattt 7560tgatatgttt gaattataat caggaatggt tcaaacataa ttatttttat ccctacgata 7620gtatttttaa ttcagaagca aaggatattt tagcttatat attgatggct ataacaagtg 7680caattagctt acccttgact ttaatcgtaa ttagaaaaat tctcctaaat atgacggata 7740taactaccgt tggacaatgg caggcggtat ggaaaatatc tgaagtatat ataggagtcg 7800tgactattgc acttagtact tattttttgc ctaagttgtc tgctctaaat gatacggcta 7860aaataaaaaa tgaaattggt attgtcctta aatatactat tccatttgtt tgtgttgccg 7920
cggttctcat tttcgctttt cgcgatctga taataacgct cttattcacg aatgagtttt 7980atcctgcacg tgatcttttt tttattcaac ttgtaggtga tataattaaa ataataagtt 8040ggatttatgc attcactatg ttggcttcaa aagcaactag gtggtatgtt ggatctgaat 8100tatttttttg tatttcatgg tgtttaatta gttttgttct tgttaatata tataaggcgc 8160aaggaattaa tatagcatat tgcattagct atgttatgta ttttttaata atttatctca 8220acctaaataa gattataaag aaaaagaatg aacctcattg aaattattaa actccaaatt 8280atcaaaactt ctgatattaa taagaaaata agactgctca aggagttggg gggaatgcta 8340tgggccaata acgttggcat atacaactta aattcacttg aaagggcagt tatcgaagat 8400gtagcaagag attatacgcc acaaattggt agtcaatata aaaagaaaaa aaataatgta 8460tttgtgatta ctataggcta catgtctggt gggcatacaa ggttaatgga aaatcttgca 8520aatatgctag ataataaatg tgaccttata attactggaa acgcatctgt tacgctaaaa 8580aaaaggcttg aaaaatattt caatgaaatt tttgaaattc ctgtttacaa tgacactaac 8640attaatgaac tttataagtt aagcgctaat cttgagagat acgaaaatat aatacttaat 8700atacaccctg atgatattgc gagcgttatt gcagctggtc ttgcaaaaaa aaatataaac 8760acatacgttc actttgttaa tcatgcagat catgttttta gcttcggtcc gaccgtagca 8820gatgtctggt atcaaattag ccaattcggg gctaaacttg atcaattaag agagctaagt 8880ggtaaaacta cattcttggg gataccgatt gcgataaatg atgatcattt atctaataat 8940atgatttcca ctaatgatga agtgaaatgt attatcactg ctggctctgc aaataaatac 9000aagccgcata aaggctattc tctcataaaa aaaattcctg aaatattata tcaatttcca 9060gaagcatcaa taatagtagt aggtactaac atcctatttt gctattggtg gtggggaact 9120tttttaaaat tcagaaagcg tattaaattc tataaagcac ttaatcattc tgaatatctt 9180ttacttatgc aaaatgctga tatttatttg gatagttatc ctattcccgg ggggacggca 9240tttgttgagc agtcctttct gggtaaaaaa tgtgccgggt atatttcacc gcaacaaggg 9300tatacaccac ttgaaaacat aaaatgcgac atcacaagtt ctgagttaaa caaaataaat 9360aacgttgata taattgagaa aataaaatat gttcatcctt ttgataatgt aaaaaataga 9420cttttaagcg ccatcaacaa acaagtgatg actactataa actgggatta ttattacaaa 9480tggactggtg acattaactt ttttaaactc gaaaaaataa gagaaattcc attatattta 9540ttgctggaat gtgtgaaaga aaattctagc ttaaaatgta taatatcaca atataaattt 9600ataactatta tttctttaat taaaaatttt atcaggctct atgtcagtaa actaaagggg 9660aaataatgga atatactatt attattattt tttttgttct gttgtatttt acatctaaag 9720ttacgtggcc ctttagtgga aaaaatgcac atccaattaa ctttgtttta ttcacgcaaa 9780tatttatatt aacgctgcca ggtgttctta ttttaacatt ttttaaagag tgcgcgggat 9840ctataacatg tgagataata gctgaaaaca tcaaaataaa cgtgatgttg gattatttta 9900ctgtgctctg ttttatcctt ttgggggtgc tttcttcatt tttcttgtta aaaggtaaaa 9960ctgattttcg gccagcatcg aatgcccata gacgatatct aaatacgtgc tttatattaa 10020ctctacttat ttttttggta aaaattattt ctgttaatca agttcctcta tttcttacat 10080tacttggtca taaagatgct gcagagattc aaaaagctga gatccttaga ggggaagatg 10140ggttttcatt tccggtaata aattttctaa taaaatattt tcctttgtat ttttattaca 10200gtacgttgat tggtttgttt aaacgcaaag ttactatagt ttactttgta atggcttttc 10260ttgtcacgtc tgtgacaatg ctttacgatt tacaaaaagg tccggttgtt attatgatta 10320ttggctcatt ttggctttat tgggcttata ccggaaaagc aaaaatgata gtagtaggtg 10380ggatattcag tttattttta gtaggtgttc tattttatat ctccttcgat tttggtgatg 10440atacccaata ttttattacc gctgtgttaa ataggacctt cattgctcag aatgatggaa 10500tgtattgggt atatcaatat tataatatat taccaaataa agaactgtat tctttatggg 10560gggtcccact tgcacaacag tttggtatcc cgcagattga cccattaagt gatattattg 10620gtgttgtttt tcctcaagct aaggatagtt gggttaatac aacgacattt ttgttaggtg 10680
aggcaaaggc aattttcggt gactatagtt ccattatctc atctttagta gtatttatta 10740atgtgtttgt tgtatgtgtg ctatcaacac ttttagtaag agtatcaaaa aatatttttt 10800atcccgcaat attcgttatg attcaaacta taccatttgc aaacaatttg actgacttat 10860tatatggtag atttattttt ggttttttag tctttatgtt atttccagtg cttatatgtt 10920ttttgtgtta tggaaaatta aaaaatgatg aatagaaaag tgcttattat aatggttacc 10980tataatcctg attggagtaa ggtaattaat aaagtgaagt ctttttgtgt tgcaggaaca 11040gtttttgttt ctgataatag cgattctgat tcctcatcat tgataaacta tgaaaatgtt 11100atatacagat ataatcatgg taatgtaggc atagcaaaag ctcagaattt aggtattgaa 11160tatgcgatgc agtataatta tgagtttgta gcttttgttg atgatgatag taatctgagc 11220gggggtaaaa ttacacagtt aacaaataat ttatgtaaat taggcagtct tggtgaaaat 11280attgcagcat tttgcgctta ccctagtgaa agaggtggtt ttgacaagac aaaaaaaact 11340tcgcttggta gacaattatt gttaactaag aatttaatga gttcaggatc tttaacaaag 11400gttgatgtat ttaaaaagat aggtttattt gatgaagatt tatttattga ctatgtggat 11460tatgaatggg gctggagagc actggaaaaa aattttttaa tcgtaattga tacatcagta 11520gaatttgaac attcacttgg tcaggggcgc tcaaaaattg gattagggat cccctctcct 11580atccgacatt tttatcaaac tagaaatctt ttatggatat caaggctaaa ttatgtacca 11640atatattgga aacttaaaca gtttttactt cttccaattc gctatttcta ttttggtttt 11700ttttataatc actctaaatt acggcgaacc cattttctca aagggtttgc cgcagggtta 11760aaatttaaat catagtttta tgagataata tcatcaacgg gacgaataat tttagctgga 11820ttgccagcaa caattacatt atccggaata tccttcgtaa ctacggagcc tgcgccaata 11880attgaatttt caccgatgat aatacccggc aaaattgttg cgttcgcacc aatagaagca 11940ttctttttaa tatgtatcgt tggataataa tctgggtatt ttttagatct tggataaata 12000tcatttgtaa atgtaacatt tggacctata aaaacattat cttcaattat gactccatcc 12060catatataga ctccagattt tatagtgaca ttatcgccaa taataacttt attttcgatt 12120aaagtatgtg cgcaaatatt gcagttatta ccaattacag cgccttcaaa aataatgctg 12180tattgccaaa tggttgtatt tagaccgatt tttacagttt ttacatcact taatggatga 12240attttcataa attctaccct tcatttttaa aacaataata ttgtaaatga tatcatttag 12300tattaatgat atcattagac gcctgaatag taaaaagttt tccctttggt tataaagtca 12360aaagttaagt agcgtaaatc ggtattctga caggagtaaa acatgtcaaa gcaacagatc 12420ggcgtcgtcg gtatggcagt gatggggcgc aaccttgcgc tcaacatcga aagccgtggt 12480tataccgtct ctattttcaa ccgttcccgt gaaaagacgg aagaagtgat tgccgaaaat 12540ccaggcaaga aactggttcc ttactatacg gtgaaagagt ttgttgaatc tctggaaacg 12600cctcgtcgca tcctgttaat ggtgaaagca ggtgcaggca cggatgctgc tattgattcc 12660ctcaagccgt acctcgataa aggtgacatc atcattgatg gtggtaacac cttcttccag 12720gacaccattc gtcgtaaccg tgagctttct tcagaaggct ttaacttcat cggtaccggt 12780gtttccggcg gagaagaggg ggcgctgaaa gggccgtcca tcatgcctgg tggccagaaa 12840gaagcctatg aactggttgc gccgatcctg accaaaatcg ccgcagtagc tgaagacggt 12900gagccatgcg ttacctatat tggtgccgat ggcgcaggtc actatgtgaa gatggttcac 12960aacggtattg aatacggaga tatgcaactg attgctgaag cctactctct gcttaaaggt 13020ggcctgaacc tcaccaacga agaactggcg cagacgttta ccgagtggaa taacggtgaa 13080ctgagcagct acctgatcga catcaccaaa gacatcttca ctaaaaaaga tgaagacggt 13140aactacctgg ttgatgtgat cctggatgaa gcggctaaca aaggtaccgg taaatggacc 13200agccagagcg cgcttgatct cggcgaaccg ctgtcgctga ttaccgagtc tgtgtttgca 13260cgatacatct cttctctgaa agagcagcgt gttgccgcat ctaaagttct ttctggtccg 13320caagcgcagc ctgctggcga caaaggtgaa ttcatcgaaa aagttcgccg tgcgctgtat 13380ctgggtaaaa tcgtttctta cgctcagggc ttctctcagc tacgcgctgc gtctgaagag 13440
tacaactggg atctgaacta cggtgaaatc gcgaagattt tccgtgctgg ctgcatcatc 13500cgtgcgcagt tcctgcagaa aatcaccgat gcttatgccg aaaatccgca gatcgctaac 13560ctgttgctgg ctccttactt caagcaaatt gccgatgact accagcaggc gctgcgcgat 13620gtcgtcgctt acgcagtaca gaacggtatc ccggtgccga ccttcgccgc tgctgttgcc 13680tattacgaca gctaccgcgc cgctgttctg cctgcgaacc taattcaggc acagcgcgac 13740taa13743表1大腸桿菌O71型的O抗原基因簇中的糖基轉移酶基因和寡糖單位處理基因及其中的引物及PCR數據產生正確 PCR的退基因的堿基 PCR產物基因功能正向引物反向引物 大小電泳 火溫度位置 的長度 帶的組數 (℃)Wzx O-抗原轉運酶 6987-82617515-7533 7839-7859345bp 0*567139-7157 8051-8069931bp 0*55Wzy O-抗原聚合酶 9666-10955 10332-1035010581-10609 278bp 0*569981-9999 10670-10688 708bp 0*54*只在大腸桿菌O71型中得到正確的一條帶表2166株大腸桿菌和43株志賀氏菌及它們的來源組號 該組中含有的菌株 來源1、野生型大腸桿菌 O1,O2,O5,O7,O12,O13,O14,O15,O16,O17,O19ab,O20, IMVSaO21,O22,O23,O24,O592、野生型大腸桿菌 O25,O26,O27,O28,O29,O30,O32,O33,O35,O36,O37,IMVSaO38,O40,O41,O42,O433、野生型大腸桿菌 O44,O45,O46,O48,O49,O50,O51,O52,O54,O55,O56,IMVSaO57,O58,O60,O61,O624、野生型大腸桿菌 O63,O65,O66,O69,O70,O72,O74,O75,O76,O77,O78,IMVSaO79,O80,O81,O82,O835、野生型大腸桿菌 O84,O85,O86,O87,O88,O89,O91,O92,O98,O99,O101, IMVSaO102,O103,O104,O1066、野生型大腸桿菌 O107,O108,O109,O110,O111,O112ab,O112ac,O113, IMVSaO115,O116,O118,O120,O123,O125,O126,O1287、野生型大腸桿菌 O129,O130,O131,O132,O133,O134,O135,O136,O137, IMVSaO138,O139,O140,O141,O142,O143,O144,O1458、野生型大腸桿菌 O146,O147,O148,O150,O152,O154,O156,O157,O158, IMVSaO159,O160,O161,O163,O164,O165,O166 b9、野生型大腸桿菌 O168,O169,O170,O171,O172,O173, c志賀氏菌 D1,D2,D3,D4,D5,D6,D7,D8,D9,D10,D11,D12d10、野生型志賀氏菌 B1,B2,B3,B4,B6,B7,B8,B9,B10,B11,B12,B13,B14,B15, dB16,B17,B1811、野生型志賀氏菌 F1a,F1b,F2a,F2b,F3,F4b,F5(v4),F5(v7),F6,FX變,FY變,DS,DR, d12、野生型大腸桿菌 O3,O11,O39,O59,O64,O73,O96,O95,O100,O114,O151, IMVSaO155,O12413、第4組菌株加上大腸桿菌標準菌株O71 IMVS*為了檢測的方便,我們將每13-17個菌分為一組,總共13組
a.Institude of Medical and Veterinary Science,Anelaide,Australiab.Statens Serum Institut,Copenhagen,Denmarkc.O172和O173來自于Statens Serum Institut,Copenhagen,Denmark,其余來自于IMVSd.中國預防醫(yī)學科學院流行病學研究所表3大腸桿菌O71型O抗原基因結構圖 orf# galF rmlB rmlD rmlA orf4rmlC orf6 orf7 wzx orf9 wzy orf11 orf12 gndG+C%content44464231 34 363530 3131 32 32E.coli O71 O-antigen gene cluster表4大腸桿菌O71型O抗原基因簇基因位置ATTGTGGCTG CAGGGATCAA AGAAATCCTC CTGGTAACTC ACGCGTCCAA GAACGCGGTC60GAAAACCACT TCGACACCTC ATATGAATTA GAATCTCTCC TTGAGCAGCG CGTGAAGCGT 120CAACTGCTTG CGGAAGTGCA GTCCATCTGT CCACCGGGCG TGACCATTAT GAACGTGCGT 180CAGGGCGAAC CTTTAGGTTT AGGCCACTCC ATTTTGTGTG CACGACCCGC CATTGGTGAC 240AACCCATTTG TCGTGGTGCT GCCAGACGTT GTGATCGACG ATGCCAGCGC CGACCCGCTA 300CGCTACAACC TTGCTGCCAT GATTGCGCGC TTCAATGAAA CGGGCCGTAG CCAAGTGCTG 360GCAAAACGTA TGCCGGGTGA CCTCTCTGAA TACTCCGTCA TCCAGACCAA AGAACCGCTG 420GACCGTGAAG GCAAAGTCAG CCGCATTGTT GAATTCATCG AAAAACCGGA TCAGCCACAC 480ACGCTGGACT CAGACATCAT GGCCGTGGGT CGCTATGTGC TTTCTGCCGA TATTTGGCCG 540GAACTTGAAC GCACTCAGCC TGGTGCATGG GGGCGTATTC AGCTGACTGA TGCCATTGCC 600GAACTGGCGA AAAAACAGTC CGTTGATGCC ATGCTGATGA CAGGTGACAG CTACGACTGC 660GGTAAAAAAA TGGGGTATAT GCAGGCATTT GTGAAGTATG GACTACGCAA CCTCAAAGAA 720GGGGCGAAGT TCCGTAAAGG GATTGAGAAG CTGTTAAGCG AATAATGAAA ATCTGACCGG 780ATGTAACGGT TGATAAGAAA ATTATAACGG CAGTGAAGAT TCGTGGCGAA AGTAATTTGT 840TGCGAATATT CCTGCCGTTA TTTTATATAA ACAATCAGAA TAACAACGAG TTAGCAATAG 900GATTTTAGTC AAAGTTTTCC AGGATTTTCC TTGTTTCCAG AGCGGATTGG TAAGACAATT 960AGCGTTTGAA TTTTTCGGGT TTAGCGCGAG TGGGCAACGC TCGTCACATC GTAGACATGC 1020ATGCAGTGCT CTGGTAGCTG TAAAGCCAGG GGCGGTAGCG TGCATTAATA CCTCTCTTAA 1080orf1的起始TCAAACTAAG AGCCGCTAAT TTCACAGCAT GCTCTGAAGT AATATGGAAT AAAAAAGTGA1140AGATACTTGT TACTGGTGGC GCAGGATTTA TTGGTTCTGC TGTAGTTCGT CACATTATAA 1200ATAATACGCA GGATAGTGTT GTTAATGTCG ATAAATTAAC GTACGCCGGA AACCTGGAAT 1260CACTTGCTGA TGTTTCTGAT TCTGAACGCT ATGTTTTTGA ACATGCGGAT ATTTGCGATG 1320CTGCTGCAAT GGCGCGGATT TTTGCTCAGC ATCAGCCGGA TGCAGTGATG CACCTGGCTG 1380CTGAAAGCCA TGTTGACCGT TCAATTACAG GTCCTGCGGC ATTTATTGAA ACCAATATTG 1440TTGGTACTTA TGTCCTTTTG GAAGCCGCTC GCAATTACTG GTCTGCTCTT GATAGCGACA 1500AGAAAAATAG CTTCCGTTTT CATCATATTT CTACTGACGA AGTCTATGGC GATCTGCCTC 1560ATCCTGACGA AGTAAATAAT AAAGAAGAAT TACCCCTCTT TACTGAGACG ACAGCTTACG 1620CGCCAAGCAG CCCATATTCT GCTTCTAAAG CATCCAGCGA TCATTTAGTC CGCGCGTGGA 1680
AACGTACCTA TGGTTTACCG ACCATTGTGA CTAACTGTTC GAATAACTAC GGCCCTTATC 1740ACTTTCCGGA AAAATTGATT CCGTTGGTAA TTCTTAATGC TCTGGAAGGT AAGGCATTAC 1800CTATTTATGG CAAAGGGGAT CAAATTCGTG ACTGGCTGTA TGTTGAAGAT CATGCGCGTG 1860CGTTATATAC CGTCGTAACC GAAGGTAAAG CGGGTGGAAC TTATAACATT GGTGGACACA 1920ACGAAAAGAA AAACATCGAT GTAGTGCTCA CTATTTGTGA TTTGTTGGAT GAGATTGTAC 1980CGAAAGAGAA ATCTTACCGC GAGCAAATCA CTTATGTTGC CGATCGTCCG GGACACGATC 2040GCCGTTATGC CATTGATGCT GAGAAGACTG GTCGCGAATT GGGATGGAAA CCACAGGAAA 2100CGTTTGAGAG CGGGATTCGG AAGACAGTGG AATGGTACCT GTCCAATACA AAATGGGTTG 2160orf1的終止TTAATGTGAA AAGTGGTGCC TATCAATCGT GGATTGAACA GAACTATGAG GGCCGCCAGT2220orf2的起始AATGAATATT CTCCTTTTCG GCAAAACAGG GCAGGTAGGT TGGGAACTAC AGCGTGCTCT 2280GGCACCTTTG GGTAATTTGA TTGCTCTTGA TGTTCACTCC ACTGATTATT GTGGTGATTT 2340TAGTAATCCT GAAGGTGTGG CTGAAACCGT CAAAAAAATT CGCCCTGATG TTATTGTTAA 2400TGCTGCGGCT CATACTGCAG TAGATAAGCT GAGTCAGAAC CCGAATTTGC ACAATTACTC 2460AATGCGACCA GCGTTGAATC AATTGCAAAA GCGGCCAATG AAAGTTGGGG CTTGGGTAAT 2520TCATTACTCA ACTGACTACG TATTTCCGGG AACCGGTGAA ATACCATGGC TGGAGACGGA 2580TGCAACCGCA CCGCTAAATG TTTACGGTGA AACCAAGTTA GCCGGAGAAA AAGCGTTACA 2640GGAAAATTGC GCGAAGCATC TTATTTTCCG TACCAGCTGG GTATACGCAG GTAAAGGAAA 2700TAACTTCGCC AAAACGATGT TGCGTCTGGC AAAAGAGCGC GAAGAACTGG CTGTGATTAA 2760TGATCAATTT GGTGCGCCAA CAGGTGCTGA GCTGCTGGCA GATTGTACGG CACATGCTAT 2820TCGTGTGGCA CTGAATAAAC CAGAAGTCGC AGGCTTGTAT CATCTGGTAG CCAGTGGTAC 2880CACAACTTGG CACGATTATG CTGCGCTGGT TTTTGAAGAG GCGCGCAAAG CAGGCATTCC 2940CCTTGCACTC AACAAGCTCA ACGCAATATC AACAACAGCC TATCCTACAC CAGCTCGTCG 3000CCCACATAAC TCTCGCCTTA ATACAGAAAA ATTTCAGCAG AACTTTGCGC TTGTCTTGCC 3060orf2的終止TGACTGGCAG GTTGGCGTGA AACGAATGCT CAACGAATTA TTTACGACTA CAGCAATTTA3120orf3的起始ATTGTTTTTG CATCTTGTTC GTGATGATGG TGCAAGATGA ATTAAAAGGA ATGATGAAAT3180GAAAACGCGT AAAGGTATTA TTTTAGCGGG TGGTTCTGGT ACTCGTCTTT ATCCTGTGAC 3240TATGGCCGTG AGTAAACAAC TTCTGCCTAT TTATGATAAG CCTATGATTT ATTACCCGCT 3300CTCAACCCTG ATGCTGGCGG GTATTCGTGA TATTTTGATT ATTAGTACGC CACAAGACAC 3360ACCACGTTTT GAGCAATTAC TGGGCGACGG TAGCCAGTGG GGGCTTAATC TTCAGTACAA 3420AGTGCAACCT AGTCCAGATG GTCTGGCACA AGCTTTCATT ATTGGAGAAG ATTTTATTGG 3480TGGTGATGAT TGTGCGTTGG TCTTGGGTGA TAATATCTTT TACGGTCATG ACCTACCAAA 3540ATTAATGGAT ACAGCTGTTA ATAGAGAGAG TGGCGCAACG GTATTTGCCT ATCACGTTAA 3600TGATCCAGAA CGTTATGGTG TGGTGGAGTT TGATAAAAAC GGCACGGCAA TAAGCTTGGA 3660AGAAAAACCG CTTCAACCGA AAAGCAATTA TGCAGTTACA GGACTTTATT TCTATGATAA 3720TGATGTCGTG GAAATGGCAA AAAAACTGAA ACCATCTGCC CGTGGCGAAG TCGAAATCAC 3780AGATATTAAC CGTATTTATA TGGAACAGGG GCGTTTGTCT GTAGCCATGA TGGGGCGTGG 3840TTATGCTTGG TTGGACACGG GTACACATCA AAGTCTTATT GAGGCAAGTA ACTTCATTGC 3900AACAATAGAA GAACGCCAGG GGCTGAAAGT TTCCTGTCCA GAAGAGATTG CTTACCGTAA 3960AGGGTTTATT GGAAAAGAGC AACTAGAGCT ATTAGCTAAG TCGCTTATGA AAAATCAATA 4020orf3的終止orf4的起始TGGAAAATAT CTTCTTAAAA TGATCGGGTA AATAATAATA CTTTTTCAGG AAATGAAATG4080AATTTCAGTG TATTGATGTC TCTTTATATT AAAGAGAAGC CCGAATATCT ACATGAATGC 4140
TTAAAAAGTC TATATGAACA AACAAAGCAA GCTGATGAGA TAGTGCTTGT CTATGATGGA 4200CCAATTACAA ACGAATTAGA TAAAGTAGTT AATTATTGGT TAAATAGTTT GCCAATAAAG 4260ATAATAAAAT TAAGCAAAAA TGTCGGTTTG GGTCAGGCCC TGAATAAGGG GTTAGCTCAA 4320TGTGAAAATG ATTATGTCGC TAGAATGGAT ACGGATGATA TATGCCATCC CAAGAGATTT 4380GAAATTCAAA TTGATTTTTT AAATAAAAAC AAGAATATAA GTGTTGTTGG TTCATATATA 4440GAGGAGTTTT CAGAAACTAT AGAAAACAGG TTGTCGCAAA AAATTGTACC GACAACGCAC 4500AATGAGATAA TGAAAAATAT AGGAAAACGA AATCCATTTA ACCACATGAC AGTTGTGTTC 4560AATAAGAGTG AAATAATAAA GGTGGGTGGA TATGAACATC ATTATTTAAT GGAAGATTAT 4620AATTTATGGT TGCGGCTTTT AAAAAATAAT ATTCAGGCAG CCAATTTGCC TTTAACATTA 4680GTTTATGCCA GAGGTGGGGA TGGCATGATT TATAGGAGGT CCGGTTTACG TTATATTAAA 4740AGTGAATATA AATTGTATAA GTTAAAACAA AGATTAGGAT ATCAAAATTA TATTATATCC 4800TCATTGGTGT TTTTTTTAAG GAGTGTACCA AGGGTTTTTC CTCCTTACAT TTTAAAAGCA 4860orf4的終止ATTTATAGAT TCTTGCGAAA GAAATAACAG TATAAAAATG CATTATATTA TTTAGAGGGG 4920orf5的起始GCTTATGAAA TATTCAAGAA CAACAATACA AGATGCTATA GTGATTACAC CTGAAGTATT 4980TGCTGATTCT AGGGGGTATT TTTTTGAAAG CTTTAATTAT CGGGATTTTC AAAGGATTAT 5040TAATCGAGAG ATAGTTTTTT GTCAAGATAA CCAATCATTA TCGCATAAGG GAGTTGTCAG 5100GGGACTACAT TTTCAAGTAA ATCCAAAGGA ACAGGCAAAA TTGGTAAGAT GTATAAATGG 5160TTCGGTGTAT GATGTGATTG TAGACTTGCG CAAAAACTCC CCTTCTTATA AGTGTTGGTT 5220CGGAATTTTA TTATCGTCTG ATAATAAAAA ACAGTTATGG ATTCCAGAGG GATGTGCTCA 5280TGGTTTTATC TCATTAGAGG ACAATACGGA ATTATTATAT AAGACTACTG AATTTTATTC 5340TCCTGACCAT GAACGCTGCA TCATTTGGAA TGATCCTGAC TTAGGAATAA GTTGGCCAGA 5400ATATAGCTAT ATAATTTCCG ATAAAGATAA GAATGGAATT TCCTTCGCTG AATGGGAGAG 5460orf6的起始 orf5的終止CTTAGGTGATTAAGGTGAAA TTAATTCCAC TTCAAACGCA TGGTGACGAT AGAGGTTCGC 5520TTGTTGCTTT AGAAGAGGGG TATAATATAC CATTTCAAAT TAAACGCGTT TATTATATTT 5580TTAACACAAA GAAAGGAGTC ATGAGAGGTT TTCATGCACA TAAAAACTTA AAACAGGTTG 5640CAATAGCTGT TAGAGGAAGT TGTAAGTTTA AATTAGACAA TGGTACCGAT AGTGTTGAGG 5700TTCTACTGAA TGATCCTGCG CAAGGTCTAT TGATAGAATC ATTTATTTGG AGAGAAATGT 5760ATGACTTTTC CGAGGACTGC GTATTAATGG TTTTAGCCGA CTCTCATTAC GATGAGAACG 5820orf6的終止ATTACGTTAG AGACTACAAT GCTTTCTTAA ATCTGGTGGC TTAATAATAA TAAGGATACA 5880orf7的起始ATAATGGTTA ATTTCTTAAG TTTAAAAAAT ATAAACTCAC GCTATAATGA GGAATTAAAA 5940AAAGCATGTG CAAGAGTTAT TGACTCTGGC TGGTATGTAA TGGGGGAGGA ATTACACCAG 6000TTCGAAAACG AGTTCGCTAA ATATTGTGGT GTAAAAGGTT CTCTGGGGGT GGCGAATGGG 6060CTAGATGCTT TGATTCTTTC ATTAAGAGCT TGGCGTGAAA TGGGGAAAAT TAAGCCGGGT 6120GATGAGGTAC TTGTTCCAGC TAATACATAT ATAGCTTCAA TTATTGCAAT TACAGAAAAT 6180AATCTGGTGC CTGTATTTGT TGAGCCGGAT TATAATACTT ATAATTTAGA TCCAGATAAA 6240ATTGAATCTG CGATTACTGA AAAAACAAAA GTGATTTTAC CTGTTCATTT GTATGGACGA 6300ATTTGTCCTA TGGAAGAAAT ATTATCATTG GCGAAAAAAT ATAATCTTCT TGTGTTAGAG 6360GATTGTGCTC AGGCGCATGG TGCATCTCTT AATGGCAGAA AAACAGGGGG GTGGGGAGAT 6420GCGGGGGCTT TTAGTTTTTA TCCAGGTAAA AATTTGGGGG CCCTTGGTGA TTCTGGGGCT 6480ATTACTAGCA ATGATTTAGA TTTTCTGAAT GTAATTCAAG CTTTAAGAAA TTATGGGTCA 6540CACCAAAAAT ATGTAAATCA ATATATTGGT GTGAATAGTC GATTAGATGA AATTCAAGCA 6600
GCTATGCTAA GGGTTAAATT AAAATACCTG GATAGTGATA ACAAAAGAAG GAAAGAAATT 6660GCTCAATATT ACATTGATTC AATAATAAAT CCTTTAGTCC AATTGCCGAA ATCATGCAGT 6720AATTATGATG AAAATGTTTG GCATTTATTT GTTGTTAAAA CTCGATATAG AGAGTATCTT 6780CAAAAATTCC TGAGTAAACA GAGTATTCAA ACATTAATTC ACTATCCACA CCCTCCACAT 6840AAACAAATAG CTTATAAGCA GTTTAATTCC ATTTCTTTGC CATTGACAGA AAAAATCCAT 6900AATGAGGTTT TGTCTTTGCC AATGGATCCA ACTCTTTCTG AAGAGGAGAT ACAAAAGGTT 6960orf8的起始 orf7的終止GTCAATGCGG TAAATGGTTT TACTCTATGAGTTCATTTTT TAAGATATCA TTCTTTAGTG7020GTTGTTTGAC ATTATTCAAG ATGTTAATGG GCTTTTTAAT TGCTAAAGTA ATCGCTATTT 7080ATACAGGGCC ATCTGGTATG GCCTTACTTG GTCAGCTTCA AAGTTTAGTC ACAGGTATTA 7140ATGGGATCGT AAATGCACCT GTAGGAAATG GTATCGTTAA ATATACTGCA GAGTTTAAAC 7200TAGAAGGTGC AGAATGTTGC TCTAGATGGT GGAAACCAGC AATCGGCTTT TCATTCCTTT 7260TTTGTTTGGT TTTATCGATA GTTTTTATAC CATTTGCAAA TAAAATATCA TTTATTTTAT 7320TTGGCTCTTA TGAATATGAT TATGTGGTTA TTATAGCAGT ATGTAACTTA CCTTTTGCAG 7380CTTTCGGTAC TATGATAATG TCTATTGTCA ATGGAATGGG GAAGTATAGA CTTTATATAT 7440TATATGGGTT TATTTCTAAT CTTATAACGT CGATAATAAT GTTACTTATG CTAATAAAAT 7500ATGGTATTGT TGGTGCATTA TTAGCCACTT CAATACAATA TGGTCTTATT GGTATAATTT 7560TGATATGTTT GAATTATAAT CAGGAATGGT TCAAACATAA TTATTTTTAT CCCTACGATA 7620GTATTTTTAA TTCAGAAGCA AAGGATATTT TAGCTTATAT ATTGATGGCT ATAACAAGTG 7680CAATTAGCTT ACCCTTGACT TTAATCGTAA TTAGAAAAAT TCTCCTAAAT ATGACGGATA 7740TAACTACCGT TGGACAATGG CAGGCGGTAT GGAAAATATC TGAAGTATAT ATAGGAGTCG 7800TGACTATTGC ACTTAGTACT TATTTTTTGC CTAAGTTGTC TGCTCTAAAT GATACGGCTA 7860AAATAAAAAA TGAAATTGGT ATTGTCCTTA AATATACTAT TCCATTTGTT TGTGTTGCCG 7920CGGTTCTCAT TTTCGCTTTT CGCGATCTGA TAATAACGCT CTTATTCACG AATGAGTTTT 7980ATCCTGCACG TGATCTTTTT TTTATTCAAC TTGTAGGTGA TATAATTAAA ATAATAAGTT 8040GGATTTATGC ATTCACTATG TTGGCTTCAA AAGCAACTAG GTGGTATGTT GGATCTGAAT 8100TATTTTTTTG TATTTCATGG TGTTTAATTA GTTTTGTTCT TGTTAATATA TATAAGGCGC 8160AAGGAATTAA TATAGCATAT TGCATTAGCT ATGTTATGTA TTTTTTAATA ATTTATCTCA 8220orf9的起始orf8的終止ACCTAAATAA GATTATAAAG AAAAAGAATGAACCTCATTG AAATTATTAA ACTCCAAATT8280ATCAAAACTT CTGATATTAA TAAGAAAATA AGACTGCTCA AGGAGTTGGG GGGAATGCTA 8340TGGGCCAATA ACGTTGGCAT ATACAACTTA AATTCACTTG AAAGGGCAGT TATCGAAGAT 8400GTAGCAAGAG ATTATACGCC ACAAATTGGT AGTCAATATA AAAAGAAAAA AAATAATGTA 8460TTTGTGATTA CTATAGGCTA CATGTCTGGT GGGCATACAA GGTTAATGGA AAATCTTGCA 8520AATATGCTAG ATAATAAATG TGACCTTATA ATTACTGGAA ACGCATCTGT TACGCTAAAA 8580AAAAGGCTTG AAAAATATTT CAATGAAATT TTTGAAATTC CTGTTTACAA TGACACTAAC 8640ATTAATGAAC TTTATAAGTT AAGCGCTAAT CTTGAGAGAT ACGAAAATAT AATACTTAAT 8700ATACACCCTG ATGATATTGC GAGCGTTATT GCAGCTGGTC TTGCAAAAAA AAATATAAAC 8760ACATACGTTC ACTTTGTTAA TCATGCAGAT CATGTTTTTA GCTTCGGTCC GACCGTAGCA 8820GATGTCTGGT ATCAAATTAG CCAATTCGGG GCTAAACTTG ATCAATTAAG AGAGCTAAGT 8880GGTAAAACTA CATTCTTGGG GATACCGATT GCGATAAATG ATGATCATTT ATCTAATAAT 8940ATGATTTCCA CTAATGATGA AGTGAAATGT ATTATCACTG CTGGCTCTGC AAATAAATAC 9000AAGCCGCATA AAGGCTATTC TCTCATAAAA AAAATTCCTG AAATATTATA TCAATTTCCA 9060GAAGCATCAA TAATAGTAGT AGGTACTAAC ATCCTATTTT GCTATTGGTG GTGGGGAACT 9120TTTTTAAAAT TCAGAAAGCG TATTAAATTC TATAAAGCAC TTAATCATTC TGAATATCTT 9180TTACTTATGC AAAATGCTGA TATTTATTTG GATAGTTATC CTATTCCCGG GGGGACGGCA 9240
TTTGTTGAGC AGTCCTTTCT GGGTAAAAAA TGTGCCGGGT ATATTTCACC GCAACAAGGG 9300TATACACCAC TTGAAAACAT AAAATGCGAC ATCACAAGTT CTGAGTTAAA CAAAATAAAT 9360AACGTTGATA TAATTGAGAA AATAAAATAT GTTCATCCTT TTGATAATGT AAAAAATAGA 9420CTTTTAAGCG CCATCAACAA ACAAGTGATG ACTACTATAA ACTGGGATTA TTATTACAAA 9480TGGACTGGTG ACATTAACTT TTTTAAACTC GAAAAAATAA GAGAAATTCC ATTATATTTA 9540TTGCTGGAAT GTGTGAAAGA AAATTCTAGC TTAAAATGTA TAATATCACA ATATAAATTT 9600ATAACTATTA TTTCTTTAAT TAAAAATTTT ATCAGGCTCT ATGTCAGTAA ACTAAAGGGG 9660orf9的終止 orf10的起始AAATAATGGA ATATACTATT ATTATTATTT TTTTTGTTCT GTTGTATTTT ACATCTAAAG9720TTACGTGGCC CTTTAGTGGA AAAAATGCAC ATCCAATTAA CTTTGTTTTA TTCACGCAAA 9780TATTTATATT AACGCTGCCA GGTGTTCTTA TTTTAACATT TTTTAAAGAG TGCGCGGGAT 9840CTATAACATG TGAGATAATA GCTGAAAACA TCAAAATAAA CGTGATGTTG GATTATTTTA 9900CTGTGCTCTG TTTTATCCTT TTGGGGGTGC TTTCTTCATT TTTCTTGTTA AAAGGTAAAA 9960CTGATTTTCG GCCAGCATCG AATGCCCATA GACGATATCT AAATACGTGC TTTATATTAA 10020CTCTACTTAT TTTTTTGGTA AAAATTATTT CTGTTAATCA AGTTCCTCTA TTTCTTACAT 10080TACTTGGTCA TAAAGATGCT GCAGAGATTC AAAAAGCTGA GATCCTTAGA GGGGAAGATG 10140GGTTTTCATT TCCGGTAATA AATTTTCTAA TAAAATATTT TCCTTTGTAT TTTTATTACA 10200GTACGTTGAT TGGTTTGTTT AAACGCAAAG TTACTATAGT TTACTTTGTA ATGGCTTTTC 10260TTGTCACGTC TGTGACAATG CTTTACGATT TACAAAAAGG TCCGGTTGTT ATTATGATTA 10320TTGGCTCATT TTGGCTTTAT TGGGCTTATA CCGGAAAAGC AAAAATGATA GTAGTAGGTG 10380GGATATTCAG TTTATTTTTA GTAGGTGTTC TATTTTATAT CTCCTTCGAT TTTGGTGATG 10440ATACCCAATA TTTTATTACC GCTGTGTTAA ATAGGACCTT CATTGCTCAG AATGATGGAA 10500TGTATTGGGT ATATCAATAT TATAATATAT TACCAAATAA AGAACTGTAT TCTTTATGGG 10560GGGTCCCACT TGCACAACAG TTTGGTATCC CGCAGATTGA CCCATTAAGT GATATTATTG 10620GTGTTGTTTT TCCTCAAGCT AAGGATAGTT GGGTTAATAC AACGACATTT TTGTTAGGTG 10680AGGCAAAGGC AATTTTCGGT GACTATAGTT CCATTATCTC ATCTTTAGTA GTATTTATTA 10740ATGTGTTTGT TGTATGTGTG CTATCAACAC TTTTAGTAAG AGTATCAAAA AATATTTTTT 10800ATCCCGCAAT ATTCGTTATG ATTCAAACTA TACCATTTGC AAACAATTTG ACTGACTTAT 10860TATATGGTAG ATTTATTTTT GGTTTTTTAG TCTTTATGTT ATTTCCAGTG CTTATATGTT 10920orf11的起始orf10的終止TTTTGTGTTA TGGAAAATTA AAAAATGATGAATAGAAAAG TGCTTATTAT AATGGTTACC 10980TATAATCCTG ATTGGAGTAA GGTAATTAAT AAAGTGAAGT CTTTTTGTGT TGCAGGAACA 11040GTTTTTGTTT CTGATAATAG CGATTCTGAT TCCTCATCAT TGATAAACTA TGAAAATGTT 11100ATATACAGAT ATAATCATGG TAATGTAGGC ATAGCAAAAG CTCAGAATTT AGGTATTGAA 11160TATGCGATGC AGTATAATTA TGAGTTTGTA GCTTTTGTTG ATGATGATAG TAATCTGAGC 11220GGGGGTAAAA TTACACAGTT AACAAATAAT TTATGTAAAT TAGGCAGTCT TGGTGAAAAT 11280ATTGCAGCAT TTTGCGCTTA CCCTAGTGAA AGAGGTGGTT TTGACAAGAC AAAAAAAACT 11340TCGCTTGGTA GACAATTATT GTTAACTAAG AATTTAATGA GTTCAGGATC TTTAACAAAG 11400GTTGATGTAT TTAAAAAGAT AGGTTTATTT GATGAAGATT TATTTATTGA CTATGTGGAT 11460TATGAATGGG GCTGGAGAGC ACTGGAAAAA AATTTTTTAA TCGTAATTGA TACATCAGTA 11520GAATTTGAAC ATTCACTTGG TCAGGGGCGC TCAAAAATTG GATTAGGGAT CCCCTCTCCT 11580ATCCGACATT TTTATCAAAC TAGAAATCTT TTATGGATAT CAAGGCTAAA TTATGTACCA 11640ATATATTGGA AACTTAAACA GTTTTTACTT CTTCCAATTC GCTATTTCTA TTTTGGTTTT 11700TTTTATAATC ACTCTAAATT ACGGCGAACC CATTTTCTCA AAGGGTTTGC CGCAGGGTTA 11760orf11的終止 orf12的終止AAATTTAAAT CATAGTTTTATGAGATAATA TCATCAACGG GACGAATAAT TTTAGCTGGA 11820
TTGCCAGCAA CAATTACATT ATCCGGAATA TCCTTCGTAA CTACGGAGCC TGCGCCAATA11880ATTGAATTTT CACCGATGAT AATACCCGGC AAAATTGTTG CGTTCGCACC AATAGAAGCA11940TTCTTTTTAA TATGTATCGT TGGATAATAA TCTGGGTATT TTTTAGATCT TGGATAAATA12000TCATTTGTAA ATGTAACATT TGGACCTATA AAAACATTAT CTTCAATTAT GACTCCATCC12060CATATATAGA CTCCAGATTT TATAGTGACA TTATCGCCAA TAATAACTTT ATTTTCGATT12120AAAGTATGTG CGCAAATATT GCAGTTATTA CCAATTACAG CGCCTTCAAA AATAATGCTG12180TATTGCCAAA TGGTTGTATT TAGACCGATT TTTACAGTTT TTACATCACT TAATGGATGA12240orf12的起始ATTTTCATAA ATTCTACCCT TCATTTTTAA AACAATAATA TTGTAAATGA TATCATTTAG 12300TATTAATGAT ATCATTAGAC GCCTGAATAG TAAAAAGTTT TCCCTTTGGT TATAAAGTCA12360AAAGTTAAGT AGCGTAAATC GGTATTCTGA CAGGAGTAAA ACATGTCAAA GCAACAGATC12420GGCGTCGTCG GTATGGCAGT GATGGGGCGC AACCTTGCGC TCAACATCGA AAGCCGTGGT12480TATACCGTCT CTATTTTCAA CCGTTCCCGT GAAAAGACGG AAGAAGTGAT TGCCGAAAAT12540CCAGGCAAGA AACTGGTTCC TTACTATACG GTGAAAGAGT TTGTTGAATC TCTGGAAACG12600CCTCGTCGCA TCCTGTTAAT GGTGAAAGCA GGTGCAGGCA CGGATGCTGC TATTGATTCC12660CTCAAGCCGT ACCTCGATAA AGGTGACATC ATCATTGATG GTGGTAACAC CTTCTTCCAG12720GACACCATTC GTCGTAACCG TGAGCTTTCT TCAGAAGGCT TTAACTTCAT CGGTACCGGT12780GTTTCCGGCG GAGAAGAGGG GGCGCTGAAA GGGCCGTCCA TCATGCCTGG TGGCCAGAAA12840GAAGCCTATG AACTGGTTGC GCCGATCCTG ACCAAAATCG CCGCAGTAGC TGAAGACGGT12900GAGCCATGCG TTACCTATAT TGGTGCCGAT GGCGCAGGTC ACTATGTGAA GATGGTTCAC12960AACGGTATTG AATACGGAGA TATGCAACTG ATTGCTGAAG CCTACTCTCT GCTTAAAGGT13020GGCCTGAACC TCACCAACGA AGAACTGGCG CAGACGTTTA CCGAGTGGAA TAACGGTGAA13080CTGAGCAGCT ACCTGATCGA CATCACCAAA GACATCTTCA CTAAAAAAGA TGAAGACGGT13140AACTACCTGG TTGATGTGAT CCTGGATGAA GCGGCTAACA AAGGTACCGG TAAATGGACC13200AGCCAGAGCG CGCTTGATCT CGGCGAACCG CTGTCGCTGA TTACCGAGTC TGTGTTTGCA13260CGATACATCT CTTCTCTGAA AGAGCAGCGT GTTGCCGCAT CTAAAGTTCT TTCTGGTCCG13320CAAGCGCAGC CTGCTGGCGA CAAAGGTGAA TTCATCGAAA AAGTTCGCCG TGCGCTGTAT13380CTGGGTAAAA TCGTTTCTTA CGCTCAGGGC TTCTCTCAGC TACGCGCTGC GTCTGAAGAG13440TACAACTGGG ATCTGAACTA CGGTGAAATC GCGAAGATTT TCCGTGCTGG CTGCATCATC13500CGTGCGCAGT TCCTGCAGAA AATCACCGAT GCTTATGCCG AAAATCCGCA GATCGCTAAC13560CTGTTGCTGG CTCCTTACTT CAAGCAAATT GCCGATGACT ACCAGCAGGC GCTGCGCGAT13620GTCGTCGCTT ACGCAGTACA GAACGGTATC CCGGTGCCGA CCTTCGCCGC TGCTGTTGCC13680TATTACGACA GCTACCGCGC CGCTGTTCTG CCTGCGAACC TAATTCAGGC ACAGCGCGAC13740TAA 13743以上所述,僅是本發(fā)明的較佳實施例而已,并非對本發(fā)明作任何形式上的限制,凡是依據本發(fā)明的技術實質對以上實施例所作的任何簡單修改、等同變化與修飾,均仍屬于本發(fā)明技術方案的范圍內。
權利要求
1.一種對大腸桿菌O71型的O-抗原特異的核苷酸,其特征在于其是如SEQ ID NO1所示的分離的核苷酸,全長13743個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。
2.按照權利要求1所述的對大腸桿菌O71型的O-抗原特異的核苷酸,其特征在于其是由12個基因組成,都位于galF基因和gnd基因之間。
3.按照權利要求2所述的對大腸桿菌O71型的O-抗原特異的核苷酸,其特征在于,所述的基因是轉運酶的基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因,包括wzy基因或與wzy有相似功能的基因;鼠李糖合成酶基因,包括rmlBDAC基因或與rmlBDAC有相似功能的基因;一種稀有單糖合成酶基因,包括orf6和orf7或與orf6和orf7有相似功能的基因;乙?;D移酶基因orf12或與乙酰基轉移酶有相似功能的基因;糖基轉移酶基因,包括orf4、orf11基因;一個未知功能的基因orf9;其中所述的基因wzx是SEQ ID NO1中的6987至8261堿基的核苷酸;wzy是SEQ ID NO1中的9666至10955堿基的核苷酸;rmlBDAC分別是SEQ ID NO1中的1137至2222,2222至3121,3179至4051,4925至5473堿基的核苷酸;orf4是SEQID NO1中的4078至4887堿基的核苷酸;orf6是SEQ ID NO1中的5466至5864堿基的核苷酸;orf7是SEQ ID NO1中的5884至6990堿基的核苷酸;orf9是SEQ ID NO1中的8248至9666堿基的核苷酸;orf11是SEQ ID NO1中的10948至11775堿基的核苷酸;orf712是SEQ ID NO1中的11778至12248堿基的核苷酸。
4.按照權利要求1或2所述的對大腸桿菌O71型的O-抗原特異的核苷酸,其特征在于它是源于所述的wzx基因、wzy基因;糖基轉移酶基因包括的orf4、orf11基因;一個未知功能的基因orf9;以及它們的混合或它們的重組。
5.按照權利要求4所述的對大腸桿菌O71型的O-抗原高度特異的核苷酸,其特征在于,所述的源于wzx基因的寡核苷酸對是SEQ ID NO1中的7515至7533堿基的核苷酸和7839至7859堿基的核苷酸;SEQ ID NO1中的7139至7157堿基的核苷酸和8051至8069堿基的核苷酸;源于wzy基因的寡核苷酸對是SEQ ID NO1中的10332至10350堿基的核苷酸和10581至10609堿基的核苷酸;SEQ ID NO1中的9981至9999堿基的核苷酸和10670至10688堿基的核苷酸。
6.權利要求1所述的對大腸桿菌O71型的O-抗原特異的核苷酸在檢測表達O-抗原的細菌、在診斷中鑒定細菌的O-抗原和細菌的其它多糖抗原的應用。
7.權利要求1所述的對大腸桿菌O71型的O-抗原特異的核苷酸的重組分子,而且通過插入表達可提供表達大腸桿菌O71型的O-抗原,并成為細菌疫苗。
8.按照權利要求1所述的對大腸桿菌O71型的O-抗原特異的核苷酸的應用,其特征在于它作為引物用于PCR、作為探針用于雜交反應與熒光檢測、或者用于制造基因芯片或微陣列,檢測人體和環(huán)境中的細菌。
9.權利要求1所述的對大腸桿菌O71型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O71型,離心收集細胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘,之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃溫育30分鐘;加等體積酚抽提混合物,取上清液再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提兩次,取上清液再用等體積的乙醚抽提以除去殘余的酚,上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,將DNA重懸于30ul TE中;基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴增大腸桿菌O71型中的O-抗原基因簇以大腸桿菌O71型的基因組為模板通過Long PCR擴增其O-抗原基因簇,首先根據經常發(fā)現于O-抗原基因簇啟動子區(qū)的JumpStart序列設計上游引物(5’-ATT GTG GCTGCA GGG ATC AAA GAA AT-3’),再根據O-抗原基因簇下游的gnd基因設計下游引物(5’-TAG TCG CGT GNG CCT GGA TTA AGT TCG C-3’);用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應程序如下在94℃預變性2分鐘;然后94℃變性10秒,60℃退火15秒,68℃延伸15分鐘,這樣進行30個循環(huán),最后,在68℃繼續(xù)延伸7分鐘,得到PCR產物,用0.8%的瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性,合并5管long PCR產物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產物;(3)構建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構建O-抗原基因簇文庫,反應體系是300ng PCR純化產物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應在室溫中進行,酶切10分鐘使DNA片段大小集中在1.5kb-3kb之間,而后加入2ul 0.1M EDTA終止反應,合并4管同樣的反應體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中,隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃30分鐘,將酶切產物補成平端,75℃終止反應后,加入5單位的Tth DNA聚合酶及其相應的緩沖液并將體系擴大為80ul,70℃反應20分鐘,使DNA的3′端加dA尾,此混合物經等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接10小時,總體積為90ul,其中有9ul的10×buffer和25單位的T4DNA連接酶。最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產物;用Bi0-Rad公司的電轉化感受態(tài)細胞的制備方法制備感受態(tài)大腸桿菌DH5α細胞,取2-3ul連接產物與50ul感受態(tài)大腸桿菌DH5α混合后,轉到Bi0-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒至6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上,在37℃過夜培養(yǎng),次日得到藍白菌落,將得到的白色菌落即白色克隆轉到含有氨卞青霉素的LB固體培養(yǎng)基上培養(yǎng),同時從每個克隆中提取質粒,并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構成了大腸桿菌O71型的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1kb以上的96個克隆用本實驗室ABI3730型DNA自動測序儀對克隆中的插入片段進行測序,序列達到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O71型的O-抗原基因簇的核苷酸全長序列;序列的質量主要由兩個方面來保證1)對大腸桿菌O71型的基因組作5個Long PCR反應,然后混合這些產物以產生文庫,2)對每個堿基,保證3個以上高質量的覆蓋率,在得到大腸桿菌O71型O-抗原基因簇的核苷酸序列后,用美國國家生物技術信息學中心(The National Center forBiotechnology Information,NCBI)的orffinder發(fā)現基因,找到12個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質序列間的精確比對,最后得到大腸桿菌O71型的O-抗原基因簇的結構;(6)特異基因的篩選針對大腸桿菌O71型的O-抗原基因簇中的wzx、wzy基因設計引物;在每個基因內各設計了兩對引物,每對引物分布在相應基因內的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,除在第13組中得到了預期大小的一條帶外,在其他組中都沒有擴增到任何產物,所以wzx、wzy基因對大腸桿菌O71型的O-抗原都是高度特異的。
全文摘要
本發(fā)明提供一種對大腸桿菌O71型(Escherichiacoli O71)的O-抗原特異的核苷酸,它是大腸桿菌O71型中控制O-抗原合成的基因簇的核苷酸全序列,如SEQ ID NO1所示的分離的核苷酸,全長13743個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸;還包括源于大腸桿菌O71型的O-抗原基因簇中的糖基轉移酶基因和寡糖單位處理基因的寡核苷酸;本發(fā)明通過PCR證實寡核苷酸對大腸桿菌O71型的O-抗原都有高度的特異性;本發(fā)明還公開了用本發(fā)明的寡核苷酸檢測和鑒定人體及環(huán)境中的大腸桿菌O71型的方法。
文檔編號C07H21/00GK1554757SQ20031011786
公開日2004年12月15日 申請日期2003年12月22日 優(yōu)先權日2003年12月22日
發(fā)明者王磊, 孔慶科, 馮露, 王 磊 申請人:南開大學