專利名稱:鮑氏志賀氏菌7型的o-抗原特異的核苷酸的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及鮑氏志賀氏菌7型(Shigella boydii7)中控制O-抗原合成的基因簇的核苷酸全序列,特別是涉及鮑氏志賀氏菌7型中控制O-抗原合成的基因簇中的寡核苷酸,可利用這些對O-抗原特異的寡核苷酸快速、準確地檢測人體及環(huán)境中的鮑氏志賀氏菌7型并鑒定這些致病菌中的O-抗原。
O-抗原是革蘭氏陰性細菌脂多糖中的O特異性多糖成分,它由許多重復(fù)的寡糖單位組成。O-抗原的合成過程研究得較清楚先由糖基轉(zhuǎn)移酶將核苷二磷酸單糖轉(zhuǎn)移到一個固定在細胞內(nèi)膜的脂分子上,然后在內(nèi)膜的內(nèi)側(cè)合成寡糖單位,O-抗原的寡糖單位再通過轉(zhuǎn)運酶被轉(zhuǎn)移到內(nèi)膜外側(cè),而后通過聚合酶聚合成多糖,再被連接到一個糖脂分子上形成脂多糖分子[Whitfield,C.(1995)“Biosynthesis of lipopolysaccharide Oantigens”.Trends in Microbiology.3178-185;Schnaitman,C.A.andJ.D.Klena.(1993)“Genetics of lipopolysaccharide biosynthesis inentericbacteria”.Microbiological Reviews,57(3)655-682]。編碼負責O-抗原合成的所有酶分子的基因一般在染色體上相鄰排列,形成一個基因簇[Reeves,P.R.,et al.(1996)“Bacterial polysaccharide synthesis and genenomenclature”Trends in Microbiology,4495-503]。在志賀氏菌、大腸桿菌和沙門氏菌中,O-抗原基因簇位于galF和gnd基因之間[Lei Wang.et al(2001)“Sequence analysis of four Shigella boydii O-antigen lociimplicationfor Escherichia coli and Shigella relationships”.Infection andImmunity,116923-6930;Lei Wang and Peter Reeves(2000)“TheEscherichia coli O111 and Salmonella enterica O35 gene clustersgeneclusters encoding the same colitose-containing O antigen are highlyconserved”.Journal of Bacteriology.1825256-5261]。O-抗原基因簇含有三類基因糖合成路徑基因,糖基轉(zhuǎn)移酶基因,寡糖單位處理基因。其中糖合成路徑基因編碼的酶合成O-抗原所需的核苷二磷酸單糖;糖基轉(zhuǎn)移酶基因編碼的酶將核苷二磷酸單糖及其它分子轉(zhuǎn)到單糖上從而使單糖聚合成寡糖單位;寡糖單位處理基因包括轉(zhuǎn)運酶基因和聚合酶基因,它們將寡糖單位轉(zhuǎn)移到細菌內(nèi)膜外側(cè),再聚合成多糖。糖基轉(zhuǎn)移酶基因和寡糖單位處理基因只存在于攜帶這些基因的基因簇里。O-抗原中單糖的不同,單糖間聯(lián)結(jié)鍵的不同和寡糖單位之間聯(lián)結(jié)鍵的不同構(gòu)成了O-抗原的多樣性,而單糖的組成、單糖間的聯(lián)結(jié)鍵及寡糖單位之間的聯(lián)結(jié)鍵是由O-抗原基因簇中的基因控制著,所以O(shè)-抗原基因簇決定了O-抗原的合成,也決定了O-抗原的多樣性。
因為O-抗原是極強的抗原,是志賀氏菌重要的致病因素之一,同時它又具有極強的多樣性,這啟示我們能研究一種快速、準確地檢測志賀氏菌及其O-抗原的特異性好、靈敏度高的方法。以表面多糖為目標的血清學免疫反應(yīng)自上世紀30年代以來一直被用于對細菌的分型和鑒定,是鑒定致病菌的唯一的手段。這種診斷方法需要大量的抗血清,而抗血清一般種類不全,數(shù)量不足,大量的抗血清在制備和儲存中也存在一些困難。另一方面此法耗時長、靈敏度低、漏檢率高、準確性差,所以,現(xiàn)在普遍認為這種傳統(tǒng)的血清學檢測方法將為現(xiàn)代分子生物學方法取代。1993年,Luk,J.M.C et.al用沙門氏菌(S.enterica)O-抗原基因簇的特異核苷酸序列通過PCR方法鑒定了沙門氏菌的O-抗原[Luk,J.M.C.et.al.(1993)“Selective amplification ofabequose and paratose synthase genes(rfb)by polymerase chain reactionfor identification of S.enterica major serogroups(A,B,C2,andD)”,J.Clin.Microbiol.312118-2123]。Luk,et.al的方法是將相應(yīng)于沙門氏菌血清型E1,D1,A,B和C2的O-抗原內(nèi)的CDP-阿比可糖和CDP-泰威糖的合成基因的核苷酸序列排列后得到對不同血清型的沙門氏菌特異的寡核苷酸。1996年,Paton,A.W et.al用針對E.coli O111的O-抗原特異的源于wbdI基因的寡核苷酸鑒定了一株產(chǎn)毒素的E.coli O111的血清型[“Molecularmicrobiological investigation of an outbreak of Hemolytic-UremicSyndrome caused by dry fermented sausage contaminated with Shiga-liketoxin producing Escherichiacoli”.J.Clin.Microbiol.341622-1627],但是后來的研究表明Paton,A.W et.al的用源于wbdI基因的寡核苷酸鑒定E.coli O111的血清型的方法有假陽性結(jié)果出現(xiàn)。Bastin D.A.and Reeves,P.R.認為,這是由于wbdI基因是一個推測的糖合成路徑基因[Bastin D.A.andReeves,P.R.(1995)Sequence and analysis of the O antigen gene(rfb)cluster of Escherichia coli O111.Gene 16417-23],而在其它細菌的O-抗原的結(jié)構(gòu)中也可能有這個糖,所以糖合成路徑基因?qū)τ贠-抗原并不是高度特異的。
志賀氏菌有46種血清型,大腸桿菌有166種不同的O-抗原,二者親緣關(guān)系非常近,并且有12種O-抗原是大腸桿菌和志賀氏菌共有的,其中鮑氏志賀氏菌7型就擁有相同的O-抗原[Ewing,W.H.(1986)“Edwards and Ewing’sidentification of the Enterobacteriaceae”.Elsevier SciencePublishers,Amsterdam,The Netherlands;T.cheasty,et al.(1983)“Antigenic relationships between the enteroinvasive Escherichiacoli antigens O28ac,O112ac,O124,O136,O143,O144,O152 and O164 andShigella O antigens”J.clin Microbiol,17(4)681-684],傳統(tǒng)的血清型方法不能將它們區(qū)分。
本發(fā)明的次一目的是提供了鮑氏志賀氏菌7型的O-抗原基因簇的全長核苷酸序列。
本發(fā)明的另一目的是提供了構(gòu)成鮑氏志賀氏菌7型的O-抗原基因簇的基因轉(zhuǎn)運酶的基因即wzx基因或與wzx有相似功能的基因;聚合酶基因即wzy基因或與wzy有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf8、orf10、orf11、orf12基因;糖合成路徑基因,包括flmA,flmB,neuA,flmD,flmH,nue,glf。
本發(fā)明的又一目的是提供了寡核苷酸,它們分別源于鮑氏志賀氏菌7型的O-抗原基因簇中編碼糖基轉(zhuǎn)移酶的基因包括orf8、orf10、orf11、orf12基因;源于編碼轉(zhuǎn)運酶的基因即wzx基因或與wzx有相似功能的基因、源于編碼聚合酶的基因即wzy基因或與wzy有相似功能的基因;它們是上述基因內(nèi)的寡核苷酸,長度在10-20nt;它們對鮑氏志賀氏菌7型的O-抗原是特異的;尤其是表一中列出的寡核苷酸,它們對鮑氏志賀氏菌7型的O-抗原是高度特異的,而且這些寡核苷酸還可重新組合,組合后的寡核苷酸對鮑氏志賀氏菌7型的O-抗原也是高度特異的。
本發(fā)明的再一目的是提供的上述寡核苷酸可作為引物用于核酸擴增反應(yīng),或者作為探針用于雜交反應(yīng),或者用于制造基因芯片或微陣列,從而通過這些方法來檢測和鑒定鮑氏志賀氏菌7型的O-抗原及檢測和鑒定鮑氏志賀氏菌7型。
本發(fā)明的還一目的是提供了分離鮑氏志賀氏菌7型的O-抗原基因簇的全序列的方法。按照本方法操作可以獲得其他細菌的O-抗原基因簇的全序列,也可以獲得編碼其他多糖抗原的細菌的基因簇的全序列。
本發(fā)明的目的是由以下技術(shù)方案實現(xiàn)的。
本發(fā)明對鮑氏志賀氏菌7型的O-抗原特異的核苷酸,其特征在于,其是如SEQ ID NO1所示的分離的核苷酸,全長15796個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。
前述的對鮑氏志賀氏菌7型的O-抗原特異的核苷酸,其特征在于它是由11個基因組成,它們都位于galF基因和gnd基因之間。
前述的對鮑氏志賀氏菌7型的O-抗原特異的核苷酸,其特征在于,所述的基因包括轉(zhuǎn)運酶基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因,包括wzy基因或與wzy有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf8、orf10、orf11、orf12基因;其中所述的wzx基因是SEQ ID NO1中的6714至7928堿基的核苷酸;orf8基因是SEQ ID NO1中的7936至8877堿基的核苷酸;wzy基因是SEQ ID NO1中的8889至10184堿基的核苷酸;orf10基因是SEQ ID NO1中的10186至11148堿基的核苷酸;orf11基因是SEQ IDNO1中的11355至12272堿基的核苷酸;orf12基因是SEQ ID NO1中的12247至13176堿基的核苷酸;前述的對鮑氏志賀氏菌7型的O-抗原特異的核苷酸,其特征在于,其是源于所述的wzx基因、wzy基因或糖基轉(zhuǎn)移酶基因的orf8、orf10、orf11、orf12基因;或糖合成路徑基因中的寡核苷酸;以及它們的混合或它們的重組。
前述的對鮑氏志賀氏菌7型的O-抗原特異的核苷酸,其特征在于,所述的源于wzx的寡核苷酸對是SEQ ID NO1中的6782至6799堿基的核苷酸和7449至7466堿基的核苷酸,SEQ ID NO1中的6971至6989堿基的核苷酸和7481至7498堿基的核苷酸,SEQ ID NO1中的7035至7053堿基的核苷酸和7588至7607堿基的核苷酸;源于orf8的寡核苷酸對是SEQ ID NO1中的8065至8082堿基的核苷酸和8789至8806堿基的核苷酸,SEQ ID NO1中的8134至8152堿基的核苷酸和8685至8704堿基的核苷酸,SEQ ID NO1中的8198至8215堿基的核苷酸和8459至8476堿基的核苷酸;源于wzy的寡核苷酸對是SEQ ID NO1中的9091至9108堿基的核苷酸和9457至9474堿基的核苷酸,SEQ ID NO1中的9357至9376堿基的核苷酸和9704至9721堿基的核苷酸,SEQ ID NO1中的9120至9137堿基的核苷酸和9945至9962堿基的核苷酸;源于orf10的寡核苷酸對是SEQ ID NO1中的10271至10288堿基的核苷酸和11060至11077堿基的核苷酸,SEQ ID NO1中的10375至10393堿基的核苷酸和10790至10808堿基的核苷酸,SEQ ID NO1中的10510至10528堿基的核苷酸和11090至11108堿基的核苷酸;源于orf11的寡核苷酸對是SEQ ID NO1中的11737至11754堿基的核苷酸和12013至12030堿基的核苷酸,SEQ ID NO1中的11367至11384堿基的核苷酸和12154至12171堿基的核苷酸,SEQ ID NO1中的11482至11598堿基的核苷酸和11839至11856堿基的核苷酸;源于orf12的寡核苷酸對是
SEQ ID NO1中的12274至12291堿基的核苷酸和13016至13033堿基的核苷酸,SEQ ID NO1中的12489至12506堿基的核苷酸和13101至13120堿基的核苷酸,SEQ ID NO1中的12384至12401堿基的核苷酸和12959至12976堿基的核苷酸。
前述的對鮑氏志賀氏菌7型的O-抗原特異的核苷酸在檢測表達O-抗原的細菌、在診斷中鑒定細菌的O-抗原和細菌的其它多糖抗原的應(yīng)用。
前述的對鮑氏志賀氏菌7型的O-抗原特異的核苷酸的重組分子,而且通過插入表達可提供表達鮑氏志賀氏菌7型的O-抗原,并成為細菌疫苗。
前述的對鮑氏志賀氏菌7型的O-抗原特異的核苷酸的應(yīng)用,其特征在于,其作為引物用于PCR、作為探針用于雜交反應(yīng)與熒光檢測、或者用于制造基因芯片或微陣列,檢測人體和環(huán)境中的細菌。
前述的對鮑氏志賀氏菌7型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)提取基因組。在LB培養(yǎng)基中37℃過夜培養(yǎng)志賀氏菌,離心收集細胞,用Tris-HCl(pH8.0)和EDTA重懸細胞,37℃溫育20分后加入溶菌酶裂解細菌,加入蛋白酶K和SDS降解蛋白質(zhì),再加入RNase去除RNA;然后用等體積酚及等體積的酚∶氯仿∶異戊醇(25∶24∶1)抽提去除其中的酶和蛋白,再用等體積的乙醚抽提除去殘余的酚;用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA后用70%乙醇洗DNA,最后將DNA重懸于30ulTE中,基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過Long PCR擴增鮑氏志賀氏菌7型中的O-抗原基因簇。首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇啟動子區(qū)的JumpStart序列設(shè)計上游引物(#1523-ATT GTG GCT GCA GGG ATC AAA GAA AT),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計下游引物(#1524-TAG TCG CGT GNG CCT GGA TTA AGT TCG C);用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分;然后94℃變性10秒;60℃退火30秒,68℃延伸15分,這樣進行30個循環(huán);最后,在68℃繼續(xù)延伸7分,得到長度為15796個堿基的PCR產(chǎn)物;合并6管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫。用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫,反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul0.1M MnCl2,1ul1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進行;選擇合適的反應(yīng)時間使酶切后的DNA片段大小集中在1kb-3kb之間,而后加入2ul0.1M EDTA終止反應(yīng),合并4管同樣的反應(yīng)體系,分別用等體積的酚和酚∶氯仿∶異戊醇(25∶24∶1)抽提一次,再用等體積的乙醚抽提兩次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中;隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul100mM DTT和5單位的T4DNA聚合酶,11℃30分,將酶切產(chǎn)物補成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴大為80ul,使DNA的3’端加dA尾,此混合物經(jīng)氯仿∶異戊醇(24∶1)抽提和乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接24小時,總體積為90ul,其中有9ul的10×buffer和25單位的T4DNA連接酶,最后用無水乙醇沉淀連接混合物,70%乙醇洗后溶于30ul水中得到連接產(chǎn)物,用Bio-Rad公司的電轉(zhuǎn)化感受態(tài)細胞的制備方法制備感受態(tài)大腸桿菌DH5α細胞,取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒-6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上37℃過夜培養(yǎng),次日得到藍白菌落。將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時從每個克隆中提取質(zhì)粒并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆構(gòu)成了鮑氏志賀氏菌7型的O-抗原基因簇文庫;(4)對文庫中的克隆測序。從文庫中挑選插入片段在700bp以上的120個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到80%的覆蓋率。剩余20%的序列再根據(jù)已得到的序列設(shè)計引物,兩對引物,如下所示5’-GCATGGGTTACTGTACTAGC-3’和3’-AATGGCATCAATACCCGC-5’及5’-TGGCGGTATTGAGAGAGT-3’和3’-TTACAGGCTACTTCTCTTC-5’,再從鮑氏志賀氏菌7型的基因組DNA中直接PCR并對PCR產(chǎn)物測序,從而獲得O-抗原基因簇的所有序列。
(5)核苷酸序列的拼接及分析。用英國劍橋MRC(Medical Research Council)分子生物學實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到鮑氏志賀氏菌7型的O-抗原基因簇的核苷酸全長序列(見序列列表)。序列的質(zhì)量主要由兩個方面來保證1)對鮑氏志賀氏菌7型的基因組作6個Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫。2)對每個堿基,保證3個以上高質(zhì)量的覆蓋率。在得到鮑氏志賀氏菌7型O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學中心(The NationalCenter for Biotechnology Information,NCBI)的orffinder發(fā)現(xiàn)基因,找到13個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對,最后得到鮑氏志賀氏菌7型的O-抗原基因簇的結(jié)構(gòu),(6)特異基因的篩選。針對鮑氏志賀氏菌7型的O-抗原基因簇中的wzx、wzy、orf8、orf10、orf11、orf12基因設(shè)計引物。在每個基因內(nèi)各設(shè)計了三對引物,每對引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,在各組中都沒有擴增到任何大小正確的帶,即在大多數(shù)組中沒有得到任何PCR產(chǎn)物帶,雖然在少數(shù)組中得到PDR產(chǎn)物帶,但其大小不符合預(yù)期大小,所以wzx、wzy、orf8、orf10、orf11、orf12基因?qū)︴U氏志賀氏菌7型的O-抗原都是高度特異的。
也就是,在本發(fā)明的第一個方面,提供了鮑氏志賀氏菌7型的O-抗原基因簇的全長核苷酸序列,它的全序列如SEQ ID NO1所示,全長15796個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。通過本發(fā)明的方法得到了鮑氏志賀氏菌7型的O-抗原基因簇的結(jié)構(gòu),如表3所示,它總共由11個基因組成,都位于galF基因和gnd基因之間。
在本發(fā)明的第二個方面,提供了鮑氏志賀氏菌7型的O-抗原基因簇中的基因,即轉(zhuǎn)運酶基因(wzx基因或與wzx有相似功能的基因);聚合酶基因(wzy基因或與wzy有相似功能的基因);糖基轉(zhuǎn)移酶基因,包括orf8、orf10、orf11、orf12基因;細菌多糖抗原中特殊的糖合成路徑基因,包括flmA,flmB,neuA,flmD,flmH,nue,glf基因,它們在O-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在表4中。本發(fā)明尤其涉及到糖基轉(zhuǎn)移酶基因、轉(zhuǎn)運酶基因和聚合酶基因,因為糖合成路徑基因即合成核苷二磷酸單糖的基因現(xiàn)在被預(yù)示對較多胞外多糖是常見的、共同的,對細菌的O-抗原并不是很特異的,而本發(fā)明涉及到的糖基轉(zhuǎn)移酶基因、轉(zhuǎn)運酶基因和聚合酶基因?qū)︴U氏志賀氏菌7型的O-抗原是高度特異的。
在本發(fā)明的第三個方面,提供了源于鮑氏志賀氏菌7型的O-抗原基因簇中的wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因和糖基轉(zhuǎn)移酶基因,包括orf8、orf10、orf11、orf12基因的寡核苷酸,它們是這些基因中的任何一段寡核苷酸。但是,優(yōu)先被用的是列于表一中的寡核苷酸對,在表一中也列出了這些寡核苷酸對在O-抗原基因簇中的位置及以這些寡核苷酸對為引物所做的PCR反應(yīng)的產(chǎn)物的大小,這些PCR反應(yīng)可用表中的退火溫度進行。這些引物只在以鮑氏志賀氏菌7型為模板進行的PCR擴增中得到預(yù)期大小的產(chǎn)物,而在以表二所列的166株大腸桿菌和43株志賀氏菌為模板進行的PCR擴增中都未得到預(yù)期大小的產(chǎn)物。更詳細地說,以這些寡核苷酸對為引物所做的PCR反應(yīng)在大多數(shù)細菌中均未得到任何產(chǎn)物,雖然在有些菌中得到了PCR產(chǎn)物帶,但其大小不符合預(yù)期大小,這是由于引物結(jié)合到基因組的別的位置造成,這種問題可通過用基因內(nèi)的其它引物做PCR來避免。所以,可以確定這些引物即表一所列的寡核苷酸對鮑氏志賀氏菌7型及它們的O-抗原是高度特異的。
本發(fā)明的其他方面由于本文的技術(shù)的公開,對本領(lǐng)域的技術(shù)人員而言是顯而易見的。
如本發(fā)明所用,“寡核苷酸”是指來源于O-抗原基因簇中的編碼糖基轉(zhuǎn)移酶的基因、編碼轉(zhuǎn)運酶的基因和編碼聚合酶的基因內(nèi)的一段核苷酸分子,它們在長度上可改變,一般在10到20個核苷酸范圍內(nèi)改變。更確切的說這些寡核苷酸是源于wzx基因(核苷酸位置是從SEQ ID NO1的6714至7928堿基),orf8基因(核苷酸位置是從SEQ ID NO1的7936至8877堿基),wzy基因(核苷酸位置是從SEQ ID NO1的8889至10184堿基),orf10基因(核苷酸位置是從SEQ ID NO1的10186至11148堿基),orf11基因(核苷酸位置是從SEQID NO1的11355至12272堿基),orf12基因(核苷酸位置是從SEQ ID NO1的12247至13176堿基)。源于以上基因內(nèi)的寡核苷酸對鮑氏志賀氏菌7型(SEQID NO1)都是高度特異的。
此外,有時兩個遺傳相似的編碼不同O-抗原的基因簇通過基因重組或突變產(chǎn)生新的O-抗原,從而產(chǎn)生新的細菌類型,新的突變株。在這種環(huán)境中,需要篩選出多對寡核苷酸同重組基因雜交以提高檢測的特異性。因此,本發(fā)明提供了一整套多對寡核苷酸的混合物,它們源于糖基轉(zhuǎn)移酶基因;源于轉(zhuǎn)運酶和聚合酶基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因;也源于糖合成路徑基因。這些基因的混合物對一個特殊的細菌多糖抗原來說是特異的,從而使這套寡核苷酸對這個細菌的多糖抗原是特異的。更具體地說,這些寡核苷酸的混合物是源于糖基轉(zhuǎn)移酶基因、wzx基因或與wzx有相似功能的基因、wzy或與wzy有相似功能的基因中的寡核苷酸與源于糖合成路徑基因中的寡核苷酸的組合。
在另一方面,本發(fā)明涉及寡核苷酸的鑒定,它們可以用于檢測表達O-抗原的細菌和在診斷中鑒定細菌的O-抗原。
本發(fā)明涉及到一種檢測食品中的一個或多個細菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼轉(zhuǎn)運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交,這些細菌是鮑氏志賀氏菌7型或??捎肞CR方法檢測,更可以將本發(fā)明方法中的核苷酸標記后作為探針通過雜交反應(yīng)如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
本發(fā)明者考慮到以下情況當單個的特異的寡核苷酸檢測無效時,寡核苷酸的混合物能與靶區(qū)域特異性雜交以檢測樣品。因此本發(fā)明提供了一套寡核苷酸用于本發(fā)明所述的檢測方法。這里所說的寡核苷酸是指源于編碼糖基轉(zhuǎn)移酶的基因、編碼轉(zhuǎn)運酶的基因和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的寡核苷酸。這套寡核苷酸對一個特殊的細菌的O-抗原來說是特異的,這一特殊的細菌O-抗原是由鮑氏志賀氏菌7型或表達的。
另一方面,本發(fā)明涉及到一種檢測排泄物中的一個或多個細菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼轉(zhuǎn)運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交。這些細菌是鮑氏志賀氏菌7型或??捎帽景l(fā)明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發(fā)明中的寡核苷酸分子標記后作為探針通過雜交反應(yīng)如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
一般一對寡核苷酸可能與同樣的基因雜交也可與不同的基因雜交,但它們中必須有一個寡核苷酸能特異性雜交到特殊抗原型的特異序列上,另一個寡核苷酸可雜交于非特異性區(qū)域。因此,當特殊的多糖抗原基因簇中的寡核苷酸被重新組合時,至少能選出一對寡核苷酸與多糖抗原基因簇中特異基因混合物雜交,或者選出多對寡核苷酸與特異基因的混合物雜交。甚至即使當一個特殊的基因簇中所有基因都獨一無二時,此方法也能應(yīng)用于識別此基因簇內(nèi)的基因混合物的核苷酸分子。因此本發(fā)明提供了一整套用于檢測本發(fā)明方法的多對寡核苷酸,在這里多對寡核苷酸是源于編碼糖基轉(zhuǎn)移酶的基因、編碼轉(zhuǎn)運酶和聚合酶的基因包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因,這套寡核苷酸對一個特殊的細菌多糖來說是特異的,這套寡核苷酸可能是糖合成中必須基因的核苷酸。
另一方面,本發(fā)明也涉及到一種檢測源于病人的樣品中的一個或多個細菌多糖抗原的方法。樣品中的一個或多個細菌多糖抗原可以使樣品能與以下至少一個基因中的一對寡核苷酸中的一個特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼轉(zhuǎn)運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與樣品中的至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交,這些細菌是鮑氏志賀氏菌7型或??捎帽景l(fā)明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發(fā)明中的寡核苷酸標記后作為探針通過雜交反應(yīng),或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
更詳細地說,以上描述的方法可以理解為當寡核苷酸對被使用時,其中的一個寡核苷酸分子能雜交到一個并不是來源于糖基轉(zhuǎn)移酶基因、wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的序列上。此外,當兩個寡核苷酸都能雜交上時,它們可能雜交于同一基因也可能雜交到不同基因上。也即,當交叉反應(yīng)出現(xiàn)問題時,可選擇寡核苷酸的混合物來檢測混合的基因以提供檢測的特異性。
本發(fā)明者相信本發(fā)明不必限于以上所提的核苷酸序列編碼的特定的O-抗原,而且廣泛應(yīng)用于檢測所有表達O-抗原和鑒定O-抗原的細菌。而且,由于O-抗原合成和其他多糖抗原(如細菌胞外抗原)合成之間的相似性,發(fā)明者相信本發(fā)明的方法和分子也應(yīng)用于這些其他的多糖抗原。
本發(fā)明首次公開了鮑氏志賀氏菌7型的O-抗原基因簇的全長序列,而且可從這個未被克隆的全長基因簇的序列中產(chǎn)生重組分子,通過插入表達可產(chǎn)生表達鮑氏志賀氏菌7型的O-抗原,并成為有用的疫苗。
具體實施例方式
下面結(jié)合具體實施例,進一步闡述本發(fā)明。應(yīng)理解這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件如Sambrook等人,分子克隆實驗室手冊(NewYorkCold Spring Harbor Laboratory Press,1989)中所述的條件。實施例1基因組的提取。
在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)志賀氏菌,離心收集細胞。用500ul50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細胞,37℃溫育20分,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃30分。加等體積酚抽提混合物,取上清液液再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)抽提兩次,取上清液液再用等體積的乙醚抽提以除去殘余的酚。上清液液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中?;蚪MDNA通過0.4%的瓊脂糖凝膠電泳檢測。實施例2通過PCR擴增鮑氏志賀氏菌7型中的O-抗原基因簇。
鮑氏志賀氏菌7型的O-抗原基因簇通過Long PCR擴增。首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇啟動子區(qū)的JumpStart序列設(shè)計上游引物(#1523-ATTGTG GCT GCA GGG ATC AAA GAA AT),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計下游引物(#1524-TAG TCG CGT GNG CCT GGA TTA AGT TCG C)。用BoehringerMannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分;然后94℃變性10秒,60℃退火30秒,68℃延伸15分,這樣進行30個循環(huán)。最后,在68℃繼續(xù)延伸7分,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性。合并6管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物。實施例3構(gòu)建O-抗原基因簇文庫。
首先是連接產(chǎn)物的獲得用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫。反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進行。酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng)。合并4管同樣的反應(yīng)體系,分別用等體積的酚和酚∶氯仿∶異戊醇(25∶24∶1)抽提一次,再用等體積的乙醚抽提兩次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中。隨后在此混合物中加入2.5uldNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃30分,將酶切產(chǎn)物補成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴大為80ul,70℃反應(yīng)20分,使DNA的3’端加dA尾。此混合物經(jīng)等體積氯仿∶異戊醇抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接24小時,總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶。最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物。
其次是感受態(tài)細胞的制備參照Bio-Rad公司提供的方法制備感受態(tài)細胞大腸桿菌DH5α。取一環(huán)大腸桿菌DH5α單菌落于5ml的LB培養(yǎng)基中,180rpm培養(yǎng)10小時后,取2ml培養(yǎng)物轉(zhuǎn)接到200ml的LB培養(yǎng)基中,37℃250rpm劇烈振蕩培養(yǎng)到OD600 0.5左右,然后冰浴冷卻20分,于4℃4000rpm離心15分。傾盡上清液液,用冷的冰預(yù)冷的去離子滅菌水200ml吹散菌體,于4℃4000rpm離心15分。再用冷的冰預(yù)冷的去離子滅菌水100ml吹散菌體,于4℃4000rpm離心15分。用冷的冰預(yù)冷的10%的甘油懸浮細胞,4℃ 6000rpm離心10分,棄上清液液,最后沉淀用1ml冰預(yù)冷的10%的甘油懸浮細胞,即為感受態(tài)細胞。將制得的感受態(tài)細胞分裝為50ul一管,-70℃保存。
最后是電轉(zhuǎn)化感受態(tài)細胞取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒-6.0ms毫秒。電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇。然后立即將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上37℃倒置過夜培養(yǎng),次日得到藍白菌落。將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時從每個克隆中提取質(zhì)粒并用EcoRI酶切鑒定其中的插入片段的大小,得到白色克隆群構(gòu)成了鮑氏志賀氏菌7型的O-抗原基因簇文庫。實施例4對文庫中的克隆測序從文庫中挑選插入片段在700bp以上的120個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到80%的覆蓋率。剩余20%的序列再根據(jù)已得到的序列設(shè)計引物,再從鮑氏志賀氏菌7型的基因組DNA中直接PCR并對PCR產(chǎn)物測序,從而獲得O-抗原基因簇的所有序列。在鮑氏志賀氏菌7型中我們設(shè)計了兩對引物,如下所示5’-GCATGGGTTACTGTACTAGC-3’和3’-AATGGCATCAATACCCGC-5’5’-TGGCGGTATTGAGAGAGT-3’和3’-TTACAGGCTACTTCTCTTC-5’實施例5核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到鮑氏志賀氏菌7型的O-抗原基因簇的核苷酸全長序列(見序列列表)。序列的質(zhì)量主要由兩個方面來保證1)對鮑氏志賀氏菌7型的基因組作6個Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫。2)對每個堿基,保證3個以上高質(zhì)量的覆蓋率。在得到鮑氏志賀氏菌7型O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學中心(The National Center for BiotechnologyInformation,NCBI)的orffinder發(fā)現(xiàn)基因,找到13個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對,最后得到鮑氏志賀氏菌7型的O-抗原基因簇的結(jié)構(gòu),如表3所示。
通過檢索和比較,發(fā)現(xiàn)orf1與Aeromonas punctata的合成酶flmA基因在197個氨基酸的序列中都有53%的相同性,表明它們之間有高度的同源性。所以可以確定orf1是flmA基因。orf2與Aeromonas punctata的合成酶flmB基因在378個氨基酸的序列中都有61%的相同性,表明它們之間有高度的同源性。所以可以確定orf2是flmB基因。orf3與Aeromonas punctata的nueA基因在227個氨基酸的序列中有56%的相同性,表明它們之間有高度的同源性。所以,可以確定orf3是neuA基因。orf4與Aeromonas punctata的flmD基因在361氨基酸的序列中有33%的相同性,53%的相似性,表明它們之間也有高度的同源性。所以,可以確定orf4是flmD基因。orf5與Aeromonaspunctata的flmH基因在227個氨基酸的序列中有35%的相同性,59%的相似性,表明它們之間有高度的同源性。所以,可以確定orf5是flmH基因。Orf6與Aeromonas punctata的neuB基因在361氨基酸的序列中有73%的相同性,84%的相似性,表明它們之間也有高度的同源性。所以,可以確定orf6是neuB基因。Orf7與大腸桿菌的wzx基因在307個氨基酸序列中有23%的相同性,并且通過Eisenberg等人的算法[Eisenberg,D,Schwarz,E.etal(1984).Analysis ofmembrane and surface protein sequences with the hydrophobic momentplot.J.Mol.Biol.179125-142]發(fā)現(xiàn)orf7有12個潛在的穿膜區(qū),它與許多wzx蛋白相似,而且在wzx蛋白的氨基端有一個大約50個氨基酸的保守基序,所以可以確定orf7是wzx基因,命名為wzx。Orf8與Salmonella enterica的glycosyltansferase基因在286個氨基酸中有29%的相同性,是一個糖基轉(zhuǎn)移酶基因,命名為orf8。 Orf9與大腸桿菌的wzy基因在306個氨基酸序列中有20%的相同性,另外通過Eisenberg算法得知orf9有10個潛在的穿膜區(qū),與其他的O-抗原聚合酶有相似的二級結(jié)構(gòu),所以確定orf9就是wzy基因,命名為wzy。Orf11與S.boydii的糖基轉(zhuǎn)移酶基因在239個氨基酸序列中有32%的相同性,51%的相似性,所以確定orf11是一個乙酰基轉(zhuǎn)移酶基因,命名為orf11。Orf12與Methanothermobacter thermautotrophicas的糖基轉(zhuǎn)移酶基因在286個氨基酸序列中有36%的相同性,51%的相似性,所以確定orf12是一個糖基轉(zhuǎn)移酶基因,命名為orf12。 Orf12與Pseudomonas aeruginosa的合成酶wbpS基因在628個氨基酸序列中有56%的相同性,72%的相似性,所以確定orf12是一個合成酶酶基因,命名為orf12,Orf13與Pseudomonastyphimurium LT2的glf基因在381個氨基酸序列中有58%的相同性,73%的相似性,所以可以確定orf13是glf基因,命名為glf。根據(jù)鮑氏志賀氏菌7型的O-抗原結(jié)構(gòu)可知還需要有1個糖基轉(zhuǎn)移酶基因,orf10與已知序列無明顯同源性,但具有糖基轉(zhuǎn)移酶的特征,是1個糖基轉(zhuǎn)移酶,命名為orf10。實施例6特異基因的篩選。針對鮑氏志賀氏菌7型的O-抗原基因簇中的wzx、wzy、orf8、orf10、orf11、orf12基因設(shè)計引物,這些基因在核苷酸序列中的位置見表1所示。
表1列出了鮑氏志賀氏菌7型的O抗原基因簇中糖基轉(zhuǎn)移酶基因和寡糖單位處理基因及基因內(nèi)的引物及PCR數(shù)據(jù)。在表中列出了鮑氏志賀氏菌7型的O抗原基因簇的糖基轉(zhuǎn)移酶基因、轉(zhuǎn)運酶基因和聚合酶基因及它們的相應(yīng)的功能和大小。在每個基因內(nèi),我們各設(shè)計了三對引物,每對引物分布在相應(yīng)基因內(nèi)的不同地方以確保其特異性。在表中還列出了每個引物在SEQ IDNO1中的位置和大小。以每對引物用表中所列的相應(yīng)的退火溫度以表二中的所有菌的基因組為模板進行PCR,得到了相應(yīng)的PCR產(chǎn)物,其大小也列于表中。
mdh(malate dehydrogenase)基因是存在于所有的大腸桿菌的基因組中且高度保守的一個基因,所以我們根據(jù)mdh基因設(shè)計了引物#101(-TTC ATC CTAAAC TCC TTA TT)和#102(-TAA TCG CAG GGG AAA GCA GG),然后從166株大腸桿菌中提取基因組,方法如前所述。用這對引物從166株大腸桿菌的基因組中PCR以鑒定大腸桿菌并檢測其基因組的質(zhì)量。
表2是用于篩選特異基因的166株大腸桿菌和43株志賀氏菌及它們的來源,為了檢測的方便,我們將它們每8-10個菌分為一組,總共27組,它們的來源都列于表中。
在第23組中含有鮑氏志賀氏菌7型的基因組DNA作為陽性對照。以每組菌做模板,用表一中的每對引物按如下條件做PCR在94℃預(yù)變性2分后,94℃變性15秒,退火溫度因引物的不同而不同(參照表一),退火時間是50秒,72℃延伸2分,這樣進行30個循環(huán)。最后在72℃繼續(xù)延伸10分,反應(yīng)體系是25ul。反應(yīng)完畢后,取10ulPCR產(chǎn)物通過0.8%瓊脂糖凝膠電泳檢測擴增出的片段。
對于wzx、wzy、orf8、orf10、orf11、orf12基因,每個基因都有1至3對引物被檢測,每對引物除了在第23組中做PCR后得到了預(yù)期大小的正確的一條帶外,在第18組中也都得到同樣大小的特異性帶。以第18組中的每個菌的基因組DNA做模板PCR后,發(fā)現(xiàn)只在中得到了陽性結(jié)果。更詳細地說,以上每個基因的每一對引物都在中得到預(yù)期大小的正確的PCR產(chǎn)物帶。據(jù)報道,鮑氏志賀氏菌7型的O-抗原結(jié)構(gòu)是一樣的,我們的結(jié)果從另一個側(cè)面證實了這一點。此外,所有的引物在其他組中都沒有擴增到任何大小正確的帶,也就是說,在大多數(shù)組中沒有得到任何PCR產(chǎn)物帶,雖然在少數(shù)組中得到PCR產(chǎn)物帶,但其大小不符合預(yù)期大小,所以wzx、wzy、orf8、orf10、orf11、orf12基因?qū)︴U氏志賀氏菌7型及其O-抗原都是高度特異的。
最后,通過PCR從鮑氏志賀氏菌7型中篩選到對鮑氏志賀氏菌7型的O-抗原高度特異的基因wzx、wzy和四個糖基轉(zhuǎn)移酶基因。而這些基因內(nèi)的任何一段10-20nt的寡核苷酸對鮑氏志賀氏菌7型的O-抗原是特異的,尤其是上述每個基因中的引物即寡核苷酸對經(jīng)PCR檢測后證實對鮑氏志賀氏菌7型是高度特異的。所有的這些寡核苷酸都可用于快速準確地檢測人體和環(huán)境中的鮑氏志賀氏菌7型,并能鑒定它們的O-抗原。
表3是鮑氏志賀氏菌7型的O-抗原基因簇的結(jié)構(gòu)表,在表中列出了鮑氏志賀氏菌7型的O-抗原基因簇的結(jié)構(gòu),共由13個基因組成,每個基因用方框表示,并在方框內(nèi)寫入基因的名稱,數(shù)字表示的是O-抗原基因簇中的開放閱讀框(orf)的順序。在O-抗原基因簇的兩端是galF基因和gnd基因,這兩個基因不負責O-抗原的合成,我們只是用它們的一段序列設(shè)計引物來擴增O-抗原基因簇的全長序列。
表4是鮑氏志賀氏菌7型的O-抗原基因簇中的基因的位置表,在表中列出了鮑氏志賀氏菌7型的O-抗原基因簇中的所有開放閱讀框在全序列中的準確位置,在每個開放閱讀框的起始密碼子和終止密碼子的下面劃線。
序列列表SEQUENCE LISTING<110>南開大學<120>對鮑氏志賀氏菌7型的O-抗原特異的核苷酸<130>對鮑氏志賀氏菌7型的O-抗原特異的核苷酸<160>1<170>PatentIn version 3.1<210>1<211>15796<212>DNA<213>Shigella boydii<400>1ctcctggtga ctcatgcgtc caagaacgcg gtcgaaaacc acttcgacac ctcatatgaa 60ttagaatcgc tccttgaaca gcgtgtaaaa cgccagttgc tggcggaagt tcagtccatc120tgcccaccgg gcgtcaccat tatgaatgtg cgtcagagcg aacctttagg tttgggccac180tccattttgt gcgccagacc cgccattggc gacaatccat tcgttgtggt gctgcctgat240gtcgttattg atgatgccag cgccgatccg ctgcgttaca accttgccgc tatgattgcg300cgattcaacg aaacgggtcg cagtcaggtt ctggcaaaac gtatgccggg tgacctctct360gaatactctg tcatccagac taaagaaccg ctggatcgtg aaggcaaagt cagtcgcatt420gttgaattta tcgaaaaacc cgatcagccg cagacactgg attcagacat tatggcggtt480ggtcgctatg tgctttctgc agacatttgg cctgaactgg agcggactca acccggtgca540tggggacgta ttcagctaac tgacgcaatt gccgaactgg cgaaaaaaca gtccgttgat600gcaatgttaa tgacgggtga cagctacgac tgcggtaaaa aaatgggcta catgcaggca660tttgtgaagt acggactacg caacctgaaa gaaggagtga agttccgcaa agggattgag720cagctgttaa gcgaataaaa atcttaccgg atgtaacggt taataagaaa atcataacgg780cagtgaagat tcgtggtgaa agtaaattgc aacgaatgtt cctgccgtta ttgctttata840aaacactata ataacaatga gttagcaata agattttagt caaatttttc caggattttc900cttgtttcca gagcggattg gtaagacaat tagcgtttga atttttcggg tttagcgcga960gtgggtaatg ctcgtcacat cgtaggtatg catgcagtgc tctggtagct gttaagccag 1020gggcggtagc gtgtgttaaa cttaaggggg ttgttgcgag taatcaagat cgcggcaatt 1080tcggattgtg tcttattttg ataataaaac tatcctgata actggtggta ctggctcatt 1140cggcaataag tttgtgcgca tgacattaga taaatataac cctaaaaaga ttattattta 1200ttctcgtgat gaaatgaaac agtgggaaat ggcaaaacat ttcaaggacg aaagccgaat 1260tcgattcttt attggggatg ttcgtgataa agatcgtttg tatcgtgcgt tggatggtgt 1320tgactttgtt gttcacgccg cagcaacaaa aatcgtacct acagcagagt ataatccctt 1380cgaatgtgta aaaacaaata tcaatggtgc gatgaatgtg attgatgctt gtatcgataa 1440aggtatcgaa cgtgttgttg cactttctac tgataaagca agcagccctg cgaatctgta 1500tggtgcaaca aaattagcat ccgataaact tttcgttgct ggtaactctt attctggtgc 1560gacaaaaact cgttttgctg ttgttcgcta cggaaatgta atgggatcac gtggttcggt 1620aataccgttc ttcttatcta tcaaagaaaa aggagaattg cctattactg atgatcgtat 1680gactcgcttt atgattactc tggagcaggg ggttgagtta gtttggcatg cgtttgaaga 1740tatggtcggt ggtgaaattt atgtaaaaaa aataccttcg atgaaagtaa ctgatatagc 1800aacagctgtt gcgcctaatg ctacacaaaa aatggtcggt attcgaccgg gcgagaaact 1860acacgagcag atgatcagtg ctgaagatgc ttattacact tatgaatatc cagagcattt 1920taagattctt ccagccattc acaactggtg taactcacct gaaaggatta aagatggtaa 1980aaaagtgcca gaaggcttcg tctatgaaag tgatagtaac gcagaatgga tgagtattga 2040agaacttcgt caatggatcg aggataatag agaaaaagta ggtaacattt gatgaaattt 2100attccctatg gacggcagga tgtttctgat gaagatatcc atgctgtggt ggatgtactg 2160aagtccgatt ttttgacgca aggaccatgt gttccccaat ttgagaaggc aattgctgat 2220tatgtgaatg ctaagtatgc agttgcagta aatagtgcta cttcagcact tcacattgct 2280tgtctcgcgt tggggatgaa gaaaggcgat tggctttgga catcgccaaa tacatttgtt 2340gcttctgcga actgtgctct ttattgcggt gctaatgtca gttttgtcga tattgatgcg 2400cggacttata atatgagtgt tagcgcgtta gaagcgaaac ttatgtctgc aaggaacaat 2460ggaacattgc ctaaggttgt tgttcctgtc gcatttgcag gacagtcatg tgaaatggag 2520gaaatatata aactctcaaa agagtatgga ttttcaatta tcgaagatgc ttcgcatgct 2580attggaggaa attaccaggg aaagaaaata ggtaattcgc gctttgcaga tattactata 2640ttgagcttcc atcctgttaa aattattaca actgcagaag gtggtatggc tctaaccaat 2700aatgatgatt tggcagaaaa aatgcagtta ttccgtagtc atgggatcac tcgtgatagt 2760aatcatatga cgaaggtaag tgaaggagga tggtattatc aacaagttga tcttggtctg 2820aattaccgaa tgactgaact gcaggctgca ttaggcgtga gtcagctgaa gagtattgat 2880gattttgtaa cacgccgcca tgaactggtt gaacgttaca aaaaagctct cgaagatatt 2940cctatttccc taccatacca ggcggaaagt ggtcacagtg cctttcacct ttatcctgta 3000accgttaaaa attctgcaca gcggaaaact ttgtttgatt atctgcggaa taaaaatatc 3060ggggttaatg tccattatat tccagttcat actcaaccgt attatgaaaa gttagggcat 3120aaaatcggag attatcctgt cgctgaggat tattactctc gaaccatcag cataccgatg 3180tattctgctt tgacaaatga agaccaggat tatgtaatcc aatgcattcg ggagtttttt 3240taaatgaatg tggcaatcat tccagctcgt ggtggtagta aacgtatccc tcgaaaaaat 3300attaaaatgt tttgcgggaa accaatgatt gcctggtcga ttaatgccgc tcgaaagagc 3360ggcgtgtttg acagaatcat tgtttcgacg gatgatatgg agattgcagc tgtagcaaga 3420aaattcggcg ccgaagttcc gtttatgcgg ccagaagaac tttcgaatga ttttactgga 3480acaatccctg ttatacggca tgcggctgaa tggcttattt ctcagggaaa taaaataaaa 3540tatatttgct gcatttatgc aacggccccc tttattagag atgaagattt aaaactaggt 3600ttgaacctta tcaaagcaaa ggggggggat tattgttttt ctgttactac ttattcgtac 3660cctattcaaa gagcattaaa aattaatgag aataacgaaa taaccatgtt tgatccgact 3720cagtttgaaa tgcgatctca agatcttgtg gacgcttggc atgatgccgg gcaattttat 3780tgggggaata ttgatgcatg gataaaagaa aaaccggtat ttaagtcaca ggctatacca 3840ttacctttgc ctagagaacg agtgcaagat attgatacgc cggaagattg gcatttcgct 3900gaggtgttat ataggataaa tacaataaaa aatgaagatt gtatttaggg ttgatgcttc 3960gctttcaatt ggttcaggac atgtttttcg ttgtctaaat cttgctggtg cattgagaaa 4020gaatggtttt gaatgcattt ttcttacaaa ggaacatgca ggaaacttaa ttcaatatat 4080aaagacatat ttgttccaag tatatgttat ttcaaaggaa gataatgttg atgataaata 4140tattgaaaat gaaaaagagt ggttaggagg gagtcaaaaa gaagacgctg aaaaaacttg 4200tgaaattatt tacagaaata attttgcacc aggcatattt attattgatc attattcatt 4260agattctgaa tgggaaagtt taattaaatg gaaatttcca agtacaaaaa ttgttgttat 4320tgacgacttg tgtaatagaa aacattattg tgatatcctg attgattcaa catttgagcg 4380tacttctgag gaatatagga gattagttcc tgaatattgt actattttgg ccggtactga 4440ctatgcttta ctgaaagatg aatttttgca attgcgcaaa gaagccatat taaaacgtac 4500atctatatta agccctcaga aaattttaat tactatggga ggggttgata tacataacgt 4560gactgggaaa gttttaaaag aattaaataa tagagctgat cttcattata aaaagatcac 4620tgttgtatta ggggtgaatt gccctcataa aaaaaacatt gaaaatattg cacaatcgat 4680aaaatatgat gtggatataa aagtgaatac caacaatatg ccacaactta tgttagaaca 4740tgatttatct attggagctt taggaagtac tacttgggag agagctgtgc ttggattacc 4800cacagtaaat attgctattg ctgacaatca actggttatt gtagagaaac taaggcgaaa 4860tggttttatt gtctttgata gcattaattt tactggggtg gaattagctc gttctttaat 4920aaaggtaact gatttctatg atgaaatggt gtctcgctcg ctctctatat gtgatggcag 4980gggattacaa aggacactaa aatttataat atctttagct acaaataaat aatgagacat 5040gcttatgact ggcaaaaata taaaaaaatt aaatttgctt aacattgttc attcttcgga 5100ggatattcaa gaaaaagttc gatgtataag aaatgaacct caaattagga agtggatgta 5160tacagatcat cttatatcaa aagatgagca taaaaattgg attgaaagat taagaaatga 5220atcaagaaat tttgtgtatg tcgtaatgaa tgactacgat gagcctattg gtgtcgttag 5280tgtaaattcg attgatttga aaaacaaaaa aggagactgg gcatattatt tgacagcaaa 5340tacacgtact ggtattggtg ctgtattaga attttttgtg attgattatg tttttaacta 5400tttgcatctt gaaaaattaa attgtgaggt aattgaacat aatgataccg tcgttcgatt 5460acatgagaaa tttgggttta agcaggaagg atttagagag tctaatatta taaaggatga 5520taagcgtttt ggagtttatt attttggttt aacgaaagaa aaatggatgc taacacgaga 5580atgtttaaag aataaatatt ataagctttt ttctcaatac gcggttgatt ttcattaata 5640ggtttatttt tggggtgata aatgaaagca attactattg caggacgtaa aattggtaaa 5700gattttcctc catatatcat tgctgaatta tcggctaatc ataatggaga tataaatcgt 5760gcatttaaga taatggaaga ggcaaaagca gctggagctg atgctgtaaa attacagaca 5820tatagagcag atactataac gctggattgt gattctgaag agtttcaaat acatggtggt 5880ttatggggtg gtcagacatt gtatagctta tatcaaagtg ctcaaatgcc ttgggaatgg 5940cataagccat tatttgataa ggcaaaagag ttaggcatta ctatttttag cagtcctttt 6000gattttactg ctgttgattt attagaagaa ttaggtgctc cggcttataa aatagcgtca 6060ttcgaagcta ttgatttacc gctaattcga tatgtagctc aaactgggaa accgatgatt 6120atctcgacag ggatggctga tgaacaggag attcaggagg cgatccatgt agctaaagaa 6180ggcggttgta aggagctcgt tgtcttgcat tgcgtaagtg gatatccggc tccaccagag 6240gattacaatc ttgccacaat ccctgacatg gctaaaaaat ttaacgttat aacaggtctg 6300tcagaccata caatagataa tactacggcg atagcatccg ttgcattagg agcgagtgtg 6360atcgaaaagc atgtaacact tgatcgtaat ggaggagggc cagacgatag tttctcactt 6420gaaccaagtg agcttacagt tctttgccgt gatgcaaaga tcgcttggca ggctttaggt 6480agaataaact ataccagaaa gccaagtgag atgggaaacg ttcaatttag acgttcattg 6540tattttgtta aagatatgaa agctggtgat attattgatg aaacatgtgt gcgcagtgtg 6600cggccaggct atggattacc acctaaatat tttgatgatt taattggtaa gcgagttatt 6660agtgatgtta tggccaatac ccgaacatca ttggaattaa ttgcagattt aaaatgaaag 6720ttattaaaga tagtgttctg tatgtaatag gtgagttgat atctaaaagt gttccatttc 6780tattgcttcc ctatcttaca aggcggttgg gaattgatgg ttttggagaa atgtcatttt 6840atcagacaat acttgcttta ttggttatcg ttataagctt agggcaagat ggggctgttg 6900ctagatattt ttatttctac ggagcccgtt ctataaattt gattgtgact gtaggtgctt 6960tatattcact tgtgacgaca tccctattgt ttttatcgtt ttcatttttt aaatccacga 7020tattatcaat tattgtgttg actgctggat ttcaatcact tttcaatacg cagctaagtc 7080ttaggcagtg ccaaaaagag tcagttcagt atattgtcat gcaaatatta gttgcgttga 7140cttctggtgg tataaccttt tgtttactgg aaatatatag tcatgattta gttgaaaaga 7200gatttattgc attgcttttg agtaatatag tttgtgtttt tattgcttat cttatttata 7260tgaggagacg gaaatataat cacgcatttt tatttcgacg atattatagt gcattgctat 7320acttgattgg ttttggaggc ccattgattt tgcatcaaat aagtggcttt cttaaaggac 7380aattagatcg agttttgata tatagccgtt tttctgcttc agatttaggg ggctattctg 7440ctgcatttca aatagcctca gttctcttga tactgataat ggcgttgaat aaagcactag 7500ttccatatta ttatagtgag ctcaaaaaaa agcatatagt ctttgatgat ataaaaaaaa 7560cttgcgtttt tttatttcta ttgattccac ttccatcaat catatcgttg attattcctg 7620ctgatttttg gtgttttatt ttaggaaatg aatttgttga tgttaaatat tacatcgcta 7680tattcctatt aggtataggt tttacaatac cttatctttt actagtgaat tatctttttt 7740attatggtaa aaataaaagt ataactatct gttcagtcat ttcaacatct atttattgca 7800ttgttcttta ttttttatca tgtttaggta tttcttatgt tccatattct atgttgatag 7860caaatatgct aatcgttcct ttactttata tggctgccaa aaaaacatca atgcttgaac 7920gccagtgaga ttaatatgcc ctcgttattt atatgtgtta cgccactgca aatgttgatt 7980gctgaaaaaa taattgataa aaccaggcca gtaaacatag aaattatagt gcttgcatat 8040cagaaaaatg ataaatatat gcattacata aagcggttgg agaaaaaatg tactaatttt 8100acagttttgg ctgtaacgcc aaaaaataaa tttgtaaccg tgatcgcctt tgcaaaatta 8160cataccatct taaataaaaa tatgagtaaa acttactctg aggtttatct gtctagtatt 8220gataacaagt atgtacaatt aattgtttct aagctcaatt atgcaaggtt atatacattt 8280gacgatggaa cagcgaatat aattaaatct agtgcatatt atcaagagga aaaaaaaact 8340ctcaagacta acattttgag atggattttt ggaattaata aaggattgca agaaattaag 8400agtgaaatat gcaagcacta tacaatttat ccaagtgtta gtaatattgt ctctaataca 8460gaattgatag agatgtttac acaatgcaaa aaaaggaagc aagataaaaa agttgtgaga 8520gtctttatag gacaaccttt tgatgaatta ggaataccat tatcactaat agaagagttt 8580ttctttaaat acaaaatgga ctattattat ccacacccaa gagagaaaat aattaataat 8640aagttcactt atatacactc acatttgatt tttgaagaat atataattga aggcttacaa 8700catcaagata tcgtatacaa aatatatggt gctgtgtgta caagtatatt aaatttagcg 8760tcctcgaaaa atgatatcga gatatgttcc atttatacgg atgagctgag aactaaatat 8820agtgattatt atgcactggc tgaaaaaatg aatattacct tgttaaaact tacttgatat 8880gataaaatat gactaatata acgttcagaa ctctgagaat tccaggatat ttactctcat 8940tatttgttct tttaatcgga tttataacat atttcatctt taatgaaact cttgcagcga 9000atttattagc agtgggggct attggcatta tcattcttga tagtttacat gataagcgga 9060ttttttattt aacacttttt cccgtgtatg tcctcgtagg tcaactcatt tcattattat 9120tagttgagca cggatggatt ctaatcgaac ttggaggtat taaaagctat cccattggtt 9180caattctttt tatggcgtta acaatagttt tattccattt tatcatattt ttaactgtaa 9240aaatttcaat attcaaattt gatcgaacat gtattgataa gttaagtggt aattctttta 9300tttattactt gccgattttt tatctatgct tagtatatat tcctgttttt atttatggct 9360ctgcattatc tgtaacaaat ggtaatcgag ttgtatacaa tcaaataata tcacctgttt 9420ttttatattt atttcaaatt aaacaattta tacttcctgt tgcaggattg tatttgctta 9480aaaataaaaa aatatttact atatatctgt ttgcaatttt actatggaat atattgattg 9540gagagaaggc aacgggcatt tggcagtcat tgtatccaat gctgttacct tatgttttga 9600taaattatga taaaataaaa acaaaaaata tattaatagt attaggtttt tgtattgtat 9660ttataaccag tagcatagta attaattata tatttattga aaagtcaggt gctacgttta 9720tatttgatag aatatcaatg caaggacaat tgtggtggta ttattttaat gagcacgttt 9780tgttagctaa gacccctcat gaattatctg aagagttctc gtcagaatat agtgggcttc 9840ttaatctgat gtatcattca atgcctgccc atcttttcaa tagctatatc gagcgcggtg 9900tagtcttgac gagtggtttc cccgcaatat ttctttttta ctttggacaa tactggctcc 9960ttcctacgtt attatcacct tttctttttg gtttagttgt ctattttttt tcaagaagtt 10020tatatagcgg tagtatattg agtttgctta tatcaagtaa actatttttt gcttttactg 10080ttttttttgc ccgtggagat atcgcaactt ttttagatta taaattgctt atttatctat 10140tgattataat aattttacaa tatttgccaa gggttaaggt ttaatatggc gtatacttct 10200cactttatat ataaagtagc taataagatt agcattttta taagaaaaat catcaactta 10260tttagattat ttctttacgg tgatgttgtt tcatatgatt ttgaaatgga ggagaataga 10320agaattatag tgtcaggaag tctaacaaag agagataaca tacctaaaat aatttggatt 10380tattggcatg atgagcaaat tccattatta atagaggctt gtataaaacg ccttaaagat 10440ttaaatccta attatcaatt aaatgtgcta aataaattta caattcatga atacttacct 10500gagagtctaa tgtggagaca ggatctttct gtccaaataa gatctgatct gattcgcttg 10560ggattattat ataaatttgg tggagtatgg atagatgcta gtgtaatgtt ttttgaggat 10620ctttcatggt tagaaagact ttcagcagag aataaatatg atttaatcgg tttttatcga 10680ggcagactat ctatcgactg ctataatcca atagtagaaa gttggatgct gggggcacca 10740aaatacaata agtttataaa gcgatggtat gacaactttt atccagtatc ttatttaggg 10800ttagatgaat atttcaacac aattaagaaa agaagtgatt ataaaattat caaacagaat 10860ataaatattc ccaaatattt atctgtttat ctggcacaac aaatttcgtc gcgagaaatg 10920agagattatt gcgcttattt aagaaaggta gaggatagtg catatttata tcaagagtca 10980tatccacagc gtgattgtgt tctctcggag gtttggtgta aaagaagaaa accacagaaa 11040attcctccac taatcaaatt aacaagccag aacagaaata caattttagc ctgtagtaaa 11100ataaatccac gtagtatcgt aggtgagttt ttagataata agaattagga atagagaaag 11160tgcgagataa aattgtattt gtagtcgctg atatcacggc tactggcggg attgaacgag 11220ttattactta tcttgccagt tatttatgta ataatgggta tagtgtagag atattatcta 11280ttcatagaag taatcgtaat ttaccttatc ctgttcatgc agacgttcat atctcttttg 11340ttgataaaac tataatgaag gcaagaaagc caggatctgt cagcaaatta ctttcacatt 11400ttaaatcctc atttcattta aatataaaat tatttaagag aagaaaatgt attattgtag 11460caaatagttt tcctgttgct ttattttcct gcttctcggc cttattttca tcaaaaatgc 11520tcgttgtcga gcatgttcat tatcactatt acagtaagtg cttagttaat gtaaggcgtt 11580tcatttataa gtttttttat ggggtagttg cgttaactga gcgtgacagt gagctttata 11640ttaatgataa actaaattct ctaacaatac ctaacgctct tagttctttt cctgaaaaaa 11700tagcgaatcc atctgtggaa aagaaaaaaa taattgccgc tggaagatta gaacatcaaa 11760aagggtttga tattctaata aaatcctttg ctgaaataga ctattctgtg aggaaagaat 11820ggatcatgga tatttatggg gatggaaatg aaagagctgc cttacagaaa ttaattcatg 11880atttaaatat tgaggattgt gttaatttat tgggtaacag tcgagacctt atgaacactt 11940atgctgaata tgattttttt gtattatctt caagatttga aggtttcggg atggttttac 12000ttgaagccat gagttgcggt cttccttgta ttgccatcga ttgtcctaca gggcctagag 12060aaatacttga tggaggcaag tatgggatac tttgtgacaa ccaatcaaat ctgggggaga 12120gtattgcatc tctaattgtt aataaggatc taagaactat gctatccggc aaaagcattt 12180tacgtagtca tgattataat attcagatta taagtgaaaa atggcagggt ttatttgaaa 12240gcttaaatga aaaaaatata tatgaaaaat aatatcgcac ttgttcttgt tacgtataat 12300agagagtctc ttttaaaaga agtcctttca tcgataaagc atttaaaaga taaaccgaaa 12360catgtttata taatcgataa taatagctca gatggaacct gtaatataat tatagatttt 12420attcaacaga attcatctat tctaagtatg agttatcata atacaggaga taatctcggt 12480ggggctggcg gatttgctta cggtagccgg cttgcttatg ccgatggatt ccaatggatt 12540tggttagctg atgatgatgt tgtttttgag caaacatgtc tgactcaatt gatgctttat 12600tcttcagatg ccgatatatt acagccaatg agaatcaata ctgacggtag ctgtgcagaa 12660atttcaggaa tagattacga aataaacaat atcttcaggt taaaccctaa aaaacttaaa 12720attactgata tatatgaaga aaagtgggat attcaagaaa tcaaaacgat accttttgaa 12780ggaccattaa tacatcgacg tgtatttgag cagattggtt ttcccaaccc cgattttttt 12840attttttatg atgatctaga ttttgcattg agggctcaaa gagcaggctt caagattaaa 12900tgtgtaaaat ctgctcatct gattcgtaag attagatttg ttcaaagcgt cgctttgacg 12960tcttggaaag gttattttat gtatcgtaac ttttttaagg ttcaacttac gtatgcgaga 13020ataccgatag gattatttag agttattgct atatttttta ttgtaataat ttattctcta 13080ctatttggag gtgcaaaaaa catttcgact ttgataagtg cattgcgtga tgcattaagg 13140aaaaattttc cacttgatca acgttataaa ccctaattta aaagttaaaa tcatgaaaaa 13200taaaatagct attgtcggtg caggcttaag tggggcagta atagctcgtg aacttgctga 13260tgctggatat ttagttgatg tttttgataa acgtcaacat attggaggta actgctatac 13320cgctagggat cctcaaacaa atattatggt tcatacatat ggcccacata tatttcatac 13380taacagtaaa tttgtttggg cttatattaa taagctgggg gtatttaaac cgtttactaa 13440ccgcgttaaa gctgttacta gaggacaggt tttttctttg cctattaacc tattaactat 13500aaatcaattc ttcaataaat tatttacacc agcagaagca aaaaaatata ttgaatctat 13560atctgataaa tatattaaag atcctaatac gtttgaagaa caagctttat cctttattgg 13620acgtgaatta tatgaggctt ttttcaagtc ttatacaatt aaacagtggg ggattttacc 13680taccgatata ccagccagta ttctcaaacg actgcctgtc cgttttaatt atgatgataa 13740ttatttttcg catcaatatc agggaatgcc ggaggacggc tatacacctc tattcgaaaa 13800tcttctgaat cactccaata tcaatgttat tctttctacg gaattctcgg caattgattg 13860tgataaatat attcatactt tttatagtgg cacaatcgat gggttctttg attatgattt 13920aggtcgtttg ctatatagaa ctctagactt taaaacggaa gtgttttggg gagattatca 13980gggatgtgca gtaatgaatt attgtgataa ttctaaacca tatacacgta ttactgaaca 14040taaatatttt tctccttggg aacaacatga caaaacaata atttacaaag aatatagtag 14100agaatgtaat gatagtgata ttccctatta ccccgtacga ctggtcagtg ataaagaaat 14160attaaaaaaa tatgtggaac gtgccagtaa acttgaaaat gttacttttg ttggccgatt 14220gggtacgtat cgatatttag atatggatgt aactatcact gaggccttaa acaccgccga 14280acagttttta gaacttcacc aaaataatca aagaatacca gctttttttg ttgatgtttt 14340atagcgagtc aacatgatta tattgtagta cataatatta cgttcatcct gataaattta 14400atctatattt tgctcatggc tttaaattta aagctattct tcatataata gcactaattg 14460cggtaacccc tgacaggagt aaacaatgtc aaagcaacag atcggcgtcg tcggtatggc 14520ggtgatgggg cgcaaccttg cgctcaatat cgaaagccgt ggttataccg tctctatttt 14580caaccgttcc cgtgaaaaga cggaagaagt gattgccgaa aattctggca aaaaactggt 14640tccttactat acggtgaaag agttcgttga atctcttgaa acgcctcgtc gcatcctgtt 14700aatggttaaa gcaggtgcag gcacagatgc tgctattgat tcccttaagc cataccttga 14760aaaaggcgac atcatcattg atggcggtaa caccttcttc ctggacacca ttcgtcgtaa 14820ccgtgagctt tctgcggaag gttttaactt cattggtacg ggggtttccg gtggtgaaga 14880aggtgcgctg aaaggtcctt ctatcatgcc tggcggtcag aaagaagcct atgaattggt 14940tgcgccgatc ctgaccaaaa tcgctgccgt agctgaagat ggcgaaccgt gcgttaccta 15000tattggtgca gacggcgcag gtcattatgt gaagatggtt cacaacggta ttgaatacgg 15060tgatatgcag ttgattgccg aagcttattc actgcttaaa ggtggcctga atctctccaa 15120cgaagaacta gcgcagacct ttaccgagtg gaataacggt gaactgagca gttacctgat 15180
cgacataacc aaagacatct tcaccaaaaa agatgaagac ggtaactacc tggttgatgt15240gattctggat gaagcggcta acaaaggtac cggtaaatgg accagccaga gtgcgctgga15300tctcggcgaa ccgctgtcgc tgattaccga gtctgtgttt gcacgttata tctcgtctct15360gaaagatcag cgtgttgccg cgtctaaagt tctctctggt ccgcaggcac agccagcagg15420cgacaaagcg gagttcatcg agaaagttcg ccgtgcgctg tatcttggca aaatcgtttc15480ttatgctcag ggcttctctc aattgcgtgc cgcgtctgaa gagtatcact gggatctgaa15540ctacggtgaa atcgcgaaga ttttccgtgc tggctgcatc atccgtgcgc agttcctgca15600gaaaatcacc gatgcctatg ccgaaaacct aaaaatcgct aacctgctgt tggctccgta15660ttttaagaaa atcgctgacg actaccaaca agcactgcgt gatgtcgtcg cttatgcagt15720gcaaaacggt attccggttc caaccttctc tgcggcggtt gcttattacg acagctatcg15780tgccgctgtcctgcct 15796表一鮑氏志賀氏菌7型O抗原基因簇中的糖基轉(zhuǎn)移酶基因和寡糖單位處理基因及其中的引物及PCR數(shù)據(jù)
*在所有組中得到2條錯誤大小的帶,**在6組中都得到1條錯誤大小的帶,***在所有組中得到1條錯誤大小的帶表二 166株大腸桿菌和43株志賀氏菌及它們的來源組號 該組中含有的菌株 來源1 野生型大腸桿菌O1,O2,O3,O10,O16,O18,O39 IMVSa2 野生型大腸桿菌O40,O41,O48,O49,O71,O73,O88,O100IMVS3 野生型大腸桿菌O102,O109,O119,O120,O121,O125,O126,O137 IMVS4 野生型大腸桿菌O138,O139,O149,O7,O5,O6,O11,O12IMVS5 野生型大腸桿菌O13,O14,O15,O17,O19ab,O20,O21,O22 IMVS6 野生型大腸桿菌O23,O24,O25,O26,O27,O28,O29,O30IMVS7 野生型大腸桿菌O32,O33,O34,O35,O36,O37,O38,O42IMVS8 野生型大腸桿菌O43,O44,O45,O46,O50,O51,O52,O53IMVS9 野生型大腸桿菌O54,O55,O56,O57,O58,O59,O60,O61IMVS10 野生型大腸桿菌O62,O63,O64,O65,O66,O68,O69,O70IMVS11 野生型大腸桿菌O74,O75,O76,O77,O78,O79,O80,O81IMVS12 野生型大腸桿菌O82,O83,O84,O85,O86,O87,O89,O90IMVS13 野生型大腸桿菌O91,O92,O95,O96,O97,O98,O99,O101 IMVS14 野生型大腸桿菌O112,O162,O113,O114,O115,O116,O117,O118IMVS15 野生型大腸桿菌O123,O165,O166,O167,O168,O169,O170,O171See b16 野生型大腸桿菌O172,O173,O127,O128,O129,O130,O131,O132, See c17 野生型大腸桿菌O133,O134,O135,O136,O140,O141,O142,O143IMVS18 野生型大腸桿菌O144,O145,O146,O147,O148,O150,O151,O152IMVS19 野生型大腸桿菌O153,O154,O155,O156,O157,O158,O159,O164IMVS20 野生型大腸桿菌O160,O161,O163,O8,O9,O124,O111 IMVS21 野生型大腸桿菌O103,O104,O105,O106,O107,O108,O110 IMVS22 鮑氏志賀氏菌血清型B4,B5,B6,B8,B9,B11,B12,B14 Seed23 鮑氏志賀氏菌血清型B1,B3,B7,B8,B10,B13,B15,B16,B17,B18 Seed24 痢疾志賀氏菌血清型D1,D2,D3,D4,D5,D6,D7,D8Seed25 痢疾志賀氏菌血清D9,D10,D11,D12,D13 Seed26 弗氏志賀氏菌F6a,F(xiàn)1a,F(xiàn)1b,F(xiàn)2a,F(xiàn)2b,F(xiàn)3,F(xiàn)4a,F(xiàn)4b,F(xiàn)5(v7)F5(v4) Seed27 宋內(nèi)氏志賀氏D5,DR Seeda. Institude of Medical and Veterinary Science,Anelaide,Australiab. O123 from IMVS;the rest from Statens Serum Institut,Copenhagen,Denmarkc. 172 and 173 from Statens Serum Institut,Copenhagen,Denmark,the rest from IMVSd. 中國預(yù)防醫(yī)學科學院流行病學研究所表3是鮑氏志賀氏菌7型的O-抗原基因簇的結(jié)構(gòu)表 1kb表4是鮑氏志賀氏菌7型的O-抗原基因簇中的基因的位置表ctcctggtga ctcatgcgtc caagaacgcg gtcgaaaacc acttcgacac ctcatatgaa 60ttagaatcgc tccttgaaca gcgtgtaaaa cgccagttgc tggcggaagt tcagtccatc 120tgcccaccgg gcgtcaccat tatgaatgtg cgtcagagcg aacctttagg tttgggccac 180tccattttgt gcgccagacc cgccattggc gacaatccat tcgttgtggt gctgcctgat 240gtcgttattg atgatgccag cgccgatccg ctgcgttaca accttgccgc tatgattgcg 300cgattcaacg aaacgggtcg cagtcaggtt ctggcaaaac gtatgccggg tgacctctct 360gaatactctg tcatccagac taaagaaccg ctggatcgtg aaggcaaagt cagtcgcatt 420gttgaattta tcgaaaaacc cgatcagccg cagacactgg attcagacat tatggcggtt 480ggtcgctatg tgctttctgc agacatttgg cctgaactgg agcggactca acccggtgca 540tggggacgta ttcagctaac tgacgcaatt gccgaactgg cgaaaaaaca gtccgttgat 600gcaatgttaa tgacgggtga cagctacgac tgcggtaaaa aaatgggcta catgcaggca 660tttgtgaagt acggactacg caacctgaaa gaaggagtga agttccgcaa agggattgag 720cagctgttaa gcgaataaaa atcttaccgg atgtaacggt taataagaaa atcataacgg 780cagtgaagat tcgtggtgaa agtaaattgc aacgaatgtt cctgccgtta ttgctttata 840aaacactata ataacaatga gttagcaata agattttagt caaatttttc caggattttc 900cttgtttcca gagcggattg gtaagacaat tagcgtttga atttttcggg tttagcgcga 960gtgggtaatg ctcgtcacat cgtaggtatg catgcagtgc tctggtagct gttaagccag1020gggcggtagc gtgtgttaaa cttaaggggg ttgttgcgag taatcaagat cgcggcaatt1080tcggattgtg tcttattttg ataataaaac tatcctgata actggtggta ctggctcatt1140orf1的起始cggcaataag tttgtgcgcatgacattaga taaatataac cctaaaaaga ttattattta1200ttctcgtgat gaaatgaaac agtgggaaat ggcaaaacat ttcaaggacg aaagccgaat1260tcgattcttt attggggatg ttcgtgataa agatcgtttg tatcgtgcgt tggatggtgt1320tgactttgtt gttcacgccg cagcaacaaa aatcgtacct acagcagagt ataatccctt1380cgaatgtgta aaaacaaata tcaatggtgc gatgaatgtg attgatgctt gtatcgataa1440aggtatcgaa cgtgttgttg cactttctac tgataaagca agcagccctg cgaatctgta1500tggtgcaaca aaattagcat ccgataaact tttcgttgct ggtaactctt attctggtgc1560gacaaaaact cgttttgctg ttgttcgcta cggaaatgta atgggatcac gtggttcggt1620aataccgttc ttcttatcta tcaaagaaaa aggagaattg cctattactg atgatcgtat1680gactcgcttt atgattactc tggagcaggg ggttgagtta gtttggcatg cgtttgaaga1740tatggtcggt ggtgaaattt atgtaaaaaa aataccttcg atgaaagtaa ctgatatagc1800aacagctgtt gcgcctaatg ctacacaaaa aatggtcggt attcgaccgg gcgagaaact1860acacgagcag atgatcagtg ctgaagatgc ttattacact tatgaatatc cagagcattt1920taagattctt ccagccattc acaactggtg taactcacct gaaaggatta aagatggtaa1980orf2的起始 orf1的中止aaaagtgcca gaaggcttcg tctatgaaag tgatagtaac gcagaatgga tgagtattga2040agaacttcgt caatggatcg aggataatag agaaaaagta ggtaacattt gatgaaattt2100attccctatg gacggcagga tgtttctgat gaagatatcc atgctgtggt ggatgtactg2160aagtccgatt ttttgacgca aggaccatgt gttccccaat ttgagaaggc aattgctgat2220tatgtgaatg ctaagtatgc agttgcagta aatagtgcta cttcagcact tcacattgct2280tgtctcgcgt tggggatgaa gaaaggcgat tggctttgga catcgccaaa tacatttgtt2340gcttctgcga actgtgctct ttattgcggt gctaatgtca gttttgtcga tattgatgcg2400cggacttata atatgagtgt tagcgcgtta gaagcgaaac ttatgtctgc aaggaacaat2460ggaacattgc ctaaggttgt tgttcctgtc gcatttgcag gacagtcatg tgaaatggag2520gaaatatata aactctcaaa agagtatgga ttttcaatta tcgaagatgc ttcgcatgct2580attggaggaa attaccaggg aaagaaaata ggtaattcgc gctttgcaga tattactata2640ttgagcttcc atcctgttaa aattattaca actgcagaag gtggtatggc tctaaccaat2700aatgatgatt tggcagaaaa aatgcagtta ttccgtagtc atgggatcac tcgtgatagt2760aatcatatga cgaaggtaag tgaaggagga tggtattatc aacaagttga tcttggtctg2820aattaccgaa tgactgaact gcaggctgca ttaggcgtga gtcagctgaa gagtattgat2880gattttgtaa cacgccgcca tgaactggtt gaacgttaca aaaaagctct cgaagatatt2940cctatttccc taccatacca ggcggaaagt ggtcacagtg cctttcacct ttatcctgta3000accgttaaaa attctgcaca gcggaaaact ttgtttgatt atctgcggaa taaaaatatc3060ggggttaatg tccattatat tccagttcat actcaaccgt attatgaaaa gttagggcat3120aaaatcggag attatcctgt cgctgaggat tattactctc gaaccatcag cataccgatg3180tattctgctt tgacaaatga agaccaggat tatgtaatcc aatgcattcg ggagtttttt3240orf2的中止 orf3的起始taaatgaatg tggcaatcat tccagctcgt ggtggtagta aacgtatccc tcgaaaaaat3300attaaaatgt tttgcgggaa accaatgatt gcctggtcga ttaatgccgc tcgaaagagc3360ggcgtgtttg acagaatcat tgtttcgacg gatgatatgg agattgcagc tgtagcaaga3420aaattcggcg ccgaagttcc gtttatgcgg ccagaagaac tttcgaatga ttttactgga3480acaatccctg ttatacggca tgcggctgaa tggcttattt ctcagggaaa taaaataaaa3540tatatttgct gcatttatgc aacggccccc tttattagag atgaagattt aaaactaggt3600ttgaacctta tcaaagcaaa ggggggggat tattgttttt ctgttactac ttattcgtac3660cctattcaaa gagcattaaa aattaatgag aataacgaaa taaccatgtt tgatccgact3720cagtttgaaa tgcgatctca agatcttgtg gacgcttggc atgatgccgg gcaattttat3780tgggggaata ttgatgcatg gataaaagaa aaaccggtat ttaagtcaca ggctatacca3840ttacctttgc ctagagaacg agtgcaagat attgatacgc cggaagattg gcatttcgct3900orf4的起始 orf3的中止gaggtgttat ataggataaa tacaataaaa aatgaagatt gtatttaggg ttgatgcttc3960gctttcaatt ggttcaggac atgtttttcg ttgtctaaat cttgctggtg cattgagaaa4020gaatggtttt gaatgcattt ttcttacaaa ggaacatgca ggaaacttaa ttcaatatat4080aaagacatat ttgttccaag tatatgttat ttcaaaggaa gataatgttg atgataaata4140tattgaaaat gaaaaagagt ggttaggagg gagtcaaaaa gaagacgctg aaaaaacttg4200tgaaattatt tacagaaata attttgcacc aggcatattt attattgatc attattcatt4260agattctgaa tgggaaagtt taattaaatg gaaatttcca agtacaaaaa ttgttgttat4320tgacgacttg tgtaatagaa aacattattg tgatatcctg attgattcaa catttgagcg4380tacttctgag gaatatagga gattagttcc tgaatattgt actattttgg ccggtactga4440ctatgcttta ctgaaagatg aatttttgca attgcgcaaa gaagccatat taaaacgtac4500atctatatta agccctcaga aaattttaat tactatggga ggggttgata tacataacgt4560gactgggaaa gttttaaaag aattaaataa tagagctgat cttcattata aaaagatcac4620tgttgtatta ggggtgaatt gccctcataa aaaaaacatt gaaaatattg cacaatcgat4680aaaatatgat gtggatataa aagtgaatac caacaatatg ccacaactta tgttagaaca4740tgatttatct attggagctt taggaagtac tacttgggag agagctgtgc ttggattacc4800cacagtaaat attgctattg ctgacaatca actggttatt gtagagaaac taaggcgaaa4860tggttttatt gtctttgata gcattaattt tactggggtg gaattagctc gttctttaat4920aaaggtaact gatttctatg atgaaatggt gtctcgctcg ctctctatat gtgatggcag4980orf4的中止 orf5的起始gggattacaa aggacactaa aatttataat atctttagct acaaataaat aatgagacat5040gcttatgact ggcaaaaata taaaaaaatt aaatttgctt aacattgttc attcttcgga5100ggatattcaa gaaaaagttc gatgtataag aaatgaacct caaattagga agtggatgta5160tacagatcat cttatatcaa aagatgagca taaaaattgg attgaaagat taagaaatga5220atcaagaaat tttgtgtatg tcgtaatgaa tgactacgat gagcctattg gtgtcgttag5280tgtaaattcg attgatttga aaaacaaaaa aggagactgg gcatattatt tgacagcaaa5340tacacgtact ggtattggtg ctgtattaga attttttgtg attgattatg tttttaacta5400tttgcatctt gaaaaattaa attgtgaggt aattgaacat aatgataccg tcgttcgatt5460acatgagaaa tttgggttta agcaggaagg atttagagag tctaatatta taaaggatga5520taagcgtttt ggagtttatt attttggttt aacgaaagaa aaatggatgc taacacgaga5580orf5的中止atgtttaaag aataaatatt ataagctttt ttctcaatac gcggttgatt ttcattaata5640orf6的起始ggtttatttt tggggtgata aatgaaagca attactattg caggacgtaa aattggtaaa5700gattttcctc catatatcat tgctgaatta tcggctaatc ataatggaga tataaatcgt5760gcatttaaga taatggaaga ggcaaaagca gctggagctg atgctgtaaa attacagaca5820tatagagcag atactataac gctggattgt gattctgaag agtttcaaat acatggtggt5880ttatggggtg gtcagacatt gtatagctta tatcaaagtg ctcaaatgcc ttgggaatgg5940cataagccat tatttgataa ggcaaaagag ttaggcatta ctatttttag cagtcctttt6000gattttactg ctgttgattt attagaagaa ttaggtgctc cggcttataa aatagcgtca6060ttcgaagcta ttgatttacc gctaattcga tatgtagctc aaactgggaa accgatgatt6120atctcgacag ggatggctga tgaacaggag attcaggagg cgatccatgt agctaaagaa6180ggcggttgta aggagctcgt tgtcttgcat tgcgtaagtg gatatccggc tccaccagag6240gattacaatc ttgccacaat ccctgacatg gctaaaaaat ttaacgttat aacaggtctg6300tcagaccata caatagataa tactacggcg atagcatccg ttgcattagg agcgagtgtg6360atcgaaaagc atgtaacact tgatcgtaat ggaggagggc cagacgatag tttctcactt6420gaaccaagtg agcttacagt tctttgccgt gatgcaaaga tcgcttggca ggctttaggt6480agaataaact ataccagaaa gccaagtgag atgggaaacg ttcaatttag acgttcattg6540tattttgtta aagatatgaa agctggtgat attattgatg aaacatgtgt gcgcagtgtg6600cggccaggct atggattacc acctaaatat tttgatgatt taattggtaa gcgagttatt6660orf7的起始 orf6的中止agtgatgtta tggccaatac ccgaacatca ttggaattaa ttgcagattt aaaatgaaag6720ttattaaaga tagtgttctg tatgtaatag gtgagttgat atctaaaagt gttccatttc6780tattgcttcc ctatcttaca aggcggttgg gaattgatgg ttttggagaa atgtcatttt6840atcagacaat acttgcttta ttggttatcg ttataagctt agggcaagat ggggctgttg6900ctagatattt ttatttctac ggagcccgtt ctataaattt gattgtgact gtaggtgctt6960tatattcact tgtgacgaca tccctattgt ttttatcgtt ttcatttttt aaatccacga7020tattatcaat tattgtgttg actgctggat ttcaatcact tttcaatacg cagctaagtc7080ttaggcagtg ccaaaaagag tcagttcagt atattgtcat gcaaatatta gttgcgttga7140cttctggtgg tataaccttt tgtttactgg aaatatatag tcatgattta gttgaaaaga7200gatttattgc attgcttttg agtaatatag tttgtgtttt tattgcttat cttatttata7260tgaggagacg gaaatataat cacgcatttt tatttcgacg atattatagt gcattgctat7320acttgattgg ttttggaggc ccattgattt tgcatcaaat aagtggcttt cttaaaggac7380aattagatcg agttttgata tatagccgtt tttctgcttc agatttaggg ggctattctg7440ctgcatttca aatagcctca gttctcttga tactgataat ggcgttgaat aaagcactag7500ttccatatta ttatagtgag ctcaaaaaaa agcatatagt ctttgatgat ataaaaaaaa7560cttgcgtttt tttatttcta ttgattccac ttccatcaat catatcgttg attattcctg7620ctgatttttg gtgttttatt ttaggaaatg aatttgttga tgttaaatat tacatcgcta7680tattcctatt aggtataggt tttacaatac cttatctttt actagtgaat tatctttttt7740attatggtaa aaataaaagt ataactatct gttcagtcat ttcaacatct atttattgca7800ttgttcttta ttttttatca tgtttaggta tttcttatgt tccatattct atgttgatag7860caaatatgct aatcgttcct ttactttata tggctgccaa aaaaacatca atgcttgaac7920orf7的中止 orf8的起始gccagtgaga ttaatatgcc ctcgttattt atatgtgtta cgccactgca aatgttgatt7980gctgaaaaaa taattgataa aaccaggcca gtaaacatag aaattatagt gcttgcatat8040cagaaaaatg ataaatatat gcattacata aagcggttgg agaaaaaatg tactaatttt8100acagttttgg ctgtaacgcc aaaaaataaa tttgtaaccg tgatcgcctt tgcaaaatta8160cataccatct taaataaaaa tatgagtaaa acttactctg aggtttatct gtctagtatt8220gataacaagt atgtacaatt aattgtttct aagctcaatt atgcaaggtt atatacattt8280gacgatggaa cagcgaatat aattaaatct agtgcatatt atcaagagga aaaaaaaact8340ctcaagacta acattttgag atggattttt ggaattaata aaggattgca agaaattaag8400agtgaaatat gcaagcacta tacaatttat ccaagtgtta gtaatattgt ctctaataca8460gaattgatag agatgtttac acaatgcaaa aaaaggaagc aagataaaaa agttgtgaga8520gtctttatag gacaaccttt tgatgaatta ggaataccat tatcactaat agaagagttt8580ttctttaaat acaaaatgga ctattattat ccacacccaa gagagaaaat aattaataat8640aagttcactt atatacactc acatttgatt tttgaagaat atataattga aggcttacaa8700catcaagata tcgtatacaa aatatatggt gctgtgtgta caagtatatt aaatttagcg8760tcctcgaaaa atgatatcga gatatgttcc atttatacgg atgagctgag aactaaatat8820orf8的中止 orf9的起始agtgattatt atgcactggc tgaaaaaatg aatattacct tgttaaaact tacttgatat8880gataaaatat gactaatata acgttcagaa ctctgagaat tccaggatat ttactctcat8940tatttgttct tttaatcgga tttataacat atttcatctt taatgaaact cttgcagcga9000atttattagc agtgggggct attggcatta tcattcttga tagtttacat gataagcgga9060ttttttattt aacacttttt cccgtgtatg tcctcgtagg tcaactcatt tcattattat9120tagttgagca cggatggatt ctaatcgaac ttggaggtat taaaagctat cccattggtt9180caattctttt tatggcgtta acaatagttt tattccattt tatcatattt ttaactgtaa9240aaatttcaat attcaaattt gatcgaacat gtattgataa gttaagtggt aattctttta9300tttattactt gccgattttt tatctatgct tagtatatat tcctgttttt atttatggct9360ctgcattatc tgtaacaaat ggtaatcgag ttgtatacaa tcaaataata tcacctgttt9420ttttatattt atttcaaatt aaacaattta tacttcctgt tgcaggattg tatttgctta9480aaaataaaaa aatatttact atatatctgt ttgcaatttt actatggaat atattgattg9540gagagaaggc aacgggcatt tggcagtcat tgtatccaat gctgttacct tatgttttga9600taaattatga taaaataaaa acaaaaaata tattaatagt attaggtttt tgtattgtat9660ttataaccag tagcatagta attaattata tatttattga aaagtcaggt gctacgttta9720tatttgatag aatatcaatg caaggacaat tgtggtggta ttattttaat gagcacgttt9780tgttagctaa gacccctcat gaattatctg aagagttctc gtcagaatat agtgggcttc9840ttaatctgat gtatcattca atgcctgccc atcttttcaa tagctatatc gagcgcggtg9900tagtcttgac gagtggtttc cccgcaatat ttctttttta ctttggacaa tactggctcc9960ttcctacgtt attatcacct tttctttttg gtttagttgt ctattttttt tcaagaagtt 10020tatatagcgg tagtatattg agtttgctta tatcaagtaa actatttttt gcttttactg 10080ttttttttgc ccgtggagat atcgcaactt ttttagatta taaattgctt atttatctat 10140orf9的中止 orf10的起始tgattataat aattttacaa tatttgccaa gggttaaggt ttaatatggc gtatacttct 10200cactttatat ataaagtagc taataagatt agcattttta taagaaaaat catcaactta 10260tttagattat ttctttacgg tgatgttgtt tcatatgatt ttgaaatgga ggagaataga 10320agaattatag tgtcaggaag tctaacaaag agagataaca tacctaaaat aatttggatt 10380tattggcatg atgagcaaat tccattatta atagaggctt gtataaaacg ccttaaagat 10440ttaaatccta attatcaatt aaatgtgcta aataaattta caattcatga atacttacct 10500gagagtctaa tgtggagaca ggatctttct gtccaaataa gatctgatct gattcgcttg 10560ggattattat ataaatttgg tggagtatgg atagatgcta gtgtaatgtt ttttgaggat 10620ctttcatggt tagaaagact ttcagcagag aataaatatg atttaatcgg tttttatcga 10680ggcagactat ctatcgactg ctataatcca atagtagaaa gttggatgct gggggcacca 10740aaatacaata agtttataaa gcgatggtat gacaactttt atccagtatc ttatttaggg 10800ttagatgaat atttcaacac aattaagaaa agaagtgatt ataaaattat caaacagaat 10860ataaatattc ccaaatattt atctgtttat ctggcacaac aaatttcgtc gcgagaaatg 10920agagattatt gcgcttattt aagaaaggta gaggatagtg catatttata tcaagagtca 10980tatccacagc gtgattgtgt tctctcggag gtttggtgta aaagaagaaa accacagaaa 11040attcctccac taatcaaatt aacaagccag aacagaaata caattttagc ctgtagtaaa 11100orf10的中止ataaatccac gtagtatcgt aggtgagttt ttagataata agaattagga atagagaaag 11160tgcgagataa aattgtattt gtagtcgctg atatcacggc tactggcggg attgaacgag 11220ttattactta tcttgccagt tatttatgta ataatgggta tagtgtagag atattatcta 11280ttcatagaag taatcgtaat ttaccttatc ctgttcatgc agacgttcat atctcttttg 11340orf11的起始ttgataaaac tataatgaag gcaagaaagc caggatctgt cagcaaatta ctttcacatt 11400ttaaatcctc atttcattta aatataaaat tatttaagag aagaaaatgt attattgtag 11460caaatagttt tcctgttgct ttattttcct gcttctcggc cttattttca tcaaaaatgc 11520tcgttgtcga gcatgttcat tatcactatt acagtaagtg cttagttaat gtaaggcgtt 11580tcatttataa gtttttttat ggggtagttg cgttaactga gcgtgacagt gagctttata 11640ttaatgataa actaaattct ctaacaatac ctaacgctct tagttctttt cctgaaaaaa 11700tagcgaatcc atctgtggaa aagaaaaaaa taattgccgc tggaagatta gaacatcaaa 11760aagggtttga tattctaata aaatcctttg ctgaaataga ctattctgtg aggaaagaat 11820ggatcatgga tatttatggg gatggaaatg aaagagctgc cttacagaaa ttaattcatg 11880atttaaatat tgaggattgt gttaatttat tgggtaacag tcgagacctt atgaacactt 11940atgctgaata tgattttttt gtattatctt caagatttga aggtttcggg atggttttac 12000ttgaagccat gagttgcggt cttccttgta ttgccatcga ttgtcctaca gggcctagag 12060aaatacttga tggaggcaag tatgggatac tttgtgacaa ccaatcaaat ctgggggaga 12120gtattgcatc tctaattgtt aataaggatc taagaactat gctatccggc aaaagcattt 12180tacgtagtca tgattataat attcagatta taagtgaaaa atggcagggt ttatttgaaa 12240orf12的起始 orf11的中止gcttaaatga aaaaaatata tatgaaaaataatatcgcac ttgttcttgt tacgtataat 12300agagagtctc ttttaaaaga agtcctttca tcgataaagc atttaaaaga taaaccgaaa 12360catgtttata taatcgataa taatagctca gatggaacct gtaatataat tatagatttt 12420attcaacaga attcatctat tctaagtatg agttatcata atacaggaga taatctcggt 12480ggggctggcg gatttgctta cggtagccgg cttgcttatg ccgatggatt ccaatggatt 12540tggttagctg atgatgatgt tgtttttgag caaacatgtc tgactcaatt gatgctttat 12600tcttcagatg ccgatatatt acagccaatg agaatcaata ctgacggtag ctgtgcagaa 12660atttcaggaa tagattacga aataaacaat atcttcaggt taaaccctaa aaaacttaaa 12720attactgata tatatgaaga aaagtgggat attcaagaaa tcaaaacgat accttttgaa 12780ggaccattaa tacatcgacg tgtatttgag cagattggtt ttcccaaccc cgattttttt 12840attttttatg atgatctaga ttttgcattg agggctcaaa gagcaggctt caagattaaa 12900tgtgtaaaat ctgctcatct gattcgtaag attagatttg ttcaaagcgt cgctttgacg 12960tcttggaaag gttattttat gtatcgtaac ttttttaagg ttcaacttac gtatgcgaga 13020ataccgatag gattatttag agttattgct atatttttta ttgtaataat ttattctcta 13080ctatttggag gtgcaaaaaa catttcgact ttgataagtg cattgcgtga tgcattaagg 13140orf12的中止orf13的起始aaaaattttc cacttgatca acgttataaa ccctaattta aaagttaaaa tcatgaaaaa 13200taaaatagct attgtcggtg caggcttaag tggggcagta atagctcgtg aacttgctga 13260tgctggatat ttagttgatg tttttgataa acgtcaacat attggaggta actgctatac 13320cgctagggat cctcaaacaa atattatggt tcatacatat ggcccacata tatttcatac 13380taacagtaaa tttgtttggg cttatattaa taagctgggg gtatttaaac cgtttactaa 13440ccgcgttaaa gctgttacta gaggacaggt tttttctttg cctattaacc tattaactat 13500aaatcaattc ttcaataaat tatttacacc agcagaagca aaaaaatata ttgaatctat 13560atctgataaa tatattaaag atcctaatac gtttgaagaa caagctttat cctttattgg 13620acgtgaatta tatgaggctt ttttcaagtc ttatacaatt aaacagtggg ggattttacc 13680taccgatata ccagccagta ttctcaaacg actgcctgtc cgttttaatt atgatgataa 13740ttatttttcg catcaatatc agggaatgcc ggaggacggc tatacacctc tattcgaaaa 13800tcttctgaat cactccaata tcaatgttat tctttctacg gaattctcgg caattgattg 13860tgataaatat attcatactt tttatagtgg cacaatcgat gggttctttg attatgattt 13920aggtcgtttg ctatatagaa ctctagactt taaaacggaa gtgttttggg gagattatca 13980gggatgtgca gtaatgaatt attgtgataa ttctaaacca tatacacgta ttactgaaca 14040taaatatttt tctccttggg aacaacatga caaaacaata atttacaaag aatatagtag 14100agaatgtaat gatagtgata ttccctatta ccccgtacga ctggtcagtg ataaagaaat 14160attaaaaaaa tatgtggaac gtgccagtaa acttgaaaat gttacttttg ttggccgatt 14220gggtacgtat cgatatttag atatggatgt aactatcact gaggccttaa acaccgccga 14280acagttttta gaacttcacc aaaataatca aagaatacca gctttttttg ttgatgtttt 14340orf13的中止atagcgagtc aacatgatta tattgtagta cataatatta cgttcatcct gataaattta 14400atctatattt tgctcatggc tttaaattta aagctattct tcatataata gcactaattg 14460cggtaacccc tgacaggagt aaacaatgtc aaagcaacag atcggcgtcg tcggtatggc 14520ggtgatgggg cgcaaccttg cgctcaatat cgaaagccgt ggttataccg tctctatttt 14580caaccgttcc cgtgaaaaga cggaagaagt gattgccgaa aattctggca aaaaactggt 14640tccttactat acggtgaaag agttcgttga atctcttgaa acgcctcgtc gcatcctgtt 14700aatggttaaa gcaggtgcag gcacagatgc tgctattgat tcccttaagc cataccttga 14760aaaaggcgac atcatcattg atggcggtaa caccttcttc ctggacacca ttcgtcgtaa 14820ccgtgagctt tctgcggaag gttttaactt cattggtacg ggggtttccg gtggtgaaga 14880aggtgcgctg aaaggtcctt ctatcatgcc tggcggtcag aaagaagcct atgaattggt 14940tgcgccgatc ctgaccaaaa tcgctgccgt agctgaagat ggcgaaccgt gcgttaccta 15000tattggtgca gacggcgcag gtcattatgt gaagatggtt cacaacggta ttgaatacgg 15060tgatatgcag ttgattgccg aagcttattc actgcttaaa ggtggcctga atctctccaa 15120cgaagaacta gcgcagacct ttaccgagtg gaataacggt gaactgagca gttacctgat 15180cgacataacc aaagacatct tcaccaaaaa agatgaagac ggtaactacc tggttgatgt 15240gattctggat gaagcggcta acaaaggtac cggtaaatgg accagccaga gtgcgctgga 15300tctcggcgaa ccgctgtcgc tgattaccga gtctgtgttt gcacgttata tctcgtctct 15360gaaagatcag cgtgttgccg cgtctaaagt tctctctggt ccgcaggcac agccagcagg 15420cgacaaagcg gagttcatcg agaaagttcg ccgtgcgctg tatcttggca aaatcgtttc 15480ttatgctcag ggcttctctc aattgcgtgc cgcgtctgaa gagtatcact gggatctgaa 15540ctacggtgaa atcgcgaaga ttttccgtgc tggctgcatc atccgtgcgc agttcctgca 15600gaaaatcacc gatgcctatg ccgaaaacct aaaaatcgct aacctgctgt tggctccgta 15660ttttaagaaa atcgctgacg actaccaaca agcactgcgt gatgtcgtcg cttatgcagt 15720gcaaaacggt attccggttc caaccttctc tgcggcggtt gcttattacg acagctatcg 15780tgccgctgtcctgcct15796以上所述,僅是本發(fā)明的較佳實施例而已,并非對本發(fā)明作任何形式上的限制,凡是依據(jù)本發(fā)明的技術(shù)實質(zhì)對以上實施例所作的任何簡單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
1.一種對鮑氏志賀氏菌7型的O-抗原特異的核苷酸,其特征在于,其是如SEQ ID NO1所示的分離的核苷酸,全長15796個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。
2.按照權(quán)利要求1所述的對鮑氏志賀氏菌7型的O-抗原特異的核苷酸,其特征在于它是由11個基因組成,它們都位于galF基因和gnd基因之間。
3.按照權(quán)利要求2所述的對鮑氏志賀氏菌7型的O-抗原特異的核苷酸,其特征在于,所述的基因包括轉(zhuǎn)運酶基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因,包括wzy基因或與wzy有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf8、orf10、orf11、orf12基因;其中所述的wzx基因是SEQ ID NO1中的6714至7928堿基的核苷酸;orf8基因是SEQ ID NO1中的7936至8877堿基的核苷酸;wzy基因是SEQ ID NO1中的8889至10184堿基的核苷酸;orf10基因是SEQ ID NO1中的10186至11148堿基的核苷酸;orf11基因是SEQ ID NO1中的11355至12272堿基的核苷酸;orf12基因是SEQ ID NO1中的12247至13176堿基的核苷酸;
4.按照權(quán)利要求1或2所述的對鮑氏志賀氏菌7型的O-抗原特異的核苷酸,其特征在于,其是源于所述的wzx基因、wzy基因或糖基轉(zhuǎn)移酶基因的orf8、orf10、orf11、orf12基因;或糖合成路徑基因中的寡核苷酸;以及它們的混合或它們的重組。
5.按照權(quán)利要求4所述的對鮑氏志賀氏菌7型的O-抗原特異的核苷酸,其特征在于,所述的源于wzx基因的寡核苷酸對是SEQ ID NO1中的6782至6799堿基的核苷酸和7449至7466堿基的核苷酸;SEQ ID NO1中的6971至6989堿基的核苷酸和7481至7498堿基的核苷酸;SEQ ID NO1中的7035至7053堿基的核苷酸和7588至7607堿基的核苷酸;源于orf8基因的寡核苷酸對是SEQ ID NO1中的8065至8082堿基的核苷酸和8789至8806堿基的核苷酸;SEQ ID NO1中的8134至8152堿基的核苷酸和8685至8704堿基的核苷酸;SEQ ID NO1中的8198至8215堿基的核苷酸和8459至8476堿基的核苷酸;源于wzy基因的寡核苷酸對是SEQ ID NO1中的9091至9108堿基的核苷酸和9457至9474堿基的核苷酸;SEQ ID NO1中的9357至9376堿基的核苷酸和9704至9721堿基的核苷酸;SEQ ID NO1中的9120至9137堿基的核苷酸和9945至9962堿基的核苷酸;源于orf10基因的寡核苷酸對是SEQ ID NO1中的10271至10288堿基的核苷酸和11060至11077堿基的核苷酸;SEQ ID NO1中的10375至10393堿基的核苷酸和10790至10808堿基的核苷酸;SEQ ID NO1中的10510至10528堿基的核苷酸和11090至11108堿基的核苷酸;源于orf11基因的寡核苷酸對是SEQ ID NO1中的11737至11754堿基的核苷酸和12013至12030堿基的核苷酸;SEQ ID NO1中的11367至11384堿基的核苷酸和12154至12171堿基的核苷酸;SEQ ID NO1中的11482至11598堿基的核苷酸和11839至11856堿基的核苷酸;源于orf12基因的寡核苷酸對是SEQ ID NO1中的12274至12291堿基的核苷酸和13016至13033堿基的核苷酸;SEQ ID NO1中的12489至12506堿基的核苷酸和13101至13120堿基的核苷酸;SEQ ID NO1中的12384至12401堿基的核苷酸和12959至12976堿基的核苷酸。
6.權(quán)利要求1所述的對鮑氏志賀氏菌7型的O-抗原特異的核苷酸在檢測表達O-抗原的細菌、在診斷中鑒定細菌O-抗原和細菌的其它多糖抗原的應(yīng)用。
7.權(quán)利要求1所述的對鮑氏志賀氏菌7型的O-抗原特異的核苷酸的重組分子,而且通過插入表達可提供表達鮑氏志賀氏菌7型的O-抗原,并成為細菌疫苗。
8.按照權(quán)利要求1所述的對鮑氏志賀氏菌7型的O-抗原特異的核苷酸的應(yīng)用,其特征在于,其作為引物用于PCR、作為探針用于雜交反應(yīng)與熒光檢測、或者用于制造基因芯片或微陣列,檢測人體和環(huán)境中的細菌。
9.按照權(quán)利要求1所述的對鮑氏志賀氏菌7型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)提取基因組。在LB培養(yǎng)基中37℃過夜培養(yǎng)志賀氏菌,離心收集細胞,用Tris-HCl(pH8.0)和EDTA重懸細胞,37℃溫育20分后加入溶菌酶裂解細菌,加入蛋白酶K和SDS降解蛋白質(zhì),再加入RNase去除RNA;然后用等體積酚及等體積的酚∶氯仿∶異戊醇(25∶24∶1)抽提去除其中的酶和蛋白,再用等體積的乙醚抽提除去殘余的酚;用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA后用70%乙醇洗DNA,最后將DNA重懸于30ulTE中,基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過Long PCR擴增鮑氏志賀氏菌7型中的O-抗原基因簇。首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇啟動子區(qū)的JumpStart序列設(shè)計上游引物(#1523-ATT GTG GCT GCA GGG ATC AAA GAA AT),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計下游引物(#1524-TAG TCG CGT GNG CCT GGA TTA AGT TCG C);用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分;然后94℃變性10秒;60℃退火30秒,68℃延伸15分,這樣進行30個循環(huán);最后,在68℃繼續(xù)延伸7分,得到長度為15796個堿基的PCR產(chǎn)物;合并6管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫。用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫,反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進行;選擇合適的反應(yīng)時間使酶切后的DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng),合并4管同樣的反應(yīng)體系,分別用等體積的酚和酚∶氯仿∶異戊醇(25∶24∶1)抽提一次,再用等體積的乙醚抽提兩次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中;隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul100mM DTT和5單位的T4DNA聚合酶,11℃30分,將酶切產(chǎn)物補成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴大為80ul,使DNA的3’端加dA尾,此混合物經(jīng)氯仿∶異戊醇(24∶1)抽提和乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接24小時,總體積為90ul,其中有9ul的10×buffer和25單位的T4DNA連接酶,最后用無水乙醇沉淀連接混合物,70%乙醇洗后溶于30ul水中得到連接產(chǎn)物;用Bio-Rad公司的電轉(zhuǎn)化感受態(tài)細胞的制備方法制備感受態(tài)大腸桿菌DH5α細胞,取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒-6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上37℃過夜培養(yǎng),次日得到藍白菌落。將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時從每個克隆中提取質(zhì)粒并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆構(gòu)成了鮑氏志賀氏菌7型的O-抗原基因簇文庫;(4)對文庫中的克隆測序。從文庫中挑選插入片段在700bp以上的120個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到80%的覆蓋率。剩余20%的序列再根據(jù)已得到的序列設(shè)計引物,兩對引物,如下所示5’-GCATGGGTTACTGTACTAGC-3’和3’-AATGGCATCAATACCCGC-5’及5’-TGGCGGTATTGAGAGAGT-3’和3’-TTACAGGCTACTTCTCTTC-5’,再從鮑氏志賀氏菌7型的基因組DNA中直接PCR并對PCR產(chǎn)物測序,從而獲得O-抗原基因簇的所有序列。(5)核苷酸序列的拼接及分析。用英國劍橋MRC(Medical ResearchCouncil)分子生物學實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到鮑氏志賀氏菌7型的O-抗原基因簇的核苷酸全長序列(見序列列表)。序列的質(zhì)量主要由兩個方面來保證1)對鮑氏志賀氏菌7型的基因組作6個Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫。2)對每個堿基,保證3個以上高質(zhì)量的覆蓋率。在得到鮑氏志賀氏菌7型O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學中心(TheNational Center for Biotechnology Information,NCBI)的orffinder發(fā)現(xiàn)基因,找到13個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對,最后得到鮑氏志賀氏菌7型的O-抗原基因簇的結(jié)構(gòu),(6)特異基因的篩選。針對鮑氏志賀氏菌7型的O-抗原基因簇中的wzx、wzy、orf8、orf10、orf11、orf12基因設(shè)計引物;在每個基因內(nèi)各設(shè)計了三對引物,每對引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,在其他組中都沒有擴增到任何大小正確的帶,即在大多數(shù)組中沒有得到任何PCR產(chǎn)物帶,雖然在少數(shù)組中得到PDR產(chǎn)物帶,但其大小不符合預(yù)期大小,所以wzx、wzy、orf8、orf10、orf11、orf12基因?qū)︴U氏志賀氏菌7型的O-抗原都是高度特異的。
全文摘要
本發(fā)明提供一種鮑氏志賀氏菌7型的O-抗原特異的核苷酸,其是鮑氏志賀氏菌7型(Shigella boydii 7)中控制O-抗原合成的基因簇的核苷酸全序列,還包括O-抗原基因簇的結(jié)構(gòu)以及源于鮑氏志賀氏菌7型的O-抗原基因簇中的糖基轉(zhuǎn)移酶基因和寡糖單位處理基因(包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy相似功能的基因)的寡核苷酸,并且包括獲得細菌O-抗原基因簇的方法,本發(fā)明通過PCR證實它們對鮑氏志賀氏菌7型的O-抗原都有高度的特異性,本發(fā)明還公開了用本發(fā)明的寡核苷酸檢測和鑒定人體及環(huán)境中的鮑氏志賀氏菌7型的方法。
文檔編號C07H21/00GK1429832SQ0310053
公開日2003年7月16日 申請日期2003年1月20日 優(yōu)先權(quán)日2003年1月20日
發(fā)明者王磊, 陶江, 馮露 申請人:南開大學