專(zhuān)利名稱(chēng):核酸、包含該核酸的探針以及利用該探針的篩選方法
背景技術(shù):
1.發(fā)明領(lǐng)域本發(fā)明涉及核酸、探針以及利用該探針的篩選方法,更具體而言,本發(fā)明涉及核酸、包含該核酸的探針以及利用該探針進(jìn)行基因診斷的篩選方法。
2.相關(guān)技術(shù)描述對(duì)于在染色體上定位人基因組以制作染色體圖譜的基因定位方法,普遍實(shí)行利用人和嚙齒類(lèi)動(dòng)物之間體細(xì)胞雜交或者染色體部分缺失的克隆圖,分析其余的人特定染色體或者染色體的一部分的方法,以及將克隆基因用作Southern印跡探針的方法。
近來(lái),利用所謂原位雜交,將從基因組DNA克隆并標(biāo)記的基因或DNA標(biāo)志用作探針,在玻片上的染色體樣本中直接形成分子雜交物,檢測(cè)存在基因的部分,以便有效獲得有關(guān)許多基因(例如人基因)的特定位置以及序列相互順序的信息。
對(duì)于原位雜交,一種方法是利用放射性同位素(主要為3H)標(biāo)記DNA作為探針,通過(guò)放射自顯影檢測(cè)其位點(diǎn),以及利用熒光顯微鏡檢測(cè)標(biāo)記DNA探針的熒光信號(hào)的方法。
后者熒光原位雜交方法(以下記作FISH方法)的優(yōu)點(diǎn)在于,不使用RI設(shè)備,操作程序簡(jiǎn)單,短時(shí)間內(nèi)(2天)在染色體帶上精確進(jìn)行細(xì)微定位。
目前,利用這些方法開(kāi)發(fā)了可用于多種疾病/綜合癥的探針,進(jìn)行臨床診斷。例如,已知一種適用于多種染色體FISH方法的檢查探針,針對(duì)具有微缺失的先天性畸形綜合癥。該探針檢查靶疾病的基因,如果檢查結(jié)果是陽(yáng)性(即存在缺失等),則作出確診。
例如,上述探針對(duì)普-威(Prader Willi)綜合癥有效,因?yàn)榇蠹s60%的患者帶有缺失。
如上所述,已經(jīng)在該疾病基因的部分克隆中找到有用的探針。然而,還有自發(fā)性疾病,除疾病的身體表現(xiàn)和癥狀以外,尚未發(fā)現(xiàn)對(duì)其有效的檢查和診斷方法。如果能夠利用引起疾病的基因和/或同系物發(fā)現(xiàn)探針,其在基因診斷領(lǐng)域會(huì)很有益處。
發(fā)明概述因此,本發(fā)明目的在于提供核酸、利用該核酸的有用探針以及利用該探針的篩選方法。
為達(dá)此目的,本發(fā)明人對(duì)有關(guān)先天性畸形綜合癥和基因的關(guān)系進(jìn)行了多種研究,找到了探針以及利用本發(fā)明這種探針的篩選方法。
根據(jù)本發(fā)明的第一方面,該核酸是(a)包含序列表中No.1序列的1-39726位堿基序列所示的堿基序列的核酸,或者(b)其中1-39726位堿基序列的部分堿基序列缺失、置換或者添加,并具有80%堿基序列同源性的核酸。
此外,根據(jù)本發(fā)明的第二方面,核酸是(a)包含序列表中No.2序列1-8511位堿基序列所示的堿基序列的核酸,或者(b)其中1-8511位堿基序列的部分堿基序列缺失、置換或者添加,并具有80%堿基序列同源性的核酸。
根據(jù)本發(fā)明的第三方面,該探針包含本發(fā)明的第一或第二方面定義的核酸。
在優(yōu)選實(shí)施方案中,本發(fā)明的探針用于診斷索托斯綜合癥(Sotossyndrome)。
根據(jù)本發(fā)明的第四方面,該肽片段是(a)包含序列表中No.3序列的1-309位氨基酸序列所示的氨基酸序列的肽片段,或者(b)其中No.3序列所示的部分氨基酸序列缺失、置換或者添加,并具有80%堿基序列同源性的肽片段。
根據(jù)本發(fā)明的第五方面,該肽片段是(a)包含序列表中No.4序列1-2696位氨基酸序列所示的氨基酸序列的肽片段,或者(b)其中No.4序列所示的部分氨基酸序列缺失、置換或者添加,并具有80%的堿基序列同源性的肽片段。
根據(jù)本發(fā)明的第六方面,該探針包含本發(fā)明的第四或第五方面定義的肽片段。
根據(jù)本發(fā)明,用于診斷索托斯綜合癥的探針,其特征在于,該探針包含人染色體5上的以下(a)或(b)(a)包含序列表中No.5序列的1-190位堿基序列所示的堿基序列的核酸,或者(b)其中1-190位堿基序列的部分堿基序列缺失、置換或添加,并具有80%的堿基序列同源性的核酸。
根據(jù)本發(fā)明,用于診斷索托斯綜合癥的探針,其特征在于,該探針包含人染色體5上的下列(a)或(b)(a)包含序列表中No.6序列的1-275位堿基序列所示的堿基序列的核酸,或者(b)其中1-275位堿基序列的部分堿基序列缺失、置換或添加,并具有80%的堿基序列同源性的核酸。
根據(jù)本發(fā)明,用于診斷索托斯綜合癥的探針,其特征在于,該探針包含人染色體5上的下列(a)和(b)之間的任何序列(a)包含序列表中No.5序列的1-190位堿基序列所示的堿基序列的核酸,以及(b)其中序列表中No.6序列的1-275位堿基序列的部分堿基序列的核酸。
根據(jù)本發(fā)明的第七方面,該篩選方法特征在于,利用本發(fā)明的第三、第四或第七至第十方面定義的探針。
根據(jù)本發(fā)明,在該篩選方法的優(yōu)選實(shí)施方案中,利用至少一種選自原位雜交方法、Southern印跡方法、基于巨陣列(macroarray)的雜交方法以及堿基序列測(cè)定方法(雙脫氧鏈終止方法等)中的方法進(jìn)行篩選。
根據(jù)本發(fā)明,在該篩選方法的優(yōu)選實(shí)施方案中,該原位雜交方法為熒光原位雜交方法。
附圖簡(jiǎn)述本發(fā)明將參考附圖進(jìn)行描述,其中
圖1顯示物理圖譜;圖2顯示NSD1的各種突變;圖3顯示一名患者的永生化成淋巴細(xì)胞系的直接序列測(cè)定結(jié)果;圖4顯示FISH分析結(jié)果;圖5a顯示序列表1的堿基序列;圖5b是顯示序列表1堿基序列的圖5a的續(xù)圖;圖5c是顯示序列表1堿基序列的圖5b的續(xù)圖;圖5d是顯示序列表1堿基序列的圖5c的續(xù)圖;圖5e是顯示序列表1堿基序列的圖5d的續(xù)圖;圖5f是顯示序列表1堿基序列的圖5e的續(xù)圖;圖5g是顯示序列表1堿基序列的圖5f的續(xù)圖;圖5h是顯示序列表1堿基序列的圖5g的續(xù)圖;圖5i是顯示序列表1堿基序列的圖5h的續(xù)圖;圖5j是顯示序列表1堿基序列的圖5i的續(xù)圖;圖5k是顯示序列表1堿基序列的圖5j的續(xù)圖;圖5l是顯示序列表1堿基序列的圖5k的續(xù)圖;圖5m是顯示序列表1堿基序列的圖51的續(xù)圖;圖5n是顯示序列表1堿基序列的圖5m的續(xù)圖;圖6a顯示序列表2的堿基序列;圖6b是顯示序列表2堿基序列的圖6a的續(xù)圖;圖6c是顯示序列表2堿基序列的圖6b的續(xù)圖;圖6d是顯示序列表2堿基序列的圖6c的續(xù)圖;圖6e是顯示序列表2堿基序列的圖6d的續(xù)圖;圖7a顯示序列表4的氨基酸序列;圖7b是顯示序列表4氨基酸序列的圖7b的續(xù)圖;圖8顯示序列表5的堿基序列;以及圖9顯示序列表6的堿基序列。
發(fā)明詳述首先闡述本發(fā)明的核酸。本發(fā)明的核酸是(a)包含序列表中No.1序列的1-39726位堿基序列所示的堿基序列的核酸,或者(b)其中1-39726位堿基序列的部分堿基序列缺失、置換或者添加,并具有80%、優(yōu)選90%、更優(yōu)選95%堿基序列同源性的核酸。這樣的核酸來(lái)源于人的染色體5的NSD1,并與NSD1的一部分互補(bǔ)。具體而言,該核酸與包含NSD1的外顯子1、外顯子2和內(nèi)含子的基因組DNA互補(bǔ)。本發(fā)明的核酸也包括其中堿基序列1-39726位的部分堿基序列缺失、置換或添加,并具有80%、優(yōu)選90%、更優(yōu)選95%堿基序列同源性的核酸。即使該部分缺失、置換或添加,如下所述后者的核酸也可用作探針。
此外,本發(fā)明的核酸包含序列表中No.2序列的1-8511位堿基序列所示的堿基序列。該核酸來(lái)源于人的染色體5的NSD1,并與NSD1的一部分互補(bǔ)。具體而言,這是與包括NSD1的外顯子1-23的cDNA互補(bǔ)的核酸。本發(fā)明的核酸也包括其中堿基序列1-8511位的部分堿基序列缺失、置換或添加,并具有80%、優(yōu)選90%、更優(yōu)選95%堿基序列同源性的核酸。
另外,No.2序列所示堿基序列對(duì)應(yīng)的氨基酸序列如下。該氨基酸序列如序列表的No.4序列所示。No.1序列所示的堿基序列的翻譯區(qū),即對(duì)應(yīng)于NSD1第二外顯子的氨基酸序列如No.3序列所示。
根據(jù)本發(fā)明,該肽片段是(a)包含序列表中No.3序列1-309位氨基酸序列所示的氨基酸序列的肽片段,或者(b)其中No.3氨基酸序列所示的部分氨基酸序列缺失、置換或者添加,并具有80%、優(yōu)選90%、更優(yōu)選95%氨基酸序列同源性的肽片段。根據(jù)本發(fā)明,該肽片段也是(a)包含序列表中No.4序列1-2696位氨基酸序列所示的氨基酸序列的肽片段,或者(b)其中No.4氨基酸序列所示的部分氨基酸序列缺失、置換或者添加,并具有80%、優(yōu)選90%、更優(yōu)選95%氨基酸序列同源性的肽片段。該氨基酸序列可用于利用抗原抗體反應(yīng)的免疫學(xué)檢查。
關(guān)于上述核酸的純化和分離方法如下所述。無(wú)特別限制的情況下,上述核酸可通過(guò)以下方法純化并分離。該核酸包括NSD1的外顯子1和2,根據(jù)以下方法通過(guò)亞克隆名為RP1-118m12的PAC克隆而獲得。首先,純化PAC DNA。然后利用Midi-Prep柱(Qiagen,Chatsworth,CA)分離純化的PAC DNA,利用限制性內(nèi)切酶例如Sau3AI進(jìn)行部分消化。再根據(jù)廠家說(shuō)明書(shū)(Stratagene,La Jolla,CA)制備SuperCosl粘粒載體,并利用T4DNA連接酶與消化的PAC DNA連接。利用Gigapack IIIgold extract(Stratagene)包裝連接反應(yīng)產(chǎn)物,轉(zhuǎn)染至XL1-Blue MR宿主細(xì)胞。利用PCR,通過(guò)STS定位方法(STS content mapping)構(gòu)建基因組序列。從而獲得本發(fā)明的核酸。
此外,利用本領(lǐng)域技術(shù)人員公知的任何方法確定DNA的堿基序列。例如,可利用末端終止方法等確定堿基序列。
本發(fā)明探針的使用方法為,直接或利用PCR方法擴(kuò)增上述核酸,通過(guò)印跡固化到聚合物膜上,然后進(jìn)行雜交。按照常見(jiàn)方式雜交,不特別限于但可包括,例如Southern印跡方法、原位雜交方法、基于微陣列的方法以及堿基序列測(cè)定方法。從快速、準(zhǔn)確篩選的觀點(diǎn)來(lái)看,優(yōu)選原位雜交方法。原位雜交方法有熒光原位雜交方法(以下稱(chēng)作FISH方法)、放射性同位素原位雜交方法等。從無(wú)需RI設(shè)備的觀點(diǎn)來(lái)看,優(yōu)選FISH方法。FISH方法一般在玻片上制備染色體樣本,與標(biāo)記探針雜交,然后直接通過(guò)顯微鏡研究。
用于本發(fā)明探針雜交的支持介質(zhì)可為薄膜、粉末、微粒物質(zhì)、凝膠、小珠、纖維、玻璃、懸浮液、乳濁液等。其可填充到合適的柱子中使用。其中,優(yōu)選薄膜,例如硝酸纖維素膜或尼龍膜。
闡述用于本發(fā)明探針的標(biāo)記的例子??梢岳帽绢I(lǐng)域技術(shù)人員公知的標(biāo)記。該標(biāo)記不特別限于但包括,例如放射性原子(如32P、35S等)、生物素基團(tuán)、親和素基團(tuán)、酶、熒光標(biāo)記等。就利用抗原-抗體系統(tǒng)而言,標(biāo)記可包含抗原,這也在本發(fā)明范圍內(nèi)。
本發(fā)明的核酸與正常染色體5的一部分互補(bǔ)結(jié)合。然而,如果染色體5異常,即缺失異常,本發(fā)明的核酸不與這種異常染色體5結(jié)合。如果利用上述特性將本發(fā)明的核酸用作探針,可以確定染色體5的異常。因此,本發(fā)明的探針還可用作索托斯綜合癥的診斷探針,60%的索托斯綜合癥患者具有染色體5的缺失。
本發(fā)明用于診斷索托斯綜合癥的探針,包含人染色體5上的下列(a)或(b)(a)包含序列表中No.5序列的1-190位堿基序列所示的堿基序列的核酸,或者(b)其中1-190位堿基序列的部分堿基序列缺失、置換或添加,并具有80%的堿基序列同源性的核酸。
本發(fā)明用于診斷索托斯綜合癥的探針,包含人染色體5上的下列(a)或(b)(a)包含序列表中No.6序列的1-275位堿基序列所示的堿基序列的核酸,或者(b)其中1-275位堿基序列的部分堿基序列缺失、置換或添加,并具有80%的堿基序列同源性的核酸。
本發(fā)明用于診斷索托斯綜合癥的探針,包含人染色體5上的下列(a)和(b)之間的任何序列(a)包含序列表中No.5序列的1-190位堿基序列所示的堿基序列的核酸,以及(b)其中序列表中No.6序列的1-275位堿基序列的部分堿基序列的核酸。
為此使用的這些探針取決于本發(fā)明人的發(fā)現(xiàn),其中堿基序列發(fā)生缺失,其處于索托斯綜合癥患者染色體5上序列表中No.5和6序列之間。因此,序列5的堿基序列本身可用作探針,序列6的堿基序列本身可用作探針。此外,由于索托斯綜合癥患者沒(méi)有處于正常人上述序列5和6之間的序列,因此其中的任何序列都可用來(lái)診斷索托斯綜合癥。探針的堿基長(zhǎng)度取決于篩選方法,沒(méi)有特別限制,為5kb或5kb以上。特別地,優(yōu)選5-15kb,更優(yōu)選7-12kb。
雖然正常人存在上述序列5和6的序列,但是因?yàn)樗魍兴咕C合癥患者染色體的一個(gè)拷貝缺失,因此可以根據(jù)這些事實(shí)進(jìn)行基因診斷。
提供以下實(shí)施例闡述而非意在限制本發(fā)明。
以下實(shí)施例意在闡述本發(fā)明的實(shí)施方案,在不背離本發(fā)明權(quán)利要求書(shū)所要求的精神和范圍的情況下,當(dāng)然可能適當(dāng)?shù)馗淖儽景l(fā)明。
實(shí)施例1索托斯綜合癥(SS,OMIM 117550),亦稱(chēng)大腦性巨人癥,是神經(jīng)性疾病,特征在于出生前-兒童期過(guò)度發(fā)育及骨齡超前、顱骨寬大的獨(dú)特面相、肢端肥大外形及下頜突出、偶然的腦異常及發(fā)作、以及智力遲鈍。
雖然大多數(shù)病例為單個(gè)發(fā)生的,但也已知該疾病有偶爾的親-子傳播。估計(jì)SS患者具有3.9%的良性/惡性腫瘤的風(fēng)險(xiǎn)。首先,從de novot(5;8)(q35;q24.1)患者的5q35斷點(diǎn)通過(guò)定位克隆分離NSD1基因。該基因編碼2,696個(gè)氨基酸,具有SET、PHD指狀和PWWP結(jié)構(gòu)域,并與核受體(NRs)相互作用。在直接測(cè)序檢驗(yàn)的38名SS患者中,在NSD1檢測(cè)到4個(gè)de novo點(diǎn)突變(10.5%),包括一個(gè)無(wú)義突變(1310C->A,S437X)、一個(gè)單堿基缺失(3536delA)、一個(gè)單堿基插入(5998insT)和一個(gè)拼接供體位點(diǎn)突變(6135+1G->A)。此外,在可以獲得其分裂中期和/或分裂間期細(xì)胞而供FISH研究的30名SS患者中,鑒定出涉及NSD1的20個(gè)亞顯微缺失(66.7%)。總體來(lái)說(shuō),估計(jì)77%的SS患者具有NSD1突變。此結(jié)果表明,NSD1的單倍體不全性導(dǎo)致索托斯綜合癥,NSD1在人的生長(zhǎng)和大腦發(fā)育中具有重要作用。
接收了一名女孩(患者BP),患有與de novo相互易位(46,XX,t(5;8)(q35;q24.1))有關(guān)的索托斯綜合癥(SS)。由于另一種易位[t(5;15)(q35;q24.1)]以及涉及5q35的缺失[del(5)(q35.1qter)]分別與SS或SS樣外形有關(guān),5q35區(qū)可能帶有SS的基因座位。為此克隆了5q35斷點(diǎn)。首先關(guān)注FGFR4,因?yàn)槠涠ㄎ挥?q35-qter,已知其基因家族的突變與某些顱面及生長(zhǎng)異常有關(guān)。然后分離包括FGFR4的PAC克隆(RP1-251c21),并通過(guò)FISH分析確認(rèn)其包括5q35斷點(diǎn)。此后構(gòu)建包括該斷點(diǎn)的基于BAC/PAC/粘粒的物理圖譜,以確認(rèn)該斷點(diǎn)附近的其它基因(圖1a)。FISH分析表明,RP1-118m12及其粘粒亞克隆(c2b,c4D,c6A和c6B)橫跨該斷點(diǎn)(圖1b)。通過(guò)物理圖譜內(nèi)的草圖(draft)/完整序列(AC027314為CTC-286c20,AC008570為CTC-549a4)鑒定另一個(gè)基因JAZ(Genbank登錄號(hào)XM 012279)。測(cè)序了12名患者的JAZ編碼區(qū),但均未發(fā)現(xiàn)核苷酸的改變。利用對(duì)應(yīng)于c6B的部分基因組序列(AC02314)進(jìn)行BlastN檢索,鑒定小鼠Nsd1基因的同源序列。因?yàn)榫幋a核受體(NR)結(jié)合蛋白質(zhì)的Nsd1可能與轉(zhuǎn)錄調(diào)節(jié)有關(guān),其人類(lèi)直向同源物(Ortholog)NSD1成為引人注目的候選基因,并被分離。分離的NSD1具有8,088-bp開(kāi)放閱讀框架,由至少23個(gè)外顯子組成(Genbank登錄號(hào)AF395588)。
斷點(diǎn)位于NSD1之內(nèi),因?yàn)槔胏6B的FISH分析,在患者的der(5)和der(8)染色體上都產(chǎn)生分裂信號(hào),并且每個(gè)信號(hào)的強(qiáng)度幾乎相等(圖1a和b)。圖1a顯示物理圖譜,其中粗黑線表示BAC/PAC粘??寺?,紅線和藍(lán)線分別表示利用FISH分析的包括5q35斷點(diǎn)的克隆,以及完整基因組序列。箭頭表示候選基因。圖1b顯示利用粘粒c6B對(duì)患者BP染色體的FISH分析,其中紅色和黃色箭頭分別表示正常染色體5以及衍生的染色體5和8的信號(hào)。設(shè)計(jì)40套引物,擴(kuò)增該基因的全部編碼區(qū)。通過(guò)直接測(cè)序,分析總共38名無(wú)關(guān)的正常SS患者的基因組DNA。
然后,在包括患者BP的39名患者中的4名患者中鑒定出四個(gè)不同的NSD1點(diǎn)突變(圖2,表1)。圖2顯示NSD1的基因組結(jié)構(gòu)以及在索托斯綜合癥患者中檢測(cè)的突變。特定區(qū)域以彩色框顯示,其中淡藍(lán)色為NR-相互作用結(jié)構(gòu)域(NID-L),粉紅色為NR-相互作用結(jié)構(gòu)域(NID+L),藍(lán)色為PHD指狀結(jié)構(gòu)域,綠色為PWWP結(jié)構(gòu)域,紅色為SET結(jié)構(gòu)域。突變包括外顯子5的一個(gè)無(wú)義突變(1310C->A,S437X)、外顯子5的一個(gè)單堿基缺失(3536delA)、外顯子19的一個(gè)單堿基插入(5998insT)以及內(nèi)含子20中拼接供體位點(diǎn)的一個(gè)堿基置換(6151+1G->A)。由于其確認(rèn)為父子關(guān)系的各自親代中沒(méi)有該變化,這四個(gè)突變均為de novo類(lèi)型。預(yù)測(cè)無(wú)義突變TCA(Ser)->TAA(終止)導(dǎo)致NSD1蛋白質(zhì)在437位氨基酸處截短(S437X)。缺失(3536delA)在nt 3651-3653處產(chǎn)生過(guò)早的終止密碼子,插入(5998insT)也在nt 6022-6024處產(chǎn)生過(guò)早的終止密碼子。預(yù)測(cè)拼接位點(diǎn)突變(6151+1G->A)跳過(guò)外顯子20,產(chǎn)生較短cDNA,導(dǎo)致只在外顯子19后增加9個(gè)氨基酸的截短蛋白質(zhì)。通過(guò)對(duì)患者的永生類(lèi)淋巴母細(xì)胞系進(jìn)行RT-PCR以及直接測(cè)序,確認(rèn)較短cDNA缺失外顯子20(圖3)。圖3a顯示RT-PCR分析結(jié)果,其中黑色和紅色箭頭分別表示正常的471-bp產(chǎn)物和異常的329-bp產(chǎn)物。此外,符號(hào)Pt為患者24,符號(hào)Wt為正常對(duì)照,符號(hào)+為使用逆轉(zhuǎn)錄酶,符號(hào)-為不使用逆轉(zhuǎn)錄酶。圖3b中,上面的線表示外顯子19、20和21,小紅圈表示拼接供體位點(diǎn)處的突變。329bp產(chǎn)物的序列分析表明跳過(guò)外顯子20,導(dǎo)致移框以及外顯子21的第10個(gè)密碼子處產(chǎn)生新的終止密碼子。盡管外顯子5或外顯子23中鑒定出其它5個(gè)堿基置換(3個(gè)同義和2個(gè)非同義改變),其在正常對(duì)照中也常見(jiàn),可能為多態(tài)性,即單核苷酸多態(tài)性(SNPs)(表1)。令人吃驚的是,39名患者中有29名在這5個(gè)SNP位點(diǎn)均顯示純合形式。這些資料有力提示,存在涉及NSD1的缺失,而12名正常對(duì)照個(gè)體的數(shù)據(jù)符合Hardy-Weinberg平衡。對(duì)于可得到其分裂中期和/或分裂間期細(xì)胞的30名患者,利用RP1-118m12為探針,F(xiàn)ISH分析檢測(cè)到其中20名(66.7%)有缺失(圖4),其中紅色和黃色箭頭分別表示正常染色體5上的信號(hào),而缺失染色體5上沒(méi)有信號(hào)。FISH分析連同點(diǎn)突變數(shù)據(jù)(4/38)提示,此組中77%的SS患者具有NSD1突變(表1)。鑒定的改變都是導(dǎo)致蛋白質(zhì)截短的缺失(半合子)或雜合突變。因此,很可能NSD1的單倍體不全性(haploinsufficency)是索托斯綜合癥的主要原因。
NSD1是雙功能核蛋白質(zhì),充當(dāng)核受體輔阻遏物,并通過(guò)與NRs的配基-結(jié)合結(jié)構(gòu)域相互作用而充當(dāng)共活化物。人SD1具有兩個(gè)不同的NR-相互作用結(jié)構(gòu)域(稱(chēng)為NID-L和NID+L),以及其它保守的結(jié)構(gòu)域,例如SET(su(var)3-9,enhancer-of-zestem trutgirax)、PWWP(脯氨酸-色氨酸-脯氨酸)及PHD(植物同源結(jié)構(gòu)域蛋白質(zhì))的指狀結(jié)構(gòu)域。SS患者中觀察到的兩個(gè)蛋白質(zhì)截短(PT)突變(S437X和3536delA),可能導(dǎo)致PHD-I、PHD-II、PWWP-II、SET以及PHD-II結(jié)構(gòu)域丟失。單堿基插入(5998insT)和拼接位點(diǎn)突變(6151+1G>A)可能丟失SET和PHD-III結(jié)構(gòu)域(圖2)。這些發(fā)現(xiàn)提示,SS患者中涉及的蛋白質(zhì)截短的SET和PHD-III結(jié)構(gòu)域的微小缺失對(duì)該蛋白質(zhì)的功能極其重要。
PHD指狀結(jié)構(gòu)域可與其它蛋白質(zhì)相互作用,并與染色質(zhì)的調(diào)節(jié)有關(guān)。
最近,從與t(5;11)(q35;p15.5)有關(guān)的兒童急性骨髓性白血病(AML)分離出NSD1-來(lái)源的嵌合蛋白質(zhì),其中NSD1在其內(nèi)含子5處融合NUP98。推測(cè)患者BP的染色體斷裂位于內(nèi)含子2。因此可以提示,兩種病癥之間的突變類(lèi)型不同,即組成型蛋白質(zhì)截短突變與形成融合基因的體細(xì)胞突變。
在核苷酸水平,NSD1與從Wolf-Hirschhorn綜合癥(WHS)的165-kc微小缺失區(qū)分離的WHSC1(NSD2)具有75%的同源性。WHS(OMIM 194190)的特征在于多種畸形、嚴(yán)重的生長(zhǎng)停滯、智力缺陷以及4p的半合子缺失(單倍體不全性)。此外,NSD2通過(guò)t(4;14)融合IgH基因時(shí),導(dǎo)致一種多發(fā)性骨髓瘤??赡軆煞N基因(NSD1和NSD2)對(duì)人的生長(zhǎng)、大腦發(fā)育以及細(xì)胞生長(zhǎng)都很重要。
由于在一個(gè)母親和兩個(gè)女兒、兩個(gè)兄弟以及三個(gè)親屬(單卵雙生女孩及其兄弟)中記述了SS,可以認(rèn)為SS是遺傳上異種的,因此假定為常染色體隱性遺傳。還記述了另一患者,為de novo t(3;6)(p21;p21)、mos dup(20)(p11.2-p12.1)[12/66]以及t(2;12)(q33.3;q15)mat。因此,提示另一SS位點(diǎn)帶有染色體斷點(diǎn)或裂片。
但是,上述數(shù)據(jù)表明大多數(shù)(多達(dá)77%)的SS患者具有NSD1突變。索托斯綜合癥NSD1缺陷的發(fā)現(xiàn)將促進(jìn)SS的診斷,并將明了對(duì)人智力遲鈍和生長(zhǎng)異常機(jī)制的理解。
物理圖譜構(gòu)建如前所述,利用STSs通過(guò)PCR篩選人PAC文庫(kù)RPCI-1,-3。從橫跨斷點(diǎn)的PAC制備粘粒亞克隆。利用Midi-PrepTM柱(Qiagen,Chatsworth,CA)分離純化的PAC DNA,利用Sau3AI進(jìn)行部分消化。根據(jù)廠家說(shuō)明書(shū)(Stratagene,La Jolla,CA)制備SuperCos1粘粒載體,并利用T4DNA連接酶與消化的PAC DNA連接。利用Gigapack III goldextract(Stratagene)包裝連接反應(yīng)產(chǎn)物,轉(zhuǎn)染至XL1-Blue MR宿主細(xì)胞(Stratagene)。參考草圖/完整的基因組序列,利用PCR借助于STS定位(STS content mapping)構(gòu)建重疊群(contig)。利用Midi-PrepTM柱提取BAC/PAC/粘粒DNA。利用BAC的T7/SP6引物或者粘粒的T7/T3引物從克隆-末端序列得到新的STSs。使用2μgBAC/PACDNA或者1μg粘粒DNA為模板以及40pmol引物,利用ABI PrismTMBigDye Terminator Cycle Sequencing Ready Reaction Kit(PEApplied Biosystems,F(xiàn)oster,CA)進(jìn)行測(cè)序反應(yīng)。
通過(guò)96℃ 10秒、50℃ 5秒以及60℃ 4分鐘,50次循環(huán),進(jìn)行測(cè)序循環(huán)。
FISH分析利用BAC/PAC/粘粒DNA,對(duì)SS患者和正常對(duì)照的分裂中期染色體和/或分裂間期細(xì)胞進(jìn)行FISH分析。利用SpectrumGreenTM-11-dUTP或SpectrumOrangeTM-11-dUTP(Vysis,Downers Grove,IL)通過(guò)切口平移標(biāo)記克隆的DNA,76℃變性10分鐘。將探針-雜交混合物(10μl)作用于染色體上,37℃溫育16小時(shí),然后如前所述洗滌。利用配備帶單波長(zhǎng)激發(fā)濾光片的四片濾光器(a quad filter set)的ZeissAxioskop顯微鏡(84000,Chroma Technology Corp.,Brattleboro,VT),進(jìn)行熒光顯微攝影。利用冷的CCD照相機(jī)(TEA/CCD-1317-G1,Princeton Instruments,Trenton,NJ)以及IPLab/MAC軟件(Scanalytics,Inc.,F(xiàn)airfax,VA)采集并合并圖像。
患者及親代樣本在得到通知同意后,從單一發(fā)生的索托斯綜合癥患者的外周血白細(xì)胞或類(lèi)淋巴母細(xì)胞系提取DNA。還從幾個(gè)病例的親代采集了樣本。除一名患者(日本-巴基斯坦人)以外,所有患者都是日本人出身。實(shí)驗(yàn)方案經(jīng)Ethical Committee for Gene Research of NagasakiUniversity School of Medicine批準(zhǔn)。
突變分析利用PCR擴(kuò)增包括編碼區(qū)的22個(gè)NSD1外顯子(外顯子2-23)。在包含1×PCR緩沖液(含1.5mM MgCl2)、0.2mM每種dNTP、1μM每種引物以及2.5U TaqGold聚合酶(PE Applied Biosystems)的50μl體積中進(jìn)行PCR,95℃ 30秒、50℃ 30秒、72℃ 1分鐘,循環(huán)35次。
利用QIAquick PCR純化試劑盒(Qiagen,Chatsworth,CA)純化PCR產(chǎn)物,用BigDye Terminator化學(xué)法通過(guò)如前所述標(biāo)準(zhǔn)程序(PEApplied Biosystems)進(jìn)行雙鏈測(cè)序。
RT-PCR分析利用Trizol試劑(Gibco-BRL,Gaithersburg,MD),從患者及正常對(duì)照建立的類(lèi)淋巴母細(xì)胞系制備總RNA。
利用隨機(jī)六聚體以及SuperscriptTMRT-PCR第一鏈合成系統(tǒng)(Gibco-BRL),按照廠家規(guī)程進(jìn)行反轉(zhuǎn)錄。使用引物NSD1PT1F5’-ATTTGTGAATGAGTATGTGG-3’(nt 5898-5917)以及NSD1RT1R5’-CTAAAACACTCATCTTCTCG-3’(nt 6349-6368),退火溫度48℃,進(jìn)行35個(gè)循環(huán),利用PCR擴(kuò)增cDNA。PCR產(chǎn)物直接測(cè)序。
Genbank登錄號(hào)人NSD1,AF395588;NSD2,XM 055926;FGFR4,XM 030308;JAZ,XM 012279;小鼠Nsd1,NM 008739;BAC克隆CTC-286c20,AC027314,CTC-549a4,AC008570。
表1索托斯綜合癥患者中鑒定的NSD1突變以及NSD1的SNPs
SNP,單核苷酸多態(tài)性;*,由FISH數(shù)據(jù)估計(jì)實(shí)施例2接下來(lái),利用包含序列表的序列5和6的探針,檢測(cè)受試者是否為索托斯綜合癥患者。利用與實(shí)施例1相同的方法進(jìn)行FISH分析。
具體地,利用RPCI-11 147K7和RPCI-11 1006E8進(jìn)行FISH分析。可以容易地從基因組數(shù)據(jù)庫(kù)中獲得RPCI-11 147K7和RPCI-11 1006E8。
其結(jié)果為,60%的索托斯綜合癥患者中確認(rèn)有缺失。因此,人們發(fā)現(xiàn)利用此探針可以進(jìn)行基因診斷。
最后,可按類(lèi)似方法,可以類(lèi)似的方式利用FISH分析確診患者是否患有索托斯綜合癥,其中將本發(fā)明有關(guān)NSD1區(qū)的核酸用作探針。
本發(fā)明的核酸和利用該核酸的探針具有有利作用,可用于基因診斷和基因治療。
特別地,根據(jù)本發(fā)明利用熒光原位雜交,不使用RI設(shè)備,操作程序簡(jiǎn)單,更為出色的一點(diǎn)是短時(shí)間(2天)內(nèi)在染色體帶上精確進(jìn)行詳細(xì)定位,故也可用于快速、安全的基因診斷。
序列表<110>head of university of nagasaki<120>核酸、包含該核酸的探針以及利用該探針的篩選方法<130>U2001P165<160>4<210>1<211>39726<212>核酸<213>人類(lèi)染色體<400>1tttgatgatg ggttctgcct ttgccatttc agacacattt tctataaatc aagctagctg 60aatctacagc tctggagggt tttttttttt ttttttttga gacagaatct cgctctgtca 120cccaggctgg agtgcactga tgtgatcttg ggtcactgca acctctgcct cccggcttca 180agagattctc ctacctaagc ctgccaagta gctgggatta caggcgtgca ccaccacgct 240cagctaattt ttgtagtttt agtagagagg ggatttcgcc atattggcca ggctggtttc 300aaactcctga cctcaagtga tctgcccacc tcggcctccc aaagtgctgg gattacaggc 360gtgagccacc agacctggcc tctgggtttt tttttttttt tttgagacag agccttacta 420tgtcacccag gctggagtgc agtggcgcga tctcagctca ctgcaacctc cgcctcccgg 480gttcaagcga ttcttctgtc tcagcctccc gagtagctgg gactacaggt gcccgccacc 540acgcccagct aatttttgta tttttagtag agacagggtt tcaccgtgtt agccgggatg 600gtcttgatct cctgaccttg tgatctgccc gctttggcct cccaaagtgc tgggattaca 660ggcgtgagcc accgtgtccg gccaacgccc agctaatttt ttgtagagat gaggtttcgt 720tgcccagtct ggtcttcaac tcctgccctc cagtgatcca cccacctcgg catcccaaag 780tgctgggatt ataggcttca gccaccacgc ccagcccttt tagtatttat tgagcaacta 840ctgggtacaa actctttgtc attcctccac tagcaagagc agtgatttca tgagctgctt 900ttcagccttt gttttcatct gtaaaatagg atatcttctc tttgaggggc aacaaggggt 960aggtgtgggt gggtgagcta taaaccctaa tcctcaccca ggaggaggtg cagccacctt 1020tctggccact ggctggagac ctcccccttt ccccatactc ctccttccac tccctgatcc 1080aagcactgcc agaacccagc attctctcac tttctcttcc tccgttttga atcagtaggt 1140tcagaagtgc ttggcttgat atgaagctgg gggtgcatcc aacaaaatca gatgcctaga 1200gaaggagcag gattggggtg ggagagagaa gacagataat tgggttgagg aacctggggg 1260catcctgaag gaggtgccca gtgggcagtt gctttgtgct gggcccaggg ccaggttata 1320cgtactttga atattttatc ttcatagcta tcccatttgg tgaggctcaa agagcgaaaa 1380tgacattcct ggtaaatggc cctgctgcag tttgaatttg tatccatctg actccaggtc 1440acgtaagctc tttttgtttt tgagacggag tctcgccctg tagcccaggc tggagtgcaa 1500tggcgggatc tcagcttact gcaacttcca cctgccaggt tcaagcgatt ctcctgcctc 1560agcctccctt gtagctggga ttacaggcac gtgccaccac gcccagctaa tcctttgtat 1620ctttagtaga gacggggttt caccatgttg gccaggctgt tctcgaaccc ctgaccttgt 1680gatccgccct cctcggcctc ccaaagtgct gggattacag gcatgagcca ctgagcctgg 1740tcataaggtc tcttatactt ttatttattt atttattgga gccagagtct cactctgtca 1800cccaggctga agtgcaatgg catgaacatg gctcactgca gcctccacat cctgggctca 1860agcgatcctc ccacctcagc ctgccaagta gctgggacta tgggtgcgaa tcatacacca 1920ccatgccagg ataatttgtt tgtttgtttg tttgtttttt taaatggagt ttcgccttgt 1980ggaccagggt ggagtgaaat ggcgcgatct cagctcactg caacctcagc ctcttgggtt 2040caagcgattc tcctgcctca gccccccgaa tagctgggat tacaggtgtg tgccaccaca 2100tccggctaat tttgtatttt tagtagagac ggggtttcac cacattggtc aggctggtct 2160caaactcctg acctcatgtg acccacctgc cttggcctcc caaagtgctg ggattacaga 2220tgtgagccac agcgcctggc ctactttttg tattttttgt agagacaagg tttagccata 2280ttgcccaggc tggtcttgaa ctcctgggct caagcgatcc gtctgcctca gccttccaaa 2340gtgctgggac taaaggcgtg caccactgta cctggcctct tatgctttgt aaagcattgt 2400ctggcaccaa aggctgtttg ttcctcaaac atcttgaatc ctttttggga ggatctgagt 2460tttgtacaac tcatttggtc cgttattgaa accacaattc tgtctgatgg agacacaggc 2520ttggagagga gaggagggga tagatcaggc atcatgaaat gtttctggag cactcactct 2580gagcttcacg gtctgggctt gttcactgga ggtcagagag tatatgtcct tagtcttgtt 2640ggaagtgact gtccaactgg atgagaccag atttagaagc cattagttac taccaggact 2700cagggaaaaa tggctgcctg taggggtggg aagactacca ggaggaggag tcttctaaac 2760tggatgaatg gagtctgccc aggggaaaag gcagagtgac tggcatgagc ataggctgga 2820caggatgtgg cttgtcctgg cactgggcag ttgggggaag tgagagcagg agggcaggga 2880ttagtggcca ccataccaag cttcagaagg aggtttaaga agaagaaaac ttaaaggtgg 2940atgcttgagt ccttcgggct ggggctgggc gtacaggctc aggttagcga caggacctgg 3000tatttggggc aggaaggaga ctgctggagg gctgcctggt ctcagatgtg gtcaggcctt 3060ccttgatctt aagttgaaaa ctgattcaat tttggggaaa tccgtgggtg gggagaggaa 3120ggaaacagct cctagaccca tcagaaggca tggtcctggt gttcaccagc tatgttcagg 3180attaattacc aaaggcctcc atgcctctcc caagacctaa ctgtttagtc agaaggcaga 3240tgctgttcct gttcagtggg aacaaggagc tggaactagg atgggagttt gtctctgggc 3300aagtcatgct tcctttctag aagatgggga taacaataat acccatctca gaggagtaaa 3360tgagtatcct gcagggtagc tggaacagag gaggataagc tacaactgtt attgtaacaa 3420caggcagagc ccttgctgga gttgtgtttc taggggagga accagtgtct tctggacaca 3480gaagagtgag ctttctactg ctcagatgcc atcacgtcat tatcctcctc cctcaccttc 3540catggctgct tactgccttc cagataaagc ttcaactctt taacttaacc aaccaagccc 3600tgaagggtga ggctctgtgt ctgccccatc cttggttgag cctctttctg cactcattac 3660ctctgccccg gcacatacac tagacatgct tgttgtggtc agttcctctg aagcctggtg 3720tttctctgga ctctgctgga atctctgcct cttccccttc ttgcctggct attcctgaat 3780atcctccagg actctctctg gatgttgctt cctcaaggat acccctgagt tagtttcaag 3840ggcattctca gcttctccag cacccttggc ttctctctca gtactcagtt ctctgccttg 3900ttattacctg tctgcttttt ccacaaggct gtgacgggga gccccaaaat atttatggaa 3960ttaatgaatg aaaaggggtg gttctaagaa aaaagagatc actgtacatt ggccaaatgt 4020cccaacaggt atctattata tctcaccagg gtaggaatta tcagtaacca agatttacag 4080atgaggaaac tcagcccaag gtagagtccc tctgcctgtc attcaaattt ctgggcacct 4140gtgtgtaagc accatgctgg gcttttcaca ggcagtatgt gtagggtgga caggctgaga 4200gcaagcacgt gaggcccatc ataccaggtg agagttaagg tgctgacacc ttgcatgagg 4260gcttagtctc ttggacctca attcttcgta gggctggtga agggtcatag gaacgactgt 4320atgtgaagtg cccaggacag tgtccagtac actagtacag acccagcaag tgtttactga 4380ttcttatctc agtcctaagg atgggagtca caggcccaga aaaggtccct ggattgagac 4440aaccagccag aggagagctg agtgtacatc ccaggccccc accctacagg gacacagtcc 4500tctcccttct gcccccactc aaggagtcag tgtccttgtg agaatctatg gcgctgtgga 4560tcttctcaac ctagtgctgg cacacatgag atgcttggcc agggcctgcc agatggggag 4620gctggagatg ggtcggctgt gattgagacc tctgtggcca agttttactc taagaggcag 4680gtaaggccct caggggttat cccagagaag tctgagaggt tttccctggg gtcctggtct 4740tctcccccag acctgtcagc aagcagttca tccccagctg ccaatctcct tttggccctc 4800agtcttccag aggagctggg aggtgggaga gaggggttct gcagggcagt gttgttcaga 4860ggtgagcttt ggaagaaact gttgtctcaa ccctattttc acaccatagc acctttattt 4920aactgtcttt tcccgaggcc aggatctcat cttttgtttc cccagcactc agcacactgc 4980ctggaatgca ggaaatggtt gctgaatgaa gcgatgaatt acatttcagc actcatcaag 5040tgctcagcct ataactaagt ctgagtgtag gctgctaaca cttagacctt taccttacag 5100aatcttcgca gccagtgctg tgcattggaa gttgcagatg gggaaactga ggctcaggac 5160tgttaagtga ctagttcaag gcaggtctca ggccctcagg atggttagtg gcaaagtaaa 5220ggactgggag gagcattgat gaattggggc aattggcaga ggagtaactg tcagtcaaaa 5280tgattggctc aaattattag gtgtgaagaa ggaaccagtc agagcttgcc tgttgagtcg 5340aattgcccag atgggattag cagggtgagt gaccctagca gaacaaagag ctggcccttg 5400taggtataga ctcgactttt ctctggttgg tcccaacaca tagacaacta ccaacctgac 5460tttgcacctg agaatcttca gggtacctca gactcttcaa cagaaggagc ctccctgagg 5520tcacagccct ctcatcagtc ccgttccagt gggcactttc cctctaacaa agcccacttg 5580ctgtcttggc agggtctgca tccggcactt gcagacatgt gctaagggcc tgttgacttg 5640ggagcctcca tcactggact gtgggccttg gagagcaaaa gggtaagagc atctcgagct 5700ccacgcctgc tgggccagtc gctggctgaa ggcaggggaa ggatggagtt tagctggcca 5760gcactaatgt cacacagggc aacgccaaaa atggcctttc tcccaggtgg gctcaaagtt 5820aacagaaggc agtgagtaaa cagtccactg gggcaataac tatgcacatt tactaagcca 5880tgggaagaat agtagtcacg tggccctcga gggcggtgcc ctcagcttga gatggagtta 5940actccaaatc taatcacaga aggctttctg gaggaggcgg aatttttatg gcggccggat 6000ccggctttct ctgaacagcg agaaggcgct tagcgcccta gggaccaggt aactcctgag 6060gtgagcttct tggtggggat caagcccagg gggcgacgga gtccgggctg ggggaagggc 6120ccgaggggct ggagtcgcaa gttcaggccc agcttgggct ccctgtcccg cccttccgct 6180gtcttggggg attggacgcc acgcggtcgt gctagattcg gtgctgcggg cccggtgcag 6240gatgcaggcc gtgaggcccc aggccgaggg ctgcgccagc gggcttgtcc cggccagccg 6300ggcggtcccg tgtcccggcg cagctccgct ggggtccaga tgcccggccc tcaggggcga 6360ggcgcgcact ccccggggaa ccgggctgcg gagcaggcgg cccgctctgg gcggcggtgg 6420cacgagaggg ccatctgcct gggtgccgag aactgcagcg tccgcggtgc gaggcgcggc 6480ccgtcccgtc ccggccccca gcccggcgcg cacgcacata cccacgccgg ccggcgcccg 6540ctgcccgagc ccccgtgcca ggcccagacc ttgactaggc gcgggaggcg gtgcagggac 6600tagaggaccc cctcccccgg cgttcccctc gccccgcccg aggctgcgag gacccctggg 6660ctcgggggtg gtgagggagc ttcgtcccgg ctgggcccgg gctggggact cggcctccct 6720gggcgggggc cgcacggctg caggccgagg tgcggacgcg ctgtcaggct gcagcccggc 6780tcggtgccgg gggtgggctc agcgctgggg tcgcctggct tcgttccccc gcggaggcca 6840cggccgggcg agcagtgccg gggcgggtaa cccgacccgg ctccccagag ccgctcaccc 6900cgcacggccc ggcaagggga gggagaggga tggggggagg gggaagggaa ggggtggtgg 6960gtgaggggct gtgggcaccg cagggccgag tccccggccc gtctgcgctg ctgtagggcg 7020gctgcccgcg gcacccggga cgatccagcc tctgcctcgc gggcgtcgag cctgagacag 7080gagggagccc tggggctgca caggcttggc tcagggaggc agacccgagc tgctgcctcc 7140attttgtttc ctgctcagct tggtctgtgg tggtggtggt ggtggtggtg tgggtttggg 7200gtgcggccgg gtagggggtt cgcctgcggc cgcgtctgct cggggcctga ggcctcgaag 7260accccagccc aagcccccag gtgagccctg cggcaggagg ggggttgcct tggcctcggg 7320ccgaacccag cgggctgagg gcaggtgccc agtggatggg gagcctgggc tgtaacctaa 7380gatggaggcc gggactgacg cgggcccgag cagggctggc gggacgatcg gacaggcctc 7440agccgcgcca ggtgccgcct gggttggggt tcgagacgcg tagggtgcgg gagccgtgtg 7500cggcccgagg ccagcgccgt gccccgaggt aggtgagggg atcggaatgc cacccacgac 7560gcccgcaggc cccgacactc caaggaggcg cgcgaggccc ctggggagcc cgcctcaggc 7620cccgcccggg cagccgggcc ggcccgtagg ccccggccgc gagcgggcgc gcagggggag 7680gggagggggc ggcagcggca gctccgctga ttgggcggcg ctctcacaag cccgacttca 7740cccgccctga accccgaaga gtgagagaag ggaacgcgcg cgctcggtgg gggaaggggt 7800gcgcgcgcac tcggggccca gccgcacgcg ggccggcgcg aggcgctcgg tcgcacgcgc 7860ggccgcgggg gcgcgcgcgg tgggggtgtg aggaggagga ggcggcggcg gaataggccg 7920gggcaggtcg cgctcgctgc cttctcccct gaagagagac gcggggggag gggggtgcgg 7980cgagcggccc cgctctctcc ccaccgctcc gctcgcaccc cagtgtaatg agggtcaccc 8040cctcccccca gctggcccgg gagggggcgc ggggcacggt aactagtgcg ctggggtggg 8100cggcgggcag gcgcgaggag aagggaggga ggagggtggc cgggcgggga agatggtggt 8160ggccgtaagg tgaggggctc gggggagggc caggcgcgat gcggggttgg tggccggcgg 8220cgctgcagcc gccggcctcc tccccctccc cctcctccat cactaccagc cgggctcagg 8280cctagctggc cgggctgccg cgaacttcct cccggcgcgg cccgtgcccc gccggccgcc 8340tgcgaacacc tcggcctccg cctcccctca ggtagcaggc tgcggggcgc ggggccggct 8400gccctcccgc agcaaacttt gcttgctgct gaatattgat gagagcgatc ggctcggctg 8460ggaggtgctg ccgcggctgc gggaaggagc gcggcccggg caggcggcgg cggcgtcggc 8520agcagccatg tttttcgagc tgtagcagct gctgctaccc tgactgggct tcgctggccg 8580cctcggtttc tccctctgcc gggtccaggc ctcttcgccc tgcagctgcg gatccagcag 8640gcctgcattc aggaaggcga gctctggggt gcagccgcct cggccggctc gcctgcggcc 8700tgcgcaccgc cgctgcaaag gctccggcgc tggctgggcg cagggtgcag cgctattgtg 8760accgctgcgc cctagcgagc caggaagggg ggggtacctt tttgtgcagg gtccaggagc 8820ccccctcgga ccccgcagcc ttttgctttt gagagatcca gctgctcgac ccctggcgag 8880ggagggggag gactagtcct gtttgagaat tgggaatttt gacgggcaga ggggttttaa 8940ttttagttca tcccaagtgt ccaccagtct acagaggagg aaaaagagac gggctgtttc 9000tatgtagcag gatcggccca gcttcgggaa aatggagttt tcagaggctc atcgaggcca 9060ttttttcatc tccagtcggg ggaacttttt ctgcccatgg aagtgcagca gaaaggcata 9120gaggccacta ggccttgaag tggctgccat tttaaagagt cgagtcagat ggcctattaa 9180ctcagattaa ttgctgtgct tttggattcc aggttgatgc cggcccagga tggatcagac 9240ctgtgaacta cccagaagaa attgtctgct gcccttttcc aatccagtga atttagatgc 9300ccctgaagac aaggacagcc ctttcggtaa tggtcaatcc aatttttctg agccacttaa 9360tgggtgtact atgcagttat cgactgtcag tggaacatcc caaaatgctt atggacaaga 9420ttctccatct tgttacattc cactgcggag actacaggat ttggcctcca tgatcaatgt 9480agagtattta aatgggtctg ctgatggatc agaatccttt caagaccctg aaaaaagtga 9540ttcaagagct cagacgccaa ttgtttgcac ttccttgagt cctggtggtc ctacagcact 9600tgctatgaaa caggaaccct cttgtaataa ctcccctgaa ctccaggtaa aagtaacaaa 9660gactatcaag aatggctttc tgcactttga gaattttact tgtgtggacg atgcagatgt 9720agattctgaa atggacccag aacagccagt cacagaggat gagagtatag aggagatctt 9780tgaggaaact cagaccaatg ccacctgcaa ttatgagact aaatcagaga atggtgtaaa 9840agtggccatg ggaagtgaac aagacagcac accagagagt agacacggtg cagtcaaatc 9900gccattcttg ccattagctc ctcagactga aacacagaaa aataagcaaa gaaatgaagt 9960ggacggcagc aatgaaaaag cagcccttct cccagccccc ttttcactag gagacacaaa 10020cattacaata gaagagcaat taaactcaat aaatttatct tttcaggatg atccagattc 10080cagtaccagt acattaggaa acatgctaga attacctgga acttcatcat catctacttc 10140acaggaattg ccatttgtaa gcagtttttg gtacaactta aatatataca tatatgtata 10200tatacaggcc acttaaaggg aaacttgtaa caaatttgtt tttggttgct tatcagttca 10260cagctgaaat cctattgcta atcataagct ttgggcaaaa ttttactttg atttttaaat 10320ttatctctgt tgtatgaatt tggttgtttt aagctttttc caaataactc ttcattgaga 10380gtaggctaat gcttttaaag gcatttgatt gagttcaggt ttaatttctc aagttggagg 10440tatacatata tgattaaaaa aaaaaaaaaa agatgggttt tggcctgcca gcaccatgag 10500tgcaggtgaa ccaatttagt acttggagtc ctgttgctat atgtggcaga ttattttttt 10560acttgatgac ttgactctta cttcaggttg aagggcattt tgaacacaga ttaaagtggc 10620taagatgaag ttttcttgga cattgtcaaa atctaaatta ggctagtttt tctgaactac 10680ctgttttgaa ggtatagcat cctgtgcttt tgataactgc caccattagc tctttttttt 10740ttttttgagg tggagtctca ctctgttgcc aggctggagt gcagtggttg atcactgcaa 10800cctctgcctc ttgggttcaa gcaattctcc tgcctcaccc tcccgagtag ctgggattac 10860tggtacccat caccacgccc ggctaatttt tgtatcacca ttagctcttg aagtttttct 10920agttttgttt tgttttattt tattttattt taacagaacc ctaactaaga caaagtttta 10980tatttattta ttgtttagag actggccttg tcatgttgcc caggctggcg tcgggactcc 11040tgggctcatt cgatcctcct gcatcagcta gaactacagt agtttcagat tttgaagtgt 11100gtatgtgtat gtgtgatatg tatatattcc gtgtgtatag aaatggagag tatcttattt 11160gagttgttgt tttcagtaat gctgtcaagt attgttagag ggtgataaat gataacattt 11220gtttttattt gagcttatga agaatttctt gactttctag ctaaatgatc agttcacttc 11280tcttagcctc aattttattg cgtctaaatt ccagaagttc ttgattgcta taagattcct 11340tcagctttaa atattaatat ttgatattga ttttgtttct gcccaaacac attgtttggt 11400caccgccggt aatgttagca aagagaattt tttttggcca acaaatgtct cataccacat 11460tcagttttta taagaaaaac ttttatggta tgttgttatt ctgagttcat taaacattcg 11520ctttacctta tatccctgct gttctttaaa gttacagagg gagaatgtgg gtgtgtcact 11580tttgtttctg ttgatttgta tcttaattat gccttggtac tccttggttt cttggcaatt 11640gcagatttaa aaaaatttgc tttagtggtt atcttgagtc tgaattgtcc tacacattag 11700ggtgggtagg ctgttttgaa aacctattgg cagctcagac aaatcctttt tcttgggttc 11760acgttgaaat ttattttata tatatatcgt gtctttgttt ttgcacataa atttaaatct 11820gagaatggag atagatgttt ctctagaagc atacaaatag aattgtaaac ctgtttctcg 11880tcaaagagat gttagtggag tattggttct attaaaaaaa aaatgaaggc tgagtgtggt 11940ggctcacacc tgtagtccca gcactttggg aggctgaggt ggacagatca cctgaggtca 12000ggagtttgag accagtctgg ccaacatggt gaaactccgt ctctacaaaa attagccggg 12060cgtgatggtg ggcaactgta atcccagcta ctcgagaggc tgaggcagga gaatcgcttg 12120aacccaggag gcagaggttg cagtgagcca agattgcgcc attgcactcc atactgggaa 12180ataagagtga aactctgtct caaaaaaaaa aacaacaaaa aaacaaacaa acaaacaaac 12240aaaaaactga aaatattgga gcctttagat agtaggttac atgtctaaaa tgggagttag 12300caaatgtata aatgtagaag tttttttttc agggagaaat tgaaattgct caaagacttt 12360atcaccttga agaagcaagt atgtagttta tttatttttt tgagacacag tcatgctgtc 12420acccaggctg gagtgtagtg gcgcgatctc agctcacttc aaccacctcc tcctgggttc 12480aagcgattct cccacctcag cctcccgagt agctgggact acaggtgtgc accaccatgc 12540ctgactactt tttgtatttt tattagagac gaggtttcac catgtgggcc aggctggtct 12600tgaactcctg acctcaggtg atccgcccac cttggcctcc caaagtgctg ggattacagg 12660cgtgagccac cgtacccatc ccctaattta ttattttagg aatttggttc aaagttgtga 12720ttgaaatcta ttgcctttat ttttgccttt gatattttta aactgaagac attttttttt 12780ttgagacgaa gtttcactct tgttgcccag gctggagtgc aatggcatga tctcggctca 12840ctgcaatctc cgccttctgg gttcaagcag ttctcctgcc tcagccttct gagtagctgg 12900gattacaggt gcgcaccacc accccagcta atttttgtat ttttagtaga gatggggttt 12960taccatgttg gcccagctgg tctcgaactc ctgacctcag gtgatccacc cgcctcagcc 13020tcccaaagtg ctgggattac aggtgtgagc cacggagccc ggcctcagac tgaggactta 13080aaaagtgagg tcagggtggg catggtggct cacgcctgta atcccagcac tttgggaggc 13140tgaggcgggt ggatcacctg agatgaggat ttcaagacca gcctggccaa catggcaaaa 13200ccccgtctct actaaaaata caaaaaatta gctaggcatg gtggcaggag cctgtaatct 13260cagctatttg ggaggctgag gcaggagaat cacttgaacc cgggaggctg aggttgcagt 13320gagctgagat cgccccattg cactctagcc tgggcaacaa gagcgaaact ccctctcaag 13380aaaaaaaaaa accatcctgg ccgacatggt gaaaccccgt ctctactaaa aatacaaaaa 13440ttagctgggc gtggtggcag gctcgggagg ttgaggcagg agaatcactt gaacccggga 13500ggcggaggtt gcagtgagcc gagattgtgc cactgcactc cagccttgag acagagggag 13560actccatctc aaaaaaaaaa aaaaaaagcg gtcaatctta gaatgcaaag ttaggtaagc 13620aatacagctt gagaaaagtg taattaaaaa taacttttct atgtagtcat gtgatattaa 13680tgtattcaac ttgttcacag ttgatttaag ttattgatat agtaggtatt gttactatgc 13740tgggaatttt agaaaatcct tagcaaattg ctatttgtct ctttttgtct gtaattttgg 13800ctgggcttgg tggctaacac ctgtaattct agcaagttgg gaagccgaga caaaaggatt 13860gcttggggcc cagagtttga aactagactg ggcaacatag tgagatcctg tctctacact 13920cagttggttg tggtggtatg cctgtagtcc cagctactca ggaggctgag gcagtagtag 13980gatcacttga ggccagaagt ttgagactgc agtgagccat gatcatgcca ctgcattcca 14040gcctaggcaa cagagcaaga tcctgtcaaa aaaaaaaaaa aaggagaaaa ttctcttggc 14100agtgggtaag agtagttatt agggttgtag atttcctgtc tggaattaga gaaagaaggg 14160tcatattttc tgttattttg tgtatctacc tctaagtgga ctgtttgcct cttgtcacga 14220attagtagcc tcttcagttt accatcatgt gctcttattt tctctgcata cagtgaagtg 14280attgtcatta caatttataa tcctgacctg gtacttttat atttaattgg gctgatattt 14340tctaattctt cccagtgtac aaaggtttta tgctttgttg ttgttgttga gacaggctag 14400gtgctttgga tgtggagaat taaatgagca tggcattttc agaggatact tgttggagat 14460tgcttgggta ggatggatgt agtcagctaa tggggcctag aaattcagac tgaagcattt 14520ggtattgatg tgatgggaac tggcagccct tgagagattt tagctgagaa gtgatgtaaa 14580atctgtttgg aagactttga gtagaggaga ttagaggcaa ggttaggatg tagggtatgt 14640tgcaatagta attaagactt aagaatcggc ccagtggcat gtacctgtag tcctagctac 14700tctggaggcc gaggcaggag gatcacttga ggctgcaatt agctgtgatt gtgcctgtga 14760atagccactg cactccaacc taggcaatat aatgagattc tgtctcttaa aaaaaaaatg 14820agcacagtga gtactctaaa gaaagggggt aaatctaaaa gattatttca aagggagaaa 14880attggcagct ttttgggggc tacctgatct ggaggcagat tggagtctgg atttgaggaa 14940tggagagaga tgaggcagat gatgtctaag gcttatagtt ttgctgcctg agacaaaaat 15000gattcctcag aggttccttc ctcttctcta cccatcatcc cacaattttc tactccctcc 15060ttagctatct tggaagaaaa ttgatctctt cacacctgag gttctgctct ctctccgatt 15120ccctcctggc tgggtgacct tttttgtttg tttttgtttt tgttttgaga cagagtctca 15180ctctgtcacc caggctggag tgcagtgggg cgatctcggc tcactgcaac ctctgcctcc 15240caggttcaag caattctctg cctcagcctc tggagtagct gggattacag gcgcccgcca 15300ccgcaaccag ctaattttta tatttttagt agagacgggg tttcaccatc ttggccaggc 15360tggtcttgaa ctcctgacct cgtgatccac ccgccttggc ctcccaaagt gctgggatta 15420caggcgtgag ccaccgcgcg cagccttttt tttttttttt tttttttttt ttttaagatg 15480aattcttgct ctgttgccca ggctggagtg cagtggtgtg accttagccc acggcaacct 15540ccatctcctg ggttcaagag attcttgtgc ctcagcctcc caagtagctg ggattgcagg 15600cgccctccac catgcttggc taatttttgt atttttagca gagagaggtt tcaccatgtt 15660ggccaggctg gtctcgaacc cctgacctca agtgatccac ctgcttcagt ctttcaaagt 15720gctggaatta caggtgtgag ccaccacgac ctgcatacca cttctcaaac agtccttttt 15780tgcgtccttg ttctcttttt cttcctcttt ctctgcagtc tcattcactt tcattgattc 15840tgctgctact ccactctatg aaactctctt ctgaactgac ttcaaaccaa caaattctac 15900ttgtcaacta agctgctcct ctaccttgtg ttatattcac ctaaaatgta atattatttc 15960cttttttatt tttcctttgg acagggtctt tctctgtcac ccaggctgta gtgcagtggt 16020gccatctcgg ctcactgcaa cctctgcctt ctgggttcaa gtgattctcc tgcctcagcc 16080tcctaagtag ctgggactac aggcgcccac caccatgcct ggctaatttt tgtattttta 16140gtagagacag ggttttgcca tgttggccat gctggtctca aactcctgac ctcaagtgat 16200acgcctgcct ctgcttccca aagtgctggg attacaggca tgagccactg cgcccagcct 16260attattttca ttttgaaccc atctctttta ttgccaaaca cgcatttact tctgtgttca 16320tgatgacatc attatcctat tcatctcaaa gctggaaacc ttgcagtcaa tcatttaaat 16380gattaaaata catttgagta cctcttgagc caggcactgc cagtataata aaaaataaaa 16440aaattaaaaa aaggaaagag atagtttgct tttaaggaac ttcactgtgt ggcaaaaact 16500agtgtaaaca atgacaatac agaatactaa gtggtctggt aggtgttatg tatgcagtac 16560tttgggagtg tggaggaagg catgcctaga ataatcaggg aggacttcac agagtggtta 16620tttatagttt aagcagagac ataccagtaa gagggaatag catatgcaag tggccagaaa 16680tccttggcta gctatctggg aggagtgggg ttgtcaggag ataaaggtat aaagataggc 16740ttatatgccg tgctgtatag ttgaatgttt ttactattac aaaattttac agatgccctc 16800agtttctccc tttattcatt tttctatgac atctttattg ttggtcttca tttagtcttt 16860ccttccagtc tatcctgtgt aaaattactt cctacttcca aaatgagaaa tactgggtct 16920ctacttaaat ttgtaaccta aatgcctcac acctcatttt ctgaacaaat aaagcccaaa 16980ttcagtgtcc tttttgatag gatcctgtcc tgacctttcc aaatctgatg ctagagcctt 17040gtgtaccctg agttcagcca aactgaactc ttaatggtcc cttgctccat actctcccct 17100tgctcatgcc tttattctcc tggtctgatt catctttgca tcttaacagt gtatagcatg 17160gtgccttctt tttactgggg acatatcgag ttaatgaatg aatgatgcta ttacagaggt 17220acagtttggg aaggggagtg agtacatttt agaaaggtga taagtggatt gtcagccttc 17280atcattttca atggaccaaa ttactaaaac tttacaggtt ggttggtttt ttttcttttt 17340tcatttcctc atgtactcaa tttctaaggc tttttgaatt tgagcttcct aatatctcat 17400gcattaattt ttttctccat tctcaacttt cactctttta attaaggata ataatttttt 17460tttttgagat ggagtcttgc tctgttgcac aggttcgagg gcagtggtgc gatcttggct 17520cactgcaatc tccgtctgcc gtgttcaagc aattctcctg cctcagcctc ctgagtagct 17580gggattacag gtgcatgcca ccacgcctgg ctaatttttg tatttttaga agagatgggg 17640tttcaccacg ttggttaagc tggtcttgaa ctcctgacct tatggtccgc ctgcctcagc 17700ctcccaaagt gctgggatta caggcatgag ccactgagcc tggccaagga taataaatta 17760taatggtttt aggttggaca tctctgactg catactgcac tgtgtttact ggaagaagtc 17820ccttaatgtc tctaaggccc atttcctcag ttctaaatta cggctagtac cttcattgga 17880gggttgttaa gtctatgata caagataact tttttttttt tttttttttg agacagagtc 17940tctatcgccc aggctggagt gcaaaatggc acgatcttgg ctcactgcaa cctccacctc 18000atgggttcaa gttgattctc ctgcctcagc ctcccaagta gcttggatta taggcatgcg 18060ccaccatgcc cgactaattt tgtgttttta gtagagatgg ggttcaccac gttggccagg 18120ctggtcgaac tcctgacctc aggtgatcga cccacctcgg cctcccaaag ttgctaggat 18180tacaggtgtg agccatctct cctggccatg atacaagata atttatatga agtaatacac 18240tgctggttct gaagtaggtg tgcagtaagt gatgcctact gctgcatgcc aagagtcaaa 18300tgtatatttg aaagagttgt gaatttcaag aaagatattt ttgagttttt ttttttttct 18360ttctgagaca gggtcttgta ctgtttccca ggctagagtg cagtggcctg atcttggctc 18420ctggctgggc ccaagtgatc caccgccctc agccttccaa cgtattggga ttacgggaat 18480gagccactgc atttggctaa gtttttgttt tttttttctc tatttttcca aacttatttg 18540attagtaaga taaagacatt aactgctgtt gacagtttcc atttttaatt agtaatcagg 18600agcatttgtt gtatttttgt ttgataatca gaataattta atttgtgcaa taggatcaat 18660agctttctgt attccaactg ttaagtggtg taagtttatt acattgttgc tttttgcagg 18720ttgtcctttg ttctagatag aaatgtttaa tttattcttc ctggttttca ggggagccca 18780ttgaaaggag atccagtctc tgaaatttag tggtaggata ataacaattg aacagttact 18840tttgaatcta atttaaataa tctcaattgt agccttttaa agcaattcct atgaaccttt 18900ttgaatttag aaaagtaata cttggccggg cgcggtggtt cacatctata atcccagcac 18960tttgggaggc tgagggggtg gattatctga ggtcaggagt tcaagaccag cctggccaac 19020gtagtgaaac cctgtctcta ctgaaaatac aaaaaaaaat tagctgggtg tggtggcacg 19080tgcctgtagt cccagctact caggaggctg atgcaggagg atcgcttgaa cccaggaggc 19140agaggttgca gtaagctggg attgtgccac tgcactccag cctgggtgac agagtgagac 19200tttgtctcaa aaaaaaaaaa aaaaaagtca aacttaaaaa tggaatataa aaatctcttg 19260atttttgtca gttttcatat actccctcat ttacactctt aatattctat tagaaattgt 19320ctcttctctc tacacacccc tttttttccc ttttggttaa tatgttaaga catcttttca 19380tatgagcatg taacatgtaa caagattttt tttttttttt ttggacagtg tctcgctctg 19440ttgctcaggc tggagtctag tagtatgatc acaactcact gcagtttaga cctcctgtgt 19500taaagtgatt ctcctacttt agcctcatga gtagttggga ctacaggccc atgccaccac 19560gcctggctaa ttaaagaaaa aattatttgg tagagacagg gtcttgctat gttgcccagg 19620ctggtcttga atttctggct tcaggcaatt ctcctactct gcatgagcca cctcagccgc 19680gaatattttc ttattatgaa atttttgttt agataaatgt tgattcacat gcagttgtaa 19740caaattccat ggccaggctg ggcgtggtgg ctcacgcctg taatcccagc actttgggag 19800gctgaggtgg atcacctgag gttgggagtc caagaccagc ctgaccaaca tggagaaacc 19860ccgtctctac taaaaataca aaattagcca ggcgtgatgg tgcgtgcttg taatcccagc 19920tacttgggag gctgaggcag aagaatcact tgaacccggg aggcggaggt tgtagtgagc 19980caagatcgtg ccattgcact ccagcctggg ctagaagagc gaaactccat ctcaaaaaaa 20040aaaaaaaaaa aatcaggaaa ttccatgggc taggcacagt gacttatgcc tgtaatccca 20100gcgttttgga aggctgaggt tggaggattg cttgagccca ggagtttgag gctacagtga 20160acactgactg tgccactgca ctccagcctg ggtgaccctg tctcttaaaa aaaaaaaaga 20220atacagagag gtcccttgta tattttgcct ggttttgcaa tggtaatatt ttgcaaaaaa 20280tatctaatac cacacaacca gaatattgat gttgatgtac ttcaccaatc gttttttttt 20340tttttttttg agtcggagtc tccatctgat gcccaggcta gagtgcagtg gctcaatctc 20400ggctcactgc aacctccacc tcctgggttc aagcaattct cctgcctcag cctcctgagt 20460agctgggact acaggcgtgt gctatgacgc ccagctagtt tttgtatttt tagtagagac 20520ggtgtttcac cgtgttatcc agggtggtct caatctcccg accttgtgat ccgcccgcct 20580cagcctccca aagtgttggg attacaggct tgagccaccg cgtccagcca gtcttactta 20640ggcattgacg ttcatgtaat ttatccatct tattcagatg tccttaaatt ttatcttttt 20700ccttaaaaga aatctgtatt tctatcagga cattctggat gtccccagtt ttactggtag 20760tctttcattg tgtgtatatt aagttctttg tttttatcac ctgtataggt tagtatatcc 20820atgactcccg tcaactttct aaatgttcgc tgggtgcagt ggctcatgcc tgtaatccca 20880gcactttggg aggctgaggc ggctggatca cctgaggtca gtagttcgag accagtctgg 20940ccaacatggt gaaaccccgt gtctactaaa aataaaaaaa aaattagctg gatatggtgg 21000gtcatgcctg taatcctagc tactcgggag gctgaggttg gagaatcgct tgaacccagg 21060aggcggaagt tgcagtgagc tgagatcgcg ccgctgcact ctagcctggg tgacagagta 21120tgtctctgtc tcaaaaaaaa aaaaaaagtt gctaaacatt tctaatacca taaggatccc 21180tgctgttgcc agccgtttta aaactacatc catcgtcttc ttggcaacct tccatctctt 21240tttcgtatgt gacagcgtct tgctctgccg cccaggctgg agtgcagtag ttgcatctca 21300gctcactgca ccctctgtgt cccaggctta agcgatcctc ccacctcagc ctcctgatta 21360gctgcgacta caggcacttg ccaccatgcc ccactaattt ttgtatgttt ttgtagagat 21420ggggttttac catgttgctc aagctcgtct tgaactcgtg agctcaagca atccgcctgc 21480cttggcctcc caaatggctg ggattacagg caggagccac catgcctggc ctagcccctc 21540catctctagc ctttgtcagt tactaaactt tttttcctga agttttgtca tttcacaaat 21600gttagataaa catgagtcat acagtatgca gccttttggg attgtctttt tttcccttag 21660cataatttcc aggggattca tctaagttgt tgactaaatc aatagttgtt ttttttgttt 21720gttttttttt tgagacggag tttcactctt gtggaccagg ctggagtgca atggcatgat 21780cttggctcac tgcaacctcc gcctcccagg ttcaagcgat tctcctgcct cagcctcctg 21840agcagttggg attataggcc cctgccacca cacccagcta atttttgtat ttttagtaga 21900gatggggttt caccatgttg gtcagggtag tcttgaactc ctggcctcaa gtgatctacc 21960tgcattggcc tcccaaagtg ctgggattac aggtgtgagc cactgcgcac ggccctagtt 22020ttttcctttt tatcactaag taatattcca tgatacaaat ataccatggt ttgcttgacc 22080gttcacctgt tgaaggacat ctggggcaat gctagctttt ggtaattaag gtaaaagtac 22140tatttatgtt catttatggg gttttgtgtg actgtaagtt ttcacttctc tgggataaat 22200accagtagaa caattgcagt attatatggt aatggcatgt taagtttttt ttttttcctg 22260agagggagtt tcgatcttgt tgcccaggct ggagtgcaat tgcgcgatct tggctcgctg 22320caacctctgc ctcctgggtt caagcgattg tcctttctca gcctcgcatg tagctgggat 22380tataggtgtc aaccaccaca cccagctcat ttttgtattt ttagtagaga tggggtttca 22440ctgtgtttgc caggctggtc ccaaactctt gaccccaggt gatccaccct cctcagcctc 22500ccaaagtgct gggattacag gcgtgagcca cggcgccccg ccaatgttca gttgtttttt 22560tgtttttttg agacaatctc tctctgtcac ccaggctgga gggcagtggc gcgatcctgg 22620ctcactgcaa cctctgcctc ccggattcaa gcgattatcc cgcctcaggc tcctgagtag 22680ctgggaccac aggtgcacac caccacacca ggctaatttt tttattttta gtagagacgg 22740ggtttcacca tgttgggtca ggctggtctc gaactcctga cctcaggtga tccacccacc 22800tcggcctccc gaagtgctgg gattacaggt gtgagccacc acgcctggcc caatgttcag 22860ttttataaga aactaccaag ctgttttccc tagtgtctgt accatttaca ttctcactag 22920cagtatatga gtgatccagt ttcttttatt ttttgttttt tgagacggag tctcgccctg 22980ttgcccaggc tgaagtgcag tggcacgatc tcggctcact gcaacctctg cttcccggct 23040tcaagtgatt ctcctgcatc agcctcccaa gtagctggga ttacaggcat gtgcaccatg 23100cctggctaat tttttgtatt tttagtagag atagggtttc accatgttgg ccaggctggt 23160ctcgaactcc tgacctcagg taatccaccc atcttggctt cccaaagtcc tgggatttca 23220ggcatgagcc attgcacctg gccgagtgct tcagtttcta tgcatcctca ccagcatttg 23280gtgtggtcac tattttaatt ttagccattc gtgtagatat gtagtaatgt ctcatctcat 23340tatgttttgt tttttttttt gagacggaat gttgctcttg ttgcccagac tggagtgcag 23400tgatgccatc tcggttcact gcaacctcca cctgctgagt tcaagcaatt ctcgtgcgtc 23460agcctctgga gtagctggga ttataggtgt gcatcaccat gcctggctaa tttttgtatt 23520ttttagtaga catggggttt caccacgttg gccaggctgt tcttgaactc ctgacctcag 23580gtgagctgcc cacctcggcc tcccaaagtg ctgggattac agttttgtat ggtggattcc 23640atgcagagag agttttttct gtagtctaga ttagcagtcc ccagcctttt tggcaccagg 23700gaccaaattc ctgggaaaca gtttttccac aggtgggagt gggatggttt ggggatgaaa 23760cttttccacc ttagattatc acgcattagt tagaatctca taagaagcgc gcaacctaga 23820tcccttgcat ttgcagttca caatagggtt catgatcctc tgagaatcta atgccacccc 23880tgatgtgaca ggagtgggag ctcaggcgat aatgctccct tgtctgctgt tcacctcctg 23940ctatgcagcc cggttcctaa caggctgaga ggaccagtac cattctgtgg cctgggcgtt 24000ggggacccct gttctagatg atccacattc ttttaaatgc ctatatacaa accatacttt 24060ctttatttct tttctttttt tgagacagtc ttactctgtc acccaggcta gagtgcaatt 24120gcgtgatctt ggcacactgc aacctctgcc tcccaagttc aagtgattct cctgcctcag 24180cctcccgagt agttaggact acaggtgtgt cccaccatgc ctggctaatt ttttatattt 24240gtatttttta atttttattt atttatttat ttttttgaga tggagtctcg ctctgtcacg 24300caagctggaa tgcaatggca cgatctcggc tcactgcaac ctccgcctcc cgagctcaag 24360cgattctcct gcctcagcct cctgtgtagc tgggattaca ggcacccgcc acgacgcctg 24420gcttttttgt atttttgtag agacaggttt tcactgtgtt gtccgttctg gtctcaaact 24480cctgagttca gggaatccac cgccttggcc tcccaaagtg ctgggattac agtcgtgagc 24540caccgcgccc tgccacaaac catactttga aaacgttgct tccattttta gataatttgt 24600taggaaacca ataaaatcat acatacttgt gattttccct tagtaaaaca caaattttag 24660tgttttttgc tgttattatt aatacttcta aagttccttt cacattgcta gtgaccttat 24720ataaaatacc ataatgctct tctagcaatt gctggaaaga taaaatctat tttagagaat 24780gaacaattat attttcacat tagattaaat taaaagtaat tactggttat gtgatattcc 24840ctcacatacc agagtgagtc tgaaggtagt ctttctttgt aaattatgag gctatatttc 24900ctgtgttatc tctgatttct cttgatgctg taattggagt tgttgggtct ccctggtgaa 24960agtaggtgat gtgcaagttg tgtctatacc cagtgaaaat aacagacatt aatgctacac 25020taatttgtca ttggaatttt acattcaaaa gcatttcttt ttaaaaatat gattgtaaat 25080tggtaattta tagttgtata taccaaaggc atttctttaa cgttatagtt ggttcaactg 25140aaaatacgtt aagtctgttt ttataattag tatattgagg aacagcactt ccatcgtgtc 25200acaatatatt aagaattgcc agcagggcac ggtggctcac gcctataatc ccagcacttt 25260gggaggccta ggcgggagga tcacctgaag ccaggagtcg agaccagcct ggctaacgtg 25320gccaaacccc tatctactaa aaatacaaaa attagccagg tgtgatggcg ggtgcctgta 25380gtcccagcta ctcgggaggc tgaggcagga gaatccagaa ttgaattgaa cccaggagac 25440ggaggttgca gtgagccaag attgtgccat tgcactccag cctggacaac acagcgagac 25500tcagtctttt ttatttttat ttttattttt gagacggagt ttcgctcttg ttgcccaggc 25560tggagtgcaa tggcacagtc tcggctccct gcaacttctg cctcccgggt tcaagcgatt 25620cacctacctc agcctcccga ctagctggga ttacaggcat gtgccaccac gcccggctaa 25680tttttgtatt tttagtagag atgggatttc tccatgttgg tcagacttgt ctcggactcc 25740caacctctgg tgatctgccc gcctcggctt cccaaagtgc tgggattaca ggcatgagcc 25800accgtgcgtg tccttttttt tttttttatc ttttgagaca gggtctcact ctgttggcta 25860ggctggagtg cagtgatgca gtcacaactc actgcagcct caacctccca gtctcaagca 25920atacccccac ctctgcccct ttgagtaggc tgggactaca ggtgtgtgcc ttcataccta 25980gctaattttt tttgttttgt tttttgagac agtcttgccc catcgcccag gctggagtgc 26040agtggtgcca tctcggctca ctgaaagctc cgcctcccgg gttcacgcca ttctcctgcc 26100tcagcctccc gagtaactgg gaccacaggt gcccgccacc acacccggct aattttttgt 26160atttttagta gagacggggt ttcaccatgt tagccaggat agtctcgttc tcctgacctc 26220atgatccgcc tgccttggcc tcccaaagtg ctgggattac aggtgtgagc cactgcacct 26280ggccatgccc agctaatttt tgtatttttt tgtagggatg ggatggcact atgttcccta 26340ggctagtctt taattcttgg gttcaagtgg tcctcctgcc tcggcctccc aaagtgttgg 26400gattacaggt gtgagccact gtgccgagcc aggttgtgtg tgtgtgtatg tatgtatgta 26460tgtatgtatg tatgtatgta tgtatgtttg tatatattta tatttatttt tttggaactg 26520catctcactt tcatccaggc ccgaatgcag tgacatgatc tcagctcact gcaacttctg 26580cctcctgggt tcaagcgatt cttttttttt tttttttttt ttgagacgga gtctccctct 26640gtcgccaggt tcactgcaag ctctggctcc cgggttcacg ccattctcct gcctcagcct 26700cccaagtagc tgggactaca gatgcccacc agcatgcctg gctaattttt tgtattttta 26760gtagagatgg ggtttcactg gggtttcacc atgttagcca ggatggtctt gatctcctga 26820ccttgtgatc cgcccgcctc tgcttcccaa agtgctggga ttacaggcgt gagccactgc 26880gcctggccat ttcttttttt tttttggcaa gtgattcttg tgcctcagcc tcccgagtag 26940ctgaaattat aggcgtgtgc cctcaacgcc tgggtaattt ttgtattttt agtagagaca 27000gggtttcacc atgttggaca ggctggtctc aaactcctgg cctcaagtga tccaccctcc 27060tcagcctccc aaagtgctgg gataacagct gtgagccacc gtgcccttcc caggttttat 27120atttattctt ttttcctttt aaattatgtt tttatttagg tattgtacgt aaagtgcttt 27180tctaacagag ctttggggca gaagtgttag ggcaggtcat taaaccactg aaattagttc 27240tttggaggag aagataattg ttagagttgt aagtgaagtc ttgatagata ccttatcaat 27300ttcatagtaa tgtctgtgga atttcttttt ctgttttttt tttttttaat tatttcttga 27360ggattaactg ctgatagtgg aatatcatat atatagttgg ctcttgatgt acttatttct 27420ggatggcttt ccaaaaggat tttaccattt tacacacagt tctaaatagt atatgaattt 27480agcatttgtc ccacacttag atagcactga tttttttttt tattaagtgg gtgcaaaatg 27540ctactacaag attgctttaa ttactacagt tttattgatg aaaatgattt ctacttgttt 27600actgtttgta tttttttcta ggagttttgt gtctatattc tttgctgatg tatctttttg 27660gatttaatgt tttatacata ttaaatttct gtctcattgg atataaatat tttcccaatc 27720tggttttcat tttagttaat gattttctgt agttgtatag tcaaagtttc atttattata 27780tagctagatc tgtgttttcg agtgatttat tgattcaaag cttattgtgc ttctagatat 27840ttgataaact gactttagac tcttgtaaaa atttgaagaa ctcatatcta ctacagtctt 27900actgatttaa taggggtttt aatatccagt actatgctaa taatttttat agtgttttta 27960cgacaatttt ttgagaacat aagtttttag agctgtggat ggaatgtttt ctgctctatc 28020agttatccct tctgcgtaac agacccctaa gtgtagcagc ttagaggagt aaatatttat 28080tatctcacat tttgtaagga atcatggagt ggcttagctg gatggtgctg gctcagtctc 28140tctaatgaat ttacagtcaa gatgtctgcc agggctgcgg tctctgaagg ctgtaggatc 28200cctgtccaag acggctcact catatggatg ctagctcttt gtatgaggcc tgttctttcc 28260cacttgcact tctccatagg cctgcttact gtatggtagc tggcttttcc cggagtgagt 28320gatccaagag acagggacag accaagcagg aagatgcagt aactttttat gatgtgtatt 28380ctattggctg gccacacata ccaagcagat agggaaggga ttacacaaag gcatgaatac 28440catcaggctg ggataattgg gggccagctt ggaatctggc taccatatcc aaccaaataa 28500gaaattaata gttttaatta aaggaaaagg attatattaa atagacattc gttagttttt 28560acttttaagc tgacccaatc atttttcaga ttgaagtttt gaatagatat atgattaaaa 28620aatacatgaa aagttaacca gtgaagtgac ctctgtgcca tgtttgctca ggtaacgcac 28680ctccaattct tgtgctttcc cggagaccac cttttttaag agaaaggtag tggactgtgc 28740acacttggtc ttcctttttc acataatggt gtatgttgaa atctttccat tttagagcat 28800agctttccct ttttaatttt attattatta ttatttttga gacagagtct ccctctgtcg 28860ccccagctgg aatgcaatgg tgcgatctcg gctcactgca acctccagct cctgggttca 28920agtgattctc ctgcctcagc cacctgagta gctgggatta cagtcgcctg ccaccatgct 28980cggctaattt ttgtattttt agtagcgacg gggtttcacc atgttggcca ggctggtctc 29040gaactcctga cctcaggtta tccacctacc tcagcctccc aaagtgctgg gattacaggc 29100gtgaggcacc gtgcccggca attttttttt tttgagtcag agtcttgttc tgttgcccaa 29160gttggagtgc agtggtttga tctcggctca ctgcaacctg tacctcctgg gttcaagtga 29220ttctcctgcc tcagcctccc gagtagctgg gactacaggc atgccccacc atgcttggct 29280aattttgtat tttagtagag actaggtttc tccatgttgg tcaggctcgt gtcaaactcc 29340ctacctcagg ggatccgccc accttggcct cccaaagtgc tgggattata gacgttagcc 29400accgcgcctg gcctaatttt tgtattttca gtagaaattt ttgtatttca ctgtattggt 29460caggctggtc tggaactcct gagctcaggt gatccacccg cctcggcctc ccaaagtgct 29520gggataacag gagtgagcca ctaggtgtga cctaattttt gtatttttag tagagatggg 29580atttcaccat gtcggctaag ctggtctcga actcctgacc tcaggtgatc tgcctgcctt 29640ggcctcccaa tgtgctggga ttataggcat aagccaccgc actggctttt tttttttttt 29700tttttttaaa cctggatggt tttattttgc atgaatgtat agatatttcc tgttcataca 29760ttctgaaagt gaacaactgt atatatgcaa tttattttta ttcttattta tttatttgtt 29820tattttttga gaccagagtc tcactctgtc gcccaggcta gagtgcaatg acacaatctc 29880ggttcactgc aacctctgcc tcctgggtta agcaattctt ctgcctcagc ttccccagta 29940gctgggatta caggtgtccg ctaatttttg tatttttaca aaatacaccc aggtaatttt 30000ttgtaatttt ggtagagaca ggtttcacca tgtcggccag gctggtctcg aactcctgac 30060ctcaggtgat atgcccgact cagcctccca aagtgctggg attacaggtg tgagccactg 30120cgtctggcct gcatggggat tcttaatgaa gattaattat tgtagttgag ggggaaaagg 30180aataataaat atttattgga ccctaaatac cttcgaatat ggaataccct aggtattcta 30240gggcatttag ggaccaataa atatttattc ctccgtactc ttccctcgct cttttcagat 30300tttttttttt tttttttttt ttttgagatg gagtcttgct ctgtctccag gctggagtgc 30360agtggcgcga tcttggctca ctgcaacctc tgcctcctgg gttgaagtga ttctcttgcc 30420tcagcctcct gagtggctgg gactacaggt gcataccact atgcccagct aatttttgta 30480ttttttgtag agacaggctt tcaccatgtt ggccaggatg gtctcgttct ttagacctcg 30540tgatctgtct tcctcagcct cccaaagtgt tggaattaca ggcgtaagcc tccgccgggc 30600cttttttaga tttttaagag aatttttgtt aaagcatgaa cttaaaaaat cagacttggc 30660ttggagcggt ggctcatggc ctctagtccc aggactttgg gtggctgagg caagtggatt 30720gcttgagccc aggagttcaa gacctgcctt ggcaataata tcaagacccc ctcttcatga 30780aaaacaatca agctaatact tgatactatt ttacataaga attttttata gtatgtcatg 30840ttttaatgta tattggttat atagttgcaa atttaaaggc atggtggtgg ctcatacctg 30900taatcccagc actttgggag gctggggcgg gcagatcttc tgaggtcagg agttcaagac 30960cagcctggcc aacatggtgg aaccccgtct taggctgagg caggagaata gcttgtgccc 31020aggaggcaga ggttgctttg agctgagatc gcaccacggc attccagcct ggaggacaga 31080gcgagactct gtctctaaat aaataaataa ataaataaat gtatactaac tgcattagca 31140agactccgtc tctaaataaa taagtgaata aataaatgta tactaattgc attttaaaaa 31200tcaaagtata ggccgggtac ggtggctcac aactgtaatc ctagcacttt tggaggctga 31260ggtggatgga tcacctgagg tcaggagttt gagaccagcc tgaccaacat ggtgaaactt 31320tgtctctact aaaaatacaa aattagctgg tgtggtggcg catggctgta atcccagcta 31380ctcgggaggc tgaggtagga gaattgcttg aacctgagag gtggaggttg tggtgagcgg 31440agatcgtgct gttgcactcc agcctgggca acaagagcga aacttcgtct ccaagaaaaa 31500aaaaatatat aattcacata agataaaatt caccctcttt ggccaggcgc agtggctcat 31560gcctgtaatc ccagcacttt gggaggtaga ggtgggcaga tcacttgagg tcagggagtt 31620tgagaccagc ctggccaaca tggtgaaacc ccatctctac taaaaataca aaaattagcc 31680cggtgtggtg gcatacacct gtaatccacc tactcaggac gctgagtctg cactcagtcc 31740ctgggctaca gggtgaaact gtatctcaaa aataaagaat aaaatgcagc tacttaaagg 31800gtgtagagtt gaacaactgt taccactgtc taattccaga acctttcatc accccaaaag 31860aaaacccatt cccagcagtc atttcccatt aagtctcctc tagcccctca caaccactaa 31920tctaattcat gtttctatgt atttgcctat tctaggcgtt tcatacaaat acagtcatat 31980aatttgtggc ctttcgtgtc tgacttgttt aacttagcat aatgttttaa ggcccattta 32040tgttgttgta tgtatgcata cttcattcca ttttactgct gaatattgct ttgtactgat 32100gccacttttt gtttgtcttt tcatcacttg acggacattt tgtttcttcc actttgtggc 32160tgttacaggc agtgctactg tgaaaatttg tattaaagtt ttagcgtgaa tatatgtttt 32220cagttctctt gggaaaatac ctagaagtgg tattgtcgga tcatagggtc attctatgtt 32280tagcattttg aggaacagcc agactgtttt acatagtggt tgcaccgttt tacagtccta 32340ctttagccta tatgggttct aatttctttc tttctttctt tctttctttc tttctttctt 32400tctttctttc tttctttctt tcttttcttt cttttctttc ttttctttct tttctttctt 32460tctttctttc tttttttaga acagagtctc cctctgtagc ccaggctgga gtgcagtggc 32520atggtcttgg ctcactgcag cctccgcctc tcgggttcaa gcaattctct gcctcagcct 32580cccaagtagc ttggactaca ggcgcccgcc accacgcctg gctaatgttt gtatttttgg 32640tagtgacagg gtttcaccac attggccagg ttggtcttga actcctgacc tcaggtgatt 32700cacccacctc ggcctcccaa agtgccgaga ttacaggcat gagccactgc atccgggcgt 32760gggttctaaa ttcttaatat tctcatcaac atttattgct gtctttttaa ttttagcctg 32820taatcccagc tactagggcg actgaggtgg tagcatcgct tgagcccagg aagctgaggc 32880tgcagtgagc caagattgca ccactgcact ccaggctagg tgatgaagtg agacttcatc 32940tcaaaaaaaa aaaaaaggaa gtaatggcaa aaactggaat tattttgcac caacttaaat 33000atttagatct ttaatacctt tggaaagttt tttatatata gtttgtgtgt gtgtgtgtgt 33060atatatacac acatatatat atacacacac atatatacac acatatatat gaatgatttt 33120atatatatat atatatatat atatgaatga tatatatata tatatatgaa tgaatgaatg 33180agatggagtc tcactctgtc acccaggcag gagtgcagtg gtgccatttt ggcttatggc 33240agcctccgcc tccggggttc aagtgattct tgtacctcag cctcccgagt tgctgggatt 33300acaggcactc gccaccatgc ccggattttt tgtcttaatt catgaaggat gaattaagtc 33360tgcagttgtt ctttttccct ttttctttcc agtttttttt tttgtttgtt tgtttgtttt 33420tgagacacag tctcactcgg ttgtccaggc tggagtgcgg tggcagtatc ttggctccct 33480gtaacccatc tccctggttc aagcgattcc ggtgcctcag cttcccaagt agctaggatt 33540acaggtgtgt gacaccacac ctggttaatt tttgtatttt tagtagagac gaggtttcac 33600cgcattggtt aggttggtct caaaactcct gacctcaggt gaaccgccca cctaagcctt 33660ccaaagtgct gagattacat gcatgagcca ccaagtctgg cctaagtctg aatttttttt 33720tttttttttt tgagacggag tttcgctctt gttgcccagg ctggagtgca atggtgcgat 33780cttggctaac cgcaacctcc gcctcccacg ttcaagcaat tctgcctcag cctcccgagt 33840agctgggatt gcaggcatat accaccacgc ctggctaatt ttgtattttt gttagagatg 33900gggtttctcc gtgttgagac tggtctcgaa ctcctgacct caggtgatcc gcctgcctcg 33960gcctcccaaa gtgctgggat tacaggtgtg aaccactgca cccggccgaa tatatttttt 34020ttttttttaa atggagtctc gctctgtggc ccaggctgga atgcagcggt gtgatcttag 34080ctcactgcaa cctctgcctc cctggctcaa gcgattctcc tgcttcagcc tcctgagtac 34140ctgggaccac aggtgtgcac caccatgcct gaataatttt tttgtgtttt tgtagagatg 34200gagtttcacc atgttggcca ggctgatctc gaactactga cctcaggtga tgtgcctgcc 34260tccgccttcc caagtgctgg gattacaggc atgagctact gtacccggct aagtgtacag 34320tgttcttgtg atgtctttgt ctggtgttgg tatcagggta atactgtctt caagattacc 34380cttgaatgag ctttacttca ttttttaatg tgtttttttt tcttttcttt tgttttttgt 34440ttttgagaca gagtttcact ctgtcgcaca ggctggaatc cacactctag gctcgctgca 34500gcctccacct cccaggttca agagattctc ctgtgtcagc ctcttgagta gctggggtta 34560caggcacgtg ccacgacgcc cggctgattt ttttgtattt ttagtagtga cgggctttca 34620ccatgttggc caggctggtc tcgaactcct gacatcaagt gacctgcctt cctcagcctc 34680ccaaagtgtt gggattacag gagtgagcca ctgtgccccg cctgcaatta cttcttaagt 34740tctcaattaa aagagagttt atcaaggact ttttttggta attttgcatt ttgaaaattg 34800ctaacattaa ctgggacagc ccttttattt atttatttgt cactcagttg tttttttgag 34860ttgcctacta tgtcccaggc actggtaaga taggagtatc attgtacctg aggcagggca 34920acatgtgctt gcttgagagg agcatgatct aggattataa ggactgcaac ctccccttcc 34980caggttgaag cagttctcat gcctcagcct cccaagtagc tgggactaca gccatgagcc 35040accacgccca gctaattttt gtgtttttag tagagatgag gtttccccat gttggccagg 35100ctagtctcaa cttctggacc tcaggtgatc tgcccacttc agcctcccaa agtgctgaaa 35160ttacaggagt aattttattc tcccaaagct gctgctttgg gagaataaaa agttgagtat 35220gggccaggca tgggggctga tgcctgtgat cgcagcactt taggagactg aggtgggagt 35280ctagcttgag cccagtagtt tgagacaagc ctggggaaca tagggagatc cggcctctac 35340aaaaaaaata aattagctgg gtggagtggc atgtgcctgt ggtcccagct acttgggtgg 35400ttgaggtggg aagatatctg agctcaggag ttccaggctg cagtgagctc tgattatgca 35460ctccagcctg ggtgacagag tgagatgctg tctcaaaaaa aaaaattcag tgtggcgtga 35520ttaggctggg agggtggggc aggaagggat gacattggag gggtaggcaa ggtgtagata 35580gacctttccc tatattctcc tatttttaaa aaattttttt ctaaatagag atagggtctt 35640actattttgc ccaggctggg tctcaaactc ctgggctcaa gtaatccttc catctaggcc 35700tctatttttt gtgcaaacga ttgaaattat atttttttta cctgaatttt tcctgtgaac 35760attgggttat ttataaacct gttttctgtt tctttctttc tttttttttt tttttgtttt 35820tgttttttga gatagagtcc agcctggagt gctgtggcat gatcttggca cacttgcaac 35880ctctgcctcc tgggttcagg tgattctcct cctctagcct cctccacgcc tggctaatat 35940ttgtattttt agtagagatg gggtttcacc catgttggcc gggctgttct tgaactcctg 36000gtttcaacag atccacctgc ctcagcctgc caaagtgctg agattacagg tgtgagccac 36060tgttctaggc acttgtttct gtttcttaat tttggctgct actcagtggg aaaaagcaca 36120gattgaatct aattgaggcc gggcgctgtg gctcactcct gtaatttcag cactttggga 36180ggctgaggtg ggcagatcac ctgagatcca gagttcgaga ctagcctggc caacatgggg 36240aaacctcatc tctactaaaa acacaaaaat tagttgggcg tggtggctca tggctgtagt 36300cccagctact cgggaggctg aggcatgaga attgcttcaa cccgggaggt ggaggttgca 36360gtgagctgag atcaggacac tgccctccag gttgggcaag agagtgagac tcggtcttaa 36420aaaaaaaaaa aaatctagtt gaaaaatgtc atcgggtctt tccaaatttt tactaggaat 36480ttgttaaaat taaccaggct ggaagtcatt atagtttgtt tgtttgtttg tttgtttgag 36540atgggggtct cactctgtca cgcaggctgg agttcagtgg taggatctcg gctcactgca 36600acctctgcat cccagattca agcgatcctc tcacctctgc ctcatgagta gttggaacca 36660caggcatgtg tcaccatgct tttgtagaga cagggtttct ttcgccctgt tggctaggct 36720ggtctcaaac ttgtgagctc aagcgatccg cccaccttgg cctcccaaag tgctgggatt 36780acaggcatga gttaccttgc cttgcccatt atagcttttt tgaggctggg tcttactctc 36840tgtcatgcag gctggactgc agtggtgtga tctaagctca ctgcctcctg ggctcaagca 36900gtcctcccac ctcagcctcc tgagtagctg gcacaggcgc tacctcaccc atctaatttt 36960ttattttttt tagagatggg gttttgccat gtttgcccag gctggtctag aattcatgag 37020ctcaagtgat ctacctgcct cggcctccca atgtgctggg attacagaca tgagccacta 37080tgttcagcca tacctggcta atttttaaaa aatgttttca agagacaggg tctccctgtg 37140ttgcccaggt tggtctcaag ttcctgggat tactgctggc cttcaaaagt aaatgtgaaa 37200taattagtta atttctccct cagttgacaa ataatgccaa aagtgataaa gattaatgaa 37260atgtctcttt tttttttttt tttttgagac ggagtctcgt tctgttgcca agtctggaat 37320gcagtggcac gatctcggct cactgcaacg tccacctact gggttcaagt gattctcctg 37380cctcagcctc ccgagtagct gggactacag gcacgcatca ccatgcccgg ctaatttttg 37440tatttttagt agagacgggg tttcactatg ttggccaggc tggtcttgaa ctcctgacct 37500catgatccac ccaccttggc ctcccaaagt gctgggatta caggcatgag ccaccgcgcc 37560cagccatgaa atttcttacg tagaaaggca gcttgggatt gtagaaagaa tgtaggcttt 37620ggagttggac aggcctccat ttgagaccat acttgagtcc cgtgcttgcc ttagacaaag 37680aacctctcaa ccttagtttt taatctataa ggtgttttga aaattaattc ctagttcagt 37740acatggcaca tggtaggtac ctgctgctat ccataattct cttagttaat atattcggtg 37800ccacatgcca ggcagccagg atctgtacta agcacctaat aagtattatc tcatttaatc 37860ctcaaaagaa ccccacctga gttgctagac agccattatt tcagggttac acattaggaa 37920attgaagctt agagagattt aagtggttag ccaagtgatg gtgctggtat tccaactaag 37980gtcatctgct ttcagagcat ttactttctg ttaggctgcc tctcctgttg caaagtacta 38040agaacacaac tacataatgt atttttagtg gattcttgtc tttttgtaaa tagaaggtta 38100aaatgagagg aatttttttt ttgtttggga gacgtggtct cgctctgatg agagctagaa 38160atttgattac ttgtatttct ggtctgcata aaaatttggc ctaaaaacat caatagaaag 38220gcaagtgtca tctgcaaatc tgtcccatcc tgttcttcac aggaaaatgt aacctttttt 38280tttttttttt tctttttttg agatggagtc tagctctgtt gcccaagctg gagtgcaatg 38340gcatggtttc ccgctcactg caacctctgc cttctgggtt ctagcagttc tcctgcctca 38400gcctcctgag tagctgggat tacaggcgcc tgccaccatg cctggctaat ttttgtattt 38460ttagtagaga cagggtttca ccatgttggc caggctggtc tttaactcct gacctcaggt 38520gatccgcctg cctcggcctc ccaaagtgct gggatcacag gtgtgagcca ctgcgcccgg 38580gctcaaaatg taacgtctgt ctagtatgag gatttatttc cttgtctgac ttctgagttg 38640taatcgttta ttaacaatca cattgtaagt ttatctatga agtaataaaa tgttctttct 38700gtatattata ctggaaatga atgcttcatt caaaaaatag ttttatcttg ggaaggtagc 38760cactttttaa aaattgaggt aaaacggcca ggcacggtgg ctcacgccca taattccagc 38820actttgggag gccaaggtgg gtggagatca cctgaggtca gaagttcaag accagcctgg 38880ccaatatggt gaaactccat ctctactaaa atacaaaaat tagaccggca tggtggcagg 38940tgcctgtaat cccagctact caggaagctg aggcaggaga atcgcttgaa cccaggaggt 39000ggaggttaca gtgagccgag atcctgccgc tgcattgaag cctgggtgag aagagcgaaa 39060ctctgtctca ttaaaaaaaa aaaaaaagag gtaaaattta aataacttaa ggctgattgt 39120attggcttac acttgtaatt ccagcatttt gggagaccaa ggcaggagga tcacttgaac 39180tcagaagttt gagaccagcc tggtcaacat agggaaacct catctccaca aaaaataaaa 39240aataaaatat aaaaacttca aaattaaata agttacagtt caccattgta accattttat 39300tttatcctat ttattttgag acagtcttgt tttgtcaccc aggctggagt acagtggtgg 39360gatcacagct cactacagcc tccaccttcc aggttcaagt gattcttctg cctcagcctc 39420tgtaactggg attacaggtg cttgccacca caccctgcta atttttgtat tttgattaga 39480gacagggttt caccatgttg gcccgattgg tctcgaactc ctgagctcaa gtgatctgcc 39540tgtcttggcc tcccaaaatg agccaccgtg cctgtcccct tagtctactt taaaattcaa 39600tttgcctttt ttttaaattg taagaattcc ttatatattt tggatattaa atccttaact 39660agggatatga ttcgcaaatt tttttccccc attctgtttc tgtaggctct ttgacattct 39720ttttct 39726<210>2<211>8511<212>核酸<213>人類(lèi)染色體<400>2GGTGCGGCGA GCGGCCCCGC TCTCTCCCCA CCGCTCCGCT CGCACCCCAG TGTAATGAGG 60GTCACCCCCT CCCCCCAGCT GGCCCGGGAG GGGGCGCGGG GCACGGTTGA TGCCGGCCCA 120GGATGGATCA GACCTGTGAA CTACCCAGAA GAAATTGTCT GCTGCCCTTT TCCAATCCAG 180TGAATTTAGA TGCCCCTGAA GACAAGGACA GCCCTTTCGG TAATGGTCAA TCCAATTTTT 240CTGAGCCACT TAATGGGTGT ACTATGCAGT TATCGACTGT CAGTGGAACA TCCCAAAATG 300CTTATGGACA AGATTCTCCA TCTTGTTACA TTCCACTGCG GAGACTACAG GATTTGGCCT 360CCATGATCAA TGTAGAGTAT TTAAATGGGT CTGCTGATGG ATCAGAATCC TTTCAAGACC 420CTGAAAAAAG TGATTCAAGA GCTCAGACGC CAATTGTTTG CACTTCCTTG AGTCCTGGTG 480GTCCTACAGC ACTTGCTATG AAACAGGAAC CCTCTTGTAA TAACTCCCCT GAACTCCAGG 540TAAAAGTAAC AAAGACTATC AAGAATGGCT TTCTGCACTT TGAGAATTTT ACTTGTGTGG 600ACGATGCAGA TGTAGATTCT GAAATGGACC CAGAACAGCC AGTCACAGAG GATGAGAGTA 660TAGAGGAGAT CTTTGAGGAA ACTCAGACCA ATGCCACCTG CAATTATGAG ACTAAATCAG 720AGAATGGTGT AAAAGTGGCC ATGGGAAGTG AACAAGACAG CACACCAGAG AGTAGACACG 780GTGCAGTCAA ATCGCCATTC TTGCCATTAG CTCCTCAGAC TGAAACACAG AAAAATAAGC 840AAAGAAATGA AGTGGACGGC AGCAATGAAA AAGCAGCCCT TCTCCCAGCC CCCTTTTCAC 900TAGGAGACAC AAACATTACA ATAGAAGAGC AATTAAACTC AATAAATTTA TCTTTTCAGG 960ATGATCCAGA TTCCAGTACC AGTACATTAG GAAACATGCT AGAATTACCT GGAACTTCAT 1020CATCATCTAC TTCACAGGAA TTGCCATTTT GTCAACCTAA GAAAAAGTCT ACGCCACTGA 1080AGTATGAAGT TGGAGATCTC ATCTGGGCAA AATTCAAGAG ACGCCCATGG TGGCCCTGCA 1140GGATTTGTTC TGATCCGTTG ATTAACACAC ATTCAAAAAT GAAAGTTTCC AACCGGAGGC 1200CCTATCGGCA GTACTACGTG GAGGCTTTTG GAGATCCTTC TGAGAGAGCC TGGGTGGCTG 1260GAAAAGCAAT CGTCATGTTT GAAGGCAGAC ATCAATTCGA AGAGCTACCT GTCCTTAGGA 1320GAAGAGGGAA ACAGAAAGAA AAAGGATATA GGCATAAGGT TCCTCAGAAA ATTTTGAGTA 1380AATGGGAAGC CAGTGTTGGA CTTGCAGAAC AGTATGATGT TCCCAAGGGG TCAAAGAACC 1440GAAAATGTAT TCCTGGTTCA ATCAAGTTGG ACAGTGAAGA AGATATGCCA TTTGAAGACT 1500GCACAAATGA TCCTGAGTCA GAACATGACC TGTTGCTTAA TGGCTGTTTG AAATCACTGG 1560CTTTTGATTC TGAACATTCT GCAGATGAGA AGGAAAAGCC TTGCGCTAAA TCTCGAGCCA 1620GAAAGAGCTC TGATAATCCA AAAAGGACTA GTGTGAAAAA GGGCCACATA CAATTTGAAG 1680CACATAAAGA TGAACGGAGG GGAAAGATTC CAGAGAACCT TGGCCTAAAC TTTATCTCTG 1740GGGATATATC TGATACGCAG GCCTCTAATG AACTTTCCAG GATAGCAAAT AGCCTCACAG 1800GGTCCAACAC TGCCCCAGGA AGTTTTCTGT TTTCTTCCTG TGGAAAAAAC ACTGCAAAGA 1860AAGAATTTGA GACTTCAAAT GGTGACTCTT TATTGGGCTT GCCTGAGGGT GCTTTGATCT 1920CAAAGTGTTC TCGAGAGAAG AATAAACCCC AACGAAGCCT GGTGTGTGGT TCAAAAGTGA 1980AGCTCTGCTA TATTGGAGCA GGTGATGAGG AAAAGCGAAG TGATTCCATT AGTATCTGTA 2040CCACTTCTGA TGATGGAAGC AGTGACCTGG ATCCCATAGA ACACAGCTCA GAGTCTGATA 2100ACAGTGTCCT TGAAATTCCA GATGCTTTCG ATAGAACAGA GAACATGTTA TCTATGCAGA 2160AAAATGAAAA GATAAAGTAT TCTAGGTTTG CTGCCACAAA CACTAGGGTA AAAGCAAAAC 2220AGAAGCCTCT CATTAGTAAC TCACATACAG ACCACTTAAT GGGTTGTACT AAGAGTGCAG 2280AGCCTGGAAC CGAGACGTCT CAGGTTAATC TCTCTGATCT GAAGGCATCT ACTCTTGTTC 2340ACAAACCCCA GTCAGATTTT ACAAATGATG CTCTCTCTCC AAAATTCAAC CTGTCATCAA 2400GCATATCCAG TGAGAACTCG TTAATAAAGG GTGGGGCAGC AAATCAAGCT CTATTACATT 2460CGAAAAGCAA ACAGCCCAAG TTCCGAAGTA TAAAGTGCAA ACACAAAGAA AATCCAGTTA 2520TGGCAGAACC CCCAGTTATA AATGAGGAGT GCAGTTTGAA ATGCTGCTCT TCTGATACCA 2580AAGGCTCTCC TTTGGCCAGC ATTTCTAAAA GTGGGAAAGT GGATGGTCTA AAACTACTGA 2640ACAATATGCA TGAGAAAACC AGGGATTCAA GTGACATAGA AACAGCAGTG GTGAAACATG 2700TTTTATCCGA GTTGAAGGAA CTCTCTTACA GATCCTTAGG TGAGGATGTC AGTGACTCTG 2760GAACATCAAA GCCATCAAAA CCATTACTTT TCTCTTCTGC TTCTAGTCAG AATCACATAC 2820CTATTGAACC AGACTACAAA TTCAGTACAT TGCTAATGAT GTTGAAAGAT ATGCATGATA 2880GTAAGACGAA GGAGCAGCGG TTGATGACTG CTCAAAACCT GGTCTCTTAC CGGAGTCCTG 2940GTCGTGGGGA CTGTTCTACT AATAGTCCTG TAGGAGTCTC TAAGGTTTTG GTTTCAGGAG 3000GCTCCACACA CAATTCAGAG AAAAAGGGAG ATGGCACTCA GAACTCCGCC AATCCTAGCC 3060CTAGTGGGGG TGACTCTGCA TTATCTGGCG AGTTGTCTGC TTCCCTACCT GGCTTACTGT 3120CCGACAAGAG AGACCTCCCT GCTTCTGGTA AAAGTCGTTC AGACTGTGTT ACTAGGCGCA 3180ACTGTGGACG ATCAAAGCCT TCATCCAAAT TGCGAGATGC TTTTTCAGCC CAAATGGTAA 3240AGAACACAGT GAACCGTAAA GCCTTAAAGA CCGAGCGCAA AAGAAAACTG AATCAGCTTC 3300CAAGTGTGAC TCTTGATGCT GTACTGCAGG GAGACCGAGA ACGTGGAGGT TCATTGAGAG 3360GTGGGGCAGA AGATCCTAGT AAAGAGGATC CCCTTCAGAT AATGGGCCAC TTAACAAGTG 3420AAGATGGTGA CCATTTTTCT GATGTGCATT TCGATAGCAA GGTTAAGCAA TCTGATCCTG 3480GTAAAATTTC TGAAAAAGGA CTCTCTTTTG AAAACGGAAA AGGCCCAGAG CTGGACTCTG 3540TAATGAACAG TGAGAATGAT GAACTCAATG GTGTAAATCA AGTGGTGCCT AAAAAGCGGT 3600GGCAGCGTTT AAACCAAAGG CGCACTAAAC CTCGTAAGCG CATGAACAGA TTTAAAGAGA 3660AAGAAAACTC TGAGTGTGCC TTTAGGGTCT TACTTCCTAG TGACCCTGTG CAGGAGGGGC 3720GGGATGAGTT TCCAGAGCAT AGAACTCCTT CAGCAAGCAT ACTTGAGGAA CCACTGACAG 3780AGCAAAATCA TGCTGACTGC TTAGATTCAG CTGGGCCACG GTTAAATGTT TGTGATAAAT 3840CCAGTGCCAG CATTGGTGAC ATGGAAAAGG AGCCAGGAAT TCCCAGTTTG ACACCACAGG 3900CTGAGCTCCC TGAACCAGCT GTGCGGTCAG AGAAGAAACG CCTTAGGAAG CCAAGCAAGT 3960GGCTTTTGGA ATATACAGAA GAATATGATC AGATATTTGC TCCTAAGAAA AAACAAAAGA 4020AGGTACAGGA GCAGGTGCAC AAGGTAAGTT CCCGCTGTGA AGAGGAAAGC CTTCTAGCCC 4080GAGGTCGATC TAGTGCTCAG AACAAGCAGG TGGACGAGAA TTCTTTGATT TCAACCAAAG 4140AAGAGCCTCC AGTTCTTGAA AGGGAGGCTC CGTTTTTGGA GGGCCCCTTG GCTCAGTCAG 4200AACTTGGAGG TGGACATGCT GAGTTGCCGC AGCTGACCTT GTCTGTGCCT GTGGCTCCGG 4260AAGTCTCTCC ACGGCCTGCC CTTGAGTCTG AGGAATTGCT AGTTAAAACG CCAGGAAATT 4320ATGAAAGTAA ACGTCAAAGA AAACCAACTA AGAAACTTCT TGAATCCAAT GATTTAGACC 4380CTGGATTTAT GCCCAAGAAG GGGGACCTTG GCCTTTCTAA AAAGTGCTAT GAAGCTGGTC 4440ACCTGGAGAA TGGCATAACT GAATCTTGTG CCACATCTTA TTCAAAAGAT TTTGGTGGAG 4500GCACTACCAA GATATTTGAC AAGCCAAGGA AGCGAAAACG ACAGAGGCAT GCTGCAGCCA 4560AGATGCAGTG TAAAAAAGTG AAAAATGATG ACTCGTCAAA AGAGATTCCA GGCTCAGAGG 4620GAGAACTAAT GCCTCACAGG ACGGCCACAA GCCCCAAGGA GACTGTTGAG GAAGGTGTAG 4680AACACGATCC CGGGATGCCT GCCTCTAAAA AAATGCAGGG TGAACGCGGT GGAGGAGCTG 4740CACTCAAGGA GAATGTCTGT CAGAATTGTG AAAAATTGGG TGAGCTGCTG TTATGTGAGG 4800CTCAGTGCTG TGGGGCTTTC CACCTGGAGT GCCTTGGATT GACTGAGATG CCAAGAGGAA 4860AATTTATCTG CAATGAATGT CGCACAGGAA TCCATACCTG TTTTGTATGT AAGCAGAGTG 4920GGGAAGATGT TAAAAGGTGC CTTCTACCCT TGTGTGGAAA GTTTTACCAT GAAGAGTGTG 4980TCCAGAAGTA CCCACCCACT GTTATGCAGA ACAAGGGCTT CCGGTGCTCC CTCCACATCT 5040GTATAACCTG TCATGCTGCT AATCCAGCCA ATGTTTCTGC ATCTAAAGGT CGGCTGATGC 5100GCTGTGTCCG CTGTCCTGTG GCATACCACG CCAATGACTT TTGCCTGGCT GCTGGGTCAA 5160AGATCCTTGC ATCTAATAGT ATCATCTGCC CTAATCACTT TACCCCTAGG CGGGGCTGCC 5220GAAATCATGA GCATGTTAAT GTTAGCTGGT GCTTTGTGTG CTCAGAAGGA GGCAGCCTTC 5280TGTGCTGTGA TTCTTGCCCT GCTGCTTTTC ATCGTGAATG CCTGAACATT GATATCCCTG 5340AAGGAAACTG GTATTGCAAC GACTGTAAAG CAGGCAAAAA GCCACACTAC AGGGAGATTG 5400TCTGGGTAAA AGTTGGACGA TACAGGTGGT GGCCAGCTGA GATCTGCCAT CCTCGAGCTG 5460TTCCTTCCAA CATTGATAAG ATGAGACATG ATGTGGGAGA GTTCCCAGTC CTCTTTTTTG 5520GATCTAATGA CTATTTGTGG ACTCACCAAG CCCGAGTCTT CCCTTACATG GAGGGTGACG 5580TGAGCAGCAA GGATAAGATG GGCAAAGGAG TGGATGGGAC ATATAAAAAA GCTCTTCAGG 5640AAGCTGCAGC AAGGTTTGAG GAATTAAAGG CCCAAAAAGA GCTAAGACAG CTGCAGGAAG 5700ACCGAAAGAA TGACAAGAAG CCACCACCTT ATAAACATAT AAAGGTAAAC CGTCCTATTG 5760GCAGGGTACA GATCTTCACT GCAGACTTAT CTGAAATACC CCGTTGCAAC TGTAAAGCTA 5820CTGATGAGAA CCCCTGTGGG ATAGACTCTG AATGCATCAA CCGCATGCTG CTCTATGAGT 5880GCCACCCCAC AGTGTGTCCT GCCGGAGGGC GCTGTCAAAA CCAGTGCTTT TCCAAGCGCC 5940AATATCCAGA GGTTGAAATT TTCCGCACAT TACAGCGGGG TTGGGGTCTA CGGACAAAAA 6000CAGATATTAA AAAGGGTGAA TTTGTGAATG AGTATGTGGG TGAGCTTATA GATGAAGAAG 6060AATGCAGAGC TCGAATTCGC TATGCTCAAG AACATGATAT CACTAATTTC TATATGCTCA 6120CCCTAGACAA AGACCGAATC ATTGATGCTG GTCCCAAAGG AAACTATGCT CGGTTCATGA 6180ATCATTGCTG CCAGCCCAAC TGTGAAACAC AGAAGTGGTC TGTGAATGGA GATACCCGTG 6240TAGGCCTTTT TGCACTAAGT GACATTAAAG CAGGCACTGA ACTTACCTTC AACTACAACC 6300TAGAATGTCT TGGGAATGGA AAGACTGTTT GCAAATGTGG AGCCCCGAAC TGCAGTGGCT 6360TCTTGGGTGT AAGGCCAAAG AATCAACCCA TTGCCACGGA AGAAAAGTCA AAGAAATTCA 6420AGAAGAAGCA ACAGGGAAAG CGCAGGACCC AGGGTGAAAT CACAAAGGAG CGAGAAGATG 6480AGTGTTTTAG TTGTGGGGAT GCTGGCCAGC TCGTCTCCTG CAAGAAACCA GGCTGCCCAA 6540AAGTTTACCA CGCAGACTGT CTCAATCTGA CCAAGCGACC AGCAGGGAAA TGGGAATGTC 6600CGTGGCATCA GTGTGACATC TGCGGGAAGG AAGCAGCCTC CTTCTGTGAG ATGTGCCCCA 6660GCTCCTTTTG TAAGCAGCAT CGAGAAGGGA TGCTTTTCAT TTCCAAACTG GATGGGCGTC 6720TGTCTTGTAC TGAGCATGAC CCCTGTGGGC CCAATCCTCT GGAACCTGGG GAGATCCGTG 6780AGTATGTGCC TCCCCCAGTA CCGCTGCCTC CAGGGCCAAG CACTCACCTG GCAGAGCAAT 6840CAACAGGAAT GGCTGCTCAG GCACCCAAAA TGTCAGATAA ACCTCCTGCT GACACCAACC 6900AGATGCTGTC GCTCTCCAAA AAAGCTCTGG CAGGGACTTG TCAGAGGCCA CTGCTACCTG 6960AAAGACCTCT TGAGAGAACT GACTCCAGGC CCCAGCCTTT AGATAAGGTC AGAGACCTCG 7020CTGGGTCAGG GACCAAATCC CAATCCTTGG TTTCCAGCCA GAGGCCACTG GACAGGCCAC 7080CAGCAGTGGC AGGACCAAGA CCCCAGCTAA GCGACAAACC CTCTCCAGTG ACCAGCCCAA 7140GCTCCTCACC CTCAGTCAGG TCCCAACCAC TGGAAAGACC TCTGGGGACG GCTGACCCAA 7200GGCTGGATAA ATCCATAGGT GCTGCCAGCC CAAGGCCCCA GTCACTGGAG AAAACCTCAG 7260TTCCCACTGG CCTGAGACTT CCGCCGCCAG ACAGACTGCT CATTACTAGC AGTCCCAAAC 7320CCCAGACTTC AGACAGGCCT ACTGACAAAC CCCATGCCTC TTTGTCCCAG AGACTCCCAC 7380CTCCTGAGAA AGTACTATCA GCTGTGGTCC AGACCCTTGT AGCTAAAGAA AAAGCACTGA 7440GGCCTGTGGA CCAGAATACT CAGTCAAAAA ATAGAGCTGC TTTGGTGATG GATCTCATAG 7500ACCTAACTCC TCGCCAGAAG GAGCGGGCAG CTTCACCTCA TCAGGTCACA CCACAGGCTG 7560ATGAGAAGAT GCCAGTGTTG GAGTCAAGTT CATGGCCTGC CAGCAAAGGT CTGGGGCATA 7620TGCCGAGAGC TGTTGAGAAA GGCTGTGTGT CAGATCCTCT TCAGACATCT GGGAAAGCAG 7680CAGCCCCTTC AGAGGACCCC TGGCAAGCTG TTAAATCACT CACCCAGGCC AGACTTCTTT 7740CTCAGCCTCC TGCCAAGGCC TTTTTATATG AGCCAACAAC TCAGGCCTCA GGAAGAGCTT 7800CTGCAGGGGC TGAGCAGACC CCAGGGCCTC TTAGCCAATC CCCGGGCCTG GTGAAGCAGG 7860CGAAGCAGAT GGTCGGAGGC CAGCAACTAC CTGCACTTGC CGCCAAGAGT GGGCAATCTT 7920TTAGGTCTCT CGGGAAGGCC CCAGCCTCCC TCCCCACTGA AGAAAAGAAG TTGGTAACCA 7980CAGAGCAAAG TCCCTGGGCC CTGGGAAAAG CCTCATCACG GGCAGGGCTC TGGCCCATAG 8040TGGCTGGACA GACACTGGCA CAGTCTTGCT GGTCTGCTGG GAGCACACAG ACATTGGCAC 8100AGACTTGCTG GTCTCTTGGA AGAGGGCAAG ACCCCAAACC AGAGCAAAAT ACACTTCCAG 8160CTCTTAACCA GGCTCCTTCC AGTCACAAGT GTGCAGAATC AGAACAGAAG TAGTACCAAT 8220CAATGTCACA TGAACAAACA AGCTGCCCCC AGGGTACCAT TTGGGGAGGG GAAATCTTTT 8280CTTTCTTTCC CCCTTAAAAA AAAACACATC TGCCCCGAAC ACTTTCCCAC TGTTATTCTT 8340TCCTCATATC CCAACACTCA GAACTCTTGT GACATTAGCC AGTGGGGGCT TATGGTTGTG 8400TGAACCATGT ATGAAAATCC AGTGGGCCCC AACCAAGGAG ACAGACAGAC TTGGGTCTCT 8460TTCCCCCAAC TTTTCCACAT GGTCATCGTG AAATAAAAAG TCCACTCTGG A8511<210>3<211>309<212>氨基酸序列<213>人類(lèi)染色體<400>3MDQTCELPRR NCLLPFSNPV NLDAPEDKDS PFGNGQSNFS EPLNGCTMQL STVSGTSQNA 60YGQDSPSCYI PLRRLQDLAS MINVEYLNGS ADGSESFQDP EKSDSRAQTP IVCTSLSPGG 120PTALAMKQEP SCNNSPELQV KVTKTIKNGF LHFENFTCVD DADVDSEMDP EQPVTEDESI 180EEIFEETQTN ATCNYETKSE NGVKVAMGSE QDSTPESRHG AVKSPFLPLA PQTETQKNKQ 240RNEVDGSNEK AALLPAPFSL GDTNITIEEQ LNSINLSFQD DPDSSTSTLG NMLELPGTSS 300SSTSQELPF 309<210>4<211>2696<212>氨基酸序列<213>人類(lèi)染色體<400>4MDQTCELPRR NCLLPFSNPV NLDAPEDKDS PFGNGQSNFS EPLNGCTMQL STVSGTSQNA 60YGQDSPSCYI PLRRLQDLAS MINVEYLNGS ADGSESFQDP EKSDSRAQTP IVCTSLSPGG 120PTALAMKQEP SCNNSPELQV KVTKTIKNGF LHFENFTCVD DADVDSEMDP EQPVTEDESI 180EEIFEETQTN ATCNYETKSE NGVKVAMGSE QDSTPESRHG AVKSPFLPLA PQTETQKNKQ 240RNEVDGSNEK AALLPAPFSL GDTNITIEEQ LNSINLSFQD DPDSSTSTLG NMLELPGTSS 300SSTSQELPFC QPKKKSTPLK YEVGDLIWAK FKRRPWWPCR ICSDPLINTH SKMKVSNRRP 360YRQYYVEAFG DPSERAWVAG KAIVMFEGRH QFEELPVLRR RGKQKEKGYR HKVPQKILSK 420WEASVGLAEQ YDVPKGSKNR KCIPGSIKLD SEEDMPFEDC TNDPESEHDL LLNGCLKSLA 480FDSEHSADEK EKPCAKSRAR KSSDNPKRTS VKKGHIQFEA HKDERRGKIP ENLGLNFISG 540DISDTQASNE LSRIANSLTG SNTAPGSFLF SSCGKNTAKK EFETSNGDSL LGLPEGALIS 600KCSREKNKPQ RSLVCGSKVK LCYIGAGDEE KRSDSISICT TSDDGSSDLD PIEHSSESDN 660SVLEIPDAFD RTENMLSMQK NEKIKYSRFA ATNTRVKAKQ KPLISNSHTD HLMGCTKSAE 720PGTETSQVNL SDLKASTLVH KPQSDFTNDA LSPKFNLSSS ISSENSLIKG GAANQALLHS 780KSKQPKFRSI KCKHKENPVM AEPPVINEEC SLKCCSSDTK GSPLASISKS GKVDGLKLLN 840NMHEKTRDSS DIETAVVKHV LSELKELSYR SLGEDVSDSG TSKPSKPLLF SSASSQNHIP 900IEPDYKFSTL LMMLKDMHDS KTKEQRLMTA QNLVSYRSPG RGDCSTNSPV GVSKVLVSGG 960STHNSEKKGD GTQNSANPSP SGGDSALSGE LSASLPGLLS DKRDLPASGK SRSDCVTRRN 1020CGRSKPSSKL RDAFSAQMVK NTVNRKALKT ERKRKLNQLP SVTLDAVLQG DRERGGSLRG 1080GAEDPSKEDP LQIMGHLTSE DGDHFSDVHF DSKVKQSDPG KISEKGLSFE NGKGPELDSV 1140MNSENDELNG VNQVVPKKRW QRLNQRRTKP RKRMNRFKEK ENSECAFRVL LPSDPVQEGR 1200DEFPEHRTPS ASILEEPLTE QNHADCLDSA GPRLNVCDKS SASIGDMEKE PGIPSLTPQA 1260ELPEPAVRSE KKRLRKPSKW LLEYTEEYDQ IFAPKKKQKK VQEQVHKVSS RCEEESLLAR 1320GRSSAQNKQV DENSLISTKE EPPVLEREAP FLEGPLAQSE LGGGHAELPQ LTLSVPVAPE 1380VSPRPALESE ELLVKTPGNY ESKRQRKPTK KLLESNDLDP GFMPKKGDLG LSKKCYEAGH 1440LENGITESCA TSYSKDFGGG TTKIFDKPRK RKRQRHAAAK MQCKKVKNDD SSKEIPGSEG 1500ELMPHRTATS PKETVEEGVE HDPGMPASKK MQGERGGGAA LKENVCQNCE KLGELLLCEA 1560QCCGAFHLEC LGLTEMPRGK FICNECRTGI HTCFVCKQSG EDVKRCLLPL CGKFYHEECV 1620QKYPPTVMQN KGFRCSLHIC ITCHAANPAN VSASKGRLMR CVRCPVAYHA NDFCLAAGSK 1680ILASNSIICP NHFTPRRGCR NHEHVNVSWC FVCSEGGSLL CCDSCPAAFH RECLNIDIPE 1740GNWYCNDCKA GKKPHYREIV WVKVGRYRWW PAEICHPRAV PSNIDKMRHD VGEFPVLFFG 1800SNDYLWTHQA RVFPYMEGDV SSKDKMGKGV DGTYKKALQE AAARFEELKA QKELRQLQED 1860RKNDKKPPPY KHIKVNRPIG RVQIFTADLS EIPRCNCKAT DENPCGIDSE CINRMLLYEC 1920HPTVCPAGGR CQNQCFSKRQ YPEVEIFRTL QRGWGLRTKT DIKKGEFVNE YVGELIDEEE 1980CRARIRYAQE HDITNFYMLT LDKDRIIDAG PKGNYARFMN HCCQPNCETQ KWSVNGDTRV 2040GLFALSDIKA GTELTFNYNL ECLGNGKTVC KCGAPNCSGF LGVRPKNQPI ATEEKSKKFK 2100KKQQGKRRTQ GEITKEREDE CFSCGDAGQL VSCKKPGCPK VYHADCLNLT KRPAGKWECP 2160WHQCDICGKE AASFCEMCPS SFCKQHREGM LFISKLDGRL SCTEHDPCGP NPLEPGEIRE 2220YVPPPVPLPP GPSTHLAEQS TGMAAQAPKM SDKPPADTNQ MLSLSKKALA GTCQRPLLPE 2280RPLERTDSRP QPLDKVRDLA GSGTKSQSLV SSQRPLDRPP AVAGPRPQLS DKPSPVTSPS 2340SSPSVRSQPL ERPLGTADPR LDKSIGAASP RPQSLEKTSV PTGLRLPPPD RLLITSSPKP 2400QTSDRPTDKP HASLSQRLPP PEKVLSAVVQ TLVAKEKALR PVDQNTQSKN RAALVMDLID 2460LTPRQKERAA SPHQVTPQAD EKMPVLESSS WPASKGLGHM PRAVEKGCVS DPLQTSGKAA 2520APSEDPWQAV KSLTQARLLS QPPAKAFLYE PTTQASGRAS AGAEQTPGPL SQSPGLVKQA 2580KQMVGGQQLP ALAAKSGQSF RSLGKAPASL PTEEKKLVTT EQSPWALGKA SSRAGLWPIV 2640AGQTLAQSCW SAGSTQTLAQ TCWSLGRGQD PKPEQNTLPA LNQAPSSHKC AESEQK 2696<210>5<211>190<212>核酸<213>人類(lèi)染色體<400>5gtcacattag ctaggacttc cagtacaatg ctgaaaagga gtagtgagga gacatccttg 60ccttatccct gatcttagta ggaatgcttc aagtttttca ccattaggta tgatattagt 120ggcaggtttt ttgtagatgt tctttctgaa gttgaggaag ttcccctcta ttcctagttt 180gctggaaggc 190<210>6<211>275<212>核酸<213>人類(lèi)染色體<400>6Actttttgaa agtttcattt aggtgctatc atttaaaaaa tcagaagata tcacttaaga 60atccagcatt ctagtttctt tcgaaaaatc agaagatctg gcaacactag gcccacattc 120cggcatggca acaaccagct agagcggtgc tggctgttcc ccctctgtgg ggcttgtgct 180ctggtttctg aagtcctaac cctcaccagg cccaactgcc acctacgcca gctgcatggc 240ccctacactg tgtctctgca cgaggcagcc ccaat 27權(quán)利要求
1.包含以下(a)或(b)的核酸(a)包含序列表中No.1序列的1-39726位堿基序列所示的堿基序列的核酸,或者(b)其中1-39726位堿基序列的部分堿基序列缺失、置換或添加,并具有80%的堿基序列同源性的核酸。
2.包含以下(a)或(b)的核酸(a)包含序列表中No.2序列的1-8511位堿基序列所示的堿基序列的核酸,或者(b)其中1-8511位堿基序列的部分堿基序列缺失、置換或添加,并具有80%的堿基序列同源性的核酸。
3.包含權(quán)利要求1或2所要求的核酸的探針。
4.根據(jù)權(quán)利要求3的探針,其中該探針用于診斷索托斯綜合癥。
5.包含以下(a)或(b)的肽片段(a)包含序列表中No.3序列的1-309位氨基酸序列所示的氨基酸序列的肽片段,或者(b)其中No.3序列所示的部分氨基酸序列缺失、置換或添加,并具有80%的堿基序列同源性的肽片段。
6.包含以下(a)或(b)的肽片段(a)包含序列表中No.4序列的1-2696位氨基酸序列所示的氨基酸序列的肽片段,或者(b)其中No.4序列所示的部分氨基酸序列缺失、置換或添加,并具有80%的堿基序列同源性的肽片段。
7.包含權(quán)利要求5或6所要求的肽片段的探針。
8.用于診斷索托斯綜合癥的探針,其中該探針包含人染色體5上的下列(a)或(b)(a)包含序列表中No.5序列的1-190位堿基序列所示的堿基序列的核酸,或者(b)其中1-190位堿基序列的部分堿基序列缺失、置換或添加,并具有80%的堿基序列同源性的核酸。
9.用于診斷索托斯綜合癥的探針,其中該探針包含人染色體5上的下列(a)或(b)(a)包含序列表中No.6序列的1-275位堿基序列所示的堿基序列的核酸,或者(b)其中1-275位堿基序列的部分堿基序列缺失、置換或添加,并具有80%的堿基序列同源性的核酸。
10.用于診斷索托斯綜合癥的探針,其中該探針包含人染色體5上處于下列(a)和(b)之間的任何序列(a)包含序列表中No.5序列的1-190位堿基序列所示的堿基序列的核酸,以及(b)其中序列表中No.6序列的1-275位堿基序列的部分堿基序列的核酸。
11.篩選方法,其特征在于利用權(quán)利要求3、4和7-10中任何一項(xiàng)所要求的探針。
12.根據(jù)權(quán)利要求11的方法,其中利用至少一種選自原位雜交方法、Southern印跡方法以及堿基序列測(cè)定方法中的方法進(jìn)行篩選。
13.根據(jù)權(quán)利要求12的方法,其中原位雜交方法為熒光原位雜交方法。
全文摘要
本發(fā)明涉及核酸,其為(a)包含序列表中No.1序列的1-39726位堿基序列所示的堿基序列的核酸,或者(b)其中1-39726位堿基序列的部分堿基序列缺失、置換或者添加,并具有80%堿基序列同源性的核酸。此外,本發(fā)明還涉及包含上述核酸的探針,以及利用該探針進(jìn)行的篩選。
文檔編號(hào)C12N15/09GK1428346SQ0215719
公開(kāi)日2003年7月9日 申請(qǐng)日期2002年12月19日 優(yōu)先權(quán)日2001年12月19日
發(fā)明者松本直通, 新川詔夫 申請(qǐng)人:長(zhǎng)崎大學(xué)