本發(fā)明屬于遺傳病檢測領域,特別涉及遺傳性白質(zhì)腦病的檢測,特別是一種遺傳性白質(zhì)腦病基因芯片及其應用。
背景技術:
遺傳性白質(zhì)腦病又稱腦白質(zhì)營養(yǎng)不良,是指一組主要累及中樞神經(jīng)系統(tǒng)白質(zhì)的進展性遺傳性疾病,其基本特點為中樞白質(zhì)的髓鞘發(fā)育異常或彌漫性變性。腦白質(zhì)病變的臨床特征主要包括視聽損害(長傳導束受累)、運動障礙、錐體束征陽性、智力運動發(fā)育遲滯或倒退,驚厥少見或在病程晚期出現(xiàn)。
雖然這些疾病目前缺乏根治性治療,大多數(shù)最終會致殘,甚至導致早期死亡,但是由于分子遺傳學診斷的建立,目前絕大多數(shù)此類疾病可以預知,即孕早期做產(chǎn)前診斷,從而可以選擇是否繼續(xù)妊娠。因此,對于此類疾病,目前的重點首先是明確診斷,為進一步的準確遺傳咨詢以及產(chǎn)前診斷打基礎。
隨著高通量測序技術的發(fā)展與成熟,人類全基因組測序已經(jīng)成為遺傳相關致病基因突變研究和診斷的重要工具。通過全基因組測序對被測樣本進行全基因組掃描,可實現(xiàn)對基因突變零遺漏,從而成為遺傳代謝病相關致病基因突變研究和診斷的有效工具。
由于人類基因組的大小約為3gb,對其進行全基因組測序總計約需90gb測序數(shù)據(jù)。巨大的數(shù)據(jù)量要求所致高昂的測序成本,導致全基因組測序應用遺傳代謝病的基因診斷收到限制。全基因組測序需要產(chǎn)生大量的測序數(shù)據(jù)量,測序成本高,因此測序深度不大可能太深。對于檢查基因突變而言,想要實現(xiàn)突變檢查的零遺漏,全基因組測序確實難以擔當此任。特別是對于,一次檢測數(shù)百個基因上發(fā)生的所有突變,高深度測序才能實現(xiàn)對突變檢測的準確性。
因此,開發(fā)一款價格低廉的,準確性高的基因突變檢查產(chǎn)品,特別是對于遺傳性白質(zhì)腦病基因突變的診斷產(chǎn)品,具有重要的意義。
技術實現(xiàn)要素:
本發(fā)明人經(jīng)過對大量臨床病人的基因組數(shù)據(jù)進行分析,提供了一組基因探針,通過包括這些基因探針的基因芯片,實現(xiàn)對遺傳性白質(zhì)腦病的基因檢測。
因此,在第一方面,本發(fā)明提供了一種遺傳性白質(zhì)腦病基因芯片,所述基因芯片包括針對如下基因的探針:mccc1、amacr、pex1、galc、gcdh、pank2、pla2g6、arsa和abcd1。
mccc1突變位點為:c.980g>a和c.288+2t>a;amacr突變位點為:c.446t>a;pex1突變位點為:c.2245+1g>t和c.357+1g>t;galc突變位點為:c.392c>a和c.136g>t;gcdh突變位點為:c.148t>c、c.169g>a、c.395g>a、c.533g>a和c.892g>a;pank2突變位點為:c.260a>g和c.629t>a;pla2g6突變位點為:c.2208t>g、c.2071c>t、c.1736c>a、c.1609c>t、c.1265+1g>a、c.1117g>a、c.991g>t和c.668c>a;arsa突變位點為:c.1108-3c>g;abcd1突變位點為:c.488g>c、c.521a>g、c.796g>a、c.869c>g、c.1390c>t、c.1823g>a、c.1865+1g>a和c.1979g>a。
在一個實施方案中,檢測這些突變位點的探針包括seqidno.2、seqidno.4、seqidno.7、seqidno.9、seqidno.11、seqidno.14、seqidno.15、seqidno.18、seqidno.21、seqidno.24、seqidno.26、seqidno.29、seqidno.32、seqidno.35、seqidno.38、seqidno.41、seqidno.44、seqidno.47、seqidno.50、seqidno.53、seqidno.56、seqidno.59、seqidno.62、seqidno.65、seqidno.67、seqidno.68、seqidno.70和seqidno.73。
在一個實施方案中,檢測這些突變位點的探針分別包括選自如下各組的1-3個探針:seqidno.1-3、seqidno.4-5、seqidno.6-8、seqidno.9、seqidno.10-12、seqidno.13-14、seqidno.15-16、seqidno.17-18、seqidno.17-19、seqidno.20-22、seqidno.23-24、seqidno.25-27、seqidno.28-30、seqidno.31-33、seqidno.34-36、seqidno.37-39、seqidno.40-42、seqidno.43-45、seqidno.46-48、seqidno.49-51、seqidno.52-54、seqidno.55-57、seqidno.58-59、seqidno.60-62、seqidno.61-63、seqidno.64-66、seqidno.66-67、seqidno.68、seqidno.69-71和seqidno.72-74。在優(yōu)選的實施方案中,檢測這些突變位點的探針分別還包括這樣的探針,即上述探針的位點被突變堿基替換的探針。
在一個實施方案中,所述基因芯片包括針對如下基因的探針:abat、abat、abcd1、acox1、aldh3a2、amacr、arsa、auh、cyp27a1、ddc、dld、ercc6、ercc8、ethe1、folr1、galc、gcdh、l2hgdh、mccc1、pank2、pc、pex1、pex7、phyh、pla2g6、plp1、psap、slc16a2、slc17a5和trappc9。
在一個實施方案中,所述基因芯片包括針對表1中列出的基因的探針。
在第二方面,本發(fā)明提供了一種利用基因芯片篩查受試者基因突變的方法,所述方法包括:
1)提取所述受試者的基因組dna,或者提取所述受試者的rna,反轉錄成cdna;
2)將所述dna或cdna打斷至200-300bp的范圍;
3)對上述打碎的基因組dna進行dna小片段文庫的制備;
4)將dna小片段文庫和本發(fā)明第一方面的基因芯片進行雜交,檢測基因突變。
在一個實施方案中,在步驟2)中采用illuminatruseqdnalibrarypreparation試劑盒,進行dna小片段文庫的制備。
在第三方面中,本發(fā)明還提供了本發(fā)明第一方面的基因芯片用于檢測遺傳性白質(zhì)腦病的用途。
本發(fā)明的方法和基因芯片至少有如下優(yōu)點:
相對于全基因組測序,大大節(jié)約了所需要的測序數(shù)據(jù)量;
一次性檢測疾病相關致病基因的大多數(shù)突變,平衡了性價比,為疾病的治療和干預提供保障。
具體實施方式
通過參考示范性實施例,本發(fā)明的目的和功能以及用于實現(xiàn)這些目的和功能的方法將得以闡明。然而,本發(fā)明并不受限于以下所公開的示范性實施例;可以通過不同形式來對其加以實現(xiàn)。說明書的實質(zhì)僅僅是幫助相關領域技術人員綜合理解本發(fā)明的具體細節(jié)。
基因芯片是近幾年在高科技領域出現(xiàn)的重大科技進展之一,其主要原理是將能反應樣本中大量基因信息的基因探針以一定順序和密度固定在載體上形成陣列,與實際樣本進行雜交反應,通過雜交信號分析可高通量獲得所有待檢基因的信息。該技術以其高通量、快速、準確性高等優(yōu)點為癲癇遺傳學診斷提供一條新的解決途徑,對患兒的臨床治療、預后評估具有重要作用。
在本發(fā)明中,人類參考基因組是hg19。
在本發(fā)明中,采用本領域通用表示法表示突變。例如,突變(c.980g>a;p.r327h)中,c表示cdna,p表示蛋白質(zhì),dna水平的突變對應蛋白質(zhì)水平的突變。突變(c.2245+1g>t;splicing)中,c.2245+1g>t表示c.2245后面是內(nèi)含子,+1表示該內(nèi)含子的第1位,這位的g突變?yōu)閠;splicing表示剪接錯誤。
對于本發(fā)明說明書和權利要求書中,提及基因序列,本領域技術人員應當理解,實際包括互補雙鏈的任意一條,或者兩條。為了方便,在本說明書和權利要求書中,雖然多數(shù)情況下只給出了一條鏈,但實際上也公開了與之互補的另一條鏈。例如提及一條探針序列,實際上包括該序列以及其互補序列。例如,提及seqidno:1,實際包括其互補序列。本領域技術人員還可以理解,利用一條鏈可以檢測另一條鏈,反之亦然。
本申請中的基因序列包括dna形式或rna形式,公開其中一種,意味著另一種也被公開。例如提及一條探針序列,實際也包括相應的rna序列。
發(fā)明人近幾年在臨床研究中積累了近2000例遺傳性白質(zhì)腦病例的外顯子組序列得測序數(shù)據(jù),原始測序片段(reads)由illuminabasecallingsoftware1.7進行處理,經(jīng)過過濾去污染、使用soapaligner2.20(lir,liy,kristiansenk,etal,soap:shortoligonucleotidealignmentprogram.bioinformatics2008,24(5):713-714;lir,yuc,liy,etal,soap2:animprovedultrafasttoolforshortreadalignment.bioinformatics2009,25(15):1966-1967)比對參考基因組,獲得比對到基因組上的唯一匹配測序片段。靶區(qū)域的基因型由soapsnp(lir,liy,fangx,yangh,etal,snpdetectionformassivelyparallelwhole-genomeresequencing.genomeres2009,19(6):1124-1132)確定。隨后,對結果通過四個公共數(shù)據(jù)庫(dbsnp(v131):http://hgdownload.cse.ucsc.edu/goldenpath/hg19/database/snp131.txt.gz.;1000人:ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp或ftp://ftp-trace.ncbi.nih.gov/1000genomes/ftp;hapmap:ftp://ftp.ncbi.nlm.nih.gov/hapmap;以及yh數(shù)據(jù)庫:http://yh.genomics.org.cn)進行過濾,去掉所有已知與遺傳性白質(zhì)腦病無關的且在數(shù)據(jù)庫中等位基因頻率大于0.005的變異。
結果發(fā)現(xiàn),遺傳性白質(zhì)腦病例與如下表1中列出的基因的有關:
根據(jù)表1中列出的基因設計針對這些基因的檢測探針,通過包括所述探針的基因芯片可以檢測97%的遺傳性白質(zhì)腦病例。
為了簡化本發(fā)明的基因芯片,綜合考慮探針成本和檢出率的性價比對所述基因芯片包括的探針進行優(yōu)化,所述基因芯片包括針對如下基因的探針可以檢測86%的遺傳性白質(zhì)腦病例:abat、abcd1、acox1、aldh3a2、amacr、arsa、auh、cyp27a1、ddc、dld、ercc6、ercc8、ethe1、folr1、galc、gcdh、l2hgdh、mccc1、pank2、pc、pex1、pex7、phyh、pla2g6、plp1、psap、slc16a2、slc17a5和trappc9。
為了簡化本發(fā)明的基因芯片,進一步考慮探針成本和檢出率的性價比對所述基因芯片包括的探針進行優(yōu)化,所述基因芯片包括針對如下基因的探針可以檢測71%的遺傳性白質(zhì)腦病例:mccc1、amacr、pex1、galc、gcdh、pank2、pla2g6、arsa和abcd1。
所述基因的突變位點1-31及其在染色體上的位置如下表2中所示。
突變1-31對應的探針列對應染色體上的位置表如下表3中所示:
在本實施例中,針對所述基因的編碼序列,由5’往3’方向,按照序列反向互補的原則,從第一個堿基開始設計長度為120bp的探針序列,并且每兩個相鄰的探針序列之間存在重疊,所述每兩個相鄰的探針序列之間重疊是所述探針長度的1/2或2/3。對于所述探針序列的長度,大于120bp會帶來合成上的困難,小于110bp一是其捕獲能力降低,二是會增加探針數(shù)量,從而增加成本,二者平衡非常重要,發(fā)明人經(jīng)過不斷試驗,得到了120bp的較優(yōu)值。對于所述探針在每兩個相鄰的探針序列之間的重疊,所述每兩個相鄰的探針序列之間重疊是所述探針長度的1/2或2/3,這是因為會對每一個區(qū)域都形成2層或者3層的探針覆蓋,因此探針覆蓋均勻,進而不影響捕獲的均一性,而探針覆蓋不均勻會影響到捕獲的均一性。因此,所述每兩個相鄰的探針序列之間重疊是所述探針長度的1/2或2/3。在所述每兩個相鄰的探針序列之間重疊是所述探針長度的1/2的情況下,優(yōu)選探針長度是偶數(shù);在所述每兩個相鄰的探針序列之間重疊是所述探針長度的2/3的情況下,優(yōu)選探針長度是3的整倍數(shù)。但是,在探針長度不是偶數(shù)或3的整倍數(shù)的情況下,所述重疊取所述探針長度1/2或2/3的近似整數(shù)也是可以的,雖然其效果不如探針長度是偶數(shù)或3的整倍數(shù)的情況。
將針對所述基因的探針和探針seqidno.1-74通過商業(yè)基因芯片公司制備基因芯片,每個探針序列進行三次重復。檢測表2中所示突變位點的探針分別還包括這樣的探針,即上述探針的位點被突變堿基替換的探針。
實施例
以affymetrixhgu133a芯片平臺各檢測了648名患者和700正常對照樣本的基因表達對本發(fā)明的基因芯片進行測試?;蛐酒O計和測試由艾吉泰康(北京)生物技術有限公司進行。
第1步:rna的抽提。
按照制造商提供的說明書,使用qiagen’srneasytotalrnaisolationkit抽提800名患者和800正常人外周靜脈血的總rna;使用qiagen’soligotexdirectmrnakit從總rna中抽提mrna。
第2步:rna沉淀。
用qiagen’srneasytotalrnaisolationkit分離或洗滌后沒有必要沉淀總rna。調(diào)整洗脫體積以制備cdna合成接近希望的rna濃度。大多數(shù)poly(a)+mrna分離過程都會導致得到較稀的rna,所以需要在cdna合成前濃縮mrna。trizol分離和熱酚提取后需要乙醇沉淀:1)加1/10體積3mnaoac,ph5.2,和2.5倍體積乙醇;2)混勻,-20℃放置最少1小時;3)4℃,≥12000×g離心20分鐘;4)80%乙醇洗滌沉淀2次;5)空氣干燥沉淀;6)depc(焦磷酸二異質(zhì))處理水重新溶解沉淀。最合適的溶解體積由cdna合成中需要的rna的濃度和量來決定。rna測定,用分光光度計分析rna濃度,在260nm下以1單位吸光度等于40μg/mlrna,需要在260nm和280nm測定吸光度來確定樣品的濃度和純度,a260/a280應接近2.0為較純的rna(即比值在1.9-2.1)。
第3步:由純化的總rna合成雙鏈cdna。
hplc純化t7-(d7)24引物;
1)第一鏈cdna合成,cdna合成前,depc處理水和逆轉錄的正確體積必須確定。它由加到反應中的rna濃度和總體積決定。
rna和superscriptⅱrt體積不要超過12μl。
合成反應可在1.5ml離心管中進行(rnase-free),按下列組分合成cdna。
2)第二鏈cdna合成。第一鏈反應放置冰上,稍微離心甩下管壁試劑,在第一鏈合成的管中加入下列第二鏈反應試劑,混勻。
≥12000g離心10分鐘,16℃放置2小時加2μl10ut4dna聚合物16℃放置5分鐘,加10μl0.5medta繼續(xù)純化cdna步驟或-20℃儲存。
3)純化雙鏈cdna。phaselockgels(plg)-酚/氯仿提取,≥12000g離心plg管20-30秒,離下管壁plg;加162μl(等體積)的(25:24:1)酚:氯仿:異戊醇(10mmtris-hclph8.0,1mmedta飽和)到cdna最后合成產(chǎn)物中(162μl),最后體積到324μl,混勻,≥12000g離心10分鐘;轉移上清液至plg管,不要混合,plg會混入溶液中;≥12000g離心2分鐘;轉移上層水相到一個新的1.5ml離心管中;加0.5倍體積7.5mnh4oac和2.5倍體積乙醇(-20℃儲存)到樣品中,混勻;立即在室溫下≥12000g離心20分鐘;去上清,0.5ml80%乙醇(-20℃儲存)洗滌沉淀,在室溫下≥12000g離心5分鐘;小心去掉80%乙醇,80%乙醇再洗滌一次;空氣干燥沉淀,檢查是否干燥,rnase-free水重新溶解沉淀。
第4步:生物素標記cdna合成。
利用bioarrayhighyieldrnatranscriptlabelingkit進行cdna標記,cdna體外轉錄產(chǎn)物(總rna)如下表。
cdna體外轉錄成分如下,37℃,4.5小時,600rpm振蕩10秒/35分種。
第5步:純化和質(zhì)控體外轉錄(ivt)產(chǎn)物。
qiagenrneasycolumns純化體外轉錄產(chǎn)物,洗滌和洗脫之前將樣品過柱兩次;洗脫rna時加水到柱子后,靜置一分鐘,再離心。cdna質(zhì)控,用分光光度計分析rna濃度,a260/a280應接近2.0為較純的rna(即比值在1.9-2.1)。根據(jù)下面的計算公式確定調(diào)整crna的含量:
crna含量=rnam-(總rnai)(y)
rnam=體外轉錄后測得crna量(μg)
總rnai=開始總rna的量(μg)
y=在ivt過程中使用的cdna的倍數(shù)
凝膠電泳檢測樣品,同時進行純化和沒有純化的體外轉錄產(chǎn)物的凝膠電泳有助于檢測純化過程丟失的范圍,0.1%瓊酯糖凝膠電泳分析0.1%的樣品,rna和溴化乙錠混合,加熱到65℃,5分鐘。
第6步:片段化cdna。
在新的1.5mlrnase-free離心管中按下表加入樣品,
94℃,35分鐘。然后放置冰上。變性凝膠電泳,至少需要1μgcrna。-20℃儲存樣品。
第7步:雜交。在新的1.5mlrnase-free離心管中按下表加入樣品,
20×真核生物雜交控制試劑凍存,在使用前在65℃下5分鐘。使用前室溫平衡探針;在99℃下5分鐘;通過加樣孔加入適量體積1×雜交緩沖液濕潤芯片;在45℃下60rpm預雜交芯片10分鐘;處理過的樣品45℃,5分鐘;最大速離心5分鐘;從芯片中取出緩沖液,加等體積處理好的雜交液45℃,60rpm雜交芯片16小時。
第8步:洗脫和染色。
雜交16小時后,從芯片中取出雜交液裝入一個新的離心管,放置冰上或-80℃長時間保存;洗脫緩沖液a充滿芯片;配制下列溶液:
sape液(使用前配制,4℃儲存)
抗體溶液
洗脫工作站按下表工作。
第9步:掃描。
采用genechipscanner30007g掃描芯片,并進行芯片的圖像分析處理。
結果表明,根據(jù)表1中列出的基因設計針對這些基因的檢測探針,通過包括所述探針的基因芯片可以檢測97%的遺傳性白質(zhì)腦病例。
為了簡化本發(fā)明的基因芯片,綜合考慮探針成本和檢出率的性價比對所述基因芯片包括的探針進行優(yōu)化,所述基因芯片包括針對如下基因的探針可以檢測86%的遺傳性白質(zhì)腦病例:abat、abcd1、acox1、aldh3a2、amacr、arsa、auh、cyp27a1、ddc、dld、ercc6、ercc8、ethe1、folr1、galc、gcdh、l2hgdh、mccc1、pank2、pc、pex1、pex7、phyh、pla2g6、plp1、psap、slc16a2、slc17a5和trappc9。
為了簡化本發(fā)明的基因芯片,進一步考慮探針成本和檢出率的性價比對所述基因芯片包括的探針進行優(yōu)化,所述基因芯片包括針對如下基因的探針可以檢測71%的遺傳性白質(zhì)腦病例:mccc1、amacr、pex1、galc、gcdh、pank2、pla2g6、arsa和abcd1,即探針seqidno.1-74。
對于表3中列出的31個突變,為了達到最少28個探針有效檢測突變的目的,發(fā)明人對針對這些突變位點可以設計出的探針seqidno.1-74進行了測試,發(fā)現(xiàn)seqidno.2、seqidno.4、seqidno.7、seqidno.9、seqidno.11、seqidno.14、seqidno.15、seqidno.18、seqidno.21、seqidno.24、seqidno.26、seqidno.29、seqidno.32、seqidno.35、seqidno.38、seqidno.41、seqidno.44、seqidno.47、seqidno.50、seqidno.53、seqidno.56、seqidno.59、seqidno.62、seqidno.65、seqidno.67、seqidno.68、seqidno.70和seqidno.73可以最大實現(xiàn)遺傳性白質(zhì)腦病患者和正常對照的區(qū)分達到69%。所有探針seqidno.1-74可以檢測71%的遺傳性白質(zhì)腦病例。
雖然已經(jīng)結合優(yōu)選實施例對本發(fā)明進行了描述,但應當理解本發(fā)明的保護范圍并不局限于這里所描述的實施例。結合這里披露的本發(fā)明的說明和實踐,本發(fā)明的其他實施例對于本領域技術人員都是易于想到和理解的。說明和實施例僅被認為是示例性的,本發(fā)明的真正范圍和主旨均由權利要求所限定。
sequencelisting
<110>中南大學湘雅醫(yī)院
<120>一種遺傳性白質(zhì)腦病基因芯片及其應用
<130>cp20170523
<160>74
<170>patentinversion3.5
<210>1
<211>100
<212>dna
<213>人工序列
<400>1
tgaccaaacacatcaaggtcactggcacggtctcagatcactcacattgtactgacgaag60
gctgtacctcagttttgtcaatgccgcctggcgatctgct100
<210>2
<211>100
<212>dna
<213>人工序列
<400>2
cagatcactcacattgtactgacgaaggctgtacctcagttttgtcaatgccgcctggcg60
atctgctgcccacacgaccagcttcgcaatcatggggtca100
<210>3
<211>100
<212>dna
<213>人工序列
<400>3
cctcagttttgtcaatgccgcctggcgatctgctgcccacacgaccagcttcgcaatcat60
ggggtcataatgcacggaaacttcgtctcctgaaattgaa100
<210>4
<211>100
<212>dna
<213>人工序列
<400>4
agacaagcctgaattggcaaacacaagcatgcacaatcttacttttcctcctccaccccg60
gacggctttaatcatgacaggatagccaattctcctggcg100
<210>5
<211>100
<212>dna
<213>人工序列
<400>5
caatcttacttttcctcctccaccccggacggctttaatcatgacaggatagccaattct60
cctggcgtgttccttcaggcactggtctgattggtcctca100
<210>6
<211>100
<212>dna
<213>人工序列
<400>6
agtgcgtgtgcggtcaaaaagagccattataatgcccagtgcacacataaggccaccacc60
agcaaagtcagccaggagattcagcggggcatacggattc100
<210>7
<211>100
<212>dna
<213>人工序列
<400>7
gcccagtgcacacataaggccaccaccagcaaagtcagccaggagattcagcggggcata60
cggattctcaccacttctgccaatttttgagagaacacct100
<210>8
<211>100
<212>dna
<213>人工序列
<400>8
gtcagccaggagattcagcggggcatacggattctcaccacttctgccaatttttgagag60
aacacctacatcattaaaaacaaatttaatgtctctttta100
<210>9
<211>100
<212>dna
<213>人工序列
<400>9
catactttctctggtggatatactctgacgagagagtcgagaatgtatggctcgatccac60
aagtactgtaaaatctctagccacaaacccgccagtttct100
<210>10
<211>100
<212>dna
<213>人工序列
<400>10
ttctttaccagtatctcccaatcatctgctgagaggggttccacctcaacttgttgacaa60
gataccacatgggaacatggcttgagaaatacctagaaaa100
<210>11
<211>100
<212>dna
<213>人工序列
<400>11
tggttttctttaccagtatctcccaatcatctgctgagaggggttccacctcaacttgtt60
gacaagataccacatgggaacatggcttgagaaataccta100
<210>12
<211>100
<212>dna
<213>人工序列
<400>12
taccagtatctcccaatcatctgctgagaggggttccacctcaacttgttgacaagatac60
cacatgggaacatggcttgagaaatacctagaaaaaatta100
<210>13
<211>100
<212>dna
<213>人工序列
<400>13
tcacgacataataggcagtcagctgaagattgacataaggccagtcgaaaccttttccca60
gccatccagggaatgaccatggcaaccctgcagagagaag100
<210>14
<211>100
<212>dna
<213>人工序列
<400>14
cataaggccagtcgaaaccttttcccagccatccagggaatgaccatggcaaccctgcag60
agagaagggaggaggcaaaggtagaggaggtataacggtg100
<210>15
<211>100
<212>dna
<213>人工序列
<400>15
accccgccgccgctgaccgcgccgatgccgtcgaactcccggcccagcccgtcggagtcg60
tcgagcacgtacgcgccgccgggcgccagcagcgcacaca100
<210>16
<211>100
<212>dna
<213>人工序列
<400>16
aactcccggcccagcccgtcggagtcgtcgagcacgtacgcgccgccgggcgccagcagc60
gcacacagcagcaagggcaccgcggcgcggcccgccgaac100
<210>17
<211>100
<212>dna
<213>人工序列
<400>17
acagtgatcttgcggactggaccgaggcgaattccccttcccagcctcgcgtcccgagtt60
tgactggcaggacccgctggtgctggaggagcagctgacc100
<210>18
<211>100
<212>dna
<213>人工序列
<400>18
ccccttcccagcctcgcgtcccgagtttgactggcaggacccgctggtgctggaggagca60
gctgaccacagatgagatcctcatcagggacaccttccgc100
<210>19
<211>100
<212>dna
<213>人工序列
<400>19
gcaggacccgctggtgctggaggagcagctgaccacagatgagatcctcatcagggacac60
cttccgcacctactgccaggagagactcatgcctcgcatc100
<210>20
<211>100
<212>dna
<213>人工序列
<400>20
cctactaccaccaggatatggctgtgctggggtttcgtctgtggcctatgggctcctggc60
ccgagagctggagcgggtggacagtggctacaggtcggcg100
<210>21
<211>100
<212>dna
<213>人工序列
<400>21
ttcgtctgtggcctatgggctcctggcccgagagctggagcgggtggacagtggctacag60
gtcggcgatgagtgtccagtcctccctcgtcatgcaccct100
<210>22
<211>100
<212>dna
<213>人工序列
<400>22
gctggagcgggtggacagtggctacaggtcggcgatgagtgtccagtcctccctcgtcat60
gcaccctatctatgcctatggcagcgaggaacagcggcag100
<210>23
<211>100
<212>dna
<213>人工序列
<400>23
ccaggcagccttgtgactttgtcttgtgcctgcagccaagggggagctcctgggctgctt60
cgggctcacagagcccaacagcggaagtgaccccagcagc100
<210>24
<211>100
<212>dna
<213>人工序列
<400>24
agccaagggggagctcctgggctgcttcgggctcacagagcccaacagcggaagtgaccc60
cagcagcatggagaccagagcccactacaactcatccaac100
<210>25
<211>100
<212>dna
<213>人工序列
<400>25
ctcttggtgtctcttgggtgggcctgaggcgccatctcaaccctacagggtcccttcggc60
tgcctgaacaacgcccggtacggcatcgcgtggggcgtgc100
<210>26
<211>100
<212>dna
<213>人工序列
<400>26
atctcaaccctacagggtcccttcggctgcctgaacaacgcccggtacggcatcgcgtgg60
ggcgtgcttggagcttcggagttctgcttgcacacagccc100
<210>27
<211>100
<212>dna
<213>人工序列
<400>27
aacaacgcccggtacggcatcgcgtggggcgtgcttggagcttcggagttctgcttgcac60
acagcccggcagtacgccctcgacaggtgtgtgagggctg100
<210>28
<211>100
<212>dna
<213>人工序列
<400>28
tacattgactcagtcggattcaatggacggtcacagtgctattactttgaaaaccctgct60
gattctgaaaagtgtcagaagttaccatttgatttgaaaa100
<210>29
<211>100
<212>dna
<213>人工序列
<400>29
cagtgctattactttgaaaaccctgctgattctgaaaagtgtcagaagttaccatttgat60
ttgaaaaatccgtatcctctgcttctggtgaacattggct100
<210>30
<211>100
<212>dna
<213>人工序列
<400>30
gaaaagtgtcagaagttaccatttgatttgaaaaatccgtatcctctgcttctggtgaac60
attggctcaggggttagcatcttagcagtatattccaaag100
<210>31
<211>100
<212>dna
<213>人工序列
<400>31
cacagctttggaaacatgatgagcaaggagaagcgagaggctgtcagtaaagaggacctg60
gccagagcgactttgatcaccatcaccaacaacattggct100
<210>32
<211>100
<212>dna
<213>人工序列
<400>32
cgagaggctgtcagtaaagaggacctggccagagcgactttgatcaccatcaccaacaac60
attggctcaatagcaagaatgtgtgcccttaatgaagtaa100
<210>33
<211>100
<212>dna
<213>人工序列
<400>33
gcgactttgatcaccatcaccaacaacattggctcaatagcaagaatgtgtgcccttaat60
gaagtaaggggacatggatttctttaattgctctaaggaa100
<210>34
<211>100
<212>dna
<213>人工序列
<400>34
tgaatggacgaggtcagctggggccggtgagaggctggggaccctcagggtgagagcagc60
agctggatgagcttctggaactcctcgcggtgctcataga100
<210>35
<211>100
<212>dna
<213>人工序列
<400>35
gctggggaccctcagggtgagagcagcagctggatgagcttctggaactcctcgcggtgc60
tcatagatgtagacctcggtctcccagagggcgttgacca100
<210>36
<211>100
<212>dna
<213>人工序列
<400>36
atgagcttctggaactcctcgcggtgctcatagatgtagacctcggtctcccagagggcg60
ttgaccagcactgtgtcactgacctcatccagcatgatgt100
<210>37
<211>100
<212>dna
<213>人工序列
<400>37
gctgagccctcacctgaagtactggatgccgaccatctcgcaccaggcccgtgcccggtc60
cacagcccgcccgtctggatccgtgcactggtgagaagca100
<210>38
<211>100
<212>dna
<213>人工序列
<400>38
gccctcacctgaagtactggatgccgaccatctcgcaccaggcccgtgcccggtccacag60
cccgcccgtctggatccgtgcactggtgagaagcagcctt100
<210>39
<211>100
<212>dna
<213>人工序列
<400>39
gggcggctgagccctcacctgaagtactggatgccgaccatctcgcaccaggcccgtgcc60
cggtccacagcccgcccgtctggatccgtgcactggtgag100
<210>40
<211>100
<212>dna
<213>人工序列
<400>40
gttggccagcagcccaccgtccaggaagcgcccattgggtcggaagtaagtaggagctgc60
cccgctgcttcgggccgcccgccacaccagctggtctagg100
<210>41
<211>100
<212>dna
<213>人工序列
<400>41
attgggtcggaagtaagtaggagctgccccgctgcttcgggccgcccgccacaccagctg60
gtctaggggcggggaaggagggcggcccagtggcacaagg100
<210>42
<211>100
<212>dna
<213>人工序列
<400>42
gcttcgggccgcccgccacaccagctggtctaggggcggggaaggagggcggcccagtgg60
cacaagggactggcataaaacccatgcactccagatctca100
<210>43
<211>100
<212>dna
<213>人工序列
<400>43
gcctgaggttaacgttctggttgaaacgaggctcccggacagtttctggagcatcgtagt60
tccggaagaggtggagttcagccggctgccggtcagacag100
<210>44
<211>100
<212>dna
<213>人工序列
<400>44
cccggacagtttctggagcatcgtagttccggaagaggtggagttcagccggctgccggt60
cagacagtgtccctgtcagcatcaccctggagagaaatga100
<210>45
<211>100
<212>dna
<213>人工序列
<400>45
agaggtggagttcagccggctgccggtcagacagtgtccctgtcagcatcaccctggaga60
gaaatgaggcaggaggacggctgagccacccgcccatcca100
<210>46
<211>100
<212>dna
<213>人工序列
<400>46
atccacttacgtccgcttctcgtccctcatggagcccaggatgaacgctggcttccgggc60
ccgtgagatgtgcatgagatcctgtagttctgtgaggcac100
<210>47
<211>100
<212>dna
<213>人工序列
<400>47
tctcgatccacttacgtccgcttctcgtccctcatggagcccaggatgaacgctggcttc60
cgggcccgtgagatgtgcatgagatcctgtagttctgtga100
<210>48
<211>100
<212>dna
<213>人工序列
<400>48
cttacgtccgcttctcgtccctcatggagcccaggatgaacgctggcttccgggcccgtg60
agatgtgcatgagatcctgtagttctgtgaggcacagagc100
<210>49
<211>100
<212>dna
<213>人工序列
<400>49
cagagcacatacgtctgccgattttggaggctaggaatgtaggagtctccccaaagtcat60
tcggggtgtccacttctgctccgaacacgatgagggcctt100
<210>50
<211>100
<212>dna
<213>人工序列
<400>50
ggaatgtaggagtctccccaaagtcattcggggtgtccacttctgctccgaacacgatga60
gggccttgatcatctccacgttgtctttctgttggagatg100
<210>51
<211>100
<212>dna
<213>人工序列
<400>51
tgtccacttctgctccgaacacgatgagggccttgatcatctccacgttgtctttctgtt60
ggagatggagagaggataagacgtgcaactgccggggaag100
<210>52
<211>100
<212>dna
<213>人工序列
<400>52
gggctcaccgacatggccaggtgcagcggggtgttgccgtgctctccgcgggcatccgcg60
ttggccccgtgggtcagcagcactatggcacagtcgaagc100
<210>53
<211>100
<212>dna
<213>人工序列
<400>53
ttgccgtgctctccgcgggcatccgcgttggccccgtgggtcagcagcactatggcacag60
tcgaagcggttgcgcatcaccgccacgtgcagggccgtgt100
<210>54
<211>100
<212>dna
<213>人工序列
<400>54
ccgtgggtcagcagcactatggcacagtcgaagcggttgcgcatcaccgccacgtgcagg60
gccgtgttccccgcggagctggtgctgttcacgttgcagc100
<210>55
<211>100
<212>dna
<213>人工序列
<400>55
caccgagcattgcacagcagcagcacgcggaccatctcctgcttccccagctggcaggcc60
aggtgcagcggggtcagcccttggttattcacctggttca100
<210>56
<211>100
<212>dna
<213>人工序列
<400>56
atctcctgcttccccagctggcaggccaggtgcagcggggtcagcccttggttattcacc60
tggttcaggccagccactgcgttccttccaaggagctgat100
<210>57
<211>100
<212>dna
<213>人工序列
<400>57
agcggggtcagcccttggttattcacctggttcaggccagccactgcgttccttccaagg60
agctgatgaaagaggaagggaagtttgactccataggatg100
<210>58
<211>100
<212>dna
<213>人工序列
<400>58
ccttgtactttccagtccgcacagcaaaaaccccacggacctcgtctgggtaggacgggt60
agaagaagagagactgccgagggctctgggggcagagtca100
<210>59
<211>100
<212>dna
<213>人工序列
<400>59
cacggacctcgtctgggtaggacgggtagaagaagagagactgccgagggctctgggggc60
agagtcaggggtcacggggcggggcaggccccaagcactg100
<210>60
<211>100
<212>dna
<213>人工序列
<400>60
cagctgctgcagtggctcctcatcgccctccctgctaccttcgtcaacagtgccatccgt60
tacctggagggccaactggccctgtcgttccgcagccgtc100
<210>61
<211>100
<212>dna
<213>人工序列
<400>61
gctaccttcgtcaacagtgccatccgttacctggagggccaactggccctgtcgttccgc60
agccgtctggtggcccacgcctaccgcctctacttctccc100
<210>62
<211>100
<212>dna
<213>人工序列
<400>62
gagggccaactggccctgtcgttccgcagccgtctggtggcccacgcctaccgcctctac60
ttctcccagcagacctactaccgggtcagcaacatggacg100
<210>63
<211>100
<212>dna
<213>人工序列
<400>63
ctggtggcccacgcctaccgcctctacttctcccagcagacctactaccgggtcagcaac60
atggacgggcggcttcgcaaccctgaccagtctctgacgg100
<210>64
<211>100
<212>dna
<213>人工序列
<400>64
ccctcggccatcgccggcctcgtggtgttcctcacggccaacgtgctgcgggccttctcg60
cccaagttcggggagctggtggcagaggaggcgcggcgga100
<210>65
<211>100
<212>dna
<213>人工序列
<400>65
acggccaacgtgctgcgggccttctcgcccaagttcggggagctggtggcagaggaggcg60
cggcggaagggggagctgcgctacatgcactcgcgtgtgg100
<210>66
<211>100
<212>dna
<213>人工序列
<400>66
ttcggggagctggtggcagaggaggcgcggcggaagggggagctgcgctacatgcactcg60
cgtgtggtggccaactcggaggagatcgccttctatgggg100
<210>67
<211>100
<212>dna
<213>人工序列
<400>67
aagggggagctgcgctacatgcactcgcgtgtggtggccaactcggaggagatcgccttc60
tatgggggccatgaggtggggcaggttggggtgccgggca100
<210>68
<211>100
<212>dna
<213>人工序列
<400>68
cccagggagctagaggacgctcaggcggggtctgggaccataggccggtctggtgtccgt60
gtggagggccccctgaagatccgaggtaaggctgtcccct100
<210>69
<211>100
<212>dna
<213>人工序列
<400>69
cgcctaggttgggaggctatgtgtgactggaaggacgtcctgtcgggtggcgagaagcag60
agaatcggcatggcccgcatgttctaccacaggtgagcac100
<210>70
<211>100
<212>dna
<213>人工序列
<400>70
aggttgggaggctatgtgtgactggaaggacgtcctgtcgggtggcgagaagcagagaat60
cggcatggcccgcatgttctaccacaggtgagcactccgg100
<210>71
<211>100
<212>dna
<213>人工序列
<400>71
gcccccgcctaggttgggaggctatgtgtgactggaaggacgtcctgtcgggtggcgaga60
agcagagaatcggcatggcccgcatgttctaccacaggtg100
<210>72
<211>100
<212>dna
<213>人工序列
<400>72
ccagcgccgtgagcatcgacgtggaaggcaagatcttccaggcggccaaggacgcgggca60
ttgccctgctctccatcacccaccggccctccctgtggta100
<210>73
<211>100
<212>dna
<213>人工序列
<400>73
tcttccaggcggccaaggacgcgggcattgccctgctctccatcacccaccggccctccc60
tgtggtaggtgccctgtctccctgcctggggtcggtggga100
<210>74
<211>100
<212>dna
<213>人工序列
<400>74
tgctctccatcacccaccggccctccctgtggtaggtgccctgtctccctgcctggggtc60
ggtgggagtggctgcctgaggggaggaggtggcctggcgg100