技術(shù)領(lǐng)域
本發(fā)明涉及基因檢測領(lǐng)域,具體而言,本發(fā)明涉及一種檢測MET基因14外顯子突變的探針及檢測方法。該方法可以精準地富集MET基因14外顯子突變序列,所得DNA樣本庫可進一步結(jié)合下一代測序技術(shù)(NGS),精準地判斷病人的MET基因14外顯子突變情況,并為相關(guān)腫瘤的診斷,預(yù)后,及臨床治療方案的設(shè)計提供指導及理論基礎(chǔ)。
背景技術(shù):
原發(fā)性肺癌(以下簡稱肺癌),發(fā)生于支氣管粘膜上皮,故亦稱支氣管肺癌,是最常見的肺部原發(fā)性惡性腫瘤,也是我國最常見的惡性腫瘤之一,嚴重危害民眾的生命與健康。
在我國,肺癌發(fā)病率和死亡率在男性常見惡性腫瘤中均占首位;在女性常見惡性腫瘤中分別占第一、二,僅次于乳腺癌的死亡人數(shù)。根據(jù)全國腫瘤登記中心2014年發(fā)布的數(shù)據(jù)顯示,2010年,我國新發(fā)肺癌病例60.59萬(男性41.63萬,女性18.96萬),占惡性腫瘤新發(fā)病例的19.59%(男性23.03%,女性14.75%)。肺癌發(fā)病率為35.23/10萬(男性49.27/10萬,女性21.66/10萬)。同期,我國肺癌死亡人數(shù)為48.66萬(男性32.58萬,女性16.08萬),占惡性腫瘤死因的24.87%(男性26.85%,女性21.32%)。肺癌死亡率為27.93/10萬(男性39.79/10萬,女性16.62/10萬)。從分布來看,上海、北京、東北和沿海地區(qū)的幾個較大城市的死亡率最高。
目前肺癌的治療方式主要是手術(shù)、化療、放療,其中化療是中晚期肺癌的主要治療方式,但是其毒副作用較大,且個體間治療療效差異較大。隨著腫瘤生物學的發(fā)展,及腫瘤發(fā)生機制的進一步探索,分子靶向治療因其治療有效率高、毒副作用小的特點,逐漸成為晚期肺癌的常規(guī)臨床治療方案。MET蛋白由原癌基因c-MET編碼,是肝細胞生長因子HGF的受體。MET與多種細胞行為相關(guān),參與細胞的信號傳導、細胞骨架重排,促進細胞的增殖與分化。通過基因擴增或者過表達的方式激活MET的激酶活性可以促使細胞的癌變(8-10)。MET擴增在未經(jīng)治療的非小細胞肺癌(NSCLC)患者中并不常見,發(fā)生頻率約為2-4%(8,9,11)。
從2014年首次發(fā)現(xiàn)MET基因14外顯子跳讀突變到現(xiàn)在,已經(jīng)有多個研究針對不同的腫瘤類型對該突變類型進行研究。MET基因14外顯子跳讀突變在肺腺癌中的發(fā)生頻率約為4%,而在肺肉瘤樣癌中的頻率高達22%。該突變的機理是,MET基因14外顯子是MET蛋白泛素化降解過程中的結(jié)合位點,其丟失會導致MET蛋白無法被泛素化降解,從而引起MET蛋白的持續(xù)表達。
在非小細胞肺癌中,攜帶MET基因14外顯子跳讀突變的患者對MET抑制劑(克唑替尼、卡博替尼)在臨床試驗中有較好的應(yīng)答。并且該突變與EGFR、ALK、KRAS、BRAF等突變不共存,意味著該靶點在肺腺癌中有較高的特異性。所以在NCCN指南中,建議MET基因14外顯子跳讀的患者選擇克唑替尼進行治療。MET基因14外顯子跳讀也成為肺腺癌中重要的一類分子分型。
MET基因14外顯子跳讀突變檢測目前只有實時熒光定量PCR的試劑盒,其特點是檢測方法簡單,易于操作,但是需要提取RNA,對樣本要求較高,實驗結(jié)果判讀較復(fù)雜,并且一次只能檢測MET基因14外顯子跳讀突變,無法同時檢測其它突變類型,所以實際上應(yīng)用范圍有限。
現(xiàn)有的主流基因突變檢測方法主要集中于以下3個技術(shù):
1)PCR突變檢測
基于PCR片段擴增和凝膠電泳分離的方法,從而分辨出野生型和突變性的差異。其缺點包括:其為單堿基突變類型檢測,不能對mRNA進行定量,不能檢測基因顛換;敏感性低;耗時長,單次只能檢測一個基因突變;不能確定堿基的具體變化;無法進行高通量檢測。
2)Q-PCR(定量PCR)檢測
基于熒光和PCR片段擴增來對模板mRNA多少來進行定量。其缺點包括:不能檢測單堿基類型突變;不能檢測基因顛換;只能檢測已知突變;耗時長,單次只能檢測一個基因突變;不能確定堿基的具體變化。
3)基因芯片技術(shù)
用高精度技術(shù)將DNA片段打印在芯片上,然后通過DNA雜交結(jié)合特性來確定突變性質(zhì)。其缺點包括:不能檢測基因顛換;只能檢測已知突變;成本高,通量較小;準確率低,通常需要重復(fù)2次以上才能確定結(jié)果。
技術(shù)實現(xiàn)要素:
針對上述技術(shù)問題,本發(fā)明人通過大量實驗,開發(fā)了用于檢測MET基因14外顯子突變的方法,該方法利用探針液相捕獲、二代測序技術(shù),不僅可以實現(xiàn)幾千倍地富集的MET基因14外顯子及其附近內(nèi)含子的DNA片段,而且實現(xiàn)了較高的檢測特異性和敏感性。
本發(fā)明的第一個方面:
一種檢測MET基因14外顯子突變的探針庫,其中包括有核苷酸序列如SEQ ID NO. 1~46所示的任意一條探針,或者與其具有相同功能的探針。
優(yōu)選的:探針庫中包括上述的全部探針。
優(yōu)選的:所述的具有相同功能的探針,是指將SEQ ID NO. 1~46任意一條探針經(jīng)過一個或幾個核苷酸的取代和/或缺失和/或添加且具有相同雜交捕獲功能的探針。
優(yōu)選的:所述的具有相同功能的探針與原探針具有80%以上相同的堿基,更優(yōu)選是90%以上相同堿基,再優(yōu)選是95%以上相同堿基。
本發(fā)明的第二個方面:
本發(fā)明提供一種富集MET基因14外顯子及其附近內(nèi)含子片段的方法,所述方法包括以下步驟:
1)獲得受試者的DNA樣本庫;
2)獲得所述的檢測MET基因14外顯子突變的探針;
3)使所述DNA探針庫與所述DNA樣本庫進行雜交;和
4)分離步驟3)的雜交產(chǎn)物,然后釋放經(jīng)雜交富集的MET基因14外顯子及其附近內(nèi)含子DNA片段。
其中,所述步驟1)中的DNA樣本庫由雙鏈DNA片段組成,并且,所述步驟1)包括:
1-1)提取全基因組DNA,然后將其片段化;或者
1-2)提取mRNA,將其片段化,然后以該經(jīng)片段化的mRNA為模板合成雙鏈cDNA;
其中,所述受試者為哺乳動物,優(yōu)選人,且從受試者的細胞、組織或體液樣本中提取全基因組DNA或mRNA;
優(yōu)選地,所述DNA片段的長度為150~600bp;
進一步優(yōu)選地,所述DNA片段的長度為150~200bp。
所述步驟2)中的DNA探針庫為如上所述的DNA探針庫。具體而言,所述DNA探針庫包括一個或多個能夠與MET基因14外顯子雜交的DNA探針,所述DNA探針如以下序列所示:SEQ ID NO. 1~46。
此外,所述步驟3)包括:
3-1)采用選擇性標記標記DNA探針庫中的DNA探針;和
3-2)使所述DNA探針庫與DNA樣本庫進行雜交;
優(yōu)選地,所述步驟3-1)中的選擇性標記為生物素;進一步優(yōu)選地,所述步驟3-2)包括在PCR擴增儀中,在65℃下將所述DNA探針庫與DNA樣本庫孵育24小時。
因此,所述方法的步驟4)中,優(yōu)選利用DNA探針上的選擇性標記分離雜交產(chǎn)物。進一步優(yōu)選地,所述步驟3-1)中的選擇性標記為生物素,所述步驟4)中利用鏈霉親和素-生物素的親和作用分離雜交產(chǎn)物。
本發(fā)明的第三個方面:
本發(fā)明還提供一種檢測MET基因14外顯子突變的方法,所述方法包括以下步驟:
1)根據(jù)上述方法富集MET基因14外顯子及其附近內(nèi)含子的DNA片段;和
2)檢測所述MET基因14外顯子的突變。
優(yōu)選地,所述步驟2)中采用下一代測序技術(shù),通過對富集到的MET基因14外顯子片段進行測序而檢測所述MET基因14外顯子片段的突變。
本發(fā)明的第四個方面:
本發(fā)明提供一種用于檢測MET基因14外顯子突變的試劑盒,所述試劑盒包含上述的DNA探針庫。
本發(fā)明的第五個方面:
上述的試劑盒在用于非治療與診斷目的的MET基因14外顯子突變測序中的應(yīng)用。
有益效果
本發(fā)明開發(fā)了基于雜交選擇而捕獲特定MET基因14外顯子及其附近內(nèi)含子序列的方法,采用該方法可以獲得成幾千倍富集的MET基因14外顯子及其附近內(nèi)含子DNA片段,該經(jīng)富集的MET基因14外顯子及其附近內(nèi)含子片段樣本可以選擇性地應(yīng)用于各種基因檢測技術(shù),特別是可以應(yīng)用下一代測序技術(shù)進行基因突變、缺失、增加、和顛換等方面的檢測,以取得高效且準確的結(jié)果,對相關(guān)癥狀的后續(xù)治療提供有意義的理論及臨床指導。
并且,對于將通過本發(fā)明的方法富集得到的MET基因14外顯子及其附近內(nèi)含子片段用于基于下一代測序技術(shù)的基因結(jié)構(gòu)突變檢測的應(yīng)用而言,還具有以下有益效果:
使用本發(fā)明的基因富集方法及篩選得到的特定DNA探針庫,能夠成數(shù)千倍地富集MET基因14外顯子及其附近內(nèi)含子片段,從而可以應(yīng)用下一代測序技術(shù)、利用該MET基因14外顯子及其附近內(nèi)含子片段的測序,而準確地獲得MET基因14外顯子的各種突變。并且,由于采用下一代測序技術(shù),因此能夠一次性檢測多個基因的多種類型基因突變;準確性高,傳統(tǒng)技術(shù)例如基因芯片技術(shù),通常需要重復(fù)兩次以上才能確定檢測結(jié)果,而本發(fā)明在一次反應(yīng)中,對單個堿基進行反復(fù)測序,保證了數(shù)據(jù)的精準度,并且縮短了檢測周期;敏感性高,本發(fā)明提供的方法和試劑盒能夠有效地使對于低突變豐度樣本的檢測靈敏性得到提高,和傳統(tǒng)檢測技術(shù)相比,本發(fā)明產(chǎn)生的數(shù)據(jù)能夠達到堿基級的分辨率。
附圖說明
圖1為本發(fā)明技術(shù)方案的示例性工藝流程圖,其中富集得到目標基因群,并用于基于下一代測序技術(shù)的基因結(jié)構(gòu)突變檢測。
圖2為本發(fā)明的探針設(shè)計策略的示意圖。
圖3為本發(fā)明的探針覆蓋范圍示意圖。
圖4是上機測序結(jié)果示意圖。
具體實施方式
下面通過具體實施方式對本發(fā)明作進一步詳細說明。但本領(lǐng)域技術(shù)人員將會理解,下列實施例僅用于說明本發(fā)明,而不應(yīng)視為限定本發(fā)明的范圍。實施例中未注明具體技術(shù)或條件者,按照本領(lǐng)域內(nèi)的文獻所描述的技術(shù)或條件或者按照產(chǎn)品說明書進行。所用試劑或儀器未注明生產(chǎn)廠商者,均為可以通過市購獲得的常規(guī)產(chǎn)品。
在本文中所使用的術(shù)語”DNA”為脫氧核糖核酸(英文:Deoxyribonucleicacid,縮寫為DNA)是一種由脫氧核糖核苷酸組成的雙鏈分子??山M成遺傳指令,引導生物發(fā)育與生命機能運行,其堿基排列順序構(gòu)成了遺傳信息,所以在遺傳病的診斷中具有重要的作用。
在本文中所使用的術(shù)語“高通量測序技術(shù)”指的是第二代高通量測序技術(shù)及之后發(fā)展的更高通量的測序方法。第二代高通量測序平臺包括但不限于Illumina-Solexa(Miseq、Hiseq-2000、Hiseq-2500、Hiseq X ten等)、ABI-Solid和Roche-454測序平臺等。隨著測序技術(shù)的不斷發(fā)展,本領(lǐng)域技術(shù)人員能夠理解的是還可以采用
其他方法的測序方法和裝置進行本檢測。根據(jù)本發(fā)明的具體示例,可以將根據(jù)本發(fā)明實施例的核酸標簽用于Illumina-Solexa、ABI-Solid和Roche-454測序平臺等的至少一種進行測序。高通量測序技術(shù),例如Miseq測序技術(shù)具有以下優(yōu)勢:(1)高靈敏度:高通量測序,例如Miseq的測序通量大,目前一個實驗流程下來可以產(chǎn)生最多15G堿基數(shù)據(jù),高的數(shù)據(jù)通量可以再測序序列數(shù)確定的情況下,使得每條序列獲得高的測序深度,所以可以檢測到含量更低的突變,同時因其測序深度高,其測序結(jié)果也更為可靠。(2)高通量,低成本:利用根據(jù)本發(fā)明實施例的標簽序列,通過一次測序可以檢測上萬份樣本,從而大大降低了成本。
本發(fā)明中的“突變”、“核酸變異”、“基因變異”可通用,本發(fā)明中的“SNP”(SNV)、“CNV”、“插入缺失”(indel)和“結(jié)構(gòu)變異”(SV)同通常定義,但本發(fā)明中對各種變異的大小不作特別限定,這樣這幾種變異之間有的有交叉,比如當插入/缺失的為大片段甚至整條染色體時,也屬于發(fā)生拷貝數(shù)變異(CNV)或是染色體非整倍性,也屬于SV。這些類型變異的大小交叉并不妨礙本領(lǐng)域人員通過上述描述執(zhí)行實現(xiàn)本發(fā)明的方法和/或裝置并且達到所描述的結(jié)果。
本發(fā)明提供一種富集MET基因14外顯子及其附近內(nèi)含子DNA片段的方法。具體而言,本發(fā)明的方法包括:從哺乳動物例如人的細胞、體液或組織樣本中提取基因組DNA或mRNA,經(jīng)處理或合成cDNA,從而獲得片段化的雙鏈DNA作為DNA樣本庫;此外,針對要富集的MET基因14外顯子片段,設(shè)計與該MET基因14外顯子及部分內(nèi)含子雜交的DNA探針,從中篩選出多個探針作為DNA探針庫;然后,將該DNA樣本庫與DNA探針庫進行雜交,從而從DNA樣本庫中富集得到MET基因14外顯子及附近內(nèi)含子DNA片段。根據(jù)本發(fā)明的具體實施方式,可以先將DNA探針庫中的各個探針進行生物素化,然后在雜交后用鏈霉親和素磁珠吸附雜交產(chǎn)物,再從磁珠上釋放出富集的MET14外顯子基因片段。經(jīng)適應(yīng)性處理,可以采用下一代測序基因?qū)ET基因14外顯子片段進行基因結(jié)構(gòu)突變的檢測,以確認MET14外顯子基因的各類突變。
下面以富集得到的MET14外顯子基因片段用于基于下一代測序技術(shù)的基因突變檢測為例,示例性地說明本發(fā)明。
一、準備mRNA/DNA樣本庫
1. 準備基因組DNA樣本(采用此種方式獲得的DNA樣本庫稱為“源自全基因組的DNA樣本庫”)
1.1 DNA提取
DNA提取,包括新鮮組織,新鮮血液和細胞,固定和石蠟樣本,商業(yè)化公司提取試劑盒。以上均按說明書指示方法操作。
使用分光光度定量儀以及凝膠電泳系統(tǒng)檢測DNA模板質(zhì)量和濃度。DNA模板260nm吸光率大于0.05以上,吸光率A260/A280比值在1.8到2之間為合格。
1.2 DNA片段化
將3微克高質(zhì)量的基因組DNA用低TE緩沖液稀釋至120微升。按照組織勻漿機使用說明書,將DNA片段化,片段長度為150~200堿基。
DNA過柱純化,商業(yè)化公司純化試劑盒。
1.3 DNA樣本庫質(zhì)量檢測
用生物分析儀進行DNA定性定量分析,確認DNA片段長度峰值合理。
2. 準備cDNA樣本(采用此種方式獲得的DNA樣本庫稱為“源自mRNA的DNA樣本庫”即cDNA樣本庫)
2.1 mRNA提取
mRNA提取,包括新鮮組織,新鮮血液和細胞,固定和石蠟樣本,商業(yè)化公司提取試劑盒。以上均按說明書指示方法操作。
使用分光光度定量儀以及凝膠電泳系統(tǒng)檢測mRNA質(zhì)量和濃度,吸光率A260/A280比值在1.8到2之間為合格。
2.2 mRNA片段化
采用NEBNext RNA Fragmentation系統(tǒng)或者其他商業(yè)化公司mRNA片段化試劑盒。
mRNA過柱純化,商業(yè)化公司純化試劑盒。
2.3 用商業(yè)化公司cDNA合成試劑盒進行mRNA合成第一鏈以及第二鏈cDNA。
cDNA過柱純化,商業(yè)化公司純化試劑盒。
3. cDNA/DNA末端修補
將DNA片段進行末端修復(fù)可以利用Klenow片段、T4DNA聚合酶和T4多核苷酸激酶進行,其中,所述Klenow片段具有5’-3’’聚合酶活性和3’-5’聚合酶活性,但缺少5’-3’外切酶活性。由此,能夠方便準確地對DNA片段進行末端修復(fù)。根據(jù)本發(fā)明的實施例,還可以進一步包括對經(jīng)過末端修復(fù)的DNA片段進行純化的步驟,由此能夠方便地進行后續(xù)處理。
利用T4聚合酶及Klenow大腸桿菌聚合酶片斷,對于cDNA/DNA 5'突出粘末端補平以及3'突出粘末端打平,產(chǎn)生平末端,用于后續(xù)的平端連接。反應(yīng)在PCR擴增儀中進行,20攝氏度,30分鐘。
cDNA/DNA過柱純化,商業(yè)化公司純化試劑盒。
4. 在cDNA/DNA樣本3'末端加上堿基A
在經(jīng)過末端修復(fù)的DNA片段的3’末端添加堿基A,以便獲得具有粘性末端A的DNA片段。根據(jù)本發(fā)明的一個實施例,可以利用Klenow(3’-5’exo-),即具有3’-5’外切酶活性的Klenow,在經(jīng)過末端修復(fù)的DNA片段的3’末端添加堿基A。由此,能夠方便準確地將堿基A添加到經(jīng)過末端修復(fù)的DNA片段的3’末端。根據(jù)本發(fā)明的實施例,還可以進一步包括對具有粘性末端A的DNA片段進行純化的步驟,由此能夠方便地進行后續(xù)處理。
反應(yīng)在PCR擴增儀中進行,37℃,30分鐘。
cDNA/DNA過柱純化,商業(yè)化公司純化試劑盒。
5. 在cDNA/DNA兩端加上接頭
cDNA/DNA過柱純化,商業(yè)化公司純化試劑盒。
如使用mRNA→cDNA,進行6和7;
如果是用基因組DNA,直接跳到8。
6. 分離出合適長度的cDNA片段
使用電泳凝膠,對照DNA梯度標準,在凝膠上剪切出150-250堿基cDNA片段。
將含有cDNA樣本庫的凝膠樣本過柱純化,商業(yè)化公司純化試劑盒。
7. cDNA片段樣本庫質(zhì)量檢測
使用生物分析儀,進行cDNA定性定量分析,并確認分離出的cDNA片斷長度峰值合理。
PCR條件:置于PCR擴增儀中,98℃預(yù)變性30秒,98℃變性30秒,65℃退火30秒,72℃延伸30秒,共循環(huán)15次(cDNA樣本庫)或者4-6次(DNA樣本庫)。最后在72℃延伸5分鐘。
PCR擴增產(chǎn)物過柱純化,商業(yè)化公司純化試劑盒。
8. 擴增DNA模板
在本發(fā)明的一個實施例中,樣本為含微量游離DNA片段的血漿樣本,包含極其微量的目標游離DNA片段,第一擴增使得核酸的量能滿足芯片/探針雜交捕獲的需求
聚合酶鏈反應(yīng)(PCR),在PCR擴增儀中進行。
PCR條件:置于PCR擴增儀中,98℃預(yù)變性30秒,98℃變性30秒,65℃退火30秒,72℃延伸30秒,共循環(huán)15次(cDNA樣本庫)或者4-6次(DNA樣本庫)。最后在72℃延伸5分鐘。
PCR擴增產(chǎn)物過柱純化,商業(yè)化公司純化試劑盒。
9. 擴增后cDNA/DNA樣本庫質(zhì)量檢測
使用生物分析儀,進行cDNA/DNA定性定量分析,并確認純化后片段長度峰值合理,約200bp。
對于得到的cDNA/DNA樣本庫,如果cDNA小于30納克/微升,DNA濃度小于150納克/微升,須將樣品經(jīng)過真空濃縮機低溫干燥(低于45℃),再用無核酸酶水溶解至所需濃度。
二、探針的設(shè)計
針對MET14外顯子基因準備DNA探針庫。
本領(lǐng)域技術(shù)人員知曉:捕獲的特異性受各種因素影響,如捕獲探針的設(shè)計不佳,捕獲條件不理想,基因組DNA中重復(fù)序列的封閉不充分及基因組DNA與捕獲探針的比例不合適等因素都會影響捕獲的特異性、敏感性、測序覆蓋率等諸多結(jié)果。為了實現(xiàn)目標基因的高度富集和低脫靶率,本領(lǐng)域技術(shù)人員需要對探針的類型、長度、序列、雜交條件等進行大量實驗摸索,需要通過創(chuàng)造性的探索工作才能夠獲得最佳的參數(shù)組合,沒有在相應(yīng)的證據(jù)證明下,其是否能夠達到相同的效果,是本領(lǐng)域技術(shù)人員無法預(yù)期的。同時,對于產(chǎn)生突變的樣本進行檢測時,由于突變樣本在組織樣本中所占的比例會因個體而不同,因此,如果突變樣本的豐度較低時,較容易導致的問題是探針往往無法準確地與突變的片斷雜交,而導致檢測的靈敏度低,這也需要對探針序列進行試驗進行摸索。
由于基因組中的高GC、重復(fù)序列等復(fù)雜結(jié)構(gòu)的存在,測序最終拼接組裝獲得的序列往往無法覆蓋有所的區(qū)域,這部分沒有獲得的區(qū)域就稱為Gap。例如一個細菌基因組測序,覆蓋率是95%,那么還有5%的序列區(qū)域是沒有通過測序獲得的。
構(gòu)建一個基于雜交原理的目標序列捕獲系統(tǒng),有較多的設(shè)計因素需要考慮,例如:探針的長度和探針的合成成本。一般來說一個8堿基的探針就有了足夠的雜交特異性,而探針越長,雜交的特異性就越差。目前商業(yè)試劑盒的探針長度都在60nt到200nt之間,這其中的一個重要考慮是,雜交的特異性限定(或者說雜交的錯配容忍度)。我們需要研究的是目標DNA片段中發(fā)生的突變、插入/缺失等,如果探針特異性太高,在DNA捕獲時就會產(chǎn)生有利于參考序列(與探針完全互補的序列)的選擇,這在后期數(shù)據(jù)統(tǒng)計上就會產(chǎn)生明顯的偏差,同時太短的探針結(jié)合目標DNA片段的結(jié)合力度不足以將目標DNA捕獲下來;而探針太長,探針合成的效率降低,并且合成成本大大增加。
在探針實際應(yīng)用的時候,探針覆蓋策略(Tiling Strategy),也是一個影響捕獲效率的重要因素。具體含義是,目標區(qū)域中每個堿基位點被多少個不同的探針覆蓋。例如,每個位點有2根不同探針覆蓋,則該位點是2倍探針覆蓋;每個位點有3根不同探針覆蓋,則該位點是3倍探針覆蓋。
探針設(shè)計策略見圖2和圖3。其中,側(cè)翼序列長度為內(nèi)含子序列,內(nèi)含子序列的重復(fù)性較高。探針重疊區(qū)域為每個探針之間的重疊堿基數(shù)目。重疊區(qū)域越大,目標區(qū)域覆蓋率越高;重疊區(qū)域越小,甚至探針間隔分布,測序成本則越低。探針長度越長,測序時對于單核苷酸多態(tài)性(SNP)的容忍度越高。
使用每個探針分別對全基因組進行了富集和擴增并根據(jù)結(jié)果進行篩選。通過IDT DNA Technologies,單獨合成了每一個探針并用質(zhì)譜分析保證質(zhì)量,在5’端有生物素(Biotin)。
三、DNA捕獲探針雜交
1. 將DNA樣本庫與生物素化的DNA探針庫雜交
將cDNA/DNA樣本庫與雜交緩沖液混合,反應(yīng)條件為95℃ 5分鐘,之后保持在65℃。反應(yīng)在PCR擴增儀中進行。
然后將該混合物與探針庫混合,反應(yīng)條件為65℃ 5分鐘。將雜交反應(yīng)置于PCR擴增儀中,65℃孵育24小時。
四、得到經(jīng)雜交富集的MET14外顯子基因片段
1. 準備鏈霉親和素(Streptavidin-Coated)磁珠
使用Dynabeads鏈霉親和素磁珠或者其它商業(yè)化公司鏈霉親和素磁珠。將磁珠置于混勻儀上混勻,每個樣本需要50微升磁珠。
磁珠洗滌:混合50微升磁珠和200微升結(jié)合緩沖液,在混勻儀上混勻,使用Dynal磁選機或者其它商業(yè)化公司磁選機,將磁珠與緩沖液分離純化,緩沖液棄掉不用。重復(fù)三次,每次加入200微升結(jié)合緩沖液。
2. 分離雜交產(chǎn)物
混合1中的雜交反應(yīng)混合物與2中的鏈霉親和素磁珠,反復(fù)顛倒試管5次。在室溫下振搖30分鐘。使用Dynal磁選機或者其它商業(yè)化公司磁選機,將磁珠分離純化。
然后向磁珠中加入500微升洗滌緩沖液,在65℃孵育10分鐘,每隔5分鐘混勻一次。使用Dynal磁選機或者其它商業(yè)化公司磁選機,將磁珠分離純化。
以上步驟重復(fù)三次。
3. cDNA/DNA富集樣本釋放
將磁珠與50微升洗脫緩沖液混合,室溫孵化10分鐘,每隔5分鐘混勻一次。使用Dynal磁選機或者其它商業(yè)化公司磁選機,將磁珠分離棄掉。此時上清液中即含有富集過的MET14外顯子基因片段cDNA/DNA樣本庫。
將樣本庫過柱純化,商業(yè)化公司純化試劑盒。
五、PCR擴增與純化
因雜交捕獲會損耗一定量的核酸,第二擴增能使捕獲下的目標片段獲得再次擴增以滿足上機測序和質(zhì)控檢測的要求。本發(fā)明的這一文庫構(gòu)建方法特別適用于總游離核酸不低于10ng或者常規(guī)組織基因組DNA不低于1μg的樣本的測序文庫構(gòu)建。
將富集cDNA/DNA樣本庫進一步擴增,為測序儀器上樣做準備。
PCR條件:置于PCR擴增儀中,98℃預(yù)變性30秒,98℃變性30秒,65℃退火30秒,72℃延伸30秒,共循環(huán)15次(cDNA樣本庫)或者4-6次(DNA樣本庫)。最后在72℃延伸5分鐘。
PCR擴增產(chǎn)物過柱純化,商業(yè)化公司純化試劑盒。
六、采用下一代測序技術(shù)檢測MET基因14外顯子的突變
使用下一代商業(yè)化的測序儀器進行測序,如Roche 454、Illumina Hiseq等。測序結(jié)果用已有的測序軟件分析包進行分析。
示例性地,使用TruSeq PE Cluster Kit v3-cBot-HS,使用橋式PCR對DNA樣本庫模板進行擴增:每個DNA樣本片段將會在芯片上形成克隆簇,每條泳道上產(chǎn)生數(shù)百萬這樣的克隆簇。使用Illumina HiSeq2000下一代測序系統(tǒng)。和傳統(tǒng)Sanger方法相比,利用“可逆性末端終結(jié)反應(yīng)”技術(shù),四種dNTP堿基末端被保護基團封閉,并分別以不同顏色熒光標記。
經(jīng)過QC篩選后,對測序結(jié)果使用了Bowtie對所得片段進行序列映射,利用Bioconductor軟件,成功映射片段進行突變分析。
實施例1 富集并檢測MET14外顯子基因
一、構(gòu)建樣本庫
1. 構(gòu)建陽性質(zhì)控質(zhì)粒及內(nèi)控質(zhì)粒
陽性質(zhì)控質(zhì)粒:構(gòu)建常見MET基因14外顯子跳讀突變D1028N(c.G3082A)的質(zhì)粒。
內(nèi)控質(zhì)粒:與上陽性質(zhì)粒相對應(yīng)的同序列的野生型質(zhì)粒。
將陽性質(zhì)控質(zhì)粒和內(nèi)控質(zhì)粒按照拷貝數(shù)比例混合,獲得突變頻率10%的質(zhì)粒樣本溶液,然后用Tris-HCl 緩沖液(2.5mM,pH8.5)調(diào)整DNA濃度,得到DNA濃度為5μg/μL的溶液。
2. DNA片段化
按照DNA破碎儀使用說明書,將DNA樣本片段化,使片段長度為150-200堿基。
使用Beckman Coulter Ampure Beads試劑盒(貨號:A63880)將DNA過柱純化。
3. DNA樣本庫質(zhì)量檢測
用生物分析儀進行DNA定性定量分析,確認DNA片段長度峰值合理。
4. DNA末端修補
利用T4聚合酶及Klenow大腸桿菌聚合酶片斷,對于cDNA/DNA 5'突出粘末端補平以及3'突出粘末端打平,產(chǎn)生平末端,用于后續(xù)的平端連接。反應(yīng)在PCR擴增儀中進行,20攝氏度,30分鐘。
使用Beckman Coulter Ampure Beads試劑盒(貨號:A63880)將cDNA/DNA過柱純化。
5. 在DNA樣本3'末端加上堿基A
反應(yīng)在PCR擴增儀中進行,37℃,30分鐘。
使用Beckman Coulter Ampure Beads試劑盒(貨號:A63880)將cDNA/DNA過柱純化。
6. 在DNA兩端加上接頭
使用Beckman Coulter Ampure Beads試劑盒(貨號:A63880)將cDNA/DNA過柱純化。
7. 擴增5獲得的DNA片段樣本庫
聚合酶鏈反應(yīng)(PCR),在PCR擴增儀中進行。
PCR條件:置于PCR擴增儀中,98℃預(yù)變性30秒,98℃變性30秒,65℃退火30秒,72℃延伸30秒,共循環(huán)15次(cDNA樣本庫)或者4~6次(DNA樣本庫)。最后在72℃延伸5分鐘。
使用Beckman Coulter Ampure Beads試劑盒(貨號:A63880)將PCR擴增產(chǎn)物過柱純化。
8. 擴增后DNA樣本庫的質(zhì)量檢測
使用生物分析儀,進行DNA定性定量分析,并確認純化后片段長度峰值合理,約200bp。
對于得到的DNA樣本庫,如果DNA濃度小于150納克/微升,須將樣品經(jīng)過真空濃縮機低溫干燥(低于45℃),再用無核酸酶水溶解至所需濃度。
二、針對MET14外顯子基因準備DNA探針庫
根據(jù)上述的探針設(shè)計方法和思路,設(shè)計并合成探針進行試驗,在5’端有生物素(Biotin)。
三、將DNA樣本庫與生物素化的DNA探針庫雜交
將DNA樣本庫與雜交緩沖液(10mM Tris-HCl, 2%牛血清白蛋白, pH8.0)混合(混合后,DNA樣本庫濃度至多不超過50ng/ul),反應(yīng)條件為95℃ 5分鐘,之后保持在65℃。反應(yīng)在PCR擴增儀中進行。
然后以DNA樣本庫:探針庫為1:100的摩爾比,將探針庫加入上述混合物,反應(yīng)條件為65℃ 5分鐘。將雜交反應(yīng)置于PCR擴增儀中,65℃孵育24小時。
四、得到經(jīng)雜交富集的MET14外顯子基因片段
1. 準備鏈霉親和素磁珠
使用Dynabeads(Life technologies, 貨號:11206D)鏈霉親和素磁珠或者其它商業(yè)化公司鏈霉親和素磁珠。將磁珠置于混勻儀上混勻。
磁珠洗滌:混合50微升磁珠和200微升結(jié)合緩沖液(10mM Tris-HCl, 2%牛血清白蛋白, pH8.0),在混勻儀上混勻,使用Dynal磁選機或者其它商業(yè)化公司磁選機,將磁珠與緩沖液分離純化,緩沖液棄掉不用。重復(fù)三次,每次加入200微升結(jié)合緩沖液。
2. 分離雜交產(chǎn)物
混合步驟三中得到的雜交反應(yīng)混合物與步驟四的1中得到的鏈霉親和素磁珠,反復(fù)顛倒試管5次。在室溫下振搖30分鐘。使用Dynal磁選機或者其它商業(yè)化公司磁選機,將磁珠分離純化。
然后向磁珠中加入500微升洗滌緩沖液(磷酸緩沖液,0.1% Tween-20, 0.1% SDS, pH7.4),在65℃孵育10分鐘,每隔5分鐘混勻一次。使用Dynal磁選機或者其它商業(yè)化公司磁選機,將磁珠分離純化。以上步驟重復(fù)三次。
3. DNA富集樣本釋放
將磁珠與50微升洗脫緩沖液(10mM氫氧化鈉溶液)混合,室溫孵化10分鐘,每隔5分鐘混勻一次。使用Dynal磁選機或者其它商業(yè)化公司磁選機,將磁珠分離棄掉。此時上清液中即含有富集過的MET14外顯子基因片段DNA樣本庫。
使用Beckman Coulter Ampure Beads試劑盒(貨號:A63880)將樣本庫過柱純化。
五、PCR擴增與純化
將富集cDNA/DNA樣本庫進一步擴增,為測序儀器上樣做準備。
PCR條件:置于PCR擴增儀中,98℃預(yù)變性30秒,98℃變性30秒,65℃退火30秒,72℃延伸30秒,共循環(huán)15次(cDNA樣本庫)或者4-6次(DNA樣本庫)。最后在72℃延伸5分鐘。
使用Beckman Coulter Ampure Beads試劑盒(貨號:A63880)將PCR擴增產(chǎn)物過柱純化。
六、采用下一代測序技術(shù)檢測MET14外顯子基因的基因結(jié)構(gòu)突變
使用TruSeq PE Cluster Kit v3-cBot-HS,使用橋式PCR對DNA樣本庫模板進行擴增:每個DNA樣本片段將會在芯片上形成克隆簇,每條泳道上產(chǎn)生數(shù)百萬這樣的克隆簇。使用Illumina HiSeq2000下一代測序系統(tǒng),其原理是邊合成邊測序。和傳統(tǒng)Sanger方法相比,利用“可逆性末端終結(jié)反應(yīng)”技術(shù),四種dNTP堿基末端被保護基團封閉,并分別以不同顏色熒光標記。
根據(jù)以上方法,采用不同探針進行測試結(jié)果如下:
探針長度對于檢測的特異性、中靶率具有較大的影響,因此,在2X覆蓋倍數(shù)的條件下設(shè)計了不同長度的探針,我們設(shè)計了3種探針長度,分別是100nt、120nt和140nt,通過中靶率和經(jīng)濟性來來確定什么長度下的探針最適合用于檢測。
三次重復(fù)檢測結(jié)果如下:
根據(jù)測序結(jié)果可以得到,140nt的探針中靶率最高,100nt探針的中靶率最低。其中120nt探針明顯優(yōu)于100nt探針,這兩者之間有顯著性差異;140nt探針優(yōu)于120nt探針,這兩者之間也有顯著性差異。從中靶率來看,140nt探針的效果最好。
最后將探針長度確定為140個堿基,保證目標序列的捕獲中靶率。通過對primer軟件的改進,對設(shè)計的探針進行分析,以準確的知道探針的退火溫度、GC成分連續(xù)重復(fù)單基數(shù)量(如CCCCCCC)。
在探針實際應(yīng)用的時候,探針覆蓋倍數(shù)也是一個影響捕獲效率的重要因素。由于基因組中的高GC、重復(fù)序列等復(fù)雜結(jié)構(gòu)的存在,測序最終拼接組裝獲得的序列往往無法覆蓋有所的區(qū)域,這部分沒有獲得的區(qū)域就稱為Gap。例如一個細菌基因組測序,覆蓋率是95%,那么還有5%的序列區(qū)域是沒有通過測序獲得的。
探針覆蓋倍數(shù)的含義是,目標區(qū)域中每個堿基位點被多少個不同的探針覆蓋。例如,每個位點有2根不同探針覆蓋,則該位點是2倍探針覆蓋;每個位點有3根不同探針覆蓋,則該位點是3倍探針覆蓋。對此我們設(shè)計了4組實驗,采用140nt長度探針,來確定最優(yōu)化的探針覆蓋倍數(shù)。實驗結(jié)果如下:
根據(jù)測序結(jié)果可以得到,1倍覆蓋倍數(shù)的探針中靶率最低,1.5倍覆蓋倍數(shù)的探針中靶率優(yōu)于1X,并且兩者差異有統(tǒng)計學意義;2倍覆蓋倍數(shù)的探針中靶率優(yōu)于1.5X,兩者有統(tǒng)計學差異;2.5倍覆蓋倍數(shù)的探針中靶率優(yōu)于2X,兩者沒有統(tǒng)計學差異。從中靶率來看,2.5倍覆蓋倍數(shù)的探針效果最好,但是2.5X的探針價格高于2X,同時2.5X探針與2X探針的差異并不大,所以綜合考慮選擇2X探針。
并且我們分析了每個探針目標區(qū)域DNA序列的測序深度,結(jié)果如下:
注:>0.2x平均覆蓋占比的意思是大于目標區(qū)域DNA序列平均覆蓋倍數(shù)20%的區(qū)域在總區(qū)域中的占比,同理0.5x和1x平均覆蓋占比的意思是大于目標區(qū)域平均覆蓋倍數(shù)50%/100%的區(qū)域在總區(qū)域中的占比。
根據(jù)測序結(jié)果可以得到,隨著探針覆蓋倍數(shù)的增加,目標區(qū)域的平均覆蓋倍數(shù)逐漸增加,并且均一性更好。但是外顯子的探針捕獲效率與內(nèi)含子的探針捕獲效率不一樣,外顯子在2X探針覆蓋的情況下可以得到較好的目標區(qū)域覆蓋,而內(nèi)含子在2.5X探針覆蓋的情況下才能得到與2X探針外顯子類型的目標區(qū)域覆蓋。綜合中靶率、經(jīng)濟性,最后選擇2X的探針作為外顯子區(qū)域的覆蓋倍數(shù),選擇2.5X探針作為內(nèi)含子預(yù)期的覆蓋倍數(shù)。
另外,對于低豐度樣本的檢測靈敏性也是需要經(jīng)過試驗考察。針對跳讀突變D1028N設(shè)計了多組探針,并與其它探針共同進行了樣本檢測,探針如下:
第1組:1X的100nt探針
SEQ ID NO. 47
第2組:1X的120nt探針
SEQ ID NO. 48
第3組:2X的140nt探針
seq1: SEQ ID NO. 49
Seq2: SEQ ID NO. 50
第4組:2X的140nt探針
seq1: SEQ ID NO. 3
Seq2: SEQ ID NO. 26
可以看出,經(jīng)過優(yōu)選后的探針在檢測時,可以檢測到0.5%豐度的突變,具有較高的靈敏性。另外,經(jīng)過DNA提取、PCR擴增和Sanger測序法,以上突變已被驗證。
最終確定的優(yōu)選探針序列如SEQ ID NO. 1~46所示。
對173例存在MET 14外顯子跳躍突變的患者樣本和5例陰性樣本進行DNA提取,并通過本發(fā)明優(yōu)選的探針和方法進行測序,結(jié)果中顯示,陽性樣本和陰性樣本的測序結(jié)果與Sanger測序法所得結(jié)果相同,證明了本方法的可靠性。
SEQUENCE LISTING
<110> 南京世和基因生物技術(shù)有限公司
<120> 一種檢測MET基因14外顯子突變的探針庫、檢測方法和試劑盒
<130> 無
<160> 50
<170> PatentIn version 3.5
<210> 1
<211> 140
<212> DNA
<213> 人工序列
<400> 1
agaaagcaaa ttaaaggtgc atttttgtta ctgttcattt ttagaagtta ccttaagaac 60
acagtcatta cagtttaaga ttgtcgtcga ttcttgtgtg ctgtcttata tgtagtccat 120
aaaacccatg agttctgggc 140
<210> 2
<211> 140
<212> DNA
<213> 人工序列
<400> 2
actgggtcaa agtctcctgg ggcccatgat agccgtcttt aacaagctct ttctttctct 60
ctgttttaag atctgggcag tgaattagtt cgctacgatg caagagtaca cactcctcat 120
ttggataggc ttgtaagtgc 140
<210> 3
<211> 140
<212> DNA
<213> 人工序列
<400> 3
ccgaagtgta agcccaacta cagaaatggt ttcaaatgaa tctgtagact accgagctac 60
ttttccagaa ggtatatttc agtttattgt tctgagaaat acctatacat atacctcagt 120
gggttgtgac attgttgttt 140
<210> 4
<211> 140
<212> DNA
<213> 人工序列
<400> 4
atttttggtt ttgcatttat atttttataa aaacctaaag gaagtattta cctctgccaa 60
gtaagtattt gacacaaaat tacatggctc ttaattttaa aagaacccat gtatatatta 120
cattatgatt ttagagtcca 140
<210> 5
<211> 140
<212> DNA
<213> 人工序列
<400> 5
taagctctca tttcacaaaa aggttaattt gagcaaaagt aatttgttta tcatctaagt 60
gcaatagtaa gaaattgcga agctctcttt tacaatccag gaagagttaa gttacaaaat 120
atacttattt aaatgtaagt 140
<210> 6
<211> 140
<212> DNA
<213> 人工序列
<400> 6
tggaactgct acatttttta cctgttgaag cccaaacatt gaaattatac tgttagtaat 60
tcttcgaagt gttttcaatg aactgttagt acacagcctt tttcccacca tattctagga 120
cttgaatgta ttttgagact 140
<210> 7
<211> 140
<212> DNA
<213> 人工序列
<400> 7
tagccaagga aaaccttcaa ttatgccatg aaaaaaagga ggggtcaata tcatcagctt 60
tgtaaaacac tatgcctagt aatgttcagg ttaatcagag ttttcatgtt gttttattta 120
aatctcctgg taaaagcaaa 140
<210> 8
<211> 140
<212> DNA
<213> 人工序列
<400> 8
aggtctgtat tgtatcagct ccattatctt tagaagttac aggatgtgag tcaagtacaa 60
gcatttcctt ggttgaatat ttaccattgg acaaataaaa tgagtcacag atcattgagg 120
atactggaaa agttagaagt 140
<210> 9
<211> 140
<212> DNA
<213> 人工序列
<400> 9
tgctcatcca aacaagttca agagcaatga agcacttaac attttaacat tttcaacact 60
tactacctct tatgttttga agtttatgtt atttctatgg agatacacat agtaaacatt 120
gtctttgccc tgattccatt 140
<210> 10
<211> 140
<212> DNA
<213> 人工序列
<400> 10
cacctttaaa aatccattcg tttaaccgtg tggaaaaatc aaacctagtt tattgttttg 60
aaatttagat ctatttagta ttttatgtgc acatttagtg catctattta gtattttata 120
tgcacatttc atagttctaa 140
<210> 11
<211> 140
<212> DNA
<213> 人工序列
<400> 11
tctgagatca ttaaaattta caaattttct ttgaaaaaaa aacttaccta atcttctttg 60
aacctcctta ctcaccaaag ctctgtcatc attgctaaga aggttgagtt tcacactctt 120
ttctccattg agcctgctcc 140
<210> 12
<211> 140
<212> DNA
<213> 人工序列
<400> 12
ttggagacat gaaaagaaaa caggtaaaag agggtcattt agagagaatg agaaaatagg 60
tgcacagcca aaacctaatg aagaggcaac tgcagagctt tcctctctac atctggtggg 120
gacagcattc tcatcagact 140
<210> 13
<211> 140
<212> DNA
<213> 人工序列
<400> 13
ttttcacgga gacctagagt gctatgtggt gtgacatcag ggtggcacac tgatggtttc 60
aattggtttc tgcacatgtt ggaatttagc tgaagagtca cgttttcatg ccaaagggct 120
tttatccatg tctcaccaag 140
<210> 14
<211> 140
<212> DNA
<213> 人工序列
<400> 14
gatttccctc aatctgtgca cccttaagca tttagagccc tgatctccag atgcaaaggc 60
tttaggaagt gagaatgaaa gacctgagtt tagagaggct gattggcatt cccaatcccc 120
tggggaaggt ttagagaccc 140
<210> 15
<211> 140
<212> DNA
<213> 人工序列
<400> 15
tgactccttg gaattaaggg agcaagtacc cagctaggct ccttccttcc tcactcaccc 60
aacatttcag gtacttcact gatgttccac atccttcttt aaaggttgct cttgtctttt 120
ttctggctag tgtctactat 140
<210> 16
<211> 140
<212> DNA
<213> 人工序列
<400> 16
aactgtaatt gatgcccaac gcttttctgg aaccactttt ggccaagttc atttattatt 60
aatcaaactg tccactgtag aaaatactaa aaatgctcaa gtgggattag gaatagtcaa 120
ggtactaaca gcattctttt 140
<210> 17
<211> 140
<212> DNA
<213> 人工序列
<400> 17
tatgcccttc tctcagattc tgattctcct gcttatttgc aaacaaatga tacattttgg 60
tgctaatgag gaacccccac ataaccttct ccctgtgtta catactaata catttcaata 120
ctatgcctag tttatcttca 140
<210> 18
<211> 140
<212> DNA
<213> 人工序列
<400> 18
tgtcagttgc tgtggctatg atgccccctc cttgatatgt gtgaattccc agtggaaaga 60
gaaagggaaa gtggaaatgc cctatttggc attaagaaat tgactatcag caccatttct 120
tcccctgaaa taaaaaaaaa 140
<210> 19
<211> 140
<212> DNA
<213> 人工序列
<400> 19
aattctcctt gcaaaaggga actttgcctg aggttcttac agagctttgg ttataaagat 60
caacttataa agaatgctta cccctttcat agtgtcctta actaaacaac aaggatggtc 120
cactaaccga gatctaacct 140
<210> 20
<211> 140
<212> DNA
<213> 人工序列
<400> 20
gccttctcta aacaacagta acactaaatc cagtgccatc actgcacagt ggagaattta 60
ccactaatgt gaaaagcttt cagttttggg aatatagcca ttatttattt ctaatcatat 120
gtgtattttt cccttggcca 140
<210> 21
<211> 140
<212> DNA
<213> 人工序列
<400> 21
ggaatccata ggttttgcac aatagtaatt aattccatta acaaatagta gtgtctcaaa 60
aggcatcttt ttcattttct tatatttgag ctggattttt gtgagacgag gcaattgctc 120
aactaccttt gctgctacca 140
<210> 22
<211> 140
<212> DNA
<213> 人工序列
<400> 22
ctgcttccat tcttaaggac atagtatatt caaaaataaa ccataagcat ggctttttgc 60
tattgataaa gagagaaatg tctaaggaaa tgagggtaaa aagctttcaa aattaatact 120
tagtctactt aaatgaaaat 140
<210> 23
<211> 140
<212> DNA
<213> 人工序列
<400> 23
ctgtaaacat ctaatgaaat gcttgtatat ataacttagt atcttttccc aatttattat 60
catttttatc aaactaattc cattataaaa gctcttcctg tttcagtccc cattaaatga 120
ggttttactg ttgttcttta 140
<210> 24
<211> 140
<212> DNA
<213> 人工序列
<400> 24
cttaagaaca cagtcattac agtttaagat tgtcgtcgat tcttgtgtgc tgtcttatat 60
gtagtccata aaacccatga gttctgggca ctgggtcaaa gtctcctggg gcccatgata 120
gccgtcttta acaagctctt 140
<210> 25
<211> 140
<212> DNA
<213> 人工序列
<400> 25
tctttctctc tgttttaaga tctgggcagt gaattagttc gctacgatgc aagagtacac 60
actcctcatt tggataggct tgtaagtgcc cgaagtgtaa gcccaactac agaaatggtt 120
tcaaatgaat ctgtagacta 140
<210> 26
<211> 140
<212> DNA
<213> 人工序列
<400> 26
ccgagctact tttccagaag gtatatttca gtttattgtt ctgagaaata cctatacata 60
tacctcagtg ggttgtgaca ttgttgttta tttttggttt tgcatttata tttttataaa 120
aacctaaagg aagtatttac 140
<210> 27
<211> 140
<212> DNA
<213> 人工序列
<400> 27
ctctgccaag taagtatttg acacaaaatt acatggctct taattttaaa agaacccatg 60
tatatattac attatgattt tagagtccat aagctctcat ttcacaaaaa ggttaatttg 120
agcaaaagta atttgtttat 140
<210> 28
<211> 140
<212> DNA
<213> 人工序列
<400> 28
catctaagtg caatagtaag aaattgcgaa gctctctttt acaatccagg aagagttaag 60
ttacaaaata tacttattta aatgtaagtt ggaactgcta cattttttac ctgttgaagc 120
ccaaacattg aaattatact 140
<210> 29
<211> 140
<212> DNA
<213> 人工序列
<400> 29
gttagtaatt cttcgaagtg ttttcaatga actgttagta cacagccttt ttcccaccat 60
attctaggac ttgaatgtat tttgagactt agccaaggaa aaccttcaat tatgccatga 120
aaaaaaggag gggtcaatat 140
<210> 30
<211> 140
<212> DNA
<213> 人工序列
<400> 30
catcagcttt gtaaaacact atgcctagta atgttcaggt taatcagagt tttcatgttg 60
ttttatttaa atctcctggt aaaagcaaaa ggtctgtatt gtatcagctc cattatcttt 120
agaagttaca ggatgtgagt 140
<210> 31
<211> 140
<212> DNA
<213> 人工序列
<400> 31
caagtacaag catttccttg gttgaatatt taccattgga caaataaaat gagtcacaga 60
tcattgagga tactggaaaa gttagaagtt gctcatccaa acaagttcaa gagcaatgaa 120
gcacttaaca ttttaacatt 140
<210> 32
<211> 140
<212> DNA
<213> 人工序列
<400> 32
ttcaacactt actacctctt atgttttgaa gtttatgtta tttctatgga gatacacata 60
gtaaacattg tctttgccct gattccattc acctttaaaa atccattcgt ttaaccgtgt 120
ggaaaaatca aacctagttt 140
<210> 33
<211> 140
<212> DNA
<213> 人工序列
<400> 33
attgttttga aatttagatc tatttagtat tttatgtgca catttagtgc atctatttag 60
tattttatat gcacatttca tagttctaat ctgagatcat taaaatttac aaattttctt 120
tgaaaaaaaa acttacctaa 140
<210> 34
<211> 140
<212> DNA
<213> 人工序列
<400> 34
tcttctttga acctccttac tcaccaaagc tctgtcatca ttgctaagaa ggttgagttt 60
cacactcttt tctccattga gcctgctcct tggagacatg aaaagaaaac aggtaaaaga 120
gggtcattta gagagaatga 140
<210> 35
<211> 140
<212> DNA
<213> 人工序列
<400> 35
gaaaataggt gcacagccaa aacctaatga agaggcaact gcagagcttt cctctctaca 60
tctggtgggg acagcattct catcagactt tttcacggag acctagagtg ctatgtggtg 120
tgacatcagg gtggcacact 140
<210> 36
<211> 140
<212> DNA
<213> 人工序列
<400> 36
gatggtttca attggtttct gcacatgttg gaatttagct gaagagtcac gttttcatgc 60
caaagggctt ttatccatgt ctcaccaagg atttccctca atctgtgcac ccttaagcat 120
ttagagccct gatctccaga 140
<210> 37
<211> 140
<212> DNA
<213> 人工序列
<400> 37
tgcaaaggct ttaggaagtg agaatgaaag acctgagttt agagaggctg attggcattc 60
ccaatcccct ggggaaggtt tagagaccct gactccttgg aattaaggga gcaagtaccc 120
agctaggctc cttccttcct 140
<210> 38
<211> 140
<212> DNA
<213> 人工序列
<400> 38
cactcaccca acatttcagg tacttcactg atgttccaca tccttcttta aaggttgctc 60
ttgtcttttt tctggctagt gtctactata actgtaattg atgcccaacg cttttctgga 120
accacttttg gccaagttca 140
<210> 39
<211> 140
<212> DNA
<213> 人工序列
<400> 39
tttattatta atcaaactgt ccactgtaga aaatactaaa aatgctcaag tgggattagg 60
aatagtcaag gtactaacag cattcttttt atgcccttct ctcagattct gattctcctg 120
cttatttgca aacaaatgat 140
<210> 40
<211> 140
<212> DNA
<213> 人工序列
<400> 40
acattttggt gctaatgagg aacccccaca taaccttctc cctgtgttac atactaatac 60
atttcaatac tatgcctagt ttatcttcat gtcagttgct gtggctatga tgccccctcc 120
ttgatatgtg tgaattccca 140
<210> 41
<211> 140
<212> DNA
<213> 人工序列
<400> 41
gtggaaagag aaagggaaag tggaaatgcc ctatttggca ttaagaaatt gactatcagc 60
accatttctt cccctgaaat aaaaaaaaaa attctccttg caaaagggaa ctttgcctga 120
ggttcttaca gagctttggt 140
<210> 42
<211> 140
<212> DNA
<213> 人工序列
<400> 42
tataaagatc aacttataaa gaatgcttac ccctttcata gtgtccttaa ctaaacaaca 60
aggatggtcc actaaccgag atctaacctg ccttctctaa acaacagtaa cactaaatcc 120
agtgccatca ctgcacagtg 140
<210> 43
<211> 140
<212> DNA
<213> 人工序列
<400> 43
gagaatttac cactaatgtg aaaagctttc agttttggga atatagccat tatttatttc 60
taatcatatg tgtatttttc ccttggccag gaatccatag gttttgcaca atagtaatta 120
attccattaa caaatagtag 140
<210> 44
<211> 140
<212> DNA
<213> 人工序列
<400> 44
tgtctcaaaa ggcatctttt tcattttctt atatttgagc tggatttttg tgagacgagg 60
caattgctca actacctttg ctgctaccac tgcttccatt cttaaggaca tagtatattc 120
aaaaataaac cataagcatg 140
<210> 45
<211> 140
<212> DNA
<213> 人工序列
<400> 45
gctttttgct attgataaag agagaaatgt ctaaggaaat gagggtaaaa agctttcaaa 60
attaatactt agtctactta aatgaaaatc tgtaaacatc taatgaaatg cttgtatata 120
taacttagta tcttttccca 140
<210> 46
<211> 140
<212> DNA
<213> 人工序列
<400> 46
atttattatc atttttatca aactaattcc attataaaag ctcttcctgt ttcagtcccc 60
attaaatgag gttttactgt tgttctttaa taattttcct tcatcttaca gatcagtttc 120
ctaattcatc tcagaacggt 140
<210> 47
<211> 100
<212> DNA
<213> 人工序列
<400> 47
tgtaagtgcc cgaagtgtaa gcccaactac agaaatggtt tcaaatgaat ctgtagacta 60
ccgagctact tttccagaag gtatatttca gtttattgtt 100
<210> 48
<211> 120
<212> DNA
<213> 人工序列
<400> 48
gtgtaagccc aactacagaa atggtttcaa atgaatctgt agactaccga gctacttttc 60
cagaaggtat atttcagttt attgttctga gaaataccta tacatatacc tcagtgggtt 120
<210> 49
<211> 140
<212> DNA
<213> 人工序列
<400> 49
ttgtaagtgc ccgaagtgta agcccaacta cagaaatggt ttcaaatgaa tctgtagact 60
accgagctac ttttccagaa ggtatatttc agtttattgt tctgagaaat acctatacat 120
atacctcagt gggttgtgac 140
<210> 50
<211> 140
<212> DNA
<213> 人工序列
<400> 50
ctgtagacta ccgagctact tttccagaag gtatatttca gtttattgtt ctgagaaata 60
cctatacata tacctcagtg ggttgtgaca ttgttgttta tttttggttt tgcatttata 120
tttttataaa aacctaaagg 140