一種基于高通量測(cè)序的多樣本的一個(gè)或多個(gè)靶序列的檢測(cè)方法和試劑盒的制作方法
【專利摘要】本發(fā)明提供基于高通量測(cè)序的捕獲和標(biāo)記多樣本的一個(gè)或多個(gè)靶序列的方法或試劑盒。本發(fā)明整合了多重?cái)U(kuò)增技術(shù)、連接技術(shù)和PCR?index技術(shù),提供了一種新型標(biāo)記技術(shù)方案,使用特異性捕獲引物擴(kuò)增靶序列,利用連接反應(yīng)在PCR產(chǎn)物的兩端各引入一個(gè)帶U堿基且序列已知的接頭,用USER酶切開(kāi)U堿基,根據(jù)接頭已知序列設(shè)計(jì)PCR引物,并利用PCR反應(yīng)在PCR產(chǎn)物兩端分別引入標(biāo)簽引物,通過(guò)PCR產(chǎn)物兩端引入的標(biāo)簽引物序列特異地得到PCR產(chǎn)物的樣本信息,再根據(jù)每個(gè)靶序列的捕獲引物序列將測(cè)序結(jié)果對(duì)應(yīng)到樣本的每個(gè)靶序列上。
【專利說(shuō)明】
一種基于高通量測(cè)序的多樣本的一個(gè)或多個(gè)靶序列的檢測(cè) 方法和試劑盒
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及生物技術(shù)領(lǐng)域,具體涉及捕獲和標(biāo)記多個(gè)樣本的靶序列的方法和試劑 盒,特別是涉及一種基于高通量測(cè)序的捕獲和標(biāo)記多樣本的一個(gè)或多個(gè)靶序列的方法或試 劑盒。
【背景技術(shù)】
[0002] 新一代高通量測(cè)序儀的出現(xiàn)大大降低了核酸測(cè)序成本,其具有高通量、低成本、測(cè) 序錯(cuò)誤率低等特點(diǎn)。應(yīng)用第二代高通量測(cè)序技術(shù),可以對(duì)混合的核酸分子進(jìn)行序列測(cè)定,同 時(shí)分辨和測(cè)出每個(gè)獨(dú)立的序列,使得該測(cè)序技術(shù)在高通量標(biāo)記開(kāi)發(fā)成為可能。
[0003] 隨著高通量測(cè)序技術(shù)在人類疾病研究、微生物基因組測(cè)序等方面的廣泛開(kāi)展,如 何最大限度發(fā)揮第二代測(cè)序技術(shù)的高通量和大數(shù)據(jù)量等特點(diǎn),降低單樣本測(cè)序成本成為下 一步測(cè)序技術(shù)的發(fā)展方向,具有很大的市場(chǎng)前景和價(jià)值。
[0004] 然而,常規(guī)的PCR-index技術(shù),對(duì)于每個(gè)PCR產(chǎn)物的index標(biāo)簽都是需要單獨(dú)進(jìn)行 擴(kuò)增標(biāo)記,然后將所有的產(chǎn)物混合測(cè)序,當(dāng)PCR片段較多時(shí),不僅操作繁瑣,而且很難控制 片段混合的均一性,會(huì)導(dǎo)致最終測(cè)序結(jié)果中片段之間數(shù)據(jù)量差距巨大。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的是利用高通量測(cè)序技術(shù)對(duì)大量樣本中的靶序列相關(guān)序列同時(shí)進(jìn)行 測(cè)序分析,解決傳統(tǒng)方法通量低、測(cè)序成本高的問(wèn)題,擴(kuò)大第二代測(cè)序技術(shù)在PCR測(cè)序領(lǐng)域 的應(yīng)用。
[0006] 針對(duì)本發(fā)明的目的,本發(fā)明整合了多重?cái)U(kuò)增技術(shù)、連接技術(shù)和PCR-index技術(shù),提 供了一種新型標(biāo)記技術(shù)方案,使用特異性捕獲引物擴(kuò)增靶序列(第一輪擴(kuò)增),利用連接反 應(yīng)在第一輪PCR產(chǎn)物的兩端各引入一個(gè)帶U堿基且序列已知的接頭,用USER酶切開(kāi)U堿 基,根據(jù)接頭已知序列設(shè)計(jì)標(biāo)簽引物,并利用PCR反應(yīng)(第二輪擴(kuò)增)在第二輪PCR產(chǎn)物兩 端分別引入標(biāo)簽引物序列,通過(guò)第二輪PCR產(chǎn)物兩端引入的標(biāo)簽引物序列可以特異地得到 PCR產(chǎn)物的樣本信息,再根據(jù)第二輪擴(kuò)增產(chǎn)物中所含有的捕獲引物序列將測(cè)序結(jié)果對(duì)應(yīng)到 樣本的每個(gè)靶序列上。
[0007] 根據(jù)本發(fā)明的一個(gè)方面,提供一種基于高通量測(cè)序的捕獲和標(biāo)記多個(gè)樣本的一個(gè) 或多個(gè)靶序列的方法,包括以下步驟:
[0008] 第一輪擴(kuò)增:使用根據(jù)靶序列設(shè)計(jì)的捕獲引物,在適于多重?cái)U(kuò)增目的核酸的條件 下分別對(duì)各樣本的目標(biāo)區(qū)域進(jìn)行擴(kuò)增,回收所設(shè)計(jì)的目標(biāo)區(qū)域范圍之內(nèi)的所有DNA條帶; [0009] 第二輪擴(kuò)增:使用第一輪擴(kuò)增得到的產(chǎn)物作為模板進(jìn)行第二輪擴(kuò)增以使第二輪擴(kuò) 增產(chǎn)物上帶有可對(duì)各樣本進(jìn)行區(qū)分的標(biāo)簽;
[0010] 混合與回收:將各樣本的富集擴(kuò)增產(chǎn)物均一地混合在一起,回收所設(shè)計(jì)的目標(biāo)區(qū) 域范圍之內(nèi)的所有DNA條帶;
[0011] 測(cè)序:將回收的DNA混合物進(jìn)行測(cè)序;
[0012] 分析:基于每個(gè)樣本的擴(kuò)增產(chǎn)物中獨(dú)特的標(biāo)簽,將獲得的測(cè)序結(jié)果首先與樣本 --對(duì)應(yīng);根據(jù)每個(gè)靶序列的捕獲引物序列,再將測(cè)序結(jié)果對(duì)應(yīng)到樣本的靶序列上。
[0013] 優(yōu)選地,根據(jù)本發(fā)明的一個(gè)方面,提供一種基于高通量測(cè)序的捕獲和標(biāo)記多個(gè)樣 本的一個(gè)或多個(gè)靶序列的方法,包括以下步驟:
[0014] 第一輪擴(kuò)增:使用根據(jù)靶序列設(shè)計(jì)的捕獲引物,在適于多重?cái)U(kuò)增目的核酸的條件 下分別對(duì)各樣本的目標(biāo)區(qū)域進(jìn)行擴(kuò)增,回收所設(shè)計(jì)的目標(biāo)區(qū)域范圍之內(nèi)的所有DNA條帶, 對(duì)擴(kuò)增產(chǎn)物進(jìn)行末端修復(fù)并加 A尾;
[0015] 接頭設(shè)計(jì):所述接頭包含兩個(gè)回文序列、U堿基和3'T末端,其中,一個(gè)回文序列位 于所述接頭5'端,通過(guò)U堿基與另一個(gè)回文序列連接,其可穩(wěn)定形成發(fā)卡結(jié)構(gòu);
[0016] 連接接頭(Adaptor):通過(guò)連接反應(yīng)在第一輪擴(kuò)增產(chǎn)物的兩端加上帶U堿基的接 頭;進(jìn)行U堿基剪切,并用單鏈消化酶消化剩余的引物;
[0017] 標(biāo)簽引物設(shè)計(jì):所述標(biāo)簽引物包含標(biāo)簽序列和與所述接頭的5'端回文序列互補(bǔ) 的序列,其中,所述標(biāo)簽序列位于所述標(biāo)簽引物的5'端,其中,標(biāo)簽序列的數(shù)量X接頭的數(shù) 量>樣本數(shù)量;
[0018] 第二輪擴(kuò)增:使用針對(duì)接頭和各樣本設(shè)計(jì)的標(biāo)簽(index)引物,以對(duì)應(yīng)樣本連接 接頭后的產(chǎn)物作為模板進(jìn)行富集擴(kuò)增,并用單鏈消化酶消化剩余的引物,以分別給每個(gè)樣 本的擴(kuò)增產(chǎn)物都加上可以區(qū)分的標(biāo)簽引物序列;
[0019] 混合與回收:將各樣本的富集擴(kuò)增產(chǎn)物均一地混合在一起,回收所設(shè)計(jì)的目標(biāo)區(qū) 域范圍之內(nèi)的所有DNA條帶;
[0020] 測(cè)序:將回收的DNA混合物進(jìn)行測(cè)序;
[0021] 分析:基于每個(gè)樣本的擴(kuò)增產(chǎn)物中獨(dú)特的標(biāo)簽引物序列,將獲得的測(cè)序結(jié)果首先 與樣本--對(duì)應(yīng);根據(jù)每個(gè)靶序列的捕獲引物序列,再將測(cè)序結(jié)果對(duì)應(yīng)到樣本的每個(gè)靶序 列上。
[0022] 優(yōu)選地,本發(fā)明提供了一種基于高通量測(cè)序的捕獲和標(biāo)記多個(gè)樣本的一個(gè)或多個(gè) 靶序列的方法,包括以下步驟:
[0023] 1)引物和接頭設(shè)計(jì):
[0024] 第一輪擴(kuò)增引物:根據(jù)待測(cè)的靶序列設(shè)計(jì)相應(yīng)的捕獲引物,組成第一輪擴(kuò)增引物 組合;
[0025] 接頭序列:設(shè)計(jì)一個(gè)或多個(gè)接頭序列,所述接頭包含兩個(gè)回文序列、U堿基和3' T 末端,其中,一個(gè)回文序列位于所述接頭5'端,通過(guò)U堿基與另一個(gè)回文序列連接,其可穩(wěn) 定形成發(fā)卡結(jié)構(gòu);
[0026] 第二輪擴(kuò)增引物:根據(jù)樣本數(shù)量設(shè)計(jì)不同的標(biāo)簽序列,并在其3'端加上與所述接 頭的5'端回文序列互補(bǔ)的序列組成富集擴(kuò)增所用的標(biāo)簽引物,組成第二輪擴(kuò)增引物組合, 其中,由于第二輪擴(kuò)增的靶序列兩端連接的接頭相同,用于同一樣本的正向標(biāo)簽引物和反 向標(biāo)簽引物相同,設(shè)計(jì)的標(biāo)簽引物的數(shù)量遵循以下規(guī)則:標(biāo)簽序列的數(shù)量X接頭的數(shù)量> 樣本數(shù)量,以及其中,在第二輪擴(kuò)增引物中,標(biāo)簽序列上添加的序列與第一輪擴(kuò)增產(chǎn)物中連 接的接頭的5'端回文序列互補(bǔ);
[0027] 2)第一輪擴(kuò)增(PCR捕獲):將擴(kuò)增靶序列的捕獲引物混合,在適于多重?cái)U(kuò)增目的 核酸的條件下分別對(duì)各樣本進(jìn)行擴(kuò)增;回收所設(shè)計(jì)的目標(biāo)區(qū)域范圍之內(nèi)的所有DNA條帶, 對(duì)擴(kuò)增產(chǎn)物進(jìn)行末端修復(fù),并將擴(kuò)增產(chǎn)物的兩個(gè)末端都加上A尾;
[0028] 3)連接接頭(Adaptor):通過(guò)連接反應(yīng)在擴(kuò)增產(chǎn)物兩端加上帶U堿基的接頭,使用 USER酶打斷U堿基,用單鏈消化酶消化剩余的引物;
[0029] 4)第二輪擴(kuò)增(產(chǎn)物富集):根據(jù)不同樣本和接頭設(shè)計(jì)的標(biāo)簽引物,使用對(duì)應(yīng)樣本 連接接頭處理后的產(chǎn)物作為模板進(jìn)行富集擴(kuò)增,以分別給每個(gè)樣本的擴(kuò)增引物都加上可以 區(qū)分的標(biāo)簽引物序列;用單鏈消化酶消化剩余的引物,并進(jìn)行純化;
[0030] 5)混合與回收:將各樣本的富集產(chǎn)物均一地混合在一起;回收所設(shè)計(jì)的目標(biāo)區(qū)域 范圍之內(nèi)的所有DNA條帶;
[0031] 6)測(cè)序:將DNA混合物進(jìn)行測(cè)序;
[0032] 7)分析:基于每個(gè)樣本獨(dú)特的標(biāo)簽引物序列,將獲得的測(cè)序結(jié)果首先與樣本-- 對(duì)應(yīng);根據(jù)每個(gè)靶序列的捕獲引物序列,再將測(cè)序結(jié)果對(duì)應(yīng)到樣本的每個(gè)靶序列上。
[0033] 優(yōu)選地,步驟1中,所述標(biāo)簽序列的長(zhǎng)度可以為5_20bp,更優(yōu)選地,所述標(biāo)簽序列 的長(zhǎng)度可以為6-8bp ;所述接頭序列中包含兩個(gè)區(qū)域的回文序列,優(yōu)選地,每個(gè)回文序列可 以為8-15bp (最優(yōu)選為15bp)。
[0034] 優(yōu)選地,步驟2中,擴(kuò)增所采用的體系為高保真多重PCR反應(yīng)體系,以減少擴(kuò)增所 帶來(lái)的DNA突變,并保證各目的片段能得到有效擴(kuò)增;
[0035] 優(yōu)選地,步驟2中,PCR擴(kuò)增進(jìn)行18-20個(gè)循環(huán)。
[0036] 優(yōu)選地,步驟4中,擴(kuò)增所采用的酶為高保真DNA聚合酶,由此減少擴(kuò)增帶來(lái)的DNA 突變率。
[0037] 優(yōu)選地,步驟2中的末端修復(fù)、加 A尾反應(yīng)以及步驟3中的連接反應(yīng)所用試劑分 別為 Neb 推薦二代建庫(kù)試劑盒TSfEBNexl? End Repair Module、NEKNext? dA-Tailing Module和HEKlSfext? Quick Ligation Module。優(yōu)選地,步驟3和4中所用的單鏈消化酶 為核酸外切酶I (Exonuclease I),該酶是單鏈特異性3' 一 5'核酸外切酶,不分解雙鏈DNA 及 RNA。
[0038] 優(yōu)選地,步驟4中第二輪擴(kuò)增進(jìn)行15-18個(gè)循環(huán)。
[0039] 優(yōu)選地,步驟6中測(cè)序利用二代測(cè)序技術(shù),優(yōu)選的是pair-End技術(shù)(例如 Illumina Hiseq2000,Illumina Hiseq2500 和 Illumina Miseq)進(jìn)行測(cè)序,獲得 DNA 混合 物的序列。
[0040] 另一方面,本發(fā)明還提供一種基于高通量測(cè)序的捕獲和標(biāo)記多個(gè)樣本的一個(gè)或多 個(gè)靶序列的試劑盒,其中,所述試劑盒包括以下引物 :
[0041] 第一輪擴(kuò)增引物:根據(jù)待測(cè)的靶序列設(shè)計(jì)相應(yīng)的捕獲引物,組成第一輪擴(kuò)增引物 組合;
[0042] 接頭序列:一個(gè)或多個(gè)接頭序列,所述接頭包含兩個(gè)回文序列、U堿基和3'T末端, 其中,一個(gè)回文序列位于所述接頭5'端,通過(guò)U堿基與另一個(gè)回文序列連接,其可穩(wěn)定形成 發(fā)卡結(jié)構(gòu);和/或
[0043] 第二輪擴(kuò)增引物:根據(jù)樣本數(shù)量設(shè)計(jì)不同的標(biāo)簽序列,并在其3'端加上與所述接 頭的5'端回文序列互補(bǔ)的序列組成富集擴(kuò)增所用的標(biāo)簽引物,組成第二輪擴(kuò)增引物組合, 其中,由于第二輪擴(kuò)增的靶序列兩端連接的接頭相同,用于同一樣本的正向標(biāo)簽引物和反 向標(biāo)簽引物相同,設(shè)計(jì)的標(biāo)簽引物的數(shù)量遵循以下規(guī)則:標(biāo)簽序列的數(shù)量X接頭的數(shù)量> 樣本數(shù)量,以及其中,在第二輪擴(kuò)增引物中,標(biāo)簽序列上添加的序列與第一輪擴(kuò)增產(chǎn)物中連 接的接頭的5'端回文序列互補(bǔ)。
[0044] 優(yōu)選地,在本發(fā)明中,所述樣本的數(shù)量可為:樣本數(shù)量 <可設(shè)計(jì)的標(biāo)簽序列的數(shù) 量X可設(shè)計(jì)的接頭的數(shù)量。
[0045] 更優(yōu)選地,本發(fā)明提供一種基于高通量測(cè)序的標(biāo)記和捕獲多個(gè)(10個(gè))樣本的 Wilson綜合征相關(guān)的ATP7B基因的一個(gè)或多個(gè)(21個(gè))外顯子的試劑盒,其中所述外顯子 為選自 EX0N1、EX0N2、EX0N3、EX0N4、EX0N5、EX0N6、EX0N7、EX0N8、EX0N9、EX0N10、EX0N11、 EX0N12、EX0N13、EX0N14、EX0N15、EX0N16、EX0N17、EX0N18、EX0N19、EX0N20、EX0N21 中的一 種或多種;所述試劑盒包括如下引物和接頭:
[0046] 第一輪擴(kuò)增引物包括選自下列中的一對(duì)或多對(duì):
[0047]
[0048]
[0049] 用于連接在第一輪擴(kuò)增產(chǎn)物兩端的具有如下序列的接頭:
[0050] ADP1:5'P-AGGACAGAAGCTCGA-U-TCGAGCTTCTGTCCT-s-T-3'
[0051] ADP2 :5'P-ACCTTGAGCGATCGA-U-TCGATCGCTCAAGGT-s-T-3' ;
[0052] 第二輪擴(kuò)增引物包括選自下列標(biāo)簽引物中的一種或多種標(biāo)簽引物組成的引物對(duì), 其中劃?rùn)M線部分為與第一輪產(chǎn)物中連接的接頭的5'端回文區(qū)域互補(bǔ)的序列:
[0063] 其中,由于第二輪擴(kuò)增時(shí),靶序列兩端連接的接頭相同,用于同一樣本的正向標(biāo)簽 引物和反向標(biāo)簽引物相同。
[0064] 本發(fā)明具有如下有益效果:
[0065] 本發(fā)明使用特異性的捕獲引物(第一輪擴(kuò)增引物)擴(kuò)增靶序列,通過(guò)連接反應(yīng)將 帶有U堿基的接頭(Adaptor)連接到靶序列擴(kuò)增產(chǎn)物的兩端,用USER酶切開(kāi)U堿基后,通 過(guò)采用標(biāo)簽序列+接頭序列組成的第二輪擴(kuò)增引物進(jìn)行擴(kuò)增,最終在PCR產(chǎn)物的5'末端添 加了標(biāo)簽引物序列。通過(guò)對(duì)每個(gè)樣本都引入獨(dú)特的標(biāo)簽引物序列,在第二代高通量測(cè)序技 術(shù)檢測(cè)時(shí),每個(gè)樣本的測(cè)序結(jié)果都可以通過(guò)其獨(dú)特的標(biāo)簽引物序列找回,再根據(jù)每個(gè)靶序 列的捕獲引物序列將測(cè)序結(jié)果對(duì)應(yīng)到樣本的每個(gè)靶序列上,因此,本發(fā)明可以應(yīng)用于同時(shí) 檢測(cè)大量樣本的多個(gè)不同基因位點(diǎn),大大降低了測(cè)序成本。
【附圖說(shuō)明】
[0066] 圖1是本發(fā)明的捕獲和標(biāo)記多個(gè)樣本的靶序列的方法的示意圖。
【具體實(shí)施方式】
[0067] 現(xiàn)將結(jié)合實(shí)施例對(duì)本發(fā)明做進(jìn)一步詳細(xì)說(shuō)明,實(shí)施例僅限于說(shuō)明本發(fā)明,而非對(duì) 本發(fā)明的限定。
[0068] 以下實(shí)施例中所使用的設(shè)備和試劑如下:NEBNext? End Repair Module、 NEBNext? dA-Tailing Module 和 NEBNext? Quick Ligation Module,核酸外切酶 Takara (Exonuclease I(E.coli))。
[0069] 實(shí)施例1
[0070] Wilson 綜合征相關(guān) ATP7B 基因 (NCBI Gene ID:540)的 21 個(gè)外顯子(EX0N1、 EX0N2、EX0N3、EX0N4、EX0N5、EX0N6、EX0N7、EX0N8、EX0N9、EX0N10、EX0N11、EX0N12、EX0N13、 EX0N14、EX0N15、EX0N16、EX0N17、EX0N18、EX0N19、EX0N20 和 EX0N21)測(cè)序,共 10 例臨床樣 本:
[0071] 1)引物和接頭設(shè)計(jì):
[0072] 針對(duì)ATP7B基因的21個(gè)外顯子分別設(shè)計(jì)相應(yīng)的捕獲引物,相關(guān)參數(shù):Tm值 58. 0°C - 65. 0°C,GC 值 40. 0% - 60. 0%,引物大小 23±3bp,目的片段大小為 150-300bp, 所設(shè)計(jì)的引物如下:
[0073]
[0074]
[0075] 根據(jù)10個(gè)樣本設(shè)計(jì)2個(gè)接頭,接頭為單鏈DNA,序列中包含兩個(gè)區(qū)域(每個(gè)區(qū)域長(zhǎng) 度為15bp)的回文序列、一個(gè)U堿基和3' T末端,可形成穩(wěn)定的發(fā)卡結(jié)構(gòu),所設(shè)計(jì)的接頭序 列如下:
[0076] ADP1:5'P-AGGACAGAAGCTCGA-U-TCGAGCTTCTGTCCT-s-T-3'
[0077] ADP2 :5'P-ACCTTGAGCGATCGA-U-TCGATCGCTCAAGGT-s-T-3'
[0078] 按照以下規(guī)則設(shè)計(jì)標(biāo)簽引物:標(biāo)簽引物包含標(biāo)簽序列和與接頭的5'端回文序列 互補(bǔ)的序列,其中,標(biāo)簽序列的數(shù)量X接頭序列的數(shù)量>樣本數(shù)量,在本實(shí)施例中,根據(jù)10 個(gè)樣本和2個(gè)接頭設(shè)計(jì)10條標(biāo)簽引物,即,在與接頭的5'端回文序列互補(bǔ)的序列的5'端 加上可以區(qū)分的標(biāo)簽序列(6bp)構(gòu)成標(biāo)簽引物,其中,由于第二輪擴(kuò)增的靶序列(第一輪擴(kuò) 增產(chǎn)物連接接頭后的產(chǎn)物)兩端連接的接頭的回文序列相同,用于同一樣本的正向標(biāo)簽引 物和反向標(biāo)簽引物相同。所設(shè)計(jì)的標(biāo)簽引物如下,其中劃?rùn)M線部分為與第一輪產(chǎn)物中連接 的接頭的5'端回文區(qū)域互補(bǔ)的序列:
[0079] ADP1A :GCTCATTCGAGCTTCTGTCCT
[0089] 2)第一輪擴(kuò)增(PCR捕獲):
[0090] 每對(duì)捕獲引物單獨(dú)調(diào)試合格后,分別針對(duì)各臨床樣本,將21對(duì)引物分別稀釋到 100 μ M,然后等量混合,按以下體系和條件擴(kuò)增:
[0091]
[0092] 反應(yīng)條件:
[0093] 95 °C 10 分鐘;
[0094] 95°C 30 秒;58°C 5 分鐘(20 個(gè)循環(huán));
[0095] 72 °C 7 分鐘。
[0096] 產(chǎn)物回收:切膠回收所設(shè)計(jì)的目標(biāo)區(qū)域范圍之內(nèi)的所有DNA條帶(150-300bp)。
[0097] 末端修復(fù):按照以下反應(yīng)體系和條件對(duì)上述回收產(chǎn)物進(jìn)行末端修復(fù):
[0098]
[0099] 反應(yīng)條件:
[0100] 20 °C 30min
[0101] 65 °C 20min
[0102] 將所得產(chǎn)物進(jìn)行柱純化,最終50 μ L洗脫。
[0103] 加 A尾:按照以下反應(yīng)體系和條件對(duì)上述產(chǎn)物片段3'端加 A尾: 「01041
[0105] 反應(yīng)條件:37°C 30min, 65°C 20min。
[0106] 將所得產(chǎn)物進(jìn)行柱純化,最終30 μ L洗脫。
[0107] 3)連接接頭
[0108] 連接反應(yīng):按照以下反應(yīng)體系和條件在上述產(chǎn)物片段兩端加上接頭:
[0109]
[0110] 反應(yīng)條件:2(TC 15min,12°C 30min,65°C lOmin。
[0111] 其中,在第二輪擴(kuò)增所用的標(biāo)簽引物中,與標(biāo)簽序列3'端連接的序列是與第一輪 擴(kuò)增產(chǎn)物中連接的接頭的5'端回文序列互補(bǔ)的序列,每個(gè)樣本在第一輪產(chǎn)物中連接的接頭 和在第二輪擴(kuò)增所用的標(biāo)簽引物如下表一所示。
[0112] USER酶和Exonuclease I酶消化:在上述體系中添加 lyL USER酶,37 °C反應(yīng) 30min,以切開(kāi)接頭中的U堿基,然后加入1 μ L Exonuclease I酶,37°C反應(yīng)30min以消化 體系中殘留的引物單鏈。對(duì)所得產(chǎn)物進(jìn)行柱純化,最終50 μ L洗脫。
[0113] 4)第二輪擴(kuò)增(產(chǎn)物富集)使用上述根據(jù)樣本和接頭設(shè)計(jì)的標(biāo)簽引物,以對(duì)應(yīng)樣 本連接接頭處理后的產(chǎn)物作為模板進(jìn)行富集擴(kuò)增,以分別給每個(gè)樣本的擴(kuò)增產(chǎn)物再加上可 以區(qū)分的標(biāo)簽引物序列,反應(yīng)體系和條件如下:
[0114]
[0115]
[0116] 反應(yīng)條件:95°C lOmin ;95°C lmin,50°C 5min,72°C lmin(15-18 個(gè)循環(huán));
[0117] 其中,第一輪產(chǎn)物中連接的接頭和第二輪產(chǎn)物中所使用的標(biāo)簽引物如下表一所 示:
[0118] 表一
[0119]
[0120] 引物消化和產(chǎn)物回收:擴(kuò)增產(chǎn)物用單鏈消化酶消化剩余的引物,并進(jìn)行純化,回收 所設(shè)計(jì)的目標(biāo)區(qū)域范圍之內(nèi)的所有DNA條帶;
[0121] 5)混合與回收:將針對(duì)各臨床樣本的帶有標(biāo)記序列的第二輪PCR擴(kuò)增產(chǎn)物根據(jù)濃 度均一的混合在一起,回收所設(shè)計(jì)的目標(biāo)區(qū)域范圍之內(nèi)的所有DNA條帶;
[0122] 6)測(cè)序:將回收的DNA混合物,采用Illumina Miseq,PE300進(jìn)行測(cè)序,獲得DNA 混合物的序列。
[0123] 7)分析:Illumina Miseq產(chǎn)物的測(cè)序結(jié)果是一系列DNA序列,通過(guò)查找測(cè)序結(jié)果 中10個(gè)樣本各自獨(dú)特的標(biāo)簽引物序列(接頭序列和標(biāo)簽序列的組合),將獲得的測(cè)序結(jié)果 首先與樣本一一對(duì)應(yīng),然后根據(jù)21個(gè)外顯子的捕獲引物序列,再將測(cè)序結(jié)果對(duì)應(yīng)到樣本的 每個(gè)靶序列上。所有的10個(gè)樣本的21個(gè)外顯子都能夠在測(cè)序結(jié)果中找到對(duì)應(yīng)的數(shù)據(jù),每 個(gè)樣本對(duì)應(yīng)的reads數(shù)如下表二所示,10個(gè)樣本之間reads數(shù)差異最大在3倍左右,21個(gè) 外顯子序列對(duì)應(yīng)的reads差異最大在10倍左右(數(shù)據(jù)參見(jiàn)表三,以1-2#樣本為例),表明 我們的多樣本標(biāo)記方法能夠有效的區(qū)分每個(gè)標(biāo)簽對(duì)應(yīng)的DNA序列。
[0124] 表二每個(gè)樣本對(duì)應(yīng)的reads數(shù)和GC數(shù)
[0125]
[0127] 表三21個(gè)外顯子序列對(duì)應(yīng)的reads數(shù)(以1-2#樣本為例)
[0128]
【主權(quán)項(xiàng)】
1. 一種基于高通量測(cè)序的捕獲和標(biāo)記多個(gè)樣本的一個(gè)或多個(gè)祀序列的方法,包括W下 步驟: 第一輪擴(kuò)增:使用根據(jù)祀序列設(shè)計(jì)的捕獲引物,在適于多重?cái)U(kuò)增目的核酸的條件下分 別對(duì)各樣本的目標(biāo)區(qū)域進(jìn)行擴(kuò)增,回收所設(shè)計(jì)的目標(biāo)區(qū)域范圍之內(nèi)的所有DNA條帶; 第二輪擴(kuò)增:使用第一輪擴(kuò)增得到的產(chǎn)物作為模板進(jìn)行第二輪擴(kuò)增W使第二輪擴(kuò)增產(chǎn) 物上帶有可對(duì)各樣本進(jìn)行區(qū)分的標(biāo)簽; 混合與回收:將各樣本的富集擴(kuò)增產(chǎn)物均一地混合在一起,回收所設(shè)計(jì)的目標(biāo)區(qū)域范 圍之內(nèi)的所有DNA條帶; 測(cè)序;將回收的DNA混合物進(jìn)行測(cè)序; 分析:基于每個(gè)樣本的擴(kuò)增產(chǎn)物中獨(dú)特的標(biāo)簽,將獲得的測(cè)序結(jié)果首先與樣本一一對(duì) 應(yīng);根據(jù)每個(gè)祀序列的捕獲引物序列,再將測(cè)序結(jié)果對(duì)應(yīng)到樣本的每個(gè)祀序列上。2. -種基于高通量測(cè)序的捕獲和標(biāo)記多個(gè)樣本的一個(gè)或多個(gè)祀序列的方法,包括W下 步驟: 第一輪擴(kuò)增:使用根據(jù)祀序列設(shè)計(jì)的捕獲引物,在適于多重?cái)U(kuò)增目的核酸的條件下分 別對(duì)各樣本的目標(biāo)區(qū)域進(jìn)行擴(kuò)增,回收所設(shè)計(jì)的目標(biāo)區(qū)域范圍之內(nèi)的所有DNA條帶,對(duì)擴(kuò) 增產(chǎn)物進(jìn)行末端修復(fù)并加 A尾; 接頭設(shè)計(jì):所述接頭包含兩個(gè)回文序列、U堿基和3'T末端,其中,一個(gè)回文序列位于所 述接頭5'端,通過(guò)U堿基與另一個(gè)回文序列連接,其可穩(wěn)定形成發(fā)卡結(jié)構(gòu); 連接接頭:通過(guò)連接反應(yīng)在第一輪擴(kuò)增產(chǎn)物的兩端加上帶U堿基的接頭;進(jìn)行U堿基 剪切,并用單鏈消化酶消化剩余的引物; 標(biāo)簽引物設(shè)計(jì):所述標(biāo)簽引物包含標(biāo)簽序列和與所述接頭的5'端回文序列互補(bǔ)的序 列,其中,所述標(biāo)簽序列位于所述標(biāo)簽引物的5'端,其中,標(biāo)簽序列的數(shù)量X接頭的數(shù)量> 樣本數(shù)量; 第二輪擴(kuò)增:使用針對(duì)接頭和各樣本設(shè)計(jì)的標(biāo)簽引物,W對(duì)應(yīng)樣本連接接頭后的產(chǎn)物 作為模板進(jìn)行富集擴(kuò)增,并用單鏈消化酶消化剩余的引物,W分別給每個(gè)樣本的擴(kuò)增產(chǎn)物 都加上可W區(qū)分的標(biāo)簽引物序列; 混合與回收:將各樣本的富集擴(kuò)增產(chǎn)物均一地混合在一起,回收所設(shè)計(jì)的目標(biāo)區(qū)域范 圍之內(nèi)的所有DNA條帶; 測(cè)序;將回收的DNA混合物進(jìn)行測(cè)序; 分析:基于每個(gè)樣本的擴(kuò)增產(chǎn)物中獨(dú)特的標(biāo)簽引物序列,將獲得的測(cè)序結(jié)果首先與樣 本--對(duì)應(yīng);根據(jù)每個(gè)祀序列的捕獲引物序列,再將測(cè)序結(jié)果對(duì)應(yīng)到樣本的祀序列上。3. -種基于高通量測(cè)序的捕獲和標(biāo)記多個(gè)樣本的一個(gè)或多個(gè)祀序列的方法,包括W下 步驟: 1)引物和接頭設(shè)計(jì): 第一輪擴(kuò)增引物:根據(jù)待測(cè)的祀序列設(shè)計(jì)相應(yīng)的捕獲引物,組成第一輪擴(kuò)增引物組 合; 接頭序列:設(shè)計(jì)一個(gè)或多個(gè)接頭序列,所述接頭包含兩個(gè)回文序列、U堿基和3'T末端, 其中,一個(gè)回文序列位于所述接頭5'端,通過(guò)U堿基與另一個(gè)回文序列連接,其可穩(wěn)定形成 發(fā)卡結(jié)構(gòu); 第二輪擴(kuò)增引物:根據(jù)樣本數(shù)量設(shè)計(jì)不同的標(biāo)簽序列,并在其3'端加上與所述接頭的 5'端回文序列互補(bǔ)的序列組成富集擴(kuò)增所用的標(biāo)簽引物,組成第二輪擴(kuò)增引物組合,其中, 由于第二輪擴(kuò)增的祀序列兩端連接的接頭相同,用于同一樣本的正向標(biāo)簽引物和反向標(biāo)簽 引物相同,設(shè)計(jì)的標(biāo)簽引物的數(shù)量遵循W下規(guī)則:標(biāo)簽序列的數(shù)量X接頭的數(shù)量>樣本數(shù) 量,W及其中,在第二輪擴(kuò)增引物中,標(biāo)簽序列上添加的序列與第一輪擴(kuò)增產(chǎn)物中連接的接 頭的5'端回文序列互補(bǔ); 2) 第一輪擴(kuò)增;將擴(kuò)增祀序列的捕獲引物混合,在適于多重?cái)U(kuò)增目的核酸的條件下分 別對(duì)各樣本進(jìn)行擴(kuò)增;回收所設(shè)計(jì)的目標(biāo)區(qū)域范圍之內(nèi)的所有DNA條帶,對(duì)擴(kuò)增產(chǎn)物進(jìn)行 末端修復(fù),并將擴(kuò)增產(chǎn)物的兩個(gè)末端都加上A尾; 3) 連接接頭(Adaptor):通過(guò)連接反應(yīng)在擴(kuò)增產(chǎn)物兩端加上帶U堿基的接頭,使用 US邸酶打斷U堿基,用單鏈消化酶消化剩余的引物; 4) 第二輪擴(kuò)增;根據(jù)不同樣本和接頭設(shè)計(jì)的標(biāo)簽引物,使用對(duì)應(yīng)樣本連接接頭處理后 的產(chǎn)物作為模板進(jìn)行富集擴(kuò)增,W分別給每個(gè)樣本的擴(kuò)增引物都加上可W區(qū)分的標(biāo)簽引物 序列;用單鏈消化酶消化剩余的引物,并進(jìn)行純化; 5) 混合與回收;將各樣本的富集產(chǎn)物均一地混合在一起;回收所設(shè)計(jì)的目標(biāo)區(qū)域范圍 之內(nèi)的所有DNA條帶; 6) 測(cè)序;將DNA混合物進(jìn)行測(cè)序; 7) 分析;基于每個(gè)樣本獨(dú)特的標(biāo)簽引物序列,將獲得的測(cè)序結(jié)果首先與樣本一一對(duì) 應(yīng);根據(jù)每個(gè)祀序列的捕獲引物序列,再將測(cè)序結(jié)果對(duì)應(yīng)到樣本的祀序列上。4. 根據(jù)權(quán)利要求2或3所述的方法,其中,所述標(biāo)簽序列的長(zhǎng)度為5-20bp,優(yōu)選地, 所述標(biāo)簽序列的長(zhǎng)度為6-8bp ;所述接頭中包含兩個(gè)區(qū)域的回文序列,每個(gè)回文序列為 8-lf5bp,最優(yōu)選為 15bp。5. 根據(jù)權(quán)利要求2或3所述的方法,其中,第一輪擴(kuò)增所采用的體系為高保真多重PCR 反應(yīng)體系;第二輪擴(kuò)增所采用的酶為高保真DNA聚合酶,所述的單鏈消化酶為核酸外切酶 Io6. 根據(jù)權(quán)利要求2或3所述的方法,其中,第一輪擴(kuò)增進(jìn)行18-20個(gè)循環(huán),第二輪擴(kuò)增 進(jìn)行15-18個(gè)循環(huán)。7. 根據(jù)權(quán)利要求2或3所述的方法,其中,末端修復(fù)、加 A尾反應(yīng)W及連接反應(yīng)所 用試劑分別為Neb推薦二代建庫(kù)試劑盒NEBNext? Elnd Repair Module、NEBNext? dA-Tailing Module 和NEBNex俾如ick Ligation Module。8. 根據(jù)權(quán)利要求2或3所述的方法,其中,測(cè)序利用二代測(cè)序技術(shù),優(yōu)選的是pair-End 技術(shù)(例如 Illumina Hiseq2000, Illumina Hiseq2500 和 Illumina Miseq)進(jìn)行測(cè)序,獲 得DNA混合物的序列。9. 一種基于高通量測(cè)序的捕獲和標(biāo)記多個(gè)樣本的一個(gè)或多個(gè)祀序列的試劑盒,其中, 所述試劑盒包括W下引物和接頭: 第一輪擴(kuò)增引物:根據(jù)待測(cè)的祀序列設(shè)計(jì)相應(yīng)的捕獲引物,組成第一輪擴(kuò)增引物組 合; 接頭序列:一個(gè)或多個(gè)接頭序列,所述接頭包含兩個(gè)回文序列、U堿基和3' T末端,其 中,一個(gè)回文序列位于所述接頭5'端,通過(guò)U堿基與另一個(gè)回文序列連接,其可穩(wěn)定形成發(fā) 卡結(jié)構(gòu);和/或 第二輪擴(kuò)增引物:根據(jù)樣本數(shù)量設(shè)計(jì)不同的標(biāo)簽序列,并在其3'端加上與所述接頭的 5'端回文序列互補(bǔ)的序列組成富集擴(kuò)增所用的標(biāo)簽引物,組成第二輪擴(kuò)增引物組合,其中, 由于第二輪擴(kuò)增的祀序列兩端連接的接頭相同,用于同一樣本的正向標(biāo)簽引物和反向標(biāo)簽 引物相同,設(shè)計(jì)的標(biāo)簽引物的數(shù)量遵循W下規(guī)則:標(biāo)簽序列的數(shù)量X接頭的數(shù)量>樣本數(shù) 量,W及其中,在第二輪擴(kuò)增引物中,標(biāo)簽序列上添加的序列與第一輪擴(kuò)增產(chǎn)物中連接的接 頭的5'端回文序列互補(bǔ)。10. -種基于局通量測(cè)序的標(biāo)記和捕獲多個(gè)樣本的Wilson綜合征相關(guān)的ATP7B基因 的一個(gè)或多個(gè)外顯子的試劑盒,其中所述外顯子為選自EX0N1、EX0N2、EX0N3、EX0N4、EX0N5、 EX0N6、EX0N7、EX0N8、EX0N9、EX0N10、EXONl 1、EX0N12、EX0N13、EX0N14、EX0N15、EX0N16、 EX0N17、EX0N18、EX0N19、EX0N20、EX0N21中的一種或多種;所述試劑盒包括如下引物和接 頭: 第一輪擴(kuò)增引物包括選自下列中的一對(duì)或多對(duì): El-F CTTCCCCGGTCCCAAATGAAG El-R CCTCCTGGTGGGAGTGAGCAC E2-F TGCCAGAGAAGCTGGGATGTTG E2-R GCAAACCTGTTGCAGGCACAC E3-F GAGCCCTGAAACCTCTTGTTCTG E3-R CGAGGTCTATACGCAGCATTCCT E4-F GCCCTGCCCACCCAGAGTG E4-R CAAAGATGGATGTGTCCAAAATGC E5-F CTGGCTTTCACAGGCTTTCCT E5-R TTACTTACCTCAATAATTTTGATAATATCC E6-F CTGCCAATGCATATTTTAACCAAGT E6-R GAAGGGACTTAGATGAGAGCTGGAG E7-F AATCCAGGTGACAAGCAGCATC E7-R GCATGGAAGGGAGAGGTCTGC E8-F ACTTGCTGGCAGCCTTCACTG E8-R GATTTGTTTACTGAAGGAGCAGCTC E9-F CGATAGCTCTCATTTCACATTCTGG E9-R CACACAGATTGATAGATACCAACCAC ElO-F TGACCCGGTGACCGAATGAGT ElO-R ATGATATCCTCCTGAGGGAACATG Ell-F CAAGTGACAGTTGTCTCTTTCCTACG Ell-R TTCCCAGAACTCTTCACATAATTTCT E12-F CCATGGTCTTGGTGTTTTATTTTC E12-R TGAAAGAACAGGATCAATGTCAGTAG E13-F TGGGAGCTTCCTTATTGAACTCTC E13-R CATCTCTCAGGATGGGGAAAGC E14-F CCTCCATCTGTATTGTGGTCAGTG E14-R GGTGAGGAATAAAAGAGCATTGGC E15-F TCTTGGCTTACAGTTTCCTCTTCC E15-R CGTGGTGCTCTCTGTGGTTTGA E16-F GGACCATTTAGAAATAACCACAGCC E16-R TTTGCCTGATATCTGCAGAAAACTG E17-F CCAACTTGTGTAGCTGCTGATGC E17-R TGGTGCTTACTTTTGTCTCTAACTGC E1819-F TGATACCTTTTGCCAACACTAGGC E1819-R TGGGAGACAGAAGCCTTTCTGG E20F TGGCTCCTCTCCCCAGACCTA E20-R ACTGTGCTAAGCATGCAGAATGAC E21-F GAGAGGCCTTCACCAGGCTTAG E21-R GCCTGCCTGAAGTCATCAGATG 用于連接在第一輪擴(kuò)增產(chǎn)物兩端的具有如下序列的接頭: ADPl 點(diǎn) P-AGGACAGAAGCTCGA-U-TCGAGCTTCTGTCCT-S-T-3' ADP2 :5' P-ACCTTGAGCGATCGA-U-TCGATCGCTCAAGGT-S-T-3'; 第二輪擴(kuò)增引物包括選自下列標(biāo)簽引物中的一種或多種標(biāo)簽引物組成的引物對(duì),其中 劃?rùn)M線部分為與第一輪產(chǎn)物中連接的接頭的5'端回文區(qū)域互補(bǔ)的序列: ADPlA :GCTCATTCGAGCTTCTGTCCT ADPlB :TAGCCTTCGAGCTTCTGTCCT ADPlC :AGAGGCTCGAGCTTCTGTCCT ADPlD :TATCCTTCGAGCTTCTGTCCT ADPlE :CTCTGATCGAGCTTCTGTCCT ADP2A :GCTCATTCGATCGCTCAAGGT ADP2B :TAGCCTTCGATCGCTCAAGGT ADP2C :AGAGGCTCGATCGCTCAAGGT ADP2D :TATCCTTCGATCGCTCAAGGT ADP沈:CTCTGATCGATCGCTCAAGGT 其中,由于第二輪擴(kuò)增時(shí),祀序列兩端連接的接頭相同,用于同一樣本的正向標(biāo)簽引物 和反向標(biāo)簽引物相同。
【文檔編號(hào)】C12Q1/68GK105986015SQ201510061690
【公開(kāi)日】2016年10月5日
【申請(qǐng)日】2015年2月5日
【發(fā)明人】劉琦, 許立志, 胡小許, 鄭新, 楊文輝, 其他發(fā)明人請(qǐng)求不公開(kāi)姓名
【申請(qǐng)人】大連晶泰生物技術(shù)有限公司