一種提高基因連接測序準(zhǔn)確性的方法
【專利摘要】本發(fā)明公開了一種提高基因連接測序準(zhǔn)確度的方法,其中測序所使用的測序引物(3)或連接臂序列(4)是含有硫代修飾的核苷酸序列;使用T7核酸外切酶將未參與連接反應(yīng)的測序引物(3)全部或者部分降解;另外當(dāng)連接臂序列(4)與測序引物(3)發(fā)生連接反應(yīng)后,如果延長引物(5)的5’末端堿基未能有效與未知序列DNA模板(1)配對,可通過T7核酸外切酶降解至硫代修飾的核苷酸片段,從而將未配對的堿基有效清除。本發(fā)明的方法縮短了測序的時(shí)間,提高了連接測序的準(zhǔn)確性,使其在使用價(jià)格便宜的寡核苷酸探針試劑后,仍然維持連接測序的高準(zhǔn)確性。
【專利說明】一種提高基因連接測序準(zhǔn)確性的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明是一種實(shí)現(xiàn)了提高DNA序列分析準(zhǔn)確性的方法,具體涉及一種提高高通量基因連接測序準(zhǔn)確性的方法,屬于生物【技術(shù)領(lǐng)域】。
技術(shù)背景
[0002]全基因組DNA測序技術(shù)對從基因水平上認(rèn)識生命的差異,疾病發(fā)生、發(fā)展的規(guī)律,以及藥物與生命體的相互作用提供了技術(shù)平臺,已經(jīng)成為國際上一個(gè)競爭十分激烈的研究領(lǐng)域。全基因組DNA測序技術(shù)大體上可以分成三大類:第一類是合成測序,在堿基加入到正在延伸的DNA鏈的過程當(dāng)中進(jìn)行檢測;第二類技術(shù)則是雜交測序法,通過制備一組高密度寡核苷酸微陣列芯片的雜交信號,進(jìn)行目標(biāo)基因的序列鑒定。第三類為在單分子的水平上進(jìn)行測序的技術(shù)。實(shí)際上,目前只有合成測序方法在商業(yè)化水平上實(shí)現(xiàn)了全基因組測序,即所謂第二代高通量測序技術(shù),主要包括合成測序和連接測序兩大類。I)合成測序技術(shù)其測序化學(xué)的一個(gè)共同的策略是通過聚合酶反應(yīng),即DNA復(fù)制過程來實(shí)現(xiàn)的。其商業(yè)化儀器包括Roch (454 Life Sciences)公司采用焦磷酸測序化學(xué)技術(shù)的Genome Sequencer ?系統(tǒng);Life Technologies公司利用檢測H+濃度的離子半導(dǎo)體(1n Torrent)測序平臺;Illumina(Solexa)公司Genome Analyzer測序平臺。2)連接測序技術(shù)其測序方法是以四色突光標(biāo)記寡核苷酸探針的連接合成為基礎(chǔ),取代了傳統(tǒng)的聚合酶連接反應(yīng),使用了 DNA連接酶進(jìn)行測序。其商業(yè)化技術(shù)包括Applied Biosystems公司的SOLiD System雙堿基編碼寡核苷酸探針連接測序技術(shù)’Complete Genomics連接測序等。
[0003]連接測序是第二代高通量測序方法之一,它的最大特點(diǎn)是測序的高準(zhǔn)確性(尤其在雙編碼探針測序中,該方法可以區(qū)分測序錯(cuò)誤與單堿基多態(tài)性(SNP),當(dāng)然它的最大不足使測序長度相對于延伸合成測序方要短很多。然而,即使有閱讀片段短的不足,但在使用價(jià)格便宜的寡核苷酸探針試劑后,該測序技術(shù)仍然在RNA、基因組重測序等應(yīng)用方面方面獲得了廣泛的應(yīng)用,并最有可能推向臨床應(yīng)用。價(jià)格便宜的組合寡核苷酸探針連接測序方法中每個(gè)測序引物測定10個(gè)堿基序列:首先利用分別在第1、2、3、4、5位置標(biāo)識堿基的探針與第一個(gè)測序引物進(jìn)行連接反應(yīng),測定DNA模板對應(yīng)的第1、2、3、4、5位置堿基信息;而當(dāng)需要測定DNA模板6~10位置堿基信息時(shí),先在第一個(gè)測序引物上連接一個(gè)非標(biāo)記的連接臂序列,向外延伸了 5個(gè)堿基,然后再采用測定第1、2、3、4、5位置堿基的方法將6、7、8、9、10位置的堿基信息確定。很明顯在進(jìn)行第6、7、8、9、10位置的堿基序列測定時(shí),由于未能對連接失敗的延長引物進(jìn)行有效處理,會出現(xiàn)不同步引物,以及末端發(fā)生錯(cuò)配的堿基序列,從而影響連接測序的準(zhǔn)確性。為了降低錯(cuò)誤信號,目前采用的方法是將測序引物與連接臂序列進(jìn)行多次連接反應(yīng),盡可能使測序引物與連接臂完全發(fā)生反應(yīng)。然而,這樣處理一方面大大增加了測序的操作時(shí)間,另一方面,有限次的連接反應(yīng)也不能完全消除測序錯(cuò)誤。
[0004]T7核酸外切酶作用于雙鏈DNA,沿5r — 3r方向催化去除5'單核苷酸,它既能從5'末端起始消化,也能從雙鏈DNA的切刻或缺口處起始消化。它既能降解5'端磷酸化DNA,也能降解5'端去磷酸化DNA。該酶的另一個(gè)特點(diǎn)是降解受阻于連續(xù)4個(gè)或者四個(gè)以上硫代修飾的核苷酸序列(參見:Nikiforov T T, et al.硫代磷酸引物的使用和外切核酸酶水解制備單鏈PCR產(chǎn)物用于固相雜交檢測.基因組研究.1994 3: 285-291; Hsu H L, et al.用于強(qiáng)化多個(gè)病原體定量檢測和鑒定的單鏈多重聚合酶鏈反應(yīng)擴(kuò)增產(chǎn)物懸浮微珠陣列.分析化學(xué).2013,85,5562 - 5568),文獻(xiàn)中利用該酶的這一特點(diǎn),將PCR中的其中一條引物的5’端進(jìn)行硫代修飾,得到的PCR產(chǎn)物通過T7核酸外切酶切割另一條未進(jìn)行硫代修飾的單鏈,最后得到硫代修飾的單鏈DNA用于核酸序列的雜交分析。即目前T7核酸外切酶與硫代修飾DNA鏈的配合運(yùn)用的目的是用于制備單鏈DNA,并未用于測序,因此與本發(fā)明的目的存在較大差異。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的是有選擇性地對未參與連接反應(yīng)的測序引物進(jìn)行降解,或者降解延長引物5’末端錯(cuò)配堿基,從而清除不同步測序引物,修正未完全雜交的測序引物,提高連接測序的準(zhǔn)確性,使其在使用價(jià)格便宜的寡核苷酸探針試劑后,仍然維持連接測序的高準(zhǔn)確性。
[0006]本發(fā)明中的提高基因連接測序準(zhǔn)確性的方法,方法為:測序引物與固定在固相載體上的未知序列DNA模板雜交后,再與連接臂序列進(jìn)行連接反應(yīng),由測序引物與連接臂序列共同組成的延長引物與連有熒光標(biāo)記的探針連接,然后進(jìn)行測序,所述的測序引物或者連接臂序列是含有硫代修飾的核苷酸序列;使用T7核酸外切酶將未參與連接反應(yīng)的測序引物全部或者部分降解,其中全部降解的測序引物被清除,而部分降解的測序引物通過提高溫度被變性清除;另外當(dāng)連接臂序列與測序引物發(fā)生連接反應(yīng)后,如果延長引物的5’末端堿基未能有效與未知序列DNA模板配對,可通過T7核酸外切酶降解至硫代修飾的核苷酸片段,從而將未配 對的堿基有效清除。
[0007]所述的測序引物或者連接臂序列中硫代修飾核苷的個(gè)數(shù)為連續(xù)4個(gè)或者4個(gè)以上。
[0008]所述的探針為單堿基標(biāo)記序列和雙堿基編碼標(biāo)記序列。
[0009]與現(xiàn)有技術(shù)相比,本發(fā)明的最大優(yōu)點(diǎn)是使用硫代修飾的測序引物或連接臂序列與T7核酸外切酶相互配合進(jìn)行連接測序,消除了連接測序反應(yīng)中測序引物不同步,即測序反應(yīng)中存在兩種不同測序引物的問題,減少了基因連接測序的步驟,縮短了所需的時(shí)間,大大提高測序反應(yīng)的準(zhǔn)確性,解決了一直以來本領(lǐng)域的技術(shù)人員想解決但是未能解決的技術(shù)問題。并且在使用價(jià)格便宜的寡核苷酸探針試劑后,仍然維持連接測序的高準(zhǔn)確性,降低了基因連接測序的成本。
【專利附圖】
【附圖說明】
[0010]圖中:DNA模板1,固相載體2,測序引物3,連接臂序列4,延長引物5,探針6,熒光標(biāo)記7。
[0011]以下將結(jié)合附圖對本發(fā)明作進(jìn)一步說明。
[0012]圖1是本發(fā)明一種提高基因連接測序準(zhǔn)確性的方法(沿測序引物的3’ - 5’)示意圖。
[0013]圖1中,未知序列的DNA模板I固定到固相載體2上,5 ’端磷酸化修飾的測序引物3(即為5’ - PO/—-CACCGACTGCCCATA,參見表1)與DNA模板I雜交反應(yīng)后,與連接臂序列4(即為5’ -NsNsNsNsNNN,參見表1)進(jìn)行連接反應(yīng)(a);加入T7核酸外切酶進(jìn)行酶切反應(yīng)(b)降解未發(fā)生連接反應(yīng)的測序引物3,經(jīng)過T7核酸外切酶酶切后,便全部降解掉,而連接連接臂序列4后構(gòu)成的延長引物5的5’端核苷由于被硫代修飾,所以堿基被保護(hù),不能被T7核酸外切酶降解。如連接臂序列4為5’-NNNNsNsNsNsNN (參見表1 ),則由其組成的延長引物5經(jīng)過T7核酸外切酶酶切后,便降解掉5’端的三個(gè)NNN堿基。最后加入T4激酶將延長引物5的5’端磷酸化(C),然后加入連有5’端熒光標(biāo)記7的寡核苷酸探針6進(jìn)行連接測序反應(yīng)⑷。
[0014] 圖2是本發(fā)明一種提高基因連接測序準(zhǔn)確性的方法(沿測序引物的5’ - 3’)示意圖。
[0015]圖2中,未知序列的DNA模板I固定到固相載體2上,硫代修飾的測序引物3 (BP為5’ -CACCGACTGSCSCSCSATA,參見表1)與DNA模板I雜交反應(yīng)后,與3’、5’均經(jīng)磷酸化修飾的連接臂序列4 (即為5’ -P043^-NNNNNNN- PO43'參見表1)進(jìn)行連接反應(yīng)(a);之后加入T7核酸外切酶進(jìn)行酶切(b)降解未發(fā)生連接反應(yīng)的測序引物3,酶切后,便降解成5’-GsCsCsCsATA,而連接連接臂的延長引物 5 的序列為 5’-CACCGACTGsCsCsCsATANNNNNNN_P043—便降解成5’-GsCsCsCsATANNNNNNN-P0廣,通過溫度控制的熱變性(如將溫度提高至30°C ),序列5’-GsCsCsCsATA便從DNA模板I上變性去除掉,而延長引物5序列5’_GSCSCSCSATANNNNNNN_PO43-則繼續(xù)保持與DNA模板I的雜交形式,供探針6連接測序使用;之后加入T4多聚核苷酸激酶將延長引物5的5’端去磷酸化(C),然后加入3’端連有熒光標(biāo)記7、且5’端磷酸化的寡核苷酸標(biāo)記探針6進(jìn)行連接測序反應(yīng)(d)。
【具體實(shí)施方式】
[0016]實(shí)施例1:利用組合探針高通量連接測序測定人全基因組部分區(qū)域序列。
[0017]1、將人基因組經(jīng)超聲破碎成大小為50-1000堿基片段,并在連接酶的作用下將這些片段化核酸序列用一對序列已知的通用連接子進(jìn)行連接,并進(jìn)行預(yù)擴(kuò)增10個(gè)循環(huán);然后凝膠電泳切割200-800bp DNA片段,并純化。將這些200-800 bp DNA片段與固定其中一個(gè)連接子互補(bǔ)序列的微珠進(jìn)行乳液并行PCR反應(yīng),擴(kuò)增片段化的人基因組片段,并變性得到人基因組測序DNA模板1,將這些擴(kuò)增DNA模板的微珠固定到平面固相載體2上,通過標(biāo)記序列與基因組測序DNA模板I雜交,掃描,確定所有人基因組測序DNA模板I在平板固相載體2上的位置。最后,加入SM的尿素,在60°C下變性,將雜交的標(biāo)記序列從基因組模板上清除,得到位置已知的所有測序DNA模板I。
[0018]2、加入測序引物3 (即為:5’_ PO/_-CACCGACTGCCCATA,參見表1)與人基因組測序DNA模板I雜交,在沿著測序引物3’到5’方向的連接測序中,加入第I組四色熒光標(biāo)記7的探針6 (參見表2),在T4連接酶及其反應(yīng)體系中,16°C下連接反應(yīng)30分鐘,然后用緩沖液洗滌清除未參與反應(yīng)的探針6,掃描記錄每個(gè)位置上模板對應(yīng)的四色熒光信號,并取其四個(gè)熒光信號中強(qiáng)度最強(qiáng)的信號對應(yīng)的堿基為該位置DNA模板I上第I個(gè)堿基的測序信息。
[0019]3、加入8M的尿素,在60°C下變性,將上步測序引物3與探針6發(fā)生連接反應(yīng)的產(chǎn)物從基因組模板上清除,并用緩沖液洗滌。
[0020]4、重復(fù)步驟2和步驟3,分別加入第2、3、4、5組四色標(biāo)記的連接探針6(參見表2),分別測定每個(gè)位置模板上的第2、3、4、5個(gè)堿基的信息。
[0021]5、加入測序引物3與人基因組測序DNA模板I雜交,加入硫代修飾的接臂序列4(即為:5’ -NsNsNsNsNNN,參見表1),在T4連接酶及其反應(yīng)體系中,16°C下連接反應(yīng)30分鐘,然后用緩沖液洗滌清除未參與反應(yīng)的連接臂序列4。
[0022]6、加入T7核酸外切酶,在37°C下酶切反應(yīng)30分鐘,然后用緩沖液洗滌。將未與連接臂序列發(fā)生連接反應(yīng)的測序引物3降解;而連接連接臂序列4的延長引物5的5’端由于硫代修飾堿基而被被保護(hù),不能被T7核酸外切酶降解,被保留下來,作為唯一的測序引物用于用于第7步驟的連接測序。
[0023]7、加T4激酶及其反應(yīng)體系中,在37°C下連接反應(yīng)30分鐘,將連接連接臂序列4的延長引物5的5’端磷酸化。
[0024]8、加入第I組四色熒光標(biāo)記7的探針6(參見表2),在T4連接酶及其反應(yīng)體系中,16°C下連接反應(yīng)30分鐘,然后用緩沖液洗滌清除未參與反應(yīng)的探針6,掃描記錄每個(gè)位置上模板對應(yīng)的四色熒光信號,并取其四個(gè)熒光信號中強(qiáng)度最強(qiáng)的信號對應(yīng)的堿基為該位置模板上第6個(gè)堿基的測序信息。
[0025]9、加入SM的尿素,在60°C下變性,將上步連接測序反應(yīng)的延伸標(biāo)記引物從基因組模板上清除,并用緩沖液洗滌。
[0026]10、重復(fù)步驟8-步驟11,分別加入第2、3、4、5組四色標(biāo)記的連接探針6 (參見表2),分別測定每個(gè)位置模板上的第7、8、9、10個(gè)堿基的信息。
[0027]這樣就檢測得到基因組中若干10堿基序列片段的信息。
[0028]表1幾種硫代修飾測序引物與連接臂示意
【權(quán)利要求】
1.一種提高基因連接測序準(zhǔn)確性的方法,方法為:測序引物(3)與固定在固相載體(2)上的未知序列DNA模板⑴雜交后,再與連接臂序列(4)進(jìn)行連接反應(yīng),由測序引物(3)與連接臂序列(4)共同組成的延長引物(5)與連有熒光標(biāo)記(7)的探針(6)連接,然后進(jìn)行測序,其特征在于所述的測序引物(3)或者連接臂序列(4)是含有硫代修飾的核苷酸序列;使用T7核酸外切酶將未參與連接反應(yīng)的測序引物(3)全部或者部分降解,其中全部降解的測序引物被清除,而部分降解的測序引物(3)通過提高溫度被變性清除;另外當(dāng)連接臂序列(4)與測序引物(3)發(fā)生連接反應(yīng)后,如果延長引物(5)的5’末端堿基未能有效與未知序列DNA模板(I)配對,可通過T7核酸外切酶降解至硫代修飾的核苷酸片段,從而將未配對的喊基有效清除。
2.如權(quán)利要求1所述的一種提高基因連接測序準(zhǔn)確性的方法,其特征在于所述的測序引物(3)或者連接臂序列(4)中硫代修飾核苷的個(gè)數(shù)為連續(xù)4個(gè)或者4個(gè)以上。
3.根據(jù)權(quán)利要求1所述的一種提高基因連接測序準(zhǔn)確性的方法,其特征在于所述的探針(6 )為單堿基標(biāo) 記序列或雙堿基編碼標(biāo)記序列。
【文檔編號】C12Q1/68GK103993100SQ201410269782
【公開日】2014年8月20日 申請日期:2014年6月17日 優(yōu)先權(quán)日:2014年6月17日
【發(fā)明者】肖鵬峰, 何磊 申請人:東南大學(xué)