專利名稱:用于多重核酸測序的標(biāo)簽及其使用方法
技術(shù)領(lǐng)域:
本發(fā)明涉及核酸測序技術(shù)領(lǐng)域,特別是多重核酸測序技術(shù)領(lǐng)域。另外,本發(fā)明還涉及標(biāo)簽及其使用方法,以及利用標(biāo)簽技術(shù)構(gòu)建測序文庫的方法。本發(fā)明的方法特別適用于第二代測序技術(shù),尤其是Illumina/Solexa測序技術(shù)。
背景技術(shù):
最早的測序文庫建庫方法只適合對單個文庫樣品進(jìn)行測序,不能將多個文庫樣品混合測序。但是隨著測序技術(shù)的發(fā)展,測序平臺的測序通量已經(jīng)遠(yuǎn)遠(yuǎn)超出了單個文庫所需要的數(shù)據(jù)量。為了實(shí)現(xiàn)多個文庫樣品混合測序,避免測序資源浪費(fèi),產(chǎn)生了多重核酸測序(Multiplex sequencing)技術(shù)。多重測序的基本理念是在姆個文庫接頭序列和插入片段之間加入一段用于識別樣品來源的標(biāo)簽序列(也稱為Index序列),在測序時,使用標(biāo)簽特異性引物,測出每個文庫的標(biāo)簽序列,根據(jù)標(biāo)簽序列不同,區(qū)分不同的文庫。以illumina公司的Illumina/Solexa測序平臺的一種樣品文庫制備方法為例(Preparing Samples for Multiplexed Paired-EndSequencing, Part#1005361Rev. B,illumina),如圖I所示,建庫過程如下首先將基因組DNA按照11111111;[的/5016130嫩樣品制備方法打斷成主帶小于50(^ロ的一系列DNA片段;然后將因打斷形成的粘性末端修復(fù)成平末端;再通過3'端加堿基“A”,使得DNA片段能與3'端帶有“T”堿基的并含有用于標(biāo)記樣品來源的標(biāo)簽序列的接頭連接;連接產(chǎn)物用電泳法選擇回收目的片段的分子量大小;然后使用PCR技術(shù)擴(kuò)增兩端帶有接頭的DNA片段并對最后的PCR產(chǎn)物進(jìn)行純化。如圖2所示,在測序時,將目的片段和標(biāo)簽序列一并測出,通過標(biāo)簽序列就可以識別樣品文庫的來源。常規(guī)多重核酸測序時,一般是利用同樣長度的標(biāo)簽(Index),混合不同文庫同時進(jìn)行測序,常常會因?yàn)闃?biāo)簽中堿基的偏向性,造成檢測插入片段時光強(qiáng)參數(shù)的波動,影響輸出的數(shù)據(jù)質(zhì)量,導(dǎo)致數(shù)據(jù)結(jié)果不可信,不能真實(shí)的反映樣品的相關(guān)信息,同時也將導(dǎo)致實(shí)驗(yàn)結(jié)果重復(fù)性低。
發(fā)明內(nèi)容
本發(fā)明基于目前illumina公司的Illumina/Solexa測序平臺提供的文庫制備方法,將一段不同長度的標(biāo)簽(核苷酸序列),例如長度呈梯度變化的核苷酸序列(即梯度標(biāo)簽)嵌入接頭(也稱為adapter)中或PCR引物中,同時考慮PCR引物的擴(kuò)增效率和數(shù)據(jù)產(chǎn)出的偏向性因素,篩選出合適的不同長度的標(biāo)簽及含該標(biāo)簽序列的接頭或PCR引物,并將該接頭用于混合樣品測序,并在此基礎(chǔ)上,利用在PCR引物中加入標(biāo)簽序列用于混合樣品測序,增強(qiáng)了該發(fā)明的靈活性和實(shí)用性。本發(fā)明將經(jīng)過篩選的不同長度的標(biāo)簽用于構(gòu)成標(biāo)簽文庫的接頭,其中所述接頭包 含所述標(biāo)簽,從而構(gòu)成各自相對應(yīng)的標(biāo)簽接頭,用作標(biāo)簽文庫的接頭。本發(fā)明還可以將經(jīng)過篩選的不同長度的標(biāo)簽構(gòu)成用于擴(kuò)增目的序列的PCR引物,其中所述PCR引物包含所述標(biāo)簽,從而構(gòu)成各自相對應(yīng)的標(biāo)簽PCR引物。標(biāo)簽設(shè)計首先需要考慮標(biāo)簽序列之間的序列差異程度和堿基識別率。在標(biāo)簽混合量少于6個樣品的情況下,必須考慮到混合后的標(biāo)簽上的每個堿基位點(diǎn)的GT含量。因?yàn)镮llumina/Solexa測序過程中,堿基G和T的激發(fā)熒光一樣,堿基A和C的激發(fā)光是ー樣的,因此必須考慮堿基“GT”含量與堿基“AC”含量的“平衡”,最后考慮數(shù)據(jù)產(chǎn)出的準(zhǔn)確性和可重復(fù)性。在設(shè)計標(biāo)簽的過程中,本發(fā)明充分考慮到以上幾個因素,同時避免了標(biāo)簽序列之間出現(xiàn)3或3個以上連續(xù)的相同堿基的出現(xiàn) ,這樣可以降低序列在合成過程中或測序過程中的錯誤率。標(biāo)簽序列本身嵌入接頭中,也要盡可能的避免出現(xiàn)發(fā)夾結(jié)構(gòu)或與測序引物及其反向互補(bǔ)序列相同的現(xiàn)象。在本發(fā)明的ー個具體實(shí)施方式
中,將不同長度的核苷酸序列(標(biāo)簽)包含在用于擴(kuò)增目的序列的PCR引物中,從而構(gòu)成各自相對應(yīng)的標(biāo)簽PCR引物,首先將總DNA樣品利用機(jī)械法或酶切法打斷成一定長度的片段。片段與接頭連接后,再通過標(biāo)簽PCR引物對目的片段進(jìn)行擴(kuò)增,最后通過瓊脂糖電泳并切膠回收目的片段文庫。在本發(fā)明的ー個具體實(shí)施方式
中,將不同長度的核苷酸序列(標(biāo)簽)嵌入現(xiàn)有文庫的接頭(例如末端)中,形成標(biāo)簽接頭(例如梯度標(biāo)簽接頭)。首先將總DNA樣品利用機(jī)械法或酶切法打斷成一定長度的片段,并在片段末端形成隨機(jī)的粘性末端,之后,與標(biāo)簽接頭進(jìn)行連接反應(yīng)。目的片段與標(biāo)簽接頭連接后,再通過特定的PCR引物對目的片段進(jìn)行擴(kuò)增,最后通過瓊脂糖電泳并切膠回收目的片段文庫。在本發(fā)明的ー個具體實(shí)施方式
中,將不同長度的核苷酸序列(標(biāo)簽)包含在用于擴(kuò)增目的序列的PCR引物中,從而構(gòu)成各自相對應(yīng)的標(biāo)簽PCR引物;同時將不同長度的核苷酸序列(標(biāo)簽)嵌入現(xiàn)有文庫的接頭(例如末端)中,形成標(biāo)簽接頭(例如梯度標(biāo)簽接頭)。首先將總DNA樣品利用機(jī)械法或酶切法打斷成一定長度的片段。之后,與標(biāo)簽接頭進(jìn)行連接反應(yīng)。目的片段與標(biāo)簽接頭連接后,再通過標(biāo)簽PCR引物對目的片段進(jìn)行擴(kuò)增,最后通過瓊脂糖電泳并切膠回收目的片段文庫。基于目前illumina公司的Illumina/Solexa測序平臺提供的文庫制備方法,本發(fā)明針對樣品建庫方法,設(shè)計了獨(dú)特的標(biāo)簽序列(例如梯度標(biāo)簽序列),通過接頭將標(biāo)簽(例如梯度標(biāo)簽)嵌入Illumina/Solexa測序文庫的3’接頭中,成功的建立了適用于Illumina/Solexa測序標(biāo)簽文庫的建庫方法,所述方法適合任何常見生物樣品(例如植物,例如擬南芥、水稻;動物,例如人、小鼠;微生物,例如大腸桿菌等)的Illumina/Solexa測序標(biāo)簽文庫構(gòu)建,并成功用于Illumina/Solexa測序,不僅增大了 Illumina/Solexa測序樣品的測序通量,而且降低了 Illumina/Solexa測序的費(fèi)用。在本發(fā)明的ー個具體實(shí)施方式
中,基于目前illumina公司提供的Illumina/Solexa測序平臺,設(shè)計ー組長度為6_8bp并以I個bp遞增的特定梯度標(biāo)簽序列,將這些梯度標(biāo)簽序列嵌入接頭序列中。考慮到Illumina/Solexa測序文庫的3’接頭(也稱為接頭
2)的連接效率,優(yōu)化并篩選出6條梯度標(biāo)簽接頭,這些梯度標(biāo)簽的長度為6、7或8個bp,并且它們之間的差異在5個堿基以上,當(dāng)梯度標(biāo)簽的6、7和8個堿基中的任意I個堿基出現(xiàn)測序錯誤或合成錯誤,都不影響到梯度標(biāo)簽的最終識別。表I為優(yōu)化篩選出來的6條梯度標(biāo)簽(Indexl-6)序列,及其對應(yīng)的梯度標(biāo)簽接頭序列(IndexN adapter2F和IndexN adapter2R, N = 1-6)信息。這些梯度標(biāo)簽及其梯度標(biāo)簽接頭可以應(yīng)用于任何Illumina/Solexa測序標(biāo)簽文庫的構(gòu)建。這些梯度標(biāo)簽應(yīng)用于Illumina/Solexa測序樣品的文庫構(gòu)建并通過Illumina/Solexa進(jìn)行測序的方法,目前尚未有報道。表llllumina/Solexa測序的梯度標(biāo)簽序列及梯度標(biāo)簽接頭2序列,其中每ー個梯度標(biāo)簽接頭2由有義序列IndexN adapter F和反義序列IndexN adapter R經(jīng)退火形成。
權(quán)利要求
1.ー組不同長度,優(yōu)選梯度長度的標(biāo)簽用于測序標(biāo)簽文庫的構(gòu)建和/或測序的用途,其中所述標(biāo)簽是一段寡聚核苷酸序列,優(yōu)選是2-100bp的核苷酸序列。
2.權(quán)利要求I所述的用途,其中將所述標(biāo)簽包含在用于擴(kuò)增目的序列的PCR引物中,從而構(gòu)成各自相對應(yīng)的標(biāo)簽PCR引物,通過PCR方法弓I入待測序序列中,所述PCR標(biāo)簽弓I物用作PCR的5’引物,或3’引物,或者同時用作PCR的5’引物和3’引物。
3.權(quán)利要求I所述的用途,其中在所述標(biāo)簽PCR引物中,所述標(biāo)簽嵌入用于擴(kuò)增目的序列的PCR引物中,或者通過或不通過連接子與用于擴(kuò)增目的序列的PCR引物的5’端或3’端相連,從而構(gòu)成各自相對應(yīng)的標(biāo)簽PCR引物。
4.權(quán)利要求I所述的用途,其中將所述標(biāo)簽包含在標(biāo)簽文庫的接頭中,從而構(gòu)成各自相對應(yīng)的標(biāo)簽接頭,所述標(biāo)簽接頭用作標(biāo)簽文庫的5’接頭,3’接頭,或者同時用作標(biāo)簽文庫的5’接頭和3’接頭。
5.權(quán)利要求I所述的用途,其中所述標(biāo)簽插入接頭中,或通過或不通過連接子連接在接頭的末端,優(yōu)選地不通過連接子連接在接頭的末端,從而構(gòu)成自相對應(yīng)的標(biāo)簽接頭。
6.權(quán)利要求I所述的用途,其中所述標(biāo)簽構(gòu)成標(biāo)簽PCR引物和標(biāo)簽接頭,同時用于測序標(biāo)簽文庫的構(gòu)建和/或測序。
7.—組不同長度,優(yōu)選梯度長度的標(biāo)簽,其用于測序標(biāo)簽文庫的構(gòu)建和/或測序。
8.ー組梯度標(biāo)簽,所述ー組梯度標(biāo)簽包括如下或由如下組成表I所示的6個梯度標(biāo)簽或者與其相差I(lǐng)個堿基的梯度標(biāo)簽中的至少2個,或至少3個,或至少4個,或至少5個,或全部6個, 所述ー組梯度標(biāo)簽優(yōu)選地至少包括表I所示的6個梯度標(biāo)簽中的Indexl和Index2,或Index3和Index4,或Index5和Index6,或者他們?nèi)魏蝺蓚€或多個的組合。
9.權(quán)利要求8所述的梯度標(biāo)簽,其中所述相差I(lǐng)個堿基包括對表I所示的6個梯度標(biāo)簽的序列中I個堿基的取代、添加或缺失。
10.權(quán)利要求8或9所述的梯度標(biāo)簽用于測序標(biāo)簽文庫,特別是Illumina/Solexa測序標(biāo)簽文庫的構(gòu)建和/或測序的用途,其中所述梯度標(biāo)簽包含在用于測序標(biāo)簽文庫,特別是Illumina/Solexa測序標(biāo)簽文庫的接頭2的5’末端中,從而構(gòu)成各自相對應(yīng)的梯度標(biāo)簽接頭2,其用作測序標(biāo)簽文庫,特別是Illumina/Solexa測序標(biāo)簽文庫的3’接頭。
11.權(quán)利要求10所述的用途,所述梯度標(biāo)簽包含在接頭2的5’末端中,包括所述梯度標(biāo)簽通過或不通過連接子與接頭2的5’末端相連,或者插入接頭2的5’末端中,優(yōu)選的是不通過連接子與接頭2的5’末端相連。
12.使用權(quán)利要求8或9所述的梯度標(biāo)簽構(gòu)建的測序標(biāo)簽文庫,特別是Illumina/Solexa測序標(biāo)簽文庫。
13.包含權(quán)利要求8所述的梯度標(biāo)簽的ー組梯度標(biāo)簽接頭2,其在5’末端包含權(quán)利要求I所述的梯度標(biāo)簽,并且優(yōu)選地用作測序標(biāo)簽文庫,特別是Illumina/Solexa測序標(biāo)簽文庫的3’接頭,所述ー組梯度標(biāo)簽接頭2包括如下或由如下組成表I所示的6個梯度標(biāo)簽接頭2或者與其中包含的梯度標(biāo)簽序列相差I(lǐng)個堿基的接頭中的至少2個,或至少3個,或至少4個,或至少5個,或全部6個, 所述ー組梯度標(biāo)簽接頭2優(yōu)選地至少包括表I所示的6個梯度標(biāo)簽接頭2中的Indexladapter2F/R 和 Index2 adapter2F/R,或 Index3adapter2F/R 和 Index4 adapter2F/R,或Index5 adapter2F/R和Index6adapter2F/R,或者他們?nèi)魏蝺蓚€或多個的組合。
14.權(quán)利要求13所述的梯度標(biāo)簽接頭2,其中所述相差I(lǐng)個堿基包括對梯度標(biāo)簽序列中I個堿基的取代、添加或缺失。
15.權(quán)利要求13或14所述的梯度標(biāo)簽接頭2用于測序標(biāo)簽文庫,特別是Illumina/Solexa測序標(biāo)簽文庫的構(gòu)建和/或測序的用途,所述梯度標(biāo)簽接頭2用作測序標(biāo)簽文庫,特別是Illumina/Solexa測序標(biāo)簽文庫的3’接頭。
16.使用權(quán)利要求13或14所述的梯度標(biāo)簽接頭2構(gòu)建的測序標(biāo)簽文庫,特別是Illumina/Solexa測序標(biāo)簽文庫,其中所述梯度標(biāo)簽接頭2用作測序標(biāo)簽文庫,特別是Illumina/Solexa測序標(biāo)簽文庫的3’接頭。
17.—種構(gòu)建測序標(biāo)簽文庫,特別是Illumina/Solexa測序標(biāo)簽文庫的方法,所述方法的特征在于使用ー組具有不同長度,優(yōu)選梯度長度的標(biāo)簽的接頭用作測序標(biāo)簽文庫,特別是Illumina/Solexa測序標(biāo)簽文庫的3’接頭。
18.權(quán)利要求17所述的方法,其包括 1)提供n個總基因組DNA樣品,所述基因組DNA樣品來自任何真核生物樣品,包括但不限于人的基因組DNA樣品; 2)打斷DNA:通過機(jī)械法打斷DNA,產(chǎn)生帶有粘性末端的DNA片段,所述機(jī)械法包括但不限于使用 Bioruptor、Hydroshear 和 Covaris ; 3)末端修復(fù)通過連接反應(yīng)將DNA片段的粘性末端補(bǔ)平; 4)末端加A:通過連接反應(yīng)在DNA片段的平末端加上一個腺嘌呤堿基A ; 5)添加5’接頭和3’接頭; 6)通過PCR對目的片段進(jìn)行擴(kuò)增,最后通過回收目的片段文庫; 7)混合當(dāng)n> I吋,將各樣品的PCR擴(kuò)增產(chǎn)物混合在一起。
19.權(quán)利要求17所述的方法,其中所述方法的特征在于使用不同的選自表I的梯度標(biāo)簽接頭2或者與其中包含的梯度標(biāo)簽序列相差I(lǐng)個堿基的接頭用作測序標(biāo)簽文庫,特別是Illumina/Solexa測序標(biāo)簽文庫的3’接頭。
20.權(quán)利要求19所述的方法,其包括 1)提供n個總基因組DNA樣品,n為整數(shù)且I彡n彡6,優(yōu)選地2彡n彡6,所述基因組DNA樣品來自任何真核生物樣品,包括但不限于人的基因組DNA樣品; 2)打斷DNA:通過機(jī)械法打斷DNA,產(chǎn)生帶有粘性末端的DNA片段,所述機(jī)械法包括但不限于使用 Bioruptor、Hydroshear 和 Covaris ; 3)末端修復(fù)通過連接反應(yīng)將DNA片段的粘性末端補(bǔ)平; 4)末端加A:通過連接反應(yīng)在DNA片段的平末端加上一個腺嘌呤堿基A ; 5)添加接頭I和梯度標(biāo)簽接頭2:通過連接反應(yīng)將接頭I和梯度標(biāo)簽接頭2與帶有A-末端的DNA片段進(jìn)行連接; 6)通過PCR對目的片段進(jìn)行擴(kuò)增,最后通過回收目的片段文庫; 7)混合當(dāng)n> I吋,將各樣品的PCR擴(kuò)增產(chǎn)物混合在一起。
21.權(quán)利要求20所述的方法,其中所述接頭I包括如下接頭5’-TACACTCTTTCCCTACACGACGCTCTTCCGATCTATCACT 和 5’ -/GTGATAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC。
22.權(quán)利要求20所述的方法,其中所述梯度標(biāo)簽接頭2包括表I所示的6個梯度標(biāo)簽接頭2或與其中包含的梯度標(biāo)簽序列相差I(lǐng)個堿基的接頭中的至少2個,或至少3個,或至少4個,或至少5個,或全部6個, 所述ー組梯度標(biāo)簽接頭2優(yōu)選地至少包括表I所示的6個梯度標(biāo)簽接頭2中的Indexladapter2F/R 和 Index2 adapter2F/R,或 Index3adapter2F/R 和 Index4 adapter2F/R,或Index5 adapter2F/R和Index6adapter2F/R,或者他們?nèi)魏蝺蓚€或多個的組合。
23.權(quán)利要求19或20所述的方法,其中所述相差I(lǐng)個堿基包括梯度標(biāo)簽序列中I個堿基的取代、添加或缺失。
24.權(quán)利要求20所述的方法,其中步驟6)中的PCR使用如下PCR引物PCR Primer I5! -AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT,和PCR Primer 25! -CAAGCAGAAGACGGCATACGAGCTCTTCCGATCT0
25.權(quán)利要求20所述的方法,其中步驟6)中回收目的片段文庫是通過瓊脂糖凝膠電泳以及切膠回收進(jìn)行。
26.權(quán)利要求19或20所述的方法,其進(jìn)ー步包括如下步驟; 8)測序?qū)⒏鳂悠返腜CR擴(kuò)增產(chǎn)物利用測序技木,特別是Illumina/Solexa測序技術(shù)進(jìn)行測序。
27.權(quán)利要求26所述的方法,其中利用測序技術(shù)進(jìn)行測序中使用的測序引物包括當(dāng)構(gòu)建DNA Pair-end文庫時,使用測序引物為 Sequencing Primerl :5' -ACACTCTTTCCCTACACGACGCTCTTCCGATCT。
28.通過權(quán)利要求17-27所述的方法構(gòu)建的測序標(biāo)簽文庫,特別是Illumina/Solexa測序標(biāo)簽文庫。
全文摘要
本發(fā)明提供了一種用于多重核酸測序的標(biāo)簽及其使用方法,基于目前illumina公司提供的Illumina/Solexa測序平臺,針對測序文庫,特別是Illumina/Solexa測序樣品建庫方法,設(shè)計了不同長度的標(biāo)簽,特別是獨(dú)特的梯度標(biāo)簽序列(index1-6),通過接頭將標(biāo)簽嵌入測序文庫,特別是Illumina/Solexa測序文庫的3’接頭中,成功的建立了測序標(biāo)簽文庫,特別是Illumina/Solexa測序標(biāo)簽文庫的建庫方法,適合任何生物的測序標(biāo)簽文庫構(gòu)建,并成功用于Illumina/Solexa測序,不僅增大了Illumina/Solexa測序樣品的測序通量,而且降低了針對Illumina/Solexa測序測序的費(fèi)用。
文檔編號C12N15/10GK102653784SQ201110050238
公開日2012年9月5日 申請日期2011年3月3日 優(yōu)先權(quán)日2011年3月3日
發(fā)明者何毅敏, 劉琳 申請人:深圳華大基因研究院, 深圳華大基因科技有限公司