專利名稱::對多核苷酸模板進行測序的方法
技術(shù)領(lǐng)域:
:本發(fā)明涉;5Lxt雙鏈多核苷酸模板進行成對測序的方法,本方法可以確定多核苷酸模板上兩個不同且分開的區(qū)域中的核苷酸序列。
背景技術(shù):
:有關(guān)生物分子研究的m,部分是由于用來表征分子或其生物反應(yīng)的技術(shù)改進所致。特別的,對核酸DNA和RNA的研究受益于序列分析技術(shù)的HUS5302509描述了一種對多核苷酸;j^板測序的方法,該方法包括4吏用DNA聚合酶或DNA連接酶連續(xù)摻入與模板鏈互補的經(jīng)標記核普酸或多核普酸而實施的多延伸反應(yīng)。在這種"合成測序(sequencingbysyndesis)"反應(yīng)中,通過連續(xù)摻入與模板鏈互補的單個核苷酸以5,到3,的方向構(gòu)建了一條與模板M基配對的新核苷酸鏈。將測序反應(yīng)使用的核苷三磷酸底物封閉以防止過度摻入,差異標記核苷三磷酸底物以使得能夠確定作為后續(xù)核苷酸被加入的摻入核苷酸的種類。為了進行準確測序,可以將可逆的鏈終止結(jié)構(gòu)性修飾或"封閉基團(blockinggroup),,添加到底物核苷酸,以保證核苷酸以受控方式一次摻入一個。每摻入一個單核苷酸,封閉基團即阻止任何其它核普酸再摻入進多核苷酸鏈。一旦確定了最后摻入的標記核苷酸的種類,就除去標記部分和封閉基團,允許下一個封閉的標記核苷酸在隨后的測序運行中被摻入。在某些的情況下(特別是在當使用封閉的經(jīng)標記核苷酸時),可以通過使用合成測序(sequencing-by-synthesis)技術(shù)可靠獲得的測序數(shù)據(jù)的量可能是有限的。在一些情況下,測序"運行(mn)"可能限于允許與人類基因組進行序列重新比對的一些威基,通常大約25-30個摻入循環(huán)。盡管,此長度的測序運行非常有用(特別是在,例如SNP分析和基因分型中的應(yīng)用),但在很多情況下,能夠可靠的獲取同一個模板分子另外的序列數(shù)據(jù)是有利的。"配對末端(paired-end)"和"成對(pairwise)"測序技術(shù)在分子生物學領(lǐng)域是公知的,特別是在全基因組鳥槍測序法的情況下(SiegelA.F.etal"Genomics.2000,68:237-246;RoachJ.C.etal.,Genomics.1995,26:345-353.)。配對末端測序允許確定來自一條多核苷酸雙鏈兩個位置的序列的兩個"讀取(read)"。配對末端法的優(yōu)點在于,對單個模板上兩段"n,,堿基序列的每段進行測序比以隨機方式對兩個獨立模板上的"n"4序列的每段進行測序明顯能得到更多的信息。使用合適的序列信息集合的軟件工具(MillkinS.C.etal"GenomeRes.2003,13:81-卯;Kent,E.J.etal"GenomeRes.2001,11:1541-8),就有可能利用以下知識,即"配對末端"序列并非完全隨機,而是已知發(fā)生在單個雙鏈上,并且因此在基因組中是相連或成對的。該信息已顯示出非常有助于將全基因組的序列組合成一致的序列。來實施。在特異性單位點切割載體后,將待測序模板DNl^i常是基因組DNA)插入到載體中,末端重新封閉形成新構(gòu)建物。插入DNA側(cè)翼的載體序列包含序列引物的結(jié)合位點,所述引物允許對相反鏈上的插入DNA進行測序。該方法的缺點在于它需要對DNA模板進行費時的克隆,并且需要在合適的測序載體中進行測序。此外,因為需要將DNA模板克隆到載體中以使得將序列引物的結(jié)合位點設(shè)置于所述模板片段的兩端,所以利用基于陣列的測序技術(shù)非常困難。使用基于陣列的技術(shù),通常只可能從核普酸模板的一端進行測序,這經(jīng)常是鄰近與陣列相連接的點的末端。WO2004/070005中描述了一種對多核普酸模板進行雙末端測序的方法,它可在固體支持物上實施。該方法依賴于在單個引物雜交步驟中將兩個或多個引物同時與靶標多核苷酸雜交。在所述雜交步驟之后,除一個引物之外,封閉其它所有與模板雜交的引物,該未被封閉的引物具有作為第一個測序反應(yīng)起點的游離3,端幾基。測序一直進行到不可能再有鏈伸長,或者終止測序反應(yīng)。接著將被封閉引物中的一個解除封閉以得到游離3,羥基并從此起始點進行另一個測序反應(yīng)。這樣,所述;^板保持完好并始終連接在固體支持物上?;诜忾]及未封閉引物雜交的此方法的主J^:陷在于如果需要對雙鏈核酸模板互補鏈上的兩個區(qū)域進行測序,則必須在單個雜交步驟中將引物與所述^^的兩個互補鏈雜交。由于模板的兩M都保持完好并連接在固體支持物上,因此將引物與^^板鏈上的相應(yīng)序列雜交一般來說不利于模板兩條互補鏈通過退火形成雙鏈。該方法的另一個缺陷是需要確保第一個引物的化學封閉以允許對第二個引物進行測序。應(yīng)用中所描述的非固定化珠的特征意味著從所*上除去引物并不簡單,因此除非第一個引物被完全封閉,否則測序就不是最優(yōu)的。WO98/44151和WO00/18957都描述了一種核酸擴增的方法,其允許擴增產(chǎn)物被固定在固體支持物上以形成由簇或"集群(colony)"構(gòu)成的陣列,所述蔟或"集群"是由多個相同的固定化多核苷酸鏈和多個相同的固定化互補鏈形成的。在根據(jù)這些方法制備的成簇陣列上的DNA集群中存在的核酸分子可以為測序反應(yīng)提供模板,例如,如WO98/44152中所述,但是到目前為止,從每個集群中的一種固定化鏈只能獲得單測序讀取。
發(fā)明內(nèi)容本發(fā)明人開發(fā)了一種對雙鏈多核苷酸模板(包括成簇陣列上的雙鏈模板,如本文中所述的那些)進行配對末端測序或成對測序的方法。術(shù)語成對測序是指通過對靶標多核苷酸雙鏈中同一條鏈上或互補鏈上兩個不同區(qū)域測序獲得的一對讀取。使用本發(fā)明的方法,有可能從成簇陣列上的每個雙鏈模板獲取兩個相連或成對的讀取,而不是像現(xiàn)有技術(shù)方法一樣只能獲得單個測序讀取。根據(jù)本發(fā)明,提供了一種對靶標雙鏈多核苷酸第一和第二區(qū)域進行成對測序的方法,其中所述第一和第二區(qū)域在同一靶標雙鏈多核普酸上,該方法包括(a)提供一種固體支持物,其上已固定了多個雙^^板多核普酸,每個多核苷酸都是由5,端連接在所述固體支持物上的互補的第一和第二模板鏈形成的;(b)對所述多個雙鏈模板多核苷酸進行處理,4吏所述雙鏈模板多核普酸變性以4吏得測序引物雜交;(c)將第一測序引物與(b)部分產(chǎn)生的^^鏈中的一個雜交;(d)通過將核苷酸依次加至第一測序引物來進行第一測序反應(yīng),以產(chǎn)生第一延伸測序引物并確定第一模板鏈中靶標多核苷酸的第一區(qū)域的序列;(e)除去步驟(d)中的所述第一延伸測序引物;(f)將第二測序引物與所述^^L鏈中的一個雜交;和(g)通過將核苷酸依次加至第二測序引物進行第二測序反應(yīng),產(chǎn)生第二延伸測序引物并確定所述乾標多核苷酸第二區(qū)域的序列,其中對所述靼標多核苷酸第一和第二區(qū)域序列的確定實現(xiàn)了對所述靶標雙鏈多核苷酸的所述第一和第二區(qū)域的成對測序。在一個實施方案中,初始多核苷酸雙鏈的兩條鏈都保持固定化,具有不同序列的兩個引物被用來進行每個測序運行。步驟(b)和(e)可包括熱處理或化學處理(如0.1M氳氧化鈉),以使得結(jié)合在支持物表面的雙鏈多核苷酸變性。在另一個實施方案中,也可將所述靶標雙鏈多核苷酸制備成包含夾在兩個序列未知的區(qū)域之間的已知序列區(qū)。所述已知序列可包含限制性核酸內(nèi)切酶的識別位點。限制性核酸內(nèi)切酶的切割會形成兩個獨立的多核普酸,每個都通過5,端固定。接著所述兩個多核苷酸可被置于變性條件下,得到兩個通過5,端固定的單鏈多核苷酸。每個單鏈多核苷酸可以被依次測序,以使得從所述一個初始靶標中得到兩個獨立的讀取。在另一個實施方案中,也可將所述靶標雙鏈多核苷酸制備成包含夾在兩個序列未知的區(qū)域之間的已知序列區(qū)??梢詫⑺龉潭ɑ嗪塑账岬囊欢藦乃霰砻媲懈钕聛?,將所得的多核苷酸變性。通過5,端固定的所得單鏈多核苷酸包含兩個不同的能夠與測序引物雜交的區(qū)域;可以依次獲得兩個讀取。圖1是配對末端讀取的示意圖。在該過程中,第一寡核苷酸(寡核苷酸l)與待測序模板雜交,用于引發(fā)第一測序運行(第l運行,25個循環(huán)的單堿基測序(singlebasesequencing,SBS))。接著將寡核苷酸l從所述模板上除去,將第二引物(寡核苷酸2)與相同模板的不同區(qū)域雜交,用于引發(fā)第二測序運行(第2運行,25個循環(huán)的單堿基測序)。結(jié)果是從相同^板的不同位置得到兩個測序讀取。圖2是五種不同模板序列混合物的測序反應(yīng)結(jié)果,所述序列被擴增形成蔟o圖3是測序反應(yīng)的結(jié)果。所顯示的圖〗象是由A摻入所產(chǎn)生的。92%的運行1的簇與運行2中相對應(yīng)(align)。運行2中大于99%的被檢測到。圖4是用未知序列之間的已知序列來構(gòu)建多核苷酸分子的方法的圖示,其中限制性酶被用于生成雙標簽序列(載體-靶標-靶標-載體),其中所述片段兩末端之間的中間區(qū)域被切除。圖5是在不使用限制性酶的情況下確定長的未知多核苷酸區(qū)域的成對讀取方法之示意圖。圖6是樣品制備方法的示意圖,所述樣品用于從任意長度片段的兩個末端獲得成對讀取。該方法使用生物素化的接頭來分離包含所述接頭的成環(huán)插入物。接著可以切割所述環(huán)形插入物,使用另外的接頭重新環(huán)化形成包含兩個接頭區(qū)域的更小尺寸的環(huán)??梢允褂冕槍Φ谝粋€接頭的選擇性引物擴增所述環(huán),生成適于擴增的線性^^L。圖7是樣品制備方法的示意圖,所述樣品用于從任意長度片段的兩個末端獲得成對讀取。該方法使用生物素化的接頭來分離包含所述接頭的成環(huán)插入物,接著將所述環(huán)片段化并進行處理使得所述末端也包含允許隨后擴增和測序的接頭。圖8是;^發(fā)明方法的示意圖,其中所述中間已知區(qū)域包含一個特定限制性酶的酶切位點。經(jīng)所述限制性酶處理后,可以從擴增片段的中間區(qū)域獲得兩個測序讀取。更特別的,可以從所述固定化雙鏈的每M獲得一個讀取。圖9是樣品制備的示意圖,所述樣品適于獲得任意長度片段的一對讀取。該方法基于用受控量的dUTP擴增所述片段,由此引入低水平的修飾,所述修飾使片段可以被隨機切割(即在尿嘧咬g隨機插入的地方切割)。所述切割片段可以重新連接成環(huán)并被擴增,以使得初始PCR片段的兩個末端連接在一起而中間M被切割掉。圖10;i樣品制備的示意圖,所述樣品適于獲得任意長度片段的一對讀取。該方法是基于將初始樣品中鳥噪呤g氧化至低水平,由此引入低水平的修飾,所述修飾使得片段可以被隨機切割(即在鳥嘌呤g隨機氧化的地方切割)。所述切割片段可以重新連接成環(huán)并被擴增,以使得初始PCR片段的兩個末端連接在一起而中間g被切割掉。圖ll是樣品制備的示意圖,所述樣品適于獲得任意長度片段的一對讀取。該方法是基于將初始樣品中鳥噤呤g氧化至低水平,由此引入低水平的修飾,所述修飾使得片段可以被隨機切割(即在鳥噤呤4^隨機氧化的地方切割)。如果使用除去8-氧代鳥噤呤堿基的酶切開載體-靶標連接環(huán),那么只有靶標片段的末端仍然連接在所述載體上??梢赃B接一個新的接頭序列以重新封閉露出(polished)的末端,產(chǎn)生具有兩個來自初始載體的已知末端的片段,兩個末端分別來自靶標片段和中間接頭序列。該片段可以通過使用與所述初始載體的所述末端互補的引物進行擴增來線性化。圖12顯示了所附實施例中用于固相擴增的示例性雙鏈DNA模板的結(jié)構(gòu)和序列。擴增引物P5和P7的序列以粗體顯示。發(fā)明詳述本發(fā)明提供了對靶標雙鏈多核苷酸模板的兩個區(qū)域進行測序的方法,所述區(qū)域在本文中稱為進行序列測定的第一和第二區(qū)域。進行序列測定的第一和第二區(qū)域既可以在雙鏈多核苷酸模板的同一條鏈上,也可以在互補鏈上,所述互補鏈在本文中分別稱為第一和第二模板鏈。本發(fā)明方法的起點是提供以擴增簇形式固定于固體支持物上的多個模板多核苷酸雙鏈體,如W09844151和WO00018957中所述,其內(nèi)容以參考形式合并入本文。特定蔟中的每一個雙鏈體都包含相同的待測序雙鏈靶標區(qū)域。每個雙鏈都是由互補的第一和第二模板鏈形成的,它們都在5,末端或接近5,末端的地方連接在固體支持物上。通常,所述^l^板多核普酸雙鏈體將以成簇陣列的形式提供。WO07010252也描述了從每個簇上讀取第一和第二;j^^鏈的方法,但它的缺點是每個蔟中只有一半的鏈被測序。這降低了測序讀取的信號強度。本文所述的方法允許對每個簇中每^^本上所有的拷貝進行測序,因此,比之前的方法產(chǎn)生的信號更強。本方法的這個性質(zhì)賦予了信號檢測更高的靈敏性,這就意味著相比現(xiàn)有技術(shù)可以從更小的簇上獲得更長的讀取。當提到分子(如核酸)固定化或連接到固體支持物上時,術(shù)語"固定化(immobilised)"和"連接"在本文中可以互換使用,除非另有明確指出或通過上下文指出,否則兩個術(shù)語都旨在包括直接或間接,共價或非共價的連接。在本發(fā)明的某些實施方案中,共價連接可能是優(yōu)選的,但是一般來說,只要求在計劃使用所述支持物的條件下(例如在需要核酸擴增和/或測序的應(yīng)用中)分子(如核酸)保持固定化或連接在支持物上。本發(fā)明的某實施方案可能利用包含"官能化的"惰性基底或基質(zhì)的固體支持物(例如,玻璃片、聚合物珠等),所述官能化例如通過施加中間材料的層或覆層來實現(xiàn),所述中間材料包含可以與生物分子(如多核苷酸)共價連接的反應(yīng)性基團。這些支持物的實例包括但不僅限于惰性基底(如玻璃)上所支持的聚丙烯酰胺M膠。在這些實施方案中,所述生物分子(如多核苷酸)可以直接共價連接于所述中間材料上(如水凝膠),但所述中間材料本身可以非共價連接于基底或基質(zhì)(如玻璃基底)上。因此術(shù)語"共價連接在固體支持物上"可以理解為包括這類排列。根據(jù)上下文,本文提到的特定核酸序列也可以指包含該核酸序列的核酸分子,這對于本領(lǐng)域的讀者來說是顯而易見的。靶標片段的測序意味著建立按時間順序的4讀取。然而,堿基不需要是連續(xù)的,也不是必須對整個片段上每一個M進行測序。隨后的段落更詳細的描述了本發(fā)明的不同方面。除非有相反地明確指出,否則本發(fā)明的每個方面可以和本發(fā)明的其它任何一個或多個方面相結(jié)合。特別是,任何被指為特別的、優(yōu)選的或有利的特征也可以和其它一個或多個被指為特別的、優(yōu)選的或有利的特4^目結(jié)合。根據(jù)本發(fā)明,術(shù)語"靶標核酸序列"、"靶標核酸分子"、"靶標核酸"和"靶標核酸片段"可以互換使用以指代陣列上需要被測序的核酸分子。靶標核脧基本上可以是任何已知或未知序列的核酸。例如,它可以是基因組DNA或cDNA的片段。測序可以確定乾標分子的全部序列或一部分序列。所述把標可以來源于已被隨機片段化的初始核酸樣品??梢酝╥t^每個靶標片段末端安置通用擴增序列而將所述靼標加工成適合擴增的^板。還可以通過逆轉(zhuǎn)錄成cDNA而從原始的RNA樣品中得到所述靼標。如本文中所使用的,術(shù)語"多核苷酸"是指脫氧核糖核酸(DNA),但是在合適時,本領(lǐng)域技術(shù)人員會了解該方法也可用于核糖核酸(RNA)。類似物,并且適用于單鏈(如有義鏈或反義鏈)和雙鏈多核苷酸。本文中所用的該術(shù)語也包括cDNA,即由RNA模板生成的互補或拷貝DNA,例如,通過逆轉(zhuǎn)錄酶的作用生成。初始多核苷酸分子可來源于雙鏈DNA(dsDNA)形式(如基因組DNA片段,PCR或擴增產(chǎn)物等)或者來源于單鏈形式,如DNA或RNA,并被轉(zhuǎn)化成dsDNA形式。例如,使用該領(lǐng)域熟知的標準技術(shù),mRNA分子可以復(fù)制成適用于本發(fā)明方法的雙鏈cDNA。初始多核苷酸分子的確切序列通常對本發(fā)明不重要,它可以是已知的或未知的。在一個特定的實施方案中,初始多核苷酸分子為DNA分子。更特別的,初始多核苷酸分子代表生物體的全部遺傳互補序列(geneticcomplement),是包含內(nèi)含子和外顯子序列(編碼序列)以及非編碼調(diào)控序列(如啟動子和增強子序列)的基因組DNA分子。在一個使用基因組DNA分子的實施方案中,可以實現(xiàn)基因組水平的分析或?qū)φ麄€基因組的分析。然而,可以想象也可以使用多核苷酸序列或基因組DNA的特定子集,例如特定的染色體。更特別的,初始多核苷酸分子序列是未知的。再特別的,初始多核苷酸分子是人類基因組DNA分子。可以在任意隨機片段化過程之前或之后,以及在接頭序列連接之前或之后,化學或酶處理所述DNA靶標分子。隨機片段化是指以無序方式通過酶、化學以及機械方法等進行的多核苷酸分子片段化。這種片段化方法在該領(lǐng)域廣為人知,并可4吏用標準方法(SambrookandRussell,MolecularCloning,ALaboratoryManual,ThirdEdition)。為了清j^見,通過特異性PCR擴增較小片段而生成較大核酸的較小片段并不等同于大片段核酸的片段化,這是因為較大核酸仍保持完好(即并未因為PCR擴增而片段化)。而且,隨機片段化是設(shè)計用來與包含斷裂和/或斷裂附近的序列特性或位置無關(guān)地生成片段。更特別的,隨機片段化是通過機械方式(例如霧化或超聲)實現(xiàn)的,生成長度大約50個4^&對到約1500個M對的片段,更特別的是長50-700個4^對,再特別的是長50-400個4^f。最特別的,本方法用來生成長度在50-150個>5^}"的較小片段。多核苷酸通過機械方法(如霧化、超聲和水力剪切等)的片段化得到具有平末端以及3,和5,突出端的非均質(zhì)的片段混合物。因此,需^^吏用該領(lǐng)域已知的方法或試劑盒(如LicgenDNA終止子末端修復(fù)試劑盒)修復(fù)片段末端,從而生成最適于插入的末端,例如,插入到克隆載體的平端位點。在一個具體實施方案中,所述核酸集群的片段末端被平末端化,更特別的,所述片段末端是平末端化并且磷酸化的??梢酝ㄟ^酶處理(例如使用多核苷酸激酶)引入磷酸部分。在一個具體實施方案中,用單突出核苷酸通過例如某種類型的DNA聚合酶活性來制備所述乾標多核苷酸序列,所述DNA聚合酶如Taq聚合酶或Klenow無外切型(exominus)聚合酶,它們具有非模板依賴性末端轉(zhuǎn)移酶活性,可以將單個脫氧核苷酸(例如脫氧腺普(A))添加到如PCR產(chǎn)物的3,末端。這些酶可以用來將單核苷酸"A"添加到靶標多核普酸雙鏈每條鏈的平端化3,端。因此,可以通過與Taq聚合酶或Klenow無外切型聚合酶的反應(yīng)將"A"添加到靶標多核苷酸雙鏈體每個末端修復(fù)鏈的3,端,同時所述接頭多核苷酸構(gòu)建物可以是T構(gòu)建物,其在所述接頭構(gòu)建物的每個雙鏈區(qū)3,端具有相容的"T"突出。此末端修飾還阻止載體和耙標的自連接,使得偏好于形成組合連接的接頭-靶標序列。可以對任意長度片段獲得成對讀取,例如2-10kb的PCR擴增子或分離自細菌或其它生物來源的DNA克隆。粑標可以是大約40kb的噬菌粒分子的末端或大約100-200kb的細菌人工染色體(BAC's)的末端。來自的末端獲得讀取,或者靶標可以被片段化??梢詫ζ位陌袠诉M行大小選擇(如通過皿電泳)以獲得靶標片段較窄尺寸的分布。整個樣品中間隔的成對讀取可以用作從頭組裝先前未測序樣品的工具,也可用于當參照基因組可供利用時樣品的再測序。當需要知道所述分子任意一端的序列時,本文所描述的方法適用于任何來源的核酸分子。為了使用本發(fā)明的方法對給定靶標雙鏈多核苷酸的兩個區(qū)域測序,需要實施依次的測序反應(yīng)。為了實現(xiàn)兩個分開的測序反應(yīng),就有必要與兩個不同單鏈區(qū)依次雜交來作為測序的模板??梢酝ㄟ^本文描述的任何一種方式形成適合測序的單鏈區(qū)域。依次雜交固定化雙鏈體包含兩條互補鏈,每條都通過5,末端固定于所i^面。變性雙鏈多核普酸得到兩條單鏈多核苷酸;每M能夠與不同的測序引物雜交。使用與其中一條結(jié)合鏈的3,末端互補的第一測序引物,可以從一條鏈獲得測序讀取。接著可將該測序運行變性;與另一條鏈的3,末端互補的第二測序引物可以與之雜交。接著可以在第一運行的多核苷酸分子的相反末端重復(fù)測序方案以進行第二運行。用于使固定化多核苷酸分子變性或除去第一測序引物的變性處理可以是加熱至超過95匸或者是用變性溶液進行的化學處理,所述變性溶液例如0.1M氫氧化鈉,50%的甲酰胺或8M的尿素溶液。在第一和第二讀取過程中測序《1物可保持固定化。如果所述雙鏈多核香酸被設(shè)計成在每個鏈上包含序列選擇性的切口化位點,則可以在對每^:切口化之后以該切口化鏈的3,端作為起點依次實施測序讀取。切口化鏈的5,末端保持固定化,其可以在第一測序運行后,實施第二鏈切口化處理前被封閉。在這種情況下,雙鏈體沒有變性以使測序引物雜交,而是第一鏈被切口化以使得初始雙鏈體的一部分用作測序引物并對第二鏈進行測序。通過所述雙鏈體第二鏈的切口開始第二讀取,從而對第一鏈讀取。在該實施方案中,在任何點都不將所述陣列置于變性條件之下是非常重要的,這是因為在第二讀取過程中,所i^板只通過雜交與所i^面連接。用限制性核酸內(nèi)切酶i^行蔟切割雙鏈多核苷酸模板包含夾在位于序列末端處的已知接頭之間的未知靶標DNA序列。然而,很容易使用分子生物學技術(shù)構(gòu)建其中也有將未知區(qū)域一分為二的核苷酸序列已知區(qū)域的多核苷酸。因此,;^板多核苷酸可以表示為具有一個已知末端、一段未知序列、已知接頭區(qū)、另一段未知序列和第二個已知末端,如果它們不進一步擴增那么在本文中被定義為接頭-靶標-接頭-靶標-接頭構(gòu)建體,或者如果所述初始接頭-靶標-接頭-靶標-接頭接受擴增,則被定義為引物-靶標-接頭-靶標-引物。內(nèi)部序列可以設(shè)計為包含兩個測序引物位點;以及允許對雙鏈體的兩#^進行序列選擇性切割的位點,例如限制性核酸內(nèi)切酶的識別位點,如圖8所示。這種限制性核酸內(nèi)切酶切割生成兩個錨定的多核苷酸雙鏈體,所述雙鏈體在其中一^^5,末端固定。該固定化雙鏈體可以通過熱處理或化學處理來變性,生成固定于相鄰位置的兩個非互補單鏈多核苷酸??梢允褂貌煌臏y序引物對這些非互補鏈中的每一條測序以給出源于所述初始多核香酸雙鏈體的兩個讀取。可以通過將隨機化基因組片段與線性化載體相連接以重新生成環(huán)形構(gòu)建物來構(gòu)建帶有內(nèi)部引物區(qū)的雙鏈多核苷酸模板。使用遠程切割限制性酶(如Mmel或Ecopl5),遠離環(huán)化載體的已知部分而切割到未知區(qū)域,這樣可以除去所述未知序列的中間區(qū)域。EcoP151是III型限制性酶的一種,它識別基序CAGCAG序列并在CAGCAG基序下游27個4^&對處切割雙鏈DNA分子。切割位點包含2個威基的5,突出,它可以通過末端修復(fù)形成一個27個威基的平末端化雙鏈體。在正常的體內(nèi)條件下,EcoP151需要兩個在雙鏈分子的相反鏈上頭對頭朝向的CAGCAG基序,隨后酶只在兩個位點其中之一處切割雙鏈體。但是,在存在抗生素化合物Sinefugin(Sigmacat編號S8559)的特定體外條件下,EcoP151具有在所有存在于序列中的CAGCAG序列處誘導切割雙鏈的所需作用,而不論其數(shù)目或方向如何,如Raghavendra和Rao所描述(BiochemBiophysResCommun.加O5Sep2;334(3):803-11),它以整體合并入本文,但是就我們所知,此前未報道過Sinefungin或其類似物在使用EcoP15或其它限制性核酸內(nèi)切酶III制備雙標簽文庫中的用途。每個分子末端既可以連接在一起形成載體-靶標-靶標-載體類型的單核苷酸"雙標簽"序列,或者已知序列的接頭可用作載體-乾標-接頭-乾標-載體類型模板中的間隔區(qū)域,如圖4所示。建立此類型構(gòu)建物的一個替代性方法是打開一個成環(huán)的載體分子并在其每一端都連接上接頭,該方法的一個實施例如圖7所示,其中通過遠程切割限制性酶而非隨機化方法的片段化也包括在圖7中。在用于蔟生成和SBS的DNA;^板的制備中,將兩個EcoP151位點鄰的位置,如圖4所示。EcoP15I位點臨近所述乾標序列,這4吏得向把標序列內(nèi)27個>5^^的特定位置進行切割,因此可以操縱未知把標序列27個堿基的序列。使用分別位于所述靶標DNA片段任意一端的兩個EcoP151位點,使得大部分的乾標序列被除去,而在任一末端剩下兩個相關(guān)聯(lián)的27>5^^片段。54個g的單測序讀:^出了來自初始粑標兩個末端的序列信息,而沒有插入威基。54個連續(xù)威基的構(gòu)建物為雙標簽的一個實例,因為它包含連接在一起的原始靶標兩個27>^對末端。該EcoP151特異性雙標簽構(gòu)建物包含載體-靶標(274)-靶標(274)-載體。如果用與所述載體區(qū)域互補的引物擴增所述環(huán)形雙標簽,則可以獲得線性雙標簽構(gòu)建物引物-靶標(27M)-乾標(27^JO-引物。重新連接以使得環(huán)形構(gòu)建物閉合可以使用足夠保證該環(huán)有效封閉的任意長M列來完成。使用初始切割位點任意一側(cè)的引物擴增可給出所需多核苷酸模板的拷貝。然而,可以用此雙標簽法生成的未知區(qū)域的長度受到遠程切割的限制性酶的可用性的限制。使用限制性酶構(gòu)建此類文庫的實例曾有報道(Science2005;Vol.309.No.5741,pp.1728-1732)。生成雙標簽的方法詳細記載于例如,WO00179553,WO03074734,W06135342或US2006/0024681中。擴增此類雙標簽的單分子生成成蔟陣列,其中每個所擴增雙鏈體的兩a都被固定,如本發(fā)明人第一次所教導的,所述擴增帶來一個巨大優(yōu)點,即有可能在單個固體支持物上同時分析大量的不同序列雙標簽。而且,在所述雙標簽中插入接頭可使得從每個模板雙鏈體獲得4個測序讀取而不僅僅是兩個?,F(xiàn)有技術(shù)方法的另一重要限制是需要使用限制性酶,這就限制了靶標序列的長度。本文中詳細描述的方法不需要使用限制性酶,它在可以被測序的兩個靶標片段的長度方面具有顯著的優(yōu)勢。一種生成其中靶標多核苷酸片段長于限制性酶切位點的所需構(gòu)建物的替代性方法是將線性接頭序列連接到未知片段中形成環(huán)形構(gòu)建物,這在本發(fā)明中特別有優(yōu)勢。接著可使用隨機剪切處理(如超聲、霧化或外切酶處理)來生成包含中間接頭序列的線性構(gòu)建物。接頭可以用如生物素的基團所修飾以利于接頭-靶標環(huán)或其片段的純化。末端修復(fù),接下來與另一個接頭環(huán)化,將產(chǎn)生具有兩個已知和兩個未知區(qū)域的環(huán)形產(chǎn)物。對其可以使用引物對擴增,產(chǎn)生所需的已知-未知-已知-未知-已知多核苷酸模板。該技術(shù)有一系列的變化,且其步驟的順序也并非固定的。預(yù)期任何用于生成包含下列部分的多核苷酸分子的技術(shù)包括在本發(fā)明的范圍內(nèi),所述部分即已知末端和在兩個未知的待測序目的區(qū)域之間的已知中間序列??捎糜诖祟悩悠分苽浼夹g(shù)的多種方法在圖5、6、7、9、10和11中顯示。參考附圖在下文描述這些方法。圖5是在不使用限制性酶的情況下確定長的未知多核苷酸區(qū)域成對讀取之方法的示意圖。靶標插入片段可以是,例如PCR擴增子,分離自生物樣品(如細菌、病毒或其它生物)、分離的克隆、克隆文庫、質(zhì)粒、噬菌粒或任何其它核酸來源的隨機剪切的核酸樣品,其可以使用合適接頭連接成環(huán)。所述隨機剪切耙標可以在連接之前進行末端修復(fù)。如果在連接前將所述樣品片段化,那么可以在連接前對所述片段進行大小選擇得到很窄的分布,或者控制片段化以得到具有大小窄窄地分布在某一尺寸的片段,例如5kb或10kb。還可以使用如超聲、霧化或水力剪切等多種技術(shù)將所述環(huán)形構(gòu)建物隨機片段化。由于這些過程的隨機性,所述片段將是包含接頭序列的片段和不包含接頭序列的片段的混合物。如果保護接頭使之免受片段化,則可以減少片段化過程的隨機性。由于接頭區(qū)域的序列已知,該序列可用于選擇性將DNA結(jié)合蛋白或類似物質(zhì)把向到所述接頭區(qū)域。如果所述蛋白大小足夠的話,它們還可以與靶標序列結(jié)合并保護所述乾標不再受進一步的片段化。可以使用接頭區(qū)域的已知序列靶向所述蛋白,例如使用寡核苷酸-蛋白質(zhì)綴合物。在該情況下,使用與雙鏈體強力雜交形成三螺旋的寡核苷酸或分子(例如可以鏈侵入到雙鏈體的肽核酸(PNA))可能是有利的。合適的DNA結(jié)合蛋白可以包括轉(zhuǎn)錄因子、DNA聚合酶或其它核酸修飾酶、染色質(zhì)或限制性酶,此時結(jié)合位點被修飾從而不能被切割。受保護區(qū)域的大小取決于所用保護靶標序列的方法,但可以是從接頭序列每個末端開始20-200個堿基不等??梢允褂玫诙宇^將片段重新環(huán)化,以獲得基本上兩類環(huán)形構(gòu)建物,即只有第二接頭的構(gòu)建物以及有第一和第二兩個接頭的構(gòu)建物。用第一接頭特異性引物對所述環(huán)進行擴增會導致只有包含完整第一接頭序列的環(huán)得到擴增,因此,將僅僅獲得預(yù)期的包含引物-靶標-接頭-靶標-引物構(gòu)建物的產(chǎn)物。在所有環(huán)擴增的實施例中,擴增方法可以包括用于標準擴增反應(yīng)的兩個引物,或可以通過滾環(huán)擴增來進行。在一些情況下,滾環(huán)擴增法中也可以使用兩個引物,使得所述環(huán)形模板的初始拷貝可以被進一步擴增。圖6所示為圖5的變化,其中所述初始接頭是生物素化的。接頭的生物素化允許在固體支持物上實施一些或全部的步驟,或在需要的時候純化所需片段。如果所述接頭如上所述連接在靶標上,未連接的耙標將不攜帶生物素修飾,則它可以容易的從分子混合物中被除去。一旦所述環(huán)片段化,接頭上的生物素基團還允許將攜帶初始接頭的片段從那些沒有攜帶的片段中選擇出來??梢匀缟纤鰧蔚慕宇^與第二接頭相連接,并用第一接頭序列特異性引物擴增以生成適于進一步擴增和/或測序的線性模板。圖7所示為圖6的變化,其中用接頭處理片段化的環(huán),從而線性片段的兩個末端都被修飾。這就避免了對第二環(huán)化反應(yīng)的需要,而同時仍允許制備接頭-靶標-接頭-靶標-接頭類型的構(gòu)建物。圖9是制備用于從任意長度片段的遠端獲得讀取對的樣品的示意圖。該方法基于用受控量的dUTP來擴增片段,由此引入可以使片段被隨機切割的低水平修飾(也就是在尿嘧咬^隨機插入的地方切割)。切割片段可以被重新連接成環(huán)并被擴增,以使得初始PCR片段的兩個末端連接在一起而中間4^被切除。圖10是制備用于從任意長度片段的遠端獲得讀M的樣品的示意圖,所述制備不需要初始PCR反應(yīng)來引入隨后切割所需的修飾堿基。該方法基于低水平氧化初始樣品中的鳥噪呤M,由此引入可以使片段被隨機切割的低水平修飾(也就是在鳥嘌呤堿基隨機氧化的地方切割)。切割片段可以被重新連接成環(huán)并被擴增,以使得初始PCR片段的兩個末端連接在一起而中間>5^^皮切除。圖11是制備用于從任意長度片段的遠端獲得讀取對的樣品的示意圖。該方法基于低水平氧化初始樣品中的鳥嘌呤M,由此引入可以使片段被隨機切割的低水平修飾(也就是在鳥嘌呤^隨機氧化的地方切割)。如果使用除去8-氧代鳥嘌呤威基的酶切開載體-靶標連接環(huán),那么此時只有靶標片段的末端保持連接在載體上??梢赃B接新接頭序列以重新環(huán)化露出的末端,生成具有兩個來自初始栽體的已知末端的片段,兩個末端分別來自靶標片段的和中部接頭序列??梢杂门c初始載體末端互補的引物進行擴增來線性化該片段,從而得到適合進一步擴增和/或測序的引物-靶標-接頭-靶標-引物構(gòu)建物。固定化DNA的線性化可以如上所述將多核苷酸分子制備成包含兩個測序引物的序列。如果這些分子被固定化,使得可以A^面上切割兩個固定化末端之一,則在此切割之后可以通過熱處理或化學變性條件使只在雙鏈體一端固定的所得雙鏈DNA成為單鏈,以得到包含兩個引物雜交位點的單鏈分子。除去"橋連"的雙鏈核酸結(jié)構(gòu)中一條固定化單鏈的所有或一部分的過程在本文中可以被稱為"線性化"??梢允褂玫谝粶y序引物對單鏈分子測序,接著除去第一引物并引入第二測序引物以允許第二讀取。如果構(gòu)建物沒有被線性化,就有可能從每個雙鏈體獲得四個讀取,這是因為每條漣可以被測序兩次,一次來自3'末端的接頭序列,另一次來自中間接頭序列。為了對固定化雙鏈線性化,模板雙鏈體的第一或第二鏈必須包含切割位點。上述的切割位點是可以通過化學、酶或光化學方法對第一或第二模板鏈進行受控切割的位點。然后僅通過一端固定所述雙鏈多核普酸。接著使所述多核苷酸變性,留下5,端固定的多核苷酸單鏈。然后可以將第一測序引物與模板的單鏈區(qū)域雜交并作為測序反應(yīng)的引物使用,之后將它從所述^板上除去,雜交第二測序引物并將其用于所述單鏈^^板不同區(qū)域的測序。任何合適的酶、化學或光化學切割反應(yīng)都可以用于切割。切割反應(yīng)可導致部分的或整個鏈,皮切割。合適的切割方法包括,例如,限制性酶消化,在此情況下,所述切割位點是適合于指導雙鏈體模板一條或兩條逸切割的酶的限制性位點;RNA酶消化或脫氧核糖核酸和核糖核酸之間鍵的化學切割,在此情況下,所述切割位點可包含一個或多個核糖核普酸;使用還原劑(如TCEP)對二石克鍵的化學還原,在此情況下,所述切割位點應(yīng)包含合適的二硫鍵;用高碘酸鹽對二醇鍵的化學切割,在此情況下,切割位點應(yīng)該包含二醇^^;無g位點的生成和隨后的水解等。在一個實施方案中,切割可以發(fā)生在^j^板多核苷酸雙鏈的一條或兩a上的切割位點,所述雙鏈體包含一個或多個或任意組合的非天然核苷酸、核糖核苷酸或非核苷酸的化學修飾。本發(fā)明方法中所使用的合適切割技術(shù)在共同未決的申請WO07010251中有完整說明,它包括但不僅限于如下內(nèi)容(i)化學切割術(shù)語"化學切割"包括任何利用非核酸和非S^ft學試劑來促i^/實現(xiàn)模板多核普酸雙鏈中一條或兩M切割的方法。如果需要,所述模板多核苷酸雙鏈體中一條或兩條鏈可包含一個或多個非核苷酸的化學部分和/或非天然核苷酸和/或非天然骨架連接,以便進行化學切割反應(yīng)。在一個具體實施方案中,可以將實現(xiàn)化學切割所需的修飾可以摻入到用于通過固相核酸擴增形成^板多核苷酸雙鏈體的擴增引物中。在一個具體實施方案中,所述模板多核苷酸雙鏈體的一a(或者,如果通過固相擴增形成則是產(chǎn)生此鏈的擴增引物)可包含允許通過高碘酸鹽(如高碘酸鈉)處理切割的二醇鍵。應(yīng)該理解,可以在切割位點包含不止一個二醇。適合在多核苷酸鏈上摻入的基于亞磷酰胺化學法的二醇連接單位可以購自FidelitysystemInc.(Gaithersburg,MD,USA),或者可以按照WO07010251中所述的方法進行化學制備??梢允褂肈NA自動化學合成的標準方法將一個或多個二醇單位摻入到多核普酸中。因此,可以方4更地通過化學合成來制備包含一個或多個二醇連接的寡核苷酸引物。為了將二醇連接置于距固體支持物最優(yōu)的距離,可以在二醇連接和固體支持物的連接位點之間包含一個或多個間隔物分子。為了促進固體支持物在多核香酸鏈5,端的連接,所述5,端可以被修飾成包含硫代磷酸酯基。硫代磷酸酯基可以在包含間隔物和二醇單位的多核苷酸鏈的化學合成中容易的連接上去。所述間隔物分子可以包括例如與被擴增模板不互補的一段核普酸。通??梢园?到20個,特別是1到15個或1到10個,更為具體的是2、3、4、5、6、7、8、9或10個間隔核普酸。在一個具體實施方案中,IO個間隔核苷酸被置于固體支持物連接點和二醇連接之間。在另一個具體實施方案中,使用多聚T間隔物,盡管也可以使用其它核苷酸及其組合。在另一個具體實施方案中,所述引物可以包含10T間隔核普酸。通過"切割劑,,的處理來切割所述二醇連接,該切割劑可以是任何能夠促進二醇切割的物質(zhì)。其中一種切割劑是高碘酸鹽,如高碘酸鈉的水溶液(Nal04)。切割劑(如高碘酸鹽)處理切割二醇鍵之后,為了中和切割反應(yīng)中生成的反應(yīng)性物質(zhì),可以用"加帽劑,,處理所述切割產(chǎn)物。用于該用途合適的加帽劑包括胺類,如乙醇胺或丙醇胺(3-^J^-丙-l-醇)。有利的是,所述加帽劑(如丙醇胺)可以包含在與切割劑(如高碘酸鹽)的混合物中,使得反應(yīng)性物質(zhì)一形成就被加帽。因為高碘酸鹽和丙醇胺處理與核酸完整性和^膠表面化學相容,所以二醇鍵和實現(xiàn)切割模板多核苷酸雙鏈體至少一條鏈的切割劑(如高碘酸鹽)組合的實例在線性化固相支持的聚丙烯酰胺7JC^上的模板雙鏈體方面作用良好。然而,使用二醇^/高碘鹽作為線性化的方法并不僅限于聚丙烯酰胺水^4面,還可擴展到固定在其它固體支持物和表面的雙鏈體的線性化,包括由官能化硅烷包被的支持物(等)。在另一個實施方案中,待切割的鏈(或者,如果通過固相擴增制備的話則是產(chǎn)生此鏈的擴增引物)可以包含允許用化學還原劑切割的二硫基團,如三(2-羧乙基)磷酸鹽酸鹽(Tris(2-carboxyethyl)-phosphatehydrochloride,TCEP)。ii)無M位點的切割"無^位點"定義為多核普酸鏈上M成分被除去的核苷酸位點。無4位點可以在生理條件下通過核苷酸殘基水解而在DNA上自發(fā)出現(xiàn),也可以在人工條件下化學形成或者通過酶作用形成。一旦形成后,無g位點可以被切割(如通過核酸內(nèi)切酶或其它單鏈切割酶的處理,或暴露于熱或堿),為多核苷酸鏈的位點特異性切割提供了一種方法。在一個具體但非限制性的實施方案中,無4^位點可以在模板多核苷酸雙鏈體的一條漣上預(yù)定的位置處生成,然后在^^多核普酸雙鏈體的一M上預(yù)定切割位點處通過首先摻入脫氧尿嘧咬(U)而被切割。這可以通過例如在用于固相PCR擴增制備模板多核苷酸雙鏈體的引物之一中包含U來實現(xiàn)。接著可利用尿嘧啶DNA糖苷酶(UDG)除去尿嘧咬4^,在一條鏈上生成無堿基位點。然后可以在無堿基位點處通過核酸內(nèi)切酶(如,EndoIV核酸內(nèi)切酶、AP裂解酶、FPG糖苷酶/AP裂解酶、EndoVIII糖苷酶/AP裂解酶)、熱或堿處理來切割包含無g位點的多核普酸鏈。無堿基位點還可以在除脫氧尿嘧咬之外的非天然/經(jīng)修飾的脫氧核糖核苷酸處生成并以相似的方式通過核酸內(nèi)切酶、熱或堿處理切割。例如,通過暴露于FPG糖苷酶,可以將8-氧代鳥嘌呤轉(zhuǎn)化成無>5^位點??梢酝ㄟ^暴露于AlkA糖苷酶而將脫氧次黃戒轉(zhuǎn)化為無^位點。如此生成的無堿基位點可以接著被切割,通常是通過合適的核酸內(nèi)切酶處理(如,EndoIV、AP裂解酶)。如果非天然/經(jīng)修飾的核苷酸將被摻入到用于固相擴增的擴增引物中,那么該非天然/經(jīng)l務(wù)飾的核普酸應(yīng)該能夠通過用于擴增反應(yīng)的聚合酶進4于復(fù)制。在一個實施方案中,待切割分子可以暴露于包含合適的糖苷酶和一種或多種合適的核酸內(nèi)切酶的混合物。在此類混合物中,所述糖苷酶和所述核酸內(nèi)切酶通常以至少約2:1的活性比存在。該切割方法在生成核酸測序模板的方面具有特別的優(yōu)點。特別是,在通過如UDG的糖苷酶處理生成的無^位點處的切割可以在切割鏈上生成游離3,羥基基團,它為互#^上區(qū)域的測序拔:供了起點。另外,如果初始雙鏈核酸在一條鏈上包含唯——個可切割的堿基(如尿嗜咬),那么在雙鏈體的這#^上的唯一位置處可以生成一個單"切口"。由于所述切割反應(yīng)需要不是天然存在于DNA中而是獨立于序列背景的殘基(例如脫氧尿苷),所以如果只包含一個非天然堿基,那么就不可能在雙鏈體上其它非所需位點處發(fā)生糖苷*導的切割。相反,若是雙鏈核酸被一個識別特異序列的"切口化"核酸內(nèi)切酶切割,那么如果具有正確的識別序列,酶就有可能在雙鏈體中的"其它"位點處生成缺口(除了所需切割位點之外)。如果缺口生成在想要測序的鏈上而不是在全部或部分除去以生成測序;^板的鏈上,那就會出現(xiàn)問題,如果雙鏈核酸分子的靶標部分具有未知序列則也特別有風險。使用該方法對置于具體序列背景中以提供切割位點的非天然殘基(例如尿嘧啶)沒有要求,這本身就是優(yōu)點。特別的,如果所述切割位點將被摻入到用于通過固相擴增生成簇陣列的擴增引物,則只需要用非天然核苷酸(如尿嘧啶)替換引物中的一個天然核苷酸(如胸腺嘧啶)就能實現(xiàn)切割。不需要^t引物4吏其包含數(shù)個核苷酸長的限制性酶識別序列??梢匀菀椎氖褂霉押塑账峄瘜W合成的常規(guī)技術(shù)和設(shè)備來制備包含尿嘧咬核苷酸及其它如上所列非天然核香酸的寡核普酸引物。切割通過UDG對尿嘧啶的作用所生成的雙鏈分子上無M位點的另外一個優(yōu)點是,"合成測序"反應(yīng)中摻入的第一個堿基總是T,所述反應(yīng)自通過該位點處的切割形成的3,末端游離羥差^起始。因此,如果所述^^L多核苷酸雙鏈體形成包含許多此類分子的成簇陣列的一部分(所有的分子都通過這種方式被切割生成測序^^L),那么普遍摻入整個陣列的第一個g將是T。這可以提供一種在測序運行開始時測定各個簇強度的序列不依賴性的測定法。iii)核糖核普酸的切割在由脫氧核糖核苷酸(帶有或不帶有其它非核普酸的化學部分、非天然M或非天然骨架連接)組成的多核苷酸鏈中摻入一個或多個核糖核苷酸可以為使用能選擇性切割脫氧核糖核普酸與核糖核香酸之間磷酸二酯鍵的化學試劑或使用核糖核酸酶(RNAse)的切割提供位點。因此,可以通過使用此類化學試劑或RNA酶在包含一個或多個連續(xù)核糖核普酸的位點切割所述模板多核苷酸雙鏈體的一條漣來產(chǎn)生測序模板。特別的說,待切割鏈包含單個核糖核苷酸以揭JH匕學切割位點。能夠選擇性切割脫氧核糖核普酸與核糖核苷酸之間磷酸二酯鍵的合適化學切割劑包括金屬離子,例如,稀土金屬離子(尤其是La、特別是Tm3+、Yb"或Lu3+(ChenCaLBiotechniques.2002,32:528-520;KomiyamaWaLChem.Commun.1999,1443-1451))、Fe(3)或Cu(3),或暴露于高pH值,例如用如氫氧化鈉的堿進行處理。"脫氧核糖核苷酸與核糖核苷酸之間磷酸二酯鍵的選擇性切割"指所述化學切割劑在相同條件下不能切割兩個脫氧核糖核苷酸之間的磷酸二酯鍵。核糖核苷酸的^組成通常并不重要,而是可以加以選擇以便優(yōu)化化學(或酶)切割。例如,如果切割通ii暴露于金屬離子(特別是稀土金屬離子)來實施,則可以^使用rUMP或rCMP。典型的,核糖核香酸將被摻入到模板多核苷酸雙鏈體的一條漣中(或者,如果通過固相擴增制備的話則是產(chǎn)生此鏈的擴增引物),并可能位于在所述雙鏈體的兩條互補鏈退火時呈單鏈形式的雙鏈體區(qū)域中(即5,突出部分)。如果使用正向和反向擴增引物通過固相PCR擴增來制備所述模板多核苷酸雙鏈體,其中一引物包含至少一個核糖核普酸,則用于PCR擴增的標準DNA聚合酶不能夠復(fù)制核糖核普酸^^板。因此,PCR產(chǎn)物將包含5,突出的區(qū)域,該區(qū)域包含核糖核苷酸和所述核糖核苷酸上游的擴增引物的其余部分。核糖核苷酸和脫氧核糖核苷酸之間或兩個核糖核苷酸之間的磷酸二酯鍵也可以被RNA酶切割。任何具有合適底物特異性的內(nèi)切核糖核酸酶都可以被用于此目的。如果核糖核苷酸存在于當雙鏈分子的兩條互補鏈退火時呈單鏈形式的區(qū)域中(即在5'突出部分中),那么RNA酶將是對包含核糖核苷酸的單鏈具有特異性的核酸內(nèi)切酶。對于使用核糖核酸酶的切割,在一個特定實施方案中可以包含兩個或多個連續(xù)的核糖核苷酸,更特別的,包含2到10個或5到10個連續(xù)的核糖核苷酸。核糖核苷酸的確切序列通常并不重要,除非某些RNA酶對某些殘基之后的切割具有特異性。合適的RNA酶包括例如RNaseA,它在C和U殘基后進行切割。因此,當用RNaseA切割時,切割位點必須包含至少一個是C或U的核糖核苷酸。可以通過使用合適核糖核苷酸前體的化學合成寡核普酸的標準技術(shù)容易地合成摻入一個或多個核糖核苷酸的多核苷酸。如果通過固相核酸擴增制備模板多核苷酸雙鏈體,那么在用于擴增反應(yīng)的其中一個引物中摻入一個或多個核糖核苷酸是^f艮方i更的。iv)光化學切割術(shù)語"光化學切割,,包括任何利用光能來切割雙鏈核酸分子中一條或兩條鏈的的方法。光化學切割位點可以由雙鏈分子的一M中非核普酸化學間隔單元提供(或者,如果通過固相擴增制備的話則是產(chǎn)生此鏈的擴增引物)。合適的光化學可切割間隔物包括PC間隔物亞磷酰胺(4(4,4,-二甲氧三苯甲氧基)丁酰絲甲基)-1-(2-硝基苯基)-乙基)冬氰乙基-(N,N-二異丙基)-亞磷酰胺)(4一(4,4,隱Dimethoxytrityloxy)butyramidomethyl)-1畫(2-nitrophenyl)畫ehtyl國2-cyanoethyl國(N,N畫diisopropyl)畫phosphoramidite)),它由美國弗吉尼亞州斯特林(Sterling,Virginia,USA)的GlenResearch公司提供(目錄號為10-4913-XX)。其結(jié)構(gòu)如下可以通it暴露于紫外光源來切割所述間隔單元。使用寡核苷酸化學合成的標準技術(shù),可以將該間隔單元和能使之連接到固體表面的硫代磷酸酯基團一起連接到多核苷酸的5,端。方便的是,該間隔單元可以摻入到正向或反向擴增引物中,該引物用于通過固相擴增合成可光切割^l^板的多核普酸雙鏈體。v)半甲基化DNA的切割還可以通過在該鏈中摻入一個或多個曱基化核苷酸然后用對包含該甲基化核苷酸的識別序列特異性的核酸內(nèi)切酶進行切割來實現(xiàn)對雙鏈核酸分子其中一條鏈的位點特異性切割。甲基化核苷酸通常將被摻入到模板多核苷酸雙鏈體其中一M的區(qū)域中,其在互補鏈上具有一段非甲基化脫氧核糖核普酸的互補區(qū),這樣所述兩*#:退火生成了半甲基化的雙鏈結(jié)構(gòu)。接著可以通過合適的核酸內(nèi)切酶作用切割半甲基化雙鏈。為了避免質(zhì)疑,切割此類半甲基化乾序列的酶不被認為是從本發(fā)明第二個方面的范圍中排除的"限制性核酸內(nèi)切酶",而是也旨在構(gòu)成本發(fā)明主題的一部分??梢允褂米詣覦NA合成的標準技術(shù)以及合適甲基化的核普酸前體來制^#入一個或多個甲差^匕核苷酸的多核香酸。如果通過固相核酸擴增制備模板多核苷酸雙鏈體,那么在用于擴增反應(yīng)的其中一個引物上摻入一個或多個甲基化核苷^A很方便的。vi)PCR阻塞物在本發(fā)明的另一個實施方案中,可以通過使用正向和反向引物的固相擴增來制備所述模板多核苷酸雙鏈,其中一個引物包含"PCR阻塞物(PCRstopper)","PCR阻塞物"是阻止用于擴增的聚合酶通讀(read-through)的任何部分(核普酸或非核苷酸),使得在超出該點后不能延伸/復(fù)制。其結(jié)果是由包含該PCR阻塞物的引物延伸得到的擴增鏈將包含5,端突出部分。該5,端突出(PCR阻塞物本身除外)可由通過天然骨架連接的天然脫氧核糖核苷酸構(gòu)成,即,它可以僅僅是一段單鏈DNA。隨后可以用選擇性切割單鏈DNA而非雙鏈DNA的切割劑(如酶)在5,端突出區(qū)域切割該分子,例如用綠豆核酸酶。PCR阻塞物本質(zhì)上可以U本上任何阻止用于擴增反應(yīng)的聚合酶通讀的部分。合適的PCR阻塞物包括但不僅限于六乙二醇(HEG)、無g位點和任何可以阻止聚合酶通讀的非天然或經(jīng)修飾的核普酸,包括DNA類似物如肽核酸(PNA)。可以在使用包含穩(wěn)定無4^位點的合適間隔單元進行寡核苷酸化學合成過程中引入穩(wěn)定的無4位點。例如,可以在寡核苷酸化學合成時摻入購自美國弗吉尼亞州斯特林的GlenResearch的無堿基呋喃(5,-0-二甲氧三苯甲氧基-1,,2,-二脫氧核糖-3,-[(2-氰乙基)-(N,N-二異丙基)-亞磷酰胺)((5,-O-Dimethoxytrityl-l,,2,畫Dideoxyribose畫3,國[(2-cyanoethy1)—(N,N畫diisopropyl)]-phosphoramidite))間隔物,以引入無>5^位點。這才羊,該位點可以容易地被引入到用于固相擴增的寡核苷酸引物中。如果無M位點被摻入到正向或反向擴增引物中,那么所得擴增產(chǎn)物將在一條包含該無M位點的鏈上具有5,端突出(以單鏈形式)。接著可以通過合適化學試劑(例如暴露于堿)或酶(例如AP核酸內(nèi)切酶VI,ShidaWNucleicAcidsResearch,1996,Vol.24,4572-4576)的作用切割該單鏈無^8^位點。vii)多肽接頭的切割還可以通過制備綴合結(jié)構(gòu)而將切割位點引入到模板多核普酸雙鏈體的一條鏈中,在該結(jié)構(gòu)中肽分子與雙鏈體其中一l^目連(或者,如果通過固相擴增制備的話則是產(chǎn)生此鏈的擴增引物)。隨后可以通過具有合適特異性的肽酶或其它任何合適的非酶化學或光化學切割方式切割肽分子。通常,通過將肽與;^板多核苷酸雙鏈體僅僅一M共價連接來形成所述肽和核酸之間的綴合物,其中所述肽部分與該鏈5,端綴合,與固體表面的連接點臨近。如果通過固相擴增制名^;^板多核苷酸雙鏈,則可以在擴增引物之一的5,端摻入所述肽綴合物。顯然,該引物的肽部分在PCR擴增時不會被復(fù)制,因此,"橋式(bridged)"擴增產(chǎn)物會在一^上包含可切割的5,端肽突出。可以使用本領(lǐng)域中的常規(guī)方法制備肽與核酸的綴合物,其中肽與核酸5,端綴合。在這樣的一項技術(shù)中,可以分別合成具有所需氨基酸和核酸序列的肽和核酸,如通過標準自動化學合成技術(shù),并隨后在水/有機溶液中綴合。例如,可從GlenResearch購得的OPeCTM系統(tǒng)是基于N末端硫酯官能化的肽與5,端半胱氨酰化寡核苷酸的"天然連接"。五氟苯基S-苯甲基石1/R琥珀酸酯(pentafluorophenylS-benzylthiosuccinate)被用于基于Fmoc的標準固相肽組裝的最終偶聯(lián)步驟。使用三氟乙酸去保護,在溶液中生成N端S-苯甲J^克代琥珀酰^t代的肽。0-反式-4-(N-a-Fmoc-S-叔丁基亞磺酰基-l-半胱氨酰)氨基環(huán)己基O-2-氰乙基-N,N-二異丙基亞磷酰胺(0畫trans-4國(N畫a-Fmoc-S-tert畫butylsulfenyl-l-cysteinyl)aminocyclohexyl0畫2國cyanoethyl-N,N-diisopropylphosphoramidite)被用于標準的亞磷酰胺固相寡核苷酸組裝的最終偶聯(lián)步驟。使用氨7JC溶液去保護,在溶液中生成5,-S-叔丁基亞磺g-L-半胱氨酰官能化的寡核苷酸。通過使用苯硫酚將經(jīng)修飾肽的千石?;┒宿D(zhuǎn)化成千硫基類似物,同時用三(羧乙基。-膦還原經(jīng)修"飾寡核苷酸。這兩種中間產(chǎn)物的偶聯(lián)以及之后的"天然連接"步驟導致形成寡核苷酸-肽綴合物。可以使用本領(lǐng)域已知的任何與所選表面相容的共價連接技術(shù)將包含肽和核酸的綴合物鏈共價連接到固體支持物上。如果肽/核酸綴合物結(jié)構(gòu)是用于固相PCR擴增的擴增引物,則與固體支持物的連接必須使核酸部分的3,端游離。所述肽部分可以被設(shè)計為可被任意選定的肽酶切割,其中許多是本領(lǐng)域已知的。肽酶的性質(zhì)沒有特別的限制,只須肽酶可以在所述肽部分的某處切割即可。相似的,所述肽部分的長度和M酸序列也沒有特別的限制,只是需要它們可以被所選的肽酶切割。對所述核酸部分的長度和確切序列也沒有特別的限制,它可以^1任何所需的序列。如果所述核酸部分在固相PCR中起引物作用,那么它的長度和核苷酸序列將被選擇成能夠與待擴增^板退火。限制性核酸內(nèi)切酶/切口化核酸內(nèi)切酶的酶消化用限制性核酸內(nèi)切酶切割雙鏈多核香酸是分子生物學領(lǐng)域一項常規(guī)使用的技術(shù)。切口化核酸內(nèi)切酶是一類對多核苷酸雙鏈體其中一M進行選擇性切割或"切口化(nick)"的酶,其在分子生物學領(lǐng)域也是公知的。本發(fā)明在酶的性質(zhì)方面并沒有限制。基本上任何限制性或切口化核酸內(nèi)切酶都可以使用,只要在切割位點包含合適的識別序列即可。隨后將進一步詳細說明本發(fā)明方法。可使用本領(lǐng)域已知的任何合適的固體支持物和任何合適的連接方式,其中的幾個將通過下面的實施例進行說明。與固體支持物的連接可以通過共價連接實現(xiàn)。多核苷酸雙鏈體將由兩條包含由磷酸二酯鍵連接的脫氧核糖核苷酸的互補多核苷酸鏈形成,但還可包含一個或多個核糖核普酸和/或非核苷酸的化學部分和/或非天然核苷酸和/或非天然骨架連接。特別的,雙鏈核酸可在一條或兩^的5'端包含非核苷酸化學部分(例如接頭或間隔物)。例如,雙鏈核酸可以包含甲基化核苷酸、尿嘧咬堿基、硫代磷酸酯基團、核糖核苷酸、二醇鍵、二硫鍵、肽等,但并不限于此??梢园@些非DNA或非天然修飾以實現(xiàn)切割或賦予其它所需的性質(zhì),例如,實現(xiàn)與固體支持物的共價連接,或作為間隔物將切割位點置于距固體支持物最佳距離處。模板雙鏈體還可包含位于靶標多核苷酸側(cè)翼5'端和3,端的非耙標序列。如果通過固相擴增形成^^1雙鏈體,則這些非靶標序列通常來自于用于固相擴增的引物。多核苷酸雙鏈體形成包含許多此類第一和第二雙鏈體的單個簇或集群的一部分,所述簇或集群本身通常形成具有許多此類簇或集群的陣列的一部分。術(shù)語"簇,,和"集群"通篇可以互換使用,其指固體支持物上的離散位點,其包含多個相同的固定化核酸鏈以及多個相同的固定化互補核酸鏈。術(shù)語"成簇陣列"指由此類簇或集群組成的陣列。本發(fā)明的一個關(guān)鍵特征在于兩個測序運行可以發(fā)生在成簇陣列的相同簇或集群上。在該陣列上每個集群內(nèi)的每個雙鏈體都包含相同的雙鏈耙標多核苷酸,而不同的集群可由包含不同雙鏈靶標多核普酸的雙鏈體形成。在一個具體實施方案中,給定的成簇陣列上至少卯%、更特別的至少95%的集群由包含不同雙鏈靼標多核苷酸的模板雙鏈體形成,盡管所述陣列上每個單獨的集群內(nèi)所有的;^板雙鏈體包含相同的雙鏈耙標多核普酸。然后可以以允許引物雜交的方式處理擴增的多核苷酸。這可以通過下列各項處理進行加熱所擴增的蔟使雙鏈體變性,然后在第一測序引物存在的情況下冷卻,例如釆用氫氧化鈉的化學處理以使得所述雙鏈體變性,或者對雙鏈體多核苷酸的一條或兩l^進行切割處理。所述陣列上每個多核苷酸雙鏈體包含相同的通用引物識別區(qū)域,以允許使用相同引物對每個簇進行測序。接著第一測序引物與第一模板鏈雜交,通過將核苷酸連續(xù)摻入第一測序引物進行測序反應(yīng),從而確定靼標多核苷酸第一區(qū)域的序列。通過將引物與模板鏈在促進引物與模板退火的條件下相接觸來實現(xiàn)測序引物與模板鏈的雜交。這些條件對于分子生物學領(lǐng)域技術(shù)人員來說是妙的。當?shù)谝粶y序反應(yīng)完成后,>^面除去延伸的第一測序引物。這可以通過加熱或化學變性實現(xiàn)。緊接著第二測序引物與所#板的第二區(qū)域雜交,通過將核苷酸連續(xù)添加到第二測序引物進行測序反應(yīng),從而確定靼標多核苷酸第二區(qū)域的序列??梢允褂萌魏魏线m的"合成測序,,技術(shù)進行測序,其中核香酸被連續(xù)添加到游離的3,羥基上,通常由測序引物退火來提供,導致從5,到3,方向合成多核苷酸鏈。在一個具體的實施方案中,在每次添加后確定所添加核普酸的種類??捎糜诒景l(fā)明方法的一個具體的測序方法依賴于使用可充當可逆性鏈終止子的經(jīng)修飾核苷酸。本發(fā)明中所使用的核普酸在WO04018497和US7057026中有完整的說明。一旦經(jīng)修飾的核苷酸被摻入到與被測序模板區(qū)域互補的正在伸長的多核苷酸鏈中,就沒有可用的游離3'羥基來指導進一步的序列^^伸,因此聚合酶無法添加另外的核普酸。一旦確定了摻入正在伸長的鏈中的堿基的種類,可除去3,封閉以允許添加下一個連續(xù)核香酸。通過將使用這些經(jīng)修飾的核苷酸得到的產(chǎn)物排序,就有可能推斷出DNA模板的DNA序列。如果每個經(jīng)《務(wù)飾的核普酸上連接了已知對應(yīng)不同^的不同標記的話,其幫助區(qū)分每個摻入步驟中所添加的威基,那么這些反應(yīng)可以在單個實驗中完成。作為替代的,可以實施包含每個經(jīng)修飾的核苷酸的單獨反應(yīng),其中核苷^1分別添加的。經(jīng)修飾的核苷酸可能攜帶標記以方便其檢測。在一個具體的實施方案中,所述標記是熒光標記。每個核苷酸類型可以攜帶不同的熒光標記。適合在本發(fā)明中使用的熒光標記在美國申請60/801270中有說明。然而,可檢測標記不一定是熒光標記。可以檢測DNA序列中所摻入核苷酸的任何標記都可以^使用。一種檢測帶有熒光標記的核苷酸的方法包括^f吏用對標記核苷酸的特定波長激光或使用其它合適的光源??梢酝ㄟ^CCD相機或其它合適檢測方法檢測核苷酸上標記所發(fā)的熒光。一種適合確定摻入核苷酸所發(fā)出的熒光信號的成像系統(tǒng)在申請60/788248中有說明。本發(fā)明的方法并不僅限于使用上述的測序方法,而是可以與基本上任何依賴于在核苷酸鏈上連續(xù)摻入核苷酸的測序方法聯(lián)用。合適的技術(shù)包括,例如PyrosequencingTM、FISSEQ(熒光原位測序)、MPSS(大^J^平行測序技術(shù))和基于連接的測序方法,如US6306597中所述。用本發(fā)明方法測序的靶標雙鏈多核苷酸可以是任何需要測序的多核普酸。所述乾標多核苷酸可以是已知的、未知的或部分已知的序列,例如在重測序應(yīng)用中的那些。使用下面詳細說明的模板制備方法,有可能M本上任何具有已知、未知或部分已知序列的雙鏈耙標多核苷酸開始制備模板陣列。通過使用陣列,就可能平行的對相同或不同序列的多個靶標測序。成對方法的一個具體的應(yīng)用是在基因組DNA片段的測序中。本方法為基因組重排的鑒別提供了特別的優(yōu)點,這是因為使用本方法獲得的每個靶標分子的兩個序列區(qū)域已知在基因組中一定距離內(nèi)彼此相連,其取決于起始靶標分子的大小。待測序^^板的制備可以通過固相核酸擴增產(chǎn)生核酸集群來制備適合使用本發(fā)明方法測序的模板。這可以4吏用W098/44151和WO00/18957中所述的類似程序進行,其內(nèi)容通過參考以整體形式并入本文。為進行擴增,將兩種擴增引物的混合物固定化或"接枝"到合適的固體支持物表面上。所述擴增引物是具有以下結(jié)構(gòu)的寡核苷酸分子正向引物A-L-X-S1反向引物A-L-X-S2其中A代表允許連接到固體支持物的部分,L是任選的接頭部分,X是任選的切割位點,Sl和S2是允許包含靼標雙鏈多核苷酸的;j^板核酸分子擴增的多核苷酸序列。引物的混合物一般包含大體相等含量的正向和反向引物。L代表可被包含在內(nèi)但并非嚴格必不可少的接頭。該接頭可以是包含碳的鏈,例如式為(CH2)n的那些,其中"n"是從1到約1500,例如小于約IOOO,特別的小于IOO,例如從2到50,特別的從5到25。然而,也可使用多種其它的接頭,對它們的結(jié)構(gòu)唯一的限制是接頭必須在隨后計劃使用多核普酸的條件下穩(wěn)定,例如DNA擴增和測序時使用的條件。還可使用那些不只由碳原子組成的接頭。此類接頭包括具有通式為(CHrCH2-0)m的聚乙二醇,其中m為1到600,特別的小于約500。也可修飾主要由碳原子鏈和PEG構(gòu)成的接頭以包含打斷所述鏈的官能團。此類基團的例子包括酮、酯、胺、酰胺、醚、硫醚、亞砜、砜??梢詥为毷褂没蚺c此類官能團的存在組合使用烯類、炔類、芳香族或雜芳族部分,或環(huán)脂類(例如環(huán)己基)。例如,環(huán)己基或苯基可以通過其l位和4位被連接到PEG或(CH2)n鏈上。作為上述主要基于飽和碳原子的線性鏈并任選地插入有不飽和碳原子或雜原子的接頭的替代選擇,可以考慮基于核酸或單糖單元(如葡萄糖)的其它接頭。使用肽作為接頭也在本發(fā)明范圍之內(nèi)。在另一個實施方案中,接頭可包含構(gòu)成擴增引物的一部分但不參與任何發(fā)生在引物上或使用引物進行的反應(yīng)(例如,雜交或擴增反應(yīng))的一個或多個核苷酸。此類核普酸在本文中也可稱為"間隔物"多核普酸。通??砂?到20個,更特別的1到15個或1到10個,更特別的2、3、4、5、6、7、8、9或10個間隔核香酸。最特別的,所述引物包含10個間隔核苷酸??墒褂枚嗑跿間隔物,盡管也可使用其它核香酸和其組合。在一個特別的實施方案中,所述引物可包含10T間隔核苷酸。所述一個或多個間隔核苷酸的功能是將靶標雜交和指導擴增所需的引物部分與同固體支持物相連接的位點(即S1或S2)間隔開來。在5,端包含間隔核苷酸可以顯著改善互補多核普酸與區(qū)域S1或S2雜交的性能。在一個具體的實施方案中,多核苷酸包含10T間隔核苷酸和用于連接固體支持物的5,硫代磷酸酯基團(A部分),盡管如下所述可使用其它的連接部分。正向和反向引物中的序列Sl和S2是以組合的形式通過固相橋聯(lián)擴增反應(yīng)來指導模板擴增的多核苷酸序列。待擴增模板本身必須在3,端包含(當視作單鏈時)能夠與正向引物中序列Sl雜交的序列以及在5'端包含其互補序列能夠與反向引物中序列S2雜交的序列。正向和反向引物寡核香酸中的序列Sl和S2的確切性質(zhì)取決于計劃擴增的^^板的性質(zhì)。Sl和S2必須能夠與待擴增^^板互補鏈的相應(yīng)序列雜交。術(shù)語"雜交"包括引物和模板之間序列特異性結(jié)合。引物與模板鏈上其相應(yīng)序列的結(jié)合應(yīng)在標準PCR中引物和;^板退火所使用的典型條件下發(fā)生。典型的雜交條件為初始變性步驟之后的40"C5xSSC。序列Sl和S2與待擴增^^1鏈上其相應(yīng)序列的完全互補對雜交來說并不是必不可少的。Sl和S2可具有不同的或相同的序列,其長度通常為大約20-30個核苷酸。引物可以包括天然和非天然的DNA堿基、核糖核苷酸或其任何組合,還可包括非天然骨架連接,如二硫鍵或石克代磷酸酯。切割位點X可位于序列Sl或S2內(nèi),或者如果接頭L本身是多核普酸片段,則它們可形成接頭區(qū)域L的一部分。在其它一些實施方案中,切割位點可在序列L和Sl或者L和S2連接處形成,或者在A部分和接頭L(如果存在的話)或在A部分和序列Sl或S2之間(如果L不存在的話)連接處形成。A部分可以是任何允許寡核苷酸引物固定在固體支持物上的化學部分。固體支持物的表面本身可以被官能化以允許引物的連接。可以使用任何合適的共價或非共價連接方法,其中許多是本領(lǐng)域公知的。例如,生物素化的白蛋白(BSA)可以通過蛋白在表面上的物理吸附而形成生物素基團的穩(wěn)定附著。也可使用硅烷進行共價修飾,其被用于將分子連接到固體支持物上,通常是玻璃載片。例如,四乙氧硅烷和三乙氧基國澳乙酰氛基丙基-珪烷(triethoxy畫bromoacetamidopropyl畫silane)的混合物(如l:100的比例)可用于制備官能化的玻璃載片,其允許包含石克代磷酸或硫代磷酸酯官能團的核酸分子附著。使用可以與JU^面反應(yīng)的如生物素-PEG-琥珀酰亞胺酯的合適反應(yīng)性物質(zhì),可以將生物素分子附著到表面上。接著可以將擴增引物的混合物與官能化的固體支持物相接觸。在一個替代性實施方案中,可以使用官能化的聚丙烯酰胺水凝膠來連接引物,其+A部分為含硫親核基團。合適的含有硫親核體的多核普酸例子在Zhaoetal(NucleicAcidsReseach,2001,29(4),955-959)以及Pirrungetal(Langmiur,2000,16,2185-2191)中公開,它包括例如簡單硫醇、硫代磷酸酯和硫代磷酰氨基酸酯(thi叩hosphoramidate)。特定的水凝膠有由以下兩類物質(zhì)混合所構(gòu)成的,(i)第一共聚單體,其是丙烯酰胺、曱基丙烯酰胺、甲基丙烯酸、甲基丙烯酸羥乙基酯或N-乙烯基吡咯烷酮;和(ii)第二共聚單體,它們是式(I)的官能化的丙烯酰胺或丙烯酸酯H2C=C(H)-C(=0)-A-B-C(I)或者式(II)的曱基丙烯酸酯或甲基丙烯酰胺或H2C=C(CH3)-C(=0)-A-B-C-(II)沐中A是NR或O,其中R是氫或包含l到5個碳原子的任選地取代的飽和烴基;-B-是任選地取代的式為-(CH2)n-的亞烷基雙基(biradical),其中n是1到50的整數(shù);其中n=2或更大時,所述亞烷基雙基的一個或多個任選地取代的亞乙基雙基-CH2CHr可以獨立地被亞乙烯基或亞乙炔基所取代;其中n=l或更大時,一個或多個亞甲基雙基-CHr可以被包含4到50個碳原子的任選地取代的單或多環(huán)烴取代,或被相應(yīng)的雜單環(huán)基或雜多環(huán)基雙基取代,其中至少一個CH2或CH2被氧、硫或氮原子或NH基所取代;以及C是和化合物反應(yīng)(以將所述化合物共價結(jié)合到7jC凝膠上)以形成聚合產(chǎn)物的基團。可以通過丙烯酰胺和N-(5-溴乙酰氨基戊基)丙烯酰胺(N國(5-bromoacetamidylpentyl)acrylamide,BRAPA)共聚形成特定的水凝膠。如本文中所用到的,術(shù)語"固體支持物"是指多核苷酸分子連接到其上的物質(zhì)。合適的固體支持物有市售的,其對本領(lǐng)域技術(shù)人員來說是顯而易見的??梢允褂美绮A?、陶資、硅石和硅的材料生產(chǎn)所述支持物。也可以使用具有金表面的支持物。所述支持物通常包含一個平的表面(平面),或至少包含其中待連接的多核苷酸大致在同一平面上的結(jié)構(gòu)。作為替代的,所述固體支持物可以為非平面,例如#*。可使用任何合適的尺寸。例如,所述支持物可以在每個方向上是l到10cm的量級。對于要進行的接枝反應(yīng),將擴增引物的混合物在允許A部分和所述支持物發(fā)生反應(yīng)的條件下施加于(適當官能化的)固體支持物。接枝反應(yīng)的結(jié)果是固體支持物上的引物大體平均分布。在一些特定實施方案中,待擴增模板可以與擴增引物一起在單個接^L^應(yīng)中接枝到固體支持物上。這可以通過將在5,端包含A部分的模板分子添加到引物的混合物中以形成引物-模板混合物來實現(xiàn)。接著該混合物在單步驟中接枝到固體支持物上。然后,可以使用固定化的模板和引物在類似于WO00/18957中所述的反應(yīng)中進行擴增。該反應(yīng)的第一步是表面結(jié)合的模板和表面結(jié)合的擴增引物之間的雜交。如果僅僅引物的混合物接枝到固體支持物表面,并且待擴增模板存在于游離溶液中,則擴增反應(yīng)大體上可如WO98/44151中所述進行。簡單的說,引物連接之后,在允許模板和固定化引物雜交的^下將所述固體支持物與待擴增模板相接觸。通常在合適的雜交條件下將所述模板加入到游離溶液中,i^t本領(lǐng)域技術(shù)人員是明顯的。通常雜交條件為例如40"C5xSSC,其是在起始變性步驟之后進行。接著可以進行固相擴增,擴增的第一步是引物延伸步驟,其中將核苷酸添加到與模板雜交的固定化引物的3'端以生成一個完整延伸的互補鏈。這樣該互補鏈在其3,端包含能夠與固定在固體支持物上的第二引物分子結(jié)合的序列。進一步的擴增輪(與標準PCR反應(yīng)類似)導致形成結(jié)合于固體支持物的模板分子的簇或集群。擴增引物中的序列Sl和S2可以是期望擴增的特定靶標核普酸特異性的,但在另一些實施方案中,序列S1和S2可以是"通用的,,引物序列,其使得可以擴增任何具有已知或未知序列的經(jīng)修飾而其可以被通用引物擴增的乾標核酸??梢酝ㄟ^在待擴增靶標核酸分子的5,端和3,端添加已知接頭序列來修飾靶標雙鏈多核苷酸,由此可制備可用通用引物待擴增的合適模板。乾標分子本身可以是任何需要測序的雙鏈分子(如,人類基因組DNA的隨機片段)。接頭序列使得可以使用具有上述通用結(jié)構(gòu)的正向和反向引物擴增固體支持物上的這些分子以形成簇,其中序列S1和S2是通用的引物序列。所述接頭通常是短鏈寡核普酸,其可以通過常規(guī)方法合成。所述接頭可以通過多種方式(例如亞克隆、連接等)附加到耙標核酸片段的5,端和3,端。更特別的,將兩種不同的接頭序列附加到待擴增靶標核酸分子上使得一個接頭附加到靶標核酸分子的一端而另一個接頭分子連接到靶標核酸分子另一端。包含側(cè)翼是接頭的靶標核酸序列的所得構(gòu)建物在本文中被稱為"模板核酸構(gòu)建物"。在用接頭序列修飾之前可以有利地按尺寸將靶標雙鏈多核苷酸分級。所述接頭包含允許使用固定于固體支持物上的擴增引物分子擴增核酸的序列。所述接頭中的這些序列在本文中可被稱為"引物結(jié)合序列"。為了起到核酸擴增模板的作用,模板構(gòu)建物的一條單鏈必須包含與正向擴增引物中序列Sl互補的序列(這樣所述正向引物分子可結(jié)合并引發(fā)互補鏈合成)以及與反向擴增引物分子中序列S2相對應(yīng)的序列(這樣反向引物分子可以結(jié)合到互補鏈上)。接頭中允許與引物分子雜交的序列通常長約20-30個核苷酸,但是本發(fā)明并不限于此長度的序列。擴增引物中序列Sl和S2確切身份(identity),以及接頭中的相應(yīng)序列,通常來^W本發(fā)明并不重要,只要所述引物分子可以與擴增序列相互作用來指導橋式擴增即可。引物設(shè)計的原則通常對本領(lǐng)域技術(shù)人員來說都是4艮熟悉的。通過WO98/44151或WO00/18957中類似的方法實施的固相擴增將導致生成"橋式"擴增產(chǎn)物的集群的陣列。擴增產(chǎn)物的兩M都在5,端或臨近5,端的位置固定于固體支持物,該連接來自于擴增引物的初始連接。通常,每個集群內(nèi)的擴增產(chǎn)物來自于單乾標分子的擴增。本發(fā)明測序方法的應(yīng)用并不僅限于對擴增反應(yīng)所產(chǎn)生模板的測序。本方法還可以應(yīng)用于對通過適于雜交和測序重復(fù)循環(huán)的任何其它方法固定于支持物上的雙M^^L的測序??赏ㄟ^參考下文實施例進一步理解本發(fā)明。實施例下列為可應(yīng)用于本發(fā)明方法實施的常規(guī)技術(shù)的實施例??梢园凑誢>開的參考文獻W007010251中所述方法制^^蔟,其方案以參考形式并入本文。實施例1:用丙烯酰胺包被玻璃芯片所用的固體支持物通常是8通道玻璃芯片,如SilexMicrosystems(SilexMicrosystem,Sweden)、Mironit(Twente,Nederland)或IMT等公司(Neuchatel,Switzerland)所提供的產(chǎn)品。然而,實驗^^和程序也可以容易地適用于其它固體支持物。按以下步驟清洗芯片純Decon清洗30分鐘、milliQ水清洗30分鐘、INNaOH清洗15分鐘、milliQ水清洗30分鐘、0.1NHC1清洗15分鐘、milliQ水清洗30分鐘。聚合物溶液制備制備10ml2%的聚合混合物-10ml2%丙烯酰胺的milliQ水溶液-165nl100mg/ml的N-(5-溴乙酰氨基戊基)丙烯酖胺(BRAPA)的DMF溶液(23.5mg溶于235nlDMF)-11.5nl的TEMED-100nl50mg/ml過硫酸鉀的milliQ水溶液(20mg溶于400fil水中)首先用氬氣對10ml丙烯酰胺溶液除氣15分鐘。依次將BRAPA、TEMED和過硫酸鉀溶液加入到丙烯酰胺溶液中。接著將混合物快速渦旋混合后立即使用。隨后聚合反應(yīng)在室溫下進行l(wèi)小時30分。然后,用milliQ水清洗通道30分鐘。隨后通it^進口吹氬氣來干燥載片,并將其貯存在低壓干燥器中。實施例2N-f5-溴乙酰Jl^戊基)丙烯酰胺(BRAPA)的合成<formula>formulaseeoriginaldocumentpage35</formula>N-Boc-l,5-二氨基戊烷曱^t酸得自Novabiochem。溴乙酰氯和丙烯酰氯得自Fluka。所有其它試劑均為Aldrich的產(chǎn)品。通過壓力平衡式滴液漏斗在0"C下歷時1小時將丙烯酰氯(1.13毫升,leq)加入到N-Boc-l,5-二氨基戊烷甲笨璜酸(5.2克,13.88mmol)和三乙胺(4.83亳升,2.5eq)在THF(120毫升)中的攪拌懸浮液。在室溫下攪拌反應(yīng)混合物并用TLC檢測反應(yīng)進度(石油醚乙酸乙酯1:1)。兩小時后,濾掉>^應(yīng)中形成的鹽并將濾液蒸發(fā)至干燥。用快速層析純化殘余物(先用純石油醚,然后用最高至60。/。的乙酸乙酯梯度)得到2.56g(9.98mmol,71%)淺褐色固體產(chǎn)物2。NMR(400MHz,d6-DMSO):1.20-1.22(m,2H,CH2),1.29-1.43(m,13H,tBu,2xCH2),2.86(q,2H,J=6.8Hz和12.9Hz,CH2),3.07(q,2H,J=6.8Hz和12.9Hz,CH2),5.53(dd,1H,J=2.3Hz和10.1Hz,CH),6.05(dd,1H,J=2.3Hz和17.2Hz,CH),6.20(dd,1H,J=10.1Hz和17.2Hz,CH),6.77(t,1H,J=5.3Hz,NH),8.04(bs,1H,NH)。C13H24N203的質(zhì)量(電噴霧+)計算值為256,實測值為279(256+Na"。產(chǎn)物2(2.56g,10mmol)溶解于三氟乙酸:二氯甲烷(l:9,100ml)中并在室溫下攪拌。通過TLC監(jiān)測(二氯甲烷曱醇9:1)反應(yīng)進程。結(jié)束時,將反應(yīng)混合物蒸發(fā)至干燥,殘余物與曱苯共蒸發(fā)3次,然后用快速色鐠進行純化(用純二氯曱烷,然后用最高至20%的甲醇梯度)。得到白色粉末狀的產(chǎn)物3(2.43g,9mmo1,90%)。NMR(400MHz,D20):1.29-1.40(m,2H,CH2),1.52(quint.,2H,J=7.1Hz,CH2),1.61(quint.,2H,J=7.7Hz,CH2),2.92(t,2H,J=7.6Hz,CH2),3.21(t,2H,J=6.8Hz,CH2),5.68(dd,1H,J=1.5Hz和10.1Hz,CH),6.10(dd,1H,J=1.5Hz和17.2Hz,CH),6.20(dd,1H,J=10.1Hz和17.2Hz,CH)。C8H16N20的質(zhì)量(電噴霧+)計算值為156,實測值為179(156+Na,。通過壓力平衡滴液漏斗在-60X:下(在杜瓦瓶中cardice和異丙醇浴)歷時l小時將溴乙酰氯(2.07毫升,1.1eq)加入到產(chǎn)物3(6.12g,22.64mmol)和三乙胺(6.94ml,2.2eq)的THF(120ml)混懸液中。然后反應(yīng)混合物在室溫下攪拌過夜,在次日通過TLC(二氯甲烷曱醇9:1)檢測反應(yīng)的完成情況。濾去反應(yīng)生成的鹽并將反應(yīng)混合物蒸發(fā)至干燥。殘余物用色譜純化(用純二氯曱烷,然后再用最高至5%的曱醇梯度)。得到3.2g(11.55mmol,51%)白色粉末狀產(chǎn)物1(BRAPA)。在石油醚乙酸乙酯的混合物中對產(chǎn)物進行重結(jié)晶,得到3g產(chǎn)物1。'HNMR(400MHz,d6-DMSO):1.21-1.30(m,2H,CH2),1.34-1.48(m,4H,2xCH2),3.02-3.12(m,4H,2xCH2),3.81(s,2H,CH2),5.56(d,1H,J=9.85Hz,CH),6.07(d,1H,J=16.9Hz,CH),6.20(dd,1H,J=10.1Hz和16.9Hz,CH),8.07(bs,1H,NH),8.27(bs,1H,NH)。C1()H17BrN202的分子量(電噴霧+)計算值為276或278,實測值為279(278+H",299(276+Na^。實施例3:引物的接枝將SFA包被的流通池(flowcell)置于改裝過的MJ-Research熱循環(huán)儀中,并連接蠕動泵。將10mM磷酸緩沖液(pH7.0)中的(K5nM正向引物和0.5jiM反向引物組成的接枝混合物以60jil/分鐘的流速在20X:下75秒內(nèi)泵入流通池的通道內(nèi)。隨后將熱循環(huán)儀加熱到51.6匸,流通池在該溫度下孵育1小時。在這段時間內(nèi),接枝混合物經(jīng)歷了18輪泵循環(huán)以15fil/分鐘的流速持續(xù)泵入接枝混合物20秒,接著將溶液來回地(以15n1/分如泵入5秒,然后以15nl/分鐘泵出5秒)泵入泵出180秒。在18個泵循環(huán)之后,流通池以15nI/分鐘的流速在51.6n下泵入5xSSC/5mMEDTA清洗,持續(xù)300秒。接著將熱循環(huán)儀冷卻至20"C。通常,所述引物是摻入切割所需的任何特異序列或修飾的5,硫代磷酸酯化寡核普酸。它們的序列和供應(yīng)商根據(jù)它們用于實驗的不同而不同,而在本實施例中,其與模板雙鏈體5,端互補。對于所述的實驗,擴增的簇在接枝引物之一中包含二醇鍵。可以通過將合適的亞磷酰胺中間體加入到用于固相擴增的引物之一中而引入二醇鍵,如W007010251中所述。接枝引物在5,末端含有TM序列,其用作間隔基團以輔助線性化和雜交。在商業(yè)化DNA合成儀上在標準的偶聯(lián)條件下使用二醇亞磷酰胺制備寡核苷酸。氨水中的最終切割/去保護步驟從受保護的二醇部分切割下醋脧基,從而使溶液中的寡核苷酸包含二醇基修飾。接枝到流通池上的兩個引物的序列為P5-5,-PS-TTTTTTTTTT-Diol-AATGATACGGCGACCACCGA-3,和P7-5'-PS-TTTTTTTTTTCAAGCAGAAGACGGCATACGA-3'實施例4:簇形成用于擴增過程的DNA序列是5種單模板序列的混合物,其末端與接枝引物互補。其中一個單模板雙鏈體的全序列如圖12所示,該19個g的可變靶標區(qū)域的序列如圖2中所示。所述雙鏈DNA(1nM)用0.1M氫氧化鈉處理變性,隨后在"雜交緩沖液"(5xSSC/0.1%吐溫)中快速稀釋(snapdilution)至所需的0.2-2pM"工作濃度,,通過使用MJResearch熱循環(huán)儀的熱循環(huán)來進行表面擴增,該儀器與有裝配了Ismatec管(桔黃/黃色,0.51mmID)的8通道蠕動泵IsmatecIPCISM931聯(lián)用。臨擴增反應(yīng)前將單鏈模板與所述接枝引物雜交,因此其是由初始引物延伸步驟而不是由模板變性步驟開始。雜交程序從嚴^"緩沖液中的加熱步驟開始以保證在雜交前完全變性。在雜交后,其是在20分鐘的緩慢冷卻步驟中發(fā)生的,用清洗緩沖液清洗所述流通池5分鐘(0.3xSSC/0.1%吐溫)。典型的擴增過程在下表中有詳細說明,并詳細說明了每個通道的流通體積<table>tableseeoriginaldocumentpage38</column></row><table><table>tableseeoriginaldocumentpage39</column></row><table>雜交預(yù)混物(緩沖液)=5xSSC/0.1%吐溫;雜交混合物=0.1M氫氧化物DNA樣品,在雜交預(yù)混物中稀釋;清洗緩沖液=0.3xSSC/0.1%吐溫;擴增預(yù)混物=21\1甜菜堿,20mMTris,10mM硫酸銨,2mM硫酸鎂,0.1%Triton,1.3%DMSO,pH8.8;擴增混合物=21\1甜菜堿,20mMTris,10mM硫酸銨,2mM硫酸鎂,0.1%Triton,1.3%DMSO,pH8.8加上200nmdNTP混合物和25單位/mL的Taq聚合酶(NEB產(chǎn)品號M0273L)??梢杂枚喾N方法處理簇以便測序?qū)嵤├?:非線性化簇的測序接著通過以15nL/分的流速在所有通道中泵過0.1M氫氧化鈉將所述通道變性,持續(xù)5分鐘。為了幫助鏈分離,將包含氫氧化鈉的芯片加熱到80X:,以15jil/min的流速泵入雜交緩沖液(0.3xSCC)中的測序引物,持續(xù)5分鐘。接著將芯片冷卻至661C,并在此溫度下孵育15分鐘。將芯片冷卻到40C并用O.lxSSC/0.1%吐溫清洗5分鐘。如下所述實施測序酶反應(yīng)的循環(huán),其表現(xiàn)為在非線性化簇和線性化簇上的摻入。對這些圖的分析揭示出非線性化蔟上的摻入程度大約是線性化簇的一半。在用O.lM氫氧化鈉變性之后,使第二測序引物雜交以進行模板其它鏈上的第二測序運行。實施例6:使用單鏈模板上兩步雜交對線性化簇測序步驟l:線性化為了使流通池通道內(nèi)所形成的核酸簇線性化,使線性化緩沖液以15Hl/分的流速在室溫下流過流通池(總體積為300nl每通道),持續(xù)20分鐘,隨后在室溫下流過5分鐘的水。線性化緩沖液由1429nl的水,64mg的高碟酸鈉,1500jil的曱酰胺,60nllMpH為8的Tris,以及11.4pL的3-氨基丙醇組成,混合后終體積為3ml。使高碘酸鹽先與水混合,而Tris與甲酰胺混合。然后兩溶液混合在一起,將3-氛基丙醇加入該混合物。步驟2:封閉可延伸的3,羥基為了制備封閉預(yù)混物,將1360jil的水,170fil的10x封閉緩沖液(NEB緩沖液4;產(chǎn)品號為B7004S),170nl的氯化鈷(25mM)混合,終體積為1700nl。為了制備封閉混合物,將1065.13nl的封閉預(yù)混物,21.12Hl的125nMddNTP混合物,以及13.75jil的TdT末端轉(zhuǎn)移酶(NEB;部分號M0252S)混合,^M、為1100jiL。為了封閉流通池通道中所形成的簇中的核酸,使所述封閉緩沖液流經(jīng)流通池,溫度按以下示例性實施方案中所示進行調(diào)節(jié)。<table>tableseeoriginaldocumentpage40</column></row><table>步驟3:測序引物的變性和雜交為了制備引物混合物,將895.5fil的雜交預(yù)混物/緩沖液和4.5fil的測序引物(100fiM)混合至終體積為900ul。這些反應(yīng)中所用的兩個測序引物的序列如下所示第一讀取的測序引物5,AATGATACGGCGACCACCGAGATGAAGGTATAGAT第二讀取的測序引物5'ACACTCTTTCCCTACACGACGCTCTTCCGATC為了使蔟中的核酸變性并與所述測序引物雜交,將合適的溶液流過流通池,如下所述<table>tableseeoriginaldocumentpage41</column></row><table>在第一測序運行之后,可以重復(fù)該過程以除去第一運行的引物并與第二測序引物雜交。在測序引物變性和雜交之后,流通池即可用于測序。實施例7:DNA測序循環(huán)使用按照國際專利申請WO2004/018493中所述制備的并用四種不同的市售熒光團(MolecularProbesInc.)標記的經(jīng)修飾核苷酸進行測序。一種突變9°N聚合酶(一種包含三突變L408Y/Y409A/P410V和C223S的外切型變體(exo-variant))被用于核苷酸摻入步驟。將#^入混合物、摻入緩沖液(50mMTris-HClpH8.0,6mMMgS04,1mMEDTA,0.05%(v/v)Tween-20,50mMNaCl)以及110nMYAV外切型-C223S和各1的四種經(jīng)標記的經(jīng)修飾核苷酸施加在成蔟模板上,并加熱到45"C。模板在45XM呆持30分鐘,冷卻至20匸并用摻入緩沖液清洗,再用5xSSC/0.05。/。吐溫20清洗。然后,模板暴露于成像緩沖液(新溶解的100mMTrispH7.0,30mMNaCl,0.05%吐溫20,50mM抗壞血酸鈉)。;^板在室溫下用四種顏色掃描。模板接著暴露于如下所述的切割和摻入的測序循環(huán)切割提供切割緩沖液(0.1MTrispH7.4,0.1MNaCl和0.05%吐溫20)。加熱至6ox:。用切割混合液(切割緩沖液中的100mMTCEP)處理所述蔟。共等待15分鐘,另外每4分鐘泵入新鮮緩沖液。冷卻至2ox:。用酶緩沖液清洗。用5xSSC/0.05。/。吐溫20清洗。提供成傳壤沖液。室溫下用4種顏色掃描。摻入提##入緩沖液,加熱到60"C。用摻入緩沖液處理。共等待15分鐘,另外每4分鐘泵入新鮮緩摻入混合液。冷卻至20"C。用摻入緩沖液清洗。用5xSSC/0.05。A吐溫20清洗。提供成^J變沖液。室溫下用4種顏色掃描。重復(fù)所需循環(huán)數(shù)的摻入和切割過程。使用基于全內(nèi)反射的熒光CCD成像設(shè)備檢測摻入的核苷酸。本發(fā)明方法的示意圖在圖1中給出。測序反應(yīng)所得的數(shù)據(jù)列于圖2和3中。每一運行中所得的測序數(shù)據(jù)在質(zhì)量上相當,并且大于99%的第一運行的簇也在第二運行中產(chǎn)生測序數(shù)據(jù)。另外,每個來自第二運行的序列可以與文庫中五個預(yù)期序列之一相對應(yīng)。該數(shù)據(jù)明確的顯示,如下各項是可能的將第一測序引物與線性化簇雜交、得到測序讀取、除去第一延伸引物、與第二引物雜交以及得到第二讀取。盡管所示數(shù)據(jù)是從已知序列的單^^L的混合物中得到的,以mi該方法的有效性,但是模板的序列對本發(fā)明的有效性并不重要,因此任何使用本文所述的方法制備和擴增的模板或3,和5'端修飾的模板文庫都在本發(fā)明范圍之內(nèi)。權(quán)利要求1.一種對靶標雙鏈多核苷酸第一和第二區(qū)域成對測序的方法,其中所述第一和第二區(qū)域在同一靶標雙鏈多核苷酸上,該方法包括(a)提供固體支持物,其上已固定化了多個雙鏈模板多核苷酸,每個多核苷酸都是由其5’端連接在所述固體支持物上的互補的第一和第二模板鏈所形成的,其中每個雙鏈模板多核苷酸都包含靶標雙鏈多核苷酸;(b)對所述多個雙鏈模板多核苷酸進行處理使所述雙鏈模板多核苷酸變性,以允許測序引物的雜交;(c)將第一測序引物與(b)部分中所生成的模板多核苷酸之一雜交;(d)使用利用了聚合酶和經(jīng)標記核苷酸的引物延伸循環(huán)來進行第一測序反應(yīng)以監(jiān)測經(jīng)標記核苷酸在第一測序引物上的摻入,從而生成第一延伸測序引物,并確定模板多核苷酸第一區(qū)域的序列;(e)除去步驟(d)中所述延伸測序引物;(f)將第二測序引物與步驟(c)的所述模板多核苷酸之一或其互補序列雜交;以及(g)使用利用了聚合酶和經(jīng)標記核苷酸的引物延伸循環(huán)來進行第二測序運行以監(jiān)測經(jīng)標記核苷酸在第二測序引物上的摻入,從而生成第二延伸測序引物,并確定模板多核苷酸第二區(qū)域的序列,其中確定所述模板多核苷酸的第一和第二區(qū)域的序列實現(xiàn)了所述靶標雙鏈多核苷酸的所述第一和第二區(qū)域的成對測序。2.根據(jù)權(quán)利要求1的方法,其中兩條鏈都保持連接于所述表面,并且通過加熱和冷卻實施步驟(b)和(c)。3.根據(jù)權(quán)利要求1的方法,其中兩條鏈都保持連接于所述表面,并且通過加熱和冷卻實施步驟(e)和(f)。4.根據(jù)權(quán)利要求1的方法,其中兩條鏈都保持連接于所述表面,并且通過化學變性實施步驟(b)。5.根據(jù)權(quán)利要求1的方法,其中兩條鏈都保持連接于所述表面,并且通過化學變性實施步驟(e)。6.根據(jù)權(quán)利要求4或5的方法,其中使用氫氧化鈉溶液、甲酰胺溶液或尿素溶液實施所迷化學變性。7.根據(jù)權(quán)利要求6的方法,其中氫氧化鈉溶液濃度大于0.05M。8.根據(jù)權(quán)利要求1的方法,其中所述靶標雙鏈多核香酸在所述靶標雙鏈多核苷酸的第一和第二區(qū)域之間包含已知的引物區(qū)域,并將所述靶標雙鏈多核苷酸變性以允許測序引物雜交。9.根據(jù)權(quán)利要求8的方法,其中內(nèi)部的已知引物區(qū)域含有可以被限制性酶識別的位點,其中使用所述限制性酶實施步驟(b)中的所述處理以使所述耙標雙鏈多核苷酸變性,使用加熱來從表面除去非共價連接的單鏈多核苷酸區(qū)域。10.根據(jù)權(quán)利要求8的方法,其中內(nèi)部的已知引物區(qū)域包含可以被限制性酶識別的位點,其中使用所述限制性酶實施步驟(b)中的所述處理以使所述靶標雙鏈多核苷酸變性,使用化學變性來從表面除去非共價連接的單鏈多核香酸區(qū)域。11.根據(jù)權(quán)利要求10的方法,其中使用氫氧化鈉溶液、甲酰胺溶液或尿素溶液實施所述化學變性。12.根據(jù)權(quán)利要求11的方法,其中氫氧化鈉溶液濃度大于0.05M。13.根據(jù)權(quán)利要求9的方法,其中使用所述第一和第二測序引物對所述固定化多核苷酸的第一和第二區(qū)域進行測序,所述測序引物與所述已知內(nèi)部引物在所述限制性位點的某一側(cè)的不同區(qū)域互補。14.根據(jù)權(quán)利要求8的方法,其中將第一或第二鏈中任意一條從表面切下,留下一端固定的雙鏈多核苷酸,所述雙鏈多核苷酸包含兩個能與測序引物雜交的已知區(qū)域,所述的方法還包括處理所述雙鏈多核苷酸以生成固定化單鏈多核苷酸。15.根據(jù)權(quán)利要求14的方法,其中所述切割步驟是化學或光化學處理以切割所述多核普酸一條鏈的5,端。16.根據(jù)權(quán)利要求15的方法,其中所述雙鏈多核普酸通過二醇鍵連接,該鍵通過包括高碘酸鹽的化學切割劑處理而被切割。17.根據(jù)權(quán)利要求14的方法,其中所述切割包括切割所述多核苷酸的固定化鏈之一的酶處理。18.根據(jù)權(quán)利要求17的方法,其中使用限制性核酸內(nèi)切酶進行切割。19.根據(jù)權(quán)利要求14的方法,其中通過加熱使所述雙鏈多核苷酸變性。20.根據(jù)權(quán)利要求14的方法,其中通過化學變性處理使所述雙鏈多核苷酸變性。21.根據(jù)權(quán)利要求20的方法,其中使用氫氧化鈉溶液、甲酰胺溶液或尿素溶液實施所述化學變性。22.根據(jù)權(quán)利要求21的方法,其中氫氧化鈉溶液濃度大于0.05M。23.根據(jù)前面任一權(quán)利要求的方法,其中步驟(a)中多個模板雙鏈多核苷酸存在于成簇陣列上。24.根據(jù)權(quán)利要求23的方法,其中步驟(a)中多個模板雙鏈多核苷酸存在于所述成簇陣列上的單個簇內(nèi)。25.根據(jù)前面任一權(quán)利要求的方法,其中所述成簇陣列是通過固相核酸擴增形成的。26.根據(jù)權(quán)利要求l的方法,其中針對包含不同序列的多個模板多核苷酸同時實施對靶標雙鏈多核苷酸第一和第二區(qū)域的成對測序,其中所述多個模板多核苷酸固定于單個固體支持物上。全文摘要本發(fā)明提供了一種對雙鏈多核苷酸模板進行成對測序的方法,本方法可以確定多核苷酸模板上兩個不同且分開的區(qū)域中的核苷酸序列。文檔編號C12Q1/68GK101415839SQ200780010295公開日2009年4月22日申請日期2007年2月8日優(yōu)先權(quán)日2006年2月8日發(fā)明者喬納森·馬克·布特爾,埃里克·漢斯·韋爾馬斯,大衛(wèi)·本特利,尼爾·安托尼·戈姆利,托比亞斯·威廉·巴爾·奧斯特,文森特·彼得·史密斯,杰夫雷·保羅·史密斯,格拉哈姆·約翰·沃斯利,科林·洛伊德·巴爾內(nèi)斯,羅伯托·里加蒂申請人:億明達劍橋有限公司