專利名稱:選擇探針擴(kuò)增的制作方法
選擇探針擴(kuò)增 發(fā)明背景本發(fā)明涉及用于選擇、分離和/或擴(kuò)增核酸樣品中的預(yù)指定序列 的方法、探針、裝置、試劑盒等。本發(fā)明在單一反應(yīng)混合物中使用 多種選擇探針(經(jīng)常為數(shù)千種)。按常規(guī)使用聚合酶鏈反應(yīng)(PCR)擴(kuò)增核酸樣品的預(yù)指定區(qū)域或片 段。經(jīng)由多個(gè)循環(huán)的變性和退火,PCR產(chǎn)生許多額外的片段拷貝。 通常,核酸樣品含許多被排除在擴(kuò)增之外的其它序列區(qū)。在這些情 況下,PCR有效地將預(yù)指定的目標(biāo)序列由核酸序列的剩余部分中選 擇或分離出來。在許多目標(biāo)應(yīng)用中,PCR用于擴(kuò)增核酸樣品中的多個(gè)不同序列。 這可在樣品含相對(duì)少的待擴(kuò)增序列時(shí)成為有效工具,但在有許多在 研序列時(shí)其變得昂貴和耗時(shí)。待擴(kuò)增的每個(gè)序列都需要其自身獨(dú)特 的PCR引物組。這些引物組的生產(chǎn)或獲得是昂貴的。此外,直至最 近,每個(gè)序列還都需要在其自身反應(yīng)容器中與其自身PCR反應(yīng)物進(jìn) 行單獨(dú)的PCR擴(kuò)增反應(yīng)。多重PCR是解決這些難題中的某一些的一種方法。多重PCR在 單個(gè)反應(yīng)容器中擴(kuò)增多個(gè)序列。在多重PCR中,所述容器含分析中 的樣品、待擴(kuò)增的每個(gè)序列的特有引物組以及所有擴(kuò)增反應(yīng)共享的 聚合酶和三磷酸脫氧核糖核芬酸(dNTP-例如,dATP、 dCTP、 dGTP 和dTTP)。因此,多重PCR已有可能在單一反應(yīng)混合物中同時(shí)擴(kuò)增 數(shù)百個(gè)序列。這可極大地提升效率。但是,待擴(kuò)增的各個(gè)序列仍需 要特有的引物組,因此實(shí)施過程的成本幾乎與待擴(kuò)增或分離的序列 數(shù)成比例。此外,在許多應(yīng)用中必須要擴(kuò)增遠(yuǎn)多于數(shù)百個(gè)的序列。 例如,完全測(cè)定高等物種個(gè)體的基因型需要擴(kuò)增成千上萬的序列。
因此,必須進(jìn)行許多單獨(dú)的多重PCR反應(yīng)。顯然,即便通過多重PCR使效率增加,但該方法也可變得非常昂貴和耗時(shí)。人基因組提供了特別復(fù)雜的分析樣品。其看起來含約5百萬至 約8百萬的單核苷酸多態(tài)性(SNP)。其中,約250,000個(gè)被認(rèn)為是完 全測(cè)定個(gè)體基因型所必需的。荻取此完整SNP組的信息有可能需要 成千上萬個(gè)不同的多重PCR反應(yīng)。這為解開最近通過作圖完整人類 基因組獲得的治療潛力設(shè)置了明顯的實(shí)施障礙。用于由核酸樣品中分離或選擇多個(gè)序列的更有效技術(shù)應(yīng)使本領(lǐng) 域得到重要發(fā)展。發(fā)明概述本發(fā)明提供一種通過使用在單一介質(zhì)中的多種獨(dú)特選擇探針(通 常數(shù)千種這種探針),由核酸樣品中分離或選擇多種序列的先進(jìn)技術(shù)?;パa(bǔ)。例如,每個(gè)選擇探針都可與含一個(gè)或多個(gè)用于測(cè)定生物體基 因型的SNP的序列互補(bǔ)。本發(fā)明方法允許單鏈的(例如變性的、雙鏈 的)選擇探針與樣品序列退火或雜交,所述樣品序列具有由選擇探針 序列指定的獨(dú)特靶序列(例如互補(bǔ)于選擇探針序列)。利用合適的技術(shù) 將不與選擇探針退火或雜交的樣品序列與結(jié)合序列分離。然后結(jié)合 的序列可自由提供分離靶序列的混合物,該混合物可根據(jù)需要用于 現(xiàn)有應(yīng)用。例如,分離的靶序列可與核酸陣列接觸,以測(cè)定由其取 樣的生物體的基因型。本發(fā)明的 一個(gè)方面提供一種由核酸樣品選擇或分離靶核酸序列 的方法。所述方法可以下列順序的操作為特征(a)由所述樣品產(chǎn)生 核酸片段;(b)擴(kuò)增所述核酸片段;(c)在促進(jìn)選擇探針和互補(bǔ)于選擇 探針的擴(kuò)增核酸片段之間退火的條件下,使擴(kuò)增核酸片段與單 一 反 應(yīng)介質(zhì)中的至少約2000種或至少約5000種或至少約10,000種不同 的選擇探針接觸;(d)去除未強(qiáng)結(jié)合選擇探針的擴(kuò)增核酸片段;和(e)
由選擇探針釋放退火的擴(kuò)增核酸片段D在該方法中,要理解的是, 選擇探針具有與靶核酸序列互補(bǔ)或接近互補(bǔ)的序列。因此,退火的擴(kuò)增核酸片段含所述靶核酸序列。所述方法有效地選擇或分離所述 靶核酸序列。所述方法可包含基于(e)中釋放的靶核酸序列表征核酸樣品的進(jìn) 一步操作。在一個(gè)實(shí)施方案中,這可通過將靶核酸序列應(yīng)用于核酸 陣列來實(shí)現(xiàn)。為利于此操作,所述方法還可(i)擴(kuò)增(e)中釋放的靶核 酸序列,和(ii)標(biāo)記靶核酸序列,之后使它們與核酸陣列接觸。按照 另一個(gè)實(shí)施細(xì)節(jié),所述方法在標(biāo)記和/或接觸陣列前進(jìn)一步片段化耙 核酸片段。選擇用于產(chǎn)生樣品片段(操作(a))的條件,以提供大小和結(jié)構(gòu)適于 所述方法的余下步驟的片段。在一個(gè)實(shí)施方案中,片段化產(chǎn)生的核 酸片段具有約25個(gè)至約2,000個(gè)或更多個(gè)石成基對(duì)、優(yōu)選約500個(gè)堿 基對(duì)的平均長(zhǎng)度。對(duì)于某些方法,片段化產(chǎn)生的核酸片段具有的平 均大小允許在微陣列上進(jìn)行基因型測(cè)定,無須進(jìn)一步片段化。在某 些情況下,避免稱為PCR抑制作用的現(xiàn)象需要片段化以兩步進(jìn)行, 一步在擴(kuò)增前,另一步在擴(kuò)增后(操作(b))。在一個(gè)具體實(shí)施方案中,使用PCR對(duì)通過片段化操作(a)產(chǎn)生的 基本所有核酸片段實(shí)現(xiàn)擴(kuò)增。該方法可設(shè)計(jì)得使其在不需為每個(gè)片 段提供特有引物的情況下完成。例如,該方法可包括將"連接物,, 連接至核酸片段末端。連接物包含與用于PCR擴(kuò)增的通用引物互補(bǔ)量不同序列時(shí),那么僅需要一個(gè)或幾個(gè)引物組來擴(kuò)增所有片段。換 句話說,有限的引物組可擴(kuò)增所有具有連接物的片段,而不考慮在 片段中包含的具體序列。在一個(gè)具體實(shí)施方案中,連接物是具有單 鏈尾或突出端的雙鏈序列。在另一個(gè)具體實(shí)施方案中,連接物具有 額外功能它們用作隨后擴(kuò)增」繰作中的PCR引物。在該實(shí)施方案中, 某些但不是全部連接物連接至樣品片段。保留在溶液中的連接物用 于才是供隨后需要的引物。在一個(gè)具體實(shí)施方案中,使用PCR對(duì)由靶核酸產(chǎn)生的基本所有的核酸片段進(jìn)行擴(kuò)增,之后例如通過在操作(e)后與微陣列接觸進(jìn)一 步分析。該實(shí)施方案可使用與用于擴(kuò)增(操作(b)中的)核酸片段的引物 具有相同序列的引物,但可加入單鏈引物,來代替要使用的過量雙 鏈連接物。所述方法將結(jié)合選擇探針的片段與不結(jié)合的片段分離。這可以 多種方式完成,在一種方法中,選擇探針(可為單鏈的或雙鏈的)結(jié)合 固體基質(zhì),固體基質(zhì)可被清洗或被處理,以去除未結(jié)合的樣品片段。 為實(shí)施此方法,選擇探針可首先與擴(kuò)增的核酸片段接觸(操作(c)),然 后連接至固體基質(zhì)。至少 一部分選擇探針將在操作(c)和(d)之間與擴(kuò) 增的核酸片段退火。為利于選擇探針連接至固體基質(zhì),所述探針可 包含緊密結(jié)合固體基質(zhì)的部分。為去除未強(qiáng)結(jié)合選擇探針(并因此不強(qiáng)結(jié)合固體基質(zhì))的擴(kuò)增核酸 片段,該方法可包括清洗基質(zhì),以去除未結(jié)合或弱結(jié)合的核酸片段。 在一種方法中,其包括在由結(jié)合選擇探針中去除部分退火擴(kuò)增核酸 片段的條件下使固體基質(zhì)接觸溶液。此部分退火的擴(kuò)增核酸片段可 包含一個(gè)或多個(gè)相對(duì)于靶序列的錯(cuò)配,因此可能與任何選擇探針都 不完全互補(bǔ)。本發(fā)明的顯著利益是在單一反應(yīng)介質(zhì)中選擇或分離成千上萬的 不同靶序列的能力。為此,所述反應(yīng)介質(zhì)可包含成千上萬的序列特 異性選擇探針;例如約105至約108種這種選擇探針。在該范圍內(nèi), 當(dāng)使用僅幾千種(例如至少約1,000、 2,000、 5,000、 10,000、 50,000、 100,000、 1,000,000或10,000,000種)獨(dú)特選擇探針時(shí),仍可實(shí)現(xiàn)超越 多重PCR的顯著優(yōu)勢(shì)。本發(fā)明的另 一 方面涉及使用單 一 引物用于初始擴(kuò)增的方法。該 方法可以以下操作為特征(a)將連接物序列加至混合物中的靶和非 靶核酸片段的末端;(b)進(jìn)行聚合酶鏈反應(yīng)來擴(kuò)增靶和非輩巴片段,其
中除了通過變性過量連接物提供的引物序列以外,沒有擴(kuò)增耙和非靶片段必需的引物序列;(c)在促進(jìn)選擇探針和靶核酸片段退火的條 件下使擴(kuò)增的靶和非靶片段與多種選擇探針同時(shí)接觸;和(d)將未退 火和部分退火的非靶核酸片段與結(jié)合所述選擇探針的退火革巴核酸片 段分離,由此選擇靶核酸片段。同上述方法一樣,選擇探針含與耙 核酸片段的序列互補(bǔ)的序列。優(yōu)選地,連接物序列含長(zhǎng)約15-40個(gè)堿 基對(duì)的序列和/或相對(duì)片段末端數(shù)以約10至100倍過量的范圍過量存 在。在一個(gè)實(shí)施方案中,連4秦物序列是雙鏈核酸序列。其可具有一 個(gè)平端和一個(gè)非平端(粘性末端)。在該實(shí)施方案中,所述平端可用于 連接至核酸片段末端。為防止自身退火,可設(shè)計(jì)具有粘性末端的雙 鏈連接物,以具有不與其自身互補(bǔ)的突出端。此外,為防止連接物如5'磷酸基團(tuán))。本發(fā)明的再另 一 方面涉及一 組選擇探針,它們同時(shí)用于將靶核 酸片段和非耙核酸片段分離。這種探針組可具有如下特征(a)在同 一介質(zhì)中具有至少約I,OOO或5,000或IO,OOO種不同的選擇探針,和 (b)其中各個(gè)不同的選擇探針均長(zhǎng)約20-1000個(gè)堿基對(duì)。在一個(gè)實(shí)施 方案中,各個(gè)選擇探針都具有與不同靶序列互補(bǔ)的序列,所述靶序 列包含至少一個(gè)不同的SNP,全部存在于單個(gè)基因組中。在某些實(shí) 施方案中,各個(gè)不同的靶序列zf又包含一個(gè)SNP。在其它實(shí)施方案中, 各個(gè)不同的靶序列包含至少兩個(gè)或更多個(gè)SNP。在再其它實(shí)施方案 中,某些靶序列僅包含一個(gè)SNP,而其它靶序列包含兩個(gè)或更多個(gè) SNP。選擇探針可為雙鏈的或單鏈的。它們可通過各種技術(shù)如特異性 PCR反應(yīng)來制備。探針組可包含約104-107種不同的選擇探針,或在 更特定的情況下包含約104-105種不同的選擇探針。在某些實(shí)施方案 中,選擇探針是長(zhǎng)約50-200個(gè)堿基對(duì)的PCR擴(kuò)增子。
在又一個(gè)實(shí)施方案中,各個(gè)不同的選擇探針除了包含選擇探針 序列之外,還包含利于結(jié)合固體基質(zhì)的部分。作為實(shí)例,所述部分 可為生物素或鏈霉抗生物素蛋白。本發(fā)明的另 一 方面提供由非靶核酸片段中選擇靶核酸片段的試劑盒。此試劑盒包含(i)如上所述的選擇探針組(例如在同一介質(zhì)中的 至少約1,000或2,000或5,000或10,000種不同的選擇探針);和(ii) 固體基質(zhì),其具有結(jié)合選擇探針上的所述部分的結(jié)構(gòu)特征,由此有 利于選擇探針在固體基質(zhì)上的固定化。作為實(shí)例,所述固體基質(zhì)可 采用珠的形式。此外,選擇探針可包含利于結(jié)合固體基質(zhì)的部分(利 用表面特征)。在某些情況下,所述試劑盒還將包含用于擴(kuò)增核酸片 段的引物和聚合酶。其還可包含微陣列,所述微陣列包含與耙核酸 片段互補(bǔ)的序列。在本發(fā)明的一個(gè)具體實(shí)施方案中,完整順序的操作包括(l)由 基因組產(chǎn)生合適大小的核酸片段,(2)向片段的兩個(gè)末端加入通用連 接物,以便允許用一個(gè)引物或單一引物組擴(kuò)增,(3)擴(kuò)增所述片段,(4) 退火擴(kuò)增片段和與目標(biāo)SNP位置的序列互補(bǔ)的選擇探針(所述探針包 含生物素或允許附著至固體基質(zhì)的其它分子特征),(5)連接選擇探針 (連同互補(bǔ)序列)至固體基質(zhì),(6)清洗基質(zhì),以去除未結(jié)合和松散結(jié)合 的基因組片段,(7)通過變性將互補(bǔ)基因組片段與固定化選擇探針分 離,(8)使用與用于初始擴(kuò)增過程的引物具有相同核香酸序列的引物 擴(kuò)增選定的基因組片段,(9)將擴(kuò)增片段片段化為適于和微陣列結(jié)合 的較小片段,和(10)將所述片段與微陣列上的耙探針雜交,以測(cè)定基 因組的基因型。本發(fā)明的這些和其它特征和優(yōu)勢(shì)將在下文參考附圖更詳細(xì)地描述。附圖簡(jiǎn)述
圖1是一幅程序流程圖,描繪了按照本發(fā)明的實(shí)施方案由樣品
中分離靶核酸序列的具體方法圖2A和2B圖解了核酸鏈片段化為多個(gè)片段,其中一些片段包 含目標(biāo)靶序列。圖3A圖示了圖2B的片段,連接物連接至所述片段的末端,以 利于隨后的擴(kuò)增。圖3B圖解了用于將雙鏈連接物連接至核酸片段平端的連接步驟。圖3C顯示了連接物結(jié)構(gòu),其中連接物的平端設(shè)計(jì)得沒有連接部 分(例如磷酸基團(tuán)),由此防止自身連接。圖3D圖解了具有連接的連接物的片段鏈的聚合,以去除雙鏈結(jié) 構(gòu)中缺口位之前的連接物序列。圖4A描繪了一種介質(zhì),其中靶序列的選擇可通過使用選擇探針 來實(shí)現(xiàn)。圖4B描繪了處理后的圖4A介質(zhì),以變性初始序列,然后在促 進(jìn)單鏈選擇探針和單鏈靶核酸片段結(jié)合的條件下使它們?cè)偻嘶稹?圖5圖解了含選擇探針的雙鏈核酸與固體基質(zhì)的固定化。 圖6顯示了選擇探針和靶核酸序列中的SNP位之間比對(duì)的3個(gè)實(shí)例。圖7描繪了樣品核酸片段可"結(jié)合"選擇探針的兩種不同情況, 在一種情況下緊密結(jié)合,在另一種情況下松散結(jié)合。圖8描繪了擴(kuò)增和進(jìn) 一 步片段化分離的靶核酸序列的步驟。 圖9圖解了分離的靶序列與核酸陣列如DNA微陣列的接觸。優(yōu)選實(shí)施方案的描述《r賴迷本發(fā)明使用單一介質(zhì),其含至少約1000、 2000、 5000、 IO,OOO、 30,000、 50,000、 80,000、 IOO,OOO、 1,000,000或10,000,000種不同的 選擇探針。各種選擇探針都具有與不同的目標(biāo)靶(例如與特定SNP相 關(guān)的序列)互補(bǔ)的序列。使用選沖奪介質(zhì),使核酸樣品(例如基因組DNA) 的片段與選擇探針退火,由此變成"選定的"。因此,在使用單一 介質(zhì)的單步驟中,由樣品中的非靶片段中同時(shí)選擇成千上萬的靶片 段。該方法與多重PCR相比有利,在多重PCR中,僅可在單一反應(yīng) 介質(zhì)中同時(shí)存在幾百個(gè)選擇性擴(kuò)增。筒而言之,本發(fā)明在非常復(fù)雜的核酸樣品中有效富集靶序列。選擇介質(zhì)自身表現(xiàn)出了本領(lǐng)域的進(jìn)步。在一個(gè)實(shí)施例中,其包含至少約10,000種不同選擇探針,每個(gè)探針約50-500個(gè)堿基對(duì)長(zhǎng), 含有利于連接至固體基質(zhì)的部分,由此有利于退火的靶片段與未退 火的非靶片段的分離。另 一個(gè)將在下文更詳細(xì)解釋的目標(biāo)用途是通用連接物序列的用 途,該用途允許單一引物擴(kuò)增由基因組樣品產(chǎn)生的成千上萬的所有 核酸片段。同時(shí)擴(kuò)增的樣品片段將具有許多不同的序列。如果以后 在所述方法中使用第二次擴(kuò)增,則可再使用相同的單一引物。例如, 如果通過結(jié)合至選擇探針選定的靶片段要進(jìn)一步擴(kuò)增,則可使用相 同引物來單獨(dú)地?cái)U(kuò)增靶片段。用于本發(fā)明代表性方法的一系列操作的一般概述示于圖1。如圖 所示,以參考號(hào)101標(biāo)示整種方法,該方法以核酸樣品(例如復(fù)雜的 基因組樣品)的片段化開始。參見操作103。如下所釋,可為此使用 各種片段化技術(shù)。針對(duì)給定實(shí)施措施而選擇的 一種技術(shù)將產(chǎn)生期望 的大小范圍和最終結(jié)構(gòu)的片段。接著,如框105所示,將連接物連接至在操作103中產(chǎn)生的樣 品片段。使用的連接物允許使用少量引物(在某些實(shí)施方案中僅1種) 擴(kuò)增所有片段,而與序列無關(guān)。所述連接物具有經(jīng)選擇與引物互補(bǔ)的序列。如下所釋,在某些實(shí)施方案中,溶液中過量的連接物自身 可用作引物。在連接物已連接后,如框107所示擴(kuò)增樣品。典型地, 其包括采用合適引物如游離連接物序列的PCR法。接著,在操作109中,擴(kuò)增的樣品被變性,以產(chǎn)生單鏈序列,
該序列隨后與大量收集的選擇探針退火,每個(gè)探針都具有與要由基 因組樣品分離的特定靶序列互補(bǔ)的序列。選擇探針可以單鏈形式導(dǎo) 入,或者可以雙鏈形式導(dǎo)入,并與擴(kuò)增的樣品片段同時(shí)變性。如上 所示,單一液體介質(zhì)包含許多不同的探針序列,經(jīng)常包含成千上萬 的不同探針序列。這使得靶序列的選擇遠(yuǎn)比現(xiàn)有技術(shù)所提供的更有 效。在退火步驟結(jié)束后,許多單鏈選擇探針將與樣品的互補(bǔ)耙片段 退火,以產(chǎn)生雙鏈核酸序列。然后如框111所示將這些雙鏈核酸序 列連接至固體基質(zhì)。在一個(gè)實(shí)施方案中,選擇探針包含有利于連接 至固體基質(zhì)的部分,由此將固定化限于含至少 一條選擇探針單鏈的核酸。接著,如框113所示,未結(jié)合的片段由固體基質(zhì)中去除。當(dāng)然, 所述基質(zhì)仍將含有固定化的選擇探針,其中一些與互補(bǔ)基因組片段 退火。去除操作113可使用限定的清洗方案,例如下文描述的方案。程序101中的下一個(gè)操作包括由連接至固體基質(zhì)的選擇探針釋 放捕獲的單鏈片段(其具有靶序列)。這可簡(jiǎn)單地包括使固體基質(zhì)暴露 于變性結(jié)合的雙鏈片段的條件。因?yàn)閮H有選擇探針含連接其至固體 基質(zhì)的部分,所以捕獲的靶片段自由地再進(jìn)入溶液中用于進(jìn)一步的 分析。在此分析之前,靶片段可任選地如框117所示擴(kuò)增。再者, 根據(jù)分析技術(shù),片段可能需要進(jìn)一步片段化為較小尺寸,以利于其 捕獲、操作和進(jìn)一步分析。最后,如框119所示,進(jìn)一步分析分離 的耙片段,例如確切地測(cè)定哪個(gè)耙序列存在于基因組樣品中。如所 示,其可使用固定化核酸序列的微陣列實(shí)現(xiàn)。也可使用其它技術(shù), 如定向測(cè)序。并非程序101中的所有"t喿作都是本發(fā)明的所有實(shí)施措施所必須 的。例如,某些實(shí)施方案可將樣品片段與預(yù)固定的單鏈選擇探針雜 交。在這種實(shí)施方案中,選擇探針與固定它們的固體載體(例如珠、 柱、微陣列等)一起提供。在此情況下,靶樣品片段將與已存在于固 體基質(zhì)上的單鏈選擇探針雜交。在該實(shí)施方案中不需要將與靶片段 雜交的探針連接至固體基質(zhì)的分離步驟。顯然,探針可在雜交前于 分離操作中連接至基質(zhì)。所述程序的其它具體步驟可為通用的。因此,所述方法的可變特征包括以下幾項(xiàng)(l)片段化核酸樣品,以產(chǎn) 生多個(gè)核酸片段;(2)將擴(kuò)增的核酸片段與選擇探針退火或雜交,所 述選擇探針具有與接近SNP或其它目標(biāo)特征的基因組序列互補(bǔ)的序 列;(3)將不結(jié)合選擇探針的核酸片段與結(jié)合選擇探針的核酸片段分 離;和(4)測(cè)定先前結(jié)合至選擇探針的靶核酸片段的基因型,由此選 擇性地測(cè)定僅在目標(biāo)基因座(例如SNP)處的核酸樣品的基因型。捧品及^^發(fā)如所示,本發(fā)明程序針對(duì)核酸樣品實(shí)施。所述樣品具有靶和非 靶序列。所述程序通過選擇或分離耙序列而富集樣品。在這樣做時(shí), 所述程序還可擴(kuò)增靶序列。 一般來說,在復(fù)雜樣品中存在至少幾百 個(gè)或幾千個(gè)或幾萬個(gè)不同的靶特征或序列的情況下,本發(fā)明提供了 其超越現(xiàn)有技術(shù)的最大優(yōu)勢(shì)。核酸樣品得自所研究的生物體,并可使用例如生物活檢品、死 后組織樣品和由任何生物體的眾多產(chǎn)物提取來獲得。在許多目標(biāo)應(yīng) 用中,所述樣品將包含基因組材料。目標(biāo)基因組可為任意生物體的 基因組,高等生物體如靈長(zhǎng)類動(dòng)物經(jīng)常是最令人感興趣的?;蚪M DNA可由實(shí)際上任意的組織來源荻得。便利的組織樣品包括全血和 血制品(除了純紅細(xì)胞以外)、精液、唾液、淚液、尿、糞便材料、汗 液、口腔材料、皮膚和頭發(fā)。核酸樣品可為DNA、 RNA或其化學(xué)衍 生物,其可以單鏈或雙鏈形式提供。RNA樣品也經(jīng)常進(jìn)行擴(kuò)增。在 此情況下,擴(kuò)增通常在逆轉(zhuǎn)錄之前。所有表達(dá)的mRNA的擴(kuò)增都可 如共同擁有的WO 96/14839和WO 97/01603所述進(jìn)行。在一個(gè)具體實(shí)施方案中,目標(biāo)靶特征是含SNP的相對(duì)短的序列。 如上所示,對(duì)人類基因組而言,有約5百萬至8百萬個(gè)已知SNP。
本發(fā)明提供了一種用于有效分離和擴(kuò)增與這些SNP相關(guān)的序列的方法。可使用本發(fā)明分離的其它靶特征(除SNP以夕卜)包括插入、缺失、反轉(zhuǎn)、轉(zhuǎn)座、其它突變、微衛(wèi)星、重復(fù)序列一尤其是可通過其核酸 序列辨別的任意特征。這些特征可存在于例如外顯子或其它基因區(qū) 中,存在于啟動(dòng)子或其它調(diào)節(jié)序列中,或存在于結(jié)構(gòu)區(qū)(例如中心體或端粒)中。不考慮SNP或其它特征是否用作靶,本發(fā)明可用于廣泛 的用途,包括針對(duì)特定基因靶(例如涉及藥物響應(yīng)或藥物開發(fā)的靶)的 藥物研究、表型研究、結(jié)合研究、集中于單個(gè)染色體或含基因組的 一部分染色體的研究、集中于表達(dá)模式的使用例如來源于mRNA的 探針的研究、集中于基因組的編碼區(qū)或調(diào)節(jié)區(qū)的研究以及僅集中于說,可基于許多不同的標(biāo)準(zhǔn)或目標(biāo)特性由樣品選擇和分離靶序列。 在其它實(shí)例中,基于將如何分析和處理靶序列,例如基于將應(yīng)用靶 序列的DNA微陣列的設(shè)計(jì),選擇靶序列。正如所釋,原始核酸樣品可被片段化,以產(chǎn)生許多不同的核酸 片段,其中一些具有靶特征或目標(biāo)序列,而另一些沒有。當(dāng)然,初 始樣品有可能將以合適大小的片段化形式和不需要單獨(dú)的片段化操 作的狀態(tài)提供。所有片段(靶片段和相似的非靶片段)通常具有某些共 有特征,例如通用的大小范圍和末端特征(例如平端對(duì)粘性末端)。片 段群可由平均尺寸和尺寸分布以及靶序列的出現(xiàn)率進(jìn)一步表征。片 段化狀況決定了這些特征。圖2A圖示了核酸203的連續(xù)鏈,其可構(gòu)成待分析樣品的一部分; 例如取自人供體的基因組DNA的雙鏈節(jié)段。鏈203顯示具有多個(gè)靶 特征207、 207'、 207"......。這些特征可代表所研究的SNP或其它特征。在方法101的操作103中,樣品被片段化。這圖示于圖2B,在 圖2B中,連續(xù)鏈203片段化為多條鏈209、 209'、 209"等。這些鏈 中的一些如鏈209包含目標(biāo)耙特征。其它鏈如鏈209'和209"未包含 靶序列。如所釋,當(dāng)按照本發(fā)明處理核酸片段時(shí),許多或大部分含
靶的片段與許多或大部分不含靶的片段分離。在選擇平均或中間片段長(zhǎng)度時(shí),各種考慮因素開始起作用。在一個(gè)典型個(gè)例中,平均片段大小長(zhǎng)約20-2000個(gè)堿基對(duì)乃至更長(zhǎng),但 優(yōu)選長(zhǎng)約50-800個(gè)堿基對(duì)。在某些實(shí)施方案中,平均片段大小長(zhǎng)約 400-600個(gè)堿基對(duì)。在其它實(shí)施方案中,平均片段大小長(zhǎng)約100-200 個(gè)堿基對(duì)。本領(lǐng)域技術(shù)人員容易認(rèn)識(shí)到,最佳的平均片段長(zhǎng)度可能 取決于具體應(yīng)用。例如,片段必須足夠大,以包含獨(dú)有的序列。如 果雜交將用于選擇或分析靶序列,則所述片段必須足夠大,以在特 定雜交條件下與其互補(bǔ)序列充分雜交。所述片段應(yīng)足夠小,以使它 們?cè)陔S后的操作中不容易被剪切,并使它們不干擾對(duì)選擇探針的雜 交。此外,它們應(yīng)根據(jù)隨后操作(例如長(zhǎng)鏈PCR、短鏈PCR等)的需 要具有合適的大小。決定合適片段長(zhǎng)度的另 一個(gè)考慮因素是要考慮最終的序列分析 技術(shù)。例如,如果使用核酸微陣列,則期望的片段大小將為約25-100 個(gè)堿基對(duì)。如果最初產(chǎn)生的片段明顯比其大,則必須在用微陣列測(cè) 定基因型前進(jìn)行第2次片段化。實(shí)際上,初始片段化應(yīng)產(chǎn)生大小適 于分析的片段,以便不必再片段化。不幸的是,業(yè)已發(fā)現(xiàn)25-100個(gè) 堿基對(duì)大小的片段可表現(xiàn)出"PCR抑制作用"。這是單鏈中給定片 段的引物互補(bǔ)末端彼此結(jié)合,形成發(fā)夾結(jié)構(gòu)。此發(fā)夾結(jié)構(gòu)不能參與 PCR擴(kuò)增。只有在片段明顯明顯較大時(shí)(例如大于至少約300個(gè)石成基 對(duì)),單鏈的末端與末端結(jié)合的可能性才減小到PCR抑制作用不是顯 著考慮因素的程度。人們有可能通過使用彼此不互補(bǔ)的兩種不同連接物序列最小化 形成這些發(fā)夾結(jié)構(gòu)的可能性。例如,使用連接物序列A和B產(chǎn)生約 1/4具有兩個(gè)A連接物的連接產(chǎn)物;約1/4具有兩個(gè)B連接物的連接 產(chǎn)物,以及約一半具有1個(gè)A連接物和1個(gè)B連接物的連接產(chǎn)物。 因此,所獲連接產(chǎn)物的顯著部分仍對(duì)PCR抑制作用敏感。為有利于連接物序列的連接,片段末端優(yōu)選具有一致的結(jié)構(gòu),
例如全平端或全粘性末端。在后一種情況下,所有粘性末端優(yōu)選都 具有相同的突出端序列,以便提供一致的結(jié)構(gòu),用于連接至對(duì)應(yīng)的 連接物末端。但是,在一個(gè)優(yōu)選實(shí)施方案中,所述片段是平端的。 在下文描述的本發(fā)明的具體實(shí)施方案中,使用全平端連接物。樣品核酸的片段化可通過各種已知技術(shù)中的任 一 種完成。實(shí)例包括機(jī)械裂解、化學(xué)降解、酶片段化和自降解。由于DNA的酸性, 自降解發(fā)生在相對(duì)高的溫度。片段化技術(shù)可提供雙鏈或單鏈DNA。 2003年8月8日提交的美國(guó)專利申請(qǐng)第10/638,113號(hào)描述了各種方 法、裝置和可控參數(shù),以提供期望水平的片段化。該申請(qǐng)?jiān)谒蟹?面通過引用結(jié)合到本文中。酶片段化使用核酸酶如DNA酶完成。在一個(gè)實(shí)施例中,在存在 錳(II)離子的情況下使用DNA酶I。用該酶酶切產(chǎn)生相對(duì)平端的雙鏈 片段。在產(chǎn)生的片段中仍可有一個(gè)或兩個(gè)堿基突出端。在此情況下, 全平端片段可通過用某些外切核酸酶處理由適度粘性末端的片段產(chǎn) 生(如P/w DNA聚合酶所呈現(xiàn)的)。尸/m酶起削減DNA片段兩個(gè)末端 的3'延伸的作用。其還通過聚合酶活性填充3'凹缺末端(recessive end)。產(chǎn)生平端片段的其它方法包括機(jī)械剪切和酸水解,這二者均產(chǎn) 生某些平端和某些突出端。因此,所述片段將仍需要一些如同尸/w聚 合酶一樣的"削平作用,,。此外,可使用某些留下平端(例如Alul、HaeIII、 HinDII、 Smal)的限制酶。還可使用留下的突出端可被"削平" 的其它限制酶。當(dāng)然,可使用任一種留下粘性末端(包括隨機(jī)突出端 序列)的技術(shù),不用隨后削平,只要所述程序使用相適的連接物(例如 具有隨機(jī)末端的連接物,以便不論突出端如何都仍能得到連接物)。遂凝參和,增為擴(kuò)增樣品片段但避免制備或購買許多不同引物的成本,本發(fā) 明任選使用一種或多種通用連接物序列。這些連接物連接至所有樣 品片段的兩個(gè)末端,在末端處它們提供用于引物退火的相同序列。
參見圖1的框105。另參見圖3A,該圖以漫畫形式描繪了連接物303 已連接后的圖2B的片段。優(yōu)選地,僅提供單種連接物序列用于連接 至由樣品產(chǎn)生的眾多片段的全部。對(duì)于該方法,僅需要1種引物序 列來擴(kuò)增所有片段。在替代性實(shí)施方案中,使用1種以上的連接物 序列,但一般來說有利地使用不超過幾種連接物序列。本章節(jié)描述 了連接物的結(jié)構(gòu)和連接它們至片段的方法。所述連接物應(yīng)當(dāng)具有適于其用途的長(zhǎng)度,所述用途即提供用于 與PCR引物退火的位點(diǎn)。因此,所述連接物通常長(zhǎng)約25-50個(gè)堿基 對(duì)。在一個(gè)優(yōu)選實(shí)施方案中,它們是具有一個(gè)平端和一個(gè)粘性末端 的雙鏈。如下所釋,這使得連接物可以一致的方向結(jié)合片段,還允 許過量的連接物在隨后的擴(kuò)增中用作PCR引物。當(dāng)然,本發(fā)明不限 于該結(jié)構(gòu),并且在某些情況下所述連接物可為單鏈序列。在許多情況下,連接物的濃度應(yīng)遠(yuǎn)超過片段濃度。這確保了將 有足夠的連接物可用于促進(jìn)快速的片段-連接物連接。其還降低了片 段-片段連接的可能性。在一個(gè)實(shí)施方案中,連接物濃度在相對(duì)于片 段末端濃度(其一般為片段濃度的2倍)過量約10-100倍的范圍內(nèi)。 在該濃度,未反應(yīng)的過量連接物序列可用作隨后擴(kuò)增的引物。在變 性期間,雙鏈連接物將分成單鏈序列,其中一個(gè)序列之后在與單鏈 片段上的其互補(bǔ)序列退火時(shí)可用作引物。在圖3B描迷的實(shí)施方案中,連接物303包含粘性末端313和平 端311。平端總是連接至DNA片段209,粘性末端總是避開該片段。 因?yàn)檎承阅┒?13不連接平端片段,所以連接物被迫以片段和連接 物之間平端與平端連接所指示的單一方向連接。在所示實(shí)施例中, 粘性末端313具有3'凹缺。連接可用常規(guī)DNA連接酶完成??勺⒁鉁p少或消除連接物之間的自連接。 一個(gè)連接物的平端不 連接另 一個(gè)連接物的粘性末端,但有可能兩個(gè)連接物的平端將連接。 還有可能兩個(gè)連接物的粘性末端連接,只是連接物的突出端要彼此
為防止連接物在其平端自連接,平端可設(shè)計(jì)得使其中一條單鏈含某 化學(xué)特征,此化學(xué)特征使該單鏈不能以排列好的連接物的平端連接 至鄰近鏈。例如,連接物平端中的5'鏈可沒有磷酸基團(tuán)。如果兩個(gè)這種連接物的平端以促進(jìn)連接的形式排列,則適宜的DNA連接酶應(yīng)不能連 接它們,因?yàn)槊織l鏈在兩個(gè)連接物之間會(huì)缺少磷酸橋。要指出的是, DNA鏈的5'末端通常具有游離的磷酸基團(tuán),用于連接3'羥基。這種 結(jié)合建立了連續(xù)鏈。如果連接物的其中一條平端末端鏈沒有5'磷酸基 團(tuán),則其不能形成連續(xù)鏈。在此情況下,不可能將兩個(gè)連接物連接, 因?yàn)閱捂湹母鱾€(gè)5'至3'偶聯(lián)將被阻止。這種情況描述于圖3C,在圖 3C中,連接物303a和303b各自均具有在該處5'鏈沒有磷酸基團(tuán)的 平端。當(dāng)這些連接物如所示的末端-末端排列好時(shí),它們不能連接, 因?yàn)樵谏戏芥満拖路芥溨g沒有連續(xù)單鏈可形成。應(yīng)當(dāng)理解的是, 缺少磷酸部分僅僅是防止自連接的 一種方法,可使用各種化學(xué)阻斷 機(jī)制。例如, 一個(gè)相似的實(shí)施方案使用其中在平端沒有3'OH而不是 5'磷酸的連接物。當(dāng)連接物的平端與DNA片段的平端排在一起時(shí),僅有其中一條 單鏈被阻止連接。由DNA片段指示的具有5'末端的鏈將具有磷酸基 團(tuán),其允許與連接物序列上其中一條單鏈的3'末端連接。但是,產(chǎn)生 的連接產(chǎn)物將在與各個(gè)連接物的接合處具有缺口 315。參見圖3D。 如圖3D的下部所示,可通過聚合酶反應(yīng)以由基因組片段向外擴(kuò)展的 完整連續(xù)單鏈代替缺口之前的連接物序列。在一個(gè)實(shí)施方案中,尸/w DNA聚合酶在連接物連接期間仍存在 于反應(yīng)混合物中。因?yàn)槭?w DNA聚合酶是嗜熱酶,所以其可通過增 加混合物的溫度(達(dá)到例如約68。C)來活化。在dNTP存在下,尸/w聚 合酶將填充3'凹缺,具有鏈替換活性。因此,其如下作用于含連接物 的片段在缺口左側(cè)(因?yàn)闆]有5'磷酸)啟動(dòng)DNA聚合,由此延伸片 段的3'末端,并替代沒有5'磷酸的連接物鏈,如圖3D所示。這導(dǎo)致產(chǎn)生無缺口的雙鏈序列,其含兩個(gè)跨接DNA片段的連接物序列?;蚪M片段的平端之間的自連接一般得以避免,因?yàn)檫B接物的濃度與 核酸片段濃度相比是如此之大,以至片段-片段連接的可能性極小。 在核酸片段已用連接物修飾之后,它們可如上所示擴(kuò)增。參見圖1的框107。向含片段的溶液提供與一種或多種連接物互補(bǔ)的一種 引物或一組引物。如所示,過量的連接物序列自身可用作引物,在 該情況下不需加入額外的引物??筛鶕?jù)需要提供擴(kuò)增必需的其它組 分(例如特定聚合酶、dNTP、緩沖液等)。在上述具體實(shí)施方案中,PfU 聚合酶仍在溶液中,并單獨(dú)地或與另一種聚合酶一起參與PCR,所 述另一種聚合酶例如為可得自AB Peptides, Inc. of St. Louis, Missouri 的"KlentaqI"或本領(lǐng)域已知的其它聚合酶。然后進(jìn)行PCR擴(kuò)增,以擴(kuò) 增所有片段。在一個(gè)具體實(shí)施方案中,擴(kuò)增進(jìn)行大約20個(gè)循環(huán),但 這決不是最小或最大需求。獲得的DNA序列具有跨接操作103中產(chǎn) 生的個(gè)體DNA片段的連接物序列。在某些實(shí)施方案中,擴(kuò)增后的片 段濃度在約1 至1 mg總量之間。PCR擴(kuò)增法描述于PCR Technology: Principles and Applications for DNA Amplification (H.A. Erlich編輯,F(xiàn)reeman Press, NY, NY, 1992); PCR Protocols: A Guide to Methods and Applications (Innis等編 輯,Academic Press, San Diego, CA, 1990); Mattila等,Nucleic Acids Res. 19, 4967 (1991); Eckert等,PCR Methods and Applications 1, 17 (1991); PCR (McPherson等編輯,IRL Press, Oxford);和美國(guó)專利 4,683,202,各個(gè)文獻(xiàn)均在所有方面通過引用結(jié)合到本文中。擴(kuò)增產(chǎn) 物可為RNA、 DNA或其衍生物,取決于在擴(kuò)增反應(yīng)中使用的酶和底年1月9日提交的美國(guó)專利申請(qǐng)第10,042,406號(hào)、2004年5月25日 提交的美國(guó)專利第6,740,510號(hào)以及2003年1月14日提交的美國(guó)專 利申請(qǐng)第10/341,832號(hào),各個(gè)文獻(xiàn)均在其所有方面通過引用結(jié)合到 本文中。
存在其它可用本發(fā)明生產(chǎn)擴(kuò)增的樣品片段的方法(例如用于使用 選擇探針分離)。這些技術(shù)中的某些包括標(biāo)記核酸片段的其它方法,例如DOP-PCR、標(biāo)記PCR等,它們非常詳細(xì)地描述于Kamberov等, US2004/0209298 Al,其在所有方面通過引用結(jié)合到本文中。乾,發(fā)^遂脊;^^庠在擴(kuò)增樣品片段之后,將多種寡核苷酸選擇探針加入混合物中?;?0,000或100,000、 1,000,000或10,000,000種不同序列,作為混 合物中的選擇探針(在一個(gè)實(shí)施例中使用約85,000種探針)。如所釋, 使選擇探針與擴(kuò)增核酸片段在單一反應(yīng)介質(zhì)中接觸,并暴露于促進(jìn) 選擇探針和互補(bǔ)于選擇探針的擴(kuò)增核酸片段之間退火的條件。各個(gè)樣品探針都具有與 一般認(rèn)為存在于(或至少被認(rèn)為潛在地存 在于)樣品中的靶序列互補(bǔ)的序列。因此,如果使用1000種探針,則 可選擇1000種靶序列。因此,只有具有耙序列的樣品片段才結(jié)合選擇探針,并最終由樣品混合物中分離出來。探針序列可為適于獨(dú)有地選擇把序列的任意長(zhǎng)度。對(duì)于靶SNP而言,合適的長(zhǎng)度在約20-1000 個(gè)堿基對(duì)的范圍內(nèi),更優(yōu)選在20-200個(gè)堿基對(duì)(例如約80個(gè)堿基對(duì)) 之間。其它大小范圍可適用于其它應(yīng)用。選擇探針可為單鏈或雙鏈的,并可包含RNA、 DNA或其衍生物。 在下文論述的某些實(shí)施方案中,選擇探針的單鏈包含有利于結(jié)合固 體基質(zhì)的化學(xué)部分或其它特征。從功能上講,"探針,,是能夠通過 一種或多種類型的化學(xué)鍵、通常通過互補(bǔ)堿基配對(duì)、通常通過氬鍵 形成結(jié)合互補(bǔ)序列的靶核酸的核酸。核酸探針可包含天然堿基(即A、 G、 C或T)或修飾堿基(例如7-脫氮雜鳥苦、肌香)。另外,核酸探針中的堿基可通過磷酸二酯鍵以外的鍵連接,只要其不干擾雜交。因 此,核酸探針可為其中組成石成基通過肽鍵而不是磷酸二酯鍵連接的 肽核酸。 通常,退火混合物將包含各種選擇探針的多個(gè)拷貝。優(yōu)選地,混合物中各種選擇探針的濃度處于100 pl反應(yīng)混合物中約1-100 ng 之間,片段濃度處于100pl反應(yīng)混合物中約l-10jxg之間。廣義地講,本發(fā)明可使用眾多不同的選擇探針。預(yù)期許多目標(biāo) 應(yīng)用將使用至少約1000種不同的選擇探針,例如在約104-107之間。 本發(fā)明設(shè)想使用的更具體的量為至少約2000種不同探針,甚至更具 體的量為至少約5000種或至少約10,000種或至少約50,000種不同 探針。在接觸所有樣品片段的單一溶液或混合物中使用所有選擇探 針,以便成千上萬的不同靶序列的選擇可在單一反應(yīng)混合物中同時(shí) 發(fā)生。對(duì)于使用數(shù)萬或數(shù)十萬不同靶序列的復(fù)雜樣品來說,可使用 約10,000至IOO,OOO乃至1,000,000個(gè)不同探針。優(yōu)選地但不是必須的,所有選擇探針都在單一溶液或混合物中提供。因此,本發(fā)明的一個(gè)實(shí)施方案提供一組同時(shí)用于由非靶核酸片 段中選擇靶核酸片段的選擇探針。所述組在同一介質(zhì)中包含至少約1000種(優(yōu)選至少約10,000種)不同的選擇探針。如所示,各種選擇 4笨針都具有互補(bǔ)于不同靶序列(例如與不同SNP相關(guān)的序列)的序列。 優(yōu)選地,任意給定選擇探針都將與僅具有單個(gè)SNP的序列互補(bǔ)。所有靶序列都可存在于單個(gè)樣品如基因組中。用于包含探針組的介質(zhì)將是緩沖水溶液。在一個(gè)具體實(shí)施方案中,所述溶液含約1 MNa,鹽, 優(yōu)選含50%曱酰胺和10%硫酸葡聚糖。以共用介質(zhì)的選擇探針包含即使有也極少的非靶序列,或至少它們 僅包含不顯著損害探針選擇其靶序列的能力的量。共用介質(zhì)最低程 度將包含與非靶序列相比(當(dāng)比較天然基因組或其它樣品中的靶和非 靶序列的相對(duì)量時(shí))顯著富集量的選擇探針互補(bǔ)靶序列。無論是基于特異性探針序列的總數(shù)對(duì)非靶片段的總數(shù),來檢測(cè)靶特異性選擇探 針對(duì)非靶探針的相對(duì)量,這都是無可置疑的。
此外,選擇探針組不需要包含鑒別為與樣品特征相關(guān)的每個(gè)耙序列的探針。例如,50,000種不同的SNP等位基因可被鑒別為與樣 品特征相關(guān),但選擇探針組可包含針對(duì)這些等位基因中的僅40,000 種的探針。將40,000個(gè)成員的探針組加至樣品混合物以便分離潛在 地存在于樣品中的至少一部分靶序列屬于本發(fā)明的范圍。此外,探 針組包含的靶序列可多于特定樣品中存在的輩巴序列。例如,樣品可 來源于特定組織的mRNA,所以在該組織中不表達(dá)的任意靶序列在 樣品中都將不存在。選擇探針可通過任意合適的方法生產(chǎn),包括寡核苷酸合成技術(shù) 和由生物體分離。在后一種情況下,PCR或其它擴(kuò)增技術(shù)可用于以 相對(duì)較高的濃度生產(chǎn)探針。在一個(gè)具體實(shí)施例中,對(duì)被發(fā)現(xiàn)保持特 定SNP的人類基因組序列使用PCR (或多重PCR)獲得探針。在此情 況下,可通過使用對(duì)這些探針特異性的引物的PCR反應(yīng)制備單獨(dú)的 選擇探針。這種基因組序列可通過本領(lǐng)域已知的任意方法鑒別,例 如通過相關(guān)性研究、連鎖分析等鑒別。許多服務(wù)提供商基于合同生產(chǎn)可用的定制探針。用于本發(fā)明的 選擇探針可由這種提供商處訂購,其中一些提供商如下Agilent Technologies of Palo Alto, CA, NimbleGen Systems, Inc. of Madison, WI, Seq Wright DNA Technology Services of Houston, TX,以及Invitrogen Corporation of Carlsbad, CA。在另 一種方法中,選擇探針可通過片段 化已知具有靶特征的基因組DNA (例如基因組文庫的單染色體或克 隆)生產(chǎn)。再進(jìn)一步,可通過轉(zhuǎn)變?yōu)閏DNA由mRNA產(chǎn)生選擇探針, 以選擇表達(dá)的靶序列。換句話說,表達(dá)的mRNA具有耙序列。如所示,選擇探針還可包含在完成退火步驟后有利于連接至固 體基質(zhì)的部分。此部分的實(shí)例包括DNA修飾,以包含生物素、抗生 物素蛋白、熒光染料、地高辛或其它核苷酸修飾。在一個(gè)具體實(shí)例 中,所述部分是生物素或鏈霉抗生物素蛋白,基質(zhì)表面分別具有鏈 霉抗生物素蛋白或生物素。在替代性實(shí)施方案中,將提供預(yù)連接至
固體基質(zhì)的選擇探針。在該實(shí)施方案中,固體基質(zhì)與擴(kuò)增片段的溶 液接觸,并處于促進(jìn)雜交的條件下。不需要單獨(dú)的連接步驟。本發(fā)明的 一些方面涉及舍如上鑒別的選擇探針組連同 一個(gè)或多 個(gè)其它制品的試劑盒,其中所述制品有利于把序列的富集和/或分析。 在一個(gè)實(shí)施方案中,所述試劑盒還包含固體基質(zhì)(例如珠、4效陣列、 柱等),其具有結(jié)合選擇探針上的部分的表面特征,由此有利于選擇 探針在基質(zhì)上的固定化。所迷試劑盒還可包含用于擴(kuò)增核酸片段的 引物和聚合酶。再進(jìn)一步,所述試劑盒可以與核酸陣列或其它工具 一起提供,它們用于鑒別靶片段中包含的靶序列。按照本發(fā)明的實(shí)施方案,完整的選擇探針組和樣品片段在單一 反應(yīng)混合物中提供。為促進(jìn)雜種退火產(chǎn)物的形成,這兩種組分的相對(duì)濃度優(yōu)選為片段為選擇探針的約100倍至約10,000倍,更優(yōu)選為 片段為選擇探針的約500倍至約5,000倍;例如片段為選擇探針的約 1000倍。要指出的是,許多應(yīng)用使用較大的"完整"選擇探針組的 亞組。例如,相關(guān)性研究可將某些SNP與目標(biāo)狀況關(guān)聯(lián)。"完整" 探針組可為包含數(shù)十萬甚至數(shù)百萬種用于SNP等位基因的不同選擇為實(shí)際選擇靶片段,所述程序必須提供為單鏈的片段和選擇探 針。所以,如果它們中的任一個(gè)以雙鏈形式提供,則所述程序首先 通過變性混合物中的雙鏈序列開始。然后,逐漸改變混合物中的條 件,以驅(qū)動(dòng)變性。在某些實(shí)施措施中,以漸進(jìn)的方式改變溫度,以 促進(jìn)退火。在一個(gè)典型實(shí)施措施中,退火在約10-50小時(shí)(在具體實(shí) 施措施中為36小時(shí))內(nèi)發(fā)生。在一個(gè)實(shí)施方案中,使用50%曱酰胺溶液于約94。C的溫度變性 雙鏈探針和雙鏈片段約2分鐘。注意,甲酰胺濃度增加1%就降低雙 鏈DNA的解鏈溫度達(dá)約0.6°C,所以溫度和甲酰胺濃度的組合可根 據(jù)需要相配。在變性后,通過采用如本文所述的某些梯度的緩慢冷 卻步驟退火序列。最初,混合物在約2小時(shí)時(shí)間段內(nèi)由94。C冷卻至
約42°C。然后,溫度保持在42。C達(dá)約12小時(shí)。此后,溶液在約5 小時(shí)的時(shí)間段內(nèi)由42。C緩慢冷卻至約37。C。就是在此溫度范圍內(nèi)(約 37-42。C)發(fā)生大部分退火。在達(dá)到37。C后,混合物保持在該溫度達(dá)約 12小時(shí)。當(dāng)然,本發(fā)明不限于這些變性條件。例如,有可能在明顯 較短的時(shí)間段內(nèi)退火,可能短至12小時(shí)。
一般來說,退火指在特定核苷酸序列存在時(shí)于嚴(yán)格條件下分子 僅與該序列結(jié)合、雙鏈化或雜交。嚴(yán)格條件是在該條件下探針與其 靶序列雜交但不與其它序列雜交的條件。嚴(yán)格條件是序列依賴性的, 隨環(huán)境改變。 一般來說,選擇的嚴(yán)格條件是在限定的離子強(qiáng)度和pH 比特定序列的熱解鏈點(diǎn)(Tm)低約5°C。 Tm是與靶序列互補(bǔ)的探針的 50%與靶序列退火達(dá)到平衡時(shí)的溫度(在限定的離子強(qiáng)度、pH和核酸 濃度下)。(由于靶序列可過量存在,所以在Tm時(shí),理論上在平衡時(shí) 將占據(jù)50%的探針)。通常,嚴(yán)格條件包括在pH 7.0-8.3下至少約 0.01-1.0 M Na離子濃度(或其它鹽)的鹽濃度,對(duì)于短探針(例如10-50 個(gè)核苷酸)該溫度為至少約3(TC。嚴(yán)格條件還可用加入去穩(wěn)定劑如曱 酰胺獲得。例如,5X SSPE (750 mM NaCl、 50 mM磷酸鈉、5 mM EDTA, pH 7.4)的條件和25-3CTC的溫度的條件適于等位基因特異性 的探針雜交。
在圖4A和4B中圖解了選擇程序的起點(diǎn)和終點(diǎn)。如所示,這些 圖中的每一個(gè)都呈現(xiàn)了在單個(gè)容器403中提供的反應(yīng)混合物405的 分子尺度容積407。圖4A的容積407具有眾多的雙鏈物質(zhì)。選擇探 針可通過連接的"B"生物素物質(zhì)鑒別。這些探針包括探針411和415。 另外,各種選擇探針都將包含由"X"表示的靶序列。樣品片段可通 過末端的矩形連接物序列識(shí)別。 一些片段具有靶序列X (例如片段 413),而其它片段沒有(例如片段409)。
在圖4A的理想化實(shí)施例中,選擇探針保有耙序列XI至X6。 樣品片段僅保有靶序列XI、 X2、 X4和X6。序列X3和X5在樣品 中不存在。在退火后,如在圖4B的容積407'中所示, 一些探針與耙
片段雜交,另一些沒有雜交。如所示,不具有靶序列的樣品片段如
片段409仍是完整的。具有靶X3和X5的選擇探針以及保有靶X6 的探針411同樣如此。該探針不與也保有靶序列X6的樣品片段413 退火。當(dāng)然,互補(bǔ)選擇探針和靶片段的某些部分彼此不退火。在所 示的實(shí)例中,具有X1、 X2和X4的片段交叉退火。當(dāng)然,正常情況 下將有多個(gè)拷貝的保有靶的片段,以及多個(gè)拷貝的互補(bǔ)選擇探針。 因此,盡管通常不是所有的互補(bǔ)鏈都將彼此發(fā)現(xiàn)和退火,但在合適 的條件下大部分將退火,產(chǎn)生探針樣品雙鏈產(chǎn)物。
在樣品片段和選擇探針已退火后,通過使溶液接觸對(duì)選擇探針 具有親和力的固體基質(zhì)固定它們。如所示,選擇探針可包括連接固
體基質(zhì)上的互補(bǔ)部分的部分(例如生物素和鏈霉抗生物素蛋白)。固體 基質(zhì)可采取許多不同形式,包括珠、碟、柱、孩么陣列、多孔玻璃表
面、膜、塑料。在一個(gè)具體實(shí)施方案中,基質(zhì)包括約1 ,Lim直徑的珠, 每個(gè)珠均具有約105-107個(gè)探針/1 ium珠。得自Dynal (Oslo, Norway) 的包被鏈霉抗生物素蛋白的磁性珠適于固定化生物素標(biāo)記的DNA。 使用珠上的固定化DNA對(duì)核酸進(jìn)行富集的步驟描述于Birren等,第 3章,該文獻(xiàn)在所有方面通過引用結(jié)合到本文中。
在示于圖5的實(shí)施方案中,退火的混合物接觸在其表面上分布 有鏈霉抗生物素蛋白部分的珠。如所示,將大量珠503加入退火的 混合物405'中。首先,單獨(dú)的珠不具有固定化選擇探針。但它們確 實(shí)具有分布于其表面上的鏈霉抗生物素蛋白部分,如示于圖5的單 個(gè)珠505上的"S"所示。在溶液中保留一段時(shí)間之后,所述珠捕獲 了溶液中的一些選擇探針。 一些捕獲的探針與如圖5所示的輩巴片段 退火;參見珠505'。
在一個(gè)具體的實(shí)施方案中,溶液和珠之間的接觸發(fā)生在約20°C-37。C的溫度、約30分鐘至1小時(shí)的時(shí)間段內(nèi)。這使得生物素和鏈霉 抗生物素蛋白部分有足夠時(shí)間彼此連接,并有效地固定選擇探針和 互補(bǔ)DNA片段的雙鏈序列。
如上所示,選擇探針的序列應(yīng)進(jìn)行選擇,以選擇含目標(biāo)特征(例 如一個(gè)或多個(gè)SNP)的靶序列。目標(biāo)特征通常位于探針序列中心,但 這不是必須的。在某些情況下,目標(biāo)特征偏離探針序列中心乃至就 在探針序列之外。如果目標(biāo)特征位于探針序列之外,則探針序列應(yīng) 與足夠接近目標(biāo)特征的靶序列區(qū)互補(bǔ),使得探針揀選具有此特征的
片段。這些實(shí)施措施示于圖6,該圖顯示了(a)SNP或其它目標(biāo)特征603 位于選擇探針605中心,(b) SNP 603處于選擇探針607中,但偏離 中心,以及(c) SNP 603位于選擇探針609的范圍之外,但接近此探 針的一個(gè)末端。
至少 一部分靶片段在以上概述的程序中附著至固體基質(zhì)。為富 集這些片段,未附著的片段應(yīng)被洗去或與基質(zhì)分開。要認(rèn)識(shí)到,耙 片段與固定化探針序列互補(bǔ),各種分離技術(shù)對(duì)本領(lǐng)域技術(shù)人員是顯 而易見的。例如,可使用兩步清洗法,第一步用于去除位于基質(zhì)上 但不通過DNA-DNA相互作用結(jié)合的DNA片段,第二步在更嚴(yán)格的 條件下實(shí)施,以去除松散的雜交樣品核酸鏈,它們可能在某一區(qū)域 包含對(duì)一個(gè)或多個(gè)選擇探針的錯(cuò)配,要不然該區(qū)域與一種或多種選 擇探針互補(bǔ)。
作為實(shí)例,第一步用6x SSPE緩沖液于室溫進(jìn)行,第二步在于 較高溫度使用低鹽濃度(代表更嚴(yán)格的條件)的最嚴(yán)格條件下進(jìn)行。例 如,其可于約室溫至約37。C的溫度使用0.2x SSPE。再者,此第二次 清洗將去除相對(duì)松散結(jié)合的DNA片段,這些DNA片段可能部分地 與選擇探針互補(bǔ)。圖7顯示了完全互補(bǔ)的雜交片段711 (其通常不會(huì) 被第二步清洗去除)和部分雜交的片段713 (其非常有可能被第二步清 洗去除)。兩個(gè)片段均顯示與逸擇探針705雜交。
在未退火的和松散退火的樣品片段已通過上述的兩步清洗去除 后,只有靶DNA片段才應(yīng)保留在固體基質(zhì)上。換句話說,此時(shí)基質(zhì) 將僅包含(理想地)與選擇探針強(qiáng)互補(bǔ)的核酸片段,這些片段推測(cè)是耙 DNA片段。因此,所述程序至此時(shí)已有效地分離靶片段和樣品的其
余部分。此時(shí),可以下述的各種方式進(jìn)一步加工或分析靶。盡管所
述實(shí)施例具體地描述了用DNA微陣列分析,但應(yīng)當(dāng)理解的是,本發(fā)
明不限于該方法。
如圖1的框113所示,通過例如變性將靶DNA片段由固定化選 擇探針中去除。在一個(gè)具體實(shí)施例中,這通過用0.15 M氬氧化鈉于 室溫處理完成。此后,用0.15 M鹽酸中和溶液。在其中靶片段已由 基質(zhì)去除的變性之后,基質(zhì)自身(例如珠)可由溶液中去除。荻得的溶 液包含分離并富集的靶核酸片,爻。
為、岸^/e,發(fā)的^^f
在某些實(shí)施方案中,可直接分析分離的靶片段。但是,對(duì)于某 些應(yīng)用,它們首先必須進(jìn)一步被擴(kuò)增和/或片段化。如上所示,PCR 抑制作用的可能性可將最初的片段化步驟局限于生產(chǎn)不小于約300-400個(gè)堿基對(duì)的片段。這種片段可能太大,以至于不能有效地使用DNA 微陣列偵測(cè)。因此,可能必須進(jìn)一步片段化耙鏈。
假定富集的靶片段必須被擴(kuò)增(參見圖1的操作117),則使用與 初始擴(kuò)增中使用的序列相同的引物進(jìn)行PCR (操作107)。分離的耙片 段仍具有附著的連接物序列,其可用作PCR引物的退火位點(diǎn)。在許 多情況下,第二次擴(kuò)增僅需要單一引物序列,因?yàn)樵谒龀绦虻脑?期僅使用單個(gè)連接物序列(參見圖1中的操作105)。但是,通常在本 文使用單鏈引物,而不是在初始擴(kuò)增中使用的雙鏈連接物序列。擴(kuò) 增程度取決于捕獲和固定化的片段量以及序列分析技術(shù)的要求。在 一個(gè)典型案例中,使用約20-40個(gè)PCR循環(huán)。
在擴(kuò)增后,分離的片段可能太大,以至于不能有效地與DNA微 陣列上的固定化寡核苷酸探針雜交。如所示,隨后期望進(jìn)一步片段 化靶鏈。如果使用第二次片段化,則選擇條件,以產(chǎn)生具有的大小 適于要實(shí)施的分析技術(shù)的片段。為通過DNA微陣列測(cè)定基因型,最 終的片段大小優(yōu)選長(zhǎng)為約25-150個(gè)石成基對(duì),或者在某些實(shí)施方案中,
長(zhǎng)為約40-100個(gè)堿基對(duì)。與DNA酶接觸適宜的時(shí)間段可用于片段 化分離的靶序列,并產(chǎn)生該尺寸的最終片段。在其它實(shí)施方案中, 使用如上所述的剪切、限制酶等完成附加片段化。
圖8遵循了選定靶片段通過第二輪擴(kuò)增和片段化的進(jìn)展。如所 示,擴(kuò)增具有連接物303的輩巴片段613,產(chǎn)生額外的拷貝613'。擴(kuò)增 的耙片段隨后被片段化,以產(chǎn)生較小的耙片段623、 623'等。如所示, 這些片段的某一些將不含目標(biāo)靶序列。
僅使用單 一 片段化反應(yīng)當(dāng)然屬于本發(fā)明的范圍。在這種實(shí)施方 案中,初始片段化產(chǎn)生合適大小的片段,用于分析分離的靶片段, 例如使用常規(guī)DNA微陣列測(cè)定基因型?;蛘?,所述方法使用適于測(cè) 序相對(duì)大序列(例如約300個(gè)堿基對(duì)或更大的序列)的測(cè)序工具。例如, 可使用定向測(cè)序技術(shù)。其它實(shí)施方案使用Illumina, Inc. (San Diego, CA) 和454 Corporation (New Haven, CT)的測(cè)序平臺(tái)。 一拘殳來i兌,本發(fā)明 不限于任何特定的方法學(xué)或產(chǎn)品來分析使用本發(fā)明分離的靶片段。
如果DNA微陣列用于測(cè)序分離的耙片段,則首先標(biāo)記片段,然
后在有利于與固定化寡核苷酸雜交的條件下與微陣列接觸。任何合 適的標(biāo)記和標(biāo)記技術(shù)都可使用。用于該用途的許多廣泛^f吏用的標(biāo)記 提供熒光信號(hào)。在一個(gè)具體實(shí)施例中,末端轉(zhuǎn)移酶用于標(biāo)記所述片 段。在標(biāo)記附著至片段且片段與微陣列上的寡核苷酸雜交后,所述 陣列可被染色和/或清洗,以進(jìn)一步有利于結(jié)合至陣列的片段的檢測(cè)。 然后讀出在陣列上的結(jié)合模式并編譯,以表明各種靶序列在樣品中 的存在或不存在。對(duì)于SNP靶,解讀器通過例如以下步驟來鑒別耙 序列中存在的等位基因(l)陣列上單個(gè)探針的已知序列和位置;(2) 知曉片段與陣列上的 一 個(gè)或多個(gè)探針互補(bǔ);(3)由此知道片段序列; 和最后(4)由此知曉片段的基因型。標(biāo)記、寡核苷酸;f鼓陣列和相關(guān)解 讀器、軟件等以各種常規(guī)可用的DNA微陣列產(chǎn)品提供,諸如得自例 如Affymetrix, Inc., (Santa Clara, CA)的商品化微陣列。如所示,其它 方法也是適合的,例如定向測(cè)序編碼各個(gè)標(biāo)記的區(qū)域、建立含耙序
列的文庫、在進(jìn)一步的實(shí)驗(yàn)和方法學(xué)中使用靶序列作為探針或用于 細(xì)^^系的功能測(cè)定。
圖9顯示了用于在如上所述的具體實(shí)施方案中測(cè)序分離的靶片
段的一系列操作。在操作921中,游離的分離把片段在液體介質(zhì)中 提供。這些片段可如下獲得首先清洗固體基質(zhì),以去除非特異性 片段,然后釋放特異性結(jié)合的靼片段。在耙片段中呈現(xiàn)出83,000種 SNP。在操作923中,使用采用單一引物的單個(gè)PCR擴(kuò)增游離草巴片 段,以擴(kuò)增全部83,000種SNP。此后,在操作925中,片段被進(jìn)一 步片段化和標(biāo)記。最后。在操作927中,標(biāo)記的片段使用DNA微陣 列偵測(cè)。
豸滋辦
DNA樣品的制備
使用商品化試劑盒按照生產(chǎn)商提供的方案由人血液淋巴細(xì)胞分 離基因組DNA。在1 mMMnCl2存在下使用DNA酶I片段化約100 ng 基因組DNA。當(dāng)在通過瓊脂糖凝膠電泳分離后通過溴化乙錠染色顯 現(xiàn)時(shí),片段化的DNA的大小處于約200 bp至1 kb的范圍內(nèi)。通過 在200 mM dNTP存在下用P/w DNA聚合酶于65。C處理使片段化DNA 變?yōu)槠蕉恕=又?,使用T4 DNA連接酶于40。C連接平端片段和雙鏈 連接物持續(xù)16小時(shí)。然后將連接的DNA在20-24個(gè)循環(huán)的PCR反 應(yīng)中用作模板,連接反應(yīng)殘余的未連接連接物用作PCR引物。該反 應(yīng)可通過先前用于平端DNA片段末端的DNA聚合酶催化,或 通過加入到反應(yīng)中的其它DNA聚合酶催化。通常,PCR產(chǎn)物的大小 在約300 bp至1.2 kb的范圍內(nèi),大部分產(chǎn)物處于約500-600 bp。
退火反應(yīng)
將約5嗎PCR產(chǎn)物與10 |iig C0T-1 DNA和100嗎緋魚精(Herring Sperm) DNA混合,混合物凍千,通過真空離心干燥。然后,干燥的 DNA重懸浮在合適的雜交緩沖液中,例如6X SSC或6X SSPE,其 可含50%曱酰胺和/或雜交加速劑,例如10%硫酸葡聚糖或10%聚乙 二醇。將約50 ng生物素標(biāo)記的DNA選擇探針加入反應(yīng)中,于95°C 變性達(dá)2分鐘后,在2小時(shí)內(nèi)使反應(yīng)物緩慢冷卻至37'C。使退火反 應(yīng)于37。C繼續(xù)進(jìn)行20-36小時(shí)。退火DNA片段的選擇將100 pg鏈霉抗生物素蛋白包被的1 pm順磁珠加入反應(yīng)中, 使生物素化的DNA于37。C結(jié)合珠30分鐘。在結(jié)合后,于30分鐘內(nèi) 序貫地用1 ml 6X SSPE于室溫清洗珠2次,并用1 ml 0.2X SSPE于 37。C清洗珠2次。然后通過在0.15 M NaOH中溫育釋放捕獲在珠上 的DNA,通過加入等體積的0.15 M HC1中和變性的DNA。然后將 中和的DNA用于采用單鏈PCR引物的PCR反應(yīng),所述引物具有的 DNA序列對(duì)應(yīng)于在DNA片,殳末端的連接的連接物。然后對(duì)擴(kuò)增的 DNA進(jìn)行純化、片段化,并用末端轉(zhuǎn)移酶末端標(biāo)記,準(zhǔn)備用于按照 標(biāo)準(zhǔn)方法進(jìn)行的陣列雜交。如本實(shí)施例和上述的優(yōu)選實(shí)施方案所闡述,本發(fā)明使處理大樣 品如人基因組的復(fù)雜性有相當(dāng)程度的下降。作為指引或參考,人基 因組含約30億個(gè)堿基對(duì)。按照本發(fā)明施加一組80,000種選擇探針可 容易地將待分析的DNA的量減少達(dá)約20倍;例如對(duì)于500 bp的樣 品片段減少至約8000萬個(gè)堿基對(duì)。顯然,當(dāng)使用較少的選擇探針和/ 或樣品片段較小時(shí),復(fù)雜性將產(chǎn)生極大降低。^它實(shí)滋才襲本發(fā)明比以上所述具有更廣范圍的實(shí)施性和可用性。例如,盡 管已就使用DNA微陣列測(cè)定基因型描述了本發(fā)明的方法學(xué),但本發(fā) 明的方法學(xué)不限于此。例如,本發(fā)明可容易地?cái)U(kuò)展至核酸如全長(zhǎng) cDNA、 rnRNA和基因的選擇和分離,以及需要復(fù)雜性降低的其它方
法,例如基因表達(dá)分析和種間比較性雜交。本領(lǐng)域一般技術(shù)人員會(huì) 認(rèn)識(shí)到其它變化、修改和替代。要理解的是,以上所述意在闡述而非限制。本領(lǐng)域技術(shù)人應(yīng)容 易理解,可在不偏離本發(fā)明范圍和精神的情況下,對(duì)本申請(qǐng)公開的 本發(fā)明實(shí)施各種實(shí)施方案和修改。因此,本發(fā)明的范圍不應(yīng)參考以 上所述來確定,而是應(yīng)參考所附權(quán)利要求書連同這些權(quán)利要求的等 同方案的完整范圍來確定。引用本文提及的所有出版物是為了描述 和公開可連同本發(fā)明一起使用的試劑、方法學(xué)和概念。本文不應(yīng)被 解釋為承認(rèn)這些參考文獻(xiàn)是相對(duì)于本文描述的本發(fā)明的現(xiàn)有技術(shù)。 在整個(gè)公開內(nèi)容中參考了各種專利、專利申請(qǐng)和出版物。除非另有 說明,否則各個(gè)文獻(xiàn)均在所有方面通過引用整體結(jié)合到本文中。
權(quán)利要求
1.一種由核酸樣品中分離靶核酸序列的方法,所述方法包括(a)由所述樣品產(chǎn)生核酸片段;(b)擴(kuò)增所述核酸片段;(c)在促進(jìn)選擇探針和互補(bǔ)于選擇探針的擴(kuò)增核酸片段之間退火的條件下,在單一反應(yīng)介質(zhì)中使擴(kuò)增核酸片段與至少約2,000種不同選擇探針接觸,其中所述選擇探針具有與靶核酸序列互補(bǔ)的序列;(d)去除未強(qiáng)結(jié)合至選擇探針的擴(kuò)增核酸片段;和(e)由選擇探針釋放退火的擴(kuò)增核酸片段,其中所述退火的擴(kuò)增核酸片段是所述靶核酸序列,由此分離所述靶核酸序列。
2. 權(quán)利要求1的方法,所述方法還包括基于(e)中釋放的靶核酸 序列表征核酸樣品。
3. 權(quán)利要求2的方法,其中所述表征通過將靶核酸序列應(yīng)用于 核酸陣列實(shí)施。
4. 權(quán)利要求3的方法,所迷方法還包括 擴(kuò)增(e)中釋放的耙核酸序列;和標(biāo)記所述粑核酸序列,之后使它們與所述核酸陣列接觸。
5. 權(quán)利要求4的方法,所述方法還包括在標(biāo)記前進(jìn)一步片段化 靶核酸片段。
6. 權(quán)利要求1-5中任一項(xiàng)的方法,其中片段化所述核酸樣品產(chǎn) 生具有約25個(gè)至約2,000個(gè)堿基對(duì)的平均大小的核酸片段。
7. 權(quán)利要求6的方法,其中所述核酸片段的平均大小為約500 個(gè);咸基對(duì)。
8. 權(quán)利要求1-5中任一項(xiàng)的方法,其中在(a)中產(chǎn)生核酸片段時(shí) 產(chǎn)生的核酸片段所具有的平均大小允許在核酸陣列上測(cè)定基因型, 而不用進(jìn)一步片段化。
9. 權(quán)利要求1-5中任一項(xiàng)的方法,其中擴(kuò)增核酸片段包括對(duì)在(a) 中產(chǎn)生的基本所有核酸片段實(shí)施聚合酶鏈反應(yīng)(PCR)。
10. 權(quán)利要求1-5中任一項(xiàng)的方法,所述方法還包括在擴(kuò)增核酸 片段之前將連接物連接至核酸片段末端,其中所述連接物包含與用 于擴(kuò)增操作的引物互補(bǔ)的序列。
11. 權(quán)利要求10的方法,其中所述各連接物均包含相同序列。
12. 權(quán)利要求10的方法,其中所述連接物包含dsDNA和ssDNA尾。
13. 權(quán)利要求10的方法,其中未連接至核酸片段末端的過量連 接物在擴(kuò)增核酸片段時(shí)用作引物。
14. 權(quán)利要求10的方法,其中連接連接物包括將所述連接物連 接至核酸片段的平端。
15. 權(quán)利要求1-5中任一項(xiàng)的方法,其中所述選擇探針包含利于 連接至固體基質(zhì)的部分。
16. 權(quán)利要求15的方法,所述方法還包括將選擇探針連接至固 體基質(zhì),其中至少 一部分選擇探針在操作(c)和(d)之間與擴(kuò)增的核酸 片段退火。
17. 權(quán)利要求16的方法,其中所述固體基質(zhì)包含多個(gè)珠。
18. 權(quán)利要求16的方法,其中去除未強(qiáng)結(jié)合至選擇探針的擴(kuò)增 核酸片段包括清洗固體基質(zhì),以去除未結(jié)合的核酸片段。
19. 權(quán)利要求18的方法,其中清洗固體基質(zhì)包括在由結(jié)合的選液接觸。
20. 權(quán)利要求1-5中任一項(xiàng)的方法,其中在單一反應(yīng)介質(zhì)中使擴(kuò) 增核酸片段與不同選擇探針接觸包括在單一反應(yīng)介質(zhì)中提供至少約 50,000種不同選擇探針,每種4罙針均與不同的靶核酸序列互補(bǔ)。
21. 權(quán)利要求20的方法,其中在單一反應(yīng)介質(zhì)中使用的不同選 擇探針數(shù)在約50,000至約107之間。
22. 權(quán)利要求1-5中任一項(xiàng)的方法,其中在單一反應(yīng)介質(zhì)中使擴(kuò)增核酸片段與不同的選擇探針接觸包括在所述單一反應(yīng)介質(zhì)中使擴(kuò)增核酸片段與至少約5,000種不同選擇探針接觸。
23. 權(quán)利要求22的方法,其中在單一反應(yīng)介質(zhì)中使擴(kuò)增核酸片 段與不同的選擇探針接觸包括在所述單一反應(yīng)介質(zhì)中使擴(kuò)增核酸片 段與至少約10,000種不同的選擇探針接觸。
24. —種由靶和非耙核酸片段的混合物中分離耙核酸片段的方 法,所述方法包括(a) 將連接物序列加至混合物中靶和非靶核酸片段的末端,其中 所述連接物序列包含長(zhǎng)約15-40個(gè)堿基對(duì)的序列,相對(duì)于核酸片段末 端數(shù)過量存在;(b) 進(jìn)行聚合酶鏈反應(yīng),以擴(kuò)增所述靶和非靶片段,其中除通過 變性過量連接物提供引物外,沒有必要對(duì)擴(kuò)增靶和非靶片段提供引 物序列;(c) 在促進(jìn)選擇探針和靶核酸片段退火的條件下,使擴(kuò)增的靶和 非耙片段與多種選擇探針同時(shí)接觸,其中所述選擇探針包含與靶核 酸片段的序列互補(bǔ)的序列;和(d) 將未退火和部分退火的非耙核酸片段與結(jié)合至所述選擇探針 的退火耙核酸片段分離,由此分離靶核酸片段。
25. 權(quán)利要求24的方法,其中所述連接物序列是雙鏈核酸序列。
26. 權(quán)利要求25的方法,其中所述連接物具有用于連接至核酸 片段末端的平端。
27. 權(quán)利要求26的方法,其中所述連接物具有粘性末端,所述粘性末端具有與自身不互補(bǔ)的突出端,由此所述連接物的粘性末端 4皮此不退火。
28. 權(quán)利要求26的方法,其中所述連接物的一條鏈沒有用于在 連接物平端連接的必須部分,由此所述連接物的平端彼此不連接。
29. 權(quán)利要求24-28中任一項(xiàng)的方法,其中所述連接物以相對(duì)于 核酸片段末端數(shù)過量約10-100倍存在。
30. —種用于同時(shí)由非靶核酸片段中選擇靶核酸片段的選擇探針 組,其中所述組包含共用介質(zhì)中至少約10,000種不同的選擇探針,每種選擇探針都 具有與不同靶序列互補(bǔ)的序列,所述靶序列包含全部存在于單個(gè)基 因組中的不同SNP,其中每種不同的選擇探針長(zhǎng)為約20-1000個(gè)石威基對(duì)。
31. 權(quán)利要求30的選擇探針組,其中所述組中的單個(gè)選擇探針 是雙鏈核酸序列。
32. 權(quán)利要求30或31的選擇探針組,其中所述組包含約104-108 種不同的選擇探針。
33. 權(quán)利要求30或31的選擇探針組,其中所述組包含約104-105 種不同的選擇探針。
34. 權(quán)利要求30-33中任一項(xiàng)的選擇探針組,其中每種不同的選 擇探針除了包含選擇探針序列之外,還包含有利于結(jié)合固體基質(zhì)的 部分。
35. 權(quán)利要求34的選擇4笨針組,其中所述部分是生物素或鏈霉 抗生物素蛋白。
36. 權(quán)利要求30-33中任一項(xiàng)的選擇探針組,其中所述組的單個(gè)
37. —種用于由非靶核酸片段中分離靶核酸片段的試劑盒,所述試劑盒包含權(quán)利要求34中提及的選擇探針組;和固體基質(zhì),所述固體基質(zhì)含與選擇探針上的部分結(jié)合的表面特 征,由此有利于選擇探針在所述基質(zhì)上的固定化。
38. 權(quán)利要求37的試劑盒,所述試劑盒還包含用于擴(kuò)增核酸片 段的引物和聚合酶。
39. 權(quán)利要求37或38的試劑盒,所述試劑盒還包含核酸陣列, 所述核酸陣列包含與輩巴核酸片段互補(bǔ)的序列。
40.權(quán)利要求37-39中任一項(xiàng)的試劑盒,其中所述固體基質(zhì)包括珠。
全文摘要
在單一介質(zhì)中提供多種獨(dú)特的選擇探針。每種選擇探針都具有與可存在于所研究樣品中的獨(dú)特靶序列互補(bǔ)的序列。例如,每種選擇探針都可與含用于測(cè)定生物體基因型的其中一種SNP的序列互補(bǔ)。單鏈選擇探針與具有獨(dú)特靶序列的樣品序列退火或雜交,所述獨(dú)特靶序列由選擇探針序列確定。利用合適的技術(shù)將不與選擇探針退火或雜交的樣品序列與結(jié)合序列分離。然后結(jié)合序列可自由提供分離的靶序列的混合物,所述混合物可根據(jù)需要用于現(xiàn)有應(yīng)用。
文檔編號(hào)C12Q1/68GK101155931SQ200680011151
公開日2008年4月2日 申請(qǐng)日期2006年1月25日 優(yōu)先權(quán)日2005年2月14日
發(fā)明者A·B·斯帕斯, A·奧爾曼, D·巴林格, G·付, J·希漢, L·斯塔夫, N·沈 申請(qǐng)人:珀?duì)柛茖W(xué)公司