專利名稱:有效進行核酸測序的方法和組合物的制作方法
本申請是共同未決的美國申請系列No.08/303,058(1994年9月8日申請)的后繼部分申請;而后者是美國申請系列No.08/127,420(1993年9月27日申請)的后繼部分申請;所述公開的全部內(nèi)容和附圖均引入本文作為參考,不刪除任何內(nèi)容。按照Department of Energy grant LDRD 03235和美國能源部和芝加哥大學(代表Argonne National Laboratory)之間的合同No.W-31-109-ENG-38,美國政府擁有本發(fā)明的權利。
本發(fā)明的背景1 本發(fā)明領域本發(fā)明總的來講涉及分子生物學領域。本發(fā)明特別提供新的方法和組合物以便能夠高效地確定核酸分子的序列。本發(fā)明方法適用于確定長核酸分子的序列,包括染色體和RNA,而不需要克隆或亞克隆步驟。
2 相關領域的描述核酸測序形成目前科學進步的不可或缺的領域。確定核酸分子和片段的序列,即一級結構就研究特定目標領域范圍的每個項目而言是非常重要的。測序所獲得的資料影響著科學、醫(yī)藥、農(nóng)業(yè)和生物技術的所有領域。當然,核酸測序?qū)τ谌祟惢蚪M項目以及其他大規(guī)模計劃是至關重要的,這些任務的目的在于進一步了解生物體的進化和功能并找出各種疾病的原因。
核酸測序的實用性是顯而易見的,例如在各中心進行的人類基因組項目(HGP),這是致力于確定全部人類基因序列的一項多國努力。但是,一般來講在此領域的進展緩慢而且成本高。通常在分離長度上有一個核苷酸差異的1-500bpDNA片段的聚丙烯酰胺凝膠上進行核酸測序??梢杂脙煞N方法實際確測序列,即每個A,G,C和T核苷酸的順序。第一種是使用在特定核苷酸處化學降解DNA片段的Maxam和Gilbert方法(Maxam &Gilbert(1977)),或第二種由Sanger和其同事描述的雙脫氧鏈終止測序方法(Sanger et al.,1977)。這兩種方法均費時費力。
最近,提出了不使用電泳步驟的其他核酸測序方法,這些方法總的可稱為經(jīng)雜交測序或SBH(Drmanac et al.,1991;Cantor etal.,1992;Drmanac & Crkvenjakov,美國專利5,202,231)。這樣一些方法的發(fā)展已產(chǎn)生了稱為測序芯片的新固體支持型測序工具??傊谶@項技術基礎上而授予的美國專利已證實了SBH的實用性。但是,盡管SBH有潛力提高用其進行核酸測序的速度,目前所有的SBH方法還有一些缺陷。
可以用兩種基本方式進行SBH,通常稱為方式1和方式2(Cantor et al.,1992)。在方式1中,將一般為100-1000個核苷酸的未知序列的寡核苷酸排列在固體支持物和濾膜上,以便固定本身未知的樣品(Strezoska et al.,1991;Drmanac &Crkvenjakov,美國專利5,202,231)。然后通過與約6-8個殘基的標記探針雜交來探知所述陣的復制品。在方式2中,從有約6-8個殘基之已知序列的寡核苷酸的陣形成測序芯片(Southern WO 89/10977;Khrapko et al.,1991;Southern er al.,1992)。然后標記未知序列的核酸并與固定寡核苷酸雜交。
令人遺憾的是,這兩種SBH方式都有一些限制,特別是需要預先的DNA克隆步驟。在方式1中,其他明顯的問題包括待測序的各種核酸碎片附著在固體支持物的表面或要制備大量的較長的探針。在方式2中,主要問題包括要標記未知序列的核酸,通常產(chǎn)生的高噪信比,而且事實上只能確定短序列。方式2的其他問題包括形成了不能接近一些靶目標的二級結構,而且不同GC含量的探針需要不同的條件。因此很明顯,本領域?qū)囊环N用于核酸測序的新方法,特別是省去了冗長的克隆和/或亞克隆過程的方法中獲益。
本發(fā)明綜述本發(fā)明通過提供確定核酸序列的新方法和組合物而尋求克服現(xiàn)有技術中固有的這些和其他缺陷。本發(fā)明人將本文描述的新技術稱為方式3,而且它顯示出在現(xiàn)存方式1和方式2 SBH方法上的顯著改進。在本發(fā)明提供的方式3測序中,提供與兩組已知序列的小寡核苷酸探針雜交而確定核酸序列。本發(fā)明方法可以對極大的核酸分子,包括染色體材料或RNA進行高分辨的測序,而預先不必進行克隆、亞克隆或擴增。此外,本發(fā)明方法不需要大量的探針,不需要進行較大探針的復雜合成,或標記核酸片段的復雜混合物。
根據(jù)本發(fā)明方法,為了確定核酸序列,人們通過與來自限定長度并已知序列的兩組小寡核苷酸探針(寡核苷酸)的互補序列雜交,來鑒定來自核酸的序列,所述探針覆蓋了此探針長度的最大序列組合。然后人們分析鑒測序列,以確定重疊的鑒測序列的范圍,然后從所述的重疊序列重建或組裝完整的核酸序列。
通過相繼與來自兩組小寡核苷酸的互補序列雜交可以完成測序方法。另外,可以用稱為“循環(huán)”的方式,其中兩組小寡核苷酸同時與未知序列雜交。術語“循環(huán)”用作所述技術的分辨部分,來源于提高溫度以“熔解”未互補的那些雜交物。所述循環(huán)技術是分子生物學的其他領域常用的,例如PCR,在閱讀本發(fā)明時本領域?qū)I(yè)人員是很容易理解的。
本發(fā)明可用于確定很長的核酸分子。作為一種實施情況,通常將待測的核酸分子制成片段以便得到易于操作的小或中等長度的核酸片段。本文所用的術語核酸片段大部分情況下指長度為約10個堿基對(bp)到約100bp之間的核酸分子。所完成的本發(fā)明的最優(yōu)選的方法是其中處理核酸分子以得到中等長度的,即約10bp到約40bp的核酸片段。但是應該強調(diào)的是,本發(fā)明不是完全確定小核酸片段序列的方法,而是確定核酸分子本身序列的方法,其中包括確定所述分子內(nèi)的部分序列-這或者用整個分子來完成,或者為了簡化,首先將所述分子制成較小的約4到約1000bp的片段。
通過與已知序列的小寡核苷酸探針雜交來確定來自核酸分子的序列。在所提到的“小寡核苷酸探針”中,術語“小”指少于10bp的探針,而且優(yōu)選的約4到約9bp長的探針。在一個舉證性的測序?qū)嵤┓桨钢?,設想約6bp的探針是特別有用的。對于覆蓋所選探針長度的所有序列組合的寡聚物的組來講,其數(shù)量為4F,其中F是探針的長度。例如,對于一個4-聚體,所述的組應含有256個探針;對于一個5-聚體,所述的組應含有1024個探針;對于6-聚體,是4096個探針;對于7-聚體,是16384個探針等。合成這種長度的寡核苷酸在本領域是常規(guī)的,而且可以用自動合成儀進行合成。
在本發(fā)明的方法中,將一組已知序列的小寡核苷酸探針(可以稱為第一組)附著在固體支持物上,即將其固定在支持物上,以便使其可以參與雜交反應。另一組已知序列的小寡核苷酸探針(可以稱為第二組)是溶液中的并且用可檢測標記標記過的探針。所述寡聚物組可以包括長度相同或不同的探針。
相繼雜交的過程指可將未知序列的核酸分子或片段與不同組已知序列的寡核苷酸探針在不同的時間雜交(
圖1)。通常將核酸分子或片段變性以便進行雜交,然后將其在有分辨力的雜交條件下加到第一組固定探針中,以確保只有有互補序列的片段才能雜交。除去沒有互補序列的片段,通過將第二組標記溶液中的探針加到已形成的片段探針組合中,從而完成下一輪的分辨雜交。在鄰接固定探針處發(fā)生雜交的標記探針將附著在支持物上并被檢測,若固定和標記探針之間有空間,則不是這種情況。
同時雜交的過程指可以將未知序列的核酸分子同時與不同組已知序列的寡核苷酸探針接觸。在分辨雜交條件下會發(fā)生雜交。然后將沒有互補序列的片段“熔解”,即通過提高溫度而除去,然后進行下一輪的分辨雜交,使任何互補的第二探針雜交。然后,用相同的方法,檢測在鄰接固定探針處發(fā)生雜交的標記探針。
“互補”的核酸序列是根據(jù)標準Watson-Crick互補法則以及用于修飾的堿基時該法則的變化,能夠進行堿基配對的那些。即較大的嘌呤或修飾的嘌呤總是與較小的嘧啶進行堿基配對,從而只能形成已知的組合。這些包括在DNA中,鳥嘌呤與胞嘧啶配對(GC),腺嘌呤與胸腺嘧啶配對(AT),或者在RNA中,腺嘌呤與尿嘧啶配對(AU)。設想也可以使用修飾的堿基或所謂的廣義堿基(M,Nichol et al.,1994)。
本文所用的術語“互補序列”指在整個長度上基本上完全互補并且?guī)缀鯖]有堿基失配的核酸序列。例如,若6個堿基長的核酸序列與6個位置中的5個雜交,而只有一個失配,則可以稱為互補。自然,“完全互補”的核酸序列是在其全長均完全互補,而且沒有失配的核酸序列。
核酸片段部分的各種單個序列通過與已知序列的寡聚物雜交而得到鑒定后,接下來分析這些單個序列以檢測重疊的序列伸展范圍。例如,鑒定了序列的一部分,其5’末端與另一序列的3’末端相同,或反之。然后可以描述核酸分子或片段的完整序列,即可以從由此確定的重疊序列將其重建。
通常通過計算分析鑒定重疊序列并重建完整序列。例如,如果標記探針5’-TTTTTT-3’與含有固定探針5’-AAAAAA-3’處雜交,就確定了核酸分子內(nèi)的一個12聚體的序列,即5’-AAAAAATTTTTT-3’(SEQ ID NO1),即將兩個雜交探針的序列合起來得到一個以前未知的序列。接下來要回答的問題是新確定的5’AAAAAATTTTTT-3’(SEQ ID NO1)序列后的核苷酸是什么。由固定探針5’-AAAAAT-3’和A標記探針5’-TTTTTA-3’;標記T的5’-TTTTTT-3’;標記C的5’-TTTTTC-3’;標記G的5’-TTTTTG-3’代表了四種可能性。例如,如果探針5’-TTTTTC-3’是陽性的,而其他三種是陰性的,則裝配的序列延伸為5’-AAAAAATTTTTC-3’(SEQ ID NO2)。在接下來的步驟中,規(guī)則系統(tǒng)確定在含有固定探針AAAATT處,標記探針TTTTCA,TTTTCT,TTTTCC或TTTTCG哪一個是陽性的。重復所述的過程直到使用了所有的陽性(F+P)寡核苷酸序列或?qū)⑵浯_定為假陽性。
因此本發(fā)明提供了一種非常有效的途徑以確定長核酸片段和分子的序列。本文所定義的大核酸分子是在測序前需切成片段的那些分子。通常它們有至少約45或50個堿基對(bp)長,而且經(jīng)常是更長的。事實上,可以用本發(fā)明方法測序的核酸分子的長度實際上沒有上限,以致于可以確定約100bp,1kb,100kb,1Mb和50Mb或更長的序列,最多達到而且包括完整的染色體,例如長度約為100Mb人染色體。這樣大的數(shù)目也在本發(fā)明范圍內(nèi),而且確定所述數(shù)目堿基的序列需要兩組8聚體或9聚體的寡核苷酸(以便使F+P≈16-18)。待測的核酸可以是DNA,例如cDNA,基因組DNA,顯微解剖而得到的染色體帶,粘粒DNA或YAC插入片段,或者可以是RNA,包括mRNA,rRNA,tRNA或snRNA。
確定長核酸分子之序列的方法包括單純地從所述分子中鑒定長度為F+P的序列,然后用適宜的規(guī)則系統(tǒng)組合所述序列。在實踐中,人們最有可能首先將待測的核酸分子制成片段以得到較小的片段,例如中等長度的核酸片段。然后如上所述通過將所述片段與來自兩組已知序列的小寡核苷酸探針的互補序列雜交,例如相繼雜交而鑒定長度為F+P的序列。在所述方法中,從長度為F+P的重疊序列可以重建特大分子的完整核酸序列。
不論待測核酸本身是中等長度的片段還是先被處理然后得到如此長度的片段,通過與兩組已知序列的小寡核苷酸探針雜交從而從核酸片段鑒測序列的方法是本文所公開的測序方法的中心內(nèi)容。所述方法主要包括下列步驟(a) 在有效的雜交條件下,將附著或固定寡核苷酸探針組或陣與核酸片段接觸,以使含有互補序列的片段與探針充分雜交,由此形成一級復合物,其中所述片段具有雜交的和未雜交的,或“游離”序列;(b) 在有效的雜交條件下,將一級復合物與溶液中標記寡核苷酸探針組接觸以便使含有互補序列的探針與未雜交的或游離的片段序列雜交,由此形成二級復合物,其中所述片段與附著(固定)探針和標記探針均雜交;(c) 從二級復合物中除去與附著探針未鄰接雜交的標記探針,由此只剩下鄰接的二級復合物;(d) 通過檢測標記探針中標記存在來檢測鄰接的二級復合物;和(e) 通過組合或連接雜交的附著及標記探針,從鄰接的二級復合物的核酸片段鑒定寡核苷酸序列。
根據(jù)所選的特定的測序方案,可以操縱用于處理一個或兩個雜交步驟中的雜交或“洗滌條件”。例如,設計兩種雜交條件使含有互補序列,即基本上匹配的序列,例如與6個位點上有5個雜交的那些序列的寡核苷酸探針與所給的核酸片段雜交。正如在目前的測序方法中所常規(guī)使用的,優(yōu)選用簡單的機器人裝置進行雜交步驟。
另外,可以設計雜交條件使只有含有完全互補序列的那些寡核苷酸探針和片段雜交。這些分辨力更高的或更“嚴緊”的條件可以用于相繼雜交過程的兩個不同步驟或只用于兩個步驟中的任意一個中。在所述情況下,所述寡核苷酸探針不論是固定還是標記探針,都只能與所給片段享有完全互補序列時與所給的核酸片段雜交。
所選的雜交條件通常限定了分析所得的數(shù)據(jù)所需的復雜程度。同樣,用于分析任何所得數(shù)據(jù)的計算機程序可以限定在指定實驗室中所必須使用的雜交條件。例如,在分辨力最高的方法中,兩個雜交步驟都要在只能使具有完全互補序列的寡核苷酸和片段雜交的條件下進行。由于沒有失配的堿基,所述方法牽涉最不復雜的計算分析,因此,它是目前實施本發(fā)明的優(yōu)選方法。然而,一個或兩個雜交步驟中使用分辨力較低的條件,也在本發(fā)明范圍內(nèi)。
在任意一個或兩個步驟中所用的適宜的雜交條件常規(guī)的可以通過最優(yōu)化方法或‘導航研究’而得到確定。由核酸測序領域?qū)I(yè)人員常規(guī)地進行各種導航研究,建立工作方法和為給定實驗室改變方法。例如,可以改變條件例如溫度;各組分的濃度;所述步驟的時間長度;所用的緩沖液及其pH和離子強度,從而使其最優(yōu)化。
在優(yōu)選的實施方案中,本發(fā)明的核酸測序方法包括一個分辨步驟,以篩選包括了緊鄰的固定和標記探針的二級雜交復合物,它們不同于未緊鄰并且由一個,兩個或多個堿基分開的那些復合物??梢杂酶鞣N方法除去未與固定探針緊鄰雜交的標記探針,即未對頭拼接雜交的標記探針,留下的每個都是緊鄰的二級復合物。
所述的分辨過程可能僅依賴于嚴緊控制的洗滌步驟,其中設計所用的雜交條件使緊鄰的探針仍保持雜交,這是由于相鄰核苷酸疊加的相互作用使穩(wěn)定性提高。此外,可以改變洗滌條件,例如溫度,濃度,時間,緩沖液,pH,離子強度等,以便使除去未緊鄰的標記探針的效果達到最佳。
在優(yōu)選的實施方案中,在進行洗滌步驟前緊鄰的固定和標記探針應連接起來,即使它們共價相連,以除去任何未連接的探針。通過用含有化學連接試劑處理例如,水溶性的碳化二亞胺或溴化氰的溶液來進行連接。更優(yōu)選的,可以使用來自許多來源(例如,Biolabs)的市售的連接酶,例如來自T4噬菌體的T4DNA連接酶。在任何情況下,然后人們可以通過更嚴緊的洗滌條件除去未緊鄰的標記探針,所述的洗滌條件不會影響共價相連的標記和固定探針。
通過觀察復合物中標記探針的標記位置,可以保留的相鄰二級復合物??梢杂没瘜W可檢測標記,例如熒光染料,或者經(jīng)足夠的修飾以致可以由化學顯色方法檢測的,或放射性標記例如35S,3H,32P或33P,來標記寡核苷酸探針,目前用33P是優(yōu)選的。也可以用非放射性同位素標記探針,然后用質(zhì)譜檢測。
目前,實施本發(fā)明最優(yōu)選的方法包括在所設計的條件下完成雜交,所述條件只能使有完全互補序列的寡核苷酸探針和片段雜交,而且只能使緊鄰的那些探針保持雜交狀態(tài)。所述方法隨后需要最不復雜的計算分析。
若未知序列的核酸分子長于45或50bp,則確定其序列的有效方法主要包括處理所述分子以得到中等長度的核酸片段,然后確定這些片段的序列。核酸分子不論它是DNA還是RNA,都可以通過多種方法中的一種切為片段,例如通過限制酶消化來切割,通過物理方法來剪切如超聲處理,通過NaOH處理或通過低壓剪切。
在特定的實施方案中,例如涉及約4bp到約9bp的小寡核苷酸探針,人們目的生產(chǎn)約10bp到約40bp的核酸片段。當然,通常用較長的探針來確定較長核酸片段的序列,反之亦然,在特定優(yōu)選的實施方案中,所用的小寡核苷酸探針為約6bp長,待測的核酸片段通常為約20bp長。如果需要,可以按大小分離片段以得到適宜長度的片段,例如,可以進行凝膠電源,例如瓊脂糖凝膠,然后切下約所需長度的片段。
用下列術語也可以舉例說明確定核酸分子序列的方法。首先人們要將一定量的待測核酸隨機制成片段以得到長度為T的核酸片段的混合物。然后制備長度為F的一批已知序列之固定寡核苷酸探針和一組溶液中已知序列的長度為P的寡核苷酸探針,其中,F(xiàn)+P≤T,且優(yōu)選的T≈3F。
然后在雜交條件下,人們將固定寡核苷酸探針與混合核酸片段接觸,所述的雜交條件可以促使有效地形成雜交的及長度為F的互補序列,長度為T-F的未雜交片段序列的一級復合物。優(yōu)選的,長度為F的雜交序列只含有完全互補的序列。
然后在有效的雜交條件下,將一級復合物與標記寡核苷酸探針組接觸,以形成二級復合物。所述二級復合物含有雜交的、長度為F的互補序列和鄰接雜交的、長度為P的互補序列。在優(yōu)選的實施方案中,只有帶有完全互補序列的那些標記探針才能進行雜交,而且只有在緊鄰固定探針處雜交的那些探針才能保持雜交狀態(tài)。在最優(yōu)選的實施方案中,在此階段,將連接鄰接的固定和標記寡核苷酸探針。
接下來,通過檢測標記存在而檢測二級復合物,然后通過組合已知序列的雜交的固定和標記探針,從二級復合物的核酸片段中鑒定長度為F+P的序列。然后鑒定重疊的長度為F+P的序列范圍,由此重建或從確定的重疊序列組裝完整的核酸序列。
在本發(fā)明的方法中,可以通過本領域?qū)I(yè)人員熟知的任何方法將第一組寡核苷酸附著,即將其固定到固體支持物上。例如,可以經(jīng)可尋址的激光激活的光去保護進行附著(Fodor et al.,1991;Pease et al.,1994)。一種優(yōu)選的方法是使用試劑例如nocleosidephosphoramidite或nocleoside hydrogen phosphorate如Southern& Maskos所述(PCT專利申請WO90/03382,摻入本文作為參考),通過磷酸酯基團附著寡核苷酸并使用玻璃,尼龍或特富龍(teflon)支持物。另一種優(yōu)選的方法是由Pease等人描述的光引發(fā)的合成(1994;引入本文作為參考)。人們也可以購買支持物結合的寡核苷酸,例如,由Affymetrix和Beckman銷售的產(chǎn)品。
可以將固定寡核苷酸形成含有全部探針或給定長度(優(yōu)選的約4到10個堿基)的探針亞組的陣,而且更優(yōu)選的形成多個排好的固定寡核苷酸的陣,以形成所謂“測序芯片”。一種芯片的實例是使用疏水部分以產(chǎn)生獨特的空間區(qū)域??梢栽O計用于不同應用的測序芯片,例如用于制作圖譜,部分測序,用于診斷目的的靶區(qū)域的測序,mRNA測序和大規(guī)?;蚪M測序。對于每種應用,一種特定芯片可設計有不同大小探針或有不整套的探針。
在一個舉證性實施方案中,兩組寡核苷酸探針均為6個堿基長的探針,即6-聚物。在這種情況下,每組寡核苷酸含有4096個不同的探針。優(yōu)選的第一組探針成陣地固定在一個微芯片上,最好是排列在64排和64列中。用可檢測標記標記第二組的4096個寡核苷酸,然后分配在一組不同的試管中。在該實施例中,4096個芯片將被組合在一個大的陣或數(shù)個陣中。雜交核酸片段后,少量標記寡核苷酸加到各微芯片中以便進行第二個雜交步驟,4096個核苷酸中只有一個被加到一個微芯片中。
本發(fā)明其它的實施方案包括用于核酸測序的試劑盒,所述試劑盒通常含有附著有已知序列寡核苷酸探針陣的固體支持物,如圖2A,圖2B和圖2C所示,其中所述的寡核苷酸能夠參與雜交反應,和一組含有已知序列的標記寡核苷酸探針溶液的容器。也可以按圖4所示完成排列。這描述了廣義堿基的使用,作為一種附著方法或在末端給雜交片段增長尺寸。
在所述的試劑盒中,附著和溶液中的寡核苷酸探針可以是約4bp到約9bp長,優(yōu)選的為約6bp長。所述寡核苷酸可以用化學可檢測的或放射性標記進行標記,一般用32P標記探針是優(yōu)選的,33P-標記探針是更優(yōu)選的。所述試劑盒也可以含有化學或其它連接試劑,例如DNA連接酶。所述試劑盒也可以包括各種其它附加組合物和材料,例如96-頭或96-針裝置,緩沖液,切割長核酸分子的試劑和進行DNA片段大小篩選的工具。所述試劑盒甚至還可以包括標記RNA探針以便用RNAase除去探針,然后重復使用測序芯片。
附圖的簡要描述圖1雜交過程中的基本步驟。步驟1待測序的未標記靶DNA(T)在分辨條件下與一附著寡核苷酸探針陣雜交。描述了連接探針Fx和探針Fy點。Fx和Fy的互補序列在T的不同位置。步驟2標記探針Pi(每芯片一個探針)與所述陣雜交。所描述的是在T上有互補靶的鄰接Fx而不是Fy探針。步驟3通過應用分辨條件或試劑,選擇性地熔解沒有鄰接探針的復合物。一個特定的實例是標記探針與附著探針背對背雜交時標記探針與固定探針連接。只有在探針鄰接的情況下才能檢測到陽性信號如Fx和Pi,在一個特定的實施例中,只有在探針連接的情況下才能檢測到。
圖2A,圖2B和圖2C表述舉證性測序試劑盒的組分。
圖2A 測序芯片,表示4P相等單元的陣各含有相等(或不等)的寡核苷酸陣。通過物理屏障或疏水帶可將單元分開。在所述陣中有4,000-16,000個寡核苷酸芯片。
圖2B是一個含有4F點的芯片單元放大圖,每一個點上都有一個特定的合成的或點在上面的寡核苷酸探針(4,000-16,000)。每個點有數(shù)微米那么小,單元的大小為約1到10mm。
圖2C表示一組試管,或一個或多個多孔平板,具有適宜數(shù)目的孔(在此情況下為4P個孔)。每個孔含有一定量的特異性標記寡核苷酸。如果合成時未進行標記,則可以貯存另外的未標記探針;在這種情況下,測序試劑盒將含有進行探針標記所必需的組分。連接試管/孔與芯片單元的線描述測序過程中的一個步驟,其中,一定量的一種標記探針被轉移到芯片單元。通過加樣器(單或多道的)或通過利用表面張力的針陣轉移溶液。測序試劑盒中也可以包括轉移工具。
圖3A,圖3B和圖3C。通過隨機切割一定量的一種DNA分子而產(chǎn)生的DNA片段的雜交。在圖3A中,DNA片段T1含有固定和非固定標記探針的完整靶。圖3B表示未適當切割DNA片段的情況。在圖3C中,有足夠的空間使探針P進行雜交,但鄰接的序列不與它互補。在B和C的情況下,由于附著探針F分子的飽和,信號將受到減弱。與DNA片段和標記探針同時雜交以及雜交過程的循環(huán)是一些提高正確鄰接雜交率的可能的途徑。
圖4。廣義堿基作為接頭或處于雜交終止位置中的應用。在探針合成中可以加入廣義堿基(M堿基,Nichols et al.,1994)或所有四種堿基。這是一種增加探針長度,從而提高雙螺旋的穩(wěn)定性但不增加探針的數(shù)目的途徑。廣義堿基在探針游離末端的使用還提供了可以在不同閱讀框架中閱讀序列的間隔。
優(yōu)選實施方案的詳細描述在基礎和應用生物學研究中確定核酸分子的序列是很重要的(Drmanac & Crkvenjakov,1990)。本發(fā)明提供了新而有效的確定并分析核酸分子序列的方法。所述方法的一個預期用途是與其他測序技術結合用于人基因組項目(HGP)。
目前已知有兩種通過雜交測序(SBH)的方法。在方式1中,首先未知的基因組DNA或長達100-2000個核苷酸的寡核苷酸被排列在固體支持物上。然后通過與一組通常為6到8聚物的標記探針雜交來探詢這些DNA。在相反的技術方式2中,6到8個核苷酸的寡聚物被固定在固體支持物上,然后與克隆并標記DNA碎片退火。
在兩種SBH分析方法中的任一種中,必須包括許多步驟以便得到確定的序列?,F(xiàn)有SBH方法的特殊問題就是與合成大量探針以及難以有效進行分辨雜交有關的問題。由于兩個原因而很難做到完全分辨匹配和失配。首先,長于10個堿基的探針的末端失配是很難分辨的,第二,在分析長DNA片段時,所得的標記DNA片段的復雜混合物產(chǎn)生了高背景。
本發(fā)明提供了不需大量探針或增加長度的探針的有效分辨雜交而且消除了許多標記和克隆步驟,而這正是目前已知的每種SBH方法的特別缺陷之處。公開的高效核酸測序方法(稱為方式3測序法)是基于與兩組已知序列的小寡核苷酸探針雜交,因此至少可以確定雙倍長度的序列。這些方法也可以確定極大核酸分子,包括染色體的測序,并解決其他SBH方法的問題,例如,許多核酸片段的附著或標記。本發(fā)明的特別有效之處還在于可以用其確定RNA甚至未擴增的RNA樣品的序列。
繼本發(fā)明之后,如公布于美國系列申請No.08/127,402和Drmanac(1994)中,描述了另一種稱為陽性SBH(PSBH)的SBH的變體(Broude et al.,1994)。PSBH基本上是方式2的變體(其中固定已知序列的寡核苷酸,然后用其與已標記未知序列的核酸雜交)。在PSBH中,固定探針不是簡單的單鏈探針,而是含有單鏈3’突出端的雙螺旋。生物素化的雙螺旋探針被固定在鏈霉抗生物素蛋白包被的磁珠上,以形成一種固定探針,然后與32P標記待測靶核酸混合。然后加入T4DNA連接酶以便將任何雜交的靶DNA與雙螺旋探針的較短末端相連。然而,盡管代表了一種有趣的方法,但是,PSBH(如Broude et al.,1994報告的)與現(xiàn)存的SBH技術相比并沒有顯著的進步。例如,與本發(fā)明的方式3方法學不同,在方法的一輪實驗中PSBH并未延長可測測序列的長度。PSBH仍需進行繁重的工作以標記未知的靶DNA,而這在方式3中是不需要的??偠灾?,PSBH建成用于比較性研究或作圖,而不是用于從頭進行基因組測序。因此盡管它被廣泛地用于所有的測序領域,但是它與作為甚至最大的基因組測序的有效工具的方式3相比有著顯著的不同。
首先可以將待測的核酸制成片段。用任何方法均可完成這一步驟,所述的方法包括,例如,用限制酶切割,特別是用Fitzgerald等人描述(1992)的Cvi JI;用物理方法例如超聲處理剪切;用NaOH處理;等。如果需要,可以從凝膠中切出適宜長度,如約10bp到40bp之間的片段。源分子(如人染色體)的完整核酸序列是通過限定源分子中存在的F+P序列并組裝F+P序列的重疊部分來確定的。因此本發(fā)明方法并不需要確定片段序列的中間步驟,而是從描述的F+P序列構建整個分子的序列。
出于下列所討論的目的,通??梢约俣ㄋ姆N堿基組成了待測核酸的序列。它們是用于DNA的A,G,C和T以及用于RNA的A,G,C和U。然而,在特定實施方案的小寡核苷酸探針中使用修飾的堿基可能是有利的。為了完成本發(fā)明,人們通常制備大量限定長度的小寡核苷酸探針,探針覆蓋了所有的序列組合。所述的數(shù)目為4N(4的N次方),其中,探針的長度為N。例如,對于6聚體的探針來說,有4096種可能序列(46=4096)。
在1mm2或1cm2微芯片上的一個正方陣中,固定一組長度為F的所述探針(4F)。在本發(fā)明的實施例中,將以64行和64列而排列。當然,人們要確保將寡聚物探針附著,或者說固定在微芯片的表面上,以便所述的寡聚物探針能夠參與雜交反應。還要合成另一組長度為P的寡聚物數(shù)目為4P?!癙組”的寡聚物用可檢測標記標記,將其分散在一組試管中(圖2A,2B和2C)。
4P個芯片將組合在一個大的陣中(或?qū)τ谝粋€方便的大小是,約10-100cm2的數(shù)個陣中),其中P相當于第二組寡聚物組中的寡核苷酸長度(圖2A,圖2B和圖2C)。另外作為一個方便的實施例,P可以選為6(P=6)。
可以將待測核酸制成片段以便得到未知序列的小核酸片段。這些片段的平均長度(稱為T)一般應大于F和P的組合長度,而且可以是F長度的3倍(即F+P≤T和T≈3F)。在本發(fā)明的實施例中,人們想制得約20個堿基對長的核酸片段。將這些片段變性并在有利于互補序列雜交的條件下加到大陣中。
在本發(fā)明最簡單和目前最優(yōu)選的形式中,選擇雜交條件以使只有當核酸片段中的6個連續(xù)的核苷酸與F寡核苷酸探針的所有6個核苷酸互補時才發(fā)生顯著的雜交。所述雜交條件可以通過常規(guī)的優(yōu)化領航研究來確定,所述的條件包括例如溫度,各組分的濃度,各步驟時間的長度,所用的緩沖液以及緩沖液的pH。
在該階段,各微芯片含有特定的雜交復合物。這些將以探針片段復合物形式存在,其中整個探針序列與所述片段雜交,但所述的片段較長,有一些未雜交序列形成復合物的“尾”。在所述實施例中,互補雜交的序列的長度為F,而未雜交序列長為T-F。所述片段的互補部分可以在或朝向一個適宜的末端,以便是形成一個較長的未雜交的尾。另外,所述片段的互補末端可以朝向相反的末端以便形成兩個未雜交的尾(圖3A,圖3B和圖3C)。
洗滌除去未雜交的非互補核酸片段后,將少量的組P中的標記寡核苷酸加到各微芯片中以便與從探針片段復合物伸出的未知序列的核酸片段尾雜交。僅將4種核苷酸之一種加到各微芯片中。此外目前優(yōu)選的是使用只有當標記探針的所有6個核苷酸與核酸片段尾的6個連續(xù)核苷酸互補時而發(fā)生顯著結合的雜交條件。如上所述,可以經(jīng)領航確定優(yōu)化雜交條件,例如溫度,濃度,時間,緩沖液等。
在該階段,每微芯片含有特定的‘二級雜交復合物’。這些是探針片段探針復合物形式,其中各探針的整個序列與所述片段雜交,而且其中所述片段可能有一些未雜交的序列。在這些二級雜交復合物中,固定探針和標記探針都與所述片段雜交以便兩個探針緊鄰或“背對背”。但是,給定的所述片段一般比探針的總長度長,固定探針和標記探針可能在由一個或多個堿基分開的非鄰接位置上與所述片段雜交。
然后用一種方法處理大陣以除去未雜交的標記探針。在優(yōu)選的實施方案中,所用的方法不僅可從陣中除去未雜交的標記探針,也可以除去非鄰接雜交的標記探針。所述方法將使用分辨條件,以便從其中核酸片段與未鄰接的兩個探針雜交的那些二級雜交復合物中,分辨出包括鄰接的固定和標記探針的那些二級雜交復合物。這是本發(fā)明的一個重要方面,因為它最終描述對應于固定探針和標記探針之組合序列的片段序列部分。
用于從陣中除去未雜交的和未鄰接雜交的探針而留下鄰接雜交的探針附著分辨步驟又是一個控制的洗滌過程。由于鄰接探針的疊加效應,利用其增加的穩(wěn)定性可以使鄰接雜交的探針不受所選條件的影響。但是,在優(yōu)選的實施方案中,考慮例如通過用含有化學連接劑或優(yōu)選的用連接酶例如T4 DNA連接酶(Landegren et al.1988 Wu & Wallace,1989)的溶液處理,人們可以處理大陣以便使鄰接的探針共價相連。
在任何情況下,完整的陣都要經(jīng)嚴緊的洗滌,以便只剩下與陣相連的探針是帶有長度為F+P個之鄰接雜交部分的雙鏈探針-片段-探針復合物(即本發(fā)明實施例中的12個核苷酸)。使用這種兩步雜交反應,可以達到很高的分辨,這是因為考慮了3或4個獨立分辨過程片段T至F個堿基的探針的分辨雜交;P個堿基的探針與片段T的分辨雜交;與P雜交體或甚至與含有非鄰接的F+P探針的失配的雜交體相比,完全匹配(F+T+P)雜交體的分辨穩(wěn)定性;F和P兩個末端堿基的分辨連接。
人們通過觀察陣中保留標記位置檢測所謂的鄰接二級復合物。從所述標記位置,通過組合固定和標記探針的已知序列可以確定所述片段的F+P(例如12)個核苷酸長的序列。然后從因此確定的重疊的F+P序列可以重建或組裝源分子,例如人染色體的完整核酸序列。
若在測序過程中使用連接,按目前優(yōu)選的,則不能重復使用普通的寡核苷酸芯片。本發(fā)明人認為用各種方法進行再循環(huán)是,這不會成為限制。例如,人們可以在探針之間產(chǎn)生可特異性裂解的鍵,然后在檢測后裂解所述的鍵。另外,人們也可以使用核糖核苷酸作為第二探針,探針P,或用核糖核苷酸作為探針P中的連接堿基,以便隨后可以用RNA酶或通過尿嘧啶DNA糖基化處理(Craig et al.,1989)除去所述的探針。其他設想的方法是用可以被選擇性切割的化學連接來產(chǎn)生鍵(Dolinnaya et al.,1988)。
也可以設想本測序方法學進一步改變和改進,而且也在本發(fā)明的范圍之內(nèi)。這包括使用修飾的寡核苷酸以提高所述方法的特異性或有效性,與Hoheisel & Lehrach(1990)描述的相似。也可以使用循環(huán)雜交以增加雜交信號,正如在PCR技術中所用的。在這些情況下,人們可以使用不同溫度的循環(huán)以再雜交特定的探針。通過使用末端位置等摩爾量的不同堿基的探針,本發(fā)明還提供了確定移碼的方法。例如,使用等摩爾的7聚體,其中前六個堿基相同,而最后位置上可以是A,T,C或G均可。
下列實施例將用于說明本發(fā)明優(yōu)選的實施方案。本領域?qū)I(yè)人員應接受,在表述了本發(fā)明人所發(fā)明技術之后,于下列實施例中公開的技術,以本發(fā)明的實施中起很好的作用,因此可以認為構成其實施的優(yōu)選方式。但是,本領域?qū)I(yè)人員從本發(fā)明的公開來看,應該理解在公開的特定實施方案中可以有許多改變,并且仍可得到相似的結果而不會偏離本發(fā)明的精神和范圍。
實施例I制備支持物結合的寡核苷酸通過例如用化學方法直接合成寡核苷酸,實踐中通常用自動寡核苷酸合成儀可以很容易地合成寡核苷酸,即小核酸片段。
用任何適宜的支持物,例如玻璃、聚苯乙烯或特富龍(teflon),本領域?qū)I(yè)人員用任何已知的方法可以很容易地制備支持物結合的寡核苷酸。一種策略是把用標準合成儀合成的寡核苷酸精確地置于一點。用被動吸附(Inouye & Hondo,1990);用紫外光(Nagata et al.,1985’;Dahlen et al.,1987’;Morriey & Collins1989)或通過共價健合堿基修飾的DNA(Keller et al.,1988;1989)可以達到固定目的,所有文獻均引入本文作為參考。
可以使用的另一策略是用強生物素-鏈霉抗生物素蛋白間的相互作用作為連接物。例如Broude等人(1994)描述了生物素化探針的使用,盡管這些是雙螺旋探針,但還是將其固定在鏈霉抗生物素蛋白包被的磁珠上。鏈霉抗生物素蛋白包被的磁珠可以從Dynal,Oslo處購買。這種相同的連接化學也適用于用鏈霉抗生物素蛋白包被任何表面。生物素化的探針可以從各種來源購買,例如,Operon Technologies(Alameda,CA)。
Nunc實驗室(Naperville IL)也出售可以使用的適宜的材料。Nunc實驗室已研制了一種方法,用這種方法可以將DNA共價健合到稱為CovaLink NH的微孔表面上。CovaLink NH是用二級氨基(>NH)嫁接的聚苯乙烯表面,所述的二級氨基作為進一步共價健合的鍵橋的頭??梢詮腘unc實驗室購買CovaLinkModules。通過磷酰胺鍵DNA分子可以僅僅在5’-末端與CovaLink結合,固定1pmol以上的DNA(Rasmussen et al.,1991).
已描述了利用CovaLink NH條帶在5’-末端共價健合DNA分子(Rasmussen等,1991)。在所述技術中,使用了磷酰胺鍵(Chu等,1983)。由于僅僅使用一個共價鍵,因而是優(yōu)選的。磷酰胺鍵將DNA與CovaLink NH二級氨基相連接,所述的氨基位于通過一個2nm長的間隔臂共價連于聚苯乙烯表面的間隔的一端。為了通過磷酰胺鍵將寡核苷酸與CovaLink NH相連,所述寡核苷酸末端必須有一個5’-末端磷酸基。那么甚至可能將生物素與CovaLink NH共價健合,然后用鏈霉抗生物素蛋白結合探針。
更具體地說,連接方法包括將DNA溶解在水中(7.5ng/ul)然后于95℃變性10分鐘,在冰上冷卻10分鐘。然后將冰冷的0.1M1-甲基咪唑,PH7.0(1-MeIm7)加到終濃度為10mM1-MeIm7.將ss DNA溶液分散在冰上的CovaLink NH條帶(75μl/孔)中。
制備新鮮的溶于10mM 1-MeIm7的碳化二亞胺0.2M 1-乙基-3-(二甲基氨基丙基)-碳化二亞胺(EDC),每孔加入25ul。將條帶在50℃溫育5小時。溫育后用例如Nunc-Immuno洗液洗滌條帶;首先將孔洗滌3次,然后用洗滌溶液將其浸5分鐘,最后再將其洗滌3次(其中洗滌溶液是0.4NaOH,加熱到50℃的0.25%SDS)。
認為更適用于本發(fā)明的其他方法在PCT專利申請WO90/03382(Southern & Maskos)中作了描述,該申請引入本文作為參考。這種制備與支持物結合的寡核苷酸的方法包括將核苷3’-試劑通過磷酸酯基團經(jīng)共價磷酸二酯鍵附著于支持物攜帶的脂肪族羥基上。在附著核苷上合成寡核苷酸,在不會從支持物上裂解所述寡核苷酸的標準條件下從合成的寡核苷酸中除去保護基團。適宜的試劑包括nocleoside phosphoramidite和nocleosidehydrogen phosphorate.
更詳細地說,通過于90℃與二甲苯,glycidoxy丙基三甲氧基硅烷,和痕量的二異丙基乙基胺混合物接觸過夜而得到用于所述方法的支持物,例如玻璃平皿。然后用甲醇,醚將其徹底洗滌,并空氣干燥。然后在含催化量的濃硫酸的六乙基甘醇中將所得的支持物在氬氣中于80℃加熱并攪拌過夜以得到烷基羥基衍生的支持物。用甲醇和醚洗滌后,真空干燥支持物,然后在氬氣中貯于-20℃。
然后用衍生的玻璃平皿為固體支持物,在標準條件下用手完成寡核苷酸的合成。第一個核苷酸是三乙基銨鹽形式的3’-磷酸氫酯,所述方法可以得到高純度的與支持物結合的寡核苷酸。
也可以使用在芯片上制備DNA探針列陣的策略。例如,按Fodor等人(1991)所述(該文獻引入本文作為參考),直接在玻璃表面化學合成寡核苷酸時可以使用可尋址的激光激活的光去保護作用。也可以按Van Ness等人(1991)所述將探針固定在尼龍支持物上,或用Duncan & Cavalier(1988)的方法與特富龍相連;所有文獻均引入本文作為參考。
Fodor等人(1991)描述了光指導的二核苷酸的合成,所述二核苷酸適用于用于裝置微制備的復雜化合物的空間指導的合成。這是以利用光在固體支持物上指導同時合成化學化合物的方法為基礎的。通過一個罩暴露于光或其他形式能量的方式或通過其他空間可尋址方法確定支持物的哪個區(qū)域被激活用于化學偶合。通過光激活的原因在于從所選的區(qū)域中除去了對光不穩(wěn)定的基團。去保護后,將第一個攜帶對光不穩(wěn)定基團的化合物暴露于整個表面,但只與在前一步驟中由光訪問的區(qū)域發(fā)生反應。透過第二個罩照射底物,激活與第二個保護的結構單元反應的不同區(qū)域。在這些照射中所用的罩的形狀和反應劑的序列決定了終產(chǎn)物和其位置。高度縮小是可能的,因為合成位點的密度只是根據(jù)空間可尋址能力受物理照射,即光照射的限制。每個化合物都受影響并且可以精確地知道其位置,因此,用這種方法制備的寡核苷酸芯片都可用于SBH。
Fodor等人(1991)描述了如下光激活形成二核苷酸的方式。從3’-胸苷乙酯合成5’硝基-藜蘆基胸苷。用堿去保護后,5’-硝基藜蘆基胸苷通過其3’-羥基與一胺化的底物成鍵。透過一個500-um的方格罩照射而除去硝基藜蘆基保護基團。然后用亞磷酰胺活化的2’-脫氧胞嘧啶核苷處理底物。為了用熒光方法跟蹤反應,此脫氧胞苷已用連接于環(huán)外氨的Fmoc保護氨已基連接物加以修飾。用堿除去FMOC保護基團后,通過用FITC處理底物而熒光標記含有二核苷酸的區(qū)域。因此完成所述的方法后,就可以合成支持物結合的寡核苷酸。
按Van Ness等人(1991)所述,為了將寡核苷酸與尼龍支持物相連,按如下要求經(jīng)烷基化活化尼龍表面同時選擇性的用氰尿酰氯活化寡核苷酸的5’-胺。用三乙基氧翁四氫硼酸鹽將尼龍表面乙基化以便在尼龍表面形成胺反應活性的亞氨酸酯(imidate),用1-甲基-2-吡咯烷酮作為溶劑。尼龍表面是未磨光的以達到最大可能的表面面積。
然后使活化表面與聚(吖丙啶)(Mr-10 K-70K)反應以形成聚合物包被,從而提供了用于連接寡核苷酸的一個延伸的胺表面。帶胺尾的寡核苷酸選擇性地與過量的氰尿酰氯反應(僅僅在胺尾),以便以定量的產(chǎn)率得到4,6-二氯-1,3,5-三嗪基-寡核苷酸。用氨基取代氰尿酰氯的一個氯會明顯地降低其余氯基團的反應性。這樣提高了4,6-二氯-1,3,5-三嗪基-寡核苷酸的水解穩(wěn)定性,從而適于在緩沖的水溶液(pH8.3,4℃,1星期)中在延長的時期內(nèi)都是穩(wěn)定的,并且容易用大小排阻層析或超濾分離和純化。
反應對于胺尾是特異性的,而在核苷酸部分沒有明顯的反應。然后PEI包被的尼龍表面與用氰尿酰氯活化的寡核苷酸反應。很容易將高濃度的‘捕獲’序列固定在表面上,而在衍生過程的最后步驟中用琥珀酸酐封閉未反應的胺基。
一種制備支持物結合的寡核苷酸的特殊方法是由Pease等人(1994。引入本文作為參考)描述的利用光產(chǎn)生的合成。這些作者使用了目前的照相平版印刷技術以得到固定寡核苷酸探針的列陣(DNA芯片)。這些方法(其中用光以高密度、縮小的列陣指導寡核苷酸探針合成)利用了對光不穩(wěn)定的5’-保護的N-?;?脫氧nocleoside phosphoramidite,表面連接化學以及多種組合的合成策略。用這種方法可以得到256個空間限定的寡核苷酸探針的方陣,然后按本文所述用于有利的方式3測序。
Pease等人(1994)提出了一種適用于光指導的寡核苷酸合成策略。在所述方法中,透過照相平版印刷罩照射用對光不穩(wěn)定的保護基團修飾的固體支持物的表面,在受到照射的區(qū)域得到反應性的羥基基團。然后將3’0-亞磷酰胺-活化的脫氧核苷(用對光不穩(wěn)定的基團保護5’-羥基)置于表面上,在暴露于光的位點發(fā)生偶合。封閉,氧化后,漂洗底物,然后透過第二個罩照射表面以便暴露另一個進行偶合的羥基基團。將第二個5’-保護的3’0-亞磷酰胺-活化的脫氧核苷放在表面上。重復選擇性光去保護和偶合循環(huán)直到得到所需的產(chǎn)物組。由于使用了照相平版印刷術,因而,得到高密度寡核苷酸探針陣的過程得以縮減,在各位點的序列是已知的。
制備必需的5’0-(α-甲基-6-硝基胡椒氧基羰基)-N-?;?2’-脫氧nocleoside phosphoramidite(MeNPoc-N-酰基-2’-脫氧nocleoside phosphoramidite)的合成途徑包括第一步,N-酰基-2’-脫氧核苷與1-(2-硝基-4,5-亞甲基二氧苯基)乙基-1-氯甲酸酯反應以得到5’-MeNPoc-N-?;?2’-脫氧核苷。第二步,用標準方法使3’-羥基與2-氰乙基N,N’-異丙基亞磷酰胺氯反應以得到5’-MeNPoc-N-?;?2’-脫氧核苷-3’-0-(2-氰乙基N-N-二異丙基)亞磷酰胺。在正常亞磷酰胺合成條件下,光保護的基團是穩(wěn)定的,而且可以用含水堿除去。在4℃氬氣中,這些試劑可以長期貯存。
已報道MeNPoc-dT,MeNPoc-dCibu,MeNPoc-dGPACMeNPoc-dAPAC的光解半衰期分別為28s,31s,27s和18s(Pease etal.,1994)。在平版印刷合成中,因此推薦采用4.5分鐘的照射時間,可以確保除去>99%的MeNPoc保護基團。
適宜的支持物是通過用濃NaOH清洗,然后用水徹底漂洗而制備的由5.1×7.6cm玻璃底物組成的支持物。然后用在95%乙醇中的10%(體積/體積)雙(2-羥基乙基)氨基丙基三乙氧基硅烷(Petrarch Chemicals,Bristol,PA)溶液將表面衍生2小時,用乙醇和醚徹底漂洗,于40℃在真空中干燥,然后于100℃加熱15分鐘。在所述的研究中,通過將衍生的底物與4’4-二甲氧基三苯甲基(DMT)-六乙氧基-0-氰乙基亞磷酰胺反應而連接合成連接臂接頭。
總之,為了開始合成寡核苷酸探針,應該將適宜的脫氧nocleoside phosphoramidite通過一個連接臂接到合成支持物上。透過一個照相平版印刷罩的800×12800um孔來照射,從而激活支持物的區(qū)域??梢酝瓿善渌麃喠柞0泛铣裳h(huán)(用DMT-保護的脫氧核苷)以得到任何所需的序列,例如,任何4-,5-,6-,7-,8-,9-或10-聚體的序列。用濃縮的NH4OH處理4小時除去磷酸和環(huán)外胺保護基團后,將底物嵌在水包的熱穩(wěn)定控制的雜交箱中以備使用。
當然,人們很容易從商業(yè)途徑購買DNA芯片,例如上述的光活化的芯片。鑒于此,人們可以與Affymetrix of SantaClara,CA 95051,and Beckman聯(lián)系。實施例II探針中所用的修飾的寡核苷酸在本發(fā)明方法中可以使用修飾的寡核苷酸以提高雜交的特異性或效率。達到此目的的一種方法是通過堿基修飾取代天然的核苷酸。例如,可以使用在C5-位置帶有一個鹵素的嘧啶。據(jù)認為通過影響堿基堆積而提高雙螺旋的穩(wěn)定性。也可以使用2,6-二氨基嘌呤以便在其與胸腺嘧啶進行堿基配對時形成一三個氫鍵,由此使DNA雙螺旋熱穩(wěn)定。有報告認為用2,6-二氨基嘌呤可以明顯提高短寡核苷酸的雙螺旋穩(wěn)定性。認為它的摻入使得可以在更嚴緊的條件下進行引物退火,由此提高雙螺旋形成的特異性并抑制背景問題或短寡核苷酸聚物的使用。
由Hoheisel & Lehrach(1990,引入本文作為參考)公開了這些修飾核酸三磷酸酯合成的方式。簡而言之,從Sigma購買5-氯-2’-脫氧尿苷和2,6-二氨基嘌呤2’-脫氧核苷。按如下完成磷酸化在氬氣下,將50mg無水2-NH2-dAdo溶于500ul磷酸三乙酯中,攪拌。加入25μl POCl3,然后于-20℃將混合物溫育。同時,將1mmol焦磷酸溶于0.95ml三-正-丁基胺,和2ml甲醇,然后在旋轉蒸發(fā)器中蒸干。隨后,通過用5ml吡啶蒸發(fā)兩次而將其干燥,在第二次前還加入70μl三-正-丁基胺。最后,將其溶于2ml干燥的二甲基甲酰胺。
-20℃90分鐘后,蒸發(fā)磷酸化混合物以除去過量的POCl3,加入在二甲基甲酰胺中的磷酸三-正-丁基銨。于室溫溫育1.5分鐘。加入5ml 0.2M碳酸氫三乙基銨(pH7.6)而終止反應,然后在冰上保持4小時。對于5-Cl-dUrd,條件應是相同的,但應加入50μl POCl3,而且在室溫進行4小時的磷酸化。
水解后,蒸發(fā)混合物,將pH調(diào)到7.5,然后用1體積二乙基醚抽提。用0.15M到0.8M碳酸氫三乙基銨的線性梯度在一Q-Sepharose柱(2.5×20cm)上分離產(chǎn)物。冷凍貯存,在很長一段時間內(nèi)核苷酸是穩(wěn)定的。
人們也可以使用Nichols等人(1994)設計的非分辨堿基類似物或廣義堿基。產(chǎn)生這種新的類似物,1-(2’-脫氧-β-D-核糖呋喃基)-3-吡咯(稱為M)是為了用于寡核苷酸探針和引物以解決因遺傳密碼兼并性而帶來的,或在只能得到成片段的肽序列而引起的設計的問題。所述類似物使堆積最大化,而使氫鍵合的相互作用最小化,但又不會在空間上破壞DNA雙螺旋。
設計M核苷類似物以便用與雜芳環(huán)相連的非質(zhì)子極性取代基使疊加的相互作用最大化,提高鏈內(nèi)和鏈間的相互作用以降低氫鍵在堿基配對特異性中的作用。Nichols等人(1994)傾向于3-硝基吡咯2’-脫氧核糖核苷,因為其結構和電子類似于對-硝基苯胺,其衍生物是已知最小的雙鏈DNA摻入物。
也可以將二甲氧基三苯甲基保護的核苷M亞磷酰胺摻入用作引物的核苷酸中進行測序和聚合酶鏈反應(PCR)。Nichols等人(1994)表明了可以用M取代而不會喪失引物特異性的核苷酸基本數(shù)目。
M的特有特性在于其取代長區(qū)域內(nèi)的連續(xù)核苷并且仍作為有功能的測序引物的能力。已報告了有3個,6個和9個M取代的序列,得到可讀的測序階梯,以及用含有3種不同M的引物進行PCR可以擴增正確的產(chǎn)物(Nichols等人,1994)。
含有3-硝基吡咯的寡核苷酸作為引物的能力明顯說明雙螺旋結構必須與互補鏈形成。從寡核苷酸對d(5’-C2-T5XT5G-3’)和d(5’-C2A5YA5G2-3’)(其中X和Y可以是A、C、G、T或M)得到的光學熱圖譜與從DNA雙-到-單鏈過渡觀察到的正常S形圖一致。報告含有XM堿基對的寡核苷酸(其中X是A、C、G、T,Y是M)的Tm值均在3℃范圍內(nèi)(Nichols等人,1994)。
實施例III制備測序芯片和列陣本實施例描述由本發(fā)明人完成的測序芯片的物理實施方案。
基本的實施例是使用粘附于50μm表面的6-聚物以得到3×3mm的芯片,從而組合得到20×20cm的陣。另一個實施例是使用粘附于10×10μm表面的9-聚物以得到一個9聚物芯片,大小為5×5mm??梢允褂?000個單元的所述芯片以得到30×30cm的陣。圖2A、圖2B和圖2C表示還有另一種陣,其中4000到16000個寡核苷酸芯片被排在一個平方陣中。在陣中還包裝了平皿或試管組,作為測序試劑盒的一部分。
陣彼此物理或經(jīng)疏水表面而被分開。利用疏水帶分離的一種可能的方法是使用如QA Laboratories Toronto,加拿大生產(chǎn)的Iso-Grid Microbiology System的技術。
疏水網(wǎng)格膜濾器(HGMF)用于分析食品微生物已有10年,它們在大的數(shù)字范圍和自動計數(shù)菌落方面表現(xiàn)出了獨特的魅力。一種市售的網(wǎng)格是來自QA Laboratories Ltd.(Toronto,加拿大)ISO-GRID,由聚砜類聚合物(Gelman Tuffryn HT-450,0.45μ的孔)方陣(60×60cm)組成,在其上有由1600(40×40)個方格組成的黑色疏水油墨網(wǎng)格。已用經(jīng)真空過濾的細菌懸液接種HGMF,然后在所選的分化或選擇培養(yǎng)基上溫育。
由于微生物生長受到膜上已知位置和大小的網(wǎng)格小格的限制,所以HGMF比常規(guī)平皿或膜濾器更像MPN裝置。Peterkin等人(1987)報告當與HGMF復制單元一起使用時,這些HGMF可用于增殖并貯存基因組文庫。一種所述的儀器可以復制ISO-GRID 1600個細胞中每個細胞的生長,并且能夠作成許多主HGMF的拷貝(Peterkin等人,1987)。
Sharpe等人(1989)還使用了來自QA Laboratories的ISO-GRID和自動HGMF計數(shù)儀(MI-100 Interprter)和RP-100 Replicator。他們報告了用于保持和篩選許多微生物培養(yǎng)物的技術。
Peterkin和同事后來描述一種用疏水網(wǎng)格-膜濾器篩選DNA探針的方法(Peterkin等人,1989)。這些作者報告了在HGMF上直接進行有效的克隆雜交的方法。以前,在其上印有HGMF的聚砜類聚合物只有很低的DNA結合能力,因此結果很差。但是Peterkin等人(1989)報告在與DNA接觸前通過用聚吖丙啶-聚陽離子處理復制和溫育的HGMF可以提高DNA與膜表面的結合。盡管這項早期的工作使用細胞的DNA連接,而且與本發(fā)明有不同的目的,但是描述的方法很容易經(jīng)改進后用于方式3SBH。
為了快速鑒定有用的序列,Peterkin等人(1989)使用了來自不同克隆的放射標記質(zhì)粒DNA,并檢測了其對所制備的HGMF上的DNA的特異性。用這種方法,通過對HGMF復制物上的100個生物的菌落雜交,可以迅速篩選來自重組質(zhì)粒的DNA,可以很容易重復制備所述的HGMF復制物。
必須要解決兩個問題。用小芯片(2-3mm)操作,并且同時要完成許多反應。本發(fā)明的解決辦法是將芯片和探針保持在相應的陣中。在一個實施例中,以8×8mM平皿(15μM/寡核苷酸,Pease等人,1994)的形式在硅片上合成含有250000個9-聚物的芯片,所述平皿以8×12方式(96芯片),彼此間有1mm的槽而進行列陣。用多道移液管或針陣加入探針,一個芯片上一個探針,為了記錄所有4000個6-聚物,要使用42個芯片陣,可以使用不同的芯片或?qū)⑿酒囍貜褪褂脭?shù)次。
在上述情況下,使用本說明書較早部分的說明,F(xiàn)=9;P=6;和F+P=15。芯片可以有BxNn個探針,其中,x是特定堿基B的數(shù)目;n是非特定堿基數(shù)目;這樣x=4到10,n=1到4。為了達到更有效的雜交,并且任何支持寡核苷酸的影響,可以用非特定堿基圍住特定堿基,因此用公式(N)nBx(N)m表示(圖4)。
實施例IV制備核酸片段可以從任何適當?shù)膩碓?,例如cDNA、基因組DNA、染色體DNA、顯微切割的染色體帶、粘?;験AC插入片段和RNA,包括未經(jīng)過任何擴增步驟的mRNA得到待測的核酸。例如,Sambrook等人(1989)描述了三種從哺乳動物細胞中分離大分子量DNA的方法(p.9.14-9.23)。
然后用本領域技術人員已知的方法將所述核酸制成片段,所述方法包括,例如,用Sambrook等人(1989)描述的限制酶,用超聲剪切和NaOH處理。
也可以使用Schriefer等人(1990,摻入本文作為參考)描述的低壓剪切方法。在所述方法中,DNA樣品在從低到中的不同壓力下通過小French壓力小室。一個手柄裝置可以使從低到中的壓力施加給所述小室。這些研究的結果表明,低壓剪切是除超聲和酶促將DNA制成片段的方法以外的另一種有效的方法。
將DNA制成片段的一種特別適宜的方法是由Fitzgerald等人(1992)描述的使用識別兩個堿基的核酸內(nèi)切酶,CviJI.這些作者描述了將DNA快速制成特定大小的片段,然后進行分離的方法,它們適用于鳥槍法克隆和測序。本發(fā)明人認為對于產(chǎn)生隨機的,但是相對小的用于本發(fā)明測序技術的DNA來說也是特別有用的。
限制性核酸內(nèi)切酶CviJI常規(guī)地在G和C之間裂解識別序列PuGCPy以得到平整末端。改變這種酶(CviJI**)特異性的典型反應條件,由pUC19(2688個堿基對)小分子產(chǎn)生半隨機分布的DNA片段。Fitzgerald等人(1992)定量分析了這種制片段策略的隨機性,使用了經(jīng)快速凝膠過濾按大小分級的pUC19的CviJI**消化片段,然后不進行末端修復直接與lacZ-M13克隆載體相連。76個克隆的序列分析表明,除PuGCPy外,CviJI**還限制酶切PyGCPy和PuGCPu,而且,新的序列元(sequence data)以一致于隨機片段生成的速率積累。
正如文獻中報告的,所述方法與超聲處理和瓊脂糖凝膠分離相比,其優(yōu)點在于需要少量的DNA(0.2-0.5μg,而不是2-5μg);涉及較少的步驟(不需要預連接,末端修復,化學抽提或瓊脂糖凝膠電泳和洗脫)。在制備用于方式3的DNA測序時,這些優(yōu)點也是有用的。
不考慮得到或制備核酸片段的方法,重要的是將DNA變性以得到用于雜交的單鏈片段。通過在80-90℃將DNA溶液溫育2-5分鐘就可以達到此目的。然后將所述的溶液迅速冷卻到2℃以防止在將DNA片段與芯片接觸前,所述DNA片段復性。按實施例VI中所述,還必須從基因組DNA中除去磷酸基團。
實施例V制備標記探針用自動合成儀可以制備寡核苷酸探針,這是本領域?qū)I(yè)人員熟知的,例如使用Applied Biosystems系統(tǒng)。另外,利用使用數(shù)組多孔特富龍片的Genosys Biotechnologies Inc.方法也可以制備探針。
寡核苷酸探針可如下標記,例如可以用放射性標記物(35S、32P、33P,而優(yōu)選的是33P)標記含有100-200μm或100-400μm點的陣;非放射性同位素(Jacobsen等人1990);或熒光團(Brumbaugh等人,1988)。所有所述的標記方法是本領域?qū)I(yè)人員熟知的,正如由Sambrook等人(1989)中的有關部分舉證的,以及其他參考文獻例如Schrbert dr(1990(,Murakami等人(1991)和Cate等人(1991)的,所有文獻均引入本文作為參考。
就放射性標記而言,常用的方法是使用T4多聚核苷酸激酶進行末端標記或使用Klenow或甚至T7聚合酶進行高比活標記。其描述如下。
合成在其5’末端沒有磷酸基團的寡核苷酸,因而通過使用噬菌體T4多聚核苷酸激酶轉移〔γ-32P〕ATP或〔γ-33P〕ATP的γ-32P或γ-33P很容易將其進行標記。如果有效地完成了此反應,所述探針的比活性可以與〔γ-32P〕ATP或〔γ-33P〕ATP本身的比活性一樣高。如下描述的反應是設計來,以標記10pmol的寡核苷酸達到高比活性。通過增加或減少反應的大小,保持所有組分濃度不變可以很容易標記不同量的寡核苷酸。
用1.0μl寡核苷酸(10pmol/μl);2.0μl 10×噬菌體T4多聚核苷酸激酶緩沖液;5.0μl〔γ-32P 〕ATP或〔γ-33P〕ATP(比活性5000Ci/mmol;10mCi/ml水溶液)(10pmol)和11.4μl水組成反應混合物。將8單元(約1μl)噬菌體T4多聚核苷酸激酶加到反應混合物中混勻,然后在37℃溫育45分鐘。將反應在68℃加熱10分鐘以使噬菌體T4多聚核苷酸激酶失活。
然后確定將32P或33P轉移到寡核苷酸的效率及其比活性。如果探針的比活性是可接受的,就將其純化。如果比活性太低,則再加入8個單元的的酶,于37℃再溫育30分鐘,然后于68℃將反應加熱10分鐘使酶失活。
通過用乙醇沉淀;用鯨蠟基吡啶翁溴化物沉淀;用通過bio-凝膠P-60的層析或通過在Sep-Pak C18柱上層析可以純化放射性標記寡核苷酸。
用大腸桿菌DNA聚合酶I的Klenow片段合成與合成寡核苷酸互補的DNA的一條鏈,可以得到有更高比活性的探針。將短引物與寡核苷酸模板雜交,所述模板的序列是所需放射標記探針的互補物。然后用大腸桿菌DNA聚合酶I的Klenow片段延伸引物以便用模板指導的方法摻入〔α-32P〕dNTP或〔α-32P〕dNTP。反應后,通過變性,然后在變性條件下通過聚丙烯酰胺凝膠電泳分離模板和產(chǎn)物。如果需要,用所述的方法,可以得到每個寡核苷酸分子含有數(shù)個放射性原子的寡核苷酸探針。
為了應用所述的方法,人們將在一個微離心管中混合達到所需比活性以及足以完全合成所有模板鏈所必需的計算量的〔α-32P〕dNTP或〔α-32P〕dNTP。在反應過程中的任何階段,dNTP的濃度不應小于1μM。然后向試管中加入適量的引物和模板DNA,引物超過模板3-10倍。
然后加入0-1體積的10×klenow緩沖液并充分混心,每5μl的反應液中加入2-4單元的大腸桿菌DNA聚合酶工的klenow片段,混心,4℃溫育2-4小時。如果需要,反應進程可通過取出小份(0.1μl),測定已用10%三氯乙酸(TCT)沉淀配放射活性比例來監(jiān)測。
用等體積的凝膠上樣緩沖液稀釋反應物,80℃加熱了3分鐘,然后將全部樣品上樣在變性的聚丙烯酰胺凝膠上。電泳后,將凝膠放射自顯影,確定探針的位置,,然后從凝膠中取出。如下的熒光團標記方法也是可行的。Brumbaugh等人(1988)描述了熒光標記引物的合成。合成在C-5連接一個12原子的一級胺“連接臂”的脫氧尿苷類似物。類似物的合成包括通過金屬有機化合物的中間產(chǎn)物衍生2’-脫氧尿苷以得到5’(甲基丙烯基(propenoyl))-2’-脫氧尿苷。與二甲氧基三苯甲基氯反應生產(chǎn)相應的5’-二甲氧基三苯甲基產(chǎn)物。將甲基酯水解,活化,然后與適當單酰基化的烷基二胺反應。純化后,將所得的連接臂核苷轉化成適用于寡核苷酸化學合成的核苷類似物。
用改進的phosphoridite化學方法制備含有一個或兩個堿基帶連接臂的寡核苷酸。將20μl 300mM FITC的二甲亞砜溶液加到25μl 500mM碳酸氫鈉(pH9.4),其中含50nmol連接臂寡核苷酸溶液中。在室溫將混合物攪拌6小時。用1×30cmSephadexG-25柱經(jīng)20mM乙酸胺(pH6)洗脫從游離FITC中分離寡核苷酸,合并第一個UV-吸收峰組分。
總之,在寡核苷酸5’-末端的熒光標記首先包括兩步。第一,在自動的DNA合成過程中,將N-保護的氨基烷基亞磷酰胺衍生物加到寡核苷酸的5’-末端。除去所有的保護基團后,將適當熒光染料的NHS酯與5’-氨基基團偶聯(lián)過夜,然后用反相HPLC或PAGE從過量的染料中純化標記寡核苷酸。
Schubert等人(1990)描述了亞磷酰胺的合成,在自動DNA合成過程中可以生產(chǎn)用熒光素標記寡核苷酸。在DMF中,有K2CO3和KI存在的條件下,經(jīng)17小時用4-氯(4’4-二甲氧基三苯甲基)丁醇-1將熒光素甲基酯烷基化。用含1%TFA的氯仿溶液除去三苯甲基后,用雙(二異丙基氨基)甲氧膦經(jīng)標準方法將產(chǎn)物phosphitylated.上述所得熒光素衍生物的磷酸化會得到相當產(chǎn)率的H-磷酸酯。用所得的amidite(0.1M的無水乙腈溶液)利用β-氰乙基亞磷酰胺化學方法和DNA合成儀自動合成不同的引物。在室溫經(jīng)36小時用25%氨水從支持物上裂解并去保護。用PAGE純化粗產(chǎn)物,在310nm肉眼觀察標記引物為淡綠色的熒光帶。用RP 18盒洗脫并脫鹽得到所需的產(chǎn)物。
在Schubert方法中,熒光標記探針的的5’-末端是在最后偶聯(lián)循環(huán)的DNA合成過程中直接完成的。偶聯(lián)產(chǎn)率與用正常亞磷酰胺的一樣高。經(jīng)脫保護并用speed vac凍干或乙醇沉淀除去氨后,可以將熒光標記寡核苷酸直接用于方式3 SBH的DNA測序。
Murakami等人也描述了熒光素-標記寡核苷酸的制備。所述的合成方法是以聚合物-支持的亞磷酰胺和氫磷酸酯方法為基礎。用亞乙基二酰胺或六亞甲基二酰胺作為系鏈。經(jīng)亞磷酰胺鍵將其導入,通過氫磷酸酯中間產(chǎn)物在CCI4溶液中的氧化作用而形成。用一級胺定向的試劑,F(xiàn)ITC,在珠上標記修飾寡核苷酸。從珠上裂解所得的修飾寡核苷酸,隨后經(jīng)RPLC純化。
Cate等人(1991)描述了將寡核苷酸探針直接與結合有直接的化學發(fā)光底物(AMPDD)的堿性磷酸酶結合以探針檢測的應用。堿性磷酸酶可以與修飾的寡核苷酸堿基共價健合。雜交后,將寡核苷酸與AMPDD溫育。堿性磷酸酶破壞AMPDD以得到產(chǎn)生不需激發(fā)的熒光,即不需激光的化合物。用所述的技術可以產(chǎn)生強信號。
從各種商業(yè)途徑,包括GENsET很容易買到標記探針,而不必合成。
實施例VI除去磷酸基團細菌堿性磷酸酶(BAP)和牛腸堿性磷酸酶(CIP)均催化從DNA和RNA除去5’-磷酸殘基。因此它們適用于從DNA和/或RNA中除去5’磷酸以防止連接和不適當?shù)碾s交。按Sambrook等人(1989)的描述,在切割或剪切基因組DNA后再除去磷酸。
BAP是兩種堿性磷酸酶中更有活性的一種,但是對熱和去污劑的抗性較強。因此在去磷酸化反應完成后,很難完全抑制BAP。用蛋白酶K消化CIP,為了進行隨后的有效連接,必須將其完全除去。另一種方法是在5mMEDTA(pH 8.0)存在的條件下,通過將CIP65℃加熱1小時(或75℃,10分鐘)使CIP失活然后經(jīng)酚∶氯仿抽提而純化去磷酸化的DNA。
實施例VII經(jīng)兩步雜交完成測序下面是描述本發(fā)明人完成的測序方法實施的特定實施例。首先,將全部芯片與1億個bp(一個人的染色體)復雜的DNA混合物雜交。完成雜交的指導可以參見文獻例如Drmanac等人(1990);Khrapko等人(1991);和Broude等人(1994)。這些文獻說明了適用于方式3 SBH開始步驟的雜交溫度的范圍,緩沖液和洗滌步驟。
由于可以提供相對低濃度的靶DNA,所以本發(fā)明人特別考慮在高鹽濃度于低溫度(-2℃到5℃)下長達數(shù)小時的條件以完成雜交。為了達到此目的,用SSC緩沖液代替在10℃沉淀的磷酸鈉緩沖液(Drmanac等人,1990)。若用雜交循環(huán)進行高度復雜的DNA樣品的測序時,由于第二步驟,可以不必徹底洗滌(數(shù)分鐘),而且可以完全省去。
用于雜交和洗滌步驟的同一種緩沖液能繼續(xù)用于與標記探針的二次雜交步驟。用各陣,例如8×8mm陣(實施例III)上的自動裝置適當洗滌后,加入一個標記探針,例如6-聚體。使用96-針或96-針裝置,在42個操作中完成。還可以使用在以前的科技文獻中描述的分辨條件的范圍。
本發(fā)明人特別使用了下列條件。首先,在低溫(0-5℃)加入標記探針并溫育數(shù)分鐘(由于加入了高濃度的寡核苷酸)后,根據(jù)F+P的長度,將溫度提高到3-10℃,加入洗滌緩沖液。此時,所使用的是與任何連接反應均可相容的緩沖液(例如100mM鹽濃度范圍)。加入連接酶后,將溫度升到15-37℃以加速連接(少于30分鐘),然后再分辨完全匹配和失配的雜交物。
在方式3 SBH中,還使用了Pontius & Berg(1991,引入本文作為參考)描述的陽離子去污劑。這些作者描述了使用兩種簡單的陽離子去污劑,在DNA變性中的十二烷基和鯨蠟基三甲基胺溴化物(DTAB和CTAB)。
DTAB和CTAB是季胺四甲基胺溴化物(TMAB)的變體,其中甲基之一由一個12-碳(DTAB)或一個16-碳(CTAB)烷基基團所取代。TMAB是四甲基胺離子的溴化鹽,用于核酸變性實驗以降低熔解溫度的G-C含量偏離的試劑。DTAB和CTAB在結構上與十二烷基磺酸鈉(SDS)相似,只是帶陽電荷的季胺取代了帶負電荷的SDS磺酸鹽。而在雜交緩沖液中常常使用SDS以減少非特異性結合并抑制核酸酶,它對變性速率沒有太大的影響。
在使用連接過程時,可以將酶與標記探針一起加入或在適當?shù)南礈觳襟E后加入以降低背景。
盡管以前未考慮到在任何SBH方法中使用,但是,連接酶技術是分子生物學領域熟知的技術。例如,Hood和同事描述了連接酶介導的基因檢測技術(Landegren et al.,1988),很容易將改方法加以改變以適用于方式3 SBH。Landegren等人描述了檢測是否存在給定的DNA序列的方法,它是基于兩個寡核苷酸在互補靶DNA分子上能夠緊鄰著退火,然后通過DNA連接酶的作用將兩個寡核苷酸共價連接,條件是連接處的核苷酸正確堿基配對的。盡管以前未實現(xiàn),但是這種方法已用于方式3 SBH。Wu &Wallace還描述了用噬菌體T4 DNA連接酶連接兩個相鄰的短的合成寡核苷酸。他們的寡核苷酸連接反應是在50mM Tris HclpH7.6,10mM MgCl2,1mM ATP,1mM DTT,5%PEG中完成的,將連接反應物加熱到100℃5-10分鐘,然后在加入T4 DNA連接酶(1單元,Bethesda Research Laboratory)前冷卻到0℃。大多數(shù)連接反應是在30℃完成,加熱到100℃5分鐘而終止。
然后進行適當?shù)淖詈笙礈煲苑直鏅z測雜交的相鄰,或連接的寡核苷酸的長度(F+P)。洗滌步驟于40-60℃在水中進行數(shù)分鐘以洗掉未連接的標記探針和所有其他的化合物以便最大程度地減少背景。由于共價健合標記探針,所以使檢測簡單化(沒有時間和低溫的限制)。
根據(jù)所用的標記,用不同的裝置進行芯片成象。對放射性標記,可以用熒光貯存屏技術和PhosphorImager作為掃描儀(Molecular Dynamics,Sunnyvale,CA)。將芯片放在盒中,用磷光屏蓋上。暴露1-4小時后,掃描所述的屏,然后將圖象貯存在計算機硬盤中。對于磷光標記檢測,使用CCD攝像機和外熒光(epifluorescent)和共焦顯微鏡。于在CCD攝像機的象素上直接產(chǎn)生芯片,可以按Eggers等人(1994,引入本文作為參考)的描述完成檢測。
電荷耦合的裝置(CCD)檢測儀作為活性固體支持物,定量檢測和成象標記靶分子在探針為基礎的檢測中的分布。這些裝置利用了微電子適應高平行檢測,超敏檢測,高流量,積分數(shù)據(jù)采集和計算的特性。Eggers等人(1994)描述了在探針為基礎的檢測,例如本發(fā)明的方式3 SBH中CCD的使用,由于高度的敏感性和直接耦合的使用,可以在數(shù)秒鐘內(nèi)完成定量估測。
積分CCD檢測方法可以檢測芯片上的分子結合過程。檢測儀迅速產(chǎn)生獨特地表征樣品的二維圖形。在CCD為基礎的分子檢測儀的具體操作中,不同的生物學探針被直接固定在CCD的象素上或附著于CCD表面一次性的蓋片上。樣品分子可以用放射性同位素,化學發(fā)光劑或熒光標記進行標記。
將樣品暴露于CCD為基礎的探針陣后,在方式3的情況下,在樣品與互補探針結合的象素位置發(fā)射出光電子或放射性同位素衰減產(chǎn)物。當帶電粒子或來自標記樣品的射線入射在CCD網(wǎng)格上時,在硅上產(chǎn)生電子空穴對。然后將電子聚集在相鄰的CCD網(wǎng)格下方,隨后在顯示存儲體讀出。在各象素上產(chǎn)生的光電子數(shù)在所述的接近度內(nèi)與分子結合數(shù)直接成正比。從而定量地確定分子結合(Eggers等人,(1994))。
正如最近報告的,硅為基礎的CCD作為固體狀態(tài)的檢測和成象傳感器主要是由于所述裝置在很寬的波長范圍(從1-10000A)內(nèi)都是高度敏感的。硅對可見光譜到軟X-射線的電磁輻射很容易作出反應。對于可見光,一個光電子入射CCD網(wǎng)格會使得一個電荷束聚集在所述網(wǎng)格下。一個軟X-射線β粒子(一般KeV到MeV的范圍)產(chǎn)生數(shù)千到數(shù)萬個電子。除高靈敏度外,由于可檢測電荷束的范圍在數(shù)個到105電子,所以Eggers等人(1994)描述的CCD有很寬的動態(tài)范圍(放大4到5倍)。檢測反應在很寬的動態(tài)范圍內(nèi)呈線性。
通過在樣品附近放成象陣,聚集效率比基于透鏡技術例如在常規(guī)CCD攝像機中所見到的要高至少10倍。即,樣品(發(fā)射物)與檢測儀(成象陣)緊緊接觸,省去了常規(guī)成象鏡片,例如透鏡和反光鏡。
當放射性同位素作為報告基團連接于靶分子時,就檢測到能量粒子。發(fā)射不同能量粒子的報告基團已成功地被微加工檢測儀所利用,包括32P,33P,35S,14C和125L。粒子的能量越高(例如來自32P),則提供最高的分子檢測靈敏度,而來自的能量越低(例如來自35S),則分辨率越好。因此,可以按需要選擇所選的放射性同位素報告基團。一旦選擇了特定的放射性同位素標記,按Eggers等人(1994)所述,通過計算信噪比(SNR)可以預測檢測性能。
另一種發(fā)光檢測方法包括使用連接于靶分子的熒光或化學發(fā)光報告基團。熒光標記可以通過共價或相互作用而粘附。由于量子效率在激發(fā)波長比在熒光信號波長低數(shù)個數(shù)量級,因此,在UV附近(300-350nm)有強度吸收帶并在可見(500-650nm)有主發(fā)射帶的熒光染料,例如溴化乙錠最適于CCD裝置。
從檢測發(fā)光的角度看,聚硅CCD網(wǎng)格有內(nèi)在的能力,可以過濾掉在UV范圍的入射光組分,而對由熒光報告基團產(chǎn)生的可見發(fā)光仍很敏感。對UV激發(fā)的所述內(nèi)在的大分辨率能夠增大SNR(大于100),達到Eggers等人(1994)在引入的文獻中由CCD所達到的程度。
為了在檢測儀上固定探針,可以在不昂貴的SiO2片上產(chǎn)生雜交基質(zhì),在雜交和干燥后放在CCD表面。由于DNA的雜交是在不昂貴的一次性SiO2片上進行的,因此可以重復使用比較昂貴的CCD檢測儀。另外,可以將探針直接固定在CCD上以產(chǎn)生專用的探針基質(zhì)。
為了將探針固定在SiO2涂層上,利用環(huán)氧-硅烷試劑和標準SiO2改性化學將均勻的環(huán)氧化物層與膜表面相連。利用與環(huán)氧環(huán)形成的仲胺,將氨-修飾的寡核苷酸探針通過與環(huán)氧環(huán)形成二級胺而與SiO2表面相連。所得的鍵合在寡核苷酸的3’堿基和SiO2表面之間提供了17個可旋轉的鍵。為了在耦合過程中確保完全胺去質(zhì)子化并且形成最少的二級結構,在0.1M KOH中完成反應,在37℃溫育6小時。
總的來說,在方式3中,每各千兆點記錄信號。不必在同時雜交所有的陣例如4000個5×5mm,而且可以連續(xù)使用較少數(shù)量的陣。
循環(huán)雜交是一種提高雜交信號的可能的方法。在一個循環(huán)中,大多數(shù)固定探針將與帶有與標記探針不互補的尾序列的DNA序列雜交。通過提高溫度,那些雜交物將被融化(圖3)。在下一個循環(huán)中,它們之中的一部分(-0.1%)將與適宜的DNA片段雜交,連接其他的標記探針。在這種情況下,將會發(fā)生分辨熔解同時帶有兩組探針失配的DNA雜交物。
在循環(huán)雜交中,在循環(huán)開始前加入所有的組分,在37℃加T4,或在更高的溫度加熱穩(wěn)定的連接酶。然后將溫度降到15-37℃,并將芯片溫育長達10分鐘,再將溫度升到37℃或更高保持幾分鐘,然后再降低。可將循環(huán)重復高達10次。在一種變體中,可以使用最佳的高溫(10-50℃)而不必進行循環(huán),并且可以完成較長的連接反應(1-3小時)。
由于只需要相對較少的寡核苷酸,所以本文所述的方法可以利用標準合成方法和精確的寡核苷酸點制備復雜的芯片。例如,如果合成了所有7-聚體(16384),則可以確定256百萬個14-聚體表。
本發(fā)明方法的一種重要變體是每基陣使用一種以上的不同標記探針。這可以考慮到兩個目的而被完成;多重通道降低不同雜交陣的數(shù)目;或確定甚至更長的寡核苷酸例如3×6或3×7的表。在這種情況下,如果使用兩個標記,由于陽性位點必須有兩個標記足夠的信號,所以3個連續(xù)寡核苷酸的特異性幾乎是絕對的。
另一種變體是使用含有BxNy探針的芯片,其中y是1-4。這些芯片可以在不同的幀中進行序列閱讀。這也可以通過使用適當組數(shù)的標記探針來達到或者F和P可能有一些不特定的末端位置(即一些末端簡并性元素)。也可以用通用的堿基作為接頭的一部分以便使確測序列的探針連接在固體支持物上。這樣使得探針更易于雜交而且使得構建體更穩(wěn)定。如果探針有5個堿基,人們可以例如使用3個廣義堿基作為接頭(圖4)。
實施例VIII分析所得的數(shù)據(jù)通過圖像分析程序,象DOTS程序(Drmanac et al.,1993)分析圖像存儲數(shù)據(jù),然后通過例如在SCORES程序(Drmanac etal.,1994)中所包括的統(tǒng)計功能換算并評估。從信號的分布,確定將信號轉化成+/-輸出的最佳閾值。
從所檢測的標記位置,通過組合對應于標記位置的固定和標記探針的已知序列確定片段的F+P核苷酸序列。然后從通過計算推測而確定的重疊的F+P序列組裝完整核酸序列或源分子,例如人染色體的序列。
一個選擇是在序列組裝過程中將雜交信號例如記數(shù)轉化成+/-輸出。在這種情況下,組裝將從有很高記數(shù)的F+P序列,例如,F(xiàn)+P序列AAAAAATTTTTT(SEQ ID NO1)開始。比較所有四種可能的重疊探針AAAAATTTTTTA(SEQ IDNO3),AAAAATTTTTTT(SEQ ID NO4),AAAAATTTTTTC(SEQ ID NO5),和AAAAATTTTTTG(SEQ ID NO6)和三個在開始不同的其它三種探針(TAAAAATTTTTT,SEQ ID NO7;CAAAAATTTTTT,SEQ ID NO8;GAAAAATTTTTT,SEQ ID NO9),得出三個結論(i)只有開始的探針和四個重疊探針中的一個具有相對于其它6個探針來說明顯陽性的記數(shù),在這種情況下,將AAAAAATTTTTT(SEQ ID NO1)序列向右延伸一個核苷酸;(ii)除起始探針外沒有一個探針有明顯陽性記數(shù),在這種情況下,將停止組裝,例如AAAAAATTTTTT(SEQ ID NO10)序列在待測序之DNA分子的末端;(iii)在重疊的和/或其它三種探針中發(fā)現(xiàn)了不止一個明顯陽性的探針;由于錯誤或分支,將停止組裝(Drmanac et al.,1994)。
計算推導過程將利用現(xiàn)存算法的計算機程序(參見例如Pevzner,1989;Drmanac et al.,1991;Labat和Drmanac,1993;所述文獻引入本文作為參考)。
如果,除F+P外,還確定F(空1)P,F(xiàn)(空2)P,F(xiàn)(空3)P,或F(空4)P,將使用算法使所有的數(shù)據(jù)設置相符以改正潛在錯誤或處理有分支問題的情況(參見例如,Drmanac et al.,1989;Brain.,1988;所述文獻均引入本文作為參考)。
實施例IX重復使用測序芯片在測序過程中使用連接時,其后不能立刻再使用常規(guī)的寡核苷酸芯片。本發(fā)明人用各種方法使其得到克服。
人們可以使用作為第二探針的核糖核苷酸,探針P,以便隨后用RNAase處理除去該探針。RNAase處理可以使用RNAase A,一個內(nèi)切核糖核酸酶,它特異性攻擊單鏈RNA 3’的嘧啶殘基并裂解相鄰核苷酸的磷酸鍵。終產(chǎn)物是嘧啶3’磷酸和帶有末端3’磷酸的寡核苷酸。RNAase A在不存在輔助因子和二價陽離子的情況下發(fā)揮作用。
為了使用RNAase,人們通常在含有適當RNAase的緩沖液中溫育芯片,如Sambrook等人所述(1989;引入本文作為參考)。在10到60分鐘之間于37℃每8×8mm或9×9mm陣使用30-50μl的含有RNAase的緩沖液是適當?shù)摹?br>
盡管沒有廣泛的使用,在具體的實施方案中也可以使用尿嘧啶堿基,如Craig等人(1989)所述,所述文獻引入本文作為參考。通過用大腸桿菌修復酶,從DNA中除去尿嘧啶的尿嘧啶-DNA糖基化酶(glycosylase)消化可以破壞連接的探針組合以得到可重復使用的芯片。
人們也可以在探針間產(chǎn)生特異性的可裂解的鍵,然后在檢測后將其裂解。例如,通過Shabarova等人(1991)和Dolinnaya等人(1988)所述的化學連接可以達到此目的(所述的兩篇文獻均引入本文作為參考)Shabarova等人(1991)描述了用溴化氰作為縮合劑縮合寡脫氧核糖核苷酸。在其中的一步化學連接反應中,將寡核苷酸加熱到97℃,緩慢冷卻到0℃,然后加入1μl在乙腈中的10MBrCN。
Dolinnaya等人(1988)說明了如何將亞磷酰胺和焦磷酸核苷酸間鍵加入DNA雙螺旋中。他們還用水溶性碳化二亞胺(CDI)作為偶合劑,使用化學連接方法修飾DNA的糖磷酸骨架。亞磷酰胺鍵的選擇性裂解包括在95℃與15%CH3COOH接觸5分鐘。焦磷酸鍵的選擇性裂解包括與吡啶-水混合物(9∶1)和新鮮蒸餾的(CF3CO)2O接觸。
盡管已用優(yōu)選的實施方案描述了本發(fā)明的組成和方法,但是,對于本文所述組合物,方法和所述方法的步驟或所述方法步驟的順序,對于本領域?qū)I(yè)人員來說顯而易見在不偏離本發(fā)明概念,精神和范圍的前題下進行改變。更特別地,顯而易見可用化學上和生理上均相關的某試劑取代這里描述的試劑,而仍可得到相同或相似的結果。對于本領域?qū)I(yè)人員顯而易見的所有這些相似取代物和修飾相信是在所附權利要求所限定的本發(fā)明的精神,范圍和概念內(nèi)??梢灾苽浜屯瓿伤袡嗬蟮奈镔|(zhì)和方法,而不需要過分的試驗。
參考文獻以下參考能夠為上述內(nèi)容提供舉證性程序或補充性細節(jié),特在此引入作為參考。Bains et al.,1988,J.Theor.Biol.,135303-307.Broude et al.,1994,Proc.Natl.Acad.Sci.USA,913072-3076.Brumbaugh et al.,1988,Proc.Natl.Acad.Sci.U.S.A.,855610-5614.Cantor et al.,1992,Genomics,13,1378.Cate et al.,1991,GATA,8(3)102-106.Chu et al.,1983,Nucleic Acids Res.,116513-6529.Craig et al.,1989,Nucleic Acids Research,17(12)4605.Dahlen et al.,1987,Mol.Cell.Probes 1159-168.Dolinnaya et al.,1988,Nucleic Acids Research,16(9)3721-3738.Drmanac & Crkvenjakov,1990,Scientia Yugoslavica,16,97.Drmanac & Crkvenjakov,U.S.Patent 5,202,231.Drmanac et al.,1989,Genomics,4114-128.Drmanac et al.,1991,J.Biomol.Struct.& Dyn.,81085.Drmanac et al.,1991,In ″Electrophoreses,Supercomputersand the Human Genome″,pp 47-59,World ScientificPublishing Co.,Singapore.Drmanac et al.,1993,Proceedings of 2nd InternationalConference on Bioinformatics,Supercomputing,andComplex Genome Analysis,World Scientific PublishingCo.,pp.121-134.Drmanac,1994,Abstract Book for Genome Mapping andSequencing;arranged by Richard Myers,DavidPorteous and Robert Waterstone,Cold Spring HarborLaboratories,p.60.Drmanac et al.,1994,Proceedings of the 3rdInternational Workshop of Transcribed Sequences,InPress.Duncan & Cavalier,1988,Analytical Biochemistry,169104-108.Eggers et al.,1994,BioTechniques,17(3)516-524.Fitzgerald et al.,1992,Nucleic Acids Research,20(14)3753-62.Fodor et al.,1991,Science,251767-768.Hoheisel & Lehrach,1990,F(xiàn)EBS Lett.,274(1,2)103-106.Inouye & Hondo,1990,J.Clin.Microb.,281469-1472.Jacobsen et al.,1990,Genomics,8001-007.Keller et al.,1988,Anal.Biochem.,170441-450.Keller et al.,1989,Anal.Biochem.,17727-32.Khrapko et al.,1991,J.DNA Sequencing Mapping,1,375.Labat and Drmanac,1993,Proceedings of 2nd InternationalConference on Bioinformations,Supercomputing,andComplex Genome Analysis,World Scientific PublishingCo.,pp.555-565.Landegren et al.1988,Science,2411077-1080.Maxam & Gilbert,1977,Proc.Natl.Acad.Sci.,74,560.Morriey & Collins,1989,Mol.Cell.Probes 3189-207.Murakami et al.,1991,Nucleic Acids Research,19(15)4097-4102.Nagata et al.,1985,F(xiàn)EBS Letters,183379-382.Nichols et al.,1994,Nature,369492.Pease et al.,1994 Proc.Natl.Acad.Sci.,915022-5026.Peterkin et al.,1987,BioTechniques 5(2)132-134.peterkin et al.,1989,F(xiàn)ood Microbiology 5(2)281-284.Pontius & Berg,1991,Proc.Natl.Acad.Sci.U.S.A.,888237-8241.Rasmussen et al.,1991,Analytical Biochemistry,198138-142.Sambrook et al.,1989,Molecular cloningA laboratorymanual.Cold Spring Harbor Laboratory.Cold SpringHarbor,NY.Sanger,et al.,1977,Proc.Natl.Acad.Sci.,74,5463.Schriefer et al.,1990,Nucleic Acids Research,18(24)7455.Schubert et al.,1990,Nucleic Acids Research,18(11)3427.Shabarova et al.,1991,Nucleic Acids Research,19(15)4247-4251.Sharp et al.,1989 Food Microbiology,6261-265.Southern,PCT patent Application WO 89/10977.Southern & Maskos,PCT Patent Application WO 90/03382.Southern et al.,1992,Genomics,13,1008.Strezoska et al.,1991,Proc.Natl.Acad.Sci.,88,10089.Van Ness et al.,1991,Nucleic Acics Research,19(12)3345.Wu & Wallace,1989 Gene,76245-254.Zeremski and Crkvenjakow,1993,DNA SequenceDetermination by Hybridizationa Strategy forEfficient Large-Scale Sequencing,Science,2601649-1652.
序列表(1)一般資料(I)申請人名稱ARCH DEVELOPMENT CORPORATION街道1101 East 58th Street城市Chincago州Illinois國家United States of America郵政編碼60637電話(312)702-1692電傳(312)702-0741(ii)發(fā)明人Drmanac,Radoje(iii)發(fā)明題目進行有效核酸測序的方法和組合物(iv)序列數(shù)10(v)相關地址(A)收件人Arnold,White & Durkee(B)街道P.O.Box 4433(C)城市Houston(D)州TX(E)國家USA(F)郵政編碼77210-4433(vi)計算機可讀形式(A)介質(zhì)類型軟盤(B)計算機IBM PC兼容(C)操作系統(tǒng)PC-DOS/MS-DOS
(D)軟件PatentIn Release #1.0,Ver.#1.25(vii)現(xiàn)有申請資料(A)申請?zhí)朏ILING HEREWITH(B)申請日申請時附上(C)分類(viii)先前申請資料(A)申請?zhí)朥SSN 08/303,058(B)申請日9月8日1994(08.09.94)(C)分類未知(A)申請?zhí)朥SSN 08/127,420(B)申請日9月27日1994(27.09.94)(C)分類未知(ix)代理人/代理資料(A)姓名Parker,David L.
(B)登記號32,165(C)參考/摘要號ARCD146P--\PAR(x)通訊資料(A)電話(512)418-3000(B)電傳(512)474-7577(2)SEQ ID NO1的資料(i)序列特征(A)長度12個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲線性
(ii)分子類型DNA(xi)序列描述SEQ ID NO1AAAAATTTT TT 12(2)SEQ ID NO2的資料(i)序列特征(A)長度13base pairs(B)類型nucleic acid(C)鏈型single(D)拓撲結構Linear(ii)分子類型DNA(xi)序列描述SEQ ID NO2AAAAAATTTT TTC13(2)SEQ ID NO3的資料(i)序列特征(A)長度12base pairs(B)類型nucleic acid(C)鏈型single(D)拓撲結構linear(ii)分子類型DNA(xi)序列描述SEQ ID NO 3AAAAATTTTT TA12(2)SEQ ID NO4的資料(i)序列特征(A)長度12個堿基對
(B)類型核酸(C)鏈型單連(D)拓撲結構線性(ii)分子類型DNA(xi)序列描述SEQ ID NO4AAAAATTTTT TT12(2)SEQ ID NO5的資料(i)序列特征(A)長度12個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(xi)序列描述SEQ ID NO5AAAAATTTTT TC12(2)SEQ ID NO6的資料(i)序列特征(A)長度12個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(xi)序列描述SEQ ID NO6AAAAATTTTT TG12(2)SEQ ID NO7的資料
(i)序列特征(A)長度12個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(Xi)序列描述SEQ ID NO7TAAAAATTTT TT12(2)SEQ ID NO8的資料(i)序列特征(A)長度12個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(xi)序列描述SEQ ID NO8CAAAAATTTT TT12(2)SEQ ID NO9的資料(i)序列特征(A)長度12個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA
(xi)序列描述SEQ ID NO9GAAAAATTTT TT12(2)SEQ ID NO10的資料(I)序列特征(A)長度12個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(xi)序列描述SEQ ID NO9AAAAAATTTT T 1權利要求
1.確定核酸分子序列的方法,包括步驟(a) 通過將所述分子與兩組已知序列的小寡核苷酸探針的互補序列雜交來鑒定來自所述分子的序列,其中第一組探針附著于固體支持物,第二組探針是溶液中的標記探針;(b) 從步驟(a)中鑒定的序列鑒定所述序列的重疊伸展范圍;和(c) 從鑒定的所述重疊序列組裝所述分子的核酸序列。
2.權利要求1的方法,其中所述雜交循環(huán)完成。
3.確定核酸分子序列的方法,包括步驟(a) 將待測序的核酸分子制成片段以得到中等長度的核酸片段;(b) 通過將所述片段與兩組已知序列的小寡核苷酸探針的互補序列雜交來鑒定來自所述片段的序列,其中第一組探針附著于固體支持物,第二組探針是溶液中的標記探針;(c) 從步驟(b)中鑒定的序列鑒定所述序列的重疊伸展范圍;和(d) 從鑒定的所述重疊序列組裝所述分子的核酸序列。
4.權利要求3的方法,其中所述片段相繼與兩組已知序列的小寡核苷酸探針的互補序列雜交。
5.權利要求3的方法,其中所述片段同時與兩組已知序列的小寡核苷酸探針的互補序列雜交。
6.權利要求3的方法,其中所述中等長度的核酸片段長度為約10個核苷酸到約40個核苷酸之間,所述小寡核苷酸探針長度為約4個核苷酸到約9個核苷酸長。
7.權利要求3的方法,其中所述寡核苷酸探針與來自所述片段的完全互補序列雜交。
8.權利要求3的方法,其中所述寡核苷酸探針與來自所述片段的緊鄰的序列雜交。
9.權利要求8的方法,其中所述寡核苷酸探針與來自所述片段的完全互補和緊鄰的序列雜交。
10.權利要求8的方法,其中將所述緊鄰的寡核苷酸探針隨后連接起來。
11.權利要求3的方法,其中步驟(b)包括步驟(a) 在奏效的只讓具有完全互補序列的那些片段與探針雜交的雜交條件下,將所述的第一組附著寡核苷酸探針與所述中等長度的核酸片段接觸,由此形成一級復合物,復合物中所述片段有雜交的和游離的序列;(b) 在奏效的只讓具有完全互補序列的那些探針與游離的片段序列雜交的雜交條件下,將所述的一級復合物與所述第二組寡核苷酸探針接觸,由此形成二級復合物,復合物中所述片段與附著和標記探針雜交;(c) 從所述二級復合物中除去未與附著探針緊鄰的標記探針,由此只剩下相鄰的二級復合物;(d) 通過檢測標記存在而檢測所述相鄰的二級復合物;和(e) 通過連接雜交的附著和標記探針的已知序列而鑒定在所述相鄰二級復合物中的所述核酸片段的序列。
12.核酸測序的方法,包括步驟(a) 將待測序的核酸制成片段以得到長度為T的核酸片段;(b) 制備已知序列且長度為F的固定寡核苷酸探針陣和一組在溶液中已知序列的長度為P的標記寡核苷酸探針,其中F+P≤T;(c) 在奏效的只讓帶有雜交的長度為F的完全互補序列和未雜交的長度為T-F的片段序列的一級復合物形成的雜交條件下,將固定寡核苷酸探針陣與所述的核酸片段接觸;(d) 在奏效的只讓帶有雜交的長度為F的完全互補序列和緊鄰雜交的長度為P的完全互補序列的二級復合物形成的雜交條件下,將所述的復合物與所述的標記寡核苷酸探針組接觸;(e) 通過檢測標記存在而檢測所述二級復合物;(f) 通過組合雜交的固定和標記探針的已知序列,從所述二級復合物的核酸片段中鑒定長度為F+P的序列;(g) 鑒定重疊的長度為F+P的所述序列的伸展范圍;和(h) 從所述的重疊序列組裝完整的核酸序列。
13.權利要求12的方法,其中長度T比長度F長約3倍。
14.權利要求12的方法,其中長度T為約10個核苷酸到約40個核苷酸之間,長度F為約4個核苷酸到約9個核苷酸之間,長度P在約4個核苷酸到約9個核苷酸之間。
15.權利要求14的方法,其中長度T為約20個核苷酸,長度F為約6個核苷酸和長度P為約6個核苷酸。
16.權利要求12的方法,其中將所述緊鄰的固定和標記寡核苷酸探針連接起來。
17.核酸測序的方法,包括步驟(a) 將待測序的核酸制成片段以得到中等長度的核酸片段;(b) 在奏效的只讓具有完全互補序列的那些片段與探針雜交的雜交條件下,將已知序列的固定小寡核苷酸探針陣與所述核苷酸片段接觸,由此形成一級復合物,復合物中所述片段含有雜交的和未雜交的序列;(c) 在奏效的只讓具有完全互補序列的那些探針與未雜交片段序列雜交的雜交條件下,將所述的一級復合物與一組溶液中的標記小寡核苷酸探針接觸,由此形成二級復合物,其中所述片段與固定探針和標記探針雜交;(d) 從所述二級復合物中除去未與固定探針緊鄰的標記探針,由此只剩下相鄰二級復合物;(e) 通過檢測標記存在而檢測所述相鄰二級復合物;(f) 通過組合雜交的固定和標記探針的已知序列,從所述相鄰二級復合物的核酸片段鑒測序列;(g) 確定重疊的所述序列的伸展范圍;和(h) 從鑒定的所述重疊序列組裝完整的核酸序列。
18.權利要求17的方法,其中所述的核酸是克隆的DNA或染色體DNA。
19.權利要求17的方法,其中所述的核酸是mRNA。
20.權利要求17的方法,其中通過限制酶消化,超聲處理,NaOH處理或低壓剪切而將所述的核酸制成片段。
21.權利要求17的方法,其中所述核酸片段長度為約10核苷酸至約100個核苷酸之間。
22.權利要求17的方法,其中所述的寡核苷酸探針長度為約4個核苷酸到約9個核苷酸之間。
23.權利要求22的方法,其中所述的寡核苷酸長度為約6個核苷酸。
24.權利要求17的方法,其中所述的固定寡核苷酸附著于玻璃,聚苯乙烯或特富龍固體支持物。
25.權利要求17的方法,其中所述的固定寡核苷酸經(jīng)磷酸二酯鍵附著于固體支持物。
26.權利要求17的方法,其中所述固定寡核苷酸經(jīng)光激活的合成機制附著于固體支持物。
27.權利要求17的方法,其中所述標記探針用非放射性同位素或熒光染料標記。
28.權利要求17的方法,其中所述標記寡核苷酸探針用35S,32P,或33P標記。
29.權利要求17的方法,其中所述核酸片段或所述寡核苷酸探針之一含有修飾的堿基或廣義堿基。
30.權利要求17的方法,其中通過嚴緊的洗滌條件從二級復合物中除去未與固定探針緊鄰的標記探針。
31.權利要求17的方法,其中將與固定探針緊鄰的標記探針與所述固定探針連接,隨后通過洗滌除去未連接的標記探針。
32.權利要求31的方法,其中所述相鄰探針經(jīng)酶促連接。
33.權利要求17的方法,其中多個固定寡核苷酸陣以測序芯片的方式排列。
34.核酸測序的方法,包括步驟(a) 將待測核酸制成片段,以得到長度為約10個核苷酸到40個核苷酸的核酸片段;(b) 在奏效的只讓具有完全互補序列的那些片段與探針雜交的雜交條件下,將已知序列的長度為約4核苷酸至約9個核苷酸固定寡核苷酸探針陣與所述核酸片段接觸,由此形成一級復合物,復合物中所述片段含有雜交的和未雜交的序列;(c) 在奏效的只讓具有完全互補序列的那些探針與未雜交的片段序列雜交的雜交條件下,將所述的復合物與一組32P-標記或33P-標記已知序列的長度為約4核苷酸至約9個核苷酸寡核苷酸探針接觸,由此形成二級復合物,二級復合物中所述片段與固定探針和32P-標記或33P-標記探針雜交;(d)用DNA連接酶將緊鄰的固定探針和標記探針連接在一起,由此形成連接的二級復合物;(e) 從二級復合物中除去任何未連接的標記探針;(f) 通過檢測32P或33P標記存在而檢測所述連接的二級復合物;(g) 通過組合連接探針的已知序列而鑒定在所述連接的二級復合物中的核酸片段的序列;(h) 確定重疊的所述序列伸展范圍;和(i) 從所述重疊序列組裝完整的核酸序列。
35.用于核酸測序的試劑盒,含有具有附著已知序列的寡核苷酸探針之排列的固體支持物芯片,所述寡核苷酸能夠參與雜交反應,和一組包含已知序列的標記寡核苷酸探針溶液的容器。
36.權利要求35的試劑盒,其中所述多個固定寡核苷酸探針芯片以測序陣的形式排列。
37.權利要求35的試劑盒,其中所述寡核苷酸長度為約4個核苷酸到約9個核苷酸之間。
38.權利要求37的試劑盒,其中所述寡核苷酸探針長度為約6個寡核苷酸。
39.權利要求35的試劑盒,其中所述寡核苷酸探針附著于玻璃,聚苯乙烯或特富龍固體支持物。
40.權利要求35的試劑盒,其中所述寡核苷酸探針經(jīng)磷酸二酯鍵附著于固體支持物。
41.權利要求35的試劑盒,其中所述寡核苷酸探針經(jīng)光激活的合成機制附著于固體支持物。
42.權利要求35的試劑盒,其中所述標記寡核苷酸探針用非放射性同位素或熒光染料標記。
43.權利要求35的試劑盒,其中所述寡核苷酸探針之一含有修飾的或通用的堿基。
44.權利要求35的試劑盒,其中所述標記寡核苷酸探針用35S,32P,或33P標記。
45.權利要求35的試劑盒,還含有連接試劑。
46.權利要求45的試劑盒,其中連接試劑是DNA連接酶。
全文摘要
公開了以與兩組已知序列的小寡核苷酸探針雜交為基礎的快速高效地進行核酸測序的新方法和組合物。也可以對極大的核酸分子,包括染色體和非擴增的RNA進行測序而預先不必進行克隆或亞克隆。本發(fā)明還解決了目前與測序技術有關的各種問題,例如,高噪信比和分辨,表面附著許多核酸片段,制備許多更長或更復雜的探針以及要標記更多的種類。
文檔編號C12Q1/68GK1136330SQ94194301
公開日1996年11月20日 申請日期1994年9月27日 優(yōu)先權日1993年9月27日
發(fā)明者R·德曼阿克 申請人:阿奇發(fā)展公司