、或 90、或80、或70、或60、或50、或40、或30個或更少、或20個或更少、或15個或更少的核苷 酸、但至少有10個核苷酸。制備引物的方法是本領域公知的,并且許多商業(yè)來源提供適于 提供根據(jù)本文所述方法和組合物的引物的寡核苷酸合成服務,例如,INVITROGEN? Custom DNA Oligos ;Life Technologies ;Grand Island,NY 或來自 IDT 的 custom DNA Oligos; Coralville, IA0
[0087] 在一些實施方式中,在將通用寡核苷酸尾部接頭連接至樣品中的核酸(例如,靶 核酸)后,可在第一擴增步驟(即步驟(b))中對所述靶核酸進行擴增。第一擴增步驟可為 使用第一靶特異性引物和第一尾部接頭引物進行的PCR擴增循環(huán)組。
[0088] 本文所使用的術語"第一靶特異性引物"是指含有可在退火溫度下特異性退火至 靶核酸的核酸序列的單鏈寡核苷酸。
[0089] 在一些實施方式中,第一革El標特異性引物可包含5'標簽序列部分。在一些實施方 式中,反應中存在的所有第一靶特異性引物可包含相同的5'標簽序列部分。在多重PCR反 應中,不同引物種類可通過不希望的脫靶方式彼此相互作用,從而引起由DNA聚合酶進行 的引物延伸和隨后的擴增。這些引物二聚體一般是短的,它們的高效擴增可主導反應并占 據(jù)優(yōu)勢,從而導致所需靶序列的擴增不佳。在第一靶特異性引物中包含有5'標簽序列引起 任何潛在的引物二聚體(其可導致在兩個末端含有相同的互補尾部)。在隨后的PCR循環(huán) 中,引物二聚體將變性成單鏈DNA引物二聚體,每個單鏈DNA引物二聚體在其兩個末端上含 有由5'標簽引入的互補序列。并非是引物退火至這些單鏈DNA引物二聚體,而是優(yōu)先發(fā)生 分子內(nèi)發(fā)卡(鍋柄狀結構)的形成,這是由于相同引物二聚體分子上互補標簽的接近的可 及性(proximate accessibility),而不是不同分子上與新引物的分子間相互作用。結果 是這些引物二聚體非常難以擴增,從而使得引物不會呈指數(shù)地被不希望的二聚體擴增所消 耗。相反,對于期望的靶序列的特異性擴增而言,帶標簽的引物可保持高且足夠的濃度。引 物二聚體的累積還會有損多重PCR,因為引物二聚體競爭并消耗反應中的其它試劑。在一 些實施方式中,5'標簽序列可為富含GC的序列,S卩,標簽序列可含有至少50%的GC含量、 至少55 %的GC含量、至少60 %的GC含量、至少65 %的GC含量、至少70 %的GC含量、至少 75%的GC含量、至少80%的GC含量、或更高的GC含量。在一些實施方式中,標簽序列可含 有至少60%的GC含量。在一些實施方式中,標簽序列可含有至少65%的GC含量。
[0090] 本文所使用的術語"第二靶特異性引物"是指含有3'部分和5'部分的單鏈寡核 苷酸,所述3'部分含有能夠特異性退火至由步驟(b)產(chǎn)生的擴增子包含的已知靶核苷酸序 列的一部分的核酸序列,所述5'部分含有與第二測序引物相同的核酸序列。第二靶特異性 引物相對于第一靶特異性引物嵌套。在一些實施方式中,第二靶特異性引物通過至少3個 核苷酸(例如,通過3個以上、4個以上、5個以上、6個以上、7個以上、8個以上、9個以上、 10個以上、或者15個以上核苷酸)相對于第一靶特異性引物嵌套。
[0091] 在一些實施方式中,存在于反應中的所有第二靶特異性引物含有相同的5'部分。 在一些實施方式中,5'部分可用來阻遏上文所述的關于第一靶特異性引物的5'標簽所描述 的引物二聚體。
[0092] 在一些實施方式中,第一靶特異性引物和第二靶特異性引物基本上與靶核酸的同 一條鏈互補。在一些實施方式中,特異性退火至已知靶序列的第一靶特異性引物和第二靶 特異性引物的部分可包含總共至少20個所述已知靶核苷酸序列的獨有(unique)堿基,例 如,20個以上獨有堿基、25個以上獨有堿基、30個以上獨有堿基、35個以上獨有堿基、40個 以上獨有堿基、或50個以上獨有堿基。在一些實施方式中,特異性退火至已知靶序列的第 一靶特異性引物和第二靶特異性引物的部分可含有總共至少30個所述已知靶核苷酸序列 的獨有堿基。
[0093] 本文所使用的術語"第一接頭引物"是指含有與第一測序引物的5'部分相同的核 酸序列的核酸分子。因為第一尾部接頭引物由此與擴增鏈序列的至少一部分相同(與互補 相對),所述第一尾部接頭引物將不能夠特異性退火至通用寡核苷酸尾部接頭本身的任何 部分。
[0094] 本文所使用的術語"第二接頭引物"是指含有與第一測序引物的一部分相同的核 酸序列、并相對于第一接頭引物嵌套的核酸分子。因為第二尾部接頭引物由此與擴增鏈序 列的至少一部分相同(與互補相對),所述第二尾部接頭引物將不能夠特異性退火至通用 寡核苷酸尾部接頭本身的任何部分。在一些實施方式中,第二接頭引物與第一測序引物相 同。
[0095] 所述第二接頭引物應該相對于第一接頭引物嵌套,即,所述第一接頭引物包含與 擴增鏈相同的核酸序列,該序列并不包含于所述第二接頭引物中、且與包含于第二接頭引 物中的與擴增鏈相同的任何序列相比而言位于較接近擴增引物的5'末端的位置。在一些 實施方式中,第二接頭引物通過至少3個核苷酸(例如,通過3個核苷酸、通過4個核苷酸、 通過5個核苷酸、通過6個核苷酸、通過7個核苷酸、通過8個核苷酸、通過9個核苷酸、通 過10個核苷酸或更多核苷酸)來嵌套。
[0096] 在一些實施方式中,第一接頭引物可含有與通用寡核苷酸尾部接頭的擴增鏈的最 5'端的約20個堿基相同的核酸序列,且第二接頭引物可包含與通用寡核苷酸尾部接頭的 擴增鏈的約30個堿基相同的核酸序列,所述第二接頭引物的5'堿基在3'方向上距所述擴 增鏈的 5' 末端至少 3 個核苷酸(at least 3nucleotides 3' of the 5' terminus of the amplification strand)〇
[0097] 嵌套接頭引物的使用消除了生成可擴增(例如,橋式PCR或乳液PCR中)但不能 測序的最終擴增子的可能性,這是可能在半巢式(hemi-nested)方法中出現(xiàn)的情況。在其 它情況下,使用與測序引物相同的引物進行的半巢式方法可導致不希望的擴增產(chǎn)物從第一 PCR步驟遺留至第二PCR步驟,并將最終產(chǎn)生人為測序讀段。如本文所述,兩個接頭引物的 使用可以減少這些問題,并且在一些實施方式中可消除這些問題。
[0098] 在第一擴增步驟的第一 PCR擴增循環(huán)中,第一靶特異性引物可特異性退火至含有 已知靶核苷酸序列的任何核酸的模板鏈。根據(jù)設計第一靶特異性引物的方向,將合成已知 靶核苷酸序列上游或下游且與模板鏈互補的序列。如果在PCR的延伸階段期間,模板鏈的 5 '末端終止于連接的通用寡核苷酸尾部接頭,新合成的產(chǎn)物鏈的3 '末端將會含有與第一尾 部接頭引物互補的序列。在隨后的PCR擴增循環(huán)中,第一靶特異性引物和第一尾部接頭引 物兩者將能夠特異性退火至靶核酸序列的適當鏈,已知靶核苷酸序列和通用寡核苷酸尾部 接頭之間的序列可被擴增(即,復制)。
[0099] 在本文所述方法的下一步驟(S卩,步驟(C))中,在第二擴增步驟中擴增由步驟(b) 產(chǎn)生的擴增部分的一部分。第二擴增步驟可為使用第二靶特異性引物和第一測序引物進行 的PCR擴增循環(huán)組。第二PCR擴增循環(huán)組可具有與第一 PCR擴增循環(huán)組中的PCR參數(shù)相同 或不同的PCR參數(shù)。例如,步驟(b)和步驟(c)的PCR擴增方案可具有相同或不同的退火 溫度、或者相同或不同的延伸步驟時長。
[0100] 本文所述的方法允許測定在已知靶核苷酸序列的兩側之一或兩側的與所述已知 靶核苷酸序列鄰接的核苷酸序列。無論靶核酸是正常地以單鏈核酸的形式還是雙鏈核酸的 形式存在,序列信息通常以單鏈格式(鏈A)從5'至3'表示。如果將要測定鏈A的已知靶 核苷酸序列的5'端的序列,基因特異性引物可與鏈A互補(即,退火至鏈A)。如果將要測 定鏈A的已知靶核苷酸序列的3'端的序列,基因特異性引物可與鏈A相同,以使得所述引 物將退火至雙鏈靶核酸的互補鏈。這樣的引物設計考慮為本領域普通技術人員所熟知。
[0101] 在一些實施方式中,本文所述的涉及使用第一基因特異性引物和第二基因特異性 引物的方法可使得分析具有優(yōu)秀的靶命中(on-target)率,例如70-90%。在一些實施方式 中,本文所述的分析和方法可具有至少85 %的靶特異率。
[0102] 在一些實施方式中,將四類引物設計為引物在約61-72?的退火溫度下(例如,約 61-69°C、約63-69°C、約63-67°C、約64-66°C )將特異性退火至它們的互補序列。在一些實 施方式中,將四類引物設計為引物在低于72°C的退火溫度下將特異性退火至它們的互補序 列。在一些實施方式中,將四類引物設計為引物在低于70°C的退火溫度下將特異性退火至 它們的互補序列。在一些實施方式中,將四類引物設計為引物在低于68°C的退火溫度下將 特異性退火至它們的互補序列。在一些實施方式中,將四類引物設計為引物在約65°C的退 火溫度下將特異性退火至它們的互補序列。
[0103] 在一些實施方式中,特異性退火至已知靶核苷酸序列的靶特異性引物的部分將在 約61-72°C的溫度下(例如,約61-69°C、約63-69°C、約63-67°C、約64-66°C )特異性退火。 在一些實施方式中,特異性退火至已知靶核苷酸序列的靶特異性引物的部分將在PCR緩沖 液中在約65°C的溫度下特異性退火。
[0104] 在一些實施方式中,本文所述的引物和/或接頭不可含有修飾的堿基(例如,引物 和/或接頭不可含有封閉3'胺(blocking 3' amine)) 〇
[0105] 在本文所述方法的下一步驟(即,步驟(d))中,可對由步驟(c)產(chǎn)生的擴增部 分進行測序。在一些實施方式中,測序可通過下一代測序法進行。本文所使用的"下一 代測序"是指此類寡核苷酸測序技術:所述寡核苷酸測序技術具有以高于傳統(tǒng)測序方法 (例如,Sanger測序)的可能速度的速度對寡核苷酸進行測序的能力,因為所述下一代 測序平行執(zhí)行和讀取數(shù)千甚至數(shù)百萬個測序反應。下一代測序法/平臺的非限制性實例 包括:大規(guī)模平行簽名測序(Lynx Therapeutics) ;454焦磷酸測序(454Life Sciences/ Roche Diagnostics);固相可逆染料終止物測序(Solexa/Illumina) :S0LiD技術(Applied Biosystems) ; Ion 半導體測序(ION Torrent) ;DNA 納米球測序(Complete Genomics);以 及可從 Pacific Biosciences、Intelligen Bio_systems、Oxford Nanopore Technologies 和Helicos Biosciences獲得的技術。在一些實施方式中,測序引物可包含可與選定的 下一代測序法兼容的部分。下一代測序技術及相關引物的限制和設計參數(shù)在本領域中 是公知的(參見例如 Shendure 等,"Next-generation DNA sequencing",Nature,2008, 第 26 卷,第 10 期,1135-1145 ;Mardis,"The impact of next-generation sequencing technology on genetics",Trends in Genetics,2007,第 24 卷,第 3 期,第 133-141 頁;Su 等,"Next-generation sequencing and its applications in molecular diagnostics'', Expert Rev Mol Diagn,2011,11 (3):333-43 ;Zhang等,"The impact of next-generation sequencing on genomics'',J Genet Genomics, 2011,38 (3) :95-109 ;Nyren, P.等,Anal Biochem 208:17175 (1993) ;Bentley,D. R. , Curr Opin Genet Devl6:545-52 (2006); Strausberg,R.L.等,Drug Disc Today 13:569-77(2008);美國專利號 7, 282, 337;美國專 利號7, 279, 563 ;美國專利號7, 226, 720 ;美國專利號7, 220, 549 ;美國專利號7, 169, 560 ; 美國專利號6, 818, 395 ;美國專利號6, 911,345 ;美國公開號2006/0252077、2007/0070349 和20070070349,以引用的方式將其整體并入本文)。
[0106] 在一些實施方式中,測序步驟取決于第一測序引物和第二測序引物的使用。在一 些實施方式中,將第一測序引物和第二測序引物選擇為兼容本文所述的下一代測序法。
[0107] 將測序讀段與基因組和/或CDNA序列的已知序列數(shù)據(jù)庫進行比對的方法是本領 域中公知的,并且用于此過程的軟件是可商購的。在一些實施方式中,并未完全映射(map) 至野生型序列數(shù)據(jù)庫的讀段(去掉測序引物和/或接頭核苷酸序列)可為基因組重排或大 型插入缺失(indel)突變。在一些實施方式中,含有映射至基因組中多個位置的序列的讀 段(去掉測序引物和/或接頭核苷酸序列)可為基因組重排。
[0108] 在一些實施方式中,可在步驟a-步驟d的任意步驟之前和/或之后,將靶核 酸和/或其擴增產(chǎn)物從酶、引物、或緩沖液組分中分離。用于分離核酸的方法在本領域 是公知的。在一些實施方式中,分離可包括固相可逆固定(Solid Phase Reversible Immobilization,SPRI)純化。SPRI純化方法是本領域所熟知的,且試劑盒是可商購的,例 如,Agencourt AMPure XP-PCR 純化(目錄號 A6388〇,Beckman Coulter ;Brea,CA)。在一 些實施方式中,酶可通過加熱處理失活。
[0109] 在一些實施方式中,靶核酸可包含于基因組DNA中。在一些實施方式中,靶核酸可 包含于核糖核酸(RNA)中,例如,mRNA。在一些實施方式中,靶核酸可包含于cDNA中。許多 適于用于本文所述方法的測序方法提供最佳讀段長度為數(shù)十至數(shù)百核苷酸堿基的測序運 行(例如,Ion Torrent技術可產(chǎn)生200-400bp的讀段長度)。例如,由基因組DNA或mRNA 所包含的靶核酸可包含于大大長于這一最佳讀段長度的核酸分子中。為了使由步驟(c)產(chǎn) 生的擴增核酸部分成為可適于在特定測序技術中使用的長度,已知靶核苷酸序列和靶核酸 末端(可將通用寡核苷酸尾部接頭連接至該末端)之間的平均距離應盡可能接近所選定技 術的最佳讀段長度。例如,如果給定測序技術的最佳讀段長度為200bp,則根據(jù)本文所述方 法擴增的核酸分子應具有約400bp以下的平均長度。在步驟(a)之前,可對由例如基因組 DNA或mRNA所包含的靶核酸進行剪切(例如,機械剪切或酶促剪切),以產(chǎn)生任何所需大小 的片段。機械剪切方法的非限制性實例包括:超聲、霧化、以及可從Covaris (Woburn, MA)獲 得的AFAtm剪切技術。在一些實施方式中,可通過超聲對基因組DNA所包含的靶核酸進行機 械剪切。在一些實施方式中,當靶核酸由RNA所包含時,可使樣品經(jīng)歷逆轉錄酶方案以生成 DNA模板,然后可對所述DNA模板進行剪切。在一些實施方式中,可在進行逆轉錄酶方案前 對靶RNA進行剪切。在一些實施方式中,含有靶RNA的樣品可用于本文所述的如下方法:使 用從新鮮樣本或降解樣本提取的總核酸;無需為cDNA測序去除基因組DNA ;無需為cDNA測 序而使核糖體RNA耗竭;在任何步驟中均不需要機械剪切或酶促剪切;通過使用隨機六聚 體使RNA經(jīng)歷雙鏈cDNA合成;以及通過在單個管中使核酸經(jīng)歷末端修復、磷酸化以及腺苷 酸化。
[0110] 在一些實施方式中,已知靶核苷酸序列可包含于基因重排中。本文所述的方法適 合于測定基因重排的存在和/或種類,因為僅一半的基因重排的種類必須是先前已知的 (即,待由基因特異性引物所靶向的一半基因重排)。在一些實施方式中,基因重排可包含 癌基因。在一些實施方式中,基因重排可包含融合癌基因。
[0111] 在一些實施方式中,靶核酸可包含于樣品中。在一些實施方式中,靶核酸可包含于 獲得自受試者的樣品中。在一些實施方式中,樣品可為獲得自受試者的診斷樣品。在一些 實施方式中,樣品可進一步包含蛋白質、細胞、流體、生物流體、保護劑、和/或其它物質。以 非限制性實例的方式,樣品可為面頰拭子(cheek swab)、血液、血清、血漿、痰、腦脊液流體、 尿液、淚液、肺泡分離物(alveolar isolates)、胸膜液、心包液、囊液(cyst fluid)、腫瘤組 織、組織、活組織切片、唾液、抽出物(aspirate),或上述物質的組合。在一些實施方式中,樣 品可通過切除術或活組織切片獲得。
[0112] 在一些實施方式中,樣品可獲得自需要治療癌癥的受試者。在一些實施方式中,樣 品可包含腫瘤細胞群,例如,至少一種腫瘤細胞的群。在一些實施方式中,樣品可包含腫瘤 活組織檢片,包括但不限于未處理的活檢組織或經(jīng)過處理的活檢組織(例如,福爾馬林固 定的活檢組織和/或石蠟包埋的活檢組織)。
[0113] 在一些實施方式中,樣品可新鮮收集。在一些實施方式中,可在將樣品用于本文所 述的方法和組合物中之前,將所述樣品儲存。在一些實施方式中,樣品是未經(jīng)處理的樣品。 本文所使用的"未經(jīng)處理的樣品"是指除了稀釋于溶液中和/或懸浮于溶液中外,未曾進行 任何事先的樣品預處理的生物樣品。在一些實施方式中,樣品可獲得自受試者,并可在用于 本文所述的方法和組合物之前對其進行保存或加工。以非限制性實例的方式,可將樣品包 埋于石蠟中、冷藏或冷凍??稍诟鶕?jù)本文所述的方法和組合物測定核酸的存在之前,將冷凍 的樣品解凍。在一些實施方式中,樣品可為加工過的或處理過的樣品。用于處理或加工樣 品的示例性方法包括但不限于:離心、過濾、超聲、均質化、加熱、冷凍和解凍、與保護劑(例 如,抗凝血劑或核酸酶抑制劑)接觸,以及上述方法的任意組合。在一些實施方式中,可用 化學試劑和/或生物試劑對樣品進行處理??刹捎没瘜W試劑和/或生物試劑在加工和/或 存儲期間保護和/或保持樣品或樣品中所含核酸的穩(wěn)定性??商娲鼗蝾~外地,可采用化 學試劑和/或生物試劑使核酸從樣品的其它組分中釋放出。以非限制性實例的方式,在用 于本文所述的方法和組合物之前,可用抗凝血劑處理血液樣品。本領域技術人員熟知用于 核酸分析的樣品加工、保存或處理方法和過程。在一些實施方式中,樣品可以是例如通過離 心得到的澄清流體樣品。在一些實施方式中,可通過低速離心(例如,3000Xg以下)并收 集含有澄清流體樣品的上清液來使樣品澄清。
[0114] 在一些實施方式中,可在用于本文所述的方法和組合物之前,對樣品中存在的核 酸進行分離、富集或純化。從樣品中分離、富集或純化核酸的方法是本領域普通技術人員所 公知的。以非限制性實例的方式,用于從各種樣品類型中分離基因組DNA的試劑盒是可商 購的(例如,目錄號 51104、513〇4、565〇4 和 56404 ;Qiagen ;Germantown,MD) 〇
[0115] 本文所述的方法可用于多重(multiplex)技術。在本文所述方法的實施方式中, 多重應用可以包括測定與一種或多種已知靶核苷酸序列鄰接的核苷酸序列。本文所使用的 "多重PCR"是指在一個反應容器中進行多于一種靶核酸的同時擴增的PCR變型、并隨后通 過使用多于一組第一基因特異性引物和第二基因特異性引物對擴增產(chǎn)物的序列進行測定。 多重可涉及在單個反應中檢測約2-1,000種不同的靶序列。本文所使用的多重是指在單個 反應中檢測2-1,000種之間的任何范圍(例如,5-500、25-1000、或10-100種之間)的不同 靶序列等。適用于PCR的術語"多重"意味著在同一 PCR反應中存在對于至少兩種不同靶 序列具有特異性的引物。
[0116] 在一些實施方式中,可用多個第一靶特異性引物和第二靶特異性引物對樣品或樣 品的單獨部分中的靶核酸進行擴增。在一些實施方式中,所述多個第一靶特異性引物和第 二靶特異性引物可存在于單個反應混合物中,例如,可在同一反應混合物中產(chǎn)生多種擴增 產(chǎn)物。在一些實施方式中,多組第一靶特異性引物和第二靶特異性引物可特異性退火至不 同基因中所包含的已知靶序列。在一些實施方式中,至少兩組第一靶特異性引物和第二靶 特異性引物可特異性退火至已知靶序列的不同部分。在一些實施方式中,至少兩組第一靶 特異性引物和第二靶特異性引物可特異性退火至單個基因所包含的已知靶序列的不同部 分。在一些實施方式中,至少兩組第一靶特異性引物和第二靶特異性引物可特異性退火至 含有已知靶序列的基因的不同外顯子。在一些實施方式中,多個第一靶特異性引物可含有 相同的5'標簽序列部分。
[0117] 在本文所述方法的實施方式中,多重應用可包括在一個測序反應或測序運行 中測定多個樣品中與一個或多個已知靶核苷酸序列鄰接的核苷酸序列。多個樣品可為 不同來源,例如,來自不同組織和/或不同受試者。在此類實施方式中,通用寡核苷酸 尾部接頭可進一步包含條形碼部分。在一些實施方式中,可將具有獨特條形碼部分的 通用寡核苷酸尾部接頭添加至各樣品中,并與其中的核酸連接;然后可在步驟(a)之 后將所述樣品合并。擴增產(chǎn)物所得到的各測序讀段由此都將包含識別含有原始模板核 酸的樣品類型的條形碼,所述擴增產(chǎn)物源自所述原始模板核酸。下一代測序應用中條 形碼部分的使用在本領域中是公知的,并在以下著作中有所描述:例如,Margulies,M. 等,"Genome Sequencing in Microfabricated High-Density Picolitre Reactors'', Nature,437, 376-80 (2005) ;Mikkelsen,T.等,"Genome-Wide Maps of Chromatin State in Pluripotent and Lineage-Committed Cells'',Nature,448,553-60 (2007); McLaughlin, S.等,"Whole-Genome Resequencing With Short Reads:Accurate Mutation Discovery With Mate Pairs and Quality Values^jASHG Annual Meeting(2007); Shendure I.等,"Accurate Multiplex Polony Sequencing of an Evolved Bacterial Genome",Science,309,1728-32 (2005) ;Harris,T·等,"Single-Molecule DNA Sequencing of a Viral Genome",Science,320,106-9 (2008) ;Simen,B.等,"Prevalence of LoW Abundance Drug Resistant Variants by Ultra Deep Sequencing in Chronically HIV-infected Antiretroviral (ARV) Naiv