欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于單體型測定的方法和系統(tǒng)的制作方法

文檔序號:510003閱讀:326來源:國知局
用于單體型測定的方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明的實(shí)施方案提供用于測定生物樣品的單體型的方法和系統(tǒng)。特定的實(shí)施方案提供用于基因組的遠(yuǎn)程單倍體分型的方法。
【專利說明】用于單體型測定的方法和系統(tǒng)
[0001]本申請要求2011年2月25日遞交的美國臨時專利申請系列號61/446890和2011年6月20日遞交的美國臨時專利申請系列號61/509960的優(yōu)先權(quán),其兩者通過引用以其全部結(jié)合到本文中。
[0002]背景
人類基因組計(jì)劃的努力開辟了更廣闊的人類遺傳密碼的窗口。例如使用高通量測序技術(shù)進(jìn)一步解開人類基因組的工作正在不斷的進(jìn)行中。HapMap (單體型圖)計(jì)劃(HapMap(Haplotype Map) Project)為通過比較沒有特定疾病的人群與具有所述疾病的人群的基因組信息,針對發(fā)現(xiàn)導(dǎo)致疾病的基因變異的全球性的科學(xué)努力。等位基因,對于特定基因的DNA序列的一種或多種形式,可含有一個或多個不同的基因變異和識別的單體型,或者特定染色體上的不同位置或位點(diǎn)的等位基因的組合為HapMap計(jì)劃(HapMap Project)的主要焦點(diǎn)。所確認(rèn)的其中兩組不同的單體型可能與引起疾病的基因異常的位置相關(guān)。這樣,HapMap結(jié)果將有助于描述在人類基因變異的常見模式以及這些變異是否潛在地與疾病相關(guān)。[0003]從這些努力獲得的信息,即使序列是不完整的,并且存在差距和有時是錯誤的,在幫助破譯疾病和障礙背后的遺傳學(xué)方面提供有價值的工具。不幸地,進(jìn)行這樣大規(guī)模測序的成本仍然非常高,并且提供更深入的信息的技術(shù)比如單染色體單倍體分型、等位基因或引導(dǎo)序列的取相(phasing)為虛幻的。所需要的是從人類基因組解開更多信息的另外的工具和技術(shù)。
[0004]概述
目前的基因分型技術(shù)可給研究者提供受試者的基因組成。然而,關(guān)于提供方便和可擴(kuò)展的手段的技術(shù)有限,這種手段用來測定一個染色體上的什么序列相對于另一個染色體上的相鄰或鄰近的那些序列彼此相鄰或鄰近。圖2舉例說明一種困境,其中受試者的基因型可被測定,然而為測定關(guān)注的序列(例如等位基因、單核苷酸多態(tài)性(SNP)、拷貝數(shù)目變異體(CNV)、基因插入或缺失(插入/缺失(indel)等)是否位于與另一個關(guān)注的序列相同的染色體上所獲得的信息不足。例如,對于采自受試者的樣本中的染色體的混合群體(圖2A),可以能自數(shù)據(jù)測定示例性的基因型(圖2B)。然而,對于測定雜合性等位基因如何在染色體上組合在一起(單倍體分型)提供的信息不足。例如,不知是否母體A (Pa)提供等位基因α和Y,母體B (Pb)提供等位基因α ’和Y ’(圖2C),或者是否它們?yōu)榛旌系?圖2D)。當(dāng)那些序列在染色體上彼此相隔很遠(yuǎn)或位于遠(yuǎn)端或遠(yuǎn)程時,甚至更加難以測定哪些關(guān)注的序列存在于相同的染色體上,從而測定染色體的長單倍型或等位基因取相。
[0005]本公開的實(shí)施方案提供用于測定取相的(phased)等位基因而不管其彼此在染色體上的位置(例如近端或遠(yuǎn)端)的新的解決方案。在針對解決當(dāng)前的單倍體分型挑戰(zhàn)的實(shí)驗(yàn)期間,發(fā)現(xiàn)提供遺傳物質(zhì)的不平衡或不對稱分布,對于受試者的準(zhǔn)確單倍體分型問題提供一種新的解決方案。在不平衡分布后的引導(dǎo)序列的任選擴(kuò)增是特別有用的。本發(fā)明不限于特定的機(jī)制。的確,理解機(jī)制對于實(shí)踐本發(fā)明是沒有必要的。但是,考慮部分基于不平衡物質(zhì)的差分?jǐn)U增(differential amplification),擴(kuò)增信號強(qiáng)度確定染色體的單體型。例如,不同等位基因信號的比例確定哪一個存在于單染色體上,從而確定樣本的取相的單體型。圖3舉例說明這樣的實(shí)施方案。原始樣本分布的不平衡(如在3B和3D所見)被利用,并且差分?jǐn)U增證實(shí),α等位基因被取相或與Pa的Y ’等位基因組合在一起,和α ’在Pb上取相,與Y組合在一起(3Ε)。進(jìn)一步地,實(shí)施方案不限于單倍體樣本,而是當(dāng)采用二倍體樣本(例如配對的染色體、DNA插入、YACs、BACs、粘粒、F粘粒(fosmids)等)或單倍體樣本(例如來自精子、卵子、完整的水泡樣胎塊(hydatiform mole)等的遺傳互補(bǔ))時有效。
[0006]發(fā)現(xiàn)從通過實(shí)踐本文描述的方法提供的基因組中的等位基因取相獲得的信息,在一般性研究和發(fā)現(xiàn)努力以及例如疾病檢測、治療和用于降低移植排斥反應(yīng)的HLA相容性的更高信心方面具有用途。例如,已知的單體型可能與藥物代謝、藥物發(fā)現(xiàn)、疾病狀態(tài)、癌癥、障礙、移植排斥反應(yīng)的風(fēng)險和指定極少數(shù)的個性化的衛(wèi)生保健計(jì)劃相關(guān)。的確,關(guān)于個性化的衛(wèi)生保健,一旦受試者的個人單體型為已知,那么受試者的特定疾病相關(guān)性和治療選擇可專門地進(jìn)行設(shè)計(jì),以滿足所述受試者的需要。
[0007]本公開的一個實(shí)施方案包括用于通過提供部分樣品(在核酸樣品中包含關(guān)注的兩個或更多個序列之間可檢測的不平衡),并基于所述可檢測的不平衡測定核酸樣品的單體型,測定核酸樣品的單體型的方法。在一些實(shí)施方案中,核酸樣品來自基因組或其片段,其中所述基因組源于一個或多個細(xì)胞,例如約1-100個細(xì)胞。在一些實(shí)施方案中,核酸樣品來自哺乳動物,優(yōu)選地來自人。在其它的實(shí)施方案中,核酸樣品來自非人哺乳動物、植物或病毒。在一些實(shí)施方案中,核酸樣品包含關(guān)注的序列的野生型序列,而在其它的實(shí)施方案中,核酸樣品包含關(guān)注的序列的變異序列。在一些實(shí)施方案中,關(guān)注的序列包含關(guān)注的一個序列的野生型序列和關(guān)注的另一個序列的變異序列或其組合。在一些實(shí)施方案中,變異序列選自單核苷酸多態(tài)性、拷貝數(shù)目變異體、基因組插入和基因組缺失。在一些實(shí)施方案中,樣品中關(guān)注的兩個或更多個序列之間可檢測的不平衡通過熒光進(jìn)行測定。在一些實(shí)施方案中,樣品中關(guān)注的兩個或更多個序列之間可檢測的不平衡通過核酸測序技術(shù)、通過例如在微陣列實(shí)施的基因分型技術(shù)或通過定量聚合酶鏈反應(yīng)進(jìn)行測定。
[0008]本公開的一個實(shí)施方案包括制備用于單體型測定的部分的方法,所述方法包括提供包含染色體組分的核酸樣品,并把染色體組分不對稱地分布成多個部分,從而制備用于單體型測定的部分。在一些實(shí)施方案中,染色體組分的不對稱分布包括把不等量的染色體組分遞送至多個部分中的不同部分中。在一些實(shí)施方案中,不對稱地分布的染色體組分的比例與初始細(xì)胞群體中的染色體組分的比例不同。在一些實(shí)施方案中,染色體組分的不對稱分布包括在多個部分中的不同部分中差異性地降解染色體組分。在一些實(shí)施方案中,染色體組分的不對稱分布包括在多個部分中的不同部分中差異性地?cái)U(kuò)增染色體組分。在一些實(shí)施方案中,核酸樣品來自哺乳動物,優(yōu)選地來自人。在其它的實(shí)施方案中,核酸樣品來自非人哺乳動物、植物或病毒。在一些實(shí)施方案中,核酸樣品來自多個細(xì)胞,例如約5-300個細(xì)胞或約10-100個細(xì)胞。在一些實(shí)施方案中,多個細(xì)胞為中期同步的,而在其它的實(shí)施方案中,多個細(xì)胞不為中期同步的。在一些實(shí)施方案中,染色體組分包含在不同位點(diǎn)的兩個或更多個等位基因,其中這些等位基因進(jìn)一步包含關(guān)注的一個或多個序列。
[0009]本公開的一個實(shí)施方案包括用于測定關(guān)注的兩個或更多個序列的取相(phasing)的方法,所述方法包括提供其中在所述部分中的染色體組分不對稱地分布的部分,從所述部分創(chuàng)建一個庫,對庫中關(guān)注的兩個或更多個序列檢測可檢測的信號,并基于可檢測的信號中的所述差異測定關(guān)注的兩個或更多個序列的取相。在一些實(shí)施方案中,可檢測的信號為熒光信號。在一些實(shí)施方案中,關(guān)注的兩個或更多個序列為在同一染色體上,并且進(jìn)一步地位于同一染色體的兩個或更多個不同位點(diǎn)上。在一些實(shí)施方案中,位于同一染色體的兩個或更多個不同位點(diǎn)由至少10000、至少100000、至少100000000或至少200000000個核苷酸隔開。在一些實(shí)施方案中,所述部分來自個體生物。在一些實(shí)施方案中,所述部分來自哺乳動物,例如來自人。在其它的實(shí)施方案中,所述部分來自非人哺乳動物、植物或病毒。在一些實(shí)施方案中,在提供所述部分用于相測定之前,測定所述部分中關(guān)注的兩個或更多個序列之間的不對稱度。在一些實(shí)施方案中,測定不對稱度包括所述部分的定量聚合酶鏈反應(yīng)分析。在一些實(shí)施方案中,測定不對稱度包括所述部分的微陣列分析。在一些實(shí)施方案中,測定不對稱度包括測定所述部分中關(guān)注的兩個或更多個序列之間的信噪比。在一些實(shí)施方案中,所述部分中關(guān)注的兩個或更多個序列之間的信噪比大于其它部分中的信噪比。在一些實(shí)施方案中,信噪比通過熒光檢測來測定。
[0010]本公開的一個實(shí)施方案包括用于測定兩個或更多個不同位點(diǎn)的等位基因的相的方法,所述方法包括提供在兩個或更多個不同位點(diǎn)包含等位基因的核酸分子的不對稱分布,其中不對稱分布包含多個部分,其中各獨(dú)立的部分包含等位基因的多份拷貝,和其中各獨(dú)立的部分包含不同數(shù)量的等位基因,區(qū)分存在于一個或多個獨(dú)立的部分中的核酸分子拷貝中的等位基因,評價存在于一個或多個獨(dú)立的部分中的不同數(shù)量的等位基因,并且對于兩個或更多個不同位點(diǎn)的等位基因自等位基因的區(qū)分和自不同數(shù)量的等位基因的評價測定取相。在一些實(shí)施方案中,評價包括檢測兩個或更多個不同位點(diǎn)的等位基因的讀取總數(shù)減去兩個或更多個不同位點(diǎn)的等位基因的熒光測序讀取數(shù)目的差值。在一些實(shí)施方案中,不對稱分布的核酸分子來自個體生物。在一些實(shí)施方案中,評價等位基因的不同數(shù)量包括測定兩個或更多個不同位點(diǎn)的等位基因的比例。在一些實(shí)施方案中,評價不同數(shù)量包括計(jì)數(shù)兩個或更多個不同位點(diǎn)的等位基因。在一些實(shí)施方案中,區(qū)分等位基因包括核酸測序技術(shù),而在其它的實(shí)施方案中,區(qū)分等位基因包括在微陣列是實(shí)施的基因分型技術(shù)。在特殊情況下,可使用核酸測序技術(shù)和基于陣列的基因分型技術(shù)。在一些實(shí)施方案中,兩個或更多個不同位點(diǎn)在同一染色體上并由至少10000個核苷酸分開。在一些實(shí)施方案中,位于同一染色體的兩個或更多個不同位點(diǎn)由至少100000、至少100000000或至少200000000個核苷酸分開。
[0011]定義` 本文使用的術(shù)語“單體型”指的是單倍體基因型、在染色體的不同位置或位點(diǎn)發(fā)現(xiàn)的等位基因或DNA序列的組合或組,其通常作為一個單位遺傳而得和例如在易位事件期間被連接。單體型可提供個體的獨(dú)特遺傳模式。單體型可依在給定組的位點(diǎn)之間發(fā)生的重組事件的數(shù)目而定對于一個位點(diǎn)、幾個位點(diǎn)或整個染色體進(jìn)行測定。等位基因或DNA序列不限于任何特定的類型,并且包括例如正常的基因序列(即非變異的)或變異的基因序列。例如單核苷酸多態(tài)性(SNPs)、短串聯(lián)重復(fù)序列(STRs)等可被考慮為變異的基因序列。術(shù)語“取相的等位基因”指的是在單染色體上的特定等位基因的分布。因此,兩個等位基因的“取相”可指表征或測定等位基因是位于單染色體上,還是位于兩個獨(dú)立的染色體(例如母系或父系遺傳的染色體)上。除非另作說明,“單體型”和“取相的等位基因”被認(rèn)為是同義詞。
[0012]本文使用的術(shù)語“分離的”、“純化的”或“純化”指的是自樣品去除組分(例如污染物)的產(chǎn)品或行為。例如,核酸通過去除污染宿主細(xì)胞或其它蛋白質(zhì)、用于自其存在的環(huán)境分離核酸的鹽、酶、緩沖劑等,被分離或分離遠(yuǎn)離細(xì)胞碎屑或分離試劑。
[0013]本文使用的術(shù)語“樣品”與其在生物學(xué)和化學(xué)領(lǐng)域的含義一致進(jìn)行使用。在某種意義上,其意指包括來自從任何來源比如生物和環(huán)境樣品得到的樣本或培養(yǎng)物的核酸。生物樣品可得自動物,所述動物包括但不限于人、非人靈長類動物和非人動物,所述非人動物包括但不限于脊椎動物比如嚙齒動物、綿羊、牛科動物、反芻動物、兔類動物、豬、山羊、馬、犬科動物、貓科動物、鳥類等。生物樣品包括但不限于流體比如血液制品、組織、細(xì)胞等。生物樣品可進(jìn)一步屬于植物來源,單子葉植物的或雙子葉植物的、落葉性或常綠的、草本或木本的,包括但不限于農(nóng)業(yè)植物、景觀植物、苗圃植物等。環(huán)境樣品可為細(xì)菌、病毒、真菌等起源的。優(yōu)選的樣品為真核生物起源的。基本上,研究者在測定取相的等位基因中關(guān)注的任何生物核酸樣品來源適用于本發(fā)明。樣品也可包括合成的核酸。核酸的衍生物或產(chǎn)品比如擴(kuò)增的拷貝或化學(xué)改性的種類也包括在內(nèi)。
[0014]本文使用的術(shù)語“核酸”例如可為核苷酸的聚合物或多核苷酸。該術(shù)語可用于指定單分子或分子的集合。核酸可為單鏈或雙鏈,并可包括編碼區(qū)和各種控制元件的區(qū)域、非編碼區(qū)、整個染色體、部分染色體、其片段和變體。
[0015]本文使用的術(shù)語“不對稱的”、“不平衡的”、“不等的”或“有偏倚的”,當(dāng)用于指類似項(xiàng)目的分布時,被認(rèn)為是同義詞,除非另外說明。所述術(shù)語指的是類似項(xiàng)目例如染色體或染色體組分的集合,其跨多個部分、等分試樣、亞組等分布,使得在兩個或更多個獨(dú)立的部分存在不同數(shù)量的類似項(xiàng)目。多個部分中的兩個或更多個獨(dú)立的部分可具有類似項(xiàng)目。然而,不是多個部分中的所有部分需要具有項(xiàng)目,相反一個或多個部分、等分試樣、亞組等可能沒有項(xiàng)目。獨(dú)立的部分關(guān)于存在的項(xiàng)目可為均勻的,或者作為選擇可在獨(dú)立的部分存在項(xiàng)目的不均勻集合,使得與一種或多種不同項(xiàng)目一起存在多個類似項(xiàng)目。類似項(xiàng)目可為基本上類似或相同的。例如,類似項(xiàng)目可為具有共有序列的染色體、具有共有序列的染色體的片段、具有共有序列的染色體的至少一部分的拷貝或具有共有序列的其它核酸分子。類似項(xiàng)目的不對稱或不平衡樣品可通過把樣品離散成其組分的比例與初始群體中的比例不相同的部分、等分試樣、亞組等進(jìn)行制備。類似項(xiàng)目的不對稱分布為例如兩個親代染色體貢獻(xiàn)的分布(例如一個母源染色體和一個父源染色體),這種分布導(dǎo)致部分中兩個親代染色體貢獻(xiàn)的不相等分布例如0.5:1、1:1.5、1:2、1:3、2:3等比例。部分、等分試樣、亞組等可為例如管、孔(例如在微量滴定板中)、微陣列的特征、表面或基底的斑點(diǎn)、珠或顆粒等。
[0016]應(yīng)該理解,樣品的不對稱、不平衡或偏倚可為相對特征,或者可以相對的方式測定。例如,樣品可具有染色體或染色體組分的不對稱、不平衡或偏倚,其特征為染色體或染色體組分的量不同于存在于所述樣品源自的個體、組織或細(xì)胞的染色體或染色體組分的量。這樣,應(yīng)該理解,樣品源自的個體、組織或細(xì)胞可具有至少一種染色體或染色體組分?jǐn)?shù)量的天然存在的不對稱、不平衡或偏倚,而樣品可偏倚以具有至少一種染色體或染色體組分?jǐn)?shù)量的非天然存在的不對稱、不平衡或偏倚。
[0017]圖示
圖1顯示用于產(chǎn)生包含不平衡分布的父系和母系染色體組分的遺傳物質(zhì)池的實(shí)施方案。
[0018]圖2顯示來自父母兩者的染色體混合群體的實(shí)例和測定混合群體的單體型的挑戰(zhàn)。[0019] 圖3顯示示例性的染色體群體及其在測定單體型方面的用途。
[0020]圖4證實(shí)對于實(shí)踐本文描述的方法可得到的包括遺傳物質(zhì)的不平衡分布的示例性基因分型信息。
[0021]圖5證實(shí)與自給定的試驗(yàn)產(chǎn)生有用信息的可能性(即可測量差異的概率)相比較的示例性加載百分?jǐn)?shù)(預(yù)期加載的目標(biāo)分子數(shù)目/試驗(yàn)孔或位置X 100)。
[0022]圖6證實(shí)用于產(chǎn)生具有兩個代表性等位基因即等位基因A和等位基因B的遺傳物質(zhì)的不平衡分布的偏倚擴(kuò)增方法的實(shí)施方案。
[0023]圖7證實(shí)用于產(chǎn)生遺傳物質(zhì)的不平衡分布的模板偏倚降解的方法的實(shí)例。
[0024]圖8證實(shí)用于產(chǎn)生具有兩個代表性的等位基因即等位基因A和等位基因B的遺傳物質(zhì)的不平衡分布的偏倚降解的方法的實(shí)施方案。
[0025]圖9顯示正常二倍體個體的突光原始強(qiáng)度(raw intensities)的示例性散點(diǎn)圖和本文描述的方法把雜合SNPs拆分為其單倍體組分的能力。
[0026]圖10顯示從源自圖9的二倍體樣品的6個12倍稀釋的樣品任意指定A (在Y軸)和B(在X軸)的兩個位點(diǎn)的熒光原始強(qiáng)度的一系列示例性散點(diǎn)圖。
[0027]圖11顯示來自從頂面板(top panel)的細(xì)胞HG01377 (頂部)和NA18507 (底部)和底面板(bottom panel)的融合的單體型模塊(blocks)(分別為HG01377和NA28507)衍生的不平衡遺傳物質(zhì)池的比對區(qū)段(aligned segments)。
[0028]圖12顯示來自從細(xì)胞NA18506 (頂面板)和底面板的合并單體型域衍生的正常個體的整個人基因組的不平衡遺傳物質(zhì)池的匹配段。
[0029]實(shí)施方案的詳述
本公開的實(shí)施方案提供用于測定生物樣品的單體型的方法和系統(tǒng)。特定的實(shí)施方案提供用于基因組的遠(yuǎn)程單倍體分型的方法。單倍體分型基因組的重要性例如在有助于和驅(qū)動個性化的衛(wèi)生保健系統(tǒng)以及有助于成功的器官和組織移植方面具有深遠(yuǎn)的意義。
[0030]常規(guī)的基因分型方法(例如微陣列、測序、PCR等)在測定單染色體的單體型中,特別是當(dāng)關(guān)注的序列位于染色體上距離很遠(yuǎn)處時面臨困難。例如,微陣列和PCR分析如目前實(shí)踐的那樣一般不提供單倍體分型信息,只是序列的存在或不存在。第一代測序技術(shù)如目前實(shí)踐的那樣,比如基于毛細(xì)管的序列分析方法,可以能夠依系統(tǒng)而定檢測近端例如1000bp或者更少范圍內(nèi)的關(guān)注的序列。下一代測序如目前實(shí)踐的那樣,落在關(guān)于測定遠(yuǎn)程單體型的下一代測序(NGS)方法的可量測性之間的某處,已經(jīng)受到相對短的測序讀取(例如依系統(tǒng)而定幾百個堿基對)的限制。本文描述的實(shí)施方案通過在基因組中提供相鄰或近端和遠(yuǎn)端或遠(yuǎn)程等位基因的取相,填補(bǔ)由這些以上提及的技術(shù)留下的缺口。的確,本文描述的實(shí)施方案特別適合于鑒定遠(yuǎn)程單體型。這些方法特別是很好地適合于鑒定具有長于以所使用的特定技術(shù)檢測的核酸片段長度的范圍的單體型。例如,本文闡述的方法的基于NGS的實(shí)施方案可用于鑒定具有長于所采用的NGS技術(shù)的讀取長度的范圍的單體型。發(fā)現(xiàn)從通過實(shí)踐本文描述的方法提供的取相等位基因獲得的信息,在例如疾病檢測和個性化的衛(wèi)生保健(PHC)方面具有用途。例如個體的單體型可能與藥物代謝、藥物發(fā)現(xiàn)、疾病狀態(tài)、癌癥、障礙、移植排斥反應(yīng)的風(fēng)險等相關(guān)。的確,關(guān)于個性化的衛(wèi)生保健,一旦受試者的取相的單體型為已知,那么受試者的特定疾病相關(guān)性和治療選擇可進(jìn)行專門設(shè)計(jì),以滿足所述受試者的需要。[0031]本文描述的實(shí)施方案與其它用于單倍體分型的方法相比較提供更好的選擇。本公開提供例如易于使用、適合于高通量應(yīng)用和具有取相遠(yuǎn)程等位基因的能力的方法,而不管樣品為單倍體還是二倍體,和不管樣品對于關(guān)注的等位基因是純合的還是雜合的。
[0032]在圖1中舉例說明產(chǎn)生用于單體型測定的遺傳物質(zhì)池的實(shí)施方案。產(chǎn)生用于很大一部分基因組或染色體,具有不平衡分布的母系和父系染色體組分的遺傳物質(zhì)池的方法的一個實(shí)施方案包括利用泊松隨機(jī)性(Poisson randomness),以產(chǎn)生遺傳物質(zhì)的不相等分布(左箭頭)。例如,正常的DNA樣品具有1:1比例的母系:父系染色體。該樣品可通過實(shí)踐本文公開的方法分開,以產(chǎn)生除了 1:1比例之外例如至少1:0.5、至少1:2、至少1:3、至少1:4、至少2:1、至少2:3等的母系:父系染色體(或反之亦然),因此為不平衡分布的染色體。
[0033]在圖2和3中舉例說明包括利用泊松隨機(jī)性,以產(chǎn)生不相等分布的遺傳物質(zhì)的本公開的實(shí)施方案。基因型分型樣本可由來自雙親兩者的染色體的混合群體組成(圖2A)。盡管可能對患者測定基因型(圖2B),這種類型的分析將不顯示雜合性等位基因如何在染色體上組在一起。在該實(shí)施例中,不知親代A (Parent A)是否在基因α和Y提供示例性的(_)等位基因兩者,和親代B (Parent B)提供示例性的(+)等位基因(圖2C),或者是否它們?yōu)榛旌系?圖2D)。測定單體型的一種方法包括把每一個染色體分離到其自己的隔室(圖3D),并將其作為單獨(dú)的樣品處理。這樣,每一個樣品在所有的等位基因?yàn)榧兒系?,因?yàn)閮H在隔室中存在每個基因的一個拷貝。然而,該方法的不利條件是將存在許多空的試驗(yàn)孔(圖3C)(然而,空孔對于用作陰性試驗(yàn)對照可為有利的),并且來自具有單染色體的孔的信號可能很低。本文闡述的方法以較高濃度和不對稱分布在那些部分提供以部分比如試驗(yàn)孔或隔室存在的染色體樣品。只要例如與顯示相等數(shù)目的親代染色體的圖3A形成對比,存在來自每個雙親的不等數(shù)目的染色體(或具有源于染色體的序列的核酸分子)(圖3B),來自具有更大數(shù)目的染色體的等位基因可呈現(xiàn)更高的檢測信號(例如熒光、發(fā)光等),并且從而相互關(guān)聯(lián),允許測定不同染色體的單體型(圖3E)。
[0034]可以預(yù)見的是,實(shí) 踐本分開的具體方法所估計(jì)的改進(jìn)可導(dǎo)致與現(xiàn)有技術(shù)相比較,加載密度增加至2-3x和來自給定試驗(yàn)的總可用數(shù)據(jù)增加至5-6x (圖4和5)。例如,圖4A證實(shí)可自標(biāo)準(zhǔn)稀釋法測定得到的基因型分型信息的程度,其中染色體在測定中被稀釋至單分子水平。僅有其中存在一個染色體的那些試驗(yàn)孔將提供有用的數(shù)據(jù),例如Pa=l,Pb=0或反之亦然。相反,有用信息量的大幅度增加起因于實(shí)踐本文描述的方法的實(shí)施方案,因?yàn)椋纾墒褂萌魏螖?shù)目的染色體/每體積,只要兩個不同等位基因之間的檢測差異大于測量閾值 Θ (theta)(圖 4B)。
[0035]因?yàn)閷?shí)踐所公開的方法的實(shí)施方案可導(dǎo)致對于給定數(shù)目的部分加載密度較大和每體積或部分產(chǎn)生數(shù)據(jù)的概率較高,單倍體(即單倍體基因組)的覆蓋范圍與實(shí)踐其它方法比如0-1稀釋法相比較應(yīng)更高(圖5)。例如,可在24%加載下發(fā)現(xiàn)對于O或I稀釋情況下(例如如在圖5A中舉例說明的那樣)的最大值,僅有36%的試驗(yàn)孔產(chǎn)生有用的數(shù)據(jù)?;蛘撸瑘D5B證實(shí),如本文公開的不對稱加載方法可提供最多100%加載,76%的試驗(yàn)孔產(chǎn)生有用的數(shù)據(jù)??紤]到檢測系統(tǒng)的分辨率或靈敏度影響需要提供有用數(shù)據(jù)的試驗(yàn)部分的數(shù)目。目標(biāo)分子(即染色體組分)包括整個染色體、染色體的片段、克隆的染色體插入物比如于BACs> YACs> MACs> F粘粒、粘粒等中發(fā)現(xiàn)的那些。進(jìn)一步地,所公開的方法與0_1稀釋法相比較,可有效地提供給較少的部分同等覆蓋范圍的單倍體。
[0036]在一個實(shí)施方案中,偏倚或不平衡的擴(kuò)增方法包括用于擴(kuò)增等位基因,具有不同效率的引物和/或擴(kuò)增條件,使得一組取相的等位基因在擴(kuò)增的群體中是可區(qū)別的,考慮用于產(chǎn)生遺傳物質(zhì)的不平衡分布(圖1,中間箭頭)。偏倚或不平衡的擴(kuò)增比如偏倚的或不平衡的聚合酶鏈反應(yīng)(PCR),可通過例如阻斷(部分地)其中一個等位基因的擴(kuò)增,用于產(chǎn)生兩個等位基因的不平衡分布。例如一個實(shí)施方案包括使用阻斷探針,比如在Rex etal.(2009, J.Virol.Meth.158:24-29)和 Senescau et al.(2005, J.Clin.Micr0.43:3304-3308)中描述的探針(其兩者通過引用以其全部結(jié)合到本文中)。例如阻斷探針可為其中一個等位基因的補(bǔ)體(圖6A,頂端反應(yīng);阻斷探針顯示跨越A核苷酸),具有與PCR的延伸溫度(extension temperature)適配的Tm,和具有防止其通過DNA聚合酶延長的3’阻斷基團(tuán)。一旦DNA聚合酶(例如非鏈置換(non-strand displacing))遇到探針,鏈延長(strand elongation)停止,導(dǎo)致最終PCR產(chǎn)物混合物中的一個等位基因表現(xiàn)度減少。相反,其它等位基因的鏈延長將不會由于存在阻斷探針受到阻礙,從而導(dǎo)致最終PCR產(chǎn)物混合物中的所述等位基因表現(xiàn)度正常,從而造成PCR產(chǎn)物混合物中的一個等位基因的表現(xiàn)度偏倚(圖6A,等位基因B比等位基因A更多)。
[0037]在另一個實(shí)施方案中,偏倚或不平衡的擴(kuò)增方法包括熱穩(wěn)定的MutS蛋白和等位基因-特異性探針,例如等位基因特異性阻斷探針,這種探針在擴(kuò)增反應(yīng)中產(chǎn)生不平衡的遺傳物質(zhì)池(圖6B)。MutS為DNA錯配結(jié)合蛋白,其在Mg2+存在下強(qiáng)烈結(jié)合于異源雙鏈 DNA (Lishanski et al., 1994,Proc.Natl.Acad.Sc1.91:2674-2678;Stanislawska-Sachadyn and Sachadyn, 2005, Acta Biochim.Pol.52:575-583;其兩者通過引用以其全部結(jié)合到本文中)。例如,為一個等位基因的補(bǔ)體的等位基因特異性阻斷探針可退火以與模板DNA分子結(jié)合,與兩個等位基因模板形成同源雙鏈DNA和異源雙鏈DNA兩者。MutS可優(yōu)先結(jié)合于已與非補(bǔ)體等位基因配對的阻斷探針(圖6B頂端反應(yīng);異源雙鏈形成顯示在B等位基因中和MutS結(jié)合作為圓形顯示在底端反應(yīng)中)。通過使用鏈置換DNA聚合酶(例如phi29 DNA聚`合酶、BST DNA聚合酶大片段、Vent? (外-)DNA聚合酶、Deep Vent? (外-)DNA聚合酶、9°Nm DNA聚合酶等),可去除未通過MutS結(jié)合的探針(例如通過使用抗-MutS的陰性抗體選擇),以允許完美匹配的模板分子的鏈延長,而MutS-復(fù)合的探針依然存在于適當(dāng)?shù)奈恢?,從而停止錯配模板分子的鏈延長,從而在最終產(chǎn)物混合物中產(chǎn)生等位基因的不平衡表現(xiàn)度(圖6B,等位基因A比等位基因B更多)。
[0038]在另一個實(shí)施方案中,偏倚或不平衡的擴(kuò)增方法通過圖6C舉例說明。在圖6C (頂部組的等位基因)中,短探針可雜交至位點(diǎn)的任何一側(cè)。對于那些匹配特定等位基因的探針,可發(fā)生探針的延伸和連接。然而,當(dāng)探針和等位基因?yàn)榉峭磿r,沒有或存在探針的最小延伸和連接(來自頂部第二組等位基因)。在延伸和連接后,可升高溫度,使得已經(jīng)延伸和連接的那些探針將保持雜交至模板,而沒有延伸的短探針將自模板釋放(第三組等位基因)。雜交和延伸的探針可交聯(lián)至模板,從而阻斷PCR擴(kuò)增,導(dǎo)致一個等位基因比另一個更多(在這種情況下,等位基因B比等位基因A更多)。
[0039]在另一個實(shí)施方案中,偏倚或不平衡的擴(kuò)增方法通過圖6D舉例說明。圖6D顯示等位基因特異性的PCR的使用,其中引物之一在靠近多形態(tài)位點(diǎn)(即SNP或其它多態(tài)性的位置)于其3’末端退火。錯配的引物將不引發(fā)復(fù)制,而匹配的引物可以復(fù)制,這樣導(dǎo)致一個等位基因比另一個更多(圖6D,等位基因A比等位基因B更多)(Newton, 1989,Nucl.Acid.Res.17:2503-2516;通過引用以其全部結(jié)合到本文中)。
[0040]在一個實(shí)施方案中,產(chǎn)生遺傳物質(zhì)的不平衡分布包括等位基因的偏倚降解(圖1,右箭頭)。例如,模板可在引物之間的兩個位點(diǎn)(例如示例性位點(diǎn)包括ATACC和TTGTC)上于等位基因-特異性位置消化,使得僅有一個等位基因(例如未消化的等位基因)擴(kuò)增,并且擴(kuò)增鏈上的所有等位基因因此共享相同的相(圖7)??砂褬悠贩殖蓭讉€獨(dú)立的部分(A、B和C)。一些位點(diǎn)在等位基因靶標(biāo)(A和G)為雜合的(7A),其中在降解之后生成的群體將超過代表的單一單倍體組分(在該實(shí)例中為位點(diǎn)TTGTC和等位基因G),從而允許區(qū)域中的所有等位基因在例如把單獨(dú)的反應(yīng)索引和排序后取相。一些位點(diǎn)在等位基因靶標(biāo)(等位基因T)為純合的(例如7B和C),或者在兩個單倍體染色體貢獻(xiàn)之間產(chǎn)生同等擴(kuò)增的群體(7B)或者很少甚或沒有擴(kuò)增(7C,等位基因C)。
[0041]圖8證實(shí)用于偏倚降解方法的幾個示例性實(shí)施方案。作為圖6B的示例性修飾,圖8A證實(shí),完全匹配的雙鏈分子可用例如雙鏈特異性核酸酶DSN選擇性地破壞,而MutS-結(jié)合的錯配雙鏈被保護(hù)免于裂解。圖8A證實(shí)熱穩(wěn)定的MutS蛋白(圓形)、等位基因特異性探針和雙鏈特異性核酸酶(剪刀)的使用,其中雙鏈特異性核酸酶可對等位基因B超過對等位基因A的偏倚擴(kuò)增裂解同源雙鏈DNA。
[0042]在另一個實(shí)施方案中,偏倚降解方法包括對于單核苷酸錯配具有強(qiáng)的靶標(biāo)位點(diǎn)傾向的曬菌體 Mu 轉(zhuǎn)座子(Yanagihara and Mizuuchi, 2002, Proc.Natl.Acad.Sc1.99:11317-11321;通過引用以其全部結(jié)合到本文中)和等位基因特異性探針。Mu本身可伴隨錯配優(yōu)先插入異源雙鏈DNA中,使得其在例如庫制備方案方面的用途(圖SB,作為圓形顯示的Mu轉(zhuǎn)座子)可用于使錯配等位基因的模板分子破裂,而完美匹配的等位基因的模板分子保持完整并用作PCR擴(kuò)增的模板,從而產(chǎn)生偏倚或不平衡的基因池用于單體型測定(圖8B,等位基因A比等位基因B更多)。
[0043]在另一個實(shí)施方案中,偏倚或不平衡的擴(kuò)增方法通過圖SC舉例說明,其為圖SB的修飾。在圖8C中,生物素化的等 位基因特異性探針(對于B)被顯示雜交于模板DNA。鏈霉抗生物素轉(zhuǎn)座子融合蛋白(例如如在來自Epicentre Biotechnologies的NextEra DNA樣品制備試劑盒中舉例說明的用圓形指定的Mu轉(zhuǎn)座子)可通過鏈霉抗生物素-生物素相互作用募集到雙鏈雜交位點(diǎn),從而導(dǎo)致完美匹配的等位基因破裂和一個等位基因比另一個更多(圖8C,等位基因B比等位基因A更多)。
[0044]在另一個實(shí)施方案中,偏倚降解方法可包括限制性內(nèi)切核酸酶,如在圖8D中證實(shí)的那樣。例如,可選擇一種或多種限制性內(nèi)切核酸酶,使得存在約一個限制位點(diǎn)/每個擴(kuò)增子對(例如通過靶向已知的雜合位點(diǎn)或通過基于擴(kuò)增子長度的統(tǒng)計(jì)學(xué))。包含靶向位點(diǎn)的擴(kuò)增子可被降解(即通過在圓形指定的限制性內(nèi)切核酸酶受到限制),使得擴(kuò)增為不可能的。未消化的等位基因可優(yōu)先擴(kuò)增,產(chǎn)生表現(xiàn)度不等的等位基因用于單體型測定(圖8D,等位基因A比等位基因B更多)。
[0045]本公開提供用于測定基因組的單體型的方法。在一個實(shí)施方案中,本公開的方法自受試者的二倍體或單倍體基因組樣品產(chǎn)生遺傳物質(zhì)(即染色體組分)的不平衡分布。用標(biāo)準(zhǔn)方法(例如微陣列、測序、PCR、基于凝膠等)對不平衡的遺傳物質(zhì)進(jìn)行基因型分型,使得能夠?qū)τ谶h(yuǎn)程單倍體分型在大的基因組區(qū)域測定單體型。例如,當(dāng)對于遺傳物質(zhì)的不對稱或不平衡分布采用本文描述的方法用于單倍體分型時,如果特定基因組區(qū)域中關(guān)注的一組引導(dǎo)序列比另一組等位基因擴(kuò)增信號強(qiáng)度更高(3x)(例如通過微陣列)或讀取更多(3x)(測序),那么推斷兩個相應(yīng)的組對應(yīng)于兩個不同的單體型。不平衡的遺傳物質(zhì)池中關(guān)注的每一個引導(dǎo)序列的相對量一旦測定,與自正常二倍體基因組或匯集的正?;蚪M測定的量進(jìn)行比較,從而測定受試樣品中的異?,F(xiàn)象。
[0046]本公開提供包括樣品的不相等、不平衡、偏倚或不對稱分布,用于單體型測定的方法。不相等分布可為例如稀釋、不對稱PCR、靶標(biāo)降解等的結(jié)果。特別是,本文描述的實(shí)施方案在各部分比如基底上的測試位置(例如板上的孔、玻片上的區(qū)域、多個毛細(xì)管、柔性帶中/上的孔等)之間提供分布不均的來自受試者的遺傳物質(zhì)。在某些實(shí)施方案中,樣品的遺傳物質(zhì)的不均勻分布代表位于基底上一個或多個測試位置的染色體的分布不等。考慮一些測試位置不含遺傳物質(zhì),并且發(fā)現(xiàn)這些位置在如在圖3C中舉例說明的試驗(yàn)中作為陰性對照品具有用途?;装ǖ幌抻谖㈥嚵谢妆热缍趸杌蚋呙芏人芰喜F?、芯片等、板比如96、384、1536孔測定板、毛細(xì)管例如如用于流過PCR的毛細(xì)管、柔性的高通量測試條(例如Douglas Scientific的Array Tape ? )、珠粒、納米顆粒等。本文描述的方法不受在其上或其中實(shí)施測試的基底的限制。
[0047]本文描述的方法的特定實(shí)施方案可用于例如測定染色體上彼此近端和遠(yuǎn)端兩者的關(guān)注序列的單體型。考慮關(guān)注的序列不被任何特定的距離分開,例如關(guān)注的序列可在染色體上為彼此相鄰或者近端的。相反,考慮關(guān)注的序列在染色體上為彼此遠(yuǎn)端分離的或遠(yuǎn)程的。的確,實(shí)踐本文描述的實(shí)施方案在測定遠(yuǎn)程單體型時可為特別有益的。關(guān)注的序列之間的距離不打算限制所述方法,例如關(guān)注的序列可由至少100、200、300、400、500、750或至少1000個堿基對分開。然而,實(shí)施方案發(fā)現(xiàn),當(dāng)關(guān)注的序列在染色體上間隔離得很遠(yuǎn),并且由例如至少10000、至少100000、至少1000000、至少10000000、至少100000000、至少150000000、至少200000000、至少247000000或者更多個堿基對分開時,對測定其單體型特別有用。這樣,本文描述的實(shí)施方案可提供特別適合于個體基因組的遠(yuǎn)程單倍體分型的方法,而不管被提供的用于測定的樣品是單倍體還是二倍體。
[0048]在本公開的實(shí)施方案中,提供用于測定單體型,特別是位于染色體上遠(yuǎn)側(cè)的關(guān)注序列的方法。在一些實(shí)施方案中,關(guān)注的序列為單核苷酸多態(tài)性,或SNPs。在一些實(shí)施方案中,SNPs為彼此相鄰的或接近的,而在其它的實(shí)施方案中,SNPs為彼此離得很遠(yuǎn)或遠(yuǎn)程的。在一些實(shí)施方案中,關(guān)注的序列為基因組中序列的插入或缺失,或者插入/缺失(indels)。在一些實(shí)施方案中,關(guān)注的序列為基因組拷貝數(shù)目變異,或者CNVs。在其它的實(shí)施方案中,關(guān)注的序列為等位基因,或者位于染色體上特定位置的基因或序列的替代形式。在一些實(shí)施方案中,等位基因?yàn)橐吧突蛘5淖R別序列,而在其它的實(shí)施方案中,等位基因與野生型相比較可隱匿一個或多個突變,比如SNPs、CNVs、插入/缺失等。
[0049]這樣的突變可被確定為與疾病狀態(tài)比如癌癥、遺傳疾病等直接相關(guān)。突變的等位基因?qū)τ谘芯空呔哂刑貏e意義,并且實(shí)踐本公開的實(shí)施方案可在使得研究者能夠研究等位基因突變及其單體型方面提供有價值的工具。單體型在定義個體的二倍體基因組的基因組成方面是有價值的。單倍體分型信息可導(dǎo)致更多的理解,并且在許多科學(xué)研究領(lǐng)域發(fā)現(xiàn)具有更廣泛的用途,這些領(lǐng)域包括但不限于藥物代謝、藥物發(fā)現(xiàn)、個性化的衛(wèi)生保健計(jì)劃、移植成功群體遺傳學(xué)的HLA分型、復(fù)雜疾病連鎖、遺傳人類學(xué)、疾病和癌癥的醫(yī)學(xué)遺傳學(xué)、癌癥和其它疾病的結(jié)構(gòu)變化、等位基因的特異性表達(dá)和修飾比如等位基因特異性甲基化模式以及更始基因組(de novo genome)組裝。當(dāng)用于單倍體分型的關(guān)注的等位基因來自小的基因組區(qū)域時,包括偏倚擴(kuò)增和偏倚降解的實(shí)施方案是特別有利的。這樣,臨床應(yīng)用比如其中需要超過幾千個堿基或者一個或多個基因組區(qū)域的單體型測定的HLA基因型分型(例如HLA-A、HLA-B、HLA-C、HLA-DRB1、HLA-DQB1、HLA-DQAI 等),將極大地得益于實(shí)踐本文公開的方法。
[0050]把等位基因分配到染色體(即單倍體分型)的能力強(qiáng)大,因?yàn)槠淇衫缤ㄟ^提供關(guān)于基因組中重組事件的信息來提供臨床相關(guān)性的信息。這種信息對于確定引起疾病的突變的位置可為重要的,并可有助于確定連鎖不平衡,或者基因組中兩個多態(tài)性的存在之間的統(tǒng)計(jì)關(guān)聯(lián)性,此為疾病基因組廣泛疾病關(guān)聯(lián)性研究的一種關(guān)鍵特性。例如,如果兩種多態(tài)性之間的關(guān)聯(lián)性(即連鎖不平衡)高,已知一種多態(tài)性(即SNP)的基因型可有助于預(yù)測另一種多態(tài)性(即SNP)的基因型。通過測定其單體型更完全匹配人白細(xì)胞抗原(HLA)的能力將極大地改善例如移植接受者的臨床結(jié)果(Crawford and Nickerson, 2004, Ann.Rev.Med.56:303-320,通過引用以其全部結(jié)合到本文中)。例如,通過實(shí)踐本文公開的方法,移植接受者和潛在供者可沿著主要組織相容性復(fù)合體對多個標(biāo)記進(jìn)行基因型分型,并可自產(chǎn)生的數(shù)據(jù)測定單體型。這樣的匹配的實(shí)例可見于本文公開的實(shí)施例中。這樣的匹配可提供移植接受者與供者之間高度準(zhǔn)確的HLA匹配,導(dǎo)致比不是如此匹配的患者與供者更好的移植結(jié)果。
[0051]另外,存在一些疾病,其中單體型而不是在特定位點(diǎn)的基因型可預(yù)測疾病的嚴(yán)重性,這樣準(zhǔn)確的單體型將不僅對于確定具體患者的疾病嚴(yán)重性具有廣泛用途,而且也提供給臨床醫(yī)生基于診斷和/或預(yù)后確定有效的治療選擇方面的信息,因?yàn)椴煌闹委熯x擇可能與不同的疾病狀態(tài)和/或嚴(yán)重性水平相關(guān)。例如,特定的鐮狀細(xì)胞性貧血β_球蛋白位點(diǎn)單體型與不太嚴(yán)重的鐮狀細(xì)胞性貧血有關(guān),并且ILlO啟動子區(qū)域的單體型與移植物抗宿主病和接受細(xì)胞移植的患者死亡的發(fā)生率較低有關(guān)。這樣,提供基因組樣品的單倍體分型的方法可對例如疾病相關(guān)性的研究、疾病診斷和預(yù)后實(shí)踐以及治療方案的應(yīng)用具有很大影響。然而,單倍體分型也在農(nóng)業(yè)和其它園藝領(lǐng)域具有重要意義,特別是在其中疾病或有利的性質(zhì)可能與動物或植物中的特定單體`型有關(guān)的牲畜飼養(yǎng)和農(nóng)作物方面。
[0052]本文提供的實(shí)施方案描述用于測定樣品中取相的等位基因的方法。通常,樣品包括核酸樣品。在一些實(shí)施方案中,核酸樣品源于體液,例如來自受試者的血液、痰液、尿液、脊髓液等。在其它的實(shí)施方案中,生物樣品源于固體,例如來自受試者的組織、活組織切片檢查、細(xì)胞刮取、細(xì)胞學(xué)或細(xì)胞樣品等。在一個實(shí)施方案中,生物樣品為純化的單染色體或其片段,或者例如在粘粒、F粘粒、質(zhì)粒、酵母人工染色體(YAC)、細(xì)菌人工染色體(BAC)、哺乳動物人工染色體(MAC)、植物克隆系統(tǒng)(例如農(nóng)桿菌iAgrobacterium tumefacians)T-DNA克隆系統(tǒng)、雙元載體克隆系統(tǒng)等)或其片段中的DNA插入等。在優(yōu)選的實(shí)施方案中,生物樣品為如在一種或多種細(xì)胞中發(fā)現(xiàn)的二倍體DNA樣品。然而,本文描述的方法的實(shí)施方案不限于二倍體樣品,因?yàn)閱伪扼w樣品(例如源于卵子、精子、水泡樣胎塊(hydatiformmole)的核酸,和機(jī)械分開和/或分離的染色體、其片段、克隆的DNA片段等)同樣適用于實(shí)踐本文描述的方法。
[0053]在一個實(shí)施方案中,樣品為細(xì)胞樣品或組織樣品。細(xì)胞或組織樣品可來自任何來源,例如來自解離組織的細(xì)胞、來自血液或其它體液的細(xì)胞、來自細(xì)胞學(xué)樣本的細(xì)胞、來自非人動物的細(xì)胞、來自植物的細(xì)胞等。在優(yōu)選的實(shí)施方案中,細(xì)胞為哺乳動物起源的,優(yōu)選地為人起源的。然而,本文描述的方法不限于細(xì)胞樣品的來源。在一些實(shí)施方案中,用于實(shí)踐本文描述的方法的基因組材料源于多個細(xì)胞。在一些實(shí)施方案中,多個細(xì)胞為至少2-1000個細(xì)胞之間、至少5-500個細(xì)胞之間、至少10-300個細(xì)胞之間、至少10-100個細(xì)胞之間。除非特別相反地指出,實(shí)踐本文闡述的方法可采用本領(lǐng)域技術(shù)范圍內(nèi)的病毒學(xué)、免疫學(xué)、微生物學(xué)、分子生物學(xué)和DNA重組技術(shù)的常規(guī)方法。這種技術(shù)在以下文獻(xiàn)中得到充分說明:參見例如1995, Ausubel et al.,精編分子生物學(xué)實(shí)驗(yàn)指南(Short Protocols inMolecular Biology),(第3版),Wiley & Sons; 2001, Sambrook and Russell,分子克隆:實(shí)驗(yàn)室手冊(Molecular Cloning: A Laboratory Manual)(第3版);1982, Maniatuset al.,分子克隆:實(shí)驗(yàn)室手冊(Molecular Cloning: A Laboratory Manual) ; DNA 克隆:一種實(shí)用方法(DNA Cloning: A Practical Approach),第 I 和 II 卷(D.Glover 編輯);1984,寡核苷酸合成(Oligonucleotide Synthesis) (N.Gait 編輯);1985,核酸雜交(Nucleic Acid Hybridization) (B.Hames 和 S.Higgins 編輯);1986,動物細(xì)胞培養(yǎng)(Animal Cell Culture) (R.Freshney 編輯);1984, Perbal,分子克隆的實(shí)用指南(A Practical Guide to Molecular Cloning)?;蚪M材料可通過本領(lǐng)域已知的方法收獲,并且本文描述的方法不一定限于用于分離基因組材料的任何具體方法。技術(shù)人員應(yīng)理解,對于這種分離存在大量的市售和自產(chǎn)的(homebrew)替代品。
[0054] 在一個實(shí)施方案中,由受試者提供用于單倍體分型的樣品。受試者可為對希望測定來自所述實(shí)體的單體型的研究者關(guān)注的任何生物實(shí)體。這樣,用于測試的樣品不一定限于特定受試者,并且受試者可為例如動物或植物起源的。例如,提供樣品的受試者可為動物(人或非人)或植物,例如相關(guān)的經(jīng)濟(jì)作物等。在優(yōu)選的實(shí)施方案中,受試者為人。在其它優(yōu)選的實(shí)施方案中,受試者為經(jīng)濟(jì)相關(guān)的動物或其衍生物。在其它的實(shí)施方案中,受試者為經(jīng)濟(jì)相關(guān)的植物或其衍生物。
[0055]通過實(shí)踐本公開的方法提供的不對稱分布的樣品易于應(yīng)用于下游應(yīng)用。在一些實(shí)施方案中,考慮在測序或其它儀器相關(guān)的單體型測定之前對樣品實(shí)施下游過程。在一些實(shí)施方案中,不對稱分布的樣品的等分試樣或部分用于制備群集(clustering)準(zhǔn)備下一代測序的DNA庫。例如通過在Nextera ? DNA樣品制備試劑盒(Nextera ? DNA SamplePrep Kit) (Epicentre? Biotechnologies, Madison WI)、GL FLX 欽庫制備試劑盒(GLFLX Titanium Library Preparation Kit) (454 Life Sciences, Branford CT)>SOLiD ?庫制備試劑盒(SOLiD ? Library Preparation Kits) (Applied Biosystems ? LifeTechnologies, Carlsbad CA)等實(shí)施所描述的方法產(chǎn)生這種庫。本文描述的樣品一般通過例如多重鏈置換擴(kuò)增(MDA)技術(shù)進(jìn)行進(jìn)一步擴(kuò)增用于測序或微陣列分析。對于MDA后的測序,例如通過以如在配對庫制備試劑盒(Mate Pair Library Prep kit)、基因組DNA樣品制備試劑盒(Genomic DNA Sample Prep kits)或TruSeq ?樣品制備或外顯子組富集試劑盒(TruSeq ? Sample Preparation or Exome Enrichment kits) (Illumina?, Inc.,San Diego CA)產(chǎn)生所描述的DNA庫,制備擴(kuò)增的樣品庫。有用的群集擴(kuò)增(clusteramplification)方法描述在例如美國專利第5641658號、美國專利公布號2002/0055100、美國專利第7115400號、美國專利公布號2004/0096853、美國專利公布號2004/0002090、美國專利公布號2007/0128624和美國專利公布號2008/0009420中,其每一個通過引用以其全部結(jié)合到本文中。另一種用于在表面擴(kuò)增核酸的有用方法為例如如在Lizardi etal., Nat.Genet.19:225-232 (1998)和 US 2007/0099208 中描述的滾環(huán)擴(kuò)增(RCA),其每一個通過引用以其全部結(jié)合到本文中。乳液PCR方法也是有用的,示例性方法被描述于Dressman et al., Proc.Natl.Acad.Sc1.USA 100:8817-8822 (2003)、WO 05/010145或美國專利公布號2005/0130173或2005/0064460中,其每一個通過引用以其全部結(jié)合到本文中。本公開的方法不一定受到任何具體的庫制備或擴(kuò)增方法的限制,因?yàn)榭紤]本文描述的樣品的不對稱分布適用于本領(lǐng)域已知和/或?qū)Υ四康氖惺劭傻玫降母鞣N方法中的任何一種。[0056]例如,包含不平衡分布的遺傳物質(zhì)的DNA庫可被固定在基底比如流動池上,并在對例如通過合成方法學(xué)得到的序列進(jìn)行測序之前對固定化的多核苷酸實(shí)施橋式擴(kuò)增(bridge amplification)。在橋式擴(kuò)增中,固定化的多核苷酸(例如來自DNA庫)被雜交至固定化的寡核苷酸引物。固定化的多核苷酸分子的3’末端提供給模板自固定化的寡核苷酸引物延伸的,聚合酶催化的,模板定向的伸長反應(yīng)(例如引物延伸)。生成的雙鏈產(chǎn)物“橋接”兩個引物,并且兩個鏈共價連接于載體(support)。在下一個周期中,在產(chǎn)生固定于固體載體的一對單鏈(固定化的模板和延伸的引物產(chǎn)物)的變性之后,兩個固定化的鏈可用作用于新的引物延伸的模板。因此,第一和第二部分可被擴(kuò)增,以產(chǎn)生多個群集。術(shù)語“群集”和“集落”可互換使用,并且指的是核酸序列和/或其附著于表面的補(bǔ)體的多個拷貝。通常地,群集包含核酸序列和/或其通過其5’末端附著于表面的補(bǔ)體的多個拷貝。示例性橋式擴(kuò)增和群集方法學(xué)被描述在例如國際專利公布號W000/18957和W098/44151、美國專利第5641658號、美國專利公布號2002/0055100、美國專利第7115400號、美國專利公布號2004/0096853、美國專利公布號2005/0100900、美國專利公布號2004/0002090、美國專利公布號2007/0128624和美國專利公布號2008/0009420中,其每一個通過引用以其全部結(jié)合到本文中。本文描述的組合物和方法在采用包含群集的流動池通過合成方法學(xué)得到的序列中為特別有用的。
[0057]用于在測序之前擴(kuò)增核酸的乳液PCR方法也可與本文描述的方法和系統(tǒng)組合使用。乳液PCR包括銜接子側(cè)面鳥槍DNA庫在油包水乳液中的PCR擴(kuò)增。PCR為多模板PCR,僅使用單引物對。PCR引物中的一個系于微尺度珠(microscale beads)的表面(5’附著)。低的模板濃度導(dǎo)致存在不多于一個模板分子,含有大多數(shù)珠粒的乳液微泡。在生產(chǎn)乳液微泡(其中存在珠粒和模板分子兩者的乳液微泡)中,PCR擴(kuò)增子可被捕獲于珠粒的表面。在破乳后,可選擇性地富集帶有擴(kuò)增產(chǎn)物的珠粒。每一個克隆擴(kuò)增的珠粒將在其表面帶有對應(yīng)于來自模板庫的單分子擴(kuò)增的PCR產(chǎn)物。乳液PCR方法的各種實(shí)施方案被闡述于例如Dressman et al., Proc.Natl.Acad.Sc1.USA 100:8817-8822 (2003)、國際專利公布號 TO 05/010145、美國專利公布號 2005/0130173、2005/0064460 和 US2005/0042648 中,其每一個通過引用以其全部結(jié)合到本文中。
[0058]DNA納米球也可與本文描述的方法和系統(tǒng)組合使用。產(chǎn)生和采用用于基因組測序的DNA納米球的方法可見于例如美國專利和出版物7910354、2009/0264299、2009/0011943、2009/0005252、2009/0155781、2009/0118488,以及如在例如 Drmanac etal., 2010, Science 327(5961): 78-81中描述的那樣,其全部通過引用以其全部結(jié)合到本文中。簡言之,在銜接子連接的基因組DNA片段連續(xù)來回之后,擴(kuò)增和消化導(dǎo)致被環(huán)化為單鏈DNA (例如通過用圓形連接酶(circle ligase)連接)和滾環(huán)擴(kuò)增(例如如在Lizardiet al., Nat.Genet.19:225-232 (1998)和 US 2007/0099208 Al 中描述的那樣,其每一個通過引用以其全部結(jié)合到本文中)的圓形基因組DNA模板/銜接子序列的多個拷貝的首尾相接的串聯(lián)體。所述串聯(lián)體的銜接子結(jié)構(gòu)促進(jìn)單鏈DNA的盤繞,從而產(chǎn)生緊密的DNA納米球。DNA納米球可被捕獲于基底上,優(yōu)選地產(chǎn)生有序或圖形排列,使得保持每一個納米球之間的距離,從而使得能夠?qū)为?dú)的DNA納米球測序。
[0059]在一些實(shí)施方案中,一旦不對稱分布的樣品得到進(jìn)一步處理,將其應(yīng)用于測序、微陣列分析、基因型分型或其它下游應(yīng)用。例如,測序可按照制造商的方案,在系統(tǒng)比如由 Illumina, Inc.(HiSeq 1000, HiSeq 2000,基因組分析儀(Genome Analyzers),MiSeq, HiScan, systems (系統(tǒng)))、454 Life Sciences (FLX基因組測序儀(FLX GenomeSequencer), GS Junior)、Applied Biosystems ? Life Technologies (ABI PRISM? 序列檢測系統(tǒng)(Sequence detection systems), SOLiD ? System)、1n Torrent? LifeTechnologies (個人基因組機(jī)械測序儀(Personal Genome Machine sequencer))提供的那些系統(tǒng)、進(jìn)一步如在例如美國專利和專利申請5888737、6175002、5695934、6140489、5863722、2007/007991、2009/0247414、2010/0111768 和 PCT 申請?zhí)?W02007/123744 中描述的那些系統(tǒng)上進(jìn)行,其每一個通過引用以其全部結(jié)合到本文中。
[0060]在一些實(shí)施方案中,發(fā)現(xiàn)本文描述的用于測定單體型的方法在用于測序,例如合成測序(SBS)技術(shù)時具有特別的用途。合成測序通常包括使用聚合酶依序增添一個或多個標(biāo)記的核苷酸,以使多核苷酸鏈在5’至3’方向生長。延伸的多核苷酸鏈與可附著于基底(例如流動池、芯片、玻片等)上,并含有引導(dǎo)序列的核酸模板互補(bǔ)。用于SBS的標(biāo)記的核苷酸可包括各種熒光團(tuán)、質(zhì)量標(biāo)記、可電子檢測的標(biāo)記或其它類型標(biāo)記中的任何一種。用于SBS的標(biāo)記的核苷酸也可包括可逆性的終止基團(tuán),使得每個SBS循環(huán)僅增添一個核苷酸。在所結(jié)合的核苷酸被檢測之后可加入解封劑,以提供增添的適合于在隨后的循環(huán)中延伸的核苷酸。SBS方法對于核酸樣品的不同序列片段的平行分析特別有用。例如數(shù)百、數(shù)千、數(shù)百萬或者更多的不同序列片段可使用已知的SBS技術(shù)在單一基底上同時進(jìn)行測序。示例性的測序方法被描述于例如 Bentley et al., Nature 456:53-59 (2008) ,WO 04/018497,US7057026、WO 91/06678、WO 07/123744、US 7329492、US 7211414、US 7315019、US 7405281和US 2008/0108082中,其每一個通過引用以其全部結(jié)合到本文中。
[0061]也發(fā)現(xiàn)所公開的用于測定單體型的方法在用于連接法測序、雜交測序及其它測序技術(shù)時具有用途。示例性的連接法測序方法學(xué)為應(yīng)用生物系統(tǒng)公司的(AppliedBiosystems’)SOLiD ?測序系統(tǒng)采用的二元化編碼(例如色彩空間測序)(Voelkerdinget al., 2009,Clin Chem 55:641-658;通過引用以其全部結(jié)合到本文中)。
[0062]用于本文公開的單倍體分型的方法可通過雜交技術(shù)用于測序。雜交測序包括使用向其增添分裂成碎片的標(biāo)記的目標(biāo)DNA的一些列短序列的核苷酸探針(例如,如在Drmanacet al., 2002, Adv Biochem Eng Biotechnol 77:75-101; Lizardi et al., 2008, NatBiotech 26:649-650,美國專利7071324中描述的;通過引用以其全部結(jié)合到本文中)。對雜交測序的進(jìn)一步改進(jìn)可見于例如美國專利申請出版物2007/0178516、2010/0063264和2006/0287833中(通過引用以其全部結(jié)合到本文中)。結(jié)合雜交與連接生物化學(xué)的測序方法已得到開發(fā)和商業(yè)化,比如由完整的染色體組,高原病展望(Complete Genomics,Mountain View), CA)實(shí)踐的基因組測序技術(shù)。例如,組合的探針-錨定序列連接方法或 cPAL? (Drmanac et al., 2010, Science 327(5961): 78-81)采用連接生物化學(xué),同時利用雜交測序的優(yōu)勢。單分子測序技術(shù),例如如在Pushkarev et al.(2009, Nat.Biotechnol.27:847-52;通過引用以其全部結(jié)合到本文中)描述的和如由HeliScope?單分子測序器(Helicos,Cambridge, MA)實(shí)踐的單分子測序技術(shù),也可利用所公開方法的優(yōu)勢用于測定單體型。
[0063]本文描述的方法不受到任何特定測序樣品制備方法的限制,并且備選方法對技術(shù)人員是顯而易見的,并考慮在本公開的范圍內(nèi)。然而,發(fā)現(xiàn)在本文的方法應(yīng)用于以下測序裝置時具有特殊的用途:比如流動池或陣列,其用于實(shí)踐合成測序方法學(xué)或其它相關(guān)的測序技術(shù),比如聚合酶測序技術(shù)(polony sequencing technology) (Dover Systems)、通過雜交突光平臺測序(Complete Genomics)、sTOP 技術(shù)(Industrial Technology ResearchInstitute)和合成測序(Illumina, Life Technologies)中的一種或多種實(shí)踐的那些測序技術(shù)。
[0064]在一些實(shí)施方案中,本文描述的不對稱分布的樣品經(jīng)MDA處理,并進(jìn)行進(jìn)一步處理用于微陣列和/或其它基因型分析試驗(yàn)。例如,在一些實(shí)施方案中,樣品經(jīng)定量PCR(qPCR)處理,以信噪比表征各部分或等分試樣(例如通過采用Eco PCR系統(tǒng)(Illumina?,Inc.))。這種表征在定義自下游測序或微陣列分析潛在提供最高概率的可判斷數(shù)據(jù)的部分或等分試樣方面是有用的。在一些實(shí)施方案中,進(jìn)行進(jìn)一步處理用于微陣列分析之前的制備。例如,不對稱分布的樣品在經(jīng)MDA擴(kuò)增和/或經(jīng)qPCR表征之后進(jìn)行制備,用于經(jīng)各種方法進(jìn)行微陣列分析,所述方法包括但不限于以上對庫樣品制備先前描述的那些。
[0065]有用的示例性微陣列包括但不限于可得自Illumina?, Inc.(San Diego, CA)的Sentrix? Array或Sentrix? BeadChip Array,或者其它孔中包含珠粒的微陣列,比如在例如美國專利第 6266459,6355431,6770441 和 6859570 號和 PCT 公布號 WO 00/63437 (其每一個通過引用以其全部結(jié)合到本文中)中描述的那些微陣列。
[0066]其它表面上具有顆粒的陣列包括在US 2005/0227252、US 2006/0023310、US2006/006327,US 2006/0071075,US 2006/0119913,US 6489606,US 7106513,US 7126755、US 7164533、WO 05/033681和WO 04/024328 (其每一個通過引用以其全部結(jié)合到本文中)中闡述的那些微陣列。用于測試如通過實(shí)踐本公開的方法提供的不對稱分布的樣品的一系列珠粒也可呈流動格式(fluid format),比如流式細(xì)胞分析儀或類似裝置的液流。用于區(qū)分珠粒的市售可得到的流動格式包括例如用于來自Luminex的XMAP?技術(shù)或來自LynxTherapeutics的MPSS?方法的那些流動格式。
[0067]可與通過實(shí)踐本公開的方法提供的樣品一起使用的,市售可得到的微陣列的其它實(shí)例包括例如Affymetrix? GeneChip?微陣列,或按照如例如在以下文獻(xiàn)描述的有時稱為VLSIPS ? (極大尺度的固定化聚合物合成(Very Large Scale Immobilized PolymerSynthesis))技術(shù)的技術(shù)合成的其它微陣列:美國專利第5324633、5744305、5451683、5482867、5491074、5624711、5795716、5831070、5856101、5858659、5874219、5968740、5974164、5981185、5981956、6025601、6033860、6090555、6136269、6022963、6083697、6291183、6309831、6416949、6428752和6482591 (其每一個通過引用以其全部結(jié)合到本文中)。
[0068]點(diǎn)樣微陣列也可與通過實(shí)踐本公開的方法提供的樣品一起使用。示例性的點(diǎn)樣微陣列為可得自安瑪西亞公司(Amersham Biosciences)的CodeLink ? Array (陣列)。有用的另一種微陣列為使用噴墨印刷法比如可得自安捷倫科技(Agilent Technologies)的SurePrint? Technology制作的微陣列??墒褂玫钠渌㈥嚵邪ǖ幌抻谠贐utte,2002, Nature Reviews Drug Discov.1:951-60 或美國專利第 5429807、5436327、5561071、5583211、5658734、5837858、5919523、6287768、6287776、6288220、6297006、6291193和6514751號及WO 93/17126和WO 95/35505 (其每一個通過引用以其全部結(jié)合到本文中)中描述的那些微陣列。
[0069]來自測序、微陣列或其它基因分型方法學(xué)或儀器的輸出可具有任何方式。例如,一些技術(shù)采用生成可讀輸出的光,比如熒光或發(fā)光,而其它技術(shù)測量電子或離子的釋放。然而,本發(fā)明不限于可讀輸出的類型,只要可對關(guān)注的特定序列測定輸出信號的差異??捎糜诒碚髟从趯?shí)踐本文描述的方法的輸出的分析軟件的實(shí)例包括但不限于Pipeline,CASAVA,基因組 Studio 數(shù)據(jù)分析(Genome Studio Data Analysis), BeadStudio Genotyping andKaryoStudio 數(shù)據(jù)分析軟件(IIlumina?, Inc.)、SignalMap and NimbleScan 數(shù)據(jù)分析軟件(Roche NimbleGen)、GS Analyzer 分析軟件(454 Life Sciences)、S0LiD ?,DNASTAR?SeqMan? NGen? and Partek? Genomics Suite ? 數(shù)據(jù)分析軟件(Life Technologies)、特征提取和 Agilent 染色體組工作臺(Feature Extraction and Agilent GenomicsWorkbench)數(shù)據(jù)分析軟件(Agilent Technologies)、Genotyping Console ? ,染色體分析研究和基因芯片序列分析(Chromosome Analysis Suite and GeneChip? SequenceAnalysis)數(shù)據(jù)分析軟件(Affymetrix?)。技術(shù)人員應(yīng)了解用于微陣列、測序和PCR產(chǎn)生的輸出的數(shù)據(jù)分析的另外眾多的商業(yè)和學(xué)術(shù)上可用的備選軟件。本文描述的實(shí)施方案不限于任何數(shù)據(jù)分析方法。
[0070]本公開的示例性方`法不一定受到任何特定的測序、微陣列或基因分型系統(tǒng)的限制,因?yàn)榭紤]對于特定儀器要求的特定樣品制備適合用于本文描述的不對稱分布的樣品。然而,考慮任何給定檢測系統(tǒng)的分辨率或靈敏度可影響可被測試以產(chǎn)生可判斷的結(jié)果的部分的數(shù)目。在圖3B (K)和圖4B (0)中舉例說明分辨率差異。
[0071]以下實(shí)施例描述用于通過采用不對稱產(chǎn)生的樣品進(jìn)行測序測定SNP單體型的方法。在該具體實(shí)施例中,采用低輸入DNA水平(例如IO-1OOpg)的制備方法比如Nextera ?DNA樣品制備試劑盒是特別有用的,因?yàn)橛眠@種試劑盒處理的樣品適合準(zhǔn)備測序,并且不需進(jìn)一步處理,比如多鏈置換擴(kuò)增。另外,可需要另外的擴(kuò)增步驟,比如MDA。所制備的樣品可例如在 Illumina, Inc.基因組分析儀(Genome Analyzer), HiSeq, MiSeq, TruSeq 或其中產(chǎn)生對應(yīng)于每個熒光標(biāo)記的核苷酸的熒光讀數(shù)用于分析的其它測序平臺上進(jìn)行測序。對于該實(shí)施例的目的,自不對稱分布的樣品制備得到以下測序結(jié)果:
ity>2? 56- ?94;--;|31.0:'501
aIagtGTcTgT^gCCGT' , l|c^AA0
- /s J
4料mii04...49? 2SB廣 f492 S08
在該實(shí)施例中,用雙散列線(double hash lines)自不連續(xù)和可能遠(yuǎn)離地位于染色體區(qū)域分離單個位點(diǎn)的核酸。對一個位置列出的兩個核苷酸代表雜合序列變異或關(guān)注的序列中的單核苷酸多態(tài)性(SNPs)。核苷酸上面和下面的數(shù)目代表出自讀取總數(shù),例如在這種情況下讀取約800的特定核苷酸位置的讀取數(shù)目。遠(yuǎn)程SNP取相通過匹配具有如下相似讀數(shù)的SNP位置進(jìn)行測定:
【權(quán)利要求】
1.一種用于測定核酸樣品的單體型的方法,所述方法包括提供核酸樣品的一個或多個部分,其中母系和父系染色體的貢獻(xiàn)不相等,檢測核酸樣品的一個或多個部分中關(guān)注的兩個或更多個序列之間的不平衡,并基于所述可檢測的不平衡測定所述核酸樣品的單體型。
2.權(quán)利要求1的方法,其中所述核酸樣品來自基因組或其片段。
3.權(quán)利要求2的方法,其中所述基因組來自一個或多個細(xì)胞。
4.權(quán)利要求3的方法,其中所述一個或多個細(xì)胞為約10-100個細(xì)胞。
5.權(quán)利要求1的方法,其中所述核酸樣品來自哺乳動物。
6.權(quán)利要求5的方法,其中所述哺乳動物為人。
7.權(quán)利要求1的方法,其中所述母系和父系染色體包括選自單核苷酸多態(tài)性、拷貝數(shù)目變異體、基因組插入和基因組缺失的一種或多種變異序列。
8.權(quán)利要求1的方法,其中母系和父系染色體的所述不相等貢獻(xiàn)包括除了1:1比例的染色體比例。
9.權(quán)利要求1的方法,其中所述單體型通過熒光進(jìn)行測定。
10. 權(quán)利要求1的方法,其中所述單體型通過核酸測序技術(shù)進(jìn)行測定。
11.權(quán)利要求1的方法,其中所述單體型通過在微陣列上實(shí)施的基因分型技術(shù)進(jìn)行測定。
12.權(quán)利要求1的方法,其中所述單體型通過定量聚合酶鏈反應(yīng)進(jìn)行測定。
13.一種制備用于單體型測定的部分的方法,所述方法包括: a)提供包含對樣品為天然的一定比例的母系和父系染色體組分的核酸樣品,和 b)產(chǎn)生多個部分,其中一個或多個部分包含偏倚比例的母系和父系染色體組分,其中所述偏倚比例基本上不同于對所述個體為天然的比例,從而制備用于單體型測定的部分。
14.權(quán)利要求13的方法,其中所述產(chǎn)生包括向多個部分中的一個或多個部分不對稱地分布母系和父系染色體組分。
15.權(quán)利要求13的方法,其中所述產(chǎn)生包括在所述多個部分的一個或多個部分中差異性地降解母系或父系染色體組分中的一種或多種。
16.權(quán)利要求13的方法,其中所述產(chǎn)生包括在所述多個部分的一個或多個部分中差異性地?cái)U(kuò)增母系或父系染色體組分中的一種。
17.權(quán)利要求13的方法,其中所述核酸樣品來自哺乳動物。
18.權(quán)利要求17的方法,其中哺乳動物為人。
19.權(quán)利要求13的方法,其中所述核酸樣品來自多個細(xì)胞。
20.權(quán)利要求19的方法,其中所述多個細(xì)胞為中期同步的。
21.權(quán)利要求19的方法,其中所述多個細(xì)胞為約5-約300個細(xì)胞。
22.權(quán)利要求19的方法,其中所述多個細(xì)胞為約10-約100個細(xì)胞。
23.一種用于對樣品中關(guān)注的多個序列測定單體型的方法,所述方法包括: a)提供來自權(quán)利要求13的一個或多個部分, b)自所述一個或多個部分創(chuàng)建一個庫, c)對所述多個關(guān)注的序列檢測可檢測的信號, d)基于可檢測的信號的所述差異測定關(guān)注的多個序列的單體型。
24.權(quán)利要求23的方法,其中所述關(guān)注的兩個或更多個序列在同一染色體上。
25.權(quán)利要求23的方法,其中所述關(guān)注的兩個或更多個序列位于同一染色體的兩個或更多個不同位點(diǎn)上。
26.權(quán)利要求24的方法,其中同一染色體的兩個或更多個不同位點(diǎn)由至少10000個核苷酸分開。
27.權(quán)利要求24的方法,其中所述兩個或更多個不同位點(diǎn)位于同一染色體上,并由至少100000個核苷酸分開。
28.權(quán)利要求24的方法,其中所述兩個或更多個不同位點(diǎn)位于同一染色體上,并由至少100000000個核苷酸分開。
29.權(quán)利要求24的方法,其中所述兩個或更多個不同位點(diǎn)位于同一染色體上,并由至少200000000個核苷酸分開。
30.權(quán)利要求23的方法,其中所述一個或多個部分來自個體生物。
31.權(quán)利要求23的方法,其中所述一個或多個部分來自哺乳動物。
32.權(quán)利要求23的方法,其中所述一個或多個部分來自人。
33.權(quán)利要求23的方法,所述方法進(jìn)一步包括在步驟b)之前測定母系和父系染色體的比例。
34.權(quán)利要求23的方法,其中所述測定單體型包括部分的定量聚合酶鏈反應(yīng)分析。
35.權(quán)利要求23的方法,其中所述測定單體型包括部分的微陣列分析。
36.權(quán)利要求23的方法,其中所述測定單體型包括對多個關(guān)注序列中的每一個檢測序列讀取數(shù)目的差異,匹配具有相似序列讀數(shù)的關(guān)注的序列,并基于所匹配的關(guān)注的序列測定單體型。
37.權(quán)利要求23的方法,其中所述可檢測的信號為熒光。
38.權(quán)利要求36的方法,其中所述可檢測的信號為突光。
39.權(quán)利要求23的方法,其中所述兩個或更多個關(guān)注的序列選自等位基因、單核苷酸多態(tài)性、拷貝數(shù)目變異體、基因組插入和基因組缺失。
40.權(quán)利要求23的方法,其中所述檢測包括核酸測序技術(shù)。
41.權(quán)利要求23的方法,其中所述檢測包括在微陣列上實(shí)施的基因分型技術(shù)。
42.權(quán)利要求23的方法,其中所述檢測包括定量聚合酶鏈反應(yīng)基因分型技術(shù)。
43.權(quán)利要求40的方法,其中所述測序技術(shù)檢測自多個關(guān)注序列的讀取總數(shù)扣除多個關(guān)注序列的讀取數(shù)目的差值。
44.權(quán)利要求43的方法,其中檢測讀取數(shù)目包括檢測多個關(guān)注的序列產(chǎn)生的熒光信號的數(shù)目。
45.一種測定多個位點(diǎn)的等位基因的取相的方法,所述方法包括: a)提供核酸分子的不對稱分布,其中不對稱分布包含多個部分,其中各個部分包含等位基因的多份拷貝,和其中各個部分包含不同數(shù)量的等位基因; b)區(qū)分存在于一個或多個各個部分中的核酸分子拷貝中的等位基因; c)評價存在于一個或多個各單獨(dú)的部分中等位基因的不同數(shù)量;和 d)自等位基因的區(qū)分和自不同數(shù)量的等位基因的評價確定多個位點(diǎn)的等位基因的取相。
46.權(quán)利要求45的方法,其中所述評價包括檢測自讀取總數(shù)扣除多個位點(diǎn)的等位基因的熒光測序讀取數(shù)目的差值。
47.權(quán)利要求45的方法,其中所述核酸分子來自個體生物。
48.權(quán)利要求45的方法,其中所述不同數(shù)量的評價包括測定多個位點(diǎn)的等位基因的比例。
49.權(quán)利要求45的方法,其中所述等位基因的區(qū)分包括測定存在于多個位點(diǎn)的一個或多個核苷酸的同一'I"生。
50.權(quán)利要求45的方法,其中所述等位基因的區(qū)分包括核酸測序技術(shù)。
51.權(quán)利要求45的方法,其中所述等位基因的區(qū)分包括在微陣列上實(shí)施的基因分型技術(shù)。
52.權(quán)利要求45的方法,其中所述多個位點(diǎn)位于同一染色體上,并由至少10000個核苷酸分開。
53.權(quán)利要求45的方法,其中所述多個位點(diǎn)位于同一染色體上,并由至少100000個核苷酸分開。
54.權(quán)利要求45的方法,其中所述多個位點(diǎn)位于同一染色體上,并由至少100000000個核苷酸分開。
55.權(quán)利要求45的方法, 其中所述多個位點(diǎn)位于同一染色體上,并由至少200000000個核苷酸分開。
56.一種用于測定單體型的核酸部分,其中所述核酸部分包含不對稱地分布的母系和父系染色體組分,其中所述不對稱分布的染色體組分為偏倚比例的母系與父系染色體組分,這種偏倚比例不同于對個體為天然的比例。
【文檔編號】C12N15/11GK103492588SQ201280010224
【公開日】2014年1月1日 申請日期:2012年2月24日 優(yōu)先權(quán)日:2011年2月25日
【發(fā)明者】J-B.范, J.S.費(fèi)希爾, F.凱珀 申請人:伊路敏納公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
灵川县| 林口县| 营口市| 瑞金市| 台南市| 和田市| 石狮市| 丰镇市| 河源市| 全州县| 萨嘎县| 宽城| 嵩明县| 通海县| 岳池县| 贵德县| 图片| 凤翔县| 虞城县| 丰宁| 图木舒克市| 凤凰县| 汉阴县| 临漳县| 邹平县| 汽车| 英吉沙县| 博湖县| 长葛市| 盐山县| 高安市| 阜宁县| 江永县| 修水县| 吉隆县| 册亨县| 南江县| 铜鼓县| 顺平县| 教育| 同德县|