欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于確定并且驗(yàn)證常見(jiàn)的和罕見(jiàn)的染色體非整倍性的歸一化染色體的制作方法

文檔序號(hào):406928閱讀:383來(lái)源:國(guó)知局
專利名稱:用于確定并且驗(yàn)證常見(jiàn)的和罕見(jiàn)的染色體非整倍性的歸一化染色體的制作方法
技術(shù)領(lǐng)域
本發(fā)明提供了一種能夠在包含胎兒和母體核酸的母體樣品中確定單個(gè)或多個(gè)胎兒染色體非整倍性并且驗(yàn)證已作出正確的確定的方法。該方法至少適用于無(wú)創(chuàng)性產(chǎn)前診斷的實(shí)施,并且適用于與健康個(gè)體對(duì)比患病的個(gè)體中序列表達(dá)差異相關(guān)聯(lián)的病狀的診斷和監(jiān)測(cè)。
背景技術(shù)
2007 年公布的美國(guó)婦產(chǎn)科學(xué)會(huì)(American College of Obstetrics·andGynecology ;AC0G)實(shí)施公告號(hào)77支持對(duì)所有孕婦妊娠期的前三個(gè)月進(jìn)行非整倍性風(fēng)險(xiǎn)評(píng)估,該評(píng)估是基于頸半透明度測(cè)量以及替代生化標(biāo)記物,用以篩查唐氏綜合征(美國(guó)婦產(chǎn)科學(xué)會(huì)實(shí)施公告號(hào)77 (AC0G Practice Bulletin No. 77),婦產(chǎn)科(ObstetGynecol) 109 :217-227 [2007])。這些篩查測(cè)試僅可以提供風(fēng)險(xiǎn)確定,該風(fēng)險(xiǎn)確定是非決定性的并且具有非最佳的確定和高假陽(yáng)性率。如今,僅有包括絨膜絨毛采樣(CVS)、羊膜穿刺或臍帶穿刺在內(nèi)的創(chuàng)傷性方法才提供關(guān)于胎兒的明確遺傳信息,但這些程序?qū)δ赣H和胎兒都有風(fēng)險(xiǎn)(歐迪波(Odibo)等人,婦產(chǎn)科(Obstet Gynecol) 112 :813-819[2008];歐迪波(Odibo)等人,婦產(chǎn)科(Obstet Gynecol) 111 :589-595[2008];埃文斯(Evans)和瓦普納(Wapner),圍產(chǎn)期學(xué)論文集(Semin Perinatol) 29 :215-218 [2005])。因此,所希望的是一種用來(lái)獲得關(guān)于胎兒染色體狀態(tài)的明確信息的無(wú)創(chuàng)性手段。對(duì)從母體血漿中獲得的CfDNA進(jìn)行大規(guī)模平行DNA測(cè)序產(chǎn)生數(shù)百萬(wàn)個(gè)短序列標(biāo)簽,這些短序列標(biāo)簽可以被比對(duì)并且唯一地映射到來(lái)自參照人類基因組的位點(diǎn),并且所映射的標(biāo)簽的計(jì)數(shù)可以用于確定染色體的過(guò)度表達(dá)或表達(dá)不足(范(Fan)等人,美國(guó)國(guó)家科學(xué)院院刊(Proc Natl Acad Sci USA) 105 :16266-16271 [2008];維爾克汀(Voelkerding)和里昂(Lyon),臨床化學(xué)(Clin Chem) 56 :336-338 [2010])。然而,測(cè)序深度和后續(xù)計(jì)數(shù)統(tǒng)計(jì)決定了胎兒非整倍性確定的靈敏度。顯然不能在測(cè)試樣品群體中確定一種以上類型的三體性,這一情況強(qiáng)調(diào)了針對(duì)用來(lái)在母體血漿樣品中確定染色體非整倍性的優(yōu)化的算法的需求(趙(Chiu)等人,英國(guó)醫(yī)學(xué)雜志(BMJ) 342, C7401 [2011];埃里克(Ehrich)等人,美國(guó)婦產(chǎn)科雜志(Am J Obstet Gynecol) 2014 205 el[2011])?,F(xiàn)有方法的局限性成為針對(duì)最佳的無(wú)創(chuàng)性方法的需求的基礎(chǔ),這些最佳的無(wú)創(chuàng)性方法將為產(chǎn)前診斷以及與拷貝數(shù)變化有關(guān)的醫(yī)學(xué)病狀的診斷和監(jiān)測(cè)提供特異性、靈敏性以及適用性中的任一者或全部以便可靠地診斷染色體非整倍性。本發(fā)明實(shí)現(xiàn)了上述需求中的一些,并且尤其提供了一個(gè)優(yōu)點(diǎn),即提供了一種可靠的方法,該方法具有足夠的靈敏性以便確定單個(gè)或多個(gè)染色體非整倍性,并且該方法驗(yàn)證已作出正確的確定。發(fā)明概述本發(fā)明提供了一種能夠在包含胎兒和母體核酸的母體樣品中確定單個(gè)或多個(gè)胎兒染色體非整倍性并且驗(yàn)證已作出正確的確定的方法。該方法適用于在多個(gè)樣品中確定任何感興趣的序列的拷貝數(shù)變異(CNV),這些樣品包含來(lái)源于兩個(gè)不同基因組的基因組核酸的混合物,并且已知或懷疑這兩個(gè)不同基因組在一個(gè)或多個(gè)感興趣的序列的量方面不同。該方法至少適用于無(wú)創(chuàng)性產(chǎn)前診斷的實(shí)施,并且適用于與健康個(gè)體對(duì)比患病的個(gè)體中序列表達(dá)差異有關(guān)的病狀的診斷和監(jiān)測(cè)。在一個(gè)實(shí)施方案中,該方法通過(guò)以下步驟在包含胎兒和母體核酸分子的母體測(cè)試樣品中確定存在或不存在一種胎兒染色體非整倍性(a)獲得針對(duì)在母體樣品中胎兒和母體核酸的序列信息,以便識(shí)別針對(duì)一個(gè)感興趣的染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目以及針對(duì)至少兩個(gè)歸一化染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目;(b)使用序列標(biāo)簽的數(shù)目來(lái)計(jì)算針對(duì)感興趣的染色體的一個(gè)第一歸一化值和一個(gè)第二歸一化值;并且(C)將針對(duì)感興趣的染色體的第一歸一化值與一個(gè)第一閾值進(jìn)行比較并且將針對(duì)感興趣的染色體的第二歸一化值與一個(gè)第二閾值進(jìn)行比較,以確定在樣品中存在或不存在一種胎兒非整倍性。第一和第二閾值可以是相同的,或者它們可以是不同的。在這個(gè)方法的步驟(C)中,針對(duì)所述感興趣的染色體的第一歸一化值與閾值的比較指示存在或不存在針對(duì)所述感興趣的染色體的一種非整倍性,并且針對(duì)所述感興趣的染色體的第二歸一化值與閾值的比較驗(yàn)證存在或不存 在針對(duì)感興趣的染色體的一種非整倍性的確定。在一些實(shí)施方案中,第一歸一化值是一個(gè)第一染色體劑量,它是針對(duì)感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第一歸一化染色體的序列標(biāo)簽的數(shù)目的比率,并且第二歸一化值是一個(gè)第二染色體劑量,它是針對(duì)感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目的比率。任選地,第一和第二歸一化值可以表示為如下所述的歸一化的染色體值(NCV)。在上述和所有后續(xù)實(shí)施方案中,獲得測(cè)序信息的步驟包括下一代測(cè)序(NGS)。NGS可以是使用多個(gè)可逆染料終止子進(jìn)行合成法測(cè)序(sequencing-by-synthesis)。可替代地,NGS可以是連接法測(cè)序(sequencing-by-ligation)進(jìn)行測(cè)序。NGS還可以是單分子測(cè)序。類似地,在上述和所有后續(xù)實(shí)施方案中,針對(duì)染色體21的歸一化染色體是選自染色體9、11、14、以及I。在一些實(shí)施方案中,針對(duì)染色體18的歸一化染色體是選自染色體
8、3、2、以及6。在一些實(shí)施方案中,針對(duì)染色體13的歸一化染色體是選自染色體4、染色體2-6的群組、染色體5、以及染色體6。在一些實(shí)施方案中,針對(duì)染色體X的歸一化染色體是選自染色體6、5、13、以及3。在一些實(shí)施方案中,針對(duì)染色體I的歸一化染色體是選自染色體10、11、9、以及15。在一些實(shí)施方案中,針對(duì)染色體2的歸一化染色體是選自染色體8、7、
12、以及14。在一些實(shí)施方案中,針對(duì)染色體3的歸一化染色體是選自染色體6、5、8、以及18。在一些實(shí)施方案中,針對(duì)染色體4的歸一化染色體是選自染色體3、5、6、以及13。在一些實(shí)施方案中,針對(duì)染色體5的歸一化染色體是選自染色體6、3、8、以及18。在一些實(shí)施方案中,針對(duì)染色體6的歸一化染色體是選自染色體5、3、8、以及18。在一些實(shí)施方案中,針對(duì)染色體7的歸一化染色體是選自染色體12、2、14、以及8。在一些實(shí)施方案中,針對(duì)染色體8的歸一化染色體是選自染色體2、7、12、以及3。在一些實(shí)施方案中,針對(duì)染色體9的歸一化染色體是選自染色體11、10、1、以及14。在一些實(shí)施方案中,針對(duì)染色體10的歸一化染色體是選自染色體1、11、9、以及15。在一些實(shí)施方案中,針對(duì)染色體11的歸一化染色體是選自染色體1、10、9、以及15。在一些實(shí)施方案中,針對(duì)染色體12的歸一化染色體是選自染色體7、14、2、以及8。在一些實(shí)施方案中,針對(duì)染色體14的歸一化染色體是選自染色體12、
7、2、以及9。在一些實(shí)施方案中,針對(duì)染色體15的歸一化染色體是選自染色體1、10、11、以及9。在一些實(shí)施方案中,針對(duì)染色體16的歸一化染色體是選自染色體20、17、15、以及I。在一些實(shí)施方案中,針對(duì)染色體17的歸一化染色體是選自染色體16、20、19、以及22。在一些實(shí)施方案中,針對(duì)染色體19的歸一化染色體是選自22、17、16、以及20。在一些實(shí)施方案中,針對(duì)染色體20的歸一化染色體是選自染色體16、17、15、以及I。在一些實(shí)施方案中,針對(duì)染色體22的歸一化染色體是選自染色體19、17、16、以及20。在另一個(gè)實(shí)施方案中,該方法通過(guò)以下步驟在包含胎兒和母體核酸分子的母體測(cè)試樣品中確定存在或不存在一種胎兒染色體非整倍性(a)獲得針對(duì)在母體樣品中胎兒和母體核酸的序列信息,以便識(shí)別針對(duì)一個(gè)感興趣的染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目以及針對(duì)至少兩個(gè)歸一化染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目;(b)使用序列標(biāo)簽的數(shù)目來(lái)計(jì)算針對(duì)感興趣的染色體的一個(gè)第一歸一化值和一個(gè)第二歸一化值;并且(C)將針對(duì)感興趣的染色體的第一歸一化值與一個(gè)第一閾值進(jìn)行比較并且將針對(duì)感興趣的染色體的第二歸一化值與一個(gè)第二閾值進(jìn)行比較,以確定在樣品中存在或不存在一種胎兒非整倍性。第一和第二閾值可以是相同的,或者它們可以是不同的。在這個(gè)方法的步驟(C)中,針對(duì)所述感興趣的染色體的第一歸一化值與閾值的比較表明存在或不存在針對(duì)所述感興趣的染色體的·一種非整倍性,并且針對(duì)所述感興趣的染色體的第二歸一化值與閾值的比較驗(yàn)證存在或不存在針對(duì)感興趣的染色體的一種非整倍性的確定。在一些實(shí)施方案中,第一歸一化值是一個(gè)第一染色體劑量,它是針對(duì)感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第一歸一化染色體的序列標(biāo)簽的數(shù)目的比率,并且第二歸一化值是一個(gè)第二染色體劑量,它是針對(duì)感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目的比率。任選地,第一和第二歸一化值可以表示為如下所述的歸一化的染色體值(NCV)。胎兒染色體非整倍性可以是一種部分的或完整的染色體非整倍性。在這些實(shí)施方案中,胎兒染色體非整倍性可以選自21三體性(T21)、18三體性(T18)、13三體性(T13)、X單體性。在一些實(shí)施方案中,母體樣品是從一位孕婦獲得的。在一些實(shí)施方案中,母體樣品是一種生物學(xué)流體樣品,例如一個(gè)血液樣品或從血液樣品獲得的血漿部分。在一些實(shí)施方案中,母體樣品是一個(gè)血衆(zhòng)樣品。在一些實(shí)施方案中,母體樣品中的核酸是cfDNA分子。在一些其他實(shí)施方案中,母體測(cè)試樣品是從一位孕婦獲得的血漿樣品,并且核酸分子是cfDNA分子。在另一個(gè)實(shí)施方案中,該方法確定存在或不存在至少兩種不同的染色體非整倍性。在一個(gè)實(shí)施方案中,該方法通過(guò)針對(duì)至少兩個(gè)感興趣的染色體重復(fù)步驟(a)-(c)在包含胎兒和母體核酸分子的母體測(cè)試樣品中確定存在或不存在至少兩種不同的胎兒染色體非整倍性,其中這些步驟包括(a)獲得針對(duì)在母體樣品中胎兒和母體核酸的序列信息,以便識(shí)別針對(duì)一個(gè)感興趣的染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目以及針對(duì)至少兩個(gè)歸一化染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目;(b)使用序列標(biāo)簽的數(shù)目來(lái)計(jì)算針對(duì)感興趣的染色體的一個(gè)第一歸一化值和一個(gè)第二歸一化值;并且(C)將針對(duì)感興趣的染色體的第一歸一化值與一個(gè)第一閾值進(jìn)行比較并且將針對(duì)感興趣的染色體的第二歸一化值與一個(gè)第二閾值進(jìn)行比較,以確定在樣品中存在或不存在一種胎兒非整倍性。第一和第二閾值可以是相同的,或者它們可以是不同的。在這個(gè)方法的步驟(C)中,針對(duì)所述感興趣的染色體的第一歸一化值與閾值的比較表明存在或不存在針對(duì)所述感興趣的染色體的一種非整倍性,并且針對(duì)所述感興趣的染色體的第二歸一化值與閾值的比較驗(yàn)證存在或不存在針對(duì)感興趣的染色體的一種非整倍性的確定。在一些實(shí)施方案中,第一歸一化值是一個(gè)第一染色體劑量,它是針對(duì)感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第一歸一化染色體的序列標(biāo)簽的數(shù)目的比率,并且第二歸一化值是一個(gè)第二染色體劑量,它是針對(duì)感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目的比率。任選地,第一和第二歸一化值可以表示為如本文中所述的歸一化的染色體值(NCV)。在一些實(shí)施方案中,該方法包括針對(duì)所有染色體重復(fù)該方法以確定存在或不存在至少兩種不同的胎兒染色體非整倍性。在另一個(gè)實(shí)施方案中,該方法確定存在或不存在至少兩種不同的染色體非整倍性。在一個(gè)實(shí)施方案中,該方法通過(guò)針對(duì)至少兩個(gè)感興趣的染色體重復(fù)步驟(a)-(c)來(lái)確定在包含胎兒和母體核酸分子的母體測(cè)試樣品中存在或不存在至少兩種不同的胎兒染色體非整倍性,其中這些步驟包括(a)獲得針對(duì)在母體樣品中胎兒和母體核酸的序列信息,以便識(shí)別針對(duì)一個(gè)感興趣的染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目以及針對(duì)至少兩個(gè)歸一化染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目;(b)使用序列標(biāo)簽的數(shù)目來(lái)計(jì)算針對(duì)感興趣的染色體的一個(gè)第一歸一化值和一個(gè)第二歸一化值;并且(C)將針對(duì)感興趣的染色體的第一歸一化值與一個(gè)第一閾值進(jìn)行比較并且將針對(duì)感興趣的染色體的第二歸一化值與一個(gè)第二閾值進(jìn)行比較,以確定在樣品中存在或不存在一種胎兒非整倍性。第一和第二閾值可以是相同的,或者它們可以是不同的。在這個(gè)方法的步驟(C)中,針對(duì)所述感興趣的染色體的第一歸 一化值與閾值的比較表明存在或不存在針對(duì)所述感興趣的染色體的一種非整倍性,并且針對(duì)所述感興趣的染色體的第二歸一化值與閾值的比較驗(yàn)證存在或不存在針對(duì)感興趣的染色體的一種非整倍性的確定。在一些實(shí)施方案中,第一歸一化值是一個(gè)第一染色體劑量,它是針對(duì)感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第一歸一化染色體的序列標(biāo)簽的數(shù)目的比率,并且第二歸一化值是一個(gè)第二染色體劑量,它是針對(duì)感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目的比率。任選地,第一和第二歸一化值可以表示為如本文中所述的歸一化的染色體值(NCV)。在一些實(shí)施方案中,該方法包括針對(duì)所有染色體重復(fù)該方法以確定存在或不存在至少兩種不同的胎兒染色體非整倍性。至少兩種不同的胎兒染色體非整倍性可以選自T21、T18、T13、以及X單體性。在一些實(shí)施方案中,母體樣品是從一位孕婦獲得的。在一些實(shí)施方案中,母體樣品是一種生物學(xué)流體樣品,例如一個(gè)血液樣品或從血液樣品獲得的血漿部分。在一些實(shí)施方案中,母體樣品是一個(gè)血衆(zhòng)樣品。在一些實(shí)施方案中,母體樣品中的核酸是cfDNA分子。在一些其他實(shí)施方案中,母體測(cè)試樣品是從一位孕婦獲得的血漿樣品,并且核酸分子是cfDNA分子。在另一個(gè)實(shí)施方案中,該方法通過(guò)以下步驟驗(yàn)證在包含胎兒和母體核酸分子的母體測(cè)試樣品中存在或不存在針對(duì)感興趣的染色體的一種非整倍性的確定(a)獲得針對(duì)在樣品中胎兒和母體核酸的序列信息,以便識(shí)別針對(duì)一個(gè)感興趣的染色體的多個(gè)映射的序列標(biāo)簽的一個(gè)數(shù)目以及針對(duì)至少兩個(gè)歸一化染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目;(b)使用針對(duì)感興趣的染色體的標(biāo)簽的數(shù)目以及針對(duì)一個(gè)第一歸一化染色體的標(biāo)簽的數(shù)目來(lái)確定針對(duì)感興趣的染色體的一個(gè)第一歸一化值,并且使用針對(duì)第一歸一化染色體的序列標(biāo)簽的數(shù)目以及針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目來(lái)確定針對(duì)第一歸一化染色體的一個(gè)第二歸一化值;并且(C)將針對(duì)感興趣的染色體的第一歸一化值與一個(gè)第一閾值進(jìn)行比較并且將針對(duì)第一歸一化染色體的第二歸一化值與一個(gè)第二閾值進(jìn)行比較,以確定在樣品中存在或不存在一種胎兒非整倍性。第一和第二閾值可以是相同的,或者它們可以是不同的。在這個(gè)方法的步驟(C)中,針對(duì)所述感興趣的染色體的第一歸一化值與閾值的比較表明存在或不存在針對(duì)所述感興趣的染色體的一種非整倍性,并且針對(duì)所述第一歸一化染色體的第二歸一化值與閾值的比較驗(yàn)證存在或不存在針對(duì)感興趣的染色體的一種非整倍性的確定。在一些實(shí)施方案中,第一歸一化值是一個(gè)第一染色體劑量,它是針對(duì)所述感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第一歸一化染色體的序列標(biāo)簽的數(shù)目的比率,并且第二歸一化值是一個(gè)第二染色體劑量,它是針對(duì)第一歸一化染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目的比率。任選地,第一和第二歸一化值可以表示為如下所述計(jì)算的歸一化的染色體值(NCV)。在另一個(gè)實(shí)施方案中,該方法通過(guò)以下步驟在包含胎兒和母體核酸分子的母體測(cè)試樣品中驗(yàn)證存在或不存在針對(duì)感興趣的染色體的一種非整倍性的確定(a)獲得針對(duì)在樣品中胎兒和母體核酸的序列信息,以便識(shí)別針對(duì)一個(gè)感興趣的染色體的多個(gè)映射的序列標(biāo)簽的一個(gè)數(shù)目以及針對(duì)至少兩個(gè)歸一化染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目;(b)使用針對(duì)感興趣的染色體的標(biāo)簽的數(shù)目以及針對(duì)一個(gè)第一歸一化染色體的標(biāo)簽的數(shù)目來(lái)確定針對(duì)感興趣的染色體的一個(gè)第一歸一化值,并且使用針對(duì)第一歸一化染色體的序列標(biāo)簽的數(shù)目以及針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目來(lái)確定針對(duì)第一歸一化染色體的一 個(gè)第二歸一化值;并且(C)將針對(duì)感興趣的染色體的第一歸一化值與一個(gè)第一閾值進(jìn)行比較并且將針對(duì)第一歸一化染色體的第二歸一化值與一個(gè)第二閾值進(jìn)行比較,以確定在樣品中存在或不存在一種胎兒非整倍性。第一和第二閾值可以是相同的,或者它們可以是不同的。在這個(gè)方法的步驟(C)中,針對(duì)所述感興趣的染色體的第一歸一化值與閾值的比較表明存在或不存在針對(duì)所述感興趣的染色體的一種非整倍性,并且針對(duì)所述第一歸一化染色體的第二歸一化值與閾值的比較驗(yàn)證存在或不存在針對(duì)感興趣的染色體的一種非整倍性的確定。在一些實(shí)施方案中,第一歸一化值是一個(gè)第一染色體劑量,它是針對(duì)所述感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第一歸一化染色體的序列標(biāo)簽的數(shù)目的比率,并且第二歸一化值是一個(gè)第二染色體劑量,它是針對(duì)第一歸一化染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目的比率。任選地,第一和第二歸一化值可以表示為如下所述計(jì)算的歸一化的染色體值(NCV)。胎兒染色體非整倍性可以是一種部分的或完整的染色體非整倍性。在這些實(shí)施方案中,胎兒染色體非整倍性可以選自T21、T18、T13、以及X單體性。在一些實(shí)施方案中,母體樣品是從一位孕婦獲得的。在一些實(shí)施方案中,母體樣品是一種生物學(xué)流體樣品,例如一個(gè)血液樣品或從血液樣品獲得的血漿部分。在一些實(shí)施方案中,母體樣品是一個(gè)血漿樣品。在一些實(shí)施方案中,母體樣品中的核酸是cfDNA分子。在一些其他實(shí)施方案中,母體測(cè)試樣品是從一位孕婦獲得的血漿樣品,并且核酸分子是cfDNA分子。在另一個(gè)實(shí)施方案中,該方法通過(guò)針對(duì)至少兩個(gè)感興趣的染色體重復(fù)步驟(a)-(c)在包含胎兒和母體核酸分子的母體測(cè)試樣品中確定存在或不存在至少兩種不同的胎兒染色體非整倍性,其中針對(duì)該至少兩個(gè)感興趣的染色體中每一個(gè)的步驟(a)-(c)包括(a)獲得針對(duì)在樣品中胎兒和母體核酸的序列信息,以便識(shí)別針對(duì)一個(gè)感興趣的染色體的多個(gè)映射的序列標(biāo)簽的一個(gè)數(shù)目以及針對(duì)至少兩個(gè)歸一化染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目;(b)使用針對(duì)感興趣的染色體的標(biāo)簽的數(shù)目以及針對(duì)一個(gè)第一歸一化染色體的標(biāo)簽的數(shù)目來(lái)確定針對(duì)感興趣的染色體的一個(gè)第一歸一化值,并且使用針對(duì)第一歸一化染色體的序列標(biāo)簽的數(shù)目以及針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目來(lái)確定針對(duì)第一歸一化染色體的一個(gè)第二歸一化值;并且(C)將針對(duì)感興趣的染色體的第一歸一化值與一個(gè)第一閾值進(jìn)行比較并且將針對(duì)第一歸一化染色體的第二歸一化值與一個(gè)第二閾值進(jìn)行比較,以確定在樣品中存在或不存在一種胎兒非整倍性。第一和第二閾值可以是相同的,或者它們可以是不同的。在這個(gè)方法的步驟(C)中,對(duì)于該至少兩個(gè)感興趣的染色體中的每一個(gè)而言,針對(duì)所述感興趣的染色體的第一歸一化值與閾值的比較表明存在或不存在針對(duì)所述感興趣的染色體的一種非整倍性,并且針對(duì)所述第一歸一化染色體的第二歸一化值與閾值的比較驗(yàn)證存在或不存在針對(duì)感興趣的染色體的一種非整倍性的確定。在一些實(shí)施方案中,第一歸一化值是一個(gè)第一染色體劑量,它是針對(duì)所述感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第一歸一化染色體的序列標(biāo)簽的數(shù)目的比率,并且第二歸一化值是一個(gè)第二染色體劑量,它是針對(duì)第一歸一化染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目的比率。任選地,第一和第二歸一化值可以表示為如本文中所述的歸一化的染色體值(NCV)。在一些實(shí)施方案中,該方法包括針對(duì)所有染色體重復(fù)該方法以確定存在或不存在至少兩種不同的胎兒染色體非整倍性。在另一個(gè)實(shí)施方案中,該方法通過(guò)針對(duì)至少兩個(gè)感興趣的染色體重復(fù)步驟(a)-(c)在包含胎兒和母體核酸分子的母體測(cè)試樣品中確定存在或不存在至少兩種不同的 胎兒染色體非整倍性,其中針對(duì)該至少兩個(gè)感興趣的染色體中每一個(gè)的步驟(a)-(c)包括(a)獲得針對(duì)在樣品中胎兒和母體核酸的序列信息,以便識(shí)別針對(duì)一個(gè)感興趣的染色體的多個(gè)映射的序列標(biāo)簽的一個(gè)數(shù)目以及針對(duì)至少兩個(gè)歸一化染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目;(b)使用針對(duì)感興趣的染色體的標(biāo)簽的數(shù)目以及針對(duì)一個(gè)第一歸一化染色體的標(biāo)簽的數(shù)目來(lái)確定針對(duì)感興趣的染色體的一個(gè)第一歸一化值,并且使用針對(duì)第一歸一化染色體的序列標(biāo)簽的數(shù)目以及針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目來(lái)確定針對(duì)第一歸一化染色體的一個(gè)第二歸一化值;并且(C)將針對(duì)感興趣的染色體的第一歸一化值與一個(gè)第一閾值進(jìn)行比較并且將針對(duì)第一歸一化染色體的第二歸一化值與一個(gè)第二閾值進(jìn)行比較,以確定在樣品中存在或不存在一種胎兒非整倍性。第一和第二閾值可以是相同的,或者它們可以是不同的。在這個(gè)方法的步驟(C)中,對(duì)于該至少兩個(gè)感興趣的染色體中的每一個(gè)而言,針對(duì)所述感興趣的染色體的第一歸一化值與閾值的比較表明存在或不存在針對(duì)所述感興趣的染色體的一種非整倍性,并且針對(duì)所述第一歸一化染色體的第二歸一化值與閾值的比較驗(yàn)證存在或不存在針對(duì)感興趣的染色體的一種非整倍性的確定。在一些實(shí)施方案中,第一歸一化值是一個(gè)第一染色體劑量,它是針對(duì)所述感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第一歸一化染色體的序列標(biāo)簽的數(shù)目的比率,并且第二歸一化值是一個(gè)第二染色體劑量,它是針對(duì)第一歸一化染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目的比率。任選地,第一和第二歸一化值可以表示為如本文中所述的歸一化的染色體值(NCV)。在一些實(shí)施方案中,該方法包括針對(duì)所有染色體重復(fù)該方法以確定存在或不存在至少兩種不同的胎兒染色體非整倍性。至少兩種不同的胎兒染色體非整倍性可以選自T21、T18、T13、以及X單體性。在一些實(shí)施方案中,母體樣品是從一位孕婦獲得的。在一些實(shí)施方案中,母體樣品是一種生物學(xué)流體樣品,例如一個(gè)血液樣品或從血液樣品獲得的血漿部分。在一些實(shí)施方案中,母體樣品是一個(gè)血漿樣品。在一些實(shí)施方案中,母體樣品中的核酸是cfDNA分子。在一些其他實(shí)施方案中,母體測(cè)試樣品是從一位孕婦獲得的血漿樣品,并且核酸分子是cfDNA分子。
在另一個(gè)實(shí)施方案中,該方法通過(guò)以下步驟在包含胎兒和母體核酸分子(例如cfDNA)的母體血漿測(cè)試樣品中確定存在或不存在選自21三體性、18三體性、13三體性、以及X單體性的一種胎兒染色體非整倍性(a)獲得針對(duì)在母體樣品中胎兒和母體核酸的序列信息,以便識(shí)別針對(duì)一個(gè)感興趣的染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目以及針對(duì)至少兩個(gè)歸一化染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目,其中獲得序列信息包括使用多個(gè)可逆染料終止子進(jìn)行大規(guī)模平行合成法測(cè)序;(b)使用序列標(biāo)簽的數(shù)目來(lái)計(jì)算針對(duì)感興趣的染色體的一個(gè)第一歸一化值和一個(gè)第二歸一化值;并且(c)將針對(duì)感興趣的染色體的第一歸一化值與一個(gè)第一閾值進(jìn)行比較并且將針對(duì)感興趣的染色體的第二歸一化值與一個(gè)第二閾值進(jìn)行比較,以確定在樣品中存在或不存在一種胎兒非整倍性。在一些實(shí)施方案中,第一歸一化值是一個(gè)第一染色體劑量,它是針對(duì)感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第一歸一化染色體的序列標(biāo)簽的數(shù)目的比率,并且第二歸一化值是一個(gè)第二染色體劑量,它是針對(duì)感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目的比率。任選地,第一和第二歸一化值可以表示為如本文中所述的歸一化的染色體值(NCV)。在一些實(shí)施方案中,該方法通過(guò)針對(duì)至少兩個(gè)感興趣的染色體重復(fù)步驟(a)-(c)在包含胎兒 和母體核酸分子(例如cfDNA)的母體血漿測(cè)試樣品中確定存在或不存在選自21三體性、18三體性、13三體性、以及X單體性的至少兩種不同的染色體非整倍性。該方法可以進(jìn)一步包括針對(duì)所有染色體重復(fù)步驟(a)-(c)以確定存在或不存在至少兩種胎兒染色體非整倍性。在一些實(shí)施方案中,母體樣品是從一位孕婦獲得的。在一些實(shí)施方案中,母體樣品是一種生物學(xué)流體樣品,例如一個(gè)血液樣品或從血液樣品獲得的血衆(zhòng)部分。在一些實(shí)施方案中,母體樣品是一個(gè)血漿樣品。在一些實(shí)施方案中,母體樣品中的核酸是cfDNA分子。在一些其他實(shí)施方案中,母體測(cè)試樣品是從一位孕婦獲得的血漿樣品,并且核酸分子是cfDNA分子。在另一個(gè)實(shí)施方案中,該方法通過(guò)以下步驟在包含胎兒和母體核酸分子(例如cfDNA)的母體血漿測(cè)試樣品中確定存在或不存在選自21三體性、18三體性、13三體性、以及X單體性的一種胎兒染色體非整倍性(a)獲得針對(duì)在樣品中胎兒和母體核酸的序列信息,以便識(shí)別針對(duì)一個(gè)感興趣的染色體的多個(gè)映射的序列標(biāo)簽的一個(gè)數(shù)目以及針對(duì)至少兩個(gè)歸一化染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目,其中獲得序列信息包括使用多個(gè)可逆染料終止子進(jìn)行大規(guī)模平行合成法測(cè)序;(b)使用針對(duì)感興趣的染色體的標(biāo)簽的數(shù)目以及針對(duì)一個(gè)第一歸一化染色體的標(biāo)簽的數(shù)目來(lái)確定針對(duì)感興趣的染色體的一個(gè)第一歸一化值,并且使用針對(duì)第一歸一化染色體的序列標(biāo)簽的數(shù)目以及針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目來(lái)確定針對(duì)第一歸一化染色體的一個(gè)第二歸一化值;并且(c)將針對(duì)感興趣的染色體的第一歸一化值與一個(gè)第一閾值進(jìn)行比較并且將針對(duì)第一歸一化染色體的第二歸一化值與一個(gè)第二閾值進(jìn)行比較,以確定在樣品中存在或不存在一種胎兒非整倍性。在一些實(shí)施方案中,第一歸一化值是一個(gè)第一染色體劑量,它是針對(duì)所述感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第一歸一化染色體的序列標(biāo)簽的數(shù)目的比率,并且第二歸一化值是一個(gè)第二染色體劑量,它是針對(duì)第一歸一化染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目的比率。任選地,第一和第二歸一化值可以表示為如本文中所述的歸一化的染色體值(NCV)。在一些實(shí)施方案中,該方法通過(guò)針對(duì)至少兩個(gè)感興趣的染色體重復(fù)步驟(a)-(c)在包含胎兒和母體核酸分子(例如cfDNA)的母體血漿測(cè)試樣品中確定存在或不存在選自21三體性、18三體性、13三體性、以及X單體性的至少兩種不同的染色體非整倍性。該方法可以進(jìn)一步包括針對(duì)所有染色體重復(fù)步驟(a)-(c)以確定存在或不存在至少兩種胎兒染色體非整倍性。在一些實(shí)施方案中,母體樣品是從一位孕婦獲得的。在一些實(shí)施方案中,母體樣品是一種生物學(xué)流體樣品,例如一個(gè)血液樣品或從血液樣品獲得的血漿部分。在一些實(shí)施方案中,母體樣品是一個(gè)血漿樣品。在一些實(shí)施方案中,母體樣品中的核酸是cfDNA分子。在一些其他實(shí)施方案中,母體測(cè)試樣品是從一位孕婦獲得的血漿樣品,并且核酸分子是cfDNA分子。在一些上述實(shí)施方案以及一些后續(xù)實(shí)施方案中,獲得針對(duì)在樣品中胎兒和母體核酸的序列信息包括對(duì)在樣品中的胎兒和母體核酸分子進(jìn)行測(cè)序。通過(guò)引用結(jié)合本文中所提及的所有專利、專利申請(qǐng)、以及其他公開(kāi)物(包括這些參考文獻(xiàn)中所·披露的所有序列)都明確地通過(guò)引用結(jié)合,其結(jié)合程度就如同各單獨(dú)的公開(kāi)物、專利或?qū)@暾?qǐng)確切地并且單獨(dú)地被指明為通過(guò)引用結(jié)合。然而,對(duì)任何文獻(xiàn)的引述都不應(yīng)該被理解為承認(rèn)它是關(guān)于本發(fā)明的現(xiàn)有技術(shù)。附圖
簡(jiǎn)要說(shuō)明本發(fā)明的新穎特征在所附權(quán)利要求書(shū)中加以特殊性闡述。通過(guò)參考以下闡述了利用本發(fā)明原理的示意性實(shí)施方案的發(fā)明詳細(xì)說(shuō)明以及其附圖將獲得對(duì)本發(fā)明特征和優(yōu)點(diǎn)的更好理解。圖I提供了一個(gè)流程圖,示出了確定并且驗(yàn)證存在或不存在非整倍性的方法的兩個(gè)替代實(shí)施方案。圖2示出了在來(lái)自訓(xùn)練集I的樣品中確定的針對(duì)染色體21 (〇)、18 ( A )、以及13( □)的歸一化的染色體值(實(shí)例I)。圖3示出了在來(lái)自測(cè)試集I的樣品中確定的針對(duì)染色體21 (〇)、18 ( A )、以及13( □)的歸一化的染色體值(實(shí)例I)。圖4示出了使用趙(Chiu)等人的歸一化方法在來(lái)自測(cè)試集I的樣品中確定的針對(duì)染色體21 (O)和18 ( A )的歸一化的染色體值(實(shí)例I)。圖5示出了使用染色體11作為歸一化染色體在測(cè)試集I(實(shí)例I)的48個(gè)樣品中確定的針對(duì)染色體9劑量的歸一化的染色體值的圖。圖6示出了使用染色體2作為歸一化染色體在測(cè)試集I(實(shí)例I)的48個(gè)樣品中確定的針對(duì)染色體8劑量的歸一化的染色體值的圖。圖7示出了使用染色體5作為歸一化染色體在測(cè)試集I(實(shí)例I)的48個(gè)樣品中確定的針對(duì)染色體6劑量的歸一化的染色體值的圖。圖8示出了對(duì)應(yīng)地使用染色體9 (A)、染色體10⑶、以及染色體14 (C)在測(cè)試集I的48個(gè)樣品中確定的針對(duì)染色體21劑量的歸一化的染色體值的圖,該測(cè)試集I包括未受影響(〇)和受影響(A ) ( S卩,21三體性)的樣品。圖9示出了使用染色體2作為歸一化染色體⑷以及使用染色體7作為歸一化染色體(B)在測(cè)試集2(實(shí)例4)中確定的針對(duì)染色體8劑量的歸一化的染色體值的圖。發(fā)明詳細(xì)說(shuō)明本發(fā)明提供了一種能夠在包含胎兒和母體核酸的母體樣品中確定單個(gè)或多個(gè)胎兒染色體非整倍性并且驗(yàn)證已作出正確的確定的方法。該方法適用于在多個(gè)樣品中確定任何感興趣的序列的拷貝數(shù)變異(CNV),這些樣品包含來(lái)源于兩個(gè)不同基因組的基因組核酸的混合物,并且已知或懷疑這兩個(gè)不同基因組在一個(gè)或多個(gè)感興趣的序列的量方面有所不同。該方法至少適用于無(wú)創(chuàng)性產(chǎn)前診斷的實(shí)施,并且適用于與健康個(gè)體對(duì)比患病的個(gè)體中序列表達(dá)差異有關(guān)的病狀的診斷和監(jiān)測(cè)。除非另外指明,否則本發(fā)明的實(shí)施涉及分子生物學(xué)、微生物學(xué)、蛋白質(zhì)純化、蛋白質(zhì)工程、蛋白質(zhì)和DNA測(cè)序、以及重組DNA領(lǐng)域中常用的常規(guī)技術(shù),這些技術(shù)都在本領(lǐng)域的技術(shù)范疇內(nèi)。這些技術(shù)是本領(lǐng)域的技術(shù)人員所知的,并且描述于眾多教科書(shū)和參考文獻(xiàn)中(參見(jiàn)例如薩姆布魯克(Sambrook)等人分子克隆實(shí)驗(yàn)指南(Molecular Cloning A Laboratory Manual) ”,第二版(冷泉港(Cold Spring Harbor)), [1989]);和奧蘇伯爾(Ausubel)等人,“最新分子生物學(xué)實(shí)驗(yàn)方法匯編(Current Protocols in MolecularBiology)” [1987]) 數(shù)值范圍包括限定該范圍的數(shù)值。在此的意圖是貫穿本說(shuō)明書(shū)給出的每一最大數(shù)值限度包括每一較低的數(shù)值限度,如同此類較低數(shù)值限度在此被明確寫(xiě)出。貫穿本說(shuō)明書(shū)給出的每一最小數(shù)值限度將包括每一較高的數(shù)值限度,如同此類較高數(shù)值限度在此被明確寫(xiě)出。貫穿本說(shuō)明書(shū)給出的每一數(shù)值范圍將包括落在此類較廣的數(shù)值范圍內(nèi)的每一較窄數(shù)值范圍,如同此類較窄數(shù)值范圍此處被全部明確地寫(xiě)出。本文中所提供的標(biāo)題并不是對(duì)本發(fā)明的不同的方面或?qū)嵤┓桨傅南拗?,它可以是通過(guò)參考作為一個(gè)總體的說(shuō)明書(shū)而具有的。因此,如上所指明,直接在下文中定義的術(shù)語(yǔ)通過(guò)參考作為一個(gè)總體的說(shuō)明書(shū)而更充分地定義。除非在此另行定義,在此使用的所有技術(shù)的和科學(xué)的術(shù)語(yǔ)都具有本發(fā)明所屬領(lǐng)域中的一位普通技術(shù)人員通常理解的相同含義。包括了在此包含的術(shù)語(yǔ)的不同科學(xué)字典對(duì)于本領(lǐng)域那些技術(shù)人員而言是熟知并且是可獲得的。雖然類似或等價(jià)于在此所述的那些方法和材料的任何方法和材料在實(shí)施或測(cè)試本發(fā)明中找到了用途,但僅說(shuō)明了一些優(yōu)選的方法和材料。因此,直接在下文中定義的術(shù)語(yǔ)通過(guò)將本說(shuō)明書(shū)作為整體來(lái)參閱即得到更完全地說(shuō)明。應(yīng)理解,本發(fā)明并不局限于所說(shuō)明的具體方法學(xué)、規(guī)程、以及試劑,因?yàn)檫@些可以變化,它們被本領(lǐng)域的那些技術(shù)人員根據(jù)其情況下來(lái)使用。定義如在此所使用的,單數(shù)的術(shù)語(yǔ)“一個(gè)”、“一種”、和“該”包括復(fù)數(shù)引用,除非上下文清楚地另外指明。除非另外指明,核酸是按5'到3'方向從左到右書(shū)寫(xiě)并且氨基酸序列是按氨基到羧基方向從左到右書(shū)寫(xiě)。術(shù)語(yǔ)“獲得序列信息”在本文中是指對(duì)核酸進(jìn)行測(cè)序以獲得呈序列讀數(shù)形式的序列信息,這些序列讀數(shù)當(dāng)被唯一地映射到參照基因組時(shí)被識(shí)別為序列標(biāo)簽。術(shù)語(yǔ)“歸一化值”在本文中是指針對(duì)感興趣的染色體確定的并且使針對(duì)感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)歸一化染色體的序列標(biāo)簽的數(shù)目相關(guān)聯(lián)的一個(gè)數(shù)值。舉例來(lái)說(shuō),“歸一化值”可以是如本文中別處描述的一個(gè)染色體劑量,或者它可以是如本文中別處描述的一個(gè)NCV (歸一化的染色體值)。術(shù)語(yǔ)“感興趣的染色體”在本文中是指進(jìn)行存在或不存在一種非整倍性確定的一種染色體。感興趣的染色體的實(shí)例包括常見(jiàn)的非整倍性(如21三體性)中所涉及到的染色體,以及罕見(jiàn)的非整倍性(如2三體性)中所涉及到的染色體。染色體1_22、X以及Y中的任何一項(xiàng)都可以是感興趣的染色體。術(shù)語(yǔ)“多個(gè)(multiple)和復(fù)數(shù)個(gè)(plurality) ”當(dāng)關(guān)于染色體非整倍性數(shù)目和/或染色體數(shù)目使用時(shí),在本文中是指兩個(gè)或更多個(gè)非整倍性和/或染色體。術(shù)語(yǔ)“閾值”在本文中是指使用訓(xùn)練數(shù)據(jù)集計(jì)算的并且用作生物體中拷貝數(shù)變異(例如非整倍性)診斷界限的任何數(shù)值。如果從實(shí)施本發(fā)明獲得的結(jié)果超過(guò)閾值,那么受試者可以被診斷為有拷貝數(shù)變異(例如21三體性)。針對(duì)本文中所述的方法的適當(dāng)閾值可以通過(guò)對(duì)針對(duì)包括合格樣品(即,未受影響的樣品)的訓(xùn)練樣品集所計(jì)算的歸一化值(例如染色體劑量、或NCV(歸一化的染色體值))進(jìn)行分析來(lái)識(shí)別。閾值可以使用合格樣品以及被識(shí)別為具有染色體非整倍性的樣品(即,受影響的樣品)進(jìn)行設(shè)定(參見(jiàn)本文中的實(shí)例)。在一些實(shí)施方案中,用于識(shí)別適當(dāng)閾值的訓(xùn)練集包括至少10個(gè)、至少20個(gè)、至少30個(gè)、至少40個(gè)、至少50個(gè)、至少60個(gè)、至少70個(gè)、至少80個(gè)、至少90個(gè)、至少100個(gè)、至少200個(gè)、至少300個(gè)、至少400個(gè)、至少500個(gè)、至少600個(gè)、至少700個(gè)、至少800個(gè)、至少·900個(gè)、至少1000個(gè)、至少2000個(gè)、至少3000個(gè)、至少4000個(gè)、或更多個(gè)合格樣品。使用更大的合格樣品集來(lái)改善閾值的診斷工具可能是有利的。術(shù)語(yǔ)“下一代測(cè)序(NGS) ”在本文中是指允許對(duì)以克隆方式擴(kuò)增的核酸分子以及單個(gè)核酸分子進(jìn)行大規(guī)模平行測(cè)序的測(cè)序方法。NGS的非限制性實(shí)例包括使用多個(gè)可逆染料終止子進(jìn)行的合成法測(cè)序、以及連接法測(cè)序。術(shù)語(yǔ)“讀數(shù)”是指具有足夠長(zhǎng)度(例如至少約30bp)的一個(gè)DNA序列,其可以用于識(shí)別更大的序列或區(qū)域,例如其可以被比對(duì)并且特定地歸屬到染色體或基因組區(qū)域或基因。術(shù)語(yǔ)“序列標(biāo)簽”在本文中可與術(shù)語(yǔ)“映射的序列標(biāo)簽”互換使用以提及已通過(guò)比而確切地歸屬(即,映射)到更大序列(例如,參照基因組)的一個(gè)序列讀數(shù)。映射的序列標(biāo)簽被唯一地映射到一個(gè)參照基因組,即,它們被歸屬到參照基因組的單一位置。分析中不包括可以被映射到參照基因組上的一個(gè)以上位置的標(biāo)簽(即,不唯一地映射的標(biāo)簽)。術(shù)語(yǔ)“序列標(biāo)簽的數(shù)目”當(dāng)關(guān)于針對(duì)一個(gè)感興趣的染色體和/或一個(gè)或多個(gè)歸一化染色體的標(biāo)簽的數(shù)目使用時(shí),在本文中是指映射到這個(gè)感興趣的染色體和/或這個(gè)或這些歸一化染色體的序列標(biāo)簽,這些序列標(biāo)簽是針對(duì)樣品中所有染色體獲得的多個(gè)標(biāo)簽的子集。針對(duì)一個(gè)樣品獲得的標(biāo)簽數(shù)目可以是至少約IXio6個(gè)序列標(biāo)簽、至少約2X106個(gè)序列標(biāo)簽、至少約3 X IO6個(gè)序列標(biāo)簽、至少約5 X IO6個(gè)序列標(biāo)簽、至少約8 X IO6個(gè)序列標(biāo)簽、至少約IOX IO6個(gè)序列標(biāo)簽、至少約15 X IO6個(gè)序列標(biāo)簽、至少約20 X IO6個(gè)序列標(biāo)簽、至少約30 X IO6個(gè)序列標(biāo)簽、至少約40 X IO6個(gè)序列標(biāo)簽,或至少約50 X IO6個(gè)序列標(biāo)簽、或至少約60 X IO6個(gè)序列標(biāo)簽,或至少約70 X IO6個(gè)序列標(biāo)簽、或至少約80 X IO6個(gè)序列標(biāo)簽,包括在20bp與40bp之間(例如36bp)的讀數(shù),是每個(gè)樣品通過(guò)將讀數(shù)映射到參照基因組而獲得的。被映射到任何一個(gè)染色體的標(biāo)簽的數(shù)目將取決于染色體大小和染色體拷貝數(shù)。舉例來(lái)說(shuō),被映射到21三體性樣品中的染色體21的標(biāo)簽的數(shù)目將不同于(即,大于)被映射到未受影響的樣品中的染色體21的標(biāo)簽的數(shù)目。類似地,被映射到染色體19的標(biāo)簽的數(shù)目將小于被映射到染色體I (其約為染色體19大小的4倍)的標(biāo)簽的數(shù)目。被映射到感興趣的序列(例如染色體)的標(biāo)簽的數(shù)目也被稱為“序列標(biāo)簽密度”。
術(shù)語(yǔ)“序列標(biāo)簽密度”在本文中是指被映射到參照基因組序列的序列讀數(shù)的數(shù)目,例如針對(duì)染色體21的序列標(biāo)簽密度是通過(guò)測(cè)序方法產(chǎn)生的被映射到參照基因組的染色體21的序列讀數(shù)的數(shù)目。可以針對(duì)整個(gè)染色體、或針對(duì)染色體的部分確定序列標(biāo)簽密度。如本文中所使用,術(shù)語(yǔ)“被比對(duì)的”、“比對(duì)”或“進(jìn)行比對(duì)”是指就它們的核酸分子次序方面被識(shí)別為與來(lái)自參照基因組的已知序列匹配的一個(gè)或多個(gè)序列。該種比對(duì)可以人工進(jìn)行或通過(guò)計(jì)算機(jī)算法進(jìn)行,實(shí)例包括作為億明達(dá)基因組學(xué)分析流水線(IlluminaGenomics Analysis pipeline)的一部分配發(fā)的高效的核苷酸數(shù)據(jù)局部比對(duì)(EfficientLocal Alignment of Nucleotide Data ;ELAND)的計(jì)算機(jī)程序。比對(duì)中的序列讀數(shù)的匹配可以是100%序列匹配或小于100% (非完美匹配)。如本文中所使用,術(shù)語(yǔ)“參照基因組”是指任何生物體或病毒的任何特定的已知基因組序列(無(wú)論是部分的還是完整的),其可以用于給從受試者識(shí)別出的序列作參照。舉例來(lái)說(shuō),用于人類受試者以及許多其他生物體的參照基因組見(jiàn)于美國(guó)國(guó)家生物技術(shù)信息中心(National Center for Biotechnologylnformation)www. ncbi. nlm. nih. gov。 “基因組”是指以核酸序列形式表示的生物體或病毒的完整遺傳信息。術(shù)語(yǔ)“母體樣品”在本文中是指從懷孕的受試者(例如女性)獲得的生物樣品。術(shù)語(yǔ)“生物學(xué)流體”在本文中是指從生物來(lái)源取得的液體,并且包括例如血液、血清、血漿、痰、灌洗液、腦脊液、尿液、精液、汗水、眼淚、唾液等。如本文中所使用,術(shù)語(yǔ)“血液”、“血漿”以及“血清”明確地涵蓋它們的部分或經(jīng)過(guò)加工的部分。類似地,當(dāng)樣品是取自活組織檢查、拭子、涂片等時(shí),“樣品”明確地涵蓋來(lái)源于活組織檢查、拭子、涂片等的經(jīng)過(guò)加工的碎片或部分。術(shù)語(yǔ)“母體核酸”和“胎兒核酸”在本文中對(duì)應(yīng)地是指懷孕女性受試者的核酸以及由懷孕雌性所攜帶的胎兒的核酸。術(shù)語(yǔ)“受試者”在本文中是指人類受試者以及非人類受試者,如哺乳動(dòng)物、無(wú)脊椎動(dòng)物、脊椎動(dòng)物、真菌、酵母、細(xì)菌、以及病毒。盡管本文中的實(shí)例涉及人類并且言辭主要是針對(duì)有關(guān)人類,但本發(fā)明的概念適用于來(lái)自任何植物或動(dòng)物的基因組,并且適用于獸醫(yī)學(xué)、動(dòng)物科學(xué)、以及研究實(shí)驗(yàn)室等領(lǐng)域。術(shù)語(yǔ)“歸一化序列”在本文中是指在多個(gè)樣品和多個(gè)測(cè)序批次之間顯示被映射到其上的序列標(biāo)簽的數(shù)目有變異性的序列,該序列標(biāo)簽的數(shù)目的變異性最接近于它被用作歸一化參數(shù)所針對(duì)的感興趣的序列的序列標(biāo)簽的數(shù)目的變異性,并且可以最佳地將受影響的樣品與一個(gè)或多個(gè)未受影響的樣品區(qū)別開(kāi)。“歸一化染色體”是“歸一化序列”的一個(gè)實(shí)例。
術(shù)語(yǔ)“序列劑量”在本文中是指使感興趣的序列的序列標(biāo)簽密度與歸一化序列的標(biāo)簽密度相關(guān)聯(lián)的一個(gè)參數(shù)?!叭旧w劑量”是被映射到染色體(例如感興趣的染色體)的序列標(biāo)簽的數(shù)目與被映射到歸一化染色體的序列標(biāo)簽的數(shù)目的比率,它是序列劑量的一個(gè)實(shí)例?!皽y(cè)試序列劑量”是使在測(cè)試樣品中確定的感興趣的序列(例如染色體21)的序列標(biāo)簽密度與歸一化序列(例如染色體9)的序列標(biāo)簽密度相關(guān)聯(lián)的一個(gè)參數(shù)。類似地,“合格序列劑量”是使在合格樣品中確定的感興趣的序列的序列標(biāo)簽密度與歸一化序列的序列標(biāo)簽密度相關(guān)聯(lián)的一個(gè)參數(shù)。術(shù)語(yǔ)“染色體劑量”在本文中是指被映射到染色體(例如感興趣的染色體)的序列標(biāo)簽的數(shù)目與被映射到歸一化染色體的序列標(biāo)簽的數(shù)目的比率。
術(shù)語(yǔ)“歸一化染色體”在本文中是指在多個(gè)樣品和多個(gè)測(cè)序批次之間顯示被映射到它的序列標(biāo)簽的數(shù)目有變異性的染色體,該序列標(biāo)簽的數(shù)目的變異性最接近于它被用于獲得歸一化值所針對(duì)的感興趣的染色體的序列標(biāo)簽的數(shù)目的變異性,并且可以最佳地將受影響的樣品與一個(gè)或多個(gè)未受影響的樣品區(qū)別開(kāi)。術(shù)語(yǔ)“感興趣的序列”在本文中是指與在健康個(gè)體對(duì)比患病的個(gè)體中的序列表達(dá)差異有關(guān)的核酸序列。感興趣的序列可以是在疾病或遺傳狀況中錯(cuò)誤表達(dá)(即,過(guò)度表達(dá)或表達(dá)不足)的染色體上的序列。感興趣的序列還可以是染色體的一部分、或染色體(即,感興趣的染色體)。舉例來(lái)說(shuō),感興趣的序列可以是在非整倍性病狀中過(guò)度表達(dá)的染色體(例如染色體13、18、21、以及X)、或在癌癥中編碼表達(dá)不足的腫瘤抑制因子的基因。感興趣的序列包括在受試者細(xì)胞的總?cè)夯騺喨褐羞^(guò)度表達(dá)或表達(dá)不足的序列?!案信d趣的合格序列”是合格樣品中的感興趣的序列。“感興趣的測(cè)試序列”是測(cè)試樣品中的感興趣的序列。術(shù)語(yǔ)“合格樣品”在本文中是指包含與測(cè)試樣品中的核酸進(jìn)行比較的、以已知拷貝數(shù)存在的多種核酸的混合物的一個(gè)樣品,并且針對(duì)感興趣的序列,它是正常(即,不是非整 倍體)的樣品,例如用于識(shí)別針對(duì)染色體21的歸一化染色體的合格樣品是一個(gè)非21三體性樣品的樣品。術(shù)語(yǔ)“訓(xùn)練集”和“訓(xùn)練樣品”在本文中用于指包含與測(cè)試樣品中的核酸進(jìn)行比較的、以已知拷貝數(shù)存在的核酸的樣品。除非另外說(shuō)明,否則訓(xùn)練集包括合格和受影響的樣品。術(shù)語(yǔ)“測(cè)試樣品”在本文中是指包含核酸混合物并且這些核酸包含拷貝數(shù)被懷疑已經(jīng)發(fā)生變異的至少一個(gè)核酸序列的樣品。存在于測(cè)試樣品中的核酸被稱為“測(cè)試核酸”。術(shù)語(yǔ)“非整倍性”在此是指由損失或獲得整個(gè)染色體、或染色體的一部分而引起的遺傳物質(zhì)的不平衡。術(shù)語(yǔ)“染色體性非整倍性”在此是指由損失或獲得整個(gè)染色體而引起的遺傳物質(zhì)的不平衡,并且包括種系非整倍性和嵌合性非整倍性。術(shù)語(yǔ)“部分非整倍性”和“部分染色體性非整倍性”在此是指由損失或獲得染色體的一部分(例如,部分單體性和部分三體性)而引起的遺傳物質(zhì)的不平衡,并且涵蓋由易位、缺失和插入引起的不平衡。術(shù)語(yǔ)“核酸分子”、“多核苷酸”以及“核酸”被可互換地使用,并且是指一個(gè)共價(jià)連接的核苷酸序列(即,RNA的核糖核苷酸和DNA的脫氧核糖核苷酸),其中一個(gè)核苷酸的戊糖的3'位置被一個(gè)磷酸二酯基團(tuán)連接到下一個(gè)核苷酸的戊糖的5'位置上,這包括任何形式的核酸的序列,包括但不局限于RNA、DNA和cfDNA分子。術(shù)語(yǔ)“多核苷酸”包括而不局限于單鏈的和雙鏈的多核苷酸。術(shù)語(yǔ)“拷貝數(shù)變異(CNV) ”在本文中是指存在于測(cè)試樣品中的核酸序列拷貝數(shù)與存在于合格樣品(即,正常樣本)中的核酸序列拷貝數(shù)相比的變異??截悢?shù)變異包括缺失(包括微缺失)、插入(包括微插入)、復(fù)制、倍增、倒位、易位以及復(fù)雜多位置變異。CNV涵蓋了完整的染色體非整倍性和部分的非整倍性。描述本發(fā)明提供了一種能夠在包含胎兒和母體核酸的母體樣品中確定單個(gè)或多個(gè)胎兒染色體非整倍性并且驗(yàn)證已作出正確的確定的方法。該方法適用于在多個(gè)樣品中確定任何感興趣的序列的拷貝數(shù)變異(CNV),這些樣品包含來(lái)源于至少兩個(gè)不同基因組的基因組核酸的混合物,并且已知或懷疑這兩個(gè)不同基因組在一個(gè)或多個(gè)感興趣的序列的量方面不同。感興趣的序列包括在數(shù)百個(gè)堿基到數(shù)十個(gè)巨堿基到整個(gè)染色體范圍內(nèi)的基因組序列,這些基因組序列已知或被懷疑為與遺傳或疾病病狀有關(guān)。感興趣的序列的實(shí)例包括與熟知的非整倍性(例如21三體性)有關(guān)的染色體、以及在疾病(如癌癥)中倍增的染色體片段(例如急性髓細(xì)胞白血病中的部分8三體性)。本發(fā)明方法包括在一個(gè)或多個(gè)母體測(cè)試樣品中獲得測(cè)序信息,以計(jì)算針對(duì)感興趣的序列(例如染色體)的染色體劑量,從而確定存在或不存在單個(gè)或多個(gè)染色體非整倍性,并且包括驗(yàn)證作出正確的非整倍性的確定。正確地確定在樣品中存在或不存在CNV(例如非整倍性)所需的準(zhǔn)確性是基于以下各項(xiàng)的一個(gè)測(cè)序批次內(nèi)的多個(gè)樣品之間映射到參照基因組的序列標(biāo)簽的數(shù)目的變異(同批測(cè)序變異),以及不同測(cè)序批次中映射到參照基因組的序列標(biāo)簽的數(shù)目的變異(輪次間測(cè)序變異),這些變異可以使胎兒染色體非整倍性映射射的序列標(biāo)簽的分布的影響不明顯。舉例來(lái)說(shuō),對(duì)于映射到GC富集或GC貧乏的參照序列的標(biāo)簽而言,變異可能尤其顯著。為了校正該種變異,本發(fā)明方法基于歸一化染色體(或歸一化染色體群組)的知識(shí)使用染色體劑量從本質(zhì)上解釋了出現(xiàn)的測(cè)序變異性。 歸一化染色體和染色體劑量使用來(lái)自一組從受試者獲得的合格樣品的序列信息來(lái)識(shí)別歸一化染色體,這些樣品已知包含具有針對(duì)任何一個(gè)感興趣的序列正常的拷貝數(shù)(例如針對(duì)染色體21的二倍體)的細(xì)胞。從合格樣品獲得的序列信息還用于確定在測(cè)試樣品中染色體非整倍性的有統(tǒng)計(jì)學(xué)意義的識(shí)別(參見(jiàn)實(shí)例)。在一個(gè)實(shí)施方案中,合格樣品是從懷有胎兒的母親獲得的,已使用細(xì)胞遺傳學(xué)手段證實(shí)該胎兒具有正常的染色體拷貝數(shù)(例如針對(duì)染色體21的二倍體)。生物學(xué)合格樣品可以是一種生物學(xué)流體(例如血漿)、或如下文所述的任何適合的樣品。在一些實(shí)施方案中,合格樣品包含核酸分子(例如cfDNA分子)的混合物。在一些實(shí)施方案中,合格樣品是包含胎兒和母體cfDNA分子的混合物的母體血漿樣品。通過(guò)使用任何已知的測(cè)序方法對(duì)核酸(例如胎兒和母體核酸)的至少一部分進(jìn)行測(cè)序來(lái)獲得針對(duì)歸一化染色體的序列信息。優(yōu)選地,使用本文中別處所述的任何一種下一代測(cè)序(NGS)方法來(lái)對(duì)呈單分子或以克隆方式擴(kuò)增的分子形式的胎兒和母體核酸進(jìn)行測(cè)序。具有預(yù)定長(zhǎng)度(例如36bp)的數(shù)百萬(wàn)個(gè)序列讀數(shù)是通過(guò)NGS技術(shù)產(chǎn)生的,并且被映射到參照基因組以待于作為序列標(biāo)簽進(jìn)行計(jì)數(shù)。對(duì)各合格樣品的至少一部分核酸進(jìn)行測(cè)序,并且對(duì)被映射到各染色體的序列標(biāo)簽的數(shù)目進(jìn)行計(jì)數(shù)。在一些實(shí)施方案中,被映射到染色體的序列標(biāo)簽的數(shù)目可以歸一化到這些感興趣的合格序列的、映射它們到上面的長(zhǎng)度。作為標(biāo)簽密度相對(duì)于感興趣的序列長(zhǎng)度的比率而確定的序列標(biāo)簽密度在本文中被稱作標(biāo)簽密度比率。歸一化到感興趣的序列長(zhǎng)度不是必需的,但是可以作為用來(lái)減少數(shù)值中的數(shù)字?jǐn)?shù)目的步驟而包括在內(nèi),以簡(jiǎn)化數(shù)值以供人類解讀。當(dāng)各合格樣品中的所有合格序列標(biāo)簽都被映射并且計(jì)數(shù)時(shí),合格樣品中針對(duì)感興趣的序列(例如臨床上相關(guān)的序列)的合格序列標(biāo)簽密度被確定,針對(duì)隨后用來(lái)從中識(shí)別歸一化序列的另外序列的序列標(biāo)簽密度也被確定了?;谒?jì)算的合格標(biāo)簽密度,針對(duì)感興趣的序列(例如染色體21)的合格序列劑量(例如染色體劑量)各自作為針對(duì)感興趣的序列的序列標(biāo)簽密度與針對(duì)隨后用來(lái)從中識(shí)別歸一化序列的另外序列的合格序列標(biāo)簽密度的比率而被確定。舉例來(lái)說(shuō),針對(duì)感興趣的染色體(例如染色體21)的染色體劑量是作為針對(duì)染色體21的序列標(biāo)簽密度與針對(duì)所有其余染色體(即,染色體1-20、染色體22、染色體X、以及染色體Y)各自的序列標(biāo)簽密度的比率而確定的??梢葬槍?duì)所有染色體確定合格序列劑量。隨后,基于所計(jì)算的序列劑量在合格樣品中識(shí)別出針對(duì)感興趣的序列(例如染色體21)的至少兩個(gè)歸一化序列。舉例來(lái)說(shuō),針對(duì)染色體21的合格歸一化序列是作為合格樣品中所具有的序列標(biāo)簽密度變異最接近于染色體21的序列標(biāo)簽密度變異的序列而識(shí)別的。舉例來(lái)說(shuō),合格歸一化序列是具有最小變異性的序列。在一些實(shí)施方案中,識(shí)別出兩個(gè)以上的歸一化序列。舉例來(lái)說(shuō),確定了針對(duì)所有染色體1-22、染色體X、以及染色體Y中的每一個(gè)的具有最低變異性的歸一化染色體。實(shí)例5中的表9提供了四個(gè)歸一化染色體,這些歸一化染色體被確定為針對(duì)染色體1-22、染色體X、以及染色體Y中的每一個(gè)的具有四個(gè)最低變異性。如實(shí)例中所示,變異性在數(shù)值上可以表示為變異系數(shù)(CV%)。歸一化序列還 可以是最佳地區(qū)分一個(gè)或多個(gè)合格樣品與一個(gè)或多個(gè)受影響的樣品的序列,即,歸一化序列是具有最大可辨性的序列??杀嫘猿潭瓤梢宰鳛楹细駱悠啡后w中的染色體劑量與一個(gè)或多個(gè)測(cè)試樣品中的染色體劑量之間的統(tǒng)計(jì)學(xué)差異而確定。舉例來(lái)說(shuō),可辨性在數(shù)值上可以表示為T(mén)測(cè)試值,其表示合格樣品群體中的染色體劑量與一個(gè)或多個(gè)測(cè)試樣品中的染色體劑量之間的統(tǒng)計(jì)學(xué)差異??商娲?,可辨性在數(shù)值上可以表示為歸一化的染色體值(NCV),其在NCV呈正態(tài)分布的時(shí)候是針對(duì)染色體劑量的z分值。在確定z分值中,可以使用一組合格樣品中的染色體劑量的均值和標(biāo)準(zhǔn)差??商娲兀梢允褂冒ê细駱悠泛褪苡绊懙臉悠返挠?xùn)練集中的染色體劑量的均值和標(biāo)準(zhǔn)差。在其他實(shí)施方案中,歸一化序列是具有最小變異性和最大可辨性的序列。該方法識(shí)別了天生地具有類似的特征并且傾向于在樣品和測(cè)序批次之間發(fā)生類似的變異的序列,并且這些序列適用于確定測(cè)試樣品中的序列劑量?;趯?duì)合格樣品中的這個(gè)或這些歸一化序列的識(shí)別,使用針對(duì)測(cè)試樣品中的核酸獲得的序列信息確定測(cè)試樣品中針對(duì)感興趣的序列(例如染色體21)的一個(gè)或多個(gè)序列劑量(例如染色體劑量)。在一些實(shí)施方案中,確定了針對(duì)感興趣的序列的至少兩個(gè)序列劑量(例如染色體劑量)。舉例來(lái)說(shuō),使用染色體9作為一個(gè)第一歸一化染色體確定針對(duì)染色體21的一個(gè)第一染色體劑量,并且使用染色體11作為第二歸一化染色體確定針對(duì)染色體21的一個(gè)第二染色體劑量。測(cè)試序列劑量可以進(jìn)一步表示為如下所述的NCV。在一些實(shí)施方案中,可以通過(guò)以下步驟進(jìn)行測(cè)試樣品的分類直接將針對(duì)感興趣的染色體的第一測(cè)試序列劑量與一個(gè)第一閾值進(jìn)行比較并且將第二測(cè)試序列劑量與一個(gè)第二閾值進(jìn)行比較以確定在測(cè)試樣品中存在或不存在一種染色體非整倍性。針對(duì)感興趣的染色體的兩個(gè)染色體劑量的比較驗(yàn)證了樣品分類的確定。根據(jù)用戶定義的可靠性閾值選擇閾值以將樣品分類為“正常的”、“受影響的”或““未判定(no call)的”樣品。在其他實(shí)施方案中,使用一個(gè)第一歸一化染色體確定針對(duì)感興趣的染色體的一個(gè)第一染色體劑量,并且使用一個(gè)第二歸一化染色體確定針對(duì)第一歸一化染色體的一個(gè)第二染色體劑量??梢酝ㄟ^(guò)以下步驟進(jìn)行測(cè)試樣品的分類將第一染色體劑量與一個(gè)第一閾值進(jìn)行比較并且將第二染色體劑量與一個(gè)第二閾值進(jìn)行比較以確定在測(cè)試樣品中存在或不存在一種染色體非整倍性。針對(duì)感興趣的染色體的染色體劑量與一個(gè)第一閾值的比較確定了在測(cè)試樣品中存在或不存在針對(duì)感興趣的染色體的非整倍性,并且針對(duì)歸一化染色體的第二染色體劑量與一個(gè)第二閾值的比較驗(yàn)證了樣品分類的確定。測(cè)試染色體劑量可以進(jìn)一步表示為如下所述的NCV,其中第一和第二染色體劑量表不為第一和第二 NCV ;并且測(cè)試樣品的分類是通過(guò)將第一 NCV與一個(gè)第一閾值進(jìn)行比較并且將第二 NCV與一個(gè)第二閾值進(jìn)行比較來(lái)進(jìn)行的。盡管本文中的實(shí)例涉及完整的染色體非整倍性,但本發(fā)明的概念適用于部分的非整倍性。在一個(gè)實(shí)施方案中,感興趣的序列是與部分的非整倍性(例如染色體缺失或插入、或不平衡的染色體易位)有關(guān)的染色體片段,并且至少兩個(gè)歸一化序列是與部分的非整倍性無(wú)關(guān)的染色體片段,并且這些兩個(gè)歸一化序列的序列標(biāo)簽密度變異最接近于與部分的非整倍性有關(guān)的染色體片段的序列標(biāo)簽密度變異。部分的非整倍性可以使用染色體劑量確定(參見(jiàn)2010年12月I日提交的國(guó)際申請(qǐng)PCT/US2010/058609、以及2010年12月I日提交的美國(guó)專利申請(qǐng)12/958,352,這些申請(qǐng)的名稱都為“用于確定拷貝數(shù)變異的方法(Methodfor Determining Copy Number Variations) ”并且通過(guò)引用以其全文結(jié)合在此)??梢愿鶕?jù)本發(fā)明方法使用至少兩個(gè)歸一化序列驗(yàn)證存在或不存在一種部分的非整倍性。圖I提供了方法100的兩個(gè)示例性實(shí)施方案的流程圖,該方法在包含兩個(gè)基因組 的混合物的樣品(例如母體樣品)中確定并且驗(yàn)證存在或不存在一種染色體非整倍性。在一個(gè)第一實(shí)施方案中,該方法通過(guò)以下步驟在包含胎兒和母體核酸的母體測(cè)試樣品中確定存在或不存在胎兒染色體非整倍性(a)獲得針對(duì)在母體樣品中胎兒和母體核酸的序列信息,以便識(shí)別針對(duì)一個(gè)感興趣的染色體的序列標(biāo)簽的數(shù)目以及針對(duì)至少兩個(gè)歸一化染色體的序列標(biāo)簽的數(shù)目;(b)使用序列標(biāo)簽的數(shù)目來(lái)計(jì)算針對(duì)感興趣的染色體的一個(gè)第一歸一化值和一個(gè)第二歸一化值;并且(C)將針對(duì)感興趣的染色體的第一歸一化值與一個(gè)第一閾值進(jìn)行比較并且將針對(duì)感興趣的染色體的第二歸一化值與一個(gè)第二閾值進(jìn)行比較,以確定在樣品中存在或不存在胎兒非整倍性。第一和第二閾值可以是相同的,或者它們可以是不同的。在這個(gè)方法的步驟(C)中,針對(duì)所述感興趣的染色體的第一歸一化值與閾值的比較表明存在或不存在針對(duì)所述感興趣的染色體的一種非整倍性,并且針對(duì)所述感興趣的染色體的第二歸一化值與閾值的比較驗(yàn)證存在或不存在針對(duì)感興趣的染色體的一種非整倍性的確定。在一些實(shí)施方案中,第一歸一化值是一個(gè)第一染色體劑量,它是針對(duì)感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第一歸一化染色體的序列標(biāo)簽的數(shù)目的比率;并且第二歸一化值是一個(gè)第二染色體劑量,它是針對(duì)感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目的比率。任選地,第一和第二歸一化值可以表示為如下所述的歸一化的染色體值(NCV)。根據(jù)如圖I中示出的方法的步驟110、120、130、以及140描繪第一實(shí)施方案。對(duì)從母體樣品獲得的胎兒和母體核酸進(jìn)行測(cè)序以提供序列標(biāo)簽的數(shù)目(110)。對(duì)被映射到一個(gè)感興趣的染色體(例如染色體21)的序列標(biāo)簽、以及被映射到兩個(gè)歸一化染色體(例如染色體9和染色體11)的序列標(biāo)簽進(jìn)行計(jì)數(shù)并且用于計(jì)算針對(duì)感興趣的染色體的相應(yīng)的第一和第二歸一化值(例如染色體劑量)。在一個(gè)實(shí)施方案中,至少兩個(gè)染色體劑量是針對(duì)各感興趣的染色體確定的歸一化值。在一個(gè)實(shí)施方案中,針對(duì)感興趣的染色體的第一歸一化值是一個(gè)第一染色體劑量,它是針對(duì)感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第一歸一化染色體的序列標(biāo)簽的數(shù)目的比率;并且針對(duì)感興趣的染色體的第二歸一化值是一個(gè)第二染色體劑量,它是針對(duì)感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目的比率(120)。將針對(duì)感興趣的染色體的第一歸一化值(S卩,第一染色體劑量)與一個(gè)第一閾值相比,并且將針對(duì)感興趣的染色體的第二歸一化值(即第二染色體劑量)與一個(gè)第二閾值相比(130),并且進(jìn)行存在或不存在一種染色體非整倍性的確定以及驗(yàn)證(140)。可替代地,至少兩個(gè)染色體劑量表示為第一和第二歸一化的染色體值(NCV),該第一 NCV使第一染色體劑量與在一組合格樣品中相應(yīng)的第一染色體劑量的均值相關(guān)聯(lián),并且第二 NCV使第二染色體劑量與在同一組合格樣品中相應(yīng)的染色體劑量的均值相關(guān)聯(lián),如
權(quán)利要求
1.一種用于在包含胎兒和母體核酸分子的母體測(cè)試樣品中確定存在或不存在胎兒染色體非整倍性的方法,所述方法包括 (a)獲得針對(duì)在所述樣品中所述胎兒和母體核酸的序列信息,以便識(shí)別針對(duì)一個(gè)感興趣的染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目以及針對(duì)至少兩個(gè)歸一化染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目; (b)使用所述序列標(biāo)簽的數(shù)目來(lái)計(jì)算針對(duì)所述感興趣的染色體的一個(gè)第一歸一化值和一個(gè)第二歸一化值;并且 (C)將針對(duì)所述感興趣的染色體的所述第一歸一化值與一個(gè)第一閾值進(jìn)行比較并且將針對(duì)所述感興趣的染色體的所述第二歸一化值與一個(gè)第二閾值進(jìn)行比較,以確定在所述樣品中存在或不存在一種胎兒非整倍性。
2.如權(quán)利要求I所述的方法,其中針對(duì)所述感興趣的染色體的所述第一歸一化值是一個(gè)第一染色體劑量,所述第一染色體劑量是針對(duì)所述感興趣的染色體的序列標(biāo)簽的數(shù)目與一個(gè)第一歸一化染色體的比率,并且其中針對(duì)所述感興趣的染色體的所述第二歸一化值是一個(gè)第二染色體劑量,所述第二染色體劑量是針對(duì)所述感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目的比率。
3.一種用于在包含胎兒和母體核酸分子的母體測(cè)試樣品中確定存在或不存在胎兒染色體非整倍性的方法,所述方法包括 (a)獲得針對(duì)在所述樣品中所述胎兒和母體核酸的序列信息,以便識(shí)別針對(duì)一個(gè)感興趣的染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目以及針對(duì)至少兩個(gè)歸一化染色體的多個(gè)序列標(biāo)簽的一個(gè)數(shù)目; (b)使用針對(duì)所述感興趣的染色體的所述序列標(biāo)簽的數(shù)目以及針對(duì)一個(gè)第一歸一化染色體的序列標(biāo)簽的數(shù)目來(lái)確定針對(duì)所述感興趣的染色體的一個(gè)第一歸一化值;并且使用針對(duì)所述第一歸一化染色體的所述序列標(biāo)簽的數(shù)目以及針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目來(lái)確定針對(duì)所述第一歸一化染色體的一個(gè)第二歸一化值; (c)將針對(duì)所述感興趣的染色體的所述第一歸一化值與一個(gè)第一閾值進(jìn)行比較并且將針對(duì)所述第一歸一化染色體的所述第二歸一化值與一個(gè)第二閾值進(jìn)行比較,以確定在所述樣品中存在或不存在一種胎兒非整倍性。
4.如權(quán)利要求3所述的方法,其中針對(duì)所述感興趣的染色體的所述第一歸一化值是一個(gè)第一染色體劑量,所述第一染色體劑量是針對(duì)所述感興趣的染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第一歸一化染色體的序列標(biāo)簽的數(shù)目的比率,并且其中針對(duì)所述感興趣的染色體的所述第二歸一化值是一個(gè)第二染色體劑量,所述第二染色體劑量是所述第一歸一化染色體的序列標(biāo)簽的數(shù)目與針對(duì)一個(gè)第二歸一化染色體的序列標(biāo)簽的數(shù)目的比率。
5.如權(quán)利要求I到4中任何一項(xiàng)所述的方法,進(jìn)一步包括確定一個(gè)第一歸一化的染色體值和一個(gè)第二歸一化的染色體值(NCV),其中所述第一 NCV使所述第一染色體劑量與在一組合格樣品中相應(yīng)的第一染色體劑量的均值相關(guān)聯(lián),并且其中所述第二 NCV使所述第二染色體劑量與在一組合格樣品中相應(yīng)的第二染色體劑量的均值相關(guān)聯(lián),作為 其中A和^對(duì)應(yīng)地是針對(duì)在一組合格樣品中第j個(gè)染色體劑量的 估算均值和標(biāo)準(zhǔn)差,并且Xu是針對(duì)測(cè)試樣品i所觀察到的第j個(gè)染色體劑量。
6.如權(quán)利要求I到5中任何一項(xiàng)所述的方法,其中 針對(duì)染色體21的所述歸一化染色體是選自染色體9、11、14、以及I ; 針對(duì)染色體18的所述歸一化染色體是選自染色體8、3、2、以及6 ; 針對(duì)染色體13的所述歸一化染色體是選自染色體4、染色體2-6的群組、染色體5、以及染色體6 ; 針對(duì)染色體X的所述歸一化染色體是選自染色體6、5、13、以及3 ; 針對(duì)染色體I的所述歸一化染色體是選自染色體10、11、9、以及15 ; 針對(duì)染色體2的所述歸一化染色體是選自染色體8、7、12、以及14 ; 針對(duì)染色體3的所述歸一化染色體是選自染色體6、5、8、以及18 ; 針對(duì)染色體4的所述歸一化染色體是選自染色體3、5、6、以及13 ; 針對(duì)染色體5的所述歸一化染色體是選自染色體6、3、8、以及18 ; 針對(duì)染色體6的所述歸一化染色體是選自染色體5、3、8、以及18 ; 針對(duì)染色體7的所述歸一化染色體是選自染色體12、2、14、以及8 ; 針對(duì)染色體8的所述歸一化染色體是選自染色體2、7、12、以及3 ; 針對(duì)染色體9的所述歸一化染色體是選自染色體11、10、I、以及14 ; 針對(duì)染色體10的所述歸一化染色體是選自染色體1、11、9、以及15 ; 針對(duì)染色體11的所述歸一化染色體是選自染色體1、10、9、以及15 ; 針對(duì)染色體12的所述歸一化染色體是選自染色體7、14、2、以及8 ; 針對(duì)染色體14的所述歸一化染色體是選自染色體12、7、2、以及9 ; 針對(duì)染色體15的所述歸一化染色體是選自染色體I、10、11、以及9 ; 針對(duì)染色體16的所述歸一化染色體是選自染色體20、17、15、以及I ; 針對(duì)染色體17的所述歸一化染色體是選自染色體16、20、19、以及22 ; 針對(duì)染色體19的所述歸一化染色體是選自22、17、16、以及20 ; 針對(duì)染色體20的所述歸一化染色體是選自染色體16、17、15、以及I ;并且 針對(duì)染色體22的所述歸一化染色體是選自染色體19、17、16、以及20。
7.如權(quán)利要求I到6中任何一項(xiàng)所述的方法,其中確定了至少兩種不同的胎兒染色體非整倍性的存在或不存在。
8.如權(quán)利要求7所述的方法,其中 (i)所述方法包括針對(duì)至少兩個(gè)感興趣的染色體重復(fù)如權(quán)利要求I或權(quán)利要求2所述的方法來(lái)確定存在或不存在所述不同的胎兒染色體非整倍性;或 (ii)所述方法包括針對(duì)至少兩個(gè)感興趣的染色體重復(fù)如權(quán)利要求3或權(quán)利要求4所述的方法來(lái)確定存在或不存在所述不同的胎兒染色體非整倍性;或 (iii)所述方法包括針對(duì)至少兩個(gè)感興趣的染色體重復(fù)如權(quán)利要求5所述的方法。
9.如權(quán)利要求7或權(quán)利要求8所述的方法,其中該方法包括針對(duì)所有染色體重復(fù)如權(quán)利要求I到5中任何一項(xiàng)所述的方法來(lái)確定存在或不存在不同的胎兒染色體非整倍性。
10.如權(quán)利要求I到6中任何一項(xiàng)所述的方法,其中所述胎兒染色體非整倍性是選自T21、T13、T18、以及單體性X ;或如權(quán)利要求7到9中任何一項(xiàng)所述的方法,其中所述不同的胎兒染色體非整倍性是選自T21、T13、T18、以及單體性X。
11.如以上權(quán)利要求中任何一項(xiàng)所述的方法,其中所述母體樣品是從一位孕婦獲得的; 所述母體樣品是一種生物學(xué)流體樣品; 所述母體樣品是一個(gè)血漿樣品;和/或 所述核酸分子是cfDNA分子。
12.如以上權(quán)利要求中任何一項(xiàng)所述的方法,其中獲得針對(duì)在該樣品中的這些胎兒和母體核酸的序列信息包括對(duì)在該樣品中的胎兒和母體核酸分子進(jìn)行測(cè)序。
13.如權(quán)利要求12所述的方法,其中 獲得所述序列信息包括下一代測(cè)序(NGS); 獲得所述序列信息包括使用多個(gè)可逆染料終止子進(jìn)行合成法測(cè)序; 獲得所述序列信息包括連接法測(cè)序;或 獲得所述序列信息包括單分子測(cè)序。
14.如以上權(quán)利要求中任何一項(xiàng)所述的方法,其中所述染色體非整倍性是一種部分的或完整的染色體非整倍性。
15.如以上權(quán)利要求中任何一項(xiàng)所述的方法,其中所述母體測(cè)試樣品是從一位孕婦獲得的血漿樣品,并且所述核酸分子是cfDNA分子。
全文摘要
本發(fā)明提供了一種能夠在包含胎兒和母體核酸的母體樣品中檢測(cè)單個(gè)或多個(gè)胎兒染色體非整倍性并且驗(yàn)證已作出正確的確定的方法。該方法適用于在多個(gè)樣品中確定任何感興趣的序列的拷貝數(shù)變異(CNV),這些樣品包含來(lái)源于兩個(gè)不同基因組的基因組核酸的混合物,并且已知或懷疑這兩個(gè)不同基因組在一個(gè)或多個(gè)感興趣的序列的量方面不同。該方法至少適用于無(wú)創(chuàng)性產(chǎn)前診斷的實(shí)施,并且適用于與健康個(gè)體對(duì)比患病的個(gè)體中序列表達(dá)差異有關(guān)的病狀的診斷和監(jiān)測(cè)。
文檔編號(hào)C12Q1/68GK102985561SQ201180022971
公開(kāi)日2013年3月20日 申請(qǐng)日期2011年4月14日 優(yōu)先權(quán)日2011年4月14日
發(fā)明者里查德·P·拉瓦 申請(qǐng)人:維里納塔健康公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
朝阳市| 新泰市| 邓州市| 绩溪县| 阿合奇县| 玛纳斯县| 北票市| 车致| 云霄县| 中方县| 绥棱县| 石林| 夏津县| 象山县| 阳江市| 江孜县| 吉安县| 和硕县| 无极县| 佛教| 侯马市| 万载县| 黄骅市| 芦溪县| 上饶县| 平昌县| 聊城市| 田东县| 东明县| 南召县| 惠水县| 阳城县| 沙洋县| 巩留县| 辽阳县| 伊金霍洛旗| 濮阳市| 台中市| 江都市| 庆城县| 建湖县|