專利名稱:遺傳分析的方法
背景技術(shù):
構(gòu)成人類染色體的DNA為體內(nèi)所有蛋白的合成提供了指導(dǎo)。這些蛋白質(zhì)具有對生命至關(guān)重要的功能。在編碼蛋白的DNA序列中的變異在所編碼的蛋白中產(chǎn)生了變異或突變,由此影響了細(xì)胞的正常功能。盡管環(huán)境通常在疾病中起到重要的作用,但個體DNA的變異和/或突變卻直接與幾乎所有的人類疾病相關(guān),包括心血管疾病,代謝和傳染病,癌癥,以及自身免疫紊亂。不僅如此,遺傳學(xué),尤其是人類遺傳學(xué)的知識,引導(dǎo)了對由若干基因或其產(chǎn)物的相互作用導(dǎo)致的眾多疾病的認(rèn)識。例如,I型和II型糖尿病就與多個基因相關(guān),每個基因都具有自己的突變模式。
此外,當(dāng)涉及到藥物反應(yīng)---遺傳藥理學(xué)領(lǐng)域時,人類遺傳學(xué)知識對個體間差異的理解有所局限。約半個世紀(jì)之前,不良藥物反應(yīng)總是和兩種藥物代謝酶,即血漿膽堿酯酶和葡萄糖-6-磷酸脫氫酶中的氨基酸變異相關(guān)。從那時起,精細(xì)的遺傳分析就將超過35種藥物代謝酶,25種藥靶和5種藥物遞質(zhì)中的序列多態(tài)性(變異)與藥物效率或安全性的中和水平聯(lián)系起來(Evans and Relling,Sceince 296487-91(1999))。在臨床上,這樣的信息可用來預(yù)防藥物毒性;例如,對患者進(jìn)行巰基嘌呤甲基轉(zhuǎn)移酶基因遺傳差異的常規(guī)篩選,所述基因能引起6-巰基嘌呤或咪唑硫嘌呤代謝的降低。然而在所觀察到的藥物毒性中,只有一小部分能夠由沿用至今依然有效的藥理遺傳學(xué)標(biāo)記組合進(jìn)行令人滿意地解釋。比毒性問題更常見的是這樣的情況,即使是證明了對某些個體是安全和/或有效的藥物對其他個體不是治療效率欠佳就是具有尚未可知的副作用。
因?yàn)槿我鈨蓚€人的遺傳組成是99.9%相似的,所以他們基因組DNA的絕大部分序列是一致的。不過,個體間的DNA序列也有差異。例如,在編碼或非編碼區(qū)的多個重復(fù)DNA元件中存在有多堿基DNA片段的缺失,DNA片段的插入和變異,在基因組中單個含氮堿基位置上發(fā)生的改變稱為“單核苷酸多態(tài)性”(SNPs)。人類DNA序列的變異解釋了大部分所觀察到的個體將的差異,包括對疾病的易感性或抵抗力以及個體如何對特定的治療劑或治療方案進(jìn)行反應(yīng)。
多因素性狀,或復(fù)雜性狀受到多種因素的影響,例如基因,環(huán)境因素和它們的相互作用。通常,會有不止一種遺傳和/或遺傳因素產(chǎn)生相同的多因素性狀,這種復(fù)雜性使研究人員很難確定哪一種因素會發(fā)展哪一種性狀。此外,每種因素的貢獻(xiàn)通常與其他每種因素的貢獻(xiàn)不相一致。換言之,例如,某些因素會具有較大的貢獻(xiàn)而其他的貢獻(xiàn)則相對較弱。為了使多因素性狀的生物基礎(chǔ)變得更加復(fù)雜,因素的貢獻(xiàn)可以是加和的,協(xié)同性的或完全獨(dú)立于任意其它因素的貢獻(xiàn)。某些復(fù)雜性狀表現(xiàn)出常見疾病,例如心血管疾病,糖尿病,肥胖,和高膽固醇癥。其他的復(fù)雜性狀包括個體對藥物或其它醫(yī)學(xué)治療方案產(chǎn)生反應(yīng)的表現(xiàn)型。
近來,對疾病遺傳基礎(chǔ)的深入研究發(fā)展了疾病的若干遺傳檢測。然而,這些檢測并不能有效地預(yù)測健康人發(fā)展常見多因素疾病的可能性。由于每個所涉及基因的不完全外顯率和較低的個體貢獻(xiàn),許多研究人員認(rèn)為對常見多因素性狀(例如,疾病)進(jìn)行的遺傳檢測在實(shí)踐中并無甚用(Holtzman and Marteau,2000;Vineis et al 2001)。不過,這些爭論大部分都是基于單個座來預(yù)測個體是否會表現(xiàn)出所述性狀(Beaudet1999;Evans et al 2001)。需要的是一種可靠的方法確定個體發(fā)展或表現(xiàn)出基于多個基因座的個體基因型的多因素性狀的風(fēng)險,每一基因座都是所述多因素性狀表現(xiàn)中的因素。
發(fā)明內(nèi)容
本申請公開用于確定個體發(fā)展或表現(xiàn)出多因素性狀的奉獻(xiàn)的方法,通過基于在多個雙等位基因多態(tài)座上個體的基因型確定評分,并將所述評分與至少一個閾值進(jìn)行比較進(jìn)行。在一個實(shí)施方案中,對于每一多態(tài)座而言,個體的基因型可以是相關(guān)等位基因的純合子,非相關(guān)等位基因的純合子或雜合子。如果個體的評分高于閾值,個體就被認(rèn)為是處于發(fā)展或者表現(xiàn)多因素性狀的風(fēng)險之中,并且如果個體的評分等于或者小于閾值,那么個體可能會被認(rèn)為并不在發(fā)展或者表現(xiàn)多因素性狀的風(fēng)險之中。如果個體的評分高于一個閾值但是小于或者等于另一閾值,那么該個體可能被認(rèn)為是具有發(fā)展或者表現(xiàn)多因素性狀的中等風(fēng)險。
本申請還公開了鑒定與多因素性狀相關(guān)的雙等位基因多態(tài)座的等位基因的方法,在這里稱作“相關(guān)等位基因”。該方法包括實(shí)施相關(guān)分析,其中將顯示多因素性狀的個體組(“患者組”)的遺傳組成與不顯示多因素性狀的個體組(“對照組”)的遺傳組成相比較,并鑒定那些在患者組的遺傳組成中比對照組的遺傳組成更顯著流行的等位基因作為相關(guān)等位基因。在某些實(shí)施方案中,在用第一患者組和第一對照組在第一相關(guān)分析中鑒定的相關(guān)等位基因通過用第二患者組和第二對照組實(shí)施第二相關(guān)分析進(jìn)行驗(yàn)證。
本申請還公開了用于確定用于多基因檢驗(yàn)的閾值的方法。在一個方面,通過分析基于來自患者組的一組評分和來自對照組的一組評分的一系列風(fēng)險邊界值確定閾值。確定閾值包括使用包括但不限于靈敏度,特異性,PPV,NPV,準(zhǔn)確度,相對風(fēng)險,LR+和LR-的信息用于利用每一風(fēng)險邊界值作為閾值的多基因檢驗(yàn);關(guān)于多因素性狀,潛在的治療選擇,以及接受檢驗(yàn)的個體的臨床信息;以及來自于至少一家管理機(jī)構(gòu)的信息。
本發(fā)明還公開了一種診斷或預(yù)測分析,包括設(shè)計(jì)用于檢測生物樣品中相關(guān)等位基因的核酸探針。在某些實(shí)施方案中,所述診斷或預(yù)測分析的探針結(jié)合于固體基質(zhì)。
圖1所示為在多基因檢測中建立閾值的示例性受體操作特征曲線。
發(fā)明詳述概述本發(fā)明的某些實(shí)施方案提供了以較高確定性確定個體發(fā)展或表現(xiàn)出多因素性狀易感性體質(zhì)的方法,這些易感性體質(zhì)可以是,例如發(fā)展疾病或其他紊亂,或者是對于藥物的陽性或陰性反應(yīng)。這樣的確定是基于多個遺傳座上的個體基因型,每種基因座是參與多因素性狀表現(xiàn)的遺傳因素。所述方法還提供了這樣的好處,即在不知道各個遺傳因素對該多因素性狀表現(xiàn)的影響程度或影響方式的情況下就可進(jìn)行測定。與以往不同,本發(fā)明的方法依賴于多遺傳因素的累積效應(yīng),并使得本領(lǐng)域技術(shù)人員可基于已被確定為與多因素性狀發(fā)生相關(guān)的多個遺傳座上的個體的基因型,對該個體發(fā)展或表現(xiàn)多因素性狀的可能性做出準(zhǔn)確的預(yù)測。
多因素性狀受到多個遺傳因素,環(huán)境因素,及其相互作用的影響。而且,每個因素的貢獻(xiàn)通常與其他各個因素的貢獻(xiàn)并不一致。換言之,例如,某些因素會具有較大的貢獻(xiàn)而其他的貢獻(xiàn)則相對較弱。為了使得多因素性狀的生物基礎(chǔ)更加復(fù)雜,單因素的貢獻(xiàn)可以是加和性的,協(xié)同性的,或完全獨(dú)立于任意其他因素的貢獻(xiàn)。在某些實(shí)施方案中,本文所提供的方法并既不依賴于每種因素對多因素性狀的影響程度,也不依賴于是否所述因素的效應(yīng)是加和性的,協(xié)同性的或獨(dú)立性的。在這樣的實(shí)施方案中,當(dāng)計(jì)算個體發(fā)展這種多因素性狀的“風(fēng)險”(例如,可能性,概率)時,該方法并不需要將每種因素的效應(yīng)程度考慮在內(nèi)。在某些實(shí)施方案中,所述方法并不要求對包含某種因素,遺傳相關(guān)于某種因素,或是某種因素產(chǎn)物的任意基因的表達(dá),RNA或蛋白的知識有所了解。在某些實(shí)施方案中,所述方法對可能影響所述多因素性狀的環(huán)境因素的知識沒有要求。在某些實(shí)施方案中,在此給出的方法依賴于一系列假設(shè),即每個遺傳因素的單個貢獻(xiàn)與每個其他遺傳因素的貢獻(xiàn)是相同的,在導(dǎo)致所述多因素性狀的所有遺傳因素中這樣的單個貢獻(xiàn)具有簡單的加性效應(yīng),以及可在缺乏了解環(huán)境因素對該多因素性狀的表現(xiàn)具有哪些貢獻(xiàn)的條件下對該個體的風(fēng)險進(jìn)行評估。在其它實(shí)施方案中,該方法還考慮到了所述因素的其他特征,例如,每種因素對該多因素性狀的效應(yīng)幅度,和/或當(dāng)計(jì)算個體發(fā)展多因子性狀的風(fēng)險時所述因素是否是加和性的,協(xié)同性的,抗性的,獨(dú)立的或上位性的。在某些實(shí)施方案中,可以將表達(dá)數(shù)據(jù)考慮在內(nèi)。在其他實(shí)施方案中,對可能影響多因素性狀的環(huán)境因素的認(rèn)知會在計(jì)算個體發(fā)展多因素性狀的風(fēng)險時被考慮在內(nèi)。
本發(fā)明的某些實(shí)施方案提供了實(shí)施相關(guān)研究的方法來鑒定與多因素性狀相關(guān)的多態(tài)座組。同樣還提供了確定哪組相關(guān)的多態(tài)座包括在該多因素性狀的多基因檢測中的方法,并提供了確定這些檢測的確切特征,例如,靈敏度,特異性,陽性預(yù)測值,陰性預(yù)測值,相關(guān)風(fēng)險,可能性比率,準(zhǔn)確度等的手段。此外,還提供了在多基因檢測中使用一組相關(guān)的多態(tài)座來測定個體發(fā)展或表現(xiàn)出該多因素性狀的易感性的方法。在一個實(shí)施方案中,該多因素性狀是疾病,并且可以對鑒定為可能發(fā)展該疾病的個體進(jìn)行治療或其它醫(yī)療介入從而對該疾病的發(fā)展進(jìn)行治療或預(yù)防。在另一個實(shí)施方案中,本發(fā)明的方法可用來對建議性的醫(yī)療治療效率進(jìn)行預(yù)測,其中如果該治療不是很有效的話,則不會對患者進(jìn)行給藥。在另一個實(shí)施方案中,所述多因素性狀是對藥物治療產(chǎn)生的副作用的表現(xiàn)。鑒定會表現(xiàn)出副作用的個體可被排除在藥物治療范圍之外,或者如果進(jìn)行藥物(例如,萬不得已)治療的話,可以在對副作用的預(yù)測中使用其他監(jiān)控措施。在又一個實(shí)施方案中,在此公開的方法可用于藥物開發(fā),尤其是通過選擇適合于研究的患者來增加藥物的效率和安全性。
正如對本領(lǐng)域所屬技術(shù)人員顯而易見地,本發(fā)明的方法可用作對具有或處于發(fā)展感興趣多因素性狀風(fēng)險的個體進(jìn)行鑒定的輔助工具,而且,在此所述的方法也可與涉及到性狀,被測個體,和進(jìn)行個體選擇的人群的臨床信息,以及其他臨床檢測和甚至是醫(yī)務(wù)人員的臨床“直覺”組合使用。遺傳檢測通常給醫(yī)療人員提供輔助,而支配臨床決定的做出。實(shí)際上,正是醫(yī)療人員來確定如何使用診斷或預(yù)測檢測,其采用例如,性狀的臨床知識(例如,疾病)和潛在的治療選擇,所述診斷檢測的特征,發(fā)展所述檢測的人群,以及接受檢測的特定患者,且與此同時來對所述檢測錯誤鑒定個體和正確鑒定個體之間的風(fēng)險和受益進(jìn)行平衡。在另一方面,醫(yī)療人員還應(yīng)考慮到與被所述檢測錯誤鑒定為“陰性”個體的風(fēng)險相對比的被所述檢測錯誤鑒定為“陽性”個體的風(fēng)險(例如,對需要此種治療的患者停止治療從而引起比不需要治療的患者進(jìn)行給藥治療更嚴(yán)重的傷害?)。
現(xiàn)對本發(fā)明的多種實(shí)施方案和具體的應(yīng)用進(jìn)行詳細(xì)描述。雖然本發(fā)明是連同多種實(shí)施方案和應(yīng)用進(jìn)行說明的,但仍需理解這些實(shí)施方案和應(yīng)用并非旨在對本發(fā)明進(jìn)行限制。相反,本法明旨在包括可包括于本發(fā)明精神和范圍之內(nèi)的替換,修飾和等價變換。
相關(guān)分析在本發(fā)明的一個方面,通過實(shí)施相關(guān)分析鑒定了與多因素性狀表現(xiàn)相關(guān)的多態(tài)坐位組合和對應(yīng)于這些多態(tài)座的相關(guān)等位基因,并且這些相關(guān)等位基因被進(jìn)一步用來確定不是患者患者或者對照成員的個體是否是具有發(fā)展或表現(xiàn)出所述多因素性狀的遺傳傾向。多因素性狀可以是任意類型的表現(xiàn)型性狀,例如疾病或其它醫(yī)學(xué)紊亂的表現(xiàn),對這些疾病或紊亂的易感性或抵抗力,對藥物或其它醫(yī)療治療方式的反應(yīng),或其他身體或精神的特征。例如,在一個實(shí)施方案中,該多因素性狀是一種疾病,而相關(guān)分析可對對藥物表現(xiàn)出疾病(患者)個體組的遺傳組成和未表現(xiàn)出疾病(對照)個體組的遺傳組成進(jìn)行比較。多因素疾病的例子包括,但不局限于,哮喘及其他肺病,牛皮癬,誦讀困難,不育癥,痛風(fēng),白內(nèi)障,肥胖,糖尿病,胃腸機(jī)能紊亂,癌癥,心血管疾病,中風(fēng),高血壓,注意力缺損障礙,精神分裂癥,躁郁癥,骨質(zhì)疏松癥,免疫系統(tǒng)紊亂,多發(fā)性硬化,動脈粥樣硬化和癲癇癥。某些發(fā)育異常也同樣包括在這一類別中,比如兔唇/腭,先天性心臟缺損和神經(jīng)管缺陷。在另一個實(shí)施方案中,該多因素性狀是對藥物的反應(yīng),且相關(guān)分析可對對藥物表現(xiàn)出特定反應(yīng)的(患者)個體組的遺傳組成和未表現(xiàn)出該特定反應(yīng)(對照)個體組的遺傳組成進(jìn)行比較。在一方面,藥物反應(yīng)可與該藥物的效力相關(guān)。例如,該藥物可能對患者組中的個體具有極高的效力,卻對對照組中的個體具有較低的效力,反之亦然。在另一方面,藥物反應(yīng)可能與對給藥該藥物產(chǎn)生的不良反應(yīng)相關(guān)。例如,患者組中的個體可能具有對于該藥物的不良反應(yīng),而對照組中的個體則沒有該不良反應(yīng)。盡管在此提供的諸多實(shí)施例都描述了本發(fā)明的方法與特定多因素性狀的組合應(yīng)用,但這些實(shí)施例并非旨在對本發(fā)明的范圍進(jìn)行限制,本發(fā)明的范圍包括了在此所述方法與其表現(xiàn)涉及多個遺傳座的任意多因素性狀的組合使用。
通常,每個患者組和對照組中都至少為50個個體,優(yōu)選為至少100個個體。在某些研究中,在至少一個患者組和對照組中有至少200,或至少500個個體。通常對照組中的個體數(shù)比患者組中的多。在某些實(shí)施方案中,患者組和對照組中的個體是哺乳動物,但患者組和對照組也可以包括非哺乳動物個體,例如,細(xì)菌,真菌,原生生物,病毒,古細(xì)菌,及其他真核生物,比如,爬行動物,兩棲動物,魚類,鳥類,甲殼類動物,昆蟲和植物。在某些實(shí)施方案中,患者組和對照組中的個體是人。
通常,除了已經(jīng)考慮的多因素性狀之外,患者組和對照組的組成應(yīng)該具有類似的特征。例如,在一個實(shí)施方案中,每組中選擇的都是相似數(shù)量的具有相似年齡的男人和女人。在某些實(shí)施方案中,環(huán)境風(fēng)險因素也會影響患者組和對照組的組成。例如,在肺癌的研究中,只有吸煙的人(或者只有不吸煙的人)可被選擇到患者組和對照組中。在本發(fā)明的某些實(shí)施方案中,對患者組和對照組的成員資格進(jìn)行了調(diào)整,從而在進(jìn)行相關(guān)分析之前使兩個組的人員結(jié)構(gòu)“匹配”。人員結(jié)構(gòu)(或“人員層次”)是指群體內(nèi)個體遺傳組成的異源性。例如,由于兩個組別不同的人種來源,主要由意大利人組成的患者組的人員結(jié)構(gòu)就與主要由墨西哥人組成的對照組不盡相同。如果在兩個組別不相匹配的情況下進(jìn)行相關(guān)分析,那么與意大利裔祖先而不是與墨西哥裔祖先相關(guān)的遺傳座就會在研究中錯誤地與該多因素性狀相關(guān)。通過對患者組和對照組的人員結(jié)構(gòu)進(jìn)行匹配,本領(lǐng)域所屬技術(shù)人員可以對與感興趣多因素性狀非相關(guān)的患者組和對照組之間的遺傳差異進(jìn)行控制。因此,通過后續(xù)相關(guān)分析鑒定出的兩組之間的遺傳差異更可能是與感興趣多因素性狀偶然相關(guān)的座。在實(shí)施相關(guān)分析之前對患者組和對照組進(jìn)行匹配的方法已在申請日為2003年4月30日,題為“Method forIdentifying Matched Groups”的美國發(fā)明專利申請10/427,696號;和申請日為2003年8月26日,題為“Matching Strategies for GeneticAssociation Studies in Structured Populations”的美國臨時專利申請第60/497,771號在中詳細(xì)公開。
從患者組和對照組的個體中采集核酸樣品用于基因型分析。核酸樣品可以是DNA或RNA,并且可從多種生物樣品中得到,例如,全血,精液,唾液,眼淚,糞便物,尿液,汗液,口腔,皮膚和毛發(fā)。在某些方面,核酸樣品包括基因組DNA??梢允褂帽绢I(lǐng)域公知的任意方法來制備用于分析的樣品核酸。優(yōu)選地,采用這些技術(shù)可生產(chǎn)出核酸分子,其純度足以在該核酸分子的一個或多個位點(diǎn)確定一種或多種多態(tài)性的存在與否。這樣的技術(shù)是公知的,并可在例如Sambrook,et al,Molecular CloningA Laboratory Manual(Cold Spring Harbor Laboratory,New York)(2001),和Ausubel,et al,Current Protocols in MolecularBiology(John Wiley and Sons,New York)中找到。
在確定所述核酸中的一種或多種多態(tài)存在與否之前,可對一種或多種感興趣的核酸進(jìn)行擴(kuò)增和/或標(biāo)記??蓪⒈绢I(lǐng)域所屬技術(shù)人員公知的任意擴(kuò)增技術(shù),與包括但不限于聚合酶鏈反應(yīng)技術(shù)(PCR)的本發(fā)明的某些方法共同使用??墒褂帽绢I(lǐng)域所屬技術(shù)人員公知的材料和方法實(shí)施PCR。一般的PCR技術(shù)可參見Principals and Application for DNAamplification(ed HA Erlich,F(xiàn)reeman Press,NY,NY,1992);PCRProtocolsA Guide to Methods and Applications(eds Innis,et al,Academic Press,San Diego,CA,1990);Matilla et al,Nucleic Acids Res194937(1991);Eckert et al,PCR Methods and Applications 117(1991);PCR(eds McPherson et al,IRL Press,Exford)和美國專利第4,683,202號。其他適當(dāng)?shù)姆椒ㄟ€包括連接酶鏈反應(yīng)(LCR)(參見Wu and Wallace,Genomics 4560(1989)and Landergren et al,Science 2411077(1988)),轉(zhuǎn)錄擴(kuò)增(Kwoh et al,Proc Natl Acad Sci USA 861173(1989)),自我維持的序列復(fù)制(Guatelli et al,Proc Natl Acad Sci USA 871874(1990))和基于核酸的序列擴(kuò)增(NASBA)。此外,在未決的美國專利申請第10/106,097號,申請日為2002年3月26日,題為“Methods for Genomic Analysis”;第10/042,406號,申請日為2002年1月9日,題為“Algorithms forSelection of Primer Pairs”;第10/042,492號,申請日為2002年1月9日,題為“Methods for Amplification of Nucleic Acids”;第10/236,480號,申請日為2002年9月5日,題為“Methods for Amplification ofNucleic Acids”;第10/174,101號,申請日為2002年6月17日,題為“Methods for Storage of Reaction Cocktails”;第10/447,685號,申請日為2003年5月28日,題為“Liver Related Disease Compositions andMethods”;第10/768,788號,申請日為2004年3月4日,題為“Apparatusand Methods for Analyzing and Characterizing Nucleic Acid Sequences”;和第10/427,696號,申請日為2003年4月30日,題為“Methods forIdentifying Matched Groups”中公開的方法也適于在本發(fā)明的某些方法中用來對核酸進(jìn)行擴(kuò)增,標(biāo)記,或進(jìn)一步操作(即,片段化)。
在相關(guān)分析中,在每個患者組和對照組中對每個成員公知為多態(tài)的遺傳座(例如,SNPs)進(jìn)行基因型分析,并且根據(jù)所述組別中出現(xiàn)的基因型計(jì)算每個組別中每個座的相對等位基因頻率。換言之,如果對10個多態(tài)座進(jìn)行基因型分析,那么就可確定20個相對等位基因頻率,患者組和對照組各10個。對于給定的多態(tài)座,可將患者組的相對等位基因頻率與對照組的進(jìn)行比較,如果該多態(tài)座在患者組中比在對照組中的相對等位基因頻率具有顯著差異,則其可被鑒定為與區(qū)分患者組和對照組的多因素性狀相關(guān)的座(“相關(guān)座”)。在某些實(shí)施方案中,相對等位基因頻率的顯著差異大于約5%,或者大于約8%,或者大于約10%,或者大于約12%,或者大于約15%。在患者群體中出現(xiàn)更頻繁的等位基因可稱為“相關(guān)等位基因”,而在對照群體中出現(xiàn)更頻繁的等位基因可稱為“非相關(guān)等位基因”。所鑒定的相關(guān)座的數(shù)量(以及,由此,對于雙等位基因相關(guān)座的相關(guān)等位基因)會隨著所研究的對該多因素性狀(例如,疾病)具有貢獻(xiàn)的多態(tài)座的數(shù)量發(fā)生廣泛的變化,或者與具有貢獻(xiàn)的座形成連鎖不平衡。例如,如果疾病的表現(xiàn)涉及10個基因,那么所鑒定的相關(guān)座的數(shù)量就會隨著與引起該疾病的10個基因的等位基因形成連鎖不平衡的在該相關(guān)分析中進(jìn)行基因型分析的多態(tài)座的數(shù)量變化而變化。通常,涉及多因素性狀表現(xiàn)的座數(shù)量介于約5個至數(shù)百個之間,但也可能更多或更少。關(guān)于使用患者組和對照組的相對等位基因頻率實(shí)施相關(guān)分析方法的詳細(xì)描述,請參見第60/460,329號,申請日為2003年4月3日和第10/768,788號,申請日為2004年1月30日,兩者都題為“Apparatus and Methods for Analyzing and CharacterizingNucleic Acid Sequences”的美國專利申請。
可使用本領(lǐng)域所屬人員公知的任意技術(shù)對個體實(shí)施基因型分析。優(yōu)選的技術(shù)允許對最低量的樣品操作的多個變異進(jìn)行快速,準(zhǔn)確的測定。一些適當(dāng)?shù)募夹g(shù)涉及但不限于直接DNA測序,毛細(xì)管電泳,雜交,等位基因特異性探針或引物,單鏈構(gòu)象多態(tài)性分析,核酸分析,珠分析,限制性片段長度多態(tài)性分析,剪切酶片段長度多態(tài)性分析,隨機(jī)擴(kuò)增的多態(tài)性DNA,連接酶檢測反應(yīng),異源雙鏈或片段分析,使用質(zhì)譜的差異測序,原子力顯微觀察法,熱測序,F(xiàn)RET(即,TaqMan(AppliedBiosystems,Inc,F(xiàn)oster City,CA)和分子信標(biāo)(Stratagene,La Jolla,CA))分析,以及其他本領(lǐng)域公知的技術(shù)。若干DNA測序的方法是本領(lǐng)域公知且通常能夠獲得的??蓞⒁?,例如,Sambrook,et al,Molecular CloningA Laboratory Manual(Cold Spring Harbor Laboratory,New York)(2001);Ausubel,et al,Current Protocols in Molecular Biology(John Wiley andSons,New York)(1997),Twyman,et al(2003)“Techniques Patens for SNPGenotyping”,Pharmacogenomics 4(1)67-79;和Kristensen,et al(2001)“High-Throughput Methods for Detection of Genetic Variation”,BioTechniques 30(2)318-332。對于使用核酸分析(DNA芯片)對例如SNPs進(jìn)行測定的詳細(xì)情況,請參見Lipshultz等人的美國專利第6,300,063號,和Chee等人的美國專利第5,837,832號,以及HuSNPMapping Assay,試劑盒和用戶手冊,Affymetrix Part No.90094(Affymetrix,Santa Clara,CA)。
可以直接測定患者組或?qū)φ战M的相對等位基因頻率,通過對群體中的所有個體進(jìn)行個體的基因型測定來確定在該群體的每個成員中每種等位基因的確切數(shù)量。對多個個體進(jìn)行個體基因型分析的方法已在美國專利申請第10/351,973號,申請日為2003年1月27日,題為“Apparatus and Methods for Determining Individual Genotypes”和美國專利申請第號(未指定),事務(wù)所卷號100/1046-20,申請日為2004年2月24日,題為“Improvements to Analysis Methods for IndividualGenotyping”中詳細(xì)描述?;蛘?,可使用混合的基因型分析來確定每個患者組和對照組的相對等位基因頻率。對混合基因型分析而言,可將來自患者組的核酸樣品混合到一起(患者混合物)并將來自對照組的核酸樣品混合到一起(對照混合物),通過對患者混合物和對照混合物進(jìn)行分析確定對于該患者組和對照組的相對等位基因頻率。實(shí)施混合基因型分析的方法在美國專利申請第60/460,329號,申請日為2003年4月3日和第10/768,788號,申請日為2004年1月30日,兩者都題為“Apparatus and Methods for Analyzing and Characterizing Nucleic AcidSequences”的美國專利申請中已進(jìn)行過詳細(xì)討論。
基因座術(shù)語“SNP”或“單核苷酸多態(tài)性”是指個體之間的遺傳差異;例如,在生物體DNA的單個含氮堿基位置上有所差異。SNP在整個基因組中都有發(fā)現(xiàn),有許多個體間的遺傳差異就是源于在SNP座上的差異,且通常這樣的遺傳差異會導(dǎo)致個體間表現(xiàn)型的差異。用于本發(fā)明中的SNP及其各自的等位基因可來自多種來源,例如公共數(shù)據(jù)庫(UCSanta Cruz Human Genome BrowserGateway)(http://genomeusucedu/cgi-bin/hgGateway)或NCBI dbSNP網(wǎng)站(http:///www.ncbi.nlm.nih.gov/SNP/),或可如美國專利申請第10/106,097號,申請日為2002年3月26日,題為“Methods for Genomic Analysis”和第10/284,444號,申請日為2002年10月31日,題為“Human GenomicPolymorphisms”所描述的美國專利申請?jiān)囼?yàn)性地進(jìn)行測定。雖然在本說明書給出的某些實(shí)施方案中對SNP的使用進(jìn)行了描述,但應(yīng)該理解也可以使用其他的雙等位遺傳標(biāo)記。雙等位基因遺傳標(biāo)記是具有兩種多態(tài)性形式,或等位基因的遺傳標(biāo)記。如上所述,對與某個性狀相關(guān)的雙等位基因遺傳標(biāo)記而言,與對照組相比在患者組的遺傳組成中豐度更高的等位基因被稱為“相關(guān)等位基因”,而其他等位基因則被稱為“非相關(guān)等位基因”。因此對每一種與給定性狀(例如,疾病或藥物反應(yīng))相關(guān)的雙等位多態(tài)性而言,都存在相對應(yīng)的相關(guān)等位基因。其他可用于本發(fā)明所述方法的雙等位基因多態(tài)性包括,但不限于,多核苷酸改變,插入,缺失和易位。還應(yīng)該理解,涉及到本文所述的DNA時還可以包括DNA的衍生物,例如,擴(kuò)增子,RNA轉(zhuǎn)錄物,cDNA,DNA類似物等。在相關(guān)分析中篩選到的多態(tài)性座可以二倍體或單倍體的形式存在,且理想的,可以存在于跨越基因組中的各個位置。
在本發(fā)明的某些實(shí)施方案中,相關(guān)分析涉及篩選至少約100個SNP,或者少約500個SNP,或者少約1000個SNP,或者少約10,000個SNP,或者少約100,000個SNP,或者少約1,000,000個SNP。在某些實(shí)施方案中,認(rèn)為位于基因組中一個或多個部分的DNA與被篩選的多因素性狀相相關(guān)。在其他實(shí)施方案中,對位于一條或多條染色體上的SNP進(jìn)行篩選。在另一個實(shí)施方案中,對基因組中每一條染色體上的SNP進(jìn)行篩選。在其它的實(shí)施方案中,對來基因組上每條染色體的多個SNP進(jìn)行篩選。在其他實(shí)施方案中,對位于基因編碼區(qū)或調(diào)控區(qū)的SNP進(jìn)行篩選。在其他實(shí)施方案中,對發(fā)現(xiàn)與基因的差異等位基因表達(dá)相關(guān)的SNP進(jìn)行篩選。(在雜合子中,當(dāng)某個基因的一個等位基因以高于該相同基因其他等位基因的水平進(jìn)行表達(dá)時,發(fā)生了差異等位基因表達(dá),詳細(xì)描述請參見美國專利申請第10/438,184號,申請日為2003年5月13日,題為“Allele-Specific Expression Patterns”)。在某些實(shí)施方案中,對全部公知的SNP(迄今為止約3百萬個)進(jìn)行篩選。在其他實(shí)施方案中,經(jīng)過篩選的SNP亞組可用來預(yù)測未經(jīng)過篩選SNP亞組的等位基因組成。由本說明書中所述方法篩選到的SNP在個體中可以是二倍體,或者是單倍體狀態(tài)的。
由本發(fā)明所述方法鑒定出的相關(guān)SNP(以及由此而來的相關(guān)等位基因)的數(shù)量依賴于幾個標(biāo)準(zhǔn)。首先,其依賴于涉及疾病表現(xiàn)的遺傳座的數(shù)量。例如,如果某種多因素疾病的遺傳基礎(chǔ)只涉及少數(shù)幾個座,那么該相關(guān)SNP和相關(guān)等位基因的數(shù)量通常就會低于其遺傳基礎(chǔ)涉及上百個座的多因素疾病的相關(guān)SNP和相關(guān)等位基因的數(shù)量。第二,所鑒定的相關(guān)SNP和相關(guān)等位基因的數(shù)量依賴于在相關(guān)分析中篩選的SNP數(shù)量。例如,僅對患者組和對照組中一百個SNP進(jìn)行篩選的相關(guān)分析不太可能比對1百萬個SNP進(jìn)行篩選的相關(guān)分析中找到的相關(guān)SNP數(shù)量更多。一般地,本發(fā)明的方法可鑒定約10個至數(shù)百個的相關(guān)SNP/相關(guān)等位基因,但也可能鑒定更多或更少。
相關(guān)等位基因組的驗(yàn)證在一個實(shí)施方案中,為了證實(shí)對相關(guān)等位基因的鑒定,使用第二患者和第二對照群體重復(fù)該相關(guān)分析。這樣的第二相關(guān)分析確定了是否那些來自于第一次相關(guān)分析的相關(guān)基因在基于新患者和對照組合的相對等位基因頻率基礎(chǔ)上依然被鑒定出來,并且那些確實(shí)“重復(fù)”出來的相關(guān)基因由此被證實(shí)為相關(guān)SNP。在某些實(shí)施方案中,在第一次相關(guān)分析中篩選過的多態(tài)性座同樣也在第二次證實(shí)相關(guān)分析中進(jìn)行了篩選。在其它實(shí)施方案中,在第一次相關(guān)分析中篩選過的多態(tài)座亞組同樣也在第二次證實(shí)相關(guān)分析中進(jìn)行了篩選。在一個特定的實(shí)施方案中,在第二相關(guān)分析中篩選到的多態(tài)座組包含有第一次相關(guān)分析鑒定的相關(guān)多態(tài)座。例如,如果在第一次相關(guān)分析中鑒定出30,000個SNP與某種疾病的發(fā)生相相關(guān),那么隨后就在選擇了表現(xiàn)出該疾病和未表現(xiàn)出該疾病的第二患者組合第二對照組中對這30,000個SNP進(jìn)行篩選。在某些實(shí)施方案中,根據(jù)與第一患者組相同的標(biāo)準(zhǔn)對第二患者組進(jìn)行選擇,根據(jù)與第一對照組相同的標(biāo)準(zhǔn)對第二對照組進(jìn)行選擇。在一個方面,第一和第二患者組與第一和第二對照組中沒有相同的成員。可以使用混合或個體基因型分析的方法學(xué)來實(shí)施第二相關(guān)分析。
在其他方面,如果使用混合基因型分析來實(shí)施相關(guān)分析,那么通過混合基因型分析方法確定的相關(guān)等位基因的組就可以通過在患者組和對照組中的每個成員的相關(guān)SNP組合中進(jìn)行單個的基因型分析以及對相對等位基因頻率進(jìn)行重新計(jì)算和重新比較來證實(shí)。與根據(jù)個體基因型分析數(shù)據(jù)得到的對照組相比,在初始混合基因型分析基礎(chǔ)上鑒定出的相關(guān)等位基因在患者組中具有較高的等位基因頻率,由此可證實(shí)其是相關(guān)等位基因??蓪κ褂没旌匣蛐头治龇椒ǖ牡谝淮蜗嚓P(guān)分析實(shí)施這一證實(shí)步驟,或者對使用混合基因型分析的第二次證實(shí)相關(guān)分析實(shí)施這一證實(shí)步驟。
在實(shí)驗(yàn)設(shè)計(jì)中,可使用不止一種證實(shí)方法來鑒定相關(guān)SNP的組。例如,在本發(fā)明的一個實(shí)施方案中,對表現(xiàn)出某種疾病個體的患者群體和未表現(xiàn)出該疾病個體的對照群體進(jìn)行了第一次相關(guān)分析。使用混合基因型分析方法在大約150萬個SNP座對患者組和對照組進(jìn)行基因型分析,從而鑒定出約30,000個在患者組和對照組中相對等位基因頻率差異顯著的SNP。在下一個證實(shí)步驟中,對所述患者組和對照組在“混合”相關(guān)分析中鑒定出的約30,000個SNP中的每一個進(jìn)行獨(dú)立的基因型分析,從而鑒定出在基于個體基因型分析的方法中在患者組和對照組之間具有顯著差異的相對等位基因頻率的約300個SNP。因此,通過個體基因型分析證實(shí)了這些約300個的SNP。在進(jìn)一步的證實(shí)步驟中,進(jìn)行了第二相關(guān)分析,其中通過基于個體基因型分析方法用第二患者組和第二對照組進(jìn)行的第二相關(guān)分析進(jìn)一步證實(shí)了由個體基因型分析步驟所證實(shí)的約300個SNP。那些在第二相關(guān)分析中重復(fù)的SNP被分類為該疾病的SNP,且在患者組中豐度高于對照組中的該相關(guān)SNP的等位基因被稱為相關(guān)等位基因。
使用相關(guān)等位基因來確定風(fēng)險邊界在本發(fā)明的一個實(shí)施方案中,在患者組和對照組個體在每個疾病相關(guān)SNP座上的基因型可用來發(fā)展一系列邊界值,這些邊界值可用來確定個體發(fā)展將患者組和對照組加以區(qū)分的所述多因素性狀的易感體質(zhì)。
在一方面,將患病組和對照組中所有個體在每個相關(guān)SNP位置上的基因型都集中起來。如果個體基因型分析是在相關(guān)分析中實(shí)施的,如上所述,那么在所述相關(guān)分析中在所述相關(guān)SNP位置上收集到的個體基因型分析數(shù)據(jù)就是可以使用的。然而,如果個體基因分型尚未確定,那么對相關(guān)SNP組而言,必須對患病組和對照組的每一成員進(jìn)行單獨(dú)的基因型分析。例如,在雙等位SNP的情況下,二倍體個體可具有三種不同的基因型之一,相關(guān)等位基因的純合子,非相關(guān)等位基因的純合子,以及雜合子(含有一個相關(guān)等位基因和一個非相關(guān)等位基因)。在此介紹的方法可應(yīng)用于二倍體生物體,或二倍體生物體中的單倍體座(例如,人類的Y染色體座)。對單倍體座而言,只有兩種基因型,即每一種可能的等位基因。
在另一方面,根據(jù)每一個相關(guān)SNP座上的基因型,對患者組和對照組中的每一個個體都賦予了一個評分。在本發(fā)明的一個實(shí)施方案中,對每個相關(guān)等位基因賦值為1分,則該相關(guān)等位基因純合子的每一個SNP基因型為2分,雜合子的每一個基因型為1分,非相關(guān)等位基因純合子的每一個SNP基因型為0分。在單倍體座的一個實(shí)施方案中,具有相關(guān)等位基因的每個SNP基因型為1分而具有非相關(guān)等位基因的每個SNP基因型為0分。在單倍體座的另一個實(shí)施方案中,具有相關(guān)等位基因的每個SNP基因型為2分而具有非相關(guān)等位基因的每個SNP基因型為0分。對給定的個體而言,將所有相關(guān)SNP的評分匯總得到一個對于該個體的評分。例如,如果對100個相關(guān)SNP進(jìn)行基因型分析,則該個體的最高評分為200,即該個體在每個相關(guān)SNP位置都具有兩個相關(guān)等位基因。換言之,對每個SNP位置的相關(guān)等位基因而言該個體是純合子。對在任意相關(guān)SNP位置上沒有相關(guān)等位基因的個體,或在每個SNP位置上的非相關(guān)等位基因純合子個體而言,最小評分為0。對患者組和對照組中每個個體的評分都進(jìn)行計(jì)算。例如,在具有102個個體的患者群體和具有405個個體的對照群體中對100個相關(guān)SNP進(jìn)行檢驗(yàn)?;颊呓M的最低評分為42且最高評分為97;對對照組而言,最低評分為23且最高評分為79。這是對個體評分進(jìn)行確定的實(shí)施方案的一個實(shí)施例,其既不依賴于每個因素對多因素性狀的效應(yīng)程度,也不依賴于是否該因素的效應(yīng)是加和性的,協(xié)同性的或獨(dú)立性的。此外,該實(shí)施方案并不需要對包含任意因素產(chǎn)物,遺傳相關(guān)于任意因素產(chǎn)物,或者任意因素產(chǎn)物的任意基因,RNA或蛋白的表達(dá)譜有所了解。而且,該實(shí)施方案并不需要對可能影響所述多因素性狀的環(huán)境因素的知識有所了解。
在本發(fā)明的其他實(shí)施方案中,當(dāng)對個體的評分進(jìn)行計(jì)算時,可將其他因素考慮在內(nèi),例如,每種因素對于該多因素性狀的效應(yīng)程度,和/或當(dāng)計(jì)算個體的評分時該因素是否是加和性的,協(xié)同性的,對抗性的,獨(dú)立地或上位性的。例如,第一個等位基因可能比第二個等位基因具有對個體風(fēng)險高兩倍的效應(yīng)幅度,因此在計(jì)算該個體的評分時,賦予第一個等位基因的值比賦予第二個等位基因的值高兩倍。在某些實(shí)施方案中,給定的因素組可以表現(xiàn)出不同上位性互作的組合。在其他實(shí)施方案中,還應(yīng)該將表達(dá)數(shù)據(jù)加以考慮。例如,作為癌癥發(fā)展基礎(chǔ)的因素的基因(或RNA或其蛋白產(chǎn)物)的特定等位基因的表達(dá)水平可以預(yù)測發(fā)展所述癌癥風(fēng)險的增加或降低。在另一個實(shí)施方案中,當(dāng)計(jì)算個體的評分時,可將影響該多因素性狀的環(huán)境因素的知識也考慮在內(nèi)。在這樣的實(shí)施方案中,與一種或多種環(huán)境因素出現(xiàn)相關(guān)的評分可用于對個體的評分進(jìn)行計(jì)算。
在另一方面,可以確定一系列風(fēng)險邊界值。風(fēng)險邊界值代表了用于遺傳檢測對個體有可能發(fā)展或表現(xiàn)出某種多因素性狀進(jìn)行鑒定的理論閾值。例如,評分高于閾值的個體可被診斷為有可能表現(xiàn)出該多因素性狀,而那些評分等于或低于閾值的個體則可被診斷為不太可能表現(xiàn)出該多因素性狀?;蛘?,可使用多個閾值來確定個體表現(xiàn)出該多因素性狀的風(fēng)險。
這一系列風(fēng)險邊界值的范圍從1到相關(guān)分析中對個體計(jì)算出的最高評分,無論是否其是患者組或?qū)φ战M中的一員。在一個實(shí)施例中,個體的最高分為97分,因此確定的所述風(fēng)險邊界值(風(fēng)險邊界范圍)在1和97之間。在某些方面,風(fēng)險邊界值選自整個風(fēng)險邊界范圍,盡管對特定風(fēng)險邊界值的選擇在某種程度上是任意的。在某些實(shí)施方案中,在所述風(fēng)險邊界范圍內(nèi)的每一個評分都被選擇。在其他實(shí)施方案中,每第n個(例如,每第5個或每第10個)評分被選擇。在其他實(shí)施方案中,所述范圍被分成百分?jǐn)?shù),并選擇每一第n個百分?jǐn)?shù)。在某些實(shí)施方案中,更多的風(fēng)險邊界值選自于整個評分范圍的中部而不是該范圍的頂部或底部,反之亦然。例如,在整個評分范圍介于1至97之間的情況下,可在20和80之間在每一第10分對風(fēng)險邊界值進(jìn)行選擇,同時將55和65的其他風(fēng)險邊界值加入從而對該范圍的中部進(jìn)行更好的評估(參見表1)。
在隨后的步驟中,將每一個風(fēng)險邊界值與對患者組和對照組個體計(jì)算出的評分進(jìn)行比較。具體而言,患者(“受影響”)和對照(“未受影響”)個體的評分可用來確定哪個風(fēng)險邊界值提供了最佳的敏感性,特異性,陽性預(yù)測值(PPV),陰性預(yù)測值(NPV),準(zhǔn)確度或其組合,來從那些不太可能表現(xiàn)出多因素性狀的個體中將有可能表現(xiàn)出多因素性狀的個體鑒別出來,由此鑒定出適于作為使用相關(guān)SNP進(jìn)行多基因檢測較好閾值的風(fēng)險邊界值。此外,對合適閾值的鑒定還涉及臨床信息的使用(例如,關(guān)于正在研究的多因素性狀,群體,或被測試的個體)和/或本發(fā)明實(shí)施人員與外界機(jī)構(gòu)(例如,美國食品和藥品管理局(FDA))的相互協(xié)助。這樣的些閾值可以被發(fā)展成遺傳檢測,例如,在患病組和對照組個體的閾值和評分基礎(chǔ)上計(jì)算出的具有敏感性,特異性,PPV,NPV和準(zhǔn)確度的診斷方法。
雙向的遺傳檢測具有兩種可能的結(jié)果。陽性檢測結(jié)果說明個體表現(xiàn)出或有可能表現(xiàn)出感興趣的性狀,而陰性檢測結(jié)果則說明個體未表現(xiàn)出且沒有可能表現(xiàn)出感興趣的性狀。同樣地,遺傳檢測的可靠性與該檢測結(jié)果能夠正確地鑒定個體為該性狀的“陽性”或“陰性”的頻率相關(guān)。真陽性(TP)和真陰性(TN)是分別正確地鑒定出個體為該性狀的陽性(例如,“受影響的”)和陰性(例如,“未受影響的”)的檢測結(jié)果。假陽性(FP)是當(dāng)將實(shí)際上對該性狀是陰性的個體錯誤地鑒別為陽性時的檢測結(jié)果。同樣,假陰性(FN)是當(dāng)將實(shí)際上對該性狀是陽性的個體錯誤地鑒別為陰性時的檢測結(jié)果。對TP,TN,F(xiàn)P和FN的測定可用來計(jì)算遺傳檢測的靈敏度,特異性,PPV和NPV。
檢測的“靈敏度”是對所述檢測能夠正確鑒定出受影響的個體,或個體會發(fā)展所述感興趣性狀的能力。靈敏度越接近1,該檢驗(yàn)?zāi)茉綔?zhǔn)確鑒定受影響的個體。特別地,靈敏度是指同樣由該檢測正確診斷出的受影響個體的比例,同時也是由正確鑒定為受影響的(TP)個體數(shù)量除以受影響個體的總數(shù)(TP+FN)計(jì)算出來的。較高的靈敏度是優(yōu)選的,因?yàn)橥ㄟ^所述遺傳檢測能夠?qū)⒋蠖鄶?shù)受影響的個體鑒定出來。檢驗(yàn)的“特異性”是測定所述檢驗(yàn)正確鑒定未受影響的個體,或者不會發(fā)展感興趣的性狀的個體。特異性越接近于1,該檢測就越能正確地鑒定出未受影響的個體。特別地,特異性是指同樣由該檢測正確診斷出的未受影響個體的比例,同時也是由正確鑒定為未受影響的(TN)個體數(shù)量除以未受影響個體的總數(shù)(TN+FP)計(jì)算出來的。高特異性是優(yōu)選的,使得被錯誤鑒定為受影響個體的數(shù)量最小。因此,對于給定的風(fēng)險邊界值而言,靈敏度的計(jì)算值為在患者組中評分確實(shí)高于風(fēng)險邊界值的個體的比例,而特異性的計(jì)算值則為在對照組中評分低于或等于該風(fēng)險邊界值的個體的比例(或,1減去評分高于所述風(fēng)險邊界值的對照個體的比例)。
遺傳檢測的“陽性預(yù)測值”(PPV)對陽性檢測成果/結(jié)果的可靠性進(jìn)行了評估,且計(jì)算值為具有陽性檢測結(jié)果確實(shí)具有感興趣性狀的人口比例。換言之,是陽性檢測結(jié)果正確鑒定出個體具有該性狀的可能性,且計(jì)算值為正確鑒定為受影響個體的數(shù)量(TP)除以由該遺傳檢測鑒定出的受影響個體的總數(shù)(TP+FP)。在很多情況下,優(yōu)選高PPV,從而被鑒定為受影響的大多數(shù)個體實(shí)際上就受到影響。例如,0.98的PPV是指具有陽性檢驗(yàn)結(jié)果的個體具有98%的具有和發(fā)展所述形狀的幾率。遺傳檢測的“陰性預(yù)測值”(NPV)對陰性檢測成果/結(jié)果的可靠性進(jìn)行了評估,且計(jì)算值為具有陰性檢測結(jié)果確實(shí)沒有感興趣性狀的人口比例。換言之,其是陰性檢測結(jié)果正確鑒定出個體沒有該性狀的可能性,且計(jì)算值為正確鑒定為不受影響個體的數(shù)量(TF)除以鑒定出的不受影響個體的總數(shù)(TN+FN)。較高的NPV有時是指大多數(shù)鑒定為不受影響的個體事實(shí)上是不受影響的(例如,除了具有給藥特異性藥物相關(guān)副作用風(fēng)險的受試者)。例如,NPV為0.999意味著具有陰性檢測結(jié)果的個體只有0.1%的具有或發(fā)展該性狀(例如,體驗(yàn)到對于該藥物的副作用)的幾率。因此,對于給定的風(fēng)險邊界值而言,PPV的計(jì)算值為在患者組中評分確實(shí)高于風(fēng)險邊界值的全部個體的比例,而NPV的計(jì)算值則為在對照組中評分確實(shí)低于或等于該風(fēng)險邊界值的所有個體的比例。
性狀的流行率是指該性狀在被測人群中的頻率,且計(jì)算值為現(xiàn)存患者數(shù)量除以在給定時間點(diǎn)的總?cè)丝跀?shù)。雖然考慮到檢測的靈敏度和特異性并未受到該性狀流行率的影響,但在被測人群中PPV和NPV都受到了該性狀流行率的較高影響;越低的疾病流行率導(dǎo)致越低的PPV和越高的NPV。PPV和NPV都可作為靈敏度(sens),特異性(spec)和流行率(prev)的函數(shù)來進(jìn)行計(jì)算PPV=(sens)(prev)/[(sens)(prev)+(1-spec)(1-prev)]
NPV=(spec)(1-prev)/[(spec)(1-prev)+(1-sens)(prev)]。
也可以使用似然率來選擇適于遺傳檢測的閾值。似然率(LR)是將檢測的靈敏度和特異性整合成一個測量值的方法,并基于陽性或陰性檢測結(jié)果給出了具有或發(fā)展給定性狀變化的可能性為多少。因?yàn)殪`敏度和特異性是檢測本身的固定特征,所以與PPV和NPV不同,LR是與人群中該性狀的流行率相互獨(dú)立的。LR是與預(yù)計(jì)沒有所述性狀的個體的相同結(jié)果的可能性相比,給定的檢驗(yàn)預(yù)計(jì)個體具有所述性狀的可能性。陽性檢測結(jié)果的LR(LR+)提供了當(dāng)該檢測為陽性時個體有多少可能性具有或發(fā)展性狀升高的測量值,且計(jì)算值為靈敏度除以(1-特異性)。用于“排除”性狀的較好檢測是使用最大的LR+的檢測。陰性檢測結(jié)果的LR(LR-)提供了當(dāng)該檢測為陰性時個體有多少可能性具有或發(fā)展性狀升高的測量值,且計(jì)算值為(1-特異性)除以特異性。用于“排除”性狀的較好檢測是使用較低LR-的檢測。大于10或小于0.1的LR值通常用作對高診斷值進(jìn)行判定。將LR值與“檢測前可能性”組合考慮可確定檢測個體具有或會發(fā)展成感興趣性狀的“檢測后可能性”(檢測后可能性=檢測前可能性×LR)。檢測前可能性是通過關(guān)于該性狀流行性信息,人群特征和特定被測個體的信息進(jìn)行計(jì)算的,且其代表了該個體在檢測之前具有或逐漸發(fā)展成該性狀的可能性。檢測后代表了在給定檢測結(jié)果之后該個體具有或逐漸發(fā)展成該性狀的可能性。在本發(fā)明的一個實(shí)施方案中,遺傳檢測LR的最大值被選為閾值。
遺傳檢測值或有效性的另一個參數(shù)是準(zhǔn)確度,其代表了在檢測結(jié)果與真實(shí)疾病狀態(tài)之間的總的一致性。準(zhǔn)確度的計(jì)算值等于真陽性與真陰性的和除以樣品結(jié)果的總數(shù)((TP+TN)/(TP+TN+FP+FN))。遺傳檢測的準(zhǔn)確度可用來確定是否一組風(fēng)險邊界值可在多基因檢測中用作閾值。
對每一個風(fēng)險邊界值都進(jìn)行了靈敏度,特異性,PPV,NPV和準(zhǔn)確度的計(jì)算,下表1所示為在具有102名患者和405名對照的實(shí)施例中對這些值進(jìn)行分析的結(jié)果。從全部評分范圍中選出的邊界值如第一列所示。評分高于其對應(yīng)邊界值的患者個體的數(shù)量如第二列所示。第三列所示為評分高于其對應(yīng)邊界值的對照個體的數(shù)量。將每個對應(yīng)邊界值都用作閾值進(jìn)行檢測的靈敏度如第四列所示。將每個對應(yīng)邊界值都用作閾值進(jìn)行檢測的特異性如第五列所示。將每個對應(yīng)邊界值都作為閾值進(jìn)行檢測的PPV和NPV分別如第六列和第七列所示。最后,將每個對應(yīng)邊界值都作為閾值進(jìn)行檢測的準(zhǔn)確度如第八列所示。
表1
在最適條件下,具有較高PPV,NPV和準(zhǔn)確度的遺傳檢測是高靈敏和高特異性的,因此所有被測個體都被正確地鑒定為具有或沒有感興趣的性狀。不過,在通常情況下,對最適風(fēng)險邊界值的選擇是基于,例如,對特異性,靈敏度,PPV,NPV和準(zhǔn)確度或其亞組的最佳組合。如表1所示,使用較高的風(fēng)險邊界值提高了所述檢測的特異性和PPV卻降低了靈敏度和FPV。因此,如果遺傳檢測是根據(jù)較高的風(fēng)險邊界值來確定個體發(fā)展疾病的易感性的,那么只有少數(shù)個體會被誤診為具有較高的風(fēng)險發(fā)展所述疾病,但大部分確實(shí)具有較高風(fēng)險的人群卻沒有被鑒定出來。在另一方面,使用較低的風(fēng)險邊界值提高了靈敏度和NPV卻降低了特異性和PPV,因此,盡管大多數(shù)或全部個體具有較高風(fēng)險的個體被鑒定了出來,但相當(dāng)數(shù)量低風(fēng)險的個體也被錯誤地鑒定為具有較高風(fēng)險。所以,很明顯這兩個極端值都是不可用的,但可以考慮的是對特定性狀,人群和個體來確定平衡的靈敏度,特異性,PPV和NPV。
對閾值的確定依賴于許多因素。例如,為了實(shí)現(xiàn)這樣的確定一般都需要對該疾病的臨床知識有所了解。此外,對多基因檢測的閾值可以是由管理機(jī)構(gòu)(例如,F(xiàn)DA)進(jìn)行調(diào)節(jié)的,或由醫(yī)生根據(jù),例如,關(guān)于有效治療的信息,該多基因檢測的特征,或特定患者的具體情況的變化而進(jìn)行變化的。此外,還可以在二分方式中使用或不使用閾值。例如,對個體的治療可隨該個體的評分高于所述閾值(例如,給藥)或低于或等于所述閾值(例如,不給藥)發(fā)生變化?;蛘撸瑢υu分接近閾值的個體治療可與評分遠(yuǎn)離閾值的個體治療不同。例如,根據(jù)其他因素,例如臨床知識和該個體的信息,醫(yī)生可以做出對評分略低于閾值的個體進(jìn)行給藥的決定。此外,將評分與閾值進(jìn)行比較時的“高于”與“低于或等于”的使用只是一種習(xí)慣問題,在本發(fā)明的其他實(shí)施方案中,還可以使用“高于或等于”和“低于”,這對本領(lǐng)域所屬技術(shù)人員而言都是清楚明了的。
在一方面,對閾值的確定依賴于疾病的嚴(yán)重程度。例如,如果該性狀涉及嚴(yán)重疾病的發(fā)展,那么研究人員更傾向于較高的敏感性與較低的特異性,因?yàn)殍b定出那些個體具有較高的風(fēng)險對那些個體而言是至關(guān)重要的。例如,可治療的惡性腫瘤(原位癌癥或霍奇金氏病(Hodgkin′s disease))可以被早期發(fā)現(xiàn),所以在對病情的診斷中應(yīng)該使用較敏感的檢測。類似地,為了確保假陰性的數(shù)量較低,對嚴(yán)重疾病優(yōu)選使用較高NPV的檢測。由于比理想PPV較低的PPV可使得假陽性的數(shù)量明顯增加,因此可實(shí)施其他的檢測,使用,例如,高準(zhǔn)確率的“金標(biāo)準(zhǔn)(gold standard)”檢測,來對那些檢測為陽性/受影響個體的狀況進(jìn)行確認(rèn)。同樣地,當(dāng)還可方便的具有其他確認(rèn)診斷措施時,較低的PPV也是更容易接受的。例如,在一般人群中,異常宮頸細(xì)胞的比率約為1/1000且早期子宮頸癌涂片檢驗(yàn)的靈敏度和特異性分別為0.70和0.90。基于這些數(shù)值,早期子宮頸癌涂片檢驗(yàn)的PPV和NPV分別為0.00696和0.999,說明早期子宮頸癌涂片檢驗(yàn)陽性的個體真正具有異常的可能性非常小,而早期子宮頸癌涂片檢驗(yàn)陰性的個人基本上肯定是沒有疾病的。
在某些方面,較高的特異性和PPV對遺傳檢測而言是優(yōu)選地,例如,當(dāng)假陽性檢測結(jié)果具有較高的不希望反應(yīng)時。例如,當(dāng)該檢測用于對個體是否應(yīng)該接受具有危險性的治療方案(移植手術(shù),化療,輻射,具有嚴(yán)重副作用的藥物,乳房切除術(shù)等等)作出決定時,重要的是由該檢測鑒定為需要治療的個體確實(shí)需要所述治療。例如,遺傳檢測可發(fā)展為在缺乏心臟移植程序中對具有高死亡風(fēng)險的個體進(jìn)行鑒定。因此,評分高于閾值的個體被鑒定為很可能死亡,除非接受新的心臟。這樣的檢測對具有較高PPV(~10)的個體而言是優(yōu)選地,因此只有較高死亡可能性的個體會考慮心臟移植。雖然這意味著可將不接受心臟移植就會死亡的相當(dāng)數(shù)量個體排除在治療之外(較低的NPV),但最重要的是不會有個體接受其完全不需要的心臟移植。
確定遺傳檢測合適閾值的另一個因素是該疾病在人群中的總流行率。例如,以在人群中非常罕見的性狀為例。0.95的特異性看起來是可接受的較高了,但這意味著有5%并不具有高風(fēng)險的個體被誤診為具有發(fā)展該性狀的高風(fēng)險。因此,對在人群中頻率為1/10,000的性狀而言,在被正確鑒定為具有發(fā)展該性狀風(fēng)險的個體中,大約有500個個體會被誤診為“高風(fēng)險”(假陽性)。所以,最適合的是對罕見的,非嚴(yán)重的性狀使用較高特異性的邊界,而對常見的,嚴(yán)重的性狀使用較高敏感性的邊界。此外,如上所述,PPV和NPV對感興趣性狀的流行率具有較高的依賴性。例如,用來對個體發(fā)展在人群中疾病流行率較低的所述疾病風(fēng)險進(jìn)行鑒定的遺傳檢測的PPV值低于用來對個體發(fā)展在人群中疾病流行率較高的所述疾病風(fēng)險進(jìn)行同樣鑒定的遺傳檢測的PPV值。類似地,用來對個體發(fā)展在人群中疾病流行率較低的所述疾病風(fēng)險進(jìn)行鑒定的遺傳檢測的NPV值高于用來對個體發(fā)展在人群中疾病流行率較高的所述疾病風(fēng)險進(jìn)行同樣鑒定的遺傳檢測的NPV值。同樣,當(dāng)具有相當(dāng)高PPV(或相當(dāng)高NPV)的遺傳檢測被用于對一個人群中的個體進(jìn)行檢測時,其并不能被用于感興趣的性狀的流行率與之不同的其他人群中,因此,根據(jù)感興趣性狀的流行率不同,對不同的人群應(yīng)該選擇不同的閾值。簡言之,不僅使用本文所述的方法,還使用了臨床知識和直覺,以及,例如,與諸如FDA的管理結(jié)構(gòu)的相互作用,本領(lǐng)域所屬技術(shù)人員可以對具有特定給定性狀流行率的患者人群選擇閾值從而獲得一個或多個臨床可用的參數(shù),例如靈敏度,特異性,PPV,NPV,準(zhǔn)確度等等。
在本發(fā)明的一個方面,根據(jù)對風(fēng)險邊界值計(jì)算得到的靈敏度和特異性,使用ROC(接受器操作特征)曲線確定了使用相關(guān)SNP的多基因檢測的閾值(Hanley et al(1982)Radiology 14329-36;和Beck,et al(1986)Arch Pathol Lab Med 11013-20)。ROC曲線與遺傳檢測的靈敏度和特異性之間的內(nèi)在權(quán)衡相關(guān),并可通過對每種風(fēng)險邊界值的靈敏度作為1減去特異性的函數(shù)作圖得到,如圖1所示,其所示為使用表1的數(shù)據(jù)產(chǎn)生的ROC曲線。因此,在ROC曲線上,每一個風(fēng)險邊界值都對應(yīng)一個“數(shù)據(jù)點(diǎn)”。曲線下的面積提供了對該遺傳檢測可靠性的度量。對能夠完全區(qū)分受影響和不受影響個體(靈敏度和特異性都分別為1)的遺傳檢測而言,曲線下的面積為1。對不能區(qū)分受影響和不受影響個體的遺傳檢測而言,曲線下的面積為0.5。一般而言,曲線越靠近圖的左手部分和頂部邊界,該遺傳檢測就越準(zhǔn)確,曲線越靠近ROC空間的45度角,檢測就越不準(zhǔn)確。通常用來分析ROC曲線的計(jì)算機(jī)程序是公眾可獲得的,包括ROCKIT,CORROC2,LABROC4,ROCFIT,CLABROC,ROCPWR,LABMRMC和PROPROC,其全部都可以從進(jìn)行放射影像研究的Kurt Rossman實(shí)驗(yàn)室下載,網(wǎng)址為www-radiology.uchicago.edu/krl/KRL_ROC/software_index.htm#ROC%20calculations%20Auxiliary%20software。在某些實(shí)施方案中,可以從數(shù)據(jù)點(diǎn)最接近于圖左上角的ROC曲線的部分(例如,百分比)的風(fēng)險邊界值中選擇閾值。例如,如果數(shù)據(jù)點(diǎn)選自圖1所示圖中最接近于左上角的20%ROC曲線(箭頭A和B之間),那么就可以從對應(yīng)于風(fēng)險邊界值為55和60之間的數(shù)據(jù)點(diǎn)中選擇閾值,分別用D和E表示。在其它實(shí)施方案中,閾值被確定為由最接近于圖中左上角數(shù)據(jù)點(diǎn)代表靈敏度和特異性的風(fēng)險邊界值。在圖1中,這一數(shù)據(jù)點(diǎn)(D)對應(yīng)的風(fēng)險邊界值為55。在另一個實(shí)施方案中,可以由最接近于圖左上角的ROC曲線位置來決定閾值。在圖1中,該位置用C表示,對應(yīng)的靈敏度和特異性為約0.87和約0.84。在這個實(shí)施方案中,所確定的風(fēng)險邊界值與該曲線這一位置代表的靈敏度和特異性相對應(yīng),且該風(fēng)險邊界值被用作使用相關(guān)SNP進(jìn)行遺傳檢測的閾值。例如,因?yàn)槲恢肅位于數(shù)據(jù)點(diǎn)D和E之間,用作閾值的最佳風(fēng)險邊界值就應(yīng)該在55和60之間。為了確定最佳的風(fēng)險邊界值,在基于患者組和對照組評分范圍內(nèi)確定了適于所有風(fēng)險邊界值的靈敏度和特異性(參見表2)。選擇的是靈敏度和特異性分別最接近0.87和0.84的風(fēng)險邊界值,在該實(shí)施例中,風(fēng)險邊界值為56,靈敏度和特異性為0.88和0.84。因此,56被選為使用相關(guān)等位基因進(jìn)行多基因檢測的閾值。
在本發(fā)明的另一實(shí)施方案中,可根據(jù)特殊需要的臨床結(jié)果對閾值進(jìn)行選擇。例如,遺傳檢測可發(fā)展成為在給定特殊治療的個體中降低副作用出現(xiàn)的方式從而對患者群體進(jìn)行分類。例如,由于有4%的副作用出現(xiàn),藥物就被批準(zhǔn)為受限制使用,但如果將副作用的出現(xiàn)降低至少50%,其就可以是廣泛使用的了。在這個實(shí)施方案中,“患者”是對藥物產(chǎn)生副作用的個體,而“對照”則是當(dāng)暴露于所述藥物時并未產(chǎn)生副作用的個體。個體經(jīng)受副作用的風(fēng)險是通過計(jì)算該個體在所述相關(guān)座組合基因型的評分,然后,例如,將該評分與遺傳分析的閾值進(jìn)行比較確定,其中所述閾值是通過對基于患者組和對照組評分對遺傳檢測的PPV,NPV,靈敏度,特異性等等或其它組合進(jìn)行分析得到的。例如,相關(guān)等位基因數(shù)量高于閾值的個體被鑒定為具有較高副作用的風(fēng)險。使用60的閾值能夠消除77%的患者和8%的對照。因?yàn)楣弊饔冒l(fā)生為4%,則1000患者人群中就會有大約40個病例,其中約31(77%)個個體的相關(guān)等位基因>60個,而其中9個體的相關(guān)等位基因≤60個。同一個患者人群中有約960個對照,其中約77(8%)個個體的相關(guān)等位基因>60個,而其中883個個體的相關(guān)等位基因≤60個。在將相關(guān)等位基因數(shù)量≤60的108個個體排除之后,在沒有排除的892個個體中副作用出現(xiàn)的計(jì)算為(9/892)×100=1%。。類似地,在被排除的個體中副作用出現(xiàn)的計(jì)算為(31/108)×100=29%。使用相同的計(jì)算方法,59和61的風(fēng)險邊界值也被定為診斷檢測的閾值。風(fēng)險邊界值為59使得在未被排除治療個體中的副作用發(fā)生預(yù)測值為1%,但對照組中的更多個體(92)被排除在外,說明如果將該風(fēng)險值用作診斷檢測中的閾值的話,更多沒有副作用風(fēng)險的個體會被排斥在治療之外。風(fēng)險邊界值為61使得在未排除治療個體中的副作用發(fā)生預(yù)測值為1.2%,其高于風(fēng)險邊界值為60所對應(yīng)的數(shù)值,然而,但更少的對照個體(69)被排除,意味著如果將這一風(fēng)險邊界值用作診斷檢測閾值的話,更多沒有副作用風(fēng)險的個體會受益于藥物治療。此外,如果本領(lǐng)域所屬人員意圖在保持副作用風(fēng)險為2%或低于2%的情況下,在治療群體中最大化接受治療的對照個體數(shù)量,69的閾值可僅排除10個對照個體并以2%的副作用風(fēng)險提供接受治療的人群。此外,如圖2所示,對從需要治療的患者組中排除足夠病例進(jìn)行鑒定的檢測而言,僅需要0.53就可以將副作用的風(fēng)險降低至2%。因此,在這樣的診斷檢測中使用閾值為69的風(fēng)險邊界值能夠降低在由特定治療劑治療的個體人群中副作用的發(fā)生,由此增加其風(fēng)險/收益情況,并允許放寬其標(biāo)記,與此同時最大化被包括于所述治療中不具有副作用風(fēng)險的個體總數(shù)。很明顯,在接受治療人群中對特異性副作用風(fēng)險的選擇是確定這類診斷檢測閾值的一個重要因素,通過醫(yī)生與涉及對此類診斷進(jìn)行批準(zhǔn)的管理機(jī)構(gòu)(例如,F(xiàn)DA)的通力合作必定確定了風(fēng)險水平。例如,如果需要的是1%副作用風(fēng)險,則可以選擇60的閾值,其能夠增加所述檢測的NPV(由此在接受治療的人群中降低副作用的實(shí)際數(shù)量)與此同時犧牲PPV(排除了更多可以受益的個體(對照))。被排除的患者可接受不同的治療,例如,用不同的藥物,或在給藥時伴隨對副作用的嚴(yán)密監(jiān)測,或者使用能對抗所述副作用的其他治療方法或治療劑的治療。
表2
靈敏度,特異性,PPV,NPV,準(zhǔn)確度,似然率和ROC曲線的概念,以及對診斷檢測選擇適當(dāng)閾值的方法都是廣泛使用的并為本領(lǐng)域所屬技術(shù)人員公知(參見,例如,Janssen,et al(2004)Am J Hum Genet74585-588;www.bamc.amedd.army.mil/DCI/articles/dci10972htm;BaumM(1995)Lancet 346436-437;Forrest P(1990)“Breast Cancerthedecision to screen”;Nuffield Provincial Hospitals Trust;Morrison,AS(1985)“Screen in Chronic Disease”O(jiān)xford University Press Inc USA;www.genome.gov/10002404;med.usd.edu/som/genetics/curriculum/1ITEST.7htm;Bauman A.(1990)Australian Prescriber 1362-64;Walker et al(1986)Med.J.Aust.145185-187;Gilbert R(2001)Western J.Med174405-409;Frohna,J.G.(2001)“Fostering the Efficient,Effective Use ofEvidence-based Medicine in the Clinic”,2ndedition,University ofMichigan;Raglans,RA(2000)“Studying a Study and Testing a Test”,4thedition,Lippincott Williams & Wilkins;www.cebm.net/likelihood rations.asp;和www1.elsvier.com/gej-ng/10/20/71/52/140/article.htm)。例如,在一研究中,對鑒別肝硬化和肝細(xì)胞癌的α-胎蛋白的最佳閾值就是根據(jù)ROC曲線下面積,似然率,靈敏度,特異性,PPV和NPV確定的(Soresi et al(2003)Anticancer Res 23(2C)1747-1753)。在其它研究中,對早期胸部腫瘤X射線測定法,聲圖描記法,和MR早期胸部腫瘤X射線測定法進(jìn)行比較,從而決定是否這些技術(shù)中的一種,或兩種或更多種技術(shù)的組合能夠?yàn)槭褂渺`敏度,特異性,PPV,NPV和準(zhǔn)確度參數(shù)對侵入性癌癥和多病灶(multifocal)疾病的測定提供最好的結(jié)果(Malur et al(2001)Breast Cancer Res 355-60)。全部三種影像技術(shù)的組合得到了靈敏度為0.994,特異性為0.953,PPV為0.939,NPV為0.996,和準(zhǔn)確度為0.97的最佳結(jié)果。在其他研究中,將兩次臨床檢測ROC曲線下的面積進(jìn)行比較從而確定到底是這些檢測中的一種還是兩種檢測的組合能夠最準(zhǔn)確地鑒定乳腺損傷的人群(Buscombe et al(2001)J Nuc Med 42(1)3-8)。在其他研究中,發(fā)現(xiàn)在前列腺特異性抗原(PSA)邊界值為4ng/ml PSA的情況下,對前列腺癌檢測的靈敏度為0.86且特異性為0.33,將邊界值降低至2ng/ml PSA的情況下靈敏度升高為0.95,但特異性降低為0.20(Hoffman,et al(2002)BMC Fam Pract 3(1)19)。一旦對所有風(fēng)險邊界值進(jìn)行檢驗(yàn)且計(jì)算出其分別的特異性,靈敏度,PPVs,NPVs,LR+和LR-值,以及準(zhǔn)確度(或其一些的亞組),就可將這些參數(shù),或其一些亞組之間的最佳平衡用于確定閾值。本領(lǐng)域所屬技術(shù)人員可選擇對任一這些參數(shù)或其組合進(jìn)行優(yōu)化的閾值來獲得對患者人群進(jìn)行分類,例如,診斷,預(yù)防,藥物基因組學(xué),藥物開發(fā),theranostics等等的臨床有效方式。
在本發(fā)明的某些實(shí)施方案中,可確定不止一個閾值,并將其用于對表現(xiàn)出多因素性狀的個體風(fēng)險進(jìn)行分類。在一個這樣的實(shí)施方案中,所選擇的第一個閾值可以是基于對靈敏度的優(yōu)化,其可以降低具有較高風(fēng)險但卻不是由該檢測鑒定的個體數(shù)量(假陰性)。使用第一個閾值在遺傳檢測中檢測為“陽性”的個體隨后被用來使用基于對特異性進(jìn)行優(yōu)化得到的第二個閾值進(jìn)行相同的遺傳檢測。第二閾值可降低檢測為陽性但不具有高風(fēng)險的個體的數(shù)量(假陽性)。依次使用這兩個閾值可以提高該方法的準(zhǔn)確度。
在確定了不止一個閾值并將其用于對表現(xiàn)多因素性狀的個體風(fēng)險進(jìn)行分類的本發(fā)明另一種實(shí)施方案是在同一個遺傳檢測中同時使用多個閾值的實(shí)施方案。在這樣的檢測中,根據(jù)個體的評分高于,低于,或等于哪一個閾值來計(jì)算該個體的風(fēng)險。在一個實(shí)施方案中,至少使用了大約兩個閾值,或至少使用了大約五個閾值,或至少使用了大約10個閾值。在某些實(shí)施方案中,每一個對給定多基因檢測的可能性評分都可用作閾值,在其他實(shí)施方案中,使用了可能性評分的亞組,其中所述亞組可包括評分的特定范圍,或包括從整個評分范圍內(nèi)選擇的評分。例如,可對第一個閾值進(jìn)行選擇從而將評分高于第一閾值的個體歸為具有較高可能性發(fā)展疾病的人群并隨后用適當(dāng)?shù)乃幬镞M(jìn)行治療從而防止疾病發(fā)作??蓪Φ诙€閾值進(jìn)行選擇從而將評分低于第二閾值的個體歸為具有較低可能性發(fā)展疾病且無需治療從而防止疾病發(fā)作。那些評分介于第一和第二閾值之間的個體可被歸為具有中等可能性發(fā)展疾病的人群并隨后使用不同于評分高于第一閾值或評分低于第二閾值個體治療進(jìn)行不同的治療,例如,也可不對其給藥但監(jiān)測更加嚴(yán)密從而測定本應(yīng)該發(fā)現(xiàn)的疾病發(fā)作。對具有中等風(fēng)險個體的治療更加依賴于其他信息,例如關(guān)于該疾病,多基因檢測,藥物,患者的臨床信息等等的信息,而不是對不具有中等風(fēng)險(即,處于“高”或“低”風(fēng)險)個體進(jìn)行治療。
雖然通過相關(guān)分析可以鑒定出相關(guān)座的組,但在單個多基因檢測中并不需要使用到所有的相關(guān)座。一旦鑒定了相關(guān)座的組,本領(lǐng)域所屬技術(shù)人員就可以對用于多基因檢測中的相關(guān)座數(shù)量進(jìn)行調(diào)節(jié),并對所述檢測的數(shù)值進(jìn)行分析,例如,參照其靈敏度,特異性,相對風(fēng)險,似然率,PPV,NPV,準(zhǔn)確度或其組合。例如,在某些實(shí)施方案中,較高的相對風(fēng)險和較高的靈敏度是優(yōu)選的。在一方面,本發(fā)明的方法可用來對用于多基因檢測中的相關(guān)座亞組(例如,至少約5,10,15,20,30或50)進(jìn)行測定。例如,可以選擇在患者組和對照組之間具有最大等位基因頻率差的相關(guān)座。在一些實(shí)施方案中,只有等位基因頻率差值為至少約8%(0.08),10%(0.1),15%(0.15)或25%(0.25)的座被選用于多基因檢測中。在某些實(shí)施方案中,可使用來自患者組和對照組的基因型分析數(shù)據(jù)對所得多基因檢測的某些特征進(jìn)行分析來確定應(yīng)用于多基因檢測中的相關(guān)座亞組。例如,可以使用給定的相關(guān)座亞組來確定適用于假定多基因檢測的靈敏度,特異性,相對風(fēng)險,似然率,PPV,NPV,準(zhǔn)確度或其組合。以這種方式可對多個這樣的假定多基因檢測進(jìn)行分析,且可在所述多基因檢測中用具有這些特征最佳組合的相關(guān)座亞組進(jìn)行選擇。如上所述,在確定適當(dāng)?shù)拈撝禃r,對于多基因檢測的靈敏度,特異性,相對風(fēng)險,似然率,PPV,NPV,準(zhǔn)確度或其亞組的最佳組合依賴于多種臨床因素,包括,例如,表現(xiàn)型的嚴(yán)重程度,表現(xiàn)型的流行率,以及其他人群特異性或患者特異性的臨床信息。在某些實(shí)施方案中,用于多基因檢測中的相關(guān)座亞組是根據(jù)所述相關(guān)座的等位基因頻率差異和由此產(chǎn)生的多基因檢測特征來確定的。因此,使用本發(fā)明的方法,本領(lǐng)域所屬技術(shù)人員可以使用相關(guān)座的亞組來對多基因檢測的特征進(jìn)行預(yù)測而無需僅使用對這些特征進(jìn)行測定的亞組來實(shí)施患者-對照分析。
本發(fā)明的這一方面具有重要的實(shí)際應(yīng)用價值。例如,如果在第二次驗(yàn)證性相關(guān)分析中某些相關(guān)座并未重復(fù),那么就可以將其從用于多基因分析的相關(guān)座組合中排除,而其無需進(jìn)行其他的相關(guān)分析就可以對缺乏“非重復(fù)”座的所述多基因檢測的特征進(jìn)行確定。此外,需要對大量座進(jìn)行基因型分析的多基因檢測比實(shí)施需要對少數(shù)座進(jìn)行基因型分析的多基因檢測要昂貴的多。因此,在保持特定所需要特征(例如,靈敏度,相對風(fēng)險,等等)的情況下,在多基因檢測中降低相關(guān)座數(shù)量的能力對實(shí)施這種檢測的可負(fù)擔(dān)性具有直接的影響,并由此對這種檢測的實(shí)際應(yīng)用具有直接的影響。
此外,認(rèn)為每個相關(guān)SNP等位基因的貢獻(xiàn)且類似或不同程度的表現(xiàn)型效應(yīng)是加和性的,以及每個相關(guān)SNP等位基因與其他各個基因是相互獨(dú)立(即,分別獨(dú)立)的多基因檢測可用來對每代人群發(fā)展多因素性狀的風(fēng)險進(jìn)行預(yù)測。在一個這樣的實(shí)施方案中,在患者人群和對照人群中確定個體的SNP組合,并在每個人群中確定每種SNP的等位基因頻率。假設(shè)SNP彼此是處于哈代-韋伯格平衡(Hardy-Weinbergequilibrium)的,在每個人群中所述基因型的頻率是根據(jù)在該人群中所述等位基因頻率來確定的。這種計(jì)算的簡單說明可通過僅對一個SNP進(jìn)行基因型分析的實(shí)施例來加以示例。如果該SNP具有較低的為0.3的等位基因頻率(C),則“CC”基因型的頻率為(03)2,“GG”基因型的頻率為(0.7)2,而“GC”基因型的頻率為2(0.3)(0.7)。因此,如果一個等位基因增加了個體發(fā)展感興趣表現(xiàn)型性狀的風(fēng)險,就可以根據(jù)在該患者和對照人群中CC,GG和CG基因型的頻率來確定該人群的風(fēng)險。只要等位基因頻率在兩代之間是穩(wěn)定的,這樣的風(fēng)險就不僅適用于當(dāng)代的人群,還適用于后代的人群,正如在大群體中經(jīng)??梢砸姷降那闆r。在多基因檢測中,在患者和對照人群中對多種SNP進(jìn)行基因型分析,產(chǎn)生了兩種基因型組合。如果SNP之間是相互獨(dú)立的,那么就可將多個SNP的等位基因頻率的組用來計(jì)算兩個人群中基因型頻率的組。因?yàn)槊糠N基因型都具有與根據(jù)其所含相關(guān)等位基因數(shù)量相關(guān)的特定風(fēng)險,可以根據(jù)對基因型組合提供的風(fēng)險對在人群中個體的總風(fēng)險進(jìn)行確定,只要等位基因頻率保持相對恒定,這一風(fēng)險對于其他人群(例如,下一代)中的個體也是相等的。
對個體發(fā)展多因素疾病的風(fēng)險的鑒定一旦確定了一個或多個閾值,就可以對患者或?qū)φ战M之外的個體(“檢測個體”)進(jìn)行檢測從而確定該個體發(fā)展或表現(xiàn)出所感興趣性狀的風(fēng)險。在本發(fā)明的某些實(shí)施方案中,所述檢測個體與患者組和對照組的個體是相同的物種。在每個相關(guān)SNP座都對該檢測個體進(jìn)行基因型分析。以在原始患者組和對照組中對個體進(jìn)行評分計(jì)算的相同方式,根據(jù)每個SNP座的基因型,計(jì)算所述檢測個體的評分。在本發(fā)明的一個實(shí)施方案中,將計(jì)算出的檢測個體的評分與一個或多個閾值相比,從而確定該個體是否有可能表現(xiàn)出該疾病。例如,如果某檢測個體的評分高于第一閾值,可認(rèn)為該檢測個體會發(fā)展或表現(xiàn)出該疾病,而如果該檢測個體的評分等于或低于第二閾值,則可認(rèn)為該檢測個體發(fā)展該疾病的風(fēng)險較低。第一閾值和第二閾值可以相同或不同。例如,在55被同時選為第一和第二閾值的實(shí)施方案中,評分高于55的檢測個體可被診斷為有可能發(fā)展該疾病,而評分等于或低于55的檢測個體則被診斷為不太可能發(fā)展該疾病。此外,根據(jù)該疾病的流行率和遺傳檢測的靈敏度和特異性,本領(lǐng)域所屬技術(shù)人員可以計(jì)算出通過所述檢測鑒定出的個體具有較高風(fēng)險確實(shí)具有或發(fā)展所述疾病的可能性或似然率。類似地,本領(lǐng)域所屬技術(shù)人員可以計(jì)算出由該檢測鑒定為具有較低風(fēng)險的個體事實(shí)上沒有或不會發(fā)展該疾病的可能性或似然率。
在本發(fā)明的另一實(shí)施方案中,對檢測個體計(jì)算出的相對風(fēng)險可進(jìn)一步對該個體發(fā)展或表現(xiàn)出該疾病可能性進(jìn)行分析。相對風(fēng)險是有多少特定的風(fēng)險因素能夠影響具體發(fā)病結(jié)果風(fēng)險的度量值。例如,與風(fēng)險因素相關(guān)的為2的相對風(fēng)險意味著具有該相對風(fēng)險的個體比沒有風(fēng)險因素的個體具體結(jié)果的發(fā)病的風(fēng)險升高了兩倍。在一方面,在普通人群中,與所述性狀(例如,疾病)的風(fēng)險相比而言疾病的相對風(fēng)險是倍增的。通過計(jì)算患者組中個體百分比和對照組中個體百分比的比率達(dá)到或超過了基于與該疾病相關(guān)的SNP組合上其基因型的給定評分來確定相對風(fēng)險。使用表1所示的數(shù)據(jù),例如,評分為至少65的個體的相對風(fēng)險為(0.64)/(0.02)=32,這意味著基于其在相關(guān)SNP位置的等位基因組成,該個體發(fā)展該疾病的風(fēng)險增加了32倍。為了進(jìn)行比較,評分為至少70的個體的相對風(fēng)險為(0.5)/(0.005)=100,這意味著根據(jù)其在相關(guān)SNP位置的等位基因組成情況,該個體發(fā)展該疾病的風(fēng)險增加了100倍。在本發(fā)明的一方面,根據(jù)在其相關(guān)SNP座上的基因型對檢測個體計(jì)算出了評分,并且對患者組和對照組進(jìn)行分析從而確定何種比例的患者個體與何種比例的對照個體具有至少與該檢測個體一樣大的評分。然后,將評分至少與該檢測個體一樣大的患者個體的百分?jǐn)?shù)除以評分至少與該檢測個體一樣大的對照個體的百分?jǐn)?shù)來計(jì)算所述檢測個體的相對風(fēng)險。
如上所述,相對風(fēng)險在普通人群中提供了相對于該疾病風(fēng)險的倍增風(fēng)險。因此,為了確定檢測個體發(fā)展該疾病的個體風(fēng)險,必須將該個體的相對風(fēng)險與涉及該疾病流行率的臨床信息組合考慮。例如,如果疾病的流行率為1∶100,那么相對風(fēng)險為32的個體發(fā)展該疾病的可能性為32∶100,或0.32。然而,對流行率為1∶1,000,000的疾病而言,相對風(fēng)險為32的個體發(fā)展該疾病的可能性為32∶1,000,000,或0.000032。因此,雖然相對風(fēng)險在這兩個實(shí)施例中是相同的,但對這兩種疾病而言,發(fā)展該疾病的實(shí)際可能性區(qū)別相當(dāng)大。在本發(fā)明的某些方面,可通過將根據(jù)在普通人群中該多因素性狀流行率測定的個體相對風(fēng)險相乘,來計(jì)算檢測個體發(fā)展感興趣多因素性狀的風(fēng)險。對相對風(fēng)險的測定是公知地并可由本領(lǐng)域所屬技術(shù)人員常規(guī)操作獲得(參見Sackett,et al(1991)Clinical Epidemiologya basic science for clinicalmedicine(second edition)Little Brown,Boston)。
此外,遺傳檢測的PPV和NPV也可以提供關(guān)于基于所述檢測結(jié)果個體具有或發(fā)展疾病風(fēng)險的信息。例如,如果使用PPV為0.87和NPV為0.99的檢測將個體檢測為對疾病具有“陽性”,那么該個體具有87%的幾率具有或發(fā)展該疾病。類似地,如果使用相同的檢測對另一個個體檢測為對該疾病具有“陰性”,那么該個體僅有1%的幾率具有或發(fā)展該疾病。
如上所述,似然率使用了檢測的靈敏度和特異性提供對有多少特定的檢測結(jié)果改變了患者具有或沒有感興趣多因素性狀似然率的度量值。將靈敏度除以(1-特異性)計(jì)算出了陽性檢測結(jié)果(LR+)的似然率(LR),而將(1-靈敏度)除以特異性計(jì)算出了陰性檢測結(jié)果(LR-)的似然率(LR)。將這些LR值與檢測前幾率相乘計(jì)算出了檢測后幾率,其代表了將關(guān)于疾病流行率,患者群體和特定的患者風(fēng)險因素(檢測前幾率)以及關(guān)于診斷檢測本身的信息(LR)整合起來得到的該個體具有或發(fā)展該多因素性狀的可能性。通過將檢測后幾率除以(1+檢測后幾率),可將檢測后幾率用于計(jì)算檢測后可能性。例如,如果被檢測為陽性的個體在流行率為1.5%是具有的檢測前幾率為1-66,而該檢測的LR+為6.6,那么該檢測后幾率就為0.1且檢測后可能性為0.09,意味著該個體具有9%的幾率具有該疾病。類似地,如果被檢測為陰性的個體具有的檢測前幾率為1-3且該檢測的LR-為0.09,那么該檢測后幾率為0.03,對應(yīng)于3%的該個體具有疾病的檢測后可能性。以這種方式,可將多因素性狀的似然率和流行率用來計(jì)算個體在基于給定檢測結(jié)果的情況下具有或發(fā)展感興趣多因素性狀的可能性。
預(yù)測和診斷用途預(yù)防性度量值在對多種不同疾病的預(yù)防中是相當(dāng)成功的,但這些度量值只有在當(dāng)個體發(fā)生疾病之前被鑒定為具有發(fā)展該疾病的風(fēng)險時是成功的。因?yàn)橛绊懚嘁蛩丶膊“l(fā)展的因素組相當(dāng)復(fù)雜,所以該多因素疾病的發(fā)生是特別難以預(yù)測的。同樣,個體通常并不知道其具有發(fā)展多因素疾病風(fēng)險直到在要進(jìn)行預(yù)防的時候已經(jīng)為時過晚。對本領(lǐng)域所屬技術(shù)人員而言,顯而易見此述的方法可以為醫(yī)生提供有效的工具來作出涉及到患者護(hù)理的醫(yī)療決定。風(fēng)險的確定是對個體進(jìn)行臨床分析的一個重要方面,其可被用來確定是否有理由進(jìn)行醫(yī)療干涉,以及哪種干涉最適于給定個體(Bucher,et al(1994)BMJ 309(6957)761-764;Forrow,et al(1992)Am J Med 92(2)121-124)。
在某些實(shí)施方案中,本發(fā)明提供了鑒定個體具有發(fā)展疾病風(fēng)險的方法(預(yù)測),由此可以利用所述測定來防止或延遲疾病的發(fā)生。在一個實(shí)施方案中,可通過將根據(jù)個體在疾病相關(guān)SNP組合上的基因型的評分與至少一個閾值進(jìn)行比較,可確定個體發(fā)展給定疾病的風(fēng)險。如果個體的評分超過了閾值,就可對預(yù)防性度量值(例如,輻射或藥物治療)的制定進(jìn)行調(diào)節(jié)。在另一個實(shí)施方案中,可通過計(jì)算個體的相對風(fēng)險并將所述相對風(fēng)險乘以該疾病的流行率來確定個體發(fā)展疾病的風(fēng)險。在其他實(shí)施方案中,可將遺傳檢測的靈敏度,特異性,PPV,NPV,和/或準(zhǔn)確度用來計(jì)算個體發(fā)展所述疾病的風(fēng)險。在又一實(shí)施方案中,檢測的LR可用來計(jì)算個體發(fā)展該疾病的檢測后幾率/可能性。在又一實(shí)施方案中,上述方法的組合可用來確定個體具有或發(fā)展該疾病的風(fēng)險。這一信息可為醫(yī)生所用,從而更好地確定適于患者的治療方案。通常,這一信息可與關(guān)于該疾病,患者,或患者所來自人群的臨床信息組合使用。在某些方面,本發(fā)明的方法還可用來鑒定對疾病具有抵抗力的個體。例如,有些具有家族病史的個體(例如,乳腺癌)卻從來不會形成該疾病。這些知識為這些懷疑會發(fā)展疾病的個體進(jìn)行了更好的風(fēng)險評估,為那些沒有較高風(fēng)險的個體提供了心靈的平靜,在某些情況下,還排除了劇烈的預(yù)防性治療(例如,可選擇的乳房切除術(shù))。本發(fā)明的方法還可用來鑒定個體具有發(fā)展不利的,非疾病狀態(tài)的升高的風(fēng)險,由此激發(fā)生活方式的改變從而預(yù)防所述狀態(tài)的發(fā)生。例如,包括與高血壓相關(guān)的SNP組的多基因檢測為那些已發(fā)現(xiàn)具有較高風(fēng)險的個體提供了進(jìn)行鍛煉以及食用健康膳食的強(qiáng)烈動機(jī)。
僅根據(jù)在患者中明顯的身體癥狀,某些疾病是難以診斷的。對這些疾病的診斷通常會被該疾病以多種方式在不同個體中的表現(xiàn)方式,和/或其癥狀類似于多種不相關(guān)疾病的癥狀的事實(shí)混淆。在本發(fā)明的又一方面,與這種疾病相關(guān)的SNP組合可用來協(xié)助對具有該疾病指示性表現(xiàn)型的個體進(jìn)行診斷。因此,對相關(guān)SNP組進(jìn)行個體的基因型分析以及確定個體表現(xiàn)出該疾病的風(fēng)險可對由身體癥狀建議的診斷進(jìn)行支持或反對。如果對診斷有所支持,醫(yī)生就可以使用這一信息作出適于該個體的治療決定,從而啟動對該疾病的治療。例如,脂瀉病是破壞了小腸并干擾食物營養(yǎng)成分吸收的消化系統(tǒng)自身免疫紊亂。特別地,腸泄病會在小腸中引起對存在于小麥,黑麥和大麥中的面筋的炎癥反應(yīng),對腸泄病唯一的治療就是無面筋的膳食。因?yàn)椴煌膫€體表現(xiàn)出了不同的癥狀,所以很難對腸泄病進(jìn)行診斷。例如,一些人具有初級消化系統(tǒng)癥狀,如腹部擴(kuò)張或腹瀉,而其他人則僅易怒或抑郁。此外,該癥狀很容易被誤診,因?yàn)樵摪Y狀類似于許多其他的病癥,包括過敏性腸綜合征,克羅恩氏病,潰瘍性結(jié)腸炎,腸憩室病,腸感染。慢性疲勞綜合征和抑郁。本發(fā)明的方法可用來鑒定與腸泄病相關(guān)的遺傳座組,而這些座可用來對表現(xiàn)出腸泄病指示性癥狀的個體進(jìn)行篩選?;谄溥z傳組成,那些被發(fā)現(xiàn)具有較高風(fēng)險發(fā)展腸泄病的個體可被診斷為患有腸泄病并給予無面筋的膳食。
在其它實(shí)施方案中,本發(fā)明的方法可用來協(xié)助確定是否某種用來預(yù)防,例如個體中疾病發(fā)展的預(yù)防性治療是有理由的。例如,預(yù)防乳腺癌的有效治療方案依賴于臨床病史信息,例如家族史,初潮時間,孩子數(shù)量等等。這些因素,盡管在計(jì)算檢測前幾率時是有用的,但在預(yù)測某位婦女是否會發(fā)展乳腺癌時僅具有微弱的作用??膳c檢測前幾率組合使用的遺傳檢測將提供相當(dāng)好的方式,通過提供更多的正確方式來鑒定和定量女性發(fā)展乳腺癌的風(fēng)險,從而確定是否對該個體進(jìn)行預(yù)防性治療(例如,三苯氧胺)。
在本發(fā)明的一個方面,提供了預(yù)測性或診斷性分析,其含有包括探針的核酸陣列,該探針設(shè)計(jì)為對生物樣品中存在的相關(guān)SNP組合進(jìn)行測定的探針。從檢測個體的生物樣品中提取核酸,并將其與所述核酸陣列上的探針雜交。對探針強(qiáng)度進(jìn)行分析從而提供了在每個相關(guān)SNP位點(diǎn)所述檢測個體的基因型。將基因型可用來計(jì)算檢測個體的評分,并根據(jù)本發(fā)明所述的方法測定個體發(fā)展所述疾病的風(fēng)險。
還可以將相關(guān)SNP的組用于鑒定涉及疾病表現(xiàn)型發(fā)展的基因組區(qū)域。這些SNP可以直接涉及所述疾病的表現(xiàn),或其可以與直接涉及的座處于連鎖不平衡。例如,疾病相關(guān)的SNP可以直接影響疾病相關(guān)蛋白的表達(dá)或功能,或者可與影響該蛋白表達(dá)或功能的其他座形成連鎖不平衡。直接影響蛋白的表達(dá)或功能的例子包括,但不限于,改變所述蛋白多肽序列的多態(tài)性,發(fā)生在調(diào)控區(qū)域(即,啟動子,增強(qiáng)子,等等)導(dǎo)致所述蛋白表達(dá)升高或降低的多態(tài)性。在某些實(shí)施方案中,可對包含有相關(guān)SNP組的基因組區(qū)域進(jìn)行分析從而鑒定直接參與所述疾病生物學(xué)基礎(chǔ)的基因(“被鑒定的基因”)。
存在于基因編碼區(qū)中的相關(guān)SNP可用作所述疾病的診斷標(biāo)記對生物樣品中的相關(guān)等位基因的表達(dá)進(jìn)行檢測和定量。例如,含有相關(guān)SNP的核酸可用作寡核苷酸探針對擬被檢測的生物體或其部分,例如特定組織或器官中的RNA或mRNA水平進(jìn)行監(jiān)測,從而確定編碼所述RNA或mRNA的基因是否含有相關(guān)的等位基因。在一方面,提供了含有寡核苷酸探針的診斷性或預(yù)測性試劑盒,在生物樣品中對相關(guān)的等位基因進(jìn)行檢測。類似地,如果相關(guān)等位基因在所編碼蛋白的多肽序列中引起了改變,那么就可以使用任一適當(dāng)?shù)募夹g(shù),例如免疫學(xué)方法(例如,Western雜交,放射免疫沉淀等等)或測定與所述基因產(chǎn)物活性相關(guān)的基于活性的分析方法,在蛋白質(zhì)水平對所述基因的等位基因組成進(jìn)行分析。在一方面,提供了含有分析的診斷性或預(yù)測性試劑盒在生物樣品中對相關(guān)的等位基因編碼的多肽進(jìn)行檢測。對細(xì)胞中所存在特定核苷酸或多肽序列進(jìn)行探測的方法已經(jīng)建立,無須贅述,參見,例如Sambrook,et al,Molecular CloningA Laboratory Manual(Cold SpringHarbor Laboratory,New York)(2001)。
治療方法相關(guān)SNP組可用于開發(fā)適用于預(yù)防疾病的治療方法。在一方面,所鑒定的基因可用于基因治療。例如,如果所鑒定的基因在表現(xiàn)疾病的個體中是下調(diào)的,那么將該基因上調(diào)就是一種有效的策略來預(yù)防檢測個體中疾病的發(fā)生??梢酝ㄟ^將不與疾病相關(guān)基因的等位基因整合入表達(dá)載體,并將該載體導(dǎo)入生物體中,由此在該生物體中將該基因的表達(dá)上調(diào),實(shí)現(xiàn)對所鑒定基因的上調(diào)。這樣的載體一般都在啟動子序列附近具有方便的限制性位點(diǎn)從而在受體基因組中提供了核酸序列的插入。轉(zhuǎn)錄盒的制備可包括轉(zhuǎn)錄起始區(qū)域,靶基因或其片段,以及轉(zhuǎn)錄終止區(qū)域。轉(zhuǎn)錄盒可被導(dǎo)入多種載體中,例如,質(zhì)粒;逆轉(zhuǎn)錄病毒,例如,慢病毒,腺病毒;等等,其中所述載體能夠在細(xì)胞中瞬間或穩(wěn)定維持??赏ㄟ^任意的方式,包括病毒感染,微注射,或囊泡融合將所述基因或蛋白產(chǎn)物直接導(dǎo)入組織或宿主細(xì)胞。噴氣注射也可用于進(jìn)行肌內(nèi)給藥,如Furth Et al,Anal Biochem,205365-68(1992)所述。或者,可將DNA包被在金微粒上,并通過文獻(xiàn)中所述的微粒轟擊裝置或“基因槍”經(jīng)皮內(nèi)進(jìn)行遞送(參見,例如,Tang,et al,Nature,356152-54(1992))。
如果在與該疾病易感性體質(zhì)相關(guān)的蛋白序列中有氨基酸的改變,那么由所鑒定基因編碼的蛋白就可以作為抗體治療的靶位。例如,如果某個相關(guān)等位基因編碼的蛋白變異體是引起該疾病的因素,那么就可將對該疾病相關(guān)蛋白變異體具有特異性的抗體施用給患者作為抑制該疾病發(fā)展的手段。在某些實(shí)施方案中,每一種對不同疾病相關(guān)蛋白具有特異性的抗體組合,可施用給患者從而預(yù)防疾病的發(fā)生。
反義分子可用于在細(xì)胞中對所鑒定基因相關(guān)的等位基因的表達(dá)進(jìn)行下調(diào)。反義分子與基因等位基因所編碼的mRNA形成雙鏈,由此下調(diào)其表達(dá)并封閉了對應(yīng)蛋白的翻譯。例如,可以在由相關(guān)等位基因編碼的mRNA序列基礎(chǔ)上發(fā)展反義試劑。然后將這樣的反義試劑施用給雜合子患者(擁有一個相關(guān)等位基因和一個與該疾病非相關(guān)的等位基因)來降低相關(guān)等位基因的表達(dá),允許非相關(guān)等位基因的表達(dá)占主要。反義試劑可以是反義寡核苷酸,尤其是具有化學(xué)修飾的合成反義寡核苷酸,或表達(dá)這種反義分子的核酸構(gòu)建體,如RNA??蓪⒎戳x分子的組合給藥,其中該組合可包括多種不同的序列。
作為反義抑制劑的替代物,催化核酸化合物,例如,核酶,反義軛合物等等可被用于抑制相關(guān)等位基因的表達(dá)。核酶可在體外合成并給藥于患者,或可在表達(dá)載體上被編碼,從中可在靶細(xì)胞中合成核酶(例如,參見國際專利申請WO 9523225號,和Beigelman,et al,Nucl AcidsRes 234434-42(1995))。具有催化活性寡核苷酸的例子在WO 9506764中已有描述。能夠介導(dǎo)mRNA水解的具有金屬復(fù)合物的反義寡核苷酸軛合物,例如,三聯(lián)吡啶銅(II)在Bashkin,et al,Appl Biochem Biotechnol5443-56(1995)中已有描述。
由所鑒定基因編碼的表達(dá)蛋白可用于藥物篩選分析,從而鑒定結(jié)合于所述蛋白產(chǎn)物,調(diào)節(jié)或模擬所述蛋白產(chǎn)物活性的配體或底物,由此鑒定出能在,受影響細(xì)胞中,例如,提供替換或增強(qiáng)蛋白功能,或調(diào)節(jié)或取消蛋白功能制劑的治療劑。出于這一目的,可使用多種分析方法,包括標(biāo)記的體外蛋白-蛋白結(jié)合分析,蛋白-DNA結(jié)合分析,電泳遷移率分析,蛋白結(jié)合的免疫分析,等等。在此使用的術(shù)語“制劑”描述的是任意分子,例如,可以直接或間接對所鑒定基因或基因產(chǎn)物的生理功能具有改變,模擬或屏蔽能力的蛋白或小分子。一般而言,可將所述制劑以不同濃度平行地進(jìn)行多種分析,從而獲得對于不同濃度的不同反應(yīng)。通常,這些濃度中的一種可作為陰性對照,例如,為零濃度或低于檢測水平。同樣,全部或部分純化蛋白變異體可用于測定三維晶體結(jié)構(gòu),其還可用于測定所述蛋白或其部分的生物學(xué)功能,建立分子相互作用的模型,膜融合模型,等等。
候選制劑包括多種化學(xué)類型,盡管通常是有機(jī)分子或復(fù)合物,優(yōu)選的是分子量大于50小于2,500道爾頓的小有機(jī)化合物。候選制劑包括與蛋白進(jìn)行結(jié)構(gòu)上的相互作用必需的官能團(tuán),尤其是氫鍵,其通常包括至少一個胺,羰基,羥基或羧基,且通常是至少兩個官能化學(xué)基團(tuán)。候選制劑通常包括一個或多個上述官能團(tuán)取代的碳環(huán)或雜環(huán)結(jié)構(gòu)和/或芳香或多芳香結(jié)構(gòu)。候選制劑還可在生物分子中發(fā)現(xiàn),這些生物分子包括,但不限于多肽,糖,脂肪酸,類固醇,嘌呤,嘧啶,衍生物,結(jié)構(gòu)類似物或其組合。
可從多種來源,包括合成或天然化合物的文庫中得到候選制劑。例如,有多種方法可方便地對多種有機(jī)化合物和生物分子進(jìn)行隨機(jī)和指導(dǎo)性合成,包括隨機(jī)寡核苷酸和寡肽的表達(dá)?;蛘撸约?xì)菌,真菌,植物和動物提取物形式存在的天然化合物文庫是可以獲得并容易生產(chǎn)的。而且,通過常規(guī)的化學(xué),物理和生物化學(xué)手段可對天然或合成生產(chǎn)的文庫和化合物進(jìn)行方便地修飾,并可用于生產(chǎn)組合文庫。公知的藥理學(xué)制劑可用來進(jìn)行直接或隨機(jī)的化學(xué)修飾,例如,酰化,烷基化,酯化,amidification,等來生產(chǎn)結(jié)構(gòu)類似物。
當(dāng)篩選分析是結(jié)合分析時,可將一種或多種分子軛合于標(biāo)記,其中所述標(biāo)記可直接或間接地提供可檢測的信號。多種標(biāo)記包括了放射性同位素,熒光劑,化學(xué)發(fā)光劑,酶,特異性結(jié)合分子,顆粒,例如磁顆粒,等等。特異性結(jié)合分子包括成對物質(zhì),例如生物素和抗生物素蛋白鏈菌素,地高辛和抗地高辛,等等。對特異性結(jié)合成分而言,其互補(bǔ)成分通常都標(biāo)記有根據(jù)公知方法提供測定的分子。在所述篩選分析中還包括了多種其他試劑。這些包括有如鹽,中性蛋白,例如,白蛋白,去污劑等等的試劑可用來協(xié)助最佳的蛋白-蛋白結(jié)合和/或降低非特異性或背景相互作用。還可以使用提高所述分析效率的試劑,例如,蛋白抑制劑,核酸酶抑制劑,抗微生物制劑等等。
制劑可與藥物可接受的載體或稀釋劑組合,包括任一和全部溶劑,分散介質(zhì),包衣劑,抗氧化劑,等滲劑和吸收延緩劑等等。制劑可與常規(guī)的添加劑,如乳糖,甘露醇,玉米淀粉或土豆淀粉;與粘合劑,如結(jié)晶纖維素,纖維素衍生物,阿拉伯樹膠,玉米淀粉或明膠;與崩解劑,如玉米淀粉,土豆淀粉或羧甲基纖維素鈉;與潤滑劑,如滑石或硬脂酸鎂;以及如果需要的話,與緩沖劑,濕潤劑,防腐劑和調(diào)味劑組合。對這些具有藥物活性物質(zhì)的介質(zhì)和制劑的使用在本領(lǐng)域內(nèi)是公知的,并很容易為公眾所獲得。此外,藥物可接受的輔助物質(zhì),例如pH調(diào)節(jié)劑和緩沖劑,強(qiáng)度調(diào)節(jié)劑,穩(wěn)定劑,濕潤劑等等都是很容易為公眾所獲得的。除了與所述活性成分不匹配的任意常規(guī)介質(zhì)或制劑,其在治療組合物和本發(fā)明所述方法中使用都被包括在內(nèi)。還可在所述組合物中包括補(bǔ)充性的活性成分。
以下方法和賦型劑僅是示例性的并非以任何方式進(jìn)行限制。所鑒定的本發(fā)明制劑可整合入多種配方中來進(jìn)行治療性給藥。更特別地,通過與適當(dāng)?shù)?,以上討論的制藥可接受的載體或稀釋劑組合,所述復(fù)合物可被配制成藥物組合物,且可以被配制成固體,半固體,液體或氣體形式的制劑,例如片劑,膠囊,粉劑,顆粒,油膏,溶液,凝膠,微球體和氣霧劑。而且,通過在水溶性或非水溶性溶劑,例如植物油或其他類似油,合成的脂肪酸甘油酯,高級脂肪酸酯或丙二醇中對其進(jìn)行溶解,懸浮或乳化;如果需要的話,還可與常規(guī)添加劑,例如增溶劑,等滲劑,懸浮劑,乳化劑,穩(wěn)定劑和防腐劑一起將制劑配制成用于注射的制劑。此外,可通過吸入將配制成氣霧劑配方的制劑給藥。通過本發(fā)明方法鑒定的所述制劑可被配制成壓縮的可接受揮發(fā)劑,例如二氯二氟甲烷,丙烷,氮?dú)獾鹊取;蛘?,通過與多種基質(zhì),例如乳化性基質(zhì)或水溶性基質(zhì)混合,并可包括載體,例如在體溫融化而在室溫為固體的可可脂,carbowaxes和聚乙二醇混合,可將制劑制備成適于直腸給藥的栓劑。
適用于緩釋配方的植入物在本領(lǐng)域中是公知的。植入物可被配制成具有生物降解或非生物降解聚合物的微球體,片等等。例如,乳酸和/或羥基乙酸的聚合物形成了宿主良好耐受的易蝕的聚合物。含有所鑒定制劑的植入物可放置于位置附近,從而使得該活性制劑的局部濃度相對于肌體的其他部分有所升高。還提供了適于口服或直腸給藥的單位劑量形式,例如糖漿,酏劑和懸液,其中每種劑量單位,例如,茶匙,湯匙,凝膠膠囊,片劑或栓劑都包含預(yù)定量的本發(fā)明組合物。類似地,適于注射或靜脈給藥的單位劑量形式可包括如在無菌水中,常規(guī)鹽水或其他藥物可接受載體溶液中的以組合物形式存在的本發(fā)明化合物。適于新單位劑型的規(guī)格依賴于所使用的特定化合物和希望達(dá)到的效果,以及在宿主中與每種活性成分相關(guān)的藥效學(xué)。
可以多種方式實(shí)現(xiàn)所述制劑的給藥。所述制劑可通過吸入進(jìn)行口服給藥,或通過例如血管內(nèi),腫瘤內(nèi)(intratumor),皮下,腹內(nèi),肌內(nèi)等等方式進(jìn)行注射。通過使用在植入位置發(fā)揮維持所述活性劑量的植入物,所述制劑可以是局部的,系統(tǒng)性的或定位的。所述治療配方的劑量可隨著所使用的具體制劑和配方,疾病的特征,給藥的頻率,給藥的方式,制劑從宿主中被清除等等的變化而變化,因此足以對疾病或其癥狀進(jìn)行治療而同時將副作用降低到最低。在某些情況中,口服給藥的劑量與靜脈內(nèi)給藥的劑量并不相同。可將所述化合物以有效劑量給藥,因此經(jīng)過適當(dāng)?shù)臅r間該疾病的發(fā)展可被基本抑制。起始劑量可以較高,然后是較低的維持劑量??刹捎貌活l繁的,如一天一次,一周一次或兩周一次進(jìn)行所述劑量的給藥,或?qū)⑵錃w為更小的劑量每天,或半周等等給藥來維持有效的劑量水平。治療可以是短期的,例如,在心室纖維性顫動之后,或長期的,例如,預(yù)防心室纖維性顫動的進(jìn)一步發(fā)作。應(yīng)該理解,為了進(jìn)行體內(nèi)使用,所述組合物的獲得和使用都應(yīng)該聽從于醫(yī)生的指導(dǎo)。
藥物基因組學(xué)在其他實(shí)施方案中,由本發(fā)明方法鑒定的相關(guān)SNP的組合可用于藥物基因組學(xué)和藥物發(fā)展。由于適合對常見多因素疾病進(jìn)行的治療選擇數(shù)量巨大,通常很難確定哪一組治療選擇對給定的患者是最有效的。一般地,在確定哪一種選擇是安全和有效的之前,需要嘗試若干種選擇。與此同時,患者還要繼續(xù)遭受疾病的影響,并有可能經(jīng)歷由一種或多種治療選擇檢測造成的副作用。本發(fā)明的方法可在啟動治療方案之前有效地對患者人群進(jìn)行分類。所鑒定的多態(tài)座與患者對藥物或其它醫(yī)學(xué)治療的反應(yīng)相相關(guān)。所述反應(yīng)可以是副作用或可與治療的效率相關(guān)。將相關(guān)座用于對患者人群進(jìn)行篩選從而獲得與該患者相關(guān)座相關(guān)的遺傳資料有助于幫助醫(yī)生確定應(yīng)該對哪些個體給藥或給于醫(yī)學(xué)治療而哪些則不需要。例如,對表現(xiàn)出副作用具有易感性體質(zhì)的個體和不太可能對藥物具有有效反應(yīng)的個體可被排除在該藥物的治療范圍之外,而通過其他的方式(不同的藥物或其它醫(yī)學(xué)治療)來進(jìn)行治療。
在一個這樣的實(shí)施方案中,對個體進(jìn)行了與疾病相關(guān)且具有對特殊藥物治療具有公知副作用風(fēng)險的SNP組的篩選。將那些具有較高風(fēng)險發(fā)展該疾病的個體從該治療方案中排除出去。例如,當(dāng)給藥抗心律不齊藥物時,具有LQTS(長QT綜合征)的個體具有較高的心室纖維性顫動風(fēng)險。有益處的是在給藥這樣的藥物之前,對患者人群進(jìn)行與LQTS相關(guān)座組合的篩選,并且將那些具有較高風(fēng)險發(fā)展LQTS的個體排除出去。通過實(shí)施相關(guān)分析可以確定與該疾病相關(guān)的SNP組,且如上所述分析了該個體發(fā)展該疾病的風(fēng)險。發(fā)展所述疾病的較高風(fēng)險被認(rèn)為是對抗心律不齊藥物產(chǎn)生副作用的風(fēng)險因素,而這一信息可為醫(yī)生所用來確定適于該個體的適當(dāng)治療選擇。例如,如果該個體具有較高的風(fēng)險發(fā)展該疾病,那么就可以避免給藥。如果該個體發(fā)展該疾病的風(fēng)險較低,那么給藥就是一種可能的治療選擇。
在本發(fā)明的另一實(shí)施方案中,可基于在與所述藥物相關(guān)的SNP組合上個體的基因型對藥物治療方案對該個體的有效性進(jìn)行預(yù)測。這一信息可用來確定是否該藥物對該個體具有有效地治療的可能性,或應(yīng)該考慮其他的藥物或治療選擇。例如,可以使用對藥物沒有有效反應(yīng)的患者組個體(“無反應(yīng)者”)和具有有效反應(yīng)的對照組個體(“反應(yīng)者”)實(shí)施相關(guān)分析。在多個SNP位置對患者組和對照組的個體進(jìn)行基因型分析,并計(jì)算每個SNP的相對等位基因頻率,由于那些SNP具有的等位基因頻率差異在患者組和對照組中差異顯著,鑒定出了與有效反應(yīng)相關(guān)的SNP組合。基于在相關(guān)SNP上的基因型,對患者組和對照組中每個成員的評分進(jìn)行計(jì)算,并將這些評分用來確定適于遺傳檢測的一個或多個適當(dāng)?shù)拈撝?,所述遺傳檢測能夠預(yù)測某個個體對所述藥物沒有有效應(yīng)答的風(fēng)險。對適當(dāng)閾值的確定還可包括一或多個以下內(nèi)容所述藥物的臨床知識,需要治療的病癥,患者人群,以及對該遺傳檢測的靈敏度,特異性,PPV,NPV,準(zhǔn)確度,LR+和LR-的計(jì)算。在每一個相關(guān)SNP位置對接受藥物的候選個體進(jìn)行基因型分析,并基于在該SNP組他/她的基因型計(jì)算出該個體的評分。如果該個體的評分高于閾值,則該個體可被歸為有可能成為未響應(yīng)者,并可考慮其他的治療方案。如果該個體的評分等于或低于閾值,則該個體可被歸為有可能是響應(yīng)者并推薦給藥。在其他實(shí)施方案中,通過計(jì)算個體的相對風(fēng)險并將該相對風(fēng)險乘以基于該藥物公知效率得到的未響應(yīng)者的流行率,確定了該個體是未響應(yīng)者的風(fēng)險。在另一實(shí)施方案中,使用多基因檢測的準(zhǔn)確度,LR+,LR-,PPV和/或NPV計(jì)算出了個體是響應(yīng)者的可能性。這一信息隨后可為醫(yī)生所用來確定適于該個體的適當(dāng)治療方式。
在相關(guān)的實(shí)施方案中,可對適于治療范圍的診斷進(jìn)行發(fā)展從而使得醫(yī)生能夠更高對患者進(jìn)行個性化治療。與集中于單一藥物不同,治療領(lǐng)域診斷可提供可能性的信息,即患者可以是涉及單個治療領(lǐng)域的一系列藥物的響應(yīng)者。例如,市場上有多種治療抑郁的藥物,包括SSRI(選擇性血清素再攝入抑制劑),TCA(三環(huán)抗抑郁藥),MAOI(單胺氧化酶抑制劑)和三唑吡啶(triazolopyridine)。還可以實(shí)施相關(guān)分析來鑒定與這些藥物類型中的每一個的效率都相關(guān)的多態(tài)座,然后將這些作為用來篩選患者人群,從而確定哪一類藥物對給定個體是最有效的座。對每一種藥物而言,患者組包括對該藥物具有有效反應(yīng)的患有抑郁的患者,而對照組則包括對該藥物沒有有效反應(yīng)的個體。由于那些SNP在患者組和對照組中具有顯著差異的等位基因頻率,可將相關(guān)的SNP鑒定出來。對每一類藥物而言,閾值的確定將能鑒定個體有多高的幾率(例如,>80%,或>90%或>95%,或>98%)具有有效的反應(yīng)。對需要抗抑郁治療的個體進(jìn)行與每種藥物類型相關(guān)SNP的篩選,而由醫(yī)生在基于該個體基因型信息和對每類藥物所確定的閾值對該個體的適當(dāng)治療選擇作出決定。
在又一實(shí)施方案中,通過對患者人群進(jìn)行分類,與藥物效率相關(guān)的SNP可用來提高所述藥物的效率從而將可能的未響應(yīng)者排除在治療之外。在一個實(shí)施例中,約32%暴露于藥物患者被歸為響應(yīng)者。對響應(yīng)者的患者組和未響應(yīng)者的對照組進(jìn)行了相關(guān)分析,發(fā)現(xiàn)有25個SNP與響應(yīng)者的表現(xiàn)型相關(guān)。基于對患者和對照計(jì)算得到的評分,可以發(fā)現(xiàn)81%的響應(yīng)者和40%的未響應(yīng)者的評分都>19。因此,可以將19作為閾值在給藥前對患者人群進(jìn)行分類,將所述藥物的總效率從約32%提高至約50%。在這種情況下,暴露于所述藥物的未響應(yīng)者數(shù)量大幅度降低,然后可對那些被排除出來的個體實(shí)施其他治療方式的治療。在這種程度上的效率改變可幫助新藥獲得批準(zhǔn),或鼓勵已經(jīng)批準(zhǔn)藥物更廣泛地使用。
在又一個實(shí)施方案中,本發(fā)明的方法可用于評定是否應(yīng)該使用商品藥,還是使用更便宜的通用名藥(generic drug)。例如,可實(shí)施相關(guān)分析來鑒定與對仿制替代物具有陽性臨床反應(yīng)相關(guān)的遺傳座。隨后對需要治療的患者在這些相關(guān)座上進(jìn)行基因型分析,并計(jì)算出評分。然后將該個體的評分用來預(yù)測在該個體內(nèi)通用名藥的效率,而醫(yī)生也可以使用這一信息來作為對該個體進(jìn)行治療的決定。同樣,所公開方法的應(yīng)用還可用于對醫(yī)療費(fèi)用補(bǔ)償作出決定。例如,如果發(fā)現(xiàn)在個體A中通用名藥不太可能有效,那么就應(yīng)該對A給藥商品藥并將商品藥的費(fèi)用補(bǔ)償給A;然而,如果個體B有可能對通用名藥產(chǎn)生有效反應(yīng),那么個體B就不應(yīng)該被給藥更昂貴的商品藥,就可以僅僅補(bǔ)償通用名藥的費(fèi)用。
在本發(fā)明的其他實(shí)施方案中,基于在與藥物相關(guān)副作用相關(guān)的SNP組合上對個體進(jìn)行基因型分析,確定該個體會經(jīng)歷對給藥所述藥物產(chǎn)生副作用的風(fēng)險。如果發(fā)現(xiàn)該個體具有較高風(fēng)險經(jīng)歷對治療方式產(chǎn)生的副作用,那么就可以避免使用該治療方式而考慮其他的治療選擇。例如,可使用對藥物表現(xiàn)出副作用個體的患者組和不表現(xiàn)出該副作用個體的對照組實(shí)施相關(guān)分析。在多個SNP位置對患者組和對照組的個體進(jìn)行基因型分析,并計(jì)算每個SNP的相對等位基因頻率,由于那些具有等位基因頻率差異的SNP在患者組和對照組中差異顯著,鑒定出了與副作用相關(guān)的SNP組合。根據(jù)在其相關(guān)SNP上的基因型,計(jì)算出患者組和對照組中每個成員的評分,并將這些評分用于確定適于多基因檢測的一個或多個閾值,該多基因檢測可以適當(dāng)水平靈敏度,特異性,PPV,NPV,LR+,LR-和/或準(zhǔn)確度預(yù)測個體經(jīng)歷對所述藥物產(chǎn)生的副作用的風(fēng)險。如上所述,可以根據(jù)臨床因素,例如副作用的嚴(yán)重程度,需要治療的疾病或病癥,以及需要治療的患者的病史對閾值進(jìn)行選擇。例如,如果副作用是死亡的話,那么較高的靈敏度對于鑒定那些一旦給藥了所述藥物就具有較高死亡可能性個體是至關(guān)重要的。在接受所述藥物之前,在每個相關(guān)SNP位置對個體進(jìn)行基因型分析,并根據(jù)在該SNP組合他/她的基因型計(jì)算出該個體的評分。例如,如果該個體的評分高于對患者組和對照組測定的評分,則該個體可被歸為一旦給藥的就有可能經(jīng)歷副作用的個體,同時可以避免使用藥物。如果該個體的評分等于或低于閾值,則該個體可被歸為不太可能遭受副作用的個體,同時推薦給藥。如果該個體的評分低于或等于一個閾值同時又大于另一個閾值,那么該個體可被歸為具有中等可能性經(jīng)歷副作用,同時可使用其他藥物治療,或給藥其他藥物,例如,僅與嚴(yán)密的監(jiān)測,或與其他治療劑組合來中和所述副作用。確定適于具有中等風(fēng)險經(jīng)歷副作用個體的最佳治療方案比確定適于具有極高或極低風(fēng)險個體的最佳治療方案更依賴于其他信息(例如,臨床信息,F(xiàn)DA情況或患者信息,等等)。在又一實(shí)施方案中,可通過計(jì)算個體的相對風(fēng)險,并將該相對風(fēng)險乘以公知的個體經(jīng)歷副作用的流行率,來確定個體經(jīng)歷副作用的風(fēng)險。這一信息隨后可為醫(yī)生所用,來決定適于該個體的適當(dāng)治療方式。對于給藥產(chǎn)生的副作用包括,但不限于,過敏反應(yīng),心臟心律不齊,中風(fēng),支氣管痙攣,胃腸紊亂,昏厥,陽萎,皮疹,發(fā)燒,肌肉疼痛,頭痛,惡心,出生缺陷,潮熱,情緒變化,眩暈,激動,嘔吐,睡眠紊亂,嗜眠,失眠,對藥物成癮和死亡。
在一個相關(guān)實(shí)施方案中,可將與藥物安全相關(guān)的SNP用于提高通過對患者人群進(jìn)行分類獲得的藥物安全性,從而將那些有可能表現(xiàn)出對給藥所述藥物產(chǎn)生副作用的個體排除在治療范圍之外。在一個實(shí)施例中,發(fā)現(xiàn)一種新藥具有極好的效率,耐受和方便性,然而,4%使用所述藥物治療的個體經(jīng)歷了嚴(yán)重的副作用,且這種副作用的發(fā)生將該藥物的使用僅限制在,例如,那些其他治療都失敗的個體內(nèi)。然而,管理結(jié)構(gòu)約定如果可將副作用的發(fā)生降低至少50%,就可以批準(zhǔn)該藥物具有更廣泛的應(yīng)用。如果在治療前對有可能經(jīng)歷副作用的個體進(jìn)行鑒定,這就是可以達(dá)到的,所以對經(jīng)歷副作用個體的患者組和沒有鑒定與該副作用相關(guān)的20個SNP的個體的對照組實(shí)施了相關(guān)分析。對該相關(guān)分析的結(jié)果如表3所示,第一列所示為風(fēng)險邊界值,第二列所示為評分高于對應(yīng)風(fēng)險邊界值的患者百分?jǐn)?shù),第三列所示為評分高于對應(yīng)風(fēng)險邊界值的對照百分?jǐn)?shù),第四列為相對風(fēng)險,第五列為靈敏度百分?jǐn)?shù),第六列為特異性百分?jǐn)?shù),第七列為PPV(為百分?jǐn)?shù)),第八列為NPV(為百分?jǐn)?shù))。
表3
使用這些值,發(fā)現(xiàn)使用19為閾值可以排除了大約51.6%對副作用具有最高風(fēng)險的患者,與此同時只排除了5.6%可受益于所述藥物的患者。因此,如果使用19為閾值對1000個患者進(jìn)行篩選,并假設(shè)其中4%的患者都具有較高風(fēng)險經(jīng)歷所述副作用,則可以排除74[(1000)(0.04)(0.516)+(1000)(0.96)(0.056)]個個體,并對剩余的926個個體進(jìn)行治療。那些經(jīng)過治療個體的副作用風(fēng)險因此為[(1000)(0.04)(1-0.516)/926=0.02],或者2%。因此,使用19為閾值在給藥所述藥物之前的診斷中對患者人群進(jìn)行分類可以將副作用發(fā)生從4%降低至2%,由此使得所述藥物可更廣泛的使用。類似地,18也可用作閾值,其可將23/1000個體排除,并導(dǎo)致在接受治療的個體中與其副作用的發(fā)生為1.9%。然而,這種副作用發(fā)生的降低伴隨著該檢測特異性和PPV的同時降低。對適當(dāng)風(fēng)險/受益診斷閾值的選擇不僅需要關(guān)于檢測本身的信息(特異性,靈敏度,PPV,NPV,等),還需要本發(fā)明方法實(shí)施者與管理機(jī)構(gòu)(例如,F(xiàn)DA)以及基于醫(yī)療機(jī)構(gòu)的判斷之間的相互作用。這種藥物基因組學(xué)檢測的目的在于最大化NPV(在接受治療的個體中降低副作用的發(fā)生)同時平衡PPV(將所排除的受益于所述藥物的患者最小化)。使用本發(fā)明的方法來降低副作用的頻率可以幫助新藥得到批準(zhǔn),或鼓勵已經(jīng)批準(zhǔn)藥物的更廣泛使用。例如,通過將這樣的診斷與藥物結(jié)合,有可能將副作用的頻率降低至商業(yè)可接受的水平,從而有效地拯救將不被批準(zhǔn)的藥物。
對本領(lǐng)域所屬技術(shù)人員顯而易見的是,與藥物結(jié)合的用于診斷批準(zhǔn)的適當(dāng)閾值主要依賴于藥物提供者(例如,制藥公司)和管理機(jī)構(gòu)(例如,F(xiàn).D.A)之間的協(xié)商。這是關(guān)于所述診斷能否提高藥物效率或安全性的情況。例如,盡管在上述實(shí)施例中副作用的頻率低于2%,管理機(jī)構(gòu)會要求更加嚴(yán)謹(jǐn)?shù)陌踩剑虼藭玫礁偷拈撝祦龛b定從該藥物治療中排除的個體,由此犧牲PPV而獲得更高的NPV。
在某些方面,本發(fā)明提供了極大改進(jìn)的方法來測定個體發(fā)展或表現(xiàn)出多因素性狀的風(fēng)險。在某些方面,所述方法可進(jìn)一步用來發(fā)展針對多因素疾病的預(yù)防,診斷或治療。在其他方面,該方法還可進(jìn)一步用來在給藥治療方案之前預(yù)測個體的藥物反應(yīng)。通過提供對個體進(jìn)行快速尋找正確醫(yī)療干預(yù)(最有效,最安全,最便宜,等等)的手段,本發(fā)明的方法還可進(jìn)一步幫助降低醫(yī)療的總開銷,因此不會將寶貴的時間和金錢浪費(fèi)在有限價值的治療中。應(yīng)該理解以上描述旨在進(jìn)行說明而非進(jìn)行限制。在不偏離本發(fā)明范圍和精神的情況下,對已公開的發(fā)明所采取的多種實(shí)施方案和修改對本領(lǐng)域所屬技術(shù)人員而言也是顯而易見的。本發(fā)明的范圍,因此,并不是參照以上說明來確定的,而是參照所附的權(quán)利要求,以及這些權(quán)利要求所要求的等同變換的全部范圍來確定的。本文提到的所有出版物都被作為說明性的目的進(jìn)行引用,而且公開的試劑,方法學(xué)和概念都可與本發(fā)明結(jié)合使用。本文中沒有任何內(nèi)容被認(rèn)為涉及了本發(fā)明的現(xiàn)有技術(shù)。在整個公開內(nèi)容中,參考了多個專利,專利申請和專利公開。除非另有說明,出于所有目的將其每一個都全文引用作為參考。
權(quán)利要求
1.評估個體發(fā)展或表現(xiàn)出多因素性狀可能性的方法,包括a)在多個雙等位基因多態(tài)座上測定所述個體的基因型,其中所述多個雙等位基因的每一個都有一個相關(guān)等位基因和一個非相關(guān)的等位基因,且更進(jìn)一步其中的基因型選自相關(guān)等位基因的純合子,雜合子和非相關(guān)等位基因的純合子;b)根據(jù)在步驟a)中確定的基因型計(jì)算所述個體的評分;c)將所述評分與至少一個閾值進(jìn)行比較,其中所述比較可用來評估該個體發(fā)展或表現(xiàn)出所述多因素性狀的可能性,并進(jìn)一步確定所述個體的適當(dāng)治療過程。
2.權(quán)利要求1的方法,還包括對表現(xiàn)出多因素性狀的患者組和未表現(xiàn)出多因素性狀的對照組實(shí)施相關(guān)分析鑒定出多個雙等位基因多態(tài)座的相關(guān)等位基因和非相關(guān)等位基因,從而確定出在患者組中豐度明顯高于對照組中的所述多態(tài)座的等位基因組合,其中所述等位基因組或其亞組也是相關(guān)等位基因。
3.權(quán)利要求2的方法,其中每個患者組和對照組包含至少50個個體。
4.權(quán)利要求2的方法,其中所述患者組和所述對照組至少之一包含至少100個個體。
5.權(quán)利要求2的方法,其中所述患者組和對照組至少之一包含至少200個個體。
6.權(quán)利要求2的方法,其中所述患者組和對照組至少之一包含至少500個個體。
7.權(quán)利要求2的方法,其中所述患者組和對照組包括為哺乳動物,爬行動物,兩棲動物,魚類,鳥類,甲殼類動物,昆蟲,植物,細(xì)菌,病毒或古細(xì)菌的個體。
8.權(quán)利要求2的方法,其中所述患者組和對照組包括人類個體。
9.權(quán)利要求2的方法,其中在實(shí)施相關(guān)分析之前所述患者組和所述對照組是匹配的。
10.權(quán)利要求2的方法,其中所述實(shí)施相關(guān)分析還包括a)在包含所述多個雙等位基因多態(tài)座的多態(tài)座組合上對患者組和對照組進(jìn)行基因型分析;b)計(jì)算每個所述患者組和所述對照組在每個所述多態(tài)座組合上的相對等位基因頻率;c)對每個多態(tài)座組合而言,將對患者組計(jì)算出的相對等位基因頻率和對對照組計(jì)算出的相對等位基因頻率進(jìn)行比較,從而鑒定出所述多態(tài)座組合的亞組,其中每個所述亞組在患者組中的相對等位基因頻率與在對照組中的相對等位基因頻率具有顯著差異;以及d)確定在所述患者組中豐度高于對照組中的每個亞組的等位基因,其中所述等位基因也是所述相關(guān)等位基因之一。
11.權(quán)利要求10的方法,其中的多態(tài)座組合包含至少約500個多態(tài)座。
12.權(quán)利要求10的方法,其中的多態(tài)座組合包含至少約1000個多態(tài)座。
13.權(quán)利要求10的方法,其中的多態(tài)座組合包含至少約10,000個多態(tài)座。
14.權(quán)利要求10的方法,其中的多態(tài)座組合包含至少約100,000個多態(tài)座。
15.權(quán)利要求10的方法,其中的多態(tài)座組合包含至少約1,000,000個多態(tài)座。
16.權(quán)利要求10的方法,其中的多態(tài)座組合包括來自所述個體基因組中一條或多條染色體的多態(tài)座。
17.權(quán)利要求10的方法,其中的多態(tài)座組合包括來自所述個體基因組中每一條染色體的多態(tài)座。
18.權(quán)利要求10的方法,其中的多態(tài)座組合包括來自所述個體基因組中每一條染色體的多個多態(tài)座。
19.權(quán)利要求2的方法,其中使用個體基因型分析方法來實(shí)施所述相關(guān)分析。
20.權(quán)利要求2的方法,其中使用混合基因型分析方法來實(shí)施所述相關(guān)分析。
21.權(quán)利要求20的方法,還包括使用個體基因型分析方法對所述患者組和所述對照組實(shí)施第二相關(guān)分析對所述相關(guān)等位基因進(jìn)行驗(yàn)證,從而根據(jù)所述第二相關(guān)分析確定哪些所述的相關(guān)等位基因在患者組中的豐度顯著高于在對照組中的豐度,其中根據(jù)第二相關(guān)分析得到的在患者組中的豐度顯著高于所述對照組中豐度的那些相關(guān)等位基因是驗(yàn)證的相關(guān)等位基因。
22.權(quán)利要求2的方法,還包括對表現(xiàn)出所述多因素性狀的第二患者組和未表現(xiàn)出所述多因素性狀的第二對照組實(shí)施第二相關(guān)分析來對所述相關(guān)等位基因進(jìn)行驗(yàn)證,從而確定出哪些所述的相關(guān)等位基因在第二患者組中的豐度顯著高于在第二對照組中的豐度,其中在第二患者組中的豐度顯著高于第二對照組中豐度的那些所述的相關(guān)等位基因是驗(yàn)證的相關(guān)等位基因。
23.權(quán)利要求2的方法,還包括通過含有以下步驟的方法確定所述至少一個閾值中的一個a)計(jì)算所述患者組和對照組中每個成員的評分;b)選擇一系列風(fēng)險邊界值;c)對每個所述的系列的風(fēng)險邊界值計(jì)算出一組值,其中所述組值包括靈敏度,特異性,PPV,NPV,準(zhǔn)確度,相對風(fēng)險,LR+和LR-中的至少一個;d)根據(jù)所述組值選擇一個所述系列的風(fēng)險邊界值作為所述至少一個閾值中的一個,從而確定所述至少一個閾值的所述的一個。
24.權(quán)利23的方法,其中計(jì)算所述患者組和對照組中每個成員的評分,包括a)在所述多個雙等位基因多態(tài)座上確定所述每個成員的基因型,其中所述基因型選自相關(guān)等位基因的純合子,雜合子和非相關(guān)的等位基因的純合子;b)將基因型為非相關(guān)等位基因純合子的每個所述多態(tài)座賦值為0;c)將基因型為雜合子的每個所述多態(tài)座賦值為1;d)將基因型為相關(guān)等位基因純合子的每個所述多態(tài)座賦值為2;e)將全部所述多態(tài)座在步驟a)至c)中所確定的值求和,從而對所述患者組和所述對照組中的所述每個成員計(jì)算出評分。
25.權(quán)利要求23的方法,其中所述選擇一系列風(fēng)險邊界值包括從對所述患者組和所述對照組的每個成員計(jì)算的評分中鑒定出一個最高評分;確定一個風(fēng)險邊界范圍,其中所述范圍從1到所述所述最高評分;從交叉的風(fēng)險邊界范圍中選擇一系列值,從而選出所述的系列風(fēng)險邊界值。
26.權(quán)利要求25的方法,其中所述的從交叉的風(fēng)險邊界范圍中選擇所述系列值包括選自如下的方法選擇風(fēng)險邊界范圍內(nèi)的每一個值;選擇風(fēng)險邊界范圍內(nèi)的每一第n個值;將風(fēng)險邊界范圍分成百分?jǐn)?shù)并選擇每一第n百分?jǐn)?shù)的風(fēng)險邊界范圍的值;從風(fēng)險邊界范圍的中部選出比從該風(fēng)險邊界范圍頂部或底部更多的值;以及從風(fēng)險邊界范圍的頂部或底部選出比從該風(fēng)險邊界范圍中部更多的值。
27.權(quán)利要求23的方法,其中對給定風(fēng)險邊界而言,通過確定評分高于所述給定風(fēng)險邊界值的所述患者組中的所述成員的比例計(jì)算所述靈敏度,其中所述比例是針對所述給定風(fēng)險邊界值的靈敏度。
28.權(quán)利要求23的方法,其中對給定風(fēng)險邊界而言,通過確定評分等于或低于所述給定風(fēng)險邊界值的所述對照組中的所述成員的比例計(jì)算所述特異性,其中所述比例是針對所述給定風(fēng)險邊界值的特異性。
29.權(quán)利要求23的方法,其中確定所述至少一個閾值中的所述的一個還包括使用至少一個所述多因素性狀和所述個體的現(xiàn)有臨床知識。
30.權(quán)利要求29的方法,其中所述現(xiàn)有臨床知識包括該多因素性狀的嚴(yán)重程度。
31.權(quán)利要求29的方法,其中所述現(xiàn)有臨床知識包括所述多因素性狀的流行率。
32.權(quán)利要求23方法,其中所述確定所述至少一個閾值中的所述的一個還包括使用基于c)中計(jì)算的所述靈敏度和特異性的ROC曲線,其中所述ROC曲線的圖表呈現(xiàn)方式是圖。
33.權(quán)利要求32方法,其中所述確定所述至少一個閾值中的所述的一個還包括從最接近所述圖左上角的所述ROC曲線部分選擇所述至少一個閾值中的所述的一個。
34.權(quán)利要求33方法,其中所述部分包括所述ROC曲線的約20%。
35.權(quán)利要求32方法,還包括選擇對應(yīng)于比所述ROC曲線上任意其它數(shù)據(jù)點(diǎn)更接近所述圖左上角的所述ROC曲線的數(shù)據(jù)點(diǎn)的風(fēng)險邊界值作為所述至少一個閾值中的所述一個,其中所述ROC曲線上的每個數(shù)據(jù)點(diǎn)對應(yīng)于不同的風(fēng)險邊界值。
36.權(quán)利要求32的方法,還包括a)確定所述ROC曲線上最接近所述圖左上角的位置并確定對應(yīng)于所位置的靈敏度和特異性;b)分析所述患者組和所述對照組每個成員的所述評分,從而鑒定出靈敏度和特異性與對應(yīng)于所述位置的靈敏度和特異性最接近的風(fēng)險邊界值,其中靈敏度和特異性與對應(yīng)于所述位置的靈敏度和特異性最接近的所述風(fēng)險邊界值是所述至少一個閾值中的一個。
37.權(quán)利要求32的方法,其中對給定的風(fēng)險邊界值而言,通過包括以下步驟的方法計(jì)算所述的相對風(fēng)險a)測定評分至少與所述給定風(fēng)險邊界值一樣大的所述患者組的所述成員的百分?jǐn)?shù);b)測定評分至少與所述給定風(fēng)險邊界值一樣大的所述對照組的所述成員的百分?jǐn)?shù);以及c)用在a)中確定的所述百分?jǐn)?shù)除以在b)中確定的所述百分?jǐn)?shù)來計(jì)算所述相對風(fēng)險。
38.權(quán)利要求37的方法,還包括將所述相對風(fēng)險乘以所述多因素性狀的流行率來計(jì)算評分等于給定風(fēng)險邊界值的給定個體發(fā)展或表現(xiàn)出所述多因素性狀的風(fēng)險。
39.權(quán)利要求23的方法,其中對給定風(fēng)險邊界值而言,通過將評分高于所述給定風(fēng)險邊界值的所述患者組的成員的數(shù)量除以評分高于所述給定風(fēng)險邊界值的所述患者組和所述對照組中的成員的數(shù)量計(jì)算所述PPV。
40.權(quán)利要求23的方法,其中對給定風(fēng)險邊界而言,通過將評分低于所述給定風(fēng)險邊界值的所述對照組中的成員的數(shù)量除以評分低于所述給定風(fēng)險邊界值的所述患者組和所述對照組中的成員的數(shù)量計(jì)算所述NPV。
41.權(quán)利要求1的方法,其中所述多態(tài)座是SNP。
42.權(quán)利要求1的方法,其中所述個體選自哺乳動物,爬行動物,兩棲動物,魚類,鳥類,甲殼類動物,昆蟲,植物,細(xì)菌,病毒和古細(xì)菌。
43.權(quán)利要求1的方法,其中所述個體是人類。
44.權(quán)利要求1的方法,其中所述評分的計(jì)算還包括a)將基因型為非相關(guān)等位基因的純合子的每個所述多態(tài)座賦值為0;b)將基因型為雜合子的每個所述多態(tài)座賦值為1;c)將基因型為相關(guān)等位基因純合子的每個所述多態(tài)座賦值為2;d)將全部所述多態(tài)座在步驟a)至c)中所確定的值求和,從而計(jì)算出所述個體的評分。
45.權(quán)利要求1的方法,其中所述多因素性狀是疾病。
46.權(quán)利要求45的方法,還包括如果所述評分高于所述至少一個閾值中的一個,采取措施來預(yù)防所述疾病。
47.權(quán)利要求45的方法,其中所述疾病對藥物的不良反應(yīng)具有公知的風(fēng)險。
48.權(quán)利要求47的方法,還包括如果所述評分高于所述至少一個閾值中的一個,將所述個體排除在用所述藥物治療之外。
49.權(quán)利要求45的方法,其中所述個體具有所述疾病的家族史。
50.權(quán)利要求45的方法,其中所述個體表現(xiàn)出所述疾病的癥狀。
51.權(quán)利要求1的方法,其中所述多因素性狀是對藥物的反應(yīng)。
52.權(quán)利要求51的方法,其中所述反應(yīng)是對所述藥物缺乏有效反應(yīng)。
53.權(quán)利要求52的方法,還包括如果所述評分高于所述至少一個閾值中的一個,將所述個體排除在用所述藥物治療之外。
54.權(quán)利要求51的方法,其中所述反應(yīng)是由所述藥物的給藥引起的副作用。
55.權(quán)利要求54的方法,還包括如果所述評分高于所述至少一個閾值中的一個,將所述個體排除在用所述藥物治療之外。
56.權(quán)利要求51的方法,其中所述反應(yīng)是對通用名藥的有效反應(yīng),其中所述通用名藥在含有至少一種商品藥的藥物族中,且其中所述個體對所述通用名藥具有有效反應(yīng)的可能性被用來確定是否可將所述通用名藥施用給所述個體。
57.權(quán)利要求51的方法,其中所述反應(yīng)是對通用名藥的有效反應(yīng),其中所述通用名藥在含有至少一種商品藥的藥物族中,且其中所述個體對所述通用名藥具有有效反應(yīng)的可能性被用來確定用所述商品名藥的治療是否可以得到補(bǔ)償。
58.權(quán)利要求1的方法,其中所述比較揭示所述評分大于所述至少一個閾值中的一個,且所述個體被評估為有可能表現(xiàn)出多因素性狀。
59.權(quán)利要求1的方法,其中所述比較揭示所述評分低于或等于所述至少一個閾值中的一個,且所述個體被評估為不可能表現(xiàn)出多因素性狀。
60.權(quán)利要求1的方法,其中所述比較揭示所述評分低于或等于所述至少一個閾值中的第一個且大于所述至少一個閾值中的第二個,還包括使用其他因素來確定對所述個體的適當(dāng)?shù)闹委熯^程。
61.權(quán)利要求60的方法,其中所述其他因素包括選自關(guān)于所述多因素性狀的信息,關(guān)于所述個體的信息,關(guān)于潛在治療選擇的信息,來自所述個體的信息,以及來自管理機(jī)構(gòu)的信息中的至少一個因素。
62.診斷或預(yù)防分析,包括設(shè)計(jì)用來在生物樣品中測定權(quán)利要求1所述的相關(guān)基因的核酸探針。
63.權(quán)利要求62的分析,其中所述探針結(jié)合于固體基質(zhì)。
64.評估個體發(fā)展或表現(xiàn)多因素性狀可能性的方法,包括a)在多個雙等位基因多態(tài)座確定所述個體的基因型,其中每個所述多個雙等位基因都有一個相關(guān)等位基因和一個非相關(guān)等位基因,進(jìn)而其中的基因型選自相關(guān)等位基因的純合子,雜合子,和非相關(guān)等位基因的純合子,且其中用表現(xiàn)多因素性狀的患者組和未表現(xiàn)多因素性狀的對照組實(shí)施相關(guān)分析,鑒定所述相關(guān)等位基因和所述非相關(guān)等位基因,從而確定出在患者組中豐度顯著高于對照組的所述多態(tài)座的等位基因組合,其中所述等位基因組是相關(guān)的等位基因,并且其中在實(shí)施相關(guān)分析之前所述患者組和所述對照組是匹配的;b)根據(jù)a)中確定的所述基因型計(jì)算所述個體的評分,其中所述評分的計(jì)算還包括將基因型為非相關(guān)等位基因純合子的每個所述的多態(tài)座賦值為0;將基因型為雜合子的每個多態(tài)座賦值為1;將基因型為相關(guān)等位基因純合子的每個所述多態(tài)座賦值為2;并對全部所述多態(tài)座的賦值求和,從而計(jì)算出每個成員的評分;以及c)將評分與至少一個閾值進(jìn)行比較,其中所述比較可用于確定所述個體的適當(dāng)治療過程,其中通過含有以下步驟的方法確定所述至少一個閾值中的每一個計(jì)算所述患者組和所述對照組中每個成員的評分;選擇一系列風(fēng)險邊界值;匯編信息,其中所述信息包括靈敏度,特異性,PPV,NPV,準(zhǔn)確度,相對風(fēng)險,LR+,LR-,關(guān)于所述多因素性狀的臨床信息,關(guān)于所述個體的臨床信息,關(guān)于潛在治療選擇的臨床信息,以及來自至少一個管理機(jī)構(gòu)的信息中的至少一個;根據(jù)所述信息選擇所述系列的風(fēng)險邊界值中的一個作為所述至少一個閾值中的所述的每一個,從而確定所述至少一個閾值中的所述的每一個。
全文摘要
本發(fā)明描述了若干用于評估個體發(fā)展或表現(xiàn)出多因素性狀可能性的方法。所述方法包括在多個雙等位基因多態(tài)座上確定該個體的多個基因型,使用這些基因型來計(jì)算該個體的評分,并將所述評分與至少一個閾值進(jìn)行比較。
文檔編號C12Q1/68GK1950826SQ200580014286
公開日2007年4月18日 申請日期2005年3月3日 優(yōu)先權(quán)日2004年3月5日
發(fā)明者大衛(wèi)·R·科克斯, 馬克·麥卡米什 申請人:佩勒根科學(xué)有限公司