本發(fā)明涉及高級(jí)別漿液性卵巢癌(HG-SOC)的生物標(biāo)志物及其用于診斷高級(jí)別漿液性卵巢癌(HG-SOC)和/或確定患有高級(jí)別漿液性卵巢癌(HG-SOC)的受試者的預(yù)后的方法和用途。
背景技術(shù):
卵巢癌(其中高級(jí)別漿液性卵巢癌(high-grade serous ovarian cancer,HG-SOC)是最普遍的)是目前世界上最致命的婦科疾病之一。高級(jí)別漿液性卵巢癌(HG-SOC),上皮卵巢癌(EOC)的一種主要的組織學(xué)類(lèi)型,是一種表征較差的、異質(zhì)的且致命的疾病,其中TP53的體細(xì)胞突變是9.5-13%的EOC患者中的有癌癥傾向的BRCA1/2中的常見(jiàn)的且遺傳性的功能喪失突變(Bolton等人JAMA 2012 25;307(4):832-90)。然而,由于遺傳性或散發(fā)性突變所致的疾病的總體負(fù)荷是未知的。盡管在高通量生物技術(shù)和致癌基因組(oncogenomic)研究中取得了顯著進(jìn)展,但是這種復(fù)雜疾病的遺傳背景知之甚少,并且用于早期檢測(cè)、差異診斷學(xué)、預(yù)后和疾病預(yù)測(cè)的生物標(biāo)志物尚未在臨床實(shí)踐中實(shí)施。診斷為HG-SOC的患者面臨嚴(yán)峻的統(tǒng)計(jì)值,即,即使利用標(biāo)準(zhǔn)化學(xué)療法和放射療法他們中的僅30%在初始診斷后會(huì)存活超過(guò)5年。原因可能是由于高腫瘤異質(zhì)性、未知的組織來(lái)源位點(diǎn)、無(wú)癥狀的腫瘤生長(zhǎng)、晚期臨床檢測(cè)和診斷、以及初級(jí)化學(xué)療法后對(duì)復(fù)發(fā)的高易感性。
事實(shí)上,HG-SOC腫瘤的異質(zhì)性和可靠的早期檢測(cè)、預(yù)后和預(yù)測(cè)性生物標(biāo)志物的缺乏表明,患者的臨床狀態(tài)是變化的,并且腫瘤常常對(duì)標(biāo)準(zhǔn)治療的響應(yīng)差。因此,用于風(fēng)險(xiǎn)評(píng)估和疾病形成/復(fù)發(fā)的風(fēng)險(xiǎn)的高置信度分子標(biāo)志物的鑒定在從預(yù)防性到患者臨床管理的各種領(lǐng)域中變得重要。因此,患者基于他們的存活模式的分層在從患者臨床管理到特定腫瘤亞型的科學(xué)發(fā)現(xiàn)的各種領(lǐng)域中變得重要。
最近的技術(shù)進(jìn)步已經(jīng)促進(jìn)了這種復(fù)雜疾病的研究,并且高級(jí)別漿液性卵巢癌(HG-SOC)是已經(jīng)由腫瘤基因圖譜(The Cancer Genome Atlas,TCGA)研究網(wǎng)絡(luò)全面研究的癌癥疾病之一。這些研究的結(jié)果表明,通過(guò)mRNA數(shù)據(jù)的表達(dá)譜,可以將患者分為四個(gè)具有生物學(xué)意義和不同的腫瘤/基因亞組:分化的、免疫反應(yīng)性的、間充質(zhì)的或增殖的(TCGA research network Nature 2011Vol 474;609-15)。然而,存活分析沒(méi)有表明TCGA數(shù)據(jù)集中這些轉(zhuǎn)錄亞型之間的顯著差異。基于TCGA和幾個(gè)其它分組(cohort)的miRNA和mRNA表達(dá)譜的元分析(meta-analysis),已經(jīng)將HG-SOC患者可靠分類(lèi)為三個(gè)預(yù)后亞組,其中患者的總體存活與特定的途徑和治療結(jié)果相關(guān)聯(lián)(Tang等人Int J Cancer.2014;134(2):306-18)。盡管進(jìn)行了集中的研究和努力,但是與具有HG-SOC的專(zhuān)利相關(guān)的信息在當(dāng)今不比10年前更好,因?yàn)闆](méi)有可用的臨床批準(zhǔn)的預(yù)后。
最近對(duì)TCGA患者分組的HG-SOC的突變研究揭示了諸如TP53,NF1,RB1,F(xiàn)AT3,CSMD3,GABRA6,CDK12,BRCA1,BRCA2,SMARCB1,KRAS,NRAS,CREBBP和ERBB2的突變基因。在另一項(xiàng)研究中通過(guò)大量平行測(cè)序也鑒定出腫瘤抑制基因的其它突變,如BRIP,CHEK2,MRE11A,MSH6,NBN,PALB2,RAD50和RAD51C。然而,這些和其它突變尚未在其提供HG-SOC臨床結(jié)果的預(yù)后的能力的背景下系統(tǒng)性研究。研究已經(jīng)顯示,在HG-SOC中,在幾乎所有HG-SOC患者中報(bào)道TP53體細(xì)胞突變,并且雖然其在諸如早期診斷或形成疾病的風(fēng)險(xiǎn)預(yù)測(cè)的領(lǐng)域中將是有用的,但是其在患者存活預(yù)測(cè)中的應(yīng)用受到限制。此外,最近報(bào)道了BRCA1或BRCA2的常規(guī)的“驅(qū)動(dòng)”突變相對(duì)于野生型變體反常地與更好的患者存活相關(guān)。通常,就疾病病因?qū)W、診斷或預(yù)后而言的突變數(shù)據(jù)的研究可能由于缺乏合適的和/或高質(zhì)量腫瘤樣品而面臨典型的統(tǒng)計(jì)學(xué)問(wèn)題。當(dāng)特定基因或基因變體的突變?yōu)楹币?jiàn)時(shí),該問(wèn)題可以進(jìn)一步惡化。
先前研究了CHEK2突變?cè)诼殉舶┗颊叻纸M中的作用,由此,CHEK2I157T的錯(cuò)義變體與卵巢囊腺瘤,邊緣卵巢癌和低度侵入性癌癥顯著相關(guān),但不與高度卵巢癌相關(guān)(Szymanska-Pasternak等人Gynecol Oncol.2006;102(3):429-31)。在另一項(xiàng)研究中,Baysal等人通過(guò)焦磷酸測(cè)序進(jìn)行單核苷酸多態(tài)性基因型分型并鑒定CHEK2的del1100C和A252G變體(Baysal等人Gynecol Oncol.2004;95(1):62-9)。然而,由于在與對(duì)照相比時(shí),變體頻率的統(tǒng)計(jì)學(xué)差異不顯著,提示了CHEK2中的變異與卵巢癌的發(fā)病機(jī)制不相關(guān)。在俄羅斯卵巢癌患者中,研究了CHEK2 1100delC對(duì)卵巢癌發(fā)病機(jī)制的影響,但沒(méi)有觀察到關(guān)聯(lián)(Krylova等人Herd Cancer Clin Pract.2007;5(3):153-56)。這些研究主要聚焦于篩選一些完善報(bào)道的CHEK2基因變體,例如,del1100C,A252G和I157T。此外,在這些以前的報(bào)告中,作者僅研究了關(guān)于疾病發(fā)病機(jī)制的特定變體的關(guān)聯(lián)。然而,由于CHEK2突變的影響,HG-SOC患者的預(yù)后目前不清楚或不顯著。
相關(guān)基因的互連性和相互作用是正常或腫瘤組織中生物學(xué)過(guò)程的共同特征。在生物學(xué)過(guò)程中涉及的或與HG-SOC的預(yù)后意義相關(guān)的許多潛在基因,特別是能夠進(jìn)行患者分層的基因使得對(duì)這些基因的鑒定成為令人生畏的任務(wù)。卵巢癌是一種高度致死的疾病,比女性生殖系統(tǒng)的任何其它癌癥造成更多死亡,并且在女性中的癌癥死亡中排名第五。在這方面,迫切需要用于預(yù)測(cè)和鑒定高級(jí)別漿液性卵巢癌(HG-SOC)患者的癌癥風(fēng)險(xiǎn)評(píng)估,分層,總體存活預(yù)后和治療響應(yīng)預(yù)測(cè)的新方法。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的第一方面涉及用于確定罹患高級(jí)別漿液性卵巢癌(HG-SOC)的患者的預(yù)后的方法,所述方法包括從所述患者獲得的樣品中確定選自CHEK2、ERN2、ADAMTSL3、ATR、ENAH、GLI2、GYPB、KIAA1324L、LRRN2、MAP3K6、MAPK15、MET、MLL4、NIPBL、PCDH15、PPP1CC、PTCH1、PTK2B、RPS6KA2、RSU1和TNC的基因中的突變的存在或不存在,其中所述ERN2基因中的突變的存在指示所述患者的預(yù)后良好,并且所述CHEK2、ADAMTSL3、ATR、ENAH、GLI2、GYPB、KIAA1324L、LRRN2、MAP3K6、MAPK15、MET、MLL4、NIPBL、PCDH15、PPP1CC、PTCH1、PTK2B、RPS6KA2、RSU1和TNC基因的任一種中的突變的存在指示所述患者的預(yù)后不良。
本發(fā)明的另一個(gè)方面涉及用于實(shí)施本文中所述的方法的試劑盒,所述試劑盒包含與選自下組的突變基因的mRNA互補(bǔ)的至少一種核酸探針:CHEK2、ERN2、ADAMTSL3、ATR、ENAH、GLI2、GYPB、KIAA1324L、LRRN2、MAP3K6、MAPK15、MET、MLL4、NIPBL、PCDH15、PPP1CC、PTCH1、PTK2B、RPS6KA2、RSU1和TNC。
本發(fā)明的另一個(gè)方面涉及用于預(yù)測(cè)患者發(fā)生高級(jí)別漿液性卵巢癌(HG-SOC)的風(fēng)險(xiǎn)的方法,所述方法包括從所述患者獲得的樣品中確定選自下組的基因中的種系突變:CHEK2、RPS6KA2和MLL4。
本發(fā)明的另一個(gè)方面涉及用于實(shí)施診斷方法的試劑盒,所述試劑盒包含與選自下組的突變基因的mRNA互補(bǔ)的至少一種核酸探針:CHEK2、RPS6KA2和MLL4。
參考以下附圖和各個(gè)非限制性實(shí)施方案的描述,本發(fā)明的其它方面對(duì)于本領(lǐng)域技術(shù)人員將是顯而易見(jiàn)的。
附圖說(shuō)明
在下面的描述中,參考以下圖描述本發(fā)明的各個(gè)實(shí)施方案。
圖1:從TCGA數(shù)據(jù)門(mén)戶(data portal)下載的高級(jí)別漿液性卵巢癌(HG-SOC)的突變數(shù)據(jù)。
圖2:HG-SOC基因中的突變的統(tǒng)計(jì)特征。
(A)易感驅(qū)動(dòng)基因中的突變的頻率分布。
(B)針對(duì)突變樣品數(shù)目的不同突變的數(shù)目。
基因的散點(diǎn)圖,其中垂直軸對(duì)應(yīng)于所有樣品間的突變數(shù)目,并且水平軸對(duì)應(yīng)于對(duì)于給定基因具有至少一個(gè)突變的樣品的數(shù)目。對(duì)角線表示每個(gè)基因的每個(gè)樣品的突變數(shù)為1的假設(shè)情況。兩個(gè)軸均進(jìn)行l(wèi)og10轉(zhuǎn)化。
圖3:具有CHEK2突變的患者與在BRCA1,BRCA2,RPS6KA2或MLL4基因中具有突變的患者的κ相關(guān)性。
列聯(lián)表中的值表示對(duì)應(yīng)于行和列標(biāo)簽的獨(dú)特樣品ID的數(shù)目。計(jì)算加權(quán)κ作為一致性(agreement)的量度,并且通過(guò)Mantel-Haenszel(MH)檢驗(yàn)估計(jì)顯著性。使用StatXact-9(計(jì)算的權(quán):平方差,得分:相等間隔)實(shí)施計(jì)算。
圖4:對(duì)于455種高度突變的基因(在至少5名患者中突變)和334名患者觀察到的種系,LOH或體細(xì)胞突變的熱圖。
圖的強(qiáng)度對(duì)應(yīng)于對(duì)于該基因和患者觀察到的突變(包括沉默突變)的數(shù)目。
圖5:(A)沿著TP53基因基因座的特定位點(diǎn)突變的樣品的頻率
(B)在各種基因內(nèi)的特定位點(diǎn)處鑒定的突變。
圖6:(A)通過(guò)分層聚類(lèi)(hierarchical clustering)(Kendall-tau距離,完全連鎖)排列的屬于58種基因和22名患者的突變矩陣的提取子簇。圖的強(qiáng)度對(duì)應(yīng)于對(duì)于該基因和患者觀察到的突變(包括沉默突變)的數(shù)目。
(B)從突變子簇鑒定的21種基因的子集的直接相互作用基因網(wǎng)絡(luò)。
圖7:在突變亞群中鑒定的58個(gè)基因符號(hào)的注釋。
圖8:通過(guò)(A)DAVID生物信息學(xué),(B)MetaCore途徑分析,(C)MetaCore過(guò)程網(wǎng)絡(luò)分析和(D)MetaCore疾病生物標(biāo)志物分析,在突變子簇中58種基因的富集分析。
圖9:19種直接相互作用基因與DNA損傷信號(hào)傳導(dǎo),修復(fù),凋亡,細(xì)胞增殖或免疫過(guò)程的關(guān)聯(lián)。
圖10:在臨床、拷貝數(shù)變異、突變和表達(dá)數(shù)據(jù)集之間的合并的CHEK2信息。
圖11:基于(A)CHEK2,(B)TP53,(C)BRCA1和(D)MUC16的非沉默突變706狀態(tài)的TCGA HG-SOC患者的Kaplan-Meier存活曲線。
圖12:(A)CHEK2突變和(B)非沉默CHEK2突變與治療抗性的Κ相關(guān)性。列聯(lián)表中的值表示對(duì)應(yīng)于行和列標(biāo)簽的獨(dú)特樣品ID的數(shù)目。
圖13:(A)基于CHEK2拷貝數(shù)的330名TCGA HG-SOC患者的患者分層。
(B)具有CHEK2缺失,擴(kuò)增或不顯著改變的樣品的CHEK2表達(dá)。
(C)378個(gè)樣品的腫瘤類(lèi)型間的CHEK2mRNA的表達(dá)譜。378個(gè)樣品來(lái)自8個(gè)輸卵管樣品和370個(gè)具有腫瘤級(jí)別和階段信息的HG-SOC樣品。(D)基于CHEK2表達(dá)數(shù)據(jù)的358名HG-SOC患者的預(yù)后分層。12名沒(méi)有存活時(shí)間和事件的HG-SOC患者從分析中排除。高CHEK2mRNA表達(dá)與較高的風(fēng)險(xiǎn)相關(guān),而低CHEK2mRNA表達(dá)與較低的風(fēng)險(xiǎn)相關(guān)。
圖14:TCGA突變位點(diǎn)與已知或預(yù)測(cè)的CHEK2區(qū)域的共定位。
圖15:(A)來(lái)自UCSC基因組瀏覽器的CHEK2的基因組基因座。顯示了單個(gè)同種型(isoform)的內(nèi)含子-外顯子-UTR結(jié)構(gòu)。
(B)來(lái)自TCGA數(shù)據(jù)庫(kù)的263名高級(jí)別漿液性卵巢癌患者間的CHEK2同種型的RNA-seq表達(dá)。
圖16:(A)沿著CHEK2基因座的基因組圖式的DNA突變的位置。外顯子塊從5’到3’順序編號(hào)。倒置三角形代表外顯子上突變的位置。倒置三角形上方的數(shù)字指示具有突變(包括同義突變)的患者的數(shù)目。
(B)氨基酸序列上預(yù)期突變的位置。倒置三角形中的字母表指示參考氨基酸殘基,而具有非同義突變的患者的數(shù)目顯示在倒置三角形上方。矩形塊中的數(shù)字指示氨基酸殘基跨度。
(C)計(jì)算建模和分子動(dòng)力學(xué)模擬后Chk2蛋白松弛狀態(tài)的代表性晶體結(jié)構(gòu)。所有Chk2突變由有色球體表示,其指示對(duì)應(yīng)于翻譯后的DNA突變的殘基的位置。使用CHEK2同種型1(NM_007194/NP_009125/O96017)作為參照同種型。叉頭相關(guān)(forkhead-associated,F(xiàn)HA)域,激酶域和核定位信號(hào)(NLS)分別標(biāo)記為粉紅色,藍(lán)色和青色。文氏圖(Venn diagram)將患者的數(shù)目與在兩個(gè)不同的核苷酸位置處觀察到的突變進(jìn)行比較。圖沒(méi)有按比例繪制。
圖17:基于非沉默突變狀態(tài)的21種存活顯著基因的預(yù)后顯著性(對(duì)數(shù)秩統(tǒng)計(jì)p值≤0.05,#突變≥5和#非突變≥5)。
圖18:(A)鑒定的基因突變簇與突變狀態(tài)呈預(yù)后顯著的基因之間的共同基因的文氏圖。
(B)基于21-基因標(biāo)簽(21-gene signature)的突變狀態(tài)的預(yù)后分層。
(C)基于CHEK2基因和20-基因標(biāo)簽的突變的預(yù)后分層。
圖19:由21種基因突變標(biāo)簽分類(lèi)的患者與治療抗性的K相關(guān)性。列聯(lián)表中的值表示對(duì)應(yīng)于行和列標(biāo)簽的獨(dú)特樣品ID的數(shù)目。
圖20:在預(yù)后標(biāo)簽中的21個(gè)基因符號(hào)的注釋。
圖21:通過(guò)(A)DAVID生物信息學(xué),(B)MetaCore途徑分析,(C)MetaCore過(guò)程網(wǎng)絡(luò)分析和(D)MetaCore對(duì)21種存活顯著基因的富集分析。
圖22:(A)種系,LOH和體細(xì)胞突變,(B)種系突變,(C)LOH和(D)體細(xì)胞突變的不良預(yù)后亞組中21種預(yù)后基因和58名患者的非沉默突變的簇?;蚝突颊咄ㄟ^(guò)分層聚類(lèi)(kendall-tau距離和完全連鎖)進(jìn)行排序。
圖23:CHEK2-MLL4-RPS6KA2確定的EOC腫瘤亞類(lèi)的遺傳和臨床特征(G:種系,S:體細(xì)胞,L:LOH)。
圖24:(A)參與各種卵巢癌亞型的病因?qū)W的關(guān)鍵基因。
(B)在腫瘤等級(jí)和階段的HG-SOC樣品間CHEK2mRNA的表達(dá)(在紅色箱線圖中表示)。通過(guò)Mann-Whitney檢驗(yàn)計(jì)算正常和腫瘤樣品之間的差異表達(dá)。
具體實(shí)施方式
來(lái)自TCGA的HG-SOC患者的全基因組突變和臨床數(shù)據(jù)集的綜合生物信息學(xué)和統(tǒng)計(jì)分析允許鑒定其突變狀態(tài)可將患者分層到不同存活亞組中的預(yù)后基因(生物標(biāo)志物)。還鑒定了與患者的不良預(yù)后相關(guān)的基因標(biāo)簽,其中不同的腫瘤亞組得到表征并且潛在地由這些標(biāo)簽基因的種系或體細(xì)胞突變驅(qū)動(dòng)。
基于它們的存活模式的用于風(fēng)險(xiǎn)評(píng)估和患病患者分層的新型分子標(biāo)志物的鑒定在從發(fā)現(xiàn)特定腫瘤類(lèi)別和亞型到改進(jìn)的預(yù)防,早期診斷和臨床管理的各個(gè)領(lǐng)域中變得重要。
本發(fā)明的第一個(gè)方面涉及用于確定罹患高級(jí)別漿液性卵巢癌(HG-SOC)的患者的預(yù)后的方法,所述方法包括從所述患者獲得的樣品中確定選自CHEK2、ERN2、ADAMTSL3、ATR、ENAH、GLI2、GYPB、KIAA1324L、LRRN2、MAP3K6、MAPK15、MET、MLL4、NIPBL、PCDH15、PPP1CC、PTCH1、PTK2B、RPS6KA2、RSU1和TNC的基因中的突變的存在或不存在,其中所述ERN2基因中的突變的存在指示所述患者的預(yù)后良好,并且所述CHEK2、ADAMTSL3、ATR、ENAH、GLI2、GYPB、KIAA1324L、LRRN2、MAP3K6、MAPK15、MET、MLL4、NIPBL、PCDH15、PPP1CC、PTCH1、PTK2B、RPS6KA2、RSU1和TNC基因的任一種中的突變的存在指示所述患者的預(yù)后不良。
這些突變基因或標(biāo)志物基因可以在組織和/或體液樣品中,例如在血液樣品中檢測(cè),并且因此提供了用于預(yù)后罹患HG-SOC的患者的新方法。由于此類(lèi)方法不需要昂貴的設(shè)備,新方法可以由任何內(nèi)科醫(yī)生進(jìn)行。優(yōu)選地,直接(即在DNA水平上),或依靠基因產(chǎn)物(包括mRNA或蛋白質(zhì))檢測(cè)基因或標(biāo)志物基因。優(yōu)選地,通過(guò)測(cè)序方法,如通過(guò)Illumina或ABI SOLID測(cè)序平臺(tái)測(cè)序來(lái)檢測(cè)突變。任何合適的方法,如PCT熔化技術(shù)也可以適合于確定突變或本領(lǐng)域已知的用于確定序列變異的任何其它方法。
對(duì)于本發(fā)明的基因標(biāo)志物的檢測(cè),可以采用特異性結(jié)合配偶體。在一些實(shí)施方案中,特異性結(jié)合配偶體可用于檢測(cè)樣品中標(biāo)志物的存在,其中標(biāo)志物是蛋白質(zhì)或RNA。標(biāo)志物及其結(jié)合配偶體表示分子的結(jié)合對(duì),其通過(guò)多種分子力(包括例如離子,共價(jià),疏水,范德華力和氫鍵鍵合)的任一種彼此相互作用。優(yōu)選地,此結(jié)合是特異性的?!疤禺愋越Y(jié)合”是指結(jié)合對(duì)的成員優(yōu)先彼此結(jié)合,即通常比對(duì)非特異性結(jié)合配偶體以顯著更高的親和力結(jié)合。因此,對(duì)特異性結(jié)合配偶體的結(jié)合親和力通常比非特異性結(jié)合配偶體的結(jié)合親和力高至少10倍,優(yōu)選至少100倍。結(jié)合配偶體也可以是特異性的,因?yàn)樗鼈円员确峭蛔冃问礁叩挠H和力結(jié)合基因產(chǎn)物(即RNA或蛋白質(zhì))的突變形式,優(yōu)選地,差異是親和力增加至少10倍。
確定預(yù)后包括風(fēng)險(xiǎn)分層和預(yù)測(cè)不良結(jié)果的可能性。這可以就某個(gè)時(shí)間段而言做出。在多個(gè)實(shí)施方案中,時(shí)間段是5年。本發(fā)明意義上的不良或不利結(jié)果包括患者狀況的惡化,例如如本文中所述,由于在診斷或預(yù)后確定后5年內(nèi)的轉(zhuǎn)移或死亡。有利或積極的結(jié)果包括維持或改善患者的狀況,例如由于積極響應(yīng)化學(xué)療法如順鉑療法,或5年或更長(zhǎng)時(shí)間的存活。
總體上,技術(shù)可以改善患者風(fēng)險(xiǎn)評(píng)估,管理和咨詢(xún),以及為臨床環(huán)境中治療人卵巢癌的個(gè)性化藥物策略提供優(yōu)化解決方案。
在多個(gè)實(shí)施方案中,檢測(cè)CHEK2基因中的突變。檢查點(diǎn)激酶2(CHEK2)編碼參與細(xì)胞周期檢查點(diǎn)控制,DNA損傷反應(yīng)信號(hào)轉(zhuǎn)導(dǎo)和細(xì)胞凋亡調(diào)節(jié)的核絲氨酸/蘇氨酸蛋白激酶。CHEK2。在DNA損傷的存在下,CHEK2磷酸化下游細(xì)胞周期調(diào)節(jié)劑如p53,Cdc25和BRCA1以激活檢查點(diǎn)修復(fù)或恢復(fù)應(yīng)答,以及同時(shí)延遲進(jìn)入有絲分裂。偏離其正常生理功能可能有助于疾病發(fā)病機(jī)制。
在多個(gè)實(shí)施方案中,CHEK2標(biāo)志物基因包含如SEQ ID NO.1(NM_001005735)、或SEQ ID NO.67(NM_001257387)、或SEQ ID NO.68(NM_007194)、或SEQ ID NO.69(NM_145862)的任一項(xiàng)中所示的序列。這些序列是CHEK2已知的最常見(jiàn)的序列,并且這里已經(jīng)證明了這些標(biāo)準(zhǔn)序列的突變或變異與罹患高級(jí)別漿液性卵巢癌的患者的不良存活相關(guān)。CHEK2基因的畸變先前沒(méi)有與HG-SOC中的總體存活時(shí)間或治療響應(yīng)的預(yù)后相關(guān)聯(lián)。334名HG-SOC患者的相對(duì)大和設(shè)計(jì)良好的分組允許鑒定先前未鑒定的患者亞類(lèi),其具有潛在非常差的治療反應(yīng)和總體存活(5年總體存活率為0%)。當(dāng)在CHEK2標(biāo)志物基因中檢測(cè)到突變時(shí),可以建議患者依靠姑息護(hù)理。這將為患者節(jié)省在用化學(xué)療法的進(jìn)取性治療的情況下?tīng)可娴牟槐匾馁M(fèi)用和痛苦。
在多個(gè)實(shí)施方案中,ADAMTSL3標(biāo)志物基因包含如SEQ ID NO 5(NM_001301110)和SEQ ID NO.71(NM_207517)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,ATR標(biāo)志物基因包含如SEQ ID NO.6(NM_001184)中所示的序列。
在多個(gè)實(shí)施方案中,ENAH標(biāo)志物基因包含如SEQ ID NO.7(NM_001008493)和SEQ ID NO.72(NM_018212)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,GLI2標(biāo)志物基因包含如SEQ ID NO.8(NM_005270)中所示的序列。
在多個(gè)實(shí)施方案中,GYPB標(biāo)志物基因包含如SEQ ID NO.9(NM_001304382)和SEQ ID NO.73(NM_002100)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,KIAA1324L標(biāo)志物基因包含如SEQ ID NO.10(NM_001142749)、SEQ ID NO.74(NM_001291990)、SEQ ID NO.75(NM_001291991)、和SEQ ID NO.76(NM_152748)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,LRRN2標(biāo)志物基因包含如SEQ ID NO.11(NM_006338)和SEQ ID NO.77(NM_201630)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,MAP3K6標(biāo)志物基因包含如SEQ ID NO.12(NM_001297609)和SEQ ID NO.78(NM_004672)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,MAPK15標(biāo)志物基因包含如SEQ ID NO.13(NM_139021)中所示的序列。
在多個(gè)實(shí)施方案中,MET標(biāo)志物基因包含如SEQ ID NO.14(NM_000245)和SEQ ID NO.79(NM_001127500)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,MLL4標(biāo)志物基因包含如SEQ ID NO.4(NM_014727)中所示的序列。標(biāo)志物也可以稱(chēng)作KMT2B。
在多個(gè)實(shí)施方案中,NIPBL標(biāo)志物基因包含如SEQ ID NO.15(NM_015384)和SEQ ID NO.80(NM_133433)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,PCDH15標(biāo)志物基因包含如SEQ ID NO.16(NM_001142763)、SEQ ID NO.81(NM_001142764)、SEQ ID NO.82(NM_001142765)、SEQ ID NO.83(NM_001142766)、SEQ ID NO.84(NM_001142767)、SEQ ID NO.85(NM_001142768)、SEQ ID NO.86(NM_001142769)、SEQ ID NO.87(NM_001142770)、SEQ ID NO.88(NM_001142771)、SEQ ID NO.89(NM_001142772)、SEQ ID NO.90(NM_001142773)、和SEQ ID NO.91(NM_033056)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,PPP1CC標(biāo)志物基因包含如SEQ ID NO.17(NM_001244974)和SEQ ID NO.92(NM_002710)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,PTCH1標(biāo)志物基因包含如SEQ ID NO.18(NM_000264)、SEQ ID NO.93(NM_001083602)、SEQ ID NO.94(NM_001083603)、SEQ ID NO.95(NM_001083604)、SEQ ID NO.96(NM_001083605)、SEQ ID NO.97(NM_001083606)、和SEQ ID NO.98(NM_001083607)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,PTK2B標(biāo)志物基因包含如SEQ ID NO.19(NM_004103)、SEQ ID NO.99(NM_173174)、SEQ ID NO.100(NM_173175)、和SEQ ID NO.101(NM_173176)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,RPS6KA2標(biāo)志物基因包含如SEQ ID NO.3(NM_001006932)和SEQ ID NO.70(NM_021135)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,RSU1標(biāo)志物基因包含如SEQ ID NO.20(NM_012425)和SEQ ID NO.102(NM_152724)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,TNC標(biāo)志物基因包含如SEQ ID NO.21(NM_002160)中所示的序列。
所有前述序列是相應(yīng)的野生型序列,其可以用作檢測(cè)這些基因中的突變的參考。括號(hào)中的代碼表示其各自的數(shù)據(jù)庫(kù)條目編號(hào)(databank entry number)。
在多個(gè)實(shí)施方案中,ERN2標(biāo)志物基因中的突變指示患者的有利的治療結(jié)果。在多個(gè)實(shí)施方案中,ERN2標(biāo)志物包含SEQ ID NO.2(NM_033266)中所示的核酸序列。該序列是對(duì)于ERN2已知的最常見(jiàn)的序列,并且此處已經(jīng)證明來(lái)自該標(biāo)準(zhǔn)野生型序列的突變或變異與罹患高級(jí)別漿液性卵巢癌的患者的更好的存活相關(guān),總體5年存活率為37%。由于ERN2突變與患者的更好的總體存活期相關(guān),所以被鑒定為在ERN2標(biāo)志物中具有突變的HG-SOC患者可以用化學(xué)療法和其它治療例如放射治療和切除進(jìn)行治療。
在多個(gè)實(shí)施方案中,該方法還包括如下步驟:通過(guò)卵巢組織活體組織切片的顯微分析或通過(guò)超聲或確認(rèn)患者中的卵巢癌特別是HG-SOC的預(yù)后的本領(lǐng)域中已知的任何其它方法來(lái)確認(rèn)預(yù)后。超聲可以在外部進(jìn)行或優(yōu)選在陰道內(nèi)進(jìn)行,以更好地確定任何腫瘤生長(zhǎng)的大小。確認(rèn)預(yù)后的方法還可以包括檢測(cè)卵巢癌,優(yōu)選HG-SOC的已知標(biāo)志物中的突變,例如TP53,BRCA1或BRCA2中的突變。結(jié)果指示,CHEK2和BRCA1是相互排斥的突變,其可以能夠?qū)?huì)或不會(huì)良好地響應(yīng)化學(xué)療法的患者進(jìn)行分層。具有CHEK2標(biāo)志物突變的患者通常不良好響應(yīng)化學(xué)療法。
在多個(gè)實(shí)施方案中,CHEK2標(biāo)志物中的突變位于CHEK2標(biāo)志物的外顯子10、11或15中。在多個(gè)實(shí)施方案中,CHEK2基因的末端外顯子15表達(dá)核定位序列。HG-SOC患者中的CHEK2突變是患者存活預(yù)后的強(qiáng)不良指標(biāo),并且與療法抗性相關(guān)。假設(shè)但不限于任何理論,它可能是由于核定位位點(diǎn)的突變,這防止蛋白的核輸入,并隨后導(dǎo)致單倍不足(haplo-insufficiency)。在多個(gè)實(shí)施方案中,突變位于對(duì)應(yīng)于編碼氨基酸R346,T383,R406,R519,P522,R535和/或P536的密碼子的序列位置。這些氨基酸存在于CHEK2的核定位位點(diǎn)中。
在多個(gè)實(shí)施方案中,本發(fā)明的方法可以進(jìn)一步包括確定上文所示的那些標(biāo)志物的一種或多種額外的標(biāo)志物中突變的存在。如果檢測(cè)到一個(gè)或多個(gè)額外的突變標(biāo)志物基因,那么這可以提高該方法的準(zhǔn)確性。在本發(fā)明方法的某些實(shí)施方案中,確定至少2、3、4、5、6、7、8、9、10、20、30、40、45、50或58個(gè)或更多個(gè)額外標(biāo)志物中的突變。
在確定CHEK2標(biāo)志物中的突變的多個(gè)實(shí)施方案中,所述方法還包括確定選自下組的基因的任一種中的突變:ABCA3、ADAM15、ADAMTSL3、ALK、ANKHD1-EIF4EBP3、ANKMY2、ANXA7、ASPM、CDC27、CHD6、CHL1、DPYSL4、ENAH、EP400、ERBB2IP、FN1、FOXO3、GCLC、GLI2、GLI3、GYPB、GZMB、HLA-G、HNF1A、INPP5D、INSR、ITGB2、KIF3B、KIF4B、KTN1、LRRN2、MAD1L1、MAP3K6、MAPK15、MET、MKL1、MLL4、MYO5C、NUMA1、PDGFRA、PHLPP、PIK3C2B、PKP4、PLAGL2、PPARA、PRKCI、PTK2B、RAB3D、ROR2、RPS6KA2、RSU1、SPTB、TBK1、TNK2、TP53、VAV1和ZC3H11A。
在多個(gè)實(shí)施方案中,ABCA3標(biāo)志物基因包含如SEQ ID NO.22(NM_001089)中所示的序列。
在多個(gè)實(shí)施方案中,ADAM15標(biāo)志物基因包含如SEQ ID NO.23(NM_001261464)、SEQ ID NO103(NM_001261465)、SEQ ID NO.104(NM_001261466)、SEQ ID NO.105(NM_003815)、SEQ ID NO.106(NM_207191)、SEQ ID NO.107(NM_207194)、SEQ ID NO.108(NM_207195)、SEQ ID NO.109(NM_207196)、SEQ ID NO.110(NM_207197)、SEQ ID NO.111(NR_048577)、SEQ ID NO.112(NR_048578)、和SEQ ID NO.113(NR_048579)中所示的序列。
在多個(gè)實(shí)施方案中,ADAMTSL3標(biāo)志物基因包含如SEQ ID NO 5(NM_001301110)和SEQ ID NO.71(NM_207517)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,ALK標(biāo)志物基因包含如SEQ ID NO.24(NM_004304)中所示的序列。
在多個(gè)實(shí)施方案中,ANKHD1-EIF4EBP3標(biāo)志物基因包含如SEQ ID NO.25(NM_020690)中所示的序列。
在多個(gè)實(shí)施方案中,ANKMY2標(biāo)志物基因包含如SEQ ID NO.26(NM_020319)中所示的序列。
在多個(gè)實(shí)施方案中,ANXA7標(biāo)志物基因包含如SEQ ID NO.27(NM_001156)和SEQ ID NO.114(NM_004034)中所示的序列。
在多個(gè)實(shí)施方案中,ASPM標(biāo)志物基因包含如SEQ ID NO.28(NM_001206846)和SEQ ID NO.115(NM_018136)中所示的序列。
在多個(gè)實(shí)施方案中,CDC27標(biāo)志物基因包含如SEQ ID NO.29(NM_001114091)、SEQ ID NO.116(NM_001256)、SEQ ID NO.117(NM_001293089)、和SEQ ID NO.118(NM_001293091)中所示的序列。
在多個(gè)實(shí)施方案中,CHD6標(biāo)志物基因包含如SEQ ID NO.30(NM_032221)中所示的序列。
在多個(gè)實(shí)施方案中,CHL1標(biāo)志物基因包含如SEQ ID NO.31(NM_001253387)、SEQ ID NO.119(NM_001253388)、SEQ ID NO.120(NM_006614)、和SEQ ID NO.121(NR_045572)中所示的序列。
在多個(gè)實(shí)施方案中,DPYSL4標(biāo)志物基因包含如SEQ ID NO.32(NM_006426)中所示的序列。
在多個(gè)實(shí)施方案中,ENAH標(biāo)志物基因包含如SEQ ID NO.7(NM_001008493)和SEQ ID NO.72(NM_018212)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,GLI2標(biāo)志物基因包含如SEQ ID NO.8(NM_005270)中所示的序列。
在多個(gè)實(shí)施方案中,EP400標(biāo)志物基因包含如SEQ ID NO.33(NM_015409)中所示的序列。
在多個(gè)實(shí)施方案中,ERBB2IP標(biāo)志物基因包含如SEQ ID NO.34(NM_001006600)、SEQ ID NO.122(NM_001253697)、SEQ ID NO.123(NM_001253698)、SEQ ID NO.124(NM_001253699)、SEQ ID NO.125(NM_001253701)和SEQ ID NO.126(NM_018695)中所示的序列。
在多個(gè)實(shí)施方案中,F(xiàn)N1標(biāo)志物基因包含如SEQ ID NO.35(NM_002026)、SEQ ID NO.127(NM_054034)、SEQ ID NO.128(NM_212474)、SEQ ID NO.129(NM_212476)、SEQ ID NO.130(NM_212478)、和SEQ ID NO.131(NM_212482)中所示的序列。
在多個(gè)實(shí)施方案中,F(xiàn)OXO3標(biāo)志物基因包含如SEQ ID NO.36(NM_001455)和SEQ ID NO.132(NM_201559)中所示的序列。
在多個(gè)實(shí)施方案中,GCLC標(biāo)志物基因包含如SEQ ID NO.37(NM_001197115)和SEQ ID NO.133(NM_001498)中所示的序列。
在多個(gè)實(shí)施方案中,GLI3標(biāo)志物基因包含如SEQ ID NO.38(NM_000168)中所示的序列。
在多個(gè)實(shí)施方案中,GYPB標(biāo)志物基因包含如SEQ ID NO.9(NM_001304382)和SEQ ID NO.73(NM_002100)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,GZMB標(biāo)志物基因包含如SEQ ID NO.39(NM_004131)中所示的序列。
在多個(gè)實(shí)施方案中,HLA-G標(biāo)志物基因包含如SEQ ID NO.40(NM_002127)中所示的序列。
在多個(gè)實(shí)施方案中,HNF1A標(biāo)志物基因包含如SEQ ID NO.41(NM_000545)中所示的序列。
在多個(gè)實(shí)施方案中,INPP5D標(biāo)志物基因包含如SEQ ID NO.42(NM_001017915)和SEQ ID NO.134(NM_005541)中所示的序列。
在多個(gè)實(shí)施方案中,INSR標(biāo)志物基因包含如SEQ ID NO.43(NM_000208)和SEQ ID NO.135(NM_001079817)中所示的序列。
在多個(gè)實(shí)施方案中,ITGB2標(biāo)志物基因包含如SEQ ID NO.44(NM_000211)、SEQ ID NO.136(NM_001127491)、和SEQ ID NO.137(NM_001303238)中所示的序列。
在多個(gè)實(shí)施方案中,KIF3B標(biāo)志物基因包含如SEQ ID NO.45(NM_004798)中所示的序列。
在多個(gè)實(shí)施方案中,KIF4B標(biāo)志物基因包含如SEQ ID NO.46(NM_001099293)中所示的序列。
在多個(gè)實(shí)施方案中,KTN1標(biāo)志物基因包含如SEQ ID NO.47(NM_001079521)、SEQ ID NO.138(NM_001079522)、SEQ ID NO.139(NM_001271014)、SEQ ID NO.140(NM_004986)、SEQ ID NO.141(NR_073128)、和SEQ ID NO.142(NR_073129)中所示的序列。
在多個(gè)實(shí)施方案中,LRRN2標(biāo)志物基因包含如SEQ ID NO.11(NM_006338)和SEQ ID NO.77(NM_201630)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,MAD1L1標(biāo)志物基因包含如SEQ ID NO.48(NM_001013836)、SEQ ID NO.143(NM_001013837)、SEQ ID NO.144(NM_001304523)、SEQ ID NO.145(NM_001304524)、SEQ ID NO.146(NM_001304525)、和SEQ ID NO.147(NM_003550)中所示的序列。
在多個(gè)實(shí)施方案中,MAP3K6標(biāo)志物基因包含如SEQ ID NO.12(NM_001297609)和SEQ ID NO.78(NM_004672)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,MAPK15標(biāo)志物基因包含如SEQ ID NO.13(NM_139021)中所示的序列。
在多個(gè)實(shí)施方案中,MET標(biāo)志物基因包含如SEQ ID NO.14(NM_000245)和SEQ ID NO.79(NM_001127500)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,MKL1標(biāo)志物基因包含如SEQ ID NO.49(NM_001282660)、SEQ ID NO.148(NM_001282661)、SEQ ID NO.149(NM_001282662)、和SEQ ID NO.150(NM_020831)中所示的序列。
在多個(gè)實(shí)施方案中,MLL4標(biāo)志物基因包含如SEQ ID NO.4(NM_014727)中所示的序列。該基因也可以稱(chēng)作KMT2B。
在多個(gè)實(shí)施方案中,MYO5C標(biāo)志物基因包含如SEQ ID NO.50(NM_018728)中所示的序列。
在多個(gè)實(shí)施方案中,NUMA1標(biāo)志物基因包含如SEQ ID NO.51(NM_001286561)、SEQ ID NO.151(NM_006185)、和SEQ ID NO.152(NR_104476)中所示的序列。
在多個(gè)實(shí)施方案中,PDGFRA標(biāo)志物基因包含如SEQ ID NO.52(NM_006206)中所示的序列。
在多個(gè)實(shí)施方案中,PHLPP標(biāo)志物基因包含如SEQ ID NO.53(NM_194449)中所示的序列。該基因也可以稱(chēng)作PHLPP1。
在多個(gè)實(shí)施方案中,PIK3C2B標(biāo)志物基因包含如SEQ ID NO.54(NM_002646)中所示的序列。
在多個(gè)實(shí)施方案中,PKP4標(biāo)志物基因包含如SEQ ID NO.55(NM_001005476)、SEQ ID NO.153(NM_001304969)、SEQ ID NO.154(NM_001304970)、SEQ ID NO.155(NM_001304971)、和SEQ ID NO.156(NM_003628)中所示的序列。
在多個(gè)實(shí)施方案中,PLAGL2標(biāo)志物基因包含如SEQ ID NO.56(NM_002657)中所示的序列。
在多個(gè)實(shí)施方案中,PPARA標(biāo)志物基因包含如SEQ ID NO.57(NM_001001928),SEQ ID NO.157(NM_005036)中所示的序列。
在多個(gè)實(shí)施方案中,PRKCI標(biāo)志物基因包含如SEQ ID NO.58(NM_002740)中所示的序列。
在多個(gè)實(shí)施方案中,PTK2B標(biāo)志物基因包含如SEQ ID NO.19(NM_004103)、SEQ ID NO.99(NM_173174)、SEQ ID NO.100(NM_173175)、和SEQ ID NO.101(NM_173176)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,RAB3D標(biāo)志物基因包含如SEQ ID NO.59(NM_004283)中所示的序列。
在多個(gè)實(shí)施方案中,ROR2標(biāo)志物基因包含如SEQ ID NO.60(NM_004560)中所示的序列。
在多個(gè)實(shí)施方案中,RPS6KA2標(biāo)志物基因包含如SEQ ID NO.3(NM_001006932)和SEQ ID NO.70(NM_021135)的任一項(xiàng)中所示的序列。
在多個(gè)實(shí)施方案中,RSU1標(biāo)志物基因包含如SEQ ID NO.20(NM_012425)和SEQ ID NO.102(NM_152724)中所示的序列。
在多個(gè)實(shí)施方案中,SPTB標(biāo)志物基因包含如SEQ ID NO.61(NM_000347)和SEQ ID NO.158(NM_001024858)中所示的序列。
在多個(gè)實(shí)施方案中,TBK1標(biāo)志物基因包含如SEQ ID NO.62(NM_013254)中所示的序列。
在多個(gè)實(shí)施方案中,TNK2標(biāo)志物基因包含如SEQ ID NO.63(NM_001010938)和SEQ ID NO.159(NM_005781)中所示的序列。
在多個(gè)實(shí)施方案中,TP53標(biāo)志物基因包含如SEQ ID NO.64(NM_000546)、SEQ ID NO.160(NM_001126112)、SEQ ID NO.161(NM_001126113)、SEQ ID NO.162(NM_001126114)、SEQ ID NO.163(NM_001126115)、SEQ ID NO.164(NM_001126116)、SEQ ID NO.165(NM_001126117)、SEQ ID NO.166(NM_001126118)、SEQ ID NO.167(NM_001276695)、SEQ ID NO.168(NM_001276696)、SEQ ID NO.169(NM_001276697)、SEQ ID NO.170(NM_001276698)、SEQ ID NO.171(NM_001276699)、SEQ ID NO.172(NM_001276760)、和SEQ ID NO.173(NM_001276761)中所示的序列。
在多個(gè)實(shí)施方案中,VAV1標(biāo)志物基因包含如SEQ ID NO.65(NM_001258206)、SEQ ID NO.174(NM_001258207)和SEQ ID NO.175(NM_005428)中所示的序列。
在多個(gè)實(shí)施方案中,ZC3H11A標(biāo)志物基因包含如SEQ ID NO.66(NM_014827)中所示的序列。
所有前述序列是相應(yīng)的野生型序列,其可以用作檢測(cè)這些基因中的突變的參考。括號(hào)中的代碼表示其各自的數(shù)據(jù)庫(kù)條目編號(hào)。
在多個(gè)實(shí)施方案中,確定一組標(biāo)志物基因的任一種中的突變的存在或不存在,包括檢測(cè)選自下組的核苷酸序列的突變的存在或不存在:SEQ ID NO.3-5、7-9、11-14、19、20、22-73、77-79、99-175中所示的核酸序列。
在確定CHEK2標(biāo)志物中的突變的多個(gè)實(shí)施方案中,該方法還包括確定選自下組的基因的任一種中的突變:ADAMTSL3、ATR、ENAH、ERN2、GLI2、GYPB、KIAA1324L、LRRN2、MAP3K6、MAPK15、MET、MLL4、NIPBL、PCDH15、PPP1CC、PTCH1、PTK2B、RPS6KA2、RSU1和TNC。在一些實(shí)施方案中,另外確定至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或所有20種基因中的突變。
在多個(gè)實(shí)施方案中,該方法還包括確定以下標(biāo)志物的每種中的突變的存在:ADAMTSL3,ATR,CHEK2,ENAH,GLI2,GYPB,KIAA1324L,LRRN2,MAP3K6,MAPK15,MET,MLL4,NIPBL,PCDH15,PPP1CC,PTCH1,PTK2B,RPS6KA2,RSU1和TNC。任何前述基因中的任何突變的檢測(cè)指示患者的不利的治療結(jié)果。在多個(gè)實(shí)施方案中,標(biāo)志物包含SEQ ID NO.3-21,或70-102中所示的核酸序列。上述標(biāo)志物的任一種中的突變與患者的較差的總體存活相關(guān)聯(lián)。
在多個(gè)實(shí)施方案中,該方法還包括確定選自下組的標(biāo)志物序列的任一種中的突變:SEQ ID NO.1、3-21和67-102中所示的核酸序列。
在多個(gè)實(shí)施方案中,該方法包括確定基因標(biāo)志物的組中的突變的存在或不存在,所述基因標(biāo)志物的組包含CHEK2,ERN2,ADAMTSL3,ATR,ENAH,GLI2,GYPB,KIAA1324L,LRRN2,MAP3K6,MAPK15,MET,MLL4,NIPBL,PCDH15,PPP1CC,PTCH1,PTK2B,RPS6KA2,RSU1和TNC的任何2種或更多種,3種或更多種,4種或更多種,5種或更多種,6種或更多種,7種或更多種,8種或更多種,9種或更多種,10種或更多種,11種或更多種,12種或更多種,13種或更多種,14種或更多種,15種或更多種,16種或更多種,17種或更多種,18種或更多種,19種或更多種,20種或更多種,或全部21種。在此實(shí)施方案中,包含21種基因(DNA和/或mRNA和/或蛋白質(zhì))的組合突變組或標(biāo)簽可以用于將患者分組分層為低和高風(fēng)險(xiǎn)亞組。如果在ERN2中觀察到突變或在ADAMTSL3,ATR,CHEK2,ENAH,GLI2,GYPB,KIAA1324L,LRRN2,MAP3K6,MAPK15,MET,MLL4,NIPBL,PCDH15,PPP1CC,PTCH1,PTK2B,RPS6KA2,RSU1和TNC中沒(méi)有觀察到突變,那么將HG-SOC患者分類(lèi)為低風(fēng)險(xiǎn),如果在ERN2中沒(méi)有觀察到突變,并且在ADAMTSL3,ATR,CHEK2,ENAH,GLI2,GYPB,KIAA1324L,LRRN2,MAP3K6,MAPK15,MET,MLL4,NIPBL,PCDH15,PPP1CC,PTCH1,PTK2B,RPS6KA2,RSU1和TNC中觀察到突變,那么將HG-SOC患者分類(lèi)為高風(fēng)險(xiǎn)。在多個(gè)實(shí)施方案中,該方法可包括確定包含SEQ ID NO.:1-21中所示的非突變序列的標(biāo)志物組中突變的存在。
在多個(gè)實(shí)施方案中,所述方法包括確定標(biāo)志物組中的突變,所述標(biāo)志物組包含ADAMTSL3,ATR,CHEK2,ENAH,GLI2,GYPB,KIAA1324L,LRRN2,MAP3K6,MAPK15,MET,MLL4,NIPBL,PCDH15,PPP1CC,PTCH1,PTK2B,RPS6KA2,RSU1和TNC,其中在基因標(biāo)志物組的任一種中的突變表示患者的不利的治療結(jié)果。在多個(gè)實(shí)施方案中,該方法包括確定具有SEQ ID NO.1和3-21中所示的野生型序列的標(biāo)志物組中的突變的存在或不存在,其中突變的存在指示所述受試者具有預(yù)后不良。如果在ERN2中沒(méi)有觀察到突變,并且在ADAMTSL3,ATR,CHEK2,ENAH,GLI2,GYPB,KIAA1324L,LRRN2,MAP3K6,MAPK15,MET,MLL4,NIPBL,PCDH15,PPP1CC,PTCH1,PTK2B,RPS6KA2,RSU1和TNC中觀察到突變,那么將HG-SOC患者分類(lèi)為高風(fēng)險(xiǎn)。
在多個(gè)實(shí)施方案中,通過(guò)CHEK2,RPS6KA2和/或MLL4標(biāo)志物中的種系突變確定第一腫瘤亞型。在多個(gè)實(shí)施方案中,通過(guò)檢測(cè)如SEQ ID NO:1、3和/或4的任一種中所示的核酸序列中的種系突變的存在確定第一腫瘤亞型,所述序列對(duì)應(yīng)于相應(yīng)的野生型序列。
在多個(gè)實(shí)施方案中,CHEK2標(biāo)志物基因的野生型序列包含如SEQ ID NO.1(NM_001005735)、或SEQ ID NO.67(NM_001257387)、或SEQ ID NO.68(NM_007194)、或SEQ ID NO.69(NM_145862)的任一項(xiàng)中所示的序列。RPS6KA2標(biāo)志物基因的野生型序列包含如SEQ ID NO.3(NM_001006932),和SEQ ID NO.70(NM_021135)的任一項(xiàng)中所示的序列。MLL4標(biāo)志物基因的野生型序列包含如SEQ ID NO.4(NM_014727)中所示的序列。該基因也可以稱(chēng)為KMT2B。
在多個(gè)實(shí)施方案中,所述方法包括確定基因標(biāo)志物組中突變的存在或不存在,所述基因標(biāo)志物組包含CHEK2,ABCA3,ADAM15,ADAMTSL3,ALK,ANKHD1-EIF4EBP3,ANKMY2,ANXA7,ASPM,CDC27,CHD6,CHEK2,CHL1,DPYSL4,ENAH,EP400,ERBB2IP,F(xiàn)N1,F(xiàn)OXO3,GCLC,GLI2,GLI3,GYPB,GZMB,HLA-G,HNF1A,INPP5D,INSR,ITGB2,KIF3B,KIF4B,KTN1,LRRN2,MAD1L1,MAP3K6,MAPK15,MET,MKL1,MLL4,MYO5C,NUMA1,PDGFRA,PHLPP,PIK3C2B,PKP4,PLAGL2,PPARA,PRKCI,PTK2B,RAB3D,ROR2,RPS6KA2,RSU1,SPTB,TBK1,TNK2,TP53,VAV1和ZC3H11A。在此實(shí)施方案中,組合突變組或標(biāo)簽包含在7%的HG-SOC患者中相對(duì)經(jīng)常突變的58種基因。該組可以用于鑒定具有不良預(yù)后的HG-SOC患者。在多個(gè)實(shí)施方案中,所述方法包括確定基因標(biāo)志物組中突變的存在或不存在,包括檢測(cè)SEQ ID NO 3-5、7-9、11-14、19、20、22-73、77-79、99-175中所示的任何一個(gè)或多個(gè)核苷酸序列中的突變的存在或不存在。
在多個(gè)實(shí)施方案中,可以用于預(yù)后的鑒定突變?cè)趫D5中相對(duì)于其染色體位點(diǎn)位置列出。本領(lǐng)域技術(shù)人員可以使用諸如d-chip軟件或其它可用軟件等標(biāo)準(zhǔn)軟件基于此信息容易地獲得特異性突變。
本發(fā)明的另一方面涉及用于實(shí)施本文所述方法的試劑盒,所述試劑盒包含至少一種能夠檢測(cè)下列任一項(xiàng)中的突變的檢測(cè)試劑,如與野生型或突變的mRNA互補(bǔ)的核酸探針或允許擴(kuò)增并且然后測(cè)序擴(kuò)增序列的引物,或允許直接測(cè)序的引物:ABCA3,ADAM15,ADAMTSL3,ALK,ANKHD1-EIF4EBP3,ANKMY2,ANXA7,ASPM,CDC27,CHD6,CHL1,DPYSL4,ENAH,EP400,ERBB2IP,F(xiàn)N1,F(xiàn)OXO3,GCLC,GLI2,GLI3,GYPB,GZMB,HLA-G,HNF1A,INPP5D,INSR,ITGB2,KIF3B,KIF4B,KTN1,LRRN2,MAD1L1,MAP3K6,MAPK15,MET,MKL1,MLL4,MYO5C,NUMA1,PDGFRA,PHLPP,PIK3C2B,PKP4,PLAGL2,PPARA,PRKCI,PTK2B,RAB3D,ROR2,RPS6KA2,RSU1,SPTB,TBK1,TNK2,TP53,VAV1和ZC3H11A標(biāo)志物基因。
所述標(biāo)志物基因中的突變是上文關(guān)于本發(fā)明方法所描述的突變,并且它們的檢測(cè)可以通過(guò)標(biāo)準(zhǔn)測(cè)序方法進(jìn)行。
在多個(gè)實(shí)施方案中,檢測(cè)試劑是與SEQ ID NO.1-21和67-102中所示的任一序列的野生型mRNA互補(bǔ)的核酸探針。
在多個(gè)實(shí)施方案中,試劑盒包含與ABCA3,ADAM15,ADAMTSL3,ALK,ANKHD1-EIF4EBP3,ANKMY2,ANXA7,ASPM,CDC27,CHD6,CHL1,DPYSL4,ENAH,EP400,ERBB2IP,F(xiàn)N1,F(xiàn)OXO3,GCLC,GLI2,GLI3,GYPB,GZMB,HLA-G,HNF1A,INPP5D,INSR,ITGB2,KIF3B,KIF4B,KTN1,LRRN2,MAD1L1,MAP3K6,MAPK15,MET,MKL1,MLL4,MYO5C,NUMA1,PDGFRA,PHLPP,PIK3C2B,PKP4,PLAGL2,PPARA,PRKCI,PTK2B,RAB3D,ROR2,RPS6KA2,RSU1,SPTB,TBK1,TNK2,TP53,VAV1和ZC3H11A標(biāo)志物基因的任一種的mRNA互補(bǔ)的至少一種核酸探針。
在多個(gè)實(shí)施方案中,試劑盒包含與ADAMTSL3,ATR,ENAH,GLI2,GYPB,KIAA1324L,LRRN2,MAP3K6,MAPK15,MET,MLL4,NIPBL,PCDH15,PPP1CC,PTCH1,PTK2B,RPS6KA2,RSU1和TNC標(biāo)志物基因的mRNA互補(bǔ)的核酸探針組。
在多個(gè)實(shí)施方案中,試劑盒包含與SEQ ID NO 1-175中所示的標(biāo)志物基因序列的任一種的mRNA互補(bǔ)的至少一個(gè)核酸探針,以及任選地書(shū)面說(shuō)明,用于:從患者的樣品中提取核酸,并將所述核酸與DNA微陣列雜交;并為患者獲得總體存活的預(yù)后或治療結(jié)果的預(yù)測(cè)。
在多個(gè)實(shí)施方案中,試劑盒包含與如SEQ ID NO 1-21,67-102中所示的標(biāo)志物基因序列的mRNA互補(bǔ)的核酸探針組。
在多個(gè)實(shí)施方案中,試劑盒還包含與如SEQ ID NO 3-5,7-9,11-14,19,20,22-73,77-79和99-175中所示的標(biāo)志物基因序列的任一種的mRNA互補(bǔ)的至少一種核酸探針。
在多個(gè)實(shí)施方案中,探針能夠檢測(cè)標(biāo)志物中的突變。這可以使用與標(biāo)志物互補(bǔ)的探針實(shí)現(xiàn),從而當(dāng)它們與PCR熔解技術(shù)一起使用時(shí),在更高溫度下突變體和探針之間的雜交親和力小于標(biāo)準(zhǔn)核酸和探針之間的雜交親和力,從而可以鑒定突變。備選探針可以包括突變,否則與標(biāo)志物序列的任一種的野生型mRNA基本上互補(bǔ)。
在多個(gè)實(shí)施方案中,試劑盒包含與ABCA3,ADAM15,ADAMTSL3,ALK,ANKHD1-EIF4EBP3,ANKMY2,ANXA7,ASPM,CDC27,CHD6,CHL1,DPYSL4,ENAH,EP400,ERBB2IP,F(xiàn)N1,F(xiàn)OXO3,GCLC,GLI2,GLI3,GYPB,GZMB,HLA-G,HNF1A,INPP5D,INSR,ITGB2,KIF3B,KIF4B,KTN1,LRRN2,MAD1L1,MAP3K6,MAPK15,MET,MKL1,MLL4,MYO5C,NUMA1,PDGFRA,PHLPP,PIK3C2B,PKP4,PLAGL2,PPARA,PRKCI,PTK2B,RAB3D,ROR2,RPS6KA2,RSU1,SPTB,TBK1,TNK2,TP53,VAV1和ZC3H11A標(biāo)志物基因的mRNA互補(bǔ)的核酸探針組。
在多個(gè)實(shí)施方案中,所述試劑盒包含與如SEQ ID NO 1、3-5、7-9、11-14、19、20和22-69中所示的標(biāo)志物序列的mRNA互補(bǔ)的核酸探針組。
本發(fā)明的另一方面涉及用于預(yù)測(cè)患者發(fā)生高級(jí)別漿液性卵巢癌(HG-SOC)的風(fēng)險(xiǎn)的方法,包括確定從所述患者獲得的樣品中的選自CHEK2,RPS6KA2和MLL4的基因中的種系突變的存在或不存在,其中在CHEK2,RPS6KA2和/或MLL4基因中的突變的存在指示患者患HG-SOC。
在本發(fā)明的多個(gè)實(shí)施方案中,通過(guò)分析從患者獲得的樣品來(lái)檢測(cè)一種或多種標(biāo)志物基因中的突變。樣品通常含有核酸,并且可以例如是體液,細(xì)胞或組織樣品。體液包括但不限于血液,血漿,血清,腦脊液,耵聹(耳垢),內(nèi)淋巴和外淋巴,胃液,粘液(包括鼻引流和痰),腹膜液,胸膜液,唾液,皮脂(皮膚油),精液,汗液,眼淚,陰道分泌物,乳頭抽吸液,嘔吐物和尿液。在上文詳述的方法的某些實(shí)施方案中,體液選自下組:血液,血清,血漿,尿液和唾液。組織樣品可以是卵巢組織,并且細(xì)胞樣品可以包含來(lái)自卵巢或輸卵管組織的細(xì)胞。
本技術(shù)還包括使用CHEK2和/或RPS6KA2和/或MLL4基因(DNA和/或mRNA和/或蛋白)的種系突變作為預(yù)測(cè)健康女性的HG-SOC啟動(dòng)和形成風(fēng)險(xiǎn)中的危險(xiǎn)因素。
在多個(gè)實(shí)施方案中,種系突變指示所述患者患HG-SOC的風(fēng)險(xiǎn)增加。
在多個(gè)實(shí)施方案中,可以用于診斷的鑒定的種系突變列于圖23中。
如本文中提及,診斷方法可以改進(jìn)鑒定有卵巢癌的遺傳性和體細(xì)胞突變的高風(fēng)險(xiǎn)的女性的努力,所述卵巢癌與那些與p53體細(xì)胞突變和種系BRAC1/BRAC2突變相關(guān)的卵巢癌截然不同。
本發(fā)明的另一個(gè)方面涉及用于實(shí)施診斷方法的試劑盒,所述試劑盒包含與CHEK2、RPS6KA2和MLL4標(biāo)志物的任一項(xiàng)的mRNA互補(bǔ)的至少一種核酸探針。
在多個(gè)實(shí)施方案中,與mRNA互補(bǔ)的核酸探針包含與SEQ ID NO 1、3、和/或4中所示的任一種核酸序列的mRNA互補(bǔ)的標(biāo)志物序列,和任選書(shū)面用法說(shuō)明,用于:從所述患者的樣品提取核酸,并且使所述核酸與DNA微陣列雜交;以及獲得所述患者患HG-SOC的風(fēng)險(xiǎn)。
應(yīng)當(dāng)理解,上面關(guān)于本發(fā)明的方法或用途公開(kāi)的所有實(shí)施方案類(lèi)似地適用于每種方法和用途,反之亦然。
如上文已經(jīng)描述,生物標(biāo)志物的重要性和定量方法的技術(shù)優(yōu)勢(shì)對(duì)于理解罹患HG-SOC的受試者的病因?qū)W,病理生理學(xué)以及更重要地,預(yù)后和診斷,特別就患者存活事件和時(shí)間而言具有巨大希望。
本技術(shù)包括方法,所述方法(i)鑒定CHEK2基因(DNA和/或mRNA和/或蛋白質(zhì))的突變作為具有HG-SOC的患者的重要風(fēng)險(xiǎn)和不良預(yù)后因子,(ii)鑒定包含在7%的HG-SOC中的58種相對(duì)經(jīng)常突變的基因的組合突變標(biāo)簽,所述基因鑒定與不良的預(yù)后顯著相關(guān)的HG-SOC患者,(iii)鑒定包含21種基因(DNA和/或mRNA和/或蛋白質(zhì))的組合突變標(biāo)簽,其將患者分組顯著分層為低風(fēng)險(xiǎn)和高風(fēng)險(xiǎn)亞組,并且(iv)使用CHEK2基因(DNA和/或mRNA和/或蛋白)或5-8基因標(biāo)簽(DNA和/或mRNA和/或蛋白)或21-基因標(biāo)簽(DNA和/或mRNA和/或蛋白)作為在臨床背景中個(gè)體HG-SOC患者的總體存活和治療結(jié)果預(yù)測(cè)中的強(qiáng)制性預(yù)后工具。
包含在58-基因和21-基因突變標(biāo)簽中包含的基因與諸如激酶活性和ATP結(jié)合等功能相關(guān),并且它們也是諸如細(xì)胞周期調(diào)節(jié),凋亡控制和DNA損傷修復(fù)等生物過(guò)程中富集的。使用這些基因突變標(biāo)簽將診斷的HG-SOC患者顯著分層為低和高風(fēng)險(xiǎn)亞組。具體來(lái)說(shuō),21-基因突變標(biāo)簽提供患者到兩種疾病形成風(fēng)險(xiǎn)組上的分層,其5年總體存活率分別為37%和6%。此外,高風(fēng)險(xiǎn)亞組中的腫瘤是可能表現(xiàn)對(duì)治療的抗性的約兩倍(高風(fēng)險(xiǎn)亞組的15%和低風(fēng)險(xiǎn)亞組的8.7%)。
HG-SOC患者中的CHEK2突變是患者存活預(yù)后的強(qiáng)不良指標(biāo),并且與治療抗性相關(guān)。假設(shè)但不限于任何理論,它可以是由于核定位位點(diǎn)的突變,其防止蛋白質(zhì)的核輸入,并隨后導(dǎo)致單倍不足。還鑒定出21-基因突變標(biāo)簽,其與患者的存活模式高度相關(guān)(p=7.311e-08)。在這些基因中,諸如激酶活性或ATP結(jié)合的蛋白質(zhì)功能得到富集,這可能指示這些過(guò)程在致癌作用中起關(guān)鍵作用并且靶向這些過(guò)程可能是有吸引力的治療策略,以恢復(fù)與更高風(fēng)險(xiǎn)亞組相關(guān)的失調(diào)的細(xì)胞增殖的不平衡。
經(jīng)由CHEK2,RPS6KA2和MLL4的種系突變或其它標(biāo)簽基因的體細(xì)胞突變表征HG-SOC的兩個(gè)亞類(lèi)。通過(guò)CHEK2的種系突變或/和雜合性丟失(LOH)表征的腫瘤亞組的存在提供了潛在的篩選努力來(lái)鑒定具有形成HG-SOC的高風(fēng)險(xiǎn)的女性。
分析來(lái)自診斷為HG-SOC的患者的9083種基因符號(hào)和334個(gè)腫瘤組織樣品間的突變計(jì)數(shù)。預(yù)期地,發(fā)現(xiàn)已知其突變是HG-SOC的限定特征之一的TP53在所有樣品間是高度突變的。然而,每個(gè)腫瘤樣品中TP53突變的頻率較低,每個(gè)腫瘤樣品平均約1個(gè)TP53。相比之下,CHEK2和BRCA1基因(其參與DNA損傷修復(fù))在患者的小亞組中以高頻率突變。
進(jìn)一步的非監(jiān)督分層聚類(lèi)揭示了58種基因的高度突變簇和主要通過(guò)CHEK2突變表征的22名患者(來(lái)自334HG-SOC)?;虮倔w論和網(wǎng)絡(luò)分析揭示這些基因與激酶和ATP結(jié)合相關(guān),并且可以參與與細(xì)胞周期,DNA損傷修復(fù),凋亡或免疫反應(yīng)相關(guān)的生物過(guò)程。58種基因的簇是:ABCA3、ADAM15、ADAMTSL3、ALK、ANKHD1-EIF4EBP3、ANKMY2、ANXA7、ASPM、CDC27、CHD6、CHEK2、CHL1、DPYSL4、ENAH、EP400、ERBB2IP、FN1、FOXO3、GCLC、GLI2、GLI3、GYPB、GZMB、HLA-G、HNF1A、INPP5D、INSR、ITGB2、KIF3B、KIF4B、KTN1、LRRN2、MAD1L1、MAP3K6、MAPK15、MET、MKL1、MLL4、MYO5C、NUMA1、PDGFRA、PHLPP、PIK3C2B、PKP4、PLAGL2、PPARA、PRKCI、PTK2B、RAB3D、ROR2、RPS6KA2、RSU1、SPTB、TBK1、TNK2、TP53、VAV1和ZC3H11A。
評(píng)估了最高度突變的基因(在至少5名患者中)的突變狀態(tài)的預(yù)后意義。鑒定21種基因,所述基因的突變狀態(tài)可以獨(dú)立且顯著分層患者為低或高風(fēng)險(xiǎn)(p值≤0.05)。這21種基因是:ADAMTSL3、ATR、CHEK2、ENAH、ERN2、GLI2、GYPB、KIAA1324L、LRRN2、MAP3K6、MAPK15、MET、MLL4、NIPBL、PCDH15、PPP1CC、PTCH1、PTK2B、RPS6KA2、RSU1和TNC。除了突變狀態(tài)與更好的總體存活相關(guān)的ERN2外,其它20種基因具有與較差的總體存活相關(guān)的突變。這些基因在激酶活性和ATP結(jié)合功能中高度富集。它們也在DNA損傷和修復(fù),凋亡和細(xì)胞周期的途徑或基因網(wǎng)絡(luò)中顯著富集。
隨后,組成組合的21-基因突變標(biāo)簽,其中HSG-SOC患者分類(lèi)為:
如果在ERN2中觀察到突變和/或在ADAMTSL3,ATR,CHEK2,ENAH,GLI2,GYPB,KIAA1324L,LRRN2,MAP3K6,MAPK15,MET,MLL4,NIPBL,PCDH15,PPP1CC,PTCH1,PTK2B,RPS6KA2,RSU1和TNC中沒(méi)有觀察到突變,那么分類(lèi)為低風(fēng)險(xiǎn)。
如果在ADAMTSL3,ATR,CHEK2,ENAH,GLI2,GYPB,KIAA1324L,LRRN2,MAP3K6,MAPK15,MET,MLL4,NIPBL,PCDH15,PPP1CC,PTCH1,PTK2B,RPS6KA2,RSU1和TNC中觀察到突變和/或在ERN2中沒(méi)有觀察到突變,那么分類(lèi)為高風(fēng)險(xiǎn)。
對(duì)通過(guò)21-基因突變標(biāo)簽定義的58高風(fēng)險(xiǎn)患者亞組中的患者的進(jìn)一步分析揭示了以?xún)煞N不同腫瘤亞型為特征的兩群不同的患者。第一種腫瘤亞型的特征在于CHEK2,RPS6KA2和MLL4的種系突變,而第二種腫瘤亞型的特征在于其它基因的自發(fā)體細(xì)胞突變。結(jié)果還揭示在存在TP53的情況下通常表征HG-SOC腫瘤的兩種可能的疾病病因?qū)W途徑。遺傳變體的CHEK2,RPS6KA2和MLL4的篩選可以用作預(yù)測(cè)健康女性形成疾病的風(fēng)險(xiǎn)中的風(fēng)險(xiǎn)因素。
基因突變標(biāo)簽可以有助于臨床設(shè)置中用于卵巢癌的早期診斷以及治療效率和總體存活的預(yù)后的潛在應(yīng)用。本發(fā)明還可以用于鑒定不太可能良好響應(yīng)化學(xué)療法的腫瘤亞類(lèi),并因此為科學(xué)家提供開(kāi)發(fā)新的臨床策略以靶向該腫瘤亞類(lèi)的工具?;蛲蛔儤?biāo)簽可以形成診斷或預(yù)后試劑盒,用于實(shí)驗(yàn)室或臨床環(huán)境中。
觀察到CHEK2突變與對(duì)化學(xué)療法的不良響應(yīng)和因此不良總體存在高度相關(guān),其中具有CHEK2突變的高級(jí)別漿液性卵巢癌(HG-SOC)患者的0%存活超過(guò)5年時(shí)。具有CHEK2突變的患者的此亞類(lèi)占所有HG-SOC患者的約7.2%。這允許鑒定診斷為高級(jí)別漿液性卵巢癌(HG-SOC)的患者的先前未鑒定的亞類(lèi)。迫切需要用于患者的此亞類(lèi)的療法或臨床管理的新線路,因?yàn)樗麄兊哪[瘤沒(méi)有良好地響應(yīng)療法。因此,這暗示鑒定HG-SOC患者的此亞類(lèi)的必要性,為這組患者提供更好的臨床護(hù)理,并且研究腫瘤的此亞組以在未來(lái)驅(qū)動(dòng)未來(lái)的個(gè)性化臨床治療益處。
除了治療高級(jí)別和高階段漿液性卵巢癌外,在臨床干預(yù)方面,在最早階段檢測(cè)此類(lèi)癌癥也可以對(duì)患者有益。測(cè)量CHEK2表達(dá)水平以提供卵巢癌的早期診斷可以幫助解決此類(lèi)需要。
“包括”意味著包括但不限于在詞語(yǔ)“包括”之后的任何事物。因此,術(shù)語(yǔ)“包括”的使用指示列出的要素是必需的或強(qiáng)制性的,但是其它要素是可選的并且可以或不可以存在。
“由...組成”表示包括并限于短語(yǔ)“由......組成”之后的任何事物。因此,短語(yǔ)“由...組成”指示列出的要素是必需的或強(qiáng)制性的,并且不存在其它要素。
本文中示例性描述的本發(fā)明可以在沒(méi)有本文未具體公開(kāi)的任何一個(gè)或多個(gè)要素,限制的情況下適當(dāng)?shù)貙?shí)施。因此,例如,術(shù)語(yǔ)“包括”,“包括”,“含有”等應(yīng)當(dāng)廣泛且在沒(méi)有限制的情況下理解。另外,本文中使用的術(shù)語(yǔ)和表達(dá)已經(jīng)用作描述性而不是限制性術(shù)語(yǔ),并且在使用這些術(shù)語(yǔ)和表達(dá)時(shí)不意圖排除所示和所描述的特征或其部分的任何等同物,而是認(rèn)識(shí)到在所要求保護(hù)的本發(fā)明的范圍內(nèi)的各種修改是可能的。因此,應(yīng)當(dāng)理解,雖然本發(fā)明已經(jīng)通過(guò)優(yōu)選實(shí)施方案和可選特征具體公開(kāi),但是本文公開(kāi)的其中體現(xiàn)的本發(fā)明的修改和變化可以由本領(lǐng)域技術(shù)人員采取,并且這樣的修改和變化被認(rèn)為在本發(fā)明的范圍內(nèi)。
本文已廣泛和一般性地描述了本發(fā)明。落入屬的公開(kāi)內(nèi)容內(nèi)的每個(gè)較窄的種類(lèi)和亞屬分組也形成本發(fā)明的一部分。這包括本發(fā)明的一般性描述,其具有從屬除去任何主題的附帶條件或否定限制,而不管所排除的材料是否在本文中具體描述。
其它實(shí)施方案在所附權(quán)利要求書(shū)和非限制性實(shí)施例內(nèi)。
實(shí)施例
基因突變的全基因組突變譜和統(tǒng)計(jì)學(xué)分布
在人類(lèi)基因組測(cè)序中心(HGSC)對(duì)334個(gè)HG-SOC腫瘤樣品進(jìn)行通過(guò)Illumina或ABI SOLID測(cè)序平臺(tái)的外顯子組測(cè)序:貝勒醫(yī)學(xué)院(Baylor College of Medicine,BCM),布洛德研究所(Broad Institute)基因組中心(BI)和華盛頓大學(xué)基因組研究所(WUSM)。如先前所述(TCGA research network Nature 2011Vol 474;609-15),通過(guò)TCGA研究網(wǎng)絡(luò)分析數(shù)據(jù)。從TCGA數(shù)據(jù)門(mén)戶下載處理的突變數(shù)據(jù)用于進(jìn)一步分析。
TCGA數(shù)據(jù)門(mén)戶含有所有研究的基因和患者間的21,978種突變。除去突變狀態(tài)未知的基因,并且剩余的17,639種突變由334名患者間的種系,LOH或體細(xì)胞突變和9083種獨(dú)特的基因符號(hào)構(gòu)成(圖1)。這些突變包括所有變體,包括缺失,插入,錯(cuò)義突變或種系、體細(xì)胞或雜合性丟失(LOH)起源的沉默突變。該分析包括沉默突變,假定它們可以是條件致病突變,特別是在由常見(jiàn)內(nèi)源性誘變物(AID/APOBEC胞苷脫氨酶)誘導(dǎo)的DNA損傷,調(diào)節(jié)信號(hào)傳導(dǎo),RNA-蛋白結(jié)合修飾,轉(zhuǎn)錄后事件和胞質(zhì)溶膠-核轉(zhuǎn)運(yùn)的背景中。
為了提供基因內(nèi)突變發(fā)生的相對(duì)頻率和患者樣品間的基因突變的相對(duì)頻率的全基因組理解,首先產(chǎn)生二維關(guān)聯(lián)矩陣,其中行和列分別對(duì)應(yīng)于9083種獨(dú)特基因符號(hào)和334種獨(dú)特的腫瘤樣品ID(數(shù)據(jù)未顯示)。矩陣的每個(gè)室中的整數(shù)值表示每個(gè)基因和每個(gè)腫瘤樣品ID的獨(dú)特突變位點(diǎn)的數(shù)目。該表的突變基因的頻率分析證明,如果兩個(gè)突變被認(rèn)為是置信閾值,則在先前TCGA研究中報(bào)道的所有23個(gè)突變基因都包括在突變基因的子集中。
隨后,對(duì)于每個(gè)基因,計(jì)算在該基因中具有報(bào)道的突變的腫瘤樣品的數(shù)目,以及所有樣品間的突變事件的總數(shù)。在研究的個(gè)體基因(N=9083)中分布的腫瘤樣品數(shù)目的頻率分布函數(shù)顯示在圖2A中。該圖顯示了HG-SOC樣品中具有低,中等和高頻率的突變基因的實(shí)例。特別地,圖2A顯示在TCGA患者分組中具有BRCA1(334個(gè)腫瘤樣品中的40個(gè))或BRCA2(334個(gè)腫瘤樣品中的23個(gè))基因中的突變的腫瘤樣品的相對(duì)高頻率。相比之下,DNA錯(cuò)配修復(fù)基因MLH1,MSH2,MSH6,PMS1和PMS2中的突變發(fā)生在少得多的患者(分別為334患者中的1,1,4,2和1名)中。這些基因通常與Lynch綜合征相關(guān),并且造成遺傳性卵巢癌的亞組。
頻率分布是偏斜的,有長(zhǎng)右尾,代表下述觀察結(jié)果:少數(shù)基因是高度突變的,而許多其它基因在HG-SOC腫瘤樣品中較少突變。此類(lèi)概率函數(shù)屬于偏態(tài)分布家族,其在許多演進(jìn)和交互(互連)系統(tǒng)中經(jīng)常觀察到,其中出生-死亡過(guò)程發(fā)生并且通過(guò)朝向復(fù)雜性和自組織(self-organization)的演化來(lái)驅(qū)動(dòng)系統(tǒng)(參見(jiàn)方法)。在此類(lèi)模型中,函數(shù)的偏斜形式是強(qiáng)烈的群體/樣品大小和尺度依賴(lài)性的。在癌癥驅(qū)動(dòng)突變的情況下,Kolmogorov-Waring(KW)模型允許我們更好地理解突變事件的巨大變異性和可塑性的性質(zhì)以及癌癥起源及其進(jìn)展中常見(jiàn)和罕見(jiàn)突變的作用。在實(shí)際意義上,K-W模型允許估計(jì)突變基因的分?jǐn)?shù),所述突變基因可以在突變腫瘤樣品的數(shù)目增加時(shí)觀察到。在這種情況下,最佳擬合的K-W函數(shù)產(chǎn)生以下參數(shù):
a=3.944;b=9.50;θ=0.867和
因此,易感性靶基因的總數(shù)Ns可以通過(guò)下式估計(jì):
Ns=Nb/a=9083x 9.5/3.944=21887種基因。
該結(jié)果表明,用于誘變的潛在靶基因的預(yù)期數(shù)目將包括人類(lèi)中的整組蛋白編碼基因。由于數(shù)據(jù)僅揭示9083種突變基因,這些差異可能是假陰性,并且可以通過(guò)增加樣品大小或改進(jìn)技術(shù)來(lái)改善。
此外,產(chǎn)生散點(diǎn)圖,其中每個(gè)點(diǎn)代表每個(gè)基因,并且軸代表相對(duì)于所有樣品間的基因的總突變位點(diǎn)的數(shù)目在該基因中具有至少一種突變的患者腫瘤樣品的數(shù)目(圖2B)。對(duì)角線表示假設(shè)的情況,其中每個(gè)樣品精確突變每種基因一次(如果有的話)。我們的結(jié)果指示雖然TP53是最高度突變的基因,并且在幾乎所有HG-SOC患者中觀察到,在每個(gè)患者樣品中具有基因基因座的突變的數(shù)目相對(duì)較低,即平均僅對(duì)每個(gè)患者觀察到1個(gè)TP53突變(285名HG-SOC患者間的298種突變)。此腫瘤抑制劑的改變的功能或功能喪失似乎對(duì)HG-SOC致癌作用是關(guān)鍵的。
其它癌癥易感性基因BRCA2不太頻繁突變,并且在23種HG-SOC突變中僅觀察到25種突變。CHEK2和BRCA1突變似乎在HG-SOC患者中是相互排斥的,因?yàn)閮H18%(4/22)具有非沉默的CHEK2突變的患者具有BRCA1突變(圖3)。類(lèi)似地,僅18%(4/22)具有非沉默CHEK2突變的患者攜帶BRCA2突變(圖3)。
突變簇由參與各種細(xì)胞周期相關(guān)過(guò)程的基因定義
對(duì)于在至少5名HG-SOC患者中具有觀察到的突變的455種基因的子集,進(jìn)行基因-患者突變關(guān)聯(lián)矩陣上的無(wú)監(jiān)督分層聚類(lèi)。455種基因和334名HG-SOC患者的完整熱圖如圖4所示。如預(yù)期的,在大多數(shù)HG-SOC患者(85%,334名中的285名)中觀察到TP53突變。然而,患者中TP53突變的強(qiáng)度較低:通常在給定患者的每個(gè)p53基因中僅觀察到1個(gè)TP53突變。有趣的是,沿著TP53基因座的突變位點(diǎn)似乎隨機(jī)位于外顯子間,并且對(duì)于任何特定基因變體似乎沒(méi)有強(qiáng)陽(yáng)性克隆選擇(圖5)。腫瘤樣品中其它基因如BRCA1(12.0%,334名中的40名)和CHEK2(7.2%,334名中的24名)的突變頻率相對(duì)較小。然而,每個(gè)基因的這些突變的強(qiáng)度比對(duì)于TP53的高3倍以上(平均而言,對(duì)于BRCA1和CHEK2分別為每名患者的3.38和3.96個(gè)突變)。熱圖提供了這些發(fā)現(xiàn)的視覺(jué)呈現(xiàn)。它還證實(shí)了我們先前的發(fā)現(xiàn),BRCA1和CHEK2中的突變通常是相互排斥的(圖3和4)。
來(lái)自分層聚類(lèi)的結(jié)果還揭示了與CHEK2相關(guān)(180)的獨(dú)特的基因-患者簇(圖4)。該亞群包括58種基因符號(hào)和22名HG-SOC患者(圖6)。在該簇內(nèi),CHEK2的突變似乎占主導(dǎo),因?yàn)橛^察到CHEK2的多個(gè)區(qū)域在這些患者的每一名中是突變的(圖6A)。58種基因符號(hào)的注釋在圖7中列出。通過(guò)DAVID生物信息學(xué)分析58種基因符號(hào),揭示了這些基因在蛋白激酶活性(TBK1,PIK3C2B,MET,PRKCI,CHEK2,ALK,MAP3K6,PTK2B,RPS6KA2,MAPK15,PDGFRA,ROR2,TNK2和INSR)、腺苷酸和嘌呤核糖核苷酸結(jié)合(KIF4B,KIF3B,GCLC,TBK1,PIK3C2B,MET,PRKCI,TP53,CHEK2,ALK,ABCA3,MAP3K6,PTK2B,RPS6KA2,MAPK15,PDGFRA,ROR2,TNK2,CHD6,INSR,EP400和MYO5C)和疾病突變(MAD1L1,HNF1A,GCLC,MET,TP53,ITGB2,CHEK2,GLI2,GLI3,ABCA3,ROR2,INSR,SPTB和FN1)中顯著富集(圖8A)。通過(guò)Metacore的進(jìn)一步分析揭示了,與免疫應(yīng)答和DNA損傷途徑以及凋亡和細(xì)胞周期基因網(wǎng)絡(luò)的顯著關(guān)聯(lián)(圖8B,C)。這58種基因的網(wǎng)絡(luò)分析進(jìn)一步確定了21種基因的緊密直接相互作用網(wǎng)絡(luò),主要參與凋亡,細(xì)胞周期控制,DNA損傷反應(yīng)和免疫反應(yīng)(圖6B)。這些生物類(lèi)別和網(wǎng)絡(luò)被強(qiáng)烈分配到充分研究的DNA損傷,修復(fù),細(xì)胞周期,檢查點(diǎn)調(diào)節(jié)(圖9)。
本技術(shù)描述了基于檢測(cè)CHEK2相關(guān)的58-突變基因標(biāo)簽的DNA和/或mRNA和/或蛋白質(zhì)的種系和/或體細(xì)胞突變的高級(jí)別漿液性卵巢癌(HG-SOC)的風(fēng)險(xiǎn)評(píng)估,預(yù)后和治療結(jié)果預(yù)測(cè)的方法,所述58-突變基因標(biāo)簽由以下構(gòu)成:
ABCA3,ADAM15,ADAMTSL3,ALK,ANKHD1-EIF4EBP3,ANKMY2,ANXA7,ASPM,CDC27,CHD6,CHEK2,CHL1,DPYSL4,ENAH,EP400,ERBB2IP,F(xiàn)N1,F(xiàn)OXO3,GCLC,GLI2,GLI3,GYPB,GZMB,HLA-G,HNF1A,INPP5D,INSR,ITGB2,KIF3B,KIF4B,KTN1,LRRN2,MAD1L1,MAP3K6,MAPK15,MET,MKL1,MLL4,MYO5C,NUMA1,PDGFRA,PHLPP,PIK3C2B,PKP4,PLAGL2,PPARA,PRKCI,PTK2B,RAB3D,ROR2,RPS6KA2,RSU1,SPTB,TBK1,TNK2,TP53,VAV1和ZC3H11A
所述21-突變基因標(biāo)簽由以下構(gòu)成:
ADAMTSL3,ATR,CHEK2,ENAH,ERN2,GLI2,GYPB,KIAA1324L,LRRN2,MAP3K6,MAPK15,MET,MLL4,NIPBL,PCDH15,PPP1CC,PTCH1,PTK2B,RPS6KA2,RSU1和TNC。
本發(fā)明包括所述方法,所得的標(biāo)簽和隨后的臨床應(yīng)用,以預(yù)后診斷的HG-SOC患者或者篩選健康女性以進(jìn)行形成疾病的風(fēng)險(xiǎn)預(yù)測(cè)。
導(dǎo)致CHEK2、58-基因和21-基因突變標(biāo)簽開(kāi)發(fā)的方法包括:
■使用非監(jiān)督分層聚類(lèi)和監(jiān)督統(tǒng)計(jì)分析來(lái)鑒定58種基因的高度突變簇和以CHEK2的突變?yōu)樘卣鞯腍G-SOC患者。
■HG-SOC患者(至少5名患者)中高度突變的基因的無(wú)偏篩選以鑒定21種預(yù)后基因(ADAMTSL3,ATR,CHEK2,ENAH,ERN2,GLI2,GYPB,KIAA1324L,LRRN2,MAP3K6,MAPK15,MET,MLL4,NIPBL,PCDH15,PPP1CC,PTCH1,PTK2B,RPS6KA2,RSU1和TNC),其突變狀態(tài)顯著且獨(dú)立將患者分為低和高風(fēng)險(xiǎn)亞組。
■使用基因本體論,途徑和網(wǎng)絡(luò)分析來(lái)評(píng)估和確認(rèn)CHEK2相關(guān)突變簇中58種基因和21種預(yù)后基因的生物學(xué)有效性。
■使用Kaplan-Meier和對(duì)數(shù)秩檢驗(yàn)來(lái)確認(rèn)基因突變?cè)谠\斷的HG-SOC患者中的預(yù)后意義。
組合的21-基因突變標(biāo)簽的組成,其中:
■如果在ERN2中觀察到突變或在ADAMTSL3,ATR,CHEK2,ENAH,GLI2,GYPB,KIAA1324L,LRRN2,MAP3K6,MAPK15,MET,MLL4,NIPBL,PCDH15,PPP1CC,PTCH1,PTK2B,RPS6KA2,RSU1和TNC中沒(méi)有觀察到突變,那么將HG-SOC患者分類(lèi)為低風(fēng)險(xiǎn)。
■如果在ERN2中沒(méi)有觀察到突變,并且在ADAMTSL3,ATR,CHEK2,ENAH,GLI2,GYPB,KIAA1324L,LRRN2,MAP3K6,MAPK15,MET,MLL4,NIPBL,PCDH15,PPP1CC,PTCH1,PTK2B,RPS6KA2,RSU1和TNC中觀察到突變,那么將HG-SOC患者分類(lèi)為高風(fēng)險(xiǎn)。
本技術(shù)提出:
■使用CHEK2突變狀態(tài)用于已經(jīng)診斷為HG-SOC的患者的總體存活預(yù)后和療法響應(yīng)預(yù)測(cè)的方法。
■使用組合的58基因突變標(biāo)簽鑒定主要與種系或體細(xì)胞突變相關(guān)的高風(fēng)險(xiǎn)亞組的方法
■使用組合的21基因突變標(biāo)簽將患者分類(lèi)為低或高風(fēng)險(xiǎn)亞組的方法,其中低和高風(fēng)險(xiǎn)亞組的5年總體存活率分別為37%和6%。
■使用組合的21-基因突變標(biāo)簽,基于21-基因突變標(biāo)簽的基因的種系和/或LOH和/或體細(xì)胞突變的表征將高風(fēng)險(xiǎn)患者亞組分類(lèi)兩種進(jìn)一步的腫瘤亞型的方法。第一種腫瘤亞型與CHEK2和/或RPS6KA2和/或MLL4基因的種系和/或LOH突變相關(guān),而其它腫瘤亞型與其它基因的體細(xì)胞突變相關(guān)。
■使用CHEK2和/或RPS6KA2和/或MLL4基因的種系突變來(lái)鑒定可能對(duì)導(dǎo)致HG-SOC的腫瘤的起始、形成和進(jìn)展易感的健康女性的方法。
CHEK2突變與診斷的HG-SOC患者的不良預(yù)后相關(guān)
診斷為HG-SOC的患者的突變譜的初始分析揭示了不同的基因-患者群,其中CHEK2突變似乎在幾名患者中高度集中。將隨后的分析聚焦在CHEK2上,檢查該基因中的突變以確定它們是否與患者總體存活時(shí)間相關(guān),并且其是否可以用作已經(jīng)診斷為HG-SOC的患者的預(yù)后存活因素。
基于CHEK2基因的非沉默突變狀態(tài)進(jìn)行TCGA HG-SOC患者的分層。在這項(xiàng)分析中,研究具有突變數(shù)據(jù)和臨床信息兩者的總共311位患者(圖10)。在22名TCGA HG-SOC患者中觀察到非沉默的CHEK2突變,而未觀察到其余289名患者(具有臨床信息)中的CHEK2突變。在與沒(méi)有CHEK2突變的亞組相比時(shí),具有CHEK2突變的患者亞組的Kaplan-Meier存活曲線展現(xiàn)出顯著較差的總存活時(shí)間(p值≤0.01,圖11A)。有效地,來(lái)自TCGA數(shù)據(jù)的回顧性研究的結(jié)果表明,對(duì)于已經(jīng)診斷為HG-SOC的患者,CHEK2基因的非沉默突變(種系,LOH或體細(xì)胞)對(duì)于患者總體存活時(shí)間是非常不利的,因?yàn)檫@些患者在初始病理診斷后沒(méi)有存活超過(guò)5年。
在TCGA HG-SOC數(shù)據(jù)中,諸如TP53,BRCA1或MUC16的基因以比CHEK2更高的頻率突變,但與CHEK2不同,這些基因的突變狀態(tài)不能將HG-SOC患者獨(dú)立地分為存活顯著亞組(圖11B-D)。盡管缺乏統(tǒng)計(jì)學(xué)顯著性,但有一些略微的指標(biāo),即MUC16(一種已知的卵巢癌臨床生物標(biāo)志物)中的突變可以與較差的患者存活相關(guān)。另一方面,具有BRCA1突變的患者似乎與更好的患者存活相關(guān),這與其它幾個(gè)公開(kāi)的數(shù)據(jù)一致。盡管TP53在HG-SOC中經(jīng)常突變,并且可用于疾病診斷,但是我們的分析揭示,在診斷的患者中,它不能有效作為患者總體存活時(shí)間的預(yù)后標(biāo)志物(圖11B)。
CHEK2突變與對(duì)治療的不良的響應(yīng)相關(guān)
研究CHEK2突變與治療抗性之間的關(guān)聯(lián),并且發(fā)現(xiàn)其在HG-SOC中是顯著的。從TCGA數(shù)據(jù)看,HG-SOC患者分為兩個(gè)亞組。第一亞組由在初步療法后展現(xiàn)出進(jìn)行性疾病的患者組成。第二亞組由初步療法后具有部分響應(yīng),穩(wěn)定疾病或完全響應(yīng)的患者組成。隨后,生成一個(gè)2x 2的列聯(lián)表,其中列代表先前定義的患者的兩個(gè)亞組,并且這些行對(duì)應(yīng)于CHEK2的突變狀態(tài)。通過(guò)κ相關(guān)性測(cè)量的分析揭示了CHEK2基因中的突變與具有邊界顯著性的進(jìn)行性疾病相關(guān)(κ=0.1278,p值=0.05536,圖12A)。當(dāng)從分析中排除沉默突變時(shí),觀察到與療法抗性的略微更加顯著的相關(guān)性(κ=0.1422,p值=0.03769,圖12B)。基本上,25%的具有CHEK2突變的患者(20名中的5名)顯示疾病進(jìn)展,而僅有8.8%的沒(méi)有CHEK2突變的患者(237名中的21名)顯示疾病進(jìn)展。因此,結(jié)果指示CHEK2突變與對(duì)療法的不良的響應(yīng)相關(guān)。
CHEK2的拷貝數(shù)和mRNA表達(dá)似乎對(duì)HG-SOC患者存活沒(méi)有顯著影響
為了了解CHEK2的其它方面是否可以與患者存活相關(guān),合并了來(lái)自拷貝數(shù),突變,表達(dá)和臨床實(shí)驗(yàn)的可用數(shù)據(jù)集間的CHEK2的患者信息(圖10),并隨后評(píng)估它們的預(yù)后顯著性。
356名患者的拷貝數(shù)變異數(shù)據(jù)可用。對(duì)這些患者的拷貝數(shù)變異數(shù)據(jù)的分析揭示,CHEK2在15名患者中顯著擴(kuò)增,并且在130名患者中缺失。其余患者沒(méi)有展現(xiàn)出顯著的拷貝數(shù)變異。隨后,分析還顯示,CHEK2的拷貝數(shù)不能提供HG-SOC患者的顯著預(yù)后分類(lèi)(圖13A)。還預(yù)期,具有CHEK2區(qū)域的顯著擴(kuò)增的樣品展現(xiàn)出較高的mRNA表達(dá),而具有顯著缺失的樣品具有較低的表達(dá)(圖13B)。
399個(gè)樣品的表達(dá)數(shù)據(jù)可用,其由8個(gè)正常輸卵管和391個(gè)HG-SOC樣品構(gòu)成。另外,描述了391個(gè)HG-SOC樣品中的370個(gè),它們具有腫瘤信息,如腫瘤等級(jí)或腫瘤階段。因此,研究了屬于不同級(jí)別或階段的正常輸卵管組織和腫瘤組織間的CHEK2mRNA的表達(dá)譜(圖13C)。相對(duì)于輸卵管樣品,腫瘤中CHEK2的較高mRNA表達(dá)指示可能由于補(bǔ)償作用所致的早期疾病發(fā)作時(shí)的可能的上調(diào),并且提示使用CHEK2mRNA表達(dá)作為HG-SOC的早期診斷生物標(biāo)志物的可能性。另一方面,CHEK2表達(dá)數(shù)據(jù)將已經(jīng)診斷為HG-SOC的患者分類(lèi)為低和高風(fēng)險(xiǎn)亞組的預(yù)后能力有限(圖13D)。將發(fā)表的計(jì)算算法應(yīng)用于屬于391名HG-SOC患者的CHEK2mRNA表達(dá),其根據(jù)通過(guò)最大化兩個(gè)Kaplan-Meier存活曲線的分離而優(yōu)化的表達(dá)截留,將患者分配為低或高風(fēng)險(xiǎn)。雖然391個(gè)樣品中的370個(gè)注釋了臨床信息,但是12個(gè)是不完整的,因?yàn)樗鼈儧](méi)有存活時(shí)間和事件。因此,對(duì)具有臨床數(shù)據(jù)的良好注釋的358個(gè)HG-SOC樣品進(jìn)行存活分析。結(jié)果提示CHEK2的mRNA表達(dá)不與HG-SOC患者的預(yù)后顯著相關(guān)(p值=0.2057,圖13D)。因此,結(jié)果提示CHEK2的其它方面,如表達(dá)或拷貝數(shù)變異258不能用作HG-SOC患者的預(yù)后特征。
觀察到的CHEK2突變不可能改變磷酸化事件或蛋白質(zhì)結(jié)構(gòu)
CHEK2是絲氨酸/蘇氨酸-蛋白激酶,其在細(xì)胞核中發(fā)揮功能以響應(yīng)DNA雙鏈斷裂而調(diào)節(jié)細(xì)胞周期,DNA修復(fù)和凋亡。由于Chk2蛋白經(jīng)由磷酸化事件的翻譯后活化是其生理功能所需要的,檢查CHEK2突變以確定是否有任何突變位于已知或預(yù)測(cè)的磷酸化位點(diǎn)。從UniProt30和Phospho.ELM的數(shù)據(jù)庫(kù)收集已知的CHEK2磷酸化位點(diǎn)。在對(duì)CHEK2報(bào)告的所有突變中,僅發(fā)現(xiàn)一個(gè)突變位點(diǎn)與已知的磷酸化位點(diǎn)共定位(圖14)。來(lái)自TCGA HG-SOC患者的突變數(shù)據(jù)揭示了CHEK2在編碼殘基Thr-383的核苷酸處突變(hg18,外顯子11處的chr22:27421808-27421808)。已經(jīng)報(bào)道在Chk2激酶結(jié)構(gòu)域的激活環(huán)內(nèi)的Thr-383/Thr-387和Chk2的C末端區(qū)域的Ser-516處的Chk2自磷酸化對(duì)于Chk2激活是必需的。然而,在僅6名患者中觀察到在編碼Thr-383的核苷酸處的突變。此外,由于突變是同義的,相同的氨基酸殘基蘇氨酸將被編碼,因此,目前看來(lái)這里的突變不會(huì)導(dǎo)致Chk2功能的異常。結(jié)果還顯示,CHEK2突變不與由NetPhos和PHOSIDA33,34 274計(jì)算預(yù)測(cè)的任何其它磷酸化位點(diǎn)共定位(圖14),這提示基于我們目前的結(jié)果,磷酸化事件的改變可能不是導(dǎo)致改變的Chk2行為的關(guān)鍵機(jī)制。
確定所觀察到的沿CHEK2的DNA突變是否可以潛在修飾蛋白質(zhì)結(jié)構(gòu)。使用從RNA測(cè)序?qū)嶒?yàn)產(chǎn)生并從Sage Bionetworks的Synapse數(shù)據(jù)庫(kù)下載的數(shù)據(jù),首先檢查各種CHEK2同種型和屬于262名患者的原發(fā)性實(shí)體瘤間的表達(dá)數(shù)據(jù)。當(dāng)與其它CHEK2同種型相比時(shí),鑒定出同種型uc003adu.1(代表同種型1或A)是主要表達(dá)的(圖15)。收集沿著氨基酸殘基的已知的二級(jí)結(jié)構(gòu)(同種型1,UniProt ID:O96017),并將其與觀察到的DNA突變進(jìn)行比較(圖14)。在CHEK2DNA的8個(gè)獨(dú)特的位點(diǎn)處的DNA突變可以潛在地改變7個(gè)不同氨基酸殘基處的蛋白質(zhì)結(jié)構(gòu)(圖16A-B)。在蛋白質(zhì)的結(jié)構(gòu)化位點(diǎn)僅出現(xiàn)氨基酸殘基之一(Thr-383)。然而,次級(jí)螺旋結(jié)構(gòu)不可能被破壞,因?yàn)樵搮^(qū)域的DNA突變是沉默的。為了進(jìn)一步可視化,生成了生理Chk2的代表性蛋白質(zhì)晶體結(jié)構(gòu)并疊加7個(gè)突變殘基,以相對(duì)于其周?chē)娜S構(gòu)象研究突變位點(diǎn)(圖16C)。根據(jù)從Thr89到Glu501的Chk2的初始晶體學(xué)結(jié)構(gòu)(PDB代碼3i6u36,在3.0A解析),使用Modeller完成少數(shù)缺失的環(huán)并將激酶的C-末端區(qū)域延伸到Leu543。進(jìn)行分子動(dòng)力學(xué)(MD)模擬,從而獲得50ns的蛋白質(zhì)結(jié)構(gòu)的松弛狀態(tài)構(gòu)象(圖16C)。從圖中可以觀察到,突變殘基(由有色球體表示)大部分位于蛋白質(zhì)的非結(jié)構(gòu)區(qū)域。因此,來(lái)自蛋白質(zhì)建模和MD模擬的我們的結(jié)果提示了CHEK2的DNA突變不可能破壞蛋白質(zhì)結(jié)構(gòu)并且影響其生理功能。
觀察到的CHEK2突變可影響蛋白質(zhì)的核輸入
在這些TCGA HG-SOC患者中調(diào)查NLS信號(hào)的修飾是可能的。先前已報(bào)道NLS3是參與細(xì)胞中Chk2的核定位的關(guān)鍵NLS(Zannini等人J Biol Chem.2003278(43):42346-51)。經(jīng)由PSORT II計(jì)算預(yù)測(cè)的單組分(monopartite)NLS3占據(jù)一段短氨基酸,跨越蛋白質(zhì)的殘基515-522(氨基酸序列:PSTSRKRP,圖16B)。由Zannini等人進(jìn)行的突變研究顯示該區(qū)域的突變導(dǎo)致Chk2蛋白的細(xì)胞質(zhì)定位,這提示改變的Chk2不能轉(zhuǎn)運(yùn)至細(xì)胞核。有趣的是,結(jié)果揭示了沿著此短N(yùn)LS序列,具有屬于TCGA HG-SOC患者的突變的3個(gè)不同的核苷酸(對(duì)應(yīng)于2個(gè)氨基酸殘基-R519和P522)位點(diǎn)(圖14和16)。在染色體坐標(biāo)chr22:27413951處觀察到的突變是在21名患者中觀察到的沉默突變(P522P,在圖16A中標(biāo)記為灰色)。在連續(xù)核苷酸位置chr22:27413961和chr22:27413962處的兩個(gè)非沉默突變分別存在于14名和21名患者中(R519Q/R519G,在圖16A中標(biāo)記為深灰色)??偟膩?lái)說(shuō),觀察到21名患者在這2個(gè)位點(diǎn)的任一處展現(xiàn)突變,以及與CHEK2突變對(duì)患者存活有害的發(fā)現(xiàn)一起,結(jié)果提示NLS區(qū)域中的突變可以不利地影響Chk2的核輸入,降低有效且功能性Chk2的蛋白質(zhì)水平,影響Chk2相關(guān)的修復(fù)途徑,并最終有助于較差的患者存活。
由于在NLS3下游有兩個(gè)其它突變位點(diǎn),使用備選的計(jì)算工具cNLS40來(lái)預(yù)測(cè)沿Chk2蛋白質(zhì)序列(同種型A,NP_009125-543氨基酸殘基)的NLS。結(jié)果揭示來(lái)自氨基酸殘基517-538(TSRKRPREGEAEGAETTKRPAV,圖16B)的功能性二分NLS的可能性。該區(qū)域包括由12個(gè)氨基酸殘基的接頭連接的兩個(gè)堿性殘基簇。有趣的是,在觀察到在編碼R519的核苷酸處具有突變的21名TCGA HG-SOC患者中,對(duì)90%(21名中的19名)患者觀察到編碼R535的核苷酸的同時(shí)突變(圖16B)。來(lái)自該分析的結(jié)果提示,有效NLS區(qū)域可以比由Zannini等人鑒定的NLS3更長(zhǎng)。此外,編碼二分NLS的兩個(gè)關(guān)鍵組分(堿性殘基)處的殘基的突變的共發(fā)生進(jìn)一步暗示在這些19名HG-SOC患者的腫瘤組織樣品中的陽(yáng)性克隆選擇的可能性。
21-基因預(yù)后標(biāo)簽的鑒定
用在至少5名具有臨床信息的患者中觀察到的突變研究282種基因的突變狀態(tài)的預(yù)后顯著性。結(jié)果揭示了有21種基因,它們?cè)谥辽?名患者中非沉默突變,并且可以獨(dú)立地將HG-SOC患者分層為預(yù)后顯著亞組(p值≤0.05,圖17)。在這21個(gè)基因中具有預(yù)后顯著性的前3種突變基因包括分別在22名,23名和20名患者中具有非沉默突變的CHEK2,RPS6KA2和MLL4(圖17)。有趣的是,來(lái)自分層聚類(lèi)的結(jié)果也揭示了這些基因聚集在一起(圖6A)。定量地,κ相關(guān)分析進(jìn)一步揭示了CHEK2突變與RPS6KA2或MLL4突變的高度共發(fā)生(κ≥0.75,p值≤5E-20,圖3)。
總體上,觀察到這些預(yù)后顯著基因與CHEK2相關(guān)突變亞簇的基因的相當(dāng)大的重疊(p值=6e-08,圖18A)。由于具有CHEK2突變的患者通常還會(huì)具有突變簇中的基因突變(圖6A),僅審閱21種預(yù)后基因以產(chǎn)生組合的突變預(yù)后標(biāo)簽。在這21種基因中,20種基因的突變狀態(tài)展現(xiàn)出促致癌性行為(pro-oncogenic behaviour),其中突變與較差的總體存活相關(guān)(圖17)。相比之下,只有ERN2展現(xiàn)出腫瘤抑制行為,其中突變與更好的總存活相關(guān)聯(lián)。使用這些基因,如果在ERN2中存在突變或在所有20種促致癌基因中沒(méi)有突變,則將患者分類(lèi)為較低風(fēng)險(xiǎn)的亞組。另一方面,在20種促致癌基因中的任一個(gè)中具有突變并且沒(méi)有ERN2突變的患者被分類(lèi)為更高的風(fēng)險(xiǎn)。來(lái)自Kaplan-Meier存活圖的結(jié)果揭示了,21-基因標(biāo)簽定義的患者亞組顯著分層并與總體存活時(shí)間相關(guān)(p值=7.31e-08,圖18B)。具體來(lái)說(shuō),低風(fēng)險(xiǎn)和高風(fēng)險(xiǎn)亞組的5年總體存活率分別為37%和6%。為了研究21-基因標(biāo)簽的預(yù)后顯著性(圖18B)是否由于單獨(dú)的CHEK2突變的貢獻(xiàn),具有CHEK2突變的患者從標(biāo)簽限定的高風(fēng)險(xiǎn)亞組中排除。我們的結(jié)果指示,診斷為具有CHEK2突變或剩余的20-基因標(biāo)簽(排除CHEK2)的任一種中的突變的患者展現(xiàn)出相似的總體存活模式(圖19C)。在20基因標(biāo)簽中的任何基因中展現(xiàn)出突變的患者的不良預(yù)后提示這些基因在HG-SOC基因組中的異常功能發(fā)揮可以相反地影響患者對(duì)療法的手術(shù)后響應(yīng),不依賴(lài)于CHEK2突變的效應(yīng)并且不管CHEK2突變的效應(yīng)如何。
患者的這兩個(gè)亞組的臨床特征揭示了由21-基因標(biāo)簽定義的高風(fēng)險(xiǎn)患者與進(jìn)行性疾病相關(guān)。具體來(lái)說(shuō),與低風(fēng)險(xiǎn)亞組形成對(duì)比,通過(guò)21-基因突變標(biāo)簽定義為高風(fēng)險(xiǎn)的患者以?xún)杀犊赡苷宫F(xiàn)出進(jìn)行性疾病(高風(fēng)險(xiǎn):50名患者中的8名=15%;低風(fēng)險(xiǎn):208名患者中的18名=8.7%,圖19)。然而,統(tǒng)計(jì)學(xué)顯著性為邊界(κ=0.08984,p值=0.06065)。不過(guò),趨勢(shì)提示這些基因可以是治療抗性中的重要因素。
21-基因預(yù)后標(biāo)簽中的基因的詳細(xì)注釋列于(圖20)。隨后,使用DAVID生物信息學(xué)進(jìn)行標(biāo)簽的21種基因的基因本體論分析。結(jié)果指示這些基因在與激酶活性,ATP結(jié)合和磷酸化相關(guān)的功能中強(qiáng)烈富集(圖21)。平行地,通過(guò)MetaCore的分析還揭示了與DNA損傷誘導(dǎo)的響應(yīng)相關(guān)的途徑以及與細(xì)胞周期,DNA修復(fù)和凋亡相關(guān)的基因網(wǎng)絡(luò)的關(guān)聯(lián)(圖21B-C)。
鑒定來(lái)自標(biāo)簽定義的高風(fēng)險(xiǎn)亞組的兩個(gè)腫瘤亞類(lèi)
為了研究通過(guò)CHEK2或20基因標(biāo)簽鑒定的不良預(yù)后患者亞組的可能的異質(zhì)性,產(chǎn)生了21種基因和58名定義為高風(fēng)險(xiǎn)的患者的基因-患者突變矩陣(圖22A)。就種系、LOH或體細(xì)胞突變而言進(jìn)一步表征這些突變,并且我們的結(jié)果顯示了在22名具有CHEK2突變的患者的亞組中的基因突變似乎是種系或LOH起源的,而其他36名高風(fēng)險(xiǎn)患者的基因突變似乎是體細(xì)胞的(圖22B-D)。具體來(lái)說(shuō),在22名具有CHEK2突變的患者的亞組中,16名患者(73%)展現(xiàn)出非沉默的種系CHEK2突變(圖23)。有趣的是,在這16名患者中,在15名(94%)和12名(75%)患者中分別觀察到RPS6KA2和MLL4基因中的種系突變的強(qiáng)烈的共存在。重新分析整個(gè)基因-患者突變矩陣(455種高度突變基因和334名患者)也揭示了類(lèi)似的發(fā)現(xiàn),即來(lái)自CHEK2相關(guān)突變410亞簇的基因與種系或LOH而不是體細(xì)胞突變相關(guān)(結(jié)果未顯示)。
我們的結(jié)果揭示了通過(guò)我們的21-基因標(biāo)簽鑒定的高風(fēng)險(xiǎn)患者中,可以有兩個(gè)獨(dú)特的腫瘤亞類(lèi),其最初的發(fā)病機(jī)制可以由CHEK2,RPS6KA2和MLL4的遺傳性種系突變,或其它標(biāo)簽基因的自發(fā)體細(xì)胞突變驅(qū)動(dòng)。
HG-SOC中CHEK2的突變可影響核定位并導(dǎo)致不良的臨床結(jié)果
許多發(fā)表的突變研究?jī)H聚焦于特定類(lèi)別的突變,如體細(xì)胞或種系變體。當(dāng)分別對(duì)出生時(shí)形成特定疾病的遺傳風(fēng)險(xiǎn),或者鑒定在生命的后期階段形成疾病的驅(qū)動(dòng)突變感興趣時(shí),對(duì)種系或體細(xì)胞突變的聚焦將適合于特定研究。為了預(yù)后的目的,突變是由于早期遺傳還是后期環(huán)境因素是不太相關(guān)的。因此,在預(yù)后分層期間包括所有類(lèi)別的突變。
有趣的是,攜帶Chk2突變的HG-SOC患者具有更高的死亡風(fēng)險(xiǎn)。但重要的是,它也可以促使進(jìn)一步研究這些患者的備選靶向治療。Chk2突變?yōu)楹闻c不利的患者預(yù)后相關(guān)的可能的解釋可以是由于化學(xué)抗性的誘導(dǎo),因?yàn)樵贑HEK2和治療響應(yīng)之間發(fā)現(xiàn)顯著相關(guān)性(κ=0.1422,p值=0.03769,圖12B)。在TCGA HG-SOC患者中觀察到的突變沒(méi)有發(fā)生在注釋的二級(jí)結(jié)構(gòu),ATP結(jié)合位點(diǎn),活性位點(diǎn),F(xiàn)HA結(jié)構(gòu)域或激酶結(jié)構(gòu)域中(圖14)。因此,似乎沒(méi)有足夠的證據(jù)表明在TCGA HG-SOC患者中觀察到的CHEK2突變可以破壞蛋白質(zhì)結(jié)構(gòu)、二聚化過(guò)程或激酶活性并且有助于化學(xué)抗性。
在卵巢癌中,順鉑用作主要的化學(xué)治療劑。Zhang等人報(bào)道順鉑處理可以降解Chk2蛋白,并且降低的Chk2水平可以阻礙細(xì)胞周期控制,防止細(xì)胞凋亡,并且有助于腫瘤的化療抗性。Chk2降解可以是大量臨床相關(guān)腫瘤形成獲得性對(duì)DNA損傷劑的抗性的主要機(jī)制之一。就展現(xiàn)CHEK2突變的患者而言,通過(guò)體細(xì)胞或種系突變的一個(gè)拷貝的功能喪失可以導(dǎo)致細(xì)胞核中CHEK2的拷貝減少,并且隨后在順鉑處理時(shí),CHEK2降解的作用可以加重,并且最終對(duì)患者存活有害。有趣的是,觀察到的CHEK2突變?yōu)楹慰赡茏畛醮俪傻鞍踪|(zhì)功能喪失的原因可以歸因于在細(xì)胞核中缺乏蛋白質(zhì)定位。Chk2的核定位的缺乏可能有助于偏離生理活性并導(dǎo)致不期望的效應(yīng)。分析揭示了在TCGA分組的21名HG-SOC患者中,CHEK2突變發(fā)生在對(duì)于蛋白質(zhì)的核輸入關(guān)鍵的核定位信號(hào)內(nèi)(圖16B)。核定位信號(hào)的突變抑制Chk2蛋白的核輸入,導(dǎo)致Chk2在核中的功能性拷貝減少。似乎可能的是,沿著CHEK2基因的核定位信號(hào)的突變可導(dǎo)致細(xì)胞核中Chk2蛋白水平降低,并且在順鉑治療時(shí),蛋白質(zhì)水平將進(jìn)一步耗盡,這可能潛在地導(dǎo)致在存在順鉑的情況下增強(qiáng)的腫瘤增殖,這模擬化療抗性并導(dǎo)致不利的患者存活。結(jié)果顯示,展現(xiàn)出CHEK2突變的HG-SOC患者與不良的臨床結(jié)果顯著相關(guān),并且在初始診斷后沒(méi)有存活超過(guò)5年(圖11A和12)。
觀察到的CHEK2突變不可能影響翻譯后修飾
檢查CHEK2與不良患者預(yù)后的關(guān)聯(lián),以觀察該突變是否可以是由于磷酸化位點(diǎn)的修飾所致。然而,CHEK2中觀察到的突變沒(méi)有沿著任何當(dāng)前已知和注釋的磷酸化位點(diǎn)發(fā)生。因此,收集來(lái)自文獻(xiàn)的計(jì)算鑒定的磷酸化基序并研究沿著基序的任何關(guān)鍵殘基在TCGA HG-SOC患者中是否突變。結(jié)果揭示了盡管它們非常接近,但觀察到的突變無(wú)一發(fā)生在磷酸化位點(diǎn)或圍繞磷酸化位點(diǎn)的關(guān)鍵基序上。此外,分析揭示了圍繞CHEK2突變的區(qū)域似乎不含強(qiáng)的蛋白質(zhì)二級(jí)結(jié)構(gòu),因此目前似乎不太可能的是,Chk2蛋白質(zhì)的翻譯后修飾的異常是導(dǎo)致受累患者的不良存活預(yù)后的促成因素。然而,可以進(jìn)一步研究CHEK2突變對(duì)蛋白質(zhì)二聚化或與其它蛋白質(zhì)配偶體的物理相互作用的影響。
沉默突變的可能影響
雖然假設(shè)沿著CHEK2觀察到的突變可以影響翻譯的蛋白質(zhì)的核移位,但是也可以牽涉涉及沉默突變的其它機(jī)制。
觀察到21名HG-SOC患者在chr22:27413951處展現(xiàn)沉默突變(P522P,圖16)。傳統(tǒng)上,假定編碼相同氨基酸殘基的沉默DNA突變對(duì)蛋白質(zhì)功能具有可忽略的影響。然而,最近的研究已經(jīng)提示了沉默突變可以通過(guò)各種機(jī)制影響下游蛋白功能性。例如,DNA三聯(lián)體密碼子的改變可以改變miRNA的結(jié)合位點(diǎn),導(dǎo)致翻譯抑制效率和下游信號(hào)網(wǎng)絡(luò)的改變。研究chr22:27413951(P522P,圖16)處的突變是否可以潛在改變miRNA結(jié)合位點(diǎn),來(lái)自序列比對(duì)的結(jié)果指示特定的區(qū)域未被任何目前已知的人成熟miRNA靶向(結(jié)果未顯示)。因此,通過(guò)同義突變的miRNA靶位點(diǎn)的改變不可能對(duì)檢查的突變中的mRNA穩(wěn)定性及其隨后的翻譯具有任何影響。
單一同義DNA突變可以影響mRNA二級(jí)結(jié)構(gòu)、折疊、穩(wěn)定性,并因此影響翻譯的蛋白質(zhì)的調(diào)節(jié),如對(duì)于人多巴胺受體D2基因報(bào)道的。還提示同義突變可影響氨基酸殘基的翻譯效率,這是由于細(xì)胞中tRNA豐度的變化和不對(duì)稱(chēng)性。即使在同義突變不影響mRNA或蛋白質(zhì)水平的情況下,翻譯的蛋白質(zhì)的功能也可以改變。在MDR1基因中,顯示導(dǎo)致罕見(jiàn)的三聯(lián)體密碼子的同義多態(tài)性可以改變MDR1蛋白的底物特異性,可能是由于在該氨基酸殘基處的翻譯速率的減慢,其繼而影響蛋白質(zhì)折疊。在最后一個(gè)外顯子處展現(xiàn)沉默突變和非沉默突變兩者的14名常見(jiàn)患者中的強(qiáng)烈重疊(圖16A)似乎提示了這些突變的可能的陽(yáng)性選擇,并且未來(lái)的研究可以集中于闡明沉默突變對(duì)最終蛋白表達(dá)和功能性的可能影響。
21-基因突變標(biāo)簽用于預(yù)后和治療設(shè)計(jì)的潛在的臨床應(yīng)用
盡管CHEK2突變就患者基于其存活模式的分類(lèi)而言似乎是最重要的,但總共鑒定了21種基因,其可以基于其突變狀態(tài)獨(dú)立且顯著地將患者鑒定為低和高風(fēng)險(xiǎn)亞組(圖17)。將21種組合的基因分類(lèi)器應(yīng)用于TCGA患者分組導(dǎo)致患者顯著分層為兩個(gè)存活顯著亞組,其中低和高風(fēng)險(xiǎn)亞組的5年總體存活率分別為37%和6%(p值=3.8E-09,圖18B)。此外,基于單獨(dú)的CHEK2或剩余的20-基因標(biāo)簽的突變狀態(tài)的分層允許排除21-基因標(biāo)簽的預(yù)后價(jià)值是由于單獨(dú)的CHEK2的貢獻(xiàn)的假設(shè)(圖18C)。確切地,這顯示即使在缺乏CHEK2突變的情況下,基于20-基因標(biāo)簽也可以鑒定出不良預(yù)后亞組。為了預(yù)后的目的,雖然從TCGA患者分組的回顧性研究的患者風(fēng)險(xiǎn)預(yù)測(cè)中使用21-基因突變標(biāo)簽是有用的,但是前瞻性研究將驗(yàn)證在臨床背景中使用該標(biāo)簽。
有趣的是,在其突變狀態(tài)最適合預(yù)后應(yīng)用的21種基因中,與蛋白激酶活性、ATP結(jié)合、磷酸化、DNA損傷應(yīng)答、細(xì)胞凋亡或細(xì)胞周期調(diào)節(jié)相關(guān)的基因功能是富集的(圖21)。發(fā)現(xiàn)激酶如CHEK2或RPS6KA2中的突變與患者存活和患者分層相關(guān)。具有CHEK2或RPS6KA2的表征的突變的患者僅代表HG-SOC患者的子集。大多數(shù)HG-SOC患者的特征在于僅在幾個(gè)基因中的突變(圖4和22),這與患者-基因突變譜為異質(zhì)和稀疏的一般共識(shí)一致。不過(guò),已經(jīng)假設(shè)個(gè)體患者可以在通過(guò)對(duì)應(yīng)于癌癥標(biāo)志的基因網(wǎng)絡(luò)功能相關(guān)的不同基因中展現(xiàn)出突變。因此,任何特定的生物過(guò)程可以通過(guò)其任何成員基因的畸變來(lái)影響。對(duì)HG-SOC患者中突變的異質(zhì)性質(zhì)的理解可以提供未來(lái)更有效和靶向治療的機(jī)會(huì)。
21-基因突變標(biāo)簽用于形成HSG-SOC的風(fēng)險(xiǎn)預(yù)測(cè)的潛在臨床應(yīng)用
對(duì)通過(guò)21-基因標(biāo)簽鑒定的58名高風(fēng)險(xiǎn)HG-SOC患者的分析還揭示了可以源于兩種不同的腫瘤病因?qū)W因素的兩種截然不同的腫瘤亞型。第一個(gè)腫瘤亞類(lèi)(或患者亞組)通過(guò)基因如CHEK2、RPS6KA2和MLL4的種系突變或LOH清楚地表征(圖22)。相比之下,對(duì)于其它腫瘤亞類(lèi)(或患者亞組),未觀察到這些基因的種系突變。確切地,此腫瘤亞類(lèi)似乎是在通常表征HG-SOC腫瘤的TP53突變的存在下這些基因的自發(fā)體細(xì)胞突變的結(jié)果。
事實(shí)上,卵巢癌是高度異質(zhì)的,具有參與幾種癌癥亞型的形成的各種驅(qū)動(dòng)基因(圖24A)。結(jié)果提示了大約11.6%的HG-SOC腫瘤可以由于TP53突變存在下標(biāo)簽中的基因的自發(fā)體細(xì)胞突變而可能啟動(dòng)。此外,在以TP53點(diǎn)突變和基因組不穩(wěn)定性為特征的高級(jí)別漿液性卵巢癌中,遺傳的種系CHEK2突變可能導(dǎo)致易感性,并參與約7.1%的HG-SOC患者中的腫瘤的起始、形成和進(jìn)展(圖24)。結(jié)果還提示CHEK2、RPS6KA2或MLL4的種系突變可以用作預(yù)測(cè)個(gè)體形成HG-SOC的風(fēng)險(xiǎn)的風(fēng)險(xiǎn)因子的可能性。對(duì)于CHEK2,已經(jīng)進(jìn)行研究以研究基因變體對(duì)卵巢易感性的影響,但是報(bào)道了關(guān)聯(lián)是不顯著的,可能是由于CHEK2突變的罕見(jiàn)發(fā)生,小腫瘤樣品大小,缺乏合適的HG-SOC患者樣品,可用樣品的變體檢測(cè)的低分辨率。然而,來(lái)自TCGA的高質(zhì)量HG-SOC數(shù)據(jù)集的當(dāng)前結(jié)果已經(jīng)揭示了由于CHEK2種系變體的疾病易感性的先前未表征的關(guān)聯(lián)。
CHEK2表達(dá)在HSG-SOC的早期診斷中的潛在臨床應(yīng)用
結(jié)果揭示了相對(duì)于輸卵管正常組織,CHEK2mRNA在腫瘤樣品中上調(diào)(圖24B),這提示了升高的CHEK2mRNA表達(dá)可以作為高級(jí)別漿液性卵巢癌的早期診斷標(biāo)志物使用??赡艿?,升高的CHEK2表達(dá)可以是由于對(duì)HG-SOC中與TP53突變相關(guān)的DNA損傷或基因組不穩(wěn)定性的響應(yīng)。通過(guò)抑制Chk2在腫瘤細(xì)胞中誘導(dǎo)凋亡可有益于預(yù)防不可控的細(xì)胞增殖,從而可導(dǎo)致更好的患者存活。然而,最近的研究發(fā)現(xiàn),卵巢癌細(xì)胞系中的Chk2耗竭減少順鉑敏感性,并且提出Chk2是否可以是順鉑治療的HG-SOC患者中的有效治療靶點(diǎn)的進(jìn)一步懷疑。
TCGA HG-SOC數(shù)據(jù)源和預(yù)處理
從2010年11月24日從TCGA數(shù)據(jù)門(mén)戶下載屬于334名TCGA HG-SOC患者的處理過(guò)的突變數(shù)據(jù)。序列由貝勒醫(yī)學(xué)院(BCM)的人類(lèi)基因組測(cè)序中心(HGSC),布洛德研究所基因組中心(BI)和華盛頓大學(xué)基因組研究所(WUSM)基于Illumina或ABI SOLID測(cè)序技術(shù)產(chǎn)生。該版本(release)包括105名水平2和91名水平3(BCM)患者,來(lái)自BI的172名水平2和158名水平3患者,和作為水平2和水平3WUSM患者的88名。
總共,報(bào)告了跨越334名患者和10489個(gè)RefSeq基因符號(hào)的21978個(gè)突變。除去4339種具有未知的突變狀態(tài)的突變。在9083種基因中觀察到剩余的17639種突變,并且涵蓋諸如插入、缺失、SNP和沉默突變的變體。還下載對(duì)應(yīng)于每個(gè)HG-SOC患者的臨床信息。
此外,獲得463個(gè)原發(fā)性實(shí)體卵巢癌組織樣品的mRNA表達(dá)數(shù)據(jù)(來(lái)自11批,每批21-47個(gè)樣品)。在每批中進(jìn)行質(zhì)量評(píng)估以鑒定質(zhì)量差的芯片。從隨后的分析中除去74個(gè)質(zhì)量差的芯片。在每個(gè)批次內(nèi)進(jìn)行背景校正和標(biāo)準(zhǔn)化。最后,使用非參數(shù)ComBat軟件在批次間消除批次效應(yīng)。
拷貝數(shù)變異分析
使用從TCGA門(mén)戶下載的腫瘤-血液配對(duì)樣品。將血液拷貝數(shù)變異用于標(biāo)準(zhǔn)化和估計(jì)匹配腫瘤樣品的拷貝數(shù)變異數(shù)據(jù)的倍數(shù)變化富集/呈現(xiàn)不足(under representation)。TCGA SNP陣列數(shù)據(jù)(CNV平臺(tái)6)通過(guò)PARTEK 6.5程序以公司推薦的參數(shù)進(jìn)行處理。使用PARTEK軟件,鑒定了拷貝變異區(qū)段的基因組坐標(biāo),其形成統(tǒng)計(jì)學(xué)上顯著的缺失或擴(kuò)增的基因組區(qū)域。對(duì)于每個(gè)腫瘤樣品,將這些顯著區(qū)域定位在人類(lèi)基因組坐標(biāo)上,并且通過(guò)USCS基因組瀏覽器定制軌跡顯現(xiàn)此類(lèi)信號(hào)的標(biāo)準(zhǔn)化倍數(shù)變化。卵巢腫瘤中的改變的拷貝數(shù)展現(xiàn)出高水平的染色體不穩(wěn)定性。20573種基因與改變的CN區(qū)段重疊,代表與顯著的改變拷貝數(shù)區(qū)域重疊的約70%的RefSeq蛋白編碼基因。
處理過(guò)的RNA測(cè)序表達(dá)數(shù)據(jù)
基因和基因同種型的處理過(guò)的RNA測(cè)序表達(dá)數(shù)據(jù)從Sage Bionetworks的Synapse數(shù)據(jù)庫(kù)下載。該數(shù)據(jù)集含有73598種基因同種型的RNA-seq表達(dá)數(shù)據(jù)和對(duì)應(yīng)于263名患者的266個(gè)樣品。在266個(gè)樣品中,從原發(fā)性實(shí)體瘤收集262個(gè)樣品(來(lái)自262個(gè)患者),而從復(fù)發(fā)性實(shí)體瘤收集其余的樣品。
次級(jí)數(shù)據(jù)來(lái)源
從UniProt獲得由重要功能位點(diǎn)、二級(jí)結(jié)構(gòu)、天然變體、誘變實(shí)驗(yàn)數(shù)據(jù)和磷酸化位點(diǎn)構(gòu)成的蛋白質(zhì)注釋數(shù)據(jù)。此外,已知的磷酸化位點(diǎn)從驗(yàn)證的數(shù)據(jù)庫(kù)Phopho.ELM下載。使用在線工具NetPhos和PHOSIDA(它們基于機(jī)器學(xué)習(xí)技術(shù),如人工神經(jīng)網(wǎng)絡(luò)或支持向量機(jī))進(jìn)一步預(yù)測(cè)磷酸化位點(diǎn)。通過(guò)在線計(jì)算工具PSORT II和cNLS Mapper預(yù)測(cè)核定位信號(hào)。
患者和基因間的突變矩陣
患者和基因間的突變譜在二維矩陣中表示,M由分別代表基因符號(hào)和患者樣品ID的9083行和334列構(gòu)成。矩陣中的每個(gè)條目,Mij表示第j個(gè)患者樣品的第i個(gè)基因中的獨(dú)特突變位點(diǎn)的數(shù)目。
對(duì)易感基因的突變腫瘤樣品的數(shù)目的頻率分布的分析
Kolmogorov-Waring(K-W)概率函數(shù)用于擬合突變的腫瘤組織樣品數(shù)目的分布。該函數(shù)描述為:
其中m=0、1、2、...并且b,a,θ是我們模型的參數(shù)。B(x)是如前所述的β函數(shù)。在b>a>0的情況下,通過(guò)公式估計(jì)未觀察的事件的概率,可以以下面的遞歸公式的形式呈現(xiàn)等式1,以便容易地計(jì)算估計(jì)模型參數(shù):
為了將概率函數(shù)(等式1)或(等式2)應(yīng)用于觀察數(shù)據(jù),假定隨機(jī)變量X限于樣品大小,并且最罕見(jiàn)的事件是未觀察的。因此,隨機(jī)變量X被雙截短的,即范圍1、2、...、J(J<∞)。使用(等式1),得到的截短分布函數(shù)的概率分布函數(shù)如下書(shū)寫(xiě):
該概率分布函數(shù)對(duì)應(yīng)于在沒(méi)有檢測(cè)到發(fā)生數(shù)值0和J+1,J+2,...的有限分組中分析誘變數(shù)據(jù)中的典型情況。曲線擬合計(jì)算算法的細(xì)節(jié)以前已經(jīng)公開(kāi)。
分層聚類(lèi)
生成表示患者和基因間的突變模式的數(shù)值矩陣。行和列分別對(duì)應(yīng)于基因和患者。矩陣中的每個(gè)數(shù)值表示對(duì)于該患者和基因具有報(bào)道的突變的不同位置的數(shù)目。使用Kendall-tau作為相似性度量和完全鏈接作為聚類(lèi)方法進(jìn)行分層聚類(lèi)分析。數(shù)學(xué)過(guò)程在Gene Cluster 3.0中實(shí)現(xiàn),并通過(guò)Java TreeView可視化。圖的強(qiáng)度對(duì)應(yīng)于該患者和基因的獨(dú)特的突變位置的數(shù)目。
基因富集和網(wǎng)絡(luò)分析
通過(guò)來(lái)自GeneGo Inc.的DAVID Bioinformatics和MetaCore進(jìn)行基因功能富集分析。使用默認(rèn)的人類(lèi)基因組基因作為背景設(shè)置。使用默認(rèn)參數(shù)。通過(guò)MetaCore通過(guò)直接交互網(wǎng)絡(luò)算法生成基因網(wǎng)絡(luò)。網(wǎng)絡(luò)的圖例可以從http://ftp.genego.com/files/MC_legend.pdf進(jìn)行評(píng)估。
存活分析
患者亞組的存活分析參考其總存活時(shí)間(最后一次隨訪前的年數(shù))和存活事件(最后一次隨訪的生命狀態(tài)(vital status))進(jìn)行。使用Kaplan-Meier存活曲線顯現(xiàn)患者亞組的比較存活時(shí)間和事件,所述Kaplan-Meier存活曲線表示在初始診斷后在給定時(shí)間時(shí)患者存活的概率。使用基于chi-sq分布的對(duì)數(shù)秩檢驗(yàn)評(píng)價(jià)完全存活時(shí)間范圍間的患者亞組分層的統(tǒng)計(jì)學(xué)顯著性。使用開(kāi)源R編程語(yǔ)言和軟件包實(shí)現(xiàn)程序。
一致性檢驗(yàn)(agreement test)的測(cè)量
使用加權(quán)κ相關(guān)測(cè)量計(jì)算具有臨床參數(shù),如治療響應(yīng)的有序患者亞組之間的相關(guān)性。使用Mantel-Haenszel(MH)檢驗(yàn)評(píng)估統(tǒng)計(jì)學(xué)顯著性。使用StatXact-9(計(jì)算的權(quán)重:平方差,得分:相等間隔)實(shí)施計(jì)算。所有p值是單側(cè)的(右尾的),其指示隨機(jī)κ相關(guān)性測(cè)量大于實(shí)際觀察的概率。
蛋白質(zhì)結(jié)構(gòu)建模
初始結(jié)構(gòu)取自絲氨酸/蘇氨酸蛋白激酶chk2的晶體結(jié)構(gòu)。(PDB碼3i6u,在3.0A解析)。結(jié)晶學(xué)單元含有二聚體蛋白質(zhì)(鏈A和B)。晶體構(gòu)建體包含殘基Thr89至Glu501。使用程序Modellerhas進(jìn)行殘基的質(zhì)子化,所述程序Modellerhas已經(jīng)用于完成少數(shù)的缺少環(huán)并且擴(kuò)展激酶的C末端區(qū)域到Leu543,以包括核定位信號(hào)基序。使用PDB2PQR進(jìn)行殘基的質(zhì)子化。使用AMBER 12包中的前室(antechamber)和LEaP模塊建立MD模擬。該系統(tǒng)在截短的八面體TIP3P水盒中溶劑化并用鈉離子中和。使用Amber ff99SB全原子力場(chǎng)的最小化和MD模擬用Amber12包的Sander模塊,使用GPU加速版本的程序進(jìn)行。如前所述,遵循多步方案。提取50ns的構(gòu)象,并假定沿著軌跡,激酶和特別是C末端尾已經(jīng)采取松弛狀態(tài)。已經(jīng)使用PyMOL可視化和生成圖形。