一種基于遺傳物質(zhì)特異性的腫瘤細(xì)胞藥物敏感性評(píng)估方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及腫瘤細(xì)胞藥物敏感性檢測(cè)與評(píng)價(jià)技術(shù)領(lǐng)域,具體是一種基于遺傳物質(zhì) 特異性的腫瘤細(xì)胞藥物敏感性評(píng)估方法。
【背景技術(shù)】
[0002] 腫瘤已經(jīng)成為人類的"頭號(hào)殺手",嚴(yán)重威脅著人類的健康,根據(jù)世界衛(wèi)生組織的 報(bào)道,過去10年間全球腫瘤的發(fā)病率和死亡率均增長(zhǎng)了約22%,預(yù)計(jì)到2020年新發(fā)病例將 達(dá)到2000萬,約有1200萬人將死于腫瘤。在我國(guó),近10年來,由于環(huán)境污染惡化,出現(xiàn)了 許多癌癥村、癌癥縣等腫瘤高發(fā)區(qū),腫瘤患者數(shù)量增長(zhǎng)迅速,其死亡率也已居中年人死亡的 首位。如何有效治療癌癥是一項(xiàng)世界性的難題,也是我國(guó)醫(yī)療衛(wèi)生事業(yè)的一項(xiàng)緊迫性課題。
[0003] 化學(xué)療法是腫瘤臨床治療的主要方式之一,當(dāng)前,對(duì)同種類型的腫瘤患者個(gè)體往 往施用相同的化療方案。然而,臨床應(yīng)用表明,不同的腫瘤患者個(gè)體,甚至同一分期的患者, 對(duì)藥物的反應(yīng)或療效顯著不同,有的甚至發(fā)生嚴(yán)重的毒副作用。最新醫(yī)學(xué)研究證實(shí),不同個(gè) 體的腫瘤化療療效不同的根本原因在于其遺傳物質(zhì)的差異性。因此,相對(duì)于現(xiàn)有的理化指 標(biāo)或組織病理學(xué)的方法,如何基于遺傳物質(zhì)的特異性對(duì)腫瘤細(xì)胞的藥物敏感性進(jìn)行評(píng)估成 為一項(xiàng)亟待解決的問題。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的在于提供一種基于遺傳物質(zhì)特異性的腫瘤細(xì)胞藥物敏感性評(píng)估方 法,采用極限學(xué)習(xí)機(jī)識(shí)別與藥物敏感性相關(guān)的腫瘤細(xì)胞基因突變譜特征,通過建?;蛲?變譜與藥物IC50值之間的關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)基于遺傳物質(zhì)特異性的腫瘤細(xì)胞藥物敏感性評(píng) 估。
[0005] 本發(fā)明的技術(shù)方案為:
[0006] -種基于遺傳物質(zhì)特異性的腫瘤細(xì)胞藥物敏感性評(píng)估方法,包括以下步驟:
[0007] (1)按一定比例將腫瘤細(xì)胞樣本集分割為訓(xùn)練樣本子集和測(cè)試樣本子集,所述腫 瘤細(xì)胞樣本集數(shù)據(jù)包括各個(gè)腫瘤細(xì)胞樣本的基因突變譜和藥物IC50值;
[0008] (2)采用訓(xùn)練樣本子集訓(xùn)練并獲得不同參數(shù)條件下的腫瘤細(xì)胞藥物IC50值極限 學(xué)習(xí)機(jī)預(yù)測(cè)模型集合;
[0009] (3)采用測(cè)試樣本子集逐個(gè)測(cè)試所述腫瘤細(xì)胞藥物IC50值極限學(xué)習(xí)機(jī)預(yù)測(cè)模型, 選擇性能最佳的腫瘤細(xì)胞藥物IC50值極限學(xué)習(xí)機(jī)預(yù)測(cè)模型作為腫瘤細(xì)胞藥物敏感性評(píng)估 豐旲型;
[0010] (4)將待測(cè)腫瘤細(xì)胞的基因突變譜輸入所述腫瘤細(xì)胞藥物敏感性評(píng)估模型,計(jì)算 得到所述待測(cè)腫瘤細(xì)胞的藥物IC50值,作為其藥物敏感性評(píng)估值。
[0011] 所述的基于遺傳物質(zhì)特異性的腫瘤細(xì)胞藥物敏感性評(píng)估方法,所述步驟(1)中, 具體按照3:2的比例將腫瘤細(xì)胞樣本集分割為訓(xùn)練樣本子集和測(cè)試樣本子集。
[0012] 所述的基于遺傳物質(zhì)特異性的腫瘤細(xì)胞藥物敏感性評(píng)估方法,所述步驟(2),具體 包括:
[0013] (21)根據(jù)基因突變譜維數(shù)設(shè)置極限學(xué)習(xí)機(jī)隱含層節(jié)點(diǎn)數(shù),所述極限學(xué)習(xí)機(jī)隱含層 節(jié)點(diǎn)數(shù)分為Q種情況:
[0014] Nq= 2p+5q,q = 1,2,…,Q
[0015] 其中,Nq表示極限學(xué)習(xí)機(jī)隱含層節(jié)點(diǎn)數(shù),p表示基因突變譜維數(shù);
[0016] (22)對(duì)每種情況的極限學(xué)習(xí)機(jī)隱含層節(jié)點(diǎn)數(shù),分別執(zhí)行步驟(23)~(26);
[0017] (23)隨機(jī)賦值每個(gè)隱含層節(jié)點(diǎn)的輸入權(quán)重向量以及輸出偏置;
[0018] (24)計(jì)算對(duì)應(yīng)訓(xùn)練樣本數(shù)據(jù)的隱含層輸出矩陣:
[0019]
[0020] 其中,H表示隱含層輸出矩陣,X1表示第i,i = 1,2,…,L個(gè)訓(xùn)練樣本的 基因突變譜,Wk表示第k,k = 1,2,…,Nq個(gè)隱含層節(jié)點(diǎn)的輸入權(quán)重向量,bk表示第 k,k = 1,2,…,Nq個(gè)隱含層節(jié)點(diǎn)的輸出偏置,g(wkXi+bk)表示隱含層節(jié)點(diǎn)激勵(lì)函數(shù),
[0021] (25)采用最小二乘法求解隱含層輸出矩陣的Moore-Penrose廣義逆矩陣;
[0022] (26)計(jì)算隱含層輸出權(quán)重:
[0023] β = H 1T
[0024] 其中,β表示隱含層輸出權(quán)重,H 1表示隱含層輸出矩陣的Moore-Penrose廣義逆 矩陣,T表示所有訓(xùn)練樣本的藥物IC50值標(biāo)簽;
[0025] (27)獲得Q個(gè)腫瘤細(xì)胞藥物IC50值極限學(xué)習(xí)機(jī)預(yù)測(cè)模型:
[0026]
[0027] 其中,Γ(χ)表示基于第q個(gè)預(yù)測(cè)模型得到的腫瘤細(xì)胞藥物IC50值,1?表示第q 個(gè)預(yù)測(cè)模型的第k個(gè)隱含層節(jié)點(diǎn)的輸出權(quán)重,表示第q個(gè)預(yù)測(cè)模型的第k個(gè)隱含層節(jié) 點(diǎn)的輸入權(quán)重,表示第q個(gè)預(yù)測(cè)模型的第k個(gè)隱含層節(jié)點(diǎn)的輸出偏置。
[0028] 所述的基于遺傳物質(zhì)特異性的腫瘤細(xì)胞藥物敏感性評(píng)估方法,所述步驟(3),具體 包括:
[0029] (31)對(duì)測(cè)試樣本子集中的所有測(cè)試樣本,依次采用所獲得的每個(gè)預(yù)測(cè)模型計(jì)算得 到其藥物IC50預(yù)測(cè)值;
[0030] (32)根據(jù)測(cè)試樣本的藥物IC50實(shí)際值和預(yù)測(cè)值,計(jì)算每個(gè)預(yù)測(cè)模型在所有測(cè)試 樣本上的預(yù)測(cè)總誤差:
[0031] (33)選擇預(yù)測(cè)總誤差最小的預(yù)測(cè)模型,將其作為腫瘤細(xì)胞藥物敏感性評(píng)估模型。
[0032] 由上述技術(shù)方案可知,本發(fā)明采用極限學(xué)習(xí)機(jī)來學(xué)習(xí)基因突變譜模式特征與藥物 敏感性關(guān)系模型,然后使用所獲得的模型對(duì)待測(cè)腫瘤細(xì)胞的藥物IC50值進(jìn)行預(yù)測(cè),實(shí)現(xiàn)了 在基因遺傳水平上的腫瘤細(xì)胞藥物敏感性評(píng)估,同時(shí)藥物IC50值的使用能夠避免人工主 觀性影響,使得藥物敏感性判別更加客觀、可靠,采用極限學(xué)習(xí)機(jī)學(xué)習(xí)無需迭代,待調(diào)節(jié)參 數(shù)少且能保證全局最優(yōu),使得腫瘤細(xì)胞藥物敏感性檢測(cè)更加方便快捷、高效實(shí)用。
【附圖說明】
[0033] 圖1是本發(fā)明的方法流程圖;
[0034] 圖2是本發(fā)明中腫瘤細(xì)胞藥物IC50值極限學(xué)習(xí)機(jī)預(yù)測(cè)模型學(xué)習(xí)流程圖;
[0035] 圖3是本發(fā)明中腫瘤細(xì)胞藥物IC50值極限學(xué)習(xí)機(jī)預(yù)測(cè)模型評(píng)估流程圖;
[0036] 圖4是本發(fā)明所獲得的腫瘤細(xì)胞藥物敏感性極限學(xué)習(xí)機(jī)網(wǎng)絡(luò)結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0037] 下面結(jié)合附圖和具體實(shí)施例進(jìn)一步說明本發(fā)明。
[0038] 如圖1所示,一種基于遺傳物質(zhì)特異性的腫瘤細(xì)胞藥物敏感性評(píng)估方法,包括以 下步驟:
[0039] S1、按一定比例(如3:2)將腫瘤細(xì)胞樣本集分割為訓(xùn)練樣本子集和測(cè)試樣本子 集,其中,訓(xùn)練樣本子集用于學(xué)習(xí)基因突變譜與藥物IC50值指標(biāo)間的關(guān)系模型,測(cè)試樣本 子集用于選擇最佳腫瘤細(xì)胞藥物IC50值極限學(xué)習(xí)機(jī)預(yù)測(cè)模型,作為腫瘤細(xì)胞藥物敏感性 評(píng)估模型。
[0040] 訓(xùn)練樣本子集數(shù)據(jù)可以表示為:
[0041] Xtr= {x i, tilxje Rp, R, i = I, ---L}
[0042] 其中,X1表示第i個(gè)訓(xùn)練樣本的基因突變譜,P表示基因突變譜維數(shù),t i表示第i 個(gè)訓(xùn)練樣本的藥物IC50值,L表示訓(xùn)練樣本總數(shù)。
[0043] 測(cè)試樣本子集數(shù)據(jù)可以表示為:
[0044] Xte= {x .j,tjlxje Rp,tjG R,j = 1,...M}
[0045] 其中,Xj表示第j個(gè)測(cè)試樣本的基因突變譜,t j表示第j個(gè)測(cè)試樣本的藥物IC50 值,M表示測(cè)試樣本總數(shù)。
[0046] S2、采用訓(xùn)練樣本子集訓(xùn)練并獲得不同參數(shù)條件下的腫瘤細(xì)胞藥物IC50值極限 學(xué)習(xí)機(jī)預(yù)測(cè)模型集合,作為候選腫