欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于深度學(xué)習(xí)可用于癌癥預(yù)測和致癌基因歸因分析的生物網(wǎng)絡(luò)方法

文檔序號:40429483發(fā)布日期:2024-12-24 15:03閱讀:17來源:國知局
一種基于深度學(xué)習(xí)可用于癌癥預(yù)測和致癌基因歸因分析的生物網(wǎng)絡(luò)方法

本發(fā)明屬于計(jì)算機(jī)和醫(yī)學(xué)結(jié)合的醫(yī)工交叉領(lǐng)域,主要涉及人工智能深度學(xué)習(xí),癌癥預(yù)測與基因歸因分析。


背景技術(shù):

1、傳統(tǒng)領(lǐng)域:醫(yī)學(xué)中常使用高通量測序技術(shù)大量獲取轉(zhuǎn)錄組數(shù)據(jù),這些數(shù)據(jù)可以通過差異表達(dá)分析、聚類分析等方法進(jìn)行處理,以尋找在腫瘤組織和正常組織之間有顯著差異的基因,這些基因便被認(rèn)為是參與腫瘤發(fā)生的潛在因子,接下來,通過對這些差異表達(dá)基因的功能注釋和通路分析,可以進(jìn)一步了解潛在基因的生物學(xué)功能和相關(guān)的信號通路。通過基因網(wǎng)絡(luò)分析、基因互作網(wǎng)絡(luò)分析等方法,探尋這些基因之間的相互作用關(guān)系,從而發(fā)現(xiàn)更深層次的生物學(xué)機(jī)制和潛在的治療靶點(diǎn)并且鑒定特定的腫瘤亞型、預(yù)測病人的生存期和治療反應(yīng),以及發(fā)現(xiàn)新的靶點(diǎn)和治療策略。

2、新興技術(shù):近年來人工智能尤其是深度學(xué)習(xí)的興起,醫(yī)療領(lǐng)域也開始逐漸應(yīng)用這些技術(shù)來處理海量的醫(yī)療數(shù)據(jù),這些技術(shù)能利用海量數(shù)據(jù)之間潛在特征關(guān)系,對于醫(yī)療領(lǐng)域的應(yīng)用和研究起到巨大貢獻(xiàn)。已有開發(fā)“可見”的神經(jīng)網(wǎng)絡(luò)來模擬基因相互作用對酵母細(xì)胞生長的影響以及使用基于路徑相關(guān)的稀疏神經(jīng)網(wǎng)絡(luò)來解決多形膠質(zhì)母細(xì)胞瘤患者的預(yù)后情況;alphafold模型通過學(xué)習(xí)大量已知的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù),來預(yù)測未知蛋白質(zhì)的結(jié)構(gòu),其預(yù)測準(zhǔn)確性非常高,甚至能夠預(yù)測出一些迄今為止未解決的蛋白質(zhì)結(jié)構(gòu),該模型的出現(xiàn)在蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域掀起了一股革命,為生物學(xué)、藥物研發(fā)等領(lǐng)域帶來了新的機(jī)遇和挑戰(zhàn)。其高準(zhǔn)確度的預(yù)測結(jié)果不僅可以幫助科學(xué)家更好地理解蛋白質(zhì)的結(jié)構(gòu)和功能,還可以為藥物研發(fā)提供新的思路和方法;另有pnet基于生物數(shù)據(jù)建模,訓(xùn)練,以此預(yù)測前列腺腫瘤的原發(fā)性和轉(zhuǎn)移性,令人驚喜的是,其歸因分析中的結(jié)果不僅服從現(xiàn)實(shí),且發(fā)現(xiàn)新的靶向基因mdm4,并在臨床實(shí)驗(yàn)中獲得證實(shí)。而本發(fā)明提出的方法不僅在前者的基礎(chǔ)上增加知識可訓(xùn)練,獲得更精確的預(yù)測性能的同時(shí)更有利于下游的解釋任務(wù),另外還提出基因嵌入的概念,其中包含著基因先驗(yàn)知識,可以和基因表達(dá)信息一同送入模型增強(qiáng)性能,另外僅基因嵌入信息就可使用數(shù)學(xué)方法探索基因之間的相似性,還有許多值得探索的空間。

3、雖然目前的深度學(xué)習(xí)技術(shù)能夠使生物信號與測量的表型建立強(qiáng)有力的聯(lián)系,但這些方法在識別神經(jīng)網(wǎng)絡(luò)的因果結(jié)構(gòu)方面作用有限,且隨著“ai+醫(yī)療”的應(yīng)用,對相關(guān)學(xué)習(xí)模型的可解釋性以及可視化的要求越來越高,因此開發(fā)新的方法來提高深度學(xué)習(xí)模型的可解釋性和可視化性,以更好地理解這些模型如何作出預(yù)測和決策,并且更好地解釋這些結(jié)果是亟待解決的問題。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目標(biāo)是實(shí)現(xiàn)分子水平的癌癥預(yù)測預(yù)警,推進(jìn)腫瘤早篩早治與精準(zhǔn)診療,以及通過歸因分析發(fā)現(xiàn)潛在的致癌基因,獲得潛在新靶點(diǎn)和新治療策略。

2、本發(fā)明提出的一種基于深度學(xué)習(xí)可用于癌癥預(yù)測和致癌基因歸因分析的生物網(wǎng)絡(luò)方法,通過融入生物知識建模,采用知識可訓(xùn)練方式訓(xùn)練,得到癌癥發(fā)病率預(yù)測結(jié)果與歸因分析結(jié)果,整體流程步驟如圖1所述,所述方法具體包括以下步驟。

3、1、收集數(shù)據(jù):

4、1.1)收集癌癥患者的轉(zhuǎn)錄組測序數(shù)據(jù)和需要分析的患者的轉(zhuǎn)錄測序數(shù)據(jù),通過預(yù)處理將對應(yīng)癌癥患者的轉(zhuǎn)錄組測序數(shù)據(jù)轉(zhuǎn)化為一個(gè)表達(dá)矩陣其中每個(gè)元素表示基因gj在樣本si中的表達(dá)情況,反映患者體內(nèi)真實(shí)的生化反應(yīng)和分子水平;

5、1.2)通路數(shù)據(jù)集分為通路數(shù)據(jù)集和“通路與基因”數(shù)據(jù)集g包括通路節(jié)點(diǎn)集和邊集ε,表示存在從通路到通路的有向邊?;蚣總€(gè)基因gi所屬的通路即表明gi參與了通路的生化反應(yīng);

6、1.3)候選致癌基因集則是一個(gè)基因集合,使用先驗(yàn)知識挑選出來的最有可能致癌的基因集;

7、1.4)基因嵌入信息,使用前置生物知識得到基因在向量空間的表示,前置生物知識可以是基因互作網(wǎng)絡(luò)等事實(shí)性知識,其蘊(yùn)含了豐富的基因信息。

8、2、建立生物模型:

9、2.1)使用表達(dá)矩陣和候選基因表達(dá)集xcandidate取交集,得到僅包含候選基因的表達(dá)矩陣,刪除表達(dá)矩陣中不需要的基因的值;

10、2.2)將通路及其數(shù)據(jù)庫表示為有向圖,找出所有入度為0的節(jié)點(diǎn)作為高階生物過程的表示。創(chuàng)建一個(gè)新的節(jié)點(diǎn)root,將其與所有入度為0的節(jié)點(diǎn)相連。通過廣度優(yōu)先搜索算法從root節(jié)點(diǎn)開始遍歷搜索樹,只保留高度為前n層的節(jié)點(diǎn),并刪除高度超過n的節(jié)點(diǎn)。同時(shí)添加新節(jié)點(diǎn)的形式使得所有葉子節(jié)點(diǎn)都位于第n層。

11、2.3)利用前一步得到的高度為n的搜索樹和基因數(shù)據(jù)集,將候選基因表達(dá)矩陣中的基因與搜索樹的葉子節(jié)點(diǎn)(通路節(jié)點(diǎn))相連。具體而言,依據(jù)顯示關(guān)系將基因節(jié)點(diǎn)和通路節(jié)點(diǎn)連接,這相當(dāng)于在原高度為n的搜索樹的葉子節(jié)點(diǎn)(通路節(jié)點(diǎn))下再添加一層新的節(jié)點(diǎn)(基因節(jié)點(diǎn)),形成高度為n+1的搜索樹。第n+1層為基因節(jié)點(diǎn),從第n層到第2層為通路節(jié)點(diǎn),第1層為虛擬的root節(jié)點(diǎn)。

12、2.4)該模型的架構(gòu)包括:

13、a.高度為n+1的搜索樹作為模型的基礎(chǔ)結(jié)構(gòu);

14、b.在每一層到下一層的數(shù)據(jù)流動中添加mask矩陣,保證數(shù)據(jù)流動方向遵循基因與通路的作用規(guī)則;

15、c.從第n+1層到第3層,每一層添加一個(gè)全連接層和激活函數(shù)y=

16、sigmoid(wtx+b),用于單獨(dú)表示每一層的預(yù)測;

17、d.將全連接層和root節(jié)點(diǎn)的輸出加權(quán)求和,得到最終的預(yù)測結(jié)果;

18、2.5)先將基因表達(dá)矩陣按樣本分類,每個(gè)樣本包含數(shù)千至數(shù)萬個(gè)基因的表達(dá)信息,再將蘊(yùn)含前置知識的基因嵌入信息與蘊(yùn)含基因表達(dá)信息的嵌入相結(jié)合,得到新的樣本,并且分層采樣,將候選基因表達(dá)矩陣按照樣本分為數(shù)量比為8:1:1的訓(xùn)練集、測試集和驗(yàn)證集。

19、2.6)使用adam優(yōu)化器,二分類交叉熵?fù)p失函數(shù),線性遞減學(xué)習(xí)率訓(xùn)練模型,用于下游的癌癥預(yù)測與致癌基因歸因分析。

20、3、歸因分析致癌基因以及癌癥發(fā)病率:

21、3.1)將病人的轉(zhuǎn)錄組測序數(shù)據(jù)x送入模型中,便可計(jì)算得出模型的預(yù)測fw(),即為癌癥發(fā)病率的預(yù)測值。

22、3.2)歸因分析致癌基因包括:

23、a.將病人的轉(zhuǎn)錄組測序數(shù)據(jù)x輸入模型,得到輸出fw();

24、b.將標(biāo)準(zhǔn)參考輸入x0分別輸入模型,得到標(biāo)準(zhǔn)輸出fw(x0);

25、c.計(jì)算兩個(gè)輸出之間的差異值,即fw()-fw(0);

26、d.使用反向傳播算法計(jì)算模型第n+1層每個(gè)神經(jīng)元(基因節(jié)點(diǎn))對于輸出差異值的貢獻(xiàn)度;

27、e.各個(gè)基因?qū)τ陬A(yù)測值的貢獻(xiàn)度,即基因?qū)τ诎┌Y的貢獻(xiàn)度;

28、本發(fā)明的特點(diǎn)及有益效果在于:

29、將生物知識融入深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),一來生物先驗(yàn)知識減少網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)量,二來采用知識可訓(xùn)練提高模型預(yù)測性能,三使用可解釋算法,解釋了基因?qū)τ陬A(yù)測的貢獻(xiàn)度,反推出致癌基因,對于發(fā)現(xiàn)新靶點(diǎn)和新治療策略具有現(xiàn)實(shí)意義。



技術(shù)特征:

1.一種用于癌癥預(yù)測和致癌基因歸因分析的生物網(wǎng)絡(luò)方法,其特征包括以下步驟:

2.根據(jù)權(quán)利要求1所述的用于癌癥預(yù)測和致癌基因歸因分析的生物網(wǎng)絡(luò)方法,其特征在于,所述的收集生物數(shù)據(jù),具體包括:

3.根據(jù)權(quán)利要求1所述的用于癌癥預(yù)測和致癌基因歸因分析的生物網(wǎng)絡(luò)方法,其特征在于,所述的利用生物數(shù)據(jù)建立通用生物模型,具體包括:

4.根據(jù)權(quán)利要求1所述的用于癌癥預(yù)測和致癌基因歸因分析的生物網(wǎng)絡(luò)方法,其特征在于,所述的歸因分析患者癌癥發(fā)病率及致癌基因,具體包括以下步驟:

5.根據(jù)權(quán)利要求2所述的收集生物數(shù)據(jù)步驟,其特征在于,所述的基因嵌入信息,具體包括以下步驟:

6.根據(jù)權(quán)利要求3所述的利用生物數(shù)據(jù)建立通用生物模型步驟,其特征在于,所述的構(gòu)建神經(jīng)網(wǎng)絡(luò)模型,具體包括以下步驟:

7.根據(jù)權(quán)利要求4所述的歸因分析患者癌癥發(fā)病率及致癌基因步驟,其特征在于,所述的可解釋性歸因分析,具體包括以下步驟:


技術(shù)總結(jié)
本發(fā)明提出一種基于深度學(xué)習(xí)可用于癌癥預(yù)測和致癌基因歸因分析的生物網(wǎng)絡(luò)方法。該方法先收集轉(zhuǎn)錄組數(shù)據(jù),潛在致癌基因集,通路數(shù)據(jù)庫,使用上述生物數(shù)據(jù)得到樣本表達(dá)矩陣,通路網(wǎng)絡(luò)和數(shù)據(jù)集;使用樣本表達(dá)矩陣中和通路網(wǎng)絡(luò)構(gòu)建融入生物模型;采用知識可訓(xùn)練的方式訓(xùn)練模型;將病人轉(zhuǎn)錄組數(shù)據(jù)輸入模型得到病人癌癥發(fā)病概率并且可以歸因分析其影響癌癥的致癌基因。此方法涉及醫(yī)工結(jié)合交叉領(lǐng)域,主要應(yīng)用領(lǐng)域?yàn)榘┌Y的早篩預(yù)警,以及歸因分析發(fā)現(xiàn)癌癥潛在新靶點(diǎn)和治療策略。該方法具有以下優(yōu)點(diǎn),其一融入生物知識,稀疏模型計(jì)算量小,訓(xùn)練迭代速度快;其二知識可訓(xùn)練,提高模型預(yù)測性能且助力下游解釋任務(wù);其三可解釋算法解釋模型的決策。

技術(shù)研發(fā)人員:何亮,易升,郭文佳,馬靜
受保護(hù)的技術(shù)使用者:新疆大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2024/12/23
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
儋州市| 江陵县| 大埔区| 宁武县| 新建县| 恩施市| 青岛市| 平罗县| 卫辉市| 玉树县| 定襄县| 桂东县| 吉首市| 嘉善县| 揭东县| 商水县| 秭归县| 太谷县| 甘孜| 色达县| 新丰县| 洛浦县| 蒙城县| 江达县| 获嘉县| 开远市| 历史| 安阳市| 白山市| 庄河市| 北流市| 黄陵县| 南木林县| 鄂尔多斯市| 汝城县| 姚安县| 新化县| 永嘉县| 亳州市| 赤峰市| 武胜县|