欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種代謝物-疾病關(guān)聯(lián)預(yù)測(cè)方法及系統(tǒng)

文檔序號(hào):40522803發(fā)布日期:2024-12-31 13:32閱讀:11來源:國知局
一種代謝物-疾病關(guān)聯(lián)預(yù)測(cè)方法及系統(tǒng)

本發(fā)明涉及生物信息學(xué),特別是涉及基于非負(fù)矩陣分解和zinb圖自動(dòng)編碼器的代謝物-疾病關(guān)聯(lián)預(yù)測(cè)方法及系統(tǒng)。


背景技術(shù):

1、疾病的產(chǎn)生和發(fā)展通常與體內(nèi)代謝物的異常含量有關(guān)。這些代謝物包括各種小分子化合物,如氨基酸、糖類、脂質(zhì)等,它們?cè)谏矬w內(nèi)的代謝途徑中扮演著關(guān)鍵角色。傳統(tǒng)的生物實(shí)驗(yàn)方法需要大量的人力進(jìn)行重復(fù)試驗(yàn)來研究代謝物與疾病之間的關(guān)系,這種方法不僅耗時(shí)耗力,而且效率低下。因此,開發(fā)高效的計(jì)算方法來預(yù)測(cè)代謝物與疾病之間的關(guān)聯(lián)成為了研究的熱點(diǎn)。

2、目前最新的解決方法是采用一種基于深度學(xué)習(xí)的方法,稱為mda-aenmf(predicting?metabolite–disease?associations?based?on?auto-encoder?and?non-negative?matrix?factorization,基于自動(dòng)編碼器和非負(fù)矩陣分解的代謝物-疾病關(guān)聯(lián)預(yù)測(cè)模型)。該方法結(jié)合了自動(dòng)編碼器(autoencoder)、圖自動(dòng)編碼器(gae)和非負(fù)矩陣分解(nmf)三種技術(shù)來提取代謝物和疾病的特征。自動(dòng)編碼器用于學(xué)習(xí)數(shù)據(jù)的低維表示,圖自動(dòng)編碼器利用圖結(jié)構(gòu)信息來進(jìn)一步提取特征,而非負(fù)矩陣分解則幫助保持?jǐn)?shù)據(jù)中的非負(fù)約束。最終,使用多層感知機(jī)(mlp)分類器來進(jìn)行代謝物與疾病關(guān)聯(lián)的預(yù)測(cè)。

3、盡管現(xiàn)有的自動(dòng)編碼器方法能夠在一定程度上提取代謝物和疾病的特征,但它們通常只關(guān)注于對(duì)輸入信息的直接重構(gòu),而忽略了輸入特征本身的特點(diǎn)。例如,輸入到編碼器的特征中可能存在大量零值并且呈離散分布,以及這些特征的方差可能小于均值等特性。這些特點(diǎn)對(duì)于最終提取的特征具有重要影響,但是在目前的自動(dòng)編碼器框架中往往沒有得到足夠的關(guān)注。這種忽視可能導(dǎo)致模型無法充分捕捉到數(shù)據(jù)的真實(shí)結(jié)構(gòu)和模式,從而影響預(yù)測(cè)的準(zhǔn)確性和可靠性。


技術(shù)實(shí)現(xiàn)思路

1、有鑒于此,本發(fā)明提供了一種代謝物-疾病關(guān)聯(lián)預(yù)測(cè)方法及系統(tǒng),基于非負(fù)矩陣分解和zinb圖自動(dòng)編碼器進(jìn)行代謝物-疾病關(guān)聯(lián)預(yù)測(cè),以充分捕捉到數(shù)據(jù)的真實(shí)結(jié)構(gòu)和模式,提高預(yù)測(cè)的準(zhǔn)確性和可靠性。

2、為此,本發(fā)明提供了以下技術(shù)方案:

3、本發(fā)明提供了一種基于非負(fù)矩陣分解和zinb圖自動(dòng)編碼器的代謝物-疾病關(guān)聯(lián)預(yù)測(cè)方法,包括:

4、獲取疾病綜合相似性和代謝物綜合相似性;

5、構(gòu)建基于非負(fù)矩陣分解和零膨脹負(fù)二項(xiàng)分布zinb圖自動(dòng)編碼器的代謝物-疾病關(guān)聯(lián)預(yù)測(cè)模型;所述模型包括:非負(fù)矩陣分解nmf模塊、基于zinb的圖自動(dòng)編碼器和雙線性解碼器;所述非負(fù)矩陣分解nmf模塊用于將代謝物-疾病關(guān)聯(lián)矩陣分解為兩個(gè)低秩的矩陣,得到疾病和代謝物低維特征;所述基于zinb的圖自動(dòng)編碼器包括:圖卷積神經(jīng)網(wǎng)絡(luò)gcn構(gòu)成的編碼器與zinb解碼器,gcn對(duì)代謝物綜合相似性矩陣、疾病綜合相似性矩陣和代謝物-疾病關(guān)聯(lián)矩陣進(jìn)行編碼,經(jīng)過gcn編碼的特征輸入到zinb解碼器中重建出網(wǎng)絡(luò)輸出參數(shù),并根據(jù)所述網(wǎng)絡(luò)輸出參數(shù)進(jìn)行不斷迭代優(yōu)化,優(yōu)化完成后,將gcn最終的輸出作為疾病和代謝物包含圖結(jié)構(gòu)和數(shù)據(jù)特點(diǎn)的特征;所述雙線性解碼器基于所述疾病和代謝物低維特征、所述疾病和代謝物包含圖結(jié)構(gòu)和數(shù)據(jù)特點(diǎn)的特征進(jìn)行預(yù)測(cè);

6、將代謝物-疾病關(guān)聯(lián)矩陣、疾病綜合相似性和代謝物綜合相似性輸入所述代謝物-疾病關(guān)聯(lián)預(yù)測(cè)模型,得到代謝物和疾病有關(guān)聯(lián)或無關(guān)聯(lián)的預(yù)測(cè)結(jié)果。

7、進(jìn)一步地,所述疾病綜合相似性由疾病語義相似性、疾病高斯核相似性和基于信息熵的疾病相似性整合而成;

8、所述代謝物綜合相似性由代謝物結(jié)構(gòu)相似性、代謝物高斯核相似性和基于信息熵的代謝物相似性整合而成。

9、進(jìn)一步地,計(jì)算疾病語義相似性,包括:利用醫(yī)學(xué)主題詞構(gòu)建出有向無環(huán)圖作為疾病的描述符,從中計(jì)算出疾病的語義相似性;

10、計(jì)算疾病高斯核相似性,包括:將疾病相關(guān)向量輸入至高斯核函數(shù),得到疾病高斯核相似性;

11、計(jì)算基于信息熵的疾病相似性,包括:利用信息熵與代謝物和疾病之間的共同信息,得到基于信息熵的疾病相似性;

12、計(jì)算代謝物結(jié)構(gòu)相似性,包括:獲取描述每種代謝物化學(xué)性質(zhì)的向量,再根據(jù)所述向量計(jì)算得到代謝物的結(jié)構(gòu)相似性;

13、計(jì)算代謝物高斯核相似性,包括:將代謝物相關(guān)向量輸入至高斯核函數(shù),得到代謝物高斯核相似性;

14、計(jì)算基于信息熵的代謝物相似性,包括:利用信息熵與代謝物和疾病之間的共同信息,得到基于信息熵的代謝物相似性。

15、進(jìn)一步地,所述疾病綜合相似性由疾病語義相似性、疾病高斯核相似性和基于信息熵的疾病相似性整合而成,包括:

16、將疾病語義相似性、疾病高斯核相似性和基于信息熵的疾病相似性進(jìn)行歸一化;

17、采用k最近鄰算法分別計(jì)算三種疾病相似性矩陣中疾病之間的局部親和力,保留前預(yù)設(shè)百分比的局部親和力,其余的置為0;

18、不斷迭代更新三種疾病相似性直至達(dá)到終止條件,在迭代完成后將三種疾病相似性相加取平均,并把相加取平均后的矩陣與其轉(zhuǎn)置相加再取平均后作為疾病的綜合相似性;

19、所述代謝物綜合相似性由代謝物結(jié)構(gòu)相似性、代謝物高斯核相似性和基于信息熵的代謝物相似性整合而成,包括:

20、將代謝物結(jié)構(gòu)相似性、代謝物高斯核相似性和基于信息熵的代謝物相似性進(jìn)行歸一化;

21、采用k最近鄰算法分別計(jì)算三種代謝物相似性矩陣中代謝物之間的局部親和力,保留前預(yù)設(shè)百分比的局部親和力,其余的置為0;

22、不斷迭代更新三種代謝物相似性直至達(dá)到終止條件,在迭代完成后將三種代謝物相似性相加取平均,并把相加取平均后的矩陣與其轉(zhuǎn)置相加再取平均后作為代謝物的綜合相似性。

23、進(jìn)一步地,還包括:測(cè)試所述模型。

24、進(jìn)一步地,測(cè)試所述模型,包括:

25、構(gòu)建去除非負(fù)矩陣分解模塊、替換非負(fù)矩陣分解、去除zinb解碼器和將zinb解碼器替換為常規(guī)圖自動(dòng)編碼器的模型變體,測(cè)試不同模塊對(duì)模型整體結(jié)果的重要性。

26、進(jìn)一步地,在預(yù)測(cè)之前,還包括:采用1:1的抽樣方法,隨機(jī)抽取與正樣本數(shù)量相同的負(fù)樣本。

27、本發(fā)明還提供了一種基于非負(fù)矩陣分解和zinb圖自動(dòng)編碼器的代謝物-疾病關(guān)聯(lián)預(yù)測(cè)系統(tǒng),包括:

28、相似性獲取模塊,用于獲取疾病綜合相似性和代謝物綜合相似性;

29、模型構(gòu)建模塊,用于構(gòu)建基于非負(fù)矩陣分解和零膨脹負(fù)二項(xiàng)分布zinb圖自動(dòng)編碼器的代謝物-疾病關(guān)聯(lián)預(yù)測(cè)模型;所述模型包括:非負(fù)矩陣分解nmf模塊、基于zinb的圖自動(dòng)編碼器和雙線性解碼器;所述非負(fù)矩陣分解nmf模塊用于將代謝物-疾病關(guān)聯(lián)矩陣分解為兩個(gè)低秩的矩陣,得到疾病和代謝物低維特征;所述基于zinb的圖自動(dòng)編碼器包括:圖卷積神經(jīng)網(wǎng)絡(luò)gcn構(gòu)成的編碼器與zinb解碼器,gcn對(duì)代謝物綜合相似性矩陣、疾病綜合相似性矩陣和代謝物-疾病關(guān)聯(lián)矩陣進(jìn)行編碼,經(jīng)過gcn編碼的特征輸入到zinb解碼器中重建出網(wǎng)絡(luò)輸出參數(shù),并根據(jù)所述網(wǎng)絡(luò)輸出參數(shù)進(jìn)行不斷迭代優(yōu)化,優(yōu)化完成后,將gcn最終的輸出作為疾病和代謝物包含圖結(jié)構(gòu)和數(shù)據(jù)特點(diǎn)的特征;所述雙線性解碼器基于所述疾病和代謝物低維特征、所述疾病和代謝物包含圖結(jié)構(gòu)和數(shù)據(jù)特點(diǎn)的特征進(jìn)行預(yù)測(cè);

30、預(yù)測(cè)模塊,用于將代謝物-疾病關(guān)聯(lián)矩陣、疾病綜合相似性和代謝物綜合相似性輸入所述代謝物-疾病關(guān)聯(lián)預(yù)測(cè)模型,得到代謝物和疾病有關(guān)聯(lián)或無關(guān)聯(lián)的預(yù)測(cè)結(jié)果。

31、本發(fā)明的優(yōu)點(diǎn)和積極效果:

32、本發(fā)明中,首先,通過整合代謝物和疾病的多種相似性,分別構(gòu)建了代謝物綜合相似性和疾病綜合相似性網(wǎng)絡(luò),為后續(xù)的特征提取打下了堅(jiān)實(shí)的基礎(chǔ)。其次,非負(fù)矩陣分解和基于zinb(零膨脹負(fù)二項(xiàng)分布)的圖自動(dòng)編碼器被用于特征提取,這使得模型能夠有效處理特征的離散分布、大量零值以及方差小于均值的情況。此外,將提取到的代謝物和疾病特征拼接后輸入到雙線性解碼器中,進(jìn)一步提高了模型在學(xué)習(xí)特征交互方面的性能,從而提升了代謝物-疾病關(guān)聯(lián)預(yù)測(cè)的精準(zhǔn)度。與常見的深度學(xué)習(xí)方法相比,本發(fā)明的zinb解碼器的引入,充分考慮了數(shù)據(jù)特性,為提高預(yù)測(cè)精準(zhǔn)度提供了有力支持。

33、綜上所述,本發(fā)明在提高代謝物-疾病關(guān)聯(lián)預(yù)測(cè)精準(zhǔn)度方面具有顯著優(yōu)勢(shì),對(duì)于實(shí)際疾病的發(fā)現(xiàn)、判斷疾病發(fā)展階段以及后續(xù)治療具有重要價(jià)值,有望推動(dòng)相關(guān)領(lǐng)域的研究和應(yīng)用發(fā)展。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
济阳县| 蒙自县| 龙泉市| 拉孜县| 大邑县| 承德县| 保靖县| 鞍山市| 鄄城县| 泸定县| 潼南县| 乐山市| 抚顺市| 武威市| 霍山县| 牡丹江市| 赤水市| 南开区| 许昌市| 从江县| SHOW| 防城港市| 屏东县| 乐亭县| 民乐县| 芦山县| 花莲县| 广宁县| 绥中县| 辉县市| 太和县| 绥德县| 吉安县| 武隆县| 新河县| 大庆市| 陇南市| 桐庐县| 吴桥县| 顺义区| 剑川县|