本發(fā)明屬于藥物研究,具體涉及一種基于對比知識增強的藥物靶點關(guān)系預(yù)測方法。
背景技術(shù):
1、目前,二部圖學(xué)習(xí)在藥物發(fā)現(xiàn)領(lǐng)域的研究主要側(cè)重于利用圖神經(jīng)網(wǎng)絡(luò)(gnn)將藥物分子和靶點編碼為低維向量表示。然而,基于gnn的方法通常使用拉普拉斯矩陣對所有節(jié)點進行平均聚合,未能充分利用注意力感知矩陣來區(qū)分藥物分子和靶點之間的重要性差異,導(dǎo)致節(jié)點嵌入不夠準確,影響了藥物發(fā)現(xiàn)模型的性能。雖然基于自適應(yīng)訓(xùn)練的注意權(quán)重機制可以學(xué)習(xí)藥物分子和靶點之間的交互,但其計算成本較高且不夠直觀易懂。
2、為了解決這一挑戰(zhàn),研究人員將知識圖譜(kg)融入藥物分子和靶點的綜合信息網(wǎng)絡(luò)中,以不同類型的實體增強節(jié)點的語義信息,構(gòu)建了知識感知圖學(xué)習(xí)。dkn通過深度知識感知網(wǎng)絡(luò)將kg嵌入集成到節(jié)點中,cao等共同學(xué)習(xí)推薦和知識圖譜補全模型。此外,一些基于路徑的模型從kg中提取語義有意義的元路徑,以增強節(jié)點的語義信息。kprn通過知識感知路徑遞歸網(wǎng)絡(luò)生成路徑表示,以增強節(jié)點語義信息。最近的研究主要集中利用gnn捕獲kg中的高階關(guān)系。kgat學(xué)習(xí)kg中的高階連接,以增強推薦系統(tǒng)中節(jié)點的信息。smiles通過利用多模態(tài)知識圖來增強節(jié)點表示,而csrec通過將常識作為補充kg來增強節(jié)點語義信息。為了有效地進行藥物發(fā)現(xiàn),kge_nfm將kg納入其中,用于學(xué)習(xí)kg中各種實體的表示,并通過神經(jīng)分解機整合多模態(tài)信息,而kge-unit采用kg和多任務(wù)學(xué)習(xí)來增強節(jié)點信息,以同時預(yù)測藥物-靶標相互作用。最近,kg-diverse對kg中的節(jié)點嵌入進行編碼,以學(xué)習(xí)多樣性感知表示,增強節(jié)點語義信息。然而,實際中的知識圖譜(kg)常常受到噪聲和稀疏性的影響,導(dǎo)致節(jié)點(藥物分子和靶點)和實體(非節(jié)點)之間的連接與藥物發(fā)現(xiàn)任務(wù)無關(guān),降低了模型的預(yù)測性能。
3、最近,一些研究者采用對比學(xué)習(xí)(contrast?learning,cl)來增強知識感知圖學(xué)習(xí)。kdar通過對齊對比機制學(xué)習(xí)二部圖來對齊知識圖中的屬性,mkgcl采用混合曲率知識增強圖對比學(xué)習(xí)來學(xué)習(xí)二部圖。盡管對比學(xué)習(xí)(cl)可以改善知識感知圖學(xué)習(xí)并應(yīng)對數(shù)據(jù)稀疏性問題,但目前的方法往往忽視了大量無關(guān)信息。
4、綜上,大多數(shù)現(xiàn)有的方法忽略了kg中大量的不相關(guān)信息,這可能對特定的下游任務(wù)產(chǎn)生有害影響。近年來,擴散模型在魯棒圖數(shù)據(jù)生成方面取得了突出的成績。diffkg通過擴散模型生成了一個魯棒知識圖,以增強節(jié)點的語義信息。然而,現(xiàn)有的大多數(shù)方法都不能保證生成的kg總能對強任務(wù)相關(guān)的節(jié)點知識帶來好處。
技術(shù)實現(xiàn)思路
1、為了解決上述問題,本發(fā)明提出了一種基于對比知識增強的藥物靶點關(guān)系預(yù)測方法,這種方法能夠確保生成的知識圖對藥物發(fā)現(xiàn)任務(wù)高度相關(guān)的節(jié)點知識具有積極影響。
2、本發(fā)明提供的具體技術(shù)方案如下:
3、本發(fā)明提供一種基于對比知識增強的藥物靶點關(guān)系預(yù)測方法,包括以下步驟:
4、將藥物知識圖譜中不同類型的實體聚合到二部圖中的節(jié)點中,生成具有知識感知的二部圖;采用注意感知機制將具有知識感知的二部圖中的節(jié)點進行注意感知和知識感知的節(jié)點特征聚合,獲得主視圖;
5、利用擴散模型在擴散階段添加噪聲以破壞原始的藥物知識圖譜中節(jié)點與實體之間的關(guān)系,在反向過程中從純高斯噪聲中恢復(fù)原始關(guān)系,迭代識別節(jié)點和實體之間的真實關(guān)系,利用恢復(fù)的關(guān)系重構(gòu)任務(wù)相關(guān)子圖;
6、采用重構(gòu)的任務(wù)相關(guān)子圖修改原始的藥物知識圖譜的結(jié)構(gòu),以重構(gòu)與藥物發(fā)現(xiàn)任務(wù)高度相關(guān)的知識圖譜;將重構(gòu)的知識圖譜中不同類型的實體聚合到原始的二部圖的節(jié)點中,生成具有知識感知的對比視圖;利用注意感知機制對具有知識感知的對比視圖中的節(jié)點進行注意感知和知識感知的節(jié)點特征聚合,得到bgcl-kde模型;
7、比較主視圖與bgcl-kde模型的特征表示,得到對比損失函數(shù);利用經(jīng)優(yōu)化后的對比損失函數(shù)更新bgcl-kde模型的參數(shù),利用更新后的bgcl-kde模型對藥物靶點關(guān)系進行預(yù)測。
8、作為本發(fā)明的一個優(yōu)選實施例,藥物知識圖譜與重構(gòu)的知識圖譜中不同類型的實體與二部圖中節(jié)點的聚合均是采用關(guān)系感知的知識嵌入層進行的。
9、作為本發(fā)明的一個優(yōu)選實施例,注意感知和知識感知的節(jié)點特征聚合的方法是:
10、將具有知識感知的二部圖或具有知識感知的對比視圖中的節(jié)點嵌入到d維向量中,構(gòu)建得到去除非線性激活函數(shù)和特征轉(zhuǎn)換矩陣的圖嵌入傳播層,再利用多個所述圖嵌入傳播層來聚合局部鄰居信息,以實現(xiàn)注意感知和知識感知的節(jié)點特征聚合。
11、作為本發(fā)明的一個優(yōu)選實施例,藥物知識圖譜中不同類型的實體為藥物分子、靶點和疾病。
12、作為本發(fā)明的一個優(yōu)選實施例,所述二部圖中的節(jié)點為藥物分子和靶點。
13、作為本發(fā)明的一個優(yōu)選實施例,采用重構(gòu)的任務(wù)相關(guān)子圖修改藥物知識圖譜的結(jié)構(gòu)的方法是:
14、選擇重構(gòu)的任務(wù)相關(guān)子圖中節(jié)點與實體之間與任務(wù)高度相關(guān)的關(guān)系來調(diào)整知識圖譜的結(jié)構(gòu),以保持重構(gòu)知識圖譜的信息結(jié)構(gòu)。
15、作為本發(fā)明的一個優(yōu)選實施例,對比損失函數(shù)是將主視圖和bgcl-kde模型映射到特征空間,比較主視圖和bgcl-kde模型的特征表示后得到。
16、作為本發(fā)明的一個優(yōu)選實施例,優(yōu)化對比損失函數(shù)是按照以下步驟進行:從測試集中選擇正樣本和負樣本,比較正樣本對的預(yù)測得分與負樣本對的預(yù)測得分之間的差異,得到主任務(wù)損失函數(shù),利用所述主任務(wù)損失函數(shù)優(yōu)化對比損失函數(shù),得到總損失函數(shù);其中,正樣本為同一節(jié)點在主視圖和bgcl-kde模型中的表示,負樣本為節(jié)點主視圖表示和bgcl-kde模型的全圖嵌入之間的差異;
17、更新bgcl-kde模型的參數(shù)的方法是:利用獲得的總損失函數(shù)并通過反向傳播計算參數(shù)的梯度來更新模型的參數(shù)。
18、作為本發(fā)明的一個優(yōu)選實施例,利用更新后的bgcl-kde模型對藥物靶點關(guān)系進行預(yù)測是按照以下步驟進行:將藥物和靶點的數(shù)據(jù)輸入到更新后的bgcl-kde模型中,按照對比視圖的生成順序得到藥物嵌入向量與靶點的嵌入向量,通過將藥物嵌入向量乘以靶點嵌入向量的轉(zhuǎn)置,得到藥物與靶點之間作用關(guān)系的預(yù)測結(jié)果。
19、作為本發(fā)明的一個優(yōu)選實施例,利用具有注意感知機制的圖嵌入層得到藥物嵌入向量與靶點嵌入向量。
20、本發(fā)明結(jié)合圖神經(jīng)網(wǎng)絡(luò)、知識圖譜、對比學(xué)習(xí)和擴散模型,能夠有效提高藥物發(fā)現(xiàn)領(lǐng)域的二部圖學(xué)習(xí)性能和魯棒性。通過引入注意感知矩陣和知識感知的對比視圖,能夠更好地區(qū)分不同藥物分子或靶點之間的重要性差異,生成更加準確的特征表示,提高藥物發(fā)現(xiàn)模型的可解釋性和預(yù)測性能。
21、本發(fā)明提出了一種基于對比知識增強的藥物靶點關(guān)系預(yù)測方法,通常應(yīng)用于各種網(wǎng)絡(luò)預(yù)測任務(wù),包括藥物發(fā)現(xiàn)、信息檢索和推薦等領(lǐng)域。本發(fā)明提供的技術(shù)方案主要包括以下幾點:
22、(1)本發(fā)明提出了一種有效的二部圖學(xué)習(xí)對比學(xué)習(xí)架構(gòu)bgcl-kde,該架構(gòu)引入了一個注意感知機制來學(xué)習(xí)節(jié)點之間的重要性,實現(xiàn)節(jié)點特征的聚合。這種架構(gòu)能夠產(chǎn)生具有注意感知和知識感知的節(jié)點特征,充分利用知識圖譜中有益信息,避免對藥物發(fā)現(xiàn)任務(wù)造成有害影響,從而有效地學(xué)習(xí)藥物與靶點之間的關(guān)系。
23、(2)本發(fā)明在bgcl-kde模型構(gòu)建過程中,設(shè)計了一個引導(dǎo)擴散模型,用于生成知識感知的對比視圖。該模型利用原始知識圖譜的節(jié)點和實體嵌入來引導(dǎo)生成任務(wù)高度相關(guān)節(jié)點,增強節(jié)點的語義信息,保證生成的知識圖譜對關(guān)鍵藥物或靶標知識帶來好處,有效處理異常藥物或靶標的信息,提升藥物和靶標表示學(xué)習(xí)的質(zhì)量。本發(fā)明提供的預(yù)測方法能夠提高對藥物與蛋白質(zhì)化學(xué)相互作用等任務(wù)的預(yù)測準確性。