本發(fā)明涉及一種生物醫(yī)學(xué)信息,具體是一種基于多視圖圖池化的自閉癥識別方法。
背景技術(shù):
1、自閉癥是一種以社會溝通和互動障礙、感覺異常、重復(fù)行為和不同程度的智力障礙為特征的主要發(fā)育障礙,通常與其他疾病共存。自閉癥的全球患病率略低于1%,但在高收入國家可能要高得多。大多數(shù)自閉癥患者不能獨(dú)立生活,這也是家庭和社會的重大經(jīng)濟(jì)負(fù)擔(dān)。然而,自閉癥的診斷在很大程度上是基于簡單的癥狀觀察和臨床醫(yī)生的經(jīng)驗,缺乏可靠的生物標(biāo)志物。了解其潛在的機(jī)制和開發(fā)有效的治療方法仍需要大量的工作。
2、靜息狀態(tài)功能磁共振成像(resting-state?fmri,rs-fmri)主要反映血氧水平的變化,它可以捕捉大腦區(qū)域之間的相互作用,有望揭示人腦中的異常連接。許多方法傾向于在原始圖像中提取時間序列信號后構(gòu)建功能連通性網(wǎng)絡(luò)。一般來說,功能連接網(wǎng)絡(luò)是使用諸如皮爾遜相關(guān)系數(shù)或偏相關(guān)系數(shù)之類的連接度量來構(gòu)建的,以捕獲每兩個區(qū)域之間的相互作用。但是,功能連接網(wǎng)絡(luò)容易產(chǎn)生密集連接的大腦網(wǎng)絡(luò),導(dǎo)致過擬合問題,增加計算復(fù)雜度。此外,大多數(shù)深度學(xué)習(xí)模型更多地關(guān)注網(wǎng)格結(jié)構(gòu)數(shù)據(jù),而腦網(wǎng)絡(luò)數(shù)據(jù)不遵循區(qū)域的空間分布。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于多視圖圖池化的自閉癥識別方法,以解決上述背景技術(shù)中提出的問題。
2、為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
3、一種基于多視圖圖池化的自閉癥識別方法,包括局部特征提取和全局特征提取,局部特征指每個受試者的腦區(qū)特征,具體步驟如下:針對局部特征提取,構(gòu)造每個受試者的個體腦圖,根據(jù)圖池化策略來提取大腦特征,從結(jié)構(gòu)和特征的多個角度對節(jié)點(diǎn)進(jìn)行排序,篩選得到稀疏特征;針對全局特征提取,將每個主體的特征總結(jié)成一行向量,獲得粗化圖的整體圖級表示,利用多層感知器自動學(xué)習(xí)功能核磁共振影像數(shù)據(jù)的統(tǒng)計特征,得到高階的抽象特征表示,圖神經(jīng)網(wǎng)絡(luò)模型進(jìn)一步融合成像數(shù)據(jù)和非成像數(shù)據(jù),以各主體的高階抽象特征作為節(jié)點(diǎn)特征,以人口統(tǒng)計信息的相似度作為邊緣權(quán)重,構(gòu)造人口圖,對圖神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,輸出自閉癥識別結(jié)果。
4、進(jìn)一步的,針對局部特征提取,具體包括以下步驟:
5、構(gòu)造單個受試者的個體腦圖,通過哈佛-牛津大腦分區(qū)圖譜提取出的腦區(qū)特征包括來自每個半球的55個大腦區(qū)域,添加全局平均時間序列,最終構(gòu)造的的個體腦圖中包含111個節(jié)點(diǎn),將左腦區(qū)域的節(jié)點(diǎn)連接到右側(cè),將右腦區(qū)域的節(jié)點(diǎn)連接到左側(cè),構(gòu)建每個受試者的個體腦圖;
6、分別從三種視圖層面提取局部腦區(qū)特征,通過利用上下文圖信息對多視圖中的腦區(qū)節(jié)點(diǎn)進(jìn)行排序,魯棒性排序結(jié)果有利于提取不同受試者的有效腦區(qū)特征;對于結(jié)構(gòu)視圖,學(xué)習(xí)圖結(jié)構(gòu)的表示來源于圖的拓?fù)浣Y(jié)構(gòu),選取度中心性作為結(jié)構(gòu)視圖分?jǐn)?shù)生成xs,其公式如下所示:
7、xs=σ(α*log(dl+ε)+β);
8、其中,式中dl表示第l層的度矩陣,ε是一個小的正常數(shù)以避免對0進(jìn)行對數(shù)運(yùn)算,通過一個激活函數(shù)σ(·)將這些值映射到[0,1]范圍,以與其他視圖中的尺度匹配;α和β用于控制度值的縮放和移動;
9、對于特征視圖,大腦區(qū)域的時間序列作為節(jié)點(diǎn)表示,使用多層感知器(mlp)將節(jié)點(diǎn)的特征轉(zhuǎn)換成高階抽象特征作為分?jǐn)?shù)生成器xf,其公式如下所示:
10、xf=σ(mlp(hl));
11、其中hl表示第l層受試者的節(jié)點(diǎn)表示矩陣,mlp(·)也稱為全連接層,即層與層之間的神經(jīng)元都是相互連接的;σ函數(shù)通過mlp對得到的特征得分進(jìn)行歸一化;
12、對于結(jié)構(gòu)和特征的組合視圖,利用圖神經(jīng)網(wǎng)絡(luò)將結(jié)構(gòu)信息和特征信息相結(jié)合,提取圖信息,多視圖評分生成器xsf的公式如下:
13、xsf=σ(γ(in-(1-γ)al)-1hl);
14、其中,γ∈(0,1)為傳送(或重啟)概率,in表示單位矩陣,首先通過圖神經(jīng)網(wǎng)絡(luò)將圖結(jié)構(gòu)和節(jié)點(diǎn)特征信息(a和h)映射到[0,1],此外,該值通過冪次迭代逼近,以降低計算復(fù)雜度;
15、綜合多個視圖的分?jǐn)?shù),對以上分?jǐn)?shù)生成器的結(jié)果進(jìn)行加權(quán),表示為:
16、
17、其中x為所有視圖合并得到的最終得分,xc為某一視圖的得分生成器得分,pc為對應(yīng)的權(quán)重,計算公式如下:
18、
19、其中v是由不同的分?jǐn)?shù)xc串聯(lián)起來的,以上視圖中,w和b是視圖c的可學(xué)習(xí)參數(shù),使用softmax函數(shù)對權(quán)重進(jìn)行歸一化;
20、最后,定義節(jié)點(diǎn)選擇器來選擇在top-k中具有顯著性得分的節(jié)點(diǎn),使用所選節(jié)點(diǎn)對原始圖進(jìn)行粗化得到新的個體腦圖,公式如下:
21、
22、al+1=al(idx,idx)
23、其中r為池化率,topk函數(shù)根據(jù)r控制每層保留的節(jié)點(diǎn)數(shù),x)為圖池化后的節(jié)點(diǎn)得分;sigmoid激活函數(shù)用于執(zhí)行節(jié)點(diǎn)分?jǐn)?shù)的非線性變換,hl+1和al+1分別對應(yīng)圖池化后的表示矩陣和鄰接矩陣。
24、更進(jìn)一步的,針對全局特征提取,具體包括以下步驟:
25、將每個主體的特征通過讀出層總結(jié)成一行向量,獲得粗化圖的整體圖級表示,將生成的池化特征輸入到mlp(·)中提取更具判別性的高階特征,公式如下:
26、
27、其中由xmax和xavg拼接得到,xmax取節(jié)點(diǎn)上池化特征的最大值作為圖級特征,xavg取主題節(jié)點(diǎn)特征的平均值作為圖級特征,xi表示第i個腦區(qū)特征,n為池化后得到的節(jié)點(diǎn)/腦區(qū)數(shù);
28、構(gòu)造整體的人群圖,融合影像數(shù)據(jù)和非影像數(shù)據(jù),邊緣權(quán)值定義如下:
29、
30、其中,sim(xi,xj)是影像數(shù)據(jù)的距離,后半部分是非影像數(shù)據(jù)的距離,m代表不同類型的非影像數(shù)據(jù),對于類別數(shù)據(jù),通過kronecker?delta函數(shù)計算出它們的值,而對于數(shù)值數(shù)據(jù),通過設(shè)置閾值來獲得它們的相似度,然后對c′進(jìn)行二值化,得到二值化的連接圖c,人群圖a如下:
31、a=ce?s
32、
33、其中p是表型數(shù)據(jù)通過mlp歸一化到共同潛在空間的投影,sij是受試者i和受試者j調(diào)整后的余弦相似度,a之間的相似性可以通過后續(xù)圖神經(jīng)網(wǎng)絡(luò)模型參數(shù)以及最小化損失函數(shù)進(jìn)行優(yōu)化;
34、將上述得到的影像數(shù)據(jù)和非影像數(shù)據(jù)輸入到圖神經(jīng)網(wǎng)絡(luò)中,提取有效的判別特征,圖神經(jīng)網(wǎng)絡(luò)的構(gòu)建公式如下:
35、x*g=u((utx)·(utg))=ug(λ)utx;
36、其中λ為拉普拉斯矩陣的特征值矩陣,對拉普拉斯矩陣進(jìn)行分解,引入chebyshev多項式來近似卷積核:
37、
38、其中θk是一個可學(xué)習(xí)的參數(shù),tn(x)是一個n階的切比雪夫多項式,通過化簡圖卷積層的最終表達(dá)式為:
39、
40、最后,引入了跳轉(zhuǎn)連接機(jī)制,聚合不同節(jié)點(diǎn)不同程度的領(lǐng)域信息,加入蒙特卡羅dropout方法同時獲得預(yù)測結(jié)果和不確定性,通過二分類交叉熵?fù)p失函數(shù)對模型進(jìn)行迭代訓(xùn)練,得到最優(yōu)的識別模型對自閉癥數(shù)據(jù)進(jìn)行分類。
41、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:(1)在分析功能核磁共振影像數(shù)據(jù)時,區(qū)別于常見的方法,本發(fā)明的模型通過一種圖池化策略來提取大腦特征,通過利用上下文圖信息從結(jié)構(gòu)和特征多個角度對節(jié)點(diǎn)進(jìn)行排序,魯棒性排序結(jié)果有利于提取不同受試者的有效腦區(qū)特征,有助于緩解過度平滑問題。
42、(2)通過對每一個受試者進(jìn)行個性化的腦區(qū)選擇,以及在人群圖中分析受試者之間的關(guān)聯(lián),結(jié)合局部和全局兩方面來獲得更多的潛在信息,這促進(jìn)了對有效生物標(biāo)志物的研究。
43、(3)引入圖神經(jīng)網(wǎng)絡(luò)將影像數(shù)據(jù)和非影像數(shù)據(jù)融合到自閉癥診斷中,并利用圖網(wǎng)絡(luò)動態(tài)更新人群圖,動態(tài)調(diào)整受試者之間的邊緣權(quán)重可以提高自閉癥的診斷。