本發(fā)明涉及微生態(tài)健康管理、生物信息學(xué)、人工智能和醫(yī)療健康領(lǐng)域,特別涉及利用數(shù)字孿生技術(shù)對(duì)嬰幼兒腸道微生態(tài)系統(tǒng)的健康管理。
背景技術(shù):
1、近年來,越來越多的研究表明,腸道微生物群與人類健康密切相關(guān),尤其是在嬰幼兒發(fā)育方面。研究表明,腸道微生物群的組成和功能會(huì)影響大腦發(fā)育和神經(jīng)行為。然而,由于個(gè)體之間的微生物群差異很大,很難確定正常的微生物群范圍,從而限制了對(duì)腸道菌群失調(diào)對(duì)嬰兒發(fā)育影響的理解。
2、現(xiàn)有的研究方法主要集中在分析嬰兒腸道微生物群與神經(jīng)發(fā)育缺陷之間的相關(guān)性,例如通過比較患有某種疾病的兒童和沒有患病的兒童的腸道微生物群。然而,這些方法無法預(yù)測(cè)個(gè)體患病的風(fēng)險(xiǎn),也無法指導(dǎo)臨床干預(yù)。
3、總而言之,腸道微生物群與人類的健康密切相關(guān),尤其是在嬰幼兒時(shí)期,腸道微生物的平衡對(duì)神經(jīng)發(fā)育和疾病預(yù)防具有重要作用。目前,缺乏有效的工具來預(yù)測(cè)人類腸道疾病和制定個(gè)性化的干預(yù)措施。
技術(shù)實(shí)現(xiàn)思路
1、發(fā)明目的:針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明的目的是基于數(shù)字孿生技術(shù)實(shí)現(xiàn)對(duì)嬰幼兒腸道微生物的健康管理,包括腸道微生物群發(fā)育軌跡預(yù)測(cè)、目標(biāo)疾病風(fēng)險(xiǎn)預(yù)測(cè)、腸道菌群網(wǎng)絡(luò)分析、臨床干預(yù)建議等。具體目標(biāo)如下:
2、提供一種基于數(shù)字孿生的腸道微生物群發(fā)育軌跡預(yù)測(cè)方法,可以使用少量的初始觀察數(shù)據(jù),可靠地預(yù)測(cè)嬰幼兒腸道微生物群在未來的發(fā)育軌跡。
3、提供一種基于數(shù)字孿生的疾病風(fēng)險(xiǎn)預(yù)測(cè)方法,可以根據(jù)嬰幼兒腸道微生物群的發(fā)育軌跡,預(yù)測(cè)神經(jīng)發(fā)育缺陷等目標(biāo)疾病的風(fēng)險(xiǎn)。
4、提供一種基于數(shù)字孿生的腸道菌群網(wǎng)絡(luò)分析方法,可以計(jì)算微生物類群之間的因果約束系數(shù)cc(causal_constraint)系數(shù),表示一個(gè)類群對(duì)另一個(gè)類群相對(duì)豐度的影響并繪制網(wǎng)絡(luò)圖。
5、提供一種基于腸道微生物的臨床干預(yù)方法,可以根據(jù)預(yù)測(cè)的嬰幼兒腸道微生物類群特征,提供個(gè)性化的腸道菌群干預(yù)建議,以降低神經(jīng)發(fā)育缺陷等疾病的風(fēng)險(xiǎn)。
6、技術(shù)方案:為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明采用如下技術(shù)方案:
7、一種基于數(shù)字孿生的腸道微生物群發(fā)育軌跡預(yù)測(cè)方法,包括如下步驟:
8、處理糞便樣本基因測(cè)序數(shù)據(jù),得到各微生物類群的相對(duì)豐度數(shù)據(jù),并將連續(xù)類型的相對(duì)豐度數(shù)據(jù)分箱量化處理成離散類型的數(shù)據(jù);
9、將每個(gè)時(shí)間點(diǎn)的每個(gè)微生物類群豐度視為一個(gè)特征,基于條件推斷森林構(gòu)建數(shù)字孿生模型cit-net模型,所述cit-net模型中包含多個(gè)條件推斷樹(cit,conditionalinference?tree),每個(gè)條件推斷樹用于預(yù)測(cè)特定微生物類群在特定時(shí)間點(diǎn)的相對(duì)豐度,并考慮其他微生物類群的相對(duì)豐度作為條件;
10、使用cit-net模型,從初始觀察數(shù)據(jù)出發(fā),預(yù)測(cè)未來一段時(shí)間內(nèi)微生物豐度軌跡;預(yù)測(cè)過程采用改進(jìn)的gibbs采樣算法,利用cit-net模型中每個(gè)特征的條件概率分布進(jìn)行采樣,逐步更新樣本的各個(gè)特征值,直到所有缺失值都被填充。
11、作為優(yōu)選,所述將連續(xù)類型的相對(duì)豐度數(shù)據(jù)分箱量化處理成離散類型的數(shù)據(jù),包括:
12、確定量化范圍,對(duì)于每個(gè)觀察到的微生物類群,計(jì)算其相對(duì)豐度值的范圍;
13、根據(jù)觀察數(shù)據(jù)集的大小和所需的量化分辨率,確定將范圍劃分的離散區(qū)間數(shù)量;
14、確定映射函數(shù),對(duì)于每個(gè)觀察到的微生物類群的每個(gè)相對(duì)豐度值,使用映射函數(shù)將其映射到對(duì)應(yīng)的區(qū)間。
15、作為優(yōu)選,所述改進(jìn)的gibbs采樣算法用于在cit-net模型構(gòu)建中生成新的數(shù)據(jù)樣本或者單獨(dú)對(duì)缺失數(shù)據(jù)進(jìn)行插補(bǔ);改進(jìn)的gibbs采樣算法利用cit-net模型中推斷出的條件概率分布,逐步迭代地從這些條件分布中抽樣來生成數(shù)據(jù);算法步驟包括:
16、1)初始化:選擇一個(gè)已知的數(shù)據(jù)樣本作為起點(diǎn),或者從一個(gè)包含部分已知數(shù)據(jù)和部分缺失數(shù)據(jù)的樣本開始;
17、2)識(shí)別缺失數(shù)據(jù):確定樣本中哪些數(shù)據(jù)是缺失的,用一個(gè)指示量mj來表示第j個(gè)數(shù)據(jù)點(diǎn)是否缺失;
18、3)迭代抽樣,迭代地對(duì)每個(gè)缺失的數(shù)據(jù)點(diǎn)進(jìn)行以下操作:a)隨機(jī)選擇一個(gè)缺失的數(shù)據(jù)點(diǎn)xj;b)從cit-net模型中對(duì)應(yīng)的條件分布φ(xj∣x-j=x-j)中抽樣,x-j表示除了xj之外的所有數(shù)據(jù)點(diǎn),x-j和xj表示對(duì)應(yīng)的變量;c)更新該數(shù)據(jù)點(diǎn)的值,并將其標(biāo)記為非缺失;
19、4)重復(fù)步驟3),繼續(xù)迭代抽樣,直到所有缺失的數(shù)據(jù)點(diǎn)都被插補(bǔ),或者達(dá)到預(yù)設(shè)的迭代次數(shù);
20、5)收斂性檢查,在生成新樣本的過程中,檢查樣本的收斂性,確保抽樣過程穩(wěn)定;
21、6)結(jié)果輸出,輸出插補(bǔ)后的樣本或新生成的樣本,用于進(jìn)一步的分析或預(yù)測(cè)。
22、一種基于數(shù)字孿生的疾病風(fēng)險(xiǎn)預(yù)測(cè)方法,包括如下步驟:
23、利用構(gòu)建的cit-net模型,基于嬰幼兒初始觀察數(shù)據(jù),預(yù)測(cè)未來一段時(shí)間內(nèi)微生物豐度軌跡;
24、根據(jù)預(yù)測(cè)的各微生物類群的豐度軌跡,預(yù)測(cè)嬰幼兒患目標(biāo)疾病的風(fēng)險(xiǎn)。
25、作為優(yōu)選,基于p距離量化嬰幼兒未來出現(xiàn)某種異常偏差的風(fēng)險(xiǎn)mδ,實(shí)現(xiàn)對(duì)微生物群成熟過程中異常偏差的追蹤;兩個(gè)微生物類群軌跡之間的p距離定義為由cit-net模型在特定時(shí)間針對(duì)特定類群引起的條件相對(duì)豐度分布的jensen-shannon散度的平方根,對(duì)所有類群-時(shí)間戳對(duì)取平均值;根據(jù)p距離估計(jì)一個(gè)微生物類群軌跡x被另一個(gè)軌跡y自發(fā)替代的概率,p距離越小,概率越大,說明兩個(gè)軌跡越相似;通過比較一個(gè)觀察到的微生物類群軌跡x在表現(xiàn)不佳發(fā)育群體中的出現(xiàn)概率與在典型發(fā)育群體中的出現(xiàn)概率,估計(jì)個(gè)體未來出現(xiàn)異常偏離典型發(fā)育軌跡的風(fēng)險(xiǎn)mδ。
26、一種基于數(shù)字孿生的腸道菌群網(wǎng)絡(luò)分析方法,包括如下步驟:
27、定義因果約束cc系數(shù),用于衡量在控制其他變量的情況下,一個(gè)微生物類群對(duì)另一個(gè)微生物類群相對(duì)豐度的因果約束影響;
28、選擇目標(biāo)類群和源類群,確定哪一對(duì)微生物類群之間的相互作用需要被量化;
29、構(gòu)建條件分布模型,使用構(gòu)建的cit-net模型估計(jì)目標(biāo)類群在給定源類群和其他控制變量條件下的相對(duì)豐度的條件分布;
30、對(duì)于每個(gè)源類群的變化估計(jì)目標(biāo)類群相對(duì)豐度的平均變化量;
31、通過比較源類群相對(duì)豐度增加或減少一個(gè)單位時(shí)目標(biāo)類群相對(duì)豐度的變化,來計(jì)算邊際效應(yīng);
32、檢驗(yàn)時(shí)間約束,確保源類群的變化發(fā)生在目標(biāo)類群變化之前;
33、控制混雜因素,在計(jì)算cc系數(shù)時(shí),控制其他可能影響目標(biāo)類群相對(duì)豐度的微生物類群,以確保估計(jì)的效應(yīng)是特定于源類群的;
34、對(duì)估計(jì)的cc系數(shù)進(jìn)行統(tǒng)計(jì)顯著性檢驗(yàn),以確定源類群對(duì)目標(biāo)類群的影響是否在統(tǒng)計(jì)上顯著;
35、將cc系數(shù)的結(jié)果解釋為一個(gè)類群對(duì)另一個(gè)類群的正向或負(fù)向影響;
36、將cc系數(shù)的結(jié)果可視化,以展示不同微生物類群之間的動(dòng)態(tài)關(guān)系。
37、一種基于數(shù)字孿生的微生態(tài)健康管理方法,包括:
38、所述的基于數(shù)字孿生的腸道微生物群發(fā)育軌跡預(yù)測(cè)方法;
39、所述的基于數(shù)字孿生的疾病風(fēng)險(xiǎn)預(yù)測(cè)方法;
40、所述的基于數(shù)字孿生的腸道菌群網(wǎng)絡(luò)分析方法;
41、所述的基于腸道微生物的臨床干預(yù)方法。
42、基于相同發(fā)明構(gòu)思,本發(fā)明還提供一種基于數(shù)字孿生的微生態(tài)健康管理系統(tǒng),包括:
43、腸道菌群數(shù)據(jù)特征處理模塊,用于處理糞便樣本基因測(cè)序數(shù)據(jù),得到各微生物類群的相對(duì)豐度數(shù)據(jù),并將連續(xù)類型的相對(duì)豐度數(shù)據(jù)分箱量化處理成離散類型的數(shù)據(jù);
44、數(shù)字孿生模型構(gòu)建模塊,用于將每個(gè)時(shí)間點(diǎn)(時(shí)間粒度為周)的每個(gè)微生物類群豐度視為一個(gè)特征,基于條件推斷森林構(gòu)建數(shù)字孿生模型cit-net模型,所述cit-net模型中包含多個(gè)條件推斷樹,每個(gè)條件推斷樹用于預(yù)測(cè)特定微生物類群在特定時(shí)間點(diǎn)的相對(duì)豐度,并考慮其他微生物類群的相對(duì)豐度作為條件。在條件推斷樹的構(gòu)建過程中,同時(shí)使用統(tǒng)計(jì)測(cè)試確保節(jié)點(diǎn)分割的顯著性,從而避免過擬合;
45、腸道微生物豐度發(fā)育軌跡預(yù)測(cè)模塊,用于使用cit-net模型,從初始觀察數(shù)據(jù)出發(fā),預(yù)測(cè)未來一段時(shí)間內(nèi)微生物群的豐度軌跡;預(yù)測(cè)過程采用改進(jìn)的gibbs采樣算法,利用cit-net模型中每個(gè)特征的條件概率分布進(jìn)行采樣,逐步更新樣本的各個(gè)特征值,直到所有缺失值都被填充;
46、疾病風(fēng)險(xiǎn)預(yù)測(cè)模塊,用于根據(jù)預(yù)測(cè)的各微生物類群的豐度軌跡,預(yù)測(cè)嬰幼兒患目標(biāo)疾病的風(fēng)險(xiǎn);
47、微生物菌群網(wǎng)絡(luò)分析模塊,用于基于微生物類群之間的cc系數(shù),繪制cc網(wǎng)絡(luò)圖,展示微生物類群之間的定向影響關(guān)系。
48、以及臨床干預(yù)決策支持模塊,用于根據(jù)預(yù)測(cè)的各微生物類群的豐度軌跡,確定嬰幼兒的個(gè)性化干預(yù)方案。
49、一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,所述計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述各個(gè)方法的步驟。
50、有益效果:與現(xiàn)有技術(shù)相比,本發(fā)明具有如下優(yōu)點(diǎn):
51、1、本發(fā)明將微生物類群的相對(duì)豐度數(shù)據(jù)進(jìn)行分箱量化處理,使用條件推斷樹組成的cit-net模型訓(xùn)練得到數(shù)字孿生模型,每個(gè)維度的特征都交給一個(gè)條件推斷樹處理,可解釋性高,每棵樹的結(jié)構(gòu)相對(duì)簡(jiǎn)單,容易理解,可以幫助研究人員深入理解微生物生態(tài)系統(tǒng)的組織規(guī)律和關(guān)鍵驅(qū)動(dòng)因素。
52、2、本發(fā)明構(gòu)建的cit-net模型,預(yù)測(cè)性能好,通過學(xué)習(xí)多變量時(shí)間感知依賴關(guān)系,預(yù)測(cè)能力強(qiáng),能夠有效地預(yù)測(cè)微生物類群的豐度動(dòng)態(tài),并展現(xiàn)出優(yōu)于現(xiàn)有方法的預(yù)測(cè)性能,并基于發(fā)育軌跡進(jìn)一步預(yù)測(cè)疾病風(fēng)險(xiǎn),為早期干預(yù)提供依據(jù)。
53、3、本發(fā)明構(gòu)建的cit-net模型,使用條件推斷樹,能夠?qū)W習(xí)到復(fù)雜的依賴關(guān)系,每棵樹可以學(xué)習(xí)跨越任意時(shí)間點(diǎn)的微生物類群之間的復(fù)雜依賴關(guān)系,而無需事先假設(shè)任何限制,并能避免過擬合。
54、4、本發(fā)明能夠幫助醫(yī)生更好地了解嬰幼兒腸道微生物類群的動(dòng)態(tài)變化,并為臨床決策提供支持。
55、5、本發(fā)明能夠根據(jù)預(yù)測(cè)結(jié)果和臨床信息,提供補(bǔ)充特定菌株或調(diào)整飲食等個(gè)性化的干預(yù)建議,提高治療效果。