本發(fā)明涉及生物大數(shù)據(jù)分析,尤其涉及基于數(shù)據(jù)分析的微生物功能因子評價(jià)系統(tǒng)及方法。
背景技術(shù):
1、人類胃腸道微生物群落由大量復(fù)雜的微生物組成,胃腸道微生物在提高宿主免疫力、食物消化、胃腸道內(nèi)分泌功能、神經(jīng)信號調(diào)節(jié)、藥物功能和代謝以及內(nèi)毒素清除等方面扮演重要角色。
2、隨著高通量測序技術(shù)、組學(xué)技術(shù)以及生物大數(shù)據(jù)分析技術(shù)的發(fā)展,利用微生物群體dna或rna等標(biāo)志物,研究胃腸道微生物群落構(gòu)建與演化、分布特征、執(zhí)行群體功能的機(jī)理已成為胃腸道微生物研究中的重點(diǎn)領(lǐng)域。
3、現(xiàn)有技術(shù)在通過高通量測序技術(shù)進(jìn)行微生物功能因子評價(jià)時(shí)忽略了微生物群落功能特征對于確定微生物功能因子的重要價(jià)值,以及微生物功能因子在不同胃腸道環(huán)境中的變化趨勢對于預(yù)測胃腸道環(huán)境變化對微生物群落功能特性影響的重要意義,導(dǎo)致微生物群落功能特性預(yù)測存在準(zhǔn)確率不高的問題。
技術(shù)實(shí)現(xiàn)思路
1、為了克服現(xiàn)有技術(shù)存在的缺陷與不足,本發(fā)明提供基于數(shù)據(jù)分析的微生物功能因子評價(jià)系統(tǒng)及方法,通過微生物群落的功能特征確定其功能因子并構(gòu)建功能因子預(yù)測模型,提升了胃腸道環(huán)境變化對于微生物群落功能特征預(yù)測的可靠性和準(zhǔn)確性。
2、為了達(dá)到上述目的,本發(fā)明采用以下技術(shù)方案:
3、第一方面,本發(fā)明的實(shí)施例提供基于數(shù)據(jù)分析的微生物功能因子評價(jià)方法,包括下述步驟:
4、提取微生物群落dna并通過高通量測序技術(shù)獲取第一測序數(shù)據(jù),對所述第一測序數(shù)據(jù)進(jìn)行預(yù)處理,獲得第二測序數(shù)據(jù);
5、基于所述第二測序數(shù)據(jù)評估微生物群落的功能特征指數(shù);
6、基于所述功能特征指數(shù)確定微生物群落的功能因子;
7、構(gòu)建功能因子預(yù)測模型,通過評估所述功能因子在不同胃腸道環(huán)境條件下的變化趨勢,預(yù)測胃腸道環(huán)境變化對于微生物群落功能特征的影響。
8、作為優(yōu)選的技術(shù)方案,所述評估微生物群落的功能特征指數(shù)的步驟進(jìn)一步包括:
9、基于所述第二測序數(shù)據(jù)獲得微生物群落中的微生物信息,所述微生物信息包含微生物種類信息和相對豐度信息;
10、基于所述微生物信息計(jì)算微生物群落的功能多樣性系數(shù)和功能冗余系數(shù),所述功能冗余系數(shù)的計(jì)算公式如下:
11、;
12、式中表示微生物群落中第個(gè)物種與第個(gè)物種的功能相似性,表示微生物群落中第個(gè)物種的相對豐度,表示微生物群落中第個(gè)物種的相對豐度,表示微生物群落的物種數(shù)量,表示微生物群落的功能冗余系數(shù);
13、基于所述功能多樣性系數(shù)和所述功能冗余系數(shù)計(jì)算生物群落的所述功能特征指數(shù),所述功能特征指數(shù)的計(jì)算公式如下:
14、;
15、式中表示微生物群落的功能多樣性系數(shù),表示微生物群落的功能冗余系數(shù),表示第一調(diào)節(jié)因子,表示微生物群落的功能特征指數(shù)。
16、作為優(yōu)選的技術(shù)方案,所述功能多樣性系數(shù)的計(jì)算公式如下:
17、;
18、式中表示微生物群落中第個(gè)物種的相對豐度,表示微生物群落的物種數(shù)量,表示單態(tài)種數(shù),表示雙態(tài)種數(shù),表示第二調(diào)節(jié)因子,表示微生物群落的功能多樣性系數(shù)。
19、作為優(yōu)選的技術(shù)方案,所述確定微生物群落的功能因子的步驟進(jìn)一步包括:
20、獲取所述功能特征指數(shù),基于所述功能特征指數(shù)計(jì)算微生物群落間的功能特征匹配指數(shù);
21、將所述功能特征匹配指數(shù)大于預(yù)設(shè)功能特征匹配閾值的微生物群落劃分為微生物功能群;
22、基于所述微生物功能群進(jìn)行功能基因注釋并計(jì)算功能基因相對豐度,將功能基因相對豐度最大的功能基因作為微生物群落的功能因子。
23、作為優(yōu)選的技術(shù)方案,所述功能特征匹配指數(shù)的計(jì)算公式如下:
24、;
25、式中表示微生物群落的功能特征指數(shù),表示微生物群落的功能特征指數(shù),表示取和中的最大值,表示功能特征匹配指數(shù)。
26、作為優(yōu)選的技術(shù)方案,所述構(gòu)建功能因子預(yù)測模型的步驟進(jìn)一步包括:
27、采集歷史數(shù)據(jù),所述歷史數(shù)據(jù)包含歷史胃腸道環(huán)境數(shù)據(jù)以及對應(yīng)胃腸道環(huán)境條件下所述功能因子的變化趨勢數(shù)據(jù);
28、對所述歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,并將數(shù)據(jù)預(yù)處理后的歷史數(shù)據(jù)劃分為訓(xùn)練集、驗(yàn)證集和測試集;
29、基于lstm神經(jīng)網(wǎng)絡(luò)構(gòu)建功能因子預(yù)測模型,將所述訓(xùn)練集輸入所述功能因子預(yù)測模型進(jìn)行迭代訓(xùn)練,并通過所述驗(yàn)證集監(jiān)控迭代訓(xùn)練過程;
30、當(dāng)所述功能因子預(yù)測模型在所述測試集上的均方誤差達(dá)到預(yù)設(shè)誤差閾值時(shí),完成功能因子預(yù)測模型構(gòu)建。
31、在此需要說明的是,這里的第一調(diào)節(jié)因子、第二調(diào)節(jié)因子、預(yù)設(shè)功能特征匹配閾值和預(yù)設(shè)誤差閾值的取值方式為:采集10000組測序數(shù)據(jù)和歷史胃腸道環(huán)境數(shù)據(jù),對胃腸道環(huán)境變化是否對微生物群落功能特征產(chǎn)生影響進(jìn)行區(qū)分,通過測序數(shù)據(jù)評估微生物群落的功能特征指數(shù)并確定微生物群落的功能因子,將歷史胃腸道環(huán)境數(shù)據(jù)代入功能因子預(yù)測模型中進(jìn)行預(yù)測,將預(yù)測得到的功能因子變化趨勢和區(qū)分結(jié)果同時(shí)導(dǎo)入擬合軟件中,輸出符合區(qū)分結(jié)果區(qū)分準(zhǔn)確率的最優(yōu)第一調(diào)節(jié)因子、第二調(diào)節(jié)因子、預(yù)設(shè)功能特征匹配閾值和預(yù)設(shè)誤差閾值。
32、第二方面,本發(fā)明的實(shí)施例提供基于數(shù)據(jù)分析的微生物功能因子評價(jià)系統(tǒng),包括:
33、數(shù)據(jù)獲取模塊,用于提取微生物群落dna并通過高通量測序技術(shù)獲取第一測序數(shù)據(jù),對所述第一測序數(shù)據(jù)進(jìn)行預(yù)處理,獲得第二測序數(shù)據(jù);
34、功能特征指數(shù)評估模塊,用于基于所述第二測序數(shù)據(jù)評估微生物群落的功能特征指數(shù);
35、功能因子確定模塊,用于基于所述功能特征指數(shù)確定微生物群落的功能因子;
36、預(yù)測模型構(gòu)建模塊,用于構(gòu)建功能因子預(yù)測模型,通過評估所述功能因子在不同胃腸道環(huán)境條件下的變化趨勢,預(yù)測胃腸道環(huán)境變化對于微生物群落功能特征的影響。
37、第三方面,本發(fā)明的實(shí)施例提供一種電子設(shè)備,包括:處理器和存儲(chǔ)器,其中,所述存儲(chǔ)器中存儲(chǔ)有可供處理器調(diào)用的計(jì)算機(jī)程序,所述處理器通過調(diào)用所述存儲(chǔ)器中存儲(chǔ)的計(jì)算機(jī)程序,執(zhí)行基于數(shù)據(jù)分析的微生物功能因子評價(jià)方法。
38、第四方面,本發(fā)明的實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),儲(chǔ)存有指令,當(dāng)所述指令在計(jì)算機(jī)上運(yùn)行時(shí),使得計(jì)算機(jī)執(zhí)行基于數(shù)據(jù)分析的微生物功能因子評價(jià)方法。
39、本發(fā)明與現(xiàn)有技術(shù)相比,具有如下優(yōu)點(diǎn)和有益效果:
40、本發(fā)明首先通過測序數(shù)據(jù)評估微生物群落的功能特征指數(shù),然后通過微生物群落的功能特征指數(shù)確定微生物群落的功能因子,最后構(gòu)建功能因子預(yù)測模型,通過評估所述功能因子在不同胃腸道環(huán)境條件下的變化趨勢,預(yù)測胃腸道環(huán)境變化對于微生物群落功能特征的影響,提升了胃腸道環(huán)境變化對于微生物群落功能特征預(yù)測的可靠性和準(zhǔn)確性。
1.基于數(shù)據(jù)分析的微生物功能因子評價(jià)方法,其特征在于,包括下述步驟:
2.根據(jù)權(quán)利要求1所述的基于數(shù)據(jù)分析的微生物功能因子評價(jià)方法,其特征在于,所述評估微生物群落的功能特征指數(shù),包括:
3.根據(jù)權(quán)利要求2所述的基于數(shù)據(jù)分析的微生物功能因子評價(jià)方法,其特征在于,所述功能多樣性系數(shù)的計(jì)算公式如下:
4.根據(jù)權(quán)利要求1所述的基于數(shù)據(jù)分析的微生物功能因子評價(jià)方法,其特征在于,所述確定微生物群落的功能因子,包括:
5.根據(jù)權(quán)利要求1所述的基于數(shù)據(jù)分析的微生物功能因子評價(jià)方法,其特征在于,所述功能特征匹配指數(shù)的計(jì)算公式如下:
6.根據(jù)權(quán)利要求1所述的基于數(shù)據(jù)分析的微生物功能因子評價(jià)方法,其特征在于,所述構(gòu)建功能因子預(yù)測模型,包括:
7.基于數(shù)據(jù)分析的微生物功能因子評價(jià)系統(tǒng),其基于權(quán)利要求1-6中任一項(xiàng)所述的基于數(shù)據(jù)分析的微生物功能因子評價(jià)方法實(shí)現(xiàn),其特征在于,所述系統(tǒng)包括:
8.一種電子設(shè)備,包括:處理器和存儲(chǔ)器,其中,所述存儲(chǔ)器中存儲(chǔ)有可供處理器調(diào)用的計(jì)算機(jī)程序;其特征在于,所述處理器通過調(diào)用所述存儲(chǔ)器中存儲(chǔ)的計(jì)算機(jī)程序,執(zhí)行如權(quán)利要求1-6任一項(xiàng)所述的基于數(shù)據(jù)分析的微生物功能因子評價(jià)方法。
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,儲(chǔ)存有指令,當(dāng)所述指令在計(jì)算機(jī)上運(yùn)行時(shí),使得計(jì)算機(jī)執(zhí)行如權(quán)利要求1-6任一項(xiàng)所述的基于數(shù)據(jù)分析的微生物功能因子評價(jià)方法。