本申請涉及大數(shù)據(jù),特別是涉及一種醫(yī)療數(shù)據(jù)分析模型構建方法、分析方法、設備及介質(zhì)。
背景技術:
1、隨著醫(yī)療信息化的普及與快速發(fā)展,當前的醫(yī)療數(shù)據(jù)具有數(shù)據(jù)量大、數(shù)據(jù)種類多、價值高、價值密度低、產(chǎn)生快、處理快等特點。則可以對大量的醫(yī)療數(shù)據(jù)進行分級分類處理,以充分挖掘其醫(yī)療價值,為改善醫(yī)療水平提供依據(jù),對促進醫(yī)學進步具有重要意義。
2、目前,對于醫(yī)療數(shù)據(jù)的分級分類,主要通過人工標注的方式實現(xiàn),或者通過借助其他非醫(yī)療場景下的智能數(shù)據(jù)分級分類模型實現(xiàn)。
3、然而,隨著業(yè)務的拓展及數(shù)據(jù)模型的擴充,醫(yī)療數(shù)據(jù)的數(shù)據(jù)量及種類變得非常龐大,使得基于人工標注的分類分級方式,成本高、效率及精度低;另外,實際中的醫(yī)療數(shù)據(jù)涉及的場景復雜,使得其分類分級標準具備較強的專業(yè)性,而其他非醫(yī)療場景下使用的智能分類分級模型,無法滿足醫(yī)療場景的專業(yè)需求。
技術實現(xiàn)思路
1、本申請的目的是提供一種醫(yī)療數(shù)據(jù)分析模型構建方法、分析方法、設備及介質(zhì),實現(xiàn)對醫(yī)療數(shù)據(jù)的準確自動分級及分類。
2、為實現(xiàn)上述目的,本申請?zhí)峁┝巳缦路桨福?/p>
3、第一方面,本申請?zhí)峁┝艘环N醫(yī)療數(shù)據(jù)分析模型構建方法,該方法包括:
4、獲取訓練數(shù)據(jù)集,所述訓練數(shù)據(jù)集中包括醫(yī)療訓練數(shù)據(jù)及各醫(yī)療訓練數(shù)據(jù)的分級標注信息及分類標注信息;
5、將所述醫(yī)療訓練數(shù)據(jù)輸入構建的初始分析模型,對所述醫(yī)療訓練數(shù)據(jù)進行分級分類處理,輸出所述醫(yī)療訓練數(shù)據(jù)對應的初始預測結果及損失值,所述初始預測結果包括所述醫(yī)療訓練數(shù)據(jù)的初始分級標簽及初始分類標簽,所述損失值根據(jù)所述初始分級標簽、所述初始分類標簽、所述分級標注信息及所述分類標注信息確定;
6、根據(jù)設置的損失閾值及所述損失值,對所述初始分析模型進行迭代訓練,生成目標分析模型,使得將所述醫(yī)療數(shù)據(jù)輸入至所述目標分析模型,并輸出所述醫(yī)療訓練數(shù)據(jù)對應的目標預測結果及目標損失值時,所述目標損失值滿足設置的所述損失閾值;所述目標分析模型用于對輸入的待分析醫(yī)療數(shù)據(jù)進行分級及分類,并輸出所述待分析醫(yī)療數(shù)據(jù)對應的預測結果,所述預測結果包括所述待分析醫(yī)療數(shù)據(jù)對應的分級標簽及分類標簽。
7、可選地,本申請?zhí)峁┑尼t(yī)療數(shù)據(jù)分析模型構建方法,所述將所述醫(yī)療訓練數(shù)據(jù)輸入構建的初始分析模型,對所述醫(yī)療訓練數(shù)據(jù)進行分級分類處理,輸出所述醫(yī)療訓練數(shù)據(jù)對應的初始預測結果包括:
8、對所述醫(yī)療訓練數(shù)據(jù)進行特征提取,得到所述醫(yī)療訓練數(shù)據(jù)對應的特征向量;
9、對所述特征向量進行級別及類別識別,得到所述初始預測結果。
10、可選地,本申請?zhí)峁┑尼t(yī)療數(shù)據(jù)分析模型構建方法,所述初始分析模型基于bert模塊構建,所述對所述醫(yī)療訓練數(shù)據(jù)進行特征提取,得到所述醫(yī)療訓練數(shù)據(jù)對應的特征向量包括:
11、對預處理后的所述醫(yī)療訓練數(shù)據(jù)進行分詞處理,得到所述醫(yī)療訓練數(shù)據(jù)對應的分詞結果;
12、根據(jù)所述分詞結果,生成所述醫(yī)療訓練數(shù)據(jù)對應的索引序列及填充信息;
13、根據(jù)所述索引序列及所述填充信息,對所述醫(yī)療訓練數(shù)據(jù)進行深度語義提取,得到所述醫(yī)療訓練數(shù)據(jù)對應的特征向量。
14、可選地,本申請?zhí)峁┑尼t(yī)療數(shù)據(jù)分析模型構建方法,所述初始分析模型基于textcnn模塊構建,所述對所述醫(yī)療訓練數(shù)據(jù)進行特征提取,得到所述醫(yī)療訓練數(shù)據(jù)對應的特征向量包括:
15、將醫(yī)療訓練數(shù)據(jù)的文本數(shù)據(jù)轉(zhuǎn)換為詞典索引序列;
16、將所述詞典索引序列轉(zhuǎn)換為詞向量表示;
17、對所述詞向量表示進行卷積處理,得到卷積結果,所述卷積結果表示所述詞向量之間的局部關聯(lián)信息;
18、對所述卷積結果進行最大池化,并對各卷積窗口的池化結果拼接,得到所述醫(yī)療訓練數(shù)據(jù)對應的特征向量。
19、可選地,本申請?zhí)峁┑尼t(yī)療數(shù)據(jù)分析模型構建方法,所述對所述特征向量進行級別及類別識別,得到所述初始預測結果包括:
20、將提取的特征向量輸入全連接層,對所述特征向量進行特征映射,得到所述醫(yī)療訓練數(shù)據(jù)的對應的各類別標簽的預測分數(shù),以及各級標簽的預測分數(shù);
21、根據(jù)所述預測分數(shù),計算各類別標簽及各級別標簽對應的概率分布;
22、將概率值最高的類別標簽及級別標簽,作為所述初始預測結果。
23、可選地,本申請?zhí)峁┑尼t(yī)療數(shù)據(jù)分析模型構建方法,當所述初始分析模型基于bert模塊構建時,在將提取的特征向量輸入全連接層之前,所述方法還包括:
24、將所述特征向量中的部分元素隨機置零。
25、可選地,本申請?zhí)峁┑尼t(yī)療數(shù)據(jù)分析模型構建方法,在將所述醫(yī)療訓練數(shù)據(jù)輸入構建的初始分析模型之前,所述方法還包括:
26、供的醫(yī)療數(shù)據(jù)分析模型構建方法,在所述對所述醫(yī)療數(shù)據(jù)進行預處理包括:
27、對所述醫(yī)療訓練數(shù)據(jù)進行數(shù)據(jù)清洗;
28、按照設置的轉(zhuǎn)換模式,對清洗后的所述醫(yī)療訓練數(shù)據(jù)進行格式轉(zhuǎn)換。
29、第二方面,本申請?zhí)峁┮环N醫(yī)療數(shù)據(jù)分析方法,所述方法包括:
30、獲取待分析醫(yī)療數(shù)據(jù);
31、將所述醫(yī)療數(shù)據(jù)輸入至如第一方面所述的醫(yī)療數(shù)據(jù)分析模型構建方法中所構建的目標分析模型中,輸出所述待分析醫(yī)療數(shù)據(jù)的預測結果,所述預測結果包括所述待分析醫(yī)療數(shù)據(jù)對應的分級標簽及分類標簽。
32、第三方面,本申請?zhí)峁┮环N計算機設備,所述計算機設備包括:存儲器、處理器以及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序以實現(xiàn)如第一方面所述的醫(yī)療數(shù)據(jù)分析模型構建方法或如第二方面所述的醫(yī)療數(shù)據(jù)分析方法。
33、第四方面,本申請?zhí)峁┮环N計算機可讀存儲介質(zhì),所述可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如第一方面所述的醫(yī)療數(shù)據(jù)分析模型構建方法或如第二方面所述的醫(yī)療數(shù)據(jù)分析方法。
34、根據(jù)本申請?zhí)峁┑木唧w實施例,本申請公開了以下技術效果:
35、本申請?zhí)峁┑尼t(yī)療數(shù)據(jù)分析模型構建方法、分析方法、設備及介質(zhì),通過收集的包括各醫(yī)療場景的醫(yī)療訓練數(shù)據(jù),以及醫(yī)療訓練數(shù)據(jù)的分級標注信息及分類標注信息的訓練數(shù)據(jù)集,對構建的初始分析模型進行迭代訓練,以構建能夠?qū)Ω鲌鼍跋碌尼t(yī)療數(shù)據(jù)進行準確識別及分類的目標分析模型,使得對于對待分析的醫(yī)療數(shù)據(jù),能夠利用構建的目標分析模型進行分級分類處理,并輸出對應的分級結果及分類結果。即本申請通過對包含大量專業(yè)術語、專業(yè)名詞,以及涉及各種場景的醫(yī)療數(shù)據(jù),借助分析模型,進行特征學習和理解,以在多次迭代,逐步優(yōu)化參數(shù)的基礎上,構建最終的目標分析模型,該目標分析模型也能夠根據(jù)新的醫(yī)療數(shù)據(jù)和分類標準進行調(diào)整和擴展,適應不斷變化的醫(yī)療數(shù)據(jù)管理需求,最終實現(xiàn)了對醫(yī)療數(shù)據(jù)的自動且準確的分級分類處理,避免了通過人工標注的方式,或通過其他非醫(yī)療場景的智能模型的方式進行分級分類,提高了分析效率及準確度,為醫(yī)療數(shù)據(jù)的管理和安全防護提供了有力支持。
1.一種醫(yī)療數(shù)據(jù)分析模型構建方法,其特征在于,所述方法包括:
2.根據(jù)權利要求1所述的醫(yī)療數(shù)據(jù)分析模型構建方法,其特征在于,所述將所述醫(yī)療訓練數(shù)據(jù)輸入構建的初始分析模型,對所述醫(yī)療訓練數(shù)據(jù)進行分級分類處理,輸出所述醫(yī)療訓練數(shù)據(jù)對應的初始預測結果包括:
3.根據(jù)權利要求2所述的醫(yī)療數(shù)據(jù)分析模型構建方法,其特征在于,所述初始分析模型基于bert模塊構建,所述對所述醫(yī)療訓練數(shù)據(jù)進行特征提取,得到所述醫(yī)療訓練數(shù)據(jù)對應的特征向量包括:
4.根據(jù)權利要求2所述的醫(yī)療數(shù)據(jù)分析模型構建方法,其特征在于,所述初始分析模型基于textcnn模塊構建,所述對所述醫(yī)療訓練數(shù)據(jù)進行特征提取,得到所述醫(yī)療訓練數(shù)據(jù)對應的特征向量包括:
5.根據(jù)權利要求2-4任一項所述的醫(yī)療數(shù)據(jù)分析模型構建方法,其特征在于,所述對所述特征向量進行級別及類別識別,得到所述初始預測結果包括:
6.根據(jù)權利要求5所述的醫(yī)療數(shù)據(jù)分析模型構建方法,其特征在于,當所述初始分析模型基于bert模塊構建時,在將提取的特征向量輸入全連接層之前,所述方法還包括:
7.根據(jù)權利要求1所述的醫(yī)療數(shù)據(jù)分析模型構建方法,其特征在于,在將所述醫(yī)療訓練數(shù)據(jù)輸入構建的初始分析模型之前,所述方法還包括:
8.一種醫(yī)療數(shù)據(jù)分析方法,其特征在于,所述方法包括:
9.一種計算機設備,其特征在于,所述計算機設備包括:存儲器、處理器以及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序以實現(xiàn)如權利要求1-7中任一項所述的醫(yī)療數(shù)據(jù)分析模型構建方法或如權利要求8所述的醫(yī)療數(shù)據(jù)分析方法。
10.一種計算機可讀存儲介質(zhì),其特征在于,所述可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權利要求1-7中任一項所述的醫(yī)療數(shù)據(jù)分析模型構建方法或如權利要求8所述的醫(yī)療數(shù)據(jù)分析方法。