本發(fā)明涉及人工智能,應用于醫(yī)療服務相關的醫(yī)療任務處理場景中,具體涉及一種任務處理方法、裝置、計算機設備以及非易失性計算機可讀存儲介質。
背景技術:
1、目前,隨著人工智能技術的快速發(fā)展,大語言模型(large?language?model,llm)在醫(yī)療領域的應用日益廣泛。這些模型通過深度學習技術,能夠理解和生成自然語言,為醫(yī)療信息處理提供了新的可能性。然而,現有的大語言模型通常專注于處理單一場景下的任務,如文本分類、情感分析或機器翻譯等,這限制了它們在更復雜、多場景的醫(yī)療環(huán)境中的應用能力。
2、在醫(yī)療領域,信息處理的需求遠比單一任務復雜。例如,體檢報告抽取的場景中,需要從大量的醫(yī)療文本中提取關鍵信息;病例理解的場景中,則要求模型能夠理解并分析病例中的病理描述和治療建議;知識問答的場景中,則涉及到對醫(yī)療知識的查詢和解釋;而病患管理的場景中,則需要對患者的健康數據進行長期跟蹤和管理。這些場景中的任務不僅要求模型具備強大的語言理解能力,還需要能夠處理和整合來自不同來源和格式的數據?,F有的大語言模型在處理單一場景中的任務時表現出色,但當面對多場景中的任務挑戰(zhàn)時,它們的表現往往不盡如人意。這是因為這些模型通常在特定的單一數據集上進行訓練,缺乏跨場景的泛化能力。此外,醫(yī)療領域的數據通常具有高度的專業(yè)性和技術性,需要模型具備相應的領域知識,而現有的大語言模型往往缺乏這種專業(yè)知識。
3、基于此,如何提供一種任務處理方法、裝置、計算機設備以及非易失性計算機可讀存儲介質,可通過生成相應的目標大語言模型來實現對于多個場景中的任務進行有效處理,是目前本領域技術人員亟待解決的問題。
技術實現思路
1、鑒于上述現有技術的不足之處,本發(fā)明的目的在于提供一種任務處理方法、裝置、計算機設備以及非易失性計算機可讀存儲介質,旨在解決如何可通過生成相應的目標大語言模型來實現對于多個場景中的任務進行有效處理的問題。
2、為了達到上述目的,本發(fā)明采取了以下技術方案:
3、一種任務處理方法,其中,所述方法包括:
4、收集不同場景的多個下游任務對應的業(yè)務數據,擬合各所述業(yè)務數據得到擬合數據,根據所述擬合數據構建訓練數據集;
5、根據數據清洗規(guī)則對所述訓練數據集進行清洗,并根據數據檢驗規(guī)則對得到的清洗后數據集進行數據標注及數據檢驗后,得到目標數據集;
6、采用所述目標數據集對基于transformer構建的大語言模型進行微調訓練,當訓練到所述大語言模型滿足預設的要求時,生成相應的目標大語言模型;
7、基于所述目標大語言模型,處理目標場景中的任務。
8、在進一步的技術方案中,所述的任務處理方法,其中,所述收集不同場景的多個下游任務對應的業(yè)務數據,擬合各所述業(yè)務數據得到擬合數據,根據所述擬合數據構建訓練數據集,包括:
9、通過不同場景的多個下游任務對應的業(yè)務數據庫收集各所述下游任務的業(yè)務數據;
10、對收集到的各所述業(yè)務數據進行擬合,得到相應的擬合數據;
11、根據所述擬合數據構建訓練數據集。
12、在進一步的技術方案中,所述的任務處理方法,其中,所述采用所述目標數據集對基于transformer構建的大語言模型進行微調訓練,當訓練到所述大語言模型滿足預設的要求時,生成相應的目標大語言模型,包括:
13、根據所述目標數據集學習基于transformer構建的大語言模型中目標矩陣的參數,以對所述大語言模型進行微調訓練;
14、當訓練到所述大語言模型滿足預設的要求時,生成相應的目標大語言模型。
15、在進一步的技術方案中,所述的任務處理方法,其中,所述根據所述目標數據集學習基于transformer構建的大語言模型中目標矩陣的參數,以對所述大語言模型進行微調訓練,包括:
16、根據所述目標數據集利用參數優(yōu)化算法學習基于transformer構建的大語言模型中目標矩陣的參數,以對所述大語言模型進行微調訓練。
17、在進一步的技術方案中,所述的任務處理方法,其中,所述根據所述目標數據集利用參數優(yōu)化算法學習基于transformer構建的大語言模型中目標矩陣的參數,以對所述大語言模型進行微調訓練,其中,
18、所述參數優(yōu)化算法為隨機梯度下降算法。
19、在進一步的技術方案中,所述的任務處理方法,其中,所述當訓練到所述大語言模型滿足預設的要求時,生成相應的目標大語言模型,包括:
20、預先設定微調的目標性能指標;
21、當訓練到所述大語言模型滿足所述目標性能指標時,生成相應的目標大語言模型。
22、在進一步的技術方案中,所述的任務處理方法,其中,所述基于所述目標大語言模型,處理目標場景中的任務,包括:
23、獲取目標場景中的目標任務;
24、將所述目標任務相應的提示文本輸入所述目標大語言模型,生成所述目標任務的處理結果。
25、一種任務處理裝置,其中,所述裝置包括:
26、收集與擬合模塊,用于收集不同場景的多個下游任務對應的業(yè)務數據,擬合各所述業(yè)務數據得到擬合數據,根據所述擬合數據構建訓練數據集;
27、數據處理模塊,用于根據數據清洗規(guī)則對所述訓練數據集進行清洗,并根據數據檢驗規(guī)則對得到的清洗后數據集進行數據標注及數據檢驗后,得到目標數據集;
28、微調訓練模塊,用于采用所述目標數據集對基于transformer構建的大語言模型進行微調訓練,當訓練到所述大語言模型滿足預設的要求時,生成相應的目標大語言模型;
29、任務處理模塊,用于基于所述目標大語言模型,處理目標場景中的任務。
30、一種計算機設備,其中,所述計算機設備包括至少一個處理器;以及,
31、與所述至少一個處理器通信連接的存儲器;其中,
32、所述存儲器上存儲有可被所述至少一個處理器執(zhí)行的計算機程序,所述計算機程序被所述至少一個處理器執(zhí)行時,可實現如上述任一項所述的任務處理方法。
33、一種非易失性計算機可讀存儲介質,其中,所述非易失性計算機可讀存儲介質存儲有計算機程序,所述計算機程序被至少一個處理器執(zhí)行時,可實現如上述任一項所述的任務處理方法。
34、相較于現有技術,本發(fā)明提供了一種任務處理方法、裝置、計算機設備以及非易失性計算機可讀存儲介質,其中,所述方法包括:收集不同場景的多個下游任務對應的業(yè)務數據,擬合各所述業(yè)務數據得到擬合數據,根據所述擬合數據構建訓練數據集;根據數據清洗規(guī)則對所述訓練數據集進行清洗,并根據數據檢驗規(guī)則對得到的清洗后數據集進行數據標注及數據檢驗后,得到目標數據集;采用所述目標數據集對基于transformer構建的大語言模型進行微調訓練,當訓練到所述大語言模型滿足預設的要求時,生成相應的目標大語言模型;基于所述目標大語言模型,處理目標場景中的任務。這樣,通過本發(fā)明的方法可通過生成相應的目標大語言模型來實現對于多個場景中的任務進行有效處理。