本公開涉及計算機,尤其涉及深度學習、自然語言處理、大模型等人工智能,具體涉及一種數(shù)據(jù)處理方法、人機交互方法、智能體系統(tǒng)及裝置。
背景技術(shù):
1、現(xiàn)有技術(shù)中,檢索問答智能體(agent)系統(tǒng)中,前期進行模型訓練使用的訓練集通常來自公開數(shù)據(jù)集或主動挖掘的領(lǐng)域數(shù)據(jù),但是,這種方法獲得的訓練集缺乏對實際業(yè)務(wù)場景數(shù)據(jù)的擬合,準確性較低,數(shù)據(jù)質(zhì)量不高。
技術(shù)實現(xiàn)思路
1、本公開旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
2、本公開第一方面實施例提出了一種數(shù)據(jù)處理方法,包括:
3、獲取使用目標模型的業(yè)務(wù)系統(tǒng)的日志數(shù)據(jù);
4、對所述日志數(shù)據(jù)進行解析,獲取查詢數(shù)據(jù),及所述查詢數(shù)據(jù)對應(yīng)的檢索數(shù)據(jù);
5、將所述查詢數(shù)據(jù)和所述檢索數(shù)據(jù),分別輸入所述目標模型及第一模型,得到至少兩個生成數(shù)據(jù);
6、利用至少兩個第二模型,并基于所述查詢數(shù)據(jù)及所述檢索數(shù)據(jù),確定每個所述生成數(shù)據(jù)的第一可信度;
7、將所述查詢數(shù)據(jù)、所述檢索數(shù)據(jù)、所述生成數(shù)據(jù)及所述第一可信度,關(guān)聯(lián)存入所述目標模型關(guān)聯(lián)的訓練數(shù)據(jù)庫中。
8、本公開第二方面實施例提出了一種模型更新方法,包括:
9、基于訓練數(shù)據(jù)庫中包含的新增數(shù)據(jù)的數(shù)據(jù)量、新增數(shù)據(jù)的類型、目標模型當前的性能參數(shù)中的至少一項,確定目標更新方式,其中,所述訓練數(shù)據(jù)庫中的新增數(shù)據(jù)為通過如本公開第一方面所述的方法生成的;
10、基于所述目標更新方式,從所述訓練數(shù)據(jù)庫中獲取訓練數(shù)據(jù);
11、根據(jù)所述訓練數(shù)據(jù)對所述目標模型進行更新訓練。
12、本公開第三方面實施例提出了一種人機交互方法,包括:
13、接收輸入語句;
14、對所述輸入語句進行識別,確定所述輸入關(guān)聯(lián)的目標業(yè)務(wù);
15、將所述輸入語句,輸入至與所述目標業(yè)務(wù)關(guān)聯(lián)的目標模型,得到所述輸入語句對應(yīng)的答復(fù)語句,其中,所述目標模型為通過本公開第二方面所述的方法生成的。
16、本公開第四方面實施例提出了一種人機交互智能體系統(tǒng),包括:
17、輸入組件,用于獲取輸入語句;
18、處理組件,用于調(diào)用第一智能體對所述輸入語句進行識別,確定所述輸入語句關(guān)聯(lián)的目標業(yè)務(wù),并調(diào)用所述目標業(yè)務(wù)關(guān)聯(lián)的第二智能體,以得到所述第二智能體輸出的答復(fù)語句,其中,所述第一智能體及所述第二智能體中的至少一個,被配置為用于調(diào)用本公開第二方面所述的方法生成的模型以完成對應(yīng)的功能;
19、輸出組件,用于輸出所述答復(fù)語句。
20、本公開第五方面實施例提出了一種數(shù)據(jù)處理裝置,包括:
21、第一獲取模塊,用于獲取使用目標模型的業(yè)務(wù)系統(tǒng)的日志數(shù)據(jù);
22、第二獲取模塊,用于對所述日志數(shù)據(jù)進行解析,獲取查詢數(shù)據(jù),及所述查詢數(shù)據(jù)對應(yīng)的檢索數(shù)據(jù);
23、處理模塊,用于將所述查詢數(shù)據(jù)和所述檢索數(shù)據(jù),分別輸入所述目標模型及第一模型,得到至少兩個生成數(shù)據(jù);
24、第一確定模塊,用于利用至少兩個第二模型,并基于所述查詢數(shù)據(jù)及所述檢索數(shù)據(jù),確定每個所述生成數(shù)據(jù)的第一可信度;
25、存儲模塊,用于將所述查詢數(shù)據(jù)、所述檢索數(shù)據(jù)、所述生成數(shù)據(jù)及所述第一可信度,關(guān)聯(lián)存入所述目標模型關(guān)聯(lián)的訓練數(shù)據(jù)庫中。
26、本公開第六方面實施例提出了一種模型更新裝置,包括:
27、第二確定模塊,用于基于訓練數(shù)據(jù)庫中包含的新增數(shù)據(jù)的數(shù)據(jù)量、新增數(shù)據(jù)的類型、目標模型當前的性能參數(shù)中的至少一項,確定目標更新方式,其中,所述訓練數(shù)據(jù)庫中的新增數(shù)據(jù)為通過如本公開第一方面所述的方法生成的;
28、第三獲取模塊,用于基于所述目標更新方式,從所述訓練數(shù)據(jù)庫中獲取訓練數(shù)據(jù);
29、訓練模塊,用于根據(jù)所述訓練數(shù)據(jù)對所述目標模型進行更新訓練。
30、本公開第七方面實施例提出了一種計算機設(shè)備,包括:存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時,實現(xiàn)如本公開第一方面實施例提出的數(shù)據(jù)處理方法、如本公開第二方面實施例提出的模型更新方法、或如本公開第三方面實施例提出的人機交互方法。
31、本公開第八方面實施例提出了一種計算機可讀存儲介質(zhì),存儲有計算機程序,所述計算機程序被處理器執(zhí)行時,實現(xiàn)如本公開第一方面實施例提出的數(shù)據(jù)處理方法、如本公開第二方面實施例提出的模型更新方法、或如本公開第三方面實施例提出的人機交互方法。
32、本公開第九方面實施例提出了一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序在被處理器執(zhí)行時,實現(xiàn)如本公開第一方面實施例提出的數(shù)據(jù)處理方法、如本公開第二方面實施例提出的模型更新方法、或如本公開第三方面實施例提出的人機交互方法。
33、本公開提供的數(shù)據(jù)處理方法、人機交互方法、智能體系統(tǒng)及裝置,存在如下有益效果:
34、本公開實施例中,首先獲取使用目標模型的業(yè)務(wù)系統(tǒng)的日志數(shù)據(jù),并對日志數(shù)據(jù)進行解析,獲取查詢數(shù)據(jù),及查詢數(shù)據(jù)對應(yīng)的檢索數(shù)據(jù),然后將查詢數(shù)據(jù)和檢索數(shù)據(jù),分別輸入目標模型及第一模型,得到至少兩個生成數(shù)據(jù),之后利用至少兩個第二模型,并基于查詢數(shù)據(jù)及檢索數(shù)據(jù),確定每個生成數(shù)據(jù)的第一可信度,最后將查詢數(shù)據(jù)、檢索數(shù)據(jù)、生成數(shù)據(jù)及第一可信度,關(guān)聯(lián)存入目標模型關(guān)聯(lián)的訓練數(shù)據(jù)庫中。由此,通過基于使用目標系統(tǒng)的業(yè)務(wù)系統(tǒng)的日志數(shù)據(jù),獲得查詢數(shù)據(jù)以及檢索數(shù)據(jù),并基于目標模型以及第一模型,分別生成查詢數(shù)據(jù)以及檢索數(shù)據(jù)對應(yīng)的生成數(shù)據(jù),利用第二模型對生成數(shù)據(jù)進行評估并獲得可信度,將查詢數(shù)據(jù)、檢索數(shù)據(jù)、生成數(shù)據(jù)以及可信度,關(guān)聯(lián)存入目標模型對應(yīng)的數(shù)據(jù)庫中,從而保證了目標模型關(guān)聯(lián)的訓練數(shù)據(jù)庫中的訓練數(shù)據(jù)擬合真實業(yè)務(wù)場景數(shù)據(jù),提高了數(shù)據(jù)質(zhì)量以及準確性。
35、應(yīng)當理解,本部分所描述的內(nèi)容并非旨在標識本公開的實施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
1.一種數(shù)據(jù)處理方法,包括:
2.如權(quán)利要求1所述的方法,其中,所述對所述日志數(shù)據(jù)進行解析,獲取查詢數(shù)據(jù),及所述查詢數(shù)據(jù)對應(yīng)的檢索數(shù)據(jù),包括:
3.如權(quán)利要求1所述的方法,其中,所述將所述查詢數(shù)據(jù)和所述檢索數(shù)據(jù),分別輸入所述目標模型及第一模型,得到至少兩個生成數(shù)據(jù),包括:
4.如權(quán)利要求3所述的方法,其中,在所述利用至少兩個第二模型,并基于所述查詢數(shù)據(jù)及所述檢索數(shù)據(jù),確定每個所述生成數(shù)據(jù)的第一可信度之前,所述方法還包括:
5.如權(quán)利要求4所述的方法,其中,所述利用至少兩個第二模型,并基于所述查詢數(shù)據(jù)及所述檢索數(shù)據(jù),確定每個所述生成數(shù)據(jù)的第一可信度,包括:
6.如權(quán)利要求5所述的方法,其中,所述根據(jù)每個所述生成數(shù)據(jù)對應(yīng)的所述第二可信度,確定所述第一可信度,包括:
7.如權(quán)利要求5所述的方法,其中,所述根據(jù)每個所述生成數(shù)據(jù)對應(yīng)的所述第二可信度,確定所述第一可信度,包括:
8.一種模型更新方法,包括:
9.如權(quán)利要求8所述的方法,其中,在所述根據(jù)所述訓練數(shù)據(jù)對所述目標模型進行更新訓練之后,所述方法還包括:
10.如權(quán)利要求9所述的方法,其中,所述方法還包括:
11.如權(quán)利要求8-10任一所述的方法,其中,在所述基于訓練數(shù)據(jù)庫中包含的新增數(shù)據(jù)的數(shù)據(jù)量、新增數(shù)據(jù)的類型、目標模型當前的性能參數(shù)中的至少一項,確定目標更新方式之前,所述方法還包括:
12.一種人機交互方法,包括:
13.一種人機交互智能體系統(tǒng),包括:
14.一種數(shù)據(jù)處理裝置,其中,所述裝置包括:
15.如權(quán)利要求14所述的裝置,其中,所述第二獲取模塊,具體用于:
16.如權(quán)利要求14所述的裝置,其中,所述處理模塊,具體用于:
17.如權(quán)利要求16所述的裝置,其中,所述第一確定模塊,還用于:
18.如權(quán)利要求17所述的裝置,其中,所述第一確定模塊,還用于:
19.如權(quán)利要求18所述的裝置,其中,所述第一確定模塊,還用于:
20.如權(quán)利要求18所述的裝置,其中,所述第一確定模塊,還用于:
21.一種模型更新裝置,其中,所述裝置包括:
22.如權(quán)利要求21所述的裝置,其中,所述訓練模塊,還用于:
23.如權(quán)利要求22所述的裝置,其中,所述裝置還包括:
24.如權(quán)利要求21-23任一所述的裝置,其中,所述第二確定模塊,還用于:
25.一種人機交互裝置,其中,所述裝置包括:
26.一種電子設(shè)備,其特征在于,包括:
27.一種存儲有計算機指令的非瞬時計算機可讀存儲介質(zhì),其中,所述計算機指令用于使所述計算機執(zhí)行根據(jù)權(quán)利要求1-7中任一項所述的數(shù)據(jù)處理方法、權(quán)利要求8-11中任一所述的模型更新方法、或權(quán)利要求12所述的人機交互方法。
28.一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序在被處理器執(zhí)行時實現(xiàn)根據(jù)權(quán)利要求1-7中任一項所述的數(shù)據(jù)處理方法、權(quán)利要求8-11中任一所述的模型更新方法、或權(quán)利要求12所述的人機交互方法。