本申請涉及工程機械,具體地涉及一種工程機械大語言模型檢索增強生成方法、工程機械大語言模型檢索增強生成系統(tǒng)、電子設備以及機器可讀存儲介質。
背景技術:
1、工程機械領域由于具有結構特殊以及數據保密性的特點,因此通用領域大規(guī)模語言模型直接應用在工程機械領域所得到的問答結果不足以滿足使用需求。并且工程機械領域對數據的準確性要求較高,因此大模型的幻覺問題會導致通用模型表現效果不滿足需求,目前檢索增強生成的方法雖然可以有效的降低幻覺,可以保證搜索結果的廣度,但是卻不能保證其結果的準確度。因此,如何在工程機械領域構造有效的檢索增強生成方法以提高搜索結果的準確度尤為重要。
技術實現思路
1、本申請實施例的目的是提供一種工程機械大語言模型檢索增強生成方法、工程機械大語言模型檢索增強生成系統(tǒng)、電子設備以及機器可讀存儲介質,用以部分或全部地解決現有技術中工程機械大預言模型檢索結果準確性低的問題。
2、為了實現上述目的,本申請第一方面提供一種工程機械大語言模型檢索增強生成方法。
3、在本申請實施例中,所述方法包括:對用戶輸入的工程機械相關文本進行實體識別,得到用戶輸入文本內的工程機械相關實體;將所述用戶輸入文本內的工程機械相關實體按照其在用戶輸入的工程機械相關文本的順序進組合,得到組合文本;對所述組合文本進行第一次二分類和第二次二分類,得到所述組合文本所屬的自定義類別;根據所述用戶輸入文本內的工程機械相關實體以及工程機械知識圖譜,得到所述用戶輸入的工程機械相關文本在所述工程機械知識圖譜內對應的類別;當得到的所述用戶輸入文本內的工程機械相關實體的實體類別符合所述組合文本所屬的自定義類別時,將兩者進行組合輸入所述工程機械大語言模型得到模型生成結果。
4、可選地,所述方法還包括:當得到的所述用戶輸入文本內的工程機械相關實體的實體類別不符合所述組合文本所屬的自定義類別時,將工程機械知識圖譜查詢到的輸入相關數據與用戶輸入的用戶輸入的工程機械相關文本拼接,并重復執(zhí)行所述對所述組合文本進行第一次二分類和第二次二分類及其之后的步驟,直至所述得到的所述用戶輸入文本內的工程機械相關實體的實體類別符合所述組合文本所屬的自定義類別。
5、可選地,所述對所述組合文本進行第一次二分類和第二次二分類,得到所述組合文本所屬的自定義類別包括:對所述組合文本進行第一次二分類,得到與所述第一次二分類對應的自定義類別,所述第一次二分類對應的自定義類別包括數據和知識;當得到與所述第一次二分類對應的自定義類別為數據時,對所述組合文本進行第二次二分類得到與所述數據對應的自定義類別,所述數據對應的自定義類別包括工況和分析;或者,當得到與所述第一次二分類對應的自定義類別為知識時,對所述組合文本進行第二次二分類得到與所述知識對應的自定義類別,所述知識對應的自定義類別為故障和維保。
6、可選地,所述方法還包括:當對所述組合文本進行第二次二分類得到的自定義類別為工況時,獲取用戶輸入文本內的工程機械相關實體對應的工況數據;或者,當所述組合文本進行第二次二分類得到的自定義類別為分析時,獲取用戶輸入文本內的工程機械相關實體對應的分析模型,得到用戶輸入文本內的工程機械相關實體對應的分析結果。
7、可選地,所述方法還包括:當組合文本進行第二次二分類得到的自定義類別為故障時,獲取用戶輸入文本內的工程機械相關實體對應的故障處理方法;或者,當組合文本進行第二次二分類得到的自定義類別為維保時,獲取用戶輸入文本內的工程機械相關實體對應的維保知識。
8、可選地,所述根據所述用戶輸入文本內的工程機械相關實體以及工程機械知識圖譜,得到所述用戶輸入的工程機械相關文本在所述工程機械知識圖譜內對應的類別包括:根據所述用戶輸入文本內的工程機械相關實體,得到所述用戶輸入文本內的工程機械相關實體的多個實體類別;按照屬于同一實體類別的所述用戶輸入文本內的工程機械相關實體進行分組,并將分組后的所述用戶輸入文本內的工程機械相關實體輸入到工程機械知識圖譜中,得到所述用戶輸入的工程機械相關文本在所述工程機械知識圖譜內對應的類別。
9、本申請第二方面提供一種工程機械大語言模型檢索增強生成系統(tǒng),所述系統(tǒng)包括:第一獲取模塊,用于對用戶輸入的工程機械相關文本進行實體識別,得到用戶輸入文本內的工程機械相關實體;第二獲取模塊,用于將所述用戶輸入文本內的工程機械相關實體按照其在用戶輸入的工程機械相關文本的順序進組合,得到組合文本;第三獲取模塊,用于對所述組合文本進行第一次二分類和第二次二分類,得到所述組合文本所屬的自定義類別;第四獲取模塊,根據所述用戶輸入文本內的工程機械相關實體以及工程機械知識圖譜,得到所述用戶輸入的工程機械相關文本在所述工程機械知識圖譜內對應的類別;生成模塊,用于當得到的所述用戶輸入文本內的工程機械相關實體的實體類別符合所述組合文本所屬的自定義類別時,將兩者進行組合輸入所述工程機械大語言模型得到模型生成結果。
10、可選地,所述系統(tǒng)還包括:執(zhí)行模塊,用于當得到的所述用戶輸入文本內的工程機械相關實體的實體類別不符合所述組合文本所屬的自定義類別時,將工程機械知識圖譜查詢到的輸入相關數據與用戶輸入的用戶輸入的工程機械相關文本拼接,并重復執(zhí)行所述對所述組合文本進行第一次二分類和第二次二分類及其之后的步驟,直至所述得到的所述用戶輸入文本內的工程機械相關實體的實體類別符合所述組合文本所屬的自定義類別。
11、本申請第三方面提供一種電子設備,包括:處理器,以及與所述處理器通信連接的存儲器;所述存儲器存儲計算機執(zhí)行指令;所述處理器執(zhí)行所述存儲器存儲的計算機執(zhí)行指令,以實現如所述的工程機械大語言模型檢索增強生成方法。
12、本申請第四方面提供一種機器可讀存儲介質,該機器可讀存儲介質上存儲有指令,該指令用于使得機器執(zhí)行所述的工程機械大語言模型檢索增強生成方法。
13、通過上述技術方案,本發(fā)明通過對用戶輸入的用戶輸入的工程機械相關文本抽取實體,然后將實體組合為文本,組合后的文本經過兩次二分類模型進行分類就得到了該輸入文本的所屬類別,然后根據所屬類別的知識庫來尋找對應的答案;獲得答案后與知識圖譜根據實體來進行判斷得到的分類進行對比,如果二者結果一致,那么就將結果組合為提示詞輸入給工程機械大模型,最后得到模型輸出結果。
14、由此可知,本發(fā)明通過使用兩層分類的方法快速對輸入的文本進行定位,并根據輸入文本對應的類別來提供對應的數據;通過圖譜的方式來輔助對分類結果進行判斷,確保分類結果的準確性,使工程機械大語言模型回答的結果更加準確。
15、本申請實施例的其它特征和優(yōu)點將在隨后的具體實施方式部分予以詳細說明。
1.一種工程機械大語言模型檢索增強生成方法,其特征在于,包括:
2.根據權利要求1所述的工程機械大語言模型檢索增強生成方法,其特征在于,所述方法還包括:當得到的所述用戶輸入文本內的工程機械相關實體的實體類別不符合所述組合文本所屬的自定義類別時,
3.根據權利要求1所述的工程機械大語言模型檢索增強生成方法,其特征在于,所述對所述組合文本進行第一次二分類和第二次二分類,得到所述組合文本所屬的自定義類別包括:
4.根據權利要求3所述的工程機械大語言模型檢索增強生成方法,其特征在于,所述方法還包括:當對所述組合文本進行第二次二分類得到的自定義類別為工況時,獲取用戶輸入文本內的工程機械相關實體對應的工況數據;或者,
5.根據權利要求3所述的工程機械大語言模型檢索增強生成方法,其特征在于,所述方法還包括:當組合文本進行第二次二分類得到的自定義類別為故障時,獲取用戶輸入文本內的工程機械相關實體對應的故障處理方法;或者,
6.根據權利要求1所述的工程機械大語言模型檢索增強生成方法,其特征在于,所述根據所述用戶輸入文本內的工程機械相關實體以及工程機械知識圖譜,得到所述用戶輸入的工程機械相關文本在所述工程機械知識圖譜內對應的類別包括:
7.一種工程機械大語言模型檢索增強生成系統(tǒng),其特征在于,包括:
8.根據權利要求7所述的工程機械大語言模型檢索增強生成系統(tǒng),其特征在于,還包括:
9.一種電子設備,其特征在于,包括:處理器,以及與所述處理器通信連接的存儲器;
10.一種機器可讀存儲介質,其特征在于,該機器可讀存儲介質上存儲有指令,該指令用于使得機器執(zhí)行根據權利要求1至6中任一項所述的工程機械大語言模型檢索增強生成方法。