本發(fā)明涉及人工智能,尤其涉及一種基于大語言模型的問答方法及系統(tǒng)。
背景技術(shù):
1、智能問答如今已成為人們解決問題、快速獲取相關(guān)信息的一種重要方式。問答系統(tǒng)是一種對用戶使用自然語言提出的問題能夠盡可能快速、準(zhǔn)確回答的程序。早期知識問答任務(wù)一般為單輪對話設(shè)定,分別有基于檢索或者基于語義解析的方法。基于檢索的知識問答方法,首先將用戶的自然語言問題轉(zhuǎn)換為嵌入形式,并與知識圖譜中的嵌入進(jìn)行相似度匹配,以從知識圖譜中提取相關(guān)信息,最終形成答案?;谡Z義解析的方法將用戶的自然語言問題解析為一組結(jié)構(gòu)化的程序,這些表達(dá)式或程序一旦被執(zhí)行,便可以直接在知識庫上進(jìn)行查詢,最終給出答案。但是現(xiàn)有的問答方法往往缺乏對上下文的理解能力,無法根據(jù)上下文信息進(jìn)行準(zhǔn)確的回答。
2、隨著人工智能(artificial?intelligence,ai)技術(shù)發(fā)展,大語言模型(largelanguage?model,llm)逐漸被廣泛使用。大語言模型是較為復(fù)雜的ai模型,它可以理解和生成人類語言,大語言模型的特點(diǎn)是規(guī)模巨大,小則十億參數(shù)規(guī)模,大則百億參數(shù)規(guī)模。大語言模型常被應(yīng)用于文本摘要、問答和翻譯等場景中。例如,在問答場景中,大語言模型可通過對上下文的建模和語義理解,實(shí)現(xiàn)對上下文的感知和理解,從而提供更準(zhǔn)確和連貫的回答。但是,現(xiàn)有大語言模型面臨幻覺問題,同時無法在知識密集型的多輪問答任務(wù)給出準(zhǔn)確答案。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種基于大語言模型的問答方法及系統(tǒng),用以解決現(xiàn)有技術(shù)中大語言模型面臨幻覺問題,同時無法在知識密集型的多輪問答任務(wù)給出準(zhǔn)確答案的缺陷。發(fā)明在多輪問答任務(wù)中能夠基于上下文深入理解用戶的問題,有效檢索和整合不用的知識源的信息,從而準(zhǔn)確、高效地提供當(dāng)前問題的答案。
2、本發(fā)明提供一種基于大語言模型的問答方法,包括:確定用戶的當(dāng)前問題和自然語言理解提示詞;所述自然語言理解提示詞包括對話歷史跟蹤信息;輸入所述當(dāng)前問題和所述自然語言理解提示詞至預(yù)訓(xùn)練大語言模型,獲得所述大語言模型根據(jù)自然語言理解策略輸出的問題理解結(jié)果和待回答問題;所述問題理解結(jié)果包括問題屬性;所述問題屬性包括事實(shí)性問題;在所述問題理解結(jié)果為所述事實(shí)性問題的情況下,基于語義解析從知識圖譜檢索答案;所述語義解析為根據(jù)神經(jīng)符號知識檢索策略對所述待回答問題解析成可在知識圖譜上操作的程序;輸入所述檢索答案和答案校驗(yàn)提示詞至所述預(yù)訓(xùn)練大語言模型,獲得所述大語言模型輸出的答案校驗(yàn)結(jié)果;在所述答案校驗(yàn)結(jié)果為校驗(yàn)合理的情況下,將所述檢索答案作為所述當(dāng)前問題的最終答案;在所述答案校驗(yàn)結(jié)果為校驗(yàn)不合理的情況下,將所述大語言模型根據(jù)所述對話歷史跟蹤信息和/或模型自身參數(shù)知識生成的答案作為所述當(dāng)前問題的最終答案。
3、根據(jù)本發(fā)明提供的一種基于大語言模型的問答方法,還包括:將所述當(dāng)前問題的最終答案的生成過程進(jìn)行可解釋性的聊天界面顯示;在所述可解釋性的聊天界面中設(shè)置程序編輯選項(xiàng);所述程序編輯選項(xiàng)用于跳轉(zhuǎn)至程序編輯界面;所述程序編輯界面用于修改解析錯誤的程序。
4、根據(jù)本發(fā)明提供的一種基于大語言模型的問答方法,所述問題屬性還包括隨意性問題;所述輸入所述當(dāng)前問題和所述自然語言理解提示詞至預(yù)訓(xùn)練大語言模型,獲得所述大語言模型根據(jù)自然語言理解策略輸出的問題理解結(jié)果和待回答問題之后,還包括:在所述問題理解結(jié)果為所述隨意性問題的情況下,將所述大語言模型生成的所述待回答問題的答案作為所述當(dāng)前問題的最終答案。
5、根據(jù)本發(fā)明提供的一種基于大語言模型的問答方法,所述問題理解結(jié)果還包括完整性;所述完整性包括問題完整和問題不完整;在所述問題理解結(jié)果為所述問題完整的情況下,將所述當(dāng)前問題作為所述待回答問題;在所述問題理解結(jié)果為所述問題不完整的情況下,根據(jù)所述自然語言理解提示詞,基于所述大語言模型對所述當(dāng)前問題進(jìn)行重寫,將重寫后的問題作為所述待回答問題。
6、根據(jù)本發(fā)明提供的一種基于大語言模型的問答方法,所述問題理解結(jié)果還包括澄清性;所述澄清性包括問題需要澄清和問題不需要澄清;在所述問題理解結(jié)果為所述問題不需要澄清的情況下,根據(jù)所述自然語言理解提示詞,基于所述大語言模型對所述當(dāng)前問題進(jìn)行重寫,將重寫后的問題作為所述待回答問題;在所述問題理解結(jié)果為所述問題需要澄清的情況下,基于所述大語言模型對所述當(dāng)前問題進(jìn)行澄清響應(yīng),將澄清后的問題作為所述待回答問題。
7、根據(jù)本發(fā)明提供的一種基于大語言模型的問答方法,所述輸入所述當(dāng)前問題和所述自然語言理解提示詞至預(yù)訓(xùn)練大語言模型,獲得所述大語言模型根據(jù)自然語言理解策略輸出的問題理解結(jié)果和待回答問題之后,還包括:在所述問題理解結(jié)果為所述事實(shí)性問題且基于所述語義解析無法從所述知識圖譜檢索答案的情況下,將所述大語言模型根據(jù)所述對話歷史跟蹤信息和/或模型自身參數(shù)知識生成的答案作為所述當(dāng)前問題的最終答案;所述對話歷史跟蹤信息包括決策歷史跟蹤信息、后端聊天歷史信息和前端聊天歷史信息。
8、根據(jù)本發(fā)明提供的一種基于大語言模型的問答方法,所述神經(jīng)符號知識檢索策略,包括:輸入所述待回答問題至預(yù)訓(xùn)練的語義解析模型,獲得所述語義解析模型輸出可在所述知識圖譜上進(jìn)行推理和搜索的程序;其中,所述語義解析模型是基于kqa?pro數(shù)據(jù)集訓(xùn)練得到的。
9、根據(jù)本發(fā)明提供的一種基于大語言模型的問答方法,所述可在所述知識圖譜上操作的程序?yàn)閗opl程序;所述基于語義解析從知識圖譜檢索答案,包括:通過viskop引擎在所述知識圖譜上利用所述kopl程序進(jìn)行推理和搜索,得到所述kopl程序的檢索答案。
10、本發(fā)明還提供一種基于大語言模型的問答系統(tǒng),包括:確定模塊,用于確定用戶的當(dāng)前問題和自然語言理解提示詞;所述自然語言理解提示詞包括對話歷史跟蹤信息;理解模塊,用于輸入所述當(dāng)前問題和所述自然語言理解提示詞至預(yù)訓(xùn)練大語言模型,獲得所述大語言模型根據(jù)自然語言理解策略輸出的問題理解結(jié)果和待回答問題;所述問題理解結(jié)果包括問題屬性;所述問題屬性包括事實(shí)性問題;檢索模塊,用于在所述問題理解結(jié)果為所述事實(shí)性問題的情況下,基于語義解析從知識圖譜檢索答案;所述語義解析為根據(jù)神經(jīng)符號知識檢索策略對所述待回答問題解析成可在知識圖譜上操作的程序;校驗(yàn)?zāi)K,用于輸入所述檢索答案和答案校驗(yàn)提示詞至所述預(yù)訓(xùn)練大語言模型,獲得所述大語言模型輸出的答案校驗(yàn)結(jié)果;第一結(jié)果模塊,用于在所述答案校驗(yàn)結(jié)果為校驗(yàn)合理的情況下,將所述檢索答案作為所述當(dāng)前問題的最終答案;第二結(jié)果模塊,用于在所述答案校驗(yàn)結(jié)果為校驗(yàn)不合理的情況下,將所述大語言模型根據(jù)所述對話歷史跟蹤信息和/或模型自身參數(shù)知識生成的答案作為所述當(dāng)前問題的最終答案。
11、根據(jù)本發(fā)明提供的一種基于大語言模型的問答系統(tǒng),還包括:交互前端模塊,用于將所述當(dāng)前問題的最終答案的生成過程進(jìn)行可解釋性的聊天界面顯示;在所述可解釋性的聊天界面中設(shè)置程序編輯選項(xiàng);所述程序編輯選項(xiàng)用于跳轉(zhuǎn)至程序編輯界面;所述程序編輯界面用于修改解析錯誤的程序。
12、本發(fā)明提供的一種基于大語言模型的問答方法及系統(tǒng),該方法包括:確定用戶的當(dāng)前問題和自然語言理解提示詞;輸入當(dāng)前問題和自然語言理解提示詞至預(yù)訓(xùn)練大語言模型,獲得大語言模型根據(jù)自然語言理解策略輸出的問題理解結(jié)果和待回答問題;在問題理解結(jié)果為事實(shí)性問題的情況下,基于語義解析從知識圖譜檢索答案;輸入檢索答案和答案校驗(yàn)提示詞至預(yù)訓(xùn)練大語言模型,得到答案校驗(yàn)結(jié)果;在校驗(yàn)合理的情況下,將檢索答案作為當(dāng)前問題的最終答案;在校驗(yàn)不合理的情況下,大語言模型生成答案。本發(fā)明在多輪問答任務(wù)中能夠深入理解用戶的問題,有效檢索和整合不用的知識源的信息,從而準(zhǔn)確、高效地提供當(dāng)前問題的答案。