本申請涉及人工智能,尤其涉及一種提示詞生成方法及相關裝置。
背景技術:
1、隨著大數(shù)據(jù)和深度學習技術的發(fā)展,大語言模型因其強大的文本處理能力和廣泛的應用場景而備受關注。大語言模型在實際應用中需要有效的提示詞來引導其生成更準確、更相關的文本輸出。提示詞編寫通常需要大量的手工調整和試驗以找到最優(yōu)的提示詞,每當遇到新的任務或領域時,通常需要從頭開始設計新的提示詞,這不僅耗時耗力,而且難以快速推廣到其他場景。提示詞生成過程的自動化程度不足限制了大語言模型在處理大規(guī)模數(shù)據(jù)集或執(zhí)行復雜任務時的性能。
技術實現(xiàn)思路
1、鑒于上述問題,本申請?zhí)峁┝艘环N提示詞生成方法及相關裝置,以實現(xiàn)自動生成提示詞的目的。具體方案如下:
2、本申請第一方面提供一種提示詞生成方法,包括:
3、獲取目標提示詞和數(shù)據(jù)集;所述數(shù)據(jù)集包括多個輸入輸出對,每個所述輸入輸出對包括目標輸入數(shù)據(jù)和目標輸出數(shù)據(jù);
4、將所述目標提示詞和所述目標輸入數(shù)據(jù)輸入第一大語言模型,得到多個模型輸出數(shù)據(jù);
5、根據(jù)所述模型輸出數(shù)據(jù)和所述目標輸出數(shù)據(jù),計算所述第一大語言模型的輸出質量分數(shù);其中,所述輸出質量分數(shù)反映所述模型輸出數(shù)據(jù)與所述目標輸出數(shù)據(jù)的一致性程度;
6、判斷是否生成所述第一大語言模型的提示詞;若是,則根據(jù)所述輸出質量分數(shù)得到所述第一大語言模型的提示詞;若否,則將所述模型輸出數(shù)據(jù)與所述目標輸出數(shù)據(jù)進行對比,得到提示詞問題模板,基于所述提示詞問題模板對所述目標提示詞進行更新,然后執(zhí)行所述將所述目標提示詞和所述目標輸入數(shù)據(jù)輸入第一大語言模型。
7、在一種可能的實現(xiàn)中,所述將所述模型輸出數(shù)據(jù)與所述目標輸出數(shù)據(jù)進行對比,得到提示詞問題模板,包括:
8、將所述模型輸出數(shù)據(jù)與所述目標輸出數(shù)據(jù)進行對比,判斷所述模型輸出數(shù)據(jù)與所述目標輸出數(shù)據(jù)是否一致;
9、若所述模型輸出數(shù)據(jù)與所述目標輸出數(shù)據(jù)不一致,則將所述模型輸出數(shù)據(jù)和與所述模型輸出數(shù)據(jù)對應的目標輸出數(shù)據(jù)進行關聯(lián),得到關聯(lián)數(shù)據(jù)對;
10、根據(jù)所述關聯(lián)數(shù)據(jù)對生成提示詞問題模板。
11、在一種可能的實現(xiàn)中,所述基于所述提示詞問題模板對所述目標提示詞進行更新,包括:
12、對每次更新過程中得到的所述第一大語言模型的輸出質量分數(shù)進行降序排列;
13、篩選位于前s個輸出質量分數(shù)對應的目標提示詞,得到篩選后的目標提示詞;
14、將所述篩選后的目標提示詞和與所述篩選后的目標提示詞對應的提示詞問題模板輸入第二大語言模型,采用進化算法對所述目標提示詞進行更新。
15、在一種可能的實現(xiàn)中,所述判斷是否生成所述第一大語言模型的提示詞,包括:
16、在相鄰m次更新過程中計算得到的所述第一大語言模型的輸出質量分數(shù)的變化量小于預設變化量時,或在更新所述目標提示詞的次數(shù)達到預設次數(shù)時,生成所述第一大語言模型的提示詞。
17、在一種可能的實現(xiàn)中,所述根據(jù)所述模型輸出數(shù)據(jù)和所述目標輸出數(shù)據(jù),計算所述第一大語言模型的輸出質量分數(shù),包括:
18、將所述模型輸出數(shù)據(jù)和所述目標輸出數(shù)據(jù)輸入第二大語言模型,得到第一分數(shù);
19、根據(jù)所述模型輸出數(shù)據(jù)和所述目標輸出數(shù)據(jù)計算f1分數(shù),得到第二分數(shù);
20、根據(jù)所述模型輸出數(shù)據(jù)和所述目標輸出數(shù)據(jù)計算bleu分數(shù),得到第三分數(shù);
21、根據(jù)所述模型輸出數(shù)據(jù)和所述目標輸出數(shù)據(jù)計算rouge分數(shù),得到第四分數(shù);
22、根據(jù)所述模型輸出數(shù)據(jù)和所述目標輸出數(shù)據(jù),使用embedding模型計算相似度分數(shù),得到第五分數(shù);
23、對所述第一分數(shù)、所述第二分數(shù)、所述第三分數(shù)、所述第四分數(shù)和所述第五分數(shù)進行加權求和,得到所述第一大語言模型的輸出質量分數(shù)。
24、在一種可能的實現(xiàn)中,所述獲取目標提示詞,包括:
25、獲取目標模板;所述目標模板包括參考輸入數(shù)據(jù)和參考輸出數(shù)據(jù);
26、將所述目標模板輸入所述第一大語言模型,得到所述目標提示詞。
27、本申請第二方面提供一種提示詞生成系統(tǒng),包括:
28、數(shù)據(jù)獲取模塊,用于獲取目標提示詞和數(shù)據(jù)集;所述數(shù)據(jù)集包括多個輸入輸出對,每個所述輸入輸出對包括目標輸入數(shù)據(jù)和目標輸出數(shù)據(jù);
29、模型處理模塊,用于將所述目標提示詞和所述目標輸入數(shù)據(jù)輸入第一大語言模型,得到多個模型輸出數(shù)據(jù);
30、分數(shù)計算模塊,用于根據(jù)所述模型輸出數(shù)據(jù)和所述目標輸出數(shù)據(jù),計算所述第一大語言模型的輸出質量分數(shù);其中,所述輸出質量分數(shù)反映所述模型輸出數(shù)據(jù)與所述目標輸出數(shù)據(jù)的一致性程度;
31、判斷模塊,用于判斷是否生成所述第一大語言模型的提示詞;若是,則執(zhí)行提示詞生成模塊;若否,則執(zhí)行提示詞更新模塊;
32、所述提示詞生成模塊,用于根據(jù)所述輸出質量分數(shù)得到所述第一大語言模型的提示詞;
33、所述提示詞更新模塊,用于將所述模型輸出數(shù)據(jù)與所述目標輸出數(shù)據(jù)進行對比,得到提示詞問題模板,基于所述提示詞問題模板對所述目標提示詞進行更新,然后執(zhí)行所述模型處理模塊。
34、本申請第三方面提供一種計算機程序產品,包括計算機可讀指令,當所述計算機可讀指令在電子設備上運行時,使得所述電子設備實現(xiàn)上述第一方面或第一方面任一實現(xiàn)方式的提示詞生成方法。
35、本申請第四方面提供一種電子設備,包括至少一個處理器和與所述處理器連接的存儲器,其中:
36、所述存儲器用于存儲計算機程序;
37、所述處理器用于執(zhí)行所述計算機程序,以使所述電子設備能夠實現(xiàn)上述第一方面或第一方面任一實現(xiàn)方式的提示詞生成方法。
38、本申請第五方面提供一種計算機存儲介質,所述存儲介質承載有一個或多個計算機程序,當所述一個或多個計算機程序被電子設備執(zhí)行時,能夠使所述電子設備上述第一方面或第一方面任一實現(xiàn)方式的提示詞生成方法。
39、借由上述技術方案,本申請?zhí)峁┑奶崾驹~生成方法及相關裝置,將目標提示詞和目標輸入數(shù)據(jù)輸入第一大語言模型,得到多個模型輸出數(shù)據(jù);根據(jù)模型輸出數(shù)據(jù)和目標輸出數(shù)據(jù),計算第一大語言模型的輸出質量分數(shù);判斷是否生成第一大語言模型的提示詞;若是,則根據(jù)輸出質量分數(shù)得到第一大語言模型的提示詞;若否,則將模型輸出數(shù)據(jù)與目標輸出數(shù)據(jù)進行對比,得到提示詞問題模板,基于提示詞問題模板對目標提示詞進行更新,然后執(zhí)行將目標提示詞和目標輸入數(shù)據(jù)輸入第一大語言模型。本申請通過不同提示詞得到的模型輸出數(shù)據(jù)產生的問題對提示詞進行更新,并計算不同提示詞對應的大語言模型輸出質量分數(shù),能夠找到實現(xiàn)最優(yōu)輸出數(shù)據(jù)的提示詞,該過程不需要大量手工調整和實驗就可以找到最優(yōu)提示詞,實現(xiàn)了自動生成提示詞的目的。
1.一種提示詞生成方法,其特征在于,包括:
2.根據(jù)權利要求1所述的提示詞生成方法,其特征在于,所述將所述模型輸出數(shù)據(jù)與所述目標輸出數(shù)據(jù)進行對比,得到提示詞問題模板,包括:
3.根據(jù)權利要求1所述的提示詞生成方法,其特征在于,所述基于所述提示詞問題模板對所述目標提示詞進行更新,包括:
4.根據(jù)權利要求1所述的提示詞生成方法,其特征在于,所述判斷是否生成所述第一大語言模型的提示詞,包括:
5.根據(jù)權利要求1-4任一項所述的提示詞生成方法,其特征在于,所述根據(jù)所述模型輸出數(shù)據(jù)和所述目標輸出數(shù)據(jù),計算所述第一大語言模型的輸出質量分數(shù),包括:
6.根據(jù)權利要求1-4任一項所述的提示詞生成方法,其特征在于,所述獲取目標提示詞,包括:
7.一種提示詞生成系統(tǒng),其特征在于,包括:
8.一種計算機程序產品,其特征在于,包括計算機可讀指令,當所述計算機可讀指令在電子設備上運行時,使得所述電子設備實現(xiàn)如權利要求1至6中任意一項所述的提示詞生成方法。
9.一種電子設備,其特征在于,包括至少一個處理器和與所述處理器連接的存儲器,其中:
10.一種計算機存儲介質,其特征在于,所述存儲介質承載有一個或多個計算機程序,當所述一個或多個計算機程序被電子設備執(zhí)行時,能夠使所述電子設備實現(xiàn)如權利要求1至6中任意一項所述的提示詞生成方法。