本申請屬于計(jì)算機(jī)大模型,特別涉及一種大語言模型數(shù)學(xué)推理優(yōu)化方法及電子設(shè)備。
背景技術(shù):
1、在人工智能和大規(guī)模語言模型(llm,large?language?model)快速發(fā)展的背景下,使用llm來解決數(shù)學(xué)推理問題逐漸成為一個(gè)重要的研究方向。尤其是近年來,大模型使用程序化推理(program?of?thought,pot)技術(shù),用于解決數(shù)學(xué)領(lǐng)域的問題的方法逐漸興起,通過生成可以執(zhí)行的程序代碼來推導(dǎo)出復(fù)雜數(shù)學(xué)問題的解決方案。然而,現(xiàn)有技術(shù)方案仍然存在多個(gè)限制,比如存在缺乏通用性,計(jì)算成本高,復(fù)雜問題解決率低等問題,導(dǎo)致llm在應(yīng)對數(shù)學(xué)推理任務(wù)時(shí)表現(xiàn)不佳。
2、針對上述問題,提出本申請的大語言模型數(shù)學(xué)推理優(yōu)化方法及電子設(shè)備。
技術(shù)實(shí)現(xiàn)思路
1、為了解決所述現(xiàn)有技術(shù)的不足,本申請?zhí)峁┝艘环N大語言模型數(shù)學(xué)推理優(yōu)化方法及電子設(shè)備,解決現(xiàn)有技術(shù)中的llm缺乏通用性,計(jì)算成本高,復(fù)雜問題解決率低等問題。
2、本申請所要達(dá)到的技術(shù)效果通過以下方案實(shí)現(xiàn):
3、第一方面,本申請?zhí)峁┮环N大語言模型數(shù)學(xué)推理優(yōu)化方法,所述方法包括:
4、獲取原始數(shù)學(xué)推理問題,所述原始數(shù)學(xué)推理問題中包括多個(gè)數(shù)值,利用對應(yīng)的多個(gè)變量替代所述多個(gè)數(shù)值;
5、基于所述原始數(shù)學(xué)推理問題和所述多個(gè)變量,利用生成模型生成第一通用解題程序;
6、利用解釋器執(zhí)行所述第一通用解題程序,獲得執(zhí)行結(jié)果,將所述執(zhí)行結(jié)果反饋至所述生成模型,所述生成模型通過多輪對話確定目標(biāo)通用解題程序;
7、通過數(shù)據(jù)增強(qiáng)技術(shù)將所述目標(biāo)通用解題程序規(guī)?;?,獲得對應(yīng)的目標(biāo)指令數(shù)據(jù)集。
8、在一些實(shí)施例中,所述生成模型包括:
9、大語言模型;或者
10、代碼大模型。
11、在一些實(shí)施例中,所述獲取原始數(shù)學(xué)推理問題,所述原始數(shù)學(xué)推理問題中包括多個(gè)數(shù)值,利用對應(yīng)的多個(gè)變量替代所述多個(gè)數(shù)值,包括:
12、所述獲取原始數(shù)學(xué)推理問題,從所述原始數(shù)學(xué)推理問題中提取多個(gè)數(shù)值;
13、確定與所述多個(gè)數(shù)值適配的多個(gè)變量;
14、利用所述多個(gè)變量替換所述原始數(shù)學(xué)推理問題中的所述多個(gè)數(shù)值;
15、利用替換后的所述原始數(shù)學(xué)推理問題構(gòu)造成為通用數(shù)學(xué)問題。
16、在一些實(shí)施例中,所述基于所述原始數(shù)學(xué)推理問題和所述多個(gè)變量,利用生成模型生成第一通用解題程序,包括:
17、基于通用數(shù)學(xué)問題,利用大語言模型或者代碼大模型生成相應(yīng)的函數(shù)式代碼;
18、通過調(diào)用目標(biāo)子函數(shù)完成所述函數(shù)式代碼的內(nèi)部邏輯問題的求解;
19、對所述函數(shù)式代碼中的每一行代碼以及每個(gè)函數(shù)都進(jìn)行注釋;
20、將注釋后的所述函數(shù)式代碼作為第一通用解題程序。
21、在一些實(shí)施例中,所述函數(shù)式代碼包括不同版本的多個(gè)代碼。
22、在一些實(shí)施例中,所述生成模型通過多輪對話確定目標(biāo)通用解題程序,包括:
23、在所述多輪對話的過程中,將所述原始數(shù)學(xué)推理問題、相關(guān)的程序、對應(yīng)的測試輸入以及真實(shí)答案提供給所述生成模型;
24、所述生成模型修改所述相關(guān)的程序中的邏輯錯誤;
25、所述生成模型通過反饋迭代,形成目標(biāo)通用解題程序。
26、在一些實(shí)施例中,所述通過數(shù)據(jù)增強(qiáng)技術(shù)將所述目標(biāo)通用解題程序規(guī)?;?,獲得對應(yīng)的目標(biāo)指令數(shù)據(jù)集,包括:
27、對所述目標(biāo)通用解題程序中的變量與參數(shù)進(jìn)行自動替換,得到多組問題以及與問題對應(yīng)的解法;
28、通過改變所述目標(biāo)通用解題程序中的提問方式,得到多個(gè)語法不同但是數(shù)學(xué)邏輯相同的變體問題;
29、基于多組問題、與問題對應(yīng)的解法以及所述變體問題三者,結(jié)合目標(biāo)數(shù)學(xué)操作,通過規(guī)則化編程的方式批量生成目標(biāo)指令數(shù)據(jù)集。
30、在一些實(shí)施例中,所述目標(biāo)數(shù)學(xué)操作包括:多元方程和非線性函數(shù)。
31、第二方面,本申請?zhí)峁┮环N電子設(shè)備,所述電子設(shè)備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)前述任意一項(xiàng)所述的方法。
32、第三方面,本申請?zhí)峁┮环N計(jì)算機(jī)可讀存儲介質(zhì),所述計(jì)算機(jī)可讀存儲介質(zhì)存儲有一個(gè)或者多個(gè)程序,所述一個(gè)或者多個(gè)程序可被一個(gè)或者多個(gè)處理器執(zhí)行,以實(shí)現(xiàn)前述任一項(xiàng)所述的方法。
33、通過本申請實(shí)施例提供的大語言模型數(shù)學(xué)推理優(yōu)化方法及電子設(shè)備,該方法引入通用化問題生成的概念,并通過大規(guī)模語言模型生成可復(fù)用的函數(shù)式代碼,同時(shí)通過自動執(zhí)行與多輪對話修正機(jī)制,實(shí)現(xiàn)了顯著提高問題解決的準(zhǔn)確性與效率的技術(shù)效果。
1.一種大語言模型數(shù)學(xué)推理優(yōu)化方法,其特征在于,所述方法包括:
2.如權(quán)利要求1所述的大語言模型數(shù)學(xué)推理優(yōu)化方法,其特征在于,所述生成模型包括:
3.如權(quán)利要求1或2所述的大語言模型數(shù)學(xué)推理優(yōu)化方法,其特征在于,所述獲取原始數(shù)學(xué)推理問題,所述原始數(shù)學(xué)推理問題中包括多個(gè)數(shù)值,利用對應(yīng)的多個(gè)變量替代所述多個(gè)數(shù)值,包括:
4.如權(quán)利要求3所述的大語言模型數(shù)學(xué)推理優(yōu)化方法,其特征在于,所述基于所述原始數(shù)學(xué)推理問題和所述多個(gè)變量,利用生成模型生成第一通用解題程序,包括:
5.如權(quán)利要求4所述的大語言模型數(shù)學(xué)推理優(yōu)化方法,其特征在于,所述函數(shù)式代碼包括不同版本的多個(gè)代碼。
6.如權(quán)利要求1所述的大語言模型數(shù)學(xué)推理優(yōu)化方法,其特征在于,所述生成模型通過多輪對話確定目標(biāo)通用解題程序,包括:
7.如權(quán)利要求6所述的大語言模型數(shù)學(xué)推理優(yōu)化方法,其特征在于,所述通過數(shù)據(jù)增強(qiáng)技術(shù)將所述目標(biāo)通用解題程序規(guī)?;?,獲得對應(yīng)的目標(biāo)指令數(shù)據(jù)集,包括:
8.如權(quán)利要求7所述的大語言模型數(shù)學(xué)推理優(yōu)化方法,其特征在于,所述目標(biāo)數(shù)學(xué)操作包括:多元方程和非線性函數(shù)。
9.一種電子設(shè)備,所述電子設(shè)備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至8中任意一項(xiàng)所述的方法。
10.一種計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲介質(zhì)存儲有一個(gè)或者多個(gè)程序,所述一個(gè)或者多個(gè)程序可被一個(gè)或者多個(gè)處理器執(zhí)行,以實(shí)現(xiàn)如權(quán)利要求1至8任意一項(xiàng)所述的方法。