語言模型的訓(xùn)練方法、基于語言模型的人機(jī)交互方法與流程

文檔序號(hào)：40620235發(fā)布日期：2025-01-10 18:25閱讀：7來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本公開涉及數(shù)據(jù)處理領(lǐng)域，尤其涉及深度學(xué)習(xí)、人機(jī)交互等人工智能。

背景技術(shù)：

1、大型語言模型(llm，large?language?model，其本質(zhì)是生成式模型)，如chatgpt(chat?generative?pre-trained?transformer，是openai機(jī)構(gòu)研發(fā)的聊天機(jī)器人程序)，能夠?yàn)樵S多下游任務(wù)(例如面向任務(wù)的對(duì)話和問題解答)生成類似人類的流暢響應(yīng)。其中，大語言模型通過特定領(lǐng)域的問答數(shù)據(jù)進(jìn)行訓(xùn)練，以使得大語言模型可以在特定領(lǐng)域的下游任務(wù)上獲得較好的效果。

2、但是，不同領(lǐng)域?qū)?yīng)的問答數(shù)據(jù)不同，特定領(lǐng)域的大語言模型僅適用于該領(lǐng)域的人機(jī)交互，適用范圍局限，并且不同領(lǐng)域的大語言模型需要進(jìn)行分別部署，增加了資源成本。因此，亟需一種適用于多領(lǐng)域的大語言模型，以使得大語言模型適用范圍更加廣泛。

技術(shù)實(shí)現(xiàn)思路

1、為克服相關(guān)技術(shù)中存在的問題，本公開提供一種基于語言模型的人機(jī)交互方法和基于語言模型的人機(jī)交互方法，以及對(duì)應(yīng)的裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。

2、根據(jù)本公開實(shí)施例的第一方面，提供一種語言模型的訓(xùn)練方法，所述方法包括：

3、獲取訓(xùn)練數(shù)據(jù)集，其中，所述訓(xùn)練數(shù)據(jù)集包括多種不同領(lǐng)域的訓(xùn)練數(shù)據(jù)；

4、確定待訓(xùn)練的多領(lǐng)域大語言模型，所述待訓(xùn)練的多領(lǐng)域大語言模型包括基礎(chǔ)模型和不同領(lǐng)域的第一初始微調(diào)參數(shù)，所述基礎(chǔ)模型的參數(shù)為預(yù)訓(xùn)練好的；

5、利用所述多種不同領(lǐng)域的訓(xùn)練數(shù)據(jù)對(duì)所述待訓(xùn)練的多領(lǐng)域大語言模型進(jìn)行微調(diào)訓(xùn)練，對(duì)所述不同領(lǐng)域的第一初始微調(diào)參數(shù)進(jìn)行更新，以得到目標(biāo)多領(lǐng)域大語言模型。

6、根據(jù)本公開實(shí)施例的第二方面，提供一種基于語言模型的人機(jī)交互方法，所述方法包括：

7、獲取用戶輸入的需要回答的問題數(shù)據(jù)，并確定所述問題數(shù)據(jù)所屬目標(biāo)領(lǐng)域；

8、基于所述目標(biāo)領(lǐng)域和目標(biāo)多領(lǐng)域大語言模型，確定所述目標(biāo)領(lǐng)域?qū)?yīng)的目標(biāo)大語言模型，其中，所述目標(biāo)多領(lǐng)域大語言模型基于上述第一方面描述的語言模型的訓(xùn)練方法得到；

9、將所述問題數(shù)據(jù)輸入至所述目標(biāo)大語言模型，以得到所述問題數(shù)據(jù)的目標(biāo)答案并輸出。

10、根據(jù)本公開實(shí)施例的第三方面，提供一種語言模型的訓(xùn)練裝置，所述裝置包括：

11、獲取模塊，用于獲取訓(xùn)練數(shù)據(jù)集，其中，所述訓(xùn)練數(shù)據(jù)集包括多種不同領(lǐng)域的訓(xùn)練數(shù)據(jù)；

12、確定模塊，用于確定待訓(xùn)練的多領(lǐng)域大語言模型，所述待訓(xùn)練的多領(lǐng)域大語言模型包括基礎(chǔ)模型和不同領(lǐng)域的第一初始微調(diào)參數(shù)，所述基礎(chǔ)模型的參數(shù)為預(yù)訓(xùn)練好的；

13、訓(xùn)練模塊，用于利用所述多種不同領(lǐng)域的訓(xùn)練數(shù)據(jù)對(duì)所述待訓(xùn)練的多領(lǐng)域大語言模型進(jìn)行微調(diào)訓(xùn)練，對(duì)所述不同領(lǐng)域的第一初始微調(diào)參數(shù)進(jìn)行更新，以得到目標(biāo)多領(lǐng)域大語言模型。

14、根據(jù)本公開實(shí)施例的第四方面，提供一種基于語言模型的人機(jī)交互裝置，所述裝置包括：

15、獲取模塊，用于獲取用戶輸入的需要回答的問題數(shù)據(jù)，并確定所述問題數(shù)據(jù)所屬目標(biāo)領(lǐng)域；

16、確定模塊，用于基于所述目標(biāo)領(lǐng)域和目標(biāo)多領(lǐng)域大語言模型，確定所述目標(biāo)領(lǐng)域?qū)?yīng)的目標(biāo)大語言模型，其中，所述目標(biāo)多領(lǐng)域大語言模型基于上述第三方面描述的語言模型的訓(xùn)練裝置得到；

17、輸出模塊，用于將所述問題數(shù)據(jù)輸入至所述目標(biāo)大語言模型，以得到所述問題數(shù)據(jù)的目標(biāo)答案并輸出。

18、根據(jù)本公開實(shí)施例的第五方面，提供了一種電子設(shè)備，包括：

19、處理器；

20、用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器；

21、其中，所述處理器被配置為實(shí)現(xiàn)前述第一方面或第二方面中任一項(xiàng)所述的方法。

22、根據(jù)本公開實(shí)施例的第六方面，提供了一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，所述計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令；所述計(jì)算機(jī)可執(zhí)行指令被處理器執(zhí)行后，能夠?qū)崿F(xiàn)前述第一方面或第二方面中任一項(xiàng)所述的方法。

23、本公開的實(shí)施例提供的技術(shù)方案可以包括以下有益效果：

24、本公開提出的一種語言模型的訓(xùn)練方法中，該方法包括：獲取訓(xùn)練數(shù)據(jù)集，其中，訓(xùn)練數(shù)據(jù)集包括多種不同領(lǐng)域的訓(xùn)練數(shù)據(jù)；確定待訓(xùn)練的多領(lǐng)域大語言模型，待訓(xùn)練的多領(lǐng)域大語言模型包括基礎(chǔ)模型和不同領(lǐng)域的第一初始微調(diào)參數(shù)，基礎(chǔ)模型的參數(shù)為預(yù)訓(xùn)練好的；利用多種不同領(lǐng)域的訓(xùn)練數(shù)據(jù)對(duì)待訓(xùn)練的多領(lǐng)域大語言模型進(jìn)行微調(diào)訓(xùn)練，對(duì)不同領(lǐng)域的第一初始微調(diào)參數(shù)進(jìn)行更新，以得到目標(biāo)多領(lǐng)域大語言模型。由此，本公開通過多種不同領(lǐng)域的訓(xùn)練對(duì)待訓(xùn)練的多領(lǐng)域大語言模型進(jìn)行訓(xùn)練，得到目標(biāo)多領(lǐng)域大語言模型，從而使得目標(biāo)多領(lǐng)域大語言模型可以適用于多種不同領(lǐng)域，適用范圍較廣。同時(shí)，目標(biāo)多領(lǐng)域大語言模型可以同時(shí)部署和動(dòng)態(tài)加載不同領(lǐng)域的目標(biāo)大語言模型，無需對(duì)不同領(lǐng)域的大語言模型需要進(jìn)行分別部署，降低了資源成本。

25、應(yīng)當(dāng)理解的是，以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的，并不能限制本公開。

技術(shù)特征：

1.一種語言模型的訓(xùn)練方法，其特征在于，所述方法包括：

2.如權(quán)利要求1所述的方法，其特征在于，所述獲取訓(xùn)練數(shù)據(jù)集，包括：

3.如權(quán)利要求1所述的方法，其特征在于，所述基礎(chǔ)模型包括：embedding層、n層轉(zhuǎn)換transformer層和預(yù)測層，其中，所述n為正整數(shù)。

4.如權(quán)利要求3所述的方法，其特征在于，所述訓(xùn)練數(shù)據(jù)包括問題數(shù)據(jù)和真實(shí)答案；所述利用所述多種不同領(lǐng)域的訓(xùn)練數(shù)據(jù)對(duì)所述待訓(xùn)練的多領(lǐng)域大語言模型進(jìn)行微調(diào)訓(xùn)練，對(duì)所述不同領(lǐng)域的第一初始微調(diào)參數(shù)進(jìn)行更新，以得到目標(biāo)多領(lǐng)域大語言模型，包括：

5.如權(quán)利要求4所述的方法，其特征在于，所述第一初始微調(diào)參數(shù)包括n層transformer層中每層transformer層對(duì)應(yīng)的第二初始微調(diào)參數(shù)；所述將所述問題數(shù)據(jù)的第一向量表示與所述領(lǐng)域?qū)?yīng)的第一初始微調(diào)參數(shù)輸入至所述n層transformer層中，得到所述問題數(shù)據(jù)的目標(biāo)向量表示，包括：

6.如權(quán)利要求4所述的方法，其特征在于，所述將所述目標(biāo)向量表示輸入至所述預(yù)測層，得到預(yù)測答案概率數(shù)據(jù)，并基于所述預(yù)測答案概率數(shù)據(jù)和所述真實(shí)答案得到對(duì)應(yīng)的損失值，包括：

7.一種基于語言模型的人機(jī)交互方法，其特征在于，所述方法包括：

8.如權(quán)利要求7所述的方法，其特征在于，所述基于所述目標(biāo)領(lǐng)域和目標(biāo)多領(lǐng)域大語言模型，確定所述目標(biāo)領(lǐng)域?qū)?yīng)的目標(biāo)大語言模型，包括：

9.如權(quán)利要求8所述的方法，其特征在于，所述基礎(chǔ)模型包括：embedding層、n層轉(zhuǎn)換transformer層和預(yù)測層，其中，所述n為正整數(shù)。

10.如權(quán)利要求9所述的方法，其特征在于，所述將所述問題數(shù)據(jù)輸入至所述目標(biāo)大語言模型，以得到所述問題數(shù)據(jù)的目標(biāo)答案并輸出，包括：

11.一種語言模型的訓(xùn)練裝置，其特征在于，所述裝置包括：

12.一種基于語言模型的人機(jī)交互裝置，其特征在于，所述裝置包括：

13.一種電子設(shè)備，其特征在于，包括:

14.一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，所述計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令；所述計(jì)算機(jī)可執(zhí)行指令被處理器執(zhí)行后，能夠?qū)崿F(xiàn)權(quán)利要求1至10中任一項(xiàng)所述的方法。

技術(shù)總結(jié)
本公開是關(guān)于一種語言模型的訓(xùn)練方法、基于語言模型的人機(jī)交互方法，該方法包括：獲取訓(xùn)練數(shù)據(jù)集，其中，訓(xùn)練數(shù)據(jù)集包括多種不同領(lǐng)域的訓(xùn)練數(shù)據(jù)；確定待訓(xùn)練的多領(lǐng)域大語言模型，待訓(xùn)練的多領(lǐng)域大語言模型包括基礎(chǔ)模型和不同領(lǐng)域的第一初始微調(diào)參數(shù)，基礎(chǔ)模型的參數(shù)為預(yù)訓(xùn)練好的；利用多種不同領(lǐng)域的訓(xùn)練數(shù)據(jù)對(duì)待訓(xùn)練的多領(lǐng)域大語言模型進(jìn)行微調(diào)訓(xùn)練，對(duì)不同領(lǐng)域的第一初始微調(diào)參數(shù)進(jìn)行更新，以得到目標(biāo)多領(lǐng)域大語言模型。由此，本公開的目標(biāo)多領(lǐng)域大語言模型適用于多種不同領(lǐng)域，適用范圍較廣，且目標(biāo)多領(lǐng)域大語言模型同時(shí)部署和動(dòng)態(tài)加載不同領(lǐng)域的目標(biāo)大語言模型，無需分別部署，降低了資源成本。

技術(shù)研發(fā)人員：高永偉,朱振華,王思佳,隋雨芊,管俊,王艷聰,張雨,朱蕾
受保護(hù)的技術(shù)使用者：北京小米移動(dòng)軟件有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/9

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：高永偉,朱振華,王思佳,隋雨芊,管俊,王艷聰,張雨,朱蕾
技術(shù)所有人：北京小米移動(dòng)軟件有限公司
我是此專利的發(fā)明人

上一篇：一種室內(nèi)外裝修用防漏水檢測結(jié)構(gòu)的制作方法
上一篇：一種上藥裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語言模型的訓(xùn)練方法、基于語言模型的人機(jī)交互方法與流程

語言模型的訓(xùn)練方法、基于語言模型的人機(jī)交互方法與流程