基于LLM模型的語音處理方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)與流程

文檔序號(hào)：40443632發(fā)布日期：2024-12-24 15:18閱讀：26來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

基于LLM模型的語音處理方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)與流程

本發(fā)明涉及文本分類，尤其涉及基于llm模型的語音處理方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)。

背景技術(shù)：

1、傳統(tǒng)的bert對于長文本理解能力有限，不能有效學(xué)習(xí)到更多的上下文信息。其次，它不能更好地處理多樣性，對更多的詞匯和語法規(guī)則理解不透徹。此外，它不能更好地處理歧義，對于更多的語境信息理解不清晰。

2、另外，由于訓(xùn)練樣本的差異，大型模型對于同樣的文本的理解能力存在不一致的情況。這導(dǎo)致了在處理相同文本時(shí)，不同模型的理解能力存在差異。為了提升文本分類的效果，我們采用了多個(gè)大型語言模型(llm)進(jìn)行實(shí)驗(yàn)，并通過投票的方式輸出文本分類結(jié)果，以期獲得最優(yōu)效果。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明實(shí)施例提供了一種基于llm模型的語音處理方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)，旨在解決傳統(tǒng)客戶聲音訴求分類方法中存在的主觀性強(qiáng)、分類結(jié)果不穩(wěn)定等問題。。

2、本發(fā)明的技術(shù)方案為：

3、第一方面，本技術(shù)提供了一種基于llm模型的語音處理方法，其特征在于，包括：

4、獲取在同一硬件平臺(tái)上的多個(gè)語言識(shí)別學(xué)習(xí)模型，確保所有語言識(shí)別學(xué)習(xí)模型運(yùn)行在公平的資源環(huán)境下；

5、獲取發(fā)聲訴求文本數(shù)據(jù)，將該發(fā)聲訴求文本數(shù)據(jù)分別輸入至各語言識(shí)別學(xué)習(xí)模型中；

6、并行運(yùn)行所有語言識(shí)別學(xué)習(xí)模型，將該發(fā)聲訴求文本數(shù)據(jù)與語言識(shí)別學(xué)習(xí)模型訴求標(biāo)簽庫中的訴求標(biāo)簽進(jìn)行比對分析預(yù)測，各語言識(shí)別學(xué)習(xí)模型輸出各自的預(yù)測結(jié)果，其中預(yù)測結(jié)果包括該預(yù)測結(jié)果在語言識(shí)別學(xué)習(xí)模型訴求標(biāo)簽庫中的權(quán)重信息；

7、根據(jù)權(quán)重信息對各語言識(shí)別學(xué)習(xí)模型輸出的預(yù)測結(jié)果進(jìn)行統(tǒng)計(jì)評分，根據(jù)評分的高低獲取最匹配的發(fā)聲訴求文本數(shù)據(jù)識(shí)別結(jié)果。

8、進(jìn)一步地，所述將該發(fā)聲訴求文本數(shù)據(jù)與語言識(shí)別學(xué)習(xí)模型訴求標(biāo)簽庫中的訴求標(biāo)簽進(jìn)行比對分析預(yù)測，各語言識(shí)別學(xué)習(xí)模型輸出各自的預(yù)測結(jié)果的具體方法包括：

9、對訴求標(biāo)簽庫中的訴求標(biāo)簽進(jìn)行數(shù)據(jù)清洗，數(shù)據(jù)清洗后進(jìn)行特征提??；

10、對特征向量進(jìn)行聚類并得到初步的預(yù)處理,確定聚類中心標(biāo)簽，調(diào)整聚類邊界，然后迭代更新聚類中心和邊界；

11、基于每個(gè)簇內(nèi)標(biāo)簽的數(shù)量計(jì)算其權(quán)重，其中，簇內(nèi)標(biāo)簽數(shù)量越多，對應(yīng)的聚類中心標(biāo)簽權(quán)重越大，反之，權(quán)重越小。

12、進(jìn)一步地，所述對特征向量進(jìn)行聚類并得到初步的聚類結(jié)果,確定聚類中心標(biāo)簽，調(diào)整聚類邊界，然后迭代更新聚類中心和邊界包括:

13、通過k-means算法對預(yù)處理后的標(biāo)簽特征向量進(jìn)行聚類，以確定最優(yōu)的聚類數(shù)量k，并得到初步的聚類結(jié)果；

14、選取每個(gè)簇的質(zhì)心作為該簇的代表標(biāo)簽，即聚類中心標(biāo)簽；

15、采用貪婪算法逐步調(diào)整聚類邊界，以優(yōu)化聚類結(jié)果。

16、進(jìn)一步地，所述采用貪婪算法逐步調(diào)整聚類邊界，以優(yōu)化聚類結(jié)果的方法包括：

17、a1、通過k-means算法確定初始聚類中心；

18、a2、基于初始聚類結(jié)果確定初始化每個(gè)簇的邊界；

19、a3、獲取每個(gè)簇內(nèi)所有點(diǎn)到其聚類中心的相似度；

20、a4、獲取不同簇之間聚類中心的相似度；

21、a5、對標(biāo)簽進(jìn)行調(diào)整迭代；

22、a6、通過將所選標(biāo)簽從一個(gè)簇移動(dòng)到另一個(gè)簇的方式調(diào)整聚類邊界；

23、a7、在標(biāo)簽移動(dòng)后，重新計(jì)算每個(gè)簇的聚類中心；

24、a8、重復(fù)a5至a7，直至達(dá)到預(yù)設(shè)的迭代次數(shù)、聚類邊界調(diào)整對總相似度的影響小于某個(gè)閾值。

25、進(jìn)一步地，所述通過k-means算法對預(yù)處理后的標(biāo)簽特征向量進(jìn)行聚類以確定最優(yōu)的聚類數(shù)量k的方法包括：對于不同的k值運(yùn)行k-means算法，計(jì)算每個(gè)k值對應(yīng)的總平方誤差，獲取總平方誤差與k的關(guān)系圖，選擇總平均誤差下降幅度開始減小的點(diǎn)作為k值或?qū)τ诓煌膋值，獲取每個(gè)樣本的輪廓系數(shù)，選擇輪廓系數(shù)平均值最高的值作為k值，或?qū)τ诿總€(gè)k值，計(jì)算k-means聚類的總平均誤差和一個(gè)參照數(shù)據(jù)集的總平均誤差，參照數(shù)據(jù)集是通過在原數(shù)據(jù)集上添加隨機(jī)噪聲生成的，然后計(jì)算兩者的差值，并選擇差值最大的作為k值。

26、進(jìn)一步地，輸入至各語言識(shí)別學(xué)習(xí)模型時(shí)需要將所述發(fā)聲訴求文本數(shù)據(jù)的格式統(tǒng)一。

27、進(jìn)一步地，根據(jù)權(quán)重信息對各語言識(shí)別學(xué)習(xí)模型輸出的預(yù)測結(jié)果進(jìn)行統(tǒng)計(jì)評分，根據(jù)評分的高低獲取最匹配的發(fā)聲訴求文本數(shù)據(jù)識(shí)別結(jié)果的具體方法包括：

28、當(dāng)各語言識(shí)別學(xué)習(xí)模型輸出的訴求標(biāo)簽的內(nèi)容不同時(shí)，對每個(gè)模型輸出的訴求標(biāo)簽進(jìn)行權(quán)重計(jì)算，統(tǒng)計(jì)每個(gè)標(biāo)簽的權(quán)重信息，選擇訴求標(biāo)簽權(quán)重最高的訴求標(biāo)簽做為本次發(fā)聲訴求文本數(shù)據(jù)最匹配的識(shí)別結(jié)果標(biāo)簽；

29、當(dāng)各語言識(shí)別學(xué)習(xí)模型輸出的訴求標(biāo)簽的內(nèi)容存在相同時(shí)，對每個(gè)模型輸出的相同內(nèi)容的訴求標(biāo)簽進(jìn)行權(quán)重計(jì)算，對相同內(nèi)容的訴求標(biāo)簽的權(quán)重信息進(jìn)行求和，再將各求和后的權(quán)重信息進(jìn)行比較，選擇得分最高的權(quán)重信息對應(yīng)的訴求標(biāo)簽做為本次發(fā)聲訴求文本數(shù)據(jù)最匹配的識(shí)別結(jié)果標(biāo)簽。

30、第二方面，本技術(shù)還提供了一種基于llm模型的語音處理系統(tǒng)，其特征在于，包括：

31、語言識(shí)別學(xué)習(xí)模型獲取單元，用于獲取在同一硬件平臺(tái)上的多個(gè)語言識(shí)別學(xué)習(xí)模型，確保所有語言識(shí)別學(xué)習(xí)模型運(yùn)行在公平的資源環(huán)境下；

32、發(fā)聲訴求文本數(shù)據(jù)獲取單元，用于獲取發(fā)聲訴求文本數(shù)據(jù)，將該發(fā)聲訴求文本數(shù)據(jù)分別輸入至各語言識(shí)別學(xué)習(xí)模型中；

33、預(yù)測結(jié)果輸出單元，用于并行運(yùn)行所有語言識(shí)別學(xué)習(xí)模型，將該發(fā)聲訴求文本數(shù)據(jù)與各語言識(shí)別學(xué)習(xí)模型訴求標(biāo)簽庫中的訴求標(biāo)簽進(jìn)行比對分析預(yù)測，各語言識(shí)別學(xué)習(xí)模型輸出各自的預(yù)測結(jié)果，其中預(yù)測結(jié)果包括該預(yù)測結(jié)果在語言識(shí)別學(xué)習(xí)模型訴求標(biāo)簽庫中的權(quán)重信息；

34、最匹配的發(fā)聲訴求文本數(shù)據(jù)識(shí)別結(jié)果獲取單元，根據(jù)權(quán)重信息對各語言識(shí)別學(xué)習(xí)模型輸出的預(yù)測結(jié)果進(jìn)行統(tǒng)計(jì)評分，根據(jù)評分的高低獲取最匹配的發(fā)聲訴求文本數(shù)據(jù)識(shí)別結(jié)果。

35、進(jìn)一步地，所述發(fā)聲訴求文本數(shù)據(jù)獲取單元還包括文本數(shù)據(jù)格式統(tǒng)一單元，所述文本數(shù)據(jù)格式統(tǒng)一單元用于對輸入至各語言識(shí)別學(xué)習(xí)模型的發(fā)聲訴求文本數(shù)據(jù)的格式進(jìn)行統(tǒng)一。

36、進(jìn)一步地，最匹配的發(fā)聲訴求文本數(shù)據(jù)識(shí)別結(jié)果獲取單元包括文本數(shù)據(jù)權(quán)重計(jì)算比較單元，所述文本數(shù)據(jù)權(quán)重計(jì)算比較單元用于

37、當(dāng)各語言識(shí)別學(xué)習(xí)模型輸出的訴求標(biāo)簽的內(nèi)容不同時(shí)，對每個(gè)模型輸出的訴求標(biāo)簽進(jìn)行權(quán)重計(jì)算，統(tǒng)計(jì)每個(gè)標(biāo)簽的權(quán)重信息，選擇訴求標(biāo)簽權(quán)重最高的訴求標(biāo)簽做為本次發(fā)聲訴求文本數(shù)據(jù)最匹配的識(shí)別結(jié)果標(biāo)簽；

38、當(dāng)各語言識(shí)別學(xué)習(xí)模型輸出的訴求標(biāo)簽的內(nèi)容存在相同時(shí)，對每個(gè)模型輸出的相同內(nèi)容的訴求標(biāo)簽進(jìn)行權(quán)重計(jì)算，對相同內(nèi)容的訴求標(biāo)簽的權(quán)重信息進(jìn)行求和，再將各求和后的權(quán)重信息進(jìn)行比較，選擇得分最高的權(quán)重信息對應(yīng)的訴求標(biāo)簽做為本次發(fā)聲訴求文本數(shù)據(jù)最匹配的識(shí)別結(jié)果標(biāo)簽。

39、第三方面，本技術(shù)還提供了一種計(jì)算機(jī)存儲(chǔ)介質(zhì)，其特征在于：所述計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有多條指令，所述指令適于由處理器加載并執(zhí)行上述的方法步驟。

40、第四方面，本技術(shù)還提供了一種電子設(shè)備，其特征在于，包括處理器和存儲(chǔ)器，所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序，所述計(jì)算機(jī)程序適于由所述處理器加載并執(zhí)行上述的方法步驟。

41、本技術(shù)一些實(shí)施例提供的技術(shù)方案帶來的有益效果至少包括：本技術(shù)摒棄了傳統(tǒng)小模型的對長文本理解能力有限，不能有效學(xué)習(xí)到更多的上下文信息的問題，其次，基于多個(gè)大模型的語言識(shí)別學(xué)習(xí)模型，可以對多樣性的詞匯和語法規(guī)則理解更加透徹，此外，可以更好地處理歧義，對于更多的語境信息理解更加清晰，通過引入多個(gè)大模型的語言識(shí)別學(xué)習(xí)模型，可以提高分類的準(zhǔn)確性和穩(wěn)定性；評分比較的方式可以充分考慮各個(gè)模型的預(yù)測結(jié)果，減少了主觀性的影響，提高了預(yù)測的客觀性和穩(wěn)定性。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：袁美璐
技術(shù)所有人：中國平安財(cái)產(chǎn)保險(xiǎn)股份有限公司
我是此專利的發(fā)明人

上一篇：一種多天線合成圓極化天線及多天線合成正交圓極化天線的制作方法
上一篇：一種多功能急救盒的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于LLM模型的語音處理方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)與流程

基于LLM模型的語音處理方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)與流程