基于音素糾錯的語音識別方法、裝置、介質及設備與流程

文檔序號：40443756發(fā)布日期：2024-12-24 15:18閱讀：26來源：國知局

本發(fā)明涉及語音識別，尤其涉及一種基于音素糾錯的語音識別方法、裝置、介質及設備。

背景技術：

1、在asr(automatic?speech?recognition，語言識別技術)中對于語音識別問題，現(xiàn)有技術中都是將輸入的音頻信號通過各種手段，如tdnn網(wǎng)絡，gmm-hmm模型等，轉化成文本信息，但由于說話人的發(fā)音習慣，有些文本的發(fā)音與正常發(fā)音有差異，導致發(fā)音錯誤，進而無法準確識別說話人的語音對應的文本，導致語音識別的效果較差。

2、因此，如何提升說話人的語音識別準確率是當前亟待解決的技術問題。

技術實現(xiàn)思路

1、鑒于上述問題，提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的一種基于音素糾錯的語音識別方法、裝置、介質及設備。

2、本發(fā)明的其他特性和優(yōu)點將通過下面的詳細描述變得顯然，或部分地通過本發(fā)明的實踐而習得。

3、根據(jù)本發(fā)明實施例的第一方面，提供了一種基于音素糾錯的語音識別方法，所述基于音素糾錯的語音識別方法包括：

4、對待識別語音信號進行聲音特征提取處理，得到音頻信號特征；

5、基于所述音頻信號特征進行音素識別，得到音素序列；

6、對所述音素序列進行說話人音素糾錯處理，得到音素識別序列；

7、對所述音素識別序列進行文本映射處理，得到語音識別結果。

8、根據(jù)本發(fā)明實施例的第二方面，提供了一種基于音素糾錯的語音識別裝置，所述裝置包括：

9、音頻特征提取模塊，用于對待識別語音信號進行聲音特征提取處理，得到音頻信號特征；

10、音素識別模塊，用于基于所述音頻信號特征進行音素識別，得到音素序列；

11、音素糾錯模塊，用于對所述音素序列進行說話人音素糾錯處理，得到音素識別序列；

12、文本映射模塊，用于對所述音素識別序列進行文本映射處理，得到語音識別結果。

13、根據(jù)本發(fā)明實施例的第三方面，提供了一種計算機可讀存儲介質，所述計算機可讀存儲介質中存儲有計算機程序指令，所述計算機程序指令由處理器加載并執(zhí)行以實現(xiàn)如上述任一項所述的方法所執(zhí)行的操作。

14、根據(jù)本發(fā)明實施例的第四方面，提供了一種電子設備，包括處理器和存儲器，所述存儲器存儲有能夠被所述處理器執(zhí)行的計算機程序指令，所述處理器執(zhí)行所述計算機程序指令時，實現(xiàn)如上述任一所述的方法的指令。

15、本發(fā)明實施例中提供的技術方案，至少具有如下技術效果或優(yōu)點：

16、本發(fā)明實施例提供的一種基于音素糾錯的語音識別方法、裝置、介質及設備，通過對所述音素序列進行說話人音素糾錯處理，得到音素識別序列；對所述音素識別序列進行文本映射處理，得到語音識別結果，通過對音素糾錯，解決了錯誤發(fā)音對語音識別的影響，讓識別結果更接近真實的文本信息，有效提升了說話人的語音識別準確率。

17、上述說明僅是本發(fā)明技術方案的概述，為了能夠更清楚了解本發(fā)明的技術手段，而可依照說明書的內容予以實施，并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂，以下特舉本發(fā)明的具體實施方式。

技術特征：

1.一種基于音素糾錯的語音識別方法，其特征在于，所述方法包括：

2.根據(jù)權利要求1所述的基于音素糾錯的語音識別方法，其特征在于，所述對所述音素序列進行說話人音素糾錯處理，得到音素識別序列，包括：

3.根據(jù)權利要求2所述的基于音素糾錯的語音識別方法，其特征在于，所述對所述音頻信號特征進行聲紋特征提取，得到說話人識別聲紋包括：

4.根據(jù)權利要求2所述的基于音素糾錯的語音識別方法，其特征在于，所述對所述音素序列進行音素糾錯處理，得到所述音素識別序列包括：

5.根據(jù)權利要求1所述的基于音素糾錯的語音識別方法，其特征在于，所述對所述音素識別序列進行文本映射處理，得到語音識別結果包括：

6.根據(jù)權利要求1所述的基于音素糾錯的語音識別方法，其特征在于，所述對待識別語音信號進行聲音特征提取處理，得到音頻信號特征包括：

7.根據(jù)權利要求1所述的基于音素糾錯的語音識別方法，其特征在于，所述基于所述音頻信號特征進行音素識別，得到音素序列，包括：

8.一種基于音素糾錯的語音識別裝置，應用于權利要求1-7任一項所述的方法，其特征在于，所述裝置包括：

9.一種計算機可讀存儲介質，其特征在于，所述計算機可讀存儲介質中存儲有計算機程序指令，所述計算機程序指令由處理器加載并執(zhí)行以實現(xiàn)如權利要求1-7任一項所述的方法所執(zhí)行的操作。

10.一種電子設備，包括處理器和存儲器，其特征在于，所述存儲器存儲有能夠被所述處理器執(zhí)行的計算機程序指令，所述處理器執(zhí)行所述計算機程序指令時，實現(xiàn)如權利要求1-7中任一所述的方法的指令。

技術總結
本發(fā)明公開了一種基于音素糾錯的語音識別方法、裝置、介質及設備，所述方法包括：對待識別語音信號進行聲音特征提取處理，得到音頻信號特征；基于所述音頻信號特征進行音素識別，得到音素序列；對所述音素序列進行說話人音素糾錯處理，得到音素識別序列；對所述音素識別序列進行文本映射處理，得到語音識別結果。本發(fā)明所述方法通過對音素糾錯，解決了錯誤發(fā)音對語音識別的影響，讓識別結果更接近真實的文本信息，有效提升了說話人的語音識別準確率。

技術研發(fā)人員：鄧洋,蘇禹博,王兆國,丁慶
受保護的技術使用者：深圳芯瑞華聲科技有限公司
技術研發(fā)日：
技術公布日：2024/12/23

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：鄧洋,蘇禹博,王兆國,丁慶
技術所有人：深圳芯瑞華聲科技有限公司
我是此專利的發(fā)明人

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于音素糾錯的語音識別方法、裝置、介質及設備與流程

基于音素糾錯的語音識別方法、裝置、介質及設備與流程