欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于音素糾錯的語音識別方法、裝置、介質及設備與流程

文檔序號:40443756發(fā)布日期:2024-12-24 15:18閱讀:26來源:國知局
基于音素糾錯的語音識別方法、裝置、介質及設備與流程

本發(fā)明涉及語音識別,尤其涉及一種基于音素糾錯的語音識別方法、裝置、介質及設備。


背景技術:

1、在asr(automatic?speech?recognition,語言識別技術)中對于語音識別問題,現(xiàn)有技術中都是將輸入的音頻信號通過各種手段,如tdnn網(wǎng)絡,gmm-hmm模型等,轉化成文本信息,但由于說話人的發(fā)音習慣,有些文本的發(fā)音與正常發(fā)音有差異,導致發(fā)音錯誤,進而無法準確識別說話人的語音對應的文本,導致語音識別的效果較差。

2、因此,如何提升說話人的語音識別準確率是當前亟待解決的技術問題。


技術實現(xiàn)思路

1、鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的一種基于音素糾錯的語音識別方法、裝置、介質及設備。

2、本發(fā)明的其他特性和優(yōu)點將通過下面的詳細描述變得顯然,或部分地通過本發(fā)明的實踐而習得。

3、根據(jù)本發(fā)明實施例的第一方面,提供了一種基于音素糾錯的語音識別方法,所述基于音素糾錯的語音識別方法包括:

4、對待識別語音信號進行聲音特征提取處理,得到音頻信號特征;

5、基于所述音頻信號特征進行音素識別,得到音素序列;

6、對所述音素序列進行說話人音素糾錯處理,得到音素識別序列;

7、對所述音素識別序列進行文本映射處理,得到語音識別結果。

8、根據(jù)本發(fā)明實施例的第二方面,提供了一種基于音素糾錯的語音識別裝置,所述裝置包括:

9、音頻特征提取模塊,用于對待識別語音信號進行聲音特征提取處理,得到音頻信號特征;

10、音素識別模塊,用于基于所述音頻信號特征進行音素識別,得到音素序列;

11、音素糾錯模塊,用于對所述音素序列進行說話人音素糾錯處理,得到音素識別序列;

12、文本映射模塊,用于對所述音素識別序列進行文本映射處理,得到語音識別結果。

13、根據(jù)本發(fā)明實施例的第三方面,提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質中存儲有計算機程序指令,所述計算機程序指令由處理器加載并執(zhí)行以實現(xiàn)如上述任一項所述的方法所執(zhí)行的操作。

14、根據(jù)本發(fā)明實施例的第四方面,提供了一種電子設備,包括處理器和存儲器,所述存儲器存儲有能夠被所述處理器執(zhí)行的計算機程序指令,所述處理器執(zhí)行所述計算機程序指令時,實現(xiàn)如上述任一所述的方法的指令。

15、本發(fā)明實施例中提供的技術方案,至少具有如下技術效果或優(yōu)點:

16、本發(fā)明實施例提供的一種基于音素糾錯的語音識別方法、裝置、介質及設備,通過對所述音素序列進行說話人音素糾錯處理,得到音素識別序列;對所述音素識別序列進行文本映射處理,得到語音識別結果,通過對音素糾錯,解決了錯誤發(fā)音對語音識別的影響,讓識別結果更接近真實的文本信息,有效提升了說話人的語音識別準確率。

17、上述說明僅是本發(fā)明技術方案的概述,為了能夠更清楚了解本發(fā)明的技術手段,而可依照說明書的內容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式。



技術特征:

1.一種基于音素糾錯的語音識別方法,其特征在于,所述方法包括:

2.根據(jù)權利要求1所述的基于音素糾錯的語音識別方法,其特征在于,所述對所述音素序列進行說話人音素糾錯處理,得到音素識別序列,包括:

3.根據(jù)權利要求2所述的基于音素糾錯的語音識別方法,其特征在于,所述對所述音頻信號特征進行聲紋特征提取,得到說話人識別聲紋包括:

4.根據(jù)權利要求2所述的基于音素糾錯的語音識別方法,其特征在于,所述對所述音素序列進行音素糾錯處理,得到所述音素識別序列包括:

5.根據(jù)權利要求1所述的基于音素糾錯的語音識別方法,其特征在于,所述對所述音素識別序列進行文本映射處理,得到語音識別結果包括:

6.根據(jù)權利要求1所述的基于音素糾錯的語音識別方法,其特征在于,所述對待識別語音信號進行聲音特征提取處理,得到音頻信號特征包括:

7.根據(jù)權利要求1所述的基于音素糾錯的語音識別方法,其特征在于,所述基于所述音頻信號特征進行音素識別,得到音素序列,包括:

8.一種基于音素糾錯的語音識別裝置,應用于權利要求1-7任一項所述的方法,其特征在于,所述裝置包括:

9.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質中存儲有計算機程序指令,所述計算機程序指令由處理器加載并執(zhí)行以實現(xiàn)如權利要求1-7任一項所述的方法所執(zhí)行的操作。

10.一種電子設備,包括處理器和存儲器,其特征在于,所述存儲器存儲有能夠被所述處理器執(zhí)行的計算機程序指令,所述處理器執(zhí)行所述計算機程序指令時,實現(xiàn)如權利要求1-7中任一所述的方法的指令。


技術總結
本發(fā)明公開了一種基于音素糾錯的語音識別方法、裝置、介質及設備,所述方法包括:對待識別語音信號進行聲音特征提取處理,得到音頻信號特征;基于所述音頻信號特征進行音素識別,得到音素序列;對所述音素序列進行說話人音素糾錯處理,得到音素識別序列;對所述音素識別序列進行文本映射處理,得到語音識別結果。本發(fā)明所述方法通過對音素糾錯,解決了錯誤發(fā)音對語音識別的影響,讓識別結果更接近真實的文本信息,有效提升了說話人的語音識別準確率。

技術研發(fā)人員:鄧洋,蘇禹博,王兆國,丁慶
受保護的技術使用者:深圳芯瑞華聲科技有限公司
技術研發(fā)日:
技術公布日:2024/12/23
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
沈丘县| 遂昌县| 威信县| 西充县| 兴和县| 宁波市| 武山县| 论坛| 准格尔旗| 措美县| 富宁县| 白水县| 隆回县| 平顺县| 通化市| 潼关县| 保靖县| 临清市| 牡丹江市| 铜梁县| 左权县| 西藏| 都江堰市| 邹平县| 丹凤县| 金平| 大关县| 磐石市| 民乐县| 邵东县| 菏泽市| 湘潭县| 乌拉特后旗| 锦屏县| 阜新| 绍兴县| 睢宁县| 绥化市| 蓬溪县| 桑日县| 麻城市|