一種基于HTK的連續(xù)語音識(shí)別系統(tǒng)的制作方法

文檔序號(hào)：12128353閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>一種基于HTK的連續(xù)語音識(shí)別系統(tǒng)的制作方法與工藝

技術(shù)特征：

1.一種基于HTK的連續(xù)語音識(shí)別系統(tǒng)，其特征在于：包括依次連接的測(cè)試數(shù)據(jù)輸入模塊、特征提取模塊、搜索與解碼模塊、識(shí)別結(jié)果輸出模塊，所述搜索與解碼模塊的輸入端連接有聲學(xué)模型和識(shí)別網(wǎng)絡(luò)模塊；所述聲學(xué)模型的輸入端連接有訓(xùn)練數(shù)據(jù)輸入模塊；所述識(shí)別網(wǎng)絡(luò)模塊的輸入端連接有詞典、任務(wù)語法和語言模型。

2.根據(jù)權(quán)利要求1所述的一種基于HTK的連續(xù)語音識(shí)別系統(tǒng)，其特征在于：

所述測(cè)試數(shù)據(jù)輸入模塊用于獲取語音信號(hào)并將其傳至特征提取模塊；

所述特征提取模塊用于對(duì)語音信號(hào)進(jìn)行預(yù)處理并從中提取出語音特征，其中語音特征包括LPCC、MFCC；

所述聲學(xué)模型就是用來描述發(fā)音過程的一個(gè)數(shù)學(xué)模型，該數(shù)學(xué)模型為隱馬爾可夫模型，通過事先準(zhǔn)備好的一些訓(xùn)練數(shù)據(jù)，對(duì)建立的聲學(xué)模型進(jìn)行訓(xùn)練，從而得到這些模型的所有參數(shù)；

所述識(shí)別網(wǎng)絡(luò)模塊就是在識(shí)別的過程中用來搜索最佳詞序列的一個(gè)搜索空間；

所述搜索與解碼模塊用于在識(shí)別網(wǎng)絡(luò)中搜索一條最優(yōu)路徑并使得該路徑上的模型產(chǎn)生未知聲音序列的概率為最大，繼而把該路徑上的模型對(duì)應(yīng)的單詞作為識(shí)別的結(jié)果輸出。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2 3

相關(guān)技術(shù)