1.一種基于HTK的連續(xù)語音識(shí)別系統(tǒng),其特征在于:包括依次連接的測(cè)試數(shù)據(jù)輸入模塊、特征提取模塊、搜索與解碼模塊、識(shí)別結(jié)果輸出模塊,所述搜索與解碼模塊的輸入端連接有聲學(xué)模型和識(shí)別網(wǎng)絡(luò)模塊;所述聲學(xué)模型的輸入端連接有訓(xùn)練數(shù)據(jù)輸入模塊;所述識(shí)別網(wǎng)絡(luò)模塊的輸入端連接有詞典、任務(wù)語法和語言模型。
2.根據(jù)權(quán)利要求1所述的一種基于HTK的連續(xù)語音識(shí)別系統(tǒng),其特征在于:
所述測(cè)試數(shù)據(jù)輸入模塊用于獲取語音信號(hào)并將其傳至特征提取模塊;
所述特征提取模塊用于對(duì)語音信號(hào)進(jìn)行預(yù)處理并從中提取出語音特征,其中語音特征包括LPCC、MFCC;
所述聲學(xué)模型就是用來描述發(fā)音過程的一個(gè)數(shù)學(xué)模型,該數(shù)學(xué)模型為隱馬爾可夫模型,通過事先準(zhǔn)備好的一些訓(xùn)練數(shù)據(jù),對(duì)建立的聲學(xué)模型進(jìn)行訓(xùn)練,從而得到這些模型的所有參數(shù);
所述識(shí)別網(wǎng)絡(luò)模塊就是在識(shí)別的過程中用來搜索最佳詞序列的一個(gè)搜索空間;
所述搜索與解碼模塊用于在識(shí)別網(wǎng)絡(luò)中搜索一條最優(yōu)路徑并使得該路徑上的模型產(chǎn)生未知聲音序列的概率為最大,繼而把該路徑上的模型對(duì)應(yīng)的單詞作為識(shí)別的結(jié)果輸出。