1.一種基于語音相似度的語音評測方法,其特征在于,包括如下步驟:
提供訓(xùn)練數(shù)據(jù)集,所述訓(xùn)練數(shù)據(jù)集包括訓(xùn)練參照語音數(shù)據(jù)、與所述訓(xùn)練參照語音數(shù)據(jù)對應(yīng)的訓(xùn)練模仿語音數(shù)據(jù)以及所述訓(xùn)練參照語音數(shù)據(jù)和所述訓(xùn)練模仿語音數(shù)據(jù)的相似度評分值;
利用所述訓(xùn)練數(shù)據(jù)集對動態(tài)時間規(guī)整算法和支持向量順序回歸算法進(jìn)行算法訓(xùn)練,以獲得相似度評分模型;
提供參照語音信息;
錄制模仿朗讀所述參照語音信息的模仿語音信息;
提取所述參照語音信息中的參照語音特征序列集和所述模仿語音信息中的模仿語音特征序列集;以及
向所述相似度評分模型輸入所述參照語音特征序列集和所述模仿語音特征序列集,獲得所述模仿語音信息和所述參照語音信息的相似度評分值并輸出。
2.如權(quán)利要求1所述的基于語音相似度的語音評測方法,其特征在于,所述訓(xùn)練參照語音數(shù)據(jù)和所述訓(xùn)練模仿語音數(shù)據(jù)包括語音內(nèi)容特征序列、語音音調(diào)特征序列、語音時長特征序列、語音停頓特征序列以及語音重讀特征序列;
進(jìn)行算法訓(xùn)練包括:
利用所述訓(xùn)練參照語音數(shù)據(jù)和所述訓(xùn)練模仿語音數(shù)據(jù)中的語音音調(diào)特征序列、語音時長特征序列、語音停頓特征序列以及語音重讀特征序列對所述動態(tài)時間規(guī)整算法進(jìn)行算法訓(xùn)練,以使得通過所述動態(tài)時間規(guī)整算法獲得所述訓(xùn)練參照語音數(shù)據(jù)和所述訓(xùn)練模仿語音數(shù)據(jù)之間的語音音調(diào)距離、語音時長距離、語音停頓距離以及語音重讀距離;
利用所述訓(xùn)練參照語音數(shù)據(jù)和所述訓(xùn)練模仿語音數(shù)據(jù)中的語音內(nèi)容特征序列、所述訓(xùn)練參照語音數(shù)據(jù)和所述訓(xùn)練模仿語音數(shù)據(jù)的相似度評分值、所獲得的語音音調(diào)距離、語音時長距離、語音停頓距離以及語音重讀距離對所述支持向量順序回歸算法進(jìn)行算法訓(xùn)練。
3.如權(quán)利要求2所述的基于語音相似度的語音評測方法,其特征在于,在進(jìn)行算法訓(xùn)練時,為所述動態(tài)時間規(guī)整算法設(shè)定以時間幀順序依序進(jìn)行計算的約束條件。
4.如權(quán)利要求1所述的基于語音相似度的語音評測方法,其特征在于,提取所述參照語音信息中的參照語音特征序列集和所述模仿語音信息中的模仿語音特征序列集,包括:
對所述參照語音信息進(jìn)行語音識別以獲得對應(yīng)的語音內(nèi)容特征序列、語音停頓特征序列以及語音時長特征序列并加入到參照語音特征序列集中;
對所述模仿語音信息進(jìn)行語音識別以獲得對應(yīng)的語音內(nèi)容特征序列、語音停頓特征序列以及語音時長特征序列并加入到模仿語音特征序列集中。
5.如權(quán)利要求4所述的基于語音相似度的語音評測方法,其特征在于,提取所述參照語音信息中的參照語音特征序列集和所述模仿語音信息中的模仿語音特征序列集,還包括:
對所述參照語音信息進(jìn)行基頻提取以獲得對應(yīng)的語音音調(diào)特征序列并加入到參照語音特征序列集中;
對所述參照語音信息進(jìn)行能量提取以獲取對應(yīng)的語音重讀特征序列并加入到參照語音特征序列集中;
對所述模仿語音信息進(jìn)行基頻提取以獲得對應(yīng)的語音音調(diào)特征序列并加入到模仿語音特征序列集中;
對所述模仿語音信息進(jìn)行能量提取以獲取對應(yīng)的語音重讀特征序列并加入到模仿語音特征序列集中。
6.一種基于語音相似度的語音評測系統(tǒng),其特征在于,包括:
數(shù)據(jù)存儲模塊,用于存儲參照語音信息;
語音播報模塊,與所述數(shù)據(jù)存儲模塊連接,用于播報所述數(shù)據(jù)存儲模塊中存儲的參照語音信息;
語音獲取模塊,用于錄制模仿朗讀所述語音播報模塊播報的參照語音信息的模仿語音信息;
特征提取模塊,與所述語音播報模塊和所述語音獲取模塊連接,用于對所述語音播報模塊所播報的參照語音信息和所述語音獲取模塊所獲取的模仿語音信息進(jìn)行特征提取,以獲得對應(yīng)的參照語音特征序列集和模仿語音特征序列集;以及
評分模塊,與所述特征提取模塊連接,所述評分模塊接收所述特征提取模塊獲得的參照語音特征序列集和模仿語音特征序列集,并計算得出所述模仿語音信息和所述參照語音信息的相似度評分值。
7.如權(quán)利要求6所述的基于語音相似度的語音評測系統(tǒng),其特征在于,所述評分模塊內(nèi)建立有相似度評分模型,所述相似度評分模型通過訓(xùn)練數(shù)據(jù)集對動態(tài)時間規(guī)整算法和支持向量順序回歸算法進(jìn)行算法訓(xùn)練而建立,所述訓(xùn)練數(shù)據(jù)集包括訓(xùn)練參照語音數(shù)據(jù)、與所述訓(xùn)練參照語音數(shù)據(jù)對應(yīng)的訓(xùn)練模仿語音數(shù)據(jù)以及所述訓(xùn)練參照語音數(shù)據(jù)和所述訓(xùn)練模仿語音數(shù)據(jù)的相似度評分值;
所述評分模塊將所述的參照語音特征序列集和模仿語音特征序列集后輸入到所述相似度評分模塊以獲得所述模仿語音信息和所述參照語音信息的相似度評分值。
8.如權(quán)利要求7所述的基于語音相似度的語音評測系統(tǒng),其特征在于,所述訓(xùn)練參照語音數(shù)據(jù)和所述訓(xùn)練模仿語音數(shù)據(jù)包括語音內(nèi)容特征序列、語音音調(diào)特征序列、語音時長特征序列、語音停頓特征序列以及語音重讀特征序列;
通過所述訓(xùn)練參照語音數(shù)據(jù)和所述訓(xùn)練模仿語音數(shù)據(jù)中的語音音調(diào)特征序列、語音時長特征序列、語音停頓特征序列以及語音重讀特征序列對所述動態(tài)時間規(guī)整算法進(jìn)行算法訓(xùn)練,以使得通過所述動態(tài)時間規(guī)整算法獲得所述訓(xùn)練參照語音數(shù)據(jù)和所述訓(xùn)練模仿語音數(shù)據(jù)之間的語音音調(diào)距離、語音時長距離、語音停頓距離以及語音重讀距離;
通過所述訓(xùn)練參照語音數(shù)據(jù)和所述訓(xùn)練模仿語音數(shù)據(jù)中的語音內(nèi)容特征序列、所述訓(xùn)練參照語音數(shù)據(jù)和所述訓(xùn)練模仿語音數(shù)據(jù)的相似度評分值、所獲得的語音音調(diào)距離、語音時長距離、語音停頓距離以及語音重讀距離對所述支持向量順序回歸算法進(jìn)行算法訓(xùn)練,從而于所述評分模塊內(nèi)建立了相似度評分模型。
9.如權(quán)利要求8所述的基于語音相似度的語音評測系統(tǒng),其特征在于,所述動態(tài)時間規(guī)整算法在進(jìn)行算法訓(xùn)練時,設(shè)定有以時間幀順序依序進(jìn)行算法訓(xùn)練的約束條件。
10.如權(quán)利要求6所述的基于語音相似度的語音評測系統(tǒng),其特征在于,所述特征提取模塊包括語音識別子模塊、基頻提取子模塊、能量提取子模塊以及序列緩存子模塊;
所述序列緩存子模塊內(nèi)存儲有參照語音特征序列集和模仿語音特征序列集;
所述語音識別子模塊用于對所述參照語音信息進(jìn)行語音識別以獲得對應(yīng)的語音內(nèi)容特征序列、語音停頓特征序列以及語音時長特征序列并寫入到所述參照語音特征序列集中;還用于對所述模仿語音信息進(jìn)行語音識別以獲得對應(yīng)的語音內(nèi)容特征序列、語音停頓特征序列以及語音時長特征序列并寫入到所述模仿語音特征序列集中;
所述基頻提取子模塊用于對所述參照語音信息進(jìn)行基頻提取以獲得對應(yīng)的語音音調(diào)特征序列并寫入到所述參照語音特征序列集中;還用于對所述模仿語音信息進(jìn)行基頻提取以獲得對應(yīng)的語音音調(diào)特征序列并寫入到模仿語音特征序列集中;
所述能量提取子模塊用于對所述參照語音信息進(jìn)行能量提取以獲取對應(yīng)的語音重讀特征序列并寫入到所述參照語音特征序列集中;還用于對所述模仿語音信息進(jìn)行能量提取以獲取對應(yīng)的語音重讀特征序列并寫入到模仿語音特征序列集中。