中文語音信號處理方法、裝置及助聽設(shè)備的制作方法

文檔序號：2835933閱讀：157來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：中文語音信號處理方法、裝置及助聽設(shè)備的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及數(shù)字信號處理技術(shù)領(lǐng)域，特別是一種中文語音信號處理方法、一種中文語音信號處理裝置以及一種助聽設(shè)備。
背景技術(shù)：
根據(jù)2006年的統(tǒng)計(jì)數(shù)據(jù)，我國大約有2780萬人存在聽力障礙。助聽技術(shù)作為聽力障礙的有效解決手段，越來越受到人們的關(guān)注。而伴隨著科技的進(jìn)步，數(shù)字信號處理技術(shù)逐步應(yīng)用到助聽領(lǐng)域。耳聾分為傳導(dǎo)性耳聾、感音神經(jīng)性耳聾及混合型耳聾，其中，罹患感音神經(jīng)性耳聾的耳聾患者占了相當(dāng)大的比例。感音神經(jīng)性耳聾又可以分為蝸性(也叫感音性)耳聾、蝸后耳聾、以及中樞性耳聾。針對感音性耳聾，由于耳蝸的一項(xiàng)重要的功能就是分析處理聽覺信息，因此導(dǎo)致感音性耳聾患者缺失語音分析能力，聲調(diào)識別能力較差。目前的助聽器側(cè)重于聲音振幅的放大，對于傳導(dǎo)性耳聾效果很好，而對于感音性耳聾，不能達(dá)到理想的助聽效果，尤其噪聲環(huán)境下這種不理想更為明顯。目前，大部分可用于語音分析能力彌補(bǔ)的助聽器是根據(jù)西方語音來研究和開發(fā)的。而中文語音與西方語音存在多方面不同，如(I)中文語音為單音節(jié)帶調(diào)語言；(2)中文語音為輔音與元音結(jié)合的結(jié)構(gòu)，不同于西方語音存在復(fù)數(shù)個(gè)輔音串的結(jié)構(gòu)。由于中文語音和西方語音存在的差異，迫切需要一種針對中文語音的信號處理技術(shù)，增強(qiáng)中文語音的聲調(diào)，提高中文語音的聲調(diào)識別率。

發(fā)明內(nèi)容
有鑒于此，本發(fā)明提出了一種中文語音信號處理方法，用以增強(qiáng)中文語音的聲調(diào)，提高中文語音的聲調(diào)識別率。本發(fā)明還提供一種中文語音信號處理裝置以及一種助聽設(shè)備。因此，根據(jù)本發(fā)明一實(shí)施例，提供一種中文語音信號處理方法，包括以音節(jié)為單位切分待處理中文語音信號；提取每個(gè)首節(jié)的基頻曲線；確定每個(gè)音節(jié)的聲調(diào)種類，以及根據(jù)預(yù)先建立的聲調(diào)增強(qiáng)模型，確定與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù)及所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù)；根據(jù)每個(gè)音節(jié)的聲調(diào)種類、以及與所述聲調(diào)種類對應(yīng)的增強(qiáng)特征參數(shù)和所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù)，對該音節(jié)的基頻曲線進(jìn)行調(diào)整；根據(jù)調(diào)整后的基頻曲線合成音節(jié)。根據(jù)本發(fā)明實(shí)施方式，針對中文語音聲調(diào)具有辨別詞意的重要特性，根據(jù)聲調(diào)在聲學(xué)層面上的表現(xiàn)為基頻曲線的原理，將連續(xù)的中文語音信號流劃分為以音節(jié)為單位的中文語音信號，根據(jù)音節(jié)所屬的聲調(diào)種類，對音節(jié)的基頻曲線進(jìn)行調(diào)整。通過調(diào)整后的基頻曲線修改語音波形，增強(qiáng)中文語音的聲調(diào)特征，并提高中文語音聲調(diào)的識別率。根據(jù)本發(fā)明實(shí)施方式，還包括按照每個(gè)音節(jié)在待處理中文語音信號中的先后順序，依次輸出合成后的每個(gè)音節(jié)的步驟，保證了輸出的中文語音的連續(xù)性，從而保證中文語音含義的完整性。根據(jù)本發(fā)明實(shí)施方式，可以對音節(jié)的基頻曲線進(jìn)行三次多項(xiàng)式擬合，并將三次多項(xiàng)式的四個(gè)系數(shù)作為基頻曲線分類的特征，通過模式分類方法確定該音節(jié)的聲調(diào)類型，從而能夠準(zhǔn)確地確定每個(gè)音節(jié)的聲調(diào)種類。根據(jù)本發(fā)明實(shí)施方式，建立聲調(diào)增強(qiáng)模型時(shí)，針對每個(gè)聲調(diào)種類，均可以通過數(shù)據(jù)驅(qū)動(dòng)的方式，針對統(tǒng)計(jì)樣本中屬于該聲調(diào)種類的音節(jié)對，分析比較每個(gè)音節(jié)對中聲調(diào)增強(qiáng)前音節(jié)的基頻曲線的調(diào)型特征參數(shù)與聲調(diào)增強(qiáng)后音節(jié)的基頻曲線的調(diào)型特征參數(shù)之間的差別，從而確定與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)及所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù)。使得建立的聲調(diào)增強(qiáng)模型可以有效地對聲調(diào)特征進(jìn)行增強(qiáng)，提高對中文語音的聲調(diào)特征進(jìn)行增強(qiáng)的有效性。根據(jù)本發(fā)明實(shí)施方式，在確定聲調(diào)增強(qiáng)模型時(shí)，調(diào)型特征參數(shù)可以從基頻曲線的均值、基頻曲線的范圍、基頻曲線的最小值、基頻曲線的最大值、基頻曲線的最大值位置、基頻曲線的最小值位置、基頻曲線的初始值和基頻曲線的結(jié)束值這八個(gè)基頻曲線特征參數(shù)中選擇，由于調(diào)型特征參數(shù)是從可以較好地描述基頻曲線的特征參數(shù)中選擇的，因此，后續(xù)通過該調(diào)型特征參數(shù)對基頻曲線進(jìn)行調(diào)整時(shí)，可以有效地對基頻曲線進(jìn)行調(diào)整，進(jìn)一步提高聲調(diào)增強(qiáng)的精度，強(qiáng)化聲調(diào)增強(qiáng)的效果。根據(jù)本發(fā)明實(shí)施方式，在確定聲調(diào)增強(qiáng)模型時(shí)，還提供了至少三種從存在差異的調(diào)型特征參數(shù)中確定基頻曲線的增強(qiáng)特征參數(shù)的方式。包括將確定出的全部所述存在差異的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)；或者，將所述差異幅度超過一設(shè)定值的所述調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)；或者，將所述調(diào)型特征參數(shù)按差異幅度從大到小排序后的一個(gè)或復(fù)數(shù)個(gè)調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)。通過本發(fā)明實(shí)施例提供的從存在差異的調(diào)型特征參數(shù)中確定基頻曲線的增強(qiáng)特征參數(shù)的多種方式，可以靈活地建立聲調(diào)增強(qiáng)模型。根據(jù)本發(fā)明另一實(shí)施例，提供一種中文語音信號處理裝置，該裝置包括一個(gè)切分模塊，用于以音節(jié)為單位切分待處理中文語音信號；一個(gè)基頻提取模塊，用于提取每個(gè)音節(jié)的基頻曲線；一個(gè)基頻曲線分類模塊，用于確定每個(gè)音節(jié)的聲調(diào)種類；一個(gè)確定模塊，用于根據(jù)預(yù)先建立的聲調(diào)增強(qiáng)模型，確定與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù)及所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù)；—個(gè)增強(qiáng)模塊，用于根據(jù)每個(gè)音節(jié)的聲調(diào)種類、以及與所述聲調(diào)種類對應(yīng)的所述增強(qiáng)特征參數(shù)和所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù)，對每個(gè)音節(jié)的基頻曲線進(jìn)行調(diào)整；一個(gè)合成模塊，用于根據(jù)調(diào)整后的基頻曲線合成音節(jié)。根據(jù)本發(fā)明實(shí)施方式的中文語音信號處理裝置，針對中文語音聲調(diào)具有辨別詞意的重要特性，根據(jù)聲調(diào)在聲學(xué)層面上的表現(xiàn)為基頻曲線的原理，將連續(xù)的中文語音信號流劃分為以音節(jié)為單位的中文語音信號，根據(jù)音節(jié)所屬的聲調(diào)種類，對音節(jié)的基頻曲線進(jìn)行調(diào)整。通過調(diào)整后的基頻曲線修改語音波形，增強(qiáng)中文語音的聲調(diào)特征，并提高中文語音聲調(diào)的識別率。根據(jù)本發(fā)明實(shí)施方式，中文語音信號處理裝置還可以進(jìn)一步包括一個(gè)輸出模塊，該輸出模塊可以按照每個(gè)音節(jié)在待處理中文語音信號中的先后順序，依次輸出合成后的每個(gè)音節(jié)，保證了輸出的中文語音的連續(xù)性，從而保證中文語音含義的完整性。根據(jù)本發(fā)明實(shí)施方式，中文語音信號處理裝置中的基頻曲線分類模塊，可以用于對每個(gè)音節(jié)的基頻曲線進(jìn)行三次多項(xiàng)式擬合，將三次多項(xiàng)式的四個(gè)系數(shù)作為分類特征，通過模式分類方法確定該音節(jié)的聲調(diào)種類，從而提高確定出的音節(jié)的聲調(diào)種類的準(zhǔn)確性。根據(jù)本發(fā)明的又一實(shí)施例，還提供了一種助聽設(shè)備，該助聽設(shè)備包括上述任意一種中文語音信號處理裝置。利用該助聽設(shè)備，能夠通過調(diào)整后的基頻曲線修改語音波形，增強(qiáng)中文語音的聲調(diào)特征，并提高中文語音聲調(diào)的識別率。

下面將通過參照附圖詳細(xì)描述本發(fā)明的優(yōu)選實(shí)施例，使本領(lǐng)域的普通技術(shù)人員更清楚本發(fā)明的上述及其它特征和優(yōu)點(diǎn)，附圖中圖1為根據(jù)本發(fā)明一實(shí)施例的中文語音信號處理方法的步驟流程圖；圖2為本發(fā)明一實(shí)施例的基頻曲線特征參數(shù)示意圖，其中，橫坐標(biāo)為時(shí)間(單位為秒)，縱坐標(biāo)為頻率(單位為赫茲)；圖3為本發(fā)明另一實(shí)施例的建立聲調(diào)增強(qiáng)模型的步驟流程圖；圖4為本發(fā)明另一實(shí)施例的中文語音信號處理裝置的結(jié)構(gòu)示意圖。
具體實(shí)施例方式大部分助聽器是根據(jù)西方語音來研究和開發(fā)的。而中文語音與西方語音存在多方面不同，針對中文語音聲調(diào)具有辨別詞意的重要特性，對中文語音中的聲調(diào)進(jìn)行增強(qiáng)，從而提高中文語音的聲調(diào)識別率。為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚，以下舉實(shí)施例對本發(fā)明進(jìn)一步詳細(xì)說明。本發(fā)明一實(shí)施例提供一種中文語音信號處理方法，圖1為該方法的步驟流程圖，該方法包括步驟101、對待處理的中文語音信號進(jìn)行音節(jié)切分。本發(fā)明實(shí)施例提供的中文語音信號處理方法，可以是針對每個(gè)音節(jié)為單位的中文語音信號的處理方法，因此，需要將連續(xù)的待處理的中文語音信號劃分為以音節(jié)為單位的中文語音信號，以便于后續(xù)處理。在本實(shí)施例中，可以利用以下方式中的任意一種來確定一個(gè)待處理的中文語音信號方式一、將設(shè)定時(shí)長內(nèi)接收到的中文語音信號作為待處理中文語音信號。在這種確定待處理的中文語音信號的方式下，可以在選擇適當(dāng)?shù)脑O(shè)定時(shí)長時(shí)，保證中文語音信號的實(shí)時(shí)處理，使得感音性耳聾患者可以及時(shí)接收到中文語音信息。方式二、對已接收到的中文語音信號進(jìn)行端點(diǎn)檢測，將檢測出的每一段中文語音信號依次作為待處理中文語音信號。中文語音信號可以是通過麥克風(fēng)等聲音輸入設(shè)備接收，并經(jīng)過模擬/數(shù)字(A/D)轉(zhuǎn)換設(shè)備轉(zhuǎn)換后得到的數(shù)字信號。步驟102、提取每個(gè)音節(jié)的基頻曲線。中文語音中聲調(diào)在聲學(xué)層面上表現(xiàn)為基頻曲線，因此，為了對中文語音的聲調(diào)進(jìn)行增強(qiáng)，以提高感音性耳聾患者對中文語音聲調(diào)的識別率，可以對中文語音信號的基頻曲線進(jìn)行處理。具體的，可以針對切分后的每個(gè)以音節(jié)為單位的中文語音信號，利用基頻提取的方法來確定基頻曲線。步驟103、確定每個(gè)音節(jié)的聲調(diào)種類。所述聲調(diào)種類可以是按照聲調(diào)識別方法，確定出的陰平、陽平、上聲和去聲四種聲調(diào)種類。在本步驟中，也可以是根據(jù)其他聲調(diào)分類方法(例如，粵語的九種聲調(diào))，確定出的聲調(diào)種類。在確定一個(gè)音節(jié)的聲調(diào)種類時(shí)，可以對該音節(jié)的基頻曲線做三次多項(xiàng)式擬合，利用擬合后三次多項(xiàng)式的四個(gè)系數(shù)作為分類特征，通過模式分類方法確定該音節(jié)的聲調(diào)種類。具體的，可以利用三次多項(xiàng)式擬合的方法獲得擬合后的基頻曲線的四個(gè)系數(shù)，將所述四個(gè)系數(shù)作為分類特征參數(shù)。根據(jù)這些分類特征參數(shù)，與基頻曲線類型進(jìn)行匹配，確定該基頻曲線對應(yīng)的基頻曲線類型，從而確定該音節(jié)的聲調(diào)種類。步驟104、確定與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線的調(diào)整方法。針對音節(jié)的不同的聲調(diào)種類，對每個(gè)音節(jié)的基頻曲線的調(diào)整方法可能是不同的。在本實(shí)施例中，示例的調(diào)整方法是指對基頻曲線的特征參數(shù)的調(diào)整。在本步驟中，可以根據(jù)預(yù)先建立的聲調(diào)增強(qiáng)模型，從該聲調(diào)增強(qiáng)模型中確定與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)及該增強(qiáng)特征參數(shù)的調(diào)整系數(shù)，從而確定與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線的調(diào)整方法。例如，在音節(jié)的聲調(diào)種類包括陰平、陽平、上聲和去聲四種時(shí)，可以根據(jù)預(yù)先建立的聲調(diào)增強(qiáng)模型，分別確定與陰平聲調(diào)對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)及該增強(qiáng)特征參數(shù)的調(diào)整系數(shù)、與陽平聲調(diào)對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)及該增強(qiáng)特征參數(shù)的調(diào)整系數(shù)、與上聲聲調(diào)對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)及該增強(qiáng)特征參數(shù)的調(diào)整系數(shù)，以及與去聲聲調(diào)對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)及該增強(qiáng)特征參數(shù)的調(diào)整系數(shù)，從而可以確定對聲調(diào)種類為陰平、陽平、上聲和去聲中任意一種的音節(jié)的基頻曲線的調(diào)整方法。需要說明的是，步驟104和步驟103的執(zhí)行可以不分先后。在預(yù)先建立的聲調(diào)增強(qiáng)模型中，可以包括針對與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線的調(diào)整方法。下面對建立聲調(diào)增強(qiáng)模型的過程進(jìn)行示例性說明。具體的，在建立聲調(diào)增強(qiáng)模型的過程中，針對每個(gè)聲調(diào)種類，可以通過以下方法來確定與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)及該增強(qiáng)特征參數(shù)的調(diào)整系數(shù)確定統(tǒng)計(jì)樣本中與該聲調(diào)種類對應(yīng)的音節(jié)對，每個(gè)音節(jié)對包括一個(gè)聲調(diào)增強(qiáng)前音節(jié)和一個(gè)聲調(diào)增強(qiáng)后音節(jié)，每個(gè)音節(jié)對中的聲調(diào)增強(qiáng)后音節(jié)是對聲調(diào)增強(qiáng)前音節(jié)進(jìn)行聲調(diào)增強(qiáng)后獲得的；
確定音節(jié)對中聲調(diào)增強(qiáng)前音節(jié)的基頻曲線的調(diào)型特征參數(shù)與聲調(diào)增強(qiáng)后音節(jié)的基頻曲線的調(diào)型特征參數(shù)之中存在差異的調(diào)型特征參數(shù)；將所述存在差異的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)。并根據(jù)所述差異的幅度，確定該增強(qiáng)特征參數(shù)的調(diào)整系數(shù)，具體的，可以將該增強(qiáng)特征參數(shù)在每個(gè)音節(jié)對中聲調(diào)增強(qiáng)前后差異的幅度的平均值確定為該增強(qiáng)特征參數(shù)的調(diào)整系數(shù)，當(dāng)然，也可以將每個(gè)音節(jié)對中聲調(diào)增強(qiáng)前后差異的幅度進(jìn)行加權(quán)后獲得的數(shù)值確定為該增強(qiáng)特征參數(shù)的調(diào)整系數(shù)。所述調(diào)型特征參數(shù)可以從基頻曲線的均值、基頻曲線的范圍、基頻曲線的最小值、基頻曲線的最大值、基頻曲線的最大值位置、基頻曲線的最小值位置、基頻曲線的初始值以及基頻曲線的結(jié)束值這八個(gè)特征參數(shù)中選擇。圖2示出了基頻曲線的均值、基頻曲線的范圍、基頻曲線的最小值、基頻曲線的最大值、基頻曲線的最大值位置、基頻曲線的最小值位置、基頻曲線的初始值、基頻曲線的結(jié)束值。將所述存在差異的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)，可以為以下三種方式中的任意一種方式一、將確定出的全部所述存在差異的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)；方式二、將確定出的差異幅度超過一設(shè)定值的所述調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)；方式三、將確定出的所述調(diào)型特征參數(shù)按差異幅度從大到小排序后的一個(gè)或復(fù)數(shù)個(gè)調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)。步驟105、利用確定出的基頻曲線調(diào)整方法和確定出的每個(gè)音節(jié)的聲調(diào)種類，對每個(gè)音節(jié)的基頻曲線進(jìn)行調(diào)整。以調(diào)整一個(gè)音節(jié)的基頻曲線為例，本步驟包括根據(jù)該音節(jié)的聲調(diào)種類確定對應(yīng)的調(diào)整方法，即確定對應(yīng)的調(diào)整系數(shù)和對應(yīng)的增強(qiáng)特征參數(shù)，并利用確定出的對應(yīng)的調(diào)整系數(shù)去調(diào)整該基頻曲線對應(yīng)的增強(qiáng)特征參數(shù)，從而得到對該音節(jié)進(jìn)行聲調(diào)增強(qiáng)后的基頻曲線。所述調(diào)整系數(shù)還可以因人而異，從而可以針對每個(gè)人的需要對中文語音的聲調(diào)特征進(jìn)行增強(qiáng)，提高其聽到的中文語音的清晰度。步驟106、根據(jù)調(diào)整后的基頻曲線合成每個(gè)音節(jié)。具體的，可以使用基于時(shí)域波形修改的語音合成算法——基頻同步疊加(PS0LA，Pitch Synchronous OverLap and Add)-來實(shí)現(xiàn)音節(jié)的合成。步驟107、輸出合成的每個(gè)音節(jié)。在本步驟中，為了保證感音性耳聾患者可以完整地理解連續(xù)的中文語音信號的含義，可以按照每個(gè)音節(jié)在待處理中文語音信號中的先后順序，依次輸出合成后的每個(gè)音節(jié)。較優(yōu)的，為了保證步驟107的順利執(zhí)行，在步驟102至步驟106中，可以按照每個(gè)音節(jié)在待處理中文語音信號中的先后順序，在對一個(gè)音節(jié)提取基頻曲線、確定聲調(diào)種類、確定調(diào)整方法，調(diào)整基頻曲線以及合成音節(jié)的操作完成后，繼續(xù)對另一個(gè)音節(jié)進(jìn)行相同的處理，即對待處理中文語音信號中的每個(gè)音節(jié)進(jìn)行串行處理。當(dāng)然，也可以將待處理中文語音信號中包含的至少兩個(gè)音節(jié)進(jìn)行并行處理。
本發(fā)明一實(shí)施例提供一種建立聲調(diào)增強(qiáng)模型的方法，具體的，如圖3所示，本實(shí)施例可以包括以下步驟步驟201、從語音數(shù)據(jù)庫中提取中文語音信號統(tǒng)計(jì)樣本。所述中文語音信號統(tǒng)計(jì)樣本可以是以音節(jié)對的形式保存的，一個(gè)音節(jié)對中包括針對同一個(gè)中文語音的聲調(diào)增強(qiáng)前的中文語音信號(以音節(jié)為單位)和聲調(diào)增強(qiáng)后的該中文
語音信號。步驟202、確定提取出的每個(gè)音節(jié)對的基頻曲線。本步驟包括，確定每個(gè)音節(jié)對中聲調(diào)增強(qiáng)前的中文語音信號的基頻曲線，以及確定聲調(diào)增強(qiáng)后的該中文語音信號的基頻曲線。步驟203、對聲調(diào)進(jìn)行分類，針對分類后的每個(gè)聲調(diào)種類，對屬于該聲調(diào)種類的每個(gè)音節(jié)對的基頻曲線進(jìn)行特征參數(shù)提取。針對所有音節(jié)對中聲調(diào)增強(qiáng)前的中文語音信號的基頻曲線，可以利用三次多項(xiàng)式擬合的方法獲得四個(gè)系數(shù)，將此系數(shù)作為分類的特征參數(shù)對基頻曲線類型做聚類，得到至少一個(gè)基頻曲線類型，得到的每個(gè)基頻曲線類型可以視為對應(yīng)一個(gè)聲調(diào)種類。在對聲調(diào)進(jìn)行分類的同時(shí)，也確定出了每個(gè)音節(jié)對的聲調(diào)種類，即確定出了每個(gè)聲調(diào)種類包括的音節(jié)對。針對每個(gè)聲調(diào)種類，為了后續(xù)確定與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)，在本步驟中，可以提取該聲調(diào)種類包括的每個(gè)音節(jié)對所對應(yīng)的基頻曲線的調(diào)型特征參數(shù)，后續(xù)可以從提取出的調(diào)型特征參數(shù)中確定增強(qiáng)特征參數(shù)。所述調(diào)型特征參數(shù)可以選擇用于確定基頻曲線、能夠較好體現(xiàn)基頻曲線特征的特征參數(shù)。較優(yōu)的，所述調(diào)型特征參數(shù)可以從基頻曲線的均值、基頻曲線的范圍、基頻曲線的最小值、基頻曲線的最大值、基頻曲線的最大值位置、基頻曲線的最小值位置、基頻曲線的初始值、基頻曲線的結(jié)束值這八個(gè)特征參數(shù)中選擇。步驟204、統(tǒng)計(jì)確定出的每個(gè)音節(jié)對中存在差異的調(diào)型特征參數(shù)。具體的，可以通過數(shù)據(jù)驅(qū)動(dòng)的方式，利用統(tǒng)計(jì)方法分析比較屬于同一個(gè)聲調(diào)種類的每個(gè)音節(jié)對對應(yīng)的聲調(diào)增強(qiáng)前的基頻曲線與聲調(diào)增強(qiáng)后的基頻曲線，確定聲調(diào)增強(qiáng)前的基頻曲線與聲調(diào)增強(qiáng)后的基頻曲線中存在差異的調(diào)型特征參數(shù)，從而確定該聲調(diào)種類對應(yīng)的各音節(jié)對中聲調(diào)增強(qiáng)前的基頻曲線與聲調(diào)增強(qiáng)后的基頻曲線的主要差別。步驟205、確定聲調(diào)增強(qiáng)模型中，與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)及該增強(qiáng)特征參數(shù)的調(diào)整系數(shù)。在本步驟中，針對每個(gè)聲調(diào)種類，可以根據(jù)屬于該聲調(diào)種類的每個(gè)音節(jié)對所對應(yīng)的存在差異的調(diào)型特征參數(shù)確定與該聲調(diào)種類對應(yīng)的聲調(diào)增強(qiáng)模型中的增強(qiáng)特征參數(shù)，具體的，可以將屬于該聲調(diào)種類的每個(gè)音節(jié)對確定出的所有存在差異的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)，也可以將差異幅度超過設(shè)定值的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)，還可以將在所有存在差異的調(diào)型特征參數(shù)中差異幅度排名滿足要求的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)。在本步驟中，還可以根據(jù)屬于該聲調(diào)種類的每個(gè)音節(jié)對所對應(yīng)的存在差異的調(diào)型特征參數(shù)之間的差異幅度，來確定與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)的調(diào)整系數(shù)，具體的，針對確定出的每個(gè)增強(qiáng)特征參數(shù)，可以通過對每個(gè)音節(jié)對確定出的該調(diào)型特征參數(shù)之間的差異幅度取平均的方法，來確定與該聲調(diào)種類對應(yīng)的基頻曲線中該增強(qiáng)特征參數(shù)的調(diào)整系數(shù)。在本實(shí)施例提供的方法中，針對確定出的每個(gè)聲調(diào)種類，確定與該聲調(diào)種類對應(yīng)的基頻曲線的調(diào)整方法，從而確定聲調(diào)增強(qiáng)模型。若利用該預(yù)先建立的聲調(diào)增強(qiáng)模型進(jìn)行聲調(diào)增強(qiáng)，則確定出的每個(gè)待處理音節(jié)的聲調(diào)種類也必然是該聲調(diào)增強(qiáng)模型當(dāng)中的一個(gè)聲調(diào)種類。本發(fā)明另一實(shí)施例提供一種中文語音信號處理裝置，圖4為該裝置的結(jié)構(gòu)示意圖，該裝置包括一個(gè)切分模塊11、一個(gè)基頻提取模塊12、一個(gè)基頻曲線分類模塊13、一個(gè)確定模塊14、一個(gè)增強(qiáng)模塊15以及一個(gè)合成模塊16。其中，切分模塊11用于將接收到的待處理中文語音信號切分為以音節(jié)為單位的中文語音信號；基頻提取模塊12用于提取每個(gè)音節(jié)的基頻曲線；基頻曲線分類模塊13用于確定每個(gè)音節(jié)的聲調(diào)種類；確定模塊14用于根據(jù)預(yù)先建立的聲調(diào)增強(qiáng)模型，確定與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù)及所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù)；增強(qiáng)模塊15用于根據(jù)每個(gè)音節(jié)的聲調(diào)種類、以及與所述聲調(diào)種類對應(yīng)的所述增強(qiáng)特征參數(shù)和所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù)，對每個(gè)音節(jié)的基頻曲線進(jìn)行調(diào)整；合成模塊16用于根據(jù)調(diào)整后的基頻曲線合成音節(jié)。所述預(yù)先建立的聲調(diào)增強(qiáng)模型可以存放在中文語音信號處理裝置包括的聲調(diào)增強(qiáng)豐旲型庫10中。所述中文語音信號處理裝置還可以包括一個(gè)輸出模塊17,該輸出模塊17用于按照每個(gè)音節(jié)在待處理中文語音信號中的先后順序，依次輸出合成后的每個(gè)音節(jié)。具體的，基頻曲線分類模塊13用于對每條基頻曲線進(jìn)行三次多項(xiàng)式擬合，將三次多項(xiàng)式的四個(gè)系數(shù)作為分類特征，通過模式分類方法確定每個(gè)音節(jié)的聲調(diào)種類。如圖4所示，所述裝置還可以進(jìn)一步包括一個(gè)語音輸入模塊18(如麥克風(fēng))和一個(gè)A/D轉(zhuǎn)換模塊19。輸出模塊17可以包括一個(gè)D/A轉(zhuǎn)換子模塊和一個(gè)語音輸出子模塊(如揚(yáng)聲器)。所述合成模塊16中可以使用基于時(shí)域波形修改的語音合成算法——基頻同步疊加——來實(shí)現(xiàn)語音的合成。本發(fā)明的又一實(shí)施例還提供了一種助聽設(shè)備，該助聽設(shè)備包括上述任意一種中文語音信號處理裝置。由于該助聽設(shè)備包括了上面實(shí)施例提供的中文語音信號處理裝置，因此該助聽設(shè)備能夠通過調(diào)整后的基頻曲線修改語音波形，增強(qiáng)中文語音的聲調(diào)特征，并提高中文語音聲調(diào)的識別率。本發(fā)明實(shí)施例公開了一種中文語音信號處理方法、一種中文語音信號處理裝置、以及一種助聽設(shè)備，針對中文語音聲調(diào)具有辨別詞意的重要特性，根據(jù)聲調(diào)在聲學(xué)層面上的表現(xiàn)為基頻曲線的原理，將連續(xù)的中文語音信號流劃分為以音節(jié)為單位的中文語音信號，根據(jù)音節(jié)所屬的聲調(diào)種類，對音節(jié)的基頻曲線進(jìn)行調(diào)整。通過調(diào)整后的基頻曲線修改語音波形，增強(qiáng)中文語音的聲調(diào)特征，并提高中文語音聲調(diào)的識別率。以上所述僅為本發(fā)明的較佳實(shí)施例而已，并不用以限制本發(fā)明，凡在本發(fā)明的精神和原則之內(nèi)，所作的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種中文語音信號處理方法，該方法包括以音節(jié)為單位切分待處理中文語音信號；提取每個(gè)音節(jié)的基頻曲線；確定每個(gè)音節(jié)的聲調(diào)種類，以及根據(jù)預(yù)先建立的聲調(diào)增強(qiáng)模型，確定與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù)及所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù)；根據(jù)每個(gè)音節(jié)的聲調(diào)種類、以及與所述聲調(diào)種類對應(yīng)的增強(qiáng)特征參數(shù)和所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù)，對該音節(jié)的基頻曲線進(jìn)行調(diào)整；根據(jù)調(diào)整后的基頻曲線合成音節(jié)。
2.如權(quán)利要求1所述的方法，其特征在于，在合成音節(jié)之后，所述方法還包括按照每個(gè)音節(jié)在待處理中文語音信號中的先后順序，依次輸出合成后的每個(gè)音節(jié)。
3.如權(quán)利要求1所述的方法，其特征在于，確定每個(gè)音節(jié)的聲調(diào)種類包括對每個(gè)音節(jié)的基頻曲線進(jìn)行三次多項(xiàng)式擬合；將三次多項(xiàng)式的四個(gè)系數(shù)作為分類特征，通過模式分類方法確定該音節(jié)的聲調(diào)種類。
4.如權(quán)利要求1所述的方法，其特征在于，通過以下方式建立聲調(diào)增強(qiáng)模型針對每個(gè)聲調(diào)種類，確定統(tǒng)計(jì)樣本中與該聲調(diào)種類對應(yīng)的音節(jié)對，其中每個(gè)音節(jié)對包括一個(gè)聲調(diào)增強(qiáng)前音節(jié)和一個(gè)聲調(diào)增強(qiáng)后音節(jié)；確定音節(jié)對中聲調(diào)增強(qiáng)前音節(jié)的基頻曲線的調(diào)型特征參數(shù)與聲調(diào)增強(qiáng)后音節(jié)的基頻曲線的調(diào)型特征參數(shù)之中存在差異的調(diào)型特征參數(shù)；將所述存在差異的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù)，并根據(jù)所述差異的幅度，確定所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù)。
5.如權(quán)利要求4所述的方法，其特征在于，所述調(diào)型特征參數(shù)為基頻曲線的均值、基頻曲線的范圍、基頻曲線的最小值、基頻曲線的最大值、基頻曲線的最大值位置、基頻曲線的最小值位置、基頻曲線的初始值以及基頻曲線的結(jié)束值這八個(gè)基頻曲線特征參數(shù)中的至少一個(gè)。
6.如權(quán)利要求4所述的方法，其特征在于，確定增強(qiáng)特征參數(shù)包括將全部所述存在差異的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù)；或者，將所述差異幅度超過一設(shè)定值的所述調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù)；或者，將所述調(diào)型特征參數(shù)按差異幅度從大到小排序后的一個(gè)或復(fù)數(shù)個(gè)調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù)。
7.一種中文語音信號處理裝置，該裝置包括一個(gè)切分模塊，用于以音節(jié)為單位切分待處理中文語音信號；一個(gè)基頻提取模塊，用于提取每個(gè)音節(jié)的基頻曲線；一個(gè)基頻曲線分類模塊，用于確定每個(gè)音節(jié)的聲調(diào)種類；一個(gè)確定模塊，用于根據(jù)預(yù)先建立的聲調(diào)增強(qiáng)模型，確定與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù)及所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù)；一個(gè)增強(qiáng)模塊，用于根據(jù)每個(gè)音節(jié)的聲調(diào)種類、以及與所述聲調(diào)種類對應(yīng)的所述增強(qiáng)特征參數(shù)和所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù)，對每個(gè)音節(jié)的基頻曲線進(jìn)行調(diào)整；合成模塊，用于根據(jù)調(diào)整后的基頻曲線合成音節(jié)。
8.如權(quán)利要求7所述的裝置，其特征在于，所述裝置還包括一個(gè)輸出模塊，用于按照每個(gè)音節(jié)在待處理中文語音信號中的先后順序，依次輸出合成后的每個(gè)音節(jié)。
9.如權(quán)利要求7所述的裝置，其特征在于，所述基頻曲線分類模塊能夠?qū)γ總€(gè)音節(jié)的基頻曲線進(jìn)行三次多項(xiàng)式擬合，將三次多項(xiàng)式的四個(gè)系數(shù)作為分類特征，通過模式分類方法確定該音節(jié)的聲調(diào)種類。
10.一種助聽設(shè)備，包括如權(quán)利要求7至9中任一項(xiàng)所述的中文語音信號處理裝置。
全文摘要
本發(fā)明公開了一種中文語音信號處理方法、一種中文語音信號處理裝置、以及一種助聽設(shè)備，針對中文語音聲調(diào)具有辨別詞意的重要特性，根據(jù)聲調(diào)在聲學(xué)層面上的表現(xiàn)為基頻曲線的原理，將連續(xù)的中文語音信號流劃分為以音節(jié)為單位的中文語音信號，根據(jù)音節(jié)所屬的聲調(diào)種類，對音節(jié)的基頻曲線進(jìn)行調(diào)整。通過調(diào)整后的基頻曲線修改語音波形，增強(qiáng)中文語音的聲調(diào)特征，并提高中文語音聲調(diào)的識別率。
文檔編號G10L15/00GK103035252SQ20111030186
公開日2013年4月10日申請日期2011年9月30日優(yōu)先權(quán)日2011年9月30日
發(fā)明者楊晨, 周衛(wèi), 蔡蓮紅申請人:西門子公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：楊晨;周衛(wèi);蔡蓮紅
技術(shù)所有人：西門子公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

攪拌裝置設(shè)備相關(guān)技術(shù)

廚房設(shè)備滅火裝置相關(guān)技術(shù)

裝置和設(shè)備的區(qū)別相關(guān)技術(shù)

機(jī)械設(shè)備安全防護(hù)裝置相關(guān)技術(shù)

設(shè)備安全裝置相關(guān)技術(shù)

裝置與設(shè)備的區(qū)別相關(guān)技術(shù)

防雷裝置檢測專業(yè)設(shè)備相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

中文語音信號處理方法、裝置及助聽設(shè)備的制作方法