專利名稱:中文語音信號處理方法、裝置及助聽設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字信號處理技術(shù)領(lǐng)域,特別是一種中文語音信號處理方法、一種中文語音信號處理裝置以及一種助聽設(shè)備。
背景技術(shù):
根據(jù)2006年的統(tǒng)計(jì)數(shù)據(jù),我國大約有2780萬人存在聽力障礙。助聽技術(shù)作為聽力障礙的有效解決手段,越來越受到人們的關(guān)注。而伴隨著科技的進(jìn)步,數(shù)字信號處理技術(shù)逐步應(yīng)用到助聽領(lǐng)域。耳聾分為傳導(dǎo)性耳聾、感音神經(jīng)性耳聾及混合型耳聾,其中,罹患感音神經(jīng)性耳聾的耳聾患者占了相當(dāng)大的比例。感音神經(jīng)性耳聾又可以分為蝸性(也叫感音性)耳聾、蝸后耳聾、以及中樞性耳聾。針對感音性耳聾,由于耳蝸的一項(xiàng)重要的功能就是分析處理聽覺信息,因此導(dǎo)致感音性耳聾患者缺失語音分析能力,聲調(diào)識別能力較差。目前的助聽器側(cè)重于聲音振幅的放大,對于傳導(dǎo)性耳聾效果很好,而對于感音性耳聾,不能達(dá)到理想的助聽效果,尤其噪聲環(huán)境下這種不理想更為明顯。目前,大部分可用于語音分析能力彌補(bǔ)的助聽器是根據(jù)西方語音來研究和開發(fā)的。而中文語音與西方語音存在多方面不同,如(I)中文語音為單音節(jié)帶調(diào)語言;(2)中文語音為輔音與元音結(jié)合的結(jié)構(gòu),不同于西方語音存在復(fù)數(shù)個(gè)輔音串的結(jié)構(gòu)。由于中文語音和西方語音存在的差異,迫切需要一種針對中文語音的信號處理技術(shù),增強(qiáng)中文語音的聲調(diào),提高中文語音的聲調(diào)識別率。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提出了一種中文語音信號處理方法,用以增強(qiáng)中文語音的聲調(diào),提高中文語音的聲調(diào)識別率。本發(fā)明還提供一種中文語音信號處理裝置以及一種助聽設(shè)備。因此,根據(jù)本發(fā)明一實(shí)施例,提供一種中文語音信號處理方法,包括以音節(jié)為單位切分待處理中文語音信號;提取每個(gè)首節(jié)的基頻曲線;確定每個(gè)音節(jié)的聲調(diào)種類,以及根據(jù)預(yù)先建立的聲調(diào)增強(qiáng)模型,確定與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù)及所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù);根據(jù)每個(gè)音節(jié)的聲調(diào)種類、以及與所述聲調(diào)種類對應(yīng)的增強(qiáng)特征參數(shù)和所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù),對該音節(jié)的基頻曲線進(jìn)行調(diào)整;根據(jù)調(diào)整后的基頻曲線合成音節(jié)。根據(jù)本發(fā)明實(shí)施方式,針對中文語音聲調(diào)具有辨別詞意的重要特性,根據(jù)聲調(diào)在聲學(xué)層面上的表現(xiàn)為基頻曲線的原理,將連續(xù)的中文語音信號流劃分為以音節(jié)為單位的中文語音信號,根據(jù)音節(jié)所屬的聲調(diào)種類,對音節(jié)的基頻曲線進(jìn)行調(diào)整。通過調(diào)整后的基頻曲線修改語音波形,增強(qiáng)中文語音的聲調(diào)特征,并提高中文語音聲調(diào)的識別率。根據(jù)本發(fā)明實(shí)施方式,還包括按照每個(gè)音節(jié)在待處理中文語音信號中的先后順序,依次輸出合成后的每個(gè)音節(jié)的步驟,保證了輸出的中文語音的連續(xù)性,從而保證中文語音含義的完整性。根據(jù)本發(fā)明實(shí)施方式,可以對音節(jié)的基頻曲線進(jìn)行三次多項(xiàng)式擬合,并將三次多項(xiàng)式的四個(gè)系數(shù)作為基頻曲線分類的特征,通過模式分類方法確定該音節(jié)的聲調(diào)類型,從而能夠準(zhǔn)確地確定每個(gè)音節(jié)的聲調(diào)種類。根據(jù)本發(fā)明實(shí)施方式,建立聲調(diào)增強(qiáng)模型時(shí),針對每個(gè)聲調(diào)種類,均可以通過數(shù)據(jù)驅(qū)動(dòng)的方式,針對統(tǒng)計(jì)樣本中屬于該聲調(diào)種類的音節(jié)對,分析比較每個(gè)音節(jié)對中聲調(diào)增強(qiáng)前音節(jié)的基頻曲線的調(diào)型特征參數(shù)與聲調(diào)增強(qiáng)后音節(jié)的基頻曲線的調(diào)型特征參數(shù)之間的差別,從而確定與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)及所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù)。使得建立的聲調(diào)增強(qiáng)模型可以有效地對聲調(diào)特征進(jìn)行增強(qiáng),提高對中文語音的聲調(diào)特征進(jìn)行增強(qiáng)的有效性。根據(jù)本發(fā)明實(shí)施方式,在確定聲調(diào)增強(qiáng)模型時(shí),調(diào)型特征參數(shù)可以從基頻曲線的均值、基頻曲線的范圍、基頻曲線的最小值、基頻曲線的最大值、基頻曲線的最大值位置、基頻曲線的最小值位置、基頻曲線的初始值和基頻曲線的結(jié)束值這八個(gè)基頻曲線特征參數(shù)中選擇,由于調(diào)型特征參數(shù)是從可以較好地描述基頻曲線的特征參數(shù)中選擇的,因此,后續(xù)通過該調(diào)型特征參數(shù)對基頻曲線進(jìn)行調(diào)整時(shí),可以有效地對基頻曲線進(jìn)行調(diào)整,進(jìn)一步提高聲調(diào)增強(qiáng)的精度,強(qiáng)化聲調(diào)增強(qiáng)的效果。根據(jù)本發(fā)明實(shí)施方式,在確定聲調(diào)增強(qiáng)模型時(shí),還提供了至少三種從存在差異的調(diào)型特征參數(shù)中確定基頻曲線的增強(qiáng)特征參數(shù)的方式。包括將確定出的全部所述存在差異的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù);或者,將所述差異幅度超過一設(shè)定值的所述調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù);或者,將所述調(diào)型特征參數(shù)按差異幅度從大到小排序后的一個(gè)或復(fù)數(shù)個(gè)調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)。通過本發(fā)明實(shí)施例提供的從存在差異的調(diào)型特征參數(shù)中確定基頻曲線的增強(qiáng)特征參數(shù)的多種方式,可以靈活地建立聲調(diào)增強(qiáng)模型。根據(jù)本發(fā)明另一實(shí)施例,提供一種中文語音信號處理裝置,該裝置包括一個(gè)切分模塊,用于以音節(jié)為單位切分待處理中文語音信號;一個(gè)基頻提取模塊,用于提取每個(gè)音節(jié)的基頻曲線;一個(gè)基頻曲線分類模塊,用于確定每個(gè)音節(jié)的聲調(diào)種類;一個(gè)確定模塊,用于根據(jù)預(yù)先建立的聲調(diào)增強(qiáng)模型,確定與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù)及所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù);—個(gè)增強(qiáng)模塊,用于根據(jù)每個(gè)音節(jié)的聲調(diào)種類、以及與所述聲調(diào)種類對應(yīng)的所述增強(qiáng)特征參數(shù)和所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù),對每個(gè)音節(jié)的基頻曲線進(jìn)行調(diào)整;一個(gè)合成模塊,用于根據(jù)調(diào)整后的基頻曲線合成音節(jié)。根據(jù)本發(fā)明實(shí)施方式的中文語音信號處理裝置,針對中文語音聲調(diào)具有辨別詞意的重要特性,根據(jù)聲調(diào)在聲學(xué)層面上的表現(xiàn)為基頻曲線的原理,將連續(xù)的中文語音信號流劃分為以音節(jié)為單位的中文語音信號,根據(jù)音節(jié)所屬的聲調(diào)種類,對音節(jié)的基頻曲線進(jìn)行調(diào)整。通過調(diào)整后的基頻曲線修改語音波形,增強(qiáng)中文語音的聲調(diào)特征,并提高中文語音聲調(diào)的識別率。根據(jù)本發(fā)明實(shí)施方式,中文語音信號處理裝置還可以進(jìn)一步包括一個(gè)輸出模塊,該輸出模塊可以按照每個(gè)音節(jié)在待處理中文語音信號中的先后順序,依次輸出合成后的每個(gè)音節(jié),保證了輸出的中文語音的連續(xù)性,從而保證中文語音含義的完整性。根據(jù)本發(fā)明實(shí)施方式,中文語音信號處理裝置中的基頻曲線分類模塊,可以用于對每個(gè)音節(jié)的基頻曲線進(jìn)行三次多項(xiàng)式擬合,將三次多項(xiàng)式的四個(gè)系數(shù)作為分類特征,通過模式分類方法確定該音節(jié)的聲調(diào)種類,從而提高確定出的音節(jié)的聲調(diào)種類的準(zhǔn)確性。根據(jù)本發(fā)明的又一實(shí)施例,還提供了一種助聽設(shè)備,該助聽設(shè)備包括上述任意一種中文語音信號處理裝置。利用該助聽設(shè)備,能夠通過調(diào)整后的基頻曲線修改語音波形,增強(qiáng)中文語音的聲調(diào)特征,并提高中文語音聲調(diào)的識別率。
下面將通過參照附圖詳細(xì)描述本發(fā)明的優(yōu)選實(shí)施例,使本領(lǐng)域的普通技術(shù)人員更清楚本發(fā)明的上述及其它特征和優(yōu)點(diǎn),附圖中圖1為根據(jù)本發(fā)明一實(shí)施例的中文語音信號處理方法的步驟流程圖;圖2為本發(fā)明一實(shí)施例的基頻曲線特征參數(shù)示意圖,其中,橫坐標(biāo)為時(shí)間(單位為秒),縱坐標(biāo)為頻率(單位為赫茲);圖3為本發(fā)明另一實(shí)施例的建立聲調(diào)增強(qiáng)模型的步驟流程圖;圖4為本發(fā)明另一實(shí)施例的中文語音信號處理裝置的結(jié)構(gòu)示意圖。
具體實(shí)施例方式大部分助聽器是根據(jù)西方語音來研究和開發(fā)的。而中文語音與西方語音存在多方面不同,針對中文語音聲調(diào)具有辨別詞意的重要特性,對中文語音中的聲調(diào)進(jìn)行增強(qiáng),從而提高中文語音的聲調(diào)識別率。為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,以下舉實(shí)施例對本發(fā)明進(jìn)一步詳細(xì)說明。本發(fā)明一實(shí)施例提供一種中文語音信號處理方法,圖1為該方法的步驟流程圖,該方法包括步驟101、對待處理的中文語音信號進(jìn)行音節(jié)切分。本發(fā)明實(shí)施例提供的中文語音信號處理方法,可以是針對每個(gè)音節(jié)為單位的中文語音信號的處理方法,因此,需要將連續(xù)的待處理的中文語音信號劃分為以音節(jié)為單位的中文語音信號,以便于后續(xù)處理。在本實(shí)施例中,可以利用以下方式中的任意一種來確定一個(gè)待處理的中文語音信號方式一、將設(shè)定時(shí)長內(nèi)接收到的中文語音信號作為待處理中文語音信號。在這種確定待處理的中文語音信號的方式下,可以在選擇適當(dāng)?shù)脑O(shè)定時(shí)長時(shí),保證中文語音信號的實(shí)時(shí)處理,使得感音性耳聾患者可以及時(shí)接收到中文語音信息。方式二、對已接收到的中文語音信號進(jìn)行端點(diǎn)檢測,將檢測出的每一段中文語音信號依次作為待處理中文語音信號。中文語音信號可以是通過麥克風(fēng)等聲音輸入設(shè)備接收,并經(jīng)過模擬/數(shù)字(A/D)轉(zhuǎn)換設(shè)備轉(zhuǎn)換后得到的數(shù)字信號。步驟102、提取每個(gè)音節(jié)的基頻曲線。中文語音中聲調(diào)在聲學(xué)層面上表現(xiàn)為基頻曲線,因此,為了對中文語音的聲調(diào)進(jìn)行增強(qiáng),以提高感音性耳聾患者對中文語音聲調(diào)的識別率,可以對中文語音信號的基頻曲線進(jìn)行處理。具體的,可以針對切分后的每個(gè)以音節(jié)為單位的中文語音信號,利用基頻提取的方法來確定基頻曲線。步驟103、確定每個(gè)音節(jié)的聲調(diào)種類。所述聲調(diào)種類可以是按照聲調(diào)識別方法,確定出的陰平、陽平、上聲和去聲四種聲調(diào)種類。在本步驟中,也可以是根據(jù)其他聲調(diào)分類方法(例如,粵語的九種聲調(diào)),確定出的聲調(diào)種類。在確定一個(gè)音節(jié)的聲調(diào)種類時(shí),可以對該音節(jié)的基頻曲線做三次多項(xiàng)式擬合,利用擬合后三次多項(xiàng)式的四個(gè)系數(shù)作為分類特征,通過模式分類方法確定該音節(jié)的聲調(diào)種類。具體的,可以利用三次多項(xiàng)式擬合的方法獲得擬合后的基頻曲線的四個(gè)系數(shù),將所述四個(gè)系數(shù)作為分類特征參數(shù)。根據(jù)這些分類特征參數(shù),與基頻曲線類型進(jìn)行匹配,確定該基頻曲線對應(yīng)的基頻曲線類型,從而確定該音節(jié)的聲調(diào)種類。步驟104、確定與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線的調(diào)整方法。針對音節(jié)的不同的聲調(diào)種類,對每個(gè)音節(jié)的基頻曲線的調(diào)整方法可能是不同的。在本實(shí)施例中,示例的調(diào)整方法是指對基頻曲線的特征參數(shù)的調(diào)整。在本步驟中,可以根據(jù)預(yù)先建立的聲調(diào)增強(qiáng)模型,從該聲調(diào)增強(qiáng)模型中確定與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)及該增強(qiáng)特征參數(shù)的調(diào)整系數(shù),從而確定與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線的調(diào)整方法。例如,在音節(jié)的聲調(diào)種類包括陰平、陽平、上聲和去聲四種時(shí),可以根據(jù)預(yù)先建立的聲調(diào)增強(qiáng)模型,分別確定與陰平聲調(diào)對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)及該增強(qiáng)特征參數(shù)的調(diào)整系數(shù)、與陽平聲調(diào)對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)及該增強(qiáng)特征參數(shù)的調(diào)整系數(shù)、與上聲聲調(diào)對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)及該增強(qiáng)特征參數(shù)的調(diào)整系數(shù),以及與去聲聲調(diào)對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)及該增強(qiáng)特征參數(shù)的調(diào)整系數(shù),從而可以確定對聲調(diào)種類為陰平、陽平、上聲和去聲中任意一種的音節(jié)的基頻曲線的調(diào)整方法。需要說明的是,步驟104和步驟103的執(zhí)行可以不分先后。在預(yù)先建立的聲調(diào)增強(qiáng)模型中,可以包括針對與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線的調(diào)整方法。下面對建立聲調(diào)增強(qiáng)模型的過程進(jìn)行示例性說明。具體的,在建立聲調(diào)增強(qiáng)模型的過程中,針對每個(gè)聲調(diào)種類,可以通過以下方法來確定與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)及該增強(qiáng)特征參數(shù)的調(diào)整系數(shù)確定統(tǒng)計(jì)樣本中與該聲調(diào)種類對應(yīng)的音節(jié)對,每個(gè)音節(jié)對包括一個(gè)聲調(diào)增強(qiáng)前音節(jié)和一個(gè)聲調(diào)增強(qiáng)后音節(jié),每個(gè)音節(jié)對中的聲調(diào)增強(qiáng)后音節(jié)是對聲調(diào)增強(qiáng)前音節(jié)進(jìn)行聲調(diào)增強(qiáng)后獲得的;
確定音節(jié)對中聲調(diào)增強(qiáng)前音節(jié)的基頻曲線的調(diào)型特征參數(shù)與聲調(diào)增強(qiáng)后音節(jié)的基頻曲線的調(diào)型特征參數(shù)之中存在差異的調(diào)型特征參數(shù);將所述存在差異的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)。并根據(jù)所述差異的幅度,確定該增強(qiáng)特征參數(shù)的調(diào)整系數(shù),具體的,可以將該增強(qiáng)特征參數(shù)在每個(gè)音節(jié)對中聲調(diào)增強(qiáng)前后差異的幅度的平均值確定為該增強(qiáng)特征參數(shù)的調(diào)整系數(shù),當(dāng)然,也可以將每個(gè)音節(jié)對中聲調(diào)增強(qiáng)前后差異的幅度進(jìn)行加權(quán)后獲得的數(shù)值確定為該增強(qiáng)特征參數(shù)的調(diào)整系數(shù)。所述調(diào)型特征參數(shù)可以從基頻曲線的均值、基頻曲線的范圍、基頻曲線的最小值、基頻曲線的最大值、基頻曲線的最大值位置、基頻曲線的最小值位置、基頻曲線的初始值以及基頻曲線的結(jié)束值這八個(gè)特征參數(shù)中選擇。圖2示出了基頻曲線的均值、基頻曲線的范圍、基頻曲線的最小值、基頻曲線的最大值、基頻曲線的最大值位置、基頻曲線的最小值位置、基頻曲線的初始值、基頻曲線的結(jié)束值。將所述存在差異的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù),可以為以下三種方式中的任意一種方式一、將確定出的全部所述存在差異的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù);方式二、將確定出的差異幅度超過一設(shè)定值的所述調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù);方式三、將確定出的所述調(diào)型特征參數(shù)按差異幅度從大到小排序后的一個(gè)或復(fù)數(shù)個(gè)調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)。步驟105、利用確定出的基頻曲線調(diào)整方法和確定出的每個(gè)音節(jié)的聲調(diào)種類,對每個(gè)音節(jié)的基頻曲線進(jìn)行調(diào)整。以調(diào)整一個(gè)音節(jié)的基頻曲線為例,本步驟包括根據(jù)該音節(jié)的聲調(diào)種類確定對應(yīng)的調(diào)整方法,即確定對應(yīng)的調(diào)整系數(shù)和對應(yīng)的增強(qiáng)特征參數(shù),并利用確定出的對應(yīng)的調(diào)整系數(shù)去調(diào)整該基頻曲線對應(yīng)的增強(qiáng)特征參數(shù),從而得到對該音節(jié)進(jìn)行聲調(diào)增強(qiáng)后的基頻曲線。所述調(diào)整系數(shù)還可以因人而異,從而可以針對每個(gè)人的需要對中文語音的聲調(diào)特征進(jìn)行增強(qiáng),提高其聽到的中文語音的清晰度。步驟106、根據(jù)調(diào)整后的基頻曲線合成每個(gè)音節(jié)。具體的,可以使用基于時(shí)域波形修改的語音合成算法——基頻同步疊加(PS0LA,Pitch Synchronous OverLap and Add)-來實(shí)現(xiàn)音節(jié)的合成。步驟107、輸出合成的每個(gè)音節(jié)。在本步驟中,為了保證感音性耳聾患者可以完整地理解連續(xù)的中文語音信號的含義,可以按照每個(gè)音節(jié)在待處理中文語音信號中的先后順序,依次輸出合成后的每個(gè)音節(jié)。較優(yōu)的,為了保證步驟107的順利執(zhí)行,在步驟102至步驟106中,可以按照每個(gè)音節(jié)在待處理中文語音信號中的先后順序,在對一個(gè)音節(jié)提取基頻曲線、確定聲調(diào)種類、確定調(diào)整方法,調(diào)整基頻曲線以及合成音節(jié)的操作完成后,繼續(xù)對另一個(gè)音節(jié)進(jìn)行相同的處理,即對待處理中文語音信號中的每個(gè)音節(jié)進(jìn)行串行處理。當(dāng)然,也可以將待處理中文語音信號中包含的至少兩個(gè)音節(jié)進(jìn)行并行處理。
本發(fā)明一實(shí)施例提供一種建立聲調(diào)增強(qiáng)模型的方法,具體的,如圖3所示,本實(shí)施例可以包括以下步驟步驟201、從語音數(shù)據(jù)庫中提取中文語音信號統(tǒng)計(jì)樣本。所述中文語音信號統(tǒng)計(jì)樣本可以是以音節(jié)對的形式保存的,一個(gè)音節(jié)對中包括針對同一個(gè)中文語音的聲調(diào)增強(qiáng)前的中文語音信號(以音節(jié)為單位)和聲調(diào)增強(qiáng)后的該中文
語音信號。步驟202、確定提取出的每個(gè)音節(jié)對的基頻曲線。本步驟包括,確定每個(gè)音節(jié)對中聲調(diào)增強(qiáng)前的中文語音信號的基頻曲線,以及確定聲調(diào)增強(qiáng)后的該中文語音信號的基頻曲線。步驟203、對聲調(diào)進(jìn)行分類,針對分類后的每個(gè)聲調(diào)種類,對屬于該聲調(diào)種類的每個(gè)音節(jié)對的基頻曲線進(jìn)行特征參數(shù)提取。針對所有音節(jié)對中聲調(diào)增強(qiáng)前的中文語音信號的基頻曲線,可以利用三次多項(xiàng)式擬合的方法獲得四個(gè)系數(shù),將此系數(shù)作為分類的特征參數(shù)對基頻曲線類型做聚類,得到至少一個(gè)基頻曲線類型,得到的每個(gè)基頻曲線類型可以視為對應(yīng)一個(gè)聲調(diào)種類。在對聲調(diào)進(jìn)行分類的同時(shí),也確定出了每個(gè)音節(jié)對的聲調(diào)種類,即確定出了每個(gè)聲調(diào)種類包括的音節(jié)對。針對每個(gè)聲調(diào)種類,為了后續(xù)確定與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù),在本步驟中,可以提取該聲調(diào)種類包括的每個(gè)音節(jié)對所對應(yīng)的基頻曲線的調(diào)型特征參數(shù),后續(xù)可以從提取出的調(diào)型特征參數(shù)中確定增強(qiáng)特征參數(shù)。所述調(diào)型特征參數(shù)可以選擇用于確定基頻曲線、能夠較好體現(xiàn)基頻曲線特征的特征參數(shù)。較優(yōu)的,所述調(diào)型特征參數(shù)可以從基頻曲線的均值、基頻曲線的范圍、基頻曲線的最小值、基頻曲線的最大值、基頻曲線的最大值位置、基頻曲線的最小值位置、基頻曲線的初始值、基頻曲線的結(jié)束值這八個(gè)特征參數(shù)中選擇。步驟204、統(tǒng)計(jì)確定出的每個(gè)音節(jié)對中存在差異的調(diào)型特征參數(shù)。具體的,可以通過數(shù)據(jù)驅(qū)動(dòng)的方式,利用統(tǒng)計(jì)方法分析比較屬于同一個(gè)聲調(diào)種類的每個(gè)音節(jié)對對應(yīng)的聲調(diào)增強(qiáng)前的基頻曲線與聲調(diào)增強(qiáng)后的基頻曲線,確定聲調(diào)增強(qiáng)前的基頻曲線與聲調(diào)增強(qiáng)后的基頻曲線中存在差異的調(diào)型特征參數(shù),從而確定該聲調(diào)種類對應(yīng)的各音節(jié)對中聲調(diào)增強(qiáng)前的基頻曲線與聲調(diào)增強(qiáng)后的基頻曲線的主要差別。步驟205、確定聲調(diào)增強(qiáng)模型中,與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)及該增強(qiáng)特征參數(shù)的調(diào)整系數(shù)。在本步驟中,針對每個(gè)聲調(diào)種類,可以根據(jù)屬于該聲調(diào)種類的每個(gè)音節(jié)對所對應(yīng)的存在差異的調(diào)型特征參數(shù)確定與該聲調(diào)種類對應(yīng)的聲調(diào)增強(qiáng)模型中的增強(qiáng)特征參數(shù),具體的,可以將屬于該聲調(diào)種類的每個(gè)音節(jié)對確定出的所有存在差異的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù),也可以將差異幅度超過設(shè)定值的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù),還可以將在所有存在差異的調(diào)型特征參數(shù)中差異幅度排名滿足要求的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)。在本步驟中,還可以根據(jù)屬于該聲調(diào)種類的每個(gè)音節(jié)對所對應(yīng)的存在差異的調(diào)型特征參數(shù)之間的差異幅度,來確定與該聲調(diào)種類對應(yīng)的基頻曲線的增強(qiáng)特征參數(shù)的調(diào)整系數(shù),具體的,針對確定出的每個(gè)增強(qiáng)特征參數(shù),可以通過對每個(gè)音節(jié)對確定出的該調(diào)型特征參數(shù)之間的差異幅度取平均的方法,來確定與該聲調(diào)種類對應(yīng)的基頻曲線中該增強(qiáng)特征參數(shù)的調(diào)整系數(shù)。在本實(shí)施例提供的方法中,針對確定出的每個(gè)聲調(diào)種類,確定與該聲調(diào)種類對應(yīng)的基頻曲線的調(diào)整方法,從而確定聲調(diào)增強(qiáng)模型。若利用該預(yù)先建立的聲調(diào)增強(qiáng)模型進(jìn)行聲調(diào)增強(qiáng),則確定出的每個(gè)待處理音節(jié)的聲調(diào)種類也必然是該聲調(diào)增強(qiáng)模型當(dāng)中的一個(gè)聲調(diào)種類。本發(fā)明另一實(shí)施例提供一種中文語音信號處理裝置,圖4為該裝置的結(jié)構(gòu)示意圖,該裝置包括一個(gè)切分模塊11、一個(gè)基頻提取模塊12、一個(gè)基頻曲線分類模塊13、一個(gè)確定模塊14、一個(gè)增強(qiáng)模塊15以及一個(gè)合成模塊16。其中,切分模塊11用于將接收到的待處理中文語音信號切分為以音節(jié)為單位的中文語音信號;基頻提取模塊12用于提取每個(gè)音節(jié)的基頻曲線;基頻曲線分類模塊13用于確定每個(gè)音節(jié)的聲調(diào)種類;確定模塊14用于根據(jù)預(yù)先建立的聲調(diào)增強(qiáng)模型,確定與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù)及所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù);增強(qiáng)模塊15用于根據(jù)每個(gè)音節(jié)的聲調(diào)種類、以及與所述聲調(diào)種類對應(yīng)的所述增強(qiáng)特征參數(shù)和所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù),對每個(gè)音節(jié)的基頻曲線進(jìn)行調(diào)整;合成模塊16用于根據(jù)調(diào)整后的基頻曲線合成音節(jié)。所述預(yù)先建立的聲調(diào)增強(qiáng)模型可以存放在中文語音信號處理裝置包括的聲調(diào)增強(qiáng)豐旲型庫10中。所述中文語音信號處理裝置還可以包括一個(gè)輸出模塊17,該輸出模塊17用于按照每個(gè)音節(jié)在待處理中文語音信號中的先后順序,依次輸出合成后的每個(gè)音節(jié)。具體的,基頻曲線分類模塊13用于對每條基頻曲線進(jìn)行三次多項(xiàng)式擬合,將三次多項(xiàng)式的四個(gè)系數(shù)作為分類特征,通過模式分類方法確定每個(gè)音節(jié)的聲調(diào)種類。如圖4所示,所述裝置還可以進(jìn)一步包括一個(gè)語音輸入模塊18(如麥克風(fēng))和一個(gè)A/D轉(zhuǎn)換模塊19。輸出模塊17可以包括一個(gè)D/A轉(zhuǎn)換子模塊和一個(gè)語音輸出子模塊(如揚(yáng)聲器)。所述合成模塊16中可以使用基于時(shí)域波形修改的語音合成算法——基頻同步疊加——來實(shí)現(xiàn)語音的合成。本發(fā)明的又一實(shí)施例還提供了一種助聽設(shè)備,該助聽設(shè)備包括上述任意一種中文語音信號處理裝置。由于該助聽設(shè)備包括了上面實(shí)施例提供的中文語音信號處理裝置,因此該助聽設(shè)備能夠通過調(diào)整后的基頻曲線修改語音波形,增強(qiáng)中文語音的聲調(diào)特征,并提高中文語音聲調(diào)的識別率。本發(fā)明實(shí)施例公開了一種中文語音信號處理方法、一種中文語音信號處理裝置、以及一種助聽設(shè)備,針對中文語音聲調(diào)具有辨別詞意的重要特性,根據(jù)聲調(diào)在聲學(xué)層面上的表現(xiàn)為基頻曲線的原理,將連續(xù)的中文語音信號流劃分為以音節(jié)為單位的中文語音信號,根據(jù)音節(jié)所屬的聲調(diào)種類,對音節(jié)的基頻曲線進(jìn)行調(diào)整。通過調(diào)整后的基頻曲線修改語音波形,增強(qiáng)中文語音的聲調(diào)特征,并提高中文語音聲調(diào)的識別率。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種中文語音信號處理方法,該方法包括 以音節(jié)為單位切分待處理中文語音信號; 提取每個(gè)音節(jié)的基頻曲線; 確定每個(gè)音節(jié)的聲調(diào)種類,以及根據(jù)預(yù)先建立的聲調(diào)增強(qiáng)模型,確定與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù)及所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù); 根據(jù)每個(gè)音節(jié)的聲調(diào)種類、以及與所述聲調(diào)種類對應(yīng)的增強(qiáng)特征參數(shù)和所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù),對該音節(jié)的基頻曲線進(jìn)行調(diào)整; 根據(jù)調(diào)整后的基頻曲線合成音節(jié)。
2.如權(quán)利要求1所述的方法,其特征在于,在合成音節(jié)之后,所述方法還包括 按照每個(gè)音節(jié)在待處理中文語音信號中的先后順序,依次輸出合成后的每個(gè)音節(jié)。
3.如權(quán)利要求1所述的方法,其特征在于,確定每個(gè)音節(jié)的聲調(diào)種類包括 對每個(gè)音節(jié)的基頻曲線進(jìn)行三次多項(xiàng)式擬合; 將三次多項(xiàng)式的四個(gè)系數(shù)作為分類特征,通過模式分類方法確定該音節(jié)的聲調(diào)種類。
4.如權(quán)利要求1所述的方法,其特征在于,通過以下方式建立聲調(diào)增強(qiáng)模型 針對每個(gè)聲調(diào)種類,確定統(tǒng)計(jì)樣本中與該聲調(diào)種類對應(yīng)的音節(jié)對,其中每個(gè)音節(jié)對包括一個(gè)聲調(diào)增強(qiáng)前音節(jié)和一個(gè)聲調(diào)增強(qiáng)后音節(jié); 確定音節(jié)對中聲調(diào)增強(qiáng)前音節(jié)的基頻曲線的調(diào)型特征參數(shù)與聲調(diào)增強(qiáng)后音節(jié)的基頻曲線的調(diào)型特征參數(shù)之中存在差異的調(diào)型特征參數(shù); 將所述存在差異的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù),并根據(jù)所述差異的幅度,確定所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù)。
5.如權(quán)利要求4所述的方法,其特征在于,所述調(diào)型特征參數(shù)為基頻曲線的均值、基頻曲線的范圍、基頻曲線的最小值、基頻曲線的最大值、基頻曲線的最大值位置、基頻曲線的最小值位置、基頻曲線的初始值以及基頻曲線的結(jié)束值這八個(gè)基頻曲線特征參數(shù)中的至少一個(gè)。
6.如權(quán)利要求4所述的方法,其特征在于,確定增強(qiáng)特征參數(shù)包括 將全部所述存在差異的調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù); 或者,將所述差異幅度超過一設(shè)定值的所述調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù); 或者,將所述調(diào)型特征參數(shù)按差異幅度從大到小排序后的一個(gè)或復(fù)數(shù)個(gè)調(diào)型特征參數(shù)確定為與該聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù)。
7.一種中文語音信號處理裝置,該裝置包括 一個(gè)切分模塊,用于以音節(jié)為單位切分待處理中文語音信號; 一個(gè)基頻提取模塊,用于提取每個(gè)音節(jié)的基頻曲線; 一個(gè)基頻曲線分類模塊,用于確定每個(gè)音節(jié)的聲調(diào)種類; 一個(gè)確定模塊,用于根據(jù)預(yù)先建立的聲調(diào)增強(qiáng)模型,確定與每個(gè)聲調(diào)種類對應(yīng)的基頻曲線增強(qiáng)特征參數(shù)及所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù); 一個(gè)增強(qiáng)模塊,用于根據(jù)每個(gè)音節(jié)的聲調(diào)種類、以及與所述聲調(diào)種類對應(yīng)的所述增強(qiáng)特征參數(shù)和所述增強(qiáng)特征參數(shù)的調(diào)整系數(shù),對每個(gè)音節(jié)的基頻曲線進(jìn)行調(diào)整;合成模塊,用于根據(jù)調(diào)整后的基頻曲線合成音節(jié)。
8.如權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括 一個(gè)輸出模塊,用于按照每個(gè)音節(jié)在待處理中文語音信號中的先后順序,依次輸出合成后的每個(gè)音節(jié)。
9.如權(quán)利要求7所述的裝置,其特征在于,所述基頻曲線分類模塊能夠?qū)γ總€(gè)音節(jié)的基頻曲線進(jìn)行三次多項(xiàng)式擬合,將三次多項(xiàng)式的四個(gè)系數(shù)作為分類特征,通過模式分類方法確定該音節(jié)的聲調(diào)種類。
10.一種助聽設(shè)備,包括如權(quán)利要求7至9中任一項(xiàng)所述的中文語音信號處理裝置。
全文摘要
本發(fā)明公開了一種中文語音信號處理方法、一種中文語音信號處理裝置、以及一種助聽設(shè)備,針對中文語音聲調(diào)具有辨別詞意的重要特性,根據(jù)聲調(diào)在聲學(xué)層面上的表現(xiàn)為基頻曲線的原理,將連續(xù)的中文語音信號流劃分為以音節(jié)為單位的中文語音信號,根據(jù)音節(jié)所屬的聲調(diào)種類,對音節(jié)的基頻曲線進(jìn)行調(diào)整。通過調(diào)整后的基頻曲線修改語音波形,增強(qiáng)中文語音的聲調(diào)特征,并提高中文語音聲調(diào)的識別率。
文檔編號G10L15/00GK103035252SQ20111030186
公開日2013年4月10日 申請日期2011年9月30日 優(yōu)先權(quán)日2011年9月30日
發(fā)明者楊晨, 周衛(wèi), 蔡蓮紅 申請人:西門子公司