改善增強語聲的濾波器，用該濾波器的裝置、系統(tǒng)和方法

文檔序號：2819911閱讀：227來源：國知局

專利名稱：改善增強語聲的濾波器，用該濾波器的裝置、系統(tǒng)和方法
技術領域：
本發(fā)明一般涉及一種利用具有比輸入的語聲信號的信息量要少的信息量的信息碼來傳輸或存儲語聲信息的系統(tǒng)和方法。確切地說，本發(fā)明涉及一種用于從輸入的語聲信號中提取代表語聲特征的各種特征數據，傳輸或存儲該提取的數據，以及根據該傳輸和存儲的特征數據合成出原來的語聲信號。更具體地說，本發(fā)明涉及一種用于按聲學要求抑制在經合成的語聲信號中產生量化噪聲的語聲改善(用)濾波器。進而，本發(fā)明涉及一種用于提高信號質量(例如語聲清晰度)的系統(tǒng)、方法和濾波器。更確切地說，本發(fā)明涉及一種語聲增強器，其適用于改進由于模擬傳輸產生畸變的信號或由助聽裝置接收的信號的語聲清晰度，以及適用于改進由揚聲器輸出廣播節(jié)目的語聲響亮度。
在圖28中以舉例方式表示了一種語聲分析/合成系統(tǒng)的結構。在這一示意圖中的系統(tǒng)包含一分析單元100和合成單元200。分析單元100包括分析器101和編碼器102，而合成單元200包括解碼器201和合成器202。在某些應用場合，單元100和200彼此經過通訊通道連接，一個單元通常與另一個是遠離的。在另外一些應用場合，單元100經過存儲媒體向單元200傳輸信息，其中兩個單元可以構成一個裝置或兩個分開的裝置，分析器101從使用者提供的輸入語聲信號中提取包括代表輸入的語聲信號特征的頻譜信息的特征數據組。由編碼器102對提取的特征數據組進行編碼，然后經過通訊通道或存儲媒體提供到合成單元200，在其中由解碼器201對經編碼的特征數據組進行解碼。合成器202用以根據經此解碼的特征數據組來合成語聲信號。具有這種結構的系統(tǒng)的一個優(yōu)點是傳輸或存儲的信號的信息量較低。這是由于傳輸或存儲的信號即經編碼的特征數據組與輸入的語聲信號相比包含的信息量較少。
在圖29中表示了合成單元200的一種演變的方案。這種方案還包含一后置濾波器203，其用以根據經解碼的特征數據組，對由合成器202產生的信號(下文稱為合成的語聲信號)進行預定的改善處理，因此產生改善的語聲信號(下文稱為改善的合成語聲信號)。后置濾波器203在某些應用場合下，用于按聲學要求抑制在合成的語聲信號中包含的量化噪聲，但在另外一些情況下，用于改進語聲的質量例如語聲的清晰度。在如下介紹中，這種類型的后置濾波器將被稱為語聲改善濾波器或語聲增強濾波器。裝有這種濾波器203的合成單元200適于在聲音編碼/解碼系統(tǒng)或聲音記錄和響應系統(tǒng)中使用。
各種各樣的濾波器可用作該濾波器203。綜上所述，一種增強主頻特征的類型的濾波器的優(yōu)點是相當有效地抑制噪聲和改進語聲的質量。公開這種濾波器的已有技術可供參考的例如公開號為Sho64-13200的日本專利公開文件(下文稱為參考文件1)；公開號為Hei5-500573的日本專利公開文件(下文稱為參考文件2)；公開號為Hei2-82710的日本專利公開文件(下文稱為參考文件3)；以及日本聲學會的春季會議上的會刊第1卷第257-258頁(1994.3)＂根據適用于帶噪聲通道的嘜—倒頻譜分析的語聲編碼系統(tǒng)(下文稱為參考文件4)。
在參考文件1和2中所述的濾波器用作在合成單元200中的語聲改善濾波器203，其由分析單元100接收作為上述編碼的特征數據組的線性預測碼(LPCs)。在參考文件3中所述的濾波器用作在合成單元200中的語聲改善濾波器203，其由分析單元100接收自相關系數作為上述特征數據組。最后在參考文獻4中所述的濾波器用作在合成單元200中的語聲改善濾波器203，其由分析單元100接收嘜—標度倒頻譜式嘜—倒頻譜作為上述特征數據組。
圖29表示在參考文件1中公開的濾波器的示意結構。這種濾波器203除了接收由合成器202提供的合成語聲信號以外，由解碼器201接收解碼的LPC。LPC在這里是指利用由圖28中表示的分析器101進行線性預測編碼所得到的α特征數據。線性預測編碼是一種用于根據輸入語聲信號波形的采樣值以及根據線性預測方法確定例如為模擬人的發(fā)聲器官的8到12階的濾波器的α特征數據式濾波器系數的方法。
圖30中所示的濾波器203包括濾波器204和濾波器205，濾波器204用于對合成的語聲信號進行濾波，以便產生半一改善的合成語聲信號，濾波器205用于對該半一改善的合成語聲信號進行濾波，以便產生改善的合成語聲信號，濾波器204和205 兩者都利用各α特征數據作為它們的濾波器系數。應當注意，在濾波器204中所用的α特征數據不是由解碼器201提供的α特征數據αi(其中i＝1、2…p；p是一預定的階)，但α1i＝αi/υ-i，是利用改善的系數υ通過對α特征數據αi進行改善得到的。按照相同的方式，用在濾波器205中的α特征數據是α2i＝αi/η-1，是利用改善的系數η通過改善α特征數據αi得到的。利用改善的系數υ和η對α特征數據αi的改善處理是分別由LPC改善部分206和207執(zhí)行的。
下面假設濾波器204和205分別實現(xiàn)傳遞函數H(Z)的分子和分母的功能，用以將合成的語聲信號轉變?yōu)楦纳频暮铣烧Z聲信號。換句話說，令濾波器204和205分別為LPC濾波器和反一LPC濾波器。進而，利用α特征數據α1作為濾波器系數基本按照下式進行濾波A(Z)=Σi=0p(αiZ-i)---(1)]]>其中z是一變換算子z。如上所述，由于在濾波器204和205中使用的濾波器系數分別是α1i＝αi/υ-i和α2i＝αi/η-i，濾波器204和205的傳遞函數分別用1/A(z/υ)和A(z/η)的形式來表示。因而，用于將合成的語聲信號變?yōu)楦纳频暮铣烧Z聲信號的傳遞函數可以表達如下
H(z)＝A(z/η)/A(z/υ)…(2)圖31示意表示在參考文件(2)中公開的濾波器的結構。在這種濾波器203中，在LPC改善部分206中產生的α1i利用LPC/ACC變換部分208由LPC域變換為自相關域，以及利用ACC改善部分209在自相關域內部進行帶寬擴展，以及根據Levinson遞推(式)利用ACC/LPC變換部分210進行由自相關域向LPC域的變換。濾波器205接收以這種方式得到的α2i。雖然，在這個示意圖中除去了在圖30中表示的LPC改善部分207，該參考文件2還建議一種包括LPC改善部分207的結構，該部分207的輸出α2i由LPC/ACC變換部分208、ACC改善部分209和ACC/LPC變換部分210再次進行改善。
圖32表示在參考文件3中公開的濾波器的示意結構。這種濾波器203是這樣構成的，即除了參考文件1所述的結構以外，還有ACC/LPC變換部分211和212。ACC/LPC變換部分211接收作為在解碼的特征數據組中包括的頻譜信息的自相關常數，并且然后將接收的自相關常數由自相關域轉變?yōu)長PC域。ACC/LPC變換部分212接收的是由ACC/LPC變換部分211接收的自相關常數中的m階(m＜p)或小于m的階的部分，然后將接收的自相關常數由自相關域變換為LPC域。LPC改善部分206和207分別以與參考文件1相同的方式對由ACC/LPC變換部分211和212產生的α特征數據進行改善。應該認識到在這種結構中作為輸入提供的自相關常數可以是已由解碼器201解碼的一類(即由分析器101通過計算和由編碼器102通過編碼得到的自相關常數)，或者可以是由解碼器201或合成器202根據不同類型的在解碼器201中解碼的頻譜參數已經計算的一類。
圖33到35表示在參考文件1到3中公開的語聲改善(或增強)濾波器的對數功率與頻譜特性曲線關系圖。在這些示意圖中，A到D分別表示合成器202的特性、濾波器204的特性、濾波器205的反變換特性以及傳遞函數H(z)。例如在圖30和33中，A代表1/A(z)；B代表1/A(z/υ)；C代表1/A(z/η)；以及D代表H(z)＝A(z/η)/A(z/υ)。從與參考文件1相關的表達式(2)以及從與參考文件1到3相關的圖33到35可以明顯看出，濾波器204的功能是作為一個增強合成語聲信號的頻譜主頻的以及抑制該頻譜的谷值的濾波器，而濾波器205是一個消除由濾波器204引起的頻譜變化率的濾波器?？梢钥闯?，利用濾波器204增強或抑制的程度當υ變大時相應增加，當υ變小時將隨之隨低。在參考文件1中假設η和υ滿足0≤η≤υ＜1。圖33表示υ＝0.8，η＝0.5的一個實例，圖34表示利用經過一個υ＝0.8的1200赫的滯后窗口的帶寬擴展處理的實例；圖35是p＝10，m＝4，υ＝0.95，η＝0.95的一個實例。
由在圖33和34之間進行比較，或在圖33和35之間進行比較可以清楚地看出在參考文件2和3中的語聲改善(或增強)濾波器與在參考文件1中公開的濾波器相比較，利用濾波器205將能夠提高消除頻譜變化率的效果。即在參考文件1中公開的技術將不能使濾波器205完全消除由濾波器204引起的頻譜變化率。此外由于隨著時間的推移，頻譜變化率變化，對于固定的高頻頻譜增強處理將難于消除頻譜變化率，從而導致(響)亮度隨時間變化。相反地，在對比文件2和3中公開的技術將使得能提高頻譜峰谷結構的增強效果和使頻譜變化率更平緩。這將使得能防止由濾波器203造成的(響)亮度及逼真度的惡化。
應當認識到，一方面在參考文件2和3中公開的技術對在參考文件1中公開的技術進行了改進優(yōu)于后者，但在另一方面則不如。例如，雖然可能取決于分析單元100的結構或取決于系統(tǒng)遵循的模式，在參考文件2中公開的技術存在的缺欠是所形成的改善的合成語聲信號經常包含特有的畸變。這是由于在自相關域內進行極強的頻譜平滑濾波處理導致頻譜在接近很強的主(振)頻處產生明顯的畸變所引起的。這可能導致改善的合成語聲信號在質量上劣于在參考文件1中公開的技術。在參考文件3中公開的技術的情況下，由于降低了在自相關域中的濾波器的階次，經常會帶來不便，即主頻的位置移動很大的程度，或者多個主頻集中合并為一個。這樣一種不穩(wěn)定的頻譜變化將引起改善的合成語聲信號的失真。例如通過在圖35中所表示的特性曲線B和C之間進行比較，能夠看出這樣一種現(xiàn)象，即在B中具有各主頻中的最低頻率的的主頻移動到在C中的一個較低的頻率，以及引起在中部產生兩個主頻合并在一起的現(xiàn)象。此外，由于這種原因隨時間變化可能產生或者可能不產生明顯的主頻位移，從而導致所形成的改善的合成語聲逼真方面是波動的。
參考文件1到3中公開的技術還包含的一個共同的問題是使設計具有低的自由度(在特性曲線的運算和控制方面的自由度)。例如在參考文件1中公開的技術的情況下，將難于在某一范圍內只通過改變υ和η而很大程度改變?yōu)V波器203的特性，在這一范圍內頻譜變化率和它隨時間的變化的問題不會很明顯。在參考文件2中公開的技術的情況下，假如對υ和滯后窗口頻率設置較大的可變范圍，以便提高濾波器204的主頻增強效果，那么上述畸變，即由于在自相關域內部的頻譜平滑處理產生的畸變將變得更明顯。因此，υ和滯后窗口頻率的可變范圍必須限制，以使濾波器203的特性不可能產生很大的變化。在參考文件3中公開的技術的情況下，由于采用濾波器階次作為它的控制變量(是一個限定的整數值)，特性變化的自由度自然被降低。
圖36示意表示在參考文件4中公開的語聲改善(或增強)濾波器203的結構。在這個圖中的濾波器203與上述已有技術有很大的不同，在于其接收嘜一標定的倒頻譜作為由解碼器201解碼的特征數據組中包括的頻譜信息，以及在于通過對改善輸入的嘜一標定的倒頻譜得到的改善的嘜一標定的倒頻譜進行濾波將合成的語聲信號變換為改善的合成語聲信號，用作為它的濾波器系數。即由濾波器213對合成的語聲信號濾波，將由嘜一標定的倒頻譜改善部分214產生的改善的嘜一標定的倒頻譜用作為它的濾波器系數。更確切地說，嘜一標定的倒頻譜改善部分214用0替換輸入的嘜一標定的倒頻譜中的一階分量，以及將其余的分量乘以β，因此產生改進的嘜一標定的倒頻譜。濾波器213利用這種改進的嘜一標定的倒頻譜作為它的濾波器系數，以便對合成的語聲信號濾波，并且提供所得到的信號作為它的以改善的合成語聲信號形式的輸出。順便提一下，濾波器213被稱為一個嘜一標定的對數式的頻譜模擬(MLSA)濾波器，這是由于其采用改善的嘜一標定的倒頻譜作為它的濾波器系數。
術語嘜一標定的倒頻譜用在這里是指由分析器101通過對輸入語聲信號的對數頻譜的正交變換計算的特征數據。對于參考文件1至3中的技術通常不可能被利用，因此其處于一個在其中語聲信息被變換為用于傳輸或存儲的嘜一標定的倒頻譜的系統(tǒng)。即倒頻譜特征數據例如嘜一標定的倒頻譜向LPC域的變換將引起頻譜的幾何分布的畸變，這將需要通過對合成的語聲信號的重新分析對LPC計算。此外，即使經此計算的LPC包含相對于通過對于原有的語聲進行分析得到的LPC的畸變，也將不能保證這種良好的語聲改善特性。相反，參考文件4中的方法能夠避免這些畸變的產生。
反過來這意味著在參考文件4中公開的技術將面臨連貫性不佳的問題，換句話說，不可能應用于設計用來通過利用與倒頻譜特征數據不同的特征數據組來合成語聲信號的系統(tǒng)上。典型的這類系統(tǒng)例如是利用諸如LPC、LSP(成對的線性頻譜)以及PARCOR(局部自相關系數)的特征數據組的各種系統(tǒng)。由于LPC、LSP和PARCOR被經常用于語聲編碼/解碼，使這一問題很嚴重。假如將利用嘜一標定的倒頻譜作為其濾波器常數的語聲改善濾波器裝入接收LPS(作為其中一種特征數據)的合成單元200，那么如上所述，頻譜的幾何分布將由于從LPC域向嘜一標定的倒頻譜域的轉變而畸變。自然這種畸變通過對合成的語聲信號重新分析再次計算嘜一標定的倒頻譜能夠被削弱到某種程度。盡管按照這種方式已經對嘜一標定的倒頻譜進行了計算，然而，與由原有語聲產生的嘜一標定的倒頻譜相比較，其依然包含較多的畸變。因此并不具有預期的良好的語聲改善特性。
本發(fā)明的第一個目的是提供一種語聲改善(或增強，在下文將省略)濾波器，其能在可允許的頻譜變化率的范圍內具有良好的主頻增強效果。本發(fā)明的第二個目的是提供一種語聲改善濾波器，其能在不會在主頻結構中引起明顯畸變程度的前提下保證良好的主頻增強效果。本發(fā)明的第三個目的是提供一種語聲改善濾波器，其能利用比現(xiàn)有技術的數量要少的結構裝置，實現(xiàn)與現(xiàn)有技術相同的主頻增強效果。本發(fā)明的第四個目的是提供一種語聲改善濾波器，其能選擇性地進行控制(響)亮度、減少處理程序步驟、改進清晰度等等。本發(fā)明的第五個方面是提供一種具有高度設計自由度的語聲改善濾波器，能在與輸入的頻譜信號所屬的域具有不同屬性的域內不再需要驗證穩(wěn)定性。本發(fā)明的第六個目的是提供一種語聲改善濾波器，其適用于由分析單元接收作為頻譜信息的LSP、PARCOR、LAR(對數面積比)的合成單元。本發(fā)明的第七個目的提供一種語聲改善濾波器，其能根據作為頻譜信息輸入的LSP、PARCOR、LAR等等在不需要任何頻譜重新分析或特征數據變換的情況下保證具有良好的連貫性。本發(fā)明的第八個目的是通過利用能夠實現(xiàn)上述第一到第七個目的的語聲改善濾波器來實現(xiàn)一語聲合成系統(tǒng)。
根據本發(fā)明的第一個方面，合成的語聲信號經過具有由濾波器系數限定的傳遞函數的濾波器進行濾波，以便產生改善的合成語聲信號。這種濾波器常數的產生是根據以多維矢量的形式代表的以及屬于一預定的域和與輸入的語聲信號有關的頻譜信息，并按照這樣一種方式即根據上述頻譜信息和與合成語聲信號的頻譜信息相比較，使改善的合成語聲信號的主頻特性被增強而產生的。可利用作為頻譜信息的是LSP信息、PARCOR信息和LAR信息中的任何一種。由于LSP信息、PARCOR信息和LAR信息具有特定的特征，用于產生濾波器系數的運算可以按這樣一種屬性的運算，即與各維相關的計算與其余各維相關的計算無關的方式來進行。當利用LSP、PARCOR或LAR信息來產生濾波器系數時，無須將它們由LSP、PARCOR或LAR域變換到另一個域就能保證濾波器穩(wěn)定性。應注意，例如在利用由LPC信息產生的濾波器系數的濾波器中，需要將濾波器系數由LPC域轉變?yōu)榱硪粋€域，以便保證濾波器的穩(wěn)定性。因而，根據本發(fā)明的第一個方面，與利用由LPC信息產生的濾波器系數的現(xiàn)有技術相比，本發(fā)明的濾波器不會造成不穩(wěn)定，因而更易于設計語聲改善處理或濾波器。此外，將這一方面應用到傳輸或存儲LSP信息、PARCOR信息或LAR信息的系統(tǒng)將不需要任何頻譜重新分析和特征數據變換，因此可以保證良好的連貫性。
在LPC域、LSP域和PARCOR域的其中任一個域內可以進行本發(fā)明中的濾波。換句話說，本發(fā)明中的濾波器系數可以屬于LPC域、LSP域和PARCOR域中的任何一種。根據本發(fā)明的第二方面，頻譜信息首先在其所屬的一個域內進行改善，以便產生改善的頻譜信息，然后將改善的頻譜信息由該域變換到LPC域，以便產生濾波器系數，將因此得到濾波器系數用于在LPC域進行濾波。由于各種各樣的改善系數可以應用于這種改善，本發(fā)明的這一方面，可以使得根據使用者要求的濾波特性(合成的語聲信號改善特性)能夠更自由地調制濾波器系數的綜合。
根據本發(fā)明的第三個方面，對頻譜信息進行改善，使之能夠降低改善的合成語聲信號的主頻的各峰值。因此將使得能夠在允許的頻譜變化率的范圍內得到良好的主頻增強的效果以及在主頻結構中不會引起任何明顯程度的畸變的情況下得到良好的主頻增強效果。
可認為是用于改善的第一方法是這樣一種方法，其中與輸入語聲信號有關的頻譜信息和屬于同一域的參考信息根據改善的系數被按比例地分割。當頻譜信息是LSP信息時，這種方法是可利用的。取決于設定參考信息的各種方法，這一方法將使得能夠進行如下的改善，例如用于將固定的頻譜變化率賦予到改善的合成語聲信號上的改善；用于將反映平均噪聲頻譜的頻譜變化率賦予到改善的合成語聲信號上的改善(即用于輕微增強不同于噪聲頻譜的語聲頻譜的改善)；用于將改善的合成語聲信號賦予到反映迄今頻譜信息已經跟蹤的經歷的頻譜變化率上的改善(即用于增強在語聲頻譜的變化量的改善)。這將使得能夠有效地控制響亮度、降低信息處理步驟以及改進清晰度。這種方法還使得本發(fā)明的濾波器能夠進一步提供其它輔助性的濾波處理的特性(例如固定的高頻增強處理)。
可以認為是用于改善的第二方法是這樣一種方法，其中對于與輸入語聲信號相關的多維構成的頻譜信息中的每一個，利用改善的系數或利用改善的系數的乘方與頻譜信號相乘。這種方法當頻譜信息是PARCOR信息或LAR信息時是可使用的。這種方法還能保證上面列舉的某些效果，例如減少處理，改進清晰度等。應當理解，當頻譜信息是PARCOR信息時，本方法的采用為用改善的系數的乘方乘以頻譜信息，而所述乘方取決于頻譜信息的維數。
可認作為用于改善的第三方法是這樣一種方法，其中在代表與輸入的語聲信號相關的頻譜信息的多維之中相鄰的維之間的距離被擴展。更確切地說，當相鄰維之間的距離小于一參考距離時，該距離被擴展到參考距離之外，并且在此之后，所述距離相對于所有的各維均衡地收縮，以便保證頻譜信息就其整體上的范圍變得與擴展以前的范圍一致。當頻譜信息是LSP信息時，這種方法是可使用的。這種方法能夠改善頻譜信息，使得改善的合成語聲信號的頻譜變平，并且能保證上面列舉的某些效果，例如在平滑頻譜變化率中減少處理步驟和改進清晰度。此外，還可實現(xiàn)相對第一和第二方法減少處理步驟或部件。
還可看出，第一和第三改善方法可以彼此結合。在這種情況下，第一方法和第三方法可以選擇性使用，或交替使用，兩者可以結合使用。關于每種方法相對其它兩種方法的優(yōu)點以及三種方法之間的差別，對于本技術領域的熟練人員通過下面對各實施例的介紹將會是易于明了的。
第一到第三改善方法可以概括如下首先形成一轉換表，其存儲關于與改善的頻譜信息相關的輸入的語聲信號的頻譜信息并且響應對頻譜信息的提供產生改善的頻譜信息；其次形成一中間網絡，其利用記憶具有將頻譜信息變換為改善的頻譜信息的能力，以便通過關于輸入的語聲信號的頻譜信息，能夠產生改善的頻譜信息。最好為若干彼此不相重疊以及通過對關于輸入語聲信號的頻譜信息所屬的域進行分類得到的范疇的其中之一提供該轉換表和中間網絡，或者通過轉換用于每一范疇的系數來轉換它們的作用的同時，將它們加以利用。這將使得通過范疇劃分能夠提供自適應的控制和降低在范疇邊界處的畸變。對每一個范疇還可以利用與第一到第三方法不同的改善方法。
根據本發(fā)明的第四個方面，在LSP域和PARCOR域的其中之一內部進行濾波，在這樣一個域內部改善關于輸入的語聲信號的頻譜信息，這個域是該頻譜信息所屬的域，并且將形成的改善的頻譜信息用作濾波器系數。這個方面將不再需要對與改善的頻譜信息相關的域進行轉換，從而使得能夠利用較現(xiàn)有技術數量較少的構成元件得到基本上與現(xiàn)有技術相同的主頻增強效果。
根據本發(fā)明的第五個方面，與合成的語聲信號的主頻相比，所進行的濾波使改善的合成語聲信號的主頻進一步增強。根據本發(fā)明的第六個方面，在第五個方面中，賦予到改善的合成語聲信號的頻譜變化率被抑制。
根據本發(fā)明的第七個方面，根據按多維矢量表示的和屬于一預定域以及與輸入的語聲信號相關的頻譜信息產生合成的語聲信號，并且在此之后，根據該頻譜信息進行包含上述各方面的處理。根據本發(fā)明的第八個方面，根據按照多維矢量表示的和屬于一預定域的以及與輸入的語聲信號相關的第一頻譜信息產生合成的語聲信號，以及將第一頻譜信息變換為屬于一與迄今第一頻譜信息所屬域不同的一個域，然后，根據第二頻譜信息進行包含上述各方面的處理。根據本發(fā)明的第九個方面，根據與輸入的語聲信號相關的和屬于一預定域的以及由多維矢量代表的第一頻譜信息產生合成的語聲信號，以及分析合成的語聲信號，以便產生第二頻譜信息，然后根據第二頻譜信息進行包含上述各方面的處理。根據本發(fā)明的第十個方面，在進行包含第七到第九個方面的處理之前，將通過分析輸入的語聲信號產生頻譜信息或第一頻譜信息，以及將該頻譜信息或第一頻譜信息存儲或傳輸。

圖1和圖2是方塊圖，表示根據在本發(fā)明的各優(yōu)選實施例中的根據LSP的實施例的語聲改善濾波器的結構；圖3是一通過舉例的方式表示語聲分析/合成系統(tǒng)結構的方塊圖；圖4是表示LSP改善法的一實例的方塊圖；圖5是通過比例分割產生改善的LSP的方法的解釋性示意圖；圖6和圖7是表示LSP改善法的實例的方塊圖；圖8是表示在本發(fā)明的各優(yōu)選實施例中間的基于LSP實施例的對數功率與頻譜特性曲線關系圖，這些特性曲線是在采用在圖1所示結構中通過比例分割產生改善的LSP的方法的情況下得到的；圖9是表示LSP改善法的實例的方塊圖；圖10是表示在本發(fā)明的優(yōu)選實施例中間的根據LSP的實施例的對數功率與頻譜特性曲線關系圖，這些特性曲線是利用在圖2所示結構中通過擴展在相鄰維之間的距離產生改善的LSP的方法的情況下得到的；圖11、12、13、14、15和16是方塊圖，表示LSP改善法的一個實例；圖17和18是方塊圖，表示在本發(fā)明的各優(yōu)選實施例中根據在LSP域內進行濾波的一個實施例的語聲改善濾波器的結構；圖19是方塊圖，表示在本發(fā)明的各優(yōu)選實施例中間根據一基于PARCOR的實施例的語聲改善濾波器的結構；圖20是曲線圖，表示在本發(fā)明的各優(yōu)選實施例中的基于PARCOR實施例的對數功率與頻譜特性曲線的關系；圖21和22是方塊圖，表示在本發(fā)明的各優(yōu)選實施例中的根據在PARCOR域內進行濾波的一個實施例的語聲改善濾波器的結構；圖23是一方塊圖，表示在本發(fā)明的各優(yōu)選實施例中的根據一基于LAR的實施例的語聲改善濾波器的結構；圖24是一曲線圖，表示在本發(fā)明的各優(yōu)選實施例中的基于LAR的實施例的對數功率與頻率特性曲線的關系；圖25和26是方塊圖，表示在本發(fā)明的各優(yōu)選實施例中的根據在LAR域或PARCOR域內進行濾波的實施例的語聲改善濾波器的結構；圖27是方塊圖，表示在本發(fā)明的各優(yōu)選實施例中的根據利用多個特征數據的實施例的語聲改善濾波器的結構。
圖28是方塊圖，通過舉例的方式表示一語聲分析/合成系統(tǒng)的結構；圖29是方塊圖，表示語聲改善濾波器的使用方式；圖30、31和32是方塊示意圖，分別表示在參考文件1、2和3中公開的語聲改善濾波器的結構；圖33、34和35是曲線圖，分別表示在參考文件1、2和3中公開的語聲改善濾波器的對數功率與頻譜特性曲線的關系；圖36是方塊圖，表示在參考文件4中公開的語聲改善濾波器的結構。
下面參照附圖介紹本發(fā)明的各實施例，其中與在圖28到36中表示的現(xiàn)有技術相同和相應的構成元件使用相同的參考數碼來標注，并且不再進一步解釋。應指出，對于各個實施例為共同的構成元件也用相同的參考數碼標注，并將不再重復解釋。a)基于LSP的實施例首先參閱圖1和圖2，其中表示在根據本發(fā)明的濾波器203的各優(yōu)選實施例中的接收LSP作為在經解碼的特征數據組中的頻譜信息的兩個實施例。在圖1中所示的實施例包含LSP改善部分216和217以及LSP/LPC變換部分218和219，還有濾波器204和205。另外在圖2中所示的實施例除了濾波器204以外還包含LSP改善部分216和LSP/LPC變換部分218。
這些實施例可以用在圖30或3中所示的結構的合成單元200中。在利用解碼器201能夠輸出作為特征數據組的一個成分的情況下，如圖29所示，濾波器203可以直接接收來自解碼器201的輸出，而在利用不能輸出作為特征數據組的一個成分的解碼器201的情況下，來自解碼器201的輸出必須通過變換部分215變換到LSP域，然后提供到濾波器203，如圖3所示。應當認識到變換部分215可以合并到解碼器201或合成器202中。
LSP改善部分216和217由解碼器201或變換部分215接收以多維矢量形式的LSPωi，并且按照預定的方法改善ωi，以便分別產生改善的LSPωh1i和ωh2i。LSP/LPC變換部分218和219將ωh1i和ωh2i分別由LSP域變換為LPC域，以便產生改善的α特征數據α1i和α2i。濾波器204和205順次地分別利用α1i和α2i作為它們各自的濾波器系數對合成的語聲信號進行濾波。因此，濾波器205提供改善的合成語聲信號作為它的輸出。下面令濾波器204和205的傳遞函數分別為1/A1(z)和A2(z)，然后可以給出圖1中的濾波器203的傳遞函數如下H(z)＝A2(z)/A1(z) …(3)以及可以給出圖2中的濾波器203的傳遞函數如下H(z)＝1/A1(z) …(4)在本發(fā)明的基于LSP的實施例中，按照這種方式，作為其中一個特征數據接收的LSPωi被改善以及將改善的LSPωh1i(和ωh2i)由LSP域變換為LPC域，因此產生作為改善的α特征數據的濾波器系數α1i(和α2i)。因此得到的基于LSP的實施例的第一個優(yōu)點是由于在LSP域內可以檢查穩(wěn)定性，因此易于驗證和保證濾波器203是穩(wěn)定的。更確切地說，眾所周知，當LSPωi滿足如下一系列的條件時利用LSPωi的濾波器是穩(wěn)定的；該條件是0＜ω1＜ω2＜…＜ωp＜π …(5)因此，只要采用滿足方程(5)的LSP作為濾波器系數，對于相應的i可以獨立地進行用于產生α1i和α2i的處理，不會使濾波器產生不穩(wěn)定，因此，實現(xiàn)了濾波器設計的高度的自由度。例如，通過對于高階的維的增強程度設定到相對大的數值，就可以實現(xiàn)一個能夠增強語聲高頻分量的濾波器。相反，在利用α特征數據或自相關常數以便產生濾波器系數的情況下，由于利用根據這樣一些特征數據的濾波器系數將難于驗證和保證濾波器的穩(wěn)定性，只有驗證不會使濾波器產生不穩(wěn)定的情況下才能利用該處理來產生α1i和α2i。因而，當采用基于α特征數據的或基于自相關的濾波器系數時，在不會使濾波器產生不穩(wěn)定的情況下，可以不進行對于相應的i或通過調節(jié)沿頻率軸的增強程度而進行的改善處理。
基于LSP的實施例的第二個優(yōu)點是對于傳輸或存儲作為頻譜信息的LSP的系統(tǒng)有較高的適用性。特別是近年來已經開發(fā)的大多數語聲編碼/解碼系統(tǒng)都力圖利用LSP作為頻譜信息。本發(fā)明的根據LSP的實施例易于應用到這些類型的語聲編碼/解碼系統(tǒng)。即由于不需要重新分析頻譜和對特征數據變換，對于這些類型的系統(tǒng)能夠得到良好的連貫性，這與在參考文件4中公開的現(xiàn)有技術即根據輸入的嘜一標定的倒頻譜確定濾波器系數是不相同的。
從上面的介紹可以明顯看出，在本發(fā)明的基于LSP的實施例中的濾波器203的傳遞函數H(z)降取決于為了得到濾波器系數α1i和α2i進行的LSP改善操作和LSP/LPC變換操作的方式。對于LSP改善操作的一種優(yōu)選方法首先是進行比例分割改善和其次是進行相鄰的維對維的距離擴展。
比例分割改善方法首先是這樣一種方法，即其中利用改善的系數υ，η(滿足0≤υ≤η＜1)作為比例分割比率，對ωi進行按比例的分割。當按圖1中的結構執(zhí)行這種方法時，LSP改善部分216和217每個具有包括如在圖4中所示的比例分割操作部分220和變化率設定部分221。根據用于比例分割的如下表達式，該比例分割操作部分220產生ωh1i或ωh2i，其中ωh1i＝ωi×(1－υ)＋ωfi×υ或…(6)ωh2i＝ωi×(1－η)＋ωfi×η其中i＝1、2…P。
設定部分221根據線性預測階次P設定在比例分割操作部分220中的ωfi。應當認識到用在LSP改善部分216中的ωfi在數值上可以不同于部分207的ωfi。此外，通過比例分割對ωfi的改善可以適用于圖2所示的結構。
比例分割的第一個優(yōu)點是能保證改進的主頻增強的效果。即當通過比例產生的ωh1i和ωh2i由LSP域變換為LPC域時，主頻變得不鮮明，從而可以得到良好的主頻增強效果?！爸黝l變得不鮮明”在這里意指“主頻的峰值變小了”，換句話說，“頻譜特性曲線被平化，留下的頻譜稍有峰一谷的結構”。
比例分割的第二個優(yōu)點是保證按照使用者的需求對特性曲線進行設計的高度自由度，例如改變對每個頻帶的改善合成語聲信號的程度。具體地說，通過設計ωfi(除了υ和η以外)，可以改變?yōu)V波器203的特征，以便滿足使用者的需求。這種設計的高度的自由度將產生這樣一種效果，即在可允許的頻譜變化率的范圍內，可易于得到超過常規(guī)技術的較好主頻增強效果。
要指出，有幾種設定ωfi的方法。第一種方法是將表示平化的頻譜的LSP設定為ωfi，按照這種方法實現(xiàn)的變化率設定部分221以這樣一種方式設定ωfi，即根據如下的表達式，ωfi相鄰的維對維的距離(ωfi－ωfi－1)導致形成如π/(p＋1)所表示的某一數值，表達式為ωfi＝π×i/(p＋1)…(7)圖5概念性地表示作為一個實例的ωh1i的產生，當按照表達式(7)設定ωfi時，將進行利用比例分割操作的改進。要注意，這里假設p＝10。這種方法具有的優(yōu)點是在變化率設定部分221中它的功能的簡化。
第二種方法是將表示固定的變化率的頻譜的LSP設定為ωfi。按照這種方法實現(xiàn)的變化率設定部分221以這樣一種方式設定ωfi，即ωfi相鄰維對維的距離按照通過將與i無關的項δ(i)加到表達式(7)得到的如下表達式線性地上升或下降，該表達式為ωfi＝π×i/(p＋1)＋δ(i)…(7a)在這種情況下，通過上面介紹和圖5所示部分使本技術領域的熟練人員能夠易于看出，怎樣發(fā)生比例分割改善作用。這種首先具有的優(yōu)點是由于可以將基本上固定的變化率賦予到濾波器203的特性(曲線上)通過設定ωi的比例系數使得能夠控制(響)亮度。其次具有的優(yōu)點是，由于這一濾波器203的傳遞函數H(z)可以包含固定的高頻增強處理的特性(曲線)使得能夠減少處理的操作步驟，而這增強處理可以與常規(guī)主頻增強處理幾乎同時地實施。第三具有的優(yōu)點是，通過將δ(i)變?yōu)棣?ωi)以及對利用圖4用虛線表示的它的功能方塊圖進行改善，能夠將其用于限制(響)亮度變化。
第三種方法是對經過例如比例分割處理來改善代表平均噪聲頻譜的LSP得到的LSP設定作為ωfi。按照這樣方法實施的變化率設定部分221，根據如下表達式根據比例分割比率υ′或η′，通過改善代表平均噪聲頻譜設定ωfi，如圖6所示，該表達式為ωfi＝ωi′×(1－υ′)＋ωi′×υ′或ωfi＝ωi′×(1－η′)＋ωi′×η′ …(7b)其中i＝1，2，…p。這種方法的優(yōu)點在于，由于能夠多少增強語聲頻譜部分而不是噪聲頻譜部分，從而提高了清晰度。順便說一下，通過在利用如在圖6中所示的判別部分222已經判別為噪聲周期的一個周期內的ωi經過平均運算部分223進行平均可以得到ωi′。此外最好使對ωi′進行設定的改善處理不要對改善的合成語聲信號賦予太急劇的頻譜變化。例如，假如使ωf1太不鮮明，將變得可以阻止在改善的合成語聲信號中產生任何急劇的頻譜變化。
第四種方法是對例如通過比例分割，在開始作用后一直到目前的周期過程內或在經過的預定周期內的一個平均值進行改善得到的LSP設定作為ωfi。如圖7所示，利用這種方法實現(xiàn)的變化率設定部分221求出經過平均運算部分223的經過的LSPωi的平均值ωi′，以及根據這個ωi′和比例分割比率υ′或η′以及按照表達式(7b)設定ωfi。這種方法的優(yōu)點是基于能夠增強語聲頻譜中的變化來改進清晰度。此外，為了執(zhí)行這一方法，最好考慮例如改善ωi′，以便對改善的合成語聲信號不要賦予太急劇的頻譜變化。
然后參閱圖8，該圖表示在圖1中所示的濾波器203的對數功率對頻譜特性曲線的關系，當根據表達式(6)和(7)改善ωi時，將出現(xiàn)所示關系。在該曲線圖中，A、B、C和D分別代表合成器202的特性(＝)1/A(z)、濾波器204的特性(＝)1/A(z)，濾波器205的逆變換特征(＝)1/A2(z)，以及濾波器203的傳遞函數H(z)＝A2(z)/A1(z)，其中υ＝0.5和η＝0.8。如這一曲線圖所示，這一曲線圖中的特性曲線D被平化，而與圖33中的特性曲線D相比，則許可頻譜具有一定程度的峰谷結構。在圖8中按照這種方式與圖33相比可以看出較好的主頻增強效果。此外，這一曲線圖中特性曲線D與圖34中的特性曲線D相比對于頻譜的峰谷結構具有較少的畸變。此外，這一曲線圖中的特性曲線D不再存在于在圖35中的特性曲線B和C已經觀察到的兩種現(xiàn)象，即在最低頻率處的主頻的位移和在中部的兩個主頻的合并體。為了得到類似的優(yōu)點作為對比例分割處理的一種替換方案，可以采用具有在LSP域中使主頻鈍化的效果的其它處理方案。
本發(fā)明人已經將按照表達式(6)和(7)表示的方法由改善ωi的這一實施例的濾波器203產生的改善的合成語聲與由早先介紹的先有技術的濾波器203產生的改善的合成語聲進行比較。因此，已經指明，在抑制(響)亮度惡化方面這一實施例的語聲改善濾波器具有超過先有技術的濾波器的優(yōu)點，以及這一實施例不會產生任何獨有的失真的語聲或波動的音調。
如圖9所示，作為LSP改善操作的第二優(yōu)選實施例的相鄰的維對維的距離擴展可以利用擴展部分224和均勻壓縮部分225來執(zhí)行。擴展部分224通過移動ωi產生Si，其中Si和ωi兩者都屬于LSP域，因此，相鄰的維對維的距離Si－Si－1可以大于相鄰的維對維的距離ωi－ωi－1(關于ωi－ωi－1，參閱圖5)。均勻壓縮部分225由Si求出ωh1i。應指出，確切地說，Si以及ωi都是一多維矢量。當按照圖2中的結構執(zhí)行這一方法時，均勻壓縮部分225根據如下表達式求出ωh1i，該表達式為ωh1i＝Si/Sp＋1×π …(8)以及擴展部分224根據如下表達式求出Si，該表達式為Si＝Si－1＋max(ωi－ωi－1，th) …(9)其中i＝1，2，…p＋1ωo＝0，ωp＋1＝π，So＝0th閾值由上述表達式(8)和(9)可以明顯看出，相鄰的維對維的距離擴展是一種處理，用于由例如由表達式(9)右側的第二項具體限定的ωi－ωi－1與th比較的結果，在第(i－1)維和第i維之間至少確定一個距離。這種處理使得與第(i＋1)或較高維相關LSP一起向上位移一與th－(ωi－ωi－1)相對應的距離。此外，包含在表達式(8)的右側中的因子π/Sp＋1是一個用于響應于范圍0到π的ωi和LSP的范圍0至Sp＋1的Si中的比率均勻壓縮相應的維對維的距離的因子。應理解，本發(fā)明不應被限制于這一限定的表達式，其它限定的表達式也可以采用，只要它們代表用于擴展較小的相鄰的維對維的距離的處理即可。此外，通過相鄰的維對維的距離擴展得到ωi可以適用于圖1所示的結構。這將使得能夠進一步增加對濾波器203的特性(曲線)設計的自由度。
下面參閱圖10，該圖表示對數功率與頻譜特性(曲線)的關系，將這一方法應用于圖2中的濾波器203，可以出現(xiàn)這種關系。在這一曲線圖中，A、B和C分別表示合成器202特性曲線(＝)1/A(z)，濾波器204(th＝0.3)特性曲線(＝)1/A1(z；th＝0.3)以及濾波器204(th＝0.4)特性曲線(＝)1/A1(z；th＝0.4)。由這一曲線圖可以明顯看出，這一方法使得這些特性曲線可以與僅存在濾波器204的圖33和34相比較(換句話說，沒有使用濾波器205或與之對應的任何構成元件)。這意味著，利用比已知的濾波器的階次要低的濾波器能夠實現(xiàn)良好的語聲改善濾波器，以及利用較少數量的構成元件就能實現(xiàn)與常規(guī)濾波器基本相同的主頻增強效果。此外，本發(fā)明按照聲學將這一實施例中得到的改善的合成語聲與用常規(guī)技術得到的進行比較。因此，已經表明使用這一實施例的語聲改善濾波器將能保證音調質量絕不在已有濾波器之下。
兩種改善方法即比例分割改善法和相鄰的維對維的距離擴展法不是互相排它的，因此，它們可以綜合使用。例如還可以考慮，LSP改善部分216和217中的一個執(zhí)行比例分割，而另一個控制相鄰的維對維的距離擴展。另外，如圖11所示，可以采用這樣一種結構，即其包括轉換裝置228和229，用于選擇性地利用比例分割改善部分226，以便通過該比例分割改善ωi，以及包括相鄰的維到維的距離擴展部分227，以便擴展LSP的相鄰的維對維的距離。比例分割改善部分226可以具有在圖4、6和7中所示的上述結構中的任何一種。另外，如圖12所示，可以采用比例分割改善部分226和相鄰的維對維距離擴展部分227串級相連的一種結構。通過利用具有用作比例分割改善部分226和相鄰的維到維的距離擴展部分227的單體的LSP改善部分的結構，可以進一步提高濾波器203的特性(曲線)設計自由度，還可指明，在圖12中所示的比例分割改善部分226和相鄰的維對維距離擴展部分227的順序可反轉。自然，其它的處理方式可以與比例分隔改善和相鄰的維到維距離擴展中的兩者或任一個相結合。
此外，可以利用LSP改善部分216和217執(zhí)行ωi自適應處理?？烧J為是使根據比例分割的ωi改善處理成為ωi自適應的方法例如是這樣一種方法，在該方法中，一個ωi空間被分為若干個彼此不相重疊的子空間(下文稱為范疇)以及其中對于每一個范疇，υ和η是準備的(或轉換的)。在這種情況下，對于每一范疇可以提供LSP改善部分，例如對應于第一范疇為一LSP改善部分216-1(或217-1)，對應于第二范疇為一LSP改善部分216-2(或217-2)，…對應于第n范疇為一LSP改善部分216-N(或217-N)(參見圖13)。另外，單一的LSP改善部分216(或217)可以和用于響應各范疇或i轉換υ和η的改善的系數轉換部分230一起準備(見圖14)。ωi自適應處理具有的優(yōu)點是實現(xiàn)靈活的處理，例如僅對于一指定的范疇，例如當主頻的增強提高時會引起畸變的一個范疇，使主頻增強程度被削弱。這將能保證濾波器203的特性曲線改進，使之均勻或畸變減少。應以識到，由于ωi是一多維矢量，這里所稱的范疇一般是一多維矢量空間。
最好在LSP改善部分216和217中的ωi改善處理通過利用圖15所示轉化表231來實現(xiàn)。更確切地說，準備該用于使ωi和ωh1i或ωh2i相關的轉化表231，以使LSP改善部分216或217當參照ωi時能夠提供ωh1i或ωh2i作為它的輸出。利用轉化表231的優(yōu)點在于降低處理時間。假如將一相對復雜的表達式用作一用于ωi改善處理的主要表達式，這一優(yōu)點變得更顯著。
可以利用中間網絡232來在LSP改善部分216和217實施ωi改善處理，這個網絡先前已經例如利用如在圖16中所示的表達式(6)討論的ωi改善特性說明過。利用中間網絡232的第一個優(yōu)點是減少處理時間。假如使用一個相對復雜的表達式作為用于ωi改善處理的原理表達式，這種優(yōu)點將變得更加顯著。利用中間網絡232的第二個優(yōu)點是存儲器的容量可以降低，這是由于與利用轉化表231的情況相比較，不需要存儲該轉化表231。
利用中間網絡232的第三個優(yōu)點是降低了畸變。例如，在圖13、14中所示的ωi自適應實施例中，由于在范疇的邊界之外的ωi的輕微變化引起的υ和η的急劇變化，在改善的或半改善的合成的語聲信號中在范疇的邊界處經常出現(xiàn)畸變。特別是當ωi空間的分割相對粗略時，畸變會變得更顯著。在圖15所示的轉化表實施例中，像圖13和14的實施例一樣以相同的方式經常在表地址的邊界處出現(xiàn)畸變。相反，在圖16所示的中間網絡實施例中，由于沒有引起υ和η急劇變化的范疇，故不會產生畸變。
本發(fā)明的根據LSP的實施例并非試圖限制進行LPC濾波和反LPC濾波的結構，還將允許利用與LPC不同的特征數據作為它的濾波器系數。例如，如圖17和18所示，本發(fā)明可以利用LSP濾波器233(以及反LSP濾波器234)來實施，該濾波器利用ωh1i(和ωh2i)作為濾波器系數(當ωh1i是該系數時)。這種結構的優(yōu)點在于，不再需要LSP/LPC變換部分218和219。b)根據PARCOR的實施例參照圖19，該圖表示了輸2PARCOR作為頻譜信息的實施例。這個實施例除了LPC濾波器204和反LPC濾波器205以外，包含PARCOR改善部分235和236以及PARCOR/LPC變換部分237和238。PARCOR改善部分235由解碼器201或變換部分215輸入PARCOR 作為頻譜信息并改善這一，產生改善的PARCOR h1i。按照相同的方式，PARCOR改善部分236產生改善的PARCOR h2i。PARCOR/LPC變換部分237將 h1i由PARCOR域變換為LPC域，以便產生用于LPC濾波器204的濾波器系數α1i。PARCOR/LPC變換部分238還將 h2i由PARCOR域變換為LPC域，以便產生用于反LPC濾波器205的濾波器系數α2i。PARCOR改善部分235和236根據如下表達式，利用改善的(例如滿足0≤η≤υ＜1)系數υ和η，產生 h1i和 h2i，該表達式為φhli=φi×&upsi;(i×i)]]>φh2i=φi×η(i×i)---(10)]]>其中i＝1，2，…p。
進行這種改善能夠使主頻在PARCOR域平化。
因而，這一實施例將像上述根據LPC的實施例一樣保證相同的特性曲線改進效果(例如主頻增強效果，以及在判別這種增強程度的能力方面的改進)以及按照使用者的需求自由地控制/設定濾波器203的特性(曲線)。自然，本發(fā)明不應受表達式(10)的限制，可以采用在PARCOR域內使主頻被平化的其它處理方式。此外，對于利用PARCOR或根據PARCOR產生的特征數據作為其濾波器系數的濾波器，由于穩(wěn)定性條件是如下的簡單表達式給定的，故相對易于驗證和保證在PARCOR域的穩(wěn)定性。該表達式為-1<φi<1---(11)]]>換句話說，只要滿足表達式(11)，利用根據PARCOR的濾波器系數的濾波器是穩(wěn)定的。因此，根據這一實施例，提高了濾波器設計自由度的程度。例如，可以利用對于相應的i獨立地改善PARCOR 的處理作為一PARCOR改進處理。此外，由于不需要對頻譜重新分析和特征數據變換，使用傳輸或存儲作為頻譜信息的PARCOR的系統(tǒng)將保證具有良好的連貫性。圖20以曲線形式表示在圖19中的濾波器203的對數功率對頻譜特性(曲線)的關系。在這一圖中，A、B、C和D分別表示合成器202特性曲線(＝)1/A(z)、濾波器204特性曲線(＝)1/A1(z)，濾波器205反變轉特曲線(＝)1/A2(z)，以及濾波器203特性曲線(＝)A2(z)/A1(z)，其中υ＝0.98和η＝0.9。通過在圖20和33之間進行比較明顯看出，這一實施例允許頻譜峰谷結構某種程度上出現(xiàn)比在參考文件1所示的結構的峰谷變化更強。通過對改善的各合成語聲的聲學比較，本發(fā)明已經證實、使用這一實施例的濾波器203將肯定不會引起任何獨有畸變的語聲或任何波動的音調，并將保證良好的主頻增強效果。
由本說明書所作的公開對于本技術領域的熟練人員將很明顯這一基于PARCOR的實施例的細節(jié)可以與根據LSP的實施例的同樣方式構成。由本說明書所作的公開對于本技術領域的熟練人員也將易于理解，可以不用反LPC濾波和在圖21中所示的與之相關的元件而采用如圖22中所示的包括PARCOR濾波器239和利用改善的PARCOR h1i和 h2i(作為其濾波器系數)的反PARCOR濾波器240。C)根據LAR的實施例在圖23中表示了一個輸入LAR作為頻譜信息的實施例，這一實施例除了LPC濾波器204和反LPC濾波器205以外還包含LAR改善部分241和242以及LAR/LPC變換部分243和244。LAR改善部分241由解碼器201或變換部分205輸入作為頻譜信息的LARψi，并且改善這一ψi，以便產生改善的LARψh1i。按照相同的方式，LAR改善部分242也產生改善的LARψh2i。LAR/LPC變換部分243將ψh1i由LAR域變換到LPC域，以便產生用于LPC濾波器204的濾波器系數α1i。 LAR/LPC變換部分244將ψh2i由LAR域變換為LPC域，以便產生用于反LPC濾波器205的濾波器系數α2i。
按照如下的表達式，利用例如滿足0≤η≤υ＜1的改善的系數υ和η，LAR改善部分241和242分別產生ψh1i和ψh2i。該表達式為ψh1i＝ψi×υiψh2i＝ψi×ηi…(12)其中i＝1，2，…p進行這種改善能使主頻在PARCOR域內平化。
因而這一實施例將像上述根據LPC的實施例和根據PARCOR實施例一樣具有相同的特性(曲線)改進效果(例如主頻增強效果，調節(jié)所述增強程度的能力上的改進)，以及按照使用者的需求由控制/設定濾波器203的特性(曲線)。自然本發(fā)明不應受表達式(12)的限制，能夠在LAR域內使主頻被平化的其它處理方案也可以采用。由于當使用根據LAR產生的濾波器系數時，能夠驗證和保證濾波器是穩(wěn)定的，在這一實施例中的LAR改善處理不受濾波器穩(wěn)定性方面的限制。此外，應用于傳輸或存儲作為頻譜信息的PARCOR的系統(tǒng)將保證良好的連貫性，這是由于對頻譜重新分析和特征數據變換。
圖24以曲線圖方式表示在圖23中的濾波器203的對數功率對頻譜特性曲線的關系。在這一圖上，A、B、C和D分別表示合成器202特性曲線(＝)1/A(z)、濾波器204特性曲線(＝)1/A1(z)、濾波器205反變換特性曲線(＝)1/A2(z)以及濾波器203特性曲線(＝)A2(z)/A1(z)，其中υ＝0.9，η＝0.7。通過在圖24和33之間進行比較表明，這一實施例允許頻譜被平化而留下某種程度的頻譜峰谷結構，從而導致與在參考文件1中公開的結構相比，具有更好的主頻增強效果。此外，與圖34比較，圖24表示由頻譜的峰谷結構包含的畸變較少。在圖24中不再產生在中部兩個主頻合并體的現(xiàn)象，這一點由在圖35的特性曲線B和C的比較將變得很明顯。通過以聲學方式比較改善的合成語聲，本發(fā)明已經指明，使用這一實施例的濾波器203肯定不會引起任何獨有畸變失真的語聲和任何波動的音調，將能保證良好的主頻增強效果。
根據本說明書的所作公開，對本技術領域的熟練人員很明顯，基于LAR的這一實施例的細節(jié)可以由與基于LSP的實施例和基于PARCOR的實施例一樣的方式構成。由本說明書的所作公開，對于本技術領域的熟練人員還將易于認識，可不使用反LPC濾波和在圖26中所示的與其相關的構成元件，而采用包括PARCOR濾波器239和利用改善的LARψhi和ψh2i作為其濾波器系數的反PARCOR濾波器240。此外，為了將改善的LARψh1i和ψh2i由LAR域變換到PARCOR域，在圖26中設有LAR/PARCOR變換部分246和247。由于一般LAR/PARCOR變換處理比LAR/LPC變換相對簡單和容易，因此可以利用比LAR/LPC變換部分243和244處理步驟較少或使用較小的電路結構就能實現(xiàn)LAR/PARCOR變換部分246和247。因此根據圖27的實施例，在比圖23和25實施例要短的周期內產生濾波器系數α1i和α2i，由濾波器203進行的整個處理步驟會降低。d)補充由本說明書所作的公開對于本技術領域的熟練人員將會易于認識到，可以對上述的根據LSP的實施例，根據PARCOR的實施例和根據LAR的實施例選擇性地結合。由本說明書所作公開對于本技術領域的熟練人員還能易于認識到，可以將本發(fā)明的每一實施例與常規(guī)的根據LPC的裝置相結合。這些不同的結合有助于實現(xiàn)按照其它方式不能實現(xiàn)的，特性設計具有高自由度的濾波器203。例如，如圖27所示，濾波器204的濾波系統(tǒng)數α1i可以利用與參考文件1一樣的方法來確定，而濾波器205的濾波系統(tǒng)α2i可以利用與基于PARCOR的實施例一樣的方法來確定。這種結構將使濾波器203出現(xiàn)比圖33的特性曲線D要小的頻譜變化率，以及比圖34的特性曲線D在主頻的附近產生的畸變要少。
可以將另一個濾波器配置在濾波器203之前或之后，或與濾波器203并聯(lián)，以便進行音調增強處理、高頻增強處理、主頻增強處理等等。
權利要求
1.一種濾波器，包含濾波裝置，用于通過由濾波器系數限定的傳遞函數對合成的語聲信號進行濾波，以便產生改善的合成語聲信號；以及濾波器系數產生裝置，用于根據以多維矢量形式表示的以及屬于一預定域的和與輸入的語聲信號相關的頻譜信息，按照這樣一種方式即根據所述頻譜信息以及與所述合成的語聲信號的頻譜信息相比較增強所述改善的合成語聲信號的主頻特性的方式產生所述濾波器系數；所述頻譜信息是LSP信息、PARCOR信息和LAR信息中的任何一種。
2.根據權利要求1所述的濾波器，其中所述的濾波器系數屬于LPC域。
3.根據權利要求2所述的濾波器，其中所述的濾波器系數產生裝置包括改善裝置，用于改善在所述預定域內的所述頻譜信息，以便產生改善的頻譜信息；以及一裝置，用于將所述改善的頻譜信息由所述的預定域變換到LPC域，以便產生所述濾波器系數。
4.根據權利要求3所述的濾波器，其中所述改善裝置包括平化裝置，用于改善所述頻譜信息，以便降低所述改善的合成語聲信號的主頻峰值。
5.根據權利要求4所述的濾波器，其中所述的頻譜信息是LSP信息，以及其中所述平化裝置，包括比例分割裝置，用于根據改善的系數，所述頻譜信息和直接屬于所述頻譜信息所屬的同一個域的參考信息，以便產生所述改善的頻譜信息。
6.根據權利要求5所述的濾波器，其中所述比例分割裝置，對所述頻譜信息和所述參考信息進行比例分割，以便將一固定的頻譜變化率賦予到所述改善的合成語聲信號上。
7.根據權利要求5所述的濾波器，其中所述比例分割裝置對所述頻譜信息和所述參考信息進行比例分割，以便將反映平均噪聲頻譜的頻譜變化率賦予到所述改善的合成語聲信號上。
8.根據權利要求5所述的濾波器，其中所述比例分割裝置對所述頻譜信息和所述參考信息進行比例分割，以便將反映所述頻譜信息迄今已經跟蹤的經歷的頻譜變化率賦予到所述改善的合成語聲信號上。
9.根據權利要求4所述的濾波器，其中所述頻譜信息或者是PARCOR信息或者是LAR信息以及其中所述平化裝置包括一裝置，用于對于構成所述頻譜信息的多個維中的每一個，用改善的系數或所述改善的系數的乘方乘以所述頻譜信息數據，以便產生所述改善的頻譜信息。
10.根據權利要求9所述的濾波器，其中所述的乘方與所述的維無關。
11.根據權利要求3所述的濾波器，其中所述頻譜信息是LSP信息，以及其中所述改善裝置包括距離擴展裝置，用于擴展在表示所述頻譜信息的若干維之中相鄰的維之間的距離，以便產生所述改善的頻譜信息。
12.根據權利要求11所述的濾波器，其中所述距離擴展裝置包括擴展裝置，用于當所述各相鄰維之間的距離小于參考距離時，將所述距離擴展于所述參考距離之外；壓縮裝置，用于在利用所述擴展裝置擴展在相鄰的各維之間的所述距離之后，對于所有所述相鄰各維均衡壓縮所述各距離，以便保證所述頻譜信息的范圍就其整體變得與擴展之前的范圍相一致。
13.根據權利要求3所述的濾波器，其中所述的頻譜信息是LSP信息，以及其中所述改善裝置包括比例分割裝置，用于根據改善的系數、所述頻譜信息以及屬于所述頻譜信息所屬的直接相同域的參考信息進行比例分割；距離擴展裝置，用于擴展在表示所述頻譜信息的若干維中間的相鄰各維之間的距離；及轉換裝置，用于選擇性或者利用所述比例分割裝置或者利用所述距離擴展裝置來產生所述改進的頻譜信息。
14.如權利要求3所述的濾波器，其中所述的頻譜信息是LSP信息，以及其中所述改善裝置包括比例分割裝置，用于對所述頻譜信息和屬于與所述頻譜信息所屬的域直接相同的域的參考信息利用改善的系數進行比例；距離擴展裝置，用于對在表示所述頻譜信息的若干維中間的各相鄰的維之間距離進行擴展；以及串級連接裝置，用于以相互配合的方式利用所述比例分割裝置和所述距離擴展裝置，以便產生所述改善的頻譜信息。
15.如權利要求3所述的濾波器，其中所述改善裝置包括一轉化表，用于存儲與所述改善的頻譜信息相關的所述頻譜信息，所述轉化表響應于所述頻譜信息的提供，產生需要產生的改善的頻譜信息。
16.根據權利要求3所述的濾波器，其中所述改善裝置包括一中間網絡，該網絡通過記憶，具有將所述頻譜信息變換為所述改善的頻譜信息的能力，所述中間網絡響應所述頻譜信息的提供產生需要產生的改善的頻譜信息。
17.根據權利要求3所述的濾波器，其中所述改善裝置包括若干規(guī)定范疇改善裝置，每一個裝置提供用于若干彼此不相重疊和通過對所述預定域進劃分得到的范疇中的每一個范疇；所述若干規(guī)定范疇裝置，每個包括一裝置，用于改善在一對應的范疇內的所述頻譜信息；以及一裝置，用于將所述改善的頻譜信息由所述預定域變換為LPC域，以便產生一濾波器系數。
18.根據權利要求3所述的濾波器，其中所述改善裝置包括一裝置，用于根據改善的系數，改善在所述預定域內的所述頻譜信息，以便產生改善的頻譜信息；一裝置，用于將所述改善的頻譜信息由從所述預定域變換為LPC域，以便產生所述濾波器系數；以及一裝置，用于根據這樣一個范疇調節(jié)所述改善的系數，該范疇是在通過將所述預定域分割得到的且彼此不相重疊的所述若干范疇中間的所述頻譜信息所屬的那一個范疇。
19.根據權利要求1所述的濾波器，其中所述濾波器系數屬于LSP域和PARCOR域中的任一種。
20.根據權利要求19所述的濾波器，其中所述濾波器系數產生裝置包括改善裝置，用于改善在所述預定域內的所述頻譜信息，以便產生改善的頻譜信息；以及一裝置，用于將所述改善的頻譜信息作為所述濾波器系數提供到所述濾波裝置。
21.根據權利要求1所述的濾波器，其中所述濾波裝置包括一合成式濾波器，用于實現(xiàn)所述傳遞函數的分母部分的作用，以便保證所述改善的合成語聲信號的主頻特性與所述合成的語聲信號的主頻特性相比得到加重。
22.根據權利要求21所述的濾波器，其中所述濾波裝置還包括反變換濾波器，用于抑制由所述合成式濾波器賦予到所到改善的合成語聲信號上的頻譜變化率。
23.一種語聲合成裝置，包含一裝置，用于根據以多維矢量表示的且屬于一預定域的以及與輸入的語聲信號相關的頻譜信息產生合成的語聲信號；一裝置，用于通過由濾波器系數限定的傳遞函數對合成的語聲信號濾波，以便產生改善的合成語聲信號；以及一裝置，用于根據所述頻譜信息按這樣一種方式產生所述濾波器系數，該方式即根據所述頻譜信息和與所述合成的語聲信號的頻譜信息相比較使所述改善的合成語聲信號的主頻特性被增強；所述頻譜信息是LSP信息、PARCOR信息和LAR信息中的任一種。
24.一種語聲合成裝置，包含一裝置，用于根據以多維矢量的形式表示的且屬于一預定域的以及與輸入的語聲信號相關的第一頻譜信息產生合成的語聲信號；一裝置，用于將所述第一頻譜信息變換為屬于與所述預定域不同的一個域的第二頻譜信息；一裝置，用于經過由濾波器系數限定的傳遞函數對合成的語聲信號進行濾波，以便產生改善的合成語聲信息；以及一裝置，用于根據所述第二頻譜信息產生所述濾波器系數，以便根據所述第二頻譜信息和與所述合成的語聲信號的頻譜信息相比較，保證所述改善的合成語聲信號的主頻特性被增強；所述頻譜信息是LSP信息、PARCOR信息和LAR信息中的任一種。
25.一種語聲合成裝置，包含一裝置，用于根據以多維矢量的形式表示的且屬于一預定域的以及與輸入的語聲信號相關的第一頻譜信息產生合成的語聲信號；一裝置，用于分析所述合成的語聲信號，以便產生第二頻譜信息；一裝置，用于通過一由濾波器系數限定的傳遞函數對合成的語聲信號進行濾波，以便產生改善的合成語聲信號；以及一裝置，用于根據所述第二頻譜信息產生所述濾波器系數，以便根據所述第二頻譜信息和與所述合成的語聲信號的頻譜信息相比較，保證所述改善的合成語聲信號的主頻特性被增強；所述頻譜信息是LSP信息、PARCOR信息和LAR信息中的任一種。
26.一種語聲存儲/傳輸系統(tǒng)，包含一裝置，用于分析輸入的語聲信號，以便產生以多維矢量的形式表示的且屬于一預定域以及與所述輸入的語聲信號相關的頻譜信息；一裝置，用于存儲或傳輸所述頻譜信息；一裝置，用于根據已經存儲或傳輸的所述頻譜信息產生合成的語聲信號；一裝置，用于通過一利用濾波器系數限定的傳遞函數對所述合成的語聲信號進行濾波，以便產生改善的合成語聲信號；以及一裝置，用于根據所述的頻譜信息產生所述的所述濾波器階數，以便根據所述頻譜信息和與所述合成的語聲信號的頻譜信息相比較保證使所述改善的合成語聲信號的主頻特性增強；所述頻譜信息是LSP信息、PARCOR信息以及LAR信息中的任一種。
27.一種語聲存儲/傳輸系統(tǒng)，包含一裝置，用于分析輸入的語聲信號，以便產生以多維矢量表示的且屬于一預定域的以及與所述輸入的語聲信號相關的第一頻譜信息；一裝置，用于存儲或傳輸所述第一頻譜信息；一裝置，用于根據已經存儲或傳輸的所述第一頻譜信息，產生合成的語聲信號；一裝置，用于將所述第一頻譜信息變換為屬于與所述預定域不同的一個域的第二頻譜信息；一裝置，用于通過一由濾波器系數限定的傳遞函數對所述合成的語聲信號進行濾波以便產生改善的合成語聲信號；以及一裝置，用于根據所述第二頻譜信息產生所述濾波器系數，以便根據所述第二頻譜信息和與所述合成的語聲信號的頻譜信息相比較，保證所述改善的合成語聲信號的主頻特性被增強；所述頻譜信息是LSP信息、PARCOR信息和LAR信息中的任一種。
28.一種語聲存儲/傳輸系統(tǒng)，包含一裝置，用于分析輸入的語聲信號，以便產生以多維矢量形式表示的且屬于一預定域的以及與所述輸入的語聲信號相關的第一頻譜信息；一裝置，用于存儲或傳輸所述第一頻譜信息；一裝置，用于根據已經存儲或傳輸的所述第一頻譜信息產生合成的語聲信號；一裝置，用于分析所述合成的語聲信號，以便產生第二步驟譜信息；一裝置，用于通過由濾波器系數限定的傳遞函數對所述合成的語聲信號進行濾波，以便產生改善的合成語聲信號；以及一裝置，用于根據所述第二頻譜信息產生所述濾波器系數，以便根據所述第二頻譜信息和與所述合成的語聲信號的頻譜信息相比較，保證所述改善的合成語聲信號的主頻特性被增強所述頻譜信息是LSP信息、PARCOR信息和LAR信息中的任一種。
29.一種語聲改善方法，包含第一步驟，通過由濾波器系數限定的傳遞函數對合成的語聲信號進行濾波，以便產生改善的合成語聲信號；以及第二步驟，根據由多維矢量表示的且屬于一預定域的以及與所述合成的語聲信號相關的頻譜信息產生所述濾波器系數，以便根據所述頻譜信息和與所述合成的語聲信號的頻譜信息相比較來保證所述頻譜信息的主頻特性部分被加重；所述第二步驟先于執(zhí)行所述第一步驟；所述頻譜信息為LSP信息、PARCOR信息和LAR信息中的任一種。
全文摘要
一種改善增強語聲的濾波器、用該濾波器的裝置、系統(tǒng)和方法，對合成語聲信號濾波產生改善的語聲信號。由用多維矢量表示的頻譜信息確定濾波器系數以與合成語聲信號的頻譜信息比較和根據頻譜信息，能保證信號的主頻特性增強。頻譜信息可為LSP、PARCOR或LAR信息之一。由此提高了按聲學要求抑制信號中量化噪聲的語聲改善濾波器的設計自由度和語聲信號清晰度，可得到良好的主頻增強效果，而不會在允許的頻譜變化范圍產生明顯畸變。
文檔編號G10L19/14GK1148232SQ96108490
公開日1997年4月23日申請日期1996年5月11日優(yōu)先權日1995年5月12日
發(fā)明者田崎裕久申請人:三菱電機株式會社

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：田崎裕久
技術所有人：三菱電機株式會社
我是此專利的發(fā)明人

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

改善增強語聲的濾波器，用該濾波器的裝置、系統(tǒng)和方法