信號(hào)處理方法和裝置的制作方法

文檔序號(hào)：2829270閱讀：329來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：信號(hào)處理方法和裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及信號(hào)處理方法和裝置，具體地說，涉及例如用于數(shù)字移動(dòng)電話的噪聲消除器、VAD (語音活動(dòng)檢測(cè))等中的語音信號(hào)處理所需的方法和裝置。
背景技術(shù)：
作為一種在數(shù)字移動(dòng)電話等中抑制通信語音中的背景噪聲以使得能夠容易地聽到語音的技術(shù)，噪聲消除器可以被提及。同樣，作為一種通過根據(jù)語音的存在/不存在而打開/關(guān)閉發(fā)射輸出來節(jié)省發(fā)射部的電力的技術(shù)，VAD可以被提及。對(duì)于噪聲消除器、VAD等，需要在通信過程中確定語音存在的分段或者沒有語音存在的分段。作為確定這分段的方法，例如可以提及下述的方法，即，通過將過去計(jì)算出的長(zhǎng)期的平均功率看作噪聲的功率，將噪聲功率與當(dāng)前分段中的功率進(jìn)行比較，以將功率較大的當(dāng)前分段確定或判定為語音分段。然而，僅通過這種簡(jiǎn)單的功率比較，當(dāng)背景噪聲電平很高并且信噪比SNR。很小時(shí)，存在語音被錯(cuò)認(rèn)為噪聲的情況。作為對(duì)于這種情況的措施，已經(jīng)提出了通過利用語音的頻域信號(hào)來執(zhí)行分段確定的方法(例如參見專利文獻(xiàn)1)。在下文中，將對(duì)這種技術(shù) 進(jìn)行描述。對(duì)輸入信號(hào)周期性地執(zhí)行時(shí)間-頻率轉(zhuǎn)換。計(jì)算輸入信號(hào)的頻域信號(hào) (在下文中，稱為輸入頻譜)。把過去計(jì)算出的長(zhǎng)期的平均輸入頻譜看作噪聲頻譜(在下文中，稱為平均噪聲頻譜)。為平均噪聲頻譜和輸入頻譜中的每一個(gè)計(jì)算每帶寬的信噪比SNRn，以便在所需帶寬下計(jì)算每帶寬的信噪比SNR。的平均值、正(負(fù))變化量、離差值(dispersionvalue)等。通過利用這些值，來執(zhí)行分段確定。同樣，僅在通過上述分段確定將該
分段確定為噪聲分段時(shí)，才利用輸入頻譜對(duì)平均噪聲頻譜進(jìn)行更新。因此，實(shí)現(xiàn)了更精確的分段確定。專利文獻(xiàn)1:日本專利申請(qǐng)?zhí)亻_No.2001-265367 發(fā)明內(nèi)容然而，如在專利文獻(xiàn)1中所述的現(xiàn)有技術(shù)中，僅在噪聲分段中對(duì)平均噪聲頻譜進(jìn)行更新。因此，當(dāng)噪聲電平急劇上升時(shí)，噪聲分段被錯(cuò)認(rèn) 為語音分段，此后不對(duì)平均噪聲頻譜進(jìn)行更新，從而不利地持續(xù)錯(cuò)誤的確定。為了避免這種錯(cuò)誤的確定，專利文獻(xiàn)1還公開了下述的方法，艮P，根據(jù)每帶寬的信噪比SNRn來控制噪聲更新的時(shí)間常數(shù)，以與分段確定的結(jié)果無關(guān)地對(duì)噪聲進(jìn)行更新。然而，當(dāng)在語音分段中對(duì)平均噪聲頻譜進(jìn)行更新時(shí)，由于語音的影響而對(duì)平均噪聲頻譜明顯估計(jì)過高。因此.，出現(xiàn)了一個(gè)新的問題，艮P，低電平的語音分段很容易被錯(cuò)認(rèn)為噪聲分段。因此，本發(fā)明的一個(gè)目的是提供一種信號(hào)處理方法和裝置，其中，在具有急劇上升的噪聲電平的分段中，提高所估算的噪聲的跟蹤速度 (following speed),以使得在信號(hào)分段中幾乎不產(chǎn)生由于語音的影響而導(dǎo)致的噪聲頻譜的估算誤差。(1)為了實(shí)現(xiàn)上述目的，根據(jù)本發(fā)明的信號(hào)處理方法包括時(shí)域信號(hào)提取步驟，用于提取時(shí)域信號(hào)，所述時(shí)域信號(hào)是輸入信號(hào)的抽樣數(shù)據(jù); 頻域信號(hào)分析步驟，用于按幀將所述時(shí)域信號(hào)轉(zhuǎn)換成頻域信號(hào)，并計(jì)算輸入頻譜；以及噪聲估算步驟，通過利用所述輸入頻譜的最小分量來估算噪聲頻譜，所述噪聲頻譜是包括在所述輸入信號(hào)中的噪聲分量的頻域信號(hào)。將參照附圖對(duì)這種方法進(jìn)行描述。首先，采用如圖l所示的輸入信號(hào)(疊加了噪聲的語音)作為示例。在圖1中，分段(i)與(iv)是"噪聲獨(dú)占分段"(在下文中，稱為噪聲分段)。在分段(iii)中，出現(xiàn)了噪聲電平的急劇上升。分段(ii)與(v) 是"混合了語音與噪聲的混合分段"(在下文中稱為混合分段)。圖2示
出了上述分段(i)、 (ii)、 (iv)以及(V)的典型輸入頻譜。當(dāng)將圖2中的分段(0的輸入頻譜A與分段(ii)的輸入頻譜A進(jìn) 行比較時(shí)，分段(ii)中的"語音和噪聲的混合分段"中的輸入頻譜A的最小部分(圖2中的實(shí)心圓)被所疊加的噪聲屏蔽，其中噪聲的貢獻(xiàn)程度很高。因此，這些最小部分變得在值方面等于作為"噪聲獨(dú)占分段" 的分段(i)中的輸入頻譜的最小部分。對(duì)于噪聲電平增加的情況也是一樣，以使得作為"噪聲獨(dú)占分段"的分段(iv)中的頻譜的最小部分的值變得等于作為"語音和噪聲的混合分段"的分段(v)中的頻譜的最小部分的值。在下文中，用直線來連接輸入頻譜的最小部分，這將被稱為如圖2所示的最小頻譜B?；谶@種原理，在本發(fā)明的時(shí)域信號(hào)提取步驟與頻域信號(hào)分析步驟中，根據(jù)預(yù)定分段的時(shí)域的輸入信號(hào)計(jì)算作為頻域信號(hào)的輸入頻譜A。在噪聲估算步驟中，通過利用輸入頻譜A的最小值來獲得最小頻譜B，以估算作為當(dāng)前幀內(nèi)的噪聲分量的頻域信號(hào)的噪聲頻譜。因此，在本發(fā)明中通過利用頻譜的最小部分來計(jì)算所估算的噪聲，以使得幾乎不產(chǎn)生由于語音信號(hào)的影響而導(dǎo)致的噪聲頻譜的估算誤差，并且可以在噪聲電平的急劇上升分段中提高所估算的噪聲的跟蹤速度。(2) 在上述的(1)中，在噪聲估算步驟中，可以獲得每幀的瞬時(shí) 噪聲頻譜作為噪聲頻譜。因此，由于在該幀內(nèi)結(jié)束或完成了噪聲頻譜的估算步驟，所以使得較高敏感度的噪聲估算成為可能。同樣，利用相對(duì)小規(guī)模的電路結(jié)構(gòu)的實(shí)現(xiàn)也成為可能。(3) 在上述的(2)中，在噪聲估算步驟中，可以獲得多個(gè)幀的瞬時(shí)噪聲頻譜的平均噪聲頻譜作為噪聲頻譜。因此，在長(zhǎng)時(shí)間內(nèi)對(duì)所估算的噪聲頻譜進(jìn)行平均，以使得更穩(wěn)定的噪聲估算成為可能。(4) 上述(1) - (3)中的任何一個(gè)可以進(jìn)一步包括分段確定步驟，用于對(duì)所述噪聲頻譜與所述輸入頻譜進(jìn)行比較，并確定該幀是在混合了語音和噪聲的分段中還是在沒有語音的噪聲分段中。
也就是說，如圖1和2所示，對(duì)基于輸入頻譜A和最小頻譜B的瞬時(shí)噪聲頻譜相互進(jìn)行比較，由此可以指定混合分段和噪聲分段，并且可以構(gòu)造在噪聲抑制和節(jié)能方面優(yōu)異的系統(tǒng)。(5) 在上述的(4)中，在噪聲估算步驟中，當(dāng)在分段確定步驟中直到最后一幀的確定結(jié)果表示混合分段時(shí)，可以通過利用瞬時(shí)噪聲頻譜來獲得平均噪聲頻譜，而當(dāng)確定結(jié)果表示噪聲分段時(shí)，可以通過利用輸入頻譜來獲得平均噪聲頻譜。也就是說，當(dāng)在分段確定步驟中直到最后一幀的確定結(jié)果表示混合分段時(shí)，通過如上所述利用瞬時(shí)噪聲頻譜來獲得平均噪聲頻譜。另一方面，當(dāng)確定結(jié)果表示噪聲分段時(shí)，不需要利用瞬時(shí)噪聲頻譜而只需要利用輸入頻譜。因此，基于輸入頻譜來獲得平均噪聲頻譜。(6) 上述的(4)可以進(jìn)一步包括抑制量計(jì)算步驟，用于在考慮了分段確定步驟中的確定結(jié)果的情況下，基于噪聲頻譜與輸入頻譜對(duì)輸入信號(hào)計(jì)算每帶寬的抑制量，并抑制輸入信號(hào)的噪聲。因此，基于噪聲頻譜與輸入頻譜計(jì)算輸入信號(hào)的抑制量。然而，考慮到分段確定步驟中的確定結(jié)果，如果在例如混合分段的情況下減小抑制量，而在噪聲分段的情況下增大抑制量，則可以進(jìn)行更有效的噪聲抑制。因此，具有靈敏度與穩(wěn)定性之間的平衡的噪聲估算成為可能。(7) 在上述(1) - (6)中的任何一個(gè)中，輸入信號(hào)可以包括語音信號(hào)。在這種情況下，可以提供有效的應(yīng)用。應(yīng)當(dāng)注意，可以實(shí)現(xiàn)用于分別執(zhí)行在上述(1) - (7)中描述的信號(hào) 處理方法的信號(hào)處理裝置。根據(jù)本發(fā)明，在噪聲電平的急劇上升分段中提高了所估算的噪聲的跟蹤速度，并且在混合分段中減小了由于語音的影響而導(dǎo)致的噪聲頻譜的估算誤差，從而可以執(zhí)行精確的分段確定。

圖1是用于說明本發(fā)明的原理的波形圖，其示出了每分段的輸入語
音信號(hào)的變化；圖2是示出了圖1中的每分段的輸入語音信號(hào)的頻譜的頻譜圖；圖3是示出了根據(jù)本發(fā)明的第一實(shí)施方式的信號(hào)處理裝置的構(gòu)造框圖；圖4是示出了由本發(fā)明的第一實(shí)施方式的信號(hào)處理裝置計(jì)算出的最小頻譜的示例的頻譜圖；圖5是用于說明校正系數(shù)的計(jì)算的頻譜圖，該校正系數(shù)用于與由根據(jù)本發(fā)明的第一實(shí)施方式的信號(hào)處理裝置計(jì)算出的最小頻譜相乘；圖6是用于說明校正系數(shù)的計(jì)算的關(guān)系圖，該校正系數(shù)用于與由根據(jù)本發(fā)明的第一實(shí)施方式的信號(hào)處理裝置計(jì)算出的最小頻譜相乘；圖7是示出了根據(jù)本發(fā)明的第二實(shí)施方式的信號(hào)處理裝置的構(gòu)造框圖；圖8是示出了本發(fā)明的第三實(shí)施方式的信號(hào)處理裝置的配置框圖；圖9是示出了用作本發(fā)明的第四實(shí)施方式的噪聲抑制裝置的信號(hào)處理裝置的構(gòu)造框圖。標(biāo)號(hào)的說明 1時(shí)域信號(hào)提取部 2頻域信號(hào)分析部 3a、 3b、 3c噪聲估算裝置 4a、 4b、 4c分段確定裝置 5抑制量計(jì)算部 7時(shí)域信號(hào)合成部 31瞬時(shí)噪聲估算部 32b、 32c平均噪聲估算部41a、 41b、 41c用于噪聲/語音確定的參數(shù)計(jì)算部 42噪聲/語音確定部在所有附圖中，相同的標(biāo)號(hào)表示相同或相應(yīng)的組件。
具體實(shí)施例方式
在下文中，將參照附圖對(duì)本發(fā)明的實(shí)施方式進(jìn)行描述。第一實(shí)施方式圖3是示出了根據(jù)本發(fā)明的第一實(shí)施方式的信號(hào)處理裝置的構(gòu)造框圖，該信號(hào)處理裝置用作噪聲估算裝置和噪聲分段確定裝置。該信號(hào)處理裝置包括時(shí)域信號(hào)提取部l、頻域信號(hào)分析部2、噪聲估算裝置3a、以及分段確定裝置4a。在下文中，將對(duì)該信號(hào)處理裝置的各個(gè)塊進(jìn)行詳細(xì) 描述。時(shí)域信號(hào)提取部1對(duì)模擬輸入語音信號(hào)進(jìn)行量化，并從中提取時(shí)域信號(hào)Xn(k)(其中"n"表示幀編號(hào))作為每單位時(shí)間(幀)的抽樣數(shù)據(jù)。同樣，頻域信號(hào)分析部2通過利用例如FFT (快速傅立葉變換)來執(zhí)行對(duì)時(shí)域信號(hào)x"k)的頻率分析，并計(jì)算輸入頻譜Xn(f)(與圖2中的輸入頻譜A相對(duì)應(yīng))，輸入頻譜Xn(f)是輸入信號(hào)的頻譜幅值。在"Digital signal processing series vol.1: Digital signal processing (Tujii & Kamata)，P94-P120， Shoukoudou，，、 "Computer music(Curtis Roads著,Aoyagi等編譯)， P452-P457, Tokyo Denki University Press"等中對(duì)FFT進(jìn)行了詳細(xì)描述。應(yīng)當(dāng)注意，輸入頻譜Xn(f)可以被分成多個(gè)帶寬，在各個(gè)帶寬中可以用通過加權(quán)平均等計(jì)算出的帶寬頻譜來替代輸入頻譜。同樣，可以用通過BPF (帶通濾波器)計(jì)算出的每帶寬的輸入振幅之(/)來替代輸入頻譜Xn(f)。通過下列過程來計(jì)算每帶寬的輸入振幅首先，通過下列方程將輸入信號(hào)Xn(t)分成帶寬信號(hào)；(/力<formula>formula see original document page 9</formula> 方程(1 )萬i^(/J):用于帶寬劃分的FIR濾波器系數(shù) M: FIR濾波器級(jí)數(shù)(degree) i:帶寬號(hào)然后，按幀通過下列方程計(jì)算每帶寬的輸入幅值之O'): 之(0 =丄5 .,卜,)(N:幀長(zhǎng)) 方程(2)向噪聲估算裝置3a和分段確定裝置4a中輸入這樣獲得的輸入頻譜。噪聲估算裝置3a具有瞬時(shí)噪聲估算部31 ，瞬時(shí)噪聲估算部31根據(jù)輸入頻譜Xn(f)的近似形式來估算瞬時(shí)噪聲頻譜Nn(f)，該瞬時(shí)噪聲頻譜 Nn(f)是當(dāng)前幀的噪聲頻譜，該輸入頻譜Xn(f)是由頻域信號(hào)分析部2計(jì)算的。通過下列過程來計(jì)算瞬時(shí)噪聲頻譜Nn(f):首先，從輸入頻譜X"f)中選擇頻譜的最小值mn(k)。例如，選擇滿足下列條件式的輸入頻譜Xn(f)作為最小值mn(k):&(/)" (/-1)并且^(/)" (/ + 1) 方程(3)然后，根據(jù)最小值mn(k)計(jì)算最小頻譜Mn(f)(與圖2中的最小頻譜 B相對(duì)應(yīng))。如果假定第k個(gè)頻率是mn(k)，則可以用最小值m。(k)與fk的函數(shù)來表示最小頻譜Mn(f)。例如，當(dāng)例如最小頻譜Mn(f)是如圖4所示的函數(shù)時(shí)，可以用下列方程來表示最小頻譜M。(f):""、 "i、 (W"(W一氣(A —1))/y y 、m"(/)=氣(卜i)+~;、、 x (/ - u(/廣/w) 方程(4)應(yīng)當(dāng)注意，雖然圖4示出了利用非線性函數(shù)來計(jì)算最小頻譜Mn(f) 的示例，但是也可以利用高階多項(xiàng)式方程、線性函數(shù)等。然后，通過利用這樣獲得的最小頻譜Mn(f)來計(jì)算瞬時(shí)噪聲頻譜Nn(f)。應(yīng)當(dāng)注意，可以通過將校正系數(shù)^(/)與最小頻譜M"f)相加或相乘來具體計(jì)算瞬時(shí)噪聲頻譜Nn(f)。校正系數(shù)^(/)可以是預(yù)先根據(jù)經(jīng)驗(yàn)從實(shí)際噪聲中獲得的常數(shù)(考慮到噪聲的離差等)，或者可以是對(duì)每幀計(jì)算的變量。在下文中，^(/)是變量的情況被表示為計(jì)算示例1和2。作為計(jì)算示例1，在被隨后的噪聲/語音確定部42確定為噪聲分段的過去的分段中，初步計(jì)算輸入頻譜Xn(f)的離差值&(/)，以根據(jù)離差值 (/)計(jì)算校正系數(shù)""(/)?？梢杂?jì)算每頻率帶寬的離差值 (/)，或者可以在某個(gè)特定的帶寬中通過加權(quán)平均等計(jì)算離差值 (/)。作為用離差值^(/)計(jì)算校正系數(shù)^(/)的一個(gè)示例，可以利用下列方程A(/)""/)xcr"(/) 方程(5)系數(shù)^ (/)是通過實(shí)驗(yàn)獲得的經(jīng)驗(yàn)值。作為計(jì)算示例2，根據(jù)輸入頻譜Xn(f)與最小頻譜M。(f)之間的比率的
積分值Rxmn來計(jì)算校正系數(shù)^(/)。用下列方程來表示積分值Rxmn: ^^Hfe^) (L:頻率帶寬的數(shù)量) 方程(6)積分值Rxmn與圖5中的陰影區(qū)域的面積相對(duì)應(yīng)。在圖5 (1)示出的噪聲獨(dú)占分段中，積分值Rxnin很小，而在圖5 (2)示出的語音和噪聲的混合分段中，積分值Rxmn很大。因此，將校正系數(shù) (/)規(guī)定為例如圖6所示的積分值Rxmn的函數(shù)，基于瞬時(shí)噪聲計(jì)算的校正系數(shù)^(/)根據(jù)語音信號(hào)在輸入信號(hào)中的貢獻(xiàn)程度而改變，以使得可以估算更接近于實(shí)際情況的噪聲頻譜。此時(shí)，可以在某個(gè)特定的帶寬中計(jì)算積分值Rxm。。同樣，可以對(duì)頻率帶寬中的Rxm-l、 Rxm-2、 a-l(f)以及a-2(^使用不同的值，或者可以在某個(gè)特定的帶寬中使用相同的值。應(yīng)當(dāng)進(jìn)行適當(dāng)?shù)倪x擇，以便與實(shí)際的噪聲頻譜相對(duì)應(yīng)。從噪聲估算裝置3a輸出由瞬時(shí)噪聲估算部31這樣估算出的瞬時(shí)噪聲頻譜K(f)。同時(shí)，向分段確定裝置4a發(fā)送瞬時(shí)噪聲頻譜Nn(f)，分段確定裝置 4a具有噪聲/語音確定部42和用于噪聲/語音確定的參數(shù)計(jì)算部41a。用于噪聲/語音確定的參數(shù)計(jì)算部41a通過利用瞬時(shí)噪聲估算部31計(jì)算出的瞬時(shí)噪聲頻譜Nn(f)和來自頻域信號(hào)分析部2的輸入頻譜Xn(f)來計(jì)算用于分段確定的參數(shù)。作為用于分段確定的參數(shù)，根據(jù)例如輸入頻譜Xn(f)計(jì)算輸入信號(hào)的功率，并且根據(jù)瞬時(shí)噪聲頻譜Nn(f)計(jì)算瞬時(shí)噪聲的功率。根據(jù)各個(gè)功率計(jì)算出的信噪比SN^被用作用于分段確定的參數(shù)。同樣，根據(jù)輸入頻譜XJf)和瞬時(shí)噪聲頻譜Nn(f)計(jì)算出的每帶寬的信噪比的積分值R。等也可以被用作用于分段確定的參數(shù)?？梢杂孟铝蟹匠虂肀硎痉e分值Rn: 及》=§(^^1 (L:頻率帶寬的數(shù)量) 方程(7)/=0、應(yīng)當(dāng)注意，用于獲得積分值Rn的頻率的積分范圍可以被限于用于計(jì) 算的某個(gè)特定的帶寬。噪聲/語音確定部42通過對(duì)分段確定參數(shù)和閾值進(jìn)行比較來執(zhí)行分
段確定，并輸出確定結(jié)果vad—flag,該分段確定參數(shù)是由用于噪聲/語音確定的參數(shù)計(jì)算部41a計(jì)算的。也就是說，如果確定結(jié)果vad一flag是 FALSE,則意味著該幀是包括語音的混合分段，而如果確定結(jié)果va(^flag 是TRUE，則意味著該幀是沒有語音的噪聲分段。作為分段確定參數(shù)，可以使用由用于噪聲/語音確定的參數(shù)計(jì)算部 41a計(jì)算出的信噪比SNRn或者使用積分值R。。為了更有效的實(shí)現(xiàn)，可以將用于噪聲/語音確定的參數(shù)計(jì)算部41a設(shè)置為計(jì)算信噪比SNR。和積分值Rn兩者，其中，分段確定參數(shù)被計(jì)算為信噪比SNRn和積分值R^的函數(shù)，以用于確定。第二實(shí)施方式圖7示出了根據(jù)本發(fā)明的第二實(shí)施方式的信號(hào)處理裝置，該信號(hào)處理裝置用作噪聲估算裝置和噪聲分段確定裝置。以與根據(jù)第一實(shí)施方式的信號(hào)處理裝置相同的方式，該信號(hào)處理裝置包括時(shí)域信號(hào)提取部l、頻域信號(hào)分析部2、噪聲估算裝置3b、以及分段確定裝置4b。在該第二實(shí) 施方式中，與第一實(shí)施方式不同，未發(fā)生變化的瞬時(shí)噪聲頻譜不被假定為估算噪聲頻譜，而是被用來計(jì)算平均噪聲頻譜，該平均噪聲頻譜被輸出為估算噪聲頻譜。應(yīng)當(dāng)注意，具有與圖3中相同的標(biāo)號(hào)的塊與第一實(shí) 施方式中的塊相同，因此將在下文中省略對(duì)其的描述。也就是說，噪聲估算裝置3b中的平均噪聲估算部32b通過利用由瞬時(shí)噪聲估算部31計(jì)算出的瞬時(shí)噪聲頻譜Nn(f)來計(jì)算平均噪聲頻譜 ^(/)。在下文中，作為平均噪聲頻譜K(/)的實(shí)施方式，可以提及下列的計(jì)算1和2。作為計(jì)算示例1，通過利用FIR濾波器來計(jì)算平均噪聲頻譜此時(shí)，通過對(duì)包括當(dāng)前幀的過去的K幀的瞬時(shí)噪聲頻譜Nn(f)進(jìn)行加權(quán)平均來計(jì)算平均噪聲頻譜^(/)。這可以用下列方程來表示-<formula>formula see original document page 12</formula>方程(8)加權(quán)系數(shù)A(/)可以被設(shè)定為對(duì)于每一頻率不同的值。作為計(jì)算示例2，通過IIR濾波器來計(jì)算平均噪聲頻譜。此時(shí)，以瞬時(shí)噪聲頻譜Nn(f)的長(zhǎng)期平均來計(jì)算平均噪聲頻譜i^(/)。這可以用下列方
程來表示<formula>formula see original document page 13</formula>義(/):加權(quán)系數(shù) 方程(9)加權(quán)系數(shù);U/)可以被設(shè)定為對(duì)于每一頻率不同的值。已接收到由平均噪聲估算部32b這樣獲得的平均噪聲頻譜義(/)的用于噪聲/語音確定的參數(shù)計(jì)算部41b可以通過利用平均噪聲頻譜厭(/) 而不是瞬時(shí)噪聲頻譜Nn(f)來類似地計(jì)算在第一實(shí)施方式的用于噪聲/語音確定的參數(shù)計(jì)算部41a中描述的信噪比SNRn和每頻帶的信噪比的積分值R。。噪聲/語音確定部42中的后續(xù)處理與第一實(shí)施方式中的相同。第三實(shí)施方式圖8示出了本發(fā)明的第三實(shí)施方式的用作噪聲估算裝置和噪聲分段確定裝置的信號(hào)處理裝置。以與根據(jù)第一實(shí)施方式的信號(hào)處理裝置相同的方式，該信號(hào)處理裝置包括時(shí)域信號(hào)提取部l、頻域信號(hào)分析部2、噪聲估算裝置3c、以及分段確定裝置4c。然而，該實(shí)施方式與第二實(shí)施方式的不同之處在于，被確定為噪聲分段的分段的輸入頻譜未發(fā)生變化地用于后續(xù)幀中的平均噪聲頻譜的計(jì)算。應(yīng)當(dāng)注意，具有與圖3中相同的標(biāo)號(hào)的塊與第一實(shí)施方式中的塊相同，因此將在下文中省略對(duì)其的描述。平均噪聲估算部32c計(jì)算平均噪聲頻譜F"(/)。為了計(jì)算平均噪聲頻譜<(/)，在分段確定裝置4c中通過利用輸入頻譜Xn(f)和直到最后一幀的平均噪聲頻譜^_,(/)來執(zhí)行分段確定。結(jié)果，在被確定為混合分段(vad_flag=FALSE)的分段中利用瞬時(shí) 噪聲頻譜Nn(f)來計(jì)算平均噪聲頻譜^(/)，并且在被確定為噪聲分段(vad一flag-TRUE)的分段中利用輸入頻譜Xn(f)來計(jì)算平均噪聲頻譜、(/)。也就是說，當(dāng)確定結(jié)果表示噪聲分段時(shí)，輸入信號(hào)是噪聲分量本身，因此如上所述，只需要利用輸入頻譜而不需要利用瞬時(shí)噪聲頻譜。用于噪聲/語音確定的參數(shù)計(jì)算部41c通過用在平均噪聲估算部32c 中計(jì)算的直到最后一幀的平均噪聲頻譜^^(/)代替瞬時(shí)噪聲頻譜Nn(f)來計(jì)算由第一實(shí)施方式的用于噪聲/語音確定的參數(shù)計(jì)算部41a計(jì)算的信噪比SNR。和每頻帶的信噪比的積分值Rn。第四實(shí)施方式(噪聲抑制裝置)圖9示出了根據(jù)本發(fā)明的第四實(shí)施方式的用作噪聲抑制裝置的信號(hào) 處理裝置。該噪聲抑制裝置包括時(shí)域信號(hào)提取部l、頻域信號(hào)分析部2、噪聲估算裝置3a、以及分段確定裝置4a，這些組件都已在根據(jù)第一實(shí)施方式的信號(hào)處理裝置中進(jìn)行了描述。根據(jù)第四實(shí)施方式的噪聲抑制裝置進(jìn)一步具有抑制量計(jì)算部5、抑制部6、以及時(shí)域信號(hào)合成部7。首先，頻域信號(hào)分析部2通過利用FFT來產(chǎn)生輸入頻譜Xn(f)。抑制量計(jì)算部5通過利用由頻域信號(hào)分析部2計(jì)算出的輸入頻譜X"f)和由瞬時(shí)噪聲估算部31計(jì)算出的瞬時(shí)噪聲頻譜Nn(f)來計(jì)算每帶寬的抑制系數(shù) Gn(f)。通過下列方程來計(jì)算抑制系數(shù)Gn(f):G (/)《(/)(0<G (/)<1) 方程(10)應(yīng)當(dāng)注意，當(dāng)噪聲/語音確定部42中的確定結(jié)果vad_flag表示混合分段時(shí)，減小方程(10)中的系數(shù)Wn(f)，并且當(dāng)確定結(jié)果表示噪聲分段時(shí)，增大系數(shù)Wn①，從而使得噪聲分段中的抑制系數(shù)變得大于混合分段中的抑制系數(shù)。因此，可以增加抑制量。抑制部6通過利用輸入頻譜Xn(f)和由抑制量計(jì)算部5計(jì)算出的抑制系數(shù)Gn(f)而在噪聲抑制后計(jì)算每帶寬的振幅譜Yn(f)。通過下列方程計(jì)算振幅譜Y。(f):K(/) = I (/)x(7 (/) 方程(11)時(shí)域信號(hào)合成部7通過IFFT (快速傅立葉逆變換)把振幅譜Yn(f) 從頻域逆變換到時(shí)域，以計(jì)算輸出信號(hào)y。(t)。雖然圖9利用了第一實(shí)施方式中示出的噪聲估算裝置3a和分段確定裝置4a，但是也可以利用在第二實(shí)施方式和第三實(shí)施方式中示出的噪聲估算裝置3a和分段確定裝置4a。此時(shí)，抑制量計(jì)算部5通過用平均噪聲頻譜<(/)代替瞬時(shí)噪聲頻譜Nn(f)來計(jì)算抑制系數(shù)Gn(f)。雖然已通過上述的實(shí)施方式對(duì)本發(fā)明進(jìn)行了詳細(xì)描述，但是顯而易見的是，本發(fā)明不限于上述實(shí)施方式。在不脫離權(quán)利要求的描述所確定的目的和范圍的情況下，本發(fā)明的裝置可以被實(shí)現(xiàn)為經(jīng)修正的和經(jīng)修改
的方式。例如，在根據(jù)本發(fā)明的第四實(shí)施方式的噪聲抑制裝置中，當(dāng)用FIR濾波器計(jì)算出的每帶寬的輸入幅值之(!')代替用FFT計(jì)算出的輸入頻譜Xn(f)時(shí)，可以通過利用與每帶寬的輸入幅值相對(duì)應(yīng)的逆變換而不是IFFT來計(jì)算時(shí)域的輸出信號(hào)yn(t)。
權(quán)利要求
1、一種信號(hào)處理方法，該信號(hào)處理方法包括時(shí)域信號(hào)提取步驟，用于提取時(shí)域信號(hào)，所述時(shí)域信號(hào)是輸入信號(hào)的抽樣數(shù)據(jù)；頻域信號(hào)分析步驟，用于按幀將所述時(shí)域信號(hào)轉(zhuǎn)換成頻域信號(hào)并計(jì)算輸入頻譜；以及噪聲估算步驟，用于通過利用所述輸入頻譜的最小分量來估算噪聲頻譜，所述噪聲頻譜是包括在所述輸入信號(hào)中的噪聲分量的頻域信號(hào)。
2、根據(jù)權(quán)利要求1所述的信號(hào)處理方法，其中，所述噪聲估算步驟包括獲得每幀的瞬時(shí)噪聲頻譜作為所述噪聲頻譜。
3、根據(jù)權(quán)利要求2所述的信號(hào)處理方法，其中，所述噪聲估算步驟包括獲得多個(gè)幀的瞬時(shí)噪聲頻譜的平均噪聲頻譜作為所述噪聲頻譜。
4、根據(jù)權(quán)利要求1到3中的任意一項(xiàng)所述的信號(hào)處理方法，該方法還包括分段確定步驟，用于對(duì)所述噪聲頻譜與所述輸入頻譜進(jìn)行比較，并確定所述幀是在混合了語音和噪聲的分段中還是在沒有語音的噪聲分段中。
5、根據(jù)權(quán)利要求4所述的信號(hào)處理方法，其中，當(dāng)在所述分段確定步驟中直到最后一幀的確定結(jié)果表示混合分段時(shí)，所述噪聲估算步驟包括通過利用所述瞬時(shí)噪聲頻譜來獲得所述平均噪聲頻譜，而當(dāng)所述確定結(jié)果表示噪聲分段時(shí)，所述噪聲估算步驟包括通過利用所述輸入頻譜來獲得所述平均噪聲頻譜。
6、根據(jù)權(quán)利要求4所述的信號(hào)處理方法，該方法還包括抑制量計(jì)算步驟，用于考慮了所述分段確定步驟的確定結(jié)果的情況下，基于所述噪聲頻譜和所述輸入頻譜對(duì)所述輸入信號(hào)計(jì)算每帶寬的抑制量，并抑制所述輸入信號(hào)的噪聲。
7、根據(jù)權(quán)利要求1到6中的任意一項(xiàng)所述的信號(hào)處理方法，其中，所述輸入信號(hào)包括語音信號(hào)。
8、一種信號(hào)處理裝置，該信號(hào)處理裝置包括時(shí)域信號(hào)提取部，用于提取時(shí)域信號(hào)，所述時(shí)域信號(hào)是輸入信號(hào)的抽樣數(shù)據(jù)；頻域信號(hào)分析部，用于按幀將所述時(shí)域信號(hào)轉(zhuǎn)換成頻域信號(hào)并計(jì)算輸入頻譜；以及噪聲估算部，用于通過利用所述輸入頻譜的最小分量來估算噪聲頻譜，所述噪聲頻譜是包括在所述輸入信號(hào)中的噪聲分量的頻域信號(hào)。
9、根據(jù)權(quán)利要求8所述的信號(hào)處理裝置，其中，所述噪聲估算部獲得每幀的瞬時(shí)噪聲頻譜作為所述噪聲頻譜。
10、根據(jù)權(quán)利要求9所述的信號(hào)處理裝置，其中，所述噪聲估算部獲得多個(gè)幀的瞬時(shí)噪聲頻譜的平均噪聲頻譜作為所述噪聲頻譜。
11、根據(jù)權(quán)利要求8到10中的任意一項(xiàng)所述的信號(hào)處理裝置，該信號(hào)處理裝置還包括分段確定部，用于對(duì)所述噪聲頻譜和所述輸入頻譜進(jìn) 行比較，并確定所述幀是在混合了語音和噪聲的分段中還是在沒有語音的噪聲分段中。
12、根據(jù)權(quán)利要求ll所述的信號(hào)處理裝置，其中，當(dāng)在所述分段確定部中直到最后一幀的確定結(jié)果表示混合分段時(shí)，所述噪聲估算部通過利用所述瞬時(shí)噪聲頻譜來獲得所述平均噪聲頻譜，而當(dāng)所述確定結(jié)果表示噪聲分段時(shí)，所述噪聲估算部通過利用所述輸入頻譜來獲得所述平均噪聲頻譜。
13、根據(jù)權(quán)利要求11所述的信號(hào)處理裝置，該信號(hào)處理裝置還包括抑制量計(jì)算部，用于在考慮了所述分段確定部的確定結(jié)果情況下，基于所述噪聲頻譜和所述輸入頻譜對(duì)所述輸入信號(hào)計(jì)算每帶寬的抑制量，并抑制所述輸入信號(hào)的噪聲。
14、根據(jù)權(quán)利要求8到13中的任意一項(xiàng)所述的信號(hào)處理裝置，其中，所述輸入信號(hào)包括語音信號(hào)。
全文摘要
本發(fā)明提供了一種信號(hào)處理方法和裝置，該信號(hào)處理方法和裝置在噪聲電平的急劇上升分段中提高了所估算的噪聲的跟蹤速度，并且在語音分段中很少產(chǎn)生由于語音的影響而導(dǎo)致的噪聲頻譜的估算誤差，在該信號(hào)處理方法和裝置中，提取作為輸入信號(hào)的抽樣數(shù)據(jù)的時(shí)域信號(hào)，按幀將該時(shí)域信號(hào)轉(zhuǎn)換成頻域信號(hào)，并計(jì)算輸入頻譜。此外，獲得輸入頻譜的最小值，以估算噪聲頻譜，所述噪聲頻譜是包括在輸入語音信號(hào)中的噪聲分量的頻域信號(hào)。此外，將該輸入頻譜與該噪聲頻譜進(jìn)行比較，以確定分段是在噪聲分段還是混合了語音與噪聲的混合分段中。
文檔編號(hào)G10L21/00GK101111888SQ20058004760
公開日2008年1月23日申請(qǐng)日期2005年2月2日優(yōu)先權(quán)日2005年2月2日
發(fā)明者大田恭士, 大谷猛, 松原光良, 遠(yuǎn)藤香緒里申請(qǐng)人:富士通株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載