專利名稱:噪音抑制裝置以及聲音解碼裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對混入到聲音/音響信號中的噪音進(jìn)行抑制的噪音抑制裝置以及具 備噪音抑制裝置的聲音解碼裝置。
背景技術(shù):
作為如下噪音抑制處理的代表性的方法,例如有SS(SpeCtral Subtraction 譜 減)法,其中,所述噪音抑制處理為通過從混入了噪音的輸入信號中抑制作為目標(biāo)外信號 的噪音,從而強調(diào)作為目標(biāo)信號的聲音信號等。在SS法中,通過從振幅譜中減去另行推測 的平均的噪音譜,由此進(jìn)行噪音抑制(例如,參照非專利文獻(xiàn)1)。在進(jìn)行了 SS法等噪音抑制處理的情況下,噪音譜的推測誤差作為失真而殘留于 噪音抑制處理后的信號中,這具有與處理前的信號大不相同的特性,并且作為刺耳的噪音 (還稱為人工的噪音、樂音(musical tone))而出現(xiàn),所以往往會使輸出信號的主觀質(zhì)量大 幅劣化(變差)。另外,如果提高聲音以及音樂聲(musical sound)等聲音音響編碼方式的壓縮率, 則與編碼時的量化噪音以及符號模型化相伴的譜失真逐漸增大,輸出信號的主觀質(zhì)量大幅 劣化。特別是在聲音音響信號中混入噪音的情況以及在輸入信號中僅存在噪音的情況下, 編碼方式所利用的聲音模型、與背景噪音的模型大不相同,所以其劣化變得顯著。另外,背 景噪音區(qū)間中的這些劣化感像“沙沙(〉->〉->) ”這樣的水流聲,有時被稱為水流噪 音(Water Flow Noise)。作為對所述那樣的主觀性的劣化感進(jìn)行抑制的以往的方法,例如有專利文獻(xiàn)1公 開的技術(shù)。在專利文獻(xiàn)1的音信號加工方法中,以在聽覺上減輕由于噪音抑制處理、低比特 率聲音編碼處理而產(chǎn)生的失真感為目的,根據(jù)由聲音/噪音狀態(tài)判別單元求出的信號中 的噪音比率的推測值,對輸入信號與將輸入信號進(jìn)行平滑化而得到的加工信號進(jìn)行加權(quán)相 加,從而以包含大量背景噪音等劣化成分的區(qū)間為中心來改善主觀質(zhì)量。非專利文獻(xiàn) 1 :Steven F. Boll “Suppression of Acoustic noise in speech using spectral subtraction", IEEE Trans. ASSP, Vol. ASSP-27, No. 2, April 1979專利文獻(xiàn)1 :日本特開2004-272^2號公報(第14頁 第16頁、圖4)以往的噪音抑制裝置如上所述構(gòu)成,所以存在如下課題輸入信號和加工信號的 加權(quán)相加控制依賴于聲音/噪音狀態(tài)判別單元,如果聲音區(qū)間檢測失敗而在包含聲音的區(qū) 間進(jìn)行加工,則產(chǎn)生回聲感(回音感)、噪音感而使質(zhì)量顯著劣化。另外,在以往的噪音抑制裝置中,為了減輕區(qū)間判定錯誤的影響,還舉出了使用連 續(xù)量的區(qū)間判定評價值的改善對策,但評價值自身是基于時域中的分析結(jié)果的值,對于頻 域是一定值。因此,存在如下課題例如,在噪音功率集中于低頻那樣的汽車行駛噪音混入 了的聲音信號中,如果以對低頻的噪音的劣化感進(jìn)行抑制的方式調(diào)整評價值的閾值,則會 錯誤地加工功率相對地比噪音信號大的高頻的聲音信號而導(dǎo)致質(zhì)量劣化,相反,如果進(jìn)行不會發(fā)現(xiàn)高頻的聲音信號的失真這樣的調(diào)整,則幾乎得不到改善效果。另外,在以往的噪音抑制裝置中,雖然在譜區(qū)域中針對每個頻率成分控制著加權(quán) 相加,但控制要素僅是輸入信號的振幅譜成分的大小,而并未針對每個頻率成分來判定是 聲音還是噪音,其結(jié)果,輸入信號是否是聲音(或者音樂聲)這較大地依賴于時域中的區(qū)間 判定評價值,如果錯誤地進(jìn)行其區(qū)間判定,則質(zhì)量劣化的狀況不會改變。本發(fā)明是為了解決所述課題而完成的,目的在于提供一種可以實現(xiàn)聽覺上理想的 噪音抑制并且即使在高噪音下質(zhì)量劣化也少的噪音抑制裝置以及具備該噪音抑制裝置的 高質(zhì)量的聲音解碼裝置。本發(fā)明的噪音抑制裝置,具備時間/頻率變換部,將輸入信號變換為作為頻率成 分的輸入信號譜;噪音譜推測部,根據(jù)輸入信號來推測推測噪音譜;噪音譜抑制部,根據(jù)推 測噪音譜進(jìn)行輸入信號譜的噪音抑制,生成噪音抑制譜;信號變形部,生成根據(jù)基于噪音抑 制譜和推測噪音譜的比而使噪音抑制譜變形并且平滑化了的加工譜;以及信號加法部,對 噪音抑制譜相加加工譜,來抑制該噪音抑制譜中包含的劣化成分。由此,具有如下效果不會由于區(qū)間判定錯誤而產(chǎn)生回聲感以及噪音感,可以針對 每個譜成分改善主觀質(zhì)量。另外,本發(fā)明的聲音解碼裝置,具備聲音解碼部,對規(guī)定的編碼數(shù)據(jù)進(jìn)行解碼而 生成解碼信號;時間/頻率變換部,將解碼信號變換為作為頻率成分的解碼信號譜;噪音譜 推測部,根據(jù)解碼信號來推測推測噪音譜;信號變形部,生成根據(jù)基于解碼信號譜和推測噪 音譜的比而使解碼信號譜變形并且平滑化了的加工譜;以及信號加法部,對解碼信號譜相 加加工譜,來抑制該解碼信號譜中包含的劣化成分。由此,具有如下效果不會由于區(qū)間判定錯誤而產(chǎn)生回聲感以及噪音感,可以針對 每個譜成分改善主觀質(zhì)量。
圖1是本發(fā)明的實施方式1的噪音抑制裝置的整體結(jié)構(gòu)圖。圖2是示出本發(fā)明的實施方式1記載的信號加工部中的一系列的處理內(nèi)容的動作 說明圖,是對某個頻率的振幅譜和相位譜進(jìn)行矢量化而表現(xiàn)的圖。圖3是說明本發(fā)明的實施方式1記載的信號加工部中的一系列的處理的曲線圖, 示出典型的情況下的譜。圖4(a)是示出本發(fā)明的實施方式1記載的信號加工部中的一系列的處理內(nèi)容的 動作說明圖,示出對圖3的區(qū)域B的頻率的振幅譜和相位譜進(jìn)行矢量化而表現(xiàn)的結(jié)果。圖4(b)是示出本發(fā)明的實施方式1記載的信號加工部中的一系列的處理內(nèi)容的 動作說明圖,示出對圖3的區(qū)域C的頻率的振幅譜和相位譜進(jìn)行矢量化而表現(xiàn)的結(jié)果。圖5是本發(fā)明的實施方式2的噪音抑制裝置的整體結(jié)構(gòu)圖。圖6是示出本發(fā)明的實施方式2記載的信號加工部中的一系列的處理內(nèi)容的動作 說明圖,是對某個頻率的振幅譜和相位譜進(jìn)行矢量化而表現(xiàn)的圖。圖7是本發(fā)明的實施方式4的噪音抑制裝置的整體結(jié)構(gòu)圖。圖8是本發(fā)明的實施方式5的聲音解碼裝置的整體結(jié)構(gòu)圖。圖9是本發(fā)明的實施方式6的聲音解碼裝置的整體結(jié)構(gòu)圖。
圖10是本發(fā)明的實施方式8的噪音抑制裝置的整體結(jié)構(gòu)圖。圖11是本發(fā)明的實施方式9的聲音解碼裝置的整體結(jié)構(gòu)圖。圖12是本發(fā)明的實施方式10的聲音解碼裝置的整體結(jié)構(gòu)圖。
具體實施例方式以下,為了進(jìn)一步詳細(xì)說明本發(fā)明,參照附圖來說明用于實施本發(fā)明的優(yōu)選方式。實施方式1.圖1是示出本實施方式的噪音抑制裝置100的整體結(jié)構(gòu)的圖。圖1所示的噪音抑制裝置100包括時間/頻率變換部2、噪音抑制部3、信號加工 部4、頻率/時間變換部5。噪音抑制部3包括噪音譜抑制部7和噪音譜推測部8,其中,該 噪音譜推測部8包括聲音/噪音判定部9以及噪音譜更新部10。信號加工部4包括信號 加法部11、振幅平滑部12以及信號變形部13,其中,該信號變形部13包括加工成分計算部 14以及相位加擾部15。以下,根據(jù)圖1,說明噪音抑制裝置100的動作原理。首先,以規(guī)定的采樣頻率(例如,8kHz)進(jìn)行了采樣、并以規(guī)定的幀周期(例如, 20msec)進(jìn)行了幀分割的輸入信號1被輸入到噪音抑制裝置100內(nèi)的時間/頻率變換部2 和后述說明的噪音譜推測部8內(nèi)部的聲音/噪音判定部9。時間/頻率變換部2對所述的被分割為幀周期的輸入信號1進(jìn)行加窗處理,并對 加窗后的信號,使用例如256點的FFTpast Fourier Transform 快速傅立葉變換),變換 為每個頻率的譜成分即輸入信號譜16。時間/頻率變換部2將該輸入信號譜16分別輸出 到噪音抑制部3內(nèi)部的噪音譜抑制部7和噪音譜推測部8、信號加工部4內(nèi)部的振幅平滑部 12。在加窗處理中,例如可以使用漢寧窗(Harming window)、梯形窗等公知的方法。另外, 由于FFT是公知的方法,所以省略說明。在噪音抑制部3中,噪音譜抑制部7使用從后述說明的噪音譜推測部8輸入的推 測噪音譜17,對從時間/頻率變換部2輸入的輸入信號譜16進(jìn)行噪音抑制處理,將所得到 的結(jié)果作為噪音抑制譜18而輸出到信號加工部4內(nèi)部的信號加法部11和加工成分計算部 14。此處,作為噪音譜抑制部7中的噪音抑制處理的方法,除了例如非專利文獻(xiàn)1記載 那樣的基于譜減法的方法、以及根據(jù)輸入信號譜16和推測噪音譜17的每個頻率的信噪比 (SN比)對每個譜成分提供衰減量的譜振幅抑制等公知的方法以外,還可以使用將譜減法 和譜振幅抑制進(jìn)行了組合的方法(例如,專利第34M190號“噪音抑制裝置以及方法”記載 的方法)等。信號加工部4根據(jù)噪音抑制后的輸入信號譜即噪音抑制譜18和推測噪音譜17的 形態(tài),進(jìn)行噪音抑制譜18中的劣化成分的加工處理以使在聽覺方面變得理想。具體而言, 使用噪音譜抑制部7輸出的噪音抑制譜18和噪音譜推測部8輸出的推測噪音譜17,由信 號變形部13生成加工譜19,并由信號加法部11對噪音譜18相加加工譜19而生成加法譜 20。然后,振幅平滑部12在時間方向以及頻率方向上對加法譜20進(jìn)行平滑化,生成以使在 聽覺方面變得理想的方式進(jìn)行了平滑化加工的平滑化噪音抑制譜21而輸出到頻率/時間 變換部5。在后面詳述信號加工部4的處理。
頻率/時間變換部5通過對從信號加工部4輸入的平滑化噪音抑制譜21進(jìn)行逆 FFT處理而恢復(fù)到時域信號,一邊進(jìn)行用于與前后幀的平滑連接的加窗處理一邊進(jìn)行連接, 并將所得到的信號作為輸出信號6而輸出。噪音譜推測部8進(jìn)行輸入信號1中的平均的噪音譜的推測。首先,聲音/噪音判 定部9使用輸入信號1、時間/頻率變換部2輸出的輸入信號譜16、以及根據(jù)過去的幀而推 測出的推測噪音譜17,計算像聲音的信號VAD。像聲音的信號VAD表示當(dāng)前幀的輸入信號1 是否是聲音或者噪音的程度,例如,是在聲音的可能性高的情況下取大的評價值、并在聲音 的可能性低的情況下取小的評價值的信號。作為像聲音的信號VAD的計算方法,聲音/噪音判定部9例如可以分別單獨或者 組合使用輸入信號1的自相關(guān)分析的最大值、以及可以根據(jù)輸入信號1的功率與推測噪音 譜17的功率之比來計算的幀SN比。此處,關(guān)于式(1)、幀SN比SNRft,可以通過式⑵分別 計算輸入信號1的自相關(guān)分析結(jié)果的最大值A(chǔ)CFmax。
此處,x(t)是時間t下的幀分割后的輸入信號1,N是自相關(guān)分析區(qū)間長度,S(k) 是輸入信號譜16的第k個成分,N(k)是推測噪音譜17的第k個成分,M是FFT點數(shù)。可以根據(jù)通過所述式⑴求出的自相關(guān)分析的最大值A(chǔ)CFmax、和通過式⑵求出的 幀SN比SNRft,例如通過下式(3)來計算像聲音的信號VAD。VAD = wACF · ACFfflax+wSNE · SNRfr · SNRnorm (3)此處,SNRnorm是用于將SNRft的值標(biāo)準(zhǔn)化到0 1范圍內(nèi)的規(guī)定的值、wAeF以及wSNK 是用于加權(quán)的規(guī)定的值,分別根據(jù)噪音的種類或者噪音的功率,以可以適合地判定像聲音 的信號VAD的方式預(yù)先調(diào)整即可。另外,ACFmax根據(jù)所述式(1)的性質(zhì),取0 1的范圍的 值。聲音/噪音判定部9將通過以上所示的處理而計算出的用于噪音譜推測的像聲音的信 號VAD輸出到噪音譜更新部10。另外,在所述式(3)中,通過將或者wSNK的值中的某一個設(shè)定為0,還可以單獨 利用設(shè)定為0以外的一方的參數(shù)來計算出像聲音的信號VAD。具體而言,在將wSNK設(shè)成 的 情況下,僅利用自相關(guān)分析的最大值A(chǔ)CFmax就求出像聲音的信號VAD。另一方面,在像聲音的信號VAD的計算中,還可以追加所述式C3)所示的指標(biāo)/值 以外的分析參數(shù)。例如,可以追加如下等各種改善、變更聲音/噪音判定部9使用輸入信 號譜16和推測噪音譜17,計算出每個頻率的譜成分的SN比,利用取該每個頻率的譜成分的 SN比的總和而得到的值(總和越大,聲音的可能性越高)、或者利用每個頻率的譜成分的SN 比的方差(方差(variance)越大,越是出現(xiàn)聲音的諧波構(gòu)造,聲音的可能性越高)。噪音譜更新部10參照聲音/噪音判定部9的輸出即像聲音的信號VAD,在當(dāng)前幀 的輸入信號1的形態(tài)是噪音的可能性高的情況下,使用當(dāng)前幀的輸入信號譜16,更新從內(nèi) 部存儲器等中保存的過去的幀推測出的推測噪音譜17。噪音譜更新部10例如按照下式(4)將輸入信號譜16反映到推測噪音譜17從而進(jìn)行更新。
權(quán)利要求
1.一種噪音抑制裝置,具備時間/頻率變換部,將輸入信號變換為作為頻率成分的輸入信號譜; 噪音譜推測部,根據(jù)所述輸入信號來推測推測噪音譜;噪音譜抑制部,根據(jù)所述推測噪音譜進(jìn)行所述輸入信號譜的噪音抑制,生成噪音抑制譜;信號變形部,生成根據(jù)基于所述噪音抑制譜和所述推測噪音譜的比而使所述噪音抑制 譜變形并且平滑化了的加工譜;以及信號加法部,對所述噪音抑制譜相加所述加工譜,來抑制該噪音抑制譜中包含的劣化 成分。
2.根據(jù)權(quán)利要求1所述的噪音抑制裝置,其特征在于, 信號變形部生成進(jìn)行了頻率軸方向的加權(quán)的加工譜。
3.一種噪音抑制裝置,具備時間/頻率變換部,將輸入信號變換為作為頻率成分的輸入信號譜; 噪音譜推測部,根據(jù)所述輸入信號來推測推測噪音譜;噪音譜抑制部,根據(jù)所述推測噪音譜進(jìn)行所述輸入信號譜的噪音抑制,生成噪音抑制譜;信號變形部,生成根據(jù)基于所述噪音抑制譜和所述推測噪音譜的比而使所述噪音抑制 譜變形了的變形噪音抑制譜,并且生成對該變形噪音抑制譜進(jìn)行了平滑化的加工譜; 信號減法部,從所述噪音抑制譜減去所述變形噪音抑制譜;以及 信號加法部,對由所述信號減法部減去了所述變形噪音抑制譜后的所述噪音抑制譜相 加所述加工譜,來抑制該噪音抑制譜中包含的劣化成分。
4.根據(jù)權(quán)利要求3所述的噪音抑制裝置,其特征在于, 信號變形部生成進(jìn)行了頻率軸方向的加權(quán)的加工譜。
5.一種噪音抑制裝置,具備時間/頻率變換部,將輸入信號變換為作為頻率成分的輸入信號譜; 噪音譜推測部,根據(jù)所述輸入信號來推測推測噪音譜;噪音譜抑制部,根據(jù)所述推測噪音譜進(jìn)行所述輸入信號譜的噪音抑制,生成噪音抑制 譜;以及相位加擾部,以與基于所述噪音抑制譜和所述推測噪音譜的比對應(yīng)的程度,對所述噪 音抑制譜的相位進(jìn)行加擾。
6.根據(jù)權(quán)利要求5所述的噪音抑制裝置,其特征在于, 相位加擾部求出進(jìn)行了頻率軸方向的加權(quán)的相位加擾的程度。
7.一種聲音解碼裝置,具備聲音解碼部,對規(guī)定的編碼數(shù)據(jù)進(jìn)行解碼而生成解碼信號;時間/頻率變換部,將所述解碼信號變換為作為頻率成分的解碼信號譜;噪音譜推測部,根據(jù)所述解碼信號來推測推測噪音譜;信號變形部,生成根據(jù)基于所述解碼信號譜和所述推測噪音譜的比而使所述解碼信號 譜變形并且平滑化了的加工譜;以及信號加法部,對所述解碼信號譜相加所述加工譜,來抑制該解碼信號譜中包含的劣化成分。
8.根據(jù)權(quán)利要求7所述的聲音解碼裝置,其特征在于, 信號變形部生成進(jìn)行了頻率軸方向的加權(quán)的加工譜。
9.一種聲音解碼裝置,具備聲音解碼部,對規(guī)定的編碼數(shù)據(jù)進(jìn)行解碼而生成解碼信號;時間/頻率變換部,將所述解碼信號變換為作為頻率成分的解碼信號譜;噪音譜推測部,根據(jù)所述解碼信號來推測推測噪音譜;信號變形部,生成根據(jù)基于所述解碼信號譜和所述推測噪音譜的比而使所述解碼信號 譜變形了的變形解碼信號譜,并且生成對該變形解碼信號譜進(jìn)行了平滑化的加工譜; 信號減法部,從所述解碼信號譜減去所述變形解碼信號譜;以及 信號加法部,對由所述信號減法部減去了所述變形解碼信號譜后的所述解碼信號譜相 加所述加工譜,來抑制該解碼信號譜中包含的劣化成分。
10.根據(jù)權(quán)利要求9所述的聲音解碼裝置,其特征在于, 信號變形部生成進(jìn)行了頻率軸方向的加權(quán)的加工譜。
11.一種聲音解碼裝置,具備聲音解碼部,對規(guī)定的編碼數(shù)據(jù)進(jìn)行解碼而生成解碼信號;時間/頻率變換部,將所述解碼信號變換為作為頻率成分的解碼信號譜;噪音譜推測部,根據(jù)所述解碼信號來推測推測噪音譜;以及相位加擾部,以與基于所述解碼信號譜和所述推測噪音譜的比對應(yīng)的程度,對所述解 碼信號譜的相位進(jìn)行加擾。
12.根據(jù)權(quán)利要求11所述的聲音解碼裝置,其特征在于, 相位加擾部求出進(jìn)行了頻率軸方向的加權(quán)的相位加擾的程度。
全文摘要
加工成分計算部(14)根據(jù)噪音抑制譜(18)與推測噪音譜(17)之比求出變形噪音抑制譜(18a),而且相位加擾部(15)進(jìn)行相位加擾,得到在主觀上察覺不到噪音抑制譜(18)中包含的劣化成分的作為平滑化成分的加工譜(19)。信號加法部(11)對由于噪音抑制部(3)的噪音抑制處理而劣化了的噪音抑制譜(18)的頻率成分相加加工譜(19)來抑制劣化成分。
文檔編號G10L21/02GK102150206SQ20088013105
公開日2011年8月10日 申請日期2008年10月24日 優(yōu)先權(quán)日2008年10月24日
發(fā)明者古田訓(xùn), 田崎裕久 申請人:三菱電機株式會社