欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于音頻信號(hào)處理的方法和裝置的制作方法

文檔序號(hào):2830894閱讀:254來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):用于音頻信號(hào)處理的方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及音頻信號(hào)處理方法和裝置,用于產(chǎn)生通過(guò)加強(qiáng)輸入音頻信 號(hào)的目標(biāo)語(yǔ)音信號(hào)而獲得的語(yǔ)音信號(hào)。
背景技術(shù)
當(dāng)在實(shí)際環(huán)境中使用語(yǔ)音識(shí)別技術(shù)時(shí),環(huán)境噪聲會(huì)對(duì)識(shí)別率產(chǎn)生巨大 影響。例如,在汽車(chē)內(nèi)部,存在許多非語(yǔ)音噪聲,例如汽車(chē)的引擎音、風(fēng) 噪聲、迎面而來(lái)的汽車(chē)和超車(chē)汽車(chē)的聲音、以及汽車(chē)音頻設(shè)備的聲音。這 些噪聲混合在說(shuō)話者的語(yǔ)音中,并被輸入到語(yǔ)音識(shí)別器,造成識(shí)別率大幅 降低。一種用于解決這樣的噪聲問(wèn)題的方法是利用麥克風(fēng)陣列,其是一種噪 聲抑制技術(shù)。麥克風(fēng)陣列是用于信號(hào)處理從多個(gè)麥克風(fēng)輸入的音頻信號(hào)以 輸出加強(qiáng)的目標(biāo)語(yǔ)音的系統(tǒng)。采用麥克風(fēng)陣列的噪聲抑制4支術(shù)在免提裝置 中是有效的。在聲學(xué)環(huán)境中,方向性是噪聲的一個(gè)特性。例如,干擾說(shuō)話者的話音 被作為方向性噪聲,并具有噪聲到達(dá)方向可知的特點(diǎn)。另一方面,非方向 性噪聲(稱(chēng)為擴(kuò)散噪聲)是不能以特定的方向確定到達(dá)方向的噪聲。在許 多情況下,實(shí)際環(huán)境中的噪聲具有介于方向性噪聲與擴(kuò)散噪聲之間的中間 特性。通常,可以沿機(jī)搶方向聽(tīng)到引擎的聲音,但是其并不具有能夠確定 一個(gè)方向的強(qiáng)的方向性。由于麥克風(fēng)陣列通過(guò)采用多個(gè)通道的音頻信號(hào)的到達(dá)時(shí)間之間的差異 來(lái)進(jìn)行噪聲抑制,因此即使通過(guò)很少的麥克風(fēng),也可以預(yù)期對(duì)方向性噪聲 的顯著的噪聲抑制效果。另一方面,對(duì)于擴(kuò)散噪聲,噪聲抑制效果不顯著。 例如,可以通過(guò)同步加成來(lái)抑制擴(kuò)散噪聲,但是為獲得足夠的噪聲抑制多個(gè)麥克風(fēng)是必要的,使得同步加成是不實(shí)際的。此外,在實(shí)際環(huán)境中,存在聲音混響的問(wèn)題。歸因于聲音混響通過(guò)多 次被反射回墻壁表面來(lái)觀測(cè)在封閉空間中發(fā)射的聲音。因此,目標(biāo)信號(hào)將從不同于直達(dá)波(direct wave)的至!jii方向的方向至!]ii麥克雙,4吏4f"聲源、 的方向變得不穩(wěn)定。結(jié)果,存在這樣的問(wèn)題,麥克風(fēng)陣列抑制方向性噪聲 變得困難,并且不應(yīng)被抑制的目標(biāo)語(yǔ)音信號(hào)也將部分地被作為方向性噪聲 而消除。換言之,出現(xiàn)了"目標(biāo)語(yǔ)音消除"問(wèn)題。JP-A 2007-10897(KOKAI)公開(kāi)了基于這樣的聲音混響條件的麥克風(fēng) 陣列技術(shù)。將可以獲得麥克風(fēng)陣列的濾波系數(shù),其包括在預(yù)先假定的聲學(xué) 環(huán)境中的聲音混響的影響。在麥克風(fēng)陣列的實(shí)際使用中,基于源自輸入信 號(hào)的特征量來(lái)選擇濾波系數(shù)。也就是,JP-A2007-10897(KOKAI)公開(kāi)了一 種所謂的學(xué)習(xí)型陣列的技術(shù)。該方法可以充分抑制聲音混響中的方向性噪 聲,并可以同樣避免"目標(biāo)語(yǔ)音消除"問(wèn)題。然而,JP-A 2007-10897(KOKAI) 中公開(kāi)的現(xiàn)有技術(shù)不能使用方向性抑制擴(kuò)散噪聲。即使采用在JP-A 2007-10897(KOKAI)中公開(kāi)的技術(shù),噪聲抑制效果仍不夠充分。本發(fā)明旨在通過(guò)麥克風(fēng)陣列加強(qiáng)目標(biāo)語(yǔ)音信號(hào),同時(shí)抑制擴(kuò)散噪聲。發(fā)明內(nèi)容本發(fā)明的一個(gè)方面提供了一種用于處理多個(gè)通道的輸入音頻信號(hào)的音 頻信號(hào)處理方法,包括計(jì)算代表輸入音頻信號(hào)的通道之間的差異的至少一個(gè)特征量;根據(jù)特征量從通過(guò)預(yù)先學(xué)習(xí)而準(zhǔn)備的至少一個(gè)加權(quán)因子庫(kù)選 擇加權(quán)因子;以及對(duì)所述多個(gè)通道的輸入音頻信號(hào)進(jìn)行信號(hào)處理以產(chǎn)生輸 出音頻信號(hào),所迷信號(hào)處理包括噪聲抑制和采用所述選擇的加權(quán)因子的加 沖又求和。


圖l是根據(jù)第一實(shí)施例的音頻信號(hào)處理器的框圖; 圖2是示例了第一實(shí)施例的過(guò)程程序的流程圖;圖3是示例了通道特征量的分布的圖;圖4是才艮據(jù)第二實(shí)施例的音頻信號(hào)處理器的框圖;圖5是示例了第二實(shí)施例的過(guò)程程序的流程圖;圖6是4艮據(jù)第三實(shí)施例的音頻信號(hào)處理器的框圖;圖7是4艮據(jù)第四實(shí)施例的音頻信號(hào)處理器的框圖;圖8是示例了根據(jù)圖7的重心庫(kù)(centroid dictionary)的內(nèi)容的圖;圖9是第四實(shí)施例的過(guò)程程序的流程圖;圖IO是才艮據(jù)笫五實(shí)施例的音頻信號(hào)處理器的框圖;圖ll是根據(jù)第六實(shí)施例的音頻信號(hào)處理器的框圖;圖12是根據(jù)第七實(shí)施例的音頻信號(hào)處理器的框圖;圖13是才艮據(jù)笫八實(shí)施例的音頻信號(hào)處理器的框圖;圖14是笫八實(shí)施例的過(guò)程程序的流程圖;圖15是是才艮據(jù)第九實(shí)施例的音頻信號(hào)處理器的框圖;以及圖16是第九實(shí)施例的過(guò)程程序的流程圖。
具體實(shí)施方式
下面將解釋本發(fā)明的實(shí)施例。如圖1所示,在^L據(jù)笫一實(shí)施例的音頻信號(hào)處理裝置中,來(lái)自多個(gè)(N ) 個(gè)麥克風(fēng)101-1至101-N的N個(gè)通道的輸入音頻信號(hào)輸入到通道間特征量 計(jì)算器102以及噪聲抑制器105-1至105-N。通道間特征量計(jì)算器102計(jì) 算代表輸入音頻信號(hào)的通道之間的差異的特征量(稱(chēng)為為通道間特征量),, 并且將其送到選擇器104。選擇器104從存儲(chǔ)在加權(quán)因子庫(kù)103中的多個(gè) 加權(quán)因子(稱(chēng)為陣列加權(quán)因子)選擇與通道間特征量相對(duì)應(yīng)的加權(quán)因子。噪聲抑制器105-1至105-N對(duì)N個(gè)通道的輸入音頻信號(hào)進(jìn)行噪聲抑制 處理,具體而言,用于抑制擴(kuò)散噪聲的處理。加權(quán)單元106-1至106-N通 過(guò)選擇器104所選擇的加權(quán)因子加jf又來(lái)自噪聲抑制器105-1至10SN的N 通道的噪聲被抑制的音頻信號(hào)。來(lái)自加權(quán)單元106-1至106-N的N個(gè)通道 的加權(quán)的音頻信號(hào)由加法器107求和,以產(chǎn)生其中目標(biāo)語(yǔ)音信號(hào)祐加強(qiáng)的輸出音頻信號(hào)108。根據(jù)圖2的流程圖解釋了本實(shí)施例的處理過(guò)程。通道間特征量計(jì)算器 102通it^麥克風(fēng)101-1至101-N輸出的輸入音頻信號(hào)(假設(shè)為xl至xN ) 計(jì)算通道間特征量(步驟Sll)。當(dāng)使用數(shù)字信號(hào)處理技術(shù)時(shí),輸入音頻 信號(hào)xl至xN是通過(guò)模擬到數(shù)字轉(zhuǎn)換器(未示出)沿時(shí)間軸數(shù)字化的數(shù)字 信號(hào),并由使用時(shí)間指標(biāo)t的x (t)表示。如果數(shù)字化輸入音頻信號(hào)xl 至xN,那么通道間特征量同樣被數(shù)字化。對(duì)于通道間特征量的具體實(shí)例, 可以使用下面描述的輸入音頻信號(hào)xl至xN的到達(dá)時(shí)間之間的差異、功率 比率、復(fù)相干性或者廣義相關(guān)函數(shù)?;诓襟ESll計(jì)算出的通道間特征量,由選擇器104從加權(quán)因子庫(kù)103 中選擇對(duì)應(yīng)于通道間特征量的加權(quán)因子(步驟S12)。換言之,提取從加 權(quán)因子庫(kù)103中選擇的加權(quán)因子。預(yù)先確定通道間特征量與加權(quán)因子之間 的對(duì)應(yīng)。以最簡(jiǎn)單和最容易的方式,存在使通道間特征量與加權(quán)因子一一 對(duì)應(yīng)的方法。作為可以進(jìn)行更有效對(duì)應(yīng)的方法,存在使用聚類(lèi)(clustering) 方法例如LBG并分配對(duì)應(yīng)的加權(quán)因子到每一組以分組通道間特征量的方 法。通過(guò)采用例如GMM (高斯混合模型)的統(tǒng)計(jì)分布使分布的權(quán)重與加 4又因子wl至wN彼此對(duì)應(yīng)的方法是可以考慮的。以該方式,可以考慮多 種方法用于通道間特征量與加權(quán)因子之間的對(duì)應(yīng),并在考慮了計(jì)算成本或 存儲(chǔ)器容量后確定最優(yōu)的方法。將選擇器104以這樣的方式選擇的加權(quán)因 子wl至wN設(shè)置到加權(quán)單元106-1至106-N。通常,加權(quán)因子wl至wN 彼此之間的值是不同的。然而,它們有時(shí)具有相同的值,或者全部為0。 通過(guò)預(yù)先的學(xué)習(xí)來(lái)確定加權(quán)因子。另一方面,發(fā)送輸入音頻信號(hào)xl至xN到噪聲抑制器105-1至105-N 以由此抑制擴(kuò)散噪聲(步驟S13)。在噪聲抑制之后,由加權(quán)單元106-1 至106-N根據(jù)加權(quán)因子wl至wN,加權(quán)N個(gè)通道的音頻信號(hào)。由加法器 107使加權(quán)的音頻信號(hào)相加,以產(chǎn)生其中目標(biāo)語(yǔ)音信號(hào)#強(qiáng)的輸出音頻 信號(hào)108 (步驟S14 )。下面詳細(xì)描述通道間特征量計(jì)算器102。如上所述,通道間特征量是代表來(lái)自N個(gè)麥克風(fēng)101-1至101-N的N個(gè)通道的輸入音頻信號(hào)xl至xN 的差異的量。存在由JP-A 2007-10897(KOKAI)描述的多種量,在這里并 入其全部?jī)?nèi)容作為參考。假定輸入音頻信號(hào)xl至xN之間的到達(dá)時(shí)間差異t是N=2的情況。當(dāng) 輸入音頻信號(hào)xl至xN從麥克風(fēng)101-1至101-N的陣列的正面到達(dá)時(shí),7=0。 當(dāng)輸入音頻信號(hào)xl至xN從相對(duì)于正面偏移了角度e的位置到達(dá)時(shí),發(fā)生 T=dsine/c的延遲,其中c是聲速,以及d表示麥克風(fēng)101-1至101-N之間 的3巨離。假定可以檢測(cè)到達(dá)時(shí)間差異t,通過(guò)使對(duì)應(yīng)t=0的相對(duì)大的加權(quán)因子 例如(0.5, 0.5)與通道間特征量對(duì)應(yīng),以及通過(guò)使對(duì)應(yīng)非t=0的值的相 對(duì)小的加權(quán)因子例如(O, O)與通道間特征量對(duì)應(yīng),來(lái)僅僅加強(qiáng)來(lái)自麥克 風(fēng)陣列正面的輸入音頻信號(hào)。假定t被數(shù)字化,可以確定這樣的時(shí)間單位, 該時(shí)間單位對(duì)應(yīng)于可以由麥克風(fēng)101-1至101-N的陣列可以檢測(cè)到的最小 角。存在各種方法,例如,設(shè)定對(duì)應(yīng)角度的時(shí)間的方法,其中該角度以例如一度的單位的恒定單位變化;或者不管角度采用恒定時(shí)間間隔的方法。通常,大多數(shù)常規(guī)麥克風(fēng)陣列通過(guò)加權(quán)來(lái)自每一個(gè)麥克風(fēng)的輸入音頻信號(hào)并求和加^L的音頻信號(hào)來(lái)得到其輸出信號(hào)。存在各種麥克風(fēng)陣列系統(tǒng), 但是基本上各系統(tǒng)間用于確定加權(quán)因子w的方法是不同的。自適應(yīng) (adaptive)麥克風(fēng)陣列通常獲得分析加權(quán)因子w。 DCMP (定向約束功 率最小化(Directionally Constrained Minimization of Power))是公知的 這樣的自適應(yīng)麥克風(fēng)陣列中的一種。由于DCMP基于來(lái)自麥克風(fēng)的輸入音頻信號(hào)自適應(yīng)地獲得加權(quán)因子, 因此與固定型陣列例如延遲求和陣列相比,其可以采用較少的麥克風(fēng)來(lái)實(shí) 現(xiàn)高的噪聲抑制效率。然而,歸因于聲音混響下聲波的干涉,因?yàn)轭A(yù)先確 定的方向矢量c與目標(biāo)聲音實(shí)際到達(dá)的方向并不總是一致的,所以會(huì)出現(xiàn) "目標(biāo)聲音消除,,的問(wèn)題,即目標(biāo)音頻信號(hào)被當(dāng)作噪聲并由此被抑制。以該方式,自適應(yīng)地基于輸入音頻信號(hào)形成方向圖形的自適應(yīng)陣列會(huì)受到聲音 混響的顯著影響,因而無(wú)法避免"目標(biāo)聲音消除"的問(wèn)題。相反,根據(jù)本實(shí)施例的基于通道間特征量設(shè)置加權(quán)因子的系統(tǒng)可以通 過(guò)學(xué)習(xí)加權(quán)因子而避免目標(biāo)聲音消除。例如,假定由于反射,從麥克風(fēng)正 面發(fā)射的音頻信號(hào)以到達(dá)時(shí)間差異T中的TO延遲,如果相對(duì)地增加對(duì)應(yīng)于TO的加權(quán)因子例如(0.5, 0.5),并相對(duì)地降低對(duì)應(yīng)于除TO之外的T的加 權(quán)因子例如(O, 0),就可以避免目標(biāo)聲音消除。學(xué)習(xí)加權(quán)因子,即在建 立了加權(quán)因子庫(kù)103時(shí),通過(guò)下列方法預(yù)先實(shí)現(xiàn)通道間特征量與加權(quán)因子 之間的對(duì)應(yīng)。例如,提供CSP(互功率鐠相位(cross-power-spectrum phase ) 方法作為用于獲得到達(dá)時(shí)間差異T的方法。在CSP方法中,在N-2的情 況下由以下的公式(1)計(jì)算CSP系數(shù)。其中CSP (t )表示CSP系數(shù),Xn ( f)表示xn (t)的傅立葉變換, IFTU表示傅立葉逆變換,conj ()表示復(fù)共軛,以及l(fā)l表示絕對(duì)值。因?yàn)镃SP系數(shù)是白交叉i普(white cross spectrum )的反傅立葉變換, 其具有對(duì)應(yīng)于到達(dá)時(shí)間差異T的時(shí)間t的脈沖形尖峰。因此,通過(guò)探索CSP 系數(shù)的最大值來(lái)獲知到達(dá)時(shí)間差異T。對(duì)基于到達(dá)時(shí)間差異的通道間特征量而言,可以7使用復(fù)相千以及到達(dá)時(shí)間差異本身。XI (f) 、 X2(f)的復(fù)相千由下面的公式(2)表達(dá)。呵)- ,呵.(糊x糊 (2)V,(/)|2},"(yf}其中Coh (f)是復(fù)相干,以及EO表示時(shí)間平均。在信號(hào)處理領(lǐng)域,使用 相干作為表示兩個(gè)信號(hào)之間的關(guān)系的量。對(duì)于不具有通道之間的相關(guān)性的 信號(hào)例如擴(kuò)散噪聲,相干的絕對(duì)值變小。對(duì)于方向性的信號(hào),相干變大。 對(duì)于方向性的信號(hào),因?yàn)橥ǖ乐g的時(shí)間差異呈現(xiàn)為相干的相位成分 (component),所以可以由相位來(lái)區(qū)別方向性的信號(hào)是來(lái)自目標(biāo)方向的 目標(biāo)音頻信號(hào)還是來(lái)自非目標(biāo)方向的方向的信號(hào)。通過(guò)^f吏用這些性質(zhì)作為 特征量便可以區(qū)別擴(kuò)散噪聲、目標(biāo)語(yǔ)音信號(hào)以及方向性噪聲。由公式(2) 可以理解到,相干是頻率的函數(shù)。因此,其與下述的第三實(shí)施例一致。然 而,當(dāng)其用在時(shí)域中時(shí),可以構(gòu)思各種方法例如在沿頻率方向*其平均的方法和使用代表性頻率值的方法。通常限定相干具有N個(gè)通道,并不局限 于本實(shí)施例中的N=2。通常,以任意的兩個(gè)通道的相干的組合(最大Nx (N-l) /2 )表示N個(gè)通道的相干。廣義互相關(guān)函數(shù)以及基于到達(dá)時(shí)間差異的特征量可以用作通道間特征 量。例如,在"The Generalized Correlation Method for Estimation of Time Delay, C. H. Knapp and G. C. Carter, IEEE Trans, Acoust" Speech, Signal Processing", Vol.ASSP-24, No.4, pp.320-327 (1976)中描述了廣義互相關(guān) 函數(shù),在這里并入其全部?jī)?nèi)容作為參考。廣義互相關(guān)函數(shù)GCC (t)由以 下公式定義。GCC(t)=IFT{,xG12(f)} (3)其中IFT表示反傅立葉變換,O(f)表示加權(quán)因子,以及G12(f)表示通 道之間的互功率^普。如上述文件所述,存在用于決定①(f)的各種方法。例 如,通過(guò)下列公式表示了最大似然估計(jì)方法的加權(quán)因子屯ml(f)。<formula>formula see original document page 11</formula> 其中iyl2(f)12是幅值平方相干。與CSP的情況相同,可以由GCC(t)的最大值以及給出最大值的t來(lái) 獲知通道之間的相干密度以及聲源的方向。以該方式,才艮據(jù)本實(shí)施例,由于通過(guò)學(xué)習(xí)可以得到通道間特征量與加 權(quán)因子wl至wN之間的關(guān)系,即使輸入音頻信號(hào)xl至xN的方向信息初L 聲音混響擾亂,仍可以加強(qiáng)目標(biāo)語(yǔ)音信號(hào)而不產(chǎn)生"目標(biāo)聲音消除"的問(wèn)題。下面詳細(xì)地解釋加4又單元106-1至106-N。由加權(quán)單元106-1至106-N 進(jìn)行的加權(quán)在時(shí)域的數(shù)字信號(hào)處理中凈皮表示為巻積。換言之,當(dāng)加權(quán)因子 wl至wN被束示為wn-(wn(0),wn(l),…,wn(L-l)〉時(shí),就建立了下列的關(guān)系 式(5)。<formula>formula see original document page 11</formula>數(shù)目,以及*表示巻積。作為所有通道的總和的y (t)表示^法器107輸出的輸出音頻信號(hào) 108,如下式所示?!?) = Z x"(o *測(cè) (6 )下面詳細(xì)解釋噪聲抑制器105-1至105-N。噪聲抑制器105-1至105-N 可以通過(guò)相似的巻積運(yùn)算進(jìn)行噪聲抑制。將參考頻域描述具體的噪聲抑制 方法,但是時(shí)域中的巻積運(yùn)算與頻域中的乘法具有傅立葉變換的關(guān)系。因 此,可以在頻域或者時(shí)域中實(shí)現(xiàn)噪聲抑制。存在各種用于噪聲抑制的方法,例如,在S.F.Boll, "Suppression of Acoustic Noise in Speech Using Spectral Subtraction", IEEE Trans. ASSP vol. 27, pp. 113-120,1979中示出的語(yǔ)減法,在這里并入其M內(nèi)容作為參 考,在Y.Ephraim, D.Malah, "Speech Enhancement Using a Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator", IEEE Trans. ASSP vol.32, 1109-1121,1984中示出的MMSE-STSA,在這里并入 其全部?jī)?nèi)容作為參考,以及,在Y,Ephraim, D.Malah, "Speech Enhancement Using a Minimum Mean-Square Error Log-Spectral Amplitude Estimator", IEEE Trans. ASSP vol.33, 443-445,1985中示出的 MMSE-LSA,在這里并入其全部?jī)?nèi)容作為參考??梢赃m宜地選擇基于這些 算法的噪聲抑制方法。結(jié)合麥克風(fēng)陣列處理與噪聲抑制的技術(shù)是公知的。例如,在陣列處理 器之后的噪聲抑制器稱(chēng)為后濾波器,并且討論了各種技術(shù)。另一方面,不 經(jīng)常使用在陣列處理器之前設(shè)置噪聲抑制器的方法,因?yàn)樵肼曇种破鞯挠?jì) 算量隨麥克風(fēng)的數(shù)量成倍的增加。因?yàn)橥ㄟ^(guò)學(xué)習(xí)獲得加權(quán)因子,所以在JP-A 2007-10897(KOKAI)中描 述的方法具有能夠減小由噪聲抑制器所造成的失真的優(yōu)點(diǎn)。換言之,在學(xué) 習(xí)時(shí)間,學(xué)習(xí)加權(quán)因子以減小包含噪聲抑制造成的失真的輸入信號(hào)的加權(quán) 求和與目標(biāo)信號(hào)之間的差異。因此,即使計(jì)算成本增加,仍具-有優(yōu)點(diǎn),如在本實(shí)施例的情況,可以在加權(quán)加法器(包括加權(quán)單元106-1至106-N以 /0口法器107 )之前設(shè)置噪聲抑制器105-1至105-N,在該情況下,首先,可想到的配置為在已經(jīng)完成噪聲抑制之后獲得通 道間特征量,并基于該通道間特征量選擇加權(quán)因子。然而,可以想象在該 配置中存在問(wèn)題。由于對(duì)于每一個(gè)通道噪聲抑制器可以獨(dú)立地操作,所以 在噪聲抑制器抑制噪聲之后干擾了音頻信號(hào)的通道間特征量。例如,在假 定通道之間的功率比率是通道間特征量的情況下,當(dāng)將不同的抑制系數(shù)施 加到每一個(gè)通道的音頻信號(hào)時(shí),在噪聲抑制之前和之后功率比率發(fā)生改變。 相反,根據(jù)本實(shí)施例如圖1所示"&置通道間特征量計(jì)算器102和噪聲抑制 器105-1至105-N以在噪聲抑制之前計(jì)算關(guān)于輸入音頻信號(hào)的通道間特征 量。該配置避免了上述問(wèn)題。參照?qǐng)D3,詳細(xì)描迷了以該方式通過(guò)在噪聲抑制之前計(jì)算關(guān)于輸入音 頻信號(hào)的通道間特征量而得到的效果。圖3示出了通道間特征量的示意性 分布。在假定在特征量空間內(nèi)的三個(gè)音源位置A、 B以及C中,假定A為 目標(biāo)信號(hào)到達(dá)的加強(qiáng)位置(例如,正面方向的位置),并且假定B、 C為 應(yīng)該抑制噪聲的位置(例如,左方和右方的位置)。對(duì)于每個(gè)方向,在無(wú)噪聲存在的環(huán)境中計(jì)算的通道間特征量分布在窄 的范圍內(nèi),如圖3中黑圏所示。例如,當(dāng)假定功率比率是通道間特征量時(shí), 沿正面方向的功率比率為1。相對(duì)于聲源,由于接近聲源的麥克風(fēng)沿左方 或者右方的增益稍大,所以左方和右方之一的功率比率大于1,并且其他 方向的功率比率小于l。另一方面,由于在存在噪聲的環(huán)境中,對(duì)每一個(gè)通道而言,噪聲功率 是單獨(dú)變化的,因此增加了通道間的功率比率的離歉復(fù)。該狀態(tài)在圖3中 由實(shí)線圈顯示。當(dāng)對(duì)每一個(gè)通道實(shí)行噪聲抑制的時(shí)候,離散發(fā)生擴(kuò)展,如 虛線圈所示。這是因?yàn)閷?duì)于每一個(gè)通道,單獨(dú)地得到抑制系數(shù)。為了有效 地進(jìn)行后級(jí)的麥克風(fēng)陣列處理,希望在計(jì)算特征量的階段可以明確地區(qū)分 開(kāi)目標(biāo)方向與干涉方向。在本實(shí)施例中,在實(shí)行噪聲抑制之后的分布(虛線圏)內(nèi)不計(jì)算通道間特征量,而在實(shí)行噪聲抑制之前的分布(實(shí)線圈)內(nèi)計(jì)算通道間特征量, 就避免了由噪聲抑制帶來(lái)的通道間特征量的分布的擴(kuò)展,并且后級(jí)的陣列 處理器可以有效地運(yùn)作。 (第二實(shí)施例)圖4示例了才艮據(jù)第二實(shí)施例的音頻信號(hào)處理裝置。在該音頻信號(hào)處理 裝置中,加權(quán)單元106-1至106-N與噪聲抑制器105-1至105-N互換其在 圖1中的位置。換言之,如圖5的流程圖所示,由通道間特征量計(jì)算器102 計(jì)算N個(gè)通道的輸入音頻信號(hào)xl至xN的通道間特征量(步驟S21),并 且由選擇器104選擇與計(jì)算的通道間特征量相對(duì)應(yīng)的加權(quán)因子(步驟S22 )。 以該方式,步驟S21和S22與圖2中的步驟S11和S12相似。在本實(shí)施例中,步驟S22之后,由加權(quán)單元106-1至106-N加權(quán)輸入 音頻信號(hào)xl至xN (步驟S23 )。由噪聲抑制器105-1至105-N對(duì)加權(quán)的N 通道的音頻信號(hào)進(jìn)行擴(kuò)散噪聲抑制(步驟S24)。最后,在噪聲抑制之后 由加法器107相加N個(gè)通道的音頻信號(hào),以產(chǎn)生輸出音頻信號(hào)108 (步驟 S25)。以該方式,首先實(shí)施一組噪聲抑制器105-1至105-N以及一組加權(quán)單 元106-1至106-N中的明P—組。 (第三實(shí)施例)如圖6所示,在根據(jù)本實(shí)施例的音頻信號(hào)處理裝置中,將傅立葉變換 器401-1至401-N和反傅立葉變換器405增加到根據(jù)第一實(shí)施例的圖1中 的笫一音頻信號(hào)處理裝置,其中傅立葉變換器401-1至401-N用于將N通 道的輸入音頻信號(hào)轉(zhuǎn)變?yōu)轭l域信號(hào),反傅立葉變換器405用于將進(jìn)行了噪 聲抑制并加權(quán)求和的頻域音頻信號(hào)恢復(fù)成時(shí)域信號(hào)。通過(guò)增加傅立葉變換 器401-1至401-N和反傅立葉變換器405,噪聲抑制器105-1至105-N、加 權(quán)單元106-1至106-N以及加法器107替換為噪聲抑制器402-1至402-N、 加權(quán)單元403-1至403-N以及加法器404,其通過(guò)頻域中的算術(shù)運(yùn)算分別 進(jìn)行擴(kuò)散噪聲抑制、加權(quán)以及求和。在時(shí)域中的巻積運(yùn)算表示為頻域中的乘積的算術(shù)運(yùn)算,這在數(shù)字信號(hào)處理技術(shù)領(lǐng)域是/>知的。在本實(shí)施例中,由傅立葉變換器401-1至401-N 將N通道的輸入音頻信號(hào)轉(zhuǎn)換為頻域信號(hào),然后進(jìn)行噪聲抑制和加權(quán)求和。 進(jìn)行噪聲抑制和加權(quán)求和后的信號(hào)由反傅立葉變換器405進(jìn)行反傅立葉變 換以恢復(fù)為時(shí)域信號(hào)。因此,本實(shí)施例進(jìn)行的處理類(lèi)似于第一實(shí)施例在時(shí) 域中執(zhí)行的處理。在該情況下,來(lái)自加法器404的輸出信號(hào)Y (k)不通 過(guò)根據(jù)公式(5 )的巻積表示,而是以下列乘積表示。,=^]4)><簡(jiǎn)(^:) ( 7 )/7=1其中k是頻率指標(biāo)。通過(guò)反傅立葉變換器405對(duì)來(lái)自加法器404的輸出信號(hào)Y (k)進(jìn)行 反傅立葉變換,可以得到時(shí)域的輸出音頻信號(hào)y (t)。例如,剛好可以使 用來(lái)自加法器404的頻域輸出信號(hào)Y (k)作為語(yǔ)音識(shí)別的參數(shù)。當(dāng)將輸入音頻信號(hào)轉(zhuǎn)換為頻域信號(hào)然后進(jìn)行本實(shí)施例的處理時(shí),依賴(lài) 于加權(quán)單元403-1至403-N的過(guò)濾程度,可以減小計(jì)算成本,并且可以容 易地表示復(fù)雜的聲音混響,因?yàn)榭梢詫?duì)每一個(gè)頻帶進(jìn)行處理。在本實(shí)施例中,因?yàn)樵谠肼曇种破?02-1至402-N對(duì)信號(hào)進(jìn)行噪聲抑 制之前計(jì)算該信號(hào)的通道間特征量,所以由噪聲抑制產(chǎn)生的通道特征量分布的離散保持最小,由此后級(jí)陣列處理器可以有效地運(yùn)作'對(duì)于本實(shí)施例中噪聲抑制的方法,可以從各種方法中選擇任意的噪聲 抑制方法,例如,在文件S.F.Boll, "Suppression of Acoustic Noise in Speech Using Spectral Subtraction", IEEE Trans. ASSP vol. 27, pp. 113-120,1979 中示出的譜減法,在文獻(xiàn)Y. Ephraim, D. Malah, "Speech Enhancement Using a Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator", IEEE Trans. ASSP vol.32, 1109-1121,1984 中示出 MMSE畫(huà)STSA,以及在文件Y. Ephraim, D. Malah, "Speech Enhancement Using a Minimum Mean-Square Error Log-Spectral Amplitude Estimator", IEEE Trans. ASSP vol.33, 443-445,1985 中示出的 MMSE-LSA,或者它們的適宜的改進(jìn)版本。(第四實(shí)施例)在根據(jù)圖7的笫四實(shí)施例的音頻信號(hào)處理裝置中,將校對(duì)器501和重 心庫(kù)502增加到才艮據(jù)笫二實(shí)施例的圖4的音頻信號(hào)處理器。重心庫(kù)502儲(chǔ) 存由LBG等方法獲得到的多個(gè)(1)重心的特征量,如圖8所示,對(duì)應(yīng)于 索引ID。當(dāng)聚類(lèi)通道間特征量的時(shí)候,重心是每一個(gè)簇的代表點(diǎn)。圖9的流程圖示出了圖7音頻信號(hào)處理裝置的處理流程。然而,在圖 9中略去了傅立葉變換器401-1至401-N和反傅立葉變換器405的處理。 由通道間特征量計(jì)算器102計(jì)算N通道的傅立葉變換的音頻信號(hào)的通道間 特征量(步驟S31 )。校對(duì)每一個(gè)通道間特征量與存儲(chǔ)于重心庫(kù)407的多 個(gè)(1)重心的特征量中的每一個(gè),并計(jì)算通道間特征量與重心的特征量之 間的距離(步驟S32)。索引ID表示重心的特征量,其最小化了通道間特征量與代表點(diǎn)的特 征量之間的距離,由校對(duì)器406發(fā)送該指標(biāo)ID到選擇器104。由選擇器 104從加權(quán)因子庫(kù)103中選擇對(duì)應(yīng)于指標(biāo)ID的加權(quán)因子(步驟S33)。將 由選擇器104選擇的加權(quán)因子設(shè)置到加權(quán)單元403-1至403-N。另一方面, 將由傅立葉變換器401-1至401-N轉(zhuǎn)換為頻域信號(hào)的輸入音頻信號(hào)輸入到 噪聲抑制器402-1至402-N以抑制擴(kuò)散噪聲(步驟S34)。根據(jù)在步驟S33中設(shè)置到加權(quán)單元403-1至403-N的加權(quán)因子,在噪 聲抑制之后加權(quán)N通道的音頻信號(hào)。之后,加權(quán)的音頻信號(hào)由加法器404 進(jìn)行求和以產(chǎn)生其中目標(biāo)信號(hào)被加強(qiáng)的輸出信號(hào)(步驟S35)。來(lái)自加法 器404的輸出信號(hào)由反傅立變換器405進(jìn)行反傅立葉變換,從而產(chǎn)生時(shí)域 的輸出音頻信號(hào)。 (第五實(shí)施例)如圖IO所示,才艮據(jù)第五實(shí)施例的音頻信號(hào)處理裝置具有多個(gè)(M)加 權(quán)控制器500-1至500-M,其每一個(gè)包括通道間特征量計(jì)算器102、加權(quán) 因子庫(kù)103以及選擇器104,如第一實(shí)施例的解釋。根據(jù)控制信號(hào)501,由輸入開(kāi)關(guān)502和輸出開(kāi)關(guān)503來(lái)切換加權(quán)控制 器500-1至500-M。換言之,來(lái)自麥克風(fēng)101-1至101-N的一組N通道的輸入音頻信號(hào)通過(guò)輸入開(kāi)關(guān)502輸入到加權(quán)控制器500-1至500-M中的一 個(gè),以通過(guò)通道間特征量計(jì)算器102來(lái)計(jì)算通道間特征量。在加權(quán)控制器 500-1至500-M中輸入了音頻信號(hào)組的那個(gè)加權(quán)控制器中,選擇器104從 加權(quán)因子庫(kù)103選擇對(duì)應(yīng)于通道間特征量的加權(quán)因子組。將選擇的加權(quán)因 子組通過(guò)輸出開(kāi)關(guān)503輸入到加權(quán)單元106-1至106-N。加權(quán)單元106-1至106-N使用由選擇器104選擇的加權(quán)因子來(lái)加權(quán)經(jīng) 受了噪聲抑制器105-1至105-N的噪聲抑制的N通道的音頻信號(hào)。來(lái)自加 權(quán)單元106-1至106-N的N通道的加權(quán)音頻信號(hào)通過(guò)加法器107進(jìn)行求和, 以產(chǎn)生其中目標(biāo)語(yǔ)音信號(hào)被加強(qiáng)的輸出音頻信號(hào)108,。通過(guò)在接近實(shí)際^使用環(huán)境的聲學(xué)環(huán)境中的學(xué)習(xí),預(yù)先建立加權(quán)因子庫(kù) 103。事實(shí)上,假定了各種聲學(xué)環(huán)境。例如,汽車(chē)內(nèi)部的聲學(xué)環(huán)境由于汽車(chē) 類(lèi)型的不同而存在巨大的差異。分別才艮據(jù)不同的聲學(xué)環(huán)境來(lái)獲得加權(quán)控制 器500-1至500-M的加權(quán)因子庫(kù)103。因此,在音頻處理時(shí)根據(jù)實(shí)際使用 環(huán)境切換加權(quán)控制器500-1至500-M并使用這樣的加權(quán)因子,該加權(quán)因子 是選擇器104從在與實(shí)際使用環(huán)境相同或非常相似的聲學(xué)環(huán)境下學(xué)習(xí)的加 權(quán)因子庫(kù)103選擇的加權(quán)因子,就可以進(jìn)行適合實(shí)際使用環(huán)境的音頻信號(hào) 處理。例如,可以通過(guò)用戶的按鈕操作,或者自動(dòng)地使用由輸入音頻信號(hào)產(chǎn) 生的參數(shù)例如信噪比(SNR)作為指標(biāo)來(lái)產(chǎn)生用于切換加權(quán)控制器500-1 至500-M的控制信號(hào)501。可由外部參數(shù)例如汽車(chē)的速度作為指標(biāo)產(chǎn)生控 制信號(hào)501。在每一個(gè)加權(quán)控制器500-1至500-M中提供了通道間特征量計(jì)算器 102的情況下,希望通過(guò)使用用于計(jì)算通道間特征量或者參數(shù)的方法來(lái)計(jì) 算更加準(zhǔn)確的通道間特征量,其適合于對(duì)應(yīng)每一個(gè)加權(quán)控制器500-1至 500-M的聲學(xué)環(huán)境。 (第六實(shí)施例)圖11示出的第六實(shí)施例提供了一種音頻信號(hào)處理裝置,丼修改了圖 IO的第五實(shí)施例,其中由加43U&口法器504取代圖10的輸出開(kāi)關(guān)503。以與第五實(shí)施例相似的方式,分別在不同的聲學(xué)環(huán)境下學(xué)習(xí)加權(quán)控制器500-1 至500-M的加權(quán)因子庫(kù)103。加權(quán)加法器504加權(quán)-求和由選擇器104從加權(quán)控制器500-1至500-M 的加權(quán)因子庫(kù)103中選擇的加權(quán)因子,并且將由加權(quán)求和得到的加權(quán)因子 發(fā)送到加杈單元106-1至106-N。因此,即使實(shí)際使用環(huán)境變化了,可以 執(zhí)行相對(duì)地適應(yīng)使用環(huán)境的音頻信號(hào)處理。加權(quán)加法器504通過(guò)固定的加 權(quán)因子或者由控制信號(hào)501控制的加權(quán)因子來(lái)對(duì)加權(quán)因子進(jìn)行加權(quán)。 (第七實(shí)施例)圖12示出的第六實(shí)施例提供了一種音頻信號(hào)處理裝置,其修改了圖 10的第五實(shí)施例,其中從每一個(gè)加權(quán)控制器500-1至500-M去除通道間特 征量計(jì)算器并使用公共的通道間特征量計(jì)算器102。以該方式,即使使用公共的通道間特征量計(jì)算器102并且僅改變加權(quán) 因子庫(kù)103和選擇器104,也可以得到近似與第五實(shí)施例相似的效果。此 外,可以組合笫六和第七實(shí)施例,并且可以由加權(quán)加法器504替換圖12 的輸出開(kāi)關(guān)503。(第八實(shí)施例)圖13示出的第八實(shí)施例提供了一種音頻信號(hào)處理裝置,其修改了圖6 的第三實(shí)施例,其中使用通道間相關(guān)計(jì)算器601與加權(quán)因子計(jì)算器602取 代通道間特征量計(jì)算器102、加權(quán)庫(kù)103和選擇器104。根據(jù)圖14的流程圖解釋了本實(shí)施例的處理過(guò)程。通it4目關(guān)計(jì)算器601 對(duì)由麥克風(fēng)101-1至101-N輸出的輸入音頻信號(hào)xl至xN進(jìn)行通道相關(guān)計(jì) 算,以獲得通道相關(guān)(步驟S41)。如果可以數(shù)字化輸入音頻信號(hào)xl至 xN,那么也可以數(shù)字化通道相關(guān)?;谠诓襟ES41中計(jì)算的通道間相關(guān),加權(quán)因子計(jì)算器602計(jì)算用于 形成方向性的加權(quán)因子wl至wN (步驟S42)。由加權(quán)因子計(jì)算器302計(jì) 算的加權(quán)因子wl至wN被設(shè)置到加權(quán)單元403-1至403-N。噪聲抑制器402-1至402-N對(duì)輸入音頻信號(hào)xl至xN進(jìn)行噪聲抑制以 抑制擴(kuò)散噪聲(步驟S43)。噪聲抑制之后,加權(quán)單元403-1至403-N根據(jù)加權(quán)因子wl至wN對(duì)N通道的音頻信號(hào)進(jìn)行加權(quán)。此后,通過(guò)加法器404求和加權(quán)的音頻信號(hào),以得到其中目標(biāo)語(yǔ)音信號(hào)被加強(qiáng)的輸出音頻信號(hào)108 (步驟S44 )。根據(jù)作為自適應(yīng)陣列的實(shí)例的上述DCMP,通過(guò)下列分析計(jì)算拔陚予到加權(quán)單元403-1至403-N的加權(quán)因子w:w = (wl, w2,…,wN)t= (7"v(i x\0c (8)其中Rxx代表通道間相關(guān)矩陣,inv代表逆矩陣,以及h代表共軛轉(zhuǎn)置矩 陣。矢量c稱(chēng)為約束矢量。 一種設(shè)計(jì)是可能的,以便沿矢量c所指示的方 向的響應(yīng)變成希望的響應(yīng)h (具有沿目標(biāo)語(yǔ)音的方向的方向性的響應(yīng))。 每一個(gè)w和c都是矢量,并且h是標(biāo)量??梢栽O(shè)置多個(gè)約束條件。在該情 況下,c是矩陣,以及h是矢量。通常,假定約束矢量為目標(biāo)語(yǔ)音方向并 將希望的響應(yīng)i殳計(jì)為1。DCMP可以在基于輸入信號(hào)的分析中得到加權(quán)因子。然而,在本實(shí)施 例中,加權(quán)單元403-1至403-N的輸入信號(hào)是噪聲抑制器402-1至402-N 的輸出信號(hào),并且用于計(jì)算加權(quán)因子的相關(guān)計(jì)算器601的輸入信號(hào)是噪聲 抑制器402-1至402-N的輸入信號(hào)。因?yàn)槎卟⒉灰恢?,所以發(fā)生理論上 的失配。在通常情況下,應(yīng)當(dāng)使用噪聲被抑制的信號(hào)計(jì)算通道間相關(guān),但是根 據(jù)本實(shí)施例,存在可以較早地計(jì)算通道間相關(guān)的優(yōu)點(diǎn)。因此,本實(shí)施例依 賴(lài)于使用條件可顯示出整體的高性能。在第一至第七實(shí)施例中描述的技術(shù) 通過(guò)預(yù)先學(xué)習(xí)包含的噪聲抑制器的貢獻(xiàn)來(lái)學(xué)習(xí)加權(quán)因子,從而不會(huì)發(fā)生上 述失配。在本實(shí)施例中,使用DCMP作為自適應(yīng)陣列的實(shí)例,但是可能使用其 它類(lèi)型的陣列,例如,L.J.Griffiths and C.W.Jim, "An Alternative toLinearly Constrained Adaptive Beamforming", IEEE Trans. Antennas、.fPropagation, vol.O, no.l, pp.27-34, 1982中描述的Griffiths-Jim型,在這里并入其全部?jī)?nèi)容作為參考。 (第九實(shí)施例)圖15示出的笫九實(shí)施例提供了一種音頻信號(hào)處理裝置,其4奮改了圖 13的第八實(shí)施例,其中噪聲抑制器402-1至402-N與加權(quán)單元403-1至 鉤3-N相互替換。換言之,如圖16的流程圖所示,通過(guò)通道間相關(guān)計(jì)算器 601計(jì)算N通道的輸入音頻信號(hào)xl至xN的通道間相關(guān)量(步驟S51)。 由加權(quán)因子計(jì)算器602基于計(jì)算的通道間相關(guān)來(lái)計(jì)算用于形成方向性的加 權(quán)因子wl至wN (步驟S52 )。由加權(quán)因子計(jì)算器602計(jì)算的加權(quán)因子 wl至wN被設(shè)置到加權(quán)單元403-1至403-N。以該方式,步驟S51以及S52 類(lèi)似于圖14的步驟S41以及S42。在本實(shí)施例中,由加權(quán)單元403-1至403-N對(duì)輸入音頻信號(hào)xl至xN 進(jìn)行加權(quán)(步驟S53) 。 N通道的加權(quán)的音頻信號(hào)通過(guò)噪聲抑制器402-1 至405-N進(jìn)行噪聲抑制以抑制擴(kuò)散噪聲(步驟S54)。最后,通過(guò)加法器 107求和N通道的噪聲,皮抑制的音頻信號(hào),以提供輸出音頻信號(hào)108 (步 驟S55)。以該方式,首先實(shí)施一組噪聲抑制器402-1至402-N以及一組加權(quán)單 元403-1至403-N中的哪一組。通過(guò)使用例如通用計(jì)算機(jī)作為^f出硬件,可以進(jìn)行在第 一至第九實(shí)施 例中解釋的音頻信號(hào)處理。換言之,通過(guò)制造安裝在運(yùn)行程序的計(jì)算機(jī)上 的處理器,可以實(shí)現(xiàn)上述音頻信號(hào)處理。這次,通過(guò)在計(jì)算機(jī)上預(yù)先安裝 程序,可以實(shí)現(xiàn)音頻信號(hào)處理。同樣,程序可以被存儲(chǔ)在記錄介質(zhì)例如 CD-ROM中,或者通過(guò)網(wǎng)絡(luò)發(fā)布,并被適宜地安裝到計(jì)算機(jī)中。根據(jù)本發(fā)明,可以在加強(qiáng)目標(biāo)語(yǔ)音的同時(shí)去除擴(kuò)散噪聲。此外,由于 在減小噪聲之前關(guān)于輸入音頻信號(hào)計(jì)算表示輸入音頻信號(hào)的通道之間的差 異或者通道相關(guān)的特征量,即使對(duì)每一個(gè)通道單獨(dú)地進(jìn)行降噪處理,仍可 以保持通道之間的特征量或者通道之間的相關(guān)。因此,保證了通過(guò)學(xué)習(xí)型 麥克風(fēng)陣列加強(qiáng)目標(biāo)語(yǔ)音的操作。
權(quán)利要求
1.一種用于處理多個(gè)通道的輸入音頻信號(hào)的音頻信號(hào)處理方法,包括以下步驟計(jì)算代表輸入音頻信號(hào)的通道之間的差異的至少一個(gè)特征量;從通過(guò)預(yù)先學(xué)習(xí)準(zhǔn)備的至少一個(gè)加權(quán)因子庫(kù)選擇對(duì)應(yīng)于所述特征量的加權(quán)因子;以及對(duì)所述多個(gè)通道的輸入音頻信號(hào)進(jìn)行信號(hào)處理以產(chǎn)生輸出音頻信號(hào),所述信號(hào)處理包括噪聲抑制和使用所述選擇的加權(quán)因子的加權(quán)求和。
2. 根據(jù)權(quán)利要求l的方法,其中對(duì)所述輸入音頻信號(hào)進(jìn)行所迷信號(hào)處 理包括對(duì)所述多個(gè)通道的輸入音頻信號(hào)進(jìn)行所述噪聲抑制,和加權(quán)求和經(jīng) 受了所述噪聲抑制的所述音頻信號(hào)。
3. 根據(jù)權(quán)利要求l的方法,其中對(duì)所述輸入音頻信號(hào)進(jìn)行所述信號(hào)處 理包括使用所述加權(quán)因子加權(quán)所述多個(gè)通道的輸入音頻信號(hào),對(duì)所述多個(gè) 通道的加^又的音頻信號(hào)進(jìn)行所述噪聲抑制,以及求和經(jīng)受了所述噪聲抑制 的所述多個(gè)通道的音頻信號(hào)。
4. 根據(jù)權(quán)利要求l的方法,其中使所述加權(quán)因子預(yù)先對(duì)應(yīng)于所述特征量。
5. 根據(jù)權(quán)利要求l的方法,其中所述選擇包括計(jì)算所述特征量與預(yù)先 準(zhǔn)備的多個(gè)重心中的每一個(gè)的特征量之間的差異,和確定距離相對(duì)小的一 個(gè)重心,以及使所述多個(gè)加權(quán)因子預(yù)先對(duì)應(yīng)于所述重心。
6. 根據(jù)權(quán)利要求l的方法,其中所述計(jì)算包括計(jì)算所述輸入音頻信號(hào) 的所述通道之間的到達(dá)時(shí)間差異。
7. 根據(jù)權(quán)利要求l的方法,其中所述計(jì)算包括計(jì)算所述輸入音頻信號(hào) 的所述通道之間的復(fù)相干。
8. 根據(jù)權(quán)利要求l的方法,其中所述計(jì)算包括計(jì)算所述輸入音頻信號(hào) 的所述通道之間的功率比率。
9. 根據(jù)權(quán)利要求l的方法,其中使所^口權(quán)因子對(duì)應(yīng)于時(shí)域的濾波系數(shù),以及通過(guò)所述音頻信號(hào)與所迷加權(quán)因子的巻積進(jìn)行所迷加權(quán)。
10. 根據(jù)權(quán)利要求1的方法,其中使所述加權(quán)因子對(duì)應(yīng)于頻域的濾波系數(shù),以及通過(guò)計(jì)算所述音頻信號(hào)與所^口權(quán)因子的乘積進(jìn)行所述加權(quán)。
11. 根據(jù)權(quán)利要求l的方法,其中根據(jù)聲學(xué)環(huán)境選擇所述加權(quán)因子庫(kù)。
12. —種用于處理多個(gè)通道的音頻信號(hào)的音頻信號(hào)處理方法,包括以 下步驟計(jì)算輸入音頻信號(hào)的通道之間的相關(guān); 基于所述通道相關(guān)計(jì)算用于形成方向性的加權(quán)因子;以及 對(duì)所述多個(gè)通道的輸入音頻信號(hào)進(jìn)行信號(hào)處理以產(chǎn)生輸出音頻信號(hào), 所述信號(hào)處理包括噪聲抑制和使用所述加權(quán)因子的加權(quán)求和。
13. 根據(jù)權(quán)利要求12的方法,其中對(duì)所述輸入音頻信號(hào)進(jìn)行所述信號(hào) 處理包括對(duì)所述多個(gè)通道的輸入音頻信號(hào)進(jìn)行所述噪聲抑制,和加權(quán)求和 經(jīng)受了所述噪聲抑制的所述音頻信號(hào)。
14. 根據(jù)權(quán)利要求12的方法,其中對(duì)所述輸入音頻信號(hào)進(jìn)行所述信號(hào) 處理包括使用所述加權(quán)因子加權(quán)所述多個(gè)通道的輸入音頻信號(hào),對(duì)所述多 個(gè)通道的加權(quán)的音頻信號(hào)進(jìn)行所述噪聲抑制,以及求和經(jīng)受了所述噪聲抑 制的所述多個(gè)通道的音頻信號(hào)。
15. 根據(jù)權(quán)利要求12的方法,其中使所述加權(quán)因子對(duì)應(yīng)于時(shí)域的濾波 系數(shù),以及通過(guò)所述音頻信號(hào)與所述加權(quán)因子的巻積進(jìn)行所i^口權(quán)。
16. 根據(jù)權(quán)利要求12的方法,其中使所ii^權(quán)因子對(duì)應(yīng)于頻域的濾波 系數(shù),以及通過(guò)計(jì)算所述音頻信號(hào)與所述加權(quán)因子的乘積進(jìn)行所^權(quán)。
17. 根據(jù)權(quán)利要求12的方法,其中根據(jù)聲學(xué)環(huán)境選擇所述加權(quán)因子庫(kù)。
18. —種用于處理多個(gè)通道的音頻信號(hào)的音頻信號(hào)處理裝置,包括 計(jì)算器,計(jì)算表示所述輸入音頻信號(hào)的通道之間的差異的至少一個(gè)特征量;選捧器,根據(jù)所述特征量從至少一個(gè)加權(quán)因子庫(kù)選擇加權(quán)因子;以及 信號(hào)處理器,對(duì)所述多個(gè)通道的音頻信號(hào)進(jìn)行信號(hào)處理以產(chǎn)生輸出音 頻信號(hào),所述信號(hào)處理包括噪聲抑制和使用所述選擇的加權(quán)因子的加權(quán)求和。
19. 一種用于處理多個(gè)通道的音頻信號(hào)的音頻信號(hào)處理裝置,包括 第一計(jì)算器,計(jì)算輸入音頻信號(hào)的通道之間的通道相關(guān); 第二計(jì)算器,基于所述通道相關(guān)計(jì)算用于形成方向性的加權(quán)因子;以及信號(hào)處理器,對(duì)所述多個(gè)通道的輸入音頻信號(hào)進(jìn)行信號(hào)處理以產(chǎn)生輸 出音頻信號(hào),所述信號(hào)處理包括噪聲抑制和使用所述加權(quán)因子的加權(quán)求和。
全文摘要
本發(fā)明涉及用于音頻信號(hào)處理的方法和裝置。一種用于處理多個(gè)通道的輸入音頻信號(hào)的音頻信號(hào)處理方法,包括計(jì)算代表輸入音頻信號(hào)的通道間的差異的至少一個(gè)特征量;根據(jù)所述特征量從通過(guò)預(yù)先學(xué)習(xí)準(zhǔn)備的至少一個(gè)加權(quán)因子庫(kù)選擇至少一個(gè)加權(quán)因子;以及對(duì)所述多個(gè)通道的輸入音頻信號(hào)進(jìn)行信號(hào)處理以產(chǎn)生輸出音頻信號(hào),所述信號(hào)處理包括噪聲抑制和使用所述選擇的加權(quán)因子的加權(quán)求和。
文檔編號(hào)G10L15/20GK101325061SQ20081011013
公開(kāi)日2008年12月17日 申請(qǐng)日期2008年6月13日 優(yōu)先權(quán)日2007年6月13日
發(fā)明者天田皇 申請(qǐng)人:株式會(huì)社東芝
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
拉孜县| 苍南县| 洪泽县| 淮阳县| 无极县| 新疆| 凭祥市| 永靖县| 辰溪县| 禄劝| 怀集县| 高陵县| 北安市| 固安县| 雷州市| 平邑县| 万州区| 新兴县| 公主岭市| 金坛市| 清涧县| 潼南县| 闻喜县| 化州市| 孝感市| 收藏| 北碚区| 横山县| 长武县| 舟曲县| 肥城市| 内黄县| 天门市| 凤阳县| 焦作市| 乌什县| 公安县| 宁强县| 郯城县| 泰宁县| 湘潭市|