專利名稱:使用傳感器陳列進行音頻源接近度估計以用于減少噪音的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及音頻信號處理,且更明確來說,涉及近場音頻信號檢測和噪音抑制。
背景技術(shù):
例如蜂窩式電話、雙向無線電和個人數(shù)字助理(PDA)等接受音頻輸入的裝置常常在例如人群、繁忙街道、飯店、機場、車輛等不利噪音環(huán)境中使用。從音頻環(huán)境內(nèi)的各種聲源產(chǎn)生的非所要的聲音(稱為背景噪音)可從所述音頻環(huán)境內(nèi)的不同位置發(fā)出。常見實例可包括(但不限于)汽車噪音或擁擠的公共場所內(nèi)的其它話音。不管來源為何,不能區(qū)別所要音頻信號與背景噪音可導致音頻輸入信號具有降低的質(zhì)量。這些環(huán)境中的強背景噪音可使用戶的語音模糊不清并使得難以理解人在說什么。 在許多狀況下,噪音破壞語音信號且因此使所要音頻信號的質(zhì)量顯著降級。舉例來說,在蜂窩式電話中,在嘈雜環(huán)境(例如擁擠的咖啡館或繁忙的火車站)中交談的人可不能夠適當?shù)亟徽?,因為由呼叫的另一端的聽者所感覺到的被噪音破壞的語音是不可理解的。在所有這些音頻破壞的狀況下,需要通過抑制背景噪音改進所發(fā)射音頻的質(zhì)量。盡管已開發(fā)出試圖移除背景噪音的噪音過濾系統(tǒng),但是這些系統(tǒng)不能移除所有環(huán)境中的所有噪音。因此,需要一種檢測和抑制背景噪音的改進技術(shù)。
發(fā)明內(nèi)容
本文所揭示的是一種用于抑制由音頻輸入裝置接收的背景噪音的改進技術(shù)。所述技術(shù)準許音頻輸入裝置區(qū)分相對遙遠的噪聲源與在緊密接近所述裝置處發(fā)起的聲音。所述技術(shù)可應(yīng)用于移動手持機,例如蜂窩式電話或PDA、免提式耳機和其它音頻輸入裝置。利用此“緊密接近度”檢測的音頻輸入裝置能夠較佳地抑制背景噪音并提供改進的用戶體驗。根據(jù)一方面,一種確定音頻源的接近度的方法包括將來自多個傳感器的音頻信號變換到頻域。接著確定所變換音頻信號的振幅。基于對振幅的比較來確定音頻源的接近度。根據(jù)另一方面,一種確定音頻源的接近度的方法包括接收來自多個傳感器的音頻信號和將所述音頻信號變換到頻域。在多個頻率處確定所變換音頻信號的振幅。對于每一頻率,通過比較在所述頻率處的來自不同傳感器的頻譜振幅來確定差分信號。此產(chǎn)生多個差分信號?;谒霾罘中盘杹泶_定音頻源的接近度。根據(jù)另一方面,一種設(shè)備包括響應(yīng)于音頻源而輸出多個音頻信號的多個音頻傳感器。包括于所述設(shè)備中的處理器經(jīng)配置以將所述音頻信號變換到頻域,且還通過比較所變換音頻信號的振幅來確定音頻源的接近度。根據(jù)另一方面,一種設(shè)備包括用于將來自多個傳感器的多個音頻信號變換到頻域的裝置;用于確定所述所變換音頻信號的振幅的裝置;用于比較所述振幅的裝置;以及用于基于振幅的比較來確定音頻源的接近度的裝置。根據(jù)另一方面,一種計算機可讀媒體(包含可由一個或一個以上處理器執(zhí)行的指令集合)包括用于將來自多個傳感器的多個音頻信號變換到頻域的代碼;用于確定所述所變換音頻信號的振幅的代碼;用于比較所述振幅的代碼;以及用于基于振幅的比較來確定音頻源的接近度的代碼。在審查了以下各圖和詳細描述后,其它方面、特征和優(yōu)點對于所屬領(lǐng)域的技術(shù)人員來說將為或?qū)⒆兊蔑@而易見。希望所有此些額外特征、方面和優(yōu)點包括于此描述內(nèi)且受隨附權(quán)利要求書保護。
應(yīng)理解,圖式僅用于說明的目的。此外,各圖中的組件不一定按比例繪制,而是著重于說明本文中所述的技術(shù)的原理。在各圖中,相同的參考數(shù)字在所有不同視圖中指示對應(yīng)部分。圖1為包括近場音頻源和遠場背景音頻源的示范性音頻環(huán)境的圖。圖2為概念性地說明從近場音頻源發(fā)射的聲波的圖。圖3為概念性地說明從遠場音頻源發(fā)射的聲波的圖。圖4為說明通過比較來自不同音頻傳感器的信號振幅來確定音頻源的接近度的方法的流程圖。圖5為說明使用波束成形來確定音頻源的接近度的方法的流程圖。圖6為說明通過比較傳入的音頻的頻譜分量來確定音頻源的接近度的方法的流程圖。圖7為展示減少頻譜噪音的過程的過程方框圖。圖8為展示減少頻譜噪音的過程的較詳細過程方框圖。圖9為展示具有音頻源接近度估計能力的示范性耳機裝置的特定組件的方框圖。圖10展示描繪示范性背景噪音抑制的曲線圖。
具體實施例方式參考并并入有圖式的以下詳細描述描述并說明了一個或一個以上特定實施例。展示并充分詳細地描述這些實施例(提供這些實施例并非用以限制而是僅用以示范和教示) 以使所屬領(lǐng)域的技術(shù)人員能夠?qū)嵺`所主張的內(nèi)容。因此,為簡潔起見,所述描述可省略所屬領(lǐng)域的技術(shù)人員已知的特定信息。在整個本發(fā)明中使用詞“示范性”以值“充當實例、例子或說明”。沒有必要將本文中描述為“示范性”的任何事物均解釋為比其它方法或特征優(yōu)選或有利。圖1為示范性音頻環(huán)境10的圖,音頻環(huán)境10包括例如耳機16的音頻輸入裝置、 例如用戶12的嘴的近場音頻源15和例如無線電的遠場背景音頻源14。耳機16經(jīng)受近場音頻源15和遠場音頻源14的影響。遠場音頻源14比近場音頻源15距音頻輸入裝置更遠。 音頻源14、15中的每一者可為發(fā)出聲音的任何物。耳機16使用傳感器陣列以估計音頻源14、15的接近度,且其后控制包括于耳機16 中的噪音減少模塊以抑制被分類為遠場的音頻信號。在所示的實例中,傳感器陣列包括耳機16中所包括的第一音頻傳感器18和第二音頻傳感器20。音頻傳感器18、20被間隔開, 例如,其可間隔開2cm到km。音頻傳感器18、20可為麥克風或響應(yīng)于聲音輸入的任何其它合適的音頻換能器。在標稱佩戴位置處,第一音頻傳感器18比第二音頻傳感器20更接近用戶的嘴。因此,源自用戶的嘴的由第一音頻傳感器18拾取的音頻信號比由第二音頻傳感器20拾取的相同信號響。所檢測音頻信號之間的量值差可在IdB到3dB或更大的范圍內(nèi),其取決于嘴到音頻傳感器18、20的相對距離。另外,信號電平差與信號頻率相關(guān)。通常, 較高信號頻率由于衍射效應(yīng)而產(chǎn)生較高信號電平差。對于遠場音頻源14,因為音頻傳感器 18、20相對于距遠場源14的距離而彼此接近,所以音頻傳感器18、20以大致相同的振幅水平拾取遠場音頻而不管遠場音頻的到達方向如何。結(jié)果,耳機16監(jiān)視并比較兩個音頻傳感器18、20處的信號振幅水平以估計音頻源接近度。示范性耳機16包括耳機主體17和用于允許耳機16被用戶12舒適地佩戴的至少一個支撐件19 (例如耳掛)。懸臂21也可包括于耳機16中以用于將第一音頻傳感器18放置得較靠近用戶的嘴。如所示,第二音頻傳感器20可包括于耳機主體17中。在所示的實例中,耳機16為無線耳機,例如藍牙耳機,其中在一個或一個以上裝置與耳機16之間的音頻信號經(jīng)由一個或一個以上無線射頻(RF)或紅外線(IR)信道而被載運。如果實施為藍牙無線耳機,則耳機16可包括如由在www. bluetooth. com處可得到的藍牙規(guī)格所界定的組件和功能性。藍牙規(guī)格提供了用于提供無線耳機功能性的特定準則?;蛘?,耳機16可為有線耳機,其具有在裝置與耳機16之間載運音頻信號的導體。雖然將音頻輸入裝置說明為耳機16,但是本文中所揭示的音頻源接近度估計和噪音抑制技術(shù)和裝置還可包括于其它音頻輸入裝置(例如,通信裝置(例如,電話、蜂窩式電話)、PDA、視頻游戲、話音激活遙控器、現(xiàn)場報告系統(tǒng)、播音系統(tǒng)等)中。音頻輸入裝置為接
收聲音的裝置。圖2為概念性地說明經(jīng)受從近場音頻源15發(fā)射的聲波的耳機16的圖。因為第一音頻傳感器18比第二音頻傳感器20相對靠近音頻源15,所以在傳感器18、20處從源15接收到的聲音的振幅可測量地不同。此傳感器振幅的差由耳機16利用以確定音頻源是在耳機16附近還是在耳機16遠方。圖3為概念性地說明經(jīng)受從遠場音頻源14發(fā)射的聲波的耳機16的圖。因為音頻傳感器18、20相對于距遠場音頻源14的距離而彼此靠近,所以其以大致相同的振幅水平拾取音頻而不管音頻信號的到達方向如何。結(jié)果,監(jiān)視由兩個傳感器18、20接收到的信號電平的系統(tǒng)能夠估計音頻源接近度。圖4為說明一種用于基于傳感器陣列元件(例如,音頻傳感器18、20)處的音頻信號電平來估計音頻源接近度的方法的流程圖100。在方框102中,從音頻傳感器接收音頻輸入信號。每一傳感器提供一單獨的音頻信號,還稱為音頻信道。每一音頻信號表示在特定音頻傳感器處所接收的聲音。在方框104中,預(yù)先調(diào)節(jié)傳入的音頻信號。預(yù)先調(diào)節(jié)可包括對音頻信號中的每一者進行帶通濾波以排斥所關(guān)注頻率之外的干擾信號。舉例來說,音頻信號可經(jīng)濾波以移除人可聽范圍之外的信號。音頻輸入信號還可經(jīng)個別地放大以考慮個別傳感器的固有敏感度的差異。在此校正后,來自音頻傳感器的信號電平應(yīng)更準確地表示到達音頻傳感器的信號強度??稍谝纛l輸入裝置制造期間校準音頻傳感器以獲得校正放大因子。如果校正因子的使用前估計不可行,則在音頻輸入裝置操作期間經(jīng)由自動增益匹配機制可校準音頻傳感器且還可估計校正因子。音頻信號最初可作為模擬信號從傳感器接收且接著通過模/數(shù)(A/D)轉(zhuǎn)換器被轉(zhuǎn)換成數(shù)字音頻信號。可對模擬音頻信號、數(shù)字化的音頻信號或在數(shù)字和模擬處理域的任何合適組合中執(zhí)行上文描述的信號預(yù)先調(diào)節(jié)。接下來,在方框106中,確定每一音頻傳感器信號的振幅。雖然不同方法可用以確定音頻信號的振幅,但是一種方法為將音頻信號中的每一者數(shù)字化成常規(guī)數(shù)字音頻格式, 例如PCM(脈碼調(diào)制)音頻,其中音頻樣本在一時間序列中。接著,將來自每一傳感器的數(shù)字化的傳入的音頻信號劃分為預(yù)定長度(例如,IOmS(毫秒))的音頻幀??墒褂闷渌线m的幀長度,例如20mS。接著逐幀地計算每一音頻信號的振幅。如以下等式針對每一傳感器計算幀中的音頻信號的振幅ampk (η) =Σ 11 xk (t) |p等式 1在等式1中,amp (η)表示第η個幀的音頻信號振幅,η為幀索引,xk(t)表示時間t 處的數(shù)字音頻樣本,k表示第k個傳感器,且t為傳入的音頻信號樣本的時間索引。ρ為預(yù)先挑選的參數(shù),其可具有大于1的值,例如,P可等于二。對幀中的所有音頻樣本求和。對于每一傳感器,還可使用平滑函數(shù)在連續(xù)幀上對音頻信號振幅ampk(η)進行平滑,例如amp_smk (η) = α · ampk (η) + (1_ α ) · amp_smk(n_l)等式 2在等式2中,amp_Smk(n)為第η個幀的經(jīng)平滑的振幅值,amp_Smk(n-l)為第(n_l) 個幀的經(jīng)平滑的振幅值,且α為預(yù)定義加權(quán)常數(shù),其優(yōu)選具有小于1的值。另外,可任選地將經(jīng)平滑的幀振幅轉(zhuǎn)換到對數(shù)域。可根據(jù)以下等式3將經(jīng)平滑的幀振幅轉(zhuǎn)換到對數(shù)域log_amp_smk(n) = log(amp_smk(n))等式 3在等式3中,log_amp_smk(n)為第η個幀的經(jīng)平滑的振幅值的對數(shù)值。在方框108中,接著逐幀地比較音頻信道振幅以找出信道振幅之間的差。舉例來說,對于具有兩個元件的傳感器陣列(如圖1中所示),可如以下等式計算差diffAmp(n)diffAmp(n) = log_amp_sm1 (η) -log_amp_sm2 (η)等式 4在等式4中,difTAmp(n)表示第一音頻信道和第二音頻信道的第η個幀的信道振幅之間的差?;蛘?,可在不將振幅轉(zhuǎn)換到對數(shù)域的情況下通過計算兩個信道的amp_Smk(n) 之間的差來計算振幅差。在方框110中,確定音頻源的接近度。為實現(xiàn)此,將音頻信道之間的振幅差與預(yù)定義的閾值進行比較。舉例來說,將等式4的diffAmp(n)與閾值進行比較。如果在預(yù)定義數(shù)目的連續(xù)幀中diffAmp(n)大于閾值,則近場旗標被觸發(fā)到設(shè)定狀態(tài)。所述經(jīng)設(shè)定的旗標指示音頻傳感器已檢測到緊密接近音頻輸入裝置的音頻源。此旗標可一直保持開(on)直到在預(yù)定義數(shù)目的連續(xù)幀中diffAmp(n)降到閾值以下為止。當由于傳入的音頻信號被分類為遠場且因此被視為背景噪音,所以近場旗標為關(guān)(off)時,音頻輸入裝置的噪音減少/抑制模塊可抑制信號。作為信道振幅差的替代,可通過除以預(yù)定義的規(guī)格化因子從diffAmp(n)計算每一幀的near_f ield_score,如(例如)以下等式5所給出
權(quán)利要求
1.一種確定音頻源的接近度的方法,其包含 將來自多個傳感器的多個音頻信號變換到頻域; 確定所述經(jīng)變換音頻信號的振幅;比較所述振幅;以及基于對所述振幅的所述比較來確定所述音頻源的所述接近度。
2.根據(jù)權(quán)利要求1所述的方法,其進一步包含 將所述音頻信號中的每一者波束成形。
3.根據(jù)權(quán)利要求1所述的方法,其進一步包含 將所述經(jīng)變換音頻信號中的每一者波束成形。
4.根據(jù)權(quán)利要求1所述的方法,其進一步包含 對所述音頻信號中的每一者進行帶通濾波。
5.根據(jù)權(quán)利要求1所述的方法,其進一步包含 通過相應(yīng)校正因子放大所述音頻信號中的每一者。
6.根據(jù)權(quán)利要求1所述的方法,其中變換包括將FFT、DCT、DFT、小波變換或前述變換的任何合適組合應(yīng)用于所述音頻信號。
7.根據(jù)權(quán)利要求1所述的方法,其進一步包含 將所述音頻信號劃分為多個幀;確定用于所述幀中的每一者的每一經(jīng)變換音頻信號的振幅,借此產(chǎn)生所述振幅; 在所述幀上平滑所述振幅;將所述經(jīng)變換音頻信號的所述經(jīng)平滑的振幅彼此進行比較以產(chǎn)生至少一個差分信號;以及基于所述差分信號來確定所述音頻源的所述接近度。
8.根據(jù)權(quán)利要求7所述的方法,其進一步包含 規(guī)格化所述差分信號。
9.根據(jù)權(quán)利要求7所述的方法,其進一步包含 將所述經(jīng)平滑的振幅轉(zhuǎn)換到對數(shù)域。
10.根據(jù)權(quán)利要求7所述的方法,其進一步包含 將非線性函數(shù)應(yīng)用于所述差分信號以產(chǎn)生接近度得分。
11.根據(jù)權(quán)利要求10所述的方法,其中所述非線性函數(shù)為S形函數(shù)。
12.一種確定音頻源的接近度的方法,其包含 從多個傳感器接收多個音頻信號;將所述音頻信號變換到頻域;確定多個頻率處的所述經(jīng)變換音頻信號的振幅;對于所述頻率中的每一者,通過比較對應(yīng)于所述頻率的所述振幅來確定差分信號,借此確定多個差分信號;以及基于所述差分信號來確定所述音頻源的所述接近度。
13.根據(jù)權(quán)利要求12所述的方法,其進一步包含將所述頻率中的每一者處的所述差分信號與預(yù)定閾值進行比較;以及基于用于所述頻率中的每一者的所述差分信號與所述預(yù)定閾值的所述比較來確定所述頻率中的每一者處的近場旗標。
14.根據(jù)權(quán)利要求12所述的方法,其進一步包含 將所述音頻信號劃分為多個幀;以及確定所述幀中的每一者的所述振幅。
15.根據(jù)權(quán)利要求14所述的方法,其進一步包含 在所述幀上平滑所述振幅。
16.根據(jù)權(quán)利要求15所述的方法,其進一步包含 將所述經(jīng)平滑的振幅轉(zhuǎn)換到對數(shù)域。
17.根據(jù)權(quán)利要求12所述的方法,其進一步包含規(guī)格化所述差分信號以確定所述頻率中的每一者處的接近度得分。
18.根據(jù)權(quán)利要求12所述的方法,其進一步包含將非線性函數(shù)應(yīng)用于所述差分信號以產(chǎn)生所述頻率中的每一者處的接近度得分。
19.一種設(shè)備,其包含多個音頻傳感器,其響應(yīng)于音頻源而輸出多個音頻信號;以及接近度檢測模塊,其經(jīng)配置以將所述音頻信號變換到頻域,并通過比較所述經(jīng)變換音頻信號的振幅來確定所述音頻源的接近度。
20.根據(jù)權(quán)利要求19所述的設(shè)備,其中所述設(shè)備為耳機。
21.根據(jù)權(quán)利要求20所述的設(shè)備,其中所述耳機為無線耳機。
22.根據(jù)權(quán)利要求19所述的設(shè)備,其進一步包含噪音減少/抑制模塊,其響應(yīng)于來自所述接近度檢測模塊的輸出。
23.根據(jù)權(quán)利要求22所述的設(shè)備,其中所述噪音減少/抑制模塊經(jīng)配置以估計音頻信號頻譜和噪音信號頻譜。
24.根據(jù)權(quán)利要求19所述的設(shè)備,其進一步包含 麥克風校準模塊。
25.根據(jù)權(quán)利要求19所述的設(shè)備,其進一步包含 話音活動檢測(VAD)模塊。
26.根據(jù)權(quán)利要求19所述的設(shè)備,其進一步包含 回音消除模塊。
27.一種設(shè)備,其包含用于將來自多個傳感器的多個音頻信號變換到頻域的裝置; 用于確定所述經(jīng)變換音頻信號的振幅的裝置; 用于比較所述振幅的裝置;以及用于基于對所述振幅的所述比較來確定音頻源的接近度的裝置。
28.一種包含可由一個或一個以上處理器執(zhí)行的指令集合的計算機可讀媒體,其包含用于將來自多個傳感器的多個音頻信號變換到頻域的代碼; 用于確定所述經(jīng)變換音頻信號的振幅的代碼; 用于比較所述振幅的代碼;以及用于基于對所述振幅的所述比較來確定音頻源的接近度的代碼。
29.根據(jù)權(quán)利要求觀所述的計算機可讀媒體,其進一步包含 用于噪音減少/抑制的代碼。
30.根據(jù)權(quán)利要求四所述的計算機可讀媒體,其進一步包含 用于估計音頻信號頻譜和噪音信號頻譜的代碼。
31.根據(jù)權(quán)利要求觀所述的計算機可讀媒體,其進一步包含 用于話音活動檢測的代碼。
32.一種確定音頻源的接近度的方法,其包含 從多個傳感器接收多個音頻信號;將所述音頻信號波束成形; 確定所述經(jīng)波束成形的音頻信號的振幅; 比較所述振幅;以及基于對所述振幅的所述比較來確定所述音頻源的所述接近度。
33.根據(jù)權(quán)利要求32所述的方法,其中確定包含 計算近場得分;以及基于所述近場得分來確定所述音頻源的所述接近度。
34.根據(jù)權(quán)利要求32所述的方法,其中確定包含 計算近場概率值;以及基于所述近場概率值來確定所述音頻源的所述接近度。
35.根據(jù)權(quán)利要求32所述的方法,其進一步包含 通過相應(yīng)校正因子放大所述音頻信號中的每一者。
36.根據(jù)權(quán)利要求32所述的方法,其進一步包含 將所述音頻信號劃分為多個幀;確定用于所述幀中的每一者的每一經(jīng)波束成形的音頻信號的振幅,借此產(chǎn)生所述振幅;在所述幀上平滑所述振幅;將所述經(jīng)波束成形的音頻信號的所述經(jīng)平滑的振幅彼此進行比較以產(chǎn)生至少一個差分信號;以及基于所述差分信號來確定所述音頻源的所述接近度。
37.根據(jù)權(quán)利要求36所述的方法,其進一步包含 規(guī)格化所述差分信號。
38.根據(jù)權(quán)利要求36所述的方法,其進一步包含 將非線性函數(shù)應(yīng)用于所述差分信號以產(chǎn)生接近度得分。
全文摘要
通過將來自多個傳感器(18、20)的音頻信號變換到頻域而實現(xiàn)對音頻源(14、15)的接近度的估計。接著確定所述經(jīng)變換音頻信號的振幅。基于對頻域振幅的比較來確定所述音頻源的所述接近度。此估計準許裝置(16)區(qū)分相對遙遠的音頻源(14)與緊密接近所述裝置的音頻源(15)。所述技術(shù)可應(yīng)用于移動手持機,例如蜂窩式電話或PDA、免提式耳機和其它音頻輸入裝置。利用此“緊密接近度”檢測的裝置能夠較佳地抑制背景噪音并提供改進的用戶體驗。
文檔編號G10L21/00GK102197422SQ200980142292
公開日2011年9月21日 申請日期2009年10月23日 優(yōu)先權(quán)日2008年10月24日
發(fā)明者張國亮 申請人:高通股份有限公司