專利名稱:用于定位音頻源的方法以及多通道的聽力系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及一種用于利用多通道的聽力系統(tǒng)來定位音頻源的方法。此外,本發(fā)明還涉及一種對應的帶有多個輸入通道的多通道的聽力系統(tǒng),尤其是還涉及一種雙耳聽力系統(tǒng)。雙耳聽力系統(tǒng)在這里被理解為一種可以用來為使用者的雙耳提供聲音的系統(tǒng)。特別是被理解為一種雙耳助聽器系統(tǒng),其中使用者在兩個耳朵上佩戴了為各自耳朵傳聲的助聽器。
背景技術:
助聽器是為聽力差的人提供聲音的便攜式聽力裝置。為了迎合多種個性化的需要,提供了助聽器的不同結構形式,如耳后助聽器(Hinter-dem-Ohr-Hoergeraete, HdO)、具有外部聽筒的助聽器(RIC receiver in the canal)和耳內式助聽器(In-dem-Ohr-Hoergeraete,IdO),例如還有外耳式助聽器或耳道式助聽器 (Kanal-Hoergeraete,ITE,CIC)。這些示例性解釋的助聽器佩戴在外耳上或者耳道內。此外,市場上還提供了骨傳導助聽器、可植入式助聽器或振感助聽器。在此,對受到損傷的聽力或者通過機械或者通過電進行刺激。助聽器原則上具有作為基本部件的輸入轉換器、放大器以及輸出轉換器。輸入轉換器通常是一種聲音接收器(例如麥克風)和/或電磁接收器(例如感應線圈)。輸出轉換器大多作為電聲轉換器(例如微型揚聲器)或者作為電子機械轉換器(例如骨傳導耳機) 實現。放大器通常被集成到信號處理單元中。在圖1中以耳后助聽器為例示出這種原理結構。在用于配戴在耳后的助聽器外殼1內,安裝一個或者多個麥克風2,用于接收來自環(huán)境的聲音。同樣被集成在助聽器外殼1中的信號處理單元3處理麥克風信號并將其放大。信號處理單元3的輸出信號被傳輸到一個輸出聲音信號的揚聲器或聽筒4上。聲音必要時通過一個采用耳塑件固定在耳道內的傳聲軟管傳遞到助聽器佩戴者的鼓膜。助聽器的供電和特別是信號處理單元3的供電通過一個同樣被集成到助聽器外殼1中的電池5進行。一般地,計算機支持的情景分析系統(tǒng)(CASA Computational SceneAnalysis System)通過對當前聲源的以及優(yōu)選地也對當前環(huán)境的空間定位和分類,實現了對當前情景的描述。為了直觀起見,這里描述所謂“雞尾酒會問題(Party-Cocktail problem)”。多個交談的發(fā)音者產生了一種背景談話噪聲,兩個人靠近觀察者地交談(定向的聲音),某些音樂來自于另一個方向并且產生某種空間回響效應。類似于人類聽覺能夠定位并區(qū)分出不同的音頻源,CASA系統(tǒng)試圖按照類似的方式來模仿該功能,使得至少可以從聲音混合中定位并分類每個聲源(例如,說話、音樂、干擾噪聲,等)。與此相關的信息不僅對于助聽器程序選擇是寶貴的,而且例如對于所謂波束形成器(Beamformer)(空間濾波器)也是寶貴的, 該波束形成器可以在所希望的方向上偏轉,以便放大對于助聽器攜帶者的所希望的信號。通常的CASA系統(tǒng)如下地工作通過傅里葉變換或者通過類似的變換(例如,小波變換、伽馬聲調濾波器組,等等),將音頻信號變換到時間-頻率域(T-F)中。在此,也就是將信號變換到多個短期頻譜。
圖2示出了這種常規(guī)的CASA系統(tǒng)的框圖。左助聽器的麥克風10的信號以及右助聽器的麥克風11的信號,被共同送至濾波器組12,后者進行提到的至T-F域中的變換。然后,在分割單元13中將T-F域中的信號分割成分開的T-F塊。這些T-F塊是短期頻譜,其中,這些塊通常在所謂的“T-F起點檢測(T-F-Onset-Detektion) ”之后開始,S卩,當信號的頻譜超過一定的電平時。通過分析其它特征確定塊的長度。這些特征典型地包括偏移量 (Offset)和/或相關性(KoMrenz )。因此,設置了特征提取單元14,其從T-F域中的信號中提取特征。例如,這類特征是兩耳時差(ITD)、兩耳電平差(ILD)、塊互相關、基礎頻率,等等??梢越柚谒烙嫽蛘呤撬崛〉奶卣?ITD、ILD)執(zhí)行對每個源的定位15。不過,也可以將來自提取單元14的所提取的特征用來控制分割單元13。在編組單元16中將在分割單元13之后所得到的相對小的塊再次組合,以便表達不同的源。為此,對提取單元14所提取的特征進行特征分析17,其結果被用于編組。這樣所編組的塊被送至分類單元18,利用后者應該識別出,產生一個塊組的信號的源是何種類型。該分類的結果以及分析17的特征被用于描述情景19。然而,按照這種方式對聲學情景的描述經常是有錯誤的。特別是,不容易精確地分開或描述來自一個方向的多個源,因為小的T-F塊僅僅包含很少的信息。
發(fā)明內容
因此,本發(fā)明要解決的技術問題是,在多通道的聽力系統(tǒng)中改善對聲源的檢測和定位。按照本發(fā)明,上述技術問題通過一種用于利用多通道的聽力系統(tǒng)來定位至少一個音頻源的方法來解決,其中,該方法在該多通道的聽力系統(tǒng)的輸入信號中檢測起源于音頻源的、規(guī)定種類的信號,并且隨后根據所檢測的信號定位音頻源。此外,本發(fā)明提供了一種帶有多個輸入通道的多通道的聽力系統(tǒng),包括檢測裝置,用于在該多通道的聽力系統(tǒng)的輸入信號中檢測起源于音頻源的、規(guī)定種類的信號;以及定位裝置,用于根據所檢測的信號定位音頻源。按照具有優(yōu)勢的方式,在定位之前進行對已知信號分量的檢測或者分類。由此,在定位之前可以將信號分量系統(tǒng)地對應于其內容進行組合。信號分量的組合導致關于特定源的信息量提高,使得可以更可靠地進行其定位。優(yōu)選地,在檢測中檢查輸入信號的規(guī)定的特征,并且,在以對于該種類的規(guī)定強度存在規(guī)定的特征的條件下,在輸入信號的特定時間窗口中的規(guī)定種類的信號視為被檢測到。因此,借助于分類進行檢測。規(guī)定的特征可以是諧音信號分量或者是共振峰的凸顯。由此,尤其可以獲得例如關于信號種類“語音”的標志性特征。按照一種特殊的實施方式,在輸入信號中檢測規(guī)定種類的多個信號,并且按照預定的標準與不同的音頻源相關聯(lián)。由此,例如也可以基于例如濁音(stimmhaften Laute) 的基礎頻率來相互分開不同的說話者。按照本發(fā)明的一種擴展,在定位之前根據所檢測的信號從輸入信號中濾除信號分量。即,利用檢測階段,來提高待定位的源的有用信號成分。即,濾除或者壓制干擾的信號成分。
4
通過已知的定位算法以及隨后積累的統(tǒng)計資料,來進行對音頻源的定位。由此可以援引已知的用于定位的方法。對于定位來說通常需要的是,在雙耳聽力系統(tǒng)的設備之間交換信號。因為此時在準備階段已經進行了對相關信號的檢測,對于定位來說此時僅僅還需要的是,在雙耳聽力系統(tǒng)的單個設備之間傳輸所檢測的以及必要時濾波后的信號分量。即,不傳輸不是針對特殊種類進行所檢測的或者沒有分類的信號分量,從而顯著地減少待傳輸數據的量。
下面結合附圖對本發(fā)明作進一步說明,附圖中圖1示出了按照現有技術的助聽器的原理略圖;圖2示出了已知情景分析系統(tǒng)的框圖;圖3示出了按照本發(fā)明的系統(tǒng)的框圖;以及圖4對于兩個分開的聲音源示出了圖3的系統(tǒng)的不同信號的信號圖。
具體實施例方式下面詳細描述的實施例構成了本發(fā)明的優(yōu)選實施方式。本發(fā)明的基本思路在于,在第一步驟中對多通道的、尤其是雙耳聽力系統(tǒng)的輸入信號的部分進行檢測、濾波,并且在第二步驟中定位對應的源。為了檢測,從該輸入信號中提取特定的特征,使得可以進行分類。在圖3中示出了按照本發(fā)明的(這里是雙耳)聽力系統(tǒng)的框圖。在此,僅僅標出了對于本發(fā)明基本的部件。雙耳聽力系統(tǒng)的其它部件由圖1以及對其的描述中給出。按照圖3中例子的雙耳聽力系統(tǒng)包括在左設備(特別是助聽器)中的麥克風20以及另一個在右(聽力)設備中的麥克風21。作為替換,也可以選擇其它帶有多個輸入通道的多通道的聽力系統(tǒng),例如,帶有多個麥克風的唯一一個助聽器。如在圖2中的例子中那樣,兩個麥克風信號通過濾波器組22被變換到時間-頻率域(T-F),從而得到雙耳總信號的對應的短期頻譜。不過,借助于這種濾波器組22也可以將輸入信號變換到不同的表示。濾波器組22的輸出信號被送至特征提取單元23。特征提取單元23的功能在于, 估計如下的特征,即這些特征可以被用于在信號種類之間進行可靠的(基于模型的)檢測以及明確的區(qū)分。這種特征例如是調和性(諧音信號分量的強度)、信號分量的起始特性、 濁音的基礎頻率(音調),以及自然也包括選擇多個這種特征。基于特征提取單元23所提取的特征,檢測單元24試圖在例如T-F域中從濾波器組22的信號中檢測以及提取(孤立)已知的信號分量。例如,如果希望估計一個或多個說話者的方向,則所尋找的信號分量可以是元音。為了檢測元音,系統(tǒng)可以尋找具有較高的調和性(即凸顯的諧音)和特定的共振峰結構的信號分量。不過,元音檢測是一種啟發(fā)式的以及不可靠的途徑,而通用的CASA系統(tǒng)應該也能夠檢測其它種類作為語音。因此,要采用一種在監(jiān)視的學習和盡可能優(yōu)化的特性提取基礎上的理論上的途徑。檢測塊24的首要目標不是檢測特殊的信號分量的每次出現,而是僅僅識別能夠被可靠地檢測的信號分量。如果個別的塊不能通過系統(tǒng)被相關聯(lián),則總是還可以關聯(lián)其它的。與此相反,對信號的錯誤檢測則降低了隨后信號塊的說服力。
在按照本發(fā)明算法的下一步驟中進行判決控制的濾波25 (DDF =Decision Directed Filtering)。將所檢測的信號從信號混合中濾除,以便增加后面處理塊(這里是定位)的效率。例如,可以再次考慮對在語音信號中元音的檢測。如果檢測到了元音,則可以例如利用其所估計的共振峰結構,來濾除在該共振峰結構外部記錄的不希望的干擾。在該算法的最后步驟中,在濾波25所提取的信號分量的基礎上進行一種可自由選擇的定位方法26。然后,將信號源的位置連同合適的種類用于描述聲學情景27。該定位例如可以通過簡單的積累的統(tǒng)計資料28或者通過采用高度開發(fā)的途徑(例如在圍繞聽筒的空間中跟蹤每個源)來進行。與其它算法相比,本發(fā)明方法的最顯著的優(yōu)點是,不需要解決編組特定T-F值或塊的問題(類似于盲源分離的已知問題)。即使由現有技術所公知的系統(tǒng)多有不同(特征的數量以及不同的編組途徑),所有這些系統(tǒng)基本上具有相同的限制。一旦T-F塊通過固定的判決規(guī)則相互孤立,則必須將它們再次一起編組。但是,在單個小的塊中的信息通常對于在實際情形中的編組來說是不充分的。與此相反,按照本發(fā)明的途徑則由于利用了整個頻率范圍(而不是僅僅個別頻率或個別的頻帶)而允許高精度的單個源定位。所建議的系統(tǒng)的另一個值得提及的特性是,在相同方向上也可以檢測和定位多個源的能力,如果這些源屬于不同的種類的話。例如,可以將具有相同DOA(Direction of Arrival,到達方向)的一個音樂源以及一個語音源正確地識別為按照兩個種類的兩個信號。
此外,可以利用說話者識別塊來擴展按照本發(fā)明的系統(tǒng),使得可以跟蹤所希望的信號。實際的用途可以例如是,定位并且識別所希望的源(例如,主導的說話者或者一個由助聽器佩帶者所選擇的語音源)。于是,如果該源在空間中移動,則助聽器系統(tǒng)自動地跟蹤其位置并且可以例如將波束形成器偏轉到新的方向。按照本發(fā)明的算法必要時還可以減少在左和右助聽器(無線連接)之間的數據率。即,如果為了定位,在助聽器之間僅僅傳輸左和右信號的所檢測的部分(或者甚至僅僅是它們的代表),則需要傳輸比在完整的信號傳輸中顯著地更少的數據。按照本發(fā)明的算法允許按照高的空間分辨率連同其分類來定位同時的聲學源。為了說明該新途徑的效率,在圖4中示出了在完整的聲學情景中定位元音。該情景如下語音源按照方向φ = 30°出現并且具有功率ρ = -25dB。音樂源位于φ = -30°處并且具有功率ρ =_25dB。此外,存在帶有功率P = -27dB的擴散語音噪聲以及帶有功率P = _70dB的高斯噪聲。在圖4的圖示中,向上標繪了強度或者功率并且向右標繪了以度為單位的角度,圖中基本上可以確定兩個信號峰,它們表示了兩個信號源(語音源和音樂源)。曲線I示出了在濾波器組22(參見圖3)之后在整個頻譜上的輸入信號。該信號在此還沒有被進一步處理。 曲線II示出了在通過檢測單元24(參見圖3)檢測元音之后的信號。最后,曲線III代表了在濾波單元25 (同樣參見圖3)之后的定位結果,其中,采用了已知的理想的共振峰掩模。 即,對應于曲線III可以明確地定位語音源。可以修改按照本發(fā)明的算法。例如,對信號以及其源不僅進行定位和分類,而且也可以將對應的信息反饋到分類檢測器24中,從而可以迭代地改善該定位結果。不過,也可以將該反饋用于跟蹤源。此外,可以將該途徑用于確定頭部轉動。在此,可以單獨地使用該系統(tǒng),或者作為帶有加速度計的物理的頭部運動檢測系統(tǒng)的一部分來使用。
該系統(tǒng)的另一種修改可以是,將對所希望的信號的估計方向(DOA)用于控制在檢測器之前的波束形成器,以便改善整個系統(tǒng)的效率。上面說明的例子涉及語音源的定位。不過,所建議的系統(tǒng)也可以檢測其它種類的信號。為了檢測和分類不同的信號,必須采用信號的不同的特征以及必要時不同的表示。例如,如果希望檢測音樂信號,則必須利用不同的樂器來訓練該系統(tǒng),并且必須采用合適的檢測器。本發(fā)明系統(tǒng)的原理首先是作為用于助聽器的算法實現的。不過,應用并不限于助聽器。而是,也可以將這種方法應用于盲人的導航系統(tǒng),以便例如在公共場所處定位特定噪聲,或者在另外的應用中通過聲學途徑在大的機器中找出有故障的部件。參考標記清單
1助聽器外殼
2麥克風
3信號處理單元
4揚聲器或聽筒
5電池
10麥克風
11麥克風
12濾波器組
13分割單元
14特征提取單元
15定位
16編組單元
17分析
18分類單元
19情景
20麥克風
21麥克風
22濾波器組
23特征提取單元
24檢測單元
25濾波
26定位方法
27情景
28統(tǒng)計資料
I, II, III曲線
權利要求
1.一種用于利用多通道的聽力系統(tǒng)來定位至少一個音頻源的方法,其特征在于,-在該多通道的聽力系統(tǒng)的輸入信號(I)中檢測(24)起源于所述音頻源的、規(guī)定種類的信號,并且-隨后根據所檢測的信號(II)定位(26)所述音頻源。
2.根據權利要求1所述的方法,其中,在檢測中檢查輸入信號(I)的規(guī)定的特征,并且, 在以對于該種類的規(guī)定強度存在規(guī)定的特征的條件下,在輸入信號中的該規(guī)定種類的信號視為被檢測到。
3.根據權利要求2所述的方法,其中,所述規(guī)定的特征是諧音信號分量或者是共振峰。
4.根據權利要求3所述的方法,其中,所述規(guī)定種類是“語音”。
5.根據上述權利要求中任一項所述的方法,其中,在輸入信號中檢測規(guī)定種類的多個信號,并且按照預定的標準與不同的音頻源相關聯(lián)。
6.根據權利要求5所述的方法,其中,所述不同的音頻源是多個說話者。
7.根據上述權利要求中任一項所述的方法,其中,在定位(26)之前根據所檢測的信號 (II)從輸入信號中濾除信號分量。
8.根據上述權利要求中任一項所述的方法,其中,利用定位算法通過積累的統(tǒng)計資料 (28)來進行定位(26)。
9.根據上述權利要求中任一項所述的方法,其中,所述多通道的聽力系統(tǒng)是雙耳聽力系統(tǒng),并且,為了定位(26),在雙耳聽力系統(tǒng)的單個設備之間僅僅傳輸輸入信號的所檢測的信號分量。
10.一種帶有多個輸入通道的多通道的聽力系統(tǒng),其特征在于,-檢測裝置,用于在該多通道的聽力系統(tǒng)的輸入信號中(I)檢測(24)起源于音頻源的、 規(guī)定種類的信號;以及_定位裝置,用于根據所檢測的信號(II)定位(26)所述音頻源。
全文摘要
本發(fā)明涉及用于定位音頻源的方法以及多通道的聽力系統(tǒng)。要利用多通道的、特別是雙耳聽力系統(tǒng)來可靠地定位聲音源。因此提出了一種用于定位(26)至少一個音頻源的方法,其中,在該多通道的聽力系統(tǒng)的輸入信號(I)中檢測起源于該音頻源的、規(guī)定種類的信號。隨后根據所檢測的信號(II)定位(26)該音頻源。即,首先寬帶地確定信號的性質以及隨后確定源的位置。
文檔編號H04R25/00GK102316404SQ20111018587
公開日2012年1月11日 申請日期2011年7月4日 優(yōu)先權日2010年7月7日
發(fā)明者V.鮑斯 申請人:西門子醫(yī)療器械公司