專利名稱:信號(hào)處理設(shè)備、信號(hào)處理方法和程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信號(hào)處理設(shè)備、信號(hào)處理方法和程序。更具體地,本發(fā)明涉及如下這 樣的信號(hào)處理設(shè)備、信號(hào)處理方法和程序其用于通過ICA(獨(dú)立分量分析)對(duì)于每個(gè)(聲 音)源分離多個(gè)聲音的混合信號(hào),并用于通過使用分離信號(hào)(即,分離結(jié)果)來執(zhí)行任意位 置處的聲音信號(hào)的分析(如,安裝在相應(yīng)任意位置的每一麥克風(fēng)所要采集的聲音信號(hào)的分 析(即,對(duì)于各個(gè)麥克風(fēng)的投射返回(proj ection-back)))。
背景技術(shù):
存在ICA(獨(dú)立分量分析)作為用于分離包括在多個(gè)聲音的混合信號(hào)中的單獨(dú)源 信號(hào)的技術(shù)。ICA是一種多變量分析,并且它是基于信號(hào)的統(tǒng)計(jì)特性來分離多維信號(hào)的方 法。對(duì)于 ICA 本身的詳細(xì)內(nèi)容,例如,參見〃 NYUMONDOKURITSU SEIBUN BUNSEKI (Introdu ction-Independent ComponentAnalysis)" (Noboru Murata, Tokyo Denki University Press)0本發(fā)明涉及如下這樣的技術(shù)其用于通過ICA(獨(dú)立分量分析)對(duì)于每一(聲音) 源分離多個(gè)聲音的混合信號(hào),并用于通過使用分離信號(hào)(即,分離結(jié)果)執(zhí)行例如對(duì)于安裝 在各個(gè)任意位置的各個(gè)麥克風(fēng)的投射返回。例如,這種技術(shù)可以實(shí)現(xiàn)如下處理。(1)基于定向麥克風(fēng)采集的聲音來執(zhí)行ICA,并且將作為分離所采集的聲音的結(jié) 果而獲得的分離信號(hào)投射返回全向麥克風(fēng)。(2)基于安排為適配于源分離的麥克風(fēng)采集的聲音來執(zhí)行ICA,并且將作為分 離所采集的聲音的結(jié)果而獲得的分離信號(hào)投射返回安排為適配于D0A(Direction of Arrival,到達(dá)方向)估計(jì)或源位置估計(jì)的麥克風(fēng)。將參照?qǐng)D1描述對(duì)于聲音信號(hào)的ICA,特別地,時(shí)頻域中的ICA。假設(shè)這樣的情形如圖1所示,對(duì)于產(chǎn)生不同的聲音來說,數(shù)量為N的聲音源是有 效的,而數(shù)量為n的麥克風(fēng)用于觀測(cè)這些聲音。直到從聲音源產(chǎn)生的聲音(聲音信號(hào))到 達(dá)麥克風(fēng)為止存在時(shí)間延遲和反射。從而,可以將由麥克風(fēng)j觀測(cè)到的信號(hào)(觀測(cè)信號(hào)) 表示為通過對(duì)于所有聲音源將源信號(hào)與傳輸函數(shù)的卷積進(jìn)行相加的如下公式[1.1]。在下 文中,將這樣的混合稱為“卷積混合”。此外,可以由如下的單個(gè)公式[1. 2]表示所有麥克風(fēng)的觀測(cè)信號(hào)。
在以上公式中,x(t)和s(t)分別是具有元素xk(t)和sk(t)的列矢量,并且A[1]是 具有元素&10_(1)的(nXN)矩陣。注意,在下面的描述中假設(shè)n = N。眾所周知,可以將時(shí)域中的卷積混合表示為時(shí)頻域中的瞬時(shí)混合。時(shí)頻域中的ICA 利用了這種特性。關(guān)于時(shí)頻域ICA 本身,參見“19. 2. 4. Fourier Transform Method in' DetailedExplanation independent Component Analysis“‘、日本待審專禾1J串i青公 開 No. 2006-238409、“ APPARATUS AND METHOD FOR SEPARATING AUDI0SIGNALS"等。主要關(guān)于與本發(fā)明實(shí)施例有關(guān)的要點(diǎn)進(jìn)行下面的描述。通過將公式[1. 2]兩側(cè)經(jīng)歷短時(shí)傅立葉變換,獲得如下的公式[2. 1]。
及
在以上公式[2.1]中,
是頻率窗口(frequency bin)的索引(《 = 1到M,M是頻率窗口的總數(shù)),以
.[2.7]
t是幀的索引(t = 1到T,T是幀的總數(shù))。
如果假設(shè)《固定,則可以將公式[2. 1]看作表示瞬時(shí)混合(即,沒有時(shí)間延遲 的混合)。為了分離觀測(cè)信號(hào),因此,準(zhǔn)備用于計(jì)算分離信號(hào)[Y](S卩,分離結(jié)果)的公式 [2.5],并且確定分離矩陣1( )以便分離結(jié)果Y( ,t)的各個(gè)分量彼此最獨(dú)立。
根據(jù)現(xiàn)有技術(shù)的時(shí)頻域ICA已經(jīng)伴隨有稱為“置換問題”的問題,即在各窗口 之間將哪個(gè)分量分離到哪個(gè)聲道并不一致的問題。然而,通過日本待審專利申請(qǐng)公開 No. 2006-238409, " APPARATUS AND METHOD FORSEPARATING AUDIO SIGNALS"(其為與本 申請(qǐng)相同的發(fā)明人所進(jìn)行的專利申請(qǐng))中公開的方法,已經(jīng)基本上解決了置換問題。由于 現(xiàn)有技術(shù)的方法也用在本發(fā)明實(shí)施例中,因此下面將簡(jiǎn)要地描述在日本待審專利申請(qǐng)公開 No. 2006-238409中公開的用于解決置換問題的方法。在日本待審專利申請(qǐng)公開No. 2006-238409中,為了獲得分離矩陣W( ),反復(fù)地 執(zhí)行下列公式[3.1]到[3. 3]的計(jì)算,直到分離矩陣W( )收斂(或預(yù)定次數(shù))為止
.[3.2]=
P(Yk(t)) :Yk(t)的概率密度函數(shù)(
[3.6]
.[3.9]
在下文中,將這些重復(fù)的執(zhí)行稱為“獲知(learning)”。注意,對(duì)所有頻率窗口執(zhí) 行下列公式[3. 1]到[3.3]的計(jì)算,并且對(duì)累積的觀測(cè)信號(hào)的所有幀執(zhí)行公式[3. 1]的計(jì) 算。在公式[3. 2]中,t表示幀號(hào),<>t表示各幀在某一區(qū)域內(nèi)的平均。附于Y( ,t)的右 上角的H表示厄密轉(zhuǎn)置(Hermitian transpose)。厄密轉(zhuǎn)置意味著這樣的處理進(jìn)行矢量 或矩陣的轉(zhuǎn)置并將元素轉(zhuǎn)換為共軛復(fù)數(shù)。分離信號(hào)Y(t) (S卩,分離結(jié)果)由公式[3.4]表示,其以包括分離結(jié)果的所有聲道 和所有頻率窗口的元素的矢量的形式表示。此外,cpcoCYCt))是公式[3. 5]表示的矢量。該矢
量的每一個(gè)元素q^YCt))稱作分?jǐn)?shù)函數(shù),其為Yk(t)的多維(多變量)概率密度函數(shù)(PDF)
的對(duì)數(shù)差分(公式[3.6])。例如,公式[3.7]所表示的函數(shù)可以用作多維PDF。在此情況
下,分?jǐn)?shù)函數(shù)(pM(Y(t))可以用公式[3.9]表示。在公式[3.9]中,||Yk(t) ||2表示矢量Yk(t)
的L-2范數(shù)(norm)(即,所有元素的平方和的平方根)。將Yk(t)的L_m范數(shù)(即,L-2的 一般化表示)定義為公式[3.8]。此外,公式[3.7]和[3.9]中的、是用于調(diào)整Yk( ,t) 的尺度(scale)的項(xiàng)(term),并且將合適的正常數(shù)(如,sqrt (M)(頻率窗口的數(shù)量的平方 根))分配給、。進(jìn)一步,公式[3. 3]中的n稱為獲知速率或獲知系數(shù),并且其為較小的正 值(如,約為1)。在分離矩陣W( )逐漸變化時(shí),獲知速率用以反映基于公式[3. 2]計(jì)算出 的 AW(co)。盡管公式[3. 1]表示一個(gè)頻率窗口的分離(見圖2A),但是可以由一個(gè)公式表示所 有頻率窗口的分離(見圖2B)。為此,使用所有頻率窗口的分離結(jié)果Y(t)(由公式[3.4]表示)、公式[3. 11]所表 示的觀測(cè)信號(hào)X(t)以及所有頻率窗口的分離矩陣W(由公式[3.10]表示)。因此,通過使 用這些矢量和矩陣,可以由公式[3. 12]表示分離。在本發(fā)明實(shí)施例的說明中,適當(dāng)時(shí)選擇性地使用公式[3.1]和[3.11]。圖2A和圖2B中的&到A到Y(jié)n所指示的表示稱為譜圖,在每一個(gè)譜圖中,在 頻率窗口的方向上和幀的方向上排列短時(shí)傅立葉變換(STFT)的結(jié)果。垂直方向指示頻率 窗口,而水平方向指示幀。在公式[3.4]和[3. 11]中,將較低的頻率放在較高側(cè)。相反,在 譜圖中,將較低的頻率放在較低側(cè)。時(shí)頻域ICA進(jìn)一步具有稱為“尺度問題”的這一問題。即,由于分離結(jié)果的尺度(幅 度)在各個(gè)頻率窗口中彼此不同,因此當(dāng)轉(zhuǎn)換到波形時(shí)各頻率之間的平衡與信源信號(hào)的不 同,除非適當(dāng)?shù)卣{(diào)整尺度差異。已經(jīng)提出了 “投射返回麥克風(fēng)”(下面所述)以解決“尺度” 的問題。[投射返回麥克風(fēng)]將ICA的分離結(jié)果投射返回麥克風(fēng)意味著通過分析由均設(shè)置在某一位置處的麥 克風(fēng)所采集的聲音信號(hào),從采集到的聲音信號(hào)中確定可歸于各個(gè)信源信號(hào)的相應(yīng)分量。當(dāng) 僅一個(gè)聲音源有效時(shí),可歸于各個(gè)信源信號(hào)的相應(yīng)分量等于麥克風(fēng)所觀測(cè)到的相應(yīng)信號(hào)。例如,假設(shè)作為信號(hào)分離結(jié)果所獲得的一個(gè)分離信號(hào)Yk對(duì)應(yīng)于圖1中所示的聲音 源1。在此情況下,將分離信號(hào)1投射返回麥克風(fēng)1到n等效于估計(jì)在僅聲音源1有效時(shí)由 各個(gè)麥克風(fēng)所觀測(cè)到的信號(hào)。投射返回之后的信號(hào)包括對(duì)于各信源信號(hào)的如下影響(例 如)相位延遲、衰減和混響(回聲),因此其對(duì)于作為投射返回目標(biāo)的每一麥克風(fēng)彼此不同。如圖1所示,在設(shè)置多個(gè)麥克風(fēng)1到n的配置中,對(duì)于一個(gè)分離結(jié)果,存在多個(gè)(n) 投射返回目標(biāo)。將為一個(gè)輸入提供多個(gè)輸出的這種信號(hào)稱為SIM0(單輸入,多輸出(Single Input,Multiple Outputs))型。在圖1的設(shè)置中,例如,由于數(shù)量n的分離結(jié)果與數(shù)量N的 源對(duì)應(yīng)地存在,因此在投射返回之后共計(jì)存在(NXn)個(gè)信號(hào)。然而,當(dāng)僅旨在尺度問題的 解決方案時(shí),足以將分離結(jié)果投射返回任何一個(gè)麥克風(fēng)或?qū)到¥ 分別投射返回麥克風(fēng)1 到n。如上所述,通過將分離結(jié)果投射返回麥克風(fēng)(一個(gè)或多個(gè)),可以獲得具有與源 信號(hào)的頻率尺度類似的頻率尺度的信號(hào)。將以這種方式調(diào)整分離結(jié)果的尺度稱為“改變尺
/又 o除了改變尺度之外,SIM0型信號(hào)還用在其它應(yīng)用中。例如,日本待審專利申請(qǐng)公 開No. 2006-154314公開了如下這樣的技術(shù)其用于通過將兩個(gè)麥克風(fēng)中的每一個(gè)所觀測(cè) 到的信號(hào)分離為兩個(gè)SIM0信號(hào)(兩個(gè)立體信號(hào)),獲得具有聲音定位感覺的分離結(jié)果。日 本待審專利申請(qǐng)公開No. 2006-154314進(jìn)一步公開了如下這樣的技術(shù)其用于通過將另一 種類型的源分離(即,雙掩蔽(binary mask))應(yīng)用于作為立體聲信號(hào)所提供的分離結(jié)果, 使得分離結(jié)果能夠以比ICA中分離矩陣的更新間隔更短的頻率跟隨聲音源的變化。下面將描述用于產(chǎn)生SIM0型分離結(jié)果和投射返回結(jié)果的方法。利用一種方法,自 身修改ICA的算法,以便直接產(chǎn)生SIM0型分離結(jié)果。這種方法稱為“SIMO ICA”。日本待審 專利申請(qǐng)公開No. 2006-154314公開了該類型的處理。利用另一方法,在獲得了分離結(jié)果¥1到¥11之后,通過乘以適當(dāng)?shù)南禂?shù)來確定對(duì)于 各個(gè)麥克風(fēng)的投射返回結(jié)果。這種方法稱為“投射返回SIM0”。在下文中,將描述更緊密地 與本發(fā)明實(shí)施例有關(guān)的后一種投射返回SIM0。例如,關(guān)于投射返回SIM0的一般說明,參見下面的參考文獻(xiàn)Noboru Murata 下面將描述更緊密地與本發(fā)明實(shí)施例有關(guān)的投射返回SIM0。將分離結(jié)果Yk( ,t)投射返回麥克風(fēng)i的結(jié)果被寫為Yk[i] ( ,t)。作為將分離 結(jié)果Yk( ,t)投射返回麥克風(fēng)1到n的結(jié)果、由Yk[1]( ,t)到Y(jié)k[n]( ,t)組成的矢量可 以由如下公式[4. 1]表示。公式[4. 1]右手側(cè)的第二項(xiàng)是通過將公式[2.6]表示的Y( , t)的除了第k個(gè)元素之外的其他元素設(shè)置為0而產(chǎn)生的矢量,并且其表示僅對(duì)應(yīng)于Yk( , t)的聲音源有效的情形。分離矩陣的逆矩陣表示空間傳輸函數(shù)。從而,公式[4. 1]對(duì)應(yīng)于 如下這樣的公式該公式用于在只有對(duì)應(yīng)于Yk( ,t)的聲音源有效的情形下獲得由各個(gè)麥 克風(fēng)所觀測(cè)到的信號(hào)??梢詫⒐絒4. 1]重寫為公式[4. 2]。在公式[4. 2]中,Bik( )表示作為分離矩 陣的逆矩陣B( )的每一個(gè)元素(見公式[4.3])。此外,diag( )表示具有括號(hào)中的元素作為對(duì)角元素的對(duì)角矩陣。另一方面,表示將分離結(jié)果Yjco,t)到¥ ( ,t)投射返回麥克風(fēng)k的公式由公式[4.4]給出。因此,可以通過將表示分離結(jié)果的矢量Y( ,t)乘以用于投射返回的系數(shù) 矩陣diag (Bkl (co), ,Bkn( co))來執(zhí)行投射返回。[現(xiàn)有技術(shù)中的問題]然而,根據(jù)公式[4. 1]到[4. 4]的上述投射返回處理是對(duì)于ICA中所使用的麥克 風(fēng)的投射返回,而不適配于對(duì)于未在ICA中使用的麥克風(fēng)的投射返回。于是,存在當(dāng)在ICA 中使用的麥克風(fēng)和其排列對(duì)于其他處理來說不是最佳時(shí)可能出現(xiàn)問題的可能性。將在下面 討論如下兩點(diǎn)作為問題的示例。(1)定向麥克風(fēng)的使用(2)與D0A(到達(dá)方向)估計(jì)及源位置估計(jì)的組合使用(1)定向麥克風(fēng)的使用在ICA中使用多個(gè)麥克風(fēng)的原因在于獲得以不同程度彼此混合多個(gè)聲音源的多 個(gè)觀測(cè)信號(hào)。此時(shí),各麥克風(fēng)之間的混合程度的差異越大,則對(duì)于分離和獲知來說越方便。 換言之,各麥克風(fēng)之間的混合程度的較大差異不僅在增大目標(biāo)信號(hào)與干擾聲音(其仍然在 分離結(jié)果中而未擦除)之比(即,信號(hào)-干擾比SIR)時(shí),而且在以較少次數(shù)收斂獲知處理 以獲得分離矩陣時(shí)更有效。已經(jīng)建議了使用定向麥克風(fēng)的方法以獲得具有混合程度更大差異的觀測(cè)信號(hào)。例 如,參見日本待審專利申請(qǐng)公開No. 2007-295085。更具體地,建議的方法旨在通過使用每 一個(gè)均在特定方向上具有高(或低)靈敏度的多個(gè)麥克風(fēng)而使得混合程度彼此不同。然而,當(dāng)對(duì)定向麥克風(fēng)觀測(cè)到的信號(hào)執(zhí)行ICA并且將分離結(jié)果投射返回定向麥克 風(fēng)時(shí)出現(xiàn)了問題。換言之,由于每一個(gè)定向麥克風(fēng)的指向性根據(jù)頻率而不同,因此存在分離 結(jié)果的聲音可能失真(或者可能具有與源信號(hào)的頻率平衡不同的頻率平衡)的可能性。下 面將參照?qǐng)D3描述這種問題。圖3圖示了簡(jiǎn)單的定向麥克風(fēng)300的示例性配置。定向麥克風(fēng)300包括兩個(gè)聲音 采集裝置301和302,它們以其之間的裝置距離d來排列。使得由聲音采集裝置觀測(cè)到的信 號(hào)流之一(例如,在圖示的示例中,由聲音采集裝置302觀測(cè)到的流)穿過用于產(chǎn)生預(yù)定延 遲(D)的延遲處理模塊303和用于將預(yù)定增益(a)應(yīng)用于經(jīng)過信號(hào)(passing signal)的 混合增益控制模塊304。在加法器305中將延遲的信號(hào)和聲音采集裝置301所觀測(cè)到的信 號(hào)彼此混合,由此可以產(chǎn)生具有依據(jù)方向而不同的靈敏度的輸出信號(hào)306。利用這種配置, 例如,定向麥克風(fēng)300實(shí)現(xiàn)了所謂的指向性,即在特定方向上增大的靈敏度。通過在圖3中所示的定向麥克風(fēng)300的配置中設(shè)置延遲D = d/C(C是聲速)以 及混合增益a = -1,形成指向性,以便取消來自定向麥克風(fēng)300的右側(cè)的聲音,并且加強(qiáng) 來自其左側(cè)的聲音。圖4圖示了在d = 0.04[m]且C = 340[m/s]的條件下對(duì)于四個(gè)頻率 (lOOHzUOOOHz,3000Hz和6000Hz)中的每一個(gè)描繪指向性(即,進(jìn)入方向與輸出增益之間 的關(guān)系)的結(jié)果。在圖4中,按照頻率調(diào)整尺度,以便對(duì)于來自左側(cè)的聲音的輸出增益全部 僅為1。此外,假設(shè)圖4中圖示的聲音采集裝置401和402分別與圖3中圖示的聲音采集裝 置301和302相同。如圖4中所示,當(dāng)在兩個(gè)聲音采集裝置401和402以所述間隔排列的方向上觀看 時(shí),對(duì)于來自左側(cè)(定向麥克風(fēng)的前側(cè))的聲音(聲音A)輸出增益全部?jī)H為1,而當(dāng)在兩個(gè) 聲音采集裝置401和402以所述間隔排列的方向上觀看時(shí),對(duì)于來自右側(cè)(定向麥克風(fēng)的后側(cè))的聲音(聲音B)輸出增益全部?jī)H為0。然而,在其他方向上,輸出增益隨著頻率的變 化而不同。進(jìn)一步,當(dāng)與頻率對(duì)應(yīng)的聲音波長(zhǎng)短于裝置間隔(d)的兩倍(即,在d = 0. 04[m] 且C = 340[m/s]的條件下,在4250 [Hz]或更高的頻率上)時(shí),出現(xiàn)稱為“空間混疊(spatial aliasing)”的現(xiàn)象。因此,除了右側(cè)之外,另外形成靈敏度低的方向。例如,觀看圖4中 6000Hz處的指向性的曲線,對(duì)于來自傾斜方向的聲音輸出增益也變?yōu)?,例如,如“聲音C” 表示的。因此,除了特定方向之外,產(chǎn)生未檢測(cè)到特定頻率的聲音的觀測(cè)區(qū)域。圖4中向右方向上的零點(diǎn)波束(null beam)的存在引起了如下問題。在通過使用 均圖示在圖3中的多個(gè)定向麥克風(fēng)(即,兩個(gè)聲音采集裝置看作一個(gè)麥克風(fēng))獲得觀測(cè)信 號(hào)、利用ICA分離觀測(cè)信號(hào)并且將分離結(jié)果投射返回定向麥克風(fēng)的情況下,對(duì)于定向麥克 風(fēng)右側(cè)出現(xiàn)的聲音源(聲音B)所對(duì)應(yīng)的分離結(jié)果,投射返回結(jié)果基本上變?yōu)闊o效(null)。進(jìn)一步,根據(jù)頻率在聲音C的方向上的增益的較大差異引起如下問題。當(dāng)將與 聲音C對(duì)應(yīng)的分離結(jié)果投射返回圖4中所示的定向麥克風(fēng)時(shí),產(chǎn)生信號(hào)使得與100Hz和 1000Hz的分量相比,300Hz的分量得到加強(qiáng),同時(shí)6000Hz的分量得到抑制。利用日本待審專利申請(qǐng)公開No. 2007-295085中描述的方法,通過徑向地排列每 一個(gè)均在前向方向上具有指向性的多個(gè)麥克風(fēng),并通過預(yù)先選擇各麥克風(fēng)中面向最靠近朝 向每一聲音源的方向的一個(gè)麥克風(fēng),可以避免頻率分量失真的問題。然而,為了同時(shí)最小化 失真的影響并獲得在混合程度上非常不同的觀測(cè)信號(hào),要在盡可能多的方向上安裝每一個(gè) 均在前向方向上具有尖銳的指向性的多個(gè)麥克風(fēng)。(2)與D0A(到達(dá)方向)估計(jì)和源位置估計(jì)的組合使用D0A (到達(dá)方向)估計(jì)是要估計(jì)聲音從哪個(gè)方向到達(dá)每一個(gè)麥克風(fēng)。此外,除了 D0A 之外還指定每一個(gè)聲音源的位置被稱為“源位置估計(jì)”。在使用多個(gè)麥克風(fēng)方面,D0A估計(jì) 和源位置估計(jì)對(duì)于ICA是常見的。然而,對(duì)于那些估計(jì)最佳的麥克風(fēng)排列不等于在所有情 況下對(duì)于ICA最佳。為此,在旨在執(zhí)行源分離和D0A估計(jì)(或源位置估計(jì))兩者的系統(tǒng)中, 在麥克風(fēng)排列中可能出現(xiàn)矛盾的難題。關(guān)于執(zhí)行D0A估計(jì)和源位置估計(jì)的方法,然后關(guān)于當(dāng)將那些估計(jì)與ICA組合時(shí)出 現(xiàn)的問題進(jìn)行下面的描述。將參照?qǐng)D5,描述在將ICA的分離結(jié)果投射返回各個(gè)麥克風(fēng)之后估計(jì)D0A的方法。 該方法與日本專利No. 3881367中描述的方法相同??紤]以兩個(gè)麥克風(fēng)502和503之間的間隔(距離)d將其進(jìn)行安裝的環(huán)境。假設(shè) 分離結(jié)果Yk( ,t) 501 (圖5中所示)表示對(duì)于一個(gè)聲音源的分離結(jié)果,其已經(jīng)通過對(duì)來自 多個(gè)聲音源的混合信號(hào)執(zhí)行分離處理而獲得。將分離結(jié)果Yk( ,t)501投射返回圖5中所 示的麥克風(fēng)i(由502表示)和麥克風(fēng)i'(由503表示)的結(jié)果被分別假設(shè)為Yk[i]( ,t) 和Yk[i' ] (co,t)。當(dāng)聲音源與每一個(gè)麥克風(fēng)之間的距離比各麥克風(fēng)之間的距離知,大得多 時(shí),可以將聲波看作接近于平面波,從聲音源Yk( ,t)到麥克風(fēng)i的距離與從同一源到麥 克風(fēng)i'的距離之差可以表示為(!…cos0kii,。該距離差提供了圖5中所示的路徑差505。 注意,9kii,表示D0A,即它是由互連兩個(gè)麥克風(fēng)的線段和從聲音源延伸到兩個(gè)麥克風(fēng)中點(diǎn) 的線段所形成的角度504。D0A 0 kii,可以通過獲得作為投射返回結(jié)果的Yk[i] ( ,t)和Yk[i' ] ( ,t)之間的
11相位差來確定。Yk⑴(《,t)和」(《,t)(S卩,投射返回結(jié)果)之間的關(guān)系由如下公式 [5. 1]表示。用于計(jì)算相位差的公式由如下公式[5. 2]和[5. 3]表示。
在以上公式中;angle ()表示復(fù)數(shù)的相位,acos()表示C0S()的反函數(shù)。只要通過使用上述公式[4. 1]執(zhí)行投射返回,就由不依賴于幀號(hào)t而僅依賴于分 離矩陣W( )的值給出相位差。因此,可以由公式[5.4]表示用于計(jì)算相位差的公式。另一方面,日本專利申請(qǐng)No. 2008-153483 (其已經(jīng)由與本申請(qǐng)相同的申請(qǐng)人在 先前提交)描述了在不使用逆矩陣的情況下計(jì)算D0A的方法。在計(jì)算D0A方面,觀測(cè)信 號(hào)X( ,t)與分離結(jié)果Y( ,t)之間的協(xié)方差矩陣E xy( )具有與分離矩陣的逆(艮口, W(co)-1)的特性類似的特性。于是,通過計(jì)算如下面的公式[6. 1]或[6.2]中所表示的協(xié) 方差E xy( ),可以基于下面的公式[6.4]計(jì)算D0A ekii,。在公式[6.4]中,oik( )表 示如從公式[6.3]看到那樣的E xy( )的每一個(gè)分量。通過使用公式[6. 4],不再需要逆 矩陣的計(jì)算。進(jìn)一步,在實(shí)時(shí)運(yùn)行的系統(tǒng)中,可以以比使用基于ICA的分離矩陣的情況下更 短的間隔(最小逐幀)更新D0A。E XY(w) = <X(o, t)Y(o, t)H>t= <X(o, t)X(o, t)H>tff( , t)H.. 將在下文中描述從D0A估計(jì)源位置的方法?;旧?,一旦針對(duì)多個(gè)麥克風(fēng)對(duì)的每 一個(gè)確定了 D0A,也基于三角測(cè)量原理確定了源位置。例如,參見日本待審專利申請(qǐng)公開 No. 2005-49153,關(guān)于基于三角測(cè)量原理的源位置估計(jì)。將參照?qǐng)D6簡(jiǎn)要地描述源位置估 計(jì)。
麥克風(fēng)602和603與圖5中的麥克風(fēng)502和503相同。假設(shè)已經(jīng)針對(duì)每一個(gè)麥克 風(fēng)對(duì)604(包括602和603)確定了 D0A 0 kii,。考慮具有位于麥克風(fēng)602和603之間的中 點(diǎn)的頂點(diǎn)并具有其一半等于9kii,的頂角的圓錐體605,聲音源存在于圓錐體605表面上的 某處??梢酝ㄟ^以類似的方式獲得麥克風(fēng)對(duì)的相應(yīng)圓錐體605到607并通過確定那些圓錐 體的交叉點(diǎn)(或那些圓錐體的表面彼此最接近的點(diǎn))來估計(jì)源位置。前述是基于三角測(cè)量 原理估計(jì)源位置的萬法。下面將描述麥克風(fēng)排列在ICA和D0A估計(jì)(或源位置估計(jì))兩者中具有的問題。 問題主要存在于如下三點(diǎn)。a)麥克風(fēng)的數(shù)量b)各麥克風(fēng)之間的間隔c)改變其位置的麥克風(fēng)a)麥克風(fēng)的數(shù)量將D0A估計(jì)或源位置估計(jì)的計(jì)算成本與ICA的計(jì)算成本相比較,后者高得多。此 外,由于ICA的計(jì)算成本與麥克風(fēng)的數(shù)量n的平方成比例,因此考慮到計(jì)算成本的上限,在 某些情況下可能限制麥克風(fēng)的數(shù)量。結(jié)果,特別地,源位置估計(jì)所需的麥克風(fēng)數(shù)量在某些情 況下不可用。例如,在麥克風(fēng)數(shù)量=2的情況下,可以分離最多兩個(gè)聲音源,并可以估計(jì)每 一個(gè)聲音源均存在于特定圓錐體的表面上。然而,難以指定源位置。b)各麥克風(fēng)之間的間隔為了在源位置估計(jì)中高精度地估計(jì)源位置,例如,期望以與聲音源和麥克風(fēng)之間 的距離基本相同的階次(order)彼此遠(yuǎn)離地放置麥克風(fēng)對(duì)。相反,期望組成每一個(gè)麥克風(fēng) 對(duì)的兩個(gè)麥克風(fēng)彼此靠近放置以便滿足平面波假設(shè)。然而,在ICA中,從分離精度的視角來看,使用彼此遠(yuǎn)離的兩個(gè)麥克風(fēng)在某些情況 下可能是不利的。將在下面描述這一點(diǎn)。在時(shí)頻域中基于ICA的分離通常通過在干擾聲音的每一個(gè)方向上形成零點(diǎn)波束 (增益變?yōu)?的方向)來實(shí)現(xiàn)。在圖1的環(huán)境中,例如,通過在朝向源2到N(其正在產(chǎn)生干 擾聲音)的方向上形成零點(diǎn)波束來獲得用于分離和提取聲音源1的分離矩陣,以便朝向聲 音源1的方向上的信號(hào)(即,目標(biāo)聲音)最終保持。在較低的頻率中最多可以形成n-l(n:麥克風(fēng)的數(shù)量)個(gè)零點(diǎn)波束。然而,在C/ (2d) (C 聲速,d 各麥克風(fēng)之間的間隔)以上的頻率中,由于被稱為“空間混疊”的現(xiàn)象,因 此在除了預(yù)定方向之外的其他方向上進(jìn)一步形成零點(diǎn)波束。例如,觀看圖4中6000Hz的指 向性曲線,除了來自聲音采集裝置以圖4中的間隔排列的方向上的右側(cè)(即,來自定向麥克 風(fēng)的后側(cè))的聲音(由B指示)之外,在傾斜方向上形成零點(diǎn)波束,如聲音C所示。在分離 矩陣中也發(fā)生類似的現(xiàn)象。隨著各麥克風(fēng)之間的距離d增大,空間混疊開始在低頻處產(chǎn)生。 進(jìn)一步,在高頻處,在除了預(yù)定方向之外的其他方向上形成多個(gè)零點(diǎn)波束。如果除了預(yù)定方 向之外的零點(diǎn)波束的其他方向中的任意一個(gè)與目標(biāo)聲音的方向一致,則分離精度惡化。于是,要根據(jù)直到高精度執(zhí)行分離的頻率的級(jí)別來確定ICA中所使用的麥克風(fēng)的 間隔和排列。換言之,ICA中所使用的麥克風(fēng)的間隔和排列可能與源位置估計(jì)中確保滿意 精度所需的麥克風(fēng)的排列矛盾。C)改變其位置的麥克風(fēng)
在D0A估計(jì)和源位置估計(jì)中,需要至少已知關(guān)于各麥克風(fēng)之間的相對(duì)位置關(guān)系的 信息。在源位置估計(jì)中,當(dāng)還估計(jì)聲音源關(guān)于固定原點(diǎn)(例如,在房間一角設(shè)置的原點(diǎn))的 絕對(duì)坐標(biāo)時(shí),除了關(guān)于麥克風(fēng)的聲音源的相對(duì)位置之外,還進(jìn)一步需要每一個(gè)麥克風(fēng)的絕 對(duì)坐標(biāo)。另一方面,在ICA中執(zhí)行的分離中,麥克風(fēng)的位置信息不是必須的。(盡管分離精 度根據(jù)麥克風(fēng)排列而變化,但是在用于分離和獲知的公式中未包括各麥克風(fēng)的位置信息)。 因此,在某些情況下,ICA中所使用的麥克風(fēng)可能不用在D0A估計(jì)和源位置估計(jì)中。例如, 假設(shè)在電視機(jī)中并入源分離和源位置估計(jì)的功能以提取用戶的說話并估計(jì)其位置的情況。 在此情況下,當(dāng)要通過使用以電視外殼的特定點(diǎn)(如,屏幕中心)作為原點(diǎn)的坐標(biāo)系來表示 源位置時(shí),源位置估計(jì)中所使用的每一個(gè)麥克風(fēng)關(guān)于原點(diǎn)的坐標(biāo)必須已知。例如,如果將每 一個(gè)麥克風(fēng)固定到電視外殼,則麥克風(fēng)的位置已知。同時(shí),從源分離的視角來看,通過將麥克風(fēng)設(shè)置得盡可能靠近用戶,獲得更易于分 離的觀測(cè)信號(hào)。因此,在某些情況下,例如期望在遙控器(而非電視外殼)上安裝麥克風(fēng)。 然而,當(dāng)未獲得遙控器上的麥克風(fēng)的絕對(duì)位置時(shí),在基于從遙控器上的麥克風(fēng)獲得的分離 結(jié)果確定源位置時(shí)出現(xiàn)困難。如上所述,當(dāng)在現(xiàn)有技術(shù)中執(zhí)行ICA(獨(dú)立分量分析)作為源分離處理時(shí),在利用 對(duì)于ICA最佳的麥克風(fēng)排列中的多個(gè)定向麥克風(fēng)的設(shè)置之下,有時(shí)可以執(zhí)行ICA。然而,如以上討論的那樣,當(dāng)將作為利用定向麥克風(fēng)的處理結(jié)果所獲得的分離結(jié) 果投射返回定向麥克風(fēng)時(shí),由于每個(gè)定向麥克風(fēng)的指向性根據(jù)頻率而不同,因此出現(xiàn)分離 結(jié)果所提供的聲音的失真問題,如以上參照?qǐng)D4所述的那樣。進(jìn)一步,對(duì)于ICA最佳的麥克風(fēng)排列是對(duì)于源分離的最佳排列,但在某些情況下, 其對(duì)于D0A估計(jì)和源位置估計(jì)來說可能是不合適的。于是,當(dāng)以組合的方式執(zhí)行ICA和D0A 估計(jì)或源位置估計(jì)時(shí),在源分離處理和D0A估計(jì)或源位置估計(jì)處理中的任何一個(gè)之中,處 理精度可能惡化。
發(fā)明內(nèi)容
期望提供如下這樣的信號(hào)處理設(shè)備、信號(hào)處理方法和程序其不僅能夠以適于 ICA (獨(dú)立分量分析)的麥克風(fēng)設(shè)置通過ICA執(zhí)行源分離處理,而且還能夠更高精度地執(zhí)行 其他處理,如用于投射返回除了 ICA中使用的麥克風(fēng)位置之外的位置的處理、D0A(到達(dá)方 向)估計(jì)處理和源位置估計(jì)處理。還期望即使例如在使用定向麥克風(fēng)和對(duì)于ICA最佳配置的麥克風(fēng)排列來執(zhí)行最 佳ICA處理時(shí),也可實(shí)現(xiàn)用于投射返回每一個(gè)均處于任意位置的麥克風(fēng)的處理。進(jìn)一步,期 望提供如下這樣的信號(hào)處理設(shè)備、信號(hào)處理方法和程序其即使在對(duì)于ICA最佳的環(huán)境中 也能夠以更高精度執(zhí)行D0A估計(jì)和源位置估計(jì)處理。根據(jù)本發(fā)明實(shí)施例,提供了一種信號(hào)處理設(shè)備,包括源分離模塊,用于通過將 ICA(獨(dú)立分量分析)應(yīng)用于基于用以源分離的麥克風(fēng)所取得的聲音源的混合信號(hào)的觀測(cè) 信號(hào),產(chǎn)生與多個(gè)聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào);以及信號(hào)投射返回模塊,用于接收投射返回 目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)和所述源分離模塊產(chǎn)生的分離信號(hào),并且用于產(chǎn)生投射返回信號(hào)作 為與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào),所述投射返回信號(hào)由投射返回目標(biāo)麥克風(fēng)取得,其中,所述信號(hào)投射返回模塊通過接收與源分離麥克風(fēng)不同的投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào) 來產(chǎn)生所述投射返回信號(hào)。根據(jù)修改的實(shí)施例,在信號(hào)處理設(shè)備中,所述源分離模塊對(duì)觀測(cè)信號(hào)執(zhí)行ICA,由 此產(chǎn)生與各聲音源對(duì)應(yīng)的時(shí)頻域中的相應(yīng)分離信號(hào),所述觀測(cè)信號(hào)是通過將用于源分離的 麥克風(fēng)取得的信號(hào)轉(zhuǎn)換到時(shí)頻域而獲得的,并且所述信號(hào)投射返回模塊通過計(jì)算使與每一 個(gè)聲音源對(duì)應(yīng)的相應(yīng)投射返回信號(hào)之總和與投射返回目標(biāo)麥克風(fēng)的各個(gè)觀測(cè)信號(hào)之間的 誤差最小的投射返回系數(shù),并通過將分離信號(hào)乘以計(jì)算出的投射返回系數(shù)來計(jì)算投射返回 信號(hào),其中,與每一個(gè)聲音源對(duì)應(yīng)的相應(yīng)投射返回信號(hào)之總和是通過將時(shí)頻域中的分離信 號(hào)乘以投射返回系數(shù)而計(jì)算的。根據(jù)另一修改實(shí)施例,在信號(hào)處理設(shè)備中,所述信號(hào)投射返回模塊在計(jì)算使最小 平方誤差最小的投射返回系數(shù)的處理中采用最小二乘逼近。根據(jù)又一修改實(shí)施例,在信號(hào)處理設(shè)備中,所述源分離模塊接收由多個(gè)定向麥克 風(fēng)組成的源分離麥克風(fēng)所取得的信號(hào),并執(zhí)行產(chǎn)生與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào)的處 理,并且所述信號(hào)投射返回模塊接收作為全向麥克風(fēng)的投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)和 所述源分離模塊產(chǎn)生的分離信號(hào),并產(chǎn)生與作為全向麥克風(fēng)的投射返回目標(biāo)麥克風(fēng)對(duì)應(yīng)的 投射返回信號(hào)。根據(jù)再一修改實(shí)施例,信號(hào)處理設(shè)備進(jìn)一步包括指向性形成模塊,用于接收多個(gè) 全向麥克風(fēng)組成的用于源分離的麥克風(fēng)所取得的信號(hào),并且用于根據(jù)成對(duì)麥克風(fēng)之間的距 離,通過延遲成對(duì)麥克風(fēng)之一的相位來產(chǎn)生虛擬定向麥克風(fēng)的輸出信號(hào),所述成對(duì)麥克風(fēng) 是通過所述多個(gè)全向麥克風(fēng)當(dāng)中的兩個(gè)來提供的,其中所述源分離模塊接收所述指向性形 成模塊所產(chǎn)生的輸出信號(hào),并產(chǎn)生分離信號(hào)。根據(jù)再一修改實(shí)施例,信號(hào)處理設(shè)備進(jìn)一步包括到達(dá)方向估計(jì)模塊,用于接收所 述信號(hào)投射返回模塊所產(chǎn)生的投射返回信號(hào),并用于執(zhí)行如下處理基于不同位置處的多 個(gè)投射返回目標(biāo)麥克風(fēng)的投射返回信號(hào)之間的相位差,計(jì)算到達(dá)方向。根據(jù)再一修改實(shí)施例,信號(hào)處理設(shè)備進(jìn)一步包括源位置估計(jì)模塊,用于接收所述 信號(hào)投射返回模塊所產(chǎn)生的投射返回信號(hào),執(zhí)行基于不同位置處的多個(gè)投射返回目標(biāo)麥克 風(fēng)的投射返回信號(hào)之間的相位差來計(jì)算到達(dá)方向的處理,并進(jìn)一步基于到達(dá)方向的組合數(shù) 據(jù)來計(jì)算源位置,所述到達(dá)方向的組合數(shù)據(jù)是從不同位置處的多個(gè)投射返回目標(biāo)麥克風(fēng)的 投射返回信號(hào)中計(jì)算的。根據(jù)再一修改實(shí)施例,信號(hào)處理設(shè)備進(jìn)一步包括到達(dá)方向估計(jì)模塊,用于接收所 述信號(hào)投射返回模塊所產(chǎn)生的投射返回系數(shù),并用于執(zhí)行采用了接收到的投射返回系數(shù)的 計(jì)算,由此執(zhí)行計(jì)算到達(dá)方向或源位置的處理。根據(jù)再一修改實(shí)施例,信號(hào)處理設(shè)備進(jìn)一步包括輸出裝置,其設(shè)置在與投射返回 麥克風(fēng)對(duì)應(yīng)的位置處;以及控制模塊,用于執(zhí)行控制以輸出對(duì)于投射返回目標(biāo)麥克風(fēng)的投 射返回信號(hào),所述投射返回目標(biāo)麥克風(fēng)與所述輸出裝置的位置對(duì)應(yīng)。根據(jù)再一修改實(shí)施例,在信號(hào)處理設(shè)備中,所述源分離模塊包括多個(gè)源分離模塊, 其用于接收由相應(yīng)組的源分離麥克風(fēng)取得的信號(hào)并且用于產(chǎn)生相應(yīng)組的分離信號(hào),所述相 應(yīng)組的源分離麥克風(fēng)至少在其部分上彼此不同,并且所述信號(hào)投射返回模塊接收所述多個(gè) 源分離模塊所產(chǎn)生的相應(yīng)組的分離信號(hào)以及投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào),產(chǎn)生與源分離模塊對(duì)應(yīng)的多組投射返回信號(hào),并將產(chǎn)生的多組投射返回信號(hào)組合在一起,由此產(chǎn)生對(duì) 于投射返回目標(biāo)麥克風(fēng)的最終投射返回信號(hào)。根據(jù)本發(fā)明另一實(shí)施例,提供了一種在信號(hào)處理設(shè)備中執(zhí)行的信號(hào)處理方法,所 述方法包括如下步驟使得源分離模塊通過將ICA(獨(dú)立分量分析)應(yīng)用于基于來自多個(gè)聲 音源的混合信號(hào)而產(chǎn)生的觀測(cè)信號(hào),來產(chǎn)生與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào),由此執(zhí)行混 合信號(hào)的分離處理,所述觀測(cè)信號(hào)是源分離麥克風(fēng)取得的;以及使得信號(hào)投射返回模塊接 收投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)和所述源分離模塊所產(chǎn)生的分離信號(hào),并且產(chǎn)生投射返 回信號(hào)作為與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào),所述投射返回信號(hào)由投射返回目標(biāo)麥克風(fēng)取 得,其中,通過接收與源分離麥克風(fēng)不同的投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)來產(chǎn)生所述投 射返回信號(hào)。根據(jù)本發(fā)明再一實(shí)施例,提供了一種用于在信號(hào)處理設(shè)備中執(zhí)行信號(hào)處理的程 序,所述程序包括如下步驟使得源分離模塊通過將ICA(獨(dú)立分量分析)應(yīng)用于基于來自 多個(gè)聲音源的混合信號(hào)而產(chǎn)生的觀測(cè)信號(hào),來產(chǎn)生與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào),由此 執(zhí)行所述混合信號(hào)的分離處理,所述觀測(cè)信號(hào)由用于源分離的麥克風(fēng)取得;以及使得信號(hào) 投射返回模塊接收投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)和所述源分離模塊所產(chǎn)生的分離信號(hào), 并且產(chǎn)生投射返回信號(hào)作為與所述多個(gè)聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào),所述投射返回信號(hào)由 投射返回目標(biāo)麥克風(fēng)取得,其中,通過接收與源分離麥克風(fēng)不同的投射返回目標(biāo)麥克風(fēng)的 觀測(cè)信號(hào)來產(chǎn)生所述投射返回信號(hào)。根據(jù)本發(fā)明的程序是能夠由存儲(chǔ)介質(zhì)等以計(jì)算機(jī)可讀形式提供到(例如)可以執(zhí) 行各種程序代碼的各種信息處理設(shè)備和計(jì)算機(jī)系統(tǒng)的程序。通過以計(jì)算機(jī)可讀形式提供程 序,可以在各種信息處理設(shè)備和計(jì)算機(jī)系統(tǒng)上實(shí)現(xiàn)與程序?qū)?yīng)的處理。參照附圖,從本發(fā)明實(shí)施例的詳細(xì)描述中,其他特征和優(yōu)點(diǎn)將變得顯而易見。注 意,術(shù)語“系統(tǒng)”意味著多個(gè)裝置的邏輯組件,并且“系統(tǒng)”的含義不限于在同一外殼內(nèi)并入 具有相應(yīng)功能的各個(gè)裝置的情況。根據(jù)本發(fā)明實(shí)施例,將ICA(獨(dú)立分量分析)應(yīng)用于基于多個(gè)聲音源的混合信號(hào)的 觀測(cè)信號(hào)(其由源分離麥克風(fēng)獲得),以執(zhí)行分離混合信號(hào)的處理,由此產(chǎn)生分別與各聲音 源對(duì)應(yīng)的分離信號(hào)。然后,輸入所產(chǎn)生的分離信號(hào)和與源分離麥克風(fēng)不同的投射返回目標(biāo) 麥克風(fēng)的觀測(cè)信號(hào),以基于這些輸入信號(hào)產(chǎn)生作為與各個(gè)聲音源對(duì)應(yīng)的分離信號(hào)且估計(jì)為 要由投射返回目標(biāo)麥克風(fēng)取得的投射返回信號(hào)。通過利用產(chǎn)生的投射返回信號(hào),例如,可以 將語音數(shù)據(jù)輸出到輸出裝置,并且可以估計(jì)到達(dá)方向(D0A)或源位置。
圖1是說明數(shù)量為N的聲音源有效以產(chǎn)生不同聲音并且由數(shù)量為n的麥克風(fēng)觀測(cè) 聲音的情形的圖示;圖2A和圖2B分別是說明各個(gè)頻率窗口中的分離處理(圖2A)和對(duì)于所有頻率窗 口的分離處理(圖2B)的圖;圖3圖示了簡(jiǎn)單定向麥克風(fēng)的示例性配置;圖4圖示了針對(duì)四個(gè)頻率(100Hz、1000Hz、3000Hz和6000Hz)中的每一個(gè),描繪指
向性(即,進(jìn)入方向和輸出增益之間的關(guān)系)的結(jié)果;
圖5是說明在將ICA的分離結(jié)果投射返回各個(gè)麥克風(fēng)之后估計(jì)D0A(到達(dá)方向) 的方法的圖示;圖6是說明基于三角測(cè)量原理的源位置估計(jì)的圖示;圖7是圖示根據(jù)本發(fā)明第一實(shí)施例的信號(hào)處理設(shè)備的配置的框圖;圖8是說明圖7中圖示的信號(hào)處理設(shè)備中定向麥克風(fēng)和全向麥克風(fēng)的示例性排列 的圖示;圖9是圖示根據(jù)本發(fā)明第二實(shí)施例的信號(hào)處理設(shè)備的配置的框圖;圖10是說明與圖9中圖示的信號(hào)處理設(shè)備的配置對(duì)應(yīng)的麥克風(fēng)排列的示例以及 形成麥克風(fēng)的指向性的方法的圖示;圖11是圖示根據(jù)本發(fā)明的第三實(shí)施例的信號(hào)處理設(shè)備的配置的框圖;圖12是說明與圖11中圖示的信號(hào)處理設(shè)備的配置對(duì)應(yīng)的麥克風(fēng)排列的一個(gè)示例 的圖示;圖13是說明與圖11中圖示的信號(hào)處理設(shè)備的配置對(duì)應(yīng)的麥克風(fēng)排列的另一示例 的圖示;圖14圖示源分離模塊的一個(gè)示例性配置;圖15圖示信號(hào)投射返回模塊的一個(gè)示例性配置;圖16圖示信號(hào)投射返回模塊的另一示例性配置;圖17是說明當(dāng)通過采用基于由用于源分離的麥克風(fēng)獲得的數(shù)據(jù)的分離結(jié)果來執(zhí) 行用于投射返回目標(biāo)麥克風(fēng)的投射返回處理時(shí)的處理序列的流程圖;圖18是說明當(dāng)以組合方式執(zhí)行分離結(jié)果的投射返回和D0A估計(jì)(或源位置估計(jì)) 時(shí)的處理序列的流程圖;圖19是說明源分離處理的序列的流程圖;圖20是說明投射返回處理的序列的流程圖;圖21圖示根據(jù)本發(fā)明第四實(shí)施例的信號(hào)處理設(shè)備中麥克風(fēng)和輸出裝置的第一排 列示例;圖22A和圖22B圖示根據(jù)本發(fā)明第四實(shí)施例、不同環(huán)境中的信號(hào)處理設(shè)備中麥克 風(fēng)和輸出裝置的第二排列示例;圖23圖示包括多個(gè)源分離系統(tǒng)的信號(hào)處理設(shè)備的配置;以及圖24圖示包括多個(gè)源分離系統(tǒng)的信號(hào)處理設(shè)備中的處理示例。
具體實(shí)施例方式下面將參照附圖,描述根據(jù)本發(fā)明實(shí)施例的信號(hào)處理設(shè)備、信號(hào)處理方法和程序 的細(xì)節(jié)。以下面列出的各項(xiàng)的次序進(jìn)行下列描述。1.根據(jù)本發(fā)明實(shí)施例的處理的概要2.對(duì)于與適于ICA的麥克風(fēng)不同的麥克風(fēng)的投射返回處理及其原理3.對(duì)于與適于ICA的麥克風(fēng)不同的麥克風(fēng)的投射返回處理的處理示例(第一實(shí)施 例)4.通過使用多個(gè)全向麥克風(fēng)組成虛擬定向麥克風(fēng)的實(shí)施例(第二實(shí)施例)5.以組合方式執(zhí)行源分離處理的分離結(jié)果的投射返回處理和D0A估計(jì)或源位置估計(jì)的處理示例(第三實(shí)施例)6.組成根據(jù)本發(fā)明實(shí)施例的信號(hào)處理設(shè)備的各模塊的示例性配置7.在信號(hào)處理設(shè)備中執(zhí)行的處理序列8.根據(jù)本發(fā)明的其他實(shí)施例的信號(hào)處理設(shè)備8. 1在信號(hào)投射返回模塊中,在計(jì)算投射返回系數(shù)矩陣P( )的處理中省略逆矩 陣的計(jì)算的實(shí)施例8. 2執(zhí)行將源分離處理獲得的分離結(jié)果投射返回到特定排列的麥克風(fēng)的處理的實(shí) 施例(第四實(shí)施例)8. 3采用多個(gè)源分離系統(tǒng)的實(shí)施例(第五實(shí)施例)9.根據(jù)本發(fā)明實(shí)施例的信號(hào)處理設(shè)備的特征和優(yōu)點(diǎn)的總結(jié)[1.根據(jù)本發(fā)明實(shí)施例的處理的概要]如上所述,當(dāng)在現(xiàn)有技術(shù)中執(zhí)行ICA (獨(dú)立分量分析)作為源分離處理時(shí),期望在 利用對(duì)于ICA最佳的麥克風(fēng)排列中的多個(gè)定向麥克風(fēng)的設(shè)置之下執(zhí)行ICA。然而,該設(shè)置伴隨有如下問題。(1)當(dāng)將作為利用定向麥克風(fēng)的處理結(jié)果所獲得的分離信號(hào)(S卩,分離結(jié)果)投射 返回定向麥克風(fēng)時(shí),如以上參照?qǐng)D4所述的那樣,由于每一個(gè)定向麥克風(fēng)的指向性根據(jù)頻 率而不同,因此分離結(jié)果的聲音可能失真。(2)對(duì)于ICA最佳的麥克風(fēng)排列是對(duì)于源分離的最佳排列,但其對(duì)于D0A估計(jì)和源 位置估計(jì)可能經(jīng)常是不合適的。因此,在麥克風(fēng)的相同設(shè)置下,在高精度執(zhí)行對(duì)于ICA最佳的排列和位置中設(shè)置 麥克風(fēng)的ICA處理和其他處理兩者時(shí)均出現(xiàn)困難。本發(fā)明的實(shí)施例通過使得能夠?qū)CA產(chǎn)生的源分離結(jié)果投射返回未在ICA中使用 的麥克風(fēng)的位置而克服了上述問題。以另一方式說明,可以通過將定向麥克風(fēng)所獲得的分離結(jié)果投射返回全向麥克風(fēng) 來解決在使用定向麥克風(fēng)時(shí)的以上問題⑴。此外,可以通過在適于ICA的麥克風(fēng)排列的設(shè) 置之下產(chǎn)生分離結(jié)果,并通過將產(chǎn)生的分離結(jié)果投射返回處于適于D0A和源位置估計(jì)的排 列的麥克風(fēng)(或位置已知的麥克風(fēng))來解決以上問題(2)(即,ICA與D0A估計(jì)或源位置估 計(jì)之間的麥克風(fēng)排列的矛盾)。因此,本發(fā)明的實(shí)施例使得能夠?qū)τ谂c適于ICA的麥克風(fēng)不同的麥克風(fēng)執(zhí)行投射 返回。[2.對(duì)于與適于ICA的麥克風(fēng)不同的麥克風(fēng)的投射返回處理及其原理]下面將描述對(duì)于與適于ICA的麥克風(fēng)不同的麥克風(fēng)的投射返回處理及其原理。令X( ,t)是把ICA中使用的麥克風(fēng)所觀測(cè)到的信號(hào)轉(zhuǎn)換到時(shí)頻域而產(chǎn)生的數(shù) 據(jù),Y( ,t)是數(shù)據(jù)X( ,t)的分離結(jié)果(分離信號(hào))。經(jīng)轉(zhuǎn)換的數(shù)據(jù)和分離結(jié)果與上述 現(xiàn)有技術(shù)中公式[2. 1]到[2. 7]所表示的那些相同。即,通過使用如下變量時(shí)頻域中觀測(cè)信號(hào)的經(jīng)轉(zhuǎn)換數(shù)據(jù)X( ,t),分離結(jié)果Y( ,t),以及分離矩陣W( ),關(guān)系
18
Y( ,t) = W( )X(co,t)成立。分離結(jié)果Y( co,t)可以表示在改變尺度之前和 之后兩者獲得的結(jié)果。接著,執(zhí)行如下的處理通過利用ICA的分離結(jié)果來進(jìn)行對(duì)于每一個(gè)均處于任意 位置的麥克風(fēng)的投射返回。如上所述,將ICA的分離結(jié)果投射返回麥克風(fēng)意味著如下的處 理分析每一個(gè)均設(shè)置在特定位置的麥克風(fēng)所采集的聲音信號(hào),并從采集的聲音信號(hào)中確 定可歸于各個(gè)源信號(hào)的相應(yīng)分量。當(dāng)僅一個(gè)聲音源有效時(shí),可歸于各個(gè)源信號(hào)的相應(yīng)分量 等于麥克風(fēng)所觀測(cè)到的相應(yīng)信號(hào)。執(zhí)行投射返回處理作為如下的處理輸入投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)以及通 過源分離處理所產(chǎn)生的分離結(jié)果(分離信號(hào)),并產(chǎn)生投射返回信號(hào)(投射返回結(jié)果)(即 與各個(gè)源對(duì)應(yīng)且由投射返回目標(biāo)麥克風(fēng)取得的分離信號(hào))。令X' k( ,t)是投射返回目標(biāo)麥克風(fēng)所觀測(cè)到的(轉(zhuǎn)換到時(shí)頻域的)觀測(cè)信號(hào) 之一。進(jìn)一步,令m是投射返回目標(biāo)麥克風(fēng)的數(shù)量,X' ( ,t)是如下這樣的矢量該矢量 包括各個(gè)麥克風(fēng)1到m所觀測(cè)到的(轉(zhuǎn)換到時(shí)頻域的)觀測(cè)信號(hào)X' ^wt)到X' ffl( , t)作為元素,如下列公式[7. 1]所表示的那樣。
P( ) = <X' (co, t)Y( , t)H>t{<Y( , t)Y( , t)H>t}^......[7.6]=<X' ( ,t)X( ,t)H>t<X( ,t)X( ,卞)11〉/1!…)-1......[7. 7] WLkJ (w) = diag(Pkl( ), ...,Pkn(co))ff(co)......[7. 11]
與矢量X' ( ,t)的元素對(duì)應(yīng)的麥克風(fēng)可以僅由未在ICA中使用的麥克風(fēng)組成,或者可以包括ICA中所使用的麥克風(fēng)。無論如何,這些麥克風(fēng)必須包括至少一個(gè)未在ICA 中使用的麥克風(fēng)。注意,根據(jù)現(xiàn)有技術(shù)的處理方法對(duì)應(yīng)于X' ( ,t)的元素僅由ICA中所 使用的麥克風(fēng)組成的情況。當(dāng)在ICA中使用定向麥克風(fēng)時(shí),將定向麥克風(fēng)的輸出看作包括于“ICA中使用的 麥克風(fēng)”中,而組成定向麥克風(fēng)的聲音采集裝置每一個(gè)均可以作為“未在ICA中使用的麥克 風(fēng)”來處理。例如,當(dāng)在ICA中利用以上參考圖3所述的定向麥克風(fēng)300時(shí),將定向麥克風(fēng) 300的輸出306看作(轉(zhuǎn)換到時(shí)頻域的)觀測(cè)信號(hào)X( ,t)的一個(gè)元素,而可以將聲音采 集裝置301和302所單獨(dú)觀測(cè)到的信號(hào)每一個(gè)均用作“ICA中未使用的麥克風(fēng)”的觀測(cè)信號(hào) X' k(w,t)。用Yk[i]( ,t)表示將分離結(jié)果Yk( ,t)投射返回“未在ICA中使用的麥克風(fēng)”(在 下文中稱為“麥克風(fēng)i”)的結(jié)果,即投射返回結(jié)果(投射返回信號(hào))。麥克風(fēng)i的觀測(cè)信號(hào) 是X'和“)。通過將ICA的分離結(jié)果(分離信號(hào))Yk( ,t)投射返回麥克風(fēng)i而獲得的投射返 回結(jié)果(投射返回信號(hào))Yk[i]( ,t)可以通過如下過程來計(jì)算。令Pjk( )是ICA的分離結(jié)果Yk( ,t)到麥克風(fēng)i的投射返回的系數(shù),可以由前 述公式[7.2]表示投射返回。系數(shù)Pjk( )可以用最小二乘逼近來確定。更具體而言,在準(zhǔn) 備了表示對(duì)于麥克風(fēng)i的分離結(jié)果的相應(yīng)投射返回結(jié)果之總和的信號(hào)(公式[7. 3])之后, 可以確定系數(shù),以便使所準(zhǔn)備信號(hào)與每個(gè)麥克風(fēng)i的觀測(cè)信號(hào)之間的均方誤差(公 式[7. 4])最小。在源分離處理中,如上所述,通過對(duì)觀測(cè)信號(hào)(其通過將用于源分離的麥克風(fēng)觀 測(cè)到的信號(hào)轉(zhuǎn)換到時(shí)頻域而獲得)執(zhí)行ICA(獨(dú)立分量分析)來產(chǎn)生時(shí)頻域中對(duì)應(yīng)于各個(gè) 聲音源的分離信號(hào)。在信號(hào)投射返回處理中,通過將由此產(chǎn)生的時(shí)頻域中的分離信號(hào)乘以 相應(yīng)的投射返回系數(shù)來計(jì)算與各個(gè)聲音源對(duì)應(yīng)的投射返回信號(hào)。計(jì)算投射返回系數(shù)PA( ),作為使對(duì)應(yīng)于各個(gè)聲音源的投射返回信號(hào)之總和與投 射返回目標(biāo)麥克風(fēng)的各個(gè)觀測(cè)信號(hào)之間的誤差最小的投射返回系數(shù)。例如,可以將最小二 乘逼近應(yīng)用于計(jì)算投射返回系數(shù)的處理。因此,準(zhǔn)備了表示對(duì)于麥克風(fēng)i的分離結(jié)果的相 應(yīng)投射返回結(jié)果之總和的信號(hào)(公式[7. 3]),并且確定hk( ),以便所準(zhǔn)備信號(hào)與每一個(gè) 麥克風(fēng)i的觀測(cè)信號(hào)之間的均方誤差(公式[7.4])最小??梢酝ㄟ^將分離信號(hào)乘以確定 的投射返回系數(shù)來計(jì)算投射返回結(jié)果(投射返回信號(hào))。下面將描述實(shí)際處理的細(xì)節(jié)。令P( )是由投射返回系數(shù)組成的矩陣(公式 [7. 5])??梢曰诠絒7. 6]來計(jì)算P( )。可替代地,也可以使用通過利用公式[3. 1]的 上述關(guān)系而修改的公式[7. 7]。一旦確定Pjk( ),則可以通過使用公式[7.2]來計(jì)算投射返回結(jié)果。可替代地, 也可以代替地使用公式[7. 8]或[7. 9]。公式[7. 8]表示用于將一個(gè)聲道的分離結(jié)果投射到每一個(gè)麥克風(fēng)的公式。公式[7. 9]表示用于將各個(gè)分離結(jié)果投射到特定麥克風(fēng)的公式。通過準(zhǔn)備反映投射返回系數(shù)的新分離矩陣W[k] ( ),公式[7.9]也可以重寫為公 式[7. 11]或[7. 10]。換言之,投射返回之后的分離結(jié)果Y' (co, t)也可以直接從觀測(cè)信 號(hào)X ( ,t)產(chǎn)生,而不產(chǎn)生投射返回之前的分離結(jié)果Y ( ,t)。
如果在公式[7. 7]中假設(shè)X' ( ,t) =乂(《,0,8卩,如果僅對(duì)于扣々中使用的麥 克風(fēng)執(zhí)行投射返回,則P( )與W(co)-1相同。因此,根據(jù)現(xiàn)有技術(shù)的投射返回SIM0對(duì)應(yīng)于 在本發(fā)明實(shí)施例中所使用的方法的特殊情況。ICA和投射返回中所使用的各麥克風(fēng)之間的最大距離依賴于聲波可以在與短時(shí)傅 立葉變換的一幀對(duì)應(yīng)的持續(xù)期間內(nèi)最大限度地移動(dòng)的距離。當(dāng)使用512點(diǎn)的幀,將通過以 16kHz采樣所獲得的觀測(cè)信號(hào)經(jīng)歷短時(shí)傅立葉變換時(shí),一幀由如下給出512/16000 = 0. 032 秒假設(shè)聲速=340 [m/s],聲音在該時(shí)間032秒]中大約移動(dòng)10 [m]。因此,通過 使用根據(jù)本發(fā)明實(shí)施例的方法,可以對(duì)距離適于ICA的麥克風(fēng)大約10[m]的麥克風(fēng)執(zhí)行投 射返回。盡管也可以通過使用公式[7.6]或[7.7]來計(jì)算投射返回系數(shù)矩陣P( )(公式 [7. 5]),但是由于公式[7. 6]和[7. 7]每一個(gè)均包括逆矩陣,因此公式[7. 6]或[7. 7]的使 用增大了計(jì)算成本。為了降低計(jì)算成本,可以通過使用如下的公式[8. 1]或[8.2]來計(jì)算 投射返回系數(shù)矩陣P( )。P(co) = <X ‘ (co, t)Y( , t) H>tdiag | ( , t) |2>t, ...,<|Yn( ,
t) I2),)"1......[8.1]= <X' (o, t)X(o, t)H>ff(o)Hdiag(ff(o)<X(o, t)X(o, t)H>tff(o)H)^......[8.2]P( )=<X' ( ,t)Y(w,t)H>t......[8.3]= <X' (o, t)X(o, t)H>ff(o)Ht......[8.4]后面將在[8.根據(jù)本發(fā)明其他實(shí)施例的信號(hào)處理設(shè)備]中詳細(xì)描述使用公式 [8.1]到[8.4]所執(zhí)行的處理。[3.對(duì)于與適于ICA的麥克風(fēng)不同的麥克風(fēng)的投射返回處理的處理示例(第一實(shí) 施例)]下面將參照?qǐng)D7到圖10描述本發(fā)明的第一實(shí)施例。第一實(shí)施例旨在執(zhí)行對(duì)于與適于ICA的麥克風(fēng)不同的麥克風(fēng)的投射返回這一處理。圖7是圖示根據(jù)本發(fā)明第一實(shí)施例的信號(hào)處理設(shè)備的配置的框圖。在圖7中所示 的信號(hào)處理設(shè)備700中,采用定向麥克風(fēng)作為用在基于ICA(獨(dú)立分量分析)的源分離處理 中的麥克風(fēng)。因此,信號(hào)處理設(shè)備700通過使用定向麥克風(fēng)所觀測(cè)到的信號(hào)執(zhí)行源分離處 理,并進(jìn)一步執(zhí)行將源分離處理的結(jié)果投射返回一個(gè)或多個(gè)全向麥克風(fēng)這一處理。本實(shí)施例中使用的麥克風(fēng)包括多個(gè)定向麥克風(fēng)701,其用于為源分離處理提供輸 入;以及一個(gè)或多個(gè)全向麥克風(fēng)702,其用作投射返回目標(biāo)。下面將描述這些麥克風(fēng)的排 列。麥克風(fēng)701和702連接到相應(yīng)的AD轉(zhuǎn)換和STFT模塊703 (703al到703an和703b 1到 703bm),其每一個(gè)均執(zhí)行采樣(模數(shù)轉(zhuǎn)換)和短時(shí)傅立葉變換(STFT)。由于相應(yīng)麥克風(fēng)所觀測(cè)到的各信號(hào)之間的相位差在執(zhí)行信號(hào)的投射返回時(shí)具有 重要意義,因此在AD轉(zhuǎn)換和STFT模塊703中執(zhí)行的AD轉(zhuǎn)換使得以公共時(shí)鐘進(jìn)行的采樣 成為必要。為此,時(shí)鐘供應(yīng)模塊704產(chǎn)生時(shí)鐘信號(hào),并將產(chǎn)生的時(shí)鐘信號(hào)應(yīng)用于AD轉(zhuǎn)換和 STFT模塊703,其每一個(gè)均執(zhí)行來自對(duì)應(yīng)麥克風(fēng)的輸入信號(hào)的處理,以便AD轉(zhuǎn)換和STFT模塊703中執(zhí)行的采樣處理彼此同步。在每一個(gè)AD轉(zhuǎn)換和STFT模塊703中已經(jīng)經(jīng)歷了短時(shí) 傅立葉變換(STFT)的信號(hào)被提供為頻域中的信號(hào)(即,譜圖)。因此,將用于接收源分離處理中所使用的語音信號(hào)的多個(gè)定向麥克風(fēng)701的觀測(cè) 信號(hào)分別輸入到AD轉(zhuǎn)換和STFT模塊703al到703an。AD轉(zhuǎn)換和STFT模塊703al到703an 根據(jù)輸入信號(hào)產(chǎn)生觀測(cè)信號(hào)譜圖,并將產(chǎn)生的譜圖應(yīng)用于源分離模塊705。源分離模塊705通過使用ICA技術(shù),從定向麥克風(fēng)獲得的觀測(cè)信號(hào)譜圖中產(chǎn)生分 別與聲音源對(duì)應(yīng)的分離結(jié)果譜圖以及用于產(chǎn)生那些分離結(jié)果的分離矩陣。后面將詳細(xì)描述 該源分離處理。該階段中的分離結(jié)果是投射返回一個(gè)或多個(gè)全向麥克風(fēng)之前的信號(hào)。另一方面,將用作投射返回目標(biāo)的一個(gè)或多個(gè)全向麥克風(fēng)702的觀測(cè)信號(hào)分別輸 入到AD轉(zhuǎn)換和STFT模塊703b 1到703bm。AD轉(zhuǎn)換和STFT模塊703b 1到703bm根據(jù)輸入 信號(hào)產(chǎn)生觀測(cè)信號(hào)譜圖,并將產(chǎn)生的譜圖應(yīng)用于信號(hào)投射返回模塊706。通過使用源分離模塊705所產(chǎn)生的分離結(jié)果(或觀測(cè)信號(hào)和分離矩陣)以及與投 射返回目標(biāo)麥克風(fēng)702對(duì)應(yīng)的觀測(cè)信號(hào),信號(hào)投射返回模塊706將分離結(jié)果投射到全向麥 克風(fēng)702。后面將詳細(xì)描述該投射返回處理。如果需要的話,將投射返回之后的分離結(jié)果發(fā)送到執(zhí)行后端處理的后端處理模塊 707,或從裝置(如揚(yáng)聲器)將其輸出。后端處理模塊707所執(zhí)行的后端處理例如是語音識(shí) 別處理。另一方面,當(dāng)從裝置(如擴(kuò)音器)輸出分離結(jié)果時(shí),分離結(jié)果在逆FT和DA轉(zhuǎn)換模 塊708中經(jīng)歷逆傅立葉變換(FT)和數(shù)模轉(zhuǎn)換,并且從輸出裝置709 (如擴(kuò)音器或耳機(jī))輸 出所得到的時(shí)域中的模擬信號(hào)。上述處理模塊由控制模塊710控制。盡管在以下參照的框圖中省略了控制模塊, 但在控制模塊的控制之下執(zhí)行后述處理。將參照?qǐng)D8描述圖7中所示信號(hào)處理設(shè)備700中的定向麥克風(fēng)701和全向麥克風(fēng) 702的示例性排列。圖8表示如下這樣的示例將ICA處理基于四個(gè)定向麥克風(fēng)801 (801a 到801d)的觀測(cè)信號(hào)所獲得的分離結(jié)果投射返回兩個(gè)全向麥克風(fēng)803 (803p和803q)。通過 以基本上等于人耳之間的距離的間距排列兩個(gè)全向麥克風(fēng)803p和803q,基本上獲得作為 雙聲道立體聲信號(hào)(即,由兩個(gè)耳朵觀測(cè)的聲音信號(hào))的源分離結(jié)果。定向麥克風(fēng)801(801a到801d)是如下這樣的四個(gè)定向麥克風(fēng)其被布置為使得當(dāng) 從上面觀看時(shí),靈敏度高的方向802位于向上、向下、向左和向右。定向麥克風(fēng)可以是在與 每一個(gè)箭頭的方向相反的方向上形成零點(diǎn)波束的類型中的每一個(gè)(例如,具有如圖4中所 示這種指向性特性的麥克風(fēng))。除了定向麥克風(fēng)801之外,還準(zhǔn)備用作投射返回目標(biāo)的全向麥克風(fēng)803(803p和 803q)。全向麥克風(fēng)803的數(shù)量和位置管理投射返回結(jié)果的類型。如圖8中所示,當(dāng)用作投 射返回目標(biāo)的全向麥克風(fēng)803 (803p和803q)基本上布置在與左右定向麥克風(fēng)801a和801c 的相應(yīng)前端相同的位置時(shí),獲得幾乎與人耳剛好位于全向麥克風(fēng)803的位置處的情形等效 的雙聲道立體聲信號(hào)。盡管圖8圖示了作為用作投射返回目標(biāo)的全向麥克風(fēng)的兩個(gè)麥克風(fēng)803p和803q, 但是用作投射返回目標(biāo)的全向麥克風(fēng)的數(shù)量不限于2。如果僅僅想要獲得具有平坦頻率響 應(yīng)的分離結(jié)果,則可以使用單個(gè)全向麥克風(fēng)。相反,用作投射返回目標(biāo)的全向麥克風(fēng)的數(shù)量 可以大于用于源分離的麥克風(fēng)的數(shù)量。使用較大數(shù)量的投射返回目標(biāo)麥克風(fēng)的示例將在后面作為變型來描述。[4.通過使用多個(gè)全向麥克風(fēng)組成虛擬定向麥克風(fēng)的實(shí)施例(第二實(shí)施例)]雖然在圖7的信號(hào)處理設(shè)備700中,用于源分離的定向麥克風(fēng)701和用作投射返 回目標(biāo)的全向麥克風(fēng)702彼此分離地設(shè)置,但是可以通過采用多個(gè)全向麥克風(fēng)組成虛擬定 向麥克風(fēng)來實(shí)現(xiàn)麥克風(fēng)的共享。下面將參照?qǐng)D9和圖10描述這種配置。在下面的描述中,將 全向麥克風(fēng)稱為“聲音采集裝置”,而將多個(gè)聲音采集裝置所形成的定向麥克風(fēng)稱為“(虛 擬)定向麥克風(fēng)”。例如,在以上參照?qǐng)D3所述的定向麥克風(fēng)中,通過使用兩個(gè)聲音采集裝 置來形成一個(gè)虛擬定向麥克風(fēng)。圖9中所示的信號(hào)處理設(shè)備900表示使用多個(gè)聲音采集裝置的情況。將聲音采集 裝置分組為用于投射返回的聲音采集裝置902和不用于投射返回而僅用于源分離的聲音 采集裝置901。雖然圖9中所示的信號(hào)處理設(shè)備900還包括用于控制各種處理模塊的控制 模塊(如圖7中所示的設(shè)備700中那樣),但是圖9中省略控制模塊。通過AD轉(zhuǎn)換和STFT模塊903 (903al到903an以及903bl到903bm)分別將聲音 采集裝置901和902所觀測(cè)到的信號(hào)轉(zhuǎn)換為時(shí)頻域中的信號(hào)。如以上參照?qǐng)D7所述配置 中那樣,由于相應(yīng)麥克風(fēng)所觀測(cè)到的各信號(hào)之間的相位差在執(zhí)行信號(hào)的投射返回時(shí)具有重 要意義,因此AD轉(zhuǎn)換和STFT模塊903中所執(zhí)行的AD轉(zhuǎn)換使得以公共時(shí)鐘進(jìn)行采樣成為必 要。為此,時(shí)鐘供應(yīng)模塊904產(chǎn)生時(shí)鐘信號(hào),并將產(chǎn)生的時(shí)鐘信號(hào)應(yīng)用于AD轉(zhuǎn)換和STFT模 塊903,其每一個(gè)均執(zhí)行來自對(duì)應(yīng)麥克風(fēng)的輸入信號(hào)的處理,以便AD轉(zhuǎn)換和STFT模塊903 中執(zhí)行的采樣處理彼此同步。每一個(gè)AD轉(zhuǎn)換和STFT模塊903中已經(jīng)經(jīng)歷了短時(shí)傅立葉變 換(STFT)的信號(hào)被提供為頻域中的信號(hào)(即,譜圖)。AD轉(zhuǎn)換和STFT模塊903 (903al到903an以及903bl到903bm)所產(chǎn)生的、由聲音 采集裝置901的觀測(cè)信號(hào)(即,經(jīng)歷了 STFT之后的時(shí)頻域中的信號(hào))組成的矢量被假設(shè)為 0( ,t)911。在指向性形成模塊905中,將聲音采集裝置901的觀測(cè)信號(hào)轉(zhuǎn)換為要由多個(gè) 虛擬定向麥克風(fēng)觀測(cè)的信號(hào)。后面將描述轉(zhuǎn)換的細(xì)節(jié)。假設(shè)轉(zhuǎn)換結(jié)果組成的矢量為X( , t)912。源分離模塊906從與虛擬定向麥克風(fēng)對(duì)應(yīng)的觀測(cè)信號(hào)中產(chǎn)生分別與各聲音源對(duì)應(yīng) 的(投射返回之前的)分離結(jié)果和分離矩陣。將用于源分離且進(jìn)一步經(jīng)歷投射返回的、聲音采集裝置902的觀測(cè)信號(hào)從AD轉(zhuǎn)換 和STFT模塊903 (903b 1到903bm)發(fā)送到信號(hào)投射返回模塊907。由X' ( ,t)913表示 聲音采集裝置902的觀測(cè)信號(hào)所組成的矢量。信號(hào)投射返回模塊907通過使用來自源分離 模塊906的分離結(jié)果(或觀測(cè)信號(hào)X( ,t)912和分離矩陣)以及來自用作投射返回目標(biāo) 的聲音采集裝置902的觀測(cè)信號(hào)X' (co, t) 913,執(zhí)行分離結(jié)果的投射返回。信號(hào)投射返回模塊907、后端處理模塊908、逆FT和DA轉(zhuǎn)換模塊909和輸出裝置 910的相應(yīng)處理和配置與以上參照?qǐng)D7所述的那些相同,因此省略其描述。下面將參照?qǐng)D10,描述與信號(hào)處理設(shè)備900的配置(圖9中所示)對(duì)應(yīng)的麥克風(fēng) 排列的示例以及形成麥克風(fēng)指向性的方法。在圖10所示的麥克風(fēng)排列中,以交叉樣式排列五個(gè)聲音采集裝置(即,聲音采集 裝置1 (由1001表示)到聲音采集裝置5 (由1005表示))。所有這些聲音采集裝置1到5 與用于圖9中的信號(hào)處理設(shè)備900中的源分離處理的聲音采集裝置對(duì)應(yīng)。此外,聲音采集 裝置2 (1002)和聲音采集裝置5 (1005)對(duì)應(yīng)于不僅用于源分離處理而且還作為投射返回目
23標(biāo)的聲音采集裝置(即,圖9中所示的聲音采集裝置902)。圍繞位于中心的聲音采集裝置3(1003)的四個(gè)聲音采集裝置在通過聲音采集 裝置3(1003)配對(duì)使用時(shí)形成了在相應(yīng)方向上的指向性。例如,通過使用聲音采集裝置 1(1001)和聲音采集裝置3 (1003)形成如圖10中看到的那樣、具有向上指向性(即,在向 下方向上形成零點(diǎn)波束)的虛擬定向麥克風(fēng)1(1006)。因此,通過使用五個(gè)聲音采集裝置 1(1001)到5(1005)產(chǎn)生與四個(gè)虛擬定向麥克風(fēng)1(1006)到4(1009)所觀測(cè)到的信號(hào)等效 的觀測(cè)信號(hào)。下面將描述形成指向性的方法。進(jìn)一步,聲音采集裝置2(1002)和聲音采集裝置5 (1005)用作作為投射返回目標(biāo) 1和2的麥克風(fēng)。這兩個(gè)聲音采集裝置對(duì)應(yīng)于圖9中的聲音采集裝置902?,F(xiàn)在將參照下面的公式[9. 1]到[9. 4]描述圖10中所示的、從五個(gè)聲音采集裝置 1(1001)到5(1005)形成四個(gè)指向性的方法。
其中j 虛數(shù)單元co 頻率窗口的索引(1到M)M:頻率窗口的總數(shù)dki 聲音采集裝置k和i之間的距離F 采樣頻率C:聲速
.[9.4]令Ojc^t)到05( ,t)是來自聲音采集裝置的相應(yīng)觀測(cè)信號(hào)(在時(shí)頻域中),并 且0( ,t)是包括那些觀測(cè)信號(hào)作為元素的矢量(公式[9. 1])。通過使用與以上參照?qǐng)D3所述的方法類似的方法,可以從一對(duì)聲音采集裝置形成 指向性。通過將成對(duì)的聲音采集裝置之一的觀測(cè)信號(hào)乘以公式[9.3]所表示的D( ,dki) 來表示時(shí)頻域中的延遲。結(jié)果,可以由公式[9.2]表示四個(gè)虛擬定向麥克風(fēng)所觀測(cè)到的信 號(hào) X( ,t)。將成對(duì)的聲音采集裝置之一的觀測(cè)信號(hào)乘以公式[9. 3]所表示的D( ,dki)的處 理對(duì)應(yīng)于根據(jù)成對(duì)的聲音采集裝置之間的距離來延遲相位的處理。因此,可以計(jì)算以上參 照?qǐng)D3所述的、與定向麥克風(fēng)300的輸出類似的輸出。圖9中所示的信號(hào)處理設(shè)備900的指向性形成模塊905將由此產(chǎn)生的信號(hào)輸出到源分離模塊906。投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)所組成的矢量X' (co, t)可以由公式[9.4]表 示,這是因?yàn)樗鼈儽惶峁槁曇舨杉b置2 (1001)和聲音采集裝置5 (1005)的觀測(cè)信號(hào)。一 旦獲得了 X( ,t)和X' ( ,t),就可以以與使用用于源分離和投射返回的分離麥克風(fēng)的 情況類似的方式、通過使用上述公式[7.1]到[7. 11]、基于X( ,t)和X' ( ,t)執(zhí)行投 射返回。[5.以組合的方式執(zhí)行源分離處理的分離結(jié)果的投射返回處理和D0A估計(jì)或源位 置估計(jì)的處理示例(第三實(shí)施例)]下面將參照?qǐng)D11到圖13描述本發(fā)明的第三實(shí)施例。第三實(shí)施例表示源分離處理中分離結(jié)果的投射返回與D0A估計(jì)或源位置估計(jì)之 間的組合處理的示例。將參照?qǐng)D11描述根據(jù)第三實(shí)施例的信號(hào)處理設(shè)備1100的示例性配置。圖11中 所示的信號(hào)處理設(shè)備1100還包括(如以上參照?qǐng)D7到圖9所述的信號(hào)處理設(shè)備中那樣) 兩種類型的麥克風(fēng),即用于源分離的源分離麥克風(fēng)1101和僅用于投射返回的投射返回目 標(biāo)麥克風(fēng)1102。后面將描述這些麥克風(fēng)的安裝位置的細(xì)節(jié)。雖然圖11中所示的信號(hào)處理 設(shè)備1100還包括用于控制各種處理模塊的控制模塊(如圖7中所示的設(shè)備700中那樣), 但是在圖11中省略了控制模塊。盡管用于源分離的一部分或所有源分離麥克風(fēng)1101也可以用作投射返回目標(biāo)麥 克風(fēng),但是準(zhǔn)備不用于源分離的至少一個(gè)麥克風(fēng)來專用于投射返回目標(biāo)。AD轉(zhuǎn)換和STFT模塊1103和時(shí)鐘供應(yīng)模塊1104的功能與已經(jīng)在上文中參照?qǐng)D7 和圖9描述的AD轉(zhuǎn)換和STFT模塊和時(shí)鐘供應(yīng)模塊的功能相同。源分離模塊1105和信號(hào)投射返回模塊1106的功能也與已經(jīng)在上文中參照?qǐng)D7和 圖9描述的源分離模塊和信號(hào)投射返回模塊的功能相同。然而,除了專用于投射返回目標(biāo) 的麥克風(fēng)1102所觀測(cè)到的觀測(cè)信號(hào)之外,輸入到信號(hào)投射返回模塊1106的觀測(cè)信號(hào)還包 括不僅用于源分離而且還作為投射返回目標(biāo)的一個(gè)或多個(gè)麥克風(fēng)1101的觀測(cè)信號(hào)。(后面 將描述實(shí)際示例。)通過使用信號(hào)投射返回模塊的處理結(jié)果,D0A(或源位置)估計(jì)模塊1108估計(jì)與 各個(gè)聲音源對(duì)應(yīng)的方向或位置。后面將描述估計(jì)處理的細(xì)節(jié)。作為估計(jì)處理的結(jié)果,獲得 D0A或源位置1109。信號(hào)合并模塊1110是可選的。信號(hào)合并模塊1110將D0A (或源位置)1109和在投 射返回模塊1106中獲得的投射返回結(jié)果1107彼此合并,因此產(chǎn)生源與源到達(dá)的方向(或 位置)之間的對(duì)應(yīng)性。下面將參照?qǐng)D12,描述圖11中所示的信號(hào)處理設(shè)備1100中的麥克風(fēng)排列,即,在 信號(hào)處理設(shè)備1100中適于以組合方式執(zhí)行將源分離所獲得的分離結(jié)果進(jìn)行投射返回這一 處理和執(zhí)行D0A估計(jì)或源位置估計(jì)這一處理的麥克風(fēng)排列。必須將麥克風(fēng)排列設(shè)置為能夠執(zhí)行D0A估計(jì)或源位置估計(jì)。實(shí)際上,將麥克風(fēng)排 列設(shè)置為能夠基于以上參照?qǐng)D6所述的三角測(cè)量原理來估計(jì)源位置。圖12圖示了八個(gè)麥克風(fēng)1 (由1201表示)到8 (由1208表示)。麥克風(fēng)1 (1201) 和麥克風(fēng)2 (1202)僅用于源分離處理。將麥克風(fēng)5 (1205)到8 (1208)設(shè)置為投射返回目標(biāo)并且僅用于位置估計(jì)處理。剩余的麥克風(fēng)3 (1203)和麥克風(fēng)4 (1204)用于源分離處理和位 置估計(jì)處理二者。以另一方式說明,通過使用四個(gè)麥克風(fēng)1(1201)到4(1204)的觀測(cè)信號(hào)來執(zhí)行源 分離,并且將分離結(jié)果投射返回麥克風(fēng)5 (1205)到8 (1208)。假設(shè)麥克風(fēng)1(1201)到8 (1208)的相應(yīng)觀測(cè)信號(hào)分別是( ,t)到08( ,t),貝丨J 用于源分離的觀測(cè)信號(hào)x( ,t)可以由下面的公式[10. 2]表示。此外,用于投射返回的觀 測(cè)信號(hào)可以由下面的公式[10.3]表示。一旦獲得了 X( ,t)和X' ( ,t),就可以以與使 用用于源分離和投射返回的分離的麥克風(fēng)的情況類似的方式、通過使用上述公式[7. 1]到 [7. 11]、基于X( ,t)和X' ( ,t)來執(zhí)行投射返回。
‘ -[10.1] 0((D, 例如,在圖12所示的麥克風(fēng)排列中設(shè)置了三個(gè)麥克風(fēng)對(duì)(S卩,麥克風(fēng)對(duì)1(由1212 表示)、麥克風(fēng)對(duì)2 (由1213表示)和麥克風(fēng)對(duì)3 (由1214表示))。通過對(duì)于組成每一個(gè) 麥克風(fēng)對(duì)的麥克風(fēng)使用投射返回之后的源分離結(jié)果(即投射返回結(jié)果),可以根據(jù)以上參 照?qǐng)D5所述的處理來確定D0A (角度)。換言之,麥克風(fēng)對(duì)每一個(gè)均由兩個(gè)相鄰的麥克風(fēng)組成,并且針對(duì)每一個(gè)麥克風(fēng)對(duì) 確定DOA。D0A (或源位置)估計(jì)模塊1108 (圖11中所示)接收在信號(hào)投射返回模塊106中 產(chǎn)生的投射返回信號(hào),并執(zhí)行基于來自多個(gè)投射返回目標(biāo)麥克風(fēng)(其位于不同的位置)的 各投射返回信號(hào)之間的相位差計(jì)算D0A的處理。如上所述,通過獲得作為投射返回結(jié)果的Yk[i] ( ,t)與Yk[i' ]( ,t)之間的相位 差來確定DOA 0
之間(即,各投射返回結(jié)果之間)的關(guān)系 由上述公式[5. 1]表示。用于計(jì)算相位差的公式由上述公式[5. 2]和[5. 3]表示。進(jìn)一步,D0A(或源位置)估計(jì)模塊1108基于關(guān)于D0A的組合數(shù)據(jù)(其根據(jù)位于 多個(gè)不同位置的投射返回目標(biāo)麥克風(fēng)的投射返回信號(hào)來計(jì)算)計(jì)算源位置。這種處理對(duì)應(yīng) 于如以上參照?qǐng)D6所述的、以類似的方式基于三角測(cè)量原理來指定源位置的處理。利用圖12中所示的設(shè)置,可以針對(duì)三個(gè)麥克風(fēng)對(duì)(即,麥克風(fēng)對(duì)1(1212)、麥克風(fēng)對(duì)2 (1213)和麥克風(fēng)對(duì)3 (1214))中每一個(gè)確定D0A(角度0)。接著,如以上參照?qǐng)D6所述 的那樣,設(shè)置具有位于每一對(duì)的麥克風(fēng)之間的中點(diǎn)的頂點(diǎn)并且具有其一半表示D0A( 0 )的 頂角的圓錐體。在圖12的示例中,與三個(gè)麥克風(fēng)對(duì)對(duì)應(yīng)地設(shè)置三個(gè)圓錐體。這三個(gè)圓錐體 的交叉點(diǎn)可以被確定為源位置。圖13圖示了圖11中所示的信號(hào)處理設(shè)備(即,用于執(zhí)行源分離處理、投射返回處 理和D0A或源位置估計(jì)處理的信號(hào)處理設(shè)備)中的麥克風(fēng)排列的另一示例。圖13的麥克 風(fēng)排列要解決關(guān)于“改變其位置的麥克風(fēng)”的上述現(xiàn)有技術(shù)中的問題。將麥克風(fēng)1302和1304放置在電視1301和用戶所操作的遙控器1303上。遙控器 1303上的麥克風(fēng)1304用于源操作。電視1301上的麥克風(fēng)1302用作投射返回目標(biāo)。利用放置在遙控器1303上的麥克風(fēng)1304,可以在說話的用戶附近的位置處采集 聲音。然而,遙控器1303上的麥克風(fēng)的精確位置是未知的。另一方面,放置在電視1301的 框架上的麥克風(fēng)1302每一個(gè)有關(guān)其關(guān)于電視外殼上的一點(diǎn)(如,屏幕中心)的位置是已知 的。然而,麥克風(fēng)1302可能遠(yuǎn)離用戶。因此,通過基于遙控器1303上的麥克風(fēng)1304的觀測(cè)信號(hào)執(zhí)行源分離并將分離結(jié) 果投射返回電視1301上的麥克風(fēng)1302,可以獲得具有兩種麥克風(fēng)的相應(yīng)優(yōu)點(diǎn)的分離結(jié)果。 在估計(jì)D0A或源位置時(shí)采用對(duì)于電視1301上麥克風(fēng)1302的投射返回的結(jié)果。在實(shí)際中, 假設(shè)具有遙控器的用戶的說話作為聲音源的情況,可以估計(jì)具有遙控器的用戶的位置和方 向。盡管使用放置在遙控器1303上且位置未知的麥克風(fēng)1304,但是例如可以根據(jù)具 有遙控器1303且說出語音命令的用戶位于電視1301的前面還是一側(cè)來改變電視的響應(yīng) (例如,使電視僅響應(yīng)于來自電視前面的說話)。[6.組成根據(jù)本發(fā)明實(shí)施例的信號(hào)處理設(shè)備的各模塊的示例性配置]下面將參照?qǐng)D14到圖16,描述源分離模塊和信號(hào)投射返回模塊(其對(duì)于根據(jù)各實(shí) 施例的信號(hào)處理設(shè)備是共同的)的配置和處理的細(xì)節(jié)。圖14圖示了源分離模塊的一個(gè)示例性配置?;旧?,源分離模塊包括緩沖器1402 到1406,用于存儲(chǔ)在基于上述公式[3. 1]到[3. 9](即,基于ICA的獲知規(guī)則)的計(jì)算中采 用的變量和函數(shù)所對(duì)應(yīng)的數(shù)據(jù)。獲知計(jì)算模塊1401使用存儲(chǔ)的值執(zhí)行計(jì)算。觀測(cè)信號(hào)緩沖器1402表示用于存儲(chǔ)與預(yù)定持續(xù)期間對(duì)應(yīng)的時(shí)頻域中的觀測(cè)信號(hào) 的緩沖器區(qū)域,并且存儲(chǔ)與上述公式[3. 1]中X( ,t)對(duì)應(yīng)的數(shù)據(jù)。分離矩陣緩沖器1403和分離結(jié)果緩沖器1404表示用于存儲(chǔ)獲知期間的分離矩陣 和分離結(jié)果的區(qū)域,并且分別存儲(chǔ)與公式[3.1]中的W( ,t)和Y( ,t)對(duì)應(yīng)的數(shù)據(jù)。同樣地,分?jǐn)?shù)函數(shù)緩沖器1405和分離矩陣校正值緩沖器1406分別存儲(chǔ)與公式 [3.2]中的CpW(Y(t))和Aff(co)對(duì)應(yīng)的數(shù)據(jù)。在圖14的配置中所準(zhǔn)備的各種緩沖器中,除了觀測(cè)信號(hào)緩沖器1402以外,在獲知 循環(huán)有效的同時(shí),存儲(chǔ)于這些緩沖器中的值不斷變化。圖15和圖16圖示了信號(hào)投射返回模塊的示例性配置。圖15圖示了當(dāng)計(jì)算投射返回系數(shù)矩陣P( )(參見公式[7.5])時(shí),與使用上述 公式[7.6]的情況對(duì)應(yīng)的配置,而圖16圖示了當(dāng)計(jì)算投射返回系數(shù)矩陣P( )(參見公式 [7.5])時(shí),與使用上述公式[7.7]的情況對(duì)應(yīng)的配置。
首先描述信號(hào)投射返回模塊的示例性配置(圖15中所示)。圖15中圖示的信號(hào) 投射返回模塊包括與公式[7. 6]、[7. 8]和[7. 9]中表示的變量對(duì)應(yīng)的緩沖器1502到1507, 并且計(jì)算模塊1501通過使用在這些緩沖器中存儲(chǔ)的值來執(zhí)行計(jì)算。投射返回前分離結(jié)果緩沖器1502表示用于存儲(chǔ)從源分離模塊輸出的分離結(jié)果的 區(qū)域。不同于在圖14中所示的源分離模塊的分離結(jié)果緩沖器1504中存儲(chǔ)的分離結(jié)果,圖 15中所示的信號(hào)投射返回模塊的投射返回前分離結(jié)果緩沖器1502中存儲(chǔ)的分離結(jié)果是獲 知結(jié)束之后的值。投射返回目標(biāo)觀測(cè)信號(hào)緩沖器1503是用于存儲(chǔ)投射返回目標(biāo)麥克風(fēng)所觀測(cè)到的 信號(hào)的緩沖器。通過使用這兩個(gè)緩沖器1502和1503來計(jì)算公式[7. 6]中的兩個(gè)協(xié)方差矩陣。協(xié)方差矩陣緩沖器1504存儲(chǔ)投射返回之前的分離結(jié)果本身的協(xié)方差矩陣,即與 公式[7.6]中的<Y( ,t)Y( ,t)H>t對(duì)應(yīng)的數(shù)據(jù)。另一方面,互協(xié)方差矩陣緩沖器1505存儲(chǔ)投射返回目標(biāo)觀測(cè)信號(hào)X' (co, t)和 投射返回之前的分離結(jié)果Y( ,t)的協(xié)方差矩陣,即與公式[7.6]中的<X' (co,t)Y( , t)H>t對(duì)應(yīng)的數(shù)據(jù)。這里,將不同變量之間的協(xié)方差矩陣稱為“互協(xié)方差矩陣”,而將相同變 量之間的協(xié)方差矩陣簡(jiǎn)稱為“協(xié)方差矩陣”。投射返回系數(shù)緩沖器1506表示用于存儲(chǔ)基于公式[7.6]計(jì)算的投射返回系數(shù) P( )的區(qū)域。投射返回結(jié)果緩沖器1507存儲(chǔ)基于公式[7. 8]或[7. 9]計(jì)算的投射返回結(jié)果Yk[i] O,t)。關(guān)于D0A估計(jì)和源位置估計(jì),一旦確定了投射返回系數(shù),就可以計(jì)算D0A和源位置 而不計(jì)算投射返回結(jié)果本身。因此,在以組合方式執(zhí)行D0A估計(jì)或源位置估計(jì)的一些本發(fā) 明實(shí)施例中可以省略投射返回結(jié)果緩沖器1507。接著,描述圖16中所示的信號(hào)投射返回模塊的示例性配置。圖16的配置與圖15 的配置不同之處在于使用了關(guān)系Y ( ,t) = W ( ) X ( ,t)(公式[2. 5])。因此,在前者中, 省略了存儲(chǔ)分離結(jié)果Y( ,t)的緩沖器,而是準(zhǔn)備了存儲(chǔ)分離矩陣W( )的緩沖器。源分離觀測(cè)信號(hào)緩沖器1602表示存儲(chǔ)用于源分離的麥克風(fēng)的觀測(cè)信號(hào)的區(qū)域。 該緩沖器1602可以與以上已經(jīng)參照?qǐng)D14所述的源分離模塊的觀測(cè)信號(hào)緩沖器1402共同 地使用。分離矩陣緩沖器1603存儲(chǔ)通過源分離模塊中的獲知所獲得的分離矩陣。不同于 以上已經(jīng)參照?qǐng)D14描述的源分離模塊的分離矩陣緩沖器1403,該緩沖器1603存儲(chǔ)獲知結(jié) 束之后的分離矩陣的相應(yīng)值。與以上參照?qǐng)D15所述的投射返回目標(biāo)觀測(cè)信號(hào)緩沖器1503類似,投射返回目標(biāo) 觀測(cè)信號(hào)緩沖器1604是用于存儲(chǔ)投射返回目標(biāo)麥克風(fēng)所觀測(cè)到的信號(hào)的緩沖器。通過使用這兩個(gè)緩沖器1603和1604來計(jì)算公式[7. 7]中的兩個(gè)協(xié)方差矩陣。協(xié)方差矩陣1605存儲(chǔ)用于源分離的分離結(jié)果本身的協(xié)方差矩陣,即與公式[7. 7] 中的〈X ( ,t) X ( ,t) H>t對(duì)應(yīng)的數(shù)據(jù)。另一方面,互協(xié)方差矩陣緩沖器1606存儲(chǔ)投射返回目標(biāo)觀測(cè)信號(hào)X' ( ,t)和 用于源分離的分離結(jié)果X( ,t)的協(xié)方差矩陣,即與公式[7.7]中的<X' (co,t)X( ,t)H>t對(duì)應(yīng)的數(shù)據(jù)。投射返回系數(shù)緩沖器1607表示用于存儲(chǔ)基于公式[7.7]計(jì)算的投射返回系數(shù) P( )的區(qū)域。與以上參照?qǐng)D15描述的投射返回結(jié)果緩沖器1507類似,投射返回結(jié)果緩沖器 1608存儲(chǔ)基于公式[7. 8]或[7. 9]計(jì)算的投射返回結(jié)果Yk[i]( ,t)。[7.信號(hào)處理設(shè)備中執(zhí)行的處理序列]下面將參照?qǐng)D17到圖20的流程圖,描述根據(jù)本發(fā)明實(shí)施例的信號(hào)處理設(shè)備中執(zhí) 行的處理序列。圖17是說明當(dāng)通過采用基于由用于源分離的麥克風(fēng)獲得的數(shù)據(jù)的分離結(jié)果來執(zhí) 行用于投射返回目標(biāo)麥克風(fēng)的投射返回處理時(shí)的處理序列的流程圖。圖17的流程圖要說 明的例如是在將來自定向麥克風(fēng)(或虛擬定向麥克風(fēng))的源分離結(jié)果投射返回全向麥克風(fēng) 的設(shè)備(與圖7中所示的信號(hào)處理設(shè)備700以及圖9中所示的信號(hào)處理設(shè)備900對(duì)應(yīng))中 所執(zhí)行的處理。在步驟S101,對(duì)每一個(gè)麥克風(fēng)(或每一個(gè)聲音采集裝置)采集到的信號(hào)執(zhí)行AD轉(zhuǎn) 換。然后,在步驟S102,對(duì)每一個(gè)信號(hào)執(zhí)行短時(shí)傅立葉變換(STFT),以轉(zhuǎn)換為時(shí)頻域中的信號(hào)。下一步驟S103中的指向性形成處理是在通過使用多個(gè)全向麥克風(fēng)形成虛擬指向 性(如以上參照?qǐng)D10所述的那樣)的配置中所需的處理。例如,在如圖10中所示排列多個(gè) 全向麥克風(fēng)的配置中,根據(jù)上述公式[9. 1]到[9.4]產(chǎn)生虛擬定向麥克風(fēng)的觀測(cè)信號(hào)。在 如圖8中所示那樣最初地(實(shí)際地)使用定向麥克風(fēng)的配置中,可以免除步驟S103中的指 向性形成處理。在步驟S104的源分離處理中,通過將ICA應(yīng)用于時(shí)頻域中的觀測(cè)信號(hào)(其通過定 向麥克風(fēng)獲得)而獲得獨(dú)立分離結(jié)果。后面將描述步驟S104中的源分離處理的細(xì)節(jié)。在步驟S105,執(zhí)行將步驟S104中獲得的分離結(jié)果投射返回預(yù)定麥克風(fēng)的處理。后 面將描述步驟S 105中的投射返回處理的細(xì)節(jié)。在獲得了對(duì)于麥克風(fēng)的投射返回的結(jié)果之后,如果需要的話,執(zhí)行逆傅立葉變換 等(步驟S106)和后端處理(步驟S107)。由此完成整個(gè)處理。下面將參照?qǐng)D18的流程圖,描述以組合方式執(zhí)行分離結(jié)果的投射返回和D0A估計(jì) (或源位置估計(jì))的設(shè)備(與圖11中所示的信號(hào)處理設(shè)備1100對(duì)應(yīng))中所執(zhí)行的處理序 列。步驟S201、S202和S203中的處理分別與圖17流程中的步驟S101、S102和S104 的處理相同,因此省略這些步驟的描述。步驟S204中的投射返回處理是將分離結(jié)果投射到作為投射返回目標(biāo)的麥克風(fēng)的 處理。在步驟S204的該處理中,與圖17流程中的步驟S105中的投射返回處理類似,執(zhí)行 步驟S203中獲得的分離結(jié)果對(duì)于預(yù)定麥克風(fēng)的投射返回。盡管以上述處理序列執(zhí)行了投射返回處理,但是可以僅通過計(jì)算投射返回系數(shù) (即,上述公式[7. 6]、[7. 7]、[8.1]或[8. 2]中所表示的投射返回系數(shù)矩陣P( ))來省略 分離結(jié)果的實(shí)際投射返回處理。步驟S205是基于已經(jīng)投射返回麥克風(fēng)的分離結(jié)果來計(jì)算D0A或源位置的處理。該
29步驟中執(zhí)行的計(jì)算方法本身類似于現(xiàn)有技術(shù)中使用的計(jì)算方法,因此下面簡(jiǎn)要地描述該計(jì)
算方法。假設(shè)關(guān)于兩個(gè)麥克風(fēng)i和i'針對(duì)第k個(gè)分離結(jié)果Yk( ,t)計(jì)算出的D0A(角度) 是ekii, (co)。這里,i和i'是分配給除了用于源分離的麥克風(fēng)之外,用作投射返回目標(biāo) 的麥克風(fēng)(或聲音采集裝置)的下標(biāo)?;谌缦鹿絒11. 1]計(jì)算角度(co)。
公式[11. 1]與“背景技術(shù)”中關(guān)于現(xiàn)有技術(shù)方法的上述公式[5. 3]相同。此外, 通過采用上述公式[7.8],可以直接從投射返回系數(shù)P( )的元素中計(jì)算出D0A(見公式 [11.2]),而不產(chǎn)生投射返回之后的分離結(jié)果Yk[i]( ,t)。在采用公式[11.2]的情況下,處 理序列可包括這樣的步驟僅確定投射返回系數(shù)P(co),而忽略投射返回步驟(S204)中執(zhí) 行的分離結(jié)果的投射返回。當(dāng)確定用于指示關(guān)于兩個(gè)麥克風(fēng)i和i'計(jì)算出的D0A的角度0kii, (co)時(shí),還 可以以頻率窗口(《)或麥克風(fēng)對(duì)(i和i'的每一對(duì))為單元計(jì)算各個(gè)角度9 kii, (co),以 獲得多個(gè)計(jì)算出的角度的平均值,并且基于該平均值確定最終的D0A。進(jìn)一步,如以上參照 圖6所述的那樣,可以基于三角測(cè)量原理來確定源位置。在步驟S205的處理之后,如果需要的話,執(zhí)行后端處理(步驟S206)。另外,信號(hào)處理設(shè)備1100的D0A (或源位置)估計(jì)模塊1108 (圖11中所示)也可 以通過使用公式[11.2]來計(jì)算D0A或源位置。以另一方式說明,D0A(或源位置)估計(jì)模 塊1108可以接收在信號(hào)投射返回模塊1106中產(chǎn)生的投射返回系數(shù),并執(zhí)行計(jì)算D0A或源 位置的處理。在這種情況下,信號(hào)投射返回模塊1106執(zhí)行僅計(jì)算投射返回系數(shù)的處理,而 忽略獲得投射返回結(jié)果(即,投射返回信號(hào))的處理。下面參照?qǐng)D19中所示的流程圖,描述在圖17中所示流程的步驟S104和在圖18 中所示流程的步驟S203中執(zhí)行的源分離處理的細(xì)節(jié)。源分離處理是將包括來自多個(gè)聲音源的信號(hào)的混合信號(hào)分離到每一聲音源的各 個(gè)信號(hào)的處理??梢酝ㄟ^使用各種算法來執(zhí)行源分離處理。下面將描述使用日本待審專利 申請(qǐng)公開No. 2006-238409中所公開的方法的處理示例。在下面描述的源分離處理中,通過批處理(即,在存儲(chǔ)觀測(cè)信號(hào)特定時(shí)間之后執(zhí) 行源分離的處理)來確定分離矩陣。如以上結(jié)合公式[2. 5]等所述的那樣,分離矩陣W( )、 觀測(cè)信號(hào)X( ,t)和分離結(jié)果Y( ,t)之間的關(guān)系由如下公式表示Y(w , t) = ff(o)X(w , t)參照?qǐng)D19中所示的流程圖描述源分離處理的序列。在第一步驟S301,在特定時(shí)間內(nèi)存儲(chǔ)觀測(cè)信號(hào)。這里,觀測(cè)信號(hào)是在對(duì)源分離麥克 風(fēng)所采集的信號(hào)執(zhí)行短時(shí)傅立葉變換處理之后而獲得的信號(hào)。此外,在特定時(shí)間內(nèi)存儲(chǔ)的 觀測(cè)信號(hào)等效于特定數(shù)量的連續(xù)幀(如,200個(gè)幀)所組成的譜圖。下面描述中提到的“對(duì) 于全部幀的處理”意味著對(duì)于步驟S301中存儲(chǔ)的觀測(cè)信號(hào)的所有幀的處理。在進(jìn)入步驟S304到S309的獲知循環(huán)之前,如果需要的話,對(duì)步驟S302中的累積觀測(cè)信號(hào)執(zhí)行包括歸一化、預(yù)白化(去相關(guān))等在內(nèi)的處理。例如,通過確定在各幀上觀測(cè) 信號(hào)Xk ( ,t)的標(biāo)準(zhǔn)偏差、獲得標(biāo)準(zhǔn)偏差的倒數(shù)所組成的對(duì)角矩陣S ( ),并按照如下那樣 計(jì)算Z( ,t)來執(zhí)行歸一化Z(w,t) = S(w)X(w,t)在預(yù)白化中,確定Z ( ,t)和S ( )以使得Z(w,t) = S(w)X(w,t)以及<Z(co, t)Z(co, t)H>t = 1(1 單位矩陣)在以上公式中,t是幀索引,而< >t表示所有幀或樣本幀的平均。假設(shè)可以以上述預(yù)處理中所計(jì)算出的Z(t)和Z( ,t)來代替下面描述和公式中 的 X(t)和 x( ,t)。在步驟S302中的預(yù)處理之后,在步驟S303將初始值代入分離矩陣W。初始值可以 是單位矩陣。如果存在先前獲知中所確定的值,則可以將該確定的值用作當(dāng)前獲知的初始值。步驟S304到S309表示重復(fù)這些步驟直到分離矩陣W收斂為止的獲知循環(huán)。步驟 S304中的收斂確定處理將要確定分離矩陣W是否已經(jīng)收斂。例如,可以將收斂確定處理實(shí) 踐為如下的方法獲得分離矩陣W的增量AW與零矩陣之間的相似度,并且如果相似度小于 預(yù)定值則確定分離矩陣W已經(jīng)“收斂”。作為替代,可以通過預(yù)先針對(duì)獲知循環(huán)設(shè)置最大重 復(fù)次數(shù)(例如,50),并且當(dāng)循環(huán)重復(fù)達(dá)到最大次數(shù)時(shí)確定分離矩陣W已經(jīng)“收斂”來實(shí)踐收 斂確定處理。如果分離矩陣W還未收斂(或者如果循環(huán)重復(fù)的次數(shù)未達(dá)到預(yù)定值),則進(jìn)一步重 復(fù)地執(zhí)行步驟S304到S309的獲知循環(huán)。因此,獲知循環(huán)是如下這樣的處理重復(fù)地執(zhí)行基 于上述公式[3. 1]到[3.3]的計(jì)算,直到分離矩陣W收斂為止。在步驟S305,通過使用上述公式[3. 12]獲得所有幀的分離結(jié)果Y (t)。步驟S306到S309對(duì)應(yīng)于關(guān)于頻率窗口《的循環(huán)。在步驟S307,基于公式[3.2]計(jì)算A W( ) ( S卩,分離矩陣的校正值),并且在步驟 S308,基于公式[3.3]更新分離矩陣W( )。對(duì)于所有頻率窗口執(zhí)行這兩個(gè)處理。另一方面,如果在步驟S304確定分離矩陣W已經(jīng)收斂,則流程前進(jìn)到步驟S310的 后端處理。在步驟S310的后端處理中,使分離矩陣W對(duì)應(yīng)于歸一化(或預(yù)白化)之前的觀 測(cè)信號(hào)。以另一方式說明,當(dāng)已經(jīng)在步驟S302執(zhí)行了歸一化或預(yù)白化時(shí),通過步驟S304到 S309獲得的分離矩陣W將要分離Z (t)(即,歸一化(或預(yù)白化)之后的觀測(cè)信號(hào)),而不分 離x(t)(g卩,歸一化(或預(yù)白化)之前的觀測(cè)信號(hào))。于是,執(zhí)行W — SW的校正,以便使分 離矩陣W對(duì)應(yīng)于預(yù)處理之前的觀測(cè)信號(hào)(X)。投射返回處理中使用的分離矩陣是在這種校 正之后所獲得的分離矩陣。在時(shí)頻域中用于ICA的許多算法使得獲知之后的改變尺度(即,將分離結(jié)果的尺 度調(diào)整到各個(gè)頻率窗口中合適的一些)成為必要。然而,在本發(fā)明實(shí)施例的配置中,由于在 通過使用分離結(jié)果所執(zhí)行的投射返回處理中執(zhí)行針對(duì)分離結(jié)果的改變尺度處理,因此源分 離處理期間的改變尺度不是必須的。除了在上面引用的日本待審專利申請(qǐng)公開No. 2006-238409中公開的批處理之 外,還可以進(jìn)一步通過利用基于日本待審專利申請(qǐng)公開No. 2008-147920中所公開的塊批處理的實(shí)時(shí)方法來執(zhí)行源分離處理。術(shù)語“塊批處理”意味著如下這樣的處理將觀測(cè)信號(hào) 以特定時(shí)間為單元?jiǎng)澐譃閴K,并基于批處理每塊執(zhí)行分離矩陣的獲知。通過一旦已經(jīng)在某 一塊中完成了分離矩陣的獲知、就在一時(shí)段期間連續(xù)地應(yīng)用該分離矩陣直到在下一塊中完 成分離矩陣的獲知的時(shí)刻為止,可以無干擾地產(chǎn)生分離結(jié)果Y(t)。下面將參照?qǐng)D20中所示的流程圖,描述圖17所示流程的步驟S105和圖18所示 流程的步驟S204中所執(zhí)行的投射返回處理的細(xì)節(jié)。如上所述,將ICA的分離結(jié)果投射返回麥克風(fēng)意味著如下這樣的處理分析每一 個(gè)均設(shè)置在特定位置處的麥克風(fēng)所采集的聲音信號(hào),并從采集的聲音信號(hào)中確定可歸于各 個(gè)源信號(hào)的分量。通過采用在源分離處理中計(jì)算出的分離結(jié)果來執(zhí)行投射返回處理。將描 述在圖20中所示流程圖的各步驟中執(zhí)行的相應(yīng)處理。在步驟S401,計(jì)算用以計(jì)算投射返回系數(shù)所組成的矩陣P( )(參見公式[7.5]) 的兩種協(xié)方差矩陣。如上所述,可以基于公式[7.6]計(jì)算投射返回系數(shù)矩陣P( )。也可以基于通過使 用公式[3. 1]的上述關(guān)系所修改的公式[7.7]計(jì)算投射返回系數(shù)矩陣P( )。如上所述,信號(hào)投射返回模塊具有圖15或圖16中所示的配置。圖15表示在計(jì)算 投射返回系數(shù)矩陣P( )(參見公式[7. 5])的處理中采用公式[7.6]的信號(hào)投射返回模塊 的配置,而圖16表示在計(jì)算投射返回系數(shù)矩陣P( )的處理中采用公式[7. 7]的信號(hào)投射 返回模塊的配置。于是,當(dāng)信號(hào)處理設(shè)備中的信號(hào)投射返回模塊具有圖15中所示的配置時(shí),通過采 用公式[7. 6]計(jì)算投射返回系數(shù)矩陣P( )(參見公式[7. 5]),并且在步驟S401計(jì)算如下 兩種類型的協(xié)方差矩陣<X' (co,t)Y( ,t)>t 以及<Y (co,t) Y (co,t) >tg卩,計(jì)算公式[7. 6]中所表示的協(xié)方差矩陣。另一方面,當(dāng)信號(hào)處理設(shè)備中的信號(hào)投射返回模塊具有圖16中所示的配置時(shí),通 過采用公式[7. 7]計(jì)算投射返回系數(shù)矩陣P( )(參見公式[7. 5]),并且在步驟S401計(jì)算 如下兩種類型的協(xié)方差矩陣<X' (co,t)X( ,t)>t 以及<X ( w,t) X ( w,t) >t即,計(jì)算公式[7. 7]中所表示的協(xié)方差矩陣。然后,通過使用公式[7.6]或公式[7. 7],在步驟S402獲得投射返回系數(shù)矩陣 P(w)。在下一步驟S403的聲道選擇處理中,從分離結(jié)果當(dāng)中選擇適于對(duì)象的聲道。例 如,僅選擇與特定聲音源對(duì)應(yīng)的一個(gè)聲道,或者去除不與任意聲音源對(duì)應(yīng)的聲道?!安慌c任 意聲音源對(duì)應(yīng)的聲道”意味著這樣的情形當(dāng)聲音源數(shù)小于用于源分離的麥克風(fēng)數(shù)時(shí),分離 結(jié)果A到Y(jié)n必定包括不與任意聲音源對(duì)應(yīng)的一個(gè)或多個(gè)輸出聲道。由于在那些輸出聲道 上執(zhí)行投射返回和D0A (或源位置)的處理是浪費(fèi)的,因此響應(yīng)于所述必然性去除那些輸出 聲道。例如,可以提供用于選擇的準(zhǔn)則作為投射返回之后的分離結(jié)果的乘方(方差)。假設(shè)將分離結(jié)果1( ,t)投射返回第k個(gè)麥克風(fēng)(用于投射返回)的結(jié)果是1[15]( ,0,則 可以通過使用如下公式[12. 1]來計(jì)算投射返回結(jié)果的乘方<|丫嚴(yán)(《,t) |2>t......[12. 1]ff[k](co)<X( , t)X( , t)H>tff[k]( )H......[12. 2]如果通過對(duì)于投射返回之后的分離結(jié)果使用公式[12. 1]計(jì)算出的乘方的值大于 預(yù)設(shè)的特定值,則確定“分離結(jié)果Yi ( ,t)是對(duì)應(yīng)于特定聲音源的分離結(jié)果”。如果所述值 小于預(yù)設(shè)的特定值,則確定“分離結(jié)果Yi ((0,t)不對(duì)應(yīng)于任何聲音源”。在實(shí)際計(jì)算中,不需要執(zhí)行計(jì)算Y/k] ( ,t) ( S卩,將^ ( ,t)投射返回第k個(gè)麥克 風(fēng)(用于投射返回)所產(chǎn)生的數(shù)據(jù))的處理。因此,可以省略這種計(jì)算處理。原因在于可 以基于公式[12. 2]來計(jì)算公式[7. 9]表示的矢量所對(duì)應(yīng)的協(xié)方差矩陣,并且可以通過取出 矩陣的對(duì)角元素來獲得與|Y嚴(yán)(《,t) |2(即,投射返回結(jié)果的絕對(duì)值的平方數(shù)據(jù))相同的 值。在聲道選擇結(jié)束之后,在步驟S404產(chǎn)生投射返回結(jié)果。當(dāng)將所有所選聲道的分 離結(jié)果投射返回一個(gè)麥克風(fēng)時(shí),使用公式[7.9]。相反,當(dāng)將一個(gè)聲道的分離結(jié)果投射返回 所有麥克風(fēng)時(shí),使用公式[7.8]。注意,如果在接下來的處理中執(zhí)行D0A估計(jì)(或源位置估 計(jì)),則可以省略在步驟S404中產(chǎn)生投射返回結(jié)果的處理。[8.根據(jù)本發(fā)明其他實(shí)施例的信號(hào)處理設(shè)備](8. 1在信號(hào)投射返回模塊中,在計(jì)算投射返回系數(shù)矩陣P( )的處理中省略逆矩 陣的計(jì)算的實(shí)施例)首先關(guān)于在信號(hào)投射返回模塊中,在計(jì)算投射返回系數(shù)矩陣P ( )的處理中省略 逆矩陣的計(jì)算的實(shí)施例進(jìn)行下面的描述。如上所述,根據(jù)圖20的流程圖執(zhí)行圖15或圖16中所示的信號(hào)投射返回模塊中 的處理。在圖20中所示流程圖的步驟S401中,計(jì)算用以計(jì)算投射返回系數(shù)所組成的矩陣 P( )(參見公式[7.5])的兩種協(xié)方差矩陣。更具體而言,當(dāng)信號(hào)投射返回模塊具有圖15中所示的配置時(shí),通過采用公式 [7. 6]計(jì)算投射返回系數(shù)矩陣P( )(參見公式[7. 5]),并且計(jì)算如下兩種類型的協(xié)方差矩 陣<X' (co,t)Y( ,t)>t 以及<Y (co,t) Y (co,t) >t另一方面,當(dāng)信號(hào)投射返回模塊具有圖16中所示的配置時(shí),通過采用公式[7.7] 計(jì)算投射返回系數(shù)矩陣P( )(參見公式[7. 5]),并且計(jì)算如下兩種類型的協(xié)方差矩陣<X' (co,t)X( ,t)>t 以及<X (w,t) X (w,t) >tS卩,分別計(jì)算公式[7. 6]或[7. 7]中所表示的協(xié)方差矩陣。用于計(jì)算投射返回系數(shù)矩陣P( )的公式[7. 6]和[7. 7]中的每一個(gè)均包括逆矩 陣(嚴(yán)格來講,滿矩陣的逆矩陣)。然而,計(jì)算逆矩陣這一處理使得需要相當(dāng)大的計(jì)算成本 (或通過硬件獲得逆矩陣時(shí)需要相當(dāng)大的電路規(guī)模)。為此,如果可以在不使用逆矩陣的情 況下執(zhí)行等效處理,則是更期望的。下面將描述在不使用逆矩陣的情況下執(zhí)行等效處理的方法作為變型。
33
如在上文中簡(jiǎn)要討論的那樣,可以使用如下公式[8. 1]代替公式[7. 6] ......[8.2]P(o) = <X' (o, t)Y(o, t)H>t ......[8.3]
......[8.4]當(dāng)分離結(jié)果矢量Y( ,t)的各個(gè)元素彼此獨(dú)立時(shí),即當(dāng)完全地執(zhí)行了分離時(shí),協(xié) 方差矩陣<Y( ,t)Y( ,t)H>' ^變成了接近對(duì)角矩陣的矩陣。于是,即使通過僅提取后者 的對(duì)角元素,也可以獲得與以上協(xié)方差矩陣基本上相同的矩陣。由于僅通過將對(duì)角元素以 其倒數(shù)代替就可以獲得對(duì)角矩陣的逆矩陣,因此計(jì)算對(duì)角矩陣的逆矩陣所需的計(jì)算成本小 于計(jì)算滿矩陣的逆矩陣所需的計(jì)算成本。類似地,可以使用前述公式[8. 2]代替公式[7. 7]。注意,公式[8. 2]中的diag( ) 表示使得括號(hào)內(nèi)所表示的除了矩陣的對(duì)角元素之外的所有其他元素為零的運(yùn)算。因此,在 公式[8. 2]中,對(duì)角矩陣的逆矩陣也可以僅通過將對(duì)角元素以其倒數(shù)代替來獲得。進(jìn)一步,當(dāng)投射返回之后的分離結(jié)果或投射返回系數(shù)僅用于D0A估計(jì)(或源位 置估計(jì))時(shí),也可以使用前述公式[8. 3](代替公式[7.6])或前述公式[8. 4](代替公式 [7. 7]),其每一個(gè)甚至不包括對(duì)角矩陣。原因在于公式[8.1]或[8. 2]中所表示的對(duì)角矩 陣的元素全部是實(shí)數(shù),并且只要乘以任意實(shí)數(shù),通過使用公式[11. 1]或[11. 2]所計(jì)算出的 D0A就不受影響。因此,通過利用公式[8. 1]到[8.4]代替上述公式[7.6]和[7. 7],可以省略計(jì)算 滿對(duì)角矩陣的逆矩陣這一處理(這需要更高的計(jì)算成本),并且可以更高效地計(jì)算投射返 回系數(shù)矩陣P( )。(8. 2執(zhí)行將源分離處理所獲得的分離結(jié)果投射返回特定排列的麥克風(fēng)這一處理 的實(shí)施例(第四實(shí)施例))下面將描述執(zhí)行將源分離處理所獲得的分離結(jié)果投射返回特定排列的麥克風(fēng)的 處理的實(shí)施例。在前文中,已經(jīng)描述了以下列出的三個(gè)實(shí)施例作為采用通過源分離處理而獲得的 分離結(jié)果的投射返回處理的應(yīng)用[3.對(duì)于與適于ICA的麥克風(fēng)不同的麥克風(fēng)的投射返回處理的處理示例(第一實(shí) 施例)][4.通過使用多個(gè)全向麥克風(fēng)組成虛擬定向麥克風(fēng)的實(shí)施例(第二實(shí)施例)][5.以組合方式執(zhí)行源分離處理的分離結(jié)果的投射返回處理和D0A估計(jì)或源位置 估計(jì)的處理示例(第三實(shí)施例)]以另一方式說明,第一和第二實(shí)施例表示將定向麥克風(fēng)獲得的源分離結(jié)果投射返 回全向麥克風(fēng)的處理示例。第三實(shí)施例表示如下這樣的處理示例由排列為適于源分離的麥克風(fēng)采集聲音, 并且將采集的聲音的分離結(jié)果投射返回排列為適于D0A(或源位置)估計(jì)的麥克風(fēng)。下面將描述如下這樣實(shí)施例作為不同于前述三個(gè)實(shí)施例的第四實(shí)施例執(zhí)行將源分離處理獲得的分離結(jié)果投射返回特定排列的麥克風(fēng)這一處理??梢酝ㄟ^采用參照?qǐng)D7在第一實(shí)施例中的上述信號(hào)處理設(shè)備700來組成根據(jù)第四 實(shí)施例的信號(hào)處理設(shè)備。根據(jù)第四實(shí)施例的信號(hào)處理設(shè)備包括用以提供用于源分離處理的 輸入的多個(gè)麥克風(fēng)701以及用作投射返回目標(biāo)的一個(gè)或多個(gè)全向麥克風(fēng)702作為麥克風(fēng)。作為第一實(shí)施例中的定向麥克風(fēng),已經(jīng)在上文中描述了用以提供用于源分離處理 的輸入的麥克風(fēng)701。然而,在第四實(shí)施例中,用以提供用于源分離處理的輸入的麥克風(fēng) 701可以是定向麥克風(fēng)或全向麥克風(fēng)。后面將描述麥克風(fēng)的實(shí)際排列。輸出裝置709的排 列也具有重要意義,并且也將在后面進(jìn)行描述。下面將參照?qǐng)D21和圖22,描述第四實(shí)施例中麥克風(fēng)和輸出裝置的兩個(gè)排列示例。圖21圖示了第四實(shí)施例中麥克風(fēng)和輸出裝置的第一排列示例。圖21中所示的麥 克風(fēng)和輸出裝置的第一排列示例表示麥克風(fēng)和輸出裝置的排列,其適于通過源分離處理和 投射返回處理來產(chǎn)生對(duì)應(yīng)于用戶兩個(gè)耳朵的位置的雙聲道立體聲信號(hào)。耳機(jī)2101對(duì)應(yīng)于圖7中所示信號(hào)處理設(shè)備中的輸出裝置709。用作投射返回目標(biāo) 的麥克風(fēng)2108和2109安裝于說話者的相應(yīng)位置(外殼)2110和2111,其對(duì)應(yīng)于耳機(jī)2101 的兩個(gè)耳朵部分。圖21中所示的用于源分離的麥克風(fēng)2104對(duì)應(yīng)于圖7中所示的用于源分 離的麥克風(fēng)701。源分離麥克風(fēng)2104可以是全向麥克風(fēng)或定向麥克風(fēng),并且將其以適于分 離相關(guān)環(huán)境中的各聲音源的排列進(jìn)行安裝。在圖21所示的配置中,由于存在三個(gè)聲音源 (即,聲音源1 (由2105表示)到聲音源3 (由2107表示)),因此對(duì)于源分離來說至少需要 三個(gè)麥克風(fēng)。包括源分離麥克風(fēng)2104(=圖7中的源分離麥克風(fēng)701)以及投射返回目標(biāo)麥克 風(fēng)2108和2109(=圖7中的投射返回目標(biāo)麥克風(fēng)702)的信號(hào)處理設(shè)備的處理序列與參照 圖17的流程圖而在上面所述的處理序列類似。更具體而言,在圖17的流程圖的步驟S101中,對(duì)源分離麥克風(fēng)2104所采集的聲 音信號(hào)執(zhí)行AD轉(zhuǎn)換。然后,在步驟S102,對(duì)AD轉(zhuǎn)換之后的每一個(gè)信號(hào)執(zhí)行短時(shí)傅立葉變 換,以轉(zhuǎn)換到時(shí)頻域中的信號(hào)。下一步驟S103中的指向性形成處理是在通過使用多個(gè)全向 麥克風(fēng)形成虛擬指向性的情況(如上面參照?qǐng)D10所述的那樣)下所需要的處理。例如,在 如圖10中所示那樣排列多個(gè)全向麥克風(fēng)的情況下,根據(jù)上述公式[9. 1]到[9. 4]產(chǎn)生虛擬 定向麥克風(fēng)的觀測(cè)信號(hào)。然而,當(dāng)如圖8中所示情況下那樣原始地采用定向麥克風(fēng)時(shí),可以 免除步驟S103的指向性形成處理。在步驟S104的源分離處理中,對(duì)源分離麥克風(fēng)2104所獲得的時(shí)頻域中的觀測(cè)信 號(hào)執(zhí)行ICA,以獲得彼此獨(dú)立的分離結(jié)果。實(shí)際上,通過根據(jù)圖19的流程圖的處理獲得源分
罔結(jié)果。在步驟S105,將步驟S104中所獲得的分離結(jié)果投射返回預(yù)定麥克風(fēng)。在該示例 中,將分離結(jié)果投射返回圖21中所示的投射返回目標(biāo)麥克風(fēng)2108和2109。根據(jù)圖20的流 程圖執(zhí)行投射返回處理的實(shí)際序列。當(dāng)執(zhí)行投射返回處理時(shí),從分離結(jié)果當(dāng)中選擇與特定聲音源對(duì)應(yīng)的一個(gè)聲道(該 處理對(duì)應(yīng)于圖20的流程中的步驟S403),并且產(chǎn)生通過將所選分離結(jié)果投射返回到投射返 回目標(biāo)麥克風(fēng)2108和2109而獲得的信號(hào)(該處理對(duì)應(yīng)于圖20的流程中的步驟S404)。進(jìn)一步,在圖17的流程中的步驟S106,通過逆傅立葉變換,將投射返回之后的信號(hào)重新轉(zhuǎn)換為波形。在圖17的流程中的步驟S 107,從內(nèi)置于耳機(jī)中的擴(kuò)音器重放波形。 以這種方式,分別從耳機(jī)2101的擴(kuò)音器2110和2111重放被投射返回兩個(gè)投射返回目標(biāo)麥 克風(fēng)2108和2109的分離結(jié)果。由信號(hào)處理設(shè)備的控制模塊控制來自擴(kuò)音器2110和2111的聲音輸出。換言之, 信號(hào)處理設(shè)備的控制模塊在輸出與投射返回目標(biāo)麥克風(fēng)(其設(shè)置在輸出裝置的位置處)的 投射返回信號(hào)對(duì)應(yīng)的聲音數(shù)據(jù)時(shí)控制各個(gè)輸出裝置(擴(kuò)音器)。例如,通過選擇投射返回之前的分離結(jié)果之一(其對(duì)應(yīng)于聲音源1(2105)),將所 選分離結(jié)果投射返回到投射返回目標(biāo)麥克風(fēng)2108和2109,并通過耳機(jī)2101重放投射返 回結(jié)果,佩戴耳機(jī)2101的用戶可以仿佛僅聲音源1(2105)在右側(cè)有效一樣聽到聲音,盡管 三個(gè)聲音源同時(shí)有效。以另一方式說明,通過將分離結(jié)果投射返回到投射返回目標(biāo)麥克風(fēng) 2108和2109,盡管聲音源1(2105)位于源分離麥克風(fēng)2104的左側(cè),但是可以產(chǎn)生表示聲音 源1(2105)如同位于耳機(jī)2101的右側(cè)的雙聲道立體聲信號(hào)。另外,對(duì)于投射返回處理,投 射返回目標(biāo)麥克風(fēng)2108和2109的觀測(cè)信號(hào)正是必需的,而耳機(jī)2101 (或投射返回目標(biāo)麥 克風(fēng)2108和2109)的位置信息不是必需的。類似地,通過在圖20中所示的流程圖的步驟S403選擇與聲音源2(2106)或聲音 源3(2107)對(duì)應(yīng)的一個(gè)聲道,用戶可以仿佛僅那些聲音源之一在其位置有效一樣聽到聲 音。進(jìn)一步,當(dāng)佩戴耳機(jī)2101的用戶從一個(gè)地點(diǎn)移動(dòng)到另一地點(diǎn)時(shí),分離結(jié)果提供的位置 也對(duì)應(yīng)地改變。盡管也可以通過將適于源分離的麥克風(fēng)和用作投射返回目標(biāo)的麥克風(fēng)設(shè)置為相 同的現(xiàn)有技術(shù)配置來執(zhí)行此處理,但是現(xiàn)有技術(shù)配置的處理存在問題。當(dāng)將適于源分離的 麥克風(fēng)和用作投射返回目標(biāo)的麥克風(fēng)設(shè)置為相同時(shí),按照如下執(zhí)行處理。將圖21中所示的 投射返回目標(biāo)麥克風(fēng)2108和2109本身設(shè)置為用于源分離處理的源分離麥克風(fēng)。進(jìn)一步, 通過使用由源分離麥克風(fēng)采集聲音的結(jié)果執(zhí)行源分離處理,并且將分離結(jié)果投射返回到投 射返回目標(biāo)麥克風(fēng)2108和2109。然而,當(dāng)執(zhí)行上述處理時(shí),出現(xiàn)如下兩個(gè)問題。(1)在圖21中所示的環(huán)境中,由于存在三個(gè)聲音源(即,聲音源1 (2105)到聲音源 3 (2107)),因此當(dāng)僅使用兩個(gè)麥克風(fēng)時(shí),聲音源并未完全地彼此分離。(2)由于圖21中所示的投射返回目標(biāo)麥克風(fēng)2108和2109分別靠近耳機(jī)2101的 揚(yáng)聲器2110和2111放置,因此存在麥克風(fēng)2108和2109可能采集從揚(yáng)聲器2110和2111 所產(chǎn)生的聲音的可能性。在這種情況下,聲音源在數(shù)量上增加,并且獨(dú)立性的假設(shè)不成立, 由此導(dǎo)致分離精度的惡化。也可以可替代地在如下這種配置中實(shí)踐現(xiàn)有技術(shù)方法將圖21中所示的投射返 回目標(biāo)麥克風(fēng)2108和2109設(shè)置為用于源分離的麥克風(fēng),并且將圖21中所示的源分離麥克 風(fēng)2104進(jìn)一步用作用于源分離的麥克風(fēng)。由于以比聲音源的數(shù)量(三個(gè))更大的數(shù)量設(shè) 置源分離麥克風(fēng),因此此配置可以增大源分離處理的精度。在一個(gè)示例中,使用總共全部六 個(gè)麥克風(fēng)。在另一示例中,使用總共四個(gè)麥克風(fēng)(即,兩個(gè)麥克風(fēng)2108和2109以及源分離 麥克風(fēng)2104中的兩個(gè))。然而,利用可替代的現(xiàn)有技術(shù)方法,未克服上述問題(2)。換言之,還存在圖21中 所示的投射返回目標(biāo)麥克風(fēng)2108和2109可能采集從耳機(jī)2101的揚(yáng)聲器2110和2111所
36產(chǎn)生的聲音的可能性,并且分離精度惡化。進(jìn)一步,當(dāng)佩戴耳機(jī)2101的用戶移動(dòng)時(shí),在某些情況下,安裝到耳機(jī)的麥克風(fēng) 2108和2109可能與麥克風(fēng)2104遠(yuǎn)離地放置。隨著用于源分離的各麥克風(fēng)之間的間距增 大,同樣往往會(huì)在低頻處出現(xiàn)空間混疊,這也導(dǎo)致分離精度的惡化。另外,使用用于源分離 的六個(gè)麥克風(fēng)的配置比使用四個(gè)麥克風(fēng)的配置需要更高的計(jì)算成本。即,前者的計(jì)算成本 為后者的計(jì)算成本的(4/6)2 = 2. 25倍。因此,計(jì)算成本增大,并且處理效率降低。相比之下,本發(fā)明實(shí)施例通過如下處理 將投射返回目標(biāo)麥克風(fēng)和源分離麥克風(fēng)設(shè)置為分離的麥克風(fēng),并將基于源分離麥克風(fēng)獲得 的信號(hào)而產(chǎn)生的分離結(jié)果投射返回到投射返回目標(biāo)麥克風(fēng),可以解決所有上述問題。下面將參照?qǐng)D22A和圖22B,描述第四實(shí)施例中麥克風(fēng)和輸出裝置的第二排列示 例。圖22A和圖22B中所示的配置表示用于通過投射返回產(chǎn)生可提供環(huán)繞聲效果的分離結(jié) 果的排列示例,并且其特征在于投射返回目標(biāo)麥克風(fēng)和回放裝置的位置。圖22B表示安裝擴(kuò)音器2210到2214的環(huán)境(再現(xiàn)環(huán)境),而圖22A表示安裝三個(gè) 聲音源(即,聲音源1 (2202)到聲音源3 (2204))以及麥克風(fēng)2201和2205到2209的環(huán)境 (聲音采集環(huán)境)。這兩個(gè)環(huán)境彼此不同,以使得從圖22B所示回放環(huán)境中的揚(yáng)聲器2210 到2214輸出的聲音不進(jìn)入圖22A所示聲音采集環(huán)境中的麥克風(fēng)2201和2205到2209。首先描述圖22B中所示的回放環(huán)境?;胤艙P(yáng)聲器2210到2214是適于環(huán)繞聲效果 的擴(kuò)音器,其每一個(gè)均排列在預(yù)定位置。更具體而言,圖22B所示回放環(huán)境表示如下這樣的 環(huán)境除了亞低音揚(yáng)聲器(sub-woofer)之外,安裝適于5. 1聲道環(huán)繞聲效果的揚(yáng)聲器。接著描述圖22A中圖示的聲音采集環(huán)境。分別與圖22B中所示的回放環(huán)境中的回 放揚(yáng)聲器2210到2214對(duì)應(yīng)地安裝投射返回目標(biāo)麥克風(fēng)2205到2209。源分離麥克風(fēng)2201 與圖21中所示的源分離麥克風(fēng)2104類似,它們可以是定向麥克風(fēng)或全向麥克風(fēng)。最好將 麥克風(fēng)的數(shù)量設(shè)置為大于聲音源的數(shù)量,以便獲得足夠的分離性能。圖22的配置中所執(zhí)行的處理與圖21的配置中所執(zhí)行的處理類似,并且根據(jù)圖17 的流程而執(zhí)行。根據(jù)圖19的流程執(zhí)行源分離處理,并且根據(jù)圖20的流程執(zhí)行投射返回處 理。在圖20的流程中的步驟S403中的聲道選擇處理中,選擇與特定聲音源對(duì)應(yīng)的分離結(jié) 果之一。在步驟S404,將所選分離結(jié)果投射返回圖22A中所示的投射返回目標(biāo)麥克風(fēng)2205 到 2209。通過在圖22B中所示的再現(xiàn)環(huán)境中從再現(xiàn)揚(yáng)聲器2210到2214再現(xiàn)相應(yīng)的投射返 回信號(hào),聽眾2215可以仿佛周圍只有一個(gè)源是有效的那樣體驗(yàn)聲音。(8. 3采用多個(gè)源分離系統(tǒng)的實(shí)施例(第五實(shí)施例))雖然上述任何一個(gè)實(shí)施例均包括一個(gè)源分離系統(tǒng),但是在另一實(shí)施例中,多個(gè)源 分離系統(tǒng)可以共享共同的投射返回目標(biāo)麥克風(fēng)。下列描述是關(guān)于作為這種共享方式的應(yīng)用 的、包括具有不同麥克風(fēng)排列的多個(gè)源分離系統(tǒng)的實(shí)施例而進(jìn)行的。圖23圖示了包括多個(gè)源分離系統(tǒng)的信號(hào)處理設(shè)備的配置。圖23中圖示的信號(hào)處 理設(shè)備包括兩個(gè)源分離系統(tǒng)(即,源分離系統(tǒng)1 (由2305表示)(用于高頻)和源分離系統(tǒng) 2(由2306表示)(用于低頻))。兩個(gè)源分離系統(tǒng)(S卩,源分離系統(tǒng)1 (2305)(用于高頻)和源分離系統(tǒng)2 (2306)(用 于低頻))包括以不同排列而安裝的麥克風(fēng)。
更具體而言,存在用于源分離的兩組麥克風(fēng)。屬于一組且以其之間較窄的間隔排 列的源分離麥克風(fēng)(處于較窄間隔)2301連接到源分離系統(tǒng)1 (2305)(用于高頻),而屬于 另一組且以其之間較寬的間隔排列的源分離麥克風(fēng)(處于較寬間隔)2302連接到源分離系 統(tǒng)2 (2306)(用于低頻)??梢酝ㄟ^將一些源分離麥克風(fēng)設(shè)置為如圖23中所示的投射返回目標(biāo)麥克 風(fēng)(a) 2303來提供投射返回目標(biāo)麥克風(fēng),或者可以通過使用其它投射返回目標(biāo)麥克風(fēng) (b)2304來提供投射返回目標(biāo)麥克風(fēng)。下面將參照?qǐng)D24描述將通過圖23中所示的兩個(gè)源分離系統(tǒng)2305和2306所獲得 的相應(yīng)組的分離結(jié)果組合在一起的方法。將高頻源分離系統(tǒng)1(2401)(對(duì)應(yīng)于圖23中所示 的源分離系統(tǒng)1 (2305)(用于高頻))產(chǎn)生的、投射返回之前的分離結(jié)果譜圖2402劃分為低 頻和高頻兩個(gè)波段,并且僅選擇性地提取高頻數(shù)據(jù)2403 (即,高頻部分譜圖)。另一方面,也將低頻源分離系統(tǒng)2(2405)(對(duì)應(yīng)于圖23中所示的源分離系統(tǒng) 2(2306)(用于低頻))產(chǎn)生的分離結(jié)果譜圖2406劃分為低頻和高頻兩個(gè)波段,并且僅選擇 性地提取低頻數(shù)據(jù)2407 (即,低頻部分譜圖)。根據(jù)本發(fā)明實(shí)施例中的上述方法,對(duì)每一個(gè)提取出的部分譜圖執(zhí)行投射返回。通 過將投射返回之后的兩個(gè)譜圖2404和2408組合在一起,可以獲得全波段譜圖2409。以上參照?qǐng)D23和圖24所述的信號(hào)處理設(shè)備包括多個(gè)源分離系統(tǒng),其中它們的源 分離模塊接收由至少部分彼此不同的相應(yīng)組的源分離麥克風(fēng)所取得的信號(hào),由此產(chǎn)生相應(yīng) 組的分離信號(hào)。它們的信號(hào)投射返回模塊接收由多個(gè)源分離系統(tǒng)所產(chǎn)生的相應(yīng)組的分離信 號(hào)以及投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào),以產(chǎn)生分別與各源分離系統(tǒng)對(duì)應(yīng)的多組投射返回 信號(hào)(圖24中所示的投射返回結(jié)果2404和2408),并進(jìn)一步將多組產(chǎn)生的投射返回信號(hào)組 合在一起,以產(chǎn)生與投射返回目標(biāo)麥克風(fēng)對(duì)應(yīng)的最終的投射返回信號(hào)(圖24中所示的投射 返回結(jié)果2409)。下面將描述在上述處理中需要投射返回的理由。存在如下這樣的現(xiàn)有技術(shù)配置其包括具有不同麥克風(fēng)排列的多個(gè)源分離系統(tǒng)。 例如,日本待審專利申請(qǐng)公開No. 2003-263189公開了如下這樣的技術(shù)通過利用多個(gè)麥克 風(fēng)(其以具有在各麥克風(fēng)之間設(shè)置的較寬間隔的陣列而排列)所采集的聲音信號(hào)而在低頻 執(zhí)行源分離處理,通過利用多個(gè)麥克風(fēng)(其以具有在各麥克風(fēng)之間設(shè)置的較窄間隔的陣列 而排列)所采集的聲音信號(hào)而在高頻執(zhí)行源分離處理,并最終將高頻和低頻二者處的相應(yīng) 分離結(jié)果組合在一起。此外,日本專利申請(qǐng)No. 2008-92363(其已經(jīng)由與本申請(qǐng)相同的申請(qǐng) 人在先前提交)公開了如下這樣的技術(shù)當(dāng)同時(shí)操作多個(gè)源分離系統(tǒng)時(shí),使得各輸出聲道 彼此對(duì)應(yīng)(如,輸出可歸于同一聲音源的信號(hào)作為多個(gè)源分離系統(tǒng)的相應(yīng)輸出Y1)。然而,在這些現(xiàn)有技術(shù)中,執(zhí)行對(duì)于用于源分離的麥克風(fēng)的投射返回作為將分離 結(jié)果改變尺度的方法。因此,在以較寬間隔排列的麥克風(fēng)所獲得的低頻的分離結(jié)果與以較 窄間隔排列的麥克風(fēng)所獲得的高頻的分離結(jié)果之間存在相位間距。該相位間距在產(chǎn)生具有 聲音定位感覺的分離結(jié)果時(shí)引起了嚴(yán)重問題。進(jìn)一步,即使各麥克風(fēng)是同一模型,麥克風(fēng)就 其增益也具有各個(gè)差異。因此,存在這樣的可能性如果輸入增益在以較寬間隔排列的麥克 風(fēng)與以較窄間隔排列的麥克風(fēng)之間不同,則最終組合的信號(hào)聽起來是不自然的聲音。相比之下,根據(jù)圖23和圖24中所示的本發(fā)明的實(shí)施例,多個(gè)源分離系統(tǒng)工作以
38便將相應(yīng)組的分離結(jié)果投射返回公共的投射返回目標(biāo)麥克風(fēng),然后將投射返回結(jié)果組合在 一起。在圖23所示的配置中,例如,投射返回目標(biāo)麥克風(fēng)(a) 2303或投射返回目標(biāo)麥克風(fēng) (b) 2304是對(duì)于多個(gè)源分離系統(tǒng)2304和2305公共的投射返回目標(biāo)。結(jié)果,可以解決相位間 距的問題和麥克風(fēng)增益的各個(gè)差異的問題兩者,并且可以產(chǎn)生具有聲音定位的感覺的分離結(jié)果。[9.根據(jù)本發(fā)明實(shí)施例的信號(hào)處理設(shè)備的特征和優(yōu)點(diǎn)的總結(jié)]在根據(jù)本發(fā)明實(shí)施例的信號(hào)處理設(shè)備中,如上所述,源分離麥克風(fēng)和投射返回目 標(biāo)麥克風(fēng)彼此獨(dú)立地設(shè)置。換言之,投射返回目標(biāo)麥克風(fēng)可以設(shè)置為與源分離麥克風(fēng)不同 的麥克風(fēng)。基于源分離麥克風(fēng)所采集到的數(shù)據(jù)執(zhí)行源分離處理以獲得分離結(jié)果,并且將獲得 的分離結(jié)果投射返回到投射返回目標(biāo)麥克風(fēng)。通過使用投射返回目標(biāo)麥克風(fēng)所獲得的觀測(cè) 信號(hào)與分離結(jié)果之間的互協(xié)方差矩陣以及各分離結(jié)果本身之間的協(xié)方差矩陣,執(zhí)行投射返 回處理。根據(jù)本發(fā)明實(shí)施例的信號(hào)處理設(shè)備例如具有如下優(yōu)點(diǎn)。1.通過對(duì)定向麥克風(fēng)(或每一個(gè)均由多個(gè)全向麥克風(fēng)形成的虛擬定向麥克風(fēng))所 觀測(cè)到的信號(hào)執(zhí)行源分離,并將分離結(jié)果投射返回全向麥克風(fēng),可以解決定向麥克風(fēng)的頻 率依賴性問題。2.通過對(duì)排列為適于源分離的麥克風(fēng)所觀測(cè)到的信號(hào)執(zhí)行源分離,并將分離結(jié)果 投射返回排列為適于D0A估計(jì)(或源位置估計(jì))的麥克風(fēng),可以克服在源分離和D0A(或源 位置)估計(jì)之間麥克風(fēng)排列中引起的矛盾難題。3.通過與回放揚(yáng)聲器類似地排列投射返回目標(biāo)麥克風(fēng)并將分離結(jié)果投射返回這 些麥克風(fēng),可以獲得能夠提供聲音定位的分離結(jié)果,并且可以克服當(dāng)投射返回目標(biāo)麥克風(fēng) 用作源分離的麥克風(fēng)時(shí)引起的問題。4.通過準(zhǔn)備多個(gè)源分離系統(tǒng)所共享的公共投射返回目標(biāo)麥克風(fēng),并且將分離結(jié) 果投射返回這些公共麥克風(fēng),可以克服當(dāng)將分離結(jié)果投射返回用于源分離的麥克風(fēng)時(shí)引起 的、歸因于相位差異間距和麥克風(fēng)增益的各個(gè)差異的問題。已經(jīng)結(jié)合特定實(shí)施例在上文中詳細(xì)描述了本發(fā)明。然而,顯而易見,在不脫離本發(fā) 明的范圍的情況下,本領(lǐng)域的技術(shù)人員可以將各實(shí)施例修改為其他適當(dāng)?shù)男问?,或?qū)⑵湟?其他適當(dāng)?shù)男问教鎿Q。換言之,已經(jīng)通過說明性示例公開了本發(fā)明的上述實(shí)施例,并且不應(yīng) 以限制性方式考慮本發(fā)明的上述實(shí)施例。本發(fā)明的要點(diǎn)是通過參考權(quán)利要求來確定的。本說明書中的上述各種系列的處理可以通過硬件、軟件或硬件和軟件的組合配置 來執(zhí)行。當(dāng)使用軟件來執(zhí)行處理時(shí),可以通過在內(nèi)置于專用硬件中的計(jì)算機(jī)內(nèi)的存儲(chǔ)器中 安裝程序(其記錄相關(guān)的處理序列),或者通過在能夠執(zhí)行各種處理的通用計(jì)算機(jī)中安裝 程序,來執(zhí)行處理。例如,可以預(yù)先在記錄介質(zhì)上記錄程序。除了將程序從記錄介質(zhì)安裝到 計(jì)算機(jī)中之外,還可以經(jīng)由網(wǎng)絡(luò)(如,LAN(局域網(wǎng))或因特網(wǎng))接收程序,并且可以將接收 到的程序安裝在記錄介質(zhì)(如內(nèi)置硬盤)中。注意,本說明書中所述的各種類型的處理不僅可以根據(jù)所述序列以時(shí)間順序方式 執(zhí)行,還可以依據(jù)用以執(zhí)行處理的設(shè)備的處理性能或響應(yīng)于必要性而并行或以分離的方式 執(zhí)行。此外,本說明書中所使用的術(shù)語“系統(tǒng)”意味著多個(gè)設(shè)備的邏輯組件,而不限于在同一外殼中安裝具有相應(yīng)功能的設(shè)備這樣的配置。本申請(qǐng)包含與2009年3月30日向日本專利局提交的日本優(yōu)先權(quán)專利申請(qǐng)JP 2009-081379中公開的主題有關(guān)的主題,其全部?jī)?nèi)容通過引用的方式合并在此。本領(lǐng)域技術(shù)人員應(yīng)理解,根據(jù)設(shè)計(jì)要求和其他因素可以出現(xiàn)各種變型、組合、部分 組合和變更,只要其在所附權(quán)利要求及其等價(jià)物的范圍內(nèi)即可。
權(quán)利要求
一種信號(hào)處理設(shè)備,包括源分離模塊,用于通過將獨(dú)立分量分析ICA應(yīng)用于基于來自多個(gè)聲音源的混合信號(hào)而產(chǎn)生的觀測(cè)信號(hào),產(chǎn)生與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào),由此執(zhí)行所述混合信號(hào)的分離處理,所述觀測(cè)信號(hào)由用于源分離的麥克風(fēng)取得;以及信號(hào)投射返回模塊,用于接收投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)和所述源分離模塊所產(chǎn)生的分離信號(hào),并且用于產(chǎn)生投射返回信號(hào)作為與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào),所述投射返回信號(hào)由投射返回目標(biāo)麥克風(fēng)取得,其中,所述信號(hào)投射返回模塊通過接收與源分離麥克風(fēng)不同的投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)來產(chǎn)生所述投射返回信號(hào)。
2.根據(jù)權(quán)利要求1所述的信號(hào)處理設(shè)備,其中,所述源分離模塊對(duì)觀測(cè)信號(hào)執(zhí)行ICA, 由此產(chǎn)生與各聲音源對(duì)應(yīng)的時(shí)頻域中的相應(yīng)分離信號(hào),所述觀測(cè)信號(hào)是通過將用于源分離 的麥克風(fēng)獲得的信號(hào)轉(zhuǎn)換到時(shí)頻域而取得的,以及其中,所述信號(hào)投射返回模塊通過計(jì)算使與每一個(gè)聲音源對(duì)應(yīng)的相應(yīng)投射返回信號(hào)的 總和與投射返回目標(biāo)麥克風(fēng)的各個(gè)觀測(cè)信號(hào)之間的誤差最小的投射返回系數(shù),并通過將分 離信號(hào)乘以計(jì)算出的投射返回系數(shù)來計(jì)算投射返回信號(hào),其中,與每一個(gè)聲音源對(duì)應(yīng)的相 應(yīng)投射返回信號(hào)的總和是通過將時(shí)頻域中的分離信號(hào)乘以投射返回系數(shù)而計(jì)算的。
3.根據(jù)權(quán)利要求2所述的信號(hào)處理設(shè)備,其中,所述信號(hào)投射返回模塊在計(jì)算最小化 誤差的投射返回系數(shù)的處理中采用最小二乘逼近。
4.根據(jù)權(quán)利要求1所述的信號(hào)處理設(shè)備,其中,所述源分離模塊接收由所述源分離麥 克風(fēng)取得的信號(hào),并執(zhí)行產(chǎn)生對(duì)應(yīng)于各聲音源的相應(yīng)分離信號(hào)的處理,所述源分離麥克風(fēng) 由多個(gè)定向麥克風(fēng)組成,以及其中,所述信號(hào)投射返回模塊接收作為全向麥克風(fēng)的投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào) 和所述源分離模塊所產(chǎn)生的分離信號(hào),并產(chǎn)生對(duì)于作為全向麥克風(fēng)的投射返回目標(biāo)麥克風(fēng) 的投射返回信號(hào)。
5.根據(jù)權(quán)利要求1所述的信號(hào)處理設(shè)備,進(jìn)一步包括指向性形成模塊,用于接收所述 源分離麥克風(fēng)所取得的信號(hào),并且用于根據(jù)成對(duì)麥克風(fēng)之間的距離而通過延遲成對(duì)麥克風(fēng) 之一的相位來產(chǎn)生虛擬定向麥克風(fēng)的輸出信號(hào),其中所述源分離麥克風(fēng)由多個(gè)全向麥克風(fēng) 組成,所述成對(duì)麥克風(fēng)通過所述多個(gè)全向麥克風(fēng)當(dāng)中的兩個(gè)來提供,其中,所述源分離模塊接收所述指向性形成模塊所產(chǎn)生的輸出信號(hào),并產(chǎn)生分離信號(hào)。
6.根據(jù)權(quán)利要求1所述的信號(hào)處理設(shè)備,進(jìn)一步包括到達(dá)方向估計(jì)模塊,用于接收所 述信號(hào)投射返回模塊所產(chǎn)生的投射返回信號(hào),并用于執(zhí)行如下處理基于不同位置處的多 個(gè)投射返回目標(biāo)麥克風(fēng)的各投射返回信號(hào)之間的相位差,計(jì)算到達(dá)方向。
7.根據(jù)權(quán)利要求1所述的信號(hào)處理設(shè)備,進(jìn)一步包括源位置估計(jì)模塊,用于接收所述 信號(hào)投射返回模塊所產(chǎn)生的投射返回信號(hào),執(zhí)行基于不同位置處的多個(gè)投射返回目標(biāo)麥克 風(fēng)的各投射返回信號(hào)之間的相位差來計(jì)算到達(dá)方向的處理,并進(jìn)一步基于到達(dá)方向的組合 數(shù)據(jù)計(jì)算源位置,所述到達(dá)方向的組合數(shù)據(jù)是從不同位置處的多個(gè)投射返回目標(biāo)麥克風(fēng)的 投射返回信號(hào)中計(jì)算出的。
8.根據(jù)權(quán)利要求2所述的信號(hào)處理設(shè)備,進(jìn)一步包括到達(dá)方向估計(jì)模塊,用于接收所 述信號(hào)投射返回模塊所產(chǎn)生的投射返回系數(shù),并用于執(zhí)行采用了接收到的投射返回系數(shù)的計(jì)算,由此執(zhí)行計(jì)算到達(dá)方向或源位置的處理。
9.根據(jù)權(quán)利要求1所述的信號(hào)處理設(shè)備,進(jìn)一步包括輸出裝置,其設(shè)置在對(duì)應(yīng)于投射 返回目標(biāo)麥克風(fēng)的位置處;以及控制模塊,用于執(zhí)行控制以輸出對(duì)于投射返回目標(biāo)麥克風(fēng)的投射返回信號(hào),所述投射 返回目標(biāo)麥克風(fēng)與所述輸出裝置的位置對(duì)應(yīng)。
10.根據(jù)權(quán)利要求1所述的信號(hào)處理設(shè)備,其中,所述源分離模塊包括多個(gè)源分離模 塊,其用于接收相應(yīng)組的源分離麥克風(fēng)所取得的信號(hào)并且用于產(chǎn)生相應(yīng)組的分離信號(hào),其 中所述相應(yīng)組的源分離麥克風(fēng)至少其部分彼此不同,以及其中,所述信號(hào)投射返回模塊接收所述多個(gè)源分離模塊所產(chǎn)生的相應(yīng)組的分離信號(hào)以 及投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào),產(chǎn)生對(duì)應(yīng)于源分離模塊的多組投射返回信號(hào),并將產(chǎn) 生的多組投射返回信號(hào)組合在一起,由此產(chǎn)生對(duì)于投射返回目標(biāo)麥克風(fēng)的最終投射返回信 號(hào)。
11.一種在信號(hào)處理設(shè)備中執(zhí)行的信號(hào)處理方法,所述方法包括如下步驟使得源分離模塊通過將獨(dú)立分量分析ICA應(yīng)用于基于來自多個(gè)聲音源的混合信號(hào)而 產(chǎn)生的觀測(cè)信號(hào),來產(chǎn)生與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào),由此執(zhí)行所述混合信號(hào)的分離 處理,其中所述觀測(cè)信號(hào)由源分離麥克風(fēng)取得;以及使得信號(hào)投射返回模塊接收投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)和所述源分離模塊所產(chǎn) 生的分離信號(hào),并且產(chǎn)生投射返回信號(hào)作為與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào),所述投射返 回信號(hào)由投射返回目標(biāo)麥克風(fēng)取得,其中,通過接收與源分離麥克風(fēng)不同的投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)來產(chǎn)生所述投 射返回信號(hào)。
12.一種用于在信號(hào)處理設(shè)備中執(zhí)行信號(hào)處理的程序,所述程序包括如下步驟使得源分離模塊通過將獨(dú)立分量分析ICA應(yīng)用于基于來自多個(gè)聲音源的混合信號(hào)而 產(chǎn)生的觀測(cè)信號(hào),來產(chǎn)生與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào),由此執(zhí)行所述混合信號(hào)的分離 處理,其中所述觀測(cè)信號(hào)由源分離麥克風(fēng)取得;以及使得信號(hào)投射返回模塊接收投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)和所述源分離模塊所產(chǎn) 生的分離信號(hào),并且產(chǎn)生投射返回信號(hào)作為與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào),所述投射返 回信號(hào)由投射返回目標(biāo)麥克風(fēng)取得,其中,通過接收與源分離麥克風(fēng)不同的投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)來產(chǎn)生所述投 射返回信號(hào)。
全文摘要
公開了信號(hào)處理設(shè)備、信號(hào)處理方法和程序。所述信號(hào)處理設(shè)備包括源分離模塊,用于通過將獨(dú)立分量分析ICA應(yīng)用于基于來自多個(gè)聲音源的混合信號(hào)而產(chǎn)生的觀測(cè)信號(hào),產(chǎn)生與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào),由此執(zhí)行所述混合信號(hào)的分離處理,所述觀測(cè)信號(hào)由源分離麥克風(fēng)取得;以及信號(hào)投射返回模塊,用于接收投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)和所述源分離模塊所產(chǎn)生的分離信號(hào),并且用于產(chǎn)生投射返回信號(hào)作為與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào),所述投射返回信號(hào)由投射返回目標(biāo)麥克風(fēng)取得。所述信號(hào)投射返回模塊通過接收與源分離麥克風(fēng)不同的投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)來產(chǎn)生所述投射返回信號(hào)。
文檔編號(hào)G01S3/808GK101852846SQ20101015145
公開日2010年10月6日 申請(qǐng)日期2010年3月23日 優(yōu)先權(quán)日2009年3月30日
發(fā)明者廣江厚夫 申請(qǐng)人:索尼公司