信號(hào)處理設(shè)備、信號(hào)處理方法和程序的制作方法

文檔序號(hào)：5870473閱讀：264來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>測(cè)量裝置的制造及其應(yīng)用技術(shù)

專利名稱：信號(hào)處理設(shè)備、信號(hào)處理方法和程序的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及信號(hào)處理設(shè)備、信號(hào)處理方法和程序。更具體地，本發(fā)明涉及如下這樣的信號(hào)處理設(shè)備、信號(hào)處理方法和程序其用于通過ICA(獨(dú)立分量分析)對(duì)于每個(gè)(聲音)源分離多個(gè)聲音的混合信號(hào)，并用于通過使用分離信號(hào)(即，分離結(jié)果)來執(zhí)行任意位置處的聲音信號(hào)的分析(如，安裝在相應(yīng)任意位置的每一麥克風(fēng)所要采集的聲音信號(hào)的分析(即，對(duì)于各個(gè)麥克風(fēng)的投射返回(proj ection-back)))。
背景技術(shù)：
存在ICA(獨(dú)立分量分析)作為用于分離包括在多個(gè)聲音的混合信號(hào)中的單獨(dú)源信號(hào)的技術(shù)。ICA是一種多變量分析，并且它是基于信號(hào)的統(tǒng)計(jì)特性來分離多維信號(hào)的方法。對(duì)于 ICA 本身的詳細(xì)內(nèi)容，例如，參見〃 NYUMONDOKURITSU SEIBUN BUNSEKI (Introdu ction-Independent ComponentAnalysis)" (Noboru Murata, Tokyo Denki University Press)0本發(fā)明涉及如下這樣的技術(shù)其用于通過ICA(獨(dú)立分量分析)對(duì)于每一(聲音) 源分離多個(gè)聲音的混合信號(hào)，并用于通過使用分離信號(hào)(即，分離結(jié)果)執(zhí)行例如對(duì)于安裝在各個(gè)任意位置的各個(gè)麥克風(fēng)的投射返回。例如，這種技術(shù)可以實(shí)現(xiàn)如下處理。(1)基于定向麥克風(fēng)采集的聲音來執(zhí)行ICA，并且將作為分離所采集的聲音的結(jié) 果而獲得的分離信號(hào)投射返回全向麥克風(fēng)。(2)基于安排為適配于源分離的麥克風(fēng)采集的聲音來執(zhí)行ICA，并且將作為分離所采集的聲音的結(jié)果而獲得的分離信號(hào)投射返回安排為適配于D0A(Direction of Arrival，到達(dá)方向)估計(jì)或源位置估計(jì)的麥克風(fēng)。將參照?qǐng)D1描述對(duì)于聲音信號(hào)的ICA，特別地，時(shí)頻域中的ICA。假設(shè)這樣的情形如圖1所示，對(duì)于產(chǎn)生不同的聲音來說，數(shù)量為N的聲音源是有效的，而數(shù)量為n的麥克風(fēng)用于觀測(cè)這些聲音。直到從聲音源產(chǎn)生的聲音(聲音信號(hào))到達(dá)麥克風(fēng)為止存在時(shí)間延遲和反射。從而，可以將由麥克風(fēng)j觀測(cè)到的信號(hào)(觀測(cè)信號(hào)) 表示為通過對(duì)于所有聲音源將源信號(hào)與傳輸函數(shù)的卷積進(jìn)行相加的如下公式[1.1]。在下文中，將這樣的混合稱為“卷積混合”。此外，可以由如下的單個(gè)公式[1. 2]表示所有麥克風(fēng)的觀測(cè)信號(hào)。
在以上公式中，x(t)和s(t)分別是具有元素xk(t)和sk(t)的列矢量，并且A[1]是具有元素&10_(1)的(nXN)矩陣。注意，在下面的描述中假設(shè)n = N。眾所周知，可以將時(shí)域中的卷積混合表示為時(shí)頻域中的瞬時(shí)混合。時(shí)頻域中的ICA 利用了這種特性。關(guān)于時(shí)頻域ICA 本身，參見“19. 2. 4. Fourier Transform Method in' DetailedExplanation independent Component Analysis“‘、日本待審專禾1J串i青公開 No. 2006-238409、“ APPARATUS AND METHOD FOR SEPARATING AUDI0SIGNALS"等。主要關(guān)于與本發(fā)明實(shí)施例有關(guān)的要點(diǎn)進(jìn)行下面的描述。通過將公式[1. 2]兩側(cè)經(jīng)歷短時(shí)傅立葉變換，獲得如下的公式[2. 1]。

及
在以上公式[2.1]中，
是頻率窗口(frequency bin)的索引(《 = 1到M，M是頻率窗口的總數(shù))，以
.[2.7]
t是幀的索引(t = 1到T，T是幀的總數(shù))。
如果假設(shè)《固定，則可以將公式[2. 1]看作表示瞬時(shí)混合(即，沒有時(shí)間延遲的混合)。為了分離觀測(cè)信號(hào)，因此，準(zhǔn)備用于計(jì)算分離信號(hào)[Y](S卩，分離結(jié)果)的公式 [2.5]，并且確定分離矩陣1( )以便分離結(jié)果Y( ，t)的各個(gè)分量彼此最獨(dú)立。
根據(jù)現(xiàn)有技術(shù)的時(shí)頻域ICA已經(jīng)伴隨有稱為“置換問題”的問題，即在各窗口之間將哪個(gè)分量分離到哪個(gè)聲道并不一致的問題。然而，通過日本待審專利申請(qǐng)公開 No. 2006-238409, " APPARATUS AND METHOD FORSEPARATING AUDIO SIGNALS"(其為與本申請(qǐng)相同的發(fā)明人所進(jìn)行的專利申請(qǐng))中公開的方法，已經(jīng)基本上解決了置換問題。由于現(xiàn)有技術(shù)的方法也用在本發(fā)明實(shí)施例中，因此下面將簡(jiǎn)要地描述在日本待審專利申請(qǐng)公開 No. 2006-238409中公開的用于解決置換問題的方法。在日本待審專利申請(qǐng)公開No. 2006-238409中，為了獲得分離矩陣W( )，反復(fù)地執(zhí)行下列公式[3.1]到[3. 3]的計(jì)算，直到分離矩陣W( )收斂(或預(yù)定次數(shù))為止
.[3.2]=
P(Yk(t)) :Yk(t)的概率密度函數(shù)(
[3.6]
.[3.9]
在下文中，將這些重復(fù)的執(zhí)行稱為“獲知(learning)”。注意，對(duì)所有頻率窗口執(zhí) 行下列公式[3. 1]到[3.3]的計(jì)算，并且對(duì)累積的觀測(cè)信號(hào)的所有幀執(zhí)行公式[3. 1]的計(jì) 算。在公式[3. 2]中，t表示幀號(hào)，<>t表示各幀在某一區(qū)域內(nèi)的平均。附于Y( ，t)的右上角的H表示厄密轉(zhuǎn)置(Hermitian transpose)。厄密轉(zhuǎn)置意味著這樣的處理進(jìn)行矢量或矩陣的轉(zhuǎn)置并將元素轉(zhuǎn)換為共軛復(fù)數(shù)。分離信號(hào)Y(t) (S卩，分離結(jié)果)由公式[3.4]表示，其以包括分離結(jié)果的所有聲道和所有頻率窗口的元素的矢量的形式表示。此外，cpcoCYCt))是公式[3. 5]表示的矢量。該矢
量的每一個(gè)元素q^YCt))稱作分?jǐn)?shù)函數(shù)，其為Yk(t)的多維(多變量)概率密度函數(shù)(PDF)
的對(duì)數(shù)差分(公式[3.6])。例如，公式[3.7]所表示的函數(shù)可以用作多維PDF。在此情況
下，分?jǐn)?shù)函數(shù)(pM(Y(t))可以用公式[3.9]表示。在公式[3.9]中，||Yk(t) ||2表示矢量Yk(t)
的L-2范數(shù)(norm)(即，所有元素的平方和的平方根)。將Yk(t)的L_m范數(shù)(即，L-2的一般化表示)定義為公式[3.8]。此外，公式[3.7]和[3.9]中的、是用于調(diào)整Yk( ，t) 的尺度(scale)的項(xiàng)(term)，并且將合適的正常數(shù)(如，sqrt (M)(頻率窗口的數(shù)量的平方根))分配給、。進(jìn)一步，公式[3. 3]中的n稱為獲知速率或獲知系數(shù)，并且其為較小的正值(如，約為1)。在分離矩陣W( )逐漸變化時(shí)，獲知速率用以反映基于公式[3. 2]計(jì)算出的 AW(co)。盡管公式[3. 1]表示一個(gè)頻率窗口的分離(見圖2A)，但是可以由一個(gè)公式表示所有頻率窗口的分離(見圖2B)。為此，使用所有頻率窗口的分離結(jié)果Y(t)(由公式[3.4]表示)、公式[3. 11]所表示的觀測(cè)信號(hào)X(t)以及所有頻率窗口的分離矩陣W(由公式[3.10]表示)。因此，通過使用這些矢量和矩陣，可以由公式[3. 12]表示分離。在本發(fā)明實(shí)施例的說明中，適當(dāng)時(shí)選擇性地使用公式[3.1]和[3.11]。圖2A和圖2B中的&到A到Y(jié)n所指示的表示稱為譜圖，在每一個(gè)譜圖中，在頻率窗口的方向上和幀的方向上排列短時(shí)傅立葉變換(STFT)的結(jié)果。垂直方向指示頻率窗口，而水平方向指示幀。在公式[3.4]和[3. 11]中，將較低的頻率放在較高側(cè)。相反，在譜圖中，將較低的頻率放在較低側(cè)。時(shí)頻域ICA進(jìn)一步具有稱為“尺度問題”的這一問題。即，由于分離結(jié)果的尺度(幅度)在各個(gè)頻率窗口中彼此不同，因此當(dāng)轉(zhuǎn)換到波形時(shí)各頻率之間的平衡與信源信號(hào)的不同，除非適當(dāng)?shù)卣{(diào)整尺度差異。已經(jīng)提出了 “投射返回麥克風(fēng)”(下面所述)以解決“尺度” 的問題。[投射返回麥克風(fēng)]將ICA的分離結(jié)果投射返回麥克風(fēng)意味著通過分析由均設(shè)置在某一位置處的麥克風(fēng)所采集的聲音信號(hào)，從采集到的聲音信號(hào)中確定可歸于各個(gè)信源信號(hào)的相應(yīng)分量。當(dāng) 僅一個(gè)聲音源有效時(shí)，可歸于各個(gè)信源信號(hào)的相應(yīng)分量等于麥克風(fēng)所觀測(cè)到的相應(yīng)信號(hào)。例如，假設(shè)作為信號(hào)分離結(jié)果所獲得的一個(gè)分離信號(hào)Yk對(duì)應(yīng)于圖1中所示的聲音源1。在此情況下，將分離信號(hào)1投射返回麥克風(fēng)1到n等效于估計(jì)在僅聲音源1有效時(shí)由各個(gè)麥克風(fēng)所觀測(cè)到的信號(hào)。投射返回之后的信號(hào)包括對(duì)于各信源信號(hào)的如下影響(例如)相位延遲、衰減和混響(回聲)，因此其對(duì)于作為投射返回目標(biāo)的每一麥克風(fēng)彼此不同。如圖1所示，在設(shè)置多個(gè)麥克風(fēng)1到n的配置中，對(duì)于一個(gè)分離結(jié)果，存在多個(gè)(n) 投射返回目標(biāo)。將為一個(gè)輸入提供多個(gè)輸出的這種信號(hào)稱為SIM0(單輸入，多輸出(Single Input,Multiple Outputs))型。在圖1的設(shè)置中，例如，由于數(shù)量n的分離結(jié)果與數(shù)量N的源對(duì)應(yīng)地存在，因此在投射返回之后共計(jì)存在(NXn)個(gè)信號(hào)。然而，當(dāng)僅旨在尺度問題的解決方案時(shí)，足以將分離結(jié)果投射返回任何一個(gè)麥克風(fēng)或?qū)到￥分別投射返回麥克風(fēng)1 到n。如上所述，通過將分離結(jié)果投射返回麥克風(fēng)(一個(gè)或多個(gè))，可以獲得具有與源信號(hào)的頻率尺度類似的頻率尺度的信號(hào)。將以這種方式調(diào)整分離結(jié)果的尺度稱為“改變尺
/又 o除了改變尺度之外，SIM0型信號(hào)還用在其它應(yīng)用中。例如，日本待審專利申請(qǐng)公開No. 2006-154314公開了如下這樣的技術(shù)其用于通過將兩個(gè)麥克風(fēng)中的每一個(gè)所觀測(cè) 到的信號(hào)分離為兩個(gè)SIM0信號(hào)(兩個(gè)立體信號(hào))，獲得具有聲音定位感覺的分離結(jié)果。日本待審專利申請(qǐng)公開No. 2006-154314進(jìn)一步公開了如下這樣的技術(shù)其用于通過將另一種類型的源分離(即，雙掩蔽(binary mask))應(yīng)用于作為立體聲信號(hào)所提供的分離結(jié)果，使得分離結(jié)果能夠以比ICA中分離矩陣的更新間隔更短的頻率跟隨聲音源的變化。下面將描述用于產(chǎn)生SIM0型分離結(jié)果和投射返回結(jié)果的方法。利用一種方法，自身修改ICA的算法，以便直接產(chǎn)生SIM0型分離結(jié)果。這種方法稱為“SIMO ICA”。日本待審專利申請(qǐng)公開No. 2006-154314公開了該類型的處理。利用另一方法，在獲得了分離結(jié)果￥1到￥11之后，通過乘以適當(dāng)?shù)南禂?shù)來確定對(duì)于各個(gè)麥克風(fēng)的投射返回結(jié)果。這種方法稱為“投射返回SIM0”。在下文中，將描述更緊密地與本發(fā)明實(shí)施例有關(guān)的后一種投射返回SIM0。例如，關(guān)于投射返回SIM0的一般說明，參見下面的參考文獻(xiàn)Noboru Murata 下面將描述更緊密地與本發(fā)明實(shí)施例有關(guān)的投射返回SIM0。將分離結(jié)果Yk( ，t)投射返回麥克風(fēng)i的結(jié)果被寫為Yk[i] ( ，t)。作為將分離結(jié)果Yk( ，t)投射返回麥克風(fēng)1到n的結(jié)果、由Yk[1]( ，t)到Y(jié)k[n]( ，t)組成的矢量可以由如下公式[4. 1]表示。公式[4. 1]右手側(cè)的第二項(xiàng)是通過將公式[2.6]表示的Y( ， t)的除了第k個(gè)元素之外的其他元素設(shè)置為0而產(chǎn)生的矢量，并且其表示僅對(duì)應(yīng)于Yk( ， t)的聲音源有效的情形。分離矩陣的逆矩陣表示空間傳輸函數(shù)。從而，公式[4. 1]對(duì)應(yīng)于如下這樣的公式該公式用于在只有對(duì)應(yīng)于Yk( ，t)的聲音源有效的情形下獲得由各個(gè)麥克風(fēng)所觀測(cè)到的信號(hào)?？梢詫⒐絒4. 1]重寫為公式[4. 2]。在公式[4. 2]中，Bik( )表示作為分離矩陣的逆矩陣B( )的每一個(gè)元素(見公式[4.3])。此外，diag( )表示具有括號(hào)中的元素作為對(duì)角元素的對(duì)角矩陣。另一方面，表示將分離結(jié)果Yjco，t)到￥ ( ，t)投射返回麥克風(fēng)k的公式由公式[4.4]給出。因此，可以通過將表示分離結(jié)果的矢量Y( ，t)乘以用于投射返回的系數(shù) 矩陣diag (Bkl (co)，，Bkn( co))來執(zhí)行投射返回。[現(xiàn)有技術(shù)中的問題]然而，根據(jù)公式[4. 1]到[4. 4]的上述投射返回處理是對(duì)于ICA中所使用的麥克風(fēng)的投射返回，而不適配于對(duì)于未在ICA中使用的麥克風(fēng)的投射返回。于是，存在當(dāng)在ICA 中使用的麥克風(fēng)和其排列對(duì)于其他處理來說不是最佳時(shí)可能出現(xiàn)問題的可能性。將在下面討論如下兩點(diǎn)作為問題的示例。(1)定向麥克風(fēng)的使用(2)與D0A(到達(dá)方向)估計(jì)及源位置估計(jì)的組合使用(1)定向麥克風(fēng)的使用在ICA中使用多個(gè)麥克風(fēng)的原因在于獲得以不同程度彼此混合多個(gè)聲音源的多個(gè)觀測(cè)信號(hào)。此時(shí)，各麥克風(fēng)之間的混合程度的差異越大，則對(duì)于分離和獲知來說越方便。換言之，各麥克風(fēng)之間的混合程度的較大差異不僅在增大目標(biāo)信號(hào)與干擾聲音(其仍然在分離結(jié)果中而未擦除)之比(即，信號(hào)-干擾比SIR)時(shí)，而且在以較少次數(shù)收斂獲知處理以獲得分離矩陣時(shí)更有效。已經(jīng)建議了使用定向麥克風(fēng)的方法以獲得具有混合程度更大差異的觀測(cè)信號(hào)。例如，參見日本待審專利申請(qǐng)公開No. 2007-295085。更具體地，建議的方法旨在通過使用每一個(gè)均在特定方向上具有高(或低)靈敏度的多個(gè)麥克風(fēng)而使得混合程度彼此不同。然而，當(dāng)對(duì)定向麥克風(fēng)觀測(cè)到的信號(hào)執(zhí)行ICA并且將分離結(jié)果投射返回定向麥克風(fēng)時(shí)出現(xiàn)了問題。換言之，由于每一個(gè)定向麥克風(fēng)的指向性根據(jù)頻率而不同，因此存在分離結(jié)果的聲音可能失真(或者可能具有與源信號(hào)的頻率平衡不同的頻率平衡)的可能性。下面將參照?qǐng)D3描述這種問題。圖3圖示了簡(jiǎn)單的定向麥克風(fēng)300的示例性配置。定向麥克風(fēng)300包括兩個(gè)聲音采集裝置301和302，它們以其之間的裝置距離d來排列。使得由聲音采集裝置觀測(cè)到的信號(hào)流之一(例如，在圖示的示例中，由聲音采集裝置302觀測(cè)到的流)穿過用于產(chǎn)生預(yù)定延遲(D)的延遲處理模塊303和用于將預(yù)定增益(a)應(yīng)用于經(jīng)過信號(hào)(passing signal)的混合增益控制模塊304。在加法器305中將延遲的信號(hào)和聲音采集裝置301所觀測(cè)到的信號(hào)彼此混合，由此可以產(chǎn)生具有依據(jù)方向而不同的靈敏度的輸出信號(hào)306。利用這種配置，例如，定向麥克風(fēng)300實(shí)現(xiàn)了所謂的指向性，即在特定方向上增大的靈敏度。通過在圖3中所示的定向麥克風(fēng)300的配置中設(shè)置延遲D = d/C(C是聲速)以及混合增益a = -1，形成指向性，以便取消來自定向麥克風(fēng)300的右側(cè)的聲音，并且加強(qiáng) 來自其左側(cè)的聲音。圖4圖示了在d = 0.04[m]且C = 340[m/s]的條件下對(duì)于四個(gè)頻率 (lOOHzUOOOHz,3000Hz和6000Hz)中的每一個(gè)描繪指向性(即，進(jìn)入方向與輸出增益之間的關(guān)系)的結(jié)果。在圖4中，按照頻率調(diào)整尺度，以便對(duì)于來自左側(cè)的聲音的輸出增益全部僅為1。此外，假設(shè)圖4中圖示的聲音采集裝置401和402分別與圖3中圖示的聲音采集裝置301和302相同。如圖4中所示，當(dāng)在兩個(gè)聲音采集裝置401和402以所述間隔排列的方向上觀看時(shí)，對(duì)于來自左側(cè)(定向麥克風(fēng)的前側(cè))的聲音(聲音A)輸出增益全部?jī)H為1，而當(dāng)在兩個(gè) 聲音采集裝置401和402以所述間隔排列的方向上觀看時(shí)，對(duì)于來自右側(cè)(定向麥克風(fēng)的后側(cè))的聲音(聲音B)輸出增益全部?jī)H為0。然而，在其他方向上，輸出增益隨著頻率的變化而不同。進(jìn)一步，當(dāng)與頻率對(duì)應(yīng)的聲音波長(zhǎng)短于裝置間隔(d)的兩倍(即，在d = 0. 04[m] 且C = 340[m/s]的條件下，在4250 [Hz]或更高的頻率上)時(shí)，出現(xiàn)稱為“空間混疊(spatial aliasing)”的現(xiàn)象。因此，除了右側(cè)之外，另外形成靈敏度低的方向。例如，觀看圖4中 6000Hz處的指向性的曲線，對(duì)于來自傾斜方向的聲音輸出增益也變?yōu)?，例如，如“聲音C” 表示的。因此，除了特定方向之外，產(chǎn)生未檢測(cè)到特定頻率的聲音的觀測(cè)區(qū)域。圖4中向右方向上的零點(diǎn)波束(null beam)的存在引起了如下問題。在通過使用均圖示在圖3中的多個(gè)定向麥克風(fēng)(即，兩個(gè)聲音采集裝置看作一個(gè)麥克風(fēng))獲得觀測(cè)信號(hào)、利用ICA分離觀測(cè)信號(hào)并且將分離結(jié)果投射返回定向麥克風(fēng)的情況下，對(duì)于定向麥克風(fēng)右側(cè)出現(xiàn)的聲音源(聲音B)所對(duì)應(yīng)的分離結(jié)果，投射返回結(jié)果基本上變?yōu)闊o效(null)。進(jìn)一步，根據(jù)頻率在聲音C的方向上的增益的較大差異引起如下問題。當(dāng)將與聲音C對(duì)應(yīng)的分離結(jié)果投射返回圖4中所示的定向麥克風(fēng)時(shí)，產(chǎn)生信號(hào)使得與100Hz和 1000Hz的分量相比，300Hz的分量得到加強(qiáng)，同時(shí)6000Hz的分量得到抑制。利用日本待審專利申請(qǐng)公開No. 2007-295085中描述的方法，通過徑向地排列每一個(gè)均在前向方向上具有指向性的多個(gè)麥克風(fēng)，并通過預(yù)先選擇各麥克風(fēng)中面向最靠近朝向每一聲音源的方向的一個(gè)麥克風(fēng)，可以避免頻率分量失真的問題。然而，為了同時(shí)最小化失真的影響并獲得在混合程度上非常不同的觀測(cè)信號(hào)，要在盡可能多的方向上安裝每一個(gè) 均在前向方向上具有尖銳的指向性的多個(gè)麥克風(fēng)。(2)與D0A(到達(dá)方向)估計(jì)和源位置估計(jì)的組合使用D0A (到達(dá)方向)估計(jì)是要估計(jì)聲音從哪個(gè)方向到達(dá)每一個(gè)麥克風(fēng)。此外，除了 D0A 之外還指定每一個(gè)聲音源的位置被稱為“源位置估計(jì)”。在使用多個(gè)麥克風(fēng)方面，D0A估計(jì) 和源位置估計(jì)對(duì)于ICA是常見的。然而，對(duì)于那些估計(jì)最佳的麥克風(fēng)排列不等于在所有情況下對(duì)于ICA最佳。為此，在旨在執(zhí)行源分離和D0A估計(jì)(或源位置估計(jì))兩者的系統(tǒng)中，在麥克風(fēng)排列中可能出現(xiàn)矛盾的難題。關(guān)于執(zhí)行D0A估計(jì)和源位置估計(jì)的方法，然后關(guān)于當(dāng)將那些估計(jì)與ICA組合時(shí)出現(xiàn)的問題進(jìn)行下面的描述。將參照?qǐng)D5，描述在將ICA的分離結(jié)果投射返回各個(gè)麥克風(fēng)之后估計(jì)D0A的方法。該方法與日本專利No. 3881367中描述的方法相同?？紤]以兩個(gè)麥克風(fēng)502和503之間的間隔(距離)d將其進(jìn)行安裝的環(huán)境。假設(shè) 分離結(jié)果Yk( ，t) 501 (圖5中所示)表示對(duì)于一個(gè)聲音源的分離結(jié)果，其已經(jīng)通過對(duì)來自多個(gè)聲音源的混合信號(hào)執(zhí)行分離處理而獲得。將分離結(jié)果Yk( ，t)501投射返回圖5中所示的麥克風(fēng)i(由502表示)和麥克風(fēng)i'(由503表示)的結(jié)果被分別假設(shè)為Yk[i]( ，t) 和Yk[i' ] (co，t)。當(dāng)聲音源與每一個(gè)麥克風(fēng)之間的距離比各麥克風(fēng)之間的距離知，大得多時(shí)，可以將聲波看作接近于平面波，從聲音源Yk( ，t)到麥克風(fēng)i的距離與從同一源到麥克風(fēng)i'的距離之差可以表示為(！…cos0kii,。該距離差提供了圖5中所示的路徑差505。注意，9kii,表示D0A，即它是由互連兩個(gè)麥克風(fēng)的線段和從聲音源延伸到兩個(gè)麥克風(fēng)中點(diǎn) 的線段所形成的角度504。D0A 0 kii,可以通過獲得作為投射返回結(jié)果的Yk[i] ( ，t)和Yk[i' ] ( ，t)之間的
11相位差來確定。Yk⑴(《，t)和」(《，t)(S卩，投射返回結(jié)果)之間的關(guān)系由如下公式 [5. 1]表示。用于計(jì)算相位差的公式由如下公式[5. 2]和[5. 3]表示。
在以上公式中；angle ()表示復(fù)數(shù)的相位，acos()表示C0S()的反函數(shù)。只要通過使用上述公式[4. 1]執(zhí)行投射返回，就由不依賴于幀號(hào)t而僅依賴于分離矩陣W( )的值給出相位差。因此，可以由公式[5.4]表示用于計(jì)算相位差的公式。另一方面，日本專利申請(qǐng)No. 2008-153483 (其已經(jīng)由與本申請(qǐng)相同的申請(qǐng)人在先前提交)描述了在不使用逆矩陣的情況下計(jì)算D0A的方法。在計(jì)算D0A方面，觀測(cè)信號(hào)X( ，t)與分離結(jié)果Y( ，t)之間的協(xié)方差矩陣E xy( )具有與分離矩陣的逆(艮口， W(co)-1)的特性類似的特性。于是，通過計(jì)算如下面的公式[6. 1]或[6.2]中所表示的協(xié) 方差E xy( )，可以基于下面的公式[6.4]計(jì)算D0A ekii,。在公式[6.4]中，oik( )表示如從公式[6.3]看到那樣的E xy( )的每一個(gè)分量。通過使用公式[6. 4]，不再需要逆矩陣的計(jì)算。進(jìn)一步，在實(shí)時(shí)運(yùn)行的系統(tǒng)中，可以以比使用基于ICA的分離矩陣的情況下更短的間隔(最小逐幀)更新D0A。E XY(w) = <X(o, t)Y(o, t)H>t= <X(o, t)X(o, t)H>tff( , t)H.. 將在下文中描述從D0A估計(jì)源位置的方法?；旧?，一旦針對(duì)多個(gè)麥克風(fēng)對(duì)的每一個(gè)確定了 D0A，也基于三角測(cè)量原理確定了源位置。例如，參見日本待審專利申請(qǐng)公開 No. 2005-49153，關(guān)于基于三角測(cè)量原理的源位置估計(jì)。將參照?qǐng)D6簡(jiǎn)要地描述源位置估計(jì)。
麥克風(fēng)602和603與圖5中的麥克風(fēng)502和503相同。假設(shè)已經(jīng)針對(duì)每一個(gè)麥克風(fēng)對(duì)604(包括602和603)確定了 D0A 0 kii,。考慮具有位于麥克風(fēng)602和603之間的中點(diǎn)的頂點(diǎn)并具有其一半等于9kii,的頂角的圓錐體605，聲音源存在于圓錐體605表面上的某處?？梢酝ㄟ^以類似的方式獲得麥克風(fēng)對(duì)的相應(yīng)圓錐體605到607并通過確定那些圓錐體的交叉點(diǎn)(或那些圓錐體的表面彼此最接近的點(diǎn))來估計(jì)源位置。前述是基于三角測(cè)量原理估計(jì)源位置的萬法。下面將描述麥克風(fēng)排列在ICA和D0A估計(jì)(或源位置估計(jì))兩者中具有的問題。問題主要存在于如下三點(diǎn)。a)麥克風(fēng)的數(shù)量b)各麥克風(fēng)之間的間隔c)改變其位置的麥克風(fēng)a)麥克風(fēng)的數(shù)量將D0A估計(jì)或源位置估計(jì)的計(jì)算成本與ICA的計(jì)算成本相比較，后者高得多。此外，由于ICA的計(jì)算成本與麥克風(fēng)的數(shù)量n的平方成比例，因此考慮到計(jì)算成本的上限，在某些情況下可能限制麥克風(fēng)的數(shù)量。結(jié)果，特別地，源位置估計(jì)所需的麥克風(fēng)數(shù)量在某些情況下不可用。例如，在麥克風(fēng)數(shù)量=2的情況下，可以分離最多兩個(gè)聲音源，并可以估計(jì)每一個(gè)聲音源均存在于特定圓錐體的表面上。然而，難以指定源位置。b)各麥克風(fēng)之間的間隔為了在源位置估計(jì)中高精度地估計(jì)源位置，例如，期望以與聲音源和麥克風(fēng)之間的距離基本相同的階次(order)彼此遠(yuǎn)離地放置麥克風(fēng)對(duì)。相反，期望組成每一個(gè)麥克風(fēng) 對(duì)的兩個(gè)麥克風(fēng)彼此靠近放置以便滿足平面波假設(shè)。然而，在ICA中，從分離精度的視角來看，使用彼此遠(yuǎn)離的兩個(gè)麥克風(fēng)在某些情況下可能是不利的。將在下面描述這一點(diǎn)。在時(shí)頻域中基于ICA的分離通常通過在干擾聲音的每一個(gè)方向上形成零點(diǎn)波束 (增益變?yōu)?的方向)來實(shí)現(xiàn)。在圖1的環(huán)境中，例如，通過在朝向源2到N(其正在產(chǎn)生干擾聲音)的方向上形成零點(diǎn)波束來獲得用于分離和提取聲音源1的分離矩陣，以便朝向聲音源1的方向上的信號(hào)(即，目標(biāo)聲音)最終保持。在較低的頻率中最多可以形成n-l(n:麥克風(fēng)的數(shù)量)個(gè)零點(diǎn)波束。然而，在C/ (2d) (C 聲速，d 各麥克風(fēng)之間的間隔)以上的頻率中，由于被稱為“空間混疊”的現(xiàn)象，因此在除了預(yù)定方向之外的其他方向上進(jìn)一步形成零點(diǎn)波束。例如，觀看圖4中6000Hz的指向性曲線，除了來自聲音采集裝置以圖4中的間隔排列的方向上的右側(cè)(即，來自定向麥克風(fēng)的后側(cè))的聲音(由B指示)之外，在傾斜方向上形成零點(diǎn)波束，如聲音C所示。在分離矩陣中也發(fā)生類似的現(xiàn)象。隨著各麥克風(fēng)之間的距離d增大，空間混疊開始在低頻處產(chǎn)生。進(jìn)一步，在高頻處，在除了預(yù)定方向之外的其他方向上形成多個(gè)零點(diǎn)波束。如果除了預(yù)定方向之外的零點(diǎn)波束的其他方向中的任意一個(gè)與目標(biāo)聲音的方向一致，則分離精度惡化。于是，要根據(jù)直到高精度執(zhí)行分離的頻率的級(jí)別來確定ICA中所使用的麥克風(fēng)的間隔和排列。換言之，ICA中所使用的麥克風(fēng)的間隔和排列可能與源位置估計(jì)中確保滿意精度所需的麥克風(fēng)的排列矛盾。C)改變其位置的麥克風(fēng)
在D0A估計(jì)和源位置估計(jì)中，需要至少已知關(guān)于各麥克風(fēng)之間的相對(duì)位置關(guān)系的信息。在源位置估計(jì)中，當(dāng)還估計(jì)聲音源關(guān)于固定原點(diǎn)(例如，在房間一角設(shè)置的原點(diǎn))的絕對(duì)坐標(biāo)時(shí)，除了關(guān)于麥克風(fēng)的聲音源的相對(duì)位置之外，還進(jìn)一步需要每一個(gè)麥克風(fēng)的絕對(duì)坐標(biāo)。另一方面，在ICA中執(zhí)行的分離中，麥克風(fēng)的位置信息不是必須的。(盡管分離精度根據(jù)麥克風(fēng)排列而變化，但是在用于分離和獲知的公式中未包括各麥克風(fēng)的位置信息)。因此，在某些情況下，ICA中所使用的麥克風(fēng)可能不用在D0A估計(jì)和源位置估計(jì)中。例如，假設(shè)在電視機(jī)中并入源分離和源位置估計(jì)的功能以提取用戶的說話并估計(jì)其位置的情況。在此情況下，當(dāng)要通過使用以電視外殼的特定點(diǎn)(如，屏幕中心)作為原點(diǎn)的坐標(biāo)系來表示源位置時(shí)，源位置估計(jì)中所使用的每一個(gè)麥克風(fēng)關(guān)于原點(diǎn)的坐標(biāo)必須已知。例如，如果將每一個(gè)麥克風(fēng)固定到電視外殼，則麥克風(fēng)的位置已知。同時(shí)，從源分離的視角來看，通過將麥克風(fēng)設(shè)置得盡可能靠近用戶，獲得更易于分離的觀測(cè)信號(hào)。因此，在某些情況下，例如期望在遙控器(而非電視外殼)上安裝麥克風(fēng)。然而，當(dāng)未獲得遙控器上的麥克風(fēng)的絕對(duì)位置時(shí)，在基于從遙控器上的麥克風(fēng)獲得的分離結(jié)果確定源位置時(shí)出現(xiàn)困難。如上所述，當(dāng)在現(xiàn)有技術(shù)中執(zhí)行ICA(獨(dú)立分量分析)作為源分離處理時(shí)，在利用對(duì)于ICA最佳的麥克風(fēng)排列中的多個(gè)定向麥克風(fēng)的設(shè)置之下，有時(shí)可以執(zhí)行ICA。然而，如以上討論的那樣，當(dāng)將作為利用定向麥克風(fēng)的處理結(jié)果所獲得的分離結(jié) 果投射返回定向麥克風(fēng)時(shí)，由于每個(gè)定向麥克風(fēng)的指向性根據(jù)頻率而不同，因此出現(xiàn)分離結(jié)果所提供的聲音的失真問題，如以上參照?qǐng)D4所述的那樣。進(jìn)一步，對(duì)于ICA最佳的麥克風(fēng)排列是對(duì)于源分離的最佳排列，但在某些情況下，其對(duì)于D0A估計(jì)和源位置估計(jì)來說可能是不合適的。于是，當(dāng)以組合的方式執(zhí)行ICA和D0A 估計(jì)或源位置估計(jì)時(shí)，在源分離處理和D0A估計(jì)或源位置估計(jì)處理中的任何一個(gè)之中，處理精度可能惡化。

發(fā)明內(nèi)容
期望提供如下這樣的信號(hào)處理設(shè)備、信號(hào)處理方法和程序其不僅能夠以適于 ICA (獨(dú)立分量分析)的麥克風(fēng)設(shè)置通過ICA執(zhí)行源分離處理，而且還能夠更高精度地執(zhí)行其他處理，如用于投射返回除了 ICA中使用的麥克風(fēng)位置之外的位置的處理、D0A(到達(dá)方向)估計(jì)處理和源位置估計(jì)處理。還期望即使例如在使用定向麥克風(fēng)和對(duì)于ICA最佳配置的麥克風(fēng)排列來執(zhí)行最佳ICA處理時(shí)，也可實(shí)現(xiàn)用于投射返回每一個(gè)均處于任意位置的麥克風(fēng)的處理。進(jìn)一步，期望提供如下這樣的信號(hào)處理設(shè)備、信號(hào)處理方法和程序其即使在對(duì)于ICA最佳的環(huán)境中也能夠以更高精度執(zhí)行D0A估計(jì)和源位置估計(jì)處理。根據(jù)本發(fā)明實(shí)施例，提供了一種信號(hào)處理設(shè)備，包括源分離模塊，用于通過將 ICA(獨(dú)立分量分析)應(yīng)用于基于用以源分離的麥克風(fēng)所取得的聲音源的混合信號(hào)的觀測(cè) 信號(hào)，產(chǎn)生與多個(gè)聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào)；以及信號(hào)投射返回模塊，用于接收投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)和所述源分離模塊產(chǎn)生的分離信號(hào)，并且用于產(chǎn)生投射返回信號(hào)作為與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào)，所述投射返回信號(hào)由投射返回目標(biāo)麥克風(fēng)取得，其中，所述信號(hào)投射返回模塊通過接收與源分離麥克風(fēng)不同的投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào) 來產(chǎn)生所述投射返回信號(hào)。根據(jù)修改的實(shí)施例，在信號(hào)處理設(shè)備中，所述源分離模塊對(duì)觀測(cè)信號(hào)執(zhí)行ICA，由此產(chǎn)生與各聲音源對(duì)應(yīng)的時(shí)頻域中的相應(yīng)分離信號(hào)，所述觀測(cè)信號(hào)是通過將用于源分離的麥克風(fēng)取得的信號(hào)轉(zhuǎn)換到時(shí)頻域而獲得的，并且所述信號(hào)投射返回模塊通過計(jì)算使與每一個(gè)聲音源對(duì)應(yīng)的相應(yīng)投射返回信號(hào)之總和與投射返回目標(biāo)麥克風(fēng)的各個(gè)觀測(cè)信號(hào)之間的誤差最小的投射返回系數(shù)，并通過將分離信號(hào)乘以計(jì)算出的投射返回系數(shù)來計(jì)算投射返回信號(hào)，其中，與每一個(gè)聲音源對(duì)應(yīng)的相應(yīng)投射返回信號(hào)之總和是通過將時(shí)頻域中的分離信號(hào)乘以投射返回系數(shù)而計(jì)算的。根據(jù)另一修改實(shí)施例，在信號(hào)處理設(shè)備中，所述信號(hào)投射返回模塊在計(jì)算使最小平方誤差最小的投射返回系數(shù)的處理中采用最小二乘逼近。根據(jù)又一修改實(shí)施例，在信號(hào)處理設(shè)備中，所述源分離模塊接收由多個(gè)定向麥克風(fēng)組成的源分離麥克風(fēng)所取得的信號(hào)，并執(zhí)行產(chǎn)生與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào)的處理，并且所述信號(hào)投射返回模塊接收作為全向麥克風(fēng)的投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)和所述源分離模塊產(chǎn)生的分離信號(hào)，并產(chǎn)生與作為全向麥克風(fēng)的投射返回目標(biāo)麥克風(fēng)對(duì)應(yīng)的投射返回信號(hào)。根據(jù)再一修改實(shí)施例，信號(hào)處理設(shè)備進(jìn)一步包括指向性形成模塊，用于接收多個(gè) 全向麥克風(fēng)組成的用于源分離的麥克風(fēng)所取得的信號(hào)，并且用于根據(jù)成對(duì)麥克風(fēng)之間的距離，通過延遲成對(duì)麥克風(fēng)之一的相位來產(chǎn)生虛擬定向麥克風(fēng)的輸出信號(hào)，所述成對(duì)麥克風(fēng) 是通過所述多個(gè)全向麥克風(fēng)當(dāng)中的兩個(gè)來提供的，其中所述源分離模塊接收所述指向性形成模塊所產(chǎn)生的輸出信號(hào)，并產(chǎn)生分離信號(hào)。根據(jù)再一修改實(shí)施例，信號(hào)處理設(shè)備進(jìn)一步包括到達(dá)方向估計(jì)模塊，用于接收所述信號(hào)投射返回模塊所產(chǎn)生的投射返回信號(hào)，并用于執(zhí)行如下處理基于不同位置處的多個(gè)投射返回目標(biāo)麥克風(fēng)的投射返回信號(hào)之間的相位差，計(jì)算到達(dá)方向。根據(jù)再一修改實(shí)施例，信號(hào)處理設(shè)備進(jìn)一步包括源位置估計(jì)模塊，用于接收所述信號(hào)投射返回模塊所產(chǎn)生的投射返回信號(hào)，執(zhí)行基于不同位置處的多個(gè)投射返回目標(biāo)麥克風(fēng)的投射返回信號(hào)之間的相位差來計(jì)算到達(dá)方向的處理，并進(jìn)一步基于到達(dá)方向的組合數(shù) 據(jù)來計(jì)算源位置，所述到達(dá)方向的組合數(shù)據(jù)是從不同位置處的多個(gè)投射返回目標(biāo)麥克風(fēng)的投射返回信號(hào)中計(jì)算的。根據(jù)再一修改實(shí)施例，信號(hào)處理設(shè)備進(jìn)一步包括到達(dá)方向估計(jì)模塊，用于接收所述信號(hào)投射返回模塊所產(chǎn)生的投射返回系數(shù)，并用于執(zhí)行采用了接收到的投射返回系數(shù)的計(jì)算，由此執(zhí)行計(jì)算到達(dá)方向或源位置的處理。根據(jù)再一修改實(shí)施例，信號(hào)處理設(shè)備進(jìn)一步包括輸出裝置，其設(shè)置在與投射返回麥克風(fēng)對(duì)應(yīng)的位置處；以及控制模塊，用于執(zhí)行控制以輸出對(duì)于投射返回目標(biāo)麥克風(fēng)的投射返回信號(hào)，所述投射返回目標(biāo)麥克風(fēng)與所述輸出裝置的位置對(duì)應(yīng)。根據(jù)再一修改實(shí)施例，在信號(hào)處理設(shè)備中，所述源分離模塊包括多個(gè)源分離模塊，其用于接收由相應(yīng)組的源分離麥克風(fēng)取得的信號(hào)并且用于產(chǎn)生相應(yīng)組的分離信號(hào)，所述相應(yīng)組的源分離麥克風(fēng)至少在其部分上彼此不同，并且所述信號(hào)投射返回模塊接收所述多個(gè) 源分離模塊所產(chǎn)生的相應(yīng)組的分離信號(hào)以及投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)，產(chǎn)生與源分離模塊對(duì)應(yīng)的多組投射返回信號(hào)，并將產(chǎn)生的多組投射返回信號(hào)組合在一起，由此產(chǎn)生對(duì) 于投射返回目標(biāo)麥克風(fēng)的最終投射返回信號(hào)。根據(jù)本發(fā)明另一實(shí)施例，提供了一種在信號(hào)處理設(shè)備中執(zhí)行的信號(hào)處理方法，所述方法包括如下步驟使得源分離模塊通過將ICA(獨(dú)立分量分析)應(yīng)用于基于來自多個(gè)聲音源的混合信號(hào)而產(chǎn)生的觀測(cè)信號(hào)，來產(chǎn)生與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào)，由此執(zhí)行混合信號(hào)的分離處理，所述觀測(cè)信號(hào)是源分離麥克風(fēng)取得的；以及使得信號(hào)投射返回模塊接收投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)和所述源分離模塊所產(chǎn)生的分離信號(hào)，并且產(chǎn)生投射返回信號(hào)作為與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào)，所述投射返回信號(hào)由投射返回目標(biāo)麥克風(fēng)取得，其中，通過接收與源分離麥克風(fēng)不同的投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)來產(chǎn)生所述投射返回信號(hào)。根據(jù)本發(fā)明再一實(shí)施例，提供了一種用于在信號(hào)處理設(shè)備中執(zhí)行信號(hào)處理的程序，所述程序包括如下步驟使得源分離模塊通過將ICA(獨(dú)立分量分析)應(yīng)用于基于來自多個(gè)聲音源的混合信號(hào)而產(chǎn)生的觀測(cè)信號(hào)，來產(chǎn)生與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào)，由此執(zhí)行所述混合信號(hào)的分離處理，所述觀測(cè)信號(hào)由用于源分離的麥克風(fēng)取得；以及使得信號(hào) 投射返回模塊接收投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)和所述源分離模塊所產(chǎn)生的分離信號(hào)，并且產(chǎn)生投射返回信號(hào)作為與所述多個(gè)聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào)，所述投射返回信號(hào)由投射返回目標(biāo)麥克風(fēng)取得，其中，通過接收與源分離麥克風(fēng)不同的投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)來產(chǎn)生所述投射返回信號(hào)。根據(jù)本發(fā)明的程序是能夠由存儲(chǔ)介質(zhì)等以計(jì)算機(jī)可讀形式提供到(例如)可以執(zhí) 行各種程序代碼的各種信息處理設(shè)備和計(jì)算機(jī)系統(tǒng)的程序。通過以計(jì)算機(jī)可讀形式提供程序，可以在各種信息處理設(shè)備和計(jì)算機(jī)系統(tǒng)上實(shí)現(xiàn)與程序?qū)?yīng)的處理。參照附圖，從本發(fā)明實(shí)施例的詳細(xì)描述中，其他特征和優(yōu)點(diǎn)將變得顯而易見。注意，術(shù)語“系統(tǒng)”意味著多個(gè)裝置的邏輯組件，并且“系統(tǒng)”的含義不限于在同一外殼內(nèi)并入具有相應(yīng)功能的各個(gè)裝置的情況。根據(jù)本發(fā)明實(shí)施例，將ICA(獨(dú)立分量分析)應(yīng)用于基于多個(gè)聲音源的混合信號(hào)的觀測(cè)信號(hào)(其由源分離麥克風(fēng)獲得)，以執(zhí)行分離混合信號(hào)的處理，由此產(chǎn)生分別與各聲音源對(duì)應(yīng)的分離信號(hào)。然后，輸入所產(chǎn)生的分離信號(hào)和與源分離麥克風(fēng)不同的投射返回目標(biāo) 麥克風(fēng)的觀測(cè)信號(hào)，以基于這些輸入信號(hào)產(chǎn)生作為與各個(gè)聲音源對(duì)應(yīng)的分離信號(hào)且估計(jì)為要由投射返回目標(biāo)麥克風(fēng)取得的投射返回信號(hào)。通過利用產(chǎn)生的投射返回信號(hào)，例如，可以將語音數(shù)據(jù)輸出到輸出裝置，并且可以估計(jì)到達(dá)方向(D0A)或源位置。

圖1是說明數(shù)量為N的聲音源有效以產(chǎn)生不同聲音并且由數(shù)量為n的麥克風(fēng)觀測(cè) 聲音的情形的圖示；圖2A和圖2B分別是說明各個(gè)頻率窗口中的分離處理(圖2A)和對(duì)于所有頻率窗口的分離處理(圖2B)的圖；圖3圖示了簡(jiǎn)單定向麥克風(fēng)的示例性配置；圖4圖示了針對(duì)四個(gè)頻率(100Hz、1000Hz、3000Hz和6000Hz)中的每一個(gè)，描繪指
向性(即，進(jìn)入方向和輸出增益之間的關(guān)系)的結(jié)果；
圖5是說明在將ICA的分離結(jié)果投射返回各個(gè)麥克風(fēng)之后估計(jì)D0A(到達(dá)方向) 的方法的圖示；圖6是說明基于三角測(cè)量原理的源位置估計(jì)的圖示；圖7是圖示根據(jù)本發(fā)明第一實(shí)施例的信號(hào)處理設(shè)備的配置的框圖；圖8是說明圖7中圖示的信號(hào)處理設(shè)備中定向麥克風(fēng)和全向麥克風(fēng)的示例性排列的圖示；圖9是圖示根據(jù)本發(fā)明第二實(shí)施例的信號(hào)處理設(shè)備的配置的框圖；圖10是說明與圖9中圖示的信號(hào)處理設(shè)備的配置對(duì)應(yīng)的麥克風(fēng)排列的示例以及形成麥克風(fēng)的指向性的方法的圖示；圖11是圖示根據(jù)本發(fā)明的第三實(shí)施例的信號(hào)處理設(shè)備的配置的框圖；圖12是說明與圖11中圖示的信號(hào)處理設(shè)備的配置對(duì)應(yīng)的麥克風(fēng)排列的一個(gè)示例的圖示；圖13是說明與圖11中圖示的信號(hào)處理設(shè)備的配置對(duì)應(yīng)的麥克風(fēng)排列的另一示例的圖示；圖14圖示源分離模塊的一個(gè)示例性配置；圖15圖示信號(hào)投射返回模塊的一個(gè)示例性配置；圖16圖示信號(hào)投射返回模塊的另一示例性配置；圖17是說明當(dāng)通過采用基于由用于源分離的麥克風(fēng)獲得的數(shù)據(jù)的分離結(jié)果來執(zhí) 行用于投射返回目標(biāo)麥克風(fēng)的投射返回處理時(shí)的處理序列的流程圖；圖18是說明當(dāng)以組合方式執(zhí)行分離結(jié)果的投射返回和D0A估計(jì)(或源位置估計(jì)) 時(shí)的處理序列的流程圖；圖19是說明源分離處理的序列的流程圖；圖20是說明投射返回處理的序列的流程圖；圖21圖示根據(jù)本發(fā)明第四實(shí)施例的信號(hào)處理設(shè)備中麥克風(fēng)和輸出裝置的第一排列示例；圖22A和圖22B圖示根據(jù)本發(fā)明第四實(shí)施例、不同環(huán)境中的信號(hào)處理設(shè)備中麥克風(fēng)和輸出裝置的第二排列示例；圖23圖示包括多個(gè)源分離系統(tǒng)的信號(hào)處理設(shè)備的配置；以及圖24圖示包括多個(gè)源分離系統(tǒng)的信號(hào)處理設(shè)備中的處理示例。
具體實(shí)施例方式下面將參照附圖，描述根據(jù)本發(fā)明實(shí)施例的信號(hào)處理設(shè)備、信號(hào)處理方法和程序的細(xì)節(jié)。以下面列出的各項(xiàng)的次序進(jìn)行下列描述。1.根據(jù)本發(fā)明實(shí)施例的處理的概要2.對(duì)于與適于ICA的麥克風(fēng)不同的麥克風(fēng)的投射返回處理及其原理3.對(duì)于與適于ICA的麥克風(fēng)不同的麥克風(fēng)的投射返回處理的處理示例(第一實(shí)施例)4.通過使用多個(gè)全向麥克風(fēng)組成虛擬定向麥克風(fēng)的實(shí)施例(第二實(shí)施例)5.以組合方式執(zhí)行源分離處理的分離結(jié)果的投射返回處理和D0A估計(jì)或源位置估計(jì)的處理示例(第三實(shí)施例)6.組成根據(jù)本發(fā)明實(shí)施例的信號(hào)處理設(shè)備的各模塊的示例性配置7.在信號(hào)處理設(shè)備中執(zhí)行的處理序列8.根據(jù)本發(fā)明的其他實(shí)施例的信號(hào)處理設(shè)備8. 1在信號(hào)投射返回模塊中，在計(jì)算投射返回系數(shù)矩陣P( )的處理中省略逆矩陣的計(jì)算的實(shí)施例8. 2執(zhí)行將源分離處理獲得的分離結(jié)果投射返回到特定排列的麥克風(fēng)的處理的實(shí) 施例(第四實(shí)施例)8. 3采用多個(gè)源分離系統(tǒng)的實(shí)施例(第五實(shí)施例)9.根據(jù)本發(fā)明實(shí)施例的信號(hào)處理設(shè)備的特征和優(yōu)點(diǎn)的總結(jié)[1.根據(jù)本發(fā)明實(shí)施例的處理的概要]如上所述，當(dāng)在現(xiàn)有技術(shù)中執(zhí)行ICA (獨(dú)立分量分析)作為源分離處理時(shí)，期望在利用對(duì)于ICA最佳的麥克風(fēng)排列中的多個(gè)定向麥克風(fēng)的設(shè)置之下執(zhí)行ICA。然而，該設(shè)置伴隨有如下問題。(1)當(dāng)將作為利用定向麥克風(fēng)的處理結(jié)果所獲得的分離信號(hào)(S卩，分離結(jié)果)投射返回定向麥克風(fēng)時(shí)，如以上參照?qǐng)D4所述的那樣，由于每一個(gè)定向麥克風(fēng)的指向性根據(jù)頻率而不同，因此分離結(jié)果的聲音可能失真。(2)對(duì)于ICA最佳的麥克風(fēng)排列是對(duì)于源分離的最佳排列，但其對(duì)于D0A估計(jì)和源位置估計(jì)可能經(jīng)常是不合適的。因此，在麥克風(fēng)的相同設(shè)置下，在高精度執(zhí)行對(duì)于ICA最佳的排列和位置中設(shè)置麥克風(fēng)的ICA處理和其他處理兩者時(shí)均出現(xiàn)困難。本發(fā)明的實(shí)施例通過使得能夠?qū)CA產(chǎn)生的源分離結(jié)果投射返回未在ICA中使用的麥克風(fēng)的位置而克服了上述問題。以另一方式說明，可以通過將定向麥克風(fēng)所獲得的分離結(jié)果投射返回全向麥克風(fēng) 來解決在使用定向麥克風(fēng)時(shí)的以上問題⑴。此外，可以通過在適于ICA的麥克風(fēng)排列的設(shè) 置之下產(chǎn)生分離結(jié)果，并通過將產(chǎn)生的分離結(jié)果投射返回處于適于D0A和源位置估計(jì)的排列的麥克風(fēng)(或位置已知的麥克風(fēng))來解決以上問題(2)(即，ICA與D0A估計(jì)或源位置估計(jì)之間的麥克風(fēng)排列的矛盾)。因此，本發(fā)明的實(shí)施例使得能夠?qū)τ谂c適于ICA的麥克風(fēng)不同的麥克風(fēng)執(zhí)行投射返回。[2.對(duì)于與適于ICA的麥克風(fēng)不同的麥克風(fēng)的投射返回處理及其原理]下面將描述對(duì)于與適于ICA的麥克風(fēng)不同的麥克風(fēng)的投射返回處理及其原理。令X( ，t)是把ICA中使用的麥克風(fēng)所觀測(cè)到的信號(hào)轉(zhuǎn)換到時(shí)頻域而產(chǎn)生的數(shù) 據(jù)，Y( ，t)是數(shù)據(jù)X( ，t)的分離結(jié)果(分離信號(hào))。經(jīng)轉(zhuǎn)換的數(shù)據(jù)和分離結(jié)果與上述現(xiàn)有技術(shù)中公式[2. 1]到[2. 7]所表示的那些相同。即，通過使用如下變量時(shí)頻域中觀測(cè)信號(hào)的經(jīng)轉(zhuǎn)換數(shù)據(jù)X( ，t)，分離結(jié)果Y( ，t)，以及分離矩陣W( )，關(guān)系
18
Y( ，t) = W( )X(co，t)成立。分離結(jié)果Y( co，t)可以表示在改變尺度之前和之后兩者獲得的結(jié)果。接著，執(zhí)行如下的處理通過利用ICA的分離結(jié)果來進(jìn)行對(duì)于每一個(gè)均處于任意位置的麥克風(fēng)的投射返回。如上所述，將ICA的分離結(jié)果投射返回麥克風(fēng)意味著如下的處理分析每一個(gè)均設(shè)置在特定位置的麥克風(fēng)所采集的聲音信號(hào)，并從采集的聲音信號(hào)中確定可歸于各個(gè)源信號(hào)的相應(yīng)分量。當(dāng)僅一個(gè)聲音源有效時(shí)，可歸于各個(gè)源信號(hào)的相應(yīng)分量等于麥克風(fēng)所觀測(cè)到的相應(yīng)信號(hào)。執(zhí)行投射返回處理作為如下的處理輸入投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)以及通過源分離處理所產(chǎn)生的分離結(jié)果(分離信號(hào))，并產(chǎn)生投射返回信號(hào)(投射返回結(jié)果)(即與各個(gè)源對(duì)應(yīng)且由投射返回目標(biāo)麥克風(fēng)取得的分離信號(hào))。令X' k( ，t)是投射返回目標(biāo)麥克風(fēng)所觀測(cè)到的(轉(zhuǎn)換到時(shí)頻域的)觀測(cè)信號(hào) 之一。進(jìn)一步，令m是投射返回目標(biāo)麥克風(fēng)的數(shù)量，X' ( ，t)是如下這樣的矢量該矢量包括各個(gè)麥克風(fēng)1到m所觀測(cè)到的(轉(zhuǎn)換到時(shí)頻域的)觀測(cè)信號(hào)X' ^wt)到X' ffl( , t)作為元素，如下列公式[7. 1]所表示的那樣。
P( ) = <X' (co, t)Y( , t)H>t{<Y( , t)Y( , t)H>t}^......[7.6]=<X' ( ，t)X( ，t)H>t<X( ，t)X( ，卞)11〉/1!…)-1......[7. 7] WLkJ (w) = diag(Pkl( ), ...,Pkn(co))ff(co)......[7. 11]
與矢量X' ( ，t)的元素對(duì)應(yīng)的麥克風(fēng)可以僅由未在ICA中使用的麥克風(fēng)組成，或者可以包括ICA中所使用的麥克風(fēng)。無論如何，這些麥克風(fēng)必須包括至少一個(gè)未在ICA 中使用的麥克風(fēng)。注意，根據(jù)現(xiàn)有技術(shù)的處理方法對(duì)應(yīng)于X' ( ，t)的元素僅由ICA中所使用的麥克風(fēng)組成的情況。當(dāng)在ICA中使用定向麥克風(fēng)時(shí)，將定向麥克風(fēng)的輸出看作包括于“ICA中使用的麥克風(fēng)”中，而組成定向麥克風(fēng)的聲音采集裝置每一個(gè)均可以作為“未在ICA中使用的麥克風(fēng)”來處理。例如，當(dāng)在ICA中利用以上參考圖3所述的定向麥克風(fēng)300時(shí)，將定向麥克風(fēng) 300的輸出306看作(轉(zhuǎn)換到時(shí)頻域的)觀測(cè)信號(hào)X( ，t)的一個(gè)元素，而可以將聲音采集裝置301和302所單獨(dú)觀測(cè)到的信號(hào)每一個(gè)均用作“ICA中未使用的麥克風(fēng)”的觀測(cè)信號(hào) X' k(w，t)。用Yk[i]( ，t)表示將分離結(jié)果Yk( ，t)投射返回“未在ICA中使用的麥克風(fēng)”(在下文中稱為“麥克風(fēng)i”)的結(jié)果，即投射返回結(jié)果(投射返回信號(hào))。麥克風(fēng)i的觀測(cè)信號(hào) 是X'和“)。通過將ICA的分離結(jié)果(分離信號(hào))Yk( ，t)投射返回麥克風(fēng)i而獲得的投射返回結(jié)果(投射返回信號(hào))Yk[i]( ，t)可以通過如下過程來計(jì)算。令Pjk( )是ICA的分離結(jié)果Yk( ，t)到麥克風(fēng)i的投射返回的系數(shù)，可以由前述公式[7.2]表示投射返回。系數(shù)Pjk( )可以用最小二乘逼近來確定。更具體而言，在準(zhǔn) 備了表示對(duì)于麥克風(fēng)i的分離結(jié)果的相應(yīng)投射返回結(jié)果之總和的信號(hào)(公式[7. 3])之后，可以確定系數(shù)，以便使所準(zhǔn)備信號(hào)與每個(gè)麥克風(fēng)i的觀測(cè)信號(hào)之間的均方誤差(公式[7. 4])最小。在源分離處理中，如上所述，通過對(duì)觀測(cè)信號(hào)(其通過將用于源分離的麥克風(fēng)觀測(cè)到的信號(hào)轉(zhuǎn)換到時(shí)頻域而獲得)執(zhí)行ICA(獨(dú)立分量分析)來產(chǎn)生時(shí)頻域中對(duì)應(yīng)于各個(gè) 聲音源的分離信號(hào)。在信號(hào)投射返回處理中，通過將由此產(chǎn)生的時(shí)頻域中的分離信號(hào)乘以相應(yīng)的投射返回系數(shù)來計(jì)算與各個(gè)聲音源對(duì)應(yīng)的投射返回信號(hào)。計(jì)算投射返回系數(shù)PA( )，作為使對(duì)應(yīng)于各個(gè)聲音源的投射返回信號(hào)之總和與投射返回目標(biāo)麥克風(fēng)的各個(gè)觀測(cè)信號(hào)之間的誤差最小的投射返回系數(shù)。例如，可以將最小二乘逼近應(yīng)用于計(jì)算投射返回系數(shù)的處理。因此，準(zhǔn)備了表示對(duì)于麥克風(fēng)i的分離結(jié)果的相應(yīng)投射返回結(jié)果之總和的信號(hào)(公式[7. 3])，并且確定hk( )，以便所準(zhǔn)備信號(hào)與每一個(gè) 麥克風(fēng)i的觀測(cè)信號(hào)之間的均方誤差(公式[7.4])最小?？梢酝ㄟ^將分離信號(hào)乘以確定的投射返回系數(shù)來計(jì)算投射返回結(jié)果(投射返回信號(hào))。下面將描述實(shí)際處理的細(xì)節(jié)。令P( )是由投射返回系數(shù)組成的矩陣(公式 [7. 5])?？梢曰诠絒7. 6]來計(jì)算P( )。可替代地，也可以使用通過利用公式[3. 1]的上述關(guān)系而修改的公式[7. 7]。一旦確定Pjk( )，則可以通過使用公式[7.2]來計(jì)算投射返回結(jié)果。可替代地，也可以代替地使用公式[7. 8]或[7. 9]。公式[7. 8]表示用于將一個(gè)聲道的分離結(jié)果投射到每一個(gè)麥克風(fēng)的公式。公式[7. 9]表示用于將各個(gè)分離結(jié)果投射到特定麥克風(fēng)的公式。通過準(zhǔn)備反映投射返回系數(shù)的新分離矩陣W[k] ( )，公式[7.9]也可以重寫為公式[7. 11]或[7. 10]。換言之，投射返回之后的分離結(jié)果Y' (co, t)也可以直接從觀測(cè)信號(hào)X ( ，t)產(chǎn)生，而不產(chǎn)生投射返回之前的分離結(jié)果Y ( ，t)。
如果在公式[7. 7]中假設(shè)X' ( ，t) =乂(《，0，8卩，如果僅對(duì)于扣々中使用的麥克風(fēng)執(zhí)行投射返回，則P( )與W(co)-1相同。因此，根據(jù)現(xiàn)有技術(shù)的投射返回SIM0對(duì)應(yīng)于在本發(fā)明實(shí)施例中所使用的方法的特殊情況。ICA和投射返回中所使用的各麥克風(fēng)之間的最大距離依賴于聲波可以在與短時(shí)傅立葉變換的一幀對(duì)應(yīng)的持續(xù)期間內(nèi)最大限度地移動(dòng)的距離。當(dāng)使用512點(diǎn)的幀，將通過以 16kHz采樣所獲得的觀測(cè)信號(hào)經(jīng)歷短時(shí)傅立葉變換時(shí)，一幀由如下給出512/16000 = 0. 032 秒假設(shè)聲速=340 [m/s]，聲音在該時(shí)間032秒]中大約移動(dòng)10 [m]。因此，通過使用根據(jù)本發(fā)明實(shí)施例的方法，可以對(duì)距離適于ICA的麥克風(fēng)大約10[m]的麥克風(fēng)執(zhí)行投射返回。盡管也可以通過使用公式[7.6]或[7.7]來計(jì)算投射返回系數(shù)矩陣P( )(公式 [7. 5])，但是由于公式[7. 6]和[7. 7]每一個(gè)均包括逆矩陣，因此公式[7. 6]或[7. 7]的使用增大了計(jì)算成本。為了降低計(jì)算成本，可以通過使用如下的公式[8. 1]或[8.2]來計(jì)算投射返回系數(shù)矩陣P( )。P(co) = <X ‘ (co, t)Y( , t) H>tdiag | ( , t) |2>t, ...，<|Yn( ，
t) I2),)"1......[8.1]= <X' (o, t)X(o, t)H>ff(o)Hdiag(ff(o)<X(o, t)X(o, t)H>tff(o)H)^......[8.2]P( )=<X' ( ，t)Y(w，t)H>t......[8.3]= <X' (o, t)X(o, t)H>ff(o)Ht......[8.4]后面將在[8.根據(jù)本發(fā)明其他實(shí)施例的信號(hào)處理設(shè)備]中詳細(xì)描述使用公式 [8.1]到[8.4]所執(zhí)行的處理。[3.對(duì)于與適于ICA的麥克風(fēng)不同的麥克風(fēng)的投射返回處理的處理示例(第一實(shí) 施例)]下面將參照?qǐng)D7到圖10描述本發(fā)明的第一實(shí)施例。第一實(shí)施例旨在執(zhí)行對(duì)于與適于ICA的麥克風(fēng)不同的麥克風(fēng)的投射返回這一處理。圖7是圖示根據(jù)本發(fā)明第一實(shí)施例的信號(hào)處理設(shè)備的配置的框圖。在圖7中所示的信號(hào)處理設(shè)備700中，采用定向麥克風(fēng)作為用在基于ICA(獨(dú)立分量分析)的源分離處理中的麥克風(fēng)。因此，信號(hào)處理設(shè)備700通過使用定向麥克風(fēng)所觀測(cè)到的信號(hào)執(zhí)行源分離處理，并進(jìn)一步執(zhí)行將源分離處理的結(jié)果投射返回一個(gè)或多個(gè)全向麥克風(fēng)這一處理。本實(shí)施例中使用的麥克風(fēng)包括多個(gè)定向麥克風(fēng)701，其用于為源分離處理提供輸入；以及一個(gè)或多個(gè)全向麥克風(fēng)702，其用作投射返回目標(biāo)。下面將描述這些麥克風(fēng)的排列。麥克風(fēng)701和702連接到相應(yīng)的AD轉(zhuǎn)換和STFT模塊703 (703al到703an和703b 1到 703bm)，其每一個(gè)均執(zhí)行采樣(模數(shù)轉(zhuǎn)換)和短時(shí)傅立葉變換(STFT)。由于相應(yīng)麥克風(fēng)所觀測(cè)到的各信號(hào)之間的相位差在執(zhí)行信號(hào)的投射返回時(shí)具有重要意義，因此在AD轉(zhuǎn)換和STFT模塊703中執(zhí)行的AD轉(zhuǎn)換使得以公共時(shí)鐘進(jìn)行的采樣成為必要。為此，時(shí)鐘供應(yīng)模塊704產(chǎn)生時(shí)鐘信號(hào)，并將產(chǎn)生的時(shí)鐘信號(hào)應(yīng)用于AD轉(zhuǎn)換和 STFT模塊703，其每一個(gè)均執(zhí)行來自對(duì)應(yīng)麥克風(fēng)的輸入信號(hào)的處理，以便AD轉(zhuǎn)換和STFT模塊703中執(zhí)行的采樣處理彼此同步。在每一個(gè)AD轉(zhuǎn)換和STFT模塊703中已經(jīng)經(jīng)歷了短時(shí) 傅立葉變換(STFT)的信號(hào)被提供為頻域中的信號(hào)(即，譜圖)。因此，將用于接收源分離處理中所使用的語音信號(hào)的多個(gè)定向麥克風(fēng)701的觀測(cè) 信號(hào)分別輸入到AD轉(zhuǎn)換和STFT模塊703al到703an。AD轉(zhuǎn)換和STFT模塊703al到703an 根據(jù)輸入信號(hào)產(chǎn)生觀測(cè)信號(hào)譜圖，并將產(chǎn)生的譜圖應(yīng)用于源分離模塊705。源分離模塊705通過使用ICA技術(shù)，從定向麥克風(fēng)獲得的觀測(cè)信號(hào)譜圖中產(chǎn)生分別與聲音源對(duì)應(yīng)的分離結(jié)果譜圖以及用于產(chǎn)生那些分離結(jié)果的分離矩陣。后面將詳細(xì)描述該源分離處理。該階段中的分離結(jié)果是投射返回一個(gè)或多個(gè)全向麥克風(fēng)之前的信號(hào)。另一方面，將用作投射返回目標(biāo)的一個(gè)或多個(gè)全向麥克風(fēng)702的觀測(cè)信號(hào)分別輸入到AD轉(zhuǎn)換和STFT模塊703b 1到703bm。AD轉(zhuǎn)換和STFT模塊703b 1到703bm根據(jù)輸入信號(hào)產(chǎn)生觀測(cè)信號(hào)譜圖，并將產(chǎn)生的譜圖應(yīng)用于信號(hào)投射返回模塊706。通過使用源分離模塊705所產(chǎn)生的分離結(jié)果(或觀測(cè)信號(hào)和分離矩陣)以及與投射返回目標(biāo)麥克風(fēng)702對(duì)應(yīng)的觀測(cè)信號(hào)，信號(hào)投射返回模塊706將分離結(jié)果投射到全向麥克風(fēng)702。后面將詳細(xì)描述該投射返回處理。如果需要的話，將投射返回之后的分離結(jié)果發(fā)送到執(zhí)行后端處理的后端處理模塊 707，或從裝置(如揚(yáng)聲器)將其輸出。后端處理模塊707所執(zhí)行的后端處理例如是語音識(shí) 別處理。另一方面，當(dāng)從裝置(如擴(kuò)音器)輸出分離結(jié)果時(shí)，分離結(jié)果在逆FT和DA轉(zhuǎn)換模塊708中經(jīng)歷逆傅立葉變換(FT)和數(shù)模轉(zhuǎn)換，并且從輸出裝置709 (如擴(kuò)音器或耳機(jī))輸出所得到的時(shí)域中的模擬信號(hào)。上述處理模塊由控制模塊710控制。盡管在以下參照的框圖中省略了控制模塊，但在控制模塊的控制之下執(zhí)行后述處理。將參照?qǐng)D8描述圖7中所示信號(hào)處理設(shè)備700中的定向麥克風(fēng)701和全向麥克風(fēng) 702的示例性排列。圖8表示如下這樣的示例將ICA處理基于四個(gè)定向麥克風(fēng)801 (801a 到801d)的觀測(cè)信號(hào)所獲得的分離結(jié)果投射返回兩個(gè)全向麥克風(fēng)803 (803p和803q)。通過以基本上等于人耳之間的距離的間距排列兩個(gè)全向麥克風(fēng)803p和803q，基本上獲得作為雙聲道立體聲信號(hào)(即，由兩個(gè)耳朵觀測(cè)的聲音信號(hào))的源分離結(jié)果。定向麥克風(fēng)801(801a到801d)是如下這樣的四個(gè)定向麥克風(fēng)其被布置為使得當(dāng) 從上面觀看時(shí)，靈敏度高的方向802位于向上、向下、向左和向右。定向麥克風(fēng)可以是在與每一個(gè)箭頭的方向相反的方向上形成零點(diǎn)波束的類型中的每一個(gè)(例如，具有如圖4中所示這種指向性特性的麥克風(fēng))。除了定向麥克風(fēng)801之外，還準(zhǔn)備用作投射返回目標(biāo)的全向麥克風(fēng)803(803p和 803q)。全向麥克風(fēng)803的數(shù)量和位置管理投射返回結(jié)果的類型。如圖8中所示，當(dāng)用作投射返回目標(biāo)的全向麥克風(fēng)803 (803p和803q)基本上布置在與左右定向麥克風(fēng)801a和801c 的相應(yīng)前端相同的位置時(shí)，獲得幾乎與人耳剛好位于全向麥克風(fēng)803的位置處的情形等效的雙聲道立體聲信號(hào)。盡管圖8圖示了作為用作投射返回目標(biāo)的全向麥克風(fēng)的兩個(gè)麥克風(fēng)803p和803q，但是用作投射返回目標(biāo)的全向麥克風(fēng)的數(shù)量不限于2。如果僅僅想要獲得具有平坦頻率響應(yīng)的分離結(jié)果，則可以使用單個(gè)全向麥克風(fēng)。相反，用作投射返回目標(biāo)的全向麥克風(fēng)的數(shù)量可以大于用于源分離的麥克風(fēng)的數(shù)量。使用較大數(shù)量的投射返回目標(biāo)麥克風(fēng)的示例將在后面作為變型來描述。[4.通過使用多個(gè)全向麥克風(fēng)組成虛擬定向麥克風(fēng)的實(shí)施例(第二實(shí)施例)]雖然在圖7的信號(hào)處理設(shè)備700中，用于源分離的定向麥克風(fēng)701和用作投射返回目標(biāo)的全向麥克風(fēng)702彼此分離地設(shè)置，但是可以通過采用多個(gè)全向麥克風(fēng)組成虛擬定向麥克風(fēng)來實(shí)現(xiàn)麥克風(fēng)的共享。下面將參照?qǐng)D9和圖10描述這種配置。在下面的描述中，將全向麥克風(fēng)稱為“聲音采集裝置”，而將多個(gè)聲音采集裝置所形成的定向麥克風(fēng)稱為“(虛擬)定向麥克風(fēng)”。例如，在以上參照?qǐng)D3所述的定向麥克風(fēng)中，通過使用兩個(gè)聲音采集裝置來形成一個(gè)虛擬定向麥克風(fēng)。圖9中所示的信號(hào)處理設(shè)備900表示使用多個(gè)聲音采集裝置的情況。將聲音采集裝置分組為用于投射返回的聲音采集裝置902和不用于投射返回而僅用于源分離的聲音采集裝置901。雖然圖9中所示的信號(hào)處理設(shè)備900還包括用于控制各種處理模塊的控制模塊(如圖7中所示的設(shè)備700中那樣)，但是圖9中省略控制模塊。通過AD轉(zhuǎn)換和STFT模塊903 (903al到903an以及903bl到903bm)分別將聲音采集裝置901和902所觀測(cè)到的信號(hào)轉(zhuǎn)換為時(shí)頻域中的信號(hào)。如以上參照?qǐng)D7所述配置中那樣，由于相應(yīng)麥克風(fēng)所觀測(cè)到的各信號(hào)之間的相位差在執(zhí)行信號(hào)的投射返回時(shí)具有重要意義，因此AD轉(zhuǎn)換和STFT模塊903中所執(zhí)行的AD轉(zhuǎn)換使得以公共時(shí)鐘進(jìn)行采樣成為必要。為此，時(shí)鐘供應(yīng)模塊904產(chǎn)生時(shí)鐘信號(hào)，并將產(chǎn)生的時(shí)鐘信號(hào)應(yīng)用于AD轉(zhuǎn)換和STFT模塊903，其每一個(gè)均執(zhí)行來自對(duì)應(yīng)麥克風(fēng)的輸入信號(hào)的處理，以便AD轉(zhuǎn)換和STFT模塊903 中執(zhí)行的采樣處理彼此同步。每一個(gè)AD轉(zhuǎn)換和STFT模塊903中已經(jīng)經(jīng)歷了短時(shí)傅立葉變換(STFT)的信號(hào)被提供為頻域中的信號(hào)(即，譜圖)。AD轉(zhuǎn)換和STFT模塊903 (903al到903an以及903bl到903bm)所產(chǎn)生的、由聲音采集裝置901的觀測(cè)信號(hào)(即，經(jīng)歷了 STFT之后的時(shí)頻域中的信號(hào))組成的矢量被假設(shè)為 0( ，t)911。在指向性形成模塊905中，將聲音采集裝置901的觀測(cè)信號(hào)轉(zhuǎn)換為要由多個(gè) 虛擬定向麥克風(fēng)觀測(cè)的信號(hào)。后面將描述轉(zhuǎn)換的細(xì)節(jié)。假設(shè)轉(zhuǎn)換結(jié)果組成的矢量為X( ， t)912。源分離模塊906從與虛擬定向麥克風(fēng)對(duì)應(yīng)的觀測(cè)信號(hào)中產(chǎn)生分別與各聲音源對(duì)應(yīng) 的(投射返回之前的)分離結(jié)果和分離矩陣。將用于源分離且進(jìn)一步經(jīng)歷投射返回的、聲音采集裝置902的觀測(cè)信號(hào)從AD轉(zhuǎn)換和STFT模塊903 (903b 1到903bm)發(fā)送到信號(hào)投射返回模塊907。由X' ( ，t)913表示聲音采集裝置902的觀測(cè)信號(hào)所組成的矢量。信號(hào)投射返回模塊907通過使用來自源分離模塊906的分離結(jié)果(或觀測(cè)信號(hào)X( ，t)912和分離矩陣)以及來自用作投射返回目標(biāo) 的聲音采集裝置902的觀測(cè)信號(hào)X' (co, t) 913，執(zhí)行分離結(jié)果的投射返回。信號(hào)投射返回模塊907、后端處理模塊908、逆FT和DA轉(zhuǎn)換模塊909和輸出裝置 910的相應(yīng)處理和配置與以上參照?qǐng)D7所述的那些相同，因此省略其描述。下面將參照?qǐng)D10，描述與信號(hào)處理設(shè)備900的配置(圖9中所示)對(duì)應(yīng)的麥克風(fēng) 排列的示例以及形成麥克風(fēng)指向性的方法。在圖10所示的麥克風(fēng)排列中，以交叉樣式排列五個(gè)聲音采集裝置(即，聲音采集裝置1 (由1001表示)到聲音采集裝置5 (由1005表示))。所有這些聲音采集裝置1到5 與用于圖9中的信號(hào)處理設(shè)備900中的源分離處理的聲音采集裝置對(duì)應(yīng)。此外，聲音采集裝置2 (1002)和聲音采集裝置5 (1005)對(duì)應(yīng)于不僅用于源分離處理而且還作為投射返回目
23標(biāo)的聲音采集裝置(即，圖9中所示的聲音采集裝置902)。圍繞位于中心的聲音采集裝置3(1003)的四個(gè)聲音采集裝置在通過聲音采集裝置3(1003)配對(duì)使用時(shí)形成了在相應(yīng)方向上的指向性。例如，通過使用聲音采集裝置 1(1001)和聲音采集裝置3 (1003)形成如圖10中看到的那樣、具有向上指向性(即，在向下方向上形成零點(diǎn)波束)的虛擬定向麥克風(fēng)1(1006)。因此，通過使用五個(gè)聲音采集裝置 1(1001)到5(1005)產(chǎn)生與四個(gè)虛擬定向麥克風(fēng)1(1006)到4(1009)所觀測(cè)到的信號(hào)等效的觀測(cè)信號(hào)。下面將描述形成指向性的方法。進(jìn)一步，聲音采集裝置2(1002)和聲音采集裝置5 (1005)用作作為投射返回目標(biāo) 1和2的麥克風(fēng)。這兩個(gè)聲音采集裝置對(duì)應(yīng)于圖9中的聲音采集裝置902?，F(xiàn)在將參照下面的公式[9. 1]到[9. 4]描述圖10中所示的、從五個(gè)聲音采集裝置 1(1001)到5(1005)形成四個(gè)指向性的方法。
其中j 虛數(shù)單元co 頻率窗口的索引(1到M)M:頻率窗口的總數(shù)dki 聲音采集裝置k和i之間的距離F 采樣頻率C:聲速
.[9.4]令Ojc^t)到05( ，t)是來自聲音采集裝置的相應(yīng)觀測(cè)信號(hào)(在時(shí)頻域中)，并且0( ，t)是包括那些觀測(cè)信號(hào)作為元素的矢量(公式[9. 1])。通過使用與以上參照?qǐng)D3所述的方法類似的方法，可以從一對(duì)聲音采集裝置形成指向性。通過將成對(duì)的聲音采集裝置之一的觀測(cè)信號(hào)乘以公式[9.3]所表示的D( ，dki) 來表示時(shí)頻域中的延遲。結(jié)果，可以由公式[9.2]表示四個(gè)虛擬定向麥克風(fēng)所觀測(cè)到的信號(hào) X( ，t)。將成對(duì)的聲音采集裝置之一的觀測(cè)信號(hào)乘以公式[9. 3]所表示的D( ，dki)的處理對(duì)應(yīng)于根據(jù)成對(duì)的聲音采集裝置之間的距離來延遲相位的處理。因此，可以計(jì)算以上參照?qǐng)D3所述的、與定向麥克風(fēng)300的輸出類似的輸出。圖9中所示的信號(hào)處理設(shè)備900的指向性形成模塊905將由此產(chǎn)生的信號(hào)輸出到源分離模塊906。投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)所組成的矢量X' (co, t)可以由公式[9.4]表示，這是因?yàn)樗鼈儽惶峁槁曇舨杉b置2 (1001)和聲音采集裝置5 (1005)的觀測(cè)信號(hào)。一旦獲得了 X( ，t)和X' ( ，t)，就可以以與使用用于源分離和投射返回的分離麥克風(fēng)的情況類似的方式、通過使用上述公式[7.1]到[7. 11]、基于X( ，t)和X' ( ，t)執(zhí)行投射返回。[5.以組合的方式執(zhí)行源分離處理的分離結(jié)果的投射返回處理和D0A估計(jì)或源位置估計(jì)的處理示例(第三實(shí)施例)]下面將參照?qǐng)D11到圖13描述本發(fā)明的第三實(shí)施例。第三實(shí)施例表示源分離處理中分離結(jié)果的投射返回與D0A估計(jì)或源位置估計(jì)之間的組合處理的示例。將參照?qǐng)D11描述根據(jù)第三實(shí)施例的信號(hào)處理設(shè)備1100的示例性配置。圖11中所示的信號(hào)處理設(shè)備1100還包括(如以上參照?qǐng)D7到圖9所述的信號(hào)處理設(shè)備中那樣) 兩種類型的麥克風(fēng)，即用于源分離的源分離麥克風(fēng)1101和僅用于投射返回的投射返回目標(biāo)麥克風(fēng)1102。后面將描述這些麥克風(fēng)的安裝位置的細(xì)節(jié)。雖然圖11中所示的信號(hào)處理設(shè)備1100還包括用于控制各種處理模塊的控制模塊(如圖7中所示的設(shè)備700中那樣)，但是在圖11中省略了控制模塊。盡管用于源分離的一部分或所有源分離麥克風(fēng)1101也可以用作投射返回目標(biāo)麥克風(fēng)，但是準(zhǔn)備不用于源分離的至少一個(gè)麥克風(fēng)來專用于投射返回目標(biāo)。AD轉(zhuǎn)換和STFT模塊1103和時(shí)鐘供應(yīng)模塊1104的功能與已經(jīng)在上文中參照?qǐng)D7 和圖9描述的AD轉(zhuǎn)換和STFT模塊和時(shí)鐘供應(yīng)模塊的功能相同。源分離模塊1105和信號(hào)投射返回模塊1106的功能也與已經(jīng)在上文中參照?qǐng)D7和圖9描述的源分離模塊和信號(hào)投射返回模塊的功能相同。然而，除了專用于投射返回目標(biāo) 的麥克風(fēng)1102所觀測(cè)到的觀測(cè)信號(hào)之外，輸入到信號(hào)投射返回模塊1106的觀測(cè)信號(hào)還包括不僅用于源分離而且還作為投射返回目標(biāo)的一個(gè)或多個(gè)麥克風(fēng)1101的觀測(cè)信號(hào)。(后面將描述實(shí)際示例。)通過使用信號(hào)投射返回模塊的處理結(jié)果，D0A(或源位置)估計(jì)模塊1108估計(jì)與各個(gè)聲音源對(duì)應(yīng)的方向或位置。后面將描述估計(jì)處理的細(xì)節(jié)。作為估計(jì)處理的結(jié)果，獲得 D0A或源位置1109。信號(hào)合并模塊1110是可選的。信號(hào)合并模塊1110將D0A (或源位置)1109和在投射返回模塊1106中獲得的投射返回結(jié)果1107彼此合并，因此產(chǎn)生源與源到達(dá)的方向(或位置)之間的對(duì)應(yīng)性。下面將參照?qǐng)D12，描述圖11中所示的信號(hào)處理設(shè)備1100中的麥克風(fēng)排列，即，在信號(hào)處理設(shè)備1100中適于以組合方式執(zhí)行將源分離所獲得的分離結(jié)果進(jìn)行投射返回這一處理和執(zhí)行D0A估計(jì)或源位置估計(jì)這一處理的麥克風(fēng)排列。必須將麥克風(fēng)排列設(shè)置為能夠執(zhí)行D0A估計(jì)或源位置估計(jì)。實(shí)際上，將麥克風(fēng)排列設(shè)置為能夠基于以上參照?qǐng)D6所述的三角測(cè)量原理來估計(jì)源位置。圖12圖示了八個(gè)麥克風(fēng)1 (由1201表示)到8 (由1208表示)。麥克風(fēng)1 (1201) 和麥克風(fēng)2 (1202)僅用于源分離處理。將麥克風(fēng)5 (1205)到8 (1208)設(shè)置為投射返回目標(biāo)并且僅用于位置估計(jì)處理。剩余的麥克風(fēng)3 (1203)和麥克風(fēng)4 (1204)用于源分離處理和位置估計(jì)處理二者。以另一方式說明，通過使用四個(gè)麥克風(fēng)1(1201)到4(1204)的觀測(cè)信號(hào)來執(zhí)行源分離，并且將分離結(jié)果投射返回麥克風(fēng)5 (1205)到8 (1208)。假設(shè)麥克風(fēng)1(1201)到8 (1208)的相應(yīng)觀測(cè)信號(hào)分別是( ，t)到08( ，t)，貝丨J 用于源分離的觀測(cè)信號(hào)x( ，t)可以由下面的公式[10. 2]表示。此外，用于投射返回的觀測(cè)信號(hào)可以由下面的公式[10.3]表示。一旦獲得了 X( ，t)和X' ( ，t)，就可以以與使用用于源分離和投射返回的分離的麥克風(fēng)的情況類似的方式、通過使用上述公式[7. 1]到 [7. 11]、基于X( ，t)和X' ( ，t)來執(zhí)行投射返回。
‘ -[10.1] 0((D, 例如，在圖12所示的麥克風(fēng)排列中設(shè)置了三個(gè)麥克風(fēng)對(duì)(S卩，麥克風(fēng)對(duì)1(由1212 表示)、麥克風(fēng)對(duì)2 (由1213表示)和麥克風(fēng)對(duì)3 (由1214表示))。通過對(duì)于組成每一個(gè) 麥克風(fēng)對(duì)的麥克風(fēng)使用投射返回之后的源分離結(jié)果(即投射返回結(jié)果)，可以根據(jù)以上參照?qǐng)D5所述的處理來確定D0A (角度)。換言之，麥克風(fēng)對(duì)每一個(gè)均由兩個(gè)相鄰的麥克風(fēng)組成，并且針對(duì)每一個(gè)麥克風(fēng)對(duì) 確定DOA。D0A (或源位置)估計(jì)模塊1108 (圖11中所示)接收在信號(hào)投射返回模塊106中產(chǎn)生的投射返回信號(hào)，并執(zhí)行基于來自多個(gè)投射返回目標(biāo)麥克風(fēng)(其位于不同的位置)的各投射返回信號(hào)之間的相位差計(jì)算D0A的處理。如上所述，通過獲得作為投射返回結(jié)果的Yk[i] ( ，t)與Yk[i' ]( ，t)之間的相位差來確定DOA 0
之間(即，各投射返回結(jié)果之間)的關(guān)系由上述公式[5. 1]表示。用于計(jì)算相位差的公式由上述公式[5. 2]和[5. 3]表示。進(jìn)一步，D0A(或源位置)估計(jì)模塊1108基于關(guān)于D0A的組合數(shù)據(jù)(其根據(jù)位于多個(gè)不同位置的投射返回目標(biāo)麥克風(fēng)的投射返回信號(hào)來計(jì)算)計(jì)算源位置。這種處理對(duì)應(yīng) 于如以上參照?qǐng)D6所述的、以類似的方式基于三角測(cè)量原理來指定源位置的處理。利用圖12中所示的設(shè)置，可以針對(duì)三個(gè)麥克風(fēng)對(duì)(即，麥克風(fēng)對(duì)1(1212)、麥克風(fēng)對(duì)2 (1213)和麥克風(fēng)對(duì)3 (1214))中每一個(gè)確定D0A(角度0)。接著，如以上參照?qǐng)D6所述的那樣，設(shè)置具有位于每一對(duì)的麥克風(fēng)之間的中點(diǎn)的頂點(diǎn)并且具有其一半表示D0A( 0 )的頂角的圓錐體。在圖12的示例中，與三個(gè)麥克風(fēng)對(duì)對(duì)應(yīng)地設(shè)置三個(gè)圓錐體。這三個(gè)圓錐體的交叉點(diǎn)可以被確定為源位置。圖13圖示了圖11中所示的信號(hào)處理設(shè)備(即，用于執(zhí)行源分離處理、投射返回處理和D0A或源位置估計(jì)處理的信號(hào)處理設(shè)備)中的麥克風(fēng)排列的另一示例。圖13的麥克風(fēng)排列要解決關(guān)于“改變其位置的麥克風(fēng)”的上述現(xiàn)有技術(shù)中的問題。將麥克風(fēng)1302和1304放置在電視1301和用戶所操作的遙控器1303上。遙控器 1303上的麥克風(fēng)1304用于源操作。電視1301上的麥克風(fēng)1302用作投射返回目標(biāo)。利用放置在遙控器1303上的麥克風(fēng)1304，可以在說話的用戶附近的位置處采集聲音。然而，遙控器1303上的麥克風(fēng)的精確位置是未知的。另一方面，放置在電視1301的框架上的麥克風(fēng)1302每一個(gè)有關(guān)其關(guān)于電視外殼上的一點(diǎn)(如，屏幕中心)的位置是已知的。然而，麥克風(fēng)1302可能遠(yuǎn)離用戶。因此，通過基于遙控器1303上的麥克風(fēng)1304的觀測(cè)信號(hào)執(zhí)行源分離并將分離結(jié) 果投射返回電視1301上的麥克風(fēng)1302，可以獲得具有兩種麥克風(fēng)的相應(yīng)優(yōu)點(diǎn)的分離結(jié)果。在估計(jì)D0A或源位置時(shí)采用對(duì)于電視1301上麥克風(fēng)1302的投射返回的結(jié)果。在實(shí)際中，假設(shè)具有遙控器的用戶的說話作為聲音源的情況，可以估計(jì)具有遙控器的用戶的位置和方向。盡管使用放置在遙控器1303上且位置未知的麥克風(fēng)1304，但是例如可以根據(jù)具有遙控器1303且說出語音命令的用戶位于電視1301的前面還是一側(cè)來改變電視的響應(yīng) (例如，使電視僅響應(yīng)于來自電視前面的說話)。[6.組成根據(jù)本發(fā)明實(shí)施例的信號(hào)處理設(shè)備的各模塊的示例性配置]下面將參照?qǐng)D14到圖16，描述源分離模塊和信號(hào)投射返回模塊(其對(duì)于根據(jù)各實(shí) 施例的信號(hào)處理設(shè)備是共同的)的配置和處理的細(xì)節(jié)。圖14圖示了源分離模塊的一個(gè)示例性配置?；旧?，源分離模塊包括緩沖器1402 到1406，用于存儲(chǔ)在基于上述公式[3. 1]到[3. 9](即，基于ICA的獲知規(guī)則)的計(jì)算中采用的變量和函數(shù)所對(duì)應(yīng)的數(shù)據(jù)。獲知計(jì)算模塊1401使用存儲(chǔ)的值執(zhí)行計(jì)算。觀測(cè)信號(hào)緩沖器1402表示用于存儲(chǔ)與預(yù)定持續(xù)期間對(duì)應(yīng)的時(shí)頻域中的觀測(cè)信號(hào) 的緩沖器區(qū)域，并且存儲(chǔ)與上述公式[3. 1]中X( ，t)對(duì)應(yīng)的數(shù)據(jù)。分離矩陣緩沖器1403和分離結(jié)果緩沖器1404表示用于存儲(chǔ)獲知期間的分離矩陣和分離結(jié)果的區(qū)域，并且分別存儲(chǔ)與公式[3.1]中的W( ，t)和Y( ，t)對(duì)應(yīng)的數(shù)據(jù)。同樣地，分?jǐn)?shù)函數(shù)緩沖器1405和分離矩陣校正值緩沖器1406分別存儲(chǔ)與公式 [3.2]中的CpW(Y(t))和Aff(co)對(duì)應(yīng)的數(shù)據(jù)。在圖14的配置中所準(zhǔn)備的各種緩沖器中，除了觀測(cè)信號(hào)緩沖器1402以外，在獲知循環(huán)有效的同時(shí)，存儲(chǔ)于這些緩沖器中的值不斷變化。圖15和圖16圖示了信號(hào)投射返回模塊的示例性配置。圖15圖示了當(dāng)計(jì)算投射返回系數(shù)矩陣P( )(參見公式[7.5])時(shí)，與使用上述公式[7.6]的情況對(duì)應(yīng)的配置，而圖16圖示了當(dāng)計(jì)算投射返回系數(shù)矩陣P( )(參見公式 [7.5])時(shí)，與使用上述公式[7.7]的情況對(duì)應(yīng)的配置。
首先描述信號(hào)投射返回模塊的示例性配置(圖15中所示)。圖15中圖示的信號(hào) 投射返回模塊包括與公式[7. 6]、[7. 8]和[7. 9]中表示的變量對(duì)應(yīng)的緩沖器1502到1507，并且計(jì)算模塊1501通過使用在這些緩沖器中存儲(chǔ)的值來執(zhí)行計(jì)算。投射返回前分離結(jié)果緩沖器1502表示用于存儲(chǔ)從源分離模塊輸出的分離結(jié)果的區(qū)域。不同于在圖14中所示的源分離模塊的分離結(jié)果緩沖器1504中存儲(chǔ)的分離結(jié)果，圖 15中所示的信號(hào)投射返回模塊的投射返回前分離結(jié)果緩沖器1502中存儲(chǔ)的分離結(jié)果是獲知結(jié)束之后的值。投射返回目標(biāo)觀測(cè)信號(hào)緩沖器1503是用于存儲(chǔ)投射返回目標(biāo)麥克風(fēng)所觀測(cè)到的信號(hào)的緩沖器。通過使用這兩個(gè)緩沖器1502和1503來計(jì)算公式[7. 6]中的兩個(gè)協(xié)方差矩陣。協(xié)方差矩陣緩沖器1504存儲(chǔ)投射返回之前的分離結(jié)果本身的協(xié)方差矩陣，即與公式[7.6]中的<Y( ，t)Y( ，t)H>t對(duì)應(yīng)的數(shù)據(jù)。另一方面，互協(xié)方差矩陣緩沖器1505存儲(chǔ)投射返回目標(biāo)觀測(cè)信號(hào)X' (co, t)和投射返回之前的分離結(jié)果Y( ，t)的協(xié)方差矩陣，即與公式[7.6]中的<X' (co，t)Y( ， t)H>t對(duì)應(yīng)的數(shù)據(jù)。這里，將不同變量之間的協(xié)方差矩陣稱為“互協(xié)方差矩陣”，而將相同變量之間的協(xié)方差矩陣簡(jiǎn)稱為“協(xié)方差矩陣”。投射返回系數(shù)緩沖器1506表示用于存儲(chǔ)基于公式[7.6]計(jì)算的投射返回系數(shù) P( )的區(qū)域。投射返回結(jié)果緩沖器1507存儲(chǔ)基于公式[7. 8]或[7. 9]計(jì)算的投射返回結(jié)果Yk[i] O，t)。關(guān)于D0A估計(jì)和源位置估計(jì)，一旦確定了投射返回系數(shù)，就可以計(jì)算D0A和源位置而不計(jì)算投射返回結(jié)果本身。因此，在以組合方式執(zhí)行D0A估計(jì)或源位置估計(jì)的一些本發(fā) 明實(shí)施例中可以省略投射返回結(jié)果緩沖器1507。接著，描述圖16中所示的信號(hào)投射返回模塊的示例性配置。圖16的配置與圖15 的配置不同之處在于使用了關(guān)系Y ( ，t) = W ( ) X ( ，t)(公式[2. 5])。因此，在前者中，省略了存儲(chǔ)分離結(jié)果Y( ，t)的緩沖器，而是準(zhǔn)備了存儲(chǔ)分離矩陣W( )的緩沖器。源分離觀測(cè)信號(hào)緩沖器1602表示存儲(chǔ)用于源分離的麥克風(fēng)的觀測(cè)信號(hào)的區(qū)域。該緩沖器1602可以與以上已經(jīng)參照?qǐng)D14所述的源分離模塊的觀測(cè)信號(hào)緩沖器1402共同地使用。分離矩陣緩沖器1603存儲(chǔ)通過源分離模塊中的獲知所獲得的分離矩陣。不同于以上已經(jīng)參照?qǐng)D14描述的源分離模塊的分離矩陣緩沖器1403，該緩沖器1603存儲(chǔ)獲知結(jié) 束之后的分離矩陣的相應(yīng)值。與以上參照?qǐng)D15所述的投射返回目標(biāo)觀測(cè)信號(hào)緩沖器1503類似，投射返回目標(biāo) 觀測(cè)信號(hào)緩沖器1604是用于存儲(chǔ)投射返回目標(biāo)麥克風(fēng)所觀測(cè)到的信號(hào)的緩沖器。通過使用這兩個(gè)緩沖器1603和1604來計(jì)算公式[7. 7]中的兩個(gè)協(xié)方差矩陣。協(xié)方差矩陣1605存儲(chǔ)用于源分離的分離結(jié)果本身的協(xié)方差矩陣，即與公式[7. 7] 中的〈X ( ，t) X ( ，t) H>t對(duì)應(yīng)的數(shù)據(jù)。另一方面，互協(xié)方差矩陣緩沖器1606存儲(chǔ)投射返回目標(biāo)觀測(cè)信號(hào)X' ( ，t)和用于源分離的分離結(jié)果X( ，t)的協(xié)方差矩陣，即與公式[7.7]中的<X' (co，t)X( ，t)H>t對(duì)應(yīng)的數(shù)據(jù)。投射返回系數(shù)緩沖器1607表示用于存儲(chǔ)基于公式[7.7]計(jì)算的投射返回系數(shù) P( )的區(qū)域。與以上參照?qǐng)D15描述的投射返回結(jié)果緩沖器1507類似，投射返回結(jié)果緩沖器 1608存儲(chǔ)基于公式[7. 8]或[7. 9]計(jì)算的投射返回結(jié)果Yk[i]( ，t)。[7.信號(hào)處理設(shè)備中執(zhí)行的處理序列]下面將參照?qǐng)D17到圖20的流程圖，描述根據(jù)本發(fā)明實(shí)施例的信號(hào)處理設(shè)備中執(zhí) 行的處理序列。圖17是說明當(dāng)通過采用基于由用于源分離的麥克風(fēng)獲得的數(shù)據(jù)的分離結(jié)果來執(zhí) 行用于投射返回目標(biāo)麥克風(fēng)的投射返回處理時(shí)的處理序列的流程圖。圖17的流程圖要說明的例如是在將來自定向麥克風(fēng)(或虛擬定向麥克風(fēng))的源分離結(jié)果投射返回全向麥克風(fēng) 的設(shè)備(與圖7中所示的信號(hào)處理設(shè)備700以及圖9中所示的信號(hào)處理設(shè)備900對(duì)應(yīng))中所執(zhí)行的處理。在步驟S101，對(duì)每一個(gè)麥克風(fēng)(或每一個(gè)聲音采集裝置)采集到的信號(hào)執(zhí)行AD轉(zhuǎn) 換。然后，在步驟S102，對(duì)每一個(gè)信號(hào)執(zhí)行短時(shí)傅立葉變換(STFT)，以轉(zhuǎn)換為時(shí)頻域中的信號(hào)。下一步驟S103中的指向性形成處理是在通過使用多個(gè)全向麥克風(fēng)形成虛擬指向性(如以上參照?qǐng)D10所述的那樣)的配置中所需的處理。例如，在如圖10中所示排列多個(gè) 全向麥克風(fēng)的配置中，根據(jù)上述公式[9. 1]到[9.4]產(chǎn)生虛擬定向麥克風(fēng)的觀測(cè)信號(hào)。在如圖8中所示那樣最初地(實(shí)際地)使用定向麥克風(fēng)的配置中，可以免除步驟S103中的指向性形成處理。在步驟S104的源分離處理中，通過將ICA應(yīng)用于時(shí)頻域中的觀測(cè)信號(hào)(其通過定向麥克風(fēng)獲得)而獲得獨(dú)立分離結(jié)果。后面將描述步驟S104中的源分離處理的細(xì)節(jié)。在步驟S105，執(zhí)行將步驟S104中獲得的分離結(jié)果投射返回預(yù)定麥克風(fēng)的處理。后面將描述步驟S 105中的投射返回處理的細(xì)節(jié)。在獲得了對(duì)于麥克風(fēng)的投射返回的結(jié)果之后，如果需要的話，執(zhí)行逆傅立葉變換等(步驟S106)和后端處理(步驟S107)。由此完成整個(gè)處理。下面將參照?qǐng)D18的流程圖，描述以組合方式執(zhí)行分離結(jié)果的投射返回和D0A估計(jì) (或源位置估計(jì))的設(shè)備(與圖11中所示的信號(hào)處理設(shè)備1100對(duì)應(yīng))中所執(zhí)行的處理序列。步驟S201、S202和S203中的處理分別與圖17流程中的步驟S101、S102和S104 的處理相同，因此省略這些步驟的描述。步驟S204中的投射返回處理是將分離結(jié)果投射到作為投射返回目標(biāo)的麥克風(fēng)的處理。在步驟S204的該處理中，與圖17流程中的步驟S105中的投射返回處理類似，執(zhí)行步驟S203中獲得的分離結(jié)果對(duì)于預(yù)定麥克風(fēng)的投射返回。盡管以上述處理序列執(zhí)行了投射返回處理，但是可以僅通過計(jì)算投射返回系數(shù) (即，上述公式[7. 6]、[7. 7]、[8.1]或[8. 2]中所表示的投射返回系數(shù)矩陣P( ))來省略分離結(jié)果的實(shí)際投射返回處理。步驟S205是基于已經(jīng)投射返回麥克風(fēng)的分離結(jié)果來計(jì)算D0A或源位置的處理。該
29步驟中執(zhí)行的計(jì)算方法本身類似于現(xiàn)有技術(shù)中使用的計(jì)算方法，因此下面簡(jiǎn)要地描述該計(jì)
算方法。假設(shè)關(guān)于兩個(gè)麥克風(fēng)i和i'針對(duì)第k個(gè)分離結(jié)果Yk( ，t)計(jì)算出的D0A(角度) 是ekii, (co)。這里，i和i'是分配給除了用于源分離的麥克風(fēng)之外，用作投射返回目標(biāo) 的麥克風(fēng)(或聲音采集裝置)的下標(biāo)?；谌缦鹿絒11. 1]計(jì)算角度(co)。
公式[11. 1]與“背景技術(shù)”中關(guān)于現(xiàn)有技術(shù)方法的上述公式[5. 3]相同。此外，通過采用上述公式[7.8]，可以直接從投射返回系數(shù)P( )的元素中計(jì)算出D0A(見公式 [11.2])，而不產(chǎn)生投射返回之后的分離結(jié)果Yk[i]( ，t)。在采用公式[11.2]的情況下，處理序列可包括這樣的步驟僅確定投射返回系數(shù)P(co)，而忽略投射返回步驟(S204)中執(zhí) 行的分離結(jié)果的投射返回。當(dāng)確定用于指示關(guān)于兩個(gè)麥克風(fēng)i和i'計(jì)算出的D0A的角度0kii, (co)時(shí)，還可以以頻率窗口(《)或麥克風(fēng)對(duì)(i和i'的每一對(duì))為單元計(jì)算各個(gè)角度9 kii, (co)，以獲得多個(gè)計(jì)算出的角度的平均值，并且基于該平均值確定最終的D0A。進(jìn)一步，如以上參照圖6所述的那樣，可以基于三角測(cè)量原理來確定源位置。在步驟S205的處理之后，如果需要的話，執(zhí)行后端處理(步驟S206)。另外，信號(hào)處理設(shè)備1100的D0A (或源位置)估計(jì)模塊1108 (圖11中所示)也可以通過使用公式[11.2]來計(jì)算D0A或源位置。以另一方式說明，D0A(或源位置)估計(jì)模塊1108可以接收在信號(hào)投射返回模塊1106中產(chǎn)生的投射返回系數(shù)，并執(zhí)行計(jì)算D0A或源位置的處理。在這種情況下，信號(hào)投射返回模塊1106執(zhí)行僅計(jì)算投射返回系數(shù)的處理，而忽略獲得投射返回結(jié)果(即，投射返回信號(hào))的處理。下面參照?qǐng)D19中所示的流程圖，描述在圖17中所示流程的步驟S104和在圖18 中所示流程的步驟S203中執(zhí)行的源分離處理的細(xì)節(jié)。源分離處理是將包括來自多個(gè)聲音源的信號(hào)的混合信號(hào)分離到每一聲音源的各個(gè)信號(hào)的處理?？梢酝ㄟ^使用各種算法來執(zhí)行源分離處理。下面將描述使用日本待審專利申請(qǐng)公開No. 2006-238409中所公開的方法的處理示例。在下面描述的源分離處理中，通過批處理(即，在存儲(chǔ)觀測(cè)信號(hào)特定時(shí)間之后執(zhí) 行源分離的處理)來確定分離矩陣。如以上結(jié)合公式[2. 5]等所述的那樣，分離矩陣W( )、觀測(cè)信號(hào)X( ，t)和分離結(jié)果Y( ，t)之間的關(guān)系由如下公式表示Y(w , t) = ff(o)X(w , t)參照?qǐng)D19中所示的流程圖描述源分離處理的序列。在第一步驟S301，在特定時(shí)間內(nèi)存儲(chǔ)觀測(cè)信號(hào)。這里，觀測(cè)信號(hào)是在對(duì)源分離麥克風(fēng)所采集的信號(hào)執(zhí)行短時(shí)傅立葉變換處理之后而獲得的信號(hào)。此外，在特定時(shí)間內(nèi)存儲(chǔ)的觀測(cè)信號(hào)等效于特定數(shù)量的連續(xù)幀(如，200個(gè)幀)所組成的譜圖。下面描述中提到的“對(duì) 于全部幀的處理”意味著對(duì)于步驟S301中存儲(chǔ)的觀測(cè)信號(hào)的所有幀的處理。在進(jìn)入步驟S304到S309的獲知循環(huán)之前，如果需要的話，對(duì)步驟S302中的累積觀測(cè)信號(hào)執(zhí)行包括歸一化、預(yù)白化(去相關(guān))等在內(nèi)的處理。例如，通過確定在各幀上觀測(cè) 信號(hào)Xk ( ，t)的標(biāo)準(zhǔn)偏差、獲得標(biāo)準(zhǔn)偏差的倒數(shù)所組成的對(duì)角矩陣S ( )，并按照如下那樣計(jì)算Z( ，t)來執(zhí)行歸一化Z(w，t) = S(w)X(w，t)在預(yù)白化中，確定Z ( ，t)和S ( )以使得Z(w，t) = S(w)X(w，t)以及<Z(co, t)Z(co, t)H>t = 1(1 單位矩陣)在以上公式中，t是幀索引，而< >t表示所有幀或樣本幀的平均。假設(shè)可以以上述預(yù)處理中所計(jì)算出的Z(t)和Z( ，t)來代替下面描述和公式中的 X(t)和 x( ，t)。在步驟S302中的預(yù)處理之后，在步驟S303將初始值代入分離矩陣W。初始值可以是單位矩陣。如果存在先前獲知中所確定的值，則可以將該確定的值用作當(dāng)前獲知的初始值。步驟S304到S309表示重復(fù)這些步驟直到分離矩陣W收斂為止的獲知循環(huán)。步驟 S304中的收斂確定處理將要確定分離矩陣W是否已經(jīng)收斂。例如，可以將收斂確定處理實(shí) 踐為如下的方法獲得分離矩陣W的增量AW與零矩陣之間的相似度，并且如果相似度小于預(yù)定值則確定分離矩陣W已經(jīng)“收斂”。作為替代，可以通過預(yù)先針對(duì)獲知循環(huán)設(shè)置最大重復(fù)次數(shù)(例如，50)，并且當(dāng)循環(huán)重復(fù)達(dá)到最大次數(shù)時(shí)確定分離矩陣W已經(jīng)“收斂”來實(shí)踐收斂確定處理。如果分離矩陣W還未收斂(或者如果循環(huán)重復(fù)的次數(shù)未達(dá)到預(yù)定值)，則進(jìn)一步重復(fù)地執(zhí)行步驟S304到S309的獲知循環(huán)。因此，獲知循環(huán)是如下這樣的處理重復(fù)地執(zhí)行基于上述公式[3. 1]到[3.3]的計(jì)算，直到分離矩陣W收斂為止。在步驟S305，通過使用上述公式[3. 12]獲得所有幀的分離結(jié)果Y (t)。步驟S306到S309對(duì)應(yīng)于關(guān)于頻率窗口《的循環(huán)。在步驟S307，基于公式[3.2]計(jì)算A W( ) ( S卩，分離矩陣的校正值)，并且在步驟 S308，基于公式[3.3]更新分離矩陣W( )。對(duì)于所有頻率窗口執(zhí)行這兩個(gè)處理。另一方面，如果在步驟S304確定分離矩陣W已經(jīng)收斂，則流程前進(jìn)到步驟S310的后端處理。在步驟S310的后端處理中，使分離矩陣W對(duì)應(yīng)于歸一化(或預(yù)白化)之前的觀測(cè)信號(hào)。以另一方式說明，當(dāng)已經(jīng)在步驟S302執(zhí)行了歸一化或預(yù)白化時(shí)，通過步驟S304到 S309獲得的分離矩陣W將要分離Z (t)(即，歸一化(或預(yù)白化)之后的觀測(cè)信號(hào))，而不分離x(t)(g卩，歸一化(或預(yù)白化)之前的觀測(cè)信號(hào))。于是，執(zhí)行W — SW的校正，以便使分離矩陣W對(duì)應(yīng)于預(yù)處理之前的觀測(cè)信號(hào)(X)。投射返回處理中使用的分離矩陣是在這種校正之后所獲得的分離矩陣。在時(shí)頻域中用于ICA的許多算法使得獲知之后的改變尺度(即，將分離結(jié)果的尺度調(diào)整到各個(gè)頻率窗口中合適的一些)成為必要。然而，在本發(fā)明實(shí)施例的配置中，由于在通過使用分離結(jié)果所執(zhí)行的投射返回處理中執(zhí)行針對(duì)分離結(jié)果的改變尺度處理，因此源分離處理期間的改變尺度不是必須的。除了在上面引用的日本待審專利申請(qǐng)公開No. 2006-238409中公開的批處理之外，還可以進(jìn)一步通過利用基于日本待審專利申請(qǐng)公開No. 2008-147920中所公開的塊批處理的實(shí)時(shí)方法來執(zhí)行源分離處理。術(shù)語“塊批處理”意味著如下這樣的處理將觀測(cè)信號(hào) 以特定時(shí)間為單元?jiǎng)澐譃閴K，并基于批處理每塊執(zhí)行分離矩陣的獲知。通過一旦已經(jīng)在某一塊中完成了分離矩陣的獲知、就在一時(shí)段期間連續(xù)地應(yīng)用該分離矩陣直到在下一塊中完成分離矩陣的獲知的時(shí)刻為止，可以無干擾地產(chǎn)生分離結(jié)果Y(t)。下面將參照?qǐng)D20中所示的流程圖，描述圖17所示流程的步驟S105和圖18所示流程的步驟S204中所執(zhí)行的投射返回處理的細(xì)節(jié)。如上所述，將ICA的分離結(jié)果投射返回麥克風(fēng)意味著如下這樣的處理分析每一個(gè)均設(shè)置在特定位置處的麥克風(fēng)所采集的聲音信號(hào)，并從采集的聲音信號(hào)中確定可歸于各個(gè)源信號(hào)的分量。通過采用在源分離處理中計(jì)算出的分離結(jié)果來執(zhí)行投射返回處理。將描述在圖20中所示流程圖的各步驟中執(zhí)行的相應(yīng)處理。在步驟S401，計(jì)算用以計(jì)算投射返回系數(shù)所組成的矩陣P( )(參見公式[7.5]) 的兩種協(xié)方差矩陣。如上所述，可以基于公式[7.6]計(jì)算投射返回系數(shù)矩陣P( )。也可以基于通過使用公式[3. 1]的上述關(guān)系所修改的公式[7.7]計(jì)算投射返回系數(shù)矩陣P( )。如上所述，信號(hào)投射返回模塊具有圖15或圖16中所示的配置。圖15表示在計(jì)算投射返回系數(shù)矩陣P( )(參見公式[7. 5])的處理中采用公式[7.6]的信號(hào)投射返回模塊的配置，而圖16表示在計(jì)算投射返回系數(shù)矩陣P( )的處理中采用公式[7. 7]的信號(hào)投射返回模塊的配置。于是，當(dāng)信號(hào)處理設(shè)備中的信號(hào)投射返回模塊具有圖15中所示的配置時(shí)，通過采用公式[7. 6]計(jì)算投射返回系數(shù)矩陣P( )(參見公式[7. 5])，并且在步驟S401計(jì)算如下兩種類型的協(xié)方差矩陣<X' (co，t)Y( ，t)>t 以及<Y (co，t) Y (co，t) >tg卩，計(jì)算公式[7. 6]中所表示的協(xié)方差矩陣。另一方面，當(dāng)信號(hào)處理設(shè)備中的信號(hào)投射返回模塊具有圖16中所示的配置時(shí)，通過采用公式[7. 7]計(jì)算投射返回系數(shù)矩陣P( )(參見公式[7. 5])，并且在步驟S401計(jì)算如下兩種類型的協(xié)方差矩陣<X' (co，t)X( ，t)>t 以及<X ( w，t) X ( w，t) >t即，計(jì)算公式[7. 7]中所表示的協(xié)方差矩陣。然后，通過使用公式[7.6]或公式[7. 7]，在步驟S402獲得投射返回系數(shù)矩陣 P(w)。在下一步驟S403的聲道選擇處理中，從分離結(jié)果當(dāng)中選擇適于對(duì)象的聲道。例如，僅選擇與特定聲音源對(duì)應(yīng)的一個(gè)聲道，或者去除不與任意聲音源對(duì)應(yīng)的聲道?！安慌c任意聲音源對(duì)應(yīng)的聲道”意味著這樣的情形當(dāng)聲音源數(shù)小于用于源分離的麥克風(fēng)數(shù)時(shí)，分離結(jié)果A到Y(jié)n必定包括不與任意聲音源對(duì)應(yīng)的一個(gè)或多個(gè)輸出聲道。由于在那些輸出聲道上執(zhí)行投射返回和D0A (或源位置)的處理是浪費(fèi)的，因此響應(yīng)于所述必然性去除那些輸出聲道。例如，可以提供用于選擇的準(zhǔn)則作為投射返回之后的分離結(jié)果的乘方(方差)。假設(shè)將分離結(jié)果1( ，t)投射返回第k個(gè)麥克風(fēng)(用于投射返回)的結(jié)果是1[15]( ，0，則可以通過使用如下公式[12. 1]來計(jì)算投射返回結(jié)果的乘方<|丫嚴(yán)(《，t) |2>t......[12. 1]ff[k](co)<X( , t)X( , t)H>tff[k]( )H......[12. 2]如果通過對(duì)于投射返回之后的分離結(jié)果使用公式[12. 1]計(jì)算出的乘方的值大于預(yù)設(shè)的特定值，則確定“分離結(jié)果Yi ( ，t)是對(duì)應(yīng)于特定聲音源的分離結(jié)果”。如果所述值小于預(yù)設(shè)的特定值，則確定“分離結(jié)果Yi ((0，t)不對(duì)應(yīng)于任何聲音源”。在實(shí)際計(jì)算中，不需要執(zhí)行計(jì)算Y/k] ( ，t) ( S卩，將^ ( ，t)投射返回第k個(gè)麥克風(fēng)(用于投射返回)所產(chǎn)生的數(shù)據(jù))的處理。因此，可以省略這種計(jì)算處理。原因在于可以基于公式[12. 2]來計(jì)算公式[7. 9]表示的矢量所對(duì)應(yīng)的協(xié)方差矩陣，并且可以通過取出矩陣的對(duì)角元素來獲得與|Y嚴(yán)(《，t) |2(即，投射返回結(jié)果的絕對(duì)值的平方數(shù)據(jù))相同的值。在聲道選擇結(jié)束之后，在步驟S404產(chǎn)生投射返回結(jié)果。當(dāng)將所有所選聲道的分離結(jié)果投射返回一個(gè)麥克風(fēng)時(shí)，使用公式[7.9]。相反，當(dāng)將一個(gè)聲道的分離結(jié)果投射返回所有麥克風(fēng)時(shí)，使用公式[7.8]。注意，如果在接下來的處理中執(zhí)行D0A估計(jì)(或源位置估計(jì))，則可以省略在步驟S404中產(chǎn)生投射返回結(jié)果的處理。[8.根據(jù)本發(fā)明其他實(shí)施例的信號(hào)處理設(shè)備](8. 1在信號(hào)投射返回模塊中，在計(jì)算投射返回系數(shù)矩陣P( )的處理中省略逆矩陣的計(jì)算的實(shí)施例)首先關(guān)于在信號(hào)投射返回模塊中，在計(jì)算投射返回系數(shù)矩陣P ( )的處理中省略逆矩陣的計(jì)算的實(shí)施例進(jìn)行下面的描述。如上所述，根據(jù)圖20的流程圖執(zhí)行圖15或圖16中所示的信號(hào)投射返回模塊中的處理。在圖20中所示流程圖的步驟S401中，計(jì)算用以計(jì)算投射返回系數(shù)所組成的矩陣 P( )(參見公式[7.5])的兩種協(xié)方差矩陣。更具體而言，當(dāng)信號(hào)投射返回模塊具有圖15中所示的配置時(shí)，通過采用公式 [7. 6]計(jì)算投射返回系數(shù)矩陣P( )(參見公式[7. 5])，并且計(jì)算如下兩種類型的協(xié)方差矩陣<X' (co，t)Y( ，t)>t 以及<Y (co，t) Y (co，t) >t另一方面，當(dāng)信號(hào)投射返回模塊具有圖16中所示的配置時(shí)，通過采用公式[7.7] 計(jì)算投射返回系數(shù)矩陣P( )(參見公式[7. 5])，并且計(jì)算如下兩種類型的協(xié)方差矩陣<X' (co，t)X( ，t)>t 以及<X (w，t) X (w，t) >tS卩，分別計(jì)算公式[7. 6]或[7. 7]中所表示的協(xié)方差矩陣。用于計(jì)算投射返回系數(shù)矩陣P( )的公式[7. 6]和[7. 7]中的每一個(gè)均包括逆矩陣(嚴(yán)格來講，滿矩陣的逆矩陣)。然而，計(jì)算逆矩陣這一處理使得需要相當(dāng)大的計(jì)算成本 (或通過硬件獲得逆矩陣時(shí)需要相當(dāng)大的電路規(guī)模)。為此，如果可以在不使用逆矩陣的情況下執(zhí)行等效處理，則是更期望的。下面將描述在不使用逆矩陣的情況下執(zhí)行等效處理的方法作為變型。
33
如在上文中簡(jiǎn)要討論的那樣，可以使用如下公式[8. 1]代替公式[7. 6] ......[8.2]P(o) = <X' (o, t)Y(o, t)H>t ......[8.3]
......[8.4]當(dāng)分離結(jié)果矢量Y( ，t)的各個(gè)元素彼此獨(dú)立時(shí)，即當(dāng)完全地執(zhí)行了分離時(shí)，協(xié) 方差矩陣<Y( ，t)Y( ，t)H>' ^變成了接近對(duì)角矩陣的矩陣。于是，即使通過僅提取后者的對(duì)角元素，也可以獲得與以上協(xié)方差矩陣基本上相同的矩陣。由于僅通過將對(duì)角元素以其倒數(shù)代替就可以獲得對(duì)角矩陣的逆矩陣，因此計(jì)算對(duì)角矩陣的逆矩陣所需的計(jì)算成本小于計(jì)算滿矩陣的逆矩陣所需的計(jì)算成本。類似地，可以使用前述公式[8. 2]代替公式[7. 7]。注意，公式[8. 2]中的diag( ) 表示使得括號(hào)內(nèi)所表示的除了矩陣的對(duì)角元素之外的所有其他元素為零的運(yùn)算。因此，在公式[8. 2]中，對(duì)角矩陣的逆矩陣也可以僅通過將對(duì)角元素以其倒數(shù)代替來獲得。進(jìn)一步，當(dāng)投射返回之后的分離結(jié)果或投射返回系數(shù)僅用于D0A估計(jì)(或源位置估計(jì))時(shí)，也可以使用前述公式[8. 3](代替公式[7.6])或前述公式[8. 4](代替公式 [7. 7])，其每一個(gè)甚至不包括對(duì)角矩陣。原因在于公式[8.1]或[8. 2]中所表示的對(duì)角矩陣的元素全部是實(shí)數(shù)，并且只要乘以任意實(shí)數(shù)，通過使用公式[11. 1]或[11. 2]所計(jì)算出的 D0A就不受影響。因此，通過利用公式[8. 1]到[8.4]代替上述公式[7.6]和[7. 7]，可以省略計(jì)算滿對(duì)角矩陣的逆矩陣這一處理(這需要更高的計(jì)算成本)，并且可以更高效地計(jì)算投射返回系數(shù)矩陣P( )。(8. 2執(zhí)行將源分離處理所獲得的分離結(jié)果投射返回特定排列的麥克風(fēng)這一處理的實(shí)施例(第四實(shí)施例))下面將描述執(zhí)行將源分離處理所獲得的分離結(jié)果投射返回特定排列的麥克風(fēng)的處理的實(shí)施例。在前文中，已經(jīng)描述了以下列出的三個(gè)實(shí)施例作為采用通過源分離處理而獲得的分離結(jié)果的投射返回處理的應(yīng)用[3.對(duì)于與適于ICA的麥克風(fēng)不同的麥克風(fēng)的投射返回處理的處理示例(第一實(shí) 施例)][4.通過使用多個(gè)全向麥克風(fēng)組成虛擬定向麥克風(fēng)的實(shí)施例(第二實(shí)施例)][5.以組合方式執(zhí)行源分離處理的分離結(jié)果的投射返回處理和D0A估計(jì)或源位置估計(jì)的處理示例(第三實(shí)施例)]以另一方式說明，第一和第二實(shí)施例表示將定向麥克風(fēng)獲得的源分離結(jié)果投射返回全向麥克風(fēng)的處理示例。第三實(shí)施例表示如下這樣的處理示例由排列為適于源分離的麥克風(fēng)采集聲音，并且將采集的聲音的分離結(jié)果投射返回排列為適于D0A(或源位置)估計(jì)的麥克風(fēng)。下面將描述如下這樣實(shí)施例作為不同于前述三個(gè)實(shí)施例的第四實(shí)施例執(zhí)行將源分離處理獲得的分離結(jié)果投射返回特定排列的麥克風(fēng)這一處理?？梢酝ㄟ^采用參照?qǐng)D7在第一實(shí)施例中的上述信號(hào)處理設(shè)備700來組成根據(jù)第四實(shí)施例的信號(hào)處理設(shè)備。根據(jù)第四實(shí)施例的信號(hào)處理設(shè)備包括用以提供用于源分離處理的輸入的多個(gè)麥克風(fēng)701以及用作投射返回目標(biāo)的一個(gè)或多個(gè)全向麥克風(fēng)702作為麥克風(fēng)。作為第一實(shí)施例中的定向麥克風(fēng)，已經(jīng)在上文中描述了用以提供用于源分離處理的輸入的麥克風(fēng)701。然而，在第四實(shí)施例中，用以提供用于源分離處理的輸入的麥克風(fēng) 701可以是定向麥克風(fēng)或全向麥克風(fēng)。后面將描述麥克風(fēng)的實(shí)際排列。輸出裝置709的排列也具有重要意義，并且也將在后面進(jìn)行描述。下面將參照?qǐng)D21和圖22，描述第四實(shí)施例中麥克風(fēng)和輸出裝置的兩個(gè)排列示例。圖21圖示了第四實(shí)施例中麥克風(fēng)和輸出裝置的第一排列示例。圖21中所示的麥克風(fēng)和輸出裝置的第一排列示例表示麥克風(fēng)和輸出裝置的排列，其適于通過源分離處理和投射返回處理來產(chǎn)生對(duì)應(yīng)于用戶兩個(gè)耳朵的位置的雙聲道立體聲信號(hào)。耳機(jī)2101對(duì)應(yīng)于圖7中所示信號(hào)處理設(shè)備中的輸出裝置709。用作投射返回目標(biāo) 的麥克風(fēng)2108和2109安裝于說話者的相應(yīng)位置(外殼)2110和2111，其對(duì)應(yīng)于耳機(jī)2101 的兩個(gè)耳朵部分。圖21中所示的用于源分離的麥克風(fēng)2104對(duì)應(yīng)于圖7中所示的用于源分離的麥克風(fēng)701。源分離麥克風(fēng)2104可以是全向麥克風(fēng)或定向麥克風(fēng)，并且將其以適于分離相關(guān)環(huán)境中的各聲音源的排列進(jìn)行安裝。在圖21所示的配置中，由于存在三個(gè)聲音源 (即，聲音源1 (由2105表示)到聲音源3 (由2107表示))，因此對(duì)于源分離來說至少需要三個(gè)麥克風(fēng)。包括源分離麥克風(fēng)2104(=圖7中的源分離麥克風(fēng)701)以及投射返回目標(biāo)麥克風(fēng)2108和2109(=圖7中的投射返回目標(biāo)麥克風(fēng)702)的信號(hào)處理設(shè)備的處理序列與參照圖17的流程圖而在上面所述的處理序列類似。更具體而言，在圖17的流程圖的步驟S101中，對(duì)源分離麥克風(fēng)2104所采集的聲音信號(hào)執(zhí)行AD轉(zhuǎn)換。然后，在步驟S102，對(duì)AD轉(zhuǎn)換之后的每一個(gè)信號(hào)執(zhí)行短時(shí)傅立葉變換，以轉(zhuǎn)換到時(shí)頻域中的信號(hào)。下一步驟S103中的指向性形成處理是在通過使用多個(gè)全向麥克風(fēng)形成虛擬指向性的情況(如上面參照?qǐng)D10所述的那樣)下所需要的處理。例如，在如圖10中所示那樣排列多個(gè)全向麥克風(fēng)的情況下，根據(jù)上述公式[9. 1]到[9. 4]產(chǎn)生虛擬定向麥克風(fēng)的觀測(cè)信號(hào)。然而，當(dāng)如圖8中所示情況下那樣原始地采用定向麥克風(fēng)時(shí)，可以免除步驟S103的指向性形成處理。在步驟S104的源分離處理中，對(duì)源分離麥克風(fēng)2104所獲得的時(shí)頻域中的觀測(cè)信號(hào)執(zhí)行ICA，以獲得彼此獨(dú)立的分離結(jié)果。實(shí)際上，通過根據(jù)圖19的流程圖的處理獲得源分
罔結(jié)果。在步驟S105，將步驟S104中所獲得的分離結(jié)果投射返回預(yù)定麥克風(fēng)。在該示例中，將分離結(jié)果投射返回圖21中所示的投射返回目標(biāo)麥克風(fēng)2108和2109。根據(jù)圖20的流程圖執(zhí)行投射返回處理的實(shí)際序列。當(dāng)執(zhí)行投射返回處理時(shí)，從分離結(jié)果當(dāng)中選擇與特定聲音源對(duì)應(yīng)的一個(gè)聲道(該處理對(duì)應(yīng)于圖20的流程中的步驟S403)，并且產(chǎn)生通過將所選分離結(jié)果投射返回到投射返回目標(biāo)麥克風(fēng)2108和2109而獲得的信號(hào)(該處理對(duì)應(yīng)于圖20的流程中的步驟S404)。進(jìn)一步，在圖17的流程中的步驟S106，通過逆傅立葉變換，將投射返回之后的信號(hào)重新轉(zhuǎn)換為波形。在圖17的流程中的步驟S 107，從內(nèi)置于耳機(jī)中的擴(kuò)音器重放波形。以這種方式，分別從耳機(jī)2101的擴(kuò)音器2110和2111重放被投射返回兩個(gè)投射返回目標(biāo)麥克風(fēng)2108和2109的分離結(jié)果。由信號(hào)處理設(shè)備的控制模塊控制來自擴(kuò)音器2110和2111的聲音輸出。換言之，信號(hào)處理設(shè)備的控制模塊在輸出與投射返回目標(biāo)麥克風(fēng)(其設(shè)置在輸出裝置的位置處)的投射返回信號(hào)對(duì)應(yīng)的聲音數(shù)據(jù)時(shí)控制各個(gè)輸出裝置(擴(kuò)音器)。例如，通過選擇投射返回之前的分離結(jié)果之一(其對(duì)應(yīng)于聲音源1(2105))，將所選分離結(jié)果投射返回到投射返回目標(biāo)麥克風(fēng)2108和2109，并通過耳機(jī)2101重放投射返回結(jié)果，佩戴耳機(jī)2101的用戶可以仿佛僅聲音源1(2105)在右側(cè)有效一樣聽到聲音，盡管三個(gè)聲音源同時(shí)有效。以另一方式說明，通過將分離結(jié)果投射返回到投射返回目標(biāo)麥克風(fēng) 2108和2109，盡管聲音源1(2105)位于源分離麥克風(fēng)2104的左側(cè)，但是可以產(chǎn)生表示聲音源1(2105)如同位于耳機(jī)2101的右側(cè)的雙聲道立體聲信號(hào)。另外，對(duì)于投射返回處理，投射返回目標(biāo)麥克風(fēng)2108和2109的觀測(cè)信號(hào)正是必需的，而耳機(jī)2101 (或投射返回目標(biāo)麥克風(fēng)2108和2109)的位置信息不是必需的。類似地，通過在圖20中所示的流程圖的步驟S403選擇與聲音源2(2106)或聲音源3(2107)對(duì)應(yīng)的一個(gè)聲道，用戶可以仿佛僅那些聲音源之一在其位置有效一樣聽到聲音。進(jìn)一步，當(dāng)佩戴耳機(jī)2101的用戶從一個(gè)地點(diǎn)移動(dòng)到另一地點(diǎn)時(shí)，分離結(jié)果提供的位置也對(duì)應(yīng)地改變。盡管也可以通過將適于源分離的麥克風(fēng)和用作投射返回目標(biāo)的麥克風(fēng)設(shè)置為相同的現(xiàn)有技術(shù)配置來執(zhí)行此處理，但是現(xiàn)有技術(shù)配置的處理存在問題。當(dāng)將適于源分離的麥克風(fēng)和用作投射返回目標(biāo)的麥克風(fēng)設(shè)置為相同時(shí)，按照如下執(zhí)行處理。將圖21中所示的投射返回目標(biāo)麥克風(fēng)2108和2109本身設(shè)置為用于源分離處理的源分離麥克風(fēng)。進(jìn)一步，通過使用由源分離麥克風(fēng)采集聲音的結(jié)果執(zhí)行源分離處理，并且將分離結(jié)果投射返回到投射返回目標(biāo)麥克風(fēng)2108和2109。然而，當(dāng)執(zhí)行上述處理時(shí)，出現(xiàn)如下兩個(gè)問題。(1)在圖21中所示的環(huán)境中，由于存在三個(gè)聲音源(即，聲音源1 (2105)到聲音源 3 (2107))，因此當(dāng)僅使用兩個(gè)麥克風(fēng)時(shí)，聲音源并未完全地彼此分離。(2)由于圖21中所示的投射返回目標(biāo)麥克風(fēng)2108和2109分別靠近耳機(jī)2101的揚(yáng)聲器2110和2111放置，因此存在麥克風(fēng)2108和2109可能采集從揚(yáng)聲器2110和2111 所產(chǎn)生的聲音的可能性。在這種情況下，聲音源在數(shù)量上增加，并且獨(dú)立性的假設(shè)不成立，由此導(dǎo)致分離精度的惡化。也可以可替代地在如下這種配置中實(shí)踐現(xiàn)有技術(shù)方法將圖21中所示的投射返回目標(biāo)麥克風(fēng)2108和2109設(shè)置為用于源分離的麥克風(fēng)，并且將圖21中所示的源分離麥克風(fēng)2104進(jìn)一步用作用于源分離的麥克風(fēng)。由于以比聲音源的數(shù)量(三個(gè))更大的數(shù)量設(shè) 置源分離麥克風(fēng)，因此此配置可以增大源分離處理的精度。在一個(gè)示例中，使用總共全部六個(gè)麥克風(fēng)。在另一示例中，使用總共四個(gè)麥克風(fēng)(即，兩個(gè)麥克風(fēng)2108和2109以及源分離麥克風(fēng)2104中的兩個(gè))。然而，利用可替代的現(xiàn)有技術(shù)方法，未克服上述問題(2)。換言之，還存在圖21中所示的投射返回目標(biāo)麥克風(fēng)2108和2109可能采集從耳機(jī)2101的揚(yáng)聲器2110和2111所
36產(chǎn)生的聲音的可能性，并且分離精度惡化。進(jìn)一步，當(dāng)佩戴耳機(jī)2101的用戶移動(dòng)時(shí)，在某些情況下，安裝到耳機(jī)的麥克風(fēng) 2108和2109可能與麥克風(fēng)2104遠(yuǎn)離地放置。隨著用于源分離的各麥克風(fēng)之間的間距增大，同樣往往會(huì)在低頻處出現(xiàn)空間混疊，這也導(dǎo)致分離精度的惡化。另外，使用用于源分離的六個(gè)麥克風(fēng)的配置比使用四個(gè)麥克風(fēng)的配置需要更高的計(jì)算成本。即，前者的計(jì)算成本為后者的計(jì)算成本的(4/6)2 = 2. 25倍。因此，計(jì)算成本增大，并且處理效率降低。相比之下，本發(fā)明實(shí)施例通過如下處理將投射返回目標(biāo)麥克風(fēng)和源分離麥克風(fēng)設(shè)置為分離的麥克風(fēng)，并將基于源分離麥克風(fēng)獲得的信號(hào)而產(chǎn)生的分離結(jié)果投射返回到投射返回目標(biāo)麥克風(fēng)，可以解決所有上述問題。下面將參照?qǐng)D22A和圖22B，描述第四實(shí)施例中麥克風(fēng)和輸出裝置的第二排列示例。圖22A和圖22B中所示的配置表示用于通過投射返回產(chǎn)生可提供環(huán)繞聲效果的分離結(jié) 果的排列示例，并且其特征在于投射返回目標(biāo)麥克風(fēng)和回放裝置的位置。圖22B表示安裝擴(kuò)音器2210到2214的環(huán)境(再現(xiàn)環(huán)境)，而圖22A表示安裝三個(gè) 聲音源(即，聲音源1 (2202)到聲音源3 (2204))以及麥克風(fēng)2201和2205到2209的環(huán)境 (聲音采集環(huán)境)。這兩個(gè)環(huán)境彼此不同，以使得從圖22B所示回放環(huán)境中的揚(yáng)聲器2210 到2214輸出的聲音不進(jìn)入圖22A所示聲音采集環(huán)境中的麥克風(fēng)2201和2205到2209。首先描述圖22B中所示的回放環(huán)境?；胤艙P(yáng)聲器2210到2214是適于環(huán)繞聲效果的擴(kuò)音器，其每一個(gè)均排列在預(yù)定位置。更具體而言，圖22B所示回放環(huán)境表示如下這樣的環(huán)境除了亞低音揚(yáng)聲器(sub-woofer)之外，安裝適于5. 1聲道環(huán)繞聲效果的揚(yáng)聲器。接著描述圖22A中圖示的聲音采集環(huán)境。分別與圖22B中所示的回放環(huán)境中的回放揚(yáng)聲器2210到2214對(duì)應(yīng)地安裝投射返回目標(biāo)麥克風(fēng)2205到2209。源分離麥克風(fēng)2201 與圖21中所示的源分離麥克風(fēng)2104類似，它們可以是定向麥克風(fēng)或全向麥克風(fēng)。最好將麥克風(fēng)的數(shù)量設(shè)置為大于聲音源的數(shù)量，以便獲得足夠的分離性能。圖22的配置中所執(zhí)行的處理與圖21的配置中所執(zhí)行的處理類似，并且根據(jù)圖17 的流程而執(zhí)行。根據(jù)圖19的流程執(zhí)行源分離處理，并且根據(jù)圖20的流程執(zhí)行投射返回處理。在圖20的流程中的步驟S403中的聲道選擇處理中，選擇與特定聲音源對(duì)應(yīng)的分離結(jié) 果之一。在步驟S404，將所選分離結(jié)果投射返回圖22A中所示的投射返回目標(biāo)麥克風(fēng)2205 到 2209。通過在圖22B中所示的再現(xiàn)環(huán)境中從再現(xiàn)揚(yáng)聲器2210到2214再現(xiàn)相應(yīng)的投射返回信號(hào)，聽眾2215可以仿佛周圍只有一個(gè)源是有效的那樣體驗(yàn)聲音。(8. 3采用多個(gè)源分離系統(tǒng)的實(shí)施例(第五實(shí)施例))雖然上述任何一個(gè)實(shí)施例均包括一個(gè)源分離系統(tǒng)，但是在另一實(shí)施例中，多個(gè)源分離系統(tǒng)可以共享共同的投射返回目標(biāo)麥克風(fēng)。下列描述是關(guān)于作為這種共享方式的應(yīng)用的、包括具有不同麥克風(fēng)排列的多個(gè)源分離系統(tǒng)的實(shí)施例而進(jìn)行的。圖23圖示了包括多個(gè)源分離系統(tǒng)的信號(hào)處理設(shè)備的配置。圖23中圖示的信號(hào)處理設(shè)備包括兩個(gè)源分離系統(tǒng)(即，源分離系統(tǒng)1 (由2305表示)(用于高頻)和源分離系統(tǒng) 2(由2306表示)(用于低頻))。兩個(gè)源分離系統(tǒng)(S卩，源分離系統(tǒng)1 (2305)(用于高頻)和源分離系統(tǒng)2 (2306)(用于低頻))包括以不同排列而安裝的麥克風(fēng)。
更具體而言，存在用于源分離的兩組麥克風(fēng)。屬于一組且以其之間較窄的間隔排列的源分離麥克風(fēng)(處于較窄間隔)2301連接到源分離系統(tǒng)1 (2305)(用于高頻)，而屬于另一組且以其之間較寬的間隔排列的源分離麥克風(fēng)(處于較寬間隔)2302連接到源分離系統(tǒng)2 (2306)(用于低頻)?？梢酝ㄟ^將一些源分離麥克風(fēng)設(shè)置為如圖23中所示的投射返回目標(biāo)麥克風(fēng)(a) 2303來提供投射返回目標(biāo)麥克風(fēng)，或者可以通過使用其它投射返回目標(biāo)麥克風(fēng) (b)2304來提供投射返回目標(biāo)麥克風(fēng)。下面將參照?qǐng)D24描述將通過圖23中所示的兩個(gè)源分離系統(tǒng)2305和2306所獲得的相應(yīng)組的分離結(jié)果組合在一起的方法。將高頻源分離系統(tǒng)1(2401)(對(duì)應(yīng)于圖23中所示的源分離系統(tǒng)1 (2305)(用于高頻))產(chǎn)生的、投射返回之前的分離結(jié)果譜圖2402劃分為低頻和高頻兩個(gè)波段，并且僅選擇性地提取高頻數(shù)據(jù)2403 (即，高頻部分譜圖)。另一方面，也將低頻源分離系統(tǒng)2(2405)(對(duì)應(yīng)于圖23中所示的源分離系統(tǒng) 2(2306)(用于低頻))產(chǎn)生的分離結(jié)果譜圖2406劃分為低頻和高頻兩個(gè)波段，并且僅選擇性地提取低頻數(shù)據(jù)2407 (即，低頻部分譜圖)。根據(jù)本發(fā)明實(shí)施例中的上述方法，對(duì)每一個(gè)提取出的部分譜圖執(zhí)行投射返回。通過將投射返回之后的兩個(gè)譜圖2404和2408組合在一起，可以獲得全波段譜圖2409。以上參照?qǐng)D23和圖24所述的信號(hào)處理設(shè)備包括多個(gè)源分離系統(tǒng)，其中它們的源分離模塊接收由至少部分彼此不同的相應(yīng)組的源分離麥克風(fēng)所取得的信號(hào)，由此產(chǎn)生相應(yīng) 組的分離信號(hào)。它們的信號(hào)投射返回模塊接收由多個(gè)源分離系統(tǒng)所產(chǎn)生的相應(yīng)組的分離信號(hào)以及投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)，以產(chǎn)生分別與各源分離系統(tǒng)對(duì)應(yīng)的多組投射返回信號(hào)(圖24中所示的投射返回結(jié)果2404和2408)，并進(jìn)一步將多組產(chǎn)生的投射返回信號(hào)組合在一起，以產(chǎn)生與投射返回目標(biāo)麥克風(fēng)對(duì)應(yīng)的最終的投射返回信號(hào)(圖24中所示的投射返回結(jié)果2409)。下面將描述在上述處理中需要投射返回的理由。存在如下這樣的現(xiàn)有技術(shù)配置其包括具有不同麥克風(fēng)排列的多個(gè)源分離系統(tǒng)。例如，日本待審專利申請(qǐng)公開No. 2003-263189公開了如下這樣的技術(shù)通過利用多個(gè)麥克風(fēng)(其以具有在各麥克風(fēng)之間設(shè)置的較寬間隔的陣列而排列)所采集的聲音信號(hào)而在低頻執(zhí)行源分離處理，通過利用多個(gè)麥克風(fēng)(其以具有在各麥克風(fēng)之間設(shè)置的較窄間隔的陣列而排列)所采集的聲音信號(hào)而在高頻執(zhí)行源分離處理，并最終將高頻和低頻二者處的相應(yīng) 分離結(jié)果組合在一起。此外，日本專利申請(qǐng)No. 2008-92363(其已經(jīng)由與本申請(qǐng)相同的申請(qǐng) 人在先前提交)公開了如下這樣的技術(shù)當(dāng)同時(shí)操作多個(gè)源分離系統(tǒng)時(shí)，使得各輸出聲道彼此對(duì)應(yīng)(如，輸出可歸于同一聲音源的信號(hào)作為多個(gè)源分離系統(tǒng)的相應(yīng)輸出Y1)。然而，在這些現(xiàn)有技術(shù)中，執(zhí)行對(duì)于用于源分離的麥克風(fēng)的投射返回作為將分離結(jié)果改變尺度的方法。因此，在以較寬間隔排列的麥克風(fēng)所獲得的低頻的分離結(jié)果與以較窄間隔排列的麥克風(fēng)所獲得的高頻的分離結(jié)果之間存在相位間距。該相位間距在產(chǎn)生具有聲音定位感覺的分離結(jié)果時(shí)引起了嚴(yán)重問題。進(jìn)一步，即使各麥克風(fēng)是同一模型，麥克風(fēng)就其增益也具有各個(gè)差異。因此，存在這樣的可能性如果輸入增益在以較寬間隔排列的麥克風(fēng)與以較窄間隔排列的麥克風(fēng)之間不同，則最終組合的信號(hào)聽起來是不自然的聲音。相比之下，根據(jù)圖23和圖24中所示的本發(fā)明的實(shí)施例，多個(gè)源分離系統(tǒng)工作以
38便將相應(yīng)組的分離結(jié)果投射返回公共的投射返回目標(biāo)麥克風(fēng)，然后將投射返回結(jié)果組合在一起。在圖23所示的配置中，例如，投射返回目標(biāo)麥克風(fēng)(a) 2303或投射返回目標(biāo)麥克風(fēng) (b) 2304是對(duì)于多個(gè)源分離系統(tǒng)2304和2305公共的投射返回目標(biāo)。結(jié)果，可以解決相位間距的問題和麥克風(fēng)增益的各個(gè)差異的問題兩者，并且可以產(chǎn)生具有聲音定位的感覺的分離結(jié)果。[9.根據(jù)本發(fā)明實(shí)施例的信號(hào)處理設(shè)備的特征和優(yōu)點(diǎn)的總結(jié)]在根據(jù)本發(fā)明實(shí)施例的信號(hào)處理設(shè)備中，如上所述，源分離麥克風(fēng)和投射返回目標(biāo)麥克風(fēng)彼此獨(dú)立地設(shè)置。換言之，投射返回目標(biāo)麥克風(fēng)可以設(shè)置為與源分離麥克風(fēng)不同的麥克風(fēng)。基于源分離麥克風(fēng)所采集到的數(shù)據(jù)執(zhí)行源分離處理以獲得分離結(jié)果，并且將獲得的分離結(jié)果投射返回到投射返回目標(biāo)麥克風(fēng)。通過使用投射返回目標(biāo)麥克風(fēng)所獲得的觀測(cè) 信號(hào)與分離結(jié)果之間的互協(xié)方差矩陣以及各分離結(jié)果本身之間的協(xié)方差矩陣，執(zhí)行投射返回處理。根據(jù)本發(fā)明實(shí)施例的信號(hào)處理設(shè)備例如具有如下優(yōu)點(diǎn)。1.通過對(duì)定向麥克風(fēng)(或每一個(gè)均由多個(gè)全向麥克風(fēng)形成的虛擬定向麥克風(fēng))所觀測(cè)到的信號(hào)執(zhí)行源分離，并將分離結(jié)果投射返回全向麥克風(fēng)，可以解決定向麥克風(fēng)的頻率依賴性問題。2.通過對(duì)排列為適于源分離的麥克風(fēng)所觀測(cè)到的信號(hào)執(zhí)行源分離，并將分離結(jié)果投射返回排列為適于D0A估計(jì)(或源位置估計(jì))的麥克風(fēng)，可以克服在源分離和D0A(或源位置)估計(jì)之間麥克風(fēng)排列中引起的矛盾難題。3.通過與回放揚(yáng)聲器類似地排列投射返回目標(biāo)麥克風(fēng)并將分離結(jié)果投射返回這些麥克風(fēng)，可以獲得能夠提供聲音定位的分離結(jié)果，并且可以克服當(dāng)投射返回目標(biāo)麥克風(fēng) 用作源分離的麥克風(fēng)時(shí)引起的問題。4.通過準(zhǔn)備多個(gè)源分離系統(tǒng)所共享的公共投射返回目標(biāo)麥克風(fēng)，并且將分離結(jié) 果投射返回這些公共麥克風(fēng)，可以克服當(dāng)將分離結(jié)果投射返回用于源分離的麥克風(fēng)時(shí)引起的、歸因于相位差異間距和麥克風(fēng)增益的各個(gè)差異的問題。已經(jīng)結(jié)合特定實(shí)施例在上文中詳細(xì)描述了本發(fā)明。然而，顯而易見，在不脫離本發(fā) 明的范圍的情況下，本領(lǐng)域的技術(shù)人員可以將各實(shí)施例修改為其他適當(dāng)?shù)男问?，或?qū)⑵湟?其他適當(dāng)?shù)男问教鎿Q。換言之，已經(jīng)通過說明性示例公開了本發(fā)明的上述實(shí)施例，并且不應(yīng) 以限制性方式考慮本發(fā)明的上述實(shí)施例。本發(fā)明的要點(diǎn)是通過參考權(quán)利要求來確定的。本說明書中的上述各種系列的處理可以通過硬件、軟件或硬件和軟件的組合配置來執(zhí)行。當(dāng)使用軟件來執(zhí)行處理時(shí)，可以通過在內(nèi)置于專用硬件中的計(jì)算機(jī)內(nèi)的存儲(chǔ)器中安裝程序(其記錄相關(guān)的處理序列)，或者通過在能夠執(zhí)行各種處理的通用計(jì)算機(jī)中安裝程序，來執(zhí)行處理。例如，可以預(yù)先在記錄介質(zhì)上記錄程序。除了將程序從記錄介質(zhì)安裝到計(jì)算機(jī)中之外，還可以經(jīng)由網(wǎng)絡(luò)(如，LAN(局域網(wǎng))或因特網(wǎng))接收程序，并且可以將接收到的程序安裝在記錄介質(zhì)(如內(nèi)置硬盤)中。注意，本說明書中所述的各種類型的處理不僅可以根據(jù)所述序列以時(shí)間順序方式執(zhí)行，還可以依據(jù)用以執(zhí)行處理的設(shè)備的處理性能或響應(yīng)于必要性而并行或以分離的方式執(zhí)行。此外，本說明書中所使用的術(shù)語“系統(tǒng)”意味著多個(gè)設(shè)備的邏輯組件，而不限于在同一外殼中安裝具有相應(yīng)功能的設(shè)備這樣的配置。本申請(qǐng)包含與2009年3月30日向日本專利局提交的日本優(yōu)先權(quán)專利申請(qǐng)JP 2009-081379中公開的主題有關(guān)的主題，其全部?jī)?nèi)容通過引用的方式合并在此。本領(lǐng)域技術(shù)人員應(yīng)理解，根據(jù)設(shè)計(jì)要求和其他因素可以出現(xiàn)各種變型、組合、部分組合和變更，只要其在所附權(quán)利要求及其等價(jià)物的范圍內(nèi)即可。
權(quán)利要求
一種信號(hào)處理設(shè)備，包括源分離模塊，用于通過將獨(dú)立分量分析ICA應(yīng)用于基于來自多個(gè)聲音源的混合信號(hào)而產(chǎn)生的觀測(cè)信號(hào)，產(chǎn)生與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào)，由此執(zhí)行所述混合信號(hào)的分離處理，所述觀測(cè)信號(hào)由用于源分離的麥克風(fēng)取得；以及信號(hào)投射返回模塊，用于接收投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)和所述源分離模塊所產(chǎn)生的分離信號(hào)，并且用于產(chǎn)生投射返回信號(hào)作為與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào)，所述投射返回信號(hào)由投射返回目標(biāo)麥克風(fēng)取得，其中，所述信號(hào)投射返回模塊通過接收與源分離麥克風(fēng)不同的投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)來產(chǎn)生所述投射返回信號(hào)。
2.根據(jù)權(quán)利要求1所述的信號(hào)處理設(shè)備，其中，所述源分離模塊對(duì)觀測(cè)信號(hào)執(zhí)行ICA，由此產(chǎn)生與各聲音源對(duì)應(yīng)的時(shí)頻域中的相應(yīng)分離信號(hào)，所述觀測(cè)信號(hào)是通過將用于源分離的麥克風(fēng)獲得的信號(hào)轉(zhuǎn)換到時(shí)頻域而取得的，以及其中，所述信號(hào)投射返回模塊通過計(jì)算使與每一個(gè)聲音源對(duì)應(yīng)的相應(yīng)投射返回信號(hào)的總和與投射返回目標(biāo)麥克風(fēng)的各個(gè)觀測(cè)信號(hào)之間的誤差最小的投射返回系數(shù)，并通過將分離信號(hào)乘以計(jì)算出的投射返回系數(shù)來計(jì)算投射返回信號(hào)，其中，與每一個(gè)聲音源對(duì)應(yīng)的相應(yīng)投射返回信號(hào)的總和是通過將時(shí)頻域中的分離信號(hào)乘以投射返回系數(shù)而計(jì)算的。
3.根據(jù)權(quán)利要求2所述的信號(hào)處理設(shè)備，其中，所述信號(hào)投射返回模塊在計(jì)算最小化誤差的投射返回系數(shù)的處理中采用最小二乘逼近。
4.根據(jù)權(quán)利要求1所述的信號(hào)處理設(shè)備，其中，所述源分離模塊接收由所述源分離麥克風(fēng)取得的信號(hào)，并執(zhí)行產(chǎn)生對(duì)應(yīng)于各聲音源的相應(yīng)分離信號(hào)的處理，所述源分離麥克風(fēng) 由多個(gè)定向麥克風(fēng)組成，以及其中，所述信號(hào)投射返回模塊接收作為全向麥克風(fēng)的投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào) 和所述源分離模塊所產(chǎn)生的分離信號(hào)，并產(chǎn)生對(duì)于作為全向麥克風(fēng)的投射返回目標(biāo)麥克風(fēng) 的投射返回信號(hào)。
5.根據(jù)權(quán)利要求1所述的信號(hào)處理設(shè)備，進(jìn)一步包括指向性形成模塊，用于接收所述源分離麥克風(fēng)所取得的信號(hào)，并且用于根據(jù)成對(duì)麥克風(fēng)之間的距離而通過延遲成對(duì)麥克風(fēng) 之一的相位來產(chǎn)生虛擬定向麥克風(fēng)的輸出信號(hào)，其中所述源分離麥克風(fēng)由多個(gè)全向麥克風(fēng) 組成，所述成對(duì)麥克風(fēng)通過所述多個(gè)全向麥克風(fēng)當(dāng)中的兩個(gè)來提供，其中，所述源分離模塊接收所述指向性形成模塊所產(chǎn)生的輸出信號(hào)，并產(chǎn)生分離信號(hào)。
6.根據(jù)權(quán)利要求1所述的信號(hào)處理設(shè)備，進(jìn)一步包括到達(dá)方向估計(jì)模塊，用于接收所述信號(hào)投射返回模塊所產(chǎn)生的投射返回信號(hào)，并用于執(zhí)行如下處理基于不同位置處的多個(gè)投射返回目標(biāo)麥克風(fēng)的各投射返回信號(hào)之間的相位差，計(jì)算到達(dá)方向。
7.根據(jù)權(quán)利要求1所述的信號(hào)處理設(shè)備，進(jìn)一步包括源位置估計(jì)模塊，用于接收所述信號(hào)投射返回模塊所產(chǎn)生的投射返回信號(hào)，執(zhí)行基于不同位置處的多個(gè)投射返回目標(biāo)麥克風(fēng)的各投射返回信號(hào)之間的相位差來計(jì)算到達(dá)方向的處理，并進(jìn)一步基于到達(dá)方向的組合數(shù)據(jù)計(jì)算源位置，所述到達(dá)方向的組合數(shù)據(jù)是從不同位置處的多個(gè)投射返回目標(biāo)麥克風(fēng)的投射返回信號(hào)中計(jì)算出的。
8.根據(jù)權(quán)利要求2所述的信號(hào)處理設(shè)備，進(jìn)一步包括到達(dá)方向估計(jì)模塊，用于接收所述信號(hào)投射返回模塊所產(chǎn)生的投射返回系數(shù)，并用于執(zhí)行采用了接收到的投射返回系數(shù)的計(jì)算，由此執(zhí)行計(jì)算到達(dá)方向或源位置的處理。
9.根據(jù)權(quán)利要求1所述的信號(hào)處理設(shè)備，進(jìn)一步包括輸出裝置，其設(shè)置在對(duì)應(yīng)于投射返回目標(biāo)麥克風(fēng)的位置處；以及控制模塊，用于執(zhí)行控制以輸出對(duì)于投射返回目標(biāo)麥克風(fēng)的投射返回信號(hào)，所述投射返回目標(biāo)麥克風(fēng)與所述輸出裝置的位置對(duì)應(yīng)。
10.根據(jù)權(quán)利要求1所述的信號(hào)處理設(shè)備，其中，所述源分離模塊包括多個(gè)源分離模塊，其用于接收相應(yīng)組的源分離麥克風(fēng)所取得的信號(hào)并且用于產(chǎn)生相應(yīng)組的分離信號(hào)，其中所述相應(yīng)組的源分離麥克風(fēng)至少其部分彼此不同，以及其中，所述信號(hào)投射返回模塊接收所述多個(gè)源分離模塊所產(chǎn)生的相應(yīng)組的分離信號(hào)以及投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)，產(chǎn)生對(duì)應(yīng)于源分離模塊的多組投射返回信號(hào)，并將產(chǎn) 生的多組投射返回信號(hào)組合在一起，由此產(chǎn)生對(duì)于投射返回目標(biāo)麥克風(fēng)的最終投射返回信號(hào)。
11.一種在信號(hào)處理設(shè)備中執(zhí)行的信號(hào)處理方法，所述方法包括如下步驟使得源分離模塊通過將獨(dú)立分量分析ICA應(yīng)用于基于來自多個(gè)聲音源的混合信號(hào)而產(chǎn)生的觀測(cè)信號(hào)，來產(chǎn)生與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào)，由此執(zhí)行所述混合信號(hào)的分離處理，其中所述觀測(cè)信號(hào)由源分離麥克風(fēng)取得；以及使得信號(hào)投射返回模塊接收投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)和所述源分離模塊所產(chǎn) 生的分離信號(hào)，并且產(chǎn)生投射返回信號(hào)作為與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào)，所述投射返回信號(hào)由投射返回目標(biāo)麥克風(fēng)取得，其中，通過接收與源分離麥克風(fēng)不同的投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)來產(chǎn)生所述投射返回信號(hào)。
12.一種用于在信號(hào)處理設(shè)備中執(zhí)行信號(hào)處理的程序，所述程序包括如下步驟使得源分離模塊通過將獨(dú)立分量分析ICA應(yīng)用于基于來自多個(gè)聲音源的混合信號(hào)而產(chǎn)生的觀測(cè)信號(hào)，來產(chǎn)生與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào)，由此執(zhí)行所述混合信號(hào)的分離處理，其中所述觀測(cè)信號(hào)由源分離麥克風(fēng)取得；以及使得信號(hào)投射返回模塊接收投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)和所述源分離模塊所產(chǎn) 生的分離信號(hào)，并且產(chǎn)生投射返回信號(hào)作為與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào)，所述投射返回信號(hào)由投射返回目標(biāo)麥克風(fēng)取得，其中，通過接收與源分離麥克風(fēng)不同的投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)來產(chǎn)生所述投射返回信號(hào)。
全文摘要
公開了信號(hào)處理設(shè)備、信號(hào)處理方法和程序。所述信號(hào)處理設(shè)備包括源分離模塊，用于通過將獨(dú)立分量分析ICA應(yīng)用于基于來自多個(gè)聲音源的混合信號(hào)而產(chǎn)生的觀測(cè)信號(hào)，產(chǎn)生與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào)，由此執(zhí)行所述混合信號(hào)的分離處理，所述觀測(cè)信號(hào)由源分離麥克風(fēng)取得；以及信號(hào)投射返回模塊，用于接收投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)和所述源分離模塊所產(chǎn)生的分離信號(hào)，并且用于產(chǎn)生投射返回信號(hào)作為與各聲音源對(duì)應(yīng)的相應(yīng)分離信號(hào)，所述投射返回信號(hào)由投射返回目標(biāo)麥克風(fēng)取得。所述信號(hào)投射返回模塊通過接收與源分離麥克風(fēng)不同的投射返回目標(biāo)麥克風(fēng)的觀測(cè)信號(hào)來產(chǎn)生所述投射返回信號(hào)。
文檔編號(hào)G01S3/808GK101852846SQ20101015145
公開日2010年10月6日申請(qǐng)日期2010年3月23日優(yōu)先權(quán)日2009年3月30日
發(fā)明者廣江厚夫申請(qǐng)人:索尼公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：廣江厚夫
技術(shù)所有人：索尼公司
我是此專利的發(fā)明人

上一篇：乘員檢測(cè)系統(tǒng)的制作方法
上一篇：一種打火機(jī)跌落測(cè)試儀的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、邢老師：1.機(jī)械設(shè)計(jì)及理論 2.生物醫(yī)學(xué)材料及器械 3.聲發(fā)射檢測(cè)技術(shù)。
2、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
3、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
4、張老師：1.機(jī)械設(shè)計(jì)的應(yīng)力分析、強(qiáng)度校核的計(jì)算機(jī)仿真 2.生物反應(yīng)器研制 3.生物力學(xué)
5、趙老師：檢測(cè)與控制技術(shù)、機(jī)器人技術(shù)、機(jī)電一體化技術(shù)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

信號(hào)處理程序相關(guān)技術(shù)

數(shù)字信號(hào)處理程序相關(guān)技術(shù)

數(shù)字信號(hào)處理實(shí)驗(yàn)程序相關(guān)技術(shù)

數(shù)字信號(hào)處理實(shí)踐方法相關(guān)技術(shù)

信號(hào)處理方法相關(guān)技術(shù)

信號(hào)處理的方法相關(guān)技術(shù)

數(shù)字信號(hào)處理方法相關(guān)技術(shù)

信號(hào)處理的數(shù)學(xué)方法相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

信號(hào)處理設(shè)備、信號(hào)處理方法和程序的制作方法

信號(hào)處理設(shè)備、信號(hào)處理方法和程序的制作方法