專利名稱:用于確定轉(zhuǎn)換的空間音頻信號的裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明為音頻處理領(lǐng)域,特別涉及空間音頻處理和不同空間音頻格式的轉(zhuǎn)換。
背景技術(shù):
DirAC (Directional Audio Coding,方向音頻編碼)是空間音頻的再現(xiàn) (reproduction)和處理的方法。傳統(tǒng)的系統(tǒng)在錄音的二維和三維高品質(zhì)再現(xiàn)、電話會 議應(yīng)用、方向麥克風(fēng)以及立體聲_環(huán)繞上混中應(yīng)用DirAC,參照V. Pulkki和C. Faller, Directional audio coding :Filterbank and STFT-based design, 第 120 次 AES Convention, 2006 年 5 月 20-23 日,2006 年 5 月法國巴黎;V. Pulkki 禾Π C. Faller, Directional audio coding in spatial sound reproduction and stereo upmixing,第 28 次 AES International Conference,2006 年 6 月瑞典皮特奧;V. Pulkki,Spatial sound reproduction with directional audio coding, Journal of the Audio Engineering Society,55 (6) :503-516,2007 ^ 6 M Jukka Ahonen, V. Pulkki and Tapio Lokki, Teleconference application and B-format microphone array for directional audio coding,第 30 次 AES International Conference。其他采用DirAC的現(xiàn)有應(yīng)用,例如是,通用編碼格式和噪聲消除。在DirAC中,依 據(jù)時間在頻帶中分析聲音的一些方向特性。分析數(shù)據(jù)與聲音數(shù)據(jù)一起被發(fā)送并由于不同 的目的被進(jìn)行合成。上述的分析通常采用B格式信號完成,盡管理論上DirAC并不限于這 禾中格式。B 格式,參照 Michael Gerzon, Surround sound psychoacoustics, in Wireless World, volume 80,第483-486頁,1974年12月,它是在關(guān)于Ambisonics (高保真度立體 聲響復(fù)制)的工作中開發(fā)出來的,Ambisonics是在70年代由英國研究人員開發(fā)出來的用 于將音樂大廳的環(huán)繞聲音帶入居室的系統(tǒng)。B格式包含四個信號,即w(t),x(t),y(t),和 z(t)。第一個信號對應(yīng)通過全方向麥克風(fēng)(omnidirectional microphone)測量的聲壓, 而后三個信號是布置成朝向CarteSian(笛卡爾)坐標(biāo)系的三個軸的具有8字型拾音圖案 (figure-of-eight pickup pattern)的麥克風(fēng)的聲壓讀取。信號 x(t),y(t)和 ζ (t)分別 與朝向x,y和ζ方向的粒子速度矢量(particle velocity vector)的分量成比例。DirAC流包含具有方向元數(shù)據(jù)的1_4個聲道。在電話會議中和在一些其他情形中, 該流僅包含具有元數(shù)據(jù)的單聲道,稱為單聲道DirAC流。這是描述空間音頻的非常簡潔的 方式,由于僅有單聲道需要與邊信息一起傳送,例如這在談話者之間給出了良好的空間隔 離。但是,在這樣的情況下,一些聲音類型,例如混響的聲音場景或者周圍的聲音場景可能 僅可以以有限的品質(zhì)再現(xiàn)。為了在這些情形下獲得更好的品質(zhì),需要傳送另外的音頻聲道。在V. Pulkki 的 2004 年 9 月的專利 WO 2004/077884A1,名稱為 A method for reproducing natural or modified spatial impression in multichannel listening 中描述了從B格式向DirAC的轉(zhuǎn)換。方向音頻編碼是一種空間音頻分析和再現(xiàn)的有效方 案。DirAC基于與空間音頻的感知相關(guān)的特征采用聲場的參數(shù)表示,即在子頻帶中聲場的 DOA(D0A = direction of arrival,到達(dá)方向)和擴(kuò)散度。實(shí)際上,DirAC假設(shè)如果準(zhǔn)確地再現(xiàn)聲音的擴(kuò)散度,則在正確地感知雙耳間干涉(Interaural Cohenrence, IC)的同時,當(dāng) 聲場的DOA被正確地再現(xiàn)時正確地感知雙耳間的時間差(Interaural Time Differences, ITD)和雙耳間的聲級差(Interaural Level Differences, ILD) 這些參數(shù),即DOA和擴(kuò)散 度,代表了伴隨單聲道信號的邊信息,這被稱為單聲道DirAC流。圖7示出了 DirAC編碼器,該DirAC編碼器從適合的麥克風(fēng)信號計(jì)算單聲道音頻 聲道和邊信息,即擴(kuò)散度Ψ (k,η)和到達(dá)方向eDQA(k,η)。圖7示出了 DirAC編碼器200, DirAC編碼器200適于從合適的麥克風(fēng)信號計(jì)算單聲道音頻聲道和邊信息。換言之,圖7 示出了用于從合適的麥克風(fēng)信號確定擴(kuò)散度和到達(dá)方向的DirAC編碼器200。圖7示出了 DirAC編碼器200,DirAC編碼器200包括P/U估計(jì)單元210,其中P (k,η)表示聲壓信號, U(k, η)表示粒子速度矢量。P/U估計(jì)單元接收作為輸入信息的麥克風(fēng)信號,基于該輸入信 息進(jìn)行P/U估計(jì)。能量分析階段220實(shí)現(xiàn)單聲道DirAC流的到達(dá)方向和擴(kuò)散度參數(shù)的估計(jì)??梢詮柠溈孙L(fēng)信號的頻率-時間表示獲得DirAC參數(shù),例如單聲道音頻表示W(wǎng)(k, η)、擴(kuò)散度參數(shù)Ψ (k,η)和到達(dá)方向(D0A)eDQA(k,n)。因此,該參數(shù)依賴于時間和頻率。在 再現(xiàn)側(cè),這個信息允許精確的空間渲染。為了在希望的聆聽位置重新產(chǎn)生立體聲音,需要設(shè) 置多重?fù)P聲器。但是,它的幾何形狀可以是任意的。實(shí)際上,揚(yáng)聲器聲道可以被確定為DirAC 參數(shù)的函數(shù)。盡管DirAC和參數(shù)化多聲道音頻編碼(諸如MPEG Surround)之間共享類似的 處理結(jié)構(gòu),但它們之間具有實(shí)質(zhì)的不同,參考Lars Villemocs, Juergen Herre, Jeroen Breebaart, Gerard Hotho, Sascha Disch, Heiko PurnhagenjPKristofer Kjrling, MPEG surround :The forthcoming ISO standard for spatial audio coding,第 28 次 AES International Conference,2006年6月瑞典皮特奧。當(dāng)MPEG環(huán)繞基于不同揚(yáng)聲器聲道的 時間/頻率分析時,DirAC將一致的麥克風(fēng)的聲道作為輸入,其有效地描繪了在一個點(diǎn)上的 聲場。因而,DirAC還代表了用于空間音頻的有效記錄技術(shù)。另外的系統(tǒng)是SAOC(SAOC = Spatial Audio Object Coding,空間音頻對象編碼), 參考 Jonas Engdegard, Barbara Resch, Cornelia Falch, Oliver Hellmuth, Johannes Hilpert, Andreas Hoelzer, Leonid Terentiev, Jeroen Breebaart, Jeroen Koppens, Erik Schui jers,以及 Werner Oomen, Spatial audio object (SAOC) the upcoming MPEG standard on parametric object based audio coding, % 12 AES Convention,2008 ^ 5月17-20日荷蘭阿姆斯特丹,目前符合標(biāo)準(zhǔn)ISO/MPEG。它基于MPEG環(huán)繞的渲染引擎創(chuàng)建, 將不同的聲源作為對象對待。這種音頻編碼提供了非常高的比特率效率,并給出了在再現(xiàn) 側(cè)的前所未有的交互自由度。這種方案保證了在舊有系統(tǒng)中新的引人注目的特性和功能, 以及其他一些新穎的應(yīng)用。
發(fā)明內(nèi)容
本發(fā)明的目的是提供用于空間處理的改進(jìn)概念。本發(fā)明的目的通過根據(jù)權(quán)利要求1的用于確定轉(zhuǎn)換的空間音頻信號的裝置和根 據(jù)權(quán)利要求15的對應(yīng)方法來實(shí)現(xiàn)。本發(fā)明基于如下的發(fā)現(xiàn)在例如將被編碼為單聲道DirAC流的空間音頻信號轉(zhuǎn)換 為B格式信號時,可以得到改進(jìn)的空間處理。在實(shí)施例中,轉(zhuǎn)換的B格式信號可以在被添加到一些其他音頻信號中以及被編碼回DirAC流之前被處理或渲染。實(shí)施例可以具有不同的 應(yīng)用,例如,混合不同類型的DirAC和B格式流,基于DirAC的(DirAC based)等等。實(shí)施 例可以引入WO 2004/077884A1的反向操作,即從單聲道DirAC流向B格式的轉(zhuǎn)換。本發(fā)明基于如下的發(fā)現(xiàn)如果音頻信號被轉(zhuǎn)換為方向分量,則可以得到改進(jìn)的處 理。換言之,本發(fā)明發(fā)現(xiàn)當(dāng)空間音頻信號的格式與由例如B格式方向麥克風(fēng)記錄的方向分 量對應(yīng)時,可以得到改進(jìn)的空間處理。此外,本發(fā)明發(fā)現(xiàn)可以共同地并更高效率地處理來 自不同源的方向或全方向分量。換言之,如果多個音頻源的信號可以以它們?nèi)较蚝头较?分量的格式存在,因?yàn)檫@樣可以共同地處理,那么特別是當(dāng)處理來自多個音頻源的空間音 頻信號時,可以執(zhí)行更有效率的處理。因此,在實(shí)施例中,可以通過處理多個音頻源的合并 的分量更有效地利用音效生成器或者音頻處理器。在實(shí)施例中,空間音頻信號可以被表示為代表DirAC流技術(shù)的單聲道DirAC流,其 中媒體數(shù)據(jù)在傳輸中伴隨僅一個音頻聲道。這種格式可以被轉(zhuǎn)換為例如B格式流,該B格 式流具有多個方向分量。實(shí)施例可以通過將空間音頻信號轉(zhuǎn)換為方向分量來實(shí)現(xiàn)改進(jìn)的空 間處理。實(shí)施例可以提供單聲道DirAC解碼上的優(yōu)點(diǎn),其中僅一個音頻聲道用于創(chuàng)建全部 揚(yáng)聲器信號,可以基于在創(chuàng)建揚(yáng)聲器信號之前確定的方向音頻分量實(shí)現(xiàn)附加的空間處理。 實(shí)施例可以提供減少混響創(chuàng)建中問題的優(yōu)點(diǎn)。在實(shí)施例中,例如,DirAC流可以采用立體聲音頻信號代替單聲道音頻信號,其中 立體聲聲道是L(L=左立體聲聲道)和R(R=右立體聲聲道)被傳送以在DirAC解碼中使 用。實(shí)施例,例如,可以對于混響實(shí)現(xiàn)更佳的品質(zhì),并提供與立體聲揚(yáng)聲器系統(tǒng)的直接的兼 容性。實(shí)施例可以提供能夠?qū)崿F(xiàn)虛擬麥克風(fēng)DirAC解碼的優(yōu)點(diǎn)。虛擬麥克風(fēng)DirAC解 石馬的細(xì)節(jié)可以參考 V. Pulkki, Spatial sound reproduction with directional audio coding, Journal of the Audio Engineering Society, 55 (6) :503_516,June 2007。這些 實(shí)施例獲得了用于揚(yáng)聲器的音頻信號,其將虛擬麥克風(fēng)置于朝向揚(yáng)聲器的位置并具有點(diǎn)狀 聲源,點(diǎn)狀聲源的位置由DirAC參數(shù)確定。實(shí)施例可以提供通過轉(zhuǎn)換來實(shí)現(xiàn)音頻信號便利 的線性合并的優(yōu)點(diǎn)。
將通過所附附圖詳細(xì)地描述本發(fā)明的實(shí)施例,其中圖Ia示出了用于確定轉(zhuǎn)換的空間音頻信號的裝置;圖Ib示出了對于平面波在高斯平面內(nèi)粒子速度矢量的分量和聲壓;圖2示出了用于將單聲道DirAC流轉(zhuǎn)換為B格式信號的另一實(shí)施例;圖3示出了用于合并多個轉(zhuǎn)換的空間音頻信號的實(shí)施例;圖4a_4d示出了用于將應(yīng)用不同的音效的多個基于DirAC的空間音頻信號進(jìn)行合 并的實(shí)施例;圖5描繪了音效生成器的實(shí)施例;圖6示出了在方向分量上應(yīng)用多個音效的音效生成器的實(shí)施例;和圖7示出了現(xiàn)有DirAC編碼器的狀態(tài)。
具體實(shí)施例方式圖Ia示出了用于從輸入空間音頻信號確定轉(zhuǎn)換的空間音頻信號的裝置100,該轉(zhuǎn) 換的空間音頻信號具有全方向的分量和至少一個方向分量(X ;Y ;Z),該輸入空間音頻信號 具有輸入音頻表示(W)和輸入到達(dá)方向(Φ)。該裝置100包括用于基于輸入音頻表示(W)和輸入到達(dá)方向(Φ)估計(jì)波表示的 估計(jì)器110,波表示包括波場測量和波到達(dá)方向測量。此外,該裝置100包括處理器120,用 于處理波場測量和波到達(dá)方向測量,以獲得全方向分量和至少一個方向分量。估計(jì)器110 可以適于估計(jì)作為平面波表示的波表示。在實(shí)施例中,處理器可以適于提供作為全方向音頻分量(W’ )的輸入音頻表示 (W)。換言之,全方向音頻分量W’可以等于輸入音頻表示W(wǎng)。因此,根據(jù)圖Ia中的虛線,輸 入音頻表示可以繞過估計(jì)器110,或處理器120,或者繞過估計(jì)器110和處理器120。在其他 實(shí)施例中,全方向音頻分量W’可以基于與輸入音頻表示W(wǎng)—起由處理器120處理的波的強(qiáng) 度和波到達(dá)方向。在實(shí)施例中,多個方向音頻分量(X ;Y ;Z)可以被處理,例如對應(yīng)不同空間 方向的第一(X)方向音頻分量、第二(Y)方向音頻分量和/或第三(Z)方向音頻分量。在 實(shí)施例中,例如,可以根據(jù)Cartesian(笛卡爾)坐標(biāo)系的不同方向獲得三個不同的方向音 頻分量(X ;Y ;Z)。估計(jì)器110可以適于根據(jù)波場幅度和波場相位估計(jì)波場測量。換言之,在實(shí)施例 中,波場測量可以被估計(jì)為復(fù)值的量。在一些實(shí)施例中,波場幅度可以對應(yīng)于聲壓大小,波 場相位可以對應(yīng)于聲壓相位。在實(shí)施例中,波到達(dá)方向測量可以與例如可以由矢量、一個或多個角等來表達(dá)的 任意的方向量相對應(yīng),且它可以通過從例如強(qiáng)度矢量、粒子速度矢量等表示音頻分量的任 意方向測量來獲得。波場測量可以對應(yīng)于描述音頻分量的任意物理量,其可以是實(shí)值的或 復(fù)值的,該波場測量可以對應(yīng)于聲壓信號、粒子速度振幅或大小、音量等。此外,可以在時域 和/或頻域內(nèi)考慮這些測量。實(shí)施例可以基于針對每個輸入流的平面波表示的估計(jì),這可以通過圖Ia中的估 計(jì)器110來實(shí)施。換言之,可以利用平面波表示將波場測量模型化。通常,存在平面波或者 一般波的幾個等同的詳盡(即,完全)描述。下面將介紹一種數(shù)學(xué)描述,用于計(jì)算用于不同 分量的擴(kuò)散度參數(shù)和到達(dá)方向或者方向測量。盡管只有很少描述直接與物理量(如聲壓、 粒子速度等)相關(guān),但可能存在無數(shù)的不同方式描述波表示,其中的一種隨后將作為例子 進(jìn)行表述,但是這并不意味著將本發(fā)明的實(shí)施例限制為任何方式。任意的合并也可以對應(yīng) 波場測量和波到達(dá)方向測量。為了進(jìn)一步詳細(xì)闡述不同的可能的描述,考慮兩個實(shí)數(shù)a和b。當(dāng)
權(quán)利要求
1.一種適于從第一輸入空間音頻信號和第二輸入空間音頻信號確定合并的轉(zhuǎn)換的空 間音頻信號的裝置(300),所述合并的轉(zhuǎn)換的空間音頻信號具有至少第一合并分量和第二 合并分量,所述第一輸入空間音頻信號具有第一輸入音頻表示和第一到達(dá)方向,所述第二 輸入空間音頻信號具有第二輸入音頻表示和第二到達(dá)方向,所述裝置(300)包括第一裝置(101),所述第一裝置適于從所述第一輸入空間音頻信號確定第一轉(zhuǎn)換信號, 所述第一轉(zhuǎn)換信號具有第一全方向分量和至少一個第一方向分量(X ;Y ;Z),所述第一裝置 (101)包括估計(jì)器,所述估計(jì)器適于基于所述第一輸入音頻表示和所述第一輸入到達(dá)方向 估計(jì)第一波表示,所述第一波表示包括第一波場測量和第一波到達(dá)方向測量;和 處理器,所述處理器適于處理所述第一波場測量和第一波到達(dá)方向測量以獲得 所述第一全方向分量和所述至少一個第一方向分量;其中,所述第一裝置(101)適于提供具有所述第一全方向分量和所述至少一個第一方 向分量的第一轉(zhuǎn)換信號;第二裝置(102),所述第二裝置(102)適于基于所述第二輸入空間音頻信號提供第二 轉(zhuǎn)換信號,所述第二轉(zhuǎn)換信號具有第二全方向分量和至少一個第二方向分量,所述第二裝 置(102)包括另一估計(jì)器,所述另一估計(jì)器適于基于所述第二輸入音頻表示和所述第二輸入到達(dá)方 向估計(jì)第二波表示,所述第二波表示包括第二波場測量和第二波到達(dá)方向測量;和另一處理器,所述另一處理器適于處理所述第二波場測量和第二波到達(dá)方向測量以獲 得所述第二全方向分量和所述至少一個第二方向分量;其中,所述第二裝置(101)適于提供具有所述第二全方向分量和所述至少一個第二方 向分量的所述第二轉(zhuǎn)換信號;音效生成器(301),所述音效生成器(301)適于渲染所述第一全方向分量以獲得第一 渲染分量,或者渲染所述第一方向分量以獲得所述第一渲染分量;第一合并器(311),所述第一合并器(311)適于將所述第一渲染分量、所述第一全方向 分量和所述第二全方向分量合并,或者將所述第一渲染分量、所述第一方向分量和所述第 二方向分量合并,以獲得第一合并分量;以及第二合并器(312),所述第二合并器(31 適于將所述第一方向分量和所述第二方向 分量合并,或者將所述第一全方向分量和所述第二全方向分量合并,以獲得所述第二合并 分量。
2.如權(quán)利要求1所述的裝置(300),其中所述估計(jì)器或所述另一估計(jì)器適于按照波場 振幅和波場相位來估計(jì)所述第一波場測量或第二波場測量。
3.如權(quán)利要求1或2所述的裝置(300),其中所述第一輸入空間音頻信號或第二輸入 空間音頻信號還包括擴(kuò)散度參數(shù)Ψ,且其中所述估計(jì)器或所述另一估計(jì)器適于進(jìn)一步根據(jù) 所述擴(kuò)散度參數(shù)Ψ估計(jì)所述波場測量。
4.如權(quán)利要求1-3任一項(xiàng)所述的裝置(300),其中所述第一輸入到達(dá)方向或第二輸入 到達(dá)方向指的是參考點(diǎn),且其中所述估計(jì)器或所述另一估計(jì)器適于參考所述參考點(diǎn)來估計(jì) 所述第一波到達(dá)方向測量或第二波到達(dá)方向測量,所述參考點(diǎn)對應(yīng)于輸入空間音頻信號的 記錄位置。
5.如權(quán)利要求1-4任一項(xiàng)所述的裝置(300),其中所述第一轉(zhuǎn)換的空間音頻信號或第 二轉(zhuǎn)換的空間音頻信號包括第一(X)方向分量、第二(Y)方向分量和第三(Z)方向分量,且 其中所述處理器或所述另一處理器適于進(jìn)一步處理所述第一波場測量或第二波場測量以 及所述第一波到達(dá)方向測量或第二波到達(dá)方向測量以獲得用于所述第一或第二轉(zhuǎn)換信號 的所述第一⑴方向分量、第二⑴方向分量和第三(Z)方向分量。
6.如權(quán)利要求2-5任一項(xiàng)所述的裝置(300),其中所述估計(jì)器或所述另一估計(jì)器適于 基于所述第一或第二輸入音頻表示P (k,η)的分式β (k,n)確定所述第一波場測量或第二 波場測量,其中k表示時間指數(shù),η表示頻率指數(shù)。
7.如權(quán)利要求6所述的裝置(300),其中所述處理器或所述另一處理器適于通過以下 公式獲得用于所述第一或第二轉(zhuǎn)換信號的所述第一方向分量X(k,η)和/或所述第二方向 分量Y(k,n)和/或所述第三方向分量Z (k,η)和/或所述第一或第二全方向音頻分量W(k, η)的復(fù)測度
8.如權(quán)利要求6或7所述的裝置(300),其中所述估計(jì)器或所述另一估計(jì)器適于根據(jù) 以下公式基于擴(kuò)散度參數(shù)Ψ (k,η)估計(jì)分式β (k,η)
9.如權(quán)利要求6或7所述的裝置(300),其中所述估計(jì)器或所述另一估計(jì)器適于根據(jù) 以下公式基于擴(kuò)散度參數(shù)Ψ (k,η)估計(jì)分式β (k,η)
10.如權(quán)利要求1至9任一項(xiàng)所述的裝置(300),其中所述第一輸入空間音頻信號或第 二輸入空間音頻信號對應(yīng)于DirAC編碼音頻信號,且其中所述處理器或所述另一處理器適 于按照B格式信號獲得所述第一或第二全方向音頻分量(W’ )和所述至少一個第一或第二 方向音頻分量(Χ;Υ ;Ζ)。
11.如權(quán)利要求1至10任一項(xiàng)所述的裝置(300),其中所述音效生成器(301)適于渲 染所述第一全方向分量和所述第二全方向分量的合并結(jié)果,或者渲染所述第一方向分量和 所述第二方向分量的合并結(jié)果,以獲得所述第一渲染分量。
12.如權(quán)利要求1至11任一項(xiàng)所述的裝置(300),還包括第一延時和縮放階段(321),所述第一延時和縮放階段(321)用于延時和/或縮放所述 第一全方向和/或所述第一方向分量,和/或第二延時和縮放階段(322),所述第二延時和縮放階段(32 用于延時和/或縮放所述第二全方向和/或所述第二方向分量。
13.如權(quán)利要求1至12任一項(xiàng)所述的裝置(300),包括多個用于轉(zhuǎn)換多個輸入空間音 頻信號的裝置(100),所述裝置(300)還包括多個音效生成器,其中所述音效生成器的數(shù)量 小于所述裝置(100)的數(shù)量。
14.如權(quán)利要求1至13任一項(xiàng)所述的裝置(300),其中所述音效生成器(301)適于混 響所述第一全方向分量或者所述第一方向分量,以獲得所述第一渲染分量。
15.一種用于從第一輸入空間音頻信號和第二輸入空間音頻信號確定合并的轉(zhuǎn)換的空 間音頻信號的方法,所述合并的轉(zhuǎn)換的空間音頻信號具有至少第一合并分量和第二合并分 量,所述第一輸入空間音頻信號具有第一輸入音頻表示和第一到達(dá)方向,所述第二輸入空 間音頻信號具有第二輸入音頻表示和第二到達(dá)方向,所述方法包括以下步驟通過以下子步驟從所述第一輸入空間音頻信號確定第一轉(zhuǎn)換的空間音頻信號,所述第 一轉(zhuǎn)換的空間音頻信號具有第一全方向分量(W’)和至少一個第一方向分量(X ;Y ;Z),所述 子步驟包括基于所述第一輸入音頻表示和所述第一輸入到達(dá)方向估計(jì)第一波表示,所述第一波表 示包括第一波場測量和第一波到達(dá)方向測量;和處理所述第一波場測量和所述第一波到達(dá)方向測量以獲得所述第一全方向分量(W’ ) 和所述至少一個第一方向分量(X ;Y ;Z);提供具有所述第一全方向分量和所述至少一個第一方向分量的所述第一轉(zhuǎn)換信號;通過以下子步驟從所述第二輸入空間音頻信號確定第二轉(zhuǎn)換空間信號,所述第二轉(zhuǎn)換 的空間音頻信號具有第二全方向分量(W’)和至少一個第二方向分量(X ;Y ;Z),所述子步驟 包括基于所述第二輸入音頻表示和所述第二輸入到達(dá)方向估計(jì)第二波表示,所述第二波表 示包括第二波場測量和第二波到達(dá)方向測量;以及處理所述第二波場測量和所述第二波到達(dá)方向測量以獲得所述第二全方向分量(W’ ) 和所述至少一個第二方向分量(X ;Y;Z);提供具有所述第二全方向分量和所述至少一個第二方向分量的所述第二轉(zhuǎn)換信號;渲染所述第一全方向分量以獲得第一渲染分量或者渲染所述第一方向分量以獲得所 述第一渲染分量;將所述第一渲染分量、所述第一全方向分量和所述第二全方向分量合并,或者將所述 第一渲染分量、所述第一方向分量和所述第二方向分量合并,以獲得所述第一合并分量;以 及將所述第一方向分量和所述第二方向分量合并,或者將所述第一全方向分量和所述第 二全方向分量合并,以獲得所述第二合并分量。
16.一種具有程序代碼的計(jì)算機(jī)程序,該程序代碼用于當(dāng)在計(jì)算機(jī)處理器上運(yùn)行時執(zhí) 行權(quán)利要求15所述的方法。
全文摘要
用于從輸入空間音頻信號確定轉(zhuǎn)換的空間音頻信號的裝置(100),該轉(zhuǎn)換的空間音頻信號具有全方向音頻分量(W’)和至少一個方向音頻分量,該輸入空間音頻信號具有輸入音頻表示(W)和輸入到達(dá)方向(φ)。該裝置(100)包括估計(jì)器(110),估計(jì)器(110)用于基于輸入音頻表示(W)和輸入到達(dá)方向(φ)估計(jì)包括波測量和波到達(dá)方向測量的波表示(W)。該裝置(100)還包括處理器(120),處理器(120)用于處理波場測量和波到達(dá)方向測量以獲得全方向音頻分量(W)和至少一個方向音頻分量(X;Y;Z)。
文檔編號G10L19/14GK102124513SQ200980131776
公開日2011年7月13日 申請日期2009年8月12日 優(yōu)先權(quán)日2008年8月13日
發(fā)明者喬瓦尼·德爾加多, 法比安·庫切, 理查德·舒爾茨-阿姆林, 米可-維利·萊迪南, 維利·普爾基, 馬庫斯·卡林格 申請人:弗朗霍夫應(yīng)用科學(xué)研究促進(jìn)協(xié)會