專(zhuān)利名稱(chēng):非節(jié)能上混規(guī)則脈絡(luò)立體多聲道解碼器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種根據(jù)可利用下混信號(hào)與額外控制數(shù)據(jù),而以頭部相關(guān)
傳遞函數(shù)(HRTF)濾波的方式,進(jìn)行多聲道音頻信號(hào)的立體(binaural) 解碼。
背景技術(shù):
音頻編碼的近來(lái)發(fā)展己經(jīng)具有可以根據(jù)一立體(或單音)信號(hào)及 對(duì)應(yīng)控制數(shù)據(jù)進(jìn)行音頻信號(hào)多聲道表現(xiàn)的重建方法。這些方法與較早 期根據(jù)例如杜比專(zhuān)業(yè)邏輯(Dolby Prologic)的矩陣解法不同,因?yàn)?其傳輸額外的控制數(shù)據(jù),以控制根據(jù)該傳輸單音或立體聲聲道進(jìn)行重 建,也同時(shí)被稱(chēng)為環(huán)繞聲道上混。
因此,這樣的參數(shù)多聲道音頻解碼器,例如動(dòng)態(tài)影像壓縮標(biāo)準(zhǔn)環(huán) 繞(MPEG Surround),根據(jù)M個(gè)傳輸聲道以及額外的控制數(shù)據(jù)重構(gòu)N 個(gè)聲道,其中N〉M。該額外控制數(shù)據(jù)表示一種與傳輸所有N個(gè)聲道相 比之下的較低數(shù)據(jù)傳輸率,其使得編碼動(dòng)作非常的有效率,而同時(shí)也 確保與M個(gè)聲道裝置及與N個(gè)聲道裝置兩者的兼容性。[參考J. Breebaart et al. "MPEG spatial audio coding / MPEG Surround: overview and current status" , Proc. 119th AES convention, NewYork, USA, October 2005, Pr印rint 6447.]
這些參數(shù)環(huán)繞編碼方法通常包括一種根據(jù)聲道強(qiáng)度差異(CLD)與 聲道間諧和性/相關(guān)性(ICC)的參數(shù)環(huán)繞信號(hào)。這些參數(shù)描述在上混 處理中的功率比率以及聲道對(duì)之間的相關(guān)性?,F(xiàn)有技術(shù)中也使用其它 的聲道預(yù)測(cè)系數(shù)(CPC),以在上混步驟期間預(yù)測(cè)中間或輸出聲道。
其它音頻編碼中的發(fā)展也已經(jīng)提供一種獲得遍及立體聲耳機(jī)多聲 道信號(hào)印象的方法。這一般是利用該原始多聲道信號(hào)與頭部相關(guān)傳遞 函數(shù)(HRTF)濾波器,將多聲道信號(hào)下混為立體聲的方式所完成。
替代的,對(duì)于計(jì)算效率的理由以及對(duì)于音頻質(zhì)量的理由來(lái)說(shuō),避 開(kāi)產(chǎn)生具有左方立體聲道與右方立體聲道的立體信號(hào)方式,當(dāng)然也是 有用的。
然而,其問(wèn)題在于如何能夠組合原始頭部相關(guān)傳遞函數(shù)(HRTF) 濾波器。另外,在根據(jù)一種能量損失效應(yīng)的上混規(guī)則方式中,換言之 當(dāng)該多聲道解碼器輸入的信號(hào)包含具有例如第一下混聲道與第二下混 聲道的下混信號(hào),并另外具有空間參數(shù),以用來(lái)進(jìn)行非能量守恒方式 的上混時(shí),也會(huì)產(chǎn)生問(wèn)題。這樣的參數(shù)也已知為例如預(yù)測(cè)參數(shù)或是CPC 參數(shù)。這些參數(shù)在與聲道程度差異參數(shù)(CLD)相比之下,具有無(wú)法計(jì) 算反映兩聲道之間能量分布的性質(zhì),但其可以計(jì)算以執(zhí)行一種可能最 佳的波形吻合,并自然地造成能量誤差(例如,能量損失),因此,當(dāng) 產(chǎn)生該預(yù)測(cè)參數(shù)時(shí),便無(wú)法考慮到上混的能量守恒性質(zhì),而只能關(guān)心 該重建信號(hào)與該原始信號(hào)相比之下的最可能時(shí)間或子帶(subband)域 波形吻合。當(dāng)想要簡(jiǎn)單的根據(jù)這種傳輸?shù)目臻g預(yù)測(cè)參數(shù)進(jìn)行頭部相關(guān)傳遞函數(shù) (服TF)濾波器的線(xiàn)性組合時(shí),如果該聲道預(yù)測(cè)執(zhí)行效果不好,將接收到
特別嚴(yán)重的假像(artifact)。在此情況中,即使是細(xì)微的線(xiàn)性相關(guān)性也 會(huì)導(dǎo)致不想要的立體輸出頻譜染色(coloring)。目前已經(jīng)發(fā)現(xiàn),當(dāng)該原 始聲道載有成對(duì)的不相關(guān)信號(hào)并具有可比較的強(qiáng)度時(shí),便會(huì)經(jīng)常形成這種 假像。
發(fā)明內(nèi)容
本發(fā)明的目標(biāo)是提供一種有效率與定量的可接受概念,以進(jìn)行多 聲道解碼,而獲得一種立體信號(hào),其可以在例如頭戴式耳機(jī)的多聲道 信號(hào)再現(xiàn)中使用。
根據(jù)本發(fā)明第一觀點(diǎn),此目標(biāo)是利用一種多聲道解碼器所達(dá)成, 其利用包含以上混規(guī)則將下混信號(hào)進(jìn)行上混的可使用上混規(guī)則信息參 數(shù),從來(lái)自于原始多聲道信號(hào)所導(dǎo)出的下混信號(hào)產(chǎn)生立體信號(hào),該上
混規(guī)則造成一種能量誤差,該多聲道解碼器包括增益因子計(jì)算器, 其根據(jù)該上混規(guī)則信息以及對(duì)應(yīng)于上混聲道的以頭部相關(guān)傳遞函數(shù)
(HRTF)為基礎(chǔ)的濾波器特性,計(jì)算至少一個(gè)增益因子,以降低或消 除該能量誤差;以及濾波處理器,其利用該至少一個(gè)增益因子、該濾 波器特性與該上混規(guī)則信息,將該下混信號(hào)進(jìn)行濾波,以獲得能量修 正的立體信號(hào)。
根據(jù)本發(fā)明第二觀點(diǎn),此目標(biāo)是利用一種多聲道解碼的方法所達(dá) 成,其利用包含以上混規(guī)則將下混信號(hào)進(jìn)行上混的可使用上混規(guī)則信息參數(shù),從來(lái)自于原始多聲道信號(hào)所導(dǎo)出的下混信號(hào)產(chǎn)生立體信號(hào), 該上混規(guī)則造成一種能量誤差,該方法包括根據(jù)該上混規(guī)則信息以 及對(duì)應(yīng)于上混聲道的以頭部相關(guān)傳遞函數(shù)(HRTF)為基礎(chǔ)的濾波器特
性,計(jì)算至少一個(gè)增益因子,以降低或消除該能量誤差;以及利用該
至少一個(gè)增益因子、該濾波器特性與該上混規(guī)則信息,將該下混信號(hào) 進(jìn)行濾波,以獲得能量修正的立體信號(hào)。
本發(fā)明的另一觀點(diǎn)與一種計(jì)算機(jī)程序有關(guān),其具有當(dāng)在計(jì)算機(jī)上 執(zhí)行時(shí)實(shí)作該多聲道解碼方法的計(jì)算機(jī)可讀代碼。
本發(fā)明是基于可以更有利地利用造成能量誤差上混的上混規(guī)則信 息,以將下混信號(hào)濾波,而在不需要完整表現(xiàn)該多聲道信號(hào)下獲得立
體信號(hào),并接著應(yīng)用多個(gè)頭部相關(guān)傳遞函數(shù)(HRTF)濾波器。取而代 之,根據(jù)本發(fā)明,與能量誤差效應(yīng)上混規(guī)則有關(guān)的上混規(guī)則信息,可 以有利地用于避免下混信號(hào)的立體表現(xiàn),而根據(jù)本發(fā)明,可計(jì)算增益 因子并在進(jìn)行該下混信號(hào)濾波時(shí)使用,其中此增益因子的計(jì)算可以降 低或完全消除該能量誤差。
具體來(lái)說(shuō),該增益因子不只與例如預(yù)測(cè)參數(shù)的上混規(guī)則信息有關(guān), 更重要的是,其也與對(duì)應(yīng)于該上混聲道的以頭部相關(guān)傳遞函數(shù)(HRTF) 為基礎(chǔ)的濾波器有關(guān),其中該上混聲道的上混規(guī)則為已知。具體來(lái)說(shuō), 這些上混聲道從來(lái)不存在于本發(fā)明的優(yōu)選實(shí)施例中,因此該立體聲道 并不需要例如三個(gè)中間聲道的首次呈現(xiàn)便可計(jì)算。然而,雖然該上混 聲道本身從不存在于該優(yōu)選實(shí)施例中,仍然可以導(dǎo)出或提供對(duì)應(yīng)于該 上混聲道的以頭部相關(guān)傳遞函數(shù)(HRTF)為基礎(chǔ)的濾波器。已經(jīng)發(fā)現(xiàn)由這種能量損失影響的上混規(guī)則所引入的能量誤差并不與從該編碼器 傳輸至該解碼器的上混規(guī)則信息對(duì)應(yīng),但與以頭部相關(guān)傳遞函數(shù)
(HRTF)為基礎(chǔ)的濾波器相關(guān),因此當(dāng)產(chǎn)生該增益因子時(shí),以頭部相 關(guān)傳遞函數(shù)(HRTF)為基礎(chǔ)的濾波器也影響該增益因子的計(jì)算。
有鑒于此,本發(fā)明將說(shuō)明例如預(yù)測(cè)參數(shù)的上混規(guī)則信息之間的互 相依賴(lài)關(guān)系,因此代表該聲道,以頭部相關(guān)傳遞函數(shù)(HRTF)為基礎(chǔ) 濾波器的預(yù)測(cè)參數(shù)與特定表象(appearance),將成為利用該上混規(guī)則 進(jìn)行上混的結(jié)果。
因此,本發(fā)明提供一種方案,以解決從預(yù)測(cè)上混與參數(shù)多聲道音 頻立體解碼組合時(shí)所產(chǎn)生的頻譜染色現(xiàn)象。
本發(fā)明的優(yōu)選實(shí)施例包括以下特征 一種音頻解碼器,從#個(gè)解 碼信號(hào)與建立7Vd^個(gè)聲道有關(guān)的空間參數(shù)產(chǎn)生立體音頻信號(hào),該解 碼器包括增益計(jì)算器,用于在許多子帶中從來(lái)自于尸對(duì)立體子帶濾波 器與建立尸個(gè)中間聲道有關(guān)的空間參數(shù)子集合中估計(jì)兩個(gè)補(bǔ)償增益, 并包括增益調(diào)整器,用于修改在許多子帶中由該尸對(duì)立體子帶濾波器 線(xiàn)性組合所獲得的#對(duì)立體子帶濾波器,該修改包括將該#對(duì)立體子 帶濾波器的每一對(duì)與由該增益計(jì)算器所計(jì)算的兩個(gè)增益相乘。
本發(fā)明現(xiàn)在將藉由描述范例并以參考附圖的方式所敘述,其并不 限制本發(fā)明的范圍或精神,其中
圖1描述利用頭部相關(guān)傳遞函數(shù)(HRTF)相關(guān)濾波器的參數(shù)多聲道信號(hào)立體合成;
圖2描述利用組合濾波的參數(shù)多聲道信號(hào)立體合成;
圖3描述本發(fā)明的參數(shù)/濾波器組合器的組成;
圖4描述動(dòng)態(tài)影像壓縮標(biāo)準(zhǔn)環(huán)繞(MPEG Surround)空間解碼的會(huì))
圖5描述不利用本發(fā)明增益補(bǔ)償?shù)慕獯a立體信號(hào)的頻譜; 圖6描述本發(fā)明的立體信號(hào)解碼的頻譜; 圖7描述利用頭部相關(guān)傳遞函數(shù)(HRTF)的傳統(tǒng)立體合成; 圖8描述一種動(dòng)態(tài)影像壓縮標(biāo)準(zhǔn)(MPEG)環(huán)繞編碼器; 圖9描述動(dòng)態(tài)影像壓縮標(biāo)準(zhǔn)(MPEG)環(huán)繞解碼器與立體合成器的
級(jí)聯(lián);
圖IO描述一種用于特定配置的概念三維(3D)立體解碼器; 圖11描述一種用于特定配置的空間編碼器; 圖12描述一種空間(動(dòng)態(tài)影像壓縮標(biāo)準(zhǔn)環(huán)繞(MPEG Surround)) 解碼器;
圖13描述利用四個(gè)濾波器進(jìn)行兩個(gè)下混聲道濾波,以在不進(jìn)行增 益因子修正下獲得立體信號(hào);
圖14描述一種在五聲道設(shè)定中,說(shuō)明不同頭部相關(guān)傳遞函數(shù) (HRTF) 1-10的空間設(shè)定;
圖15描述當(dāng)己經(jīng)組合代表L、L以及R、Rs的聲道時(shí)圖14的狀態(tài);
圖16a描述當(dāng)已經(jīng)實(shí)作頭部相關(guān)傳遞函數(shù)(HRTF)最大組合,并 只剩余圖13的四個(gè)濾波器時(shí),圖14或15的設(shè)定;圖16b描述由圖20的編碼器所決定的上混規(guī)則,其具有造成非能 量守恒上混的上混系數(shù);
圖17描述如何組合頭部相關(guān)傳遞函數(shù)(HRTF),以最終獲得四個(gè) 以頭部相關(guān)傳遞函數(shù)(HRTF)為基礎(chǔ)的濾波器;
圖18描述本發(fā)明多聲道解碼器的優(yōu)選實(shí)施例;
圖19a描述在不進(jìn)行增益修正下以頭部相關(guān)傳遞函數(shù)(HRTF)為 基礎(chǔ)進(jìn)行濾波之后,具有縮放級(jí)的本發(fā)明的多聲道解碼器的第一實(shí)施 例;
圖19b描述利用以頭部相關(guān)傳遞函數(shù)(HRTF)為基礎(chǔ)的濾波器進(jìn) 行調(diào)整之后的本發(fā)明裝置,其形成增益調(diào)整的濾波器輸出信號(hào);以及 圖20顯示一種用于編碼器的范例,其產(chǎn)生針對(duì)非能量守恒上混 規(guī)則的信息。
具體實(shí)施例方式
在詳細(xì)討論本發(fā)明增益調(diào)整觀點(diǎn)之前,現(xiàn)在將聯(lián)系圖7至11來(lái)討 論頭部相關(guān)傳遞函數(shù)(HRTF)濾波器的組合,以及以頭部相關(guān)傳遞函 數(shù)(HRTF)為基礎(chǔ)的濾波器的使用。
為了較好地描繪本發(fā)明的特征與優(yōu)點(diǎn),首先將進(jìn)行一種更詳盡的 敘述。在第7圖中描繪一種立體合成算法。由一組頭部相關(guān)傳遞函數(shù) (HRTF)進(jìn)行一組輸入聲道的濾波。每個(gè)輸入信號(hào)都被分裂成兩個(gè)信 號(hào)(一個(gè)左方(L)以及一個(gè)右方(R)分量);接著這些信號(hào)的每一個(gè) 都被對(duì)應(yīng)于期望聲源位置的頭部相關(guān)傳遞函數(shù)(HRTF)濾波。接著求和(sum)所有的左耳信號(hào)以產(chǎn)生左方立體輸出信號(hào),并接著求和該右 耳信號(hào)以產(chǎn)生右方立體輸出信號(hào)。
該頭部相關(guān)傳遞函數(shù)(HRTF)的巻積操作可以在時(shí)間域中進(jìn)行,
但由于計(jì)算效率的因素,其通常優(yōu)選的是在頻率域中進(jìn)行濾波。在此
情況中,在圖7中所顯示的求和也可以在頻率域中進(jìn)行。
原則上,如同圖7中所描繪的立體合成方法可以被直接使用,以 與動(dòng)態(tài)影像壓縮標(biāo)準(zhǔn)(MPEG)環(huán)繞編碼器/解碼器組合。在圖8中則概 要顯示該動(dòng)態(tài)影像壓縮標(biāo)準(zhǔn)(MPEG)環(huán)繞編碼器。多聲道輸入信號(hào)是 由空間編碼器所分析,并組合空間參數(shù),形成單音或立體聲下混信號(hào)。 該下混可以利用任何的傳統(tǒng)單音或立體聲音頻編碼方式所編碼。所形 成的下混比特流則利用多路傳輸器與該空間參數(shù)組合,形成完整的輸 出比特流。
圖9中顯示組合動(dòng)態(tài)影像壓縮標(biāo)準(zhǔn)(MPEG)環(huán)繞解碼器的立體合 成設(shè)計(jì)。對(duì)該輸入比特流進(jìn)行解多路傳輸,形成空間參數(shù)與下混比特 流。該后者比特流則利用傳統(tǒng)的單音或立體聲解碼器而解碼。空間解 碼器根據(jù)該傳輸空間參數(shù)將該解碼下混進(jìn)行解碼,以產(chǎn)生多聲道輸出。 最后,該多聲道輸出則由如在圖7中所描繪的立體合成級(jí)來(lái)處理,形 成立體輸出信號(hào)。
然而,這樣的動(dòng)態(tài)影像壓縮標(biāo)準(zhǔn)(MPEG)環(huán)繞解碼器與立體合成 模塊的級(jí)聯(lián),至少具有三項(xiàng)缺點(diǎn)
* 以一種中間步驟計(jì)算多聲道信號(hào)表現(xiàn),之后進(jìn)行頭部相關(guān)傳 遞函數(shù)(HRTF)巻積處理并在該立體合成步驟中進(jìn)行下混。雖然在已知每個(gè)音頻信號(hào)可以具有不同空間位置的情況下應(yīng)該以每一聲道為基
礎(chǔ)進(jìn)行頭部相關(guān)傳遞函數(shù)(HRTF)巻積處理,然而從復(fù)雜度的觀點(diǎn)來(lái) 說(shuō),這是一種不想要的情況。
該空間解碼器是在濾波器組(正交鏡相濾波器(QMF))中操 作。另一方面, 一般是在快速傅立葉轉(zhuǎn)換(FFT)域中應(yīng)用頭部相關(guān)傳 遞函數(shù)(HRTF)巻積處理。因此,需要多聲道正交鏡相濾波器(QMF) 合成濾波器組、多聲道離散傅立葉變換(DFT)、以及立體聲反向離散 傅立葉變換(DFT)的級(jí)聯(lián),以形成具有高計(jì)算要求的系統(tǒng)。
* 由該空間解碼器建立可感知的多聲道重建時(shí)所造成的編碼 假像,將可能在該(立體聲)立體輸出中所增強(qiáng)。
圖11中顯示該空間編碼器。多聲道信號(hào)是由Z/、 Ls、 C、 / /與 /fe信號(hào)所組成,其代表左前、左環(huán)繞、中央、右前與右環(huán)繞聲道,并 利用兩個(gè)" 一對(duì)二 (0TT)"單元所處理,每一個(gè)都產(chǎn)生單音下混與用 于兩個(gè)輸入信號(hào)的參數(shù)。該形成的下混信號(hào)與該中央聲道組合,并進(jìn) 一步利用一個(gè)"二對(duì)三(TTT)"編碼器處理,產(chǎn)生立體聲下混與額外 的空間參數(shù)。
一般來(lái)說(shuō),由該"二對(duì)三(TTT)"編碼器所形成的參數(shù)是由針對(duì) 每一參數(shù)波段的一對(duì)預(yù)測(cè)系數(shù)或是一對(duì)程度差異參數(shù)所組成,以描述 該三個(gè)輸入信號(hào)的能量比率。該" 一對(duì)二 (0TT)"編碼器的參數(shù)則是 利用針對(duì)每個(gè)頻帶的輸入信號(hào)之間的程度差異與相干性,或是互相關(guān) 性值所組成。
圖12描繪一種動(dòng)態(tài)影像壓縮標(biāo)準(zhǔn)(MPEG)環(huán)繞解碼器。將該下混信號(hào)10與rO輸入至二對(duì)三(TTT)模塊之中,以重建中央聲道、右側(cè)
聲道與左側(cè)聲道。這三個(gè)聲道則進(jìn)一步由
水給1
理,以產(chǎn)生六個(gè)輸出聲道
:水^^卄
對(duì)二 (OTT)模塊所處
-丄-附ii附|2
=
Cot31'"32一
從圖10中所顯示的概念觀點(diǎn),可以看到所對(duì)應(yīng)的立體解碼器。其 中該濾波器組域、該立體聲輸入信號(hào)("、厄)由二對(duì)三(TTT)解碼 器所處理,形成三個(gè)信號(hào)乙/ 及C。此三個(gè)信號(hào)接著進(jìn)行頭部相關(guān)傳 遞函數(shù)(HRTF)參數(shù)處理。所形成的六個(gè)聲道則進(jìn)行求和,以產(chǎn)生該 立體聲立體輸出對(duì)(厶、/ A)。
該二對(duì)三(TTT)解碼器可以由下述矩陣運(yùn)算所描述
所具有的矩陣項(xiàng)目l則與空間參數(shù)有關(guān)。該空間參數(shù)與矩陣項(xiàng)目 的關(guān)系對(duì)于例如在5. 1多聲道動(dòng)態(tài)影像壓縮標(biāo)準(zhǔn)(MPEG)環(huán)繞解碼器 的關(guān)系而言為唯一的。該三個(gè)形成信號(hào)丄、/ 及C的每一個(gè)都被分裂為 兩個(gè),并利用與這些聲源位置的期望(感知)位置相對(duì)應(yīng)的頭部相關(guān) 傳遞函數(shù)(HRTF)參數(shù)進(jìn)行處理。對(duì)于中央聲道(C)而言,可以直接 地應(yīng)用該聲源位置的空間參數(shù),形成兩個(gè)代表中央的輸出信號(hào)^(0 及糊:
對(duì)于左方a)聲道而言,來(lái)自于左前方與左環(huán)繞聲道的頭部相關(guān)
傳遞函數(shù)(HRTF)參數(shù)則利用權(quán)重w,與^組合于單一頭部相關(guān)傳遞 函數(shù)(HRTF)參數(shù)集合之中。所形成的"合成(composite)"頭部相關(guān)傳遞函數(shù)(HRTF)參數(shù)則利用統(tǒng)計(jì)概念模擬前方與環(huán)繞聲道兩者的 效果。該后續(xù)方程式則用來(lái)產(chǎn)生代表該左方聲道的立體輸出對(duì)("、 厄)
,)—
以一種相似的形式,也可以根據(jù)以下方程來(lái)獲得代表該右方聲道
的立體輸出
—;w1
—,)_
在已知上述對(duì)于^(C)、厄(C)、 "L)、厄(L)、 "(R)與厄(R)的定 義下,該完整的^與^信號(hào)可以在已知該立體聲輸入信號(hào)的情況下, 從單一的2X2矩陣所導(dǎo)出
—V、,V
力2|人
g巾
、,'/^(丄)+ ,,) + /^(c)
/Zj2 =附'2/^ (丄)+ '"22//丄(i ) + W32//£ (C)
該Hx(Y)濾波器可以表示為一種該原始頭部相關(guān)傳遞函數(shù)(HRTF) 濾波器的參數(shù)形式的參數(shù)加權(quán)組合。為了使其能夠完成,該原始頭部 相關(guān)傳遞函數(shù)(HRTF)濾波器則表示為
* 代表該左耳脈沖響應(yīng)的每個(gè)頻帶的(平均)程度;
* 代表該右耳脈沖響應(yīng)的每個(gè)頻帶的(平均)程度;
* 代表該左耳與右耳脈沖響應(yīng)之間的(平均)抵達(dá)時(shí)間或相位差異。
因此,在已知該中央聲道輸入信號(hào)的情況下,代表該左耳與右耳 的頭部相關(guān)傳遞函數(shù)(服TF)濾波器可以表示為
X(c)——P/CCK^^-
-"R(C)-
其中A(6)為代表該左耳一已知頻帶下的平均程度,而-(Q則為該 相位差異。
因此,該頭部相關(guān)傳遞函數(shù)(HRTF)參數(shù)可能簡(jiǎn)單地由利用/V與 尸.的信號(hào)乘法運(yùn)算所組成,其對(duì)應(yīng)于該中央聲道的聲源位置,同時(shí)該 相位差異對(duì)稱(chēng)地分布。此處理對(duì)于每個(gè)正交鏡相濾波器(QMF)組而言 都可以獨(dú)立地進(jìn)行,其在一波段上從頭部相關(guān)傳遞函數(shù)(HRTF)參數(shù) 映射至正交鏡相濾波器(QMF)組,另一方面也從該空間參數(shù)映射至該 正交鏡相濾波器(QMF)組。
相似的,在已知該左聲道與右聲道的情況下,代表該左耳與右耳 的頭部相關(guān)傳遞函數(shù)(服TF)濾波器可以由以下方程所給定
明顯的,對(duì)于該六個(gè)原始聲道,該頭部相關(guān)傳遞函數(shù)(HRTF)為 代表該參數(shù)化頭部相關(guān)傳遞函數(shù)(HRTF)濾波器的程度與相位差異的 加權(quán)組合。
該權(quán)重^與i則與用于左前方(Lf)及左環(huán)繞(Ls)的一對(duì)二(0TT)功能區(qū)塊的聲道強(qiáng)度差異(CLD)參數(shù)有關(guān)
而該權(quán)重,w與i則與用于右前方(Rf)及右環(huán)繞(Rs)的一對(duì) 二 (OTT)功能區(qū)塊的聲道強(qiáng)度差異(CLD)參數(shù)有關(guān)
該上述解決方式對(duì)于短頭部相關(guān)傳遞函數(shù)(HRTF)濾波器可以良 好應(yīng)用,其有效精確性可以表示為每個(gè)頻帶的平均程度,以及每個(gè)頻 帶的平均相位差異。然而,對(duì)于長(zhǎng)回聲頭部相關(guān)傳遞函數(shù)(HRTF)而 言,其并不適用。
本發(fā)明將教導(dǎo)如何將2X2矩陣立體解碼器擴(kuò)展至能夠處理任意 長(zhǎng)度的頭部相關(guān)傳遞函數(shù)(HRTF)濾波器。為了達(dá)到此目的,本發(fā)明 包括以下步驟
* 將該頭部相關(guān)傳遞函數(shù)(HRTF)濾波器響應(yīng)轉(zhuǎn)換至濾波器組
域;
* 從頭部相關(guān)傳遞函數(shù)(HRTF)濾波器對(duì)取得全體延遲差異或 相位差異;
* 將該頭部相關(guān)傳遞函數(shù)(服TF)濾波器對(duì)的響應(yīng),成型 (morph)為該聲道強(qiáng)度差異(CLD)參數(shù)的函數(shù);
* 增益調(diào)整。
這可以利用六個(gè)濾波器置換代表F="、 / 。與I二乙/ 、 C的六個(gè)復(fù) 數(shù)增益佑U)所達(dá)成。這些濾波器是從代表F二"、 7 。與J4/、 "、仏、C的十個(gè)濾波器佑U)所導(dǎo)出而得,其描述正交鏡相濾波器(QMF)
域中的已知頭部相關(guān)傳遞函數(shù)(HRTF)濾波器響應(yīng)。這些正交鏡相濾 波器(QMF)表示可以根據(jù)以下敘述的方法所達(dá)成。
根據(jù)以下方程,利用復(fù)數(shù)線(xiàn)性組合執(zhí)行前方與環(huán)繞聲道濾波器的
成型
該相位參數(shù)《^可以從該前方與后方頭部相關(guān)傳遞函數(shù)(HRTF)濾 波器之間的主要延遲時(shí)間差異、T,以及該正交鏡相濾波器(QMF)組 的子帶指標(biāo)仏通過(guò)以下方程來(lái)定義
此相位參數(shù)在濾波器成型中具有雙重角色。首先,其在迭加之前 實(shí)現(xiàn)了兩個(gè)濾波器的延遲補(bǔ)償,從而形成模擬對(duì)應(yīng)于該前方與后方揚(yáng) 聲器之間的源位置的延遲時(shí)間的組合響應(yīng)。第二,其使得所需要的增 益補(bǔ)償因子g更加穩(wěn)定,并與利用&=0所進(jìn)行的簡(jiǎn)單迭加情況相比, 對(duì)于頻率呈現(xiàn)緩慢變化。 .
該增益因子g則利用相同的非諧和額外功率規(guī)則所定義,如同用 于參數(shù)頭部相關(guān)傳遞函數(shù)(HRTF)的情況,
射
而PAT為下述濾波器之間的正規(guī)化復(fù)數(shù)互相關(guān)的實(shí)數(shù)數(shù)值exp(-./DA(D及/^(^)
在利用&=0進(jìn)行簡(jiǎn)單迭加的情況中,/^數(shù)值以頻率為函數(shù),呈
現(xiàn)不穩(wěn)定振蕩的變化方式,其造成需要廣泛的增益調(diào)整。在實(shí)際實(shí)現(xiàn) 中,需要限制增益因子g的數(shù)值,且該信號(hào)的剩余頻譜染色效應(yīng)無(wú)法 避免。
相比之下,利用本發(fā)明所教導(dǎo)以延遲為基礎(chǔ)的相位補(bǔ)償成型,形 成以頻率為函數(shù)的^r平滑行為。此數(shù)值對(duì)于利用濾波器對(duì)所導(dǎo)出的自
然頭部相關(guān)傳遞函數(shù)(HRTF)而言通常接近于一,因?yàn)槠渲饕牟煌?在于延遲與振幅,而該相位參數(shù)目的便是考慮該正交鏡相濾波器(QMF) 組域中的延遲差異。
相位參數(shù)^r的另一替代有利選擇是利用下述兩濾波器之間的正
規(guī)化復(fù)數(shù)互相關(guān)相位角度計(jì)算所得
//r(z/)&//r(xs)
并且利用標(biāo)準(zhǔn)展開(kāi)(unwrapping)技術(shù)將該相位數(shù)值展開(kāi)為該正 交鏡相濾波器(QMF)組子帶指針/7的函數(shù)。此選擇造成^^永遠(yuǎn)不會(huì)
成為負(fù)值,因此該補(bǔ)償增益g對(duì)于所有子帶而言都滿(mǎn)足1/^《^1。此 外,此相位參數(shù)的選擇使得在主要延遲時(shí)間差異^無(wú)法利用的情況 時(shí),也能進(jìn)行該前方與環(huán)繞聲道濾波器成型。
以下考慮的信號(hào),為來(lái)自于離散時(shí)間信號(hào)的調(diào)制濾波器組或加窗 快速傅立葉變換(FFT)分析的子帶樣本,或是來(lái)自于離散時(shí)間信號(hào)。 可了解的是,這些子帶必須利用對(duì)應(yīng)的合成濾波器組操作,轉(zhuǎn)換回到 離散時(shí)間域中。圖1描述一種利用與頭部相關(guān)傳遞函數(shù)(HRTF)相關(guān)的濾波器, 進(jìn)行參數(shù)化多聲道信號(hào)的立體合成的過(guò)程??臻g解碼101根據(jù)#個(gè)傳 輸聲道與傳輸空間參數(shù)產(chǎn)生包括^個(gè)聲道的多聲道信號(hào)(,M。接著 借助于頭部相關(guān)傳遞函數(shù)(HRTF)濾波器將這些^個(gè)聲道轉(zhuǎn)換至代表 立體收聽(tīng)的兩輸出聲道。該頭部相關(guān)傳遞函數(shù)(HRTF)濾波102將每 個(gè)輸入聲道的濾波結(jié)果迭加,其中一個(gè)頭部相關(guān)傳遞函數(shù)(HRTF)濾 波器用于左耳,而另一頭部相關(guān)傳遞函數(shù)(HRTF)濾波器用于右耳。 總的來(lái)說(shuō),其需要2iV個(gè)濾波器。然而,當(dāng)通過(guò)W個(gè)揚(yáng)聲器聆聽(tīng)時(shí),參 數(shù)化多聲道信號(hào)可實(shí)現(xiàn)高質(zhì)量的收聽(tīng)者體驗(yàn),#個(gè)信號(hào)之間的細(xì)微內(nèi) 部相關(guān)性將造成對(duì)于該立體收聽(tīng)的假像。這些假像則由來(lái)自于編碼之 前進(jìn)行原始^個(gè)聲道頭部相關(guān)傳遞函數(shù)(HRTF)濾波所定義的參考立 體信號(hào)頻譜內(nèi)容中的差異所主導(dǎo)。此串接的另一項(xiàng)缺點(diǎn)為,針對(duì)立體 合成的總體計(jì)算成本是用于該每一組件101及102所需要的成本的附 加。
圖2描述一種利用本發(fā)明所教導(dǎo)組合濾波方式所進(jìn)行的參數(shù)化多 聲道信號(hào)的立體合成。該傳輸空間參數(shù)則由201分裂成兩個(gè)集合,集 合1與集合2。在此,集合2包括從該#個(gè)傳輸聲道建立該尸個(gè)中間 聲道的有關(guān)參數(shù),而集合1包括從該尸個(gè)中間聲道建立該#個(gè)聲道的 有關(guān)參數(shù)?,F(xiàn)有技術(shù)中的預(yù)組合器202利用權(quán)重將該2W個(gè)與該頭部相 關(guān)傳遞函數(shù)(HRTF)相關(guān)的子帶濾波器的選擇對(duì)進(jìn)行組合,該權(quán)重則 與參數(shù)集合1及該選擇的濾波器對(duì)相關(guān)。此預(yù)組合的結(jié)果是產(chǎn)生2尸個(gè) 立體子帶濾波器,其表現(xiàn)用于該尸個(gè)中間聲道的每一個(gè)的立體濾波器對(duì)。本發(fā)明的組合器203利用與該參數(shù)組合2及該2尸個(gè)立體子帶濾波 器兩者相關(guān)的權(quán)重,將該2P個(gè)立體子帶濾波器組合成為一組2¥個(gè)立 體子帶濾波器。相比之下,現(xiàn)有技術(shù)的線(xiàn)性組合器可以應(yīng)用只與該參 數(shù)集合2相關(guān)的權(quán)重。所形成的2#個(gè)濾波器的組則由用于該#個(gè)傳輸 聲道的每一個(gè)的立體濾波器對(duì)所組成。該組合濾波單元204藉由利用 該對(duì)應(yīng)濾波器對(duì)濾波的方式,獲得用于該#個(gè)傳輸聲道的每一個(gè)的兩 聲道輸出的貢獻(xiàn)對(duì)。接著,進(jìn)行所有#個(gè)貢獻(xiàn)的求和,以形成子帶域 中的兩聲道輸出。
圖3描述本發(fā)明的組合器203的組件,其用于空間參數(shù)與立體濾 波器的組合。該線(xiàn)性組合器301利用施加從已知頻譜參數(shù)所導(dǎo)出的權(quán) 重,將該2尸個(gè)立體子帶濾波器組合成為2#個(gè)立體濾波器,其中這些
空間參數(shù)為從該#個(gè)傳輸聲道建立該尸個(gè)中間聲道的有關(guān)參數(shù)。具體 來(lái)說(shuō),此線(xiàn)性組合仿真從該#個(gè)傳輸聲道至該尸個(gè)中間聲道的上混, 以及之后從尸個(gè)源進(jìn)行立體濾波的串接。增益調(diào)整器303利用對(duì)每一 個(gè)對(duì)應(yīng)于左耳輸出的濾波器施加公共左方增益的方式,以及對(duì)每一個(gè) 對(duì)應(yīng)于右耳輸出的濾波器施加公共右方增益的方式,修正來(lái)自該線(xiàn)性 組合器301所輸出的2#個(gè)立體濾波器。這些增益來(lái)自于從空間參數(shù)與 該2尸個(gè)立體濾波器導(dǎo)出增益的增益計(jì)算器301。本發(fā)明的組件302與 303所進(jìn)行的增益調(diào)整的目的,在于補(bǔ)償該尸個(gè)中間聲道在具有空間 解碼線(xiàn)性相關(guān)性時(shí),因?yàn)樵摼€(xiàn)性組合器301所造成的非預(yù)期頻譜染色 效果。由本發(fā)明所教導(dǎo)的增益計(jì)算器302包含以該頻譜參數(shù)為函數(shù)進(jìn) 行該尸個(gè)中間聲道的能量分布估計(jì)的裝置。圖4描述在立體聲傳輸信號(hào)情況中,動(dòng)態(tài)影像壓縮標(biāo)準(zhǔn)環(huán)繞(MPEG Surround)空間解碼的結(jié)構(gòu)。該12個(gè)傳輸信號(hào)的分析子帶被提供至 二對(duì)三(2">3)功能區(qū)塊401之中,其輸出A3個(gè)中間信號(hào),組合左 方、組合右方以及組合中央信號(hào)。此上混與該傳輸空間參數(shù)的子集合 有關(guān),其對(duì)應(yīng)于圖2中的集合2。這三個(gè)中間信號(hào)接著被提供至三個(gè) 一對(duì)二 ( 1 + 2)功能區(qū)塊402-404之中,其產(chǎn)生總數(shù)為,6的信號(hào)405: 左前方(7,)、左環(huán)繞(L)、右前方(/>)、右環(huán)繞(A)、中央(c)以 及低頻增強(qiáng)(2/e)。此上混與該傳輸空間參數(shù)的子集合有關(guān),其對(duì)應(yīng) 于圖2中的集合1。最終的多聲道數(shù)字音頻輸出通過(guò)將該六個(gè)子帶信 號(hào)傳送至六個(gè)合成濾波器組處來(lái)建立。
圖5描述利用本發(fā)明增益補(bǔ)償所解決的問(wèn)題。代表該左耳的參考 頭部相關(guān)傳遞函數(shù)(HRTF)濾波立體輸出頻譜則利用實(shí)心圖形所描繪。 虛線(xiàn)圖形則描繪利用圖2的方法所產(chǎn)生的對(duì)應(yīng)解碼信號(hào)的頻譜,其中 該組合器203只由線(xiàn)性組合器301所組成。如同可見(jiàn)的,在頻率區(qū)間 3-4千赫與11-13千赫中,存在相對(duì)于期望參考頻譜的大量頻譜能量 損失。在1千赫與10千赫附近也存在少量的頻譜增大。
圖6描述利用本發(fā)明增益補(bǔ)償?shù)膬?yōu)點(diǎn)。實(shí)心圖形與圖5中的參考 頻譜相同,而現(xiàn)在該虛線(xiàn)圖形描繪利用圖2的方法所產(chǎn)生的解碼信號(hào) 的頻譜,其中該組合器203由圖3中的所有組件所組成。如同可見(jiàn)的, 與圖5中的兩條曲線(xiàn)相比,該兩條曲線(xiàn)之間獲得明顯改善的頻譜吻合。
在之后的文字中,將大致說(shuō)明本發(fā)明增益補(bǔ)償?shù)臄?shù)學(xué)描述。對(duì)于 離散復(fù)數(shù)信號(hào)義、y而言,該復(fù)數(shù)內(nèi)積與平方模數(shù)(能量)定義為義=|卜-『=〈x, x〉 = Z
(1)
其中WQ為;^)的復(fù)數(shù)共軛信號(hào)。
該原始多聲道信號(hào)則由^個(gè)聲道所組成,而每個(gè)聲道都具有與其 關(guān)聯(lián)的、與立體頭部相關(guān)傳遞函數(shù)(HRTF)相關(guān)的濾波器對(duì)。然而在 此將假設(shè)該參數(shù)化多聲道信號(hào)是利用從該#個(gè)傳輸聲道至尸個(gè)預(yù)測(cè)聲 道的預(yù)測(cè)上混中間步驟所建立的。此結(jié)構(gòu)在如同圖4中所描述的動(dòng)態(tài) 影像壓縮標(biāo)準(zhǔn)環(huán)繞(MPEG Surround)中使用。假設(shè)該2W個(gè)頭部相關(guān) 傳遞函數(shù)(HRTF)相關(guān)濾波器的原始集合,已經(jīng)利用現(xiàn)有技術(shù)的預(yù)組 合器202減少成為代表該尸個(gè)預(yù)測(cè)聲道中每一個(gè)的濾波器對(duì),其中#
^/^見(jiàn)該尸個(gè)預(yù)測(cè)聲道信號(hào)^,尸l、 2、…、尸,旨在逼近該尸個(gè)聲 道信號(hào)4,尸l、 2、…、尸,這些信號(hào)是通過(guò)部分下混從該原始vV個(gè)聲 道所導(dǎo)出的。在動(dòng)態(tài)影像壓縮標(biāo)準(zhǔn)環(huán)繞(MPEG Surround)中,這些信 號(hào)為組合左方、組合右方、與組合并縮放的中央/低頻增強(qiáng)(lfe)聲 道。假設(shè)與該信號(hào)^對(duì)應(yīng)的頭部相關(guān)傳遞函數(shù)(HRTF)濾波器對(duì),是 利用代表該左耳的子帶濾波器".p以及代表該右耳的子帶濾波器Z^來(lái) 描述。該參考立體輸出信號(hào)便因此可對(duì)于/7二l、 2,利用濾波信號(hào)的線(xiàn) 性迭加來(lái)計(jì)算,
^ (2)
其中星號(hào)表示在時(shí)間方向中的巻積計(jì)算。該子帶濾波器可以利用有限沖激響應(yīng)(FIR)濾波器、無(wú)限沖激響應(yīng)(IIR)的形式所給定, 或是從濾波器的參數(shù)族(parameterized family)所導(dǎo)出。
在該編碼器中,該下混是由利用將^X尸下混矩陣D應(yīng)用至由z, fl、 2、…、尸所形成列向量信號(hào)的方式所形成的,而在該解碼器中 l將尸Xf預(yù)測(cè)矩陣C應(yīng)用至由該#個(gè)傳輸下混聲道&、
f1、…、#所形成的列向量信號(hào)的方式所執(zhí)行,
(3)
在該解碼器處知悉該兩者矩陣,并忽略該下混聲道的編碼效應(yīng),
該:
組合效果可以利用下式計(jì)算:
其中a^為該矩陣乘積A二CD的項(xiàng),
(4)
一種用于在該解碼器處產(chǎn)生立體輸出的直向(straightforward)
方法是,簡(jiǎn)單地將預(yù)測(cè)信號(hào)、插入(2)中,形成 產(chǎn)i
(5)
就計(jì)算方面來(lái)說(shuō),該立體濾波是事先與該預(yù)測(cè)上混組合,因此(5) 可以寫(xiě)為
(6)
而該組合濾波器則定義為 p=1
此方程式描述該線(xiàn)性組合器301的作用,其將利用空間參數(shù)所導(dǎo)出的系數(shù)C^與該立體子帶域?yàn)V波器久p組合。當(dāng)原始的尸個(gè)信號(hào)&
具有基本上由#所限定的數(shù)值排序時(shí),該預(yù)測(cè)便可以被設(shè)計(jì)為良好地
執(zhí)行,而且該逼近^"5是成立的。這在例如如果只有該尸個(gè)聲道之 中的#個(gè)有效時(shí)、或是如果重要的信號(hào)成分是源自于振幅搖擺
(amplitude panning)時(shí)便會(huì)發(fā)生。在該情況中,該解碼立體信號(hào)(5) 對(duì)于該參考(2)有良好的吻合。另一方面,在一般情況、以及特別是在 原始的尸個(gè)信號(hào)Xp并不相關(guān)的情況下,將存在大量的預(yù)測(cè)損失,且源 自于(5)的輸出可以明顯地與源自于(2)的能量有所差異。由于該差異 在不同頻帶中有所不同,最終的音頻輸出也遭受到如在圖5中所描述 的頻譜染色假像。本發(fā)明教導(dǎo)如何利用對(duì)該輸出進(jìn)行增益補(bǔ)償?shù)姆绞?避免此問(wèn)題的發(fā)生,其根據(jù)以下方程
(8)
就計(jì)算方面來(lái)說(shuō),根據(jù)該增益調(diào)整器303K":g"、")改變?cè)摻M 合濾波器,可以有利地進(jìn)行增益補(bǔ)償。接著,該修正組合濾波變成為
=' (9)
在(8)中的補(bǔ)償增益的最佳數(shù)值為
(10)
該增益計(jì)算器302的目的是用以根據(jù)該解碼器中可獲得的信息來(lái) 估計(jì)這些增益?,F(xiàn)在將描述用于此項(xiàng)目的多種工具。在此該可獲得的 信息是由矩陣項(xiàng)目SM以及與頭部相關(guān)傳遞函數(shù)(HRTF)相關(guān)的子帶濾 波器Z^所表示。首先,后續(xù)逼近將被假設(shè)用于已經(jīng)利用與該頭部相關(guān)傳遞函數(shù)(服TF)相關(guān)子帶濾波器6、 t/所濾波信號(hào);r、 y之間的內(nèi)積,
〈6 *x, J "〉 ^ 〈Z ,d〉〈x,y〉 (11)
此逼近是根據(jù)通常該濾波器的最大能量是集中在主導(dǎo)單一輸出
(single tap),接著預(yù)先假定該應(yīng)用時(shí)間頻率轉(zhuǎn)換的時(shí)間步長(zhǎng)(st印) 與該頭部相關(guān)傳遞函數(shù)(服TF)濾波器的主要延遲差異相比之下是足 夠大的。應(yīng)用逼近(11)與(2)組合,形成
IWI2 S〈K》〈X
下一逼近包括假設(shè)原始信號(hào)是不相關(guān)的
(12)
即對(duì)于而言
。則(12)簡(jiǎn)化為
5>",
pii ii、
對(duì)于解碼能量而言,對(duì)應(yīng)于(12)的結(jié)果為
尸
W2 w Z〈K》〈"〉
/ ,< =i
(14)
在(14)中插入該預(yù)測(cè)信號(hào)(4),并應(yīng)用原始信號(hào)為不相關(guān)的假設(shè),
滯
4 1X/A,p〈H)
(15)
接下來(lái),為了能夠計(jì)算由商(10)所給定的補(bǔ)償增益,估計(jì)該能量
分布l卜』2, fl、 2、…、尸,尸為最大至任意因子的原始聲道數(shù)目。本 發(fā)明教導(dǎo)如何通過(guò)利用能量分布的函數(shù),計(jì)算對(duì)應(yīng)于該假設(shè)的預(yù)測(cè)矩
陣"。^而完成此項(xiàng)工作,其中這些聲道彼此不相關(guān),而該編碼器的目 標(biāo)為將該預(yù)測(cè)誤差最小化。如果可能的話(huà),接著通過(guò)求解非線(xiàn)性方程式系統(tǒng)"。w《估計(jì)該能量分布。對(duì)于形成不具有解的方程式系統(tǒng)的預(yù) 測(cè)參數(shù)而言,該增益補(bǔ)償因子則設(shè)定為^=1。此發(fā)明步驟將在后續(xù)段 落中,針對(duì)最重要的特別情況詳細(xì)描述。
由(15)所增加的計(jì)算負(fù)載可以在A臉1的情況中,利用以下擴(kuò)展
方式(例如參考PCT/EP2005/011586)來(lái)減少
<formula>formula see original document page 29</formula> (16)
其中K為具有分量^的單位向量,使得Dv二O,而A^為預(yù)測(cè)損失
<formula>formula see original document page 29</formula>
(17)
(15)的計(jì)算接著可以利用在(14)中應(yīng)用(16)而有利的取代,結(jié)果
<formula>formula see original document page 29</formula>
(18)
接著,將討論從兩聲道預(yù)測(cè)三個(gè)聲道的優(yōu)選特別處理。,2與A3 的情況在動(dòng)態(tài)影像壓縮標(biāo)準(zhǔn)環(huán)繞(MPEG Surround)的情況中使用。該 信號(hào)為組合左方,,=厶組合右方A=r以及(縮放)組合中央/低頻增
強(qiáng)(lfe)聲道義3二"下混矩陣為 D =
<formula>formula see original document page 29</formula>
(19)
而由兩傳輸實(shí)數(shù)參數(shù)Q、 C2所建構(gòu)的預(yù)測(cè)矩陣,則為
<formula>formula see original document page 29</formula>
(20)
在該原始聲道為不相關(guān)的假設(shè)之下,完成該最小化預(yù)測(cè)誤差的預(yù)
測(cè)矩陣如下<formula>formula see original document page 30</formula>
"。w二C,獲得由本發(fā)明所教導(dǎo)的(未正規(guī)化)能量分布
<formula>formula see original document page 30</formula> (22)
其中,a"1-c,)/3、 〃 = (1-c2)/3、 cn + 〃而;^a/ 。這在以下所
定義的變量范圍中適用
<formula>formula see original document page 30</formula> (23)
其中該預(yù)測(cè)誤差可以由相同的縮放方式中獲得
<formula>formula see original document page 30</formula> (24)
因?yàn)?amp;3=2+1二,1,利用(16)-(18)所描繪的方法也可適用。該單
位向量為h,v2,v3^[1,1,—W^,并具有下述定義
<formula>formula see original document page 30</formula> (25)
以及
<formula>formula see original document page 30</formula> (26)
在該增益計(jì)算器302的優(yōu)選實(shí)施例中,所計(jì)算用于每個(gè)耳朵rl、 2的補(bǔ)償增益可以表示為
<formula>formula see original document page 30</formula>
如果a> 0'#>0,£7<1; 否則
<formula>formula see original document page 30</formula> (27)
在此e 〉0為一小數(shù)目,其目的在于穩(wěn)定靠近該變量參數(shù)范圍邊緣 的方程式,而^x為所應(yīng)用的補(bǔ)償增益的上限。(27)的增益對(duì)于左耳與 右耳/7=1、 2不同。本方法的變體是使用共同增益幼=^=&其中謹(jǐn)i gn
如果o: > > o,O" <1 否則
(28)
本發(fā)明的修正增益因子可以在不牽涉任何與頭部相關(guān)傳遞函數(shù) (服TF)相關(guān)議題下,與可用的直向多聲道增益補(bǔ)償共存。
在動(dòng)態(tài)影像壓縮標(biāo)準(zhǔn)環(huán)繞(MPEG Surround)中,用于預(yù)測(cè)損失的 補(bǔ)償已經(jīng)在該解碼器中通過(guò)把因子1/P與該上混矩陣C相乘的方式而 應(yīng)用,其中0〈p 為該傳輸空間參數(shù)的一部分。其中(27)與(28)的 增益已經(jīng)分別由乘積Pa與Pg所取代。這種補(bǔ)償應(yīng)用于在圖5和6 中所研究的立體解碼。這也是圖5的現(xiàn)有技術(shù)解碼方式與參考相比具 有增大頻譜部分的原因。對(duì)于對(duì)應(yīng)于那些頻率區(qū)域的子帶而言,本發(fā) 明的增益補(bǔ)償有效地利用由方程式(28)所導(dǎo)出的較小數(shù)值,取代該傳 輸參數(shù)增益因子1/P。
此外,因?yàn)镻^的情況對(duì)應(yīng)于成功的預(yù)測(cè),因此由本發(fā)明所教導(dǎo) 的增益補(bǔ)償?shù)母J氐淖凅w將造成用于P 二l的立體增益補(bǔ)償失效。
此外,本發(fā)明也可以與殘余信-
環(huán)繞(MPEG Surround)中,可以傳輸額
-起使用。在動(dòng)態(tài)影像壓縮標(biāo)準(zhǔn) ^H言號(hào)&,而使得
可以更準(zhǔn)確地再現(xiàn)該原始/^3的信號(hào)a。在此情況中,該增益補(bǔ)償是 由現(xiàn)在將要描繪的立體殘余信號(hào)加法所取代。由殘余信號(hào)所加強(qiáng)的預(yù) 測(cè)上混根據(jù)以下方程所形成
m=l
(29)
31其中卜, 3] = [1,1,-1]/3。利用、代替在(5)中的、,形成相應(yīng)的 組合濾波,
" (30) 其中對(duì)于/zpl、 2的組合濾波器力w由(7)所定義,而用于該殘余 加法的組合濾波器則定義為
"'3 3、"'"'2 "" (31) 此解碼模式的完整結(jié)構(gòu)便因此利用設(shè)定A臉3的方式,并利用修 改該組合器203以?xún)H執(zhí)行由(7)與(31)所定義的線(xiàn)性組合,而以圖2進(jìn) 行描述。
圖13描述了圖3中的線(xiàn)性組合器301的結(jié)果的修改表示。該組合 器的結(jié)果是四個(gè)以頭部相關(guān)傳遞函數(shù)(HRTF)為基礎(chǔ)的濾波器hu、 h12、 h2,與h22。如同利用圖16a與17的描述,更加清楚的是這些濾波器對(duì) 應(yīng)于圖16a中由15、 16、 17、 18所指示的濾波器。
圖16a顯示一聆聽(tīng)者的頭部,其具有左耳或左方立體點(diǎn)以及具有 右耳或右方立體點(diǎn)。當(dāng)圖16a只與立體聲方案有關(guān)時(shí),該濾波器15、 16、 17、 18則為一般的頭部相關(guān)傳遞函數(shù),其能夠被單獨(dú)地測(cè)量,或 是通過(guò)因特網(wǎng)而獲得,或是在針對(duì)聆聽(tīng)者與該左方聲道揚(yáng)聲器和右方 聲道揚(yáng)聲器之間不同位置的教科書(shū)(textbook)中獲得。
然而,因?yàn)楸景l(fā)明教導(dǎo)一種多聲道立體解碼器,利用15、 16、 17、 18所描述的濾波器便不是純粹的頭部相關(guān)傳遞函數(shù)(HRTF)濾波器, 而是以頭部相關(guān)傳遞函數(shù)(HRTF)為基礎(chǔ)的濾波器,其不但反映頭部相關(guān)傳遞函數(shù)(HRTF)的性質(zhì),也與空間參數(shù)有關(guān),特別是結(jié)合圖2 討論時(shí),與該空間參數(shù)集合l以及空間參數(shù)集合2有關(guān)。
圖14顯示在圖16a中所使用的代表以頭部相關(guān)傳遞函數(shù)(HRTF) 為基礎(chǔ)的濾波器的準(zhǔn)則。特別是描述一聆聽(tīng)者位在介于五聲道揚(yáng)聲器 設(shè)置中的五個(gè)揚(yáng)聲器之間的甜點(diǎn)(sweet spot)的情況,舉例而言, 該設(shè)置可以在一般的環(huán)繞家庭或電影院娛樂(lè)系統(tǒng)中找到。對(duì)于每個(gè)聲 道而言,存在兩個(gè)頭部相關(guān)傳遞函數(shù)(HRTF),其可以被轉(zhuǎn)換為具有以 頭部相關(guān)傳遞函數(shù)(HRTF)做為傳遞函數(shù)的濾波器的聲道沖激響應(yīng)。 特別是在本領(lǐng)域中所熟知的, 一種以頭部相關(guān)傳遞函數(shù)(HRTF)為基 礎(chǔ)的濾波器可以負(fù)責(zé)聆聽(tīng)者頭部之中的聲音傳播,因此,舉例而言, 圖14中的頭部相關(guān)傳遞函數(shù)1 (服TF1)負(fù)責(zé)從揚(yáng)聲器L所發(fā)出的聲 音在通過(guò)該聆聽(tīng)者頭部附近之后抵達(dá)右耳的情況。與其相比,從左環(huán) 繞揚(yáng)聲器L所發(fā)出的聲音幾乎直接抵達(dá)左耳,并只部分地受到在該頭 部耳朵位置以及該耳朵形狀等等的影響。因此,明顯的是該頭部相關(guān) 傳遞函數(shù)l (服TF1)與頭部相關(guān)傳遞函數(shù)2 (服TF2)彼此并不相同。
對(duì)于左方聲道的頭部相關(guān)傳遞函數(shù)3 (HRTF 3)與頭部相關(guān)傳遞 函數(shù)4 (HRTF 4)而言也同樣成立,因?yàn)殡p耳對(duì)于該左方聲道L的關(guān) 系是不同的。對(duì)于其它頭部相關(guān)傳遞函數(shù)(HRTF)而言也同樣適用, 雖然從圖14可以明顯得知,用于中央聲道的頭部相關(guān)傳遞函數(shù)5(冊(cè)TF 5)與頭部相關(guān)傳遞函數(shù)6 (HRTF6)彼此幾乎相同或是完全相同,除 非可以由該頭部相關(guān)傳遞函數(shù)(HRTF)數(shù)據(jù)調(diào)整各個(gè)聆聽(tīng)者的不對(duì)稱(chēng) 性。如同以上所陳述的,這些頭部相關(guān)傳遞函數(shù)(HRTF)已經(jīng)針對(duì)模 擬頭部而確定,并能夠針對(duì)任何特定的"平均頭部"、以及揚(yáng)聲器設(shè) 定而下載。
現(xiàn)在,隨著圖17中171與172變得明顯的是,采用一種組合方式 將該左方聲道與該左環(huán)繞聲道組合,以獲得在圖15中利用L'所指出 的用于左側(cè)的兩個(gè)以頭部相關(guān)傳遞函數(shù)(HRTF)為基礎(chǔ)的濾波器。該 相同的步驟也同樣針對(duì)右側(cè)而執(zhí)行,如在圖15中以R'所描述,其形 成頭部相關(guān)傳遞函數(shù)13 (HRTF 13)與頭部相關(guān)傳遞函數(shù)14 (HRTF 14)。 為此目的,也同樣參考圖17中的項(xiàng)目173及174。然而,在此應(yīng)該注 意的是,對(duì)于組合項(xiàng)目171、 172、 173與174中的各個(gè)頭部相關(guān)傳遞 函數(shù)(HRTF),考慮反映介于該原始設(shè)定的左方(L)聲道與Ls聲道之 間、或是介于該原始多聲道設(shè)定的右方(R)聲道與Rs聲道之間的聲 道間強(qiáng)度差異參數(shù)。特別是,這些參數(shù)定義了進(jìn)行頭部相關(guān)傳遞函數(shù) (HRTF)線(xiàn)性組合時(shí)的權(quán)重因子。
如同在之前描述的,當(dāng)組合頭部相關(guān)傳遞函數(shù)(HRTF)時(shí)也可以 應(yīng)用相位因子,該相位因子是利用被組合頭部相關(guān)傳遞函數(shù)(HRTF) 之間的時(shí)間延遲或展開(kāi)相位差異所定義。然而,該相位因子并不與傳 輸參數(shù)有關(guān)。
因此,頭部相關(guān)傳遞函數(shù)ll、 12、 13與14 (服TF 11、 12、 13、 14)并非是真正的頭部相關(guān)傳遞函數(shù)(HRTF)濾波器,而是以頭部相 關(guān)傳遞函數(shù)(HRTF)為基礎(chǔ)的濾波器,因此這些濾波器只與該頭部相 關(guān)傳遞函數(shù)(HRTF)有關(guān),而與傳輸信號(hào)無(wú)關(guān)。做為替代,由于該聲道程度差異參數(shù)cl山與cldr是用于計(jì)算這些頭部相關(guān)傳遞函數(shù)11、12、
13與14 (服TF 11、 12、 13、 14),頭部相關(guān)傳遞函數(shù)11、 12、 13與 14 (服TF 11、 12、 13、 14)也與該傳輸信號(hào)有關(guān)。
現(xiàn)在,獲得圖15的情況,其仍然具有三個(gè)聲道,而不是如同在優(yōu) 選下混信號(hào)中所包含的兩個(gè)傳輸聲道。因此,必須將該六個(gè)頭部相關(guān) 傳遞函數(shù)11、 12、 5、 6、 13、 14 (HRTF 11、 12、 5、 6、 13、 14)組 合成如同在圖16a中所描述的四個(gè)頭部相關(guān)傳遞函數(shù)15、 16、 17、 18 (服TF 15、 16、 17、 18)。
為此目的,利用左方上混規(guī)則組合頭部相關(guān)傳遞函數(shù)11、 5、 13 (服TFll、 5、 13),其可以從圖16b中的上混矩陣清楚得知。特別是 如同在圖16b中所顯示以及在功能區(qū)塊175中所顯示的左方上混規(guī)則, 其包含參數(shù)mn、 m2與m^此左方上混規(guī)則在圖16的矩陣方程式中只 用于與該左方聲道相乘。因此,這三個(gè)參數(shù)也稱(chēng)為左方上混規(guī)則。
如同在功能區(qū)塊176中所描繪的,現(xiàn)在利用右方上混規(guī)則組合相 同的頭部相關(guān)傳遞函數(shù)11、 5、 13 (HRTF 11、 5、 13),換言之,在第 圖16b的實(shí)施例中,參數(shù)11112、 m22與m32都用于與圖16b中的右方聲道 R。相乘。
因此,便產(chǎn)生了頭部相關(guān)傳遞函數(shù)15 (HRTF 15)與頭部相關(guān)傳 遞函數(shù)17 (HRTF 17)。類(lèi)似的,利用該上混左方參數(shù)m,、11121與11131組 合圖15中的頭部相關(guān)傳遞函數(shù)12、 6、 14 (服TF 12、 6、 14)以獲得 頭部相關(guān)傳遞函數(shù)16 (HRTF 16)。利用頭部相關(guān)傳遞函數(shù)12、 6、 14 (HRTF 12、 6、 14)并利用由m12、恥2與m32所指明的上混右方參數(shù)或右方上混規(guī)則進(jìn)行相應(yīng)的組合,以獲得圖16a中的頭部相關(guān)傳遞函數(shù) 18 (HRTF 18)。
再次要強(qiáng)調(diào)的是,雖然圖14中的原始頭部相關(guān)傳遞函數(shù)(HRTF) 與該傳輸信號(hào)完全無(wú)關(guān),以頭部相關(guān)傳遞函數(shù)(HRTF)為基礎(chǔ)的新的 濾波器15、 16、 17、 18現(xiàn)在則與該傳輸信號(hào)有關(guān),因?yàn)榘谠摱嗦?道信號(hào)之中的空間參數(shù)用于計(jì)算這些濾波器15、 16、 17、 18。
最后,為了獲得立體左方聲道U與立體右方聲道RB,必須在加法 器130a中組合濾波器15與17的輸出。類(lèi)似的,必須在加法器130b 中組合濾波器16與18的輸出。這些加法器130a、 130b反映人類(lèi)耳朵 之中兩個(gè)信號(hào)的迭加。
接著,將討論圖18。圖18顯示本發(fā)明的多聲道解碼器的優(yōu)選實(shí) 施例,用于利用從原始多聲道信號(hào)所導(dǎo)出的下混信號(hào)產(chǎn)生立體信號(hào)。 該下混信號(hào)則在z,及Z2處描述,或利用"L"與"R"來(lái)指明。此外, 該下混信號(hào)具有與其相關(guān)的參數(shù),該參數(shù)至少是代表左方與左環(huán)繞的 聲道程度差異,或是代表右方與右環(huán)繞的聲道程度差異,以及與上混 規(guī)則有關(guān)的信息。
自然地,當(dāng)該原始多聲道信號(hào)只是三聲道信號(hào)時(shí),并不傳輸cld, 或cl山,而如同之前描述的,只有參數(shù)側(cè)信息將成為該上混規(guī)則的信 息,而此上混規(guī)則將造成上混信號(hào)中的能量誤差。因此,雖然當(dāng)執(zhí)行 非立體呈現(xiàn)時(shí)該上混信號(hào)的波形盡可能的與該原始波形相符,然而該 上混聲道的能量卻與該對(duì)應(yīng)的原始聲道的能量不同。
在圖18的優(yōu)選實(shí)施例中,該上混規(guī)則信息是利用兩個(gè)上混參數(shù)CPCl、 CPC2所反映的。然而,也可以應(yīng)用任何其它的上混規(guī)則信息,并 通過(guò)特定個(gè)數(shù)的比特而表明。特別是,可以利用在該解碼器處的預(yù)定 表格而表明特定上混方案與上混參數(shù),因此只需要從編碼器傳送該表 格索引至該解碼器。可替代的,也可以使用不同的上混方案,例如從 二至多于三聲道的上混方式。可替代的,可以傳輸多于兩個(gè)的預(yù)測(cè)上 混參數(shù),其接著需要與該上混規(guī)則相符的、對(duì)應(yīng)的且不同的下混規(guī)則, 如同針對(duì)圖20所詳細(xì)討論的。
與這種用于該上混規(guī)則的優(yōu)選實(shí)施例無(wú)關(guān),任何可以進(jìn)行上混而 產(chǎn)生上混聲道能量損失影響集合的上混規(guī)則都是可以應(yīng)用的,其是與 該原始信號(hào)的對(duì)應(yīng)集合波形相符的。
本發(fā)明的多聲道解碼器包含增益因子計(jì)算器180,用于計(jì)算至少 一個(gè)增益因子g、^或g,以減少或消除能量誤差D該增益因子計(jì)算器 根據(jù)該上混規(guī)則信息以及當(dāng)該上混規(guī)則被應(yīng)用時(shí)對(duì)應(yīng)于將要獲得的上
混聲道的以頭部相關(guān)傳遞函數(shù)(HRTF)為基礎(chǔ)的濾波器特性,來(lái)計(jì)算 增益因子。然而,如同之前所描繪的,在立體呈現(xiàn)中,并不進(jìn)行這個(gè) 上混動(dòng)作。然而,如結(jié)合圖15以及圖17的功能區(qū)塊175、 176、 177、 178所討論,使用對(duì)應(yīng)于這些上混聲道的以頭部相關(guān)傳遞函數(shù)(服TF) 為基礎(chǔ)的濾波器。
如在之前所討論的,當(dāng)取代n而插入l或i"時(shí),該增益因子計(jì)算 器180可以計(jì)算在方程式(27)中所描繪的不同的增益因子g,與gr。可 替代的,該增益因子計(jì)算器180可以產(chǎn)生由方程式(28)所指明的用于 兩個(gè)聲道的單一增益因子。重要的是,本發(fā)明的增益因子計(jì)算器180不但根據(jù)上混規(guī)則,也
根據(jù)對(duì)應(yīng)于上混聲道的以頭部相關(guān)傳遞函數(shù)(服TF)為基礎(chǔ)的濾波器 特性,來(lái)計(jì)算增益因子。這反映了該濾波器本身也與該傳輸信號(hào)有關(guān), 并受到能量誤差影響的情況。因此,該能量誤差并不僅由例如預(yù)測(cè)參
數(shù)CPd、 CPC2的上混規(guī)則信息所引起,也受到濾波器本身的影響。
因此,為了獲得良好調(diào)整的增益修正,本發(fā)明的增益因子不但與 預(yù)測(cè)參數(shù)有關(guān),還與對(duì)應(yīng)于上混聲道的濾波器有關(guān)。
該增益因子與下混參數(shù)以及以頭部相關(guān)傳遞函數(shù)(HRTF)為基礎(chǔ) 的濾波器在該濾波處理器182中使用,用于將下混信號(hào)進(jìn)行濾波而獲 得能量修正的立體信號(hào),其具有左方立體聲道Lb以及具有右方立體聲 道Rb。
在優(yōu)選實(shí)施例中,該增益因子與介于對(duì)應(yīng)于上混聲道濾波器的聲 道沖激響應(yīng)中所包含的總能量,相對(duì)于此總能量之間的差異,以及估 計(jì)上混能量誤差A(yù) E之間的關(guān)系有關(guān)。A E可以?xún)?yōu)選地通過(guò)將對(duì)應(yīng)于上 混聲道濾波器的聲道沖激響應(yīng)組合,并接著計(jì)算該組合聲道沖激響應(yīng) 的能量而計(jì)算。因?yàn)樵趫D18中所有用于G,與G8的數(shù)目都為正值,根 據(jù)AE與E的定義較為清楚,也就是兩個(gè)增益因子皆大于1。這反映了 在圖5中所描述的經(jīng)驗(yàn),也就是在大多數(shù)時(shí)間,立體信號(hào)的能量小于 原始多聲道信號(hào)的能量。應(yīng)該也要注意的是,即使當(dāng)應(yīng)用多聲道增益 補(bǔ)償時(shí),換言之,當(dāng)在大多數(shù)信號(hào)中使用因子P時(shí),仍然會(huì)引起能量 損失。
圖19a描述了圖18中的濾波處理器182的優(yōu)選實(shí)施例。特別是,圖19a描述了當(dāng)在功能區(qū)塊182a中使用圖16a的組合濾波器15、 16、 17與18而不進(jìn)行增益補(bǔ)償時(shí)的狀況,該濾波器輸出信號(hào)如同圖13中 所描繪地相加。接著,該功能區(qū)塊182a的輸出被輸入縮放功能區(qū)塊 182b,以利用由功能區(qū)塊180所計(jì)算的增益因子進(jìn)行該輸出的縮放。
可替代的,可以如圖19b所顯示地建構(gòu)該濾波處理器。在此,頭 部相關(guān)傳遞函數(shù)15至18 (服TF 15-18)是如同功能區(qū)塊182c中所描 述地計(jì)算的。因此,計(jì)算器182c執(zhí)行頭部相關(guān)傳遞函數(shù)(HRTF)組合, 而不進(jìn)行任何增益調(diào)整。接著,提供濾波調(diào)整器182d,其使用本發(fā)明 所計(jì)算的增益因子。該濾波調(diào)整器形成如在功能區(qū)塊180e中所顯示的 調(diào)整濾波器,其中功能區(qū)塊180e利用該調(diào)整濾波器執(zhí)行濾波,并執(zhí)行 如在圖13中所顯示的相對(duì)應(yīng)的濾波器輸出的后續(xù)求和。因此,要獲得 增益修正的立體聲道L與Rs,并不需要如同圖19a中的后縮放處理。
一般來(lái)說(shuō),如同已經(jīng)結(jié)合方程式16、 17以及18所描繪,可利用 該估計(jì)上混誤差A(yù)E進(jìn)行增益計(jì)算。此逼近對(duì)于上混聲道的數(shù)目等于 下混聲道數(shù)目+l時(shí)是特別有用的。因此,在兩個(gè)下混聲道的情況中, 此逼近可針對(duì)三個(gè)上混聲道而良好工作??商娲?,當(dāng)具有三個(gè)下混 聲道時(shí),此逼近也同樣對(duì)于在具有四個(gè)上混聲道的方案中良好工作。
然而,要注意的是根據(jù)該上混誤差估計(jì)所進(jìn)行的增益因子計(jì)算也 可以在以下的范例情況中執(zhí)行其中利用三個(gè)下混聲道進(jìn)行五個(gè)聲道 的預(yù)測(cè)??商娲?,也可以使用以預(yù)測(cè)為基礎(chǔ)的上混,而從兩個(gè)下混 聲道上混成為四個(gè)上混聲道。關(guān)于估計(jì)上混能量誤差A(yù)E,不但可以對(duì) 于該優(yōu)選情況以方程式(25)中所示直接地計(jì)算此估計(jì)誤差,也可以在比特流中傳輸某些與真實(shí)發(fā)生的上混誤差有關(guān)的信息。然而,即使在 其它與結(jié)合方程式(25)至(28)所描述特別情況不同的其它情況中,也
可以根據(jù)用于該上混聲道的以頭部相關(guān)傳遞函數(shù)(HRTF)為基礎(chǔ)的濾 波器,利用該預(yù)測(cè)參數(shù)計(jì)算該數(shù)值E入當(dāng)考慮方程式(26)時(shí),明顯的 是此方程式也可以簡(jiǎn)單地應(yīng)用至2/4預(yù)測(cè)上混方案中,用于以頭部相 關(guān)傳遞函數(shù)(HRTF)為基礎(chǔ)的濾波器的沖激響應(yīng)的能量的權(quán)重因子也 相應(yīng)地改變。
有鑒于此,明顯的是方程式(27)的一般結(jié)構(gòu),即根據(jù)E7(EB-AEB) 的關(guān)系計(jì)算增益因子的方式,也可以應(yīng)用于其它的情況中。
接著,將討論圖20所顯示的以預(yù)測(cè)為基礎(chǔ)的編碼器結(jié)構(gòu)的示意實(shí) 現(xiàn),其可以用于產(chǎn)生下混信號(hào)L、 R與傳輸至解碼器的上混規(guī)則信息, 從而該解碼器可以在立體濾波處理器的上下文(context)中執(zhí)行增益 補(bǔ)償。
下混器191接收五個(gè)原始聲道,或替代的接收如同利用L與Rs 所描述的三個(gè)原始聲道。該下混器191可以根據(jù)預(yù)定的下混規(guī)則工作。 在該情況中,并不需要以線(xiàn)段192所描述的下混規(guī)則指示。自然的, 誤差最小化器193可以改變?cè)撓禄煲?guī)則,以將上混器194輸出處的重 建聲道對(duì)于該對(duì)應(yīng)原始輸入聲道之間的誤差最小化。
因此,該誤差最小化器193可以改變?cè)撓禄煲?guī)則192或該上混器 規(guī)則196,使得該重建聲道具有最小化的預(yù)測(cè)損失AE。在該誤差最小 化器193中,最佳化問(wèn)題可以利用任何已知的算法所解決,優(yōu)選的是 利用逐子帶(subband-wise)的方式操作,以將該重建聲道與該輸入聲道之間的差異最小化。
如同之前所陳述的,該輸入聲道可以是原始聲道L、 Ls、 R、 Rs、 C。
可替代的,該輸入聲道可以是三個(gè)聲道L、 R、 C,其中該輸入聲道L、 R可以利用在圖11中描述的對(duì)應(yīng)的一對(duì)二 (0TT)功能區(qū)塊來(lái)導(dǎo)出。 可替代的,當(dāng)該原始信號(hào)只具有L、 R、 C聲道時(shí),這些聲道也可以視
作為"原始聲道"。
圖20另外描述除了傳輸兩個(gè)預(yù)測(cè)參數(shù)以外,也可以使用任何的上 混規(guī)則信息,只要在該位置中的解碼器可以利用此上混規(guī)則信息進(jìn)行 上混。因此,該上混規(guī)則信息也可以是查詢(xún)表中的條目,或是任何與 上混有關(guān)的信息。
本發(fā)明因此提供了一種根據(jù)可用的下混信號(hào)與額外控制數(shù)據(jù)、借 助于頭部相關(guān)傳遞函數(shù)(HRTF)濾波、來(lái)執(zhí)行多聲道音頻信號(hào)的立體 解碼的有效方式。本發(fā)明提供一種解決當(dāng)組合預(yù)測(cè)上混與立體解碼時(shí) 所產(chǎn)生的頻譜染色問(wèn)題的方案。
根據(jù)本發(fā)明方法的特定實(shí)現(xiàn)要求,本發(fā)明方法可以在硬件或軟件 中實(shí)現(xiàn)。該實(shí)現(xiàn)可以利用一種數(shù)字儲(chǔ)存媒介進(jìn)行,特別是一種盤(pán)片、 多功能數(shù)字盤(pán)片(DVD)或是光盤(pán)(CD),其具有儲(chǔ)存在其上的電子可 讀控制信號(hào),并與可編程計(jì)算機(jī)系統(tǒng)協(xié)作,以執(zhí)行本發(fā)明的方法。一 般來(lái)說(shuō),本發(fā)明因此是一種計(jì)算機(jī)程序產(chǎn)品,其具有儲(chǔ)存在機(jī)器可讀 媒介上的程序代碼,當(dāng)該計(jì)算機(jī)程序在計(jì)算機(jī)上執(zhí)行時(shí),該程序代碼 可操作來(lái)執(zhí)行本發(fā)明的方法。換句話(huà)說(shuō),本發(fā)明方法因此是一種計(jì)算 機(jī)程序,其具有當(dāng)該計(jì)算機(jī)程序在計(jì)算機(jī)上執(zhí)行時(shí)執(zhí)行至少一種本發(fā)明的方法的程序代碼。
雖然之前已經(jīng)參考特定實(shí)施例特別說(shuō)明及描述,本領(lǐng)域技術(shù)人員 可了解的是,在不背離本發(fā)明精神與觀點(diǎn)下,可進(jìn)行形式與細(xì)節(jié)的其 它不同改變。也可了解在不背離此處所公開(kāi)以及由所附權(quán)利要求所包 含的廣泛概念下,可以在不同實(shí)施例中進(jìn)行適合的不同改變。
權(quán)利要求
1. 一種多聲道解碼器,使用參數(shù)以從下混信號(hào)產(chǎn)生立體信號(hào),該下混信號(hào)從原始多聲道信號(hào)中導(dǎo)出,該參數(shù)包含上混規(guī)則信息,該上混規(guī)則信息可用于以上混規(guī)則對(duì)該下混信號(hào)進(jìn)行上混,該上混規(guī)則造成能量誤差,該多聲道解碼器包括增益因子計(jì)算器,根據(jù)該上混規(guī)則信息以及與上混聲道對(duì)應(yīng)的以頭部相關(guān)傳遞函數(shù)HRTF為基礎(chǔ)的濾波器特性,計(jì)算用于降低或消除該能量誤差的至少一個(gè)增益因子;以及濾波處理器,利用該至少一個(gè)增益因子、該濾波器特性以及該上混規(guī)則信息,對(duì)該下混信號(hào)進(jìn)行濾波,以獲得能量修正的立體信號(hào)。
2. 如權(quán)利要求1所述的多聲道解碼器,其中該濾波處理器可操作以計(jì)算針對(duì)該下混信號(hào)的每一個(gè)聲道的兩個(gè)增益調(diào)整濾波器的濾波器系數(shù),以及利用該兩個(gè)增益調(diào)整濾波器中的每一個(gè)對(duì)該下混聲道進(jìn)行濾波。
3. 如權(quán)利要求1所述的多聲道解碼器,其中該濾波處理器不利用該增益因子而操作以計(jì)算用于該下混聲道中每一個(gè)的兩個(gè)濾波器的濾波器系數(shù),并對(duì)該下混聲道進(jìn)行濾波,在對(duì)該下混聲道進(jìn)行濾波之后,進(jìn)行增益調(diào)整。
4. 如權(quán)利要求1所述的多聲道解碼器,其中該增益因子計(jì)算器可操作以根據(jù)該濾波器特性的組合沖激響應(yīng)的能量來(lái)計(jì)算該增益因子,該組合沖激響應(yīng)是通過(guò)加上或減去各個(gè)濾波器沖激響應(yīng)而計(jì)算的。
5. 如權(quán)利要求1所述的多聲道解碼器,其中該增益因子計(jì)算器可操作以根據(jù)各個(gè)濾波器沖激響應(yīng)的功率組合來(lái)計(jì)算該增益因子。
6. 如權(quán)利要求5所述的多聲道解碼器,其中該增益因子計(jì)算器可操作以根據(jù)各個(gè)濾波器沖激響應(yīng)的功率的加權(quán)求和來(lái)計(jì)算該增益因子,其中在該加權(quán)求和中使用的權(quán)重因子與該上混規(guī)則信息有關(guān)。
7. 如權(quán)利要求1所述的多聲道解碼器,其中該增益因子計(jì)算器可操作以根據(jù)具有分子與分母的表達(dá)式來(lái)計(jì)算該增益因子,該分子具 有各個(gè)濾波器沖激濾波器響應(yīng)的功率組合,而該分母具有各個(gè)濾波器 沖激響應(yīng)的功率的加權(quán)求和,其中在該加權(quán)求和中使用的權(quán)重因子與 該上混規(guī)則信息有關(guān)。
8. 如權(quán)利要求1所述的多聲道解碼器,其中該增益因子計(jì)算器可操作以根據(jù)以下方程來(lái)計(jì)算該增益因子(l' 否知其中當(dāng)n設(shè)定為l時(shí),g。為第一聲道的增益因子,其中當(dāng)n設(shè) 定為2時(shí),g2為第二聲道的增益因子,其中E 為通過(guò)使用加權(quán)參數(shù) 對(duì)聲道沖激響應(yīng)的能量進(jìn)行加權(quán)所計(jì)算的加權(quán)求和能量,而其中A E。為該上混規(guī)則所引入的該能量誤差的估計(jì),其中,a、 P與Y為上混規(guī)則相關(guān)參數(shù),而其中e為大于或等于零的數(shù)字。
9. 如權(quán)利要求8所述的多聲道解碼器,其中該增益因子計(jì)算器 可操作以根據(jù)以下方程來(lái)計(jì)算E。及AEn:Ad(卜碌,,+ & 2 - d'其中b^為對(duì)應(yīng)于第一上混聲道與第n個(gè)立體聲道的以服TF為 基礎(chǔ)的濾波器,其中k,2為對(duì)應(yīng)于第二上混聲道與第n個(gè)立體聲道的 以HRTF為基礎(chǔ)的濾波器沖激響應(yīng),其中k,3為對(duì)應(yīng)于第三上混聲道 與第n個(gè)立體聲道的以服TF為基礎(chǔ)的濾波器沖激響應(yīng), 其中如下定義為有效的a = (l-c,)/3、 - = (l-c2)/3、 cr巧+ P以及"o^其中"為第一預(yù)測(cè)參數(shù),C2為第二預(yù)測(cè)參數(shù),而其中該第一 預(yù)測(cè)參數(shù)與該第二預(yù)測(cè)參數(shù)構(gòu)成該上混規(guī)則信息。
10. 如權(quán)利要求l所述的多聲道解碼器,其中該增益因子計(jì)算器 可操作以計(jì)算用于左立體聲道與右立體聲道的公共增益因子。
11. 如權(quán)利要求1所述的多聲道解碼器,其中該濾波處理器可操 作以使用針對(duì)虛擬中央、左和右方位置的左立體聲道與右立體聲道的 以服TF為基礎(chǔ)的濾波器,作為該濾波器特性,或是使用通過(guò)組合針對(duì)虛擬左前方位置與虛擬左環(huán)繞位置的服TF濾波器、或是通過(guò)組合針對(duì) 虛擬右前方位置與虛擬右環(huán)繞位置的服TF濾波器而導(dǎo)出的濾波器特 性。
12. 如權(quán)利要求11所述的多聲道解碼器,其中與原始左方及左 環(huán)繞聲道有關(guān)或是與原始右方及右環(huán)繞聲道有關(guān)的參數(shù)包括在解碼器 輸入信號(hào)中,以及其中該濾波處理器可操作以使用該參數(shù)而將頭部相關(guān)傳遞函數(shù) 濾波器進(jìn)行組合。
13. 如權(quán)利要求1所述的多聲道解碼器,其中該增益因子計(jì)算器 可操作以根據(jù)用于立體聲道的以HRTF為基礎(chǔ)的濾波器的聲道沖激響 應(yīng)的能量的加權(quán)線(xiàn)性組合,以及從該加權(quán)線(xiàn)性組合減去估計(jì)能量誤差 所獲得的數(shù)值之間的比率,來(lái)計(jì)算該立體聲道的增益因子。
14. 如權(quán)利要求13所述的多聲道解碼器,其中該增益因子計(jì)算 器可操作以使用該上混規(guī)則信息來(lái)確定該加權(quán)因子。
15. 如權(quán)利要求14所述的多聲道解碼器,其中該上混規(guī)則信息 包含至少兩個(gè)預(yù)測(cè)參數(shù),該預(yù)測(cè)參數(shù)可用于構(gòu)建上混矩陣,使得輸出 聲道具有與相應(yīng)的三個(gè)輸入聲道有關(guān)的能量誤差。
16. 如權(quán)利要求1所述的多聲道解碼器,其中該濾波處理器可操 作為具有下述項(xiàng)目作為濾波器特性第一濾波器,用于對(duì)左下混聲道進(jìn)行濾波,以獲得第一左立體輸出,第二濾波器,用于對(duì)右下混聲道進(jìn)行濾波,以獲得第二左立體輸出,第三濾波器,用于對(duì)左下混聲道進(jìn)行濾波,以獲得第一右立體輸出,第四濾波器,用于對(duì)右下混聲道進(jìn)行濾波,以獲得第二右立體輸出,加法器,用于將該第一左立體輸出與該第二左立體輸出進(jìn)行求 和,以獲得左方立體聲道,并用于將該第一右立體輸出與該第二右立 體輸出進(jìn)行求和,以獲得右方立體聲道,其中該濾波處理器可操作以在進(jìn)行求和之前或之后,對(duì)該第一 或第二濾波器或?qū)υ撟蠓搅Ⅲw輸出施加用于該左方立體聲道的增益因 子,并且在進(jìn)行求和之前或之后,對(duì)該第三和第四濾波器或?qū)υ撚曳?立體輸出施加用于該右方立體聲道的增益因子。
17. 如權(quán)利要求1所述的多聲道解碼器,其中該上混規(guī)則信息包 含上混參數(shù),該上混參數(shù)可用于構(gòu)建上混矩陣,以從兩個(gè)聲道至三個(gè) 聲道產(chǎn)生上混。
18. 如權(quán)利要求17所述的多聲道解碼器,其中該上混規(guī)則被定義如下/, 1 w,,m, , — 丄o其中L為第一上混聲道,R為第二上混聲道,以及C為第三 上混聲道,L。為第一下混聲道,R。為第二下混聲道,而m,j為上混規(guī) 則信息參數(shù)。
19. 如權(quán)利要求1所述的多聲道解碼器,其中預(yù)測(cè)損失參數(shù)被包 括在多聲道解碼器輸入信號(hào)中,以及其中濾波處理器可操作以利用該預(yù)測(cè)損失參數(shù)將該增益因子進(jìn) 行縮放。
20. 如權(quán)利要求1所述的多聲道解碼器,其中該增益計(jì)算器可操 作以逐子帶地計(jì)算增益因子,以及其中該濾波處理器可操作以逐子帶地施加該增益因子。
21. 如權(quán)利要求11所述的多聲道解碼器,其中該濾波處理器可 操作以通過(guò)將HRTF濾波器的聲道沖激響應(yīng)的加權(quán)或相移版本進(jìn)行求 和,以組合與兩個(gè)聲道相關(guān)聯(lián)的服TF濾波器,其中用于對(duì)服TF濾波器的聲道沖激響應(yīng)進(jìn)行加權(quán)的權(quán)重因子與該聲道之間的電平差異有關(guān),而施加的相移則與該冊(cè)TF濾波器的聲道沖激響應(yīng)之間的時(shí)間延遲有關(guān)。
22. 如權(quán)利要求1所述的多聲道解碼器,其中以HRTF為基礎(chǔ)的 濾波器或服TF濾波器的濾波器特性為復(fù)數(shù)子帶濾波器,該復(fù)數(shù)子帶濾 波器是通過(guò)利用復(fù)數(shù)指數(shù)調(diào)制濾波器組對(duì)HRTF濾波器的實(shí)數(shù)數(shù)值濾 波器沖激響應(yīng)進(jìn)行濾波而獲得的。
23. —種多聲道解碼的方法,使用參數(shù)以從下混信號(hào)產(chǎn)生立體信 號(hào),該下混信號(hào)從原始多聲道信號(hào)中導(dǎo)出,該參數(shù)包含上混規(guī)則信息, 該上混規(guī)則信息可用于以上混規(guī)則對(duì)該下混信號(hào)進(jìn)行上混,該上混規(guī) 則造成能量誤差,該方法包括根據(jù)該上混規(guī)則信息以及與上混聲道相對(duì)應(yīng)的以頭部相關(guān)傳遞 函數(shù)HRTF為基礎(chǔ)的濾波器的濾波器特性,計(jì)算至少一個(gè)增益因子,用于降低或消除該能量誤差;以及利用該至少一個(gè)增益因子、該濾波器特性以及該上混規(guī)則信息, 對(duì)該下混信號(hào)進(jìn)行濾波,以獲得能量修正的立體信號(hào)。
24. —種具有程序代碼的計(jì)算機(jī)程序,當(dāng)該計(jì)算機(jī)程序在計(jì)算機(jī)上 運(yùn)行時(shí),用于執(zhí)行如權(quán)利要求23所述的方法。
全文摘要
一種多聲道解碼器,其利用能量誤差引入上混規(guī)則的上混規(guī)則信息,從下混信號(hào)產(chǎn)生立體信號(hào),用以根據(jù)上混規(guī)則信息以及與上混聲道對(duì)應(yīng)的以頭部相關(guān)傳遞函數(shù)(HRTF)為基礎(chǔ)的濾波器的濾波器特性來(lái)計(jì)算增益因子。該一個(gè)或多個(gè)增益因子則由濾波處理器所使用,用以將該下混信號(hào)進(jìn)行濾波,因此可獲得具有左方立體聲道與右方立體聲道的能量修正的立體信號(hào)。
文檔編號(hào)G10L19/00GK101460997SQ200680054828
公開(kāi)日2009年6月17日 申請(qǐng)日期2006年9月4日 優(yōu)先權(quán)日2006年6月2日
發(fā)明者拉斯·維萊摩爾斯 申請(qǐng)人:杜比瑞典公司