欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

產(chǎn)生編碼多通道信號(hào)的設(shè)備和方法、對(duì)編碼多通道信號(hào)進(jìn)行解碼的設(shè)備和方法

文檔序號(hào):2829190閱讀:425來源:國(guó)知局
專利名稱:產(chǎn)生編碼多通道信號(hào)的設(shè)備和方法、對(duì)編碼多通道信號(hào)進(jìn)行解碼的設(shè)備和方法
技術(shù)領(lǐng)域
本發(fā)明涉及參數(shù)音頻多通道處理技術(shù),具體涉及當(dāng)存在可用于重建的多個(gè)不同參數(shù)集時(shí)對(duì)參數(shù)輔助信息的高效配置。
背景技術(shù)
除了兩個(gè)立體聲通道之外,所推薦的多通道環(huán)繞表征還包括中央通道C和兩個(gè)環(huán)繞通道,即左環(huán)繞通道L和右環(huán)繞通道R,此外,如果可應(yīng)用,則還包括稱作LFE通道(LFE=低頻增強(qiáng))的超低音揚(yáng)聲器通道。這種參考聲音格式也稱作3/2(加LFE)立體聲,近來也稱作5.1多通道,表示有三個(gè)前通道、兩個(gè)環(huán)繞通道和一個(gè)LFE通道。一般而言,這種所推薦的多通道環(huán)繞表征需要5或6個(gè)傳輸通道。在再現(xiàn)環(huán)境中,5個(gè)各自不同的位置上至少需要5個(gè)揚(yáng)聲器,以獲得與5個(gè)正確放置的揚(yáng)聲器相隔確定距離的最優(yōu)的所謂最佳聽音位置。然而,相對(duì)于超低音揚(yáng)聲器的定位,可以相對(duì)自由地使用超低音揚(yáng)聲器。
已有多種技術(shù)用于減少傳輸多通道音頻信號(hào)所需的數(shù)據(jù)量。這些技術(shù)也稱作聯(lián)合立體聲技術(shù)。為此參考圖5。圖5示出了聯(lián)合立體聲設(shè)備60。例如,這種設(shè)備可以是實(shí)現(xiàn)強(qiáng)度立體聲技術(shù)(IS技術(shù))或技術(shù)心理聲學(xué)編碼(BCC)的設(shè)備。這種設(shè)備一般接收至少兩個(gè)通道(CH1、CH2、...CHn)作為輸入信號(hào),并輸出至少一個(gè)單載波通道(縮混)和參數(shù)數(shù)據(jù)(即,一個(gè)或多個(gè)參數(shù)集)。對(duì)參數(shù)數(shù)據(jù)進(jìn)行定義,從而可以在解碼器中計(jì)算每個(gè)原始通道(CH1、CH2、...CHn)的近似。
通常,載波通道將包括子帶采樣、頻譜系數(shù)或時(shí)域采樣等,提供了下層(underlying)信號(hào)的相對(duì)精細(xì)的表征,而參數(shù)數(shù)據(jù)和/或參數(shù)集不包括任何這種采樣或頻譜系數(shù)。取而代之的是,參數(shù)數(shù)據(jù)包括用于對(duì)諸如乘法加權(quán)、時(shí)移、頻移等確定的重建算法進(jìn)行控制的控制參數(shù)。因此,參數(shù)數(shù)據(jù)只包括信號(hào)或關(guān)聯(lián)通道的相對(duì)粗略的表征。當(dāng)以數(shù)字表達(dá)時(shí),載波通道所需的數(shù)據(jù)量在60到70kbit/s的范圍中,而參數(shù)輔助信息所需的數(shù)據(jù)量在每通道1.5kbit/s的量級(jí)上。參數(shù)數(shù)據(jù)的一個(gè)示例是如將在以下描述的公知的縮放因子、強(qiáng)度立體聲信息或技術(shù)心理聲學(xué)參數(shù)。
在AES preprint 3799中由J.Herre,K.H.Brandenburg和D.Lederer所著的題為“Intensity stereo coding”,1994年2月,Amsterdam中描述了強(qiáng)度立體聲編碼技術(shù)。一般而言,強(qiáng)度立體聲的概念基于要應(yīng)用于兩個(gè)立體聲音頻通道數(shù)據(jù)的主軸變換。如果將大多數(shù)數(shù)據(jù)點(diǎn)設(shè)置在第一主軸周圍,則可以通過在編碼之前將兩個(gè)信號(hào)均旋轉(zhuǎn)確定角度來實(shí)現(xiàn)編碼增益。但是,這并不總是適用于實(shí)際立體聲再現(xiàn)技術(shù)。左和右通道的重建信號(hào)包括相同傳輸信號(hào)的不同加權(quán)或縮放的版本。雖然重建信號(hào)在幅度上不同,但是相對(duì)于相位信息是相同的。但是,兩個(gè)原始音頻通道的能量時(shí)間包絡(luò)是通過典型地以頻率選擇形式而操作的選擇性縮放操作來保持的。這與高頻上的人類聲音感知相對(duì)應(yīng),在高頻上,主導(dǎo)空間提示由能量包絡(luò)確定。
此外,在實(shí)際實(shí)現(xiàn)中,傳輸信號(hào)(即,載波通道)由左通道和右通道的和信號(hào)形成,而不是通過旋轉(zhuǎn)兩個(gè)分量來形成。此外,以頻率選擇方式,即,針對(duì)每個(gè)縮放因子頻帶(即,針對(duì)每個(gè)編碼器頻率部分)彼此獨(dú)立,來執(zhí)行這種處理(即,用于執(zhí)行縮放操作的強(qiáng)度立體聲參數(shù)的產(chǎn)生)。優(yōu)選地,將兩個(gè)通道組合,形成組合或“載波”通道。除了組合通道之外,對(duì)強(qiáng)度立體聲信息進(jìn)行確定還取決于第一通道的能量、第二通道的能量和組合或和通道的能量。
在AES convention paper 5574中的C.Faller和F.Baumgarte所著的題為“Binaural cue coding applied to stereo and multi-channel audiocompression”,2002年5月,München中描述了BCC技術(shù)。在BCC編碼中,使用具有交迭窗的基于DFT的變換,將多個(gè)音頻輸入通道轉(zhuǎn)換為頻譜表征。將得到的頻譜劃分為非交迭部分。每個(gè)部分具有與等效矩形帶寬(ERB)成比例的帶寬。針對(duì)每個(gè)部分,即,針對(duì)每個(gè)頻帶和針對(duì)每一幀k(即,時(shí)間采樣塊),來計(jì)算所謂的通道間電平差(ICLD)和所謂的通道間時(shí)間差(ICTD)。對(duì)ICLD和ICTD參數(shù)進(jìn)行量化和編碼,以獲得BCC比特流。通道間電平差和通道間時(shí)間差是相對(duì)于參考通道而給予每個(gè)通道的。具體地,取決于要處理信號(hào)的特定劃分,根據(jù)預(yù)定公式計(jì)算參數(shù)。
在解碼器側(cè),解碼器接收單聲道信號(hào)和BCC比特流(即,針對(duì)通道間時(shí)間差的第一參數(shù)集和針對(duì)通道間電平差的第二參數(shù)集)。將單聲道信號(hào)變換到頻域,并輸入到也接收已解碼的ICLD和ICTD值的合成塊中。在合成塊或重建塊中,使用BCC參數(shù)(ICLD和ICTD)執(zhí)行對(duì)單聲道信號(hào)的加權(quán)操作,以重建多通道信號(hào),然后,在經(jīng)過頻率/時(shí)間轉(zhuǎn)換之后,多通道信號(hào)代表原始多通道信號(hào)音頻信號(hào)的重建。
在BCC的情況下,聯(lián)合立體聲模塊60進(jìn)行操作,以輸出通道輔助信息,從而將參數(shù)通道數(shù)據(jù)量化和編碼為ICLD和ICTD參數(shù),其中原始通道之一可以用作對(duì)通道輔助信息進(jìn)行編碼的參考通道。通常,載波通道由參與原始通道之和形成。
當(dāng)然,上述技術(shù)只為僅能夠?qū)d波通道進(jìn)行解碼的解碼器提供了單聲道表征,而無法產(chǎn)生用于生成多于一個(gè)輸入通道的一個(gè)或多個(gè)近似的參數(shù)數(shù)據(jù)。
在美國(guó)專利申請(qǐng)US 2003/0219130 A1、2003/0026441 A1和2003/0035553 A1中也描述了稱作BCC技術(shù)的音頻編碼技術(shù)。此外,見C.Faller和F.Baumgarte所著的“Binaural Cue Coding.Part.IISchemes and Applications”,IEEETransactions on Audio and SpeechProc.,Vol.11,No.6,1993年11月。此外,還見C.Faller和F.Baumgarte所著的“Binaural Cue Coding applied to Stereo and Multi-Channel Audiocompression”,Preprint,112thConvention of the Audio EngineeringSociety(AES),2002年5月,以及J.Herre,C.Faller,C.Ertel,J.Hilpert,A.Hoelzer和C.Spenger所著的“MP3 SurroundEfficient andCompatible Coding of Multi-Channel Audio”,116thAES Convention,Berlin,2004,Preprint 6049。在下文中,將參考圖6到8,更加詳細(xì)地描述用于多通道音頻編碼的典型通用BCC方案。圖6示出了用于多通道音頻信號(hào)的編碼/傳輸?shù)耐ㄓ肂CC編碼方案。在BCC編碼器112的輸入110處輸入多通道音頻輸入信號(hào),并在所謂的縮混塊114中對(duì)其進(jìn)行“縮混”,即,轉(zhuǎn)換為單個(gè)和通道。在本示例中,輸入110處的信號(hào)是5通道環(huán)繞信號(hào),具有前左通道和前右通道、左環(huán)繞通道和右環(huán)繞通道、以及中央通道。典型地,縮混塊通過將這5個(gè)通道簡(jiǎn)單地相加成單聲道信號(hào),來產(chǎn)生和信號(hào)。其它縮混方案在本領(lǐng)域中是公知的,所有方案均使用多通道輸入信號(hào)來產(chǎn)生具有單通道或具有多個(gè)縮混通道的縮混信號(hào),其中,縮混通道的數(shù)目無論如何都少于原始輸入通道的數(shù)目。在本示例中,如果從5個(gè)輸入通道中產(chǎn)生四個(gè)載波通道,則已實(shí)現(xiàn)了縮混操作。在和信號(hào)線路115上輸出單個(gè)輸出通道和/或多個(gè)輸出通道。
在輔助信息線路117上輸出由BCC分析塊116獲得的輔助信息。在BCC分析塊中,可以計(jì)算ICLD、ICTD或通道間相關(guān)值(ICC值)的參數(shù)集。因此,在BCC合成塊122中有用于重建的多達(dá)3個(gè)的不同參數(shù)集(ICLD、ICTD和ICC)。
典型地,和信號(hào)以及具有參數(shù)集的輔助信息以量化和編碼的格式傳輸?shù)紹CC解碼器120。BCC解碼器將所傳輸?shù)暮托盘?hào)分為多個(gè)子帶,并執(zhí)行縮放、延遲和進(jìn)一步處理,以產(chǎn)生要重建的多個(gè)通道的子帶。執(zhí)行這種處理,從而輸出121處的重建多通道信號(hào)的ICLD、ICTD和ICC參數(shù)(提示)與在輸入110處進(jìn)入BCC編碼器112的原始多通道信號(hào)的各個(gè)提示(cue)類似。為此,BCC解碼器120包括BCC合成塊122和輔助信息處理塊123。
下文將參考圖7示出BCC合成塊122的內(nèi)部結(jié)構(gòu)。將線路115上的和信號(hào)輸入典型地實(shí)現(xiàn)為濾波器組FB 125的時(shí)間/頻率轉(zhuǎn)換塊中。在塊125的輸出處,有N個(gè)子帶信號(hào),或者在極端情況下,如果音頻濾波器組125執(zhí)行從N個(gè)時(shí)域采樣中產(chǎn)生N個(gè)頻譜系數(shù)的變換,則有頻譜系數(shù)塊。
BCC合成塊122還包括延遲級(jí)126、電平修正級(jí)127、相關(guān)處理級(jí)128和代表逆濾波器組的級(jí)IFB 129。例如,如圖6所示,在級(jí)129的輸出處,在5通道環(huán)繞系統(tǒng)的情況下,具有5個(gè)通道的重建多通道音頻信號(hào)可以在一組揚(yáng)聲器124上輸出。
圖7進(jìn)一步示出了通過元件125將輸入信號(hào)s(n)轉(zhuǎn)換到頻域或?yàn)V波器組域。如節(jié)點(diǎn)130所示,使元件125輸出的信號(hào)翻倍,以獲得相同信號(hào)的多個(gè)版本。原始信號(hào)的版本數(shù)目等于要重建的輸出信號(hào)中的輸出通道的數(shù)目。如果在節(jié)點(diǎn)130處使原始信號(hào)的每個(gè)版本經(jīng)歷確定的延遲d1、d2、...di、dN,則結(jié)果是塊126的輸出處的情況,包括相同信號(hào)的但具有不同延遲的版本。延遲參數(shù)由圖6中的輔助信息處理塊123來計(jì)算,并如由BCC分析塊116所確定的通道間時(shí)間差而推導(dǎo)出來。
這同樣適用于乘法參數(shù)a1、a2、...ai、aN,它們也由輔助信息處理塊123基于由BCC分析塊116所確定的通道間電平差來計(jì)算。
ICC參數(shù)由BCC分析塊116來計(jì)算,并用于控制塊128的功能,從而在塊128的輸出處獲得在經(jīng)延遲和電平處理過的信號(hào)之間的所確定的相關(guān)值。要注意,級(jí)126、127和128的順序可以不同于圖7中所表示的。
還要注意,在音頻信號(hào)的逐塊處理中,BCC分析也是逐塊執(zhí)行的。此外,BCC分析也是逐頻率執(zhí)行的,即,以頻率選擇方式。這表示對(duì)于每個(gè)頻帶,都具有ICLD參數(shù)、ICTD參數(shù)和ICC參數(shù)。因此,穿過所有頻帶的至少一個(gè)通道的ICTD參數(shù)代表ICTD參數(shù)集。這同樣適用于代表用于重建至少一個(gè)輸出通道的所有頻帶的所有ICLD參數(shù)的ICLD參數(shù)集。這同樣適用于ICC參數(shù)集,ICC參數(shù)集再次包括用于基于輸入通道或和通道來重建至少一個(gè)輸出通道的各個(gè)頻帶的多個(gè)單獨(dú)的ICC參數(shù)。
在下文中,參考圖8,圖8示出了從中可以看到BCC參數(shù)的確定的情況。通常,可以在通道對(duì)之間定義ICLD、ICTD和ICC參數(shù)。但是,典型地,在參考通道與每個(gè)其它輸入通道之間執(zhí)行ICLD和ICTD參數(shù)的確定,從而對(duì)于每個(gè)輸入通道均有獨(dú)特的參數(shù)集。這也在圖8B中示出。
但是,可以對(duì)ICC參數(shù)進(jìn)行不同的定義。一般而言,如也在圖8B中示意性示出的,在編碼器中,可以在任何通道對(duì)之間產(chǎn)生ICC參數(shù)。在這種情況下,解碼器將執(zhí)行ICC合成,從而在任何通道對(duì)之間獲得與原始信號(hào)中呈現(xiàn)的近似相同的結(jié)果。但是,建議在任何時(shí)間(即,針對(duì)每個(gè)時(shí)間幀)僅僅計(jì)算兩個(gè)最強(qiáng)通道之間的ICC參數(shù)。圖8C中表示本方案,示出了如下示例在一個(gè)時(shí)間上計(jì)算并傳輸通道1與2之間的ICC參數(shù),在另一時(shí)間上計(jì)算通道1與5之間的ICC參數(shù)。然后,解碼器對(duì)解碼器中兩個(gè)最強(qiáng)通道之間的通道間相關(guān)進(jìn)行合成,并進(jìn)一步執(zhí)行啟發(fā)式規(guī)則,以對(duì)剩余通道對(duì)的通道間相干進(jìn)行合成。
例如,對(duì)于基于所傳輸?shù)腎CLD參數(shù)對(duì)乘法參數(shù)a1、...、aN的計(jì)算,參考所引用的AES convention paper 5574。ICLD參數(shù)代表原始多通道信號(hào)中的能量分布。不失一般性,圖8A示出了在所有其它通道與前左通道之間有四個(gè)代表能量差的ICLD參數(shù)。在輔助信息處理塊123中,從ICLD參數(shù)中推導(dǎo)出乘法參數(shù)a1、...、aN,從而所有重建輸出通道的總能量是與所傳輸?shù)暮托盘?hào)所呈現(xiàn)的相同的能量,或至少與該能量成比例。確定這些參數(shù)的一種方式是兩級(jí)過程,其中,在第一級(jí)中,將左前通道的乘法因子設(shè)為1,而將圖8C中其它通道的乘法因子設(shè)為所傳輸?shù)腎CLD值。然后,在第二級(jí)中,計(jì)算所有5個(gè)通道的能量,并將其與所傳輸?shù)暮托盘?hào)的能量比較。接著,縮減所有通道,即,針對(duì)所有通道使用相等的縮放因子,其中,選擇縮放因子,以使縮放之后的所有重建輸出通道的總能量等于所傳輸?shù)暮托盘?hào)和/或多個(gè)所傳輸?shù)暮托盘?hào)的總能量。
對(duì)于從BCC編碼器傳輸?shù)紹CC解碼器、作為進(jìn)一步的參數(shù)集的通道間相干測(cè)量ICC,要注意,可以通過對(duì)乘法因子的修正來執(zhí)行相干處理,例如,將所有子帶的加權(quán)因子乘以具有在20log10-6和20log106之間的值的隨機(jī)數(shù)。典型地,選擇偽隨機(jī)序列,從而所有臨界帶的方差近似相等,并且每個(gè)臨界帶內(nèi)的平均值為0。相同的序列用于每個(gè)不同幀或塊的頻譜系數(shù)。因此,通過對(duì)偽隨機(jī)序列的方差的修正來控制音頻場(chǎng)景的寬度。較大的方差產(chǎn)生較大的聽覺寬度??梢栽诰哂信R界帶寬度的單獨(dú)的頻帶中執(zhí)行方差修正。這允許聽覺場(chǎng)景中同時(shí)存在多個(gè)對(duì)象,其中,每個(gè)對(duì)象具有不同的聽覺寬度。偽隨機(jī)序列的適合的幅度分布是對(duì)數(shù)尺度上的均勻分布,例如在美國(guó)專利公開2002/0219130 A1中所述的。
為了以兼容方式(例如,以也適合于正常立體聲解碼器的比特流格式)傳輸5個(gè)通道,可以使用G.Theile和G.Stoll所著的“MUSICAMSurroundA universal multi-channel coding system compatible withISO/IEC 11172-3”,AES Preprint,1992年10月,San Francisco中所述的所謂矩陣技術(shù)。
此外,見出版物中的B.Grill,J.Herre,K.H.Brandenburg,I.Eberlein,J.Koller和J.Miller所著的“Improved MPEG 2 Audiomulti-channel encoding”,AES Preprint 3865,1994年2月,Amsterdam中所述的多通道編碼技術(shù),其中,兼容性矩陣用于從原始輸入通道中獲得縮混通道。
總之,可以說BCC技術(shù)允許對(duì)多通道音頻材料的高效并且向后兼容的編碼,例如,如由E.Schuijer,J.Breebaart,H.Purnhagen和J.Engdegrd所著的專家出版物“Low-Complexity Parametric StereoCoding”,119thAES Convention,Berlin,2004,Preprint 6073中所述的。在這種環(huán)境下,也應(yīng)該提及MPEG-4標(biāo)準(zhǔn),特別是對(duì)參數(shù)音頻技術(shù)的擴(kuò)展,其中,該標(biāo)準(zhǔn)部分也是通過名稱ISO/IEC 14496-32001/FDAM2(Parametric Audio)而公知的。在這方面,特別應(yīng)該提及在MPEG-4標(biāo)準(zhǔn)的表8.9中名為“syntax of the ps_data()”的句法。在本示例中,應(yīng)該提及句法元素“enable_icc”和“enable_ipdopd”,其中,這些句法元素用于開啟和關(guān)閉ICC參數(shù)和與通道間時(shí)間差相對(duì)應(yīng)的相位的傳輸。還應(yīng)該提及句法元素“icc_data()”、“ipd_data()”和“opd_data()”。
總之,要注意一般采用一個(gè)或多個(gè)所傳輸?shù)妮d波通道來使用這種參數(shù)多通道技術(shù),其中,從N個(gè)原始通道中形成M個(gè)所傳輸?shù)耐ǖ溃栽俅沃亟∟個(gè)輸出通道或K個(gè)輸出通道,其中,K等于或小于原始通道的數(shù)目N。
至今,上述所有技術(shù)中的問題在于,如何在用于多通道解碼的不同類型的解碼器之間創(chuàng)建格式兼容性,例如,對(duì)于BCC解碼器和參數(shù)輔助信息的不同版本。特別地,當(dāng)市場(chǎng)上存在不同的多通道解碼器,而同時(shí)具有由不同的多通道解碼器產(chǎn)生的不同參數(shù)集的輔助信息在市場(chǎng)上、并因此對(duì)于只有單個(gè)解碼器的用戶可用時(shí),會(huì)出現(xiàn)兩個(gè)問題。
首先,用戶希望擁有在解碼時(shí)提供最優(yōu)多通道聲音質(zhì)量的高計(jì)算能力的解碼器。然而,同時(shí),也會(huì)有在有限資源條件下進(jìn)行操作的解碼器,例如,移動(dòng)設(shè)備(如,移動(dòng)電話)中的解碼器。當(dāng)然,這種解碼器應(yīng)該提供具有仍盡可能良好的質(zhì)量的多通道輸出,但是也應(yīng)該只具有有限的計(jì)算能力。這導(dǎo)致的問題是是否能夠存在具有用于支持這種可縮放性(即,允許具有高復(fù)雜度并因此質(zhì)量最優(yōu)的解碼、以及具有降低的復(fù)雜度但也具有相應(yīng)降低的質(zhì)量的解碼)的空間重建的參數(shù)集的比特流格式。
當(dāng)引入BCC編碼器以及BCC比特流的新產(chǎn)生/版本時(shí)要考慮的另一方面是如何保持BCC比特流與BCC解碼器的不同版本之間的兼容性的問題。換言之,希望新的BCC參數(shù)集以及更新的舊參數(shù)集是向后兼容的。因此,當(dāng)然希望為BCC用戶提供升級(jí)途徑,這些用戶在新的改進(jìn)多通道方案隨著技術(shù)發(fā)展而可用時(shí)允許引入新方案。另一方面,新的BCC比特流格式通常導(dǎo)致了在這些比特流與多種(較舊)BCC解碼器版本之間的不兼容。
尤其要注意,多通道編碼器/解碼器將用于越來越多的應(yīng)用領(lǐng)域,其中,最大計(jì)算能力不是必須可用的,而且也不總是必須要求全聲音質(zhì)量的。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種高效靈活的構(gòu)思,即,例如,所述構(gòu)思允許對(duì)新參數(shù)集或舊參數(shù)集的更新進(jìn)行結(jié)合,同時(shí),可以靈活地用于多種不同應(yīng)用。
本目的通過以下實(shí)現(xiàn)根據(jù)權(quán)利要求1的產(chǎn)生編碼多通道信號(hào)的設(shè)備、根據(jù)權(quán)利要求15的對(duì)編碼多通道信號(hào)進(jìn)行解碼的設(shè)備、根據(jù)權(quán)利要求21的產(chǎn)生編碼多通道信號(hào)的方法、根據(jù)權(quán)利要求22的對(duì)多通道信號(hào)進(jìn)行解碼的方法、或者根據(jù)權(quán)利要求23的計(jì)算機(jī)程序。
本發(fā)明基于如下發(fā)現(xiàn)當(dāng)將編碼多通道信號(hào)編寫為不僅包括至少一個(gè)傳輸通道或載波通道、還包括至少兩個(gè)不同的參數(shù)集的數(shù)據(jù)流時(shí),實(shí)現(xiàn)了對(duì)編碼多通道信號(hào)的高效和向后兼容的解碼,其中,將所述兩個(gè)參數(shù)集寫入數(shù)據(jù)流中,從而可以使用少于所述至少兩個(gè)的參數(shù)集來執(zhí)行輸出通道的重建。根據(jù)本發(fā)明,編寫數(shù)據(jù)流,從而解碼器可以識(shí)別參數(shù)集中的哪一個(gè)是重建所需的,哪個(gè)參數(shù)集對(duì)于重建是可選地需要的。在這種情況下,如果外部環(huán)境要求,則解碼器可以只使用重建不可缺少(即,強(qiáng)制性的)的參數(shù)集,并簡(jiǎn)單地忽略可選參數(shù)集。這樣的結(jié)果是,當(dāng)只使用重建強(qiáng)制需要的參數(shù)集時(shí),解碼器較快速并以有限的計(jì)算能力來進(jìn)行管理,同時(shí),另一解碼器可以基于代表編碼多通道信號(hào)的相同數(shù)據(jù)流,來執(zhí)行高質(zhì)量的多通道重建,但是,這也要求更多時(shí)間和/或更強(qiáng)計(jì)算能力和/或,更一般地講,更多的解碼器資源。
在本發(fā)明的優(yōu)選實(shí)施例中,強(qiáng)制性參數(shù)集是包括通道間電平差的參數(shù)集。如已根據(jù)本發(fā)明所發(fā)現(xiàn)的,這些通道間電平差對(duì)于定義所有類型的再現(xiàn)情況下輸出通道之間的基本多通道聲音分布是極其重要的。通道間時(shí)間差可以分類為可選參數(shù)集,這是因?yàn)楫?dāng)要有通過頭戴式耳機(jī)(即,來自一個(gè)傳輸通道的兩個(gè)輸出通道)的呈現(xiàn)、或當(dāng)多通道音頻表征發(fā)生在所謂的相對(duì)“干”的聲學(xué)情況(即,幾乎不包括回音的聲學(xué)情況)下時(shí),通道間時(shí)間差主要是相關(guān)的。因此,可以將通道間時(shí)間差分類為可選參數(shù)集。
通道間相關(guān)值在以下方面是重要的提供聲源寬度,并針對(duì)用戶進(jìn)一步產(chǎn)生他或她處于具有復(fù)雜聲源的場(chǎng)景中的印象,該場(chǎng)景包括許多不相關(guān)的聲音分量,例如是古典交響樂團(tuán)。因此,也可以將ICC參數(shù)集分類為可選參數(shù)集,這是因?yàn)镮CC參數(shù)集明顯對(duì)質(zhì)量具有重要影響,但是,在重建中,ICC參數(shù)集通常導(dǎo)致了相對(duì)大的計(jì)算量,例如,這種計(jì)算量在通道間電平差的強(qiáng)制性參數(shù)集中并不是特別重要,這是因?yàn)閷?shí)質(zhì)上只需要加權(quán)操作,即,相對(duì)于計(jì)算可以高效地執(zhí)行的乘法運(yùn)算。
對(duì)于數(shù)據(jù)流中參數(shù)集的對(duì)編碼多通道信號(hào)的向后兼容性的問題,例如,將具有更高版本號(hào)的參數(shù)集寫入數(shù)據(jù)流中,從而無需這種參數(shù)集而實(shí)現(xiàn)由解碼器進(jìn)行的重建,結(jié)果,當(dāng)確立了編碼器無法處理第二參數(shù)集時(shí),解碼器將會(huì)僅使用第一參數(shù)集用于重建,并簡(jiǎn)單地跳過第二參數(shù)集。
在解碼器側(cè),這表示當(dāng)解碼器已將該參數(shù)集識(shí)別為強(qiáng)制性參數(shù)集時(shí),解碼器必須完全地讀取參數(shù)集并對(duì)其進(jìn)行處理,然而,當(dāng)解碼器遇到對(duì)于重建不是強(qiáng)制性(即,標(biāo)記為可選)的參數(shù)集時(shí),解碼器將簡(jiǎn)單地跳過比特流中屬于該參數(shù)集的比特。因此,解碼器不必具有關(guān)于第二參數(shù)集句法的任何知識(shí),以能夠處理編碼多通道信號(hào),而可以簡(jiǎn)單地跳過這部分,并簡(jiǎn)單地繼續(xù)處理可能仍是重建所需的編碼多通道信號(hào)的后續(xù)區(qū)域。
優(yōu)選地,將長(zhǎng)度信息插入標(biāo)記為可選的參數(shù)集的數(shù)據(jù)流中,這允許解碼器以快速和高效的方式簡(jiǎn)單地跳過與該參數(shù)集相關(guān)聯(lián)的比特,并僅采用標(biāo)記為強(qiáng)制性的參數(shù)集來進(jìn)行解碼。對(duì)于向后兼容性,優(yōu)選的是,版本號(hào)與至少每個(gè)可選參數(shù)集相關(guān)聯(lián),該版本號(hào)由產(chǎn)生該參數(shù)集的編碼器版本指定。因此,例如,在數(shù)據(jù)流中,最低版本的通道間電平差的參數(shù)集將標(biāo)記為強(qiáng)制性的,而之后的編碼器版本的通道間電平差的參數(shù)集獲得了另一版本號(hào),從而當(dāng)確立了解碼器無法處理具有更高版本號(hào)的參數(shù)集時(shí),解碼器將簡(jiǎn)單地使用具有較低版本號(hào)的相應(yīng)參數(shù)集來進(jìn)行重建。
最后,要注意,代表多通道信號(hào)的數(shù)據(jù)流不必也必須包含傳輸通道。取而代之地,如在將BCC參數(shù)編寫到CD、之后進(jìn)入相應(yīng)通道的情況下(其中,CD已包含M(等于或大于1)個(gè)傳輸通道),傳輸通道可以是已經(jīng)產(chǎn)生并獨(dú)立傳輸?shù)摹?br>

下文中將參考附圖詳細(xì)解釋本發(fā)明的優(yōu)選實(shí)施例,其中圖1a是根據(jù)本發(fā)明實(shí)施例、具有確定的數(shù)據(jù)流句法的編碼多通道信號(hào)的概觀圖;
圖1b是根據(jù)本發(fā)明實(shí)施例的圖1a的控制塊的具體表征;圖2a是根據(jù)本發(fā)明實(shí)施例的編碼器的電路框圖;圖2b是根據(jù)本發(fā)明實(shí)施例的解碼器的電路框圖;圖3a到3d示出了根據(jù)本發(fā)明的參數(shù)集配置的優(yōu)選實(shí)現(xiàn)方式;圖4a到4c示出了根據(jù)本發(fā)明的參數(shù)集數(shù)據(jù)的優(yōu)選實(shí)現(xiàn)方式;圖5示出了多通道編碼器的一般表征;圖6是BCC編碼器/BCC解碼器路徑的示意性框圖;圖7是圖6的BCC合成塊的電路框圖;以及圖8A到8C示出了參數(shù)集ICLD、ICTD和ICC的計(jì)算的典型場(chǎng)景的表征。
具體實(shí)施例方式
圖2a示出了用于產(chǎn)生編碼多通道信號(hào)的設(shè)備的優(yōu)選實(shí)現(xiàn)方式,其中,編碼多通道信號(hào)代表包括N個(gè)原始通道的未編碼多通道信號(hào),它們饋入裝置22的輸入20,裝置22用于提供M個(gè)傳輸通道和具有至少兩個(gè)參數(shù)集的參數(shù)信息。特別地,在裝置22的輸出23處輸出的傳輸通道的數(shù)目M小于原始音頻通道的數(shù)目N。將共同代表用于重建K個(gè)輸出通道的參數(shù)信息的單獨(dú)參數(shù)集施加于提供裝置22的輸出24a、24b、24c處。將M(其中M等于或大于1并小于N)個(gè)傳輸通道提供給用于編寫輸出側(cè)的數(shù)據(jù)流的裝置25,并將數(shù)據(jù)流施加于輸出26處,就像在輸出24a、24b、24c處的參數(shù)集一樣。
如上所述,可以與參數(shù)信息分離地傳輸/存儲(chǔ)縮混信息(M個(gè)傳輸通道)。
將用于編寫代表編碼多通道信號(hào)的數(shù)據(jù)流的裝置25設(shè)計(jì)為將M個(gè)傳輸通道寫入數(shù)據(jù)流,并進(jìn)一步將第一、第二和第三參數(shù)集寫入數(shù)據(jù)流,從而可以在不使用三個(gè)參數(shù)集之一、以及優(yōu)選地甚至不使用三個(gè)參數(shù)集中的至少兩個(gè)的情況下,進(jìn)行對(duì)K個(gè)輸出通道的重建。在這方面,對(duì)提供裝置22的輸出24a至24c處的參數(shù)集進(jìn)行標(biāo)記,以使一個(gè)參數(shù)集(如,第一參數(shù)集)絕對(duì)是重建所需的,而將其它兩個(gè)參數(shù)集(即,第二參數(shù)集和第三參數(shù)集)定義為對(duì)于重建只是可選地需要的。
接著,如下所述,編寫裝置25將會(huì)把第一參數(shù)集作為強(qiáng)制性參數(shù)集寫入數(shù)據(jù)流,并將會(huì)把第二參數(shù)集和第三參數(shù)集僅作為可選參數(shù)集寫入數(shù)據(jù)流。
將圖2a的輸出26處的數(shù)據(jù)流饋入圖2b所示的多通道解碼器的數(shù)據(jù)流輸入27。向讀取數(shù)據(jù)流的裝置28提供數(shù)據(jù)流的數(shù)據(jù),其中,如圖2a中所示的編碼器一樣,讀取數(shù)據(jù)流的裝置28也包括針對(duì)從數(shù)據(jù)流中提取的M個(gè)傳輸通道的邏輯輸出29、以及針對(duì)數(shù)據(jù)流中包含的參數(shù)集的其它邏輯輸出30a、30b。在將第一參數(shù)集標(biāo)記為強(qiáng)制性或重建絕對(duì)需要的本發(fā)明的優(yōu)選實(shí)施例中,讀取裝置28將會(huì)通過邏輯輸出30a向重建裝置31提供該第一參數(shù)集。例如,如果將讀取裝置28固定地設(shè)置為僅讀取強(qiáng)制性參數(shù)集并將其提供給重建裝置31,則裝置28將會(huì)簡(jiǎn)單地跳過輸入27處的數(shù)據(jù)流中的第二參數(shù)集,這由圖2b中的中斷邏輯輸出30b象征性地表示。
也可以通過控制輸入32向裝置28提供如下控制僅從數(shù)據(jù)流中提取強(qiáng)制性參數(shù)集并提供給裝置31,還是再附加地提取可選參數(shù)集并提供給裝置31,其中,從中推導(dǎo)出的資源可用性信息和/或控制信息通過控制輸入32而到達(dá)。
例如,資源可用性信息可以包括電池供電的解碼器確立還有足夠電池電能可用,從而指示讀取數(shù)據(jù)流的裝置28不但提取強(qiáng)制性參數(shù)集,還提取可選參數(shù)集,并通過相應(yīng)的邏輯輸出提供給重建裝置31,從而,這意味著重建裝置31在輸出33處提供了K個(gè)輸出通道,其中,K等于或小于圖2a的輸入20處的原始輸入通道的原始數(shù)目N。要注意,優(yōu)選的是數(shù)目K等于數(shù)目N,這是因?yàn)榻獯a器將可能希望產(chǎn)生在數(shù)據(jù)流中編碼的所有輸出通道。
用于讀取數(shù)據(jù)流的數(shù)據(jù)流讀取裝置28也操作以讀入至少第一參數(shù)集,并能夠在利用數(shù)據(jù)流中的可縮放性(即,在數(shù)據(jù)流中的參數(shù)集不用于重建)時(shí)跳過至少一個(gè)參數(shù)集,例如,第二參數(shù)集。接著,重建裝置31可操作以使用M個(gè)傳輸通道和第一參數(shù)集、但不使用第二參數(shù)集來重建K個(gè)輸出通道。
在本發(fā)明的實(shí)施例中,提供裝置22是BCC編碼器,該BCC編碼器接收N個(gè)原始通道,并在輸出側(cè)提供M個(gè)傳輸通道和單獨(dú)的參數(shù)集??蛇x地,提供裝置22也可以是所謂的比特流代碼轉(zhuǎn)換器,它在輸入側(cè)接收例如由圖7的元件114和116產(chǎn)生的、已經(jīng)以非縮放格式(僅有參數(shù)集、或連同傳輸通道的參數(shù)集)編寫的信息,并指示編寫裝置25相應(yīng)地重寫比特流,從而將參數(shù)集以可縮放形式寫入數(shù)據(jù)流。這表示,為了能夠理解數(shù)據(jù)流,解碼器不必讀入并解析數(shù)據(jù)流的所有數(shù)據(jù),但是可以在檢測(cè)到可選參數(shù)集時(shí)跳過與可選參數(shù)集相關(guān)聯(lián)的數(shù)據(jù)。
因此,對(duì)于具有可縮放參數(shù)集的數(shù)據(jù)流的實(shí)際編寫,存在多種可能性。在一個(gè)實(shí)施例中,根據(jù)固定數(shù)據(jù)流光柵(raster),可以設(shè)置參數(shù)集的數(shù)據(jù)的開始。在這種情況下,與可選參數(shù)集相關(guān)聯(lián)的長(zhǎng)度信息的傳輸不是強(qiáng)制性的。但是,該固定光柵可能會(huì)通過填充比特來人為地導(dǎo)致擴(kuò)大數(shù)據(jù)流的數(shù)據(jù)量。因此,優(yōu)選地,將長(zhǎng)度信息與每個(gè)可選參數(shù)集相關(guān)聯(lián),從而當(dāng)具有該信息時(shí),解碼器將會(huì)跳過可選參數(shù)集,即,將會(huì)基于長(zhǎng)度信息來簡(jiǎn)單地跳過優(yōu)選串行數(shù)據(jù)流中的特定數(shù)目的比特,然后在數(shù)據(jù)流的正確位置處(即,當(dāng)新參數(shù)集和/或新信息的數(shù)據(jù)開始時(shí))恢復(fù)讀入和分析。
例如,發(fā)信號(hào)指示新參數(shù)集的開始的可選可能性在于使同步模式在具有特定比特模式(即,不對(duì)數(shù)據(jù)進(jìn)行實(shí)際分析而僅根據(jù)比特模式搜索即可識(shí)別)的實(shí)際數(shù)據(jù)之前,以向解碼器發(fā)出信號(hào),通知參數(shù)集的數(shù)據(jù)在此開始,并在后續(xù)同步模式處結(jié)束。在這種情況下,當(dāng)已將參數(shù)集識(shí)別為可選參數(shù)集時(shí),解碼器將尋找與可選參數(shù)集的開始處相關(guān)聯(lián)的同步模式,然后在不進(jìn)行解析的情況下利用同步模式之后的比特執(zhí)行模式搜索,直到遇到下一同步模式。在兩個(gè)同步模式之間的比特將不會(huì)用于重建,但是將會(huì)簡(jiǎn)單忽略這些比特,而發(fā)信號(hào)指示可選參數(shù)集結(jié)束的、在后續(xù)同步模式處的數(shù)據(jù)如果不屬于另一可選參數(shù)集,則可以用作根據(jù)比特流句法所規(guī)定的。
在本發(fā)明的優(yōu)選實(shí)施例中,將多個(gè)通道的重建所需的至少兩個(gè)參數(shù)集相對(duì)于它們的感知重要性進(jìn)行分類。將對(duì)于感知(即,對(duì)于重建的多通道信號(hào)的質(zhì)量)最重要的參數(shù)集標(biāo)記為數(shù)據(jù)流中的強(qiáng)制性參數(shù)集,而僅將其它參數(shù)集標(biāo)記為可選參數(shù)集。例如,也可以進(jìn)一步分級(jí)為強(qiáng)制性、可選和只是演播(studio)重建所需的參數(shù)集,以實(shí)現(xiàn)三級(jí)縮放步驟,而不僅僅是兩級(jí)縮放步驟。要注意,因?yàn)閺臉?biāo)記的缺失中自動(dòng)地產(chǎn)生各個(gè)未標(biāo)記的參數(shù)集的類型,所以標(biāo)記強(qiáng)制的、或優(yōu)選地標(biāo)記可選參數(shù)就足夠了。
圖1a示出了數(shù)據(jù)流的示意性表征,在圖1a所示的實(shí)施例中,數(shù)據(jù)流首先包括控制塊10;其中具有M個(gè)傳輸通道的數(shù)據(jù)、表示為11的塊;以及針對(duì)每個(gè)參數(shù)集的塊12a、12b、...、12c。在本發(fā)明的優(yōu)選實(shí)施例中,如圖1b示意性示出的,控制塊10包括各種獨(dú)條的信息段。因此,控制塊10中的條目100通過名為“numBccDataMand”的字段來指示強(qiáng)制性參數(shù)集的數(shù)目。此外,字段101指示是否有可選參數(shù)集。標(biāo)記為“OptBccDataPresent”的字段用于此目的??刂茐K10的另一字段利用變量“numBccDataOpt”來指示可選參數(shù)集的數(shù)目。此外,塊103、104和105指示針對(duì)每個(gè)參數(shù)集的參數(shù)集i的類型和/或版本號(hào)。名為“BccDataId”的字段用于此目的。字段106、107和108的另一可選序列向標(biāo)記為可選的每個(gè)參數(shù)集(即,包括在可選參數(shù)集的數(shù)目之中)給出表示為“Lengthinfo”的可選長(zhǎng)度信息。這個(gè)長(zhǎng)度信息給出了相應(yīng)的關(guān)聯(lián)參數(shù)集(例如,第一參數(shù)集)的比特長(zhǎng)度。如將在以下所述,“Lengthinfo”也可以包括與發(fā)信號(hào)指示長(zhǎng)度(或者可選地,實(shí)際的長(zhǎng)度規(guī)定)所需的比特?cái)?shù)目有關(guān)的信息。
圖3a至3d示出了參數(shù)集配置的優(yōu)選形式。可以針對(duì)每一幀進(jìn)行參數(shù)集配置,但也可以例如,針對(duì)一組幀僅進(jìn)行一次參數(shù)集配置,如在包含許多幀的文件的開始處。因此,圖3a在偽代碼給出了可選參數(shù)集的存在和數(shù)目的定義,其中,“uimsbf”代表“無符號(hào)整數(shù)最高有效位優(yōu)先”,即,代表不包括任何符號(hào)、其最高有效位首先出現(xiàn)在數(shù)據(jù)流中的整數(shù)。因此,例如,在控制塊10的字段100中首先代表用于指定BCC數(shù)據(jù)數(shù)目的變量numBccData。
此外,字段101用于確立到底有沒有任何可選參數(shù)集(optBccDataPresent)。當(dāng)這完成之后,接下來,讀入可選參數(shù)集的數(shù)目(numBccDataOPt),以獲得與可選參數(shù)集有關(guān)的進(jìn)一步信息或所謂的“組塊”(optChunkInfo)。變量numBccDataOptM1包含代表“減1”的后綴“M1”。這通過在圖3d中加入“+1”來進(jìn)行平衡。
圖3b示出了實(shí)施例中參數(shù)集數(shù)據(jù)標(biāo)識(shí)符在字段103至105中可以具有的值的概觀圖。因此,變量“BccDataId”可以首先包括名稱,即參數(shù)類型(即,ICLD、ICTD和ICC),并同時(shí)具有各自的版本號(hào)V1或V2。因此,在圖3b中可見,數(shù)據(jù)流實(shí)際上可以同時(shí)包含第一版本V1和之后的第二版本V2的通道間電平差,其中,適于第一版本的相應(yīng)解碼器可以簡(jiǎn)單地將ICLD_V1讀入作為強(qiáng)制性參數(shù)集,并可以忽略ICLD_V2;而具有較高版本號(hào)的解碼器可以簡(jiǎn)單地將ICLD_V2讀入作為強(qiáng)制性參數(shù)集,而忽略ICLD_V1,僅將其作為該場(chǎng)景中可選地所需參數(shù)集。可選地,可以編寫數(shù)據(jù)集,從而強(qiáng)制性數(shù)據(jù)集總是僅以一個(gè)版本存在于數(shù)據(jù)流中。
圖3c示出了可選參數(shù)集的標(biāo)識(shí)。因此,在與可選參數(shù)集有關(guān)的信息中,針對(duì)每個(gè)參數(shù)集,讀入圖1b的參數(shù)集標(biāo)識(shí)符103至105,以獲得與每個(gè)可選參數(shù)集有關(guān)的信息。此外,如圖3c中的命令“OptChunkLen()”所示,如果在比特流中傳輸參數(shù)集,則針對(duì)可選參數(shù)集,讀入?yún)?shù)集的長(zhǎng)度。
對(duì)于可選參數(shù)集的長(zhǎng)度信息的確定,見圖3d,圖3d示出了在本發(fā)明的優(yōu)選實(shí)施例中,如何從與每個(gè)可選參數(shù)集相關(guān)聯(lián)的數(shù)據(jù)中讀入每個(gè)可選參數(shù)集的比特長(zhǎng)度。
圖4a中示意性示出了由解碼器執(zhí)行的參數(shù)集讀取循環(huán)。因此,利用BccData()讀入圖1的塊12a至12c中的實(shí)際參數(shù)集數(shù)據(jù)。
圖4b中示出了長(zhǎng)度信息的讀取。例如,BccDataLenBits描述了用于發(fā)信號(hào)指示組塊的實(shí)際比特長(zhǎng)度所必需的比特?cái)?shù)目。然后,BccDataLen實(shí)際上給出了組塊具有的比特長(zhǎng)度。該兩級(jí)系統(tǒng)一方面比較靈活,以及另一方面節(jié)省了數(shù)據(jù),這是因?yàn)樵诮M塊的比特長(zhǎng)度顯著變化時(shí)(這尤其適用于非常不同的類型和長(zhǎng)度的參數(shù)集)特別有效。這將會(huì)允許對(duì)具有幾乎任何長(zhǎng)度的其它組塊的將來的定義。
圖4c最后示出了參數(shù)集切換,其中,對(duì)如圖3b所示的參數(shù)集標(biāo)識(shí)符進(jìn)行評(píng)估,以使參數(shù)集與相應(yīng)的重建算法相關(guān)聯(lián),從而不會(huì)發(fā)生例如將通道間電平差用作通道間時(shí)間差的情況,反之亦然。
圖4c還示出了當(dāng)已將參數(shù)集標(biāo)識(shí)為可選的,并且不希望使用可選參數(shù)集進(jìn)行解碼時(shí),跳過該參數(shù)集的比特?cái)?shù)目(“跳過并繼續(xù)”),以在已讀入所有強(qiáng)制性參數(shù)集時(shí)(或者在存在解碼器未知的數(shù)據(jù),例如,參數(shù)集時(shí))開始輸出,而不考慮其它的可選參數(shù)集(“停止解析,開始輸出”)。因此,當(dāng)已經(jīng)讀入了至少一個(gè)強(qiáng)制性組塊、并無法進(jìn)一步解析數(shù)據(jù)流中的信息時(shí),這種解碼器將開始輸出。因此,解碼器不理解的數(shù)據(jù)流內(nèi)容不會(huì)引起解碼器的完全錯(cuò)誤退出。這產(chǎn)生了非常魯棒的解碼器。
在下文中,將基于本發(fā)明的優(yōu)選實(shí)施例,更加詳細(xì)地描述本發(fā)明的功能。例如,在不同的和分離的數(shù)據(jù)部分中(即,在不同縮放層中),容納有諸如ICLD、ICTD、ICC之類的不同類型的參數(shù)信息,以及可以在將來定義的其它參數(shù)集信息。為此目的,再次參看圖4a至4c。將參數(shù)集區(qū)分為諸如通道間電平差參數(shù)集之類的強(qiáng)制性(必須的)參數(shù)集、以及諸如通道間時(shí)間差參數(shù)集和通道間相關(guān)值參數(shù)集之類的可選參數(shù)集。
提供了與強(qiáng)制性參數(shù)集的數(shù)目(numBccDataMand)、以及可選參數(shù)集的存在(optBccDataPresent)和數(shù)目(numBccDataOpt)有關(guān)的信息。通常,與強(qiáng)制性參數(shù)集的數(shù)目(numBccDataMand)有關(guān)的信息取決于系統(tǒng)規(guī)范,因此不必必須進(jìn)行顯式地傳輸,但是可以在編碼器和解碼器之間固定地設(shè)置。相反,優(yōu)選的是顯式地傳輸可選數(shù)據(jù)集的數(shù)目(numBccDataOpt)。如圖3a所示,當(dāng)存在參數(shù)(optBccDataPresent)指示可選參數(shù)集的存在時(shí),開始對(duì)與可選參數(shù)集有關(guān)的信息的相應(yīng)評(píng)估。
在本發(fā)明的優(yōu)選實(shí)施例中,還提供了針對(duì)每個(gè)參數(shù)集的標(biāo)識(shí)符(BccDataId)。如圖3b所示,該標(biāo)識(shí)符提供與參數(shù)集類型(例如ICLD、ICTD或ICC)和/或特定參數(shù)集的句法版本有關(guān)的信息。通常,隱含地指示強(qiáng)制性參數(shù)集的標(biāo)識(shí)符,而顯式地指示可選參數(shù)的標(biāo)識(shí)符。但是在這種情況下,必須在編碼器與解碼器之間設(shè)置的是例如,所遇到的第一個(gè)參數(shù)集是強(qiáng)制性參數(shù)集,例如,在固定設(shè)置的場(chǎng)景中,該參數(shù)集包括通道間電平差參數(shù)集??蛇x地,也可以通過規(guī)定參數(shù)集類型的順序,來隱含地定義參數(shù)集類型信息。
優(yōu)選地,參數(shù)集將會(huì)包括參數(shù)集長(zhǎng)度信息。提供這種參數(shù)集長(zhǎng)度信息允許解碼器在甚至不必知道參數(shù)集的確切的比特流句法的情況下,通過簡(jiǎn)單地跳過關(guān)聯(lián)比特來忽略該參數(shù)集。為此目的,參看圖4b。
在本發(fā)明的優(yōu)選實(shí)施例中,因?yàn)樵谌魏吻闆r下解碼器都必須解析和處理與強(qiáng)制性參數(shù)集有關(guān)的數(shù)據(jù),而無法簡(jiǎn)單地將其舍棄,所以強(qiáng)制性參數(shù)集不包括參數(shù)集長(zhǎng)度信息。因此,可以將解碼器實(shí)現(xiàn)為在發(fā)現(xiàn)參數(shù)集、并且該參數(shù)集不包含任何其它關(guān)聯(lián)信息時(shí),假設(shè)該參數(shù)集(例如ICLD)在確定可用的參數(shù)集之中,并且由于該參數(shù)集不包括任何相應(yīng)的信息,所以該參數(shù)集是強(qiáng)制性參數(shù)集。
對(duì)于可選參數(shù)集,根據(jù)應(yīng)用情況,可以傳輸或不傳輸參數(shù)集長(zhǎng)度信息。簡(jiǎn)單的規(guī)則可以是,為了改進(jìn)編碼器與解碼器之間的互相可操作性,所有可選參數(shù)集均包括參數(shù)集長(zhǎng)度信息。但是,為了節(jié)省比特,對(duì)于最后的參數(shù)集,可以不傳輸長(zhǎng)度信息,這是因?yàn)橛捎谠搮?shù)集無論如何都是最后的參數(shù)集,所以不再需要跳過這些數(shù)據(jù)、以及訪問隨后的參數(shù)集。當(dāng)如圖1a所示的數(shù)據(jù)塊實(shí)際上以第一參數(shù)集12c終止時(shí),并且當(dāng)隨后不再有和信號(hào)塊和/或剛處理過的M個(gè)傳輸通道的塊的控制信息等時(shí),該過程顯然是有用的。
例如,根據(jù)資源可用性信息32(圖2b),顯式的信號(hào)指示可以是,可由編碼器通過比特流元素來動(dòng)態(tài)地發(fā)信號(hào)指示參數(shù)長(zhǎng)度信息的傳輸,該比特流元素向解碼器通知參數(shù)集長(zhǎng)度信息的存在/長(zhǎng)度,這是已基于圖3d示出的。
在下文中,將論述圖2b所示的解碼器的解碼過程的優(yōu)選實(shí)施例。該優(yōu)選的解碼器首先檢查強(qiáng)制性(必須的)參數(shù)集的可用性,優(yōu)選地,該強(qiáng)制性參數(shù)集將會(huì)是通道間電平差參數(shù)集。此外,當(dāng)ILD參數(shù)集的句法版本號(hào)高于解碼器自身能夠解碼的版本號(hào)時(shí)(其中,例如,解碼器支持從1至n的句法版本,則圖2b的重建裝置31可以不進(jìn)行任何重建。在所有其它情況下,可以通過對(duì)強(qiáng)制性參數(shù)集進(jìn)行解碼來進(jìn)行確定形式的有效解碼過程,以及當(dāng)不使用可選參數(shù)集時(shí),僅使用強(qiáng)制性參數(shù)集來執(zhí)行多通道合成。
但是,當(dāng)解碼器檢測(cè)到可選參數(shù)集時(shí),解碼器可以使用該參數(shù)集或舍棄其內(nèi)容。例如,對(duì)兩種可能性之一的選擇取決于下述場(chǎng)景。
如果可選參數(shù)集的句法版本號(hào)高于該參數(shù)集類型的解碼器自身所安裝的句法版本能力,則解碼器無法處理該參數(shù)集類型,并將跳過該參數(shù)集。然而在這種情況下,在不使用該可選參數(shù)集類型執(zhí)行多通道重建的情況下,仍然實(shí)現(xiàn)了有效的解碼。但是,如果可以考慮可選參數(shù)集的內(nèi)容,則根據(jù)解碼器的能力,將實(shí)現(xiàn)更高質(zhì)量的重建。
例如,要注意,使用通道間相干值的合成可能占用相當(dāng)大量的計(jì)算資源。因此,例如,低復(fù)雜度的解碼器可以根據(jù)資源控制信息來忽略該參數(shù)集,而能夠提供更高輸出質(zhì)量的解碼器將會(huì)提取并使用所有參數(shù)集(即,強(qiáng)制性和可選參數(shù)集)來進(jìn)行重建。在優(yōu)選實(shí)施例中,基于在相應(yīng)時(shí)間處(即,動(dòng)態(tài)地)的計(jì)算資源的可用性,來作出使用/舍棄參數(shù)集的決定。
本發(fā)明構(gòu)思在不會(huì)干擾現(xiàn)有解碼器的可解碼性的情況下,提供了兼容地更新非強(qiáng)制性(即,可選)參數(shù)集類型的比特流格式的可能性,即,向后兼容性。此外,本發(fā)明在任何情況下確保,當(dāng)通過提高強(qiáng)制性參數(shù)集的句法版本號(hào)(即,ILD信息,或可選地由圖3b中的字段“BccDataId”No.4所示的)來更新句法時(shí),較舊的解碼器將產(chǎn)生無效輸出,在最壞情況下,該無效輸出甚至引起揚(yáng)聲器的損壞。
因此,本發(fā)明構(gòu)思不同于傳統(tǒng)比特流句法,在傳統(tǒng)比特流句法中,解碼器必須知道可用在比特流中的每個(gè)參數(shù)集的全部句法,以能夠在第一位置首先讀入所有參數(shù)集,然后能夠利用相應(yīng)的參數(shù)來驅(qū)動(dòng)相應(yīng)的處理器元件(如那些在圖7中所示的)。當(dāng)僅提取了通道間電平差作為強(qiáng)制性參數(shù)集時(shí),本發(fā)明的解碼器將跳過塊126和128,來執(zhí)行多通道重建,即使該重建質(zhì)量較低。
總之,下文中將再次示出編碼器的本質(zhì)特征,解碼器可以有利地使用該特征,以使用低數(shù)據(jù)速率的數(shù)據(jù)流來實(shí)現(xiàn)高效和高質(zhì)量的解碼。
如果對(duì)于重建后的多通道信號(hào)的質(zhì)量,在K個(gè)輸出通道的重建中的一參數(shù)集沒有另一參數(shù)集那樣重要,則將編寫裝置25設(shè)計(jì)為對(duì)數(shù)據(jù)集進(jìn)行編寫,以便在不使用較不重要的數(shù)據(jù)集的情況下也可以進(jìn)行重建。
優(yōu)選地,還將編寫裝置25設(shè)計(jì)為向參數(shù)集提供關(guān)聯(lián)的標(biāo)識(shí)符100至105,其中,參數(shù)集的標(biāo)識(shí)符指示參數(shù)集絕對(duì)必須用于重建,或者另一參數(shù)集的標(biāo)識(shí)符指示參數(shù)集可以只是可選地用于重建。
優(yōu)選地,編寫裝置25還設(shè)計(jì)為將M個(gè)傳輸通道寫入數(shù)據(jù)流的數(shù)據(jù)集的傳輸通道部分11,以將第一參數(shù)集寫入第一參數(shù)集部分12a,并將第二參數(shù)集寫入第二參數(shù)集部分12b,從而解碼器可以無需讀取和解譯第二參數(shù)集部分(12b)而重建K個(gè)輸出通道。
如果參數(shù)集是從以下包括通道間電平差、通道間時(shí)間差、通道間相位差或通道間相干信息的組中選擇的,則將編寫裝置25設(shè)計(jì)為將通道間電平差參數(shù)集標(biāo)記為對(duì)于解碼是強(qiáng)制性的,以及將組中的至少一個(gè)其它參數(shù)集標(biāo)記為對(duì)于解碼是可選的。
優(yōu)選地,將編寫裝置25設(shè)計(jì)為向第二參數(shù)集提供用于指示屬于第二參數(shù)集的數(shù)據(jù)集中數(shù)據(jù)量的長(zhǎng)度信息106至108,從而解碼器能夠基于長(zhǎng)度信息來跳過該數(shù)據(jù)量,其中,長(zhǎng)度信息優(yōu)選地包括用于信號(hào)指示長(zhǎng)度字段的比特長(zhǎng)度的第一字段,以及長(zhǎng)度字段包括給出的第二參數(shù)集的比特量的比特長(zhǎng)度。
優(yōu)選地,還將編寫裝置25設(shè)計(jì)為將數(shù)目信息102寫入數(shù)據(jù)流,用于指示可選參數(shù)集的數(shù)目,沒有這些可選參數(shù)集,解碼器也可以執(zhí)行對(duì)K個(gè)輸出通道的重建。
優(yōu)選地,還將編寫裝置25設(shè)計(jì)為將句法版本信息103至105與參數(shù)集相關(guān)聯(lián),從而僅在句法版本信息具有預(yù)定狀態(tài)時(shí),解碼器才使用相應(yīng)的參數(shù)集來執(zhí)行重建。
優(yōu)選地,在可應(yīng)用的情況下,還可以只有針對(duì)第二參數(shù)集和其它可選參數(shù)集的句法版本信息。
此外,數(shù)據(jù)流中的參數(shù)集序列中的最后的可選參數(shù)集可以不包括任何關(guān)聯(lián)長(zhǎng)度信息。
此外,可以將編寫裝置25設(shè)計(jì)為在數(shù)據(jù)流中動(dòng)態(tài)地信號(hào)指示參數(shù)集長(zhǎng)度信息的存在和長(zhǎng)度。
可以將提供裝置22設(shè)計(jì)為提供M個(gè)傳輸通道的數(shù)據(jù)塊序列,這個(gè)數(shù)據(jù)塊序列是基于至少一個(gè)原始通道的時(shí)間采樣塊序列的。
根據(jù)情況,可以在硬件或軟件中實(shí)現(xiàn)用于產(chǎn)生和/或解碼的本發(fā)明方法??梢栽跀?shù)字存儲(chǔ)介質(zhì)上進(jìn)行實(shí)現(xiàn),特別是在具有可以電讀出的控制信號(hào)的軟盤或CD上,它們可以與可編程計(jì)算機(jī)系統(tǒng)合作以執(zhí)行該方法。一般而言,本發(fā)明還包括計(jì)算機(jī)程序產(chǎn)品,計(jì)算機(jī)程序產(chǎn)品具有存儲(chǔ)在機(jī)器可讀載體上的程序代碼,當(dāng)計(jì)算機(jī)程序產(chǎn)品運(yùn)行在計(jì)算機(jī)上時(shí),該程序代碼執(zhí)行所述方法。換言之,本發(fā)明可實(shí)現(xiàn)為具有程序代碼的計(jì)算機(jī)程序,當(dāng)在計(jì)算機(jī)上運(yùn)行計(jì)算機(jī)程序時(shí),該程序代碼執(zhí)行所述方法。
權(quán)利要求
1.一種用于產(chǎn)生編碼多通道信號(hào)的設(shè)備,所述編碼多通道信號(hào)代表包括N個(gè)原始通道的未編碼多通道信號(hào),其中,N等于或大于2,所述設(shè)備包括提供裝置(22),用于提供從M個(gè)傳輸通道(23)中重建K個(gè)輸出通道的參數(shù)信息(24a,24b,24c),其中,M等于或大于1并等于或小于N,K大于M并等于或小于N,所述參數(shù)信息包括用于重建同一個(gè)輸出通道的至少兩個(gè)不同的參數(shù)集;以及編寫裝置(25),用于編寫數(shù)據(jù)流(26),其中,所述裝置(25)設(shè)計(jì)用于將所述第一和第二參數(shù)集寫入數(shù)據(jù)流,從而在不使用所述第二參數(shù)集和所述M個(gè)傳輸通道(23)中的至少一個(gè)的情況下,來進(jìn)行對(duì)所述K個(gè)輸出通道中的至少一個(gè)的重建。
2.一種對(duì)編碼多通道信號(hào)進(jìn)行解碼的設(shè)備,所述編碼多通道信號(hào)代表包括有N個(gè)原始通道的未編碼多通道信號(hào),其中,由包括用于從M個(gè)傳輸通道中重建K個(gè)輸出通道的參數(shù)信息的數(shù)據(jù)流來代表所述編碼多通道信號(hào),其中,M等于或大于1并等于或小于N,K大于M并等于或小于N,所述參數(shù)信息包括用于重建同一個(gè)輸出通道的至少兩個(gè)不同參數(shù)集,以及將所述第一和第二參數(shù)集寫入數(shù)據(jù)流,從而在不使用所述第二參數(shù)集情況下,來進(jìn)行對(duì)K個(gè)輸出通道的重建,所述設(shè)備包括數(shù)據(jù)流讀取裝置(28),用于讀取數(shù)據(jù)流,以讀入所述第一參數(shù)集(30a),并跳過所述第二參數(shù)集(30b)。
3.根據(jù)權(quán)利要求2所述的設(shè)備,還包括重建裝置(32),用于使用所述M個(gè)傳輸通道和所述第一參數(shù)集,但不使用所述第二參數(shù)集,來重建所述K個(gè)輸出通道。
4.根據(jù)權(quán)利要求2或3所述的設(shè)備,其中,所述第一參數(shù)集包括關(guān)聯(lián)句法版本信息(103至105),以及其中,將所述讀取裝置(28)設(shè)計(jì)用于讀取所述關(guān)聯(lián)句法版本信息,并驅(qū)動(dòng)所述重建裝置(31),從而僅在所讀取的句法版本信息與用于解碼的設(shè)備給定的句法版本信息兼容時(shí),才由所述重建裝置執(zhí)行重建。
5.根據(jù)權(quán)利要求2、3或4所述的設(shè)備,其中,所述第二參數(shù)集包括關(guān)聯(lián)句法版本信息(103至105),以及所述讀取裝置(28)設(shè)計(jì)用于在所讀取的句法版本信息與解碼設(shè)備的給定句法版本信息不兼容時(shí),跳過所述第二參數(shù)集,以及用于在所讀取的句法版本信息與給定的句法版本信息兼容時(shí),讀入所述第二參數(shù)集。
6.根據(jù)權(quán)利要求2到5之一所述的設(shè)備,其中,所述第二參數(shù)集包括長(zhǎng)度信息,用于指示關(guān)聯(lián)第二參數(shù)集的數(shù)據(jù)量,以及所述讀取裝置(28)設(shè)計(jì)用于在不解析所述第二參數(shù)集數(shù)據(jù)的情況下,基于所述長(zhǎng)度信息來跳過有所述長(zhǎng)度信息所指示的數(shù)據(jù)集中的數(shù)據(jù)量。
7.根據(jù)權(quán)利要求2到6之一所述的設(shè)備,其中,所述讀取裝置(28)是可控制(32)來獲得資源可用性信息的,以及其中,還將所述讀取裝置(28)設(shè)計(jì)用于當(dāng)資源可用性信息指示足夠的資源時(shí),讀入所述第二參數(shù)集,以及當(dāng)資源可用性信息指示不足的資源時(shí),跳過所述第二參數(shù)集。
8.根據(jù)權(quán)利要求2到7之一所述的設(shè)備,其中,相對(duì)于重建的多通道信號(hào)的質(zhì)量,在K個(gè)輸出通道的重建中的一個(gè)參數(shù)集沒有另一參數(shù)集重要,以及將所述數(shù)據(jù)流讀取裝置(28)設(shè)計(jì)用于跳過較不重要的數(shù)據(jù)集。
9.根據(jù)權(quán)利要求2到8之一所述的設(shè)備,其中,所述數(shù)據(jù)流包括具有關(guān)聯(lián)標(biāo)識(shí)符(100至105)的參數(shù)集,參數(shù)集的標(biāo)識(shí)符指示所述參數(shù)集絕對(duì)必須用于重建,或者另一參數(shù)集的標(biāo)識(shí)符指示所述參數(shù)集只是可選地用于重建,將所述數(shù)據(jù)流讀取裝置(28)設(shè)計(jì)用于檢測(cè)所述標(biāo)識(shí)符,并基于所檢測(cè)的標(biāo)識(shí)符,來讀取所述強(qiáng)制性參數(shù)集和跳過可選參數(shù)集。
10.根據(jù)權(quán)利要求2到9之一所述的設(shè)備,其中,所述數(shù)據(jù)流包括第一參數(shù)集部分(12a)中的第一參數(shù)集和第二參數(shù)集部分(12b)中的第二參數(shù)集,將所述數(shù)據(jù)流讀取裝置設(shè)計(jì)用于相對(duì)于所述參數(shù)集部分,對(duì)所述數(shù)據(jù)流進(jìn)行解譯,并讀入所述第一參數(shù)集部分,而跳過所述第二參數(shù)集部分。
11.根據(jù)權(quán)利要求2到10之一所述的設(shè)備,其中,參數(shù)集是從包括如下的通道間電平差、通道間時(shí)間差、通道間相位差或通道間相干信息的組中選擇的,在數(shù)據(jù)流中,將通道間電平差參數(shù)集標(biāo)記為解碼所絕對(duì)需要的,而將所述組中的至少一個(gè)其它參數(shù)集標(biāo)記為解碼所可選的,以及將所述數(shù)據(jù)流讀取裝置(28)設(shè)計(jì)用于讀入所述通道間電平差參數(shù)集,并跳過所述組中的另一參數(shù)集。
12.根據(jù)權(quán)利要求2到11之一所述的設(shè)備,其中,所述數(shù)據(jù)流包括用于指示可選參數(shù)集的數(shù)目的數(shù)目信息(102),解碼器無需所述可選參數(shù)集而執(zhí)行K個(gè)輸出通道的重建,將所述數(shù)據(jù)流讀取裝置設(shè)計(jì)用于基于所述數(shù)目信息,讀入至少一個(gè)可選參數(shù)集。
13.根據(jù)權(quán)利要求2所述的設(shè)備,其中,如果可用,所述數(shù)據(jù)流中有僅針對(duì)所述第二參數(shù)集和其它可選參數(shù)集的關(guān)聯(lián)句法版本信息。
14.根據(jù)前述權(quán)利要求之一所述的設(shè)備,其中,所述數(shù)據(jù)流中參數(shù)集序列中的最后的可選參數(shù)集不包括任何關(guān)聯(lián)長(zhǎng)度信息,將所述數(shù)據(jù)流讀取裝置(28)設(shè)計(jì)用于在讀入最后的可選參數(shù)集之前不讀取和解譯任何長(zhǎng)度信息。
15.根據(jù)權(quán)利要求2到14之一所述的設(shè)備,其中,在所述數(shù)據(jù)流中,動(dòng)態(tài)地發(fā)信號(hào)指示參數(shù)集長(zhǎng)度信息的存在和長(zhǎng)度,以及將所述數(shù)據(jù)流讀取裝置(28)設(shè)計(jì)用于首先在所述數(shù)據(jù)流中檢測(cè)參數(shù)集長(zhǎng)度信息的存在,然后基于檢測(cè)到的存在,從所述數(shù)據(jù)流中提取參數(shù)集長(zhǎng)度信息的長(zhǎng)度。
16.根據(jù)權(quán)利要求3到15之一所述的設(shè)備,其中,所述M個(gè)傳輸通道是BCC縮混通道,以及所述參數(shù)集包括BCC參數(shù),將所述重建裝置(32)設(shè)計(jì)用于執(zhí)行BCC合成。
17.一種用于產(chǎn)生編碼多通道信號(hào)的方法,所述編碼多通道信號(hào)代表包括N個(gè)原始通道的未編碼多通道信號(hào),其中,N等于或大于2,所述方法包括提供(22)參數(shù)信息(24a,24b,24c),用于從M個(gè)傳輸通道(23)中重建K個(gè)輸出通道,其中,M等于或大于1并等于或小于N,K大于M并等于或小于N,所述參數(shù)信息包括用于重建同一個(gè)輸出通道的至少兩個(gè)不同的參數(shù)集;以及通過將所述第一和第二參數(shù)集寫入數(shù)據(jù)流(26)來編寫(25)所述數(shù)據(jù)流,從而在不使用第二參數(shù)集而使用所述M個(gè)傳輸通道(23)中的至少一個(gè)的情況下,來進(jìn)行所述K個(gè)輸出通道中的至少一個(gè)的重建。
18.一種對(duì)編碼多通道信號(hào)進(jìn)行解碼的方法,所述編碼多通道信號(hào)代表包括N個(gè)原始通道的未編碼多通道信號(hào),其中,由包括用于從M個(gè)傳輸通道中重建K個(gè)輸出通道的參數(shù)信息的數(shù)據(jù)流來代表所述編碼多通道信號(hào),其中,M等于或大于1并等于或小于N,K大于M并等于或小于N,所述參數(shù)信息包括用于重建同一個(gè)輸出通道的至少兩個(gè)不同參數(shù)集,將所述第一和第二參數(shù)集寫入數(shù)據(jù)流,從而在不使用所述第二參數(shù)集情況下,來進(jìn)行所述K個(gè)輸出通道的重建,所述方法包括讀取(28)數(shù)據(jù)流,以讀入所述第一參數(shù)集(30a),并跳過所述第二參數(shù)集(30b)。
19.一種具有程序代碼的計(jì)算機(jī)程序,當(dāng)在計(jì)算機(jī)上運(yùn)行所述計(jì)算機(jī)程序時(shí),所述程序代碼執(zhí)行根據(jù)權(quán)利要求17的方法或用于執(zhí)行根據(jù)權(quán)利要求18所述的方法。
全文摘要
在用于產(chǎn)生多個(gè)不同參數(shù)集的多通道編碼器中,編寫(25)數(shù)據(jù)流(26),以使兩個(gè)參數(shù)集是彼此獨(dú)立地可解碼的,其中,所述參數(shù)集是用于使用至少一個(gè)傳輸通道來重建多通道輸出信號(hào)的。因此,使多通道解碼器能夠在讀取數(shù)據(jù)流時(shí)跳過標(biāo)記為可選和/或具有更高版本號(hào)的參數(shù)集,并仍然能夠使用標(biāo)記為強(qiáng)制性的數(shù)據(jù)集或具有足夠低的版本號(hào)的數(shù)據(jù)集,來執(zhí)行有效的多通道重建。這實(shí)現(xiàn)了以向后兼容性和可靠性為特征的、適合將來的更新的靈活的編碼器/解碼器構(gòu)思。
文檔編號(hào)G10L19/008GK101044550SQ200580029213
公開日2007年9月26日 申請(qǐng)日期2005年8月29日 優(yōu)先權(quán)日2004年9月3日
發(fā)明者于爾根·赫勒, 拉爾夫·施佩爾施奈德, 約翰內(nèi)斯·希爾珀特, 卡斯滕·林茨邁爾, 哈拉爾德·波普 申請(qǐng)人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
达尔| 太谷县| 嘉峪关市| 巴东县| 和平区| 株洲市| 汶川县| 台南县| 贵阳市| 紫金县| 新沂市| 偃师市| 都兰县| 晋城| 金溪县| 香格里拉县| 元朗区| 黄龙县| 吴堡县| 繁昌县| 汪清县| 瑞丽市| 中方县| 茂名市| 闸北区| 阿克苏市| 云阳县| 马边| 老河口市| 高州市| 海盐县| 哈尔滨市| 肇州县| 荥经县| 永城市| 庆阳市| 汉沽区| 财经| 巩留县| 沙雅县| 疏勒县|