欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于自適應(yīng)音頻的混合型基于優(yōu)先度的渲染系統(tǒng)和方法與流程

文檔序號(hào):11291516閱讀:337來源:國(guó)知局
用于自適應(yīng)音頻的混合型基于優(yōu)先度的渲染系統(tǒng)和方法與流程

相關(guān)申請(qǐng)的交叉引用

本申請(qǐng)要求2015年2月6日提交的美國(guó)臨時(shí)專利申請(qǐng)no.62/113268的優(yōu)先權(quán),該申請(qǐng)全文通過引用并入于此。

一個(gè)或多個(gè)實(shí)現(xiàn)總體上涉及音頻信號(hào)處理,更具體地涉及一種用于自適應(yīng)音頻內(nèi)容的混合型基于優(yōu)先度的渲染策略。



背景技術(shù):

數(shù)字影院的引入和真實(shí)三維(“3d”)或虛擬3d內(nèi)容的開發(fā)創(chuàng)建了新的聲音標(biāo)準(zhǔn),諸如音頻的多個(gè)聲道的合并以允許內(nèi)容創(chuàng)建者的創(chuàng)造力更大并且觀眾的聽覺體驗(yàn)更有包圍感且更逼真。作為用于分發(fā)空間音頻的手段,擴(kuò)展超出傳統(tǒng)的揚(yáng)聲器饋送和基于聲道的音頻是關(guān)鍵的,并且對(duì)于基于模型的音頻描述一直存在相當(dāng)大的興趣,基于模型的音頻描述允許收聽者選擇期望的回放配置,從而特別針對(duì)他們選擇的配置渲染音頻。聲音的空間呈現(xiàn)利用音頻對(duì)象,音頻對(duì)象是具有視在源位置(例如,3d坐標(biāo))、視在源寬度和其他參數(shù)的相關(guān)參數(shù)化源描述的音頻信號(hào)。進(jìn)一步的發(fā)展包括下一代空間音頻(也被稱為“自適應(yīng)音頻”)格式已經(jīng)被開發(fā),該空間音頻格式包括音頻對(duì)象和傳統(tǒng)的基于聲道的揚(yáng)聲器饋送、連同音頻對(duì)象的位置元數(shù)據(jù)的混合。在空間音頻解碼器中,聲道被直接傳輸?shù)剿鼈兿嚓P(guān)聯(lián)的揚(yáng)聲器,或者被下混到現(xiàn)有的揚(yáng)聲器組,并且音頻對(duì)象被解碼器以靈活的(自適應(yīng)的)方式渲染。與每個(gè)對(duì)象相關(guān)聯(lián)的參數(shù)化源描述(諸如3d空間中的位置軌跡)連同連接到解碼器的揚(yáng)聲器的數(shù)量和位置一起被取作輸入。渲染器然后利用某些算法(諸如平移法則)來在所附連的一組揚(yáng)聲器上分發(fā)與每個(gè)對(duì)象相關(guān)聯(lián)的音頻。每個(gè)對(duì)象的創(chuàng)作空間意圖因此被最佳地呈現(xiàn)在收聽房間里存在的特定揚(yáng)聲器配置上。

高級(jí)的基于對(duì)象的音頻的出現(xiàn)顯著地提高了傳輸?shù)礁鞣N不同揚(yáng)聲器陣列的音頻內(nèi)容的性質(zhì)以及渲染處理的復(fù)雜度。例如,影院聲軌可以包括與屏幕上的圖像、對(duì)話、噪聲以及從屏幕上的不同地方發(fā)出的聲效相對(duì)應(yīng)的許多個(gè)不同的聲音元素,并且與背景音樂和環(huán)境效果組合以創(chuàng)建總體聽覺體驗(yàn)。準(zhǔn)確的回放要求以在聲源位置、強(qiáng)度、移動(dòng)和深度方面與屏幕上的顯示內(nèi)容盡可能緊密地對(duì)應(yīng)的方式再現(xiàn)聲音。

盡管高級(jí)的3d音頻系統(tǒng)(諸如atmostm系統(tǒng))大部分是針對(duì)影院應(yīng)用設(shè)計(jì)和部署的,但是消費(fèi)者級(jí)系統(tǒng)正被開發(fā)以將影院級(jí)的、自適應(yīng)的音頻體驗(yàn)帶到家庭環(huán)境和辦公室環(huán)境。與影院相比,這些環(huán)境在場(chǎng)地大小、聲學(xué)特性、系統(tǒng)功率以及揚(yáng)聲器配置方面受到明顯的約束。目前的專業(yè)級(jí)空間音頻系統(tǒng)因此需要適于將高級(jí)對(duì)象音頻內(nèi)容渲染到以不同的揚(yáng)聲器配置和回放能力為特征的收聽環(huán)境。為此,已經(jīng)開發(fā)出了某些虛擬化技術(shù)來擴(kuò)展傳統(tǒng)的立體聲或環(huán)繞聲揚(yáng)聲器陣列的能力,從而通過使用復(fù)雜的渲染算法和技術(shù)(諸如內(nèi)容相關(guān)的渲染算法、反射聲傳輸?shù)?來重建空間聲音提示。這樣的渲染技術(shù)已經(jīng)導(dǎo)致開發(fā)出了為了渲染不同類型的自適應(yīng)音頻內(nèi)容(諸如對(duì)象音頻元數(shù)據(jù)內(nèi)容(oamd)床和isf(中間空間格式)對(duì)象)而優(yōu)化的基于dsp的渲染器和電路。已經(jīng)開發(fā)出了不同的dsp電路來利用自適應(yīng)音頻的關(guān)于渲染特定oamd內(nèi)容的不同特性。然而,這樣的多處理器系統(tǒng)需要針對(duì)各處理器的存儲(chǔ)器帶寬和處理能力進(jìn)行優(yōu)化。

因此需要一種為用于自適應(yīng)音頻的多處理器渲染系統(tǒng)中的兩個(gè)或更多個(gè)處理器提供可伸縮處理器負(fù)荷的系統(tǒng)。

在家里越來越多地采用基于環(huán)繞聲和影院的音頻也已經(jīng)導(dǎo)致開發(fā)出了超出標(biāo)準(zhǔn)的兩路或三路直立型或書架型揚(yáng)聲器的不同類型和配置的揚(yáng)聲器。已經(jīng)開發(fā)出了不同揚(yáng)聲器來回放特定內(nèi)容,諸如作為5.1或7.1系統(tǒng)的一部分的條形音箱(soundbar)揚(yáng)聲器。條形音箱表示其中兩個(gè)或更多個(gè)驅(qū)動(dòng)器并置在單個(gè)外殼(揚(yáng)聲器箱體)中并且典型地沿著單個(gè)軸排列的一類揚(yáng)聲器。例如,流行的條形音箱典型地包括在矩形箱體中排成一行的4-6個(gè)揚(yáng)聲器,該矩形箱體被設(shè)計(jì)為裝在電視機(jī)或計(jì)算機(jī)監(jiān)視器的頂部、下面或正前方以將聲音直接傳輸出屏幕。由于條形音箱的配置,與通過物理放置(例如,高度驅(qū)動(dòng)器)或其他技術(shù)提供高度提示的揚(yáng)聲器相比,某些虛擬化技術(shù)可能難以實(shí)現(xiàn)。

因此進(jìn)一步需要一種對(duì)自適應(yīng)音頻虛擬化技術(shù)進(jìn)行優(yōu)化以通過條形音箱揚(yáng)聲器系統(tǒng)回放的系統(tǒng)。

背景部分中所討論的主題不應(yīng)僅由于它在背景部分中被提及就假定是現(xiàn)有技術(shù)。類似地,背景部分中所提及的問題或者與背景部分的主題相關(guān)聯(lián)的問題不應(yīng)被假定為以前已經(jīng)在現(xiàn)有技術(shù)中被認(rèn)識(shí)到。背景部分中的主題僅表示不同的方法,這些方法本身也可以是發(fā)明。dolby、dolbytruehd和atmos是杜比實(shí)驗(yàn)室許可公司的商標(biāo)。



技術(shù)實(shí)現(xiàn)要素:

描述了關(guān)于一種通過以下步驟來渲染自適應(yīng)音頻的方法的實(shí)施例:接收包括基于聲道的音頻、音頻對(duì)象以及動(dòng)態(tài)對(duì)象的輸入音頻,其中,動(dòng)態(tài)對(duì)象被分類為低優(yōu)先度動(dòng)態(tài)對(duì)象的集合和高優(yōu)先度動(dòng)態(tài)對(duì)象的集合;在音頻處理系統(tǒng)的第一渲染處理器中渲染基于聲道的音頻、音頻對(duì)象和低優(yōu)先度動(dòng)態(tài)對(duì)象;以及在音頻處理系統(tǒng)的第二渲染處理器中渲染高優(yōu)先度動(dòng)態(tài)對(duì)象。輸入音頻可以根據(jù)包括音頻內(nèi)容和渲染元數(shù)據(jù)的基于對(duì)象音頻的數(shù)字比特流格式進(jìn)行格式化?;诼暤赖囊纛l包括環(huán)繞聲音頻床,音頻對(duì)象包括符合中間空間格式的對(duì)象。低優(yōu)先度動(dòng)態(tài)對(duì)象和高優(yōu)先度動(dòng)態(tài)對(duì)象由優(yōu)先度閾值區(qū)分,優(yōu)先度閾值可以由以下中的一個(gè)定義:包括輸入音頻的音頻內(nèi)容的創(chuàng)作者、用戶選擇的值以及由音頻處理系統(tǒng)執(zhí)行的自動(dòng)化處理。在實(shí)施例中,優(yōu)先度閾值被編碼在對(duì)象音頻元數(shù)據(jù)比特流中。低優(yōu)先度音頻對(duì)象和高優(yōu)先度音頻對(duì)象的音頻對(duì)象的相對(duì)優(yōu)先度可以由它們各自在對(duì)象音頻元數(shù)據(jù)比特流中的位置確定。

在實(shí)施例中,所述方法進(jìn)一步包括:在基于聲道的音頻、音頻對(duì)象和低優(yōu)先度動(dòng)態(tài)對(duì)象在第一渲染處理器中被渲染以生成渲染音頻期間或之后,穿過第一渲染處理器將高優(yōu)先度音頻對(duì)象傳遞到第二渲染處理器;并且對(duì)渲染音頻進(jìn)行后處理以便傳輸?shù)綋P(yáng)聲器系統(tǒng)。后處理步驟包括以下中的至少一個(gè):上混、音量控制、均衡化、低音管理以及用于促進(jìn)輸入音頻中存在的高度提示的渲染以便通過揚(yáng)聲器系統(tǒng)回放的虛擬化步驟。

在實(shí)施例中,揚(yáng)聲器系統(tǒng)包括條形音箱揚(yáng)聲器,該條形音箱揚(yáng)聲器具有沿著單個(gè)軸傳輸聲音的多個(gè)并置驅(qū)動(dòng)器,并且第一渲染處理器和第二渲染處理器被體現(xiàn)在通過傳輸鏈路耦接在一起的單獨(dú)的數(shù)字信號(hào)處理電路中。優(yōu)先度閾值由以下中的至少一個(gè)確定:第一渲染處理器和第二渲染處理器的相對(duì)處理能力、與第一渲染處理器和第二渲染處理器中的每個(gè)渲染處理器相關(guān)聯(lián)的存儲(chǔ)器帶寬以及傳輸鏈路的傳輸帶寬。

實(shí)施例進(jìn)一步針對(duì)一種通過以下步驟來渲染自適應(yīng)音頻的方法:接收包括音頻分量和相關(guān)聯(lián)的元數(shù)據(jù)的輸入音頻比特流,音頻分量每個(gè)均具有選自以下的音頻類型:基于聲道的音頻、音頻對(duì)象以及動(dòng)態(tài)對(duì)象;基于各自的音頻類型來確定每個(gè)音頻分量的解碼器格式;根據(jù)與每個(gè)音頻分量相關(guān)聯(lián)的元數(shù)據(jù)中的優(yōu)先度字段來確定每個(gè)音頻分量的優(yōu)先度;在第一渲染處理器中渲染第一優(yōu)先度類型的音頻分量;并且在第二渲染處理器中渲染第二優(yōu)先度類型的音頻分量。第一渲染處理器和第二渲染處理器被實(shí)現(xiàn)為通過傳輸鏈路相互耦接的單獨(dú)的渲染數(shù)字信號(hào)處理器(dsp)。第一優(yōu)先度類型的音頻分量包括低優(yōu)先度動(dòng)態(tài)對(duì)象,第二優(yōu)先度類型的音頻分量包括高優(yōu)先度動(dòng)態(tài)對(duì)象,所述方法進(jìn)一步包括在第一渲染處理器中渲染基于聲道的音頻、音頻對(duì)象。在實(shí)施例中,基于聲道的音頻包括環(huán)繞聲音頻床,音頻對(duì)象包括符合中間空間格式(isf)的對(duì)象,并且低優(yōu)先度動(dòng)態(tài)對(duì)象和高優(yōu)先度動(dòng)態(tài)對(duì)象包括符合對(duì)象音頻元數(shù)據(jù)(oamd)格式的對(duì)象。每個(gè)音頻分量的解碼器格式產(chǎn)生以下中的至少一個(gè):oamd格式化的動(dòng)態(tài)對(duì)象、環(huán)繞聲音頻床以及isf對(duì)象。所述方法可以進(jìn)一步包括至少對(duì)高優(yōu)先度動(dòng)態(tài)對(duì)象施加虛擬化處理以促進(jìn)輸入音頻中存在的高度提示的渲染以便通過揚(yáng)聲器系統(tǒng)回放,并且揚(yáng)聲器系統(tǒng)可以包括具有沿著單個(gè)軸傳輸聲音的多個(gè)并置驅(qū)動(dòng)器的條形音箱揚(yáng)聲器。

實(shí)施例更進(jìn)一步針對(duì)實(shí)現(xiàn)前述方法的數(shù)字信號(hào)處理系統(tǒng)和/或包含實(shí)現(xiàn)前述方法中的至少一些方法的電路的揚(yáng)聲器系統(tǒng)。

通過引用的并入

本說明書中所提及的每篇出版物、專利和/或?qū)@暾?qǐng)都全文通過引用并入本文,達(dá)到如同每一篇出版物和/或?qū)@暾?qǐng)都被明確地且單獨(dú)地指示通過引用并入一樣的程度。

附圖說明

在以下附圖中,相同的標(biāo)號(hào)用于指代相同的元件。盡管以下附圖描繪了各種例子,但是一個(gè)或多個(gè)實(shí)現(xiàn)不限于附圖中描繪的例子。

圖1例示了提供用于回放高度聲道的高度揚(yáng)聲器的環(huán)繞系統(tǒng)(例如,9.1環(huán)繞)中的示例性揚(yáng)聲器放置。

圖2例示了在一個(gè)實(shí)施例下組合基于聲道的數(shù)據(jù)和基于對(duì)象的數(shù)據(jù)以生成自適應(yīng)音頻混合。

圖3是例示了在一個(gè)實(shí)施例下在混合型基于優(yōu)先度的系統(tǒng)中處理的音頻內(nèi)容的類型的表格。

圖4是在一個(gè)實(shí)施例下用于實(shí)現(xiàn)混合型基于優(yōu)先度的渲染策略的多處理器渲染系統(tǒng)的框圖。

圖5是在一個(gè)實(shí)施例下圖4的多處理器渲染系統(tǒng)的更詳細(xì)框圖。

圖6是例示了在一個(gè)實(shí)施例下實(shí)現(xiàn)基于優(yōu)先度的渲染以便通過條形音箱回放自適應(yīng)音頻內(nèi)容的方法。

圖7例示了可以與混合型基于優(yōu)先度的渲染系統(tǒng)的實(shí)施例一起使用的條形音箱揚(yáng)聲器。

圖8例示了基于優(yōu)先度的自適應(yīng)音頻渲染系統(tǒng)在示例性電視機(jī)和條形音箱消費(fèi)者用例中的使用。

圖9例示了基于優(yōu)先度的自適應(yīng)音頻渲染系統(tǒng)在示例性全環(huán)繞聲家庭環(huán)境中的使用。

圖10是例示了在一個(gè)實(shí)施例下在對(duì)條形音箱利用基于優(yōu)先度的渲染的自適應(yīng)音頻系統(tǒng)中一些示例性元數(shù)據(jù)定義的表格。

圖11例示了在一些實(shí)施例下用于與渲染系統(tǒng)一起使用的中間空間格式。

圖12例示了在一個(gè)實(shí)施例下用于與中間空間格式一起使用的疊環(huán)格式(stacked-ringformat)平移空間中的環(huán)的布置。

圖13例示了在一個(gè)實(shí)施例下音頻對(duì)象被平移到isf處理系統(tǒng)中所用的角度的揚(yáng)聲器弧。

圖14a-c例示了不同實(shí)施例下的疊環(huán)中間空間格式的解碼。

具體實(shí)施方式

描述了用于混合型基于優(yōu)先度的渲染策略的系統(tǒng)和方法,其中,對(duì)象音頻元數(shù)據(jù)(oamd)床或中間空間格式(isf)對(duì)象被使用第一dsp組件上的時(shí)域?qū)ο笠纛l渲染器(oar)組件渲染,而oamd動(dòng)態(tài)對(duì)象則由第二dsp組件上的后處理鏈中的虛擬渲染器渲染。輸出音頻可以通過一種或多種后處理和虛擬化技術(shù)優(yōu)化以便通過條形音箱揚(yáng)聲器回放。本文中所描述的一個(gè)或多個(gè)實(shí)施例的方面可以在包括執(zhí)行軟件指令的一個(gè)或多個(gè)計(jì)算機(jī)或處理裝置的混合、渲染和回放系統(tǒng)中的對(duì)源音頻信息進(jìn)行處理的音頻或視聽系統(tǒng)中實(shí)現(xiàn)。所描述的實(shí)施例中的任何一個(gè)可以單獨(dú)使用,或者按任何組合相互一起使用。盡管各種實(shí)施例可能已受到在本說明書中的一個(gè)或多個(gè)地方可能討論或暗示的現(xiàn)有技術(shù)的各種缺陷啟發(fā),但是實(shí)施例不一定解決這些缺陷中的任何一個(gè)缺陷。換句話說,不同實(shí)施例可以解決本說明書中可能討論的不同缺陷。一些實(shí)施例可以僅部分解決本說明書中可能討論的一些缺陷或者僅一個(gè)缺陷,一些實(shí)施例可以不解決這些缺陷中的任何一個(gè)缺陷。

為了本描述的目的,以下術(shù)語具有相關(guān)聯(lián)的意義:術(shù)語“聲道”意指音頻信號(hào)加上元數(shù)據(jù),在元數(shù)據(jù)中,位置被編碼為聲道標(biāo)識(shí)符,例如,左前或右上環(huán)繞;“基于聲道的音頻”是為通過具有相關(guān)標(biāo)稱地點(diǎn)(例如,5.1、7.1等)的預(yù)定義的一組揚(yáng)聲器區(qū)域回放而格式化的音頻;術(shù)語“對(duì)象”或“基于對(duì)象的音頻”意指具有諸如視在源位置(例如,3d坐標(biāo))、視在源寬度等之類的參數(shù)化源描述的一個(gè)或多個(gè)音頻聲道;“自適應(yīng)音頻”意指基于聲道的和/或基于對(duì)象的音頻信號(hào)加上元數(shù)據(jù),其基于回放環(huán)境、使用音頻流加上其中位置被編碼為空間中的3d位置的元數(shù)據(jù)來渲染音頻信號(hào);并且“收聽環(huán)境”意指任何開放的、部分封閉的或完全封閉的區(qū)域,諸如可以用于單獨(dú)回放音頻內(nèi)容或者回放音頻內(nèi)容與視頻或其他內(nèi)容的房間,并且可以體現(xiàn)于家里、影院、劇院、禮堂、工作室、游戲機(jī)等中。這樣的區(qū)域可以具有設(shè)置在其中的一個(gè)或多個(gè)表面,諸如可以直接或間接反射聲波的墻壁或擋板。

自適應(yīng)音頻格式和系統(tǒng)

在實(shí)施例中,互連系統(tǒng)被實(shí)現(xiàn)為被配置為與聲音格式和處理系統(tǒng)一起工作的音頻系統(tǒng)的一部分,聲音格式和處理系統(tǒng)可以被稱為“空間音頻系統(tǒng)”或“自適應(yīng)音頻系統(tǒng)”。這樣的系統(tǒng)基于音頻格式和渲染技術(shù),以允許增強(qiáng)的觀眾沉浸感、更好的藝術(shù)控制以及系統(tǒng)靈活性和可擴(kuò)展性。整個(gè)自適應(yīng)音頻系統(tǒng)一般包括音頻編碼、分發(fā)和解碼系統(tǒng),該音頻編碼、分發(fā)和解碼系統(tǒng)被配置為產(chǎn)生包含常規(guī)的基于聲道的音頻元素和音頻對(duì)象編碼元素這兩者的一個(gè)或多個(gè)比特流。與分開采用基于聲道的方法或基于對(duì)象的方法相比,這樣的組合方法提供更好的編碼效率和渲染靈活性。

自適應(yīng)音頻系統(tǒng)和相關(guān)音頻格式的示例性實(shí)現(xiàn)是atmostm平臺(tái)。這種系統(tǒng)包含可被實(shí)現(xiàn)為9.1環(huán)繞系統(tǒng)或類似的環(huán)繞聲配置的高度(上/下)維度。圖1例示了目前的提供用于回放高度聲道的高度揚(yáng)聲器的環(huán)繞系統(tǒng)(例如,9.1環(huán)繞)中的揚(yáng)聲器放置。9.1系統(tǒng)100的揚(yáng)聲器配置由地板平面中的五個(gè)揚(yáng)聲器102和高度平面中的四個(gè)揚(yáng)聲器104組成。一般來說,這些揚(yáng)聲器可以用于生成被設(shè)計(jì)為在房間內(nèi)或多或少準(zhǔn)確地從任何位置發(fā)出的聲音。預(yù)定義的揚(yáng)聲器配置(諸如圖1所示的那些)可以自然地限制準(zhǔn)確地表示給定聲源的位置的能力。例如,聲源不能被平移成比左揚(yáng)聲器本身更左。這適用于每個(gè)揚(yáng)聲器,因此形成其中下混受到約束的一維(例如,左-右)、二維(例如,前-后)或三維(例如,左-右、前-后、上-下)幾何形狀。各種不同的揚(yáng)聲器配置和類型可以用在這樣的揚(yáng)聲器配置中。例如,某些增強(qiáng)音頻系統(tǒng)可以使用具有9.1、11.1、13.1、19.4或其他配置的揚(yáng)聲器。揚(yáng)聲器類型可以包括全范圍直接揚(yáng)聲器、揚(yáng)聲器陣列、環(huán)繞揚(yáng)聲器、重低音揚(yáng)聲器、高音揚(yáng)聲器以及其他類型的揚(yáng)聲器。

音頻對(duì)象可以被認(rèn)為是可以被感知為是從收聽環(huán)境中的特定的一個(gè)物理地點(diǎn)或多個(gè)物理地點(diǎn)發(fā)出的多組聲音元素。這樣的對(duì)象可以是靜態(tài)的(靜止的)或動(dòng)態(tài)的(移動(dòng)的)。音頻對(duì)象由限定聲音在給定時(shí)間點(diǎn)的位置以及其他功能的元數(shù)據(jù)控制。當(dāng)對(duì)象被回放時(shí),它們被使用存在的揚(yáng)聲器、根據(jù)位置元數(shù)據(jù)來渲染,而不一定被輸出到預(yù)定義的物理聲道。會(huì)話中的軌可以是音頻對(duì)象,并且標(biāo)準(zhǔn)平移數(shù)據(jù)類似于位置元數(shù)據(jù)。這樣,放置在屏幕上的內(nèi)容可以以與基于聲道的內(nèi)容相同的方式有效地平移,但是如果需要的話,放置在周圍的內(nèi)容可以被渲染到個(gè)別的揚(yáng)聲器。雖然音頻對(duì)象的使用提供了對(duì)于離散效果的期望控制,但是聲軌的其他方面可以在基于聲道的環(huán)境中有效地工作。例如,許多環(huán)境效果或混響實(shí)際上得益于被饋送到揚(yáng)聲器陣列。盡管這些可以被看作具有足以填充陣列的寬度的對(duì)象,但是保留一些基于聲道的功能是有益的。

自適應(yīng)音頻系統(tǒng)被配置為除了音頻對(duì)象之外還支持音頻床,其中,床是有效地基于聲道的副混合(sub-mix)或支干(stem)。取決于內(nèi)容創(chuàng)建者的意圖,這些可以要么被分別遞送以用于最終回放(渲染),要么被組合到單個(gè)床中地。這些床可以被創(chuàng)建成不同的基于聲道的配置(諸如,5.1、7.1和9.1)和包括頭頂揚(yáng)聲器的陣列(諸如圖1所示)。圖2例示了在一個(gè)實(shí)施例下組合基于聲道的數(shù)據(jù)和基于對(duì)象的數(shù)據(jù)以生成自適應(yīng)音頻混合。如處理200所示,基于聲道的數(shù)據(jù)202(例如,可以是以脈沖編碼調(diào)制(pcm)數(shù)據(jù)的形式提供的5.1或7.1環(huán)繞聲數(shù)據(jù))與音頻對(duì)象數(shù)據(jù)204組合以生成自適應(yīng)音頻混合208。音頻對(duì)象數(shù)據(jù)204是通過將原始的基于聲道的數(shù)據(jù)的元素與相關(guān)聯(lián)的元數(shù)據(jù)組合而生成的,該元數(shù)據(jù)指定了與音頻對(duì)象的地點(diǎn)有關(guān)的某些參數(shù)。如圖2中概念性地示出的,創(chuàng)作工具提供了同時(shí)創(chuàng)建包含揚(yáng)聲器聲道組和對(duì)象聲道的組合的音頻節(jié)目的能力。例如,音頻節(jié)目可以包含可選地組織成組(或軌,例如,立體或5.1軌)的一個(gè)或多個(gè)揚(yáng)聲器聲道、對(duì)于一個(gè)或多個(gè)揚(yáng)聲器聲道的描述性元數(shù)據(jù)、一個(gè)或多個(gè)對(duì)象聲道、以及對(duì)于一個(gè)或多個(gè)對(duì)象聲道的描述性元數(shù)據(jù)。

在實(shí)施例中,圖2的床音頻分量和對(duì)象音頻分量可以包括符合特定格式化標(biāo)準(zhǔn)的內(nèi)容。圖3是例示了在一個(gè)實(shí)施例下在混合型基于優(yōu)先度的渲染系統(tǒng)中處理的音頻內(nèi)容的類型。如圖3的表300所示,存在兩個(gè)主要類型的內(nèi)容,就軌跡來說相對(duì)靜態(tài)的基于聲道的內(nèi)容以及在系統(tǒng)中的揚(yáng)聲器或驅(qū)動(dòng)器之間移動(dòng)的動(dòng)態(tài)內(nèi)容?;诼暤赖膬?nèi)容可以被體現(xiàn)在oamd床中,并且動(dòng)態(tài)內(nèi)容按優(yōu)先度排列為至少兩個(gè)優(yōu)先度級(jí)別(低優(yōu)先度和高優(yōu)先度)的oamd對(duì)象。動(dòng)態(tài)對(duì)象可以根據(jù)某些對(duì)象格式化參數(shù)格式化,并且被分類為某些類型的對(duì)象,諸如isf對(duì)象。稍后在本描述中更詳細(xì)地描述isf格式。

動(dòng)態(tài)對(duì)象的優(yōu)先度反映對(duì)象的某些特性,諸如內(nèi)容類型(例如,對(duì)話vs.效果vs.環(huán)境聲音)、處理要求、存儲(chǔ)器要求(例如,高帶寬vs.低帶寬)以及其他類似的特性。在實(shí)施例中,每個(gè)對(duì)象的優(yōu)先度是沿著標(biāo)度定義的,并且被編碼在優(yōu)先度字段中,優(yōu)先度字段被包括作為封裝音頻對(duì)象的比特流的一部分。優(yōu)先度可以被設(shè)置為標(biāo)量值,諸如1(最低)至10(最高)整數(shù)值,或者被設(shè)置為二進(jìn)制標(biāo)志(0低/1高)或其他類似的可編碼優(yōu)先度設(shè)置機(jī)制。優(yōu)先度級(jí)別一般由內(nèi)容創(chuàng)作者對(duì)每個(gè)對(duì)象設(shè)置一次,內(nèi)容創(chuàng)作者可以基于以上提及的特性中的一個(gè)或多個(gè)來決定每個(gè)對(duì)象的優(yōu)先度。

在替代性實(shí)施例中,至少一些對(duì)象的優(yōu)先度級(jí)別可以由用戶設(shè)置,或者通過可以基于某些運(yùn)行時(shí)標(biāo)準(zhǔn)(諸如動(dòng)態(tài)處理器負(fù)荷、對(duì)象響度、環(huán)境變化、系統(tǒng)故障、用戶偏好、聲學(xué)定制等)來修改對(duì)象的默認(rèn)優(yōu)先度級(jí)別的自動(dòng)化動(dòng)態(tài)處理來設(shè)置。

在實(shí)施例中,動(dòng)態(tài)對(duì)象的優(yōu)先度級(jí)別確定對(duì)象在多處理器渲染系統(tǒng)中的處理。對(duì)每個(gè)對(duì)象的經(jīng)編碼的優(yōu)先度級(jí)別進(jìn)行解碼以確定雙dsp或多dsp系統(tǒng)的哪個(gè)處理器(dsp)將被用于渲染該特定對(duì)象。這使得能夠在渲染自適應(yīng)音頻內(nèi)容時(shí)使用基于優(yōu)先級(jí)的渲染策略。圖4是在一個(gè)實(shí)施例下用于實(shí)現(xiàn)混合型基于優(yōu)先度的渲染策略的多處理器渲染系統(tǒng)的框圖。圖4示出了包括兩個(gè)dsp組件406和410的多處理器渲染系統(tǒng)400。這兩個(gè)dsp被包含在兩個(gè)分開的渲染子系統(tǒng)(解碼/渲染組件404和渲染/后處理組件408)內(nèi)。這些渲染子系統(tǒng)一般包括在音頻被發(fā)送到進(jìn)一步的后處理和/或放大級(jí)和揚(yáng)聲器級(jí)之前執(zhí)行傳統(tǒng)的對(duì)象和聲道音頻解碼、對(duì)象渲染、聲道重新映射和信號(hào)處理的處理塊。

系統(tǒng)400被配置為渲染并回放通過一個(gè)或多個(gè)捕捉組件、預(yù)處理組件、創(chuàng)作組件以及將輸入音頻編碼為數(shù)字比特流402的編碼組件產(chǎn)生的音頻內(nèi)容。自適應(yīng)音頻組件可以用于通過檢查諸如源間隔和內(nèi)容類型之類的因素對(duì)輸入音頻進(jìn)行分析來自動(dòng)地產(chǎn)生適當(dāng)?shù)脑獢?shù)據(jù)。例如,位置元數(shù)據(jù)可以通過對(duì)聲道對(duì)之間的相關(guān)輸入的相對(duì)級(jí)別進(jìn)行分析而從多聲道記錄推導(dǎo)得到。內(nèi)容類型(諸如語音或音樂)的檢測(cè)可以例如通過特征提取和分類來實(shí)現(xiàn)。某些創(chuàng)作工具允許通過優(yōu)化錄音師的創(chuàng)建意圖的輸入和整理來創(chuàng)作音頻節(jié)目,從而使得他可以一次性創(chuàng)建為幾乎任何回放環(huán)境中的回放而優(yōu)化的最終音頻混合。這可以通過使用音頻對(duì)象以及與原始音頻內(nèi)容相關(guān)聯(lián)并且一起編碼的位置元數(shù)據(jù)來實(shí)現(xiàn)。一旦自適應(yīng)音頻內(nèi)容已經(jīng)在適當(dāng)?shù)木幗獯a器裝置中被創(chuàng)作和編碼,它被解碼并且被渲染以便通過揚(yáng)聲器414回放。

如圖4所示,包括對(duì)象元數(shù)據(jù)的對(duì)象音頻和包括聲道元數(shù)據(jù)的聲道音頻作為輸入音頻比特流被輸入到解碼/渲染子系統(tǒng)404內(nèi)的一個(gè)或多個(gè)解碼器電路。輸入音頻比特流402包含與各種音頻分量(諸如圖3所示的那些)相關(guān)的數(shù)據(jù),包括oamd床、低優(yōu)先度動(dòng)態(tài)對(duì)象以及高優(yōu)先度動(dòng)態(tài)對(duì)象。分配給每個(gè)音頻對(duì)象的優(yōu)先度確定兩個(gè)dsp406或410中的哪個(gè)dsp對(duì)該特定對(duì)象執(zhí)行渲染處理。oamd床和低優(yōu)先度對(duì)象在dsp406(dsp1)中渲染,而高優(yōu)先度對(duì)象被傳遞穿過渲染子系統(tǒng)404,以便在dsp410(dsp2)中渲染。經(jīng)渲染的床、低優(yōu)先度對(duì)象和高優(yōu)先度對(duì)象然后被輸入到子系統(tǒng)408中的后處理組件412以產(chǎn)生輸出音頻信號(hào)413,輸出音頻信號(hào)413被傳輸以用于通過揚(yáng)聲器414回放。

在實(shí)施例中,區(qū)分低優(yōu)先度對(duì)象和高優(yōu)先度對(duì)象的優(yōu)先度級(jí)別被設(shè)置在對(duì)每個(gè)相關(guān)聯(lián)的對(duì)象的元數(shù)據(jù)進(jìn)行編碼的比特流的優(yōu)先度內(nèi)。低優(yōu)先度和高優(yōu)先度之間的截止值或閾值可以被設(shè)置為沿著優(yōu)先度范圍的值,諸如沿著優(yōu)先度標(biāo)度1至10的值5或7,或用于二進(jìn)制優(yōu)先度標(biāo)志0或1的簡(jiǎn)單檢測(cè)器。每個(gè)對(duì)象的優(yōu)先度級(jí)別可以在解碼子系統(tǒng)402內(nèi)的優(yōu)先度確定組件中被解碼以將每個(gè)對(duì)象路由到適當(dāng)?shù)膁sp(dps1或dsp2)進(jìn)行渲染。

圖4的多處理架構(gòu)促進(jìn)基于dsp的特定配置和能力以及網(wǎng)絡(luò)和處理器組件的帶寬/處理能力來對(duì)不同類型的自適應(yīng)音頻床和對(duì)象進(jìn)行高效處理。在實(shí)施例中,dsp1被優(yōu)化為渲染oamd床和isf對(duì)象,但是可以不被配置為最佳地渲染oamd動(dòng)態(tài)對(duì)象,而dsp2被優(yōu)化為渲染oamd動(dòng)態(tài)對(duì)象。對(duì)于這個(gè)應(yīng)用,輸入音頻中的oamd動(dòng)態(tài)對(duì)象被分配高優(yōu)先度級(jí)別,使得它們被傳遞到dps2進(jìn)行渲染,而床和isf對(duì)象在dsp1中渲染。這允許適當(dāng)?shù)膁sp對(duì)它能夠渲染得最好的一個(gè)音頻分量或多個(gè)音頻分量進(jìn)行渲染。

除了或代替正被渲染的音頻分量的類型(例如,床/isf對(duì)象vs.oamd動(dòng)態(tài)對(duì)象),音頻分量的路由和分布式渲染可以基于某些性能相關(guān)的度量來執(zhí)行,諸如基于兩個(gè)dsp的相對(duì)處理能力和/或兩個(gè)dsp之間的傳輸網(wǎng)絡(luò)的帶寬。因此,如果一個(gè)dsp明顯比另一個(gè)dsp更強(qiáng)大,并且網(wǎng)絡(luò)帶寬足以傳輸未渲染的音頻數(shù)據(jù),則優(yōu)先度級(jí)別可以被設(shè)置為使得較強(qiáng)大的dsp被要求渲染音頻分量中的更多個(gè)音頻分量。例如,如果dsp2比dps1強(qiáng)大得多,則它可以被配置為渲染所有的oamd動(dòng)態(tài)對(duì)象、或不管格式如何地渲染所有對(duì)象,假定它能夠渲染這些其他類型的對(duì)象。

在實(shí)施例中,某些應(yīng)用特定的參數(shù)(諸如房間配置信息、用戶選擇、處理/網(wǎng)絡(luò)約束等)可以被反饋至對(duì)象渲染系統(tǒng)以允許動(dòng)態(tài)地改變對(duì)象優(yōu)先度級(jí)別。在被輸出以用于通過揚(yáng)聲器414回放之前,按優(yōu)先度排列的音頻數(shù)據(jù)然后通過諸如均衡器和限制器之類的一個(gè)或多個(gè)信號(hào)處理級(jí)處理。

應(yīng)注意,系統(tǒng)400表示用于自適應(yīng)音頻的回放系統(tǒng)的例子,并且其他配置、組件和互聯(lián)也是可能的。例如,在圖3中例示了了兩個(gè)渲染dsp用于處理被分為兩種類型的優(yōu)先度的動(dòng)態(tài)對(duì)象。為使處理能力更大并且優(yōu)先度級(jí)別更多,還可以包括額外數(shù)量的dsp。因此,n個(gè)dsp可以用于n個(gè)不同的優(yōu)先度區(qū)分,諸如三個(gè)dsp用于高、中等、低優(yōu)先度,以此類推。

在實(shí)施例中,圖4中所示的dsp406和410被實(shí)現(xiàn)為通過物理傳輸接口或網(wǎng)絡(luò)耦接在一起的單獨(dú)的裝置。每個(gè)dsp均可以包含在分開的組件或子系統(tǒng)(諸如所示出的子系統(tǒng)404和408)內(nèi),或者它們可以是同一個(gè)子系統(tǒng)(諸如集成解碼器/渲染器組件)中包含的分開的組件??商娲兀琩sp406和410可以是單片集成電路裝置內(nèi)的分開的處理組件。

示例性實(shí)現(xiàn)

如上所述,自適應(yīng)音頻格式的初始實(shí)現(xiàn)是在包括內(nèi)容捕捉(對(duì)象和聲道)的數(shù)字影院的背景下,該內(nèi)容捕捉是使用新穎的創(chuàng)作工具創(chuàng)作的、使用自適應(yīng)音頻影院編碼器封裝的、并且使用pcm或使用現(xiàn)有的數(shù)字影院倡導(dǎo)聯(lián)盟(digitalcinemainitiative,dci)分發(fā)機(jī)制的專有無損編解碼器分發(fā)的。在這種情況下,音頻內(nèi)容意圖在數(shù)字影院中被解碼并且被渲染以創(chuàng)建沉浸式空間音頻影院體驗(yàn)。然而,現(xiàn)在勢(shì)在必行的是直接向在家里的消費(fèi)者遞送通過自適應(yīng)音頻格式提供的增強(qiáng)用戶體驗(yàn)。這要求格式和系統(tǒng)的某些特性適于用在更受限的收聽環(huán)境中。為了描述的目的,術(shù)語“基于消費(fèi)者的環(huán)境”意圖包括任何非影院環(huán)境,包括供普通消費(fèi)者或?qū)I(yè)人員使用的收聽環(huán)境,諸如房子、工作室、房間、控制臺(tái)區(qū)域、禮堂等。

目前的用于消費(fèi)者音頻的創(chuàng)作和分發(fā)系統(tǒng)創(chuàng)建并遞送意圖用于再現(xiàn)到預(yù)定義的且固定的揚(yáng)聲器地點(diǎn)的音頻,而對(duì)音頻本質(zhì)(即,被消費(fèi)者再現(xiàn)系統(tǒng)回放的實(shí)際音頻)中傳達(dá)的內(nèi)容的類型的了解有限。然而,自適應(yīng)音頻系統(tǒng)為音頻創(chuàng)建提供新的混合型方法,其包括對(duì)于固定揚(yáng)聲器地點(diǎn)特定的音頻(左聲道、右聲道等)和具有包括位置、大小和速度的廣義3d空間信息的基于對(duì)象的音頻元素這兩者的選項(xiàng)。該混合型方法提供渲染(廣義音頻對(duì)象)的保真度(由固定揚(yáng)聲器地點(diǎn)提供)和靈活性兼顧的方法。該系統(tǒng)還經(jīng)由新的元數(shù)據(jù)提供關(guān)于音頻內(nèi)容的附加有用信息,該新的元數(shù)據(jù)與由內(nèi)容創(chuàng)建者在內(nèi)容創(chuàng)建/創(chuàng)作時(shí)將其與音頻本質(zhì)配對(duì)。這種信息提供關(guān)于在渲染期間可以使用的音頻的屬性的詳細(xì)信息。這樣的屬性可以包括內(nèi)容類型(例如,對(duì)話、音樂、效果、配音、背景/環(huán)境等)以及諸如空間屬性(例如,3d位置、對(duì)象大小、速度等)之類的音頻對(duì)象信息和有用的渲染信息(例如,對(duì)齊到揚(yáng)聲器地點(diǎn)、聲道權(quán)重、增益、低音管理信息等)。音頻內(nèi)容和再現(xiàn)意圖元數(shù)據(jù)可以要么由內(nèi)容創(chuàng)建者手動(dòng)創(chuàng)建,要么通過使用自動(dòng)的媒體智能算法來創(chuàng)建,這些算法可以在創(chuàng)作過程期間在后臺(tái)運(yùn)行,并且可以在最后的質(zhì)量控制階段期間被內(nèi)容創(chuàng)建者審閱,如果需要的話。

圖5是用于渲染不同類型的基于聲道的分量和基于對(duì)象的分量的基于優(yōu)先度的渲染系統(tǒng)的框圖,并且是根據(jù)實(shí)施例的圖4所示的系統(tǒng)的更詳細(xì)的例示。如圖5所示,系統(tǒng)500對(duì)承載有混合對(duì)象流(一個(gè)或多個(gè))和基于聲道的音頻流(一個(gè)或多個(gè))這兩者的編碼比特流506進(jìn)行處理。該比特流被渲染塊502/信號(hào)處理塊504處理,渲染塊502和信號(hào)處理塊504均表示或被實(shí)現(xiàn)為單獨(dú)的dsp裝置。在這些處理塊中執(zhí)行的渲染功能實(shí)現(xiàn)自適應(yīng)音頻的各種渲染算法以及某些后處理算法(諸如上混)等。

基于優(yōu)先度的渲染系統(tǒng)500包括解碼/渲染級(jí)502和渲染/后處理級(jí)504兩個(gè)主要組件。輸入音頻506通過hdmi(高清多媒體接口)被提供給解碼/渲染級(jí),但是其他接口也是可能的。比特流檢測(cè)組件508對(duì)比特流進(jìn)行解析,并且將不同的音頻分量引導(dǎo)到適當(dāng)?shù)慕獯a器,諸如dolby數(shù)字+(dolbydigitalplus)解碼器、mat2.0解碼器、truehd解碼器等。解碼器產(chǎn)生各種格式化的音頻信號(hào),諸如oamd床信號(hào)和isf或oamd動(dòng)態(tài)對(duì)象。

解碼/渲染級(jí)502包括oar(對(duì)象音頻渲染器)接口510,oar接口510包括oamd處理組件512、oar組件514和動(dòng)態(tài)對(duì)象提取組件516。動(dòng)態(tài)提取單元516從所有解碼器獲取輸出,并且分離出床、isf對(duì)象與任何低優(yōu)先度動(dòng)態(tài)對(duì)象以及高優(yōu)先度動(dòng)態(tài)對(duì)象。床、isf對(duì)象和低優(yōu)先度動(dòng)態(tài)對(duì)象被發(fā)送到oar組件514。對(duì)于所示出的示例實(shí)施例,oar組件514表示處理器(例如,dsp)電路502的核心,并且渲染到固定的5.1.2聲道輸出格式(例如,標(biāo)準(zhǔn)的5.1+2高度聲道),但是其他環(huán)繞聲加上高度配置也是可能的,諸如7.1.4等。oar組件514的渲染輸出513然后被傳輸?shù)戒秩?后處理級(jí)504的數(shù)字音頻處理器(dap)組件。該級(jí)執(zhí)行諸如以下的功能:上混、渲染/虛擬化、音量控制、均衡化、低音管理以及其他可能功能。在示例實(shí)施例中,級(jí)504的輸出522包括5.1.2揚(yáng)聲器饋送。級(jí)504可以被實(shí)現(xiàn)為任何適當(dāng)?shù)奶幚黼娐罚T如處理器、dsp或類似裝置。

在實(shí)施例中,輸出信號(hào)522被傳輸?shù)綏l形音箱或條形音箱陣列。對(duì)于諸如圖5中所示的特定用例例子,條形音箱還利用基于優(yōu)先度的渲染策略來支持具有31.1對(duì)象的mat2.0輸入的用例,而不使兩個(gè)級(jí)502和504之間的存儲(chǔ)器帶寬重疊。在示例性實(shí)現(xiàn)中,存儲(chǔ)器帶寬允許最多32個(gè)的音頻聲道以48khz從外部存儲(chǔ)器讀寫。因?yàn)?個(gè)聲道是oar組件514的5.1.2-聲道渲染輸出513所需的,所以最多24個(gè)oamd動(dòng)態(tài)對(duì)象可以被后處理鏈504中的虛擬渲染器渲染。如果輸入流506中存在多于24個(gè)的oamd動(dòng)態(tài)對(duì)象,則額外的最低優(yōu)先度對(duì)象必須被第一級(jí)502上的oar組件514渲染。動(dòng)態(tài)對(duì)象的優(yōu)先度是基于它們?cè)趏amd流中的位置確定的(例如,最高優(yōu)先度對(duì)象最先,最低優(yōu)先度對(duì)象最后)。

盡管圖4和圖5的實(shí)施例是關(guān)于符合oamd和isf格式的床和對(duì)象描述的,但是應(yīng)理解,使用多處理器渲染系統(tǒng)的基于優(yōu)先度的渲染方案可以與包括基于聲道的音頻和兩種或更多種類型的音頻對(duì)象的任何類型的自適應(yīng)音頻內(nèi)容一起使用,其中,對(duì)象類型可以基于相對(duì)優(yōu)先度級(jí)別區(qū)分。適當(dāng)?shù)匿秩咎幚砥?例如,dsp)可以被配置為最佳地渲染所有類型或僅一種類型的音頻對(duì)象類型和/或基于聲道的音頻分量。

圖5的系統(tǒng)500例示了使oamd音頻格式適于與特定的渲染應(yīng)用一起工作的渲染系統(tǒng),所述特定的渲染應(yīng)用涉及基于聲道的床、isf對(duì)象和oamd動(dòng)態(tài)對(duì)象并且針對(duì)條形音箱的回放進(jìn)行渲染。該系統(tǒng)實(shí)現(xiàn)基于優(yōu)先度的渲染策略,該基于優(yōu)先度的渲染策略解決了通過條形音箱或類似的并置揚(yáng)聲器系統(tǒng)重建自適應(yīng)音頻內(nèi)容的某些實(shí)現(xiàn)復(fù)雜度問題。圖6是例示了在一個(gè)實(shí)施例下實(shí)現(xiàn)基于優(yōu)先度的渲染以便通過條形音箱回放自適應(yīng)音頻內(nèi)容的方法的流程圖。圖6的處理600一般表示在圖5的基于優(yōu)先度的渲染系統(tǒng)500中執(zhí)行的方法步驟。在接收到輸入音頻比特流之后,包括基于聲道的床和不同格式的音頻對(duì)象的音頻分量被輸入到適當(dāng)?shù)慕獯a器電路進(jìn)行解碼,602。音頻對(duì)象包括可以使用不同格式方案格式化的動(dòng)態(tài)對(duì)象,并且可以基于與每個(gè)對(duì)象一起編碼的相對(duì)優(yōu)先度來區(qū)分,604。所述處理通過針對(duì)每個(gè)動(dòng)態(tài)音頻對(duì)象讀取比特流內(nèi)的適當(dāng)元數(shù)據(jù)字段來確定該對(duì)象與所定義的優(yōu)先度閾值相比的優(yōu)先度級(jí)別。區(qū)分低優(yōu)先度對(duì)象和高優(yōu)先度對(duì)象的優(yōu)先度閾值可以作為內(nèi)容創(chuàng)建者設(shè)置的硬連線值而被編程到系統(tǒng)中,或者它可以通過用戶輸入、自動(dòng)化手段或其他自適應(yīng)機(jī)制來動(dòng)態(tài)地設(shè)置。然后基于聲道的床和低優(yōu)先度動(dòng)態(tài)對(duì)象連同被優(yōu)化為在系統(tǒng)的第一dsp中渲染的任何對(duì)象一起在該第一dsp中被渲染,606。高優(yōu)先度動(dòng)態(tài)對(duì)象被沿著傳遞到第二dsp,在第二dsp中然后它們被渲染,608。被渲染的音頻分量然后被傳輸通過某些可選的后處理步驟以便通過條形音箱或條形音箱陣列回放,610。

條形音箱實(shí)現(xiàn)

如圖4中所示,由兩個(gè)dsp生成的按優(yōu)先度排列的經(jīng)渲染的音頻輸出被傳輸?shù)綏l形音箱以便向用戶回放。考慮到平面屏幕電視機(jī)的流行,條形音箱揚(yáng)聲器已經(jīng)變得越來越受歡迎。這樣的電視機(jī)變得非常薄并且相對(duì)較輕以優(yōu)化便攜性和安裝選項(xiàng),盡管以可承受的價(jià)格提供不斷增大的屏幕大小。然而,考慮到空間、功率和成本約束,這些電視機(jī)的聲音質(zhì)量通常非常差。條形音箱通常是時(shí)髦的上電揚(yáng)聲器,這些揚(yáng)聲器被放置在平面電視機(jī)的下面以改善電視機(jī)音頻的質(zhì)量,并且可以獨(dú)自地或作為環(huán)繞聲揚(yáng)聲器設(shè)置的一部分使用。圖7例示了可以與混合型基于優(yōu)先度的渲染系統(tǒng)的實(shí)施例一起使用的條形音箱揚(yáng)聲器。如系統(tǒng)700所示,條形音箱揚(yáng)聲器包括容納若干個(gè)驅(qū)動(dòng)器703的柜體701,驅(qū)動(dòng)器703沿著水平(或垂直)軸排列以將聲音直接驅(qū)動(dòng)出柜體的前面??梢愿鶕?jù)大小和系統(tǒng)約束來使用任何實(shí)際數(shù)量的驅(qū)動(dòng)器701,典型的數(shù)量在2-6個(gè)驅(qū)動(dòng)器的范圍內(nèi)。驅(qū)動(dòng)器可以是相同大小和形狀的,或者它們可以是不同驅(qū)動(dòng)器的陣列,諸如較大的中央驅(qū)動(dòng)器用于較低頻率的聲音。hdmi輸入接口702可以被提供用來允許與高清音頻系統(tǒng)的直接接口。

條形音箱系統(tǒng)700可以是沒有板載功率和放大并且具有最少的無源電路的無源揚(yáng)聲器系統(tǒng)。它也可以是上電系統(tǒng),其中一個(gè)或多個(gè)組件被安裝在柜體內(nèi)或者通過外部組件緊密地耦接。這樣的功能和組件包括電源和放大704、音頻處理(例如,eq、低音控制等)706、a/v環(huán)繞聲處理器708以及自適應(yīng)音頻虛擬化710。為了描述的目的,術(shù)語“驅(qū)動(dòng)器”意指響應(yīng)于電音頻輸入信號(hào)來生成聲音的單個(gè)電聲換能器。驅(qū)動(dòng)器可以被實(shí)現(xiàn)為任何適當(dāng)?shù)念愋?、幾何形狀和大小,并且可以包括喇叭、紙盆、帶式換能器等。術(shù)語“揚(yáng)聲器”意指在整體外殼內(nèi)的一個(gè)或多個(gè)驅(qū)動(dòng)器。

用于條形音箱710的組件710中提供的或作為渲染處理器504的組件的虛擬化功能允許在局部應(yīng)用(諸如電視機(jī)、計(jì)算機(jī)、游戲機(jī)或類似裝置)中實(shí)現(xiàn)自適應(yīng)音頻系統(tǒng),并且允許通過在與觀看屏幕或監(jiān)視器表面相對(duì)應(yīng)的平面中排列的揚(yáng)聲器來對(duì)該音頻進(jìn)行空間回放。圖8例示了基于優(yōu)先度的自適應(yīng)渲染系統(tǒng)在示例性的電視機(jī)和條形音箱消費(fèi)者用例中的使用。一般來說,基于就空間分辨率而言可能有限的揚(yáng)聲器地點(diǎn)/配置(即,沒有環(huán)繞或后置揚(yáng)聲器)和設(shè)備(tv揚(yáng)聲器、條形音箱揚(yáng)聲器等)的通常降低的質(zhì)量,電視機(jī)用例提供了創(chuàng)建沉浸式消費(fèi)者體驗(yàn)的挑戰(zhàn)。圖8的系統(tǒng)800包括在標(biāo)準(zhǔn)電視機(jī)左邊地點(diǎn)和右邊地點(diǎn)的揚(yáng)聲器(tv-l和tv-r)以及可能可選的左邊的向上激發(fā)驅(qū)動(dòng)器和右邊的向上激發(fā)驅(qū)動(dòng)器(tv-lh和tv-rh)。該系統(tǒng)還包括如圖7所示的條形音箱700。如前所述,與獨(dú)立或家庭劇場(chǎng)揚(yáng)聲器相比,電視機(jī)揚(yáng)聲器的大小和質(zhì)量由于成本約束和設(shè)計(jì)選擇而降低。然而,動(dòng)態(tài)虛擬化與條形音箱700的結(jié)合使用可以幫助克服這些缺陷。圖8的條形音箱700被示為具有向前激發(fā)驅(qū)動(dòng)器以及可能的側(cè)面激發(fā)驅(qū)動(dòng)器,所有這些驅(qū)動(dòng)器都沿著條形音箱柜體的水平軸排列。在圖8中,動(dòng)態(tài)虛擬化效果是針對(duì)條形音箱揚(yáng)聲器例示的,使得特定收聽位置804的人將聽到與在水平面中單個(gè)地渲染的適當(dāng)音頻對(duì)象相關(guān)聯(lián)的水平元素。與適當(dāng)音頻對(duì)象相關(guān)聯(lián)的高度元素可以通過基于由自適應(yīng)音頻內(nèi)容提供的對(duì)象空間信息對(duì)揚(yáng)聲器虛擬化算法參數(shù)的動(dòng)態(tài)控制來進(jìn)行渲染,以便提供至少部分的沉浸式用戶體驗(yàn)。對(duì)于條形音箱的并置揚(yáng)聲器,該動(dòng)態(tài)虛擬化可以用于創(chuàng)建沿著房間的側(cè)面移動(dòng)的對(duì)象的感知或其他水平平面聲音軌跡效果。這允許條形音箱提供空間提示,這些空間提示否則會(huì)由于沒有環(huán)繞或后置揚(yáng)聲器而不存在。

在實(shí)施例中,條形音箱700可以包括非并置驅(qū)動(dòng)器,諸如利用聲音反射來允許提供高度提示的虛擬化算法的向上激發(fā)驅(qū)動(dòng)器。某些驅(qū)動(dòng)器可以被配置為在不同方向上將聲音輻射到其他驅(qū)動(dòng)器,例如,一個(gè)或多個(gè)驅(qū)動(dòng)器可以實(shí)現(xiàn)具有單獨(dú)控制的聲音區(qū)域的可轉(zhuǎn)向聲束。

在實(shí)施例中,條形音箱700可以用作具有高度揚(yáng)聲器或啟用高度的落地式安裝的揚(yáng)聲器的全環(huán)繞聲系統(tǒng)的一部分。這樣的實(shí)現(xiàn)將允許條形音箱虛擬化擴(kuò)大由環(huán)繞揚(yáng)聲器陣列提供的沉浸式聲音。圖9例示了基于優(yōu)先度的自適應(yīng)音頻渲染系統(tǒng)在示例性全環(huán)繞聲家庭環(huán)境中的使用。如系統(tǒng)900中所示,與電視機(jī)或監(jiān)視器802相關(guān)聯(lián)的條形音箱700與揚(yáng)聲器904的環(huán)繞聲陣列結(jié)合使用,諸如按所示的5.1.2配置。對(duì)于這種情況,條形音箱700可以包括a/v環(huán)繞聲處理器708以驅(qū)動(dòng)環(huán)繞揚(yáng)聲器并且提供渲染和虛擬化處理的至少一部分。圖9的系統(tǒng)僅例示了可以由自適應(yīng)音頻系統(tǒng)提供的可能的一組組件和功能,并且某些方面可以基于用戶的需要來減少或移除,同時(shí)仍提供增強(qiáng)的體驗(yàn)。

圖9例示了動(dòng)態(tài)揚(yáng)聲器虛擬化的使用以在收聽環(huán)境中提供除了條形音箱所提供的沉浸式用戶體驗(yàn)之外的沉浸式用戶體驗(yàn)。單獨(dú)的虛擬器可以用于每個(gè)相關(guān)的對(duì)象,并且組合信號(hào)可以被發(fā)送到l揚(yáng)聲器和r揚(yáng)聲器以創(chuàng)建多對(duì)象虛擬化效果。作為例子,動(dòng)態(tài)虛擬化效果被示為用于l揚(yáng)聲器和r揚(yáng)聲器。這些揚(yáng)聲器可以連同音頻對(duì)象大小和位置信息一起被用于創(chuàng)建擴(kuò)散的或點(diǎn)源近場(chǎng)的音頻體驗(yàn)。類似的虛擬化效果也可以適用于系統(tǒng)中的其他揚(yáng)聲器中的任何一個(gè)或全部。

在實(shí)施例中,自適應(yīng)音頻系統(tǒng)包括從原始空間音頻格式產(chǎn)生元數(shù)據(jù)的組件。系統(tǒng)500的方法和組件包括音頻渲染系統(tǒng),該音頻渲染系統(tǒng)被配置為對(duì)包含常規(guī)的基于聲道的音頻元素和音頻對(duì)象編碼元素這兩者的一個(gè)或多個(gè)比特流進(jìn)行處理。包含音頻對(duì)象編碼元素的新擴(kuò)展層被定義并且被添加到基于聲道的音頻編解碼比特流或音頻對(duì)象比特流中的任何一個(gè)。該方法能夠?qū)崿F(xiàn)包括擴(kuò)展層的比特流,該擴(kuò)展層將被渲染器處理以用于現(xiàn)有的揚(yáng)聲器和驅(qū)動(dòng)器設(shè)計(jì)或利用可單個(gè)地尋址的驅(qū)動(dòng)器和驅(qū)動(dòng)器定義的下一代揚(yáng)聲器。來自空間音頻處理器的空間音頻內(nèi)容包括音頻對(duì)象、聲道和位置元數(shù)據(jù)。當(dāng)對(duì)象被渲染時(shí),它根據(jù)位置元數(shù)據(jù)以及回放揚(yáng)聲器的地點(diǎn)而被分配給條形音箱或條形音箱陣列的一個(gè)或多個(gè)驅(qū)動(dòng)器。元數(shù)據(jù)在音頻工作站中響應(yīng)于工程師的混合輸入而產(chǎn)生以提供渲染隊(duì)列,這些渲染隊(duì)列控制空間參數(shù)(例如,位置、速度、強(qiáng)度、音色等)并且指定收聽環(huán)境中的哪個(gè)(哪些)驅(qū)動(dòng)器或揚(yáng)聲器在展示期間播放各自的聲音。元數(shù)據(jù)與工作站中的供空間音頻處理器包裝和運(yùn)輸?shù)母髯缘囊纛l數(shù)據(jù)相關(guān)聯(lián)。圖10是例示了在一個(gè)實(shí)施例下在針對(duì)條形音箱利用基于優(yōu)先度的渲染的自適應(yīng)音頻系統(tǒng)中使用的一些示例性元數(shù)據(jù)定義的表格。如圖10的表1000中所示,一些元數(shù)據(jù)可以包括定義音頻內(nèi)容類型(例如,對(duì)話、音樂等)和某些音頻特性(例如,直接、擴(kuò)散等)的元素。對(duì)于通過條形音箱播放的基于優(yōu)先度的渲染系統(tǒng),元數(shù)據(jù)中所包括的驅(qū)動(dòng)器定義可以包括回放條形音箱和可以與條形音箱一起使用的其他揚(yáng)聲器(例如,其他環(huán)繞揚(yáng)聲器或啟用虛擬化的揚(yáng)聲器)的配置信息(例如,驅(qū)動(dòng)器類型、大小、功率、內(nèi)置a/v、虛擬化等)。參照?qǐng)D5,元數(shù)據(jù)還可以包括定義解碼器類型(例如,數(shù)字+、truehd等)的字段和數(shù)據(jù),從這些字段和數(shù)據(jù)可以導(dǎo)出基于聲道的音頻和動(dòng)態(tài)對(duì)象(例如,oamd床、isf對(duì)象、動(dòng)態(tài)oamd對(duì)象等)的特定格式??商娲?,每個(gè)對(duì)象的格式可以通過具體的相關(guān)聯(lián)的元數(shù)據(jù)元素來明確地定義。元數(shù)據(jù)還包括用于動(dòng)態(tài)對(duì)象的優(yōu)先度字段,并且相關(guān)聯(lián)的元數(shù)據(jù)可以被表達(dá)為標(biāo)量值(例如,1至10)或二進(jìn)制優(yōu)先度標(biāo)志(高/低)。圖10所示的元數(shù)據(jù)元素意在于僅僅例示被編碼在傳輸自適應(yīng)音頻信號(hào)的比特流中的一些可能的元數(shù)據(jù)元素,并且許多其他的元數(shù)據(jù)元素和格式也是可能的。

中間空間格式

如以上對(duì)于一個(gè)或多個(gè)實(shí)施例所描述的,由所述系統(tǒng)處理的某些對(duì)象是isf對(duì)象。isf是通過將平移操作劃分為以下兩個(gè)部分來對(duì)音頻對(duì)象平移器的操作進(jìn)行優(yōu)化的格式:時(shí)變部分和靜態(tài)部分。一般來說,音頻對(duì)象平移器通過將單音對(duì)象(例如,objecti)平移到n個(gè)揚(yáng)聲器來進(jìn)行操作,由此,平移增益按照揚(yáng)聲器地點(diǎn)(x1,y1,z1),…,(xn,yn,zn)和對(duì)象地點(diǎn)xyzi(t)的函數(shù)確定。這些增益值將隨時(shí)間推移連續(xù)地變化,因?yàn)閷?duì)象地點(diǎn)將是時(shí)變的。中間空間格式的目標(biāo)僅僅是將該平移操作劃分為兩個(gè)部分。第一部分(其將是時(shí)變的)使用對(duì)象地點(diǎn)。第二部分(其使用固定矩陣)將僅基于揚(yáng)聲器地點(diǎn)進(jìn)行配置。圖11例示了在一些實(shí)施例下用于與渲染系統(tǒng)一起使用的中間空間格式。如圖1100所示,空間平移器1102接收對(duì)象和揚(yáng)聲器地點(diǎn)信息以供揚(yáng)聲器解碼器1106解碼。在這兩個(gè)處理塊1102和1106之間,音頻對(duì)象場(chǎng)景用k聲道中間空間格式(isf)1104表示。多個(gè)音頻對(duì)象(1<=i<=ni)可以被單獨(dú)的空間平移器處理,空間平移器的輸出被加到一起以形成isf信號(hào)1104,以使得一個(gè)k聲道isf信號(hào)集可以包含ni個(gè)對(duì)象的疊加。在某些實(shí)施例中,編碼器也可以通過高度限制(elevationrestriction)數(shù)據(jù)被給予關(guān)于揚(yáng)聲器高度的信息,以使得對(duì)于回放揚(yáng)聲器的海拔的詳細(xì)了解可以被空間平移器1102使用。

在實(shí)施例中,空間平移器1102不被給予關(guān)于回放揚(yáng)聲器的地點(diǎn)的詳細(xì)信息。然而,假設(shè)一系列“虛擬揚(yáng)聲器”的地點(diǎn)限于若干個(gè)水平或?qū)硬⑶颐總€(gè)水平或?qū)觾?nèi)的分布是近似的。因此,雖然空間平移器沒有被給予關(guān)于回放揚(yáng)聲器的地點(diǎn)的詳細(xì)信息,但是關(guān)于揚(yáng)聲器的大致數(shù)量以及這些揚(yáng)聲器的大致分布通??梢宰龀鲆恍┖侠淼募僭O(shè)。

所得的回放體驗(yàn)的質(zhì)量(即,它與圖11的音頻對(duì)象平移器的匹配接近程度)可以要么通過增加聲道的數(shù)量k、要么通過收集關(guān)于最可能的回放揚(yáng)聲器放置的更多了解來改善。具體地說,在實(shí)施例中,如圖12所示,揚(yáng)聲器高度被分割為若干個(gè)平面。期望的組成聲場(chǎng)可以被認(rèn)為是從收聽者周圍的任意方向發(fā)出的一系列發(fā)聲事件。發(fā)聲事件的地點(diǎn)可以被認(rèn)為被限定在以收聽者為中心的球體1202的表面上。聲場(chǎng)格式(諸如高階高保真立體聲(highorderambisonics))是以允許聲場(chǎng)被進(jìn)一步渲染在(相當(dāng))任意的揚(yáng)聲器陣列的方式定義的。然而,從揚(yáng)聲器的高度固定在3個(gè)平面(耳朵高度平面、天花板平面和地面)中的意義上來說,所設(shè)想的典型回放系統(tǒng)有可能是受到約束的。因此,理想的球形聲場(chǎng)的概念是可以修改的,其中聲場(chǎng)由位于收聽者周圍的球體的表面上的各高度處的環(huán)中的發(fā)聲對(duì)象組成。例如,圖12中例示了一個(gè)這樣的布置1200,其具有頂點(diǎn)環(huán)、上層環(huán)、中間層環(huán)和下層環(huán)。如果必要,為了完整性的目的,還可以包括在球體底部的附加環(huán)(最底點(diǎn),嚴(yán)格來說,它也是點(diǎn)而不是環(huán))。另外,在其他實(shí)施例中可以存在更多或更少的環(huán)。

在實(shí)施例中,疊環(huán)格式被命名為bh9.5.0.1,其中,四個(gè)數(shù)字分別指示中間環(huán)、上層環(huán)、下層環(huán)和頂點(diǎn)環(huán)中的聲道數(shù)量。多聲道束中的聲道的總數(shù)將等于這四個(gè)數(shù)字的和(所以,bh9.5.0.1格式包含15個(gè)聲道)。使用所有四個(gè)環(huán)的另一示例格式是bh15.9.5.1。對(duì)于該格式,聲道命名和排序?qū)⑷缦拢篬m1,m2,…m15,u1,u2…u9,l1,l2,…l5,z1],其中,聲道布置在環(huán)中(按m、u、l、z次序),并且在每個(gè)環(huán)內(nèi),它們簡(jiǎn)單地按上升的基數(shù)次序編號(hào)。每個(gè)環(huán)可以被認(rèn)為是被圍繞該環(huán)均勻地鋪展的一組標(biāo)稱揚(yáng)聲器填充。因此,每個(gè)環(huán)中的聲道將對(duì)應(yīng)于具體的解碼角度,從聲道1(其將對(duì)應(yīng)于0°方位角(正前面))開始,并且按逆時(shí)針的次序枚舉(所以從收聽者的角度來看,聲道2將在中心的左邊)。因此,聲道n的方位角將為(其中,n為該環(huán)中的聲道的數(shù)量,并且n在從1至n的范圍內(nèi))。

關(guān)于與isf相關(guān)的object_priority的某些用例,oamd一般允許isf中的每個(gè)環(huán)分別具有object_priority值。在實(shí)施例中,這些優(yōu)先度值以多種方式用于執(zhí)行附加處理。首先,高度環(huán)和較低平面環(huán)由最小/次優(yōu)渲染器渲染,而重要的收聽者平面環(huán)可以由更復(fù)雜的/精度更高的高質(zhì)量渲染器渲染。類似地,在編碼格式中,更多的比特(即,更高質(zhì)量的編碼)可以用于收聽者平面環(huán),更少的比特可以用于高度環(huán)和地面環(huán)。這在isf中是可能的,因?yàn)樗褂铆h(huán),而這在傳統(tǒng)的高階高保真立體聲格式中一般是不可能的,因?yàn)槊總€(gè)不同的聲道是以有損總體音頻質(zhì)量的方式相互作用的極模式(polar-pattern)。一般來說,高度環(huán)或地面環(huán)的渲染質(zhì)量略微下降不是過度有害的,因?yàn)檫@些環(huán)中的內(nèi)容通常僅包含氣氛含量。

在實(shí)施例中,渲染和聲音處理系統(tǒng)使用兩個(gè)或更多個(gè)環(huán)來對(duì)空間音頻場(chǎng)景進(jìn)行編碼,其中,不同的環(huán)表示聲場(chǎng)的不同的在空間上分開的分量。音頻對(duì)象在環(huán)內(nèi)根據(jù)可轉(zhuǎn)變用途的平移曲線平移,并且音頻對(duì)象使用不可轉(zhuǎn)變用途的平移曲線在環(huán)之間平移。不同的在空間上分開的分量是基于它們的垂直軸而分開的(即,作為垂直堆疊環(huán))。聲場(chǎng)元素在每個(gè)環(huán)內(nèi)以“標(biāo)稱揚(yáng)聲器”的形式傳輸;并且每個(gè)環(huán)內(nèi)的聲場(chǎng)元素被以空間頻率分量的形式傳輸。對(duì)于每個(gè)環(huán),通過將預(yù)先計(jì)算的表示該環(huán)的分段的子矩陣聯(lián)結(jié)在一起來產(chǎn)生解碼矩陣。如果在第一個(gè)環(huán)中不存在揚(yáng)聲器,則從一個(gè)環(huán)到另一個(gè)環(huán)的聲音可以被重定向。

在isf處理系統(tǒng)中,回放陣列中的每個(gè)揚(yáng)聲器的地點(diǎn)可以用坐標(biāo)(x,y,z)坐標(biāo)(這是每個(gè)揚(yáng)聲器相對(duì)于靠近陣列中心的候選收聽位置的地點(diǎn))來表達(dá)。此外,(x,y,z)矢量可以被轉(zhuǎn)換為單位矢量,以有效地將每個(gè)揚(yáng)聲器地點(diǎn)投影到單位球體的表面上:

揚(yáng)聲器地點(diǎn):

揚(yáng)聲器單位矢量:

圖13例示了在一個(gè)實(shí)施例下音頻對(duì)象被平移到在isf處理系統(tǒng)中使用的角度的揚(yáng)聲器弧。圖1300例示了如下場(chǎng)景,即,音頻對(duì)象(o)被順序地平移通過若干個(gè)揚(yáng)聲器1302,以使得收聽者1304體驗(yàn)到音頻對(duì)象正在移動(dòng)通過順序地經(jīng)過每個(gè)揚(yáng)聲器的軌跡的錯(cuò)覺。不失一般性地,假設(shè)這些揚(yáng)聲器1302的單位矢量沿著水平面中的環(huán)布置,以使得音頻對(duì)象的地點(diǎn)可以被定義為其方位角φ的函數(shù)。在圖13中,音頻對(duì)象以角度φ通過揚(yáng)聲器a、b和c(其中,這些揚(yáng)聲器分別被安置成方位角φa、φb和φc)。音頻對(duì)象平移器(例如,圖11中的平移器1102)將典型地使用揚(yáng)聲器增益將音頻對(duì)象平移到每個(gè)揚(yáng)聲器,其中揚(yáng)聲器增益是角度φ的函數(shù)。音頻對(duì)象平移器可以使用具有以下性質(zhì)的平移曲線:(1)當(dāng)音頻對(duì)象被平移到與物理揚(yáng)聲器地點(diǎn)重合的位置時(shí),重合的揚(yáng)聲器被用于排除所有其他的揚(yáng)聲器;(2)當(dāng)音頻對(duì)象被平移到位于兩個(gè)揚(yáng)聲器地點(diǎn)之間的角度φ時(shí),只有這兩個(gè)揚(yáng)聲器是工作的,因此提供音頻信號(hào)在揚(yáng)聲器陣列上的最少量的“鋪展”;(3)平移曲線可以表現(xiàn)出高級(jí)別的“離散性”,“離散性”是指平移曲線能量在一個(gè)揚(yáng)聲器及其最近鄰域之間的區(qū)域中受到約束的部分。因此,參照?qǐng)D13,對(duì)于揚(yáng)聲器b:

離散性:

因此,db≤1,并且當(dāng)db=1時(shí),這暗示著,用于揚(yáng)聲器b的平移曲線僅在φa和φc(分別為揚(yáng)聲器a和c的角度位置)之間的區(qū)域中(在空間上)完全被約束為非零。相反,沒有表現(xiàn)出上述“離散性”性質(zhì)(即,db<1)的平移曲線可以表現(xiàn)出一個(gè)其他的重要性質(zhì):平移曲線在空間上被平滑處理,以使得它們被約束在空間頻率中,以便滿足奈奎斯特采樣定理。

在空間上帶受限的任何平移曲線在其空間支集中不能是緊湊的。換句話說,這些平移曲線將在較寬的角度范圍上鋪展。術(shù)語“阻帶波動(dòng)”是指在平移曲線中出現(xiàn)的(不合需要的)非零增益。通過滿足奈奎斯特采樣定理,這些平移曲線有不太“離散”的問題。通過被適當(dāng)?shù)亍澳慰固夭蓸印保@些平移曲線可以移到替代的揚(yáng)聲器地點(diǎn)。這意味著,已經(jīng)針對(duì)n個(gè)揚(yáng)聲器的特定布置(這些揚(yáng)聲器在圓中均勻隔開)創(chuàng)建的一組揚(yáng)聲器信號(hào)可以被重新混合到不同角度地點(diǎn)處的替代的一組n個(gè)揚(yáng)聲器(用n×n矩陣重新混合);也就是說,揚(yáng)聲器陣列可以旋轉(zhuǎn)到新的一組角度揚(yáng)聲器地點(diǎn),并且原始的n個(gè)揚(yáng)聲器信號(hào)可以被轉(zhuǎn)變用途為該新的一組n個(gè)揚(yáng)聲器。一般來說,這種“可轉(zhuǎn)變用途”性質(zhì)允許系統(tǒng)通過s×n矩陣將n個(gè)揚(yáng)聲器信號(hào)重新映射到s個(gè)揚(yáng)聲器,前提條件是對(duì)于s>n的情況,新的揚(yáng)聲器饋送不再比原始的n個(gè)聲道“離散”是可接受的。

在實(shí)施例中,疊環(huán)的中間空間格式通過以下步驟、根據(jù)每個(gè)對(duì)象的(時(shí)變)(x,y,z)地點(diǎn)來表示每個(gè)對(duì)象:

1.將對(duì)象i安置在(xi,yi,zi)處,并且假設(shè)該地點(diǎn)位于立方體(所以|xi|≤1,|yi|≤1并且-|zi|≤1)內(nèi)或者在單位球體內(nèi)。

2.使用垂直地點(diǎn)(zi)來根據(jù)不可轉(zhuǎn)變用途的平移曲線將對(duì)象i的音頻信號(hào)平移到若干個(gè)(r個(gè))空間區(qū)域中的每個(gè)空間區(qū)域。

3.以nr個(gè)標(biāo)稱揚(yáng)聲器信號(hào)的形式表示每個(gè)空間區(qū)域(即區(qū)域r:1≤r≤r)(按照?qǐng)D4,其表示位于空間的環(huán)形區(qū)域內(nèi)的音頻分量),所述nr個(gè)標(biāo)稱揚(yáng)聲器信號(hào)是使用可轉(zhuǎn)變用途平移曲線創(chuàng)建的,所述可轉(zhuǎn)變用途平移曲線是對(duì)象i的方位角(φi)的函數(shù)。

注意,對(duì)于大小為零的環(huán)(按照?qǐng)D12,頂點(diǎn)環(huán))的特殊情況,以上步驟3是不必要的,因?yàn)樵摥h(huán)最多將包含一個(gè)聲道。

如圖11所示,用于k個(gè)聲道的isf信號(hào)1104在揚(yáng)聲器解碼器1106中被解碼。圖14a-c例示了在不同實(shí)施例下對(duì)疊環(huán)的中間空間格式的解碼。圖14a例示了疊環(huán)格式被解碼為單獨(dú)的環(huán)。圖14b例示了在沒有頂點(diǎn)揚(yáng)聲器的情況下解碼的疊環(huán)格式。圖14c例示了在沒有頂點(diǎn)揚(yáng)聲器或天花板揚(yáng)聲器的情況下解碼的疊環(huán)格式。

盡管上面對(duì)比動(dòng)態(tài)oamd對(duì)象關(guān)于作為一種類型的對(duì)象的isf對(duì)象描述了實(shí)施例,但是應(yīng)注意,也可以使用按不同格式格式化的但又能與動(dòng)態(tài)oamd對(duì)象區(qū)分開的音頻對(duì)象。

本文中所描述的音頻環(huán)境的各方面表示音頻或音頻/視覺內(nèi)容通過適當(dāng)?shù)膿P(yáng)聲器和回放裝置的回放,并且可以表示其中收聽者正在體驗(yàn)所捕捉的內(nèi)容的回放的任何環(huán)境,諸如影院、音樂廳、露天劇場(chǎng)、家里或房間、收聽亭、汽車、游戲機(jī)、耳機(jī)或耳麥系統(tǒng)、公共地址(pa)系統(tǒng)或任何其他回放環(huán)境。盡管已經(jīng)主要關(guān)于其中空間音頻內(nèi)容與電視機(jī)內(nèi)容相關(guān)聯(lián)的家庭劇場(chǎng)環(huán)境中的例子和實(shí)現(xiàn)描述了實(shí)施例,但是應(yīng)注意,實(shí)施例也可以在其他基于消費(fèi)者的系統(tǒng)中實(shí)現(xiàn),諸如游戲、放映系統(tǒng)以及任何其他的基于監(jiān)視器的a/v系統(tǒng)。包括基于對(duì)象的音頻和基于聲道的音頻的空間音頻內(nèi)容可以與任何相關(guān)內(nèi)容(相關(guān)聯(lián)的音頻、視頻、圖形等)結(jié)合使用,或者它可以構(gòu)成獨(dú)立的音頻內(nèi)容。回放環(huán)境可以是從耳機(jī)或近場(chǎng)監(jiān)視器到小房間或大房間、汽車、露天競(jìng)技場(chǎng)、音樂廳等的任何適當(dāng)?shù)氖章牠h(huán)境。

本文中所描述的系統(tǒng)的各方面可以在用于對(duì)數(shù)字或數(shù)字化音頻文件進(jìn)行處理的適當(dāng)?shù)幕谟?jì)算機(jī)的處理網(wǎng)絡(luò)環(huán)境中實(shí)現(xiàn)。自適應(yīng)音頻系統(tǒng)的各部分可以包括一個(gè)或多個(gè)網(wǎng)絡(luò),這些網(wǎng)絡(luò)包括任何期望數(shù)量的單個(gè)機(jī)器,包括用于緩沖并路由在計(jì)算機(jī)之間傳輸?shù)臄?shù)據(jù)的一個(gè)或多個(gè)路由器(未示出)。這樣的網(wǎng)絡(luò)可以構(gòu)建在各種不同的網(wǎng)絡(luò)協(xié)議上,并且可以是互聯(lián)網(wǎng)、廣域網(wǎng)(wan)、局域網(wǎng)(lan)或它們的任何組合。在網(wǎng)絡(luò)包括互聯(lián)網(wǎng)的實(shí)施例中,一個(gè)或多個(gè)機(jī)器可以被配置為通過web瀏覽器程序來訪問互聯(lián)網(wǎng)。

組件、塊、處理或其他功能組件中的一個(gè)或多個(gè)可以通過控制所述系統(tǒng)的基于處理器的計(jì)算裝置的執(zhí)行的計(jì)算機(jī)程序來實(shí)現(xiàn)。還應(yīng)注意到,就本文中所公開的各種功能的行為、寄存器傳送、邏輯組件和/或其他特性來說,這些功能可以使用硬件、固件和/或包含在各種機(jī)器可讀或計(jì)算機(jī)可讀介質(zhì)中的數(shù)據(jù)和/或指令的任何數(shù)量的組合來描述。其中可以包含這種格式化數(shù)據(jù)和/或指令的計(jì)算機(jī)可讀介質(zhì)包括但不限于各種形式的物理(非暫時(shí)性)的非易失性存儲(chǔ)介質(zhì),諸如光學(xué)、磁性或半導(dǎo)體存儲(chǔ)介質(zhì)。

除非上下文另有明確要求,否則在整個(gè)說明書和權(quán)利要求書中,詞語“包括”、“包含”等要從與排他性或窮舉性的意義完全不同的包容性的意義上來解釋;也就是說,從“包括但不限于”的意義上來解釋。使用單數(shù)或復(fù)數(shù)的詞語還分別包括復(fù)數(shù)或單數(shù)。另外,詞語“在本文中”、“在下文中”、“上面”、“下面”以及類似含義的詞語是指整個(gè)本申請(qǐng),而不是指本申請(qǐng)的任何特定部分。當(dāng)在引用兩個(gè)或更多個(gè)項(xiàng)的列表時(shí)使用詞語“或”時(shí),該詞語涵蓋該詞語的以下所有解釋:該列表中的任一項(xiàng)、該列表中的所有項(xiàng)、以及該列表中的項(xiàng)的任何組合。

整個(gè)本說明書中所稱“一個(gè)實(shí)施例”、“一些實(shí)施例”或“實(shí)施例”意味著與實(shí)施例結(jié)合描述的特定的特征、結(jié)構(gòu)或特性被包括在所公開的系統(tǒng)(一個(gè)或多個(gè))和方法(一種或多種)的至少一個(gè)實(shí)施例中。因此,短語“在一個(gè)實(shí)施例中”、“在一些實(shí)施例中”或“在實(shí)施例中”在整個(gè)本說明書中各個(gè)地方的出現(xiàn)可以指代同一個(gè)實(shí)施例,或者可以不一定指代同一個(gè)實(shí)施例。此外,所述特定的特征、結(jié)構(gòu)或特性可以以本領(lǐng)域的普通技術(shù)人員明白的任何合適的方式組合。

雖然已經(jīng)以舉例的方式就特定實(shí)施例描述了一個(gè)或多個(gè)實(shí)現(xiàn),但是要理解一個(gè)或多個(gè)實(shí)現(xiàn)不限于所公開的實(shí)施例。相反,本意在于涵蓋本領(lǐng)域技術(shù)人員明白的各種修改和類似布置。因此,所附權(quán)利要求書的范圍應(yīng)被給予最寬泛的解釋以便包含所有這種修改和類似布置。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
西乌| 徐水县| 宜兰市| 高淳县| 桂林市| 巴彦淖尔市| 七台河市| 怀安县| 于田县| 岳西县| 彭山县| 霸州市| 临澧县| 梁平县| 九寨沟县| 梁河县| 中方县| 溧阳市| 巧家县| 防城港市| 武宁县| 托克托县| 吴桥县| 临城县| 青田县| 开平市| 中卫市| 和静县| 固原市| 阜新| 贺兰县| 新绛县| 化隆| 江川县| 宁明县| 霍城县| 高青县| 凤翔县| 若羌县| 石柱| 精河县|