專利名稱:用于解碼音頻信號(hào)的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于解碼音頻信號(hào)的方法和裝置,尤其涉及用于解碼經(jīng)由各種 數(shù)字介質(zhì)接收的音頻信號(hào)的方法和裝置。
背景技術(shù):
在將若干音頻對(duì)象縮減混合成單聲道或立體聲信號(hào)時(shí),可從各個(gè)對(duì)象信號(hào) 提取若干信息(或參數(shù))。這些信息可在音頻信號(hào)的解碼器中使用??衫脤?duì)
應(yīng)于各個(gè)對(duì)象信號(hào)的信息生成多對(duì)象控制單元(MCU)的輸出音頻信號(hào)。
MCU (多點(diǎn)控制單元)是在遠(yuǎn)程電信會(huì)議中用于使通過電話會(huì)議從遠(yuǎn)程 地點(diǎn)提供的信號(hào)清晰的設(shè)備。最近,使用收斂技術(shù)的試驗(yàn)隨著進(jìn)入該技術(shù)的注 意中心而增加。
常規(guī)的MCU組合器一般使組合信號(hào)成為所接收的多聲道音頻信號(hào)。但是, 當(dāng)在MCU中使用僅具有多聲道參數(shù)的多聲道音頻信號(hào)時(shí),僅可控制聲道增益 和搖移之一,而不能控制對(duì)象增益和搖移
發(fā)明內(nèi)容
技術(shù)問題
解碼器接收縮減混合信號(hào)和輔助信息,并可利用該輔助信息生成輸出信 號(hào)??苫谥T如用戶控制或回放配置之類的其它輸入信息渲染輸出信號(hào)。為了 控制各個(gè)對(duì)象信號(hào),解碼器可接收多對(duì)象信號(hào)并進(jìn)行處理以解碼它們。
然而,用于解碼整個(gè)多對(duì)象信號(hào)的裝置和方法需要寬帶寬。因此,需要一 種新的用于解碼多對(duì)象信號(hào)的裝置和方法以降低類似寬帶寬的資源要求。此 外,對(duì)于按照聲道導(dǎo)向解碼的反向兼容性,需要可靈活地轉(zhuǎn)換成多聲道參數(shù)的 對(duì)應(yīng)于對(duì)象的輔助信息。
技術(shù)方案
5因此,謹(jǐn)記以上問題作出本發(fā)明,且本發(fā)明涉及一種充分改進(jìn)相關(guān)技術(shù)的 缺點(diǎn)并消除相關(guān)技術(shù)的一個(gè)或多個(gè)問題的用于解碼音頻信號(hào)的方法和裝置。
本發(fā)明的一個(gè)目的是提供一種通過使用包括對(duì)象電平信息和對(duì)象增益信 息的對(duì)象信息以隨著改變對(duì)象對(duì)各個(gè)縮減混合聲道的貢獻(xiàn)修改音頻信號(hào)的縮 減混合來解碼音頻信號(hào)的方法。
本發(fā)明的另一目的是提供一種通過使用包括對(duì)象電平信息和對(duì)象增益信 息的對(duì)象信息以隨著改變各個(gè)對(duì)象對(duì)各個(gè)縮減混合聲道的貢獻(xiàn)修改音頻信號(hào) 的縮減混合來解碼音頻信號(hào)的裝置。
本發(fā)明的又一目的是提供一種用于解碼包括在MCU組合器中形成的縮減 混合和組合對(duì)象參數(shù)的音頻信號(hào),以在遠(yuǎn)程會(huì)議等中控制對(duì)象增益和輸出的方 法和裝置。
本公開的其它優(yōu)點(diǎn)、目的和特征將在以下的說明中部分闡述,且在本領(lǐng)域 的技術(shù)人員分析以下內(nèi)容后將部分地變得顯然易見,或者可從本發(fā)明的實(shí)施中 獲知。本發(fā)明的目的和其它優(yōu)點(diǎn)可由書面說明書及其權(quán)利要求書和附圖中具體 指出的結(jié)構(gòu)來實(shí)現(xiàn)并獲得。
有益效果
本發(fā)明的各個(gè)實(shí)施例提供一種通過減少處理時(shí)間、計(jì)算機(jī)資源從而降低類 似寬帶寬的資源要求來快速且高效地解碼多對(duì)象音頻信號(hào)的方法和裝置。根據(jù) 本發(fā)明實(shí)施例的對(duì)象參數(shù)可提供按照面向聲道解碼進(jìn)程的反向兼容性。
附圖簡(jiǎn)述
包含于此以提供對(duì)本發(fā)明進(jìn)一步理解的附圖示出本發(fā)明的優(yōu)選實(shí)施 例,并與說明書一起用來解釋本發(fā)明的原理。在附圖中
圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于解碼音頻信號(hào)的裝置的示例性框圖。
圖2是示出根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)解碼方法的流程圖。
圖3是根據(jù)本發(fā)明的其它實(shí)施例的用于解碼音頻信號(hào)的裝置的示例性框圖。
圖4是根據(jù)本發(fā)明的一個(gè)實(shí)施例的參數(shù)生成單元的示例性框圖。圖5是根據(jù)本發(fā)明的一個(gè)實(shí)施例的對(duì)象增益信息生成單元的示例性框圖。
圖6是根據(jù)本發(fā)明的其它實(shí)施例的參數(shù)生成單元的示例性框圖。
圖7是根據(jù)本發(fā)明的其它實(shí)施例的用于處理音頻信號(hào)的裝置的示例性框圖。
圖8是根據(jù)本發(fā)明的一個(gè)實(shí)施例的MCU組合單元的示例性框圖。
圖9是根據(jù)本發(fā)明的一個(gè)實(shí)施例的組合對(duì)象參數(shù)編碼單元的示例性框圖。
用于實(shí)現(xiàn)本發(fā)明的最佳模式
為了實(shí)現(xiàn)這些目的和其它優(yōu)點(diǎn)并根據(jù)本發(fā)明的目的,如本文具體體現(xiàn)并廣 泛描述的,本發(fā)明的用于解碼音頻信號(hào)的方法包括接收音頻信號(hào)的縮減混合、
對(duì)象信息和混合信息,對(duì)象信息包括對(duì)象電平信息、對(duì)象相關(guān)性信息和對(duì)象增 益信息,對(duì)象電平信息是通過利用對(duì)象電平之一作為基準(zhǔn)信息歸一化對(duì)應(yīng)于對(duì) 象的對(duì)象電平生成的,對(duì)象相關(guān)性信息從兩個(gè)所選對(duì)象的組合提供,對(duì)象增益
信息包括對(duì)象增益值信息和對(duì)象增益比信息中的至少一個(gè);利用對(duì)象信息和混 合信息生成縮減混合處理信息;并利用縮減混合處理信息處理所述音頻信號(hào)的 縮減混合。
應(yīng)理解,本發(fā)明的以上的一般描述和以下的詳細(xì)描述是示例性和說明性 的,并且旨在提供對(duì)如所要求保護(hù)的本發(fā)明的進(jìn)一步解釋。 本發(fā)明的模式
現(xiàn)在對(duì)在附圖中示出其示例的本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)參照。只要有 可能,在所有附圖中始終使用相同的附圖標(biāo)記表示相同或相似的部件。
在對(duì)本發(fā)明進(jìn)行敘述之前,應(yīng)當(dāng)指出的是本發(fā)明中揭示的大多數(shù)術(shù)語對(duì)應(yīng) 于本領(lǐng)域內(nèi)公知的一般術(shù)語,但某些術(shù)語是由本申請(qǐng)根據(jù)需要選擇的,并且將 在本發(fā)明下文的描述中予以揭示。因此,由申請(qǐng)人定義的術(shù)語優(yōu)選基于它們?cè)?本發(fā)明中的含義來理解。
圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于解碼音頻信號(hào)的裝置1000的示例 性框圖。圖3是根據(jù)本發(fā)明的其它實(shí)施例的用于解碼音頻信號(hào)的裝置2000的 示例性框圖。
裝置1000和2000的兩個(gè)實(shí)施例的區(qū)別在于裝置1000具有多聲道解碼器1300而裝置2000不具有多聲道解碼器1300。諸如參數(shù)生成單元1100和2000 以及縮減混合處理單元1200和2200之類的其它元件在圖1和3中是相同的。
參照?qǐng)D1,用于解碼音頻信號(hào)的裝置1000(在下文中簡(jiǎn)稱為'解碼器1000') 包括參數(shù)生成單元1100、縮減混合處理單元1200和多聲道解碼器1300。參數(shù) 生成單元1100被配置成從用戶控制或比特流中接收對(duì)象信息和混合信息,并 生成縮減混合處理信息。
對(duì)象信息包括對(duì)象電平信息、對(duì)象相關(guān)性信息和對(duì)象增益信息。對(duì)象電平 信息可通過使用對(duì)象電平之一作為基準(zhǔn)信息歸一化對(duì)應(yīng)于各個(gè)對(duì)象的對(duì)象電 平來生成。對(duì)象相關(guān)性信息可由兩個(gè)所選對(duì)象的組合來提供。對(duì)象增益信息包 括對(duì)象增益值信息或?qū)ο笤鲆姹刃畔???s減混合處理信息包括用于控制對(duì)象增 益和對(duì)象搖移的參數(shù),其被輸入到縮減混合處理單元1200。
縮減混合處理單元1200被配置成接收音頻信號(hào)的縮減混合以及來自參數(shù) 生成單元1100的縮減混合處理信息??s減混合處理單元1200可利用縮減混合 處理信息來處理縮減混合,從而生成經(jīng)處理的縮減混合信號(hào)。例如,縮減混合 處理單元1200可將縮減混合處理信息施加到音頻信號(hào)的縮減混合,以便改變 音頻信號(hào)的縮減混合的對(duì)象增益和對(duì)象位置之一或全部以生成經(jīng)處理的縮減 混合。
經(jīng)處理的縮減混合可被輸入到多聲道解碼器1300,以便由諸如揚(yáng)聲器之 類的輸出設(shè)備擴(kuò)展混合并輸出。來自參數(shù)生成單元的多聲道參數(shù)輸出也可輸入 到多聲道解碼器1300。在本發(fā)明的某些實(shí)施例中,多聲道解碼器1300可與 MPEG環(huán)繞系統(tǒng)的解碼器同樣地使用。
或者,經(jīng)處理的縮減混合信號(hào)可被直接發(fā)送到如圖2所示的設(shè)備2000的 輸出設(shè)備并由該設(shè)備輸出。為了經(jīng)由揚(yáng)聲器直接輸出經(jīng)處理的信號(hào),縮減混合 處理單元2200可執(zhí)行合成濾波器組并輸出PCM數(shù)據(jù)。還能夠由用戶選擇直接 輸出為PCM信號(hào)還是輸入到多聲道解碼器。
圖2示出本發(fā)明的流程圖并且也參照?qǐng)D1。該方法是用于音頻信號(hào)的解碼 方法的流程。在步驟S110,接收音頻信號(hào)的縮減混合、對(duì)象信息和混合信息。 步驟120利用對(duì)象信息和混合信息生成縮減混合處理信息。在步驟S130,生 成經(jīng)處理的縮減混合以利用縮減混合處理信息處理音頻信號(hào)的縮減混合。將參照?qǐng)D4至圖6詳細(xì)解釋參數(shù)生成單元1100的配置。 1.對(duì)象信息
l.l基準(zhǔn)信息和對(duì)象電平信息
圖4是根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于處理音頻信號(hào)的裝置的示例性框 圖,具體地是參數(shù)生成單元的示例性框圖。參照?qǐng)D4,參數(shù)生成單元1100可被 配置成接收對(duì)象信息,并利用對(duì)象信息生成縮減混合處理信息。
參數(shù)生成單元1100可包括對(duì)象電平信息解碼單元1110a、對(duì)象增益信息 生成單元1120a和對(duì)象相關(guān)性信息生成單元1130a。
音頻信號(hào)的縮減混合包括很多對(duì)象信號(hào),且對(duì)象對(duì)象信號(hào)具有各自在對(duì)象 信號(hào)中的對(duì)象電平。
對(duì)象電平信息是通過利用基準(zhǔn)信息歸一化對(duì)象電平來生成的,且基準(zhǔn)信息 可以是對(duì)象電平之一,更具體地,基準(zhǔn)信息可以是所有對(duì)象電平中最大的對(duì)象 電平。
例如,假設(shè)音頻信號(hào)的縮減混合包括對(duì)象sj,且各個(gè)對(duì)象sj的對(duì)象電平 是Ps一i。
如果按原樣發(fā)送對(duì)象電平能量以編碼對(duì)象參數(shù),則對(duì)象參數(shù)包括如下的對(duì) 象信息
可按照各種方法獲得Ps_i。例如,Ps_i可以是"sj(n)A2"或"E[s—i(n)A2]"。 可發(fā)送Ps—i作為與各個(gè)對(duì)象電平信息對(duì)應(yīng)的信息。這里,"sj(n)"指示第i 個(gè)對(duì)象信號(hào),且sj(n)可以是時(shí)域信號(hào)或給定頻帶內(nèi)的子頻帶信號(hào)。
然而,如果與各個(gè)對(duì)象信號(hào)對(duì)應(yīng)的對(duì)象電平信息按其自身的值發(fā)送,則對(duì) 象信號(hào)的對(duì)象電平可能由于動(dòng)態(tài)范圍變化的過度增加而難以量化。
因此,對(duì)象電平信息可利用基準(zhǔn)信息——即所有對(duì)象能量的最大對(duì)象電平 能量——來歸一化。如果基準(zhǔn)信息可以是r_l,則對(duì)象電平信息可以按以下的 數(shù)學(xué)演算來發(fā)送
E[s_i(n)A2]/E[r—l(n)A2], r—l(n)=基準(zhǔn)信息 所有的對(duì)象電平信息被包括在小于或等于1的范圍中。 因此,動(dòng)態(tài)范圍可被壓縮成足以編碼音頻信號(hào)。
9另外,對(duì)象電平信息可包括基準(zhǔn)信息、默認(rèn)信息、原始對(duì)象電平能量以使 用其它信號(hào)處理。對(duì)象電平信息對(duì)應(yīng)于各個(gè)對(duì)象,且對(duì)象電平信息的數(shù)目與縮 減混合中的對(duì)象的數(shù)目相同。
1.2對(duì)象增益信息
對(duì)象參數(shù)包括對(duì)象增益信息,對(duì)象增益信息包括對(duì)象增益值信息和對(duì)象增 益比信息中的至少一個(gè)。圖5是根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于處理音頻信號(hào) 的裝置的示例性框圖,具體地是參數(shù)生成單元1100的對(duì)象增益信息解碼單元 的示例性框圖。
對(duì)象增益信息生成單元1120a包括對(duì)象增益值信息生成單元1121和對(duì)象 增益比信息生成單元1122。對(duì)象增益信息涉及縮減混合一個(gè)對(duì)象信號(hào)以生成具 有一個(gè)以上聲道的縮減混合信號(hào)。
1.2.1對(duì)象增益值信息
對(duì)象增益值信息包括對(duì)象的增益值。在本發(fā)明的某些實(shí)施例中,在生成經(jīng) 處理的縮減混合之前將對(duì)象增益施加到各個(gè)對(duì)象。
例如,當(dāng)音頻信號(hào)的縮減混合包括多個(gè)對(duì)象時(shí),對(duì)應(yīng)于各個(gè)對(duì)象的各個(gè)對(duì) 象增益值信息與各個(gè)對(duì)象的對(duì)象電平相乘以生成各個(gè)增益對(duì)象,且將所有的增 益對(duì)象相加以生成經(jīng)處理的縮減混合。
X = sum(a—i * s—i} (sum為求禾口)
其中X是將被發(fā)送到單聲道的經(jīng)處理的縮減混合,s—i是對(duì)象電平,且aj 是對(duì)各個(gè)聲道有貢獻(xiàn)的對(duì)象的對(duì)象增益值信息。 1.2.2對(duì)象增益比信息
對(duì)象增益信息還包括對(duì)象增益比信息以及對(duì)象增益值信息。對(duì)象增益比信 息包括對(duì)經(jīng)處理的縮減混合的各個(gè)聲道有貢獻(xiàn)的各個(gè)對(duì)象的增益之間的比值。
對(duì)象增益比信息可用于通過縮減混合處理單元1200處理縮減混合,從而 獲得將通過2個(gè)(例如立體聲)和更多個(gè)聲道發(fā)送的經(jīng)處理的縮減混合。在立 體聲聲道的情形中,將通過各個(gè)立體聲聲道發(fā)送的經(jīng)處理的縮減混合由數(shù)學(xué)演 算3示出。對(duì)象增益比信息可從數(shù)學(xué)演算4獲得。x一l = sum{a—i * s_i} x_2 = sum{b—i * s—i}
其中x_l和x_2分別是將通過各個(gè)聲道發(fā)送的經(jīng)處理的縮減混合,s一i是 對(duì)象電平,且a—i和b—i是對(duì)各個(gè)聲道有貢獻(xiàn)的對(duì)象的對(duì)象增益值信息。 [數(shù)學(xué)演算4]
m一i = a一i / b_i
其中m_i是各個(gè)對(duì)象的對(duì)象增益比信息。
對(duì)象增益信息,即對(duì)象增益值信息(a一i和b一i)和對(duì)象增益比信息(m_i) 可按包括在比特流中的對(duì)象增益信息的各種組合被發(fā)送到參數(shù)生成單元IIOO。 組合包括例如(aj , b_i)、 (m—i, a—i)和(mj, b_i)。參數(shù)生成單元1100可解碼該 組合以重構(gòu)原始對(duì)象信息??衫斫庥蓞?shù)生成單元1100執(zhí)行的組合的解碼可 適用于其它解碼器,例如多聲道解碼器1300。
或者,當(dāng)對(duì)象增益信息以對(duì)象增益值信息(aj , bj)的組合被發(fā)送到參數(shù)生 成單元1100時(shí),可縮放對(duì)象增益值信息。如果有b一i縮放為1的約定,則盡管 對(duì)象電平信息和僅a_i作為對(duì)象增益信息發(fā)送,參數(shù)生成單元1100可根據(jù)約定 重構(gòu)原始對(duì)象信息。通過縮放對(duì)象增益值,可減少將發(fā)送到參數(shù)生成單元iioo 的參數(shù)的數(shù)目。
或者,對(duì)象增益比信息(m_i)可從如數(shù)學(xué)演算5的各個(gè)值中獲得。
m_i = a_i / b_i,
m_i = (a—i + a)/(b—i + p),
m_i = (a—i * s_i) / (b—i * s_i) (a、 (3是防止分子和分母為0的非常小的數(shù)。)
在對(duì)象增益比信息包括s—i的情形中,相同的m_i值可能不包括相同的s—i 值。例如在1) a—i = 0.5, b_i=0.5, 2) a_i = 2, b_i = 2的情形中,這些情形都具有 相同的mj^1),但這些情形具有不同的a—i、 bj值。
為了獲得將通過各個(gè)聲道發(fā)送的經(jīng)處理的縮減混合,可使用如數(shù)學(xué)演算6 的新方法-x一l = sum{a—i'(n) * s_i'(n)}, x—2 = sum{b_i'(n) * s_i'(n) }
(其中a—i鄰bj'是滿足以下條件的值, (a_i, + b—i' = C)或(a一i'A2 + b_i'A2 = C)或(a—i' = C或b—i' = C),其中s一i' = g_i
* s_i)
最后,可發(fā)送目標(biāo)增益比信息m—i'(=a—i'/b_i')??蓽p少要發(fā)送到參數(shù)生成 單元1100的參數(shù)的數(shù)目。為了防止解碼器1000或2000中的音頻信號(hào)的失真, 可發(fā)送m一i。
1.3對(duì)象相關(guān)性信息
參照?qǐng)D4,參數(shù)解碼單元1100接收對(duì)象相關(guān)性信息。對(duì)象相關(guān)性信息在 兩個(gè)對(duì)象之間被估計(jì),且表示兩個(gè)對(duì)象之間的相關(guān)性/相干性。
在兩個(gè)對(duì)象具有相同的聲道源且通過不同聲道發(fā)送的情形中,可存在對(duì)象 相關(guān)性信息。
首先,如果對(duì)象信號(hào)包括立體聲對(duì)象,則立體聲對(duì)象可生成縮減混合立體 聲對(duì)象的單聲道對(duì)象,并生成指示立體聲對(duì)象的聲道之間關(guān)系的子代對(duì)象參數(shù)
(在下文中該方法是'單聲道方法,)。在這種情形中,對(duì)象電平信息是利用 單聲道對(duì)象的對(duì)象電平能量生成的。
第二,立體聲對(duì)象識(shí)別兩個(gè)單獨(dú)的單聲道對(duì)象信號(hào)。在這種情形中,對(duì)象 電平信息利用兩個(gè)單獨(dú)的單聲道對(duì)象電平生成(在下文中,該方法是'立體聲 方法')。利用第二方法發(fā)送的信息量多于利用第一方法的信息量。
為了處理立體聲對(duì)象,例如,立體聲對(duì)象的第一聲道信號(hào)可以是s_i,立 體聲對(duì)象的第二聲道信號(hào)是作為各個(gè)單聲道對(duì)象信號(hào)的sj。
以上聲道信號(hào)的對(duì)象電平可以是Psj、 PsJ。
在立體聲對(duì)象的情形中,表示給定對(duì)象的L和R聲道的各個(gè)對(duì)象信息彼 此相似。所以,對(duì)象相關(guān)性信息可用于表示對(duì)象信息之間的相似性。
因此,為了編碼Psj和PsJ,利用立體聲方法的各個(gè)單聲道對(duì)象被視為 耦合構(gòu)成的相同對(duì)象。
對(duì)象相關(guān)性信息包括所表示的聲道功率——例如立體聲對(duì)象的左聲 道—和利用如下表示的歸一化功率值中的一個(gè)。[數(shù)學(xué)演算7]
PsJ' = PsJ /Ps_i或
Ps」'=101ogl0(PsJ) - 101ogl0(Ps_i) = 101ogl0(PsJ / Ps_i)
為了減少發(fā)送的對(duì)象信息的位,使用對(duì)象相關(guān)性信息是有效的。
并且對(duì)象相關(guān)性信息可利用如下的表示來生成。
Ps—i', Ps」'=Ps_i, PsJ / sqrt(Ps一i * PsJ)
對(duì)象相關(guān)性信息表示對(duì)象之間的關(guān)系,對(duì)象是否是同一立體聲或多聲道對(duì) 象的兩個(gè)聲道,即各個(gè)對(duì)象是同一源的不同聲道。
另外,關(guān)于兩個(gè)對(duì)象之間的關(guān)系,可使用不同的信息。 不同信息包括如下的立體聲對(duì)象的和信號(hào)或減信號(hào) [數(shù)學(xué)演算9]
M = (L + R)/2, S = (L - R)/2
Ps一M =(Ps—L + Ps一R)/2, Ps_S = CPs—L - Ps一R)/2
包括以上的M和Ps一M的對(duì)象相關(guān)性信息可提高傳輸效率并易于執(zhí)行誤 差平衡。
對(duì)象相關(guān)性信息的數(shù)目根據(jù)所組成的同一對(duì)象而適應(yīng)性地改變,以便減少 對(duì)象參數(shù)的比特率。標(biāo)志信息'相關(guān)性j示志'指示對(duì)象是否是立體聲或多聲 道對(duì)象的一部分,并可從對(duì)象信息接收。相關(guān)性_標(biāo)志可被包括在對(duì)象信息中, 且由信息生成單元1100接收。
標(biāo)志信息'相關(guān)性—標(biāo)志'的含義在以下的表l中示出。
表l
相關(guān)性標(biāo)志含義
1相關(guān)
0不相關(guān)
在'相關(guān)性—標(biāo)志'等于o的情形中,對(duì)象相關(guān)性信息不被發(fā)送到對(duì)象相 關(guān)性信息解碼單元1130a。當(dāng)'相關(guān)性—標(biāo)志,未被接收到解碼器1000或2000 時(shí),默認(rèn)值可用于處理音頻信號(hào)的縮減混合。否則('相關(guān)性—標(biāo)志'等于1),
13對(duì)象相關(guān)性信息在所選的兩個(gè)對(duì)象之間類似地發(fā)送到對(duì)象相關(guān)性信息解碼單
元1130a。
此外,對(duì)象信息還單獨(dú)包括基準(zhǔn)信息。當(dāng)存在基準(zhǔn)信息時(shí),基準(zhǔn)信息可以 是用于MCU組合器的標(biāo)識(shí)符。
根據(jù)本發(fā)明的編碼音頻信號(hào)的方法包括接收多對(duì)象音頻信號(hào)的步驟以及 生成音頻信號(hào)的縮減混合和包括對(duì)象電平信息、對(duì)象增益信息和對(duì)象相關(guān)性的 對(duì)象信息的步驟,對(duì)象電平信息和對(duì)象相關(guān)性信息來自多對(duì)象音頻信號(hào),對(duì)象 電平信息、對(duì)象增益信息和對(duì)象相關(guān)性的特性與解碼方法的特性相同。所以, 根據(jù)本發(fā)明的編碼音頻信號(hào)的方法可以不受以上所標(biāo)識(shí)的限制。
另外,根據(jù)本發(fā)明的編碼音頻信號(hào)的裝置包括由多對(duì)象音頻信號(hào)生成音 頻信號(hào)的縮減混合的縮減混合單元;以及從多對(duì)象音頻信號(hào)提取包括對(duì)象電平 信息、對(duì)象增益信息和對(duì)象相關(guān)性信息的對(duì)象信息的對(duì)象信息單元。根據(jù)本發(fā) 明的編碼音頻信號(hào)的裝置可以不受以上所標(biāo)識(shí)的限制。
2. MCU組合器
包括多對(duì)象信號(hào)的音頻信號(hào)可由MCU組合器用于控制對(duì)象增益和遠(yuǎn)程會(huì) 議中的輸出等。在使用包括多對(duì)象信號(hào)的音頻信號(hào)的情形中,控制與各個(gè)對(duì)象 信號(hào)的特性相對(duì)應(yīng)的對(duì)象增益和搖移是有效的。
例如,多聲道音頻信號(hào)包括歌唱聲音、背景音樂(BGM)、解說聲音。 在必要時(shí),當(dāng)我們僅使用或收聽沒有歌唱聲音和解說聲音的背景音樂或在 遠(yuǎn)程電信會(huì)議中僅與某人通信時(shí),我們不能檢測(cè)或控制特定類型的對(duì)象信 號(hào)。
另外,利用對(duì)象信息的本發(fā)明的解碼方法可用于增強(qiáng)的卡拉OK系統(tǒng)。 圖6是根據(jù)本發(fā)明的實(shí)施例的用于處理音頻信號(hào)的裝置的示例性框圖。參 照?qǐng)D6,根據(jù)本發(fā)明的用于處理音頻信號(hào)的裝置可包括編碼器13100、編碼器 2 4100、包括MCU組合單元5100和縮減混合器5200的組合單元5000。編碼 器1 3100和編碼器2 4100可被配置成分別接收音頻信號(hào)—1或音頻信號(hào)—2,并 在編碼器1 3100中生成縮減混合一l和對(duì)象信息_1,并在編碼器2 4100中生成 縮減混合_2和對(duì)象信息_2。
組合單元5000可被配置成接收來自編碼器1 3100的縮減混合—1和對(duì)象信息_1、來自編碼器2 4100的縮減混合一2和對(duì)象信息_2、以及來自用戶控制的
控制信息,并生成縮減混合和組合的對(duì)象信息。
組合單元5000的縮減混合、輸出信號(hào)可由常規(guī)的縮減混合單元生成。因 此,縮減混合器5200的元件的細(xì)節(jié)將被省略。 2.1組合對(duì)象參數(shù)
圖7是根據(jù)本發(fā)明的實(shí)施例的用于處理音頻信號(hào)的裝置的示例性框圖,具 體地是MCU組合單元8100的示例性框圖。參照?qǐng)D7, MCU組合單元5100可 被配置成利用對(duì)象信息J、對(duì)象信息—2和控制信息生成組合對(duì)象信息。組合對(duì) 象信息包括與來自編碼器1 3100的縮減混合—1和來自編碼器2 4100的縮減混 合—2相對(duì)應(yīng)的所有信息。
MCU組合單元5100包括對(duì)象信息解碼單元5110和組合對(duì)象信息編碼單 元5120。對(duì)象信息解碼單元5110可被配置成接收來自編碼器1 3100的對(duì)象信 息—1和來自編碼器2 4100的對(duì)象信息_2,并從對(duì)象信息_1生成基準(zhǔn)值_1、對(duì) 象電平信息一l和對(duì)象增益信息J,以及基準(zhǔn)值一2、對(duì)象電平信息_2和對(duì)象增 益信息一2?;鶞?zhǔn)值、對(duì)象電平信息和對(duì)象增益信息與圖l-圖6的相同。因此, 將省略這些信息的生成方法的細(xì)節(jié)。
并且MCU組合單元5100可被配置成從多個(gè)編碼器的每一個(gè)接收至少兩 個(gè)對(duì)象信息,而沒有輸入信號(hào)的限制,并生成包括與縮減混合相對(duì)應(yīng)的若干信 息的組合對(duì)象信息。
2.2控制信息
圖8是根據(jù)本發(fā)明的實(shí)施例的用于處理音頻信號(hào)的裝置的示例性框圖,具 體地是組合對(duì)象信息編碼單元5120的示例性框圖。參照?qǐng)D8,組合對(duì)象信息編 碼單元5120可被配置成接收這些信息和來自用戶控制的控制信息,并生成將 輸入解碼器(未示出)的組合對(duì)象信息。
控制信息可處理對(duì)象信息J和對(duì)象信息_2,并在組合對(duì)象信息編碼單元 5120中施加到以上的對(duì)象信息—1和對(duì)象信息_2的組合??缮山M合對(duì)象信息 以便由控制信息處理,控制信息指示組成組合對(duì)象信息的某些對(duì)象,并控制對(duì) 象信息的組合中的對(duì)象增益。
控制信息包括對(duì)象控制信息、增益控制信息和目的地信息。以下將解釋對(duì)象控制信息、增益控制信息和目的地信息中的每一個(gè)。 2.2.1對(duì)象控制信息
對(duì)象控制信息可確定目標(biāo)對(duì)象以生成組合對(duì)象信息。對(duì)象控制信息可確定
對(duì)象信息_1或?qū)ο笮畔⒁?的音頻對(duì)象的所需子集。
對(duì)象控制信息可被處理成對(duì)象電平信息編碼單元5112中的對(duì)象電平信 息。組合對(duì)象信息可包括與根據(jù)對(duì)象控制信息確定的某些對(duì)象相對(duì)應(yīng)的信息, 并可根據(jù)若干目的使用。
例如,對(duì)象信息一l包括含有歌唱、鋼琴、吉他對(duì)象信號(hào)的音樂,且對(duì)象 信息_2包括小提琴、歌唱對(duì)象信號(hào)。為了生成包括鋼琴、吉他、小提琴對(duì)象信 號(hào)的音頻信號(hào),我們可利用來自用戶控制的對(duì)象控制信息獲得沒有歌唱對(duì)象信 號(hào)的組合對(duì)象信息。
2.2.2增益控制信息
對(duì)象增益信息編碼單元5113可被配置成接收來自對(duì)象信息—1的增益信息 —1、來自對(duì)象信息_2的增益信息_2、增益控制信息和目的地信息,并生成對(duì)象 信息的對(duì)象增益信息。
增益控制信息可用于控制MCU組合器的對(duì)象增益。與對(duì)象控制信息不同, 增益控制信息可在對(duì)象增益信息編碼單元5113中處理對(duì)象信息,且對(duì)象信息 是利用對(duì)象電平信息編碼單元5112中的對(duì)象控制信息選擇的。增益控制信息 可以是0-l范圍中的值。
2.2.3目的地信息
在增益控制信息的范圍內(nèi),如果對(duì)應(yīng)于對(duì)象信息的增益控制信息是O,則 該對(duì)象信息不被包括在組合對(duì)象信息中。當(dāng)增益控制信息是0或1時(shí),增益控 制信息定義目的地信息。目的地信息可包括具有值0或1的特定增益控制信息 和縮減混合將輸出到哪個(gè)目的地的標(biāo)識(shí)符。
目的地信息可用于特定功能,例如,密談功能、秘密會(huì)議,并用于控制對(duì) 象信號(hào)的目的地。
參照?qǐng)D8,可將目的地信息輸入到對(duì)象增益信息編碼單元5123,并處理增 益信息—1和增益信息一2以控制組合對(duì)象信息的對(duì)象增益。如果MCU組合器具 有3端口,則目的地信息可包括對(duì)應(yīng)于每個(gè)輸出端口的各個(gè)增益值(0, 1)。
16增益控制信息和目的地信息可一次或單獨(dú)地輸入到對(duì)象增益信息編碼單 元5113。
2.3生成組合對(duì)象信息的過程
圖8是組合對(duì)象信息編碼單元5120的示例性框圖。參照?qǐng)D8,組合對(duì)象 信息編碼單元5120可被配置成接收基準(zhǔn)值_1、基準(zhǔn)值_2、對(duì)象電平信息_1、 對(duì)象電平信息—2、對(duì)象增益信息—1、對(duì)象增益信息一2、對(duì)象控制信息、增益控 制信息和目的地信息,并利用對(duì)象控制信息、增益控制信息和目的地信息生成 組合對(duì)象信息。
2.3.1基準(zhǔn)信息的確定
再次參照?qǐng)D8,組合對(duì)象信息編碼單元5120包括基準(zhǔn)值生成單元5121、 對(duì)象電平信息編碼單元5122和對(duì)象增益信息編碼單元5123。
為了生成組合對(duì)象信息,首先可估計(jì)組合對(duì)象信息的基準(zhǔn)信息。每個(gè)對(duì)象 信息一i可包括基準(zhǔn)信息以歸一化每個(gè)對(duì)象電平,并生成對(duì)象電平信息。但是, 在組合至少兩個(gè)對(duì)象信息以生成組合對(duì)象信息的情形中,組合對(duì)象信息可確定 歸一化組成組合對(duì)象信息的對(duì)象電平信息的對(duì)象電平。
組合對(duì)象信息的基準(zhǔn)信息可通過若干方法來確定。例如,組合對(duì)象信息的 基準(zhǔn)信息可以是基準(zhǔn)信息—1,或?qū)ο笮畔的最大基準(zhǔn)信息。
取代基準(zhǔn)信息的改變,組合對(duì)象信息可使用對(duì)象信息j的對(duì)象電平信息作 為組合對(duì)象信息的對(duì)象電平信息。
2.3.2組合對(duì)象信息的對(duì)象電平信息
基準(zhǔn)信息生成單元5121可按以上方法估計(jì)組合對(duì)象信息的基準(zhǔn)信息。在 組合對(duì)象信息的基準(zhǔn)信息改變之前,對(duì)象電平信息一i由基準(zhǔn)信息—i歸一化。
我們假設(shè)對(duì)象信息_1的對(duì)象電平信息是[數(shù)學(xué)演算10],組合對(duì)象信息的 對(duì)象電平信息是[數(shù)學(xué)演算ll]。
OL_ln = EO_ln/ (對(duì)象信息_1的基準(zhǔn)信息) (OL—ln是對(duì)象信息_1的第n對(duì)象電平信息,EO一ln是對(duì)象信息—1的第n 對(duì)象電平能量) [數(shù)學(xué)演算ll]OL_k = OL_ln* (對(duì)象信息_1的基準(zhǔn)信息)/ (對(duì)象信息的基準(zhǔn)信息)
(OL_k是組合對(duì)象信息的第k對(duì)象電平信息) 2.3.2對(duì)象增益信息
對(duì)象增益信息編碼單元5123可被配置成接收對(duì)象增益—1、對(duì)象增益—2、 增益控制信息和目的地信息,并利用增益控制信息和目的地信息生成對(duì)象增益 信息。在來自用戶控制的目的地信息指示對(duì)象信息的開/關(guān)的情形中,即目的地 信息是0或1,對(duì)象信息—i的對(duì)象增益信息是0或l。在可從用戶控制輸入增 益控制信息的情形中,可利用增益控制信息改變對(duì)象增益信息—1和對(duì)象增益信 息_2。
2.3.3對(duì)象相關(guān)性信息
對(duì)象相關(guān)性信息指示立體聲對(duì)象或多聲道對(duì)象的聲道之間的相似性/相異 性,所以對(duì)象相關(guān)性信息可受到在MCU組合單元5100中組合對(duì)象信息的影響。
組合對(duì)象信息的對(duì)象相關(guān)性信息可包括按原樣的對(duì)象信息j的對(duì)象相關(guān) 性信息。
對(duì)于本領(lǐng)域技術(shù)人員而言,可對(duì)本發(fā)明作出各種修改和變化而不背離本發(fā) 明的精神和范圍是顯而易見的。因此,本發(fā)明旨在涵蓋本發(fā)明的更改和變化, 只要它們落在所附權(quán)利要求及其等效方案的范圍內(nèi)即可。
工業(yè)實(shí)用性
因此,本發(fā)明適用于編碼和解碼音頻信號(hào)。
18
權(quán)利要求
1. 一種解碼音頻信號(hào)的方法,包括接收音頻信號(hào)的縮減混合、對(duì)象信息和混合信息,所述對(duì)象信息包括對(duì)象電平信息、對(duì)象相關(guān)性信息和對(duì)象增益信息,所述對(duì)象電平信息是通過利用所述對(duì)象電平之一作為基準(zhǔn)信息歸一化對(duì)應(yīng)于對(duì)象的對(duì)象電平生成的,所述對(duì)象相關(guān)性信息由兩個(gè)所選對(duì)象的組合提供,所述對(duì)象增益信息包括對(duì)象增益值信息和對(duì)象增益比信息中的至少一個(gè);利用所述對(duì)象信息和所述混合信息生成縮減混合處理信息;以及利用所述縮減混合處理信息處理所述音頻信號(hào)的縮減混合。
2. 如權(quán)利要求1所述的方法,其特征在于,所述基準(zhǔn)信息包括所有對(duì)象 電平中的最大對(duì)象電平。
3. 如權(quán)利要求1所述的方法,其特征在于,所述對(duì)象電平信息的數(shù)目與 所述音頻信號(hào)的縮減混合中所述對(duì)象的數(shù)目相同。
4. 如權(quán)利要求1所述的方法,其特征在于,所述對(duì)象相關(guān)性信息包括表示同一源的不同對(duì)象的關(guān)系信息。
5. 如權(quán)利要求1所述的方法,其特征在于,所述對(duì)象相關(guān)性信息基于相關(guān)性—標(biāo)志而存在。
6. 如權(quán)利要求1所述的方法,其特征在于,所述對(duì)象相關(guān)性信息包括基 于相關(guān)性_標(biāo)志的默認(rèn)值。
7. 如權(quán)利要求1所述的方法,其特征在于,所述對(duì)象增益值信息包括將 施加到對(duì)象以用于生成所述音頻信號(hào)的縮減混合的增益值。
8. 如權(quán)利要求1所述的方法,其特征在于,所述對(duì)象增益比信息包括關(guān) 于對(duì)所述音頻信號(hào)的縮減混合的至少兩個(gè)聲道的相對(duì)貢獻(xiàn)的增益比。
9. 如權(quán)利要求1所述的方法,其特征在于,所述對(duì)象信息還包括基準(zhǔn)信息。
10. 如權(quán)利要求l所述的方法,其特征在于,所述對(duì)象信息還包括相關(guān)性標(biāo)志。
11. 如權(quán)利要求l所述的方法,其特征在于,還包括獲取所述音頻信號(hào)的經(jīng)處理的縮減混合作為輸出信號(hào)。
12. 如權(quán)利要求1所述的方法,其特征在于,還包括 利用多聲道參數(shù)擴(kuò)展混合經(jīng)處理的縮減混合;
13. 如權(quán)利要求1所述的方法,其特征在于,接收所述音頻信號(hào)的縮減混 合作為廣播信號(hào)。
14. 如權(quán)利要求1所述的方法,其特征在于,在數(shù)字介質(zhì)上接收所述音頻 信號(hào)的縮減混合。
15. —種有指令存儲(chǔ)于其上的計(jì)算機(jī)可讀介質(zhì),當(dāng)所述指令被解碼器執(zhí)行時(shí)使得所述處理器執(zhí)行以下操作,包括接收音頻信號(hào)的縮減混合、對(duì)象信息和混合信息,所述對(duì)象信息包括對(duì)象 電平信息、對(duì)象相關(guān)性信息和對(duì)象增益信息,所述對(duì)象電平信息是通過利用所 述對(duì)象電平之一作為基準(zhǔn)信息歸一化對(duì)應(yīng)于對(duì)象的對(duì)象電平生成的,所述對(duì)象 相關(guān)性信息由兩個(gè)所選對(duì)象的組合提供,所述對(duì)象增益信息包括對(duì)象增益比信 息和對(duì)象增益值信息中的至少一個(gè);利用所述對(duì)象信息和所述混合信息生成縮減混合處理信息; 利用所述縮減混合處理信息處理所述音頻信號(hào)的縮減混合。
16. —種用于解碼音頻信號(hào)的裝置,包括信息生成單元,其接收對(duì)象信息和混合信息,所述對(duì)象信息包括對(duì)象電平 信息、對(duì)象相關(guān)性信息和對(duì)象增益信息,所述對(duì)象電平信息是通過利用所述對(duì) 象電平之一作為基準(zhǔn)信息歸一化對(duì)應(yīng)于對(duì)象的對(duì)象電平生成的,所述對(duì)象相關(guān) 性信息由兩個(gè)所選對(duì)象的組合提供,所述對(duì)象增益信息包括對(duì)象增益值信息和 對(duì)象增益比信息中的至少一個(gè),并利用所述對(duì)象信息和所述混合信息生成縮減 混合處理信息;以及縮減混合處理單元,其接收所述音頻信號(hào)的縮減混合和所述縮減混合處理 信息,并利用所述縮減混合處理信息處理所述音頻信號(hào)的縮減混合;
17. —種編碼音頻信號(hào)的方法,包括 接收多對(duì)象音頻信號(hào);以及生成音頻信號(hào)的縮減混合和包括對(duì)象電平信息、對(duì)象增益信息和對(duì)象相關(guān) 性的對(duì)象信息,所述對(duì)象電平信息和所述對(duì)象相關(guān)性信息來自所述多對(duì)象音頻信號(hào),所述對(duì)象電平信息是通過利用所述對(duì)象電平之一作為基準(zhǔn)信息歸一化對(duì) 應(yīng)于對(duì)象的對(duì)象電平生成的,所述對(duì)象相關(guān)性信息由兩個(gè)所選對(duì)象的組合提 供,所述對(duì)象增益信息包括對(duì)象增益值信息和對(duì)象增益比信息中的至少一個(gè)。
18. 如權(quán)利要求17所述的方法,其特征在于,所述基準(zhǔn)信息包括所有對(duì) 象電平中的最大對(duì)象電平。
19. 如權(quán)利要求17所述的方法,其特征在于,所述對(duì)象電平信息的數(shù)目與所述音頻信號(hào)的縮減混合中所述對(duì)象的數(shù)目相同。
20. 如權(quán)利要求17所述的方法,其特征在于,所述對(duì)象相關(guān)性信息包括 表示同一源的不同對(duì)象的關(guān)系信息。
21. —種用于編碼音頻信號(hào)的裝置,包括縮減混合單元,其從多對(duì)象音頻信號(hào)生成音頻信號(hào)的縮減混合;以及 對(duì)象信息單元,其從所述多對(duì)象音頻信號(hào)提取包括對(duì)象電平信息、對(duì)象增 益信息和對(duì)象相關(guān)性的對(duì)象信息,所述對(duì)象電平信息和所述對(duì)象相關(guān)性信息來 自所述多對(duì)象音頻信號(hào),所述對(duì)象電平信息是通過利用所述對(duì)象電平之一作為 基準(zhǔn)信息歸一化對(duì)應(yīng)于對(duì)象的對(duì)象電平生成的,所述對(duì)象相關(guān)性信息由兩個(gè)所 選對(duì)象的組合提供,所述對(duì)象增益信息包括對(duì)象增益值信息和對(duì)象增益比信息 中的至少一個(gè)。
全文摘要
本發(fā)明涉及用于解碼音頻信號(hào)的方法和裝置,提供一種通過使用包括對(duì)象電平信息和對(duì)象增益信息的對(duì)象信息以隨著改變對(duì)象對(duì)各個(gè)縮減混合聲道的貢獻(xiàn)修改音頻信號(hào)的縮減混合來解碼音頻信號(hào)的方法。本發(fā)明提供一種通過使用包括對(duì)象電平信息和對(duì)象增益信息的對(duì)象信息以隨著改變各個(gè)對(duì)象對(duì)各個(gè)縮減混合聲道的貢獻(xiàn)修改音頻信號(hào)的縮減混合來解碼音頻信號(hào)的裝置。
文檔編號(hào)G10L19/00GK101536086SQ200780042264
公開日2009年9月16日 申請(qǐng)日期2007年11月15日 優(yōu)先權(quán)日2006年11月15日
發(fā)明者吳賢午, 鄭亮源 申請(qǐng)人:Lg電子株式會(huì)社