用相位信息和殘差信息進(jìn)行編碼/解碼的設(shè)備和方法
【專(zhuān)利說(shuō)明】
[0001] 本申請(qǐng)是向中國(guó)知識(shí)產(chǎn)權(quán)局提交的申請(qǐng)日為2010年10月25日、申請(qǐng)?zhí)枮?201080047876. 1、發(fā)明名稱(chēng)為"用相位信息和殘差信息進(jìn)行編碼/解碼的設(shè)備和方法"的申 請(qǐng)的分案申請(qǐng)。
技術(shù)領(lǐng)域
[0002] 一個(gè)或多個(gè)實(shí)施例設(shè)及一種用于對(duì)多個(gè)聲道信號(hào)進(jìn)行編碼的編碼設(shè)備和對(duì)多個(gè) 聲道信號(hào)進(jìn)行解碼的解碼設(shè)備及其一個(gè)或多個(gè)方法,更具體地講,設(shè)及一種用于基于相位 信息和殘差信號(hào)對(duì)多個(gè)聲道信號(hào)進(jìn)行編碼的編碼設(shè)備和對(duì)多個(gè)聲道信號(hào)進(jìn)行解碼的解碼 設(shè)備及其一個(gè)或多個(gè)方法。
【背景技術(shù)】
[0003] 通常,多聲道音頻編碼可包括波形多聲道音頻編碼和參數(shù)多聲道音頻編碼。僅作 為波形多聲道音頻編碼的示例,可使用運(yùn)動(dòng)圖像專(zhuān)家組(MPE0-2運(yùn)動(dòng)補(bǔ)償(MC)音頻編碼、 高級(jí)音頻編碼(AAC)MC音頻編碼、位片算術(shù)編碼/應(yīng)用可視化系統(tǒng)度SAC/AV巧MC音頻編碼 等。僅作為示例,波形多聲道音頻編碼可基于輸入到原始編碼器的五個(gè)聲道信號(hào)(注意到, 立體聲或7個(gè)聲道信號(hào)W及可選擇的聲道信號(hào)數(shù)量同樣是可用的),從解碼器輸出來(lái)自發(fā) 送的單個(gè)或立體編碼信號(hào)的五個(gè)聲道信號(hào)。
[0004] 例如,參數(shù)多聲道音頻編碼可包括MPEG環(huán)繞聲編碼,例如,在對(duì)發(fā)送的一個(gè)或兩 個(gè)聲道的上混合之后輸出用于表示六個(gè)或八個(gè)多聲道的一個(gè)或兩個(gè)輸入聲道。
[0005] 通過(guò)使用示例性配置,可使用參數(shù)立體聲(P巧技術(shù)對(duì)單聲道信號(hào)或立體聲信號(hào) 進(jìn)行編碼。另外,參數(shù)立體聲技術(shù)可對(duì)輸入立體聲信號(hào)進(jìn)行下混合,W產(chǎn)生單聲道信號(hào),提 取指示立體聲信號(hào)的邊信息的立體聲參數(shù),并通過(guò)對(duì)產(chǎn)生的單聲道信號(hào)和提取的立體聲參 數(shù)進(jìn)行編碼來(lái)對(duì)立體聲信號(hào)進(jìn)行編碼。然后,解碼器可基于解碼的立體聲參數(shù)對(duì)解碼的單 聲道信號(hào)進(jìn)行上混合。
[0006] 作為在運(yùn)種情況下使用的立體聲參數(shù)的示例,基于立體聲信號(hào)中包括的至少兩個(gè) 聲道信號(hào)的能量級(jí)別指示強(qiáng)度差的聲道間強(qiáng)度差(IID)或聲道電平差(CLD)、基于立體聲 信號(hào)中包括的至少兩個(gè)聲道信號(hào)的波形的相似度指示兩個(gè)聲道信號(hào)之間的相關(guān)度的聲道 間相干性(ICC)或聲道間相關(guān)性(ICC)、指示立體聲信號(hào)中包括的至少兩個(gè)聲道信號(hào)之間 的相位差的聲道間相位差(IPD)、基于單聲道信號(hào)指示至少兩個(gè)聲道信號(hào)之間的相位差如 何分布的整體相位差(OPD)等可被提供。
[0007] 運(yùn)里,為了對(duì)多聲道進(jìn)行編碼的目的,可擴(kuò)展參數(shù)立體聲技術(shù),即,多個(gè)單聲道或 立體聲信號(hào)可被分級(jí)地產(chǎn)生,用于每級(jí)下混合的各參數(shù)信息可被產(chǎn)生。針對(duì)單層的上混合, MPEG環(huán)繞聲技術(shù)例如可基于1到2 ( -到二,0TT)模塊和2-3 (二到STTT)模塊執(zhí)行編碼 的單聲道或立體聲信號(hào)到多個(gè)聲道的上混合。如注意到的并僅作為示例,可WW分級(jí)的方 式(例如,樹(shù)結(jié)構(gòu))執(zhí)行多個(gè)運(yùn)種模塊,W使5個(gè)或更多個(gè)輸入多信號(hào)可被最終下混合為單 個(gè)單聲道或立體聲信號(hào),然后被最終上混合為比編碼的單個(gè)單聲道或立體聲信號(hào)更多的多 信號(hào)。例如,五個(gè)或屯個(gè)多信號(hào)可被編碼器下混合為一個(gè)單聲道或立體聲信號(hào),并最終被解 碼器上混合回五個(gè)或屯個(gè)多信號(hào)。
[0008] 當(dāng)MPEG環(huán)繞聲編碼方案通過(guò)用參數(shù)表示多個(gè)聲道信號(hào)來(lái)對(duì)多個(gè)聲道信號(hào)進(jìn)行 編碼時(shí),即使比特率增加,多個(gè)聲道信號(hào)從各參數(shù)對(duì)所有原始信號(hào)不正確地解碼,即,各參 數(shù)可能對(duì)于從下混合的信號(hào)適當(dāng)?shù)亟獯a成上混合的多個(gè)聲道信號(hào),無(wú)法提供足夠正確的信 息。因此,本發(fā)明人發(fā)現(xiàn)了運(yùn)樣的期望:當(dāng)用參數(shù)表示多個(gè)聲道信號(hào)時(shí),將多個(gè)聲道信號(hào)解 碼成與原始信號(hào)接近的方法。
【發(fā)明內(nèi)容】
[0009]根據(jù)一個(gè)或多個(gè)實(shí)施例的一方面,可提供一種編碼設(shè)備,包括:參數(shù)編碼器,提取 與N個(gè)聲道信號(hào)的相位信息相關(guān)的一個(gè)或多個(gè)空間參數(shù),并對(duì)提取的一個(gè)或多個(gè)空間參數(shù) 進(jìn)行編碼;下混合單元,基于提取的一個(gè)或多個(gè)空間參數(shù)將N個(gè)聲道信號(hào)下混合成M個(gè)聲道 信號(hào);殘差信號(hào)編碼器,基于下混合的M個(gè)聲道信號(hào)來(lái)對(duì)與N個(gè)聲道信號(hào)相關(guān)的殘差信號(hào)進(jìn) 行編碼;聲道信號(hào)編碼器,對(duì)M個(gè)聲道信號(hào)進(jìn)行編碼;輸出器,輸出編碼的殘差信號(hào)和編碼 的M個(gè)聲道信號(hào)。
[0010]運(yùn)里,N可W等于2,M等于1。
[0011]殘差信號(hào)編碼器可提取殘差信號(hào)作為當(dāng)將N個(gè)聲道信號(hào)與基于提取的一個(gè)或多 個(gè)空間參數(shù)表示的一個(gè)或多個(gè)聲道信號(hào)進(jìn)行比較時(shí)所產(chǎn)生的誤差信號(hào)。
[0012]可通過(guò)多個(gè)二到一(TTO)下混合模塊進(jìn)行分級(jí)下混合來(lái)對(duì)至少5個(gè)聲道信號(hào)的多 聲道信號(hào)進(jìn)行編碼,所述編碼設(shè)備可包括:包括參數(shù)編碼器和下混合單元的所述多個(gè)TTO 混合模塊中的至少一個(gè),編碼設(shè)備輸出編碼的殘差信號(hào)和編碼的M個(gè)聲道信號(hào),W使輸出 的編碼的殘差信號(hào)和輸出的編碼的M個(gè)聲道信號(hào)可用于通過(guò)多次上混合來(lái)再現(xiàn)至少所述5 個(gè)聲道信號(hào)。
[0013]根據(jù)一個(gè)或多個(gè)實(shí)施例的一方面,可提供一種解碼設(shè)備,包括:聲道信號(hào)解碼器, 基于代數(shù)碼激勵(lì)線性預(yù)測(cè)(ACELP)、加權(quán)線性預(yù)測(cè)變換(wLPT)和高級(jí)音頻編碼(AAC)中的 至少一個(gè)從比特流中解碼出編碼的M個(gè)聲道信號(hào);參數(shù)解碼器,對(duì)編碼的M個(gè)聲道信號(hào)的至 少一個(gè)編碼的空間參數(shù)進(jìn)行解碼;相位信息估計(jì)單元,基于至少一個(gè)解碼的空間參數(shù)來(lái)估 計(jì)相位信息;殘差信號(hào)解碼器,對(duì)編碼的M個(gè)聲道信號(hào)的編碼的殘差信號(hào)進(jìn)行解碼;矩陣計(jì) 算器,基于估計(jì)的相位信息計(jì)算用于對(duì)解碼的M個(gè)聲道信號(hào)進(jìn)行上混合的上混合矩陣;上 混合單元,基于解碼的殘差信號(hào)和上混合矩陣來(lái)將解碼的M個(gè)聲道信號(hào)上混合為N個(gè)聲道 信號(hào)。
[0014]運(yùn)里,所述至少一個(gè)解碼的空間參數(shù)可包括聲道電平差(CLD)和聲道間相位差 (IPD)中的至少一個(gè),CLD指示基于N個(gè)聲道信號(hào)的能量等級(jí)的強(qiáng)度差,IPD指示N個(gè)聲道 信號(hào)之間的相位差,相位信息估計(jì)單元基于所述至少一個(gè)解碼的空間參數(shù)估計(jì)整體相位差 (OPD),OTO指示N個(gè)聲道信號(hào)之間的一個(gè)或多個(gè)相位差在解碼的M個(gè)聲道信號(hào)中的分布程 度。
[0015]殘差信號(hào)可W是基于N個(gè)聲道信號(hào)與基于所述至少一個(gè)空間參數(shù)而表示的一個(gè) 或多個(gè)聲道信號(hào)之間的比較而所產(chǎn)生的誤差信號(hào)。
[001引 運(yùn)里,N可W等于2,M等于1。
[0017] 可通過(guò)多個(gè)一到二(OTT)上混合模塊進(jìn)行分級(jí)上混合對(duì)至少5個(gè)聲道信號(hào)的多聲 道信號(hào)進(jìn)行解碼,所述解碼設(shè)備可包括:所述多少OTT上混合模塊中的至少一個(gè),包括上混 合單元,從而解碼的N個(gè)聲道信號(hào)可用于通過(guò)N個(gè)聲道信號(hào)的附加OTT上混合來(lái)再現(xiàn)所述 至少5個(gè)聲道信號(hào)。
[0018] 根據(jù)一個(gè)或多個(gè)實(shí)施例的一方面,可提供一種解碼設(shè)備,包括:聲道信號(hào)解碼器, 基于W下中的至少一個(gè)來(lái)對(duì)W運(yùn)動(dòng)圖像專(zhuān)家組語(yǔ)音和音頻聯(lián)合編碼器(MPEGUSAC)編碼的 編碼M個(gè)聲道信號(hào)進(jìn)行解碼:基于操作線性預(yù)測(cè)域(LPD)的代數(shù)碼激勵(lì)線性預(yù)測(cè)(ACELP)、 加權(quán)線性預(yù)測(cè)變換(wLPT)和基于頻域(FD)的高級(jí)音頻編碼(AAC);參數(shù)解碼器,對(duì)編碼的 M個(gè)聲道信號(hào)的一個(gè)或多個(gè)編碼的空間參數(shù)進(jìn)行解碼;相位信息估計(jì)單元,基于解碼的一 個(gè)或多個(gè)空間參數(shù)估計(jì)相位信息;殘差信號(hào)解碼器,對(duì)編碼的M個(gè)聲道信號(hào)的編碼的殘差 信號(hào)進(jìn)行解碼;矩陣計(jì)算器,基于估計(jì)的相位信息計(jì)算用于解碼的M個(gè)聲道信號(hào)的上混合 矩陣;上混合單元,基于解碼的殘差信號(hào)和上混合矩陣將解碼的M個(gè)聲道信號(hào)上混合成N個(gè) 聲道信號(hào)。
[0019] 根據(jù)一個(gè)或多個(gè)實(shí)施例的一方面,可提供一種編碼方法,包括:提取與N個(gè)聲道信 號(hào)的相位信息相關(guān)的一個(gè)或多個(gè)空間參數(shù),并對(duì)提取的一個(gè)或多個(gè)空間參數(shù)進(jìn)行編碼;基 于提取的一個(gè)或多個(gè)空間參數(shù)將N個(gè)聲道信號(hào)下混合成M聲道信號(hào);基于下混合的M個(gè)聲 道信號(hào)來(lái)對(duì)與N個(gè)聲道信號(hào)相關(guān)的殘差信號(hào)進(jìn)行編碼;對(duì)M個(gè)聲道信號(hào)編碼;輸出編碼的 殘差信號(hào)和編碼的M個(gè)聲道信號(hào)。
[0020] 運(yùn)里,N可W等于2,M可W等于1。
[0021] 對(duì)殘差信號(hào)進(jìn)行編碼的步驟可包括:提取殘差信號(hào)作為當(dāng)將N個(gè)聲道信號(hào)與通過(guò) 提取的一個(gè)或多個(gè)空間參數(shù)表示的一個(gè)或多個(gè)聲道信號(hào)進(jìn)行比較時(shí)所產(chǎn)生的誤差信號(hào)。
[0022] 可通過(guò)多個(gè)二到一(TTO)下混合模塊進(jìn)行分級(jí)下混合來(lái)對(duì)至少5個(gè)聲道信號(hào)的多 聲道信號(hào)進(jìn)行編碼,所述編碼設(shè)備包括:所述多個(gè)TTO下混合模塊中的至少一個(gè),執(zhí)行參數(shù) 提取和N個(gè)聲道信號(hào)到M個(gè)聲道信號(hào)的下混合,輸出步驟還包括:輸出編碼的殘差信號(hào)和編 碼的M個(gè)聲道信號(hào),W使輸出的編碼的殘差信號(hào)和輸出的編碼的M個(gè)聲道信號(hào)可用于通過(guò) 多次上混合來(lái)再現(xiàn)所述至少5個(gè)聲道信號(hào)。
[0023] 根據(jù)一個(gè)或多個(gè)實(shí)施例的一方面,可提供一種解碼方法,包括:從比特流解碼出編 碼的M個(gè)聲道信號(hào);對(duì)編碼的M個(gè)聲道信號(hào)的至少一個(gè)編碼的空間參數(shù)進(jìn)行解碼;基于至 少一個(gè)解碼的空間參數(shù)來(lái)估計(jì)相位信息;對(duì)編碼的M個(gè)聲道信號(hào)的編碼的殘差信號(hào)進(jìn)行解 碼;基于估計(jì)的相位信息來(lái)計(jì)算用于對(duì)解碼的M個(gè)聲道信號(hào)進(jìn)行上混合的上混合矩陣;基 于解碼的殘差信號(hào)和上混合矩陣來(lái)將解碼的M個(gè)聲道信號(hào)上混合成N個(gè)聲道信號(hào)。
[0024] 解碼的至少一個(gè)空間參數(shù)可包括聲道電平差(CLD)和聲道間相位差(IPD)中的至 少一個(gè),CLD指示基于N個(gè)聲道信號(hào)的能量等級(jí)的強(qiáng)度差,IPD指示N個(gè)聲道信號(hào)之間的相 位差,估計(jì)可步驟包括:基于解碼的至少一個(gè)空間參數(shù)估計(jì)整體相位差(OPD),oro指示N個(gè) 聲道信號(hào)之間的一個(gè)或多個(gè)相位差在解碼的M個(gè)聲道信號(hào)中的分布程度。