專利名稱:多聲道音頻擴(kuò)展支持的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及多聲道音頻編碼和多聲道音頻編碼中的多聲道音頻擴(kuò)展。特別的是,本發(fā)明涉及一種在多聲道音頻編碼系統(tǒng)的編碼端支持多聲道音頻擴(kuò)展的方法、一種在多聲道音頻編碼系統(tǒng)的解碼端支持多聲道音頻擴(kuò)展的方法、一種多聲道音頻編碼器和一種用于多聲道音頻編碼器的多聲道擴(kuò)展編碼器、一種多聲道音頻解碼器和一種用于多聲道音頻解碼器的多聲道擴(kuò)展解碼器以及一種多聲道音頻編碼系統(tǒng)。
背景技術(shù):
音頻編碼系統(tǒng)在本領(lǐng)域的范圍內(nèi)是眾所周知的。它們特別用于發(fā)送或存儲音頻信號。
圖1表示音頻編碼系統(tǒng)的基本結(jié)構(gòu),其用于音頻信號的傳輸。所述音頻編碼系統(tǒng)包括發(fā)送端的編碼器10和接收端的解碼器11。將要發(fā)送的音頻信號提供給編碼器10。所述編碼器負(fù)責(zé)將輸入的音頻數(shù)據(jù)率轉(zhuǎn)換成不違反傳輸信道的帶寬條件的比特率值。理想條件下,編碼器10在該編碼過程中只丟棄音頻信號中不相關(guān)的信息。然后音頻編碼系統(tǒng)的發(fā)送端發(fā)送編碼后的音頻信號,并在該音頻編碼系統(tǒng)的接收端進(jìn)行接收。接收端的解碼器11將所述編碼過程反向執(zhí)行以獲得具有很少或無音頻損失的解碼音頻信號。
可替換的實(shí)施方案是,圖1的音頻編碼系統(tǒng)可用于存檔音頻數(shù)據(jù)。在這種情況下,將編碼器10提供的編碼音頻數(shù)據(jù)存儲在一些存儲單元中,解碼器11對從該存儲單元中檢索出來的音頻數(shù)據(jù)進(jìn)行解碼。在該可替換的實(shí)施方案中,目的是讓編碼器實(shí)現(xiàn)一個(gè)盡可能低的比特率,以節(jié)省存儲空間。
要進(jìn)行處理的原始音頻信號可以是單聲道音頻信號或者是包含至少第一和第二聲道信號的多聲道音頻信號。多聲道音頻信號的一個(gè)例子是立體聲音頻信號,其由左聲道信號和右聲道信號組成。
根據(jù)允許的比特率,可以對立體聲音頻信號使用不同的編碼方案。例如可以對左聲道和右聲道信號分別進(jìn)行獨(dú)立編碼。但是一般來說,左聲道和右聲道信號之間存在相關(guān)性,并且最先進(jìn)的編碼方案都利用這種相關(guān)性來達(dá)到進(jìn)一步減小比特率的目的。
尤其適合減小比特率的是低比特率立體聲擴(kuò)展方法。在立體聲擴(kuò)展方法中,將立體聲音頻信號編碼成高比特率單聲道信號,其和一些為立體聲擴(kuò)展而預(yù)備的側(cè)向信息一起由編碼器提供。在解碼器中,然后利用側(cè)向信息在立體聲擴(kuò)展中從高比特率單聲道信號中重建立體聲音頻信號。所述側(cè)向信息通常只占整個(gè)比特率的幾kbps。
如果一種立體聲擴(kuò)展方案旨在以低比特率進(jìn)行操作,就不能在解碼過程中獲得原始立體聲音頻信號的精確復(fù)制。為了如此要求地接近原始立體聲音頻信號,就需要一種有效的編碼模型。
最常用的立體聲音頻編碼方案是中間(MS)立體聲和強(qiáng)度立體聲(IS)。
在MS立體聲中,將左聲道和右聲道信號轉(zhuǎn)換成和信號和差信號,例如在J.D.Johnston和A.J.Ferreira所著的“和-差分立體聲轉(zhuǎn)換編碼(Sum-differencestereo transform coding)”,1992年的ICASSP-92會議記錄,第569-572頁中所述。為了獲得最大的編碼效率,以頻率和時(shí)間相關(guān)方式進(jìn)行這種變換。MS立體聲特別有利于高質(zhì)量、高比特率的立體聲編碼。
在實(shí)現(xiàn)低比特率的嘗試中,已經(jīng)將IS和所述MS編碼結(jié)合使用,其中IS構(gòu)成立體聲擴(kuò)展方案。在IS編碼中,只將頻譜的一部分編碼成單聲道模式,通過另外給左聲道和右聲道提供不同的比例系數(shù)來重建立體聲音頻信號,正如文件US5,539,829和US5,606,618中所述那樣。
另外還提出了兩種超低比特率立體聲擴(kuò)展方案,即雙聲道信號編碼(Binaural Cue Coding,BCC)和帶寬擴(kuò)展(Bandwidth Extension,BWE)。在BCC中,如F Baumgarte和C.Faller所著的“為什么雙聲道信號編碼比強(qiáng)度立體聲編碼好(Why Binaural Cue Coding is Better than Intensity Stereo Coding)”(AES第112次會議,2002年5月10日-13日,預(yù)印本5575)中所述,用IS來對整個(gè)頻譜進(jìn)行編碼。在BWE編碼中,如在ISO/IEC JTC1/SC29/WG11(MPEG-4)中的“ISO/IEC 14496-32001/FPDAM 1文本,帶寬擴(kuò)展”(N5203(第62次MPEG會議輸出文件),2002年10月)中所述,帶寬擴(kuò)展用于將單聲道信號擴(kuò)展成立體聲信號。
而且,文件US6,016,473提出一種對代表聲場的多個(gè)音頻流進(jìn)行編碼的低比特率空間編碼系統(tǒng)。在編碼器端,將所述音頻流分成多個(gè)子帶信號,分別代表相應(yīng)的子頻帶。然后,產(chǎn)生一個(gè)表示這些子帶信號組合的復(fù)合信號。另外,產(chǎn)生一個(gè)引導(dǎo)控制信號,其指示子帶中聲場的主要方向,例如以加權(quán)矢量的形式。在解碼器端,根據(jù)所述復(fù)合信號和相關(guān)的引導(dǎo)控制信號在高達(dá)兩個(gè)聲道中生成音頻流。
發(fā)明內(nèi)容
本發(fā)明的一個(gè)目的是根據(jù)側(cè)向信息以有效地方式來支持單聲道音頻信號到多聲道音頻信號的擴(kuò)展。
對于多聲道音頻編碼系統(tǒng)的編碼端來說,提出用于支持多聲道音頻擴(kuò)展的第一種方法,其包括將多聲道音頻信號的第一聲道信號轉(zhuǎn)換到頻域,產(chǎn)生頻譜的第一聲道信號;并且將該多聲道音頻信號的第二聲道信號轉(zhuǎn)換到頻域,產(chǎn)生頻譜的第二聲道信號。上述提出的方法還包括為多個(gè)相鄰頻帶中的每一個(gè)頻帶確定是頻譜第一聲道信號、頻譜第二聲道信號還是沒有頻譜聲道信號在相應(yīng)的頻帶中占據(jù)支配地位,并為每一個(gè)頻帶提供相應(yīng)的狀態(tài)信息。
另外,提出一種多聲道音頻編碼器和用于多聲道音頻編碼器的一種擴(kuò)展編碼器,它們包括用于實(shí)現(xiàn)上述第一種方法的裝置。
對于多聲道音頻編碼系統(tǒng)的解碼端來說,提出用于支持多聲道音頻擴(kuò)展的第二方法,其包括將接收到的單聲道音頻信號轉(zhuǎn)換到頻域,產(chǎn)生頻譜的單聲道音頻信號。上述提出的第二方法還包括通過在多個(gè)相鄰頻帶中的每一個(gè)頻帶上為頻譜第一聲道信號和頻譜第二聲道信號中的每一個(gè),根據(jù)至少一個(gè)增益值和接收到的狀態(tài)信息對頻譜單聲道音頻信號分別加權(quán),從頻譜單聲道音頻信號中產(chǎn)生頻譜第一聲道信號和頻譜第二聲道信號。所述狀態(tài)信息為每個(gè)頻帶指示是否是頻譜第一聲道信號、頻譜第二聲道信號還是沒有頻譜聲道信號在相應(yīng)的頻帶中占據(jù)支配地位。
此外,提出一種多聲道音頻解碼器和用于多聲道音頻解碼器的一種擴(kuò)展解碼器,它們包括用于實(shí)現(xiàn)上述第二方法的裝置。
最后,提出一種多聲道音頻編碼系統(tǒng),其包括上述的多聲道音頻編碼器和多聲道音頻解碼器。
本發(fā)明是根據(jù)基于頻帶的立體聲擴(kuò)展比較有效這一考慮而產(chǎn)生的。本發(fā)明還根據(jù)表示哪種聲道信號在相應(yīng)頻帶中占據(jù)支配地位的狀態(tài)信息,如果有的話,該狀態(tài)信息尤其適合用作將單聲道音頻信號擴(kuò)展成多聲道音頻信號的側(cè)向信息這一想法而產(chǎn)生。可以在接收端考慮表示用于重建原始立體聲信號的聲道信號的特定支配地位程度的增益信息,來估計(jì)所述狀態(tài)信息。
本發(fā)明提供已知解決方案的替換方案。
本發(fā)明的優(yōu)點(diǎn)在于它支持有效的多聲道音頻編碼,同時(shí)其與已知的多聲道擴(kuò)展解決方案相比需要較低的計(jì)算復(fù)雜性。
同樣與文件US6,016,473的解決方案相比,所述文件更多地針對環(huán)繞編碼而不是立體聲或其它多聲道音頻編碼,這樣可以期望具有更低的比特率和較少的計(jì)算量。
根據(jù)從屬權(quán)利要求,本發(fā)明的優(yōu)選實(shí)施例會更清楚。
在優(yōu)選實(shí)施例中,如果確定出頻譜第一聲道信號和頻譜第二聲道信號中的一個(gè)在至少一個(gè)頻帶中占據(jù)支配地位,編碼端就計(jì)算并提供至少一個(gè)表示該支配地位程度的增益值?;蛘?,可以預(yù)定至少一個(gè)增益值并將其存儲在接收端。
在將哪個(gè)狀態(tài)信息分配給某個(gè)頻帶的決定中,一種雙聲道心理聲學(xué)模型適合于提供有用的幫助。由于心理聲學(xué)模型一般需要較高的計(jì)算資源,所以它們在計(jì)算資源不是非常限制的設(shè)備中非常有效。
在顯示給用戶之前,必須將解碼端產(chǎn)生的頻譜第一聲道信號和頻譜第二聲道信號轉(zhuǎn)換到時(shí)域。
在第一優(yōu)選實(shí)施例中,在解碼端將產(chǎn)生的頻譜第一和第二聲道信號直接轉(zhuǎn)換到時(shí)域,產(chǎn)生重建多聲道音頻信號的第一聲道信號和第二聲道信號。
然而,這種實(shí)施例常以較低的比特率進(jìn)行操作,例如低于4kbps,并且在可采用較高立體聲擴(kuò)展比特率的應(yīng)用中,這種實(shí)施例不能標(biāo)度質(zhì)量。
采用第二優(yōu)選實(shí)施例,可以得到一種適于標(biāo)度質(zhì)量和比特率的改進(jìn)的立體聲擴(kuò)展。在第二優(yōu)選實(shí)施例中,在編碼端產(chǎn)生一附加加強(qiáng)信息,除了根據(jù)產(chǎn)生的頻譜第一和第二聲道信號來重建原始多聲道音頻信號外,在解碼端還使用所述附加加強(qiáng)信息。
為了在編碼端產(chǎn)生加強(qiáng)信息,不僅在解碼端重建頻譜第一聲道信號和頻譜第二聲道信號,還在編碼端根據(jù)狀態(tài)信息來重建頻譜第一聲道信號和頻譜第二聲道信號。然后產(chǎn)生所述加強(qiáng)信息以便對于那些頻帶(狀態(tài)信息表示聲道信號中的其中之一處于支配地位)的每個(gè)頻譜抽樣,所述加強(qiáng)信息一方面反映重建頻譜第一和第二聲道信號之間的每個(gè)抽樣間區(qū)別,另一方面反映原始頻譜第一和第二聲道信號之間的每個(gè)抽樣間區(qū)別。要注意的是,對某些抽樣反映的區(qū)別可能存在于由于該區(qū)別太微小而不會被考慮的暗示中。
第二優(yōu)選實(shí)施例僅適當(dāng)改善了第一實(shí)施例的附加復(fù)雜性,并提供了本發(fā)明的一種更寬的操作范圍。第二優(yōu)選實(shí)施例的特殊優(yōu)點(diǎn)在于,它利用已經(jīng)產(chǎn)生的立體聲擴(kuò)展信息來獲取對原始立體聲音頻圖像的更精確的近似,而不需要產(chǎn)生額外的側(cè)向信息。第二優(yōu)選實(shí)施例的特殊優(yōu)點(diǎn)還在于它具有可量測性,即解碼端能夠依據(jù)自己的資源,例如依據(jù)其存儲器或其處理能力來決定是否僅對基本立體聲擴(kuò)展比特流進(jìn)行解碼還是除了加強(qiáng)信息以外都進(jìn)行解碼。為了讓編碼端將附加加強(qiáng)信息的數(shù)量調(diào)整成有效的比特率,編碼端優(yōu)選提供關(guān)于立體聲擴(kuò)展信息所使用的比特率信息,即至少是狀態(tài)信息和附加加強(qiáng)信息。
可以在編碼端和解碼端或者擴(kuò)展編碼端以及解碼端中分別處理所述加強(qiáng)信息,也可以在專用附加元件中處理。
多聲道音頻信號具體的可以是具有左聲道信號和右聲道信號的立體聲音頻信號。在多聲道的情況下,對成對的聲道執(zhí)行上述提出的編碼。
最好在中頻和高頻執(zhí)行本發(fā)明的多聲道音頻擴(kuò)展方案,其中,空間聽力主要依靠幅度值差。在低頻上,最好另外實(shí)現(xiàn)細(xì)微調(diào)整。尤其是在該細(xì)微調(diào)整中可以限制幅度值修改增益的動(dòng)態(tài)范圍。
可以采用不同類型的變換方式來實(shí)現(xiàn)從時(shí)域到頻域以及從頻域到時(shí)域的變換,例如采用改進(jìn)的離散余弦變換(MDCT)和反向MDCT(IMDCT),采用快速傅立葉變換(FFT)和反向FFT(IFFT)或者采用離散余弦變換(DCT)和反向DCT(IDCT)。
本發(fā)明可以采用各種編碼方案,具體的,但不是窮舉的,采用自適應(yīng)多比率寬帶擴(kuò)展(AMR-WB+),其適于高音頻質(zhì)量。
本發(fā)明還可以用軟件或?qū)S糜布桨竵韺?shí)現(xiàn),由于多聲道音頻擴(kuò)展是編碼系統(tǒng)的一部分,所以最好用與整個(gè)編碼系統(tǒng)相同的方式來實(shí)現(xiàn)。
本發(fā)明可專用于存儲和傳輸,如從移動(dòng)終端到移動(dòng)終端。
附圖描述通過下面結(jié)合附圖對本發(fā)明的示意性實(shí)施例的詳細(xì)描述,本發(fā)明的其它目的和特征將會變得更清楚。
圖1是表示音頻編碼系統(tǒng)常用結(jié)構(gòu)的框圖;圖2是實(shí)現(xiàn)了本發(fā)明第一實(shí)施例的立體聲音頻編碼系統(tǒng)的高級框圖;圖3表示本發(fā)明第一實(shí)施例中如圖2所示的立體聲音頻編碼系統(tǒng)發(fā)送側(cè)的處理過程;圖4表示本發(fā)明第一實(shí)施例中如圖2所示的立體聲音頻編碼系統(tǒng)接收側(cè)的處理過程;圖5是本發(fā)明第一實(shí)施例的第一可能增補(bǔ)方案中采用的示意性霍夫曼(Huffman)表;圖6是表示本發(fā)明第一實(shí)施例的第二可能增補(bǔ)方案的流程圖;圖7是實(shí)現(xiàn)了本發(fā)明第二實(shí)施例的立體聲音頻編碼系統(tǒng)的高級框圖;圖8表示圖7所示的本發(fā)明第二實(shí)施例中的立體聲音頻編碼系統(tǒng)發(fā)送側(cè)的處理過程;圖9表示在圖8所示的處理過程中使用的量化循環(huán)的流程圖;圖10表示在圖8所示的處理過程中使用的代碼簿索引分配循環(huán)的流程圖;圖11表示圖7所示的本發(fā)明第二實(shí)施例中的立體聲音頻編碼系統(tǒng)接收側(cè)的處理過程。
具體實(shí)施例上面已經(jīng)對圖1進(jìn)行了說明。
現(xiàn)在將參照圖2-6來描述本發(fā)明的第一實(shí)施例。
圖2表示立體聲音頻編碼系統(tǒng)的常用結(jié)構(gòu),其中可以實(shí)現(xiàn)本發(fā)明。該立體聲音頻編碼系統(tǒng)可用于發(fā)送由左聲道信號和右聲道信號組成的立體聲音頻信號。
圖2所示的立體聲音頻編碼系統(tǒng)包括立體聲編碼器20和立體聲解碼器21。立體聲編碼器20對立體聲音頻信號進(jìn)行編碼并將其發(fā)送到立體聲解碼器21,立體聲解碼器21接收所述編碼信號,對其進(jìn)行解碼并將其還原成立體聲音頻信號。
或者,也可以將立體聲編碼器20提供的編碼后的立體聲音頻信號存儲在存儲單元中,立體聲解碼器21可以從所述存儲單元中提取上述信號。
立體聲編碼器20包括相加點(diǎn)22,它經(jīng)比例單元23連接到AMR-WB+單聲道編碼器元件24。所述AMR-WB+單聲道編碼器元件24又連接到AMR-WB+比特流多路復(fù)用器(MUX)25。另外,所述立體聲編碼器20包括立體聲擴(kuò)展編碼器26,其同樣連接到AMR-WB+比特流多路復(fù)用器25。
立體聲解碼器21包括AMR-WB+比特流多路分解器(DEMUX)27,其一方面與AMR-WB+單聲道解碼器元件28連接,另一方面與立體聲擴(kuò)展解碼器29相連。所述AMR-WB+單聲道解碼器元件28還與立體聲擴(kuò)展解碼器29相連。
當(dāng)要發(fā)送立體聲音頻信號時(shí),將立體聲音頻信號的左聲道信號L和右聲道信號R提供給立體聲編碼器20。假設(shè)左聲道信號L和右聲道信號R以幀的形式排列。
左聲道和右聲道信號L、R通過相加點(diǎn)22相加并在比例單元23中乘以系數(shù)0.5以形成單聲道音頻信號M。然后AMR-WB+單聲道編碼器元件24負(fù)責(zé)用公知的方式對所述單聲道音頻信號進(jìn)行編碼以獲得單聲道信號比特流。
另外還在立體聲擴(kuò)展編碼器26中對提供給立體聲編碼器20的左聲道和右聲道信號L、R進(jìn)行處理,以便獲得包含用于立體聲擴(kuò)展的側(cè)向信息的比特流。
由AMR-WB+單聲道編碼器元件24和立體聲擴(kuò)展編碼器26提供的比特流被AMR-WB+比特流多路復(fù)用器(MUX)25進(jìn)行多路復(fù)用以便傳輸。
立體聲解碼器21接收發(fā)送的多路復(fù)用的比特流并通過AMR-WB+比特流多路分解器(DEMUX)27將其再次多路分解成單聲道信號比特流和側(cè)向信息比特流。將單聲道信號比特流傳送到AMR-WB+單聲道解碼器元件28,將側(cè)向信息比特流傳送到立體聲擴(kuò)展解碼器29。
然后在AMR-WB+單聲道解碼器元件28中用公知的方式對單聲道信號比特流進(jìn)行解碼。將生成的單聲道音頻信號M提供給立體聲擴(kuò)展解碼器29。立體聲擴(kuò)展解碼器29對包含用于立體聲擴(kuò)展的側(cè)向信息的比特流進(jìn)行解碼并根據(jù)獲取的側(cè)向信息將接收的單聲道音頻信號M擴(kuò)展成左聲道信號L和右聲道信號R。然后通過立體聲解碼器21將左聲道和右聲道信號L、R作為重建的立體聲音頻信號進(jìn)行輸出。
下面將具體說明根據(jù)本發(fā)明的實(shí)施例來設(shè)計(jì)立體聲擴(kuò)展編碼器26和立體聲擴(kuò)展解碼器29。
圖3中詳細(xì)描述了立體聲擴(kuò)展編碼器26中的處理過程。
立體聲擴(kuò)展編碼器26中的處理過程包括三個(gè)階段。在第一階段中,即圖3的左側(cè),按照每幀來處理信號。在第二階段中,即圖3的中間,按照每個(gè)頻帶來處理信號。在第三階段,即圖3的右側(cè),又按照每幀來處理信號。在每個(gè)階段,表示出了各種處理部分30-38。
在第一階段中,MDCT部分30利用基于幀的MDCT將接收到的左聲道信號L轉(zhuǎn)換到頻域,生成頻譜聲道信號LMDCT。同時(shí),MDCT部分31利用基于幀的MDCT將接收到的右聲道信號R轉(zhuǎn)換到頻域,生成頻譜聲道信號RMDCT。有關(guān)MDCT的內(nèi)容已經(jīng)在一些文件中詳細(xì)描述過,例如由J.P.Princen、A.B.Bradley編寫的“基于時(shí)域失真消除的分析/合成濾波器組設(shè)計(jì)”(Analysis/synthesis filter bank design bansed on time domain aliasing cancellation)(IEEE傳輸語音、話音和信號處理,1986年10月第5期,第ASSP-34卷,1153-1161頁)以及S.Shlien編寫的“調(diào)制重疊轉(zhuǎn)換,其時(shí)間變動(dòng)形式和其在音頻編碼標(biāo)準(zhǔn)上的應(yīng)用”(The modulated lapped transform,its time-varying forms,and its applications to audio coding standards)(IEEE傳輸語音、和音頻處理,1997年7月第4期,第5卷,359-366頁)。
在第二階段中,在幾個(gè)相鄰頻帶的當(dāng)前幀內(nèi)處理頻譜聲道信號LMDCT和RMDCT。所述頻帶跟隨著臨界帶的邊界,正如E.Zwicker和H.Fastl編寫的“心理聲學(xué),事實(shí)和模型”(Psychoacoustics,F(xiàn)acts and Models)(Springer-Verlag,1990年)中所述的那樣。例如,對于抽樣率為24kHz的750Hz到6kHz的中頻編碼來說,numTotalBands為27的頻帶總數(shù)的頻帶抽樣中的寬度IS WidthLenBuf[]如下所述IS_WidthLenBuf[]={3,3,3,3,3,3,3,4,4,5,5,5,6,6,7,7,8,9,9,10,11,14,14,15,15,17,18}首先,處理部分32為頻譜聲道信號LMDCT和RMDCT的每個(gè)頻帶計(jì)算聲道加權(quán),以便確定原始立體聲音頻信號的左聲道和右聲道信號L和R在每個(gè)頻帶的相應(yīng)的影響。
根據(jù)下面的方程式計(jì)算每個(gè)頻帶的兩個(gè)聲道加權(quán)gL(fband)=ELEL+ERgR(fband)=EREL+ERfband=0,...,numTotalBands-1---(1)]]>
其中EL=Σi=0IS_WidthLenBuf[fband]-1LMDCT(n+i)2]]>ER=Σi=0IS_WidthLenBuf[fband]-1RMDCT(n+i)2]]>其中fband是與單獨(dú)考慮的頻帶相關(guān)的數(shù)量,其中n是頻譜抽樣中到頻段fband的開始位置的偏移量。也就是說,中間值EL和ER表示在相應(yīng)頻帶和相應(yīng)頻譜聲道信號中每個(gè)頻譜抽樣的平方和。
在后續(xù)的處理部分33中,將狀態(tài)LEFT、RIGHT和CENTER中的一個(gè)分配給每個(gè)頻帶。LEFT狀態(tài)表示在相應(yīng)頻帶中左聲道信號占支配地位,RIGHT狀態(tài)表示在相應(yīng)頻帶中右聲道信號占支配地位,CENTER狀態(tài)表示在相應(yīng)頻帶中單聲道音頻信號占支配地位。通過為每個(gè)頻帶生成的相應(yīng)狀態(tài)標(biāo)記IS_flag(fband)來表示所分配的狀態(tài)。
具體來說根據(jù)下面的方程式來生成所述狀態(tài)標(biāo)記 其中A=gL(fband)>gR(fband)B=gR(fband)>gL(fband)gLratio=gL(fband)/gR(fband)gRratio=gR(fband)/gL(fband)方程式(2)中的門限值參數(shù)決定立體聲圖像重建的好壞。在當(dāng)前實(shí)施例中,門限值參數(shù)的值設(shè)置為1.5。所以,如果其中一個(gè)頻譜聲道的加權(quán)值沒有超過相應(yīng)其它頻譜聲道加權(quán)值的50%,狀態(tài)標(biāo)記就表示為CENTER狀態(tài)。
在狀態(tài)標(biāo)記表示為LEFT狀態(tài)或RIGHT狀態(tài)的情況下,還要另外在后續(xù)處理部分34中計(jì)算電平修改增益。所述電平修改增益允許在處理單聲道音頻信號M時(shí)在頻帶內(nèi)重建立體聲音頻信號。
根據(jù)下面的方程式為每個(gè)頻帶計(jì)算電平修改增益gLR(fband)
在第三階段中,進(jìn)一步在幀的基礎(chǔ)上對生成的電平修改增益gLR(fband)和生成的狀態(tài)標(biāo)記IS_flag(fband)進(jìn)行處理以便發(fā)送。
可以為每個(gè)頻帶發(fā)送電平修改增益,或者每幀僅發(fā)送一次。如果僅僅給所有的頻帶都發(fā)送一個(gè)公共增益值,那么就在處理部分35中根據(jù)下面的方程式為每個(gè)幀計(jì)算公共電平修改增益gLR_averagegLR_average=1N·Σi=0numTotalBands-1gLR(i)---(4)]]>其中 所以,公共電平修改增益gLR_average構(gòu)成了與不等于0的電平修改增益gLR(fband)相關(guān)的所有頻帶的平均值。
然后處理部分36利用分級器或最好是矢量量化技術(shù)來對公共電平修改增益gLR_average或指定的電平修改增益gLR(fbana)進(jìn)行量化。將量化后的增益或增益值編碼成比特序列并將其作為側(cè)向信息比特流的第一部分提供給圖2所示的立體聲編碼器20的AMR-WB+比特流多路復(fù)用器25。在該實(shí)施例中,使用5比特對所述增益進(jìn)行編碼,但是這個(gè)值是可以根據(jù)要把增益大致量化成多大而改變的。
為了對狀態(tài)標(biāo)記進(jìn)行編碼以便發(fā)送,在處理部分37中為每個(gè)幀選擇一種編碼方案以便在取得最大效率的同時(shí)能將比特?fù)p耗降到最低。
具體來說,定義了三種可選的編碼方案。所述編碼方案表示在幀內(nèi)出現(xiàn)最頻繁的狀態(tài),并且根據(jù)下面的方程式來選擇編碼方案 其中codingScheme={CENTER,LEFT,RIGHT}所以,在幀內(nèi)CENTER狀態(tài)出現(xiàn)最頻繁的情況下選擇CENTER編碼方案,在幀內(nèi)LEFT狀態(tài)出現(xiàn)最頻繁的情況下選擇LEFT編碼方案,在幀內(nèi)RIGHT狀態(tài)出現(xiàn)最頻繁的情況下選擇RIGHT編碼方案。選定的編碼方案本身用2比特來進(jìn)行編碼。
處理部分37根據(jù)在處理部分36中選定的編碼方案來對狀態(tài)標(biāo)記進(jìn)行編碼。
在每個(gè)編碼方案中,在相應(yīng)第一比特對出現(xiàn)最頻繁的狀態(tài)進(jìn)行編碼,而在最后第二個(gè)比特上對其它兩種狀態(tài)進(jìn)行編碼。
在選定CENTER編碼方案并且將CENTER狀態(tài)分配給指定頻帶的情況下,將“1”提供給指定頻帶作為第一比特,否則將“0”提供給指定頻帶作為第一比特。在后一種情況下,如果是將LEFT狀態(tài)分配給該指定頻帶,就提供“0”作為第二比特,如果是將RIGHT狀態(tài)分配給該指定頻帶,就提供“1”作為第二比特。
在選定LEFT編碼方案并且將LEFT狀態(tài)分配給指定頻帶的情況下,將“1”分配給指定頻帶作為第一比特,否則提供“0”作為第一比特。在后一種情況下,如果是將RIGHT狀態(tài)分配給該指定頻帶,就提供“0”作為第二比特,如果是將CENTER狀態(tài)分配給該指定頻帶,就提供“1”作為第二比特。
最后,在選定RIGHT編碼方案并且將RIGHT狀態(tài)分配給指定頻帶的情況下,將“1”提供給該指定頻帶作為第一比特,否則提供“0”作為第一比特。在后一種情況下,如果是將CENTER狀態(tài)分配給該指定頻帶,就提供“0”作為第二比特,如果是將LEFT狀態(tài)分配給該指定頻帶,就提供“1”作為第二比特。
所有頻帶的編碼方案和編碼狀態(tài)標(biāo)記的2-比特指示作為側(cè)向信息比特流的第二部分提供給圖2所示的立體聲編碼器20的AMR-WB+比特流多路復(fù)用器25。
AMR-WB+比特流多路復(fù)用器25對接收到的側(cè)向信息比特流與單聲道信號比特流進(jìn)行多路復(fù)用以便傳輸,正如上面參照圖2所描述的那樣。
通過圖2的立體聲解碼器21接收發(fā)送的信號并通過AMR-WB+比特流多路分解器27和AMR-WB+單聲道解碼器元件28處理它,如上所述。
圖4詳細(xì)描述了圖2所示的立體聲解碼器21的立體聲擴(kuò)展解碼器29的處理過程。圖4是立體聲擴(kuò)展解碼器29的示意性框圖。
立體聲擴(kuò)展解碼器29包括延時(shí)部分40,其經(jīng)MDCT部分41連接到加權(quán)部分42。立體聲擴(kuò)展解碼器29還包括增益提取部分43和IS_flag提取部分44,它們的輸出與加權(quán)部分42的輸入相連接。加權(quán)部分42有兩個(gè)輸出,每個(gè)都與另一個(gè)IMDCT部分45、46的輸入相連。對后面的兩種連接沒有進(jìn)行明確的說明,但是用相應(yīng)的箭頭表示出來了。
首先將圖2所示的立體聲解碼器21的AMR-WB+單聲道解碼器元件28輸出的單聲道音頻信號M饋送到延時(shí)部分40,這是因?yàn)槿绻獯a后的單聲道音頻信號并不是象編碼器輸入信號那樣按時(shí)間順序排列的話,就必須對單聲道音頻信號M進(jìn)行延時(shí)。
然后,MDCT部分41利用基于幀的MDCT將單聲道音頻信號轉(zhuǎn)換到頻域。將生成的頻譜單聲道音頻信號MMDCT饋送到加權(quán)部分42。
同時(shí),圖2和圖4中所示的AMR-WB+比特流多路分解器27向增益提取部分43提供側(cè)向信息比特流的第一部分,向IS_flag提取部分44提供側(cè)向信息比特流的第二部分。
增益提取部分43為每個(gè)幀從側(cè)向信息比特流的第一部分中提取公共電平修改增益或者指定的電平修改增益,并將提取的增益進(jìn)行解碼。將解碼后的增益gLR_average或解碼后的增益gLR(fband)提供被加權(quán)部分42。
IS_flag提取部分44從側(cè)向信息比特流的第二部分中對每幀提取和解碼編碼方案和狀態(tài)標(biāo)記IS_flag(fband)的指示。
對狀態(tài)標(biāo)記執(zhí)行解碼處理以便對于每個(gè)頻帶來說都可以首先讀取一個(gè)比特。在該比特等于“1”的情況下,將指示編碼方案所表示的狀態(tài)分配給相應(yīng)的頻帶。在第一個(gè)比特等于“0”的情況下,讀取第二個(gè)比特并且根據(jù)該第二個(gè)比特將正確的狀態(tài)分配給相應(yīng)頻帶。
如果指示的是CENTER編碼方案,就根據(jù)最后一個(gè)讀取的比特來設(shè)置狀態(tài)標(biāo)記IS_flag(fband)=CENTER,BsGetBits(1)=1LEFT,BsGetBits(2)=0RIGHT,BsGetBits(2)=1---(6)]]>如果指示的是LEFT編碼方案,就根據(jù)最后一個(gè)讀取的比特來設(shè)置狀態(tài)標(biāo)記IS_flag(fband)=CENTER,BsGetBits(2)=1LEFT,BsGetBits(1)=1RIGHT,BsGetBits(2)=0---(7)]]>最后,如果指示的是RIGHT編碼方案,就根據(jù)最后一個(gè)讀取的比特來設(shè)置狀態(tài)標(biāo)記
IS_flag(fband)=CENTER,BsGetBits(2)=0LEFT,BsGetBits(2)=1RIGHT,BsGetBits(1)=1---(8)]]>在上述方程式(6)-(8)中,函數(shù)BsGetBits(x)從輸入比特流緩沖器中讀取x個(gè)比特。對每個(gè)頻帶來說,將生成的狀態(tài)標(biāo)記IS_flag(fband)提供給加權(quán)部分42。
根據(jù)接收到的電平修改增益和接收到的狀態(tài)標(biāo)記,在加權(quán)部分42中將頻譜單聲道音頻信號MMDCT擴(kuò)展成頻譜左聲道和右聲道信號。
根據(jù)下面的方程式從頻譜單聲道音頻信號MMDCT中獲得頻譜左聲道和右聲道信號 方程式(9)和(10)是在頻帶基礎(chǔ)上進(jìn)行操作的。對于與fband數(shù)量相關(guān)的每個(gè)頻帶來說,相應(yīng)狀態(tài)標(biāo)記IS_flag向加權(quán)部分42指示頻帶內(nèi)的頻譜單聲道音頻信號抽樣MMDCT(n)主要是來源于原始左聲道還是原始右聲道信號。電平修改增益gLR(fband)表示原始立體聲音頻信號中的左聲道或右聲道信號的支配程度,并用于在每個(gè)頻帶內(nèi)重建立體聲圖像。為此,將電平修改增益乘以頻譜單聲道音頻信號抽樣來獲得處于支配地位的聲道信號的抽樣,并且將電平修改增益的倒數(shù)值乘以頻譜單聲道音頻信號抽樣來獲得相應(yīng)其它聲道的抽樣。要注意的是,所述倒數(shù)值也可以加權(quán)一個(gè)固定的或可變的值。方程式(9)和(10)中的倒數(shù)值可以用例如1/gLR(fband)*gLR(fband)]]>來替換。在沒有一個(gè)聲道的信號在指定頻帶內(nèi)占支配地位的情況下,直接將該頻帶中的頻譜單聲道音頻信號抽樣作為該頻帶內(nèi)的兩個(gè)頻譜聲道信號的抽樣來使用。
特定頻帶內(nèi)的整個(gè)頻譜左聲道信號由用于該特定頻帶確定的所有抽樣值LMDCT(n)組成。同樣,特定頻帶內(nèi)的整個(gè)頻譜右聲道信號由用于該特定頻帶所確定的所有抽樣值RMDCT(n)組成。
在使用公共電平修改增益的情況下,方程式(9)和(10)中的增益gLR(fband)等于該所有頻帶的公共值gLR_average。
如果在幀內(nèi)使用多個(gè)電平修改增益,即如果給每個(gè)頻帶提供一個(gè)指定的電平修改增益的話,就在頻帶的邊界執(zhí)行增益平滑。根據(jù)下面兩個(gè)方程式來執(zhí)行幀的開始位置的平滑 其中g(shù)s=(gLR(fband-1)+gLR(fband))/2根據(jù)下面兩個(gè)方程式來執(zhí)行幀末端的平滑 其中g(shù)end=[gLR(fband)+gLR(fband+1)]/2只對頻帶開始和結(jié)束位置的幾個(gè)抽樣執(zhí)行平滑。平滑域的寬度隨著頻率增加而增加。例如,在27頻帶中,在開始的16個(gè)頻帶中,可以對第一個(gè)和最后一個(gè)頻譜抽樣進(jìn)行平滑。對于后面的5個(gè)頻帶,可以對第一個(gè)和最后兩個(gè)頻譜抽樣進(jìn)行平滑。對于剩下的頻帶,可以對第一個(gè)和最后4個(gè)頻譜抽樣進(jìn)行平滑。
最后,IMDCT部分45利用基于幀的IMDCT將左聲道信號LMDCT轉(zhuǎn)換到時(shí)域,以便獲取恢復(fù)后的左聲道信號L,然后通過立體聲解碼器21輸出。IMDCT部分46利用基于幀的IMDCT將右聲道信號RMDCT轉(zhuǎn)換到時(shí)域,以便獲取恢復(fù)后的右聲道信號R,該右聲道信號R通過立體聲解碼器21同等地輸出。
在一些特殊情況下,可以比上述內(nèi)容更有效地將分配給頻帶的狀態(tài)傳送給解碼器,下面就通過兩個(gè)例子來進(jìn)行說明。
在上面給出的示意性實(shí)施例中,保留兩個(gè)比特以用于傳送所使用的編碼方案。但是,CENTER(′00′)、LEFT(′01′)和RIGHT(′10′)方案僅占用能用2個(gè)信令比特表示的四個(gè)可能值中的三個(gè)。所以剩下的一個(gè)值(′11′)就可以用于對高相關(guān)立體聲音頻幀進(jìn)行編碼。在這些幀中,前一個(gè)幀的CENTER、LEFT和RIGHT狀態(tài)也可以用于當(dāng)前幀。這樣,只有必須給整個(gè)幀發(fā)送上述提到的兩個(gè)指示編碼方案的信令比特,也就是說沒有多余的比特可以為當(dāng)前幀的每個(gè)頻帶來傳送狀態(tài)標(biāo)記。
而且,根據(jù)立體聲圖像的強(qiáng)度,在當(dāng)前編碼幀中偶爾會出現(xiàn)只有少數(shù)幾個(gè)LEFT和/或RIGHT狀態(tài),也就是說,幾乎給所有的頻帶都分配了CENTER狀態(tài)。為了對所謂的極少出現(xiàn)的LEFT和/或RIGHT狀態(tài)進(jìn)行有效編碼,采用一種CENTER、LEFT和RIGHT狀態(tài)的熵編碼會很有效。在熵編碼中,將CENTER狀態(tài)看成是零值頻帶,例如用霍夫曼(Huffman)代碼字對其進(jìn)行熵編碼?;舴蚵a字描述了零的運(yùn)算,也就是說,連續(xù)CENTER狀態(tài)的運(yùn)行和每個(gè)霍夫曼代碼字都跟隨著一個(gè)比特,該一個(gè)比特表示是LEFT狀態(tài)還是RIGHT狀態(tài)跟隨在連續(xù)CENTER狀態(tài)運(yùn)行之后。LEFT狀態(tài)可以用一個(gè)比特的值‘1’來表示,RIGHT狀態(tài)可以用一個(gè)比特的值‘0’來表示。只要編碼器和解碼器知道編碼協(xié)定,所述信令反過來也可以使用。
圖5表示可用來獲取霍夫曼代碼字的霍夫曼表的一個(gè)例子。
所述表包括表示連續(xù)0值的數(shù)量的第一欄、表示用于相應(yīng)霍夫曼代碼字的比特?cái)?shù)量的第二欄、和表示要用于相應(yīng)零值運(yùn)算的實(shí)際霍夫曼代碼字的第三欄。所述表從沒有零到26個(gè)零來對零的數(shù)量分配霍夫曼代碼字。最后一行與27個(gè)零的理論數(shù)量相關(guān),用于幀內(nèi)的剩余狀態(tài)只是CENTER狀態(tài)的情況。
下面將描述根據(jù)圖5所示的霍夫曼表對極少出現(xiàn)的LEFT狀態(tài)和/或RIGHT狀態(tài)進(jìn)行編碼的第一實(shí)例。
在上面的序列中,C代表CENTER狀態(tài),L代表LEFT狀態(tài),R代表RIGHT狀態(tài)。在所建議的熵編碼中,首先,對三個(gè)CENTER狀態(tài)進(jìn)行霍夫曼編碼,生成值為9的4-比特代碼字,其后跟隨著值為‘1’的表示LEFT狀態(tài)的一個(gè)比特。接著,再對三個(gè)CENTER狀態(tài)進(jìn)行霍夫曼編碼,生成值為9的4-比特代碼字,其后跟隨著值為‘0’的表示RIGHT狀態(tài)的一個(gè)比特。最后,對一個(gè)CENTER狀態(tài)進(jìn)行霍夫曼編碼,生成值為7的3-比特代碼字,其后跟隨著值為‘0’的再次表示RIGHT狀態(tài)的一個(gè)比特。
下面描述極少出現(xiàn)的LEFT狀態(tài)和/或RIGHT狀態(tài)的第二實(shí)例。
在建議的熵編碼中,對第一組的三個(gè)CENTER狀態(tài)進(jìn)行霍夫曼編碼,生成值為9的4-比特代碼字,其后跟隨著值為‘1’的一個(gè)比特。接著,再對后面三個(gè)CENTER狀態(tài)進(jìn)行霍夫曼編碼,生成值為9的4-比特代碼字,其后跟隨著值為‘0’的一個(gè)比特。最后,用一個(gè)特殊的霍夫曼字符來表示幀內(nèi)剩下的狀態(tài)是CENTER狀態(tài),在該例子中是兩個(gè)CENTER狀態(tài)。根據(jù)圖5所示的霍夫曼表,這個(gè)特殊的字符是值為12的4-比特代碼字。
在參照圖2-4所述的立體聲音頻編碼系統(tǒng)的最有效的實(shí)施例中,對所有給出編碼方法的比特?fù)p耗都進(jìn)行檢查,并且選擇一種比特?fù)p耗最小的方法來傳送需要的狀態(tài)。從立體聲編碼器20向立體聲解碼器21給每個(gè)幀發(fā)送一個(gè)額外的信令比特,以便將2-比特編碼方案和熵編碼方案區(qū)分開。例如,額外的信令比特是‘0’值表示會使用2-比特編碼方案,額外的信令比特是‘1’值表示會使用熵編碼方案。
下面,對上面參照圖2-4描述的本發(fā)明的示意性實(shí)施例進(jìn)行進(jìn)一步可能的補(bǔ)充。
上面給出的本發(fā)明的實(shí)施例是基于每個(gè)幀的平均增益的傳輸,其中根據(jù)方程式(4)來確定平均增益。但是,平均增益僅代表幀內(nèi)的空間強(qiáng)度,并且基本上沒有考慮幀內(nèi)各頻帶之間的差別。如果頻帶之間存在很大的空間差別,至少要單獨(dú)考慮最重要的頻帶。為此,基本上任何時(shí)候都必須在幀內(nèi)發(fā)送多個(gè)增益。
現(xiàn)在將給出一種編碼方案,其不僅可以實(shí)現(xiàn)幀之間的增益自適應(yīng)分配,而且同樣實(shí)現(xiàn)幀內(nèi)的頻帶之間的增益自適應(yīng)分配。
在發(fā)送端,立體聲編碼器20的立體聲擴(kuò)展編碼器26首先為相應(yīng)幀確定并量化所述平均增益gLR_average,如上面參照方程式(4)和處理部分35和36所述的那樣。同樣也象上面所述的那樣發(fā)送平均增益gLR_average。但是,除此之外,還要將平均增益gLR_average和為每個(gè)頻帶計(jì)算出來的增益gLR(fbana)進(jìn)行比較,然后根據(jù)下面的方程式,為每個(gè)頻帶做出一個(gè)在相應(yīng)頻帶中增益是否重要的決定 其中 (15)
gRatio(fband)=gLR(fband)Q[gLR_average]]]>其中Q[]表示量化算子,并且0≤fband<numTotalBands。所以,標(biāo)記gain_flag(fband)為每個(gè)頻帶指示出增益以及相關(guān)的頻帶是否重要。要注意的是,通常把分配給CENTER狀態(tài)的頻帶的增益看成是不重要的。
現(xiàn)在,計(jì)數(shù)確定為重要的頻帶的數(shù)量。如果0個(gè)頻帶被確定為是重要的,那么就發(fā)送值為‘0’的一個(gè)比特來表示沒有進(jìn)一步的增益信息。如果存在確定為重要的頻帶,就發(fā)送具有值為‘1’的一個(gè)比特以表示還有進(jìn)一步的增益信息。
圖6是表示在找到至少一個(gè)重要頻帶的情況下,立體聲擴(kuò)展編碼器26中進(jìn)一步步驟的流程圖。
如果準(zhǔn)確地確定有一個(gè)頻帶是重要的,就選擇第一編碼方案。在該編碼方案中,發(fā)送值為‘1’的第二個(gè)比特來表示將會有關(guān)于一個(gè)重要增益的信息。提供另外兩個(gè)比特用來發(fā)送信號通知在gain_flags中表示哪里有重要增益的索引。當(dāng)找到增益時(shí),就排除CENTER狀態(tài)以實(shí)現(xiàn)最有效的索引編碼。在生成的索引值大于兩個(gè)比特能表示的范圍的情況下,使用三個(gè)比特的轉(zhuǎn)義碼。所以當(dāng)索引值等于或大于3時(shí)就經(jīng)常起動(dòng)轉(zhuǎn)義碼。一般來說,索引的分布都小于3以便少使用轉(zhuǎn)義碼。然后通過矢量量化來對確定的增益進(jìn)行量化,所述確定的增益與值gRatio相關(guān),值gRatio與識別出的重要頻帶相關(guān)。根據(jù)量化結(jié)果提供5個(gè)比特來進(jìn)行代碼簿索引的發(fā)送。
如果確定有兩個(gè)或多個(gè)頻帶是重要的,就發(fā)送值為‘0’的第二比特以表示將會有與兩個(gè)或多個(gè)重要增益相關(guān)的信息。如果確定有兩個(gè)頻帶是重要的,就選擇第二編碼方案。在第二編碼方案中,發(fā)送值為‘1’的下一個(gè)比特來表示僅僅會有跟兩個(gè)重要增益相關(guān)的信息。第一重要增益位于gain_ flags中,并與第一索引相關(guān),其用2個(gè)比特進(jìn)行編碼??梢栽偈褂?個(gè)比特來用于可能的轉(zhuǎn)義碼。第二重要增益也位于gain_flags中,并與第二索引相關(guān),它用3個(gè)比特進(jìn)行編碼,同樣可以再使用3個(gè)比特來用于可能的轉(zhuǎn)義碼??梢酝ㄟ^矢量量化對確定好的與值gRatio相關(guān)的增益進(jìn)行量化,所述值gRatio與識別出的重要頻帶相關(guān)。根據(jù)量化結(jié)果分別提供5個(gè)比特來進(jìn)行代碼簿索引的發(fā)送。
如果確定有三個(gè)或更多的頻帶是重要的,就選擇第三編碼方案。在該第三編碼方案中,發(fā)送值為‘0’的下一個(gè)比特來表示會有跟至少三個(gè)重要增益相關(guān)的信息。對于每個(gè)LEFT狀態(tài)或RIGHT狀態(tài)頻帶來說,發(fā)送一個(gè)比特來表示相應(yīng)頻帶是否重要。用值為‘0’的比特來表示該頻帶是不重要的,用值為‘1’的比特來表示該頻帶是重要的。在所述頻帶是重要的情況下,通過產(chǎn)生5個(gè)比特的矢量量化來量化與值gRatio相關(guān)的增益,所述值gRatio與該頻帶相關(guān)。分別根據(jù)量化結(jié)果,在表示所述頻帶是重要的那個(gè)比特后,提供5個(gè)比特來進(jìn)行代碼簿索引的發(fā)送。
在實(shí)際發(fā)送根據(jù)三種編碼方案中的一種而提供的比特之前,在只有一個(gè)或兩個(gè)重要頻帶的情況下,首先要確定第三編碼方案是否比第一或第二編碼方案具有更低的比特?fù)p耗??赡茉谀承┣闆r下,例如由于轉(zhuǎn)義碼,即使只有一個(gè)或兩個(gè)重要頻帶存在,但第三方案也可以提供更有效的比特使用。為了實(shí)現(xiàn)最大的編碼效率,可以選擇產(chǎn)生低比特?fù)p耗的相應(yīng)編碼方案來為實(shí)際傳輸提供比特。
另外,還要確定要發(fā)送的比特?cái)?shù)量是否小于可用比特的數(shù)量。如果情況不允許,就要丟棄最不重要的增益,然后象上面所描述的那樣重新開始發(fā)送比特的決定。
根據(jù)下面的內(nèi)容來確定最不重要的增益。首先,將gRatio值映射成相同的信號電平。如方程式(15)所示,gRatio(fband)可以小于或大于1。執(zhí)行所述映射是為了如果gRatio(fband)的值小于1,就采用它的倒數(shù)值,否則就采用gRatio(fband)的值,如下面的方程式所示 方程式(16)在0≤fband<numTotalBands時(shí)重復(fù)進(jìn)行,但是只對那些標(biāo)記為重要的頻帶進(jìn)行。接著,按照重要性遞減的順序?qū)RatioNew進(jìn)行排序,也就是說,gRatioNew中的第一項(xiàng)是最大的值,gRatioNew中第二項(xiàng)是第二個(gè)最大的值,以此類推。在排序的gRatioNew中,最不重要的增益是最小的值。與該值相對應(yīng)的頻帶被標(biāo)記為不重要的。
在接收端,具體說是在編碼器21的增益提取部分43中,首先,如上所述讀取平均增益值。然后,讀取一個(gè)比特來檢查是否存在任何重要增益。在第一個(gè)比特是‘0’的情況下,不存在重要的增益,否則存在至少一個(gè)重要的增益。
在存在至少一個(gè)重要增益的情況下,增益提取部分43接著讀取第二個(gè)比特來檢查是否只存在一個(gè)重要增益。
如果第二個(gè)比特的值是‘1’,增益提取部分43就知道只存在一個(gè)重要增益,并再讀取2個(gè)比特來確定索引和重要增益的位置。如果索引的值是3,就讀取3個(gè)轉(zhuǎn)義碼比特。通過排除CENTER狀態(tài),將所述索引反向映射成正確的頻帶索引。最后,再讀取5個(gè)比特來獲取與gRatio值相關(guān)的量化增益的代碼簿索引。
如果讀取的第二個(gè)比特的值是‘0’,增益提取部分43就知道存在兩個(gè)或更多個(gè)重要增益,接著讀取第三個(gè)比特。
如果讀取的第三個(gè)比特的值是‘1’,增益提取部分43就知道只存在兩個(gè)重要增益。在這種情況下,再讀取2個(gè)比特來確定索引和第一個(gè)重要增益的位置。如果第一個(gè)索引的值是3,就讀取3個(gè)轉(zhuǎn)義碼比特。接著,讀取3個(gè)比特來對第二個(gè)索引和第二個(gè)重要增益的位置進(jìn)行解碼。如果第二個(gè)索引的值是7,就讀取3個(gè)轉(zhuǎn)義碼比特。通過排除CENTER狀態(tài),將所述索引反向映射成正確的頻帶索引。最后,再讀取5個(gè)比特來分別獲取與gRatio值相關(guān)的第一和第二量化增益的代碼簿索引。
如果讀取的第三個(gè)比特的值是‘0’,增益提取部分43就知道存在三個(gè)或更多個(gè)重要增益。在這種情況下,為每個(gè)LEFT或RIGHT狀態(tài)頻帶再讀取一個(gè)比特。如果讀取的相應(yīng)比特的值是‘1’,解碼器就知道該頻帶是重要的,并且在相應(yīng)比特后立即再讀取附加的5個(gè)比特,以便獲得代碼簿索引來對與頻帶關(guān)聯(lián)的gRatio值相關(guān)的量化增益進(jìn)行解碼。如果讀取的相應(yīng)比特的值是‘0’,就不再為相應(yīng)頻帶讀取其它的比特。
最后根據(jù)下面的方程式來重建每個(gè)頻帶的增益 其中Q[gLR_average]表示發(fā)送的平均增益。方程式(17)在0≤fband<numTotalBands時(shí)重復(fù)進(jìn)行。
現(xiàn)在將參照圖7-11來描述從上述第一實(shí)施例中推導(dǎo)出來的本發(fā)明的第二實(shí)施例。
圖7表示立體聲音頻編碼系統(tǒng)的常用結(jié)構(gòu),其中可以實(shí)現(xiàn)本發(fā)明的第二實(shí)施例。該立體聲音頻編碼系統(tǒng)可用于發(fā)送由左聲道信號和右聲道信號組成的立體聲音頻信號。
圖7所示的立體聲音頻編碼系統(tǒng)包括立體聲編碼器70和立體聲解碼器71。立體聲編碼器70對立體聲音頻信號進(jìn)行編碼并將其發(fā)送給立體聲解碼器71,立體聲解碼器71接收所述編碼的信號,對其進(jìn)行解碼并將其重建成立體聲音頻信號?;蛘撸Ⅲw聲編碼器70也可以將經(jīng)過編碼的立體聲音頻信號存儲在存儲單元中,立體聲解碼器71可以從所述存儲單元中再次提取信號。
立體聲編碼器70包括相加點(diǎn)702,經(jīng)比例單元703連接到AMR-WB+單聲道編碼器元件704。所述AMR-WB+單聲道編碼器元件704又連接到AMR-WB+比特流多路復(fù)用器(MUX)705。另外,所述立體聲編碼器70包括立體聲擴(kuò)展編碼器706,其同樣連接到AMR-WB+比特流多路復(fù)用器705。除了這些在第一實(shí)施例的立體聲編碼器20里包括的元件之外,立體聲編碼器70還包括立體聲加強(qiáng)層編碼器707,其與AMR-WB+單聲道編碼器元件704、立體聲擴(kuò)展編碼器706和AMR-WB+比特流多路復(fù)用器(MUX)705相連。
立體聲解碼器71包括AMR-WB+比特流多路分解器(DEMUX)715,其一方面與AMR-WB+單聲道解碼器元件714連接,另一方面與立體聲擴(kuò)展解碼器716相連。AMR-WB+單聲道解碼器元件714還連接到立體聲擴(kuò)展解碼器716。除了這些在第一實(shí)施例的立體聲解碼器21里包括的元件之外,立體聲解碼器71還包括立體聲加強(qiáng)層解碼器717,其與AMR-WB+比特流多路分解器715、AMR-WB+單聲道解碼器元件714和立體聲擴(kuò)展解碼器716相連。
當(dāng)要發(fā)送立體聲音頻信號時(shí),將立體聲音頻信號的左聲道信號L和右聲道信號R提供給立體聲編碼器70。假設(shè)左聲道信號L和右聲道信號R以幀的形式排列。
在立體聲編碼器70中,首先利用相加點(diǎn)702和比例單元703在左聲道信號L和右聲道信號R的基礎(chǔ)上生成單聲道音頻信號M=(L+R)/2,AMR-WB+單聲道編碼器元件704對其進(jìn)行編碼并將其提供給AMR-WB+比特流多路復(fù)用器705,與第一實(shí)施例中所述的一樣。而且,在立體聲擴(kuò)展編碼器706中根據(jù)左聲道信號L和右聲道信號R生成立體聲擴(kuò)展所用的側(cè)向信息,并將其提供給AMR-WB+比特流多路復(fù)用器705,正如第一實(shí)施例中所述的一樣。
但是,在第二實(shí)施例中,還將原始左聲道信號L、原始右聲道信號R、編碼單聲道音頻信號 和生成的側(cè)向信息傳送給立體聲加強(qiáng)層編碼器707。所述立體聲加強(qiáng)層編碼器處理接收到的信號以便獲取附加的加強(qiáng)信息,與第一實(shí)施例相比,其保證可以在解碼端實(shí)現(xiàn)改進(jìn)的立體聲圖像。同樣也將該加強(qiáng)信息作為比特流提供給AMR-WB+比特流多路復(fù)用器705。
最后,AMR-WB+比特流多路復(fù)用器705將AMR-WB+單聲道編碼器元件704、立體聲擴(kuò)展編碼器706和立體聲加強(qiáng)層編碼器707提供的比特流進(jìn)行多路復(fù)用以便進(jìn)行傳輸。
立體聲解碼器71接收發(fā)送過來的經(jīng)過多路復(fù)用的比特流,并由AMR-WB+比特流多路分解器715將其多路分解成單聲道信號比特流、側(cè)向信息比特流和加強(qiáng)信息比特流。除了立體聲擴(kuò)展解碼器716不需要執(zhí)行任何IMDCT之外,就象第一實(shí)施例中相應(yīng)元件那樣,由AMR-WB+單聲道解碼器元件714和立體聲擴(kuò)展解碼器716對單聲道信號比特流和側(cè)向信息比特流進(jìn)行處理。為了表示這個(gè)輕微的區(qū)別,立體聲擴(kuò)展解碼器716在圖7中用立體聲擴(kuò)展解碼器來表示。將在立體聲擴(kuò)展解碼器716中獲得的頻譜左聲道 和右聲道 信號提供給立體聲加強(qiáng)層解碼器717,其輸出一個(gè)具有改進(jìn)立體聲圖像的新的重建左聲道信號和右聲道信號 要注意的是,對于第二實(shí)施例來說,與第一實(shí)施例中的立體聲擴(kuò)展解碼器29中生成的頻譜左聲道LMDCT和右聲道RMDCT信號相比,對立體聲擴(kuò)展解碼器716中生成的頻譜左聲道 和右聲道 信號使用不同的標(biāo)記符號。這是因?yàn)樵诘谝粚?shí)施例中,忽略了立體聲擴(kuò)展編碼器26和立體聲擴(kuò)展解碼器29中生成的頻譜左聲道LMDCT和右聲道RMDCT信號之間的區(qū)別。
下面將描述立體聲加強(qiáng)層編碼器707和立體聲加強(qiáng)層解碼器717的結(jié)構(gòu)和操作。
圖8詳細(xì)描述了立體聲加強(qiáng)層編碼器707中的處理過程。圖8是立體聲加強(qiáng)層編碼器707的示意性框圖。在圖8的上半部分,是以立體聲加強(qiáng)層編碼器707中一幀接一幀的處理過程來使用所示元件的,而在圖8的下半部分,是基于立體聲加強(qiáng)層編碼器707的頻帶處理過程來使用所示元件的。要注意的是,為了清楚起見,沒有給出不同元件之間的所有連接。
圖8上半部分所示的立體聲加強(qiáng)層編碼器707的元件包括有立體聲擴(kuò)展解碼器801,其與立體聲擴(kuò)展解碼器716相對應(yīng)。立體聲擴(kuò)展解碼器801的兩個(gè)輸出經(jīng)相加點(diǎn)802和比例單元803與第一處理部分804相連。立體聲擴(kuò)展解碼器801的第三個(gè)輸出除了與第二處理部分805和第三處理部分806相連外,同樣也連接到第一處理部分804。第二處理部分805的輸出同樣也連接到第三處理部分806。
圖8下半部分所示的立體聲加強(qiáng)層編碼器707的元件包括量化部分807、重要性檢測部分808和代碼簿索引分配部分809。
基于從AMR-WB+單聲道編碼器元件704接收的編碼單聲道音頻信號 和從立體聲擴(kuò)展編碼器706接收的側(cè)向信息,首先由立體聲擴(kuò)展解碼器801生成立體聲擴(kuò)展信號的精確復(fù)制,所述立體聲擴(kuò)展信號在接收端由立體聲擴(kuò)展解碼器716生成。除了沒有將生成的頻域中的頻譜左聲道 和右聲道 信號轉(zhuǎn)換到時(shí)域之外,所以立體聲擴(kuò)展解碼器801的處理過程與圖2中立體聲擴(kuò)展編碼器29執(zhí)行的處理過程完全一樣,這是因?yàn)榱Ⅲw聲加強(qiáng)層編碼器707也在頻域進(jìn)行操作。立體聲擴(kuò)展解碼器801提供的頻譜左聲道 和右聲道 信號與參照圖4所提到的LMDCT和RMDCT信號相對應(yīng)。此外,立體聲擴(kuò)展解碼器801將所接收的側(cè)向信息中包含的狀態(tài)標(biāo)記IS_flag進(jìn)行傳送。
要注意的是,在實(shí)際的實(shí)現(xiàn)過程中,不會從比特流這一級開始進(jìn)行內(nèi)部解碼。一般來說,內(nèi)部解碼都嵌入在編碼程序中,以便每個(gè)編碼程序都會在處理了接收的輸入信號后返回合成解碼輸出信號。為了進(jìn)行說明,這里只給出單個(gè)內(nèi)部立體聲擴(kuò)展解碼器801。
然后,從重建的頻譜左聲道 和右聲道 信號中確定差信號 為S~f=(L~f-R~f)/2]]>并將其提供給第一處理部分804。此外,原始頻譜左聲道和右聲道信號用來計(jì)算相應(yīng)的原始差信號Sf,也同樣將Sf提供給第一處理部分804。原始頻譜左聲道和右聲道信號與上面參照圖3所述的LMDCT和RMDCT信號相對應(yīng)。圖8沒有給出原始差信號Sf的生成過程。
第一處理部分804根據(jù)下面的方程式從接收的差信號 和原始差信號Sf中確定目標(biāo)信號 S~fe=s(j),0≤j<numTotalBands]]>
Ef(k)=Sf(offset+n)-S~f(offset+n),0≤n<IS_WidthLenBuf[k]---(18)]]>參數(shù)offset表示在頻帶k中到頻譜抽樣開始位置的抽樣偏移。
因此,在要進(jìn)行擴(kuò)展的頻域中的目標(biāo)信號 表示由立體聲擴(kuò)展解碼器716重建的信號與原始立體聲聲道信號是不一樣的。在量化之后,該信號構(gòu)成立體聲音頻編碼器70另外要發(fā)送的加強(qiáng)信息。
方程式(18)從立體聲圖像出發(fā),僅考慮了那些屬于被立體聲擴(kuò)展編碼器706確定為相關(guān)的頻帶的差信號的頻譜抽樣。所述相關(guān)信息被立體聲擴(kuò)展解碼器801以狀態(tài)標(biāo)記IS_flag的形式傳送給第一處理部分804。假設(shè)那些被分配了CENTER狀態(tài)的頻帶從空間位置來看或多或少是不相關(guān)的,這是十分安全的。同樣,第二實(shí)施例的目的不在于重建立體聲圖像的精確復(fù)制,而是一種具有相對低比特率的精密近似。
量化元件807將根據(jù)頻帶對目標(biāo)信號 進(jìn)行量化,為此,必須要知道被認(rèn)為是相關(guān)的頻帶數(shù)量和頻帶邊界。
為了能夠確定頻帶數(shù)量和頻帶邊界,首先必須要知道信號 中頻譜抽樣的數(shù)量。可以根據(jù)下面的方程式在接收的狀態(tài)標(biāo)記IS_flag的基礎(chǔ)上在第二處理部分805中確定這個(gè)頻譜抽樣的數(shù)量 然后,第三處理部分806會計(jì)算相關(guān)頻帶的數(shù)量numBands和頻帶邊界offsetBuf[n],例如象下面的第一偽C-碼一樣<pre listing-type="program-listing"><![CDATA[numBands=0;offsetBuf
=0;if(N){intl6loopLimit;if(N<=50)loopLimit=2;else if(N<=85)loopLimit=3;else if(N<=120)loopLimit=4;else if(N<=180)loopLimit=5;else if(N<=frameLen)loopLimit=6;for (i=1;i<(loopLirnit+1);i++){numBufs++;bandLen=Minimum(qBandLen[i-1],N/2);if(offset<qBandLen[i-1])bandLen=N;offsetBuf[i]=offsetBuf[i-1]+bandLen;N=bandLen;If(N<=)break;}}]]></pre>其中qBandLen描述的是每個(gè)頻帶的最大長度。在當(dāng)前實(shí)施例中,通過qBandLen={22,25,32,38,44,49}來給出頻帶的最大長度。也通過上面的過程來確定每個(gè)頻帶的寬度BandLen。
現(xiàn)在量化部分807在頻帶的基礎(chǔ)上在相應(yīng)的量化回路中對目標(biāo)信號 進(jìn)行量化,如圖9所示??梢詫⒚總€(gè)頻帶的頻譜抽樣具體量化到[-a,a]的范圍。在該實(shí)施例中,目前是將范圍設(shè)置在[-3,3]。
可以通過調(diào)整量化增益值來觀察相應(yīng)可選量化的范圍。
為此,首先根據(jù)下面的方程式來確定量化增益的開始值
gstart(n)=5.3*log2(Maximum(S~fe(i))0.75256)---(20)]]>offsetBuf[n]≤i<o(jì)ffsetBuf[n+1]可以給每個(gè)相關(guān)頻帶也就是,對于0≤n<numBands確定一個(gè)開始值gstart(n)。
然后,根據(jù)下面一組方程式,以一個(gè)抽樣接一個(gè)抽樣為基礎(chǔ)進(jìn)行量化q(i)=(|S~fe(i)|*2-0.26gstart(n))0.75,offsetBuf[n]≤i<offsetBuf[n+1]]]> (21)qfloat(i)=q(i)*sign(S~fe(i))]]> 同樣,分別為每個(gè)相關(guān)頻帶,也就是對0≤n<numBands執(zhí)行這些計(jì)算。
然后為每個(gè)頻帶確定最大絕對值qint(i)。在所述最大絕對值大于3的情況下,開始增益gstsrt會增加,并且根據(jù)方程式21對相應(yīng)頻帶重復(fù)量化,直到最大絕對值qint(i)不大于3。與終值qint(i)相對應(yīng)的值qfloat(i)構(gòu)成相應(yīng)頻帶的量化后的加強(qiáng)抽樣。
量化部分807一方面給每個(gè)相關(guān)頻帶提供最后增益值以便傳輸。另一方面,量化部分807會向重要性檢測部分808傳送所述最后增益值、量化后的加強(qiáng)抽樣qfloat(i)和各個(gè)相關(guān)頻帶的附加值qint(i)。
在重要性檢測部分808中,在將量化后的加強(qiáng)抽樣傳送給矢量量化(VQ)索引分配程序之前,計(jì)算量化后頻譜的第一重要性檢測值。所述重要性檢測值表示是否必須發(fā)送相應(yīng)頻帶的量化后的加強(qiáng)抽樣。在該實(shí)施例中,低于10的增益值和除了0值以外的其它值qint會觸發(fā)重要性檢測值以表示指定頻帶的相應(yīng)量化加強(qiáng)抽樣qfloat是不相關(guān)的,并且不需要發(fā)送。在另一實(shí)施例中,也可以包括頻帶之間的計(jì)算,以便可以定位感覺重要的立體聲頻帶以便傳輸。
重要性檢測部分808給每個(gè)頻帶提供一個(gè)相應(yīng)的重要性標(biāo)記位以便傳輸,具體來說如果頻帶的頻譜量化加強(qiáng)抽樣是不相關(guān)的,所述重要性標(biāo)記位的值為‘0’,否則重要性標(biāo)記位的值為‘1’。重要性檢測部分808還向代碼簿索引分配部分809傳送那些頻帶(所述那些頻帶的量化加強(qiáng)抽樣被認(rèn)為是重要的)的量化加強(qiáng)抽樣qfloat(i)和附加值qint(i)。
代碼簿索引分配部分809對接收到量化加強(qiáng)抽樣進(jìn)行VQ索引分配計(jì)算。
代碼簿索引分配部分809所用的VQ索引分配程序以組的形式處理接收到的量化值,所述組是由m個(gè)連續(xù)的量化頻譜加強(qiáng)抽樣組成。由于m不能被每個(gè)頻帶的寬度BandLen整除,所以可以在開始正式量化之前修改每個(gè)頻帶的邊界offsetBuf[n],例如在下面第二偽C-碼中所述的那樣<pre listing-type="program-listing"><![CDATA[for(i=0;i<numBands;i++);{int16bandLen,offset;offset=offsetBuf[i]bandLen=offsetBuf[i+1]-offsetBuf[i];if(bandLen%m){bandLen-=bandLen%m;offsetBuf[i+1]=offset+bandLen;}}]]></pre>如圖10所示的VQ索引分配程序,首先在第二重要性檢測值中給m個(gè)量化加強(qiáng)抽樣組成的相應(yīng)組確定該組是否是重要的。
如果該組內(nèi)與量化加強(qiáng)抽樣qfloat相對應(yīng)的所有的附加值qint都是0值,那該組就被認(rèn)為是重要的。在這種情況下,程序只提供值為‘0’的VQ標(biāo)記位,并且立即到下一組的m個(gè)抽樣(只要還剩下抽樣的話)。否則,VQ索引分配程序會提供值為‘1’的VQ標(biāo)記位,并給相應(yīng)組分配一個(gè)代碼簿索引。用于分配代碼簿索引的VQ搜索是基于量化加強(qiáng)抽樣qfloat而進(jìn)行的,而不是基于附加值qint進(jìn)行。原因是qfloat值更適合于VQ索引搜索,這是由于qint值非常接近整數(shù),而在整數(shù)域中不適合使用矢量量化。在該實(shí)施例中,m的值設(shè)為3,并且用3個(gè)比特的矢量量化對m個(gè)連續(xù)抽樣的每個(gè)組進(jìn)行編碼。只有這個(gè)時(shí)候,程序才會運(yùn)行到下一個(gè)m個(gè)抽樣的組(只要還剩下抽樣的話)。
典型的,對大多數(shù)幀來說,會把VQ標(biāo)記位設(shè)置成‘1’。在這種情況下,在頻帶內(nèi)為每個(gè)頻譜組傳送該VQ標(biāo)記位并不是很有效的。但是有時(shí)候,編碼器會需要每個(gè)頻譜組的VQ標(biāo)記位的幀。為此,組織了VQ索引分配程序,以便在開始實(shí)際搜索最好的VQ索引之前,計(jì)數(shù)具有相關(guān)量化加強(qiáng)抽樣的組的數(shù)量。具有相關(guān)量化加強(qiáng)抽樣的組也叫做重要組。如果重要組的數(shù)量與當(dāng)前頻帶內(nèi)的組的數(shù)量相同,就會提供值為‘1’的單比特來進(jìn)行傳輸,其表示所有的組都是重要的,所以也就不需要VQ標(biāo)記位了。在重要組的數(shù)量與當(dāng)前頻帶內(nèi)的組的數(shù)量不一樣的情況下,就提供值為‘0’的單比特來進(jìn)行傳輸,其表示VQ標(biāo)記位與每個(gè)m個(gè)量化頻譜加強(qiáng)抽樣的組都相關(guān),表示VQ代碼簿索引是否代表相應(yīng)的組。
代碼簿索引分配部分809給每個(gè)頻帶提供單比特,給所有重要組分配VQ代碼簿索引,并且還可能另外分配表示哪個(gè)組是重要的VQ標(biāo)記位。
為了實(shí)現(xiàn)有效的量化操作,還要考慮其它可用的比特率。根據(jù)可用的比特率,編碼器會或多或少地以m個(gè)組的形式發(fā)送量化的頻譜加強(qiáng)抽樣qfloat。如果可用比特率為低,那么編碼器可以只發(fā)送用于第一組兩個(gè)頻帶的m個(gè)組中的量化頻譜加強(qiáng)抽樣qfloat,如果可用比特率為高,編碼器可以發(fā)送用于第一組三個(gè)頻帶的m個(gè)組中的量化頻譜加強(qiáng)抽樣qfloat。同樣根據(jù)可用的比特率,如果所用比特的數(shù)量超過了可用比特的數(shù)量,編碼器可以停止發(fā)送當(dāng)前頻帶內(nèi)某個(gè)位置的頻譜組。然后以立體聲加強(qiáng)層比特流的形式來發(fā)送整個(gè)立體聲擴(kuò)展的比特率,包括立體聲擴(kuò)展編碼和立體聲加強(qiáng)層編碼,所述立體聲加強(qiáng)層比特流包括加強(qiáng)信息。
在當(dāng)前實(shí)施例中,定義了6.7、8、9.6和12kbps的比特率,并且保留2個(gè)比特來傳送所分別使用的比特率brMode。一般來說,第一實(shí)施例的平均比特率會比最大允許的比特率小,剩余的比特可以分配給第二實(shí)施例的加強(qiáng)層。這也是帶內(nèi)信令的一個(gè)優(yōu)點(diǎn),因?yàn)榛旧狭Ⅲw聲加強(qiáng)層編碼器707可以使用所有可用的比特。當(dāng)使用帶內(nèi)信令時(shí),解碼器可以只通過計(jì)算解碼比特的數(shù)量并將其與最大允許比特?cái)?shù)量相比來檢測什么時(shí)候停止解碼。如果解碼器用和編碼器同樣的方式來監(jiān)測比特?fù)p耗,就會在編碼器停止發(fā)送的那個(gè)位置停止解碼。
立體聲加強(qiáng)層編碼器707將比特率指示、量化增益值、重要性標(biāo)記位、VQ代碼簿索引和VQ標(biāo)記位作為加強(qiáng)信息比特流提供給圖7中立體聲編碼器70的AMR-WB+比特流多路復(fù)用器705。
可以構(gòu)造加強(qiáng)信息比特流的比特流元素以用于傳輸,例如象下面的第三偽C-碼所示的那樣<pre listing-type="program-listing"><![CDATA[Enhancement_StereoData(numBands){brMode=BsGetBits(2);for(i=0;i<numBands;i++){int16bandLen,offset;offset=offsetBuf[i];bandLen=offsetBuf[i+1]-offsetBuf[i];if(bandLen%m){bandLen-=bandLen%m;offsetBuf[i+1]=offset+bandLen;}bandPresent=BsGetBits(1);if(bandPresent==1){int16vqFlagPresent;gain[i]=BsGetBits(6)+10;vqFlagPresent=BsGetBits(1);for(j=0;j<bandLen;j++){int16vqFlagGroup=TRUE;if(vqFlagPresent==FALSE)vqFlagGroup=BsGetBits(1);if(vqFlagGroup)codebookldx[i][j]=BsGetBits(3); }}}]]></pre>這里,brMode表示所使用的比特率,band Present構(gòu)成相應(yīng)頻帶的重要性標(biāo)記位,gain[i]表示相應(yīng)頻帶使用的量化增益,vqFlag Present表示VQ標(biāo)記位是否與指定頻帶的頻譜組相關(guān),vqFlagGroup構(gòu)成表示m個(gè)抽樣的相應(yīng)組是否重要的實(shí)際VQ標(biāo)記位,,codebookIdx[i][j]表示相應(yīng)重要組的代碼簿索引。
AMR-WB+比特流多路復(fù)用器705將接收到的加強(qiáng)信息比特流和接收到的側(cè)向信息比特流以及接收到的單聲道信號比特流進(jìn)行多路復(fù)用以便傳輸,如參照圖7所述的那樣。
圖7中的立體聲解碼器71接收所發(fā)送的信號,并象上面所述的那樣由AMR-WB+比特流多路分解器715、AMR-WB+單聲道解碼器元件714和立體聲擴(kuò)展解碼器716對其進(jìn)行處理。
圖11具體描述了圖7中的立體聲解碼器71的立體聲加強(qiáng)層解碼器717中的處理過程。圖11是所述立體聲加強(qiáng)層解碼器717的示意性框圖。在圖11的上半部分,以按照一幀接一幀處理的方式來表示立體聲加強(qiáng)層解碼器717中的元件,而在圖11的下半部分,以按照頻帶為基礎(chǔ)的處理方式來表示立體聲加強(qiáng)層解碼器717中的元件。另外,在圖11的上半部分再次給出了圖7所示的立體聲擴(kuò)展解碼器716。要注意的是,為了清楚起見,沒有描述不同元件之間的所有連接。
圖11上半部分所示的立體聲加強(qiáng)層解碼器717的元件包括有相加點(diǎn)901,其與提供重建頻譜左聲道 和右聲道 信號的立體聲擴(kuò)展解碼器716的兩個(gè)輸出端相連。所述相加點(diǎn)901經(jīng)比例單元902連接到第一處理部分903。傳送接收的狀態(tài)標(biāo)記IS_flag的立體聲擴(kuò)展解碼器716的另一個(gè)輸出端直接與立體聲加強(qiáng)層解碼器717的第一處理部分903、第二處理部分904和第三處理部分905相連。第一處理部分903還與反向MS矩陣元件906相連。提供單聲道音頻信號 的AMR-WB+單聲道解碼器元件714的輸出端也經(jīng)MDCT部分913連接到該反向MS矩陣元件906。反向MS矩陣元件906還與第一IMDCT部分907和第二IMDCT部分908相連。
圖11下半部分所示的立體聲加強(qiáng)層解碼器717的元件包括重要性標(biāo)記讀取部分909,其經(jīng)由增益讀取部分910和VQ查詢部分911連接到反量化部分912。
根據(jù)上面第三偽C-碼中的比特流語法來分析由AMR-WB+比特流多路分解器715提供的加強(qiáng)信息比特流。
而且,第二處理部分904根據(jù)上面方程式(18)基于從立體聲擴(kuò)展解碼器716接收到的狀態(tài)標(biāo)記IS_flag來確定加強(qiáng)比特流中的目標(biāo)信號抽樣的數(shù)量。然后,第三處理部分905用所述抽樣數(shù)量來計(jì)算相關(guān)頻帶的數(shù)量numBands和頻帶邊界offsetBuf,例如根據(jù)上面給出的第一偽C-碼。
重要性標(biāo)記讀取部分909讀取每個(gè)頻帶的重要性標(biāo)記band Present并將該重要性標(biāo)記傳送到增益讀取部分910。增益讀取部分910讀取相應(yīng)頻帶的量化增益gain[i]并將用于每個(gè)重要頻帶的量化增益提供給VQ查詢部分911。
VQ查詢部分911進(jìn)一步讀取表示VQ標(biāo)記位是否與頻譜組相關(guān)的單比特vqFlag Present,如果所述單比特的值為‘0’,就讀取每個(gè)頻譜組的實(shí)際VQ標(biāo)記位vqFlagGroup,如果所述單比特的值為‘1’,就讀取接收到的每個(gè)頻譜組的代碼簿索引codebookIdx[i][j],或者在其它情況下就讀取那些VQ標(biāo)記位等于‘1’的每個(gè)頻譜組。
VQ查詢部分911還接收所用比特率的指示信息brMode,并且根據(jù)上面給出的第二偽C-碼對第三處理部分5確定的頻帶邊界offsetBuf進(jìn)行修改。
然后VQ查詢部分911根據(jù)解碼后的代碼簿索引來定位與m個(gè)抽樣組內(nèi)原始量化加強(qiáng)抽樣qfloat相對應(yīng)的量化加強(qiáng)抽樣gfloat。
然后將量化加強(qiáng)抽樣gfloat提供給反量化部分912,它根據(jù)下面的方程式來執(zhí)行反量化過程S^fe(i)=sign(gfloat(i))·gfloat(i)1.33·2-0.25·gain(n)]]>offsetBuf[n]≤i<o(jì)ffsetBuf[n+1] (22)對每個(gè)相關(guān)的頻帶也就是說,對于0≤n<numBands都使用上面的方程式,offsetBuf和numBands的值由第三處理部分905提供。
接著,將反量化抽樣 提供給第一處理部分903。
第一處理部分903還接收邊側(cè)信號 其由相加點(diǎn)901和比例單元902從立體聲擴(kuò)展解碼器716中接收的頻譜左聲道 和右聲道 信號中計(jì)算出來的,其值為S~f=(L~f-R~f)/2.]]>第一處理部分903根據(jù)下面的方程式將接收到的反量化抽樣 與接收到的邊側(cè)信號 相加S^f=s(j),0≤j<numTotalBands]]> (23)Ef(k)=S~f(offset+n)+S^fe(offset+n),0≤n<IS_WidthLenBuf[k]]]>其中參數(shù)offset表示在頻帶k中到頻譜抽樣開始位置的抽樣偏移。
將生成的抽樣 提供給反向MS矩陣部分906。而且,MDCT部分913對AMR-WB+單聲道解碼器元件714輸出的單聲道音頻信號 應(yīng)用MDCT,并將生成的頻譜單聲道音頻信號 同樣提供給反向MS矩陣部分906。反向MS矩陣部分906對那些在加強(qiáng)層比特流中發(fā)送非0量化加強(qiáng)抽樣的頻譜抽樣應(yīng)用反向MS矩陣,也就是由反向MS矩陣元件906來計(jì)算這些頻譜抽樣 和 立體聲擴(kuò)展解碼器716提供的頻譜左聲道 和右聲道 信號的剩余抽樣仍然保持不變。然后將所有頻譜左聲道信號 提供給第一IMDCT部分907,將所有頻譜右聲道信號 提供給第二IMDCT部分907。
最后,IMDCT部分907利用基于幀的IMDCT將頻譜左聲道信號 轉(zhuǎn)換到時(shí)域,以便獲得加強(qiáng)恢復(fù)左聲道信號 然后將 通過立體聲解碼器71輸出。同時(shí),IMDCT部分908利用基于幀的IMDCT將頻譜右聲道信號 轉(zhuǎn)換到時(shí)域,以便獲得加強(qiáng)恢復(fù)右聲道信號 同樣將 通過立體聲解碼器71輸出。
要注意的是,上述的實(shí)施例僅是本發(fā)明多種可能實(shí)施例中的一種。
權(quán)利要求
1.一種在多聲道音頻編碼系統(tǒng)的編碼端支持多聲道音頻擴(kuò)展的方法,所述方法包括將多聲道音頻信號的第一聲道信號(L)轉(zhuǎn)換到頻域,生成頻譜第一聲道信號(LMDCT);將所述多聲道音頻信號的第二聲道信號(R)轉(zhuǎn)換到頻域,生成頻譜第二聲道信號(RMDCT);為多個(gè)相鄰頻帶中的每一個(gè)確定在相應(yīng)頻帶中占支配地位的是所述頻譜第一聲道信號(LMDCT)、還是所述頻譜第二聲道信號(RMDCT)或者沒有一個(gè)所述頻譜聲道信號(LMDCT、RMDCT)占支配地位,并為所述每一個(gè)頻帶提供相應(yīng)的狀態(tài)信息。
2.如權(quán)利要求1所述的方法,還包括將所述第一聲道信號(L)和所述第二聲道信號(R)組合成單聲道音頻信號(M),并將所述單聲道信號(M)編碼成單聲道信號比特流;以及至少將所述單聲道信號比特流和所述提供的狀態(tài)信息多路復(fù)用成單比特流。
3.如權(quán)利要求1或2所述的方法,其中以幀的順序來排列所述第一聲道信號(L)和所述第二聲道信號(R),其中為所述第一聲道信號(L)和所述第二聲道信號(R)的每個(gè)幀提供所述狀態(tài)信息。
4.如上述任何一個(gè)權(quán)利要求所述的方法,進(jìn)一步包括在確定了所述頻譜第一聲道信號(LMDCT)和所述頻譜第二聲道信號(RMDCT)的其中之一在至少一個(gè)所述頻帶中占支配地位的情況下,計(jì)算和提供至少一個(gè)表示所述支配程度的增益值。
5.如權(quán)利要求4所述的方法,包括將所述第一聲道信號(L)和所述第二聲道信號(R)組合成單聲道音頻信號(M),并將所述單聲道信號(M)編碼成單聲道信號比特流;以及將所述單聲道信號比特流、所述提供的狀態(tài)信息和所述提供的至少一個(gè)增益值多路復(fù)用成單比特流。
6.如權(quán)利要求4或5所述的方法,其中以幀的順序來排列所述第一聲道信號(L)和所述第二聲道信號(R),其中為所述第一聲道信號(L)和所述第二聲道信號(R)的每個(gè)幀提供所述至少一個(gè)增益。
7.如權(quán)利要求4到6中任一個(gè)所述的方法,其中所述至少一個(gè)增益值包括為每一個(gè)所述頻帶指定的增益值,每個(gè)指定增益值表示所述頻譜第一聲道信號(LMDCT)和所述頻譜第二聲道信號(RMDCT)中相應(yīng)占支配地位的那一個(gè)在相應(yīng)頻帶中所確定的支配地位程度。
8.如權(quán)利要求7所述的方法,其中根據(jù)所述頻譜聲道信號(LMDCT、RMDCT)的頻譜抽樣值,分別為每個(gè)所述頻帶的所述頻譜第一聲道信號(LMDCT)和所述頻譜第二聲道信號(RMDCT)計(jì)算聲道加權(quán)值,其中確定特殊頻帶的所述指定增益值以便相應(yīng)于為所述特殊頻帶的所述頻譜聲道信號(LMDCT、RMDCT)中的一個(gè)計(jì)算的高加權(quán)值和為所述特殊頻帶的所述頻譜聲道信號(LMDCT、RMDCT)中的另一個(gè)計(jì)算的低加權(quán)值之間的比值。
9.如權(quán)利要求4到6中任一個(gè)所述的方法,其中所述至少一個(gè)增益值包括表示所述頻譜第一聲道信號(LMDCT)和所述頻譜第二聲道信號(RMDCT)在所有所述頻帶中的支配平均程度的公共增益值。
10.如權(quán)利要求9所述的方法,其中根據(jù)所述頻譜聲道信號(LMDCT、RMDCT)中的頻譜抽樣值,分別為每個(gè)所述頻帶的所述頻譜第一聲道信號(LMDCT)和所述頻譜第二聲道信號(RMDCT)計(jì)算聲道加權(quán)值,其中確定每個(gè)頻帶的初步指定增益值以便相應(yīng)于為相應(yīng)頻帶的所述頻譜聲道信號(LMDCT、RMDCT)中的一個(gè)計(jì)算的高加權(quán)值和為所述相應(yīng)頻帶的所述頻譜聲道信號(LMDCT、RMDCT)中的另一個(gè)計(jì)算的低加權(quán)值之間的比值,其中所述公共增益值被確定為所述初步指定增益值的平均值。
11.如權(quán)利要求4到10中任一個(gè)所述的方法,其中將所述至少一個(gè)增益值動(dòng)態(tài)范圍限定成至少是所述頻帶的較低一個(gè)的預(yù)定值。
12.如上述任何一個(gè)權(quán)利要求所述的方法,其中根據(jù)幾個(gè)編碼方案中的一個(gè)對所述狀態(tài)信息進(jìn)行編碼,所選擇的編碼方案至少部分取決于所述頻譜第一聲道信號(LMDCT)和所述頻譜第二聲道信號(RMDCT)中的哪一個(gè)在所有所述頻帶中更經(jīng)常占據(jù)支配地位。
13.如上述任何一個(gè)權(quán)利要求所述的方法,其中根據(jù)所述頻譜聲道信號(LMDCT、RMDCT)中的頻譜抽樣值,分別為每個(gè)所述頻帶的所述頻譜第一聲道信號(LMDCT)和所述頻譜第二聲道信號(RMDCT)計(jì)算聲道加權(quán)值,其中在為所述頻帶生成的高聲道加權(quán)值和為所述頻帶生成的低聲道加權(quán)值之間的比值達(dá)到或超過預(yù)定門限值的情況下,假設(shè)在所述頻帶中的一個(gè)特定頻帶內(nèi)存在支配性。
14.如上述任何一個(gè)權(quán)利要求所述的方法,進(jìn)一步包括基于所述狀態(tài)信息以及所述第一聲道信號(L)和所述第二聲道信號(R)的單聲道型式來生成重建的頻譜第一聲道信號( )和重建的頻譜第二聲道信號( );以及為那些所述狀態(tài)信息表示其中一個(gè)所述聲道信號(L、R)占據(jù)支配地位的頻帶產(chǎn)生和提供加強(qiáng)信息,所述加強(qiáng)信息在抽樣的基礎(chǔ)上一方面反映出所述重建頻譜第一和第二聲道信號( )之間的差值,另一方面反映出所述原始頻譜第一和第二聲道信號之間的差值。
15.如權(quán)利要求14所述的方法,其中生成所述加強(qiáng)信息包括通過調(diào)整相應(yīng)頻帶的量化增益,在頻帶基礎(chǔ)上一個(gè)抽樣接一個(gè)抽樣的將所述差值量化到預(yù)定的范圍,所述量化產(chǎn)生量化后的頻譜加強(qiáng)抽樣,其中相應(yīng)頻帶使用的所述量化增益作為所述加強(qiáng)信息的一部分而被提供。
16.如權(quán)利要求15所述的方法,其中只對可獲得具有非0值的量化后的頻譜加強(qiáng)抽樣的那些頻帶以及需要量化增益超過指定門限值的那些頻帶,才將所述量化頻譜增強(qiáng)抽樣提供給所述增強(qiáng)信息,為所述加強(qiáng)信息提供所述量化后的頻譜加強(qiáng)抽樣的那些頻帶的標(biāo)識信息是作為所述加強(qiáng)信息的一部分而被提供。
17.如權(quán)利要15或16所述的方法,其中生成所述加強(qiáng)信息進(jìn)一步包括以預(yù)定數(shù)量抽樣的組形式將所述量化后的頻譜加強(qiáng)抽樣分配給相應(yīng)代碼簿索引,所述代碼簿索引是作為所述加強(qiáng)信息的一部分而被提供。
18.如權(quán)利要求17所述的方法,其中只把相應(yīng)代碼簿索引分配給那些具有量化后的頻譜加強(qiáng)抽樣的組,所述組包括至少一個(gè)具有不等于0值的量化后的頻譜加強(qiáng)抽樣。
19.如權(quán)利要求14-18中任一個(gè)所述的方法,進(jìn)一步包括提供一種與提供至少所述狀態(tài)信息和所述加強(qiáng)信息所使用的比特率有關(guān)的信息,與所述比特率有關(guān)的所述信息是作為所述加強(qiáng)信息的一部分而被提供。
20.如上述任何一個(gè)權(quán)利要求所述的方法,其中所述第一聲道信號(L)是立體聲音頻信號的左聲道信號,所述第二聲道信號(R)是所述立體聲音頻信號的右聲道信號。
21.一種在多聲道音頻編碼系統(tǒng)的解碼端支持多聲道音頻擴(kuò)展的方法,所述方法包括將接收到的單聲道音頻信號(M)轉(zhuǎn)換到頻域,生成頻譜單聲道音頻信號;以及通過基于至少一個(gè)增益值并根據(jù)接收到的狀態(tài)信息,對所述頻譜第一聲道信號(LMDCT、 )和所述頻譜第二聲道信號(RMDCT、 )中每個(gè)信號的多個(gè)相鄰頻帶中每個(gè)頻帶的所述頻譜單聲道音頻信號分別加權(quán),從所述頻譜單聲道音頻信號中生成頻譜第一聲道信號(LMDCT、 )和頻譜第二聲道信號(RMDCT、 ),所述狀態(tài)信息為每個(gè)所述頻帶指示出了在相應(yīng)頻帶中占支配地位的是所述頻譜第一聲道信號(LMDCT、 )、還是所述頻譜第二聲道信號(RMDCT、 )或者沒有一個(gè)所述頻譜聲道信號(LMDCT、 RMDCT, )占支配地位。
22.如權(quán)利要求21中所述的方法,包括如果所述狀態(tài)信息表示所述相應(yīng)頻帶中所述第一聲道信號(LMDCT)占支配地位,就通過將對于相應(yīng)頻帶有效的所述至少一個(gè)增益值之一與所述相應(yīng)頻帶內(nèi)的所述頻譜單聲道音頻信號的抽樣相乘,在每個(gè)所述頻帶內(nèi)生成所述頻譜第一聲道信號(LMDCT);如果所述狀態(tài)信息表示所述相應(yīng)頻帶中所述第二聲道信號(RMDCT)占支配地位,就通過將所述增益值的倒數(shù)值與所述相應(yīng)頻帶內(nèi)的所述頻譜單聲道音頻信號的抽樣相乘,在每個(gè)所述頻帶內(nèi)生成所述頻譜第一聲道信號(LMDCT);否則就通過在所述相應(yīng)頻帶內(nèi)接收所述頻譜單聲道音頻信號,在每個(gè)所述頻帶內(nèi)生成所述頻譜第一聲道信號(LMDCT);以及如果所述狀態(tài)信息表示所述相應(yīng)頻帶中所述第二聲道信號(RMDCT)占支配地位,就通過將對于相應(yīng)頻帶有效的所述至少一個(gè)增益值之一與所述相應(yīng)頻帶內(nèi)的所述頻譜單聲道音頻信號的抽樣相乘,在每個(gè)所述頻帶內(nèi)生成所述頻譜第二聲道信號(RMDCT);如果所述狀態(tài)信息表示所述相應(yīng)頻帶中所述第一聲道信號(LMDCT)占支配地位,就通過將所述增益值的加權(quán)的或者未加權(quán)的倒數(shù)值與所述相應(yīng)頻帶內(nèi)的所述頻譜單聲道音頻信號的抽樣相乘,在每個(gè)所述頻帶內(nèi)生成所述頻譜第二聲道信號(RMDCT);否則就通過在所述相應(yīng)頻帶內(nèi)接收所述頻譜單聲道音頻信號,在每個(gè)所述頻帶內(nèi)生成所述頻譜第二聲道信號(RMDCT)。
23.如權(quán)利要求21或22所述的方法,包括這樣一個(gè)在先步驟,將接收到的比特流多路分解成至少一個(gè)單聲道信號比特流和狀態(tài)信息比特流,將所述單聲道信號比特流解碼成所述單聲道音頻信號(M),并將所述狀態(tài)信息比特流解碼成所述狀態(tài)信息
24.如權(quán)利要求23所述的方法,其中將所述接收到的比特流多路分解成單聲道信號比特流、狀態(tài)信息比特流和增益比特流,所述方法還包括將所述增益比特流解碼成所述至少一個(gè)增益值。
25.如權(quán)利要求21到24中任一個(gè)所述的方法,其中如果所述單聲道音頻信號(M)不是按要重建的原始多聲道音頻信號的時(shí)間順序排列的,就在所述單聲道音頻信號(M)轉(zhuǎn)換到時(shí)域之前對所述單聲道音頻信號(M)進(jìn)行延遲。
26.如權(quán)利要求21到25中任一個(gè)所述的方法,其中所述至少一個(gè)增益值包括用于所述多個(gè)頻帶中每一個(gè)頻帶的指定的增益值。
27.如權(quán)利要求26所述的方法,其中所述單聲道音頻信號(M)以幀的形式排列,其中通過對相應(yīng)頻帶的有效增益值和相應(yīng)下一個(gè)較低頻帶的有效增益值取平均,在每個(gè)幀的開始位置平滑所述增益值,其中通過對相應(yīng)頻帶的有效增益值和相應(yīng)下一個(gè)較高頻帶的有效增益值取平均,在每個(gè)幀的末尾位置平滑所述增益值。
28.如權(quán)利要求21到27中任一個(gè)所述的方法,其中為了獲取所述狀態(tài)信息,對接收到的狀態(tài)信息比特流進(jìn)行解碼,所述狀態(tài)信息比特流除了所述狀態(tài)信息之外還至少部分包括編碼方案信息,所述編碼方案信息表示了對所述狀態(tài)信息進(jìn)行編碼所采用的編碼方案,根據(jù)所述編碼方案信息來對所述狀態(tài)信息進(jìn)行解碼。
29.如權(quán)利要求21到28中任一個(gè)所述的方法,還包括將所述頻譜第一和第二聲道信號(LMDCT、RMDCT)轉(zhuǎn)換到時(shí)域,生成重建多聲道音頻信號的第一聲道信號(L)和第二聲道信號(R)。
30.如權(quán)利要求21到28中任一個(gè)所述的方法,還包括接收加強(qiáng)信息,所述加強(qiáng)信息至少對那些所述狀態(tài)信息表示所述聲道信號(L、R)中的一個(gè)占據(jù)支配地位的那些頻帶的一些頻譜抽樣,在抽樣的基礎(chǔ)上一方面反映出所述生成的頻譜第一和第二聲道信號( )之間的差值,另一方面反映出原始頻譜第一和第二聲道信號之間的差值;通過在一個(gè)抽樣接一個(gè)抽樣的基礎(chǔ)上考慮所述加強(qiáng)信息所反映出的所述差值來生成加強(qiáng)頻譜第一和第二聲道信號;以及將所述加強(qiáng)頻譜第一和第二聲道信號轉(zhuǎn)換到時(shí)域,生成重建多聲道音頻信號的第一聲道信號( )和第二聲道信號( )。
31.如權(quán)利要求30所述的方法,其中通過對從所述接收的加強(qiáng)信息中獲得的量化后的頻譜加強(qiáng)抽樣進(jìn)行反量化來獲得所述差值,所述反量化對可獲得量化后頻譜加強(qiáng)抽樣的每個(gè)頻帶使用指定量化增益,其中所述加強(qiáng)信息中指示了所述量化增益。
32.如權(quán)利要求31所述的方法,其中所述接收到的加強(qiáng)信息從所有的頻帶中將那些所述狀態(tài)信息表示所述聲道信號(L、R)中占支配地位的一個(gè)信號的頻帶以及那些可獲得量化后頻譜加強(qiáng)抽樣的頻帶標(biāo)識出來,其中在生成所述加強(qiáng)頻譜第一和第二聲道信號的過程中考慮所述頻帶的標(biāo)識信息。
33.如權(quán)利要求31或32所述的方法,其中通過將所述接收的加強(qiáng)信息中所包含的代碼簿索引的反向代碼映射成量化后的頻譜加強(qiáng)抽樣的相應(yīng)預(yù)定數(shù)量組的值,從所述接收的加強(qiáng)信息中獲得所述量化后的頻譜加強(qiáng)抽樣。
34.如權(quán)利要求33所述的方法,其中所述接收到的加強(qiáng)信息只包括用于所選擇抽樣組的代碼簿索引,其中所述加強(qiáng)信息還包括包含有代碼簿索引的所述組的標(biāo)識信息,其中在生成所述加強(qiáng)頻譜第一和第二聲道信號的過程中考慮所述組的標(biāo)識信息。
35.如權(quán)利要求30到34中任一個(gè)所述的方法,其中所述加強(qiáng)信息還包括提供至少所述狀態(tài)信息和所述加強(qiáng)信息所用的比特率的指示信息,所述比特率指示信息用于確定接收的加強(qiáng)信息的數(shù)量。
36.如權(quán)利要求21到35中任一個(gè)所述的方法,其中所述第一聲道信號(L)是立體聲音頻信號的左聲道信號,所述第二聲道信號(R)是所述立體聲音頻信號的右聲道信號。
37.一種多聲道音頻編碼器(20),包括用于實(shí)現(xiàn)權(quán)利要求1-20中任一個(gè)方法步驟的裝置(22-26;30-38)。
38.一種用于多聲道音頻編碼器(20)的多聲道擴(kuò)展編碼器(26),所述多聲道擴(kuò)展編碼器(26)包括用于實(shí)現(xiàn)權(quán)利要求1、3、4和6-20中任一個(gè)所述方法步驟的裝置(30-38)。
39.一種多聲道音頻解碼器(21),包括用于實(shí)現(xiàn)權(quán)利要求21-36中任一個(gè)所述方法步驟的裝置(27-29;40-46)。
40.一種用于多聲道音頻解碼器(20)的多聲道擴(kuò)展解碼器(29),所述多聲道擴(kuò)展編碼器(29)包括用于實(shí)現(xiàn)權(quán)利要求21、22和25-36中任一個(gè)所述方法步驟的裝置(40-46)。
41.一種多聲道音頻編碼系統(tǒng),包括具有用于實(shí)現(xiàn)權(quán)利要求1-20中任一個(gè)方法步驟的裝置(22-26;30-38)的編碼器(20),和具有用于實(shí)現(xiàn)權(quán)利要求21-36中任一個(gè)所述方法步驟的裝置(27-29;40-46)的解碼器(21)。
全文摘要
本發(fā)明涉及一種支持多聲道音頻擴(kuò)展的方法和單元。為了獲得有效的要求低計(jì)算復(fù)雜性的擴(kuò)展,建議在編碼端,對于從多聲道音頻信號中產(chǎn)生的單音頻信號(M)來講提供至少狀態(tài)信息作為側(cè)向信息。所述狀態(tài)信息表示多個(gè)頻段中的每一個(gè)頻段指示怎樣將預(yù)定的或等價(jià)提供的增益值在頻域中應(yīng)用到單聲道音頻信號(M),以獲得重建多聲道音頻信號的第一和第二聲道信號(L、R)。
文檔編號G10L19/008GK1748443SQ03826074
公開日2006年3月15日 申請日期2003年3月21日 優(yōu)先權(quán)日2003年3月4日
發(fā)明者J·奧彥佩拉 申請人:諾基亞有限公司