專利名稱:多聲道音頻編碼和/或解碼中改進的濾波器平滑的制作方法
技術領域:
本發(fā)明涉及音頻應用中的多聲道編碼/解碼技術,具體來說,涉及音頻傳送系統(tǒng)中和/或用于音頻存儲的立體聲編碼/解碼。可能的音頻應用的實例包括電話會議系統(tǒng)、移動通信系統(tǒng)中的立體聲音頻傳送、用于提供音頻服務的各種系統(tǒng)以及多聲道家庭影院系統(tǒng)。
為了更好地理解本發(fā)明,以現(xiàn)有電話存在的問題的概述和分析開始可能是有用的。如前面所述,目前不存在以經(jīng)濟上受關注的用于例如移動通信系統(tǒng)的比特率提供高立體聲或多聲道音頻質(zhì)量的可用的標準化編解碼器。采用可得到的編解碼器可能的情況是音頻信號的單聲道傳送和/或存儲。在某種程度上,立體聲傳送或存儲也是可得到的,但是比特率限制通常需要相當嚴格地限制立體聲表示。
現(xiàn)有技術的多聲道編碼技術的問題在于,它們需要更高的比特率以便提供好的質(zhì)量。強度立體聲在以低至例如只有幾kbps的低比特率應用時,遭遇到它不提供任何聲道間時間信息的事實。由于這種信息對于低于例如2kHz的低頻在感知上是重要的,所以無法以這類低頻提供立體聲感受。
另一方面,BCC能夠甚至在低頻以例如3kbps的低比特率再生立體聲或多聲道圖像,因為它還發(fā)送聲道間時間信息。但是,這種技術需要在編碼器以及解碼器上對聲道的每個的計算上要求高的時間頻率變換。此外,在使它們與原始聲道信號的感知差異為最小的意義上,BCC不嘗試發(fā)現(xiàn)從所發(fā)送單聲道信號到聲道信號的映射。
用于多聲道編碼的又稱作聲道間預測(ICP)的LMS技術(參見[4])通過省略殘留信號的傳送來允許更低的比特率。為了得出聲道重構(gòu)濾波器,無約束誤差最小化程序計算濾波器,使得其輸出信號最好地匹配目標信號。為了計算濾波器,可使用幾種誤差量度。均方誤差或加權均方誤差是眾所周知的,并且在計算上實現(xiàn)費用低。
大家知道,一般來說,現(xiàn)有技術方法的大多數(shù)是為高保真音頻信號或純語音的編碼開發(fā)的。在信號能量集中在較低頻率區(qū)域的語音編碼中,子帶編碼很少使用。雖然如BCC等的方法允許低比特率立體聲語音,但是子帶變換編碼處理增加復雜度以及延遲。
研究結(jié)果是,即使ICP編碼技術不提供高質(zhì)量立體聲信號的好結(jié)果,對于具有集中于較低頻率的能量的立體聲信號,冗余度減小也是可能的[5]。ICP濾波器的白化效果增加較高頻率區(qū)域中的能量,從而產(chǎn)生感知變換編碼器的凈編碼損失。在[6]和[7]中證實了這些結(jié)果,在其中,僅對于語音信號報道了質(zhì)量增強。
ICP重構(gòu)信號的準確性由當前聲道間相關來控制。Bauer等人[8]沒有發(fā)現(xiàn)音頻信號中的左與右聲道之間的任何線性關系。但是,從圖4中的單聲道和側(cè)信號的交叉譜中可以看到,在語音信號的較低頻率區(qū)域(0-2000Hz)中發(fā)現(xiàn)強的聲道間相關。在低聲道間相關的情況中,作為用于立體聲編碼的部件的ICP濾波器將產(chǎn)生目標信號的不良估算值。
連續(xù)幀之間的ICP濾波器特性的迅速變化造成重構(gòu)立體聲圖像中的干擾混疊偽像和不穩(wěn)定。這源于以下事實與固定濾波方案相反,預測方法引入大的頻譜變化。
當相鄰子帶的頻譜分量以不同方式修改時,類似的影響也存在于BCC中[10]。為了防止這個問題,BCC在分析與合成中采用交迭窗口。
交迭窗口的使用還解決了ICP濾波的混疊問題。但是,這是以相當大的性能降低為代價而得到的,因為在使用交迭幀時,濾波器系數(shù)對于當前幀通常完全不是最佳的。
總之,傳統(tǒng)的濾波器平滑一般導致相當大的性能降低,因此沒有被廣泛使用。
收聽測試表明,ICP濾波所引入的編碼偽像被感知為比立體聲寬度的暫時減小更令人不快。已經(jīng)認識到,當編碼濾波器提供目標信號的不良估算值時,偽像特別令人不快;估算值越差,則偽像越令人不快。因此,根據(jù)本發(fā)明的基本思路是引入信號自適應濾波器平滑作為解決先有技術的問題的新的一般概念。
圖5是根據(jù)本發(fā)明的一個示范優(yōu)選實施例的多聲道編碼器的示意框圖。多聲道編碼器主要包括可選的預處理單元110、可選的(線性)組合單元120、多個編碼器130、140、控制器150和可選的復用器(MUX)單元160。編碼器的數(shù)量N等于或大于2,并且包括第一編碼器130和第二編碼器140以及可能的其它編碼器。
一般來說,本發(fā)明考慮多聲道或多音信號。初始多聲道輸入信號可從音頻信號存儲裝置(未示出)提供或者例如從一組話筒(未示出)“現(xiàn)場”提供。如果不是數(shù)字形式,則音頻信號通常在進入多聲道編碼器之前被數(shù)字化。多聲道信號可提供給可選預處理單元110以及可選信號組合單元120,用于生成N個信號表示,例如主要信號表示和輔助信號表示以及可能的其它信號表示。
多聲道或多音信號可被提供給可選預處理單元110,在其中可執(zhí)行不同的信號調(diào)節(jié)程序。
(可選預處理)信號可被提供給可選信號組合單元120,它包括用于執(zhí)行不同信號組合程序、如輸入信號的線性組合以便產(chǎn)生至少第一信號和第二信號的多個組合模塊。例如,第一編碼過程可以是主要編碼過程,以及第一信號表示可以是主要信號表示。第二編碼過程例如可以是輔助(側(cè))信號過程,以及第二信號表示則可以是輔助(側(cè))信號表示、如立體聲側(cè)信號。例如,在傳統(tǒng)的立體聲編碼中,L和R聲道被求和,以及和信號除以因子2,以便提供傳統(tǒng)單聲道信號作為第一(主要)信號。L和R聲道也可相減,以及差信號除以因子2,以便提供傳統(tǒng)側(cè)信號作為第二信號。根據(jù)本發(fā)明,任何類型的線性組合或者那個方面的任何其它類型的信號組合可在信號組合單元中執(zhí)行,其中具有來自各個聲道的至少一部分的加權成分。大家理解,本發(fā)明使用的信號組合不限于兩個聲道,而是無疑可涉及多個聲道。還可能生成不止兩個信號,如圖5所示。甚至可能把輸入聲道之一直接用作第一信號,以及把輸入聲道中的另一個直接用作第二信號。例如,對于立體聲編碼,這意味著,L聲道可用作主要信號,以及R聲道可用作側(cè)信號,或者反之。還存在許多其它變化。
第一信號表示被提供給第一編碼器130,它按照任何適當?shù)木幋a原理對第一信號進行編碼。第二信號表示被提供給第二編碼器140,用于對第二信號進行編碼。如果采用不止兩個編碼器,則各附加信號表示通常在相應編碼器中編碼。
舉例來說,第一編碼器可以是主要編碼器,以及第二編碼器可以是側(cè)編碼器。在這種情況中,第二側(cè)編碼器140例如可包括自適應聲道間預測(ICP)級,用于根據(jù)第一信號表示和第二信號表示來生成信號重構(gòu)數(shù)據(jù)。第一(主要)信號表示可等效地從第一編碼器130所產(chǎn)生的信號編碼參數(shù)中推斷,如自第一編碼器的虛線所示。
整個多聲道編碼器還包括控制器150,它配置成響應多聲道音頻信號的特性而以信號自適應方式控制第二編碼器140中和/或附加編碼器的任一個中的濾波器平滑程序。通過使濾波器平滑取決于多聲道音頻信號的特性、如聲道間相關特性,例如能夠令控制器150根據(jù)多聲道音頻信號來估算編碼過程的預計性能,然后相應地調(diào)節(jié)平滑的程度和/或類型。這將提供更靈活的控制,使得濾波器平滑僅在實際需要時才執(zhí)行。性能越好,則需要越小程度的平滑。相反,編碼過程的預計性能越壞,則應當應用越多平滑。
可實現(xiàn)為獨立控制器150或者集成在所考慮的編碼器中的控制系統(tǒng)向編碼器提供適當?shù)目刂泼睢?br>
各種編碼器的輸出信號優(yōu)選地在復用器單元160中復用為單個傳送(或存儲)信號。但是,作為備選,輸出信號可分開發(fā)送(或存儲)。
一般來說,編碼通常逐幀執(zhí)行,一次一幀,以及各幀通常包括預定義時間周期內(nèi)的音頻樣本。
圖6是示意流程圖,闡述根據(jù)本發(fā)明的一個優(yōu)選實施例的基本多聲道編碼程序。在步驟S1,一個或多個音頻聲道的第一信號表示在第一編碼過程中編碼。在步驟S2,一個或多個音頻聲道的第二信號表示在第二編碼過程中編碼。在步驟S3,響應多聲道音頻信號的特性而在第二編碼過程或者對應的解碼過程中以信號自適應方式執(zhí)行濾波器平滑。
圖7是更詳細的示意流程圖,說明根據(jù)本發(fā)明的一個優(yōu)選實施例的示范編碼程序。在步驟S11,第一信號表示在第一編碼過程中編碼。在步驟S12,第一編碼過程和/或第二編碼過程的預計性能根據(jù)多聲道音頻輸入信號來估算。在步驟S13,第二編碼過程中的濾波器平滑根據(jù)所估算性能來動態(tài)配置?;蛘撸诓襟ES14,濾波器平滑信息可發(fā)送給解碼側(cè),下面將進行說明。最后,在步驟S15,第二信號表示優(yōu)選地根據(jù)自適應配置的濾波器平滑(除非濾波器平滑應當在解碼側(cè)執(zhí)行)在第二編碼過程中編碼。
通過根據(jù)估算性能動態(tài)適配濾波器平滑,能夠更靈活地控制濾波器平滑。因此,可完全避免例如當預計編碼性能足夠時的信號能量的不必要的減小。
整個解碼過程一般相當簡單,并且主要包括讀取入局數(shù)據(jù)流、(可能采用所發(fā)送控制信息來解釋數(shù)據(jù))、多聲道音頻信號的逆量化和最終重構(gòu)。更具體來說,響應第一信號重構(gòu)數(shù)據(jù),在第一解碼過程中對所述多個聲道中的至少一個的已編碼第一信號表示進行解碼。響應第二信號重構(gòu)數(shù)據(jù),在第二解碼過程中對所述多個聲道中的至少一個的已編碼第二信號表示進行解碼。如果濾波器平滑應當在解碼側(cè)而不是在編碼側(cè)執(zhí)行,則表示信號自適應濾波器平滑的信息將必須從編碼側(cè)發(fā)送(圖7中的S14)。這使解碼器能夠根據(jù)這個信息在對應的第二解碼過程中執(zhí)行信號自適應濾波器平滑。
為了更詳細地理解,現(xiàn)在主要參照立體聲(雙聲道)編碼和解碼來描述本發(fā)明。但是,應當記住,本發(fā)明一般適用于多個聲道。實例包括但不限于編碼/解碼5.1(前左、前中置、前右、后左和后右以及低音揚聲器)或者2.1(左、右和中置低音揚聲器)多聲道音響。
圖8是示意框圖,說明根據(jù)本發(fā)明的一個示范優(yōu)選實施例的編碼器的相干部分。編碼器主要包括用于對第一(主要)信號、如典型單聲道信號進行編碼的第一(主要)編碼器130、用于(輔助/側(cè))信號編碼的第二(輔助/側(cè))編碼器140、控制器150以及可選的復用器單元160??刂破?50適合于接收主要信號表示和側(cè)信號表示(或者多聲道音頻信號的其它任何適當表示),并且配置成執(zhí)行必要的計算,以便提供側(cè)編碼器140中的濾波器平滑的自適應控制。
控制器150可以是“獨立的”控制器或者集成到側(cè)編碼器140中。編碼參數(shù)優(yōu)選地在復用器單元160中復用為單個傳送或存儲信號。如果濾波器平滑將在解碼側(cè)執(zhí)行,則控制器生成適當?shù)钠交畔?,以及該信息?yōu)選地經(jīng)由復用器發(fā)送到解碼側(cè)。
圖9是示意框圖,說明根據(jù)本發(fā)明的一個示范實施例的側(cè)編碼器和關聯(lián)控制系統(tǒng)的相干部分??刂葡到y(tǒng)150包括用于估算濾波器性能的模塊152以及用于濾波器平滑配置的模塊。用于估算濾波器性能的模塊152優(yōu)選地根據(jù)多聲道音頻信號的主要信號表示和側(cè)信號表示進行操作,以及估算側(cè)編碼器140中的濾波器的預計性能。濾波器例如可以是諸如ICP濾波器之類的參數(shù)濾波器或者是本領域已知的其它任何適當?shù)膫鹘y(tǒng)濾波器。對于ICP濾波器,性能可根據(jù)預測誤差來計算。這可等效地表示為預測增益。用于濾波器平滑配置的模塊154響應估算濾波器性能而進行濾波器平滑設定的必要適配,以及相應地控制側(cè)編碼器中的濾波器平滑。
圖10是示意框圖,說明根據(jù)本發(fā)明的一個示范優(yōu)選實施例的解碼器的相干部分。解碼器主要包括可選解復用器單元210、第一(主要)解碼器230、第二(輔助/側(cè))解碼器240、控制器250、可選信號組合單元260以及可選后處理單元270。解復用器210優(yōu)選地分離入局重構(gòu)信息、如第一(主要)信號重構(gòu)數(shù)據(jù)、第二(輔助/側(cè))信號重構(gòu)數(shù)據(jù)以及控制信息、如關于幀分割配置和濾波器長度的信息。第一(主要)解碼器230響應通常以表示編碼參數(shù)的第一(主要)信號的形式提供的第一(主要)信號重構(gòu)數(shù)據(jù)而“重構(gòu)”第一(主要)信號。第二(輔助/側(cè))解碼器240優(yōu)選地響應已量化濾波器系數(shù)和已重構(gòu)第一信號表示而“重構(gòu)”第二(側(cè))信號。第二(側(cè))解碼器240還由可能或者可能沒有集成在側(cè)解碼器中的控制器250控制。在這個實例中,控制器250接收來自編碼側(cè)的平滑信息、如平滑因數(shù),以及相應地控制側(cè)解碼器240。
為了更透徹地理解本發(fā)明,現(xiàn)在將參照基于參數(shù)編碼原理、如聲道間預測的各種示范實施例更詳細地描述本發(fā)明。
采用聲道間預測的參數(shù)編碼 一般來說,聲道間預測(ICP)技術利用聲道之間的固有聲道間相關。在立體聲編碼中,聲道通常由左和右信號l(n),r(n)表示,等效表示是單聲道信號m(n)(主要信號的一個特例)和側(cè)信號s(n)。兩種表示是等效的,并且通常通過傳統(tǒng)矩陣運算相關 ICP技術針對通過估算值(n)來表示側(cè)信號s(n),(n)通過經(jīng)由具有N個濾波器系數(shù)ht(i)的時變FIR濾波器H(z)對單聲道信號m(n)進行濾波來獲得 應當注意,同樣的方式可直接應用于左和右聲道。
在編碼器上得出的ICP濾波器例如可通過使側(cè)信號預測誤差e(n)的均方誤差(MSE)或者相關的性能量度、如心理聲學加權均方誤差為最小來估算。MSE通常由下式給出 式中,L是幀大小,以及N是ICP濾波器的長度/階/維。簡單地說,ICP濾波器的性能、因而MSE的大小是確定最終立體聲分離的主要因素。由于側(cè)信號描述左與右聲道之間的差異,因此,準確的側(cè)信號重構(gòu)是確保足夠?qū)挼牧Ⅲw聲圖像必不可少的。
通過使對于所有樣本的預測誤差的MSE為最小來找出最佳濾波器系數(shù),并且表示為 hoptTR=rhopt=R-1r(4) 在(4)中,相關向量r和協(xié)方差矩陣R定義為 r=Ms R=MMT(5) 式中 s=[s(0)s(1)…s(L-1)]T,
將(5)代入(3),得到(非量化)ICP濾波器的最小MSE(MMSE)的簡化代數(shù)表達式 MMSE=MSE(hopt)=PSS-rTR-1r(7) 式中,PSS是側(cè)信號的功率,又表示為sTs。
將r=Rhopt代入(7),得到 MMSE=PSS-rTR-1Rhopt=PSS-rThopt(8) 對R的LDLT因數(shù)分解[9]給出等式系統(tǒng)
式中,首先以迭代方式求解z
現(xiàn)在引入新的向量q=LTh。由于矩陣D僅在對角線具有非零值,求出q是簡單的 所求的濾波器向量h這時可通過與(10)相同的方式迭代地計算
除了與正則矩陣求逆相比的計算節(jié)省之外,這個解決方案還提供有效計算與不同維n(濾波器長度)對應的濾波器系數(shù)的可能性 最佳ICP(FIR)濾波器系數(shù)hopt可逐幀地被估算、量化以及發(fā)送給解碼器。
一般來說,濾波器系數(shù)被看作向量,它們采用向量量化(VQ)來有效地量化。濾波器系數(shù)的量化是ICP編碼程序的最重要方面之一。會看到,對濾波器系數(shù)引入的量化噪聲可能直接與MSE的損失相關。
MMSE先前已經(jīng)定義為 量化hopt產(chǎn)生量化誤差e新的MSE現(xiàn)在可寫作 由于Rhopt=r,因此,(15)中的最后兩項抵消,以及已量化濾波器的MSE變?yōu)? 這意味著,為了具有任何預測增益,量化誤差項必須小于預測項,即rThopt>eTRe。
目標可能并非始終是單獨使MSE為最小,而是將它與平滑和調(diào)整結(jié)合,以便能夠處理單聲道與側(cè)信號之間不存在相關的情況。
非正式收聽測試表明,ICP濾波引入的編碼偽像被感知為比立體聲寬度的暫時減小更令人不快。根據(jù)一個示范實施例,因此,立體聲寬度、即側(cè)信號能量每當遇到有問題的幀時被有意減小。在最壞情況、即完全沒有ICP濾波的情況中,所得立體聲信號被減小到完全單聲道。另一方面,如果幀根本沒有問題,則信號能量不必減小。
能夠從協(xié)方差矩陣R和相關向量r計算預計濾波性能、如預計預測增益,而無需執(zhí)行實際濾波。這優(yōu)選地由控制系統(tǒng)進行,如前面所述。已經(jīng)發(fā)現(xiàn),當預計預測增益低時,或者等效地當單聲道與側(cè)信號之間的相關低時,編碼偽像主要存在于重構(gòu)側(cè)信號中。在一個示范實現(xiàn)中,已經(jīng)創(chuàng)立幀分類算法,它根據(jù)預測增益的估算等級來執(zhí)行分類。例如,當預測增益(或相關)下降到低于某個門限時,用來得出ICP濾波器的協(xié)方差矩陣可按照下式修改 R*=R+ρdiag(R)(17) 可使平滑因數(shù)ρ的值是自適應的,以便幫助修改的不同等級。已修改ICP濾波器計算為h*=(R*)-1r。顯然,ICP濾波器的能量減小,因而減小重構(gòu)側(cè)信號的能量。用于減小所產(chǎn)生估算誤差的其它方案也是可能的。這提供平滑效果,因為信號能量的減小一般減小不同幀之間的差異,考慮到在逐幀的預測信號中可能原本存在大差異的事實。
連續(xù)幀之間的ICP濾波器特性的迅速變化造成重構(gòu)立體聲圖像中的干擾混疊偽像和不穩(wěn)定。這源于以下事實與固定濾波方案相反,預測方法引入大的頻譜變化。
當相鄰子帶的頻譜分量以不同方式被修改時,類似的影響也存在于BCC中[10]。為了防止這個問題,BCC在分析與合成中采用交迭窗口。
交迭窗口的使用還解決了ICP濾波的混疊問題。但是,BCC中交迭窗口的使用不是表示信號自適應濾波器平滑,因為對于所有所考慮幀將存在“固定”平滑效果和能量減小,而與例如是否實際需要減小無關。這導致相當大的性能降低。
在本發(fā)明的一個示范實施例中,提出修改的成本函數(shù)。它定義為 ξ(ht,ht-1)=MSE(ht)+ψ(ht,ht-1) =MSE(ht)+μ(ht-ht-1)TR(ht-ht-1)(18) 式中,ht和ht-1分別是在幀t和(t-1)的ICP濾波器。計算(18)的偏導數(shù)并將它設置為零的操作產(chǎn)生新的平滑ICP濾波器 平滑因數(shù)μ確定前一個ICP濾波器的作用,由此控制平滑等級。所提出的濾波器平滑有效地消除編碼偽像,并且使立體聲圖像穩(wěn)定。通過使平滑因數(shù)是信號自適應的并取決于濾波器性能,可減輕因平滑而引起的立體聲圖像寬度減小的問題。當應用于當前幀的前一個濾波器的預測增益高時,優(yōu)選地使用大的平滑因數(shù)。但是,如果前一個濾波器導致預測增益的惡化,則平滑因數(shù)可逐漸減小。
技術人員會知道,平滑信息、如上述平滑因數(shù)可被發(fā)送到解碼側(cè),以及信號自適應濾波器平滑可等效地在解碼側(cè)而不是在編碼側(cè)執(zhí)行。
上述實施例只作為實例給出,并且應該理解,本發(fā)明不限于此。保留了本文所公開并要求其權益的根本的基本原理的其它修改、變更和改進均處于本發(fā)明的范圍之內(nèi)。
參考文獻Johnston的美國專利No.5285498。Veldhuis等人的歐洲專利No.0497413。C.Faller等人的“應用于立體聲和多聲道音頻壓縮的雙耳線索編碼”,112th AES convention,2002年5月,Munich,Germany。Holt等人的美國專利No.5434948。S-S.Kuo、J.D.Johnston的“關于交叉聲道預測不適用于感知音頻編碼的原因的研究”,IEEE Signal Processing Lett.,vol.8,第245-247頁。B.Edler、C.Faller和G.Schuller的“采用時變線性前置和后置濾波器的感知音頻編碼”,in AES Convention,Los Angeles,CA,2000年9月。Bernd Edler和Gerald Schuller的“采用心理聲學前置和后置濾波器的音頻編碼”,ICASSP-2000 Conference Record,2000年。Dieter Bauer和Dieter Seitzer的“時域中的高質(zhì)量立體聲信號的統(tǒng)計屬性”,IEEE International Conf.on Acoustics,Speech,andSignal Processing,vol.3,第2045-2048頁,1989年5月。Gene H.Golub和Charles F.van Loan的“矩陣計算”,第2版,第4章,第137-138頁,The John Hopkins University Press,1989年。C.Faller和F.Baumgarte的“雙耳線索編碼-第I部分心理聲學基礎和設計原理”,IEEE Trans.Speech Audio Processing,vol.11,第509-519頁,2003年11月。
權利要求
1.一種對多聲道音頻信號進行編碼的方法,包括以下步驟
-在第一編碼過程中對所述多個聲道中的至少一個的第一信號表示進行編碼;
-在基于濾波器的第二編碼過程中對所述多個聲道中的至少一個的第二信號表示進行編碼,
其特征在于,在所述第二編碼過程中執(zhí)行信號自適應濾波器平滑。
2.如權利要求1所述的編碼方法,其特征在于,執(zhí)行信號自適應濾波器平滑的所述步驟包括根據(jù)所述多聲道音頻信號的特性來適配所述濾波器平滑的步驟。
3.如權利要求1所述的編碼方法,其特征在于,執(zhí)行信號自適應濾波器平滑的所述步驟包括以下步驟
-估算所述第一編碼過程和所述第二編碼過程中的至少一個的預計性能;以及
-根據(jù)所述估算性能來適配所述濾波器平滑。
4.如權利要求3所述的編碼方法,其特征在于,估算所述第一編碼過程和所述第二編碼過程中的至少一個的預計性能的所述步驟根據(jù)所述多聲道音頻信號的特性來執(zhí)行。
5.如權利要求3所述的編碼方法,其特征在于,估算所述第一編碼過程和所述第二編碼過程中的至少一個的預計性能的所述步驟根據(jù)所述多聲道音頻信號的聲道間相關特性來執(zhí)行。
6.如權利要求3所述的編碼方法,其特征在于,所述第二編碼過程的濾波器的預計性能根據(jù)所述多聲道音頻信號的特性來估算,以及所述濾波器平滑根據(jù)所估算濾波器性能來適配。
7.如權利要求6所述的編碼方法,其特征在于,所述濾波器平滑通過根據(jù)所估算濾波器性能修改所述第二編碼過程的濾波器來執(zhí)行。
8.如權利要求7所述的編碼方法,其特征在于,所述濾波器通過根據(jù)所估算濾波器性能進行適配的平滑因數(shù)來修改。
9.如權利要求7所述的編碼方法,其特征在于,所述濾波器平滑通過根據(jù)所估算濾波器性能減小所述第二編碼過程的濾波器的能量來執(zhí)行。
10.如權利要求1所述的編碼方法,其特征在于,所述第二編碼過程包括用于根據(jù)所述第一信號表示和所述第二信號表示來預測所述第二信號表示的聲道間預測,以及所述濾波器平滑根據(jù)所述第二編碼過程的所估算性能來執(zhí)行。
11.如權利要求10所述的編碼方法,其特征在于,所述性能表示所述聲道間預測的預測增益。
12.一種用于對多聲道音頻信號進行編碼的裝置,包括
-第一編碼器,用于對所述多個聲道中的至少一個的第一信號表示進行編碼;
-基于濾波器的第二編碼器,用于對所述多個聲道中的至少一個的第二信號表示進行編碼,
其特征在于,用于在所述基于濾波器的第二編碼器中執(zhí)行信號自適應濾波器平滑的部件。
13.如權利要求12所述的編碼裝置,其特征在于,用于執(zhí)行信號自適應濾波器平滑的所述部件包括用于根據(jù)所述多聲道音頻信號的特性來適配所述濾波器平滑的部件。
14.如權利要求12所述的編碼裝置,其特征在于,用于執(zhí)行信號自適應濾波器平滑的所述部件包括
-用于估算所述第一編碼過程和所述第二編碼過程中的至少一個的預計性能的部件;以及
-用于根據(jù)所估算性能來適配所述濾波器平滑的部件。
15.如權利要求14所述的編碼裝置,其特征在于,所述估算部件可用于根據(jù)所述多聲道音頻信號的特性來估算所述第一編碼過程和所述第二編碼過程中的至少一個的預計性能。
16.如權利要求14所述的編碼裝置,其特征在于,所述估算部件可用于根據(jù)所述多聲道音頻信號的聲道間相關特性來估算所述第一編碼過程和所述第二編碼過程中的至少一個的預計性能。
17.如權利要求14所述的編碼裝置,其特征在于,所述估算部件可用于根據(jù)所述多聲道音頻信號的特性來估算所述第二編碼過程的濾波器的預計性能,以及所述適配部件可用于根據(jù)所估算濾波器性能來適配所述濾波器平滑。
18.如權利要求17所述的編碼裝置,其特征在于,用于適配所述濾波器平滑的所述部件包括用于根據(jù)所估算濾波器性能來修改所述第二編碼過程的濾波器的部件。
19.如權利要求18所述的編碼裝置,其特征在于,用于適配所述濾波器平滑的所述部件包括用于根據(jù)所估算濾波器性能來適配平滑因數(shù)的部件,以及用于修改所述濾波器的所述部件可用于根據(jù)所述平滑因數(shù)來修改所述濾波器。
20.如權利要求18所述的編碼裝置,其特征在于,用于修改所述濾波器的所述部件包括用于根據(jù)所估算濾波器性能來減小所述第二編碼過程的濾波器的能量的部件。
21.如權利要求12所述的編碼裝置,其特征在于,所述第二編碼器包括用于根據(jù)所述第一信號表示和所述第二信號表示來預測所述第二信號表示的自適應聲道間預測濾波器,以及用于執(zhí)行信號自適應濾波器平滑的所述部件可用于根據(jù)所述第二編碼器的估算性能來執(zhí)行濾波器平滑。
22.如權利要求21所述的編碼裝置,其特征在于,用于執(zhí)行信號自適應濾波器平滑的部件可用于根據(jù)所述聲道間預測濾波器的預測增益來執(zhí)行濾波器平滑。
23.一種對已編碼多聲道音頻信號進行解碼的方法,包括以下步驟
-響應第一信號重構(gòu)數(shù)據(jù),在第一解碼過程中對所述多個聲道中的至少一個的已編碼第一信號表示進行解碼;
-響應第二信號重構(gòu)數(shù)據(jù),在第二解碼過程中對所述多個聲道中的至少一個的已編碼第二信號表示進行解碼,
其特征在于
-從編碼側(cè)接收表示信號自適應濾波器平滑的信息;以及
-根據(jù)所述信息在所述第二解碼過程中執(zhí)行信號自適應濾波器平滑。
24.如權利要求23所述的方法,其特征在于,所述信號自適應信息包括取決于所述編碼側(cè)的編碼過程的估算性能的平滑因數(shù)。
25.一種用于對已編碼多聲道音頻信號進行解碼的裝置,包括
-用于響應第一信號重構(gòu)數(shù)據(jù)而在第一解碼過程中對所述多個聲道中的至少一個的已編碼第一信號表示進行解碼的部件;
-用于響應第二信號重構(gòu)數(shù)據(jù)而在第二解碼過程中對所述多個聲道中的至少一個的已編碼第二信號表示進行解碼的部件,
其特征在于
-用于從對應的編碼端接收表示信號自適應濾波器平滑的信息的部件;以及
-用于根據(jù)所述信息在所述第二解碼過程中執(zhí)行信號自適應濾波器平滑的部件。
26.如權利要求25所述的裝置,其特征在于,所述信號自適應信息包括取決于所述編碼側(cè)的編碼過程的估算性能的平滑因數(shù)。
27.一種音頻傳送系統(tǒng),其特征在于,所述系統(tǒng)包括權利要求12的編碼裝置和權利要求25的解碼裝置中的至少一個。
全文摘要
在第一編碼過程中對多個聲道的一個或多個的第一信號表示進行編碼(S1),以及在基于濾波器的第二編碼過程中對多個聲道的一個或多個的第二信號表示進行編碼(S2)。濾波器平滑可用來減小編碼偽像的影響。但是,傳統(tǒng)的濾波器平滑一般導致相當大的性能降低,因此沒有被廣泛使用。已經(jīng)認識到,編碼偽像被感知為比立體聲寬度的暫時減小更令人不快,以及當編碼濾波器提供目標信號的不良估算值時,偽像特別令人不快;估算值越差,則偽像越令人不快。因此,在第二編碼過程或者對應的解碼過程中引入信號自適應濾波器平滑(S3),作為用于解決先有技術的問題的新的一般概念。
文檔編號H04B1/66GK101128867SQ200680005651
公開日2008年2月20日 申請日期2006年2月22日 優(yōu)先權日2005年2月23日
發(fā)明者A·塔勒布, S·安德森 申請人:艾利森電話股份有限公司