欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種處理音頻信號(hào)的方法和裝置制造方法

文檔序號(hào):2826430閱讀:177來(lái)源:國(guó)知局
一種處理音頻信號(hào)的方法和裝置制造方法
【專利摘要】本發(fā)明公開(kāi)了一種用于處理音頻信號(hào)的裝置及其方法。本發(fā)明包括:當(dāng)將第二編譯方案應(yīng)用于當(dāng)前幀時(shí),通過(guò)音頻處理裝置接收窗口類型信息,所述窗口類型信息表示多個(gè)窗口當(dāng)中的用于當(dāng)前幀的特定窗口;并且根據(jù)窗口類型信息將當(dāng)前窗口應(yīng)用于當(dāng)前幀,其中,當(dāng)將第一編譯方案應(yīng)用于先前幀時(shí),所述多個(gè)窗口是由短窗口、第一過(guò)渡窗口、第二過(guò)渡窗口組成的,其中,短窗口具有寬度是N/8的至少一個(gè)上升線,并且第一過(guò)渡窗口和第二過(guò)渡窗口具有寬度是N/4的上升線(其中N是幀長(zhǎng))。
【專利說(shuō)明】一種處理音頻信號(hào)的方法和裝置
[0001]本申請(qǐng)是2012年3月23日提交的國(guó)際申請(qǐng)日為2010年7月27日、申請(qǐng)?zhí)枮?01080042540.6 (PCT/KR2010/004918)的,發(fā)明名稱為“一種處理音頻信號(hào)的方法和裝置”專利申請(qǐng)的分案申請(qǐng)。
【技術(shù)領(lǐng)域】
[0002]本發(fā)明涉及一種用于對(duì)音頻信號(hào)進(jìn)行處理的裝置以及其方法。雖然本發(fā)明適用于廣泛的應(yīng)用范圍,但是其尤其適用于對(duì)音頻信號(hào)進(jìn)行編碼或解碼。
【背景技術(shù)】
[0003]通常,基于音頻特征的編譯方案被應(yīng)用于諸如音樂(lè)信號(hào)這樣的音頻信號(hào),而基于語(yǔ)音特征的編譯方案被應(yīng)用于語(yǔ)音信號(hào)。

【發(fā)明內(nèi)容】

[0004]技術(shù)問(wèn)題
[0005]然而,如果將規(guī)定的編譯方案應(yīng)用于在其中音頻和語(yǔ)音特征相互混合的信號(hào),那么音頻編碼效率被降低或者音質(zhì)被惡化。
[0006]技術(shù)方案
[0007]因此,本發(fā)明是指用于對(duì)音頻信號(hào)進(jìn)行處理的裝置及其方法,其基本上可消除由于現(xiàn)有技術(shù)的局限性和缺點(diǎn)所造成的一個(gè)或多個(gè)問(wèn)題。
[0008]本發(fā)明的目的是提供一種用于對(duì)音頻信號(hào)進(jìn)行處理的裝置及其方法,通過(guò)其可將至少兩種編譯方案中的一個(gè)應(yīng)用于一個(gè)幀或子幀。
[0009]本發(fā)明的另一個(gè)目的是提供一種用于對(duì)音頻信號(hào)進(jìn)行處理的裝置及其方法,通過(guò)其在將不同編譯方案應(yīng)用于包括一系列幀的音頻信號(hào)的每個(gè)幀或子幀的過(guò)程中,可解決由于與每個(gè)編譯方案相對(duì)應(yīng)的窗口形狀的不對(duì)稱所產(chǎn)生的不匹配。
[0010]本發(fā)明的另一個(gè)目的是提供一種用于對(duì)音頻信號(hào)進(jìn)行處理的裝置及其方法,通過(guò)其可在矩形窗口和非矩形窗口相互接觸時(shí),消除混疊等等。
[0011]本發(fā)明的另一個(gè)目的是提供一種用于對(duì)音頻信號(hào)進(jìn)行處理的裝置及其方法,通過(guò)其,如果頻域方案所應(yīng)用的幀跟在線性預(yù)測(cè)域方案所應(yīng)用的幀之后,則可跳過(guò)用于對(duì)窗口長(zhǎng)度差進(jìn)行補(bǔ)償?shù)拇翱趥鬏敗?br> [0012]本發(fā)明的另一個(gè)目的是提供一種用于對(duì)音頻信號(hào)進(jìn)行處理的裝置及其方法,通過(guò)其以根據(jù)隨后幀的編譯方案來(lái)對(duì)與當(dāng)前幀相對(duì)應(yīng)的窗口類型進(jìn)行轉(zhuǎn)換的方式,可解決由于窗口形狀的不對(duì)稱所導(dǎo)致的不匹配。
[0013]本發(fā)明的進(jìn)一步目的是提供一種用于對(duì)音頻信號(hào)進(jìn)行處理的裝置和方法,通過(guò)其以根據(jù)先前幀是否是頻域方案的幀來(lái)有選擇地應(yīng)用長(zhǎng)期預(yù)測(cè)的方式,可提高線性預(yù)測(cè)域方案的幀中的比特效率。
[0014]將在隨后的描述中對(duì)本發(fā)明的附加特征和優(yōu)點(diǎn)進(jìn)行闡述,并且其部分地可從該描述顯而易見(jiàn)地得知,或者從本發(fā)明的實(shí)施中學(xué)習(xí)到。通過(guò)所寫(xiě)的描述和其權(quán)利要求以及附圖中所指出的特定結(jié)構(gòu)可實(shí)現(xiàn)并獲得本發(fā)明的目的及其它優(yōu)點(diǎn)。
[0015]為了實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,如具體體現(xiàn)且廣泛描述地,提供了一種用于處理音頻信號(hào)的方法,其包括:通過(guò)音頻處理裝置接收音頻信號(hào),所述音頻信號(hào)包括以矩形編譯方案編碼的第一塊的第一數(shù)據(jù),以及以非矩形編譯方案編碼的第二塊的第二數(shù)據(jù);接收與第二塊相對(duì)應(yīng)的補(bǔ)償信號(hào);利用第一數(shù)據(jù)估計(jì)混疊部分的預(yù)測(cè);根據(jù)第二數(shù)據(jù)、補(bǔ)償信號(hào)、以及混疊部分的預(yù)測(cè)來(lái)獲得用于第二塊的重建信號(hào)。
[0016]根據(jù)本發(fā)明,矩形編譯方案以矩形窗口來(lái)編碼或解碼,非矩形編譯方案以非矩形窗口來(lái)編碼或解碼。
[0017]根據(jù)本發(fā)明,根據(jù)校正部分以及混疊部分的誤差來(lái)產(chǎn)生補(bǔ)償信號(hào),校正部分對(duì)應(yīng)于和矩形窗口與非矩形窗口之間的不對(duì)稱有關(guān)的差異,混疊部分的誤差對(duì)應(yīng)于混疊部分和混疊部分的預(yù)測(cè)之間的差異。
[0018]根據(jù)本發(fā)明,混疊部分對(duì)應(yīng)于第一塊和用于非矩形編譯方案的非矩形窗口之間的
重疊部分。
[0019]根據(jù)本發(fā)明,估計(jì)預(yù)測(cè)包括:根據(jù)矩形窗口方案利用第一塊的第一數(shù)據(jù)來(lái)產(chǎn)生用于第一塊的輸出信號(hào);利用用于第一塊的輸出信號(hào)以及非矩形窗口來(lái)獲得混疊部分的預(yù)測(cè)。
[0020]根據(jù)本發(fā)明,重建信號(hào)近似于以矩形窗口處理的信號(hào),該矩形窗口與用于非矩形編譯方案的非矩形窗口不同。
[0021]根據(jù)本發(fā)明,獲得重建信號(hào)包括:對(duì)第二數(shù)據(jù)進(jìn)行逆頻率變換以產(chǎn)生時(shí)域第二信號(hào);對(duì)補(bǔ)償信號(hào)進(jìn)行逆頻率變換以產(chǎn)生時(shí)域補(bǔ)償信號(hào);通過(guò)將時(shí)域補(bǔ)償信號(hào)添加到時(shí)域第二信號(hào)和混疊部分的預(yù)測(cè),而獲得重建信號(hào)。
[0022]根據(jù)本發(fā)明,第一塊與巾貞和子巾貞中的一個(gè)相對(duì)應(yīng),并且第二塊與巾貞和子巾貞中的一個(gè)相對(duì)應(yīng)。
[0023]為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供一種用于處理音頻信號(hào)的裝置,其包括:解復(fù)用器,其接收音頻信號(hào),所述音頻信號(hào)包括以矩形編譯方案編碼的第一塊的第一數(shù)據(jù),以及以非矩形編譯方案編碼的第二塊的第二數(shù)據(jù),并且用于接收與第二塊相對(duì)應(yīng)的補(bǔ)償信號(hào);矩形解碼單元,用于利用第一數(shù)據(jù)估計(jì)混疊部分的預(yù)測(cè);以及非矩形解碼單元,用于根據(jù)第二數(shù)據(jù)、補(bǔ)償信號(hào)、以及混疊部分的預(yù)測(cè)來(lái)獲得用于第二塊的重建信號(hào)。
[0024]根據(jù)本發(fā)明,矩形編譯方案以矩形窗口來(lái)編碼或解碼,非矩形編譯方案以非矩形窗口來(lái)編碼或解碼。
[0025]根據(jù)本發(fā)明,根據(jù)校正部分以及混疊部分的誤差來(lái)產(chǎn)生補(bǔ)償信號(hào),校正部分對(duì)應(yīng)于和矩形窗口與非矩形窗口之間的不對(duì)稱有關(guān)的差異,混疊部分的誤差對(duì)應(yīng)于混疊部分和混疊部分的預(yù)測(cè)之間的差異。
[0026]根據(jù)本發(fā)明,混疊部分對(duì)應(yīng)于第一塊與用于非矩形編譯方案的非矩形窗口之間的
重疊部分。
[0027]根據(jù)本發(fā)明,矩形解碼單元被配置成:根據(jù)矩形窗口方案,利用第一塊的第一數(shù)據(jù)來(lái)產(chǎn)生用于第一塊的輸出信號(hào);并且利用用于第一塊的輸出信號(hào)和非矩形窗口來(lái)獲得混疊部分的預(yù)測(cè)。
[0028]根據(jù)本發(fā)明,重建信號(hào)近似于以矩形窗口處理的信號(hào),該矩形窗口與用于非矩形編譯方案的非矩形窗口不同。
[0029]根據(jù)本發(fā)明,非矩形解碼單元被配置成:對(duì)第二數(shù)據(jù)進(jìn)行逆頻率變換以產(chǎn)生時(shí)域第二信號(hào);對(duì)補(bǔ)償信號(hào)進(jìn)行逆頻率變換以產(chǎn)生時(shí)域補(bǔ)償信號(hào);以及通過(guò)將時(shí)域補(bǔ)償信號(hào)添加到時(shí)域第二信號(hào)和混疊部分的預(yù)測(cè),來(lái)獲得重建信號(hào)。
[0030]根據(jù)本發(fā)明,第一塊與巾貞和子巾貞中的一個(gè)相對(duì)應(yīng),并且第二塊與巾貞和子巾貞中的一個(gè)相對(duì)應(yīng)。
[0031]為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供了一種用于處理音頻信號(hào)的方法,包括:通過(guò)音頻處理裝置接收編譯標(biāo)識(shí)信息,所述編譯標(biāo)識(shí)信息表示是將第一編譯方案還是第二編譯方案應(yīng)用于當(dāng)前幀;當(dāng)編譯標(biāo)識(shí)信息表示將第二編譯方案應(yīng)用于當(dāng)前幀時(shí),接收窗口類型信息,該窗口類型信息表示多個(gè)窗口當(dāng)中的用于當(dāng)前幀的特定窗口 ;根據(jù)窗口類型信息識(shí)別出當(dāng)前窗口是長(zhǎng)_起始窗口,其中,長(zhǎng)_起始窗口跟在先前幀的僅長(zhǎng)窗口之后,其中,長(zhǎng)_起始窗口包括平緩的長(zhǎng)_起始窗口以及陡峭的長(zhǎng)_起始窗口 ;以及當(dāng)將第一編譯方案應(yīng)用于隨后幀時(shí),將平緩的長(zhǎng)_起始窗口應(yīng)用于當(dāng)前幀,其中:平緩的長(zhǎng)_起始窗口包括帶有第一斜坡的下降線,陡峭的長(zhǎng)_起始窗口包括帶有第二斜坡的下降線,第一斜坡比第二斜坡平緩。
[0032]根據(jù)本發(fā)明,第一斜坡的寬度等于第二斜坡的寬度的兩倍。
[0033]根據(jù)本發(fā)明,第一斜坡的寬度與N/4 (其中,N是巾貞長(zhǎng))相對(duì)應(yīng)。
[0034]根據(jù)本發(fā)明,第一斜坡的寬度與256個(gè)抽樣相對(duì)應(yīng),并且其中,第一斜坡的寬度等于長(zhǎng)_起始窗口的長(zhǎng)度的1/8。
[0035]根據(jù)本發(fā)明,僅長(zhǎng)窗口是水平對(duì)稱,并且長(zhǎng)_起始窗口是水平不對(duì)稱,長(zhǎng)_起始窗口在右半邊具有零部分。
[0036]根據(jù)本發(fā)明,帶有第一斜坡或第二斜坡的下降線的中心點(diǎn)在距長(zhǎng)_起始窗口的起始點(diǎn)的3N/2距離處(其中N是幀長(zhǎng))。
[0037]根據(jù)本發(fā)明,第一編譯方案基于頻域,并且第二編譯方案基于線性預(yù)測(cè)域。
[0038]為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供了一種用于處理音頻信號(hào)的裝置,其包括:解復(fù)用器,用于通過(guò)音頻處理裝置接收編譯標(biāo)識(shí)信息,所述編譯標(biāo)識(shí)信息表示是將第一編譯方案還是第二編譯方案應(yīng)用于當(dāng)前幀,并且當(dāng)編譯標(biāo)識(shí)信息表示將第二編譯方案應(yīng)用于當(dāng)前幀時(shí),接收窗口類型信息,該窗口類型信息表示多個(gè)窗口當(dāng)中的用于當(dāng)前幀的特定窗口 ;第二編譯單元,用于根據(jù)窗口類型信息識(shí)別出當(dāng)前窗口是長(zhǎng)_起始窗口,其中,長(zhǎng)_起始窗口跟在先前幀的僅長(zhǎng)窗口之后,其中,長(zhǎng)_起始窗口包括平緩的長(zhǎng)_起始窗口以及陡峭的長(zhǎng)_起始窗口,并且當(dāng)將第一編譯方案應(yīng)用于隨后幀時(shí),將平緩的長(zhǎng)_起始窗口應(yīng)用于當(dāng)前幀,其中:平緩的長(zhǎng)_起始窗口包括帶有第一斜坡的下降線,陡峭的長(zhǎng)_起始窗口包括帶有第二斜坡的下降線,第一斜坡比第二斜坡平緩。
[0039]根據(jù)本發(fā)明,第一斜坡的寬度等于第二斜坡的寬度的兩倍。
[0040]根據(jù)本發(fā)明,第一斜坡的寬度與N/4 (其中N是當(dāng)前幀的長(zhǎng)度)相對(duì)應(yīng)。
[0041]根據(jù)本發(fā)明,第一斜坡的寬度與256個(gè)抽樣相對(duì)應(yīng),并且其中,第一斜坡的寬度等于長(zhǎng)_起始窗口的長(zhǎng)度的1/8。[0042]根據(jù)本發(fā)明,僅長(zhǎng)窗口是水平對(duì)稱,并且長(zhǎng)_起始窗口是水平不對(duì)稱,長(zhǎng)_起始窗口在右半邊具有零部分。
[0043]根據(jù)本發(fā)明,帶有第一斜坡或第二斜坡的下降線的中心點(diǎn)在距長(zhǎng)_起始窗口的起始點(diǎn)的3N/2距離處(其中N是幀長(zhǎng))。
[0044]根據(jù)本發(fā)明,第一編譯方案基于頻域,并且第二編譯方案基于線性預(yù)測(cè)域。
[0045]為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn)并且根據(jù)本發(fā)明的目的,提供了 一種用于處理音頻信號(hào)的方法,其包括:通過(guò)音頻處理裝置接收音頻信號(hào),所述音頻信號(hào)包括第一塊的第一數(shù)據(jù)以及第二塊的第二數(shù)據(jù);接收與第二塊相對(duì)應(yīng)的補(bǔ)償信號(hào);根據(jù)第二數(shù)據(jù)、補(bǔ)償信號(hào)、以及第二塊的窗口獲得用于第二塊的重建信號(hào),其中當(dāng)以矩形編譯方案對(duì)第一數(shù)據(jù)編碼,并且第二塊的窗口屬于過(guò)渡窗口類別時(shí),第二塊的窗口具有帶有第一斜坡的上升線,其中,第一斜坡比第二斜坡平緩。
[0046]根據(jù)本發(fā)明,當(dāng)以非矩形編譯方案對(duì)第一數(shù)據(jù)編碼,并且第二塊的窗口屬于過(guò)渡窗口類別時(shí),第二塊的窗口具有帶有第二斜坡的上升線。
[0047]根據(jù)本發(fā)明,當(dāng)過(guò)渡窗口類別包括長(zhǎng)_停止(long_stop)窗口和停止_起始(stop_start)窗口時(shí),長(zhǎng)_停止窗口和停止_起始窗口是水平不對(duì)稱的,并且在左半邊具有零部分。
[0048]根據(jù)本發(fā)明,當(dāng)以矩形編譯方案對(duì)第一數(shù)據(jù)進(jìn)行編碼時(shí),接收補(bǔ)償信號(hào)。
[0049]根據(jù)本發(fā)明,根據(jù)與矩形窗口與非矩形窗口之間的不對(duì)稱有關(guān)的差異,以及混疊部分與混疊部分的預(yù)測(cè)之間的差異中的至少一個(gè)差異,產(chǎn)生補(bǔ)償信號(hào)。
[0050]為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供一種用于處理音頻信號(hào)的裝置,其包括:解復(fù)用器,用于接收音頻信號(hào),所述音頻信號(hào)包括第一塊的第一數(shù)據(jù)以及第二塊的第二數(shù)據(jù),并且用于接收與第二塊相對(duì)應(yīng)的補(bǔ)償信號(hào);非矩形解碼單元,用于根據(jù)第二數(shù)據(jù)、補(bǔ)償信號(hào)、以及第二塊的窗口獲得用于第二塊的重建信號(hào),其中當(dāng)以矩形編譯方案對(duì)第一數(shù)據(jù)編碼,并且第二塊的窗口屬于過(guò)渡窗口類別時(shí),第二塊的窗口具有帶有第一斜坡的上升線,其中,第一斜坡比第二斜坡平緩。
[0051]根據(jù)本發(fā)明,當(dāng)以非矩形編譯方案對(duì)第一數(shù)據(jù)編碼,并且第二塊的窗口屬于過(guò)渡窗口類別時(shí),第二塊的窗口具有帶有第二斜坡的上升線。
[0052]根據(jù)本發(fā)明,當(dāng)過(guò)渡窗口類別包括長(zhǎng)_停止窗口和停止_起始窗口時(shí),長(zhǎng)_停止窗口和停止_起始窗口是水平不對(duì)稱的,并且在左半邊具有零部分。
[0053]根據(jù)本發(fā)明,當(dāng)以矩形編譯方案對(duì)第一數(shù)據(jù)編碼時(shí),接收補(bǔ)償信號(hào)。
[0054]根據(jù)本發(fā)明,根據(jù)與矩形窗口和非矩形窗口之間的不對(duì)稱有關(guān)的差異,以及混疊部分與混疊部分的預(yù)測(cè)之間的差異中的至少一個(gè)差異,產(chǎn)生補(bǔ)償信號(hào)。
[0055]為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供一種用于處理音頻信號(hào)的方法,包括:通過(guò)音頻處理裝置接收音頻信號(hào),所述音頻信號(hào)包括第一塊的第一數(shù)據(jù)以及第二塊的第二數(shù)據(jù);接收與第二塊相對(duì)應(yīng)的補(bǔ)償信號(hào);根據(jù)第二數(shù)據(jù)、補(bǔ)償信號(hào)、以及第二塊的窗口獲得用于第二塊的重建信號(hào),其中當(dāng)以矩形編譯方案對(duì)第一數(shù)據(jù)編碼,并且第二塊的窗口屬于過(guò)渡窗口類別時(shí),第二塊的窗口具有帶有第一斜坡的上升線,其中,第一斜坡比第二斜坡平緩。
[0056]根據(jù)本發(fā)明,當(dāng)以非矩形編譯方案對(duì)第一數(shù)據(jù)編碼,并且第二塊的窗口屬于過(guò)渡窗口類別時(shí),第二塊的窗口具有帶有第二斜坡的上升線。
[0057]根據(jù)本發(fā)明,過(guò)渡窗口類別包括長(zhǎng)_停止窗口和停止_起始窗口,并且長(zhǎng)_停止窗口和停止_起始窗口是水平不對(duì)稱的,并且在左半邊具有零部分。
[0058]根據(jù)本發(fā)明,當(dāng)以矩形編譯方案對(duì)第一數(shù)據(jù)編碼時(shí),接收補(bǔ)償信號(hào)。
[0059]根據(jù)本發(fā)明,根據(jù)與矩形窗口和非矩形窗口之間的不對(duì)稱有關(guān)的差異,以及混疊部分與混疊部分的預(yù)測(cè)之間的差異中的至少一個(gè)差異,產(chǎn)生補(bǔ)償信號(hào)。
[0060]為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供一種用于處理音頻信號(hào)的裝置,其包括:解復(fù)用器,用于接收音頻信號(hào),所述音頻信號(hào)包括第一塊的第一數(shù)據(jù)以及第二塊的第二數(shù)據(jù),并且用于接收與第二塊相對(duì)應(yīng)的補(bǔ)償信號(hào);非矩形解碼單元,用于根據(jù)第二數(shù)據(jù)、補(bǔ)償信號(hào)、以及第二塊的窗口獲得用于第二塊的重建信號(hào),其中,當(dāng)以矩形編譯方案對(duì)第一數(shù)據(jù)編碼,并且第二塊的窗口屬于過(guò)渡窗口類別時(shí),第二塊的窗口具有帶有第一斜坡的上升線,其中,第一斜坡比第二斜坡平緩。
[0061]根據(jù)本發(fā)明,當(dāng)以非矩形編譯方案對(duì)第一數(shù)據(jù)編碼,并且第二塊的窗口屬于過(guò)渡窗口類別時(shí),第二塊的窗口具有帶有第二斜坡的上升線。
[0062]根據(jù)本發(fā)明,過(guò)渡窗口類別包括長(zhǎng)_停止窗口和停止_起始窗口時(shí),長(zhǎng)_停止窗口和停止_起始窗口是水平不對(duì)稱的,并且在左半邊具有零部分。
[0063]根據(jù)本發(fā)明,當(dāng)以矩形編譯方案對(duì)第一數(shù)據(jù)編碼時(shí),接收補(bǔ)償信號(hào)。
[0064]根據(jù)本發(fā)明,根據(jù)與矩形窗口和非矩形窗口之間的不對(duì)稱有關(guān)的差異,以及混疊部分與混疊部分的預(yù)測(cè)之間的差異中的至少一個(gè)差異,產(chǎn)生補(bǔ)償信號(hào)。
[0065]為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供了一種用于處理音頻信號(hào)的方法,其包括:當(dāng)將第二編譯方案應(yīng)用于當(dāng)前幀時(shí),通過(guò)音頻處理裝置接收窗口類型信息,所述窗口類型信息表示多個(gè)窗口當(dāng)中的用于當(dāng)前幀的特定窗口 ;并且根據(jù)窗口類型信息將當(dāng)前窗口應(yīng)用于當(dāng)前幀,其中,當(dāng)將第一編譯方案應(yīng)用于先前幀時(shí),所述多個(gè)窗口是由短窗口、第一過(guò)渡窗口、第二過(guò)渡窗口組成的,其中,短窗口具有寬度是N/8的至少一個(gè)上升線,并且第一過(guò)渡窗口和第二過(guò)渡窗口具有寬度是N/4的上升線(其中N是幀長(zhǎng))。
[0066]根據(jù)本發(fā)明,短窗口、第一過(guò)渡窗口、以及第二過(guò)渡窗口的長(zhǎng)度是2N。
[0067]根據(jù)本發(fā)明,短窗口、第一過(guò)渡窗口、以及第二過(guò)渡窗口的左半邊與1024個(gè)抽樣相對(duì)應(yīng)。
[0068]根據(jù)本發(fā)明,當(dāng)前窗口與先前窗口之間的交叉點(diǎn)在距當(dāng)前窗口的起始的N/2距離處。
[0069]根據(jù)本發(fā)明,第一過(guò)渡窗口在右半邊不具有零部分,第二過(guò)渡窗口在右半邊具有零部分,短窗口具有重疊在一起的多個(gè)短部分,并且短部分具有上升線和下降線。
[0070]為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供了一種用于處理音頻信號(hào)的方法,其包括:通過(guò)音頻處理裝置接收音頻信號(hào),所述音頻信號(hào)包括以第一編譯方案編碼的當(dāng)前幀以及以第二編譯方案編碼的隨后幀;接收子編譯標(biāo)識(shí)信息,所述子編譯標(biāo)識(shí)信息表示以矩形編譯方案或非矩形編譯方案對(duì)當(dāng)前幀的至少一個(gè)塊進(jìn)行編碼;當(dāng)子編譯標(biāo)識(shí)信息表示以非矩形編譯方案對(duì)當(dāng)前幀的至少最后塊進(jìn)行編碼時(shí),根據(jù)用于隨后幀的隨后窗口是否是短窗口,來(lái)確定用于當(dāng)前窗口的包括第一形狀和第二形狀的窗口形狀;將具有所確定的窗口形狀的當(dāng)前窗口應(yīng)用于當(dāng)前幀,其中:第一形狀具有帶有第一斜坡的下降線,第二形狀具有帶有第二斜坡的下降線,并且第一斜坡比第二斜坡平緩。
[0071]根據(jù)本發(fā)明,第一斜坡的寬度與256個(gè)抽樣或N/4相對(duì)應(yīng),并且第二斜坡的寬度與128個(gè)抽樣或N/8 (N是幀長(zhǎng))相對(duì)應(yīng)。
[0072]根據(jù)本發(fā)明,當(dāng)前窗口與隨后窗口之間的交叉點(diǎn)在距隨后窗口的起始的N/2距離處。
[0073]根據(jù)本發(fā)明,第一斜坡與非短窗口中的上升斜坡的斜坡相匹配,并且第二斜坡與短窗口中的上升斜坡的斜坡相匹配。
[0074]為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供了一種用于處理音頻信號(hào)的裝置,其包括:解復(fù)用器,用于當(dāng)將第二編譯方案應(yīng)用于當(dāng)前幀時(shí)接收窗口類型信息,所述窗口類型信息表示多個(gè)窗口當(dāng)中的用于當(dāng)前幀的特定窗口 ;第二編譯單元,用于根據(jù)窗口類型信息將當(dāng)前窗口應(yīng)用于當(dāng)前幀,其中,當(dāng)將第一編譯方案應(yīng)用于先前幀時(shí),所述多個(gè)窗口是由短窗口、第一過(guò)渡窗口、第二過(guò)渡窗口組成的,其中,短窗口具有寬度是N/8的至少一個(gè)上升線,并且第一過(guò)渡窗口和第二過(guò)渡窗口具有寬度是N/4的上升線(其中N是中貞長(zhǎng))。
[0075]根據(jù)本發(fā)明,短窗口、第一過(guò)渡窗口、以及第二過(guò)渡窗口的長(zhǎng)度是2N。
[0076]根據(jù)本發(fā)明,短窗口、第一過(guò)渡窗口、以及第二過(guò)渡窗口的左半邊與1024個(gè)抽樣相對(duì)應(yīng)。
[0077]根據(jù)本發(fā)明,當(dāng)前窗口與先前窗口之間的交叉點(diǎn)在距當(dāng)前窗口的起始的N/2距離處。
[0078]根據(jù)本發(fā)明,第一過(guò)渡窗口在右半邊不具有零部分,第二過(guò)渡窗口在右半邊具有零部分,短窗口具有重疊在一起的多個(gè)短部分,并且短部分具有上升線和下降線。
[0079]為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供了一種用于處理音頻信號(hào)的裝置,其包括:解復(fù)用器,用于接收音頻信號(hào),所述音頻信號(hào)包括以第一編譯方案編碼的當(dāng)前幀以及以第二編譯方案編碼的隨后幀,并且用于接收子編譯標(biāo)識(shí)信息,所述子編譯標(biāo)識(shí)信息表示以矩形編譯方案或非矩形編譯方案對(duì)當(dāng)前幀的至少一個(gè)塊進(jìn)行編碼;第一編譯單元,用于當(dāng)子編譯標(biāo)識(shí)信息表示以非矩形編譯方案對(duì)當(dāng)前幀的至少最后塊進(jìn)行編碼時(shí),根據(jù)用于隨后幀的隨后窗口是否是短窗口,來(lái)確定用于當(dāng)前窗口的包括第一形狀和第二形狀的窗口形狀;將具有所確定的窗口形狀的當(dāng)前窗口應(yīng)用于當(dāng)前幀,其中:第一形狀具有帶有第一斜坡的下降線,第二形狀具有帶有第二斜坡的下降線,并且第一斜坡比第二斜坡平緩。
[0080]根據(jù)本發(fā)明,第一斜坡的寬度與256個(gè)抽樣或N/4相對(duì)應(yīng),并且第二斜坡的寬度與128個(gè)抽樣或N/8 (N是幀長(zhǎng))相對(duì)應(yīng)。
[0081]根據(jù)本發(fā)明,當(dāng)前窗口與隨后窗口之間的交叉點(diǎn)在距隨后窗口的起始的N/2距離處。
[0082]根據(jù)本發(fā)明,第一斜坡與非短窗口中的上升斜坡的斜坡相匹配,并且第二斜坡與短窗口中的上升斜坡的斜坡相匹配。
[0083]應(yīng)該理解的是先前的一般描述和隨后的詳細(xì)說(shuō)明是示例性和說(shuō)明性的,并且其被用于提供對(duì)所要求的本發(fā)明的進(jìn)一步說(shuō)明。
[0084]有益效果[0085]因此,本發(fā)明提供以下效果或優(yōu)點(diǎn)。
[0086]首先,本發(fā)明對(duì)諸如由于窗口間不對(duì)稱(例如,矩形窗口與非矩形窗口之間不對(duì)稱)等所引起的混疊這樣的缺點(diǎn)進(jìn)行補(bǔ)償,從而顯著改善音頻信號(hào)的音質(zhì)。
[0087]其次,當(dāng)應(yīng)用了用于對(duì)混疊等等進(jìn)行補(bǔ)償?shù)姆桨笗r(shí),矩形窗口與非矩形窗口之間100%重疊變得不必要。因此,非矩形窗口可保持具有平緩斜坡的下降線。
[0088]第三,本發(fā)明適用于具有包含平緩斜坡的下降線的非矩形窗口,由此同類窗口(homogeneous window)(例如,非矩形窗口)之間的交叉點(diǎn)與異類窗口(heterogeneouswindow)(例如,非矩形窗口和矩形窗口)之間的交叉點(diǎn)相匹配。
[0089]第四,因?yàn)橥惔翱诘慕徊纥c(diǎn)與異類窗口的交叉點(diǎn)相匹配,因此用于對(duì)窗口長(zhǎng)度差進(jìn)行補(bǔ)償?shù)倪^(guò)渡窗口變得不必要,并且第一編譯方案(例如,線性預(yù)測(cè)域方案)與第二編譯方案(例如,頻域方案)之間的直接過(guò)渡成為可能。
[0090]第五,因?yàn)橹苯舆^(guò)渡成為可能,因此可應(yīng)用適用于相應(yīng)塊的音頻信號(hào)特征的窗口,而無(wú)需使用用于解決不匹配的窗口。因此,可顯著地提高音質(zhì)。
[0091]第六,因?yàn)榕c非矩形窗口類型相對(duì)應(yīng)的窗口的形狀根據(jù)短窗口是存在于先前塊還是存在于隨后塊而變,因此滿足TDAC條件。因此,可提聞首質(zhì)。
【專利附圖】

【附圖說(shuō)明】
[0092]所附附圖被包括以提供對(duì)本發(fā)明進(jìn)一步了解,并納入且構(gòu)成了該說(shuō)明書(shū)的一部分,所述附圖對(duì)本發(fā)明的實(shí)施例進(jìn)行說(shuō)明并且與該描述一下對(duì)本發(fā)明的原理進(jìn)行說(shuō)明。
[0093]在附圖中:
[0094]圖1是根據(jù)本發(fā)明的音頻信號(hào)處理裝置的示意性方框圖;
[0095]圖2是根據(jù)本發(fā)明的第一實(shí)施例的編碼器的方框圖;
[0096]圖3是根據(jù)本發(fā)明的第一實(shí)施例的解碼器的方框圖;
[0097]圖4是由塊單元配置的音頻信號(hào)的示意圖,按每個(gè)幀(或子幀)可對(duì)其應(yīng)用不同的編譯方案;
[0098]圖5是用于過(guò)渡到異類編譯方案(heterogeneous coding scheme)(即,矩形編譯方案和非矩形編譯方案)的示意圖;
[0099]圖6是當(dāng)矩形窗口和非矩形窗口相互重疊時(shí)的特征的示意圖;
[0100]圖7是校正部分(CP),混疊部分(aliasing part) (AP)、以及未補(bǔ)償信號(hào)的示意圖;
[0101]圖8是具有對(duì)稱性(即,TDAC的條件)的非矩形窗口的特征的示意圖;
[0102]圖9是用于對(duì)校正部分和/或混疊部分進(jìn)行補(bǔ)償?shù)难a(bǔ)償信號(hào)的示例的示意圖;
[0103]圖10是圖6所示的異類窗口(S卩,矩形窗口和非矩形窗口)的組合中的非矩形窗口的示例的示意圖;
[0104]圖11是矩形窗口之后的矩形窗口被重疊的情況的示意圖;
[0105]圖12是根據(jù)本發(fā)明的第二實(shí)施例的編碼器的方框圖;
[0106]圖13是根據(jù)本發(fā)明的第二實(shí)施例的解碼器的方框圖;
[0107]圖14是根據(jù)是否將矩形編譯方案應(yīng)用于先前塊的過(guò)渡窗口(transitionwindow)的形狀的示意圖;[0108]圖15是根據(jù)本發(fā)明的第三實(shí)施例的編碼器的方框圖;
[0109]圖16是根據(jù)本發(fā)明的第三實(shí)施例的解碼器的方框圖;
[0110]圖17是與第一編譯方案窗口或第二編譯方案窗口(短窗口)相結(jié)合的長(zhǎng)_起始窗口的不意圖;
[0111]圖18是與第一編譯方案窗口或第二編譯方案窗口(例如,長(zhǎng)_停止窗口)相重疊的短窗口的示意圖;
[0112]圖19是根據(jù)本發(fā)明的第四實(shí)施例的編碼器的方框圖;
[0113]圖20是根據(jù)本發(fā)明的第四實(shí)施例的解碼器的方框圖;
[0114]圖21是窗口間路徑或過(guò)渡的表格;
[0115]圖22是過(guò)渡到第一編譯方案中的長(zhǎng)_停止窗口的情況的示意圖;
[0116]圖23是過(guò)渡到第一編譯方案中的短窗口的情況的示意圖;
[0117]圖24是第一編譯方案窗口與新形狀的短窗口相重疊的情況的示意圖;
[0118]圖25是根據(jù)本發(fā)明的第五實(shí)施例的編碼器的方框圖;
[0119]圖26是根據(jù)本發(fā)明的第六實(shí)施例的解碼器的方框圖;
[0120]圖27是與第一編譯方案(例如TCX)相對(duì)應(yīng)的窗口與短窗口(或長(zhǎng)_停止窗口)相重置的情況的不意圖;
[0121]圖28是與在形狀I(lǐng)至形狀4之內(nèi)變化的第一編譯方案當(dāng)中的非矩形方案相對(duì)應(yīng)的窗口的表格;
[0122]圖29是根據(jù)本發(fā)明的第六實(shí)施例的編碼器的方框圖;
[0123]圖30是根據(jù)本發(fā)明的第六實(shí)施例的解碼器的方框圖;
[0124]圖31是每個(gè)塊(幀或子幀)的編譯方案的示例的示意圖;
[0125]圖32是用于與長(zhǎng)期預(yù)測(cè)有關(guān)的信號(hào)波形的一個(gè)示例的示意圖;
[0126]圖33是根據(jù)本發(fā)明的實(shí)施例的編碼器所應(yīng)用到的音頻信號(hào)編碼裝置的示例的示意圖;
[0127]圖34是根據(jù)本發(fā)明的實(shí)施例的編碼器所應(yīng)用到的音頻信號(hào)解碼裝置的示例的示意圖;
[0128]圖35是實(shí)現(xiàn)根據(jù)本發(fā)明的一個(gè)實(shí)施例的音頻信號(hào)處理裝置的產(chǎn)品的示意性方框圖;以及
[0129]圖36是用于對(duì)實(shí)現(xiàn)根據(jù)本發(fā)明的一個(gè)實(shí)施例的音頻信號(hào)處理裝置的產(chǎn)品之間的關(guān)系進(jìn)行說(shuō)明的示意圖。
【具體實(shí)施方式】
[0130]在隨后的描述中,對(duì)本發(fā)明的附加特征和優(yōu)點(diǎn)進(jìn)行闡述,并且其部分可從該描述中顯而易見(jiàn)地得知,或者可以從本發(fā)明的實(shí)施中學(xué)習(xí)到。特別地,通過(guò)在所寫(xiě)描述及其權(quán)利要求以及附圖中所指出的結(jié)構(gòu)可實(shí)現(xiàn)并獲得本發(fā)明的目的及其他優(yōu)點(diǎn)。
[0131]為了實(shí)現(xiàn)這些和其他優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,如具體體現(xiàn)和廣泛描述地,
[0132]為了進(jìn)一步實(shí)現(xiàn)這些及其他優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,
[0133]很清楚的是先前的一般描述和下面的詳細(xì)描述是示例性和說(shuō)明性的,并且其旨在提供對(duì)所要求的本發(fā)明的進(jìn)一步說(shuō)明。[0134]本發(fā)明的模式
[0135]現(xiàn)在對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)地參考,在附圖中示出了所述優(yōu)選實(shí)施例的示例。首先,不將在該說(shuō)明書(shū)和權(quán)利要求中所使用的術(shù)語(yǔ)或詞語(yǔ)解釋為局限于一般或字典含義,并且應(yīng)解釋為與基于下述原理的本發(fā)明的技術(shù)思想相匹配的含義和概念,所述原理即就是發(fā)明人能夠適當(dāng)?shù)囟x術(shù)語(yǔ)的概念,以最好地方式對(duì)發(fā)明人的發(fā)明進(jìn)行描述。該公開(kāi)中所公開(kāi)的實(shí)施例以及附圖中所示的配置僅是一個(gè)優(yōu)選實(shí)施例,并且不表示本發(fā)明的所有技術(shù)思路。因此,很清楚的是本發(fā)明覆蓋本發(fā)明的修改和變化,只要其落入在提交該申請(qǐng)時(shí)的所附權(quán)利要求及其等效體的范圍之內(nèi)。
[0136]根據(jù)本發(fā)明,應(yīng)將未在該說(shuō)明書(shū)中所公開(kāi)的術(shù)語(yǔ)解釋為與本發(fā)明的技術(shù)思路相匹配的以下含義和概念。具體地說(shuō),可將“編譯(coding)”有選擇地解釋為“編碼”或“解碼”,并且該公開(kāi)中的“信息”是通常包括值、參數(shù)、系數(shù)、元素等等的術(shù)語(yǔ),并且其含義可偶而解釋為不同,本發(fā)明并不受到此限制。
[0137]在該公開(kāi)中,在廣義上,音頻信號(hào)在概念上與視頻信號(hào)有區(qū)別,并且表示可聽(tīng)覺(jué)上識(shí)別的各種信號(hào)。從狹義上講,音頻信號(hào)是指不具有或具有少量語(yǔ)音特征的信號(hào)。應(yīng)在廣義上對(duì)本發(fā)明的音頻信號(hào)進(jìn)行解釋。然而,在用作與語(yǔ)音信號(hào)加以區(qū)分的情況下,本發(fā)明的音頻信號(hào)可被理解為狹義上的音頻信號(hào)。
[0138]雖然規(guī)定編譯(coding)僅是編碼,但是可以將其解釋為包括編碼和解碼。
[0139]圖1是根據(jù)本發(fā)明的音頻信號(hào)處理裝置的示意性方框圖。
[0140]參考圖1,根據(jù)本發(fā)明的音頻信號(hào)處理裝置的編碼器100包括一對(duì)編譯單元(SP,矩形編譯單元120R和非矩形編譯單元120N,或第一編譯單元120-1和第二編譯單元120-2)并且能夠進(jìn)一步包括信號(hào)分類器110和復(fù)用器130。
[0141]在這種情況下,矩形編譯單元120R是應(yīng)用了矩形編譯方案的編譯單元。尤其是,矩形編譯方案是指應(yīng)用了具有矩形形狀的窗口的編譯方案,而非矩形編譯方案是指應(yīng)用了具有非矩形形狀的窗口的編譯方案。
[0142]此外,第一和第二編譯單元120-1和120-2是用于分別根據(jù)不同域來(lái)應(yīng)用第一和第二編譯方案的單元。在這種情況下,域可以包括線性預(yù)測(cè)域、頻域、時(shí)域等等。例如,第一編譯方案是基于線性預(yù)測(cè)域的編譯方案,并且第二編譯方案是基于頻域的編譯方案。并且,隨后對(duì)根據(jù)域類型的定義和性質(zhì)進(jìn)行詳細(xì)地描述。
[0143]編碼器100可包括三個(gè)特定編譯單元(B卩,A編譯單元120A、B編譯單元120B、以及C編譯單元120C)。例如圖1所示,應(yīng)用于A編譯單元120A的A編譯方案是矩形編譯方案,并且與第一編譯方案相對(duì)應(yīng)。應(yīng)用于B編譯單元120B的B編譯方案是非矩形編譯方案,并且與第一編譯方案相對(duì)應(yīng)。應(yīng)用于C編譯單元120C的C編譯方案是非矩形編譯方案,并且與第二編譯方案相對(duì)應(yīng)。如在先前描述中所提到的,圖1所示的圖僅僅是示例性的,本發(fā)明并不受到此限制。為了使以下描述清楚和方便起見(jiàn),圖1所示的示例用作參考。
[0144]或者,A,B、C編譯方案分別與ACELP (代數(shù)碼激勵(lì)線性預(yù)測(cè))、TCX (變換碼激勵(lì))、以及MDCT (修正離散傅里葉變換)相對(duì)應(yīng),但是本發(fā)明并不受到此限制。隨后參考矩形編譯方案、非矩形編譯方案、第一編譯方案、以及第二編譯方案的細(xì)節(jié)對(duì)A、B、C編譯方案進(jìn)行詳細(xì)地描述。
[0145]信號(hào)分類器110對(duì)輸入音頻信號(hào)的特征進(jìn)行分析,并且此后根據(jù)所分析的特征來(lái)確定將上述至少兩個(gè)編譯方案中的哪一個(gè)應(yīng)用到當(dāng)前幀或子幀。根據(jù)該確定,產(chǎn)生編譯方案信息。如在先前描述中提到的,至少兩個(gè)編譯方案與矩形和非矩形編譯方案、第一和第二編譯方案、或者A至C編譯方案相對(duì)應(yīng),但是本發(fā)明并不受到此限制。
[0146]例如,在圖1所示的示例的情況下,編譯方案信息可包括編譯標(biāo)識(shí)信息和子編譯標(biāo)識(shí)信息(subcoding identification information)。在這種情況下,編譯標(biāo)識(shí)信息表示用于當(dāng)前幀的第一編譯方案或第二編譯方案。在當(dāng)前幀與第一編譯方案相對(duì)應(yīng)的情況下,子編譯標(biāo)識(shí)信息是表示對(duì)于每個(gè)幀或子幀而言第一編譯方案是A編譯方案或還是B編譯方案的信息。
[0147]此后,信號(hào)分類器110產(chǎn)生編譯方案信息,并且此后將其遞送到復(fù)用器130。
[0148]同時(shí),在信號(hào)分類器110的控制之下,對(duì)每個(gè)幀或子幀的輸入信號(hào)進(jìn)行分類,并且此后將其輸入到矩形/非矩形編譯單元120R/120N或第一 /第二編譯單元120-1/120-2。在圖1所示的示例的情況下,將輸入信號(hào)輸入到A至C編譯單元102A至120C中的一個(gè)。
[0149]在圖1所示的示例的情況下,A至C編譯單元120A至120C中的每一個(gè)將由相應(yīng)編譯方案對(duì)輸入信號(hào)進(jìn)行編碼所產(chǎn)生的數(shù)據(jù)遞送到復(fù)用器120。
[0150]復(fù)用器130通過(guò)對(duì)編譯方案信息以及作為通過(guò)相應(yīng)單元執(zhí)行編譯的結(jié)果的數(shù)據(jù)進(jìn)行復(fù)用而至少產(chǎn)生比特流。
[0151]同時(shí),根據(jù)本發(fā)明的音頻信號(hào)處理裝置的解碼器200包括至少兩個(gè)解碼單元220R和220N,或220-1和220-2,并且可進(jìn)一步包括解復(fù)用器210。在這種情況下,至少兩個(gè)解碼單元是在解碼方面與先前的至少兩個(gè)編譯單元相對(duì)應(yīng),并且分別包括矩形解碼單元220R和非矩形解碼單元220N (或第一解碼單元220-1和第二解碼單元220-2)的部件。按照與編碼器100相似的方式,所述至少兩個(gè)解碼單元可分別包括A至C解碼單元220A至220C。
[0152]矩形解碼單元220R所應(yīng)用的矩形編譯方案和非矩形解碼單元220N所應(yīng)用的非矩形編譯方案與在先前描述中所說(shuō)明的那些幾乎一樣。并且,第一解碼單元220-1所應(yīng)用的第一編譯方案和第二解碼單元220-2所應(yīng)用的第二編譯方案與在先前描述中所說(shuō)明的那些幾乎一樣。如在先前描述中所提到的,如圖1所示,在包括A至C解碼單元220A至220C的情況下,隨后對(duì)相應(yīng)編譯單元所使用的A至C編譯方案進(jìn)行詳細(xì)地描述。
[0153]之后,解復(fù)用器210從至少一個(gè)比特流中提取編譯方案信息以及每個(gè)幀或子幀的數(shù)據(jù)。根據(jù)編譯方案信息,將所提取的數(shù)據(jù)轉(zhuǎn)發(fā)到相應(yīng)解碼單元220A,220B,或220C。最終,每個(gè)解碼單元通過(guò)相應(yīng)解碼方案對(duì)該數(shù)據(jù)進(jìn)行解碼,以產(chǎn)生輸出音頻信號(hào)。
[0154]在下面的描述中,依次對(duì)根據(jù)圖1所示的本發(fā)明的音頻信號(hào)處理裝置的實(shí)施例進(jìn)行描述。
[0155]圖2是根據(jù)本發(fā)明的第一實(shí)施例的編碼器的方框圖,并且圖3是根據(jù)本發(fā)明的第一實(shí)施例的解碼器的方框圖。尤其是,第一實(shí)施例涉及用于對(duì)諸如當(dāng)矩形編譯方案所編碼的塊與非矩形編譯方案所編碼的塊相接觸時(shí)的混疊等等這樣的缺陷進(jìn)行補(bǔ)償?shù)膶?shí)施例。
[0156]參考圖2,像圖1所示的先前編碼器100 —樣,根據(jù)第一實(shí)施例的編碼器100A包括矩形編譯單元120R和非矩形編譯單元120N,并且可進(jìn)一步包括復(fù)用器130。尤其是,矩形編譯單元120R包括矩形方案編譯部分122和矩形方案合成(synthesis)部分124。并且,非矩形編譯單元120N包括補(bǔ)償信息產(chǎn)生部分128,并且可進(jìn)一步包括非矩形方案編譯部分126。[0157]首先,通過(guò)以塊為單元對(duì)輸入信號(hào)進(jìn)行劃分,并且此后對(duì)于每個(gè)塊將其輸入到矩形編譯單元120R或非矩形編譯單元120N。在這種情況下,塊是與幀或子幀相對(duì)應(yīng)的單元。
[0158]在下面的描述中,參考圖4和圖5對(duì)每幀的編譯方案(例如,矩形編譯方案、非矩形編譯方案)進(jìn)行檢查,并且參考圖6至11對(duì)用于對(duì)由于過(guò)渡到異類編譯方案(例如,矩形編譯方案或非矩形編譯方案)所產(chǎn)生的缺陷(例如,混疊等等)進(jìn)行補(bǔ)償?shù)母鞣N方法進(jìn)行描述。優(yōu)先描述圖4至11,并且再描述圖2和圖3所示的部件。
[0159]圖4示出了音頻信號(hào)的配置單元,以及對(duì)于每個(gè)配置單元而言的編譯方案。
[0160]參考圖4,可以觀察到音頻信號(hào)被配置成具有包括第i幀(幀i)和第(i+Ι)幀(幀i+Ι)的一系列幀。尤其是,可認(rèn)識(shí)到單個(gè)幀包括多個(gè)子幀(例如4個(gè)子幀)。此外,圖4示出了不同編譯方案適用于每個(gè)幀或子幀。尤其是,圖4示出了存在3種編譯方案[即,A編譯方案(ACELP)、B編譯方案(TCX)、以及C編譯方案(FD)]的示例。例如,幀可被配置成具有多個(gè)子幀(例如,4個(gè)子幀)。并且,如圖4 (A)所示的第i幀所示,A編譯方案(例如ACELP)可應(yīng)用到每個(gè)子幀。如圖4 (B)第i幀以及圖4 (D)所示的第i幀和第(i+Ι)幀所示,B編譯方案(例如TCX)可應(yīng)用到I子幀、2個(gè)連續(xù)子幀、以及4個(gè)連續(xù)子幀(即,一幀)。如圖4(A)和圖4 (B)所示,C編譯方案(例如FD)不通過(guò)子巾貞單元來(lái)應(yīng)用,而是通過(guò)巾貞單元來(lái)應(yīng)用,但是本發(fā)明并不受到此限制。
[0161]圖5是過(guò)渡到異類編譯方案(即,矩形編譯方案和非矩形編譯方案)的示意圖。
[0162]參考圖5 (A-1),在第N塊中過(guò)渡到矩形編譯方案并且在第(N+1)塊中過(guò)渡到非矩形編譯方案。相反地,參考圖5 (A-2),在第N塊中過(guò)渡到非矩形編譯方案并且在第(N+1)塊中過(guò)渡到矩形編譯方案。在這種情況下,塊與在先前描述中所說(shuō)明的幀或子幀相對(duì)應(yīng)。也就是說(shuō),第N或第(N+1)幀或子幀可包括幀或子幀。尤其是,總共4種組合(例如,幀-幀、幀-子幀、子幀-幀、以及子幀-幀)是可能的。
[0163]從圖4 (A)至圖4 (D)所示的先前情況可發(fā)現(xiàn)如圖5 (A_l)所示的從矩形編譯方案過(guò)渡到非矩形編譯方案的示例。
[0164]如在參考圖1的先前描述中所提到的,A編譯方案(ACELP)與矩形編譯方案相對(duì)應(yīng),而B(niǎo)編譯方案(TCX)和C編譯方案(FD)中的每一個(gè)與非矩形編譯方案相對(duì)應(yīng)。從A編譯方案(ACELP)過(guò)渡到B編譯方案(TCX)或C編譯方案(FD)的情況(即圖5 (A-1))與圖5(B-1)至圖5 (B-4)所示的虛線所表示的部分中的一個(gè)相對(duì)應(yīng)。
[0165]相反地,從非矩形編譯方案過(guò)渡到矩形編譯方案的情況[即,圖5 (A-2)]沒(méi)有在圖5 (B-1)至圖5 (B-4)中表示,S卩,從B編譯方案(TCX)或C編譯方案(FD)過(guò)渡到A編譯方案(ACELP)的情況沒(méi)有在圖5 (B-1)至圖5 (B-4)中表示,但是可從兩個(gè)或三個(gè)位置(例如,圖5 (B-2)中的第I塊和第2塊等等)中發(fā)現(xiàn)。
[0166]因此,由于矩形窗口和非矩形窗口彼此接觸的位置的不對(duì)稱,可產(chǎn)生諸如混疊等等這樣的缺陷。在下面的描述中,參考圖6至9對(duì)用于對(duì)該缺陷進(jìn)行補(bǔ)償?shù)姆椒ㄟM(jìn)行描述。
[0167]圖6是當(dāng)矩形窗口和非矩形窗口彼此重疊時(shí)的特征的示意圖。圖7是校正部分(CP)、混疊部分(AP)、以及未補(bǔ)償信號(hào)的示意圖。特別地,圖6與矩形窗口后面是非矩形窗口的情況相對(duì)應(yīng)。然而,隨后在該公開(kāi)中還對(duì)按照非矩形窗口與隨后矩形窗口相重疊的方式,使得非矩形窗口之后跟隨矩形窗口的情況進(jìn)行說(shuō)明。
[0168]參考圖6,可以觀察到矩形窗口和非矩形窗口彼此部分重疊。與包括塊A至F的音頻信號(hào)相關(guān),將矩形窗口應(yīng)用于塊B和塊C上,并且將非矩形窗口應(yīng)用于塊C至F上。尤其是,矩形窗口和非矩形窗口在塊C處彼此重疊。圖6 (a)至圖6 (d)示出了由于依次將窗口化(windowing)、折疊(folding)、展開(kāi)(unfolding)、以及窗口化應(yīng)用于塊A至F上所造成的結(jié)果。在這種情況下,為了應(yīng)用與非矩形窗口相關(guān)的時(shí)域混疊消除(TDAC),依次將窗口化、折疊、展開(kāi)、以及窗口化應(yīng)用到相應(yīng)的塊上。
[0169]參考圖6 (a),將矩形窗口應(yīng)用到塊B和塊C的每一個(gè)上(B卩,虛線塊)并且將非矩形窗口應(yīng)用于到塊C至F的每一個(gè)上。C (L1)表示由于將非矩形窗口的部分L1S用于塊C上所造成的結(jié)果。并且,D (L2)表示由于將非矩形窗口的部分L2S用到塊D上所造成的結(jié)果。隨后,如果對(duì)非矩形窗口應(yīng)用結(jié)果執(zhí)行折疊,那么將導(dǎo)致圖6 (b)所示的塊。在這種情況下,Er,Dr等等是指對(duì)相應(yīng)塊執(zhí)行折疊,并且此后參考?jí)K界限使折疊的塊進(jìn)行反轉(zhuǎn)。之后,執(zhí)行展開(kāi)以導(dǎo)致圖6 (c)所示的示意圖。最終,如果將非矩形窗口應(yīng)用到展開(kāi)塊上,那么產(chǎn)生如圖6 (d)所示的相同結(jié)果。
[0170]尤其是,可如下表示與原始信號(hào)的塊D相對(duì)應(yīng)的未補(bǔ)償信號(hào),即,作為僅傳送數(shù)據(jù)所獲取的信號(hào)。
[0171][公式I]
[0172]未補(bǔ)償信號(hào)=(-Cr(L^r+D(L2))(L2)
[0173]在公式I中,“C”表示與塊C相應(yīng)的數(shù)據(jù),“D”表示與塊D相對(duì)應(yīng)的數(shù)據(jù),“r”表示反轉(zhuǎn),“L/’表示由于應(yīng)用非矩形窗口的部分L1所造成的結(jié)果,并且“L2”表示由于應(yīng)用非矩形窗口的部分L2所造成的結(jié)果。
[0174]在下面的描述中,參考圖7至9對(duì)用于對(duì)未補(bǔ)償信號(hào)進(jìn)行補(bǔ)償以變?yōu)榕c原始信號(hào)相同或相似的方法進(jìn)行描述。`首選,參考圖7,示出了與公式I相對(duì)應(yīng)的未補(bǔ)償信號(hào)。
[0175]同時(shí),非矩形窗口具有對(duì)稱性。如下對(duì)如圖8所示的非矩形窗口的特征進(jìn)行說(shuō)明。圖8是具有對(duì)稱性(即,TDAC的條件)的非矩形窗口的特征的示意圖。
[0176][公式2]
[0177]LpRi2=I,其中 i=l 或 2
[0178]Llr=R2
[0179]L2r=R1
[0180]在公式2中,”表示左邊第一部分,“L2”表示左邊第二部分,“R/’表示右邊第一部分,并且“R2”表示右邊第二部分。
[0181]因此,如果應(yīng)用非矩形窗口的上述特征,那么可將公式I歸納成以下。
[0182][公式3]
[0183]未補(bǔ)償信號(hào)=(-Cr(L1) r+D (L2)) (L2)=D (L2) [Cr (R2L2)(因?yàn)?Llr=R2)
[0184]因此,為了使未補(bǔ)償信號(hào)變成等于原始信號(hào)D,即,為了執(zhí)行理想補(bǔ)償,因此需要的信號(hào)如圖7所示,并且可以表示如下。
[0185][公式4-1]
[0186]理想補(bǔ)償?shù)乃栊盘?hào)
[0187]=原始信號(hào)-未補(bǔ)償信號(hào)
[0188]=D- (D (L2) [Cr (R2L2))
[0189]同時(shí),利用在公式2中所示的特征,可將公式4-1歸納成以下。[0190][公式4-2]
[0191]理想補(bǔ)償?shù)乃栊盘?hào)
[0192]=D (R2) 2+C (R2L2)(因?yàn)?1_L22=R22)
[0193]在公式4-2中,第一個(gè)項(xiàng)(D (R2)2)與校正部分相對(duì)應(yīng),并且第二個(gè)項(xiàng)(Cr (R2L2))被稱為混疊部分。
[0194]如果同類窗口(例如,非矩形窗口和非矩形窗口)彼此重疊,那么校正部分CP和混疊部分AP與按照通過(guò)執(zhí)行時(shí)域混疊消除(TDAC)而增加的方式而將被刪除的部分相對(duì)應(yīng)。換句話說(shuō),因?yàn)楫愵惔翱?即,矩形窗口和非矩形窗口)彼此重疊,則校正部分CP和混疊部分AP是殘余誤差而沒(méi)有被消除。
[0195]具體地說(shuō),校正部分CP與非矩形窗口(具體地說(shuō)R2)所應(yīng)用到的當(dāng)前塊(例如塊D)(即,窗口交叉點(diǎn)后面的塊)的一部分相對(duì)應(yīng)。并且,混疊部分AP與非矩形窗口(具體地說(shuō)R2和L2)所應(yīng)用到的先前塊(例如塊C)(即,窗口交叉點(diǎn)后面的塊)(例如,矩形窗口和非矩形窗口彼此重疊處的塊)的一部分相對(duì)應(yīng)。
[0196]同時(shí),因?yàn)榻獯a器可利用先前塊的數(shù)據(jù)重建先前塊(例如,塊C),因此可利用所重建的先前塊產(chǎn)生對(duì)混疊部分的預(yù)測(cè)。這被表示為公式5。
[0197][公式5]
[0198]混疊部分的預(yù)測(cè)=qCr (R2L2)
[0199]同時(shí),可將作為混疊部分的預(yù)測(cè)與原始混疊部分之間的差異(或量化誤差)的混疊部分的誤差表不為公式6。
[0200][公式6]
[0201]混疊部分的誤差=er(R2L2)=Cr (R2L2) -qCr (R2L2)
[0202]利用公式5和公式6,將公式4_2歸納為公式7。
[0203][公式7]
[0204]理想補(bǔ)償?shù)乃栊盘?hào)
[0205]=D (R2) 2+Cr (R2L2) =D (R2)2+ (qCr+er) (R2L2)
[0206]在公式(7)中,D (R2) 2表示校正部分CP,qCr (R2L2)表示混疊部分AP的預(yù)測(cè),并且er (R2L2)表示混疊部分的誤差。
[0207]因此,如公式7所示,用于理想補(bǔ)償所需的信號(hào)是校正部分CP與混疊部分AP之和。
[0208]在下面的描述中,參考圖9對(duì)用于對(duì)校正部分CP和混疊部分AP進(jìn)行補(bǔ)償?shù)娜N方法進(jìn)行說(shuō)明。
[0209]圖9是用于對(duì)校正部分和/或混疊部分進(jìn)行補(bǔ)償?shù)难a(bǔ)償信號(hào)的實(shí)施例的示意圖。
[0210]參考圖9,圖9 (A)所示的第一實(shí)施例的補(bǔ)償信號(hào)包括校正部分CP和混疊部分的誤差,而圖9 (B)所示的第二實(shí)施例的補(bǔ)償信號(hào)僅包括校正部分CP。根據(jù)圖9 (B)所示的第三實(shí)施例,不將補(bǔ)償信號(hào)發(fā)送到解碼器,而是通過(guò)解碼器對(duì)校正部分CP和混疊部分AP進(jìn)行估計(jì)。
[0211][公式8-1]
[0212]方法A:補(bǔ)償信號(hào)=D (R2) 2+er (R2L2),其中“D”為重建信號(hào)。
[0213]在根據(jù)第一實(shí)施例的補(bǔ)償信號(hào)的情況下,如在參考公式5的先前描述中所提到的,解碼器根據(jù)先前塊(即,與矩形窗口與非矩形窗口之間的重疊部分相對(duì)應(yīng)的塊)的數(shù)據(jù)可獲得對(duì)混疊部分AP的預(yù)測(cè),而無(wú)需從編碼器到解碼器的傳送。即使補(bǔ)償信號(hào)包括校正部分CP和混疊部分的誤差,解碼器也可產(chǎn)生對(duì)混疊部分的預(yù)測(cè)。因此,可獲得用于理想補(bǔ)償?shù)男盘?hào)(參照公式7)。根據(jù)第一實(shí)施例,通過(guò)傳送誤差而不是混疊部分AP本身可節(jié)省比特的數(shù)目。此外,通過(guò)對(duì)混疊部分AP的誤差進(jìn)行補(bǔ)償可獲得理想的補(bǔ)償信號(hào)。
[0214]根據(jù)第二實(shí)施例,補(bǔ)償信號(hào)包括僅與相應(yīng)校正部分CP相對(duì)應(yīng)的信號(hào)。
[0215][公式8_2]
[0216]方法B:補(bǔ)償信號(hào)=D (R2)2,其中,重建信號(hào)是D-er (R2L2)0
[0217]如在先前描述中所提到的(或與第一實(shí)施例相似),解碼器產(chǎn)生對(duì)混疊部分AP的預(yù)測(cè),并且此后利用與校正部分CP相對(duì)應(yīng)的補(bǔ)償信號(hào)與預(yù)測(cè)一起獲得補(bǔ)償?shù)男盘?hào)。根據(jù)第二實(shí)施例,因?yàn)榛殳B部分AP的誤差保持在補(bǔ)償信號(hào)中,因此重建率(reconstruction rate)或音質(zhì)可能被惡化。然而,與第一實(shí)施例相比,補(bǔ)償信號(hào)的壓縮率可以更高地提高。
[0218]根據(jù)第三實(shí)施例,補(bǔ)償信號(hào)沒(méi)有被傳送,而是解碼器估計(jì)矯正部分CP和混疊部分AP0
[0219][公式8_3]
[0220]方法C:補(bǔ)償信號(hào)=未傳送的、解碼器中產(chǎn)生的補(bǔ)償信號(hào)=qCr (L2R2)+D (R2) 2,其中,重建信號(hào)是D-er (L2)/(R2)0
[0221]如在先前描述中所提到的(或與第一實(shí)施例和第二實(shí)施例相似),解碼器可產(chǎn)生對(duì)混疊部分AP的預(yù)測(cè)。同 時(shí),可按照對(duì)與當(dāng)前塊(例如塊D)相對(duì)應(yīng)的信號(hào)的窗口形狀進(jìn)行補(bǔ)償?shù)姆绞蕉a(chǎn)生校正部分CP。尤其是,與公式I相似,將利用先前塊(qC)的數(shù)據(jù)所產(chǎn)生的qCr (L2R2)添加到未補(bǔ)償信號(hào)上。此后,通過(guò)使D (L2) 2-er (L2R2)除以(L2) 2 (這與將D(R2) 2 加到 D (L2) 2-er (L2R2)上相對(duì)應(yīng)),產(chǎn)生 D (L2)2_er (L2R2),獲得 D_er (R2) / (L2)。在公式8-3中,沒(méi)有表示當(dāng)前塊(塊D)的量化誤差。
[0222]第三實(shí)施例的重建率低于第一或第二實(shí)施例的重建率。然而,因?yàn)榈谌龑?shí)施例根本不需要用于傳送補(bǔ)償信號(hào)的比特,因此第三實(shí)施例的壓縮率相當(dāng)高。
[0223]圖10是圖6所示的異類窗口(即,矩形窗口和非矩形窗口)的組合中的非矩形窗口的示例的示意圖。在非矩形窗口的示例中,如圖10 (A)至圖10 (C)所示,每個(gè)角不是直角而是具有斜坡(slope)的上升線。可將與圖10 (A)至圖10 (C)相對(duì)應(yīng)的非矩形窗口的形狀表不為表格I。
[0224][表格I]
[0225]
【權(quán)利要求】
1.一種處理音頻信號(hào)的方法,包括: 通過(guò)音頻處理裝置接收編譯標(biāo)識(shí)信息,所述編譯標(biāo)識(shí)信息表示是將第一編譯方案還是第二編譯方案應(yīng)用于當(dāng)前幀; 當(dāng)所述編譯標(biāo)識(shí)信息指示向所述當(dāng)前幀應(yīng)用所述第二編譯方案時(shí),接收窗口類型信息,所述窗口類型信息表示多個(gè)窗口當(dāng)中用于所述當(dāng)前幀的特定窗口; 基于所述窗口類型信息,識(shí)別當(dāng)前窗口是長(zhǎng)_起始窗口,其中,所述長(zhǎng)_起始窗口跟在先前幀的僅長(zhǎng)窗口之后,其中,所述長(zhǎng)_起始窗口包括平緩的長(zhǎng)_起始窗口以及陡峭的長(zhǎng)_起始窗口 ;以及 當(dāng)所述第一編譯方案被應(yīng)用于隨后幀時(shí),將所述平緩的長(zhǎng)_起始窗口應(yīng)用于所述當(dāng)前幀, 其中: 所述平緩的長(zhǎng)_起始窗口包括帶有第一斜坡的下降線, 所述陡峭的長(zhǎng)_起始窗口包括帶有第二斜坡的下降線, 所述第一斜坡比所述第二斜坡平緩。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述第一斜坡的寬度等于所述第二斜坡的寬度的兩倍。
3.根據(jù)權(quán)利要求1所述的方法,其中,所述第一斜坡的寬度與1/4的幀長(zhǎng)相對(duì)應(yīng)。
4.根據(jù)權(quán)利要求1所述的方法,其中,所述第一斜坡的寬度與256個(gè)抽樣相對(duì)應(yīng),并且其中,所述第一斜坡的寬度等于所述長(zhǎng)_起始窗口的長(zhǎng)度的1/8。
5.根據(jù)權(quán)利要求1所述的方法,其中,所述僅長(zhǎng)窗口是水平對(duì)稱的,并且 所述長(zhǎng)_起始窗口是水平不對(duì)稱的,并且在右半邊具有零部分。
6.根據(jù)權(quán)利要求1所述的方法,其中,帶有所述第一斜坡或所述第二斜坡的下降線的中心點(diǎn)在距所述長(zhǎng)_起始窗口的起始點(diǎn)3N/2距離處,并且其中,N是幀長(zhǎng)。
7.根據(jù)權(quán)利要求1所述的方法,其中,所述第一編譯方案基于線性預(yù)測(cè)域,并且所述第二編譯方案基于頻域。
8.一種用于處理音頻信號(hào)的裝置,包括: 解復(fù)用器,所述解復(fù)用器用于通過(guò)音頻處理裝置接收編譯標(biāo)識(shí)信息,所述編譯標(biāo)識(shí)信息表示是將第一編譯方案還是第二編譯方案應(yīng)用于當(dāng)前幀,并且,當(dāng)所述編譯標(biāo)識(shí)信息表示將所述第二編譯方案應(yīng)用于所述當(dāng)前幀時(shí),接收窗口類型信息,所述窗口類型信息表示多個(gè)窗口當(dāng)中用于所述當(dāng)前幀的特定窗口; 第二編譯單元,所述第二編譯單元用于基于所述窗口類型信息識(shí)別當(dāng)前窗口是長(zhǎng)_起始窗口,其中,所述長(zhǎng)_起始窗口跟在先如幀的僅長(zhǎng)窗口之后,其中,所述長(zhǎng)_起始窗口包括平緩的長(zhǎng)_起始窗口以及陡峭的長(zhǎng)_起始窗口,并且,當(dāng)所述第一編譯方案被應(yīng)用于隨后幀時(shí),將所述平緩的長(zhǎng)_起始窗口應(yīng)用于所述當(dāng)前幀, 其中: 所述平緩的長(zhǎng)_起始窗 口包括帶有第一斜坡的下降線, 所述陡峭的長(zhǎng)_起始窗口包括帶有第二斜坡的下降線, 所述第一斜坡比所述第二斜坡平緩。
9.根據(jù)權(quán)利要求8所述的裝置,其中,所述第一斜坡的寬度等于所述第二斜坡的寬度的兩倍。
10.根據(jù)權(quán)利要求8所述的裝置,其中,所述第一斜坡的寬度與1/4的幀長(zhǎng)相對(duì)應(yīng)。
11.根據(jù)權(quán)利要求8所述的裝置,其中,所述第一斜坡的寬度與256個(gè)抽樣相對(duì)應(yīng),并且其中,所述第一斜坡的寬度等于所述長(zhǎng)_起始窗口的長(zhǎng)度的1/8。
12.根據(jù)權(quán)利要求8所述的裝置,其中,所述僅長(zhǎng)窗口是水平對(duì)稱的,并且 所述長(zhǎng)_起始窗口是水平不對(duì)稱的,并且在右半邊具有零部分。
13.根據(jù)權(quán)利要求8所述的裝置,其中,帶有所述第一斜坡或所述第二斜坡的下降線的中心點(diǎn)在距所述長(zhǎng)_起始窗口的起始點(diǎn)3N/2距離處,并且其中,N是幀長(zhǎng)。
14.根據(jù)權(quán)利要求8所述的裝置,其中,所述第一編譯方案基于線性預(yù)測(cè)域,并且所述第二編譯方案基于頻域。
【文檔編號(hào)】G10L19/02GK103761971SQ201310579014
【公開(kāi)日】2014年4月30日 申請(qǐng)日期:2010年7月27日 優(yōu)先權(quán)日:2009年7月27日
【發(fā)明者】吳賢午, 姜泓求, 李昌憲, 宋政旭 申請(qǐng)人:延世大學(xué)工業(yè)學(xué)術(shù)合作社
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
庄浪县| 托克逊县| 咸丰县| 衢州市| 特克斯县| 南川市| 湖南省| 大埔区| 赤水市| 禄劝| 新和县| 鄂尔多斯市| 蒲江县| 阿拉善左旗| 东阳市| 芷江| 承德市| 延边| 金坛市| 扬州市| 丰原市| 永新县| 沁水县| 盐源县| 灵寿县| 宜都市| 鸡西市| 塔河县| 苏州市| 镇雄县| 台中县| 凤城市| 准格尔旗| 高唐县| 佛坪县| 洛浦县| 交口县| 德格县| 彰武县| 广昌县| 湘潭市|