專利名稱:一種在編解碼中調(diào)整量化質(zhì)量的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及編碼技術(shù),特別是指 一種在編解碼中調(diào)整量化質(zhì)量的方法和 裝置。
背景技術(shù):
隨著通信技術(shù)的發(fā)展以及多媒體業(yè)務(wù)的擴展,對于數(shù)字音頻、視頻等編 碼,不但需要更高的編碼效率和實時性,編碼帶寬也需要進(jìn)一步擴展。針對 數(shù)字音頻編碼來說,目前,能夠滿足低碼率、高質(zhì)量音頻編碼的技術(shù)主要包
括AAC+, EAAC+和AMR-WB+。其中AAC+和EAAC+是從高碼率的音 頻編碼器擴展而來,而AMR-WB+是通過對低碼率的語音編碼擴展而形成的 一種混合編碼方式。
在通常的音頻編碼中,為了更好的結(jié)合人類聽覺系統(tǒng)的一些特性, 一般 先對采樣值作時頻變換,然后根據(jù)聽覺特性對頻譜系數(shù)進(jìn)行取舍加權(quán)并量 化,量化后的頻譜系數(shù)再通過熵值編碼傳輸。編碼中的主要失真產(chǎn)生于對各 種參數(shù)的量化。因此,為了適應(yīng)不同的需求,編碼器需根據(jù)指定碼率的大小 對量化的質(zhì)量進(jìn)行調(diào)整在如大于24kbps的高碼率編碼方案中,好的編碼 器均會達(dá)到透明音質(zhì),即人耳無法察覺到編碼量化過程中引入的噪聲;而低 碼率編碼方案中,由于比特數(shù)的不足,不可能完全達(dá)到音質(zhì)透明的效果,從 而只能追求盡量小的主觀失真。
一種常用的調(diào)整量化質(zhì)量的技術(shù)是采用縮放因子或增益,編碼的系數(shù)先 除以縮放因子或乘以增益,然后再對縮放后的系數(shù)進(jìn)行量化,最合適的縮放 因子既能滿足碼率的要求又能使量化誤差盡量小。因此,當(dāng)碼率比較高的時 候,選擇較小的縮放因子,這樣量化系數(shù)的動態(tài)范圍相對較大,量化相對精 細(xì);而碼率比較小的時候,選擇較大的縮放因子,這樣量化系數(shù)的動態(tài)范圍 相對較小,量化相對粗糙。
圖1所示為MPEG1-LAYER3音頻編碼算法的示意框圖。在 MPEG1-LAYER3音頻編碼算法中,在作時頻變換之前,將整個編碼頻段等 分為32個子帶,對每個子帶分配一個縮放因子,對整個頻帶分配一個全局 縮放因子;在量化之前,通過閉環(huán)搜索算法調(diào)整全局縮放因子,使得量化比 特數(shù)在當(dāng)前比特率允許范圍內(nèi),同時調(diào)整子帶內(nèi)的縮放因子,盡可能使量化 噪聲在人耳的掩蔽域以下,即人耳感覺不到量化噪聲的存在;最后,量化后 的系數(shù)流通過霍夫曼編碼傳輸。
MPEG 1-LAYER3編碼算法中的子帶多縮放因子編碼方法存在下列缺
陷
(1) 子帶劃分需要32子帶分析濾波器組,計算復(fù)雜度很高;
(2) 每個子帶的縮放因子均需要量化編碼傳輸,占用的比特數(shù)過多, 不適合低碼率的編碼需要。
圖2所示為在AMR-WB+音頻編碼算法的變換激勵編碼(TCX)部分流 程圖。在AMR-WB+音頻編碼中,采用一個全局縮放因子。考慮到采用一個 縮放因子的局限性,無法針對某一特定的頻率段進(jìn)行微調(diào),而且,考慮到根 據(jù)低碼率的編碼要求,頻譜中能量較小的頻域樣值在矢量量化時會丟失,而 由于人類聽覺系統(tǒng)對不同頻段的敏感程度有差異,編碼時希望重要頻段處的 較小頻域樣值依然能夠被量化,所以,在AMR-WB+音頻編碼中,采用頻譜 預(yù)整形和頻譜逆整形技術(shù)。在AMR-WB+音頻編碼算法的TCX部分中,首 先對整個頻譜中比較重要的頻段進(jìn)行頻譜預(yù)整形,提升這些特定頻段的能 量,然后再對全頻段采用同一個全局縮放因子。
由于人類聽覺系統(tǒng)在低頻處有很高的頻率分辨率,通常所說的重要頻段 是指低頻,殳。在AMR-WB+音頻編碼中的頻譜預(yù)整形中,首先對前四分之一 頻譜,以每8點頻域樣值作為一塊,計算每個分塊的能量£,,,,其中m為分
塊索引號,然后找出其中最大的分塊能量£_,并對每個分塊計算出
HW",再根據(jù)^得出每個分塊的放大因子^,使每個分塊中放大
子。在AMR-WB+音頻編碼中,頻諳預(yù)整形中計算出的放大因子不在編碼碼 流中傳輸,而是在頻譜逆整形中,按照頻譜預(yù)整形中的方法,根據(jù)頻域樣值 計算出每個分塊的放大因子G。,后,通過對每個分塊的頻域樣值除以相應(yīng)塊 的放大因子得到恢復(fù)的頻域樣值。
AMR-WB+音頻編碼算法TCX部分的全局縮放因子算法存在以下缺陷
(1)由于對于全頻帶只使用一個縮放因子,量化質(zhì)量只能在整個頻帶 上調(diào)節(jié),無法強調(diào)某些比較重要的頻率段;
(2 )盡管采用頻譜預(yù)整形和頻譜逆整形技術(shù)增強了低頻處的量化質(zhì)量, 但犧牲了其余頻帶處的量化質(zhì)量;
(3) 頻譜預(yù)整形和逆整形技術(shù)只能應(yīng)用到帶寬較小的頻段上,否則將 導(dǎo)致全局縮放因子的明顯提升,整體量化效果反而降低;
(4) 由于在編碼階段預(yù)整形的放大因子并未記錄到編碼流中,量化后 產(chǎn)生的誤差將在逆整形的縮小因子中產(chǎn)生誤差累積效應(yīng)。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種在編碼中調(diào)整量化質(zhì)量的方法,降低實現(xiàn)復(fù)雜度。
本發(fā)明實施例提供一種在解碼中調(diào)整量化質(zhì)量的方法,能夠保證量化質(zhì)量。
本發(fā)明實施例提供一種在編碼中調(diào)整量化質(zhì)量的裝置,降低實現(xiàn)復(fù)雜度。
本發(fā)明實施例提供一種在解碼中調(diào)整量化質(zhì)量的裝置,能夠保證量化質(zhì)量。
本發(fā)明實施例提供一種在編碼中調(diào)整量化質(zhì)量的方法,該方法包括利
用兩個或兩個以上縮放因子,對用于編碼的第一采樣值進(jìn)行調(diào)整后,對調(diào)整
后的第 一采樣值進(jìn)行量化得到量化采樣值;從所得到的量化采樣值中去除縮
放因子的影響得到第二采樣值,并利用第 一采樣值和第二采樣值得到全局增
益;將所得到的量化采樣值、所述兩個或兩個以上的縮放因子的信息以及所
得到的全局增益作為編碼流輸出。
本發(fā)明實施例提供一種在解碼中調(diào)整量化質(zhì)量的方法,對編碼端輸出的
編碼流進(jìn)行解碼得到解碼流,該方法包括從解碼流中獲取量化采樣值、兩 個或兩個以上縮放因子的信息以及全局增益;利用兩個或兩個以上縮放因子 的信息,從所述量化采樣值中去除縮放因子的影響得到采樣值后,乘以全局 增益。
本發(fā)明實施例提供一種在編碼中調(diào)整量化質(zhì)量的裝置,該裝置包括多 縮放因子控制單元,量化單元,增益平衡單元,全局增益計算單元;其中, 所述多縮放因子控制單元用于接收第一采樣值,對第一采樣值設(shè)置兩個或兩 個以上縮放因子,利用縮放因子對第一采樣值進(jìn)行調(diào)整,將調(diào)整后的第一采 樣值輸出給所述量化單元;所述量化單元用于對所接收的第 一采樣值進(jìn)行量 化得到量化采樣值并輸出給所述增益平衡單元;所述增益平衡單元用于接收 量化采樣值,從量化采樣值中去除縮放因子的影響得到第二采樣值,并輸出 給所述全局增益計算單元;全局增益計算單元用于接收第一采樣值和第二采 樣值,并利用第 一采樣值和第二采樣值得到全局增益。
本發(fā)明實施例提供一種在解碼中調(diào)整量化質(zhì)量的裝置,該裝置包括增 益平衡單元和全局增益平衡單元;其中,所述增益平衡單元用于接收量化采 樣值和縮放因子,并利用所接收的縮放因子,從量化采樣值中去除縮放因子 的影響得到采樣值,并輸出給所述全局增益平衡單元;所述全局增益平衡單 元用于接收全局增益和采樣值,并對采樣值乘以全局增益后輸出。
根據(jù)本發(fā)明實施例提供的調(diào)整量化質(zhì)量的方法和裝置,與現(xiàn)有技術(shù)中所 述的使用濾波器的方案不同,直接對采樣值劃分為多個部分并對各部分分別 設(shè)置縮放因子,因此,能夠大大降低實現(xiàn)復(fù)雜度;而且,還與現(xiàn)有技術(shù)中使
用一個全局縮放因子的方案不同,由于采用多個縮放因子,因此,能夠更好 地調(diào)整重要部分的量化質(zhì)量,能夠獲得更好的編碼效果。
圖1所示為現(xiàn)有技術(shù)中MPEG1-LAYER3音頻編碼算法的示意框圖; 圖2所示為現(xiàn)有技術(shù)中在AMR-WB+音頻編碼算法的TCX部分流程圖; 圖3所示為本發(fā)明實施例1中調(diào)整量化質(zhì)量的編碼器示意框圖; 圖4所示為本發(fā)明實施例1中調(diào)整量化質(zhì)量的解碼器示意框圖; 圖5所示為本發(fā)明實施例1中在編碼端通過多縮放因子調(diào)整量化質(zhì)量的 流程圖6所示為本發(fā)明實施例1中選擇多個縮放因子并對整個頻段的頻域樣 值進(jìn)行微調(diào)的流程圖7所示為本發(fā)明實施例1中在解碼端通過多縮放因子調(diào)整量化質(zhì)量的 流程圖8所示為本發(fā)明實施例2中調(diào)整量化質(zhì)量的編碼器示意框圖9所示為本發(fā)明實施例2中調(diào)整量化質(zhì)量的解碼器示意框圖IO所示為本發(fā)明實施例2中實現(xiàn)峰值預(yù)整形的示意圖11所示為本發(fā)明實施例2中實現(xiàn)峰值逆整形的示意圖12所示為本發(fā)明實施例3中調(diào)整量化質(zhì)量的編碼器示意框圖13所示為本發(fā)明實施例3中調(diào)整量化質(zhì)量的解碼器示意框圖14所示為本發(fā)明實施例4中在編碼端調(diào)整量化質(zhì)量的裝置結(jié)構(gòu)圖15所示為本發(fā)明實施例4中在解碼端調(diào)整量化質(zhì)量的裝置結(jié)構(gòu)圖。
具體實施例方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白,下面舉具體實施例, 對本發(fā)明作進(jìn)一步詳細(xì)的說明。
本發(fā)明實施例提供的調(diào)整量化質(zhì)量的主要思想是利用多縮放因子或者
進(jìn)一步利用頻語整形技術(shù),調(diào)整編碼過程中的量化質(zhì)量。下面,主要以對采 樣值進(jìn)行時頻變換的編碼過程進(jìn)行說明。當(dāng)然,對于在編碼過程中沒有對采 樣值進(jìn)行時頻變換的情況,仍可以采用本發(fā)明實施例。
實施例1
實施例1提供一種通過多縮放因子調(diào)整量化質(zhì)量的方法。 圖3所示為實施例1中調(diào)整量化質(zhì)量的編碼器示意框圖,在編碼過程中, 時域采樣值首先通過時頻變換轉(zhuǎn)換到頻域,然后通過多縮放因子控制后,進(jìn) 行量化并輸出量化的采樣值,輸出的量化采樣值通過增益平衡、逆時頻變換 后計算最佳全局增益。編碼碼流需要傳輸縮放因子、頻域采樣值的量化值以 及全局增益三個部分。
圖4所示為實施例1中調(diào)整量化質(zhì)量的解碼器示意框圖,在解碼過程中, 量化頻域采樣值通過增益平衡和逆時頻變換后,得到時域釆樣值,最后乘以 全局增益即可還原時域采樣值。
下面給出在實施例1中,在編碼端通過多縮放因子調(diào)整量化質(zhì)量的具體 步驟,如圖5所示,包括以下步驟
步驟501:通過時頻變換,將時域采樣值x(n)轉(zhuǎn)換到頻域采樣值義("。
在此,可以采用離散傅立葉變換(DFT)、離散余弦變換(DCT, MDCT, IDCT)、小波變換(DWT)等時頻變換。在時頻變換過程中,還可以采用 快速傅立葉變換(FFT),降低計算復(fù)雜度。
步驟502:對頻域采樣值義(Q進(jìn)行多縮放因子控制,具體為,選擇合適 的多個縮放因子,對整個頻段的頻域采樣值進(jìn)行微調(diào)。
本實施例中,假設(shè)對整個頻段的頻域采樣值Z(W, /1 = 0,1,...,#采用m個 縮放因子,并設(shè)在編碼過程中,允許的比特數(shù)的最大值為6_。下面,結(jié)合 圖6所示的流程圖,詳細(xì)介紹選擇合適的多縮放因子并對頻域采樣值進(jìn)行微 調(diào)的步驟。
步驟601:將整個頻段劃分為m個部分
,…,[ ,—,+l,iV],得到m個部分的頻域采樣值<formula>formula see original document page 19</formula>并將每一部分的縮放因子用g,,&,…,^表示。
本發(fā)明實施例中,多個縮放因子是對時頻變換后的整個頻帶上直接劃 分,并不需要先通過濾波器組將頻段劃分為若干段,再在每段內(nèi)設(shè)置一個縮 放因子,從而與現(xiàn)有技術(shù)相比,能夠大大降低實現(xiàn)復(fù)雜度。
步驟602:選擇用于估計m個縮放因子的基準(zhǔn)值g。,該縮放因子的基準(zhǔn) 值g。的選擇,使得消耗比特數(shù)6。的估計值小于最大允許比特數(shù)6max 。
本實施例中,消耗比特數(shù)b的估計值是與頻域采樣值X、頻域采樣值的 個數(shù)N以及縮放因子g相關(guān)的值,可以用Z^cons(X,W,g)的函數(shù)表示。因此, 在本步驟602中,選擇縮放因子的基準(zhǔn)值為g。時,消耗比特數(shù)的估計值為 <formula>formula see original document page 19</formula>且滿足6。"腿。
步驟603:在g。的附近調(diào)整m個縮放因子g,,g2,…,^。
本步驟603中,可以通過降低較重要頻段的縮放因子,提升不重要頻段 的縮放因子的方式,調(diào)整m個縮放因子。在此,較重要頻段是指低頻段, 不重要頻段是指高頻段。由于g, ~ ^分別對應(yīng)從低到高的頻段,所以,調(diào)整 后的m個縮放因子gpg、,…,g^是逐漸遞增的關(guān)系。通過這種調(diào)整,可以使較 重要頻段的量化質(zhì)量相對較高,不重要頻段的量化質(zhì)量相對較低,從而使整 個頻段內(nèi)的量化質(zhì)量達(dá)到最優(yōu)。
步驟604:判斷在調(diào)整后的m個縮放因子下,消耗比特數(shù)的估計值不超 過總比特數(shù),如果不滿足,則返回步驟603,再次調(diào)整縮放因子,如果滿足, 則將滿足消耗比特數(shù)的m個縮放因子表示為<formula>formula see original document page 19</formula>
步驟605:根據(jù)調(diào)整后的m個縮放因子g,,g、,…,g:,,計算量化感知失真。 本實施例中,量化感知失真c是與頻域采樣值X和m個縮放因子 gp&,…,^相關(guān)的值,可以用<formula>formula see original document page 19</formula>的函數(shù)表示'量化感知失真c 的值表示原始的頻域采樣值X和通過m個縮放因子g,,&,…,g。,對該頻域采 樣值X進(jìn)行調(diào)整后得到的采樣值之間的差異所帶來的失真的值。本步驟605中,根據(jù)調(diào)整后的m個縮放因子g',,g、,…,g^計算得到的量化感知失真為
<formula>formula see original document page 20</formula>步驟606:判斷量化感知失真是否在無法感知的范圍內(nèi),如果是,則將 本次調(diào)整后得到的m個縮放因子作為最佳縮放因子,用g—,,g—,…,g,表示, 然后執(zhí)行步驟607;否則,返回步驟603。
其中,如果感知失真在無法感知的范圍內(nèi),則人無法感知到由編碼器引 入的量化噪聲。例如針對音頻編碼,人耳無法感知到由編碼器引入的量化噪 聲,再如針對視頻編碼,人眼無法感知到由編碼器引入的量化噪聲。在此, 具體的無法感知的范圍是一個具體的允許失真的數(shù)值范圍。判斷量化感知失 真是否在無法感知的范圍內(nèi)的具體方法是判斷步驟605中計算出來的量化 感知失真的值是否在所述的允許失真的數(shù)值范圍,如果是,則認(rèn)為量化感知 失真無法感知,否則,認(rèn)為量化感知能夠被感知。
本實施例中,根據(jù)步驟606的判斷,當(dāng)量化感知失真能夠被感知到時, 如果重復(fù)上述的調(diào)整步驟M次后,量化感知失真仍能夠被感知到,則結(jié)束 閉環(huán)選擇,并從上述重復(fù)過程中調(diào)整得到的縮放因子中,選擇使得感知失真 最小的一組縮放因子作為最佳縮放因子,然后執(zhí)行步驟607。在實際應(yīng)用中, 閉環(huán)選擇的次數(shù)M可以根據(jù)實際情況確定。
步驟607:用所得到的m個最佳縮放因子g—,g一,…,g,一,對頻域采樣
值X進(jìn)行微調(diào),即每一塊的頻域采樣值分別除以對應(yīng)塊的最佳縮放因子, 得到微調(diào)后的頻譜Z',具體表達(dá)式如下所示。
<formula>formula see original document page 20</formula>
通過以上步驟601 ~ 607得到的微調(diào)后的頻域采樣值Y送入編碼器。 考慮到解碼時需要利用縮放因子恢復(fù)數(shù)據(jù),因此,編碼碼流中需要傳輸 縮放因子。傳輸縮放因子的方式可以釆用多種方式,下面分別介紹。
傳輸縮放因子的方式一將用于微調(diào)頻率采樣值時的m個縮放因子,,g—,…,g—全部編碼,這樣,解碼時能夠較準(zhǔn)確地恢復(fù)數(shù)據(jù)。
傳輸縮放因子的方式二在用于微調(diào)頻率釆樣值時的m個縮放因子 ,g—,…,g,中,選擇一個縮放因子作為基準(zhǔn)縮放因子,然后計算其余m -1個縮放因子與該基準(zhǔn)縮放因子的比值,并編碼這m-l個比值。例如,
將g—,作為基準(zhǔn)縮放因子,則只需要編碼^L,^,…,^即可。這樣,可以
g 1 ,1 g 1甲
減少消耗的比特數(shù)。
傳輸縮放因子的方式三在用于微調(diào)頻率采樣值時的m個縮放因子 g,,,g—,…,g—中,選擇一個縮放因子作為基準(zhǔn)縮放因子,然后計算其余m -1個縮放因子與該基準(zhǔn)縮放因子的比值,并編碼該基準(zhǔn)縮放因子和m- 1
個比值。例如,將g—作為基準(zhǔn)縮放因子,則需要編碼g,。p,以及^,^^,…,k 即可。這樣,不僅可以減少消耗的比特數(shù),而且由于解碼端可以根據(jù)g—,以 及^,^,…,^計算得到g,,,g—,…,g,,從而還能夠較準(zhǔn)確地恢復(fù)數(shù)據(jù)。
gl(); /Sl, S"l()/ /
為了在采用多個縮放因子時,不占用較多的比特數(shù),可以根據(jù)編碼碼率 的要求以及量化質(zhì)量的要求,選擇較佳的縮放因子的個數(shù)。例如,在低碼率 編碼中,可以選擇2~3個縮放因子。
步驟503:對通過多縮放因子控制得到的頻域采樣值X'進(jìn)行量化,輸出 量化頻域采樣值A(chǔ)。
本步驟503中,根據(jù)編碼需求,可以采用不同的量化方式,例如,多級 矢量量化、分裂矢量量化、樹形量化、格形矢量量化等。
步驟504:對步驟503中得到的量化頻率釆樣值A(chǔ),去除縮放因子的影
響,恢復(fù)原始的頻域采樣值^。,_,即對量化頻率采樣值^進(jìn)行增益平衡后
得到4證。
根據(jù)步驟502中傳輸縮放因子的方式不同,增益平衡的方法也要采用不 同方式。
若傳輸縮放因子的方式為上述方式一或方式三,則可利用步驟502中選 擇得到的多個縮放因子g,,,g一,…,g,進(jìn)行增益平衡,具體為將量化頻率
采樣值A(chǔ)也按照步驟601中的頻段劃分方式分為m個部分,得到 <formula>formula see original document page 22</formula>),并對每一部分的量化 頻率采樣值乘以相應(yīng)部分的縮放因子,其具體表達(dá)式如下
<formula>formula see original document page 22</formula>
若傳輸縮放因子的方式為上述方式三,則可以利用多個縮放因子的比例
值進(jìn)行增益平衡,具體為將量化頻率采樣值A(chǔ)也按照步驟601中的頻段劃
分方式分為 m個部分,得到A(0,1,…,",),1+l,"m—,+2,…,A0 ,
A(",+l,A7,+2,…,"2),對基準(zhǔn)縮放因子的相應(yīng)部分的頻率采樣值乘以1,其余
部分的量化頻率采樣值均乘以相應(yīng)部分的縮放因子與基準(zhǔn)縮放因子的比例 值,假設(shè)將第一部分相應(yīng)的縮放因子g,,作為基準(zhǔn)縮放因子,則增益平衡的
具體表達(dá)式如下
<formula>formula see original document page 22</formula>
步驟505:對增益平衡后得到的^w進(jìn)行逆時頻變換,將還原的頻域 采樣值轉(zhuǎn)換為還原的時域采樣值、W 。
步驟506:利用原始的時域采樣值;c(")和還原的時域采樣值、("),計算 最佳全局增益g",。
小的全局增益&作為最佳全局增益&,,即最佳全局增益g一使
S[xW-gg.V^f最小。由此可以得出最佳全局增益為:<formula>formula see original document page 22</formula>
最佳全局增益g,,也需要編碼傳輸,用于解碼端的數(shù)據(jù)恢復(fù)。 以上所述為在編碼端通過多縮放因子調(diào)整量化質(zhì)量的流程。與編碼過程 中進(jìn)行的量化質(zhì)量調(diào)整相應(yīng)的,需要在解碼端通過如圖7所示的流程,根據(jù)
解碼后得到的量化頻率采樣值恢復(fù)時域采樣值,其具體流程包括以下步驟
步驟701:利用從編碼流中得到的縮放因子,對量化頻率采樣值進(jìn)行增 益平衡。其具體實現(xiàn)同步驟504中所述的方法,在此,省略其描述。需要注 意的是,根據(jù)傳輸縮放因子的方式不同,增益平衡的方法也要采用不同方式, 而且,編碼端中的增益平衡方式和解碼端中的增益平衡方式也要一致。
步驟702:對增益平衡后得到的頻域采樣值進(jìn)行逆時頻變換,得到時域 采樣值。
步驟703:時域采樣值乘以從編碼流中得到的全局增益,得到恢復(fù)的時 域采樣值。
本實施例1所采用的多縮放因子控制的技術(shù)可以直接對時域的采樣值 進(jìn)行,即可以適用于沒有時頻變換的情況,相應(yīng)的,在計算全局增益時,沒 有逆時頻變換過程。針對這種情況,在設(shè)置多縮放因子時,可以以時間段劃 分時域釆樣值,在調(diào)整多縮放因子時,可以將較重要時間段的縮放因子降低, 將不重要時間段的縮放因子提升。
實施例2
實施例2提供一種通過多縮放因子和頻譜整形調(diào)整量化質(zhì)量的方法。
圖8所示為實施例2中調(diào)整量化質(zhì)量的編碼器示意框圖,在編碼過程中, 時域采樣值首先通過時頻變換轉(zhuǎn)換到頻域,然后通過頻譜預(yù)整形和多縮放因 子控制后,進(jìn)行量化并輸出量化的采樣值,輸出的量化采樣值通過增益平衡、 頻譜逆整形和逆時頻變換后計算最佳全局增益。編碼碼流需要傳輸縮放因 子、頻域采樣值的量化值以及全局增益三個部分。
圖9所示為實施例2中調(diào)整量化質(zhì)量的解碼器示意框圖,在解碼過程中, 量化頻域釆樣值通過增益平衡、頻語逆整形和逆時頻變換后,得到時域采樣 值,最后乘以全局增益即可還原時域采樣值。
在實施例2中,通過多縮放因子和峰值整形調(diào)整量化質(zhì)量的具體步驟 為,在實施例1中的圖5所示的流程的基礎(chǔ)上,在步驟501所述的時頻變換 和步驟502所述的多縮放因子控制之間,進(jìn)一步包括頻i普預(yù)整形的步驟,在
步驟504所述的增益平衡和步驟505所述的逆時頻變換之間,進(jìn)一步包括頻 譜逆整形的步驟。下面,詳細(xì)介紹頻譜預(yù)整形和頻譜逆整形的具體實現(xiàn)方法。 圖IO所示為實現(xiàn)頻譜預(yù)整形的示意圖,可以通過以下步驟實現(xiàn)。 步驟1001:確定頻譜整形區(qū)域,并在該頻譜整形區(qū)域內(nèi)的步驟501中 得到的頻域采樣值中,標(biāo)記頻域采樣值的峰值集合{^ , = 1,...,似}。
在此,頻譜整形區(qū)域是指較重要頻段的頻譜區(qū)域。例如,在音頻數(shù)據(jù)中, 由于人類聽覺系統(tǒng)在低頻處具有較高的頻率分辨率,因此,低頻部分認(rèn)為是 較重要頻段;再如,在視頻、圖像等數(shù)據(jù)中,數(shù)據(jù)信息大部分都集中在低頻 處,因此,低頻部分認(rèn)為是較重要頻段。因此,頻譜整形區(qū)域可以采用全頻 段的前面部分,例如,可采用前四分之一等。
在此,所述的峰值A(chǔ)可以定義為整形頻譜段幅值中的局部最大值,若
X(0〉義G) ,V/e[!' — A,,'+ 乂 ,貝'j義(,')為[/ —A,"A]的2A + 1點局4卩的最大^f直,
其中,局部區(qū)域可任意選擇。
步驟1002:計算用于頻譜預(yù)整形的參考值;v。
在此,選擇參考值的原則是要保證參考值大小在頻語整形前后保持不 變。本步驟1002中,可以將峰值集合{;^^ = 1,..,7^中的最大峰值作為參考
值~,或者將最大局部能量作為參考值/v??紤]到量化誤差的影響,還可 以將 一 塊數(shù)據(jù)的特征參數(shù)作為參考值;v ,以避免量化誤差對參考值產(chǎn)生較 大的影響。較佳的,參考值/v可以選擇為峰值集合{^, , = 1,..,似}中的最 大峰值臨近數(shù)據(jù)點的能量,或者平均能量等。
步驟1003:計算對峰值集合{^^ = 1,..,似}中每個峰值凡,的放大因子六,,,,
<formula>formula see original document page 24</formula>
,/te(o,i),其中,c;,和/t可根據(jù)實際情況選擇適當(dāng)?shù)膮?shù).
步驟1004:利用所計算出的峰值放大因子,對峰值進(jìn)行放大。
為了保證參考值 的不變性,對除了用于計算參考值~相關(guān)的峰值點
之外,對剩余的其它峰值點&乘以相應(yīng)的放大因子&,放大后得到的峰值 考慮到人類聽覺系統(tǒng)在低頻處有很高的頻率分辨率,將低頻部分的峰值
能量放大即可使得峰值能夠被量化器捕捉,因此,在本實施例2中只對少量 的頻譜點即峰值進(jìn)行放大。本實施例中,將這種頻鐠預(yù)整形技術(shù)也可以稱為 峰值預(yù)整形。采用這種峰值預(yù)整形技術(shù),對全局增益的增加影響較小,由全 局增益增加引起的量化誤差增加可以忽略不計。當(dāng)然,若考慮到使頻錯整形 的效果更好,還可以對峰值周圍的頻譜點進(jìn)行放大,例如,對2A + 1點局部的 峰值進(jìn)行放大的同時,還可以對該峰值周圍的2A或少于2A的點,利用相應(yīng) 的放大因子進(jìn)行放大。
通過以上頻譜預(yù)整形過程,提升較重要頻段處的頻域采樣值的峰值,從 而能夠降低較重要頻段的頻域采樣值較小峰值處的量化誤差,降低了較重要 頻段的頻譜峰值在量化中丟失的概率。
在編碼器中,為了計算最佳全局增益,還需要從量化頻率采樣值恢復(fù)得 到時域采樣值。若采用頻譜預(yù)整形,則在通過步驟504所述的增益平衡得到 Iw后,需要對Aw進(jìn)行頻譜逆整形,其具體實現(xiàn)過程如圖11所示,包 括以下步驟
步驟1101:在步驟504中得到的A。,^中,標(biāo)記頻譜整形區(qū)域中頻域采 樣值的峰值集合k,m^,…,M)。其中,頻譜逆整形過程中的頻譜整形區(qū)域和
峰值標(biāo)記準(zhǔn)則應(yīng)與頻譜預(yù)整形過程中的相同。
步驟1102:計算用于頻鐠逆整形的參考值 。其中,頻譜逆整形過程
中的參考值計算準(zhǔn)則也應(yīng)與頻譜預(yù)整形過程中的相同。例如,若在頻譜預(yù)整
形過程中,采用峰值集合{/7 ^ = 1,...,似}中的最大峰值臨近數(shù)據(jù)點的能量作為
參考值,則在頻譜逆整形過程中,也應(yīng)采用峰值集合k,m^l,…,MJ中的最大 峰值臨近數(shù)據(jù)點的能量作為參考值。
步驟1103:計算對峰值集合k,w^,…,Mi中每個峰值L的縮小因子i;,《w
,Ae(O,l),其中,C;,和A:應(yīng)與頻-潛預(yù)整形過程中的參數(shù)一致,
其中,在頻譜逆整形過程中的縮小因子^的計算原理如下在頻譜預(yù)整
r 、*
形過程中,放大因子為/ = 0~ Je(O,l),如果某峰值點大小為p,則放大
、P J
后的峰值為
根據(jù)該式,求出p的表達(dá)式為
<formula>formula see original document page 26</formula>
由上述在頻譜逆整形過程中計算縮小因子的原理可以得到,在編碼流中 無需傳輸用于頻譜逆整形的參考值,在解碼端也可以按照上述原理,可以利 用解碼端的采樣值本身的特性,計算得到用于頻譜逆整形的參考值,進(jìn)一步 可以計算出相應(yīng)峰值的縮小因子,從而不占用額外的比特數(shù)。
步驟1104:利用所計算出的峰值縮小因子,對峰值進(jìn)行縮小。在頻鐠 逆整形過程中,應(yīng)對在頻譜預(yù)整形過程中放大的峰值進(jìn)行縮小。如果在頻譜 預(yù)整形過程中,對除了用于計算參考值之外的其它峰值點進(jìn)行了放大,則在 頻譜逆整形過程中,也需要對用于計算參考值之外的其它峰值點進(jìn)行縮小, 即對除了用于計算參考值V相關(guān)的峰值點之外,對剩余的其它峰值點仏,,除 以相應(yīng)的縮小因子rm ,縮小后得到的峰值點為 < =《 /a;,。
通過以上步驟進(jìn)行頻譜逆整形后,在步驟505中對頻譜逆整形后得到的 頻域采樣值進(jìn)行逆時頻變換。
本實施例2中,由于在編碼過程中在時頻變換和多縮放因子控制之間進(jìn) 行了頻譜預(yù)整形,相應(yīng)的,在解碼端也需要在增益平衡和逆時頻變換之間進(jìn) 行頻譜逆整形,具體的實現(xiàn)方法如同在上述編碼過程中進(jìn)行的頻譜逆整形方 法,在此省略其描述。
上面所述的本實施例2中,先進(jìn)行頻鐠預(yù)整形,然后再進(jìn)行多縮放因子
的控制。同樣的,在編碼過程中,還可以先進(jìn)行多縮放因子的控制,然后再 進(jìn)行頻譜預(yù)整形,相應(yīng)的,在編碼過程中的恢復(fù)原始采樣值的過程中和在解 碼過程中,可以先進(jìn)行頻譜逆整形,然后再進(jìn)行增益平衡。針對這種情況, 不予詳細(xì)的介紹。
實施例3
實施例3提供一種通過頻譜整形調(diào)整量化質(zhì)量的方法。 圖12所示為實施例3中調(diào)整量化質(zhì)量的編碼器示意框圖,在編碼過程 中,時域采樣值首先通過時頻變換轉(zhuǎn)換到頻域,然后通過頻譜預(yù)整形后,進(jìn) 行量化并輸出量化的采樣值,輸出的量化采樣值通過頻譜逆整形和逆時頻變 換后計算最佳全局增益。編碼碼流需要傳輸頻域采樣值的量化值以及全局增 益三個部分。
圖13所示為實施例3中調(diào)整量化質(zhì)量的解碼器示意框圖,在解碼過程 中,量化頻域采樣值通過頻譜逆整形和逆時頻變換后,得到時域采樣值,最 后乘以全局增益即可還原時域采樣值。
在本實施例3中,頻譜預(yù)整形以及頻譜逆整形的方法與實施例2中的實 現(xiàn)方法和所得到的技術(shù)效果一致,在此不再詳細(xì)闡述。
實施例4
實施例4給出調(diào)整量化質(zhì)量的實現(xiàn)裝置。
與實施例2所述的方法相對應(yīng),圖14所示為實施例4中在編碼端調(diào)整 量化質(zhì)量的裝置結(jié)構(gòu)圖。如圖14所示,在編碼端調(diào)整量化質(zhì)量的裝置包括 時頻變換單元,頻譜預(yù)整形單元,多縮放因子控制單元,量化單元,增益平 衡單元,頻譜逆整形單元,逆時頻變換單元,全局增益計算單元。其中,所 述時頻變換單元接收第一采樣值,并對第一采樣值進(jìn)行時頻變換后,輸出給 所述頻譜預(yù)整形單元;所述頻鐠預(yù)整形單元接收所述時頻變換單元輸出的第 一采樣值,對該第一采樣值進(jìn)行頻鐠預(yù)整形后輸出給所述多縮放因子控制單 元;所述多縮放因子控制單元接收第一采樣值,對第一采樣值設(shè)置兩個或兩個以上縮放因子,利用縮放因子對第一采樣值進(jìn)行調(diào)整,將調(diào)整后的第一采 樣值輸出給所述量化單元;所述量化單元對所接收的第一采樣值進(jìn)行量化得
到量化采樣值并輸出給所述增益平衡單元;所述增益平衡單元接收量化采樣 值,從量化采樣值中去除縮放因子的影響得到第二采樣值,并輸出給所述頻 譜逆整形單元;所述頻譜逆整形單元接收所述增益平衡單元輸出的第二采樣 值,對該第二采樣值進(jìn)行頻譜逆整形后輸出給所述逆時頻變換單元;所述逆 時頻變換單元從所述峰值逆整形單元中接收第二采樣值,并對第二采樣值進(jìn) 行逆時頻變換后,輸出給所述全局增益計算單元;全局增益計算單元接收第 一采樣值和第二采樣值,并利用第 一采樣值和第二采樣值得到全局增益。
所述多縮放因子控制單元包括縮放因子設(shè)置單元和采樣值調(diào)整單元;所 述縮放因子設(shè)置單元用于對第一采樣值設(shè)置兩個或兩個以上縮放因子,并將所 設(shè)置的縮放因子輸出給所述采樣值調(diào)整單元;所述采樣值調(diào)整單元用于接收縮 放因子,并利用縮放因子對第一采樣值進(jìn)行調(diào)整。
所述縮放因子設(shè)置單元包括基準(zhǔn)值設(shè)置單元、縮放因子調(diào)整單元、消耗 比特數(shù)估計單元、感知失真計算單元;所述基準(zhǔn)值設(shè)置單元用于設(shè)置縮放因子 的基準(zhǔn)值,并輸出給所述縮放因子調(diào)整單元;所述縮放因子調(diào)整單元用于根據(jù) 基準(zhǔn)值調(diào)整縮放因子,并輸出給所述消耗比特數(shù)估計單元和感知失真計算單元; 所述消耗比特數(shù)估計單元用于根據(jù)縮放因子,估計消耗比特數(shù),并判斷消耗比 特數(shù)是否小于編碼所允許的總比特數(shù),將判斷結(jié)果發(fā)送給所述縮放因子調(diào)整單 元;所述感知失真計算單元用于根據(jù)縮放因子,計算感知失真,并判斷感知失 真是否在無法感知的范圍內(nèi),將判斷結(jié)果發(fā)送給所述縮放因子調(diào)整單元。
所述頻譜預(yù)整形單元包括峰值標(biāo)記單元、參考值計算單元、放大因子計 算單元、預(yù)整形單元;其中,所述峰值標(biāo)記單元用于接收第一釆樣值,并在頻 謙整形區(qū)域內(nèi)的第一采樣值中,標(biāo)記峰值,輸出給所述參考值計算單元;所述 參考值計算單元用于利用峰值計算用于頻譜預(yù)整形的參考值,輸出給所述放大 因子計算單元;所述放大因子計算單元用于利用參考值,計算各標(biāo)記峰值的放 大因子,輸出給所述預(yù)整形單元;所述預(yù)整形單元用于利用所述放大因子,對頻i普進(jìn)行預(yù)整形。
所述頻譜逆整形單元包括峰值標(biāo)記單元、參考值計算單元、縮小因子計
算單元、逆整形單元;其中,所述峰值標(biāo)記單元用于接收采樣值,并在頻語整 形區(qū)域內(nèi)的采樣值中,標(biāo)記峰值,輸出給所述參考值計算單元;所述參考值計 算單元用于利用峰值計算用于頻語逆整形的參考值,輸出給所述縮小因子計算 單元;所述縮小因子計算單元用于利用參考值,計算各標(biāo)記峰值的縮小因子, 輸出給所述逆整形單元;所述逆整形單元用于利用所述縮小因子,對頻譜進(jìn)行 逆整形。
與實施例2所述的方法相對應(yīng),圖15所示為本實施例4中在解碼端調(diào) 整量化質(zhì)量的裝置結(jié)構(gòu)圖。如圖15所示,在解碼端調(diào)整量化質(zhì)量的裝置包 括增益平衡單元、頻譜逆整形單元、逆時頻變換單元以及全局增益平衡單 元。其中,所述增益平衡單元用于接收量化采樣值和縮放因子,并利用所接 收的縮放因子,從量化采樣值中去除縮放因子的影響得到采樣值,并輸出給 所述頻譜逆整形單元;所述頻譜逆整形單元接收所述增益平衡單元輸出的采 樣值,對該采樣值進(jìn)行頻語逆整形后輸出給所述逆時頻變換單元;所述逆時 頻變換單元從所述頻譜逆整形單元中接收采樣值,并對采樣值進(jìn)行逆時頻變 換后,輸出給所述全局增益平衡單元;所述全局增益平衡單元接收全局增益 和采樣值,并對采樣值乘以全局增益后輸出。全局增益平衡單元可以是乘法 器。與編碼端相同的,所述解碼端的頻譜逆整形單元包括峰值標(biāo)記單元、 參考值計算單元、縮小因子計算單元、逆整形單元;其中,所述峰值標(biāo)記單 元接收采樣值,并在頻譜整形區(qū)域內(nèi)的采樣值中,標(biāo)記峰值,輸出給所述參 考值計算單元;所述參考值計算單元用于利用峰值計算用于頻譜逆整形的參 考值,輸出給所述縮小因子計算單元;所述縮小因子計算單元用于利用參考 值,計算各標(biāo)記峰值的縮小因子,輸出給所述逆整形單元;所述逆整形單元 用于利用所述縮小因子,對頻譜進(jìn)行逆整形。
當(dāng)然,與上述的實施例1、 3所述的方法相對應(yīng),以及具體實現(xiàn)方法相 對應(yīng),可以采用不同結(jié)構(gòu)的調(diào)整量化質(zhì)量的裝置,裝置中的各單元的功能已
在上面詳細(xì)介紹,在此,不再詳細(xì)闡述。
以上所述的實施例可以應(yīng)用于音頻編碼、視頻編碼、圖像編碼等各種編 碼領(lǐng)域中。
以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本 發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在 本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1、一種在編碼中調(diào)整量化質(zhì)量的方法,其特征在于,該方法包括利用兩個或兩個以上縮放因子,對用于編碼的第一采樣值進(jìn)行調(diào)整后,對調(diào)整后的第一采樣值進(jìn)行量化得到量化采樣值;從所得到的量化采樣值中去除縮放因子的影響得到第二采樣值,利用第一采樣值和第二采樣值得到全局增益;將所得到的量化采樣值、所述兩個或兩個以上的縮放因子的信息以及所得到的全局增益作為編碼流輸出。
2、 根據(jù)權(quán)利要求1所述的方法,其特征在于, 所述第 一采樣值和第二采樣值為時域的采樣值;在對第一采樣值進(jìn)行調(diào)整之前,進(jìn)一步包括將時域的第一采樣值轉(zhuǎn)換為 頻域的第一采樣值;所述利用縮放因子對第一采樣值進(jìn)行調(diào)整為利用縮放因子,對頻域的第 一采樣值進(jìn)行調(diào)整;所述對調(diào)整后的第一采樣值進(jìn)行量化得到量化采樣值為對調(diào)整后的頻域 的第 一采樣值進(jìn)行量化得到量化采樣值;所述從量化采樣值中得到第二采樣值為從量化采樣值中去除縮放因子的 影響得到頻域的第二采樣值;在得到第二采樣值之后,得到全局增益之前,進(jìn)一步包括將頻域的第二 采樣值轉(zhuǎn)換為時域的第二采樣值;所述利用第一采樣值和第二采樣值得到全局增益為利用時域的第一采樣 值和時域的第二采樣值得到全局增益。
3、 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述將時域的第 一采樣值轉(zhuǎn)換為頻域的第 一采樣值為通過離散傅立葉變 換,或快速傅立葉變換,或離散余弦變換,或小波變換,將時域的第一采樣值 轉(zhuǎn)換為頻域的第 一采樣值。
4、 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述兩個或兩個以上縮放因子為對頻域的第一采樣值設(shè)置的兩個或兩個 以上縮;汰因子。
5、 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述對頻域的第 一采樣值設(shè)置兩個或兩個以上縮放因子為將頻域的第一 采樣值劃分為兩個或兩個以上部分,并對各部分分別設(shè)置一個縮放因子。
6、 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述利用縮放因子對頻域的第一采樣值進(jìn)行調(diào)整為對各部分的頻域的第 一采樣值,分別利用對應(yīng)部分的縮放因子進(jìn)行調(diào)整。
7、 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述從所得到的量化采樣值中去除縮放因子的影響為按照劃分所述頻域 的第一釆樣值的方式,將量化采樣值劃分為相應(yīng)的兩個或兩個以上部分,并利 用各部分的縮放因子,從相應(yīng)部分的量化采樣值中去除對應(yīng)部分的縮放因子的 影響。
8、 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述兩個或兩個以上的縮放因子的信息作為編碼流輸出為將所述兩個或 兩個以上的縮》文因子作為編碼流輸出。
9、 根據(jù)權(quán)利要求6所述的方法,其特征在于,對各部分分別設(shè)置縮放因子后,進(jìn)一步包括選擇其中一個部分的縮放因 子作為基準(zhǔn)縮放因子,計算其余部分的縮放因子與該基準(zhǔn)縮放因子的比值;所述從所得到的量化采樣值中去除縮放因子的影響為按照劃分所述頻域 的第一采樣值的方式,將量化采樣值劃分為相應(yīng)的兩個或兩個以上部分,并利 用所得到的比值,從相應(yīng)部分的量化采樣值中去除對應(yīng)部分的縮放因子的影響。
10、 根據(jù)權(quán)利要求9所述的方法,其特征在于,所述兩個或兩個以上的縮 放因子的信息作為編碼流輸出為將所述其余部分的縮放因子與該基準(zhǔn)縮放因 子的比值作為編碼流輸出。
11、 根據(jù)權(quán)利要求9所述的方法,其特征在于,所述從所得到的量化采樣值中去除縮放因子的影響為按照劃分所述頻域的第一釆樣值的方式,將量化采樣值劃分為相應(yīng)的兩個或兩個以上部分,并利 用基準(zhǔn)縮放因子和所得到的比值計算得到各部分的縮放因子,利用各部分的縮 放因子,從相應(yīng)部分的量化采樣值中去除對應(yīng)部分的縮放因子的影響。
12、 根據(jù)權(quán)利要求11所述的方法,其特征在于,所述兩個或兩個以上的縮 放因子的信息作為編碼流輸出為將所述基準(zhǔn)縮放因子以及所述其余部分的縮 放因子與該基準(zhǔn)縮放因子的比值作為編碼流輸出。
13、 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述對各部分分別設(shè)置一個縮放因子為根據(jù)消耗比特數(shù)和感知失真,調(diào) 整各部分的縮放因子得到各部分的最佳縮放因子。
14、 根據(jù)權(quán)利要求13所述的方法,其特征在于, 所述調(diào)整各部分的縮放因子得到最佳縮放因子為設(shè)置縮放因子的基準(zhǔn)值,該基準(zhǔn)值使消耗比特數(shù)小于編碼所允許的總比特數(shù);將各部分的縮放因子在該基準(zhǔn)值的基礎(chǔ)上進(jìn)行調(diào)整;判斷調(diào)整的縮放因子是否使消耗比特數(shù)小于編碼所允許的總比特數(shù),如果 不滿足該條件,則直到滿足該條件為止繼續(xù)執(zhí)行調(diào)整縮放因子的步驟,如果滿 足該條件,則計算感知失真;判斷感知失真是否在無法感知的范圍內(nèi),如果是,則將本次調(diào)整得到的縮 放因子作為最佳縮放因子,否則,返回調(diào)整縮放因子的步驟,重復(fù)調(diào)整縮放因 子的步驟以及后續(xù)步驟。
15、 根據(jù)權(quán)利要求14所述的方法,其特征在于,所述消耗比特數(shù)根據(jù)頻域 的第一采樣值、頻域的第一采樣值的個數(shù)以及縮放因子估計得到。
16、 根據(jù)權(quán)利要求14所述的方法,其特征在于,所述感知失真根據(jù)頻域的 第 一采樣值和各部分的縮放因子得到。
17、 根據(jù)權(quán)利要求14所述的方法,其特征在于,當(dāng)感知失真在感知的范圍內(nèi)時,重復(fù)調(diào)整縮放因子的步驟以及后續(xù)步驟規(guī)定數(shù)次;如果重復(fù)規(guī)定數(shù)次后,感知失真仍在感知的范圍內(nèi),則從上述重復(fù)過程中 調(diào)整的縮放因子中,選擇使感知失真最小的縮放因子作為最佳縮放因子。
18、 根據(jù)權(quán)利要求14所述的方法,其特征在于,所述將各部分的縮放因子在該基準(zhǔn)值的基礎(chǔ)上進(jìn)行調(diào)整為將重要頻段部 分的縮放因子在基準(zhǔn)值的基礎(chǔ)上降低,將不重要頻段部分的縮放因子在基準(zhǔn)值 的基礎(chǔ)上提升。
19、 根據(jù)權(quán)利要求18所述的方法,其特征在于, 所述重要頻段為低頻段,所述不重要頻段為高頻段。
20、 根據(jù)權(quán)利要求2所述的方法,其特征在于,在對頻域的第一采樣值利用縮放因子進(jìn)行調(diào)整之前,進(jìn)一步包括對頻域 的第 一采樣值進(jìn)行頻譜預(yù)整形;從量化采樣值中去除縮放因子的影響得到頻域的第二采樣值之后,轉(zhuǎn)換為 時域的第二釆樣值之前,進(jìn)一步包括對頻域的第二采樣值進(jìn)行頻語逆整形。
21、 根據(jù)權(quán)利要求2所述的方法,其特征在于,在對頻域的第一采樣值利用縮放因子進(jìn)行調(diào)整之后,進(jìn)行量化之前,進(jìn)一 步包括對調(diào)整后的頻域的第一采樣值進(jìn)行頻譜預(yù)整形;在量化后,從量化采樣值中去除縮放因子的影響之前,進(jìn)一步包括對量 化采樣值進(jìn)行頻譜逆整形。
22、 根據(jù)權(quán)利要求20或21所述的方法,其特征在于, 確定頻譜整形區(qū)域;所述對采樣值進(jìn)行頻譜預(yù)整形為對所確定的頻譜整形區(qū)域內(nèi)的采樣值進(jìn) 行頻譜預(yù)整形;所述對采樣值進(jìn)行頻譜逆整形為對所確定的頻譜整形區(qū)域內(nèi)的采樣值進(jìn) 行頻鐠逆整形。
23、 根據(jù)權(quán)利要求22所述的方法,其特征在于,所述頻譜預(yù)整形的步驟包括在所確定的頻鐠整形區(qū)域內(nèi)的采樣值中,標(biāo)記采樣值的峰值; 利用標(biāo)記的峰值中的一個峰值,計算用于頻譜預(yù)整形的參考值; 利用參考值,計算各標(biāo)記峰值的放大因子; 利用所計算出的放大因子,對頻譜進(jìn)行預(yù)整形。
24、 根據(jù)權(quán)利要求23所述的方法,其特征在于,所述標(biāo)記采樣值的峰值為在頻譜整形區(qū)域中,選擇一個或一個以上局部 區(qū)域,并在各局部區(qū)域中,選擇幅值最大的采樣值作為對應(yīng)局部區(qū)域的峰值。
25、 根據(jù)權(quán)利要求24所述的方法,其特征在于,所述對頻譜進(jìn)行預(yù)整形為除了用于計算參考值的峰值之外,對剩余的峰 值所在的局部區(qū)域,利用相應(yīng)峰值的放大因子進(jìn)行預(yù)整形。
26、 根據(jù)權(quán)利要求25所述的方法,其特征在于,所述預(yù)整形為利用放大因子對峰值進(jìn)行放大,或者,利用放大因子對峰 值及其該峰值所在的局部區(qū)域內(nèi)的采樣值進(jìn)行放大。
27、 根據(jù)權(quán)利要求23所述的方法,其特征在于,所述計算參考值為在所標(biāo)記的峰值中,選擇最大峰值,并利用該最大峰 值得到參考值。
28、 根據(jù)權(quán)利要求27所述的方法,其特征在于,所述參考值為最大峰值 的幅值,或最大峰值的臨近采樣點的能量,或最大峰值臨近采樣點的平均能量。
29、 根據(jù)權(quán)利要求23所述的方法,其特征在于,所述峰值的放大因子為參考值與該峰值的比值的第 一參數(shù)冪的第二參數(shù) 倍,其中,該第一參數(shù)為大于零且小于1的數(shù),該第二參數(shù)為任意數(shù)。
30、 根據(jù)權(quán)利要求22所述的方法,其特征在于,所述頻譜逆整形的步驟包括在所確定的頻譜整形區(qū)域內(nèi)的采樣值中,標(biāo)記采樣值的峰值; 利用標(biāo)記的峰值中的一個峰值,計算用于頻譜逆整形的參考值; 利用參考值,計算各標(biāo)記峰值的縮小因子; 利用所計算出的縮小因子,對頻譜進(jìn)行逆整形。
31、 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述利用時域的第一采樣值和時域的第二采樣值得到全局增益為所述全 局增益使得所述時域的第 一采樣值和所述時域的第二采樣值乘以所述全局增益 之間的均方誤差最小。
32、 一種在解碼中調(diào)整量化質(zhì)量的方法,對編碼端輸出的編碼流進(jìn)行解碼 得到解碼流,其特征在于,該方法包括從解碼流中獲取量化采樣值、兩個或兩個以上縮放因子的信息以及全局增益;利用所述兩個或兩個以上縮放因子的信息,從所述量化采樣值中去除縮放 因子的影響得到采樣值后,乘以全局增益。
33、 根據(jù)權(quán)利要求32所述的方法,其特征在于, 所述量化采樣值為頻域的量化采樣值;所述從所述量化采樣值中去除縮放因子的影響得到采樣值為從所述量化 采樣值中去除縮放因子的影響得到頻域的采樣值;從所述量化采樣值中去除縮放因子的影響得到采樣值后,在乘以全局增益 之前進(jìn)一步包括將頻域的采樣值轉(zhuǎn)換為時域的采樣值。
34、 根據(jù)權(quán)利要求33所述的方法,其特征在于,從所述頻域的量化采樣值中去除縮放因子的影響得到頻域的采樣值后,將 頻域的采樣值轉(zhuǎn)換為時域的采樣值之前,進(jìn)一步包括對頻域的采樣值進(jìn)行頻 域逆整形,或者,從所述頻域的量化采樣值中去除縮放因子的影響得到頻域的采樣值 之前,進(jìn)一步包括對所述頻域的量化采樣值進(jìn)行頻譜逆整形。
35、 根據(jù)權(quán)利要求32至34中任一項所述的方法,其特征在于, 所述從解碼流中獲取的縮放因子的信息為所有縮放因子; 所述從所得到的量化采樣值中去除縮放因子的影響為按照在編碼時劃分頻域的采樣值的方式,將量化采樣值劃分為相應(yīng)的兩個或兩個以上部分,并利 用各部分的縮放因子,從相應(yīng)部分的量化采樣值中去除對應(yīng)部分的縮放因子的
36、 根據(jù)權(quán)利要求32至34中任一項所述的方法,其特征在于, 所述從解碼流中獲取的縮放因子的信息為將一個縮放因子作為基準(zhǔn)縮放因子,其余縮放因子與該基準(zhǔn)縮放因子的比值;所述從所得到的量化釆樣值中去除縮放因子的影響為按照在編碼時劃分 頻域的采樣值的方式,將量化采樣值劃分為相應(yīng)的兩個或兩個以上部分,并利 用所得到的比值,從相應(yīng)部分的量化采樣值中去除對應(yīng)部分的縮放因子的影響。
37、 根據(jù)權(quán)利要求32至34中任一項所述的方法,其特征在于, 所述從解碼流中獲取的縮放因子的信息為將一個縮放因子作為基準(zhǔn)縮放因子,其余縮放因子與該基準(zhǔn)縮放因子的比值以及該基準(zhǔn)縮放因子;所述從所得到的量化采樣值中去除縮放因子的影響為按照在編碼時劃分 頻域的采樣值的方式,將量化采樣值劃分為相應(yīng)的兩個或兩個以上部分,并利 用基準(zhǔn)縮放因子和比值計算得到各部分的縮放因子,利用各部分的縮放因子, 從相應(yīng)部分的量化釆樣值中去除對應(yīng)部分的縮放因子的影響。
38、 根據(jù)權(quán)利要求34所述的方法,其特征在于,所述頻錯逆整形的步驟包括在編碼時所確定的頻譜整形區(qū)域內(nèi)的采樣值中,標(biāo)記采樣值的峰值; 利用標(biāo)記的峰值中的一個峰值,計算用于頻譜逆整形的參考值; 利用參考值,計算各標(biāo)記峰值的縮小因子; 利用所計算出的縮小因子,對頻譜進(jìn)行逆整形。
39、 一種在編碼中調(diào)整量化質(zhì)量的裝置,其特征在于,該裝置包括多縮 放因子控制單元,量化單元,增益平衡單元,全局增益計算單元;其中,所述多縮放因子控制單元用于接收第一采樣值,對第一采樣值設(shè)置 兩個或兩個以上縮放因子,利用縮放因子對第一釆樣值進(jìn)行調(diào)整,將調(diào)整后的 第 一采樣值輸出給所述量化單元;所述量化單元用于對所接收的第一采樣值進(jìn)行量化得到量化采樣值并輸出 給所述增益平衡單元;所述增益平衡單元用于接收量化采樣值,從量化采樣值中去除縮放因子的 影響得到第二采樣值,并輸出給所述全局增益計算單元;全局增益計算單元用于接收第一采樣值和第二采樣值,并利用第一采樣值 和第二采樣值得到全局增益。
40、 根據(jù)權(quán)利要求39所述的裝置,其特征在于,該裝置進(jìn)一步包括時頻 變換單元和逆時頻變換單元;所述時頻變換單元用于接收第一采樣值,并對第一采樣值進(jìn)行時頻變換后, 輸出給所述多縮放因子控制單元;所述逆時頻變換單元用于從所述增益平衡單元中接收第二采樣值,并對第 二采樣值進(jìn)行逆時頻變換后,輸出給所述全局增益計算單元。
41、 根據(jù)權(quán)利要求40所述的裝置,其特征在于,該裝置進(jìn)一步包括頻鐠 預(yù)整形單元和頻譜逆整形單元;所述頻i普預(yù)整形單元用于接收所述時頻變換單元輸出的第一采樣值,對該 第一采樣值進(jìn)行頻譜預(yù)整形后輸出給所述多縮放因子控制單元;所述頻語逆整 形單元用于接收所述增益平衡單元輸出的第二采樣值,對該第二采樣值進(jìn)行頻 譜逆整形后輸出給所述逆時頻變換單元;或者,所述頻鐠預(yù)整形單元用于接收所述多縮放因子控制單元輸出的第一采樣 值,對該第一采樣值進(jìn)行頻譜預(yù)整形后輸出給所述量化單元;所述頻譜逆整形 單元用于接收所述量化單元輸出的量化采樣值,對該量化采樣值進(jìn)行頻譜逆整 形后輸出給所述增益平衡單元。
42、 根據(jù)權(quán)利要求39至41中任一項所述的裝置,其特征在于,所述多縮 放因子控制單元包括縮放因子設(shè)置單元和采樣值調(diào)整單元;所述縮放因子設(shè)置單元用于對第一采樣值設(shè)置兩個或兩個以上縮放因子, 并將所設(shè)置的縮放因子輸出給所述采樣值調(diào)整單元;所述采樣值調(diào)整單元用于接收縮放因子,并利用縮放因子對第一采樣值進(jìn) 行調(diào)整。
43、 根據(jù)權(quán)利要求42所述的裝置,其特征在于,所述縮放因子設(shè)置單元包 括基準(zhǔn)值設(shè)置單元、縮放因子調(diào)整單元、消耗比特數(shù)估計單元、感知失真計算單元;所述基準(zhǔn)值設(shè)置單元用于設(shè)置縮放因子的基準(zhǔn)值,并輸出給所述縮放因子調(diào)整單元;所述縮放因子調(diào)整單元用于根據(jù)基準(zhǔn)值調(diào)整縮放因子,并輸出給所述消耗 比特數(shù)估計單元和感知失真計算單元;所述消耗比特數(shù)估計單元用于根據(jù)縮放因子,估計消耗比特數(shù),并判斷消 耗比特數(shù)是否小于編碼所允許的總比特數(shù),將判斷結(jié)果發(fā)送給所述縮放因子調(diào) 整單元;所述感知失真計算單元用于根據(jù)縮放因子,計算感知失真,并判斷感知失 真是否在無法感知的范圍內(nèi),將判斷結(jié)果發(fā)送給所述縮放因子調(diào)整單元。
44、 根據(jù)權(quán)利要求41所述的裝置,其特征在于,所述頻譜預(yù)整形單元包括 峰值標(biāo)記單元、參考值計算單元、放大因子計算單元、預(yù)整形單元;其中,所述峰值標(biāo)記單元用于接收第一采樣值,并在頻譜整形區(qū)域內(nèi)的第 一采樣值中,標(biāo)記峰值,輸出給所述參考值計算單元;所述參考值計算單元用于利用峰值計算用于頻譜預(yù)整形的參考值,輸出給 所述放大因子計算單元;所述放大因子計算單元用于利用參考值,計算各標(biāo)記峰值的放大因子,輸 出給所述預(yù)整形單元;所述預(yù)整形單元用于利用所述放大因子,對頻譜進(jìn)行預(yù)整形。
45、 根據(jù)權(quán)利要求41所述的裝置,其特征在于,所述頻語逆整形單元包括 峰值標(biāo)記單元、參考值計算單元、縮小因子計算單元、逆整形單元;其中,所述峰值標(biāo)記單元用于接收采樣值,并在頻譜整形區(qū)域內(nèi)的采樣值 中,標(biāo)記峰值,輸出給所述參考值計算單元;所述參考值計算單元用于利用峰值計算用于頻語逆整形的參考值,輸出給 所述縮小因子計算單元;所述縮小因子計算單元用于利用參考值,計算各標(biāo)記峰值的縮小因子,輸 出給所述逆整形單元;所述逆整形單元用于利用所述縮小因子,對頻譜進(jìn)行逆整形。
46、 一種在解碼中調(diào)整量化質(zhì)量的裝置,其特征在于,該裝置包括增益 平衡單元和全局增益平衡單元;其中,所述增益平衡單元用于接收量化采樣值和縮放因子,并利用所接收 的縮放因子,從量化采樣值中去除縮放因子的影響得到采樣值,并輸出給所述 全局增益平衡單元;所述全局增益平衡單元用于接收全局增益和采樣值,并對采樣值乘以全局 增益后輸出。
47、 根據(jù)權(quán)利要求46所述的裝置,其特征在于,該裝置進(jìn)一步包括逆時 頻變換單元;所述逆時頻變換單元用于從所述增益平衡單元中接收釆樣值,并對采樣值 進(jìn)行逆時頻變換后,輸出給所述全局增益平衡單元。
48、 根據(jù)權(quán)利要求47所述的裝置,其特征在于,該裝置進(jìn)一步包括頻譜 逆整形單元;所述頻譜逆整形單元用于接收所述增益平衡單元輸出的采樣值,對該采樣 值進(jìn)行頻譜逆整形后輸出給所述逆時頻變換單元; 或者,所述頻譜逆整形單元用于接收量化采樣值,對該量化采樣值進(jìn)行頻語逆整 形后輸出給所述增益平衡單元。
49、 根據(jù)權(quán)利要求48所述的裝置,其特征在于,所述頻譜逆整形單元包括 峰值標(biāo)記單元、參考值計算單元、縮小因子計算單元、逆整形單元;其中,所述峰值標(biāo)記單元用于接收采樣值,并在頻譜整形區(qū)域內(nèi)的采樣值 中,標(biāo)記峰值,輸出給所述參考值計算單元;所述參考值計算單元用于利用峰值計算用于頻鐠逆整形的參考值,輸出給 所述縮小因子計算單元;頁所述縮小因子計算單元用于利用參考值,計算各標(biāo)記峰值的縮小因子,輸 出給所述逆整形單元;所述逆整形單元用于利用所述縮小因子,對頻普進(jìn)行逆整形。
全文摘要
本發(fā)明公開了一種在編碼中調(diào)整量化質(zhì)量的方法,該方法包括利用兩個或兩個以上縮放因子,對用于編碼的第一采樣值進(jìn)行調(diào)整后,對調(diào)整后的第一采樣值進(jìn)行量化得到量化采樣值;從所得到的量化采樣值中去除縮放因子的影響得到第二采樣值,并利用第一采樣值和第二采樣值得到全局增益;將所得到的量化采樣值、所述兩個或兩個以上的縮放因子的信息以及所得到的全局增益作為編碼流輸出。本發(fā)明還公開了一種在解碼中調(diào)整量化質(zhì)量的方法,在編碼、解碼中調(diào)整量化質(zhì)量的裝置。根據(jù)本發(fā)明公開的方法和裝置,能夠大大降低實現(xiàn)復(fù)雜度,能夠更好地調(diào)整重要部分的量化質(zhì)量,能夠獲得更好的編碼效果。
文檔編號G10L19/02GK101192410SQ200610164330
公開日2008年6月4日 申請日期2006年12月1日 優(yōu)先權(quán)日2006年12月1日
發(fā)明者劉佩林, 清 張, 偉 李, 杜正中, 桑盛虎, 許麗凈, 許劍峰, 耀 鄒 申請人:華為技術(shù)有限公司