專利名稱:用于在圖像信號編碼中為圖像中的像素塊組確定比特分配的方法及設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于在圖像信號編碼中為像素塊組確定比特分配的方法以及設(shè)備,通過采用所述方法以及設(shè)備,這些像素塊組屬于圖像中的像素塊的相應(yīng)任意形狀區(qū)域的不同關(guān)注重要性級別。
背景技術(shù):
優(yōu)化比特分配是視頻壓縮中的一個重要問題,用于提高編碼效率,即最大程度利用可用數(shù)據(jù)速率。以有限的比特率實現(xiàn)最佳感知質(zhì)量是優(yōu)化比特分配的目標(biāo)。就人類視覺系統(tǒng)而言,人類通常對圖像的某些部分比對該圖像的其他部分更加關(guān)注。正如例如在L.Itti,Ch.Koch,E.Niebur,“A Modelof Saliency-Based Visual Attention for Rapid Scene Analysis”,IEEETransactions on Pattern Analysis and Machine Intelligence,第20卷,第11期,1998年11月中所描述的那樣,“關(guān)注區(qū)域”,即圖像中的感知敏感區(qū)域,往往引起人們更多的關(guān)注。因此,基于不同關(guān)注度圖像區(qū)域的不同感知重要性的優(yōu)化比特分配成為視頻壓縮技術(shù)中的研究課題。
例如,MPEG2和MPEG4中的宏塊層比特率控制為當(dāng)前幀中的所有宏塊選擇量化(以下稱為變換)步長Qstep的值,以便用于這些宏塊的比特的和接近于幀的目標(biāo)比特率B。MPEG2和MPEG4支持31種不同的Qstep值。在MPEG4 AVC中,標(biāo)準(zhǔn)支持總共52個Qstep值,并且這些值以量化參數(shù)值QP作為索引。
Ch.W.Tang,Ch.H.Chen,Y.H.Yu,Ch.J.Tsai,“A novel visual distortionsensitivity analysis for video encoder bit allocation”,ICIP 2004,第5卷,2004年10月24-27日,第3225-3228頁,提出了對于視覺失真敏感度(即人類視覺檢測活動場景中的失真的能力)的描述,當(dāng)比特分配方案極為簡單時,可以用以下公式描述 QPN=QP+(1-VDSi,j/255)*Δq (1) 其中,QP是由速率控制所分配的初始量化參數(shù),Δq是用于限制QP的修改的參數(shù),VDSi,j是圖像中的第(i,j)個宏塊(標(biāo)記為MB)的視覺失真敏感度值,QPN是修正后的量化參數(shù)。該比特分配方案比較粗糙簡單,并且沒有考慮精確的比特率控制和失真分布控制。
在S.Sengupta,S.K.Gupta,J.M.Hannah的“Perceptually motivatedbit-allocation for H.264 encoded video sequences”,ICIP 2003中,將圖像劃分為前景和背景區(qū)域,然后在不保證背景質(zhì)量的情況下為前景質(zhì)量預(yù)先確定一個目標(biāo)失真Dtar。背景質(zhì)量隨距前景的距離而改變。質(zhì)量下降率由視覺敏感因子控制 S=e-d/a (2) 其中a是控制背景質(zhì)量下降率的常數(shù),d是背景像素距最近的前景像素的距離。這一方案試圖給出與人類視覺系統(tǒng)相一致的失真分布,然而其性能受所使用的模型精度的影響,并且無法解釋如何獲得Dtar以及如何在預(yù)定比特預(yù)算下根據(jù)給定等式保持質(zhì)量下降。
為了解決具有比特預(yù)算約束的優(yōu)化比特分配的問題,典型的比特分配算法基于采用Lagrangian乘子處理的率失真優(yōu)化,可以利用與下列表達(dá)式類似的表達(dá)式將Lagrangian乘子處理的率失真優(yōu)化描述為以小于RT的約束率R來最小化總失真D的約束優(yōu)化問題 其中Di和Ri是每個單元i(MB或關(guān)注區(qū)域)的失真和比特率。
假設(shè)如上所述,每個MB的率和失真僅僅取決于對編碼參數(shù)的選擇,則可以簡化等式(3)的優(yōu)化,以便使每個MB的開銷最小化 minJiJi=Di+λ×Ri (4) 已經(jīng)提出使用基于在每個MB的編碼模式判決中根據(jù)以下公式修改Lagrange乘子的優(yōu)化比特分配方案 λ′=α×λ (5) 其中α是用于根據(jù)不同級別的感知重要性修改Lagrange乘子的縮放因子。
還提出了向不同關(guān)注區(qū)域的失真添加不同加權(quán)因子Wi,以執(zhí)行優(yōu)化比特分配 由此,可以基于如同下式的ρ-域比特率控制模型推導(dǎo)出率和失真模型 Ri=Aρi+B 可以將等式(7)代入等式(6),以獲得比特分配的優(yōu)化解。
已知還可以使用如公式(8)所示的基于Gaussian分布的率失真模型來獲得比特分配的最優(yōu)結(jié)果
發(fā)明內(nèi)容
然而,已知方法無法顯著影響失真分布以使其與人類視覺系統(tǒng)特性更加一致。例如,根據(jù)不同關(guān)注區(qū)域?qū)τ谌搜鄣牟煌匾潭?,對不同關(guān)注區(qū)域使用不同的加權(quán)因子Wi,實際上無法相應(yīng)地影響失真分布。此外,已知方法的精度(特別在MB級)不足以獲得更好的性能。
此外,已知方法在保持失真分布與比特分配約束間的良好折中方面存在問題。
本發(fā)明所要解決的問題是為視頻信號編碼中的比特率控制提供改進(jìn)的失真驅(qū)動比特分配。這個問題由權(quán)利要求1中所公開的方法解決。權(quán)利要求2公開了一種使用該方法的設(shè)備。
本發(fā)明的失真驅(qū)動比特分配方案以與人類視覺系統(tǒng)一致的方式給圖像區(qū)域分配編碼/解碼誤差失真,并滿足比特率的約束?!笆д骝?qū)動”意味著,比特分配在比特率約束下實現(xiàn)優(yōu)化的編碼/解碼誤差失真分布,其主要目標(biāo)不在于最小化失真。本發(fā)明使圖像內(nèi)的失真分布與人類視覺特性相一致,從而以有限的比特率達(dá)到了更好的主觀質(zhì)量,或者使得在保持一致的主觀質(zhì)量的同時降低比特率。
本發(fā)明采用失真/比特率/ρ-量化參數(shù)柱狀圖分析?;谶@種柱狀圖分析,確定量化參數(shù)、比特率、失真以及非零系數(shù)百分比間的關(guān)系。失真分配方案基于殘差信號(模式判決和幀內(nèi)或幀間預(yù)測之后,變換和量化之前)是Gaussian分布的假設(shè)。然后,利用rho-域(ρ-域)比特率控制來計算每個宏塊組(GOB)內(nèi)的比特分配。
原理上,本發(fā)明的方法適于在包括變換以及對變換系數(shù)塊的量化的圖像信號編碼中為圖像中的像素塊組確定比特分配,所述圖像被劃分為像素塊的規(guī)則網(wǎng)格,并且所述像素塊組屬于所述圖像中的像素塊的相應(yīng)任意形狀區(qū)域的不同關(guān)注重要性級別,以及其中,對每個像素塊組的編碼/解碼失真進(jìn)行控制,使其基本與該像素塊組的關(guān)注重要性級別成正比,以及其中,給編碼圖像分配比特預(yù)算,并且所述量化受量化參數(shù)的控制,所述方法包括以下步驟 - 針對當(dāng)前圖像,關(guān)于所述量化參數(shù)的候選,為每個像素塊組建立估計失真、比特率、以及所述量化后的零幅度系數(shù)的數(shù)目的表、列表或者函數(shù); - 利用所述估計失真和比特率的表、列表或者函數(shù),為所述像素塊組中的每一個計算相應(yīng)的失真分布,以及利用以下步驟的輸出,修改所述失真分布,以達(dá)到所述比特預(yù)算; - 基于所述估計失真和比特率的表格、列表或者函數(shù),以及基于所述計算得到的失真分布,為所述像素塊組中的每一個計算估計比特率; - 利用所述估計比特率以及零幅度系數(shù)的數(shù)目的表、列表或者函數(shù),為所述像素塊組中的每一個執(zhí)行ρ-域比特分配,以確定用于對像素塊進(jìn)行量化編碼的所述量化參數(shù)中的相應(yīng)參數(shù)。
原理上,本發(fā)明的設(shè)備適于在包括變換以及對變換系數(shù)塊的量化的圖像信號編碼中為圖像中的像素塊組確定比特分配,所述圖像被劃分為像素塊的規(guī)則網(wǎng)格,并且所述像素塊組屬于所述圖像中的像素塊的相應(yīng)任意形狀區(qū)域的不同關(guān)注重要性級別,以及其中,對每個像素塊組的編碼/解碼失真進(jìn)行控制,使其基本與該像素塊組的關(guān)注重要性級別成正比,以及其中,給編碼圖像分配比特預(yù)算,并且所述量化受量化參數(shù)的控制,所述設(shè)備包括 - 適于針對當(dāng)前圖像,關(guān)于所述量化參數(shù)的候選,為每個像素塊組建立估計失真、比特率、以及所述量化后的零幅度系數(shù)的數(shù)目的表、列表或者函數(shù)的裝置; - 適于利用所述估計失真和比特率的表、列表或者函數(shù),為所述像素塊組中的每一個計算相應(yīng)的失真分布,以及利用以下步驟的輸出,修改所述失真分布,以達(dá)到所述的比特預(yù)算的裝置; - 適于基于所述估計失真和比特率的表、列表或者函數(shù),以及基于所述計算得到的失真分布,為所述像素塊組中的每一個計算估計比特率的裝置; - 適于利用所述估計比特率以及零幅度系數(shù)的數(shù)目的表、列表或者函數(shù),為所述像素塊組中的每一個執(zhí)行ρ-域比特分配,以確定用于對像素塊進(jìn)行量化和編碼的所述量化參數(shù)中的相應(yīng)參數(shù)系數(shù)的裝置。
各個從屬權(quán)利要求公開了本發(fā)明的有益附加實施例。
下面參考附圖對本發(fā)明的示例性實施例進(jìn)行說明,在附圖中 圖1示出了示例關(guān)注度掩圖; 圖2示出了基于本發(fā)明的內(nèi)容的失真驅(qū)動比特分配(CDBA)方案的流程圖。
具體實施例方式 如上所述,人類通常對圖像的某些部分比圖像中的其他部分更為關(guān)注。將受到更多關(guān)注的部分稱為“關(guān)注區(qū)域”。在上述L.Itti等人的文章以及歐洲申請05300974.2中,從給定圖像的視覺輸入中提取一組灰度級特征圖。這些特征包括亮度、顏色、方向等等。然后在每個特征圖中,提取出最顯著的區(qū)域。最后,以單純的自下而上的方式將所有的特征圖合并為被認(rèn)為是圖像的關(guān)注信息的主“顯著圖”。由此,就可以獲得每個圖像的關(guān)注掩圖,后者描述了該圖像的相應(yīng)區(qū)域的不同關(guān)注重要性級別。
圖1示出了示例關(guān)注度掩圖,后者將圖像中的宏塊劃分為一組四個關(guān)注重要性級別Mi,i=1...4。給白色塊分配級別M4,給陰影較淺的塊分配級別M3,給陰影較深的塊分配級別M2,并給具有對角陰影線的塊分配級別M1。較大的Mi值意味著,由于該區(qū)域是視覺重要性較低的區(qū)域,因而可以容忍更大的失真。例如,在N=2的情況下,M1=1和M2=2意味著背景失真級別(級別2)可以是前景失真級別(級別1)的兩倍。
這里并未說明如何計算級別集合以及對應(yīng)的視覺重要性數(shù)值Mi。比特分配可以基于以下假設(shè)獲得了具有Mi,(i=1...N)的關(guān)注度掩圖,其中N是關(guān)注級別的數(shù)目。
從根本上說,可以按如下方式描述失真驅(qū)動比特分配問題 按照關(guān)注度掩圖,可以根據(jù)不同的關(guān)注或掩蔽值Mi將圖像劃分為N個GOB(宏塊組),每個GOBi包含Ki個宏塊(以下標(biāo)識為MB),且其中NMB是一個圖像中的MB的總數(shù)目。本發(fā)明的處理利用幀比特預(yù)算Rf,在以下兩個約束條件下,根據(jù)相應(yīng)的關(guān)注度掩圖值Mi給GOBi中的每個MB分配失真
,其中可以根據(jù)任意幀級比特率控制推導(dǎo)出幀比特預(yù)算Rf 其中,
是分配給每個GOBi的比特率,Du是每個MB的恒定失真單位。等式(9)意味著,每個GOBi的失真(基本上)與其關(guān)注度掩圖的值成正比,因而失真分布將與人類感知相一致。等式(10)意味著,在這種情況下應(yīng)滿足總的幀或圖像比特預(yù)算Rf。因此,本發(fā)明應(yīng)提供基于視覺關(guān)注分析的失真驅(qū)動比特分配方案,并且結(jié)果失真以及比特率應(yīng)滿足等式(9)和等式(10)的要求。
在圖2中,描繪了基于本發(fā)明內(nèi)容的失真驅(qū)動比特分配(CDBA)方案的流程圖。由于已經(jīng)公開了許多關(guān)于構(gòu)建關(guān)注區(qū)模型的研究論文,例如上面提到L.Itti等人的文章以及歐洲申請05300974.2,因此假設(shè)已經(jīng)獲得了關(guān)注度掩圖,圖像被劃分為N個GOB,并且根據(jù)任意幀級或場級速率控制算法推導(dǎo)得到了幀比特預(yù)算Rf。然后,執(zhí)行以下步驟,以計算失真驅(qū)動比特分配 步驟1)預(yù)分析以及查找表初始化PREALUTI 對當(dāng)前正在處理的圖像,針對每個GOBi,(i=1...N),基于柱狀圖分析算法,為每個GOB確定三個查找表或列表或函數(shù)
和ρGOBi[QPn],其中QPn是候選量化參數(shù),
是估計失真(以每MB的平均失真為單位),
是量化參數(shù)QPn下每個GOBi的比特率,以及ρGOBi[QPn]是使用量化參數(shù)QPn的量化后,GOBi的零幅度系數(shù)的數(shù)目。
步驟2)失真分配DISALL 步驟2.1)在恒定比特率下對失真分布進(jìn)行估計ESTDDISTR 假設(shè)每個GOBi包含Ki個MB,并且其中NMB是一個圖像中的MB的總數(shù)目,那么在恒定比特率(CBR)輸出(即不考慮不同關(guān)注級別區(qū)域中不同的失真級別)的情況下,為每個GOBi分配的比特率應(yīng)為因此,可以通過查找表
和
推導(dǎo)出針對每個GOBi的對應(yīng)的初始失真值
下面將該失真值作為含有約束比特預(yù)算的失真乘法值予以使用。
步驟2.2)計算失真單位CALLDU 基于殘差信號幅度(即,變換后的預(yù)測誤差信號)具有Gaussian分布以及相應(yīng)的率失真模型(參見W.Lai,X.D.Gu,R.H.Wang,W.Y.Ma,H.J.Zhang,“A content-based bit allocation model for video streaming”,ICME′04,2004IEEE International Conference on Multimedia and Expo,第2卷,2004年6月27-30日,第1315-1318頁)的假設(shè),可以使用以下公式獲得失真單位Du 步驟2.3)獲得經(jīng)修正的失真分配GREFDDIRTR 通過使用公式(9)為GOBi中的每個MB獲得分配的失真
由于Gaussian分布假設(shè)的不精確性,可以基于來自步驟3)的反饋來進(jìn)行細(xì)微的修改,以滿足給定的比特預(yù)算。
由于每個量化參數(shù)下的失真或比特率應(yīng)當(dāng)是離散的,并且無法根據(jù)公式實現(xiàn)精確的失真值,因此可以使用預(yù)分析步驟1)中產(chǎn)生的查找表,并調(diào)整
使
成為該失真查找表中最接近于估計值Du×Mi的值。關(guān)于來自步驟3)的反饋,如果步驟3)中的估計的比特率
大于或小于比特預(yù)算,則可以通過檢查查找表中的相鄰數(shù)值(接近于Du×Mi)在步驟2)中進(jìn)行某些修改,以滿足給定的比特預(yù)算。
步驟3)比特率分配RALL 基于
和
的表以及來自步驟2)的
可以直接獲得針對每個GOBi,i=1...N的估計的比特率
此外,將估計結(jié)果反饋至步驟2.3),以對分配比特率進(jìn)行某些細(xì)微的修正,從而滿足比特預(yù)算。
步驟4)每個GOBi內(nèi)部的ρ-域比特分配RDBALL 步驟4.1)量化參數(shù)確定QPDET 與Z.He和S.K.Mitra的"A linear source model and a unified rate controlalgorithm for DCT video coding",IEEE Transactions on Circuits and Systemsfor Video Technology,第12卷,第11期,2002年11月,第970-982頁中的ρ域速率控制模型類似,通過對GOBi內(nèi)的剩余MB進(jìn)行量化所產(chǎn)生的零值的數(shù)目應(yīng)當(dāng)是 其中
是當(dāng)前圖像中的GOBi的編碼MB的數(shù)目,
是用于對這
個MB進(jìn)行編碼的比特數(shù)目,Ki是GOBi中的MB的總數(shù)目。
查找表ρGOBi[QPn],確定量化參數(shù)QP。然后利用該QP值對當(dāng)前MB進(jìn)行量化,并對其進(jìn)行編碼。
步驟4.2)更新參數(shù)UPDPAR 根據(jù)已編碼的MB,更新參數(shù)θ和ρGOBi[QPn] 其中,
是在這
個編碼MB中的量化后的零系數(shù)的數(shù)目。其后,對下一個宏塊進(jìn)行編碼。
下面將對步驟1)至4)進(jìn)行另外的闡述 步驟1)預(yù)分析和查找表初始化 基于由S.H.Hong,S.D.Kim提出的算法“Histogram-based rate-distortionestimation for MPEG-2 video”,IEE Proceedings Vision,Image SignalProcessing,第146卷,第4期,1999年8月,第198-205頁,執(zhí)行ISO/IEC14496-10AVC/H.264標(biāo)準(zhǔn)所采用的基于柱狀圖的率失真估計?;炯僭O(shè)為均方誤差(MSE)方面的失真與所采用的量化參數(shù)的平方成正比,以及現(xiàn)有視頻編碼標(biāo)準(zhǔn)中通常采用均勻量化。然后,可以根據(jù)D(QPn)=D(QPn-1)+ΔD(QPn-1,QPn),使用迭代算法來估計不同量化參數(shù)的失真,其中ΔD(QPn-1,QPn)是當(dāng)量化參數(shù)從QPn-1增大至QPn時的失真增量。
其后,針對當(dāng)前GOB(宏塊組),基于DCT系數(shù)大小以及相關(guān)QP來建立柱狀圖或列表Hist1→0[QPn]。該柱狀圖表示當(dāng)使用QPn時被量化為幅值“1”、而當(dāng)使用后繼量化參數(shù)QPn+1時將被量化為幅值“0”的DCT系數(shù)的數(shù)目。
基于上述柱狀圖或列表Hist1→0[QPn],對于H.264/AVC,易于通過以下公式建立每個量化參數(shù)下的非零系數(shù)的數(shù)目的查找表 其中,NCoeff是每個單元(在本發(fā)明中為GOB)內(nèi)的系數(shù)的總數(shù)目。
每個量化參數(shù)QPn屬于可以從例如H.264/AVC標(biāo)準(zhǔn)中的相應(yīng)查找表中推導(dǎo)出的相應(yīng)的量化步長QPSn。
為了準(zhǔn)確估計兩個連續(xù)QP值之間的失真增量ΔD(QPn-1,QPn),需要考慮三種情形 情形1)QPn處的量化系數(shù)不為零 情形2)QPn-1處的量化系數(shù)不為零,但在QPn處被量化為零; 情形3)QPn-1處的量化系數(shù)為零。
對于情形1),基于殘差信號在量化級間隔內(nèi)均勻分布的假設(shè),可以利用下列公式來估計失真增量 其中,UD(QPn)是在假設(shè)均勻分布的情形1)中下由QPn引入的失真,ΔE1(QPn)表示在情形1)中從QPn-1到QPn的失真增量。
對于情形2),可以利用下列公式來估計失真增量 對于情形3),不存在失真增量。
在H.264/AVC中,如果DC變換用于幀內(nèi)16 x 16模式,則δn為
在其他幀內(nèi)編碼的情況下,在幀間編碼的情況下,使用
因此,最終的失真增量為 ΔDe(QPn-1,QPn)=ΔE1(QPn)+ΔE2(QPn)。
迭代失真估計方法的初始值為 因此,可以建立QP-失真表
。
正如可以從上述Z.He和S.K.Mitra的文章中得知的那樣,由于非零系數(shù)的數(shù)目與編碼比特的數(shù)目成正比,因而線性模型非常適用。因此,基于建立的列表NZC,使用線性模型來估計比特率。
假設(shè)當(dāng)非零系數(shù)的數(shù)目為零時編碼比特的數(shù)目將會是零,那么在至少給出了線上的兩點的情況下,可以確定相應(yīng)的內(nèi)插線。將一個參考點QP設(shè)置為QPref,然后根據(jù)不同的復(fù)雜度和精度需求,通過熵編碼或通過經(jīng)由頻率分析對編碼比特的實際數(shù)目Rbits進(jìn)行估計(例如,根據(jù)Q.Chen,Y.He,“A Fast Bits Estimation Method for Rate-Distortion Optimisation inH.264/AVC”,Picture Coding Symposium,2004年12月15-17日,SanFrancisco,CA,USA),來確定編碼比特的實際數(shù)目Rbits。結(jié)合該線性模型以及查找表NZC[QPn],可以通過下列公式構(gòu)建
的QP-比特率表 然后,基于非零列表或表NZC[QPn],可以很容易地利用下列公式得到QP-ρ表ρGOBi[QPn] 步驟2)失真分配 基于殘差信號的Gaussian分布的假設(shè),已經(jīng)在優(yōu)化比特分配中使用了如等式(8)所示的簡化的率失真模型?;诘仁?8)和(10),可以獲得一個基本結(jié)論 因此,對于給定比特預(yù)算Rf,每個GOB的失真的乘法結(jié)果應(yīng)保持不變。
正如在步驟2.1)中所描述的那樣,在CBR的情況下,可以很容易地通過查找表
和
,然后基于等式(14)和(9)推導(dǎo)出每個GOBi的
利用可以根據(jù)等式(15)推導(dǎo)出等式(11)。
由于圖像內(nèi)的內(nèi)容屬性差異以及量化級別局限于一組有限離散數(shù)值,等式(8)并非始終是足夠精確的,因此,需要基于來自步驟3)的反饋進(jìn)行細(xì)微的修改,以滿足比特預(yù)算。等式(11)的結(jié)果應(yīng)始終是用于利用查找表來搜索優(yōu)化失真分配的良好的起點。
步驟3)速率分配 將本步驟的結(jié)果反饋至步驟2.3),以對比特分配加以修正。
步驟4)每個GOBi內(nèi)的比特分配 本步驟用于精確地滿足比特預(yù)算約束。通常,如果在步驟3)中已經(jīng)滿足了比特預(yù)算,則可以直接對每個GOB使用從查找表
中推導(dǎo)出的相應(yīng)的量化參數(shù)。然而,如果實際編碼中的量化參數(shù)以及編碼模式不同于預(yù)分析過程中(例如H.264/AVC中)的量化參數(shù)以及編碼模式,那么為了滿足比特預(yù)算,仍需要更新了的精確的比特分配。因此,在每個GOB內(nèi)使用ρ-域速率控制作為修正后的比特分配方案,以便以有限的比特預(yù)算來分配失真。
除了基于幀,對于隔行視頻信號,還可以基于場的方式來實現(xiàn)本發(fā)明。
本發(fā)明還可以用于多通道速率控制視頻編碼以及容錯(error resilience)視頻編碼。
權(quán)利要求
1.一種用于在圖像信號編碼中為圖像中的像素塊組(GOBi)確定(RALL、RDBALL)比特分配的方法,所述圖像信號編碼包括變換以及對變換系數(shù)塊的量化,所述圖像被劃分為像素塊的規(guī)則網(wǎng)格,并且所述像素塊組(GOBi)屬于所述圖像中的像素塊的相應(yīng)任意形狀區(qū)域的不同關(guān)注重要性級別(Mi),以及其中,對每個像素塊組的編碼/解碼失真進(jìn)行控制,使其基本與所述像素塊組的關(guān)注重要性級別成正比,以及其中,給編碼圖像分配比特預(yù)算(Rf),并且所述量化受量化參數(shù)(QP)的控制,所述方法的特征在于以下步驟
-針對當(dāng)前圖像,關(guān)于所述量化參數(shù)(QP)的候選,為每個像素塊組(GOBi)建立估計失真(
[QPn])、比特率(
[QPn])、以及所述量化后的零幅度系數(shù)的數(shù)目(
[QPn])的表、列表或者函數(shù);
-利用所述估計失真(
[QPn])和比特率(
[QPn])的表、列表或者函數(shù),為所述像素塊組(GOBi)中的每一個計算相應(yīng)的失真分布
以及利用以下步驟的輸出,修改所述失真分布
以達(dá)到所述比特預(yù)算(Rf);
-基于所述估計失真(
[QPn])和比特率(
[QPn])的表、列表或者函數(shù),以及基于所述計算得到的失真分布
為所述像素塊組(GOBi)中的每一個計算估計比特率
-利用所述估計比特率
以及零幅度系數(shù)的數(shù)目(
[QPn])的表、列表或者函數(shù),為所述像素塊組(GOBi)中的每一個執(zhí)行ρ-域比特分配,以確定用于對像素塊進(jìn)行量化和編碼的所述量化參數(shù)(QP)中的相應(yīng)參數(shù)。
2.一種用于在圖像信號編碼中為圖像中的像素塊組(GOBi)確定(RALL、RDBALL)比特分配的設(shè)備,所述圖像信號編碼包括變換以及對變換系數(shù)塊的量化,所述圖像被劃分為像素塊的規(guī)則網(wǎng)格,并且所述像素塊組(GOBi)屬于所述圖像中的像素塊的相應(yīng)任意形狀區(qū)域的不同關(guān)注重要性級別(Mi),以及其中,對每個像素塊組的編碼/解碼失真進(jìn)行控制,使其基本與所述像素塊組的關(guān)注重要性級別成正比,以及其中,給編碼圖像分配比特預(yù)算(Rf),并且所述量化受量化參數(shù)(QP)的控制,所述裝置包括
-裝置(PREALUTI),適于針對當(dāng)前圖像,關(guān)于所述量化參數(shù)(QP)的候選,為每個像素塊組(GOBi)建立估計失真(DGOBi[QPn])、比特率(
[QPn])、以及所述量化后的零幅度系數(shù)的數(shù)目(
[QPn])的表、列表或者函數(shù);
-裝置(DISALL),適于利用所述估計失真(
[QPn])和比特率(
[QPn])的表、列表或者函數(shù),為所述像素塊組(GOBi)中的每一個計算相應(yīng)的失真分布
以及利用以下步驟的輸出,修改所述失真分布
以達(dá)到所述的比特預(yù)算(Rf);
-裝置(RALL),適于基于所述估計失真(
[QPn])和比特率(
[QPn])的表、列表或者函數(shù),以及基于所述計算得到的失真分布
為所述像素塊組(GOBi)中的每一個計算估計比特率
-裝置(RDBALL),適于利用所述估計比特率
以及零幅度系數(shù)的數(shù)目(
[QPn])的表、列表或者函數(shù),為所述像素塊組(GOBi)中的每一個執(zhí)行ρ-域比特分配,以確定用于對像素塊進(jìn)行量化和編碼的所述量化參數(shù)(QP)中的相應(yīng)參數(shù)。
3.根據(jù)權(quán)利要求1所述的方法或根據(jù)權(quán)利要求2所述的設(shè)備,其中,所述像素塊是宏塊。
4.根據(jù)權(quán)利要求1或3所述的方法或者根據(jù)權(quán)利要求2或4所述的設(shè)備,其中,所述編碼圖像是ISO/IEC 14496-10AVC編碼圖像序列的一部分。
5.根據(jù)權(quán)利要求1、3和4中任意一項所述的方法或根據(jù)權(quán)利要求2至4中任意一項所述的設(shè)備,其中,所述量化參數(shù)(QP)是量化器的步長。
6.根據(jù)權(quán)利要求1和3至5中任意一項所述的方法或根據(jù)權(quán)利要求2至5中任意一項所述的裝置,其中,為所述像素塊組(GOBi)中的每一個計算相應(yīng)失真分布
的步驟或功能包括
-在不考慮不同關(guān)注級別區(qū)域中不同的失真級別的情況下,為每一個像素塊組(GOBi)計算相應(yīng)的初始失真值
-計算失真單位其中Mi是相應(yīng)像素塊組(GOBi)的關(guān)注重要性級別,Ki是相應(yīng)像素塊組(GOBi)中的像素塊的數(shù)目,N是關(guān)注級別的數(shù)目;
-通過根據(jù)所述Du值為所述像素塊組(GOBi)中的每一個計算修正失真分布,由此在此執(zhí)行對所述失真分布
的所述修改。
7.根據(jù)權(quán)利1和3至6中任意一項所述的方法或根據(jù)權(quán)利要求2至6中任意一項所述的設(shè)備,其中,對所述像素塊組(GOBi)中的每一個執(zhí)行ρ-域分配的步驟或功能包括
-計算其中
是當(dāng)前像素塊組中的編碼像素塊的數(shù)目,
是用于對所述
個像素塊進(jìn)行編碼的比特數(shù)目,Ki是當(dāng)前像素塊組中的像素塊的總數(shù)目;
-根據(jù)所述量化后的零幅度系數(shù)的數(shù)目的所述表、列表或者函數(shù)(
[QPn]),確定相應(yīng)的量化參數(shù)(QP);
-根據(jù)已編碼的像素塊,更新所述零幅度系數(shù)數(shù)目的表、列表或者函數(shù),并通過更新參數(shù)θ,其中
是所述
個編碼像素塊中的量化后的零系數(shù)的數(shù)目。
8.一種利用根據(jù)權(quán)利要求1和3至7中任意一項所述的方法進(jìn)行編碼的數(shù)字視頻信號。
9.一種包含或存儲或者在其上記錄了根據(jù)權(quán)利要求1和3至7中任意一項的方法進(jìn)行了編碼的數(shù)字視頻信號的存儲介質(zhì),例如光盤。
全文摘要
優(yōu)化比特分配是視頻壓縮領(lǐng)域的一個重要課題,用于提高編碼效率,即最大程度利用可用數(shù)據(jù)速率。就人類視覺系統(tǒng)而言,人類通常對圖像的某些部分比對該圖像的其他部分更加關(guān)注。因此,應(yīng)當(dāng)針對不同關(guān)注度的圖像區(qū)域(GOBi)優(yōu)化比特分配。本發(fā)明的失真驅(qū)動比特分配方案以與人類視覺系統(tǒng)一致的方式圖像區(qū)域分配編碼/解碼誤差失真,同時滿足比特率的約束。本發(fā)明采用失真/比特率/ρ-量化參數(shù)柱狀圖分析?;谙鄳?yīng)的表(DGOB#-[i][QPn]、RGOB#-[i][QPn]以及ρGOB#-[i][QPn]),確定(PREALUTI、DISALL、RALL)針對不同關(guān)注區(qū)域的量化參數(shù)、比特率、失真以及非零系數(shù)的百分比之間的關(guān)系。其后,利用(RDBALL)ρ-域比特率控制來計算每個宏塊組內(nèi)的比特分配。
文檔編號H04N7/26GK101395923SQ200780007608
公開日2009年3月25日 申請日期2007年2月16日 優(yōu)先權(quán)日2006年3月2日
發(fā)明者陳志波, 顧曉東, 陳衢清 申請人:湯姆森許可貿(mào)易公司