一種支持隨機訪問的復雜度圖像無損壓縮方法
【專利摘要】一種支持隨機訪問的復雜度圖像無損壓縮方法,屬于視頻圖像壓縮【技術領域】,包括以下步驟:將圖像分割為宏塊,將宏塊劃分為三個區(qū)域;幀內(nèi)預測;選擇編碼比特代價最小的模式,得到最優(yōu)預測模式的殘差圖像;將殘差圖像分割為不同小塊進行自適應可變長編碼,由壓縮碼流生成模塊得到無損壓縮碼流。將宏塊分割為三個區(qū)域,解決了宏塊之間邊界像素點數(shù)據(jù)依賴問題。采用塊/像素自適應預測、差分編碼、自適應可變長編碼組合壓縮方法,可以達到較高的數(shù)據(jù)壓縮率,對于1080p分辨率無損壓縮效果達到50%以上。
【專利說明】一種支持隨機訪問的復雜度圖像無損壓縮方法
【技術領域】
[0001]本發(fā)明屬于視頻圖像壓縮【技術領域】,具體涉及為一種支持隨機訪問的復雜度圖像無損壓縮方法。
【背景技術】
[0002]隨著視頻編解碼技術、集成電路設計制造和網(wǎng)絡通信技術的飛速發(fā)展,數(shù)字媒體(如數(shù)字電視、激光視盤、視頻監(jiān)控等)的應用逐漸向聞清、超聞清方向發(fā)展,聞清、超聞清視頻編解碼器設計面臨著計算資源和訪存帶寬兩個方面的巨大挑戰(zhàn)。
[0003]高清、超高清視頻編解碼芯片結構中,原始圖像幀和解碼圖像參考幀都存在外部存儲器中,外存訪問帶寬是結構設計的瓶頸。目前工業(yè)界逐漸向4K分辨率演進,基本上超高清(4Kx2K)圖像像素數(shù)是1080P分辨率圖像像素的4倍,這意味著和1080P相比,超高清(4Kx2K)會占用四倍的帶寬。對于4Kx2K (4096X2304)像素30fps的視頻,數(shù)據(jù)訪問將消耗巨大帶寬,比如僅僅每幀回寫就需要近13.5Mbyte的內(nèi)存帶寬。工業(yè)界非常需要無損數(shù)據(jù)壓縮技術,能對這些存儲在外存的圖像數(shù)據(jù)在寫入外存前進行壓縮,讀出后進行解壓縮重建數(shù)據(jù),從而在完全不影響視頻編解碼器性能的前提下,降低外存數(shù)據(jù)訪問的總線帶寬。
[0004]針對720p分辨率以上視頻,設計無損壓縮算法,如果能達到節(jié)省50%左右外存訪問帶寬,那么可以大大緩解高清視頻編解碼芯片結構設計的巨大挑戰(zhàn),大大降低因外部存儲器頻繁訪問導致的系統(tǒng)功耗,為高性能低功耗結構設計提供支持,這是非常有意義的工作。
[0005]在視頻編碼器中,運動估計所消耗的外存存儲器訪問帶寬最大,是系統(tǒng)設計面臨的最大挑戰(zhàn)。一般來說,參考幀數(shù)據(jù)按照宏塊內(nèi)像素采用連續(xù)存儲方式,所以希望無損壓縮算法能支持宏塊數(shù)據(jù)隨機訪問,從而最大限度利用外部SDRAM存儲器的突發(fā)模式高效數(shù)據(jù)訪問模式。支持宏塊隨機訪問,訪問到任何一個宏塊,硬件能將該宏塊數(shù)據(jù)重建,也就意味著宏塊之間相鄰像素點的相關性無法使用,在宏塊之間無數(shù)據(jù)依賴。這個約束是無損壓縮算法需要解決的一個問題,另外,壓縮壓縮效率、數(shù)據(jù)訪問的規(guī)則性(地址控制相關)也是需要考慮的重要因素。
[0006]早期出現(xiàn)了多種近無損壓縮方法,基于預測、變換以及量化的組合編碼方法,實現(xiàn)有損壓縮,失真控制在40dB以上。該類方法部分像素失真相對較大,失真分布不均勻。這類接近無損壓縮技術,實際上還是有損壓縮,部分邊緣像素失真絕對值可以達到3甚至更高,這種壓縮失真對后續(xù)視頻編碼和處理非常不利。
[0007]早稻田大學Dajiang Zhou提出的基于水平預測+半定長變長編碼的無損壓縮技術,以宏塊為基本數(shù)據(jù)壓縮處理單元,半定長變長編碼基于大小為2x2的小塊,計算小塊的動態(tài)范圍,根據(jù)動態(tài)范圍將每個小塊映射到8個小區(qū)間中的某一個,從而根據(jù)小區(qū)間進行定長編碼。小區(qū)間自適應劃分實現(xiàn)了變長編碼。該技術壓縮后數(shù)據(jù)率為未壓縮的509^70%。該類無損壓縮技術,未達到平均50%的壓縮效率,未能完全去除空域像素間冗余以及控制字符之間的統(tǒng)計冗余,壓縮效率有進一步提升的空間。
【發(fā)明內(nèi)容】
[0008]本發(fā)明的目的在于克服上述提到的缺陷和不足,而提供一種一種支持隨機訪問的復雜度圖像無損壓縮方法。
[0009]本發(fā)明實現(xiàn)其目的采用的技術方案如下。
[0010]一種支持隨機訪問的復雜度圖像無損壓縮方法,包括以下步驟:
(1)、將圖像分割為宏塊,將宏塊劃分為三個區(qū)域:第一行、第一列以及15x15像素區(qū)域,并將15x15像素區(qū)域分為5x5個3x3的小塊;
(2)、幀內(nèi)預測:對于第一行,采用水平方向預測模式;對于第一列,采用垂直方向預測模式;對于每個小塊,采用選擇編碼比特消耗最小的塊級預測或像素級預測;
(3)、小塊幀內(nèi)預測模式選擇:基于查表的編碼比特估計模塊為各種預測模式計算出編碼比特消耗,選擇編碼比特代價最小的模式,得到最優(yōu)預測模式的殘差圖像;
(4)、將殘差圖像分割為不同小塊進行自適應可變長編碼,估計每個小塊的動態(tài)范圍,計算出相應控制字mm,得到相應的控制字M,由壓縮碼流生成模塊得到無損壓縮碼流。
[0011 ] 作為優(yōu)選,步驟(2)中,對于每個小塊,先計算塊級預測,選擇水平或垂直模式,確定block_pred_type (r, s),計算預測殘差residue (r, s ;m, n),采用半定長VLC編碼,統(tǒng)計塊編碼比特數(shù)bits_block,選擇最小編碼代價的模式為塊級模式;然后計算像素級預測,計算每個像素的水平垂直預測值,比較大小,選擇預測誤差小的模式pixel_pred_type,然后得到整個塊的殘差,采用半定長VLC編碼,統(tǒng)計塊編碼比特數(shù)bits_bl0Ck_piXel和前面bits_block比較,選擇較小編碼代價的模式,從而確定塊級預測類型pred_type。
[0012]作為優(yōu)選,步驟(3)中,對于每個3x3小塊,估計出小塊內(nèi)數(shù)據(jù)地動態(tài)范圍,確定分區(qū)狀態(tài)信息mm,根據(jù)每個小塊的動態(tài)范圍信息mm查表得到變長比特信息,實現(xiàn)基于控制字mm的半定長碼表,然后由M字段柱狀圖分析及huffman編碼離線構建得到編碼控制字M的Huffman可變長碼表,最后根據(jù)基于控制字mm的半定長碼表以及編碼控制字M的Huffman可變長碼表,為各種預測模式計算出編碼比特消耗。
[0013]作為優(yōu)選,步驟(4)中,對于殘差圖像,分割為不同小塊進行可變長編碼:對于第一行、第一列殘差,相鄰4個數(shù)據(jù)構成一個大小為2x2的小塊,對于其他15x15數(shù)據(jù)塊,采用3x3數(shù)據(jù)小塊。
[0014]作為優(yōu)選,對于預測殘差,采用基于小塊的半定長VLC編碼技術:對于每個小塊,計算小塊內(nèi)最大系數(shù)、最小系數(shù),確定動態(tài)范圍_,根據(jù)_將小塊殘差系數(shù)劃分為8個區(qū)間,并用控制字段M標識,對于每個劃分區(qū)間,采用定長編碼。
[0015]作為優(yōu)選,對于控制字M信息,采用Huffman變長編碼方法,統(tǒng)計M各種取值的柱狀圖,根據(jù)概率分布,得到M取(T7時可變長編碼表,然后基于查表方法進行可變長編碼。
[0016]本發(fā)明具有以下有益效果:
(1)將宏塊分割為三個區(qū)域,解決了宏塊之間邊界像素點數(shù)據(jù)依賴問題。采用塊/像素自適應預測、差分編碼、自適應可變長編碼組合壓縮方法,可以達到較高的數(shù)據(jù)壓縮率,對于IOSOp分辨率無損壓縮效果達到50%以上;
(2)塊/像素級自適應預測,支持不同區(qū)域不同小塊自適應編碼,支持宏塊級數(shù)據(jù)隨機訪問,并提高了預測效率,使得預測殘差圖像內(nèi)包含較小的圖像信息?;诰幋a比特消耗最小化的原則,在預測效率和預測殘差編碼比特效率之間平衡;
(3)基于小塊動態(tài)范圍,自適應劃分區(qū)間,針對不同區(qū)間采用半定長變長編碼;對于控制系數(shù),采用基于概率分布的Huffman變長編碼方法;最大限度利用符號存在的冗余,使得總體熵編碼性能盡可能高,殘差數(shù)據(jù)和控制字段的編碼比特消耗盡可能小,提高壓縮率。
【專利附圖】
【附圖說明】
[0017]圖1是本發(fā)明的流程圖;
圖2是一個宏塊256個像素分割為三個區(qū)域的示意圖。
【具體實施方式】
[0018]下面結合附圖,對本發(fā)明作進一步詳細說明。
[0019]( I)將圖像分割為宏塊,將宏塊劃分為三個區(qū)域,第一行、第一列以及15x15像素區(qū)域。對于15x15像素區(qū)域,劃分為5x5個3x3的小塊。
[0020]( 2 )幀內(nèi)預測,用以去除宏塊之間數(shù)據(jù)依賴。
[0021]對于第一行,采用水平方向預測模式;
對于第一列, 采用垂直方向預測模式;
對于每個小塊,采用塊級預測,或采用對小塊內(nèi)3x3=9個像素進行像素級預測。塊級預測和像素級預測均支持水平、垂直預測,以充分利用宏塊內(nèi)像素之間的水平或者垂直方向的相關性,最大限度提高預測效率。為了保證數(shù)據(jù)處理時不存在數(shù)據(jù)阻塞,小塊內(nèi)的像素級預測模式選擇需要在小塊級進行,即保證小塊內(nèi)所有像素總體編碼比特數(shù)最小。
[0022]圖2給出了一個宏塊256個像素分割為三個區(qū)域的示意圖:
第一行:水平方向預測,deltaX(l, n) = X(l,n) - X(l, n_l);
第一列:垂直方向預測,deltaX(n, I) = X(n, I) - X( n-1,1);
其他15x15像素,分為5x5個大小為3x3的像素塊,每個像素塊(r, s)支持兩種預測模式:塊級預測或像素級預測,用I比特控制字predmode (r, s)標識,I為塊級預測;0為像素級預測。具體地:
a.塊級預測:bits_block (r, s) = bit_residue_block (r, s) +1 + 1。
[0023]支持水平預測或垂直預測,類似于H.264/AVC幀內(nèi)預測技術,水平或垂直預測模式用控制字block_pred_type (r, s)標識,I為水平預測模式,0為垂直預測模式。
[0024]b.像素級預測:bits_block_pixel (r, s) = bit_residue_ block _pixel (r, s)+ 1 + 90
[0025]支持3x3塊內(nèi)每個像素(r,s ;m, n)進行水平或垂直預測模式,用控制字pixel_pred_type (r, s ;m,n)標識,I為水平預測模式,0為垂直預測模式;r=l~5, s=l~5, m=l~3,n=l~30
[0026]塊級預測和像素級預測的選擇,需要根據(jù)編碼比特消耗代價進行最小化判斷。對于每個3x3小塊,估計各種預測模式的編碼比特代價,選擇編碼比特消耗最小的模式為最優(yōu)模式,計算預測殘差。過程如下:
先計算塊級預測:選擇水平或垂直模式,確定block_pred_type (r, s),計算預測殘差residue (r, s ;m, n),采用半定長VLC編碼,統(tǒng)計塊編碼比特數(shù)bits_block,選擇最小編碼代價的模式為塊級模式block_pred_type ;
然后計算像素級預測:計算每個像素的水平垂直預測值,采用SAD判據(jù)比較預測誤差大小,選擇預測誤差小的模式pixel_block_type (r, s)。
[0027]然后得到整個塊的殘差,采用半定長VLC編碼,統(tǒng)計塊編碼比特數(shù)bits_block_pixel并和前面bits_block比較,選擇較小編碼代價的模式,從而確定塊級預測類型pred_type (r, s)。
[0028](3)小塊幀內(nèi)預測模式選擇:根據(jù)編碼比特代價最小判斷?;诓楸淼木幋a比特估計模塊為各種預測模式計算出編碼比特消耗;而這個估計過程需要基于控制字_的半定長碼表以及編碼控制字M的Huffman可變長碼表。對于每個3x3小塊,估計出小塊內(nèi)數(shù)據(jù)地動態(tài)范圍,確定分區(qū)狀態(tài)信息mm。
[0029]其中,基于控制字_的半定長碼表是實現(xiàn)確定的,根據(jù)每個小塊的動態(tài)范圍信息mm查表得到變長比特信息;而編碼控制字M的Huffman可變長碼表是由M字段柱狀圖分析及huffman編碼離線構建得到。
[0030]完成模式選擇后,得到最優(yōu)預測模式的殘差圖像,
(4)對于殘差圖像,分割為不同小塊進行自適應可變長編碼。第一行、第一列殘差,相鄰4個數(shù)據(jù)構成一個大小為2x2的小塊,其他15x15數(shù)據(jù)塊,采用3x3數(shù)據(jù)小塊。估計每個小塊的動態(tài)范圍,計算出相應控制字mm,得到相應的控制字M,由壓縮碼流生成模塊得到無損壓縮碼流。
[0031]因為動態(tài)范圍(minv,maxv)對于編碼效率有直接影響,而水平第一行16個像素僅僅采用水平預測模式,垂直第一列僅僅采用垂直預測模式;這樣對于一些存在復雜邊緣和紋理的區(qū)域,單向預測模式的動態(tài)范圍會較大;其他15x15像素采用了塊、像素級自適應水平、垂直預測模式,動態(tài)范圍相對會小點。為了避免這兩種情況的互相影響,本發(fā)明采用自適應小塊選擇策略:為了保證和塊級預測模式自適應選擇中編碼比特估計一致,對于15x15的殘差塊,分為5x5個大小為3x3的小塊;對于水平第一行16個像素,將他們分為4個2x2小塊;對于垂直第一列16個像素,將他們分為4個2x2小塊。
[0032]對于預測殘差residue,采用基于小塊的半定長VLC編碼技術。對于每個小塊,計算小塊內(nèi)最大系數(shù)maxv、最小系數(shù)minv,根據(jù)minv和maxv確定動態(tài)范圍(用mm區(qū)分),根據(jù)mm將小塊殘差系數(shù)自適應劃分為8個區(qū)間變長的編碼區(qū)域,并用控制字段M標識。對于每個劃分區(qū)間,采用定長編碼,如表I所示。
[0033]表I殘差系數(shù)半定長編碼碼表
【權利要求】
1.一種支持隨機訪問的復雜度圖像無損壓縮方法,其特征在于,包括以下步驟: (1)、將圖像分割為宏塊,將宏塊劃分為三個區(qū)域:第一行、第一列以及15x15像素區(qū)域,并將15x15像素區(qū)域分為5x5個3x3的小塊; (2)、幀內(nèi)預測:對于第一行,采用水平方向預測模式;對于第一列,采用垂直方向預測模式;對于每個小塊,采用選擇編碼比特消耗最小的塊級預測或像素級預測; (3)、小塊幀內(nèi)預測模式選擇:基于查表的編碼比特估計模塊為各種預測模式計算出編碼比特消耗,選擇編碼比特代價最小的模式,得到最優(yōu)預測模式的殘差圖像; (4)、將殘差圖像分割為不同小塊進行自適應可變長編碼,估計每個小塊的動態(tài)范圍,計算出相應控制字mm,得到相應的控制字M,由壓縮碼流生成模塊得到無損壓縮碼流。
2.如權利要求1所述的一種支持隨機訪問的復雜度圖像無損壓縮方法,其特征在于,步驟(2)中,對于每個小塊,先計算塊級預測,選擇水平或垂直模式,確定block_pred_type (r, s),計算預測殘差residue (r, s ;m, n),采用半定長VLC編碼,統(tǒng)計塊編碼比特數(shù)bits_block,選擇最小編碼代價的模式為塊級模式;然后計算像素級預測,計算每個像素的水平垂直預測值,比較大小,選擇預測誤差小的模式pixelprecLtype,然后得到整個塊的殘差,采用半定長VLC編碼,統(tǒng)計塊編碼比特數(shù)bits_block_pixel并和前面bits_block比較,選擇較小編碼代價的模式,從而確定塊級預測類型pred_type。
3.如權利要求1所述的一種支持隨機訪問的復雜度圖像無損壓縮方法,其特征在于,步驟(3)中,對于每個3x3小塊,估計出小塊內(nèi)數(shù)據(jù)地動態(tài)范圍,確定分區(qū)狀態(tài)信息mm,根據(jù)每個小塊的動態(tài)范圍信息mm查表得到變長比特信息,實現(xiàn)基于控制字mm的半定長碼表,然后由M字段柱狀圖分析及huffman編碼離線構建得到編碼控制字M的Huffman可變長碼表,最后根據(jù)基于控制字_的半定長碼表以及編碼控制字M的Huffman可變長碼表,為各種預測模式計算出編碼比特消耗。
4.如權利要求1所述的一種支持隨機訪問的復雜度圖像無損壓縮方法,其特征在于,步驟(4)中,對于殘差圖像,分割為不同小塊進行可變長編碼:對于第一行、第一列殘差,相鄰4個數(shù)據(jù)構成一個大小為2x2的小塊,對于其他15x15數(shù)據(jù)塊,采用3x3數(shù)據(jù)小塊。
5.如權利要求4所述的一種支持隨機訪問的復雜度圖像無損壓縮方法,其特征在于,對于預測殘差,采用基于小塊的半定長VLC編碼技術:對于每個小塊,計算小塊內(nèi)最大系數(shù)、最小系數(shù),確定動態(tài)范圍mm,根據(jù)mm將小塊殘差系數(shù)劃分為8個區(qū)間,并用控制字段M標識,對于每個劃分區(qū)間,采用定長編碼。
6.如權利要求5所述的一種支持隨機訪問的復雜度圖像無損壓縮方法,其特征在于,對于控制字M信息,采用Huffman變長編碼方法,統(tǒng)計M各種取值的柱狀圖,根據(jù)概率分布,得到M取(T7時可變長編碼表,然后基于查表方法進行可變長編碼。
【文檔編號】H04N19/182GK103618898SQ201310657826
【公開日】2014年3月5日 申請日期:2013年12月9日 優(yōu)先權日:2013年12月9日
【發(fā)明者】殷海兵, 胡紅旗, 夏哲雷 申請人:中國計量學院