欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

彩色圖像編碼的方法、系統(tǒng)和軟件產(chǎn)品的制作方法

文檔序號:6655605閱讀:577來源:國知局
專利名稱:彩色圖像編碼的方法、系統(tǒng)和軟件產(chǎn)品的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種彩色圖像編碼的方法、系統(tǒng)和軟件產(chǎn)品。
背景技術(shù)
近年來,互聯(lián)網(wǎng)上彩色圖像數(shù)據(jù)量急速增長。具體地,由于網(wǎng)頁、數(shù)碼攝像機(jī)和在線游戲的加速流行,彩色圖像數(shù)據(jù)成為互聯(lián)網(wǎng)流量的主要部分。另一方面,通過無線信道或通過低功率的小型設(shè)備訪問彩色圖像仍然是耗時且不便的,這主要是由于圖像顯示設(shè)備、存儲和傳輸帶寬的限制成為多數(shù)多媒體應(yīng)用的瓶頸,例如,參見J.Barrilleaux,R.Hinkle和S.Wells,“Efficient vector quantization for color image encoding,”Acoustics,Speech,and Signal Processing,IEEE International Conference onICASSP’87,vol.12,pp740-743,April 1987(下面稱為“參考[1]”)、M.T.Orchard and C.A.Bouman,“Color quantization of images,”SignalProcessing,IEEE transations on,vol.39,no.12,pp.2677-2690,Dec.1991(下面稱為“參考[2]”)、I.Ashdown,“Octree color quantization,”C/C++ UsersJounal,vol.13,no.3,pp.31-43,1994(下面稱為“參考[3]”)、X.Wu,“Yiq vectorquantization in new color palette architecture,”IEEE Trans.On ImageProcessing,vol.5,no.2,pp.321-329,1996(下面稱為“參考[4]”)、L.Velho,J.Gomes和M.V.R.Sobreiro,“Color image quantization by pairwiseclustering,”Proc.Tenth Brazilian Symp.Comput.Graph.ImageProcess.,L.H.de Figueiredo和M.L.Netto,Eds.Campos do Jordao,Spain,pp.203-210,1997(下面稱為“參考[5]”)以及S.Wan,P.Prusinkiewicz和S.Wong,“Variance-based color image quantization for frame buffer display,”Res.Appl.,vol.15,pp.52-58,1990(下面稱為“參考[6]”)。
消除以上限制的一種方式是應(yīng)用高效的彩色圖像編碼方案,其壓縮、優(yōu)化或重新編碼彩色圖像。典型的彩色圖像編碼方案包括調(diào)色板、像素映射和無損代碼。調(diào)色板用作矢量量化碼本,并且用于代表原始彩色圖像中的所有顏色。像素映射則將圖像中的每一種顏色映射至于調(diào)色板中的顏色相對應(yīng)的索引。像素映射可以是硬判決像素映射,其中一旦給定了調(diào)色板,則RGB彩色矢量到調(diào)色板的顏色的量化是固定的,并且與圖像中RGB彩色矢量的像素位置無關(guān),像素映射也可以是軟判決像素映射,其中在不同像素位置處RGB彩色矢量被量化為調(diào)色板的不同顏色。最后由無損代碼對從像素映射產(chǎn)生的索引序列進(jìn)行編碼。
以前,調(diào)色板設(shè)計(jì)、像素映射和編碼被分離地研究。在調(diào)色板和像素映射的設(shè)計(jì)中,通常忽略編碼部分,并且主要目的是減小量化失真、改進(jìn)量化圖像的可視質(zhì)量以及降低計(jì)算復(fù)雜度。在文獻(xiàn)中,例如參見參考[1]至[6],提出了多種樹結(jié)構(gòu)的劃分和合并彩色圖像量化方法,以多少能夠?qū)崿F(xiàn)該目的。
另一方面,當(dāng)考慮編碼時,通常假設(shè)調(diào)色板和像素映射已經(jīng)被給定,并且其目的是設(shè)計(jì)索引序列的有效代碼,以便降低壓縮率。例如,在A.Zaccarin和B.Liu,“A novel approach for coding color quantized image,”Image Processing,IEEE Transactions on,vol.2,no.4,pp.442-453,Oct.1993(下面稱為“參考[7]”)中給出的彩色量化圖像的LUV彩色空間中的有損壓縮的算法。在N.D.Memon和A.Venkateswaran,“On ordering color maps forlossless predictive coding,”IEEE Transactions on Image Processing,vol.5,no.11,pp.1522-1527,1996(下面稱為“參考[8]”)中提出了兩個啟發(fā)式的解決方案,在編碼圖像之前,通過無損預(yù)測編碼技術(shù)來對彩色圖像進(jìn)行重新編碼。根據(jù)二進(jìn)制樹結(jié)構(gòu)和基于上下文的熵編碼,在X.Chen,S.Kwong和J.fu Feng,“A new compression scheme for color-quantized images,”Circuits and Systems for Video Technology,IEEE Transactionson,vol.12,no.10,pp.904-908,Oct 2002(下面稱為“參考[9]”)中提出了一種壓縮算法,以提供進(jìn)步的彩色量化圖像的編碼。在這些算法中,以壓縮的比特流與諸如GIF/PNG解碼器之類的標(biāo)準(zhǔn)解碼器不兼容為代價,實(shí)現(xiàn)了壓縮效率。

發(fā)明內(nèi)容
根據(jù)本發(fā)明的第一方面,提供了一種方法,使用數(shù)據(jù)處理系統(tǒng),從具有N個不同顏色的數(shù)字化彩色圖像中創(chuàng)建數(shù)字化彩色圖像中所有像素到M個不相交簇(cluster)的樹結(jié)構(gòu)劃分,其中,M小于或等于N,N個不同顏色中的每種顏色由調(diào)色板中的多個P比特字節(jié)數(shù)字地表示,并且每個P比特字節(jié)中的P比特是從最高有效到最低有效排列的。該方法包括(a)提供包括所有N個不同顏色的根節(jié)點(diǎn);(b)提供與根節(jié)點(diǎn)相連的第一級兄弟節(jié)點(diǎn),其中由數(shù)據(jù)處理系統(tǒng)根據(jù)所述多個P比特字節(jié)中的每個P比特字節(jié)的第一比特的值,將N個不同顏色中的每種顏色分配給第一級兄弟節(jié)點(diǎn)中的相關(guān)節(jié)點(diǎn);(c)對于包括多于一種顏色的第k級節(jié)點(diǎn)中的每個節(jié)點(diǎn),在第k+1級提供多個兄弟節(jié)點(diǎn),其中由數(shù)據(jù)處理系統(tǒng)根據(jù)該顏色的所述多個P比特字節(jié)中的每個P比特字節(jié)的第k+1比特的值,將該節(jié)點(diǎn)中的每種顏色分配給第k+1級多個兄弟節(jié)點(diǎn)中的相關(guān)兄弟節(jié)點(diǎn),使得對于N個不同顏色中的這種顏色,存在只包含該顏色的獨(dú)立葉節(jié)點(diǎn);以及(d)選擇并合并葉節(jié)點(diǎn),直到僅剩下M個葉節(jié)點(diǎn)為止。
根據(jù)本發(fā)明的第二方面,提供了一種數(shù)據(jù)處理系統(tǒng),用于從具有N個不同顏色的數(shù)字化彩色圖像中創(chuàng)建數(shù)字化彩色圖像中所有顏色到M個不相交簇的樹結(jié)構(gòu)劃分,其中,M小于或等于N,N個不同顏色中的每種顏色由調(diào)色板中的多個P比特字節(jié)數(shù)字地表示,并且每個P比特字節(jié)中的P比特是從最高有效到最低有效排列的。該數(shù)據(jù)處理系統(tǒng)包括(a)節(jié)點(diǎn)創(chuàng)建裝置,用于(i)提供包括所有N個不同顏色的根節(jié)點(diǎn);(ii)提供與根節(jié)點(diǎn)相連的第一級兄弟節(jié)點(diǎn),其中根據(jù)所述多個P比特字節(jié)中的每個P比特字節(jié)的第一比特的值,將N個不同顏色中的每種顏色分配給第一級兄弟節(jié)點(diǎn)中的相關(guān)節(jié)點(diǎn);以及(iii)對于包括多于一種顏色的第k級節(jié)點(diǎn)中的每個節(jié)點(diǎn),在第k+1級提供多個兄弟節(jié)點(diǎn),其中根據(jù)該顏色的所述多個P比特字節(jié)中的每個P比特字節(jié)的第k+1比特的值,將該節(jié)點(diǎn)中的每種顏色分配給第k+1級多個兄弟節(jié)點(diǎn)中的相關(guān)兄弟節(jié)點(diǎn),使得對于N個不同顏色中的這種顏色,存在只包含該顏色的獨(dú)立葉節(jié)點(diǎn);以及(b)節(jié)點(diǎn)合并裝置,用于選擇并合并葉節(jié)點(diǎn),直到僅剩下M個葉節(jié)點(diǎn)為止。
根據(jù)本發(fā)明的第三方面,提供了一種在計(jì)算機(jī)系統(tǒng)上使用的計(jì)算機(jī)程序產(chǎn)品,用于從具有N個不同顏色的數(shù)字化彩色圖像中創(chuàng)建數(shù)字化彩色圖像中所有像素到M個不相交簇的樹結(jié)構(gòu)劃分,其中,M小于或等于N,N個不同顏色中的每種顏色由調(diào)色板中的多個P比特字節(jié)數(shù)字地表示,并且每個P比特字節(jié)中的P比特是從最高有效到最低有效排列的。該計(jì)算機(jī)程序產(chǎn)品包括記錄介質(zhì);記錄在介質(zhì)上的裝置,用于指示計(jì)算機(jī)系統(tǒng)執(zhí)行以下步驟(a)提供包括所有N個不同顏色的根節(jié)點(diǎn);(b)提供與根節(jié)點(diǎn)相連的第一級兄弟節(jié)點(diǎn),其中由數(shù)據(jù)處理系統(tǒng)根據(jù)所述多個P比特字節(jié)中的每個P比特字節(jié)的第一比特的值,將N個不同顏色中的每種顏色分配給第一級兄弟節(jié)點(diǎn)中的相關(guān)節(jié)點(diǎn);(c)對于包括多于一種顏色的第k級節(jié)點(diǎn)中的每個節(jié)點(diǎn),在第k+1級提供多個兄弟節(jié)點(diǎn),其中由數(shù)據(jù)處理系統(tǒng)根據(jù)該顏色的所述多個P比特字節(jié)中的每個P比特字節(jié)的第k+1比特的值,將該節(jié)點(diǎn)中的每種顏色分配給第k+1級多個兄弟節(jié)點(diǎn)中的相關(guān)兄弟節(jié)點(diǎn),使得對于N個不同顏色中的這種顏色,存在只包含該顏色的獨(dú)立葉節(jié)點(diǎn);以及(d)選擇并合并葉節(jié)點(diǎn),直到僅剩下M個葉節(jié)點(diǎn)為止。
根據(jù)本發(fā)明的第四方面,提供了一種方法,用于針對從原始數(shù)字化彩色圖像中推導(dǎo)出的新數(shù)字化彩色圖像,推導(dǎo)出表示像素映射的新索引序列和表示調(diào)色板的新輸出函數(shù),其中原始和新的數(shù)字化彩色圖像兩者都定義在n個像素上,其中,原始數(shù)字化彩色圖像由分配給n個像素的N個不同顏色提供,新數(shù)字化彩色圖像由分配給n個像素的M個不同顏色提供,新索引序列具有表示n個像素的n個索引組分(index member),新輸出函數(shù)用于將n個索引組分映射至M種顏色。該方法包括(a)根據(jù)原始數(shù)字化彩色圖像中的每個像素的顏色,通過將原始數(shù)字化彩色圖像中的所有像素劃分為M個不相交簇,來提供第一新索引序列,與像素在原始數(shù)字化彩色圖像中的位置無關(guān),其中,M小于或等于N;(b)提供第一新輸出函數(shù),用于將M個不同顏色一對一地映射至M個不相交簇中的像素;(c)對于第一新索引序列的每個組分,分別根據(jù)由第一新輸出函數(shù)分配給該組分的顏色值與由第一新輸出函數(shù)分配給第一新索引序列的至少一個其它組分的顏色值的相關(guān)程度,來對第一新索引序列和第一新輸出函數(shù)應(yīng)用軟判決優(yōu)化過程,以提供新的索引序列和新的輸出函數(shù)。
根據(jù)本發(fā)明的第五方面,提供了一種數(shù)據(jù)處理系統(tǒng),用于針對從原始數(shù)字化彩色圖像中推導(dǎo)出的新數(shù)字化彩色圖像,推導(dǎo)出表示像素映射的新索引序列和表示調(diào)色板的新輸出函數(shù),其中原始和新的數(shù)字化彩色圖像兩者都定義在n個像素上,其中,原始數(shù)字化彩色圖像由分配給n個像素的N個不同顏色提供,新數(shù)字化彩色圖像由分配給n個像素的M個不同顏色提供,新索引序列具有表示n個像素的n個索引組分,新輸出函數(shù)用于將n個索引組分映射至M種顏色。該數(shù)據(jù)處理系統(tǒng)包括(a)硬判決模塊,用于(i)根據(jù)原始數(shù)字化彩色圖像中的每個像素的顏色,通過將原始數(shù)字化彩色圖像中的所有像素劃分為M個不相交簇,來提供第一新索引序列,與像素在原始數(shù)字化彩色圖像中的位置無關(guān),其中,M小于或等于N;以及(ii)提供第一新輸出函數(shù),用于將M個不同顏色一對一地映射至M個不相交簇中的像素;以及(b)軟判決模塊,用于對于第一新索引序列的每個組分,分別根據(jù)由第一新輸出函數(shù)分配給該組分的顏色值與由第一新輸出函數(shù)分配給第一新索引序列的至少一個其它組分的顏色值的相關(guān)程度,來對第一新索引序列和第一新輸出函數(shù)應(yīng)用軟判決優(yōu)化過程,以提供新的索引序列和新的輸出函數(shù)。
根據(jù)本發(fā)明的第六方面,提供了一種在計(jì)算機(jī)系統(tǒng)上使用的計(jì)算機(jī)程序產(chǎn)品,以針對從原始數(shù)字化彩色圖像中推導(dǎo)出的新數(shù)字化彩色圖像,創(chuàng)建像素映射和表示調(diào)色板的新輸出函數(shù),其中原始和新的數(shù)字化彩色圖像兩者都定義在n個像素上,其中,原始數(shù)字化彩色圖像由分配給n個像素的N個不同顏色提供,新數(shù)字化彩色圖像由分配給n個像素的M個不同顏色提供,新索引序列具有表示n個像素的n個索引組分,新輸出函數(shù)用于將n個索引組分映射至M種顏色。該計(jì)算機(jī)程序包括記錄介質(zhì);以及裝置,記錄在介質(zhì)上,用于指示計(jì)算機(jī)系統(tǒng)執(zhí)行以下步驟(a)根據(jù)原始數(shù)字化彩色圖像中的每個像素的顏色,通過將原始數(shù)字化彩色圖像中的所有像素劃分為M個不相交簇,來提供第一新索引序列,與像素在原始數(shù)字化彩色圖像中的位置無關(guān),其中,M小于或等于N;(b)提供第一新輸出函數(shù),用于將M個不同顏色一對一地映射至M個不相交簇中的像素;(c)對于第一新索引序列的每個組分,分別根據(jù)由第一新輸出函數(shù)分配給該組分的顏色值與由第一新輸出函數(shù)分配給第一新索引序列的至少一個其它組分的顏色值的相關(guān)程度,來對第一新索引序列和第一新輸出函數(shù)應(yīng)用軟判決優(yōu)化過程,以提供新的索引序列和新的輸出函數(shù)。


下面參考以下附圖來提供本發(fā)明優(yōu)選方面的詳細(xì)描述,附圖中圖1是示出了根據(jù)本發(fā)明優(yōu)選方面的計(jì)算機(jī)系統(tǒng)的方框圖;圖2是示出了根據(jù)本發(fā)明優(yōu)選方面的八叉樹結(jié)構(gòu)的圖;圖3是示出了根據(jù)本發(fā)明軟判決優(yōu)化方面的第一變體的維特比算法的圖;圖4是示出了根據(jù)本發(fā)明軟判決優(yōu)化方面的第二變體的維特比算法的圖;以及圖5是示出了圖1的計(jì)算機(jī)系統(tǒng)的CPU的方框圖。
具體實(shí)施例方式
參考圖1,示出了根據(jù)本發(fā)明方面的計(jì)算機(jī)系統(tǒng)10的方框圖。計(jì)算機(jī)系統(tǒng)包括存儲器12,用于存儲彩色圖像數(shù)據(jù);監(jiān)視器14,用于顯示數(shù)字彩色圖像;CPU 16,用于圖像處理,并且在保持低計(jì)算復(fù)雜度和與GIF/PNG解碼器的兼容的同時,提供聯(lián)合地優(yōu)化了量化、失真和壓縮權(quán)重的顏色數(shù)據(jù)的壓縮;以及編碼器20,例如GIF編碼器或PNG編碼器,用于在通過傳輸導(dǎo)管20從計(jì)算機(jī)系統(tǒng)10傳輸之前,對彩色圖像數(shù)據(jù)進(jìn)行編碼。
彩色圖像編碼的聯(lián)合優(yōu)化問題可以定義如下設(shè)定Ω={(r,g,b)|0≤r,g,b≤255}是RGB顏色空間。假設(shè)O={o1,o1,...,oN-1}是具有N個不同顏色的原始彩色圖像的調(diào)色板。如果原始圖像中的總像素?cái)?shù)目是n,則通過從上至下、從左至右掃描彩色圖像,獲得索引序列I=(i0,i1,...,in-1),其中ik表示第k個像素的顏色矢量是oik。如果限定使用具有M種顏色(M<N)的新調(diào)色板C來再現(xiàn)原始彩色圖像,則聯(lián)合優(yōu)化編碼器致力于找到新調(diào)色板C={c0,c1,...,cM-1}、新索引序列U=(u0,u1,...,un-1)以及無損代碼字長度函數(shù)I,以再現(xiàn)原始圖像,且使下面的代價函數(shù)(cost function)最小化n-1l(U)+λn-1Σk=0n-1d(oik,cuk)]]>其中,λ是拉格朗日乘子,d是由cuk表示oik所引起的平方誤差d(oi,ck)=||oi-ck||2=(roI-rck)2+(goi-gck)2+(boi-bck)2---(1.1)]]>由于在無損代碼字長度函數(shù)和無損代碼之間存在一對一的映射,對無損代碼字長度函數(shù)的選擇等效于對無損代碼的選擇。
顯而易見地,Σk=0n-1d(oik,cik)=Σk=0n-1[(rok-rck)2+(gok-gck)2+(bok-bck)2]---(1.2)]]>是總平方誤差(TSE),與量化彩色圖像的可視質(zhì)量緊密相關(guān)。注意,TSE或者其它類似失真測量的最小化是在參考[1]至[6]所考慮的面向量化的方法的唯一目的。類似地,給定新調(diào)色板C和像素映射(因此有索引序列U),所有可能的無損代碼字長度函數(shù)1中比特率n-1l(U)的最小化是參考[7]至[9]所考慮的顏色量化圖像的編碼方法的唯一目的。以上給出的代價函數(shù)提出了速率和失真的聯(lián)合優(yōu)化的問題。量化失真由調(diào)色板C和像素映射(即索引序列U)確定;壓縮率由像素映射和無損代碼字長度函數(shù)1確定。當(dāng)然,在這里,像素映射是軟判決像素映射。因此,即使無損代碼長度函數(shù)1是固定的,通過改變C和U,仍然可以聯(lián)合地優(yōu)化速率和失真。
存在多種無損代碼字長度函數(shù),每一個函數(shù)與不同的熵代碼相對應(yīng),例如D.A.Huffman,“A method for the construction of minimum-redundancycodes,”Proc.IRE,vol.40,no.9,pp.1098-1101,1952(下面稱為“參考[12]”)的Huffman代碼、J.Ziv和A.Lempel,“A universal algorithm for sequentialdata compression,”IEEE Trans.On Information Theory,vol.23,pp.337-343,1977(下面稱為“參考[11]”)、J.Ziv和A.Lempel IEEETrans.Inform.theory(下面稱為“參考[10]”)的Lempel-ziv代碼、I.H.Witten,M.Neal和J.G.Cleary,“Arithmetic coding for data compression,”Commun.ACM,vol.30,pp.520-540,June 1987(下面稱為“參考[13]”)的算術(shù)代碼、E.-H.Yang和J.C.Kieffer,“Efficient universal lossless datacompression algorithms based on a greedy sequential grammar transform-part onewithout context models,”IEEE Trans.On Information Theory,vol.46,no.3,pp.755-4777,may 2000(下面稱為“參考[14]”)以及J.C.Kieffer和E.-H Yang,“Grammer based codesA new class of universal lossless sourcecodes,”IEEE Trans.on information Theory,vol.46,no.3,pp.737-754,may 2000(下面稱為“參考[16]”)的基于語法的代碼以及特別針對彩色圖像編碼而設(shè)計(jì)的無損代碼(參見參考[7]至[9])。由于希望保持與GIF/PNG解碼器的兼容,所以在GIF解碼器的情況下將l選擇為LZ78或其變體的代碼字長度,并且在PNG解碼器的情況下將l選擇為LZ77或其變體的代碼字長度,參見J.Miano,“Compressed image file formatsJpeg,png,gif,xbm,bmp,”ACM Press,2000(下面稱為“參考[17]”),在所有情況下簡單地由lLZ(U)表示。因此,要最小化的代價函數(shù)是n-1lLZ(U)+λn-1Σk=0n-1d(oik,cuk).]]>以上給出的代價函數(shù)具有與熵限制矢量量化(ECVQ)中定義的代價函數(shù)類似的形式,參見P.A.Chou,T.Lookabaugh和R.M.Gray,“Entropy-constrained vector quantization,”Acoustic,Speech,and SignalProcessing[還參見IEEE Transactions on Signal Processing],IEEETransactions on,vol.37,no.1,pp.31-42,Jan.1989(下面稱為“參考[18]”),特別地具有與可變速率格柵信源編碼(VRTSE)中定義的代價函數(shù)類似的形式,參見E.-H.Yang和Z.Zhang,“Variable rate trellis source encoding,”IEEETrans.on information Theory,vol.45,no.2,pp.586-608,March 1999(下面稱為“參考[19]”)。在利用格柵結(jié)構(gòu)且聯(lián)合地優(yōu)化產(chǎn)生的速率、失真和選定的編碼路徑意義上,VRTSE可以被看作熵限制標(biāo)量量化和矢量量化[18]的概括。其有效的性能,尤其是在低速率區(qū)域,使VRTSE特別適用于彩色圖像編碼,在彩色圖像編碼中,通常希望有高壓縮比以節(jié)約存儲空間和傳輸時間。
根據(jù)VRTSE,根據(jù)本發(fā)明的方面,開發(fā)出兩種方法可變速率格柵(trellis)顏色量化(VRTCQ)1和VRTCQ2,以在保持低計(jì)算復(fù)雜度和與GIF/PNG解碼器兼容的同時,聯(lián)合地優(yōu)化量化失真和壓縮率。VRTCQ1和VRTCQ2使用軟判決像素映射,并且是遞歸的。此外,根據(jù)本發(fā)明的另一個方面,開發(fā)出熵限制等級合并量化(ECHMQ),其使用RGB顏色的八叉樹數(shù)據(jù)結(jié)構(gòu),并且局部地使量化彩色圖像的熵限制代價最小化,以提供VRTCQ1和VRTCQ2的初始彩色圖像編碼方案。ECHMQ獨(dú)立地提供了一種平衡量化彩色圖像的速率和失真的有效方式。
可變速率格柵信源編碼的簡要回顧[19]中給出的可變速率格柵信源編碼是固定斜率有損編碼對格柵結(jié)構(gòu)解碼器的擴(kuò)展,參見E.hui Yang.,Z.Zhang和T.Berger,“Fixed-slopeuniversal lossy data compression,”IEEE Trans.on Information Theory,vol.43,no.5,pp.1465-1476,Sept.1997(下面稱為“參考[20]”)。對于每個實(shí)數(shù)值信源序列xn=(x0,x1,...,xn-1)∈Rn,目的在于找到序列un=(u0,u1,...,un-1)∈Mnset,Mset={0,1,...,M-1},以使以下代價函數(shù)最小化J(xn)=n-1l(un)+λn-1p(xn,β(un))其中,λ是給定的拉格朗日乘子,l是無損代碼字長度函數(shù),β(un)=(z0,z1,...,zn-1)是與un相對應(yīng)的再現(xiàn)序列,p是由下式定義的平方誤差失真p(xn,zn)Δ‾Σi=0n-1p(xi,zi)Δ‾Σ0n-1(xi-zi)2]]>其中xn=(x0,x1,...,xn-1),且zn=(z0,z1,...,zn-1)。
從un中,通過格柵結(jié)構(gòu)的解碼器β=(f,g),確定再現(xiàn)序列β(un),其中fS×Mset→S是狀態(tài)變換函數(shù),S={s0,s1,...,s|s|-1}是狀態(tài)集合,并且gS×Mset→R是輸出函數(shù)。函數(shù)f和g分別確定了格柵結(jié)構(gòu)和再現(xiàn)等級的集合(與調(diào)色板類似)。給定初始狀態(tài)Si0,再現(xiàn)序列β(un)=(z0,z1,...,zn-1)計(jì)算如下zj=g(sij,uj)]]>sij+1=f(sij,uj)]]>j=0,1,...,n-1 (2.3)換句話說,當(dāng)接收到un時,解碼器β在遍歷狀態(tài)序列si0,si1,...,sin的同時輸出再現(xiàn)序列β(un)=(z0,z1,...,zn-1)。
固定β。將l選擇為具有k階變換概率函數(shù)W(u|uk|)的k階靜態(tài)算術(shù)代碼字長度函數(shù)LWk。然后使用維特比算法來找到最佳序列unun=argvn=(v0,v1,...,vn-1)∈Mnmin[n-1LWk(v0,v1,...,vn-1)+λn-1p(xn,β(vn))]---(2.4)]]>固定f。g、un和LWk的聯(lián)合優(yōu)化(或者等效為W(u|uk|))可以描述如下ming,Wminun∈Mn[n-1LWk(un)+λn-1p(xn,β(un))]---(2.5)]]>
在[19]中提出了一種可選的算法,以解決聯(lián)合優(yōu)化問題(2.5)。這種可選算法的過程如下步驟1設(shè)定t=0。選擇輸出函數(shù)g(o)和變換概率函數(shù)W(0),滿足W(o)(u|uk)>0,對于任意u∈Mset和uk∈Mkset。
步驟2固定g(t)和W(t)。使用維特比算法,由g(t)替換g,W(t)替換W,來找到滿足方程(2.4)的序列(un)(t)=(u0(t),u1(t),..,un-1(t))。
步驟3固定(un)(t)。索引序列(un)(t)引起變換概率函數(shù)和輸出函數(shù)如下的更新W(t+1)(u|uk)=|{j:uj(t)=u,(uj-kj-1)(t)=uk,0≤i≤n}||{j:(uj-kj-1)(t)=uk,0≤j<n}|,]]>uk∈Msetk,]]>u∈Mset以及g(t)(s,u)=Σs,uxj|{j:sij=s,uj(t)=u,0≤j<n}|]]>s∈S,u∈Mset其中,uj-kj-1=uj-k...uj-1,]]>sij,j=0,1,...,n-1是隔柵解碼器(f,g(t))響應(yīng)于(un)(t)而遍歷的狀態(tài),并且對滿足sij=s]]>且uj(i)=u]]>的所有j取∑s,u。
步驟4對于t=0,1,2,..重復(fù)步驟2至3,直到[n-1LkW(i)((un)(i))+λn-1p(xn,β(t)((un)(i)))]-[n-1LkW(i+1)((un)(i+1))+λn-1p(xn,β(i+1)((un)(i+1)))]≤ξ]]>其中,ξ是預(yù)定的小閾值,LkW(t)是與k階變換概率函數(shù)W(t)(u|uk|)相關(guān)的k階靜態(tài)算法代碼字長度函數(shù)。然后輸出g(t+1)、(un)(t+1)和W(t+1)。
VRTSE的性能漸進(jìn)地接近于如參考[19]中定理3和4所示的有限速率-失真。對高斯、拉普拉斯、高斯-馬爾可夫信源的實(shí)驗(yàn)結(jié)果表示VRTSE尤其適用于低速率編碼。為了將VRTSE應(yīng)用于彩色圖像編碼,必須解決以下問題問題1VRTSE中使用的無損代碼字長度函數(shù)是k階靜態(tài)算術(shù)代碼字長度函數(shù)Lk。另一方面,在彩色圖像編碼的本示例中,無損代碼字長度函數(shù)是Lempel-ziv代碼字長度函數(shù)LLZ。
問題2在VRTSE中,未規(guī)定初始化步驟,即步驟1。即,在VRTSE中怎樣選擇初始函數(shù)g(0)和W(0)是開放的。在彩色圖像編碼設(shè)置中,這轉(zhuǎn)變?yōu)樵鯓釉O(shè)計(jì)初始彩色圖像編碼方案。
問題3為了減小計(jì)算復(fù)雜度,VRTSE中的索引集合Mset通常被選擇為Mset=2的二進(jìn)制,使得可以使用高級算術(shù)代碼字長度。另一方面,在彩色圖像編碼中,基數(shù)M通常相對較大,并且可以大至256。因此,需要一種新方法來降低計(jì)算復(fù)雜度。
為了避開問題1,給Lempel-ziv代碼字長度函數(shù)lLZ定上界。如果LLZ是LZ78的代碼字長度函數(shù),則遵守針對任意序列un=(u0,u1,...,un-1)的無損信源編碼文獻(xiàn)(例如,參見[14]),1nlLZ(un)≤rk(un)+qkloglognlogn---(2.6)]]>其中,rk(un)是每符號中比特的un的k階經(jīng)驗(yàn)熵,qk是僅取決于k的常數(shù),log代表底為2的對數(shù)。如果lLZ是LZ77的代碼字長度函數(shù),則類似的上限也是有效的。代替使受失真限制的 最小化,使VRTCQ1中受相同失真限制的rk(un)最小化。在VRTCQ1中使用不同的上限。下面解決問題2至3。
熵限制等級合并量化根據(jù)本發(fā)明的方面,通過熵限制等級合并量化(ECHMQ)來解決問題2,ECHMQ提供了VRTSE的初始彩色圖像編碼方案。ECHMQ用作VRTCQ1和VRTCQ2的第一階段,即階段1。
ECHMQ是硬判決量化,將原始N個顏色劃分為M個非交迭的簇,找到每個簇的再現(xiàn)顏色,并確定每個原始顏色的再現(xiàn)顏色,而與原始顏色在2維圖像中的位置無關(guān)。其利用八叉樹數(shù)據(jù)結(jié)構(gòu)[3],并通過局部地使下面定義的熵限制代價最小化,來平衡速率和失真。
設(shè)定具有調(diào)色板O={o1,o1,...,oN-1}的n像素彩色圖像和所希望的新調(diào)色板大小M<N,使用硬判決量化器q來將N個顏色劃分為M簇C0,C1,...,CM-1,其對于i≠j和0≤i,j<M,滿足
Ci∩Cj≡ФC0∪C1∪...∪CM-1≡O(shè)(3.7)簇的質(zhì)心的整數(shù)形式構(gòu)成了調(diào)色板C={c0,c1,...,cM-1},并且從原始顏色到簇的映射明確地將每個像素映射至索引。設(shè)定un=(u0,u1,...,un-1)∈Msetn]]>是將所有像素映射至索引所獲得的索引序列。因此,量化圖像的熵限制代價定義如下J(q)=R(q)+λD(q)(3.8)其中,λ是拉格朗日乘子。在(3.8)中,D(q)是總平方誤差D(q)=Σj=0M-1Σok∈cjF(ok)d(ok,cj)---(3.9)]]>其中,對于0≤i<N,F(xiàn)(oi)是顏色oi在原始彩色圖像中出現(xiàn)的次數(shù),d(ok,cj)是兩種顏色在RGB空間的歐幾里德距離的平方,如方程(1.1)所定義的。R(q)是索引序列un的代碼字長度。由于從顏色至索引的映射與顏色在彩色圖像中的位置無關(guān),所以第一階熵用于計(jì)算代碼字長度R(q)=Σj=0M-1[(Σok∈c1F(ok))lognΣok∈c1F(ok)]---(3.10)]]>方程(3.8)中定義的代價函數(shù)與參考[18]中的熵限制矢量量化(ECVQ)中定義的拉格朗日函數(shù)類似。主要問題是設(shè)計(jì)一種具有良好速率失真平衡和較低編碼復(fù)雜度的硬判決量化器q。使用八叉樹來加速合并,并且使用方程(3.8)中定義的代價函數(shù)來平衡量化圖像的速率和失真。
與掃描每個像素的顏色并將其插入樹[3]的高速(on-the-fly)八叉樹構(gòu)建過程不同,獲得原始彩色圖像的直方圖,并一次構(gòu)建初始八叉樹。參考圖2,示出了包含原始彩色圖像中所有不同的顏色及其出現(xiàn)次數(shù)的八叉樹22。根節(jié)點(diǎn)24,即等級0,包括彩色圖像中的不同顏色。由于RGB顏色空間中每個顏色包括三個8比特字節(jié),每個字節(jié)代表基本組成,三個字節(jié)的最高有效位確定顏色在等級1中的位置。只要多于一個顏色被傳遞給一個節(jié)點(diǎn),則該節(jié)點(diǎn)就是中間節(jié)點(diǎn)26,并且應(yīng)該根據(jù)較低有效RGB位的組合來進(jìn)一步分裂。傳遞給葉節(jié)點(diǎn)28的顏色被稱為在該葉節(jié)點(diǎn)28的顏色,并且顏色本身實(shí)際上是該葉節(jié)點(diǎn)的質(zhì)心。沿每個顏色分量方向,等級k處任何兩個葉兄弟節(jié)點(diǎn)的質(zhì)心之間處于(0,29-k)的范圍內(nèi)。顯而易見地,k越大,這些質(zhì)心顏色越類似。注意,圖2所示的八叉樹非常不平衡且不對稱,這是由于以下兩個原因第一,普通的彩色圖像中出現(xiàn)的顏色數(shù)目遠(yuǎn)小于RGB空間可用的224個顏色總數(shù)目(參見參考[17]);第二,如果只有一種顏色被分配給一個節(jié)點(diǎn),則該節(jié)點(diǎn)停止分裂。
現(xiàn)在,將原始彩色圖像中每個不同顏色oi放在八叉樹中的不同葉節(jié)點(diǎn)Θi中。通過重復(fù)每次合并兩個葉兄弟節(jié)點(diǎn),可以將葉節(jié)點(diǎn)的數(shù)目從N減少至M。產(chǎn)生的每個葉節(jié)點(diǎn)的質(zhì)心的整數(shù)形式是新的調(diào)色板中的顏色。注意,在重復(fù)合并葉兄弟節(jié)點(diǎn)之后,每個葉節(jié)點(diǎn)與原始彩色圖像的調(diào)色板中的顏色子集相對應(yīng)。
假設(shè)O={o1,o1,...,oN-1}是原始彩色圖像的調(diào)色板。設(shè)定Θi和Θj是父節(jié)點(diǎn)Θ下的兩個葉兄弟節(jié)點(diǎn),其中Θi={oi0,oi1,...,oim-1},]]>Θj={oj0,oj1,...,ojK-1}.]]>并且Θi∩Θj≡Ф。設(shè)定ci是Θi的質(zhì)心顏色,cj是Θj的質(zhì)心顏色。節(jié)點(diǎn)Θi的出現(xiàn)次數(shù)Fi定義為節(jié)點(diǎn)Θi中每種顏色出現(xiàn)次數(shù)的總和FiΔ=Fi0+Fi1+...+Fim-1]]>其中,F(xiàn)i1表示原始圖像中顏色oi1的出現(xiàn)次數(shù)。按照類似的方式計(jì)算節(jié)點(diǎn)Θj的出現(xiàn)次數(shù)FjFjΔ=Fj0+Fj1+...+Fjk-1]]>其中,F(xiàn)ji表示原始圖像中顏色oji的出現(xiàn)次數(shù)。通過將兩個節(jié)點(diǎn)Θi和Θj合并為新的節(jié)點(diǎn)Θij,將Θi和Θj中的所有顏色移到了新的節(jié)點(diǎn)Θij,即Θij=Θi∪Θj={oi0,oi1,...,oim-1,oj0,oj1,...,ojk-1,}.]]>因此,節(jié)點(diǎn)Θij的出現(xiàn)次數(shù)是Fij=Fi+Fj。假設(shè)允許實(shí)數(shù)值顏色。下面的引理給出了從Θi和Θj合并至Θij的產(chǎn)生的熵限制待機(jī)增量。
引理1通過合并節(jié)點(diǎn)Θi和Θj,熵限制代價增加了ΔJ=λ(Fid(c1,cij)+Fjd(cj,cij))+FijlognFij-FilognFi-FjlognFj---(3.11)]]>其中,cij是節(jié)點(diǎn)Θij的質(zhì)心,即cij=1Fij(Fici+Fjcj)---(3.14)]]>證明當(dāng)利用該單元質(zhì)心來再現(xiàn)該單元中所有元素時實(shí)現(xiàn)了最小的總平方誤差。這是質(zhì)心條件,參見在量化方法中廣泛使用的S.P.Lloyd,“Leastsquares quantization in pcm,”IEEE Trans.on Information Theory,no.28,pp.127-135,March 1982(下面稱為“參考[21]”)。在這篇文章中,使用葉節(jié)點(diǎn)的質(zhì)心作為該節(jié)點(diǎn)中所有顏色的量化等級,即再現(xiàn)顏色。通過這種方式,可以計(jì)算出每種可能的合并的熵限制代價,而不需要計(jì)算合并之前總熵限制代價與合并之后總熵限制代價之間的差值。
由于Fici=Σp=0m-1Fipoip]]>以及Fjcj=Σq=0k-1Fjqojq,]]>新節(jié)點(diǎn)Θij的質(zhì)心是cij=1Σp=0m-1Fip+Σq=0n-1Fjq(Σp=0m-1Fipoip+Σq=0k-1Fjqojq)=1Fij(Fici+Fjcj)]]>可以通過分別計(jì)算增加的平方誤差ΔD和增加的代碼字長度ΔR來證明增加的熵限制代價ΔJ的方程(3.11)。設(shè)定DΘi表示使用ci作為Θi的量化等級而引起的總平方誤差。則DΘi=Σp=0m-1Fip||oip-ci||2.]]>類似地,有DΘi=Σq=0k-1Fjq||ojq-cj||2]]>和DΘij=Σp=0m-1Fip||oip-cij||2+Σq=0k-1Fjq||ojq-cij||2.]]>將cij代入方程(3.12),并簡化D(Θij)的表達(dá)式,獲得DΘij=DΘi+DΘj+Fid(c1,cij)+Fjd(cj,cij).]]>因此,ΔD=DΘij-(DΘi+DΘj)=Fid(ci,cij)+Fid(cj,cij)]]>設(shè)定RΘi表示對具有節(jié)點(diǎn)Θi中的顏色的所有像素進(jìn)行熵編碼所產(chǎn)生的總比特?cái)?shù)目。則RΘi=FilognFi.]]>類似地,有RΘj=FjlognFj]]>和RΘij=FijlognFij.]]>因此,ΔR=R(Θij)-(R(Θi)+R(Θj))=FijlognFij-FilognFi-FjlognFj]]>其與ΔD一起暗示了(3.11)。這實(shí)現(xiàn)了引理1的證明。
引理1提供了合并兩個葉兄弟節(jié)點(diǎn)的規(guī)則。階段1的目的是產(chǎn)生給出量化圖像的速率和失真之間的有效平衡的硬判決量化器。由于原始調(diào)色板是限定的,通過搜索所有可能的組合,可以找到全局最佳硬判決量化器。而,這種方法具有較高的計(jì)算復(fù)雜度,因此對于實(shí)時壓縮是不實(shí)用的。引理1提出了一種可選方法,即一種貪婪法(greedy method),以設(shè)計(jì)一種樹結(jié)構(gòu)的硬判決量化器。根據(jù)具有N個葉節(jié)點(diǎn)的原始八叉樹,可以以最小熵限制代價的增加來重復(fù)地合并兩個葉兄弟節(jié)點(diǎn),直到剩下M個葉節(jié)點(diǎn)為止。被稱為熵限制等級合并量化(ECHMQ)的這種方法是快速的,且給出了量化圖像的速率和失真之間的相當(dāng)好的平衡。ECHMQ的詳細(xì)步驟如下步驟1讀出n個像素的原始彩色圖像X=(x0,x1,...,xn-1),并獲得調(diào)色板O={o1,o1,...,oN-1}和每種顏色oi的出現(xiàn)次數(shù)fi,其中0≤i<N。
步驟2通過將每種顏色oi插入樹作為不同的葉節(jié)點(diǎn)Θi,構(gòu)建八叉樹。對于0≤i<N的每一個葉節(jié)點(diǎn)Θi,計(jì)算其質(zhì)心ci=oi,TSEDΘi=0,]]>出現(xiàn)次數(shù)Fi=fi,并且代碼字長度RΘi=FilognFi.]]>步驟3設(shè)定k=N。
步驟4對于每兩個葉兄弟節(jié)點(diǎn)Θi和Θj,通過方程(3.12)計(jì)算質(zhì)心cij,通過方程(3.11)計(jì)算增加的熵限制代價。
步驟5在所有葉兄弟節(jié)點(diǎn)對中,選擇使在前一步驟中計(jì)算的增加的熵限制代價最小化的兩個葉兄弟節(jié)點(diǎn)Θp和Θq。如果Θp和Θq是其父節(jié)點(diǎn)下僅有的兄弟,則將Θp和Θq合并為等于Θp和Θq的父節(jié)點(diǎn)的新葉節(jié)點(diǎn)Θpq,否則將其合并為Θp和Θq父節(jié)點(diǎn)下的新組合葉節(jié)點(diǎn)。計(jì)算Θpq的質(zhì)心cpq,F(xiàn)pq=Fp+Fq,DΘpq=DΘp+DΘq+Fpd(cp,cpq)+Fqd(cq,cpq)]]>以及RΘpq=FpqlognFpq.]]>步驟6從八叉樹中去除葉節(jié)點(diǎn)Θp和Θq。
步驟7使k減1。
步驟8重復(fù)步驟4至7,直到k=M為止。然后將不同的索引i∈Mset分配給最終八叉樹中剩下的M個葉節(jié)點(diǎn)中的每一個。葉節(jié)點(diǎn)的質(zhì)心的整數(shù)形式是新的調(diào)色板中的不同顏色,并且該葉節(jié)點(diǎn)中的所有顏色映射至與該葉節(jié)點(diǎn)相對應(yīng)的索引。
當(dāng)達(dá)到所希望的顏色數(shù)目時,量化原始圖像的最終熵限制代價是J=JN+ΔJN+ΔJN-1+...+ΔJM+1=JN+Σi=NM+1ΔJi,]]>其中JN是具有N個不同顏色的原始圖像的代價,ΔJi是當(dāng)合并兩個選定的葉節(jié)點(diǎn)并且將八叉樹的葉節(jié)點(diǎn)數(shù)目從i減為i-1時增加的代價。通過找到每次在合并八叉樹中的兩個葉兄弟節(jié)點(diǎn)時的最小增加熵限制代價,ECHMQ提供了一種使熵限制代價最小化的局部最佳方式。
ECHMQ目的在于(局部)使熵限制代價最小化,而不是使純失真TSE最小化。因此,由拉格朗日乘子λ控制和平衡量化圖像的速率和失真。隨著λ增加,平均失真減小,相應(yīng)的速率增加。實(shí)際上,-λ可以解釋為產(chǎn)生的速率失真曲線的斜率。因此,在ECHMQ中,可以靈活地使用λ作為平衡因子來改變量化圖像的速率和失真。
ECHMQ的另一個優(yōu)點(diǎn)在于其較低的計(jì)算復(fù)雜度。為了示出該優(yōu)點(diǎn),假設(shè)最初有總共256個葉節(jié)點(diǎn),所有葉節(jié)點(diǎn)分配在等級7的32個父節(jié)點(diǎn)之下的等級8處。為了使葉節(jié)點(diǎn)的數(shù)目減為255,需要計(jì)算32×8!2!×6!=896]]>對葉兄弟節(jié)點(diǎn)的增加的熵限制代價。如果不使用八叉樹結(jié)構(gòu),則需要計(jì)算256!2!×254!=32640]]>對的增加代價,在[5]中,成對地分簇主要使用該方法。將方程(3.11)改寫為ΔJ=λ{F1[(rci-rcij)2+(gci-gcij)2+(bci-bcij)2]+]]>Fj[(rci-rcij)2+(gci-gcij)2+(bcj-bcij)2]}+]]>FijlognFij-(RΘi+RΘj)]]>可見,每對葉兄弟節(jié)點(diǎn)的增加代價的計(jì)算包括8次加、7次減、10次乘、1次除以及1次對數(shù)運(yùn)算。與其它方法中所需的較高計(jì)算相比,如對于每次分裂采用Jocobi方法的基于TSE的等級分裂方法[2]等,ECHMQ享有非常低的復(fù)雜度。此外,在步驟8處可以容易地獲得調(diào)色板和像素的映射;這與如在參考[5]和[6]中所述方法等的文獻(xiàn)中的其它方法相比也是有利的,在這些方法中,在調(diào)色板設(shè)計(jì)和像素的映射中包括大量的計(jì)算。
如果略過下面所述的進(jìn)一步的優(yōu)化,可以直接由GIF/PNG編碼器對在ECHMQ結(jié)尾處所獲得的新的調(diào)色板和像素的映射進(jìn)行編碼。為了明確,下面使用PNG編碼器作為熵編碼器。用可用的GIF編碼器代替PNG編碼器,可以容易地獲得與GIF解碼器兼容的輸出。
VRTCQ1在這部分,采用軟判決量化,在保持與GIF/PNG解碼器兼容的同時,進(jìn)一步聯(lián)合地優(yōu)化量化彩色圖像的壓縮率和失真。使用在ECHMQ結(jié)尾處獲得的硬判決量化器作為初始彩色圖像編碼方案,可以將VRTSE擴(kuò)展到彩色圖像編碼,產(chǎn)生VRTCQ1。
設(shè)定從VRTCQ1的VRTSE設(shè)置開始。由于希望保持與GIF/PNG解碼器的兼容,輸出函數(shù)g不能夠依賴于任何狀態(tài)。換句話說,狀態(tài)集S僅包括s0。在這種情況下,可以丟開狀態(tài)變換函數(shù)f,輸出函數(shù)g僅僅是從Mset至RGB空間的映射,定義了索引和調(diào)色板中顏色之間的對應(yīng),并且隔柵解碼器降為β=g。給定原始彩色圖像xn=(x0,x1,...,xn-1),對于un∈(u0,u1,...,un-1)∈Msetn]]>的任意序列,定義d(xn,g(un))=Σi=0n-1d(xi,g(ui))]]>使用在(2.6)中給定的上界,并且使受失真限制的rk(un)最小化。為了明確,設(shè)定k=1。然而,可以容易地將下面所述的過程擴(kuò)展到任意k。
可以從在ECHMQ結(jié)尾處獲得的調(diào)色板和像素映射中推導(dǎo)出初始輸出函數(shù)g(0)和變換概率函數(shù)W(0)。VRTCQ1的詳細(xì)過程描述如下步驟1設(shè)t=0。從ECHMQ中獲得(un)(0)、g(0)和W(0)(un)(0)=(u0(0),u1(0),...,un-1(0))]]>是從硬判決量化器產(chǎn)生的量化圖像的索引序列,g(0)(j)是在ECHMQ結(jié)尾處獲得的新調(diào)色板中與索引j相對應(yīng)的顏色,其中0≤j<M,以及對于任意α∈Mset和w∈Mset,有W(0)(α|w)=|{i:ui(0)=α,ui-1(0)=w,0≤i<n}||{i:ui-1(0)=w,0≤i<n}|]]>還計(jì)算初始代價J(0)=n-1L1W(0)((un)(0))+λn-1d(xn,g(0)((un)(0)))].]]>步驟2固定g(t)和W(t)。使用維特比算法來找到滿足以g(t)代替g和以W(t)代替W的方程(2.4)的序列(un)(i+1)=(u0(i+1),u1(i+1),...,un-1(i+1)).]]>步驟3固定(un)(t+1)。索引序列(un)(t+1)使得變換概率函數(shù)和輸出函數(shù)更新如下對于任意α∈Mset和w∈Mset,有W(t+1)(α|w)=|{i:ui(t+1)=α,ui-1(t+1)=w,0≤i<n}||{i:ui-1(t+1)=w,0≤i<n}|,]]>以及對于任意u∈Mset,有g(shù)(t+1)(u)=Σuxi|{i:ui(t+1)=u,0≤i<n}|]]>其中,對ui(t+1)=u]]>的所有i求和∑u。注意,xi代表原始圖像中第i個像素的顏色。
步驟4計(jì)算更新的代價Jt+1=n-1L1W(t+1)((un)(t+1))+λn-1d(xn,g(t+1)((un)(t+1)))].]]>步驟5對于t=0,1,2,...重復(fù)步驟2至4,直到J(t)-Jt+1≤ξ為止,其中ξ是預(yù)定閾值。
然后輸出g(t+1)和(un)(t+1)。
步驟6使用[17]中描述的PNG編碼器對調(diào)色板g(t+1)和索引序列(un)(t+1)進(jìn)行編碼。
可以將步驟2至6簡稱為VRTCQ1的階段2。圖3所示的圖示出了此處所用的維特比算法。階段之間增加的代價計(jì)算如下-logW(ui|ui-1)+d(xi,g(ui))(4.13)其中對于任意0≤i<n,si=ui。在階段i為了找到達(dá)到狀態(tài)j的優(yōu)選路徑,需要比較M個累加的代價,每個需要3次加、3次減和乘。因此總的計(jì)算復(fù)雜度是O(nM2)。
中的定理3示出了階段2的最優(yōu)性。整體上,VRTCQ1在保持與GIF/PNG解碼器的兼容的同時,在一定程度上聯(lián)合地優(yōu)化了量化彩色圖像的速率和失真。實(shí)驗(yàn)示出了收斂非???;通常,在2至3次迭代之后,J(t)非常接近于其極限。
考慮VRTCQ1的整體計(jì)算復(fù)雜度來結(jié)束本部分。與階段2相比,VRTCQ1的階段1,即ECHMQ,具有非常低的計(jì)算復(fù)雜度。因此,VRTCQ1的主要計(jì)算復(fù)雜度在于階段2,尤其是在維特比算法中。由于維特比算法的每次迭代具有計(jì)算復(fù)雜度O(nM2),所以當(dāng)M較大時,VRTCQ1的總計(jì)算復(fù)雜度非常不利于實(shí)時壓縮。因此,希望在大M(large M)的情況下降低計(jì)算復(fù)雜度。這個問題由VRTCQ2解決。
VRTCQ2為了在大M的情況下降低VRTCQ1的計(jì)算復(fù)雜度,現(xiàn)在以不同于(2.6)的方式來定義Lempel-Ziv代碼字長度函數(shù)的上限。為此,定義與第k階經(jīng)驗(yàn)熵rk(un)不同的新信息量。設(shè)定M’是嚴(yán)格小于M的整數(shù)。設(shè)定b(·)是從Mset={0,1,...,M-1}至M′set={0,1,...,M′-1}的映射。關(guān)于b,將Mset劃分為M’組{i∈Msetb(i)=j(luò)},j=0,1,...,M′-1。對于任意un=(u0,u1,...,un-1)∈Msetn,]]>設(shè)定b(un)=(b(u0),b(u1),...,b(un-1))定義r(un|b(un))Δ=Σj-1M′-1Σi=0M-1|t:0≤t<n,ut=i,b(ut)=j}|log|{t:0≤t<n,b(ut)=j}||{t:0≤t<n,ut=i,b(ut)=j}|]]>量r(un|b(un))被稱為給定b(un)下的un的條件經(jīng)驗(yàn)熵。希望的信息量定義如下rk*(un)=rk(b(un))+r(un|b(un))]]>其中,rk(b(un))是b(un)的第k階經(jīng)驗(yàn)熵。不難表明rk(un)≤rk*(un)+O(lognn)]]>因此,由于(2.6),Lempel-Ziv代碼字長度函數(shù)lLZ的上限為1nlLZ(un)≤rk*(un)+O(loglognlogn)---(5.14)]]>代替使受失真限制rk(un)的最小化,現(xiàn)在使在VRTCQ2中受失真限制的rk*(un)最小化。與nrk(un)是所有k階靜態(tài)算術(shù)代碼字長度函數(shù)LWk所提供的最小代碼字長度的事實(shí)類似,nrk*(un)也與代碼字長度函數(shù)相關(guān)。設(shè)定WS(s|sk)是從M′setk至M′set的概率變換函數(shù),WU(u|s)是從M′set至Mset的概率變換函數(shù)。對于任意un=(u0,u1,...,un-1)∈Msetn,]]>使LWsWU(un)=-Σt=0n-1[logWS(b(ut)|b(ut-1)...b(ut-k))+logWU(ut|b(ut))]---(5.15)]]>很容易看出,LWSWU是與無損代碼相對應(yīng)的代碼字長度函數(shù),其中首先使用具有變換概率Ws的第k階靜態(tài)算術(shù)代碼來編碼b(un),然后在給定b(un)下有條件地編碼un,從而通過無損代碼編碼un。此外,不難以表明nrk*(un)=minWS,WULWSWU(un)+O(logn)]]>因此,給定映射b,VRTCQ2中的聯(lián)合優(yōu)化問題變?yōu)閙ing,WS,WUminun∈Msetn[n-1LWSWU(un)+λn-1d(xn,g(un))]---(5.16)]]>為了明確,設(shè)定k=1。然而,下面的所有論據(jù)和過程也適用于一般的k。給定g、Ws和Wu,則可以由復(fù)雜度為O(nM′2)而不是O(nM2)的維特比算法來解決(5.16)中的內(nèi)部最小化。為了表明的確如此,注意,由于(5.15),每次t增加時,代價增加-logWS(b(ut)|b(ut-1))-logWU(ut|b(ut))+λd(xt,g(ut))(5.17)在(5.17)中,僅第一項(xiàng)取決于通過(past through)b(ut-1)。因此,可以構(gòu)建具有狀態(tài)集SM′set和兩個連續(xù)階段的狀態(tài)之間的完全連接的隔柵,然后對隔柵執(zhí)行維特比算法,以解決內(nèi)部最小化問題。在執(zhí)行維特比算法之前,計(jì)算最小的子代價c(s,x)Δ‾minu∈{i:0≤i<M,b(i)=s[-logWU(u|s)+λd(x,g(u))]]]>對于每個(s,x)組合,其中s∈M′set和x∈O。將(s,x)對的最小子代價和實(shí)現(xiàn)最小子代價的相應(yīng)顏色索引u保存在查找表中。從隔柵的階段t-1處的狀態(tài)st-1∈M′set變換到隔柵的階段t處的狀態(tài)st的代價是-logWS(st|st-1)+c(st,xt)。給定原始圖像xn=(x0,x1,...,xn-1),如果sn=(s0,s1,...,sn-1)∈Mset′n]]>是通過隔柵的最佳路徑,則un=(u0,u1,...,un-1),其中ut∈{i0≤i<M,b(i)=st}實(shí)現(xiàn)了最小代價c(st,xt),其中t=0,1,..,n-1是實(shí)現(xiàn)(5.16)中內(nèi)部最小化的最佳索引序列。
與VRTCQ1類似,VRTCQ2以迭代方式解決了聯(lián)合優(yōu)化問題(5.16)。VRTCQ2的階段1確定映射b,并提供了初始輸出函數(shù)g(0)和變換概率函數(shù)WU(0)和WS(0)。然后VRTCQ2的階段2使用可選過程來解決最小化問題。VRTCQ2的詳細(xì)過程描述如下。
A.階段1的過程步驟1對原始圖像執(zhí)行ECHMQ,以獲得具有M個葉節(jié)點(diǎn)、調(diào)色板大小為M的八叉樹TM以及相應(yīng)的硬判決像素映射。
步驟2根據(jù)TM,重復(fù)ECHMQ的步驟4至7,直到剩下M’個葉節(jié)點(diǎn)為止。
步驟3確定從八叉樹TM至在步驟2中獲得的具有M’個葉節(jié)點(diǎn)的八叉樹TM’的映射b,TM’是TM的子集。具體地,當(dāng)且僅當(dāng)TM的第i個葉節(jié)點(diǎn)位于以TM’的第j個葉節(jié)點(diǎn)為根的TM的子樹中時,b(i)=j(luò),i∈Mset并且j∈M′set。
B.階段2的過程步驟1設(shè)定t=0。從VRTCQ2的階段1獲得b、(un)(0)、(sn)(0)、g(0)、WU(0)和WS(0),其中(un)(0)=(u0(0),u1(0),...,un-1(0))]]>時從硬判決像素映射產(chǎn)生的索引序列,(sn)(0)=(s0(0),s1(0),...,sn-1(0))=b((un)(0),g(0)(u))]]>(0≤u<M)是在階段1的步驟1中獲得的新調(diào)色板中與索引u相對應(yīng)的顏色,WU(0)(u|s)=|{i:ui(0)=u,si(0)=s,0≤i<n}||{i:si=s,0≤i<n}|,u∈Mset,s∈M′set]]>以及WS(0)(α|w)=|{i:si-1=w,si=α,0≤i<n}||{i:si-1=w,0≤i<n}|,α∈M′set,w∈M′set]]>還計(jì)算初始代價J(0)=n-1LWS(0)WU(0)((un)(0))+λn-1d(xn,g(0)((un)(0)))]]>步驟2固定g(t)和W(t)。構(gòu)建查找表。對于每對(s,x),其中s∈M′set和x∈O,計(jì)算最小子代價
c(s,x)=minu∈{i:0≤i<M,b(i)=s}[-logWU(t)v(u|s)+λd(x,g(t)(u))]]]>并且記錄實(shí)現(xiàn)c(t)(s,x)的顏色索引u∈{i0≤i<M,b(i)=s}。
步驟3固定g(t)、WU(t)和WS(t)。使用維特比算法來找到通過隔柵的最佳路徑(sn)(i+1)=(s0(i+1),s1(i+1),...sn-1(i+1)),]]>其與b以及查找表一起確定了由g(t)代替g、由WU(t)代替WU和由WS(t)代替WS的(5.16)中的內(nèi)部最小化的最佳索引序列(un)(i+1)=(u0(i+1),u1(i+1),...,un-1(i+1)).]]>步驟4固定(un)(t+1)和(sn)(t+1)。這兩個序列使得變換概率函數(shù)和輸出函數(shù)更新如下WU(i+1)(u,s)=|{i:ui(i+1)=u,si(i+1)=s,0≤i<n|{i:si(i+1)=w,0≤i<n}|,u∈Mset,s∈M′set,]]>WS(i+1)(α|w)=|{i:si-1(i+1)=w,si(i+1)=α,0≤i<n}||{i:wt-1(i+1)=w,0≤i<n}|,α∈M′,w∈M′]]>以及g(t+1)(u)=Σuxi|{i:ui(t+1)=u,0≤i<n}|,u∈M]]>其中,對ui(t+1)=u]]>的所有i求和∑u。
步驟5計(jì)算更新代價Jt+1=n-1LWX(t+1)WU(t+1)((un)(t+1))+λn-1d(xn,g(t+1)((un)(t+1)))].]]>步驟6對于t=0,1,2,...重復(fù)步驟2至5,直到J(t)-Jt+1≤ξ為止,其中ξ是預(yù)定閾值。
然后輸出g(t+1)和(un)(t+1)。
步驟7使用[17]中的PNG編碼器對調(diào)色板g(t+1)和索引序列(un)(t+1)進(jìn)行編碼。
圖4的圖示出了步驟3中使用的維特比算法。在圖中,每個圓圈代表一組,圓圈中的黑點(diǎn)代表組中的所有顏色索引u∈Mset。
與VRTCQ1類似,VRTCQ2的主要計(jì)算復(fù)雜度仍然在其階段2。盡管與VRTCQ1的階段2相比,VRTCQ2的階段2具有額外的步驟,即步驟2,但是該步驟并不是計(jì)算量密集的。實(shí)際上,其計(jì)算復(fù)雜度是O(NM),不取決于原始圖像的大小n,并因此當(dāng)n較大時,與維特比算法的復(fù)雜度相比可以忽略。VRTCQ2的階段2的步驟3中的維特比算法現(xiàn)在具有O(nM′2)的計(jì)算復(fù)雜度,與VRTCQ1中使用的維特比算法的O(nM2)的計(jì)算復(fù)雜度相比是有利的。因此,當(dāng)M′<<M時,VRTCQ2遠(yuǎn)比VRTCQ1快。此外,一旦固定M′,則VRTCQ2的計(jì)算復(fù)雜度就不再依賴于M。這使得對于顏色豐富的圖像而言,VRTCQ2更具吸引力。VRTCQ2的代價是由于使用寬松邊界來限制Lempel-Ziv代碼字長度函數(shù)的上界,所以在壓縮率和失真之間的平衡方面,壓縮性能稍有損失。
參考圖5,示出了圖1的計(jì)算機(jī)系統(tǒng)10的CPU 16的方框圖。如圖所示,CPU 16包括硬判決模塊40和軟判決模塊42。硬判決模塊40提供了如上所述的ECHMQ。軟判決模塊42提供了如上所述的VRTCQ1和VRTCQ2。
如上所述,硬判決模塊40包括節(jié)點(diǎn)創(chuàng)建子模塊,用于構(gòu)建八叉樹;節(jié)點(diǎn)合并子模塊,用于選擇和合并葉節(jié)點(diǎn);以及代價計(jì)算子模塊,用于對于葉節(jié)點(diǎn)對的可能的合并,計(jì)算每個這種合并的熵限制代價增量。與硬判決模塊40類似,軟判決模塊42包括代價計(jì)算子模塊,用于確定在軟判決模塊42的每次軟判決迭代之后代價的增量減小。
本發(fā)明的其它變化和修改也是可以的。例如,如上所述,ECHMQ可以獨(dú)自使用,而不使用VRTCQ來進(jìn)行其它的軟判決優(yōu)化,以提供硬判決像素映射??蛇x地,可以使用VRTCQ,而不使用ECHMQ來提供初始硬判決像素映射。但是,也可以提供一些其它的初始硬判決過程。此外,代替VRTCQ,其它的軟判決優(yōu)化方法可以結(jié)合ECHMQ一起使用。此外,盡管以上描述主要涉及怎樣在保持較低計(jì)算復(fù)雜度和與如GIF/PNG解碼器等的標(biāo)準(zhǔn)解碼器兼容的同時、聯(lián)合地解決量化失真和壓縮率,對于本領(lǐng)域技術(shù)人員顯而易見的是,在其它上下文中,ECHMQ和VRTCQ也可以應(yīng)用于彩色圖像數(shù)據(jù)的壓縮。所有這種修改或變化被認(rèn)為處于所附權(quán)利要求所限定的本發(fā)明的界限和范圍內(nèi)。
權(quán)利要求
1.一種方法,用于使用數(shù)據(jù)處理系統(tǒng),從具有N個不同顏色的數(shù)字化彩色圖像中創(chuàng)建數(shù)字化彩色圖像中所有像素到M個不相交簇的樹結(jié)構(gòu)劃分,其中,M小于或等于N,N個不同顏色中的每個顏色由調(diào)色板中的多個P比特字節(jié)數(shù)字地表示,并且每個P比特字節(jié)中的P比特是從最高有效到最低有效排列的,該方法包括(a)提供包括所有N個不同顏色的根節(jié)點(diǎn);(b)提供與根節(jié)點(diǎn)相連的第一級兄弟節(jié)點(diǎn),其中,由數(shù)據(jù)處理系統(tǒng)根據(jù)所述多個P比特字節(jié)中的每個P比特字節(jié)的第一比特的值,將N個不同顏色中的每個顏色分配給第一級兄弟節(jié)點(diǎn)中的相關(guān)節(jié)點(diǎn);(c)對于包括多于一種顏色的第k級節(jié)點(diǎn)中的每個節(jié)點(diǎn),在第k+1級處提供多個兄弟節(jié)點(diǎn),其中由數(shù)據(jù)處理系統(tǒng)根據(jù)該顏色的所述多個P比特字節(jié)中的每個P比特字節(jié)的第k+1比特的值,將該節(jié)點(diǎn)中的每個顏色分配給第k+1級多個兄弟節(jié)點(diǎn)中的相關(guān)兄弟節(jié)點(diǎn),使得對于N個不同顏色中的每種顏色,存在只包含該顏色的不同葉節(jié)點(diǎn);以及(d)選擇并合并葉節(jié)點(diǎn),直到僅剩下M個葉節(jié)點(diǎn)為止。
2.根據(jù)權(quán)利要求1所述的方法,其中,步驟(d)包括重復(fù)選擇和合并葉兄弟節(jié)點(diǎn)對,直到僅剩下M個葉節(jié)點(diǎn)為止。
3.根據(jù)權(quán)利要求1所述的方法,其中,步驟(d)包括重復(fù)選擇和合并合并具有最小熵限制代價增量的葉兄弟節(jié)點(diǎn)對,直到僅剩下M個葉節(jié)點(diǎn)為止。
4.根據(jù)權(quán)利要求3所述的方法,其中,步驟(d)包括計(jì)算最小熵限制代價增量,而不計(jì)算合并前總熵限制代價和合并后總熵限制代價之間的差值。
5.根據(jù)權(quán)利要求1所述的方法,其中,N個不同顏色中每個顏色的多個P比特字節(jié)包括多個基色中每個基色的P比特字節(jié)。
6.根據(jù)權(quán)利要求3所述的方法,其中,多個基色包括紅、綠和藍(lán)。
7.根據(jù)權(quán)利要求1所述的方法,還包括創(chuàng)建具有M個不同顏色的新數(shù)字化彩色圖像,其中在M個不同顏色和完成步驟(d)之后剩下的M個葉節(jié)點(diǎn)之間存在一對一的對應(yīng)。
8.一種數(shù)據(jù)處理系統(tǒng),用于從具有N個不同顏色的數(shù)字化彩色圖像中創(chuàng)建數(shù)字化彩色圖像中所有顏色到M個不相交簇的樹結(jié)構(gòu)劃分,其中,M小于或等于N,N個不同顏色中的每個顏色由調(diào)色板中的多個P比特字節(jié)數(shù)字地表示,并且每個P比特字節(jié)中的P比特是從最高有效到最低有效排列的,該數(shù)據(jù)處理系統(tǒng)包括(a)節(jié)點(diǎn)創(chuàng)建裝置,用于(i)提供包括所有N個不同顏色的根節(jié)點(diǎn);(ii)提供與根節(jié)點(diǎn)相連的第一級兄弟節(jié)點(diǎn),其中根據(jù)所述多個P比特字節(jié)中的每個P比特字節(jié)的第一比特的值,將N個不同顏色中的每個顏色分配給第一級兄弟節(jié)點(diǎn)中的相關(guān)節(jié)點(diǎn);以及(iii)對于包括多于一種顏色的第k級節(jié)點(diǎn)中的每個節(jié)點(diǎn),在第k+1級處提供多個兄弟節(jié)點(diǎn),其中根據(jù)該顏色的所述多個P比特字節(jié)中的每個P比特字節(jié)的第k+1比特的值,將該節(jié)點(diǎn)中的每個顏色分配給第k+1級多個兄弟節(jié)點(diǎn)中的相關(guān)兄弟節(jié)點(diǎn),使得對于N個不同顏色中的每個顏色,存在只包含該顏色的獨(dú)立葉節(jié)點(diǎn);以及(b)節(jié)點(diǎn)合并裝置,用于選擇并合并葉節(jié)點(diǎn),直到僅剩下M個葉節(jié)點(diǎn)為止。
9.根據(jù)權(quán)利要求8所述的數(shù)據(jù)處理系統(tǒng),其中,節(jié)點(diǎn)合并裝置操作用于重復(fù)地選擇和合并葉兄弟節(jié)點(diǎn)對,直到僅剩下M個葉節(jié)點(diǎn)為止。
10.根據(jù)權(quán)利要求8所述的數(shù)據(jù)處理系統(tǒng),還包括代價計(jì)算裝置,用于對于葉節(jié)點(diǎn)對的可能合并,計(jì)算每個這種合并的熵限制代價增量,其中,代價計(jì)算裝置與節(jié)點(diǎn)合并裝置相鏈接,并且節(jié)點(diǎn)合并裝置操作用于重復(fù)地選擇和合并由代價計(jì)算裝置確定其合并具有最小熵限制代價增量的葉兄弟節(jié)點(diǎn)對,直到僅剩下M個葉節(jié)點(diǎn)為止。
11.根據(jù)權(quán)利要求10所述的數(shù)據(jù)處理系統(tǒng),其中,代價計(jì)算裝置操作用于計(jì)算最小熵限制代價增量,而不計(jì)算合并前總熵限制代價和合并后總熵限制代價之間的差值。
12.根據(jù)權(quán)利要求8所述的數(shù)據(jù)處理系統(tǒng),其中,N個不同顏色中每個顏色的多個P比特字節(jié)包括多個基色中每個基色的P比特字節(jié)。
13.根據(jù)權(quán)利要求10所述的數(shù)據(jù)處理系統(tǒng),其中,多個基色包括紅、綠和藍(lán)。
14.根據(jù)權(quán)利要求8所述的數(shù)據(jù)處理系統(tǒng),還包括創(chuàng)建具有M個不同顏色的新數(shù)字化彩色圖像,其中在M個不同顏色和完成步驟(d)之后剩下的M個葉節(jié)點(diǎn)之間存在一對一的對應(yīng)。
15.一種在計(jì)算機(jī)系統(tǒng)上使用的計(jì)算機(jī)程序產(chǎn)品,用于從具有N個不同顏色的數(shù)字化彩色圖像中創(chuàng)建數(shù)字化彩色圖像中所有像素到M個不相交簇的樹結(jié)構(gòu)劃分,其中,M小于或等于N,N個不同顏色中的每個顏色由調(diào)色板中的多個P比特字節(jié)數(shù)字地表示,并且每個P比特字節(jié)中的P比特是從最高有效到最低有效排列的,該計(jì)算機(jī)程序產(chǎn)品包括記錄介質(zhì);記錄在介質(zhì)上的裝置,用于指示計(jì)算機(jī)系統(tǒng)執(zhí)行以下步驟(a)提供包括所有N個不同顏色的根節(jié)點(diǎn);(b)提供與根節(jié)點(diǎn)相連的第一級兄弟節(jié)點(diǎn),其中由數(shù)據(jù)處理系統(tǒng)根據(jù)所述多個P比特字節(jié)中的每個P比特字節(jié)的第一比特的值,將N個不同顏色中的每個顏色分配給第一級兄弟節(jié)點(diǎn)中的相關(guān)節(jié)點(diǎn);(c)對于包括多于一種顏色的第k級節(jié)點(diǎn)中的每個節(jié)點(diǎn),在第k+1級處提供多個兄弟節(jié)點(diǎn),其中由數(shù)據(jù)處理系統(tǒng)根據(jù)該顏色的所述多個P比特字節(jié)中的每個P比特字節(jié)的第k+1比特的值,將該節(jié)點(diǎn)中的每個顏色分配給第k+1級多個兄弟節(jié)點(diǎn)中的相關(guān)兄弟節(jié)點(diǎn),使得對于N個不同顏色中的每個顏色,存在只包含該顏色的獨(dú)立葉節(jié)點(diǎn);以及(d)選擇并合并葉節(jié)點(diǎn),直到僅剩下M個葉節(jié)點(diǎn)為止。
16.根據(jù)權(quán)利要求15所述的計(jì)算機(jī)程序產(chǎn)品,其中,步驟(d)包括重復(fù)選擇和合并葉兄弟節(jié)點(diǎn)對,直到僅剩下M個葉節(jié)點(diǎn)為止。
17.根據(jù)權(quán)利要求15所述的計(jì)算機(jī)程序產(chǎn)品,其中,步驟(d)包括重復(fù)選擇和合并合并具有最小熵限制代價增量的葉兄弟節(jié)點(diǎn)對,直到僅剩下M個葉節(jié)點(diǎn)為止。
18.根據(jù)權(quán)利要求15所述的計(jì)算機(jī)程序產(chǎn)品,其中,步驟(d)包括計(jì)算最小熵限制代價增量,而不計(jì)算合并前總熵限制代價和合并后總熵限制代價之間的差值。
19.根據(jù)權(quán)利要求15所述的計(jì)算機(jī)程序產(chǎn)品,其中,N個不同顏色中每個顏色的多個P比特字節(jié)包括多個基色中每個基色的P比特字節(jié)。
20.根據(jù)權(quán)利要求15所述的計(jì)算機(jī)程序產(chǎn)品,其中,多個基色包括紅、綠和藍(lán)。
21.根據(jù)權(quán)利要求15所述的計(jì)算機(jī)程序產(chǎn)品,還包括創(chuàng)建具有M個不同顏色的新數(shù)字化彩色圖像,其中在M個不同顏色和完成步驟(d)之后剩下的M個葉節(jié)點(diǎn)之間存在一對一的對應(yīng)。
22.一種方法,用于針對從原始數(shù)字化彩色圖像中推導(dǎo)出的新數(shù)字化彩色圖像,推導(dǎo)出表示像素映射的新索引序列和表示調(diào)色板的新輸出函數(shù),其中原始和新的數(shù)字化彩色圖像兩者都定義在n個像素上,其中,原始數(shù)字化彩色圖像由分配給n個像素的N個不同顏色提供,新數(shù)字化彩色圖像由分配給n個像素的M個不同顏色提供,新索引序列具有表示n個像素的n個索引組分,新輸出函數(shù)用于將n個索引組分映射至M種顏色,該方法包括(a)根據(jù)原始數(shù)字化彩色圖像中的每個像素的顏色,通過將原始數(shù)字化彩色圖像中的所有像素劃分為M個不相交簇,來提供第一新索引序列,與像素在原始數(shù)字化彩色圖像中的位置無關(guān),其中,M小于或等于N;(b)提供第一新輸出函數(shù),用于將M個不同顏色一對一地映射至M個不相交簇中的像素;(c)對于第一新索引序列的每個組分,分別根據(jù)由第一新輸出函數(shù)分配給該組分的顏色值與由第一新輸出函數(shù)分配給第一新索引序列的至少一個其它組分的顏色值的相關(guān)程度,來對第一新索引序列和第一新輸出函數(shù)應(yīng)用軟判決優(yōu)化過程,以提供新的索引序列和新的輸出函數(shù)。
23.根據(jù)權(quán)利要求22所述的方法,其中,新索引序列提供軟判決像素映射,使得對于新數(shù)字化彩色圖像中的每個像素,由新索引序列和新輸出函數(shù)分配給像素的顏色值取決于像素在彩色圖像中的位置。
24.根據(jù)權(quán)利要求22所述的方法,其中步驟(c)包括應(yīng)用迭代軟判決優(yōu)化過程,并在每次迭代之后,確定代表原始數(shù)字化彩色圖像的壓縮和失真的代價函數(shù)中的增量減小,以及當(dāng)增量減小降到選定的閾值以下時,步驟(c)終止,確定了新索引序列和新顏色映射。
25.根據(jù)權(quán)利要求24所述的方法,其中,步驟(c)包括(i)設(shè)定計(jì)數(shù)器k等于1(ii)對于第k個索引序列,通過對于所有可能的索引序列,優(yōu)化第k個輸出函數(shù)和第k個變換概率函數(shù)的代價函數(shù),來確定第(k+1)個索引序列;(iii)根據(jù)第(k+1)個索引序列,確定第(k+1)個輸出函數(shù)和第(k+1)個變換概率函數(shù);(iv)根據(jù)第(k+1)個索引序列、第(k+1)個輸出函數(shù)和第(k+1)個變換概率函數(shù),確定第(k+1)個代價;以及(v)計(jì)算第(k+1)個代價和第k個代價之間的第(k+1)個代價差值,當(dāng)?shù)?k+1)個代價差值小于選定的閾值時,分別選擇第(k+1)個索引速率和第(k+1)個輸出函數(shù)作為新的索引序列和新的輸出函數(shù),否則,使k增加1,并重復(fù)子步驟(ii)至(v)。
26.根據(jù)權(quán)利要求25所述的方法,其中,步驟(ii),即針對所有可能的索引序列,通過優(yōu)化給定的第k個輸出函數(shù)和第k個變換概率函數(shù)的代價函數(shù)來確定第(k+1)個索引序列的步驟,包括使用維特比算法。
27.根據(jù)權(quán)利要求26所述的方法,其中,步驟(a)包括將M個不相交簇分組為M’個不相交簇,其中M’小于M;以及步驟(c)包括將軟判決優(yōu)化過程應(yīng)用于M’個不相交簇。
28.根據(jù)權(quán)利要求27所述的方法,其中,代價函數(shù)取決于M和M’。
29.一種數(shù)據(jù)處理系統(tǒng),用于針對從原始數(shù)字化彩色圖像中推導(dǎo)出的新數(shù)字化彩色圖像,推導(dǎo)出表示像素映射的新索引序列和表示調(diào)色板的新輸出函數(shù),其中原始和新的數(shù)字化彩色圖像兩者都定義在n個像素上,其中,原始數(shù)字化彩色圖像由分配給n個像素的N個不同顏色提供,新數(shù)字化彩色圖像由分配給n個像素的M個不同顏色提供,新索引序列具有表示n個像素的n個索引組分,新輸出函數(shù)用于將n個索引組分映射至M種顏色,該數(shù)據(jù)處理系統(tǒng)包括(a)硬判決模塊,用于(i)根據(jù)原始數(shù)字化彩色圖像中的每個像素的顏色,通過將原始數(shù)字化彩色圖像中的所有像素劃分為M個不相交簇,來提供第一新索引序列,與像素在原始數(shù)字化彩色圖像中的位置無關(guān),其中,M小于或等于N;以及(ii)提供第一新輸出函數(shù),用于將M個不同顏色一對一地映射至M個不相交簇中的像素;以及(b)軟判決模塊,用于對于第一新索引序列的每個組分,分別根據(jù)由第一新輸出函數(shù)分配給該組分的顏色值與由第一新輸出函數(shù)分配給第一新索引序列的至少一個其它組分的顏色值的相關(guān)程度,來對第一新索引序列和第一新輸出函數(shù)應(yīng)用軟判決優(yōu)化過程,以提供新的索引序列和新的輸出函數(shù)。
30.根據(jù)權(quán)利要求29所述的數(shù)據(jù)處理系統(tǒng),其中,新索引序列提供軟判決像素映射,使得對于新數(shù)字化彩色圖像中的每個像素,由新索引序列和新輸出函數(shù)分配給像素的顏色值取決于像素在彩色圖像中的位置。
31.根據(jù)權(quán)利要求29所述的數(shù)據(jù)處理系統(tǒng),其中,軟判決模塊操作用于(i)應(yīng)用迭代軟判決優(yōu)化過程,(ii)在每次迭代之后,確定代表原始數(shù)字化彩色圖像的壓縮和失真的代價函數(shù)中的增量減小,以及(iii)當(dāng)增量減小降到選定的閾值以下時,終止迭代軟判決優(yōu)化過程,并確定新索引序列和新顏色映射。
32.根據(jù)權(quán)利要求31所述的數(shù)據(jù)處理系統(tǒng),其中,迭代軟判決優(yōu)化過程包括(i)設(shè)定計(jì)數(shù)器k等于1(ii)對于第k個索引序列,通過對于所有可能的索引序列,優(yōu)化第k個輸出函數(shù)和第k個變換概率函數(shù)的代價函數(shù),來確定第(k+1)個索引序列;(iii)根據(jù)第(k+1)個索引序列,確定第(k+1)個輸出函數(shù)和第(k+1)個變換概率函數(shù);(iv)根據(jù)第(k+1)個索引序列、第(k+1)個輸出函數(shù)和第(k+1)個變換概率函數(shù),確定第(k+1)個代價;以及(v)計(jì)算第(k+1)個代價和第k個代價之間的第(k+1)個代價差值,當(dāng)?shù)?k+1)個代價差值小于選定的閾值時,分別選擇第(k+1)個索引速率和第(k+1)個輸出函數(shù)作為新的索引序列和新的輸出函數(shù),否則,使k增加1,并重復(fù)子步驟(ii)至(v)。
33.根據(jù)權(quán)利要求32所述的數(shù)據(jù)處理系統(tǒng),其中,在步驟(ii),即在針對所有可能的索引序列,通過優(yōu)化給定的第k個輸出函數(shù)和第k個變換概率函數(shù)的代價函數(shù)來確定第(k+1)個索引序列的步驟,包括使用維特比算法。
34.根據(jù)權(quán)利要求33所述的數(shù)據(jù)處理系統(tǒng),其中,硬判決模塊操作用于將M個不相交簇分組為M’個不相交簇,其中M’小于M;以及硬判決模塊操作用于將軟判決優(yōu)化過程應(yīng)用于M’個不相交簇。
35.根據(jù)權(quán)利要求34所述的數(shù)據(jù)處理系統(tǒng),其中,代價函數(shù)取決于M和M’。
36.一種在計(jì)算機(jī)系統(tǒng)上使用的計(jì)算機(jī)程序產(chǎn)品,以針對從原始數(shù)字化彩色圖像中推導(dǎo)出的新數(shù)字化彩色圖像,創(chuàng)建像素映射和表示調(diào)色板的新輸出函數(shù),其中原始和新的數(shù)字化彩色圖像兩者都定義在n個像素上,其中,原始數(shù)字化彩色圖像由分配給n個像素的N個不同顏色提供,新數(shù)字化彩色圖像由分配給n個像素的M個不同顏色提供,新索引序列具有表示n個像素的n個索引組分,新輸出函數(shù)用于將n個索引組分映射至M種顏色,該計(jì)算機(jī)程序產(chǎn)品包括記錄介質(zhì);以及記錄在介質(zhì)上的裝置,用于指示計(jì)算機(jī)系統(tǒng)執(zhí)行以下步驟(a)根據(jù)原始數(shù)字化彩色圖像中的每個像素的顏色,通過將原始數(shù)字化彩色圖像中的所有像素劃分為M個不相交簇,來提供第一新索引序列,與像素在原始數(shù)字化彩色圖像中的位置無關(guān),其中,M小于或等于N;(b)提供第一新輸出函數(shù),用于將M個不同顏色一對一地映射至M個不相交簇中的像素;(c)對于第一新索引序列的每個組分,分別根據(jù)由第一新輸出函數(shù)分配給該組分的顏色值與由第一新輸出函數(shù)分配給第一新索引序列的至少一個其它組分的顏色值的相關(guān)程度,來對第一新索引序列和第一新輸出函數(shù)應(yīng)用軟判決優(yōu)化過程,以提供新的索引序列和新的輸出函數(shù)。
37.根據(jù)權(quán)利要求36所述的方法,其中,新索引序列提供軟判決像素映射,使得對于新數(shù)字化彩色圖像中的每個像素,由新索引序列和新輸出函數(shù)分配給像素的顏色值取決于像素在彩色圖像中的位置。
38.根據(jù)權(quán)利要求36所述的方法,其中步驟(c)包括應(yīng)用迭代軟判決優(yōu)化過程,并在每次迭代之后,確定代表原始數(shù)字化彩色圖像的壓縮和失真的代價函數(shù)中的增量減小,以及當(dāng)增量減小降到選定的閾值以下時,步驟(c)終止,確定了新索引序列和新顏色映射。
39.根據(jù)權(quán)利要求38所述的方法,其中,步驟(c)包括(i)設(shè)定計(jì)數(shù)器k等于1(ii)對于第k個索引序列,通過對于所有可能的索引序列,優(yōu)化第k個輸出函數(shù)和第k個變換概率函數(shù)的代價函數(shù),來確定第(k+1)個索引序列;(iii)根據(jù)第(k+1)個索引序列,確定第(k+1)個輸出函數(shù)和第(k+1)個變換概率函數(shù);(iv)根據(jù)第(k+1)個索引序列、第(k+1)個輸出函數(shù)和第(k+1)個變換概率函數(shù),確定第(k+1)個代價;以及(v)計(jì)算第(k+1)個代價和第k個代價之間的第(k+1)個代價差值,當(dāng)?shù)?k+1)個代價差值小于選定的閾值時,分別選擇第(k+1)個索引速率和第(k+1)個輸出函數(shù)作為新的索引序列和新的輸出函數(shù),否則,使k增加1,并重復(fù)子步驟(ii)至(v)。
40.根據(jù)權(quán)利要求39所述的方法,其中,在步驟(ii),即在針對所有可能的索引序列,通過優(yōu)化給定的第k個輸出函數(shù)和第k個變換概率函數(shù)的代價函數(shù)來確定第(k+1)個索引序列的步驟,包括使用維特比算法。
41.根據(jù)權(quán)利要求40所述的方法,其中,步驟(a)包括將M個不相交簇分組為M’個不相交簇,其中M’小于M;以及步驟(c)包括將軟判決優(yōu)化過程應(yīng)用于M’個不相交簇。
全文摘要
本發(fā)明涉及一種彩色圖像數(shù)據(jù)的壓縮。硬判決像素映射和軟判決像素映射的組合用于在保持較低計(jì)算復(fù)雜度和與如GIF/PNG解碼器等的標(biāo)準(zhǔn)解碼器兼容的同時,聯(lián)合地解決量化失真和壓縮率的問題。
文檔編號G06T9/40GK101065779SQ200580012655
公開日2007年10月31日 申請日期2005年4月15日 優(yōu)先權(quán)日2004年4月21日
發(fā)明者楊恩輝, 曾劍分 申請人:噴流數(shù)據(jù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
洛扎县| 云霄县| 慈利县| 溆浦县| 湘阴县| 中卫市| 高淳县| 井陉县| 安阳县| 平南县| 平塘县| 油尖旺区| 南宫市| 惠东县| 通州市| 班戈县| 和平县| 宣武区| 邵阳市| 清徐县| 扎兰屯市| 栾川县| 崇礼县| 乌鲁木齐市| 墨竹工卡县| 景洪市| 广饶县| 河西区| 旬邑县| 新平| 张北县| 卢湾区| 出国| 西畴县| 清原| 比如县| 墨竹工卡县| 磐石市| 安化县| 仙桃市| 惠安县|