專利名稱:數(shù)字圖像中圓形感興趣區(qū)域及其壓縮算法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明提出了數(shù)字圖像中圓形感興趣區(qū)域及其壓縮算法,更好地解決了壓縮比和重建圖像質(zhì)量之間的矛盾,可以應(yīng)用于圖像交互處理、遠程醫(yī)療、遠程教育、遠程測量,空間探索中出現(xiàn)的許多與圖像處理有關(guān)的方面。
背景技術(shù):
JPEG2000標準定義了兩種感興趣區(qū)域(Region of Interest,ROI)技術(shù)[1]最大位移法和一般位移法。在一般位移法當中,與感興趣區(qū)域有關(guān)的系數(shù)被提升至較高的位平面上(MSB),而與背景區(qū)域有關(guān)的系數(shù)則處于較低的位平面上,在對圖像編解碼時,對系數(shù)的掃描總是從最重要的比特平面到最不重要的比特平面逐步進行的,感興趣區(qū)域就會優(yōu)先于背景區(qū)域編解碼。所以,可以對圖像中感興趣的區(qū)域,采用低壓縮比的壓縮,甚至無損壓縮,以獲得比較好的圖像質(zhì)量;而對于背景圖像,則仍采用高壓縮比,圖像質(zhì)量相對較差的有損壓縮。這樣就很好地解決了壓縮比和重建圖像質(zhì)量之間的矛盾。
在一般位移法的實現(xiàn)中,需要定義一個感興趣區(qū)域掩碼來指明小波變換后各個子帶中哪些系數(shù)是ROI系數(shù),對于非規(guī)則形狀的ROI區(qū)域,其掩碼的計算是相當復(fù)雜的,并且編解碼時要表示形狀信息也很復(fù)雜。矩形感興趣區(qū)域一直是研究者們的關(guān)注熱點,因為其表示方式簡單,只需要記錄左上角和右下角兩個點來表示形狀信息,并且可以較方便的計算經(jīng)過小波變換后各子帶中ROI系數(shù)[2][3]。但是人類的視覺通常是以某點為中心,圓形發(fā)散的,或者說,用戶感興趣的區(qū)域更類似于一個圓,用矩形感興趣區(qū)域就不太符合人類的視覺特征。
J.Askelof,M.L.Carlander and C.Christopoulos.Region of interest coding in JPEG2000[J],Signal ProcessingImage Communication,2002(17)105~111[2]陳軍,吳成柯,李云松.基于零樹結(jié)構(gòu)的感興趣區(qū)圖像內(nèi)嵌編碼算法[J].西安電子科技大學學報(自然科學版),2002,29(3)[3]郭武,梅麗,羅建書.一種基于SPIHT的ROI圖像編碼[J].中國空間科學技術(shù),2003,2.
發(fā)明內(nèi)容
針對矩形感興趣區(qū)域不符合人類視覺特征這一不足,本發(fā)明提出了另一種規(guī)則形狀——圓形感興趣區(qū)域的圖像壓縮算法。使用圓形區(qū)域不僅更加符合人類的視覺特征,而且選擇信息更靈活。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是對提出的圓形感興趣區(qū)域,推導(dǎo)出相應(yīng)的掩碼計算公式,將SPIHT(Set Partitioning in Hierarchical Trees)算法加以改進,得到適用于圓形感興趣區(qū)域的圖像壓縮算法。
圓形ROI掩碼計算公式的具體實現(xiàn)可設(shè)原始圖像的感興趣區(qū)域圓心和圓上任一點的坐標表示分別為(x1,y1)和(x2,y2),這時要判斷任意一個點是否在感興趣區(qū)域內(nèi)就需要計算這個點到圓心的距離了,如果距離小于圓的半徑,則說明這個點也在感興趣區(qū)域內(nèi),如果大于,則該點位于背景區(qū)域。設(shè)要進行壓縮的圖像寬為Width,高為Height,這里我們先計算出最低頻子帶的寬和高,分別記為nLLWidth,nLLHeight。由小波變換次數(shù)m可得nLLWidth=Width/2mnLLHeight=Height/2m]]>
由于添加的是圓形區(qū)域,我們考慮圓的性質(zhì)來計算出小波系數(shù)的感興趣區(qū)域。我們已知圓心(x1,y1)和圓上的任意一點(x2,y2)可以計算出在原圖上添加的圓的半徑為RadiusOrigin=(x1-x2)2+(y1-y2)2]]>因此在最低頻子帶LL中x1,LL=x1/2m圓心y1,LL=y(tǒng)1/2m半徑RadiusLL=Radiusorigin/2m通過判斷最低頻子帶內(nèi)像素點到圓心距離可得出最低頻的小波系數(shù)的ROI的值。
對于HL子帶,我們可以得到x1,HL=x1/2m+nLLWidth圓心y1,HL=y(tǒng)1/2m半徑RadiusHL=Radiusorigin/2m由HLN,HLN-1,K,HL1的相似性,可知,HL子帶的其他高頻區(qū)域的ROI可由x1,HL,y1,HL左移一位及半徑增加一倍再計算該頻段像素與圓心距離比較得出。
同理,對于LH子帶,我們可以得到x1,LH=x1/2m圓心y1,LH=y(tǒng)1/2m+nLLHeight半徑RadiusHL=Radiusorigin/2m由LHN,LHN-1,K,LH1的相似性,可知,LH子帶的其他高頻區(qū)域的ROI可由x1,LH,y1,LH左移一位及半徑增加一倍再計算該頻段像素與圓心距離比較得出。
對于HH子帶,我們同樣可得出公式x1,HH=x1/2m+nLLWidth圓心y1,HH=y(tǒng)1/2m+nLLHeight半徑RadiusHH=Radiusorigin/2m由HHN,HHN-1,K,HH1的相似性,可知,HH子帶的其他高頻區(qū)域的ROI可由x1,HH,y1,HH左移一位及半徑增加一倍再計算該頻段像素與圓心距離比較得出。
在加入圓形感興趣區(qū)域后,本發(fā)明提出了基于SPIHT的圓形感興趣區(qū)域圖像壓縮算法,其過程如下首先說明一下下面算法中用到的各記號的意義。對于位置[i,j]的給定系數(shù),設(shè)C[i,j]為它的孩子集合,D[i,j]為它的后代集合,G[i,j]為它的孫子,曾孫子等的集合(即G[i,j]=D[i,j]-C[i,j])。設(shè)Sk(·)為從任意一個系數(shù)集合到{0,1}的映射。確切地說,如果β是一個系數(shù)集合,如果β中每個系數(shù)有qk=0,則Sk(β)=0。否則β中至少有一個系數(shù)qk=1,Sk(β)=1。s[i,j]表示位置[i,j]值的符號。
則算法可描述如下1)小波變換m次。
2)找到小波變換后小波系數(shù)最大值,并計算其用二進制表示的位數(shù)s。s=log2(max)|Mcof|,Mcof表示小波系數(shù),·表示向下取整。
3)判斷用戶是否添加了感興趣的區(qū)域,如果是,設(shè)定小波提升位數(shù)為N(N≤S),并將N值寫入編碼流,轉(zhuǎn)(4),否則轉(zhuǎn)(6)。
4)對選擇的圓形區(qū)域,按圓形感興趣區(qū)域掩碼計算方法找到小波變換后的感興趣區(qū)域,并進行小波提升,同時將確定感興趣區(qū)域的兩個點寫入碼流。
5)是否還有感興趣區(qū)域未經(jīng)小波提升,如果是,轉(zhuǎn)(4),否則轉(zhuǎn)(6)。
6)計算新的小波系數(shù)最大值(未添加感興趣區(qū)域則不重新計算),并設(shè)置SPIHT掃描的初始閾值 。將小波變換次數(shù)m,圖像寬Width、高Height及初始閾值T0寫入碼流。
7)初始化LSC,LlC和LIS三個表。將LSC表設(shè)為空,LlC={LLn中系數(shù)的所有坐標[i,j]),LIS={LIC中有孩子的系數(shù)的所有坐標},將LIS中的所有項設(shè)為類型A。
8)顯著性過程(Significance Pass)(a)對每個[i,j]∈LIC,輸出qk[i,j]。如果qk[i,j]=1,輸出s[i,j]并將[i,j]移至LSC末尾;(b)對LIS中的每個[i,j],· 如果集合屬于類型A,輸出Sk(D[i,j])。如果Sk(D[i,j])=1,則對每個[l,m]∈C[i,j],輸出qk[l,m]。如果qk[l,m]=0,將[l,m]加到LIC中。否則,輸出s[l,m],將[l,m]加到LSC中。如果G[i,j]≠φ,將[i,j]移動到LIS末尾,作為類型B的集合。否則,從LIS中刪除[i,j]· 如果集合屬于類型B,輸出Sk(G[i,j])。如果Sk(G[i,j]0=1,則將每個[l,m]∈C[i,j]加到LIS末尾(作為類型A的集合)并從LIS中刪除[i,j]。
9)改進過程(Refinement Pass)對每個[i,j]∈LSC,輸出qk[i,j]。對這一步,應(yīng)該采用最近的顯著性過程前的LSC。也就是說,在最近的顯著性過程中加到LSC中的系數(shù)不應(yīng)該改進。
10)設(shè)當前量化閾值T0,即T0=T0/2。轉(zhuǎn)(8)。
在編碼過程中,如已達到指定的比特率或給定的掃描終止閾信則終止編碼討程。
該圖是基于SPIHT的圓形感興趣區(qū)域圖像壓縮算法。
當圖像經(jīng)m次小波變化后,可以得到變換后小波系數(shù)最大值;當用戶添加了感興趣的區(qū)域后,設(shè)定小波提升位數(shù)為N(N≤S),并將N值寫入編碼流;然后按圓形感興趣區(qū)域掩碼計算方法找到小波變換后的感興趣區(qū)域,并進行小波提升,同時將確定感興趣區(qū)域的兩個點寫入碼流;重新計算小波系數(shù)的最大值,并將小波變換次數(shù),圖像寬、高及初始閾值寫入碼流;初始化LSC,LIC和LIS三個表,接著進行顯著性過程和改進過程。
具體實施例方式
按照上述算法設(shè)計軟件,實現(xiàn)本發(fā)明提出的基于圓形感興趣區(qū)域的圖像壓縮。
權(quán)利要求
1.圓形感興趣區(qū)域圖像壓縮,該興趣區(qū)域包括了一些重要的或備受關(guān)注的信息,在圖像壓縮中,對這部分信息需要進行低壓縮比壓縮甚至無損壓縮,其特征是圓形感興趣區(qū)域更符合人類的視覺系統(tǒng),結(jié)合常用的矩形感興趣區(qū)域能獲得更好的壓縮效果。
2.根據(jù)權(quán)利要求1所述的圓形感興趣區(qū)域,推導(dǎo)出了相應(yīng)的掩碼計算公式,其特征是通過研究小波變換后小波系數(shù)分布的特點,提出用像素位置與圓心計算距離來判斷是否屬于ROI。
3.根據(jù)權(quán)利要求1所述的圓形感興趣區(qū)域圖像壓縮,得到了適用于圓形感興趣區(qū)域的圖像壓縮算法,其特征是利用權(quán)利要求2中的圓形感興趣區(qū)域的掩碼公式進行計算。
全文摘要
該發(fā)明為數(shù)字圖像中圓形感興趣區(qū)域及其壓縮算法,屬于計算機科學技術(shù)領(lǐng)域。在圖像壓縮過程中,需要對圖像中感興趣的區(qū)域,采用低壓縮比的壓縮,甚至無損壓縮,以獲得比較好的圖像質(zhì)量。針對常用的矩形感興趣區(qū)域,本發(fā)明從人類視覺系統(tǒng)通常以某點為中心,圓形發(fā)散這一特點入手,提出了另一規(guī)則形狀——圓形感興趣區(qū)域,并研究出了圓形感興趣區(qū)域的壓縮算法。對提出的圓形感興趣區(qū)域,推導(dǎo)出了與其相應(yīng)的掩碼計算公式,將SPIHT(Set Partitioning in HierarchicalTrees)算法加以改進,得到了適用于圓形感興趣區(qū)域的圖像壓縮算法?;趫A形感興趣區(qū)域圖像壓縮技術(shù)可以更好地解決壓縮比和重建圖像質(zhì)量之間的矛盾。
文檔編號H04N7/26GK101093583SQ20061008661
公開日2007年12月26日 申請日期2006年6月23日 優(yōu)先權(quán)日2006年6月23日
發(fā)明者郝紅衛(wèi), 石雅姍 申請人:郝紅衛(wèi), 石雅姍