專利名稱:基于稀疏表示模型的圖像解碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像解碼方法,特別涉及一種基于壓縮感知的圖像解碼方法。
背景技術(shù):
近年來,圖像壓縮編碼技術(shù)取得了長足進(jìn)展,涌現(xiàn)出許多圖像編碼標(biāo)準(zhǔn),如JPEG 和JPEG2000。這些標(biāo)準(zhǔn)都是通過變換將圖像信號或預(yù)測殘差信號的能量集中到少數(shù)顯著變 換系數(shù)上,通過量化和熵編碼將變換系數(shù)壓縮為一定結(jié)構(gòu)的碼流。解碼端通過反熵編碼、反 量化和反變換重構(gòu)圖像信號。當(dāng)量化步長較大時,解碼的圖像質(zhì)量會大幅度下降。最近,Candes,Donoho 等人提出的壓縮感知理論(Compressive Sensing/ Compressed Sampling,CS)表明對于某個變換域下稀疏的信號,可以利用優(yōu)化方法由與變 換基非一致關(guān)系的觀測矩陣生成的少量數(shù)據(jù)精確重建。因此根據(jù)壓縮感知理論,解碼器可 以利用信號的稀疏特性,基于編碼端傳輸?shù)牧炕挠^測數(shù)據(jù),采用優(yōu)化方法重建信號。與傳 統(tǒng)的反變換的解碼方法相比,壓縮感知重建解碼方法具有較高的魯棒,有望獲得更高的圖 像重建質(zhì)量。
發(fā)明內(nèi)容
本發(fā)明的技術(shù)解決問題是克服現(xiàn)有技術(shù)的不足,提供一種基于稀疏表示模型的 圖像解碼方法。本發(fā)明的技術(shù)解決方案是本發(fā)明提供的基于稀疏表示模型的圖像解碼方法,包括以下步驟(1)建立六個分段線性自回歸模型(又稱PAR模型),它們反映圖像的不同紋理, 相應(yīng)地,六個PAR模型對應(yīng)六個自適應(yīng)稀疏矩陣A,所述自適應(yīng)稀疏矩陣由像素的權(quán)重構(gòu) 成,所述像素的權(quán)重就是PAR模型的參數(shù)值;(2)在解碼端,將反量化得到的圖像塊的變換系數(shù)通過IDCT變換,得到該圖像塊 Inxn的初值;再通過分析該圖像塊的結(jié)構(gòu)特征和紋理特征,確定選用六個PAR模型中的 哪一個,即確定該圖像信號的最優(yōu)模式;(3)根據(jù)該圖像信號的最優(yōu)模式,預(yù)測該模式中PAR模型的參數(shù)值;(4)將得到的模型參數(shù)填充到自適應(yīng)稀疏矩陣A中;(5)通過求解下式對該圖像塊進(jìn)行信號重構(gòu)/ = argmin||4/||p s.t. \\Φ/-γ\\2<ε,上式表示在滿足I|2彡ε條件下/取使I |Af| I1最小的f值;式中,f表 示圖像塊Inxn經(jīng)過列掃描后得到的NX 1維向量,/表示f的重構(gòu),A表示NXN維的自適應(yīng) 稀疏矩陣,其中N = nXn,A使IlAfM1稀疏,ε表示由量化噪聲引起的誤差,y表示觀測 值,它通過在解碼端將反量化得到的圖像塊變換系數(shù)矩陣進(jìn)行列掃描獲得,是NX 1維的列 向量;Φ表示標(biāo)準(zhǔn)觀測矩陣;
(6)若步驟(5)解出的列向量/不滿足設(shè)定條件,則將其再次代入步驟(3),預(yù)測 PAR模型的參數(shù)值,繼續(xù)步驟⑷和(5),PAR模型參數(shù)O通過f的第(t-Ι)次預(yù)測得到; 如此迭代下去,直到前后得到的兩個/值滿足設(shè)定條件為止;這樣最后迭代得到的/即為
所求,然后將最后迭代得到的列向量/轉(zhuǎn)化成矩陣/ ,實現(xiàn)該圖像塊的解碼。步驟⑴中六個PAR模型包括兩個四級的PAR模型和四個二級的PAR模型;自適 應(yīng)稀疏矩陣A用行向量表示為A = Ia1 ;a2 ;…;%},每一行向量IaJ包含一組PAR模型參 數(shù)k.J ;定義M為六個PAR模型的數(shù)學(xué)表示
M = {M1,M2, M3, M4, M5, M6}
M1 ={
M2 ={
M3 ={
M4 ={
M5 ={ M6 = {(1,-1),(_1,1)}
0,-1),(-1,0), (0,1), (1,0)} -1,-1),(-1,1), (1,1), (1,-1)} -1,0), (1,0)} 0,-1),(0,1)} 1,1), (-1,-1)}
值屮…·
步驟(3)中根據(jù)該圖像信號的最優(yōu)模式,用EM方法預(yù)測該模式中PAR模型的參數(shù)
^=argmin ^ f^ihj)- Σ a{u,v)f'-X){i-uj-ν)
(u,v)eMPAR模型參數(shù)通過f的第(t-1)次預(yù)測得到。步驟(4)將得到的模型參數(shù)填充到自適應(yīng)稀疏矩陣A中的方法是自適應(yīng)稀疏矩 陣A的每一行對應(yīng)列向量f的一個像素,圖像塊里的每一個像素都適用步驟C3)得到的一 組模型參數(shù),將得到的一組PAR模型參數(shù)填到每一行的相應(yīng)位置。依據(jù)選定的最優(yōu)模式,將上述操作重復(fù)應(yīng)用于每一個圖像塊,從而實現(xiàn)整幅圖像 的解碼。為了保證圖像塊Inxn的每一個像素都有預(yù)測像素,本發(fā)明進(jìn)一步在步驟C3)前還 包括將nXn的圖像塊Inxn進(jìn)行邊界像素擴展的步驟,所述邊界像素擴展是通過引入相鄰 塊的像素完成的,即在整個圖像中把圍繞ηΧη圖像塊的一圈像素引入作為預(yù)測像素,這一 圈像素屬于nXn圖像塊的相鄰塊;因為進(jìn)行擴充后圖像塊變大,所以針對原圖像塊的觀測 矩陣就不再適用于擴充后的圖像塊,為了解決這個問題,還需要對觀測矩陣Φ進(jìn)行擴充, 擴充的方法是將觀測矩陣中與新引入像素對應(yīng)的位置用單位1填充,得到一個新的觀測矩 陣;再對擴展后的圖像塊進(jìn)行后續(xù)操作。本發(fā)明與現(xiàn)有技術(shù)相比具有如下優(yōu)點目前常用的圖像壓縮編碼標(biāo)準(zhǔn),如JPEG和JPEG2000。這些標(biāo)準(zhǔn)都通過量化和熵編 碼將變換系數(shù)壓縮為一定結(jié)構(gòu)的碼流。解碼端通過反熵編碼、反量化和反變換重構(gòu)圖像信 號。當(dāng)量化步長較大時,解碼的圖像質(zhì)量會大幅度下降。本發(fā)明將壓縮感知(⑶)應(yīng)用在圖 像解碼上,編碼端不需要作任何改動,只是在解碼端用CS重構(gòu)部分替代了反變換,通過CS 重構(gòu)來提高圖像的解碼性能,從而提升圖像的重構(gòu)質(zhì)量。為了提升CS重構(gòu)的質(zhì)量,本發(fā)明引入分段線性自回歸模型并且構(gòu)造了相應(yīng)的自適應(yīng)稀疏矩陣,可以更好的適應(yīng)圖像信號的局部結(jié)構(gòu)的變化。為了提升CS重構(gòu)的質(zhì)量,本發(fā)明還對圖像塊進(jìn)行擴充,引入相鄰塊的像素作為預(yù) 測像素。
圖1為根據(jù)本發(fā)明的圖像編解碼框圖。圖2為根據(jù)本發(fā)明的PAR模型的六種模式。圖3為根據(jù)本發(fā)明引入塊邊緣像素。
具體實施例方式以下將結(jié)合附圖對本發(fā)明的具體實施方式
進(jìn)行說明。壓縮感知(CS)理論指出,如果圖像信號足夠稀疏,那么它就可以被準(zhǔn)確地重建。 圖像信號的稀疏性對CS重構(gòu)以后的圖像質(zhì)量有很大的影響。本發(fā)明旨在使用分段線性自回歸(PAR)模型構(gòu)造自適應(yīng)稀疏矩陣,然后通過CS重 構(gòu)出圖像。大部分的圖像編解碼機制(例如JPEG和JPEG2000),都是基于圖像塊的,而在自然 圖像中大部分的圖像塊都是非稀疏的二維信號,即像素值絕大多數(shù)為非零值。因此本發(fā)明 也以8X8的圖像塊為例進(jìn)行說明。實施例一如圖1所示,根據(jù)本發(fā)明的基于稀疏表示模型的圖像解碼方法,包括以下步驟(1)建立六個分段線性自回歸模型(又稱PAR模型),它們反映圖像的不同紋理, 相應(yīng)地,六個PAR模型對應(yīng)六個自適應(yīng)稀疏矩陣A,所述自適應(yīng)稀疏矩陣由像素的權(quán)重構(gòu) 成,所述像素的權(quán)重就是PAR模型的參數(shù)值。如圖2所示,六個PAR模型包括兩個四級的PAR模型和四個二級的PAR模型;自適 應(yīng)稀疏矩陣A用行向量表示為A = Ia1 ;a2 ;…;%},每一行向量IaJ包含一組PAR模型參 數(shù)kj ;定義M為六個PAR模型的數(shù)學(xué)表示M = {M1, M2, M3, M4, M5, M6}M1 = {(0,-1),(-1,0), (0,1), (1,0)}M2 = {(-1,-1),(-1,1), (1,1), (1,_1)}M3 = {(-1,0), (1,0)}M4 = {(0,-1),(0,1)}M5 = {(1,1),(-1,-1)}M6 = {(1,-1),(_1,1)}。(2)在解碼端,將反量化得到的圖像塊的變換系數(shù)通過IDCT變換,得到該圖像塊 Inxn的初值;再通過分析該圖像塊的結(jié)構(gòu)特征和紋理特征,確定選用六個PAR模型中的 哪一個,即確定該圖像信號的最優(yōu)模式。(3)根據(jù)該圖像信號的最優(yōu)模式,用EM方法預(yù)測該模式中PAR模型的參數(shù)值Α」
權(quán)利要求
1.基于稀疏表示模型的圖像解碼方法,其特征在于,包括以下步驟(1)建立六個分段線性自回歸模型(又稱PAR模型),它們反映圖像的不同紋理,相應(yīng) 地,六個PAR模型對應(yīng)六個自適應(yīng)稀疏矩陣A,所述自適應(yīng)稀疏矩陣由像素的權(quán)重構(gòu)成,所 述像素的權(quán)重就是PAR模型的參數(shù)值;(2)在解碼端,將反量化得到的圖像塊的變換系數(shù)通過IDCT變換,得到該圖像塊Inxn的初值;再通過分析該圖像塊的結(jié)構(gòu)特征和紋理特征,確定選用六個PAR模型中的哪一個,即確定該圖像信號的最優(yōu)模式;(3)根據(jù)該圖像信號的最優(yōu)模式,預(yù)測該模式中PAR模型的參數(shù)值;(4)將得到的模型參數(shù)填充到自適應(yīng)稀疏矩陣A中;(5)通過求解下式對該圖像塊進(jìn)行信號重構(gòu)
2.根據(jù)權(quán)利要求1所述的基于稀疏表示模型的圖像解碼方法,其特征在于,步驟(1)中 六個PAR模型包括兩個四級的PAR模型和四個二級的PAR模型;自適應(yīng)稀疏矩陣A用行向 量表示為A= Ia1溝2 ;…;aN},每一行向量IaJ包含一組PAR模型參數(shù)IaiJ ;定義M為六 個PAR模型的數(shù)學(xué)表示
3.根據(jù)權(quán)利要求1所述的基于稀疏表示模型的圖像解碼方法,其特征在于,步驟(3)中根據(jù)該圖像信號的最優(yōu)模式,用EM方法預(yù)測該模式中PAR模型的參數(shù)值」
4.根據(jù)權(quán)利要求1所述的基于稀疏表示模型的圖像解碼方法,其特征在于,步驟(4)將 得到的模型參數(shù)填充到自適應(yīng)稀疏矩陣A中的方法是自適應(yīng)稀疏矩陣A的每一行對應(yīng)列 向量f的一個像素,圖像塊里的每一個像素都適用步驟C3)得到的一組模型參數(shù),將得到的 一組PAR模型參數(shù)填到每一行的相應(yīng)位置。
5.根據(jù)權(quán)利要求1所述的基于稀疏表示模型的圖像解碼方法,其特征在于,在步驟(3) 前還包括將η X η的圖像塊Inxn進(jìn)行邊界像素擴展的步驟,所述邊界像素擴展是通過弓I入相 鄰塊的像素完成的,即在整個圖像中把圍繞ηΧη圖像塊的一圈像素引入作為預(yù)測像素,這 一圈像素屬于ηΧη圖像塊的相鄰塊;對觀測矩陣Φ也進(jìn)行相應(yīng)擴充,即將觀測矩陣中與新 引入像素對應(yīng)的位置用單位1填充,得到一個新的觀測矩陣;再對擴展后的圖像塊進(jìn)行后 續(xù)操作。
6.根據(jù)權(quán)利要求1所述的基于稀疏表示模型的圖像解碼方法,其特征在于,依據(jù)選定 的最優(yōu)模式,將上述操作重復(fù)應(yīng)用于每一個圖像塊,從而實現(xiàn)整幅圖像的解碼。
全文摘要
基于稀疏表示模型的圖像解碼方法,包括(1)建立反映圖像不同紋理的六個PAR模型,其對應(yīng)六個自適應(yīng)稀疏矩陣A,A由像素的權(quán)重構(gòu)成,像素的權(quán)重就是PAR模型的參數(shù)值;(2)在解碼端,將反量化得到的圖像塊變換系數(shù)通過IDCT變換,得到該圖像塊In×n的初值再通過分析該圖像塊的結(jié)構(gòu)特征和紋理特征,確定選用六個PAR模型中的哪一個;(3)根據(jù)該圖像信號的最優(yōu)模式,預(yù)測PAR模型的參數(shù)值;(4)將得到的模型參數(shù)填充到A;(5)通過CS重構(gòu)圖像;(6)若解出的不滿足設(shè)定條件,則重復(fù)步驟(3)-(5),如此迭代,直到前后得到的兩個值滿足設(shè)定條件為止;然后將最后迭代得到的轉(zhuǎn)化成矩陣實現(xiàn)圖像的解碼。本發(fā)明能夠提升圖像的重構(gòu)質(zhì)量。
文檔編號H04N7/50GK102065291SQ20101053959
公開日2011年5月18日 申請日期2010年11月9日 優(yōu)先權(quán)日2010年11月9日
發(fā)明者丁文鵬, 尹寶才, 施云惠, 李倩 申請人:北京工業(yè)大學(xué)