用于圖像質(zhì)量評價的圖像稀疏多維度特征提取方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,尤其涉及一種用于圖像質(zhì)量評價的圖像稀疏多維 度特征提取方法。
【背景技術(shù)】
[0002] 圖像質(zhì)量評價,是指對圖像在壓縮和信道傳輸中引入的失真或噪聲進行分析,量 化成分?jǐn)?shù),從而反映圖像質(zhì)量的方法。在圖像處理智能化系統(tǒng)中,圖像質(zhì)量評價通過機器模 仿人類對圖像質(zhì)量的認(rèn)知,成為了優(yōu)化系統(tǒng)參數(shù)的閉環(huán)中的關(guān)鍵反饋。另外,圖像質(zhì)量評價 也是評測各種圖像處理算法優(yōu)劣的重要指標(biāo)。如何客觀地反映人類的主觀認(rèn)知,是圖像質(zhì) 量評價的研宄重點和難點所在。
[0003] 傳統(tǒng)的主觀圖像質(zhì)量評價憑借實驗人員的主觀感知來評價圖像質(zhì)量。實驗中通過 大量實驗人員的數(shù)據(jù),進行較為復(fù)雜的心理學(xué)模型建模和分析,得出較為公正的圖像質(zhì)量 分?jǐn)?shù)。但是,主觀實驗過程中的觀測距離、實驗環(huán)境等都必須嚴(yán)格一致,而且實驗費時費力, 難以操作。相對于主觀圖像質(zhì)量評價,基于圖像特征提取的客觀圖像質(zhì)量評價,具有操作簡 單,成本低,可重復(fù)等優(yōu)點,正在逐漸引起越來越多的關(guān)注。
[0004] 圖像質(zhì)量的損失,主要體現(xiàn)在圖像壓縮算法在壓縮過程中追求壓縮比例而丟失的 信息和傳輸過程中信道衰落或干擾而引入的噪聲或失真。譬如在JPEG壓縮過程中,由于在 離散余弦變換后,對頻譜高頻即圖像細節(jié)進行壓縮而引入的塊效應(yīng);又如在無線傳輸中,由 于接收端周圍存在散射、反射和折射體,引起信號多徑傳輸,到達的信號之間相互疊加而引 起的快衰落失真。由于這些噪聲和失真都具有較為顯著的數(shù)學(xué)特征,所以圖像質(zhì)量評價可 以通過建立各種不同的數(shù)學(xué)模型,實現(xiàn)對圖像失真的數(shù)學(xué)表達和測定,如把圖像作為信號, 失真作為信號差錯來衡量的差錯模型;利用人眼的生物學(xué)和心理學(xué)的特性,提取圖像空域 紋理特征和頻譜特征的人眼視覺特性模型;利用自然圖像統(tǒng)計學(xué),分析失真對圖像統(tǒng)計學(xué) 參數(shù)的影響的自然圖像統(tǒng)計模型。
[0005] 由于數(shù)字圖像作為一種自然場景的離散數(shù)學(xué)表示,所包含的信息是抽象、高維度 且極其復(fù)雜的,所以提取反映圖像質(zhì)量的圖像特征是圖像質(zhì)量評價最為重要的核心。傳統(tǒng) 的信號模型并不能反映圖像作為一種獨特信號的特殊性質(zhì),與人的主觀判斷差距甚遠。人 眼視覺特性模型依賴于人眼的生物學(xué)和心理學(xué)研宄,實現(xiàn)人眼建模難度極大,而各種紋理 特征和頻譜特征較為單一。自然圖像統(tǒng)計模型的特征提取,復(fù)雜度高,耗時并且分析難度 大。歸根結(jié)底,如何高效地提取獨立不冗余的特征是構(gòu)建圖像質(zhì)量評價方法的關(guān)鍵。
[0006] 近年來,稀疏的概念逐漸從神經(jīng)科學(xué)發(fā)展到計算機科學(xué)和機器學(xué)習(xí)領(lǐng)域。一方面, 由于在神經(jīng)科學(xué)中,稀疏編碼理論可以更加成功地描述哺乳動物的初級視覺的簡單細胞具 有的空域局部性、方向性和帶通性;另一方面,稀疏性是信息表示的最普遍屬性之一,一個 具有稀疏性的信息載體是可壓縮的,可壓縮的信息是能夠被更加高效的處理與應(yīng)用的。對 于圖像而言,稀疏的圖像特征去除了圖像表示中的冗余信息,從更深的層次代表圖像,進而 反映圖像特征。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明的目的針對現(xiàn)有圖像質(zhì)量評價過程中,由于圖像特征的信息冗余以及變換 域特征對空域信息的缺失導(dǎo)致質(zhì)量評價不高的缺陷,提出一種用于圖像質(zhì)量評價的圖像稀 疏多維度特征提取方法。發(fā)明立足于空間域降維和變換域稀疏處理的方法,有效地提取出 代表圖像質(zhì)量的圖像特征,并應(yīng)用于圖像質(zhì)量評價。圖像稀疏多維度特征能夠更好地模 擬人類視覺系統(tǒng)對圖像質(zhì)量的感知特性,從而為構(gòu)建更高性能的圖像質(zhì)量評價方法奠定基 礎(chǔ)。
[0008] 本發(fā)明采取的技術(shù)方案是:
[0009] 首先,將圖像分為若干參考塊,針對每個參考塊,利用全局搜索,分別查找和參考 塊空間域和變換域相似的圖像塊并堆疊成高維度的組;其次,對每組堆疊的圖像塊提取3D 變換后的稀疏信息;最后,以稀疏信息和構(gòu)造出組記錄的位置信息的統(tǒng)計特征作為分析圖 像視覺質(zhì)量的基準(zhǔn)。
[0010] 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案如下:
[0011] 步驟(1).輸入圖像I,并按一定的塊寬度Npatdl將圖像I分為互不重疊的塊作為 參考塊空間PKef={PieI:iGY+,i彡m},其中,P為參考圖像塊的總稱,i為圖像塊的索 弓丨,Y+為正整數(shù),m為假定的參考塊個數(shù)。
[0012] 步驟(2).根據(jù)步驟⑴輸入的圖像I,并按一定的步長凡_,按同樣的塊寬度Npateh 將圖像I分為互相重疊的塊作為參考塊搜索空間PseaTCh={P/eI:jGY+,j彡n},其中 P'為搜索空間圖像塊的總稱,n為搜索空間中塊的個數(shù),j為搜索空間的塊索引。
[0013] 同時記錄每一個塊的起始位置,記為:
[°014]Spos= {(xpJ,ypJ)} (1)
[0015] 其中,xpjpyw.分別對應(yīng)L塊的起始位置的橫縱坐標(biāo)。
[0016] 步驟(3).在搜索空間PseaTCh中,分別找出與參考塊的空間域距離和變換域距離小 于一定閾值的圖像塊,并分別堆疊成組,記錄塊的起始位置形成拓撲信息,并將其從PSMTCh 和Sp()s中取出。具體如下:
[0021]
[0022] 其中,dspatial和dtans分別代表空間域距離和變換域距離,|卜| | 2代表1 2范數(shù),即 歐氏距離,T2D( ?)代表2D的線性變換(如傅里葉變換、離散正余弦變換等),這里使用的是 離散余弦變換,得到的為離散余弦變換系數(shù),P和q分別為方塊內(nèi)的橫縱坐標(biāo)索引, 和分別代表在空間域和變換域與參考塊匕相似的集合,t ^ t_s分別代 表空間域和變換域判斷相似的閾值,Kx,y)spatial}和Kx,y)trans}分別為記錄下的位置集 合。
[0023] 步驟(4).分別將步驟(3)堆疊后的組進行3D變換,獲得多維度稀疏的變換域信 息。具體方法為:3D變換分為針對每一個圖像塊的2D對角變換和組堆疊縱方向上的1D變 換。2D變換使用步驟(3)中的離散余弦變換,1D變換使用Walsh-Hadamard變換:
[0026] 其中,T1D( ?)為3D堆疊塊的堆疊方向的1D變換,7"是堆疊方向的塊序列,Nstack 為堆疊方向的塊個數(shù),WAL為Walsh函數(shù),分別為矩陣中的每行或每列。對角變換是為了保 證2D變換后信息的稀疏性。由于不限定變換形式,所以記每組空域相似塊變換后的變換域 譜為,每組變換域相似塊變換后的變換域譜為。
[0027] 步驟(5).將步驟(4)得到的變換域譜^^和分別做直方圖統(tǒng)計,獲取統(tǒng)計結(jié)果 的一階矩、二階矩和三階矩作為變換域特征。
[0029] 其中,f(x)為直方圖統(tǒng)計結(jié)果中的概率密度函數(shù),n分別取1、2、3使11'"代表一、 二、三階矩(期望、方差和偏態(tài)),c為相對值,通常一階矩計算中c為0,其余為一階矩。
[0030] 步驟(6).利用最小二乘法的經(jīng)驗公式做每組塊位置的線性擬合,并求出相關(guān)系 數(shù)。
[0034] (x,y)G{(x,y)spatial}或{(x,y) trans}
[0035] 其中,a和b代表線性擬合成y=ax+b直線中的系數(shù),x和y分別代表記錄位置的 橫縱坐標(biāo),r代表相關(guān)系數(shù)。[和^分別為x和y的均值,n為每組塊的總數(shù)。
[0036] 步驟(7).分別將空域和變換域提取出的特征構(gòu)成特征向量,利用支持向量機 (SupportVectorMachine)和已有的數(shù)據(jù)庫中的部分?jǐn)?shù)據(jù),進行訓(xùn)練,利用剩余數(shù)據(jù)進行 交叉驗證,從而得到圖像質(zhì)量分?jǐn)?shù)。
[0037] V[P1spatial,P2spatial,P3spatialJ -^spatial?1trans? 2transJ 3 trans? -^trans-l為特 征向量,下標(biāo)spatial和trans分別代表空域和變換域特征。
[0038] 本發(fā)明的有益效果:
[0039] 本發(fā)明充分利用空間域?qū)D像數(shù)據(jù)進行降維處理和3D變換獲得的變換域稀疏信 息,結(jié)合降維處理時記錄的塊相似度的拓撲信息,構(gòu)建用于圖像質(zhì)量評價的多維度特征向 量。該方法具有較為適當(dāng)?shù)挠嬎銖?fù)雜度,且所有的搜索和變換過程可并行,實驗結(jié)果表明, 基于本發(fā)明提出的圖像質(zhì)量評價方法具有較好的效率和較好的性能。
【附圖說明】
[0040] 圖1為本發(fā)明基于稀疏多維度特征提取的原理框圖。
【具體實施方式】
[0041] 下面結(jié)合附圖對本發(fā)明方法作進一步說明。
[0042] 如圖1所示,用于圖像