本發(fā)明涉及一種圖像處理,特別涉及一種基于圖像庫空域和頻域特征的圖像摘要獲取方法。
背景技術(shù):
:近年來,數(shù)字媒體的內(nèi)容安全問題一直受到人們的廣泛關(guān)注。由于圖像在數(shù)字媒體中占有重要地位,各種圖像處理工具的普遍應(yīng)用使數(shù)字圖像很容易被篡改,需要采取專門的技術(shù)措施來保證其真實性和可信性。圖像摘要又稱為圖像Hash,它是通過特定的單向映射從圖像中提取的特征碼,能反映圖像的實質(zhì)內(nèi)容,因此常用于圖像防偽認(rèn)證。圖像摘要通常應(yīng)具備以下基本性質(zhì):1)抗碰撞性,即不同圖像的摘要應(yīng)有重大差異;2)感知穩(wěn)健性,圖像通過正常處理如濾波、增強、壓縮后圖像實質(zhì)內(nèi)容不變,摘要也不發(fā)生顯著變化;3)安全性,密鑰不同時生成的摘要完全不同。感知穩(wěn)健性是圖像摘要與密碼學(xué)Hash函數(shù)的重要區(qū)別,后者如MD5和SHA-1,它們對原始數(shù)據(jù)極為敏感,只要有微小變化就會導(dǎo)致完全不同的摘要值。由于摘要反映圖像實質(zhì)內(nèi)容,所以圖像摘要方法中關(guān)鍵的一步就是特征提取,它直接關(guān)系到摘要的性能。特征提取可以在空域或變換域進行?;诳沼虻姆椒ㄖ校琄ozat等人將圖像看作矩陣,利用矩陣不變性構(gòu)造圖像摘要。首先將圖像偽隨機分割成大小相同的互相重疊的圖像區(qū)域,并運用奇異值分解SVD(或者DCT和DWT)對圖像區(qū)域進行特征提取,同時對特征偽隨機排列構(gòu)造二次圖像,最后用SVD變換提取二次圖像的特征以構(gòu)成Hash值,該方法由SVD的不變性保證摘要的穩(wěn)健性;Xiang等人提出了一種基于圖像全局直方圖的圖像摘要算法,該方法首先對圖像做高斯低通濾波,然后得到圖像亮度分量的直方圖,最后對直方圖進行量化得到圖像摘要。由于圖像經(jīng)過幾何變換后圖像的直方圖沒有發(fā)生大的改變,因此該方法對旋轉(zhuǎn),剪裁和平移等幾何變換具有魯棒性,但缺點是容易偽造出與原始圖像具有相同直方圖但視覺內(nèi)容不同的圖像;唐振軍等人利用非負(fù)矩陣分解提取特征構(gòu)成圖像摘要,首先對整幅圖像進行處理,構(gòu)成二次圖像再做非負(fù)矩陣分解,然后對系數(shù)矩陣進行量化得到圖像Hash,該方法的長度較短,對大部分常規(guī)處理具有很好的魯棒性,同時能夠檢測圖像篡改,但缺點是由于二次圖像是由圖像隨機分塊得到的,因此對旋轉(zhuǎn)和剪裁等幾何變換不魯棒。在基于變換域的方法中,F(xiàn).Lefebvre等人利用Radon變換構(gòu)成了一種圖像摘要算法,首先圖像經(jīng)過Radon變換后計算亮度投影的特征向量,并用主成分分析提取兩個最大的特征值所對應(yīng)的特征向量構(gòu)成摘要值,該方法對常規(guī)的圖像處理如壓縮、濾波、小角度旋轉(zhuǎn)、縮放具有較好的穩(wěn)健性,但對紋理圖像的魯棒性較差;唐勝等人設(shè)計了基于圖像關(guān)鍵塊DCT系數(shù)的摘要方法。該方法首先對圖像所有塊做DCT變換,然后選擇圖像關(guān)鍵塊中的低頻DCT量化系數(shù)作為特征構(gòu)造數(shù)據(jù)矩陣,再將PCA應(yīng)用于數(shù)據(jù)矩陣,最后用量化后的特征向量矩陣作為圖像摘要。這些方法統(tǒng)一的特點是利用圖像本身提取特征構(gòu)成圖像摘要,因此攻擊者容易偽造具有相似摘要的攻擊圖像,安全性能有待進一步提高。技術(shù)實現(xiàn)要素:本發(fā)明是針對圖像摘要安全性的問題,提出了一種基于圖像庫空域和頻域特征的圖像摘要獲取方法,該方法對大部分保持內(nèi)容的圖像處理具有魯棒性,由于對圖像做了分塊處理,因此對大角度旋轉(zhuǎn)不具有魯棒性,該方法具有很低的碰撞率,可以用于圖像認(rèn)證,該方法利用了圖像庫中的特征構(gòu)成圖像摘要,具有較高的安全性能。本發(fā)明的技術(shù)方案為:一種基于圖像庫空域和頻域特征的圖像摘要獲取方法,具體包括如下步驟:1)利用圖像庫構(gòu)成詞典;2)對輸入圖像做預(yù)處理,將其規(guī)格化為相同尺寸,然后將按詞典中圖像塊大小對輸入圖像進行圖像分塊,之后提取圖像特征構(gòu)成中間摘要,中間摘要包括三部分:標(biāo)志位F,空域特征向量S和頻域特征向量D;3)標(biāo)志位F是對判斷圖像塊是否含有有效信息,計算圖像的顯著圖,通過比較圖像塊是否存在于顯著區(qū)域,若圖像塊大部分在顯著區(qū)域,則認(rèn)為該圖像塊為有效圖像塊,則該位置為1,否則置為0;4)空域特征向量S則是對含有有效信息的圖像塊提取其顏色和紋理特征構(gòu)成子特征向量,和詞典中的N類子詞典中心比較,選擇最接近的子詞典,再和子詞典中的各個單詞進行比較,最終用詞典中的單詞代替圖像塊的特征,將所有有效圖像塊對應(yīng)的詞典單詞連接起來構(gòu)成空域特征向量S;5)頻域特征向量D則是對每個圖像塊進行DCT變換,得到每一個圖像塊的DCT系數(shù),提取出DCT系數(shù)中的直流系數(shù)和低頻交流系數(shù)來構(gòu)造DCT特征點,對所有圖像塊的DCT特征點求均值得到重心:(xa,ya),使用DCT特征點(xi,yi)和重心(xa,ya)之間的歐氏距離構(gòu)造頻域特征向量D;6)最后利用密鑰對標(biāo)志位F和頻域特征向量D置亂后與空域特征向量S連接起來構(gòu)成圖像摘要。所述利用圖像庫構(gòu)成詞典具體步驟如下:A:讀入圖像庫中的每幅圖像,對圖像做預(yù)處理,將其規(guī)格化為相同尺寸:M×M,再將預(yù)處理后的圖像分成L×L的圖像塊;B:判斷圖像塊是否含有信息,主要是計算圖像的顯著圖,通過比較圖像塊是否存在于顯著區(qū)域,若圖像塊大部分在顯著區(qū)域,則認(rèn)為該圖像塊為有效圖像塊,否則為無效圖像塊,直接舍棄;C:對有效圖像塊提取圖像塊的特征構(gòu)成特征向量,將所有圖像中的有效圖像塊的特征向量連接起來構(gòu)成特征矩陣;D:對特征矩陣進行聚類,將其聚類為N個子詞典,最后存儲聚類中心,每個子詞典中單詞數(shù)目和單詞構(gòu)成詞典。本發(fā)明的有益效果在于:本發(fā)明基于圖像庫空域和頻域特征的圖像摘要獲取方法,具有較好的穩(wěn)健性和唯一性,能夠檢測篡改圖像。它可以廣泛應(yīng)用于圖像認(rèn)證、圖像檢索和圖像內(nèi)容安全等領(lǐng)域。附圖說明圖1為本發(fā)明利用圖像庫特征構(gòu)成詞典的框圖;圖2為本發(fā)明圖像摘要生成框圖;圖3為本發(fā)明常規(guī)圖像處理對Hash的影響示意圖;圖4為本發(fā)明唯一性分析結(jié)果圖;圖5為本發(fā)明原圖像與篡改圖像以及Hash距離實例圖。具體實施方式本發(fā)明基于圖像庫空域和頻域特征的圖像摘要獲取方法:利用圖像庫的特征生成圖像摘要主要是利用已有的圖像庫生成詞典,詞典中包含N個子詞典以及若干個單詞。圖像在生成摘要時通過將自身特征與詞典中的單詞進行比較,最終由詞典中的單詞構(gòu)成圖像摘要,由于攻擊者沒有詞典,因此這類算法的安全性很高。1、利用圖像庫構(gòu)成詞典:如圖1所示利用圖像庫特征構(gòu)成詞典的框圖,包括以下幾個步驟:(1)讀入圖像庫中的每幅圖像,對圖像做預(yù)處理,將其規(guī)格化為相同尺寸:M×M,再將預(yù)處理后的圖像分成L×L的圖像塊;(2)判斷圖像塊是否含有信息,主要是計算圖像的顯著圖,通過比較圖像塊是否存在于顯著區(qū)域,若圖像塊大部分在顯著區(qū)域,則認(rèn)為該圖像塊為有效圖像塊,否則為無效圖像塊,直接舍棄;(3)對有效圖像塊提取圖像塊的特征構(gòu)成特征向量,將所有圖像中的有效圖像塊的特征向量連接起來構(gòu)成特征矩陣;(4)對特征矩陣進行聚類,將其聚類為N個子詞典,最后存儲聚類中心,每個子詞典中單詞數(shù)目和單詞構(gòu)成詞典。2、圖像摘要生成:圖像摘要生成框圖如圖2所示。主要包含以下幾個步驟:(1)首先對輸入圖像做預(yù)處理,將其規(guī)格化為相同尺寸,然后將圖像分塊分塊大小與詞典中圖像塊大小相同。之后提取圖像特征構(gòu)成中間摘要,中間摘要包括三部分:標(biāo)志位F,空域特征向量S和頻域特征向量D。(2)標(biāo)志位F是對判斷圖像塊是否含有有效信息,方法與詞典生成中的方法相同,若含有有效信息,則該位置為1,否則置為0。(3)空域特征向量S則是對含有有效信息的圖像塊提取其顏色和紋理特征構(gòu)成子特征向量,和所選詞典中的N類子詞典中心比較,選擇最接近的子詞典,再和子詞典中的各個單詞進行比較,最終用詞典中的單詞代替圖像塊的特征,將所有有效圖像塊對應(yīng)的詞典單詞連接起來構(gòu)成空域特征向量S。顏色特征是將顏色空間從RGB轉(zhuǎn)變?yōu)镠SV,然后轉(zhuǎn)為H2SV取四個分量的均值后乘以100后取整;紋理特征則包括Tamura紋理特征的粗糙度,對比度,圖像塊的傾斜度(skewness)和峰度(kurtosis)并取整。(4)頻域特征向量D則是對每個圖像塊進行DCT變換,得到每一個圖像塊的DCT系數(shù),提取出DCT系數(shù)中的直流系數(shù)和低頻交流系數(shù)來構(gòu)造DCT特征點。對所有圖像塊的DCT特征點求均值得到重心:(xa,ya)。使用DCT特征點(xi,yi)和重心(xa,ya)之間的歐氏距離構(gòu)造頻域特征向量D。(5)最后利用密鑰對標(biāo)志位F和頻域特征向量D置亂后與空域特征向量S連接起來構(gòu)成圖像摘要。3、圖像摘要距離計算:接收方具有和發(fā)送方相同的詞典。接收方收到可能經(jīng)過攻擊后的圖像以及正確的圖像摘要H1。圖像認(rèn)證包括以下幾個步驟:(1)首先對接收圖像按照圖像摘要生成方法求出摘要H2=[F2,S2,D2]。(2)對接收到的摘要利用密鑰恢復(fù)出各個特征向量,即H1=[F1,S1,D1]。(3)根據(jù)標(biāo)志位F中的標(biāo)志調(diào)整空域特征向量S,若標(biāo)志位F為0則在空域特征向量S中補零,使得兩幅圖像相同位置圖像塊的特征在空域特征向量S中也位于相同位置。調(diào)整后的空域特征向量S分別記為S'1和S'2。將空域特征向量S和頻域特征向量D連接起來構(gòu)成特征向量V1=[S'1,D1]和V2=[S'2,D2]。(4)特征向量V1和V2之間的歐氏距離即為兩個圖像Hash的距離。若距離小于閾值,則認(rèn)為收到的圖像與發(fā)送的圖像是相似圖像,否則圖像是被攻擊的圖像。4、具體實施方案及性能分析:在實施方案中對參數(shù)做如下設(shè)置:圖像規(guī)格化大小M=256,圖像塊大小L=8,子詞典的個數(shù)N=26。因此圖像塊的總個數(shù)為32×32=1024,標(biāo)志向量F為1024bit,空域特征向量S為1024×8=8192個整數(shù),頻域特征向量為1024個整數(shù),每個整數(shù)用8bit表示,因此最終圖像Hash是長度為1024+8192*8+1024*8=74752bits。5、穩(wěn)健性分析:在穩(wěn)健性分析中,對5幅512×512的測試圖像Airplane,House,Lena,Baboon和Peppers進行各種常規(guī)處理,包括用StirMark4.0進行JPEG壓縮編碼、添加噪聲、嵌入水??;用Photoshop進行亮度調(diào)整、對比度調(diào)整和旋轉(zhuǎn);用MATLAB進行Gamma校正和3×3Gauss平滑濾波。表1列出了穩(wěn)健性性能分析中各種常規(guī)圖像處理所用參數(shù)。對原始圖像的Hash與經(jīng)過不同處理后圖像的Hash計算距離(見圖像摘要距離計算中步驟(4)),如圖3所示。圖中橫軸的序號對應(yīng)于表1列出的各種處理序號,縱軸表示Hash距離。除圖像旋轉(zhuǎn)之外,大部分處理引起的Hash變化不大,距離均在1000左右。旋轉(zhuǎn)角度大于1°時,Hash距離急劇上升,這是因為采用了分塊方案,旋轉(zhuǎn)使圖形塊內(nèi)容發(fā)生重大變化??梢姳痉椒▽D像旋轉(zhuǎn)以外的常規(guī)圖像處理具有良好的穩(wěn)健性。表16、唯一性性能分析:圖像Hash的唯一性又稱為抗碰撞性,即兩幅內(nèi)容不同的圖像應(yīng)具有完全不同的圖像Hash。圖5給出1000幅不同圖像生成的C21000=499500個圖像對的Hash距離的概率分布圖。均值和標(biāo)準(zhǔn)差分別為2269.6.1和236。可以看出距離基本都大于1000。7、閾值確定:首先建立Hash距離數(shù)據(jù)集,其中包括3000個不同圖像對Hash距離和3000個相似圖像對Hash距離。相似圖像對包括JPEG,Gamma校正和圖像縮放。經(jīng)過魯棒性實驗和唯一性實驗可以知道閾值范圍在800至1500,對數(shù)據(jù)集進行大津法分析。最終得到的最優(yōu)閾值為993。方便起見將閾值定為1000。8、檢錯率和碰撞率:定義檢錯率和碰撞率如下:表2給出本方法所得的檢錯率和碰撞率。在圖像Hash的性能指標(biāo)中,碰撞率和檢錯率都很重要。從表2中可以看出本方法具有較低的碰撞率。表2閾值P檢錯率P碰撞率本方法10000.00372.01×10-69、篡改檢測分析圖5為原圖像與篡改圖像以及Hash距離實例圖,此為篡改檢測的一些實例??梢钥闯鏊袌D像對的距離都大于確定的閾值T(1000)??傊?,本專利提出的方法具有較好的穩(wěn)健性和唯一性,能夠檢測篡改圖像。它可以廣泛應(yīng)用于圖像認(rèn)證和圖像檢索領(lǐng)域。當(dāng)前第1頁1 2 3