本發(fā)明涉及信息安全和圖像處理技術(shù),具體涉及一種基于雙分支網(wǎng)絡(luò)的高質(zhì)量因子jpeg圖像隱寫分析方法。
背景技術(shù):
1、隨著數(shù)字圖像在社交媒體上廣泛使用,圖像隱寫術(shù)也隨之發(fā)展起來。圖像隱寫術(shù)是一種將秘密信息嵌入到圖像中的技術(shù),其目的是在不被察覺的情況下傳遞隱秘信息。由于圖像存儲價格的下降以及用戶更傾向于保持圖像質(zhì)量,即保留更多的圖像細節(jié)信息,高質(zhì)量因子壓縮的jpeg圖像在社交媒體上開始流行。同時,由于免費的隱寫軟件的增多,隱寫者也可能傾向于選擇更高的質(zhì)量因子壓縮的jpeg圖像來增加嵌入容量。因此,需要開發(fā)出高效準確的隱寫分析方法,為數(shù)字圖像的安全性和隱私保護提供有力支持。
2、要想對jpeg圖像進行隱寫分析,需要從圖像中提取豐富的特征來判斷圖像是否為隱寫圖像。早期的jpeg域隱寫分析方法都是先將jpeg域圖像解壓縮到空域,并且使用濾波器獲得噪聲殘差,最后再在量化階段處理提取統(tǒng)計特征。但這種傳統(tǒng)的方式存在局限性,不僅需要研究人員手動設(shè)計特征,并且特征調(diào)節(jié)過程繁瑣,效率低。近年來,深度學習的應(yīng)用顯著提高了隱寫分析的準確率,深度學習網(wǎng)絡(luò)具有特征學習和表達能力,這使得研究人員無需手動設(shè)計復雜的高維特征。但基于深度學習的隱寫分析器大多數(shù)都是端到端的,提取的特征缺乏一定的理論支撐和可解釋性?,F(xiàn)有技術(shù)最早通過判斷圖像中的?dct系數(shù)是否符合自然圖像的統(tǒng)計分布來判斷jpeg圖像是否存在隱寫信息,該方法最初主要用于檢測jsteg?隱寫術(shù),但難以檢測到嵌入方式更復雜的隱寫術(shù)。后來利用?jpeg圖像的結(jié)構(gòu)特征,人工提取圖像中的統(tǒng)計特征,再結(jié)合支持向量機(svm)進行分類,來判斷圖像中是否存在隱寫信息,對數(shù)據(jù)量和計算資源的需求高、適應(yīng)性有限。
3、transformer最初用于處理自然語言處理任務(wù),其自注意力機制可以較好的捕獲全局信息。2020年,google團隊成功驗證了?transformer?架構(gòu)在計算機視覺領(lǐng)域的可行性。現(xiàn)有的方法大多用于目標識別和圖像分割,但是隱寫分析可看作圖像二分類問題,而且隱寫圖像幾乎無法通過肉眼識別,需要通過神經(jīng)網(wǎng)絡(luò)提取更高維的信息。目前jpeg圖像隱寫分析主要用的是cnn網(wǎng)絡(luò),準確率不高。
技術(shù)實現(xiàn)思路
1、發(fā)明目的:本發(fā)明的目的在于解決現(xiàn)有技術(shù)中存在的不足,提供一種基于雙分支網(wǎng)絡(luò)的高質(zhì)量因子jpeg圖像隱寫分析方法,本發(fā)明的創(chuàng)新點在于利用舍入誤差和截斷誤差以及新型的雙分支網(wǎng)絡(luò)結(jié)構(gòu)并通過注意力機制來對雙分支網(wǎng)絡(luò)提取的特征進行選擇性關(guān)注,從而進行隱寫分析。
2、技術(shù)方案:本發(fā)明的一種基于雙分支網(wǎng)絡(luò)的高質(zhì)量因子jpeg圖像隱寫分析方法,其特征在于,包括以下步驟:
3、步驟1、對于待分析jpeg圖像,先從頻率域轉(zhuǎn)換到空間域得到未進行舍入和截斷的非舍入像素值塊,然后將非舍入像素值塊進行舍入和截斷操作,得到舍入誤差和截斷誤差,再將舍入誤差和截斷誤差歸一化并相加轉(zhuǎn)換為誤差圖像;具體方法為:
4、步驟1.1、計算舍入和截斷誤差;首先將量化后的dct系數(shù)乘量化表進行去量化操作,然后再通過反dct變換得到解壓后的非舍入像素值塊,并將非舍入像素值塊四舍五入為整數(shù)并裁剪為有限動態(tài)范圍[0,?255];接著將四舍五入操作產(chǎn)生的誤差為舍入誤差rerror,超出[0,?255]范圍內(nèi)的部分采用截斷操作,截斷操作產(chǎn)生的誤差稱為截斷誤差terror;
5、步驟1.2、將截斷誤差和舍入誤差分別歸一化;最后將歸一化后的截斷誤差和舍入誤差相加得到誤差圖像;
6、步驟2、構(gòu)建并訓練雙分支網(wǎng)絡(luò),將步驟1中jpeg圖像和誤差圖像輸入訓練好的雙分支網(wǎng)絡(luò),所述雙分支網(wǎng)絡(luò)包括并行的transformer網(wǎng)絡(luò)模塊和cnn網(wǎng)絡(luò)模塊,通過cnn網(wǎng)絡(luò)模塊提取jpeg圖像的頻域特征,通過transformer網(wǎng)絡(luò)模塊提取誤差圖像的空域特征;
7、步驟3、將頻域特征和空域特征通過融合模塊進行融合,所得融合特征進入分類器,通過softmax層得到j(luò)peg圖像中像素的偏移量概率,根據(jù)偏移量概率來分析是否被隱寫。
8、進一步地,所述步驟1中獲得非舍入像素值塊yij的計算公式如下:
9、?????????????????????(1)
10、其中, c為量化后的dct系數(shù), q為量化表;由于且的數(shù)據(jù)類型為浮點數(shù),為獲得最終的解壓縮圖像,對所得進行四舍五入為整數(shù)并裁剪為有限動態(tài)范圍[0,?255];
11、獲得舍入誤差和截斷誤差的計算公式如下:
12、????????????????(2)
13、???????????(3)
14、誤差歸一化的計算公式如下:
15、error_norm=(max(error( y ij)-error( y ij))/(max(error( y ij))-min(error( y ij)))?(4)
16、將歸一化的舍入誤差和截斷誤差相加為誤差圖像的公式如下:
17、???(5)
18、其中,為所得誤差圖像。
19、進一步地,所述雙分支網(wǎng)絡(luò)的cnn網(wǎng)絡(luò)模塊的具體結(jié)構(gòu)和參數(shù)設(shè)置如下:cnn網(wǎng)絡(luò)模塊包括輸入層、七層堆疊層和輸出層,每一層堆疊層都包括卷積層(c)、bn層(b)和非線性激活函數(shù)(r),所有卷積層均采用3×3的卷積核;堆疊層的第三層堆疊層開始采用跳躍連接;所述非線性激活函數(shù)(r)采用relu函數(shù)。
20、進一步地,所述雙分支網(wǎng)絡(luò)的cnn網(wǎng)絡(luò)模塊的transformer網(wǎng)絡(luò)模塊先對誤差圖像進行線性投影,然后通過注意力模塊提取空域信息,各個注意力模塊之間采用殘差連接。
21、進一步地,所述步驟3融合模塊對cnn網(wǎng)絡(luò)模塊提取的頻域信息和transformer網(wǎng)絡(luò)模塊提取的空域信息進行融合,并且壓縮簡化;所述融合模塊的具體融合方法為:
22、首先,注意力模塊通過全局平均池化操作對輸入特征圖的空間維度(高度h和寬度w)進行聚合,為每個通道生成一個通道描述符;然后是兩個全連接(fc)層和一個非線性激活函數(shù)(通常是sigmoid)組成的自門控機制,第一個fc層降低通道描述符的維度,應(yīng)用relu非線性激活,第二個fc層將其投影回原始通道維度,輸出用于重新校準原始輸入特征圖。此處注意力模塊可以有選擇地強調(diào)信息豐富的特征,同時抑制不太有用的特征,使模型能夠?qū)W⒂谌蝿?wù)中最相關(guān)的特征,卷積層用于進一步提取高維特征并降低特征維度。
23、進一步地,所述分類器包括全局平局池化層、全連接層和softmax層,融合特征經(jīng)分類器得到像素的估計偏移量的概率,為[0,1]區(qū)間,
24、;
25、同時使用交叉熵損失函數(shù)作為損失函數(shù),并依據(jù)該損失函數(shù)不斷優(yōu)化網(wǎng)絡(luò)參數(shù),交叉熵損失表示為:
26、?????????????????(8)
27、其中,表示樣本的真實標簽,為0,表示jpeg圖像為正常圖像,為1,表示jpeg圖像為隱寫圖像;代表模型預(yù)測為類1的概率(隱寫圖像的概率),n代表樣本數(shù)。
28、有益效果:與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點:
29、1、本發(fā)明通過使用預(yù)處理操作將jpeg圖像轉(zhuǎn)化為誤差圖像,方便了網(wǎng)絡(luò)發(fā)掘jpeg圖像中的隱寫痕跡。經(jīng)過預(yù)處理操作后,可以顯著提高高質(zhì)量因子壓縮jpeg圖像的隱寫分析準確率。
30、2、本發(fā)明將利用舍入誤差和截斷誤差用于圖像隱寫分析,能夠精確的檢測出隱寫痕跡,而且無需依賴特定隱寫算法,對圖像本身不造成破壞。
31、3、本發(fā)明的雙分支網(wǎng)絡(luò)能夠提取圖像的高維特征信息,從而提高隱寫分析的準確率。此外,注意力機制幫助模型減少不必要的計算開銷,提高計算效率。