差分,"111廿&"表示幀內(nèi)相 鄰系數(shù)之間的差分,r,c分別為矩陣M的行和列的索引;
[0074] 步驟1. 3 :對(duì)差分矩陣D ( Ds丨二)按式五進(jìn)行閾值處理,設(shè)置 閾值T = 4,對(duì)任意D},r、C為矩陣D的行列索引;
[0076] 步驟1. 4 :對(duì)差分矩陣D計(jì)算Markov轉(zhuǎn)移概率和累積鄰接密度,MDCT系數(shù)差分矩 陣D的Markov轉(zhuǎn)移概率頂?shù)挠?jì)算式為式六,累積鄰接密度INJ的計(jì)算式為式七,在幀內(nèi)相 關(guān)性特征提取時(shí),概率計(jì)算方向?yàn)閹瑑?nèi)方向;在幀間相關(guān)性特征提取時(shí),概率計(jì)算方向?yàn)閹?間方向;
[0079] 其中,!11,11£[-4,4],隊(duì),凡分別為差分矩陣0的行數(shù)和列數(shù);5(*)為數(shù)學(xué)算子, 條件滿足時(shí)為值1,否則為〇 ;當(dāng)計(jì)算幀間關(guān)系時(shí),Ii1= 1,k2= 0 ;當(dāng)計(jì)算幀內(nèi)關(guān)系時(shí),k i = 0, k2= 1 ;每個(gè)差分矩陣得到兩個(gè)子特征,兩個(gè)集合共得到16種隱寫(xiě)分析子特征;
[0080] 步驟1. 5 :將兩個(gè)集合的子特征以各幀類(lèi)型在AAC音頻中所占的比例賦予權(quán)值,融 合后形成最終的隱寫(xiě)分析集合G,其中N1為長(zhǎng)幀數(shù)量,N s為短幀數(shù)量:
[0084] 其中,C( ·)為相關(guān)性計(jì)算運(yùn)算,α和β分別為C(M1)和C(Ms)對(duì)特征集合G的 貢獻(xiàn)程度;
[0085] 由于音頻信號(hào)中相鄰MDCT系數(shù)具有一定的相關(guān)性,以上隱寫(xiě)方法均帶來(lái)AAC碼 流中MDCT系數(shù)值的改變,引起幀內(nèi)相鄰MDCT系數(shù)值和幀間相鄰MDCT系數(shù)值之間關(guān)系 上的變化。圖2所示為碼率為96kbps,采用文獻(xiàn)[Zhu J, Wang R, Yan D. The sign bits of Huffman codeword-based steganography for AAC audio[C]. Ningbo, China:IEEE Computer Society, 2010]中的方法,在相對(duì)嵌入率為100%的情況下載體音頻(cover)和 載密音頻(stego)之間MDCT系數(shù)幀間一階差分的Markov轉(zhuǎn)移概率之間的差異;圖3所示 為該音頻MDCT系數(shù)幀間二階差分的Markov轉(zhuǎn)移概率之間的差異。由圖可見(jiàn),cover音頻 和stego音頻在隱寫(xiě)前后MDCT系數(shù)之間的相關(guān)性發(fā)生了改變。
[0086] 雖然隱寫(xiě)對(duì)MDCT系數(shù)的相關(guān)性有所改變,但是由于樣本的多樣性,單一的幀間或 幀內(nèi)相關(guān)性統(tǒng)計(jì)特征并不能有效的對(duì)cover音頻和stego音頻進(jìn)行有效的區(qū)分,因此,本發(fā) 明針對(duì)幀內(nèi)和幀間MDCT系數(shù)關(guān)系構(gòu)造多個(gè)相關(guān)性統(tǒng)計(jì)子特征,并利用隨機(jī)森林組合分類(lèi) 器對(duì)融合后特征進(jìn)行分類(lèi)。
[0087] 步驟2 :將得到的隱寫(xiě)分析集合G采用隨機(jī)森林分類(lèi)器進(jìn)行分類(lèi),其具體實(shí)現(xiàn)包括 以下子步驟:
[0088] 步驟2. 1 :分類(lèi)器訓(xùn)練,其具體實(shí)現(xiàn)包括以下子步驟:
[0089] 步驟2. I. 1 :輸入Wav樣本,分別生成cover樣本和對(duì)應(yīng)的stego樣本,并按照步 驟1的方法提取分類(lèi)特征;
[0090] 步驟2. 1. 2 :經(jīng)過(guò)步驟2. I. 1過(guò)程后,得到訓(xùn)練集樣本和數(shù)量相等的不同嵌入算法 載密樣本,然后隨機(jī)選擇不同數(shù)量的stego樣本和對(duì)應(yīng)的cover樣本共同訓(xùn)練通用隱寫(xiě)分 析模型;
[0091] 步驟2. 2 :利用步驟2. 1. 2中得到的通用隱寫(xiě)分析模型對(duì)樣本進(jìn)行隱寫(xiě)分析檢測(cè), 得到樣本的隱寫(xiě)判斷結(jié)果,其具體實(shí)現(xiàn)包括以下子步驟:
[0092] 步驟2. 2. 1 :提取待測(cè)樣本的隱寫(xiě)分析特征集合;
[0093] 步驟2. 2. 2 :將特征輸入通用隱寫(xiě)分析模型,得到樣本的隱寫(xiě)判斷結(jié)果。
[0094] 為了驗(yàn)證本發(fā)明算法的有效性,本發(fā)明針對(duì)不同隱寫(xiě)方法訓(xùn)練通用的隱寫(xiě)分析模 型,實(shí)驗(yàn)結(jié)果如表1所示。其中TPR表示載密音頻(stego)的檢測(cè)為stego的概率,TNR表 示載體音頻(cover)檢測(cè)為cover的檢測(cè)率。
[0095] 實(shí)驗(yàn)結(jié)果表明,在96kbps和128kbps編碼模式下,本文通用模型對(duì)已有的三種針 對(duì)MDCT系數(shù)修改的隱寫(xiě)方法都有較好的檢測(cè)能力,在相對(duì)嵌入率為50%時(shí),檢測(cè)率都能達(dá) 到80%以上,在相對(duì)嵌入率為80 %時(shí),檢測(cè)率都能達(dá)到95%以上。
[0096] 表1隱寫(xiě)分析實(shí)驗(yàn)結(jié)果
[0097] CN 105118512 A 說(shuō)明書(shū) 7/8 頁(yè)
[0098] 其中:
[0099] Wang [1]表不文獻(xiàn)[Wang, Y, L. Guo and C. Wang. Steganography Method for Advanced Audio Coding. Journal of Chinese Computer System, 2011. 07.]中記載的方 法;
[0100] Zhu [2]表不文獻(xiàn)[Zhu J, Wang R, Yan D. The sign bits of Huffman codeword-based steganography for AAC audio[C]. Ningbo, China: IEEE Computer Society, 2010.]中記載的方法;
[0101] Zhu [3]表不 文南犬[Zhu, J. . The research on information hiding in MPEG_2/4Advanced Audio Coding(AAC) [D]· Ningbo University, 2〇l2·]中記載的方法;
[0102] 下面本發(fā)明對(duì)基于長(zhǎng)短幀特性融合算法對(duì)隱寫(xiě)分析檢測(cè)性能的影響進(jìn)行分析。分 別對(duì)以下三種模式提取特征的檢測(cè)性能進(jìn)行對(duì)比分析,載密樣本采用算法Zhu[2]。
[0103] 模式一:在特征提取時(shí)不按照幀類(lèi)型對(duì)AAC數(shù)據(jù)幀進(jìn)行劃分。
[0104] 模式二:在特征提取時(shí)按照幀類(lèi)型將AAC數(shù)據(jù)幀劃分為兩個(gè)集合,但是對(duì)每個(gè)集 合提取隱寫(xiě)分析特征后并不對(duì)每個(gè)特征集合增加權(quán)值。
[0105] 模式三:特征提取時(shí)按幀類(lèi)型將AAC數(shù)據(jù)幀劃分為兩個(gè)集合,并對(duì)每個(gè)集合提取 的隱寫(xiě)分析特征進(jìn)行加權(quán)處理。
[0106] 利用上述特征提取模式驗(yàn)證本發(fā)明算法的有效性包括以下步驟:
[0107] 步驟1 :利用不同的特征提取方式對(duì)訓(xùn)練集樣本進(jìn)行特征提取。
[0108] 步驟2 :利用不同方式提取的特征集合進(jìn)行分類(lèi)實(shí)驗(yàn)。
[0109] 表2不同特征提取模式的樣本誤分率
[0111] 表2為三種特征提取模式在不同嵌入率情況下的樣本誤分率??梢钥闯?,未區(qū)分 長(zhǎng)短幀的特征提取模式(模式一)的誤分率最高,按照幀類(lèi)型對(duì)AAC音頻劃分集合后(模 式二)在各個(gè)相對(duì)嵌入率樣本下都能有效的降低樣本誤分率,而對(duì)AAC音頻不同集合增加 權(quán)值的方法(模式三)則能進(jìn)一步提升分類(lèi)效果,因此本文所提出的基于AAC長(zhǎng)短幀特性 融合的策略是有效的。
[0112] 應(yīng)當(dāng)理解的是,本說(shuō)明書(shū)未詳細(xì)闡述的部分均屬于現(xiàn)有技術(shù)。
[0113] 應(yīng)當(dāng)理解的是,上述針對(duì)較佳實(shí)施例的描述較為詳細(xì),并不能因此而認(rèn)為是對(duì)本 發(fā)明專(zhuān)利保護(hù)范圍的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的啟示下,在不脫離本發(fā)明權(quán) 利要求所保護(hù)的范圍情況下,還可以做出替換或變形,均落入本發(fā)明的保護(hù)范圍之內(nèi),本發(fā) 明的請(qǐng)求保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
【主權(quán)項(xiàng)】
1. 一種面向AAC數(shù)字音頻的通用隱寫(xiě)分析方法,其特征在于,包括以下步驟: 步驟1 :提取AAC音頻長(zhǎng)幀特征和短幀特征,其具體實(shí)現(xiàn)包括以下子步驟: 步驟1. 1 :將AAC文件解碼至頂DCT變換階段,得到量化MDCT系數(shù),并將量化MDCT系數(shù) 按幀類(lèi)型分為兩個(gè)集合:長(zhǎng)幀集合Fi和短幀集合Fs,對(duì)其分別構(gòu)造MDCT系數(shù)矩陣%和Ms, 將Fi集合每一幀MDCT系數(shù)作為該相關(guān)性矩陣的一行:其中,育為Fi中第i幀的MDCT系數(shù),內(nèi)幀的數(shù)量; 將Fs集合每一幀的1024個(gè)MDCT系數(shù)轉(zhuǎn)化為一個(gè)8*128子矩陣,然后將所有子矩陣按 一木空(;祐114:.其中,為Fs中第i幀的MDCT系數(shù),N3為Fs集合中幀的數(shù)量; 步驟1. 2 :對(duì)矩陣凡和Mi分別計(jì)算幀間、幀內(nèi)的一階差分和二階差分,每個(gè)集合可以得 到4個(gè)差分矩陣C、其中order表示差分階數(shù),取值1或2 ;type表示特征提取的方向, 取值"inter"或"intra"Winter"表示幀間相鄰系數(shù)之間的差分,"intra"表示幀內(nèi)相鄰 系數(shù)之間的差分,r,c分別為矩陣M的行和列的索引;步驟1. 3 :對(duì)差分矩陣D(De )按式五進(jìn)行閾值處理,設(shè)置閾值 T,對(duì)任意D},r、c為矩陣D的行列索引;步驟1. 4 :對(duì)差分矩陣D計(jì)算Markov轉(zhuǎn)移概率和累積鄰接密度,MDCT系數(shù)差分矩陣D的Markov轉(zhuǎn)移概率頂?shù)挠?jì)算式為式六,累積鄰接密度INJ的計(jì)算式為式七,在幀內(nèi)相關(guān)性 特征提取時(shí),概率計(jì)算方向?yàn)閹瑑?nèi)方向;在幀間相關(guān)性特征提取時(shí),概率計(jì)算方向?yàn)閹g方 向;其中,!11,11£[-4,4],隊(duì),凡分別為差分矩陣0的行數(shù)和列數(shù);5(*)為數(shù)學(xué)算子,條件 滿足時(shí)為值1,否則為0 ;當(dāng)計(jì)算幀間關(guān)系時(shí),ki= 1,k2= 0 ;當(dāng)計(jì)算幀內(nèi)關(guān)系時(shí),ki= 0,k2 =1 ;每個(gè)差分矩陣得到兩個(gè)子特征,兩個(gè)集合共得到16種隱寫(xiě)分析子特征; 步驟1. 5 :將兩個(gè)集合的隱寫(xiě)分析子特征賦予權(quán)值,融合后形成最終的隱寫(xiě)分析集合G: G= {aCdi),PC(MS)}(式八); 其中,C( ?)為相關(guān)性計(jì)算運(yùn)算,a和0分別為C%)和C(MS)對(duì)特征集合G的貢獻(xiàn) 程度; 步驟2 :將得到的隱寫(xiě)分析集合G采用隨機(jī)森林分類(lèi)器進(jìn)行分類(lèi),其具體實(shí)現(xiàn)包括以下 子步驟: 步驟2. 1 :分類(lèi)器訓(xùn)練,得到通用隱寫(xiě)分析模型; 步驟2. 2 :利用步驟2. 1中得到的通用隱寫(xiě)分析模型對(duì)樣本進(jìn)行隱寫(xiě)分析檢測(cè),得到樣 本的隱寫(xiě)判斷結(jié)果。2. 根據(jù)權(quán)利要求1所述的面向AAC數(shù)字音頻的通用隱寫(xiě)分析方法,其特征在于:步驟 1. 3中所述的T= 4。3. 根據(jù)權(quán)利要求1所述的面向AAC數(shù)字音頻的通用隱寫(xiě)分析方法,其特征在于:步驟 1. 5中所述的a和0,其計(jì)算公式為:其中K為長(zhǎng)幀數(shù)量,Ns為短幀數(shù)量。4. 根據(jù)權(quán)利要求1所述的面向AAC數(shù)字音頻的通用隱寫(xiě)分析方法,其特征在于:步驟 2. 1中所述的分類(lèi)器訓(xùn)練,其具體實(shí)現(xiàn)包括以下子步驟: 步驟2. 1. 1 :輸入Wav樣本,分別生成cover樣本和對(duì)應(yīng)的stego樣本,并按照步驟1的 方法提取分類(lèi)特征; 步驟2. 1.2 :經(jīng)過(guò)步驟2. 1. 1過(guò)程后,得到訓(xùn)練集樣本和數(shù)量相等的不同嵌入算法載密 樣本,然后隨機(jī)選擇不同數(shù)量的stego樣本和對(duì)應(yīng)的cover樣本共同訓(xùn)練通用隱寫(xiě)分析模 型。5. 根據(jù)權(quán)利要求1所述的面向AAC數(shù)字音頻的通用隱寫(xiě)分析方法,其特征在于:步驟 2. 2中所述的利用步驟2. 1. 2中得到的通用隱寫(xiě)分析模型對(duì)樣本進(jìn)行隱寫(xiě)分析檢測(cè),其具 體實(shí)現(xiàn)包括以下子步驟: 步驟2. 2. 1 :提取待測(cè)樣本的隱寫(xiě)分析特征集合; 步驟2. 2. 2 :將特征輸入通用隱寫(xiě)分析模型,得到樣本的隱寫(xiě)判斷結(jié)果。
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種面向AAC數(shù)字音頻的通用隱寫(xiě)分析方法,本發(fā)明采用Markov轉(zhuǎn)移概率和累積鄰接密度作為相關(guān)性評(píng)價(jià)標(biāo)準(zhǔn)從幀間和幀內(nèi)提取相關(guān)性子特征,根據(jù)AAC編碼特性對(duì)子特征進(jìn)行融合,采用隨機(jī)森林分類(lèi)器對(duì)AAC樣本進(jìn)行二分類(lèi)。本發(fā)明針對(duì)不同隱寫(xiě)算法的stego樣本統(tǒng)一訓(xùn)練分類(lèi)模型,實(shí)現(xiàn)了面向AAC的通用隱寫(xiě)分析。
【IPC分類(lèi)】G10L25/27, G10L19/018
【公開(kāi)號(hào)】CN105118512
【申請(qǐng)?zhí)枴緾N201510437226
【發(fā)明人】任延珍, 熊浩, 王麗娜
【申請(qǐng)人】武漢大學(xué)
【公開(kāi)日】2015年12月2日
【申請(qǐng)日】2015年7月23日