一種面向aac數(shù)字音頻的通用隱寫分析方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于數(shù)字媒體處理技術(shù)領(lǐng)域,特別涉及一種判別AAC音頻是否經(jīng)過秘密信 息隱寫的方法。 技術(shù)背景:
[0002] 移動通信技術(shù)的飛速發(fā)展,使得MP3、AAC等音頻壓縮標(biāo)準(zhǔn)在移動互聯(lián)網(wǎng)中得到廣 泛應(yīng)用,同時面向此類壓縮音頻的隱寫算法和工具也逐漸涌現(xiàn),給音頻隱寫分析帶來了新 的挑戰(zhàn)。AAC(Advanced Audio Coding,高級音頻編碼)是3GPP組織指定的音頻壓縮標(biāo)準(zhǔn), 其目的是取代MP3標(biāo)準(zhǔn)。與MP3相比,AAC的壓縮性能更加高效,已經(jīng)被各大廠商設(shè)備所支 持,如Apple、Nokia、Sony、Real等。AAC的隱寫嵌入域主要包括MDCT系數(shù)、量化參數(shù)、以及 Huffman編碼參數(shù)等。MDCT系數(shù)是AAC的主要編碼參數(shù),占AAC數(shù)據(jù)總量的70%以上,由 于MDCT系數(shù)的局部微量調(diào)整不會帶來明顯的聽覺感知,因此通過對MDCT系數(shù)進(jìn)行修改的 隱寫算法具有良好的隱蔽性和隱藏容量。
[0003] 目前針對MP3的隱寫分析方法相對較多,但是針對AAC壓縮域的通用隱寫分析方 法還未見公開文獻(xiàn)。由于MP3與AAC編碼原理的相似性,因此面向MP3的隱寫分析方法可 以對AAC隱寫分析方法的提出起到一定的參考作用。MP3的隱寫嵌入域與AAC基本相同, 目前針對MP3的隱寫分析方法主要集中在MP3Stego,現(xiàn)有隱寫分析方法從兩個角度進(jìn)行分 析,一類是專用隱寫分析思路,即從隱寫算法對音頻壓縮數(shù)據(jù)所引入的參數(shù)變化進(jìn)行分析, 此類方法專用性強,對于其他修改MDCT系數(shù)的隱寫方法則無效。第二類采用通用隱寫分析 思路,即從隱寫算法所引入的MDCT系數(shù)之間的關(guān)系統(tǒng)計特性方面進(jìn)行分析,這類算法不僅 可以針對MP3Stego隱寫分析工具,對于其他MDCT系數(shù)修改類隱寫方法也具有一定的適用 性。
[0004] 但是,現(xiàn)有MP3的隱寫分析思路主要針對MP3Stego隱寫方法,由于MP3Stego隱寫 時根據(jù)秘密信息控制量化過程,導(dǎo)致相鄰幀間量化步長的差異增大,經(jīng)過量化后,MP3同一 子帶間的MDCT系數(shù)相關(guān)性有明顯的減弱,因此在針對MP3Stego進(jìn)行隱寫分析時,從幀間同 一子帶提取相關(guān)性特征能取得較好的檢測效果。然而AAC的MDCT隱寫算法是對幀內(nèi)不同 區(qū)域的MDCT系數(shù)進(jìn)行微小的調(diào)整,由于MDCT系數(shù)修改位置的不確定性以及MDCT系數(shù)修改 數(shù)量的限制,導(dǎo)致隱寫對幀間相關(guān)性的影響并不大,將現(xiàn)有針對MP3的幀間隱寫分析特征 直接應(yīng)用于AAC MDCT的通用隱寫分析效果并不明顯。
[0005] 本發(fā)明的通用隱寫分析檢測方法基于AAC (Advanced Audio Coding),在
【發(fā)明內(nèi)容】
陳述之前需要對AAC的編解碼原理進(jìn)行介紹。
[0006] 如圖1所示為AAC的編碼原理,其編碼過程包括5個主要步驟:心理聲學(xué)模型分 析、濾波器MDCT變換、可選編碼模塊、MDCT系數(shù)量化和熵編碼,其中MDCT變換和量化過程 是AAC編碼的核心處理過程。AAC采用時域混疊編碼方式,對輸入的脈沖編碼調(diào)制時域音 頻信號進(jìn)行分幀,每幀包含1024個時域抽樣信號,當(dāng)前幀與前一幀時域樣本信號共同組成 2048個時域抽樣信號,經(jīng)過心理聲學(xué)模型分析,判斷窗長度(濾波器每次進(jìn)行MDCT變換的 長度),對每個窗計算全局增益,然后按窗進(jìn)行濾波器MDCT變換,得到1024個頻譜系數(shù)經(jīng)過 可選編碼模塊(時域噪聲整形、聯(lián)合立體聲編碼、預(yù)測模塊等頻域處理)后,對得到的MDCT 系數(shù)按比例因子帶進(jìn)行量化,最后通過Huffman編碼,與其他編碼參數(shù)共同組成AAC音頻碼 流。
[0007] 其中相關(guān)術(shù)語解釋如下:
[0008] (1)壓縮音頻:指經(jīng)過有損壓縮的音頻,如MP3、WMA、AAC均為有損壓縮音頻。
[0009] (2)量化:為了降低編碼復(fù)雜度,使用比例因子將較大的MDCT系數(shù)量化為編碼適 合的MDCT系數(shù),量化過程屬于有損過程。
[0010] (3)Cover :載體音頻,即未進(jìn)行秘密信息嵌入的音頻。
[0011] (4) Stego :載密音頻,即進(jìn)行了秘密信息嵌入的音頻。
[0012] (5)幀間關(guān)系:表示以幀為獨立單位的前后兩幀之間的關(guān)系。
[0013] (6)幀內(nèi)關(guān)系:表示以單個MDCT系數(shù)為單位與其前后MDCT系數(shù)之間的關(guān)系。
[0014] (7)差分:表不一組信號之間的噪聲殘差。
[0015] (8)子特征:采用一種特征提取方式得到的特征子集合。
[0016] (9)特征集合:將多種子特征經(jīng)過融合之后得到的高維特征集。
[0017] (10)隨機森林分類:采用隨機森林分類器對待測樣本進(jìn)行二分類(即劃分為 cover 或者 stego) 〇
【發(fā)明內(nèi)容】
[0018] 本發(fā)明針對目前面向AAC隱寫分析方法相對缺少的問題,提供了一種面向AAC數(shù) 字音頻的通用隱寫分析方法。
[0019] 本發(fā)明所采用的技術(shù)方案是:一種面向AAC數(shù)字音頻的通用隱寫分析方法,其特 征在于,包括以下步驟:
[0020] 步驟1 :提取AAC音頻長幀特征和短幀特征,其具體實現(xiàn)包括以下子步驟:
[0021] 步驟I. 1 :將AAC文件解碼至頂DCT變換階段,得到量化MDCT系數(shù),并將量化MDCT 系數(shù)按幀類型分為兩個集合:長幀集合F1和短幀集合F s,對其分別構(gòu)造MDCT系數(shù)矩陣%和 Ms,將F1集合每一幀MDCT系數(shù)作為該相關(guān)性矩陣的一行:
[0022] Mf4 = {?,…,尤,H
[0023] 其中,f/為F丨中第i幀的MDCT系數(shù),N丨為F丨內(nèi)幀的數(shù)量;
[0024] 將Fs集合每一幀的1024個MDCT系數(shù)轉(zhuǎn)化為一個8*128子矩陣,然后將所有子矩 陣按行排列形成一個新矩陣:
[0025] C·'心={?……/;; };
[0026] 其中,€為Fs中第i幀的MDCT系數(shù),N1^F s集合中幀的數(shù)量;
[0027] 步驟1. 2 :對矩陣MJPM1分別計算幀間、幀內(nèi)的一階差分和二階差分,每個集合可 以得到4個差分矩陣M,:廣;其中order表示差分階數(shù),取值1或2 ;type表示特征提取的方 向,取值"inter"或"化廿&";"1拉虹"表示幀間相鄰系數(shù)之間的差分,"111廿&"表示幀內(nèi)相 鄰系數(shù)之間的差分,r,c分別為矩陣M的行和列的索引; CN 105118512 A 兄明 3/8 頁
[0032] 步驟I. 3 :對差分矩陣D ( De ,M二,)按式五進(jìn)行閾值處理,設(shè)置 閾值T,對任意D},r、c為矩陣D的行列索引;
[0034] 步驟1. 4 :對差分矩陣D計算Markov轉(zhuǎn)移概率和累積鄰接密度,MDCT系數(shù)差分矩 陣D的Markov轉(zhuǎn)移概率頂?shù)挠嬎闶綖槭搅?,累積鄰接密度INJ的計算式為式七,在幀內(nèi)相 關(guān)性特征提取時,概率計算方向為幀內(nèi)方向(即水平方向);在幀間相關(guān)性特征提取時,概 率計算方向為幀間方向(即垂直方向);
[0037] 其中,111,11£[-4,4],隊,凡分別為差分矩陣0的行數(shù)和列數(shù);5(*)為數(shù)學(xué)算子, 條件滿足時為值1,否則為〇 ;當(dāng)計算幀間關(guān)系時,Ii1= 1,k2= 0 ;當(dāng)計算幀內(nèi)關(guān)系時,k i = 0, k2= 1 ;每個差分矩陣得到兩個子特征,兩個集合共得到16種隱寫分析子特征;
[0038] 步驟1. 5 :將兩個集合的隱寫分析子特征賦予權(quán)值,融合后形成最終的隱寫分析 集合G :
[0039] G =HC(M1) ,PC(Ms)}(式八);
[0040] 其中,C( ·)為相關(guān)性計算運算,α和β分別為C(M1)和C(Ms)對特征集合G的 貢獻(xiàn)程度;
[0041] 步驟2 :將得到的隱寫分析集合G采用隨機森林分類器進(jìn)行分類,其具體實現(xiàn)包括 以下子步驟:
[0042] 步驟2. 1 :分類器訓(xùn)練,得到通用隱寫分析模型;
[0043] 步驟2. 2 :利用步驟2. 1中得到的通用隱寫分析模型對樣本進(jìn)行隱寫分析檢測,得 到樣本的隱寫判斷結(jié)果。
[0044] 作為優(yōu)選,步驟1 · 3中所述的T = 4。
[0045] 作為優(yōu)選,步驟1. 5中所述的α和β,其計算公式為:
[0048] 其中N1為長幀數(shù)量,N s為短幀數(shù)量。
[0049] 作為優(yōu)選,步驟2. 1中所述的分類器訓(xùn)練,其具體實現(xiàn)包括以下子步驟:
[0050] 步驟2. I. 1 :輸入Wav樣本,分別生成cover樣本和對應(yīng)的stego樣本,并按照步 驟1的方法提取分類特征;
[0051] 步驟2. 1. 2 :經(jīng)過步驟2. I. 1過程后,得到訓(xùn)練集樣本和數(shù)量相等的不同嵌入算法 載密樣本,然后隨機選擇不同數(shù)量的stego樣本和對應(yīng)的cover樣本共同訓(xùn)練通用隱寫分 析模型。
[0052] 作為優(yōu)選,步驟2. 2中所述的利用步驟2. 1. 2中得到的通用隱寫分析模型對樣本 進(jìn)行隱寫分析檢測,其具體實現(xiàn)包括以下子步驟:
[0053] 步驟2. 2. 1 :提取待測樣本的隱寫分析特征集合;
[0054] 步驟2. 2. 2 :將特征輸入通用隱寫分析模型,得到樣本的隱寫判斷結(jié)果。
[0055] 本發(fā)明的技術(shù)方案采用Markov轉(zhuǎn)移概率和累積鄰接密度作為相關(guān)性評價標(biāo)準(zhǔn)從 幀間和幀內(nèi)提取相關(guān)性子特征,根據(jù)AAC編碼特性對子特征進(jìn)行融合,采用隨機森林分類 器對AAC樣本進(jìn)行二分類。本發(fā)明針對不同隱寫算法的stego樣本統(tǒng)一訓(xùn)練分類模型,實 現(xiàn)了面向AAC的通用隱寫分析。
【附圖說明】
[0056] 圖1 :是本發(fā)明現(xiàn)有技術(shù)中AAC編解碼流程圖;
[0057] 圖2 :是本發(fā)明實施例中AAC MDCT系數(shù)幀間一階差分Markov相關(guān)性特征差異圖, 其中(a)為載體音頻,(b)為載密音頻,(c)為載體音頻和載密音頻的特征差;
[0058] 圖3 :是本發(fā)明實施例中AAC MDCT系數(shù)幀間二階差分Markov相關(guān)性特征差異圖, 其中(a)為載體音頻,(b)為載密音頻,(c)為載體音頻和載密音頻的特征差;
[0059] 圖4 :是本發(fā)明實施例的特征提取流程圖。
【具體實施方式】
[0060] 為了便于本領(lǐng)域普通技術(shù)人員理解和實施本發(fā)明,下面結(jié)合附圖及實施例對本發(fā) 明作進(jìn)一步的詳細(xì)描述,應(yīng)當(dāng)理解,此處所描述的實施示例僅用于說明和解釋本發(fā)明,并不 用于限定本發(fā)明。
[0061] 本發(fā)明針對目前面向AAC隱寫分析方法相對缺少的問題,提供了一種面向AAC數(shù) 字音頻的通用隱寫分析方法,包括以下步驟:
[0062] 步驟1 :提取AAC音頻長幀特征和短幀特征,其具體實現(xiàn)包括以下子步驟:
[0063] 步驟I. 1 :將AAC文件解碼至頂DCT變換階段,得到量化MDCT系數(shù),并將量化MDCT 系數(shù)按幀類型分為兩個集合:長幀集合F1和短幀集合F s,對其分別構(gòu)造MDCT系數(shù)矩陣%和 Ms,將F1集合每一幀MDCT系數(shù)作為該相關(guān)性矩陣的一行:
[0064]
[0065] 其中,f/為F丨中第i幀的MDCT系數(shù),N丨為F丨內(nèi)幀的數(shù)量;
[0066] 將Fs集合每一幀的1024個MDCT系數(shù)轉(zhuǎn)化為一個8*128子矩陣,然后將所有子矩 陣按行排列形成一個新矩陣:
[0068] 其中,F(xiàn) s中第i幀的MDCT系數(shù),N 3為F s集合中幀的數(shù)量;
[0069] 步驟1. 2 :對矩陣MJPM1分別計算幀間、幀內(nèi)的一階差分和二階差分,每個集合可 以得到4個差分矩陣其中order表示差分階數(shù),取值1或2 ;type表示特征提取的方 向,取值"inter"或"化廿&";"1拉虹"表示幀間相鄰系數(shù)之間的