本發(fā)明涉及一種基于參數(shù)擬合安全容量的自適應(yīng)批量隱寫方法,屬于信息安全
技術(shù)領(lǐng)域:
:中的信息隱藏技術(shù)子領(lǐng)域。
背景技術(shù):
::隱寫是一種隱蔽通信的技術(shù)。它在載體信號的數(shù)據(jù)冗余中嵌入隱蔽信息,達到掩蓋通信事實的目的。隨著計算機、智能設(shè)備和互聯(lián)網(wǎng)絡(luò)技術(shù)的發(fā)展與普及,多媒體(如:圖像、音頻和音視頻等)被廣泛使用。圖像、音頻的數(shù)據(jù)表達的精度已經(jīng)遠遠高過人類感官能察覺的程度,因而冗余度較高,可以用來隱藏信息,不易被第三者察覺。直接從多媒體采集到的載體稱為原文,如:從相機拍攝到的JPEG圖像等。原文載體經(jīng)過具體隱寫算法嵌入隱蔽信息得到的新文件稱為隱文。一般衡量隱寫的程度時,隱蔽信息占原文可嵌入位置的比例稱為嵌入率,原文所有可嵌入位置在隱寫中被修改的比例稱為改動率。隱寫方法與保護通信內(nèi)容的傳統(tǒng)密碼學(xué)結(jié)合,可以起到掩蓋通信事實的作用,可用于個人隱藏私密信息,或企業(yè)隱藏商業(yè)秘密。相應(yīng)地,隱寫分析(Steganalysis)是指判斷給定樣本是否藏有隱蔽信息或藏有隱蔽信息程度的技術(shù),一般通過提取特征、訓(xùn)練分類器和預(yù)測等統(tǒng)計模式識別方法實現(xiàn)。隱寫行為一旦被識別出來,則隱寫失敗,隱蔽通信無法繼續(xù)。雖然當前最為有效的隱寫分析方法可以檢測高隱蔽性隱寫方法的低嵌入率水平,但其準確率并非100%,且存在一定的錯誤率。由于隱寫對原文修改量輕微的特點,嵌入率或改動率很少的隱寫很難被隱寫分析算法完全準確識別。由此,定義安全容量為一種閾值,嵌入量在安全容量以下,最有效的隱寫分析算法仍存在較大的(如:20%以上)錯誤率(參考文獻:Filler,T.,andJ.Fridrich."GibbsConstructioninSteganography."InformationForensics&SecurityIEEETransactionson5.4(2010):705-720.)。在隱寫方面存在多種方法,早期的算法主要基于最低有效位(LeastSignificantBit,LSB)、量化索引調(diào)制(QuantizationIndexModulation,QIM)和擴頻水印(SpreadSpectrum,SS)等。在這些方法的基礎(chǔ)上,衍生出一些增強隱蔽性的手段,包括:通過口令隨機置亂嵌入位置,借助編碼學(xué)方法在少量的矩陣里,通過內(nèi)容自適應(yīng)技術(shù)結(jié)合綜合征網(wǎng)格碼(SyndromeTrellisCodes,STC)手段選擇紋理復(fù)雜的位置做嵌入。目前高隱蔽性隱寫算法大多結(jié)合上述特點,達到比基本隱寫算法高出約7倍以上的安全容量。事實上,隱寫者有能力獲得多幅圖像,并將隱蔽信息分散在多個原文中嵌入。最直接的方法有集中嵌入于一個原文、均勻地分散嵌入在各個原文中(參考文獻:Ker,AndrewD."BatchSteganographyandPooledSteganalysis."InternationalConferenceonInformationHiding2006,Springer-Verlag,2006:265-281.)。然而,圖像之間是具有屬性區(qū)別的,研究人員認為,可嵌入位置和圖像的紋理屬性對安全容量有很大影響(參考文獻:Rainer.AssessmentofSteganalyticMethodsUsingMultipleRegressionModels.InternationalConferenceonInformationHiding.SpringerBerlinHeidelberg,2005:278--295.)。然而,目前在載體選擇方面存在無知識、部分知識和全知識三類(參考文獻:Kharrazi,Mehdi,H.T.Sencar,andN.Memon."CoverSelectionforSteganographicEmbedding."InternationalConferenceonImageProcessingIEEE,2006:117-120.)。其中,無知識和部分知識的方法沒有利用分類器輸出結(jié)果的信息,雖然實現(xiàn)較為簡單,但優(yōu)選載體并不夠精準。全知識類的載體選擇,定性地看,主要選擇較難被分析的原文用于嵌入;而定量地分析則是預(yù)測安全容量,用以控制嵌入率或改變率不被隱寫分析算法察覺。本發(fā)明人認為,隱寫安全容量是可以通過實驗計算的,而且,原文的屬性(以圖像為例,如:尺寸、可嵌入位置、紋理度量等)存在指示隱寫安全容量的可行性。首先,原文可以依據(jù)其屬性分類,并使用特定的隱寫算法隨機嵌入定量的信息,用當前最有效的隱寫分析算法統(tǒng)計其分類器的錯誤率,在閾值臨界線附近的嵌入率或改變率度量值即為安全容量。第二,上述因素可以和該安全容量進行函數(shù)擬合或分布擬合,在一定精準程度上可以用于預(yù)測安全容量。例如,圖像大小的平方根和安全容量近似成正比的遞增關(guān)系。專利申請?zhí)枮?013106908364的中國專利“基于MCUU模型下的DCT域圖像隱寫容量的評估方法”公開了一種基于MCUU(MaximizeCapacityunderundetectable)模型下的DCT域圖像隱寫容量的評估方法。該專利方法提出MCUU模型,通過對原文進行隱寫時不斷增加隱寫嵌入量并進入隱寫分析計算準確率的方式獲得圖像的隱寫容量,得出隱寫容量與圖像大小、嵌入強度和圖像復(fù)雜度之間的關(guān)系。該專利方法主要給出驗證隱寫容量與圖像屬性具有關(guān)系的方法,局限于DCT域圖像,目的在于對圖像各屬性與隱寫容量影響關(guān)系的揭示。此外,該專利缺乏具體預(yù)測模型來擬合圖像屬性與安全容量之間的關(guān)系,對于未來采集到新圖像需要隱寫時,并不能定量指示其安全容量。專利申請?zhí)枮?015106454411的中國專利“基于智能移動終端的圖像隱寫系統(tǒng)”公開了一種基于智能移動終端的圖像隱寫系統(tǒng)。該專利的方法包括圖像采集、存儲、提取、類型識別、類型轉(zhuǎn)換、預(yù)處理、模塊、發(fā)送和秘密信息提取模塊,最終將隱寫圖像發(fā)給接收方。該專利方法描述了在移動終端下的圖像隱寫分析系統(tǒng)的隱寫流程,但需要指出的是,雖然專利提出了圖像隱寫系統(tǒng)需要的構(gòu)成模塊,但并未涉及長度較大的隱蔽信息如何在多個載體中分配嵌入量或嵌入率的問題,也未進行安全容量的預(yù)估,在使用時有可能會大大超過安全容量而喪失隱蔽性。技術(shù)實現(xiàn)要素:本發(fā)明的目的在于提供一種基于參數(shù)擬合安全容量的自適應(yīng)批量隱寫方法,用于在隱寫者有能力制備多個樣本時,在多樣本間調(diào)整嵌入率,從而降低隱寫分析者判斷的準確率。為此,本發(fā)明采用的具體方案如下:本發(fā)明的基本流程是:1)構(gòu)造樣本庫與樣本屬性知識庫。大量制備原文庫并制備對應(yīng)不同嵌入率的密文庫,放入特定的隱寫分析算法里做預(yù)測。同時,構(gòu)造樣本屬性的知識庫,即對樣本屬性度量的函數(shù)庫(例如:包括樣本尺寸或可嵌入位置數(shù)量,樣本信號的紋理復(fù)雜度等),計算得到樣本的屬性度量。2)預(yù)估已有樣本安全容量。將以上步驟1)得到的樣本屬性度量值按照特定的粒度(如:圖像可嵌入位置按每個數(shù)量級分級)分類。分別統(tǒng)計每類中的樣本在以上步驟1)得到的隱寫分析預(yù)測結(jié)果的準確率。根據(jù)用戶設(shè)定的準確率閾值得到安全容量。3)建立模型和參數(shù)擬合。將以上步驟1)得到的樣本屬性度量值和以上步驟2)得到的安全容量,用常用的曲線(或曲面)模型或概率分布模型做擬合,選用擬合度高的模型,并使用樣本屬性度量值與安全容量估計所選模型的參數(shù)。4)預(yù)測新樣本安全容量。在實用階段,制備得到一組樣本,將該樣本提取與步驟1)相同的屬性,并放入步驟3)得到的預(yù)測模型中做預(yù)測,如果隱蔽信息比安全容量預(yù)測結(jié)果的總和大,則應(yīng)繼續(xù)制備樣本,或按安全容量的比例關(guān)系依次提高嵌入率。其中,以上步驟1)—3)為學(xué)習(xí)階段,得到估計模型和參數(shù),步驟4)為實用階段,學(xué)習(xí)階段得到的模型和參數(shù)可以多次使用,不需要每次重新計算模型,因而便于在便攜設(shè)備上計算。只有在新的隱寫算法和更有效的隱寫分析算法出現(xiàn)的時候更新預(yù)測結(jié)果。相應(yīng)地,在隱寫提取時,只要設(shè)置嵌入消息的長度、偏移量和校驗碼等,原文提取時因為校驗失敗而被忽略。將提取的信息分片按其偏移量合并,即可以有效恢復(fù)出原信息。本發(fā)明所采用的隱寫方法總體包括如下步驟(所有步驟都由計算機軟件在用戶的配置參數(shù)下完成):S1、構(gòu)造樣本庫與樣本屬性知識庫,并計算樣本屬性度量值;S2、通過隱寫分析算法預(yù)估已有樣本安全容量;S3、以步驟S1得到的樣本屬性度量值和步驟S2得到的安全容量為依據(jù)建立安全容量模型并擬合該安全容量模型的參數(shù);S4、用步驟S3得到的安全容量模型及其參數(shù)來預(yù)測新樣本的安全容量,根據(jù)用戶選取的隱蔽信息與所預(yù)測的安全容量的比較結(jié)果調(diào)整嵌入率、確定最終隱寫容量并進行嵌入,從而完成批量隱寫。進一步地,所述步驟S1包括以下子步驟:S11、構(gòu)造樣本庫,使用多媒體采集設(shè)備采集或制備大量原文集C={c1,c2,...,cn},遍歷嵌入率由0至1,通過嵌入長度為rj的隱蔽信息得到隱文集其中E為隱寫嵌入方法,k為算法所需的密鑰;S12、將樣本放入隱寫分析算法D里做預(yù)測,得到預(yù)測值{y=D(x)},其中x為原文集C或隱文集S的成員;S13、構(gòu)建對樣本屬性度量的函數(shù)庫M={m},其中,m包括但不限于樣本尺寸、可嵌入位置數(shù)量或樣本信號的紋理復(fù)雜度;S14、計算得到樣本的屬性度量其中,ci來自原文集C。所述步驟S2包括以下子步驟:S21、將所述步驟S14得到的樣本屬性度量值集合V(m)按照該屬性取值范圍確定適合的粒度分類,得到各類的樣本集S22、分別統(tǒng)計每類中的樣本在所述步驟S12得到的隱寫分析預(yù)測結(jié)果的準確率其中,為類中的元素個數(shù),為中的元素,E(c,r,k)為對原文c以k為參數(shù)嵌入長度為r的隱蔽信息得到的隱文,根據(jù)用戶設(shè)定的準確率閾值pT得到安全容量使得為滿足的最小r值。進一步地,所述步驟S3包括以下子步驟:S31、將每類樣本屬性度量值的均值與所述步驟S22得到的安全容量用曲線模型或概率分布模型φ做擬合;S32、對步驟S31的所有模型計算擬合優(yōu)度,優(yōu)先選擇使用擬合度高的模型φ,并使用所述樣本屬性度量值{vi}與所述安全容量來估計所選模型的參數(shù)θ,使得r'=φ(v),以預(yù)測出與相近的安全容量預(yù)測值。進一步地,所述曲線模型包括但不限于線性模型、多項式模型或多項式相除模型,所述概率分布模型包括但不限于二項式分布模型、正態(tài)分布模型、泊松分布模型或拉普拉斯分布模型。進一步地,所述步驟S4包括以下子步驟:S41、制備一組原文樣本{xi},選取需要嵌入的一段長度為a的隱蔽信息;S42、計算樣本集{xi}的屬性值{vi},并將該樣本屬性值代入所述步驟S32獲得的安全容量模型ri'=φ(vi)中,計算獲得樣本安全容量S43、如果a>∑ri',則增加制備原文樣本直到a≤∑ri';在條件不允許增加制備原文樣本的情況下,則按照確定新的嵌入量分配;S44、將已有的隱蔽信息按照步驟S43得到的嵌入量{ri'}進行分片,并將長度為ri'的隱蔽信息分片嵌入到原文樣本xi中,從而完成批量隱寫。至此,基于參數(shù)擬合安全容量的自適應(yīng)批量隱寫方法已經(jīng)獲得,可以投入運行,得出使隱寫分析難以檢測的嵌入率分布。其中,步驟S3得到的模型φ和參數(shù)θ可以一次獲得,多次用于實際場景即步驟S4中,因而,步驟S4可以獨立運行。本發(fā)明具有的有益效果是:(1)降低了批量隱寫被隱寫分析系統(tǒng)發(fā)現(xiàn)的準確率。本發(fā)明采用的建模和參數(shù)擬合的方法,根據(jù)大量樣本學(xué)習(xí)得到用于預(yù)測新樣本安全容量的預(yù)測模型,確保實用中預(yù)測得到的安全容量能夠盡量降低隱寫分析者的準確率,即降低隱寫分析者分析結(jié)果的可靠性。(2)有效提升了隱寫系統(tǒng)整體的隱蔽性。本發(fā)明采用建立數(shù)學(xué)模型的方法預(yù)測安全容量,結(jié)果更加準確。隱寫系統(tǒng)是長期使用的,如果隱寫者某次未意識到其采用的嵌入率超過安全容量,則容易被隱寫分析識別出來,而導(dǎo)致隱蔽通信無法繼續(xù)。(3)實用階段計算量小易于在便攜設(shè)備上實現(xiàn)。本發(fā)明在學(xué)習(xí)階段得到的模型及參數(shù),可以并在實用階段多次使用,不需要在每次預(yù)測安全容量時做一次提取特征,降低了實用階段的運行時間。附圖說明圖1是本發(fā)明的基于參數(shù)擬合安全容量的自適應(yīng)批量隱寫方法的流程圖;圖2是本發(fā)明構(gòu)造樣本庫和樣本屬性知識庫并預(yù)估已有圖庫安全容量的流程圖;圖3是本發(fā)明建立模型和擬合參數(shù)的流程圖;圖4是本發(fā)明預(yù)測新樣本安全容量的流程圖。具體實施方式為進一步說明各實施例,本發(fā)明提供有附圖。這些附圖為本發(fā)明揭露內(nèi)容的一部分,其主要用以說明實施例,并可配合說明書的相關(guān)描述來解釋實施例的運作原理。配合參考這些內(nèi)容,本領(lǐng)域普通技術(shù)人員應(yīng)能理解其他可能的實施方式以及本發(fā)明的優(yōu)點。現(xiàn)結(jié)合附圖和具體實施方式對本發(fā)明進一步說明。本發(fā)明提出的基于參數(shù)擬合安全容量的自適應(yīng)批量隱寫方法,適用于將較長的隱蔽信息分片嵌入到一組圖像中的情形,兼容于將少量信息嵌入到單個文本的情形,用于控制嵌入量不超過安全隱寫容量。其主要過程框架包括:構(gòu)造樣本庫和樣本屬性知識庫、預(yù)估已有樣本安全容量、建立模型和參數(shù)擬合、預(yù)測新樣本安全容量。通過本發(fā)明,隱寫使用者在學(xué)習(xí)階段可以構(gòu)造樣本庫和樣本知識庫,計算樣本的屬性度量,預(yù)估樣本庫中樣本的安全容量并以屬性度量和安全容量為依據(jù)建立模型、擬合其參數(shù),在實用階段,可以制備樣本并計算其屬性值,利用上述學(xué)習(xí)階段得到的模型預(yù)測樣本的安全容量并實施隱寫。下面結(jié)合附圖和示例,以將300KB隱蔽信息文件分散地嵌入到10幅4MB級別的JPEG圖像中為例,對本發(fā)明的技術(shù)框架流程做詳細描述。圖1描述了本發(fā)明的整體流程,包括4個過程:S1、構(gòu)造樣本庫和樣本屬性知識庫,計算樣本屬性度量值等為后續(xù)步驟做準備;S2、通過隱寫分析算法預(yù)估已有樣本安全容量,用于模型的建立和參數(shù)的擬合;S3、以樣本屬性度量值和已有圖庫的安全容量為依據(jù)建立安全容量模型并擬合其參數(shù);S4、根據(jù)建立好的模型和其參數(shù)預(yù)測新樣本的安全容量并根據(jù)實際情況進行調(diào)整嵌入率、確定最終隱寫容量。參照圖2,描述構(gòu)造樣本庫及樣本屬性知識庫并預(yù)估已有樣本安全容量的過程S1、S2,可分為3個流程:1、構(gòu)造樣本庫;2、樣本屬性度量值計算;3、已有圖庫安全容量預(yù)估。在構(gòu)造樣本庫時,首先使用多媒體采集設(shè)備(如:手機相機、錄音機和錄像機等)采集或制備大量(能支持后續(xù)按屬性分類每類在100個樣本以上)原文集C={c1,c2,...,cn},然后遍歷嵌入率由0至1,通過嵌入長度為rj的隱蔽信息得到隱文集其中E為隱寫嵌入方法,k為算法所需的密鑰等其它參數(shù)。在一實例中,用手機拍照得到500幅圖像(1000萬像素,約300萬可嵌入位置),遍歷嵌入率由0至1,根據(jù)經(jīng)驗可知JPEG圖像安全的嵌入率一般在0~0.4bpac(每非零AC系數(shù)嵌入比特數(shù))之間,每隔0.05bpac采樣,得到9種嵌入率。遍歷上述嵌入率,隨機產(chǎn)生長度為0~0.4*3,000,000/8的字節(jié)數(shù)組為模擬的隱蔽信息,使用J-UNIWARD隱寫工具對上述500幅圖像依次嵌入得到500*9=4,500幅隱寫圖像。在樣本屬性度量值計算時,首先構(gòu)建對樣本屬性度量的函數(shù)庫M={m},其中m包括但不限于:樣本尺寸和可嵌入位置數(shù)量,樣本信號的紋理復(fù)雜度等方法。不同樣本格式(圖像、音頻、音視頻等)的樣本屬性不同。由于樣本尺寸在本情況已固定,該實例僅考慮線性預(yù)測誤差模型(LPE)方法。然后計算樣本屬性度量值其中ci來自原文集C。在已有樣本安全容量預(yù)估時,首先將樣本放入特定的隱寫分析算法D里做預(yù)測,得到預(yù)測值{y=D(x)},其中x為原文集C或隱文集S的成員。然后分別統(tǒng)計每類中的樣本在以上步驟1c)得到的隱寫分析預(yù)測結(jié)果的準確率其中為類中的元素個數(shù),為中的元素,E(c,r,k)為對原文c以k為參數(shù)嵌入長度為r的隱蔽信息得到的隱文。根據(jù)用戶設(shè)定的準確率閾值pT得到安全容量使得為滿足的最小r值。在該實例中,將樣本載體與上述以嵌入率劃分的9種隱寫圖分別成對放入特定的隱寫分析算法D里做預(yù)測,如:使用經(jīng)過訓(xùn)練的JPEG富模型(JSRM)特征的線性分類器,得到預(yù)測值{y=D(x)},如:-1、-1、+1、……等;將樣本屬性度量值計算階段得到的樣本屬性度量值按照特定的粒度分類,得到B1,B2,...,BN,如:將所有線性預(yù)測誤差(LPE)值按照大小排列共劃分為10個等級;分別統(tǒng)計每類中的樣本在的隱寫分析預(yù)測結(jié)果的準確率根據(jù)用戶設(shè)定的準確率閾值pT得到安全容量rsec使得rsec為滿足的最小r值。如根據(jù)設(shè)定閾值為0.80,得到在每一類中的值。參照圖3,描述建立模型和參數(shù)擬合的過程S3。主要分為3個過程:1、構(gòu)建模型集合;2、篩選模型;3、參數(shù)擬合。在構(gòu)建模型集合時,選取常見的曲線(或曲面)模型和概率模型構(gòu)建待擬合的模型集合Φ,曲線(或曲面)模型包括但不限于:線性模型、多項式模型、多項式相除模型等,如線性模型為:y=bx+a;概率模型包括但不限于:二項式分布模型、正態(tài)分布模型、泊松分布模型和拉普拉斯分布模型等。在篩選模型時,將每類樣本屬性度量值的均值與安全容量用集合Φ中的每一個元素做擬合,計算其擬合優(yōu)度。以線性模型φ1:y=bx+a(x、y可以為標量,也可以為向量)為例,以樣本判定系數(shù)R2作為擬合優(yōu)度,R2越大,擬合優(yōu)度越高。計算公式如下:其他模型的擬合優(yōu)度也可以采用相應(yīng)的方法計算得出。計算出各個元素的擬合優(yōu)度后,優(yōu)先選擇使用擬合度高的模型φ∈Φ,并使用上述樣本屬性度量值v與安全容量估計所選模型的參數(shù)θ。使得:r'=φ(v,θ)可以預(yù)測出與相近的安全容量預(yù)測值。例如,篩選得到的模型為線性模型φ1:y=bx+a(x、y可以為標量,也可以為向量),經(jīng)過構(gòu)造樣本庫及樣本屬性知識庫和預(yù)估已有圖庫安全容量的過程,現(xiàn)已獲得足夠多組一一對應(yīng)的樣本屬性度量值均值和安全容量的散點數(shù)據(jù),以樣本屬性度量值均值為自變量x,安全容量為因變量y,采用線性回歸的方法,計算參數(shù)集合θ1{b,a}中元素的值:從而擬合獲得了模型φ1:y=bx+a的參數(shù)集合θ1,即:{b,a}。其他模型的參數(shù)集合也可以采用相應(yīng)的方法計算得出。參照圖4,描述預(yù)測新樣本容量的過程S4。主要分為4個過程:1、樣本制備;2、安全容量預(yù)測;3、嵌入量調(diào)整;4、實際嵌入。在樣本制備時,制備一組原文樣本{xi},樣本由用戶制備,例如通過手機拍照得到10幅大小約為4MB的JPEG圖像作為載體圖;用戶選取需要嵌入的一段長度為a的隱蔽信息,如300KB。在安全容量預(yù)測時,計算樣本屬性值vi=m(xi),這里屬性值的計算方式應(yīng)與構(gòu)造樣本庫和樣本屬性知識庫時計算樣本屬性值的方式相同;將屬性值作為自變量代入安全容量模型r′i=φ(vi)中,計算獲得因變量r′i,即預(yù)測的樣本安全容量在嵌入調(diào)整階段時,如果a>∑ri',則用戶應(yīng)增加制備原文樣本直到a≤∑ri'以保證安全性;在條件不允許增加制備原文樣本的情況下,或a≤∑ri'時,則按照確定新的嵌入量分配,以盡量降低被隱寫分析發(fā)現(xiàn)的概率。在實際嵌入時,將已有的300KB隱蔽信息按照上述步驟得到的嵌入量{ri'}進行分片,并將長度為ri'的隱蔽信息分片對應(yīng)嵌入到上述圖像xi中,得到10幅隱寫圖像。本發(fā)明方法通過計算機程序自動估算已有樣本的隱寫安全容量,自適應(yīng)地將樣本的屬性(如:可嵌入位置數(shù)量)和安全容量之間建立模型,利用曲線擬合或分布擬合技術(shù)得到經(jīng)驗公式,并將該經(jīng)驗公式用于預(yù)測將來使用中制備得到的原文樣本,估算其安全容量。盡管結(jié)合優(yōu)選實施方案具體展示和介紹了本發(fā)明,但所屬領(lǐng)域的技術(shù)人員應(yīng)該明白,在不脫離所附權(quán)利要求書所限定的本發(fā)明的精神和范圍內(nèi),在形式上和細節(jié)上可以對本發(fā)明做出各種變化,均為本發(fā)明的保護范圍。當前第1頁1 2 3 當前第1頁1 2 3