一種基于音頻斷點(diǎn)的時(shí)域數(shù)字音頻水印方法
【專利說明】
[0001]
技術(shù)領(lǐng)域
[0002] 本發(fā)明屬于音頻信號(hào)處理和音頻制品專利保護(hù)領(lǐng)域,涉及音頻信號(hào)的水印嵌入和 提取。
[0003]
【背景技術(shù)】
[0004] 今年來,隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的產(chǎn)生和迅猛發(fā)展,大量的數(shù)字化音樂制品在網(wǎng)絡(luò) 上廣泛的傳播。這樣一來,對(duì)非法分子來說,音頻作品的復(fù)制,篡改和發(fā)布都已經(jīng)變得非常 容易。這就給版權(quán)所有者和整個(gè)音樂市場帶來了巨大的損失。
[0005] 基于這一背景,用于數(shù)字作品版權(quán)保護(hù)的數(shù)字水印技術(shù)就發(fā)展了起來,數(shù)字音頻 水印算法主要分為時(shí)間域和變換域數(shù)字水印算法。時(shí)域水印算法主要有P.Bassia等人提 出的最低有效位(LSB)算法和由W.Bender等人提出的回聲隱藏算法等;變換域水印算法主 要有擴(kuò)頻水印算法、相位水印算法、離散傅里葉變換域算法、離散余弦變換域算法和離散小 波變換域算法等。
[0006] 時(shí)域下的音頻水印算法原理比較簡單易于理解,但也存在致命的弱點(diǎn)。比如,最 低有效位算法對(duì)某些信號(hào)處理技術(shù)比較敏感,魯棒性較差;回聲隱藏算法雖然具有較好的 感知透明性和一定的魯棒性,但利用回聲檢測的辦法是很容易把水印信息檢測出來的。變 換域的音頻水印算法一般都具有較好的性能,可以滿足一些苛刻的要求,但是這類算法需 要算法編寫者具備一些高等的數(shù)學(xué)知識(shí)和過硬的編程能力,且程序中的操作會(huì)讓人很難理 解。就拿離散小波變換預(yù)(DWT)算法來說,鈕心忻等人在2000年提出了一種基于小波變換 的數(shù)字水印算法。它將高斯白噪聲作為水印信號(hào)嵌入到音頻信號(hào)的小波變換域中,先選擇 適當(dāng)?shù)男〔ɑ鶎?duì)原音頻信號(hào)進(jìn)行L級(jí)分解,然后只對(duì)第L級(jí)的詳細(xì)分量 < 中絕對(duì)值最大 的前N(假設(shè)N為水印信號(hào)的長度)個(gè)值做關(guān)于水印信號(hào)x(i) (i=l,2,_ ? *,N)的特定 公式變換。同樣的,相應(yīng)的水印檢測算法是先對(duì)音頻信號(hào)進(jìn)行相同的小波變換,然后根據(jù)原 始的音頻信號(hào)找到隱藏的N個(gè)隨機(jī)數(shù)的位置并求出相應(yīng)的數(shù)值(i) (i=l,2,_ ? *,N)。 最后,由X'和x的相關(guān)函數(shù)計(jì)算出的相關(guān)系數(shù)可以判別是否有正確的水印信號(hào)的存在。雖 然小波變換具有良好的時(shí)頻局部特性,但非信號(hào)處理相關(guān)專業(yè)的學(xué)者們甚至連離散傅里葉 變換(DFT)都不知道是什么,這就給算法編寫帶來了技術(shù)上的障礙。
[0007] 由于這些原因,在時(shí)域中尋求各方面性能較好的數(shù)字水印算法就顯得較為重要。 本發(fā)明所提出的水印算法是在時(shí)域下,嵌入少量的音頻斷點(diǎn)(零信號(hào))并根據(jù)水印信息來 改變音頻斷點(diǎn)周圍原音頻信號(hào)的能量值來達(dá)到嵌入水印的目的的,水印的提取依賴音頻斷 點(diǎn)。原理簡單,編程過程并不繁雜。經(jīng)實(shí)驗(yàn),效果感知透明性,魯棒性等都較好,值得進(jìn)一步 研宄和探索。
[0008]
【發(fā)明內(nèi)容】
[0009] (一)要解決的技術(shù)問題 本發(fā)明的目的,是要提供一種時(shí)域下基于音頻斷點(diǎn)嵌入和提取數(shù)字音頻水印的方法, 依據(jù)水印信息的數(shù)值和原始音頻的能量值直接在原始音頻的基礎(chǔ)上改變其能量值的大小。 這種算法充分考慮了原始音頻的能量情況,最好還輔以有一套水印嵌入位置選取規(guī)則(本 發(fā)明中并未實(shí)現(xiàn)),只在原始信號(hào)的基礎(chǔ)之上稍作改動(dòng),在不影響或很少影響原始音頻聽覺 質(zhì)量的前提條件下,保證水印具有較好的魯棒性,抗裁剪性和很少的信息增加量(音頻的長 度增加非常少)。在水印的提取環(huán)節(jié),提取算法要具備能夠自行篩選出嵌入水印的位置,排 除一些在數(shù)值邏輯上看似是水印的信息,但是須大量保存原始水印信息的能力。這就需要 算法研宄者對(duì)音頻信號(hào)做較多的研宄分析,制定出多重合理的水印信息篩選工序。
[0010]此外,雖不算是本發(fā)明的范圍,對(duì)水印信息的加密處理也是必須的。因?yàn)楫?dāng)不法分 子獲得水印的提取規(guī)則和音頻分段信息后,就能夠很容易的篡改水印的信息,這對(duì)音頻的 作者會(huì)造成很大的經(jīng)濟(jì)、個(gè)人名譽(yù)和知識(shí)產(chǎn)權(quán)方面的損失。
[0011] 本發(fā)明所用的水印提取方案只需要一些原始音頻的分段信息和水印信號(hào)的重構(gòu) 參數(shù),不需要原始音頻和原始水印的參與,是一種盲水印算法,因此實(shí)用性較好。
[0012](二)技術(shù)方案 為達(dá)到上述目的,本發(fā)明采用以下方案: 1、 首先將水印信號(hào)平均分成P份,然后將音頻信號(hào)等分成t份,再將每一份等分成P 份,表明將水印信息重復(fù)插入t次,每一次將其分成P份插入到每一個(gè)小模塊中,共分fxJP 份插入; 2、 依據(jù)一定水印嵌入規(guī)則,依次改變?cè)家纛l中相應(yīng)位置的能量值,并在其前中后都 插入用于信息標(biāo)識(shí)的音頻斷點(diǎn),其長度為Z; 3、將第2步中所修改過的音頻片段(共份,且前中后都插入斷點(diǎn))和剩余無需修 改的音頻片段按照原音頻的時(shí)間順序重新拼接好,并再寫成一首完整的音樂文件; 4、 將重新寫好后的音頻按照事先規(guī)定的分段信息t和p的值分段,然后為了減少工作 時(shí)間,設(shè)置選擇因子,將音頻信號(hào)大概嵌入水印的位置和其前后的一小段音頻都選擇下來, 用于下一步檢測; 5、 對(duì)選擇下來的每一份音頻信號(hào)從頭至尾進(jìn)行檢測,每一次檢測以一串長度為 3*z+2*p_l的數(shù)據(jù)串為單位,將滿足條件的音頻信號(hào)比特位的數(shù)據(jù)串信息的首地址記錄下 來; 6、 將滿足條件的首地址按所在的分段號(hào)分成組別前后做差,對(duì)這些差值進(jìn)行篩選,選 出值大小合理且出現(xiàn)次數(shù)最多的定為最后的水印間隔final_interval。從每一組的首地址 中選出最合理的一個(gè)(滿足條件的第一個(gè))放入對(duì)應(yīng)數(shù)組new_position的相應(yīng)位置上去, 并且憑借間隔final_interval推算出所有首地址; 7、 先憑借算出的首地址信息提取出所有嵌入水印的數(shù)據(jù)串,然后根據(jù)p和h的值將水 印重新編排成一幅幅水印圖像,并將完整的多幅圖像疊加。根據(jù)事先存好置亂迭代參數(shù)運(yùn) 用Arnold反變換恢復(fù)出目標(biāo)水印圖像; 8、將嵌入水印信息的WAV文件壓縮成其他格式的音頻文件,如MP3、FLAC、APE等,然后 再將其解壓成WAV文件,使用檢測算法提取其中的水印信息并作出相關(guān)評(píng)價(jià)。由于水印嵌 入多次,所以該算法一定具有較好的抗裁剪性能。對(duì)于水印算法的聽覺透明性,可以直接通 過人耳的聽覺情況做出評(píng)價(jià),實(shí)驗(yàn)表明這一性能較好。此外,對(duì)于一般的數(shù)字信號(hào)處理,可 以對(duì)嵌入水印的音頻信號(hào)做濾波、重采樣、加噪等操作,然后再用檢測算法去做提取操作并 做出合理的評(píng)價(jià)。
[0013] 本發(fā)明的用途與優(yōu)越性(有益效果) 1、 這種水印算法能夠提取成功的關(guān)鍵在于音頻中嵌入的斷點(diǎn)。經(jīng)實(shí)驗(yàn)表明,當(dāng)音頻中 的斷點(diǎn)持續(xù)時(shí)間在2ms以下,人耳是很難分辨出的。這就給這種算法在必須滿足聽覺要求 的原則上帶來了操作的可行性。
[0014] 2、本水印算法是在時(shí)域中根據(jù)目標(biāo)水印圖像來直接改動(dòng)原始音頻中某些位置的 音頻能量值,這種水印信息就存在于本身音頻信號(hào)的差別之中,故水印能夠抵抗一般的數(shù) 字信號(hào)處理。加之,這種差別對(duì)于本身的音頻來說實(shí)在是太微弱,一般人耳很難分辨的出, 有較好聽覺特性。此外,雖然還未實(shí)現(xiàn),但如果水印嵌入的位置能夠根據(jù)原始音頻的能量信 息(嵌入的位置使得在原始音頻的基礎(chǔ)上須作改動(dòng)操作的較少或者水印所在位置整體能 量值的細(xì)微改動(dòng)難引起人耳的感覺)來確定,那么水印嵌入算法的聽覺特性會(huì)更加優(yōu)越。
[0015] 3、這種水印算法提出的意義在于,已有的時(shí)域水印算法在原理上都很簡單,如最 低有效位算法和回聲隱藏算法等,此類算法大多不具有較好的魯棒性或是較容易檢測出水 印信息,故用于音樂作品的版權(quán)保護(hù)可能稍顯不足;而一般的變換域水印算法,諸如離散余 弦變換域算法和離散小波變換域算法等,雖然具備良好的聽覺特性和魯棒性,但在原理上 就給許多未深入研宄的人帶來了理解上的困難,且一般加入音頻中的水印信息是高斯白噪 聲這一類的事先預(yù)存好的信息,這就降低了版權(quán)的說服力。本發(fā)明的操作對(duì)象是時(shí)域上直 接比特位音頻能量值,通俗易懂,并且實(shí)驗(yàn)證明還具備良好的聽覺特性和魯棒性(嵌入操作 需待改進(jìn)),這就給本發(fā)明帶來了一定的價(jià)值。
[0016]
【附圖說明】
[0017] 1、圖1為嵌入的水印信息的編排方式; 2、 圖2為插入水印信息和斷點(diǎn)前后局部音頻信號(hào)的變化情況,圖(a)中顯示的是原始 音頻信號(hào)局部時(shí)域波形圖像而圖(b)中顯示了插入水印和斷點(diǎn)后的局部音頻波形圖像,上 下對(duì)比可以發(fā)現(xiàn),插入水印信息的波形圖對(duì)于原波形來說并沒有較大的改變,這種細(xì)微的 能量改變不僅將水印信息隱藏在了原始音頻上,而且由于其對(duì)于整首音頻來說實(shí)在是微乎 其微,所以又保證了較好的聽覺特性; 3、 圖3為水印的提取框圖; 4、 圖4中所展示的是將同一嵌入水印的WAV格式的音頻壓縮成不同格式的音頻,再將 其反壓縮成WAV格式的音頻,并從中提取出水印的圖像,從左至右依次是:原WAV格式,MP3, FLAC,APE。可以看到,從FLAC和APE反壓縮后的音頻文件中提取出的水印圖像和原插