一種基于邊信息統(tǒng)計(jì)特性的mp3錄音文件來源識(shí)別方法

文檔序號(hào)：9867737閱讀：1359來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種基于邊信息統(tǒng)計(jì)特性的mp3錄音文件來源識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及MP3錄音文件來源的識(shí)別方法，具體是指一種基于邊信息統(tǒng)計(jì)特性的 MP3錄音文件來源識(shí)別方法。
【背景技術(shù)】
[0002] 隨著大數(shù)據(jù)時(shí)代的來臨，數(shù)字多媒體呈現(xiàn)爆炸式地增長(zhǎng)。但同時(shí)，多媒體數(shù)據(jù)量級(jí) 和使用頻率的增長(zhǎng)也促使多媒體編輯軟件得到了飛速發(fā)展，這就使得多媒體數(shù)據(jù)的偽造和篡改變得越來越容易。正因?yàn)榇耍覀兊纳钪谐涑庵罅康牟徽鎸?shí)、不可信的多媒體數(shù) 據(jù)。為了驗(yàn)證多媒體數(shù)據(jù)的原始性、真實(shí)性和完整性，多媒體取證技術(shù)應(yīng)運(yùn)而生。目前，國(guó)內(nèi) 外對(duì)數(shù)字多媒體取證的研究主要集中在圖像領(lǐng)域，而針對(duì)數(shù)字音頻取證技術(shù)的研究起步相對(duì)較晚，但作為多媒體取證的重要組成部分，其實(shí)際需求仍在不斷增長(zhǎng)，也正在受到越來越多的關(guān)注。
[0003] 音頻來源辨識(shí)是音頻取證的第一步工作，其目的是對(duì)音頻的原始性進(jìn)行驗(yàn)證，由于智能手機(jī)的快速普及，錄音行為的發(fā)生變得越來越方便。在日常生活中，人們更愿意用手機(jī)這種時(shí)刻隨身攜帶的設(shè)備去記錄聲音；因此，鑒別一個(gè)錄音文件來自于哪款品牌型號(hào)的手機(jī)是目前音頻來源取證領(lǐng)域里的一個(gè)熱點(diǎn)問題，而且近些年來也已有少量學(xué)者和研究團(tuán) 隊(duì)在這方面作了一些研究工作。例如C. Hanilci等人使用美爾倒譜系數(shù)(MFCC)作為特征對(duì) 14個(gè)不同型號(hào)手機(jī)的錄音文件進(jìn)行區(qū)分，該方法的檢測(cè)準(zhǔn)確率達(dá)到了 96.42%。在此基礎(chǔ)上，他們對(duì)比了包括MFCC在內(nèi)的4種聲學(xué)特征（另外3種分別為線性倒譜系數(shù)LFCC、巴克倒譜系數(shù)BFCC和線性預(yù)測(cè)倒譜系數(shù)LPCC)在設(shè)備來源識(shí)別方面的性能。根據(jù)對(duì)比結(jié)果，他們?nèi)匀徽J(rèn) 為MFCC是最好的特征。C. L. Kotropoulos通過使用稀疏表示對(duì)2049維的對(duì)數(shù)語(yǔ)譜特征和 2816維的高斯超向量特征成功進(jìn)行了降維，并使用對(duì)應(yīng)降維后的850維和120維特征對(duì)21種不同型號(hào)的手機(jī)進(jìn)行了分類，在使用3種不同分類器的情況下，前者檢測(cè)準(zhǔn)確率均超過了 94 · 84%，后者則為 98 · 41%-100%。
[0004] 這些方法雖然在音頻來源設(shè)備識(shí)別方面都取得了較好的識(shí)別效果，但據(jù)我們所知，利用錄音文件的碼流結(jié)構(gòu)以及編碼參數(shù)特性實(shí)現(xiàn)手機(jī)來源辨識(shí)還未見報(bào)道。而目前絕大多數(shù)智能手機(jī)默認(rèn)的錄音格式均為壓縮格式，且壓縮標(biāo)準(zhǔn)主要是MP3和AAC;另外，不同廠家、甚至相同廠家生產(chǎn)的不同型號(hào)的設(shè)備，其音頻模塊的硬件和軟件部分均有所差別，壓縮算法的具體實(shí)現(xiàn)以及與硬件的配合也有各自的特點(diǎn)，這就導(dǎo)致不同品牌型號(hào)手機(jī)對(duì)拾取的聲音信號(hào)進(jìn)行壓縮編碼時(shí)，對(duì)各種編碼參數(shù)的選擇和使用存在著差異，而通常這些編碼參數(shù)都保存在壓縮格式音頻每幀中的邊信息中；因此，基于邊信息統(tǒng)計(jì)特性來識(shí)別MP3錄音文件來源無疑是一種非?？煽康淖R(shí)別方法。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明所要解決的技術(shù)問題在于克服現(xiàn)有技術(shù)的缺陷而提供一種特征集構(gòu)建過程較為簡(jiǎn)便快速、算法復(fù)雜度低、識(shí)別準(zhǔn)確度高、實(shí)時(shí)性好、便于操作的一種基于邊信息統(tǒng) 計(jì)特性的MP3錄音文件來源識(shí)別方法。
[0006]本發(fā)明的技術(shù)問題通過以下技術(shù)方案實(shí)現(xiàn)：一種基于邊信息統(tǒng)計(jì)特性的MP3錄音文件來源識(shí)別方法，該識(shí)別方法包括如下步驟：步驟一、選擇多款品牌下各系列型號(hào)手機(jī)錄制的MP3錄音文件作為訓(xùn)練樣本，并使用 MP3編解碼器Lame-3.99.5提取該訓(xùn)練樣本的邊信息參數(shù);所述的邊信息參數(shù)包含主數(shù)據(jù)起始位置、比例因子選擇信息、及顆粒〇和顆粒1的邊信息，且主數(shù)據(jù)起始位置和比例因子選擇信息構(gòu)成兩個(gè)顆粒的公用參數(shù)，顆粒〇或顆粒1的邊信息均稱為獨(dú)立參數(shù)，分析該邊信息參數(shù)的使用情況和統(tǒng)計(jì)特性，建立手機(jī)型號(hào)與兩個(gè)顆粒的公用參數(shù)使用情況對(duì)照表，并使用獨(dú)立參數(shù)的部分統(tǒng)計(jì)量針對(duì)同品牌的手機(jī)構(gòu)建模型；步驟二、使用MP3編解碼器Lame-3.99.5提取待測(cè)MP3錄音文件的邊信息參數(shù)，檢測(cè)主數(shù) 據(jù)起始位置的值是否全為〇,進(jìn)而與步驟一建立的對(duì)照表進(jìn)行比對(duì)，初步圈定待測(cè)MP3錄音文件來源的手機(jī)品牌；步驟三、檢測(cè)待測(cè)MP3錄音文件邊信息中比例因子選擇信息在顆粒0的左聲道和右聲道中的值，通過該值與步驟一建立的對(duì)照表進(jìn)行比對(duì)，并從步驟二初步圈定的待測(cè)MP3錄音文件來源的幾個(gè)手機(jī)品牌中進(jìn)一步選定具體的手機(jī)品牌或某個(gè)手機(jī)品牌下的具體系列；步驟四、檢測(cè)待測(cè)MP3錄音文件邊信息中比例因子選擇信息在顆粒1的左聲道和右聲道中的值，通過該值與步驟一建立的對(duì)照表進(jìn)行比對(duì)，并從步驟三確定的手機(jī)品牌中進(jìn)一步確定具體系列或步驟三確定的手機(jī)系列中進(jìn)一步確定具體型號(hào)；步驟五、繼續(xù)分析待測(cè)MP3錄音文件邊信息中的每個(gè)顆粒獨(dú)立使用參數(shù)的參數(shù)值，根據(jù) 每個(gè)顆粒獨(dú)立使用參數(shù)的參數(shù)值的部分統(tǒng)計(jì)量構(gòu)建特征，所述的每個(gè)顆粒獨(dú)立使用參數(shù)的參數(shù)值的部分統(tǒng)計(jì)量與步驟一中針對(duì)訓(xùn)練樣本提取的統(tǒng)計(jì)量相一致;在此基礎(chǔ)上，通過使用LibSVM分類器，并結(jié)合步驟一中針對(duì)特定品牌手機(jī)構(gòu)建的模型，最終確定待測(cè)MP3錄音文件來自該手機(jī)品牌下哪個(gè)型號(hào)的手機(jī)。
[0007]所述的每個(gè)顆粒獨(dú)立使用參數(shù)包括6個(gè)參數(shù)，分別為part2_3_length、big_ values、global_gain、scalefac_compress、regionl_start、region2_start〇
[0008] 所述的語(yǔ)音樣本庫(kù)分為兩個(gè)集合，其中一個(gè)集合作為訓(xùn)練集，另一個(gè)集合作為測(cè) 試集，訓(xùn)練集和測(cè)試集各包含1480個(gè)時(shí)長(zhǎng)約為3秒的樣本，另外在使用分類器對(duì)待測(cè)MP3錄音文件的邊信息參數(shù)特征進(jìn)行訓(xùn)練和測(cè)試之前，對(duì)所有樣本的每一維特征都進(jìn)行歸一化處理，以降低不同特征值變化范圍不一致對(duì)分類器性能的不利影響。
[0009] 與現(xiàn)有技術(shù)相比，本發(fā)明的設(shè)計(jì)思路是通過分析MP3錄音文件碼流、也即MP3錄音文件幀中邊信息中各參數(shù)的使用特點(diǎn)及統(tǒng)計(jì)特性，從中找出不同品牌型號(hào)手機(jī)在生成MP3 錄音文件時(shí)使用這些參數(shù)的傾向或特點(diǎn)，從而實(shí)現(xiàn)對(duì)MP3錄音文件來源的辨識(shí)，即辨別給定的MP3文件是哪種品牌型號(hào)的手機(jī)錄制的，這種識(shí)別方法具有特征集構(gòu)建過程較為簡(jiǎn)便快速、算法復(fù)雜度低、識(shí)別準(zhǔn)確度高、實(shí)時(shí)性好、便于操作等優(yōu)點(diǎn)。
【附圖說明】
[001 0]圖1為本發(fā)明實(shí)施例的步驟流程示意圖。
[0011 ] 圖2為參數(shù)ain_data_begin的分布示意圖。
[0012] 圖3為MP3塊的分區(qū)示意圖。
[0013] 圖4為參數(shù)big_values的分布示意圖。
[0014] 圖5為參數(shù)global_gain的分布示意圖。
[0015]圖6為大值區(qū)的子區(qū)示意圖。
[0016] 圖7為參數(shù)regionl_start的分布示意圖。
[0017] 圖8為參數(shù)region2_start的分布示意圖。
[0018] 圖9為參數(shù)part2_3_length的分布示意圖。
[0019] 圖10為參數(shù)scalefac_compress的分布不意圖。
[0020] 圖11為大值區(qū)碼表索引分布示意圖。
[0021 ] 圖12為regionO區(qū)碼表索引分布示意圖。
[0022] 圖13為regionl區(qū)碼表索引分布示意圖。
[0023] 圖14為region2區(qū)碼表索引分布示意圖。
【具體實(shí)施方式】
[0024] 下面將按上述附圖對(duì)本發(fā)明實(shí)施例再作詳細(xì)說明。
[0025] 一種基于邊信息統(tǒng)計(jì)特性的MP3錄音文件來源識(shí)別方法，涉及的是通過研究MP3錄音文件邊信息中編碼參數(shù)的使用特點(diǎn)和統(tǒng)計(jì)特性，從而判斷一個(gè)MP3錄音文件是哪個(gè)品牌品牌下哪個(gè)型號(hào)的手機(jī)所錄制。
[0026] 在該識(shí)別方法中涉及了關(guān)于MP3錄音文件的概念說明，具體為： MP3編碼標(biāo)準(zhǔn) MP3全稱為MPEGl Layer-3，是MPEG標(biāo)準(zhǔn)中的音頻部分。MP3雖是有損壓縮，但它近CD的音質(zhì)、高壓縮比、開放性和易用性等優(yōu)勢(shì)使其從誕生一來便迅速成為主流的音頻格式，而且目前仍是數(shù)字音頻領(lǐng)域使用最為普遍的格式之一。MP3核心的編碼模塊主要由5部分組成，分別為子帶濾波器組、MDCT變換、心理聲學(xué)模型、量化和編碼、數(shù)據(jù)流封裝。具體過程是:輸入聲音信號(hào)一路經(jīng)過32個(gè)子帶濾波器組和MDCT變換進(jìn)行時(shí)頻轉(zhuǎn)換，同時(shí)另一路通過"心理聲學(xué)模型"計(jì)算每個(gè)子帶的信號(hào)能量和SMR。"量化和編碼"模塊利用SMR來決定分配給子帶信號(hào)的量化位數(shù)，使得量化噪音低于掩蔽閾值，最后通過"數(shù)據(jù)流幀包裝"將子帶的樣本及其他附加數(shù)據(jù)按幀的格式組裝成位比特流。
[0027] MP3幀結(jié)構(gòu) MP3數(shù)據(jù)流是以幀為最小單位進(jìn)行封裝，每幀數(shù)據(jù)通常包含幀頭(header)、冗余校驗(yàn) (CRC)、邊信息（side information)、主數(shù)據(jù)(main data)和輔助數(shù)據(jù)(ancillary data)5個(gè) 部分。幀頭由32比特的數(shù)據(jù)構(gòu)成，解碼時(shí)首先通過幀頭中的同步字確定解碼開始的位置，并從幀頭中提取該MP3的相關(guān)信息為后續(xù)的進(jìn)一步解碼鋪墊，如音頻信號(hào)的采樣率、聲道模式、比特率等。CRC校驗(yàn)是一個(gè)16位的奇偶校驗(yàn)字，用于檢查該幀數(shù)據(jù)在傳輸過程中是否出現(xiàn)了錯(cuò)誤。這是一個(gè)可選的信息，當(dāng)幀頭中的保護(hù)位為"Γ時(shí)表明有CRC校驗(yàn)，反之則沒有。邊信息中保存了主數(shù)據(jù)解碼需要使用的各種參數(shù)，如量化步長(zhǎng)、哈夫曼碼表索引等，邊信息的大小為130(單聲道)或246(雙聲道)位比特。緊接著邊信息的是主數(shù)據(jù)，也即原始音頻樣本編碼后的數(shù)據(jù)流。每一幀的主數(shù)據(jù)分為顆粒(Kgranule 0)和顆粒Ugranule 1)兩部分，每部分又由比例因子（scale factor)和哈夫曼碼字(Huffman codes)組成。最后的輔助數(shù) 據(jù)也是可選的，由用戶自己定義，里面存放一些與解碼無關(guān)音頻信息，如歌曲名、歌手、專輯之等信息。
[0028] 邊信息中參數(shù) 錄音設(shè)備錄制的聲音從PCM/PDM采樣值經(jīng)過壓縮編碼到最后形成MP3文件的過程均是基于上述流程，但不同型號(hào)設(shè)備在具體實(shí)現(xiàn)MP3標(biāo)準(zhǔn)的各個(gè)模塊時(shí)可能存在著差異，因此最后生成的MP3的碼流結(jié)構(gòu)及其參數(shù)統(tǒng)計(jì)特性也會(huì)有所區(qū)別。所以本發(fā)明的識(shí)別方法期望深入分析不同設(shè)備錄制的MP3文件邊信息中各參數(shù)的統(tǒng)計(jì)特性，從而找出各設(shè)備使用參數(shù)的特點(diǎn)。
[0029] 邊信息主要存儲(chǔ)了用于主數(shù)據(jù)解碼的參數(shù)，通常包括主數(shù)據(jù)起始位置（main_ data_begin)、比列因子選擇信息(scfsi)、以及顆粒0和顆粒1的邊信息，如表1所示。
[0030] 表1.邊信息結(jié)構(gòu)
根據(jù)表1對(duì)主要參數(shù)的作用進(jìn)行詳細(xì)介紹 (1)兩個(gè)顆粒共用的參數(shù)： mai

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3 4

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王讓定;金超;嚴(yán)迪群;陶表犁;陳亞楠;張立;
技術(shù)所有人：寧波大學(xué);
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于邊信息統(tǒng)計(jì)特性的mp3錄音文件來源識(shí)別方法