欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于邊信息統(tǒng)計(jì)特性的mp3錄音文件來源識(shí)別方法

文檔序號(hào):9867737閱讀:1359來源:國(guó)知局
一種基于邊信息統(tǒng)計(jì)特性的mp3錄音文件來源識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及MP3錄音文件來源的識(shí)別方法,具體是指一種基于邊信息統(tǒng)計(jì)特性的 MP3錄音文件來源識(shí)別方法。
【背景技術(shù)】
[0002] 隨著大數(shù)據(jù)時(shí)代的來臨,數(shù)字多媒體呈現(xiàn)爆炸式地增長(zhǎng)。但同時(shí),多媒體數(shù)據(jù)量級(jí) 和使用頻率的增長(zhǎng)也促使多媒體編輯軟件得到了飛速發(fā)展,這就使得多媒體數(shù)據(jù)的偽造和 篡改變得越來越容易。正因?yàn)榇耍覀兊纳钪谐涑庵罅康牟徽鎸?shí)、不可信的多媒體數(shù) 據(jù)。為了驗(yàn)證多媒體數(shù)據(jù)的原始性、真實(shí)性和完整性,多媒體取證技術(shù)應(yīng)運(yùn)而生。目前,國(guó)內(nèi) 外對(duì)數(shù)字多媒體取證的研究主要集中在圖像領(lǐng)域,而針對(duì)數(shù)字音頻取證技術(shù)的研究起步相 對(duì)較晚,但作為多媒體取證的重要組成部分,其實(shí)際需求仍在不斷增長(zhǎng),也正在受到越來越 多的關(guān)注。
[0003] 音頻來源辨識(shí)是音頻取證的第一步工作,其目的是對(duì)音頻的原始性進(jìn)行驗(yàn)證,由 于智能手機(jī)的快速普及,錄音行為的發(fā)生變得越來越方便。在日常生活中,人們更愿意用手 機(jī)這種時(shí)刻隨身攜帶的設(shè)備去記錄聲音;因此,鑒別一個(gè)錄音文件來自于哪款品牌型號(hào)的 手機(jī)是目前音頻來源取證領(lǐng)域里的一個(gè)熱點(diǎn)問題,而且近些年來也已有少量學(xué)者和研究團(tuán) 隊(duì)在這方面作了一些研究工作。例如C. Hanilci等人使用美爾倒譜系數(shù)(MFCC)作為特征對(duì) 14個(gè)不同型號(hào)手機(jī)的錄音文件進(jìn)行區(qū)分,該方法的檢測(cè)準(zhǔn)確率達(dá)到了 96.42%。在此基礎(chǔ)上, 他們對(duì)比了包括MFCC在內(nèi)的4種聲學(xué)特征(另外3種分別為線性倒譜系數(shù)LFCC、巴克倒譜系 數(shù)BFCC和線性預(yù)測(cè)倒譜系數(shù)LPCC)在設(shè)備來源識(shí)別方面的性能。根據(jù)對(duì)比結(jié)果,他們?nèi)匀徽J(rèn) 為MFCC是最好的特征。C. L. Kotropoulos通過使用稀疏表示對(duì)2049維的對(duì)數(shù)語(yǔ)譜特征和 2816維的高斯超向量特征成功進(jìn)行了降維,并使用對(duì)應(yīng)降維后的850維和120維特征對(duì)21種 不同型號(hào)的手機(jī)進(jìn)行了分類,在使用3種不同分類器的情況下,前者檢測(cè)準(zhǔn)確率均超過了 94 · 84%,后者則為 98 · 41%-100%。
[0004] 這些方法雖然在音頻來源設(shè)備識(shí)別方面都取得了較好的識(shí)別效果,但據(jù)我們所 知,利用錄音文件的碼流結(jié)構(gòu)以及編碼參數(shù)特性實(shí)現(xiàn)手機(jī)來源辨識(shí)還未見報(bào)道。而目前絕 大多數(shù)智能手機(jī)默認(rèn)的錄音格式均為壓縮格式,且壓縮標(biāo)準(zhǔn)主要是MP3和AAC;另外,不同廠 家、甚至相同廠家生產(chǎn)的不同型號(hào)的設(shè)備,其音頻模塊的硬件和軟件部分均有所差別,壓縮 算法的具體實(shí)現(xiàn)以及與硬件的配合也有各自的特點(diǎn),這就導(dǎo)致不同品牌型號(hào)手機(jī)對(duì)拾取的 聲音信號(hào)進(jìn)行壓縮編碼時(shí),對(duì)各種編碼參數(shù)的選擇和使用存在著差異,而通常這些編碼參 數(shù)都保存在壓縮格式音頻每幀中的邊信息中;因此,基于邊信息統(tǒng)計(jì)特性來識(shí)別MP3錄音文 件來源無疑是一種非??煽康淖R(shí)別方法。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明所要解決的技術(shù)問題在于克服現(xiàn)有技術(shù)的缺陷而提供一種特征集構(gòu)建過 程較為簡(jiǎn)便快速、算法復(fù)雜度低、識(shí)別準(zhǔn)確度高、實(shí)時(shí)性好、便于操作的一種基于邊信息統(tǒng) 計(jì)特性的MP3錄音文件來源識(shí)別方法。
[0006]本發(fā)明的技術(shù)問題通過以下技術(shù)方案實(shí)現(xiàn): 一種基于邊信息統(tǒng)計(jì)特性的MP3錄音文件來源識(shí)別方法,該識(shí)別方法包括如下步驟: 步驟一、選擇多款品牌下各系列型號(hào)手機(jī)錄制的MP3錄音文件作為訓(xùn)練樣本,并使用 MP3編解碼器Lame-3.99.5提取該訓(xùn)練樣本的邊信息參數(shù);所述的邊信息參數(shù)包含主數(shù)據(jù)起 始位置、比例因子選擇信息、及顆粒〇和顆粒1的邊信息,且主數(shù)據(jù)起始位置和比例因子選擇 信息構(gòu)成兩個(gè)顆粒的公用參數(shù),顆粒〇或顆粒1的邊信息均稱為獨(dú)立參數(shù),分析該邊信息參 數(shù)的使用情況和統(tǒng)計(jì)特性,建立手機(jī)型號(hào)與兩個(gè)顆粒的公用參數(shù)使用情況對(duì)照表,并使用 獨(dú)立參數(shù)的部分統(tǒng)計(jì)量針對(duì)同品牌的手機(jī)構(gòu)建模型; 步驟二、使用MP3編解碼器Lame-3.99.5提取待測(cè)MP3錄音文件的邊信息參數(shù),檢測(cè)主數(shù) 據(jù)起始位置的值是否全為〇,進(jìn)而與步驟一建立的對(duì)照表進(jìn)行比對(duì),初步圈定待測(cè)MP3錄音 文件來源的手機(jī)品牌; 步驟三、檢測(cè)待測(cè)MP3錄音文件邊信息中比例因子選擇信息在顆粒0的左聲道和右聲道 中的值,通過該值與步驟一建立的對(duì)照表進(jìn)行比對(duì),并從步驟二初步圈定的待測(cè)MP3錄音文 件來源的幾個(gè)手機(jī)品牌中進(jìn)一步選定具體的手機(jī)品牌或某個(gè)手機(jī)品牌下的具體系列; 步驟四、檢測(cè)待測(cè)MP3錄音文件邊信息中比例因子選擇信息在顆粒1的左聲道和右聲道 中的值,通過該值與步驟一建立的對(duì)照表進(jìn)行比對(duì),并從步驟三確定的手機(jī)品牌中進(jìn)一步 確定具體系列或步驟三確定的手機(jī)系列中進(jìn)一步確定具體型號(hào); 步驟五、繼續(xù)分析待測(cè)MP3錄音文件邊信息中的每個(gè)顆粒獨(dú)立使用參數(shù)的參數(shù)值,根據(jù) 每個(gè)顆粒獨(dú)立使用參數(shù)的參數(shù)值的部分統(tǒng)計(jì)量構(gòu)建特征,所述的每個(gè)顆粒獨(dú)立使用參數(shù)的 參數(shù)值的部分統(tǒng)計(jì)量與步驟一中針對(duì)訓(xùn)練樣本提取的統(tǒng)計(jì)量相一致;在此基礎(chǔ)上,通過使 用LibSVM分類器,并結(jié)合步驟一中針對(duì)特定品牌手機(jī)構(gòu)建的模型,最終確定待測(cè)MP3錄音文 件來自該手機(jī)品牌下哪個(gè)型號(hào)的手機(jī)。
[0007]所述的每個(gè)顆粒獨(dú)立使用參數(shù)包括6個(gè)參數(shù),分別為part2_3_length、big_ values、global_gain、scalefac_compress、regionl_start、region2_start〇
[0008] 所述的語(yǔ)音樣本庫(kù)分為兩個(gè)集合,其中一個(gè)集合作為訓(xùn)練集,另一個(gè)集合作為測(cè) 試集,訓(xùn)練集和測(cè)試集各包含1480個(gè)時(shí)長(zhǎng)約為3秒的樣本,另外在使用分類器對(duì)待測(cè)MP3錄 音文件的邊信息參數(shù)特征進(jìn)行訓(xùn)練和測(cè)試之前,對(duì)所有樣本的每一維特征都進(jìn)行歸一化處 理,以降低不同特征值變化范圍不一致對(duì)分類器性能的不利影響。
[0009] 與現(xiàn)有技術(shù)相比,本發(fā)明的設(shè)計(jì)思路是通過分析MP3錄音文件碼流、也即MP3錄音 文件幀中邊信息中各參數(shù)的使用特點(diǎn)及統(tǒng)計(jì)特性,從中找出不同品牌型號(hào)手機(jī)在生成MP3 錄音文件時(shí)使用這些參數(shù)的傾向或特點(diǎn),從而實(shí)現(xiàn)對(duì)MP3錄音文件來源的辨識(shí),即辨別給定 的MP3文件是哪種品牌型號(hào)的手機(jī)錄制的,這種識(shí)別方法具有特征集構(gòu)建過程較為簡(jiǎn)便快 速、算法復(fù)雜度低、識(shí)別準(zhǔn)確度高、實(shí)時(shí)性好、便于操作等優(yōu)點(diǎn)。
【附圖說明】
[001 0]圖1為本發(fā)明實(shí)施例的步驟流程示意圖。
[0011 ] 圖2為參數(shù)ain_data_begin的分布示意圖。
[0012] 圖3為MP3塊的分區(qū)示意圖。
[0013] 圖4為參數(shù)big_values的分布示意圖。
[0014] 圖5為參數(shù)global_gain的分布示意圖。
[0015]圖6為大值區(qū)的子區(qū)示意圖。
[0016] 圖7為參數(shù)regionl_start的分布示意圖。
[0017] 圖8為參數(shù)region2_start的分布示意圖。
[0018] 圖9為參數(shù)part2_3_length的分布示意圖。
[0019] 圖10為參數(shù)scalefac_compress的分布不意圖。
[0020] 圖11為大值區(qū)碼表索引分布示意圖。
[0021 ] 圖12為regionO區(qū)碼表索引分布示意圖。
[0022] 圖13為regionl區(qū)碼表索引分布示意圖。
[0023] 圖14為region2區(qū)碼表索引分布示意圖。
【具體實(shí)施方式】
[0024] 下面將按上述附圖對(duì)本發(fā)明實(shí)施例再作詳細(xì)說明。
[0025] 一種基于邊信息統(tǒng)計(jì)特性的MP3錄音文件來源識(shí)別方法,涉及的是通過研究MP3錄 音文件邊信息中編碼參數(shù)的使用特點(diǎn)和統(tǒng)計(jì)特性,從而判斷一個(gè)MP3錄音文件是哪個(gè)品牌 品牌下哪個(gè)型號(hào)的手機(jī)所錄制。
[0026] 在該識(shí)別方法中涉及了關(guān)于MP3錄音文件的概念說明,具體為: MP3編碼標(biāo)準(zhǔn) MP3全稱為MPEGl Layer-3,是MPEG標(biāo)準(zhǔn)中的音頻部分。MP3雖是有損壓縮,但它近CD的 音質(zhì)、高壓縮比、開放性和易用性等優(yōu)勢(shì)使其從誕生一來便迅速成為主流的音頻格式,而且 目前仍是數(shù)字音頻領(lǐng)域使用最為普遍的格式之一。MP3核心的編碼模塊主要由5部分組成, 分別為子帶濾波器組、MDCT變換、心理聲學(xué)模型、量化和編碼、數(shù)據(jù)流封裝。具體過程是:輸 入聲音信號(hào)一路經(jīng)過32個(gè)子帶濾波器組和MDCT變換進(jìn)行時(shí)頻轉(zhuǎn)換,同時(shí)另一路通過"心理 聲學(xué)模型"計(jì)算每個(gè)子帶的信號(hào)能量和SMR。"量化和編碼"模塊利用SMR來決定分配給子帶 信號(hào)的量化位數(shù),使得量化噪音低于掩蔽閾值,最后通過"數(shù)據(jù)流幀包裝"將子帶的樣本及 其他附加數(shù)據(jù)按幀的格式組裝成位比特流。
[0027] MP3幀結(jié)構(gòu) MP3數(shù)據(jù)流是以幀為最小單位進(jìn)行封裝,每幀數(shù)據(jù)通常包含幀頭(header)、冗余校驗(yàn) (CRC)、邊信息(side information)、主數(shù)據(jù)(main data)和輔助數(shù)據(jù)(ancillary data)5個(gè) 部分。幀頭由32比特的數(shù)據(jù)構(gòu)成,解碼時(shí)首先通過幀頭中的同步字確定解碼開始的位置,并 從幀頭中提取該MP3的相關(guān)信息為后續(xù)的進(jìn)一步解碼鋪墊,如音頻信號(hào)的采樣率、聲道模 式、比特率等。CRC校驗(yàn)是一個(gè)16位的奇偶校驗(yàn)字,用于檢查該幀數(shù)據(jù)在傳輸過程中是否出 現(xiàn)了錯(cuò)誤。這是一個(gè)可選的信息,當(dāng)幀頭中的保護(hù)位為"Γ時(shí)表明有CRC校驗(yàn),反之則沒有。 邊信息中保存了主數(shù)據(jù)解碼需要使用的各種參數(shù),如量化步長(zhǎng)、哈夫曼碼表索引等,邊信息 的大小為130(單聲道)或246(雙聲道)位比特。緊接著邊信息的是主數(shù)據(jù),也即原始音頻樣 本編碼后的數(shù)據(jù)流。每一幀的主數(shù)據(jù)分為顆粒(Kgranule 0)和顆粒Ugranule 1)兩部分, 每部分又由比例因子(scale factor)和哈夫曼碼字(Huffman codes)組成。最后的輔助數(shù) 據(jù)也是可選的,由用戶自己定義,里面存放一些與解碼無關(guān)音頻信息,如歌曲名、歌手、專輯 之等信息。
[0028] 邊信息中參數(shù) 錄音設(shè)備錄制的聲音從PCM/PDM采樣值經(jīng)過壓縮編碼到最后形成MP3文件的過程均是 基于上述流程,但不同型號(hào)設(shè)備在具體實(shí)現(xiàn)MP3標(biāo)準(zhǔn)的各個(gè)模塊時(shí)可能存在著差異,因此最 后生成的MP3的碼流結(jié)構(gòu)及其參數(shù)統(tǒng)計(jì)特性也會(huì)有所區(qū)別。所以本發(fā)明的識(shí)別方法期望深 入分析不同設(shè)備錄制的MP3文件邊信息中各參數(shù)的統(tǒng)計(jì)特性,從而找出各設(shè)備使用參數(shù)的 特點(diǎn)。
[0029] 邊信息主要存儲(chǔ)了用于主數(shù)據(jù)解碼的參數(shù),通常包括主數(shù)據(jù)起始位置(main_ data_begin)、比列因子選擇信息(scfsi)、以及顆粒0和顆粒1的邊信息,如表1所示。
[0030] 表1.邊信息結(jié)構(gòu)
根據(jù)表1對(duì)主要參數(shù)的作用進(jìn)行詳細(xì)介紹 (1)兩個(gè)顆粒共用的參數(shù): mai
當(dāng)前第1頁(yè)1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
温州市| 博白县| 龙川县| 南漳县| 万盛区| 西宁市| 运城市| 兴海县| 开江县| 弋阳县| 宁夏| 黑龙江省| 驻马店市| 淅川县| 鞍山市| 隆德县| 黎平县| 西乌珠穆沁旗| 许昌市| 长宁县| SHOW| 昌平区| 西贡区| 商水县| 二连浩特市| 台江县| 新郑市| 扎兰屯市| 天长市| 汾西县| 静宁县| 遂溪县| 新巴尔虎右旗| 元朗区| 南皮县| 咸丰县| 蓬莱市| 灌南县| 龙江县| 藁城市| 昆山市|