欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

多媒體指紋哈希矢量構(gòu)建方法及其裝置制造方法

文檔序號:6504067閱讀:113來源:國知局
多媒體指紋哈希矢量構(gòu)建方法及其裝置制造方法
【專利摘要】本發(fā)明涉及多媒體指紋哈希矢量構(gòu)建方法,包括:步驟1,對當前幀多媒體信號進行時頻變換,以獲取當前幀多媒體信號的頻譜信息;步驟2,在頻譜信息中,搜索局部峰值,獲取可構(gòu)成多媒體指紋的待選峰值點集合;步驟3,在待選峰值點集合中選擇哈希矢量起點,選取待選哈希矢量終點集合;步驟4,根據(jù)當前幀多媒體信號中提取指紋個數(shù)的限制,為哈希矢量起點選取哈希矢量終點;步驟5,根據(jù)所述哈希矢量終點,為哈希矢量起點建立該哈希矢量起點對應的多媒體指紋哈希矢量;步驟6,重復步驟3至5,直至完成當前幀中全部哈希矢量起點的多媒體指紋提取。通過上述處理過程,可以有效提高在實際應用場景下多媒體信號指紋正確匹配的成功率。
【專利說明】多媒體指紋哈希矢量構(gòu)建方法及其裝置

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及多媒體數(shù)據(jù)處理領(lǐng)域,具體涉及一種多媒體指紋哈希矢量構(gòu)建方法及 其裝置。

【背景技術(shù)】
[0002] 近年來,計算技術(shù)、網(wǎng)絡技術(shù)的迅猛發(fā)展,使人類積累了大量的多媒體數(shù)據(jù),通過 多媒體數(shù)據(jù)指紋對多媒體數(shù)據(jù)進行匹配檢索的應用越來越廣泛。以音頻數(shù)據(jù)為例,音頻數(shù) 據(jù)是多媒體數(shù)據(jù)的重要類型,它廣泛存在于互聯(lián)網(wǎng)和個人計算機中。
[0003] 音頻指紋技術(shù)是一種音頻信息檢索技術(shù),過對原始音頻信號進行時頻變換后在頻 域提取特征信息即音頻指紋,將特征信息保留下來構(gòu)建特征庫。當需要進行音頻檢索時,對 待檢索音頻用同樣的方法提取音頻指紋,然后到特征庫進行匹配,當匹配成功時就能得到 待檢索音頻的具體信息。
[0004] 如圖1所示,音頻指紋用一個哈希矢量來表征,在頻譜圖中找一特定峰值點作為 矢量起點,在矢量起點的搜索范圍內(nèi),例如圖中矩形標定的范圍,搜索到符合條件的峰值點 作為矢量終點,,其中,F(xiàn)l是矢量起點的頻率值,AF是矢量終點和矢量起點之間的頻率差, AT是矢量終點和矢量起點的時間差,Indexing= [Fl,AF,AT],如果用8bit信息表示矢量 起點可能的頻率值,6bit信息表示搜索范圍的時間可能值,6bit信息表示搜索范圍的頻率 可能值,那么就可以用20bit信息表示一個音頻指紋。
[0005] 在實際應用場景中,受到服務器容量大小,搜索時間長短等條件制約,音頻指紋數(shù) 據(jù)庫大小有一定限制,能存儲的音頻指紋的數(shù)量也受限制,因此在提取音頻指紋的時候,需 要對搜索范圍內(nèi)符合條件的峰值點進行取舍,構(gòu)建合適的哈希矢量形成音頻指紋?,F(xiàn)有技 術(shù)是按照待選終點與起點之間的時間距離遠近進行排序選擇,如圖2所示的場景中,在數(shù) 據(jù)庫中對于起點P最多只能構(gòu)建三個哈希矢量,按照時間距離由近至遠,建立的矢量為[P pl] [pp3][pp4]。
[0006] 但是,當音頻信號受到干擾出現(xiàn)失真時,很多在原始信號頻譜中出現(xiàn)的峰值點會 被噪聲譜淹沒或者消失。如圖3中信號經(jīng)過干擾失真后,原始信號中的p3,p4峰值點由于能 量較小,會被噪聲譜淹沒,在需要進行音頻指紋檢索時,構(gòu)建的哈希矢量為[Ppl][PP2], 在數(shù)據(jù)庫匹配時只能找到1個匹配指紋[Ppl]。因此在實際應用場景下,如果按照時間距 離遠近構(gòu)建哈希矢量會導致提取出的音頻指紋匹配成功率急劇降低。


【發(fā)明內(nèi)容】

[0007] 本發(fā)明的目的是提供一種多媒體指紋哈希矢量構(gòu)建方法,以解決現(xiàn)有技術(shù)中對多 媒體信號進行指紋提取和檢索時,由于受到噪聲干擾,造成指紋匹配度降低的問題。
[0008] 第一方面,本發(fā)明實施例提供了一種多媒體指紋哈希矢量構(gòu)建方法,所述方法包 括:
[0009] 步驟1,對當前幀多媒體信號進行時頻變換,以獲取所述的當前幀多媒體信號的頻 譜信息;
[0010] 步驟2,在獲取的所述當前幀多媒體信號的頻譜信息中,搜索局部峰值,以獲取所 述頻譜信息中可構(gòu)成多媒體指紋的待選峰值點集合;
[0011] 步驟3,在所述待選峰值點集合中選擇哈希矢量起點,并根據(jù)所選擇的所述哈希矢 量起點的時間和頻率信息在所述待選峰值點集合中選取待選哈希矢量終點集合;
[0012] 步驟4,根據(jù)當前幀多媒體信號中提取指紋個數(shù)的限制,為所述哈希矢量起點在所 述待選哈希矢量終點集合中選取哈希矢量終點;
[0013] 步驟5,根據(jù)所述的哈希矢量終點,為所述哈希矢量起點建立該哈希矢量起點對應 的多媒體指紋哈希矢量;
[0014] 步驟6,重復步驟3至5,直至完成當前幀中的待選峰值點集合中全部哈希矢量起 點的多媒體指紋提取。
[0015] 基于第一方面,在第一種可能的實施方式中,所述當前巾貞多媒體信號中提取指紋 個數(shù)的限制為每一個哈希矢量起點能夠提取的多媒體指紋個數(shù)。
[0016] 基于第一方面的在第一種可能的實施方式中,在第二種可能的實施方式中,在步 驟3之后,還包括:
[0017] 對所述待選哈希矢量終點集合中的待選矢量終點按照能量大小進行排序,以獲取 能量加權(quán)后的待選矢量終點集合;
[0018] 根據(jù)所述的每一個哈希矢量起點能夠提取的多媒體指紋個數(shù)的閾值,為所述哈希 矢量起點在所述能量加權(quán)后的待選矢量終點集合中,按照能量大小順序選取哈希矢量終 點。
[0019] 基于第一方面的在第一種可能的實施方式中,在第三種可能的實施方式中,所述 步驟3之后,還包括:
[0020] 對所述待選哈希矢量終點集合中的待選矢量終點按照能量大小進行排序,以獲取 能量加權(quán)后的待選矢量終點集合;
[0021 ] 根據(jù)當前哈希矢量起點的頻點能量在全部待選峰值點集合中全部待選峰值點頻 點能量之和中的占比,獲取當前哈希矢量起點的能夠提取的多媒體指紋個數(shù)的閾值;
[0022] 根據(jù)當前哈希矢量起點能夠提取的多媒體指紋個數(shù)的閾值,為所述當前哈希矢量 起點在所述能量加權(quán)后的待選矢量終點集合中,按照能量大小順序選取哈希矢量終點。
[0023] 基于第一方面的第一種可能的實施方式,在第四種可能的實施方式中,所述根據(jù) 當前幀多媒體信號中提取指紋個數(shù)的限制,為所述哈希矢量起點在所述待選哈希矢量終點 集合中選取哈希矢量終點具體包括:
[0024] 根據(jù)當前哈希矢量起點的頻點能量在全部待選峰值點集合中全部待選峰值點頻 點能量之和中的占比,獲取當前哈希矢量起點的能夠提取的多媒體指紋個數(shù)的閾值;
[0025] 根據(jù)當前哈希矢量起點能夠提取的多媒體指紋個數(shù)的閾值,為所述當前哈希矢量 起點在所述待選哈希矢量終點集合中,按照時間順序選取哈希矢量終點。
[0026] 第二方面,本發(fā)明實施例提供了一種多媒體指紋哈希矢量構(gòu)建裝置,所述裝置包 括:
[0027] 時頻變換單元,用于對當前幀多媒體信號進行時頻變換,以獲取所述的當前幀多 媒體信號的頻譜信息;
[0028] 搜索單元,用以在獲取的所述當前幀多媒體信號的頻譜信息中,搜索局部峰值,以 獲取所述頻譜信息中可構(gòu)成多媒體指紋的待選峰值點集合;
[0029] 選取單元,用于在所述待選峰值點集合中選擇哈希矢量起點,并根據(jù)所選擇的所 述哈希矢量起點的時間和頻率信息在所述待選峰值點集合中選取待選哈希矢量終點集 合;
[0030] 確定單元,用于根據(jù)當前幀多媒體信號中提取指紋個數(shù)的限制,為所述哈希矢量 起點在所述待選哈希矢量終點集合中選取哈希矢量終點;
[0031] 處理單元,用于根據(jù)所述的哈希矢量終點,為所述哈希矢量起點建立該哈希矢量 起點對應的多媒體指紋哈希矢量;
[0032] 控制單元,用于控制所述選取單元、確定單元和所述處理單元,直至完成當前幀的 待選峰值點集合中全部哈希矢量起點的多媒體指紋提取。
[0033] 基于第二方面,在第一種可能的實施方式中,所述當前幀多媒體信號中提取指紋 個數(shù)的限制為每一個哈希矢量起點能夠提取的多媒體指紋個數(shù)。
[0034] 基于第二方面的在第一種可能的實施方式中,在第二種可能的實施方式中,所述 裝置還包括:
[0035] 加權(quán)單元,用于對所述選取單元選取的所述待選哈希矢量終點集合中的待選矢量 終點按照能量大小進行排序,以獲取能量加權(quán)后的待選矢量終點集合;
[0036] 所述確定單元:根據(jù)所述的每一個哈希矢量起點能夠提取的多媒體指紋個數(shù)的閾 值,為所述哈希矢量起點在所述能量加權(quán)后的待選矢量終點集合中,按照能量大小順序選 取哈希矢量終點。
[0037] 基于第二方面的在第一種可能的實施方式中,在第三種可能的實施方式中,所述 裝置還包括:
[0038] 加權(quán)單元,對所述待選哈希矢量終點集合中的待選矢量終點按照能量大小進行排 序,以獲取能量加權(quán)后的待選矢量終點集合;
[0039] 所述確定單元:根據(jù)當前哈希矢量起點的頻點能量在全部待選峰值點集合中全部 待選峰值點頻點能量之和中的占比,獲取當前哈希矢量起點的能夠提取的多媒體指紋個數(shù) 的閾值;
[0040] 根據(jù)當前哈希矢量起點能夠提取的多媒體指紋個數(shù)的閾值,為所述當前哈希矢量 起點在所述能量加權(quán)后的待選矢量終點集合中,按照能量大小順序選取哈希矢量終點。
[0041] 基于第二方面的第一種可能的實施方式,在第四種可能的實施方式中,所述確定 單元:
[0042] 根據(jù)當前哈希矢量起點的頻點能量在全部待選峰值點集合中全部待選峰值點頻 點能量之和中的占比,獲取當前哈希矢量起點的能夠提取的多媒體指紋個數(shù);
[0043] 根據(jù)當前哈希矢量起點能夠提取的多媒體指紋個數(shù)的閾值,為所述當前哈希矢量 起點在所述待選哈希矢量終點集合中,按照時間順序選取哈希矢量終點。
[0044] 本發(fā)明實施例提供了一種多媒體指紋哈希矢量構(gòu)建方法、在對當前需要處理的當 前幀多媒體信號進行時頻變換后,獲取當前幀多媒體信號的頻譜信息,然后在頻譜信息中, 搜索可構(gòu)成多媒體指紋的待選峰值點集合,之后在待選峰值點集合中選擇哈希矢量起點, 和待選哈希矢量終點集合,最后根據(jù)能量加權(quán)在在待選哈希矢量終點集合中選取哈希矢量 終點,并為哈希矢量起點建立該哈希矢量起點對應的多媒體指紋哈希矢量;通過上述處理 過程,確保頻譜信息中大能量峰值有較多的多媒體指紋可以被提取,從而解決了多媒體指 紋技術(shù)在實際應用場景中受噪聲、失真等干擾會引起頻譜變化,使得原始信號頻譜中出現(xiàn) 的峰值點被噪聲譜淹沒或者消失,從而導致按照時間距離遠近構(gòu)建哈希矢量時音頻指紋匹 配成功率急劇降低的問題,有效的提高了在實際應用場景下音頻指紋正確匹配的成功率。

【專利附圖】

【附圖說明】
[0045] 為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述 中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些 實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些 附圖獲得其他的附圖。
[0046] 圖1為現(xiàn)有技術(shù)構(gòu)建首頻指紋的不意圖;
[0047] 圖2為現(xiàn)有技術(shù)構(gòu)建音頻指紋的原理圖;
[0048] 圖3為本發(fā)明實施例提供的多媒體指紋哈希矢量構(gòu)建方法的流程圖;
[0049] 圖4為本發(fā)明實施例提供的多媒體指紋哈希矢量構(gòu)建裝置的結(jié)構(gòu)圖;
[0050] 圖5為本發(fā)明實施例提供的多媒體指紋哈希矢量構(gòu)建裝置的另一種實施例的結(jié) 構(gòu)圖。

【具體實施方式】
[0051] 下面通過附圖和實施例,對本發(fā)明的技術(shù)方案做進一步的詳細描述。
[0052] 為了解決現(xiàn)有技術(shù)中當多媒體信號受到干擾出現(xiàn)失真時,很多在原始信號頻譜中 出現(xiàn)的峰值點會被噪聲譜淹沒或者消失,導致的按照時間距離遠近構(gòu)建哈希矢量提取出的 音頻指紋匹配成功率急劇降低,本發(fā)明實施例的核心思想是提出一種基于能量加權(quán)的哈希 矢量構(gòu)建方法,提高音頻指紋的魯棒性,從而提高音頻檢索的成功率。本發(fā)明的實施例,不 僅可以應用于音頻信號,還可以應用在圖像、視頻信號燈多媒體數(shù)據(jù)。
[0053] 如圖3所示,在第一方面,本發(fā)明實施例提供了一種多媒體指紋哈希矢量構(gòu)建方 法,所述方法包括:
[0054] 步驟1,對當前幀多媒體信號進行時頻變換,以獲取所述的當前幀多媒體信號的頻 譜信息;
[0055] 具體的,所述多媒體信號的頻譜信息為多個頻點的頻率、時間以及幅度信息,幅度 信息用以表征能量大小。
[0056] 步驟2,在獲取的所述當前幀多媒體信號的頻譜信息中,搜索局部峰值,以獲取所 述頻譜信息中可構(gòu)成多媒體指紋的待選峰值點集合;
[0057] 具體而言,在當前多媒體信號的頻譜信息中,按照不同的覆蓋區(qū)域大小,搜索一個 覆蓋區(qū)域范圍內(nèi)的局部峰值,將這些局部峰值點,作為待選峰值點集合。
[0058] 步驟3,在所述待選峰值點集合中選擇哈希矢量起點,并根據(jù)所述哈希矢量起點的 時間和頻率信息在所述待選峰值點集合中選取待選哈希矢量終點集合;
[0059] 具體而言,在待選峰值點集合中任意選取一個哈希矢量起點,按照與選中的哈希 矢量起點的時間差和頻率差都在設定范圍內(nèi)的約束,選取一個待選哈希矢量終點集合。
[0060] 步驟4,根據(jù)當前幀多媒體信號中提取指紋個數(shù)的限制,為所述哈希矢量起點在所 述待選哈希矢量終點集合中選取哈希矢量終點;
[0061] 具體而言,在選定哈希矢量起點和待選哈希矢量終點之后,如果系統(tǒng)對每個哈希 矢量起點的指紋數(shù)有限制,則根據(jù)系統(tǒng)對每個哈希矢量起點能夠提取的指紋數(shù)的限制,選 取哈希矢量終點;如果系統(tǒng)沒有對一個哈希矢量起點能夠提取的指紋數(shù)據(jù)進行限制,而是 對一陣多媒體信號總的指紋提取數(shù)有所限制,則要根據(jù)每個哈希矢量起點的能量在全部可 選的哈希矢量起點的能量和中的占比,再根據(jù)能量大小,確定該哈希矢量起點對應的哈希 矢量終點數(shù)目。
[0062] 步驟5,根據(jù)所述的哈希矢量終點,為所述哈希矢量起點建立該哈希矢量起點對應 的多媒體指紋哈希矢量;
[0063] 具體而言,在確定了哈希矢量起點和哈希矢量終點之后,按照IndeXing=[Fl,AF, AT]建立哈希矢量起點和哈希矢量終點之間的多媒體指紋哈希矢量。
[0064] 步驟6,重復步驟3至5,直至完成當前幀的待選峰值點集合中全部哈希矢量起點 的多媒體指紋提取。
[0065] 具體的,在待選峰值點集合中不斷更換哈希矢量起點,重復上述的步驟3到步驟 5,直到完成當前幀中全部哈希矢量起點的多媒體指紋提取。
[0066] 通過上述實施例,能夠確保多媒體信號的頻譜信息中大能量峰值有較多的多媒體 指紋可以被提取,從而解決了多媒體指紋技術(shù)在實際應用場景中受噪聲、失真等干擾會引 起頻譜變化,使得原始信號頻譜中出現(xiàn)的峰值點被噪聲譜淹沒或者消失,從而導致按照時 間距離遠近構(gòu)建哈希矢量時音頻指紋匹配成功率急劇降低的問題,有效的提高了在實際應 用場景下音頻指紋正確匹配的成功率。
[0067] 以下以音頻信號為例,詳細說明本發(fā)明的幾個實施例。
[0068] 以音頻信號為例,音頻指紋可以表示為一個哈希矢量的特征值:[FIAFAT],其中 Fl為哈希矢量起點對應的頻率,可以用R個bit二進制數(shù)表示;AF是矢量終點和矢量起點 之間的相對頻率差,可以用P個bit二進制數(shù)表示;AT是矢量終點和矢量起點的時間差, 可以用Q個bit二進制數(shù)表示,在該實施例中,在本實施例中R=8,P=6,Q=6,但根據(jù)不同系 統(tǒng)的需求,可以根據(jù)需求設置,不做贅述。
[0069] 音頻指紋提取受到實際實現(xiàn)系統(tǒng)的限制,對每一幀音頻信號能提取的音頻指紋個 數(shù)有限制,可以通過對每一幀音頻信號中每個哈希矢量起點能夠構(gòu)成的音頻指紋個數(shù)進行 約束,或者對全部哈希矢量起點構(gòu)成音頻指紋總數(shù)進行約束來實現(xiàn)對每一幀音頻信號能提 取的音頻指紋個數(shù)的限制。在本實施例中對音頻指紋提取個數(shù)的限制具體指同一個哈希矢 量起點能構(gòu)成音頻指紋的個數(shù)不超過V,即對同一個哈希矢量起點,在選擇哈希矢量終點是 個數(shù)不超過V,在本實施例中V=4。
[0070] 在步驟201中,對當前需要處理的當前幀音頻進行時頻變換,以獲取所述的當前 幀音頻信號的頻譜信息;
[0071] 在需要建立音頻指紋之前,需要將當前待處理的第N幀音頻信號進行時頻變換得 到頻譜信息集合為S={[s,i,j]},其中s為當前頻點幅度譜絕對值,i為當前頻點對應的相 對時間信息,j為當前頻點對應的頻率信息,s、i、j都受系統(tǒng)限制,具體為,0 <i<R,0 <j, R、T由系統(tǒng)音頻指紋限制條件決定,在本實施例中R=133,T=255。
[0072] 步驟202,在所述當前幀音頻信號的頻譜信息中,搜索局部峰值,以獲取所述頻譜 信息中可構(gòu)成多媒體指紋的待選峰值點集合;
[0073] 具體而言,以音頻信號為例,在對當前幀的音頻信號進行時頻轉(zhuǎn)換后,在當前幀頻 譜信息集合S中搜索局部峰值,得到當前幀中所有可構(gòu)成音頻指紋的K個待選峰值點集合M={ma=[saiajj}(MeS,1彡a:),其中叫按照先時間從小到大,后頻率從小到大的順序 排序,即若a〈b,則ia〈ib或者當ia=ib時,ja彡jb。
[0074] 步驟203,在所述待選峰值點集合中選擇哈希矢量起點,并根據(jù)所述哈希矢量起點 的時間和頻率信息在所述待選峰值點集合中選取待選哈希矢量終點集合;
[0075] 具體的,首先在待選峰值點集合M中選取Hi0做為哈希矢量起點,在待選峰值 點集合M中根據(jù)系統(tǒng)音頻指紋限制條件確定的搜索范圍確定的W個待選矢量終點集合 E={eb=[sbibjb]} (EGM,1彡b彡W,且W〈K)。在本實施例中系統(tǒng)音頻指紋限制條件指0 <ib-i0<64,-31<jb-j0<32。
[0076] 在選取待選哈希矢量終點集合E之后,對所述待選哈希矢量終點集合中的待選矢 量終點按照能量大小進行排序,以獲取能量加權(quán)后的待選矢量終點集合E'對E中的點按照 能量大小從大到小排序,得到按照能量加權(quán)后的待選矢量終點集合E' ={e'k=[skikjk]}, 艮PS1S2)......>sw。
[0077] 步驟4,根據(jù)當前幀多媒體信號中提取指紋個數(shù)的閾值,為所述哈希矢量起點在待 選哈希矢量終點集合中選取哈希矢量終點;
[0078] 在該實施例中,由于系統(tǒng)對每個哈希矢量起點的指紋數(shù)有限制,則根據(jù)系統(tǒng)對每 個哈希矢量起點能夠提取的指紋數(shù)的限制,選取哈希矢量終點;
[0079] 按照音頻指紋提取個數(shù)的限制,按照能量從大到小的順序,從加權(quán)后的待選矢量 終點集合E'中選擇哈希矢量終點,e/、e2' ......ev'。
[0080] 步驟5,根據(jù)所述的哈希矢量終點,為所述哈希矢量起點建立該哈希矢量起點對應 的音頻指紋哈希矢量;
[0081] 具體而言,在確定了哈希矢量起點和哈希矢量終點之后,按照IndeXing=[Fl,AF, △T]建立哈希矢量起點和哈希矢量終點之間的音頻指紋哈希矢量。
[0082] 更具體的,按照選取的哈希矢量終點,構(gòu)成哈希矢量[mQ,ei' ]……[mQ,ev' ],按照 Fl=j|m。,AF=F2-Fl=j|e/-j|m。,AT=T2-Tl=ile/-i|m。,由哈希矢量的特征值構(gòu)成音頻指 紋。
[0083] 步驟6,重復步驟3至5,直至完成當前幀中全部哈希矢量起點的音頻指紋提取。
[0084] 具體的,在待選峰值點集合中不斷更換哈希矢量起點,重復上述的步驟3到步驟 5,直到完成當前幀中全部哈希矢量起點的音頻指紋提取。
[0085] 通過上述實施例,在選取待選哈希矢量終點集合之后,對所述待選哈希矢量終點 集合中的待選矢量終點按照能量大小進行排序,之后再加權(quán)后的待選哈希矢量終點集合中 選取能量加大的點作為哈希矢量終點,能夠確保多媒體信號的頻譜信息中大能量峰值有較 多的多媒體指紋可以被提取,從而解決了多媒體指紋技術(shù)在實際應用場景中受噪聲、失真 等干擾會引起頻譜變化,使得原始信號頻譜中出現(xiàn)的峰值點被噪聲譜淹沒或者消失,從而 導致按照時間距離遠近構(gòu)建哈希矢量時音頻指紋匹配成功率急劇降低的問題,有效的提高 了在實際應用場景下音頻指紋正確匹配的成功率。
[0086] 再次以首頻指紋獲取為例,在另一種實施例中,
[0087] 音頻指紋提取受到實際實現(xiàn)系統(tǒng)的限制,是對每一幀音頻信號中每個哈希矢量起 點能夠構(gòu)成的音頻指紋個數(shù)進行約束。,在本實施例中對音頻指紋提取個數(shù)的限制具體指 當前幀信號總體可提取的音頻指紋個數(shù)不超過V,在本實施例中V=200。
[0088] 因此,在獲取到所述的當前幀音頻信號的頻譜信息,選中可構(gòu)成音頻指紋的待選 峰值點集合,并且在所述待選峰值點集合中選擇哈希矢量起點,并根據(jù)所述哈希矢量起點 的時間和頻率信息在所述待選峰值點集合中選取待選哈希矢量終點集合之后,還對所述待 選哈希矢量終點集合中的待選矢量終點按照能量大小進行排序,以獲取能量加權(quán)后的待選 矢量終點集合E',例如對E中的點按照能量大小從大到小排序,得到按照能量加權(quán)后的待 選矢量終點集合E' = {e'k=[skikjk]},即S1S2)......>sw。
[0089] 與前述的實施例的區(qū)別在于,還需要確定每個哈希矢量起點能夠提取的指紋數(shù) 目,具體為:
[0090] 根據(jù)當前哈希矢量起點的頻點能量在全部待選峰值點集合中全部待選峰值點頻 點能量之和中的占比,獲取當前哈希矢量起點的能夠提取的多媒體指紋個數(shù);
[0091] 具體而言,根據(jù)當前哈希矢量起點的頻點能量特性計算當前哈希矢量起點的可選 終點個數(shù)V',其中,II表示取整,即起點能量越大,可提取的音頻指紋 個數(shù)越多。

【權(quán)利要求】
1. 一種多媒體指紋哈希矢量構(gòu)建方法,其特征在于,所述方法包括: 步驟1,對當前幀多媒體信號進行時頻變換,以獲取所述的當前幀多媒體信號的頻譜信 息; 步驟2,在獲取的所述當前幀多媒體信號的頻譜信息中,搜索局部峰值,以獲取所述頻 譜信息中可構(gòu)成多媒體指紋的待選峰值點集合; 步驟3,在所述待選峰值點集合中選擇哈希矢量起點,并根據(jù)所選擇的所述哈希矢量起 點的時間和頻率信息在所述待選峰值點集合中選取待選哈希矢量終點集合; 步驟4,根據(jù)當前幀多媒體信號中提取指紋個數(shù)的限制,為所述哈希矢量起點在所述待 選哈希矢量終點集合中選取哈希矢量終點; 步驟5,根據(jù)所述的哈希矢量終點,為所述哈希矢量起點建立該哈希矢量起點對應的多 媒體指紋哈希矢量; 步驟6,重復步驟3至5,直至完成當前幀的待選峰值點集合中全部哈希矢量起點的多 媒體指紋提取。
2. 如權(quán)利要求1所述的方法,其特征在于,所述當前幀多媒體信號中提取指紋個數(shù)的 限制為每一個哈希矢量起點能夠提取的多媒體指紋個數(shù)。
3. 如權(quán)利要求2所述的方法,其特征在于,在步驟3之后,還包括: 對所述待選哈希矢量終點集合中的待選矢量終點按照能量大小進行排序,以獲取能量 加權(quán)后的待選矢量終點集合; 根據(jù)所述的每一個哈希矢量起點能夠提取的多媒體指紋個數(shù)的閾值,為所述哈希矢量 起點在所述能量加權(quán)后的待選矢量終點集合中,按照能量大小順序選取哈希矢量終點。
4. 如權(quán)利要求2所述的方法,其特征在于,所述步驟3之后,還包括: 對所述待選哈希矢量終點集合中的待選矢量終點按照能量大小進行排序,以獲取能量 加權(quán)后的待選矢量終點集合; 根據(jù)當前哈希矢量起點的頻點能量在全部待選峰值點集合中全部待選峰值點頻點能 量之和中的占比,獲取當前哈希矢量起點的能夠提取的多媒體指紋個數(shù)的閾值; 根據(jù)當前哈希矢量起點能夠提取的多媒體指紋個數(shù)的閾值,為所述當前哈希矢量起點 在所述能量加權(quán)后的待選矢量終點集合中,按照能量大小順序選取哈希矢量終點。
5. 如權(quán)利要求2所述的方法,其特征在于,所述根據(jù)當前幀多媒體信號中提取指紋個 數(shù)的限制,為所述哈希矢量起點在所述待選哈希矢量終點集合中選取哈希矢量終點具體包 括: 根據(jù)當前哈希矢量起點的頻點能量在全部待選峰值點集合中全部待選峰值點頻點能 量之和中的占比,獲取當前哈希矢量起點的能夠提取的多媒體指紋個數(shù)的閾值; 根據(jù)當前哈希矢量起點能夠提取的多媒體指紋個數(shù)的閾值,為所述當前哈希矢量起點 在所述待選哈希矢量終點集合中,按照時間順序選取哈希矢量終點。
6. -種多媒體指紋哈希矢量構(gòu)建裝置,其特征在于,所述裝置包括: 時頻變換單元,用于對當前幀多媒體信號進行時頻變換,以獲取所述的當前幀多媒體 信號的頻譜信息; 搜索單元,用以在獲取的所述當前幀多媒體信號的頻譜信息中,搜索局部峰值,以獲取 所述頻譜信息中可構(gòu)成多媒體指紋的待選峰值點集合; 選取單元,用于在所述待選峰值點集合中選擇哈希矢量起點,并根據(jù)所選擇的所述哈 希矢量起點的時間和頻率信息在所述待選峰值點集合Μ中選取待選哈希矢量終點集合E ; 確定單元,用于根據(jù)當前幀多媒體信號中提取指紋個數(shù)的限制,為所述哈希矢量起點 在所述待選哈希矢量終點集合中選取哈希矢量終點; 處理單元,用于根據(jù)所述的哈希矢量終點,為所述哈希矢量起點建立該哈希矢量起點 對應的多媒體指紋哈希矢量; 控制單元,用于控制所述選取單元、確定單元和所述處理單元,直至完成當前幀的待選 峰值點集合中全部哈希矢量起點的多媒體指紋提取。
7. 如權(quán)利要求6所述的裝置,其特征在于,所述當前幀多媒體信號中提取指紋個數(shù)的 限制為每一個哈希矢量起點能夠提取的多媒體指紋個數(shù)。
8. 如權(quán)利要求7所述的裝置,其特征在于,還包括: 加權(quán)單元,用于對所述待選哈希矢量終點集合中的待選矢量終點按照能量大小進行排 序,以獲取能量加權(quán)后的待選矢量終點集合; 所述確定單元:根據(jù)所述的每一個哈希矢量起點能夠提取的多媒體指紋個數(shù)的閾值, 為所述哈希矢量起點在所述能量加權(quán)后的待選矢量終點集合中,按照能量大小順序選取哈 希矢量終點。
9. 如權(quán)利要求7所述的裝置,其特征在于,還包括: 加權(quán)單元,對所述待選哈希矢量終點集合中的待選矢量終點按照能量大小進行排序, 以獲取能量加權(quán)后的待選矢量終點集合; 所述確定單元:根據(jù)當前哈希矢量起點的頻點能量在全部待選峰值點集合中全部待選 峰值點頻點能量之和中的占比,獲取當前哈希矢量起點的能夠提取的多媒體指紋個數(shù)的閾 值; 根據(jù)當前哈希矢量起點能夠提取的多媒體指紋個數(shù)的閾值,為所述當前哈希矢量起點 在所述能量加權(quán)后的待選矢量終點集合中,按照能量大小順序選取哈希矢量終點。
10. 如權(quán)利要求7所述的裝置,其特征在于,所確定單元: 根據(jù)當前哈希矢量起點的頻點能量在全部待選峰值點集合中全部待選峰值點頻點能 量之和中的占比,獲取當前哈希矢量起點的能夠提取的多媒體指紋個數(shù); 根據(jù)當前哈希矢量起點能夠提取的多媒體指紋個數(shù)的閾值,為所述當前哈希矢量起點 在所述待選哈希矢量終點集合中,按照時間順序選取哈希矢量終點。
【文檔編號】G06F17/30GK104239306SQ201310227474
【公開日】2014年12月24日 申請日期:2013年6月8日 優(yōu)先權(quán)日:2013年6月8日
【發(fā)明者】張德明, 張琦 申請人:華為技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
尉氏县| 新平| 天祝| 夏津县| 定陶县| 甘南县| 永胜县| 安远县| 桂阳县| 青海省| 广灵县| 应城市| 邮箱| 健康| 榆社县| 岗巴县| 筠连县| 永仁县| 田东县| 合江县| 日照市| 论坛| 孝义市| 旺苍县| 银川市| 嘉祥县| 博野县| 夏邑县| 黄梅县| 句容市| 定陶县| 凤凰县| 绥江县| 旺苍县| 荆门市| 翁牛特旗| 祥云县| 新民市| 枝江市| 临潭县| 海口市|