一種音頻信息檢索的方法和裝置制造方法

文檔序號：6504883閱讀：195來源：國知局

一種音頻信息檢索的方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種音頻信息檢索的方法和裝置，所述方法包括：獲取待處理音頻信息；獲取所述待處理音頻信息的音頻數(shù)據(jù)；提取所述音頻數(shù)據(jù)的特征組，所述特征組包括不少于一個特征；根據(jù)所述特征組，在預設(shè)的音頻特征庫中確定所述待處理音頻信息的同源信息。由于本發(fā)明在音頻信息包含惡意信息時，能夠?qū)ζ溥M行檢索，避免了存在惡意信息的音頻信息流傳于網(wǎng)絡(luò)，保證了用戶的正常上網(wǎng)體驗。
【專利說明】
一種音頻信息檢索的方法和裝置

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域，具體涉及一種音頻信息檢索的方法和裝置。

【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的發(fā)展，網(wǎng)絡(luò)上的多媒體信息越來越多，同時能夠提供多媒體信息服務(wù)的業(yè)務(wù)模式也層出不窮，例如微博、播客等，都支持用戶通過網(wǎng)絡(luò)上傳音頻信息。但是不可避免的，用戶上傳的音頻信息中可能包含不符合現(xiàn)有法律法規(guī)的內(nèi)容，如涉及到色情、淫穢、反動、封建迷信、兇殺暴力、恐怖、教唆犯罪等違反法律法規(guī)的內(nèi)容，或者具有版權(quán)保護的信息，也可能是以謀取商業(yè)利益為目的的廣告等，這些惡意損害用戶體驗的音頻信息都需要及時的被甄別和刪除，以保證用戶的正常上網(wǎng)體驗。
[0003]現(xiàn)有技術(shù)中，通過人工審核的方法對用戶上傳的音頻信息進行檢索，以便檢索出帶有惡意信息的音頻信息，保證用戶的上網(wǎng)體驗。
[0004]但是，人工審核音頻信息的方法花費時間長，對于音頻信息的檢索效率較低。

【發(fā)明內(nèi)容】

[0005]本發(fā)明提供了一種音頻信息檢索的方法和裝置，能夠提高音頻信息的檢索效率。
[0006]本發(fā)明提供了一種音頻信息檢索的方法，所述方法包括:
[0007]獲取待處理音頻信息；
[0008]獲取所述待處理音頻信息的音頻數(shù)據(jù)；
[0009]提取所述音頻數(shù)據(jù)的特征組，所述特征組包括不少于一個特征；
[0010]根據(jù)所述特征組，在預設(shè)的音頻特征庫中確定所述待處理音頻信息的同源信息。
[0011]優(yōu)選地，所述根據(jù)所述特征組，在預設(shè)的音頻特征庫中確定所述待處理音頻信息的同源信息，包括:
[0012]將所述特征組中的任一特征確定為目標特征，執(zhí)行特征匹配流程:在預設(shè)的音頻特征庫中，獲取與所述目標特征匹配的樣本特征，所述音頻特征庫包括音頻樣本與樣本特征的對應關(guān)系；獲取所述樣本特征對應的音頻樣本后，將所述音頻樣本加入結(jié)果音頻組；將任一未執(zhí)行特征匹配流程的特征確定為目標特征，繼續(xù)執(zhí)行所述特征匹配流程，直到所述特征組中的特征均完成所述特征匹配流程；根據(jù)所述結(jié)果音頻組確定所述待處理音頻信息的同源信息。
[0013]優(yōu)選地，所述根據(jù)所述結(jié)果音頻組確定所述待處理音頻信息的同源信息，包括:
[0014]獲取所述結(jié)果音頻組中數(shù)量最多的音頻樣本；
[0015]將所述音頻樣本確定為所述待處理音頻信息的同源信息。
[0016]優(yōu)選地，所述根據(jù)所述結(jié)果音頻組確定所述待處理音頻信息的同源信息，包括:
[0017]獲取所述結(jié)果音頻組中的音頻樣本；
[0018]將所述音頻樣本進行組合，得到組合結(jié)果；
[0019]根據(jù)所述組合結(jié)果確定所述待處理音頻信息的同源信息。
[0020]優(yōu)選地，所述提取所述音頻數(shù)據(jù)的特征組，所述特征組包括不少于一個特征，包括:
[0021]將所述音頻數(shù)據(jù)分幀，得到幀數(shù)據(jù)；
[0022]將所述幀數(shù)據(jù)進行短時傅立葉變換后，得到變換后幀數(shù)據(jù)；
[0023]將所述變換后幀數(shù)據(jù)進行分頻后，得到頻譜圖；
[0024]根據(jù)所述頻譜圖，提取所述音頻數(shù)據(jù)的特征組。
[0025]優(yōu)選地，所述將所述音頻數(shù)據(jù)分幀，得到幀數(shù)據(jù)之前，還包括:
[0026]將所述音頻數(shù)據(jù)進行降采樣。
[0027]本發(fā)明還提供一種音頻信息檢索的裝置，所述裝置包括:
[0028]第一獲取模塊，用于獲取待處理音頻信息；
[0029]第二獲取模塊，用于獲取所述待處理音頻信息的音頻數(shù)據(jù)；
[0030]提取模塊，用于提取所述音頻數(shù)據(jù)的特征組，所述特征組包括不少于一個特征；
[0031]第一確定模塊，用于根據(jù)所述特征組，在預設(shè)的音頻特征庫中確定所述待處理音頻信息的同源信息。
[0032]優(yōu)選地，所述第一確定模塊，包括:
[0033]第一確定子模塊，用于將所述特征組中的任一特征確定為目標特征；
[0034]第一獲取子模塊，用于在預設(shè)的音頻特征庫中，獲取與所述目標特征匹配的樣本特征，所述音頻特征庫包括音頻樣本與樣本特征的對應關(guān)系；
[0035]第二獲取子模塊，用于獲取所述樣本特征對應的音頻樣本后，將所述音頻樣本加入結(jié)果音頻組；
[0036]第二確定子模塊，用于將任一未執(zhí)行特征匹配流程的特征確定為目標特征，繼續(xù)觸發(fā)所述第一獲取子模塊，直到所述特征組中的特征均完成觸發(fā)所述第一獲取子模塊；
[0037]第三確定子模塊，用于根據(jù)所述結(jié)果音頻組確定所述待處理音頻信息的同源信肩、O
[0038]優(yōu)選地，所述第三確定子模塊，包括:
[0039]第三獲取子模塊，用于獲取所述結(jié)果音頻組中數(shù)量最多的音頻樣本；
[0040]第四確定子模塊，用于將所述音頻樣本確定為所述待處理音頻信息的同源信息。
[0041]優(yōu)選地，所述第三確定子模塊，包括:
[0042]第四獲取子模塊，用于獲取所述結(jié)果音頻組中的音頻樣本；
[0043]組合子模塊，用于將所述音頻樣本進行組合，得到組合結(jié)果；
[0044]第五確定子模塊，用于根據(jù)所述組合結(jié)果確定所述待處理音頻信息的同源信息。
[0045]優(yōu)選地，所述提取模塊，包括:
[0046]分幀子模塊，用于將所述音頻數(shù)據(jù)分幀，得到幀數(shù)據(jù)；
[0047]變換子模塊，用于將所述幀數(shù)據(jù)進行短時傅立葉變換后，得到變換后幀數(shù)據(jù)；
[0048]分頻子模塊，用于將所述變換后幀數(shù)據(jù)進行分頻后，得到頻譜圖；
[0049]提取子模塊，用于根據(jù)所述頻譜圖，提取所述音頻數(shù)據(jù)的特征組。
[0050]優(yōu)選地，所述提取模塊，還包括:
[0051 ]降采樣子模塊，用于將所述音頻數(shù)據(jù)進行降采樣。
[0052]本發(fā)明首先獲取待處理音頻信息，其次，獲取所述待處理音頻信息的音頻數(shù)據(jù)，再次，提取所述音頻數(shù)據(jù)的特征組，所述特征組包括不少于一個特征，最后，根據(jù)所述特征組，在預設(shè)的音頻特征庫中確定所述待處理音頻信息的同源信息。由于本發(fā)明在音頻信息包含惡意信息時，能夠?qū)ζ溥M行檢索，避免了存在惡意信息的音頻信息流傳于網(wǎng)絡(luò)，保證了用戶的正常上網(wǎng)體驗。

【專利附圖】

【附圖說明】
[0053]為了更清楚地說明本申請實施例中的技術(shù)方案，下面將對實施例描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本申請的一些實施例，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動的前提下，還可以根據(jù)這些附圖獲得其他的附圖。
[0054]圖1為實施例一提供的音頻信息檢索的方法流程圖；
[0055]圖2為實施例一提供的以特征P為例介紹特征的匹配過程流程圖；
[0056]圖3為實施例二提供的音頻信息檢索的裝置結(jié)構(gòu)圖；
[0057]圖4為實施例二提供的服務(wù)器結(jié)構(gòu)示意圖。

【具體實施方式】
[0058]下面將結(jié)合本申請實施例中的附圖,對本申請實施例中的技術(shù)方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是本申請一部分實施例，而不是全部的實施例。基于本申請中的實施例，本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例，都屬于本申請保護的范圍。
[0059]實施例一
[0060]通過對上傳的音頻信息進行分析發(fā)現(xiàn)，各個惡意音頻信息中的數(shù)據(jù)彼此存在大量的重復，如用戶可能將含有惡意信息的單個音頻信息多次上傳，或者將音頻信息進行簡單編輯后再次上傳等，我們可以將這樣存在大量重復內(nèi)容的音頻信息稱為同源信息。例如，對于一段音頻信息A，用戶可以在其音頻信息中插入一些其他音頻數(shù)據(jù)，然后重新壓制可以得到音頻信息B，那么音頻信息B就是音頻信息A的同源信息。也就是說，當音頻信息A已經(jīng)被確定為含有惡意信息的音頻信息的情況下，可以將音頻信息A作為樣本音頻存儲于音頻特征庫中，把與該樣本音頻的同源信息都確定為含有惡意信息的音頻信息，從而完成音頻信息的檢索。
[0061]參考圖1，圖1為本實施例提供的音頻信息檢索的方法流程圖，具體包括:
[0062]步驟101:獲取待處理音頻信息。
[0063]本實施例中，在檢索音頻信息之前，首先獲取待處理音頻信息作為后續(xù)步驟的處理對象。
[0064]實際操作中，可以將任意一段音頻信息作為待處理音頻信息，通過本實施例提供的音頻信息檢索的方法獲取待處理音頻信息的同源信息，從而完成音頻信息的檢索。例如，可以將用戶上傳到服務(wù)器的一段音頻作為待處理音頻信息，也可以將載有音頻信息的視頻作為待處理對象，其中，可以獲取視頻中的音頻信息作為待處理音頻信息。
[0065]其中，獲取待處理音頻信息的方法很多，本實施例對此不做限制。
[0066]步驟102:獲取所述待處理音頻信息的音頻數(shù)據(jù)。
[0067]本實施例中，可以獲取待處理音頻信息的音頻數(shù)據(jù)，具體的，可以將待處理音頻信息進行解碼，獲取解碼后的音頻數(shù)據(jù)。實際操作中獲取音頻數(shù)據(jù)的方式很多，本實施例不做限制。
[0068]步驟103:提取所述音頻數(shù)據(jù)的特征組，所述特征組包括不少于一個特征。
[0069]本實施例中，在獲取音頻數(shù)據(jù)后，提取該音頻數(shù)據(jù)中的特征，將得到的特征組成特征組。其中，任意一段音頻數(shù)據(jù)至少可以被提取一個特征，將從音頻數(shù)據(jù)中提取的特征組成特征組，也就是說，特征組是由音頻數(shù)據(jù)中的全部特征組成的，也可以將所述特征組理解成包括該音頻數(shù)據(jù)的所有特征的數(shù)組。
[0070]實際操作中，提取音頻數(shù)據(jù)的特征組的方法可以為:
[0071]第一，將所述音頻數(shù)據(jù)分幀，得到幀數(shù)據(jù)；
[0072]其中，由于音頻數(shù)據(jù)是由若干個音頻采樣點組成，將音頻數(shù)據(jù)分幀，就是在音頻數(shù)據(jù)中每隔A個音頻采樣點獲取B個音頻采樣點作為該音頻數(shù)據(jù)的一幀，最終得到若干段幀數(shù)據(jù)，其中，A、B為整數(shù)。特別的，為了在滿足需求的同時保證音頻數(shù)據(jù)中的特征的完整性，音頻數(shù)據(jù)的連續(xù)兩幀可以存在重復數(shù)據(jù)。例如，第一幀的數(shù)據(jù)從樣本0001到樣本1024，與第一巾貞相鄰的第二巾貞數(shù)據(jù)可以從樣本0513到樣本1536,也就是說,從樣本0513到樣本1024為第一幀和第二幀重復的數(shù)據(jù)。
[0073]值得提到的是，由于音頻數(shù)據(jù)中的音頻采樣點通常較密集，可以將音頻數(shù)據(jù)進行降采樣，以便減少數(shù)據(jù)計算量，提高同源信息的檢索效率。
[0074]第二，將所述幀數(shù)據(jù)進行短時傅立葉變換后，得到變換后幀數(shù)據(jù)；
[0075]其中，將音頻數(shù)據(jù)中的每一幀的幀數(shù)據(jù)均進行短時傅立葉變換，得到變換后幀數(shù)據(jù)，以便后續(xù)步驟進行分頻操作。
[0076]第三，將所述變換后幀數(shù)據(jù)進行分頻后，得到頻譜圖；
[0077]其中，將音頻數(shù)據(jù)中的經(jīng)過短時傅立葉變換的幀數(shù)據(jù)進行分頻，其中可以按照梅爾頻率對變換后幀數(shù)據(jù)進行分頻，獲得分頻后幀數(shù)據(jù)，最后，將該音頻數(shù)據(jù)中的每一幀的分頻后幀數(shù)據(jù)進行組合，得到該音頻數(shù)據(jù)的頻譜圖。
[0078]第四，根據(jù)所述頻譜圖，提取所述音頻數(shù)據(jù)的特征組。
[0079]其中，根據(jù)獲取的音頻數(shù)據(jù)的頻譜圖，分別獲取該音頻數(shù)據(jù)的特征，最終將該音頻數(shù)據(jù)的所有特征確定為該音頻數(shù)據(jù)的特征組，其中，特征組包括至少一個特征。
[0080]實際操作中，首先將該頻譜圖切分成若干分塊，其中各個分塊可以為同等大小，同時相鄰分塊之間可以存在重疊部分。其次，對該頻譜圖的所有分塊中的數(shù)據(jù)均做小波變換，獲取小波變換后結(jié)果，即為該音頻數(shù)據(jù)的特征。最后，將根據(jù)該頻譜圖的各個分塊的數(shù)據(jù)獲得的特征組成該音頻數(shù)據(jù)的特征組。
[0081]步驟104:根據(jù)所述特征組，在預設(shè)的音頻特征庫中確定所述待處理音頻信息的同源信息。
[0082]本實施例中，根據(jù)提取的特征組確定待處理音頻信息的同源信息。其中，預先建立音頻特征庫，音頻特征庫包括音頻樣本與樣本特征的對應關(guān)系，通過提取的特征組中的特征與音頻特征庫中的樣本特征進行匹配，在音頻特征庫中獲得待處理音頻信息的同源信肩、O
[0083]實際操作中，可以將所述特征組中的任一特征確定為目標特征，執(zhí)行特征匹配流程:在預設(shè)的音頻特征庫中，獲取與所述目標特征匹配的樣本特征，所述音頻特征庫包括音頻樣本與樣本特征的對應關(guān)系；獲取所述樣本特征對應的音頻樣本后，將所述音頻樣本加入結(jié)果音頻組；將任一未執(zhí)行特征匹配流程的特征確定為目標特征，繼續(xù)執(zhí)行所述特征匹配流程，直到所述特征組中的特征均完成所述特征匹配流程；根據(jù)所述結(jié)果視頻組確定所述待處理音頻信息的同源信息。參考圖2，圖2為以特征P為例介紹特征的匹配過程流程圖，具體可以包括:
[0084]預先獲取特征組中的特征P，圖2中的特征P為8個數(shù)字，實際操作中的特征通常大于8字節(jié)。首先將特征P的8個字節(jié)拆分為4份，將每一份對應一個HASH表。下面對特征P的具體匹配過程進行介紹:
[0085]第一，將特征P的第一份中的兩個字節(jié)123和45組合成一個數(shù)字，組成的數(shù)字可以為 123+45*256 ；
[0086]第二，將該組成的數(shù)字123+45*256送入HASH_1中，與預設(shè)的音頻特征庫中特征進行匹配，假設(shè)得到匹配結(jié)果為“ 11，101，284，4567” ；
[0087]第三，將特征P中的第二份、第三份和第四份依次匹配，可以得到各自的匹配結(jié)果;
[0088]第四，對每一份的匹配結(jié)果進行投票，得到圖中左下方的投票結(jié)果，該投票結(jié)果記錄了音頻特征庫中各個音頻樣本被匹配的次數(shù)；
[0089]第五，預先設(shè)置得票標準數(shù)，圖2中將得票標準數(shù)設(shè)為2，也就是說，對于得票數(shù)少于等于2的結(jié)果進行過濾。如圖最終確定了 “11”和“101”。
[0090]第六，在上述步驟的基礎(chǔ)上還可以進行精細匹配，也就是說，可以將特征P和最終確定的音頻特征庫中的特征11與特征101相比較，獲得最終的與特征P相匹配的樣本特征。
[0091]具體的，特征匹配的標準可以為預先設(shè)置匹配系數(shù)，當兩個特征的匹配系數(shù)大于預設(shè)的閾值時，可以確定這兩個特征是匹配的。其中，匹配系數(shù)可以通過分析特征獲得，例如，當兩個特征中的數(shù)據(jù)相似度為80%以上時，可以認為這兩個特征的匹配系數(shù)大于閾值，所以，這兩個特征是匹配的。
[0092]其中，本實施例提供兩種根據(jù)所述結(jié)果視頻組確定所述待處理視頻的同源視頻的方法。
[0093]第一種方法:首先，獲取所述結(jié)果音頻組中數(shù)量最多的音頻樣本；其次，將所述音頻樣本確定為所述待處理音頻信息的同源信息。
[0094]由于本實施例將與待處理音頻信息的特征相匹配的特征所對應的音頻樣本均加入結(jié)果音頻組中，所以，顯而易見，被加入次數(shù)最多的音頻樣本即為與待處理音頻信息最匹配的視頻，本方法將結(jié)果音頻組中數(shù)量最多的音頻樣本確定為待處理音頻信息的同源信肩、O
[0095]第二種方法:首先，獲取所述結(jié)果音頻組中的音頻樣本；其次，將所述音頻樣本進行組合，得到組合結(jié)果；最后，根據(jù)所述組合結(jié)果確定所述待處理音頻信息的同源信息。
[0096]實際操作中，可以將與待處理音頻信息匹配特征數(shù)目大于預設(shè)個數(shù)的音頻樣本作為待處理音頻信息的同源信息。
[0097]本實施例中所有的閾值，簡單可以通過經(jīng)驗進行設(shè)定，復雜的可以通過機器學習的手段設(shè)置。
[0098]對于載有音頻信息的視頻，本實施例為了保證用戶觀看視頻的體驗，可以提取視頻中的音頻信息，進而對該音頻信息進行檢索，通過對該音頻信息的檢索實現(xiàn)視頻檢索的目的，最終確定該視頻是否包含惡意信息。
[0099]在結(jié)束基于音頻特征的視頻檢索后，可以繼續(xù)對該視頻進行基于圖像特征的檢索，可以有效防止帶有惡意信息的視頻被上傳到公眾平臺。
[0100]實際操作中基于圖像特征的視頻檢索的步驟可以包括:首先，在根據(jù)所述特征組不能確定所述待處理視頻是否包含惡意信息的情況下，獲取所述待處理視頻的圖像特征；其次，將所述圖像特征與預設(shè)的圖像特征庫中的樣本特征匹配后，確定所述待處理視頻是否包含惡意信息。
[0101]本實施例首先獲取待處理音頻信息，其次，獲取所述待處理音頻信息的音頻數(shù)據(jù)，再次，提取所述音頻數(shù)據(jù)的特征組，所述特征組包括不少于一個特征，最后，根據(jù)所述特征組，在預設(shè)的音頻特征庫中確定所述待處理音頻信息的同源信息。由于本實施例在音頻信息包含惡意信息時，能夠?qū)ζ溥M行檢索，避免了存在惡意信息的音頻信息流傳于網(wǎng)絡(luò)，保證了用戶的正常上網(wǎng)體驗。
[0102]實施例二
[0103]參考圖3，圖3為本實施例提供的音頻信息檢索的裝置結(jié)構(gòu)圖，所述裝置可以包括:
[0104]第一獲取模塊301,用于獲取待處理音頻信息；
[0105]第二獲取模塊302，用于獲取所述待處理音頻信息的音頻數(shù)據(jù)；
[0106]提取模塊303，用于提取所述音頻數(shù)據(jù)的特征組，所述特征組包括不少于一個特征；
[0107]所述提取模塊可以包括:
[0108]分幀子模塊，用于將所述音頻數(shù)據(jù)分幀，得到幀數(shù)據(jù)；
[0109]變換子模塊，用于將所述幀數(shù)據(jù)進行短時傅立葉變換后，得到變換后幀數(shù)據(jù)；
[0110]分頻子模塊，用于將所述變換后幀數(shù)據(jù)進行分頻后，得到頻譜圖；
[0111]提取子模塊，用于根據(jù)所述頻譜圖，提取所述音頻數(shù)據(jù)的特征組。
[0112]為了提高同源信息的檢索效率，所述提取模塊還可以包括:
[0113]降采樣子模塊，用于將所述音頻數(shù)據(jù)進行降采樣。
[0114]第一確定模塊304，用于根據(jù)所述特征組，在預設(shè)的音頻特征庫中確定所述待處理音頻信息的同源信息。
[0115]所述第一確定模塊可以包括:
[0116]第一確定子模塊，用于將所述特征組中的任一特征確定為目標特征；
[0117]第一獲取子模塊，用于在預設(shè)的音頻特征庫中，獲取與所述目標特征匹配的樣本特征，所述音頻特征庫包括音頻樣本與樣本特征的對應關(guān)系；
[0118]第二獲取子模塊，用于獲取所述樣本特征對應的音頻樣本后，將所述音頻樣本加入結(jié)果音頻組；
[0119]第二確定子模塊，用于將任一未執(zhí)行特征匹配流程的特征確定為目標特征，繼續(xù)觸發(fā)所述第一獲取子模塊，直到所述特征組中的特征均完成觸發(fā)所述第一獲取子模塊；
[0120]第三確定子模塊，用于根據(jù)所述結(jié)果音頻組確定所述待處理音頻信息的同源信肩、O
[0121]所述第三確定子模塊可以包括:
[0122]第三獲取子模塊，用于獲取所述結(jié)果音頻組中數(shù)量最多的音頻樣本；
[0123]第四確定子模塊，用于將所述音頻樣本確定為所述待處理音頻信息的同源信息。
[0124]或者，所述第三確定子模塊也可以包括:
[0125]第四獲取子模塊，用于獲取所述結(jié)果音頻組中的音頻樣本；
[0126]組合子模塊，用于將所述音頻樣本進行組合，得到組合結(jié)果；
[0127]第五確定子模塊，用于根據(jù)所述組合結(jié)果確定所述待處理音頻信息的同源信息。
[0128]請參考圖4，其圖4為本實施例提供的一種服務(wù)器，該服務(wù)器可以用于實施上述實施例中提供的方法。具體來講:
[0129]服務(wù)器可以包括有一個或一個以上可讀存儲介質(zhì)的存儲器410、輸入單元420、輸出單元430包括有一個或者一個以上處理核心的處理器440、以及電源450等部件。其中:
[0130]存儲器410可用于存儲軟件程序以及模塊，處理器440通過運行存儲在存儲器410的軟件程序以及模塊，從而執(zhí)行各種功能應用以及數(shù)據(jù)處理。存儲器410可主要包括存儲程序區(qū)和存儲數(shù)據(jù)區(qū)，其中，存儲程序區(qū)可存儲操作系統(tǒng)、至少一個功能所需的應用程序；存儲數(shù)據(jù)區(qū)可存儲根據(jù)計算機的使用所創(chuàng)建的數(shù)據(jù)等。此外，存儲器410可以包括高速隨機存取存儲器，還可以包括非易失性存儲器，例如至少一個磁盤存儲器件、閃存器件、或其他易失性固態(tài)存儲器件。相應地，存儲器410還可以包括存儲器控制器，以提供處理器440和輸入單元420對存儲器410的訪問。
[0131]輸入單元420可用于接收輸入的數(shù)字或字符信息，以及產(chǎn)生與用戶設(shè)置以及功能控制有關(guān)的鍵盤、鼠標、操作桿、光學或者軌跡球信號輸入。
[0132]處理器440是服務(wù)器的控制中心，利用各種接口和線路連接各個部分，通過運行或執(zhí)行存儲在存儲器410內(nèi)的軟件程序和/或模塊，以及調(diào)用存儲在存儲器410內(nèi)的數(shù)據(jù)，執(zhí)行計算機的各種功能和處理數(shù)據(jù)，從而對手機進行整體監(jiān)控?？蛇x的，處理器440可包括一個或多個處理核心。
[0133]服務(wù)器還包括給各個部件供電的電源450 (比如電池)，優(yōu)選的，電源可以通過電源管理系統(tǒng)與處理器440邏輯相連，從而通過電源管理系統(tǒng)實現(xiàn)管理充電、放電、以及功耗管理等功能。電源450還可以包括一個或一個以上的直流或交流電源、再充電系統(tǒng)、電源故障檢測電路、電源轉(zhuǎn)換器或者逆變器、電源狀態(tài)指示器等任意組件。
[0134]具體在本實施例中，處理器440會按照如下的指令，將一個或一個以上的應用程序的進程對應的可執(zhí)行文件加載到存儲器410中，并由處理器440來運行存儲在存儲器410中的應用程序，從而實現(xiàn)各種功能:
[0135]獲取待處理音頻信息；
[0136]獲取所述待處理音頻信息的音頻數(shù)據(jù)；
[0137]提取所述音頻數(shù)據(jù)的特征組，所述特征組包括不少于一個特征；
[0138]根據(jù)所述特征組，在預設(shè)的音頻特征庫中確定所述待處理音頻信息的同源信息。
[0139]優(yōu)選地，所述根據(jù)所述特征組，根據(jù)所述特征組，在預設(shè)的音頻特征庫中確定所述待處理音頻信息的同源信息，包括:
[0140]將所述特征組中的任一特征確定為目標特征，執(zhí)行特征匹配流程:在預設(shè)的音頻特征庫中，獲取與所述目標特征匹配的樣本特征，所述音頻特征庫包括音頻樣本與樣本特征的對應關(guān)系；獲取所述樣本特征對應的音頻樣本后，將所述音頻樣本加入結(jié)果音頻組；將任一未執(zhí)行特征匹配流程的特征確定為目標特征，繼續(xù)執(zhí)行所述特征匹配流程，直到所述特征組中的特征均完成所述特征匹配流程；根據(jù)所述結(jié)果音頻組確定所述待處理音頻信息的同源信息。
[0141]優(yōu)選地，所述根據(jù)所述結(jié)果音頻組確定所述待處理音頻信息的同源信息，包括:
[0142]獲取所述結(jié)果音頻組中數(shù)量最多的音頻樣本；
[0143]將所述音頻樣本確定為所述待處理音頻信息的同源信息。
[0144]優(yōu)選地，所述根據(jù)所述結(jié)果音頻組確定所述待處理音頻信息的同源信息，包括:
[0145]獲取所述結(jié)果音頻組中的音頻樣本；
[0146]將所述音頻樣本進行組合，得到組合結(jié)果；
[0147]根據(jù)所述組合結(jié)果確定所述待處理音頻信息的同源信息。優(yōu)選地，所述提取所述音頻數(shù)據(jù)的特征組，所述特征組包括不少于一個特征，包括:
[0148]將所述音頻數(shù)據(jù)分幀，得到幀數(shù)據(jù)；
[0149]將所述幀數(shù)據(jù)進行短時傅立葉變換后，得到變換后幀數(shù)據(jù)；
[0150]將所述變換后幀數(shù)據(jù)進行分頻后，得到頻譜圖；
[0151 ] 根據(jù)所述頻譜圖，提取所述音頻數(shù)據(jù)的特征組。
[0152]優(yōu)選地，所述將所述音頻數(shù)據(jù)分幀，得到幀數(shù)據(jù)之前，還包括:
[0153]將所述音頻數(shù)據(jù)進行降采樣。
[0154]本實施例首先獲取待處理音頻信息，其次，獲取所述待處理音頻信息的音頻數(shù)據(jù)，再次，提取所述音頻數(shù)據(jù)的特征組，所述特征組包括不少于一個特征，最后，根據(jù)所述特征組，在預設(shè)的音頻特征庫中確定所述待處理音頻信息的同源信息。由于本實施例在音頻信息包含惡意信息時，能夠?qū)ζ溥M行檢索，避免了存在惡意信息的音頻信息流傳于網(wǎng)絡(luò)，保證了用戶的正常上網(wǎng)體驗。
[0155]對于裝置實施例而言，由于其基本對應于方法實施例，所以相關(guān)之處參見方法實施例的部分說明即可。以上所描述的裝置實施例僅僅是示意性的，其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的，作為單元顯示的部件可以是或者也可以不是物理單元，即可以位于一個地方，或者也可以分布到多個網(wǎng)絡(luò)單元上?？梢愿鶕?jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動的情況下，即可以理解并實施。
[0156]需要說明的是，在本文中，諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來，而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關(guān)系或者順序。而且，術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含，從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素，而且還包括沒有明確列出的其他要素，或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下，由語句“包括一個......”限定的要素，并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0157]以上對本發(fā)明實施例所提供的音頻信息檢索的方法和裝置進行了詳細介紹，本文中應用了具體個例對本發(fā)明的原理及實施方式進行了闡述，以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想；同時，對于本領(lǐng)域的一般技術(shù)人員，依據(jù)本發(fā)明的思想，在【具體實施方式】及應用范圍上均會有改變之處，綜上所述，本說明書內(nèi)容不應理解為對本發(fā)明的限制。
【權(quán)利要求】
1.一種音頻信息檢索的方法，其特征在于，所述方法包括: 獲取待處理音頻信息；獲取所述待處理音頻信息的音頻數(shù)據(jù)；提取所述音頻數(shù)據(jù)的特征組，所述特征組包括不少于一個特征；根據(jù)所述特征組，在預設(shè)的音頻特征庫中確定所述待處理音頻信息的同源信息。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述根據(jù)所述特征組，在預設(shè)的音頻特征庫中確定所述待處理音頻信息的同源信息，包括: 將所述特征組中的任一特征確定為目標特征，執(zhí)行特征匹配流程:在預設(shè)的音頻特征庫中，獲取與所述目標特征匹配的樣本特征，所述音頻特征庫包括音頻樣本與樣本特征的對應關(guān)系；獲取所述樣本特征對應的音頻樣本后，將所述音頻樣本加入結(jié)果音頻組；將任一未執(zhí)行特征匹配流程的特征確定為目標特征，繼續(xù)執(zhí)行所述特征匹配流程，直到所述特征組中的特征均完成所述特征匹配流程；根據(jù)所述結(jié)果音頻組確定所述待處理音頻信息的同源信息。
3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述根據(jù)所述結(jié)果音頻組確定所述待處理音頻信息的同源信息，包括: 獲取所述結(jié)果音頻組中數(shù)量最多的音頻樣本；將所述音頻樣本確定為所述待處理音頻信息的同源信息。
4.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述根據(jù)所述結(jié)果音頻組確定所述待處理音頻信息的同源信息，包括: 獲取所述結(jié)果音頻組中的音頻樣本；將所述音頻樣本進行組合，得到組合結(jié)果；根據(jù)所述組合結(jié)果確定所述待處理音頻信息的同源信息。
5.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述提取所述音頻數(shù)據(jù)的特征組，所述特征組包括不少于一個特征，包括: 將所述音頻數(shù)據(jù)分幀，得到幀數(shù)據(jù)；將所述幀數(shù)據(jù)進行短時傅立葉變換后，得到變換后幀數(shù)據(jù)；將所述變換后幀數(shù)據(jù)進行分頻后，得到頻譜圖；根據(jù)所述頻譜圖，提取所述音頻數(shù)據(jù)的特征組。
6.根據(jù)權(quán)利要求5所述的方法，其特征在于，所述將所述音頻數(shù)據(jù)分幀，得到幀數(shù)據(jù)之前，還包括: 將所述音頻數(shù)據(jù)進行降采樣。
7.一種音頻信息檢索的裝置，其特征在于，所述裝置包括: 第一獲取模塊，用于獲取待處理音頻信息；第二獲取模塊，用于獲取所述待處理音頻信息的音頻數(shù)據(jù)；提取模塊，用于提取所述音頻數(shù)據(jù)的特征組，所述特征組包括不少于一個特征；第一確定模塊，用于根據(jù)所述特征組，在預設(shè)的音頻特征庫中確定所述待處理音頻信息的同源信息。
8.根據(jù)權(quán)利要求7所述的裝置，其特征在于，所述第一確定模塊，包括: 第一確定子模塊，用于將所述特征組中的任一特征確定為目標特征；第一獲取子模塊，用于在預設(shè)的音頻特征庫中，獲取與所述目標特征匹配的樣本特征，所述音頻特征庫包括音頻樣本與樣本特征的對應關(guān)系；第二獲取子模塊，用于獲取所述樣本特征對應的音頻樣本后，將所述音頻樣本加入結(jié)果首頻組；第二確定子模塊，用于將任一未執(zhí)行特征匹配流程的特征確定為目標特征，繼續(xù)觸發(fā)所述第一獲取子模塊，直到所述特征組中的特征均完成觸發(fā)所述第一獲取子模塊；第三確定子模塊，用于根據(jù)所述結(jié)果音頻組確定所述待處理音頻信息的同源信息。
9.根據(jù)權(quán)利要求8所述的裝置，其特征在于，所述第三確定子模塊，包括: 第三獲取子模塊，用于獲取所述結(jié)果音頻組中數(shù)量最多的音頻樣本；第四確定子模塊，用于將所述音頻樣本確定為所述待處理音頻信息的同源信息。
10.根據(jù)權(quán)利要求8所述的裝置，其特征在于，所述第三確定子模塊，包括: 第四獲取子模塊，用于獲取所述結(jié)果音頻組中的音頻樣本；組合子模塊，用于將所述音頻樣本進行組合，得到組合結(jié)果；第五確定子模塊，用于根據(jù)所述組合結(jié)果確定所述待處理音頻信息的同源信息。
11.根據(jù)權(quán)利要求7所述的裝置，其特征在于，所述提取模塊，包括: 分幀子模塊，用于將所述音頻數(shù)據(jù)分幀，得到幀數(shù)據(jù)；變換子模塊，用于將所述幀數(shù)據(jù)進行短時傅立葉變換后，得到變換后幀數(shù)據(jù)；分頻子模塊，用于將所述變換后幀數(shù)據(jù)進行分頻后，得到頻譜圖；提取子模塊，用于根據(jù)所述頻譜圖，提取所述音頻數(shù)據(jù)的特征組。
12.根據(jù)權(quán)利要求11所述的裝置，其特征在于，所述提取模塊，還包括: 降采樣子模塊，用于將所述音頻數(shù)據(jù)進行降采樣。
【文檔編號】G06F17/30GK104252480SQ201310263426
【公開日】2014年12月31日申請日期:2013年6月27日優(yōu)先權(quán)日:2013年6月27日
【發(fā)明者】黃亮申請人:深圳市騰訊計算機系統(tǒng)有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：黃亮
技術(shù)所有人：深圳市騰訊計算機系統(tǒng)有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構(gòu)動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

信息檢索方法相關(guān)技術(shù)

信息檢索常用的方法有相關(guān)技術(shù)

信息檢索的方法相關(guān)技術(shù)

網(wǎng)絡(luò)信息檢索的方法相關(guān)技術(shù)

信息檢索常用方法相關(guān)技術(shù)

信息檢索方法有哪些相關(guān)技術(shù)

計算機信息檢索的方法相關(guān)技術(shù)

因特網(wǎng)信息檢索方法相關(guān)技術(shù)

信息檢索的基本方法相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種音頻信息檢索的方法和裝置制造方法