欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

檢索方法及設(shè)備的制作方法

文檔序號(hào):6492726閱讀:110來源:國知局
檢索方法及設(shè)備的制作方法
【專利摘要】本發(fā)明實(shí)施例提供一種檢索方法及設(shè)備。本發(fā)明實(shí)施例通過根據(jù)檢索關(guān)鍵詞獲得的至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,對所述至少兩個(gè)檢索結(jié)果進(jìn)行聚類,以獲得聚類之后的至少兩個(gè)檢索結(jié)果,使得能夠向所述客戶端發(fā)送所述聚類之后的至少兩個(gè)檢索結(jié)果,由于采用檢索結(jié)果的內(nèi)容特征信息對檢索結(jié)果進(jìn)行聚類,能夠避免現(xiàn)有技術(shù)中利用檢索結(jié)果的主題名稱,對所述檢索結(jié)果進(jìn)行聚類不夠準(zhǔn)確的問題,從而提高了檢索的可靠性。
【專利說明】檢索方法及設(shè)備
【【技術(shù)領(lǐng)域】】
[0001]本發(fā)明涉及檢索技術(shù),尤其涉及一種檢索方法及設(shè)備。
【【背景技術(shù)】】
[0002]隨著通信技術(shù)的發(fā)展,終端集成了越來越多的功能,從而使得終端的系統(tǒng)功能列表中包含了越來越多相應(yīng)的應(yīng)用程序,有些應(yīng)用程序中會(huì)涉及一些對象檢索操作,例如,百度音樂等。在檢索過程中,經(jīng)常會(huì)出現(xiàn)大量檢索結(jié)果相似的情況。現(xiàn)有技術(shù)中,可以利用檢索結(jié)果的主題名稱,例如,音頻文件的歌曲名稱和演唱者,對所述檢索結(jié)果進(jìn)行聚類,以優(yōu)化客戶端所展示的檢索結(jié)果。
[0003]然而,利用檢索結(jié)果的主題名稱,對所述檢索結(jié)果進(jìn)行聚類不夠準(zhǔn)確,從而導(dǎo)致了檢索的可靠性的降低。

【發(fā)明內(nèi)容】

[0004]本發(fā)明的多個(gè)方面提供一種檢索方法及設(shè)備,用以提高檢索的可靠性。
[0005]本發(fā)明的一方面,提供一種檢索方法,包括:
[0006]接收客戶端發(fā)送的檢索命令,所述檢索命令中包含檢索關(guān)鍵詞;
[0007]根據(jù)所述檢索關(guān)鍵詞,獲得與所述檢索關(guān)鍵詞匹配的至少兩個(gè)檢索結(jié)果;
[0008]根據(jù)所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,對所述至少兩個(gè)檢索結(jié)果進(jìn)行聚類,以獲得聚類之后的至少兩個(gè)檢索結(jié)果;
[0009]向所述客戶端發(fā)送所述聚類之后的至少兩個(gè)檢索結(jié)果。
[0010]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述至少兩個(gè)檢索結(jié)果為音頻文件;所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息包括:
[0011]所述音頻文件的音頻指紋;和/或
[0012]所述音頻指紋的索引值,所述音頻指紋的索引值為根據(jù)所述音頻文件的音頻指紋生成。
[0013]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述至少兩個(gè)檢索結(jié)果為視頻文件;所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息包括:
[0014]所述視頻文件的視頻指紋;和/或
[0015]所述視頻指紋的索引值,所述視頻指紋的索引值為根據(jù)所述視頻文件的視頻指紋生成。
[0016]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述根據(jù)所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,對所述至少兩個(gè)檢索結(jié)果進(jìn)行聚類,包括:
[0017]根據(jù)所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,利用哈希算法,將每個(gè)所述檢索結(jié)果分別移入哈希表中對應(yīng)槽位的鏈表中。
[0018]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述向所述客戶端發(fā)送所述聚類之后的至少兩個(gè)檢索結(jié)果,包括:[0019]遍歷每個(gè)所述槽位,獲得每個(gè)所述槽位的鏈表中的檢索結(jié)果;
[0020]向所述客戶端發(fā)送每個(gè)所述槽位的鏈表中的檢索結(jié)果。
[0021]本發(fā)明的一方面,提供一種檢索設(shè)備,包括:
[0022]接收單元,用于接收客戶端發(fā)送的檢索命令,所述檢索命令中包含檢索關(guān)鍵詞;
[0023]匹配單元,用于根據(jù)所述檢索關(guān)鍵詞,獲得與所述檢索關(guān)鍵詞匹配的至少兩個(gè)檢索結(jié)果;
[0024]聚類單元,用于根據(jù)所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,對所述至少兩個(gè)檢索結(jié)果進(jìn)行聚類,以獲得聚類之后的至少兩個(gè)檢索結(jié)果;
[0025]發(fā)送單元,用于向所述客戶端發(fā)送所述聚類之后的至少兩個(gè)檢索結(jié)果。
[0026]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述匹配單元所匹配出的所述至少兩個(gè)檢索結(jié)果為音頻文件;所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息包括:
[0027]所述音頻文件的音頻指紋;和/或
[0028]所述音頻指紋的索引值,所述音頻指紋的索引值為根據(jù)所述音頻文件的音頻指紋生成。
[0029]如上所述的方面 和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述匹配單元所匹配出的所述至少兩個(gè)檢索結(jié)果為視頻文件;所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息包括:
[0030]所述視頻文件的視頻指紋;和/或
[0031 ] 所述視頻指紋的索引值,所述視頻指紋的索引值為根據(jù)所述視頻文件的視頻指紋生成。
[0032]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述聚類單元具體用于
[0033]根據(jù)所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,利用哈希算法,將每個(gè)所述檢索結(jié)果分別移入哈希表中對應(yīng)槽位的鏈表中。
[0034]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述發(fā)送單元具體用于
[0035]遍歷每個(gè)所述槽位,獲得每個(gè)所述槽位的鏈表中的檢索結(jié)果;以及向所述客戶端發(fā)送每個(gè)所述槽位的鏈表中的檢索結(jié)果
[0036]由上述技術(shù)方案可知,本發(fā)明實(shí)施例通過根據(jù)檢索關(guān)鍵詞獲得的至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,對所述至少兩個(gè)檢索結(jié)果進(jìn)行聚類,以獲得聚類之后的至少兩個(gè)檢索結(jié)果,使得能夠向所述客戶端發(fā)送所述聚類之后的至少兩個(gè)檢索結(jié)果,由于采用檢索結(jié)果的內(nèi)容特征信息對檢索結(jié)果進(jìn)行聚類,能夠避免現(xiàn)有技術(shù)中利用檢索結(jié)果的主題名稱,對所述檢索結(jié)果進(jìn)行聚類不夠準(zhǔn)確的問題,從而提高了檢索的可靠性。
【【專利附圖】

【附圖說明】】
[0037]為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0038]圖1為本發(fā)明一實(shí)施例提供的檢索方法的流程示意圖;
[0039]圖2為圖1對應(yīng)的實(shí)施例中所采用的哈希表的槽位示意圖;
[0040]圖3為本發(fā)明另一實(shí)施例提供的檢索設(shè)備的結(jié)構(gòu)示意圖。
【【具體實(shí)施方式】】
[0041]為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0042]另外,本文中術(shù)語“和/或”,僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,A和/或B,可以表示:單獨(dú)存在A,同時(shí)存在A和B,單獨(dú)存在B這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對象是一種“或”的關(guān)系。
[0043]圖1為本發(fā)明一實(shí)施例提供的檢索方法的流程示意圖,如圖1所示。
[0044]101、接收客戶端發(fā)送的檢索命令,所述檢索命令中包含檢索關(guān)鍵詞。
[0045]102、根據(jù)所述檢索關(guān)鍵詞,獲得與所述檢索關(guān)鍵詞匹配的至少兩個(gè)檢索結(jié)果。
[0046]103、根據(jù)所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,對所述至少兩個(gè)檢索結(jié)果進(jìn)行聚類,以獲得聚類之后的至少兩個(gè)檢索結(jié)果。
[0047]104、向所述客戶端發(fā)送所述聚類之后的至少兩個(gè)檢索結(jié)果。
[0048]需要說明的是,101~104的執(zhí)行主體可以是服務(wù)器。
[0049]這樣,通過根據(jù)檢索關(guān)鍵詞獲得的至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,對所述至少兩個(gè)檢索結(jié)果進(jìn)行聚類,以獲得聚類之后的至少兩個(gè)檢索結(jié)果,使得能夠向所述客戶端發(fā)送所述聚類之后的至少兩個(gè)檢索結(jié)果,由于采用檢索結(jié)果的內(nèi)容特征信息對檢索結(jié)果進(jìn)行聚類,能夠避免現(xiàn)有技術(shù)中利用檢索結(jié)果的主題名稱,對所述檢索結(jié)果進(jìn)行聚類不夠準(zhǔn)確的問題,從而提高了檢索的可靠性。
[0050]其中,所述至少兩個(gè)檢索結(jié)果可以包括但不限于音頻文件和視頻文件中的至少一種。
[0051]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,若所述至少兩個(gè)檢索結(jié)果為音頻文件;那么,相應(yīng)地,所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息則可以包括但不限于:
[0052]所述音頻文件的音頻指紋;和/或
[0053]所述音頻指紋的索引值,所述音頻指紋的索引值為根據(jù)所述音頻文件的音頻指紋生成。
[0054]具體地,在103之前,還可以進(jìn)一步對所述音頻文件進(jìn)行音頻指紋識(shí)別,以獲得所述音頻文件的音頻指紋。其中,所述音頻文件的音頻指紋是一個(gè)音頻文件專屬的特征,是指可以代表一段音樂的重要聲學(xué)特征的基于內(nèi)容的數(shù)字簽名,其主要目的是建立一種有效機(jī)制來比較兩個(gè)音頻數(shù)據(jù)的感知聽覺質(zhì)量。注意這里不是直接比較通常很大的音頻數(shù)據(jù)本身,而是比較其相應(yīng)通常較小的音頻指紋。大量音頻數(shù)據(jù)的音頻指紋和其相應(yīng)的元數(shù)據(jù)例如,歌曲名稱、詞曲作者、歌詞等內(nèi)容一起存儲(chǔ)在一個(gè)數(shù)據(jù)庫中,并采用音頻指紋作為相應(yīng)元數(shù)據(jù)的索引。詳細(xì)描述可以參見現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不再贅述。進(jìn)一步地,如果有需要,還可以進(jìn)一步根據(jù)所述音頻文件的音頻指紋,生成所述音頻指紋的索引值。
[0055]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,若所述至少兩個(gè)檢索結(jié)果為視頻文件;那么,相應(yīng)地,所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息則可以包括但不限于:
[0056]所述視頻文件的視頻指紋;和/或
[0057]所述視頻指紋的索引值,所述視頻指紋的索引值為根據(jù)所述視頻文件的視頻指紋生成。
[0058]具體地,在103之前,還可以進(jìn)一步對所述視頻文件進(jìn)行視頻指紋識(shí)別,以獲得所述視頻文件的視頻指紋。其中,所述視頻文件的視頻指紋是一個(gè)視頻文件區(qū)別于其他視頻文件的唯一特征向量,是指可以表征一段視頻的重要視頻特征的基于內(nèi)容的數(shù)字簽名。詳細(xì)描述可以參見現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不再贅述。進(jìn)一步地,如果有需要,還可以進(jìn)一步根據(jù)所述視頻文件的視頻指紋,生成所述視頻指紋的索引值。
[0059]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在103中,具體可以根據(jù)所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,利用哈希(Hash)算法,將每個(gè)所述檢索結(jié)果分別移入哈希表中對應(yīng)槽位的鏈表中。
[0060]例如,以檢索音頻文件為例,假設(shè)預(yù)先為每個(gè)音頻文件生成一個(gè)128字節(jié)的音頻指紋,那么,則可以進(jìn)一步預(yù)先根據(jù)所述音頻指紋,生成兩個(gè)32位(bit)無符號(hào)整數(shù)(unsign32)的索引值。首先,服務(wù)器接收到客戶端發(fā)送的音頻檢索命令,該音頻檢索命令中包含檢索關(guān)鍵詞。然后,所述服務(wù)器則根據(jù)所述檢索關(guān)鍵詞,獲得與所述檢索關(guān)鍵詞匹配的至少兩個(gè)音頻文件,即音頻文件1、音頻文件2、音頻文件3、……、音頻文件n,并采用現(xiàn)有技術(shù)中的方案,例如,相關(guān)性算法等,對這些音頻文件進(jìn)行排序。接著,所述服務(wù)器則按照所述排序之后的順序,利用每個(gè)音頻文件的索引值,查找哈希表,以確定是否命中,如果命中,為了進(jìn)一步確保聚類的準(zhǔn)確性,還可以再進(jìn)一步比較一下該音頻文件的音頻指紋與所命中的槽位中的音頻文件的音頻指紋,如果一致,則將該音頻文件移入哈希表中所命中槽位的鏈表中,如果沒有命中,則在哈希表中獲取一個(gè)新的槽位,將該音頻文件移入該新的槽位中,如圖2所示,直至完成全部的音頻文件的查找為止。
[0061]相應(yīng)地,在104中,則可以遍歷每個(gè)所述槽位,獲得每個(gè)所述槽位的鏈表中的檢索結(jié)果;然后,向所述客戶端發(fā)送每個(gè)所述槽位的鏈表中的檢索結(jié)果。具體地,可以利用內(nèi)聚數(shù)據(jù)結(jié)構(gòu),對每個(gè)所述槽位的鏈表中的檢索結(jié)果進(jìn)行結(jié)構(gòu)化,并向所述客戶端發(fā)送經(jīng)過所述結(jié)構(gòu)化的每個(gè)所述槽位的鏈表中的檢索結(jié)果,以使得客戶端所展現(xiàn)的檢索結(jié)果實(shí)現(xiàn)內(nèi)聚效果。
[0062]本實(shí)施例中,通過根據(jù)檢索關(guān)鍵詞獲得的至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,對所述至少兩個(gè)檢索結(jié)果進(jìn)行聚類,以獲得聚類之后的至少兩個(gè)檢索結(jié)果,使得能夠向所述客戶端發(fā)送所述聚類之后的至少兩個(gè)檢索結(jié)果,由于采用檢索結(jié)果的內(nèi)容特征信息對檢索結(jié)果進(jìn)行聚類,能夠避免現(xiàn)有技術(shù)中利用檢索結(jié)果的主題名稱,對所述檢索結(jié)果進(jìn)行聚類不夠準(zhǔn)確的問題,從而提高了檢索的可靠性。 [0063]需要說明的是,對于前述的各方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。
[0064]在上述實(shí)施例中,對各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。
[0065]圖3為本發(fā)明另一實(shí)施例提供的檢索設(shè)備的結(jié)構(gòu)示意圖,如圖3所示。本實(shí)施例的檢索設(shè)備可以包括接收單元31、匹配單元32、聚類單元33和發(fā)送單元34。其中,接收單元31,用于接收客戶端發(fā)送的檢索命令,所述檢索命令中包含檢索關(guān)鍵詞;匹配單元32,用于根據(jù)所述檢索關(guān)鍵詞,獲得與所述檢索關(guān)鍵詞匹配的至少兩個(gè)檢索結(jié)果;聚類單元33,用于根據(jù)所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,對所述至少兩個(gè)檢索結(jié)果進(jìn)行聚類,以獲得聚類之后的至少兩個(gè)檢索結(jié)果;發(fā)送單元34,用于向所述客戶端發(fā)送所述聚類之后的至少兩個(gè)檢索結(jié)果。
[0066]需要說明的是,本實(shí)施例提供的檢索設(shè)備可以是服務(wù)器。
[0067]這樣,通過聚類單元根據(jù)匹配單元根據(jù)檢索關(guān)鍵詞獲得的至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,對所述至少兩個(gè)檢索結(jié)果進(jìn)行聚類,以獲得聚類之后的至少兩個(gè)檢索結(jié)果,使得發(fā)送單元能夠向所述客戶端發(fā)送所述聚類之后的至少兩個(gè)檢索結(jié)果,由于采用檢索結(jié)果的內(nèi)容特征信息對檢索結(jié)果進(jìn)行聚類,能夠避免現(xiàn)有技術(shù)中利用檢索結(jié)果的主題名稱,對所述檢索結(jié)果進(jìn)行聚類不夠準(zhǔn)確的問題,從而提高了檢索的可靠性。
[0068]其中,所述匹配單元32所匹配出的所述至少兩個(gè)檢索結(jié)果可以包括但不限于音頻文件和視頻文件中的至少一種。
[0069]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,若所述匹配單元32所匹配出的所述至少兩個(gè)檢索結(jié)果為音頻文件;那么,相應(yīng)地,所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息則可以包括但不限于:
[0070]所述音頻文件的音頻指紋;和/或
[0071]所述音頻指紋的索引值,所述音頻指紋的索引值為根據(jù)所述音頻文件的音頻指紋生成。
[0072]具體地,所述聚類單元33在執(zhí)行聚類操作之前,還可以進(jìn)一步對所述音頻文件進(jìn)行音頻指紋識(shí)別,以獲得所述音頻文件的音頻指紋。其中,所述音頻文件的音頻指紋是一個(gè)音頻文件專屬的特征,是指可以代表一段音樂的重要聲學(xué)特征的基于內(nèi)容的數(shù)字簽名,其主要目的是建立一種有效機(jī)制來比較兩個(gè)音頻數(shù)據(jù)的感知聽覺質(zhì)量。注意這里不是直接比較通常很大的音頻數(shù)據(jù)本身,而是比較其相應(yīng)通常較小的音頻指紋。大量音頻數(shù)據(jù)的音頻指紋和其相應(yīng)的元數(shù)據(jù)例如,歌曲名稱、詞曲作者、歌詞等內(nèi)容一起存儲(chǔ)在一個(gè)數(shù)據(jù)庫中,并采用音頻指紋作為相應(yīng)元數(shù)據(jù)的索引。詳細(xì)描述可以參見現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不再贅述。進(jìn)一步地,如果有需要,所述聚類單元33還可以進(jìn)一步根據(jù)所述音頻文件的音頻指紋,生成所述音頻指紋的索引值。
[0073]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,若所述匹配單元32所匹配出的所述至少兩個(gè)檢索結(jié)果為視頻文件;那么,相應(yīng)地,所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息則可以包括但不限于:
[0074]所述視頻文件的視頻指紋;和/或
[0075]所述視頻指紋的索引值,所述視頻指紋的索引值為根據(jù)所述視頻文件的視頻指紋生成。[0076]具體地,所述聚類單元33在執(zhí)行聚類操作之前,還可以進(jìn)一步對所述視頻文件進(jìn)行視頻指紋識(shí)別,以獲得所述視頻文件的視頻指紋。其中,所述視頻文件的視頻指紋是一個(gè)視頻文件區(qū)別于其他視頻文件的唯一特征向量,是指可以表征一段視頻的重要視頻特征的基于內(nèi)容的數(shù)字簽名。詳細(xì)描述可以參見現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不再贅述。進(jìn)一步地,如果有需要,所述聚類單元33還可以進(jìn)一步根據(jù)所述視頻文件的視頻指紋,生成所述視頻指紋的索引值。
[0077]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,所述聚類單元33具體可以用于根據(jù)所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,利用哈希算法,將每個(gè)所述檢索結(jié)果分別移入哈希表中對應(yīng)槽位的鏈表中。
[0078]例如,以檢索音頻文件為例,假設(shè)所述聚類單元33預(yù)先為每個(gè)音頻文件生成一個(gè)128字節(jié)的音頻指紋,那么,所述聚類單元33則可以進(jìn)一步預(yù)先根據(jù)所述音頻指紋,生成兩個(gè)32位(bit)無符號(hào)整數(shù)(unsign32)的索引值。首先,所述接收單元31接收到客戶端發(fā)送的音頻檢索命令,該音頻檢索命令中包含檢索關(guān)鍵詞。然后,所述匹配單元32則根據(jù)所述檢索關(guān)鍵詞,獲得與所述檢索關(guān)鍵詞匹配的至少兩個(gè)音頻文件,即音頻文件1、音頻文件
2、音頻文件3、......、音頻文件n,并采用現(xiàn)有技術(shù)中的方案,例如,相關(guān)性算法等,對這些音
頻文件進(jìn)行排序。接著,所述聚類單元33則按照所述匹配單元對所述音頻文件進(jìn)行的排序之后的順序,利用每個(gè)音頻文件的索引值,查找哈希表,以確定是否命中,如果命中,為了進(jìn)一步確保聚類的準(zhǔn)確性,還可以再進(jìn)一步比較一下該音頻文件的音頻指紋與所命中的槽位中的音頻文件的音頻指紋,如果一致,則將該音頻文件移入哈希表中所命中槽位的鏈表中,如果沒有命中,則在哈希表中獲取一個(gè)新的槽位,將該音頻文件移入該新的槽位中,如圖2所示,直至完成全部的音頻文件的查找為止。
[0079]相應(yīng)地,所述發(fā)送單元34則具體可以用于遍歷每個(gè)所述槽位,獲得每個(gè)所述槽位的鏈表中的檢索結(jié)果;以及向所述客戶端發(fā)送每個(gè)所述槽位的鏈表中的檢索結(jié)果。具體地,所述發(fā)送單元34可以利用內(nèi)聚數(shù)據(jù)結(jié)構(gòu),對每個(gè)所述槽位的鏈表中的檢索結(jié)果進(jìn)行結(jié)構(gòu)化,并向所述客戶端發(fā)送經(jīng)過所述結(jié)構(gòu)化的每個(gè)所述槽位的鏈表中的檢索結(jié)果,以使得客戶端所展現(xiàn)的檢索結(jié)果實(shí)現(xiàn)內(nèi)聚效果。
[0080]本實(shí)施例中,通過聚類單元根據(jù)匹配單元根據(jù)檢索關(guān)鍵詞獲得的至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,對所述至少兩個(gè)檢索結(jié)果進(jìn)行聚類,以獲得聚類之后的至少兩個(gè)檢索結(jié)果,使得發(fā)送單元能夠向所述客戶端發(fā)送所述聚類之后的至少兩個(gè)檢索結(jié)果,由于采用檢索結(jié)果的內(nèi)容特征信息對檢索結(jié)果進(jìn)行聚類,能夠避免現(xiàn)有技術(shù)中利用檢索結(jié)果的主題名稱,對所述檢索結(jié)果進(jìn)行聚類不夠準(zhǔn)確的問題,從而提高了檢索的可靠性。
[0081]所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng),裝置和單元的具體工作過程,可以參考前述方法實(shí)施例中的對應(yīng)過程,在此不再贅述。
[0082]在本發(fā)明所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。[0083]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。
[0084]另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。
[0085]上述以軟件功能單元的形式實(shí)現(xiàn)的集成的單元,可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。上述軟件功能單元存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)或處理器(processor)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(Read-Only Memory, ROM)、隨機(jī)存取存儲(chǔ)器(Random Access Memory, RAM)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0086]最后應(yīng)說明的是:以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。
【權(quán)利要求】
1.一種檢索方法,其特征在于,包括: 接收客戶端發(fā)送的檢索命令,所述檢索命令中包含檢索關(guān)鍵詞; 根據(jù)所述檢索關(guān)鍵詞,獲得與所述檢索關(guān)鍵詞匹配的至少兩個(gè)檢索結(jié)果; 根據(jù)所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,對所述至少兩個(gè)檢索結(jié)果進(jìn)行聚類,以獲得聚類之后的至少兩個(gè)檢索結(jié)果; 向所述客戶端發(fā)送所述聚類之后的至少兩個(gè)檢索結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述至少兩個(gè)檢索結(jié)果為音頻文件;所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息包括: 所述音頻文件的音頻指紋;和/或 所述音頻指紋的索引值,所述音頻指紋的索引值為根據(jù)所述音頻文件的音頻指紋生成。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述至少兩個(gè)檢索結(jié)果為視頻文件;所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息包括: 所述視頻文件的視頻指紋;和/或 所述視頻指紋的索引值,所述視頻指紋的索引值為根據(jù)所述視頻文件的視頻指紋生成。
4.根據(jù)權(quán)利要求1~`3任一權(quán)利要求所述的方法,其特征在于,所述根據(jù)所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,對所述至少兩個(gè)檢索結(jié)果進(jìn)行聚類,包括: 根據(jù)所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,利用哈希算法,將每個(gè)所述檢索結(jié)果分別移入哈希表中對應(yīng)槽位的鏈表中。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述向所述客戶端發(fā)送所述聚類之后的至少兩個(gè)檢索結(jié)果,包括: 遍歷每個(gè)所述槽位,獲得每個(gè)所述槽位的鏈表中的檢索結(jié)果; 向所述客戶端發(fā)送每個(gè)所述槽位的鏈表中的檢索結(jié)果。
6.—種檢索設(shè)備,其特征在于,包括: 接收單元,用于接收客戶端發(fā)送的檢索命令,所述檢索命令中包含檢索關(guān)鍵詞; 匹配單元,用于根據(jù)所述檢索關(guān)鍵詞,獲得與所述檢索關(guān)鍵詞匹配的至少兩個(gè)檢索結(jié)果; 聚類單元,用于根據(jù)所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,對所述至少兩個(gè)檢索結(jié)果進(jìn)行聚類,以獲得聚類之后的至少兩個(gè)檢索結(jié)果; 發(fā)送單元,用于向所述客戶端發(fā)送所述聚類之后的至少兩個(gè)檢索結(jié)果。
7.根據(jù)權(quán)利要求6所述的設(shè)備,其特征在于,所述匹配單元所匹配出的所述至少兩個(gè)檢索結(jié)果為音頻文件;所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息包括: 所述音頻文件的音頻指紋;和/或 所述音頻指紋的索引值,所述音頻指紋的索引值為根據(jù)所述音頻文件的音頻指紋生成。
8.根據(jù)權(quán)利要求6所述的設(shè)備,其特征在于,所述匹配單元所匹配出的所述至少兩個(gè)檢索結(jié)果為視頻文件;所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息包括: 所述視頻文件的視頻指紋;和/或所述視頻指紋的索引值,所述視頻指紋的索引值為根據(jù)所述視頻文件的視頻指紋生成。
9.根據(jù)權(quán)利要求6~8任一權(quán)利要求所述的設(shè)備,其特征在于,所述聚類單元具體用于 根據(jù)所述至少兩個(gè)檢索結(jié)果的內(nèi)容特征信息,利用哈希算法,將每個(gè)所述檢索結(jié)果分別移入哈希表中對應(yīng)槽位的鏈表中。
10.根據(jù)權(quán)利要求9所述的設(shè)備,其特征在于,所述發(fā)送單元具體用于 遍歷每個(gè)所述槽位,獲得每個(gè)所述槽位的鏈表中的檢索結(jié)果;以及向所述客戶端發(fā)送每個(gè)所述槽位的鏈表中的 檢索結(jié)果。
【文檔編號(hào)】G06F17/30GK103870476SQ201210535176
【公開日】2014年6月18日 申請日期:2012年12月12日 優(yōu)先權(quán)日:2012年12月12日
【發(fā)明者】劉鋒, 朱中的, 王寬 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
嘉鱼县| 闻喜县| 天津市| 白河县| 商洛市| 土默特右旗| 从化市| 建平县| 青田县| 伊宁县| 赞皇县| 繁昌县| 丹阳市| 乌审旗| 秦安县| 鹤山市| 锡林郭勒盟| 福清市| 沙田区| 策勒县| 华池县| 庆元县| 南部县| 大丰市| 安福县| 上栗县| 河曲县| 乐平市| 丽水市| 白银市| 阿合奇县| 潍坊市| 和平区| 广汉市| 陈巴尔虎旗| 宿迁市| 收藏| 汤阴县| 广州市| 鞍山市| 德令哈市|