視頻搜索的方法及裝置制造方法
【專利摘要】本公開是關(guān)于視頻搜索的方法及裝置,用于提高視頻搜索的準(zhǔn)確性,降低視頻搜索的時(shí)長。方法包括:將視頻庫中視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征,利用聚類算法將所述局部特征進(jìn)行聚類;將待搜索視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征作為待搜索局部特征;利用所述聚類算法確定所述待搜索局部特征所屬聚類;根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻。本公開能夠避免以關(guān)鍵幀為對(duì)象重復(fù)搜索過程,降低了搜索運(yùn)算量,提高了搜索效率,降低了搜索時(shí)長;并且針對(duì)視頻中幀的圖片特征進(jìn)行搜索,避免僅根據(jù)視頻的標(biāo)題或簡(jiǎn)介中的文字進(jìn)行搜索,提高了搜索的準(zhǔn)確性。
【專利說明】視頻搜索的方法及裝置
【技術(shù)領(lǐng)域】
[0001]本公開涉及搜索【技術(shù)領(lǐng)域】,尤其涉及視頻搜索的方法及裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,互聯(lián)網(wǎng)的業(yè)務(wù)不斷增加,互聯(lián)網(wǎng)中的數(shù)據(jù)類型不斷增加?;ヂ?lián)網(wǎng)中的數(shù)據(jù)類型除文字外還包括視頻。如何對(duì)視頻進(jìn)行搜索成為需要解決的問題。目前使用的視頻搜索方法為:基于視頻的標(biāo)題或簡(jiǎn)介中的文字進(jìn)行搜索。這種視頻搜索方法的缺陷在于:搜索所用信息有限,使得搜索結(jié)果的準(zhǔn)確性較低。
[0003]另一種視頻搜索方法為:提取待搜索視頻中關(guān)鍵幀,以及關(guān)鍵幀中的局部特征,按關(guān)鍵幀在視頻中的時(shí)序,依次根據(jù)局部特征查找到包含與關(guān)鍵幀匹配的幀的視頻,對(duì)查找結(jié)果中的視頻進(jìn)行篩選,得到與待搜索視頻匹配的視頻。其中,關(guān)鍵幀是指視頻中角色、物體運(yùn)動(dòng)或場(chǎng)景變化中的關(guān)鍵動(dòng)作所處的那一幀圖像,關(guān)鍵幀通常為某個(gè)視頻中某個(gè)場(chǎng)景的穩(wěn)定代表圖像;局部特征是指圖像中比較局部的描述子,用來表述圖像的唯一性和差異性。這種視頻搜索方法的缺陷在于:需要依據(jù)時(shí)序針對(duì)關(guān)鍵幀重復(fù)進(jìn)行搜索,搜索運(yùn)算量龐大,因此使得視頻搜索的效率低下,搜索耗時(shí)過長。
【發(fā)明內(nèi)容】
[0004]為克服相關(guān)技術(shù)中存在的問題,本公開實(shí)施例提供視頻搜索的方法及裝置,用以提高視頻搜索的準(zhǔn)確性,降低視頻搜索的時(shí)長。
[0005]根據(jù)本公開實(shí)施例的第一方面,提供一種視頻搜索的方法,包括:
[0006]將視頻庫中視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征,利用聚類算法將所述局部特征進(jìn)行聚類;
[0007]將待搜索視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征作為待搜索局部特征;
[0008]利用所述聚類算法確定所述待搜索局部特征所屬聚類;
[0009]根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻。
[0010]在一實(shí)施例中,所述根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻,可包括:
[0011]按視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量從高到低的順序,將所述視頻庫中視頻排序;
[0012]從所述視頻排序的前η個(gè)視頻中確定出與所述待搜索視頻匹配的視頻;
[0013]其中,η為預(yù)設(shè)正整數(shù)。
[0014]在一實(shí)施例中,所述從所述視頻排序的前η個(gè)視頻中確定出與所述待搜索視頻匹配的視頻,可包括:
[0015]在所述視頻排序的前η個(gè)視頻中,將所包含的與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量大于第一預(yù)設(shè)閾值的視頻,確定為與所述待搜索視頻匹配的視頻。
[0016]在一實(shí)施例中,所述從所述視頻排序的前η個(gè)視頻中確定出與所述待搜索視頻匹配的視頻,可包括:
[0017]當(dāng)待搜索視頻的關(guān)鍵幀為多個(gè)時(shí),根據(jù)與待搜索局部特征屬于同一聚類的局部特征,確定所述如η個(gè)視頻的各個(gè)視頻中與所述待搜索視頻的關(guān)鍵巾貞匹配的關(guān)鍵巾貞;
[0018]在所述前η個(gè)視頻中,將匹配的關(guān)鍵幀在視頻中時(shí)序與所述待搜索視頻中關(guān)鍵幀的時(shí)序一致的視頻,確定為與所述待搜索視頻匹配的視頻。
[0019]在一實(shí)施例中,所述根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻,可包括:
[0020]當(dāng)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量大于第二預(yù)設(shè)閾值時(shí),確定所述視頻與所述待搜索視頻匹配。
[0021]在一實(shí)施例中,所述利用聚類算法將所述局部特征進(jìn)行聚類,可包括:
[0022]利用聚類算法生成聚類樹;
[0023]將所述視頻庫中視頻的局部特征在所述聚類樹中遍歷,確定各個(gè)所述局部特征到達(dá)的葉子節(jié)點(diǎn);
[0024]其中,葉子節(jié)點(diǎn)與局部特征的聚類對(duì)應(yīng),到達(dá)葉子節(jié)點(diǎn)的局部特征屬于所述葉子節(jié)點(diǎn)對(duì)應(yīng)的聚類。
[0025]在一實(shí)施例中,所述將所述視頻庫中視頻的局部特征在所述聚類樹中遍歷,確定各個(gè)所述局部特征到達(dá)的葉子節(jié)點(diǎn)后,還可包括:
[0026]在所述葉子節(jié)點(diǎn)中,記錄到達(dá)所述葉子節(jié)點(diǎn)的各個(gè)局部特征的標(biāo)識(shí),生成倒排文檔;
[0027]其中,所述局部特征的標(biāo)識(shí)包括:所述局部特征所在視頻的標(biāo)號(hào)。
[0028]在一實(shí)施例中,所述利用所述聚類算法確定所述待搜索局部特征所屬聚類,可包括:
[0029]對(duì)于各個(gè)待搜索局部特征,將所述待搜索局部特征在所述聚類樹中遍歷,確定所述待搜索局部特征到達(dá)的葉子節(jié)點(diǎn);
[0030]其中,所述待搜索局部特征屬于所述葉子節(jié)點(diǎn)對(duì)應(yīng)的聚類。
[0031]在一實(shí)施例中,所述根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻,可包括:
[0032]根據(jù)倒排文檔的葉子節(jié)點(diǎn)中記錄的局部特征的標(biāo)識(shí),獲得所述待搜索局部特征所屬聚類中局部特征的標(biāo)識(shí);
[0033]根據(jù)局部特征的標(biāo)識(shí),統(tǒng)計(jì)視頻庫中視頻所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量;
[0034]根據(jù)統(tǒng)計(jì)出的數(shù)量從視頻庫中確定出與所述待搜索視頻匹配的視頻。
[0035]根據(jù)本公開實(shí)施例的第二方面,提供一種視頻搜索的裝置,包括:
[0036]局部特征聚類模塊,用于將視頻庫中視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征,利用聚類算法將所述局部特征進(jìn)行聚類;
[0037]待搜索局部特征提取|吳塊,用于將待搜索視頻提取關(guān)鍵巾貞,提取關(guān)鍵巾貞中局部特征作為待搜索局部特征;
[0038]待搜索局部特征歸類模塊,用于利用所述聚類算法確定所述待搜索局部特征所屬聚類;
[0039]匹配視頻確定模塊,用于根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻。
[0040]在一實(shí)施例中,所述匹配視頻確定模塊,可包括:
[0041]視頻排序子模塊,用于按視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量從高到低的順序,將所述視頻庫中視頻排序;
[0042]第一匹配視頻確定子模塊,用于從所述視頻排序的前η個(gè)視頻中確定出與所述待搜索視頻匹配的視頻;
[0043]其中,η為預(yù)設(shè)正整數(shù)。
[0044]在一實(shí)施例中,所述第一匹配視頻確定子模塊,可包括:
[0045]第一匹配視頻確定單元,用于在所述視頻排序的前η個(gè)視頻中,將所包含的與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量大于第一預(yù)設(shè)閾值的視頻,確定為與所述待搜索視頻匹配的視頻。
[0046]在一實(shí)施例中,所述第一匹配視頻確定子模塊,可包括:
[0047]匹配關(guān)鍵幀確定單元,用于當(dāng)待搜索視頻的關(guān)鍵幀為多個(gè)時(shí),根據(jù)與待搜索局部特征屬于同一聚類的局部特征,確定所述前η個(gè)視頻的各個(gè)視頻中與所述待搜索視頻的關(guān)鍵幀匹配的關(guān)鍵幀;
[0048]第二匹配視頻確定單元,用于在所述前η個(gè)視頻中,將匹配的關(guān)鍵幀在視頻中時(shí)序與所述待搜索視頻中關(guān)鍵巾貞的時(shí)序一致的視頻,確定為與所述待搜索視頻匹配的視頻。
[0049]在一實(shí)施例中,所述第一匹配視頻確定子模塊,可包括:
[0050]第二匹配視頻確定子模塊,用于當(dāng)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量大于第二預(yù)設(shè)閾值時(shí),確定所述視頻與所述待搜索視頻匹配。
[0051]在一實(shí)施例中,所述局部特征聚類模塊,可包括:
[0052]聚類樹生成子模塊,用于利用聚類算法生成聚類樹;
[0053]聚類樹遍歷子模塊,用于將所述視頻庫中視頻的局部特征在所述聚類樹中遍歷,確定各個(gè)所述局部特征到達(dá)的葉子節(jié)點(diǎn);
[0054]其中,葉子節(jié)點(diǎn)與局部特征的聚類對(duì)應(yīng),到達(dá)葉子節(jié)點(diǎn)的局部特征屬于所述葉子節(jié)點(diǎn)對(duì)應(yīng)的聚類。
[0055]在一實(shí)施例中,所述局部特征聚類模塊,還可包括:
[0056]倒排文檔生成子模塊,用于在所述葉子節(jié)點(diǎn)中,記錄到達(dá)所述葉子節(jié)點(diǎn)的各個(gè)局部特征的標(biāo)識(shí),生成倒排文檔;
[0057]其中,所述局部特征的標(biāo)識(shí)包括:所述局部特征所在視頻的標(biāo)號(hào)。
[0058]在一實(shí)施例中,所述待搜索局部特征歸類模塊,可包括:
[0059]待搜索局部特征歸類子模塊,用于對(duì)于各個(gè)待搜索局部特征,將所述待搜索局部特征在所述聚類樹中遍歷,確定所述待搜索局部特征到達(dá)的葉子節(jié)點(diǎn);
[0060]其中,所述待搜索局部特征屬于所述葉子節(jié)點(diǎn)對(duì)應(yīng)的聚類。
[0061]在一實(shí)施例中,所述匹配視頻確定模塊,可包括:
[0062]標(biāo)識(shí)獲取子模塊,用于根據(jù)倒排文檔的葉子節(jié)點(diǎn)中記錄的局部特征的標(biāo)識(shí),獲得所述待搜索局部特征所屬聚類中局部特征的標(biāo)識(shí);
[0063]數(shù)量統(tǒng)計(jì)子模塊,用于根據(jù)局部特征的標(biāo)識(shí),統(tǒng)計(jì)視頻庫中視頻所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量;
[0064]視頻確定子模塊,用于根據(jù)統(tǒng)計(jì)出的數(shù)量從視頻庫中確定出與所述待搜索視頻匹配的視頻。
[0065]根據(jù)本公開實(shí)施例的第三方面,提供一種視頻搜索的裝置,包括:
[0066]處理器;
[0067]用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
[0068]其中,所述處理器被配置為:
[0069]將視頻庫中視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征,利用聚類算法將所述局部特征進(jìn)行聚類;
[0070]將待搜索視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征作為待搜索局部特征;
[0071]利用所述聚類算法確定所述待搜索局部特征所屬聚類;
[0072]根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻。
[0073]本公開的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:通過將局部特征和待搜索局部特征進(jìn)行聚類,根據(jù)各個(gè)聚類中包含的局部特征和待搜索局部特征的情況,進(jìn)行視頻搜索,能夠避免以關(guān)鍵幀為對(duì)象重復(fù)搜索過程,降低了搜索運(yùn)算量,提高了搜索效率,降低了搜索時(shí)長;并且針對(duì)視頻中幀的圖片特征進(jìn)行搜索,避免僅根據(jù)視頻的標(biāo)題或簡(jiǎn)介中的文字進(jìn)行搜索,提高了搜索的準(zhǔn)確性。
[0074]應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
【專利附圖】
【附圖說明】
[0075]此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實(shí)施例,并與說明書一起用于解釋本公開的原理。
[0076]圖1是根據(jù)一示例性實(shí)施例示出的視頻搜索的方法的流程圖。
[0077]圖2是根據(jù)一示例性實(shí)施例示出的從視頻中提取關(guān)鍵幀和局部特征的示意圖。
[0078]圖3是根據(jù)一示例性實(shí)施例示出的將視頻庫中視頻的局部特征在聚類樹中遍歷的示意圖。
[0079]圖4是根據(jù)一示例性實(shí)施例示出的生成的倒排文檔的示意圖。
[0080]圖5是根據(jù)一示例性實(shí)施例一示出的視頻搜索的方法的流程圖。
[0081]圖6是根據(jù)一示例性實(shí)施例示出的一種視頻搜索的裝置的框圖。
[0082]圖7是根據(jù)一示例性實(shí)施例示出的另一種視頻搜索的裝置的框圖。
[0083]圖8是根據(jù)一示例性實(shí)施例示出的另一種視頻搜索的裝置的框圖。
[0084]圖9是根據(jù)一示例性實(shí)施例示出的另一種視頻搜索的裝置的框圖。
[0085]圖10是根據(jù)一示例性實(shí)施例示出的另一種視頻搜索的裝置的框圖。
[0086]圖11是根據(jù)一示例性實(shí)施例示出的另一種視頻搜索的裝置的框圖。
[0087]圖12是根據(jù)一示例性實(shí)施例示出的一種適用于視頻搜索的裝置的框圖(終端設(shè)備的一般結(jié)構(gòu))。
【具體實(shí)施方式】
[0088]這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本公開相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。
[0089]圖1是根據(jù)一示例性實(shí)施例示出的視頻搜索的方法的流程圖。如圖1所示,該視頻搜索的方法用于各種設(shè)備,如個(gè)人電腦、手機(jī)、平板電腦、服務(wù)器、路由器中,包括以下步驟 S101-S104:
[0090]在步驟SlOl中、將視頻庫中視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征,利用聚類算法將局部特征進(jìn)行聚類。
[0091]舉例而言,如圖2所示,對(duì)于視頻庫中的各個(gè)視頻解碼后,獲得視頻幀,在視頻幀中提取關(guān)鍵幀,對(duì)于各個(gè)關(guān)鍵幀提取局部特征,例如,對(duì)于各個(gè)關(guān)鍵幀提取SIFT (尺度不變特征轉(zhuǎn)換,Scale-1nvariant feature transform)特征。SIFT特征是一種局部特征,可以用來描述圖像的差異性。
[0092]在一實(shí)施例中,上述利用聚類算法將局部特征進(jìn)行聚類可包括如下步驟A1-A2。
[0093]在步驟Al中、利用聚類算法生成聚類樹。
[0094]舉例而言,利用K-means算法(硬聚類算法)生成K_means樹。K_means算法為一種聚類算法,采用距離作為相似性的評(píng)價(jià)指標(biāo),即認(rèn)為兩個(gè)對(duì)象的距離越近,其相似度越大;認(rèn)為簇是由距離靠近的對(duì)象組成的,因此將獲得緊湊且獨(dú)立的簇作為最終目標(biāo)。例如,對(duì)訓(xùn)練集中的視頻進(jìn)行關(guān)鍵幀提取,提取關(guān)鍵幀中局部特征,利用提取的局部特征進(jìn)行K-means樹訓(xùn)練,得到二層三叉K-means樹,可以在K-means樹中保留每個(gè)葉子節(jié)點(diǎn)的聚類中心。
[0095]本公開中的聚類算法不限于K-means算法,例如,也可以使用K_medoids算法(K-means的改進(jìn)算法)或Clarans算法(基于隨機(jī)搜索的大型應(yīng)用聚類算法,ClusteringLarge Applicat1n based upon RANdomized Search),將局部特征進(jìn)行聚類。
[0096]在步驟A2中、將視頻庫中視頻的局部特征在聚類樹中遍歷,確定各個(gè)局部特征到達(dá)的葉子節(jié)點(diǎn)。
[0097]其中,葉子節(jié)點(diǎn)與局部特征的聚類對(duì)應(yīng),到達(dá)葉子節(jié)點(diǎn)的局部特征屬于葉子節(jié)點(diǎn)對(duì)應(yīng)的聚類。
[0098]舉例而言,如圖3所示,將視頻庫中視頻的一局部特征在二層三叉的K-means樹中遍歷,該局部特征通過圖3中標(biāo)出的路徑,最終到達(dá)標(biāo)為灰色的葉子節(jié)點(diǎn)。該局部特征屬于該葉子節(jié)點(diǎn)所對(duì)應(yīng)的聚類。
[0099]步驟A2中的操作也是將局部特征進(jìn)行量化的過程,通過步驟A2中操作降低了局部特征的維度。
[0100]在一實(shí)施例中,步驟A2后還可包括:在葉子節(jié)點(diǎn)中,記錄到達(dá)葉子節(jié)點(diǎn)的各個(gè)局部特征的標(biāo)識(shí),生成倒排文檔。其中,局部特征的標(biāo)識(shí)包括:局部特征所在視頻的標(biāo)號(hào),還可包括局部特征的標(biāo)號(hào)、局部特征所在關(guān)鍵幀的標(biāo)號(hào)。
[0101]倒排文檔是文檔檢索中通常使用的數(shù)據(jù)結(jié)構(gòu),相關(guān)技術(shù)中引入到圖像搜索中,記錄著一個(gè)單詞,即特征,的水平反向索引,對(duì)應(yīng)著該單詞出現(xiàn)的每一個(gè)文檔的記錄索引。
[0102]舉例而言,如圖4所示,視頻庫中視頻的局部特征在聚類樹中遍歷,到達(dá)葉子節(jié)點(diǎn),記錄下各個(gè)葉子節(jié)點(diǎn)中包含的局部特征的標(biāo)識(shí),局部特征的標(biāo)識(shí)包括:局部特征ID、局部特征所在關(guān)鍵幀ID,以及局部特征所在視頻ID,生成倒排文檔。各個(gè)葉子節(jié)點(diǎn)中的局部特征數(shù)量可能會(huì)不同。
[0103]在步驟S102中、將待搜索視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征作為待搜索局部特征。
[0104]舉例而言,對(duì)于待搜索視頻解碼后,獲得視頻幀,在視頻幀中提取關(guān)鍵幀,對(duì)于各個(gè)關(guān)鍵幀提取局部特征,例如,對(duì)于各個(gè)關(guān)鍵幀提取SIFT(尺度不變特征轉(zhuǎn)換,Scale-1nvariant feature transform)特征。將提取的待搜索視頻的局部特征作為待搜索局部特征。
[0105]在步驟S103中、利用聚類算法確定待搜索局部特征所屬聚類。
[0106]在一實(shí)施例中,如前所述,在步驟Al中,利用聚類算法生成聚類樹。步驟S103可包括:對(duì)于各個(gè)待搜索局部特征,將待搜索局部特征在聚類樹中遍歷,確定待搜索局部特征到達(dá)的葉子節(jié)點(diǎn)。
[0107]其中,待搜索局部特征屬于葉子節(jié)點(diǎn)對(duì)應(yīng)的聚類。
[0108]在另一實(shí)施例中,生成有倒排文檔,通過倒排文檔,能夠確定與待搜索局部特征到達(dá)同一葉子節(jié)點(diǎn)的局部特征的標(biāo)識(shí),即與待搜索局部特征屬于同一聚類的局部特征的標(biāo)識(shí)。
[0109]在步驟S104中、根據(jù)視頻中所包含的、與待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從視頻庫中確定出與待搜索視頻匹配的視頻。
[0110]在一實(shí)施例中,如前所述,對(duì)應(yīng)聚類樹生成有倒排文檔,步驟S104可包括如下步驟 C1-C3:
[0111]在步驟Cl中、根據(jù)倒排文檔的葉子節(jié)點(diǎn)中記錄的局部特征的標(biāo)識(shí),獲得待搜索局部特征所屬聚類中局部特征的標(biāo)識(shí)。
[0112]在步驟C2中、根據(jù)局部特征的標(biāo)識(shí),統(tǒng)計(jì)視頻庫中視頻所包含的與待搜索局部特征屬于同一聚類的局部特征的數(shù)量。
[0113]在步驟C3中、根據(jù)統(tǒng)計(jì)出的數(shù)量從視頻庫中確定出與待搜索視頻匹配的視頻。
[0114]本實(shí)施例中,使用倒排文檔,便于對(duì)視頻中所包含的、與待搜索局部特征屬于同一聚類的局部特征的數(shù)量進(jìn)行統(tǒng)計(jì),進(jìn)一步提高了搜索速度。
[0115]在一實(shí)施例中,步驟S104可包括如下步驟D1-D2,
[0116]在步驟Dl中、按視頻中所包含的、與待搜索局部特征屬于同一聚類的局部特征的數(shù)量從高到低的順序,將視頻庫中視頻排序。
[0117]舉例而言,待搜索視頻具有i個(gè)待搜索局部特征,確定出i個(gè)待搜索局部特征所屬聚類后,對(duì)于每個(gè)待搜索局部特征,確定出待搜索局部特征所屬聚類中局部特征所在視頻。然后,統(tǒng)計(jì)出視頻庫中每個(gè)視頻中與上述i個(gè)待搜索局部特征屬于同一聚類的局部特征的數(shù)量。按統(tǒng)計(jì)出的數(shù)量從高到低的順序,將視頻庫中視頻排序。
[0118]例如,待搜索視頻具有3個(gè)待搜索局部特征,對(duì)于待搜索局部特征E1,所屬聚類中局部特征E11、E12和E13分別在視頻F1,視頻F2和視頻F3中;對(duì)于待搜索局部特征E2,所屬聚類中局部特征E21和E22分別在視頻Fl和視頻F2 ;對(duì)于待搜索局部特征E3,所屬聚類中局部特征E31所在視頻為視頻F2。由此,得出視頻Fl包含2個(gè)與待搜索局部特征屬于同一聚類的局部特征,視頻F2包含3個(gè)與待搜索局部特征屬于同一聚類的局部特征,視頻F3包含I個(gè)與待搜索局部特征屬于同一聚類的局部特征。按視頻中所包含的、與待搜索局部特征屬于同一聚類的局部特征的數(shù)量從高到低的順序?qū)⒁曨l排序,所得視頻排序?yàn)橐曨lF2、視頻Fl和視頻F3。
[0119]在步驟D2中、從視頻排序的前η個(gè)視頻中確定出與待搜索視頻匹配的視頻。
[0120]其中,η為預(yù)設(shè)正整數(shù)。
[0121]舉例而言,可以將視頻排序中的前η個(gè)視頻確定為與待搜索視頻匹配的視頻。例如,在η為2時(shí),從視頻排序中選取前2個(gè)視頻,將視頻F2和視頻Fl作為與待搜索視頻匹配的視頻。
[0122]在本示例中,利用視頻中所包含的、與待搜索局部特征屬于同一聚類的局部特征的數(shù)量,搜索出與待搜索視頻匹配的視頻,搜索運(yùn)算量得到顯著降低,提高了視頻搜索的速度。
[0123]在一實(shí)施例中,步驟D2可包括:在視頻排序的前η個(gè)視頻中,將所包含的與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量大于第一預(yù)設(shè)閾值的視頻,確定為與待搜索視頻匹配的視頻。
[0124]本實(shí)施例中,對(duì)排序的如η個(gè)視頻進(jìn)行篩選,進(jìn)一步提聞搜索的準(zhǔn)確性。
[0125]在一實(shí)施例中,步驟D2可包括如下步驟G1-G2。
[0126]在步驟Gl中、當(dāng)待搜索視頻的關(guān)鍵幀為多個(gè)時(shí),根據(jù)與待搜索局部特征屬于同一聚類的局部特征,確定前η個(gè)視頻的各個(gè)視頻中與待搜索視頻的關(guān)鍵幀匹配的關(guān)鍵幀。
[0127]舉例而言,獲得待搜索局部特征所在的聚類中,各個(gè)局部特征所在關(guān)鍵幀的標(biāo)識(shí);對(duì)于前η個(gè)視頻中各個(gè)視頻,根據(jù)獲得的關(guān)鍵幀的標(biāo)識(shí),確定各個(gè)視頻中與待搜索視頻的關(guān)鍵巾貞匹配的關(guān)鍵中貞。
[0128]在步驟G2中、在前η個(gè)視頻中,將匹配的關(guān)鍵幀在視頻中時(shí)序與待搜索視頻中關(guān)鍵幀的時(shí)序一致的視頻,確定為與所述待搜索視頻匹配的視頻。
[0129]在本實(shí)施例中,根據(jù)關(guān)鍵幀在視頻中時(shí)序選取視頻,如此,能夠提高了搜索的準(zhǔn)確性,此外,因?yàn)闀r(shí)序比較僅在前η個(gè)視頻中進(jìn)行,限制了搜索速度所受影響,在提高搜索準(zhǔn)確性的同時(shí),保證了搜索速度。
[0130]在一實(shí)施例中,步驟S104可包括:當(dāng)視頻中所包含的、與待搜索局部特征屬于同一聚類的局部特征的數(shù)量大于第二預(yù)設(shè)閾值時(shí),確定視頻與待搜索視頻匹配。
[0131]本實(shí)施例中,將視頻中所包含的、與待搜索局部特征屬于同一聚類的局部特征的數(shù)量與第二預(yù)設(shè)閾值做比較,如此,確定搜索結(jié)果的方法簡(jiǎn)單,易于實(shí)現(xiàn),提高了搜索效率。
[0132]本公開的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:通過將局部特征和待搜索局部特征進(jìn)行聚類,根據(jù)各個(gè)聚類中包含的局部特征和待搜索局部特征的情況,進(jìn)行視頻搜索,能夠避免以關(guān)鍵幀為對(duì)象重復(fù)搜索過程,降低了搜索運(yùn)算量,提高了搜索效率,降低了搜索時(shí)長;并且針對(duì)視頻中幀的圖片特征進(jìn)行搜索,避免僅根據(jù)視頻的標(biāo)題或簡(jiǎn)介中的文字進(jìn)行搜索,提高了搜索的準(zhǔn)確性。
[0133]圖5是根據(jù)一示例性實(shí)施例一示出的視頻搜索的方法的流程圖。如圖5所示,該視頻搜索的方法用于各種設(shè)備,如個(gè)人電腦、手機(jī)、平板電腦、服務(wù)器、路由器中。實(shí)施例一應(yīng)用在如下場(chǎng)景,用戶輸入待搜索視頻,在視頻庫中搜索待搜索視頻,如圖5所示,方法包括以下步驟:
[0134]在步驟S501中,對(duì)訓(xùn)練集中的視頻進(jìn)行關(guān)鍵幀提取,對(duì)關(guān)鍵幀提取SIFT特征,利用SIFT特征進(jìn)行K-means樹訓(xùn)練,得到二層三叉K-means樹。
[0135]所得二層三叉K-means樹如圖3所示。
[0136]在步驟S502中,對(duì)視頻庫中的各個(gè)視頻解碼后,獲得視頻幀,從視頻幀中提取關(guān)鍵幀,對(duì)各個(gè)關(guān)鍵幀提取SIFT特征。
[0137]在步驟S503中,將視頻庫中視頻的SIFT特征在K-means樹中遍歷,確定各個(gè)SIFT特征到達(dá)的葉子節(jié)點(diǎn)。
[0138]在步驟S504中,在葉子節(jié)點(diǎn)中,記錄到達(dá)葉子節(jié)點(diǎn)的各個(gè)SIFT特征的標(biāo)識(shí),生成倒排文檔。
[0139]SIFT特征的標(biāo)識(shí)包括:SIFT特征ID、SIFT特征所在關(guān)鍵幀ID,以及SIFT特征所在視頻ID。
[0140]在步驟S505中,對(duì)于待搜索視頻解碼后,獲得視頻幀,在視頻幀中提取關(guān)鍵幀,對(duì)于各個(gè)關(guān)鍵幀提取SIFT特征作為待搜索SIFT特征。
[0141]其中,待搜索視頻的關(guān)鍵幀為多個(gè)。
[0142]在步驟S506中,對(duì)于各個(gè)待搜索SIFT特征,將待搜索SIFT特征在K-means樹中遍歷,確定待搜索SIFT特征到達(dá)的葉子節(jié)點(diǎn)。
[0143]在步驟S507中,根據(jù)倒排文檔的葉子節(jié)點(diǎn)中記錄的SIFT特征的標(biāo)識(shí),獲得待搜索SIFT特征到達(dá)的葉子節(jié)點(diǎn)中SIFT特征的標(biāo)識(shí)。
[0144]在步驟S508中,根據(jù)待搜索SIFT特征到達(dá)的葉子節(jié)點(diǎn)中,各個(gè)SIFT特征所在視頻ID,統(tǒng)計(jì)視頻庫中視頻所包含的與待搜索SIFT特征到達(dá)同一葉子節(jié)點(diǎn)的SIFT特征的數(shù)量。
[0145]在步驟S509中、按視頻對(duì)應(yīng)的數(shù)量從高到低的順序,將視頻排序。
[0146]在步驟S510中,根據(jù)與待搜索SIFT特征在同一葉子節(jié)點(diǎn)的SIFT特征所在關(guān)鍵幀ID和所在視頻ID,確定排序中如η個(gè)視頻的各個(gè)視頻中與待搜索視頻的關(guān)鍵巾貞匹配的關(guān)鍵幀。
[0147]在步驟S511中,在前η個(gè)視頻中,確定匹配的關(guān)鍵幀在視頻中時(shí)序與待搜索視頻中關(guān)鍵幀的時(shí)序一致的視頻,作為與待搜索視頻匹配的視頻。
[0148]本實(shí)施例提供的技術(shù)方案可以包括以下有益效果:通過將SIFT特征和待搜索SIFT特征進(jìn)行聚類,根據(jù)各個(gè)聚類中包含的SIFT特征和待搜索SIFT特征的情況,進(jìn)行視頻搜索,能夠避免以關(guān)鍵幀為對(duì)象重復(fù)搜索過程,降低了搜索運(yùn)算量,提高了搜索效率,降低了搜索時(shí)長;并且針對(duì)視頻中幀的圖片特征進(jìn)行搜索,避免僅根據(jù)視頻的標(biāo)題或簡(jiǎn)介中的文字進(jìn)行搜索,提高了搜索的準(zhǔn)確性。
[0149]圖6是根據(jù)一示例性實(shí)施例示出的一種視頻搜索的裝置的框圖。如圖6所示,該視頻搜索的裝置用于各種設(shè)備,如個(gè)人電腦、手機(jī)、平板電腦、服務(wù)器、路由器中,包括:
[0150]局部特征聚類模塊61被配置為將視頻庫中視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征,利用聚類算法將局部特征進(jìn)行聚類;
[0151]待搜索局部特征提取模塊62被配置為將待搜索視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征作為待搜索局部特征;
[0152]待搜索局部特征歸類模塊63被配置為利用聚類算法確定待搜索局部特征所屬聚類;
[0153]匹配視頻確定模塊64被配置為根據(jù)視頻中所包含的、與待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從視頻庫中確定出與待搜索視頻匹配的視頻。
[0154]在一實(shí)施例中,如圖7所示,匹配視頻確定模塊64,可包括:
[0155]視頻排序子模塊71被配置為按視頻中所包含的、與待搜索局部特征屬于同一聚類的局部特征的數(shù)量從高到低的順序,將視頻庫中視頻排序;
[0156]第一匹配視頻確定子模塊72被配置為從視頻排序的前η個(gè)視頻中確定出與待搜索視頻匹配的視頻;
[0157]其中,η為預(yù)設(shè)正整數(shù)。
[0158]在一實(shí)施例中,第一匹配視頻確定子模塊,可包括:
[0159]第一匹配視頻確定單元被配置為在所述視頻排序的前η個(gè)視頻中,將所包含的與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量大于第一預(yù)設(shè)閾值的視頻,確定為與所述待搜索視頻匹配的視頻。
[0160]在一實(shí)施例中,如圖8所示,第一匹配視頻確定子模塊72,可包括:
[0161]匹配關(guān)鍵幀確定單元81被配置為當(dāng)待搜索視頻的關(guān)鍵幀為多個(gè)時(shí),根據(jù)與待搜索局部特征屬于同一聚類的局部特征,確定前η個(gè)視頻的各個(gè)視頻中與待搜索視頻的關(guān)鍵幀匹配的關(guān)鍵幀;
[0162]第二匹配視頻確定單元82被配置為在前η個(gè)視頻中,將匹配的關(guān)鍵幀在視頻中時(shí)序與待搜索視頻中關(guān)鍵巾貞的時(shí)序一致的視頻,確定為與待搜索視頻匹配的視頻。
[0163]在一實(shí)施例中,第一匹配視頻確定子模塊,可包括:
[0164]第二匹配視頻確定子模塊被配置為當(dāng)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量大于第二預(yù)設(shè)閾值時(shí),確定所述視頻與所述待搜索視頻匹配。
[0165]在一實(shí)施例中,如圖9所示,局部特征聚類模塊61,可包括:
[0166]聚類樹生成子模塊91被配置為利用聚類算法生成聚類樹;
[0167]聚類樹遍歷子模塊92被配置為將視頻庫中視頻的局部特征在聚類樹中遍歷,確定各個(gè)局部特征到達(dá)的葉子節(jié)點(diǎn);
[0168]其中,葉子節(jié)點(diǎn)與局部特征的聚類對(duì)應(yīng),到達(dá)葉子節(jié)點(diǎn)的局部特征屬于所述葉子節(jié)點(diǎn)對(duì)應(yīng)的聚類。
[0169]在一實(shí)施例中,如圖10所示,局部特征聚類模塊61,還包括:
[0170]倒排文檔生成子模塊101被配置為在葉子節(jié)點(diǎn)中,記錄到達(dá)葉子節(jié)點(diǎn)的各個(gè)局部特征的標(biāo)識(shí),生成倒排文檔;
[0171]其中,局部特征的標(biāo)識(shí)包括:局部特征所在視頻的標(biāo)號(hào)。
[0172]在一實(shí)施例中,待搜索局部特征歸類模塊,可包括:
[0173]待搜索局部特征歸類子模塊被配置為對(duì)于各個(gè)待搜索局部特征,將待搜索局部特征在所述聚類樹中遍歷,確定待搜索局部特征到達(dá)的葉子節(jié)點(diǎn);
[0174]其中,待搜索局部特征屬于葉子節(jié)點(diǎn)對(duì)應(yīng)的聚類。
[0175]在一實(shí)施例中,如圖11所示,匹配視頻確定模塊64,可包括:
[0176]標(biāo)識(shí)獲取子模塊111被配置為根據(jù)倒排文檔的葉子節(jié)點(diǎn)中記錄的局部特征的標(biāo)識(shí),獲得待搜索局部特征所屬聚類中局部特征的標(biāo)識(shí);
[0177]數(shù)量統(tǒng)計(jì)子模塊112被配置為根據(jù)局部特征的標(biāo)識(shí),統(tǒng)計(jì)視頻庫中視頻所包含的、與待搜索局部特征屬于同一聚類的局部特征的數(shù)量;
[0178]視頻確定子模塊113被配置為根據(jù)統(tǒng)計(jì)出的數(shù)量從視頻庫中確定出與待搜索視頻匹配的視頻。
[0179]本公開的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:通過將局部特征和待搜索局部特征進(jìn)行聚類,根據(jù)各個(gè)聚類中包含的局部特征和待搜索局部特征的情況,進(jìn)行視頻搜索,能夠避免以關(guān)鍵幀為對(duì)象重復(fù)搜索過程,降低了搜索運(yùn)算量,提高了搜索效率,降低了搜索時(shí)長;并且針對(duì)視頻中幀的圖片特征進(jìn)行搜索,避免僅根據(jù)視頻的標(biāo)題或簡(jiǎn)介中的文字進(jìn)行搜索,提高了搜索的準(zhǔn)確性。
[0180]關(guān)于上述實(shí)施例中的裝置,其中各個(gè)模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實(shí)施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說明。
[0181]圖12是根據(jù)一示例性實(shí)施例示出的一種用于視頻搜索的裝置1200的框圖,該裝置適用于終端設(shè)備。例如,裝置1200可以是移動(dòng)電話,計(jì)算機(jī),數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺(tái),平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個(gè)人數(shù)字助理等。
[0182]參照?qǐng)D12,裝置1200可以包括以下一個(gè)或多個(gè)組件:處理組件1202,存儲(chǔ)器1204,電源組件1206,多媒體組件1208,音頻組件1210,輸入/輸出(I/O)的接口 1212,傳感器組件1214,以及通信組件1216。
[0183]處理組件1202通??刂蒲b置1200的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理元件1202可以包括一個(gè)或多個(gè)處理器1220來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件1202可以包括一個(gè)或多個(gè)模塊,便于處理組件1202和其他組件之間的交互。例如,處理部件1202可以包括多媒體模塊,以方便多媒體組件1208和處理組件1202之間的交互。
[0184]存儲(chǔ)器1204被配置為存儲(chǔ)各種類型的數(shù)據(jù)以支持在設(shè)備1200的操作。這些數(shù)據(jù)的示例包括用于在裝置1200上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲(chǔ)器1204可以由任何類型的易失性或非易失性存儲(chǔ)設(shè)備或者它們的組合實(shí)現(xiàn),如靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM),電可擦除可編程只讀存儲(chǔ)器(EEPROM),可擦除可編程只讀存儲(chǔ)器(EPROM),可編程只讀存儲(chǔ)器(PROM),只讀存儲(chǔ)器(R0M),磁存儲(chǔ)器,快閃存儲(chǔ)器,磁盤或光盤。
[0185]電力組件1206為裝置1200的各種組件提供電力。電力組件1206可以包括電源管理系統(tǒng),一個(gè)或多個(gè)電源,及其他與為裝置1200生成、管理和分配電力相關(guān)聯(lián)的組件。
[0186]多媒體組件1208包括在所述裝置1200和用戶之間的提供一個(gè)輸出接口的屏幕。在一些實(shí)施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實(shí)現(xiàn)為觸摸屏,以接收來自用戶的輸入信號(hào)。觸摸面板包括一個(gè)或多個(gè)觸摸傳感器以感測(cè)觸摸、滑動(dòng)和觸摸面板上的手勢(shì)。所述觸摸傳感器可以不僅感測(cè)觸摸或滑動(dòng)動(dòng)作的邊界,而且還檢測(cè)與所述觸摸或滑動(dòng)操作相關(guān)的持續(xù)時(shí)間和壓力。在一些實(shí)施例中,多媒體組件1208包括一個(gè)前置攝像頭和/或后置攝像頭。當(dāng)設(shè)備1200處于操作模式,如拍攝模式或視頻模式時(shí),前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個(gè)前置攝像頭和后置攝像頭可以是一個(gè)固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。
[0187]音頻組件1210被配置為輸出和/或輸入音頻信號(hào)。例如,音頻組件1210包括一個(gè)麥克風(fēng)(MIC),當(dāng)裝置1200處于操作模式,如呼叫模式、記錄模式和語音識(shí)別模式時(shí),麥克風(fēng)被配置為接收外部音頻信號(hào)。所接收的音頻信號(hào)可以被進(jìn)一步存儲(chǔ)在存儲(chǔ)器1204或經(jīng)由通信組件1216發(fā)送。在一些實(shí)施例中,音頻組件1210還包括一個(gè)揚(yáng)聲器,用于輸出音頻信號(hào)。
[0188]I/O接口 1212為處理組件1202和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點(diǎn)擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動(dòng)按鈕和鎖定按鈕。
[0189]傳感器組件1214包括一個(gè)或多個(gè)傳感器,用于為裝置1200提供各個(gè)方面的狀態(tài)評(píng)估。例如,傳感器組件1214可以檢測(cè)到設(shè)備1200的打開/關(guān)閉狀態(tài),組件的相對(duì)定位,例如所述組件為裝置1200的顯示器和小鍵盤,傳感器組件1214還可以檢測(cè)裝置1200或裝置1200 —個(gè)組件的位置改變,用戶與裝置1200接觸的存在或不存在,裝置1200方位或加速/減速和裝置1200的溫度變化。傳感器組件1214可以包括接近傳感器,被配置用來在沒有任何的物理接觸時(shí)檢測(cè)附近物體的存在。傳感器組件1214還可以包括光傳感器,如CMOS或CXD圖像傳感器,用于在成像應(yīng)用中使用。在一些實(shí)施例中,該傳感器組件1214還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
[0190]通信組件1216被配置為便于裝置1200和其他設(shè)備之間有線或無線方式的通信。裝置1200可以接入基于通信標(biāo)準(zhǔn)的無線網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個(gè)示例性實(shí)施例中,通信部件1216經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號(hào)或廣播相關(guān)信息。在一個(gè)示例性實(shí)施例中,所述通信部件1216還包括近場(chǎng)通信(NFC)模塊,以促進(jìn)短程通信。例如,在NFC模塊可基于射頻識(shí)別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(huì)(IrDA)技術(shù),超寬帶(UWB)技術(shù),藍(lán)牙(BT)技術(shù)和其他技術(shù)來實(shí)現(xiàn)。
[0191]在示例性實(shí)施例中,裝置1200可以被一個(gè)或多個(gè)應(yīng)用專用集成電路(ASIC)、數(shù)字信號(hào)處理器(DSP)、數(shù)字信號(hào)處理設(shè)備(DSro)、可編程邏輯器件(PLD)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實(shí)現(xiàn),用于執(zhí)行上述方法。
[0192]在示例性實(shí)施例中,還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),例如包括指令的存儲(chǔ)器1204,上述指令可由裝置1200的處理器820執(zhí)行以完成上述方法。例如,所述非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是ROM、隨機(jī)存取存儲(chǔ)器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲(chǔ)設(shè)備等。
[0193]一種視頻搜索的裝置,包括:
[0194]處理器;
[0195]用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
[0196]其中,處理器被配置為:
[0197]將視頻庫中視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征,利用聚類算法將所述局部特征進(jìn)行聚類;
[0198]將待搜索視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征作為待搜索局部特征;
[0199]利用所述聚類算法確定所述待搜索局部特征所屬聚類;
[0200]根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻。
[0201]該處理器可被配置為:按視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量從高到低的順序,將所述視頻庫中視頻排序;
[0202]從所述視頻排序的前η個(gè)視頻中確定出與所述待搜索視頻匹配的視頻;
[0203]其中,η為預(yù)設(shè)正整數(shù)。
[0204]該處理器可被配置為:在所述視頻排序的前η個(gè)視頻中,將所包含的與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量大于第一預(yù)設(shè)閾值的視頻,確定為與所述待搜索視頻匹配的視頻。
[0205]該處理器可被配置為:當(dāng)待搜索視頻的關(guān)鍵幀為多個(gè)時(shí),根據(jù)與待搜索局部特征屬于同一聚類的局部特征,確定所述前η個(gè)視頻的各個(gè)視頻中與所述待搜索視頻的關(guān)鍵幀匹配的關(guān)鍵幀;
[0206]在所述前η個(gè)視頻中,將匹配的關(guān)鍵幀在視頻中時(shí)序與所述待搜索視頻中關(guān)鍵幀的時(shí)序一致的視頻,確定為與所述待搜索視頻匹配的視頻。
[0207]該處理器可被配置為:當(dāng)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量大于第二預(yù)設(shè)閾值時(shí),確定所述視頻與所述待搜索視頻匹配。
[0208]該處理器可被配置為:利用聚類算法生成聚類樹;將所述視頻庫中視頻的局部特征在所述聚類樹中遍歷,確定各個(gè)所述局部特征到達(dá)的葉子節(jié)點(diǎn);
[0209]其中,葉子節(jié)點(diǎn)與局部特征的聚類對(duì)應(yīng),到達(dá)葉子節(jié)點(diǎn)的局部特征屬于所述葉子節(jié)點(diǎn)對(duì)應(yīng)的聚類。
[0210]該處理器可被配置為:在所述葉子節(jié)點(diǎn)中,記錄到達(dá)所述葉子節(jié)點(diǎn)的各個(gè)局部特征的標(biāo)識(shí),生成倒排文檔;
[0211]其中,所述局部特征的標(biāo)識(shí)包括:所述局部特征所在視頻的標(biāo)號(hào)。
[0212]該處理器可被配置為:對(duì)于各個(gè)待搜索局部特征,將所述待搜索局部特征在所述聚類樹中遍歷,確定所述待搜索局部特征到達(dá)的葉子節(jié)點(diǎn);
[0213]其中,所述待搜索局部特征屬于所述葉子節(jié)點(diǎn)對(duì)應(yīng)的聚類。
[0214]該處理器可被配置為:根據(jù)倒排文檔的葉子節(jié)點(diǎn)中記錄的局部特征的標(biāo)識(shí),獲得所述待搜索局部特征所屬聚類中局部特征的標(biāo)識(shí);
[0215]根據(jù)局部特征的標(biāo)識(shí),統(tǒng)計(jì)視頻庫中視頻所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量;
[0216]根據(jù)統(tǒng)計(jì)出的數(shù)量從視頻庫中確定出與所述待搜索視頻匹配的視頻。
[0217]一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)所述存儲(chǔ)介質(zhì)中的指令由移動(dòng)終端的處理器執(zhí)行時(shí),使得移動(dòng)終端能夠執(zhí)行一種視頻搜索的方法,所述方法包括:
[0218]將視頻庫中視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征,利用聚類算法將所述局部特征進(jìn)行聚類;
[0219]將待搜索視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征作為待搜索局部特征;
[0220]利用所述聚類算法確定所述待搜索局部特征所屬聚類;
[0221]根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻。
[0222]所述根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻,可包括:
[0223]按視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量從高到低的順序,將所述視頻庫中視頻排序;
[0224]從所述視頻排序的前η個(gè)視頻中確定出與所述待搜索視頻匹配的視頻;
[0225]其中,η為預(yù)設(shè)正整數(shù)。
[0226]所述從所述視頻排序的前η個(gè)視頻中確定出與所述待搜索視頻匹配的視頻,可包括:
[0227]在所述視頻排序的前η個(gè)視頻中,將所包含的與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量大于第一預(yù)設(shè)閾值的視頻,確定為與所述待搜索視頻匹配的視頻。
[0228]所述從所述視頻排序的前η個(gè)視頻中確定出與所述待搜索視頻匹配的視頻,可包括:
[0229]當(dāng)待搜索視頻的關(guān)鍵幀為多個(gè)時(shí),根據(jù)與待搜索局部特征屬于同一聚類的局部特征,確定所述如η個(gè)視頻的各個(gè)視頻中與所述待搜索視頻的關(guān)鍵巾貞匹配的關(guān)鍵巾貞;
[0230]在所述前η個(gè)視頻中,將匹配的關(guān)鍵幀在視頻中時(shí)序與所述待搜索視頻中關(guān)鍵幀的時(shí)序一致的視頻,確定為與所述待搜索視頻匹配的視頻。
[0231]所述根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻,可包括:
[0232]當(dāng)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量大于第二預(yù)設(shè)閾值時(shí),確定所述視頻與所述待搜索視頻匹配。
[0233]所述利用聚類算法將所述局部特征進(jìn)行聚類,可包括:
[0234]利用聚類算法生成聚類樹;
[0235]將所述視頻庫中視頻的局部特征在所述聚類樹中遍歷,確定各個(gè)所述局部特征到達(dá)的葉子節(jié)點(diǎn);
[0236]其中,葉子節(jié)點(diǎn)與局部特征的聚類對(duì)應(yīng),到達(dá)葉子節(jié)點(diǎn)的局部特征屬于所述葉子節(jié)點(diǎn)對(duì)應(yīng)的聚類。
[0237]所述將所述視頻庫中視頻的局部特征在所述聚類樹中遍歷,確定各個(gè)所述局部特征到達(dá)的葉子節(jié)點(diǎn)后,還可包括:
[0238]在所述葉子節(jié)點(diǎn)中,記錄到達(dá)所述葉子節(jié)點(diǎn)的各個(gè)局部特征的標(biāo)識(shí),生成倒排文檔;
[0239]其中,所述局部特征的標(biāo)識(shí)包括:所述局部特征所在視頻的標(biāo)號(hào)。
[0240]所述利用所述聚類算法確定所述待搜索局部特征所屬聚類,可包括:
[0241]對(duì)于各個(gè)待搜索局部特征,將所述待搜索局部特征在所述聚類樹中遍歷,確定所述待搜索局部特征到達(dá)的葉子節(jié)點(diǎn);
[0242]其中,所述待搜索局部特征屬于所述葉子節(jié)點(diǎn)對(duì)應(yīng)的聚類。
[0243]所述根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻,可包括:
[0244]根據(jù)倒排文檔的葉子節(jié)點(diǎn)中記錄的局部特征的標(biāo)識(shí),獲得所述待搜索局部特征所屬聚類中局部特征的標(biāo)識(shí);
[0245]根據(jù)局部特征的標(biāo)識(shí),統(tǒng)計(jì)視頻庫中視頻所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量;
[0246]根據(jù)統(tǒng)計(jì)出的數(shù)量從視頻庫中確定出與所述待搜索視頻匹配的視頻。
[0247]本領(lǐng)域技術(shù)人員在考慮說明書及實(shí)踐這里公開的公開后,將容易想到本公開的其它實(shí)施方案。本申請(qǐng)旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本【技術(shù)領(lǐng)域】中的公知常識(shí)或慣用技術(shù)手段。說明書和實(shí)施例僅被視為示例性的,本公開的真正范圍和精神由下面的權(quán)利要求指出。
[0248]應(yīng)當(dāng)理解的是,本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求來限制。
【權(quán)利要求】
1.一種視頻搜索的方法,其特征在于,包括: 將視頻庫中視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征,利用聚類算法將所述局部特征進(jìn)行聚類; 將待搜索視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征作為待搜索局部特征; 利用所述聚類算法確定所述待搜索局部特征所屬聚類; 根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻。
2.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻,包括: 按視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量從高到低的順序,將所述視頻庫中視頻排序; 從所述視頻排序的前η個(gè)視頻中確定出與所述待搜索視頻匹配的視頻; 其中,η為預(yù)設(shè)正整數(shù)。
3.如權(quán)利要求2所述的方法,其特征在于,所述從所述視頻排序的前η個(gè)視頻中確定出與所述待搜索視頻匹配的視頻,包括: 在所述視頻排序的前η個(gè)視頻中,將所包含的與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量大于第一預(yù)設(shè)閾值的視頻,確定為與所述待搜索視頻匹配的視頻。
4.如權(quán)利要求2所述的方法,其特征在于,所述從所述視頻排序的前η個(gè)視頻中確定出與所述待搜索視頻匹配的視頻,包括: 當(dāng)待搜索視頻的關(guān)鍵幀為多個(gè)時(shí),根據(jù)與待搜索局部特征屬于同一聚類的局部特征,確定所述如η個(gè)視頻的各個(gè)視頻中與所述待搜索視頻的關(guān)鍵巾貞匹配的關(guān)鍵巾貞; 在所述前η個(gè)視頻中,將匹配的關(guān)鍵幀在視頻中時(shí)序與所述待搜索視頻中關(guān)鍵幀的時(shí)序一致的視頻,確定為與所述待搜索視頻匹配的視頻。
5.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻,包括: 當(dāng)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量大于第二預(yù)設(shè)閾值時(shí),確定所述視頻與所述待搜索視頻匹配。
6.如權(quán)利要求1所述的方法,其特征在于,所述利用聚類算法將所述局部特征進(jìn)行聚類,包括: 利用聚類算法生成聚類樹; 將所述視頻庫中視頻的局部特征在所述聚類樹中遍歷,確定各個(gè)所述局部特征到達(dá)的葉子節(jié)點(diǎn); 其中,葉子節(jié)點(diǎn)與局部特征的聚類對(duì)應(yīng),到達(dá)葉子節(jié)點(diǎn)的局部特征屬于所述葉子節(jié)點(diǎn)對(duì)應(yīng)的聚類。
7.如權(quán)利要求6所述的方法,其特征在于,所述將所述視頻庫中視頻的局部特征在所述聚類樹中遍歷,確定各個(gè)所述局部特征到達(dá)的葉子節(jié)點(diǎn)后,還包括: 在所述葉子節(jié)點(diǎn)中,記錄到達(dá)所述葉子節(jié)點(diǎn)的各個(gè)局部特征的標(biāo)識(shí),生成倒排文檔; 其中,所述局部特征的標(biāo)識(shí)包括:所述局部特征所在視頻的標(biāo)號(hào)。
8.如權(quán)利要求6或7所述的方法,其特征在于,所述利用所述聚類算法確定所述待搜索局部特征所屬聚類,包括: 對(duì)于各個(gè)待搜索局部特征,將所述待搜索局部特征在所述聚類樹中遍歷,確定所述待搜索局部特征到達(dá)的葉子節(jié)點(diǎn); 其中,所述待搜索局部特征屬于所述葉子節(jié)點(diǎn)對(duì)應(yīng)的聚類。
9.如權(quán)利要求7所述的方法,其特征在于,所述根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻,包括: 根據(jù)倒排文檔的葉子節(jié)點(diǎn)中記錄的局部特征的標(biāo)識(shí),獲得所述待搜索局部特征所屬聚類中局部特征的標(biāo)識(shí); 根據(jù)局部特征的標(biāo)識(shí),統(tǒng)計(jì)視頻庫中視頻所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量; 根據(jù)統(tǒng)計(jì)出的數(shù)量從視頻庫中確定出與所述待搜索視頻匹配的視頻。
10.一種視頻搜索的裝置,其特征在于,包括: 局部特征聚類模塊,用于將視頻庫中視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征,利用聚類算法將所述局部特征進(jìn)行聚類; 待搜索局部特征提取模塊,用于將待搜索視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征作為待搜索局部特征; 待搜索局部特征歸類模塊,用于利用所述聚類算法確定所述待搜索局部特征所屬聚類; 匹配視頻確定模塊,用于根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻。
11.如權(quán)利要求10所述的裝置,其特征在于,所述匹配視頻確定模塊,包括: 視頻排序子模塊,用于按視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量從高到低的順序,將所述視頻庫中視頻排序; 第一匹配視頻確定子模塊,用于從所述視頻排序的前η個(gè)視頻中確定出與所述待搜索視頻匹配的視頻; 其中,η為預(yù)設(shè)正整數(shù)。
12.如權(quán)利要求11所述的裝置,其特征在于,所述第一匹配視頻確定子模塊,包括: 第一匹配視頻確定單元,用于在所述視頻排序的前η個(gè)視頻中,將所包含的與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量大于第一預(yù)設(shè)閾值的視頻,確定為與所述待搜索視頻匹配的視頻。
13.如權(quán)利要求11所述的裝置,其特征在于,所述第一匹配視頻確定子模塊,包括: 匹配關(guān)鍵幀確定單元,用于當(dāng)待搜索視頻的關(guān)鍵幀為多個(gè)時(shí),根據(jù)與待搜索局部特征屬于同一聚類的局部特征,確定所述前η個(gè)視頻的各個(gè)視頻中與所述待搜索視頻的關(guān)鍵幀匹配的關(guān)鍵幀; 第二匹配視頻確定單元,用于在所述前η個(gè)視頻中,將匹配的關(guān)鍵幀在視頻中時(shí)序與所述待搜索視頻中關(guān)鍵幀的時(shí)序一致的視頻,確定為與所述待搜索視頻匹配的視頻。
14.如權(quán)利要求10所述的裝置,其特征在于,所述第一匹配視頻確定子模塊,包括: 第二匹配視頻確定子模塊,用于當(dāng)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量大于第二預(yù)設(shè)閾值時(shí),確定所述視頻與所述待搜索視頻匹配。
15.如權(quán)利要求10所述的裝置,其特征在于,所述局部特征聚類模塊,包括: 聚類樹生成子模塊,用于利用聚類算法生成聚類樹; 聚類樹遍歷子模塊,用于將所述視頻庫中視頻的局部特征在所述聚類樹中遍歷,確定各個(gè)所述局部特征到達(dá)的葉子節(jié)點(diǎn); 其中,葉子節(jié)點(diǎn)與局部特征的聚類對(duì)應(yīng),到達(dá)葉子節(jié)點(diǎn)的局部特征屬于所述葉子節(jié)點(diǎn)對(duì)應(yīng)的聚類。
16.如權(quán)利要求15所述的裝置,其特征在于,所述局部特征聚類模塊,還包括: 倒排文檔生成子模塊,用于在所述葉子節(jié)點(diǎn)中,記錄到達(dá)所述葉子節(jié)點(diǎn)的各個(gè)局部特征的標(biāo)識(shí),生成倒排文檔; 其中,所述局部特征的標(biāo)識(shí)包括:所述局部特征所在視頻的標(biāo)號(hào)。
17.如權(quán)利要求15或16所述的裝置,其特征在于,所述待搜索局部特征歸類模塊,包括: 待搜索局部特征歸類子模塊,用于對(duì)于各個(gè)待搜索局部特征,將所述待搜索局部特征在所述聚類樹中遍歷,確定所述待搜索局部特征到達(dá)的葉子節(jié)點(diǎn); 其中,所述待搜索局部特征屬于所述葉子節(jié)點(diǎn)對(duì)應(yīng)的聚類。
18.如權(quán)利要求16所述的裝置,其特征在于,所述匹配視頻確定模塊,包括: 標(biāo)識(shí)獲取子模塊,用于根據(jù)倒排文檔的葉子節(jié)點(diǎn)中記錄的局部特征的標(biāo)識(shí),獲得所述待搜索局部特征所屬聚類中局部特征的標(biāo)識(shí); 數(shù)量統(tǒng)計(jì)子模塊,用于根據(jù)局部特征的標(biāo)識(shí),統(tǒng)計(jì)視頻庫中視頻所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量; 視頻確定子模塊,用于根據(jù)統(tǒng)計(jì)出的數(shù)量從視頻庫中確定出與所述待搜索視頻匹配的視頻。
19.一種視頻搜索的裝置,其特征在于,包括: 處理器; 用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器; 其中,所述處理器被配置為: 將視頻庫中視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征,利用聚類算法將所述局部特征進(jìn)行聚類;將待搜索視頻提取關(guān)鍵幀,提取關(guān)鍵幀中局部特征作為待搜索局部特征; 利用所述聚類算法確定所述待搜索局部特征所屬聚類; 根據(jù)視頻中所包含的、與所述待搜索局部特征屬于同一聚類的局部特征的數(shù)量,從所述視頻庫中確定出與所述待搜索視頻匹配的視頻。
【文檔編號(hào)】G06F17/30GK104239566SQ201410510539
【公開日】2014年12月24日 申請(qǐng)日期:2014年9月28日 優(yōu)先權(quán)日:2014年9月28日
【發(fā)明者】張濤, 陳志軍, 王琳 申請(qǐng)人:小米科技有限責(zé)任公司