本發(fā)明涉及多媒體處理的
技術(shù)領(lǐng)域:
,特別是涉及一種視頻特征信息的展示方法和一種視頻特征信息的展示裝置。
背景技術(shù):
:隨著互聯(lián)網(wǎng)的高速發(fā)展,網(wǎng)上的信息量急劇增加,其中包含了大量的視頻數(shù)據(jù),例如,新聞視頻、綜藝類節(jié)目、電視劇、電影等等。用戶對(duì)于視頻數(shù)據(jù)的了解,大多源于對(duì)整個(gè)視頻數(shù)據(jù)的簡介,基于視頻數(shù)據(jù)的簡介,用戶會(huì)選擇觀看或不觀看。但是,視頻數(shù)據(jù)的時(shí)間一般比較長,如電視劇一集長達(dá)40分鐘,一部電視劇多達(dá)數(shù)十集,而電影一部長達(dá)2個(gè)多小時(shí)。這些時(shí)長很長的視頻數(shù)據(jù)中包含的信息量比較大,但是,不一定所有的視頻數(shù)據(jù)都是用戶感興趣的,用戶若需要從中篩選出感興趣的部分,需要瀏覽整個(gè)視頻數(shù)據(jù),消耗大量的時(shí)間、浪費(fèi)許多帶寬資源,效率很低。技術(shù)實(shí)現(xiàn)要素:鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的一種視頻特征信息的展示方法和相應(yīng)的一種視頻特征信息的展示裝置。依據(jù)本發(fā)明的一個(gè)方面,提供了一種視頻特征信息的展示方法,包括:獲取視頻數(shù)據(jù)的一個(gè)或多個(gè)彈幕文本;對(duì)所述一個(gè)或多個(gè)彈幕文本進(jìn)行聚類,獲得一個(gè)或多個(gè)彈幕分類;根據(jù)所述一個(gè)或多個(gè)彈幕分類從所述視頻數(shù)據(jù)中識(shí)別一個(gè)或多個(gè)關(guān)鍵視頻片段;提取所述關(guān)鍵視頻片段對(duì)應(yīng)的視頻特征信息;將所述視頻特征信息推送至客戶端進(jìn)行展示??蛇x地,所述對(duì)所述一個(gè)或多個(gè)彈幕文本進(jìn)行聚類,獲得一個(gè)或多個(gè)彈幕分類的步驟包括:從所述一個(gè)或多個(gè)彈幕文本中提取彈幕中心文本;對(duì)所述彈幕中心文本配置彈幕分類;計(jì)算所述一個(gè)或多個(gè)彈幕文本與所述彈幕中心文本的一個(gè)或多個(gè)相似度;當(dāng)所述相似度高于預(yù)設(shè)的相似度閾值時(shí),將所述彈幕文本劃入所述彈幕中心文本所屬的彈幕分類中。可選地,所述從所述一個(gè)或多個(gè)彈幕文本中提取彈幕中心文本的步驟包括:對(duì)所述一個(gè)或多個(gè)彈幕文本進(jìn)行分詞處理,獲取一個(gè)或多個(gè)文本分詞;統(tǒng)計(jì)所述一個(gè)或多個(gè)文本分詞的詞頻;查詢所述一個(gè)或多個(gè)文本分詞的文本權(quán)重;結(jié)合所述詞頻和所述文本權(quán)重,計(jì)算所述文本分詞的彈幕權(quán)重;當(dāng)所述彈幕權(quán)重高于預(yù)設(shè)的權(quán)重閾值時(shí),確定所述文本分詞為彈幕中心文本??蛇x地,所述根據(jù)所述一個(gè)或多個(gè)彈幕分類從所述視頻數(shù)據(jù)中識(shí)別一個(gè)或多個(gè)關(guān)鍵視頻片段的步驟包括:對(duì)所述視頻數(shù)據(jù)劃分為一個(gè)或多個(gè)視頻片段;在所述一個(gè)或多個(gè)視頻片段中,統(tǒng)計(jì)所述一個(gè)或多個(gè)彈幕分類中彈幕文本的數(shù)量;按照所述數(shù)量從所述一個(gè)或多個(gè)視頻片段中選取關(guān)鍵視頻片段??蛇x地,所述按照所述數(shù)量從所述一個(gè)或多個(gè)視頻片段中選取關(guān)鍵視頻片段的步驟包括:查詢所述視頻數(shù)據(jù)的視頻類型;查詢所述視頻類型對(duì)應(yīng)的系數(shù);當(dāng)所述數(shù)量超過預(yù)設(shè)的數(shù)量閾值與所述系數(shù)的乘積時(shí),確定所述彈幕分類所屬的視頻片段為關(guān)鍵視頻片段??蛇x地,所述根據(jù)所述一個(gè)或多個(gè)彈幕分類從所述視頻數(shù)據(jù)中識(shí)別一個(gè)或多個(gè)關(guān)鍵視頻片段的步驟還包括:當(dāng)關(guān)鍵視頻片段相鄰時(shí),合并相鄰的關(guān)鍵視頻片段。可選地,所述提取所述關(guān)鍵視頻片段對(duì)應(yīng)的視頻特征信息的步驟包括:提取所述關(guān)鍵視頻片段對(duì)應(yīng)的時(shí)間區(qū)間,作為視頻特征信息??蛇x地,所述提取所述關(guān)鍵視頻片段對(duì)應(yīng)的視頻特征信息的步驟包括:將所述彈幕中心文本設(shè)置為視頻特征信息??蛇x地,所述提取所述關(guān)鍵視頻片段對(duì)應(yīng)的視頻特征信息的步驟包括:查找所述關(guān)鍵視頻片段對(duì)應(yīng)的字幕數(shù)據(jù);采用所述字幕數(shù)據(jù)生成文本摘要信息,作為視頻特征信息??蛇x地,所述提取所述關(guān)鍵視頻片段對(duì)應(yīng)的視頻特征信息的步驟包括:采用所述關(guān)鍵視頻片段中的視頻數(shù)據(jù)生成視頻摘要信息,作為視頻特征信息。根據(jù)本發(fā)明的另一方面,提供了一種視頻特征信息的展示裝置,包括:彈幕文本獲取模塊,適于獲取視頻數(shù)據(jù)的一個(gè)或多個(gè)彈幕文本;彈幕文本聚類模塊,適于對(duì)所述一個(gè)或多個(gè)彈幕文本進(jìn)行聚類,獲得一個(gè)或多個(gè)彈幕分類;關(guān)鍵視頻片段識(shí)別模塊,適于根據(jù)所述一個(gè)或多個(gè)彈幕分類從所述視頻數(shù)據(jù)中識(shí)別一個(gè)或多個(gè)關(guān)鍵視頻片段;視頻特征信息提取模塊,適于提取所述關(guān)鍵視頻片段對(duì)應(yīng)的視頻特征信息;視頻特征信息推送模塊,適于將所述視頻特征信息推送至客戶端進(jìn)行展示??蛇x地,所述彈幕文本聚類模塊還適于:從所述一個(gè)或多個(gè)彈幕文本中提取彈幕中心文本;對(duì)所述彈幕中心文本配置彈幕分類;計(jì)算所述一個(gè)或多個(gè)彈幕文本與所述彈幕中心文本的一個(gè)或多個(gè)相似度;當(dāng)所述相似度高于預(yù)設(shè)的相似度閾值時(shí),將所述彈幕文本劃入所述彈幕中心文本所屬的彈幕分類中。可選地,所述彈幕文本聚類模塊還適于:對(duì)所述一個(gè)或多個(gè)彈幕文本進(jìn)行分詞處理,獲取一個(gè)或多個(gè)文本分詞;統(tǒng)計(jì)所述一個(gè)或多個(gè)文本分詞的詞頻;查詢所述一個(gè)或多個(gè)文本分詞的文本權(quán)重;結(jié)合所述詞頻和所述文本權(quán)重,計(jì)算所述文本分詞的彈幕權(quán)重;當(dāng)所述彈幕權(quán)重高于預(yù)設(shè)的權(quán)重閾值時(shí),確定所述文本分詞為彈幕中心文本??蛇x地,所述關(guān)鍵視頻片段識(shí)別模塊還適于:對(duì)所述視頻數(shù)據(jù)劃分為一個(gè)或多個(gè)視頻片段;在所述一個(gè)或多個(gè)視頻片段中,統(tǒng)計(jì)所述一個(gè)或多個(gè)彈幕分類中彈幕文本的數(shù)量;按照所述數(shù)量從所述一個(gè)或多個(gè)視頻片段中選取關(guān)鍵視頻片段??蛇x地,所述關(guān)鍵視頻片段識(shí)別模塊還適于:查詢所述視頻數(shù)據(jù)的視頻類型;查詢所述視頻類型對(duì)應(yīng)的系數(shù);當(dāng)所述數(shù)量超過預(yù)設(shè)的數(shù)量閾值與所述系數(shù)的乘積時(shí),確定所述彈幕分類所屬的視頻片段為關(guān)鍵視頻片段??蛇x地,所述關(guān)鍵視頻片段識(shí)別模塊還適于:當(dāng)關(guān)鍵視頻片段相鄰時(shí),合并相鄰的關(guān)鍵視頻片段??蛇x地,所述視頻特征信息提取模塊還適于:提取所述關(guān)鍵視頻片段對(duì)應(yīng)的時(shí)間區(qū)間,作為視頻特征信息??蛇x地,所述視頻特征信息提取模塊還適于:將所述彈幕中心文本設(shè)置為視頻特征信息??蛇x地,所述視頻特征信息提取模塊還適于:查找所述關(guān)鍵視頻片段對(duì)應(yīng)的字幕數(shù)據(jù);采用所述字幕數(shù)據(jù)生成文本摘要信息,作為視頻特征信息??蛇x地,所述視頻特征信息提取模塊還適于:采用所述關(guān)鍵視頻片段中的視頻數(shù)據(jù)生成視頻摘要信息,作為視頻特征信息。本發(fā)明實(shí)施例對(duì)視頻數(shù)據(jù)的彈幕文本進(jìn)行聚類,基于彈幕分類識(shí)別關(guān)鍵視頻片段,并將該關(guān)鍵視頻片段的視頻特征信息推送至客戶端進(jìn)行展示,實(shí)現(xiàn)了視頻主題的挖掘,避免了用戶再次通過觀看整個(gè)視頻數(shù)據(jù)篩選出感興趣的部分,大大減少了耗時(shí),減少了帶寬資源的浪費(fèi),提高了效率。上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式。附圖說明通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種視頻特征信息的展示方法實(shí)施例的步驟流程圖;以及圖2示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種視頻特征信息的展示裝置實(shí)施例的結(jié)構(gòu)框圖。具體實(shí)施方式下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。參照?qǐng)D1,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種視頻特征信息的展示方法實(shí)施例的步驟流程圖,具體可以包括如下步驟:步驟101,獲取視頻數(shù)據(jù)的一個(gè)或多個(gè)彈幕文本;彈幕(barrage)文本,是指以字幕形式在播放的視頻數(shù)據(jù)之上顯示的評(píng)論信息。在本發(fā)明實(shí)施例中,可以通過在線視頻網(wǎng)站等方式收集的彈幕文本,以挖掘出有價(jià)值的視頻片段。步驟102,對(duì)所述一個(gè)或多個(gè)彈幕文本進(jìn)行聚類,獲得一個(gè)或多個(gè)彈幕分類;彈幕文本,可以給觀眾一種“實(shí)時(shí)互動(dòng)”的錯(cuò)覺,雖然不同彈幕的發(fā)送時(shí)間有所區(qū)別,但是其一般會(huì)集中在視頻數(shù)據(jù)中某一個(gè)時(shí)間點(diǎn)出現(xiàn),因此,在某段視頻數(shù)據(jù)中發(fā)送的彈幕基本上也可能具有相同的主題,通過聚類,可以挖掘出該主題。在本發(fā)明的一種可選實(shí)施例中,步驟102可以包括如下子步驟:子步驟s11,從所述一個(gè)或多個(gè)彈幕文本中提取彈幕中心文本;在本發(fā)明實(shí)施例中,可以從眾多的彈幕文本中挖掘出重要的文本,作為彈幕中心文本。在本發(fā)明實(shí)施例的一種可選示例中,子步驟s11進(jìn)一步可以包括如下子步驟:子步驟s111,對(duì)所述一個(gè)或多個(gè)彈幕文本進(jìn)行分詞處理,獲取一個(gè)或多個(gè)文本分詞;本發(fā)明實(shí)施例中,可以如下的一種或多種方式進(jìn)行分詞處理:1、基于字符串匹配的分詞:是指按照一定的策略將待分析的漢字串與一個(gè)預(yù)置的機(jī)器詞典中的詞條進(jìn)行匹配,若在詞典中找到某個(gè)字符串,則匹配成功(識(shí)別出一個(gè)詞)。2、基于特征掃描或標(biāo)志切分的分詞:是指優(yōu)先在待分析字符串中識(shí)別和切分出一些帶有明顯特征的詞,以這些詞作為斷點(diǎn),可將原字符串分為較小的串再來進(jìn)機(jī)械分詞,從而減少匹配的錯(cuò)誤率;或者將分詞和詞類標(biāo)注結(jié)合起來,利用豐富的詞類信息對(duì)分詞決策提供幫助,并且在標(biāo)注過程中又反過來對(duì)分詞結(jié)果進(jìn)行檢驗(yàn)、調(diào)整,從而提高切分的準(zhǔn)確率。3、基于理解的分詞:是指通過讓計(jì)算機(jī)模擬人對(duì)句子的理解,達(dá)到識(shí)別詞的效果。其基本思想就是在分詞的同時(shí)進(jìn)行句法、語義分析,利用句法信息和語義信息來處理歧義現(xiàn)象。它通常包括三個(gè)部分:分詞子系統(tǒng)、句法語義子系統(tǒng)、總控部分。在總控部分的協(xié)調(diào)下,分詞子系統(tǒng)可以獲得有關(guān)詞、句子等的句法和語義信息來對(duì)分詞歧義進(jìn)行判斷,即它模擬了人對(duì)句子的理解過程。4、基于統(tǒng)計(jì)的分詞方法:是指,中文信息中由于字與字相鄰共現(xiàn)的頻率或概率能夠較好的反映成詞的可信度,所以可以對(duì)語料中相鄰共現(xiàn)的各個(gè)字的組合的頻度進(jìn)行統(tǒng)計(jì),計(jì)算它們的互現(xiàn)信息,以及計(jì)算兩個(gè)漢字x、y的相鄰共現(xiàn)概率。互現(xiàn)信息可以體現(xiàn)漢字之間結(jié)合關(guān)系的緊密程度。當(dāng)緊密程度高于某一個(gè)閾值時(shí),便可認(rèn)為此字組可能構(gòu)成了一個(gè)詞。當(dāng)然,上述分詞處理方式只是作為示例,在實(shí)施本發(fā)明實(shí)施例時(shí),可以根據(jù)實(shí)際情況設(shè)置其他分詞處理方式,本發(fā)明實(shí)施例對(duì)此不加以限制。另外,除了上述分詞處理方式外,本領(lǐng)域技術(shù)人員還可以根據(jù)實(shí)際需要采用其它分詞處理方式,本發(fā)明實(shí)施例對(duì)此也不加以限制。子步驟s112,統(tǒng)計(jì)所述一個(gè)或多個(gè)文本分詞的詞頻;若分詞完成,則可以統(tǒng)計(jì)各文本分詞的詞頻。子步驟s113,查詢所述一個(gè)或多個(gè)文本分詞的文本權(quán)重;在本發(fā)明實(shí)施例中,可以按照基于搜索熱度、時(shí)事新聞等因素,預(yù)先對(duì)不同的詞配置文本權(quán)重,是一種動(dòng)態(tài)的權(quán)重配置方式。若文本分詞匹配上該詞,則可以對(duì)該文本分詞配置該文本權(quán)重。子步驟s114,結(jié)合所述詞頻和所述文本權(quán)重,計(jì)算所述文本分詞的彈幕權(quán)重;子步驟s115,當(dāng)所述彈幕權(quán)重高于預(yù)設(shè)的權(quán)重閾值時(shí),確定所述文本分詞為彈幕中心文本。在本發(fā)明實(shí)施例中,可以通過講詞頻與文本權(quán)重相乘,獲得最終的彈幕權(quán)重。若該彈幕權(quán)重高于一權(quán)重閾值,則表示該彈幕權(quán)重高較高,可以將該文本分詞設(shè)置為彈幕中心文本。子步驟s12,對(duì)所述彈幕中心文本配置彈幕分類;在本發(fā)明實(shí)施例中,該彈幕中心文本可以作為一個(gè)彈幕分類的中心,劃分彈幕分類。需要說明的是,若彈幕中心文本屬于相似的文本,表征同一個(gè)主題,則該彈幕文本劃入同一個(gè)彈幕分類中。子步驟s13,計(jì)算所述一個(gè)或多個(gè)彈幕文本與所述彈幕中心文本的一個(gè)或多個(gè)相似度;子步驟s14,當(dāng)所述相似度高于預(yù)設(shè)的相似度閾值時(shí),將所述彈幕文本劃入所述彈幕中心文本所屬的彈幕分類中。在本發(fā)明實(shí)施例中,可以通過word2vec(wordtovector)計(jì)算彈幕文本與彈幕中心文本的相似度、word2vec,顧名思義,這是一個(gè)將單詞轉(zhuǎn)換成向量形式的工具。通過轉(zhuǎn)換,可以把對(duì)文本內(nèi)容的處理簡化為向量空間中的向量運(yùn)算,計(jì)算出向量空間上的相似度,來表示文本語義上的相似度。word2vec為計(jì)算向量詞提供了一種有效的連續(xù)詞袋(bag-of-words)和skip-gram架構(gòu)實(shí)現(xiàn),word2vec遵循apachelicense2.0開源協(xié)議。word2vec主要是將文本語料庫轉(zhuǎn)換成詞向量,它會(huì)先從訓(xùn)練文本數(shù)據(jù)中構(gòu)建一個(gè)詞匯,然后獲取向量表示詞,由此產(chǎn)生的詞向量可以作為某項(xiàng)功能用在許多自然語言處理和機(jī)器學(xué)習(xí)應(yīng)用中。在舉例子之前,引入余弦距離(cosinedistance)這個(gè)概念:通過測量兩個(gè)向量內(nèi)積空間的夾角的余弦值來度量它們之間的相似性。0度角的余弦值是1,而其他任何角度的余弦值都不大于1;并且其最小值是-1。從而兩個(gè)向量之間的角度的余弦值確定兩個(gè)向量是否大致指向相同的方向。兩個(gè)向量有相同的指向時(shí),余弦相似度的值為1;兩個(gè)向量夾角為90°時(shí),余弦相似度的值為0;兩個(gè)向量指向完全相反的方向時(shí),余弦相似度的值為-1。在比較過程中,向量的規(guī)模大小不予考慮,僅僅考慮到向量的指向方向。余弦相似度通常用于兩個(gè)向量的夾角小于90°之內(nèi),因此余弦相似度的值為0到1之間。然后可以通過distance工具根據(jù)轉(zhuǎn)換后的向量計(jì)算出余弦距離,來表示向量(詞語)的相似度。例如,輸入“france”,distance工具會(huì)計(jì)算并顯示與“france”距離最相近的詞,如下:wordcosinedistancespain0.678515belgium0.665923netherlands0.652428italy0.633130switzerland0.622323luxembourg0.610033portugal0.577154russia0.571507germany0.563291catalonia0.534176當(dāng)然,詞向量也可以從巨大的數(shù)據(jù)集中導(dǎo)出詞類,通過執(zhí)行詞向量頂部的k-means聚類即可實(shí)現(xiàn)詞聚類(wordclustering)。步驟103,根據(jù)所述一個(gè)或多個(gè)彈幕分類從所述視頻數(shù)據(jù)中識(shí)別一個(gè)或多個(gè)關(guān)鍵視頻片段;在具體實(shí)現(xiàn)中,可以基于聚類后的彈幕文本,挖掘出用戶行為偏向,從而從視頻數(shù)據(jù)識(shí)別具有某個(gè)受歡迎主題的關(guān)鍵視頻片段。在本發(fā)明的一種可選實(shí)施例中,步驟103可以包括如下子步驟:子步驟s21,對(duì)所述視頻數(shù)據(jù)劃分為一個(gè)或多個(gè)視頻片段;在具體實(shí)現(xiàn)中,為了減少計(jì)算量,可以每間隔一定的時(shí)間,如3分鐘,就可以切分一個(gè)視頻片段。當(dāng)然,為了提高切分的精確度,也可以按照基于時(shí)空聯(lián)合的視頻對(duì)象分割算法、基于運(yùn)動(dòng)一致性的視頻分割算法、基于幀間差分的分割算法、基于貝葉斯與mrf的分割算法等方式,將視頻數(shù)據(jù)按照?qǐng)鼍扒蟹殖梢粋€(gè)或多個(gè)視頻片段。子步驟s22,在所述一個(gè)或多個(gè)視頻片段中,統(tǒng)計(jì)所述一個(gè)或多個(gè)彈幕分類中彈幕文本的數(shù)量;在本發(fā)明實(shí)施例中,彈幕文本具有時(shí)間信息,因此,可以統(tǒng)計(jì)在一個(gè)視頻片段中,屬于同一個(gè)類別的彈幕文本的數(shù)量,挖掘主題的集中程度。子步驟s23,按照所述數(shù)量從所述一個(gè)或多個(gè)視頻片段中選取關(guān)鍵視頻片段。由于不同視頻類型的視頻數(shù)據(jù)的受眾群體不同,例如,抗戰(zhàn)劇的受眾群體多為中老年人,動(dòng)漫視頻的受眾群體多為年輕的學(xué)生,軍事節(jié)目的受眾群體多為中年男性,等等。不同的受眾群體具有不同的行為習(xí)慣,其對(duì)彈幕文本的習(xí)慣也有所不同,因此,可以針對(duì)視頻數(shù)據(jù)的視頻類型設(shè)置一系數(shù),以動(dòng)態(tài)調(diào)整閾值。在具體實(shí)現(xiàn)中,可以查詢視頻數(shù)據(jù)的視頻類型,查詢視頻類型對(duì)應(yīng)的系數(shù),當(dāng)數(shù)量超過預(yù)設(shè)的數(shù)量閾值與系數(shù)的乘積時(shí),確定彈幕分類所屬的視頻片段為關(guān)鍵視頻片段。需要說明的是,當(dāng)關(guān)鍵視頻片段相鄰時(shí),可以合并相鄰的關(guān)鍵視頻片段。步驟104,提取所述關(guān)鍵視頻片段對(duì)應(yīng)的視頻特征信息;在本發(fā)明實(shí)施例中,可以從關(guān)鍵視頻片段中挖掘出表征該關(guān)鍵視頻片段特征的視頻特征信息。在一種視頻特征信息中,可以提取關(guān)鍵視頻片段對(duì)應(yīng)的時(shí)間區(qū)間,即起始時(shí)間和結(jié)束時(shí)間,作為視頻特征信息。在另一種視頻特征信息中,可以將所述彈幕中心文本設(shè)置為視頻特征信息,體現(xiàn)該關(guān)鍵視頻片段的主題。在另一種視頻特征信息中,可以查找關(guān)鍵視頻片段對(duì)應(yīng)的字幕數(shù)據(jù),通過文本摘要算法(如textteaser)等方式,采用字幕數(shù)據(jù)生成文本摘要信息,作為視頻特征信息。在另一種視頻特征信息中,可以通過視頻摘要生成算法,如基于關(guān)鍵幀(keyframe)的視頻摘要生成算法、基于語義內(nèi)容相關(guān)挖掘的視頻摘要生成算法等等,采用所述關(guān)鍵視頻片段中的視頻數(shù)據(jù)生成視頻摘要信息,作為視頻特征信息。當(dāng)然,上述視頻數(shù)據(jù)信息只是作為示例,在實(shí)施本發(fā)明實(shí)施例時(shí),可以根據(jù)實(shí)際情況設(shè)置其他視頻數(shù)據(jù)信息,本發(fā)明實(shí)施例對(duì)此不加以限制。另外,除了上述視頻數(shù)據(jù)信息外,本領(lǐng)域技術(shù)人員還可以根據(jù)實(shí)際需要采用其它視頻數(shù)據(jù)信息,本發(fā)明實(shí)施例對(duì)此也不加以限制。步驟105,將所述視頻特征信息推送至客戶端進(jìn)行展示。在具體實(shí)現(xiàn)中,可以基于不同的場景將視頻特征信息推送至客戶端進(jìn)行展示。若客戶端主動(dòng)請(qǐng)求發(fā)送搜索關(guān)鍵詞,則服務(wù)器可以搜索匹配的視頻特征信息返回給客戶端進(jìn)行展示。若客戶端加載某個(gè)頁面,如某個(gè)視頻所在的頁面,則服務(wù)器可以將包含視頻特征信息的頁面數(shù)據(jù)返回給客戶端,將該視頻特征信息推薦給客戶端。若客戶端的某些行為數(shù)據(jù)與視頻特征信息,則服務(wù)器可以主動(dòng)將該視頻特征信息推送至客戶端。本發(fā)明實(shí)施例對(duì)視頻數(shù)據(jù)的彈幕文本進(jìn)行聚類,基于彈幕分類識(shí)別關(guān)鍵視頻片段,并將該關(guān)鍵視頻片段的視頻特征信息推送至客戶端進(jìn)行展示,實(shí)現(xiàn)了視頻主題的挖掘,避免了用戶再次通過觀看整個(gè)視頻數(shù)據(jù)篩選出感興趣的部分,大大減少了耗時(shí),減少了帶寬資源的浪費(fèi),提高了效率。對(duì)于方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明實(shí)施例并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明實(shí)施例,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作并不一定是本發(fā)明實(shí)施例所必須的。參照?qǐng)D2,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種視頻特征信息的展示裝置實(shí)施例的結(jié)構(gòu)框圖,具體可以包括如下模塊:彈幕文本獲取模塊201,適于獲取視頻數(shù)據(jù)的一個(gè)或多個(gè)彈幕文本;彈幕文本聚類模塊202,適于對(duì)所述一個(gè)或多個(gè)彈幕文本進(jìn)行聚類,獲得一個(gè)或多個(gè)彈幕分類;關(guān)鍵視頻片段識(shí)別模塊203,適于根據(jù)所述一個(gè)或多個(gè)彈幕分類從所述視頻數(shù)據(jù)中識(shí)別一個(gè)或多個(gè)關(guān)鍵視頻片段;視頻特征信息提取模塊204,適于提取所述關(guān)鍵視頻片段對(duì)應(yīng)的視頻特征信息;視頻特征信息推送模塊205,適于將所述視頻特征信息推送至客戶端進(jìn)行展示。在本發(fā)明的一種可選實(shí)施例中,所述彈幕文本聚類模塊202還可以適于:從所述一個(gè)或多個(gè)彈幕文本中提取彈幕中心文本;對(duì)所述彈幕中心文本配置彈幕分類;計(jì)算所述一個(gè)或多個(gè)彈幕文本與所述彈幕中心文本的一個(gè)或多個(gè)相似度;當(dāng)所述相似度高于預(yù)設(shè)的相似度閾值時(shí),將所述彈幕文本劃入所述彈幕中心文本所屬的彈幕分類中。在本發(fā)明的一種可選實(shí)施例中,所述彈幕文本聚類模塊202還可以適于:對(duì)所述一個(gè)或多個(gè)彈幕文本進(jìn)行分詞處理,獲取一個(gè)或多個(gè)文本分詞;統(tǒng)計(jì)所述一個(gè)或多個(gè)文本分詞的詞頻;查詢所述一個(gè)或多個(gè)文本分詞的文本權(quán)重;結(jié)合所述詞頻和所述文本權(quán)重,計(jì)算所述文本分詞的彈幕權(quán)重;當(dāng)所述彈幕權(quán)重高于預(yù)設(shè)的權(quán)重閾值時(shí),確定所述文本分詞為彈幕中心文本。在本發(fā)明的一種可選實(shí)施例中,所述關(guān)鍵視頻片段識(shí)別模塊203還可以適于:對(duì)所述視頻數(shù)據(jù)劃分為一個(gè)或多個(gè)視頻片段;在所述一個(gè)或多個(gè)視頻片段中,統(tǒng)計(jì)所述一個(gè)或多個(gè)彈幕分類中彈幕文本的數(shù)量;按照所述數(shù)量從所述一個(gè)或多個(gè)視頻片段中選取關(guān)鍵視頻片段。在本發(fā)明的一種可選實(shí)施例中,所述關(guān)鍵視頻片段識(shí)別模塊203還可以適于:查詢所述視頻數(shù)據(jù)的視頻類型;查詢所述視頻類型對(duì)應(yīng)的系數(shù);當(dāng)所述數(shù)量超過預(yù)設(shè)的數(shù)量閾值與所述系數(shù)的乘積時(shí),確定所述彈幕分類所屬的視頻片段為關(guān)鍵視頻片段。在本發(fā)明的一種可選實(shí)施例中,所述關(guān)鍵視頻片段識(shí)別模塊203還可以適于:當(dāng)關(guān)鍵視頻片段相鄰時(shí),合并相鄰的關(guān)鍵視頻片段。在本發(fā)明的一種可選實(shí)施例中,所述視頻特征信息提取模塊204還可以適于:提取所述關(guān)鍵視頻片段對(duì)應(yīng)的時(shí)間區(qū)間,作為視頻特征信息。在本發(fā)明的一種可選實(shí)施例中,所述視頻特征信息提取模塊204還可以適于:將所述彈幕中心文本設(shè)置為視頻特征信息。在本發(fā)明的一種可選實(shí)施例中,所述視頻特征信息提取模塊204還可以適于:查找所述關(guān)鍵視頻片段對(duì)應(yīng)的字幕數(shù)據(jù);采用所述字幕數(shù)據(jù)生成文本摘要信息,作為視頻特征信息。在本發(fā)明的一種可選實(shí)施例中,所述視頻特征信息提取模塊204還可以適于:采用所述關(guān)鍵視頻片段中的視頻數(shù)據(jù)生成視頻摘要信息,作為視頻特征信息。對(duì)于裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對(duì)任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說明書的理解。類似地,應(yīng)當(dāng)理解,為了精簡本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循具體實(shí)施方式的權(quán)利要求書由此明確地并入該具體實(shí)施方式,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中。可以把實(shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來代替。此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來使用。本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(dsp)來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的視頻特征信息的展示設(shè)備中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過同一個(gè)硬件項(xiàng)來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。本發(fā)明實(shí)施例公開了a1、一種視頻特征信息的展示方法,包括:獲取視頻數(shù)據(jù)的一個(gè)或多個(gè)彈幕文本;對(duì)所述一個(gè)或多個(gè)彈幕文本進(jìn)行聚類,獲得一個(gè)或多個(gè)彈幕分類;根據(jù)所述一個(gè)或多個(gè)彈幕分類從所述視頻數(shù)據(jù)中識(shí)別一個(gè)或多個(gè)關(guān)鍵視頻片段;提取所述關(guān)鍵視頻片段對(duì)應(yīng)的視頻特征信息;將所述視頻特征信息推送至客戶端進(jìn)行展示。a2、如a1所述的方法,所述對(duì)所述一個(gè)或多個(gè)彈幕文本進(jìn)行聚類,獲得一個(gè)或多個(gè)彈幕分類的步驟包括:從所述一個(gè)或多個(gè)彈幕文本中提取彈幕中心文本;對(duì)所述彈幕中心文本配置彈幕分類;計(jì)算所述一個(gè)或多個(gè)彈幕文本與所述彈幕中心文本的一個(gè)或多個(gè)相似度;當(dāng)所述相似度高于預(yù)設(shè)的相似度閾值時(shí),將所述彈幕文本劃入所述彈幕中心文本所屬的彈幕分類中。a3、如a2所述的方法,所述從所述一個(gè)或多個(gè)彈幕文本中提取彈幕中心文本的步驟包括:對(duì)所述一個(gè)或多個(gè)彈幕文本進(jìn)行分詞處理,獲取一個(gè)或多個(gè)文本分詞;統(tǒng)計(jì)所述一個(gè)或多個(gè)文本分詞的詞頻;查詢所述一個(gè)或多個(gè)文本分詞的文本權(quán)重;結(jié)合所述詞頻和所述文本權(quán)重,計(jì)算所述文本分詞的彈幕權(quán)重;當(dāng)所述彈幕權(quán)重高于預(yù)設(shè)的權(quán)重閾值時(shí),確定所述文本分詞為彈幕中心文本。a4、如a1或a2或所述的方法,所述根據(jù)所述一個(gè)或多個(gè)彈幕分類從所述視頻數(shù)據(jù)中識(shí)別一個(gè)或多個(gè)關(guān)鍵視頻片段的步驟包括:對(duì)所述視頻數(shù)據(jù)劃分為一個(gè)或多個(gè)視頻片段;在所述一個(gè)或多個(gè)視頻片段中,統(tǒng)計(jì)所述一個(gè)或多個(gè)彈幕分類中彈幕文本的數(shù)量;按照所述數(shù)量從所述一個(gè)或多個(gè)視頻片段中選取關(guān)鍵視頻片段。a5、如a4或所述的方法,所述按照所述數(shù)量從所述一個(gè)或多個(gè)視頻片段中選取關(guān)鍵視頻片段的步驟包括:查詢所述視頻數(shù)據(jù)的視頻類型;查詢所述視頻類型對(duì)應(yīng)的系數(shù);當(dāng)所述數(shù)量超過預(yù)設(shè)的數(shù)量閾值與所述系數(shù)的乘積時(shí),確定所述彈幕分類所屬的視頻片段為關(guān)鍵視頻片段。a6、如a4或所述的方法,所述根據(jù)所述一個(gè)或多個(gè)彈幕分類從所述視頻數(shù)據(jù)中識(shí)別一個(gè)或多個(gè)關(guān)鍵視頻片段的步驟還包括:當(dāng)關(guān)鍵視頻片段相鄰時(shí),合并相鄰的關(guān)鍵視頻片段。a7、如a1或a2或a3或a5或a6所述的方法,所述提取所述關(guān)鍵視頻片段對(duì)應(yīng)的視頻特征信息的步驟包括:提取所述關(guān)鍵視頻片段對(duì)應(yīng)的時(shí)間區(qū)間,作為視頻特征信息。a8、如a2或a3所述的方法,所述提取所述關(guān)鍵視頻片段對(duì)應(yīng)的視頻特征信息的步驟包括:將所述彈幕中心文本設(shè)置為視頻特征信息。a9、如a1或a2或a3或a5或a6所述的方法,所述提取所述關(guān)鍵視頻片段對(duì)應(yīng)的視頻特征信息的步驟包括:查找所述關(guān)鍵視頻片段對(duì)應(yīng)的字幕數(shù)據(jù);采用所述字幕數(shù)據(jù)生成文本摘要信息,作為視頻特征信息。a10、如a1或a2或a3或a5或a6所述的方法,所述提取所述關(guān)鍵視頻片段對(duì)應(yīng)的視頻特征信息的步驟包括:采用所述關(guān)鍵視頻片段中的視頻數(shù)據(jù)生成視頻摘要信息,作為視頻特征信息。本發(fā)明實(shí)施例還公開了b11、一種視頻特征信息的展示裝置,包括:彈幕文本獲取模塊,適于獲取視頻數(shù)據(jù)的一個(gè)或多個(gè)彈幕文本;彈幕文本聚類模塊,適于對(duì)所述一個(gè)或多個(gè)彈幕文本進(jìn)行聚類,獲得一個(gè)或多個(gè)彈幕分類;關(guān)鍵視頻片段識(shí)別模塊,適于根據(jù)所述一個(gè)或多個(gè)彈幕分類從所述視頻數(shù)據(jù)中識(shí)別一個(gè)或多個(gè)關(guān)鍵視頻片段;視頻特征信息提取模塊,適于提取所述關(guān)鍵視頻片段對(duì)應(yīng)的視頻特征信息;視頻特征信息推送模塊,適于將所述視頻特征信息推送至客戶端進(jìn)行展示。b12、如b11所述的裝置,所述彈幕文本聚類模塊還適于:從所述一個(gè)或多個(gè)彈幕文本中提取彈幕中心文本;對(duì)所述彈幕中心文本配置彈幕分類;計(jì)算所述一個(gè)或多個(gè)彈幕文本與所述彈幕中心文本的一個(gè)或多個(gè)相似度;當(dāng)所述相似度高于預(yù)設(shè)的相似度閾值時(shí),將所述彈幕文本劃入所述彈幕中心文本所屬的彈幕分類中。b13、如b12所述的裝置,所述彈幕文本聚類模塊還適于:對(duì)所述一個(gè)或多個(gè)彈幕文本進(jìn)行分詞處理,獲取一個(gè)或多個(gè)文本分詞;統(tǒng)計(jì)所述一個(gè)或多個(gè)文本分詞的詞頻;查詢所述一個(gè)或多個(gè)文本分詞的文本權(quán)重;結(jié)合所述詞頻和所述文本權(quán)重,計(jì)算所述文本分詞的彈幕權(quán)重;當(dāng)所述彈幕權(quán)重高于預(yù)設(shè)的權(quán)重閾值時(shí),確定所述文本分詞為彈幕中心文本。b14、如b11或b12或所述的裝置,所述關(guān)鍵視頻片段識(shí)別模塊還適于:對(duì)所述視頻數(shù)據(jù)劃分為一個(gè)或多個(gè)視頻片段;在所述一個(gè)或多個(gè)視頻片段中,統(tǒng)計(jì)所述一個(gè)或多個(gè)彈幕分類中彈幕文本的數(shù)量;按照所述數(shù)量從所述一個(gè)或多個(gè)視頻片段中選取關(guān)鍵視頻片段。b15、如b14或所述的裝置,所述關(guān)鍵視頻片段識(shí)別模塊還適于:查詢所述視頻數(shù)據(jù)的視頻類型;查詢所述視頻類型對(duì)應(yīng)的系數(shù);當(dāng)所述數(shù)量超過預(yù)設(shè)的數(shù)量閾值與所述系數(shù)的乘積時(shí),確定所述彈幕分類所屬的視頻片段為關(guān)鍵視頻片段。b16、如b14或所述的裝置,所述關(guān)鍵視頻片段識(shí)別模塊還適于:當(dāng)關(guān)鍵視頻片段相鄰時(shí),合并相鄰的關(guān)鍵視頻片段。b17、如b11或b12或b13或b15或b16所述的裝置,所述視頻特征信息提取模塊還適于:提取所述關(guān)鍵視頻片段對(duì)應(yīng)的時(shí)間區(qū)間,作為視頻特征信息。b18、如b12或b13所述的裝置,所述視頻特征信息提取模塊還適于:將所述彈幕中心文本設(shè)置為視頻特征信息。b19、如b11或b12或b13或b15或b16所述的裝置,所述視頻特征信息提取模塊還適于:查找所述關(guān)鍵視頻片段對(duì)應(yīng)的字幕數(shù)據(jù);采用所述字幕數(shù)據(jù)生成文本摘要信息,作為視頻特征信息。b20、如b11或b12或b13或b15或b16所述的裝置,所述視頻特征信息提取模塊還適于:采用所述關(guān)鍵視頻片段中的視頻數(shù)據(jù)生成視頻摘要信息,作為視頻特征信息。當(dāng)前第1頁12