欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種獲取熱點(diǎn)話題的方法及裝置與流程

文檔序號(hào):12887225閱讀:357來(lái)源:國(guó)知局
一種獲取熱點(diǎn)話題的方法及裝置與流程

本申請(qǐng)涉及大數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種獲取熱點(diǎn)話題的方法及裝置。



背景技術(shù):

在社交網(wǎng)絡(luò)中,通常針對(duì)熱點(diǎn)話題進(jìn)行大數(shù)據(jù)分析,以挖掘相關(guān)人群重點(diǎn)關(guān)注的內(nèi)容。由于熱點(diǎn)話題是一種能明確、簡(jiǎn)潔地表達(dá)熱點(diǎn)信息的形式。例如,從海量社交短文本中發(fā)現(xiàn)熱點(diǎn)話題,能使人們快速、及時(shí)地獲取重要的事件、新聞,讓產(chǎn)品運(yùn)營(yíng)、公關(guān)等人員了解用戶,讓銷售、市場(chǎng)等人員更加了解消費(fèi)者。由于社交數(shù)據(jù)量龐大,在進(jìn)行熱點(diǎn)話題分析時(shí)需要處理較復(fù)雜的數(shù)據(jù),而從海量文本中生成語(yǔ)法正確、意思明確的熱點(diǎn)話題更難。

目前主要采用聚類式的方法、主題模型方法、文檔摘要的方法或者取標(biāo)題的方法等從海量文本中提取熱點(diǎn)話題,但是,現(xiàn)有的方法存在話題屬性較弱、難以直接提取話題、準(zhǔn)確率低或者運(yùn)算復(fù)雜度高等問(wèn)題。



技術(shù)實(shí)現(xiàn)要素:

本申請(qǐng)?zhí)峁┝艘环N獲取熱點(diǎn)話題的方法及裝置,能夠解決現(xiàn)有技術(shù)中提取熱點(diǎn)話題的難以直接提取、效率較低的問(wèn)題。

本申請(qǐng)第一方面提供一種獲取熱點(diǎn)話題的方法,所述方法包括:

獲取待處理的語(yǔ)料集合,所述語(yǔ)料集合包括多個(gè)語(yǔ)料,每個(gè)語(yǔ)料包括多個(gè)詞語(yǔ);

獲取所述語(yǔ)料集合中各詞語(yǔ)的熱度信息;

根據(jù)所述語(yǔ)料集合中各詞語(yǔ)的熱度信息,從所述語(yǔ)料集合中提取熱詞集合;

基于信息熵從所述熱詞集合中提取候選熱詞組集合,所述候選熱詞組集合包括多個(gè)候選熱詞組;

基于候選熱詞組的熱度信息和候選熱詞組的權(quán)重值,從所述候選熱詞組集合中提取目標(biāo)熱詞組集合,將所述目標(biāo)熱詞組集合作為熱點(diǎn)話題集合。

一種可能的設(shè)計(jì)中,所述根據(jù)所述語(yǔ)料集合中各詞語(yǔ)的熱度信息,從所述語(yǔ)料集合中提取熱詞集合,包括:

將第一時(shí)間段內(nèi)的詞語(yǔ)集合與第二時(shí)間段內(nèi)的詞語(yǔ)集合進(jìn)行比較,所述第一時(shí)間段和所述第二時(shí)間段之間間隔至少一個(gè)預(yù)設(shè)時(shí)間段,所述第一時(shí)間段在所述第二時(shí)間段之后;

若所述第一時(shí)間段內(nèi)的詞語(yǔ)集合與所述第二時(shí)間段內(nèi)的詞語(yǔ)集合之間的相似度高于第一閾值,則將所述第一時(shí)間段內(nèi)的詞語(yǔ)集合從所述語(yǔ)料集合中去除,得到所述熱詞集合。

一種可能的設(shè)計(jì)中,所述獲取語(yǔ)料集合中各詞語(yǔ)的熱度信息,包括:

計(jì)算統(tǒng)計(jì)時(shí)間內(nèi)第一詞語(yǔ)的理論梯度信息,得到所述語(yǔ)料集合中各詞語(yǔ)的理論梯度信息;所述統(tǒng)計(jì)時(shí)間包括至少兩個(gè)采樣時(shí)間,所述第一詞語(yǔ)為所述語(yǔ)料集合中的詞語(yǔ),所述理論梯度信息是指在一個(gè)所述采樣時(shí)間內(nèi)所述第一詞語(yǔ)出現(xiàn)的頻次與總頻次的比值,所述總頻次是指所述第一詞語(yǔ)在所述統(tǒng)計(jì)時(shí)間內(nèi)出現(xiàn)的頻次;

基于貝葉斯平均公式對(duì)所述語(yǔ)料集合中各詞語(yǔ)的理論梯度信息進(jìn)行修正,得到所述語(yǔ)料集合中各詞語(yǔ)的熱度信息。

一種可能的設(shè)計(jì)中,所述根據(jù)所述語(yǔ)料集合中各詞語(yǔ)的熱度信息,從所述語(yǔ)料集合中提取熱詞集合,還包括:

基于詞語(yǔ)共現(xiàn)模型,去除所述語(yǔ)料集合中的冗余詞語(yǔ)。

一種可能的設(shè)計(jì)中,所述基于信息熵從所述熱詞集合中提取候選熱詞組集合,包括:

計(jì)算所述熱詞集合中各熱詞之間的互信息、所述熱詞集合中各熱詞的左右信息熵;

根據(jù)所述熱詞集合中各熱詞之間的互信息、所述熱詞集合中各熱詞的左右信息熵以及熱詞出現(xiàn)的頻次確定多個(gè)候選熱詞組,得到所述候選熱詞組集合。

一種可能的設(shè)計(jì)中,所述根據(jù)所述語(yǔ)料集合中各詞語(yǔ)的熱度信息,從所述語(yǔ)料集合中提取熱詞集合,還包括:

對(duì)所述語(yǔ)料集合進(jìn)行去噪處理,所述去噪處理的方式包括以下方式中的至少一項(xiàng):

文本去重、垃圾文本識(shí)別、語(yǔ)義分析、新詞發(fā)現(xiàn)、中文分詞、去除標(biāo)點(diǎn)符號(hào)或特殊字符等。

一種可能的設(shè)計(jì)中,基于詞語(yǔ)共現(xiàn)模型,去除所述語(yǔ)料集合中的冗余詞語(yǔ),從而進(jìn)一步篩選熱詞。其中,共現(xiàn)模型是指對(duì)于互為共現(xiàn)詞的熱詞的模型。

一種可能的設(shè)計(jì)中,所述基于候選熱詞組的熱度信息和候選熱詞組的權(quán)重值,從所述候選熱詞組集合中提取目標(biāo)熱詞組集合,包括:

根據(jù)第一候選熱詞組的熱度信息、包括所述第一候選熱詞組的語(yǔ)料數(shù)量以及所述候選熱度詞組集合中所有候選熱詞組的平均熱度信息,計(jì)算所述第一候選熱詞組的熱點(diǎn)話題能力信息;所述第一候選熱詞組是指所述候選熱詞組集合中的任一候選熱詞組,所述第一候選熱詞組的熱點(diǎn)話題能力信息是指所述第一候選熱詞組具備熱點(diǎn)話題的生成條件;

根據(jù)所述第一候選熱詞組的熱點(diǎn)話題能力信息確定所述第一候選熱詞組具備熱點(diǎn)話題的生成條件時(shí),將所述第一候選熱詞組作為目標(biāo)熱詞組,以得到包括至少一個(gè)目標(biāo)熱詞組的所述目標(biāo)熱詞組集合;

根據(jù)所述目標(biāo)熱詞組集合生成熱點(diǎn)話題,得到包括至少一個(gè)熱點(diǎn)話題的所述熱點(diǎn)話題集合,所述第一候選熱詞組對(duì)應(yīng)一個(gè)熱點(diǎn)話題。

可選的,計(jì)算所述候選熱詞組集合時(shí),還可考慮候選的熱詞的左/右/鄰詞語(yǔ)的個(gè)數(shù)等相關(guān)或類似特征。

可選的,在選擇作為熱點(diǎn)話題的目標(biāo)熱詞組時(shí),還可以進(jìn)一步考慮熱詞詞組出現(xiàn)的頻次,熱詞組出現(xiàn)的頻次越多,說(shuō)明該熱詞詞組定義的事件越重要,也就越有熱度價(jià)值。

本申請(qǐng)第二方面提供一種用于獲取熱點(diǎn)話題的裝置,所述裝置包括:

獲取模塊,用于獲取待處理的語(yǔ)料集合,所述語(yǔ)料集合包括多個(gè)語(yǔ)料,每個(gè)語(yǔ)料包括多個(gè)詞語(yǔ),以及獲取所述語(yǔ)料集合中各詞語(yǔ)的熱度信息;

處理模塊,用于根據(jù)所述語(yǔ)料集合中各詞語(yǔ)的熱度信息,從所述語(yǔ)料集合中提取熱詞集合;基于信息熵從所述熱詞集合中提取候選熱詞組集合,所述候選熱詞組集合包括多個(gè)候選熱詞組;基于候選熱詞組的熱度信息和候選熱詞組的權(quán)重值,從所述候選熱詞組集合中提取目標(biāo)熱詞組集合,將所述目標(biāo)熱詞組集合作為熱點(diǎn)話題集合。

一種可能的設(shè)計(jì)中,所述處理模塊具體用于:

將第一時(shí)間段內(nèi)的詞語(yǔ)集合與第二時(shí)間段內(nèi)的詞語(yǔ)集合進(jìn)行比較,所述第一時(shí)間段和所述第二時(shí)間段之間間隔至少一個(gè)預(yù)設(shè)時(shí)間段,所述第一時(shí)間段在所述第二時(shí)間段之后;

若所述第一時(shí)間段內(nèi)的詞語(yǔ)集合與所述第二時(shí)間段內(nèi)的詞語(yǔ)集合之間的相似度高于第一閾值,則將所述第一時(shí)間段內(nèi)的詞語(yǔ)集合從所述語(yǔ)料集合中去除,得到所述熱詞集合。

一種可能的設(shè)計(jì)中,所述熱度信息包括詞語(yǔ)的梯度信息,所述處理模塊獲取待處理的語(yǔ)料集合之后,根據(jù)所述語(yǔ)料集合中各詞語(yǔ)的熱度信息從所述語(yǔ)料集合中提取熱詞集合之前,還用于:

計(jì)算統(tǒng)計(jì)時(shí)間內(nèi)第一詞語(yǔ)的理論梯度信息,得到所述語(yǔ)料集合中各詞語(yǔ)的理論梯度信息;所述統(tǒng)計(jì)時(shí)間包括至少兩個(gè)采樣時(shí)間,所述第一詞語(yǔ)為所述語(yǔ)料集合中的詞語(yǔ),所述理論梯度信息是指在一個(gè)所述采樣時(shí)間內(nèi)所述第一詞語(yǔ)出現(xiàn)的頻次與總頻次的比值,所述總頻次是指所述第一詞語(yǔ)在所述統(tǒng)計(jì)時(shí)間內(nèi)出現(xiàn)的頻次;

基于貝葉斯平均公式分別對(duì)所述語(yǔ)料集合中各詞語(yǔ)的理論梯度信息進(jìn)行修正,得到所述語(yǔ)料集合中各詞語(yǔ)的熱度信息。

一種可能的設(shè)計(jì)中,所述處理模塊具體用于:

基于詞語(yǔ)共現(xiàn)模型,去除所述語(yǔ)料集合中的冗余詞語(yǔ)。

一種可能的設(shè)計(jì)中,所述處理模塊具體用于:

計(jì)算所述熱詞集合中各熱詞之間的互信息、所述熱詞集合中各熱詞的左右信息熵;

根據(jù)所述熱詞集合中各熱詞之間的互信息、所述熱詞集合中各熱詞組的左右信息熵以及熱詞出現(xiàn)的頻次確定多個(gè)候選熱詞組,得到所述候選熱詞組集合。

一種可能的設(shè)計(jì)中,所述處理模塊具體用于:

對(duì)所述語(yǔ)料集合進(jìn)行去噪處理,所述去噪處理的方式包括以下方式中的至少一項(xiàng):

文本去重、垃圾文本識(shí)別、語(yǔ)義分析、新詞發(fā)現(xiàn)或中文分詞。

一種可能的設(shè)計(jì)中,所述處理模塊具體用于:

根據(jù)第一候選熱詞組的熱度信息、包括所述第一候選熱詞組的語(yǔ)料數(shù)量以及所述候選熱度詞組集合中所有候選熱詞組的平均熱度信息,計(jì)算所述第一候選熱詞組的熱點(diǎn)話題能力信息;所述第一候選熱詞組是指所述候選熱詞組集合中的任一候選熱詞組,所述第一候選熱詞組的熱點(diǎn)話題能力信息是指所述第一候選熱詞組具備熱點(diǎn)話題的生成條件;

根據(jù)所述第一候選熱詞組的熱點(diǎn)話題能力信息確定所述第一候選熱詞組具備熱點(diǎn)話題的生成條件時(shí),將所述第一候選熱詞組作為目標(biāo)熱詞組,以得到包括至少一個(gè)目標(biāo)熱詞組的所述目標(biāo)熱詞組集合;

根據(jù)所述目標(biāo)熱詞組集合生成熱點(diǎn)話題,得到包括至少一個(gè)熱點(diǎn)話題的所述熱點(diǎn)話題集合,所述第一候選熱詞組對(duì)應(yīng)一個(gè)熱點(diǎn)話題。

可選的,計(jì)算所述候選熱詞組集合時(shí),還可考慮候選的熱詞的左/右/鄰詞語(yǔ)的個(gè)數(shù)等相關(guān)或類似特征。

可選的,在選擇作為熱點(diǎn)話題的目標(biāo)熱詞組時(shí),還可以進(jìn)一步考慮熱詞詞組出現(xiàn)的頻次,熱詞組出現(xiàn)的頻次越多,說(shuō)明該熱詞詞組定義的事件越重要,也就越有熱度價(jià)值。

本申請(qǐng)又一方面提供了一種用于管理設(shè)備的裝置,其包括至少一個(gè)連接的處理器、存儲(chǔ)器、發(fā)射器和接收器,其中,所述存儲(chǔ)器用于存儲(chǔ)程序代碼,所述處理器用于調(diào)用所述存儲(chǔ)器中的程序代碼來(lái)執(zhí)行上述第一方面所述的方法。

本申請(qǐng)又一方面提供了一種計(jì)算機(jī)存儲(chǔ)介質(zhì),其包括指令,當(dāng)其在計(jì)算機(jī)上運(yùn)行時(shí),使得計(jì)算機(jī)執(zhí)行上述第一方面所述的方法。

本申請(qǐng)又一方面提供了一種包含指令的計(jì)算機(jī)程序產(chǎn)品,當(dāng)其在計(jì)算機(jī)上運(yùn)行時(shí),使得計(jì)算機(jī)執(zhí)行上述第一方面所述的方法。

相較于現(xiàn)有技術(shù),本申請(qǐng)?zhí)峁┑姆桨钢?,在獲取待處理的語(yǔ)料集合后,根據(jù)所述語(yǔ)料集合中各詞語(yǔ)的熱度信息提取出熱詞集合,可見(jiàn),不需要基于訓(xùn)練數(shù)據(jù),就可以直接、快速、準(zhǔn)確的提取出連貫的候選熱詞組。基于信息熵從所述熱詞集合中提取候選熱詞組集合,由于目標(biāo)熱詞組集合是基于候選熱詞組的熱度信息和候選熱詞組的權(quán)重值從所述候選熱詞組集合中提取的,所以生成的目標(biāo)熱點(diǎn)話題集合的準(zhǔn)確度也較高。

附圖說(shuō)明

圖1為本發(fā)明實(shí)施例中通信系統(tǒng)的一種網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)示意圖;

圖2為本發(fā)明實(shí)施例中獲取熱點(diǎn)話題的方法的一種流程示意圖;

圖3為本發(fā)明實(shí)施例中影響熱詞因素的一種框架示意圖;

圖4為本發(fā)明實(shí)施例中選擇候選詞組的一種示意圖;

圖5為本發(fā)明實(shí)施例中用于獲取熱點(diǎn)話題的裝置的一種結(jié)構(gòu)示意圖;

圖6為本發(fā)明實(shí)施例中服務(wù)器的一種結(jié)構(gòu)示意圖;

圖7為本發(fā)明實(shí)施例中手機(jī)的一種結(jié)構(gòu)示意圖。

具體實(shí)施方式

本申請(qǐng)的說(shuō)明書和權(quán)利要求書及上述附圖中的術(shù)語(yǔ)“第一”、“第二”等是用于區(qū)別類似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的實(shí)施例能夠以除了在這里圖示或描述的內(nèi)容以外的順序?qū)嵤?。此外,術(shù)語(yǔ)“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或模塊的過(guò)程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或模塊,而是可包括沒(méi)有清楚地列出的或?qū)τ谶@些過(guò)程、方法、產(chǎn)品或設(shè)備固有的其它步驟或模塊,本申請(qǐng)中所出現(xiàn)的模塊的劃分,僅僅是一種邏輯上的劃分,實(shí)際應(yīng)用中實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)模塊可以結(jié)合成或集成在另一個(gè)系統(tǒng)中,或一些特征可以忽略,或不執(zhí)行,另外,所顯示的或討論的相互之間的耦合或直接耦合或通信連接可以是通過(guò)一些接口,模塊之間的間接耦合或通信連接可以是電性或其他類似的形式,本申請(qǐng)中均不作限定。并且,作為分離部件說(shuō)明的模塊或子模塊可以是也可以不是物理上的分離,可以是也可以不是物理模塊,或者可以分布到多個(gè)電路模塊中,可以根據(jù)實(shí)際的需要選擇其中的部分或全部模塊來(lái)實(shí)現(xiàn)本申請(qǐng)方案的目的。

本申請(qǐng)供了一種獲取熱點(diǎn)話題的方法及裝置,用于大數(shù)據(jù)處理技術(shù)領(lǐng)域。以下進(jìn)行詳細(xì)說(shuō)明。如圖1所示的通信系統(tǒng)的一種網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)示意圖,該通信系統(tǒng)可包括服務(wù)器和多個(gè)終端設(shè)備,終端設(shè)備可查看、搜索新聞、以及對(duì)新聞進(jìn)行評(píng)論。服務(wù)器則是統(tǒng)計(jì)這些終端設(shè)備的操作數(shù)據(jù),然后從中提取出語(yǔ)料,再?gòu)倪@些語(yǔ)料中提取出熱詞,并生成熱點(diǎn)話題。

其中,需要特別說(shuō)明的是,本申請(qǐng)涉及的終端設(shè)備,可以是指向用戶提供語(yǔ)音和/或數(shù)據(jù)連通性的設(shè)備,具有無(wú)線連接功能的手持式設(shè)備、或連接到無(wú)線調(diào)制解調(diào)器的其他處理設(shè)備。無(wú)線終端可以經(jīng)無(wú)線接入網(wǎng)(英文全稱:radioaccessnetwork,英文簡(jiǎn)稱:ran)與一個(gè)或多個(gè)核心網(wǎng)進(jìn)行通信,無(wú)線終端可以是移動(dòng)終端,如移動(dòng)電話(或稱為“蜂窩”電話)和具有移動(dòng)終端的計(jì)算機(jī),例如,可以是便攜式、袖珍式、手持式、計(jì)算機(jī)內(nèi)置的或者車載的移動(dòng)裝置,它們與無(wú)線接入網(wǎng)交換語(yǔ)音和/或數(shù)據(jù)。例如,個(gè)人通信業(yè)務(wù)(英文全稱:personalcommunicationservice,英文簡(jiǎn)稱:pcs)電話、無(wú)繩電話、會(huì)話發(fā)起協(xié)議(sip)話機(jī)、無(wú)線本地環(huán)路(wirelesslocalloop,英文簡(jiǎn)稱:wll)站、個(gè)人數(shù)字助理(英文全稱:personaldigitalassistant,英文簡(jiǎn)稱:pda)等設(shè)備。無(wú)線終端也可以稱為系統(tǒng)、訂戶單元(subscriberunit)、訂戶站(subscriberstation),移動(dòng)站(mobilestation)、移動(dòng)臺(tái)(mobile)、遠(yuǎn)程站(remotestation)、接入點(diǎn)(accesspoint)、遠(yuǎn)程終端(remoteterminal)、接入終端(accessterminal)、用戶終端(userterminal)、終端設(shè)備、用戶代理(useragent)、用戶設(shè)備(userdevice)、或用戶裝備(userequipment)。

為解決上述技術(shù)問(wèn)題,本申請(qǐng)主要提供以下技術(shù)方案:

首先從海量社交短文本中提取熱詞。然后從熱詞出發(fā),在包含熱詞的相關(guān)短文本中,對(duì)包含熱詞,并且所包含詞語(yǔ)數(shù)量在一定范圍內(nèi)的詞語(yǔ)組合,利用信息熵理論篩選出一批候選話題詞組。最后,根據(jù)tf-idf、詞語(yǔ)熱度以及候選詞組的出現(xiàn)頻次等,進(jìn)一步精篩出熱點(diǎn)話題。

請(qǐng)參照?qǐng)D2,以下從對(duì)本申請(qǐng)?zhí)峁┮环N獲取熱點(diǎn)話題的方法進(jìn)行舉例說(shuō)明,所述方法包括:

201、獲取待處理的語(yǔ)料集合和所述語(yǔ)料集合中各詞語(yǔ)的熱度信息。

其中,該語(yǔ)料集合是指在指定的一個(gè)統(tǒng)計(jì)時(shí)間內(nèi)所收集到的語(yǔ)料的集合,各語(yǔ)料集合可來(lái)自至少一個(gè)平臺(tái)。所述語(yǔ)料集合包括多個(gè)語(yǔ)料,每個(gè)語(yǔ)料包括多個(gè)詞語(yǔ),多個(gè)詞語(yǔ)可組成一個(gè)詞語(yǔ)集合。例如該語(yǔ)料集合來(lái)源于一篇帖子或新聞的數(shù)據(jù)。

在獲取所述語(yǔ)料集合后,還可計(jì)算所述語(yǔ)料集合中各詞語(yǔ)的熱度信息。

202、根據(jù)所述語(yǔ)料集合中各詞語(yǔ)的熱度信息,從所述語(yǔ)料集合中提取熱詞集合。

可選的,在一些實(shí)施方式中,本申請(qǐng)是按照一定時(shí)間范圍內(nèi)統(tǒng)計(jì)的熱詞,考慮到時(shí)間段的關(guān)系,出現(xiàn)的熱詞差異較大,有可能會(huì)誤判,所以需要進(jìn)一步的判斷:例如將前后兩天同一時(shí)刻的出現(xiàn)的熱詞進(jìn)行比較,若相同,則可認(rèn)為不一定是熱詞,很可能是常用詞,所以要去掉。從所述語(yǔ)料集合中提取熱詞集合可通過(guò)下述操作實(shí)現(xiàn):

1、將第一時(shí)間段內(nèi)的詞語(yǔ)集合與第二時(shí)間段內(nèi)的詞語(yǔ)集合進(jìn)行比較,所述第一時(shí)間段和所述第二時(shí)間段之間間隔至少一個(gè)預(yù)設(shè)時(shí)間段,所述第一時(shí)間段在所述第二時(shí)間段之后。該預(yù)設(shè)時(shí)間段可以是時(shí)刻、分鐘、小時(shí)、日或月為單位,具體本申請(qǐng)不作限定。其中,第一時(shí)間段和第二時(shí)間段都屬于所述統(tǒng)計(jì)時(shí)間內(nèi)的時(shí)間段。具體將這兩個(gè)時(shí)間段內(nèi)的詞語(yǔ)集合進(jìn)行比較可以直接比較詞語(yǔ)是否相同,或者詞語(yǔ)的語(yǔ)義是否相同,也可以將詞語(yǔ)集合轉(zhuǎn)換為其他計(jì)算機(jī)語(yǔ)言來(lái)進(jìn)行判斷,具體比較的方式本申請(qǐng)不作限定。

2、若所述第一時(shí)間段內(nèi)的詞語(yǔ)集合與所述第二時(shí)間段內(nèi)的詞語(yǔ)集合之間的相似度高于第一閾值,則將所述第一時(shí)間段內(nèi)的詞語(yǔ)集合從所述語(yǔ)料集合中去除,得到所述熱詞集合。其中,第一時(shí)間段屬于上述統(tǒng)計(jì)時(shí)間,第二時(shí)間段可以屬于上述統(tǒng)計(jì)時(shí)間,或者更早的統(tǒng)計(jì)時(shí)間。第一時(shí)間段的詞語(yǔ)集合屬于上述語(yǔ)料集合。

舉例來(lái)說(shuō),將今天下午2點(diǎn)至3點(diǎn)統(tǒng)計(jì)的詞語(yǔ)與昨天、前天,甚至更前的某一天或者某幾天中下午2點(diǎn)至3點(diǎn)統(tǒng)計(jì)的詞語(yǔ)進(jìn)行比較,若相似度較高,則可認(rèn)為不一定是熱詞,很可能是常用詞,所以要去掉今天下午2點(diǎn)至3點(diǎn)統(tǒng)計(jì)的這些詞語(yǔ)。

一些實(shí)施方式中,考慮到所統(tǒng)計(jì)的語(yǔ)料集合中存在噪聲數(shù)據(jù),熱詞主要受到下述因素的影響:

1、大盤影響:白天和凌晨、雙休日和工作日、節(jié)假日和平常日子,社交消息的整體數(shù)量都會(huì)有一個(gè)較大的波動(dòng)。

2、詞間影響:也許語(yǔ)料中某個(gè)段子突然非?;?,會(huì)導(dǎo)致一些平時(shí)關(guān)系不大的詞語(yǔ),一下子全部成為熱詞。

3、周期影響:24小時(shí)、星期、月份、節(jié)氣等周期性的變化,常常會(huì)使得“早安”、“周一”、“三月”等事件意義性不強(qiáng)的詞語(yǔ)成為熱詞。一些受歡迎的周播電視節(jié)目,也會(huì)使得相關(guān)詞語(yǔ)周期性地成為熱詞,這種熱詞對(duì)我們來(lái)說(shuō),是更有意義的。

4、自身趨勢(shì):這個(gè)就是我們最關(guān)心的熱度信息了。這些由于事件引起相關(guān)詞語(yǔ)的突發(fā)性、遞增性等的增長(zhǎng),就是我們算法想要識(shí)別和分析出來(lái)的。

影響熱詞的因素可由圖3所示的一種影響熱詞的框架示意圖來(lái)呈現(xiàn)。為簡(jiǎn)化計(jì)算,還可以對(duì)所述語(yǔ)料集合進(jìn)行去噪處理,所述去噪處理的方式包括以下方式中的至少一項(xiàng):文本去重、垃圾文本識(shí)別、語(yǔ)義分析、新詞發(fā)現(xiàn)或中文分詞。還有去除標(biāo)點(diǎn)符號(hào)、特殊字符等。

一些實(shí)施方式中,考慮到一個(gè)事件或新聞,會(huì)導(dǎo)致幾個(gè)相關(guān)的詞語(yǔ)都成為熱詞,造成信息冗余,還可以進(jìn)行冗余處理。例如可以基于詞語(yǔ)共現(xiàn)模型,去除所述語(yǔ)料集合中的冗余詞語(yǔ),從而進(jìn)一步篩選熱詞。其中,共現(xiàn)模型是指對(duì)于互為共現(xiàn)詞的熱詞的模型,例如一個(gè)事件或新聞,會(huì)導(dǎo)致幾個(gè)相關(guān)的詞語(yǔ)都成為熱詞,造成信息冗余。但這些詞語(yǔ)通過(guò)一些頻繁項(xiàng)集、文檔向量法(word2vector)等方法,都可以發(fā)現(xiàn)出共現(xiàn)詞語(yǔ)的關(guān)系。利用共現(xiàn)詞語(yǔ)的信息,可以對(duì)熱詞進(jìn)行一輪篩選,從而提取出最有熱度價(jià)值的熱詞,避免信息冗余。

203、基于信息熵從所述熱詞集合中提取候選熱詞組集合。

其中,候選熱詞組集合包括多個(gè)候選熱詞組。

信息熵是用來(lái)衡量一個(gè)隨機(jī)變量出現(xiàn)的期望值,一個(gè)變量的信息熵越大,表示其可能的出現(xiàn)的狀態(tài)越多,越不確定,也即信息量越大。信息熵可由下述公式(1)來(lái)定義:

其中,h為信息熵,其可表示每一事件發(fā)生時(shí)所傳達(dá)的信息量。

在提取候選熱詞組時(shí),需要枚舉每一個(gè)包含熱詞,且所包含的詞語(yǔ)數(shù)量在一定范圍內(nèi)的詞語(yǔ)組合。如設(shè)定詞語(yǔ)數(shù)量的上限為7,則語(yǔ)料中包含7個(gè)以及7個(gè)以下詞語(yǔ)的文本片段(詞組)都會(huì)被枚舉出來(lái)。然后,我們需要對(duì)這些詞組進(jìn)行分析,篩選出語(yǔ)法正確、語(yǔ)義連貫的詞組,這就是所謂的候選熱詞組提取。

204、基于候選熱詞組的熱度信息和候選熱詞組的權(quán)重值,從所述候選熱詞組集合中提取目標(biāo)熱詞組集合,將所述目標(biāo)熱詞組集合作為熱點(diǎn)話題集合。

與現(xiàn)有機(jī)制相比,本申請(qǐng)?zhí)峁┑姆桨钢?,在獲取待處理的語(yǔ)料集合后,根據(jù)所述語(yǔ)料集合中各詞語(yǔ)的熱度信息提取出熱詞集合,可見(jiàn),不需要基于訓(xùn)練數(shù)據(jù),就可以直接、快速、準(zhǔn)確的提取出連貫的候選熱詞組。基于信息熵從所述熱詞集合中提取候選熱詞組集合,由于目標(biāo)熱詞組集合是基于候選熱詞組的熱度信息和候選熱詞組的權(quán)重值從所述候選熱詞組集合中提取的,所以生成的目標(biāo)熱點(diǎn)話題集合的準(zhǔn)確度也較高。

可選的,在一些發(fā)明實(shí)施例中,計(jì)算所述語(yǔ)料集合中各詞語(yǔ)的熱度信息的具體過(guò)程可以包括下述操作:

1、計(jì)算統(tǒng)計(jì)時(shí)間內(nèi)第一詞語(yǔ)的理論梯度信息,得到所述語(yǔ)料集合中各詞語(yǔ)的理論梯度信息;所述統(tǒng)計(jì)時(shí)間包括至少兩個(gè)采樣時(shí)間,所述第一詞語(yǔ)為所述語(yǔ)料集合中的詞語(yǔ),所述理論梯度信息是指在一個(gè)所述采樣時(shí)間內(nèi)所述第一詞語(yǔ)出現(xiàn)的頻次與總頻次的比值,所述總頻次是指所述第一詞語(yǔ)在所述統(tǒng)計(jì)時(shí)間內(nèi)出現(xiàn)的頻次。一些實(shí)施方式中,可基于下述公式(2)計(jì)算出該理論梯度信息:

其中,wi表示某個(gè)詞語(yǔ),tj表示時(shí)間窗口,f(wi,tj)表示詞語(yǔ)wi在時(shí)間窗口tj的出現(xiàn)頻數(shù),f(wi,t1,t2,...,tj)表示詞語(yǔ)wi在時(shí)間窗口t1,t2,...,tj出現(xiàn)的總頻數(shù)。s(wi)表示某個(gè)詞語(yǔ)目前的梯度分?jǐn)?shù),也可稱為熱度分?jǐn)?shù)。

可見(jiàn),在熱詞提取流程中,某個(gè)詞語(yǔ)每出現(xiàn)一次,相當(dāng)于給詞語(yǔ)的熱度進(jìn)行了一次評(píng)分。

2、基于貝葉斯平均公式對(duì)所述語(yǔ)料集合中各詞語(yǔ)的理論梯度信息進(jìn)行修正,得到所述語(yǔ)料集合中各詞語(yǔ)的梯度信息。

其中,貝葉斯平均公式一種利用外部的已知信息,來(lái)評(píng)價(jià)更客觀地給出評(píng)價(jià)的平均分的方法。貝葉斯平均公式的典型應(yīng)用包括用戶投票排名,產(chǎn)品評(píng)分排序,廣告點(diǎn)擊率的平滑等等。以用戶投票評(píng)分排名為例,有以下公式:

其中,n為實(shí)際投票人數(shù);xi為每個(gè)人的投票分?jǐn)?shù);c是一個(gè)常數(shù),與樣本總體有關(guān),在用戶投票評(píng)分問(wèn)題中,為與數(shù)據(jù)集中待投票項(xiàng)目相關(guān)的常數(shù);m為先驗(yàn)已知的平均分。c越大,表示我們希望分?jǐn)?shù)的總體分布差距越小。

當(dāng)用戶投票評(píng)分的人很少,則算平均分很可能會(huì)出現(xiàn)不夠客觀的情況。這時(shí)引入外部信息c*m,假設(shè)還有一部分人(c人)投了票,并且都給了平均分saverage(m分)。把這些人的評(píng)分加入到已有用戶的評(píng)分中,再進(jìn)行求平均,可以對(duì)當(dāng)前的平均分進(jìn)行修正,得到x,以在某種程度上增加最終分?jǐn)?shù)x的客觀性。

由公式(3)推導(dǎo)可知,當(dāng)投票人數(shù)少的時(shí)候,分?jǐn)?shù)會(huì)趨向于平均分;投票人數(shù)越多,貝葉斯平均的結(jié)果就越接近真實(shí)投票的算術(shù)平均,加入的參數(shù)(c個(gè)人的saverage)對(duì)最終排名的影響就越小。

由上述貝葉斯平均公式可知,本申請(qǐng)也可以將貝葉斯平均公式用于修正計(jì)算公式(2)得到的s(wi),將各參數(shù)代入上述公式(3)中,可得到用于修正s(wi)的貝葉斯平均公式,如下公式(4)所示:

在熱詞提取流程中,可將上述公式(4)中的ms定義為所有詞語(yǔ)的s(wi)的平均分,可用saverage表示;cs定義為所有詞語(yǔ)一天詞頻的平均值,用faverage表示,設(shè)i為詞語(yǔ)總數(shù),j為考慮的總天數(shù),則:

對(duì)上述貝葉斯平均公式(3)進(jìn)行變換,可得到:

其中,公式(6)中的s'(wi)表示某個(gè)熱詞的平均熱度分?jǐn)?shù)。(s(wi)-saverage)表示某個(gè)詞語(yǔ)的熱度個(gè)性分?jǐn)?shù),則是表示熱度個(gè)性分?jǐn)?shù)的詞權(quán)重。

由此可見(jiàn),采用上述公式(2)、公式(4)-(6)能夠有效的識(shí)別出真正有熱度價(jià)值的熱詞,排除那些表象為熱詞的詞語(yǔ)。具體可從下述兩個(gè)方面來(lái)分析:

第一方面:當(dāng)某個(gè)詞語(yǔ)的詞頻少時(shí),則是代表對(duì)該詞語(yǔ)評(píng)分的人數(shù)少,那么對(duì)其評(píng)分的不確定性大。需要用平均分saverage來(lái)進(jìn)行修正、平滑。這里可以把一些詞頻很少的詞語(yǔ)的高分?jǐn)?shù)拉下來(lái),例如一個(gè)詞語(yǔ)今天出現(xiàn)了18次,昨天出現(xiàn)了6次,這里梯度分?jǐn)?shù)就比較高,為0.75,但這種詞語(yǔ)其實(shí)更可能不是一個(gè)熱詞。

從公式(6)層面上可以這么理解:如果某個(gè)詞語(yǔ)的詞頻特別小,遠(yuǎn)小于faverage,則制約其個(gè)性分?jǐn)?shù)(s(wi)-saverage)的詞權(quán)重值將接近于0,這時(shí),即使其原分?jǐn)?shù)s(wi)特別高,修正后的熱度分?jǐn)?shù)s'(wi)也接近算術(shù)平均分。這樣就篩掉了詞頻少,但數(shù)量變化比值大的詞語(yǔ)。

第二方面:當(dāng)某個(gè)詞語(yǔ)的詞頻高,甚至其詞頻遠(yuǎn)高于平均詞頻時(shí),則是代表對(duì)該詞語(yǔ)評(píng)分的人數(shù)多,那么對(duì)其的評(píng)分就會(huì)越趨于該詞語(yǔ)的實(shí)際評(píng)分。越趨于詞語(yǔ)自身的實(shí)際評(píng)分,則體現(xiàn)為引入的平均分saverage對(duì)該詞語(yǔ)的評(píng)分計(jì)算的影響變小,因此,對(duì)于詞頻越高的詞語(yǔ)而言,引入平均分saverage越能凸出其可能為熱詞的概率。例如一個(gè)本來(lái)是百萬(wàn)量級(jí)的詞語(yǔ),第二天也出現(xiàn)了一個(gè)三倍的增量,那么該詞語(yǔ)稱為熱詞的熱度價(jià)值就明顯提高。

從公式(6)層面上可以這么理解:如果某個(gè)詞語(yǔ)的詞頻特別大,詞權(quán)重接近于1,但這種詞往往是常用詞,原分?jǐn)?shù)s(wi)會(huì)接近于算術(shù)平均分,則個(gè)性分?jǐn)?shù)(s(wi)-saverage)也會(huì)很小,修正后的熱度分?jǐn)?shù)s'(wi)也接近算術(shù)平均分,也被篩掉。

顯然,根據(jù)上述公式(6)還可以獲知:當(dāng)詞語(yǔ)的熱度分?jǐn)?shù)s(wi)小于或等于當(dāng)天的平均熱度分?jǐn)?shù)saverage時(shí),可以判定該詞語(yǔ)肯定不是熱詞,直接將該詞語(yǔ)從語(yǔ)料集合中剔除即可。除此之外,還可以通過(guò)下述兩種方式來(lái)從語(yǔ)料集合中提取熱詞集合:

a、將各詞語(yǔ)的熱度分?jǐn)?shù)進(jìn)行排序,將排名前n位的詞語(yǔ)作為熱詞選入熱詞集合中,其中,n為正整數(shù)。

b、設(shè)定熱度分?jǐn)?shù)的門限值,將熱度分?jǐn)?shù)超過(guò)該門限值的詞語(yǔ)作為熱詞選入熱詞集合中。

可選的,在一些發(fā)明實(shí)施例中,所述基于信息熵從所述熱詞集合中提取候選熱詞組集合,包括:

1、計(jì)算所述熱詞集合中各熱詞之間的互信息、所述熱詞集合中各熱詞的左右信息熵。

其中,互信息是指兩個(gè)隨機(jī)變量x,y共享的信息量,也可以說(shuō),互信息代表知道了任意一個(gè)變量之后對(duì)另一個(gè)變量不確定性的減少,能夠表示兩個(gè)隨機(jī)變量之間的關(guān)系強(qiáng)弱?;谏鲜龉?1),互信息可以通過(guò)下述公式(7)來(lái)定義:

其中,p(x,y)表示聯(lián)合分布概率,即表示x和y同時(shí)出現(xiàn)的概率,p(x)、p(y)分別表示x、y出現(xiàn)的概率,p(x)p(y)表示假設(shè)x、y相互獨(dú)立的情況下二者共同出現(xiàn)的概率。

對(duì)上述公式(7)做變換可以得到下述公式(8)所表示的不確定度:

i(x;y)=h(y)-h(y|x)(8)

h(y)表示某個(gè)詞y的不確定度;h(y|x)表示在已知某個(gè)詞x的情況下,y的不確定度,h(y|x)稱為已知x時(shí),y的條件熵。

則可知i(x;y)表示由x引入而使y的不確定度減小的量。i(x;y)越大,說(shuō)明x出現(xiàn)后,y出現(xiàn)的不確定度減小,即y很可能也會(huì)出現(xiàn),也就是說(shuō)x、y關(guān)系越密切。反之亦然。

在提取候選熱詞組集合的過(guò)程中,若詞組的互信息值大,則說(shuō)明詞組中的詞語(yǔ)都傾向于共同出現(xiàn),即內(nèi)部聚合度高,那么詞組可以說(shuō)明一個(gè)特定問(wèn)題的可能性更大。

在實(shí)際應(yīng)用中,以“巴薩逆轉(zhuǎn)巴黎”為例,“巴薩”的出現(xiàn)使“逆轉(zhuǎn)巴黎”出現(xiàn)的不確定性減少,以及“巴薩逆轉(zhuǎn)(即x)”的出現(xiàn)使“巴黎(即y)”出現(xiàn)的不確定性減少是不一樣的。直觀看來(lái),前者的不確定性減少會(huì)更大;因?yàn)楹笳摺鞍屠琛钡南嚓P(guān)事件很多,例如“巴黎時(shí)裝周”“巴黎旅游”等等,可以組的詞組很多。而在這個(gè)例子中,前者更能說(shuō)明“巴薩逆轉(zhuǎn)巴黎”的內(nèi)部結(jié)合度。所以,我們選取使不確定性減少的程度最多的一種組合,來(lái)說(shuō)明詞組的內(nèi)部聚合度。

2、根據(jù)所述熱詞集合中各熱詞之間的互信息、所述熱詞集合中各熱詞組的左右信息熵以及熱詞出現(xiàn)的頻次確定多個(gè)候選熱詞組,得到所述候選熱詞組集合。

其中,左右信息熵可以表示詞組能夠成為語(yǔ)義相對(duì)獨(dú)立且完整的話題詞組的可能性,其可包括左信息熵和右信息熵。例如,若某個(gè)詞組的左右信息熵值越大,則表示該詞組左右兩側(cè)的字/詞搭配出現(xiàn)的語(yǔ)境越多,則其越有可能成為話題詞組。比如"超級(jí)月亮"這個(gè)詞組,因?yàn)樵撛~組右邊可以接的組合非常多,如“超級(jí)月亮真好看”,“超級(jí)月亮很難得”等等,所以其右信息熵值較大。如果一個(gè)詞組的左右信息熵越大,即該詞組所處語(yǔ)境的豐富程度越大,則其越有可能是一個(gè)可以獨(dú)立表達(dá)一個(gè)話題的詞組。

對(duì)于熱詞而言,熱詞的左右信息的可能情況越多,左右信息的搭配越豐富,則說(shuō)明這個(gè)熱詞在不同的語(yǔ)境里可討論的事情越多,越可能可以獨(dú)立說(shuō)明一個(gè)事件或話題。

可選的,計(jì)算上述候選熱詞組集合時(shí),還可考慮候選的熱詞的左/右/鄰詞語(yǔ)的個(gè)數(shù)等相關(guān)或類似特征。

可選的,在一些發(fā)明實(shí)施例中,從所述候選熱詞組集合中提取目標(biāo)熱詞組集合,包括下述1-3所述的操作:

1、根據(jù)第一候選熱詞組的熱度信息、包括所述第一候選熱詞組的語(yǔ)料數(shù)量以及所述候選熱度詞組集合中所有候選熱詞組的平均熱度信息,計(jì)算所述第一候選熱詞組的熱點(diǎn)話題能力信息。

其中,所述第一候選熱詞組是指所述候選熱詞組集合中的任一候選熱詞組,所述第一候選熱詞組的熱點(diǎn)話題能力信息是指所述第一候選熱詞組具備熱點(diǎn)話題的生成條件。

2、根據(jù)所述第一候選熱詞組的熱點(diǎn)話題能力信息確定所述第一候選熱詞組具備熱點(diǎn)話題的生成條件時(shí),將所述第一候選熱詞組作為目標(biāo)熱詞組,以得到包括至少一個(gè)目標(biāo)熱詞組的所述目標(biāo)熱詞組集合。

一些實(shí)施方式中,可定義所述第一候選熱詞組為熱詞wh的第一候選熱詞組s,那么熱詞wh中的第一候選熱詞組s的事件或話題表示能力分?jǐn)?shù)可由以下公式(8)求得:

其中,n為候選熱詞組中的詞語(yǔ)個(gè)數(shù)。wh表示熱詞,wi表示候選話題詞組中的詞語(yǔ)。corpus(w)表示含有詞語(yǔ)w的相關(guān)語(yǔ)料數(shù)量。hotscore(w)表示詞語(yǔ)w的熱度分?jǐn)?shù),hotscoreaver表示所有詞語(yǔ)的平均熱度分?jǐn)?shù)。本申請(qǐng)不對(duì)上述公式(8)進(jìn)行限定,可以在該公式(8)基礎(chǔ)上變形。

3、根據(jù)所述目標(biāo)熱詞組集合生成熱點(diǎn)話題,得到包括至少一個(gè)熱點(diǎn)話題的所述熱點(diǎn)話題集合,所述第一候選熱詞組對(duì)應(yīng)一個(gè)熱點(diǎn)話題。

舉例來(lái)說(shuō),對(duì)于某一個(gè)熱詞,挑選出來(lái)一批候選熱詞組后,每個(gè)詞組所含的詞語(yǔ)不同,包含的信息量也不同。比如3月9日對(duì)于“巴黎”這個(gè)熱詞,我們提取出來(lái)的候選熱詞組有“巴黎球迷”、“巴黎球員”、“淘汰巴黎”、“心疼巴黎”、“巴薩逆轉(zhuǎn)巴黎”、“法國(guó)巴黎”、“巴黎時(shí)裝周”。

但“巴薩球員”、“巴黎球迷”、“淘汰巴黎”、“心疼巴黎”、“法國(guó)巴黎”這些詞組中,“球員”、“球迷”、“淘汰”、“心疼”這些詞語(yǔ)在很多其他的語(yǔ)境中也經(jīng)常出現(xiàn),所以它們的指向性并不明確,可排除在外。尤其是“法國(guó)巴黎”的信息量甚至只有一個(gè)地點(diǎn),其不確定度更大。

而“巴薩逆轉(zhuǎn)巴黎”和“巴黎時(shí)裝周”則進(jìn)一步包含了更具體的信息,例如包括足球比賽、球隊(duì)、賽果、地點(diǎn)或者時(shí)裝秀等,可見(jiàn),“巴薩逆轉(zhuǎn)巴黎”和“巴黎時(shí)裝周”這兩者代表的事件的指向性更明確。所以,在能夠定位出真正的熱點(diǎn)話題,還需要進(jìn)一步對(duì)上述候選熱詞組集合進(jìn)行篩選,以篩選出目標(biāo)熱詞詞組,即重要詞語(yǔ)。

具體來(lái)說(shuō),篩選重要詞語(yǔ)時(shí),當(dāng)前的候選熱詞組集合中包括的各候選熱詞組可以有如圖4所示搭配結(jié)構(gòu)。其中,比如與“巴黎”的搭配,“巴薩”、“逆轉(zhuǎn)”、“時(shí)裝周”比“球迷”、“球員”、“心疼”、“法國(guó)”包含的信息更多,意義更大??梢韵氲?,“巴薩”、“逆轉(zhuǎn)”、“時(shí)裝周”這些詞語(yǔ)在其他無(wú)關(guān)語(yǔ)料中不常出現(xiàn),“球迷”、“球員”、“心疼”、“法國(guó)”在不同語(yǔ)料中都常會(huì)出現(xiàn),信息量相對(duì)較小。所以,在精篩熱點(diǎn)話題時(shí),可以通過(guò)tf-idf以及熱度信息來(lái)確定重要詞語(yǔ)。

其中,tf-idf是指tf乘以idf,idf相當(dāng)于該詞語(yǔ)的權(quán)重。tf-idf值相對(duì)于詞頻,對(duì)詞語(yǔ)的描述上有更合理的意義,比如某些詞語(yǔ)在文檔中出現(xiàn)了很多次,那么該詞語(yǔ)的tf就很大,但這些詞語(yǔ)在這個(gè)文檔集中又是普現(xiàn)的,因此對(duì)于區(qū)分熱詞并不會(huì)起很大的作用,idf就是用于解決這個(gè)問(wèn)題,給每個(gè)詞語(yǔ)的詞頻賦予權(quán)重,某個(gè)詞語(yǔ)在該文檔越集中越普現(xiàn),則idf值就越小。比如說(shuō)“巴黎”這個(gè)詞語(yǔ),由于其普遍性較高,指向性不明確,可以衍生出很多詞組,因此對(duì)于文檔相似度的貢獻(xiàn)或者說(shuō)影響力會(huì)比別的詞語(yǔ)大,但其實(shí)“巴黎”這個(gè)詞語(yǔ)對(duì)于熱詞的區(qū)分效果并不明顯,因此這個(gè)詞語(yǔ)應(yīng)該被賦予一個(gè)較低的權(quán)重值,來(lái)平衡其較高的詞頻帶來(lái)的負(fù)面影響。相反的,“巴薩”這一詞語(yǔ)的指向性較強(qiáng),根據(jù)該詞語(yǔ)很容易鎖定其所帶來(lái)的有熱度價(jià)值的信息量。

具體說(shuō)來(lái),就是衡量候選熱詞組集合中各候選熱詞組在候選熱詞組集合中的特異性。我們有理由相信,“巴薩”、“逆轉(zhuǎn)”、“時(shí)裝周”這些詞語(yǔ),在含“巴黎”的相關(guān)語(yǔ)料中出現(xiàn)的概率較高。另外還可以結(jié)合候選熱詞組中詞語(yǔ)的熱度情況來(lái)考慮,熱詞wh的候選熱詞組s的事件或話題表示能力分?jǐn)?shù)可由上述公式(8)得到。

可選的,在選擇作為熱點(diǎn)話題的目標(biāo)熱詞組時(shí),還可以進(jìn)一步考慮熱詞詞組出現(xiàn)的頻次,熱詞組出現(xiàn)的頻次越多,說(shuō)明該熱詞詞組定義的事件越重要,也就越有熱度價(jià)值。

最終,我們通過(guò)候選熱詞組的事件或話題表示能力分?jǐn)?shù)以及出現(xiàn)頻次,精篩出熱詞的相關(guān)話題。

舉例來(lái)說(shuō),利用本算法對(duì)社交文本進(jìn)行熱點(diǎn)話題提取,例如,2017年4月12日10點(diǎn)的熱度排名在前的熱點(diǎn)話題結(jié)果如下:昨晚杭州地震、美聯(lián)航事件、粵港澳大灣區(qū)概念、巴薩客場(chǎng)、吳世勛生日快樂(lè)、姐姐新婚快樂(lè)和夏目友人帳第六季等熱點(diǎn)話題,這些熱點(diǎn)話題的熱度從左至右,從高至低排列。

綜上所述,基于本申請(qǐng)所提供的獲取熱點(diǎn)話題的方法,能自動(dòng)從海量社交短文本中,挖掘出有熱度價(jià)值的熱點(diǎn)話題。不需要監(jiān)督數(shù)據(jù),算法復(fù)雜度較低,維護(hù)成本低,也不受語(yǔ)料變化影響。考慮了多方面的相關(guān)影響因素。且熱點(diǎn)話題可直接從語(yǔ)料集合中選取,其語(yǔ)法結(jié)構(gòu)更有保障。

上述各實(shí)施例中的語(yǔ)料集合、熱度信息、信息熵、候選熱詞組、候選熱詞組集合、目標(biāo)熱詞組集合、熱點(diǎn)話題集合、貝葉斯平均公式、第一時(shí)間段、第二時(shí)間段內(nèi)、詞語(yǔ)共現(xiàn)模型、互信息、左右信息熵和熱點(diǎn)話題能力信息等特征也同樣適用于本申請(qǐng)中的圖5-圖7所對(duì)應(yīng)的實(shí)施例,后續(xù)類似之處不再贅述。

以上對(duì)本申請(qǐng)中一種獲取熱點(diǎn)話題的方法進(jìn)行說(shuō)明,以下對(duì)執(zhí)行上述方法的用于獲取熱點(diǎn)話題的裝置進(jìn)行描述,該裝置可以是服務(wù)器,也可以是安裝于服務(wù)器的應(yīng)用,還可以是終端設(shè)備,或者可以是安裝于終端設(shè)備的應(yīng)用,該應(yīng)用可在服務(wù)器或者終端設(shè)備上運(yùn)行,當(dāng)其運(yùn)行時(shí),可執(zhí)行本申請(qǐng)圖1-圖4任一所對(duì)應(yīng)的實(shí)施例中的方案。

一、參照?qǐng)D5,對(duì)用于獲取熱點(diǎn)話題的裝置50進(jìn)行說(shuō)明,該裝置50可包括:

獲取模塊501,用于獲取待處理的語(yǔ)料集合,所述語(yǔ)料集合包括多個(gè)語(yǔ)料,每個(gè)語(yǔ)料包括多個(gè)詞語(yǔ),以及獲取所述語(yǔ)料集合中各詞語(yǔ)的熱度信息;

處理模塊502,用于根據(jù)所述獲取模塊501獲取的所述語(yǔ)料集合中各詞語(yǔ)的熱度信息,從所述語(yǔ)料集合中提取熱詞集合;基于信息熵從所述熱詞集合中提取候選熱詞組集合,所述候選熱詞組集合包括多個(gè)候選熱詞組;基于候選熱詞組的熱度信息和候選熱詞組的權(quán)重值,從所述候選熱詞組集合中提取目標(biāo)熱詞組集合,將所述目標(biāo)熱詞組集合作為熱點(diǎn)話題集合。

與現(xiàn)有機(jī)制相比,本發(fā)明實(shí)施例中,在獲取模塊501獲取待處理的語(yǔ)料集合后,處理模塊502根據(jù)所述語(yǔ)料集合中各詞語(yǔ)的熱度信息提取出熱詞集合,可見(jiàn),不需要基于訓(xùn)練數(shù)據(jù),就可以直接、快速、準(zhǔn)確的提取出連貫的候選熱詞組。基于信息熵從所述熱詞集合中提取候選熱詞組集合,由于目標(biāo)熱詞組集合是基于候選熱詞組的熱度信息和候選熱詞組的權(quán)重值從所述候選熱詞組集合中提取的,所以生成的目標(biāo)熱點(diǎn)話題集合的準(zhǔn)確度也較高。

可選的,在一些發(fā)明實(shí)施例中,所述處理模塊502具體用于:

將第一時(shí)間段內(nèi)的詞語(yǔ)集合與第二時(shí)間段內(nèi)的詞語(yǔ)集合進(jìn)行比較,所述第一時(shí)間段和所述第二時(shí)間段之間間隔至少一個(gè)預(yù)設(shè)時(shí)間段,所述第一時(shí)間段在所述第二時(shí)間段之后;

若所述第一時(shí)間段內(nèi)的詞語(yǔ)集合與所述第二時(shí)間段內(nèi)的詞語(yǔ)集合之間的相似度高于第一閾值,則將所述第一時(shí)間段內(nèi)的詞語(yǔ)集合從所述語(yǔ)料集合中去除,得到所述熱詞集合。其中,第一時(shí)間段和第二時(shí)間段都屬于同一個(gè)統(tǒng)計(jì)時(shí)間內(nèi)的時(shí)間段。

可選的,在一些發(fā)明實(shí)施例中,所述熱度信息包括詞語(yǔ)的梯度信息,所述處理模塊502獲取待處理的語(yǔ)料集合之后,根據(jù)所述語(yǔ)料集合中各詞語(yǔ)的熱度信息從所述語(yǔ)料集合中提取熱詞集合之前,還用于:

計(jì)算統(tǒng)計(jì)時(shí)間內(nèi)第一詞語(yǔ)的理論梯度信息,得到所述語(yǔ)料集合中各詞語(yǔ)的理論梯度信息;所述統(tǒng)計(jì)時(shí)間包括至少兩個(gè)采樣時(shí)間,所述第一詞語(yǔ)為所述語(yǔ)料集合中的詞語(yǔ),所述理論梯度信息是指在一個(gè)所述采樣時(shí)間內(nèi)所述第一詞語(yǔ)出現(xiàn)的頻次與總頻次的比值,所述總頻次是指所述第一詞語(yǔ)在所述統(tǒng)計(jì)時(shí)間內(nèi)出現(xiàn)的頻次。

基于貝葉斯平均公式對(duì)所述語(yǔ)料集合中各詞語(yǔ)的理論梯度信息進(jìn)行修正,得到所述語(yǔ)料集合中各詞語(yǔ)的梯度信息。

可選的,在一些發(fā)明實(shí)施例中,所述處理模塊502具體用于:

基于詞語(yǔ)共現(xiàn)模型,去除所述語(yǔ)料集合中的冗余詞語(yǔ)。

可選的,在一些發(fā)明實(shí)施例中,所述處理模塊502具體用于:

計(jì)算所述熱詞集合中各熱詞之間的互信息、所述熱詞集合中各熱詞的左右信息熵;

根據(jù)所述熱詞集合中各熱詞之間的互信息、所述熱詞集合中各熱詞的左右信息熵以及熱詞出現(xiàn)的頻次確定多個(gè)候選熱詞組,得到所述候選熱詞組集合。

可選的,在一些發(fā)明實(shí)施例中,所述處理模塊502具體用于:

對(duì)所述語(yǔ)料集合進(jìn)行去噪處理,所述去噪處理的方式包括以下方式中的至少一項(xiàng):

文本去重、垃圾文本識(shí)別、語(yǔ)義分析、新詞發(fā)現(xiàn)或中文分詞。

可選的,在一些發(fā)明實(shí)施例中,所述處理模塊502具體用于:

根據(jù)第一候選熱詞組的梯度信息、包括所述第一候選熱詞組的語(yǔ)料數(shù)量以及所述候選熱度詞組集合中所有候選熱詞組的平均梯度信息,計(jì)算所述第一候選熱詞組的熱點(diǎn)話題能力信息;所述第一候選熱詞組是指所述候選熱詞組集合中的任一候選熱詞組,所述第一候選熱詞組的熱點(diǎn)話題能力信息是指所述第一候選熱詞組具備熱點(diǎn)話題的生成條件。

根據(jù)所述第一候選熱詞組的熱點(diǎn)話題能力信息確定所述第一候選熱詞組具備熱點(diǎn)話題的生成條件時(shí),將所述第一候選熱詞組作為目標(biāo)熱詞組,以得到包括至少一個(gè)目標(biāo)熱詞組的所述目標(biāo)熱詞組集合。

根據(jù)所述目標(biāo)熱詞組集合生成熱點(diǎn)話題,得到包括至少一個(gè)熱點(diǎn)話題的所述熱點(diǎn)話題集合,所述第一候選熱詞組對(duì)應(yīng)一個(gè)熱點(diǎn)話題。

上面從模塊化功能實(shí)體的角度對(duì)本發(fā)明實(shí)施例中的用于獲取熱點(diǎn)話題的裝置進(jìn)行了描述,下面從硬件處理的角度分別對(duì)本發(fā)明實(shí)施例中的用于獲取熱點(diǎn)話題的裝置進(jìn)行描述。需要說(shuō)明的是,在本發(fā)明圖5所示的實(shí)施例中的獲取模塊對(duì)應(yīng)的實(shí)體設(shè)備可以為輸入/輸出單元,處理模塊對(duì)應(yīng)的實(shí)體設(shè)備可以為處理器。圖5所示的裝置可以具有如圖6所示的結(jié)構(gòu),當(dāng)圖5所示的裝置具有如圖6所示的結(jié)構(gòu)時(shí),圖6中的處理器、發(fā)射器和接收器能夠?qū)崿F(xiàn)前述對(duì)應(yīng)該裝置的裝置實(shí)施例提供的處理模塊、發(fā)送模塊和接收模塊相同或相似的功能,圖6中的中央存儲(chǔ)器存儲(chǔ)處理器執(zhí)行上述獲取熱點(diǎn)話題的方法時(shí)需要調(diào)用的程序代碼。

在本發(fā)明圖5所示的實(shí)施例中的獲取模塊所對(duì)應(yīng)的實(shí)體設(shè)備可以為輸入輸出接口,處理模塊對(duì)應(yīng)的實(shí)體設(shè)備可以為處理器。圖5所示的裝置可以具有如圖7所示的結(jié)構(gòu),當(dāng)圖5所示的裝置具有如圖7所示的結(jié)構(gòu)時(shí),圖7中的處理器和射頻(英文全稱:radiofrequency,英文簡(jiǎn)稱:rf)電路能夠?qū)崿F(xiàn)前述對(duì)應(yīng)該裝置的裝置實(shí)施例提供的處理模塊、發(fā)送模塊和接收模塊相同或相似的功能,圖7中的存儲(chǔ)器存儲(chǔ)處理器執(zhí)行上述獲取熱點(diǎn)話題的方法時(shí)需要調(diào)用的程序代碼。

圖6是本發(fā)明實(shí)施例提供的一種服務(wù)器結(jié)構(gòu)示意圖,該服務(wù)器600可因配置或性能不同而產(chǎn)生比較大的差異,可以包括一個(gè)或一個(gè)以上中央處理器(英文全稱:centralprocessingunits,英文簡(jiǎn)稱:cpu)622(例如,一個(gè)或一個(gè)以上處理器)和存儲(chǔ)器632,一個(gè)或一個(gè)以上存儲(chǔ)應(yīng)用程序642或數(shù)據(jù)644的存儲(chǔ)介質(zhì)630(例如一個(gè)或一個(gè)以上海量存儲(chǔ)設(shè)備)。其中,存儲(chǔ)器632和存儲(chǔ)介質(zhì)630可以是短暫存儲(chǔ)或持久存儲(chǔ)。存儲(chǔ)在存儲(chǔ)介質(zhì)630的程序可以包括一個(gè)或一個(gè)以上模塊(圖示沒(méi)標(biāo)出),每個(gè)模塊可以包括對(duì)服務(wù)器中的一系列指令操作。更進(jìn)一步地,中央處理器622可以設(shè)置為與存儲(chǔ)介質(zhì)630通信,在服務(wù)器600上執(zhí)行存儲(chǔ)介質(zhì)630中的一系列指令操作。

服務(wù)器600還可以包括一個(gè)或一個(gè)以上電源626,一個(gè)或一個(gè)以上有線或無(wú)線網(wǎng)絡(luò)接口650,一個(gè)或一個(gè)以上輸入輸出接口658,和/或,一個(gè)或一個(gè)以上操作系統(tǒng)641,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm等等。

上述實(shí)施例中由服務(wù)器所執(zhí)行的步驟可以基于該圖6所示的服務(wù)器結(jié)構(gòu)。

本發(fā)明實(shí)施例還提供了另一種終端設(shè)備,如圖7所示,為了便于說(shuō)明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分,具體技術(shù)細(xì)節(jié)未揭示的,請(qǐng)參照本發(fā)明實(shí)施例方法部分。該終端設(shè)備可以為包括手機(jī)、平板電腦、個(gè)人數(shù)字助理(英文全稱:personaldigitalassistant,英文簡(jiǎn)稱:pda)、銷售終端(英文全稱:pointofsales,英文簡(jiǎn)稱:pos)、車載電腦等任意終端設(shè)備,以終端為手機(jī)為例:

圖7示出的是與本發(fā)明實(shí)施例提供的終端設(shè)備相關(guān)的手機(jī)的部分結(jié)構(gòu)的框圖。參考圖7,手機(jī)包括:rf電路78、存儲(chǔ)器720、輸入單元730、顯示單元740、傳感器750、音頻電路750、無(wú)線保真(英文全稱:wirelessfidelity,英文簡(jiǎn)稱:wifi)模塊770、處理器780、以及電源790等部件。本領(lǐng)域技術(shù)人員可以理解,圖7中示出的手機(jī)結(jié)構(gòu)并不構(gòu)成對(duì)手機(jī)的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。

下面結(jié)合圖7對(duì)手機(jī)的各個(gè)構(gòu)成部件進(jìn)行具體的介紹:

rf電路78可用于收發(fā)信息或通話過(guò)程中,信號(hào)的接收和發(fā)送,特別地,將基站的下行信息接收后,給處理器780處理;另外,將設(shè)計(jì)上行的數(shù)據(jù)發(fā)送給基站。通常,rf電路78包括但不限于天線、至少一個(gè)放大器、收發(fā)信機(jī)、耦合器、低噪聲放大器(英文全稱:lownoiseamplifier,英文簡(jiǎn)稱:lna)、雙工器等。此外,rf電路78還可以通過(guò)無(wú)線通信與網(wǎng)絡(luò)和其他設(shè)備通信。上述無(wú)線通信可以使用任一通信標(biāo)準(zhǔn)或協(xié)議,包括但不限于全球移動(dòng)通訊系統(tǒng)(英文全稱:globalsystemofmobilecommunication,英文簡(jiǎn)稱:gsm)、通用分組無(wú)線服務(wù)(英文全稱:generalpacketradioservice,英文簡(jiǎn)稱:gprs)、碼分多址(英文全稱:codedivisionmultipleaccess,英文簡(jiǎn)稱:cdma)、寬帶碼分多址(英文全稱:widebandcodedivisionmultipleaccess,英文簡(jiǎn)稱:wcdma)、長(zhǎng)期演進(jìn)(英文全稱:longtermevolution,英文簡(jiǎn)稱:lte)、電子郵件、短消息服務(wù)(英文全稱:shortmessagingservice,英文簡(jiǎn)稱:sms)等。

存儲(chǔ)器720可用于存儲(chǔ)軟件程序以及模塊,處理器780通過(guò)運(yùn)行存儲(chǔ)在存儲(chǔ)器720的軟件程序以及模塊,從而執(zhí)行手機(jī)的各種功能應(yīng)用以及數(shù)據(jù)處理。存儲(chǔ)器720可主要包括存儲(chǔ)程序區(qū)和存儲(chǔ)數(shù)據(jù)區(qū),其中,存儲(chǔ)程序區(qū)可存儲(chǔ)操作系統(tǒng)、至少一個(gè)功能所需的應(yīng)用程序(比如聲音播放功能、圖像播放功能等)等;存儲(chǔ)數(shù)據(jù)區(qū)可存儲(chǔ)根據(jù)手機(jī)的使用所創(chuàng)建的數(shù)據(jù)(比如音頻數(shù)據(jù)、電話本等)等。此外,存儲(chǔ)器720可以包括高速隨機(jī)存取存儲(chǔ)器,還可以包括非易失性存儲(chǔ)器,例如至少一個(gè)磁盤存儲(chǔ)器件、閃存器件、或其他易失性固態(tài)存儲(chǔ)器件。

輸入單元730可用于接收輸入的數(shù)字或字符信息,以及產(chǎn)生與手機(jī)的用戶設(shè)置以及功能控制有關(guān)的鍵信號(hào)輸入。具體地,輸入單元730可包括觸控面板731以及其他輸入設(shè)備732。觸控面板731,也稱為觸摸屏,可收集用戶在其上或附近的觸摸操作(比如用戶使用手指、觸筆等任何適合的物體或附件在觸控面板731上或在觸控面板731附近的操作),并根據(jù)預(yù)先設(shè)定的程式驅(qū)動(dòng)相應(yīng)的連接裝置??蛇x的,觸控面板731可包括觸摸檢測(cè)裝置和觸摸控制器兩個(gè)部分。其中,觸摸檢測(cè)裝置檢測(cè)用戶的觸摸方位,并檢測(cè)觸摸操作帶來(lái)的信號(hào),將信號(hào)傳送給觸摸控制器;觸摸控制器從觸摸檢測(cè)裝置上接收觸摸信息,并將它轉(zhuǎn)換成觸點(diǎn)坐標(biāo),再送給處理器780,并能接收處理器780發(fā)來(lái)的命令并加以執(zhí)行。此外,可以采用電阻式、電容式、紅外線以及表面聲波等多種類型實(shí)現(xiàn)觸控面板731。除了觸控面板731,輸入單元730還可以包括其他輸入設(shè)備732。具體地,其他輸入設(shè)備732可以包括但不限于物理鍵盤、功能鍵(比如音量控制按鍵、開(kāi)關(guān)按鍵等)、軌跡球、鼠標(biāo)、操作桿等中的一種或多種。

顯示單元740可用于顯示由用戶輸入的信息或提供給用戶的信息以及手機(jī)的各種菜單。顯示單元740可包括顯示面板741,可選的,可以采用液晶顯示器(英文全稱:liquidcrystaldisplay,英文簡(jiǎn)稱:lcd)、有機(jī)發(fā)光二極管(英文全稱:organiclight-emittingdiode,英文簡(jiǎn)稱:oled)等形式來(lái)配置顯示面板741。進(jìn)一步的,觸控面板731可覆蓋顯示面板741,當(dāng)觸控面板731檢測(cè)到在其上或附近的觸摸操作后,傳送給處理器780以確定觸摸事件的類型,隨后處理器780根據(jù)觸摸事件的類型在顯示面板741上提供相應(yīng)的視覺(jué)輸出。雖然在圖7中,觸控面板731與顯示面板741是作為兩個(gè)獨(dú)立的部件來(lái)實(shí)現(xiàn)手機(jī)的輸入和輸入功能,但是在某些實(shí)施例中,可以將觸控面板731與顯示面板741集成而實(shí)現(xiàn)手機(jī)的輸入和輸出功能。

手機(jī)還可包括至少一種傳感器750,比如光傳感器、運(yùn)動(dòng)傳感器以及其他傳感器。具體地,光傳感器可包括環(huán)境光傳感器及接近傳感器,其中,環(huán)境光傳感器可根據(jù)環(huán)境光線的明暗來(lái)調(diào)節(jié)顯示面板741的亮度,接近傳感器可在手機(jī)移動(dòng)到耳邊時(shí),關(guān)閉顯示面板741和/或背光。作為運(yùn)動(dòng)傳感器的一種,加速計(jì)傳感器可檢測(cè)各個(gè)方向上(一般為三軸)加速度的大小,靜止時(shí)可檢測(cè)出重力的大小及方向,可用于識(shí)別手機(jī)姿態(tài)的應(yīng)用(比如橫豎屏切換、相關(guān)游戲、磁力計(jì)姿態(tài)校準(zhǔn))、振動(dòng)識(shí)別相關(guān)功能(比如計(jì)步器、敲擊)等;至于手機(jī)還可配置的陀螺儀、氣壓計(jì)、濕度計(jì)、溫度計(jì)、紅外線傳感器等其他傳感器,在此不再贅述。

音頻電路760、揚(yáng)聲器761,傳聲器762可提供用戶與手機(jī)之間的音頻接口。音頻電路760可將接收到的音頻數(shù)據(jù)轉(zhuǎn)換后的電信號(hào),傳輸?shù)綋P(yáng)聲器761,由揚(yáng)聲器761轉(zhuǎn)換為聲音信號(hào)輸出;另一方面,傳聲器762將收集的聲音信號(hào)轉(zhuǎn)換為電信號(hào),由音頻電路760接收后轉(zhuǎn)換為音頻數(shù)據(jù),再將音頻數(shù)據(jù)輸出處理器780處理后,經(jīng)rf電路78以發(fā)送給比如另一手機(jī),或者將音頻數(shù)據(jù)輸出至存儲(chǔ)器720以便進(jìn)一步處理。

wifi屬于短距離無(wú)線傳輸技術(shù),手機(jī)通過(guò)wifi模塊770可以幫助用戶收發(fā)電子郵件、瀏覽網(wǎng)頁(yè)和訪問(wèn)流式媒體等,它為用戶提供了無(wú)線的寬帶互聯(lián)網(wǎng)訪問(wèn)。雖然圖7示出了wifi模塊770,但是可以理解的是,其并不屬于手機(jī)的必須構(gòu)成,完全可以根據(jù)需要在不改變發(fā)明的本質(zhì)的范圍內(nèi)而省略。

處理器780是手機(jī)的控制中心,利用各種接口和線路連接整個(gè)手機(jī)的各個(gè)部分,通過(guò)運(yùn)行或執(zhí)行存儲(chǔ)在存儲(chǔ)器720內(nèi)的軟件程序和/或模塊,以及調(diào)用存儲(chǔ)在存儲(chǔ)器720內(nèi)的數(shù)據(jù),執(zhí)行手機(jī)的各種功能和處理數(shù)據(jù),從而對(duì)手機(jī)進(jìn)行整體監(jiān)控??蛇x的,處理器780可包括一個(gè)或多個(gè)處理單元;優(yōu)選的,處理器780可集成應(yīng)用處理器和調(diào)制解調(diào)處理器,其中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶界面和應(yīng)用程序等,調(diào)制解調(diào)處理器主要處理無(wú)線通信??梢岳斫獾氖?,上述調(diào)制解調(diào)處理器也可以不集成到處理器780中。

手機(jī)還包括給各個(gè)部件供電的電源790(比如電池),優(yōu)選的,電源可以通過(guò)電源管理系統(tǒng)與處理器780邏輯相連,從而通過(guò)電源管理系統(tǒng)實(shí)現(xiàn)管理充電、放電、以及功耗管理等功能。

盡管未示出,手機(jī)還可以包括攝像頭、藍(lán)牙模塊等,在此不再贅述。

在本發(fā)明實(shí)施例中,該手機(jī)所包括的處理器780還具有控制執(zhí)行以上由終端設(shè)備執(zhí)行的方法流程。

在上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒(méi)有詳述的部分,可以參見(jiàn)其他實(shí)施例的相關(guān)描述。

所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的系統(tǒng),裝置和模塊的具體工作過(guò)程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過(guò)程,在此不再贅述。

在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過(guò)其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述模塊的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)模塊或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過(guò)一些接口,裝置或模塊的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。

所述作為分離部件說(shuō)明的模塊可以是或者也可以不是物理上分開(kāi)的,作為模塊顯示的部件可以是或者也可以不是物理模塊,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)模塊上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部模塊來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。

另外,在本申請(qǐng)各個(gè)實(shí)施例中的各功能模塊可以集成在一個(gè)處理模塊中,也可以是各個(gè)模塊單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上模塊集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。

在上述實(shí)施例中,可以全部或部分地通過(guò)軟件、硬件、固件或者其任意組合來(lái)實(shí)現(xiàn)。當(dāng)使用軟件實(shí)現(xiàn)時(shí),可以全部或部分地以計(jì)算機(jī)程序產(chǎn)品的形式實(shí)現(xiàn)。

所述計(jì)算機(jī)程序產(chǎn)品包括一個(gè)或多個(gè)計(jì)算機(jī)指令。在計(jì)算機(jī)上加載和執(zhí)行所述計(jì)算機(jī)程序指令時(shí),全部或部分地產(chǎn)生按照本發(fā)明實(shí)施例所述的流程或功能。所述計(jì)算機(jī)可以是通用計(jì)算機(jī)、專用計(jì)算機(jī)、計(jì)算機(jī)網(wǎng)絡(luò)、或者其他可編程裝置。所述計(jì)算機(jī)指令可以存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,或者從一個(gè)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)向另一計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)傳輸,例如,所述計(jì)算機(jī)指令可以從一個(gè)網(wǎng)站站點(diǎn)、計(jì)算機(jī)、服務(wù)器或數(shù)據(jù)中心通過(guò)有線(例如同軸電纜、光纖、數(shù)字用戶線(dsl))或無(wú)線(例如紅外、無(wú)線、微波等)方式向另一個(gè)網(wǎng)站站點(diǎn)、計(jì)算機(jī)、服務(wù)器或數(shù)據(jù)中心進(jìn)行傳輸。所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是計(jì)算機(jī)能夠存儲(chǔ)的任何可用介質(zhì)或者是包含一個(gè)或多個(gè)可用介質(zhì)集成的服務(wù)器、數(shù)據(jù)中心等數(shù)據(jù)存儲(chǔ)設(shè)備。所述可用介質(zhì)可以是磁性介質(zhì),(例如,軟盤、硬盤、磁帶)、光介質(zhì)(例如,dvd)、或者半導(dǎo)體介質(zhì)(例如固態(tài)硬盤solidstatedisk(ssd))等。

以上對(duì)本申請(qǐng)所提供的技術(shù)方案進(jìn)行了詳細(xì)介紹,本申請(qǐng)中應(yīng)用了具體個(gè)例對(duì)本申請(qǐng)的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本申請(qǐng)的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請(qǐng)的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書內(nèi)容不應(yīng)理解為對(duì)本申請(qǐng)的限制。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
郑州市| 莱芜市| 红桥区| 寿光市| 洱源县| 蒲城县| 奉新县| 玉山县| 灵宝市| 凤翔县| 酒泉市| 塔城市| 竹北市| 龙江县| 罗平县| 灌阳县| 凤翔县| 宁强县| 贵州省| 水富县| 射阳县| 汉沽区| 如皋市| 灌云县| 沁源县| 康乐县| 天峻县| 日喀则市| 太康县| 喀喇沁旗| 登封市| 射阳县| 保山市| 凌源市| 唐河县| 澜沧| 邻水| 应城市| 靖宇县| 鄂温| 尉氏县|