本發(fā)明涉及數(shù)據(jù)搜索技術(shù)領(lǐng)域,特別是涉及一種專題信息獲取方法及裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)與物聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)更加智能化,網(wǎng)絡(luò)的數(shù)據(jù)量也呈現(xiàn)爆炸的趨勢。
用戶在搜索某個(gè)原始信息的專題信息(專題信息即相關(guān)性高的信息)時(shí),通常會人為的從該原始信息中找到某一個(gè)關(guān)鍵詞,并根據(jù)該關(guān)鍵詞在網(wǎng)絡(luò)上進(jìn)行搜索,得到搜索信息,這些搜索信息數(shù)量巨大而且多樣性,用戶不能方便的從這些搜索信息中查找到與原始信息相關(guān)性高的信息。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于,提供一種專題信息獲取方法及裝置,以方便的獲取到與原始信息相關(guān)性高的信息。
為達(dá)到上述目的,本發(fā)明實(shí)施例提供了一種專題信息獲取方法,所述方法包括:
獲得第一信息;
從所述第一信息中獲取至少一個(gè)目標(biāo)關(guān)鍵詞;
在數(shù)據(jù)庫中搜索包含所有所述目標(biāo)關(guān)鍵詞的第二信息,根據(jù)所述第二信息確定所述第一信息的專題信息。
較優(yōu)地,在所述從所述第一信息中獲取至少一個(gè)目標(biāo)關(guān)鍵詞之后,所述方法還包括:
計(jì)算每個(gè)所述目標(biāo)關(guān)鍵詞在所述第一信息中的第一權(quán)值;
所述根據(jù)所述第二信息確定所述第一信息的專題信息,包括:
計(jì)算每個(gè)所述目標(biāo)關(guān)鍵詞在所述第二信息中的第二權(quán)值;
比較每個(gè)所述目標(biāo)關(guān)鍵詞的第二權(quán)值與該目標(biāo)關(guān)鍵詞的第一權(quán)值,根據(jù)比較結(jié)果,從所述第二信息中確定所述第一信息的專題信息。
較優(yōu)地,所述從所述第一信息中獲取至少一個(gè)目標(biāo)關(guān)鍵詞,包括:
對所述第一信息進(jìn)行分詞處理和停用詞過濾處理,得到第一數(shù)量個(gè)第一關(guān)鍵詞;
統(tǒng)計(jì)各個(gè)所述第一關(guān)鍵詞在所述第一信息中出現(xiàn)的第一次數(shù);
按照所述第一次數(shù)的大小,對所述第一關(guān)鍵詞進(jìn)行降序排列形成隊(duì)列;
將所述隊(duì)列中前至少一個(gè)所述第一關(guān)鍵詞確定為所述目標(biāo)關(guān)鍵詞。
較優(yōu)地,所述計(jì)算每個(gè)所述目標(biāo)關(guān)鍵詞在所述第一信息中的第一權(quán)值,包括:
根據(jù)第一總次數(shù)以及每個(gè)所述目標(biāo)關(guān)鍵詞的第一次數(shù),計(jì)算該目標(biāo)關(guān)鍵詞在所述第一信息中的第一權(quán)值;其中,所述第一總次數(shù)為所有所述第一關(guān)鍵詞的第一次數(shù)的和。
較優(yōu)地,所述計(jì)算每個(gè)所述目標(biāo)關(guān)鍵詞在所述第二信息中的第二權(quán)值,包括:
按照以下方式計(jì)算每個(gè)所述目標(biāo)關(guān)鍵詞在每一所述第二信息中的第二權(quán)值:
對目標(biāo)第二信息進(jìn)行分詞處理和停用詞過濾處理,得到第二數(shù)量個(gè)第二關(guān)鍵詞,其中,所述目標(biāo)第二信息為任一所述第二信息;
統(tǒng)計(jì)各個(gè)第二關(guān)鍵詞在所述目標(biāo)第二信息中出現(xiàn)的第二次數(shù);
根據(jù)每個(gè)所述目標(biāo)關(guān)鍵詞的第二次數(shù)與第二總次數(shù)計(jì)算該目標(biāo)關(guān)鍵詞在所述目標(biāo)第二信息中的第二權(quán)值;其中,所述第二總次數(shù)為所述目標(biāo)第二信息中所有第二關(guān)鍵詞的第二次數(shù)的和。
較優(yōu)地,所述比較每個(gè)所述目標(biāo)關(guān)鍵詞的第二權(quán)值與該目標(biāo)關(guān)鍵詞的第一權(quán)值,根據(jù)比較結(jié)果,從所述第二信息中確定所述第一信息的專題信息,包括:
按照以下方式判斷每一所述第二信息是否為所述第一信息的專題信息:
基于每個(gè)所述目標(biāo)關(guān)鍵詞在所述目標(biāo)第二信息中的第二權(quán)值與該目標(biāo)關(guān)鍵詞的第一權(quán)值,計(jì)算該目標(biāo)關(guān)鍵詞對應(yīng)的第一差距;
判斷每個(gè)所述目標(biāo)關(guān)鍵詞對應(yīng)的第一差距是否小于該目標(biāo)關(guān)鍵詞對應(yīng)的預(yù)設(shè)差距;
如果是,將該目標(biāo)關(guān)鍵詞對應(yīng)的第一差距標(biāo)記為合理差距;
如果否,將該目標(biāo)關(guān)鍵詞對應(yīng)的第一差距標(biāo)記為不合理差距;
如果所有所述目標(biāo)關(guān)鍵詞對應(yīng)的第一差距均為合理差距,則將所述目標(biāo)第二信息作為所述第一信息的專題信息;反之,則不能將所述目標(biāo)第二信息作為所述第一信息的專題信息。
較優(yōu)地,所述方法還包括:
對所述專題信息進(jìn)行存儲;
建立所有所述目標(biāo)關(guān)鍵詞與所述專題信息的鏈接;
將所有所述目標(biāo)關(guān)鍵詞以及每個(gè)所述目標(biāo)關(guān)鍵詞對應(yīng)的鏈接發(fā)送給客戶端,使所述客戶端對所有所述目標(biāo)關(guān)鍵詞與所述第一信息進(jìn)行顯示。
本發(fā)明實(shí)施例還提供了一種專題信息獲取裝置,所述裝置包括:
第一信息獲取模塊,用于獲得第一信息;
目標(biāo)關(guān)鍵詞獲取模塊,用于從所述第一信息中獲取至少一個(gè)目標(biāo)關(guān)鍵詞;
專題信息確定模塊,用于在數(shù)據(jù)庫中搜索包含所有所述目標(biāo)關(guān)鍵詞的第二信息,根據(jù)所述第二信息確定所述第一信息的專題信息。
較優(yōu)地,所述裝置還包括:
第一權(quán)值計(jì)算模塊,用于計(jì)算每個(gè)所述目標(biāo)關(guān)鍵詞在所述第一信息中的第一權(quán)值;
所述專題信息確定模塊,包括:
第二權(quán)值計(jì)算單元,用于計(jì)算每個(gè)所述目標(biāo)關(guān)鍵詞在所述第二信息中的第二權(quán)值;
權(quán)值比較單元,用于比較每個(gè)所述目標(biāo)關(guān)鍵詞的第二權(quán)值與該目標(biāo)關(guān)鍵詞的第一權(quán)值,根據(jù)比較結(jié)果,從所述第二信息中確定所述第一信息的專題信息。
較優(yōu)地,所述目標(biāo)關(guān)鍵詞獲取模塊,包括:
第一關(guān)鍵詞獲取單元,用于對所述第一信息進(jìn)行分詞處理和停用詞過濾處理,得到第一數(shù)量個(gè)第一關(guān)鍵詞;
第一次數(shù)統(tǒng)計(jì)單元,用于統(tǒng)計(jì)各個(gè)所述第一關(guān)鍵詞在所述第一信息中出現(xiàn)的第一次數(shù);
降序排列單元,用于按照所述第一次數(shù)的大小,對所述第一關(guān)鍵詞進(jìn)行降序排列形成隊(duì)列;
目標(biāo)關(guān)鍵詞確定單元,用于將所述隊(duì)列中前至少一個(gè)所述第一關(guān)鍵詞確定為所述目標(biāo)關(guān)鍵詞。
本發(fā)明實(shí)施例提供的專題信息獲取方法及裝置,通過對第一信息進(jìn)行處理得到至少一個(gè)目標(biāo)關(guān)鍵詞,在從數(shù)據(jù)庫中搜索包含所有目標(biāo)關(guān)鍵詞的第二信息,最終可根據(jù)搜索到的第二信號獲取與第一信息相關(guān)性高的專題信息。由以上可見,本發(fā)明實(shí)施例提供的方案中采用數(shù)據(jù)庫與至少一個(gè)目標(biāo)關(guān)鍵詞相結(jié)合的形式獲得與第一信息相關(guān)性高的專題信息,而無需再在大量的網(wǎng)絡(luò)信息中進(jìn)行搜索,且獲得第一信息相關(guān)性高的信息時(shí)考慮的關(guān)鍵詞多,因此能夠方便的獲得與第一信息相關(guān)性高的信息。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例提供的專題信息獲取方法的流程圖;
圖2為本發(fā)明實(shí)施例提供的專題信息獲取裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
實(shí)施例一
如圖1所示,為本發(fā)明實(shí)施例提供的專題信息獲取方法的流程圖,應(yīng)用于服務(wù)器,所述方法包括:
S110,獲得第一信息。
具體地,第一信息可以為短語、句子或文章等。本實(shí)施中,第一信息可通過以下方式獲得:一、客服端向服務(wù)器發(fā)送第一信息;二、通過網(wǎng)絡(luò)爬蟲從網(wǎng)絡(luò)上爬取得到第一信息。
S120,從所述第一信息中獲取至少一個(gè)目標(biāo)關(guān)鍵詞。
優(yōu)選地,步驟S120可包括如下步驟:
A1、對所述第一信息進(jìn)行分詞處理和停用詞過濾處理,得到第一數(shù)量個(gè)第一關(guān)鍵詞。
具體地,分詞處理和停用詞過濾處理的具體實(shí)現(xiàn)過程均為現(xiàn)有技術(shù),此處不在贅述。
定義第一關(guān)鍵詞,為對第一信息進(jìn)行處理后得到的關(guān)鍵詞。例如,設(shè)第一信息為“小明出生在北京”,得到的第一關(guān)鍵詞可以為“小明”、“出生”和“北京”。
定義第一數(shù)量為所有第一關(guān)鍵詞的個(gè)數(shù),例如,第一關(guān)鍵詞“小明”、“出生”和“北京”的第一數(shù)量為3。
A2、統(tǒng)計(jì)各個(gè)所述第一關(guān)鍵詞在所述第一信息中出現(xiàn)的第一次數(shù)。
具體地,在第一信息中(如篇幅較大的文章),可能會存在某個(gè)第一關(guān)鍵詞多次出現(xiàn)的情況,定義第一次數(shù)為第一關(guān)鍵詞在第一信息中出現(xiàn)的次數(shù)。第一次數(shù)的統(tǒng)計(jì)方法,可利用遍歷算法實(shí)現(xiàn),此為現(xiàn)有技術(shù)。
A3、按照所述第一次數(shù)的大小,對所述第一關(guān)鍵詞進(jìn)行降序排列形成隊(duì)列。
A4、將所述隊(duì)列中前至少一個(gè)所述第一關(guān)鍵詞確定為所述目標(biāo)關(guān)鍵詞。
具體地,按照所有第一關(guān)鍵詞的第一次數(shù)的大小進(jìn)行降序排列,出現(xiàn)次數(shù)較多的第一關(guān)鍵詞會位于隊(duì)列的前面,說明這些第一關(guān)鍵詞在第一信息中的重要性較高,將前幾個(gè)(如前3個(gè))第一關(guān)鍵詞作為目標(biāo)關(guān)鍵詞,說明該第一信息可以通過這幾個(gè)目標(biāo)關(guān)鍵詞進(jìn)行標(biāo)識。
S130,在數(shù)據(jù)庫中搜索包含所有所述目標(biāo)關(guān)鍵詞的第二信息,根據(jù)所述第二信息確定所述第一信息的專題信息。
具體地,數(shù)據(jù)庫可以為本地?cái)?shù)據(jù)庫、云數(shù)據(jù)庫或網(wǎng)絡(luò)數(shù)據(jù)庫等。本實(shí)施例中,定義第二信息為包含所有目標(biāo)關(guān)鍵詞的信息,即根據(jù)第一信息得到幾個(gè)目標(biāo)關(guān)鍵詞,要求第二信息必須包含所有的目標(biāo)關(guān)鍵詞,第二信息可以為短語、句子或文章等。本實(shí)施例中,目標(biāo)關(guān)鍵詞表征了第一信息和第二信息的相關(guān)性,目標(biāo)關(guān)鍵詞越多,二者的相關(guān)性越高。
第二信息的獲取方法,可根據(jù)逐層篩選的方法得到。例如,先從數(shù)據(jù)庫篩選包含一個(gè)目標(biāo)關(guān)鍵詞的信息集合,再從該信息集合中篩選包含另外一個(gè)目標(biāo)關(guān)鍵詞的信息,以此逐層篩選。
本實(shí)施例中,根據(jù)第二信息確定第一信息的專題信息的方式可分為兩種:一、由于獲取的每個(gè)第二信息中均包含第一信息中所有的目標(biāo)關(guān)鍵詞,二者的相關(guān)性較強(qiáng),則可將所有第二信息作為第一信息的專題信息;二、還可根據(jù)目標(biāo)關(guān)鍵詞在第一信息和第二信息中的權(quán)值,從所有的第二信息中選擇相關(guān)性更高的第二信息作為第一信息的專題信息。
本發(fā)明實(shí)施例提供的專題信息獲取方法,通過對第一信息進(jìn)行處理得到至少一個(gè)目標(biāo)關(guān)鍵詞,在從數(shù)據(jù)庫中搜索包含所有目標(biāo)關(guān)鍵詞的第二信息,最終可根據(jù)搜索到的第二信號獲取與第一信息相關(guān)性高的專題信息。由以上可見,本發(fā)明實(shí)施例提供的方案中采用數(shù)據(jù)庫與至少一個(gè)目標(biāo)關(guān)鍵詞相結(jié)合的形式獲得與第一信息相關(guān)性高的專題信息,而無需再在大量的網(wǎng)絡(luò)信息中進(jìn)行搜索,且獲得第一信息相關(guān)性高的信息時(shí)考慮的關(guān)鍵詞多,因此能夠方便的獲得與第一信息相關(guān)性高的信息。
優(yōu)選地,在步驟S110之后,所述方法還包括:計(jì)算每個(gè)所述目標(biāo)關(guān)鍵詞在所述第一信息中的第一權(quán)值。
優(yōu)選地,根據(jù)第一總次數(shù)以及每個(gè)所述目標(biāo)關(guān)鍵詞的第一次數(shù),計(jì)算該目標(biāo)關(guān)鍵詞在所述第一信息中的第一權(quán)值;其中,所述第一總次數(shù)為所有所述第一關(guān)鍵詞的第一次數(shù)的和。
具體地,第一權(quán)值可理解為各個(gè)第一關(guān)鍵詞在第一信息中的影響程度。根據(jù)上述實(shí)施例得到各個(gè)第一關(guān)鍵詞的第一次數(shù)后(即出現(xiàn)次數(shù)),對所有的第一關(guān)鍵詞的第一次數(shù)進(jìn)行求和得到的總出現(xiàn)次數(shù)為第一總次數(shù)。本實(shí)施例中,可將某一個(gè)目標(biāo)關(guān)鍵詞的第一次數(shù)除以第一總次數(shù)的值作為該目標(biāo)關(guān)鍵詞在第一信息中的第一權(quán)值。例如,假設(shè)存在某個(gè)目標(biāo)關(guān)鍵詞a,其第一次數(shù)為10,第一總次數(shù)為100,則a的第一權(quán)值為1/10。
優(yōu)選地,所述根據(jù)所述第二信息確定所述第一信息的專題信息,包括:
B1、計(jì)算每個(gè)所述目標(biāo)關(guān)鍵詞在所述第二信息中的第二權(quán)值。
優(yōu)選地,按照以下方式計(jì)算每個(gè)所述目標(biāo)關(guān)鍵詞在每一所述第二信息中的第二權(quán)值:
C1、對目標(biāo)第二信息進(jìn)行分詞處理和停用詞過濾處理,得到第二數(shù)量個(gè)第二關(guān)鍵詞,其中,所述目標(biāo)第二信息為任一所述第二信息。
具體地,根據(jù)目標(biāo)關(guān)鍵詞進(jìn)行搜索后,可得到多個(gè)第二信息,定義目標(biāo)第二信息為其中任一第二信息。在計(jì)算所有目標(biāo)關(guān)鍵詞在該目標(biāo)第二信息中的第二權(quán)值時(shí),需要對該目標(biāo)第二信息進(jìn)行分詞處理和停用詞過濾處理,得到多個(gè)關(guān)鍵詞(定義為第二關(guān)鍵詞),得到的第二關(guān)鍵詞的個(gè)數(shù)為第二數(shù)量。
C2、統(tǒng)計(jì)各個(gè)第二關(guān)鍵詞在所述目標(biāo)第二信息中出現(xiàn)的第二次數(shù)。
具體地,定義第二次數(shù)為各個(gè)第二關(guān)鍵詞在目標(biāo)第二信息中出現(xiàn)的次數(shù)。值得注意的是,由于各個(gè)目標(biāo)第二信息中均包含所有的目標(biāo)關(guān)鍵詞,因此得到的第二關(guān)鍵詞中必定包含所有的目標(biāo)關(guān)鍵詞,在統(tǒng)計(jì)各個(gè)第二關(guān)鍵詞的第二次數(shù)時(shí),同時(shí)也會統(tǒng)計(jì)各個(gè)目標(biāo)關(guān)鍵詞的第二次數(shù)。
C3、根據(jù)每個(gè)所述目標(biāo)關(guān)鍵詞的第二次數(shù)與第二總次數(shù)計(jì)算該目標(biāo)關(guān)鍵詞在所述目標(biāo)第二信息中的第二權(quán)值。
具體地,定義第二總次數(shù)為目標(biāo)第二信息中所有第二關(guān)鍵詞的第二次數(shù)的和。在某一個(gè)目標(biāo)第二信息中,將任一目標(biāo)關(guān)鍵詞的第二次數(shù)除以第二總次數(shù),得到的值即為該目標(biāo)關(guān)鍵詞在該目標(biāo)第二信息中的第二權(quán)值。
B2、比較每個(gè)所述目標(biāo)關(guān)鍵詞的第二權(quán)值與該目標(biāo)關(guān)鍵詞的第一權(quán)值,根據(jù)比較結(jié)果,從所述第二信息中確定所述第一信息的專題信息。
優(yōu)選地,按照以下方式判斷每一所述第二信息是否為所述第一信息的專題信息:
D1、基于每個(gè)所述目標(biāo)關(guān)鍵詞在所述目標(biāo)第二信息中的第二權(quán)值與該目標(biāo)關(guān)鍵詞的第一權(quán)值,計(jì)算該目標(biāo)關(guān)鍵詞對應(yīng)的第一差距。
具體地,可以將目標(biāo)關(guān)鍵詞的第二權(quán)值與第一權(quán)值的差值的絕對值作為該目標(biāo)關(guān)鍵詞對應(yīng)的第一差距;也可以將目標(biāo)關(guān)鍵詞的第二權(quán)值與第一權(quán)值的比值作為該目標(biāo)關(guān)鍵詞對應(yīng)的第一差距。
D2、判斷每個(gè)所述目標(biāo)關(guān)鍵詞對應(yīng)的第一差距是否小于該目標(biāo)關(guān)鍵詞對應(yīng)的預(yù)設(shè)差距。
D3、如果是,將該目標(biāo)關(guān)鍵詞對應(yīng)的第一差距標(biāo)記為合理差距;
D4、如果否,將該目標(biāo)關(guān)鍵詞對應(yīng)的第一差距標(biāo)記為不合理差距;
具體地,預(yù)設(shè)差距為表征目標(biāo)關(guān)鍵詞第一差距是否合理的判斷標(biāo)準(zhǔn),當(dāng)?shù)谝徊罹嘈∮谠擃A(yù)設(shè)差距時(shí),則說明第一差距較小,將其標(biāo)記為合理差距;當(dāng)?shù)谝徊罹嗖恍∮谠擃A(yù)設(shè)差距時(shí),則說明第一差距過大,將其標(biāo)記為不合理差距。
具體地,如果將目標(biāo)關(guān)鍵詞的第二權(quán)值與第一權(quán)值的差值的絕對值,作為該目標(biāo)關(guān)鍵詞對應(yīng)的第一差距,二者差值的絕對值越大,則第一差距越大;如果將目標(biāo)關(guān)鍵詞的第二權(quán)值與第一權(quán)值的比值作為該目標(biāo)關(guān)鍵詞對應(yīng)的第一差距,則比值越接近于1,第一差距越小。
本實(shí)施例中,預(yù)設(shè)差距的大小可根據(jù)目標(biāo)關(guān)鍵詞的在第一信息中第一權(quán)值的大小不同而自由設(shè)定。例如,由于第一權(quán)值最大的目標(biāo)關(guān)鍵詞在第一信息中的影響程度最高,則可以將第一權(quán)值最大的目標(biāo)關(guān)鍵詞對應(yīng)的預(yù)設(shè)差距設(shè)置小一點(diǎn)。
D5、如果所有所述目標(biāo)關(guān)鍵詞對應(yīng)的第一差距均為合理差距,則將所述目標(biāo)第二信息作為所述第一信息的專題信息;反之,則不能將所述目標(biāo)第二信息作為所述第一信息的專題信息。
本實(shí)施例中,如果所有的目標(biāo)關(guān)鍵詞對應(yīng)的第一差距均為合理差距,則說明所有的目標(biāo)關(guān)鍵詞在第一信息中和目標(biāo)第二信息中的影響程度都很相近,此時(shí)第一信息和該目標(biāo)第二信息的相關(guān)性很高,則可以將該目標(biāo)第二信息作為第一信息的專題信息;如果某一個(gè)或多個(gè)目標(biāo)關(guān)鍵詞對應(yīng)的第一差距為不合理差距,則說明至少一個(gè)目標(biāo)關(guān)鍵詞在第一信息和目標(biāo)第二信息中的影響程度不相近,此時(shí)第一信息和該目標(biāo)第二信息的相關(guān)性不高,則不能將該目標(biāo)第二信息作為第一信息的專題信息。
本實(shí)施例提供的專題信息獲取方法,通過計(jì)算所有目標(biāo)關(guān)鍵詞在第一信息中的第一權(quán)值和在目標(biāo)第二信息中第二權(quán)值,并根據(jù)第一權(quán)值和第二權(quán)值計(jì)算第一差距,當(dāng)所有目標(biāo)關(guān)鍵詞的第一差距均為合理差距時(shí),將目標(biāo)第二信息作為第一信息的專題信息,較前述的實(shí)施例,該方法可獲取到更高相關(guān)性的專題信息。
優(yōu)選地,所述方法還包括:
E1、對所述專題信息進(jìn)行存儲;
E2、建立所有所述目標(biāo)關(guān)鍵詞與所述專題信息的鏈接;
E3、將所有所述目標(biāo)關(guān)鍵詞以及每個(gè)所述目標(biāo)關(guān)鍵詞對應(yīng)的鏈接發(fā)送給客戶端,使所述客戶端對所有所述目標(biāo)關(guān)鍵詞與所述第一信息進(jìn)行顯示。
具體地,根據(jù)上述實(shí)施例中的方法,服務(wù)器獲取第一信息的專題信息后,對這些專題信息存儲,并建立專題信息與所有目標(biāo)關(guān)鍵詞之間的鏈接,然后將所有目標(biāo)關(guān)鍵詞以及每個(gè)標(biāo)關(guān)鍵詞對應(yīng)的鏈接發(fā)送給客戶端,客戶端將第一信息與所有目標(biāo)關(guān)鍵詞共同顯示在一起以方便用戶查看。如果用戶對顯示的第一信息感興趣,想觀看相關(guān)專題信息時(shí),可通過點(diǎn)擊關(guān)鍵詞,客戶端利用相應(yīng)的鏈接,請求服務(wù)器調(diào)用已經(jīng)存儲的專題信息,服務(wù)器為客戶端推送這些專題信息,客戶端顯示專題信息。
實(shí)施例二
如圖2所示,為本發(fā)明實(shí)施例提供的專題信息獲取裝置的結(jié)構(gòu)示意圖,用于執(zhí)行如圖1所示的方法,該裝置包括:
第一信息獲取模塊210,用于獲得第一信息;
目標(biāo)關(guān)鍵詞獲取模塊220,用于從所述第一信息中獲取至少一個(gè)目標(biāo)關(guān)鍵詞;
專題信息確定模塊230,用于在數(shù)據(jù)庫中搜索包含所有所述目標(biāo)關(guān)鍵詞的第二信息,根據(jù)所述第二信息確定所述第一信息的專題信息。
本發(fā)明是實(shí)施例提供的專題信息獲取裝置,通過對第一信息進(jìn)行處理得到至少一個(gè)目標(biāo)關(guān)鍵詞,在從數(shù)據(jù)庫中搜索包含所有目標(biāo)關(guān)鍵詞的第二信息,最終可根據(jù)搜索到的第二信號獲取與第一信息相關(guān)性高的專題信息。由以上可見,本發(fā)明實(shí)施例提供的方案中采用數(shù)據(jù)庫與至少一個(gè)目標(biāo)關(guān)鍵詞相結(jié)合的形式獲得與第一信息相關(guān)性高的專題信息,而無需再在大量的網(wǎng)絡(luò)信息中進(jìn)行搜索,且獲得第一信息相關(guān)性高的信息時(shí)考慮的關(guān)鍵詞多,因此能夠方便的獲得與第一信息相關(guān)性高的信息。
優(yōu)選地,所述裝置還包括:
第一權(quán)值計(jì)算模塊,用于計(jì)算每個(gè)所述目標(biāo)關(guān)鍵詞在所述第一信息中的第一權(quán)值;
所述專題信息確定模塊,包括:
第二權(quán)值計(jì)算單元,用于計(jì)算每個(gè)所述目標(biāo)關(guān)鍵詞在所述第二信息中的第二權(quán)值;
權(quán)值比較單元,用于比較每個(gè)所述目標(biāo)關(guān)鍵詞的第二權(quán)值與該目標(biāo)關(guān)鍵詞的第一權(quán)值,根據(jù)比較結(jié)果,從所述第二信息中確定所述第一信息的專題信息。
優(yōu)選地,所述目標(biāo)關(guān)鍵詞獲取模塊,包括:
第一關(guān)鍵詞獲取單元,用于對所述第一信息進(jìn)行分詞處理和停用詞過濾處理,得到第一數(shù)量個(gè)第一關(guān)鍵詞;
第一次數(shù)統(tǒng)計(jì)單元,用于統(tǒng)計(jì)各個(gè)所述第一關(guān)鍵詞在所述第一信息中出現(xiàn)的第一次數(shù);
降序排列單元,用于按照所述第一次數(shù)的大小,對所述第一關(guān)鍵詞進(jìn)行降序排列形成隊(duì)列;
目標(biāo)關(guān)鍵詞確定單元,用于將所述隊(duì)列中前至少一個(gè)所述第一關(guān)鍵詞確定為所述目標(biāo)關(guān)鍵詞。
所述第一權(quán)值計(jì)算模塊,具體用于根據(jù)第一總次數(shù)以及每個(gè)所述目標(biāo)關(guān)鍵詞的第一次數(shù),計(jì)算該目標(biāo)關(guān)鍵詞在所述第一信息中的第一權(quán)值;其中,所述第一總次數(shù)為所有所述第一關(guān)鍵詞的第一次數(shù)的和。
優(yōu)選地,所述第二權(quán)值計(jì)算單元,包括:
第二關(guān)鍵詞獲取子單元,用于對目標(biāo)第二信息進(jìn)行分詞處理和停用詞過濾處理,得到第二數(shù)量個(gè)第二關(guān)鍵詞,其中,所述目標(biāo)第二信息為任一所述第二信息;
第二次數(shù)統(tǒng)計(jì)子單元,用于統(tǒng)計(jì)各個(gè)第二關(guān)鍵詞在所述目標(biāo)第二信息中出現(xiàn)的第二次數(shù);
第二權(quán)值計(jì)算子單元,用于根據(jù)每個(gè)所述目標(biāo)關(guān)鍵詞的第二次數(shù)與第二總次數(shù)計(jì)算該目標(biāo)關(guān)鍵詞在所述目標(biāo)第二信息中的第二權(quán)值;其中,所述第二總次數(shù)為所述目標(biāo)第二信息中所有第二關(guān)鍵詞的第二次數(shù)的和。
優(yōu)選地,所述權(quán)值比較單元,包括:
第一差距計(jì)算子單元,用于基于每個(gè)所述目標(biāo)關(guān)鍵詞在所述目標(biāo)第二信息中的第二權(quán)值與該目標(biāo)關(guān)鍵詞的第一權(quán)值,計(jì)算該目標(biāo)關(guān)鍵詞對應(yīng)的第一差距;
第一差距判斷子單元,用于判斷每個(gè)所述目標(biāo)關(guān)鍵詞對應(yīng)的第一差距是否小于該目標(biāo)關(guān)鍵詞對應(yīng)的預(yù)設(shè)差距;
合理差距標(biāo)記子單元,用于如果是,將該目標(biāo)關(guān)鍵詞對應(yīng)的第一差距標(biāo)記為合理差距;
不合理差距標(biāo)記子單元,用于如果否,將該目標(biāo)關(guān)鍵詞對應(yīng)的第一差距標(biāo)記為不合理差距;
專題信息獲取子單元,用于如果所有所述目標(biāo)關(guān)鍵詞對應(yīng)的第一差距均為合理差距,則將所述目標(biāo)第二信息作為所述第一信息的專題信息;反之,則不能將所述目標(biāo)第二信息作為所述第一信息的專題信息。
優(yōu)選地,所述裝置還包括:
專題信息存儲模塊,用于對所述專題信息進(jìn)行存儲;
鏈接建立模塊,用于建立所有所述目標(biāo)關(guān)鍵詞與所述專題信息的鏈接;
發(fā)送模塊,用于將所有所述目標(biāo)關(guān)鍵詞以及每個(gè)所述目標(biāo)關(guān)鍵詞對應(yīng)的鏈接發(fā)送給客戶端,使所述客戶端對所有所述目標(biāo)關(guān)鍵詞與所述第一信息進(jìn)行顯示。
本實(shí)施例提供的專題信息獲取裝置,通過計(jì)算所有目標(biāo)關(guān)鍵詞在第一信息中的第一權(quán)值和在目標(biāo)第二信息中第二權(quán)值,并根據(jù)第一權(quán)值和第二權(quán)值計(jì)算第一差距,當(dāng)所有目標(biāo)關(guān)鍵詞的第一差距均為合理差距時(shí),將目標(biāo)第二信息作為第一信息的專題信息,較前述的實(shí)施例,該裝置可獲取到更高相關(guān)性的專題信息。
需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
本說明書中的各個(gè)實(shí)施例均采用相關(guān)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見即可,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處。尤其,對于系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。