專利名稱:關(guān)鍵字管理程序、關(guān)鍵字管理系統(tǒng)和關(guān)鍵字管理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對(duì)與網(wǎng)絡(luò)連接的用戶終端訪問內(nèi)容時(shí)所利用的關(guān)鍵字進(jìn) 行管理的關(guān)鍵字管理程序、關(guān)鍵字管理系統(tǒng)和關(guān)鍵字管理方法。
背景技術(shù):
近年來,因特網(wǎng)廣泛普及,用戶利用與因特網(wǎng)連接的用戶終端,從 網(wǎng)絡(luò)上取得各種信息。例如,在用戶從網(wǎng)絡(luò)上取得與規(guī)定關(guān)鍵字相關(guān)聯(lián) 的信息的情況下,能夠利用檢索引擎來取得。
并且,即使用戶不知道特定的關(guān)鍵字,通過訪問服務(wù)提供商管理的 門戶網(wǎng)站或博客等,也能夠取得服務(wù)提供商選出的新聞、話題、勸告信 息等各種信息。
除此之外,對(duì)應(yīng)于進(jìn)行信息收集的用戶,在網(wǎng)絡(luò)上提供各種服務(wù)。 例如,在非專利文獻(xiàn)l中公開了如下的服務(wù)向用戶提供話題的關(guān)鍵字, 提示該關(guān)鍵字的檢索。該服務(wù)進(jìn)行在規(guī)定期間內(nèi)檢索到的關(guān)鍵字的排名, 向用戶通知排名結(jié)果,由此,能夠向用戶提供話題的關(guān)鍵字。
另外,在專利文獻(xiàn)1中公開了如下技術(shù)為了使用戶的信息檢索更 加舒適,根據(jù)檢索到的關(guān)鍵字和與關(guān)鍵字相關(guān)聯(lián)的信息之間的關(guān)聯(lián)性的 程度,來設(shè)定與關(guān)鍵字相關(guān)聯(lián)的信息的配置。
非專利文獻(xiàn)l: 二7亍^株式會(huì)社"瞬7—F、" 、 [online]、[平成18 年12月25日檢索]、因特網(wǎng)〈http:〃www.nifty.com/shun^ 專利文獻(xiàn)l:日本特開2006-31577號(hào)公報(bào)
但是,在上述現(xiàn)有技術(shù)中存在如下問題即使能夠向用戶提供成為 話題的主題,也仍不清楚所提供的主題為何成為了話題。
該情況下,用戶不知道所提供的主題為何成為了話題,所以,需要 在不知道話題理由的狀態(tài)下進(jìn)行檢索。而且,檢索的結(jié)果,命中與主題相關(guān)聯(lián)的各種信息(包含與話題無關(guān)的信息),用戶無法舒適地進(jìn)行利用 主題的檢索。
艮P,明確主題為什么成為話題并向用戶通知成為話題的主題的信息, 是極其重要的課題。
發(fā)明內(nèi)容
本發(fā)明是鑒于上述內(nèi)容而完成的,其目的在于,提供明確主題為什 么成為話題并能夠向用戶通知成為話題的主題的信息的關(guān)鍵字管理程 序、關(guān)鍵字管理系統(tǒng)和關(guān)鍵字管理方法。
為了解決上述課題并達(dá)成目的,本發(fā)明的關(guān)鍵字管理程序用于對(duì)在 與網(wǎng)絡(luò)連接的用戶終端訪問到內(nèi)容時(shí)所利用的關(guān)鍵字進(jìn)行管理的關(guān)鍵字 管理系統(tǒng),該關(guān)鍵字管理程序的特征在于,該關(guān)鍵字管理程序使計(jì)算機(jī) 執(zhí)行以下步驟突發(fā)值計(jì)算步驟,在該步驟中,計(jì)算突發(fā)值,該突發(fā)值 表示所述關(guān)鍵字的每單位時(shí)間的增加值;綜合突發(fā)值計(jì)算步驟,在該步 驟中,根據(jù)與所述突發(fā)值對(duì)應(yīng)的關(guān)鍵字在所述內(nèi)容中的特征,對(duì)所述突 發(fā)值進(jìn)行校正,從而計(jì)算出綜合突發(fā)值;以及輸出控制步驟,在該步驟 中,根據(jù)所述綜合突發(fā)值的時(shí)間序列推移,從所述內(nèi)容中提取與對(duì)應(yīng)于 該綜合突發(fā)值的關(guān)鍵字相關(guān)聯(lián)的關(guān)聯(lián)關(guān)鍵字,將所述關(guān)鍵字和關(guān)聯(lián)關(guān)鍵 字對(duì)應(yīng)起來輸出到所述用戶終端。
并且,本發(fā)明的特征在于,在上述發(fā)明中,該關(guān)鍵字管理程序還使 計(jì)算機(jī)執(zhí)行形式要素分析執(zhí)行步驟,在該步驟中,根據(jù)所述突發(fā)值為閾 值以上的關(guān)鍵字,分析在所述內(nèi)容內(nèi)包含的文本的形式要素,在所述突 發(fā)值計(jì)算步驟中,針對(duì)由所述形式要素分析結(jié)果得到的關(guān)鍵字,進(jìn)一步 計(jì)算突發(fā)值。
并且,本發(fā)明的特征在于,在上述發(fā)明中,該關(guān)鍵字管理程序還使 計(jì)算機(jī)執(zhí)行分類步驟,在該步驟中,根據(jù)所述綜合突發(fā)值的時(shí)間序列推 移,將對(duì)應(yīng)于該綜合突發(fā)值的關(guān)鍵字分類為預(yù)先準(zhǔn)備的多個(gè)類型中的任 一種類型,在所述輸出控制步驟中,將所述分類步驟的分類結(jié)果進(jìn)一步 輸出到所述用戶終端。
7并且,本發(fā)明的特征在于,在上述發(fā)明中,所述關(guān)鍵字在內(nèi)容中的 特征包含在所述內(nèi)容中標(biāo)題所包含的所述關(guān)鍵字的數(shù)量、在所述內(nèi)容 中展開鏈接的所述關(guān)鍵字的數(shù)量、以及在所述內(nèi)容中被修飾的所述關(guān)鍵 字的數(shù)量。
并且,本發(fā)明的特征在于,在上述發(fā)明中,在所述輸出控制步驟中, 提取與所述綜合突發(fā)值的時(shí)間序列推移相關(guān)的關(guān)鍵字,作為所述關(guān)聯(lián)關(guān) 鍵字。
并且,本發(fā)明的特征在于,在上述發(fā)明中,在所述輸出控制步驟中, 進(jìn)一步提取在所述內(nèi)容的文本中與所述綜合突發(fā)值為閾值以上的關(guān)鍵字 一起出現(xiàn)的關(guān)鍵字,作為所述關(guān)聯(lián)關(guān)鍵字。
并且,本發(fā)明的關(guān)鍵字管理系統(tǒng)對(duì)在與網(wǎng)絡(luò)連接的用戶終端訪問到 內(nèi)容時(shí)所利用的關(guān)鍵字進(jìn)行管理,該關(guān)鍵字管理系統(tǒng)的特征在于,該關(guān) 鍵字管理系統(tǒng)具有突發(fā)值計(jì)算單元,其計(jì)算突發(fā)值,該突發(fā)值表示所 述關(guān)鍵字的每單位時(shí)間的增加值;綜合突發(fā)值計(jì)算單元,其根據(jù)與所述 突發(fā)值對(duì)應(yīng)的關(guān)鍵字在所述內(nèi)容上的特征,對(duì)所述突發(fā)值進(jìn)行校正,從 而計(jì)算出綜合突發(fā)值;以及輸出控制單元,其根據(jù)所述綜合突發(fā)值的時(shí) 間序列推移,從所述內(nèi)容中提取與對(duì)應(yīng)于該綜合突發(fā)值的關(guān)鍵字相關(guān)聯(lián) 的關(guān)聯(lián)關(guān)鍵字,將所述關(guān)鍵字和關(guān)聯(lián)關(guān)鍵字對(duì)應(yīng)起來輸出到所述用戶終
一山順。
并且,本發(fā)明的特征在于,在上述發(fā)明中,該關(guān)鍵字管理系統(tǒng)還具 有形式要素分析執(zhí)行單元,該形式要素分析執(zhí)行單元根據(jù)所述突發(fā)值為 閾值以上的關(guān)鍵字,分析在所述內(nèi)容中包含的文本的形式要素,所述突 發(fā)值計(jì)算單元針對(duì)由所述形式要素分析結(jié)果得到的關(guān)鍵字,進(jìn)一步計(jì)算
突發(fā)值。
并且,本發(fā)明的特征在于,在上述發(fā)明中,該關(guān)鍵字管理系統(tǒng)還具 有分類單元,該分類單元根據(jù)所述綜合突發(fā)值的時(shí)間序列推移,將對(duì)應(yīng) 于該綜合突發(fā)值的關(guān)鍵字分類為預(yù)先準(zhǔn)備的多個(gè)類型中的任一種類型,
所述輸出控制單元將所述分類單元的分類結(jié)果進(jìn)一步輸出到所述用戶終
士山 頓。并且,本發(fā)明的特征在于,在上述發(fā)明中,所述關(guān)鍵字在內(nèi)容中的 特征包含在所述內(nèi)容中標(biāo)題所包含的所述關(guān)鍵字的數(shù)量、在所述內(nèi)容 中展開鏈接的所述關(guān)鍵字的數(shù)量、以及在所述內(nèi)容中被修飾的所述關(guān)鍵 字的數(shù)量。
并且,本發(fā)明的特征在于,在上述發(fā)明中,所述輸出控制單元提取 與所述綜合突發(fā)值的時(shí)間序列推移相關(guān)的關(guān)鍵字,作為所述關(guān)聯(lián)關(guān)鍵字。
并且,本發(fā)明的特征在于,在上述發(fā)明中,所述輸出控制單元進(jìn)一 步提取在所述內(nèi)容的文本中與所述綜合突發(fā)值為閾值以上的關(guān)鍵字一起 出現(xiàn)的關(guān)鍵字,作為所述關(guān)聯(lián)關(guān)鍵字。
并且,本發(fā)明的關(guān)鍵字管理方法用于對(duì)在與網(wǎng)絡(luò)連接的用戶終端訪 問到內(nèi)容時(shí)所利用的關(guān)鍵字進(jìn)行管理的關(guān)鍵字管理系統(tǒng),該關(guān)鍵字管理 方法的特征在于,該關(guān)鍵字管理方法包含以下步驟突發(fā)值計(jì)算步驟, 在該步驟中,計(jì)算突發(fā)值,該突發(fā)值表示所述關(guān)鍵字的每單位時(shí)間的增 加值;綜合突發(fā)值計(jì)算步驟,在該步驟中,根據(jù)與所述突發(fā)值對(duì)應(yīng)的關(guān) 鍵字在所述內(nèi)容中的特征,對(duì)所述突發(fā)值進(jìn)行校正,從而計(jì)算出綜合突 發(fā)值;以及輸出控制步驟,在該步驟中,根據(jù)所述綜合突發(fā)值的時(shí)間序 列推移,從所述內(nèi)容中提取與對(duì)應(yīng)于該綜合突發(fā)值的關(guān)鍵字相關(guān)聯(lián)的關(guān) 聯(lián)關(guān)鍵字,將所述關(guān)鍵字和關(guān)聯(lián)關(guān)鍵字對(duì)應(yīng)起來輸出到所述用戶終端。
并且,本發(fā)明的特征在于,在上述發(fā)明中,該關(guān)鍵字管理方法還包 含形式要素分析執(zhí)行步驟,在該步驟中,根據(jù)所述突發(fā)值為閾值以上的 關(guān)鍵字,分析在所述內(nèi)容中包含的文本的形式要素,在所述突發(fā)值計(jì)算 步驟中,針對(duì)由所述形式要素分析結(jié)果得到的關(guān)鍵字,進(jìn)一步計(jì)算突發(fā) 值。
并且,本發(fā)明的特征在于,在上述發(fā)明中,該關(guān)鍵字管理方法還包 含分類步驟,在該步驟中,根據(jù)所述綜合突發(fā)值的時(shí)間序列推移,將對(duì) 應(yīng)于該綜合突發(fā)值的關(guān)鍵字分類為預(yù)先準(zhǔn)備的多個(gè)類型中的任一種類 型,在所述輸出控制步驟中,將所述分類步驟的分類結(jié)果進(jìn)一步輸出到 所述用戶終端。
并且,本發(fā)明的特征在于,在上述發(fā)明中,所述關(guān)鍵字的在內(nèi)容中的特征包含在所述內(nèi)容中標(biāo)題所包含的所述關(guān)鍵字的數(shù)量、在所述內(nèi) 容中展開鏈接的所述關(guān)鍵字的數(shù)量、以及在所述內(nèi)容中被修飾的所述關(guān) 鍵字的數(shù)量。
并且,本發(fā)明的特征在于,在上述發(fā)明中,在所述輸出控制步驟中, 提取與所述綜合突發(fā)值的時(shí)間序列推移相關(guān)的關(guān)鍵字,作為所述關(guān)聯(lián)關(guān)
并且,本發(fā)明的特征在于,在上述發(fā)明中,在所述輸出控制步驟中, 進(jìn)一步提取在所述內(nèi)容的文本中與所述綜合突發(fā)值為閾值以上的關(guān)鍵字 一起出現(xiàn)的關(guān)鍵字,作為所述關(guān)聯(lián)關(guān)鍵字。
根據(jù)本發(fā)明,計(jì)算表示關(guān)鍵字的每單位時(shí)間的增加值的突發(fā)值,根 據(jù)與計(jì)算出的突發(fā)值對(duì)應(yīng)的關(guān)鍵字在內(nèi)容中的特征,對(duì)突發(fā)值進(jìn)行校正, 從而計(jì)算出綜合突發(fā)值,根據(jù)該綜合突發(fā)值的時(shí)間序列推移,從內(nèi)容中 提取與對(duì)應(yīng)于綜合突發(fā)值的關(guān)鍵字相關(guān)聯(lián)的關(guān)聯(lián)關(guān)鍵字,將關(guān)鍵字和關(guān) 聯(lián)關(guān)鍵字對(duì)應(yīng)起來輸出到所述用戶終端,所以,根據(jù)成為話題的關(guān)鍵字 和關(guān)聯(lián)關(guān)鍵字,用戶能夠容易地理解該關(guān)鍵字為什么成為話題。
并且,根據(jù)本發(fā)明,根據(jù)突發(fā)值為閾值以上的關(guān)鍵字,分析內(nèi)容所 包含的文本的形式要素,針對(duì)由形式要素分析結(jié)果得到的關(guān)鍵字,進(jìn)一 步計(jì)算突發(fā)值,所以,能夠更準(zhǔn)確地提取成為話題的關(guān)鍵字。
并且,根據(jù)本發(fā)明,根據(jù)綜合突發(fā)值的時(shí)間序列推移,將對(duì)應(yīng)于綜 合突發(fā)值的關(guān)鍵字分類為預(yù)先準(zhǔn)備的多個(gè)類型中的任一種類型,所以, 用戶能夠容易地理解通過怎樣的經(jīng)過成為話題的關(guān)鍵字。
并且,根據(jù)本發(fā)明,根據(jù)包含標(biāo)題所包含的所述關(guān)鍵字的數(shù)量、展 開鏈接的關(guān)鍵字的數(shù)量、以及被修飾的關(guān)鍵字的數(shù)量的關(guān)鍵字在內(nèi)容中 的特征,來校正綜合突發(fā)值,所以,能夠更可靠地提取話題的關(guān)鍵字。
并且,根據(jù)本發(fā)明,提取與綜合突發(fā)值的時(shí)間序列推移相關(guān)的關(guān)鍵 字作為關(guān)聯(lián)關(guān)鍵字,所以,根據(jù)成為話題的關(guān)鍵字和關(guān)聯(lián)關(guān)鍵字,用戶 能夠容易地理解該關(guān)鍵字為什么成為話題。
并且,根據(jù)本發(fā)明,進(jìn)一步提取在內(nèi)容的文本中與綜合突發(fā)值為閾 值以上的關(guān)鍵字一起出現(xiàn)的關(guān)鍵字作為關(guān)聯(lián)關(guān)鍵字,所以,根據(jù)成為話題的關(guān)鍵字和關(guān)聯(lián)關(guān)鍵字,用戶能夠容易地理解該關(guān)鍵字為什么成為話 題,能夠更加舒適地執(zhí)行使用關(guān)鍵字的信息檢索。
圖1是用于說明現(xiàn)有技術(shù)和本實(shí)施例的關(guān)鍵字管理系統(tǒng)之間的差異 的說明圖。
圖2是示出本實(shí)施例的關(guān)鍵字管理系統(tǒng)的結(jié)構(gòu)的系統(tǒng)結(jié)構(gòu)圖。
圖3是示出本實(shí)施例的網(wǎng)絡(luò)話題積累裝置的結(jié)構(gòu)的功能框圖。
圖4是示出新聞/博客表的數(shù)據(jù)結(jié)構(gòu)的一例的圖。
圖5是示出檢索詞表的數(shù)據(jù)結(jié)構(gòu)的一例的圖。
圖6是示出用戶辭典表的數(shù)據(jù)結(jié)構(gòu)的一例的圖。
圖7是示出形式要素分析結(jié)果管理表的數(shù)據(jù)結(jié)構(gòu)的一例的圖。
圖8是示出Burst計(jì)算參數(shù)表的數(shù)據(jù)結(jié)構(gòu)的一例的圖。
圖9是示出綜合Burst存儲(chǔ)表的數(shù)據(jù)結(jié)構(gòu)的一例的圖。
圖IO是示出主題類型管理表的數(shù)據(jù)結(jié)構(gòu)的一例的圖。
圖11是示出關(guān)聯(lián)關(guān)鍵字表的數(shù)據(jù)結(jié)構(gòu)的一例的圖。 圖12是示出共現(xiàn)關(guān)鍵字表的數(shù)據(jù)結(jié)構(gòu)的一例的圖。 圖13是示出最終結(jié)果存儲(chǔ)表的數(shù)據(jù)結(jié)構(gòu)的一例的圖。 圖14是示出本實(shí)施例的網(wǎng)絡(luò)話題積累裝置的處理步驟的流程圖。 圖15是示出構(gòu)成圖3所示的網(wǎng)絡(luò)話題積累裝置的計(jì)算機(jī)的硬件結(jié)構(gòu) 的圖。
符號(hào)說明
10:網(wǎng)絡(luò);20:用戶終端;30:各種內(nèi)容存儲(chǔ)裝置;40:服務(wù)器; 50:計(jì)算機(jī);51:輸入裝置;52:監(jiān)視器;53: RAM; 53a:各種數(shù)據(jù); 54: ROM; 55:介質(zhì)讀取裝置;56:網(wǎng)絡(luò)接口; 57: CPU; 57a:話題關(guān) 鍵字提供處理;58: HDD; 58a:各種數(shù)據(jù);58b:話題關(guān)鍵字提供程序; 59-總線;100:網(wǎng)絡(luò)話題積累裝置;110:輸入部;120:輸出部;130: 通信控制IF部;140:輸入輸出控制IF部;150:存儲(chǔ)部;150a: Web 內(nèi)容數(shù)據(jù)庫;150b:新聞/博客表;150C:檢索詞表;150d:用戶辭典表;150e:形式要素分析結(jié)果管理表;150f: Burst計(jì)算參數(shù)表;150g:綜合 Burst存儲(chǔ)表;150h:主題類型管理表;150i:相關(guān)關(guān)鍵字表;150j:共 現(xiàn)關(guān)鍵字表;150k:最終結(jié)果存儲(chǔ)表;160:控制部;160a:數(shù)據(jù)管理部; 160b: Burst計(jì)算部;160c:用戶辭典登記部;160d:形式要素分析部; 160e:綜合Burst計(jì)算部;160f:主題類型判定部;160g:相關(guān)關(guān)鍵字檢 測(cè)部;160h:共現(xiàn)關(guān)鍵字檢測(cè)部;160i:輸出關(guān)鍵字判定處理部。
具體實(shí)施例方式
下面,根據(jù)附圖詳細(xì)說明本發(fā)明的關(guān)鍵字管理程序、關(guān)鍵字管理系 統(tǒng)和關(guān)鍵字管理方法的實(shí)施例。另外,不由該實(shí)施例限定本發(fā)明。
首先,與現(xiàn)有技術(shù)相比較來說明本實(shí)施例的關(guān)鍵字管理系統(tǒng)的特征。 圖1是用于說明現(xiàn)有技術(shù)和本實(shí)施例的關(guān)鍵字管理系統(tǒng)之間的差異的說 明圖。如圖1左側(cè)所示,在現(xiàn)有技術(shù)中,根據(jù)訪問到內(nèi)容時(shí)所利用的關(guān) 鍵字的利用頻度來選擇成為話題的關(guān)鍵字,從利用頻度從高到低的順序 排列所選擇的關(guān)鍵字,作為主題通知給用戶終端(以下為用戶終端)(參 照?qǐng)Dl左側(cè))。
但是,現(xiàn)有技術(shù)僅根據(jù)利用頻度來排列成為話題的關(guān)鍵字,所以, 用戶無法理解各關(guān)鍵字為什么成為主題,無法舒適地進(jìn)行利用各關(guān)鍵字 的信息檢索。
另一方面,本實(shí)施例的關(guān)鍵字管理系統(tǒng)的特征在于,計(jì)算表示用戶 訪問到內(nèi)容時(shí)所利用的關(guān)鍵字的每單位時(shí)間的增加值的突發(fā)值,計(jì)算根 據(jù)與該突發(fā)值對(duì)應(yīng)的關(guān)鍵字的內(nèi)容上的特征校正了計(jì)算出的突發(fā)值得到 的綜合突發(fā)值。而且,根據(jù)綜合突發(fā)值的時(shí)間序列推移,從內(nèi)容中提取 與對(duì)應(yīng)于綜合突發(fā)值的關(guān)鍵字相關(guān)聯(lián)的關(guān)鍵字(以下為關(guān)聯(lián)關(guān)鍵字),以 把關(guān)鍵字和關(guān)聯(lián)關(guān)鍵字對(duì)應(yīng)起來的信息作為主題,通知給用戶終端(參 照?qǐng)Dl右側(cè))。
這樣,本實(shí)施例的關(guān)鍵字管理系統(tǒng)將設(shè)置了與成為話題的關(guān)鍵字密 切相關(guān)聯(lián)的其他關(guān)鍵字的關(guān)鍵字組作為主題,通知給用戶,所以,用戶 能夠理解各關(guān)鍵字為什么成為話題,能夠舒適地執(zhí)行利用主題的信息檢
12索。
接著,說明本實(shí)施例的關(guān)鍵字管理系統(tǒng)的結(jié)構(gòu)。圖2是示出本實(shí)施 例的關(guān)鍵字管理系統(tǒng)的結(jié)構(gòu)的系統(tǒng)結(jié)構(gòu)圖。如該圖所示,該關(guān)鍵字管理
系統(tǒng)構(gòu)成為,利用網(wǎng)絡(luò)10來連接用戶終端20、各種內(nèi)容存儲(chǔ)裝置30、 服務(wù)器40、網(wǎng)絡(luò)話題積累裝置IOO。
用戶終端20是利用由服務(wù)器40運(yùn)營的門戶網(wǎng)站(包含檢索引擎) 來取得各種信息的裝置。另外,用戶終端20在取得各種信息的情況下, 經(jīng)由輸入裝置(省略圖示)從用戶接收關(guān)鍵字,將接收的關(guān)鍵字輸出到 服務(wù)器40。
各種內(nèi)容存儲(chǔ)裝置30是存儲(chǔ)在網(wǎng)絡(luò)上收發(fā)的各種內(nèi)容(新聞、博客、 BBS (Bulletin Board System)、股價(jià)、天氣、占卜等文本內(nèi)容)的存儲(chǔ)裝 置。另外。各種內(nèi)容包含有生成該內(nèi)容的日期時(shí)間的信息。
服務(wù)器40是如下的裝置運(yùn)營門戶網(wǎng)站,并且,在從用戶終端20 取得了關(guān)鍵字的情況下,從各種內(nèi)容存儲(chǔ)裝置30檢索與所取得的關(guān)鍵字 相關(guān)聯(lián)的信息,將檢索到的信息輸出到用戶終端20。并且,服務(wù)器40將 從用戶終端20取得的關(guān)鍵字的歷史作為檢索記錄信息,存儲(chǔ)在存儲(chǔ)裝置 (省略圖示)中。該檢索記錄信息是將檢索的關(guān)鍵字、檢索的日期時(shí)間、 檢索數(shù)量(同一用戶重復(fù)檢索視為一次)、利用關(guān)鍵字來命中的各種信息 的件數(shù)的信息對(duì)應(yīng)起來存儲(chǔ)得到的。
網(wǎng)絡(luò)話題積累裝置100是將成為話題的關(guān)鍵字和關(guān)聯(lián)關(guān)鍵字對(duì)應(yīng)起 來輸出到用戶終端20的裝置。這里,說明網(wǎng)絡(luò)話題積累裝置100的結(jié)構(gòu)。 圖3是示出本實(shí)施例的網(wǎng)絡(luò)話題積累裝置100的結(jié)構(gòu)的功能框圖。如該 圖所示,該網(wǎng)絡(luò)話題積累裝置IOO構(gòu)成為具有輸入部110、輸出部120、 通信控制IF部130、輸入輸出控制IF部140、存儲(chǔ)部150、以及控制部 160。
其中,輸入部110是輸入各種信息的輸入單元,由鍵盤、鼠標(biāo)、麥 克風(fēng)等構(gòu)成。另外,后述的監(jiān)視器(輸出部120)也與鼠標(biāo)協(xié)作,實(shí)現(xiàn)指 示設(shè)備功能。
輸出部120是輸出各種信息的輸出單元,由監(jiān)視器(或顯示器、觸摸面板)、揚(yáng)聲器等構(gòu)成。通信控制IF部130是主要對(duì)用戶終端20、各 種內(nèi)容存儲(chǔ)裝置30、服務(wù)器40之間的通信進(jìn)行控制的單元。輸入輸出控 制IF部140是對(duì)輸入部110、輸出部120、通信控制IF部130、存儲(chǔ)部 150、控制部160進(jìn)行的數(shù)據(jù)的輸入輸出進(jìn)行控制的單元。
存儲(chǔ)部150是存儲(chǔ)控制部160進(jìn)行的各種處理所需要的數(shù)據(jù)和程序 的存儲(chǔ)單元,特別地,作為與本發(fā)明密切相關(guān)聯(lián)的部分,如圖3所示, 存儲(chǔ)部150具有Web內(nèi)容數(shù)據(jù)庫150a、新聞/博客表150b、檢索詞表 150c、用戶辭典表150d、形式要素分析結(jié)果管理表150e、 Burst計(jì)算參數(shù) 表150f、綜合Burst存儲(chǔ)表150g、主題類型管理表150h、相關(guān)關(guān)鍵字表 150i、共現(xiàn)關(guān)鍵字表150j、最終結(jié)果存儲(chǔ)表150k。
Web內(nèi)容數(shù)據(jù)庫150a是存儲(chǔ)網(wǎng)絡(luò)話題積累裝置100從服務(wù)器40取 得的檢索記錄信息和從各種內(nèi)容存儲(chǔ)裝置30取得的各種內(nèi)容的信息(新 聞、博客、BBS、股價(jià)、天氣、占卜等文本內(nèi)容的信息)的數(shù)據(jù)庫。另 外,與唯一的文檔源ID (Identification)對(duì)應(yīng)地存儲(chǔ)各種內(nèi)容的信息。
新聞/博客表"Ob是通過關(guān)鍵字以及發(fā)布(或生成)新聞和博客的 日期時(shí)間對(duì)新聞和博客(或BBS)的信息進(jìn)行分類(分類化)的表。圖 4是示出新聞/博客表150b的數(shù)據(jù)結(jié)構(gòu)的一例的圖。如該圖所示,新聞/ 博客表150b由關(guān)鍵字、日期時(shí)間、文檔源ID、新聞(博客)內(nèi)容構(gòu)成。 其中,日期時(shí)間表示發(fā)布(或生成)新聞或博客的日期時(shí)間。另外,這 里示出新聞/博客表150b存儲(chǔ)新聞和博客的信息的情況,但是,也可以包 含并存儲(chǔ)其他信息(例如BBS、其他內(nèi)容)。
檢索詞表150c是存儲(chǔ)檢索記錄信息所包含的關(guān)鍵字的各種信息的 表。圖5是示出檢索詞表150c的數(shù)據(jù)結(jié)構(gòu)的一例的圖。如該圖所示,該 檢索詞表150c由關(guān)鍵字、日期時(shí)間、檢索數(shù)量、出現(xiàn)件數(shù)、平均檢索數(shù) 量、Burst值構(gòu)成。
其中,檢索數(shù)量表示由用戶檢索該關(guān)鍵字的次數(shù)。例如,在圖5的 第1段中,示出株式會(huì)社A這樣的關(guān)鍵字的檢索次數(shù)為111。
出現(xiàn)件數(shù)表示通過規(guī)定的檢索引擎檢索關(guān)鍵字時(shí)所命中的件數(shù)。例 如,在圖5的第1段中,示出作為關(guān)鍵字的"株式會(huì)社A"的命中件數(shù)為"1200000"。
平均檢索數(shù)量表示根據(jù)過去檢索到的關(guān)鍵字的檢索數(shù)量而計(jì)算出的 每單位時(shí)間的平均檢索數(shù)量。例如,在圖5的第1段中,示出作為關(guān)鍵 字的"株式會(huì)社A"的平均檢索數(shù)量為"9.0"。
Burst值表示對(duì)內(nèi)容進(jìn)行訪問時(shí)所利用(由用戶輸入到檢索引擎等 中)的關(guān)鍵字的每單位時(shí)間的增加量(根據(jù)時(shí)間經(jīng)過而變化的檢索關(guān)鍵 字的微分值)。通過后述的Burst計(jì)算部160b來計(jì)算該Burst值。
返回圖3的說明,用戶辭典表150d是存儲(chǔ)對(duì)新聞和博客進(jìn)行形式要 素分析時(shí)所使用的形式要素的信息的表。圖6是示出用戶辭典表150d的 數(shù)據(jù)結(jié)構(gòu)的一例的圖。如該圖所示,該用戶辭典表150d由形式要素、讀 音、詞類、其他信息構(gòu)成。
形式要素分析結(jié)果管理表150e是作為從新聞和博客中提取的形式要 素的關(guān)鍵字的各種分析結(jié)果的表。圖7是示出形式要素分析結(jié)果管理表 150e的數(shù)據(jù)結(jié)構(gòu)的一例的圖。如該圖所示,該形式要素分析結(jié)果管理表 150e由關(guān)鍵字、日期時(shí)間、文檔源ID、場(chǎng)所、標(biāo)題、增強(qiáng)、鏈接、內(nèi)容 構(gòu)成。
其中,文檔源ID表示包含有相應(yīng)的關(guān)鍵字的文檔的識(shí)別編號(hào)。例如, 在圖7中示出包含"株式會(huì)社A"這樣的關(guān)鍵字的文檔的識(shí)別編號(hào)(文檔源 ID)為"CNOOl、 C函2、 C膽3"。
場(chǎng)所表示該關(guān)鍵字在文檔內(nèi)的位置。例如示出"株式會(huì)社A"這樣的 關(guān)鍵字在文檔源ID"CNOOr的文檔內(nèi)位于第l個(gè)、第15個(gè)、第50個(gè)。
標(biāo)題表示文檔的標(biāo)題所包含的關(guān)鍵字的數(shù)量。例如示出在文檔源 ID"CNOOl"的文檔的標(biāo)題內(nèi)包含一個(gè)"株式會(huì)社A"這樣的關(guān)鍵字。
增強(qiáng)表示該關(guān)鍵字在文檔中被修飾的數(shù)量(表示該關(guān)鍵字在文檔中 利用Bold等增強(qiáng)的數(shù)量,例如,當(dāng)增強(qiáng)關(guān)鍵字"株式會(huì)社A"時(shí),成為"株 式會(huì)社A")。鏈接表示在文檔中關(guān)鍵字展開了鏈接的數(shù)量。內(nèi)容表示文 檔中所包含的關(guān)鍵字的數(shù)量。
Burst計(jì)算參數(shù)表150f是存儲(chǔ)進(jìn)行形式要素分析的結(jié)果、即與從新 聞或博客中提取的各形式要素的Burst值相關(guān)聯(lián)的信息的表。圖8是示出Burst計(jì)算參數(shù)表150f的數(shù)據(jù)結(jié)構(gòu)的一例的圖。如該圖所示,該Burst計(jì) 算參數(shù)表150f由關(guān)鍵字、日期時(shí)間、標(biāo)題、增強(qiáng)、鏈接、內(nèi)容、平均、 Burst值構(gòu)成。
其中,標(biāo)題、增強(qiáng)、鏈接、內(nèi)容分別對(duì)應(yīng)于在圖7中說明的標(biāo)題、 增強(qiáng)、鏈接、內(nèi)容。平均和Burst值對(duì)應(yīng)于在圖5中說明的平均檢索數(shù)量 和Burst值。另外,圖7的平均和Burst值以新聞和博客中的關(guān)鍵字為對(duì) 象(圖5的平均檢索數(shù)量和Burst值以檢索記錄信息中的關(guān)鍵字為對(duì)象)。
綜合Burst存儲(chǔ)表150g是存儲(chǔ)與各關(guān)鍵字對(duì)應(yīng)的綜合突發(fā)值的表。 圖9是示出綜合Burst存儲(chǔ)表150g的數(shù)據(jù)結(jié)構(gòu)的一例的圖。如該圖所示, 該綜合Burst存儲(chǔ)表150g由關(guān)鍵字、日期時(shí)間、SB (kwi)、 CB (kwi)、 a (kwi)、 TB (kwi)構(gòu)成。
其中,SB (kwi)表示檢索記錄信息所包含的關(guān)鍵字的Burst值。根 據(jù)存儲(chǔ)在檢索詞表150c中的各信息來計(jì)算該SB (kwi)。 CB (kwi)表示 新聞或博客所包含的關(guān)鍵字的Burst值。根據(jù)存儲(chǔ)在Burst計(jì)算參數(shù)表150f 中的各信息來計(jì)算該CB (kwi)。
a (kwi)是計(jì)算綜合Burst值時(shí)所利用的系數(shù)。TB (kwi)表示與關(guān) 鍵字對(duì)應(yīng)的綜合Burst值。通過后述的綜合Burst計(jì)算部160e來計(jì)算該綜 合Burst值。綜合Burst存儲(chǔ)表150g存儲(chǔ)各個(gè)時(shí)刻的關(guān)鍵字的SB (kwi)、 CB (kwi)、 a (kwi)、 TB (kwi)。
主題類型管理表150h是將關(guān)鍵字分類為預(yù)先準(zhǔn)備的多個(gè)主題類型 的表。圖IO是示出主題類型管理表150h的數(shù)據(jù)結(jié)構(gòu)的一例的圖。如該 圖所示,該主題類型管理表150h由關(guān)鍵字、日期、主題類型構(gòu)成。.
其中,主題類型表示由用戶檢索的關(guān)鍵字的時(shí)間變化的特征。例如, 在主題類型為"反復(fù)型"的情況下,表示關(guān)鍵字的檢索數(shù)量反復(fù)增加減少。 除此之外,主題類型還存在"遞增型"和"突發(fā)型,,等。"遞增型,,表示關(guān)鍵字 的檢索數(shù)量隨著時(shí)間經(jīng)過平穩(wěn)增加,"突發(fā)型"表示關(guān)鍵字的檢索數(shù)量在 規(guī)定時(shí)間內(nèi)急劇增加。
相關(guān)關(guān)鍵字表150i是將關(guān)鍵字和與該關(guān)鍵字相關(guān)的關(guān)鍵字(相關(guān)關(guān) 鍵字)對(duì)應(yīng)起來迸行存儲(chǔ)的表。圖11是示出關(guān)聯(lián)關(guān)鍵字表150i的數(shù)據(jù)結(jié)構(gòu)的一例的圖。如該圖所示,該相關(guān)關(guān)鍵字表150i由關(guān)鍵字和相關(guān)關(guān)鍵
字構(gòu)成,且分別對(duì)應(yīng)起來。例如,在圖ll的第l段中,作為關(guān)鍵字的株
式會(huì)社A與作為相關(guān)關(guān)鍵字的服務(wù)A和個(gè)人計(jì)算機(jī)B對(duì)應(yīng)。
共現(xiàn)關(guān)鍵字表150J是將關(guān)鍵字和與該關(guān)鍵字具有共現(xiàn)關(guān)系的關(guān)鍵字 (在文檔中與關(guān)鍵字一起出現(xiàn)的關(guān)鍵字,以下為共現(xiàn)關(guān)鍵字)對(duì)應(yīng)起來 進(jìn)行存儲(chǔ)的表。圖12是示出共現(xiàn)關(guān)鍵字表150j的數(shù)據(jù)結(jié)構(gòu)的一例的圖。 如該圖所示,該共現(xiàn)關(guān)鍵字表150j由關(guān)鍵字和共現(xiàn)關(guān)鍵字構(gòu)成,且分別 對(duì)應(yīng)起來。例如,在圖12的第1段中,作為關(guān)鍵字的株式會(huì)社A與作為 共現(xiàn)關(guān)鍵字的研究所和開發(fā)對(duì)應(yīng)。
最終結(jié)果存儲(chǔ)表150k是存儲(chǔ)輸出到用戶終端20的信息的表。圖13 是示出最終結(jié)果存儲(chǔ)表150k的數(shù)據(jù)結(jié)構(gòu)的一例的圖。如該圖所示,該最 終結(jié)果存儲(chǔ)表150k由關(guān)鍵字、日期時(shí)間、TB (kwi)、 SUB (kwi)、主題 類型構(gòu)成。其中,SUB (kwi)表示與關(guān)鍵字一起輸出到用戶終端20的 相關(guān)關(guān)鍵字或共現(xiàn)關(guān)鍵字。另外,最終結(jié)果存儲(chǔ)表150k按照綜合Burst 值TB (kwi)的大小順序存儲(chǔ)關(guān)鍵字。
返回圖3的說明,控制部160具有用于存儲(chǔ)規(guī)定了各種處理步驟的 程序和控制數(shù)據(jù)的內(nèi)部存儲(chǔ)器,是通過這些程序和數(shù)據(jù)來執(zhí)行各種處理 的控制單元,特別地,作為與本發(fā)明密切相關(guān)聯(lián)的部分,如圖3所示, 控制部160具有數(shù)據(jù)管理部160a、 Burst計(jì)算部160b、用戶辭典登記部 160c、形式要素分析部160d、綜合Burst計(jì)算部160e、主題類型判定部 160f、相關(guān)關(guān)鍵字檢測(cè)部160g、共現(xiàn)關(guān)鍵字檢測(cè)部160h、輸出關(guān)鍵字判 定處理部160i。
其中,數(shù)據(jù)管理部160a是如下的單元從服務(wù)器40取得檢索記錄 信息,將其存儲(chǔ)在Web內(nèi)容數(shù)據(jù)庫150a中,并且,從各種內(nèi)容存儲(chǔ)裝置 30取得各種內(nèi)容的信息,將其存儲(chǔ)在Web內(nèi)容數(shù)據(jù)庫150a中。另外, 數(shù)據(jù)管理部160a在收集保證了發(fā)布日期時(shí)間的各種內(nèi)容的情況下,利用 現(xiàn)有技術(shù)(日本特開2006-236262)所公開的技術(shù)即可。
并且,數(shù)據(jù)管理部160a進(jìn)行存儲(chǔ)在Web內(nèi)容數(shù)據(jù)庫150a中的新聞 和博客的索引化,生成新聞/博客表150b (參照?qǐng)D4)。另外,在進(jìn)行索引化的情況下,關(guān)于從新聞/博客中選擇的關(guān)鍵字,只要能夠通過日期時(shí)間 和所選擇的關(guān)鍵字唯一確定該新聞或博客,則可以選擇任意的關(guān)鍵字。
進(jìn)而,數(shù)據(jù)管理部160a根據(jù)存儲(chǔ)在Web內(nèi)容數(shù)據(jù)庫150a中的檢索 記錄信息,生成檢索詞表150c (參照?qǐng)D5)。在生成檢索詞表的情況下, 數(shù)據(jù)管理部160a根據(jù)檢索記錄信息所包含的過去的關(guān)鍵字的檢索數(shù)量, 計(jì)算平均檢索數(shù)量,將計(jì)算出的平均檢索數(shù)量存儲(chǔ)在檢索詞表150c中。
Burst計(jì)算部160b是根據(jù)檢索詞表150c或Burst計(jì)算參數(shù)表150f來 計(jì)算Burst值的單元。首先,說明Burst計(jì)算部160b根據(jù)檢索詞表150c 計(jì)算Burst值的情況。如上所述,該Burst值是表示由用戶檢索的關(guān)鍵字 的每單位時(shí)間的增加量的值。Burst值如何計(jì)算都可以,例如能夠通過下 式計(jì)算。
UU( Wi) x (\jU《Wi) - , fUUk(Wi) AT"W')l:-^-^~~^-i …(1〉
這里,說明式(1)的各項(xiàng)目。UUt(Wi)表示時(shí)刻t時(shí)的關(guān)鍵字(wi) 的用戶數(shù)量,Q,表示UUt (Wi)的校正值。使用式(1),能夠計(jì)算時(shí)刻 t時(shí)的Burst值A(chǔ)Tt (Wi) 1。另夕卜,式(1)的分母對(duì)應(yīng)于檢索詞表的平 均檢索數(shù)量,式(1)的UUt (Wi)對(duì)應(yīng)于檢索詞表150c的檢索數(shù)量。 Burst計(jì)算部160b與關(guān)鍵字對(duì)應(yīng)地將Burst值A(chǔ)Tt (W》1存儲(chǔ)在檢索詞 表150c的Burst值域中。
接著,說明Burst計(jì)算部160b根據(jù)Burst計(jì)算參數(shù)表150f計(jì)算Burst 值的情況。此時(shí)的Burst值例如能夠通過下式計(jì)算。
廣 Ct2 。t-l 、
、_t — 1 J
AT《Wi)2:-^~i^i-^' ...(2)
這里,說明式(2)的各項(xiàng)目。Ft (Wi)表示時(shí)刻t發(fā)布的內(nèi)容所包 含的關(guān)鍵字的頻度,Ct2表示Ft (Wi)的校正值。使用式(2),能夠計(jì)算 時(shí)刻t的Burst值A(chǔ)Tt (Wi) 2。另外,式(2)的分母對(duì)應(yīng)于Burst計(jì)算 參數(shù)表150f的平均,式(2)的Ft (Wi)對(duì)應(yīng)于Burst計(jì)算參數(shù)表150f
18的內(nèi)容。Burst計(jì)算部160b與關(guān)鍵字對(duì)應(yīng)地將Burst值A(chǔ)Tt (W》2存儲(chǔ) 在Burst計(jì)算參數(shù)表I50f的Burst值域中。
用戶辭典登記部160c是如下的單元根據(jù)存儲(chǔ)在檢索詞表150c中 的信息,檢索存儲(chǔ)在Burst值域中的Burst值為閾值以上的關(guān)鍵字,將檢 索到的關(guān)鍵字存儲(chǔ)在用戶辭典表150d (參照?qǐng)D6)中。
形式要素分析部160d是如下的單元使用用戶辭典表150d的形式 要素域所記載的各關(guān)鍵字,執(zhí)行新聞/博客表150b的新聞(博客)內(nèi)容域 所記載的文本內(nèi)容或Web內(nèi)容數(shù)據(jù)庫150a所記載的信息的形式要素分 析。形式要素分析部160d將形式要素分析結(jié)果存儲(chǔ)在形式要素分析結(jié)果 管理表150e中。
形式要素分析部160d根據(jù)新聞/博客表150b的新聞(博客)內(nèi)容域 所記載的文本內(nèi)容或Web內(nèi)容數(shù)據(jù)庫150a所記載的信息,使用由形式要 素分析結(jié)果得到的形式要素(關(guān)鍵字),對(duì)標(biāo)題所包含的關(guān)鍵字的數(shù)量、 被增強(qiáng)的關(guān)鍵字的數(shù)量、關(guān)鍵字展開鏈接的數(shù)量、以及新聞和博客所包 含的關(guān)鍵字的數(shù)量進(jìn)行計(jì)數(shù)。
形式要素分析部160d將所計(jì)數(shù)的數(shù)量與關(guān)鍵字對(duì)應(yīng)起來存儲(chǔ)在形 式要素分析結(jié)果表150e的標(biāo)題域、增強(qiáng)域、鏈接域、內(nèi)容域中。并且, 形式要素分析部160d也將文檔源ID、場(chǎng)所的信息存儲(chǔ)在形式要素分析結(jié) 果表150e中。
進(jìn)而,形式要素分析部160d根據(jù)由形式要素分析結(jié)果得到的形式要 素(關(guān)鍵字)和存儲(chǔ)在Web內(nèi)容數(shù)據(jù)庫150a或新聞/博客表150b中的信 息,生成Burst計(jì)算參數(shù)表150f (參照?qǐng)D8)。形式要素分析部160d根據(jù) 存儲(chǔ)在Web內(nèi)容數(shù)據(jù)庫150a或新聞/博客表150b中的信息所包含的關(guān)鍵 字的檢索數(shù)量,計(jì)算每單位時(shí)間檢索關(guān)鍵字的平均檢索數(shù)量。將計(jì)算出 的平均檢索數(shù)量存儲(chǔ)在Burst計(jì)算參數(shù)表150f的平均域中。
綜合Burst計(jì)算部160e是計(jì)算與關(guān)鍵字對(duì)應(yīng)的綜合Burst值的單元。 具體而言,說明綜合Burst計(jì)算部160e進(jìn)行的處理時(shí),能夠通過TB(kwi) =SB (kwi) xCB (kwi) +a (kwi),來計(jì)算與關(guān)鍵字對(duì)應(yīng)的綜合Burst 值TB (kwi)。這里,說明各項(xiàng)目時(shí),SB (kwi)表示存儲(chǔ)在檢索詞表150c的Burst值域中(與該關(guān)鍵字對(duì)應(yīng))的Burst值。并且,CB (kwi)表示 存儲(chǔ)在Burst計(jì)算參數(shù)表150f的Burst值域中(與該關(guān)鍵字對(duì)應(yīng))的Burst 值。
a (kwi)是通過表示存儲(chǔ)在Burst計(jì)算參數(shù)表150f的標(biāo)題域中的關(guān) 鍵字的數(shù)量的T (kwi)、表示存儲(chǔ)在增強(qiáng)域中的關(guān)鍵字的數(shù)量的L (kwi)、 和表示存儲(chǔ)在鏈接域中的關(guān)鍵字的數(shù)量的E (kwi)計(jì)算出的值,具體而 言,通過a (kwi) -卩x (T (kwi) +L (kwi) +E (kwi))來計(jì)算。上述 式中的|3是用于取得綜合Burst值的平衡的系數(shù)。
綜合Burst計(jì)算部160e將計(jì)算出的綜合Burst值(TB (kwi))與關(guān) 鍵字對(duì)應(yīng)起來存儲(chǔ)在綜合Burst存儲(chǔ)表150g (參照?qǐng)D9)中。另夕卜,綜合 Burst計(jì)算部160e根據(jù)Burst計(jì)算參數(shù)表150f,預(yù)先登記與綜合Burst存 儲(chǔ)表150g的各關(guān)鍵字對(duì)應(yīng)的SB (kwi)、 CB (kwi)、 a (kwi)的值。另 外,綜合Burst計(jì)算部160e在SB (kwi)的值為0的情況下,代替0而 登記1 。同樣,綜合Burst計(jì)算部160e在CB (kwi)的值為0的情況下, 代替0而登記1 。
主題類型判定部160f是如下的單元判定與關(guān)鍵字對(duì)應(yīng)的主題類型 (反復(fù)型、遞增型或突發(fā)型),按照每個(gè)關(guān)鍵字將判定結(jié)果存儲(chǔ)在主題類 型管理表中。具體而言,主題類型判定部160f檢測(cè)存儲(chǔ)在綜合Burst存 儲(chǔ)表150g的TB (kwi)域中的綜合Burst值為閾值以上的關(guān)鍵字。
而且,主題類型判定部160f計(jì)算與檢測(cè)到的關(guān)鍵字對(duì)應(yīng)的綜合Burst 值在過去一定期間內(nèi)的時(shí)間序列推移,在多個(gè)時(shí)刻計(jì)算從過去的t-1到t (在t中代入與每天的時(shí)刻對(duì)應(yīng)的數(shù)值)的微分值,根據(jù)各時(shí)刻的微分值 來判定主題類型。另外,能夠根據(jù)過去一定期間內(nèi)的綜合Burst值和日期 時(shí)間之間的關(guān)系,通過近似式來確定過去一定期間內(nèi)的綜合Burst值的時(shí) 間序列推移。
在各時(shí)刻的微分值反復(fù)加減n次以上的情況下,主題類型判定部160f 將對(duì)應(yīng)的關(guān)鍵字的主題類型判定為"反復(fù)型"。并且,在各時(shí)刻的微分值 在規(guī)定期間以上的期間連續(xù)增加m次以上的情況下,主題類型判定部 160f將對(duì)應(yīng)的關(guān)鍵字的主題類型判定為"遞增型"。并且,在各時(shí)刻的微分值在小于規(guī)定期間的期間連續(xù)增加m次的情況下,主題類型判定部 160f將對(duì)應(yīng)的關(guān)鍵字的主題類型判定為"突發(fā)型"。
相關(guān)關(guān)鍵字檢測(cè)部160g是利用綜合Burst值為閾值以上的關(guān)鍵字來 檢測(cè)相關(guān)系數(shù)為規(guī)定值以上的關(guān)鍵字組的單元。具體而言,該相關(guān)關(guān)鍵 字檢測(cè)部160g根據(jù)綜合Burst存儲(chǔ)表150g,取出綜合Burst值TB (kwi) 為閾值T以上的關(guān)鍵字。
而且,相關(guān)關(guān)鍵字檢測(cè)部160g利用所取出的各關(guān)鍵字的綜合Burst 值TB (kwi),計(jì)算相關(guān)系數(shù)。相關(guān)系數(shù)如何計(jì)算都可以,例如能夠通過 下式計(jì)算。 — 一
這里,說明式(3)的各項(xiàng)目,Xi對(duì)應(yīng)于關(guān)鍵字的綜合Burst值TB(kwi), yi對(duì)應(yīng)于作為相關(guān)系數(shù)的比較對(duì)象的關(guān)鍵字的綜合Burst值(kwj)。
相關(guān)關(guān)鍵字檢測(cè)部160g使用式(3)取出與關(guān)鍵字的相關(guān)系數(shù)為規(guī) 定值以上的關(guān)鍵字組,將取出的關(guān)鍵字組作為相關(guān)關(guān)鍵字CO (kwi)存 儲(chǔ)在相關(guān)關(guān)鍵字表中。由存儲(chǔ)在圖11的第1段中的結(jié)果可知,關(guān)鍵字"株 式會(huì)社A"的綜合Burst值TB (kwi)和相關(guān)關(guān)鍵字"服務(wù)A"的綜合Burst 值TB (kwj)之間的相關(guān)系數(shù)為規(guī)定值以上。同樣,可知關(guān)鍵字"株式會(huì) 社A"的綜合Burst值TB(kwi)和相關(guān)關(guān)鍵字"個(gè)人計(jì)算機(jī)B"的綜合Burst 值TB (kwi)之間的相關(guān)系數(shù)為規(guī)定值以上。
共現(xiàn)關(guān)鍵字檢測(cè)部160h是如下的單元利用綜合Burst值為閾值以 上的關(guān)鍵字,取出在文檔中與該關(guān)鍵字一起出現(xiàn)(共現(xiàn))的關(guān)鍵字,作 為共現(xiàn)關(guān)鍵字。
具體而言,共現(xiàn)關(guān)鍵字檢測(cè)部160h根據(jù)綜合Burst存儲(chǔ)表150g,取 出綜合Burst值TB (kwi)為閾值T以上的關(guān)鍵字。然后,共現(xiàn)關(guān)鍵字檢 測(cè)部160h根據(jù)所取出的關(guān)鍵字和形式要素分析結(jié)果表150e,確定該關(guān)鍵 字的場(chǎng)所(文檔上的位置)。
共現(xiàn)關(guān)鍵字檢測(cè)部160h根據(jù)所確定的場(chǎng)所和Web內(nèi)容數(shù)據(jù)庫150a 或新聞/博客表150b,取出場(chǎng)所值前后的m個(gè)詞(關(guān)鍵字)作為共現(xiàn)關(guān)鍵字RK (kwi),將所取出的共現(xiàn)關(guān)鍵字與對(duì)應(yīng)的關(guān)鍵字對(duì)應(yīng)起來存儲(chǔ)在共 現(xiàn)關(guān)鍵字表150J中。共現(xiàn)關(guān)鍵字檢測(cè)部160h還針對(duì)其他文檔源ID執(zhí)行 該處理。
另外,共現(xiàn)關(guān)鍵字檢測(cè)部160h在將共現(xiàn)關(guān)鍵字存儲(chǔ)在共現(xiàn)關(guān)鍵字表 150J中的情況下,按照文檔上的共現(xiàn)關(guān)鍵字的頻度的大小順序進(jìn)行存儲(chǔ)。 在圖12的第1段所示的例子中,按照研究所、開發(fā)、...的順序存儲(chǔ)共現(xiàn) 關(guān)鍵字,所以,關(guān)于與關(guān)鍵字"株式會(huì)社A"—起出現(xiàn)在文檔上的頻度,共 現(xiàn)關(guān)鍵字"研究所"的頻度比"幵發(fā)"的頻度大。
輸出關(guān)鍵字判定處理部160i是如下的單元生成輸出到用戶終端20 的關(guān)鍵字組(存儲(chǔ)在最終結(jié)果存儲(chǔ)表150k中的信息),將所生成的關(guān)鍵 字組輸出到用戶終端20。具體而言,輸出關(guān)鍵字判定處理部160i通過關(guān) 鍵字(kwi) &相關(guān)關(guān)鍵字0) (kwi) & RK (kwi) &日期時(shí)間這樣的檢 索條件來檢索新聞/博客表150b。
輸出關(guān)鍵字判定處理部160i在命中該檢索條件的件數(shù)為1以上的情 況下,.將與檢索條件對(duì)應(yīng)的關(guān)鍵字、日期時(shí)間、綜合Burst值TB (kwi)、 SUB (kwi)以及關(guān)鍵字的主題類型存儲(chǔ)在最終結(jié)果存儲(chǔ)表150k中。另 外,在SUB (kwi)中存儲(chǔ)檢索條件所包含的相關(guān)關(guān)鍵字CO (kwi)和共 現(xiàn)關(guān)鍵字RK (kwi)。輸出關(guān)鍵字判定處理部160i根據(jù)主題類型管理表 150h,將關(guān)鍵字的主題類型存儲(chǔ)在最終結(jié)果存儲(chǔ)表中。輸出關(guān)鍵字判定 處理部160i按照綜合Burst值的大小順序?qū)Υ鎯?chǔ)在最終結(jié)果存儲(chǔ)表150k 中的關(guān)鍵字進(jìn)行存儲(chǔ)。
在上述檢索結(jié)果的出現(xiàn)數(shù)量為0的情況下,從檢索條件中排除頻度 低的相關(guān)關(guān)鍵字CO (kwi)或共現(xiàn)關(guān)鍵字RK (kwi),再次檢索新聞/博 客表150b。輸出關(guān)鍵字判定處理部160i進(jìn)行檢索條件的再次設(shè)定(從檢 索條件中排除頻度低的相關(guān)關(guān)鍵字CO (kwi)或共現(xiàn)關(guān)鍵字RK (kwi) 的設(shè)定)并反復(fù)進(jìn)行檢索,直到檢索結(jié)果的出現(xiàn)數(shù)量為l以上。
另外,輸出關(guān)鍵字判定處理部160i參照最終結(jié)果存儲(chǔ)表150k的主 題類型域,取出突發(fā)型的關(guān)鍵字。然后,輸出關(guān)鍵字判定處理部160j通 過所取出的關(guān)鍵字(kwi) &CO (kwi) & RK (kwi)這樣的從檢索條件
22中排除日期時(shí)間后的新的檢索條件,檢索新聞/博客表150b,判定出現(xiàn)件 數(shù)是否大于1。在輸出關(guān)鍵字判定處理部160i判定為出現(xiàn)件數(shù)大于1的 情況下,刪除對(duì)應(yīng)的關(guān)鍵字的主題類型"突發(fā)型"。在除此之外的情況下, 保留主題類型。
接著,說明本實(shí)施例的網(wǎng)絡(luò)話題積累裝置100的處理。圖14是示出 本實(shí)施例的網(wǎng)絡(luò)話題積累裝置100的處理步驟的流程圖。如該圖所示, 在網(wǎng)絡(luò)話題積累裝置100中,數(shù)據(jù)數(shù)據(jù)管理部160a從各種內(nèi)容存儲(chǔ)裝置 30和服務(wù)器40取得新聞、博客、檢索記錄的信息,將其存儲(chǔ)在Web內(nèi) 容數(shù)據(jù)庫150a中(步驟SIOI)。
數(shù)據(jù)管理部160a進(jìn)行存儲(chǔ)在Web內(nèi)容數(shù)據(jù)庫150a中的數(shù)據(jù)的索引 化,生成新聞/博客表150b和檢索詞表150c (步驟S102), Burst計(jì)算部 160b計(jì)算檢索詞表150c所包含的關(guān)鍵字的Burst值(步驟S103)。
接著,用戶辭典登記部160c將Burst值為閾值以上的關(guān)鍵字登記在 用戶辭典表150d中(步驟S104),形式要素分析部160d根據(jù)登記在用戶 辭典表150d中的數(shù)據(jù),對(duì)新聞/博客的文本內(nèi)容執(zhí)行形式要素分析(步驟 S105)。 Burst計(jì)算部160b計(jì)算執(zhí)行形式要素分析的結(jié)果得到的關(guān)鍵字的 Burstf直,將其存儲(chǔ)在Burst計(jì)算參數(shù)表150f中(步驟S106)。
然后,形式要素分析部160d對(duì)標(biāo)題所包含的關(guān)鍵字的數(shù)量進(jìn)行計(jì)數(shù) (步驟S107),對(duì)針對(duì)關(guān)鍵字展開鏈接的數(shù)量進(jìn)行計(jì)數(shù)(步驟S108),對(duì) 通過Bold等增強(qiáng)了關(guān)鍵字的數(shù)量進(jìn)行計(jì)數(shù)(步驟S109)。
綜合Burst計(jì)算部160e根據(jù)Burst計(jì)算參數(shù)表150f計(jì)算綜合Burst 值,將其存儲(chǔ)在綜合Burst存儲(chǔ)表150g中(步驟SllO)。主題類型判定 部160f根據(jù)過去的綜合Burst值的時(shí)間序列推移來判定主題類型,將其 存儲(chǔ)在主題類型管理表150h中(步驟Slll)。
接著,相關(guān)關(guān)鍵字檢測(cè)部160g檢測(cè)與過去的綜合Burst值的時(shí)間序 列推移高度相關(guān)(相關(guān)系數(shù)為閾值以上)的關(guān)鍵字組CO,將其存儲(chǔ)在相 關(guān)關(guān)鍵字表150i中(步驟S112)。共現(xiàn)關(guān)鍵字檢測(cè)部160h在新聞和博客 的內(nèi)容中檢測(cè)與綜合Burst值高(閾值以上)的關(guān)鍵字一起出現(xiàn)的關(guān)鍵字 組RK,將其存儲(chǔ)在共現(xiàn)關(guān)鍵字表150j中(步驟S113)。然后,輸出關(guān)鍵字判定處理部150i根據(jù)綜合Burst值的排名(綜合 Burst值的大小順序),通過關(guān)鍵字(kwi) &相關(guān)關(guān)鍵字CO (kwi) &共 現(xiàn)關(guān)鍵字RK (kwi) &日期時(shí)間(Date)的檢索條件來檢索新聞/博客表 150b (步驟S114),根據(jù)綜合Burst值的排名,以關(guān)鍵字(kwi) +相關(guān)關(guān) 鍵字CO (kwi) +共現(xiàn)關(guān)鍵字10^ (kwi) +主題類型的形式,向用戶終端 20輸出主題(步驟S115)。
這樣,輸出關(guān)鍵字判定處理部以關(guān)鍵字(kwi)+相關(guān)關(guān)鍵字CO(kwi) +共現(xiàn)關(guān)鍵字RW (kwi) +主題類型的形式,向用戶終端20輸出主題, 所以,用戶能夠獲得話題的主題,并且,能夠容易地掌握主題成為話題 的理由。
如上所述,在本實(shí)施例的關(guān)鍵字管理系統(tǒng)中,網(wǎng)絡(luò)話題積累裝置100 計(jì)算表示關(guān)鍵字的每單位時(shí)間的增加值的Burst值,根據(jù)計(jì)算出的Burst 值和與該Burst值對(duì)應(yīng)的關(guān)鍵字在內(nèi)容中的特征(標(biāo)題中包含關(guān)鍵字的數(shù) 量、展開鏈接的數(shù)量、被增強(qiáng)的數(shù)量),計(jì)算綜合Burst值。然后,網(wǎng)絡(luò) 話題積累裝置100根據(jù)綜合Burst值的時(shí)間序列推移,從內(nèi)容中提取與對(duì) 應(yīng)于綜合Burst值的關(guān)鍵字的關(guān)聯(lián)關(guān)鍵字(相關(guān)關(guān)鍵字和共現(xiàn)關(guān)鍵字), 將把關(guān)鍵字和關(guān)聯(lián)關(guān)鍵字對(duì)應(yīng)起來的信息作為主題,輸出到用戶終端20, 所以,明確主題為什么成為話題,并能夠向用戶通知成為話題的主題的
j曰息。
并且,本實(shí)施例的網(wǎng)絡(luò)話題積累裝置100在主題的信息中包含主題 類型并將其輸出到用戶終端,所以,用戶能夠容易地理解通過怎樣的經(jīng) 過成為話題的主題。
并且,在本實(shí)施例的網(wǎng)絡(luò)話題積累裝置100中,形式要素分析部160d 利用存儲(chǔ)在用戶辭典表150d中的形式要素,執(zhí)行新聞或博客的形式要素 分析,所以,能夠更準(zhǔn)確地執(zhí)行未知詞等的切出。
但是,在本實(shí)施例中說明的各處理中,能夠手動(dòng)進(jìn)行作為自動(dòng)進(jìn)行 的處理而說明的處理的全部或一部分,或者,能夠利用公知的方法自動(dòng) 進(jìn)行作為手動(dòng)進(jìn)行的處理而說明的處理的全部或一部分。除此之外,針 對(duì)上述文檔中和附圖中所示的處理步驟、控制步驟、具體名稱、包含各種數(shù)據(jù)和參數(shù)在內(nèi)的信息,除了特意標(biāo)記的情況以外,能夠任意變更。
并且,圖2所示的關(guān)鍵字管理系統(tǒng)的結(jié)構(gòu)和圖3所示的網(wǎng)絡(luò)話題積 累裝置100的各結(jié)構(gòu)要素是功能上的概念,在物理上不一定如圖所示那 樣構(gòu)成。即,各裝置的分散/統(tǒng)合的具體形式不限于圖示的形式,能夠構(gòu) 成為根據(jù)各種負(fù)荷或使用狀況等,以任意單位在功能上或物理上對(duì)其全 部或一部分進(jìn)行分散/統(tǒng)合。進(jìn)而,在各裝置中進(jìn)行的各處理功能的全部 或任意一部分利用CPU和在該CPU中執(zhí)行分析的程序來實(shí)現(xiàn),或者, 也能夠作為基于布線邏輯的硬件來實(shí)現(xiàn)。
圖15是示出構(gòu)成圖3所示的網(wǎng)絡(luò)話題積累裝置100的計(jì)算機(jī)的硬件 結(jié)構(gòu)的圖。該計(jì)算機(jī)50構(gòu)成為,利用總線59來連接接收來自用戶的數(shù) 據(jù)輸入的輸入裝置51、監(jiān)視器52、 RAM (Random Access Memory ) 53、 ROM (Read Only Memory) 54、從記錄了各種程序的記錄介質(zhì)中讀取程 序的介質(zhì)讀取裝置55、經(jīng)由網(wǎng)絡(luò)在與其他計(jì)算機(jī)之間進(jìn)行數(shù)據(jù)收發(fā)的網(wǎng) 絡(luò)接口 56、CPU(Central Processing Unit )57、以及HDD(Hard Disk Drive) 58。
而且,在HDD 58中存儲(chǔ)有發(fā)揮與上述網(wǎng)絡(luò)話題積累裝置100的功 能相同的功能的話題關(guān)鍵字提供程序58b。而且,CPU 57從HDD 58中 讀出并執(zhí)行話題關(guān)鍵字提供程序58b,由此,實(shí)現(xiàn)上述網(wǎng)絡(luò)話題積累裝置 100的功能部的功能的話題關(guān)鍵字提供處理57a起動(dòng)。該話題關(guān)鍵字提供 處理57a對(duì)應(yīng)于圖3所示的數(shù)據(jù)管理部160a、 Burst計(jì)算部160b、用戶辭 典登記部160c、形式要素分析部160d、綜合Burst計(jì)算部160e、主題類 型判定部160f、相關(guān)關(guān)鍵字檢測(cè)部160g、共現(xiàn)關(guān)鍵字檢測(cè)部160h、輸出 關(guān)鍵字判定處理部160i。
并且,在HDD 58中存儲(chǔ)有與存儲(chǔ)在上述網(wǎng)絡(luò)話題積累裝置100的 存儲(chǔ)部150中的數(shù)據(jù)對(duì)應(yīng)的各種數(shù)據(jù)58a。該各種數(shù)據(jù)58a對(duì)應(yīng)于圖3所 示的Web內(nèi)容數(shù)據(jù)庫150a、新聞/博客表150b、檢索詞表150c、用戶辭 典表150d、形式要素分析結(jié)果管理表150e、 Burst計(jì)算參數(shù)表150f、綜 合Burst存儲(chǔ)表150g、主題類型管理表150h、相關(guān)關(guān)鍵字表150i、共現(xiàn) 關(guān)鍵字表150j、最終結(jié)果存儲(chǔ)表150k。CPU57在HDD58中存儲(chǔ)各種數(shù)據(jù)58a,并且,從HDD58中讀出 各種數(shù)據(jù)58a并將其存儲(chǔ)在RAM 53中,利用存儲(chǔ)在RAM 53中的各種 數(shù)據(jù)53a,將成為話題的主題的信息與關(guān)聯(lián)關(guān)鍵字對(duì)應(yīng)起來輸出到用戶終 端20。
產(chǎn)業(yè)上的可利用性
如上所述,本發(fā)明的關(guān)鍵字管理系統(tǒng)在進(jìn)行向用戶終端提供主題的 服務(wù)的系統(tǒng)中是有用的,特別適合于需要提供主題以使用戶能夠舒適地 檢索成為話題的主題的情況。特別地,考慮對(duì)利用時(shí)間序列整理成為話 題的主題并對(duì)用戶感興趣的主題進(jìn)行引用,或附加注釋來收集具有相同 嗜好的用戶的小區(qū)服務(wù)的應(yīng)用。
權(quán)利要求
1.一種關(guān)鍵字管理程序,該關(guān)鍵字管理程序用于對(duì)在與網(wǎng)絡(luò)連接的用戶終端訪問到內(nèi)容時(shí)所利用的關(guān)鍵字進(jìn)行管理的關(guān)鍵字管理系統(tǒng),該關(guān)鍵字管理程序的特征在于,該關(guān)鍵字管理程序使計(jì)算機(jī)執(zhí)行以下步驟突發(fā)值計(jì)算步驟,在該步驟中,計(jì)算突發(fā)值,該突發(fā)值表示所述關(guān)鍵字的每單位時(shí)間的增加值;綜合突發(fā)值計(jì)算步驟,在該步驟中,根據(jù)與所述突發(fā)值對(duì)應(yīng)的關(guān)鍵字在所述內(nèi)容中的特征,對(duì)所述突發(fā)值進(jìn)行校正,從而計(jì)算出綜合突發(fā)值;以及輸出控制步驟,在該步驟中,根據(jù)所述綜合突發(fā)值的時(shí)間序列推移,從所述內(nèi)容中提取與對(duì)應(yīng)于該綜合突發(fā)值的關(guān)鍵字相關(guān)聯(lián)的關(guān)聯(lián)關(guān)鍵字,將所述關(guān)鍵字和關(guān)聯(lián)關(guān)鍵字對(duì)應(yīng)起來輸出到所述用戶終端。
2. 根據(jù)權(quán)利要求1所述的關(guān)鍵字管理程序,其特征在于, 該關(guān)鍵字管理程序還使計(jì)算機(jī)執(zhí)行形式要素分析執(zhí)行步驟,在該步驟中,根據(jù)所述突發(fā)值為閾值以上的關(guān)鍵字,分析在所述內(nèi)容內(nèi)包含的 文本的形式要素,在所述突發(fā)值計(jì)算步驟中,針對(duì)由所述形式要素分析 結(jié)果得到的關(guān)鍵字,進(jìn)一步計(jì)算突發(fā)值。
3. 根據(jù)權(quán)利要求1所述的關(guān)鍵字管理程序,其特征在于, 該關(guān)鍵字管理程序還使計(jì)算機(jī)執(zhí)行分類步驟,在該步驟中,根據(jù)所述綜合突發(fā)值的時(shí)間序列推移,將對(duì)應(yīng)于該綜合突發(fā)值的關(guān)鍵字分類為 .預(yù)先準(zhǔn)備的多個(gè)類型中的任一種類型,在所述輸出控制步驟中,將所述 分類步驟的分類結(jié)果進(jìn)一步輸出到所述用戶終端。
4. 根據(jù)權(quán)利要求1所述的關(guān)鍵字管理程序,其特征在于, 所述關(guān)鍵字在內(nèi)容中的特征包含在所述內(nèi)容中標(biāo)題所包含的所述關(guān)鍵字的數(shù)量、在所述內(nèi)容中展開鏈接的所述關(guān)鍵字的數(shù)量、以及在所 述內(nèi)容中被修飾的所述關(guān)鍵字的數(shù)量。
5. 根據(jù)權(quán)利要求1 4中的任一項(xiàng)所述的關(guān)鍵字管理程序,其特征 在于,在所述輸出控制步驟中,提取與所述綜合突發(fā)值的時(shí)間序列推移相 關(guān)的關(guān)鍵字,作為所述關(guān)聯(lián)關(guān)鍵字。
6. 根據(jù)權(quán)利要求5所述的關(guān)鍵字管理程序,其特征在于, 在所述輸出控制步驟中,進(jìn)一步提取在所述內(nèi)容的文本中與所述綜合突發(fā)值為閾值以上的關(guān)鍵字一起出現(xiàn)的關(guān)鍵字,作為所述關(guān)聯(lián)關(guān)鍵字。
7. —種關(guān)鍵字管理系統(tǒng),該關(guān)鍵字管理系統(tǒng)對(duì)在與網(wǎng)絡(luò)連接的用戶 終端訪問到內(nèi)容時(shí)所利用的關(guān)鍵字進(jìn)行管理,該關(guān)鍵字管理系統(tǒng)的特征在于,該關(guān)鍵字管理系統(tǒng)具有突發(fā)值計(jì)算單元,其計(jì)算突發(fā)值,該突發(fā)值表示所述關(guān)鍵字的每單位時(shí)間的增加值;綜合突發(fā)值計(jì)算單元,其根據(jù)與所述突發(fā)值對(duì)應(yīng)的關(guān)鍵字在所述內(nèi) 容上的特征,對(duì)所述突發(fā)值進(jìn)行校正,從而計(jì)算出綜合突發(fā)值;以及輸出控制單元,其根據(jù)所述綜合突發(fā)值的時(shí)間序列推移,從所述內(nèi) 容中提取與對(duì)應(yīng)于該綜合突發(fā)值的關(guān)鍵字相關(guān)聯(lián)的關(guān)聯(lián)關(guān)鍵字,將所述 關(guān)鍵字和關(guān)聯(lián)關(guān)鍵字對(duì)應(yīng)起來輸出到所述用戶終端。.
8. 根據(jù)權(quán)利要求7所述的關(guān)鍵字管理系統(tǒng),其特征在于, 該關(guān)鍵字管理系統(tǒng)還具有形式要素分析執(zhí)行單元,該形式要素分析執(zhí)行單元根據(jù)所述突發(fā)值為閾值以上的關(guān)鍵字,分析在所述內(nèi)容中包含 的文本的形式要素,所述突發(fā)值計(jì)算單元針對(duì)由所述形式要素分析結(jié)果 得到的關(guān)鍵字,進(jìn)一步計(jì)算突發(fā)值。
9. 根據(jù)權(quán)利要求7所述的關(guān)鍵字管理系統(tǒng),其特征在于, 該關(guān)鍵字管理系統(tǒng)還具有分類單元,該分類單元根據(jù)所述綜合突發(fā)值的時(shí)間序列推移,將對(duì)應(yīng)于該綜合突發(fā)值的關(guān)鍵字分類為預(yù)先準(zhǔn)備的 多個(gè)類型中的任一種類型,所述輸出控制單元將所述分類單元的分類結(jié) 果進(jìn)一步輸出到所述用戶終端。
10. 根據(jù)權(quán)利要求7所述的關(guān)鍵字管理系統(tǒng),其特征在于, 所述關(guān)鍵字在內(nèi)容中的特征包含在所述內(nèi)容中標(biāo)題所包含的所述關(guān)鍵字的數(shù)量、在所述內(nèi)容中展開鏈接的所述關(guān)鍵字的數(shù)量、以及在所 述內(nèi)容中被修飾的所述關(guān)鍵字的數(shù)量。
11. 根據(jù)權(quán)利要求7 10中的任一項(xiàng)所述的關(guān)鍵字管理系統(tǒng),其特 征在于,所述輸出控制單元提取與所述綜合突發(fā)值的時(shí)間序列推移相關(guān)的關(guān) 鍵字,作為所述關(guān)聯(lián)關(guān)鍵字。
12. 根據(jù)權(quán)利要求U所述的關(guān)鍵字管理系統(tǒng),其特征在于, 所述輸出控制單元進(jìn)一步提取在所述內(nèi)容的文本中與所述綜合突發(fā)值為閾值以上的關(guān)鍵字一起出現(xiàn)的關(guān)鍵字,作為所述關(guān)聯(lián)關(guān)鍵字。
13. —種關(guān)鍵字管理方法,該關(guān)鍵字管理方法用于對(duì)在與網(wǎng)絡(luò)連接 的用戶終端訪問到內(nèi)容時(shí)所利用的關(guān)鍵字進(jìn)行管理的關(guān)鍵字管理系統(tǒng), 該關(guān)鍵字管理方法的特征在于,該關(guān)鍵字管理方法包含以下步驟突發(fā)值計(jì)算步驟,在該步驟中,計(jì)算突發(fā)值,該突發(fā)值表示所述關(guān) 鍵字的每單位時(shí)間的增加值;綜合突發(fā)值計(jì)算步驟,在該步驟中,根據(jù)與所述突發(fā)值對(duì)應(yīng)的關(guān)鍵 字在所述內(nèi)容中的特征,對(duì)所述突發(fā)值進(jìn)行校正,從而計(jì)算出綜合突發(fā) 值;以及輸出控制步驟,在該步驟中,根據(jù)所述綜合突發(fā)值的時(shí)間序列推移, 從所述內(nèi)容中提取與對(duì)應(yīng)于該綜合突發(fā)值的關(guān)鍵字相關(guān)聯(lián)的關(guān)聯(lián)關(guān)鍵 字,將所述關(guān)鍵字和關(guān)聯(lián)關(guān)鍵字對(duì)應(yīng)起來輸出到所述用戶終端。
14. 根據(jù)權(quán)利要求13所述的關(guān)鍵字管理方法,其特征在于, 該關(guān)鍵字管理方法還包含形式要素分析執(zhí)行步驟,在該步驟中,根據(jù)所述突發(fā)值為閾值以上的關(guān)鍵字,分析在所述內(nèi)容中包含的文本的形 式要素,在所述突發(fā)值計(jì)算步驟中,針對(duì)由所述形式要素分析結(jié)果得到 的關(guān)鍵字,進(jìn)一步計(jì)算突發(fā)值。
15. 根據(jù)權(quán)利要求13所述的關(guān)鍵字管理方法,其特征在于, 該關(guān)鍵字管理方法還包含分類步驟,在該步驟中,根據(jù)所述綜合突發(fā)值的時(shí)間序列推移,將對(duì)應(yīng)于該綜合突發(fā)值的關(guān)鍵字分類為預(yù)先準(zhǔn)備 的多個(gè)類型中的任一種類型,在所述輸出控制步驟中,將所述分類步驟 的分類結(jié)果進(jìn)一步輸出到所述用戶終端。
16. 根據(jù)權(quán)利要求13所述的關(guān)鍵字管理方法,其特征在于,所述關(guān)鍵字在內(nèi)容中的特征包含在所述內(nèi)容中標(biāo)題所包含的所述 關(guān)鍵字的數(shù)量、在所述內(nèi)容中展開鏈接的所述關(guān)鍵字的數(shù)量、在所述內(nèi) 容中被修飾的所述關(guān)鍵字的數(shù)量。
17. 根據(jù)權(quán)利要求13 16中的任一項(xiàng)所述的關(guān)鍵字管理方法,其特 征在于,在所述輸出控制步驟中,提取與所述綜合突發(fā)值的時(shí)間序列推移相 關(guān)的關(guān)鍵字,作為所述關(guān)聯(lián)關(guān)鍵字。
18. 根據(jù)權(quán)利要求17所述的關(guān)鍵字管理方法,其特征在于, 在所述輸出控制步驟中,進(jìn)一步提取在所述內(nèi)容的文本中與所述綜合突發(fā)值為閾值以上的關(guān)鍵字一起出現(xiàn)的關(guān)鍵字,作為所述關(guān)聯(lián)關(guān)鍵字。
全文摘要
本發(fā)明提供關(guān)鍵字管理程序、關(guān)鍵字管理系統(tǒng)和關(guān)鍵字管理方法。在關(guān)鍵字管理系統(tǒng)中,網(wǎng)絡(luò)話題積累裝置(100)計(jì)算表示關(guān)鍵字的每單位時(shí)間的增加值的Burst值,根據(jù)計(jì)算出的Burst值和與該Burst值對(duì)應(yīng)的關(guān)鍵字在內(nèi)容中的特征(標(biāo)題中包含關(guān)鍵字的數(shù)量、展開鏈接的數(shù)量、被增強(qiáng)的數(shù)量),計(jì)算綜合Burst值。然后,網(wǎng)絡(luò)話題積累裝置(100)根據(jù)綜合Burst值的時(shí)間序列推移,從內(nèi)容中提取與對(duì)應(yīng)于綜合Burst值的關(guān)鍵字的關(guān)聯(lián)關(guān)鍵字(相關(guān)關(guān)鍵字和共現(xiàn)關(guān)鍵字),將把關(guān)鍵字和關(guān)聯(lián)關(guān)鍵字對(duì)應(yīng)起來的信息作為主題,輸出到用戶終端(20)。
文檔編號(hào)G06F17/30GK101583951SQ20078005010
公開日2009年11月18日 申請(qǐng)日期2007年1月18日 優(yōu)先權(quán)日2007年1月18日
發(fā)明者內(nèi)野寬治, 岡本青史, 軍 張, 高橋哲朗 申請(qǐng)人:富士通株式會(huì)社