欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種情報收集處理和檢索系統(tǒng)的制作方法

文檔序號:6516348閱讀:463來源:國知局
一種情報收集處理和檢索系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種情報收集處理和檢索系統(tǒng),其包括情報收集模塊、情報處理模塊、檢索模塊以及情報庫,還包括知識庫,所述的知識庫包括興趣模型庫、專業(yè)領(lǐng)域知識庫、權(quán)威網(wǎng)址列表以及閾值庫;所述情報收集模塊包括搜索器和興趣制定模塊,所述興趣制定模塊,為用戶制定興趣定制與文檔相關(guān)度模型;通過用戶定義以及興趣相關(guān)度計算的方式,實現(xiàn)了下載信息的過濾與分類,并能夠較好地實現(xiàn)互聯(lián)網(wǎng)上公開情報信息的收集、處理與管理問題。
【專利說明】一種情報收集處理和檢索系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種情報收集處理和檢索系統(tǒng),其包括情報收集模塊、情報處理模塊、檢索模塊以及情報庫。
【背景技術(shù)】
[0002]隨著時代與技術(shù)的發(fā)展,在報刊、圖書、地圖、聲像資料等眾多公開情報來源當中,互聯(lián)網(wǎng)已經(jīng)成了進行公開情報收集的一個重要渠道。計算機互聯(lián)網(wǎng)絡(luò)已經(jīng)遍布全球,因特網(wǎng)已經(jīng)廣泛應(yīng)用于政治、經(jīng)濟、軍事等各個領(lǐng)域,已經(jīng)形成超越傳統(tǒng)地理空間的“計算機網(wǎng)絡(luò)空間”,其時效性、方便性及內(nèi)容的豐富性都十分突出。
[0003]但是,Internet是海量信源,而且是一個開放、分布的信息空間,它本身所固有的三個特點已經(jīng)明顯阻礙了人們對Inter-net上信息資源的充分使用:UInternet上可利用的信息是無組織的,多種結(jié)構(gòu)形式的,并且分布在全世界的各個站點上;2、資料和服務(wù)的類型以及數(shù)量每天都在大量增加。因而信息可利用性和可靠性也在不斷地變化;3、由于信息源的動態(tài)性以及潛在的有用信息的更新和保存問題,信息常常是模糊的,有時甚至是錯誤的。
[0004]如何確定情報搜集的方向,并找到一種高效的收集方式,也就是在互聯(lián)網(wǎng)上如何找、以及怎樣找,是進行公開情報收集的一個急需解決的問題。目前所提供的信息檢索方式,如搜索引擎,并不能從根本上解決這方面的問題。其原因有以下幾點:1、用戶的興趣表達方式與計算機對用戶興趣的理解與識別之間存在相當?shù)木嚯x;2、在檢索過程中,會有大量不相關(guān)的信息被提供給用戶,產(chǎn)生“信息過載”的現(xiàn)象;3、幾乎所有的搜索引擎都不能對互聯(lián)網(wǎng)的所有信息進行索引,所涵蓋的只是其中的一部分,因此不能保證情報的查全率;4、搜索引擎在尋找信息過程中,不能對有限制的站點進行破解與索引。因此,這些站點的信息會被遺漏;5、搜索引擎在檢索信息時,不能保證信息的時效性和權(quán)威性,這對進行情報收集來說,也是一個非常嚴重、甚至是致命的弱點。

【發(fā)明內(nèi)容】

[0005]本發(fā)明所要解決的技術(shù)問題是提供一種情報收集處理和檢索系統(tǒng),其包括情報收集模塊、情報處理模塊、檢索模塊以及情報庫,通過用戶定義以及興趣相關(guān)度計算的方式,實現(xiàn)了下載信息的過濾與分類,并能夠較好地實現(xiàn)互聯(lián)網(wǎng)上公開情報信息的收集、處理與管理問題,解決了用戶的興趣表達方式與計算機對用戶興趣的理解與識別之間存在相當?shù)木嚯x的技術(shù)問題。
[0006]本發(fā)明解決上述技術(shù)問題的技術(shù)方案如下:一種情報收集處理和檢索系統(tǒng),其包括情報收集模塊、情報處理模塊、檢索模塊以及情報庫,其特征在于:還包括知識庫,所述的知識庫包括興趣模型庫、專業(yè)知識庫、挖掘規(guī)則庫、權(quán)威網(wǎng)址列表以及閾值庫;所述情報收集模塊包括搜索器和興趣制定模塊;所述興趣制定模塊,為用戶制定興趣定制與文檔相關(guān)度模型。[0007]進一步,所述專業(yè)領(lǐng)域知識庫包括專業(yè)同義詞庫、專業(yè)異義詞庫、地理信息庫、人名庫。
[0008]進一步,所述興趣制定模塊的工作步驟如下。
[0009]步驟一,情報用戶以專題來表達并提交他的興趣。
[0010]步驟二,將所述專題名稱經(jīng)過地名、人名專用名詞的抽取處理后作為關(guān)鍵詞的一個最重要部分,抽取出來的專用名詞加入所述專題的關(guān)鍵詞列表;
[0011]步驟三,設(shè)置所述專題為T、關(guān)鍵詞為K1,K2,…,Κη,所述關(guān)鍵詞Κ1,Κ2,…,Kn的字符長度分別為11,12,…,In,文檔D中的出現(xiàn)Κ1,Κ2,…,Kn的頻率分別為Π,f2,-,fn,文檔D的字符數(shù)為L ;
[0012]步驟四,令所述關(guān)鍵詞Ki的權(quán)重Wi為:
[0013]
【權(quán)利要求】
1.一種情報收集處理和檢索系統(tǒng),其包括情報收集模塊、情報處理模塊、檢索模塊以及情報庫,其特征在于:還包括知識庫,所述的知識庫包括興趣模型庫、專業(yè)知識庫、挖掘規(guī)則庫、權(quán)威網(wǎng)址列表以及閾值庫;所述情報收集模塊包括搜索器和興趣制定模塊; 所述興趣制定模塊,為用戶制定興趣定制與文檔相關(guān)度模型。
2.根據(jù)權(quán)利要求1所述一種情報收集處理和檢索系統(tǒng),其特征在于,所述專業(yè)知識庫包括專業(yè)同義詞庫、專業(yè)異義詞庫、地理信息庫和人名庫。
3.根據(jù)權(quán)利要求1所述一種情報收集處理和檢索系統(tǒng),其特征在于,所述興趣制定模塊的工作步驟如下: 步驟一,情報用戶以專題來表達并提交他的興趣; 步驟二,將所述專題名稱經(jīng)過地名、人名專用名詞的抽取處理后作為關(guān)鍵詞的一個最重要部分,抽取出來的專用名詞加入所述專題的關(guān)鍵詞列表; 步驟三,設(shè)置所述專題為T、關(guān)鍵詞為Kl,K2,…,Kn,所述關(guān)鍵詞Kl,K2,…,Kn的字符長度分別為11,12,…,In,文檔D中的出現(xiàn)K1,K2,.'Kn的頻率分別為fl,f2,…,fn,文檔D的字符數(shù)為L ; 步驟四,令所述關(guān)鍵詞Ki的權(quán)重wi為:
4.根據(jù)權(quán)利要求1所述一種情報收集處理和檢索系統(tǒng),其特征在于,所述檢索模塊還包括:自動摘要模塊、自動分類模塊和搜索引擎模塊。
【文檔編號】G06F17/30GK103530398SQ201310502517
【公開日】2014年1月22日 申請日期:2013年10月23日 優(yōu)先權(quán)日:2013年10月23日
【發(fā)明者】江彩蓮 申請人:合山市科學技術(shù)情報研究所
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
年辖:市辖区| 沽源县| 达州市| 英吉沙县| 马山县| 礼泉县| 峨眉山市| 吐鲁番市| 囊谦县| 资兴市| 大城县| 毕节市| 临泉县| 东明县| 罗甸县| 黎川县| 黄龙县| 木里| 攀枝花市| 海口市| 溆浦县| 年辖:市辖区| 太谷县| 保德县| 崇礼县| 河池市| 密山市| 平武县| 嘉义县| 株洲县| 阿克苏市| 富裕县| 西昌市| 呼图壁县| 固原市| 寻甸| 梅州市| 乌拉特中旗| 汽车| 舒城县| 郧西县|