欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

網(wǎng)站支撐數(shù)據(jù)庫安全搜索引擎系統(tǒng)的制作方法

文檔序號:6459946閱讀:248來源:國知局
專利名稱:網(wǎng)站支撐數(shù)據(jù)庫安全搜索引擎系統(tǒng)的制作方法
技術領域
本發(fā)明屬于計算機檢索技術,具體涉及一種網(wǎng)站支撐數(shù)據(jù)庫安全搜索 引擎系統(tǒng),該系統(tǒng)結合了互聯(lián)網(wǎng)搜索引擎、數(shù)據(jù)庫全文檢索及基于訪問控 制的搜索引擎等技術,對網(wǎng)站支撐數(shù)據(jù)庫中所存放的網(wǎng)頁文本信息及其描 述信息建立索引,用戶可檢索出其權限許可范圍內的所有文本資源,并以 原始網(wǎng)頁的形式展示文本資源。
背景技術
隨著互聯(lián)網(wǎng)技術的迅猛發(fā)展,越來越多的企業(yè)和組織用網(wǎng)站的形式發(fā) 布消息和資源、實現(xiàn)業(yè)務流程,這種方式極大地方便了管理者對資源的管 理和用戶對資源的訪問和使用。隨著信息資源不斷完善豐富、業(yè)務流程靈 活性要求不斷提高,通過靜態(tài)頁面的超級鏈接的形式訪問所有的信息資源 己經(jīng)不夠現(xiàn)實, 一些資源往往需要用戶在特定頁面中選擇或輸入相關條件 后才能在網(wǎng)頁上顯示出來。同時,不同的企業(yè)或組織為了自身的利益或其 他目的對其網(wǎng)站中的資源實施訪問控制,將不同資源的訪問權限授予不同 的用戶群體,訪問控制技術在提高資源安全性的同時,也為搜索引擎對資 源的檢索設置了障礙。
傳統(tǒng)搜索引擎系統(tǒng)通過爬行器對所有的網(wǎng)站資源進行爬行,對所獲得 的資源通過分詞等技術建立全文索引文件,并將所建立的全文索引文件置 于服務器端,當用戶查詢資源時,搜索程序通過分詞技術將用戶査詢條件 分解為索引項在已建立的索引文件中進行搜索,并將搜索到的結果反饋給 用戶。由此可以看出,傳統(tǒng)搜索引擎系統(tǒng)無法采集到受控的資源,比如不 同權限的用戶可訪問不同的資源。其次,傳統(tǒng)搜索引擎系統(tǒng)注重通用性, 不會獲取用戶身份,因此無法根據(jù)用戶的不同而返回不同的搜索結果。
基于訪問控制的安全搜索引擎系統(tǒng)對傳統(tǒng)搜索引擎系統(tǒng)進行改進,不 僅能夠對網(wǎng)絡中受安全訪問控制下的文件進行信息檢索,還能夠對安全訪問控制下的資源進行分析,并通過用戶信息建立索引,自動實現(xiàn)對復雜訪 問控制環(huán)境下受控資源的檢索與訪問。該系統(tǒng)解決了傳統(tǒng)搜索引擎系統(tǒng)不 能檢索受控資源的問題,可以根據(jù)用戶身份信息檢索到用戶權限許可范圍 內的網(wǎng)頁資源,但是該系統(tǒng)只能檢索到爬行器所能收集到的網(wǎng)頁資源,對 于爬行器不能收集到的資源則無能為力,如上文所述,網(wǎng)站中大量的資源 往往需要用戶在特定頁面中選擇或輸入相關條件后才能在網(wǎng)頁上顯示出 來,對于這部分資源基于訪問控制的安全搜索引擎則無法檢索。
數(shù)據(jù)庫全文檢索系統(tǒng)對數(shù)據(jù)庫的文本字段建立索引,在索引的支持下 能夠實現(xiàn)很高的查全率。將數(shù)據(jù)庫全文檢索系統(tǒng)直接用于網(wǎng)站支撐數(shù)據(jù)庫 存在以下兩個問題第一個問題是安全問題,系統(tǒng)雖然能夠保證查全率, 但是不能根據(jù)用戶的身份確定用戶所能査看的信息資源,使得該系統(tǒng)無法 應用于有受控資源的網(wǎng)站,現(xiàn)有一些數(shù)據(jù)庫全文檢索產(chǎn)品通過為用戶和資 源指定安全標簽實現(xiàn)分級訪問控制,能夠部分解決這個問題,但是由于分 級訪問控制較為僵化,無法適應于現(xiàn)代電子政務和電子商務的靈活性需求;
第二個問題是查詢結果顯示問題,數(shù)據(jù)庫全文檢索系統(tǒng)往往通過定制界面 展示檢索到的信息資源,而搜索引擎系統(tǒng)往往在檢索出信息資源后以原始 頁面的形式顯示該信息,以原始頁面的形式顯示信息除了更符合用戶習慣 外,顯示頁面前還要通過網(wǎng)站的訪問控制檢查,更加安全。數(shù)據(jù)庫全文檢
索系統(tǒng)的一個典型代表是北京拓爾思信息技術有限公司的TRS產(chǎn)品,該產(chǎn) 品就存在上述的兩個問題, 一是采用分級訪問控制方法,過于僵化不能滿 足各種組織的靈活的訪問控制需求,二是不能以原始網(wǎng)頁的形式顯示檢索 出的信息,除了不符合用戶習慣外還避開網(wǎng)站的訪問控制檢查,還存在安 全隱患。

發(fā)明內容
本發(fā)明的目的在于提供一種網(wǎng)站支撐數(shù)據(jù)庫安全搜索引擎系統(tǒng),該系 統(tǒng)能夠對存放網(wǎng)頁文本信息的數(shù)據(jù)庫進行深度檢索,并且査全率高,安全 性強。
本發(fā)明提供的網(wǎng)站支撐數(shù)據(jù)庫安全搜索引擎系統(tǒng),其特征在于該系統(tǒng)包括登錄模塊、訪問控制模塊、數(shù)據(jù)庫、數(shù)據(jù)庫更新探測模塊、信息描
述模塊、索引模塊、索引庫和檢索模塊;
登錄模塊用于接受用戶提供的身份信息并進行認證;
訪問控制模塊用于控制用戶對資源網(wǎng)頁的訪問,用戶通過登錄模塊的 認證后,從訪問控制模塊獲取用戶的角色信息,當用戶請求訪問資源網(wǎng)頁' 時對比用戶的角色信息和允許訪問該資源網(wǎng)頁的角色信息進行訪問控制, 通過訪問控制的用戶請求被授權訪問資源網(wǎng)頁;當訪問控制模塊改變網(wǎng)頁 文本信息的訪問角色信息,訪問控制模塊向信息描述模塊提交網(wǎng)頁文本信 息的顯示網(wǎng)址和改變后的訪問角色信息;
數(shù)據(jù)庫用于支撐網(wǎng)站的運行,存儲網(wǎng)頁中顯示的文本信息以及該文本 信息的訪問角色信息和顯示網(wǎng)址信息;
數(shù)據(jù)庫更新探測模塊用于探測數(shù)據(jù)庫中數(shù)據(jù)表的更新,當探測到數(shù)據(jù) 庫中數(shù)據(jù)表有新增網(wǎng)頁文本信息條目時通知信息描述模塊,信息描述模塊 將該新增網(wǎng)頁文本信息的訪問角色信息和顯示網(wǎng)址信息寫回數(shù)據(jù)庫的數(shù)據(jù) 表中;當數(shù)據(jù)庫更新探測模塊探測到數(shù)據(jù)庫中數(shù)據(jù)表中網(wǎng)頁文本信息、網(wǎng) 頁文本信息的訪問控制角色信息及顯示網(wǎng)址信息有更新時通知索引模塊;
信息描述模塊為管理員提供一個對數(shù)據(jù)庫中數(shù)據(jù)表中存放的網(wǎng)頁文本 信息的訪問角色信息和顯示網(wǎng)址進行描述的接口,根據(jù)網(wǎng)站的業(yè)務邏輯確 定網(wǎng)頁文本信息的顯示網(wǎng)址,根據(jù)訪問控制模塊的訪問控制邏輯確定網(wǎng)頁 文本信息的訪問角色信息;
索引模塊從數(shù)據(jù)庫中獲取網(wǎng)頁文本信息、網(wǎng)頁文本信息的訪問角色信 息及網(wǎng)頁文本信息的顯示網(wǎng)址信息,并實時地更新索引庫中的索引;
索引庫中存放索引模塊根據(jù)從數(shù)據(jù)庫中獲取的信息所建立的索引;
檢索模塊為用戶提供搜索引擎的使用界面,并提供搜索服務,搜索引 擎的使用界面接受通過登錄模塊認證的用戶的查詢關鍵字,對關鍵字進行 分詞,檢索模塊向訪問控制模塊提交用戶角色信息,獲取該角色對應的訪 問控制規(guī)則;根據(jù)關鍵字分詞結果和用戶請求中攜帶的訪問控制規(guī)則對索 引庫進行檢索,對比用戶請求中攜帶的訪問控制規(guī)則和索引庫中所存放的 網(wǎng)頁文本信息的訪問角色信息,確定用戶所能查看的網(wǎng)頁文本信息,并返回網(wǎng)頁文本信息的顯示網(wǎng)址信息。
本發(fā)明提出的網(wǎng)站支撐數(shù)據(jù)庫安全搜索引擎系統(tǒng)部署后能夠對存放網(wǎng) 頁文本信息的數(shù)據(jù)庫進行深度檢索,不僅能夠對網(wǎng)頁中現(xiàn)存的文本信息進 行信息檢索,還能夠對需要用戶在網(wǎng)頁中輸入相關查詢條件后才能在網(wǎng)頁
中顯示出的文本信息進行信息檢索;被檢索的文本信息既包括公開網(wǎng)頁中 的文本信息,也包括受安全訪問控制網(wǎng)頁中的文本信息。本發(fā)明系統(tǒng)在信 息描述模塊和數(shù)據(jù)庫的支持下,索引模塊對數(shù)據(jù)庫中的網(wǎng)頁文本信息、網(wǎng) 頁文本信息的訪問角色信息及網(wǎng)頁文本信息的顯示網(wǎng)址信息建立索引,檢 索模塊利用索引庫為用戶提供檢索服務,為用戶提供其權限許可范圍內所 有滿足檢索條件的網(wǎng)頁文本信息,并以原始網(wǎng)頁的形式展現(xiàn)給用戶。由于 大量存在需要用戶在網(wǎng)頁中輸入相關查詢條件后才能在網(wǎng)頁中顯示出的文 本信息,普通的搜索引擎系統(tǒng)無法對網(wǎng)站進行深度搜索,無法檢索出需要 用戶在網(wǎng)頁中輸入相關查詢條件后才能在網(wǎng)頁中顯示出的文本信息。普通 的數(shù)據(jù)庫檢索工具能夠對網(wǎng)站支撐數(shù)據(jù)庫進行深度搜索,但是不能適應復 雜訪問控制策略,而且檢索結果不能以原始網(wǎng)頁的形式展現(xiàn)給用戶。具體 而言,本發(fā)明具有如下優(yōu)點
(1) 查全率高本系統(tǒng)針直接對網(wǎng)站支撐數(shù)據(jù)庫中的網(wǎng)頁文本信息、 網(wǎng)頁文本信息的訪問角色信息及網(wǎng)頁文本信息的顯示網(wǎng)址信息建立索引, 不僅能夠對網(wǎng)頁中現(xiàn)存的文本信息進行信息檢索,還能夠對需要用戶在網(wǎng) 頁中輸入相關査詢條件后才能在網(wǎng)頁中顯示出的文本信息進行信息檢索, 對網(wǎng)站進行深度搜索。
(2) 安全性強本系統(tǒng)的信息描述模塊根據(jù)訪問控制模塊的訪問控制 邏輯確定網(wǎng)頁文本信息的訪問角色信息,索引模塊在對網(wǎng)頁文本信息建立 索引的同時,將網(wǎng)頁文本信息的訪問角色信息也添加到索引中,檢索模塊 根據(jù)關鍵字分詞結果和用戶請求中攜帶的用戶角色信息對索引庫進行檢 索,對比用戶請求中攜帶的角色信息和索引庫中所存放的網(wǎng)頁文本信息的 訪問角色信息,確定用戶所能查看的網(wǎng)頁文本信息,并返回網(wǎng)頁文本信息 的顯示網(wǎng)址信息,提供給用戶的網(wǎng)址都是用戶權限許可范圍內網(wǎng)址,確保網(wǎng)頁文本信息的安全。


圖1是本發(fā)明系統(tǒng)的結構示意圖。
圖2是本發(fā)明系統(tǒng)中信息描述模塊結構示意圖。
圖3是本發(fā)明系統(tǒng)中數(shù)據(jù)庫中存放網(wǎng)頁文本信息及其顯示網(wǎng)址和訪問 控制信息的表結構。
圖4是本發(fā)明系統(tǒng)中檢索模塊結構示意圖。 圖5是本發(fā)明系統(tǒng)的檢索工作流程圖。
具體實施例方式
如圖1所示,本發(fā)明系統(tǒng)包括登錄模塊100、訪問控制模塊200、數(shù)據(jù) 庫600、數(shù)據(jù)庫更新探測模塊800、信息描述模塊700、索引模塊400、索 引庫500和檢索模塊300。
登錄模塊100接受用戶提供的身份信息并進行認證,如果認證通過, 登錄模塊100根據(jù)用戶標識從訪問控制模塊200獲取該用戶的角色信息, 將角色信息添加在用戶會話中并轉向用戶請求資源網(wǎng)頁,如果認證沒有通 過,則拒絕用戶登錄并返回錯誤信息;
訪問控制模塊200用于控制用戶對資源阿頁的訪問,用戶通過登錄模 塊100的認證后,從訪問控制模塊200獲取用戶的角色信息,當用戶請求 訪問資源網(wǎng)頁時對比用戶的角色信息和允許訪問該資源網(wǎng)頁的角色信息進 行訪問控制,通過訪問控制的用戶,求被授權訪問資源網(wǎng)頁,沒有通過訪 問控制的用戶請求被拒絕;當訪問控制模塊200改變網(wǎng)頁文本信息的訪問 角色信息,訪問控制模塊200向信息描述模塊700提交網(wǎng)頁文本信息的顯 示網(wǎng)址和改變后的訪問角色信息;
數(shù)據(jù)庫600用于支撐網(wǎng)站的運行,存儲網(wǎng)頁中顯示的文本信息以及該 文本信息的訪問角色信息和顯示網(wǎng)址信息;
數(shù)據(jù)庫更新探測模塊800用于探測數(shù)據(jù)庫600中數(shù)據(jù)表的更新,當探測到數(shù)據(jù)庫600中數(shù)據(jù)表有新增網(wǎng)頁文本信息條目時通知信息描述模塊 700,信息描述模塊700將該新增網(wǎng)頁文本信息的訪問角色信息和顯示網(wǎng)址 信息寫回數(shù)據(jù)庫600的數(shù)據(jù)表中;當數(shù)據(jù)庫更新探測模塊800探測到數(shù)據(jù) 庫600中數(shù)據(jù)表中網(wǎng)頁文本信息、網(wǎng)頁文本信息的訪問控制角色信息及顯 示網(wǎng)址信息有更新時通知索引模塊400;
信息描述模塊700為管理員提供一個對數(shù)據(jù)庫600中數(shù)據(jù)表中存放的 網(wǎng)頁文本信息的訪問角色信息和顯示網(wǎng)址進行描述的接口,根據(jù)網(wǎng)站的業(yè) 務邏輯確定網(wǎng)頁文本信息的顯示網(wǎng)址,根據(jù)訪問控制模塊200的訪問控制 邏輯確定網(wǎng)頁文本信息的訪問角色信息,網(wǎng)頁文本信息的訪問角色信息確 定哪些角色可以訪問該網(wǎng)頁文本信息,網(wǎng)頁文本信息的顯示網(wǎng)址確定網(wǎng)頁 文本信息的顯示網(wǎng)址;當網(wǎng)站的業(yè)務邏輯發(fā)生變化造成網(wǎng)頁文本信息的顯 示網(wǎng)址發(fā)生變化時,信息描述模塊700更新數(shù)據(jù)庫600中數(shù)據(jù)表中存放的 對應網(wǎng)頁文本信息的顯示網(wǎng)址,將更新后的顯示網(wǎng)址提交給訪問控制模塊 200以獲取網(wǎng)頁文本信息的訪問角色信息,信息描述模塊700更新數(shù)據(jù)庫 600中數(shù)據(jù)表中存放的對應網(wǎng)頁文本信息的訪問角色信息;當數(shù)據(jù)庫更新探 測模塊800探測到數(shù)據(jù)庫600中數(shù)據(jù)表有新增網(wǎng)頁文本信息條目通知信息 描述模塊700時,信息描述模塊700根據(jù)網(wǎng)站的業(yè)務邏輯確定新增網(wǎng)頁文 本信息的顯示網(wǎng)址,從訪問控制模塊200獲取網(wǎng)頁文本信息的訪問角色信 息,將網(wǎng)頁文本信息的顯示網(wǎng)址和訪問角色信息寫回數(shù)據(jù)庫600中;當訪 問控制模塊200改變網(wǎng)頁文本信息的訪問角色信息,訪問控制模塊200向 信息描述模塊700提交網(wǎng)頁文本信息的顯示網(wǎng)址和改變后的訪問角色信息, 信息描述模塊700將接收到的網(wǎng)頁文本信息的訪問角色信息寫入數(shù)據(jù)庫600
的數(shù)據(jù)表對應條件的訪問角色字段。
索引模塊400從數(shù)據(jù)庫600中獲取網(wǎng)頁文本信息、網(wǎng)頁文本信息的訪 問角色信息及網(wǎng)頁文本信息的顯示網(wǎng)址信息,網(wǎng)頁文本信息由數(shù)據(jù)庫600 中數(shù)據(jù)表的若干字段組成,對所獲取的這些信息建立索引,存放在索引庫 500,當數(shù)據(jù)庫更新探測模塊800探測數(shù)據(jù)庫600中網(wǎng)頁文本信息、網(wǎng)頁文
本信息的訪問角色信息及網(wǎng)頁文本信息的顯示網(wǎng)址信息的更新時將更新通 知索引模塊400,索引模塊400接到通知后實時地更新索引庫500中的索弓l;索引庫500中存放索引模塊400根據(jù)從數(shù)據(jù)庫600中獲取的信息所建 立的索引;
檢索模塊300為用戶提供搜索引擎的使用界面,并提供搜索服務,搜 索引擎的使用界面接受通過登錄模塊100認證的用戶的査詢關鍵字,對關 鍵字進行分詞,根據(jù)關鍵字分詞結果和用戶請求中攜帶的用戶角色信息對 索引庫500進行檢索,對比用戶請求中攜帶的角色信息和索引庫500中所
存放的網(wǎng)頁文本信息的訪問角色信息,確定用戶所能查看的網(wǎng)頁文本信息, 并返回網(wǎng)頁文本信息的顯示網(wǎng)址信息;
整個網(wǎng)站支撐數(shù)據(jù)庫安全搜索引擎系統(tǒng)模塊功能描述以及模塊間的數(shù) 據(jù)流傳遞細節(jié)如下
整個系統(tǒng)流程包括-
(1) 對數(shù)據(jù)庫中存放的網(wǎng)頁文本信息的訪問角色信息和顯示網(wǎng)址進 行描述,其過程包括
信息描述流程針對的對象是管理員用戶,管理員用戶通過系統(tǒng)提供的 接口對數(shù)據(jù)庫中存放的網(wǎng)頁文本信息的訪問角色信息和顯示網(wǎng)址進行描 述,具體流程如下
(1.1) 管理員使用登錄模塊100輸入登錄信息。
(1.2) 登錄模塊IOO通對用戶輸入的登錄信息進行認證,如果認證通過, 則登錄模塊100從訪問控制模塊200獲取該管理員用戶的角色信息,并對 其開放管理員權限(即可對數(shù)據(jù)庫中存放的網(wǎng)頁文本信息的訪問角色信息 和顯示網(wǎng)址進行描述),進入步驟(1.3),否則返回登錄失敗信息,退出流程。
(1.3) 管理員通過信息描述模塊700向數(shù)據(jù)庫600提交網(wǎng)頁文本信息的 訪問角色信息和顯示網(wǎng)址,網(wǎng)頁文本信息的顯示網(wǎng)址由網(wǎng)站的業(yè)務邏輯確 定,網(wǎng)頁文本信息的訪問角色信息由訪問控制模塊200的訪問控制邏輯確 定。
(2) 索引模塊400從數(shù)據(jù)庫600中獲取網(wǎng)頁文本信息、網(wǎng)頁文本信息的 訪問角色信息及網(wǎng)頁文本信息的顯示網(wǎng)址信息建立索引,其過程包括
索引模塊400對從數(shù)據(jù)庫600中獲取網(wǎng)頁文本信息、網(wǎng)頁文本信息的 訪問角色信息及網(wǎng)頁文本信息的顯示網(wǎng)址信息建立索引分為兩個階段,第 一個階段為初始化階段,第二個階段為實時更新階段,兩個階段的具體流程如下
(2.1) 初始化階段索引模塊400遍歷數(shù)據(jù)庫中存放網(wǎng)頁文本信息、網(wǎng)頁
文本信息的訪問角色信息及網(wǎng)頁文本信息的顯示網(wǎng)址信息的數(shù)據(jù)表(數(shù)據(jù) 表為物理存在的表或者由多個物理存在的表通過連接操作而成的邏輯數(shù)據(jù) 表),對數(shù)據(jù)表中的每條記錄里的存放網(wǎng)頁文本信息的字段建立索引,同時 在索引中加入網(wǎng)頁文本信息的訪問角色信息及網(wǎng)頁文本信息的顯示網(wǎng)址信
息,建立的索引存放于索引庫500中。
(2.2) 實時更新階段索引模塊400實時接收數(shù)據(jù)庫更新探測模塊800的 更新通知,接收到數(shù)據(jù)庫600中網(wǎng)頁文本信息、網(wǎng)頁文本信息的訪問角色 信息及網(wǎng)頁文本信息的顯示網(wǎng)址信息的更新通知時,更新索引庫500,保證 索引庫和數(shù)據(jù)庫的實時同步。
(3)向用戶提供搜索服務,其過程包括
搜索流程針對的對象是所有使用該系統(tǒng)的用戶,用戶通過登錄模塊100 進行身份認證并獲得自己的角色信息,然后通過檢索模塊300提交查詢關 鍵字,即能夠得到該用戶權限許可范圍內的查詢結果。
(3.1) 用戶通過登錄模塊100進行身份認證后,從訪問控制模塊200獲 得自己的角色信息,然后在檢索模塊300為用戶提供搜索引擎的使用界面 上輸入査詢關鍵字。
(3.2) 檢索模塊300向索引庫500提交用戶提供的關鍵字,在索引庫中 找到匹配關鍵字的所有條目,向訪問控制模塊200提交用戶攜帶的角色信 息和被檢索出條目的訪問角色信息,由訪問控制模塊200根據(jù)其訪問控制 規(guī)則確定用戶所能訪問的被檢索出的條目,并將這些用戶所能訪問的命中 條目的網(wǎng)頁文本信息顯示網(wǎng)址排序后返回給用戶。
信息描述模塊700可以采用如圖2所示的功能模塊予以具體實現(xiàn),它 包括網(wǎng)頁文本信息的顯示網(wǎng)址描述模塊720、網(wǎng)頁文本信息的訪問角色信息 描述模塊710,信息描述模塊700有系統(tǒng)初始化階段和守候階段兩個工作階 段,信息描述模塊700在這兩個階段時網(wǎng)頁文本信息的顯示網(wǎng)址描述模塊 720和網(wǎng)頁文本信息的訪問角色信息描述模塊710的詳細功能流程如下
信息描述模塊700處于初始化階段時,網(wǎng)頁文本信息的顯示網(wǎng)址描述
12模塊720從數(shù)據(jù)庫600的數(shù)據(jù)表中依次獲取條目的主鍵ID,數(shù)據(jù)表的內容 如圖3所示,包括ID、網(wǎng)頁文本信息、訪問角色、顯示網(wǎng)址等字段,根據(jù) 網(wǎng)站的業(yè)務邏輯確定該主鍵ID所對應的網(wǎng)頁文本信息的顯示網(wǎng)址信息,將 所獲得的顯示網(wǎng)址信息寫回數(shù)據(jù)庫600的數(shù)據(jù)表中的顯示網(wǎng)址字段;網(wǎng)頁 文本信息的訪問角色信息描述模塊710從數(shù)據(jù)庫600的數(shù)據(jù)表中依次獲取 條目的顯示網(wǎng)址,將所獲得的顯示網(wǎng)址提交給訪問控制模塊200,訪問控制 模塊200確定顯示網(wǎng)址的訪問角色信息,并將訪問角色信息返回網(wǎng)頁文本 信息的訪問角色信息模塊710,網(wǎng)頁文本信息的訪問角色信息模塊710將所 獲得的訪問角色信息寫回數(shù)據(jù)庫600的數(shù)據(jù)表中的訪問角色字段。
信息描述模塊700處于守候階段時,當網(wǎng)站的業(yè)務邏輯發(fā)生變化造成 網(wǎng)頁文本信息的顯示網(wǎng)址發(fā)生變化時,網(wǎng)頁文本信息的顯示網(wǎng)址描述模塊 720更新數(shù)據(jù)庫600中數(shù)據(jù)表中存放的對應網(wǎng)頁文本信息的顯示網(wǎng)址,將更 新后的顯示網(wǎng)址提交給訪問控制模塊200以獲取網(wǎng)頁文本信息的訪問角色 信息,網(wǎng)頁文本信息的訪問角色信息描述模塊710更新數(shù)據(jù)庫600中數(shù)據(jù) 表中存放的對應網(wǎng)頁文本信息的訪問角色信息;當數(shù)據(jù)庫更新探測模塊800 探測到數(shù)據(jù)庫600中數(shù)據(jù)表有新增網(wǎng)頁文本信息條目通知信息描述模塊700 時,網(wǎng)頁文本信息的顯示網(wǎng)址描述模塊720從數(shù)據(jù)庫600的數(shù)據(jù)表中獲取 新增條目的主鍵ID,根據(jù)網(wǎng)站的業(yè)務邏輯確定該主鍵ID所對應的網(wǎng)頁文本 信息的顯示網(wǎng)址信息,將所獲得的顯示網(wǎng)址信息寫回數(shù)據(jù)庫600的數(shù)據(jù)表 中的顯示網(wǎng)址字段,將所獲得的顯示網(wǎng)址提交給訪問控制模塊200以獲取 網(wǎng)頁文本信息的訪問角色信息,網(wǎng)頁文本信息的訪問角色信息描述模塊710 更新數(shù)據(jù)庫600中數(shù)據(jù)表中存放的對應網(wǎng)頁文本信息的訪問角色信息;當 訪問控制模塊200改變網(wǎng)頁文本信息的訪問角色信息,訪問控制模塊200 向網(wǎng)頁文本信息的訪問角色信息描述模塊710提交網(wǎng)頁文本信息的顯示網(wǎng) 址和改變后的訪問角色信息,網(wǎng)頁文本信息的訪問角色信息描述模塊710 將接收到的網(wǎng)頁文本信息的訪問角色信息寫入數(shù)據(jù)庫600的數(shù)據(jù)表對應條 件的訪問角色字段。
檢索模塊300以索引庫500為基礎,為用戶提供安全的深度搜索服務。 査詢檢索模塊300包括關鍵字提交模塊310、后臺檢索模塊320和快照生成 模塊330。用戶通過登錄模塊100的認證后,從訪問控制模塊200獲取用戶的角 色信息,向關鍵字提交模塊310提交査詢關鍵字,關鍵字提交模塊310獲 得用戶輸入的查詢關鍵字后,將關鍵字分割成若干個具有詞義的單詞,并 將分詞后的關鍵字及用戶請求中所攜帶的用戶角色信息傳遞給后臺檢索模 塊320;后臺檢索模塊320向訪問控制模塊200提交用戶角色信息,獲取該 角色對應的訪問控制規(guī)則,后臺檢索模塊320將接收到的關鍵字提交給索 引庫500進行檢索,然后根據(jù)從訪問控制模塊200獲取的角色對應的訪問 控制規(guī)則從索引庫500獲取用戶權限許可范圍內的檢索結果并排序;快照 生成模塊330能夠根據(jù)返回結果集生成結果快照,使檢索結果易于閱讀, 并負責生成結果頁面將結果顯示給用戶。
檢索模塊300內各模塊間的數(shù)據(jù)流傳遞細節(jié)如下關鍵字提交模塊310 在收到登錄模塊100傳遞來的査詢關鍵字和用戶角色信息,對査詢關鍵字 進行適當策略的分詞,使檢索結果更加精準,然后將分詞后的檢索詞及用 戶角色信息提交給后臺檢索模塊320;后臺檢索模塊320接收分詞后的檢索 詞以及用戶角色信息,將用戶角色信息提交給訪問控制模塊200,從訪問控 制模塊200獲取該角色對應的訪問控制規(guī)則,然后將關鍵詞提交給索引庫 500與索引中對應域進行匹配,對從索引庫600返回命中的記錄用用戶對應 角色信息的訪問控制規(guī)則進行過濾,對過濾后的返回結果集進行排序,然 后將結果集與關鍵詞交給快照生成模塊330,其中結果集中的每條結果記錄 包括網(wǎng)頁URL、標題和內容四個域;快照生成模塊330將索引標題和內容 字段中與關鍵詞相關內容高亮顯示,并在內容字段中取出最相關的段落顯 示在結果返回頁面,使用戶更加直觀地閱讀結果集,流程如圖5所示。
權利要求
1、一種網(wǎng)站支撐數(shù)據(jù)庫安全搜索引擎系統(tǒng),其特征在于該系統(tǒng)包括登錄模塊(100)、訪問控制模塊(200)、數(shù)據(jù)庫(600)、數(shù)據(jù)庫更新探測模塊(800)、信息描述模塊(700)、索引模塊(400)、索引庫(500)和檢索模塊(300);登錄模塊(100)用于接受用戶提供的身份信息并進行認證;訪問控制模塊(200)用于控制用戶對資源網(wǎng)頁的訪問,用戶通過登錄模塊(100)的認證后,從訪問控制模塊(200)獲取用戶的角色信息,當用戶請求訪問資源網(wǎng)頁時對比用戶的角色信息和允許訪問該資源網(wǎng)頁的角色信息進行訪問控制,通過訪問控制的用戶請求被授權訪問資源網(wǎng)頁;當訪問控制模塊(200)改變網(wǎng)頁文本信息的訪問角色信息,訪問控制模塊(200)向信息描述模塊(700)提交網(wǎng)頁文本信息的顯示網(wǎng)址和改變后的訪問角色信息;數(shù)據(jù)庫(600)用于支撐網(wǎng)站的運行,存儲網(wǎng)頁中顯示的文本信息以及該文本信息的訪問角色信息和顯示網(wǎng)址信息;數(shù)據(jù)庫更新探測模塊(800)用于探測數(shù)據(jù)庫(600)中數(shù)據(jù)表的更新,當探測到數(shù)據(jù)庫(600)中數(shù)據(jù)表有新增網(wǎng)頁文本信息條目時通知信息描述模塊(700),信息描述模塊(700)將該新增網(wǎng)頁文本信息的訪問角色信息和顯示網(wǎng)址信息寫回數(shù)據(jù)庫(600)的數(shù)據(jù)表中;當數(shù)據(jù)庫更新探測模塊(800)探測到數(shù)據(jù)庫(600)中數(shù)據(jù)表中網(wǎng)頁文本信息、網(wǎng)頁文本信息的訪問控制角色信息及顯示網(wǎng)址信息有更新時通知索引模塊(400);信息描述模塊(700)為管理員提供一個對數(shù)據(jù)庫(600)中數(shù)據(jù)表中存放的網(wǎng)頁文本信息的訪問角色信息和顯示網(wǎng)址進行描述的接口,根據(jù)網(wǎng)站的業(yè)務邏輯確定網(wǎng)頁文本信息的顯示網(wǎng)址,根據(jù)訪問控制模塊(200)的訪問控制邏輯確定網(wǎng)頁文本信息的訪問角色信息;索引模塊(400)從數(shù)據(jù)庫(600)中獲取網(wǎng)頁文本信息、網(wǎng)頁文本信息的訪問角色信息及網(wǎng)頁文本信息的顯示網(wǎng)址信息,并實時地更新索引庫(500)中的索引;索引庫(500)中存放索引模塊(400)根據(jù)從數(shù)據(jù)庫(600)中獲取的信息所建立的索引;檢索模塊(300)為用戶提供搜索引擎的使用界面,并提供搜索服務,搜索引擎的使用界面接受通過登錄模塊(100)認證的用戶的查詢關鍵字,對關鍵字進行分詞,檢索模塊(300)向訪問控制模塊(200)提交用戶角色信息,獲取該角色對應的訪問控制規(guī)則;根據(jù)關鍵字分詞結果和用戶請求中攜帶的訪問控制規(guī)則對索引庫(500)進行檢索,對比用戶請求中攜帶的訪問控制規(guī)則和索引庫(500)中所存放的網(wǎng)頁文本信息的訪問角色信息,確定用戶所能查看的網(wǎng)頁文本信息,并返回網(wǎng)頁文本信息的顯示網(wǎng)址信息。
2、 根據(jù)權利要求l所述的網(wǎng)站支撐數(shù)據(jù)庫安全搜索引擎系統(tǒng),其特征 在于信息描述模塊(700)包括網(wǎng)頁文本信息的訪問角色信息描述模塊(710) 和網(wǎng)頁文本信息的顯示網(wǎng)址描述模塊(720);網(wǎng)頁文本信息的訪問角色信息描述模塊(710)用于從數(shù)據(jù)庫(600) 的數(shù)據(jù)表中依次獲取條目的顯示網(wǎng)址,將所獲得的顯示網(wǎng)址提交給訪問控 制模塊(200),并將所獲得的訪問角色信息寫回數(shù)據(jù)庫(600)的數(shù)據(jù)表中 的訪問角色字段;網(wǎng)頁文本信息的顯示網(wǎng)址描述模塊(720)從數(shù)據(jù)庫(600)的數(shù)據(jù)表 中獲取新增條目的主鍵ID,根據(jù)網(wǎng)站的業(yè)務邏輯確定該主鍵ID所對應的網(wǎng) 頁文本信息的顯示網(wǎng)址信息,將所獲得的顯示網(wǎng)址信息寫回數(shù)據(jù)庫(600) 的數(shù)據(jù)表中的顯示網(wǎng)址字段。
3、 根據(jù)權利要求1或2所述的網(wǎng)站支撐數(shù)據(jù)庫安全搜索引擎系統(tǒng),其 特征在于査詢檢索模塊(300)包括關鍵字提交模塊(310)、后臺檢索模塊(320) 和快照生成模塊(330);關鍵字提交模塊(310)通過登錄模塊(100)獲得用戶輸入的查詢關 鍵字后,將關鍵字分割成若干個具有詞義的單詞,并將分詞后的關鍵字及用戶請求中所攜帶的用戶角色信息傳遞給后臺檢索模塊(320);后臺檢索模塊(320)用于向訪問控制模塊(200)提交用戶角色信息, 獲取該角色對應的訪問控制規(guī)則,后臺檢索模塊(320)將接收到的關鍵字 提交給索引庫(500)進行檢索,然后根據(jù)從訪問控制模塊(200)獲取的 角色對應的訪問控制規(guī)則從索引庫(500)獲取用戶權限許可范圍內的檢索 結果并排序;快照生成模塊(330)根據(jù)返回結果集生成結果快照,并負責生成結果 頁面將結果顯示給用戶。
全文摘要
本發(fā)明公開了一種網(wǎng)站支撐數(shù)據(jù)庫安全搜索引擎系統(tǒng)。系統(tǒng)對網(wǎng)站支撐數(shù)據(jù)庫存放的網(wǎng)頁文本信息的訪問角色信息和顯示網(wǎng)址進行描述;直接對網(wǎng)頁文本信息建立索引,索引中包含顯示網(wǎng)址信息和訪問角色信息;按照用戶提交的查詢關鍵字從牽引庫中獲取匹配的記錄,根據(jù)用戶所對應的訪問控制規(guī)則對匹配記錄進行過濾,并返回給用戶;用戶通過原始頁面查看網(wǎng)頁文本信息。本發(fā)明實現(xiàn)對網(wǎng)站文本信息的深度、全面搜索,索引中包含網(wǎng)頁文本信息的訪問角色信息,用戶只能查看到其權限許可范圍內的網(wǎng)頁文本信息,實現(xiàn)安全搜索,索引中包含網(wǎng)頁文本信息的顯示網(wǎng)址信息,用戶通過顯示網(wǎng)址信息在原始頁面中查看網(wǎng)頁文本信息,繼承傳統(tǒng)搜索引擎突出的優(yōu)點,符合用戶操作習慣。
文檔編號G06F17/30GK101320373SQ20081004801
公開日2008年12月10日 申請日期2008年6月13日 優(yōu)先權日2008年6月13日
發(fā)明者丁益斌, 盧正鼎, 張茂元, 文坤梅, 於光燦, 李瑞軒, 辜希武 申請人:華中科技大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
临海市| 桐庐县| 安阳市| 佛山市| 松江区| 汤原县| 堆龙德庆县| 鹤庆县| 如皋市| 上高县| 婺源县| 永修县| 富锦市| 清远市| 孟州市| 遂平县| 二连浩特市| 东乌珠穆沁旗| 杭锦旗| 区。| 孝昌县| 香格里拉县| 阳朔县| 杂多县| 满洲里市| 淅川县| 宁蒗| 桃园市| 福贡县| 滁州市| 西吉县| 阳西县| 思南县| 双牌县| 高青县| 瓦房店市| 闽侯县| 田东县| 大悟县| 奈曼旗| 清水县|