專利名稱:基于數(shù)據(jù)倉庫技術的圖書館智能管理系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及一種計算機信息管理系統(tǒng),尤其涉及一種基于數(shù)據(jù)倉庫技術的圖書館智能管理系統(tǒng)。
背景技術:
隨著全球信息產(chǎn)業(yè)的高速發(fā)展,數(shù)字技術的應用日益普及,數(shù)字產(chǎn)品已經(jīng)進入到各個領域,在圖書館中利用計算機技術有效提高了圖書的管理水平。然而。隨著經(jīng)濟的發(fā)展和社會的進步,人們對知識的需求和積累不斷增加,圖書館的藏書不斷增多,信息迅速增長。因此,對于圖書館的管理工作也提出了更高的要求,不但需要進一步提高圖書管理水平,更為重要的是,需要實現(xiàn)圖書信息的有效利用。
目前,針對圖書館圖書管理的研究中,大多數(shù)主要集中在管理方面,很少有針對用戶的需求來提供信息分析和決策支持的智能型管理的研究。此外,在數(shù)字化書籍管理的研究發(fā)展中,目前仍然存在著巨大的困難和障礙,主要表現(xiàn)在如此大量的信息,究竟如何對它們進行有效的存儲、管理和利用?如何充分發(fā)掘信息背后的信息及其潛在的價值?在因特網(wǎng)迅速擴大,信息量爆炸增長的今天,人們發(fā)現(xiàn)數(shù)據(jù)、信息雖然越來越多,而知識即有序、有效、有價值的信息卻越來越少。因此,挖掘大量數(shù)據(jù)信息背后隱藏的價值,提高圖書管理的智能化程度成為人們密切關注的一個問題。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術的不足,提供一種能夠連接眾多類型各異的信息資源,以統(tǒng)一的方式向用戶提供智能化的多種信息產(chǎn)品和信息服務的基于數(shù)據(jù)倉庫技術的圖書館智能管理系統(tǒng)。
本發(fā)明的目的通過以下技術方案予以實現(xiàn)本發(fā)明提供的一種基于數(shù)據(jù)倉庫技術的圖書館智能管理系統(tǒng),包括數(shù)據(jù)獲取模塊,用于從各類數(shù)據(jù)源抓取數(shù)據(jù),并對原始數(shù)據(jù)進行必要的清潔、增強和轉(zhuǎn)換,使數(shù)據(jù)符合數(shù)據(jù)倉庫所要求的規(guī)則,并將數(shù)據(jù)加載到數(shù)據(jù)倉庫中;數(shù)據(jù)倉庫,用于存儲管理各種類型的數(shù)據(jù),使其以標準化的格式存儲,并對每一種類型對象定義其索引、目錄信息;元數(shù)據(jù)倉庫,用于運行和維護數(shù)據(jù)倉庫,通過中間件模塊為用戶訪問數(shù)據(jù)倉庫提供一個信息目錄;信息目錄模塊,用于維護和管理元數(shù)據(jù)倉庫;數(shù)據(jù)管理模塊,用于支持其它模塊以生成、管理和訪問數(shù)據(jù)倉庫以及元數(shù)據(jù)倉庫中的數(shù)據(jù);中間件模塊,用于連接數(shù)據(jù)倉庫與應用服務模塊,從而以統(tǒng)一的方式為用戶提供服務并支持用戶對數(shù)據(jù)的訪問;應用服務模塊,包括數(shù)據(jù)檢索和訪問模塊以及信息發(fā)布模塊,通過中間件連接數(shù)據(jù)倉庫,其中數(shù)據(jù)檢索和訪問模塊用于提供各類檢索、分析和訪問工具;信息發(fā)布模塊用于支持數(shù)字化信息的發(fā)布;分布式管理模塊,用于維護數(shù)據(jù)倉庫環(huán)境的系統(tǒng)管理服務,所述服務包括管理數(shù)據(jù)獲取操作、將倉庫數(shù)據(jù)歸檔、備份和恢復數(shù)據(jù)、訪問系統(tǒng)中數(shù)據(jù)的保安和授權以及管理和調(diào)試數(shù)據(jù)訪問操作。
本發(fā)明基于的數(shù)據(jù)倉庫技術是數(shù)據(jù)庫的一個新的應用、發(fā)展方向,最近幾年獲得了快速的發(fā)展。數(shù)據(jù)倉庫是作為聯(lián)機分析處理的數(shù)據(jù)源而產(chǎn)生的,是在數(shù)據(jù)庫的基礎上,以查詢、分析為目的的,按特定方式組織和管理的數(shù)據(jù)庫的集合。因此,數(shù)據(jù)倉庫與數(shù)據(jù)庫有著完全不同的特征,數(shù)據(jù)倉庫技術是一個面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,能夠支持海量數(shù)據(jù)的存儲以及對數(shù)據(jù)的快速檢索分析,用于支持管理決策。
本發(fā)明是一種信息資源的組織管理模式,以數(shù)據(jù)倉庫為核心的多種信息技術的集合,包括建立在數(shù)據(jù)倉庫基礎上的信息存儲、信息檢索、信息分析、信息挖掘、信息推送等多種先進的信息處理技術以及方法和工具。本發(fā)明系統(tǒng)以圖書館信息庫群為核心,綜合處理包括各類文獻信息、社會信息、科研信息等在內(nèi)的多種信息、使圖書館的所有信息數(shù)據(jù)按照一定的方式組織存儲在數(shù)據(jù)倉庫中,從而使得信息容易存取并且有使用價值,不僅提供傳統(tǒng)圖書館的信息檢索等服務功能,更多的是提供經(jīng)過加工、分析等智能化綜合處理后的信息產(chǎn)品,提供信息咨詢、綜合決策支持等智能化服務。
本發(fā)明的數(shù)據(jù)源包括內(nèi)部數(shù)據(jù)源和外部數(shù)據(jù)源,實際上包含了各種類型、不同來源的信息。內(nèi)部信息包括內(nèi)部館藏數(shù)據(jù),如書目數(shù)據(jù)、文摘、全文等;外部數(shù)據(jù)包括Internet網(wǎng)上各類信息源以及各類學科門戶網(wǎng)站上的數(shù)據(jù)信息。除用于信息服務的信息資源外,還包括供分析使用的業(yè)務數(shù)據(jù),如語音業(yè)務、數(shù)據(jù)業(yè)務、應用業(yè)務、互聯(lián)網(wǎng)業(yè)務、圖像業(yè)務等方面的數(shù)據(jù)。數(shù)據(jù)獲取模塊從各類信息源獲取數(shù)據(jù)后,對其進行加工,包括清潔、增強、轉(zhuǎn)換、集成等處理,使數(shù)據(jù)符合一定的條件,如統(tǒng)一、一致性等。
數(shù)據(jù)經(jīng)過加工后由數(shù)據(jù)獲取模塊加載到數(shù)據(jù)倉庫中進行存儲,其功能主要由DBMS來實現(xiàn)。數(shù)據(jù)的存放方式極大程度上影響到系統(tǒng)的性能,因為對于一個數(shù)字圖書館的數(shù)據(jù)倉庫系統(tǒng)來說,最多涉及的操作是信息的查詢,包括各種簡單的或復雜的查詢。因此,這里物理設計的非正規(guī)化被控制到最低。在數(shù)字圖書館的數(shù)據(jù)倉庫系統(tǒng)中,合理的物理設計和數(shù)據(jù)存放方式是一個非常重要的問題。系統(tǒng)中所使用的數(shù)據(jù)管理程序通常既可以是RDBMS,也可以是多維DBMS。
元數(shù)據(jù)倉庫采用元數(shù)據(jù)(metadata)和SGML技術標準來處理多種信息資源,以符合新的信息標引需求和數(shù)據(jù)格式。信息目錄模塊通過設計模塊完成,幫助技術用戶和業(yè)務用戶訪問和利用數(shù)據(jù)倉庫系統(tǒng),實現(xiàn)對系統(tǒng)中數(shù)據(jù)倉庫元數(shù)據(jù)的維護和管理。
中間件模塊是一種獨立的系統(tǒng)軟件或服務程序,分布式應用軟件借助這種軟件在不同的技術之間共享資源。中間件模塊在操作系統(tǒng)、網(wǎng)絡和數(shù)據(jù)庫之上,應用軟件的下層,總的作用是為處于自己上層的應用軟件提供運行與開發(fā)的環(huán)境,幫助用戶靈活、高效地開發(fā)和集成復雜的應用軟件。
由于標準接口對于可移植性和標準協(xié)議對于互操作性的重要性,中間件已成為許多標準化工作的主要部分。對于應用軟件開發(fā),中間件遠比操作系統(tǒng)和網(wǎng)絡服務更為重要,中間件提供的程序接口定義了一個相對穩(wěn)定的高層應用環(huán)境,不管底層的計算機硬件和系統(tǒng)軟件怎樣更新?lián)Q代,只要將中間件升級更新,并保持中間件對外的接口定義不變,應用軟件幾乎不需任何修改,從而有利于軟件的移植和節(jié)省開支。
數(shù)字圖書館的根本職責是提供各種各樣、豐富多彩的信息服務。建立數(shù)據(jù)倉庫系統(tǒng)的最終目標是為了提供更多、更好、更優(yōu)質(zhì)的智能化的信息服務以滿足各類型用戶的多層次的信息需求。數(shù)據(jù)檢索和訪問模塊是系統(tǒng)功能的表現(xiàn)模塊之一,提供各類檢索和訪問工具,如支持信息的屬性檢索、文本挖掘工具、基于內(nèi)容的檢索等,以及各類分析工具,如數(shù)據(jù)分析、內(nèi)容分析等。信息發(fā)布模塊用于支持數(shù)字化信息的發(fā)布。
分布式管理模塊即系統(tǒng)管理模塊,由于邏輯上獨立的數(shù)字圖書館是一個面向?qū)ο?、分布式的信息網(wǎng)絡體系結構,是跨系統(tǒng)、跨平臺的,所以必須采用分布式體系結構,相應的系統(tǒng)管理也必須是分布式的。包括一整套用于維護數(shù)據(jù)倉庫環(huán)境的系統(tǒng)管理服務。這些服務包括管理數(shù)據(jù)獲取操作,將倉庫數(shù)據(jù)歸檔,備份和恢復數(shù)據(jù),訪問系統(tǒng)中數(shù)據(jù)的保安和授權,以及管理和調(diào)試數(shù)據(jù)訪問操作。目前專門為管理數(shù)據(jù)倉庫系統(tǒng)而設計的工具很少,大多數(shù)數(shù)據(jù)倉庫管理者都是用倉庫DBMS來完成這些工作。
為方便用戶的使用,有效提高查詢性能和獲取信息的質(zhì)量,并有效利用外部信息資源,本發(fā)明還可采取如下進一步措施所述系統(tǒng)還包括學科知識數(shù)據(jù)倉庫,用于存儲與學科知識相關的數(shù)據(jù);個人數(shù)據(jù)倉庫,用于存儲與個人信息相關的數(shù)據(jù);外部數(shù)據(jù)倉庫,用于存儲管理外部信息數(shù)據(jù);數(shù)據(jù)傳遞模塊,用于根據(jù)數(shù)據(jù)集合的內(nèi)容和傳遞時間表,將數(shù)據(jù)倉庫中的數(shù)據(jù)分布到學科知識數(shù)據(jù)倉庫和個人數(shù)據(jù)倉庫中去;多個數(shù)據(jù)倉庫通過中間件模塊集成連接構成一個統(tǒng)一視圖的虛擬數(shù)據(jù)倉庫;其中的學科知識數(shù)據(jù)倉庫和個人數(shù)據(jù)倉庫均為一種具體的數(shù)據(jù)倉庫,適用于特定的應用目的或應用范圍,有助于提高服務質(zhì)量和效率。
本發(fā)明具有以下有益效果(1)將圖書館的各種信息資源、科研項目管理、項目進展情況、科研成果以及科研成果轉(zhuǎn)化等通過數(shù)據(jù)倉庫技術統(tǒng)一進行組織管理,并對這些信息進行綜合分析處理,能夠提供多層次、多角度、智能化的信息服務。
(2)不僅提供傳統(tǒng)圖書館的信息檢索等服務功能,更多的是提供經(jīng)過加工、分析等智能化綜合處理后的信息產(chǎn)品以及信息咨詢、綜合決策支持等智能化服務,極大提高了圖書館的管理服務水平。用戶不必在大量的簡單原始數(shù)據(jù)信息中耗費太多的時間,充分利用了圖書館的信息資源,而且充分挖掘了信息資源的價值,有效提高了信息服務的效率和準確性。
下面將結合實施例和附圖對本發(fā)明作進一步的詳細描述圖1是本發(fā)明實施例的結構組成框圖;圖2是本發(fā)明實施例的層次結構框圖。
具體實施例方式
圖1和圖2所示為本發(fā)明的實施例,如圖1所示包括數(shù)據(jù)獲取模塊,用于從各類數(shù)據(jù)源抓取數(shù)據(jù),并對原始數(shù)據(jù)進行必要的清潔、增強和轉(zhuǎn)換,使數(shù)據(jù)符合數(shù)據(jù)倉庫所要求的規(guī)則,并將數(shù)據(jù)加載到數(shù)據(jù)倉庫中;數(shù)據(jù)倉庫,用于存儲管理各種類型的數(shù)據(jù),使其以標準化的格式存儲,并對每一種類型對象定義其索引、目錄信息;元數(shù)據(jù)倉庫,用于運行和維護數(shù)據(jù)倉庫,通過中間件模塊為用戶訪問數(shù)據(jù)倉庫提供一個信息目錄;元數(shù)據(jù)倉庫可以在數(shù)據(jù)倉庫設計和開發(fā)過程中由倉庫開發(fā)人員和管理人員生成,采用元數(shù)據(jù)(metadata)和SGML技術標準來處理多種信息資源,以符合新的信息標引需求和數(shù)據(jù)格式,信息目錄模塊,用于維護和管理元數(shù)據(jù)倉庫,可以通過設計模塊完成,幫助技術用戶和業(yè)務用戶訪問和利用數(shù)據(jù)倉庫系統(tǒng),實現(xiàn)對系統(tǒng)中數(shù)據(jù)倉庫元數(shù)據(jù)的維護和管理;數(shù)據(jù)管理模塊,用于支持其它模塊以生成、管理和訪問數(shù)據(jù)倉庫以及元數(shù)據(jù)倉庫中的數(shù)據(jù);中間件模塊,用于連接數(shù)據(jù)倉庫與應用服務模塊,從而以統(tǒng)一的方式為用戶提供服務并支持用戶對數(shù)據(jù)的訪問;應用服務模塊,包括數(shù)據(jù)檢索和訪問模塊以及信息發(fā)布模塊,通過中間件連接數(shù)據(jù)倉庫,其中數(shù)據(jù)檢索和訪問模塊用于提供各類檢索、分析和訪問工具;信息發(fā)布模塊用于支持數(shù)字化信息的發(fā)布;學科知識數(shù)據(jù)倉庫,用于存儲與學科知識相關的數(shù)據(jù);個人數(shù)據(jù)倉庫,用于存儲與個人信息相關的數(shù)據(jù);外部數(shù)據(jù)倉庫,用于存儲管理外部信息數(shù)據(jù);數(shù)據(jù)傳遞模塊,用于根據(jù)數(shù)據(jù)集合的內(nèi)容和傳遞時間表,將數(shù)據(jù)倉庫中的數(shù)據(jù)分布到學科知識數(shù)據(jù)倉庫和個人數(shù)據(jù)倉庫中去;數(shù)據(jù)集合的內(nèi)容通常由管理者和用戶進行界定;傳遞時間表是用信息目錄模塊中的信息助理設備確定下來的,數(shù)據(jù)傳遞可以在一天中的某一時間進行,也可以在一個外部事件結束時進行;多個數(shù)據(jù)倉庫通過中間件模塊集成連接構成一個統(tǒng)一視圖的虛擬數(shù)據(jù)倉庫;分布式管理模塊,用于維護數(shù)據(jù)倉庫環(huán)境的系統(tǒng)管理服務,所述服務包括管理數(shù)據(jù)獲取操作、將倉庫數(shù)據(jù)歸檔、備份和恢復數(shù)據(jù)、訪問系統(tǒng)中數(shù)據(jù)的保安和授權以及管理和調(diào)試數(shù)據(jù)訪問操作。
由于本實施例系統(tǒng)處理海量信息、提供多層次信息服務和信息產(chǎn)品等方面的特殊性,決定了其結構和功能等都與一般的數(shù)據(jù)倉庫系統(tǒng)有較大的不同。從其體系結構和功能來看,如圖2所示,分為以下幾個層次信息獲取層從各種信息源獲取數(shù)據(jù)信息,包括內(nèi)部的和外部的。內(nèi)部數(shù)據(jù)信息包括內(nèi)部館藏數(shù)據(jù),如書目數(shù)據(jù)、文摘、全文等,外部數(shù)據(jù)信息包括Internet網(wǎng)上各類信息源以及各類學科門戶網(wǎng)站上的數(shù)據(jù)信息。除用于信息服務的信息資源外,還應包括一些業(yè)務數(shù)據(jù),以提供分析使用。從各類信息源獲取數(shù)據(jù),對其進行加工,包括清潔、增強、轉(zhuǎn)換、集成等處理,使數(shù)據(jù)符合一定的條件,如統(tǒng)一、一致性等。
信息存儲層數(shù)據(jù)經(jīng)過加工后進行存儲。數(shù)據(jù)的存放方式極大程度上影響到系統(tǒng)的性能,因為對于一個數(shù)字圖書館的數(shù)據(jù)倉庫系統(tǒng)來說,最多涉及的操作是信息的查詢,包括各種簡單的或復雜的查詢。因此,這里物理設計的非正規(guī)化被控制到最低。在數(shù)字圖書館的數(shù)據(jù)倉庫系統(tǒng)中,合理的物理設計和數(shù)據(jù)存放方式是一個非常重要的問題。系統(tǒng)中所使用的數(shù)據(jù)管理程序通常既可以是RDBMS,也可以是多維DBMS。數(shù)據(jù)倉庫DBMS的要求比操作OLTP應用程序的要求高,需要考慮可伸縮性。隨著查詢復雜性和數(shù)據(jù)庫規(guī)模的增大,使用并行硬件和并行數(shù)據(jù)庫軟件才能獲得令人滿意的性能。此外,在這一層可以根據(jù)信息獲取層獲得的信息,通過數(shù)據(jù)倉庫以及個人數(shù)據(jù)倉庫的內(nèi)容經(jīng)過升級過程來更新其它模塊。
信息服務層數(shù)字圖書館的根本職責是提供各種各樣、豐富多彩的信息服務,建立數(shù)據(jù)倉庫系統(tǒng)的最終目標是為了提供更多、更好、更優(yōu)質(zhì)的智能化的信息服務以滿足各類型用戶的多層次的信息需求。信息服務層提供查詢、檢索工具、數(shù)據(jù)分析、學科分析等輔助工具以及各類服務工具,以滿足不同的信息需求。
用戶訪問層數(shù)字圖書館、數(shù)據(jù)倉庫歸根結底是要提供用戶訪問。用戶訪問層就是要提供用戶方便靈活的信息訪問方式,如定制界面、定制信息服務等。用戶還可以按照自己的需求和喜好建立自己的個人數(shù)據(jù)倉庫,以提高查詢性能和獲取信息的質(zhì)量。
權利要求
1.一種基于數(shù)據(jù)倉庫技術的圖書館智能管理系統(tǒng),其特征在于包括數(shù)據(jù)獲取模塊,用于從各類數(shù)據(jù)源抓取數(shù)據(jù),并對原始數(shù)據(jù)進行必要的清潔、增強和轉(zhuǎn)換,使數(shù)據(jù)符合數(shù)據(jù)倉庫所要求的規(guī)則,并將數(shù)據(jù)加載到數(shù)據(jù)倉庫中;數(shù)據(jù)倉庫,用于存儲管理各種類型的數(shù)據(jù),使其以標準化的格式存儲,并對每一種類型對象定義其索引、目錄信息;元數(shù)據(jù)倉庫,用于運行和維護數(shù)據(jù)倉庫,通過中間件模塊為用戶訪問數(shù)據(jù)倉庫提供一個信息目錄;信息目錄模塊,用于維護和管理元數(shù)據(jù)倉庫;數(shù)據(jù)管理模塊,用于支持其它模塊以生成、管理和訪問數(shù)據(jù)倉庫以及元數(shù)據(jù)倉庫中的數(shù)據(jù);中間件模塊,用于連接數(shù)據(jù)倉庫與應用服務模塊,從而以統(tǒng)一的方式為用戶提供服務并支持用戶對數(shù)據(jù)的訪問;應用服務模塊,包括數(shù)據(jù)檢索和訪問模塊以及信息發(fā)布模塊,通過中間件連接數(shù)據(jù)倉庫,其中數(shù)據(jù)檢索和訪問模塊用于提供各類檢索、分析和訪問工具;信息發(fā)布模塊用于支持數(shù)字化信息的發(fā)布;分布式管理模塊,用于維護數(shù)據(jù)倉庫環(huán)境的系統(tǒng)管理服務,所述服務包括管理數(shù)據(jù)獲取操作、將倉庫數(shù)據(jù)歸檔、備份和恢復數(shù)據(jù)、訪問系統(tǒng)中數(shù)據(jù)的保安和授權以及管理和調(diào)試數(shù)據(jù)訪問操作。
2.根據(jù)權利要求1所述的基于數(shù)據(jù)倉庫技術的圖書館智能管理系統(tǒng),其特征在于還包括學科知識數(shù)據(jù)倉庫,用于存儲與學科知識相關的數(shù)據(jù);個人數(shù)據(jù)倉庫,用于存儲與個人信息相關的數(shù)據(jù);外部數(shù)據(jù)倉庫,用于存儲管理外部信息數(shù)據(jù);數(shù)據(jù)傳遞模塊,用于根據(jù)數(shù)據(jù)集合的內(nèi)容和傳遞時間表,將數(shù)據(jù)倉庫中的數(shù)據(jù)分布到學科知識數(shù)據(jù)倉庫和個人數(shù)據(jù)倉庫中去;多個數(shù)據(jù)倉庫通過中間件模塊集成連接構成一個統(tǒng)一視圖的虛擬數(shù)據(jù)倉庫。
全文摘要
本發(fā)明公開了一種基于數(shù)據(jù)倉庫技術的圖書館智能管理系統(tǒng),包括數(shù)據(jù)獲取模塊、數(shù)據(jù)倉庫、元數(shù)據(jù)倉庫、信息目錄模塊、數(shù)據(jù)管理模塊、中間件模塊、應用服務模塊和分布式管理模塊。本發(fā)明能夠連接圖書館眾多類型各異的信息資源,通過數(shù)據(jù)倉庫技術統(tǒng)一進行組織管理,并對這些信息進行綜合分析處理,以統(tǒng)一的方式向用戶提供多層次、多角度、智能化的多種信息產(chǎn)品和信息服務。用戶不必在大量的簡單原始數(shù)據(jù)信息中耗費太多的時間,充分利用了圖書館的信息資源,而且充分挖掘了信息資源的價值,有效提高了信息服務的效率和準確性。
文檔編號G06Q50/00GK1924915SQ20061012226
公開日2007年3月7日 申請日期2006年9月20日 優(yōu)先權日2006年9月20日
發(fā)明者彭斌斌, 陳麗, 羅笑南 申請人:中山大學