本發(fā)明涉及信息管理技術(shù)領(lǐng)域,特別是涉及一種基于DSpace的數(shù)字資源管理方法。
背景技術(shù):
DSpace系統(tǒng)是由美國(guó)麻省理工學(xué)院(MIT)和美國(guó)惠普公司(Hewlett-Packard)合作開發(fā)的以內(nèi)容管理發(fā)布為設(shè)計(jì)目標(biāo)的數(shù)字資源存儲(chǔ)系統(tǒng)。該系統(tǒng)可以收集、存儲(chǔ)、索引、保存和發(fā)布任何格式的數(shù)字資源,包括期刊論文、技術(shù)報(bào)告和多媒體文件等。由于DSpace向世界公開了遵循BSD協(xié)議的開放源代碼,任何用戶都可以對(duì)該系統(tǒng)進(jìn)行定制和擴(kuò)展。
DSpace系統(tǒng)分為存儲(chǔ)層、業(yè)務(wù)邏輯層和應(yīng)用層,每層由一系列組件構(gòu)成:存儲(chǔ)層的功能是對(duì)數(shù)字內(nèi)容和相關(guān)的元數(shù)據(jù)進(jìn)行存儲(chǔ),一方面負(fù)責(zé)對(duì)后臺(tái)數(shù)據(jù)庫(kù)的操作,完成內(nèi)容組織、內(nèi)容元數(shù)據(jù)、電子用戶、授權(quán)、工作流和檢索索引的保存;另一方面負(fù)責(zé)數(shù)字流的保存,這是通過(guò)文件系統(tǒng)和存儲(chǔ)資源代理服務(wù)(Storage Source Broker)來(lái)實(shí)現(xiàn)的。該層各個(gè)組件的功能是通過(guò)Java編寫的存儲(chǔ)API來(lái)調(diào)用實(shí)現(xiàn)的。業(yè)務(wù)邏輯層負(fù)責(zé)完成具體的功能模塊,如內(nèi)容管理、工作流管理、電子用戶管理、授權(quán)、瀏覽和檢索等。該層的各個(gè)組件的功能是通過(guò)Java編寫的DSpace公共API來(lái)調(diào)用實(shí)現(xiàn)的。應(yīng)用層提供了基于Web的用戶界面來(lái)應(yīng)用和管理DSpace系統(tǒng),使用起來(lái)極為方便。此外還提供了一系列的接口,如元數(shù)據(jù)獲取標(biāo)準(zhǔn)OAI-PMH的數(shù)據(jù)供應(yīng)、數(shù)字條目批量導(dǎo)入工具等。該層的各個(gè)組件的功能是通過(guò)Java編寫的Servlet和JSP來(lái)調(diào)用實(shí)現(xiàn)的。
作為一個(gè)電子資源收集發(fā)布平臺(tái),DSpace必須解決誰(shuí)有權(quán)遞交資源、誰(shuí)有權(quán)使用資源、誰(shuí)負(fù)責(zé)管理等一系列問(wèn)題,這是由DSpace的授權(quán)策略和工作流機(jī)制相互配合來(lái)解決的。某些DSpace的功能,比如檢索、瀏覽等可以由匿名用戶使用,但是如提交、訂閱以及管理等功能則需要用戶通過(guò)認(rèn)證。DSpace用“電子用戶”(E-People)來(lái)表示認(rèn)證用戶,主要包含用戶的郵件地址、認(rèn)證信息和所訂閱專題等信息。若干電子用戶可以組成一個(gè)用戶組(Group)。
DSpace應(yīng)用上的一些特點(diǎn):
考慮到用戶會(huì)在其他地方引用到所需要的數(shù)字條目,而傳統(tǒng)的頁(yè)面URL方式引用并不能保證長(zhǎng)期有效,DSpace采用了美國(guó)國(guó)家研究推進(jìn)機(jī)構(gòu)句柄系統(tǒng)(CNRI Han-dle System)來(lái)生成與存儲(chǔ)地址無(wú)關(guān)的標(biāo)識(shí)符來(lái)指向空間群、館藏或條目。句柄可以寫成2種形式:hdl:1721.123/4567和http:∥hdl.handle.net/1721.123/4567,前者訪問(wèn)時(shí)需要使用CNRI的句柄解析插件,后者則可以被任意的瀏覽器識(shí)別。每個(gè)DSpace站點(diǎn)要從CNRI獲得一個(gè)全球惟一的前綴,如以上的1721.123就是一個(gè)前綴。站點(diǎn)本身必須運(yùn)行一個(gè)句柄服務(wù)器來(lái)生成指向數(shù)字條目的惟一標(biāo)識(shí)符,如以上的4567。另外DSpace還提供一種指向數(shù)字流的標(biāo)識(shí)來(lái)提供引用服務(wù),如https:∥dspace.myu.edu/bitstream/123.456/789/24/foo.html,這種方式使用方便,但可靠性比句柄方式差,如果服務(wù)器變更了,引用就會(huì)變成無(wú)效。
DSpace系統(tǒng)通過(guò)應(yīng)用層實(shí)現(xiàn)了對(duì)OAI-PMH協(xié)議的支持,可以從其他資源站點(diǎn)收割元數(shù)據(jù)信息,并采用聯(lián)機(jī)計(jì)算機(jī)圖書館中心(OCLC)的開放源代碼軟件OAICat框架在OAI協(xié)議集合的基礎(chǔ)上公開了數(shù)字條目的DC元數(shù)據(jù),使用戶可以從一個(gè)DSpace站點(diǎn)上匿名地獲取多個(gè)站點(diǎn)上的信息。
DSpace系統(tǒng)還通過(guò)SFX支持OpenURL協(xié)議。如果擁有一個(gè)SFX服務(wù)器,DSpace可以在每一個(gè)數(shù)字條目頁(yè)面上顯示一個(gè)OpenURL鏈接,自動(dòng)使用DC元數(shù)據(jù),用戶可以方便得使用鏈接服務(wù)。另外,DSpace能夠響應(yīng)外來(lái)的OpenURL請(qǐng)求,不過(guò)只是簡(jiǎn)單地把OpenURL作為查詢條件傳遞給檢索子系統(tǒng),給出最相關(guān)的數(shù)字條目的結(jié)果列表。
檢索是資源發(fā)布的重要組成部分,DSpace也盡可能多地提供檢索特性。DSpace的索引和檢索模塊提供一個(gè)簡(jiǎn)單的API,允許對(duì)新內(nèi)容作索引、重建索引以及在指定范圍內(nèi)檢索。這個(gè)API來(lái)自開放源代碼的Java搜索引擎Lucene。Lucene適合跨平臺(tái)的全文檢索,支持很多檢索特性如字段檢索、省略詞(Stop Words)、詞干(Stemming)以及不重建索引增加新的索引內(nèi)容的能力。除檢索外,用戶還可以通過(guò)瀏覽來(lái)獲取資源,瀏覽子系統(tǒng)提供了一個(gè)簡(jiǎn)單的API來(lái)使用一個(gè)索引或該索引的一部分。目前可以被瀏覽的索引有條目題名,遞交日期和作者等。
DSpace還提供了一系列的工具來(lái)方便使用。如導(dǎo)入和導(dǎo)出數(shù)字條目的批處理工具,該工具采用簡(jiǎn)單的目錄結(jié)構(gòu)組織將條目的DC元數(shù)據(jù)存成XML文件,方便在DSpace和其他系統(tǒng)之間交換數(shù)據(jù)。此外還提供一個(gè)基于元數(shù)據(jù)編碼和傳輸規(guī)范(METS)的導(dǎo)出工具,用于將數(shù)字條目導(dǎo)出成符合METS格式的元數(shù)據(jù)記錄。但目前還沒(méi)有提供對(duì)METS格式的元數(shù)據(jù)的導(dǎo)入功能,DSpace開發(fā)組計(jì)劃在未來(lái)的版本中提供基于METS的元數(shù)據(jù)導(dǎo)入工具。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是提供一種基于DSpace的數(shù)字資源管理方法。
本發(fā)明的目的可以通過(guò)以下技術(shù)方案實(shí)現(xiàn):
一種基于DSpace的數(shù)字資源管理方法,其特征在于,包括:
步驟一、將用戶分組,不同的用戶組設(shè)置不同等級(jí)的權(quán)限,其中設(shè)置兩個(gè)特殊組:管理組和匿名組,所述的管理組中的用戶可以對(duì)DSpace站點(diǎn)做任何事情,所述的匿名組指沒(méi)有通過(guò)認(rèn)證的Web用戶;
步驟二、對(duì)資源的控制采取分組控制的授權(quán)策略,將不同的資源對(duì)應(yīng)到不同的數(shù)據(jù)模型,定義不同的用戶組可以針對(duì)特定的資源執(zhí)行的操作,生成權(quán)限對(duì)應(yīng)表存入數(shù)據(jù)庫(kù);
步驟三、采用默認(rèn)否定的策略,將新建立的組缺省權(quán)限設(shè)置為匿名組權(quán)限;
步驟四、將每一次資源的收集發(fā)布規(guī)整成一個(gè)工作流,每個(gè)工作流可以包含遞交、審核、元數(shù)據(jù)編輯和終審等步驟,每個(gè)步驟必須由擁有該步驟執(zhí)行權(quán)限組中的用戶才能執(zhí)行;
步驟五、將未完成的發(fā)布任務(wù)加入到相關(guān)的用戶組的任務(wù)池中;
步驟六、向?qū)?yīng)用戶組中的用戶發(fā)送通知,該組用戶可以從任務(wù)池中取出該任務(wù)繼續(xù)處理,直到發(fā)布完成。
進(jìn)一步地,所述的數(shù)據(jù)模型包括數(shù)字空間群、數(shù)字館藏、數(shù)字條目、數(shù)字流包、數(shù)字流、數(shù)字流格式,所述的數(shù)字空間群包含數(shù)字館藏,所述的數(shù)字館藏包含數(shù)字條目,所述的數(shù)字條目包含數(shù)字流包,所述的數(shù)字流包包含數(shù)字流,所述的數(shù)字流包含數(shù)字流格式。
本發(fā)明的有益效果:
本發(fā)明所提供的一種基于DSpace的數(shù)字資源管理方法,應(yīng)用于開放源代碼數(shù)字資源管理系統(tǒng)DSpace,提供了較為豐富的功能,可以滿足大多數(shù)數(shù)字資源的提交、保存、管理和發(fā)布等應(yīng)用的需求。對(duì)于一般的數(shù)字圖書館電子資源應(yīng)用,在不需要擴(kuò)展特殊功能的情況下,可以選擇DSpace作為應(yīng)用的平臺(tái),在此基礎(chǔ)上快速開發(fā)出完善的存儲(chǔ)解決方案。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
圖1是本發(fā)明的方法流程圖。
圖2是本發(fā)明的數(shù)據(jù)模型示意圖。
具體實(shí)施方式
本發(fā)明的核心是提供一種基于DSpace的數(shù)字資源管理方法。
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
如圖1所示,本發(fā)明提供了一種基于DSpace的數(shù)字資源管理方法,該方法包括如下步驟:
步驟一、將用戶分組,不同的用戶組設(shè)置不同等級(jí)的權(quán)限,其中設(shè)置兩個(gè)特殊組:管理組和匿名組,管理組中的用戶可以對(duì)DSpace站點(diǎn)做任何事情,匿名組指沒(méi)有通過(guò)認(rèn)證的Web用戶。
步驟二、對(duì)資源的控制采取分組控制的授權(quán)策略,將不同的資源對(duì)應(yīng)到不同的數(shù)據(jù)模型,定義不同的用戶組可以針對(duì)特定的資源執(zhí)行的操作,生成權(quán)限對(duì)應(yīng)表存入數(shù)據(jù)庫(kù)。
如圖2所示,數(shù)字模型包括數(shù)字空間群、數(shù)字館藏、數(shù)字條目、數(shù)字流包、數(shù)字流、數(shù)字流格式,其中,數(shù)字空間群包含數(shù)字館藏,數(shù)字館藏包含數(shù)字條目,數(shù)字條目包含數(shù)字流包,數(shù)字流包包含數(shù)字流,數(shù)字流包含數(shù)字流格式;
數(shù)字空間群是模型中最上層的對(duì)象,每個(gè)DSpace站點(diǎn)可以劃分成多個(gè)數(shù)字空間群;數(shù)字空間群可以進(jìn)一步劃分成多個(gè)子數(shù)字空間群,數(shù)字空間群可以進(jìn)一步劃分成多個(gè)子數(shù)字空間群;
數(shù)字館藏由一些相關(guān)的內(nèi)容組成,一個(gè)數(shù)字空間群可以包含多個(gè)數(shù)字館藏,一個(gè)數(shù)字館藏也可以在多個(gè)數(shù)字空間群中出現(xiàn),用戶一般以數(shù)字館藏為單位來(lái)訂閱相關(guān)的信息;
數(shù)字條目是信息的基本存檔單元,代表用戶可訪問(wèn)的具體一條數(shù)字資源,數(shù)字館藏就是由若干條目構(gòu)成的,一個(gè)條目可以以引用的方式同時(shí)出現(xiàn)在多個(gè)數(shù)字館藏中,但是只能屬于一個(gè)數(shù)字館藏;
數(shù)字流包由密切聯(lián)系的數(shù)字流組成,例如發(fā)布文件數(shù)字流包、證書文件數(shù)字流包等;
數(shù)字流就是通常的計(jì)算機(jī)文件,例如HTML文檔、AVI文件等;
數(shù)字流格式是用來(lái)指向一種特定文件格式的惟一標(biāo)識(shí),提供如何顯式或隱式解釋該格式文件的方法;每個(gè)數(shù)字流都與一種數(shù)字流格式相關(guān)聯(lián)。因?yàn)樘峁╅L(zhǎng)期保存服務(wù)是DSpace服務(wù)的一個(gè)重要方面,所以獲取用戶所提交文件的特定格式是很重要的。
步驟三、采用“默認(rèn)否定”的策略,將新建立的組缺省權(quán)限設(shè)置為匿名組權(quán)限。
步驟四、將每一次資源的收集發(fā)布規(guī)整成一個(gè)工作流,每個(gè)工作流可以包含遞交、審核、元數(shù)據(jù)編輯和終審等步驟,每個(gè)步驟必須由擁有該步驟執(zhí)行權(quán)限組中的用戶才能執(zhí)行。
步驟五、將未完成的發(fā)布任務(wù)加入到相關(guān)的用戶組的“任務(wù)池”中。
步驟六、向?qū)?yīng)用戶組中的用戶發(fā)送通知,該組用戶可以從“任務(wù)池”中取出該任務(wù)繼續(xù)處理,直到發(fā)布完成。
本發(fā)明所提供的一種基于DSpace的數(shù)字資源管理方法,應(yīng)用于開放源代碼數(shù)字資源管理系統(tǒng)DSpace,提供了較為豐富的功能,可以滿足大多數(shù)數(shù)字資源的提交、保存、管理和發(fā)布等應(yīng)用的需求。對(duì)于一般的數(shù)字圖書館電子資源應(yīng)用,在不需要擴(kuò)展特殊功能的情況下,可以選擇DSpace作為應(yīng)用的平臺(tái),在此基礎(chǔ)上快速開發(fā)出完善的存儲(chǔ)解決方案。
以上內(nèi)容僅僅是對(duì)本發(fā)明結(jié)構(gòu)所作的舉例和說(shuō)明,所屬本技術(shù)領(lǐng)域的技術(shù)人員對(duì)所描述的具體實(shí)施例做各種各樣的修改或補(bǔ)充或采用類似的方式替代,只要不偏離發(fā)明的結(jié)構(gòu)或者超越本權(quán)利要求書所定義的范圍,均應(yīng)屬于本發(fā)明的保護(hù)范圍。