專利名稱:一種信息存儲(chǔ)、或讀取的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)庫(kù)技術(shù)領(lǐng)域,特別涉及一種信息存儲(chǔ)、或讀取的方法及裝置。
背景技術(shù):
隨著網(wǎng)絡(luò)媒體的發(fā)展,信息的數(shù)量急劇增加。每個(gè)信息平臺(tái)為管理各自的信息內(nèi) 容都會(huì)建立對(duì)應(yīng)的數(shù)據(jù)庫(kù)。例如數(shù)據(jù)庫(kù)中包括信息編號(hào)、信息標(biāo)題、信息發(fā)布時(shí)間等等。 針對(duì)各條信息內(nèi)容的正文,也會(huì)在數(shù)據(jù)庫(kù)中進(jìn)行備份,一般建立一條大文本字段(clob)來 表示。而信息內(nèi)容的正文往往篇幅比較長(zhǎng),信息量也比較大,這時(shí),表示信息正文的clob字 段就會(huì)比較長(zhǎng)。在數(shù)據(jù)庫(kù)中存儲(chǔ)信息時(shí),由于表示信息正文的clob字段比較長(zhǎng),進(jìn)行存儲(chǔ)時(shí)會(huì)耗 費(fèi)大量的時(shí)間,clob字段越長(zhǎng),存儲(chǔ)時(shí)間的消耗就更加明顯。在數(shù)據(jù)庫(kù)中查詢信息時(shí),可能只需查看信息的標(biāo)題或者發(fā)布時(shí)間,而并不需要查 看信息的正文,但是返回查詢結(jié)果中仍然包括表示信息正文的clob字段,并且clob字段比 較長(zhǎng),占用大量的資源??梢?,在數(shù)據(jù)庫(kù)在存取一條表示信息正文的clob字段時(shí),若字段內(nèi)容較長(zhǎng),其存 儲(chǔ)時(shí)間較長(zhǎng),從而,造成了內(nèi)存資源的不必要消耗,并使得信息存取的效率低下。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種信息存儲(chǔ),或讀取的方法及裝置,用以提高信息存取的效率。本發(fā)明實(shí)施例提供一種信息存儲(chǔ)的方法,包括信息平臺(tái)讀取待存儲(chǔ)信息的屬性標(biāo)識(shí);當(dāng)讀取的屬性標(biāo)識(shí)是正文標(biāo)識(shí)時(shí),在數(shù)據(jù)庫(kù)中為所述待存儲(chǔ)信息設(shè)置鏈接有效信 肩、ο本發(fā)明實(shí)施例提供一種信息讀取的方法,包括讀取待讀取信息的每條屬性信息;當(dāng)讀取的屬性信息是鏈接有效信息時(shí),根據(jù)保存的身份標(biāo)識(shí)與正文信息的對(duì)應(yīng)關(guān) 系,確定所述待讀取信息的身份標(biāo)識(shí)對(duì)應(yīng)的正文信息;呈現(xiàn)確定的所述正文信息。本發(fā)明實(shí)施例提供一種信息存儲(chǔ)的裝置,包括讀取單元,用于讀取待存儲(chǔ)信息的屬性標(biāo)識(shí);配置單元,用于當(dāng)讀取的屬性標(biāo)識(shí)是正文標(biāo)識(shí)時(shí),在數(shù)據(jù)庫(kù)中為所述待存儲(chǔ)信息 設(shè)置鏈接有效信息。本發(fā)明實(shí)施例提供一種信息讀取的裝置,包括讀取單元,用于讀取待讀取信息的每條屬性信息;確定單元,用于當(dāng)讀取的屬性信息是鏈接有效信息時(shí),根據(jù)保存的身份標(biāo)識(shí)與正文信息的對(duì)應(yīng)關(guān)系,確定所述待讀取信息的身份標(biāo)識(shí)對(duì)應(yīng)的正文信息;呈現(xiàn)單元,用于呈現(xiàn)確定的所述正文信息。本發(fā)明實(shí)施例中,信息平臺(tái)保存了每條信息的身份標(biāo)識(shí)與正文信息的對(duì)應(yīng)關(guān)系, 這樣,存儲(chǔ)信息時(shí),當(dāng)讀取的待存儲(chǔ)信息的屬性標(biāo)識(shí)為正文標(biāo)識(shí)時(shí),不需要存儲(chǔ)該正文標(biāo)識(shí) 對(duì)應(yīng)的正文信息,只需要在數(shù)據(jù)庫(kù)中為所述待存儲(chǔ)信息設(shè)置鏈接有效信息,這樣,極大的減 少了存儲(chǔ)的信息量,提高信息存儲(chǔ)的效率。
圖1為本發(fā)明實(shí)施例中信息存儲(chǔ)的流程圖;圖2為本發(fā)明實(shí)施例中信息讀取的流程圖;圖3為本發(fā)明實(shí)施例中信息存儲(chǔ)的裝置結(jié)構(gòu)圖;圖4為本發(fā)明實(shí)施例中信息存儲(chǔ)的裝置結(jié)構(gòu)圖。
具體實(shí)施例方式本發(fā)明實(shí)施例,信息平臺(tái)保存了每一條信息,這樣,每條信息的正文都有一條對(duì)應(yīng) 的存儲(chǔ)路徑,并且每條信息都有一個(gè)唯一的身份標(biāo)識(shí),即ID,這樣,信息平臺(tái)建立并保存了 每條信息的身份標(biāo)識(shí)與存儲(chǔ)路徑的第一對(duì)應(yīng)關(guān)系,以及存儲(chǔ)路徑與正文信息的第二對(duì)應(yīng)關(guān)系。信息平臺(tái)建立數(shù)據(jù)庫(kù)管理每一條信息,將一條信息存入數(shù)據(jù)庫(kù)包括讀取該條信 息的每條屬性標(biāo)識(shí),將讀取的屬性標(biāo)識(shí)對(duì)應(yīng)的屬性信息存入數(shù)據(jù)庫(kù)中對(duì)應(yīng)的位置。這里,屬 性標(biāo)識(shí)包括身份標(biāo)識(shí)、標(biāo)題標(biāo)識(shí)、作者標(biāo)識(shí)、發(fā)布時(shí)間標(biāo)識(shí)、評(píng)論標(biāo)識(shí)、或正文標(biāo)識(shí)。對(duì)應(yīng)的 屬性信息分別為身份信息、標(biāo)題信息、作者信息、發(fā)布時(shí)間信息、評(píng)論信息、以及正文信息。當(dāng)讀取的屬性信息為正文標(biāo)識(shí)時(shí),其對(duì)應(yīng)的正文信息可能包含的內(nèi)容很多,如果 將該正文信息存入到數(shù)據(jù)庫(kù)中對(duì)應(yīng)的位置時(shí),表示正文信息的字段就會(huì)比較長(zhǎng),存儲(chǔ)的時(shí) 間也會(huì)比較長(zhǎng),因此,本發(fā)明實(shí)施例中,不在數(shù)據(jù)庫(kù)中存儲(chǔ)正文信息。參見圖1,本發(fā)明實(shí)施例信息平臺(tái)中,信息存儲(chǔ)的過程包括步驟101 信息平臺(tái)讀取待存儲(chǔ)信息的屬性標(biāo)識(shí)。這里,屬性標(biāo)識(shí)包括ID、標(biāo)題標(biāo)識(shí)、作者標(biāo)識(shí)、發(fā)布時(shí)間標(biāo)識(shí)、評(píng)論標(biāo)識(shí)、或正文標(biāo) 識(shí)。信息平臺(tái)中的待存儲(chǔ)信息的格式有多種,包括可擴(kuò)展標(biāo)記語(yǔ)言(XML,Extensible Markup Language)格式,HTML 格式,TXT 格式等等。當(dāng)待存儲(chǔ)信息為XML格式文件時(shí),直接讀取XML格式文件中的類型標(biāo)簽。具體可 以操作XML的相應(yīng)技術(shù),如Dom4j,SAXReader等讀取XML格式文件,當(dāng)讀取到標(biāo)題標(biāo)簽時(shí), 則獲取到該待存儲(chǔ)信息的標(biāo)題標(biāo)識(shí),當(dāng)讀取到正文標(biāo)簽時(shí),則獲取到該待存儲(chǔ)信息的正文 標(biāo)識(shí)。例如待存儲(chǔ)信息為XML格式文件,D0C/C0NTENT中存儲(chǔ)了表DOC_PAPER_ARTICLES 中ID為Dl 1000b jcb_20090926的信息,具體為<D0CS><D0C_ID = " Dl 1000bjcb_20090926" D0C_TYPE = " DOC_PAPER_ARTICLES" >
〈CONTENT〉< ! [CDATA[晨報(bào)長(zhǎng)春訊“我沒想到能被傳到網(wǎng)上被大家品頭論足,有點(diǎn)意外?!闭f 起自己的視頻被傳到網(wǎng)上并出現(xiàn)了超高點(diǎn)擊率,被喻為長(zhǎng)春男主播版的“劉翔”顯得有點(diǎn)尷 她,其實(shí)“劉翔”真名叫劉暢。]]>〈/CONTENT〉</D0C></D0CS>這樣,該信息的屬性標(biāo)識(shí)分別包括ID、D0C_TYPE、以及CONTENT。當(dāng)然,待存儲(chǔ)的信息格式也包括其他的信息平臺(tái)能識(shí)別的文件格式。當(dāng)待存儲(chǔ)信 息為TXT格式文件,也可以通過在文本文件中設(shè)立特殊字符來標(biāo)識(shí)屬性信息,例如設(shè)立一 個(gè)特殊的字符“#”對(duì)應(yīng)正文信息的開始和結(jié)束,那么,當(dāng)讀取該特性字符“#”時(shí),即可確定 讀取的是正文標(biāo)識(shí)。同樣類似的其他文件格式也可以采取相應(yīng)的措施進(jìn)行讀取。步驟102 判斷讀取的屬性標(biāo)識(shí)是否為正文標(biāo)識(shí),如果是執(zhí)行步驟103,否則,執(zhí)行 步驟104。這里,對(duì)讀取的每個(gè)屬標(biāo)識(shí)進(jìn)行判斷,當(dāng)讀取的屬性標(biāo)識(shí)為正文標(biāo)識(shí)時(shí),執(zhí)行步驟 103,否則,執(zhí)行步驟104。例如上述XML格式文件中,如果讀取的屬性標(biāo)識(shí)為“ID”,確定不是正文標(biāo)識(shí),執(zhí) 行步驟104。如果讀取的屬性標(biāo)識(shí)為“CONTENT”,確定是正文標(biāo)識(shí),執(zhí)行步驟103。。步驟103 在數(shù)據(jù)庫(kù)中為待存儲(chǔ)信息設(shè)置鏈接有效信息。這里,讀取的屬性標(biāo)識(shí)為正文標(biāo)識(shí)時(shí),本發(fā)明實(shí)施例中,不需要在數(shù)據(jù)庫(kù)中存儲(chǔ)正 文信息,只需要在數(shù)據(jù)庫(kù)中為待存儲(chǔ)信息設(shè)置鏈接有效信息。其中,鏈接有效信息用于表示 該待存儲(chǔ)信息的正文信息是有鏈接的。即通過與該正文對(duì)應(yīng)的存儲(chǔ)路徑,即可鏈接查找到 正文信息。這里,可以在數(shù)據(jù)庫(kù)中正文標(biāo)識(shí)對(duì)應(yīng)的屬性信息中設(shè)置一個(gè)鏈接有效信息。例如 將正文標(biāo)識(shí)“C0NTEENT”對(duì)應(yīng)的屬性信息設(shè)置為“extfile”。即“extfile”為鏈接有效信 肩、ο還可以在數(shù)據(jù)庫(kù)中預(yù)先設(shè)置了鏈接標(biāo)識(shí),當(dāng)數(shù)據(jù)庫(kù)中不存儲(chǔ)正文信息時(shí),將該鏈 接標(biāo)識(shí)對(duì)應(yīng)的屬性信息設(shè)置為鏈接有效信息。例如設(shè)置一個(gè)鏈接標(biāo)識(shí)“LINK”,當(dāng)在數(shù)據(jù) 庫(kù)中不存儲(chǔ)正文信息時(shí),該鏈接標(biāo)識(shí)“LINK”對(duì)應(yīng)的屬性信息置為“YES”,則“YES”為鏈接有
效信息。步驟104 將讀取的屬性標(biāo)識(shí)對(duì)應(yīng)的屬性信息存入數(shù)據(jù)庫(kù)中。這里,讀取的屬性標(biāo)識(shí)不是正文標(biāo)識(shí),可見,其對(duì)應(yīng)的屬性信息的內(nèi)容比較簡(jiǎn)單, 因此,直接將該屬性標(biāo)識(shí)對(duì)應(yīng)的屬性信息存入數(shù)據(jù)庫(kù)中對(duì)應(yīng)的位置。例如讀取的屬性標(biāo)識(shí) 為ID,則將〃 D11000bjcb_20090擬6〃存入數(shù)據(jù)庫(kù)中對(duì)應(yīng)的位置?;蛘?,讀取的屬性信息為 D0C_TYPE,則將‘‘DOC_PAPER_ARTICLES”存入數(shù)據(jù)庫(kù)中對(duì)應(yīng)的位置??梢?,本發(fā)明實(shí)施例中,在數(shù)據(jù)庫(kù)中存儲(chǔ)每條信息時(shí),不需要存儲(chǔ)正文信息,即存 儲(chǔ)大量的CLOB字段,只需要設(shè)置對(duì)應(yīng)的鏈接有效信息。因此,大大地節(jié)省了存儲(chǔ)資源,提高 存儲(chǔ)效率。
當(dāng)然,對(duì)于含有大文本數(shù)據(jù)正文信息的文件的存儲(chǔ),采用本發(fā)明實(shí)施例所述方法 非常有效,對(duì)于正文信息很少的文件的存儲(chǔ),既可以采用現(xiàn)有的技術(shù)直接進(jìn)行存儲(chǔ),也可以 采用本發(fā)明實(shí)施例所述方法。根據(jù)上述方法在數(shù)據(jù)庫(kù)中存儲(chǔ)了每條信息,并且,在信息平臺(tái)中保存了每條信息 的身份標(biāo)識(shí)與存儲(chǔ)路徑的對(duì)應(yīng)關(guān)系。這樣,從數(shù)據(jù)庫(kù)中讀取信息時(shí),當(dāng)讀取到待讀取信息的屬性信息為鏈接有效信息 時(shí),根據(jù)保存的身份標(biāo)識(shí)與正文信息的對(duì)應(yīng)關(guān)系,確定待讀取信息的身份標(biāo)識(shí)對(duì)應(yīng)的正文 信息,從而讀取到正文信息。信息平臺(tái)可以根據(jù)輸入的關(guān)鍵字,在數(shù)據(jù)庫(kù)中查找待讀取信息。關(guān)鍵字包括標(biāo) 題,作者,或發(fā)布時(shí)間??梢酝ㄟ^數(shù)據(jù)庫(kù)的檢索功能,確定數(shù)據(jù)庫(kù)中的待讀取信息。查找到 后,從數(shù)據(jù)庫(kù)中讀取該信息的過程參見圖2,包括步驟201 讀取待讀取信息的每條屬性信息。數(shù)據(jù)庫(kù)中按每個(gè)屬性標(biāo)識(shí),分別存儲(chǔ)了待讀取信息的每個(gè)屬性標(biāo)識(shí)對(duì)應(yīng)的屬性信 息,從而,可以逐一讀取該待讀取信息中屬性標(biāo)識(shí)對(duì)應(yīng)的每條屬性信息。步驟202 判斷讀取到的屬性信息是否為鏈接有效信息,如果是,執(zhí)行步驟203,否 則,執(zhí)行步驟206。例如信息平臺(tái)中,已默認(rèn)鏈接有效信息為“extfile”。當(dāng)讀取到的正文標(biāo)識(shí)對(duì)應(yīng) 的屬性信息為“extfile”時(shí),確認(rèn)為鏈接有效信息,執(zhí)行步驟203;否則,執(zhí)行步驟206?;蛘?,信息平臺(tái)中,已默認(rèn)鏈接有效信息為“YES”,當(dāng)讀取到的鏈接標(biāo)識(shí)對(duì)應(yīng)的屬 性信息為“YES”時(shí),確認(rèn)為鏈接有效信息,執(zhí)行步驟203 ;否則,執(zhí)行步驟206。步驟203 根據(jù)保存的身份標(biāo)識(shí)與正文信息的對(duì)應(yīng)關(guān)系,確定待讀取信息的身份 標(biāo)識(shí)對(duì)應(yīng)的正文信息。信息平臺(tái)在管理每條信息時(shí),已經(jīng)保存了身份標(biāo)識(shí)與存儲(chǔ)路徑的第一對(duì)應(yīng)關(guān)系, 以及存儲(chǔ)路徑與正文信息的第二對(duì)應(yīng)關(guān)系。因此,這里首先獲取待讀取信息的身份標(biāo)識(shí),然 后根據(jù)第一對(duì)應(yīng)關(guān)系,可以確定待讀取信息的身份標(biāo)識(shí)對(duì)應(yīng)的存儲(chǔ)路徑,根據(jù)第二對(duì)應(yīng)關(guān) 系,查找確定的存儲(chǔ)路徑對(duì)應(yīng)的正文信息。這里,可以直接根據(jù)該存儲(chǔ)路徑,鏈接到正文信 息。例如信息平臺(tái)中待讀取信息為XML格式文件,這樣,當(dāng)通過存儲(chǔ)路徑,鏈接到對(duì)應(yīng)的 XML格式文件后,解析該XML格式文件,獲得XML格式文件中的正文信息。步驟204 呈現(xiàn)查找到的正文信息。這里,信息平臺(tái)呈現(xiàn)查找到的正文信息。步驟205 呈現(xiàn)讀取的屬性信息。這里,讀取的屬性信息不是鏈接有效信息,直接將讀取的屬性信息呈現(xiàn)出來。例 如,讀取的屬性信息為〃 Dl 1000bjcb_20090926〃,則直接呈現(xiàn)“D11000bjcb_20090926”。當(dāng)然,本發(fā)明實(shí)施例中,如果不需要獲取待存儲(chǔ)信息的正文信息,則可以不去查找 對(duì)應(yīng)的正文信息,直接讀取其他的屬性信息,然后,將讀取的屬性信息呈現(xiàn)出來。下面結(jié)合說明書附圖對(duì)本發(fā)明實(shí)施例作進(jìn)一步詳細(xì)描述。實(shí)施例一,本實(shí)施例中管理信息的數(shù)據(jù)庫(kù)表內(nèi)容信息如表1所示,這里,鏈接有效 信息用“extfile”表示。在信息平臺(tái)的存儲(chǔ)單元中存儲(chǔ)了一條信息,其對(duì)應(yīng)的存儲(chǔ)路徑為 \d\xx\x,則保存了該信息的身份標(biāo)識(shí)與該存儲(chǔ)路徑的對(duì)應(yīng)關(guān)系。該信息為XML格式文件,
權(quán)利要求
1.一種信息存儲(chǔ)的方法,其特征在于,包括 信息平臺(tái)讀取待存儲(chǔ)信息的屬性標(biāo)識(shí);當(dāng)讀取的屬性標(biāo)識(shí)是正文標(biāo)識(shí)時(shí),在數(shù)據(jù)庫(kù)中為所述待存儲(chǔ)信息設(shè)置鏈接有效信息。
2.如權(quán)利要求1所述的方法,其特征在于,所述讀取待存儲(chǔ)信息的屬性標(biāo)識(shí)包括 讀取可擴(kuò)展標(biāo)記語(yǔ)言XML格式文件中的類型標(biāo)簽。
3.如權(quán)利要求1所述的方法,其特征在于,所述在數(shù)據(jù)庫(kù)中為所述待存儲(chǔ)信息設(shè)置鏈 接有效信息包括將所述數(shù)據(jù)庫(kù)中所述正文標(biāo)識(shí)對(duì)應(yīng)的屬性信息設(shè)置為鏈接有效信息;或, 將所述數(shù)據(jù)庫(kù)中預(yù)設(shè)的鏈接標(biāo)識(shí)對(duì)應(yīng)的屬性信息設(shè)置為鏈接有效信息。
4.一種信息讀取的方法,其特征在于,包括 讀取待讀取信息的每條屬性信息;當(dāng)讀取的屬性信息是鏈接有效信息時(shí),根據(jù)保存的身份標(biāo)識(shí)與正文信息的對(duì)應(yīng)關(guān)系, 確定所述待讀取信息的身份標(biāo)識(shí)對(duì)應(yīng)的正文信息; 呈現(xiàn)確定的所述正文信息。
5.如權(quán)利要求4所述的方法,其特征在于,所述確定所述待讀取信息的身份標(biāo)識(shí)對(duì)應(yīng) 的正文信息包括根據(jù)保存的身份標(biāo)識(shí)與存儲(chǔ)路徑的第一對(duì)應(yīng)關(guān)系,確定所述待讀取信息的身份標(biāo)識(shí)對(duì) 應(yīng)的存儲(chǔ)路徑;根據(jù)保存的存儲(chǔ)路徑與正文信息的第二對(duì)應(yīng)關(guān)系,查找確定的所述存儲(chǔ)路徑對(duì)應(yīng)的正 3Cfn 息。
6.一種信息存儲(chǔ)的裝置,其特征在于,包括 讀取單元,用于讀取待存儲(chǔ)信息的屬性標(biāo)識(shí);配置單元,用于當(dāng)讀取的屬性標(biāo)識(shí)是正文標(biāo)識(shí)時(shí),在數(shù)據(jù)庫(kù)中為所述待存儲(chǔ)信息設(shè)置 鏈接有效信息。
7.如權(quán)利要求6所述的裝置,其特征在于,所述讀取單元,還用于讀取可擴(kuò)展標(biāo)記語(yǔ)言XML格式文件中的類型標(biāo)簽。
8.如權(quán)利要求6所述的裝置,其特征在于,所述配置單元,還用于將所述數(shù)據(jù)庫(kù)中所述正文標(biāo)識(shí)對(duì)應(yīng)的屬性信息設(shè)置為鏈接有效 信息,或,將所述數(shù)據(jù)庫(kù)中預(yù)設(shè)的鏈接標(biāo)識(shí)對(duì)應(yīng)的屬性信息設(shè)置為鏈接有效信息。
9.一種信息讀取的裝置,其特征在于,包括 讀取單元,用于讀取待讀取信息的每條屬性信息;確定單元,用于當(dāng)讀取的屬性信息是鏈接有效信息時(shí),根據(jù)保存的身份標(biāo)識(shí)與正文信 息的對(duì)應(yīng)關(guān)系,確定所述待讀取信息的身份標(biāo)識(shí)對(duì)應(yīng)的正文信息; 呈現(xiàn)單元,用于呈現(xiàn)確定的所述正文信息。
10.如權(quán)利要求9所述的裝置,其特征在于,所述確定單元包括確定子單元,用于根據(jù)保存的身份標(biāo)識(shí)與存儲(chǔ)路徑的第一對(duì)應(yīng)關(guān)系,確定所述待讀取 信息的身份標(biāo)識(shí)對(duì)應(yīng)的存儲(chǔ)路徑;查找子單元,用于根據(jù)保存的存儲(chǔ)路徑與正文信息的第二對(duì)應(yīng)關(guān)系,查找確定的所述 存儲(chǔ)路徑對(duì)應(yīng)的正文信息。
全文摘要
本發(fā)明公開了一種信息存儲(chǔ),或讀取的方法和裝置,用以提高信息存取的效率。其中,信息存儲(chǔ)的方法包括信息平臺(tái)讀取待存儲(chǔ)信息的屬性標(biāo)識(shí),當(dāng)讀取的屬性標(biāo)識(shí)是正文標(biāo)識(shí)時(shí),在數(shù)據(jù)庫(kù)中為所述待存儲(chǔ)信息設(shè)置鏈接有效信息。
文檔編號(hào)G06F17/30GK102103611SQ20091024300
公開日2011年6月22日 申請(qǐng)日期2009年12月21日 優(yōu)先權(quán)日2009年12月21日
發(fā)明者朱傲, 趙東巖, 閔旺華 申請(qǐng)人:北京大學(xué), 北京方正阿帕比技術(shù)有限公司, 北大方正集團(tuán)有限公司