欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的方法及其系統(tǒng)的制作方法

文檔序號:6571494閱讀:662來源:國知局

專利名稱::將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的方法及其系統(tǒng)的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及一種文本數(shù)據(jù)格式轉(zhuǎn)換的方法,尤其是一種將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的方法及系統(tǒng)。
背景技術(shù)
:一般而言,在不同的時期或者不同的文本數(shù)據(jù)編寫者或者提供者所提供的文本數(shù)據(jù)格式都可能差別很大,而文本數(shù)據(jù)的呈現(xiàn)方式也會有很多不同。因此,我們常常會碰到需要處理以各種格式保存或者傳輸?shù)奈谋緮?shù)據(jù)的情況,這里不同格式是指文本數(shù)據(jù)本身儲存的格式不同,以及文本數(shù)據(jù)本身的數(shù)據(jù)結(jié)構(gòu)不一致,例如文本文本數(shù)據(jù)(TXT),DOC,超文本標(biāo)識語言(HypertextMarkupLanguage,HTML),可擴展超文本標(biāo)識語言(ExtensibleHypertextMarkupLanguage,xhtml)及可擴展標(biāo)識語言(ExtensibleMarkupLanguage,XML)等格式進行儲存。目前文本數(shù)據(jù)的處理往往是針對各部分文本數(shù)據(jù),依照具體的應(yīng)用需求利用專門的軟件做專門的處理。例如,對每一種格式都需要對應(yīng)的解析器(parser)。因此處理過程、文本數(shù)據(jù)格式和應(yīng)用密切相關(guān),而如果文本數(shù)據(jù)在不同軟件之間進行轉(zhuǎn)換時,容易引入錯誤,影響數(shù)據(jù)處理的品質(zhì)。此外,一旦需求變化,文本數(shù)據(jù)則需要再次修改。隨著文本數(shù)據(jù)的更新,相應(yīng)處理也必須發(fā)生變化,因此上述不同格式的文本數(shù)據(jù)的轉(zhuǎn)換不僅靈活性很差,而且很耗費人力和時間。尤其是在針對引擎開發(fā)以及數(shù)據(jù)驅(qū)動模式開發(fā)的過程中,在前期的數(shù)據(jù)處理時,由于文本數(shù)據(jù)格式的不一致,不僅減緩了開發(fā)進度,增加了相應(yīng)開發(fā)的時間周期,而且可能會導(dǎo)致錯誤的發(fā)生。
發(fā)明內(nèi)容本發(fā)明為了解決
背景技術(shù)
中存在的上述技術(shù)問題,而提供一種將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的格式的方法及系統(tǒng),不僅方便、快捷,而且減少了文本數(shù)據(jù)轉(zhuǎn)化的錯誤率。本發(fā)明的技術(shù)解決方案是本發(fā)明為一種將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的方法,其特殊之處在于該方法包含有以下步驟1)轉(zhuǎn)換不同儲存格式的文本數(shù)據(jù)為帶有卷標(biāo)描述信息的中間文件;1.1)讀取不同儲存格式的文本數(shù)據(jù),并依照各文本數(shù)據(jù)的儲存格式對其呈現(xiàn)的信息描述給予卷標(biāo)化,以得到相應(yīng)的卷標(biāo)描述信息;1.2)抽取出卷標(biāo)描述信息,以生成帶有卷標(biāo)描述信息的中間文件;2)然后按照文本數(shù)據(jù)呈現(xiàn)需求所需要的顯示格式,進行卷標(biāo)解釋配置及文本數(shù)據(jù)顯示格式配置,制定有統(tǒng)一模板格式的應(yīng)用模板;3)提取中間文件的卷標(biāo)描述信息映像到該應(yīng)用模板中;4)依照卷標(biāo)解釋與文本數(shù)據(jù)顯示格式,將中間文件的卷標(biāo)描述信息與應(yīng)用模板進行映像,轉(zhuǎn)換中間文件的數(shù)據(jù)格式,進而統(tǒng)一文本數(shù)據(jù)上的儲存格式與數(shù)據(jù)格式。上述步驟1)中當(dāng)所述文本數(shù)據(jù)中含有二進制信息描述時,則在中間文件中對應(yīng)該二進制信息的文本描述處添加一資源連接的卷標(biāo)及其屬性,以轉(zhuǎn)換文本數(shù)據(jù)為合適的帶有卷標(biāo)描述信息的中間文件。上述步驟1)和步驟2)之間還包括有檢查中間文件的正確性及其格式合法性的步驟。上述步驟2)和步驟3)之間還包括有借助應(yīng)用模板的卷標(biāo)描述的格式卷標(biāo)格式化顯示中間文件,以查看和驗證該應(yīng)用模板的配置是否正確的步驟。上述步驟2)中還包括有更新應(yīng)用模板的卷標(biāo)解釋配置及文本數(shù)據(jù)顯示格式配置的步驟。上述步驟3)中提取中間文件中的卷標(biāo)描述信息的過程中,對于中間文件中可以舍棄的卷標(biāo)描述信息,給予卷標(biāo)描述信息的屏弊,對于其中可以舍棄的數(shù)據(jù)文件,屏弊數(shù)據(jù)文件對應(yīng)的卷標(biāo)描述信息。上述中間文件為可自定義卷標(biāo)的卷標(biāo)屬性的卷標(biāo)文本數(shù)據(jù),如可擴展標(biāo)識語言文本數(shù)據(jù)。一種應(yīng)用上述的將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的方法的系統(tǒng),其特殊之處在于該系統(tǒng)包括用來將不同儲存格式的文本數(shù)據(jù)轉(zhuǎn)換為帶有卷標(biāo)描述信息的中間文件,進而統(tǒng)一各文本數(shù)據(jù)的儲存格式的第一轉(zhuǎn)換模塊、用來配置卷標(biāo)解釋及文本數(shù)據(jù)顯示格式,以制定具有統(tǒng)一模板格式的應(yīng)用模板的定義模塊、用來依照已配置的卷標(biāo)解釋與文本數(shù)據(jù)顯示格式,將中間文件的卷標(biāo)描述信息與應(yīng)用模板進行比對,轉(zhuǎn)換中間文件的數(shù)據(jù)格式,進而統(tǒng)一文本數(shù)據(jù)上的儲存格式與數(shù)據(jù)格式的第二轉(zhuǎn)換模塊,第一轉(zhuǎn)換模塊和定義模塊分別接入第二轉(zhuǎn)換模塊。上述系統(tǒng)還包括用來依照應(yīng)用模板的卷標(biāo)描述的格式卷標(biāo)格式化顯示中間文件,進而查看和驗證該應(yīng)用模板的配置是否正確的預(yù)覽模塊和檢查中間文件的正確性及其格式的合法性的檢查模塊,預(yù)覽模塊分別接入第一轉(zhuǎn)換模塊和定義模塊,檢查模塊接入第一轉(zhuǎn)換模塊。本發(fā)明的方法是依照文本數(shù)據(jù)顯示的要求統(tǒng)一制定應(yīng)用模板,而將文本數(shù)據(jù)本身與具體應(yīng)用分離,即文本數(shù)據(jù)本身只呈現(xiàn)文本數(shù)據(jù)本身的信息描述,而不關(guān)心應(yīng)用描述。依照不同的應(yīng)用抽取出文本數(shù)據(jù)中的卷標(biāo)描述,生成文本數(shù)據(jù)的卷標(biāo)描述文本數(shù)據(jù),進而將文本數(shù)據(jù)依照給定的卷標(biāo)模式和定義的統(tǒng)一模板格式給予轉(zhuǎn)換,達到文本數(shù)據(jù)格式統(tǒng)一的目的。因此本發(fā)明通過卷標(biāo)描述的中間文件,進行分層轉(zhuǎn)換的方式,將文本數(shù)據(jù)描述與提取分離,可方便文本數(shù)據(jù)的維護,不必在文本數(shù)據(jù)中添加任何應(yīng)用格式上的說明,進而做到文本數(shù)據(jù)與應(yīng)用具體格式的分離,同時通過將文本數(shù)據(jù)轉(zhuǎn)換為帶卷標(biāo)的中間文件,可減少轉(zhuǎn)換為統(tǒng)一格式時所導(dǎo)致的信息丟失,因此不僅容易實現(xiàn)且不易出錯,還可以在轉(zhuǎn)換的過程中,通過中間文件的卷標(biāo)描述信息,方便快捷地查看各個轉(zhuǎn)換階段文本數(shù)據(jù)的正確性。此外,本發(fā)明的方法通過使用配置腳本進行數(shù)據(jù)格式轉(zhuǎn)換所依照的應(yīng)用模板,對于同類型的卷標(biāo)文本數(shù)據(jù),僅配置一份即可完成全部的轉(zhuǎn)換,還可以方便配置批腳本處理,并且,當(dāng)文本數(shù)據(jù)呈現(xiàn)需求變化時,文本數(shù)據(jù)的更新僅需要更新應(yīng)用模板的配置即可,進而節(jié)省人力和開發(fā)時間。圖1為本發(fā)明具體實施例中的文本數(shù)據(jù)儲存格式轉(zhuǎn)換的流程圖;圖2為本發(fā)明具體實施例中的文本數(shù)據(jù)數(shù)據(jù)格式轉(zhuǎn)換的流程圖;圖3、4為本發(fā)明具體實施例中的文本數(shù)據(jù)數(shù)據(jù)格式轉(zhuǎn)換后卷標(biāo)映像處理的實例示意圖;圖5為本發(fā)明具體實施例中的文本數(shù)據(jù)格式轉(zhuǎn)換方法轉(zhuǎn)換后所得文本數(shù)據(jù)的應(yīng)用顯示圖;圖6本發(fā)明的系統(tǒng)框圖;圖7為依據(jù)本發(fā)明的方法和系統(tǒng)得到的具有統(tǒng)一格式文本數(shù)據(jù)的應(yīng)用示意圖。具體實施例方式本發(fā)明的方法的具體步驟如下1)轉(zhuǎn)換不同儲存格式的文本數(shù)據(jù)為帶有卷標(biāo)描述信息的中間文件,進而統(tǒng)一源文件的儲存格式,例如將doc、TXT等不同儲存格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的XML格式文本數(shù)據(jù);2)然后按照文本數(shù)據(jù)呈現(xiàn)需求所需要的顯示格式,進行卷標(biāo)解釋配置及文本數(shù)據(jù)顯示格式配置,制定有統(tǒng)一模板格式的應(yīng)用模板;3)接著提取轉(zhuǎn)換得到的中間文件的卷標(biāo)描述信息,并將其映像到制定的應(yīng)用模板中;4)依照應(yīng)用模板中事先配置卷標(biāo)解釋與文本數(shù)據(jù)顯示格式,將中間文件的卷標(biāo)描述信息與應(yīng)用模板進行映像,轉(zhuǎn)換中間文件的數(shù)據(jù)格式,進而統(tǒng)一文本數(shù)據(jù)上的儲存格式與數(shù)據(jù)格式。需要注意的是,這里的文本數(shù)據(jù)可包含一個或多個文本數(shù)據(jù),對于存在一個文本數(shù)據(jù)的情況,統(tǒng)一的儲存格式是指希望轉(zhuǎn)換的中間文件儲存格式一致,本發(fā)明僅需要將此文本數(shù)據(jù)轉(zhuǎn)換為帶有卷標(biāo)描述信息且具有預(yù)定儲存格式的中間文件即可。同理,統(tǒng)一的數(shù)據(jù)格式則表示將已具有統(tǒng)一儲存格式的中間文件的數(shù)據(jù)格式再轉(zhuǎn)換為應(yīng)用模板所預(yù)先制定的數(shù)據(jù)格式。另外,具有卷標(biāo)描述的中間文件,可以是可擴展標(biāo)識語言(XML)文本數(shù)據(jù),還可以是任何可以自定義卷標(biāo)的卷標(biāo)屬性的卷標(biāo)文本數(shù)據(jù),如以下卷標(biāo)文本數(shù)據(jù)均屬于卷標(biāo)描述中間文件的實例\語義\<L>文</L>[名前·稱號の前で]ああ,おお\|語義\ああいやだ!|<L>略式</L>(Well,)I′llbe[I′m]damned![\用例]下面結(jié)合具體實施例對本發(fā)明的方法做進一步的詳細(xì)描述參見圖1,本發(fā)明的文本數(shù)據(jù)儲存格式轉(zhuǎn)換具體步驟如下首先讀取源文件,依照文本數(shù)據(jù)的儲存格式對其呈現(xiàn)的信息描述給予卷標(biāo)化,以得到相應(yīng)的卷標(biāo)描述信息(步驟201)。這部分轉(zhuǎn)換只需要注意將文本數(shù)據(jù)的信息沒有損失地以卷標(biāo)描述的形式保存下來。進而可依照文本數(shù)據(jù)的具體格式,將其組織為帶有卷標(biāo)描述信息的中間文件。對于文本數(shù)據(jù)中含有的二進制信息(例如圖片,媒流)進行卷標(biāo)化時,抽取出圖片,媒流等二進制信息后,需要在文本描述處添加好資源連接的卷標(biāo)及其屬性,進而將文本數(shù)據(jù)轉(zhuǎn)換為適合帶有卷標(biāo)描述信息的中間描述文件。對于存在字段說明的文本文本數(shù)據(jù),可能會存在一些固定格式的字段,則需要將字段的這種格式呈現(xiàn)的信息給予卷標(biāo)信息化。例如以字段格式描述的信息如下英文…中文…英文ThisisEnglish.中文這是中文.對上述格式的信息進行卷標(biāo)化處理后如下所示<英文>…</英文><中文>…</中文><英文>ThisisEnglish.</英文><中文>這是中文.</中文>對于表格數(shù)據(jù),如下面所示的表格1表格1則對表格1中的信息進行卷標(biāo)化后的信息為<table><tr><td>FieldName-1</td><td>FieldName-2</td></tr><tr><td>Field1-Row1-Value</td><td>Field2-Row1-Value</td></tr><tr><td>Field1-Row2-Value</td><td>Field2-Row2-Value</td></tr></table>這里,當(dāng)源文件轉(zhuǎn)換為帶有卷標(biāo)描述的XML格式時,會存在源文件本身就是XML格式的,因此可能有些卷標(biāo)依賴具體上下文文本數(shù)據(jù),因此需要消除上下文相關(guān)卷標(biāo)描述信息(步驟202)。例如下面給出的源文件<meaningsubid=″BG000050#AD00000″><hinshi>[副]</hinshi>《◆次の成句で》.</meaning><subheadwordsubid=″BG000050#SK00010″type=″成句″>betàkenabáck</subheadword><keytype=″成句″>be/taken/take*/aback</key><meaning>ぁんくらう,あつけにとられる.</meaning><subheadwordsubid=″BG000010#SK00010″type=″成句″>fromÁtoŹ</subheadword><keyype=″成句″>from/A/to/Z</key><meaning><form-nv>[通例know,learnと共に用いて]</form-nv>初めから終わりまで;完全に(thoroughly).</meaning>從上面的數(shù)據(jù)內(nèi)容可知,卷標(biāo)<subheadword>與<subheadword>一致,當(dāng)前則根據(jù)上文中的《◆次の成句で》具有不同的涵義,屬于隱藏的信息,所以需要轉(zhuǎn)換為<meaningsubid=″BG000050#AD00000″><hinshi>[副]</hinshi>《◆次の成句で》.</meaning><subheadwordsubid=″BG000050#SK00010″type=″成句″attribute=″次の成句″>betàkenabáck</subheadword><keytype=″成句″>be/taken/take*/aback</key><meaning>めんくらう,あつけにとられる.</meaning><subheadwordsubid=″BG000010#SK00010″type=″成句″>fromÁtoŹ</subheadword><keytype=″成句″>from/A/to/Z</key><meaning><form-nv>[通例know,learnと共に用いて]</form-nv>初めから終わりまで;完全に(thoroughly).</meaning>轉(zhuǎn)換后的第一個<subheadword>使用屬性attribute=″次の成句″加以與下面的<subheadword>區(qū)分?;蛘呤褂貌煌木順?biāo)替換此不同涵義的subheadword卷標(biāo),例如<meaningsubid=″BG000050#AD00000″><hinshi>[副]</hinshi>《◆次の成句で》.</meaning><subheadword1subid=″BG000050#SK00010″type=″成句″>betàkenabáck</subheadword1><keytype=″成句″>be/taken/take*/aback</key><meaning>ぁんくらう,あつけにとられる.</meaning><subheadword2subid=″BG000010#SK00010″type=″成句″>fromÁtoŹ</subheadword2><keytype=″成句″>from/A/to/Z</key><meaning><form-nv>[通例know,learnと共に用いて]</form-nv>初めから終わりまで;完全に(thoroughly).</meaning>可見此部份轉(zhuǎn)換僅對源文件本身的信息進行描述處理,消除文本數(shù)據(jù)對于特定格式的依賴,不關(guān)心文本數(shù)據(jù)的應(yīng)用層的組織,只需要使用卷標(biāo)完整清楚的完成對文本數(shù)據(jù)的輔助說明,如考慮添加一些字段卷標(biāo)等,消除一些需要根據(jù)上下文或數(shù)據(jù)內(nèi)容再區(qū)分的卷標(biāo),拆分為多個意義單一的卷標(biāo)或添加卷標(biāo)屬性,以便可以簡單通過卷標(biāo)屬性區(qū)分出數(shù)據(jù)。接著,抽取出源文件卷標(biāo)化的卷標(biāo)描述信息,以生成帶有卷標(biāo)描述信息的中間文件(步驟203),這里可預(yù)先設(shè)定中間文件的儲存格式,例如XML格式,然后檢查所得中間文件的正確性及其格式的合法性(步驟204),判斷是否發(fā)現(xiàn)錯誤(步驟205),對于XML格式的中間文件,若存在錯誤,則判斷是否存在XML語法錯誤(步驟206),如果存在語法錯誤,則前進至步驟210,對中間文件的轉(zhuǎn)換規(guī)則進行修正;否則判斷所得XML格式的中間文件是否符合DTD(步驟207),若不符合DTD,則判斷是否需要更新DTD(步驟208),如果需要更新,則前進至步驟211,對DTD進行修正;否則,判斷文本數(shù)據(jù)本身存在錯誤(步驟209)。如果文本數(shù)據(jù)存在錯誤,則前進至步驟201,檢查源文件數(shù)據(jù);否則,表明執(zhí)行文本數(shù)據(jù)儲存格式轉(zhuǎn)換的步驟存在問題,需要對轉(zhuǎn)換步驟進行修正。如果中間文件存在的錯誤既不是語法錯誤,也不是DTD錯誤,則前進至步驟212,依照應(yīng)用模板的卷標(biāo)描述信息中的格式卷標(biāo)格式化顯示中間文件,對中間文件進行預(yù)覽,以查看和驗證應(yīng)用模板的配置是否正確(步驟212)。參見圖2,本發(fā)明的文本數(shù)據(jù)數(shù)據(jù)格式轉(zhuǎn)換具體步驟如下首先依照文本數(shù)據(jù)呈現(xiàn)需求制定具有統(tǒng)一格式的應(yīng)用模板(步驟301),配置卷標(biāo)解釋(步驟302),卷標(biāo)解釋是用來實現(xiàn)應(yīng)用模板卷標(biāo)描述的模板化轉(zhuǎn)換(步驟303),進而在中間文件進行數(shù)據(jù)格式轉(zhuǎn)換時,卷標(biāo)解釋用來解釋描述中間文件的卷標(biāo)描述信息,進而與應(yīng)用模板的配置卷標(biāo)解釋腳本一致。在進行文本數(shù)據(jù)的數(shù)據(jù)格式轉(zhuǎn)換時,首先提取中間文件中的卷標(biāo)描述信息(步驟304),提取過程中,對于中間文件中可以舍棄的卷標(biāo)描述信息,給予卷標(biāo)描述信息的屏弊;對于其中可以舍棄的數(shù)據(jù)文件,屏弊數(shù)據(jù)文件對應(yīng)的卷標(biāo)描述信息,即提取文本數(shù)據(jù)中更具有說明、有用的信息。在配置好應(yīng)用模板的格式之后(步驟305),判斷中間文件的顯示格式及其卷標(biāo)描述信息是否與應(yīng)用模板匹配(步驟306),即將中間文件的卷標(biāo)描述信息與應(yīng)用模板進行映像,以轉(zhuǎn)換源文件的數(shù)據(jù)格式為統(tǒng)一的數(shù)據(jù)格式。如果匹配則對中間文件進行格式化處理(步驟307),以轉(zhuǎn)換為文本數(shù)據(jù)驅(qū)動或引擎開發(fā)所用的統(tǒng)一格式(步驟308)。卷標(biāo)解釋腳本描述將不同文本數(shù)據(jù)的不同卷標(biāo)描述信息對應(yīng)到統(tǒng)一的應(yīng)用模板部分,對應(yīng)的卷標(biāo)或含有某種屬性,或某種屬性值。例如數(shù)據(jù)1與數(shù)據(jù)2的數(shù)據(jù)格式如下所示數(shù)據(jù)1<UNITorderlay=“0001”>Thisisunitdata<PICTUREid=″//www.wallet.com/234.gif″>NewPictureShow</PICTURE></UNIT>數(shù)據(jù)2<PARTtype=“V0-001”>Thisisitemdata<snapimageref=“f:\\flower.jpg”>savePicture</snapimage></PART>而統(tǒng)一格式的應(yīng)用模板定義為LIBLIB<ITEMid=“T-00001”><imagehref=“www.163.com\webgif\a.gif”>ImagePictureLinkText</image></ITEM>直接對應(yīng)卷標(biāo)涵義進行說明的配置,可得到如圖3和圖4所示的卷標(biāo)映像處理的實例示意圖。其中圖3表示數(shù)據(jù)1與應(yīng)用模板LIB的映像關(guān)系;圖4表示數(shù)據(jù)2與應(yīng)用模板LIB的映像關(guān)系。經(jīng)過卷標(biāo)映像處理之后,即可得到統(tǒng)一的數(shù)據(jù)格式,如下所示數(shù)據(jù)1<ITEMid=“0001”>Thisisunitdata<imagehref=″//www.wallet.com/234.gif″>NewPictureShow</image></ITEM>數(shù)據(jù)2<ITEMid=“V0-001”>Thisisitemdata<imagehref=“f:\\flower.jpg”>savePicture</image></ITEM>即與通用應(yīng)用模板格式一致LIB<ITEMid=“T-00001”><imagehref=“www.163.com\webgif\a.gif”>ImagePictureLinkText</image></ITEM>應(yīng)用模板的定義則完全更具有文本數(shù)據(jù)用途,定義一種抽象集合。例如電子辭典的應(yīng)用文本數(shù)據(jù)可以定義如下模板<DICTIONARY><ITEM>//詞條單位<KEYWORD>詞條部份...</KEYWORD><CONTENT>解釋部份...</CONTENT></ITEM>這個可更具具體應(yīng)用.</DICTIONARY>一種菜單(MENU)呈現(xiàn)的文本數(shù)據(jù)的應(yīng)用模板可以定義如下<DOCUMENT><TITLE>...</TITLE><MENU><TITLE>...</TITLE><MENU><TITLE>...</TITLE><MENU>......</MENU><LINK>...</LINK></MENU><LINK>...</LINK></MENU><LINK>...</LINK><DOCUMENT>對于文本數(shù)據(jù)顯示格式的配置則主要利用卷標(biāo)添加一些格式的控制信息,如一些卷標(biāo)需要換新的段(添加回車);一些卷標(biāo)(或其含有某個屬性,或其某個屬性值等于某個值)需要縮進不同的寬度。下面將通過一段日文辭典數(shù)據(jù)對文本數(shù)據(jù)格式顯示的配置舉例進行說明則轉(zhuǎn)換完畢,便得到希望的格式檔案如表中第三列所示。應(yīng)用后,得到要求的顯示方式如圖5所示,于此完成了對源文件儲存格式以及數(shù)據(jù)格式的統(tǒng)一轉(zhuǎn)換。此外,由于應(yīng)用模板的設(shè)定是依照文本數(shù)據(jù)的顯示要求制定的,因此,對于以后文本數(shù)據(jù)的更新,僅需要更新文本數(shù)據(jù)對于應(yīng)用模板的配置即可,而不需要進行任何程序的修改,對于文本數(shù)據(jù)呈現(xiàn)方式的修改,也僅需要修改對于配置即可,然后將更新的文本數(shù)據(jù)對應(yīng)到新的應(yīng)用模板中就可以實現(xiàn)對文本數(shù)據(jù)格式統(tǒng)一的轉(zhuǎn)換。參見圖6,本發(fā)明的系統(tǒng)包括第一轉(zhuǎn)換模塊1,檢查模塊2,預(yù)覽模塊3,定義模塊4以及第二轉(zhuǎn)換模塊5。第一轉(zhuǎn)換模塊1用來將文本數(shù)據(jù)轉(zhuǎn)換為帶有卷標(biāo)描述信息的中間文件,進而通過轉(zhuǎn)換可以將多個儲存格式不同的文本數(shù)據(jù)轉(zhuǎn)換為具有統(tǒng)一儲存格式的文本數(shù)據(jù)。第一轉(zhuǎn)換模塊10借助使用由組件提供的對象引用實現(xiàn)對文本數(shù)據(jù)儲存格式的轉(zhuǎn)換,例如轉(zhuǎn)換辦公(Office)集合的文本數(shù)據(jù),可以利用微軟數(shù)據(jù)庫對象庫(MicrosoftAccessObjectLibrary),微軟幻燈片對象庫(MicrosoftPowerPointObjectLibrary),微軟文字處理對象庫(MicrosoftWordObjectLibrary)等。超文本標(biāo)識語言(HypertextMarkupLanguage,HTML)可以使用微軟對象庫(MicrosoftObjectLibrary)等。在讀取文本數(shù)據(jù)后,第一轉(zhuǎn)換模塊10依照文本數(shù)據(jù)的具體格式,對其呈現(xiàn)的信息描述給予卷標(biāo)化,并得到相應(yīng)的卷標(biāo)描述信息,進而將關(guān)心的文本數(shù)據(jù)沒有損失的以卷標(biāo)描述的形式保存下來。然后抽取出卷標(biāo)描述信息,則轉(zhuǎn)換源文件為帶有卷標(biāo)描述信息的中間文件。這里,帶有卷標(biāo)描述的中間文件為可以自定義卷標(biāo)的卷標(biāo)屬性的卷標(biāo)文文件,包括可擴展標(biāo)識語言(XML)格式的文本數(shù)據(jù)等,本發(fā)明優(yōu)選的中間文件為XML格式的文本數(shù)據(jù)。目前各種印刷文本數(shù)據(jù)往往都帶有卷標(biāo)描述,如果這些卷標(biāo)能夠很好的利用,通過本發(fā)明的第一轉(zhuǎn)換模塊1可以方便簡單地將其轉(zhuǎn)換為XML格式。而且,隨著XML的應(yīng)用,越來越多的文本數(shù)據(jù)已經(jīng)開始推行XML格式,因此利用這些卷標(biāo),僅根據(jù)不同數(shù)據(jù)的卷標(biāo)描述,就可定義一張卷標(biāo)的說明描述,即能夠自動統(tǒng)一這些不同格式的數(shù)據(jù)。需要注意的是,本發(fā)明并不局限于XML格式的文本數(shù)據(jù),任何可以自定義卷標(biāo)的卷標(biāo)屬性的卷標(biāo)文本數(shù)據(jù)均可。檢查模塊2用來檢查轉(zhuǎn)換得到的中間文件的正確性及其格式的合法性。當(dāng)對應(yīng)格式為XML的中間文件時,檢查模塊2借助XML文本類型定義(DocumentTypeDefinition,DTD)檢查中間文件的正確性,利用XML語法檢查文本數(shù)據(jù)格式的合法性。如果存在錯誤,則對中間文件進行轉(zhuǎn)換規(guī)則的修正或者DTD的相應(yīng)修正。有效的XML文本數(shù)據(jù)需遵照文本類型定義(DTD)的規(guī)則DTD的目的是定義一個XML文本數(shù)據(jù)的合法構(gòu)筑塊,它通過一系列合法元素定義了文件的結(jié)構(gòu)。第一轉(zhuǎn)換模塊10僅用來對文本數(shù)據(jù)的儲存格式進行轉(zhuǎn)換,因此還需要進一步對中間文件的數(shù)據(jù)格式進行轉(zhuǎn)換,以達到文本數(shù)據(jù)格式的完全統(tǒng)一。因此,本發(fā)明的系統(tǒng)還包括了第二轉(zhuǎn)換模塊5,用來轉(zhuǎn)換中間文件的數(shù)據(jù)格式,進而將原始不同格式的文本數(shù)據(jù)轉(zhuǎn)換為具有統(tǒng)一儲存格式及數(shù)據(jù)格式的統(tǒng)一格式。在第二轉(zhuǎn)換模塊5對中間文件進行轉(zhuǎn)換之前,需要依照要求的顯示格式進行配置,以制定具有統(tǒng)一模板格式的應(yīng)用模板。定義模板4即用來依據(jù)文本數(shù)據(jù)的顯示要求,比如風(fēng)格,式樣等統(tǒng)一制定一些應(yīng)用模板,而將文本數(shù)據(jù)本身與具體應(yīng)用分離,即文本數(shù)據(jù)本身只呈現(xiàn)文本數(shù)據(jù)本身的信息描述,而不用關(guān)心應(yīng)用描述,從而進行轉(zhuǎn)換。定義模塊4需要配置卷標(biāo)解釋及文本數(shù)據(jù)顯示格式,卷標(biāo)解釋用來模板化應(yīng)用模板的卷標(biāo)描述,以直接對應(yīng)卷標(biāo)涵義進行說明的配置,配置卷標(biāo)解釋腳本。進而在中間文件進行轉(zhuǎn)換時,第二轉(zhuǎn)換模塊5可依據(jù)卷標(biāo)解釋對中間文件的卷標(biāo)描述信息進行模板化轉(zhuǎn)換。文本數(shù)據(jù)顯示格式的配置則主要利用卷標(biāo),添加一些格式的控制信息,例如一些卷標(biāo)需要轉(zhuǎn)換新的段,一些卷標(biāo)需要縮進不同的寬度等。第二轉(zhuǎn)換模塊5提取中間文件的卷標(biāo)描述信息,將不同文本數(shù)據(jù)的不同卷標(biāo)映像到具有統(tǒng)一數(shù)據(jù)格式的應(yīng)用模板中對應(yīng)的卷標(biāo),進而依照應(yīng)用模板中的卷標(biāo)解釋與文本數(shù)據(jù)顯示格式,對中間文件12的卷標(biāo)描述信息與應(yīng)用模板進行比對,以轉(zhuǎn)換中間文件12的數(shù)據(jù)格式為統(tǒng)一的數(shù)據(jù)格式。預(yù)覽模塊3用來依照中間文件的卷標(biāo)描述信息的格式卷標(biāo)格式化顯示中間文件,進而查看和驗證應(yīng)用模板的配置是否正確,如果發(fā)現(xiàn)錯誤則反饋至定義模塊4,以修正當(dāng)前應(yīng)用模板的設(shè)置,進而得到正確的信息配置。此外,預(yù)覽模塊3還可用來向第一轉(zhuǎn)換模塊1反饋存在格式轉(zhuǎn)換錯誤的信息,如果是,則第一轉(zhuǎn)換模塊1進行轉(zhuǎn)換規(guī)則的修改,比如添加必要的卷標(biāo)描述信息。參見圖7,依照本發(fā)明的方法和系統(tǒng)得到的具有統(tǒng)一數(shù)據(jù)格式,統(tǒng)一文本數(shù)據(jù)格式的數(shù)據(jù)集合可應(yīng)用于引擎開發(fā)或者數(shù)據(jù)驅(qū)動模式中,進而大幅度地縮短相應(yīng)的開發(fā)周期。圖7中給出了相應(yīng)的數(shù)據(jù)驅(qū)動引擎,只要數(shù)據(jù)滿足其格式就可以直接按照要求完成固定功能。權(quán)利要求1.一種將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的方法,其特征在于該方法包含有以下步驟1)轉(zhuǎn)換不同儲存格式的文本數(shù)據(jù)為帶有卷標(biāo)描述信息的中間文件;1.1)讀取不同儲存格式的文本數(shù)據(jù),并依照各文本數(shù)據(jù)的儲存格式對其呈現(xiàn)的信息描述給予卷標(biāo)化,以得到相應(yīng)的卷標(biāo)描述信息;1.2)抽取出卷標(biāo)描述信息,以生成帶有卷標(biāo)描述信息的中間文件;2)然后按照文本數(shù)據(jù)呈現(xiàn)需求所需要的顯示格式,進行卷標(biāo)解釋配置及文本數(shù)據(jù)顯示格式配置,制定有統(tǒng)一模板格式的應(yīng)用模板;3)提取中間文件的卷標(biāo)描述信息映像到該應(yīng)用模板中;4)依照卷標(biāo)解釋與文本數(shù)據(jù)顯示格式,將中間文件的卷標(biāo)描述信息與應(yīng)用模板進行映像,轉(zhuǎn)換中間文件的數(shù)據(jù)格式,進而統(tǒng)一文本數(shù)據(jù)上的儲存格式與數(shù)據(jù)格式。2.根據(jù)權(quán)利要求1所述的將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的方法,其特征在于所述步驟1)中當(dāng)所述文本數(shù)據(jù)中含有二進制信息描述時,則在中間文件中對應(yīng)該二進制信息的文本描述處添加一資源連接的卷標(biāo)及其屬性,以轉(zhuǎn)換文本數(shù)據(jù)為合適的帶有卷標(biāo)描述信息的中間文件。3.根據(jù)權(quán)利要求1所述的將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的方法,其特征在于所述步驟1)和步驟2)之間還包括有檢查中間文件的正確性及其格式合法性的步驟。4.根據(jù)權(quán)利要求1所述的將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的方法,其特征在于所述步驟2)和步驟3)之間還包括有借助應(yīng)用模板的卷標(biāo)描述的格式卷標(biāo)格式化顯示中間文件,以查看和驗證該應(yīng)用模板的配置是否正確的步驟。5.根據(jù)權(quán)利要求1所述的將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的方法,其特征在于所述步驟2)中還包括有更新應(yīng)用模板的卷標(biāo)解釋配置及文本數(shù)據(jù)顯示格式配置的步驟。6.根據(jù)權(quán)利要求1所述的將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的方法,其特征在于所述步驟3)中提取中間文件中的卷標(biāo)描述信息的過程中,對于中間文件中可以舍棄的卷標(biāo)描述信息,給予卷標(biāo)描述信息的屏弊,對于其中可以舍棄的數(shù)據(jù)文件,屏弊數(shù)據(jù)文件對應(yīng)的卷標(biāo)描述信息。7.根據(jù)權(quán)利要求1至6任一權(quán)利要求所述的將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的方法,其特征在于所述中間文件為可自定義卷標(biāo)的卷標(biāo)屬性的卷標(biāo)文本數(shù)據(jù)。8.根據(jù)權(quán)利要求7所述的將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的方法,其特征在于所述中間文件為可擴展標(biāo)識語言文本數(shù)據(jù)。9.一種應(yīng)用權(quán)利要求1所述的將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的方法的系統(tǒng),其特征在于該系統(tǒng)包括用來將不同儲存格式的文本數(shù)據(jù)轉(zhuǎn)換為帶有卷標(biāo)描述信息的中間文件,進而統(tǒng)一各文本數(shù)據(jù)的儲存格式的第一轉(zhuǎn)換模塊、用來配置卷標(biāo)解釋及文本數(shù)據(jù)顯示格式,以制定具有統(tǒng)一模板格式的應(yīng)用模板的定義模塊、用來依照已配置的卷標(biāo)解釋與文本數(shù)據(jù)顯示格式,將中間文件的卷標(biāo)描述信息與應(yīng)用模板進行映像,轉(zhuǎn)換中間文件的數(shù)據(jù)格式,進而統(tǒng)一文本數(shù)據(jù)上的儲存格式與數(shù)據(jù)格式的第二轉(zhuǎn)換模塊,所述第一轉(zhuǎn)換模塊和定義模塊分別接入第二轉(zhuǎn)換模塊。10.根據(jù)權(quán)利要求9所述的將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的系統(tǒng),其特征在于該系統(tǒng)還包括用來依照應(yīng)用模板的卷標(biāo)描述的格式卷標(biāo)格式化顯示中間文件,進而查看和驗證該應(yīng)用模板的配置是否正確的預(yù)覽模塊和檢查中間文件的正確性及其格式的合法性的檢查模塊,所述預(yù)覽模塊分別接入第一轉(zhuǎn)換模塊和定義模塊,所述檢查模塊接入第一轉(zhuǎn)換模塊。全文摘要本發(fā)明涉及一種文本數(shù)據(jù)格式轉(zhuǎn)換的方法,尤其是一種將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的方法及系統(tǒng)。其技術(shù)解決方案為該方法包括以下步驟1)轉(zhuǎn)換不同儲存格式的文本數(shù)據(jù)為帶有卷標(biāo)描述信息的中間文件;2)按照文本數(shù)據(jù)呈現(xiàn)需求所需的顯示格式,進行卷標(biāo)解釋配置及文本數(shù)據(jù)顯示格式配置,制定統(tǒng)一模板的應(yīng)用模板;3)提取卷標(biāo)描述信息映像到該應(yīng)用模板中;4)依照顯示格式,將卷標(biāo)描述信息與應(yīng)用模板進行映像,轉(zhuǎn)換數(shù)據(jù)格式,進而統(tǒng)一文本數(shù)據(jù)上的儲存格式與數(shù)據(jù)格式。本發(fā)明解決了普通技術(shù)中存在的技術(shù)問題,不僅可以將不同格式的文本數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的格式,而且還具有方便、快捷、減少了文本數(shù)據(jù)轉(zhuǎn)化的錯誤率的優(yōu)點。文檔編號G06F17/30GK101013436SQ20071001729公開日2007年8月8日申請日期2007年1月25日優(yōu)先權(quán)日2007年1月25日發(fā)明者陳淮琰,劉剛,鐘輝申請人:無敵科技(西安)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
汉阴县| 邮箱| 临朐县| 隆安县| 玛曲县| 华宁县| 怀远县| 福鼎市| 宜川县| 庆元县| 安仁县| 韶关市| 三河市| 黄陵县| 自贡市| 台南县| 乌兰察布市| 武隆县| 辽阳县| 利川市| 宁明县| 花莲市| 宁陵县| 卓资县| 甘泉县| 五峰| 高密市| 堆龙德庆县| 阿拉善盟| 山西省| 西畴县| 鄱阳县| 临高县| 泸西县| 通化市| 札达县| 股票| 卓尼县| 边坝县| 红原县| 凭祥市|