專(zhuān)利名稱(chēng):查詢(xún)索引多媒體標(biāo)題數(shù)據(jù)的方法與裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種查詢(xún)索引多媒體標(biāo)題(TITLE)數(shù)據(jù)的方法及裝置,特別是涉及一種可對(duì)多媒體數(shù)據(jù)進(jìn)行查詢(xún)索引,使多媒體數(shù)據(jù)可以重新使用及充分利用的方法及裝置。
隨著多媒體計(jì)算機(jī)的流行,使得一些書(shū)籍、展示文件等均以計(jì)算機(jī)展示,且多媒體計(jì)算機(jī)的影音播放功能,更使得影音光盤(pán)盛行。然而,這些多媒體TITLE的數(shù)據(jù)卻只能供其本身所使用,別的產(chǎn)品無(wú)法讀取此多媒體TITLE的數(shù)據(jù),或無(wú)法識(shí)別其文件格式,而不能對(duì)其所包括的任何數(shù)據(jù)進(jìn)行瀏覽,因此限制了這些數(shù)據(jù)的用途,也使得這些數(shù)據(jù)無(wú)法作進(jìn)一步的利用,形成資源的浪費(fèi),增加數(shù)據(jù)搜尋的困難與時(shí)間。
本發(fā)明的目的在于提供一種查詢(xún)索引多媒體TITLE數(shù)據(jù)的方法及裝置,主要是采用多級(jí)索引的方式,將多媒體數(shù)據(jù)建立索引庫(kù),由使用者提出要查詢(xún)的關(guān)鍵字,通過(guò)編碼作業(yè)獲得關(guān)鍵字的各項(xiàng)特征,依據(jù)這些特征進(jìn)行多級(jí)查詢(xún)和索引后,通過(guò)瀏覽器輸出所查詢(xún)的多媒體文件數(shù)據(jù),使得多媒體數(shù)據(jù)可以重新使用,達(dá)到充分利用現(xiàn)成數(shù)據(jù)的目的。
依據(jù)前述,本發(fā)明在多媒體光盤(pán)上由專(zhuān)用工具置放數(shù)個(gè)索引庫(kù),用以針對(duì)多媒體數(shù)據(jù)進(jìn)行索引,其中一索引庫(kù)為多媒體數(shù)據(jù)中所有可用的數(shù)據(jù)標(biāo)題表,其余的索引文件則作為標(biāo)題的索引文件,再在前述的索引庫(kù)上建立索引,使得用戶(hù)能有效查詢(xún)到所需的多媒體數(shù)據(jù),并增進(jìn)查尋的速度。
依據(jù)前述,本發(fā)明針對(duì)關(guān)鍵字的特征所進(jìn)行的編碼操作,是采用逆向排除算法,以達(dá)到快速尋找的目的。
本發(fā)明的另一目的在于為配合前述的索引功能,在開(kāi)發(fā)標(biāo)題時(shí),可為其多媒體數(shù)據(jù)編寫(xiě)兩個(gè)瀏覽程序,第一個(gè)瀏覽程序稱(chēng)為電子書(shū),可以瀏覽整個(gè)多媒體的數(shù)據(jù),第二個(gè)瀏覽程序可以接收參數(shù),使用者可以通過(guò)參數(shù)將所要查詢(xún)的內(nèi)容提交給此瀏覽程序,便可將相關(guān)的多媒體數(shù)據(jù)返傳給使用者,通過(guò)上述的過(guò)程,即可使得TITLE上的多媒體可以被以后的ITILE所使用,而使數(shù)據(jù)資源不會(huì)浪費(fèi)。
本發(fā)明的目的是這樣實(shí)現(xiàn)的,即提供一種查詢(xún)索引多媒體ITILE數(shù)據(jù)的方法與裝置,主要由通過(guò)在多媒體上設(shè)置標(biāo)題關(guān)鍵字表、初級(jí)標(biāo)題索引表、次級(jí)標(biāo)題索引表的數(shù)個(gè)索引庫(kù),由使用者提供所需的關(guān)鍵字后傳入瀏覽器中,利用多級(jí)索引的方式,依據(jù)關(guān)鍵字的特微進(jìn)行編碼,并進(jìn)行查找以通過(guò)對(duì)關(guān)鍵字的各項(xiàng)特征比較,而獲得多媒體數(shù)據(jù)中所有包括關(guān)鍵字的數(shù)據(jù),回傳至瀏覽器顯現(xiàn)出來(lái),能使多媒體數(shù)據(jù)可以重新利用,達(dá)到充分利用現(xiàn)成數(shù)據(jù)的目的。
以下將對(duì)本發(fā)明的結(jié)構(gòu)設(shè)計(jì)與操作原理,作一詳細(xì)的說(shuō)明,并參閱附圖,將對(duì)本發(fā)明的特征作更進(jìn)一步的了解,其中
圖1為本發(fā)明的結(jié)構(gòu)及功能原理圖;圖2為本發(fā)明的逆向排除算法的步驟流程圖。
本發(fā)明主要是提供一種方法,使光盤(pán)中的多媒體數(shù)據(jù)可以重新利用,達(dá)到充分利用現(xiàn)成數(shù)據(jù)的目的。主要是采用多級(jí)索引的方式,如圖1所示,首先通過(guò)在多媒體光盤(pán)上設(shè)置數(shù)個(gè)索引庫(kù),包括有標(biāo)題關(guān)鍵字表30(CDINDEX.DAT)、初級(jí)標(biāo)題索引表50(CDINDEX.ID1)、次級(jí)標(biāo)題索引表40(CDINDEX.ID2)。由使用者提供所需的關(guān)鍵字10后傳入瀏覽器20中,依據(jù)關(guān)鍵字10的特征(如詳后述)產(chǎn)生前述的三種表數(shù)據(jù)30、40、50,經(jīng)過(guò)多級(jí)查詢(xún)和索引后,將所查詢(xún)的結(jié)果回傳至瀏覽器20,并將此結(jié)果顯現(xiàn)出來(lái)。
使用者所提供的關(guān)鍵字10,可能是一些不規(guī)則的短語(yǔ)組合,因此抽取關(guān)鍵字的五項(xiàng)特征進(jìn)行編碼,并以逆向排除的方法進(jìn)行查找,以通過(guò)對(duì)關(guān)鍵字10的第一單詞首字母、第一單詞長(zhǎng)度、第二單詞的首字母、關(guān)鍵字10的字尾符、關(guān)鍵字長(zhǎng)度等特征比較,通過(guò)總體到細(xì)部的思考模式,對(duì)細(xì)部的一一確認(rèn)來(lái)確認(rèn)整體,而獲得光盤(pán)中所有包括有關(guān)鍵字10的數(shù)據(jù)。
前述關(guān)鍵字10所取出的五項(xiàng)特征碼中,關(guān)鍵字10的第一單詞首字母、第一單詞長(zhǎng)度組成關(guān)鍵字10的第一特征;第二單詞的首字母則作為關(guān)鍵字10的第二特征。若關(guān)鍵字10為中文,則第一特征取首字內(nèi)碼的低十二位,第二特征取第二字內(nèi)碼的高八位。
標(biāo)題關(guān)鍵字表30中包括關(guān)鍵字10、關(guān)鍵字的字尾符及關(guān)鍵字長(zhǎng)度三項(xiàng)內(nèi)容;以表一內(nèi)容舉例說(shuō)明,標(biāo)題關(guān)鍵字表30第0位置的關(guān)鍵字10為“Li jian”關(guān)鍵字表中即分別記錄Li jian、n、7(包括空格)三項(xiàng)內(nèi)容,以此類(lèi)推,即記錄所有關(guān)鍵字10的三項(xiàng)內(nèi)容于標(biāo)題關(guān)鍵字表30中。
表一 本發(fā)明實(shí)施例的關(guān)鍵字表<
表二 本發(fā)明實(shí)施例的次級(jí)索引表<
表三 本發(fā)明實(shí)施例的初級(jí)索引表<
次級(jí)標(biāo)題索引表40用來(lái)記錄第一和第二特征的關(guān)鍵字10在標(biāo)題關(guān)鍵字表30中的位置,包括有關(guān)鍵字10的第二特征、所有包括第一和第二特征的關(guān)鍵字10在標(biāo)題關(guān)鍵字表30中的起始位置(FROM)、所有包括第一和第二特征的關(guān)鍵字10在標(biāo)題關(guān)鍵字表30中的結(jié)束位置(TO)三項(xiàng)內(nèi)容,以表二內(nèi)容舉例說(shuō)明
關(guān)鍵字“Li jian”的第二特征為j,僅有位置0處擁有此項(xiàng)特征,因此其起始位置與結(jié)束位置分別為0、0;而關(guān)鍵字“Wang dong”及“Wangdong sheng”的第二特征均為d,故其啟始位置為2,結(jié)束位置為3,以此類(lèi)推,建立出一完整的次級(jí)標(biāo)題索引表40。
初級(jí)標(biāo)題索引表50的大小是固定的,與關(guān)鍵字10的最大長(zhǎng)度有關(guān),所有關(guān)鍵字10的第一特征均可通過(guò)下列公式計(jì)算出其在初級(jí)標(biāo)題索引表50的位置,此位置的內(nèi)容指向次級(jí)標(biāo)題索引表40該關(guān)鍵字10的第二特征。初級(jí)標(biāo)題索引表50共有兩項(xiàng)數(shù)據(jù),分別是含有第一特征的所有關(guān)鍵字10在次級(jí)標(biāo)題索引表40中的起始位置(FROM),及含有第二特征的所有關(guān)鍵字10在次級(jí)標(biāo)題索引表40中的結(jié)束位置(END)。
位置=(單詞的長(zhǎng)度-1)×128+單詞的首字母ASCII碼值若為中文,則位置=(中文內(nèi)碼的低十二位)+(128×32)其中,32為定義關(guān)鍵字的最大長(zhǎng)度,128為英文ASCII碼值的大小。
當(dāng)掃描到單詞時(shí),首先會(huì)根據(jù)它的第一特征查詢(xún)?cè)诔跫?jí)標(biāo)題索引表50的內(nèi)容,如果該位置是空,則不存在以此為詞頭的關(guān)鍵字10,進(jìn)行下一個(gè)詞的掃描,否則繼續(xù)查詢(xún)次級(jí)標(biāo)題索引表。
前述的索引庫(kù)30、40、50建立完成后,可采用逆向排除算法以達(dá)到快速尋找的目的。如圖2所示,為本發(fā)明的逆向排除算法的步驟流程圖;包括有下列步驟步驟a.由待查字的第一特征求得初級(jí)標(biāo)題索引表50中的位置,若為空,則表無(wú)以此單詞為首的關(guān)鍵字10,即執(zhí)行步驟e,否則按初級(jí)標(biāo)題索引表50的結(jié)束與起始位置尋找次級(jí)標(biāo)題索引表40的相對(duì)應(yīng)內(nèi)容。步驟b.以待查字后面的單詞第二特征與步驟a所查到次級(jí)標(biāo)題索引表40的第一項(xiàng)內(nèi)容比較,若不同則表無(wú)此二詞的關(guān)鍵字10,執(zhí)行步驟3;否則按其內(nèi)容的結(jié)束與起始位置找尋標(biāo)題關(guān)鍵字表30的相對(duì)應(yīng)內(nèi)容。步驟c.取出標(biāo)題關(guān)鍵字表30中相對(duì)應(yīng)該關(guān)鍵字10的長(zhǎng)度與字尾符,比對(duì)待查字的字尾符字母是否相等于關(guān)鍵字10的字尾符,若不,則無(wú)此待查字為首的關(guān)鍵字,執(zhí)行步驟e;否則,將關(guān)鍵字10與待查字逐個(gè)字符比較,若不同則執(zhí)行步驟e,相同者則執(zhí)行步驟d。步驟d.確認(rèn)待查字是關(guān)鍵字10,再進(jìn)一步對(duì)其進(jìn)行單詞標(biāo)注等各項(xiàng)操作。步驟e.結(jié)束比較。
以表一、表二及表三對(duì)逆向排除算法作進(jìn)一步的執(zhí)行說(shuō)明假設(shè)待查字為“Wang dong sheng”,其第一特征為W4;依據(jù)前述的公式可獲得其于初級(jí)標(biāo)題索引表50中的位置為471,由初級(jí)標(biāo)題索引表50中可查出其起始與結(jié)束位置分別為“2”與“2”,因此要查詢(xún)次級(jí)標(biāo)題索引表40中的位置“2”。
待查字的第二特征為“d”,次級(jí)標(biāo)題索引表位置“2”的第一項(xiàng)內(nèi)容為“d”,起始與結(jié)束位置內(nèi)容分為是“2”、“3”,因此可以得知要查標(biāo)題關(guān)鍵字表30中位置“3”、“2”的內(nèi)容。
先取出標(biāo)題關(guān)鍵字表30中位置“2”的內(nèi)容,其對(duì)應(yīng)關(guān)鍵字10長(zhǎng)度為15,字尾符為“g”,然后再查詢(xún)待查字的長(zhǎng)度與字尾符是否相符,在本例中獲得一相同的對(duì)比結(jié)果,則再對(duì)待查字和此關(guān)鍵字10逐字符相比較,比較結(jié)果相同即進(jìn)行步驟e。如此即能將光盤(pán)片中所有包括有關(guān)鍵字10的每一筆數(shù)據(jù),通過(guò)瀏覽程序20而顯現(xiàn)于屏幕上。
再進(jìn)一步,在關(guān)鍵TITLE時(shí),可為其多媒體數(shù)據(jù)編寫(xiě)兩個(gè)瀏覽程序20,第一個(gè)瀏覽程序稱(chēng)為電子書(shū),可以瀏覽整個(gè)多媒體數(shù)據(jù),第二個(gè)瀏覽程序可以接收參數(shù),使用者可以通過(guò)參數(shù)將所要查詢(xún)的內(nèi)容提交給此瀏覽程序20,便可將相關(guān)的多媒體數(shù)據(jù)返傳給使用者,由上述的過(guò)程,即可使得TITLE上的多媒體可以被以后的TITLE所使用,而使數(shù)據(jù)資源不會(huì)浪費(fèi)。
承前所述,本發(fā)明所提供的查詢(xún)索引多媒體TITLE數(shù)據(jù)的裝置及方法,僅需通過(guò)關(guān)鍵字查詢(xún),即能對(duì)現(xiàn)有的或往后的多媒體TITLE數(shù)據(jù)進(jìn)一步利用,使數(shù)據(jù)不致浪費(fèi)不用,有助與使用者的數(shù)據(jù)查詢(xún)與程序設(shè)計(jì)者縮短數(shù)據(jù)的輸入時(shí)間。
以上已將本發(fā)明作一詳細(xì)說(shuō)明,但以上所述的,僅為本發(fā)明的一較佳實(shí)施例而已,不能限于本發(fā)明實(shí)施的范圍。因此凡依本發(fā)明權(quán)利要求所作的各種變化與修飾,均仍屬本發(fā)明的權(quán)利要求范圍。
權(quán)利要求
1.一種查詢(xún)索引多媒體標(biāo)題數(shù)據(jù)的方法與裝置,其特征在于,主要由通過(guò)在多媒體上設(shè)置標(biāo)題關(guān)鍵字表、初級(jí)標(biāo)題索引表、次級(jí)標(biāo)題索引表的數(shù)個(gè)索引庫(kù),由使用者提供所需的關(guān)鍵字后傳入瀏覽器中,利用多級(jí)索引的方式,依據(jù)關(guān)鍵字的特征進(jìn)行編碼,并進(jìn)行查找以通過(guò)對(duì)關(guān)鍵字的各項(xiàng)特征比較,而獲得多媒體數(shù)據(jù)中所有包括關(guān)鍵字的數(shù)據(jù),回傳至瀏覽器顯現(xiàn)出來(lái),能使多媒體數(shù)據(jù)可以重新利用,達(dá)到充分利用現(xiàn)成數(shù)據(jù)的目的。
2.如權(quán)利要求1所述的查詢(xún)索引多媒體標(biāo)題數(shù)據(jù)的方法與裝置,其特征在于,該關(guān)鍵字以其第一單詞首字母、第一單詞長(zhǎng)度組成第一特征。
3.如權(quán)利要求1所述的查詢(xún)索引多媒體標(biāo)題數(shù)據(jù)的方法與裝置,其特征在于,該關(guān)鍵字是以其第二單詞的首字母作為第二特征。
4.如權(quán)利要求1所述的查詢(xún)索引多媒體標(biāo)題數(shù)據(jù)的方法與裝置,其特征在于,該關(guān)鍵字可為多字節(jié)內(nèi)碼,其第一特征是取首字內(nèi)碼的低十二位,第二特征取第二字內(nèi)碼的高八位。
5.如權(quán)利要求1所述的查詢(xún)索引多媒體標(biāo)題數(shù)據(jù)的方法與裝置,其特征在于,該標(biāo)題關(guān)鍵字表進(jìn)一步包括關(guān)鍵字、關(guān)鍵字的字尾符及關(guān)鍵字長(zhǎng)度三項(xiàng)內(nèi)容。
6.如權(quán)利要求1所述的查詢(xún)索引多媒體標(biāo)題數(shù)據(jù)的方法與裝置,其特征在于,該次級(jí)標(biāo)題索引表是記錄第一和第二特征的關(guān)鍵字在關(guān)鍵字表中的位置,包括關(guān)鍵字的第二特征、所有包括第一和第二特征的關(guān)鍵字在關(guān)鍵字表中的起始位置、所有包括第一和第二特征的關(guān)鍵字在關(guān)鍵字表中的結(jié)束位置。
7.如權(quán)利要求1所述的查詢(xún)索引多媒體標(biāo)題數(shù)據(jù)的方法與裝置,其特征在于,該初級(jí)標(biāo)題索引表的大小是固定的,與關(guān)鍵字的最大長(zhǎng)度有關(guān),包括第一特征的所有關(guān)鍵字在次級(jí)標(biāo)題索引表中的起始位置,及第二特征的所有關(guān)鍵字在次級(jí)標(biāo)題索引表中的結(jié)束位置。
8.如權(quán)利要求1所述的查詢(xún)索引多媒體標(biāo)題數(shù)據(jù)的方法與裝置,其特征在于,可進(jìn)一步利用逆向排除算法進(jìn)行查詢(xún),通過(guò)總體到細(xì)部的思考模式,對(duì)細(xì)部的數(shù)據(jù)一一確認(rèn)而確認(rèn)整體。
9.如權(quán)利要求8所述的查詢(xún)索引多媒體標(biāo)題數(shù)據(jù)的方法與裝置,其特征在于,該逆向排除算法包括a.由待查字的第一特征求得初級(jí)標(biāo)題索引表中的位置步驟;b.以待查字后面的單詞第二特征與步驟a所查到次級(jí)標(biāo)題索引表中第一項(xiàng)內(nèi)容的比較步驟;c.關(guān)鍵字表中相對(duì)應(yīng)該關(guān)鍵字的長(zhǎng)度與字尾符,與待查字的字尾符字母的比較步驟;d.確認(rèn)待查字是關(guān)鍵字的步驟;e.進(jìn)行單詞標(biāo)注等各項(xiàng)操作步驟。
全文摘要
一種查詢(xún)索引多媒體標(biāo)題數(shù)據(jù)的方法與裝置,主要是采用多級(jí)索引的方式,將多媒體數(shù)據(jù)建立索引庫(kù),由使用者下達(dá)欲查詢(xún)的關(guān)鍵字,通過(guò)編碼操作獲得關(guān)鍵字的各項(xiàng)特征,依據(jù)這些特征進(jìn)行多級(jí)查詢(xún)和索引后,通過(guò)瀏覽器輸出所查詢(xún)的多媒體文件數(shù)據(jù),使得多媒體數(shù)據(jù)可以重新使用,達(dá)到充分利用現(xiàn)成數(shù)據(jù)的目的。
文檔編號(hào)G06F17/30GK1254136SQ98124160
公開(kāi)日2000年5月24日 申請(qǐng)日期1998年11月12日 優(yōu)先權(quán)日1998年11月12日
發(fā)明者林光信, 陳玄同, 穆立源 申請(qǐng)人:英業(yè)達(dá)股份有限公司