專利名稱:文檔檢索設(shè)備和文檔檢索方法
技術(shù)領(lǐng)域:
本發(fā)明涉及文檔檢索設(shè)備和文檔檢索方法。
背景技術(shù):
先進(jìn)的存儲技術(shù)和成本降低允許存儲和管理大量文檔數(shù)據(jù)。并 且,文件服務(wù)器、文檔管理系統(tǒng)、群件等已經(jīng)流行并在先進(jìn)的功能和 性能方面得到改進(jìn)。在每個都具有文檔存儲、以及圖像傳送和接收功 能的諸如復(fù)印機(jī)、打印機(jī)、圖像掃描儀、傳真機(jī)、數(shù)字?jǐn)z影機(jī)、多功
能外圍設(shè)備(MFP)之類的各種視頻辦公室機(jī)器與網(wǎng)絡(luò)兼容的同時(shí), 信息處理設(shè)備也進(jìn)行了更新。在網(wǎng)絡(luò)環(huán)境中,信息處理設(shè)備和各種視 頻辦公室機(jī)器持續(xù)交換大量文檔數(shù)據(jù)??尚r?yàn)地存儲經(jīng)由辦公室網(wǎng)絡(luò) 傳播的文檔通信量的存儲基礎(chǔ)結(jié)構(gòu)(infrastructure)正在開始進(jìn)入實(shí) 際使用。
日本專利No.3,486,452披露了 一種多功能圖像處理設(shè)備,該多功 能圖像處理設(shè)備可連接至少兩個圖像數(shù)據(jù)輸出設(shè)備,以便提供一種能 保證對所需圖像制作副本而不麻煩操作者的多功能圖像處理設(shè)備。
為了有效地從巨大數(shù)量的存儲文檔中檢索所需文檔,考慮除文本 之外主要包括圖像的文檔的檢索是重要的。全文本搜索對于檢索主要 包括圖像而不是文本的文檔,諸如演示材料、廣泛使用圖形和可視數(shù) 據(jù)之類的文檔是能力不足的。當(dāng)用戶想要使用給定圖像作為檢索關(guān) 鍵,并檢索包括圖像的文檔時(shí),單獨(dú)的全文本搜索不能很好地起作用。
已知使用圖像作為檢索關(guān)鍵來檢索相似圖像的許多相似圖像檢 索方案。已獲得一種基于圖像中的邊緣等來確定對象的形狀以抽取對 象,并使用對象的配置、配色、多個對象之間的位置關(guān)系等的方案, 一種基于直方圖等抽取并使用形成整個圖像的占主導(dǎo)的顏色的組合
或彩色圖案的方案等。
例如,日本專利申請乂>開No.2005 - 244684披露了 一種相似圖像 檢索方案,該相似圖像檢索方案使用推導(dǎo)具有與認(rèn)知相似度確定接近 的特性的特征量的數(shù)學(xué)處理。
日本專利No.3691962披露了基于文本檢索包括多個頁面的文 檔,并顯示包括與命中(hit)文本對應(yīng)的文本圖像的一個或多個頁面 (當(dāng)文本出現(xiàn)在跨越兩個頁面時(shí)的兩個頁面)的布置。
在使用圖像檢索技術(shù)的文檔檢索中,只獲得一個文檔作為檢索結(jié) 果的情況是罕見的。在大多數(shù)情況下,根據(jù)用戶的判斷,在檢索之后 需要從相當(dāng)大數(shù)量的命中文檔中抽取所需文檔的處理。其原因是出 于所有實(shí)用目的,在大規(guī)模存儲基礎(chǔ)結(jié)構(gòu)中存在包括被再次使用或修 改的同樣圖像的多個文檔。并且,圖像相似度由模擬連續(xù)量來表達(dá), 甚至是一對不同的圖像也具有一定相似度。根據(jù)檢索的最終目的,因 為"相似,,是基于用戶的主觀性的,所以"相似,,的標(biāo)準(zhǔn)是任意的。因?yàn)?不可能自動地作出與用戶的主觀性完全符合的相似度評估,所以相似 圖像檢索只被用來縮小(narrow down)相當(dāng)大的數(shù)量的備選,并且 用于找出所需文檔的操作應(yīng)由用戶的主觀性負(fù)責(zé)。此外,演示某范圍 內(nèi)的相當(dāng)大的數(shù)量的檢索結(jié)果文檔可激發(fā)用戶的思考,從而支持他或 她的創(chuàng)造性作品。
在使用在日本專利申請公開No.2005 - 244684所披露的圖像檢 索技術(shù)的文檔檢索中,檢索結(jié)果列表包括相當(dāng)大的數(shù)量的文檔、還有 許多噪聲結(jié)果(除所需文檔之外的文檔)。因而,當(dāng)用戶瀏覽該列表 并從該列表檢索所需文檔時(shí),效率是重要的。
例如,當(dāng)多個文檔包括命中檢索條件的圖像時(shí),將該多個文檔列 入文檔檢索結(jié)果列表中。在這樣的情況下,根據(jù)該圖像被分配的上下 文,該文檔可能不是所需的。在文檔主要包括文本的情況下,可構(gòu)建 一種檢索系統(tǒng),該檢索系統(tǒng)使用文本概要技術(shù)自動地產(chǎn)生概要,并且 將該文檔概要顯示在檢索結(jié)果列表中,以允許用戶容易地選擇所需文 檔。然而,不能由基于文本的概要來表達(dá)圖像信息。
日本專利No.3691962披露了 一種當(dāng)基于文本的檢索結(jié)果跨越文 檔中的多個頁面出現(xiàn)時(shí)的顯示技術(shù)。然而,當(dāng)由用戶從相似圖像檢索 的文檔檢索結(jié)果列表中選擇所需文檔時(shí),這樣的技術(shù)沒有導(dǎo)致效率的提兩。
發(fā)明內(nèi)容
本發(fā)明的一個目的是提供一種文檔檢索技術(shù),該文檔檢索技術(shù)可 有效地顯示文檔概要,并且使用該圖像檢索技術(shù),可將命中圖像檢索條 件的圖像所在的文檔中的內(nèi)容分配到文檔檢索的檢索結(jié)果列表中。
本發(fā)明的另 一 目的是提供一種文檔檢索技術(shù),該文檔檢索技術(shù)允 許用戶迅速地從包括相當(dāng)大的數(shù)量的文檔以及還有許多噪聲結(jié)果的 檢索結(jié)果列表中找出所需文檔。
為實(shí)現(xiàn)上述目的中的至少一個目的,根據(jù)本發(fā)明的一個方面,提 供一種文檔檢索設(shè)備,所述設(shè)備包括
文檔檢索單元,其適用于檢索包括與輸入檢索條件相匹配的圖像 的文檔數(shù)據(jù);
檢索結(jié)果列表顯示單元,其適用于基于文檔檢索單元的檢索結(jié) 果,在顯示單元上顯示與檢索條件相匹配的文檔數(shù)據(jù)的列表顯示;以 及
縮略圖顯示單元,其適用于在通過檢索結(jié)果列表顯示單元的列表 顯示中顯示和與檢索條件相匹配的頁面或圖像元素相關(guān)聯(lián)的第一縮 略像,以及與形成包括與檢索條件相匹配的頁面或圖像元素的文 檔數(shù)據(jù)的另一頁面或另一圖像元素相關(guān)聯(lián)的第二縮略像。
根據(jù)本發(fā)明的另 一方面,提供一種用于包括顯示單元的文檔檢索 設(shè)備的文檔檢索方法,所述方法包括
檢索包括與輸入檢索條件相匹配的圖像的文檔數(shù)據(jù)的文檔檢索
步驟;
基于文檔檢索步驟的檢索結(jié)果,在顯示單元上顯示與檢索條件相 匹配的文檔數(shù)據(jù)的列表顯示的檢索結(jié)果列表顯示步驟;以及在通過檢索結(jié)果列表顯示步驟的列表顯示中顯示和與檢索條件 相匹配的頁面或圖像元素相關(guān)聯(lián)的第一縮略像,以及與形成包括 與檢索條件相匹配的頁面或圖像元素的文檔數(shù)據(jù)的另一頁面或另一 圖像元素相關(guān)聯(lián)的第二縮略像的縮略圖顯示步驟。
根據(jù)本發(fā)明,在使用圖像檢索技術(shù)的文檔檢索中,在檢索結(jié)果列 表中可有效地顯示文檔的概要和命中圖像檢索條件的圖像在文檔中 ,皮分配的上下文。
并且,根據(jù)本發(fā)明,用戶可迅速地從檢索結(jié)果列表中找出所需文 檔,其中該檢索結(jié)果列表包括相當(dāng)大的數(shù)量的文檔以及還包括許多噪 聲結(jié)果。
參考附圖,本發(fā)明的其它特征將從示例性實(shí)施例的下述說明中變 得明了。
圖1是示出根據(jù)本發(fā)明的一個實(shí)施例的圖像處理系統(tǒng)的整體布置的框圖2是示出在服務(wù)器系統(tǒng)上運(yùn)行的作業(yè)存檔應(yīng)用的軟件配置的框圖3是示出圖像處理設(shè)備的硬件布置的框圖4是示出圖像處理設(shè)備的外觀的透視圖5示出圖像處理設(shè)備的操作單元的布置;
圖6是示出與控制單元的布置一致的、圖像處理設(shè)備的操作單元 和操作單元接口 (i/f)的布置的框圖7示出圖像處理設(shè)備的操作單元上顯示的操作窗口的示例;
圖8示出了數(shù)據(jù)庫(db)管理系統(tǒng)中存儲的數(shù)據(jù)庫的數(shù)據(jù)結(jié)構(gòu);
圖9是用于說明檢索處理的序列的流程圖10示出了作為文檔檢索應(yīng)用的基本窗口的文檔檢索窗口的配 置示例;
圖11示出了文檔檢索應(yīng)用的文檔檢索結(jié)果列表窗口的配置示
例;
圖12示出了檢索命中文檔顯示的示例;
圖13示出了其中多個頁面命中的文檔的檢索命中文檔顯示的示
例;
圖14示出了文檔概要縮略圖的動畫顯示示例;
圖15示出了在密集顯示模式下的文檔檢索應(yīng)用的文檔檢索結(jié)果 列表窗口的顯示示例;
圖16A和16B是示出了文檔概要縮略圖動畫顯示處理的序列的 流程圖17示出了由多個圖像區(qū)域元素配置的文檔的示例;以及 圖18示出了根據(jù)第二實(shí)施例的檢索命中文檔顯示的示例。
具體實(shí)施例方式
將參考附圖在下文詳細(xì)例示本發(fā)明的優(yōu)選實(shí)施例。然而,根據(jù)實(shí) 施例說明的構(gòu)造組件僅為示例,并且本發(fā)明的技術(shù)范圍由權(quán)利要求的 范圍定義,但不限于下述個體實(shí)施例。 (圖像處理系統(tǒng)的布置)
圖l是示出根據(jù)一個實(shí)施例的圖像處理系統(tǒng)的整體布置的框圖。 參考圖1,圖像處理系統(tǒng)包括通過網(wǎng)絡(luò)彼此相連接的圖像處理設(shè)備 110、 120和130、個人計(jì)算機(jī)(在下文中也被稱為"信息處理設(shè)備") 101和102、以及服務(wù)器系統(tǒng)140。網(wǎng)絡(luò)包括例如LAN(局域網(wǎng)) 亂
圖像處理設(shè)備IIO包括作為圖像輸入裝置的掃描儀113、作為圖 像輸出裝置的打印機(jī)114、控制單元111和作為用戶接口的操作單元 112。掃描儀113、打印機(jī)114和操作單元112與控制單元111相連接, 并由來自控制單元111的指令控制。使控制單元111連接到LAN 100。
圖像處理設(shè)備120和130具有與圖像處理設(shè)備110的布置相同的布置。
個人計(jì)算機(jī)101是由多個用戶中的每一個用戶親自使用,并存儲 由用戶使用的應(yīng)用程序、用戶數(shù)據(jù)等的信息處理設(shè)備。
服務(wù)器系統(tǒng)140包括服務(wù)器計(jì)算機(jī)141和大規(guī)模存儲設(shè)備142。
服務(wù)器計(jì)算機(jī)141存儲對多個用戶和客戶端系統(tǒng)提供服務(wù)的服 務(wù)器應(yīng)用、共享數(shù)據(jù)等。大規(guī)模存儲設(shè)備142是具有高性能和高可靠 性、并且主要存儲在服務(wù)器計(jì)算機(jī)141等上運(yùn)行的數(shù)據(jù)庫管理系統(tǒng) (DBMS)的數(shù)據(jù)的大規(guī)模次級存儲設(shè)備。
由服務(wù)器系統(tǒng)140執(zhí)行的服務(wù)器應(yīng)用之一是將遍及網(wǎng)絡(luò)分布的 作業(yè)數(shù)據(jù)(例如,打印數(shù)據(jù)和掃描數(shù)據(jù))存檔(即,累積并管理)的 數(shù)據(jù)庫應(yīng)用器。在下文中將服務(wù)器應(yīng)用稱為作業(yè)存檔應(yīng)用。作業(yè)存檔 應(yīng)用與安裝在連接到網(wǎng)絡(luò)的其它設(shè)備中的軟件協(xié)作,以配置被稱為作 業(yè)存檔系統(tǒng)的分布式應(yīng)用。
在圖1所示的系統(tǒng)中,個人計(jì)算機(jī)101與圖像處理設(shè)備110、 120 和130、服務(wù)器系統(tǒng)140等,通過LAN100協(xié)作。例如,個人計(jì)算機(jī) 101與圖像處理設(shè)備110交換文檔數(shù)據(jù)(在下文中也被簡稱為"文檔")。 個人計(jì)算機(jī)101執(zhí)行諸如打印作業(yè)、掃描作業(yè)、傳真發(fā)送和接收作業(yè)、 存儲和檢索作業(yè)到箱(box)(圖像處理設(shè)備110中的嵌入文檔管理 系統(tǒng))等的作業(yè)。在執(zhí)行處理文檔的作業(yè)時(shí),在服務(wù)器系統(tǒng)140上運(yùn) 行的作業(yè)存檔應(yīng)用將作業(yè)信息和作業(yè)中要被處理的文檔數(shù)據(jù)的副本 存檔。例如,在打印作業(yè)的情況下,個人計(jì)算機(jī)101上的打印機(jī)驅(qū)動 程序?qū)⒆鳂I(yè)輸入到圖像處理設(shè)備110,還將與該作業(yè)相關(guān)聯(lián)的信息和 要被處理的文檔的數(shù)據(jù)傳送到服務(wù)器系統(tǒng)140,從而將作業(yè)存檔。
在圖1所示的系統(tǒng)中,圖像處理設(shè)備110與其它圖像處理設(shè)備 120和130、個人計(jì)算機(jī)101和102、服務(wù)器系統(tǒng)140等通過LAN 100 協(xié)作。例如,圖像處理設(shè)備110可掃描原稿圖像以將其轉(zhuǎn)換為數(shù)字?jǐn)?shù) 據(jù),并將該數(shù)字?jǐn)?shù)據(jù)發(fā)送到另一設(shè)備。并且,圖像處理設(shè)備110可執(zhí) 行用于檢索存儲在另一設(shè)備中的數(shù)據(jù)、并且打印檢索到的數(shù)據(jù)、將其 存儲在本地箱中、或仍將其傳輸?shù)搅硪辉O(shè)備的作業(yè)。
在執(zhí)行處理文檔的這樣的作業(yè)時(shí),運(yùn)行在服務(wù)器系統(tǒng)140上的作 業(yè)存檔應(yīng)用將作業(yè)信息和在每個作業(yè)中要被處理的文檔數(shù)據(jù)的副本 存檔。例如,在自動路由掃描(push scan)作業(yè)的情況下,利用圖像 處理設(shè)備110上的"發(fā)送"應(yīng)用將使用掃描儀通過掃描原稿文檔獲得的 數(shù)字文檔數(shù)據(jù)發(fā)送到主要發(fā)送目的地。在發(fā)送的同時(shí),將與該作業(yè)相 關(guān)聯(lián)的作業(yè)信息和要被處理的文檔的數(shù)據(jù)發(fā)送至服務(wù)器系統(tǒng)140,從 而將該作業(yè)存檔。
因而,作業(yè)存檔應(yīng)用將遍及網(wǎng)絡(luò)分布的作業(yè)文檔存檔。
(作業(yè)存檔應(yīng)用的軟件配置)
圖2是示出在服務(wù)器系統(tǒng)140上運(yùn)行的作業(yè)存檔應(yīng)用的軟件配置 的框圖。
數(shù)據(jù)庫管理系統(tǒng)(DB管理系統(tǒng))201存儲大量數(shù)據(jù),包括作為 數(shù)據(jù)庫的大量記錄,該數(shù)據(jù)庫是與記錄之間的關(guān)系 一起被結(jié)構(gòu)化的。 響應(yīng)使用諸如SQL (結(jié)構(gòu)化查詢語言)之類的查詢語言的查詢,DB 管理系統(tǒng)201高速檢索與來自數(shù)據(jù)庫的輸入條件相匹配的記錄。DB 管理系統(tǒng)201包括文檔DB 202、作業(yè)DB 203和索引DB 204。通過公 知的關(guān)系數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫等實(shí)現(xiàn)DB管理系統(tǒng)201。
文檔DB 202是存儲由作業(yè)存檔系統(tǒng)累積和管理的文檔數(shù)據(jù)的數(shù) 據(jù)庫。文檔DB 202將文檔的內(nèi)容數(shù)據(jù)和與該文檔相關(guān)聯(lián)的元數(shù)據(jù)存 儲為文檔記錄。文檔DB 202和作業(yè)DB 203在其所存儲的記錄之中彼 此相關(guān)。
作業(yè)DB 203是將由作業(yè)存檔系統(tǒng)累積和管理的作業(yè)數(shù)據(jù)存儲為 作業(yè)記錄的數(shù)據(jù)庫。作業(yè)DB 203和文檔DB 202在其所存儲的記錄之 中彼此相關(guān)。
索引DB 204是存儲索引記錄的數(shù)據(jù)庫,該索引記錄用于從由作 業(yè)存檔系統(tǒng)累積和管理的文檔數(shù)據(jù)和作業(yè)數(shù)據(jù)中迅速地檢索所需數(shù) 據(jù)。存儲在索引DB 204中的索引記錄查閱文檔DB 202和作業(yè)DB 203 中的記錄。
存儲單元205是存儲請求接受模塊,該存儲請求接受模塊從諸如 圖像處理設(shè)備110、個人計(jì)算機(jī)101之類的客戶端接收文檔數(shù)據(jù)和作 業(yè)數(shù)據(jù),并將該數(shù)據(jù)存儲在DB管理系統(tǒng)201中。存儲單元205將接收的文檔數(shù)據(jù)和作業(yè)數(shù)據(jù)存儲在DB管理系統(tǒng)201中。存儲單元205 切換用于產(chǎn)生與接收的文檔數(shù)據(jù)的數(shù)據(jù)格式一致的元數(shù)據(jù)的處理。當(dāng) 接收的文檔數(shù)據(jù)是通過由圖像掃描儀掃描圖像、由數(shù)字?jǐn)z影機(jī)捕獲圖 像、或通過傳真接收圖像而產(chǎn)生的光柵圖像文檔數(shù)據(jù)時(shí),存儲單元205 將文檔數(shù)據(jù)發(fā)送至光柵圖像頁面處理器206。
當(dāng)接收的文檔數(shù)據(jù)是編碼文檔數(shù)據(jù)時(shí),存儲單元205將該數(shù)據(jù)發(fā) 送至再現(xiàn)(rendering)單元210。例如,存儲單元205將由頁面描述 語言或向量數(shù)據(jù)表達(dá)的各種文檔格式發(fā)送至再現(xiàn)單元210。存儲單元 205將諸如桌面出版(desk publish )應(yīng)用、文字處理器、電子制表軟 件、演示應(yīng)用、制圖應(yīng)用、噴繪應(yīng)用之類的各種應(yīng)用的文檔格式的數(shù) 據(jù)發(fā)送至再現(xiàn)單元210。
光柵圖像頁面處理器206是將光柵圖像文檔分成形成該文檔的 頁面(圖像頁面),并處理所分開的圖像頁面的模塊。光柵圖像頁面 處理器206將分開的圖像頁面發(fā)送至圖像特征抽取單元207和圖像結(jié) 構(gòu)分析單元208。
圖像特征抽取單元207是分析光柵圖像數(shù)據(jù)并抽取特征數(shù)據(jù)(在 下文中也被簡稱為"特征")的模塊,其中該特征數(shù)據(jù)被用作關(guān)于確定 圖像之間的相似度的標(biāo)準(zhǔn)。將抽取的特征數(shù)據(jù)發(fā)送至存儲接收的特征 數(shù)據(jù)的DB管理系統(tǒng)201??衫脤τ谙嗨茍D像檢索有效的各種特征 抽取方案。實(shí)施例不取決于具體算法,并可一起使用多個有效的方案。 可采用的方案包括下述方案。
例如,可利用基于圖像中的邊緣等抽取對象以確定其形狀,并使 用圖像的分配、配色、多個對象之間的位置關(guān)系等抽取對象的方案。 并且,可利用基于直方圖等抽取并使用形成整個圖像的占主導(dǎo)的顏色 的組合或顏色圖案的方案。此外,可利用使用推導(dǎo)具有與認(rèn)知相似度 確定接近的特性的特征量的各種數(shù)學(xué)處理(例如,傅立葉梅林變換) 的方案。由日本專利申請^>開No.2006 - 65866(日本專利申請No.2005 -244684)披露的方法也是適合的方案。
圖像結(jié)構(gòu)分析單元208是分析光柵圖像數(shù)據(jù)的結(jié)構(gòu)的模塊。圖像
結(jié)構(gòu)分析單元208使用諸如塊選擇、圖像區(qū)分離之類的方案將一組圖 像區(qū)(圖像頁面)分解為形成圖像頁面并具有不同特性的多個區(qū)。例 如,圖像結(jié)構(gòu)分析單元208將圖像頁面分解為多個區(qū)(文本區(qū)、圖像 區(qū)、照片區(qū)、圖形區(qū)、黑白區(qū)、彩色區(qū)等),并對區(qū)結(jié)構(gòu)進(jìn)行分析和 分類。
并且,圖像結(jié)構(gòu)分析單元208對諸如背景之類的背景圖案和諸如 文本、形狀之類的布局在背景圖案上的對象之間的層結(jié)構(gòu)進(jìn)行分析和 分類。圖像結(jié)構(gòu)分析單元208將作為分析結(jié)果獲得的圖像區(qū)(或圖像 層)的光柵圖像數(shù)據(jù)發(fā)送至圖像特征抽取單元207。并且,圖像結(jié)構(gòu) 分析單元208將作為分析結(jié)果獲得的文本區(qū)(或文本層)的光柵圖像 數(shù)據(jù)發(fā)送至OCR單元209。圖像結(jié)構(gòu)分析單元208將作為分析結(jié)果 獲得的結(jié)構(gòu)信息發(fā)送至存儲接收的結(jié)構(gòu)信息的DB管理系統(tǒng)201。
OCR單元209是分析對其已再現(xiàn)了字符的光柵圖像數(shù)據(jù),并識 別字符的模塊。OCR單元209將已經(jīng)過字符識別的文本數(shù)據(jù)(即, 由統(tǒng)一碼等編碼的數(shù)據(jù))發(fā)送至存儲接收的文本數(shù)據(jù)的DB管理系統(tǒng) 201。
索引產(chǎn)生器211是產(chǎn)生用于從文檔DB 202和作業(yè)DB 203迅速 檢索數(shù)據(jù)的索引信息的模塊。預(yù)先產(chǎn)生索引,以迅速地檢索包括與給 定作為檢索關(guān)鍵的圖像相似的圖像的文檔記錄;或預(yù)先產(chǎn)生索引,以 在文檔內(nèi)容數(shù)據(jù)或頁面內(nèi)容數(shù)據(jù)中對包括給定作為檢索關(guān)鍵的文本 的文檔記錄迅速地實(shí)施全文本檢索(或搜索)。并且,預(yù)先產(chǎn)生索引,
文檔記錄或作業(yè)記錄。索引產(chǎn)生可使用多種已知方法的組合。
用于全文本檢索的索引的產(chǎn)生4吏用例如,N元模型(N-gram) 方案。使表達(dá)圖像的特征的特征向量預(yù)先聚集或按照給定的順序使用 散列函數(shù)對其進(jìn)行分類,以產(chǎn)生用于相似圖像檢索的索引。當(dāng)文檔 DB 202和作業(yè)DB 203的內(nèi)容在另外登記或編輯文檔數(shù)據(jù)和作業(yè)數(shù)據(jù) 而進(jìn)行更新時(shí),完成由索引產(chǎn)生器211進(jìn)行的索引產(chǎn)生。索引產(chǎn)生器 211能與更新各個DB異步地如批處理一樣執(zhí)行索引產(chǎn)生。將產(chǎn)生的
索引存儲在DB管理系統(tǒng)201的索引DB 204中。
檢索單元212是從諸如圖像處理設(shè)備110、個人計(jì)算機(jī)101之類 的客戶端接受檢索關(guān)鍵(檢索關(guān)鍵圖像或檢索關(guān)鍵文本)和檢索條件 的模塊。檢索單元212根據(jù)接受的檢索條件從DB管理系統(tǒng)201檢索 文檔數(shù)據(jù)。檢索單元212將命中的文檔數(shù)據(jù)、與該文檔相關(guān)聯(lián)的縮略 像(在下文中將被簡稱為"縮略圖,,)和諸如作業(yè)數(shù)據(jù)之類的元數(shù) 據(jù)返回至客戶端。
文檔檢索單元213是檢索與文檔檢索請求相匹配的文檔的模塊。 文檔檢索單元213可實(shí)施基于文檔的內(nèi)容數(shù)據(jù)的檢索,其基于文檔中 所包括的頁面數(shù)據(jù),并根據(jù)檢索請求和給定檢索關(guān)鍵的類型基于文檔 的元數(shù)據(jù)。文檔檢索單元213基于與文檔相關(guān)的作業(yè)組合檢索,并找 出與檢索請求相匹配的多個文檔記錄備選。
頁面檢索單元214基于文檔中所包括的頁面數(shù)據(jù),^J應(yīng)檢索請 求,從文檔DB 202中找出與檢索請求的條件相匹配的多個頁面記錄 備選(和包括該頁面的文檔)。
相似圖像檢索單元215基于給定作為檢索關(guān)鍵的圖像,響應(yīng)相似 圖像檢索請求,找出具有包括與檢索關(guān)鍵圖像相似的圖像的頁面內(nèi)容 數(shù)據(jù)的多個頁面記錄(和包括該頁面的文檔)。相似圖4象檢索單元215 對檢索關(guān)鍵圖像應(yīng)用如在圖像特征抽取單元207中相同的圖像特征抽 取,并基于各個特征的相似度檢索相似圖像。
DB操作單元216是從客戶端接受并處理對數(shù)據(jù)庫的操作和對各 個數(shù)據(jù)庫中的記錄的操作請求,并將結(jié)果返回至客戶端的數(shù)據(jù)庫操作 模塊??蛻舳税ǚ?wù)器計(jì)算機(jī)141的管理控制臺、圖像處理設(shè)備IIO、 個人計(jì)算機(jī)101等。對記錄的操作包括諸如元數(shù)據(jù)的添加、編輯之類 的操作(例如,標(biāo)簽等)。
(圖像處理設(shè)備的硬件布置)
圖3是示出圖像處理設(shè)備110的硬件布置的框圖。圖像處理設(shè)備 120和130也包括相同的布置。
控制單元111連接到掃描儀113和打印機(jī)114,并連接到LAN 100 和公共線(WAN),以便控制圖像信息和裝置信息的輸入和輸出。
CPU 301控制控制單元111的操作。RAM 302是由CPU 301使 用的、用于CPU 301的操作的系統(tǒng)工作存儲器。RAM 302還是用于 臨時(shí)存儲圖像數(shù)據(jù)的圖像存儲器。ROM 303是存儲系統(tǒng)的引導(dǎo)程序 的引導(dǎo)ROM。 HDD 304是存儲系統(tǒng)軟件和圖像數(shù)據(jù)的硬盤驅(qū)動器。
操作單元接口 (I/F) 306控制與操作單元(UI) 112的接口,并 將要被顯示在操作單元112上的圖像數(shù)據(jù)輸出至操作單元112。并且, 操作單元I/F 306充當(dāng)對CPU 301通報(bào)由用戶經(jīng)由操作單元112輸入 的信息的角色。
網(wǎng)絡(luò)接口 (1/F)308控制與LAN 100的連接,并充當(dāng)對LAN 100 輸入信息和從LAN 100輸出信息的通信單元。調(diào)制解調(diào)器309控制與 公共線路的連接,并充當(dāng)對公共線路輸入信息和從公共線路輸出信息 的通信單元。上述裝置被分配在系統(tǒng)總線307上。
圖像總線接口 (圖像總線I/F) 305是將系統(tǒng)總線307與高速傳 輸圖像數(shù)據(jù)的圖像總線310相連接,并轉(zhuǎn)換數(shù)據(jù)結(jié)構(gòu)的總線橋。圖像 總線310包括PCI總線或IEEE 1394。
在圖像總線310上分配下述裝置。光柵圖像處理器(RIP) 311 將從網(wǎng)絡(luò)發(fā)送的PDL代碼數(shù)據(jù)光柵化為位像。裝置接口 (I/F) 312將作為圖像輸入和輸出裝置的掃描儀113和打印機(jī)114連接到控 制單元111,并執(zhí)行圖像數(shù)據(jù)的同步系統(tǒng)和異步系統(tǒng)之間的轉(zhuǎn)換。
掃描儀圖像處理器313校正、修改、并編輯輸入圖像數(shù)據(jù)。打印 機(jī)圖像處理器314根據(jù)打印機(jī)114的性能執(zhí)行校正、分辨率轉(zhuǎn)換等, 以打印輸出圖像數(shù)據(jù)。圖像旋轉(zhuǎn)單元315旋轉(zhuǎn)圖像數(shù)據(jù)。圖像壓縮單 元316應(yīng)用對多值圖像數(shù)據(jù)應(yīng)用JPEG壓縮/解壓縮處理,以及對二值 圖4象數(shù)據(jù)應(yīng)用JBIG、 MMR或MH的壓縮和解壓縮處理。 (圖像處理設(shè)備的外觀)
圖4是示出圖像處理設(shè)備110的外觀的透視圖。圖像處理設(shè)備 120和130也具有相同的外觀。要注意的是,盡管將關(guān)于圖像處理設(shè) 備110作出下述說明,圖像處理設(shè)備120和130也包括相同布置,并
可執(zhí)行相同操作。
作為圖像輸入裝置的掃描儀113通過以光照射作為原稿的打印 介質(zhì)(紙張)上的圖像,并掃描CCD線傳感器(未示出)產(chǎn)生光柵 圖像數(shù)據(jù)。
當(dāng)用戶將原稿用紙置于文檔給送器405的托盤406中,并在操作 單元112輸入掃描激活指令時(shí),控制單元111的CPU 301將該指令發(fā) 送至掃描儀113?;谠撦斎胫噶睿瑢⒅糜谕斜P406上的原稿用紙逐 張給送,并且掃描儀113掃描原稿圖像。
作為圖像輸出裝置的打印機(jī)114將光柵圖像數(shù)據(jù)打印并輸出到 打印介質(zhì)(紙張)上??衫檬褂酶泄夤?、感光帶等的電子照像系統(tǒng)、 從微噴嘴陣列噴墨以在打印介質(zhì)(紙張)上直接形成圖像的噴墨系統(tǒng) 等作為打印系統(tǒng),并且可釆用任何這樣的系統(tǒng)。要注意的是打印操
作是響應(yīng)來自CPU 301的指令而被激活的。
打印機(jī)114具有多個紙給送板,以便允許用戶選擇不同的紙張尺 寸或不同的紙張方向,并包括對應(yīng)的紙盒401、 402和403。排空的托 盤404接收打印的紙張。
(圖像處理設(shè)備的操作單元)
圖5是示出圖像處理設(shè)備110的操作單元112的布置的平面圖。 要注意的是圖像處理設(shè)備120和130的操作單元包括等同的布置。
LCD顯示單元501是通過將觸摸板薄片粘接到液晶顯示器 (LCD)上的觸摸板顯示器502配置而成的。LCD顯示單元501顯 示圖像處理設(shè)備IIO的操作窗口和軟件鍵,并且當(dāng)用戶按壓所顯示的 鍵之一時(shí),單元501將指示所按下的位置的位置信息發(fā)送至控制單元 111的CPU 301。
當(dāng)用戶想要啟動,例如原稿圖像的掃描操作時(shí),按下啟動鍵505。 啟動鍵505的中心位置包括指示啟動鍵505是否準(zhǔn)備進(jìn)行操作的綠 紅、兩色LED指示器506。當(dāng)用戶想要停止圖像處理設(shè)備IIO的激活 操作時(shí),按下停止鍵503。當(dāng)用戶輸入他或她的用戶ID時(shí),按下ID 鍵507。復(fù)位鍵504允許用戶將來自操作單元112的設(shè)定復(fù)位。
(操作單元和操作單元接口 (I/F)的內(nèi)部布置)
圖6是示出與控制單元111的內(nèi)部布置一致的、圖像處理設(shè)備 110的操作單元112和操作單元I/F 306的內(nèi)部布置的框圖。要注意的 是盡管下述說明是關(guān)于圖像處理設(shè)備110作出的,即使當(dāng)圖像處理 設(shè)備IIO由圖像處理設(shè)備120或130替代時(shí),也不會引起問題。
如上所述,操作單元112通過操作單元I/F 306與系統(tǒng)總線307 相連接。CPU 301、 RAM302、 ROM303和硬盤驅(qū)動器(HDD ) 304 連接到系統(tǒng)總線307。 CPU 301基于存儲在ROM 303和HDD 304中 的控制程序等,系統(tǒng)地控制對連接到系統(tǒng)總線307的各種裝置的訪問。 CPU 301從通過裝置I/F 312連接的掃描儀113讀取輸入信息,并將 圖像信號作為輸出信息輸出至通過裝置I/F 312連接的打印機(jī)114。 RAM302充當(dāng)CPU301的主存儲器、工作區(qū)等。
來自觸摸板顯示器502的每個觸摸板和各種硬件鍵(停止鍵503、 復(fù)位鍵504、啟動鍵505和ID鍵507 )的用戶輸入信息通過輸入端口 601傳遞給CPU 301。 CPU 301基于用戶輸入信息的內(nèi)容和控制程序 產(chǎn)生顯示窗口數(shù)據(jù),并將顯示窗口數(shù)據(jù)通過控制窗口輸出裝置的輸出 端口 602輸出至LCD顯示單元501。并且,CPU301根據(jù)需要控制兩 色LED指示器506。
圖7示出了在圖像處理設(shè)備110的操作單元112上顯示的標(biāo)準(zhǔn)操 作窗口的示例。
布置在圖7的最上方的顯示區(qū)701上的按鈕被用于選擇由圖像處 理設(shè)備110提供的各種功能之一。復(fù)制功能704允許用戶使用打印機(jī) 114,打印由掃描儀113通過掃描原稿圖像獲得的原稿圖像數(shù)據(jù),以 便獲得原稿圖像的副本。
發(fā)送功能705允許用戶將由掃描儀113掃描的原稿圖像數(shù)據(jù)或存 儲在HDD 304中的圖像數(shù)據(jù)發(fā)送至各輸出目的地。輸出目的地包括 由各種協(xié)議通過網(wǎng)絡(luò)接口 308能對其發(fā)送數(shù)據(jù)的各輸出目的地,和通 過例如,諸如FAX之類的協(xié)議經(jīng)由調(diào)制解調(diào)器309能對其發(fā)送數(shù)據(jù) 的輸出目的地。利用發(fā)送功能705,通過選擇多個輸出目的地能發(fā)送數(shù)據(jù)。
箱功能706允許用戶瀏覽、編輯、打印和發(fā)送存儲在HDD 304 中的諸如圖像數(shù)據(jù)、代碼數(shù)據(jù)之類的文檔文件。存儲在HDD 304中 的文檔文件包括由掃描儀113掃描的原稿圖像數(shù)據(jù),和通過網(wǎng)絡(luò)接口 308下載的數(shù)據(jù)。并且,存儲在HDD 304中的文檔文件包括通過存儲 從另一設(shè)備經(jīng)由網(wǎng)絡(luò)接口 308接收的打印數(shù)據(jù)而獲得的數(shù)據(jù)、從另一 設(shè)備經(jīng)由調(diào)制解調(diào)器309接收的傳真數(shù)據(jù)等。
箱功能706可被用作為用戶的辦公室環(huán)境中的電子郵件信箱。因 為到紙張上的打印輸出操作被延遲,直到用戶輸入密碼,所以箱功能 706也可以用作為增強(qiáng)PDL打印作業(yè)的保密性的安全打印(secured print)功能。
使用箱功能706允許用戶對其它圖像處理設(shè)備120和130的 HDD 、以及由信息處理設(shè)備101和102公開的共享文件系統(tǒng)進(jìn)行訪問, 以瀏覽、編輯、打印和發(fā)送數(shù)據(jù)。利用箱功能706,用戶可訪問存儲 在服務(wù)器系統(tǒng)140的共享文件系統(tǒng)、數(shù)據(jù)庫系統(tǒng)等中的諸如圖像數(shù)據(jù)、 代碼數(shù)據(jù)之類的文檔文件,并瀏覽、編輯、打印并發(fā)送數(shù)據(jù)。
擴(kuò)展功能707允許用戶調(diào)用各種擴(kuò)展功能,以從外部設(shè)備使用掃 描儀113。
檢索功能708允許用戶從圖像處理設(shè)備110的箱、其它圖像處理 設(shè)備的箱等檢索所需文檔。利用檢索功能708,用戶可從由信息處理 設(shè)備公開的共享文件系統(tǒng)、以及由服務(wù)器系統(tǒng)140提供的共享文件系 統(tǒng)和數(shù)據(jù)庫系統(tǒng)檢索所需文檔。
圖7中的中間顯示區(qū)702顯示當(dāng)用戶選擇復(fù)制功能704時(shí)的操作 窗口。圖7中的最下方的顯示區(qū)703與狀態(tài)顯示區(qū)對應(yīng),該狀態(tài)顯示 區(qū)向用戶顯示諸如圖像處理設(shè)備IIO的功能、設(shè)備本身的信息之類的 各種消息,而與在最上方的顯示區(qū)701上選擇的功能無關(guān)。
圖8示出了在DB管理系統(tǒng)201中存儲的各個數(shù)據(jù)庫的示意性配置。
文檔DB 202包括多個文檔記錄801。文檔記錄801與要由用戶
處理的紙文檔和數(shù)字文檔文件對應(yīng)。每一個文檔記錄801包括文檔元 數(shù)據(jù)802、文檔內(nèi)容數(shù)據(jù)803和多個頁面記錄804。
文檔元數(shù)據(jù)802是存儲與對應(yīng)于文檔記錄的文檔相關(guān)聯(lián)的各種 元數(shù)據(jù)。文檔元數(shù)據(jù)802包括文檔名稱、作者、創(chuàng)建日期、數(shù)據(jù)格式、 數(shù)據(jù)大小、頁面數(shù)量、標(biāo)簽、作業(yè)日志等。
"標(biāo)簽,,是像由任意字符串形成的、由用戶賦給文檔的關(guān)鍵詞 一樣 的信息。文檔可基于該標(biāo)簽被檢索。用戶可自由地將多個標(biāo)簽賦給一 個文檔。通過將標(biāo)簽附加給文檔,文檔可基于各種標(biāo)準(zhǔn)被分類并可以 容易地被檢索。對于共享文檔,多個用戶可稍后添加標(biāo)簽,以便在稍 后的時(shí)間查閱或使用該文檔。因此,可顯著地將用于分類和檢索文檔 的元數(shù)據(jù)做得更加滿意。
該方法;故通常稱為"大眾分類法(folksonomy)"。"大眾分類法" 是組合了 "大眾"和"分類法"的術(shù)語。
作業(yè)日志是用于詳細(xì)說明對于作為要被處理的對象的文檔執(zhí)行 的 一 系列作業(yè)的參考信息列表。 一個文檔記錄通常保持對多個作業(yè)記 錄的參考。例如,考慮其中作為要被處理的對象的多個作業(yè)使用被明 顯詳細(xì)說明為相同文檔的文檔的情況。
文檔內(nèi)容數(shù)據(jù)803是與文檔本身的內(nèi)容對應(yīng)的數(shù)據(jù)。當(dāng)存儲編碼 文檔數(shù)據(jù)時(shí),文檔內(nèi)容數(shù)據(jù)803與應(yīng)用程序的文本、數(shù)據(jù)等對應(yīng)。當(dāng) 將形成文檔的頁面像與紙?jiān)鍖?yīng)的光柵圖像數(shù)據(jù)一樣明顯地分離, 并由掃描儀掃描時(shí),每個頁面記錄804都包括內(nèi)容數(shù)據(jù)。
頁面記錄804是與形成文檔的每一頁面對應(yīng)的記錄。單獨(dú)的頁面 記錄804與由掃描儀113掃描的光柵圖像數(shù)據(jù)組、通過由再現(xiàn)單元210 再現(xiàn)應(yīng)用程序的數(shù)據(jù)并將其分開到各頁面而獲得的圖像數(shù)據(jù)、結(jié)構(gòu)信 息、文本、元數(shù)據(jù)組等對應(yīng)。
每一個頁面記錄包括頁面元數(shù)據(jù)805和頁面內(nèi)容數(shù)據(jù)806。頁面 元數(shù)據(jù)805是存儲與對應(yīng)的頁面相關(guān)聯(lián)的各種元數(shù)據(jù)的記錄。頁面元 數(shù)據(jù)805包括結(jié)構(gòu)信息、特征、縮略圖等。結(jié)構(gòu)信息是與由圖像結(jié)構(gòu) 分析單元208或再現(xiàn)單元210存儲作為分析結(jié)果的該頁面的結(jié)構(gòu)相關(guān) 聯(lián)的信息。
特征是表達(dá)由圖像特征抽取單元207抽取和存儲、并形成頁面的 圖像的特征的信息。
縮略圖是易于處理的幾個相對小的尺寸的圖像,并且該圖像是通 過對整個頁面的圖像或該頁面中所包括的圖像元素應(yīng)用分辨率轉(zhuǎn)換 (或按比例縮減)獲得的??梢栽诋a(chǎn)生頁面元數(shù)據(jù)805時(shí)產(chǎn)生縮略圖 圖像,或者如果需要它們響應(yīng)外部檢索請求,則可以根據(jù)需要產(chǎn)生縮 略像。并且,產(chǎn)生還未產(chǎn)生的縮略像的任務(wù)可與預(yù)定的批處 理一起被異步執(zhí)行。
頁面內(nèi)容數(shù)據(jù)806是與頁面本身的內(nèi)容對應(yīng)的數(shù)據(jù)。頁面內(nèi)容數(shù) 據(jù)806存儲用于每個頁面的圖像數(shù)據(jù),諸如通過由圖像掃描儀掃描紙 原稿的頁面而獲得的光柵圖像數(shù)據(jù)、通過由再現(xiàn)單元210將代碼文檔 再現(xiàn)成為頁面而獲得的圖像數(shù)據(jù)等。并且,頁面內(nèi)容數(shù)據(jù)806存儲通 過由OCR 209對頁面圖像應(yīng)用字符識別而獲得的文本數(shù)據(jù)、用于通 過由再現(xiàn)單元210再現(xiàn)代碼文檔而獲得的每個頁面的文本信息等。
作業(yè)DB 203包括多個作業(yè)記錄808。作業(yè)記錄808是與由用戶 執(zhí)行的每個分別的文檔處理作業(yè)對應(yīng)的記錄。每個作業(yè)記錄808包括 日期和時(shí)間、操作者、請求源設(shè)備、處理設(shè)備、處理內(nèi)容、處理的文 檔等。日期和時(shí)間是表達(dá)執(zhí)行對應(yīng)作業(yè)的日期和時(shí)間的數(shù)據(jù)。操作者 是詳細(xì)說明已經(jīng)執(zhí)行該作業(yè)的用戶的數(shù)據(jù)。
處理請求源設(shè)備是充當(dāng)作業(yè)執(zhí)行請求源的設(shè)備。例如,當(dāng)個人計(jì) 算機(jī)101將打印作業(yè)發(fā)送至圖像處理設(shè)備110時(shí),請求源設(shè)備是個人 計(jì)算機(jī)101。
處理設(shè)備是實(shí)際處理作業(yè)的設(shè)備。例如,當(dāng)個人計(jì)算機(jī)101將打 印作業(yè)發(fā)送至圖像處理設(shè)備110時(shí),處理設(shè)備是圖像處理設(shè)備110。
處理內(nèi)容是詳細(xì)說明作業(yè)的處理內(nèi)容的信息。處理內(nèi)容包括作業(yè) 類型、以及詳細(xì)說明在進(jìn)行處理時(shí)在每種作業(yè)類型中如何選擇并設(shè)定 各種可選擇的選項(xiàng)和各種可設(shè)定的參數(shù)的信息。
處理文檔是參考信息的列表,該參考信息詳細(xì)說明將要處理的作
為目標(biāo)的作業(yè)的文檔。
一個作業(yè)記錄通常參照多個文檔記錄。例如, 考慮其中執(zhí)行一個作業(yè)以使作為目標(biāo)的多個文檔被處理的情況。
索引DB 204包括多個索引記錄809。每個索引記錄809是用于 從文檔DB 202和作業(yè)DB 203中迅速地檢索數(shù)據(jù)的索引信息,并且參 照多個文檔記錄801和多個作業(yè)記錄808。
索引記錄是由索引產(chǎn)生器211產(chǎn)生的。索引記錄可用于迅速地檢
索包括與給定作為檢索關(guān)鍵的圖像相似的圖像的文檔記錄。并且,索
引記錄可用于在文檔內(nèi)容數(shù)據(jù)和頁面內(nèi)容數(shù)據(jù)中迅速地檢索包括給
定作為檢索關(guān)鍵的文本的文檔記錄。此外,索引記錄可用于迅速地檢 索具有與給定作為檢索關(guān)鍵的條件相匹配的元數(shù)據(jù)的文檔記錄和作
業(yè)記錄。
(檢索處理的序列)
圖9是用于說明檢索處理的序列的流程圖。檢索處理是通過由圖 像處理設(shè)備IIO的CPU 301執(zhí)行的嵌入應(yīng)用程序來實(shí)施的。嵌入應(yīng)用 被稱為文檔檢索應(yīng)用。
當(dāng)用戶選擇例如,操作單元112上的顯示區(qū)701中的"檢索,,按鈕 時(shí),開始一系列的流程的序列。
在步驟S901中,文檔檢索應(yīng)用顯示操作單元112的顯示區(qū)702 上的文檔檢索功能的基本窗口 (檢索窗口 )。該檢索窗口允許用戶設(shè) 定檢索條件、輸入檢索關(guān)鍵、輸入開始檢索指令等。下面將使用圖10 說明該檢索窗口的配置。
在步驟S902中,該應(yīng)用根據(jù)用戶的指令輸入檢索關(guān)鍵圖像。
在步驟S903中,該應(yīng)用根據(jù)用戶的指令輸入其它檢索條件設(shè)定。
在步驟S904中,該應(yīng)用等待來自用戶的開始檢索指令的輸入。 在用戶輸入開始檢索指令之前(S904中為否),處理返回至步驟S902 以重復(fù)輸入檢索關(guān)鍵圖像和其它檢索條件設(shè)定。如果用戶輸入開始檢 索指令(S904中為是),則處理前進(jìn)至步驟S905。
在步驟S905中,應(yīng)用執(zhí)行檢索處理。文檔檢索應(yīng)用建立與在服 務(wù)器系統(tǒng)140上運(yùn)行的作業(yè)存檔應(yīng)用的連接,并將檢索關(guān)鍵和檢索條
件發(fā)送至檢索單元212。該應(yīng)用接收所需數(shù)據(jù)以將與一個或更多文檔 相關(guān)聯(lián)的檢索結(jié)果列表顯示作為由檢索單元212進(jìn)行的檢索結(jié)果,其 中該一個或更多文檔與檢索條件匹配(命中)。相當(dāng)大的數(shù)量的文檔 命中根據(jù)相似圖像檢索和全文本檢索的特征的檢索條件。顯示檢索結(jié) 果顯示的所需數(shù)據(jù)是與所命中的文檔對應(yīng)的文檔記錄中所包括的元 數(shù)據(jù),以及與文檔記錄相關(guān)聯(lián)的作業(yè)記錄中所包括的一些數(shù)據(jù)。
在步驟S906中,該應(yīng)用基于從作業(yè)存檔應(yīng)用接收的信息顯示檢 索結(jié)果列表。將在下文中參考圖ll說明該檢索結(jié)果列表的配置。
在步驟S907中,該應(yīng)用檢查用戶是否輸入縮略圖顯示設(shè)定改變 指令。如果用戶輸入了該指令(S卯7中為是),則該處理前進(jìn)至步驟 S908以改變縮略圖顯示設(shè)定。處理返回至步驟S906。在步驟S906中, 該應(yīng)用基于改變的縮略圖顯示設(shè)定再次顯示檢索結(jié)果列表。
如果在步驟S907中該應(yīng)用確定用戶沒有輸入任何縮略圖顯示設(shè) 定改變指令(S907中為否),則該處理前進(jìn)至步驟S909。
在步驟S909中,該應(yīng)用檢查用戶是否輸入文檔記錄過濾器改變 指令。如果用戶輸入了該指令(S卯9中為是),則該處理前進(jìn)至步驟 S910以改變文檔記錄過濾器。然后,該處理返回至步驟S卯6,以基 于改變的文檔記錄過濾器再次顯示檢索結(jié)果列表。
如果在步驟S909中該應(yīng)用確定用戶沒有輸入任何文檔記錄過濾 器改變指令(S909中為否),則該處理前進(jìn)至步驟S911。
在步驟S911中,該應(yīng)用檢查用戶是否輸入文檔或頁面的詳細(xì)項(xiàng) 目顯示指令。如果用戶輸入了該指令(S911中為是),則該處理前進(jìn) 至步驟S912以顯示窗口,該窗口顯示與所選文檔、頁面或作業(yè)相關(guān) 聯(lián)的詳細(xì)信息。在用戶關(guān)閉詳細(xì)項(xiàng)目顯示窗口之后,該處理返回至步 驟S906以再次顯示檢索結(jié)果列表。
如果在步驟S911中該應(yīng)用確定用戶沒有輸入4壬何詳細(xì)項(xiàng)目顯示 指令(S911中為否),則該處理前進(jìn)至步驟S913。
在步驟S913中,該應(yīng)用檢查用戶是否對文檔記錄輸入操作指令。 允許對在列表中顯示的文檔記錄進(jìn)行的操作包括打印、保存、發(fā)送、 附加標(biāo)簽、檢索并顯示相關(guān)文檔、標(biāo)記等。如果用戶輸入該指令(S913 中為是),則該處理前進(jìn)至步驟S914以執(zhí)行與所選指令對應(yīng)的文檔 記錄操作。該處理返回至步驟S906以再次顯示檢索結(jié)果列表。
如果在步驟S913中該應(yīng)用確定用戶沒有輸入任何文檔操作指令 (S913中為否),則該處理前進(jìn)至步驟S915。
在步驟S915中,該應(yīng)用檢查用戶是否輸入再次檢索指令。如果 用戶沒有輸入任何再次檢索指令(S915中為否),則該處理返回至步 驟S906以再次顯示檢索結(jié)果列表。如果在步驟S915中,該應(yīng)用確定 用戶輸入了再次檢索指令(S915中為是),則該處理返回至步驟S901 以再次執(zhí)行一系列檢索處理。
要注意的是,信息處理設(shè)備101可執(zhí)行一系列序列處理??商娲?地, 一系列處理是可分開的,并且可將執(zhí)行各個處理的軟件程序安裝 于多個設(shè)備之上,并由該多個設(shè)備執(zhí)行以形成分布式應(yīng)用。例如,可 在圖像處理設(shè)備110上執(zhí)行檢索窗口和檢索結(jié)果列表的顯示、以及來 自用戶的指令輸入。從而,可在信息處理設(shè)備IOI、服務(wù)器系統(tǒng)140、 其它圖像處理設(shè)備120和130等上執(zhí)行其它處理。
相反地,可在信息處理設(shè)備101上執(zhí)行檢索窗口和檢索結(jié)果列表 的顯示、以及來自用戶的指令輸入,而在圖像處理設(shè)備110和服務(wù)器 系統(tǒng)140上執(zhí)行其它處理。當(dāng)用戶在信息處理設(shè)備IOI上操作文檔檢 索應(yīng)用時(shí),對于用戶,在紙?jiān)迳陷斎胱鳛闄z索關(guān)鍵圖像的圖像比在 包括掃描儀113的圖像處理設(shè)備110上的操作更不方便。在這樣的情 況下,因?yàn)橛脩艨蓮男畔⑻幚碓O(shè)備101、另一個圖像處理設(shè)備120等 操作由圖像處理設(shè)備IIO的箱功能預(yù)先存儲的圖像,所以用戶可容易 地使用從箱選擇的作為檢索關(guān)鍵圖像的圖像。
作為形成分布式應(yīng)用的方法之一,可利用由網(wǎng)絡(luò)瀏覽器和網(wǎng)絡(luò)服 務(wù)器的組合來實(shí)現(xiàn)的基于網(wǎng)絡(luò)的應(yīng)用的形式。 (文檔檢索窗口的配置示例)
圖10示出了作為文檔檢索應(yīng)用的基本窗口的文檔檢索窗口的配 置的示例。將文檔檢索窗口 1000用作文檔檢索應(yīng)用的基本窗口。在
本實(shí)施例中,文檔檢索應(yīng)用在操作單元112的顯示區(qū)702上顯示文檔 檢索窗口。文檔檢索窗口 1000包括檢索條件設(shè)定區(qū)1001、檢索關(guān)鍵 圖像輸入?yún)^(qū)1002、以及檢索開始指令區(qū)1003。
檢索條件設(shè)定區(qū)1001允許用戶設(shè)定并確認(rèn)檢索條件。
檢索條件單選按鈕1004允許用戶選擇基本檢索條件并確認(rèn)所選 設(shè)定。選項(xiàng)"包括所有關(guān)鍵,,指示命中所有設(shè)定檢索關(guān)鍵的文檔的檢 索。選項(xiàng)"包括一些關(guān)鍵,,指示命中一些設(shè)定檢索關(guān)鍵的文檔的檢索。 選項(xiàng)"高級檢索"指示命中在按下檢索選項(xiàng)按鈕1005時(shí)設(shè)定的詳細(xì)檢 索條件的文檔的檢索。
檢索選項(xiàng)按鈕1005允許用戶打開用于設(shè)定詳細(xì)檢索條件的窗 口。詳細(xì)檢索條件設(shè)定包括高級檢索條件設(shè)定,該高級檢索條件設(shè)定 用作用于在高級檢索模式中執(zhí)行檢索時(shí)確定命中文檔的標(biāo)準(zhǔn)。作為詳 細(xì)檢索條件的選項(xiàng),可設(shè)定一起使用元數(shù)據(jù)檢索和全文本檢索的條 件,以與相似圖像檢索一起使用。
元數(shù)據(jù)檢索是對于存儲在與對應(yīng)于給定文檔的文檔記錄801相 關(guān)聯(lián)的文檔元數(shù)據(jù)、 一組頁面元數(shù)據(jù)805、以及對應(yīng)作業(yè)記錄808中 的各個數(shù)據(jù)項(xiàng)目指定檢索條件的檢索方法。元數(shù)據(jù)檢索允許基于標(biāo) 簽、文檔名稱、所有者、創(chuàng)建日期、數(shù)據(jù)格式、頁面數(shù)量、標(biāo)簽和相 關(guān)文檔等指定檢索條件。元數(shù)據(jù)檢索允許基于作業(yè)日志(日期和時(shí)間、 操作者、請求設(shè)備、處理設(shè)備、處理內(nèi)容、以及由該作業(yè)處理過的、 要被處理的其它文檔)、各個頁面的結(jié)構(gòu)信息等指定檢索條件。
因而,除了基于文檔名稱、所有者、創(chuàng)建的日期和時(shí)間、標(biāo)簽等 的普通檢索,還可以基于相關(guān)文檔和文檔的先前檢索的日志來檢索文 檔。
元數(shù)據(jù)檢索允許基于諸如形成文檔的頁面的方向,即,縱向(垂 直延長)或橫向(水平延長)之類的其它標(biāo)準(zhǔn)檢索文檔。并且,元數(shù) 據(jù)檢索允許基于諸如紙張大小、頁面范圍(n頁S頁面數(shù)量〈m頁)、 彩色或單色、圖像和文本的比率等的其它標(biāo)準(zhǔn)檢索文檔。
此外,元數(shù)據(jù)檢索允許基于與作業(yè)相關(guān)聯(lián)的其它標(biāo)準(zhǔn),即該文檔是在何時(shí)、何地、由誰和如何被處理的來檢索文檔。
全文本檢索將文本(字符串)設(shè)定為檢索關(guān)鍵,并在全文本中檢
索包括設(shè)定字符串的文檔。文檔的文本被包括在文檔記錄801中所包 括的文檔內(nèi)容數(shù)據(jù)803中,以及在頁面記錄804中的任何一個中所包 括的頁面內(nèi)容數(shù)據(jù)。
可將文檔元數(shù)據(jù)802或頁面元數(shù)據(jù)805中所包括的文檔數(shù)據(jù)作為 全文本檢索目標(biāo)添加。并且,可采用下述設(shè)定。當(dāng)將與文檔相關(guān)的作 業(yè)記錄808中所包括的文本數(shù)據(jù)作為全文本檢索目標(biāo)添加,并且作業(yè) 記錄808命中時(shí),對應(yīng)的文檔記錄801可命中。
檢索關(guān)鍵圖像輸入?yún)^(qū)1002允許用戶設(shè)定并確認(rèn)要被用作相似圖 像檢索的檢索關(guān)鍵的圖像。
原稿圖像掃描按鈕1006允許用戶使用圖像處理設(shè)備的掃描儀 113掃描紙文檔,并將掃描的圖像作為相似圖像檢索的檢索關(guān)鍵輸入。 在按下原稿圖像掃描按鈕1006時(shí)打開圖像掃描窗口。圖像掃描窗口 允許用戶在圖像處理設(shè)備110的復(fù)制或掃描功能、基于TWAIN等的 普通掃描儀裝置驅(qū)動程序的功能等中進(jìn)行原稿掃描設(shè)定,并設(shè)定原稿 掃描參數(shù)。
在按下啟動鍵505時(shí),根據(jù)設(shè)定的原稿掃描參數(shù)掃描原稿圖像, 并且將掃描的圖像數(shù)據(jù)作為檢索關(guān)鍵圖像輸入。在完成原稿圖像掃描 時(shí),如果圖像掃描窗口是打開的,則將其關(guān)閉。在按下啟動鍵505而 沒有按下原稿圖像掃描按鈕1006時(shí),根據(jù)默認(rèn)原稿掃描參數(shù)或目前 設(shè)定的掃描參數(shù)掃描原稿圖像。
箱圖像選擇按鈕1007允許用戶使用圖像處理設(shè)備110的箱功能 從預(yù)存儲的文檔中選擇檢索關(guān)鍵圖像。箱功能允許用戶瀏覽圖像處理 設(shè)備110的HDD 304的內(nèi)容,并選擇包括他或她想要用作檢索關(guān)鍵 圖像的圖像的文檔。
并且,用戶可經(jīng)由LAN IOO通過訪問并瀏覽其它圖像處理設(shè)備 120和130的HDD、或由信息處理設(shè)備101和102^>開的共享文件系 統(tǒng)的內(nèi)容來選擇包括他或她想要用作檢索關(guān)鍵圖像的圖像的文檔。可
替代地,用戶可通過訪問并瀏覽由服務(wù)器系統(tǒng)140提供的共享文件系 統(tǒng)、數(shù)據(jù)庫系統(tǒng)等的文檔文件來選擇包括他或她想要用作檢索關(guān)鍵圖 像的圖像的文檔。
檢索關(guān)鍵圖像設(shè)定區(qū)1008允許用戶確認(rèn)并操作設(shè)定的檢索關(guān)鍵圖像。
檢索關(guān)鍵圖像設(shè)定條件消息1009指示檢索關(guān)鍵圖像的設(shè)定條 件,并顯示設(shè)定的檢索關(guān)鍵圖像的數(shù)量等。
檢索關(guān)鍵圖像顯示區(qū)IOIO顯示設(shè)定的檢索關(guān)鍵圖像組。該區(qū)顯 示與設(shè)定為檢索關(guān)鍵的圖像對應(yīng)的一組并列檢索關(guān)鍵圖標(biāo)。當(dāng)用戶使 用原稿圖像掃描按鈕1006或箱圖像選擇按鈕1007輸入檢索關(guān)鍵圖像 時(shí),對其添加對應(yīng)的檢索關(guān)鍵圖標(biāo)。
檢索關(guān)鍵圖標(biāo)1011與一個檢索關(guān)鍵圖像對應(yīng)。用戶可由此對檢 索關(guān)鍵圖像輸入各種指令。
檢索關(guān)鍵ID 1012是用于指定檢索關(guān)鍵圖像的識別信息(識別符)。
檢索關(guān)鍵縮略圖1013是檢索關(guān)鍵圖像的縮略圖。在按下檢索關(guān) 鍵縮略圖1013時(shí),打開圖像查看器窗口并以比縮略圖大的尺寸顯示 檢索關(guān)鍵圖像。利用圖像查看器窗口,用戶可確認(rèn)檢索關(guān)鍵圖像的詳 情。
檢索關(guān)鍵概要1014是檢索關(guān)鍵圖像的簡要說明。 檢索關(guān)鍵詳情按鈕1015允許用戶確認(rèn)關(guān)于檢索關(guān)鍵圖像的詳細(xì) 信息。在檢索關(guān)鍵詳情按鈕1015操作時(shí),打開比檢索關(guān)鍵概要1014 更詳細(xì)地顯示關(guān)于檢索關(guān)鍵的信息的檢索關(guān)鍵詳情窗口。檢索關(guān)鍵詳 情窗口還允許用戶設(shè)定對檢索關(guān)鍵圖像唯一的檢索條件。為了在未來 的檢索中再次使用該檢索關(guān)鍵,用戶可將檢索關(guān)鍵圖像保存在箱中。
檢索關(guān)鍵編輯按鈕1016允許用戶編輯檢索關(guān)鍵圖像。在檢索關(guān) 鍵編輯按鈕1016操作時(shí),可打開用于編輯檢索關(guān)鍵圖像的檢索關(guān)鍵 編輯窗口。檢索關(guān)鍵編輯窗口允許用戶通過對檢索關(guān)鍵圖像應(yīng)用諸如 修整、遮蔽(masking)、噪聲去除之類的各種圖像處理獲得所需的 編輯過的檢索關(guān)鍵圖像。用戶可將檢索關(guān)鍵圖像分為多個檢索關(guān)鍵圖 像。用戶可將與包括多個頁面圖像的文檔對應(yīng)的一個檢索關(guān)鍵分成為 與各個頁面圖像對應(yīng)的檢索關(guān)鍵圖像。
檢索關(guān)鍵刪除按鈕1017允許用戶從一組檢索關(guān)鍵中移除檢索關(guān) 鍵圖像。檢索開始指令區(qū)1003允許用戶激活檢索處理。
檢索啟動按鈕1018允許用戶啟動檢索處理。在按下檢索啟動按 鈕1018時(shí),使用檢索條件設(shè)定區(qū)1001上的檢索條件和檢索關(guān)鍵圖像 輸入?yún)^(qū)1002上的檢索關(guān)鍵圖像,對服務(wù)器系統(tǒng)140的作業(yè)存檔應(yīng)用 發(fā)出檢索處理請求。
(文檔檢索結(jié)果列表窗口的配置示例)
圖11示出了文檔檢索應(yīng)用的文檔檢索結(jié)果列表窗口的配置的示 例。文檔檢索結(jié)果列表窗口 1100是一個窗口的示例,當(dāng)文檔檢索應(yīng) 用從作業(yè)存檔應(yīng)用接收到檢索處理請求的響應(yīng)時(shí),該窗口顯示檢索結(jié) 果。本實(shí)施例的文檔檢索應(yīng)用在操作單元112的顯示區(qū)702上顯示文 檔檢索結(jié)果列表窗口。文檔檢索結(jié)果列表窗口 1100包括列表操作區(qū) 1101、檢索列表顯示區(qū)1102、滾動條1103。
檢索列表操作區(qū)1101是用于控制檢索結(jié)果列表的顯示的操作設(shè) 定區(qū)。顯示過濾顯示區(qū)域1104顯示應(yīng)用于作為檢索結(jié)果命中的多個 文檔的顯示過濾器,以便留下當(dāng)前顯示在檢索列表顯示區(qū)1102上的 文檔組。圖11示出了其中窗口顯示作為檢索結(jié)果命中的"所有文檔,, 狀態(tài)。
窗口能顯示從服務(wù)器系統(tǒng)140的檢索單元212接收的所有命中文 檔(即,沒有過濾的)、或根據(jù)用于縮小結(jié)果的顯示過濾器設(shè)定的條 件通過過濾命中文檔而獲得的文檔。
顯示過濾器設(shè)定按鈕(過濾器)1105允許用戶設(shè)定顯示過濾器 條件。在按下顯示過濾器設(shè)定按鈕1105時(shí),打開顯示過濾器設(shè)定窗 口以提示用戶設(shè)定所需過濾器條件。用戶可基于命中文檔的文檔記錄 801中所包括的各種信息來設(shè)定條件作為過濾器條件。并且,用戶可 將條件設(shè)定為用于存儲在文檔元數(shù)據(jù)802、命中頁面的頁面記錄804 的頁面元數(shù)據(jù)805、與該文檔相關(guān)聯(lián)的作業(yè)記錄808等中的各條信息 的圖案匹配條件。換句話說,用戶可設(shè)定與他或她基于按下檢索選項(xiàng) 按鈕1005設(shè)定的詳細(xì)檢索選項(xiàng)相似的過濾器條件。
例如,除了基于文檔名稱、創(chuàng)建的日期和時(shí)間、標(biāo)簽等的普通過 濾之外,用戶還可基于相關(guān)文檔和該文檔先前檢索的日志設(shè)定過濾。
用于縮小結(jié)果的顯示過濾器設(shè)定條件。并且,用戶可基于諸如形成文 檔的頁面的方向,即,縱向(垂直延伸)或橫向(水平延伸),之類 的其它標(biāo)準(zhǔn)來設(shè)定過濾。此外,用戶可基于諸如紙張大小、頁面范圍 (n頁S頁面數(shù)量〈m頁)、顏色、灰度(連續(xù)色調(diào)圖像)、或單色二 值圖像(二值圖像)、圖像和文本的比率之類的其它標(biāo)準(zhǔn)來設(shè)定過濾。 此外,用戶可基于與作業(yè)相關(guān)聯(lián)的其它標(biāo)準(zhǔn),即,該文檔是何時(shí)、何 地、由誰、和如何被處理的來設(shè)定過濾。
根據(jù)實(shí)施例,不僅在檢索列表顯示區(qū)1102上顯示作為檢索結(jié)果
的所有命中的文檔,還可以設(shè)定抽取滿足特定條件的文檔、并且將所 抽取的文檔顯示為列表的過濾器。此外,當(dāng)用戶改變設(shè)定時(shí),更新檢
索結(jié)果列表的內(nèi)容。從而,用戶可從大數(shù)量的備選文檔中容易地檢索
所需文檔。
顯示項(xiàng)目設(shè)定區(qū)1106在將命中文檔作為檢索結(jié)果顯示在檢索列 表顯示區(qū)1102上時(shí),控制每個文檔要被顯示的項(xiàng)目。每次用戶在復(fù) 選框上進(jìn)行選取或點(diǎn)擊指定給該復(fù)選框的標(biāo)記字符串時(shí),復(fù)選框的已 選和未選狀態(tài)可被交替切換。當(dāng)用戶選擇"顯示屬性信息"復(fù)選框時(shí), 諸如文檔名稱、數(shù)據(jù)格式、頁面數(shù)量、文檔位置信息之類的與文檔相 關(guān)聯(lián)的元數(shù)據(jù)被顯示在檢索列表顯示區(qū)1102上。當(dāng)用戶選擇"顯示縮 略圖,,復(fù)選框時(shí),命中檢索條件的每個頁面的縮略像被顯示在檢 索列表顯示區(qū)1102上。
文檔概要縮略圖設(shè)定區(qū)1107在將命中文檔作為檢索結(jié)果顯示在 檢索列表顯示區(qū)1102上的同時(shí),控制用于每個文檔的要被顯示的文 檔概要縮略圖的顯示格式。當(dāng)用戶在顯示項(xiàng)目設(shè)定區(qū)1106上選擇"顯 示縮略圖"復(fù)選框,以及還選擇"顯示文檔概要縮略圖"復(fù)選框時(shí),顯 示文檔概要縮略圖。文檔概要縮略圖是與形成文檔的頁面對應(yīng)的一對 縮略圖,以便允許用戶在視覺上識別其概要。
文檔概要縮略圖配置設(shè)定區(qū)1108允許用戶設(shè)定形成文檔概要縮 略圖的縮略圖組的配置。在文檔概要縮略圖配置設(shè)定區(qū)1108上,用 于輸入數(shù)值的四個文本輸入?yún)^(qū)域并列,并分別對它們指定"首頁"、"之 前"、"后續(xù),,和"尾頁"標(biāo)記字符串。用戶通過對"首頁"區(qū)域輸入從文 檔的第一頁起要顯示多少頁縮略圖的數(shù)值進(jìn)行設(shè)定。用戶通過對"之 前"區(qū)域輸入在命中檢索條件的頁面之前要顯示多少之前頁縮略圖的 數(shù)值來設(shè)定。用戶通過對"后續(xù),,區(qū)域輸入在命中檢索條件的頁面之后 要顯示多少后續(xù)頁縮略圖的數(shù)值來設(shè)定。用戶通過對"尾頁"區(qū)域輸入 從文檔的最后一頁起要顯示多少頁縮略圖的數(shù)值來設(shè)定。
動畫顯示復(fù)選框1109允許用戶設(shè)定文檔概要縮略圖的動畫顯示。
再次檢索按鈕1110允許用戶返回到文檔檢索窗口 1000。 縮小檢索按鈕1111允許用戶返回到文檔檢索窗口 1000并實(shí)施范 圍更小的縮小再次檢索。用戶從在檢索列表顯示區(qū)1102上顯示的文 檔中標(biāo)記要被添加作為檢索關(guān)鍵的文檔(包括要被添加作為檢索關(guān)鍵 的圖像的文檔),并按下縮小檢索按鈕1111。在按下縮小檢索按鈕 1111時(shí),當(dāng)標(biāo)記的文檔被作為檢索關(guān)鍵添加到檢索關(guān)鍵圖像顯示區(qū) 1010時(shí),再次顯示文檔檢索窗口 1000,并繼續(xù)進(jìn)行縮小再次檢索。
僅通過添加盡可能多的足夠的檢索關(guān)鍵圖像,可以提高所需文檔 的檢索命中率(與設(shè)定條件相匹配的比率),并且可容易地檢索到所 需文檔。通過分析所添加的檢索關(guān)鍵圖像的特征量、并在確定相似度 時(shí)調(diào)整各種特征量的標(biāo)記的分配,可根據(jù)用戶的意向作出相似圖像檢索。
更具體地說,可將由用戶添加的用于縮小檢索的檢索關(guān)鍵圖像從 實(shí)施檢索的用戶的角度確定為具有主觀地高相似度的樣本圖像。因
而,用戶可通過將多個特征量和相似度確i^算法組合來調(diào)整標(biāo)記的分
配,以便更高地評估檢索關(guān)鍵圖像的相似度。例如,當(dāng)在原稿檢索關(guān) 鍵圖像和添加的檢索關(guān)鍵圖像之間,基于形狀的相似度很高,而基于 色彩的相似度很低時(shí),可實(shí)施縮小檢索,以將基于形狀的相似度取為 優(yōu)先于基于色彩的相似度。反之,可作出適合的調(diào)整以實(shí)施色彩優(yōu)先 檢索、彩色圖案優(yōu)先檢索、對象樹型結(jié)構(gòu)相似度優(yōu)先檢索等。
檢索列表顯示區(qū)1102顯示與檢索條件匹配的文檔列表作為檢索 結(jié)果。檢索命中文檔顯示區(qū)1112、 1113、 1114和1115分別顯示與和 檢索條件和縮小條件相匹配的文檔對應(yīng)的信息。在默認(rèn)設(shè)定中,將具 有更高命中率(與設(shè)定條件相匹配的比率)的文檔顯示在列表的更高 級別位置。在相同的命中率(與設(shè)定條件匹配的比率)的情況下,將具 有通過數(shù)字評估文檔值而獲得的更高文檔級別的文檔顯示在更高級 別位置。用戶可通過以與默認(rèn)順序不同的順序?qū)ξ臋n分類來再次顯示 文檔列表,其中可通過按下顯示過濾器設(shè)定按鈕1105來以與默認(rèn)順 序不同的順序進(jìn)行文檔分類。例如,可基于諸如創(chuàng)建日期、最后參考 日期、數(shù)據(jù)格式、頁面數(shù)量、每個文檔的信息的位置、用于該文檔的 作業(yè)的日期、設(shè)備、處理內(nèi)容之類的與文檔相關(guān)聯(lián)的各種元數(shù)據(jù),以 升序或降序顯示文檔。當(dāng)用戶再次設(shè)定文檔列表的顯示順序時(shí),迅速 地更新該列表顯示。
將在下文中簡要說明基于默認(rèn)顯示順序的文檔命中率(與設(shè)定條 件匹配的比率)。相似圖像檢索基于對單獨(dú)算法唯一的相似度。 一般 來講,相似度是表達(dá)"相似程度"的連續(xù)量,而不是二進(jìn)制值"相似"或 "不相似"。然而,基于實(shí)施例的實(shí)現(xiàn),將其相似度低于預(yù)定閾值的圖 像處理為"不相似"。對于其相似度高于預(yù)定閾值的圖像,可將具有相 對高相似度的圖像與具有低相似度的圖像區(qū)別開?;诮o定檢索條件 中所包括的檢索關(guān)鍵圖像與要被檢索的文檔數(shù)據(jù)中所包括的圖像之 間的相似度確認(rèn)結(jié)果來計(jì)算命中率(與設(shè)定條件匹配的比率)。也就 是說,包括具有高相似度的圖像的文檔的命中率被計(jì)算為高于包括具 有低相似度的圖像的文檔的命中率。
由于可指定多個檢索關(guān)鍵,將與更大數(shù)量的檢索條件相匹配的文
高。當(dāng)指定相似圖像檢索的多個檢索關(guān)鍵圖像時(shí),如果文檔包括具有 高相似度的大數(shù)量的圖像,則其命中率變得很高。當(dāng)在選擇"包括所 有關(guān)鍵,,單選按鈕同時(shí)實(shí)施檢索時(shí),確定沒有命中,除非該文檔與所 有給定檢索關(guān)鍵相匹配。
下面將說明基于默認(rèn)顯示順序的文檔等級。將文檔等級作為表示 文檔的語義重要性的索引來計(jì)算。文檔等級基于明確指定作為文檔的 元數(shù)據(jù)的重要性?;谥T如秘密程度、所有者、作者、位置、頁面數(shù) 量之類的文檔屬性來計(jì)算文檔等級。此外,還可以基于后來附加于文 檔的標(biāo)簽的數(shù)量和類型、參考的次數(shù)、相關(guān)文檔的相互參照關(guān)系的網(wǎng) 絡(luò)等來計(jì)算文檔等級。
由于文檔等級基于相關(guān)文檔的相互參照關(guān)系的網(wǎng)絡(luò),因此從具有
更高文檔等級的許多文檔參考的文檔的文檔等級被計(jì)算為相對高。具 有指示與具有高文檔等級的文檔被同時(shí)處理(即,它們被同時(shí)打印、
發(fā)送、保存或檢索,它們的作業(yè)被組合等)的日志的文檔的文檔等級 被計(jì)算為相對高。
通過使檢索列表顯示區(qū)1102上顯示的文檔中在較低等級的文檔 的檢索命中文檔顯示狀態(tài)比較高等級的文檔的顯示狀態(tài)更簡單,或減
小它們的顯示尺寸,可增加在一個窗口內(nèi)顯示的文檔的總數(shù)量。
根據(jù)實(shí)施例,在默認(rèn)設(shè)定下,可基于命中率的順序、文檔等級的 順序、附加到文檔的元數(shù)據(jù)的順序、用于文檔的執(zhí)行的作業(yè)的順序等 將文檔列表分類并顯示。此外,當(dāng)再次設(shè)定文檔列表的顯示順序時(shí), 立即更新列表顯示。從而,可從大量的備選文檔中容易地檢索所需文 檔。
滾動條1103允許用戶滾動文檔檢索結(jié)果列表窗口 1100。在許多 情況下,由于檢索列表顯示區(qū)1102顯示大數(shù)量的文檔,所以那些文 檔沒有正常地落于操作單元112的LCD顯示單元501的顯示區(qū)之內(nèi)。 用戶可通過在滾動窗口的同時(shí)瀏覽文檔來找出所需文檔。要注意的 是,可將用于翻頁等的按鈕(未示出)分配在例如,檢索列表顯示區(qū)1102的最下方部分,并且可將檢索結(jié)果文檔的列表分為要被顯示的多 個頁面。
要注意的是,當(dāng)按下分配在例如檢索列表顯示區(qū)1102的最下方 部分的列表打印按鈕(未示出)時(shí),打印出文檔檢索結(jié)果。在有限的 顯示區(qū)之內(nèi)顯示盡可能最大數(shù)量的文檔的列表的需要、和允許用戶通 過在視覺上比較盡可能詳細(xì)的文檔概要縮略圖來選擇所需文檔的需 要是難以同時(shí)滿足的竟?fàn)幮缘男枰H欢?,根?jù)本實(shí)施例,由于可立 即打印出文檔檢索結(jié)果列表,所以用戶可使用具有比觸摸板顯示器 502更高的分辨率和瀏覽率(browsability)的輸出紙張來檢索所需文 檔。
(檢索命中文檔顯示的示例)
圖11所示的檢索命中文檔顯示區(qū)1112、 1113、 1114和1115被 配置為具有相同顯示格式。在窗口上實(shí)際顯示指示文檔的對應(yīng)元數(shù)據(jù) 的實(shí)際值的斜體字符串。有下劃線的字符串允許在按下其顯示區(qū)域時(shí) 打開對應(yīng)的詳細(xì)信息顯示窗口,并允許用戶確認(rèn)其詳細(xì)信息。
圖12示出了作為檢索命中文檔顯示區(qū)的示例的檢索命中文檔顯 示區(qū)1112。數(shù)據(jù)格式圖標(biāo)1201被用于顯示對應(yīng)文檔的數(shù)據(jù)格式。"文 檔名稱"1202是用于顯示對應(yīng)文檔的文檔名稱的字符串。"數(shù)據(jù)格 式"1203是用于顯示對應(yīng)文檔的數(shù)據(jù)格式的字符串。"頁面數(shù)量"1204 是用于顯示對應(yīng)文檔的頁面數(shù)量的字符串。"文檔位置信息"1205是用 于詳細(xì)說明諸如保存對應(yīng)文檔的文件服務(wù)器之類的存儲位置(地點(diǎn)) 的字符串。文檔位置信息是由URI或文件服務(wù)器及其文件系統(tǒng)中的文 件路徑字符串識別的。在由作業(yè)存檔系統(tǒng)累積文檔的情況下,可顯示 其中保存由作業(yè)存檔系統(tǒng)的作業(yè)收集的將被處理的文檔的副本數(shù)據(jù) 的位置??商娲兀?dāng)指定要被處理的文檔的原稿數(shù)據(jù)的位置時(shí),可 顯示該位置。
"日志信息"1206是用于表達(dá)預(yù)先應(yīng)用于作為要被處理的對象的 對應(yīng)文檔的作業(yè)處理、檢索等的日志的字符串。用戶可確認(rèn)指示該文 檔是何時(shí)、由誰、通過何種處理,并且由那個設(shè)備處理的日志信息。 "頁面"1207是用于表達(dá)命中形成對應(yīng)文檔的檢索關(guān)鍵的條件的 頁面的頁面數(shù)量的字符串。
命中頁面縮略圖1208是用于顯示命中形成對應(yīng)文檔的檢索關(guān)鍵 的條件的頁面或圖像元素的概況的縮略像。
首頁縮略圖1209是用于顯示對應(yīng)文檔的首頁的概況的縮略 像。編號與在文檔概要縮略圖配置設(shè)定區(qū)1108上設(shè)定的頁面的數(shù)量 一樣多的縮略像被顯示成行。
之前頁面縮略圖1210是用于表達(dá)命中檢索關(guān)鍵的頁面之前的頁 面的概況的縮略像。編號與在文檔概要縮略圖配置設(shè)定區(qū)1108 上設(shè)定的頁面的數(shù)量一樣多的縮略像被顯示成行。后續(xù)頁面縮略 圖1211是用于表達(dá)命中檢索關(guān)鍵的頁面之后的頁面的概況的縮略圖 圖像。編號與在文檔概要縮略圖配置設(shè)定區(qū)1108上設(shè)定的頁面的數(shù) 量一樣多的縮略像被顯示成行。尾頁縮略圖1212是用于表達(dá)對 應(yīng)文檔的尾頁的概況的縮略像。編號與在文檔概要縮略圖配置設(shè) 定區(qū)1108上設(shè)定的頁面的數(shù)量一樣多的縮略像被顯示成行。根 據(jù)實(shí)施例,以大尺寸顯示命中頁面縮略圖1208,并且以小于命中頁面 縮略圖1208的尺寸顯示其它頁面的縮略圖。根據(jù)目前的配置,用戶 可明確地識別命中的頁面。
在有限的顯示區(qū)之內(nèi)顯示盡可能最大數(shù)量的文檔的需要、和允許 用戶通過在視覺上比較盡可能詳細(xì)的文檔概要縮略圖來選擇所需文 檔的需要是難以同時(shí)滿足的竟?fàn)幮缘男枰?。然而,根?jù)本發(fā)明,由于 用戶可容易地改變將在文檔概要縮略圖中顯示的頁面配置、和頁面數(shù) 量,他或她可容易地檢索所需文檔。
當(dāng)要在文檔概要縮略圖內(nèi)顯示非常大的數(shù)量的頁面時(shí),顯示具有 更高縮減比例的小縮略圖以使其落于有限的顯示區(qū)之內(nèi),從而調(diào)整檢 索結(jié)果的顯示。可替代地,可如下控制顯示。也就是說,以更小的尺 寸顯示具有相對更低的優(yōu)先級的頁面的縮略圖,或如此布局縮略圖以 使之前頁面部分地重疊在后續(xù)頁面之上??商娲?,可通過省略檢索 結(jié)果的一些信息調(diào)整檢索結(jié)果的顯示,以使其落于有限的顯示區(qū)之 內(nèi)。
當(dāng)顯示區(qū)不夠大時(shí),可根據(jù)下述算法選擇優(yōu)選地顯示在文檔概要 縮略圖中的具有高優(yōu)先級的頁面。也就是說,可使用當(dāng)頁面命中相似 圖像檢索的條件時(shí),優(yōu)選地選擇文檔的更年輕的頁面,優(yōu)選地選擇命 中更早指定的檢索關(guān)鍵的頁面,或優(yōu)選地選擇具有更高相似度的頁面 的算法。
打印按鈕1213允許用戶使用打印功能打印出對應(yīng)文檔。保存按 鈕1214允許用戶將對應(yīng)文檔保存在箱功能中。發(fā)送按鈕1215允許用 戶通過發(fā)送功能發(fā)送對應(yīng)文檔。
"附加標(biāo)簽,,按鈕1216允許用戶操作對應(yīng)文檔的標(biāo)簽。當(dāng)按下"附 加標(biāo)簽,,按鈕1216時(shí),打開文檔標(biāo)簽窗口,并且用戶可瀏覽并編輯已 為對應(yīng)文檔設(shè)定的標(biāo)簽并能另外登記新的任意標(biāo)簽。
相關(guān)文檔按鈕1217允許用戶操作并設(shè)定與對應(yīng)文檔相關(guān)的文檔 (相關(guān)文檔)。當(dāng)按下相關(guān)文檔按鈕1217時(shí),打開相關(guān)文檔窗口,并且 用戶可瀏覽并編輯與對應(yīng)文檔相關(guān)的相關(guān)文檔。并且,用戶可使其它 文檔與對應(yīng)文檔相關(guān),并將它們登記為相關(guān)文檔。
"標(biāo)記"復(fù)選框(標(biāo)記)1218允許用戶標(biāo)記對應(yīng)文檔。當(dāng)用戶想 要選擇性地操作顯示在列表上的一些文檔時(shí),他或她可操作在選定狀 態(tài)具有復(fù)選框的每個文檔。例如,當(dāng)用戶將"標(biāo)記"復(fù)選框1218設(shè)為 已選狀態(tài),然后按下縮小檢索按鈕1111時(shí),在將標(biāo)記的(所選)文 檔添加到檢索關(guān)鍵的同時(shí)實(shí)施再次檢索。
根據(jù)實(shí)施例,使用文檔概要縮略圖,用戶不僅可識別命中檢索條 件的頁面,還可以一眼識別文檔的頁面和全局圖像的上下文,因此他 或她可容易地從列表中檢索所需文檔。
(包括多個命中頁面的文檔的顯示)
圖13示出了包括多個命中頁面的文檔的檢索命中文檔顯示區(qū)的 示例。相同的附圖標(biāo)記表示上述顯示項(xiàng)目,并且將避免對其的重復(fù)說 明。由于相似圖像檢索基于連續(xù)的相似度,因此一個文檔中所包括的 多個相似圖像都可能命中檢索條件。由于在設(shè)定多個檢索關(guān)鍵和條件同時(shí)可實(shí)施檢索,因此一個文檔中的多個頁面都可能命中檢索條件。
圖13示出了與其中兩個命中頁面縮略圖1208和1302命中檢索條件 的文檔相關(guān)聯(lián)的顯示示例。
"頁面"1301是用于顯示命中形成對應(yīng)文檔的那些頁面的檢索關(guān) 鍵的條件的第二頁面的頁面數(shù)量的字符串。命中頁面縮略圖1302是 用于顯示命中檢索關(guān)鍵的條件的第二頁面的概況的縮略像。
之前頁面縮略圖1303是用于表達(dá)在命中檢索關(guān)鍵的第二頁面之 前的頁面的概況的縮略像。編號與在文檔概要縮略圖配置設(shè)定區(qū) 1108上設(shè)定的頁面的數(shù)量一樣多的縮略像被顯示成行。
后續(xù)頁面縮略圖1304是用于表達(dá)在命中檢索關(guān)鍵的頁面之后的 頁面的概況的縮略像。編號與在文檔概要縮略圖配置設(shè)定區(qū)1108 上設(shè)定的頁面的數(shù)量一樣多的縮略像被顯示成行。
在有限的顯示區(qū)之內(nèi)顯示盡可能最大數(shù)量的文檔的列表的需要、 和允許用戶通過在視覺上比較盡可能詳細(xì)的文檔概要縮略圖來選擇 所需文檔的需要是難以同時(shí)滿足的竟?fàn)幮缘男枰?。然而,根?jù)本實(shí)施 例,由于用戶可容易地改變將在文檔概要縮略圖中顯示的頁面配置和 頁面數(shù)量,他或她可容易地檢索所需文檔。
如圖12所示,在圖13的顯示示例中,顯示具有更高的縮減比例 的小縮略圖,以使其落于有限的顯示區(qū)之內(nèi),從而調(diào)整檢索結(jié)果的顯 示??商娲?,可如下控制顯示。也就是說,以更小的尺寸顯示具有 相對更低的優(yōu)先級的頁面的縮略圖,或如此布局縮略圖以使之前頁面 部分地重疊在后續(xù)頁面之上??商娲?,可通過省略檢索結(jié)果的一些 信息調(diào)整檢索結(jié)果的顯示,以使其落于有限的顯示區(qū)之內(nèi)。
當(dāng)顯示區(qū)不夠大時(shí),對于文檔概要縮略像設(shè)定優(yōu)先級。根據(jù) 下述算法,可選擇具有高優(yōu)先級的頁面。也就是說,可使用當(dāng)頁面命 中相似圖像檢索的條件時(shí),優(yōu)選地選擇文檔的更年輕的頁面,優(yōu)選地 選擇命中更早指定的檢索關(guān)鍵的頁面,或優(yōu)選地選擇具有更高相似度的頁面的算法。
(文檔概要縮略圖的動畫顯示的示例)圖14示出了文檔概要縮略圖的動畫顯示示例。當(dāng)動畫顯示復(fù)選 框1109處于選定狀態(tài)中時(shí),自動動畫顯示檢索命中文檔顯示區(qū)1112、 1113、 1114和1115中的文檔概要縮略圖。
首頁縮略圖1209是用于顯示對應(yīng)文檔的首頁的概況的縮略 像。編號與在文檔概要縮略圖配置設(shè)定區(qū)1108上設(shè)定的頁面的數(shù)量 一樣多的縮略像被顯示成行。在這種情況下,當(dāng)用戶設(shè)定"四個 頁面,,時(shí),將文檔的第一頁面縮略圖1209、以及文檔接下來的第二到 第四頁面的縮略圖1401a、 1401b和1401c顯示成行。在表示檢索文 檔數(shù)據(jù)的內(nèi)容的縮略像中,在相對其它縮略像的前面的位置 并且在放大的狀態(tài)下,依次自動地顯示各個頁面的縮略圖1209和 1401a到1401c中的每一個(動畫顯示)。通過像翻頁一樣使縮略圖 進(jìn)行動畫,可通過使用小顯示區(qū)表達(dá)文檔中的大數(shù)量的頁面的上下文 和概況。
之前頁面縮略圖1210a、 1210b和1210c是用于表達(dá)命中檢索關(guān) 鍵的頁面之前的頁面的概況的縮略像。與在文檔概要縮略圖配置 設(shè)定區(qū)1108上設(shè)定的頁面的數(shù)量一樣多的縮略像被顯示成行。 圖14示出了其中用戶設(shè)定"三個頁面,,的狀態(tài)。
命中頁面縮略圖1208是用于表達(dá)命中形成對應(yīng)文檔的頁面的檢 索關(guān)鍵的條件的頁面的概況的縮略像。
后續(xù)頁面縮略圖1211a、 1211b和1211c是用于表達(dá)在命中檢索 關(guān)鍵的頁面之后的頁面的概況的縮略像。與在文檔概要縮略圖配 置設(shè)定區(qū)1108上設(shè)定的頁面的數(shù)量一樣多的縮略像被顯示成行。 圖14示出了其中用戶設(shè)定"三個頁面"的狀態(tài)。
在相對其它縮略像的前面的位置并且在放大的狀態(tài)下,依次 自動地顯示各個頁面的縮略圖1210a到1210c、1208和1211a到1211c 中的每一個。通過像翻頁一樣使縮略圖進(jìn)行動畫,可通過使用小顯示 區(qū)表達(dá)文檔中的大數(shù)量的頁面的上下文和概況。
尾頁縮略圖1212是用于顯示對應(yīng)文檔的尾頁的概況的縮略 像。編號與在文檔概要縮略圖配置設(shè)定區(qū)1108上設(shè)定的頁面的數(shù)量 一樣多的縮略像被顯示成行。在這種情況下,當(dāng)用戶設(shè)定"四個
頁面"時(shí),將文檔的最后一頁頁面縮略圖1212、以及從文檔的最后一 頁計(jì)數(shù)的第二到第四頁面的縮略圖1402a、 1402b和1402c顯示成行。 在相對其它縮略像的前面的位置并且在放大的狀態(tài)下,依次自動 地顯示各個頁面的縮略圖1402a到1402c和1212中的每一個(動畫 顯示)。通過像翻頁一樣使縮略圖進(jìn)行動畫,可通過使用小顯示區(qū)表 達(dá)文檔中的大數(shù)量的頁面的上下文和概況。
在有限的顯示區(qū)之內(nèi)顯示盡可能最大數(shù)量的文檔的列表的需要、 和允許用戶通過在視覺上比較盡可能詳細(xì)的文檔概要縮略圖來選擇 所需文檔的需要是難以同時(shí)滿足的竟?fàn)幮缘男枰?br>
然而,根據(jù)實(shí)施例,由于將文檔概要縮略像配置為自動地進(jìn) 行動畫,因此可同時(shí)滿足竟?fàn)幮缘男枰?br>
(在密集模式中的文檔檢索結(jié)果列表窗口的顯示示例)
圖15示出了在密集顯示模式中的文檔檢索應(yīng)用的文檔檢索結(jié)果 列表窗口的顯示配置的示例。
文檔檢索結(jié)果列表窗口 1500與圖11中所示的文檔檢索結(jié)果列表 顯示示例的另一模式對應(yīng)。當(dāng)顯示項(xiàng)目設(shè)定區(qū)1106上的"顯示屬性信 息,,復(fù)選框沒有被選擇時(shí),將與在檢索列表顯示區(qū)1101上要被顯示的 每個文檔相關(guān)聯(lián)的元數(shù)據(jù)盡可能多地省略,并代替為在窗口上顯示盡 可能最大的數(shù)量的命中文檔的列表。相同附圖標(biāo)記表示與在圖11中 示出的文檔檢索結(jié)果列表窗口 1100上的那些元素相同的元素,并且 將避免對其重復(fù)說明。
詳情按鈕1501用于打開允許用戶確認(rèn)與文檔相關(guān)聯(lián)的詳細(xì)信息 的窗口,省略詳細(xì)信息的顯示。在按下該按鈕時(shí),打開與圖13所示 的顯示窗口相同的詳細(xì)信息顯示窗口。
^^用文檔概要縮略圖動畫顯示區(qū)1502a到1502i (在下文中也祐_ 簡稱為"顯示區(qū)1502")以動畫顯示文檔概要縮略圖。
在密集顯示模式下,為允許用戶從大數(shù)量的檢索結(jié)果文檔中找出 所需文檔,在一個窗口內(nèi)同時(shí)顯示盡可能最大數(shù)量的檢索結(jié)果文檔。
如用于顯示文檔概要縮略圖的顯示區(qū)1502,只能確保用于一個頁面的 顯示大小。因此,當(dāng)選擇動畫顯示復(fù)選框1109時(shí),顯示區(qū)1502的顯 示是分時(shí)的。顯示區(qū)1502的顯示是分時(shí)的,以執(zhí)行如翻頁一樣依次 自動切換頁面(或圖像元素)的動畫顯示。動畫顯示允許用戶識別幫 助他或她理解形成文檔的頁面和包括檢索命中頁面的上下文的概況 的特性頁面。
(文檔概要縮略圖動畫顯示處理的序列)
圖16A和16B是示出了文檔概要縮略圖動畫顯示處理的序列的 流程圖。顯示處理是通過由圖像處理設(shè)備110的CPU 301執(zhí)行的文檔 檢索應(yīng)用來實(shí)現(xiàn)的。
當(dāng)顯示圖15中示出的密集顯示模式下的文檔檢索結(jié)果列表窗口 時(shí),對于所有顯示文檔的每個文檔概要縮略圖動畫顯示區(qū)1502a到 1502i,并行執(zhí)行一系列流程的序列。在下面的說明中,將這些顯示區(qū) 1502a到1502i作為文檔概要縮略圖動畫顯示區(qū)1502來說明。
文檔檢索應(yīng)用在步驟S1601中檢查是否設(shè)定了動畫顯示。如果選 擇了動畫顯示復(fù)選框1109( S1601中為是),則處理前進(jìn)至步驟S1602; 否則(S1601中為否),該處理結(jié)束。
該應(yīng)用在步驟S1602中檢查是否已經(jīng)顯示從首頁開始、編號與在 文檔概要縮略圖配置設(shè)定區(qū)1108上設(shè)定的頁面數(shù)量一樣多的縮略圖 圖像。如果已經(jīng)顯示了該縮略像(S1602中為是),則處理跳至 步驟S1604;否則(S1602中為否),該處理前進(jìn)至步驟S1603。
在步驟S1603中,應(yīng)用在文檔概要縮略圖動畫顯示區(qū)1502上從 首頁顯示縮略像,并且該處理返回至步驟S1602。根據(jù)目前的循 環(huán),順序使從第一頁面開始,編號同設(shè)定的頁面數(shù)量一樣多的縮略圖 圖像進(jìn)行動畫。
應(yīng)用在步驟S1604中檢查是否已經(jīng)顯示了檢索命中頁面的縮略 像。如果已經(jīng)顯示了該縮略像(S1604中的是),則該處理 跳至步驟S1610;否則(S1604中為否),該處理前進(jìn)至步驟S1605。
該應(yīng)用在步驟S1605中檢查是否已經(jīng)顯示編號與在文檔概要縮
略圖配置設(shè)定區(qū)1108上設(shè)定的頁面數(shù)量一樣多的之前頁面的縮略圖 圖像。如果已經(jīng)顯示了該縮略像(S1605中的是),則該處理跳 至步驟S1607;否則(S1605中為否),該處理前進(jìn)至步驟S1606。
在步驟S1606中,應(yīng)用顯示編號與在文檔概要縮略圖動畫顯示區(qū) 1502上設(shè)定的頁面數(shù)量一樣多的之前頁面的縮略像,并且該處理 返回至步驟S1605。根據(jù)目前的循環(huán),順序使編號與檢索命中頁面相 關(guān)聯(lián)地設(shè)定的編號同頁面數(shù)量一樣多的之前頁面的縮略像進(jìn)行 動畫。
在步驟S1607中,該應(yīng)用還在文檔概要縮略圖動畫顯示區(qū)1502 上顯示該檢索命中頁面的縮略像。
該應(yīng)用在步驟S1608中檢查是否已經(jīng)顯示編號與在文檔概要縮 略圖配置設(shè)定區(qū)1108上與一個檢索命中頁面相關(guān)聯(lián)地設(shè)定的頁面數(shù) 量一樣多的后續(xù)頁面的縮略像。如果已經(jīng)顯示了該縮略像 (S1608中的是),則該處理返回步驟S1604;否則(S1608中為否), 該處理前進(jìn)至步驟S1609。
在步驟S1609中,應(yīng)用顯示編號與在文檔概要縮略圖動畫顯示區(qū) 1502上設(shè)定的頁面數(shù)量一樣多的后續(xù)頁面的縮略像,并且該處理 返回至步驟S1608。根據(jù)目前的循環(huán),順序使編號與檢索命中頁面相 關(guān)聯(lián)地設(shè)定的頁面數(shù)量一樣多的后續(xù)頁面的縮略像進(jìn)行動畫。
另一方面,如果步驟S1608中的條件為真,并且處理返回至步驟 S1604,則該循環(huán)允許每個檢索命中頁面和其之前和后續(xù)頁面的縮略 圖與文檔中的所有檢索命中頁面相關(guān)聯(lián)地進(jìn)行順序動畫。
該應(yīng)用在步驟S1610中檢查是否已經(jīng)從尾頁顯示編號與在文檔 概要縮略圖配置設(shè)定區(qū)1108上設(shè)定的頁面數(shù)量一樣多的縮略像。 如果已經(jīng)顯示了該縮略像(S1610中為是),則該處理返回步驟 S1601;否則(S1610中為否),該處理前進(jìn)至步驟S1611。
在步驟S1611中,應(yīng)用在文檔概要縮略圖動畫顯示區(qū)1502上顯 示尾頁的縮略像,并且該處理返回至步驟S1610。根據(jù)目前的循 環(huán),順序使編號與設(shè)定的頁面數(shù)量一樣多、從尾頁開始的縮略像進(jìn)行動畫。
為了使縮略像進(jìn)行動畫,可基于定時(shí)器設(shè)定對于各個時(shí)幀切 換顯示。根據(jù)用于文檔概要縮略圖中的各個頁面的優(yōu)先級,可以將具 有高優(yōu)先級的頁面顯示長時(shí)間段,而具有低優(yōu)先級的頁面顯示短時(shí)間 段。
根據(jù)下述算法來選擇優(yōu)選地顯示在文檔概要縮略圖中的具有高 優(yōu)先級的頁面。也就是說,可使用當(dāng)頁面命中相似圖像檢索的條件時(shí), 優(yōu)選地選擇文檔的更年輕的頁面,優(yōu)選地選擇命中更早指定的檢索關(guān) 鍵的頁面,或優(yōu)選地選擇具有更高相似度的頁面的算法。
要注意的是,可使未在文檔概要縮略圖配置設(shè)定區(qū)1108上設(shè)定 的頁面的縮略圖只顯示非常短的時(shí)間段。根據(jù)目前的配置,由于根據(jù) 重要頁面的重要級,與包括文檔中命中頁面的文檔或上下文的概況相 關(guān)聯(lián)的重要頁面顯示相對長的時(shí)間段,可增強(qiáng)對命中頁面的文檔和上 下文的概況的印象。
在有限的顯示區(qū)之內(nèi)顯示盡可能最大數(shù)量的文檔的列表的需要、 和允許用戶通過在視覺上比較盡可能詳細(xì)的文檔概要縮略圖來選擇 所需文檔的需要是難以同時(shí)滿足的竟?fàn)幮缘男枰?br>
然而,根據(jù)實(shí)施例,由于將文檔概要縮略像配置為自動地進(jìn) 行動畫,因此可同時(shí)滿足竟?fàn)幮缘男枰?(第二實(shí)施例)
根據(jù)第一實(shí)施例,使用形成文檔的頁面為單位顯示文檔概要縮略 圖。然而,第二實(shí)施例將說明使形成文檔的單獨(dú)圖像區(qū)元素作為單位 顯示文檔概要縮略圖的配置。
圖17示出了由多個圖像區(qū)元素形成的文檔的示例。 文檔1700是由多個圖像區(qū)和文本區(qū)形成的文檔的示例。由圖像 結(jié)構(gòu)分析單元208或再現(xiàn)單元210獲得與頁面的結(jié)構(gòu)相關(guān)聯(lián)的結(jié)構(gòu)信 息作為文檔1700的分析結(jié)果,并且可將形成文檔的諸如多個圖像和 多個文本元素的元素分解。并且,可基于分配的元素之間的距離、由 文化確定的分配和上下文的習(xí)慣等,通過分析獲得元素之間的交叉關(guān)系作為結(jié)構(gòu)信息。要注意的是,當(dāng)通過諸如HTML之類的代碼數(shù)據(jù) 來描述文檔時(shí),數(shù)據(jù)本身通常描述元素之間的關(guān)系。
文檔1700包括圖像元素1701到1702??苫趯⑺鼈儚淖蟮接?、 從上到下分配的文化習(xí)慣來分析圖像元素以使上下文在附圖標(biāo)記的 升序中。
圖18示出了根據(jù)第二實(shí)施例的檢索命中文檔顯示區(qū)。圖18的檢 索命中文檔顯示區(qū)示例假設(shè)其中使用與圖像元素1704相似的圖像作 為關(guān)鍵來實(shí)施檢索,并且圖17中所示的文檔1700命中的情況。圖18 中的檢索命中文檔顯示區(qū)具有與第一實(shí)施例的圖12中所示的檢索命 中文檔顯示區(qū)的示例相同的配置。因而,相同附圖標(biāo)記表示共同的元 素,并且避免對其的重復(fù)說明。
命中圖像縮略圖1804是用于顯示圖像元素的概況的縮略 像,其中該圖像元素命中形成對應(yīng)文檔的條件的檢索關(guān)鍵的條件。該 縮略圖與形成圖17中的文檔1700的圖像元素1704對應(yīng)。
第一圖像縮略圖1801是用于表達(dá)對應(yīng)文檔的第一圖像元素的概 況的縮略像??s略圖與形成圖17中的文檔1700的圖像元素1701 對應(yīng)。編號與在與文檔概要縮略圖配置設(shè)定區(qū)1108相似的設(shè)定區(qū)(未 示出)上設(shè)定的頁面的數(shù)量一樣多的縮略像可被顯示成行。
之前圖像縮略圖1803是用于顯示在命中檢索關(guān)鍵的圖像元素之 前的圖像元素的概況的縮略像??s略圖與形成圖17中的文檔1700 的圖像元素1703對應(yīng)。編號與在與文檔概要縮略圖配置設(shè)定區(qū)1108 相似的設(shè)定區(qū)(未示出)上設(shè)定的頁面的數(shù)量一樣多的縮略像可 被顯示成行。
后續(xù)圖像縮略圖1805是用于表達(dá)命中檢索關(guān)鍵的圖像元素之后 的圖像元素的概況的縮略像??s略圖與形成圖17中的文檔1700 的圖像元素1705對應(yīng)。與在與文檔概要縮略圖配置設(shè)定區(qū)1108相似 的設(shè)定區(qū)(未示出)上設(shè)定的頁面的數(shù)量一樣多的縮略像可被顯 示成行。
最后圖像縮略圖1812是用于表達(dá)對應(yīng)文檔的最后圖像元素的概況的縮略像??s略圖與形成圖17中的文檔1700的圖像元素1712 對應(yīng)。編號與在與文檔概要縮略圖配置設(shè)定區(qū)1108相似的設(shè)定區(qū)(未 示出)上設(shè)定的頁面的數(shù)量一樣多的縮略像可被顯示成行。
在有限的顯示區(qū)之內(nèi)顯示盡可能最大數(shù)量的文檔的列表的需要、 和允許用戶通過在視覺上比較盡可能詳細(xì)的文檔概要縮略圖來選擇 所需文檔的需要是難以同時(shí)滿足的竟?fàn)幮缘男枰?br>
根據(jù)實(shí)施例,由于用戶可容易地改變要被顯示在文檔概要縮略圖 中的圖像元素配置、以及圖像元素的數(shù)量,因此他或她可容易地檢索 所需文檔。
當(dāng)要在文檔概要縮略圖內(nèi)顯示非常大的數(shù)量的圖像元素時(shí),顯示 具有更高縮減比例的小縮略圖以使其落于有限的顯示區(qū)之內(nèi),從而調(diào) 整檢索結(jié)果的顯示??商娲兀扇缦驴刂骑@示。也就是說,以更小 的尺寸顯示具有相對更低的優(yōu)先級的圖像元素的縮略圖,或如此布局 圖像元素以使之前頁面部分地重疊在后續(xù)頁面之上??商娲?,可通 過省略一些顯示內(nèi)容調(diào)整檢索結(jié)果的顯示,以使其落于有限的顯示區(qū)之內(nèi)。
當(dāng)顯示區(qū)不夠大時(shí),可根據(jù)下述算法選擇優(yōu)選地顯示在文檔概要 縮略圖中的具有高優(yōu)先級的圖像元素。也就是說,可使用當(dāng)文檔命中 相似圖像檢索的條件時(shí),優(yōu)選地選擇文檔的更年輕數(shù)量的圖像元素, 優(yōu)選地選擇命中更早指定的檢索關(guān)鍵的圖像元素,或優(yōu)選地選擇具有 更高相似度的圖^象元素的算法。
可以如同圖14的顯示示例中的、和圖16A和16B中的序列相同 的序列,使用圖像元素為單元使文檔概要縮略圖進(jìn)行動畫,并且可通 過使用小顯示區(qū)來顯示布置在文檔中的大數(shù)量的圖像元素的上下文 和概況。
(其它實(shí)施例)
要注意的是,也可通過提供記錄軟件的程序代碼的存儲介質(zhì)來實(shí) 現(xiàn)本發(fā)明的目的,其中該軟件可基于系統(tǒng)或設(shè)備實(shí)現(xiàn)上述實(shí)施例的功 能。并且,當(dāng)系統(tǒng)或設(shè)備的計(jì)算機(jī)(或CPU或MPU)讀取出并執(zhí)行 存儲在存儲介質(zhì)中的程序代碼時(shí),可實(shí)現(xiàn)該目的。
在這樣的情況下,從存儲介質(zhì)讀取出的程序代碼本身實(shí)現(xiàn)上述實(shí) 施例的功能,并且存儲程序代碼的存儲介質(zhì)構(gòu)成本發(fā)明。
可使用例如,軟盤、硬盤、光盤、磁光盤、CD-ROM、 CD-R、 非易失性存儲卡、ROM等作為用于提供程序代碼的存儲介質(zhì)。
當(dāng)計(jì)算機(jī)執(zhí)行讀取程序代碼時(shí)實(shí)現(xiàn)上述實(shí)施例的功能。并且運(yùn)行 在計(jì)算機(jī)上的OS (操作系統(tǒng))基于程序代碼的指令執(zhí)行一些或所有 實(shí)際處理操作,以實(shí)現(xiàn)上述實(shí)施例。
盡管已參考示例性實(shí)施例說明了本發(fā)明,應(yīng)理解為本發(fā)明不限于 公開的示例性實(shí)施例。下述權(quán)利要求的范圍依照最廣泛的說明,以便 包含所有這樣的修改和等同的結(jié)構(gòu)和功能。
權(quán)利要求
1.一種文檔檢索設(shè)備,包括文檔檢索單元,其適用于檢索包括與輸入檢索條件相匹配的圖像的文檔數(shù)據(jù);檢索結(jié)果列表顯示單元,其適用于基于文檔檢索單元的檢索結(jié)果,在顯示單元上顯示與檢索條件相匹配的文檔數(shù)據(jù)的列表顯示;以及縮略圖顯示單元,其適用于在通過檢索結(jié)果列表顯示單元的列表顯示中顯示和與檢索條件相匹配的頁面或圖像元素相關(guān)聯(lián)的第一縮略像,以及與形成包括與檢索條件相匹配的頁面或圖像元素的文檔數(shù)據(jù)的另一頁面或另一圖像元素相關(guān)聯(lián)的第二縮略像。
2. 根據(jù)權(quán)利要求1所述的設(shè)備,其中,縮略圖顯示單元基于在第 一縮略像之前或之后要分配的頁面或圖像元素的布置順序顯示 第二縮略像。
3. 根據(jù)權(quán)利要求1所述的設(shè)備,其中,要被顯示的第二縮略圖 圖像包括與頁面或圖像元素相關(guān)聯(lián)的縮略像,該頁面或圖像元素 鄰近與檢索條件相匹配的頁面或圖像元素。
4. 根據(jù)權(quán)利要求1所述的設(shè)備,其中,要被顯示的第二縮略圖 圖像包括與形成文檔數(shù)據(jù)的首頁或尾頁、或第一或最后圖像元素相關(guān) 聯(lián)的縮略像,其中所述文檔數(shù)據(jù)包括與檢索條件相匹配的頁面或 圖像元素。
5. 根據(jù)權(quán)利要求1所述的設(shè)備,其中,要被顯示的第二縮略圖 圖像包括與多個頁面或多個圖像元素相關(guān)聯(lián)的多個縮略像,其中 該多個頁面或多個圖像元素是基于從鄰近與檢索條件相匹配的頁面 或圖像元素的頁面或圖像元素依次的布置順序來選擇的。
6. 根據(jù)權(quán)利要求1所述的設(shè)備,其中,要被顯示的第二縮略圖 圖像包括與多個頁面或多個圖像元素相關(guān)聯(lián)的多個縮略像,其中 該多個頁面或多個圖像元素是基于從形成包括與檢索條件相匹配的頁面或圖像元素的文檔數(shù)據(jù)的首頁或尾頁、或第一或最后圖像元素依 次的布置順序選擇的。
7. 根據(jù)權(quán)利要求5所述的設(shè)備,還包括顯示計(jì)數(shù)設(shè)定單元,其適用于設(shè)定要被顯示的第二縮略像的 顯示計(jì)數(shù),其中,縮略圖顯示單元根據(jù)由顯示計(jì)數(shù)設(shè)定單元設(shè)定的顯示計(jì) 數(shù),選擇要被作為第二縮略像顯示的頁面或圖像元素,并顯示與 所選頁面或圖像元素相關(guān)聯(lián)的多個縮略像。
8. 根據(jù)權(quán)利要求1所述的設(shè)備,其中,縮略圖顯示單元顯示尺寸比第二縮略像大的第一縮略像。
9. 根據(jù)權(quán)利要求1所述的設(shè)備,還包括動畫顯示設(shè)定單元,其適用于進(jìn)行設(shè)定以動畫顯示表示由文檔檢 索單元檢索的文檔數(shù)據(jù)的內(nèi)容的縮略像,其中,縮略圖顯示單元根據(jù)動畫顯示設(shè)定單元的設(shè)定動畫顯示第 一縮略像和第二縮略像。
10. 根據(jù)權(quán)利要求1所述的設(shè)備,還包括 顯示過濾器設(shè)定單元,其適用于設(shè)定縮小文檔檢索單元的檢索結(jié)果所需條件,其中,檢索結(jié)果列表顯示單元基于由顯示過濾器設(shè)定單元設(shè)定的 條件在顯示單元上顯示縮小的檢索結(jié)果。
11. 根據(jù)權(quán)利要求1所述的設(shè)備,其中檢索條件包括使用掃描圖 像和保存在存儲裝置中的圖像中至少之一 的檢索關(guān)鍵圖像。
12. 根據(jù)權(quán)利要求1所述的設(shè)備,其中,當(dāng)一個文檔數(shù)據(jù)包括與 檢索條件相匹配的多個頁面或多個圖像元素時(shí),縮略圖顯示單元顯示 和與檢索條件相匹配的頁面或圖像元素相關(guān)聯(lián)的多個第一縮略 像、以及與形成包括與檢索條件相匹配的頁面或圖像元素的其它頁面 或其它圖像元素相關(guān)聯(lián)的多個第二縮略像。
13. 根據(jù)權(quán)利要求12所述的設(shè)備,其中,當(dāng)一個文檔數(shù)據(jù)包括 與檢索條件相匹配的多個頁面或多個圖像元素時(shí),要由縮略圖顯示單元顯示的第一縮略像是與根據(jù)優(yōu)先條件所選的頁面或圖像元素 相關(guān)聯(lián)的縮略像。
14. 一種用于包括顯示單元的文檔檢索設(shè)備的文檔檢索方法,所 述方法包括檢索包括與輸入檢索條件相匹配的圖像的文檔數(shù)據(jù)的文檔檢索步驟;基于該文檔檢索步驟的檢索結(jié)果,在顯示單元上顯示與檢索條件 相匹配的文檔數(shù)據(jù)的列表顯示的檢索結(jié)果列表顯示步驟;以及在通過檢索結(jié)果列表顯示步驟的列表顯示中顯示和與檢索條件 相匹配的頁面或圖像元素相關(guān)聯(lián)的第一縮略像,以及與形成包括 與檢索條件相匹配的頁面或圖像元素的文檔數(shù)據(jù)的另一頁面或另一 圖像元素相關(guān)聯(lián)的第二縮略像的縮略圖顯示步驟。
15. 根據(jù)權(quán)利要求14所述的方法,其中,縮略圖顯示步驟基于在 第一縮略像之前或之后要分配的頁面或圖像元素的布置順序顯 示第二縮略像。
16. 根據(jù)權(quán)利要求14所述的方法,其中,要被顯示的第二縮略 像包括與頁面或圖像元素相關(guān)聯(lián)的縮略像,該頁面或圖像元 素鄰近與檢索條件相匹配的頁面或圖像元素。
17. 根據(jù)權(quán)利要求14所述的方法,其中,要被顯示的第二縮略 像包括與首頁或尾頁、或第一或最后圖像元素相關(guān)聯(lián)的縮略 像,該首頁或尾頁、或第一或最后圖像元素形成包括與檢索條件相匹 配的頁面或圖像元素的文檔數(shù)據(jù)。
全文摘要
本發(fā)明涉及文檔檢索設(shè)備和文檔檢索方法。文檔檢索設(shè)備包括文檔檢索單元,其適用于檢索包括與輸入檢索條件相匹配的圖像的文檔數(shù)據(jù);檢索結(jié)果列表顯示單元,其適用于基于該文檔檢索單元的檢索結(jié)果,在顯示單元上顯示與檢索條件相匹配的文檔數(shù)據(jù)的列表顯示;以及縮略圖顯示單元,其適用于在通過檢索結(jié)果列表顯示單元的列表顯示中顯示和與檢索條件相匹配的頁面或圖像元素相關(guān)聯(lián)的第一縮略像,以及與形成包括與檢索條件相匹配的頁面或圖像元素的文檔數(shù)據(jù)的另一頁面或另一圖像元素相關(guān)聯(lián)的第二縮略像。
文檔編號G06F17/30GK101206662SQ20071015377
公開日2008年6月25日 申請日期2007年9月20日 優(yōu)先權(quán)日2006年12月13日
發(fā)明者山本雅仁 申請人:佳能株式會社