專利名稱:檢索方法、檢索裝置的制作方法
技術領域:
本發(fā)明涉及適合于有效地提示來自多個文件組的檢索結果的檢索方法,以及檢索
>J-U裝直。
背景技術:
目前,已知的是內置有國語詞典或英日詞典、日英詞典、英英詞典等各種詞典的數(shù)據(jù)庫(詞典DB)的電子詞典裝置(下面僅稱為“電子詞典”)。詞典DB是指,使詞條和對該詞條進行說明解說的說明信息(文字數(shù)據(jù)或圖像數(shù)據(jù)、動畫數(shù)據(jù)、語音數(shù)據(jù)等)對應起來的信息集合,以能夠使用計算機進行檢索處理而系統(tǒng)地構成的詞典DB。、另外,為了提高檢索的便利性,電子詞典具備各種各樣的功能。特別是,在內置有針對多個詞典的DB的電子詞典中,較多的是在通過同時檢索多個詞典,以省去用戶選擇詞典的麻煩等用于提高可用性方面下工夫的電子詞典。例如,專利文獻I (日本特開2006-106889號公報)中公開的是如下的技術,在內置有多個詞典信息的電子詞典中,根據(jù)用戶的水平對詞典設置優(yōu)先級,以該優(yōu)先級的順序對檢索結果進行一覽顯示。據(jù)此,用戶能夠優(yōu)先獲得針對例如與中學/高中/大學等自身的水平相應的詞典檢索結果,能夠提高電子詞典的可用性。如內置多個詞典DB的裝置那樣,具備多個文件組的檢索裝置,較多的是以同時檢索多個文件組的方式提高便利性。但是,存在以下情況,盡管檢索了多個文件組,但檢索結果沒有從所有的文件組中毫無遺漏地輸出而是集中于一部分的文件組進行輸出等,沒有將來自多個文件組的檢索結果有效地提示給用戶。具體而言,若將內置有多個詞典DB的電子詞典裝置作為例子進行說明,則在以日語檢索語進行檢索的情況下,與英英詞典相比,國語詞典的說明信息中所包含的該日語檢索語較多,因此,實際上,即使進行英英詞典的檢索,提示給用戶的檢索結果也會容易變成幾乎由來自國語詞典的信息占有,相反,若用英語檢索語進行檢索,則也會容易引起提示給用戶的檢索結果幾乎由來自英英詞典的信息占有。
發(fā)明內容
為了解決如上所述的課題而提出本發(fā)明,其目的在于提供一種適合于有效地提示來自多個文件組的檢索結果的檢索方法、檢索裝置。為了實現(xiàn)上述目的,本發(fā)明的檢索方法的特征在于,其具備如下的步驟提取步驟,從多個文件組分別具備的多個文件數(shù)據(jù)中,提取包含期望的檢索字符串的文件數(shù)據(jù);設定步驟,基于預定的規(guī)則對所述提取的文件數(shù)據(jù)分別設定輸出優(yōu)先級;判定步驟,按順序判定所述多個文件組是否分別具備被設定了所述輸出優(yōu)先級的文件數(shù)據(jù)中的滿足預定的輸出條件的文件數(shù)據(jù);和輸出步驟,其在所述判定的文件組具備滿足所述預定的輸出條件的文件數(shù)據(jù)的情況下,輸出該文件數(shù)據(jù)中預定的個數(shù)的文件數(shù)據(jù)。根據(jù)本發(fā)明,能夠提供一種適合于有效地提示來自多個文件組的檢索結果的檢索方法、檢索裝置。
圖I是表示本發(fā)明的實施方式的檢索裝置的概要結構的圖;圖2是表示本發(fā)明的實施方式的檢索裝置的物理結構的圖;圖3(a)、(b)均是表示本發(fā)明的實施方式的多個文件組及文件數(shù)據(jù)的結構的圖;
圖4是表示本發(fā)明的實施方式的檢索裝置的處理的流程的流程圖;圖5是表示在本發(fā)明的實施方式中,對文件數(shù)據(jù)設定得分,并排序的情況的圖;圖6是表示在本發(fā)明的實施方式的檢索裝置中輸出處理的流程的流程圖;圖7是表示在本發(fā)明的實施方式中從多個文件組中巡回地輸出的情況的圖;圖8是表示針對本發(fā)明的檢索裝置的結構概要,其它的例子的圖。
具體實施例方式下面,參照附圖對本發(fā)明的實施方式進行說明。另外,以下說明的實施方式不限定本發(fā)明的范圍而是用于進行說明。因此,本領域的技術人員可采用將下述的各結構要素置換為均等的結構要素的實施方式,這些實施方式也包含在本發(fā)明的范圍內。另外,在以下的說明中,為了使本發(fā)明容易理解,適當省略不重要的公知的技術的事項的說明。在本實施方式中,作為實現(xiàn)檢索裝置的信息處理裝置,假設具備電子詞典等功能的小型信息處理裝置進行說明。即,本實施方式的檢索裝置為從構成電子詞典的多個文件數(shù)據(jù)中檢索包含期望的檢索語的文件數(shù)據(jù)的裝置。這種檢索裝置I采用如圖I所示的構成,其具備控制部100、存儲部110、輸入部120及顯示部130。另一方面,該檢索裝置I物理上如圖2所示構成,其具備CPU(CentralProcessing Unit)151、 ROM(Read OnlyMemory)152> RAM(Random AccessMemory) 153、鍵盤154及監(jiān)視器155。下面,參照圖I及圖2對檢索裝置I的構成要素進行說明??刂撇?00控制檢索裝置I整體的動作,并與各構成要素連接,對控制信號、數(shù)據(jù)進行互換。即,控制部100與存儲部110、輸入部120及顯示部130連接,一邊充分利用這些各部的功能,一邊執(zhí)行檢索處理。在此,控制部100具備提取部101、設定部102、判定部103及輸出部104。這些各部詳細如后所述,從存儲于存儲部110的多個文件組300a 300n中確定包含期望的檢索語的文件數(shù)據(jù),執(zhí)行對應預定的輸出優(yōu)先級進行輸出的處理。這種控制部100 (提取部101、設定部102、判定部103、輸出部104)例如由CPU151構成。在此,CPU151通過用于轉發(fā)命令、數(shù)據(jù)的傳送路徑即系統(tǒng)總線與各構成要素相互連接,根據(jù)記錄于R0M152的檢索裝置I整體的動作控制所需的計算機程序、各種數(shù)據(jù)進行動作。而且,CPU151將從R0M152讀出的計算機程序、數(shù)據(jù)、進行其它的處理所需的數(shù)據(jù)暫時存儲于RAM153,同時對各種動作進行控制。這樣,通過CPU151與R0M152、RAM153協(xié)作,控制部100對檢索裝置I全體的動作進行控制。
存儲部110例如由在檢索裝置I內具備的R0M152那樣的只讀存儲介質構成,控制部100存儲檢索處理所需的各種數(shù)據(jù)。具體而言,在此,預先存儲成為檢索對象的多個文件組 300a 300n。在此,預先存儲于存儲部110的文件組300a 300n相當于各自不同種類的詞典。具體而言,如圖3(a)所示,如文件組300a為國語辭典,文件組300b為英日辭典,還有文件組300n為百科詞典那樣,為分別相互獨立的詞典。即,檢索裝置I具備這樣的多種詞典,將該多種詞典作為檢索對象進行檢索。另外,這些文件組300a 300n分別作為詞典的構成單位,具備多個文件數(shù)據(jù)301。具體而言,如圖3(b)所示,例如相當于國語辭典的文件組300a由多個文件數(shù)據(jù)301a 301c等構成,進而,該文件數(shù)據(jù)301a 301c等分別由“詞條”和“說明文”構成。在此“詞條”是指成為該詞典的詞條的一個語句,對于一個文件數(shù)據(jù)301對應一個詞條。而且,對于“詞條”對應說明該詞條的“說明文”,將他們組合構成一個文件數(shù)據(jù)301。文件組300a 300n分別存在“詞條”的數(shù)的文件數(shù)據(jù)301,整體構成一個文件組300。
返回圖I及圖2,輸入部120例如由如鍵盤154那樣的輸入裝置構成,接受來自用戶的輸入。具體而言,在此,接受來自用戶的檢索語。所接受的檢索語向控制部100的提取部101供給,用于提取包含該檢索語的文件數(shù)據(jù)301的處理。顯示部130例如由如監(jiān)視器155那樣的顯示裝置構成,其將控制部100進行的處理的結果提示給用戶。具體而言,在此,通過將包含用戶輸入的檢索語的文件數(shù)據(jù)301基于后述的預定的輸出優(yōu)先級顯示在監(jiān)視器155上,來提示給該用戶。由此,取得作為輸出結果的包含用戶自身輸入的檢索語的文件數(shù)據(jù)301,能夠進行各種利用。另外,輸入部120和顯示部130也可以由將觸摸面板等那樣的輸入裝置和顯示裝置組合的裝置構成。在該情況下,由內置于觸摸面板的觸摸傳感器等組成的位置輸入裝置構成輸入部120,由液晶顯示器等組成的顯示裝置構成顯示部130。如上述構成的檢索裝置1,在控制部100的控制的基礎上進行檢索處理。具體而言,按照圖4的流程圖所示的步驟執(zhí)行處理。本處理以檢索裝置I的輸入部120接受從用戶輸入的檢索語為契機開始。即,使用鍵盤154,用戶輸出期望的檢索語,指示進行檢索的主旨,從而開始本處理。開始處理時,首先,檢索裝置I的提取部101指定最初的文件組300 (步驟S401)。在此,最初的文件組300是指檢索裝置I在存儲部110中具備的多個文件組300a 300n中按照預先決定的順序排列的最初的文件組300。S卩,多個文件組300a 300n被預先決定預定的順序被存儲在存儲部110,基于該預定的順序,進行自此開始敘述的提取處理及輸出處理等。下面,為了方便,假設預先決定文件組300a、文件組300b、...文件組300n這樣的順序進行說明。若指定最初的文件組300a,則提取部101在該指定的文件組300a內提取詞條中包含所輸入的檢索語的文件數(shù)據(jù)301 (步驟S402)。S卩,提取部101將輸入的檢索語的字符串(檢索字符串)和文件組300a具備的多個文件數(shù)據(jù)301a 301c等的詞條的字符串進行比較,提取詞條中包含與檢索字符串一致的字符串的文件數(shù)據(jù)301。例如,在用戶輸入“攜帯(AB) ”(下面,對示例的各漢字分配A F記號并用括號標注。)的檢索語的情況下,提取詞條為“攜帯(AB) ”的語句本身即文件數(shù)據(jù)301、或者“攜帯電話(AB⑶)”及“常時攜帯(EFAB) ”這樣包含檢索字符串的文件數(shù)據(jù)301。這樣,詞條中包含輸入的檢索語的文件數(shù)據(jù)301,例如在具備1000個文件數(shù)據(jù)301的文件組300a內有10個的情況下,提取該10個文件數(shù)據(jù)301。另外,此時進行的檢索的詳細方法可以基于任何公知的檢索技術。即,提取部101例如也可以進行依次掃描多個文件數(shù)據(jù)301a 301c等詞條的字符串并找出檢索字符串的按序型檢索(grep型檢索),或者為了檢索處理的高速化也可以進行預先準備了索引文件的索引型(index型)檢索。
這樣,若提取詞條中包含檢索語的文件數(shù)據(jù)301,則接著設定部102對提取的文件數(shù)據(jù)301設定相當于詞條和檢索語的字符數(shù)的差值的得分(步驟S403)。在此“得分”是指表示后述的輸出處理的輸出優(yōu)先級的指標,相對于一個文件數(shù)據(jù)301設定一個值。S卩,在此按照基于設定的得分的優(yōu)先級,之后進行輸出文件數(shù)據(jù)301的處理。此時,設定部102取得詞條和檢索語的字符數(shù)的差值,設定為得分的值。S卩,若詞條和檢索語的字符數(shù)的差值較大,則得分變成較大的值,若差值較小,則得分變成較小的值。詞條和檢索語的字符數(shù)的差值較小是指詞條和檢索語的一致的程度較大,被認為是用戶意向的文件數(shù)據(jù)301的可能性較高。因此,按照差值(得分)越小的文件數(shù)據(jù)301越優(yōu)先輸出的方式,輸出優(yōu)先級變得較高。具體而言,參照如圖5所示的例子進行說明。在用戶輸入“攜帯(AB) ”的檢索語的情況下,會提取具有“攜帯(AB) ” “攜帯電話(AB⑶)” “常時攜帯(EFAB) ”的詞條的文件數(shù)據(jù)301。在詞條為“攜帯(AB) ”的語句本身即文件數(shù)據(jù)301中,由于沒有字符數(shù)的差值(0文字),因此,得分被設定為“O”。另一方面,在為詞條“攜帯電話(ABCD) ”或“常時攜帯(EFAB) ”這類的文件數(shù)據(jù)301中,由于字符數(shù)的差值為兩個文字,因此,設定得分為“2”。若這樣設定得分,則進而檢索裝置I的控制部100對提取的文件數(shù)據(jù)301按得分從小到大的順序排列(步驟S404)。即,將文件數(shù)據(jù)301按輸出優(yōu)先級從高到低的順序排列。例如,得分為“0” S卩“攜帯(AB) ”的詞條的文件數(shù)據(jù)301排列在比得分為“2”的“攜帯電話(AB⑶)”或“常時攜帯(EFAB) ”的詞條的文件數(shù)據(jù)301靠前的位置。此時,控制部100將得分相同的文件數(shù)據(jù)301按照檢索語離開頭從近到遠的順序進一步排列(步驟S405)。即,相對于按得分順序排列的文件數(shù)據(jù)301,進而在具有相等的得分的文件數(shù)據(jù)301之間也進行排列。作為此時的排列的基準,控制部100著眼于詞條內的檢索語的位置,將靠近開頭的優(yōu)先。其原因如下,認為檢索語靠近開頭的是用戶意向的文件數(shù)據(jù)301的可能性較高。具體而言,若參照如圖5所示的例子進行說明,則針對具有得分相同的“2”即“攜帯電話(AB⑶)”和“常時攜帯(EFAB) ”詞條的兩個文件數(shù)據(jù)301,“攜帯電話(AB⑶)”的詞條一方與“常時攜帯(EFAB) ”的詞條相比,由于靠前的位置中包含檢索語“攜帯(AB) ”的字符串,因此,被排列在靠前的位置。其結果,在用戶輸入“攜帯(AB) ”的檢索語的情況下,針對具有提取的“攜帯(AB) ” “攜帯電話(ABCD) ” “常時攜帯(EFAB) ”詞條的三個文件數(shù)據(jù)301,得分為“O”、最小的“攜帯(AB) ”的詞條的文件數(shù)據(jù)301排在第一位,得分為“2”的“攜帯電話(ABCD) ”的詞條的文件數(shù)據(jù)301排在第二位,雖得分相同為“2”但檢索語沒有位于最前頭的“常時攜帯(EFAB) ”的詞條的文件數(shù)據(jù)301排在第三位。另外,得分和檢索語的位置都相同的情況下,基于文件組300內的詞條的50音順序或字母順序等其它要素進行排列。若對從這樣指定的文件組300a中提取的各文件數(shù)據(jù)301設定得分進行排序,則將該文件數(shù)據(jù)301暫時保持在RAM153中,同時,接著,檢索裝置I的控制部100判定是否有未處理的文件組300 (步驟S406)。在有未處理的文件組300的情況下(步驟S406 ;是(YES)),指定下一文件組
300(步驟S407),處理回到步驟S402。S卩,在文件組300a的處理后,指定下一文件組300b,對該指定的文件組300b進行上述步驟S402 S405中的文件數(shù)據(jù)301的提取、得分的設定、排列的各處理。對所有文件組300a 300n的各個文件組進行這些處理,包含輸入的檢索語的文件數(shù)據(jù)301被按得分從小到大的順序排列。之后,若沒有未處理的文件組300(步驟S406 ;否(NO)),則基于設定的得分即輸出優(yōu)先級,移至輸出文件數(shù)據(jù)301的處理(步驟S408)。針對該輸出處理,再次參照圖6的流程圖詳細地進行說明。 若開始輸出處理,則檢索裝置I的判定部103將作為輸出文件數(shù)據(jù)301的判定基準的輸出得分S初始化為“0”,而且,指定最初的文件組300 (步驟S601)。在此,最初的文件組300是指按上述的預定的順序存儲的最初的文件組300。具體而言,如圖7的例子所示,在按如下順序存儲國語辭典的文件組300a、英日辭典的文件組300b、百科詞典的文件組300c這三個文件組300a 300c的情況下,在該步驟S601中,指定國語辭典的文件組300a。另外,在圖7的例子中,各文件組300a 300c成為經(jīng)上述的步驟S402 S405的處理的狀態(tài)。即,在各文件組300a 300c具備的文件數(shù)據(jù)301中,提取包含輸入的檢索語的文件數(shù)據(jù)301,對它們設定得分,進而成為按照得分從小到大的順序排列的狀態(tài)。在自此的輸出處理的說明中,參照圖6的流程圖和圖7的具體例兩者進行說明。若指定最初的文件組300a,則判定部103判定在指定的文件組300a內是否有得分為S且未輸出的文件數(shù)據(jù)301(步驟S602),在有的情況下(步驟S602 ;是),輸出部104輸出一個相應的文件數(shù)據(jù)301 (步驟S603)。在此,由于輸出得分S的值被初始化為“0”,因此,判定在文件組300a內是否有得分為“0”的文件數(shù)據(jù)301,在有的情況下,輸出其中的一個。在此,不將得分為“0”(輸出優(yōu)先級最大)的文件數(shù)據(jù)301全部輸出,僅輸出一個的理由為,若一次輸出較多的文件數(shù)據(jù)301,則不能從多個文件組300a 300c中按照盡可能平衡的順序輸出文件數(shù)據(jù)301。因此,檢索裝置1,預先決定預定的個數(shù)(在此為一個)作為一次輸出的個數(shù)并存儲在存儲部110中等,輸出部104按每個指定的文件組300依次輸出預定的個數(shù)輸出文件數(shù)據(jù)301。具體而言,在圖7中,在文件組300a內,作為得分設定為“0”的文件數(shù)據(jù)301,存在一個“al”的詞條的文件數(shù)據(jù)301。因此,在此,輸出部104通過將該“al”的文件數(shù)據(jù)301通過檢索裝置I的顯示部130顯示在監(jiān)視器155上等,向用戶輸出。接著,判定部103判定在所有的文件組300a 300c內是否有得分為S且未輸出的文件數(shù)據(jù)301(步驟S604)。即,判定是否還有也包含在其它的文件組300內與輸出的“al”相同的得分為“0”的文件數(shù)據(jù)301。在有情況下(步驟S604 ;是),指定下一文件組300b (步驟S605),處理返回步驟S602。而且,判定部103判定在該指定的文件組300b內,是否有相應的文件數(shù)據(jù)301,在有的情況下,在步驟S603中,輸出部104輸出一個相應的文件數(shù)據(jù)301。
具體而言,在圖7中,由于與輸出的“al”的文件數(shù)據(jù)301得分同樣為“0”即“bl”的文件數(shù)據(jù)301存在于指定的英日辭典的文件組300b內,因此,輸出部104會接著“al”輸出“bl”的文件數(shù)據(jù)301。若輸出“bl”的文件數(shù)據(jù)301,則在所有的文件組300a 300c內得分為“0”且未輸出的文件數(shù)據(jù)301已經(jīng)消失。因此,在圖6的流程圖中,判斷沒有得分為“0”且未輸出的文件數(shù)據(jù)301 (步驟S604 ;否),接著,將輸出得分的值增加至“ I ”,即著眼于在未輸出的文件數(shù)據(jù)301中輸出優(yōu)先級最大的文件數(shù)據(jù)301,進行處理。因此,首先,判定部103判定在所有的文件組300a 300c內是否有未輸出的文件數(shù)據(jù)301 (步驟S606)。在此,由于只輸出得分為“0”的文件數(shù)據(jù)301,而未輸出得分為“I”以上的文件數(shù)據(jù)301,因此,判斷為有(步驟S606;是)。此時,將輸出得分S的值增加至S+1,即將為“0”的設定為“I” (步驟S607),進而,在指定下一文件組300c的基礎上(步驟S605),再進行步驟S602的處理。
在此,如圖7所示,指定的百科詞典的文件組300c具有的文件數(shù)據(jù)301,得分僅為“2”以上。因此,在圖6的步驟S602中,判定部103判定為在指定的文件組300c內沒有得分被設定為“I”的文件數(shù)據(jù)301 (步驟S602 ;否),在此,不通過步驟S603不輸出任何的文件數(shù)據(jù)301。而且,該狀態(tài)下的處理會再次移至步驟S604、S605,指定下一文件組300a,返回步驟S602。在此,由于到此為止指定的文件組300c為按預定的順序存儲的最后,因此,在步驟S605中,作為接著指定的文件組,巡回地返回至預定的順序的最初,指定國語辭典的文件組300a。而且,再次判定在該最初的文件組300a即國語辭典內是否存在得分被設定為“I”的未輸出的文件數(shù)據(jù)301 (步驟S602)。具體而言,在該最初的文件組300a中,得分被設定為“I”的未輸出的文件數(shù)據(jù)301存在“a2”和“a3”兩個。因此,在此判定為有,執(zhí)行步驟S603的文件數(shù)據(jù)301的輸出處理。此時,輸出部104輸出該兩個文件數(shù)據(jù)301 ( “a2”和“a3”)中的預定的個數(shù),即在此輸出一個文件數(shù)據(jù)301。S卩,輸出部104不同時輸出該兩個文件數(shù)據(jù)301,僅輸出一個排在前頭的“a2”的文件數(shù)據(jù)301,移至下一英日辭典的文件組300b的處理。由此,通過從多個文件組300a 300c中分別逐一輸出文件數(shù)據(jù)301,從而實現(xiàn)從多個文件組300a 300c
中毫無遺漏的輸出。重復如上所述的處理,檢索裝置I的輸出部104 —邊巡回地指定文件組300a 300c,一邊從得分較小的文件數(shù)據(jù)301開始按順序輸出各一個。其結果,從如圖7的三個文件組 300a 300c 中按“&1”、“131”、“&2”、訃2”、“&3”、訃3”、“。1”、訃4”、“。2”、“&4”、“。3”、“c4”、“c5”、“a5”、“b5”. . 的順序輸出文件數(shù)據(jù)301。通過如以上的結構,本實施方式的檢索裝置1,在從多個文件組300a 300n中的包含期望的檢索語的文件數(shù)據(jù)301的檢索中,對文件數(shù)據(jù)301設定基于檢索語和詞條的字符數(shù)的差值的輸出優(yōu)先級,按照該輸出優(yōu)先級從高到低的順序一邊巡回多個文件組300a 300n —邊逐一輸出文件數(shù)據(jù)301。其結果,從多個文件組300a 300n中毫無遺漏地輸出包含檢索語的文件組301,用戶即使未明確地指定并檢索任一文件組300,也能夠從多個文件組300a 300n中分別確認符合意向的可能性較高的文件數(shù)據(jù)301,另外,能夠一邊在多個文件組300a 300n間進行比較等,一邊找出。另外,上述實施方式為一個例子,本發(fā)明的適用范圍不受其限制。即,可進行各種應用,所有的實施方式都包含在本發(fā)明范圍內。例如,在上述實施方式中,檢索裝置I將文件組300a 300n存儲于如R0M152那樣的存儲部110內。但不限定于此,,檢索裝置I也可以具備硬盤等大容量存儲裝置、DVD-ROM驅動器,文件組300a 300n被存儲在硬盤、DVD-ROM等中?;蛘?,檢索裝置I也可以與網(wǎng)絡連接,文件組300a 300n存在于網(wǎng)絡上。另外,在上述實施方式中,對于檢索裝置I而言,用戶輸入檢索語的輸入部120、顯示檢索結果的顯示部130與控制部100、存儲部110存在于同一裝置內。但不限定于此,輸入部120和顯示部130也可以位于檢索裝置I的外部。即,例如如圖8所示,檢索裝置I也可以不具備輸入部120和顯示部130,而經(jīng)由網(wǎng)絡150與具備它們的終端裝置2連接,構成為如在線型的電子詞典那樣的信息設備。、
此時,檢索裝置I和終端裝置2通過各自具備的通信部140a、140b經(jīng)由網(wǎng)絡150彼此相互通信數(shù)據(jù)。即,終端裝置2的用戶輸入的檢索語被發(fā)送給檢索裝置1,并通過控制部100執(zhí)行檢索處理。之后,在將作為檢索結果的文件數(shù)據(jù)的信息與對他們設定的輸出的順序對應的基礎上,再次發(fā)送給終端裝置2,并經(jīng)由顯示部130顯示給用戶。通過采用這種結構,能夠一并管理檢索裝置I內的文件組300a 300n等,能夠被多個用于利用,另外,由于用戶端的終端裝置2無需保持文件組300a 300n等,因此,具有能夠抑制數(shù)據(jù)大小的優(yōu)點。另外,在上述實施方式中,假設如電子詞典那樣的小型的信息處理裝置作為檢索裝置I進行了說明。但不限定于此,檢索裝置I也可以為商業(yè)用/家庭用的普通的計算機裝置、便攜式電話等其它信息設備。即,檢索裝置I例如也可是在普通的計算機裝置中,從硬盤等大容量存儲裝置、DVD-ROM等準備的文件組300a 300n中檢索包含期望的檢索語的文件數(shù)據(jù)301的裝置,還可以是在手機中,從在網(wǎng)絡150上準備的文件組300a 300n中檢索包含期望的檢索語的文件數(shù)據(jù)301的裝置。另外,在上述實施方式中,檢索裝置I提取“詞條”中包含檢索語的文件數(shù)據(jù)
301(所謂的“詞條檢索”),根據(jù)基于設定的輸出優(yōu)先級的預定的規(guī)則,輸出該提取出的文件數(shù)據(jù)301。但不限定于此,也可以提取文件數(shù)據(jù)301中的“說明文”中包含檢索語的文件數(shù)據(jù)(所謂的“全文檢索”)。即,可以將檢索對象擴展到“詞條”和“說明文”兩者,將在任何一方中包含檢索語的文件數(shù)據(jù)301向用戶輸出。在該情況下,也可以針對通過“全文檢索”提取的文件數(shù)據(jù)301,與通過“詞條檢索”提取的文件數(shù)據(jù)301相比,將輸出優(yōu)先級較低地(將得分較大地)設定。由此,即使用戶未明確地指定檢索“詞條檢索”和“全文檢索”,也將是符合用戶的檢索意向的文件數(shù)據(jù)301的可能性較高的通過“詞條檢索”提取出的文件數(shù)據(jù)301優(yōu)先輸出,之后,輸出“說明文”中包含檢索語的文件數(shù)據(jù)301,用戶能夠更加簡便地獲得符合意向的檢索結果。該情況下,而且,也可以預先對輸出的文件數(shù)據(jù)301的個數(shù)決定最大值,在“詞條”中包含檢索語的文件數(shù)據(jù)301不滿足該最大值的情況下,只提取剩余數(shù)量的“說明文”中包含檢索語的文件數(shù)據(jù)301。通常,由于若“說明文”也包含在檢索對象內,則檢索對象會擴大,因此,在此,通過僅在不滿足輸出個數(shù)的情況下將檢索對象擴展至“說明文”,能夠抑制整個處理的負荷。另外,在上述實施方式中,假設從用戶接受單一的檢索語的情況進行了說明。但不限定于此,檢索裝置I也可以接受多個檢索語,并進行針對實施它們的邏輯積及邏輯和等各種運算處理后而得結果的檢索,基于以預定的規(guī)則設定的輸出優(yōu)先級,向用戶輸出。在該情況下,對作為檢索結果而提取的文件數(shù)據(jù)301設定的輸出優(yōu)先級,可以通過在此包含的多個檢索語的出現(xiàn)位置、出現(xiàn)頻度、或者多個檢索語間的出現(xiàn)位置的間隔的各種出現(xiàn)形式來設定。另外,在上述實施方式中,文件組300a 300n具備的多個文件數(shù)據(jù)301a 301c等由“詞條”和“說明文”構成。但不限定于此,可以由各種各樣的要素構成。例如,也可以為具有用于說明“詞條”的圖或表。或者,不限于由這種“詞條”和“說明文”構成的詞典的構成單位,檢索裝置I也可以為檢索各種電子數(shù)據(jù)的裝置。例如,也可以為在普通的計算機裝置中,從存儲于硬盤等大容量存儲裝置的電子文件中,檢索包含期望的檢索字符串的電子文件的裝置?;蛘撸部梢詾榕c網(wǎng)絡連接,并檢索存在于網(wǎng)絡上的網(wǎng)頁的裝置。 另外,在上述實施方式中,文件組300a 300n預先被決定預定的順序,并基于該預定的順序,進行檢索裝置I的處理。在此,預定的順序不限于不可從預先決定的一個順序進行設定變更的順序,可以為各種設定的順序。例如,也可以為針對各文件組300預先存儲使用頻度,按照該使用頻度升從高到低的順序決定預定的順序。或者,也可以由用戶自己決定順序。由此,從符合用戶的意向的可能性較高的文件組300的檢索結果按順序輸出,從而提高檢索裝置I的可用性?;蛘撸幌抻趯⒋鎯τ诖鎯Σ?10的所有的文件組300a 300n作為檢索對象,也可以按照用戶能夠自己選擇檢索對象的文件組300的方式,從該選擇的文件組300中,基于預定的順序進行檢索處理。由此,更容易進行符合用戶意向的檢索結果的輸出。另外,在上述實施方式中,巡回地逐一輸出多個文件組300a 300n具備的文件數(shù)據(jù)301中輸出優(yōu)先級較高的文件數(shù)據(jù)。但是不限于逐一輸出文件數(shù)據(jù),也可以巡回地逐次輸出兩個、三個,或者其它個數(shù)。即,輸出部104作為每次輸出的文件數(shù)據(jù)301的個數(shù)而決定的預定的個數(shù),不限于一個,可以為若干個。通常,若將預定的個數(shù)設為一個或兩個那樣比較少的個數(shù),則可從所有的文件組300中進行毫無遺漏的文件數(shù)據(jù)301的輸出。相反,若是增大預定的個數(shù),則從各文件組300的文件數(shù)據(jù)301的輸出成為每次輸出某種程度上大量的個數(shù)?;蛘撸部梢杂脩糇约褐付ㄟ@種每一次輸出的文件數(shù)據(jù)301的個數(shù)。由此,能夠靈活地設計從多個文件組300a 300n中毫無遺漏地輸出的程度。另外,當然,能夠提供預先具備用于實現(xiàn)本發(fā)明的功能的結構的檢索裝置,還能夠提供通過程序的應用,使已有的個人計算機、信息終端設備等作為本發(fā)明的檢索裝置發(fā)揮作用。即,通過使控制已有的個人計算機、信息終端設備等的CPU等能夠執(zhí)行用于實現(xiàn)上述實施方式中示例的檢索裝置I的各功能結構的檢索程序,能夠作為本發(fā)明的檢索裝置I發(fā)揮作用。另外,能夠使用檢索裝置I實施本發(fā)明的檢索方法。另外,這種程序的適用方法是任意的,例如除能夠收容在⑶-ROM或DVD-ROM、存儲器卡等計算機可讀存儲介質中來進行應用之外,例如,還可以經(jīng)由因特網(wǎng)等通信介質來進行應用。
權利要求
1.一種檢索方法,其特征在于, 具備如下步驟 提取步驟,從多個文件組分別具備的多個文件數(shù)據(jù)中,提取包含期望的檢索字符串的文件數(shù)據(jù); 設定步驟,基于預定的規(guī)則對所述提取的文件數(shù)據(jù)分別設定輸出優(yōu)先級; 判定步驟,按順序判定所述多個文件組是否分別具備被設定了所述輸出優(yōu)先級的文件數(shù)據(jù)中的滿足預定的輸出條件的文件數(shù)據(jù); 輸出步驟,在所述判定的文件組具備滿足所述預定的輸出條件的文件數(shù)據(jù)的情況下,輸出該文件數(shù)據(jù)中的預定的個數(shù)的文件數(shù)據(jù)。
2.根據(jù)權利要求I所述的檢索方法,其特征在于, 所述多個文件組被附加預定的順序, 在所述判定步驟中,以附加給所述多個文件組的預定的順序巡回地進行是否具備滿足所述預定的輸出條件的文件數(shù)據(jù)的判定。
3.根據(jù)權利要求2所述的檢索方法,其特征在于, 所述多個文件組分別具備的多個文件數(shù)據(jù)分別由詞條和對應的說明文構成, 在所述設定步驟中,基于詞條和檢索字符串的字符數(shù)的差值設定文件數(shù)據(jù)的輸出優(yōu)先級。
4.根據(jù)權利要求3所述的檢索方法,其特征在于, 在所述設定步驟中,對于詞條和所述檢索字符串的字符數(shù)的差值相等的文件數(shù)據(jù),按照該詞條的開頭字符和所述檢索字符串間的字符數(shù)從小到大的順序,進一步設定輸出優(yōu)先級。
5.根據(jù)權利要求4所述的檢索方法,其特征在于, 在所述設定步驟中,將所述提取的文件數(shù)據(jù)中的、詞條中沒有包含所述檢索字符串的文件數(shù)據(jù)的輸出優(yōu)先級設定為比詞條中包含所述檢索字符串的文件數(shù)據(jù)的輸出優(yōu)先級低。
6.根據(jù)權利要求5所述的檢索方法,其特征在于, 在所述提取步驟中,從所述多個文件組分別具備的多個文件數(shù)據(jù)中提取詞條中包含所述檢索字符串的文件數(shù)據(jù),在該提取的文件數(shù)據(jù)的個數(shù)不滿足預定的最大數(shù)的情況下,進而提取說明文中包含所述檢索字符串的文件數(shù)據(jù)。
7.一種檢索裝置,其特征在于, 具備 提取單元,其從多個文件組分別具備的多個文件數(shù)據(jù)中提取包含期望的檢索字符串的文件數(shù)據(jù); 設定單元,其基于預定的規(guī)則對所述提取的文件數(shù)據(jù)分別設定輸出優(yōu)先級; 判定單元,其按順序判定所述多個文件組是否分別具備被設定了所述輸出優(yōu)先級的文件數(shù)據(jù)中的滿足預定的輸出條件的文件數(shù)據(jù); 輸出單元,其在所述判定的文件組具備滿足所述預定的輸出條件的文件數(shù)據(jù)的情況下,輸出該文件數(shù)據(jù)中的預定的個數(shù)的文件數(shù)據(jù)。
8.根據(jù)權利要求7所述的檢索裝置,其特征在于, 所述多個文件組被附加預定的順序,在所述判定單元中,以附加給所述多個文件組的預定的順序巡回地進行是否具備滿足所述預定的輸出條件的文件數(shù)據(jù)的判定。
9.根據(jù)權利要求8所述的檢索裝置,其特征在于, 所述多個文件組分別具備的多個文件數(shù)據(jù)分別由詞條和對應的說明文構成, 在所述設定單元中,基于詞條和檢索字符串的字符數(shù)的差值設定文件數(shù)據(jù)的輸出優(yōu)先級。
10.根據(jù)權利要求9所述的檢索裝置,其特征在于, 在所述設定單元中,對于詞條和所述檢索字符串的字符數(shù)的差值相等的文件數(shù)據(jù),按照該詞條的開頭字符和所述檢索字符串間的字符數(shù)從小到大的順序進一步設定輸出優(yōu)先級。
11.根據(jù)權利要求10所述的檢索裝置,其特征在于, 在所述設定單元中,將所述提取的文件數(shù)據(jù)中的、詞條中沒有包含所述檢索字符串的文件數(shù)據(jù)的輸出優(yōu)先級設定為比詞條中包含所述檢索字符串的文件數(shù)據(jù)的輸出優(yōu)先級低。
12.根據(jù)權利要求11所述的檢索裝置,其特征在于, 在所述提取單元中,從所述多個文件組分別具備的多個文件數(shù)據(jù)中提取詞條中包含所述檢索字符串的文件數(shù)據(jù),在該提取的文件數(shù)據(jù)的個數(shù)不滿足預定的最大數(shù)的情況下,進而提取說明文中包含所述檢索字符串的文件數(shù)據(jù)。
全文摘要
本發(fā)明提供一種檢索方法、檢索裝置,在檢索裝置(1)中,提取部(101)從多個文件組(300a~300n)分別具備的多個文件數(shù)據(jù)中提取包含期望的檢索字符串的文件數(shù)據(jù)。設定部(102)基于預定的規(guī)則對提取的文件數(shù)據(jù)分別設定輸出優(yōu)先級。判定部(103)按順序判定多個文件組(300a~300n)是否分別具備設定了輸出優(yōu)先級的文件數(shù)據(jù)中的滿足預定的輸出條件的文件數(shù)據(jù)。輸出部(104)在判定的文件組(300a~300n)具備滿足預定的輸出條件的文件數(shù)據(jù)的情況下,輸出該文件數(shù)據(jù)中的預定的個數(shù)的文件數(shù)據(jù)。
文檔編號G06F17/30GK102737113SQ20121014227
公開日2012年10月17日 申請日期2012年3月29日 優(yōu)先權日2011年3月30日
發(fā)明者井手博康 申請人:卡西歐計算機株式會社