專利名稱:信息存儲與檢索的制作方法
技術領域:
本發(fā)明涉及信息檢索裝置與方法。
背景技術:
有多種已建立用于通過根據(jù)關鍵詞搜索來定位信息(例如,文檔、圖像、電子郵件、專利、互聯(lián)網(wǎng)內(nèi)容、或媒體內(nèi)容諸如音頻/視頻內(nèi)容)的系統(tǒng)。例子包括互聯(lián)網(wǎng)搜索“引擎”,諸如由“Google” 或“Yahoo” 提供的搜索引擎,其中通過關鍵詞進行的搜索產(chǎn)生了由該搜索引擎以感覺相關順序排列的結果列表。然而,在包含大量內(nèi)容的系統(tǒng)中(通常稱為大量內(nèi)容集合),很難制定有效的搜索查詢以給出搜索“命中”的簡短列表。例如,在準備本申請時,以關鍵詞“大量文檔集合”進行Google搜索,命中M3000個。如果之后重復搜索,則這個命中數(shù)還有望增加,因為通過互聯(lián)網(wǎng)存儲的內(nèi)容量一般隨時間增加。查看這種命中列表可能相當耗時。通常,大量內(nèi)容集合沒有被很好利用的一些原因是·用戶不知道存在相關內(nèi)容;·用戶知道存在相關內(nèi)容,但不知道它在哪;·用戶知道存在內(nèi)容,但不知道它是相關的; 用戶知道存在相關內(nèi)容以及如何找到它,但找到該內(nèi)容要花很長時間。文章“大量文檔集合的自組織”(“klfOrganisation of a Massive Document Collection,,,Kohonen et al, IEEE Transactions on Neural Networks, Vol 11,No. 3,May 2000,P574-585)公開了一種使用所謂“自組織映射”(SOM)的技術。其利用了所謂無人監(jiān)管的自學習神經(jīng)網(wǎng)絡算法,其中表示各文檔特性的“特征向量”映射到SOM的節(jié)點上。在Kohonen等人的文章中,第一步是預處理文檔文本,并隨后從各預處理的文檔中導出特征向量。在一種形式中,這可以是顯示單詞的各大型詞典出現(xiàn)頻率的直方圖。直方圖內(nèi)的各數(shù)據(jù)值(即,各個詞典單詞的各出現(xiàn)頻率)變成η值向量的值,其中η是詞典中候選單詞的總數(shù)(在這篇文章描述的實例中是4322 ??蓪Ζ窍蛄恐颠M行加權,或許強調(diào)特定單詞的增強的相關性或改進的分化。隨后,η值向量被映射到基本小于η的較小維數(shù)向量上(即,具有數(shù)值為m(在該篇文章中為500)的向量)。這是通過將該向量與由隨機數(shù)陣列形成的(nXm) “投影矩陣” 相乘來實現(xiàn)的。這種技術已經(jīng)顯示出可以生成較小維數(shù)的向量,其中任意兩個減小維數(shù)的向量都具有許多與兩個各輸入向量相同的向量點積。在文章“通過隨機映射的維數(shù)縮減 用于聚類的快速相似性計算”(“Dimensionality Reduction by Random Mapping =Fast Similarity Computation for Clustering", Kaski, Proc IJCNN,P413-418,1998)中描述了這個向量映射過程。
通過將各向量與“模型”(另一向量)相乘的過程,減小維數(shù)的向量隨后被映射到 SOM上的節(jié)點(也稱為神經(jīng)元)上。這些模型通過學習過程產(chǎn)生,該學習過程通過相互相似性將它們自動排序在SOM上,這通常表示為節(jié)點的二維柵格。這是一個不平凡的過程,對于只在700萬文檔以下的文檔數(shù)據(jù)庫,Kohonen等人在內(nèi)存為800MB的6個處理器的計算機上花了 6周的時間。最后,顯示形成SOM的節(jié)點柵格,用戶可放大映射區(qū)域并選擇節(jié)點,這使用戶界面可提供到包含鏈接到那個節(jié)點的文檔的網(wǎng)頁的鏈接。
發(fā)明內(nèi)容
本發(fā)明的各方面和特征在所附權利要求書中定義。根據(jù)本發(fā)明的一方面,提供了一種用于搜索信息項集合并顯示搜索結果的信息檢索裝置,所述信息項各具有表征信息特征集合。所述裝置包括搜索處理器,所述搜索處理器可操作用于根據(jù)用戶定義的表征信息特征來搜索信息項,并標識具有與那個用戶定義的表征信息特征相對應的表征信息特征的信息項。映射處理器可操作用于生成表示來自在搜索中標識的信息項集合的信息項映射的數(shù)據(jù)。所述映射根據(jù)信息項的相互相似性相對于陣列中的位置提供標識的信息項,相似信息項映射到陣列內(nèi)的相似位置。所述裝置包括用于顯示至少某些標識項的表示的圖形用戶界面,還包括用于選擇標識信息項的用戶控制。搜索處理器可操作用于精煉(refine)搜索,以標識與選擇的信息項有關的信息項。同樣,給用戶提供了這樣的便利通過相對于如在相互相似的陣列內(nèi)的位置所顯示的項來標識期望的信息項,來精煉搜索。結合相對于可向用戶顯示的陣列中位置的信息項的排列,提供了搜索并精煉搜索結果的便利。此外,便于信息項的導航,當信息項的量很大時,這特別有利。本發(fā)明解決了一個定義搜索信息項的搜索查詢并精煉信息項搜索的技術問題,這對于搜索導航大量數(shù)據(jù)特別有利。表征信息特征可包括描述信息項內(nèi)容或屬性的元數(shù)據(jù)、視頻圖像或音頻信號或音頻元數(shù)據(jù)、或這些類型表征信息特征的組合。同樣,為了精煉信息項的搜索,用戶控制可操作用于根據(jù)與標識項相關聯(lián)的元數(shù)據(jù)、視頻圖像或音頻元數(shù)據(jù)來選擇所標識的信息項。搜索處理器可操作用于搜索包括相同和/或相似元數(shù)據(jù)、相同和/或相似視頻圖像、或相同和/或相似音頻元數(shù)據(jù)的信息項的信息項集合。例如,搜索處理器可比較從與選擇的信息項相關聯(lián)的元數(shù)據(jù)中形成的特征向量,以找到最靠近這個特征向量的陣列中的位置。隨后,搜索處理器可操作用于搜索有關與用戶選擇的標識信息項相關聯(lián)的元數(shù)據(jù)的信息項集合。搜索處理器標識來自所述集合的信息項,所述信息項在來自最靠近所述特征向量的陣列中的位置的陣列內(nèi)的預定數(shù)量位置內(nèi)。用戶控制可操作用于給用戶提供選擇多個標識信息項的便利,并根據(jù)布爾邏輯指定標識項之間的搜索關系。結果,可根據(jù)用戶指定的布爾算子來組合多個表征特征以形成搜索查詢。同樣,可針對用戶感興趣的信息項來進行更多關注的搜索。根據(jù)本發(fā)明的另一方面,提供了圖形用戶界面,它包括用于從信息項集合中選擇信息項的場的行。根據(jù)與各行相關聯(lián)的表征信息特征的不同類型,各行定義形成搜索查詢的搜索條件。如果在每行提供了多個信息特征,則通過布爾算子指定搜索條件。相應地,用戶可根據(jù)在界面的不同行中選擇的信息項來指定搜索查詢。 本發(fā)明的其它各方面和特征在所附權利要求書中定義。
現(xiàn)在將參考附圖僅通過示例的方式來描述本發(fā)明的實施例,附圖中圖1示意性地示出了信息存儲與檢索系統(tǒng);圖2是顯示自組織映射(SOM)生成的示意性流程圖;圖3a和北示意性地示出了項頻率直方圖;圖如示意性地示出了原始特征向量;圖4b示意性地示出了減小的特征向量;圖5示意性地示出了 SOM ;圖6示意性地示出了抖動(dither)過程;圖7-9示意性地示出了提供用戶界面以訪問由SOM表示的信息的顯示屏;圖10提供了根據(jù)本發(fā)明實施例的信息檢索裝置的示意性框圖;圖11提供了表示生成在搜索中標識的信息項的分層配置過程的部分流程圖的說明性表示;圖12提供了提供用于顯示圖11所示不同層次級的兩個區(qū)域的屏幕的示意性表示;圖13提供了示例信息項的三種表征信息特征的說明性表示;圖14提供了根據(jù)本發(fā)明范例性實施例用于形成搜索查詢的圖形用戶界面的示意性說明;圖15提供了根據(jù)布爾“AND”運算形成合成特征向量的示意性說明;圖16示出了根據(jù)布爾“OR”算子的兩個特征向量的組合以及根據(jù)布爾“NOT”算子的第三特征向量;圖17示意性地示出了根據(jù)圖16的布爾算子和特征向量來顯示搜索結果的標識信息項的一部分二維映射;圖18(a)和18(b)提供了提供形成搜索查詢的兩個視頻圖像的色彩直方圖的兩個實例的條形圖,以及圖18(c)提供了通過組合圖18(a)和18(b)的色彩直方圖而產(chǎn)生的示意性條形圖。
具體實施例方式圖1是基于通用計算機10的信息存儲和檢索系統(tǒng)的示意圖,該計算機10具有處理器單元20,該處理器單元20包括程序和數(shù)據(jù)的盤存儲器30、連接到網(wǎng)絡50 (諸如以太網(wǎng)或互聯(lián)網(wǎng))的網(wǎng)絡接口卡40、諸如陰極射線管設備60的顯示設備、鍵盤70以及諸如鼠標 80的用戶輸入設備。該系統(tǒng)在程序控制下工作,程序存儲在盤存儲器30上,并例如通過在網(wǎng)絡50、移動盤(未示出)或盤存儲器30上預先安裝來提供。存儲系統(tǒng)工作在兩種通用工作模式下。在第一種模式下,信息項集合(例如文本信息項)安裝在盤存儲器30上或通過網(wǎng)絡50連接的網(wǎng)絡盤驅動器上,并對其進行分類和索引,準備搜索操作。第二種工作模式是對索引并分類的數(shù)據(jù)進行實際搜索。這些實施例可應用于許多類型的信息項。適當類型信息的非窮盡列表包括專利、 視頻材料、電子郵件、演示、互聯(lián)網(wǎng)內(nèi)容、廣播內(nèi)容、商業(yè)報告、音頻材料、圖形和剪輯圖、照片等、或這些信息的任意組合或混合。在本描述中將參照文本信息項。文本信息項可與非文本項相關聯(lián),或鏈接到非文本項。因此,例如音頻和/或視頻材料可與定義文本項中那個材料的文本信息項的“元數(shù)據(jù)”相關聯(lián)。信息項以常規(guī)方式加載在盤存儲器30上。它們最好存儲為允許更容易檢索并索引信息項的一部分數(shù)據(jù)庫結構,但這不是必需的。一旦信息以及項如此存儲了,就執(zhí)行圖2 中示意性示出的配置它們搜索的過程。要理解到,索引的信息項不必存儲在本地盤驅動器30上。信息項可存儲在通過網(wǎng)絡50連接到系統(tǒng)10的遠程驅動器上。作為一種備選方案,可以分布式方式存儲信息,例如經(jīng)過互聯(lián)網(wǎng)的各種網(wǎng)站。如果信息存儲在不同互聯(lián)網(wǎng)或網(wǎng)絡站點上,則信息存儲的第二級可用于本地存儲一個到遠程信息的鏈接(例如通用資源標識符URI),可能具有相關簡介、 摘要或與那個鏈接相關聯(lián)的元數(shù)據(jù)。因此,雖然為了下面的技術描述,可將遠程保存的信息、或摘要/簡介/元數(shù)據(jù)、或鏈接/URI認為是“信息項”,但除用戶選擇的相關鏈接(例如來自下面要描述的結果列表260)之外,不會訪問遠程保存的信息。換言之,“信息項”的形式定義是導出并處理(參見下文)特征向量以提供到SOM 映射的項。結果列表沈0(參見下文)中所示的數(shù)據(jù)可以是用戶尋找的實際信息項(如果是本地保存并足夠短便于顯示),或者可以是表示和/或針對諸如一個或多個元數(shù)據(jù)、URI、摘要、關鍵詞集合、代表性關鍵印記(stamp)圖像等的信息項的數(shù)據(jù)。在通常(盡管不總是) 包括列出表示信息項集合數(shù)據(jù)的操作“列表”中,這是固有的。表示信息項的數(shù)據(jù)可包括不同類型的信息。各信息項的信息類型和表示各類型的數(shù)據(jù)被稱為表征信息特征。在另一實例中,信息項可通過聯(lián)網(wǎng)的工作組(諸如研究組或合法公司)存儲?;旌戏椒砂ㄒ恍┍镜卮鎯Φ男畔㈨棥⒑?或一些通過局域網(wǎng)存儲的信息項、和/或一些通過廣域網(wǎng)存儲的信息項。在這種情況下,該系統(tǒng)在定位例如由大型跨國研究和開發(fā)組織中的其他人從事的相似工作中是有用的,相似研究工作傾向于映射到SOM(參見下文)中的相似輸出節(jié)點上?;蛘撸绻邉澬碌碾娨暪?jié)目,則本技術可用于通過找出具有相似內(nèi)容的先前節(jié)目來檢查其獨創(chuàng)性。還要理解到,圖1的系統(tǒng)10只是可以使用索引信息項的可能系統(tǒng)的一個示例。雖然設想初始(索引)階段可由相當強大的計算機來執(zhí)行,最可能是非便攜式計算機,但后面的訪問信息階段可在便攜式機器上執(zhí)行,諸如“個人數(shù)字助理”(帶有顯示器和用戶輸入設備的數(shù)據(jù)處理設備的術語,該設備通常適合單手)、諸如膝上型電腦的便攜式計算機、或甚至是諸如移動電話、視頻編輯裝置或攝像機的設備。通常,實際上任何具有顯示器的設備都可用于操作的信息訪問階段。這些過程并不局限于特定數(shù)量的信息項。現(xiàn)在參照圖2-6來描述生成信息項的自組織映射(SOM)表示的過程。圖2是說明 SOM映射過程之前的所謂“特征提取”過程的示意性流程圖。數(shù)據(jù)提取是將原始數(shù)據(jù)轉換為抽象表示的過程。隨后,這些抽象表示可用于諸如模式分類、聚類和識別的過程。在此過程中,生成所謂的“特征向量”,其是文檔內(nèi)所用項頻率的抽象表示。通過創(chuàng)建特征向量來形成可視化的過程包括·創(chuàng)建項的“文檔數(shù)據(jù)庫詞典”;
·基于“文檔數(shù)據(jù)庫詞典”創(chuàng)建各個文檔的“項頻率直方圖”;·使用隨機映射來減小“項頻率直方圖”的維數(shù);·創(chuàng)建信息空間的2維可視化。更詳細地考慮這些步驟,依次打開各文檔(信息項)100。在步驟110,從文檔中去掉所有“無用詞”。無用詞是在預先準備列表上極其常用的單詞,諸如“a”、“the”、 “h0Wever”、“ab0ut”、“andm“the”。因為這些單詞極其常用,因此它們可能在所有足夠長的文檔中平均出現(xiàn)的頻率差不多。由于這個原因,所以在試圖表征特定文檔內(nèi)容時它們的用途很小,并因此應該去掉。去掉無用詞之后,在步驟120對剩下的單詞進行詞干化(stem),包括找出單詞的變形的共同詞干。例如,單詞“thrower”、“throws”和“throwing”的共同詞干是“throw”。保留在文檔中(排除了“無用”詞)出現(xiàn)的詞干化單詞的“詞典”。當遇到一個新詞時,將其加到詞典中,并還記錄該詞已在整個文檔集合(信息項集合)中出現(xiàn)次數(shù)的運行計數(shù)(running count) 0結果是在集合中的所有文檔中所用的項列表,以及那些項出現(xiàn)的頻率。不理會出現(xiàn)頻率太高或太低的單詞,也就是說將它們從詞典中去掉,并且不參與下面的分析。頻率太低的單詞可能是拼錯、編造、或與文檔集合表示的領域不相關的詞。出現(xiàn)頻率太高的單詞不適于辨別集合內(nèi)的文檔。例如,在與廣播相關的文檔測試集合中大約所有文檔的三分之一中都使用了項“News”,而單詞“football”在該測試集合中只有大約2%的文檔使用。因此可以假定“football”是比“News”更好的表征文檔內(nèi)容的項。相反,單詞 "fottbal “footkil 1”的錯拼)在整個文檔集合中只出現(xiàn)一次,因此由于出現(xiàn)頻率太低而被丟棄。這種單詞可定義為那些具有出現(xiàn)頻率比小于平均出現(xiàn)頻率的兩個標準偏差低的單詞,或是出現(xiàn)頻率比大于平均出現(xiàn)頻率的兩個標準偏差高的單詞。隨后,在步驟130生成特征向量。為了做到這一點,為集合中的每個文檔生成項頻率直方圖。通過對單詞在各個文檔內(nèi)的詞典(屬于那個文檔集合)中出現(xiàn)的次數(shù)進行計數(shù),來構造項頻率直方圖。詞典中的大多數(shù)項不會出現(xiàn)在單一文檔中,因此這些項的頻率為零。圖3a和北示出了兩個不同文檔項頻率直方圖的示意性示例。從這個實例可以看出直方圖是如何表征文檔內(nèi)容的。通過觀察這些實例看到,文檔1中項“MPEG”和“視頻”的出現(xiàn)次數(shù)比文檔2多,文檔2中項“元數(shù)據(jù)”的出現(xiàn)次數(shù)較多。 直方圖中的許多條目都為零,這是因為在文檔中沒出現(xiàn)對應的詞。在一個真實例子中,實際項頻率直方圖具有的項的數(shù)量遠大于該例中的數(shù)量。通常情況下,給直方圖超過50000的維數(shù),直方圖可描繪超過50000個不同項的頻率。如果直方圖要用于構建SOM信息空間,則這個直方圖的維數(shù)需要大大減小。項頻率直方圖中的每個條目都被用來表示那個文檔特征向量中的相應值。這個過程的結果是一個(50000X1)向量,它包含由詞典為文檔集合中各文檔指定的所有項頻率。 由于大部分值通常為零,其它大部分詞通常為非常小的數(shù)(例如1),所以該向量可稱為“稀疏向量”。在步驟140減小特征向量的大小,并因此減小項頻率直方圖的維數(shù)。為減小直方圖維數(shù)的過程提出了兩種方法。
i)隨機映射-一種將直方圖與隨機數(shù)矩陣相乘的技術。這是一個計算上很便宜的過程。ii)隱性語義索引-一種通過尋找文檔中同時出現(xiàn)的概率很高的項的組合來減小直方圖維數(shù)的技術。隨后,這些詞的組合可被減小為單一參數(shù)。這是一個計算上很昂貴的過程。在本實施例中,所選擇的用于減小項頻率直方圖維數(shù)的方法是“隨機映射”,上面提到的Kaski文章中對這種方法進行了詳細描述。隨機映射通過將直方圖與隨機數(shù)矩陣相乘而成功地減小了直方圖的維數(shù)。如上所述,“原始”特征向量(圖如中示意性地示出了)一般是大小在50000個值范圍內(nèi)的稀疏向量。這可減小到大約200個(參見示意圖4b),并仍保持了特征向量的相對正交特征,即,它的關系,諸如與其它同樣處理的特征向量的相對角(向量點積)。因為盡管特定維數(shù)的正交向量的數(shù)量有限,但幾乎正交的向量的數(shù)量很大,所以該方法有效。事實上,隨著向量維數(shù)的增加,任何給定的隨機生成的向量集合幾乎都彼此正交。 這種性質意味著將保持與隨機數(shù)矩陣相乘的向量的相對方向。這可通過在隨機映射之前和之后通過查看其點積來示出向量的相似性而進行論證??捎脤嶒灥姆椒ㄊ境觯ㄟ^將稀疏向量從50000個值減小到200個值來保持其相對相似性。然而,這個映射并不完善,但對于以簡潔方式表征文檔內(nèi)容而言足夠了。—旦為文檔集合生成了特征向量,從而定義了集合的信息空間,就在步驟150將它們投入二維SOM中以創(chuàng)建語義映射。下面部分說明通過使用Kohonen自組織映射對特征向量進行聚類來映射到2D的過程。還參考了圖5。Kohonen自組織映射用于聚類并組織為各文檔生成的特征向量。自組織映射包括顯示為二維平面185的節(jié)點的二維陣列或柵格中的輸入節(jié)點170 和輸出節(jié)點180。輸入節(jié)點與用于訓練映射的特征向量中的值一樣多。映射上的每個輸出節(jié)點由加權連接190( —個連接一個加權)連接到輸入節(jié)點。開始,每個這些加權都設為隨機值,并隨后通過迭代過程“訓練”加權。通過將每個特征向量呈現(xiàn)到映射的輸入節(jié)點來訓練該映射。通過計算輸入向量和與各輸出節(jié)點相關聯(lián)的加權之間的歐氏距離來計算“最靠近的”輸出節(jié)點。由輸入向量和與那個節(jié)點相關聯(lián)的加權之間的最小歐氏距離所標識的最靠近的節(jié)點被指定為“勝利者”,并通過稍微改變加權值來訓練這個節(jié)點的加權,以使它們向“更靠近”輸入向量的方向移動。除了獲勝節(jié)點之外,還訓練獲勝節(jié)點鄰域內(nèi)的節(jié)點,并稍微向更靠近輸入向量的方向移動。這不只是訓練單個節(jié)點加權的過程,而且是訓練映射上節(jié)點區(qū)域加權的過程,其允許一旦映射被訓練了就保持節(jié)點2D映射中的輸入空間的大量拓撲。—旦訓練了映射,各文檔就被呈現(xiàn)到該映射上,以查看對于那個文檔哪個輸出節(jié)點最靠近輸入特征向量。加權等于特征向量是不太可能的,并且特征向量與映射上其最靠近的節(jié)點間的歐氏距離被稱為它的“量化誤差”。通過將各文檔的特征向量呈現(xiàn)到該映射上,來查看它在哪產(chǎn)生各文檔的X、y映射位置。當這些χ、y位置與文檔ID —起放進查找表時,可用來對文檔間的關系進行可視化。最后,在步驟160加入抖動分量,下面參照圖6描述該步驟。
用上述過程的潛在問題是兩個相同或基本相同的信息項可映射到SOM節(jié)點陣列中的同一節(jié)點。這沒有引起處理數(shù)據(jù)方面的困難,但對顯示屏上數(shù)據(jù)的可視化(下面將描述)沒有幫助。特別是,當在顯示屏上可視化數(shù)據(jù)時,已經(jīng)認識到,對于在特定節(jié)點處的單個項上可辨別的多個非常相似的項而言,這是有用的。因此,將“抖動”分量加到各信息項映射的節(jié)點位置上。抖動分量是節(jié)點間隔的士 1/2的隨機增加。因此,參照圖6,映射過程選擇輸出節(jié)點200的信息項具有添加的抖動分量,以便它實際上可映射到圖6上由虛線界定的區(qū)域210內(nèi)的節(jié)點200周圍的任何映射位置。因此,可認為信息項映射到了圖6平面上的位置,在節(jié)點位置而不是SOM過程的 “輸出節(jié)點”。在任何時候,通過上面概述的步驟(即步驟110-140)并隨后將結果減小的特征向量應用到“預訓練”的SOM模型上,S卩,由映射的自組織準備產(chǎn)生的SOM模型集合,可將新的信息項添加到SOM上。因此,對于新添加的信息項,映射一般不被“再訓練”;代替步驟150 和160用于所有未修改的SOM模型。為再訓練SOM每次添加新信息項是計算上很昂貴的, 并且對用戶也不友好,用戶可能已習慣于映射中通常訪問的信息項的相對位置。然而,有可能達到再訓練過程是適當?shù)倪@一點。例如,如果自從首次生成SOM時新項(可能是新聞的新項或新的技術領域)就已經(jīng)進入了詞典,則它們不可能非常好地映射到輸出節(jié)點的現(xiàn)有集合。在將新近接收的信息項映射到現(xiàn)有SOM的過程中,這可被檢測為在檢測的所謂“量化誤差”中的一個增加。在本實施例中,將量化誤差與閾值誤差量相比較。如果它大于閾值量,則(a)使用所有其原始信息項和自從其創(chuàng)建所添加的任何項,來自動再訓練S0M;或者(b)使用戶在方便的時候開始再訓練過程。再訓練過程使用所有相關信息項的特征向量,并全部再次應用步驟150和160。圖7示意性地示出了顯示屏60上的顯示。該顯示示出了搜索查詢250、結果列表 260以及SOM顯示區(qū)270。在操作中,最初顯示區(qū)270是空白的。用戶在查詢區(qū)250輸入關鍵詞搜索查詢。隨后,用戶例如通過按鍵盤70上的回車或通過使用鼠標80選擇屏幕“按鈕”來啟動搜索,以開始搜索。隨后,使用標準關鍵詞搜索技術,將搜索查詢區(qū)250中的關鍵詞與數(shù)據(jù)庫中的信息項相比較。這生成結果列表,各結果顯示為列表區(qū)沈0中的各個條目觀0。于是顯示區(qū)270 顯示與各結果項相對應的顯示點。因為生成SOM表示的分類過程傾向于在SOM中將相互相似的信息項集中在一起, 所以搜索查詢結果通常傾向于歸入諸如聚類四0的聚類中。在此要注意的是,區(qū)域270上的各點對應于與結果列表260中的一個結果相關聯(lián)的SOM中的各條目;并且在區(qū)域270中顯示的點的位置對應于節(jié)點陣列內(nèi)那些節(jié)點的陣列位置。圖8示意性地示出了一種減少“命中”(結果列表中的結果)數(shù)的技術。用戶用鼠標80在區(qū)域270中顯示的顯示點集合的周圍拖出一個邊界,在本實例中是矩形框300。在結果列表區(qū)沈0中,只顯示了與邊界300內(nèi)的點相對應那些結果。如果這些結果證明是不感興趣的,則用戶可拖出包含不同顯示點集合的另一邊界。要注意的是,對于在邊界300內(nèi)顯示的顯示點并滿足單詞搜索區(qū)250中搜索標準的那些結果,結果區(qū)260顯示了列表條目。邊界300可包含與在節(jié)點陣列中填充的節(jié)點相對應的其它顯示位置,但如果這些不滿足搜索標準,則不會顯示它們,并因此不會形成在列表沈0中顯示的一部分結果子集。圖9示出了本發(fā)明的實施例。參照圖9,步驟920,當生成自組織映射SOM時,它沒有標簽(不象Kohonen的S0M)。用戶需要標簽以給出研究映射的導引。在本發(fā)明的實施例中,自動生成標簽以匹配用戶的特殊要求。用戶生成如參照圖7和/或圖8描述的搜索結果列表。根據(jù)結果自動動態(tài)地生成標簽,并將其用于標記區(qū)域270中顯示點的聚類。-胃鮮· /現(xiàn)在將參照圖10、11和12來描述本發(fā)明的示范性實施例。在圖10中,包含信息項數(shù)據(jù)庫的數(shù)據(jù)中心庫400通過數(shù)據(jù)通信網(wǎng)絡410連接到搜索處理器404和映射處理器412。映射處理器連接到用戶控制414和顯示處理器416。圖形用戶界面418接收顯示處理器416的輸出,該圖形用戶界面418對接到顯示器420。顯示處理器416可操作用于處理來自映射處理器的數(shù)據(jù),用于在顯示屏上顯示。數(shù)據(jù)中心庫400可單獨定位到映射處理器412。相應地,搜索處理器可從數(shù)據(jù)中心庫400、映射處理器412和圖10所示用于顯示信息的那些部分來單獨定位,其中那些部分是指顯示處理器416、圖形用戶界面418和顯示器420。備選地,映射處理器412、搜索處理器 404以及顯示處理器416可以在通用計算機(諸如圖1所示的)上運行的軟件模塊的形式來實現(xiàn)。然而,要理解到,映射處理器、搜索處理器和顯示處理器可分別產(chǎn)生和定位。結合圖7、8和9中的說明,圖10所示的實施例基本操作為圖1所示的存儲及檢索數(shù)據(jù)處理器。圖7、8和9提供了如何相對于搜索查詢來搜索信息項以及如何顯示搜索結果的示例說明。相應地,圖10所示的實施例配置為接收搜索查詢,例如來自用戶控制414的關鍵詞。響應該關鍵詞,搜索處理器404處理該搜索,以結合映射處理器來標識對應于標識為搜索結果的信息項的陣列中的χ、y位置集合。例如,對于40X40的節(jié)點陣列,在方形二維陣列中有1600個位置。如上所述,搜索處理器根據(jù)搜索查詢來搜索信息項。通過搜索處理器的搜索產(chǎn)生由搜索處理器標識為對應于搜索查詢的信息項的x、y位置集合。映射處理器412接收搜索結果的χ、y位置。在備選實施例中,搜索處理器404可配置為搜索信息項并生成搜索結果,該搜索結果標識與搜索查詢相對應的信息項。隨后,映射處理器412可接收表示標識對應于搜索查詢的信息項的搜索結果的數(shù)據(jù)。隨后,映射處理器生成與標識的信息項相對應的陣列中位置的x、y坐標。映射處理器412可操作用于通過實施k_均值聚類算法來標識在第一全級的信息項聚類。k_均值聚類算法標識聚類以及陣列內(nèi)該聚類的位置。在標題為“用于模式識別的神經(jīng)網(wǎng)絡,,("Neural Networks for Pattern Recognition", by Christopher M. Bishop, pp 187-188,Oxford University Press)的書中公開了 k_均值聚類算法。在如下網(wǎng)址中公開了 k-均值聚類算法的更多公開http://cne. Rmu. edu/modules/dau/stat/clustRalRs/clust5 bdy. html。如圖11所示,關鍵詞“表演”的搜索結果可標識與以單詞“表演”作為其元數(shù)據(jù)一部分的信息項相對應的陣列中的位置。因此,在陣列上執(zhí)行k_均值聚類算法的結果標識了例如“知識競賽”、“游戲”和“DIY”的三個聚類。信息項的這些聚類形成第一層次級h_ level 1。顯示處理器416接收來自映射處理器412與第一層次級h_levell的信息項聚類相對應的數(shù)據(jù)。顯示處理器416處理數(shù)據(jù)的第一層次級,以便提供表示這個第一層次級h_Ievell的二維顯示的數(shù)據(jù)。顯示處理器416產(chǎn)生的數(shù)據(jù)饋送到圖形用戶界面418,用于在如圖12所示的顯示屏420上的第一區(qū)430中顯示。在一些實施例中,可通過映射處理器412執(zhí)行進一步操作,以使用k-均值算法來精煉聚類的標識。進一步操作被稱為“k-均值聚類與修剪”。已知的k-均值聚類過程標識在表示相似信息項的搜索結果中標識的信息項的陣列位置組合。隨后執(zhí)行進一步修剪過程, 該進一步修剪過程確定結果項x、y位置的相鄰子聚類是否為同一主聚類的一部分。如果兩個子聚類的中心之間的距離小于閾值,則這兩個子聚類被認為是同一主聚類的一部分。用已知方法反復地執(zhí)行修剪,直到聚類穩(wěn)定。映射處理器412操作執(zhí)行對在第一層次級h_levell標識的信息項的各聚類的進一步分析。為了向用戶提供單獨檢查信息項聚類并標識那些信息項內(nèi)其它聚類的便利,映射處理器412形成另一層次級。相應地,對于信息項的各聚類,對那個聚類執(zhí)行k-均值聚類算法,以標識信息項的那個第一層次級內(nèi)的其它聚類。因此,例如如圖11所示,如果在“知識競賽”聚類上執(zhí)行k-均值算法,則在第二層次級h_level2標識其它三個聚類。如對于第一層次級所說明的,根據(jù)關鍵詞標記各聚類。通過找出最通用的詞來標識關鍵詞,最通用的詞是指聚類中每個信息項都存在與那個信息項相關聯(lián)的元數(shù)據(jù)。因此, 例如在第一層次級中,通過詞“知識競賽”、“游戲”和“DIY”標識了三個聚類。以標記第一層次級h_levell聚類的相應方式,對第二層次級h_level2中的各聚類標識關鍵詞。相應地,三個聚類被標記為“主持人”、“淘汰(wipeout) ”以及“對手參與 (enemy within)”。這三個聚類每個都包括知識競賽表演的不同片段。這是可以理解的,可進行進一步重復分析各聚類。這是通過在第二層次級h_ level2標識的各聚類上執(zhí)行k-均值算法來實現(xiàn)。如圖11所示,使用k_均值聚類算法來進一步分析“淘汰”信息聚類。然而,在第三層次級h_level3,只顯示了單個信息項,并因此如圖11所示,第三層次級h_level3標識了 “淘汰”的各個片段。因此,映射處理器412可操作用于標識在不同層次級信息項的聚類。表示各層次級的數(shù)據(jù)被饋送到顯示處理器416。相應地,結合圖形用戶界面418,第二區(qū)可被顯示在例如與第二層次級h_level2相對應的顯示器420上。因此,使用縮放控制用戶可放大在第一層次級h_levell中顯示的聚類。使用用戶控制414可操作縮放控制。相應地,放大特定的聚類可對顯示信息項的第二層次級h_level2有影響?;蛘撸脩艨刂?14可用于選擇第一區(qū)內(nèi)的“當前視圖”區(qū)域。相應地,相對于在第一顯示中所示的第一層次級h_levell標識的“知識競賽”聚類內(nèi)所標識的聚類來說明第二顯示。本發(fā)明實施例提供的另一優(yōu)點是在顯示器的第二或后續(xù)區(qū)域中顯示的第二或后續(xù)級的配置可設置有其它聚類的指示符。該指示符可將用戶指向與在較低層次級觀察到的聚類相關聯(lián)的關鍵詞的備選聚類。因而,在第二顯示區(qū)440內(nèi)的較低層次級示出的聚類將有正查看聚類的備選聚類。例如,在圖12中,在第一顯示區(qū)430中,第一層次級示出了三個聚類“知識競賽”、“游戲”和“DIY”。由于縮放控制用于在“知識競賽”聚類進行放大,于是第二顯示區(qū)440提供了“知識競賽”聚類內(nèi)的聚類顯示,它們是“主持人”、“對手參與”和“淘汰”。然而,“知識競賽”聚類的備選關鍵詞是如在第一區(qū)所示的“DIY”、“恐怖”和“游戲”。 相應地,提供箭頭444、446和448,以將用戶指向與在第二顯示區(qū)中顯示的“知識競賽”聚類同一層次級的信息項聚類。相應地,如果用戶隨后想查看來自第一層次級的不同聚類以顯示第二層次級中的聚類,則用戶可用箭頭導航到第一層次級內(nèi)的備選聚類。此外,有利的是,用出現(xiàn)在第一層次級中聚類的關鍵詞標簽來標記箭頭。在其它實施例中,為了向用戶提供聚類中相對項的數(shù)量的說明,于是在與方向指示箭頭相關的關鍵詞旁顯示這個數(shù)量。當鼠標指針MP通過或定位在指示箭頭上時,用戶控制與顯示器可配置為指示這個數(shù)量。一些實施例的其它有利特征是提供了附加關鍵詞列表,S卩,與第一級聚類內(nèi)的第二級聚類相關的關鍵詞。如圖12所示,對于提供“恐怖”的其它第一級聚類的聚類,當鼠標指針MP定位在與“恐怖”相關的箭頭上時,于是生成與那個第一級聚類“恐怖”內(nèi)的第二級聚類相對應的附加詞。結果,在不必查看第二顯示區(qū)440內(nèi)的那些聚類的情況下,向用戶提供了與第一級聚類相關的信息項內(nèi)容的非常有效的說明。如圖12所示,顯示區(qū)還可包括通常如450所示的控制圖標,其用于在第一顯示區(qū)430中出現(xiàn)的信息項周圍查看并導航。斜就職_現(xiàn)在將參照圖10并結合圖13-17來描述本發(fā)明的另一示范性實施例。圖13提供了表征信息特征類型的說明性表示,其以與信息項相關聯(lián)的方式存儲。例如,信息項可以是來自電視節(jié)目的一段音頻/視頻數(shù)據(jù)。在該實例中,節(jié)目提供了足球賽的最精彩部分。相應地,數(shù)據(jù)項包括視頻數(shù)據(jù)460和音頻數(shù)據(jù)。與音頻數(shù)據(jù)有關的是在框462中示出的音頻元數(shù)據(jù)。音頻元數(shù)據(jù)描述與視頻數(shù)據(jù)相關的音頻信號的內(nèi)容和類型。對于本示例,音頻數(shù)據(jù)包括“音樂”、“評論”、“嘈雜聲”,但也可包括指示音頻信號類型的一個或多個其它類型的元數(shù)據(jù)。除視頻數(shù)據(jù)和音頻數(shù)據(jù)外,信息項還可包括描述視頻和音頻數(shù)據(jù)內(nèi)容或屬性的其它元數(shù)據(jù)。對于本示例,元數(shù)據(jù)在框464內(nèi)說明了,并顯示為包括視頻節(jié)目內(nèi)容的描述。是包含在這個元數(shù)據(jù)中的詞用于構建生成SOM的特性向量。然而,在本發(fā)明的其它實施例中, 可相對于是音頻元數(shù)據(jù)462或在視頻數(shù)據(jù)上的音頻數(shù)據(jù),來搜索包含在數(shù)據(jù)中心庫400中的信息項集合。為此,可從視頻數(shù)據(jù)460的幀中生成代表性關鍵印記。通過形成視頻數(shù)據(jù)各幀的色彩直方圖,來生成代表性關鍵印記RKS。對所有或選擇的視頻幀的色彩直方圖進行組合,并隨后進行標準化,以產(chǎn)生合成的色彩直方圖,其以如圖13中的條形圖466的代表性形式進行說明。隨后將合成的色彩直方圖與各視頻幀的色彩直方圖相比較。通過對各視頻幀色彩直方圖的各列與合成直方圖的對應列的距離求和, 來確定各幀色彩直方圖與合成色彩直方圖之間的距離。選擇相對于合成色彩直方圖具有最小距離的色彩直方圖的代表性關鍵印記RKS。對于描述足球賽的節(jié)目,則相應產(chǎn)生的代表性關鍵印記最可能是一部分足球場的視頻圖像,通過圖13所示的代表性關鍵印記RKS對其進行說明。在其它實施例中,可通過如下任一方法從視頻幀中生成各信息項的RKS ·用戶可選擇認為是與信息項的整個內(nèi)容相對應的最具代表性幀的幀。這個方法可提供改進的可靠性,因為用戶確保選擇了主觀上代表信息項的視頻幀。然而,這種方法較費時。 用戶可選擇信息項內(nèi)的第一幀或隨機幀。對于選擇適當?shù)腞KS,這是可靠性較低的方法?!ぴO想基于圖像幀內(nèi)容來處理視頻幀并選擇RKS的其它方法。本發(fā)明的實施例可提供基于選擇的表征信息特征來產(chǎn)生精煉搜索的便利。在一個實施例中,搜索處理器142可操作用于根據(jù)元數(shù)據(jù)、視頻圖像或音頻數(shù)據(jù)的項來搜索在第一次搜索中標識的那些信息項。在備選實施例中,可只在元數(shù)據(jù)、或只在視頻數(shù)據(jù)、或只在音頻數(shù)據(jù)、或其中的任意組合上進行搜索。為了便于搜索查詢的形成,圖10所示的顯示設備420可包括由圖14所示的圖形用戶界面418所提供的另一圖形顯示。在圖14中,顯示區(qū)472內(nèi)的第一行470向用戶提供了基于元數(shù)據(jù)選擇查詢信息的便利。相應地,如果來自信息項的圖像代表性關鍵印記放在這行的窗口內(nèi),則將與這個信息項(如圖13所示的)相關的元數(shù)據(jù)添加到搜索查詢中。因此,可將來自不同信息項的一個或多個代表性關鍵印記引入到類型元數(shù)據(jù)的表征信息特征的搜索查詢中。相應地,引入用戶已經(jīng)選擇的第二行474視頻幀,以形成一部分搜索查詢。例如,用戶可瀏覽視頻數(shù)據(jù)的特定項,并選擇感興趣的幀。用戶隨后可將這個圖像幀放在行474,以形成一部分搜索查詢。 用戶可引入一個或多個視頻幀。用戶還可根據(jù)信息項內(nèi)的音頻數(shù)據(jù)來選擇要搜索的那個信息項。相應地,顯示區(qū)內(nèi)的第三行476向用戶提供了這樣的便利引入那個信息項的代表性圖像,以標識在音頻數(shù)據(jù)行內(nèi)搜索查詢要包含與搜索查詢內(nèi)的那個信息項相對應的音頻數(shù)據(jù)。除了根據(jù)表征信息特征的類型來選擇要搜索的信息項之外,本發(fā)明的實施例還提供了根據(jù)選擇的信息項之間的布爾算子進行搜索的便利。如圖14所示,要根據(jù)如在前兩列 478,480之間所示的“AND”算子來搜索已經(jīng)對于元數(shù)據(jù)搜索而選擇的信息項。然而,在搜索查詢中第一元數(shù)據(jù)與第一視頻圖像項之間的搜索查詢由“OR”算子連接。要對于視頻圖像數(shù)據(jù)搜索的兩個項由“AND”算子連接。要根據(jù)音頻數(shù)據(jù)搜索的信息項還要根據(jù)“NOT”算子在搜索查詢中搜索。已經(jīng)建立了搜索查詢,搜索處理器404可操作用于根據(jù)從用戶作的選擇而構建的、并在圖14中說明的搜索查詢來搜索從關鍵詞搜索中標識的信息項。搜索處理器根據(jù)選擇的表征信息特征類型來不同地搜索信息項,這將在下面段落中解釋。對于搜索表征信息特征(諸如元數(shù)據(jù))的實例,然后對于任意信息項,從元數(shù)據(jù)生成的那個信息項的特征向量可用于標識與那個特征向量相對應的二維陣列中的點。相應地,陣列中那個所標識位置的預定距離內(nèi)的信息項可作為搜索查詢的結果返回。然而,如果已經(jīng)在元數(shù)據(jù)搜索行內(nèi)選擇了多個信息項,則必須以根據(jù)選擇的布爾算子來搜索這兩個項的方式構建搜索查詢。對于“AND”布爾算子的實例,則組合各信息項的特征向量,以形成如圖15所示的合成特征向量。為此,將與元數(shù)據(jù)內(nèi)每個詞相關聯(lián)的值加到一起,并進行標準化,以產(chǎn)生合成特征向量。因此如圖15所示,將與用戶選擇的元數(shù)據(jù)相關聯(lián)的兩個特征向量A、B組合在一起形成特征向量C,其中用戶選擇的元數(shù)據(jù)具有在元數(shù)據(jù)搜索查詢行470的行470和列 478到480中所示的其代表性關鍵印記。隨后,搜索處理器可得到特征向量C,并將其與SOM 相比較。標識了與合成特征向量C相對應的陣列中的最靠近的位置,將來自陣列中那個標識位置的陣列內(nèi)的預定數(shù)量位置內(nèi)的信息項作為搜索查詢結果返回。對于相應元數(shù)據(jù)搜索的布爾“OR”算子的實例,則對于第一特征向量A和第二特征 B,標識那些特征向量在陣列中的相應位置。同樣,搜索查詢結果要返回陣列中每個那些標識點的預定數(shù)量位置內(nèi)的所有信息項。這在圖16和17中說明了。在圖17中,在二維陣列中標識與特征向量A相對應并與特征向量B相應的位置。如圖17所示,隨后可將陣列中在 A與B陣列位置的預定半徑內(nèi)的位置作為如搜索查詢結果所標識的返回。然而,如果在搜索查詢中標識了另一特征向量C,并對這個另一特征向量指定了 “NOT”布爾算子,則再次標識對應于特征向量C的陣列中的位置。相應地,可再次標識從C的陣列位置的預定半徑內(nèi)的信息項。然而,作為“NOT”算子的結果,從搜索結果中排除在特征向量C以及A和B的陣列位置的半徑之間標識的任何相互包含的陣列位置。因此,搜索處理器配置為返回與從A或 B但不是C產(chǎn)生的陣列中的位置相對應的信息項。對于與作為搜索的表征特征的視頻圖像數(shù)據(jù)相對應的搜索查詢中的第二行,則搜索處理器可操作用于搜索與用戶選擇的視頻圖像相對應的代表性關鍵印記的視頻數(shù)據(jù)。為此,將與用戶選擇的視頻圖像相關聯(lián)的色彩直方圖和與信息項相關聯(lián)的各代表性關鍵印記的色彩直方圖相比較。計算各信息項的代表性關鍵印記的色彩直方圖與用戶指定視頻圖像的色彩直方圖之間的距離。這是通過計算表示那個圖像的色彩分量的各列之間的距離并對各列的這些距離求和來實現(xiàn)的。標識與在用戶選擇的視頻圖像的色彩直方圖和對應于陣列位置的代表性關鍵印記的色彩直方圖之間具有最短距離的信息項相對應的那個陣列位置。 查詢結果將再次返回具有來自標識陣列位置的預定數(shù)量位置內(nèi)的陣列位置的信息項。對于布爾算子的情況,則可通過將布爾“AND”算子選擇并指定的兩個圖像的色彩直方圖相組合而再次形成色彩直方圖。圖18示出了形成合成色彩直方圖的過程。通過對色彩直方圖各列中的值取平均來組合圖14所示的顯示區(qū)內(nèi)的視頻圖像搜索查詢行的行474 和列478、480中提供的第一和第二用戶選擇的圖像的色彩直方圖。從而,組合了圖18a和 18b所示的兩個色彩直方圖,形成在圖18c中形成的色彩直方圖。相對于要搜索的信息項的代表性關鍵印記來搜索的是這個色彩直方圖。對于音頻數(shù)據(jù)的例子,則搜索處理器可從與選擇的信息項相關聯(lián)的音頻元數(shù)據(jù)中形成特征向量。例如,音頻元數(shù)據(jù)可標識存在于音頻信號、語音數(shù)據(jù)中的諧波,或在由音頻元數(shù)據(jù)表示的音頻信號內(nèi)是否存在音樂。此外,元數(shù)據(jù)可標識在音頻信號上是否存在特定的講演者,例如托尼 布萊爾或特別評論員諸如約翰 莫特森。相應地,可從選擇的音頻數(shù)據(jù)中再次生成特征向量,其中該選擇的音頻數(shù)據(jù)可相對于特別與音頻數(shù)據(jù)相關的其它特征向量來搜索。以上面說明的相應方法,布爾算子可用于組合多個音頻元數(shù)據(jù)類型的搜索。對于“AND”算子的實例,可組合音頻元數(shù)據(jù)項,以產(chǎn)生合成的元數(shù)據(jù)項。搜索具有最靠近這個合成項的特征向量的相應信息項將標識一個信息項。當指定“OR”算子時,搜索處理器可隨后恢復在兩個元數(shù)據(jù)項的陣列內(nèi)的預定數(shù)量位置內(nèi)的信息項。再者,“NOT”布爾算子將用來從搜索查詢的結果中排除具有匹配音頻數(shù)據(jù)的返回的信息項。已經(jīng)提供了精煉從標識的信息項中的搜索的本發(fā)明的實施例。然而要理解到,在其它實施例中,可以提供由圖14所示的顯示而形成的搜索查詢以及該搜索查詢相對于元數(shù)據(jù)、視頻圖像數(shù)據(jù)和音頻數(shù)據(jù)的應用,以搜索數(shù)據(jù)中心庫400內(nèi)的整個信息集合。在不脫離本發(fā)明范圍的前提下,可對上述實施例進行各種修改。本發(fā)明的各方面和特征在所附權利要求書中定義。
權利要求
1.一種圖形用戶界面裝置,包括圖形顯示,該圖形顯示包括多個字段,每個字段被布置在多個行中的一行上,所述圖形顯示被配置為顯示形成搜索查詢的用戶選擇查詢信息,并顯示基于所述搜索查詢的信息項集合的搜索結果,所述信息項集合被用于形成可以被搜索的特征向量集合,并且所述信息項集合包括代表一個或多個視頻圖像的數(shù)據(jù)和/或代表音頻信號的數(shù)據(jù),所述圖形用戶界面裝置包括輸入設備,該輸入設備被配置為使得用戶能夠通過選擇一個或多個圖像來填充所述圖形顯示的所述多個字段的每個字段,其中每個圖像代表所述信息項之一,并且每個圖像與表征信息特征相關聯(lián),描述一單個字段中的兩個所選圖像之間的布爾關系,以及描述兩個單個字段中的各自圖像之間的布爾關系;以及搜索處理器,該搜索處理器被配置為基于如下各項來定義所述搜索查詢用戶定義的在所述多個字段中的所選圖像之間的布爾關系,以及與每個圖像相關聯(lián)的表征信息特征的各自類型,所述表征信息特征的各自類型是根據(jù)所述圖像被用戶放置到的字段所確定的,以及基于所述搜索查詢來搜索所述信息項集合。
2.如權利要求1所述的圖形用戶界面裝置,其中每個信息項的代表性圖像幀與一色彩直方圖相關聯(lián),所述搜索查詢用于搜索信息項集合,所述信息項集合是通過組合與在各個字段中的圖像位置相關聯(lián)的色彩直方圖以形成合成特征向量而形成的,并且通過確定所述合成特征向量和針對所述信息項的各個特征向量之間的歐氏距離來執(zhí)行所述搜索。
3.如權利要求1所述的圖形用戶界面裝置,其中所述信息項被按自組織映射來組織, 并且所述圖形用戶界面裝置被布置成顯示所述搜索的結果,所述搜索是由搜索處理器所執(zhí)行的,所述搜索處理器根據(jù)所述搜索查詢搜索所述信息項,以通過如下方式識別信息項基于所述搜索查詢確定所述自組織映射中的針對合成特征向量的最靠近的節(jié)點,并返回在所述最靠近的節(jié)點的預定距離以內(nèi)的信息項,并且所述圖形用戶界面可操作用于根據(jù)由映射處理器所生成的數(shù)據(jù)顯示識別出的信息項中的至少一些信息項的表示,所述數(shù)據(jù)代表來自在所述搜索中識別出的信息項集合的信息項的映射,所述映射根據(jù)信息項的相互相似性、相對于陣列中的位置提供識別出的信息項,其中相似信息項映射到陣列中的相似位置。
4.如權利要求1所述的圖形用戶界面裝置,其中所述圖形用戶界面被布置為顯示所述搜索處理器響應于所述搜索查詢識別出的信息項的表示,并且響應于用于選擇由所述處理器識別出的信息項中的一個或多個的用戶控制,所選的信息項被所述搜索處理器用來細化搜索,以識別與所選的信息項相關的信息項。
5.如權利要求1所述的圖形用戶界面裝置,其中所述所選圖像是代表性關鍵印記。
6.一種基于特征向量顯示對信息項集合的搜索結果的方法,所述特征向量由所述信息項形成,所述搜索基于由用戶所選的查詢信息形成的搜索查詢,所述信息項集合包括代表一個或多個視頻圖像的數(shù)據(jù)和/或代表音頻信號的數(shù)據(jù),所述方法包括通過選擇兩個或更多個圖像來填充圖形顯示的多個字段,其中每個圖像代表所述信息項之一并且與表征信息特征相關聯(lián),每個字段被布置在多個行中的一行上;描述兩個圖像的選擇之間的布爾關系;基于所定義的兩個圖像之間的布爾關系以及與每個圖像相關聯(lián)的所述表征信息特征的各自類型來定義所述搜索查詢,所述表征信息特征的各自類型由所述圖像被放置到的字段所確定;以及基于所述搜索查詢來搜索所述信息項集合。
7.如權利要求6所述的方法,其中每個信息項的代表性圖像幀與一色彩直方圖相關聯(lián),并且用戶所選的搜索查詢是通過如下方式形成的組合與來自各個字段的圖像相關聯(lián)的色彩直方圖,以形成合成特征向量,并且搜索所述信息項集合包括確定所述合成特征向量與針對信息項的各個特征向量之間的歐氏距離。
全文摘要
本發(fā)明涉及信息存儲與檢索。一種用于搜索信息項集合并顯示搜索結果的信息檢索裝置,該信息項各具有表征信息特征的集合。該裝置包括搜索處理器,該搜索處理器可操作用于根據(jù)用戶定義的表征信息特征來搜索信息項,并標識具有與那個用戶定義的表征信息特征相對應的表征信息特征的信息項。映射處理器可操作用于生成表示來自在搜索中標識的信息項集合的信息項映射的數(shù)據(jù)。該映射根據(jù)信息項的相互相似性相對于陣列中的位置提供標識的信息項,相似信息項映射到陣列中的相似位置。該裝置包括用于顯示至少某些標識項的表示的圖形用戶界面,以及用于選擇標識信息項的用戶控制。搜索處理器可操作用于精煉搜索,以標識與選擇的信息項相關的信息項。同樣,給用戶提供了這樣的便利通過相對于如在相互相似的陣列內(nèi)的位置顯示的項而標識期望的信息項來精煉搜索。由此,搜索與導航大量數(shù)據(jù)變得更加容易了。
文檔編號G06F17/30GK102368255SQ20111029518
公開日2012年3月7日 申請日期2003年11月4日 優(yōu)先權日2002年11月27日
發(fā)明者D·W·特雷佩斯, J·R·托爾普 申請人:索尼英國有限公司