專利名稱:統(tǒng)一和混合搜索的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及計算機軟件和搜索引擎,尤其涉及便于從不同資源搜索內(nèi)容的系統(tǒng)和方法。
背景技術(shù):
數(shù)字形式的內(nèi)容的廣泛而迅速的增加提出了一種在各種環(huán)境中搜索信息的新機遇。除無所不在的因特網(wǎng)搜索引擎之外,也有其它常見的搜索工具可供用戶使用。例如,電子郵件應(yīng)用程序可向用戶提供搜索出現(xiàn)在用戶發(fā)送或接收的電子郵件的主標(biāo)題或正文中的信息的工具。在文字處理應(yīng)用程序中,用戶可使用工具來搜索用戶所創(chuàng)建或所訪問的文檔的標(biāo)題或正文中的單詞。其它類型的搜索可包括使用與圖像相關(guān)聯(lián)的元數(shù)據(jù)的圖像搜索。
學(xué)習(xí)如何使用這些不同的搜索工具可能令用戶感到迷惑。首先,現(xiàn)有的搜索工具被設(shè)計成在假定用戶已標(biāo)識了要觀察的特定資源-對許多用戶此假定不一定準(zhǔn)確-的情況下搜索特定的數(shù)據(jù)資源。對于現(xiàn)今的用戶,知道要到何處尋找尤其困難,因為計算機越來越多地使用因特網(wǎng)或其它類型的網(wǎng)絡(luò)鏈接到其它計算機。尋找的可能位置的絕對量,以及一旦到達(dá)該位置所要搜索的數(shù)據(jù)量,令盡可能有效地搜索變得十分重要。確定要到何處尋找,以及挑選出哪些搜索結(jié)果是最相關(guān)的可以是令人生畏的工作。此外,對要尋找的最佳位置以及最相關(guān)結(jié)果的確定可能會迅速地改變,由此很難保持搜索既相關(guān)又有效。
現(xiàn)有搜索工具的另一問題是每一搜索工具具有不同的界面,用戶必須學(xué)習(xí)這些界面以找出他或她正在尋找的內(nèi)容。例如,在Windows XPTM操作系統(tǒng)下的搜索(Search)命令調(diào)用“搜索助理(search companion)”來引導(dǎo)用戶以完全不同于Microsoft Word文字處理程序下的搜索(Search)命令的方式進行搜索,后者用具有選項卡的搜索對話框來提示用戶。
先前有各種努力來為用戶簡化搜索,但這些努力不足以滿足用戶的需求。例如,在因特網(wǎng)搜索引擎的環(huán)境中,允許用戶一次鍵入搜索詞然后同時調(diào)用若干不同的搜索引擎的網(wǎng)站曾經(jīng)是流行的。但是這類網(wǎng)站沒有進一步幫助用戶有效地搜索最相關(guān)的內(nèi)容或從各種搜索中挑選出最相關(guān)的結(jié)果。實際上,當(dāng)返回了比使用單個搜索引擎時更多的結(jié)果時,這類網(wǎng)站可能將用戶的任務(wù)復(fù)雜化。
發(fā)明內(nèi)容
為克服上述問題,提供了一種統(tǒng)一搜索的系統(tǒng)、方法和計算機可訪問媒質(zhì)。該系統(tǒng)和方法便于不同資源的統(tǒng)一搜索,并混合來自搜索的最相關(guān)結(jié)果,以用綜合的方式向用戶呈現(xiàn)。
依照本發(fā)明的一個方面,用戶導(dǎo)航到一統(tǒng)一搜索入口界面并輸入查詢。該統(tǒng)一搜索過程捕捉該查詢的導(dǎo)航上的下文,并確定在最相關(guān)的資源,在最相關(guān)的資源中,不僅基于查詢的內(nèi)容,即搜索詞,還基于正引導(dǎo)到該查詢的入口的導(dǎo)航的上下文中的一個或多個,即搜索入口點、用戶偏好以及隨時間推移所收集的潛在資源的相關(guān)度的任何自動測量來搜索。
用戶偏好可由用戶明確地預(yù)定義,或基于用戶過去的行為來隱含地確定,并可包括一私密或安全偏好,用于指定應(yīng)當(dāng)不再搜索哪些資源或哪些資源是可信的,無論其確定的相關(guān)度如何。
相關(guān)度的自動測量包括使用數(shù)據(jù),它反映用戶如何在本地和/或非本地環(huán)境中與資源交互,并由此反映其與特定搜索查詢的潛在相關(guān)度。資源包括包含可搜索內(nèi)容以及內(nèi)容本身的各種數(shù)據(jù)庫和其它數(shù)據(jù)存儲庫。使用數(shù)據(jù)包括諸如訪問資源的頻率、訪問資源的時間長度、用戶在訪問之后對資源作出的行動(如,打開、檢索、瀏覽、編輯、發(fā)送、復(fù)制、保存、創(chuàng)建、購買交易等)的數(shù)據(jù)。本地使用數(shù)據(jù)表示本地用戶與資源的交互,而非本地使用數(shù)據(jù)表示許多用戶與資源的交互的集成。
依照本發(fā)明的另一方面,確定在其中進行搜索的最相關(guān)資源可包括確定何時將搜索聯(lián)合到另外的資源,這些另外的資源一般不會被搜索,因為搜索它們太昂貴或者太耗時,這些另外的資源如可通過虛擬專用網(wǎng)絡(luò)、企業(yè)網(wǎng)絡(luò)、大數(shù)據(jù)庫,或付費可用的專利數(shù)據(jù)庫訪問的遠(yuǎn)程計算機。在本發(fā)明的一個方面,確定是否將搜索聯(lián)合到其它資源可由用戶偏好來控制。
依照本發(fā)明的又一方面,一旦確定了最相關(guān)資源,該系統(tǒng)和方法使用歸一化為搜索詞在不同資源上的出現(xiàn)統(tǒng)一了搜索。歸一化通過確定出現(xiàn)在例如網(wǎng)頁標(biāo)題中的搜索詞相對于出現(xiàn)在電子郵件的主標(biāo)題中的搜索詞的相對重要性來確保統(tǒng)一的搜索將產(chǎn)生有意義的結(jié)果。確定出現(xiàn)在一個位置中的搜索詞相對于另一位置的搜索詞的相對重要性包括首先確定在何處搜索每一相關(guān)資源,然后確定如何權(quán)衡搜索詞在一個位置中的出現(xiàn)與其在其它位置中的出現(xiàn)。
依照本發(fā)明的再一方面,使用隨時間推移構(gòu)建的局部索引來執(zhí)行搜索,以對被確定為與用戶搜索相關(guān)的資源進行索引。一旦被索引,對索引的資源的任何改變都將在索引中反映以用于未來的搜索。
依照本發(fā)明的還有一個方面,一旦執(zhí)行了統(tǒng)一搜索,該系統(tǒng)和方法提供了混合搜索結(jié)果并以綜合的方式向用戶呈現(xiàn)混合的結(jié)果?;旌纤阉鹘Y(jié)果包括,確定顯示來自哪些資源的哪些結(jié)果,以及以什么順序顯示等等。以綜合的方式向用戶呈現(xiàn)混合結(jié)果包括,以易于訪問的格式顯示不同的結(jié)果等等,該易于訪問的格式允許用戶快速地標(biāo)識他或她搜索的特定數(shù)據(jù),而無論結(jié)果所代表的數(shù)據(jù)類型如何。
依照本發(fā)明的再有一個方面,提供了用于統(tǒng)一搜索的計算機可訪問媒質(zhì)。該計算機可訪問媒質(zhì)包括數(shù)據(jù)結(jié)構(gòu)和計算機可執(zhí)行組件,它們包括一統(tǒng)一搜索處理器,它便于不同資源的統(tǒng)一搜索,并混合來自搜索的最相關(guān)結(jié)果,以綜合的方式向用戶呈現(xiàn)。該數(shù)據(jù)結(jié)構(gòu)以一般與上述方法一致的方式定義了資源、用戶偏好、導(dǎo)航的上下文數(shù)據(jù)、自動相關(guān)度數(shù)據(jù)以及索引數(shù)據(jù)。同樣,該計算機可執(zhí)行組件能夠執(zhí)行一般與上述方法一致的行動。
當(dāng)結(jié)合附圖參考以下詳細(xì)描述時,可以更容易地理解本發(fā)明的上述方面和許多附加優(yōu)點,附圖中圖1是依照本發(fā)明可在其中執(zhí)行統(tǒng)一搜索并呈現(xiàn)搜索結(jié)果的示例性統(tǒng)一搜索系統(tǒng)和一個合適的操作環(huán)境的描述;圖2是依照本發(fā)明的一個實施例更詳細(xì)描述圖1的統(tǒng)一搜索系統(tǒng)的某些組件的排列的框圖;圖3是更詳細(xì)描述用于實現(xiàn)本發(fā)明的一個實施例的搜索客戶端的某些計算組件的排列的框圖;圖4A-4B所示是依照本發(fā)明的一個實施例結(jié)合圖1和2的統(tǒng)一搜索系統(tǒng)所執(zhí)行的用于實現(xiàn)統(tǒng)一搜索并以綜合的方式呈現(xiàn)搜索結(jié)果的邏輯的流程圖;圖5是用于實現(xiàn)本發(fā)明的一個實施例的示例性統(tǒng)一搜索用戶界面的圖示;圖6是依照本發(fā)明的一個實施例,在混合了搜索結(jié)果并以綜合的方式向用戶呈現(xiàn)之后的稍后時刻,圖5的示例性統(tǒng)一搜索用戶界面的圖示;以及圖7是依照本發(fā)明的一個實施例,在選擇了顯示多媒體搜索結(jié)果的選項之后,圖6的示例性統(tǒng)一搜索用戶界面的圖示。
具體實施例方式
以下描述旨在提供適用于實現(xiàn)本發(fā)明的一個實施例的各個特征的計算系統(tǒng)的簡要、通用描述。盡管將在個人計算機和服務(wù)器計算機,或可用于在其中輔助任務(wù)由通過通信網(wǎng)絡(luò)鏈接在一起的遠(yuǎn)程計算裝置執(zhí)行的分布式計算環(huán)境的其它類型的計算裝置的一般上下文中描述本計算系統(tǒng),本領(lǐng)域的技術(shù)人員可以理解,本發(fā)明也可以用許多其它計算機系統(tǒng)配置來實踐,包括多處理器系統(tǒng)、小型機、大型機等等。除上述更常規(guī)的計算機系統(tǒng)之外,本領(lǐng)域的技術(shù)人員將認(rèn)識到,本發(fā)明可在其它計算設(shè)備上實踐,包括膝上計算機、圖形輸入板計算機、個人數(shù)字助理(PDA)、蜂窩電話和在其上安裝了計算機軟件或其它數(shù)字內(nèi)容的其它設(shè)備。
盡管本發(fā)明的各方面可以借助由web瀏覽器結(jié)合個人計算機執(zhí)行的程序或進程,或由搜索引擎結(jié)合服務(wù)器計算機執(zhí)行的程序或進程來描述,本領(lǐng)域的技術(shù)人員將認(rèn)識到,這些方面也可以結(jié)合其它程序模塊來實現(xiàn)。一般而言,程序模塊包括例程、子例程、程序、進程、組件、數(shù)據(jù)結(jié)構(gòu)、函數(shù)、接口、對象等等,它們執(zhí)行特定的任務(wù)或?qū)崿F(xiàn)特定的抽象數(shù)據(jù)類型。
圖1是依照本發(fā)明的一個實施例,可在其中執(zhí)行統(tǒng)一搜索,并混合搜索結(jié)果的示例性統(tǒng)一搜索系統(tǒng)100和一個合適的操作環(huán)境的描述。如圖所示,操作環(huán)境包括駐留在諸如計算機系統(tǒng)102或個人數(shù)字助理(PDA)104等用戶設(shè)備中的統(tǒng)一搜索客戶端110。該統(tǒng)一搜索客戶端110一般負(fù)責(zé)如所需要的提供前端搜索服務(wù),并需要時與遠(yuǎn)程服務(wù)器進行通信。由統(tǒng)一搜索客戶端110提供的前端服務(wù)可包括,生成接收用戶在統(tǒng)一搜索入口界面106中輸入的搜索詞查詢108,并響應(yīng)于源自運行在用戶設(shè)備102、104上的應(yīng)用程序的信息和搜索查詢,在混合的搜索結(jié)果頁面124中使用超文本傳輸協(xié)議呈現(xiàn)搜索結(jié)果123的文本和/或圖形,以及其它服務(wù)。由統(tǒng)一搜索客戶端110提供的后端搜索服務(wù)可包括,在不同的資源上執(zhí)行統(tǒng)一搜索、混合搜索結(jié)果以在用戶設(shè)備102、104上呈現(xiàn)、捕捉自動的相關(guān)度數(shù)據(jù)118、更新本地搜索索引116,以及其它服務(wù)。
在圖1所示的環(huán)境中,統(tǒng)一搜索客戶端110響應(yīng)于用戶輸入的搜索請求生成一統(tǒng)一搜索入口界面106,用戶可向其中輸入搜索詞108以啟動在本地駐留在用戶設(shè)備上的本地數(shù)據(jù)資源120或非本地數(shù)據(jù)資源122上對相關(guān)內(nèi)容的搜索。在一個實施例中,統(tǒng)一搜索入口界面106可被實現(xiàn)為嵌入在諸如瀏覽器應(yīng)用程序、文字處理程序等應(yīng)用程序中的搜索框,或諸如Windows等圖形用戶界面中的任務(wù)欄。在另一實施例中,統(tǒng)一搜索入口界面106可被排列成單獨的應(yīng)用程序窗口或瀏覽器應(yīng)用程序中的頁面。如圖2所示,本地資源120可包括儲存在用戶設(shè)備硬盤驅(qū)動器202上的數(shù)據(jù),包括電子郵件204、web高速緩存206、照片和圖像208、音樂、以及諸如文字處理文檔、電子表格等辦公自動文檔212等等。非本地資源可包括遠(yuǎn)程地駐留在通過諸如因特網(wǎng)214、內(nèi)聯(lián)網(wǎng)216、在因特網(wǎng)214或內(nèi)聯(lián)網(wǎng)216上配置的虛擬專用網(wǎng)絡(luò)以及局域網(wǎng)218與統(tǒng)一搜索客戶端110通信的設(shè)備上的資源。
在一個實施例中,統(tǒng)一搜索客戶端110捕捉搜索請求的導(dǎo)航上下文112,即,用戶請求搜索的所在點,并使用該上下文112結(jié)合搜索詞108以及先前儲存的用戶偏好114來確定在其中搜索與搜索詞108相關(guān)的內(nèi)容的最佳資源120、122。例如,當(dāng)用戶從電子郵件應(yīng)用程序進入統(tǒng)一搜索入口界面106時,統(tǒng)一搜索客戶端110可確定包含電子郵件文檔或作為電子郵件的附件接收的文檔的本地資源120可能是在其中執(zhí)行搜索的最相關(guān)的資源。
在一個實施例中,當(dāng)確定哪一資源120、122是在其中執(zhí)行搜索的最相關(guān)資源時,統(tǒng)一搜索客戶端110也考慮表示相關(guān)度的自動測量118的任何可用數(shù)據(jù)。在一個實施例中,自動相關(guān)度數(shù)據(jù)118是量化用戶和所述資源之間的交互的度量,包括用戶訪問資源的頻率、交互(如打開或激活文件、瀏覽網(wǎng)頁、編輯文檔、發(fā)送電子郵件、向電子郵件附加文檔、移動文檔等等)的時間長度和/或次數(shù)和重要性。統(tǒng)一搜索客戶端110使用數(shù)據(jù)118來測量所考慮的特定資源的潛在相關(guān)度。例如,訪問的頻率越高,持續(xù)時間越長,和/或交互的次數(shù)和/或重要性越大,則該資源以及該資源包含的內(nèi)容將與用戶搜索相關(guān)的可能性越大。盡管確定相關(guān)度的常規(guī)方法搜索資源內(nèi)容(或表示內(nèi)容的索引)來確定搜索詞108出現(xiàn)的頻率,然而自動相關(guān)度數(shù)據(jù)118是使用數(shù)據(jù),它可隨時間的推移來捕捉,以在搜索資源內(nèi)容之前向統(tǒng)一搜索客戶端110提供指示(盡管是間接的)資源是否可能相關(guān)的可計量信息。當(dāng)與確定相關(guān)度的更多常規(guī)方法組合時,統(tǒng)一搜索客戶端110能夠使用自動相關(guān)度數(shù)據(jù)118來有利地提高搜索的效率,因為僅搜索可能包含相關(guān)內(nèi)容的那些資源。
在一個實施例中,自動相關(guān)度數(shù)據(jù)118可以是用戶專用的或集成的,以反映資源與特定用戶組或與一般用戶的相關(guān)度。例如,數(shù)據(jù)可指示特定數(shù)據(jù)庫與企業(yè)的一個部門內(nèi)的用戶的相關(guān)度,或網(wǎng)頁與因特網(wǎng)用戶的相關(guān)度。用戶專用自動相關(guān)度數(shù)據(jù)118A一般是由本地數(shù)據(jù)資源120的搜索客戶端112隨時間推移捕捉的本地數(shù)據(jù),而集成的相關(guān)度數(shù)據(jù)118B的一般是由非本地數(shù)據(jù)資源122的搜索服務(wù)器隨時間推移捕捉的非本地數(shù)據(jù)。自動相關(guān)度數(shù)據(jù)118在需要時被發(fā)送到統(tǒng)一搜索客戶端110或由其訪問,以確定資源120、122的潛在相關(guān)度。
一旦標(biāo)識了相關(guān)資源,統(tǒng)一搜索客戶端110使用索引116啟動搜索以產(chǎn)生搜索結(jié)果123。索引116可以是用于便于快速搜索的任何類型的可更新搜索的索引。索引116的合適的實現(xiàn)是已知或可購買的,并且尤其是根據(jù)本發(fā)明的說明,可由本領(lǐng)域的普通技術(shù)人員容易地實現(xiàn)。在一個實施例中,索引116可使用作為軟插件提供的過濾器來索引某些類型的第三方文檔,如可移植文檔文件(PDF)。
在一個實施例中,統(tǒng)一搜索客戶端110使用歸一化來考慮資源120、122的全異特性。歸一化包括確定在一個資源的一個位置中相對于在另一資源的另一位置中尋找搜索詞(稱為“擊中”)的相對重要性,這通過首先標(biāo)識資源120、122中搜索哪一位置,然后依照相對重要性對一個位置的結(jié)果給予比另一位置的結(jié)果更大或更小的權(quán)值來完成。位置的相對重要性隨著每次搜索而改變,這取決于任意數(shù)目的因素,包括導(dǎo)航上下文112、用戶偏好114或搜索詞查詢本身108等等。例如,當(dāng)導(dǎo)航上下文數(shù)據(jù)112指示用戶從電子郵件應(yīng)用程序進入搜索時,搜索詞擊中電子郵件的主標(biāo)題的相對重要性高于擊中多媒體文件的標(biāo)題。
在一個實施例中,一旦完成了搜索,統(tǒng)一搜索客戶端110將搜索結(jié)果120混合成在用戶設(shè)備102、104上顯示的混合搜索結(jié)果頁面124。由于搜索結(jié)果123可在不同的資源120、122中找到,結(jié)果本身可表示不同類型的數(shù)據(jù)。例如,如參考圖5-7所示的示例搜索進一步示出的,搜索詞“Madonna”的搜索可獲得在新聞和歌迷網(wǎng)站、音樂文件和電子郵件中找到的各種內(nèi)容。統(tǒng)一搜索客戶端110確定這些不同結(jié)果中的哪些與用戶最相關(guān),并相應(yīng)地顯示它們。同時,統(tǒng)一搜索客戶端110在綜合的顯示中混合結(jié)果,以便于使用圖形、定位或便于用戶從結(jié)果中選擇的任何其它顯示格式化技術(shù)來從其它結(jié)果中識別一個結(jié)果。例如,在一個實施例中,可將電子郵件可網(wǎng)站組合到分別的位置中,但是電子郵件的主標(biāo)題可類似于新聞網(wǎng)站的標(biāo)題行、音樂文件的標(biāo)題以及歌迷網(wǎng)站的web地址來定位和格式化,以允許用戶容易地比較各種結(jié)果并相應(yīng)地選擇期望的結(jié)果。
參考圖1和2,用戶設(shè)備102、104通過諸如因特網(wǎng)214等一個或多個計算機網(wǎng)絡(luò)與遠(yuǎn)程設(shè)備或資源通信。用于通過因特網(wǎng)通信的協(xié)議和組件對計算機網(wǎng)絡(luò)通信領(lǐng)域的普通技術(shù)人員是眾所周知的。用戶設(shè)備102、104之間的通信也可通過本地有線或無線計算機網(wǎng)絡(luò)連接來實現(xiàn)。圖1描述的統(tǒng)一搜索客戶端110也可在作為分布式計算環(huán)境的一部分的用戶設(shè)備102、104中操作,該環(huán)境可包括通過通信鏈路,如使用一個或多個計算機網(wǎng)絡(luò)或直接連接互聯(lián)的若干計算機系統(tǒng)。然而,本領(lǐng)域的普通技術(shù)人員可以理解,統(tǒng)一搜索客戶端110同樣可在具有比圖1所示的更少或更多數(shù)量的組件的計算機系統(tǒng)中操作。由此,圖1中的操作環(huán)境的描述應(yīng)當(dāng)看作示例性的,而非對所附權(quán)利要求書的范圍的局限。
圖3是更詳細(xì)描述主存(host)統(tǒng)一搜索客戶端110并負(fù)責(zé)圖1所示的統(tǒng)一搜索系統(tǒng)110的操作的用戶設(shè)備102、104的某些示例性計算組件的排列的框圖。具體地,示出了用戶設(shè)備102、104,包括操作系統(tǒng)302、處理器306和存儲器308,以實現(xiàn)用于該客戶端的通用管理和操作的可執(zhí)行程序指令。用戶設(shè)備102、104還包括與諸如因特網(wǎng)214等網(wǎng)絡(luò)進行通信的網(wǎng)絡(luò)接口304,以響應(yīng)搜索詞查詢108并提供搜索結(jié)果123。對操作系統(tǒng)302、處理器306、存儲器308和網(wǎng)絡(luò)接口304的合適的實現(xiàn)是已知的或可購買的,并且尤其鑒于本發(fā)明的說明,可由本領(lǐng)域的普通技術(shù)人員容易地實現(xiàn)。
用戶設(shè)備102、104的存儲器308包括包含統(tǒng)一搜索客戶端110的計算機可執(zhí)行程序指令。在某些實施例中,存儲器206還可包括諸如上述搜索詞查詢108和搜索結(jié)果123等各種儲存的數(shù)據(jù),以及如圖1和2中所引用的用戶界面114和導(dǎo)航/上下文數(shù)據(jù)112。
在一個實施例中,統(tǒng)一搜索客戶端110包括資源相關(guān)進程310、索引進程312、搜索統(tǒng)一進程314和結(jié)果混合進程316。索引進程312可以使用已知的或可購買的索引技術(shù)來實現(xiàn)。每當(dāng)執(zhí)行搜索或出現(xiàn)索引的資源的改變時,就調(diào)用索引進程312。
在一個實施例中,資源相關(guān)進程310包含那樣的邏輯,當(dāng)執(zhí)行該邏輯時,它將監(jiān)控和捕捉關(guān)于資源120、122的用戶活動,并以度量的形式將該活動記錄在自動相關(guān)度數(shù)據(jù)118中。例如,進程310監(jiān)控硬盤驅(qū)動器上的特定文檔,并記錄用戶訪問該文檔的頻率和持續(xù)時間。另外,進程310監(jiān)控并捕捉正引導(dǎo)到響應(yīng)于搜索詞查詢108顯示統(tǒng)一搜索入口界面106的點的導(dǎo)航上下文數(shù)據(jù)112。資源相關(guān)進程310還包含邏輯,它不僅基于迄今為止捕捉的搜索詞查詢108和自動相關(guān)度數(shù)據(jù)118,還基于導(dǎo)航/上下文數(shù)據(jù)112和用戶偏好114來確定要搜索的最佳資源。
在一個實施例中,搜索統(tǒng)一進程314包含邏輯,當(dāng)執(zhí)行該邏輯時,它確定在每一資源內(nèi)使用一被稱為歸一化的進程被確定為與搜索相關(guān)的最佳數(shù)據(jù)。例如,如正文數(shù)據(jù)相比,電子郵件存儲庫內(nèi)最佳的搜索數(shù)據(jù)可以是主標(biāo)題數(shù)據(jù),而在Word文檔內(nèi)最佳搜索數(shù)據(jù)可以是該文檔的標(biāo)題,或者如果沒有可辨別的標(biāo)題,則為文件名。歸一化提高了搜索結(jié)果的相關(guān)度,并確保可有意義地比較結(jié)果以確定哪一個是最相關(guān)的。
在一個實施例中,結(jié)果混合進程316包含邏輯,當(dāng)執(zhí)行該邏輯時,它混合搜索結(jié)果,當(dāng)一個結(jié)果來自一種類型的資源120、122,而另一結(jié)果來自一個不同類型的資源,比如一個來自電子郵件另一個來自電子表格文檔時,考慮結(jié)果的全異特性。進程316還以便于用戶選擇期望結(jié)果的綜合方式向用戶呈現(xiàn)混合結(jié)果。例如,進程316可組合第一網(wǎng)頁的每一資源內(nèi)的最相關(guān)結(jié)果的表示,使得用戶可一眼見到組合結(jié)果的所有類別上的所有最佳結(jié)果。作為另一示例,進程316可交錯最相關(guān)的結(jié)果,并用適當(dāng)?shù)膱D標(biāo)或其它圖形指定結(jié)果所屬的類別。無論用哪一方式,進程316還混合結(jié)果,并通過在所有類別上格式化結(jié)果來以綜合的方式顯示它們,以便于將一個類別或組的擊中與另一個進行比較。例如,電子郵件類別中的結(jié)果可以與網(wǎng)站類別中的結(jié)果垂直對齊,使得電子郵件主標(biāo)題和網(wǎng)站標(biāo)題在每一類別內(nèi)的可比較位置上。
圖4A-4B所示是依照本發(fā)明的一個實施例結(jié)合圖1和2的統(tǒng)一搜索客戶端110執(zhí)行的用于執(zhí)行統(tǒng)一和混合搜索的邏輯的流程圖。在開始橢圓402處開始,統(tǒng)一搜索客戶端110接收起源于運行在主機設(shè)備102、104上的應(yīng)用程序的搜索請求404的通知。在一個實施例中,請求404可以在處理塊406由客戶端110截取,其中,客戶端110向用戶啟動統(tǒng)一搜索進入圖形用戶界面106的顯示,例如,以瀏覽器程序中顯示的網(wǎng)頁的形式來顯示。統(tǒng)一搜索入口界面提示用戶輸入他或她的搜索詞查詢108。同時,客戶端110通過對正引導(dǎo)到搜索請求404的導(dǎo)航,如,用戶在他或她請求搜索的點所使用的應(yīng)用程序進行排序,來捕捉它將要執(zhí)行的搜索的上下文。另外,客戶端110捕捉由用戶在統(tǒng)一搜索入口界面中直接輸入的,添加到或覆蓋先前輸入的搜索偏好的任何用戶偏好。這類偏好可包括,不被搜索的資源120、122的指定,無論其與當(dāng)前搜索詞查詢108的相關(guān)度如何;或者相反,要被搜索的資源的指定,即使其確定的與查詢的相關(guān)度看來是有疑問的;等等。其它偏好可包括私密或安全性偏好,以防止記錄或保留搜索私密性。在一個實施例中,用戶的搜索偏好根據(jù)用戶在他或她的用戶設(shè)備上使用該搜索特征時的過去的行為來隱含地確定。
在處理塊404,客戶端110從本地源118A或非本地源118B或兩者獲取自動相關(guān)度數(shù)據(jù)118。自動相關(guān)度數(shù)據(jù)118是在統(tǒng)一搜索客戶端110的先前的迭代中捕捉的數(shù)據(jù),并反映了用戶與各種資源120、122和先前的搜索結(jié)果123的交互的歷史。在處理塊412,客戶端110調(diào)用如已參考圖3所描述的資源相關(guān)進程310,來使用可用的自動相關(guān)度數(shù)據(jù)118,以確定在其中搜索當(dāng)前搜索詞查詢108的最佳資源120、122。
在處理塊414,客戶端110繼續(xù)處理,以確定每一資源120、122內(nèi)的最佳數(shù)據(jù)。客戶端110調(diào)用如已參考圖3所描述的搜索統(tǒng)一進程314,來歸一化相關(guān)資源作為要搜索的最佳數(shù)據(jù)的確定的一部分,并相應(yīng)地執(zhí)行對最佳數(shù)據(jù)中搜索詞108的出現(xiàn)的搜索。例如,在已提及的示例中,如果確定在其中搜索詞“Madonna”的最佳資源包括電子郵件資源204和音樂資源210,則在歸一化這些資源之后,電子郵件資源中搜索“Madonna”的最佳數(shù)據(jù)可以是主標(biāo)題,而音樂文件中的最佳數(shù)據(jù)可以是標(biāo)題或文件名。
參考圖4B,客戶端110在橢圓416處繼續(xù),在處理塊418對照如上確定的最佳資源中的最佳數(shù)據(jù)執(zhí)行搜索。在一個實施例中,為最大化搜索效率并最小化對用戶設(shè)備102、104的操作的影響,對照可搜索資源120、122的索引116來執(zhí)行搜索。
客戶端110在處理塊420生成搜索結(jié)果,并前進到處理塊422,通過調(diào)用參考圖3所描述的結(jié)果混合進程314來混合那些結(jié)果?;旌辖Y(jié)果的進程314包括在給定搜索結(jié)果網(wǎng)頁上可用的有限顯示區(qū)域中確定顯示哪些資源的哪些結(jié)果、并格式化結(jié)果以用綜合的方式向用戶呈現(xiàn),以便于用戶選擇期望的結(jié)果。在處理塊424,客戶端向用戶顯示混合并格式化的結(jié)果?;旌纤阉鹘Y(jié)果的一個示例在下文參考圖5-7更詳細(xì)地描述。
在一個實施例中,一旦向用戶顯示了混合的搜索結(jié)果,則在處理塊426,客戶端110調(diào)用資源相關(guān)進程310在準(zhǔn)備記錄本地的自動相關(guān)數(shù)據(jù)庫118A中監(jiān)控并捕捉用戶與呈現(xiàn)的混合搜索結(jié)果的交互,使得客戶端110能夠在進行未來搜索時進一步細(xì)化資源相關(guān)度的確定,之后,客戶端110的邏輯在終端橢圓428處結(jié)束。
圖5-7示出了瀏覽器程序500,它顯示了如先前參考圖1所描述的在網(wǎng)頁中實現(xiàn)的統(tǒng)一搜索入口界面106,其中,用戶能夠?qū)⒁粋€或多個搜索詞輸入到搜索輸入框502中。統(tǒng)一搜索入口界面106可由統(tǒng)一搜索客戶端110生成,或可遠(yuǎn)程地生成并通過因特網(wǎng)傳送到用戶計算設(shè)備102、104上的客戶端110。用戶在框502中輸入期望的搜索詞,并使用定位設(shè)備、鍵盤或其它輸入設(shè)備來啟動搜索,如通過點擊標(biāo)號502標(biāo)識的箭頭按鈕來啟動。在一個實施例中,可向用戶呈現(xiàn)若干搜索偏好506,用于選擇來定制他或她的搜索。例如,可通過點擊“My Stuff(我的東西)”文件夾504將搜索限于某些本地資源。也可提示用戶選擇將導(dǎo)致搜索被向外聯(lián)合到其它在線資源508的選項,如多媒體資源(Multimedia)510、因特網(wǎng)(The web)512、字典(Dictionary & translation)514、購物資源(Shopping)516、航班資源(Flights)518、地圖資源(Maps & directions)520、百科全書資源(Encyclopedia)522、餐館用餐資源(Restaurants)524以及新聞資源(News)526。某些選項可默認(rèn)地選擇,或可基于先前指定的用戶搜索偏好506來選擇。
在圖5所示的示例中,用戶輸入了搜索詞“MADONNA”。向用戶顯示如依照本發(fā)明的一個實施例由客戶端110實現(xiàn)的統(tǒng)一和混合搜索的結(jié)果,如圖6所示。搜索詞“MADONNA”在標(biāo)號602處的文本框中顯示。在標(biāo)號604處的下拉框中選擇了顯示所有結(jié)果的選項(All Results)。如圖所示,該顯示在頁面上列出了五個不同的類別,而在后續(xù)的頁面上列出更多,因為選擇了標(biāo)號606處的其它選項工具條中的選項來顯示“MADONNA”的“All Results(所有結(jié)果)”。未選中的選項包括標(biāo)號618處的“Grouped by Content Type(按照內(nèi)容類型分組)”選項、標(biāo)號620處的“Web sites(網(wǎng)站)”選項、標(biāo)號622處的“Multimedia(多媒體)”選項、標(biāo)號624處的“Shopping(購物)”選項、標(biāo)號626處的“News(新聞)”選項、以及標(biāo)號628處的“Learning(學(xué)習(xí))”選項。在所示的示例中,備選搜索選項的附加界面選項在標(biāo)號630、632、634和636處出現(xiàn)。
在第一頁面上顯示了用于選中的“All Results(所有結(jié)果)”選項的前五個分類標(biāo)題,即標(biāo)號606處的新聞網(wǎng)站、標(biāo)號608處的電子郵件、標(biāo)號610處的音樂、標(biāo)號612處的歌迷網(wǎng)站、以及標(biāo)號614處的圖像,其每一個在該分類標(biāo)題的下面列出了最佳結(jié)果。例如,在標(biāo)號606處的新聞網(wǎng)站分類中,最佳結(jié)果是關(guān)于重組合Madonna獨唱的新聞項目606A,而在標(biāo)號608處的電子郵件分類中,最佳結(jié)果是查詢Madonna視頻的電子郵件608A。類似地,在歌迷站點612和圖像614的分類中,其每一個在緊靠分類標(biāo)題之下都顯示了最佳結(jié)果。在每一情況中,盡可能一致地顯示來自結(jié)果的歸一化數(shù)據(jù)一在這一實例中,在最左邊的位置一使得每一分類中的結(jié)果都可比較地對齊(除標(biāo)號614處的web圖像分類之外,其中,圖像本身是水平顯示的)。最佳結(jié)果的可比較對齊結(jié)合按分類標(biāo)題隔離結(jié)果有利地方便了用戶對期望結(jié)果的選擇。
在一個替換的顯示中,向用戶顯示了依照本發(fā)明的一個實施例由客戶端110實現(xiàn)的統(tǒng)一和混合搜索的結(jié)果,如圖7所示。再一次,在標(biāo)號702處的文本框中顯示搜索詞“MADONNA”,并且搜索被限制在“MADONNA”在因特網(wǎng)上的出現(xiàn)上,如標(biāo)號704的文本框中所指示的。如圖所示,該替換的顯示列表342產(chǎn)生了藝人、音樂、電影、無線電和事件分類,因為選中了標(biāo)號722處的其它選項工具條中的選項,以僅顯示“MADONNA”的多媒體結(jié)果。未選中的選項包括標(biāo)號716處的“All Results(所有結(jié)果)”選項、標(biāo)號718處的“Grouped by Content Type(按內(nèi)容類型分組)”選項、標(biāo)號720處的“Web sites(網(wǎng)站)”選項、標(biāo)號724處的“Shopping(購物)”選項、標(biāo)號726處的“News(新聞)”選項、以及標(biāo)號728處的“Learning(學(xué)習(xí))”選項。改變顯示或改變搜索的附加選項在頁面頂端標(biāo)號706處示出。三個分類標(biāo)題-標(biāo)號710處的藝人網(wǎng)站、標(biāo)號712處的音樂和標(biāo)號714處的電影-類似于圖6中的分類來顯示,其最佳結(jié)果在該分類的標(biāo)題下列出。例如,在標(biāo)號710處的藝人網(wǎng)站分類中,最佳結(jié)果是關(guān)于Madonna的Madonna藝人頁面,而在標(biāo)號712處的音樂分類中,最佳結(jié)果是“American Life”的音樂樣本-Madonna的最新歌曲,并且在標(biāo)號714處的電影分類中,最佳結(jié)果是電影“Die Another Day”的電影樣本。如上所述,所顯示的分類710、712和714的每一個緊靠分類標(biāo)題的下面顯示了最佳結(jié)果。在每一情況下,盡可能一致地顯示來自結(jié)果的歸一化數(shù)據(jù)-在這一實例中,在頂部和最左邊的位置中-使得每一分類中的結(jié)果都是可比較地對齊的。
盡管示出并描述了本發(fā)明當(dāng)前的較佳實施例,然而可以理解,可在不脫離本發(fā)明的精神和范圍的情況下在其中作出各種改變。例如,在本發(fā)明的一個實施例中,參考資源相關(guān)進程310、索引進程312、搜索統(tǒng)一進程314和結(jié)果混合進程316所描述的統(tǒng)一搜索系統(tǒng)100的各種組件,尤其是統(tǒng)一搜索客戶端110的功能,可以進程或程序的不同組合來實現(xiàn),并可在一個或多個計算設(shè)備之間分布。
盡管示出并描述了本發(fā)明的較佳實施例,可以理解,可在不脫離本發(fā)明的精神和范圍的情況下在其中作出各種改變。
權(quán)利要求
1.一種便于從全異的資源中搜索內(nèi)容的方法,其特征在于,所述方法包括響應(yīng)于一搜索內(nèi)容的請求,顯示一統(tǒng)一搜索入口界面;從多個全異資源中確定在其中搜索在所述統(tǒng)一搜索入口界面中輸入的搜索詞的出現(xiàn)的至少一個相關(guān)資源;歸一化所述相關(guān)全異資源;以及混合從在所述歸一化相關(guān)全異資源中搜索所述搜索詞的出現(xiàn)中獲得的全異結(jié)果。
2.如權(quán)利要求1所述的方法,其特征在于,歸一化所述相關(guān)全異資源包括確定所述搜索詞在第一全異資源的一個位置中出現(xiàn)相對于在第二全異資源的另一位置中出現(xiàn)的相對重要性;以及依照所述相對重要性對所述資源中所述搜索詞的出現(xiàn)加權(quán)。
3.如權(quán)利要求2所述的方法,其特征在于,混合所述全異結(jié)果包括按照所述搜索詞的出現(xiàn)的權(quán)值對所述結(jié)果分級、按照與所述資源相關(guān)聯(lián)的分類顯示所分級的結(jié)果、以及顯示其中所述搜索詞在每一分類的可比較位置中出現(xiàn)的位置。
4.如權(quán)利要求1所述的方法,其特征在于,它還包括捕捉所述搜索請求的上下文;以及其中,確定所述至少一個相關(guān)資源是基于所述搜索請求上下文。
5.如權(quán)利要求1所述的方法,其特征在于,它還包括獲得所述多個全異資源的每一個的相關(guān)度的自動測量;其中,確定所述至少一個相關(guān)資源是基于所述相關(guān)度的自動測量的。
6.如權(quán)利要求5所述的方法,其特征在于,所述相關(guān)度的自動測量是量化用戶與所述資源的交互的度量。
7.如權(quán)利要求6所述的方法,其特征在于,所量化的用戶交互包括用戶訪問所述資源的頻率、用戶訪問所述資源的時間長度、以及用戶在所述資源上執(zhí)行的行動的重要性中的至少其中之一。
8.如權(quán)利要求1所述的方法,其特征在于,它還包括獲得指示要在其中搜索的較佳資源的用戶偏好;其中,確定所述至少一個相關(guān)資源是基于所述用戶偏好中指示的所述較佳資源。
9.如權(quán)利要求1所述的方法,其特征在于,它還包括為所述全異資源構(gòu)建一索引;以及在搜索所述搜索詞的出現(xiàn)時搜索與所述相關(guān)資源相關(guān)聯(lián)的索引。
10.一種用于電子內(nèi)容的統(tǒng)一搜索的系統(tǒng),其特征在于,所述系統(tǒng)包括包含可搜索內(nèi)容的多個全異資源;一用于儲存為所述資源收集的自動相關(guān)度數(shù)據(jù)的存儲庫;一搜索詞輸入;以及一處理器,它基于所述自動相關(guān)度數(shù)據(jù)確定所述全異資源中的哪一個與所述搜索詞輸入最相關(guān)、歸一化所述相關(guān)資源、在所歸一化的相關(guān)資源中搜索所述搜索詞、以及混合來自所述搜索的結(jié)果以向用戶顯示,其中,所述結(jié)果表示從所述歸一化相關(guān)資源的至少一個獲得的相關(guān)但全異的內(nèi)容。
11.如權(quán)利要求10所述的系統(tǒng),其特征在于,歸一化所述相關(guān)資源包括從所述全異資源中確定要在其中搜索所述搜索詞的出現(xiàn)的可比較數(shù)據(jù)。
12.如權(quán)利要求11所述的系統(tǒng),其特征在于,混合來自所述搜索的結(jié)果包括基于所述可比較數(shù)據(jù)中所述搜索詞的出現(xiàn)的相對重要性對所述全異結(jié)果分級,以及以統(tǒng)一的方式顯示來自每一個所述結(jié)果的可比較數(shù)據(jù)。
13.如權(quán)利要求10所述的系統(tǒng),其特征在于,它還包括一用戶偏好輸入,并且其中,確定所述全異資源的哪一個與所述搜索詞輸入最相關(guān)是基于所述用戶偏好輸入。
14.如權(quán)利要求10所述的系統(tǒng),其特征在于,它還包括一上下文輸入,其中,確定所述全異資源的哪一個與所述搜索詞輸入最相關(guān)是基于所述上下文。
15.如權(quán)利要求14所述的系統(tǒng),其特征在于,所述上下文輸入表示正引導(dǎo)到所述搜索詞的輸入的導(dǎo)航事件,并且確定所述全異資源的哪一個與所述搜索詞輸入最相關(guān)是基于所述導(dǎo)航事件。
16.如權(quán)利要求14所述的系統(tǒng),其特征在于,所述上下文輸入表示所述搜索詞的輸入從其起源的應(yīng)用程序,并且其中,確定所述全異資源的哪一個與所述搜索詞輸入最相關(guān)是基于所述應(yīng)用程序。
17.如權(quán)利要求10所述的系統(tǒng),其特征在于,它還包括一與所述全異資源中的內(nèi)容相關(guān)聯(lián)的索引;并且其中,在所述歸一化的相關(guān)資源中搜索所述搜索詞包括搜索與所述資源相關(guān)聯(lián)的索引。
18.如權(quán)利要求10所述的系統(tǒng),其特征在于,所述自動相關(guān)度數(shù)據(jù)包括一表示用戶訪問所述資源的頻率、用戶訪問所述資源的時間長度、以及用戶在所述資源上執(zhí)行的行動的重要性中的至少其中之一的測量的度量。
19.如權(quán)利要求18所述的系統(tǒng),其特征在于,所述最相關(guān)的全異資源是具有最高頻率、最大時間長度、以及最重要行動中的至少其中之一的那些資源。
20.一種具有用于執(zhí)行電子內(nèi)容的統(tǒng)一搜索的指令的計算機可訪問媒質(zhì),其特征在于,所述指令包括響應(yīng)于一搜索內(nèi)容的請求,顯示一統(tǒng)一搜索入口界面;從多個全異資源中確定在其中搜索在所述統(tǒng)一搜索入口界面中輸入的搜索詞的出現(xiàn)的至少一個相關(guān)資源;歸一化所述相關(guān)全異資源;以及混合從在所述歸一化的相關(guān)全異資源中搜索所述搜索詞的出現(xiàn)中獲得的全異結(jié)果。
21.如權(quán)利要求20所述的計算機可訪問媒質(zhì),其特征在于,歸一化所述相關(guān)全異資源的所述指令包括確定所述搜索詞出現(xiàn)在第一全異資源的一個位置中相對于所述搜索詞出現(xiàn)在第二全異資源的另一位置中的相對重要性;以及依照所述相對重要性對所述搜索詞在所述搜索詞的出現(xiàn)加權(quán)。
22.如權(quán)利要求20所述的計算機可訪問媒質(zhì),其特征在于,混合所述全異結(jié)果的指令包括按照所述搜索詞的出現(xiàn)的權(quán)值對所述結(jié)果分級、按照與所述資源相關(guān)聯(lián)的分類顯示所分級的結(jié)果、以及顯示在其中所述搜索詞在每一分類的可比較位置中出現(xiàn)的位置。
23.如權(quán)利要求20所述的計算機可訪問媒質(zhì),其特征在于,所述指令還包括捕捉所述搜索請求的上下文;以及基于所述搜索請求的上下文確定所述至少一個相關(guān)資源。
24.如權(quán)利要求20所述的計算機可訪問媒質(zhì),其特征在于,所述指令還包括獲得所述多個全異資源的每一個的相關(guān)度的自動測量;以及基于所述相關(guān)度的自動測量確定所述至少一個相關(guān)資源。
25.如權(quán)利要求24所述的計算機可訪問媒質(zhì),其特征在于,所述相關(guān)度的自動測量是表示用戶與所述資源的交互的數(shù)字,其中,所述用戶交互包括用戶訪問資源的頻率、用戶訪問資源的時間長度、以及用戶在資源上執(zhí)行的行動的重要性中的至少其中之一,并且當(dāng)所述自動相關(guān)度數(shù)字高時,所述資源與所述搜索更相關(guān),當(dāng)所述自動相關(guān)度數(shù)字低時,所述資源較不相關(guān)。
26.如權(quán)利要求20所述的計算機可訪問媒質(zhì),其特征在于,所述指令還包括獲取一指示要在其中搜索的較佳資源的用戶偏好;以及基于所述用戶偏好中指示的所述較佳資源確定所述至少一個相關(guān)資源。
全文摘要
提供了用于全異資源的統(tǒng)一搜索的系統(tǒng)、方法和計算機可訪問媒質(zhì)。該系統(tǒng)和方法確定要在其中搜索的最相關(guān)的全異資源,并混合來自搜索的最相關(guān)的結(jié)果,以用綜合的方式向用戶呈現(xiàn)。
文檔編號G06F17/30GK1648902SQ200510007838
公開日2005年8月3日 申請日期2005年1月26日 優(yōu)先權(quán)日2004年1月26日
發(fā)明者E·L·梅斯, E·B·瓦特森, O·荷斯特-希勒 申請人:微軟公司