本申請是申請日為2011/06/09、申請?zhí)枮?01110164789.0、發(fā)明名稱為“實體卡的實體檢測和提取”的中國專利申請的分案申請。
本發(fā)明涉及網(wǎng)絡技術領域,尤其涉及網(wǎng)絡技術中搜索查詢技術。
背景技術:
搜索引擎被用于查找各種類型的信息。盡管將鏈接列表返回給相關文檔如今是一種熟悉的格式,但這并不一定是方便的格式。為了找到特定的某條信息,用戶通常必需點進鏈接來查看對應的文檔。如果所需信息不在用戶所訪問的第一篇文檔中,則用戶可能需要多次重復這一過程。
技術實現(xiàn)要素:
在各實施例中,提供了用于檢測包含在搜索結(jié)果內(nèi)的實體信息的系統(tǒng)和方法??墒褂盟鶛z測的實體信息來確定搜索結(jié)果內(nèi)的實體類別以及具體實體。可從與搜索結(jié)果相關聯(lián)的文檔中提取實體信息。這一信息可被用作實體卡的信息的一部分,可向用戶顯示該信息結(jié)合搜索結(jié)果和/或代替搜索結(jié)果。
提供本發(fā)明內(nèi)容以便以簡化形式介紹將在以下的具體實施方式中進一步描述的一些概念。該發(fā)明內(nèi)容不旨在標識所要求保護的主題的關鍵特征或本質(zhì)特征,也不旨在獨立地用于幫助確定所要求保護的主題的范圍。
附圖說明
下面將參考附圖詳細描述本發(fā)明,其中:
圖1是適用于實現(xiàn)本發(fā)明的各實施例的示例性計算環(huán)境的框圖。
圖2示意性地示出適用于執(zhí)行本發(fā)明的實施例的系統(tǒng)的示例。
圖3描繪了根據(jù)本發(fā)明的實施例的方法的流程圖。
圖4描繪了根據(jù)本發(fā)明的實施例的方法的流程圖。
圖5描繪了根據(jù)本發(fā)明的實施例的方法的流程圖。
具體實施方式
概覽
在各實施例中,當接收到搜索查詢,搜索引擎可生成多個搜索結(jié)果。隨后可分析由搜索引擎生成的結(jié)果,以標識由該結(jié)果指示的實體類別。這一標識可部分地基于該結(jié)果中一個或多個面向類別的站點的標識??蛇M一步分析該結(jié)果,以確定意圖實體。基于意圖實體,可準備對應于該實體的實體卡并與搜索結(jié)果一起顯示??扇芜x地,可基于期望實體來排除對所生成的搜索結(jié)果中的一個或多個的顯示、或?qū)⑵浜喜⒌綄嶓w卡中。
在以下討論中,實體卡是指增強的實體專用的信息呈現(xiàn)。實體卡可包括關于實體的各種類型的信息。實體卡可允許響應于搜索查詢來向用戶呈現(xiàn)這些信息,使得用戶不需要篩選文檔鏈接來獲得該信息。
類別模板
確定與搜索查詢相關聯(lián)的用戶意圖可引起各種問題。一種用于標識用戶意圖的方法可以是確定搜索查詢是否與實體相關。實體可以指代諸如作者、政治家或運動員等類型的個人;諸如電影、書、或消費品等類型的產(chǎn)品;或諸如餐廳、旅館、娛樂區(qū)或零售商店等類型的地方。然而,標識與搜索查詢相關的實體也造成了困難。許多常規(guī)方法試圖建立可與搜索查詢中的項進行匹配的實體列表。將這些列表保持最新可能是困難的且耗時的。另外,與搜索查詢相關的實體可能沒有被包括在搜索項中。
在各實施例中,實體信息可基于響應于搜索查詢的搜索結(jié)果來動態(tài)地確定??刹糠值鼗跇俗R來自已知與特定類別對應的文檔的搜索結(jié)果來標識實體。存在試圖跟蹤各種實體的當前狀態(tài)的許多網(wǎng)站。例如,跟蹤電影、旅館、消費電子產(chǎn)品或書的多個web位置是可用的。這些站點可被稱為面向類別的站點。面向類別的站點通常跟蹤感興趣的具體類別中的當前發(fā)展,并可由此提供關于類別內(nèi)的實體的當前信息。面向類別的站點的數(shù)量和/或身份通常隨時間緩慢改變,因此將適當?shù)恼军c標識為與類別相關可能是可管理的任務。與統(tǒng)一資源定位符(url)相關聯(lián)且來自這些站點中的一個站點的文檔與類別相關聯(lián)的可能性可能增加。
對于來自面向類別的站點的文檔,可構造一個或多個類別模板。位于面向類別的站點的文檔結(jié)構在站點上所描述的實體之間常常是一致的??墒褂贸尸F(xiàn)的一致性來構造用于從站點提取信息的模板。例如,提供關于電影的信息的面向類別的站點通常將具有一致的呈現(xiàn)格式。電影導演將按特定方式來標注,諸如標注在文檔中的特定地方、或使用與導演姓名相鄰的和/或在其上面的標題“導演”來標注。可使用期望的呈現(xiàn)格式來構造用于從文檔提取信息的模板。注意,站點可被認為是超過一個類別的面向類型的站點。例如,在線零售商可出售包括消費電子產(chǎn)品、dvd以及計算機游戲等產(chǎn)品。該在線零售商可具有與這些領域中的每一領域?qū)囊粋€或多個url組件。由此,取決于搜索查詢,來自在線零售商的文檔的外觀可與電影類別、游戲類別或消費品類別對應。
可以為每一面向類別的站點構造模板。模板可包括至少兩個組件。模板的一部分可以是url組件。url組件表示url的初始部分。與url模板的初始部分匹配的文檔可以是來自已知的面向類別的站點的文檔。模板的第二組件可以是提取格式組件。提取格式組件提供多個數(shù)據(jù)字段的規(guī)范,包括可針對每一數(shù)據(jù)字段提取的信息的類型,以及如何提取該信息的規(guī)范??墒褂萌魏畏奖愕念愋偷囊?guī)范。例如,規(guī)范可標識文檔中的具體位置,以檢索信息,諸如從文檔第五行中的第二字段取得一值?;蛘?,規(guī)范可以是標簽驅(qū)動,諸如指定首先標識諸如“標題”或“電影標題”的頭部,并且隨后取得看上去與頭部有某種相關的信息或單詞。
除了基于面向類別的站點的類別模板以外,可以為類別構造具有開放格式的一個或多個類別模板。可構造開放格式類別模板,以提取與面向類別的站點的模板相同的信息。開放格式模塊可與面向類別的站點的標簽驅(qū)動的模板相似,因為開放格式模板將被應用于與url組件不匹配的頁面。
注意,可將每一開放格式模板應用于每一響應結(jié)果、或應用于被標識成與所標識的實體對應的每一響應結(jié)果。這可導致從相同文檔中提取每一數(shù)據(jù)字段的多個值。為了使這一數(shù)據(jù)對每一文檔更有用,可執(zhí)行一致性檢測以確定哪個開放格式模板對于提取給定數(shù)據(jù)字段的數(shù)據(jù)是成功的。例如,對于給定文檔,可將每一字段的多個值與從來自面向類別的站點的文檔提取的值作比較。因為偶然匹配的可能性較低,所以匹配值有可能是正確提取的值。另一類型的檢查可以是對使用來自其他文檔的開放格式模板所提取的值的一致性檢查。同樣,偶然匹配的可能性較低,因此匹配有可能指示該字段的成功提取。
可通過任何方便的方法來確定面向類別的站點。可以手動地標識面向類別的站點?;蛘?,可通過提交應返回類別專用結(jié)果的已知搜索來確定面向類別的站點。最頻繁地出現(xiàn)的站點可被認為是面向類別的站點。
類別以及實體標識
當接收到搜索查詢時,可使用常規(guī)搜索引擎來生成多個響應結(jié)果或文檔。在以下各實施例中,可分析響應文檔的一部分來確定類別或?qū)嶓w信息。該部分可與前10個、或前20個、或前50個或任何常規(guī)數(shù)量的響應結(jié)果對應??煞治鲰憫臋n以確定實體類別。分析的一部分可以是將文檔與類別模板的url組件進行匹配。在一個實施例中,可能需要至少一個url組件匹配,以便進行實體類別的標識。分析的另一部分可以是將來自搜索結(jié)果的元數(shù)據(jù)與已知項進行匹配。例如,可將諸如“電影”、“零售商”或“影片”等元數(shù)據(jù)項與電影站點相關聯(lián)。元數(shù)據(jù)可與文檔的元標簽、或與作為搜索結(jié)果來顯示的文檔的字幕、或當文檔作為搜索結(jié)果來返回時可用的且與文檔相關聯(lián)的任何其他信息相對應。
對類別模板或元數(shù)據(jù)的匹配可隨后被加權,以確定針對搜索查詢是否與類別相對應的分數(shù)。例如,與url組件匹配的每一文檔可對該類別的分數(shù)作出貢獻??蓪㈩~外的權重或分數(shù)分配給與url組件匹配的第一文檔。相對于與url組件匹配的排名較低的搜索結(jié)果,可將額外的權重或分數(shù)分配給排名較高的搜索結(jié)果。相似類型的加權可被用于元數(shù)據(jù)分析。
基于分數(shù)可確定搜索的意圖類別。例如,如果檢測到單個類別的三個或更多url組件,則可將查詢分配給該類別。如果基于url組件的匹配而檢測到多個類別,則可分配排名最高的類別。在某些實施例中,如果沒有檢測到url組件匹配,則可能不存在類別的選擇?;蛘撸绻嬖谝粋€或更少的url組件匹配,則可不進行類別的選擇。
還可分析結(jié)果以確定實體是否與搜索查詢相關聯(lián)。在一個實施例中,可首先標識類別,并隨后可分析結(jié)果以確定實體。在這一實施例中,僅考慮屬于所標識的類別的實體。在另一實施例中,如果沒有檢測到實體類別,則沒有與搜索查詢相關聯(lián)的實體。
實體分析的一部分可以是將類別模板應用于來自面向類別的站點的文檔。由于文檔來自面向類別的站點,所以文檔的提取格式有可能是已知的。由此,有可能與實體對應的文檔的一部分也有可能是已知的,并且實體可被直接提取。實體分析的另一部分可以是將開放格式類別模板的一個或多個應用于響應結(jié)果中不是來自面向類別的站點的文檔。例如,許多餐廳評論網(wǎng)站列出餐廳名稱連同地址。開放格式模板將試圖通過找到與地址對應的一組文本來從未知文檔格式中提取餐廳名稱。隨后可提取緊跟在地址前面的名稱作為可能的實體。在分析開放格式文檔以檢測實體之前類別不被確定的各實施例中,所使用的開放格式模板可與搜索結(jié)果中任何面向類別的站點的類別對應。
隨后可分析從文檔中提取的實體數(shù)據(jù),以確定與搜索查詢相關聯(lián)的實體是否可被標識。該分析可比較所提取的信息,以確定是否僅存在一個可能的實體、或是否可從若干實體中選擇一個實體、或是否存在阻止對實體的確定的歧義。
某些實體確定可以是相對簡單的。例如,類別選擇可以已經(jīng)基于多個面向類別的站點的存在,而面向類別的站點文檔中的每一個指示相同的實體。在這一情況中,來自面向類別的站點文檔的實體可被選作該實體。
在另一示例中,一個或多個文檔可來自面向類別的站點,但實體信息的提取產(chǎn)生多個可能的實體。這可按各種方式來解決。一個選項可以是選擇在最大數(shù)量的面向類別的文檔中出現(xiàn)的實體。另一選項可以是選擇從最大數(shù)量的文檔中提取的實體,而不考慮源。這一選項將包括基于開放格式模板來定義的實體。又一選項可以是至少部分地基于從中提取每一實體的文檔的排名來選擇實體。又一些選項可基于將各權重給予從文檔中提取的數(shù)據(jù)來使用,包括與以上選項中的任一個的組合。
再一示例可涉及兩個或更多類別由搜索結(jié)果來標識的情況。在某些實施例中,可首先確定類別,并隨后僅考慮在所選擇的類別內(nèi)的實體。在另一選項中,可根據(jù)每一潛在類別來分析每一文檔。隨后可使用如上所述的用于在多個實體之間進行區(qū)分的方法來選擇實體。這將導致對應的類別選擇。注意,在這一類型的實施例中,類別權重可被包括,作為在決定哪個實體對于搜索查詢是最佳匹配時的另一因素。
又一選項可涉及在實體之間進行區(qū)分需要超過一條信息的情況。例如,許多餐廳是僅有一個位置的本地企業(yè)。結(jié)果,超過一個城市可能有具有相同名稱的餐廳,盡管各餐廳是不同的實體。具有相同名稱的多個餐廳實體可被稱為具有相同主標識的實體。
以上情況可導致具有基于相同主標識的餐廳的評論的多個餐廳評論站點,但每一評論針對不同的餐廳實體。在此情況中,若干url組件匹配以及其他元數(shù)據(jù)的存在可清楚地指示餐廳類別,但可能需要進一步確定以選擇與搜索查詢對應的實體。一個選項是查看類別的附加提取的數(shù)據(jù)字段。在餐廳的示例中,用于提取的典型附加信息可包括地址和電話號碼信息??蓪@些字段進行比較以標識共享相同名稱的不同餐廳實體。這可被稱為比較各實體的次級信息。在基于次級信息在各實體之間進行區(qū)分之后,對應于每一不同實體的結(jié)果可被分類成對應于每一不同實體的組。可以應用如上所述的方法來確定與搜索查詢相關聯(lián)的實體,諸如通過選擇最常發(fā)生的實體、選擇具有排名最高的文檔的實體、或其他方法。
在某些實施例中,實體分析可導致沒有與查詢相關聯(lián)的實體。例如,如果由于缺乏url組件匹配而沒有分配類別,則可在該點停止實體分析過程。作為另一選項,可使用評分系統(tǒng)來確定實體,以及對于作出分配而言,沒有實體可具有足夠高的分數(shù)和/或與其他潛在實體足夠不同的分數(shù)。在以上餐廳示例中,每一餐廳可僅出現(xiàn)在一個文檔中。評分系統(tǒng)可能需要在不止一個文檔中的出現(xiàn),以獲取對于分配為實體而言足夠的分數(shù)?;蛘?,兩個餐廳可出現(xiàn)在相當數(shù)量的文檔中,導致兩個餐廳具有相似的分數(shù)。由于分數(shù)不夠不同,因此沒有實體可被分配給搜索查詢。
在又一些實施例中,可選擇多個實體。在這些實施例中,超過一個實體可滿足被選作實體的準則。例如,可選擇所有所標識的實體,或可選擇具有高于閾值的分數(shù)的實體。在這些實施例中,可為所選擇的每一實體提取實體信息。多個所選擇的實體可來自單個類別,或者也可標識多個實體類別。例如,可選擇對應于書的實體以及對應于電影的實體??扇芜x地,可為所選擇的每一實體顯示實體卡。
實體卡提取
在標識實體之后,可從作為搜索結(jié)果而返回的文檔中提取關于該實體的信息??墒褂盟崛〉男畔砩蓪嶓w卡。實體卡允許關于意圖實體的信息被顯示成結(jié)果頁面的一部分,而無需用戶進一步點擊或其他動作以尋找該信息。
在搜索結(jié)果中的至少一個與面向類別的站點對應的各實施例中,可使用適當?shù)念悇e模板來提取實體卡的信息。所提取的信息的類型可基于類別而變化??杀惶崛〉男畔⒌氖纠ㄎ恢眯畔?、聯(lián)系信息以及針對給定實體類型通常被請求的其他信息。例如,電影的實體卡可包括影片長度、導演姓名、以及影片是否為喜劇、戲劇或另一類型的電影。餐廳實體卡可包括食品類型以及價格范圍的一般指示。關于運動隊的實體卡可包括下一場安排的比賽以及先前比賽的結(jié)果。
可包括在實體卡中的另一類型的信息是到其他類型的相關內(nèi)容的一個或多個鏈接。在某些實施例中,呈現(xiàn)在實體卡中的附加信息可對應于與搜索查詢的次級意圖相關的信息。例如,與當前影院放映的電影相關的搜索查詢有可能提供諸如電影評論和影院位置等結(jié)果。相反,影院中不再放映的電影將有可能具有與可購買該電影的副本的商店相關的結(jié)果。搜索結(jié)果的類型的這一差別可表示搜索查詢的次級意圖的差別。可使用該次級意圖信息來包括與次級意圖相關的鏈接作為實體卡的一部分。包括在實體卡中的鏈接可與作為來自搜索引擎的結(jié)果的一部分的鏈接對應或不對應。附加鏈接的性質(zhì)可取決于實體而變化。對于餐廳,可將鏈接提供給處理預訂的在線站點。對于諸如電影或樂隊等體育或娛樂實體,可將鏈接提供給具有可獲得的門票的站點。還可將鏈接提供給已知為處理該類別的評論的一個或多個第三方評論站點。
基于搜索結(jié)果來形成實體卡的優(yōu)點中的一個是信息可被動態(tài)地生成。由此,搜索結(jié)果中所反映的信息的任何改變也可在實體卡中被自動地更新。然而,動態(tài)構造的實體卡可與包含先前獲得的信息的靜態(tài)實體卡結(jié)合使用。在無法從搜索結(jié)果中提取所需信息的情況中,使用先前獲得的信息是有幫助的。
在又一實施例中,可標識實體,并且可提供包括所存儲的信息的實體卡。在這一實施例中,可使用以上描述的實體標識方法來標識并選擇實體。隨后可使用對應于所選擇的實體的所存儲的信息來形成實體卡。
基于實體檢測的信息放置
可使用與實體相關的搜索結(jié)果的意圖來修改對結(jié)果以及相關聯(lián)的信息的放置和/或顯示。在確定搜索查詢的意圖實體之后,結(jié)果可被查看以標識與實體有關的任何結(jié)果。這些可包括對應于面向類別的站點的結(jié)果、包括所標識的實體的名稱的結(jié)果、或關于所標識的實體沒有被成功地提取的附加信息。
實體的標識可按各種方式來修改信息的放置。在一個實施例中,實體的標識可導致對與實體相關的廣告的選擇。可將所選擇的廣告放置在頁面上接近對應于實體的搜索結(jié)果的位置。例如,如果對應于所標識的實體的排名最高的搜索結(jié)果是七至九,則可將廣告放置在接近示出前十個搜索結(jié)果的頁面的底部。類似地,如果生成了實體卡,則可將實體卡放置在與實體相關的排名最高的搜索結(jié)果附近、或接近與實體相關的排名第二高的結(jié)果。
實體檢測另一影響可以是將某些項從搜索結(jié)果的顯示中移除。例如,可將來自搜索結(jié)果的一個或多個文檔合并到實體卡??扇芜x地,可從所顯示的搜索結(jié)果列表中移除這些結(jié)果,因為替代地可經(jīng)由實體卡對這些文檔進行訪問。修改結(jié)果顯示的另一方式可以是顯示響應結(jié)果的一部分,諸如僅顯示與實體或與實體的類別相關的響應結(jié)果。在這一實施例中,一旦進行了類別和實體的分配,與類別和/或?qū)嶓w不匹配的結(jié)果可從結(jié)果顯示中被省略。相反,可顯示在附加用戶動作之后允許用戶訪問所排除的結(jié)果的對象。例如,可提供鏈接以指示更多與所標識的實體不相關的結(jié)果是可用的。這一鏈接可通過用戶點進或通過將指針或光標移動到鏈接位置上方來訪問。另外,可提供具有附加結(jié)果的下拉菜單。
實體檢測的示例
在這一假想示例中,用戶首先將搜索項“教父”鍵入搜索引擎中。由這一搜索生成的結(jié)果包括來自與電影相關的至少一個面向類別的站點的多個結(jié)果。與零售銷售和/或視頻游戲相關的附加的面向類別的結(jié)果也可在搜索結(jié)果中。因為面向類別的站點是排名最高的搜索結(jié)果,所以類別選擇是基于排名最高的面向類別的站點來作出的。結(jié)果,類別“電影”被選擇。
在選擇類別之后,使用面向類別的站點來檢測實體。這導致檢測到多個實體,因為電影“教父”和電影“教父ii”兩者都被包括在搜索結(jié)果中?;谂c“教父ii”相比,“教父”在更多響應結(jié)果中被檢測到的事實,電影“教父”被選作適當?shù)膶嶓w。隨后將響應結(jié)果連同對應于該電影的實體卡一起呈現(xiàn)給用戶。實體卡是基于從響應結(jié)果中列出的文檔中提取的信息來形成的。
在查看所呈現(xiàn)的結(jié)果之后,用戶將搜索項修改為“教父餐廳”。一組新的搜索結(jié)果被生成。在新結(jié)果中,評級最前的與一般評論站點對應,該一般評論站點可以是面向類別的但針對許多類別的。許多附加的潛在面向類別的站點被包括在前20個結(jié)果內(nèi),對應于其他已知評論站點。基于來自評論站點文檔的元標簽,選擇了類別“餐廳”。
基于該類別選擇,可選擇適當?shù)念悇e模板以分析這兩個面向類別的評論站點。還可使用開放格式類別模板來分析其他文檔。搜索結(jié)果包括位于美國周圍的若干不同餐廳、以及連鎖匹薩餐廳。然而,位置數(shù)據(jù)的唯一重復出現(xiàn)是針對加利福尼亞州的圣地亞哥。列出加利福尼亞州的圣地亞哥地址的文檔被分組在一起,并且該實體被選作對應于搜索查詢的實體。注意,如果餐廳的每一實例僅出現(xiàn)了一次,則在某些實施例中沒有實體將被標識,因為意圖會不清楚。隨后可從對應于實體的響應結(jié)果中提取關于該實體的附加信息。
在簡要描述了本發(fā)明的各實施例的概覽后,現(xiàn)在描述適于執(zhí)行本發(fā)明的示例性操作環(huán)境。概括地參考附圖,并首先具體參考圖1,示出了用于實現(xiàn)本發(fā)明的各實施例的示例性操作環(huán)境,并將其概括地指定為計算設備100。計算設備100只是合適的計算環(huán)境的一個示例,并且不旨在對本發(fā)明的使用范圍或功能提出任何限制。也不應該將計算設備100解釋為對所示出的任一組件或其組合有任何依賴性或要求。
本發(fā)明的各實施例可以在由計算機或諸如個人數(shù)據(jù)助理或其它手持式設備之類的其它機器執(zhí)行的計算機代碼或機器可使用指令(包括諸如程序模塊之類的計算機可執(zhí)行指令)的一般上下文中描述。一般而言,包括例程、程序、對象、組件、數(shù)據(jù)結(jié)構等的程序模塊指的是執(zhí)行特定任務或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的代碼。本發(fā)明可以在各種系統(tǒng)配置中實施,這些系統(tǒng)配置包括手持式設備、消費電子產(chǎn)品、通用計算機、更專用計算設備等等。本發(fā)明也可以在其中任務由通過通信網(wǎng)絡鏈接的遠程處理設備執(zhí)行的分布式計算環(huán)境中實施。
繼續(xù)參考圖1,計算設備100包括直接或間接耦合以下設備的總線110:存儲器112、一個或多個處理器114、一個或多個呈現(xiàn)組件116、輸入/輸出(i/o)端口118、i/o組件120、和說明性電源122??偩€110可表示一條或多條總線(諸如地址總線、數(shù)據(jù)總線、或其組合)。雖然為了清楚起見利用線條示出了圖1的各框,但是實際上,各組件的輪廓并不是那樣清楚,并且比喻性地來說,線條更精確地將是灰色的和模糊的。例如,可以認為諸如顯示設備的呈現(xiàn)組件是i/o組件。另外,許多處理器具有存儲器。發(fā)明人關于此點認識到這是本領域的特性,并重申,圖1的圖示只是可以結(jié)合本發(fā)明的一個或多個實施例來使用的示例性計算設備的例示。諸如“工作站”、“服務器”、“膝上型計算機”、“手持式設備”等分類之間沒有區(qū)別,它們?nèi)慷急徽J為是在圖1的范圍之內(nèi)的并且被稱為“計算設備”。
計算設備100通常包括各種計算機可讀介質(zhì)。計算機可讀介質(zhì)可以是可由計算設備100訪問的任何可用介質(zhì),而且包含易失性和非易失性介質(zhì)、可移動和不可移動介質(zhì)。作為示例而非限制,計算機可讀介質(zhì)可以包括計算機存儲介質(zhì)和通信介質(zhì)。計算機存儲介質(zhì)包括以用于存儲諸如計算機可讀指令、數(shù)據(jù)結(jié)構、程序模塊之類的信息或其他數(shù)據(jù)的任何方法或技術實現(xiàn)的易失性和非易失性、可移動和不可移動介質(zhì)。計算機存儲介質(zhì)包括,但不限于,隨機存取存儲器(ram)、只讀存儲器(rom)、電可擦除可編程只讀存儲器(eeprom)、閃存或其它存儲器技術、cd-rom、數(shù)字多功能盤(dvd)或其它全息存儲器、磁帶盒、磁帶、磁盤存儲或其它磁性存儲設備、載波或可用于編碼所需信息且可以由計算設備100訪問的任何其它介質(zhì)。在一個實施例中,計算機可讀介質(zhì)可以是有形計算機可讀介質(zhì)。在另一實施例中,計算機可讀介質(zhì)可以是非瞬態(tài)計算機可讀介質(zhì)。
存儲器112包括易失性和/或非易失性存儲器形式的計算機存儲介質(zhì)。存儲器可以是可移動的,不可移動的,或兩者的組合。示例性硬件設備包括固態(tài)存儲器、硬盤驅(qū)動器、光盤驅(qū)動器等等。計算設備100包括從諸如存儲器112或i/o組件120之類的各種實體讀取數(shù)據(jù)的一個或多個處理器。呈現(xiàn)組件116向用戶或其他設備呈現(xiàn)數(shù)據(jù)指示。示例性呈現(xiàn)組件包括顯示設備、揚聲器、打印組件、振動組件等等。
i/o端口118可允許計算設備100在邏輯上耦合到包括i/o組件120在內(nèi)的其他設備,這些設備中的一些可以是內(nèi)置的。說明性組件包括話筒、操縱桿、游戲墊、碟形衛(wèi)星天線、掃描儀、打印機、無線設備等等。
現(xiàn)在轉(zhuǎn)向圖2,示出了例示根據(jù)本發(fā)明的一實施例的示例性計算系統(tǒng)200的框圖。本領域普通技術人員將理解和明白,圖2所示的計算系統(tǒng)200僅僅是一個合適的計算系統(tǒng)環(huán)境的示例,并且不旨在對本發(fā)明的各實施例的使用范圍或功能提出任何限制。也不應該將計算系統(tǒng)200解釋為對其中所示出的任何單個組件或各組件的組合有任何依賴性或要求。此外,計算系統(tǒng)200可作為獨立產(chǎn)品、作為軟件開發(fā)環(huán)境的一部分或其任何組合來提供。
計算系統(tǒng)200包括經(jīng)由網(wǎng)絡204彼此通信的用戶設備206和搜索服務208。搜索服務208可包括搜索引擎212、實體標識組件214、模板存儲216以及結(jié)果呈現(xiàn)組件218。搜索引擎212可以是用于基于搜索查詢來生成響應結(jié)果的常規(guī)搜索引擎。實體標識組件214可分析搜索結(jié)果以確定類別以及對應于搜索查詢的實體。這一分析可部分地通過使用存儲在模板存儲216中的類別模板來執(zhí)行。結(jié)果呈現(xiàn)組件218可使用由實體標識組件214提供的實體信息來修改響應結(jié)果的顯示?;谒鶚俗R的實體,可將基于實體的標識的廣告包括在與關于所標識的實體的結(jié)果對應的位置。還可基于所標識的實體來呈現(xiàn)實體卡。
圖3描繪了示出根據(jù)本發(fā)明的一實施例的方法的流程圖。在圖3所示的實施例中,獲得響應于搜索查詢的多個結(jié)果310。可從遠程搜索引擎中獲得結(jié)果,或結(jié)果可基于接收搜索查詢以及生成一組響應結(jié)果??蓪⒁粋€或多個響應結(jié)果與對應于一個或多個面向類別的站點的類別模板進行匹配320。在各實施例中,響應結(jié)果可都與一個類別模板匹配,或結(jié)果可與來自單個實體類別的各類別模板匹配,或結(jié)果可與來自多個實體類別的類別模板匹配?;谝粋€或多個匹配的響應結(jié)果來選擇實體類別330。還基于響應結(jié)果來標識實體340。在各實施例中,可在選擇實體類別330之后標識實體340。隨后檢索對應于所標識的實體的存儲的實體信息350。將所檢索的實體信息連同至少一個響應結(jié)果合并到實體卡360。顯示不包括所合并的響應結(jié)果的響應結(jié)果列表370。實體卡也被顯示380。注意,在該實施例中,基于合并到所顯示的實體卡,所合并的響應結(jié)果被排除在響應結(jié)果列表以外。
圖4描繪了示出根據(jù)本發(fā)明的一實施例的方法的流程圖。在圖4所示的實施例中,獲得410響應于搜索查詢的多個結(jié)果??蓮倪h程搜索引擎中獲得結(jié)果,或結(jié)果可基于接收搜索查詢以及生成一組響應結(jié)果??蓪⒁粋€或多個響應結(jié)果與對應于一個或多個面向類別的站點的類別模板進行匹配420。在各實施例中,響應結(jié)果可都與一個類別模板匹配,或結(jié)果可與來自單個實體類別的各類別模板匹配,或結(jié)果可與來自多個實體類別的類別模板匹配?;谝粋€或多個匹配的響應結(jié)果來選擇實體類別430。基于響應結(jié)果來標識多個實體440。在各實施例中,可在選擇實體類別430之后標識多個實體440。多個實體各自具有相同的主標識。從響應結(jié)果中提取多個實體中的每一個的次級信息450?;谒崛〉拇渭壭畔韺⑺鶚俗R的實體分類到各實體組460。這一分類可允許是相同實體的所標識的實體被分組在一起,而每一不同實體具有分開的組。隨后可選擇與搜索查詢對應的實體組470。對于所選擇的實體組,可確定對應于該實體組的響應結(jié)果。將所選擇的實體組的次級信息合并到實體卡中490。顯示實體卡以及響應結(jié)果的一部分495。響應結(jié)果的一部分可排除被確定為對應于實體組的響應結(jié)果。
圖5描繪了示出根據(jù)本發(fā)明的一實施例的方法的流程圖。在圖5所示的實施例中,獲得響應于搜索查詢的多個結(jié)果510??蓮倪h程搜索引擎中獲得結(jié)果,或結(jié)果可基于接收搜索查詢以及生成一組響應結(jié)果??蓪⒁粋€或多個響應結(jié)果與對應于一個或多個面向類別的站點的類別模板進行匹配520。在各實施例中,響應結(jié)果可都與一個類別模板匹配,或結(jié)果可與來自單個實體類別的各類別模板匹配,或結(jié)果可與來自多個實體類別的類別模板匹配?;谝粋€或多個匹配的響應結(jié)果來選擇實體類別530。還基于響應結(jié)果來標識實體540。在各實施例中,可在選擇實體類別530之后標識實體540。隨后可從響應結(jié)果中提取實體信息550??蓪⒏鲗嶓w中的每一個實體的所提取的實體信息合并到實體卡560??娠@示多個實體卡570。
附加實施例
在一個實施例中,提供了存儲計算機可使用指令的一個或多個計算機存儲介質(zhì),當這些指令由計算機設備執(zhí)行時,執(zhí)行用于確定與搜索查詢相關聯(lián)的實體的方法。該方法包括獲得響應于搜索查詢的多個結(jié)果。將多個響應結(jié)果匹配到對應于面向類別的站點的多個類別模板??苫谠摱鄠€所匹配的響應結(jié)果來選擇實體類別?;诙鄠€所匹配的響應結(jié)果來標識實體。檢索關于所標識的實體的存儲的實體信息。將所檢索的實體信息以及至少一個響應結(jié)果合并到實體卡。在搜索結(jié)果列表中顯示響應結(jié)果,該列表不包括該至少一個所合并的響應結(jié)果。實體卡也被顯示。
在另一個實施例中,提供了存儲計算機可使用指令的一個或多個計算機存儲介質(zhì),當這些指令由計算機設備執(zhí)行時,執(zhí)行用于確定與搜索查詢相關聯(lián)的實體的方法。該方法包括獲得響應于搜索查詢的多個結(jié)果。將一個或多個響應結(jié)果匹配到對應于面向類別的站點的至少一個類別模板?;谝粋€或多個匹配的響應結(jié)果來選擇實體類別。標識對應于多個響應結(jié)果中所選擇的實體類別的多個實體,所標識的每一實體具有相同的主標識。從多個響應結(jié)果中提取對應于所標識的每一實體的次級標識信息?;谒崛〉拇渭墭俗R信息來將所標識的實體分類成一個或多個實體組。將實體組選為與搜索查詢對應。確定對應于所選擇的實體組的一個或多個響應結(jié)果。將所選擇的實體組的所提取的次級標識信息合并到實體卡中。顯示實體卡以及響應結(jié)果的一部分,響應結(jié)果的該部分排除了所確定的對應于所選擇的實體組的實體的一個或多個響應結(jié)果。
在又一實施例中,提供了用于確定與搜索查詢相關聯(lián)的實體的方法。該方法包括獲得響應于搜索查詢的多個結(jié)果。將一個或多個響應結(jié)果匹配到對應于面向類別的站點的至少一個類別模板?;谝粋€或多個匹配的響應結(jié)果來選擇一個或多個實體類別。基于多個響應結(jié)果來標識多個實體。從多個響應結(jié)果中提取對應于多個所標識的實體的實體信息。將多個所標識的實體中的每一個的所提取的實體信息合并到多個實體卡中。顯示多個實體卡。
參考各具體實施例描述了本發(fā)明的各實施例,各具體實施例在所有方面都旨在是說明性的而非限制性的。不偏離本發(fā)明范圍的情況下,各替換實施例對于本發(fā)明所屬領域的技術人員將變得顯而易見。
從前面的描述可以看出,本發(fā)明很好地適用于實現(xiàn)上文所闡述的所有目的和目標,并且具有對于該結(jié)構是顯而易見且固有的其他優(yōu)點。也可理解特定的特征和子組合是有用的,并且可以加以利用而無需參考其他特征和子組合。這由權利要求所構想的,并在權利要求的范圍內(nèi)。