欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于分級架構(gòu)內(nèi)的結(jié)果優(yōu)化的生成性分布的制作方法

文檔序號:6349953閱讀:229來源:國知局
專利名稱:用于分級架構(gòu)內(nèi)的結(jié)果優(yōu)化的生成性分布的制作方法
技術(shù)領(lǐng)域
此說明涉及計算機(jī)網(wǎng)絡(luò)的分級架構(gòu)內(nèi)的工作分布。
背景技術(shù)
用于數(shù)據(jù)檢索及處理的常規(guī)系統(tǒng)嘗試優(yōu)化特征(例如,結(jié)果生成的準(zhǔn)確性及及時性、計算資源的使用),且進(jìn)一步嘗試最小化對系統(tǒng)的用戶知識及與系統(tǒng)的相互作用。存在與此些嘗試相關(guān)聯(lián)的各種挑戰(zhàn)。舉例來說,在數(shù)據(jù)檢索中,理論上可能將所有必要數(shù)據(jù)存儲于靠近于所述數(shù)據(jù)的可能用戶的位置處,使得所述可能用戶將能夠接近地(且因此及時地)存取最準(zhǔn)確的數(shù)據(jù)。 然而,在許多系統(tǒng)中,可出現(xiàn)以下情況用戶為分布式的,且數(shù)據(jù)的大小(與用戶的分布組合)阻礙其存儲于任何單個位置中。此外,某一大小的數(shù)據(jù)變得難以以準(zhǔn)確且及時的方式來搜索,且計算資源可在數(shù)據(jù)被過度統(tǒng)一的情況下經(jīng)歷瓶頸。因此,在許多系統(tǒng)中,可以反映以上困難的方式來分布數(shù)據(jù)(及其處理)。舉例來說,通過將數(shù)據(jù)的某些類型或子集分布到不同地理位置,可促進(jìn)分布式用戶的存取,且可更高效地分配計算資源。特定來說,此些分布系統(tǒng)可依賴于以結(jié)構(gòu)化及組織化的方式提供數(shù)據(jù)分布的分級或基于樹的架構(gòu)。然而,此些分布式系統(tǒng)通常具有其自己的相關(guān)聯(lián)困難。舉例來說,此些分布式系統(tǒng)通常引入額外等待時間,因為(例如)必須跨越網(wǎng)絡(luò)傳送查詢及結(jié)果。此外,此些分布式系統(tǒng)可將數(shù)據(jù)的分布結(jié)構(gòu)化,使得在更多/不同位置中復(fù)制較快的數(shù)據(jù)庫,且因此比較大、較慢的數(shù)據(jù)庫更快且更規(guī)則地存取所述較快數(shù)據(jù)庫。更通常來說,此些分布式系統(tǒng)可具有與其它資源相比存取起來成本相對更高的一些資源。在此意義上,此些成本可指時間、金錢、 計算資源或討論中的系統(tǒng)內(nèi)(或與其相關(guān)聯(lián))的任何有限資源方面的成本。因此,可難以在優(yōu)化從所述系統(tǒng)獲得的結(jié)果的較大背景內(nèi)管理此些成本。

發(fā)明內(nèi)容
根據(jù)一個一般方面,生成器節(jié)點(diǎn)可包括在分級樹形處理架構(gòu)中,所述架構(gòu)包括經(jīng)配置以在所述架構(gòu)內(nèi)分布查詢的至少一個分布器節(jié)點(diǎn),包括分布到所述生成器節(jié)點(diǎn)及預(yù)界定生成器節(jié)點(diǎn)子集內(nèi)的至少一個其它生成器節(jié)點(diǎn)。所述分布器節(jié)點(diǎn)可進(jìn)一步經(jīng)配置以接收來自所述生成器節(jié)點(diǎn)的結(jié)果及來自所述至少一個其它生成器節(jié)點(diǎn)的結(jié)果且從其輸出經(jīng)匯編結(jié)果。所述生成器節(jié)點(diǎn)可包括查詢預(yù)處理器,其經(jīng)配置以處理從所述分布器節(jié)點(diǎn)接收的查詢以使用與搜索與所述生成器節(jié)點(diǎn)相關(guān)聯(lián)的生成器索引兼容的查詢特征來獲得查詢表示,從而獲得來自所述生成器節(jié)點(diǎn)的所述結(jié)果;及查詢分類器,其經(jīng)配置以輸入所述查詢表示且基于其來輸出關(guān)于由所述預(yù)界定生成器節(jié)點(diǎn)子集內(nèi)的所述至少一個其它生成器節(jié)點(diǎn)對所述查詢的處理是否將致使所述至少一個其它生成器節(jié)點(diǎn)的結(jié)果包括在所述經(jīng)匯編結(jié)果內(nèi)的預(yù)測。實施方案可包括以下特征中的一者或一者以上。舉例來說,查詢分類器可經(jīng)配置以結(jié)合獲得所述查詢表示且在生成來自所述生成器節(jié)點(diǎn)的所述結(jié)果之前將所述預(yù)測提供到所述分布器節(jié)點(diǎn),使得所述生成器節(jié)點(diǎn)及所述至少一個其它生成器節(jié)點(diǎn)并行地將其相應(yīng)結(jié)果提供到所述分布器節(jié)點(diǎn)。所述查詢分類器可經(jīng)配置以從所述架構(gòu)內(nèi)的多個其它生成器節(jié)點(diǎn)確定所述至少一個其它生成器節(jié)點(diǎn),且將所述至少一個其它生成器節(jié)點(diǎn)識別為應(yīng)將所述查詢轉(zhuǎn)發(fā)到的目標(biāo)節(jié)點(diǎn)。所述查詢分類器可經(jīng)配置以輸入與所述查詢表示相關(guān)聯(lián)的至少兩個查詢特征且基于其來計算所述預(yù)測。在此情況下,所述查詢分類器可經(jīng)配置以從與所述查詢表示相關(guān)聯(lián)的查詢特征集合選擇所述至少兩個查詢特征,且/或所述至少兩個查詢特征中的至少一者可包括所述查詢內(nèi)的項的項計數(shù)。所述查詢分類器可經(jīng)配置以提供所述預(yù)測,所述預(yù)測包括在表示所述至少一個其它生成器節(jié)點(diǎn)可能包括在所述經(jīng)匯編結(jié)果內(nèi)的程度的范圍內(nèi)的值。所述查詢分類器可經(jīng)配置以提供所述預(yù)測,所述預(yù)測包括在表示所述至少一個其它生成器應(yīng)處理所述查詢以供在提供來自所述至少一個其它生成器節(jié)點(diǎn)的所述結(jié)果中使用的程度的范圍內(nèi)的值。所述生成器節(jié)點(diǎn)可包括分類管理器,所述分類管理器經(jīng)配置以輸入包括與所述查詢表示相關(guān)聯(lián)的查詢特征、來自所述至少一個其它生成器節(jié)點(diǎn)的結(jié)果及多個機(jī)器學(xué)習(xí)算法中的一者的分類數(shù)據(jù),且經(jīng)配置以基于其來構(gòu)造用于輸出到所述查詢分類器的分類模型以供在輸出所述預(yù)測中使用。所述分類管理器可經(jīng)配置以追蹤來自所述至少一個其它節(jié)點(diǎn)的所述結(jié)果且用其來更新所述分類數(shù)據(jù)及所述分類模型。另外,或或者,所述生成器節(jié)點(diǎn)可包括監(jiān)視器,所述監(jiān)視器經(jīng)配置以不管是否由所述查詢分類器指示而觸發(fā)所述分布器節(jié)點(diǎn)以周期性地將所述查詢的子集發(fā)送到所述至少一個其它生成器節(jié)點(diǎn),且基于其來更新所述分類數(shù)據(jù)。來自所述生成器節(jié)點(diǎn)的所述結(jié)果可從與使用所述生成器索引的所述生成器節(jié)點(diǎn)相關(guān)聯(lián)的數(shù)據(jù)源來獲得,且來自所述至少一個其它生成器節(jié)點(diǎn)的所述結(jié)果從與使用對應(yīng)索引的所述至少一個其它生成器節(jié)點(diǎn)相關(guān)聯(lián)的數(shù)據(jù)源來獲得,且其中所述至少一個其它生成器節(jié)點(diǎn)在與所述生成器節(jié)點(diǎn)相比時存取起來成本效率較差。根據(jù)另一一般方面,其中至少一個處理器實施至少以下操作的計算機(jī)實施方法可包括在生成器節(jié)點(diǎn)處從分級樹形處理架構(gòu)內(nèi)的至少一個分布器節(jié)點(diǎn)接收查詢,所述架構(gòu)包括經(jīng)配置以在所述架構(gòu)內(nèi)分布查詢的所述至少一個分布器節(jié)點(diǎn),包括分布到所述生成器節(jié)點(diǎn)及至少一個其它生成器節(jié)點(diǎn),所述分布器節(jié)點(diǎn)進(jìn)一步經(jīng)配置以接收來自所述生成器節(jié)點(diǎn)的結(jié)果及來自所述至少一個其它生成器節(jié)點(diǎn)的結(jié)果且從其輸出經(jīng)匯編結(jié)果。所述方法可包括預(yù)處理從所述分布器節(jié)點(diǎn)接收的所述查詢以使用與搜索與所述生成器節(jié)點(diǎn)相關(guān)聯(lián)的生成器索引兼容的查詢特征來獲得查詢表示,從而獲得來自所述生成器節(jié)點(diǎn)的所述結(jié)果; 及使用所述查詢表示將所述查詢分類,從而基于其來輸出關(guān)于由所述至少一個其它生成器節(jié)點(diǎn)對所述查詢的處理是否將致使所述至少一個其它生成器節(jié)點(diǎn)的結(jié)果包括在所述經(jīng)匯編結(jié)果內(nèi)的預(yù)測。實施方案可包括以下特征中的一者或一者以上。舉例來說,將所述查詢分類可包括結(jié)合獲得所述查詢表示且在生成來自所述生成器節(jié)點(diǎn)的所述結(jié)果之前將所述預(yù)測提供到所述分布器節(jié)點(diǎn),使得所述生成器節(jié)點(diǎn)及所述至少一個其它生成器節(jié)點(diǎn)并行地將其相應(yīng)結(jié)果提供到所述分布器節(jié)點(diǎn)。另外,或或者,所述將所述查詢分類可包括輸入包括與所述查詢表示相關(guān)聯(lián)的查詢特征、來自所述至少一個其它生成器節(jié)點(diǎn)的結(jié)果及多個機(jī)器學(xué)習(xí)算法中的一者的分類數(shù)據(jù);及基于其來構(gòu)造分類模型以供在輸出所述預(yù)測中使用。另外,所述將所述查詢分類可包括不管是否由所述預(yù)測指示而觸發(fā)所述分布器節(jié)點(diǎn)以周期性地將所述查詢的子集發(fā)送到所述至少一個其它生成器節(jié)點(diǎn),且基于其來更新所述分類數(shù)據(jù)。根據(jù)另一一般方面,計算機(jī)程序產(chǎn)品可有形地體現(xiàn)于計算機(jī)可讀媒體上且可包括在被執(zhí)行時經(jīng)配置以致使數(shù)據(jù)處理設(shè)備進(jìn)行以下操作的可執(zhí)行代碼在生成器節(jié)點(diǎn)處從分級樹形處理架構(gòu)內(nèi)的至少一個分布器節(jié)點(diǎn)接收查詢,所述架構(gòu)包括經(jīng)配置以在所述架構(gòu)內(nèi)分布查詢的所述至少一個分布器節(jié)點(diǎn),包括分布到所述生成器節(jié)點(diǎn)及至少一個其它生成器節(jié)點(diǎn),所述分布器節(jié)點(diǎn)進(jìn)一步經(jīng)配置以接收來自所述生成器節(jié)點(diǎn)的結(jié)果及來自所述至少一個其它生成器節(jié)點(diǎn)的結(jié)果且從其輸出經(jīng)匯編結(jié)果;預(yù)處理從所述分布器節(jié)點(diǎn)接收的所述查詢以使用與搜索與所述生成器節(jié)點(diǎn)相關(guān)聯(lián)的生成器索引兼容的查詢特征來獲得查詢表示, 從而獲得來自所述生成器節(jié)點(diǎn)的所述結(jié)果;及使用所述查詢表示將所述查詢分類,從而基于其來輸出關(guān)于由所述至少一個其它生成器節(jié)點(diǎn)對所述查詢的處理是否將致使所述至少一個其它生成器節(jié)點(diǎn)的結(jié)果包括在所述經(jīng)匯編結(jié)果內(nèi)的預(yù)測。實施方案可包括以下特征中的一者或一者以上。舉例來說,在將所述查詢分類時, 所述經(jīng)執(zhí)行指令可致使所述數(shù)據(jù)處理設(shè)備結(jié)合獲得所述查詢表示且在生成來自所述生成器節(jié)點(diǎn)的所述結(jié)果之前將所述預(yù)測提供到所述分布器節(jié)點(diǎn),使得所述生成器節(jié)點(diǎn)及所述至少一個其它生成器節(jié)點(diǎn)并行地將其相應(yīng)結(jié)果提供到所述分布器節(jié)點(diǎn)。在將所述查詢分類時,所述經(jīng)執(zhí)行指令可致使所述數(shù)據(jù)處理設(shè)備輸入包括與所述查詢表示相關(guān)聯(lián)的查詢特征、來自所述至少一個其它生成器節(jié)點(diǎn)的結(jié)果及多個機(jī)器學(xué)習(xí)算法中的一者的分類數(shù)據(jù);及基于其來構(gòu)造分類模型以供在輸出所述預(yù)測中使用。在將所述查詢分類時,所述經(jīng)執(zhí)行指令可致使所述數(shù)據(jù)處理設(shè)備不管是否由所述預(yù)測指示而觸發(fā)所述分布器節(jié)點(diǎn)以周期性地將所述查詢的子集發(fā)送到所述至少一個其它生成器節(jié)點(diǎn),且基于其來更新所述分類數(shù)據(jù)。在附圖及下文說明中闡述一個或一個以上實施方案的細(xì)節(jié)。從所述說明及圖式且從權(quán)利要求書將明了其它特征。


圖IA是用于分級架構(gòu)內(nèi)的結(jié)果優(yōu)化的生成性分布的系統(tǒng)的框圖。
圖IB是圖解說明圖IA的系統(tǒng)的實例性操作的流程圖。圖2是圖解說明圖IA的生成器節(jié)點(diǎn)的實例性操作的流程圖。圖3是圖解說明圖IA的系統(tǒng)的分類管理器的額外實例性操作的流程圖。圖4A到圖4C是圖解說明用以構(gòu)造分類模型的分類數(shù)據(jù)的表格。圖5是圖IA的系統(tǒng)可在其中操作的實例性計算環(huán)境的框圖。
具體實施例方式圖IA是用于分級架構(gòu)內(nèi)的結(jié)果優(yōu)化的生成性分布的系統(tǒng)100的框圖。在圖IA中, 圖解說明分級樹形架構(gòu)促進(jìn)用戶104所要的搜索及其它操作。更具體來說,架構(gòu)102可接受查詢106且將經(jīng)匯編結(jié)果108返回給所述用戶,且可以優(yōu)化經(jīng)匯編結(jié)果108的有用性/ 準(zhǔn)確性的方式這樣做,同時有效地管理架構(gòu)102的操作的資源及與架構(gòu)102的操作相關(guān)聯(lián)的成本。在圖IA的實例中,可觀察到,用戶104可操作合適的圖形用戶接口(GUI)或其它接口可在上面實施的顯示器109,使得所述用戶可提交查詢106且通過其來接收經(jīng)匯編結(jié)果108。舉例來說,顯示器109可表示任何常規(guī)監(jiān)視器、投影儀或其它視覺顯示器,且對應(yīng)接口可包括因特網(wǎng)瀏覽器或其它⑶I。當(dāng)然,顯示器109可與合適的計算資源(例如,膝上型計算機(jī)、個人計算機(jī)或手持式計算機(jī))相關(guān)聯(lián),為清晰及簡潔起見其未具體圖解說明于圖 IA中。在實例性實施方案中,用戶104及顯示器109可由生成查詢106且預(yù)期經(jīng)匯編結(jié)果 108的另一計算系統(tǒng)取代。如上文所提及,通常來說,架構(gòu)102可包括若干個可能數(shù)據(jù)源,如下文詳細(xì)地描述。因此,經(jīng)匯編結(jié)果108可包括來自這些數(shù)據(jù)源中的不同者的結(jié)果。特定來說,如所展示, 經(jīng)匯編結(jié)果110、112、116與一個數(shù)據(jù)源(“S”)相關(guān)聯(lián),而經(jīng)匯編結(jié)果114與另一數(shù)據(jù)源 (“T”)相關(guān)聯(lián)??闪私猓ㄟ^架構(gòu)102內(nèi)的所述多個可用數(shù)據(jù)源,用戶104及架構(gòu)102的操作者均可能在存取架構(gòu)102之前不具有關(guān)于哪一數(shù)據(jù)源含有各種經(jīng)匯編結(jié)果110到116 及所述可用結(jié)果是否具有足以出現(xiàn)在經(jīng)匯編結(jié)果108中的質(zhì)量的具體知識。在架構(gòu)102中,圖解說明分布器節(jié)點(diǎn)118及分布器節(jié)點(diǎn)120,其經(jīng)配置以處理查詢及其它工作請求以轉(zhuǎn)發(fā)到適當(dāng)生成器節(jié)點(diǎn),例如,生成器節(jié)點(diǎn)122(與數(shù)據(jù)源“S”124相關(guān)聯(lián))、生成器節(jié)點(diǎn)126 (與數(shù)據(jù)源“T” 128相關(guān)聯(lián))及生成器節(jié)點(diǎn)129 (與數(shù)據(jù)源“U” 130相關(guān)聯(lián))中的一者。分布器節(jié)點(diǎn)118、120還可經(jīng)配置以從生成器節(jié)點(diǎn)122、126、129中的一者或一者以上接收經(jīng)返回結(jié)果以將其匯編成經(jīng)匯編結(jié)果108。因此,架構(gòu)102表示較一般情況的簡化實例,其中分級樹形架構(gòu)包括多個內(nèi)部分布器節(jié)點(diǎn),所述多個內(nèi)部分布器節(jié)點(diǎn)在作為所述查詢的結(jié)果的生成器的多個葉節(jié)點(diǎn)內(nèi)及當(dāng)中分布及收集查詢。在圖IA中且貫穿此說明,主要關(guān)于用于搜索數(shù)據(jù)源124、128、130的查詢來論述架構(gòu)102。然而,可了解,在此背景下的術(shù)語查詢具有更寬廣的含義,且更通常來說可被視為表示可適于在所描述架構(gòu)102的特定實例或標(biāo)的物內(nèi)的分布的幾乎任何工作或任務(wù)。舉例來說,此些工作可包括報告產(chǎn)生、將執(zhí)行的計算、將完成的任務(wù)或生成器節(jié)點(diǎn)122、126、129可針對其生成結(jié)果的幾乎任何工作。出于本說明的目的,那么,假設(shè)生成器122、126、129可包括索引或與所述索引相關(guān)聯(lián),所述索引與對應(yīng)數(shù)據(jù)源124、128、130相關(guān)且減輕或防止在數(shù)據(jù)源124、128、130的文檔的實際內(nèi)容內(nèi)進(jìn)行搜索的需要。在此方面,應(yīng)理解術(shù)語文檔是指可存儲于數(shù)據(jù)源124、 128,130內(nèi)且在本發(fā)明實例中可與對應(yīng)生成器節(jié)點(diǎn)122、126、129相關(guān)聯(lián)地索引以促進(jìn)對所述文檔的搜索的任何離散數(shù)據(jù)段或數(shù)據(jù)結(jié)構(gòu)。也就是說,例如,每一此種索引可含有關(guān)于對應(yīng)數(shù)據(jù)源內(nèi)的文檔的內(nèi)容(例如,包括所述文檔內(nèi)的字或短語)或表征所述內(nèi)容(包括音頻、視頻或圖形內(nèi)容)的元數(shù)據(jù)的結(jié)構(gòu)化信息。此些索引技術(shù)的實例在此項技術(shù)中是眾所周知的且除非對促進(jìn)對本說明的理解是必要的否則此處不予以進(jìn)一步描述。如上文所提及,通常可為以下情況數(shù)據(jù)源124、128、130包括在架構(gòu)102內(nèi)且因此與架構(gòu)102的其它元件兼容。也就是說,例如,貫穿架構(gòu)102分布的查詢可由各種分布節(jié)點(diǎn) 118及生成器節(jié)點(diǎn)122、126、128使用以獲得將最終匯編成經(jīng)匯編結(jié)果108的結(jié)果。然而,在這樣做時,將了解(如已描述),不同生成器節(jié)點(diǎn)122、126、128及相關(guān)聯(lián)數(shù)據(jù)源124、128、130可在與其存取相關(guān)聯(lián)的成本方面具有顯著差異。舉例來說,可出現(xiàn)以下情況生成器節(jié)點(diǎn)126在地理上遠(yuǎn)離分布器節(jié)點(diǎn)120及/或生成器節(jié)點(diǎn)122,從而引入與遍歷介入網(wǎng)絡(luò)以存取生成器節(jié)點(diǎn)126相關(guān)聯(lián)的存取等待時間。在另一實例中,生成器節(jié)點(diǎn)128 可具有有限的容量對查詢做出響應(yīng),且/或可如此大而使得搜索時間因此可令人無法接受地變長(在響應(yīng)時引入計算等待時間)。作為又一實例,在一些情況下,可存在與存取特定數(shù)據(jù)源相關(guān)聯(lián)的真實的財務(wù)成本。為減輕與存取架構(gòu)102的某些生成器節(jié)點(diǎn)的存取成本相關(guān)聯(lián)的這些及相關(guān)困難, 架構(gòu)102的操作者可具有一些數(shù)據(jù)(及相關(guān)聯(lián)數(shù)據(jù)源)可含有較廣泛存取且需要的數(shù)據(jù)且因此應(yīng)比其它數(shù)據(jù)源放置得更高(且因此,可更容易且更頻繁地存取)(例如,在圖IA的實例中,數(shù)據(jù)源124可被視為表示此種數(shù)據(jù)源)的一般知識。此外,可將可較廣泛存取且具有較頻繁需要的結(jié)果的此些數(shù)據(jù)源結(jié)構(gòu)化以含有較少可能總結(jié)果,以便相對快速且容易地更新、存取及搜索。相反,可在架構(gòu)102內(nèi)將可大得多、較遙遠(yuǎn)或另外存取起來成本較高的其它數(shù)據(jù)源放置得較低且因此較不頻繁地存取。舉例來說,在圖IA中,可出現(xiàn)以下情況生成器節(jié)點(diǎn)126及數(shù)據(jù)源128在地理上遙遠(yuǎn),而生成器節(jié)點(diǎn)129及數(shù)據(jù)源130具有有限的容量對查詢做出響應(yīng)。在此種架構(gòu)中,應(yīng)明了,可首先將查詢106分布到生成器節(jié)點(diǎn)122,其為最可能含有所要的查詢結(jié)果且/或最能夠以及時、成本高效的方式提供此些結(jié)果的源。當(dāng)然,生成器節(jié)點(diǎn)122及數(shù)據(jù)源124實際上可能不含有針對查詢106的完整或最好的結(jié)果集合。在此情景中,一種選項是等待判斷從數(shù)據(jù)源124獲得的結(jié)果的數(shù)量或質(zhì)量,且接著在認(rèn)為必要的情況下繼續(xù)存取剩余生成器節(jié)點(diǎn)126、129中的一者或一者以上。然而,在此選項中,難以知道查詢結(jié)果的此數(shù)量或質(zhì)量是否值得與對生成器節(jié)點(diǎn) 126、129的此存取相關(guān)聯(lián)的成本及努力。特定來說,在分布器節(jié)點(diǎn)118、120負(fù)責(zé)在架構(gòu)102 內(nèi)分布(例如,路由)查詢的情況下,此(些)分布器節(jié)點(diǎn)可難以具有信息或計算資源來做出關(guān)于選擇生成器節(jié)點(diǎn)122、126、129中的哪一者來將查詢106轉(zhuǎn)發(fā)給其的智能決策。此信息可對于生成器節(jié)點(diǎn)122、126、129中的一者或一者以上為本地的,且對于(例如)分布器節(jié)點(diǎn)120來說不容易獲得。因此,分布器節(jié)點(diǎn)120可難以確定將查詢106分布到(例如) 生成器節(jié)點(diǎn)126對查詢106及經(jīng)匯編結(jié)果108是否將有用。在此方面且通過術(shù)語,當(dāng)架構(gòu)102的數(shù)據(jù)源返回經(jīng)匯編結(jié)果108內(nèi)所含有的查詢結(jié)果時可稱其為生成性。舉例來說,在圖IA中,可了解,所呈現(xiàn)的經(jīng)匯編結(jié)果110到116表示針對查詢106的最好可用查詢結(jié)果。如所展示及描述,從數(shù)據(jù)源128獲得結(jié)果114,使得可稱生成器節(jié)點(diǎn)126對查詢106及經(jīng)匯編結(jié)果108為生成性。如果(假設(shè))在提供經(jīng)匯編結(jié)果108時存取生成器節(jié)點(diǎn)129,那么將觀察到數(shù)據(jù)源130不提供當(dāng)相對于來自數(shù)據(jù)源 124、128的結(jié)果評定等級時被認(rèn)為值得包括在經(jīng)匯編結(jié)果內(nèi)的任何結(jié)果,使得生成器節(jié)點(diǎn) 129將被視為對查詢106及經(jīng)匯編結(jié)果108為非生成性。使用此術(shù)語,很明顯,不返回針對查詢106的生成性結(jié)果的對生成器節(jié)點(diǎn)126、129 的任何存取可被視為資源的浪費(fèi)及對于用戶104的可能不便(例如,由于計算及或存取等待時間),因為所述用戶從此種存取得不到換取進(jìn)行所述存取所需要的努力的益處。舉例來說,可出現(xiàn)以下情況數(shù)據(jù)源124最初生成大量結(jié)果,且可難以知道通過存取生成器126、 129是否可改善此些結(jié)果;即,將顯著地、微小地還是根本不改善所述結(jié)果。在微小改善或無改善的后兩種情況下,如所描述,存取生成器126、129中的一者或兩者可通常形成對資源的不良使用。此外,在此些情景中,甚至在對生成器節(jié)點(diǎn)122的存取提供對輔助生成器節(jié)點(diǎn)126、129的存取為必要(例如,例如當(dāng)生成器節(jié)點(diǎn)122提供非常少的結(jié)果或不提供任何結(jié)果時)的強(qiáng)烈指示的情形中,且甚至當(dāng)此存取的結(jié)果為生成性時,仍可觀察到當(dāng)做出/提供所述指示的時間與當(dāng)實際存取輔助生成器節(jié)點(diǎn)126、129且從其獲得結(jié)果的時間之間的不利等待時間。因此,在圖IA的系統(tǒng)100中,生成器節(jié)點(diǎn)122具備搶先預(yù)測何時可值得對生成器節(jié)點(diǎn)126、129進(jìn)行存取(例如,當(dāng)此存取可能為生產(chǎn)性且從其獲得的生產(chǎn)性結(jié)果中的結(jié)果包括在經(jīng)匯編結(jié)果108中時)的能力。此外,在圖IA中,可在對數(shù)據(jù)源124的存取之前(及 /或結(jié)合對數(shù)據(jù)源124的存取)由生成器節(jié)點(diǎn)122自己做出此些預(yù)測。以此方式,生成器節(jié)點(diǎn)122、126及/或129進(jìn)行的查詢處理可本質(zhì)上并行地進(jìn)行,且此外可更可能從生成器節(jié)點(diǎn)126、129提供生成性結(jié)果及對架構(gòu)102內(nèi)的資源的高效使用。具體來說,如所展示,可使用計算裝置132或與計算裝置132相關(guān)聯(lián)地執(zhí)行生成器 122??闪私?,計算裝置132可為適于執(zhí)行本文中所描述(例如下文關(guān)于圖5更詳細(xì)地描述)的任務(wù)的幾乎任何計算裝置。在圖IA中,圖解說明查詢預(yù)處理器134,其經(jīng)配置以接收查詢106且準(zhǔn)備查詢106 與生成器節(jié)點(diǎn)122的對應(yīng)索引一同使用,從而從數(shù)據(jù)源124獲得結(jié)果。換句話說,查詢預(yù)處理器134輸入查詢且輸出為所述查詢的更完全且/或更兼容再現(xiàn)(關(guān)于生成器節(jié)點(diǎn)122(及相關(guān)聯(lián)索引)及數(shù)據(jù)源124)的查詢表示。此種查詢預(yù)處理的實例通常在此項技術(shù)中為已知且除非對促進(jìn)對本說明的理解是需要的否則此處不予以詳細(xì)描述。但一般來說,可了解此種查詢預(yù)處理可包括對查詢106 的分析以獲得與其相關(guān)聯(lián)的查詢特征集合。僅以非限制性實例的方式,一些此類查詢特征可包括(例如)查詢的長度(即,字符的數(shù)目)、查詢中的項的數(shù)目、查詢的布爾(Boolean) 結(jié)構(gòu)、查詢的一個或一個以上項的同義字、具有與查詢中的項的語義含義類似的語義含義的字、具有與查詢中的項類似的拼寫(或誤拼寫)的字及/或?qū)Σ樵兊亩陶Z分析。在最后一方面中,此種短語分析可包括(例如)每一短語的長度、在查詢內(nèi)哪些字彼此靠近的分析,且/或可包括在查詢106內(nèi)靠近的兩個或兩個以上字在其它環(huán)境中(例如,一般在因特網(wǎng)上)往往以何種頻率呈現(xiàn)為彼此靠近的分析。此種分析可計及可被認(rèn)為與查詢相關(guān)的特定主題或標(biāo)的物(例如,語料庫特定知識,尤其是含有可往往包括某些短語或其它字關(guān)系的特定類型的結(jié)果文檔的專門化的語料庫)。在其它實例中,此種分析可故意避免對此種語料庫特定知識的考慮,且可一般地關(guān)于所有可用/合格標(biāo)的物考慮所述項及其彼此的關(guān)系。一般來說,此種查詢預(yù)處理可產(chǎn)生用戶104將獲得來自數(shù)據(jù)源124的所要結(jié)果的增加的可能性。舉例來說,通過包括查詢106的同義字及可能誤拼寫,生成器節(jié)點(diǎn)122可從數(shù)據(jù)源124獲得相對更大的結(jié)果集合。接著,當(dāng)對這些結(jié)果進(jìn)行排序/過濾/評定等級或以其它方式進(jìn)行處理時,所述結(jié)果可比在不包括同義字及誤拼寫的情況下更可能提供所要的結(jié)果。一般來說,在處理時間及/或計算資源有限的情況下,可難以或另外不期望考慮所有這些查詢特征或甚至大多數(shù),且(類似地)可期望限制考慮/實施查詢特征的程序(例如,可期望限制所包括的同義字的數(shù)目)。如所描述,存在關(guān)于數(shù)據(jù)源124的索引以各種方式且以各種程度利用此查詢預(yù)處理的一般概念的常規(guī)系統(tǒng)。在圖IA的實例中,生成器節(jié)點(diǎn)122不僅使用此種查詢預(yù)處理的一些或所有結(jié)果來存取數(shù)據(jù)源124的索引,而且進(jìn)行對查詢106的分類,此從而提供(結(jié)合存取數(shù)據(jù)源124)關(guān)于是否可有必要或期望存取生成器節(jié)點(diǎn)126、129 (此存取對經(jīng)匯編結(jié)果 108將為生成性還是可能為生成性)的預(yù)測。接著,使用此種預(yù)測,分布器節(jié)點(diǎn)120可被更好地通知是否及何時關(guān)于查詢106存取生成器節(jié)點(diǎn)126、129。因此,舉例來說,此種存取在發(fā)生時更可能為生成性,且當(dāng)其將不為生成性(且因此將浪費(fèi)系統(tǒng)資源及/或用戶時間)時較不可能發(fā)生。此外,對生成器節(jié)點(diǎn)126、129的此種存取在開始之前不需要等待對生成器節(jié)點(diǎn)122的存取完成,而是可本質(zhì)上并行地進(jìn)行, 使得可以高效且時間高效的方式提供經(jīng)匯編結(jié)果108。具體來說,在圖IA的實例中,包括分類管理器140,其存取分類數(shù)據(jù)138以構(gòu)造模型,查詢分類器142可用所述模型來做出關(guān)于對生成器節(jié)點(diǎn)126、129的存取對查詢106的經(jīng)匯編結(jié)果是否將為生成性的上文所提及的預(yù)測。舉例來說,如下文關(guān)于圖3及圖4詳細(xì)地描述,分類管理器140可實施機(jī)器學(xué)習(xí)技術(shù),以便構(gòu)造將由查詢分類器142實施的分類模型。一般來說,分類管理器140可通過將在生成器節(jié)點(diǎn)122處接收的相對大數(shù)目個查詢發(fā)送到其它生成器節(jié)點(diǎn)126、129中的一者或一者以上而操作。接著,監(jiān)視器136可用以觀察并追蹤此些查詢的結(jié)果,且將這些結(jié)果報告給分類管理器140。因此,分類數(shù)據(jù)138可包括(例如)由查詢預(yù)處理器使用的各種查詢特征的類型或性質(zhì)、在生成器節(jié)點(diǎn)122處接收的查詢的此些查詢特征的實際值及由監(jiān)視器136關(guān)于所存儲查詢及查詢特征(及其值) 從生成器節(jié)點(diǎn)126、129中的一者或一者以上追蹤的結(jié)果。分類管理器140可接著構(gòu)造將輸出到查詢分類器142且由查詢分類器142使用的分類模型(如下文關(guān)于圖3及圖4所描述)。接著,在查詢106實際由生成器節(jié)點(diǎn)122接收的稍后時間,查詢分類器142可輸入來自查詢預(yù)處理器134的對查詢106的預(yù)處理以及來自分類管理器140的分類模型,且可使用此信息來做出關(guān)于應(yīng)將查詢106發(fā)送到生成器節(jié)點(diǎn)126、129 (對經(jīng)匯編結(jié)果108可能為生成性)還是不應(yīng)將查詢106發(fā)送到生成器節(jié)點(diǎn) 126、129(可能為非生成性且因此可能浪費(fèi)計算資源及用戶時間)的預(yù)測。在此方面,可了解,如已描述,查詢預(yù)處理器考慮預(yù)界定的查詢特征中的一些或全部且相應(yīng)地處理查詢106以通過其來存取數(shù)據(jù)源124的索引。關(guān)于查詢分類器142及分類管理器140 (其也使用查詢預(yù)處理器134的結(jié)果),可稱查詢預(yù)處理器134提供查詢106的查詢表示。也就是說,此種查詢表示可被視為查詢106的經(jīng)擴(kuò)展(或在一些情況下經(jīng)收縮) 及/或經(jīng)分析版本(其含有與其相關(guān)的數(shù)據(jù)及元數(shù)據(jù)),且與所述預(yù)界定的查詢特征相關(guān)。 在一些情況下,由分類管理器140/查詢分類器142使用的此種查詢表示可為由生成器節(jié)點(diǎn) 122的索引用來存取數(shù)據(jù)源124的相同查詢表示。在其它實例中,由分類管理器140/查詢分類器142使用的查詢表示可為由生成器節(jié)點(diǎn)122的索引用來存取數(shù)據(jù)源124的不同查詢表示(例如,可使用查詢特征的不同子集及其值來構(gòu)造分類模型)。特定來說,可隨時間更新分類模型以反映架構(gòu)102及其內(nèi)容的動態(tài)性質(zhì),且因此在分類模型的不同實施例中可需要或使用查詢特征的不同子集。另一方面,由生成器節(jié)點(diǎn)122用來存取數(shù)據(jù)源124的查詢表示可相對靜止或改變較慢,且可使用更恒定的查詢特征集合。因此,基于來自查詢預(yù)處理器134的查詢表示及來自分類管理器140的分類模型 (及來自監(jiān)視器136的相關(guān)聯(lián)數(shù)據(jù)及/或分類數(shù)據(jù)138),查詢分類器142可進(jìn)行對查詢106 的分類,其本質(zhì)上提供關(guān)于將查詢106分布到(例如)生成器節(jié)點(diǎn)126對經(jīng)匯編結(jié)果108 是否將為生成性的預(yù)測。更具體來說,查詢分類器142可將此種分類/預(yù)測轉(zhuǎn)發(fā)到分布器節(jié)點(diǎn)120,分布器節(jié)點(diǎn)120可接著相應(yīng)地轉(zhuǎn)發(fā)(或不轉(zhuǎn)發(fā))所述查詢。在一些實例性實施例中,分布器節(jié)點(diǎn) 120可經(jīng)配置以只是接收所述預(yù)測且使用(例如)查詢轉(zhuǎn)發(fā)器168相應(yīng)地轉(zhuǎn)發(fā)查詢106 (或不轉(zhuǎn)發(fā))。在其它實例性實施例中,分布器節(jié)點(diǎn)120可經(jīng)配置以做出關(guān)于是否、何時及如何將查詢106分布到其它生成器節(jié)點(diǎn)的更高級決策。在后一方面中,舉例來說,分布器節(jié)點(diǎn)120可包括查詢解析器166,其經(jīng)配置以處理來自查詢分類器142的預(yù)測且做出關(guān)于由查詢轉(zhuǎn)發(fā)器168對查詢106的轉(zhuǎn)發(fā)的智能決策。舉例來說,在一些實例性實施例中,查詢分類器142可將對查詢的分類提供為關(guān)于將查詢106轉(zhuǎn)發(fā)到生成器節(jié)點(diǎn)126是否將為生成性的簡單是/否決策。在其它實施例中,查詢分類器142可將所述決策提供為一范圍內(nèi)的值,所述范圍指示所識別生成器節(jié)點(diǎn)是否可能含有生成性結(jié)果的相對可能性(其中在一些情況下,所述生成性結(jié)果可能性可進(jìn)一步細(xì)分成指示所預(yù)測生成性的程度的種類,例如被預(yù)測將在經(jīng)匯編結(jié)果108的第一頁或其它最高集合內(nèi)的“高度生成性”查詢)。接著,查詢解析器166可輸入此種信息以及是否、何時及如何分布查詢106。舉例來說,查詢解析器166可對例如網(wǎng)絡(luò)當(dāng)前是否擁擠或通過特定查詢對特定生成器節(jié)點(diǎn)的特定存取成本可如何等因子進(jìn)行加權(quán)。因此,查詢解析器166可(例如)本質(zhì)上使用存取給定生成器節(jié)點(diǎn)(與從其獲得的結(jié)果的有用性的所預(yù)測可能性及程度比較)的已知/所預(yù)測成本執(zhí)行成本效益分析。在圖IA中,各種組件被圖解說明為離散/單獨(dú)位置(例如,不同地理位置及/或不同網(wǎng)絡(luò)位置)處的離散元件。舉例來說,如剛剛所論述,查詢解析器166被圖解說明為與分布器節(jié)點(diǎn)120共同定位,因為分布器節(jié)點(diǎn)120可相對好地定位以被通知當(dāng)前網(wǎng)絡(luò)條件或與架構(gòu)102相關(guān)的其它狀態(tài)信息,且/或可被通知關(guān)于在架構(gòu)102的分級內(nèi)在其下面的所有生成器節(jié)點(diǎn)122、126、129。因此,查詢解析器166可處于一位置中以做出關(guān)于是否、何時及如何轉(zhuǎn)發(fā)查詢106的所描述決策。類似地,查詢預(yù)處理器134及查詢分類器142被圖解說明為包含于生成器節(jié)點(diǎn)122的單個計算裝置132內(nèi)。然而,在各種實際實施方案中,圖IA的許多變化形式是可能的。特定來說,例如當(dāng)查詢預(yù)處理器134在單獨(dú)的(例如,上游)裝置中執(zhí)行一些或全部預(yù)處理功能時,各種所描述功能性可每一者在單個組件/裝置中執(zhí)行,或可以分布式方式(例如,使用多個裝置)來執(zhí)行。相反,被圖解說明為位于多個裝置/元件上的功能性可實際上在單個裝置(例如,查詢解析器166)上執(zhí)行,或其至少一些功能可在被圖解說明為與生成器節(jié)點(diǎn)122相關(guān)聯(lián)的計算裝置132上執(zhí)行。然而,為清晰及簡潔起見,本身在此項技術(shù)中為已知的某些元件(例如, 例如分布器節(jié)點(diǎn)120的用于將來自兩個或兩個以上生成器節(jié)點(diǎn)122、126、128的結(jié)果匯編成經(jīng)匯編結(jié)果108的匯編器)未在圖IA中明確圖解說明。因此,所屬領(lǐng)域的技術(shù)人員將顯而易見使用此些已知組件連同所圖解說明組件中的一些或全部(及其變化形式)的系統(tǒng)100 的另外其它實施方案。圖IB是圖解說明圖IA的系統(tǒng)的實例性操作的流程圖100。如所展示,出于清晰及理解的目的,用圖IA中的對應(yīng)參考編號來相同地圖解說明及標(biāo)記流程圖100的操作。因此,在圖IA及圖IB中,(例如)在分布器節(jié)點(diǎn)118處從用戶104接收查詢 106(144)。分布器節(jié)點(diǎn)118將查詢106轉(zhuǎn)發(fā)到分布器120(146),分布器120又將查詢106 轉(zhuǎn)發(fā)到生成器節(jié)點(diǎn)122(148)。特定來說,如上文所描述,針對本文中的實例假設(shè)在架構(gòu)102 內(nèi)分布器120知道生成器節(jié)點(diǎn)122被視為含有針對查詢106的最多存取、最期望、最容易存取、最小且/或最新鮮的結(jié)果。因此,可首先且立即將所有此些查詢傳遞到生成器節(jié)點(diǎn)122。在接收到其后,生成器節(jié)點(diǎn)122可即刻開始(例如)使用查詢預(yù)處理器134對查詢106進(jìn)行預(yù)處理(149、150)。也就是說,如所描述,查詢預(yù)處理器134可分析與查詢106 及查詢預(yù)處理器134相關(guān)聯(lián)的查詢特征以獲得供在存取數(shù)據(jù)源124的索引中使用的查詢表示(149)。同時及/或作為同一處理的部分,查詢預(yù)處理器134可分析查詢特征且輸出相同或不同查詢表示,所述查詢表示由查詢分類器142結(jié)合分類數(shù)據(jù)138及分類管理器140的分類模型使用以提供查詢分類(150)。接著,生成器節(jié)點(diǎn)122將所述查詢分類轉(zhuǎn)發(fā)到分布器節(jié)點(diǎn)120 (151),從而提供關(guān)于存取其它生成器節(jié)點(diǎn)126、129中的一者或一者以上的生成性的可能性的預(yù)測。從此說明可觀察到,生成器節(jié)點(diǎn)122(例如,查詢分類器142)經(jīng)配置以在對查詢 106的預(yù)處理(以存取數(shù)據(jù)源124的索引)之前及/或結(jié)合對查詢106的預(yù)處理且在關(guān)于數(shù)據(jù)源124實際解析查詢106(152)之前將對查詢分類的預(yù)測發(fā)送到分布器節(jié)點(diǎn)120。換句話說,如所展示,此查詢解析(152)可本質(zhì)上與分布器節(jié)點(diǎn)120將查詢106轉(zhuǎn)發(fā)到生成器節(jié)點(diǎn)126、129的操作并行地進(jìn)行。因此,可觀察到,分布器節(jié)點(diǎn)120不需要等待從數(shù)據(jù)源124 獲得的實際結(jié)果而關(guān)于查詢106做出轉(zhuǎn)發(fā)決策,使得(例如)可針對查詢106改善架構(gòu)102 的響應(yīng)時間連同經(jīng)匯編結(jié)果108的質(zhì)量。此外在圖IB中,接著,生成器節(jié)點(diǎn)122可根據(jù)數(shù)據(jù)源124完成對查詢106的解析 (152)且將其結(jié)果提供到分布器節(jié)點(diǎn)120(154)。如剛剛所描述,這些操作可與查詢106到生成器節(jié)點(diǎn)126的轉(zhuǎn)發(fā)(156)及生成器節(jié)點(diǎn)126根據(jù)數(shù)據(jù)源128對查詢106的隨后解析 (158)(自然地后跟生成器126將數(shù)據(jù)源128的結(jié)果轉(zhuǎn)發(fā)到分布器120(160))并行(例如,
可重疊)。
一旦從圖IB的實例的至少兩個生成器節(jié)點(diǎn)122、126接收到結(jié)果,那么分布器 120可將所述結(jié)果合并成經(jīng)匯編結(jié)果108以轉(zhuǎn)發(fā)到分布器118(162)且最終轉(zhuǎn)發(fā)到用戶 104(164)。在圖IB中,給出其中查詢分類器142關(guān)于生成器節(jié)點(diǎn)126的生成性輸出肯定預(yù)測 (如查詢106到生成器節(jié)點(diǎn)126的隨后轉(zhuǎn)發(fā)所示)的實例。展示所述預(yù)測為正確的,因為經(jīng)匯編結(jié)果108實際上確實在來自數(shù)據(jù)源124的結(jié)果110、112、116內(nèi)包括來自數(shù)據(jù)源128的結(jié)果114。在其它實例中,當(dāng)然,所述預(yù)測可為否定的(例如,其它生成器節(jié)點(diǎn)可不提供任何生成性結(jié)果的強(qiáng)烈預(yù)期)。在此些情況下,分布器節(jié)點(diǎn)120可配置有不將查詢106轉(zhuǎn)發(fā)到生成器節(jié)點(diǎn)122以外的默認(rèn)行為,除非肯定地被提供以關(guān)于至少一個其它生成器節(jié)點(diǎn)的預(yù)期生成性的至少一名義上肯定的預(yù)測,在此情況下,查詢分類器142可不需要將任何分類/預(yù)測轉(zhuǎn)發(fā)到分布器節(jié)點(diǎn)120。在其它實例中,可如在圖IA中出現(xiàn)以下情況存在可將查詢106轉(zhuǎn)發(fā)到的若干個可能的其它生成器節(jié)點(diǎn)126、129。在此情形中,查詢分類器142可將查詢106分類為被預(yù)測為僅可用生成器節(jié)點(diǎn)中的一些可用生成器節(jié)點(diǎn)產(chǎn)出生成性結(jié)果(例如,被預(yù)測為從生成器節(jié)點(diǎn)126但不從生成器節(jié)點(diǎn)129產(chǎn)出生成性結(jié)果)。在此情況下及類似情形中,生成器節(jié)點(diǎn) 122可將查詢分類連同對至少一個其它生成器節(jié)點(diǎn)作為將查詢106轉(zhuǎn)發(fā)到的目標(biāo)節(jié)點(diǎn)的識別一起轉(zhuǎn)發(fā)。換句話說,例如,分類管理器140及監(jiān)視器136且因此查詢分類器142可基于對不同可用、相關(guān)生成器節(jié)點(diǎn)126、129的獨(dú)立分析來執(zhí)行相應(yīng)功能,使得所得分類/預(yù)測可關(guān)于不同可用生成器節(jié)點(diǎn)對于相同查詢106而不同。圖2是圖解說明圖IA的生成器節(jié)點(diǎn)122的實例性操作的流程圖200。在圖2中, 圖解說明將實例性操作提供為一系列離散線性操作的操作202、204、206。然而,可了解,所述實例性操作實際上可重疊及/或部分并行地進(jìn)行,或可以不同于圖2中所圖解說明的次序而發(fā)生(在本文中不另外需要特定次序的情況下)。此外,可包括圖2中未明確圖解說明的額外或替代操作。在圖2中,那么,所述操作包括在生成器節(jié)點(diǎn)處從分級樹形處理架構(gòu)內(nèi)的至少一個分布器節(jié)點(diǎn)接收(202)查詢,所述架構(gòu)包括經(jīng)配置以在所述架構(gòu)內(nèi)分布查詢的所述至少一個分布器節(jié)點(diǎn),包括分布到所述生成器節(jié)點(diǎn)及至少一個其它生成器節(jié)點(diǎn),所述分布器節(jié)點(diǎn)進(jìn)一步經(jīng)配置以接收來自所述生成器節(jié)點(diǎn)的結(jié)果及來自所述至少一個其它生成器節(jié)點(diǎn)的結(jié)果且從其輸出經(jīng)匯編結(jié)果。舉例來說,如關(guān)于圖IA及圖IB詳細(xì)地描述,可在生成器節(jié)點(diǎn)122處從架構(gòu)102的分布器節(jié)點(diǎn)120接收查詢106,其中分布器節(jié)點(diǎn)120經(jīng)配置以在架構(gòu)102內(nèi)分布查詢(包括分布到生成器節(jié)點(diǎn)122、126、129,如所展示),且接收來自這些生成器節(jié)點(diǎn)中的至少兩者的結(jié)果且從其提供經(jīng)匯編結(jié)果108。所述操作可進(jìn)一步包括預(yù)處理(204)從所述分布器節(jié)點(diǎn)接收的查詢以使用與搜索與所述生成器節(jié)點(diǎn)相關(guān)聯(lián)的生成器索引兼容的查詢特征來獲得查詢表示,從而獲得來自所述生成器節(jié)點(diǎn)的結(jié)果。舉例來說,查詢預(yù)處理器134可相對于特定查詢106內(nèi)的此些特征的實際值使用如上文所描述的某些查詢特征,以準(zhǔn)備查詢106用于根據(jù)數(shù)據(jù)源124的索引進(jìn)行處理。同時,查詢預(yù)處理器134可使用相同查詢特征(例如,其相同或不同子集)來構(gòu)造查詢表示,其因此可為用以存取數(shù)據(jù)源124的索引的相同或不同查詢表示。
最后在圖2中,操作可包括使用所述查詢表示將所述查詢分類(206),從而基于其輸出關(guān)于由所述至少一個其它生成器節(jié)點(diǎn)對所述查詢的處理是否將致使所述至少一個其它生成器節(jié)點(diǎn)的結(jié)果包括在所述經(jīng)匯編結(jié)果內(nèi)的預(yù)測。舉例來說,所述查詢分類器142可經(jīng)配置以輸入所述查詢表示連同查詢106的特定相關(guān)聯(lián)值,且輸入來自分類管理器140及監(jiān)視器136的分類模型以及對應(yīng)分類數(shù)據(jù)138,且從而輸出充當(dāng)?shù)椒植计鞴?jié)點(diǎn)120的預(yù)測的查詢106的分類。如所描述,所述預(yù)測提供關(guān)于查詢106在被轉(zhuǎn)發(fā)到至少一個其它生成器節(jié)點(diǎn)126的情況下將提供生成性結(jié)果的可能性及/或程度的指示。因此,圖2圖解說明生成器節(jié)點(diǎn)122的一些實例性基本操作。如已描述,許多額外或替代變化形式是可能的。舉例來說,可了解,架構(gòu)102可比圖IA中所示顯著更大且/或更復(fù)雜。舉例來說,額外生成器節(jié)點(diǎn)可與分布器節(jié)點(diǎn)118、120連通,且/或可包括比此(些) 實例中所圖解說明更多的分布器節(jié)點(diǎn)。此外,在圖IA中,僅生成器節(jié)點(diǎn)122被圖解說明為包括本文中所描述的查詢分類 /預(yù)測功能性。然而,可出現(xiàn)以下情況架構(gòu)102的生成器節(jié)點(diǎn)中的兩者或兩者以上可包括此功能性的部分或全部或其變化形式。此些特征可提供益處,因為(舉例來說)每一生成器節(jié)點(diǎn)可具有討論中的生成器節(jié)點(diǎn)可容易地獲得但架構(gòu)102的其它元件(分布器節(jié)點(diǎn)或生成器節(jié)點(diǎn))將較難以獲得或獲得成本較高的本地可用的信息。在其它實例中,可在架構(gòu)102 的不同部分內(nèi)實施不同分類模型,以便提供最為定制且優(yōu)化的預(yù)測。圖3是圖解說明圖IA的系統(tǒng)的分類管理器140的額外實例性操作的流程圖300。 更具體來說,在圖3中,分類管理器140被圖解說明為執(zhí)行監(jiān)督機(jī)器學(xué)習(xí)(SML)技術(shù),其通常表示根據(jù)外部實例推理以生成一般假設(shè)的方式,例如,從查詢到生成器節(jié)點(diǎn)126、129的過去分布推理以獲得關(guān)于分布到生成器節(jié)點(diǎn)126、129的當(dāng)前或未來查詢對經(jīng)匯編結(jié)果108 是否將為生成性的一般預(yù)測。在圖3中,確定查詢特征(302)。舉例來說,分類管理器140可與查詢預(yù)處理器且 /或與分類數(shù)據(jù)138連通以識別由查詢預(yù)處理器134使用的所有可能查詢特征(其可對構(gòu)造分類模型有用)。接著,針對這些查詢特征,可確定值(304)。舉例來說,監(jiān)視器136可將查詢集合 (例如,1000個查詢)發(fā)送(或觸發(fā)其被發(fā)送)到生成器節(jié)點(diǎn)126 (及/或生成器節(jié)點(diǎn)129)。 接著,可通過監(jiān)視器136追蹤并測量這些查詢的來自數(shù)據(jù)源128(及/或數(shù)據(jù)源130)的結(jié)果,且可將所述查詢特征的值存儲(例如)于分類數(shù)據(jù)138中。舉例來說,如果查詢特征包括查詢中的若干個項,那么監(jiān)視器136可確定查詢的項的實際計數(shù)作為所述查詢特征的值。類似地,如果查詢特征包括被指派給某些短語或其它查詢結(jié)構(gòu)的得分,那么可獲得并存儲每一查詢的此些得分的實際值。接著,可界定訓(xùn)練數(shù)據(jù)集合(306)。舉例來說,分類管理器140可選擇查詢特征及對應(yīng)值的子集以及針對查詢/查詢特征的從生成器節(jié)點(diǎn)126、129獲得的對應(yīng)查詢結(jié)果??闪私?,可在操作300的不同迭代期間選擇查詢特征及查詢值的不同子集,以與對應(yīng)查詢結(jié)果相關(guān)。在一些情況下,可使用相對少數(shù)目個查詢特征/值,此具有計算及追蹤起來輕量且容易的優(yōu)點(diǎn)。在其它情況下,可使用較大數(shù)目,且其可提供更準(zhǔn)確或全面的分類結(jié)果??蛇x擇分類算法(308)。存在若干個此類分類算法且此處可視需要進(jìn)行選擇。如所描述,分類算法(及所得分類模型)的成功或效用的準(zhǔn)則是此種算法/模型是否實際上成功地預(yù)測將查詢106傳遞到生成器節(jié)點(diǎn)126、129對經(jīng)匯編結(jié)果108是否將為生成性。然而,可存在額外或替代準(zhǔn)則。舉例來說,如下文更詳細(xì)地描述,將了解,分類管理器140且最終查詢分類器142 能夠犯錯,例如,預(yù)測不準(zhǔn)確。也就是說,查詢分類器142可(舉例來說)在將查詢106發(fā)送到生成器節(jié)點(diǎn)126實際上對經(jīng)匯編結(jié)果108并非為生成性時預(yù)測應(yīng)將查詢106發(fā)送到生成器節(jié)點(diǎn)126。另一方面,查詢分類器142可(舉例來說)在將查詢106發(fā)送到生成器節(jié)點(diǎn) 126將對經(jīng)匯編結(jié)果108為生成性時預(yù)測不應(yīng)將查詢106發(fā)送到生成器節(jié)點(diǎn)126。在前一種情況下,發(fā)送查詢106而僅獲得非生成性結(jié)果的錯誤的成本為徒勞地用來不必要地與生成器節(jié)點(diǎn)126通信的網(wǎng)絡(luò)資源的損失,此類似于現(xiàn)有系統(tǒng)(除延遲較少以外,因為在生成器節(jié)點(diǎn)122、126處并行地處理查詢106,如所描述)。另一方面,在將獲得生成性結(jié)果時不發(fā)送查詢106的錯誤可能問題更大。此種錯誤在本文中稱作損失,且導(dǎo)致用戶喪失原本已提供給用戶的有用結(jié)果。因此,可選擇嘗試最大化生成性查詢的發(fā)送同時最小化損失的查詢/結(jié)果的分類算法。同樣,此些分類算法的實例通常為眾所周知的且因此此處不予以詳細(xì)論述。此些實例可包括(例如)決策樹算法,其中基于查詢特征值對查詢結(jié)果進(jìn)行排序的,使得決策樹的節(jié)點(diǎn)表示正在分類的查詢結(jié)果中的特征,且樹的分支表示所述節(jié)點(diǎn)可假設(shè)的值。接著,可通過從根節(jié)點(diǎn)開始穿過所述決策樹而遍歷所述樹且使用其相應(yīng)值對節(jié)點(diǎn)進(jìn)行排序來將結(jié)果分類??山又?例如)通過針對從根節(jié)點(diǎn)到對應(yīng)葉節(jié)點(diǎn)的每一路徑形成規(guī)則來將決策樹轉(zhuǎn)變成分類規(guī)則集合(其可最終形成分類模型)。存在其它分類算法,且知道用于從其產(chǎn)生結(jié)果的其它技術(shù)。舉例來說,可使用單層或多層感知技術(shù)以及神經(jīng)網(wǎng)絡(luò)、統(tǒng)計學(xué)習(xí)算法(例如,貝葉斯(Bayesian)網(wǎng)絡(luò))、基于實例的學(xué)習(xí)及/或支持向量機(jī)。同樣,可選擇并測試這些或其它算法中的一者或一者以上,且最終基于其成功地預(yù)測生成性結(jié)果及/或其成功地避免損失的結(jié)果來實施。一旦選擇了分類算法,可評估對應(yīng)的訓(xùn)練數(shù)據(jù)集合(310)。舉例來說,分類管理器 140可經(jīng)配置以使用查詢特征、查詢值及對應(yīng)的查詢結(jié)果的選定訓(xùn)練數(shù)據(jù)集合(子集)來實施分類算法。舉例來說,第一訓(xùn)練數(shù)據(jù)集合可對應(yīng)于查詢關(guān)于生成器節(jié)點(diǎn)1226的結(jié)果且第二訓(xùn)練數(shù)據(jù)集合可對應(yīng)于查詢關(guān)于生成器節(jié)點(diǎn)129的結(jié)果。此外,可在過程300的不同迭代中針對每一生成器節(jié)點(diǎn)測試不同的訓(xùn)練集合。如果結(jié)果令人滿意(312),那么其可公式化為分類模型且傳遞到查詢分類器142, 如所展示,以供在評估當(dāng)前及未來查詢中使用。否則,如所展示,可選擇并變化操作302到 310中的任一者,以便重新運(yùn)行流程圖300的操作,從而獲得令人滿意的結(jié)果(312)。如上文所提及,可在初始時間點(diǎn)處執(zhí)行操作300以公式化初始分類模型。接著,查詢分類器142可相應(yīng)地在一時間周期內(nèi)實施所述分類模型。然而,隨著時間可出現(xiàn)以下情況所述分類模型變得過時且對分類傳入查詢較不有效。為避免此情形,監(jiān)視器136可周期性地觸發(fā)生成器節(jié)點(diǎn)126、129且接著測試來自其的結(jié)果且/或相應(yīng)地更新所述分類模型。也就是說,舉例來說,監(jiān)視器136可將查詢發(fā)送到生成器節(jié)點(diǎn)126,而不管查詢分類器是否預(yù)測來自其的生成性結(jié)果。接著,分類管理器 140可將所述結(jié)果與所預(yù)測結(jié)果進(jìn)行比較以確定所述分類模型仍是令人滿意的還是需要更新。
圖4A到圖4C是圖解說明用以構(gòu)造分類模型的分類數(shù)據(jù)的表格。在圖4A中,假設(shè)考慮兩個特征(例如,如查詢預(yù)處理器134所確定)查詢特征I 402及查詢特征2 404。 圖解說明存在第三查詢特征(查詢特征3 406),但不針對正在測試的特定訓(xùn)練數(shù)據(jù)集合進(jìn)行考慮。如所展示,查詢特征402可具有值A(chǔ)或B,而查詢特征404可具有值C或D。接著,可將總共1000個查詢發(fā)送到(例如)生成器節(jié)點(diǎn)126。在此情況下,列408、 410追蹤這樣做的結(jié)果。舉例來說,可將所述1000個查詢中的第一查詢發(fā)送到生成器節(jié)點(diǎn) 126且如果獲得生成性結(jié)果那么在列408內(nèi)將所述結(jié)果計數(shù)一次,從而指示應(yīng)(應(yīng)已)發(fā)送所述查詢。另一方面,如果發(fā)送具有查詢特征AC的第二查詢且得到非生成性結(jié)果,那么在列410內(nèi)將所述結(jié)果計數(shù)一次,從而指示應(yīng)(應(yīng)已)丟棄所述查詢。所述1000個查詢的發(fā)送因此可繼續(xù)且可相應(yīng)地追蹤結(jié)果直到填滿列408、410。接著,可進(jìn)行關(guān)于將對新接收的查詢采取的未來動作的決策。舉例來說,對于查詢特征組合(查詢表示)AC,觀察到87個結(jié)果指示發(fā)送,而45個結(jié)果指示丟棄。因此,可做出應(yīng)發(fā)送具有特征AC的未來查詢的決策,如列412中所示。類似地,對于查詢特征BD,92個“應(yīng)發(fā)送”結(jié)果及28個“應(yīng)丟棄”結(jié)果指示應(yīng)發(fā)送此些查詢的未來實例。相反,對于查詢特征AD,20個“應(yīng)發(fā)送”結(jié)果及198個“應(yīng)丟棄”結(jié)果指示應(yīng)丟棄此些查詢的未來實例。在具有特征BC的查詢的情況下,224個查詢被指示為“應(yīng)發(fā)送”,而307個被指示為“應(yīng)丟棄”。因此,可不明了應(yīng)針對未來查詢采取哪一動作。在圖4B中的進(jìn)一步分析中,發(fā)送具有特征BC的1000個查詢,且在列414中觀察到如果全部發(fā)送此些查詢,那么實際上應(yīng)已發(fā)送403個(因為獲得生成性結(jié)果),而在列416 中觀察到當(dāng)發(fā)送此些查詢時,實際上應(yīng)已丟棄380個。相反,當(dāng)被丟棄時,列414指示應(yīng)已發(fā)送的20個查詢及應(yīng)已丟棄的198個查詢。因此,應(yīng)已發(fā)送但未發(fā)送的20個查詢表示不給用戶104生成性結(jié)果的損失的查詢。另一方面,198個查詢表示被丟棄且應(yīng)已丟棄(即,無論如何將不產(chǎn)出生成性結(jié)果)的查詢,且因此表示網(wǎng)絡(luò)業(yè)務(wù)及資源的節(jié)省。因此,損失2%的生成性查詢,以便節(jié)省19.8% 的網(wǎng)絡(luò)業(yè)務(wù)類似分析應(yīng)用于圖4C,其中設(shè)想丟棄具有查詢特征BC的1000個查詢的影響的結(jié)果。在那里,可從列418、420觀察到丟棄且因此損失為生成性的244個結(jié)果(24.4%),而正確地丟棄505個結(jié)果(50. 5% )(且節(jié)約對應(yīng)量的網(wǎng)絡(luò)業(yè)務(wù))。圖5是圖IA的系統(tǒng)可在其中操作的實例性計算環(huán)境的框圖。更具體來說,圖5是展示可用以實施圖IA的系統(tǒng)的實例性或代表性計算裝置及相關(guān)聯(lián)元件的框圖。具體來說,圖5展示一般計算機(jī)裝置500及一般移動計算機(jī)裝置550的實例,其可與此處所描述的技術(shù)一同使用。計算裝置500既定表示各種形式的數(shù)字計算機(jī),例如膝上型計算機(jī)、桌上型計算機(jī)、工作站、個人數(shù)字助理、服務(wù)器、刀片服務(wù)器、主機(jī)及其它適當(dāng)計算機(jī)。計算裝置550既定表示各種形式的移動裝置,例如個人數(shù)字助理、蜂窩式電話、智能電話及其它類似計算裝置。此處展示的組件、其連接及關(guān)系以及其功能打算僅作為示范性, 且不打算限制本文檔中所描述及/或請求的本發(fā)明實施方案。計算裝置500包括處理器502、存儲器504、存儲裝置506、連接到存儲器504及高速擴(kuò)充端口 510的高速接口 508以及連接到低速總線514及存儲裝置506的低速接口 512。組件502、504、506、508、510及512中的每一者使用各種總線互連,且可安裝在共用母板上或以其它適當(dāng)方式安裝。處理器502可處理用于在計算裝置500內(nèi)執(zhí)行的指令,包括存儲于存儲器504中或存儲裝置506上的指令以針對外部輸入/輸出裝置(例如,耦合到高速接口 508的顯示器516)上的⑶I顯示圖形信息。在其它實施方案中,如果適當(dāng),可使用多個處理器及/或多個總線連同多個存儲器及存儲器類型。同樣,可連接多個計算裝置500, 其中每一裝置提供必要操作的部分(例如,作為服務(wù)器庫、刀片服務(wù)器群組或多處理器系統(tǒng))。存儲器504在計算裝置500內(nèi)存儲信息。在一個實施方案中,存儲器504為一或多個易失性存儲器單元。在另一實施方案中,存儲器504為一或多個非易失性存儲器單元。 存儲器504也可為另一形式的計算機(jī)可讀媒體,例如磁盤或光盤。存儲裝置506能夠為計算裝置500提供大容量存儲。在一個實施方案中,存儲裝置506可為或含有計算機(jī)可讀媒體,例如軟磁盤裝置、硬磁盤裝置、光盤裝置或磁帶裝置、 快閃存儲器或其它類似固態(tài)存儲器裝置或裝置陣列,包括存儲區(qū)域網(wǎng)絡(luò)或其它配置中的裝置。計算機(jī)程序產(chǎn)品可有形地體現(xiàn)于信息載體中。所述計算機(jī)程序產(chǎn)品還可含有在被執(zhí)行時執(zhí)行一個或一個以上方法(例如上文所描述的那些方法)的指令。所述信息載體為計算機(jī)可讀媒體或機(jī)器可讀媒體,例如存儲器504、存儲裝置506或處理器502上的存儲器。高速控制器508管理計算裝置500的帶寬密集型操作,而低速控制器512管理較低帶寬密集型操作。此種功能分配僅為示范性。在一個實施方案中,高速控制器508耦合到存儲器504、顯示器516 (例如,經(jīng)由圖形處理器或加速器)且耦合到可接受各種擴(kuò)充卡 (未展示)的高速擴(kuò)充端口 510。在所述實施方案中,低速控制器512耦合到存儲裝置506 及低速擴(kuò)充端口 514??砂ǜ鞣N通信端口(例如,USB、藍(lán)牙、乙太網(wǎng)、無線乙太網(wǎng))的低速擴(kuò)充端口可(例如,經(jīng)由網(wǎng)絡(luò)適配器)耦合到一個或一個以上輸入/輸出裝置,例如鍵盤、 指向裝置、掃描儀或聯(lián)網(wǎng)裝置,例如交換機(jī)或路由器。如圖中所示,可以若干種不同形式來實施計算裝置500。舉例來說,可將其實施為標(biāo)準(zhǔn)服務(wù)器520或在此類服務(wù)器的群組中多次實施。也可將其實施為機(jī)架式服務(wù)器系統(tǒng) 524的部分。另外,可將其實施于個人計算器中,例如膝上型計算機(jī)522?;蛘撸蓪碜杂嬎阊b置500的組件與移動裝置(未展示)(例如,裝置550)中的其它組件組合。此類裝置中的每一者可含有計算裝置500、550中的一者或一者以上,且整個系統(tǒng)可由彼此通信的多個計算裝置500、550組成。計算裝置550包括處理器552、存儲器564、例如顯示器554等輸入/輸出裝置、通信接口 566及收發(fā)器568以及其它組件。裝置550還可具備用以提供額外存儲的存儲裝置, 例如微驅(qū)動器或其它裝置。組件550、552、564、554、566及568中的每一者使用各種總線互連,且所述組件中的數(shù)個組件可安裝在共用母板上或以其它適當(dāng)方式安裝。處理器552可在計算裝置550內(nèi)執(zhí)行指令,包括存儲器564中所存儲的指令??蓪⑺鎏幚砥鲗嵤榘▎为?dú)及多個模擬與數(shù)字處理器的芯片的芯片集。所述處理器可提供(舉例來說)對裝置550的其它組件的協(xié)調(diào),例如對用戶接口、裝置550所運(yùn)行的應(yīng)用程序及裝置550所進(jìn)行的無線通信的控制。處理器552可經(jīng)由耦合到顯示器554的控制接口 558及顯示器接口 556與用戶通信。顯示器554可以是(舉例來說)TFT IXD (薄膜晶體管液晶顯示器)或OLED (有機(jī)發(fā)光二極管)顯示器或其它適當(dāng)顯示器技術(shù)。顯示器接口 556可包含用于驅(qū)動顯示器554以向用戶呈現(xiàn)圖形及其它信息的適當(dāng)電路。控制接口 558可從用戶接收命令且對其進(jìn)行轉(zhuǎn)換以用于提交給處理器552。另外,可提供與處理器552通信的外部接口 562,以便實現(xiàn)裝置550 與其它裝置的鄰近區(qū)域通信。外部接口 562在一些實施方案中可提供(舉例來說)有線通信,或在其它實施方案中提供無線通信,且也可使用多個接口。存儲器564在計算裝置550內(nèi)存儲信息。存儲器564可實施為一或多個計算機(jī)可讀媒體、一或多個易失性存儲器單元或一或多個非易失性存儲器單元中的一者或一者以上。還可提供擴(kuò)充存儲器574并經(jīng)由擴(kuò)充接口 572 (舉例來說,其可包括SIMM(單列直插式存儲器模塊)卡接口)將其連接到裝置550。此種擴(kuò)充存儲器574可提供用于裝置550的額外存儲空間,或也可存儲裝置550的應(yīng)用程序或其它信息。具體來說,擴(kuò)充存儲器574可包括用以實施或補(bǔ)充上文所描述的過程的指令,且還可包括安全信息。因此,舉例來說,擴(kuò)充存儲器574可提供為裝置550的安全模塊,且可以準(zhǔn)許安全使用裝置550的指令編程。另外,可經(jīng)由SIMM卡提供安全應(yīng)用程序連同額外信息,例如以不可篡改的方式將識別信息置于SMM卡上。舉例來說,所述存儲器可包括(舉例來說)快閃存儲器及/或NVRAM存儲器,如下文所論述。在一個實施方案中,計算機(jī)程序產(chǎn)品有形地體現(xiàn)于信息載體中。所述計算機(jī)程序產(chǎn)品含有在被執(zhí)行時執(zhí)行一個或一個以上方法(例如上文所描述的那些方法)的指令。 所述信息載體為計算機(jī)可讀媒體或機(jī)器可讀媒體,例如存儲器564、擴(kuò)充存儲器574或處理器552上的存儲器,其可(舉例來說)經(jīng)由收發(fā)器568或外部接口 562接納。裝置550可經(jīng)由通信接口 566以無線方式通信,所述通信接口必要時可包括數(shù)字信號處理電路。通信接口 566可提供各種模式或協(xié)議下的通信,例如GSM話音呼叫、SMS、 EMS或MMS消息收發(fā)、CDMA、TDMA, PDC、WCDMA, CDMA2000或GPRS以及其它模式或協(xié)議。此種通信可(舉例來說)經(jīng)由射頻收發(fā)器568發(fā)生。另外,短程通信可(例如)使用藍(lán)牙、 WiFi或其它此種收發(fā)器(未展示)發(fā)生。另外,GPS (全球定位系統(tǒng))接收器模塊570可向裝置550提供額外導(dǎo)航相關(guān)及位置相關(guān)無線數(shù)據(jù),所述數(shù)據(jù)可由在裝置550上運(yùn)行的應(yīng)用程序適當(dāng)?shù)厥褂?。裝置550還可使用音頻編解碼器560以可聽方式通信,所述音頻編解碼器可接收來自用戶的口說信息并將其轉(zhuǎn)換為可用數(shù)字信息。音頻編解碼器560同樣可(例如)經(jīng)由 (例如)裝置550的聽筒中的揚(yáng)聲器產(chǎn)生用戶可聽的聲音。此種聲音可包括來自話音電話呼叫的聲音,可包括所記錄的聲音(例如,話音消息、音樂文件等)且還可包括在裝置550 上操作的應(yīng)用程序所產(chǎn)生的聲音。如圖中所示,可以若干種不同形式來實施計算裝置550。舉例來說,可將其實施為蜂窩式電話580。也可將其實施為智能電話582、個人數(shù)字助理或其它類似移動裝置的部分。此處所描述的系統(tǒng)及技術(shù)的各種實施方案可在數(shù)字電子電路、集成電路、特別設(shè)計的ASIC(專用集成電路)、計算機(jī)硬件、固件、軟件及/或其組合中實現(xiàn)。這些各種實施方案可包括呈一個或一個以上計算機(jī)程序形式的實施方案,所述計算機(jī)程序可在可編程系統(tǒng)上執(zhí)行及/或翻譯,所述可編程系統(tǒng)包括至少一個可編程處理器、至少一個輸入裝置及至少一個輸出裝置,所述可編程處理器可以是專用或通用處理器,其經(jīng)耦合以從存儲系統(tǒng)接收數(shù)據(jù)及指令及將數(shù)據(jù)及指令傳輸?shù)酱鎯ο到y(tǒng)。這些計算機(jī)程序(也稱作程序、軟件、軟件應(yīng)用程序或代碼)包括用于可編程處理器的機(jī)器指令,且可以高級程序及/或面向?qū)ο蟮木幊陶Z言及/或以匯編/機(jī)器語言來實施。如本文中所使用,術(shù)語“機(jī)器可讀媒體”、“計算機(jī)可讀媒體”是指用以向可編程處理器提供機(jī)器指令及/或數(shù)據(jù)的任何計算機(jī)程序產(chǎn)品、設(shè)備及/或裝置(例如,磁盤、光盤、存儲器、可編程邏輯裝置(PLD)),包括接收作為機(jī)器可讀信號的機(jī)器指令的機(jī)器可讀媒體。術(shù)語 “機(jī)器可讀信號”是指用以向可編程處理器提供機(jī)器指令及/或數(shù)據(jù)的任何信號。為提供與用戶的交互,可在以下計算機(jī)上實施此處所描述的系統(tǒng)及技術(shù)具有用于向用戶顯示信息的顯示器裝置(例如,CRT (陰極射線管)或LCD (液晶顯示器)監(jiān)視器) 及用戶可通過其向計算機(jī)提供輸入的鍵盤及指向裝置(例如,鼠標(biāo)或軌跡球)。其它種類的裝置也可用以提供與用戶的交互;舉例來說,提供給用戶的反饋可為任何形式的傳感反饋(例如,視覺反饋、聽覺反饋或觸覺反饋);且可以任何形式接收來自用戶的輸入,包括聲音、語音或觸覺輸入??稍谟嬎阆到y(tǒng)中實施此處所描述的系統(tǒng)及技術(shù),所述計算系統(tǒng)包括后端組件(例如,作為數(shù)據(jù)服務(wù)器)或包括中間件組件(例如,應(yīng)用服務(wù)器)或包括前端組件(例如,具有圖形用戶接口的客戶端計算機(jī)或用戶可經(jīng)由其來與此處所描述的系統(tǒng)及技術(shù)的實施方案交互的Web瀏覽器)或此類后端、中間件或前端組件的任一組合。系統(tǒng)的組件可通過任何數(shù)字?jǐn)?shù)據(jù)通信形式或媒體(例如,通信網(wǎng)絡(luò))互連。通信網(wǎng)絡(luò)的實例包括局域網(wǎng)(“LAN”)、 廣域網(wǎng)(“WAN”)及因特網(wǎng)。所述計算系統(tǒng)可包括客戶端及服務(wù)器??蛻舳伺c服務(wù)器通常彼此遠(yuǎn)離且通常經(jīng)由通信網(wǎng)絡(luò)來交互??蛻舳伺c服務(wù)器之間的關(guān)系借助于在相應(yīng)計算機(jī)上運(yùn)行且彼此之間具有客戶端-服務(wù)器關(guān)系的計算機(jī)程序而產(chǎn)生。另外,圖中所描繪的任何邏輯流程不要求所展示的特定次序或順序次序來實現(xiàn)所期望結(jié)果。另外,可提供其它步驟,或可從所描述的流程中消除步驟,且可向所描述的系統(tǒng)添加其它組件或從所描述的系統(tǒng)移除其它組件。因此,其它實施例歸屬于以上權(quán)利要求書的范圍內(nèi)。將了解,以特定細(xì)節(jié)描述的以上實施例僅為實例性或可能實施例,且存在可包括在內(nèi)的許多其它組合、添加或替代形式。同樣,組件的特定命名、術(shù)語的大寫、屬性、數(shù)據(jù)結(jié)構(gòu)或任何其它編程或結(jié)構(gòu)方面均不是強(qiáng)制性或具有特殊意義的,且實施本發(fā)明或其特征的機(jī)構(gòu)可具有不同的名稱、格式或協(xié)議。此外,系統(tǒng)可如所描述經(jīng)由硬件與軟件的組合來實施,或完全在硬件元件中實施。 同樣,本文中所描述的各種系統(tǒng)組件之間的功能性的特定劃分僅僅為示范性,且并非為強(qiáng)制性;由單個系統(tǒng)組件執(zhí)行的功能可改為由多個組件來執(zhí)行,且由多個組件執(zhí)行的功能可改為由單個組件來執(zhí)行。以上說明的一些部分呈現(xiàn)關(guān)于信息的操作的算法及符號表示方面的特征。這些算法說明及表示可由數(shù)據(jù)處理領(lǐng)域的技術(shù)人員用來向所屬領(lǐng)域的其它技術(shù)人員最有效地傳達(dá)其工作實質(zhì)。盡管這些操作是從功能上或邏輯上進(jìn)行描述的,但應(yīng)將所述操作理解為由計算機(jī)程序來實施。此外,還已證明有時將操作的這些布置稱作模塊或通過功能名稱指代這些布置比較便利,不會喪失通用性。
除非根據(jù)上文論述顯而易見地另有具體規(guī)定,否則應(yīng)了解,在本說明的通篇中,利用例如“處理”或“計算(computing) ”或“計算(calculating) ”或“確定”或“顯示”或“提供”等術(shù)語的論述是指計算機(jī)系統(tǒng)或類似電子計算裝置的動作及過程,所述計算機(jī)系統(tǒng)或類似電子計算裝置操縱并變換表示為計算機(jī)系統(tǒng)存儲器或寄存器或其它此種信息存儲裝置、傳輸或顯示器裝置內(nèi)的物理(電子)量的數(shù)據(jù)。本文中以算法的形式描述某些方面的操作及指令。應(yīng)注意,所述過程操作及指令可體現(xiàn)于軟件、固件或硬件中,且當(dāng)體現(xiàn)于軟件中時,可下載以駐存于由實時網(wǎng)絡(luò)操作系統(tǒng)使用的不同平臺上且從由實時網(wǎng)絡(luò)操作系統(tǒng)使用的不同平臺操作。用于執(zhí)行本文中的操作的設(shè)備可特別針對所需目的進(jìn)行構(gòu)造,或其可包含通用計算機(jī),其由可由計算機(jī)存取且將所述通用計算機(jī)再現(xiàn)為經(jīng)設(shè)計以執(zhí)行所描述的操作或類似操作的專用計算機(jī)的存儲于計算機(jī)可讀媒體上的計算機(jī)程序選擇性地激活或重新配置。 此種計算機(jī)程序可存儲于計算機(jī)可讀存儲媒體中,例如但不限于任何類型的磁盤,包括軟磁盤、光學(xué)盤、CD-ROM、磁性-光學(xué)盤、只讀存儲器(ROM)、隨機(jī)存取存儲器(RAM)、EPROM、 EEPR0M、磁性或光學(xué)卡、專用集成電路(ASIC)或適于存儲電子指令的任何類型的媒體,且每一者耦合到計算機(jī)系統(tǒng)總線。此外,在本說明書中所提及的計算機(jī)可包括單個處理器或可為采用多個處理器設(shè)計以獲得增加的計算能力的架構(gòu)。實施方案可實施于計算系統(tǒng)中,所述計算系統(tǒng)包括后端組件(例如,作為數(shù)據(jù)服務(wù)器)或包括中間件組件(例如,應(yīng)用服務(wù)器)或包括前端組件(例如,具有用戶可經(jīng)由其來與實施方案交互的圖形用戶接口或Web瀏覽器的客戶端計算機(jī))或此類后端、中間件或前端組件的任一組合。組件可通過任何數(shù)字?jǐn)?shù)據(jù)通信形式或媒體(例如,通信網(wǎng)絡(luò))互連。 通信網(wǎng)絡(luò)的實例包括局域網(wǎng)(LAN)及廣域網(wǎng)(WAN)(例如,因特網(wǎng))。本文中所呈現(xiàn)的算法及操作并非固有地與任何特定計算機(jī)或其它設(shè)備相關(guān)。各種通用系統(tǒng)也可與根據(jù)本文中的教示的程序一同使用,或可證明構(gòu)造更專門化的設(shè)備來執(zhí)行所描述的操作或類似操作是便利的。所屬領(lǐng)域的技術(shù)人員將明了各種各樣的這些系統(tǒng)的結(jié)構(gòu)以及等效變化形式。另外,不參考任何特定編程語言來描述本說明。應(yīng)了解,各種編程語言可用以實施本說明的教示,且提供對特定語言的任何明確或含蓄參考作為實例。雖然已如本文中所描述圖解說明了所描述實施方案的某些特征,但所屬領(lǐng)域的技術(shù)人員現(xiàn)在將能想出許多修改、替代、改變及等效形式。因此,應(yīng)理解,所附權(quán)利要求書既定涵蓋歸屬于所述實施例的范圍內(nèi)的所有此類修改及改變。
權(quán)利要求
1.一種計算機(jī)系統(tǒng)(100),其包括存儲于計算機(jī)可讀媒體上的指令,所述計算機(jī)系統(tǒng)包含分級樹形處理架構(gòu)(10 的生成器節(jié)點(diǎn)(122),所述架構(gòu)包括經(jīng)配置以在所述架構(gòu)內(nèi)分布查詢(106)的至少一個分布器節(jié)點(diǎn)(120),包括分布到所述生成器節(jié)點(diǎn)(12 及預(yù)界定生成器節(jié)點(diǎn)(122、126、129)子集內(nèi)的至少一個其它生成器節(jié)點(diǎn)(1沈、1 ),所述分布器節(jié)點(diǎn)(120)進(jìn)一步經(jīng)配置以接收來自所述生成器節(jié)點(diǎn)(122)的結(jié)果及來自所述至少一個其它生成器節(jié)點(diǎn)(126、129)的結(jié)果且從其輸出經(jīng)匯編結(jié)果(108),所述生成器節(jié)點(diǎn)(12 包括查詢預(yù)處理器(134),其經(jīng)配置以處理從所述分布器節(jié)點(diǎn)(120)接收的查詢(106)以使用與搜索與所述生成器節(jié)點(diǎn)(12 相關(guān)聯(lián)的生成器索引兼容的查詢特征002到406)來獲得查詢表示,從而獲得來自所述生成器節(jié)點(diǎn)(12 的所述結(jié)果;及查詢分類器(142),其經(jīng)配置以輸入所述查詢表示且基于其來輸出關(guān)于由所述預(yù)界定生成器節(jié)點(diǎn)(122、126、129)子集內(nèi)的所述至少一個其它生成器節(jié)點(diǎn)(126、129)對所述查詢的處理是否將致使所述至少一個其它生成器節(jié)點(diǎn)(126、129)的結(jié)果包括在所述經(jīng)匯編結(jié)果(108)內(nèi)的預(yù)測。
2.根據(jù)權(quán)利要求1所述的系統(tǒng)(100),其中所述查詢分類器(142)經(jīng)配置以結(jié)合獲得所述查詢表示且在生成來自所述生成器節(jié)點(diǎn)(12 的所述結(jié)果之前將所述預(yù)測提供到所述分布器節(jié)點(diǎn)(120),使得所述生成器節(jié)點(diǎn)(12 及所述至少一個其它生成器節(jié)點(diǎn)(126、 129)并行地將其相應(yīng)結(jié)果提供到所述分布器節(jié)點(diǎn)(120)。
3.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的系統(tǒng)(100),其中所述查詢分類器(142) 經(jīng)配置以從所述架構(gòu)內(nèi)的多個其它生成器節(jié)點(diǎn)(126、129)確定所述至少一個其它生成器節(jié)點(diǎn)(1 ),且將所述至少一個其它生成器節(jié)點(diǎn)(126)識別為應(yīng)將所述查詢轉(zhuǎn)發(fā)到的目標(biāo)節(jié)點(diǎn)。
4.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的系統(tǒng)(100),其中所述查詢分類器(142) 經(jīng)配置以輸入與所述查詢表示相關(guān)聯(lián)的至少兩個查詢特征G02到406)且基于其來計算所述預(yù)測。
5.根據(jù)權(quán)利要求4所述的系統(tǒng)(100),其中所述查詢分類器(14 經(jīng)配置以從與所述查詢表示相關(guān)聯(lián)的查詢特征G02到406)集合選擇所述至少兩個查詢特征002到406)。
6.根據(jù)權(quán)利要求4所述的系統(tǒng)(100),其中所述至少兩個查詢特征002到406)中的至少一者包括所述查詢(106)內(nèi)的項的項計數(shù)。
7.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的系統(tǒng)(100),其中所述查詢分類器(142) 經(jīng)配置以提供所述預(yù)測,所述預(yù)測包括在表示所述至少一個其它生成器節(jié)點(diǎn)(126、129)可能包括在所述經(jīng)匯編結(jié)果內(nèi)的程度的范圍內(nèi)的值。
8.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的系統(tǒng)(100),其中所述查詢分類器(142) 經(jīng)配置以提供所述預(yù)測,所述預(yù)測包括在表示所述至少一個其它生成器(126)應(yīng)處理所述查詢以供在提供來自所述至少一個其它生成器節(jié)點(diǎn)(126)的所述結(jié)果時使用的程度的范圍內(nèi)的值。
9.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的系統(tǒng)(100),其中所述生成器節(jié)點(diǎn)(122) 包含分類管理器(140),所述分類管理器(140)經(jīng)配置以輸入包括與所述查詢表示相關(guān)聯(lián)的查詢特征、來自所述至少一個其它生成器節(jié)點(diǎn)(126)的結(jié)果及多個機(jī)器學(xué)習(xí)算法中的一者的分類數(shù)據(jù)(138),且經(jīng)配置以基于其來構(gòu)造用于輸出到所述查詢分類器(142)的分類模型以供在輸出所述預(yù)測時使用。
10.根據(jù)權(quán)利要求9所述的系統(tǒng)(100),其中所述分類管理器(140)經(jīng)配置以追蹤來自所述至少一個其它節(jié)點(diǎn)(126)的所述結(jié)果且用其來更新所述分類數(shù)據(jù)及所述分類模型。
11.根據(jù)權(quán)利要求9所述的系統(tǒng)(100),其中所述生成器節(jié)點(diǎn)(12 包含監(jiān)視器(136), 所述監(jiān)視器(136)經(jīng)配置以不管是否由所述查詢分類器(14 指示而觸發(fā)所述分布器節(jié)點(diǎn) (120)以周期性地將所述查詢的子集發(fā)送到所述至少一個其它生成器節(jié)點(diǎn)(1 ),且基于其來更新所述分類數(shù)據(jù)。
12.根據(jù)前述權(quán)利要求中任一權(quán)利要求所述的系統(tǒng)(100),其中來自所述生成器節(jié)點(diǎn) (122)的所述結(jié)果是從與使用所述生成器索引的所述生成器節(jié)點(diǎn)(12 相關(guān)聯(lián)的數(shù)據(jù)源 (124)獲得的,且來自所述至少一個其它生成器節(jié)點(diǎn)(126)的所述結(jié)果是從與使用對應(yīng)索引的所述至少一個其它生成器節(jié)點(diǎn)(126)相關(guān)聯(lián)的數(shù)據(jù)源(128)獲得的,且其中所述至少一個其它生成器節(jié)點(diǎn)(126)在與所述生成器節(jié)點(diǎn)(124)相比時存取成本效率較差。
13.一種計算機(jī)實施的方法000),其中至少一個處理器實施至少以下操作,所述方法包含在生成器節(jié)點(diǎn)(12 處從分級樹形處理架構(gòu)(10 內(nèi)的至少一個分布器節(jié)點(diǎn)(120)接收(20 查詢(106),所述架構(gòu)包括經(jīng)配置以在所述架構(gòu)(10 內(nèi)分布查詢的所述至少一個分布器節(jié)點(diǎn)(120),包括分布到所述生成器節(jié)點(diǎn)(12 及至少一個其它生成器節(jié)點(diǎn)(1 ), 所述分布器節(jié)點(diǎn)(120)進(jìn)一步經(jīng)配置以接收來自所述生成器節(jié)點(diǎn)(12 的結(jié)果及來自所述至少一個其它生成器節(jié)點(diǎn)(126)的結(jié)果且從其輸出經(jīng)匯編結(jié)果(108);預(yù)處理(204)從所述分布器節(jié)點(diǎn)(120)接收的所述查詢(106)以使用與搜索與所述生成器節(jié)點(diǎn)(12 相關(guān)聯(lián)的生成器索引兼容的查詢特征G02到406)來獲得查詢表示,從而獲得來自所述生成器節(jié)點(diǎn)(12 的所述結(jié)果;及使用所述查詢表示將所述查詢分類006),從而基于其來輸出關(guān)于由所述至少一個其它生成器節(jié)點(diǎn)(126)對所述查詢的處理是否將致使所述至少一個其它生成器節(jié)點(diǎn)的結(jié)果包括在所述經(jīng)匯編結(jié)果(108)內(nèi)的預(yù)測。
14.根據(jù)權(quán)利要求13所述的方法000),其中所述將所述查詢分類(206)包含 結(jié)合獲得所述查詢表示且在生成來自所述生成器節(jié)點(diǎn)(12 的所述結(jié)果之前將所述預(yù)測提供到所述分布器節(jié)點(diǎn)(120),使得所述生成器節(jié)點(diǎn)(12 及所述至少一個其它生成器節(jié)點(diǎn)(126)并行地將其相應(yīng)結(jié)果提供到所述分布器節(jié)點(diǎn)(120)。
15.根據(jù)權(quán)利要求13或14所述的方法O00),其中所述將所述查詢分類(206)包含 輸入包括與所述查詢表示相關(guān)聯(lián)的查詢特征、來自所述至少一個其它生成器節(jié)點(diǎn)(126)的結(jié)果及多個機(jī)器學(xué)習(xí)算法中的一者的分類數(shù)據(jù)(138);及基于其來構(gòu)造分類模型以供在輸出所述預(yù)測時使用。
16.根據(jù)權(quán)利要求15所述的方法O00),其中所述將所述查詢分類(206)包含 不管是否由所述預(yù)測指示而觸發(fā)所述分布器節(jié)點(diǎn)(120)以周期性地將所述查詢的子集發(fā)送到所述至少一個其它生成器節(jié)點(diǎn)(1 ),且基于其來更新所述分類數(shù)據(jù)。
17.一種計算機(jī)程序產(chǎn)品,所述計算機(jī)程序產(chǎn)品有形地體現(xiàn)于計算機(jī)可讀媒體上且包括在被執(zhí)行時經(jīng)配置以致使數(shù)據(jù)處理設(shè)備進(jìn)行以下操作的可執(zhí)行代碼在生成器節(jié)點(diǎn)(12 處從分級樹形處理架構(gòu)(10 內(nèi)的至少一個分布器節(jié)點(diǎn)(120)接收(20 查詢(106),所述架構(gòu)包括經(jīng)配置以在所述架構(gòu)(10 內(nèi)分布查詢的所述至少一個分布器節(jié)點(diǎn)(120),包括分布到所述生成器節(jié)點(diǎn)(12 及至少一個其它生成器節(jié)點(diǎn)(1 ), 所述分布器節(jié)點(diǎn)(120)進(jìn)一步經(jīng)配置以接收來自所述生成器節(jié)點(diǎn)(12 的結(jié)果及來自所述至少一個其它生成器節(jié)點(diǎn)(126)的結(jié)果且從其輸出經(jīng)匯編結(jié)果(108);預(yù)處理(204)從所述分布器節(jié)點(diǎn)(120)接收的所述查詢(106)以使用與搜索與所述生成器節(jié)點(diǎn)(12 相關(guān)聯(lián)的生成器索引兼容的查詢特征G02到406)來獲得查詢表示,從而獲得來自所述生成器節(jié)點(diǎn)(12 的所述結(jié)果;及使用所述查詢表示將所述查詢分類006),從而基于其來輸出關(guān)于由所述至少一個其它生成器節(jié)點(diǎn)(126)對所述查詢的處理是否將致使所述至少一個其它生成器節(jié)點(diǎn)的結(jié)果包括在所述經(jīng)匯編結(jié)果(108)內(nèi)的預(yù)測。
18.根據(jù)權(quán)利要求17所述的計算機(jī)程序產(chǎn)品,其中在將所述查詢分類(206)時,經(jīng)執(zhí)行指令致使所述數(shù)據(jù)處理設(shè)備結(jié)合獲得所述查詢表示且在生成來自所述生成器節(jié)點(diǎn)(12 的所述結(jié)果之前將所述預(yù)測提供到所述分布器節(jié)點(diǎn)(120),使得所述生成器節(jié)點(diǎn)(12 及所述至少一個其它生成器節(jié)點(diǎn)(126)并行地將其相應(yīng)結(jié)果提供到所述分布器節(jié)點(diǎn)(120)。
19.根據(jù)權(quán)利要求17或18所述的計算機(jī)程序產(chǎn)品,其中在將所述查詢分類Q06)時, 所述經(jīng)執(zhí)行指令致使所述數(shù)據(jù)處理設(shè)備輸入包括與所述查詢表示相關(guān)聯(lián)的查詢特征、來自所述至少一個其它生成器節(jié)點(diǎn) (126)的結(jié)果及多個機(jī)器學(xué)習(xí)算法中的一者的分類數(shù)據(jù)(138);且基于其來構(gòu)造分類模型以供在輸出所述預(yù)測時使用。
20.根據(jù)權(quán)利要求19所述的計算機(jī)程序產(chǎn)品,其中在將所述查詢分類時,所述經(jīng)執(zhí)行指令致使所述數(shù)據(jù)處理設(shè)備不管是否由所述預(yù)測指示而觸發(fā)所述分布器節(jié)點(diǎn)(120)以周期性地將所述查詢的子集發(fā)送到所述至少一個其它生成器節(jié)點(diǎn);且基于其來更新所述分類數(shù)據(jù)(138)。
全文摘要
生成器節(jié)點(diǎn)(122)可包括在分級樹形處理架構(gòu)(102)中,所述架構(gòu)包括經(jīng)配置以在所述架構(gòu)(102)內(nèi)分布查詢(106)的至少一個分布器節(jié)點(diǎn)(120),包括分布到所述生成器節(jié)點(diǎn)(122)及預(yù)界定生成器節(jié)點(diǎn)(122、126、129)子集內(nèi)的至少一個其它生成器節(jié)點(diǎn)(126)。所述分布器節(jié)點(diǎn)(120)可進(jìn)一步經(jīng)配置以接收來自所述生成器節(jié)點(diǎn)(122)的結(jié)果及來自所述至少一個其它生成器節(jié)點(diǎn)(126)的結(jié)果且從其輸出經(jīng)匯編結(jié)果(108)。所述生成器節(jié)點(diǎn)(122)可包括查詢預(yù)處理器(134),其經(jīng)配置以處理從所述分布器節(jié)點(diǎn)(120)接收的查詢(106)以使用與搜索與所述生成器節(jié)點(diǎn)(122)相關(guān)聯(lián)的生成器索引兼容的查詢特征(402到406)來獲得查詢表示,從而獲得來自所述生成器節(jié)點(diǎn)(122)的所述結(jié)果;及查詢分類器(142),其經(jīng)配置以輸入所述查詢表示且基于其來輸出關(guān)于由所述預(yù)界定生成器節(jié)點(diǎn)(122、126、129)子集內(nèi)的所述至少一個其它生成器節(jié)點(diǎn)(126)對所述查詢(106)的處理是否將致使所述至少一個其它生成器節(jié)點(diǎn)的結(jié)果包括在所述經(jīng)匯編結(jié)果(108)內(nèi)的預(yù)測。
文檔編號G06F15/00GK102597979SQ201080032365
公開日2012年7月18日 申請日期2010年6月10日 優(yōu)先權(quán)日2009年6月10日
發(fā)明者卡茨普爾·諾維茨基, 威廉姆·奈維特, 科斯·尼科拉烏, 約翰·科倫, 納達(dá)夫·艾龍, 維克托·普熱班達(dá) 申請人:谷歌公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
西畴县| 新绛县| 天门市| 桦甸市| 长子县| 康保县| 大冶市| 黄梅县| 仁布县| 青田县| 沧源| 望奎县| 新郑市| 安达市| 正定县| 文水县| 景德镇市| 苍溪县| 平南县| 息烽县| 榆林市| 正蓝旗| 福泉市| 大庆市| 措勤县| 山东省| 云浮市| 合阳县| 凤山市| 泾源县| 靖远县| 阿图什市| 沙河市| 麟游县| 滨海县| 盐山县| 谷城县| 河曲县| 自治县| 马边| 曲麻莱县|