專利名稱:對(duì)信息記錄進(jìn)行排序的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本申請(qǐng)涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,特別是涉及一種對(duì)信息記錄進(jìn)行排序的方法和裝置、一種信息搜索服務(wù)器和信息搜索客戶端。
背景技術(shù):
目前,在網(wǎng)絡(luò)數(shù)據(jù)中進(jìn)行信息搜索,已經(jīng)成為互聯(lián)網(wǎng)最主要的應(yīng)用之一。例如,在進(jìn)行信息搜索時(shí),搜索引擎根據(jù)用戶輸入的查詢串在數(shù)據(jù)庫(kù)中查詢出頁(yè)面形式的信息記錄,或者,瀏覽器依據(jù)用戶的當(dāng)前瀏覽網(wǎng)頁(yè)構(gòu)造查詢串,并依據(jù)構(gòu)造的查詢串在數(shù)據(jù)庫(kù)中查詢出頁(yè)面形式的信息記錄,等等。為了較好地滿足用戶需求,搜索引擎或?yàn)g覽器并不立即將查詢到的信息記錄進(jìn)行展現(xiàn),而是以信息記錄與查詢串之間的相關(guān)性為依據(jù),按照相關(guān)性由高至低的順序?qū)π畔⒂涗涍M(jìn)行排序,并將排序后的信息記錄進(jìn)行展現(xiàn),這種將與查詢串之間的相關(guān)性作為排序依據(jù)的操作稱之為依據(jù)基礎(chǔ)權(quán)值進(jìn)行排序的操作。依據(jù)基礎(chǔ)權(quán)值進(jìn)行排序后的信息記錄能夠反映出信息記錄與查詢串之間的相關(guān)性,在一定程度上有利于用戶從信息記錄中快速進(jìn)行查找,但是,由于依據(jù)基礎(chǔ)權(quán)值進(jìn)行排序只能體現(xiàn)出信息記錄與查詢串的相關(guān)性,并不考慮其它因素,而實(shí)際網(wǎng)絡(luò)數(shù)據(jù)中的信息記錄內(nèi)容繁多,僅依據(jù)基礎(chǔ)權(quán)值進(jìn)行的排序過(guò)于簡(jiǎn)單,受其他因素影響,排在前面的信息記錄并不一定是用戶需要的,排在后面的信息記錄反而可能是用戶需要的,因此,現(xiàn)有信息記錄的排序方法并不能反映用戶的真實(shí)信息需求,此種情況下用戶需要花費(fèi)大量的時(shí)間才能從查詢串對(duì)應(yīng)的信息記錄中找到最感興趣的信息,并且也會(huì)占用過(guò)多的系統(tǒng)資源??傊?,需要本領(lǐng)域技術(shù)人員迫切解決的一個(gè)技術(shù)問(wèn)題就是如何能夠提供更加接近于用戶的真實(shí)信息需求的信息記錄,從而方便用戶快速地從中找到最感興趣的信息。
發(fā)明內(nèi)容
本申請(qǐng)所要解決的技術(shù)問(wèn)題是提供一種對(duì)信息記錄進(jìn)行排序的方法和裝置,能夠針對(duì)環(huán)境信息實(shí)現(xiàn)有效的搜索排序,使得排序后的信息記錄更加接近于用戶的真實(shí)信息需求。相應(yīng)的,本申請(qǐng)還提供了一種信息搜索服務(wù)器和信息搜索客戶端,能夠提供更加接近于用戶的真實(shí)信息需求的信息記錄,從而方便用戶快速地從中找到最感興趣的信息。為了解決上述問(wèn)題,本申請(qǐng)公開(kāi)了一種對(duì)信息記錄進(jìn)行排序的方法,所述方法包括采集查詢串對(duì)應(yīng)的環(huán)境信息;
依據(jù)所述查詢串獲取各意圖類別的信息記錄;依據(jù)所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布,對(duì)意圖類別進(jìn)行排序,并依據(jù)意圖類別的排序結(jié)果調(diào)整信息記錄的順序;其中,所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布由依據(jù)記錄有環(huán)境信息的用戶日志進(jìn)行分析統(tǒng)計(jì)得到。
另一方面,本申請(qǐng)還公開(kāi)了一種對(duì)信息記錄進(jìn)行排序的裝置,所述裝置包括采集模塊,用于采集所述查詢串對(duì)應(yīng)的環(huán)境信息信息記錄獲取模塊,用于依據(jù)所述查詢串獲取各意圖類別的信息記錄;及類間排序模塊,用于依據(jù)所述查詢串對(duì)應(yīng)的環(huán)境信息下意圖類別的分布,對(duì)意圖類別進(jìn)行排序,并依據(jù)意圖類別的排序結(jié)果調(diào)整信息記錄的順序;其中,所述查詢串對(duì)應(yīng)的環(huán)境信息下意圖類別的分布由依據(jù)記錄有環(huán)境信息的用戶日志進(jìn)行分析統(tǒng)計(jì)得到。另一方面,本申請(qǐng)還公開(kāi)了一種信息搜索服務(wù)器,包括接收模塊,用于接收來(lái)自信息搜索客戶端的查詢串及所述查詢串對(duì)應(yīng)的環(huán)境信息;信息搜索模塊,用于依據(jù)查詢串在網(wǎng)絡(luò)數(shù)據(jù)中進(jìn)行搜索,得到各意圖類別的信息記錄;類間排序模塊,用于依據(jù)所述查詢串對(duì)應(yīng)的環(huán)境信息下意圖類別的分布,對(duì)意圖類別進(jìn)行排序,并依據(jù)意圖類別的排序結(jié)果調(diào)整各信息記錄的順序;其中,所述查詢串對(duì)應(yīng)的環(huán)境信息下意圖類別的分布由依據(jù)記錄有環(huán)境信息的用戶日志進(jìn)行分析統(tǒng)計(jì)得到;及返回模塊,用于將所述類間排序模塊輸出的信息記錄返回。另一方面,本申請(qǐng)還公開(kāi)了一種信息搜索客戶端,包括查詢接收模塊,用于接收用戶輸入的查詢串;環(huán)境采集模塊,用于采集所述查詢串對(duì)應(yīng)的環(huán)境信息;發(fā)送模塊,用于將所述查詢串及所述查詢串對(duì)應(yīng)的環(huán)境信息發(fā)送至信息搜索服務(wù)器;及展現(xiàn)模塊,用于對(duì)所述信息搜索服務(wù)器返回的信息記錄進(jìn)行展現(xiàn)。優(yōu)選的,所述信息搜索客戶端還包括查詢?nèi)罩居涗浤K,用于將用戶標(biāo)識(shí)信息、所述查詢串及相應(yīng)的網(wǎng)頁(yè)操作歷史和環(huán)境信息記錄至查詢?nèi)罩?,所述網(wǎng)頁(yè)操作歷史為查詢串對(duì)應(yīng)的信息記錄中被用戶操作過(guò)的網(wǎng)頁(yè)記錄。與現(xiàn)有技術(shù)相比,本申請(qǐng)具有以下優(yōu)點(diǎn)首先,本申請(qǐng)依據(jù)查詢串對(duì)應(yīng)的環(huán)境信息下意圖類別的分布,對(duì)意圖類別進(jìn)行排序,并依據(jù)意圖類別的排序結(jié)果調(diào)整信息記錄的順序;由于用戶對(duì)不同環(huán)境信息下存在著不同的信息需求,而意圖類別又與信息需求直接對(duì)應(yīng)的,其能反映用戶的不同類別的信息需求,故上述排序能夠?qū)⒏芊从乘霾樵兇畬?duì)應(yīng)的環(huán)境信息(以下簡(jiǎn)稱當(dāng)前環(huán)境信息) 下信息需求的意圖類別排在前面,因此,本申請(qǐng)能夠使得排序后的信息記錄滿足于用戶的真實(shí)息需求。其次,本申請(qǐng)對(duì)信息記錄的排序還可以考慮當(dāng)前用戶針對(duì)各意圖類別的興趣的因素;由于每個(gè)用戶對(duì)不同意圖類別有著不同的興趣,而依據(jù)對(duì)記錄有環(huán)境信息和用戶標(biāo)識(shí)信息的用戶日志進(jìn)行分析統(tǒng)計(jì)得到的當(dāng)前用戶在所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布進(jìn)行排序,能夠?qū)?dāng)前用戶更感興趣的意圖類別排在前面;在查詢串相同的情況下,現(xiàn)有技術(shù)會(huì)向全網(wǎng)用戶提供相同的信息記錄,而不會(huì)考慮用戶的個(gè)性化需求的問(wèn)題,本申請(qǐng)能夠使得排序后的信息記錄更加接近于能夠反映用戶興趣度的個(gè)性化的真實(shí)信息需求。
再者,在對(duì)各意圖類別的信息記錄進(jìn)行排序以調(diào)整各意圖類別的信息記錄的順序時(shí),本申請(qǐng)還可以依據(jù)當(dāng)前環(huán)境信息對(duì)每個(gè)意圖類別內(nèi)部的信息記錄進(jìn)行排序,將每個(gè)意圖類別的信息記錄中更能反映當(dāng)前環(huán)境信息下信息需求的網(wǎng)頁(yè)排在前面,使得排序后的信息記錄更加接近于用戶的真實(shí)信息需求。本申請(qǐng)的技術(shù)方案可以應(yīng)用于搜索引擎服務(wù)、瀏覽器服務(wù)等應(yīng)用,能夠提供更加接近于用戶的真實(shí)信息需求的信息記錄,從而方便用戶快速地查看到最感興趣的信息。
圖I是本申請(qǐng)一種對(duì)信息記錄進(jìn)行排序的方法實(shí)施例的流程圖;圖2是本申請(qǐng)一種基于搜索引擎的信息搜索方法實(shí)施例的流程圖;圖3是本申請(qǐng)一種基于瀏覽器的信息推薦方法實(shí)施例的流程圖;圖4是本申請(qǐng)圖3所述實(shí)施例中多展現(xiàn)區(qū)域的示例圖;圖5是本申請(qǐng)一種對(duì)信息記錄進(jìn)行排序的裝置實(shí)施例的結(jié)構(gòu)圖;圖6是本申請(qǐng)一種信息搜索服務(wù)器實(shí)施例的結(jié)構(gòu)圖;圖7是本申請(qǐng)一種信息搜索客戶端實(shí)施例的結(jié)構(gòu)圖。
具體實(shí)施例方式為使本申請(qǐng)的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式
對(duì)本申請(qǐng)作進(jìn)一步詳細(xì)的說(shuō)明。本申請(qǐng)實(shí)施例針對(duì)環(huán)境信息對(duì)信息記錄進(jìn)行排序,由于能夠體現(xiàn)不同環(huán)境信息下用戶的不同信息需求,故能夠使得信息記錄更加接近于用戶的真實(shí)信息需求。本申請(qǐng)實(shí)施例中,環(huán)境信息主要是指用戶所處的周邊環(huán)境信息,具體可以包括時(shí)間環(huán)境信息、位置環(huán)境信息、溫度環(huán)境信息、硬件環(huán)境信息等等。在不同的環(huán)境信息下,用戶的信息需求往往是不同的以時(shí)間環(huán)境信息為例,早晨為新一天的開(kāi)始,故用戶在早晨時(shí)對(duì)新聞信息有著需求;上班時(shí)工作為主上網(wǎng)為輔,故在上班時(shí)對(duì)網(wǎng)頁(yè)、圖片信息存在著需求;晚上為放松娛樂(lè)的時(shí)刻,在晚上時(shí)對(duì)音樂(lè)、視頻信息存在著需求,等等;以地理環(huán)境為例,網(wǎng)吧、家庭為放松娛樂(lè)的場(chǎng)所,故用戶在網(wǎng)吧、家庭,通常對(duì)視頻、游戲、音樂(lè)等信息存在著需求;辦公室為辦公場(chǎng)所不宜過(guò)度娛樂(lè),故新聞、圖片等信息對(duì)用戶來(lái)說(shuō)足夠;機(jī)場(chǎng)、車站、賓館等場(chǎng)所為流動(dòng)性強(qiáng)的場(chǎng)所,通常關(guān)注旅游、天氣等信息。即使用戶明確了自身的針對(duì)視頻的信息需求,但是,考慮到辦公場(chǎng)所不宜過(guò)度娛樂(lè),網(wǎng)吧、家庭適合娛樂(lè)的特點(diǎn),可以認(rèn)為辦公環(huán)境下用戶想看的是視頻的片花,而網(wǎng)吧、家庭環(huán)境下用戶想看的是高清完整的視頻。綜上,本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際需求,采用上述環(huán)境信息中的一種或多種,并且,針對(duì)采用的一種或多種環(huán)境信息進(jìn)行細(xì)分。例如,通過(guò)對(duì)時(shí)間環(huán)境信息進(jìn)行環(huán)境信息分害I],將時(shí)間環(huán)境信息細(xì)分為白天和黑夜,或者早晨、上班和晚上等;例如,通過(guò)對(duì)位置環(huán)境信息進(jìn)行分類,將位置環(huán)境信息細(xì)分為網(wǎng)吧、攻擊、家庭、機(jī)場(chǎng)、車站、賓館等。本申請(qǐng)對(duì)具體的細(xì)分方式不加以限制。為了將用戶的各種各樣的信息需求跟網(wǎng)絡(luò)數(shù)據(jù)中的信息記錄進(jìn)行關(guān)聯(lián),本申請(qǐng)可采用基于分類的思想為信息記錄添加意圖類別標(biāo)簽,使得不同意圖類別對(duì)應(yīng)不同的信息需求;這樣,根據(jù)環(huán)境信息對(duì)得到的信息記錄進(jìn)行的排序,就轉(zhuǎn)換為根據(jù)環(huán)境信息進(jìn)行意圖類別的排序。關(guān)于根據(jù)環(huán)境信息進(jìn)行意圖類別的排序,本申請(qǐng)使用概率論和數(shù)理統(tǒng)計(jì)的方法來(lái)計(jì)算所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布的規(guī)律性。具體而言,在離線情況下, 對(duì)用戶日志進(jìn)行分析統(tǒng)計(jì),得到所述查詢串對(duì)應(yīng)環(huán)境信息下各意圖類別的分布;在線排序時(shí),依據(jù)所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布,對(duì)各意圖類別的信息記錄進(jìn)行排序。 鑒于本申請(qǐng)實(shí)施例中使用的概率符號(hào),為方便理解,在此通過(guò)表I對(duì)各概率符號(hào)的名稱、含義和獲取方法進(jìn)行解釋。表I
權(quán)利要求
1.一種對(duì)信息記錄進(jìn)行排序的方法,其特征在于,所述方法包括采集查詢串對(duì)應(yīng)的環(huán)境信息;依據(jù)所述查詢串獲取各意圖類別的信息記錄;依據(jù)所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布,對(duì)意圖類別進(jìn)行排序,并依據(jù)意圖類別的排序結(jié)果調(diào)整信息記錄的順序;其中,所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布由依據(jù)記錄有環(huán)境信息的用戶日志進(jìn)行分析統(tǒng)計(jì)得到。
2.如權(quán)利要求I所述的方法,其特征在于,通過(guò)如下步驟得到所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布在所述查詢串對(duì)應(yīng)的環(huán)境信息下依據(jù)用戶日志對(duì)全網(wǎng)中的網(wǎng)頁(yè)進(jìn)行分析統(tǒng)計(jì),得到所述環(huán)境信息下的各網(wǎng)頁(yè)分布;在所述查詢串對(duì)應(yīng)的環(huán)境信息下針對(duì)某特定網(wǎng)頁(yè)依據(jù)用戶日志對(duì)各意圖類別進(jìn)行分析統(tǒng)計(jì),得到所述環(huán)境信息下特定網(wǎng)頁(yè)的意圖類別分布;以各網(wǎng)頁(yè)為統(tǒng)計(jì)樣本,對(duì)所述環(huán)境信息下的各網(wǎng)頁(yè)分布和所述環(huán)境信息下特定網(wǎng)頁(yè)的意圖類別分布進(jìn)行統(tǒng)計(jì),得到所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布。
3.如權(quán)利要求I所述的方法,其特征在于,還包括識(shí)別所述查詢串對(duì)應(yīng)的當(dāng)前用戶的用戶標(biāo)識(shí)信息;依據(jù)當(dāng)前用戶在所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布,對(duì)意圖類別進(jìn)行排序,并依據(jù)意圖類別的排序結(jié)果調(diào)整各信息記錄的順序;其中,所述當(dāng)前用戶在所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布依據(jù)對(duì)記錄有環(huán)境信息和用戶標(biāo)識(shí)信息的用戶日志進(jìn)行分析統(tǒng)計(jì)得到。
4.如權(quán)利要求3所述的方法,其特征在于,通過(guò)如下步驟得到當(dāng)前用戶在所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布對(duì)用戶日志進(jìn)行分析統(tǒng)計(jì),得到各意圖類別的分布和在特定的意圖類別下對(duì)應(yīng)的所述各環(huán)境信息的分布,進(jìn)而統(tǒng)計(jì)得到所有用戶在所述環(huán)境信息下各意圖類別的分布;對(duì)當(dāng)前用戶日志進(jìn)行分析統(tǒng)計(jì),得到當(dāng)前用戶的各意圖類別的分布和當(dāng)前用戶在特定的意圖類別下對(duì)應(yīng)的所述各環(huán)境信息的分布,進(jìn)而統(tǒng)計(jì)得到當(dāng)前用戶在所述環(huán)境信息下各意圖類別的初步分布;對(duì)所述所有用戶在所述環(huán)境信息下各意圖類別的分布和所述當(dāng)前用戶在所述環(huán)境信息下各意圖類別的初步分布進(jìn)行加權(quán)處理,得到所述當(dāng)前用戶在所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布。
5.如權(quán)利要求I至4中任一項(xiàng)所述的方法,其特征在于,還包括依據(jù)所述查詢串對(duì)應(yīng)的環(huán)境信息下特定意圖類別的各網(wǎng)頁(yè)分布,對(duì)每個(gè)意圖類別的信息記錄進(jìn)行排序;其中,所述查詢串對(duì)應(yīng)的環(huán)境信息下特定意圖類別的各網(wǎng)頁(yè)分布為依據(jù)記錄有環(huán)境信息的用戶日志進(jìn)行分析統(tǒng)計(jì)得到。
6.如權(quán)利要求5所述的方法,其特征在于,通過(guò)如下步驟得到所述查詢串對(duì)應(yīng)的環(huán)境信息下特定意圖類別的各網(wǎng)頁(yè)分布對(duì)用戶日志進(jìn)行分析統(tǒng)計(jì),得到全網(wǎng)中的各網(wǎng)頁(yè)分布、所述查詢串對(duì)應(yīng)的環(huán)境信息下特定網(wǎng)頁(yè)的各意圖類別分布、及在所述查詢串對(duì)應(yīng)的環(huán)境信息下的各網(wǎng)頁(yè)分布;根據(jù)全網(wǎng)中的各網(wǎng)頁(yè)分布、所述查詢串對(duì)應(yīng)的環(huán)境信息下特定網(wǎng)頁(yè)的各意圖類別分布、及在所述查詢串對(duì)應(yīng)的環(huán)境信息下的各網(wǎng)頁(yè)分布,構(gòu)造所述查詢串對(duì)應(yīng)的環(huán)境信息、特定意圖類別和全網(wǎng)中的各網(wǎng)頁(yè)的聯(lián)合分布; 依據(jù)所述查詢串對(duì)應(yīng)的環(huán)境信息、特定意圖類別和全網(wǎng)中的各網(wǎng)頁(yè)的聯(lián)合分布與所述查詢串對(duì)應(yīng)的環(huán)境信息和特定意圖類別的聯(lián)合分布的比值 ,統(tǒng)計(jì)得到所述查詢串對(duì)應(yīng)的環(huán)境信息下特定意圖類別的各網(wǎng)頁(yè)分布。
7.如權(quán)利要求I至4中任一項(xiàng)所述的方法,其特征在于,所述依據(jù)所述查詢串獲取各意圖類別的信息記錄時(shí) 依據(jù)所述查詢串在網(wǎng)絡(luò)數(shù)據(jù)中搜索得到相應(yīng)的信息記錄,并依據(jù)各意圖類別對(duì)所述信息記錄進(jìn)行分類,得到各意圖類別的信息記錄; 和/或,依據(jù)所述查詢串分別在帶有各意圖類別標(biāo)簽的網(wǎng)絡(luò)數(shù)據(jù)中進(jìn)行搜索,得到各意圖類別的信息記錄。
8.如權(quán)利要求I至4中任一項(xiàng)所述的方法,其特征在于,所述用戶日志包括瀏覽器日志和/或查詢?nèi)罩荆凰鰹g覽器日志記錄有用戶標(biāo)識(shí)信息、瀏覽網(wǎng)頁(yè)歷史和相應(yīng)的環(huán)境信息;所述查詢?nèi)罩居涗浻杏脩魳?biāo)識(shí)信息、查詢串及相應(yīng)的網(wǎng)頁(yè)操作歷史和環(huán)境信息,所述網(wǎng)頁(yè)操作歷史為查詢串對(duì)應(yīng)的信息記錄中被用戶操作過(guò)的網(wǎng)頁(yè)記錄。
9.如權(quán)利要求I至4中任一項(xiàng)所述的方法,其特征在于,還包括 對(duì)排序后的各意圖類別的信息記錄進(jìn)行展現(xiàn)。
10.如權(quán)利要求9所述的方法,其特征在于,還包括在預(yù)置的各展現(xiàn)區(qū)域內(nèi)對(duì)各意圖類別的推薦結(jié)果進(jìn)行展現(xiàn)。
11.如權(quán)利要求I至4中任一項(xiàng)所述的方法,其特征在于,所述查詢串來(lái)源于用戶輸入或用戶當(dāng)前瀏覽的網(wǎng)頁(yè)。
12.—種對(duì)信息記錄進(jìn)行排序的裝置,其特征在于,所述裝置包括 采集模塊,用于采集所述查詢串對(duì)應(yīng)的環(huán)境信息; 信息記錄獲取模塊,用于依據(jù)所述查詢串獲取各意圖類別的信息記錄;及類間排序模塊,用于依據(jù)所述查詢串對(duì)應(yīng)的環(huán)境信息下意圖類別的分布,對(duì)意圖類別進(jìn)行排序,并依據(jù)意圖類別的排序結(jié)果調(diào)整信息記錄的順序;其中,所述查詢串對(duì)應(yīng)的環(huán)境信息下意圖類別的分布由依據(jù)記錄有環(huán)境信息的用戶日志進(jìn)行分析統(tǒng)計(jì)得到。
13.如權(quán)利要求12所述的裝置,其特征在于,還包括 第一統(tǒng)計(jì)模塊,用于得到所述查詢串對(duì)應(yīng)的環(huán)境信息下意圖類別的分布,包括 第一統(tǒng)計(jì)子模塊,用于在所述查詢串對(duì)應(yīng)的環(huán)境信息下依據(jù)用戶日志對(duì)全網(wǎng)中的網(wǎng)頁(yè)進(jìn)行分析統(tǒng)計(jì),得到所述環(huán)境信息下的各網(wǎng)頁(yè)分布; 第二統(tǒng)計(jì)子模塊,用于在所述查詢串對(duì)應(yīng)的環(huán)境信息下針對(duì)某特定網(wǎng)頁(yè)依據(jù)用戶日志對(duì)各意圖類別進(jìn)行分析統(tǒng)計(jì),得到所述環(huán)境信息下特定網(wǎng)頁(yè)的意圖類別分布;及 求和子模塊,用于以網(wǎng)頁(yè)為變量,對(duì)所述環(huán)境信息下的網(wǎng)頁(yè)分布和所述環(huán)境信息下特定網(wǎng)頁(yè)的意圖類別分布進(jìn)行統(tǒng)計(jì),得到意圖類別在所述查詢串對(duì)應(yīng)的環(huán)境信息下的分布。
14.如權(quán)利要求12所述的裝置,其特征在于,還包括 識(shí)別模塊,用于識(shí)別所述查詢串對(duì)應(yīng)的當(dāng)前用戶的用戶標(biāo)識(shí)信息; 興趣度類間排序模塊,用于依據(jù)當(dāng)前用戶在所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布,對(duì)意圖類別進(jìn)行排序,并依據(jù)意圖類別的排序結(jié)果調(diào)整各信息記錄的順序,其中,所述當(dāng)前用戶在所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布為依據(jù)對(duì)記錄有環(huán)境信息和用戶標(biāo)識(shí)信息的用戶日志進(jìn)行分析統(tǒng)計(jì)得到。
15.如權(quán)利要求14所述的裝置,其特征在于,還包括第二統(tǒng)計(jì)模塊,用于得到用戶在所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布,包括第三統(tǒng)計(jì)子模塊,用于對(duì)用戶日志進(jìn)行分析統(tǒng)計(jì),得到意圖類別的分布和在特定的意圖類別下對(duì)應(yīng)的各環(huán)境信息的分布,進(jìn)而統(tǒng)計(jì)得到所有用戶在所述環(huán)境信息下意圖類別的分布;第四統(tǒng)計(jì)子模塊,用于對(duì)當(dāng)前用戶日志進(jìn)行分析統(tǒng)計(jì),得到當(dāng)前用戶的意圖類別的分布和當(dāng)前用戶在特定的意圖類別下對(duì)應(yīng)的所述各環(huán)境信息的分布,進(jìn)而統(tǒng)計(jì)得到當(dāng)前用戶在所述環(huán)境信息下意圖類別的初步分布;及線性加權(quán)處理子模塊,用于對(duì)所述所有用戶在所述環(huán)境信息下意圖類別的分布和所述當(dāng)前用戶在所述環(huán)境信息下意圖類別的初步分布進(jìn)行加權(quán)處理,得到所述當(dāng)前用戶在所述查詢串對(duì)應(yīng)的環(huán)境信息下意圖類別的分布。
16.如權(quán)利要求12至15中任一項(xiàng)所述的裝置,其特征在于,還包括類別內(nèi)排序模塊,用于依據(jù)所述查詢串對(duì)應(yīng)的環(huán)境信息下特定意圖類別的網(wǎng)頁(yè)分布, 對(duì)每個(gè)意圖類別內(nèi)部的信息記錄進(jìn)行排序;其中,所述查詢串對(duì)應(yīng)的環(huán)境信息下特定意圖類別的網(wǎng)頁(yè)分布為依據(jù)記錄有環(huán)境信息的用戶日志進(jìn)行分析統(tǒng)計(jì)得到。
17.一種信息搜索服務(wù)器,其特征在于,包括接收模塊,用于接收來(lái)自信息搜索客戶端的查詢串及所述查詢串對(duì)應(yīng)的環(huán)境信息; 信息搜索模塊,用于依據(jù)查詢串在網(wǎng)絡(luò)數(shù)據(jù)中進(jìn)行搜索,得到各意圖類別的信息記錄;類間排序模塊,用于依據(jù)所述查詢串對(duì)應(yīng)的環(huán)境信息下意圖類別的分布,對(duì)意圖類別進(jìn)行排序,并依據(jù)意圖類別的排序結(jié)果調(diào)整各信息記錄的順序;其中,所述查詢串對(duì)應(yīng)的環(huán)境信息下意圖類別的分布由依據(jù)記錄有環(huán)境信息的用戶日志進(jìn)行分析統(tǒng)計(jì)得到;及返回模塊,用于將所述類間排序模塊輸出的信息記錄返回。
18.如權(quán)利要求17所述的信息搜索服務(wù)器,其特征在于,所述信息搜索模塊,具體用于依據(jù)查詢串在網(wǎng)絡(luò)數(shù)據(jù)中搜索得到相應(yīng)的信息記錄,并依據(jù)各意圖類別對(duì)所述信息記錄進(jìn)行分類,得到各意圖類別的信息記錄;和/或,依據(jù)所述查詢串分別在帶有各意圖類別標(biāo)簽的網(wǎng)絡(luò)數(shù)據(jù)中進(jìn)行搜索,得到各意圖類別的信息記錄。
19.如權(quán)利要求17所述的信息搜索服務(wù)器,其特征在于,還包括第一相關(guān)性排序模塊,用于依據(jù)信息記錄與所述查詢串之間的相關(guān)性對(duì)所述信息搜索模塊輸出的信息記錄進(jìn)行第一相關(guān)性排序,并將第一相關(guān)性排序后的信息記錄輸出至所述分類模塊;或者第二相關(guān)性排序模塊,用于依據(jù)信息記錄與所述查詢串之間的相關(guān)性對(duì)所述類間排序模塊輸出的信息記錄進(jìn)行第二相關(guān)性排序,并將第二相關(guān)性排序后的信息記錄輸出至所述返回模塊。
20.如權(quán)利要求17所述的信息搜索服務(wù)器,其特征在于,還包括識(shí)別模塊,用于識(shí)別所述查詢串對(duì)應(yīng)的當(dāng)前用戶的用戶標(biāo)識(shí)信息;興趣類間排序模塊,用于依據(jù)當(dāng)前用戶在所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布,對(duì)意圖類別進(jìn)行排序,并依據(jù)意圖類別的排序結(jié)果調(diào)整信息記錄的順序,其中,所述當(dāng)前用戶在所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布依據(jù)對(duì)記錄有環(huán)境信息和用戶標(biāo)識(shí)信息的用戶日志進(jìn)行分析統(tǒng)計(jì)得到; 所述返回模塊,還用于將所述興趣類間排序模塊輸出的信息記錄返回給信息搜索客戶端。
21.如權(quán)利要 求17至20中任一項(xiàng)所述的信息搜索服務(wù)器,其特征在于,還包括 類別內(nèi)排序模塊,用于依據(jù)所述查詢串對(duì)應(yīng)的環(huán)境信息下特定意圖類別的網(wǎng)頁(yè)分布,對(duì)每個(gè)意圖類別內(nèi)部的信息記錄進(jìn)行排序;其中,所述查詢串對(duì)應(yīng)的環(huán)境信息下特定意圖類別的網(wǎng)頁(yè)分布為對(duì)記錄有環(huán)境信息的用戶日志進(jìn)行分析統(tǒng)計(jì)得到; 所述返回模塊,還用于將所述類別內(nèi)排序模塊輸出的信息記錄返回給信息搜索客戶端。
22.一種信息搜索客戶端,其特征在于,包括 查詢接收模塊,用于接收用戶輸入的查詢串; 環(huán)境采集模塊,用于采集所述查詢串對(duì)應(yīng)的環(huán)境信息; 發(fā)送模塊,用于將所述查詢串及所述查詢串對(duì)應(yīng)的環(huán)境信息發(fā)送至信息搜索服務(wù)器;及 展現(xiàn)模塊,用于對(duì)所述信息搜索服務(wù)器返回的信息記錄進(jìn)行展現(xiàn)。
23.如權(quán)利要求22所述的信息搜索客戶端,其特征在于,還包括 查詢?nèi)罩居涗浤K,用于將用戶標(biāo)識(shí)信息、所述查詢串及相應(yīng)的網(wǎng)頁(yè)操作歷史和環(huán)境信息記錄至查詢?nèi)罩?,所述網(wǎng)頁(yè)操作歷史為查詢串對(duì)應(yīng)的信息記錄中被用戶操作過(guò)的網(wǎng)頁(yè)記錄。
全文摘要
本申請(qǐng)?zhí)峁┝艘环N對(duì)信息記錄進(jìn)行排序的方法和裝置,其中方法具體包括采集查詢串對(duì)應(yīng)的環(huán)境信息;依據(jù)所述查詢串獲取各意圖類別的信息記錄;依據(jù)所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布,對(duì)意圖類別進(jìn)行排序,并依據(jù)意圖類別的排序結(jié)果調(diào)整信息記錄的順序;其中,所述查詢串對(duì)應(yīng)的環(huán)境信息下各意圖類別的分布由依據(jù)記錄有環(huán)境信息的用戶日志進(jìn)行分析統(tǒng)計(jì)得到。本申請(qǐng)能夠根據(jù)環(huán)境信息對(duì)意圖類別進(jìn)行排序,將當(dāng)前用戶更感興趣的意圖類別排在前面,并且結(jié)合了用戶的個(gè)性化因素,使得排序后的信息記錄更加接近于用戶的真實(shí)信息需求。
文檔編號(hào)G06F17/30GK102622417SQ20121003899
公開(kāi)日2012年8月1日 申請(qǐng)日期2012年2月20日 優(yōu)先權(quán)日2012年2月20日
發(fā)明者佟子健, 張超旭, 江會(huì)星, 王瀟, 蘇雪峰 申請(qǐng)人:北京搜狗信息服務(wù)有限公司, 北京搜狗科技發(fā)展有限公司