專利名稱:記錄用戶訪問商品信息的方法及搜索方法和服務器的制作方法
技術領域:
本申請涉及計算機技術領域,尤其涉及一種記錄用戶訪問商品信息的方法和服務器,以及一種利用記錄的用戶訪問商品信息的結(jié)果對商品信息進行搜索的方法和服務器。
背景技術:
用戶在企業(yè)對個人用戶(Business To Customer, B2C)網(wǎng)站或個人用戶對個人用戶(Customer To Customer,C2C)網(wǎng)站上進行商品搜索時,會通過網(wǎng)站提供的界面輸入待查詢的商品名稱,網(wǎng)站根據(jù)用戶輸入的關鍵字進行搜索后向用戶返回的的結(jié)果主要有兩種, 一種是與用戶待查詢的商品相關的導航信息,另一種是用戶待查詢的商品的相關信息。目前,大量的商品信息按照商品類目名稱以樹的結(jié)構(gòu)組織在一起,商品類目樹保存在數(shù)據(jù)庫相對應的數(shù)據(jù)表中,由人工對商品類目樹中各節(jié)點的數(shù)據(jù)進行輸入與維護,B2C 網(wǎng)站或是C2C網(wǎng)站中的每個商品信息的展示都屬于商品類目樹中某一個或多個節(jié)點。用戶向B2C網(wǎng)站或是C2C網(wǎng)站進行商品信息查詢時,如果網(wǎng)站向用戶返回的結(jié)果是與用戶待查詢的商品相關的導航信息,則用戶可以根據(jù)接收到的導航信息,沿商品類目樹的路徑自上而下定位至希望查詢的搜索結(jié)果。如果網(wǎng)站向用戶返回的結(jié)果是用戶待查詢的商品的相關信息,則網(wǎng)站將商品類目樹中與用戶待查詢的商品相關的所有節(jié)點的信息返回給用戶。由于目前的電子商務網(wǎng)站的商品數(shù)量非常龐大,有些網(wǎng)站的商品數(shù)量能夠達到上億規(guī)模,根據(jù)用戶輸入的待查詢的商品名稱搜索出的商品信息數(shù)量可能非常多,一方面,網(wǎng)站服務器向用戶推送數(shù)量巨大的商品信息會占用服務器的大量系統(tǒng)資源以及網(wǎng)絡帶寬,另一方面,用戶獲得這些信息后,很難從網(wǎng)站返回的商品中準確、快速地定位出用戶實際希望查詢的商品。為了解決上述問題,目前的常規(guī)做法是限定向用戶返回的商品類目數(shù),通過減少向用戶返回的商品信息,以減少向用戶推送商品信息時對系統(tǒng)服務器的資源占用和網(wǎng)絡的資源占用,并同時減少用戶的查詢時間。通過減少向用戶返回的商品類目數(shù)的做法在一定程度上減少了資源的占用和用戶的查詢時間,但同時也可能將與用戶查詢相關度非常高的商品排除在外,導致向用戶返回的查詢結(jié)果不準確。綜上所述,目前針對用戶請求查詢商品信息的搜索技術中,存在的對用戶查詢意圖不明確,向用戶返回的搜索結(jié)果中的信息與用戶查詢的相關度較低,導致用戶的搜索結(jié)果較差的問題。
發(fā)明內(nèi)容
本申請的目的在于,提供一種記錄用戶訪問商品信息的方法和服務器,用以解決現(xiàn)有技術中存在的對用戶查詢意圖不明確的問題。一種記錄用戶訪問商品信息的方法,所述方法包括在用戶每次訪問包含商品信息的頁面時生成日志文件,所述日志文件中包含訪問頁面中包含的商品信息的至少一個屬性信息;根據(jù)各個日志文件包含的屬性信息,分別確定同一商品類目對應的各個不同屬性信息、及每種屬性信息出現(xiàn)的次數(shù)信息;以及將確定出的同一商品類目對應的各個不同屬性信息、及每種屬性信息出現(xiàn)的次數(shù)信息作為一模型信息組記錄;其中記錄的該模型信息組中任一屬性信息及其對應出現(xiàn)的次數(shù)信息作為該模型信息組中一個屬性模型信息存在。一種記錄用戶訪問商品信息的服務器,所述服務器包括日志生成模塊,用于收到用戶對包含商品信息的頁面的訪問信息時,生成日志文件,所述日志文件中包含訪問頁面中包含的商品信息的至少一個屬性信息;信息確定模塊,用于根據(jù)生成的多個所述日志文件中包含的屬性信息,分別確定同一商品類目對應的各個不同屬性信息及每種屬性信息出現(xiàn)的次數(shù)信息;記錄模塊,用于將確定出的同一商品類目對應的各個不同屬性信息以及每種屬性信息出現(xiàn)的次數(shù)信息作為一模型信息組記錄;其中所述模型信息組包括屬性模型信息, 每一所述屬性模型信息包括一屬性信息及其對應出現(xiàn)的次數(shù)信息。本申請記錄用戶訪問包含商品信息的頁面時生成日志文件,并對各個日志文件中的屬性信息進行分析,將確定出的同一商品類目對應的各個不同屬性信息、及每種屬性信息出現(xiàn)的次數(shù)信息作為一模型信息組記錄,構(gòu)建用戶對商品訪問意圖的模型,明確了設定時間內(nèi)用戶對商品的訪問意圖。本申請的另一目的在于,提供一種利用記錄的用戶訪問商品信息對商品信息進行搜索的方法和服務器,用以解決現(xiàn)有技術中存在的向用戶返回的搜索結(jié)果與用戶查詢的相關度較低,導致用戶的搜索結(jié)果較差的問題。一種對商品信息進行搜索的方法,所述方法包括根據(jù)用戶輸入的查詢關鍵字,確定用戶待查詢商品信息所屬的商品類目;在記錄的各個模型信息組中,查找到確定出的商品類目對應的模型信息組;從查找到的模型信息組的屬性模型信息下的屬性信息中,確定與所述查詢關鍵字匹配的屬性信息;從確定出的屬性信息中,提取出出現(xiàn)次數(shù)達到設定門限值的屬性信息;將包含提取出的屬性信息的商品節(jié)點列表返回給用戶,其中商品節(jié)點列表中包含了與提取出的屬性信息內(nèi)容相同的至少一個包含商品信息的頁面信息。一種對商品信息進行搜索的服務器,所述進行搜索的服務器包括類目確定模塊,用于根據(jù)查詢關鍵字,確定待查詢商品信息所屬的商品類目;查找模塊,用于在記錄的各個模型信息組中,查找確定出的商品類目對應的模型信息組;屬性信息確定模塊,用于從查找到的模型信息組的屬性模型信息下的屬性信息中,確定與所述查詢關鍵字匹配的屬性信息;提取模塊,用于從確定出的屬性信息中,提取出現(xiàn)次數(shù)達到設定門限值的屬性信息;返回模塊,用于將包含提取出的屬性信息的商品節(jié)點列表作為搜索結(jié)果返回。
本申請利用已記錄的用戶對商品信息的訪問意圖對用戶的搜索請求進行分類,查詢出與用戶的查詢意圖相關性較高的屬性信息,并將包含查詢出的屬性信息的商品節(jié)點列表返回給用戶,使用戶得到高相關度的搜索結(jié)果,能夠快速、準確的定位出希望獲得的商品信息。在減少用戶的查詢時間和準確的定位出希望獲得的商品信息的同時,有效減少了向用戶推送商品信息時對系統(tǒng)服務器的資源占用和網(wǎng)絡的資源占用。
圖1為本申請實施例一確定商品的屬性信息數(shù)量的方法示意圖;圖2為本申請實施例二進行商品搜索的方法示意圖;圖3為本申請實施例三記錄用戶訪問商品信息的服務器結(jié)構(gòu)示意圖;圖4為本申請實施例三對商品信息進行搜索的服務器結(jié)構(gòu)示意圖。
具體實施例方式本申請?zhí)岢鰧σ欢螘r間內(nèi)用戶對商品信息的訪問進行記錄,根據(jù)記錄的匯總數(shù)據(jù)確定用戶對商品信息的查詢意圖分布情況,得到用戶對商品信息訪問意圖,進而利用得到的用戶對商品信息的訪問意圖對用戶的搜索請求進行分類,將與用戶搜索的商品信息相關性較高的包含商品信息頁面鏈接的商品信息節(jié)點列表返回給用戶,讓搜索結(jié)果更加接近用戶的真實意圖,使得搜索結(jié)果更準確。下面結(jié)合說明書附圖對本申請的方案進行詳細說明。實施例一本申請實施例一是記錄用戶訪問商品信息的方法,如圖1所示,包括以下步驟步驟101 服務器在用戶每次訪問包含商品信息的頁面時生成日志文件。本實施例一中涉及的服務器是指能夠在用戶每次訪問頁面時,為本次訪問事件生成日志文件的設備。該服務器可以是與提供商品信息頁面的服務器集成在一起,也可以是獨立于提供商品信息頁面的服務器。本步驟的具體執(zhí)行方式如下預先在提供商品信息的頁面中添加一條可以連接到生成日志文件的服務器(簡稱“日志服務器”)的鏈接,當用戶通過搜索結(jié)果訪問該頁面或是通過其他方式(如通過商品類目樹)訪問該頁面后,用戶對該頁面的每一次點擊都由服務器生成一條日志文件,并將生成的該日志文件通過在頁面中添加的鏈接保存到日志服務器中。本步驟中,涉及的日志服務器可以是獨立的數(shù)據(jù)存儲設備,也可以是存儲商品類目樹的數(shù)據(jù)庫中專門用于存儲日志文件的存儲設備。本申請中涉及的日志文件中包含頁面顯示的商品信息的至少一個屬性信息,所述屬性信息包括商品品牌信息、商品型號信息、商品顏色信息或商品所屬類目ID信息等。例如,用戶訪問一個提供的商品為手機的Web頁面時,服務器針對該用戶的這次訪問生成的日志文件可以包含以下屬性信息手機的品牌信息為“ABC”,手機的型號信息為“123”,手機的顏色信息為“紅色”,所屬類目ID的信息為“手機”。如果用戶是通過搜索引擎提供的導航信息沿商品類目樹的路徑自上而下到達的訪問頁面,則日志文件中還包含用戶向搜索引擎提供的搜索關鍵字信息。例如,用戶搜索的關鍵字為“ABC紅色”,根據(jù)搜索引擎服務器返回的導航信息沿商品類目樹訪問提供品牌為 “ABC”、型號為“123”、且顏色為“紅色”的手機的Web頁面時,則生成的日志文件可以包含以下屬性信息手機的品牌信息為“ABC”,手機的型號信息為“ 123”,手機的顏色信息為“紅色”,搜索關鍵字信息為“ABC紅色”等。由于日志文件是在用戶點擊商品類目頁面或是商品信息頁面時由服務器自動生成的文本文件,因此,日志服務器中存儲的各個日志文件中包含的用戶輸入的搜索關鍵字信息的格式可能會不統(tǒng)一,這種情況下,可以對存儲的各個日志文件中的用戶輸入的關鍵字進行歸一化處理,歸一化處理的方式包括但不限于去除不必要的詞語、去除多余的空格、大小寫字母的轉(zhuǎn)換、全角半角的轉(zhuǎn)換、繁體簡體的轉(zhuǎn)換、標點的轉(zhuǎn)換和中文數(shù)字的轉(zhuǎn)換等。步驟102 根據(jù)設定時間長度內(nèi)生成的各個日志文件包含的屬性信息,分別確定同一商品類目對應的各個不同屬性信息、及每種屬性信息出現(xiàn)的次數(shù)信息。在本步驟中,可以對設定時間長度(如M小時)內(nèi)生成的日志文件進行統(tǒng)計分析,確定用戶在該設定時間長度內(nèi)對商品信息的查詢意圖。在設定時間長度內(nèi)生成的日志文件可以是多個用戶訪問提供商品信息的Web頁面時生成的日志文件。在本步驟中,由于日志文件中包含的信息繁多,因此,可以通過支持向量機 (support vector machine)對屬性信息進行分類,產(chǎn)生分類數(shù)據(jù)。步驟103 將確定出的同一商品類目對應的各個不同屬性信息以及每種屬性信息出現(xiàn)的次數(shù)信息作為一模型信息組記錄。其中記錄的該模型信息組中任一屬性信息及其對應出現(xiàn)的次數(shù)信息作為該模型信息組中一個屬性模型信息存在。屬性模型信息包括商品品牌模型信息、商品型號模型信息和商品顏色模型信息等。例如,如果一條日志文件中包含的屬性信息為商品品牌信息、商品型號信息、商品顏色信息和商品類目信息,則該商品類目信息對應的模型信息組中,商品品牌模型信息包括商品品牌信息及其出現(xiàn)次數(shù),商品型號模型信息包括商品型號信息及其出現(xiàn)次數(shù),商品顏色模型信息包括商品顏色信息及其出現(xiàn)次數(shù)。由于每一條日志文件是在用戶訪問提供某一商品信息的Web頁面時生成的,因此,每一條日志文件對應一件商品信息。但是,某些商品信息中的一個或多個屬性信息的內(nèi)容可能是相同的,但這些商品信息表示的商品所屬類目ID不同(如相同品牌的手機和電腦,其所屬商品類目不同,但作為屬性信息的商品品牌信息相同),因此,可以根據(jù)商品信息表示的商品所屬類目來確定日志文件對應的類目。由于每一商品類目對應一個模型信息組,因此,將每個類目對應的模型信息組集合在一起,成為表示用戶在設定時間長度內(nèi)對商品信息訪問意圖的模型。下面以設定時間長度內(nèi)生成N條日志文件為例,說明實施例一的具體實現(xiàn)方式對生成的N條日志文件(1,2......,n0,nl,n2,n3......N)依次進行分析,確定
每一條日志文件包含的屬性信息,不斷訓練各商品類目對應的模型信息組,假設通過對第1 條 第nO條日志文件的訓練,得到的模型信息組如表1所示
權(quán)利要求
1.一種記錄用戶訪問商品信息的方法,其特征在于,所述方法包括服務器收到用戶對包含商品信息的頁面的訪問信息時,生成日志文件,所述日志文件中包含訪問頁面中包含的商品信息的至少一個屬性信息;根據(jù)生成的多個所述日志文件中包含的屬性信息,分別確定同一商品類目對應的各個不同屬性信息及每種屬性信息出現(xiàn)的次數(shù)信息;將確定出的同一商品類目對應的各個不同屬性信息以及每種屬性信息出現(xiàn)的次數(shù)信息作為一模型信息組記錄;其中所述模型信息組包括屬性模型信息,每一所述屬性模型信息包括一屬性信息及其對應出現(xiàn)的次數(shù)信息。
2.如權(quán)利要求1所述的方法,其特征在于,所述日志文件中包含的商品信息的屬性信息為商品品牌信息、商品型號信息、商品顏色信息和商品類目信息;所述模型信息組中包含以下屬性模型信息 由商品品牌信息及其出現(xiàn)次數(shù)構(gòu)成的商品品牌模型信息; 由商品型號信息及其出現(xiàn)次數(shù)構(gòu)成的商品型號模型信息; 由商品顏色信息及其出現(xiàn)次數(shù)構(gòu)成的商品顏色模型信息。
3.一種對商品信息進行搜索的方法,其特征在于,利用權(quán)利要求1記錄的用戶訪問商品信息,所述方法包括服務器根據(jù)查詢關鍵字,確定待查詢商品信息所屬的商品類目; 在記錄的各個模型信息組中,查找確定出的商品類目對應的模型信息組; 從查找到的模型信息組的屬性模型信息下的屬性信息中,確定與所述查詢關鍵字匹配的屬性信息;從確定出的屬性信息中,提取出現(xiàn)次數(shù)達到設定門限值的屬性信息; 將包含提取出的屬性信息的商品節(jié)點列表作為搜索結(jié)果返回。
4.如權(quán)利要求3所述的方法,其特征在于,在提取出對應屬性信息出現(xiàn)次數(shù)達到設定門限值的屬性信息之前,所述方法還包括如果在模型信息組中未查詢出與所述查詢關鍵字匹配的屬性信息所對應的屬性模型信息,則減少查詢關鍵字的內(nèi)容后,重新在查找到的模型信息組中查詢與減少內(nèi)容后的查詢關鍵字匹配的屬性信息所對應的屬性模型信息。
5.如權(quán)利要求4所述的方法,其特征在于,重新查詢與減少內(nèi)容后的查詢關鍵字匹配的屬性信息所對應的屬性模型信息之后,所述方法還包括根據(jù)減少內(nèi)容后的查詢關鍵字更新查找到的模型信息組。
6.如權(quán)利要求3所述的方法,其特征在于,服務器根據(jù)查詢關鍵字確定的商品類目查找對應的模型信息組,具體包括服務器根據(jù)查詢關鍵字中的屬性信息所屬的屬性模型信息,從多個模型信息組中確定該屬性模型信息所屬的模型信息組。
7.如權(quán)利要求3所述的方法,其特征在于,在模型信息組的屬性模型信息中不存在與查詢關鍵字匹配的屬性信息時,所述方法還包括服務器從商品類目樹中查詢出與查詢關鍵字匹配的所有信息,并返回包含該信息的所有節(jié)點的信息。
8.如權(quán)利要求7所述的方法,其特征在于,所述方法還包括服務器收到對所述返回包含該信息的所有節(jié)點的信息中的商品信息的頁面的訪問信息時,生成日志文件,并根據(jù)該日志文件中的商品信息的屬性信息和對應的所述查詢關鍵字,更新模型信息組。
9.一種記錄用戶訪問商品信息的服務器,其特征在于,所述服務器包括日志生成模塊,用于收到用戶對包含商品信息的頁面的訪問信息時,生成日志文件,所述日志文件中包含訪問頁面中包含的商品信息的至少一個屬性信息;信息確定模塊,用于根據(jù)生成的多個所述日志文件中包含的屬性信息,分別確定同一商品類目對應的各個不同屬性信息及每種屬性信息出現(xiàn)的次數(shù)信息;記錄模塊,用于將確定出的同一商品類目對應的各個不同屬性信息以及每種屬性信息出現(xiàn)的次數(shù)信息作為一模型信息組記錄;其中所述模型信息組包括屬性模型信息,每一所述屬性模型信息包括一屬性信息及其對應出現(xiàn)的次數(shù)信息。
10.一種利用權(quán)利要求9記錄的用戶訪問商品信息對商品信息進行搜索的服務器,其特征在于,所述進行搜索的服務器包括類目確定模塊,用于根據(jù)查詢關鍵字,確定待查詢商品信息所屬的商品類目; 查找模塊,用于在記錄的各個模型信息組中,查找確定出的商品類目對應的模型信息組;屬性信息確定模塊,用于從查找到的模型信息組的屬性模型信息下的屬性信息中,確定與所述查詢關鍵字匹配的屬性信息;提取模塊,用于從確定出的屬性信息中,提取出現(xiàn)次數(shù)達到設定門限值的屬性信息; 返回模塊,用于將包含提取出的屬性信息的商品節(jié)點列表作為搜索結(jié)果返回。
全文摘要
本發(fā)明公開了一種記錄用戶訪問商品信息的方法和服務器,以及利用記錄的用戶訪問商品信息的結(jié)果對商品信息進行搜索的方法和服務器,主要內(nèi)容包括對一段時間內(nèi)用戶對商品信息的訪問進行記錄,根據(jù)記錄的匯總數(shù)據(jù)確定用戶對商品信息的查詢意圖分布情況,得到用戶對商品信息訪問意圖,進而利用得到的用戶對商品信息的訪問意圖對用戶的搜索請求進行分類,將與用戶搜索的商品信息相關性較高的包含商品信息頁面鏈接的商品信息節(jié)點列表返回給用戶,讓搜索結(jié)果更加接近用戶的真實意圖,使得搜索結(jié)果更好。
文檔編號G06Q30/00GK102253936SQ201010176800
公開日2011年11月23日 申請日期2010年5月18日 優(yōu)先權(quán)日2010年5月18日
發(fā)明者袁偉 申請人:阿里巴巴集團控股有限公司