本發(fā)明涉及一種網絡商品推薦方法,尤其是涉及一種基于關聯(lián)分析算法的商品推薦方法。
背景技術:
購物網站使用的商品推薦算法通常包括:
基于用戶的協(xié)同過濾算法,即將每個用戶作為分析的主體,針對每個群體,通過處理群體中每個用戶的商品瀏覽日志,算出該群體的每個用戶與該群體其他用戶之間的關聯(lián)度,進而向該用戶推薦他自己沒有瀏覽或者購買而與群體中關聯(lián)度高的其他用戶購買或者瀏覽的商品;該算法的缺點是:用戶增加速度快,然而僅采用用戶的歷史偏好數(shù)據(jù)計算用戶相似度,對于新用戶有“冷啟動”問題。
基于模型的協(xié)同過濾方法,即基于樣本的用戶喜好信息,訓練一個推薦模型,然后根據(jù)實時的用戶喜好的信息進行預測,計算推薦。該方法需要通過聚類等數(shù)據(jù)處理,建立一個以用戶為行、商品為列的hugematrix(巨型矩陣),矩陣元素為用戶對商品的評分。該算法的缺點是:創(chuàng)建矩陣所需要的時間隨著用戶和商品數(shù)量的增多而飛速增長,一旦收到新增的用戶對商品的評分,原矩陣就失效,必須更新,靈活性差。
技術實現(xiàn)要素:
本發(fā)明的目的就是為了克服上述現(xiàn)有技術存在的缺陷而提供一種可根據(jù)歷史數(shù)據(jù)進行推薦、靈活性高的基于關聯(lián)分析算法的商品推薦方法。
本發(fā)明的目的可以通過以下技術方案來實現(xiàn):
一種基于關聯(lián)分析算法的商品推薦方法,根據(jù)購物網站中的用戶行為日志進行商品推薦,其特征在于,該方法包括以下步驟:
s1,獲取歷史用戶行為日志,根據(jù)歷史用戶行為日志中的數(shù)據(jù)對用戶和商品 進行模糊聚類分析,生成多個用戶群體和商品類別,以及每個用戶群體對每個商品類別的評價分數(shù);
s2,構建推薦矩陣m,所述推薦矩陣m以用戶群體為行標,以商品類別為列標,矩陣元素mij表示第i個用戶群體對第j個商品類別的評價分數(shù),其中i=1,2..u,j=1,2…p,u為用戶群體個數(shù),p為商品類別個數(shù);
s3,獲取新增用戶行為日志,利用推薦矩陣m對新增用戶行為日志中的用戶進行商品推薦;
s4,判斷新增用戶行為日志的數(shù)據(jù)量是否已達到設定值,若是,則返回步驟s1,并將新增用戶行為日志的數(shù)據(jù)量計數(shù)值,若否,則返回步驟s3。達到設定值具體為:新注冊用戶數(shù)目達到已注冊用戶的1%~10%之間的一個值,或新增商品數(shù)目達到已存在商品數(shù)目的1%~10%之間的一個值,設定值可隨時變化,以適應不斷變化的市場消費走向。
所述的步驟s1中,每個用戶群體具有一個特征,每個用戶至少歸入一個用戶群體,即每個用戶具有至少一個特征。
所述的步驟s1中,用戶群體的特征為年齡段、地區(qū)、購物偏好中的一個。
所述的用戶群體特征中的地區(qū)根據(jù)用戶注冊時填寫的資料或用戶注冊手機號碼所在地或用戶收貨地址確定。
所述的步驟s1中,用戶行為日志中的數(shù)據(jù)包括用戶信息、商品信息、用戶注冊、登陸及對商品的瀏覽、購買、評價行為。
所述的步驟s3中,直接向用戶推薦與用戶行為中的商品之間關聯(lián)度最高的商品;或將用戶歸入用戶群體,并向用戶推薦所屬用戶群體給出的評價分數(shù)最高的商品類別中的商品,即對于用戶行為日志中不含商品信息的用戶,根據(jù)該用戶所屬的用戶群體對各商品類別的評價分數(shù),選擇最高評價分數(shù)所對應的商品類別作為推薦的商品類別,并從該商品類別中推薦商品。
所述的步驟s3具體包括以下步驟:
s31,獲取新增用戶行為日志,判斷該用戶是否為新注冊用戶,若是,則進入步驟s32,若否,則進入步驟s33;
s32,判斷用戶行為中是否含有商品信息,即用戶有瀏覽、購買或評價商品的行為,若是,則向該用戶推薦該商品所屬商品類別中的商品,若否,則根據(jù)用戶注冊時填寫的信息,例如手機號、用戶所在地等,將用戶歸入至少一個用戶群體,并 進入步驟s34;
s33,判斷用戶行為中是否含有商品信息,若是,則向該用戶推薦該商品所屬商品類別中的商品,若否,則進入步驟s34;
s34,從推薦矩陣m找出用戶所屬的用戶群體對商品所屬的商品類別的評價分數(shù),選擇最高評價分數(shù)所對應的商品類別作為推薦的商品類別,并從該商品類別中推薦商品。
所述的步驟s32中,從商品所屬商品類別中選取與所述商品關聯(lián)度最高的若干商品進行推薦。
所述的步驟s33中,從所述商品所屬商品類別中選取歷史銷量最高的若干商品進行推薦。
所述的步驟s32和步驟s33中,所述商品若為新增商品,則根據(jù)商品自身特點將其歸入一個商品類別。
所述的步驟s34中,從推薦的商品類別中選取與所述商品關聯(lián)度最高的若干商品進行推薦。
與現(xiàn)有技術相比,本發(fā)明具有以下優(yōu)點:
(1)先根據(jù)歷史用戶行為日志建立用戶群體及商品類別,建立推薦矩陣,根據(jù)新增用戶行為日志利用現(xiàn)有推薦矩陣進行商品推薦,并在新增用戶行為的數(shù)據(jù)量達到設定值以后,對推薦矩陣進行更新,以適應不斷變化的市場走向。
(2)每個用戶群體具有一個特征,每個用戶至少歸入一個用戶群體,即每個用戶具有多個特征,以多方面衡量和估計用戶的感興趣商品。
(3)用戶群體的特征為年齡段、地區(qū)、購物偏好中的一個,可以反映用戶的基本行為特征,從而提高同一個用戶群體內的各用戶之間的關聯(lián)度。
(4)步驟s3中,對于用戶行為日志中不含商品信息的用戶,根據(jù)該用戶所屬的用戶群體對商品所屬的商品類別的評價分數(shù),選擇最高評價分數(shù)所對應的商品類別作為推薦的商品類別,并從該商品類別中推薦商品,具有較強的可靠性。
(5)步驟s3中,對于用戶行為日志中含商品信息的用戶,直接向該用戶推薦該商品所屬商品類別中的商品,能準確抓住用戶近期需求進行推薦,具有較強的針對性。
(6)步驟s32中,從商品所屬商品類別中選取與所述商品關聯(lián)度最高的若干商品進行推薦;步驟s33中,從所述商品所屬商品類別中選取歷史銷量最高的若 干商品進行推薦;步驟s34中,從推薦的商品類別中選取與所述商品關聯(lián)度最高的若干商品進行推薦;上述推薦方式根據(jù)用戶行為的多樣化,進行個性化推薦,符合用戶的個性化需求。
(7)步驟s32和步驟s33中,所述商品若為新增商品,則根據(jù)商品自身特點將其歸入一個商品類別,一般商品增加的速度遠沒有用戶增加速度快,所以商品之間的關聯(lián)度計算頻率和商品的類別分布短期內是沒有很大誤差上的變化,可以實現(xiàn)階段性的“一勞永逸”。
(8)對于新增加的用戶,可直接對其進行用戶群體歸類再根據(jù)所屬用戶群體進行商品推薦,或者根據(jù)其行為進行商品推薦,不需要對其進行聚類,計算量小。
附圖說明
圖1為本發(fā)明方法的流程圖。
具體實施方式
下面結合附圖和具體實施例對本發(fā)明進行詳細說明。本實施例以本發(fā)明技術方案為前提進行實施,給出了詳細的實施方式和具體的操作過程,但本發(fā)明的保護范圍不限于下述的實施例。
實施例
如圖1所示,一種基于關聯(lián)分析算法的商品推薦方法,根據(jù)購物網站中的用戶行為日志進行商品推薦,該方法包括以下步驟:
s1,獲取歷史用戶行為日志,根據(jù)歷史用戶行為日志中的數(shù)據(jù)對用戶和商品進行模糊聚類分析,生成多個用戶群體和商品類別,以及每個用戶群體對每個商品類別的評價分數(shù);
本步驟中,每個用戶群體具有一個特征,例如年齡段、地區(qū)、購物偏好,地區(qū)根據(jù)用戶注冊時填寫的資料或用戶注冊手機號碼所在地或用戶收貨地址確定;每個用戶至少歸入一個用戶群體,每個用戶群體與另一個用戶群體內的用戶有重疊,即每個用戶同時具有至少一個特征。例如,用戶a為19歲、上海郊區(qū)、對于男士西裝類產品比較感興趣;用戶b為30歲、北京市區(qū)、對于圖書類和生鮮肉類產品感興趣;用戶群體w為年齡段為18歲到22歲之間的人群,用戶群體x為30~35歲之間的人群,用戶群體y為一線城市市區(qū)的人群,用戶群體z為一線城市郊區(qū)的 人群,用戶群體m為對服裝類產品感興趣的人群;則用戶a可歸屬為用戶群體w、z,用戶b可歸屬為用戶群體x、y和m。
本步驟中,用戶行為日志中的數(shù)據(jù)包括用戶信息、商品信息、用戶注冊、登陸及對商品的瀏覽、購買、評價行為。
s2,構建推薦矩陣m,所述推薦矩陣m以用戶群體為行標,以商品類別為列標,矩陣元素mij表示第i個用戶群體對第j個商品類別的評價分數(shù),其中i=1,2..u,j=1,2…p,u為用戶群體個數(shù),p為商品類別個數(shù);
s3,獲取新增用戶行為日志,利用推薦矩陣m對新增用戶行為日志中的用戶進行商品推薦,具體包括以下步驟:
s31,獲取新增用戶行為日志,判斷該用戶是否為新注冊用戶,若是,則進入步驟s32,若否,則進入步驟s33;
s32,判斷用戶行為中是否含有商品信息,即用戶有瀏覽、購買或評價商品的行為,若是,則向該用戶推薦該商品所屬商品類別中的商品,該商品為與所述商品關聯(lián)度最高的若干商品;若否,則根據(jù)用戶注冊時填寫的信息,例如手機號、用戶所在地等,將用戶歸入至少一個用戶群體,并進入步驟s34;
s33,判斷用戶行為中是否含有商品信息,若是,則向該用戶推薦該商品所屬商品類別中的商品,該商品為所屬商品類別中歷史銷量最高的若干商品,例如排名前1~10為的商品;若否,則進入步驟s34;
s34,從推薦矩陣m找出用戶所屬的用戶群體對商品所屬的商品類別的評價分數(shù),選擇最高評價分數(shù)所對應的商品類別作為推薦的商品類別,并從該商品類別中推薦商品,推薦的商品為所屬商品類別中與所述商品關聯(lián)度最高的若干商品,關聯(lián)度可通過關聯(lián)度計算獲得;
s4,判斷新增用戶行為日志的數(shù)據(jù)量是否已達到設定值,若是,則返回步驟s1,并將新增用戶行為日志的數(shù)據(jù)量計數(shù)值,若否,則返回步驟s3。例如:新注冊用戶數(shù)目達到已注冊用戶的1%~10%之間的一個值,或新增商品數(shù)目達到已存在商品數(shù)目的1%~10%之間的一個值,則返回步驟s1,設定值可隨時變化,以適應不斷變化的市場消費走向。
步驟s32和步驟s33中,所述商品若為新增商品,則根據(jù)商品自身特點將其歸入一個商品類別。