本發(fā)明屬于電子商務(wù)技術(shù)領(lǐng)域,涉及一種面向智慧社區(qū)的電子商務(wù)信息推薦方法。
背景技術(shù):
智慧社區(qū)是充分利用物聯(lián)網(wǎng)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)等新一代信息技術(shù)的集成應(yīng)用,為社區(qū)居民提供一個(gè)安全、舒適、便利的現(xiàn)代化、智慧化生活環(huán)境。智慧社區(qū)包括“集成”和“服務(wù)”兩個(gè)核心理念,面向智慧社區(qū)的電子商務(wù)系統(tǒng)即是服務(wù)理念的一個(gè)具體實(shí)現(xiàn)。
面向智慧社區(qū)的電子商務(wù)系統(tǒng)主要為社區(qū)居民家庭提供與日常生活密切相關(guān)的商品如水果、蔬菜、米、油、飲料等,同時(shí)還提供日常最頻繁的娛樂服務(wù),如電影、美食、音樂、運(yùn)動(dòng)、旅游、圖書等。社區(qū)周邊大量的商品和服務(wù)信息讓社區(qū)居民目不暇接,雖然現(xiàn)存的許多電子商務(wù)系統(tǒng)如美團(tuán)、百度糯米、大眾點(diǎn)評(píng)等為了幫助用戶更快地找到自身需要或感興趣的商品,提供了個(gè)性化信息推薦,部分滿足了用戶的生活需求,但這些電子商務(wù)系統(tǒng)在進(jìn)行商品服務(wù)信息推薦時(shí)存在以下問題:
1、提供的商品中缺少社區(qū)居民日常密切相關(guān)的一些商品,在向社區(qū)居民推薦時(shí)不能夠綜合用戶對這些密切相關(guān)商品的興趣做出個(gè)性化信息推薦;
2、由于面向的消費(fèi)群體規(guī)模大,沒有固定范圍的消費(fèi)群體以及消費(fèi)群體間沒有固定的社會(huì)關(guān)系,不能夠做出約伴信息推薦;
3、由于消費(fèi)群體規(guī)模大、商品范圍比較模糊等因素,用戶的各項(xiàng)瀏覽行為數(shù)據(jù)均由服務(wù)端采集并作預(yù)處理,這很大程度上增加了一個(gè)信息推薦系統(tǒng)服務(wù)端的壓力。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明的目的在于提供一種面向智慧社區(qū)的電子商務(wù)信息推薦方法。
為達(dá)到上述目的,本發(fā)明提供如下技術(shù)方案:
一種面向智慧社區(qū)的電子商務(wù)信息推薦方法,基于客戶端用戶的注冊信息和歷史操作行為數(shù)據(jù),進(jìn)行以下操作:
1)為了更加全面評(píng)判用戶對商品的興趣度,對用戶在客戶端上的具體瀏覽行為進(jìn)行收集,并在客戶端上對這些數(shù)據(jù)進(jìn)行處理,得到用戶的隱式評(píng)分;
2)由隱式評(píng)分結(jié)合用戶主動(dòng)反饋的最終商品評(píng)分,于服務(wù)端上構(gòu)建反映用戶偏好的“用戶-商品”綜合評(píng)分矩陣;
3)基于“用戶-商品”綜合評(píng)分矩陣,依照距離最近原則對綜合評(píng)分矩陣進(jìn)行聚類,生成用戶興趣聚類簇,再為每個(gè)聚類簇生成一個(gè)虛擬用戶,由所有的虛擬用戶構(gòu)建“虛擬用戶-項(xiàng)目”評(píng)分矩陣;
4)基于“虛擬用戶-項(xiàng)目”評(píng)分矩陣,確定目標(biāo)用戶所屬聚類簇,在該簇內(nèi)查詢最近鄰居,基于最近鄰居集合利用協(xié)同過濾方法產(chǎn)生商品推薦集;
5)對用戶填寫的注冊信息進(jìn)行收集,注冊信息包括年齡、性別和對各類與生活密切相關(guān)商品或服務(wù)的感興趣程度,構(gòu)建用戶特征向量;
6)由所有的用戶特征向量構(gòu)建用戶特征矩陣,依照距離最近原則對用戶特征矩陣進(jìn)行聚類,生成用戶特征聚類簇;
7)計(jì)算目標(biāo)用戶所在的用戶特征聚類簇與最近鄰居集合之間的交集生成約伴推薦集。
進(jìn)一步的,所述的步驟1)中的數(shù)據(jù)處理得到隱式評(píng)分,具體步驟是:
1.1)記錄用戶在客戶端上的六種瀏覽行為,構(gòu)成興趣行為集合IA={A1,A2,A3,A4,A5,A6},其中A1代表頁面瀏覽時(shí)間、A2代表頁面點(diǎn)擊行為、A3代表頁面滑動(dòng)行為、A4代表分享行為、A5代表收藏行為、A6代表購買行為,并對這六種行為進(jìn)行合理量化;將用戶的瀏覽行為記錄表示成n×6階矩陣B=(bij)n×6,n代表用戶數(shù)目,bij表示第i條記錄中用戶第j種瀏覽行為數(shù)據(jù);
1.2)計(jì)算瀏覽行為的標(biāo)準(zhǔn)化值:其中sij為第i條記錄中用戶第j種瀏覽行為的標(biāo)準(zhǔn)化值,max(bij)和min(bij)分別是第i條記錄中用戶第j種瀏覽行為的最大值和最小值;
1.3)計(jì)算各種瀏覽行為的信息熵值:其中N=1/ln h,h為涉及的瀏覽行為種類數(shù),并假定fij=0時(shí),fij ln fij=0;
1.4)計(jì)算各瀏覽行為的權(quán)重:且滿足
1.5)根據(jù)每一條對商品的瀏覽記錄,計(jì)算實(shí)際用戶對該商品的隱式評(píng)分:ra=Aj×wj。
進(jìn)一步的,所述的步驟2)中的構(gòu)建“用戶-商品”綜合評(píng)分矩陣,具體步驟是:
2.1)設(shè)用戶主動(dòng)反饋的最終商品評(píng)分記為rb,并為rb設(shè)置合理的閾值以體現(xiàn)實(shí)際用戶的興趣反饋;
2.2)計(jì)算綜合評(píng)分:r=ra×rb;
2.3構(gòu)建n行m列的綜合評(píng)分矩陣R,n為用戶數(shù)目,m的值為商品項(xiàng)目數(shù),R中的元素rij表示用戶i對商品j的綜合評(píng)分。
進(jìn)一步的,所述的步驟3)中的構(gòu)建“虛擬用戶-項(xiàng)目”評(píng)分矩陣,具體步驟是:
3.1)在綜合評(píng)分矩陣中抽取k個(gè)用戶作為初始聚類中心CC={cc1,cc2,…,ccj,…,cck},計(jì)算所有用戶與初始聚類中心的歐式距離:
其中,d(ui,ccj)表示目標(biāo)用戶ui和聚類中心ccj的歐式距離,表示目標(biāo)用戶ui對所有商品項(xiàng)目的評(píng)分向量,表示聚類中心ccj對所有商品項(xiàng)目的評(píng)分向量;
3.2)依據(jù)距離最小原則,將所有的用戶分配到對應(yīng)的聚類簇中,然后對每個(gè)簇中的所有用戶的每個(gè)商品項(xiàng)目求取評(píng)分平均值,更新原有的聚類中心,重復(fù)本步驟直至聚類中心的評(píng)分值不再變化;
3.3)提取k個(gè)聚類中心,形成k個(gè)虛擬用戶,構(gòu)建k行m列的“虛擬用戶-項(xiàng)目”評(píng)分矩陣。
進(jìn)一步的,所述步驟4)中的基于“虛擬用戶-項(xiàng)目”評(píng)分矩陣產(chǎn)生商品推薦集,具體步驟是:
4.1)利用步驟3.1)中的歐式距離度量公式計(jì)算目標(biāo)用戶與每一個(gè)虛擬用戶的距離,找到與目標(biāo)用戶最近的虛擬用戶,將該虛擬用戶所在的聚類簇作為目標(biāo)用戶的鄰居集合;
4.2)設(shè)目標(biāo)用戶ui與鄰居集合中的用戶uj共同評(píng)分過的商品項(xiàng)目集合用Iij表示,采用Pearson相關(guān)系數(shù)計(jì)算目標(biāo)用戶與鄰居集合中的用戶之間的相似性:
其中表示目標(biāo)用戶ui對項(xiàng)目c的評(píng)分,表示用戶uj對項(xiàng)目c的評(píng)分,表示目標(biāo)用戶ui對所有項(xiàng)目的平均評(píng)分,表示用戶uj對所有項(xiàng)目的平均評(píng)分;
4.3)根據(jù)相似性高低選取前t個(gè)鄰居組成最近鄰居集NNu,根據(jù)最近鄰居集中的用戶偏來計(jì)算目標(biāo)用戶對商品項(xiàng)目的興趣度:
其中表示目標(biāo)用戶ui對項(xiàng)i的預(yù)測評(píng)分,sim(ui,uj)表示目標(biāo)用戶ui與用戶uj的相似性,表示用戶uj對項(xiàng)i的評(píng)分,表示目標(biāo)用戶ui對所有項(xiàng)的評(píng)分,表示用戶uj對所有項(xiàng)的評(píng)分;
4.4)對目標(biāo)用戶ui,從該用戶從未購買過的商品集合中選取最大的N個(gè)商品推薦給該用戶。
進(jìn)一步的,所述步驟5)中構(gòu)建用戶特征向量,具體步驟是:
5.1)于客戶端上收集用戶的注冊信息,包括年齡、性別和對各類與生活密切相關(guān)商品或服務(wù)項(xiàng)目,這些信息統(tǒng)稱為用戶的特征信息;
5.2)量化用戶的特征信息,針對每一項(xiàng)特征的特性設(shè)置合理的取值;
5.3)構(gòu)建用戶特征向量U={C1,C2,C3,…,Cn},其中的元素分別代表年齡、性別以及各類商品項(xiàng)目的愛好程度值。
進(jìn)一步的,所述步驟6)中生成用戶特征聚類簇,具體步驟是:
6.1)基于所有的用戶特征向量組成的用戶特征矩陣,隨機(jī)抽取k個(gè)用戶作為初始特征聚類中心C={c1,c2,…,cj,…,ck},計(jì)算所有用戶與初始特征聚類中心的歐式距離:
其中,d(ui,cj)表示目標(biāo)用戶ui和特征聚類中心cj的歐式距離,表示目標(biāo)用戶ui的特征向量,表示特征聚類中心cj的特征向量;
6.2)依據(jù)距離最小原則,將所有的用戶分配到對應(yīng)的聚類簇中,然后對每個(gè)簇中的所有用戶的每一項(xiàng)特征求取平均值,更新原有的聚類中心,重復(fù)本步驟直至聚類中心的特征值不再變化,由此生成用戶特征聚類簇。
進(jìn)一步的,所述步驟7)的生成約伴推薦集,具體步驟是:
7.1)判斷推薦的商品項(xiàng)目是否可約伴同行,若是,則繼續(xù)下面的具體步驟,否則結(jié)束;
7.2)利用步驟6.1)的歐式距離度量公式計(jì)算目標(biāo)用戶與每個(gè)聚類中心的距離,找到所屬的特征聚類簇ci;
7.3)計(jì)算目標(biāo)用戶ui的最近鄰居集合與所屬的特征聚類簇的交集:u=NNu∩ci;
其中,NNu表示目標(biāo)用戶最近鄰居集合,ci表示目標(biāo)用戶所屬的特征聚類簇,u即為生成的約伴推薦集。
本發(fā)明的有益效果在于:利用智慧社區(qū)環(huán)境下能夠給用戶提供日常生活密切相關(guān)的商品和服務(wù)的特點(diǎn),全面采集用戶對這些商品和服務(wù)表現(xiàn)出興趣的瀏覽行為,根據(jù)社區(qū)內(nèi)用戶的消費(fèi)習(xí)慣和消費(fèi)需求,推出個(gè)性化的商品信息推薦。
針對社區(qū)居民固定的生活環(huán)境及長期固定的社會(huì)關(guān)系,在做出商品信息推薦的同時(shí)也能進(jìn)行約伴信息推薦,讓社區(qū)內(nèi)有相同興趣的居民可以結(jié)伴外出享受社區(qū)周邊的娛樂,增加鄰里之間的交流,改善鄰居間的關(guān)系。
充分利用智慧社區(qū)內(nèi)消費(fèi)群體規(guī)模較小、商品范圍明確等優(yōu)勢,于客戶端上對用戶的各項(xiàng)表現(xiàn)出興趣的瀏覽行為進(jìn)行采集并做出預(yù)處理,很大程度上減輕服務(wù)端運(yùn)行的壓力。
附圖說明
為了使本發(fā)明的目的、技術(shù)方案和有益效果更加清楚,本發(fā)明提供如下附圖進(jìn)行說明:
圖1為本發(fā)明的方法流程圖。
圖2為本發(fā)明數(shù)據(jù)預(yù)處理流程圖。
具體實(shí)施方式
下面將結(jié)合附圖,對本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)的描述。
參照圖1,即本發(fā)明的方法流程圖,本發(fā)明一種面向智慧社區(qū)的電子商務(wù)信息推薦方法是基于移動(dòng)客戶端用戶的注冊信息和歷史操作行為數(shù)據(jù),進(jìn)行以下操作:
1)為了更加全面評(píng)判用戶對商品的興趣度,對用戶在移動(dòng)客戶端上的具體瀏覽行為進(jìn)行收集,并在客戶端上對這些數(shù)據(jù)進(jìn)行處理,得到用戶的隱式評(píng)分;
2)由隱式評(píng)分結(jié)合用戶主動(dòng)反饋的最終商品評(píng)分,于服務(wù)端上構(gòu)建反映用戶偏好的“用戶-商品”綜合評(píng)分矩陣;
3)基于“用戶-商品”綜合評(píng)分矩陣,依照距離最近原則對綜合評(píng)分矩陣進(jìn)行聚類,生成用戶興趣聚類簇,再為每個(gè)聚類簇生成一個(gè)虛擬用戶,由所有的虛擬用戶構(gòu)建“虛擬用戶-項(xiàng)目”評(píng)分矩陣;
4)基于“虛擬用戶-項(xiàng)目”評(píng)分矩陣,確定目標(biāo)用戶所屬聚類簇,選擇該簇作為部分鄰居生成最近鄰居集合,基于最近鄰居集合利用協(xié)同過濾方法產(chǎn)生商品推薦集;
5)對用戶填寫的注冊信息進(jìn)行收集,注冊信息包括年齡、性別和對各類與生活密切相關(guān)商品或服務(wù)的感興趣程度,構(gòu)建用戶特征向量;
6)由所有的用戶特征向量構(gòu)建用戶特征矩陣,依照距離最近原則對用戶特征矩陣進(jìn)行聚類,生成用戶特征聚類簇;
7)計(jì)算目標(biāo)用戶所在的用戶特征聚類簇與步驟4)形成的最近鄰居集合之間的交集,生成約伴推薦集。
上述七個(gè)步驟的具體實(shí)現(xiàn)方法做具體闡述如下:
一、步驟1)中的數(shù)據(jù)處理得到隱式評(píng)分,具體步驟參照圖2數(shù)據(jù)預(yù)處理流程圖,包括:
1.1)記錄用戶在移動(dòng)客戶端上的六種瀏覽行為,構(gòu)成興趣行為集合IA={A1,A2,A3,A4,A5,A6},并對這六種行為進(jìn)行合理量化。A1代表頁面瀏覽時(shí)間,以10秒的倍數(shù)記;A2記為頁面點(diǎn)擊次數(shù);A3記為頁面滑動(dòng)次數(shù);A4記為分享次數(shù);A5代表是否收藏,若收藏則說明用戶很有可能對此感興趣,記為A2與A3的總和,否則記為0;A6代表是否購買,若購買則說明用戶對此感興趣,記為A1、A2與A3的總和。將用戶的瀏覽行為記錄表示成n×6階矩陣B=(bij)n×6,其中bij表示第i條記錄中用戶第j種行為數(shù)據(jù)。
1.2)計(jì)算瀏覽行為的標(biāo)準(zhǔn)化值:其中sij為第i條記錄中第j種瀏覽行為的標(biāo)準(zhǔn)化值,max(bij)和min(bij)分別是第j項(xiàng)瀏覽行為的最大值和最小值。
1.3)計(jì)算各種瀏覽行為的信息熵值:其中N=1/ln h,h為涉及的瀏覽行為種類數(shù),并假定fij=0時(shí),fij ln fij=0。
1.4)計(jì)算各瀏覽行為的權(quán)重:且滿足
1.5)根據(jù)每一條對商品的瀏覽記錄,計(jì)算用戶對該商品的隱式評(píng)分:ra=Aj×wj。
二、步驟2)中的構(gòu)建綜合評(píng)分矩陣,具體步驟是:
2.1)設(shè)用戶主動(dòng)反饋的最終商品評(píng)分記為rb,范圍是1分-5分,用戶若無主動(dòng)反饋評(píng)分則記為1分。
2.2)計(jì)算綜合評(píng)分:r=ra×rb,其中ra為步驟1.5)計(jì)算得出的隱式評(píng)分。
2.3)構(gòu)建n行m列的綜合評(píng)分矩陣R,n為用戶數(shù)目,m的值為商品項(xiàng)目數(shù),R中的元素rij表示用戶i對商品j的綜合評(píng)分。
三、步驟3)中的構(gòu)建“虛擬用戶-項(xiàng)目”評(píng)分矩陣,具體步驟是:
3.1)在綜合評(píng)分矩陣中抽取k個(gè)用戶作為初始聚類中心CC={cc1,cc2,…,ccj,…,cck},計(jì)算所有用戶與初始聚類中心的歐式距離:
其中,d(ui,ccj)表示目標(biāo)用戶ui和聚類中心ccj的歐式距離,表示目標(biāo)用戶ui對所有商品項(xiàng)目的評(píng)分向量,表示聚類中心ccj對所有商品項(xiàng)目的評(píng)分向量;
3.2)依據(jù)距離最小原則,將所有的用戶分配到對應(yīng)的聚類簇中,然后對每個(gè)簇中的所有用戶的每個(gè)商品項(xiàng)目求取評(píng)分平均值,更新原有的聚類中心,重復(fù)本步驟直至聚類中心的評(píng)分值不再變化。
3.3提取k個(gè)聚類中心,形成k個(gè)虛擬用戶,構(gòu)建k行m列的“虛擬用戶-項(xiàng)目”評(píng)分矩陣Rv,k的值為虛擬用戶數(shù)目,m的值為商品項(xiàng)目數(shù)。
四、步驟4)中的基于“虛擬用戶-項(xiàng)目”評(píng)分矩陣產(chǎn)生商品推薦集,具體步驟是:
4.1)利用步驟3.1)的歐式距離度量公式計(jì)算目標(biāo)用戶與每一個(gè)虛擬用戶的距離,找到與目標(biāo)用戶最近的虛擬用戶,將該虛擬用戶所在的聚類簇作為目標(biāo)用戶的鄰居集合。
4.2)設(shè)目標(biāo)用戶ui與鄰居集合中的用戶uj共同評(píng)分過的商品項(xiàng)目集合用Iij表示,采用Pearson相關(guān)系數(shù)計(jì)算目標(biāo)用戶與鄰居集合中的用戶之間的相似性:
其中表示目標(biāo)用戶ui對項(xiàng)目c的評(píng)分,表示用戶uj對項(xiàng)目c的評(píng)分,表示目標(biāo)用戶ui對所有項(xiàng)目的平均評(píng)分,表示用戶uj對所有項(xiàng)目的平均評(píng)分;
4.3根據(jù)相似性高低選取前t個(gè)鄰居組成最近鄰居集NNu,根據(jù)最近鄰居集中的用戶偏好來計(jì)算目標(biāo)用戶對商品項(xiàng)目的興趣度:
其中表示目標(biāo)用戶ui對項(xiàng)i的預(yù)測評(píng)分,sim(ui,uj)表示目標(biāo)用戶ui與用戶uj的相似性,表示用戶uj對項(xiàng)i的評(píng)分,表示目標(biāo)用戶ui對所有項(xiàng)的評(píng)分,表示用戶uj對所有項(xiàng)的評(píng)分;
4.4)對目標(biāo)用戶ui,從該用戶從未購買過的商品集合中選取最大的N個(gè)商品推薦給該用戶。
五、步驟5)中構(gòu)建用戶特征向量,具體步驟是:
5.1)于移動(dòng)客戶端收集用戶的注冊信息,包括年齡、性別和對各類與生活密切相關(guān)商品或服務(wù)項(xiàng)目如電影、音樂、圖書、運(yùn)動(dòng)等的感興趣程度,這些信息統(tǒng)稱為用戶的特征信息。
5.2)量化用戶的特征信息,對每一項(xiàng)特征進(jìn)行分級(jí),范圍為1分至10分。對于年齡,15歲為1分,年齡每大5歲增加1分,60歲及以上分?jǐn)?shù)一樣均為10分;對于性別,為增加區(qū)別性,女性設(shè)為5分,男性設(shè)為10分;對各類與生活密切相關(guān)商品或服務(wù)項(xiàng)目的感興趣程度等級(jí)由低到高依次為不喜歡記為0分,一般記為3分,喜歡記為6分,非常喜歡記為9分。
5.3)構(gòu)建用戶特征向量U={C1,C2,C3,…,Cn},其中的元素分別代表年齡、性別以及各類商品項(xiàng)目的愛好程度值。
六、步驟6)中生成用戶特征聚類簇,具體步驟是:
6.1)基于所有的用戶特征向量組成的用戶特征矩陣,隨機(jī)抽取k個(gè)用戶作為初始特征聚類中心C={c1,c2,…,cj,…,ck},計(jì)算所有用戶與初始特征聚類中心的歐式距離:
其中,d(ui,cj)表示用戶ui和特征聚類中心cj的歐式距離,表示用戶ui的特征向量,表示特征聚類中心cj的特征向量。
6.2)依據(jù)距離最小原則,將所有的用戶分配到對應(yīng)的聚類簇中,然后對每個(gè)簇中的所有用戶的每一項(xiàng)特征求取平均值,更新原有的聚類中心,重復(fù)本步驟直至聚類中心的特征值不再變化,由此生成用戶特征聚類簇。
七、步驟7)的生成約伴推薦集,具體步驟是:
7.1)判斷推薦的商品項(xiàng)目是否可約伴同行,若是,則繼續(xù)下面的具體步驟,否則省略步驟7)。
7.2)利用步驟6.1的歐式距離度量公式計(jì)算目標(biāo)用戶與每個(gè)聚類中心的距離,找到所屬的特征聚類簇ci。
7.3)計(jì)算目標(biāo)用戶的最近鄰居集合與所屬的特征聚類簇的交集:
u=NNu∩ci
其中,NNu表示目標(biāo)用戶最近鄰居集合,ci表示目標(biāo)用戶所屬的特征聚類簇。u即為生成的約伴推薦集。
最后說明的是,以上優(yōu)選實(shí)施例僅用以說明本發(fā)明的技術(shù)方案而非限制,盡管通過上述優(yōu)選實(shí)施例已經(jīng)對本發(fā)明進(jìn)行了詳細(xì)的描述,但本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,可以在形式上和細(xì)節(jié)上對其作出各種各樣的改變,而不偏離本發(fā)明權(quán)利要求書所限定的范圍。