一種向目標(biāo)用戶推薦商品的方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及向目標(biāo)用戶推薦商品的方法和系統(tǒng)。
【背景技術(shù)】
[0002] 在現(xiàn)有技術(shù)中,可以根據(jù)用戶的購(gòu)物偏好來(lái)通過(guò)例如互聯(lián)網(wǎng)向用戶推薦商品。然 而,對(duì)于初次使用購(gòu)物網(wǎng)站、或者網(wǎng)上商戶進(jìn)行購(gòu)物的用戶來(lái)說(shuō),由于提供商品的計(jì)算機(jī)系 統(tǒng)不知曉用戶的購(gòu)物偏好,因此難以向用戶進(jìn)行推薦。
[0003] 目前已知的方案中,可以通過(guò)以下手段獲取用戶的購(gòu)物偏好:例如以平均或者隨 機(jī)的方式設(shè)置用戶的購(gòu)物偏好,又例如根據(jù)用戶的在系統(tǒng)中的注冊(cè)信息(諸如性別、年齡、 職業(yè)、居住地)來(lái)預(yù)測(cè)用戶的購(gòu)物偏好,又例如根據(jù)與該用戶相關(guān)的外部數(shù)據(jù)源(例如,該用 戶在其它購(gòu)物網(wǎng)站的歷史行為)分析其購(gòu)物偏好。
[0004] 然而,上述通過(guò)已知手段構(gòu)建購(gòu)物偏好往往準(zhǔn)確率較低、使用計(jì)算機(jī)資源較多、用 戶配合度較低、或者需要麻煩地與第三方進(jìn)行合作。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明公開,向目標(biāo)用戶推薦商品的方法,包括: 步驟101 :將第一批用戶的瀏覽日志作為訓(xùn)練數(shù)據(jù),分析第一批用戶的瀏覽日志,并對(duì) 第一批用戶進(jìn)行聚類,得到多個(gè)用戶類別, 步驟102 :計(jì)算商品對(duì)于第一批用戶的區(qū)分度, 步驟103 :將區(qū)分度高的商品推薦給目標(biāo)用戶。
[0006] 在步驟101中: 第一批用戶的瀏覽日志的記錄可以包括:IP地址、URL地址、時(shí)間和用戶ID。
[0007] 合并相同IP地址的記錄,并過(guò)濾距離當(dāng)前時(shí)間超過(guò)時(shí)間段T的瀏覽日志來(lái)形成訓(xùn) 練數(shù)據(jù)。
[0008] 建立用戶和商品類別對(duì)應(yīng)關(guān)系表,使得用戶ID對(duì)應(yīng)該用戶瀏覽過(guò)的商品類別的 序列。
[0009] 計(jì)算每個(gè)用戶的商品類別序列中的商品類別個(gè)數(shù),并作余弦歸一化,使數(shù)據(jù)映射 到〇至1的范圍內(nèi),以用于建立用戶矩陣C。
[0010] 基于建立的用戶矩陣C,采用K-Means方法進(jìn)行多次聚類得到用戶數(shù)據(jù)聚類中心 集合Cen和各個(gè)聚類類別的用戶類別集合Uset= {Uu U2, U3,…,UK}。還可以選取損失 值最小的聚類作為最后聚類結(jié)果。
[0011] 在步驟102中: 計(jì)算商品對(duì)于第一批用戶的區(qū)分度。這里,商品X的區(qū)分度In(x)可以根據(jù)用戶類別 的可預(yù)測(cè)性H(U)、根據(jù)第一批用戶的反饋計(jì)算的用戶類別的可預(yù)測(cè)性H(U|X)、商品的流行 度來(lái)計(jì)算Pop 00。
[0012] 在本發(fā)明的一個(gè)或多個(gè)實(shí)施例中,向目標(biāo)用戶推薦商品的方法還可以包括: 步驟201 :從目標(biāo)用戶獲取反饋,并且根據(jù)該反饋向目標(biāo)用戶推薦商品,其中,將與該 反饋一致的第一批用戶中的第二批用戶的瀏覽日志作為訓(xùn)練數(shù)據(jù),分析第二批用戶的瀏覽 日志,并對(duì)第二批用戶進(jìn)行聚類,得到多個(gè)用戶類別。
[0013] 步驟202:計(jì)算商品對(duì)于第二批用戶的區(qū)分度,并將區(qū)分度高的商品推薦給目標(biāo) 用戶。
[0014] 在本發(fā)明的一個(gè)或多個(gè)實(shí)施例中,向目標(biāo)用戶推薦商品的方法還可以包括: 步驟301 :從目標(biāo)用戶獲取反饋,并且根據(jù)該反饋查找與目標(biāo)用戶相似度高的用戶。相 似度計(jì)算方法可以是目標(biāo)用戶和訓(xùn)練數(shù)據(jù)中的用戶對(duì)于相同商品反饋結(jié)果的比例。
[0015] 步驟302:根據(jù)所述與目標(biāo)用戶相似度高的用戶的用戶類別判斷目標(biāo)用戶的用戶 類別。
[0016] 步驟303 :根據(jù)確定的目標(biāo)用戶的用戶類別來(lái)向目標(biāo)用戶推薦商品。例如,將該用 戶類別的所有用戶的購(gòu)買比例最高的商品推薦給目標(biāo)用戶。
[0017] 本發(fā)明還公開一種向目標(biāo)用戶推薦商品的系統(tǒng),包括: 第一裝置,將第一批用戶的瀏覽日志作為訓(xùn)練數(shù)據(jù),分析第一批用戶的瀏覽日志,并對(duì) 第一批用戶進(jìn)行聚類,得到多個(gè)用戶類別, 第二裝置,計(jì)算商品對(duì)于第一批用戶的區(qū)分度, 第三裝置,將區(qū)分度高的商品推薦給目標(biāo)用戶。
[0018] 向目標(biāo)用戶推薦商品的系統(tǒng)還可以包括: 第四裝置,從目標(biāo)用戶獲取反饋,并且根據(jù)該反饋向目標(biāo)用戶推薦商品,其中,將與該 反饋一致的第一批用戶中的第二批用戶的瀏覽日志作為訓(xùn)練數(shù)據(jù),分析第二批用戶的瀏覽 日志,并對(duì)第二批用戶進(jìn)行聚類,得到多個(gè)用戶類別, 第五裝置,計(jì)算商品對(duì)于第二批用戶的區(qū)分度,并將區(qū)分度高的商品推薦給目標(biāo)用戶。 [0019] 向目標(biāo)用戶推薦商品的系統(tǒng)還可以包括: 第六裝置,從目標(biāo)用戶獲取反饋,并且根據(jù)該反饋查找與目標(biāo)用戶相似度高的用戶,以 及 第七裝置,根據(jù)所述與目標(biāo)用戶相似度高的用戶的用戶類別判斷目標(biāo)用戶的用戶類 別, 第八裝置,根據(jù)確定的目標(biāo)用戶的用戶類別來(lái)向目標(biāo)用戶推薦商品。
【附圖說(shuō)明】
[0020] 在參照附圖閱讀了本發(fā)明的【具體實(shí)施方式】以后,本領(lǐng)域技術(shù)人員將會(huì)更清楚地了 解本發(fā)明。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解的是,附圖僅僅用于配合【具體實(shí)施方式】說(shuō)明本發(fā)明的 技術(shù)方案,而并非意在對(duì)本發(fā)明的保護(hù)范圍構(gòu)成限制。
[0021] 圖1是根據(jù)本發(fā)明實(shí)施例的向目標(biāo)用戶推薦商品的方法的步驟示意圖。
[0022] 圖2是根據(jù)本發(fā)明實(shí)施例的一種反饋交互式的商品推薦引導(dǎo)方法示意圖。
[0023] 圖3是根據(jù)本發(fā)明實(shí)施例的一種反饋交互式的商品推薦引導(dǎo)的總體流程示意圖。
【具體實(shí)施方式】
[0024] 下面參照附圖,對(duì)本發(fā)明的【具體實(shí)施方式】作進(jìn)一步的詳細(xì)描述。應(yīng)當(dāng)理解的是,可 對(duì)所描述的實(shí)施例進(jìn)行結(jié)構(gòu)的和功能的修改。另外,可針對(duì)任何給定的或特定的應(yīng)用所期 望和有利的那樣,一個(gè)實(shí)施例的一個(gè)或多個(gè)特征可以與另一個(gè)實(shí)施例的一個(gè)或多個(gè)特征相 組合。
[0025] 圖1是向目標(biāo)用戶推薦商品的方法的步驟示意圖。如圖所示,向目標(biāo)用戶推薦商 品的方法,包括: 步驟101 :將第一批用戶的瀏覽日志作為訓(xùn)練數(shù)據(jù),分析第一批用戶的瀏覽日志,并對(duì) 第一批用戶進(jìn)行聚類,得到多個(gè)用戶類別, 步驟102 :計(jì)算商品對(duì)于第一批用戶的區(qū)分度, 步驟103 :將區(qū)分度高的商品推薦給目標(biāo)用戶。
[0026] 如上所述,在步驟101中,第一批用戶進(jìn)行聚類,以下描述示例性的過(guò)程。
[0027] 第一批用戶的瀏覽日志的記錄可以包括:IP地址、URL地址、時(shí)間和用戶ID。可以 合并相同IP地址的記錄,并過(guò)濾距離當(dāng)前時(shí)間超過(guò)時(shí)間段T的瀏覽日志來(lái)形成訓(xùn)練數(shù)據(jù)。 這里,參數(shù)變量T可以預(yù)先被設(shè)置,T越小,則過(guò)濾的瀏覽日志距離當(dāng)前時(shí)間越近,符合條件 的記錄數(shù)量越少。
[0028] 隨后,可以建立用戶和商品類別對(duì)應(yīng)關(guān)系表。例如,用戶ID對(duì)應(yīng)該用戶瀏覽過(guò)的 商品類別的序列。例如,用戶u的瀏覽過(guò)的商品類別序列N(u) = {a,b,b,…},即用戶 的行為數(shù)據(jù)。
[0029] 計(jì)算每個(gè)用戶的商品類別序列中的商品類別個(gè)數(shù),并作余弦歸一化,使數(shù)據(jù)映射 到〇至1的范圍內(nèi),以用于建立用戶矩陣C。例如,用戶u的瀏覽過(guò)的商品類別序列N(u)= {a,b,b,c},那么統(tǒng)計(jì)商品類別個(gè)數(shù)得到{a=l,b=2,c=l},然后進(jìn)行歸一化得到:
[0030] 如上所述,歸一化的結(jié)果被用于建立用戶矩陣C。其中,矩陣C中成員C[u][v]= N(u) · N(v)|,即向量N(u)點(diǎn)乘向量N(v),該數(shù)值表示用戶u和v (例如ID為u和v的 用戶)所瀏覽頁(yè)面集合之間的商品類別相似度,C[u] [v]值域?yàn)?至1。C[u] [v]越大,表示 用戶u和V瀏覽相同商品類別的頁(yè)面越多。如果C[u] [V] = 0,則表示N(u)和N(v)在向量 空間內(nèi)垂直,即用戶u和ν沒(méi)有瀏覽過(guò)同一類別的商品。如果C[u][v] = 1,表示用戶u和 v瀏覽的商品類別完全相同。
[0031] 基于建立的用戶矩陣C,本領(lǐng)域技術(shù)人員可以理解,能夠采用K-Means方法進(jìn)行 多次聚類。在聚類過(guò)程中,使用用戶矩陣C中對(duì)應(yīng)成員的數(shù)值作為用戶之間的相似度。 K-Means的參數(shù)包括聚類個(gè)數(shù)k、已瀏覽的