本發(fā)明涉及信息技術領域,特別是涉及一種電商平臺長尾服務推薦方法和系統(tǒng)。
背景技術:
電子商務是一種消費者與商戶之間通過因特網(wǎng)實現(xiàn)商務活動、交易活動、金融活動和相關的綜合服務活動的一種新型商業(yè)運營模式。隨著信息科技的發(fā)展,電子商務的電商平臺也越來越多。電商平臺上包括的服務種類繁多,比如電影、美食、服裝、飾品等,為了便于用戶選擇,電商平臺通常會使用推薦系統(tǒng)向用戶推薦服務。根據(jù)服務的流行度,可以將電商平臺的服務分別流行服務和長尾服務,流行服務指流行度高、購買人數(shù)多的服務,長尾服務值流行度低、購買人數(shù)少的服務。
傳統(tǒng)的推薦系統(tǒng)采用的推薦方法主要為主流推薦算法,將流行服務加入推薦列表推薦給用戶,而對于長尾服務則很難進入現(xiàn)有的推薦方法所生成的推薦列表,很容易導致流行服務一直被推薦,而長尾服務一直不被推薦。這種推薦方式對用戶的需求考慮較少,使得對長尾服務有需求的用戶很難找到自己感興趣的內容,推薦效果差。
技術實現(xiàn)要素:
基于此,有必要針對上述問題,提供一種提高推薦效果的電商平臺長尾服務推薦方法和系統(tǒng)。
一種電商平臺長尾服務推薦方法,包括:
獲取電商平臺多個服務中的流行服務和長尾服務,獲取所述長尾服務中的待推薦服務,查找有對所述待推薦服務進行評分的所述電商平臺的賬戶并作為基礎賬戶,將所述電商平臺的賬戶中除所述基礎賬戶之外的賬戶作為備選賬戶,并將所述基礎賬戶與多個備選賬戶進行兩兩匹配得到多種賬戶組合;
從所述流行服務中選取被同一賬戶組合中的基礎賬戶與備選賬戶共同評分的流行服務,得到對應賬戶組合的公共流行服務,從所述長尾服務中選取被同一賬戶組合中的基礎賬戶與備選賬戶共同評分的長尾服務,得到對應賬戶組合的公共長尾服務;
獲取所述基礎賬戶和所述備選賬戶分別對各公共流行服務和各公共長尾服務進行評分的評分值、所述基礎賬戶對所有服務進行評分的平均值得到基礎平均值、所述備選賬戶對所有服務進行評分的平均值得到備選平均值;
根據(jù)所述基礎賬戶對各公共流行服務進行評分的評分值、所述備選賬戶對各公共流行服務進行評分的評分值、所述基礎平均值、所述備選平均值、所述基礎賬戶對各公共長尾服務進行評分的評分值、所述備選賬戶對各公共長尾服務進行評分的評分值、第一預設權重和第二預設權重,分別獲取各賬戶組合中基礎賬戶與備選賬戶之間的評分相似度;
獲取所述基礎賬戶對電商平臺的各服務類別進行評分的評分次數(shù)、所述備選賬戶對各服務類別進行評分的評分次數(shù)、所述服務類別的總數(shù)目;
根據(jù)所述基礎賬戶對各服務類別進行評分的評分次數(shù)、所述備選賬戶對各服務類別進行評分的評分次數(shù)和所述總數(shù)目,分別獲取各賬戶組合中基礎賬戶與備選賬戶之間的偏好相似度;
獲取賬戶-服務評分矩陣,根據(jù)預設的潛在特征數(shù)對所述賬戶-服務評分矩陣進行矩陣分解,得到潛在用戶特征矩陣,并從所述潛在用戶特征矩陣中選取所述基礎賬戶的潛在特征向量和所述備選賬戶的潛在特征向量;
根據(jù)所述基礎賬戶的潛在特征向量和所述備選賬戶的潛在特征向量,分別獲取各賬戶組合中基礎賬戶與備選賬戶之間的隱特征相似度;
根據(jù)所述備選賬戶與所述基礎賬戶之間的評分相似度、偏好相似度和隱特征相似度,從多個備選賬戶中選取預設個數(shù)的備選賬戶作為推薦賬戶,并將所述待推薦服務推薦給所述推薦賬戶。
一種電商平臺長尾服務推薦系統(tǒng),包括:
組合賬戶模塊,用于獲取電商平臺多個服務中的流行服務和長尾服務,獲取所述長尾服務中的待推薦服務,查找有對所述待推薦服務進行評分的所述電商平臺的賬戶并作為基礎賬戶,將所述電商平臺的賬戶中除所述基礎賬戶之外的賬戶作為備選賬戶,并將所述基礎賬戶與多個備選賬戶進行兩兩匹配得到多種賬戶組合;
公共服務分析模塊,用于從所述流行服務中選取被同一賬戶組合中的基礎賬戶與備選賬戶共同評分的流行服務,得到對應賬戶組合的公共流行服務,從所述長尾服務中選取被同一賬戶組合中的基礎賬戶與備選賬戶共同評分的長尾服務,得到對應賬戶組合的公共長尾服務;
評分數(shù)據(jù)獲取模塊,用于獲取所述基礎賬戶和所述備選賬戶分別對各公共流行服務和各公共長尾服務進行評分的評分值、所述基礎賬戶對所有服務進行評分的平均值得到基礎平均值、所述備選賬戶對所有服務進行評分的平均值得到備選平均值;
評分相似度計算模塊,用于根據(jù)所述基礎賬戶對各公共流行服務進行評分的評分值、所述備選賬戶對各公共流行服務進行評分的評分值、所述基礎平均值、所述備選平均值、所述基礎賬戶對各公共長尾服務進行評分的評分值、所述備選賬戶對各公共長尾服務進行評分的評分值、第一預設權重和第二預設權重,分別獲取各賬戶組合中基礎賬戶與備選賬戶之間的評分相似度;
服務類別分析模塊,用于獲取所述基礎賬戶對電商平臺的各服務類別進行評分的評分次數(shù)、所述備選賬戶對各服務類別進行評分的評分次數(shù)、所述服務類別的總數(shù)目;
偏好相似度計算模塊,用于根據(jù)所述基礎賬戶對各服務類別進行評分的評分次數(shù)、所述備選賬戶對各服務類別進行評分的評分次數(shù)和所述總數(shù)目,分別獲取各賬戶組合中基礎賬戶與備選賬戶之間的偏好相似度;
矩陣分解模塊,用于獲取賬戶-服務評分矩陣,根據(jù)預設的潛在特征數(shù)對所述賬戶-服務評分矩陣進行矩陣分解,得到潛在用戶特征矩陣,并從所述潛在用戶特征矩陣中選取所述基礎賬戶的潛在特征向量和所述備選賬戶的潛在特征向量;
隱特征相似度計算模塊,用于根據(jù)所述基礎賬戶的潛在特征向量和所述備選賬戶的潛在特征向量,分別獲取各賬戶組合中基礎賬戶與備選賬戶之間的隱特征相似度;
服務推薦模塊,用于根據(jù)所述備選賬戶與所述基礎賬戶之間的評分相似度、偏好相似度和隱特征相似度,從多個備選賬戶中選取預設個數(shù)的備選賬戶作為推薦賬戶,并將所述待推薦服務推薦給所述推薦賬戶。
上述電商平臺服務推薦方法和系統(tǒng),通過獲取長尾服務中的待推薦服務,根據(jù)推薦服務將賬戶分為基礎賬戶和備選賬戶;然后根據(jù)各基礎賬戶和備選賬戶對公共流行服務的評分值、對公共長尾服務的評分值、基礎平均值、備選平均值、第一預設權重和第二預設權重獲取評分相似度,評分相似度可從對服務的評分上體現(xiàn)基礎賬戶與備選賬戶的相似性;根據(jù)各基礎賬戶和備選賬戶分別對服務類別的評分次數(shù)和服務類別的總數(shù)目獲取偏好相似度,偏好相似度可從類別偏好上體現(xiàn)基礎賬戶與備選賬戶的相似性;根據(jù)賬戶-服務評分矩陣獲取各基礎賬戶和備選賬戶之間的隱特征相似度,隱特征相似度可從內在興趣偏好方面體現(xiàn)基礎賬戶與備選賬戶之間的相似性。最后根據(jù)評分相似度、偏好相似度和隱特征相似度考慮,從多個備選賬戶中選取預設個數(shù)的備選賬戶作為推薦賬戶,將待推薦服務推薦給推薦賬戶。如此,通過融合三種相似度,從多方面考慮備選賬戶與基礎賬戶之間的相似性,從而從備選賬戶中選取推薦賬戶進行待推薦服務的推薦,將待推薦服務推薦給真正需要的賬戶,推薦效果好,推薦轉化率高。
附圖說明
圖1為一實施例中電商平臺長尾服務推薦方法圖;
圖2為一實施例中電商平臺長尾服務推薦系統(tǒng)的模塊框圖;
圖3為一應用例中電商平臺長尾服務推薦方法、概率矩陣分解推薦方法和協(xié)同過濾法推薦方法的推薦轉化率對比圖。
具體實施方式
參考圖1,為一實施例中的電商平臺長尾服務推薦方法,包括如下步驟。
S110:獲取電商平臺多個服務中的流行服務和長尾服務,獲取長尾服務中的待推薦服務,查找有對待推薦服務進行評分的電商平臺的賬戶并作為基礎賬戶,將電商平臺的賬戶中除基礎賬戶之外的賬戶作為備選賬戶,并將基礎賬戶與多個備選賬戶進行兩兩匹配得到多種賬戶組合。
電商平臺的服務指電商平臺上可供消費者購買的項目,包括電影、美食、飾品、服裝等。長尾服務指被購買次數(shù)較少、流行度較低、需要被推薦的服務,是預先設置的。待推薦服務從長尾服務中選出。電商平臺的賬戶指消費者在電商平臺注冊的用戶信息。電商平臺通常包括多個服務和多個賬戶,消費者可通過注冊的賬戶對購買過的服務進行評分,對應為該賬戶對購買過的服務進行評分。
通過將有對待推薦服務進行評分的賬戶作為基礎賬戶,其余的賬戶作為備選賬戶,將賬戶分為兩類?;A賬戶的數(shù)量可以是一個,也可以是多個,備選賬戶的數(shù)量為多個?;A賬戶與備選賬戶匹配得到賬戶組合,每一個賬戶組合中包括一個基礎賬戶和一個備選賬戶。例如,基礎賬戶包括a1、a2、a3,備選賬戶包括b1、b2、b3,則得到的多個賬戶組合為:(a1,b1)、(a1,b2)、(a1,b3)、(a2,b1)、(a2,b2)、(a2,b3)、(a3,b1)、(a3,b2)、(a3,b3)。
S120:從流行服務中選取被同一賬戶組合中的基礎賬戶與備選賬戶共同評分的流行服務,得到對應賬戶組合的公共流行服務;從長尾服務中選取被同一賬戶組合中的基礎賬戶與備選賬戶共同評分的長尾服務,得到對應賬戶組合的公共長尾服務。
S130:獲取基礎賬戶和備選賬戶分別對各公共流行服務和各公共長尾服務進行評分的評分值、基礎賬戶對所有服務進行評分的平均值得到基礎平均值、備選賬戶對所有服務進行評分的平均值得到備選平均值。
基礎賬戶和備選賬戶對服務進行評分后,對應有一個評分值,基礎賬戶和備選賬戶對各服務進行評分的評分值可以從數(shù)據(jù)庫獲取?;A平均值為基礎賬戶對所有服務的評分值的平均值,可以根據(jù)基礎賬戶對所有服務進行評分的平均值求平均得到。備選平均值為備選賬戶對所有服務進行評分的平均值,可以根據(jù)備選賬戶對所有服務進行評分的評分值求平均得到。
S140:根據(jù)基礎賬戶對各公共流行服務進行評分的評分值、備選賬戶對各公共流行服務進行評分的評分值、基礎平均值、備選平均值、基礎賬戶對各公共長尾服務進行評分的評分值、備選賬戶對各公共長尾服務進行評分的評分值、第一預設權重和第二預設權重,分別獲取各賬戶組合中基礎賬戶與備選賬戶之間的評分相似度。
每一個賬戶組合中的基礎賬戶與備選賬戶之間對應有一個評分相似度,即一個賬戶組合對應一個評分相似度,不同的賬戶組合對應的評分相似度可能不同。因此,步驟S140需要對每一個賬戶組合均要計算評分相似度,具體為:根據(jù)同一賬戶組合中的基礎賬戶和備選賬戶分別對各公共流行服務進行評分的評分值、對各公共流行服務進行評分的評分值、對各公共長尾服務進行評分的評分值、對各公共長尾服務進行評分的評分值、基礎平均值、備選平均值、第一預設權重和第二預設權重,得到對應賬戶組合的評分相似度。具體地,第一預設權重和第二預設權重之和為1。
由于公共流行服務和公共長尾服務為基礎賬戶與備選賬戶共同評分的服務,通過基于基礎賬戶與備選賬戶之間的共同評分的服務來計算用戶評分相似度時,可以從對服務的評分上分析基礎賬戶與備選賬戶的相似性。
在一實施例中,步驟S140包括:采用Pearson相關系數(shù),根據(jù)基礎賬戶對各公共流行服務進行評分的評分值、備選賬戶對各公共流行服務進行評分的評分值、基礎平均值和備選平均值,計算得到同一賬戶組合中基礎賬戶與備選賬戶的第一相似度;采用余弦相似度算法,根據(jù)基礎賬戶對各公共長尾服務進行評分的評分值和備選賬戶對各公共長尾服務進行評分的評分值,計算得到同一賬戶組合中基礎賬戶與備選賬戶的第二相似度;根據(jù)第一預設權重和第二預設權重將第一相似度和第二相似度的加權和作為同一賬戶組合中基礎賬戶與備選賬戶的評分相似度。
對于公共長尾服務,由于評分次數(shù)比較少,比較適合采用余弦相似度算法計算相似度,因此通過對公共流行服務和公共長尾服務采用不同的計算方法分別求得相似度,再綜合第一預設權重和第二預設權重計算得到評分相似度,可提高相似度計算的準確性。
本實施例中,步驟S140包括:
其中,a為第一預設權重,b為第二預設權重,u為基礎賬戶的序號,v為備選賬戶的序號,i為流行服務的序號,j為長尾服務的序號,rui為第u個基礎賬戶對第i個流行服務的評分值,rvi為第v個備選賬戶對第i個流行服務的評分值,ruj為第u個基礎賬戶對第j個長尾服務的評分值,rvj為第v個備選賬戶對第j個長尾服務的評分值,為第u個基礎賬戶的基礎平均值,為第v個備選賬戶的基礎平均值,L1uv為流行服務的序號集合,L2uv為長尾服務的序號集合,psim(u,v)為第u個基礎賬戶與第v個備選賬戶之間的評分相似度。
S150:獲取基礎賬戶對電商平臺的各服務類別進行評分的評分次數(shù)、備選賬戶對各服務類別進行評分的評分次數(shù)、服務類別的總數(shù)目。
服務類別為根據(jù)服務的屬性進行分類得到的類型。每一種服務可能屬于一種服務類別,也可能屬于多種服務類別,例如,電影的服務類別根據(jù)題材區(qū)分包括動作電影、戰(zhàn)爭電影等,某一個電影可能既是戰(zhàn)爭題材,又是動作電影,則該電影對應兩種服務類別?;A賬戶對某個服務類別進行評分的評分次數(shù),指基礎賬戶已評分的服務中,屬于該服務類別的服務數(shù)目,可根據(jù)基礎賬戶對服務的評分情況得到。
S160:根據(jù)基礎賬戶對各服務類別進行評分的評分次數(shù)、備選賬戶對各服務類別進行評分的評分次數(shù)和總數(shù)目,分別獲取各賬戶組合中基礎賬戶與備選賬戶之間的偏好相似度。
每一個賬戶組合中的基礎賬戶與備選賬戶之間對應有一個偏好相似度,即一個賬戶組合對應一個偏好相似度,不同的賬戶組合對應的偏好相似度可能不同。因此,步驟S160需要對每一個賬戶組合均要計算偏好相似度。通過根據(jù)基礎賬戶和備選賬戶已評分的服務以及每個服務所屬的服務類別,比較備選賬戶與基礎賬戶之間的服務類別的偏好差異,從而可以從類別偏好上分析基礎賬戶與備選賬戶的相似性。
在一實施例中,步驟S160為采用余弦相似度算法計算基礎賬戶與備選賬戶之間的偏好相似度。本實施例中,步驟S160包括:
其中,u為基礎賬戶的序號,v為備選賬戶的序號,m為服務類別的序號,s為服務類別的總數(shù)目,gum為第u個基礎賬戶對第m個服務類別進行評分的評分次數(shù),gvm為第v個備選賬戶對第m個服務類別進行評分的評分次數(shù),gsim(u,v)為第u個基礎賬戶與第v個備選賬戶之間的偏好相似度。
S170:獲取賬戶-服務評分矩陣,根據(jù)預設的潛在特征數(shù)對賬戶-服務評分矩陣進行矩陣分解,得到潛在用戶特征矩陣,并從潛在用戶特征矩陣中選取基礎賬戶的潛在特征向量和備選賬戶的潛在特征向量。
賬戶-服務評分矩陣中的元素為賬戶對服務的評分值,賬戶-服務評分矩陣可以根據(jù)各賬戶對各服務進行評分的評分值生成。潛在特征數(shù)可以根據(jù)實際需要具體設置。
例如,一實施例中,賬戶-服務評分矩陣為:
RN*M=UN*MVN*M;
其中,N表示賬戶數(shù)量,K表示潛在特征數(shù),M表示服務數(shù)量。U中單個行向量表示單個賬戶的潛在特征向量,V中單個列向量表示單個服務潛在特征向量。
S180:根據(jù)基礎賬戶的潛在特征向量和備選賬戶的潛在特征向量,分別獲取各賬戶組合中基礎賬戶與備選賬戶之間的隱特征相似度。
每一個賬戶組合中的基礎賬戶與備選賬戶之間對應有一個隱特征相似度,即一個賬戶組合對應一個隱特征相似度,不同的賬戶組合對應的隱特征相似度可能不同。因此,步驟S180需要對每一個賬戶組合均要計算隱特征相似度。通過借助矩陣分解技術處理賬戶-服務評分矩陣,得到基礎賬戶和備選賬戶的潛在特征向量,以此來計算隱特征相似度,從而可從內在興趣偏好方面分析基礎賬戶與備選賬戶之間的相似性。
在一實施例中,步驟S180包括:
其中,u為基礎賬戶的序號,v為備選賬戶的序號,Uu為第u個基礎賬戶的潛在特征向量,Uv為第v個備選賬戶的潛在特征向量,hsim(u,v)為第u個基礎賬戶與第v個備選賬戶之間的隱特征相似度。
S190:根據(jù)備選賬戶與基礎賬戶之間的評分相似度、偏好相似度和隱特征相似度,從多個備選賬戶中選取預設個數(shù)的備選賬戶作為推薦賬戶,并將待推薦服務推薦給推薦賬戶。
通過融合評分相似度、偏好相似度和隱特征相似度三個特征,從多維相似度考慮備選賬戶與基礎賬戶之間的相似性,從而從備選賬戶中選取推薦賬戶進行待推薦服務的推薦,可以確保推薦賬戶是真正對待推薦服務感興趣的賬戶。
在一實施例中,步驟S190包括步驟(a1)至步驟(a3)。
步驟(a1):根據(jù)備選賬戶與基礎賬戶之間的評分相似度、備選賬戶與基礎賬戶之間的偏好相似度、備選賬戶與基礎賬戶之間的隱特征相似度、第一預設比例、第二預設比例和第三預設比例,分別獲取各備選賬戶與各基礎賬戶之間的整體相似度。
每一個賬戶組合中的基礎賬戶與備選賬戶之間對應有一個整體相似度。具體地,第一預設比例、第二預設比例和第三預設比例之和為1。在一實施例中,步驟(a1)包括:
sim(u,v)=α*psim(u,v)+β*gsim(u,v)+γ*hsim(u,v);
其中,u為基礎賬戶的序號,v為備選賬戶的序號,psim(u,v)為第u個基礎賬戶與第v個備選賬戶之間的評分相似度,gsim(u,v)為第u個基礎賬戶與第v個備選賬戶之間的偏好相似度,hsim(u,v)為第u個基礎賬戶與第v個備選賬戶之間的隱特征相似度,α為第一預設比例,β為第二預設比例,γ為第三預設比例,sim(u,v)為第v個備選賬戶與第u個基礎賬戶之間的整體相似度。
步驟(a2):計算同一備選賬戶與各基礎賬戶之間的整體相似度之和,按照整體相似度之和從大到小的順序,選取數(shù)量為預設個數(shù)的整體相似度之和,將選取的整體相似度之和對應的備選賬戶作為推薦賬戶。
整體相似度之和根據(jù)備選賬戶與所有基礎賬戶的整體相似度求和得到,例如,基礎賬戶有三個,其中一個備選賬戶與三個基礎賬戶的整體相似度分別為A、B、C,則該備選賬戶與所有的整體相似度之和為A+B+C。整體相似度之和越大,表示備選賬戶與所有的基礎賬戶的相似性越高,對待推薦服務感興趣的可能性越大。因此,通過整體相似度按照從大到小的順序選取得到的推薦賬戶,對待推薦服務感興趣的可能性越大。
步驟(a3):將待推薦服務推薦給推薦賬戶。
通過將待推薦服務推薦給推薦賬戶,可最大程度地保證將待推薦服務推薦給真正感興趣的賬戶,推薦效果好。
在一實施例中,步驟S110之前,還包括步驟(b1)至步驟(b3)。
步驟(b1):獲取各賬戶對各服務進行評分的評分值,并根據(jù)各賬戶、各服務和對應的評分值生成評分二維表。
評分二維表用于根據(jù)評分二維表查找有對待推薦服務進行評分的賬戶、根據(jù)評分二維表獲取基礎賬戶和備選賬戶分別對各公共流行服務和各公共長尾服務進行評分的評分值、基礎賬戶對所有服務進行評分的平均值得到基礎平均值、備選賬戶對所有服務進行評分的平均值得到備選平均值,以及用于根據(jù)評分二維表生成賬戶-服務評分矩陣。因此,步驟S110可以根據(jù)評分二維表查找基礎賬戶,步驟S130可以根據(jù)評分二維表獲取基礎賬戶和備選賬戶分別對各公共流行服務和各公共長尾服務進行評分的評分值、基礎平均值和備選平均值,步驟S170可以根據(jù)評分二維表獲取賬戶-服務評分矩陣。
在一實施例中,評分二維表如表1所示。其中,I1表示第1個服務,It表示第t個服務,U1表示第1個賬戶,Uu表示第u個賬戶,r11表示第1個賬戶對第1個服務的評分值,r1t表示第1個賬戶對第t個服務的評分值,ru1表示第u個賬戶對第1個服務的評分值,rut表示第u個賬戶對第t個服務的評分值。
表1
步驟(b2):獲取多個服務對應的所有的服務類別,根據(jù)評分二維表查找各賬戶有進行評分的服務,分別根據(jù)查找到的服務所屬的服務類別獲取對應的賬戶對服務類別進行評分的評分次數(shù)。
步驟(b3):根據(jù)各賬戶、各服務類別和對應的評分次數(shù)生成評分次數(shù)二維表。
在一實施例中,評分次數(shù)二維表如表2所示。其中,P1表示第1個服務類別,Pm表示第m個服務類別,U1表示第1個賬戶,Uu表示第u個賬戶,r’11表示第1個賬戶對第1個服務類別的評分次數(shù),r’1m表示第1個賬戶對第m個服務類別的評分次數(shù),r’u1表示第u個賬戶對第1個服務類別的評分次數(shù),r’um表示第u個賬戶對第m個服務類別的評分次數(shù)。
表2
評分次數(shù)二維表用于根據(jù)評分次數(shù)二維表獲取基礎賬戶對電商平臺的各服務類別進行評分的評分次數(shù)、備選賬戶對各服務類別進行評分的評分次數(shù)、服務類別的總數(shù)目。因此,步驟S150中的數(shù)據(jù)可以根據(jù)評分次數(shù)二維表得到。
上述電商平臺服務推薦方法,通過獲取長尾服務中的待推薦服務,根據(jù)推薦服務將賬戶分為基礎賬戶和備選賬戶;然后根據(jù)各基礎賬戶和備選賬戶對公共流行服務的評分值、對公共長尾服務的評分值、基礎平均值、備選平均值、第一預設權重和第二預設權重獲取評分相似度,評分相似度可從對服務的評分上體現(xiàn)基礎賬戶與備選賬戶的相似性;根據(jù)各基礎賬戶和備選賬戶分別對服務類別的評分次數(shù)和服務類別的總數(shù)目獲取偏好相似度,偏好相似度可從類別偏好上體現(xiàn)基礎賬戶與備選賬戶的相似性;根據(jù)賬戶-服務評分矩陣獲取各基礎賬戶和備選賬戶之間的隱特征相似度,隱特征相似度可從內在興趣偏好方面體現(xiàn)基礎賬戶與備選賬戶之間的相似性。最后根據(jù)評分相似度、偏好相似度和隱特征相似度考慮,從多個備選賬戶中選取預設個數(shù)的備選賬戶作為推薦賬戶,將待推薦服務推薦給推薦賬戶。如此,通過融合三種相似度,從多方面考慮備選賬戶與基礎賬戶之間的相似性,從而從備選賬戶中選取推薦賬戶進行待推薦服務的推薦,將待推薦服務推薦給真正需要的賬戶,便于消費者找到真正感興趣的內容,推薦效果好,推薦轉化率高。
參考圖2,一實施例中的電商平臺服務推薦系統(tǒng),包括:組合賬戶模塊110、公共服務分析模塊120、評分數(shù)據(jù)獲取模塊130、評分相似度計算模塊140、服務類別分析模塊150、偏好相似度計算模塊160、矩陣分解模塊170、隱特征相似度計算模塊180和服務推薦模塊190。
組合賬戶模塊110用于獲取電商平臺多個服務中的流行服務和長尾服務,獲取長尾服務中的待推薦服務,查找有對待推薦服務進行評分的電商平臺的賬戶并作為基礎賬戶,將電商平臺的賬戶中除基礎賬戶之外的賬戶作為備選賬戶,并將基礎賬戶與多個備選賬戶進行兩兩匹配得到多種賬戶組合。
公共服務分析模塊120用于從流行服務中選取被同一賬戶組合中的基礎賬戶與備選賬戶共同評分的流行服務,得到對應賬戶組合的公共流行服務,從長尾服務中選取被同一賬戶組合中的基礎賬戶與備選賬戶共同評分的長尾服務,得到對應賬戶組合的公共長尾服務。
評分數(shù)據(jù)獲取模塊130用于獲取基礎賬戶和備選賬戶分別對各公共流行服務和各公共長尾服務進行評分的評分值、基礎賬戶對所有服務進行評分的平均值得到基礎平均值、備選賬戶對所有服務進行評分的平均值得到備選平均值。
評分相似度計算模塊140用于根據(jù)基礎賬戶對各公共流行服務進行評分的評分值、備選賬戶對各公共流行服務進行評分的評分值、基礎平均值、備選平均值、基礎賬戶對各公共長尾服務進行評分的評分值、備選賬戶對各公共長尾服務進行評分的評分值、第一預設權重和第二預設權重,分別獲取各賬戶組合中基礎賬戶與備選賬戶之間的評分相似度。
在一實施例中,評分相似度計算模塊140用于根據(jù):
分別獲取各賬戶組合中基礎賬戶與備選賬戶之間的評分相似度。其中,a為第一預設權重,b為第二預設權重,u為基礎賬戶的序號,v為備選賬戶的序號,i為流行服務的序號,j為長尾服務的序號,rui為第u個基礎賬戶對第i個流行服務的評分值,rvi為第v個備選賬戶對第i個流行服務的評分值,ruj為第u個基礎賬戶對第j個長尾服務的評分值,rvj為第v個備選賬戶對第j個長尾服務的評分值,為第u個基礎賬戶的基礎平均值,為第v個備選賬戶的基礎平均值,L1uv為流行服務的序號集合,L2uv為長尾服務的序號集合,psim(u,v)為第u個基礎賬戶與第v個備選賬戶之間的評分相似度。
服務類別分析模塊150用于獲取基礎賬戶對電商平臺的各服務類別進行評分的評分次數(shù)、備選賬戶對各服務類別進行評分的評分次數(shù)、服務類別的總數(shù)目。
偏好相似度計算模塊160用于根據(jù)基礎賬戶對各服務類別進行評分的評分次數(shù)、備選賬戶對各服務類別進行評分的評分次數(shù)和總數(shù)目,分別獲取各賬戶組合中基礎賬戶與備選賬戶之間的偏好相似度。
在一實施例中,偏好相似度計算模塊160用于根據(jù):
分別獲取各賬戶組合中基礎賬戶與備選賬戶之間的偏好相似度。其中,u為基礎賬戶的序號,v為備選賬戶的序號,m為服務類別的序號,s為服務類別的總數(shù)目,gum為第u個基礎賬戶對第m個服務類別進行評分的評分次數(shù),gvm為第v個備選賬戶對第m個服務類別進行評分的評分次數(shù),gsim(u,v)為第u個基礎賬戶與第v個備選賬戶之間的偏好相似度。
矩陣分解模塊170用于獲取賬戶-服務評分矩陣,根據(jù)預設的潛在特征數(shù)對所述賬戶-服務評分矩陣進行矩陣分解,得到潛在用戶特征矩陣,并從潛在用戶特征矩陣中選取基礎賬戶的潛在特征向量和備選賬戶的潛在特征向量。
隱特征相似度計算模塊180用于根據(jù)基礎賬戶的潛在特征向量和備選賬戶的潛在特征向量,分別獲取各賬戶組合中基礎賬戶與備選賬戶之間的隱特征相似度。
在一實施例中,隱特征相似度計算模塊180用于根據(jù):
分別獲取各賬戶組合中基礎賬戶與備選賬戶之間的隱特征相似度。其中,u為基礎賬戶的序號,v為備選賬戶的序號,Uu為第u個基礎賬戶的潛在特征向量,Uv為第v個備選賬戶的潛在特征向量,hsim(u,v)為第u個基礎賬戶與第v個備選賬戶之間的隱特征相似度。
服務推薦模塊190用于根據(jù)備選賬戶與基礎賬戶之間的評分相似度、偏好相似度和隱特征相似度,從多個備選賬戶中選取預設個數(shù)的備選賬戶作為推薦賬戶,并將待推薦服務推薦給推薦賬戶。
在一實施例中,服務推薦模塊190包括整體相似度計算單元(圖未示)、推薦賬戶選取單元(圖未示)和推薦單元(圖未示)。
整體相似度計算單元用于根據(jù)備選賬戶與基礎賬戶之間的評分相似度、備選賬戶與基礎賬戶之間的偏好相似度、備選賬戶與基礎賬戶之間的隱特征相似度、第一預設比例、第二預設比例和第三預設比例,分別獲取各備選賬戶與各基礎賬戶之間的整體相似度。
在一實施例中,整體相似度計算單元用于根據(jù):
sim(u,v)=α*psim(u,v)+β*gsim(u,v)+γ*hsim(u,v);
分別獲取各備選賬戶與各基礎賬戶之間的整體相似度。其中,u為基礎賬戶的序號,v為備選賬戶的序號,psim(u,v)為第u個基礎賬戶與第v個備選賬戶之間的評分相似度,gsim(u,v)為第u個基礎賬戶與第v個備選賬戶之間的偏好相似度,hsim(u,v)為第u個基礎賬戶與第v個備選賬戶之間的隱特征相似度,α為第一預設比例,β為第二預設比例,γ為第三預設比例,sim(u,v)為第v個備選賬戶與第u個基礎賬戶之間的整體相似度。
推薦賬戶選取單元用于計算同一備選賬戶與各基礎賬戶之間的整體相似度之和,按照整體相似度之和從大到小的順序,選取數(shù)量為預設個數(shù)的整體相似度之和,將選取的整體相似度之和對應的備選賬戶作為推薦賬戶。
推薦單元用于將待推薦服務推薦給推薦賬戶。
在一實施例中,上述電商平臺服務推薦系統(tǒng)還包括評分二維表生成模塊(圖未示)、評分次數(shù)采集模塊(圖未示)和評分次數(shù)二維表生成模塊(圖未示)。
評分二維表生成模塊用于獲取各賬戶對各服務進行評分的評分值,并根據(jù)各賬戶、各服務和對應的評分值生成評分二維表。評分二維表用于組合賬戶模塊110根據(jù)評分二維表查找有對待推薦服務進行評分的賬戶、評分數(shù)據(jù)獲取模塊130根據(jù)評分二維表獲取基礎賬戶和備選賬戶分別對各公共流行服務和各公共長尾服務進行評分的評分值、基礎賬戶對所有服務進行評分的平均值得到基礎平均值、備選賬戶對所有服務進行評分的平均值得到備選平均值,以及用于矩陣分解模塊170根據(jù)評分二維表生成賬戶-服務評分矩陣。
評分次數(shù)采集模塊用于獲取多個服務對應的所有的服務類別,根據(jù)評分二維表查找各賬戶有進行評分的服務,分別根據(jù)查找到的服務所屬的服務類別獲取對應的賬戶對服務類別進行評分的評分次數(shù)。
評分次數(shù)二維表生成模塊用于根據(jù)各賬戶、各服務類別和對應的評分次數(shù)生成評分次數(shù)二維表。評分次數(shù)二維表用于服務類別分析模塊150根據(jù)評分次數(shù)二維表獲取基礎賬戶對電商平臺的各服務類別進行評分的評分次數(shù)、備選賬戶對各服務類別進行評分的評分次數(shù)、服務類別的總數(shù)目。
上述電商平臺服務推薦系統(tǒng),通過組合賬戶模塊110獲取長尾服務中的待推薦服務,根據(jù)推薦服務將賬戶分為基礎賬戶和備選賬戶,評分相似度計算模塊140根據(jù)公共服務分析模塊120和評分數(shù)據(jù)獲取模塊130提供的數(shù)據(jù)獲取各基礎賬戶和備選賬戶之間的評分相似度,偏好相似度計算模塊160根據(jù)服務類別分析模塊150提供的數(shù)據(jù)獲取各基礎賬戶和備選賬戶之間的偏好相似度,隱特征相似度計算模塊180根據(jù)矩陣分解模塊170提供的數(shù)據(jù)獲取各基礎賬戶和備選賬戶之間的隱特征相似度,并由服務推薦模塊190根據(jù)評分相似度、偏好相似度和隱特征相似度考慮,從多個備選賬戶中選取預設個數(shù)的備選賬戶作為推薦賬戶,將待推薦服務推薦給推薦賬戶。同理,通過融合三種相似度,從多方面考慮備選賬戶與基礎賬戶之間的相似性,從而從備選賬戶中選取推薦賬戶進行待推薦服務的推薦,將待推薦服務推薦給真正需要的賬戶,推薦效果好,推薦轉化率高。
在一應用例中,從MovieLens數(shù)據(jù)集采集數(shù)據(jù)對上述電商平臺服務推薦方法進行驗證。MovieLens數(shù)據(jù)集是應用廣泛的個性化推薦數(shù)據(jù)集。在MovieLens數(shù)據(jù)集中,消費者對自己看過的電影進行評分,分值為1到5分。由于原數(shù)據(jù)集包含較多的噪音數(shù)據(jù),所以選取評分次數(shù)不低于5次的電影以及至少評價了20部電影的消費者對應的賬戶組成實驗數(shù)據(jù)集。為了驗證電商平臺服務推薦方法的準確性,將實驗數(shù)據(jù)集分為訓練集和測試集,訓練集用來學習或訓練電商平臺服務推薦方法中的相關參數(shù),測試集用來驗證電商平臺服務推薦方法的準確性。為了保證消費者在訓練集和測試集中評分數(shù)據(jù)的連續(xù)性,以時間戳排序按80:20的比例將實驗數(shù)據(jù)集分為訓練集和測試集。采用推薦轉化率作為本應用例的評價指標,推薦轉化率越高,推薦質量越高。推薦轉化率定義為式:
其中,n為經推薦使用了該待推薦服務的賬戶數(shù)量,N為推薦賬戶數(shù)量,Q為推薦轉化率。
表3為第一預設權重和第二預設權重的實驗數(shù)據(jù),Q為推薦轉化率。由此可知,第一預設權重a和第二預設權重b的最佳取值分別為0.2和0.8。
表3
表4為第一預設比例、第二預設比例和第三預設比例的實驗數(shù)據(jù),Q為推薦轉化率。由此可知,第一預設比例α、第二預設比例β和第三預設比例γ的最佳取值分別為0.3、0.6和0.1。
表4
本應用例中,針對推薦轉化率進行了對比實驗;然后設計了5折交叉實驗驗證電商平臺服務推薦方法的靈敏度,即把Movielens 100k電影評分數(shù)據(jù)集平均分為5份,并分別把每一份作為測試集,其他四份作為訓練集進行實驗,總體實驗結果如圖3所示,其中,S1表示電商平臺服務推薦方法的推薦轉化率曲線,S2表示傳統(tǒng)技術中概率矩陣分解推薦方法的推薦轉化率曲線,S3表示傳統(tǒng)技術中協(xié)同過濾推薦方法的推薦轉化率曲線。由此可驗證,上述電商平臺服務推薦方法的推薦準確率比傳統(tǒng)的推薦方法高。
以上所述實施例的各技術特征可以進行任意的組合,為使描述簡潔,未對上述實施例中的各個技術特征所有可能的組合都進行描述,然而,只要這些技術特征的組合不存在矛盾,都應當認為是本說明書記載的范圍。
以上所述實施例僅表達了本發(fā)明的幾種實施方式,其描述較為具體和詳細,但并不能因此而理解為對發(fā)明專利范圍的限制。應當指出的是,對于本領域的普通技術人員來說,在不脫離本發(fā)明構思的前提下,還可以做出若干變形和改進,這些都屬于本發(fā)明的保護范圍。因此,本發(fā)明專利的保護范圍應以所附權利要求為準。