欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

商品搭配推薦方法及推薦系統(tǒng)的制作方法

文檔序號:10553479閱讀:241來源:國知局
商品搭配推薦方法及推薦系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種商品搭配推薦方法及推薦系統(tǒng),該方法包括根據(jù)商品庫中商品的標(biāo)題分詞計(jì)算商品之間的相似度;利用用戶的購買行為記錄對所述商品之間的相似度進(jìn)行修正;按照從大到小的順序分別對每個(gè)商品的相似度進(jìn)行排序得到該商品的相似度序列,并截取所述相似度序列中設(shè)定個(gè)數(shù)的序列值以建立相似度矩陣;基于所述相似度矩陣進(jìn)行搜索以獲取各商品的搭配推薦集合。該方法能夠顯著提高搭配預(yù)測的準(zhǔn)確度,可以與時(shí)尚行業(yè)的現(xiàn)實(shí)需求相結(jié)合,具有廣泛的適應(yīng)性。
【專利說明】
商品搭配推薦方法及推薦系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于數(shù)據(jù)處理領(lǐng)域,尤其涉及商品數(shù)據(jù)的處理,具體的說,是涉及一種商品 搭配推薦方法及推薦系統(tǒng)。
【背景技術(shù)】
[0002] 現(xiàn)如今,隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,互聯(lián)網(wǎng)購物已經(jīng)日益成為人們生活中一種重要的 購物方式。但由于互聯(lián)網(wǎng)購物的交互與交易方式的限制,用戶常常不能挑選到滿意的商品。 為了提高用戶在網(wǎng)上購物的體驗(yàn),針對互聯(lián)網(wǎng)購物的輔助推薦應(yīng)用系統(tǒng)越來越被人們所關(guān) 注。
[0003] 例如,目前已經(jīng)提出幾種用于服裝搭配的應(yīng)用平臺,包括Magic mirror,SuitUp和 Vimeo。這些應(yīng)用平臺主要通過分析產(chǎn)品的文本標(biāo)記信息進(jìn)行推薦。具體的,有些推薦平臺 基于改進(jìn)的貝葉斯網(wǎng)絡(luò)提出,有些則是基于本體論、基于模糊集合論提出的推薦系統(tǒng)。上述 應(yīng)用平臺在向用戶推薦搭配商品時(shí),可以縮小用戶搜索商品時(shí)的范圍,簡化用戶在挑選商 品時(shí)的操作,同時(shí)在一定程度上滿足用戶的要求。但現(xiàn)有輔助推薦的應(yīng)用平臺普遍存在下 列問題,不能較好地滿足用戶的喜好和興趣,推薦的準(zhǔn)確度低。
[0004] 綜上,亟需一種針對商品之間的搭配進(jìn)行推薦的方法以提高推薦的準(zhǔn)確度,更好 地滿足用戶的喜好。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明所要解決的技術(shù)問題之一是需要提供一種針對商品之間的搭配進(jìn)行推薦 的方法以提高推薦的準(zhǔn)確度。
[0006] 為了解決上述技術(shù)問題,本申請的實(shí)施例首先提供了一種商品搭配推薦方法,包 括:根據(jù)商品庫中商品的標(biāo)題分詞計(jì)算商品之間的相似度;利用用戶的購買行為記錄對所 述商品之間的相似度進(jìn)行修正;按照從大到小的順序分別對每個(gè)商品的相似度進(jìn)行排序得 到該商品的相似度序列,并截取所述相似度序列中設(shè)定個(gè)數(shù)的序列值以建立相似度矩陣; 基于所述相似度矩陣進(jìn)行搜索以獲取各商品的搭配推薦集合。
[0007] 優(yōu)選地,所述根據(jù)商品庫中商品的標(biāo)題分詞計(jì)算商品之間的相似度,包括:根據(jù)商 品所屬的類目將商品劃分為不同的類集合;假設(shè)所述類集合中各標(biāo)題分詞出現(xiàn)的概率相 同,計(jì)算任意兩個(gè)商品之間的第一相似度;假設(shè)所述類集合中各標(biāo)題分詞出現(xiàn)的概率不同, 計(jì)算任意兩個(gè)商品之間的第二相似度;以所述第一相似度與所述第二相似度的線性組合作 為商品之間的相似度。
[0008] 優(yōu)選地,所述計(jì)算任意兩個(gè)商品之間的第二相似度,包括:根據(jù)各標(biāo)題分詞在所述 類集合中出現(xiàn)的概率計(jì)算標(biāo)題分詞的權(quán)重值;基于所述標(biāo)題分詞的權(quán)重值,根據(jù)如下表達(dá) 式計(jì)算任意兩個(gè)商品之間的第二相似度SimC(I a,Ib):
[0010] 其中,抑f〃分別表示商品
Ia#PIb的標(biāo)題分詞集合,,)表示類集合Cj中 標(biāo)題分詞的權(quán)重值。
[0011] 優(yōu)選地,所述利用用戶的購買行為記錄對所述商品之間的相似度進(jìn)行修正,包括: 根據(jù)用戶的購買行為記錄中所記錄的某個(gè)商品的購買日期計(jì)算該商品的購買日期的平均 值;基于所述購買日期的平均值確定該商品的購買系數(shù);利用所述購買日期的平均值與購 買系數(shù)對商品之間的相似度進(jìn)行修正。
[0012] 優(yōu)選地,所述基于所述相似度矩陣進(jìn)行搜索以獲取各商品的搭配推薦集合,包括: 獲取參照商品Ik的搭配推薦集合時(shí),從所述相似度矩陣中Ik所在的行開始搜索,將該行中的 各相似度的值與預(yù)設(shè)的相似度閾值0依次進(jìn)行比較:當(dāng)被比較的相似度於的值小于等于 時(shí),終止對Ik所在的行的搜索過程,獲取參照商品Ik的搭配推薦集合的過程結(jié)束;當(dāng)被比 較的相似度於的值大于妒時(shí),根據(jù)商品的搭配套餐庫中與所述相似度於對應(yīng)的商品1:的 搭配列表確定參照商品Ik的搭配推薦集合。
[0013] 優(yōu)選地,所述根據(jù)商品的搭配套餐庫中與所述相似度#對應(yīng)的商品h的搭配列表 確定參照商品Ik的搭配推薦集合,包括:查詢商品的搭配套餐庫中是否存在包含與所述相 似度f對應(yīng)的商品h的搭配列表:若存在包含與所述相似度5^對應(yīng)的商品h的搭配列表, 則將所述搭配列表中的搭配商品加入?yún)⒄丈唐稩k的搭配推薦集合,然后返回所述相似度矩 陣中I k所在的行繼續(xù)比較該行中下一個(gè)相似度怒,與所述預(yù)設(shè)的相似度閾值若不存在 包含與所述相似度於對應(yīng)的商品h的搭配列表,則對相似度矩陣中h所在的行進(jìn)行遞歸搜 索。
[0014] 優(yōu)選地,所述對相似度矩陣中1#斤在的行進(jìn)行遞歸搜索,包括:重新確定用于本層 搜索的本層相似度閾值指標(biāo);將該行中的各相似度的值與本層相似度閾值指標(biāo)依次進(jìn)行比 較:當(dāng)被比較的相似度句的值小于等于本層相似度閾值指標(biāo)時(shí),終止對1:所在的行的搜索 過程,返回進(jìn)入h行之前的上一層搜索,并繼續(xù)比較上一層搜索中位于商品h后面的相似度 與上一層搜索中的相似度閾值指標(biāo);當(dāng)被比較的相似度#的值大于本層相似度閾值指標(biāo) 時(shí),查詢商品的搭配套餐庫中是否存在包含與所述相似度<對應(yīng)的商品I」的搭配列表;若 存在包含與所述相似度#對應(yīng)的商品L的搭配列表,則將所述搭配列表中的搭配商品加入 參照商品Ik的搭配推薦集合,然后返回所述相似度矩陣中1:所在的行繼續(xù)比較該行中下一 個(gè)相似度與本層相似度閾值指標(biāo);若不存在包含與所述相似度^對應(yīng)的商品L的搭配 列表,則對相似度矩陣中L所在的行進(jìn)行遞歸搜索。
[0015] 優(yōu)選地,在將與所述相似度5$對應(yīng)的商品^的搭配列表中的搭配商品加入?yún)⒄丈?品Ik的搭配推薦集合后還包括,判斷所述參照商品Ik的搭配推薦集合中是否已經(jīng)存在加入 的商品,若已經(jīng)存在加入的商品,則將加入的商品和參照商品Ik之間的相似度更新為其原 有值與相似度s/1的值中較大的值。
[0016] 優(yōu)選地,在獲取參照商品Ik的搭配推薦集合的過程結(jié)束后,將所述搭配推薦集合 中的商品按照各商品與參照商品Ik之間的相似度的值按照從大到小的順序進(jìn)行排列,截取 包含設(shè)定數(shù)量商品的序列作為參照商品Ik的搭配列表。
[0017] 本申請的實(shí)施例還提供了一種商品搭配推薦系統(tǒng),包括:相似度計(jì)算模塊,其根據(jù) 商品庫中商品的標(biāo)題分詞計(jì)算商品之間的相似度;相似度修正模塊,其利用用戶的購買行 為記錄對所述商品之間的相似度進(jìn)行修正;相似度矩陣建立模塊,其按照從大到小的順序 依次對每個(gè)商品的相似度進(jìn)行排序得到該商品的相似度序列,截取所述相似度序列中設(shè)定 個(gè)數(shù)的序列值,以全部商品的相似度序列建立相似度矩陣;相似度矩陣搜索模塊,其基于所 述相似度矩陣進(jìn)行搜索以獲取各商品的搭配推薦集合。
[0018] 與現(xiàn)有技術(shù)相比,上述方案中的一個(gè)或多個(gè)實(shí)施例可以具有如下優(yōu)點(diǎn)或有益效 果:
[0019] 通過分另I」基于熱門商品和冷門商品分別構(gòu)建相似度,以及根據(jù)用戶歷史行為對相 似度進(jìn)行修正并建立相似度舉證,進(jìn)而針對相似度矩陣對商品的搭配進(jìn)行推薦,顯著地提 高了搭配預(yù)測的準(zhǔn)確度。
[0020] 本發(fā)明的其他優(yōu)點(diǎn)、目標(biāo),和特征在某種程度上將在隨后的說明書中進(jìn)行闡述,并 且在某種程度上,基于對下文的考察研究對本領(lǐng)域技術(shù)人員而言將是顯而易見的,或者可 以從本發(fā)明的實(shí)踐中得到教導(dǎo)。本發(fā)明的目標(biāo)和其他優(yōu)點(diǎn)可以通過下面的說明書,權(quán)利要 求書,以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
【附圖說明】
[0021] 附圖用來提供對本申請的技術(shù)方案或現(xiàn)有技術(shù)的進(jìn)一步理解,并且構(gòu)成說明書的 一部分。其中,表達(dá)本申請實(shí)施例的附圖與本申請的實(shí)施例一起用于解釋本申請的技術(shù)方 案,但并不構(gòu)成對本申請技術(shù)方案的限制。
[0022] 圖1為根據(jù)本發(fā)明一實(shí)施例的商品搭配推薦方法的流程示意圖;
[0023] 圖2為根據(jù)本發(fā)明實(shí)施例的對相似度矩陣進(jìn)行搜索的流程示意圖;
[0024] 圖3為根據(jù)本發(fā)明另一實(shí)施例的商品搭配推薦系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0025] 以下將結(jié)合附圖及實(shí)施例來詳細(xì)說明本發(fā)明的實(shí)施方式,借此對本發(fā)明如何應(yīng)用 技術(shù)手段來解決技術(shù)問題,并達(dá)成相應(yīng)技術(shù)效果的實(shí)現(xiàn)過程能充分理解并據(jù)以實(shí)施。本申 請實(shí)施例以及實(shí)施例中的各個(gè)特征,在不相沖突前提下可以相互結(jié)合,所形成的技術(shù)方案 均在本發(fā)明的保護(hù)范圍之內(nèi)。
[0026] 圖1為根據(jù)本發(fā)明一實(shí)施例的商品搭配推薦方法的流程示意圖,如圖所示,該推薦 方法包括:
[0027] 步驟S110、根據(jù)商品庫中商品的標(biāo)題分詞計(jì)算商品之間的相似度。
[0028]步驟S120、利用用戶的購買行為記錄對商品之間的相似度進(jìn)行修正。
[0029]步驟S130、按照從大到小的順序分別對每個(gè)商品的相似度進(jìn)行排序得到該商品的 相似度序列,并截取相似度序列中設(shè)定個(gè)數(shù)的序列值以建立相似度矩陣。
[0030] 步驟S140、基于相似度矩陣進(jìn)行搜索以獲取各商品的搭配推薦集合。
[0031] 具體的,首先定義商品庫中與商品有關(guān)的集合的構(gòu)成:
[0032] 由商品庫中所有商品構(gòu)成的集合記為I = {h,I2, . . .,In},其中Ii表示第i個(gè)商品。 [0033]由商品庫中所有商品的標(biāo)題分詞構(gòu)成的集合記為W= {wi,W2, . . .,wq},其中Wk表示 第k個(gè)標(biāo)題分詞。
[0034] 由商品庫中的第i個(gè)商品的標(biāo)題分詞構(gòu)成的集合記為…,w;^。
[0035] 由商品庫中的商品所屬的類目構(gòu)成的集合記為C: . . .,CM},其中Q表示第j 個(gè)類別。
[0036] 由商品庫中屬于第j類商品的所有商品構(gòu)成的集合記為/( 其中 if表示包含在第j類商品中的第i個(gè)。
[0037] 由商品庫中屬于第j類商品的所有商品的標(biāo)題分詞構(gòu)成的集合記為
[0038] 在步驟S110中,考慮到可獲取商品信息主要為商品描述信息,即商品所屬類目和 標(biāo)題分詞。因此在本發(fā)明的實(shí)施例中采取了標(biāo)簽本文相似度的算法,分析商品之間的相似 度。具體來說,結(jié)合商品分詞,度量商品分詞集合之間的相似性,計(jì)算商品的相似度。在利用 標(biāo)題分詞計(jì)算商品之間的相似度時(shí),具體包括:
[0039]步驟S1101、根據(jù)商品所屬的類目將商品劃分為不同的類集合。
[0040] 步驟S1102、假設(shè)在某個(gè)類集合中各標(biāo)題分詞出現(xiàn)的概率相同,計(jì)算任意兩個(gè)商品 之間的第一相似度。
[0041] 步驟S1103、假設(shè)在某個(gè)類集合中各標(biāo)題分詞出現(xiàn)的概率不同,計(jì)算任意兩個(gè)商品 之間的第二相似度。
[0042] 步驟S1104、根據(jù)第一相似度和第二相似度確定任意兩個(gè)商品之間的相似度。
[0043] 標(biāo)題分詞對商品相似性的影響應(yīng)限制在同屬于一類的商品,比如標(biāo)題分詞"陶 瓷",對于器皿類的生活用品來說,就是一種出現(xiàn)頻率較高的標(biāo)題分詞。而對于辦公文具類 的商品來說,其出現(xiàn)頻率則非常低。因此,在計(jì)算相似度之前,先對商品庫中的商品進(jìn)行分 類,在各商品所屬的類集合中考慮其標(biāo)題分詞的影響。接下來分別計(jì)算第一相似度 (JACCARD相似度)和計(jì)算優(yōu)化過的第二相似度(COSINE相似度)。
[0044] JACCARD相似度作為基礎(chǔ)相似度計(jì)算方法,在計(jì)算商品之間的JACCARD相似度時(shí), 默認(rèn)單個(gè)分詞對商品相似度權(quán)重的影響值相同,即在某個(gè)類集合中各標(biāo)題分詞出現(xiàn)的概率 相同,根據(jù)表達(dá)式(1)計(jì)算商品UPIb之間的JACCARD相似度SimJ(I a,Ib):
[0046]式中,If4和分別表不商品la和lb的標(biāo)題分詞集合,符號| ? |表不集合中元素的 個(gè)數(shù)。且商品l4PIb均屬于第j類商品的集合。
[0047]通過對JACCARD相似度的計(jì)算結(jié)果進(jìn)行度量發(fā)現(xiàn),JACCARD相似度對熱門商品的相 似度度量精度較高。但涉及到冷門商品,尤其是標(biāo)題分詞出現(xiàn)小眾詞匯時(shí),相似度計(jì)算的精 確度有限。這是因?yàn)椋衷~的描述對商品相似度的貢獻(xiàn)具有差異性。例如在某一分類商品 "茶壺"中,標(biāo)題中的分詞"茶壺"和分詞"磨砂"相比,由于在此分類中,商品標(biāo)題中出現(xiàn)分詞 "茶壺"的概率要高于出現(xiàn)分詞"磨砂"的概率,因此對商品質(zhì)地的描述分詞"磨砂"比對商品 內(nèi)容的描述分詞"茶壺"在計(jì)算相似度時(shí)權(quán)重更大。通過提高冷門分詞的相似度權(quán)重,提高 在相似度計(jì)算時(shí)對小眾商品相似度度量的準(zhǔn)確率。因此,在本發(fā)明的實(shí)施例中,引入了第二 相似度,即優(yōu)化過的COSINE相似度。
[0048]首先根據(jù)各標(biāo)題分詞在其所屬的類集合中出現(xiàn)的概率計(jì)算標(biāo)題分詞的權(quán)重值,根 據(jù)類內(nèi)總分詞詞頻數(shù)和某個(gè)分詞出現(xiàn)的詞頻數(shù),計(jì)算每個(gè)分詞的權(quán)重。對某個(gè)分詞 uf' (wf e ),其權(quán)重的計(jì)算如表達(dá)式⑵所不:
[0050]式中,符號| ? |表示集合中元素的個(gè)數(shù),{/f |>f 表示在當(dāng)前類別的 商品集中,標(biāo)題分詞中包含分詞的商品集合。
[0051 ]進(jìn)一步地,基于標(biāo)題分詞的權(quán)重值,根據(jù)如下表達(dá)式計(jì)算任意兩個(gè)商品ijPIb之間 的COSINE相似度SimC(Ia,lb):
[0053] 式中,,4和分別表示商品UPIb的標(biāo)題分詞集合,wf 門妒' 表示商品Ia 和lb中共同出現(xiàn)的分詞< )表示類集合Cj中標(biāo)題分詞的權(quán)重值。且商品Ia 和lb均屬于第j類商品的集合if,忍。
[0054] 為了得到較好的相似度度量結(jié)果,以第一相似度與第二相似度的線性組合作為商 品之間的相似度,其結(jié)合了 JACCARD相似度對熱門商品的相似度計(jì)算優(yōu)勢和COSINE相似度 對冷門商品的相似度計(jì)算優(yōu)勢,最終得到商品Ia,Ib的相似度,如表達(dá)式⑷所示:
[0055] Sim(Ia,Ib)= w1*SimJ(Ia,Ib)+W2*SimC(Ia,Ib) (4)
[0056] 式中,《i和《2均為系數(shù),根據(jù)實(shí)際中熱門商品和冷門商品所占的不同的 比重進(jìn)行選取。舉例而言,一般情況下可以認(rèn)為熱門商品和冷門商品的比重相當(dāng),則取 =?2 = 0.5〇
[0057] 在初步確定了商品之間的相似度的值后,接下來在步驟S120中,對相似度進(jìn)行進(jìn) 一步地修正。包括,首先根據(jù)用戶的購買行為記錄中所記錄的某個(gè)商品的購買日期計(jì)算該 商品的購買日期的平均值,再基于得到的購買日期的平均值確定該商品的購買系數(shù),最后 利用購買日期的平均值與購買系數(shù)對商品之間的相似度進(jìn)行修正。
[0058] 具體的,獲取某個(gè)商品的所有用戶行為歷史,提取日期的月份格式化后取平均值, 如表達(dá)式(5)所示:
[0060] 式中,功為商品Ik的第i個(gè)用戶行為數(shù)據(jù)的日期。通過用戶行為歷史表,根據(jù)商品 及購買日期兩個(gè)字段可以將商品限定在大致的時(shí)間段,以排除夏季與冬季等不符合常識的 搭配推薦出現(xiàn)。
[0061] 搜索當(dāng)前商品1!^的相似商品列表,對相似度進(jìn)行如下修正:
[0063] 式中,Sim(Ik,Ii)和Sin/(Ik,Ii)分別表示商品Ik及與I k相似的商品Ii之間的修正 前和修正后的相似度,巧/,)和5(n分別表示商品ik和商品1:的購買日期的平均值,u為購 買系數(shù),符號I ? I表示絕對值。
[0064] 購買系數(shù)U可以基于日期格式與相似度進(jìn)行調(diào)節(jié),U越大則用戶購買日期對相似度 影響越小。當(dāng)商品Ik及與Ik相似的商品Ii之間的購買月份平均值相差超過5個(gè)月時(shí),相似度 更新為0,否則基于月份間隔對原相似度乘以系數(shù)。
[0065] 接下來,在步驟S130中,依次對商品庫中的每個(gè)商品Ik進(jìn)行相似度排序。具體為, 整理并取前1個(gè)相似度的值,即對于115將3加(11{山),1 = 1,2,...』進(jìn)行從大到小的排序。定 義與參照商品Ik相關(guān)的相似度排序由大到小的M個(gè)商品集合為S/s 則所有 商品排序后的相似度矩陣為: (Q-h 0 '^.2 .… 口 M
[0066] R= (7) C^N-1 …. U財(cái) VJ\ C].\ V U1 …/
[0067] 相似度矩陣R的第一列必定為參照商品本身,相似度為1.0。1?的每一行表示與當(dāng)前 參照商品相似度從大到小排序后的每個(gè)商品。
[0068] 在步驟S140中,以對參照商品Ik的搜索過程為例說明基于相似度矩陣進(jìn)行搜索以 獲取各商品的搭配推薦集合的過程。下面結(jié)合圖2進(jìn)行說明。
[0069] 在獲取參照商品Ik的搭配推薦集合時(shí),從相似度矩陣R中參照商品Ik所在的行開始 搜索,將該行中的各相似度的值{於,埒,辟,...,聲:,...,垃丨與預(yù)設(shè)的相似度閾值 依次進(jìn)行比較。
[0070] 當(dāng)被比較的相似度的值小于等于時(shí),由于相似度矩陣中的各相似度的值是 降序排列的,因此5^的值小于等于時(shí),位于Sf后面的相似度的值也一定小于等于所 以終止對Ik所在的行的搜索過程,獲取參照商品I k的搭配推薦集合的過程結(jié)束。
[0071 ]當(dāng)被比較的相似度貧4的值大于g4時(shí),查詢商品的搭配套餐庫,并根據(jù)商品的搭配 套餐庫中與相似度貧*對應(yīng)的商品L的搭配列表確定參照商品Ik的搭配推薦集合。
[0072]進(jìn)一步地,查詢商品的搭配套餐庫時(shí),首先查詢庫中是否存在包含與相似度礦對 應(yīng)的商品Ii的搭配列表,若存在包含與相似度穿對應(yīng)的商品Ii的搭配列表,則將搭配列表 中的搭配商品加入?yún)⒄丈唐稩k的搭配推薦集合,然后返回相似度矩陣R中參照商品Ik所在的 行繼續(xù)比較該行中下一個(gè)相似度轅,與預(yù)設(shè)的相似度閾值。若不存在包含與相似度5^對 應(yīng)的商品h的搭配列表,則對相似度矩陣中h所在的行進(jìn)行遞歸搜索。
[0073] 遞歸搜索的過程包括,重新確定用于本層搜索的本層相似度閾值指標(biāo)。將該行中 的各相似度的值與本層相似度閾值指標(biāo)依次進(jìn)行比較。當(dāng)被比較的相似度#的值小于等于 本層相似度閾值指標(biāo)時(shí),終止對h所在的行的搜索過程,返回進(jìn)入1:行之前的上一層搜索, 并繼續(xù)比較上一層搜索中位于商品h后面的相似度與上一層搜索中的相似度閾值指標(biāo)。當(dāng) 被比較的相似度好的值大于本層相似度閾值指標(biāo)時(shí),查詢商品的搭配套餐庫中是否存在包 含與相似度0對應(yīng)的商品I」的搭配列表。若存在包含與相似度<對應(yīng)的商品I」的搭配列 表,則將搭配列表中的搭配商品加入?yún)⒄丈唐稩k的搭配推薦集合,然后返回相似度矩陣中h 所在的行繼續(xù)比較該行中下一個(gè)相似度巧^與本層相似度閾值指標(biāo)。若不存在包含與相似 度句對應(yīng)的商品I」的搭配列表,則對相似度矩陣中I」所在的行進(jìn)行遞歸搜索。
[0074] 遞歸搜索過程包含多個(gè)嵌套的遞歸過程,上一層搜索指的是位于外層的調(diào)用的主 體,本層搜索指的是位于內(nèi)層的被調(diào)用的部分。每一層都對應(yīng)自己所屬當(dāng)層搜索的相似度 閾值指標(biāo),且位于內(nèi)層的相似度閾值指標(biāo)較調(diào)用其的外層的相似度閾值指標(biāo)遞減。
[0075] 舉例而言,當(dāng)前參照商品Ik所在的層(即最外層)的相似度閾值指標(biāo)(即預(yù)設(shè)的相 似度閾值)為從調(diào)用其所在行商品^進(jìn)行遞歸搜索時(shí),商品h的遞歸搜索所使用的相似 度閾值指標(biāo)(記為少)的值設(shè)置為在#的基礎(chǔ)上乘以一個(gè)小于1的系數(shù),比如少=(^峨1。 以此類推,若從商品1:的遞歸搜索中繼續(xù)調(diào)用h所在行商品L進(jìn)行遞歸搜索,則商品h的遞 歸搜索所使用的相似度閾值指標(biāo)(記為#)的值設(shè)置為*0,1。通過對不同遞歸搜索 層的相似度閾值指標(biāo)的處理,使得搭配結(jié)果與商品之間的相似度相適應(yīng),提高了商品搭配 的準(zhǔn)確度。
[0076] 需要說明的是,在上述搜索過程中,在將在商品的搭配套餐庫中存在搭配列表的 搭配商品加入?yún)⒄丈唐稩k的搭配推薦集合后還要判斷參照商品Ik的搭配推薦集合中是否已 經(jīng)存在加入的商品,若已經(jīng)存在加入的商品,則將加入的商品和參照商品Ik之間的相似度 更新為其原有值與相似度5^的值中較大的值。這是因?yàn)楸M管商品之間的相似度值并不高, 但搭配的可能性很高,基于此對搭配結(jié)果與商品之間的相似度的關(guān)系進(jìn)行修正,進(jìn)一步提 高了商品搭配的準(zhǔn)確度。
[0077] 對相似度矩陣R逐行進(jìn)行上述搜索過程,當(dāng)遍歷相似度矩陣R中的所有行時(shí),即完 成對全部商品的搭配推薦集合的建立。接下來,對于每個(gè)商品,將搭配推薦集合中的與該商 品搭配的商品按照各搭配商品與該商品之間的相似度的值按照從大到小的順序進(jìn)行排列, 截取包含設(shè)定數(shù)量(例如200個(gè))商品的序列作為該商品的搭配列表。
[0078] 通過上述推薦過程,已經(jīng)為每個(gè)待預(yù)測商品推薦200個(gè)可能的搭配商品,這些推薦 商品是否準(zhǔn)確,采用下面的評價(jià)指標(biāo)進(jìn)行驗(yàn)證。
[0079] 對于每個(gè)商品采用平滑后的Mean Average Precision@200作為評測指標(biāo),如表達(dá) 式(8)所示:
[0081]式中,n為對應(yīng)于某件商品的搭配推薦集合中搭配商品的數(shù)量,p(k)為k截?cái)嗲暗?預(yù)測準(zhǔn)確率,A (k)為第k個(gè)商品是否在搭配推薦集合中的二值表示,如果存在記為1,如果 不存在記為0。
[0082] 最后對所有待預(yù)測商品的api@200求平均值作為最后的評價(jià)指標(biāo),它應(yīng)該為一個(gè)0 到1區(qū)間的值,越接近1說明預(yù)測的結(jié)果越準(zhǔn)確。
[0083] 本發(fā)明實(shí)施例的商品推薦方法,基于商品之間的相似度以及客戶的購買行為記錄 對商品之間的搭配進(jìn)行預(yù)測,顯著地提高了搭配預(yù)測的準(zhǔn)確度。
[0084] 另外,通過結(jié)合時(shí)尚行業(yè)的現(xiàn)實(shí)需求,以及提出的系統(tǒng)構(gòu)架和方法,形成了一個(gè)較 為完善的面向網(wǎng)絡(luò)海量時(shí)尚多媒體信息的智能服裝特征分析和推薦系統(tǒng),具有廣泛的適應(yīng) 性。
[0085] 在本發(fā)明的其他實(shí)施例中,還提出了一種商品搭配推薦系統(tǒng),如圖3所示,該系統(tǒng) 包括:
[0086] 相似度計(jì)算模塊31,其根據(jù)商品庫中商品的標(biāo)題分詞計(jì)算商品之間的相似度。 [0087]相似度修正模塊32,其利用用戶的購買行為記錄對商品之間的相似度進(jìn)行修正。 [0088]相似度矩陣建立模塊33,其按照從大到小的順序依次對每個(gè)商品的相似度進(jìn)行排 序得到該商品的相似度序列,截取相似度序列中設(shè)定個(gè)數(shù)的序列值,以全部商品的相似度 序列建立相似度矩陣。
[0089] 相似度矩陣搜索模塊34,其基于相似度矩陣進(jìn)行搜索以獲取各商品的搭配推薦集 合。
[0090] 更多相關(guān)的功能的實(shí)現(xiàn)可以參考前述實(shí)施例中的推薦方法的各步驟,此處不再贅 述。
[0091] 雖然本發(fā)明所揭露的實(shí)施方式如上,但所述的內(nèi)容只是為了便于理解本發(fā)明而采 用的實(shí)施方式,并非用以限定本發(fā)明。任何本發(fā)明所屬技術(shù)領(lǐng)域內(nèi)的技術(shù)人員,在不脫離本 發(fā)明所揭露的精神和范圍的前提下,可以在實(shí)施的形式上及細(xì)節(jié)上作任何的修改與變化, 但本發(fā)明的專利保護(hù)范圍,仍須以所附的權(quán)利要求書所界定的范圍為準(zhǔn)。
【主權(quán)項(xiàng)】
1. 一種商品搭配推薦方法,包括: 根據(jù)商品庫中商品的標(biāo)題分詞計(jì)算商品之間的相似度; 利用用戶的購買行為記錄對所述商品之間的相似度進(jìn)行修正; 按照從大到小的順序分別對每個(gè)商品的相似度進(jìn)行排序得到該商品的相似度序列,并 截取所述相似度序列中設(shè)定個(gè)數(shù)的序列值W建立相似度矩陣; 基于所述相似度矩陣進(jìn)行捜索W獲取各商品的搭配推薦集合。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)商品庫中商品的標(biāo)題分詞計(jì)算商 品之間的相似度,包括: 根據(jù)商品所屬的類目將商品劃分為不同的類集合; 假設(shè)所述類集合中各標(biāo)題分詞出現(xiàn)的概率相同,計(jì)算任意兩個(gè)商品之間的第一相似 度; 假設(shè)所述類集合中各標(biāo)題分詞出現(xiàn)的概率不同,計(jì)算任意兩個(gè)商品之間的第二相似 度; W所述第一相似度與所述第二相似度的線性組合作為商品之間的相似度。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述計(jì)算任意兩個(gè)商品之間的第二相似 度,包括: 根據(jù)各標(biāo)題分詞在所述類集合中出現(xiàn)的概率計(jì)算標(biāo)題分詞的權(quán)重值; 基于所述標(biāo)題分詞的權(quán)重值,根據(jù)如下表達(dá)式計(jì)算任意兩個(gè)商品之間的第二相似度 SimC(IaJb)-其中,和分別表示商品Ia和Ib的標(biāo)題分詞集合,Wd勸表示類集合Cj中標(biāo)題 分詞的權(quán)重值。4. 根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其特征在于,所述利用用戶的購買行為記 錄對所述商品之間的相似度進(jìn)行修正,包括: 根據(jù)用戶的購買行為記錄中所記錄的某個(gè)商品的購買日期計(jì)算該商品的購買日期的 平均值; 基于所述購買日期的平均值確定該商品的購買系數(shù); 利用所述購買日期的平均值與購買系數(shù)對商品之間的相似度進(jìn)行修正。5. 根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的方法,其特征在于,所述基于所述相似度矩陣進(jìn) 行捜索W獲取各商品的搭配推薦集合,包括: 獲取參照商品Ik的搭配推薦集合時(shí),從所述相似度矩陣中Ik所在的行開始捜索,將該行 中的各相似度的值與預(yù)設(shè)的相似度闊值徑^依次進(jìn)行比較: 當(dāng)被比較的相似度5*/'的值小于等于貧''時(shí),終止對Ik所在的行的捜索過程,獲取參照商 品Ik的搭配推薦集合的過程結(jié)束; 當(dāng)被比較的相似度《'的值大于公&時(shí),根據(jù)商品的搭配套餐庫中與所述相似度巧對應(yīng) 的商品Il的搭配列表確定參照商品Ik的搭配推薦集合。6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)商品的搭配套餐庫中與所述相似 度對應(yīng)的商品Ii的搭配列表確定參照商品Ik的搭配推薦集合,包括: 查詢商品的搭配套餐庫中是否存在包含與所述相似度'對應(yīng)的商品Ii的搭配列表: 若存在包含與所述相似度皆對應(yīng)的商品Ii的搭配列表,則將所述搭配列表中的搭配商 品加入?yún)⒄丈唐稩k的搭配推薦集合,然后返回所述相似度矩陣中Ik所在的行繼續(xù)比較該行 中下一個(gè)相似度破1與所述預(yù)設(shè)的相似度闊值谷 若不存在包含與所述相似度毎4對應(yīng)的商品Ii的搭配列表,則對相似度矩陣中Ii所在的 行進(jìn)行遞歸捜索。7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述對相似度矩陣中Ii所在的行進(jìn)行遞歸 捜索,包括: 重新確定用于本層捜索的本層相似度闊值指標(biāo); 將該行中的各相似度的值與本層相似度闊值指標(biāo)依次進(jìn)行比較: 當(dāng)被比較的相似度的值小于等于本層相似度闊值指標(biāo)時(shí),終止對Ii所在的行的捜索 過程,返回進(jìn)入Ii行之前的上一層捜索,并繼續(xù)比較上一層捜索中位于商品Ii后面的相似度 與上一層捜索中的相似度闊值指標(biāo); 當(dāng)被比較的相似度的值大于本層相似度闊值指標(biāo)時(shí),查詢商品的搭配套餐庫中是否 存在包含與所述相似度Sj'對應(yīng)的商品。的搭配列表; 若存在包含與所述相似度巧對應(yīng)的商品。的搭配列表,則將所述搭配列表中的搭配商 品加入?yún)⒄丈唐稩k的搭配推薦集合,然后返回所述相似度矩陣中Ii所在的行繼續(xù)比較該行 中下一個(gè)相似度巧1與本層相似度闊值指標(biāo); 若不存在包含與所述相似度對應(yīng)的商品。的搭配列表,則對相似度矩陣中。所在的 行進(jìn)行遞歸捜索。8. 根據(jù)權(quán)利要求6或7所述的方法,其特征在于,在將與所述相似度f'對應(yīng)的商品Ii的 搭配列表中的搭配商品加入?yún)⒄丈唐稩k的搭配推薦集合后還包括,判斷所述參照商品Ik的 搭配推薦集合中是否已經(jīng)存在加入的商品,若已經(jīng)存在加入的商品,則將加入的商品和參 照商品Ik之間的相似度更新為其原有值與相似度Sf'的值中較大的值。9. 根據(jù)權(quán)利要求8所述的方法,其特征在于,在獲取參照商品Ik的搭配推薦集合的過程 結(jié)束后,將所述搭配推薦集合中的商品按照各商品與參照商品Ik之間的相似度的值按照從 大到小的順序進(jìn)行排列,截取包含設(shè)定數(shù)量商品的序列作為參照商品Ik的搭配列表。10. -種商品搭配推薦系統(tǒng),包括: 相似度計(jì)算模塊,其根據(jù)商品庫中商品的標(biāo)題分詞計(jì)算商品之間的相似度; 相似度修正模塊,其利用用戶的購買行為記錄對所述商品之間的相似度進(jìn)行修正; 相似度矩陣建立模塊,其按照從大到小的順序依次對每個(gè)商品的相似度進(jìn)行排序得到 該商品的相似度序列,截取所述相似度序列中設(shè)定個(gè)數(shù)的序列值,W全部商品的相似度序 列建立相似度矩陣; 相似度矩陣捜索模塊,其基于所述相似度矩陣進(jìn)行捜索W獲取各商品的搭配推薦集 厶 1=1 O
【文檔編號】G06Q30/02GK105913290SQ201610509889
【公開日】2016年8月31日
【申請日】2016年7月1日
【發(fā)明人】楊成, 李晨, 張隨雨, 易芃
【申請人】中國傳媒大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
金阳县| 枣庄市| 行唐县| 平顺县| 迭部县| 观塘区| 宁德市| 宜黄县| 琼中| 高陵县| 无锡市| 景洪市| 缙云县| 浦北县| 红河县| 金秀| 宁武县| 明光市| 馆陶县| 凉城县| 五大连池市| 务川| 蓬安县| 天津市| 秦安县| 温州市| 开平市| 天门市| 中江县| 清镇市| 永善县| 文登市| 高安市| 五大连池市| 讷河市| 崇礼县| 瑞昌市| 怀化市| 通化市| 阳信县| 嘉兴市|