欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

電子商務(wù)推薦模型的用戶特征提取方法及系統(tǒng)的制作方法

文檔序號:6632255閱讀:230來源:國知局
電子商務(wù)推薦模型的用戶特征提取方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種電子商務(wù)推薦模型的用戶特征提取方法,包括:將用戶對品牌的行為數(shù)據(jù)進(jìn)行時間分片,構(gòu)造不同時間片的用戶行為特征序列;根據(jù)上述構(gòu)造的不同時間片的用戶行為特征序列,對用戶的整體行為數(shù)據(jù)進(jìn)行分析,提取用戶特征。本發(fā)明還涉及一種電子商務(wù)推薦模型的用戶特征提取系統(tǒng)。本發(fā)明依據(jù)基本的用戶日志信息和品牌操作信息進(jìn)行維度擴建,提取新的特征集合,構(gòu)建推薦模型的用戶特征體系。
【專利說明】電子商務(wù)推薦模型的用戶特征提取方法及系統(tǒng)

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種電子商務(wù)推薦模型的用戶特征提取方法及系統(tǒng)。

【背景技術(shù)】
[0002] 互聯(lián)網(wǎng)和信息技術(shù)的發(fā)展引發(fā)了思維方法、生活方式和商業(yè)模式的巨大變革。在 全球商業(yè)語境下,"大數(shù)據(jù)時代"要求電商品牌運用海量數(shù)據(jù)處理系統(tǒng)對消費者從信息搜索 到產(chǎn)品購買甚至購買后行為的跟蹤和搜索,針對消費者的需求做出更加實時和精細(xì)化的決 策。常規(guī)的個性化推薦技術(shù)都需要從網(wǎng)站行為的日志信息中提取出用戶和品牌的特征信 息,并通過特征選擇,消除無關(guān)和冗余特征,才能得到令人滿意的推薦效果。然而網(wǎng)站日志 信息事無巨細(xì)地包含了每個請求的詳細(xì)信息,冗余的信息中真正可以進(jìn)行數(shù)據(jù)特征提取的 只有用戶行為數(shù)據(jù),包括點擊、購買、收藏、購物車等操作信息。
[0003] 數(shù)據(jù)特征提取在數(shù)據(jù)管理和機器學(xué)習(xí)領(lǐng)域發(fā)揮著重要的作用,但是現(xiàn)有的數(shù)據(jù)特 征化是指在保留數(shù)據(jù)特征的情況下減小原始數(shù)據(jù)的規(guī)模。數(shù)據(jù)特征化的工業(yè)背景隨著數(shù)據(jù) 大規(guī)模增長,產(chǎn)生隱含大量有效信息的高維海量數(shù)據(jù),若要在這些高價值總量,低價值密度 的數(shù)據(jù)中發(fā)現(xiàn)有價值的知識,需要通過數(shù)據(jù)特征提取保留復(fù)雜數(shù)據(jù)中的有效信息,將低價 值密度的信息轉(zhuǎn)化為高價值密度的信息。
[0004] 目前的特征提取方法可以在已知豐富的基礎(chǔ)信息上提取得到所需的隱性特征,或 者通過專業(yè)人事獲取業(yè)務(wù)相關(guān)的專業(yè)知識為背景。然而,在實際面臨的數(shù)據(jù)挖掘工程中,希 望通過最稀少的信息構(gòu)造出高維度且正交的數(shù)據(jù)特征是上述特征構(gòu)建方案所不能實現(xiàn)的。


【發(fā)明內(nèi)容】

[0005] 有鑒于此,有必要提供一種電子商務(wù)推薦模型的用戶特征提取方法及系統(tǒng)。
[0006] 本發(fā)明提供一種電子商務(wù)推薦模型的用戶特征提取方法,該方法包括如下步驟: 將用戶對品牌的行為數(shù)據(jù)進(jìn)行時間分片,構(gòu)造不同時間片的用戶行為特征序列;根據(jù)上述 構(gòu)造的不同時間片的用戶行為特征序列,對用戶的整體行為數(shù)據(jù)進(jìn)行分析,提取用戶特征。
[0007] 其中,該方法還包括:對上述提取的用戶特征進(jìn)行數(shù)值修正。
[0008] 所述的時間分片包括:常規(guī)的時間分片和基于購買行為的時間分片,其中所述常 規(guī)的時間分片包括:按照自然日期分片、根據(jù)用戶每天的行為及時間懲罰因子分片、按照日 期從近至遠(yuǎn)間隔由短變長分片,所述基于購買行為的時間分片方式指把用戶對品牌的時間 行為序列以購買日期為切分點。
[0009] 所述的用戶特征包括:用戶的行為轉(zhuǎn)化比、用戶的購買力、用戶的購買周期、用戶 的涉獵廣度。
[0010] 所述的數(shù)值修正指通過log函數(shù)的進(jìn)行數(shù)值修正。
[0011] 本發(fā)明還提供一種電子商務(wù)推薦模型的用戶特征提取系統(tǒng),包括時間分片模塊、 特征提取模塊,其中:所述時間分片模塊用于將用戶對品牌的行為數(shù)據(jù)進(jìn)行時間分片,構(gòu)造 不同時間片的用戶行為特征序列;所述特征提取模塊用于根據(jù)上述構(gòu)造的不同時間片的用 戶行為特征序列,對用戶的整體行為數(shù)據(jù)進(jìn)行分析,提取用戶特征。
[0012] 其中,該系統(tǒng)還包括數(shù)值修正模塊,所述數(shù)值修正模塊用于對上述提取的用戶特 征進(jìn)行數(shù)值修正。
[0013] 所述的時間分片包括:常規(guī)的時間分片和基于購買行為的時間分片,其中所述常 規(guī)的時間分片包括:按照自然日期分片、根據(jù)用戶每天的行為及時間懲罰因子分片、按照日 期從近至遠(yuǎn)間隔由短變長分片,所述基于購買行為的時間分片方式指把用戶對品牌的時間 行為序列以購買日期為切分點。
[0014] 所述的用戶特征包括:用戶的行為轉(zhuǎn)化比、用戶的購買力、用戶的購買周期、用戶 的涉獵廣度。
[0015] 所述的數(shù)值修正指通過log函數(shù)的進(jìn)行數(shù)值修正。
[0016] 本發(fā)明電子商務(wù)推薦模型的用戶特征提取方法及系統(tǒng),能夠使電子商務(wù)網(wǎng)站在海 量數(shù)據(jù)基礎(chǔ)上,依據(jù)基本的用戶日志信息和品牌操作信息進(jìn)行維度擴建,提取新的特征集 合,構(gòu)建推薦模型的用戶特征體系。本發(fā)明提取的數(shù)據(jù)價值高,提取效果好。

【專利附圖】

【附圖說明】
[0017] 圖1為本發(fā)明電子商務(wù)推薦模型的用戶特征提取方法的流程圖;
[0018] 圖2為基于購買行為的時間分片方式示意圖;
[0019] 圖3為本發(fā)明電子商務(wù)推薦模型的用戶特征提取系統(tǒng)的硬件架構(gòu)圖。

【具體實施方式】
[0020] 下面結(jié)合附圖及具體實施例對本發(fā)明作進(jìn)一步詳細(xì)的說明。
[0021] 參閱圖1所示,是本發(fā)明電子商務(wù)推薦模型的用戶特征提取方法較佳實施例的作 業(yè)流程圖。
[0022] 步驟S401,將用戶對品牌的行為數(shù)據(jù)進(jìn)行時間分片,構(gòu)造不同時間片的用戶行為 特征序列。具體如下:
[0023] 本實施例以天貓商城為例進(jìn)行說明。在天貓商城,每天都會有數(shù)千萬的用戶通過 品牌發(fā)現(xiàn)自己喜歡的商品,品牌是連接消費者和商品的最重要的紐帶。在已有的歷史記錄 中,如何建立用戶的品牌偏好,第一個關(guān)鍵特征的提取就在于用戶對品牌行為的時間序列 的計算。
[0024] 根據(jù)德國心理學(xué)家艾賓浩斯的研究發(fā)現(xiàn),人體大腦對新事物遺忘的循序漸進(jìn)的直 觀描述,即遺忘曲線。所以用戶對某個品牌的行為時間序列也有必要進(jìn)行分片處理,時間越 為久遠(yuǎn)的操作對用戶未來影響的可能越小,時間越近的行為對用戶消費決策的影響越大。 [0025] 常規(guī)的時間分片有三種方式:
[0026] (1)按照自然日期分割,按周、半月、月分割,直接計算用戶對品牌的不同時間跨度 內(nèi)的行為。以四個月總記錄,若按周可以分割為16片,每片的點擊、購買、收藏、購物車為7 天內(nèi)點擊、購買、收藏、購物車之和;若按半月可以分割為8片,每片的點擊、購買、收藏、購 物車為14天內(nèi)點擊、購買、收藏、購物車之和;若按月可以分割為4片,每片的點擊、購買、收 藏、購物車為30天內(nèi)點擊、購買、收藏、購物車之和。
[0027] (2)直接將用戶每天的行為乘以一個時間懲罰因子K,用戶最近的行為比前一個 月的行為更為重要,所以時間懲罰與時間成反比,時間越近懲罰值越小,時間越遠(yuǎn)懲罰值越 大。
[0028]

【權(quán)利要求】
1. 一種電子商務(wù)推薦模型的用戶特征提取方法,其特征在于,該方法包括如下步驟: 將用戶對品牌的行為數(shù)據(jù)進(jìn)行時間分片,構(gòu)造不同時間片的用戶行為特征序列; 根據(jù)上述構(gòu)造的不同時間片的用戶行為特征序列,對用戶的整體行為進(jìn)行分析,提取 用戶特征。
2. 如權(quán)利要求1所述的方法,其特征在于,該方法還包括:對上述提取的用戶特征進(jìn)行 數(shù)值修正。
3. 如權(quán)利要求1所述的方法,其特征在于,所述的時間分片包括:常規(guī)的時間分片和基 于購買行為的時間分片,其中所述常規(guī)的時間分片包括:按照自然日期分片、根據(jù)用戶每天 的行為及時間懲罰因子分片、按照日期從近至遠(yuǎn)間隔由短變長分片,所述基于購買行為的 時間分片方式指把用戶對品牌的時間行為序列以購買日期為切分點。
4. 如權(quán)利要求1所述的方法,其特征在于,所述的用戶特征包括:用戶的行為轉(zhuǎn)化比、 用戶的購買力、用戶的購買周期、用戶的涉獵廣度。
5. 如權(quán)利要求2所述的方法,其特征在于,所述的數(shù)值修正指通過log函數(shù)的進(jìn)行數(shù)值 修正。
6. -種電子商務(wù)推薦模型的用戶特征提取系統(tǒng),其特征在于,該系統(tǒng)包括時間分片模 塊、特征提取模塊,其中: 所述時間分片模塊用于將用戶對品牌的行為數(shù)據(jù)進(jìn)行時間分片,構(gòu)造不同時間片的用 戶行為特征序列; 所述特征提取模塊用于根據(jù)上述構(gòu)造的不同時間片的用戶行為特征序列,對用戶的整 體行為進(jìn)行分析,提取用戶特征。
7. 如權(quán)利要求6所述的系統(tǒng),其特征在于,該系統(tǒng)還包括數(shù)值修正模塊,所述數(shù)值修正 模塊用于對上述提取的用戶特征進(jìn)行數(shù)值修正。
8. 如權(quán)利要求6所述的系統(tǒng),其特征在于,所述的時間分片包括:常規(guī)的時間分片和基 于購買行為的時間分片,其中所述常規(guī)的時間分片包括:按照自然日期分片、根據(jù)用戶每天 的行為及時間懲罰因子分片、按照日期從近至遠(yuǎn)間隔由短變長分片,所述基于購買行為的 時間分片方式指把用戶對品牌的時間行為序列以購買日期為切分點。
9. 如權(quán)利要求6所述的系統(tǒng),其特征在于,所述的用戶特征包括:用戶的行為轉(zhuǎn)化比、 用戶的購買力、用戶的購買周期、用戶的涉獵廣度。
10. 如權(quán)利要求7所述的系統(tǒng),其特征在于,所述的數(shù)值修正指通過log函數(shù)的進(jìn)行數(shù) 值修正。
【文檔編號】G06Q30/02GK104331817SQ201410594664
【公開日】2015年2月4日 申請日期:2014年10月29日 優(yōu)先權(quán)日:2014年10月29日
【發(fā)明者】沈慧, 范小朋, 趙東輝, 須成忠 申請人:深圳先進(jìn)技術(shù)研究院
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
建水县| 清远市| 东乡族自治县| 长汀县| 元朗区| 义乌市| 辉县市| 云和县| 新乡市| 阿克| 金华市| 峨眉山市| 塔河县| 五家渠市| 民权县| 伊宁县| 兰溪市| 诏安县| 安吉县| 靖宇县| 七台河市| 敖汉旗| 北票市| 南皮县| 项城市| 延寿县| 高尔夫| 临澧县| 玛沁县| 木兰县| 东阳市| 广昌县| 荔波县| 榆中县| 通海县| 姚安县| 安徽省| 宁德市| 东台市| 东兴市| 宣威市|