欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種金融詐騙識(shí)別方法和系統(tǒng)與流程

文檔序號(hào):11921819閱讀:239來(lái)源:國(guó)知局
一種金融詐騙識(shí)別方法和系統(tǒng)與流程

本發(fā)明涉及金融服務(wù)領(lǐng)域,尤其涉及一種金融詐騙識(shí)別方法和系統(tǒng)。



背景技術(shù):

FDS系統(tǒng)(Fraud detection system,金融詐騙識(shí)別系統(tǒng))在互聯(lián)網(wǎng)金融交易過(guò)程中具有重要的作用,其通過(guò)對(duì)用戶的金融交易行為進(jìn)行大數(shù)據(jù)分析來(lái)判斷用戶當(dāng)前的行為是否屬于異常行為,從而判定當(dāng)前的金融交易是否存在金融詐騙。

目前,F(xiàn)DS系統(tǒng)的開(kāi)發(fā)面對(duì)著這諸多挑戰(zhàn),其中,正常用戶或詐騙者總是不定時(shí)的改變自己的消費(fèi)行為(Concept drift)和支持即時(shí)偵測(cè)(Supports real time detection)為較為重要的技術(shù)難點(diǎn)?,F(xiàn)有的FDS系統(tǒng)中使用的分類器,為了盡量降低Concept drift帶來(lái)的影響,在對(duì)大量的用戶行為進(jìn)行分析時(shí),包括正常行為和詐騙行為,需要耗費(fèi)大量時(shí)間,導(dǎo)致難以滿足即時(shí)偵測(cè)的要求,而由于金融詐騙的違法行為往往較為短暫,因此即時(shí)偵測(cè)又是檢驗(yàn)高效FDS系統(tǒng)實(shí)用性的重要標(biāo)準(zhǔn)之一。

因此,尋找一種既能降低Concept drift影響又能滿足即時(shí)偵測(cè)要求的FDS方法成為本領(lǐng)域技術(shù)人員的重要研究課題。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明實(shí)施例提供了一種金融詐騙識(shí)別方法和系統(tǒng),能夠滿足即時(shí)偵測(cè)的要求的同時(shí)降低Concept drift的影響,提高FDS的詐騙識(shí)別準(zhǔn)確率。

本發(fā)明實(shí)施例提供的一種金融詐騙識(shí)別方法,包括:

獲取目標(biāo)用戶的當(dāng)前交易行為數(shù)據(jù);

將所述當(dāng)前交易行為數(shù)據(jù)輸入底層分類器,得到所述底層分類器輸出的判定結(jié)果;

其中,所述底層分類器通過(guò)以下步驟訓(xùn)練得到:

獲取預(yù)設(shè)的上層分類器的分類器狀態(tài);

將獲取到的所述分類器狀態(tài)設(shè)置為所述底層分類器的初始化狀態(tài);

獲取目標(biāo)用戶的歷史交易行為數(shù)據(jù);

根據(jù)所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)生成基于用戶行為表現(xiàn)的第一聚集特征和第一時(shí)間特征;

將生成的所述第一聚集特征和第一時(shí)間特征確定為第一訓(xùn)練樣本的輸入;

將所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)的行為判定結(jié)果確定為所述第一訓(xùn)練樣本的輸出,所述行為判定結(jié)果為交易行為數(shù)據(jù)對(duì)應(yīng)的交易行為是否為詐騙行為的判定結(jié)果;

將所述第一訓(xùn)練樣本的輸入和輸出投入所述底層分類器進(jìn)行訓(xùn)練,得到完成訓(xùn)練的底層分類器。

可選地,所述上層分類器通過(guò)以下步驟預(yù)先訓(xùn)練得到:

搭建初始的上層分類器;

獲取作為樣本數(shù)據(jù)的各個(gè)用戶的交易行為數(shù)據(jù);

根據(jù)所述各個(gè)用戶的交易行為數(shù)據(jù)生成基于用戶基本狀態(tài)的第二聚集特征和第二時(shí)間特征;

將生成的所述第二聚集特征和第二時(shí)間特征確定為第二訓(xùn)練樣本的輸入;

將所述各個(gè)用戶的交易行為數(shù)據(jù)的行為判定結(jié)果確定為所述第二訓(xùn)練樣本的輸出;

將所述第二訓(xùn)練樣本的輸入和輸出投入所述上層分類器進(jìn)行訓(xùn)練,得到完成訓(xùn)練的上層分類器。

可選地,在得到完成訓(xùn)練的底層分類器之后,還包括:

獲取預(yù)設(shè)的分類器測(cè)試樣本;

將所述分類器測(cè)試樣本投入所述底層分類器,得到所述底層分類器輸出的測(cè)試判定結(jié)果;

對(duì)所述測(cè)試判定結(jié)果進(jìn)行ROC曲線評(píng)價(jià);

若ROC曲線評(píng)價(jià)不通過(guò),則返回執(zhí)行獲取作為樣本數(shù)據(jù)的各個(gè)用戶的交易行為數(shù)據(jù)的步驟。

可選地,根據(jù)所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)生成基于用戶行為表現(xiàn)的第一聚集特征包括:

從所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)中提取基于用戶行為表現(xiàn)的預(yù)設(shè)第一維度的第一原始特征;

根據(jù)所述預(yù)設(shè)第一維度與預(yù)設(shè)第一分類的映射關(guān)系對(duì)所述第一原始特征進(jìn)行整理,得到所述預(yù)設(shè)第一分類對(duì)應(yīng)的各個(gè)第一聚集特征;

根據(jù)所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)生成基于用戶行為表現(xiàn)的第一時(shí)間特征包括:

從所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)中提取基于用戶行為表現(xiàn)的各個(gè)第一時(shí)間變量特征;

根據(jù)預(yù)設(shè)的第一聚集時(shí)長(zhǎng)對(duì)所述各個(gè)第一時(shí)間變量特征進(jìn)行整理,得到與所述第一聚集時(shí)長(zhǎng)對(duì)應(yīng)的各個(gè)時(shí)間段的第一時(shí)間特征。

可選地,根據(jù)所述各個(gè)用戶的交易行為數(shù)據(jù)生成基于用戶基本狀態(tài)的第二聚集特征包括:

從所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)中提取基于用戶基本狀態(tài)的預(yù)設(shè)第二維度的第二原始特征;

根據(jù)所述預(yù)設(shè)第二維度與預(yù)設(shè)第二分類的映射關(guān)系對(duì)所述第二原始特征進(jìn)行整理,得到所述預(yù)設(shè)第二分類對(duì)應(yīng)的各個(gè)第二聚集特征;

根據(jù)所述各個(gè)用戶的交易行為數(shù)據(jù)生成基于用戶基本狀態(tài)的第二時(shí)間特征包括:

從所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)中提取基于用戶基本狀態(tài)的各個(gè)第二時(shí)間變量特征;

根據(jù)預(yù)設(shè)的第二聚集時(shí)長(zhǎng)對(duì)所述各個(gè)第二時(shí)間變量特征進(jìn)行整理,得到與所述第二聚集時(shí)長(zhǎng)對(duì)應(yīng)的各個(gè)時(shí)間段的第二時(shí)間特征。

本發(fā)明實(shí)施例提供的一種金融詐騙識(shí)別系統(tǒng),包括:

當(dāng)前數(shù)據(jù)獲取模塊,用于獲取目標(biāo)用戶的當(dāng)前交易行為數(shù)據(jù);

行為判定模塊,用于將所述當(dāng)前交易行為數(shù)據(jù)輸入底層分類器,得到所述底層分類器輸出的判定結(jié)果;

其中,所述底層分類器通過(guò)以下模塊訓(xùn)練得到:

分類器狀態(tài)獲取模塊,用于獲取預(yù)設(shè)的上層分類器的分類器狀態(tài);

初始狀態(tài)設(shè)置模塊,用于將獲取到的所述分類器狀態(tài)設(shè)置為所述底層分類器的初始化狀態(tài);

歷史數(shù)據(jù)獲取模塊,用于獲取目標(biāo)用戶的歷史交易行為數(shù)據(jù);

第一特征生成模塊,用于根據(jù)所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)生成基于用戶行為表現(xiàn)的第一聚集特征和第一時(shí)間特征;

第一樣本輸入確定模塊,用于將生成的所述第一聚集特征和第一時(shí)間特征確定為第一訓(xùn)練樣本的輸入;

第一樣本輸出確定模塊,用于將所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)的行為判定結(jié)果確定為所述第一訓(xùn)練樣本的輸出,所述行為判定結(jié)果為交易行為數(shù)據(jù)對(duì)應(yīng)的交易行為是否為詐騙行為的判定結(jié)果;

底層分類器訓(xùn)練模塊,用于將所述第一訓(xùn)練樣本的輸入和輸出投入所述底層分類器進(jìn)行訓(xùn)練,得到完成訓(xùn)練的底層分類器。

可選地,所述上層分類器通過(guò)以下模塊預(yù)先訓(xùn)練得到:

上層分類器搭建模塊,用于搭建初始的上層分類器;

樣本行為數(shù)據(jù)獲取模塊,用于獲取作為樣本數(shù)據(jù)的各個(gè)用戶的交易行為數(shù)據(jù);

第二特征生成模塊,用于根據(jù)所述各個(gè)用戶的交易行為數(shù)據(jù)生成基于用戶基本狀態(tài)的第二聚集特征和第二時(shí)間特征;

第二樣本輸入確定模塊,用于將生成的所述第二聚集特征和第二時(shí)間特征確定為第二訓(xùn)練樣本的輸入;

第二樣本輸出確定模塊,用于將所述各個(gè)用戶的交易行為數(shù)據(jù)的行為判定結(jié)果確定為所述第二訓(xùn)練樣本的輸出;

上層分類器訓(xùn)練模塊,用于將所述第二訓(xùn)練樣本的輸入和輸出投入所述上層分類器進(jìn)行訓(xùn)練,得到完成訓(xùn)練的上層分類器。

可選地,所述金融詐騙識(shí)別系統(tǒng)還包括:

測(cè)試樣本獲取模塊,用于獲取預(yù)設(shè)的分類器測(cè)試樣本;

測(cè)試判定模塊,用于將所述分類器測(cè)試樣本投入所述底層分類器,得到所述底層分類器輸出的測(cè)試判定結(jié)果;

判定結(jié)果評(píng)價(jià)模塊,用于對(duì)所述測(cè)試判定結(jié)果進(jìn)行ROC曲線評(píng)價(jià);

觸發(fā)模塊,用于若所述判定結(jié)果評(píng)價(jià)模塊的評(píng)價(jià)結(jié)果為不通過(guò),則返回觸發(fā)所述樣本行為數(shù)據(jù)獲取模塊。

可選地,所述第一特征生成模塊包括:

第一聚集特征生成子模塊,用于根據(jù)所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)生成基于用戶行為表現(xiàn)的第一聚集特征;

第一時(shí)間特征生成子模塊,用于根據(jù)所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)生成基于用戶行為表現(xiàn)的第一時(shí)間特征;

所述第一聚集特征生成子模塊包括:

第一原始特征提取單元,用于從所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)中提取基于用戶行為表現(xiàn)的預(yù)設(shè)第一維度的第一原始特征;

第一聚集特征整理單元,用于根據(jù)所述預(yù)設(shè)第一維度與預(yù)設(shè)第一分類的映射關(guān)系對(duì)所述第一原始特征進(jìn)行整理,得到所述預(yù)設(shè)第一分類對(duì)應(yīng)的各個(gè)第一聚集特征;

所述第一時(shí)間特征生成子模塊包括:

第一變量特征提取單元,用于從所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)中提取基于用戶行為表現(xiàn)的各個(gè)第一時(shí)間變量特征;

第一時(shí)間特征整理單元,用于根據(jù)預(yù)設(shè)的第一聚集時(shí)長(zhǎng)對(duì)所述各個(gè)第一時(shí)間變量特征進(jìn)行整理,得到與所述第一聚集時(shí)長(zhǎng)對(duì)應(yīng)的各個(gè)時(shí)間段的第一時(shí)間特征。

可選地,所述第二特征生成模塊包括:

第二聚集特征生成子模塊,用于根據(jù)所述各個(gè)用戶的交易行為數(shù)據(jù)生成基于用戶基本狀態(tài)的第二聚集特征;

第二時(shí)間特征生成子模塊,用于根據(jù)所述各個(gè)用戶的交易行為數(shù)據(jù)生成基于用戶基本狀態(tài)的第二時(shí)間特征;

所述第二聚集特征生成子模塊包括:

第二原始特征提取單元,用于從所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)中提取基于用戶基本狀態(tài)的預(yù)設(shè)第二維度的第二原始特征;

第二聚集特征整理單元,用于根據(jù)所述預(yù)設(shè)第二維度與預(yù)設(shè)第二分類的映射關(guān)系對(duì)所述第二原始特征進(jìn)行整理,得到所述預(yù)設(shè)第二分類對(duì)應(yīng)的各個(gè)第二聚集特征;

所述第二時(shí)間特征生成子模塊包括:

第二變量特征提取單元,用于從所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)中提取基于用戶基本狀態(tài)的各個(gè)第二時(shí)間變量特征;

第二時(shí)間特征整理單元,用于根據(jù)預(yù)設(shè)的第二聚集時(shí)長(zhǎng)對(duì)所述各個(gè)第二時(shí)間變量特征進(jìn)行整理,得到與所述第二聚集時(shí)長(zhǎng)對(duì)應(yīng)的各個(gè)時(shí)間段的第二時(shí)間特征。

從以上技術(shù)方案可以看出,本發(fā)明實(shí)施例具有以下優(yōu)點(diǎn):

本發(fā)明實(shí)施例中,首先,獲取目標(biāo)用戶的當(dāng)前交易行為數(shù)據(jù);然后,將所述當(dāng)前交易行為數(shù)據(jù)輸入底層分類器,得到所述底層分類器輸出的判定結(jié)果;其中,所述底層分類器通過(guò)以下步驟訓(xùn)練得到:獲取預(yù)設(shè)的上層分類器的分類器狀態(tài);將獲取到的所述分類器狀態(tài)設(shè)置為所述底層分類器的初始化狀態(tài);獲取目標(biāo)用戶的歷史交易行為數(shù)據(jù);根據(jù)所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)生成基于用戶行為表現(xiàn)的第一聚集特征和第一時(shí)間特征;將生成的所述第一聚集特征和第一時(shí)間特征確定為第一訓(xùn)練樣本的輸入;將所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)的行為判定結(jié)果確定為所述第一訓(xùn)練樣本的輸出,所述行為判定結(jié)果為交易行為數(shù)據(jù)對(duì)應(yīng)的交易行為是否為詐騙行為的判定結(jié)果;將所述第一訓(xùn)練樣本的輸入和輸出投入所述底層分類器進(jìn)行訓(xùn)練,得到完成訓(xùn)練的底層分類器。在本發(fā)明實(shí)施例中,通過(guò)上層分類器提供的分類器狀態(tài)作為底層分類器的初始化狀態(tài),再針對(duì)地采用目標(biāo)用戶的歷史交易行為數(shù)據(jù)對(duì)底層分類器進(jìn)行訓(xùn)練,訓(xùn)練后對(duì)目標(biāo)用戶的當(dāng)前交易行為數(shù)據(jù)進(jìn)行識(shí)別判斷,得到判定結(jié)果。對(duì)于底層分類器,可以避免對(duì)大量的用戶行為進(jìn)行分析,大大減少了分析耗時(shí),提高了識(shí)別判定的效率,滿足即時(shí)偵測(cè)的要求;同時(shí),由針對(duì)目標(biāo)用戶的歷史交易行為進(jìn)行定制訓(xùn)練,最大程度地降低了Concept drift的影響,提高了FDS的詐騙識(shí)別準(zhǔn)確率。

附圖說(shuō)明

圖1為本發(fā)明實(shí)施例中一種金融詐騙識(shí)別方法一個(gè)實(shí)施例流程圖;

圖2為本發(fā)明實(shí)施例中底層分類器的訓(xùn)練步驟流程示意圖;

圖3為本發(fā)明實(shí)施例中上層分類器的訓(xùn)練步驟流程示意圖;

圖4為本發(fā)明實(shí)施例中一個(gè)應(yīng)用場(chǎng)景下由上層分類器和底層分類器組成的FDS系統(tǒng)的構(gòu)架圖;

圖5為本發(fā)明實(shí)施例中一種金融詐騙識(shí)別方法的對(duì)底層分類器進(jìn)行ROC曲線評(píng)價(jià)的流程示意圖;

圖6為本發(fā)明實(shí)施例中一個(gè)應(yīng)用場(chǎng)景下基于von Mises分布的用戶消費(fèi)時(shí)間分析示例示意圖;

圖7為本發(fā)明實(shí)施例中一種金融詐騙識(shí)別系統(tǒng)一個(gè)實(shí)施例示意圖。

具體實(shí)施方式

本發(fā)明實(shí)施例提供了一種金融詐騙識(shí)別方法和系統(tǒng),用于解決現(xiàn)有FDS在降低Concept drift影響同時(shí)難以滿足即時(shí)偵測(cè)要求的問(wèn)題。

為使得本發(fā)明的發(fā)明目的、特征、優(yōu)點(diǎn)能夠更加的明顯和易懂,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,下面所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而非全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

請(qǐng)參閱圖1,本發(fā)明實(shí)施例中一種金融詐騙識(shí)別方法一個(gè)實(shí)施例包括:

101、獲取目標(biāo)用戶的當(dāng)前交易行為數(shù)據(jù);

102、將所述當(dāng)前交易行為數(shù)據(jù)輸入底層分類器,得到所述底層分類器輸出的判定結(jié)果。

本實(shí)施例中,當(dāng)目標(biāo)用戶發(fā)生交易行為時(shí),可以獲取到目標(biāo)用戶的當(dāng)前交易行為數(shù)據(jù)。本發(fā)明的目的是,通過(guò)該金融詐騙識(shí)別方法準(zhǔn)確地識(shí)別出該目標(biāo)用戶當(dāng)前的交易行為是正常行為還是詐騙行為。

對(duì)于上述步驟102,在獲取目標(biāo)用戶的當(dāng)前交易行為數(shù)據(jù)之后,可以將所述當(dāng)前交易行為數(shù)據(jù)輸入底層分類器,得到所述底層分類器輸出的判定結(jié)果??梢岳斫獾氖?,為了使得底層分類器滿足FDS系統(tǒng)即時(shí)偵測(cè)的要求,該底層分類器應(yīng)該盡可能地簡(jiǎn)易以及小型化。在當(dāng)前交易行為數(shù)據(jù)輸入底層分類器后,底層分類器可以快速地得到判定結(jié)果并輸出。若當(dāng)前交易行為數(shù)據(jù)被底層分類器判定為正常行為,則可以輸出“1”;反之,若當(dāng)前交易行為數(shù)據(jù)被底層分類器判定為詐騙行為,則可以輸出“0”。

其中,如圖2所示,所述底層分類器可以通過(guò)以下步驟訓(xùn)練得到:

201、獲取預(yù)設(shè)的上層分類器的分類器狀態(tài);

202、將獲取到的所述分類器狀態(tài)設(shè)置為所述底層分類器的初始化狀態(tài);

203、獲取目標(biāo)用戶的歷史交易行為數(shù)據(jù);

204、根據(jù)所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)生成基于用戶行為表現(xiàn)的第一聚集特征和第一時(shí)間特征;

205、將生成的所述第一聚集特征和第一時(shí)間特征確定為第一訓(xùn)練樣本的輸入;

206、將所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)的行為判定結(jié)果確定為所述第一訓(xùn)練樣本的輸出,所述行為判定結(jié)果為交易行為數(shù)據(jù)對(duì)應(yīng)的交易行為是否為詐騙行為的判定結(jié)果;

207、將所述第一訓(xùn)練樣本的輸入和輸出投入所述底層分類器進(jìn)行訓(xùn)練,得到完成訓(xùn)練的底層分類器。

對(duì)于上述步驟201和202,由于底層分類器的簡(jiǎn)易和小型化容易導(dǎo)致底層分類器難以通過(guò)較少的交易數(shù)據(jù)來(lái)準(zhǔn)確識(shí)別出當(dāng)前交易行為是否為詐騙行為,導(dǎo)致不能降低Concept drift的影響。因此,本實(shí)施例中,通過(guò)預(yù)設(shè)的上層分類器為底層分類器承擔(dān)龐大的交易數(shù)據(jù)分析任務(wù)。該上層分類器預(yù)先完成了對(duì)大量的用戶行為數(shù)據(jù)進(jìn)行分析訓(xùn)練,然后提供一個(gè)統(tǒng)一的分類器狀態(tài)作為該底層分類器的初始化狀態(tài),從而為底層分類器降低Concept drift的影響,提高底層分類器識(shí)別詐騙行為的準(zhǔn)確性。

對(duì)于上述步驟203,針對(duì)目標(biāo)用戶定制底層分類器時(shí),可以獲取目標(biāo)用戶的歷史交易行為數(shù)據(jù)。該歷史交易行為數(shù)據(jù)為目標(biāo)用戶的個(gè)人行為信息,例如包括該目標(biāo)用戶的首次交易數(shù)據(jù)、首次注冊(cè)數(shù)據(jù)、常用的IP地址等等。

對(duì)于上述步驟204,在獲取目標(biāo)用戶的歷史交易行為數(shù)據(jù)之后,可以根據(jù)所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)生成基于用戶行為表現(xiàn)的第一聚集特征和第一時(shí)間特征。上述的用戶行為表現(xiàn),是指目標(biāo)用戶的個(gè)人行為表現(xiàn),這些行為表現(xiàn)體現(xiàn)的是用戶的個(gè)人特性,而非全體用戶或者大多數(shù)用戶的共性特征。例如,目標(biāo)用戶常用的網(wǎng)絡(luò)交易的IP地址,由于每個(gè)IP地址對(duì)于用戶來(lái)說(shuō)是獨(dú)有的,因此該IP地址可以反應(yīng)用戶的個(gè)人特征,屬于基于用戶行為表現(xiàn)的特征。本實(shí)施例中,與“用戶行為表現(xiàn)”相對(duì)的,是“用戶基本狀態(tài)”,上述的用戶基本狀態(tài)是指目標(biāo)用戶對(duì)應(yīng)的用戶群體的基本狀態(tài),這些基本狀態(tài)體現(xiàn)的是用戶群體的共性特征。例如,絕大多數(shù)用戶會(huì)在白天進(jìn)行購(gòu)物、餐飲消費(fèi)的時(shí)間段為早午晚的用餐時(shí)間段、部分職業(yè)的用戶會(huì)常常連續(xù)訂購(gòu)多張飛機(jī)票,等等。這些共性特征可以反映一個(gè)用戶群體的基本狀態(tài)。

上述的第一聚集特征是指基于用戶行為表現(xiàn)的聚集特征,上述的第一時(shí)間特征是指基于用戶行為表現(xiàn)的時(shí)間特征。本實(shí)施例中關(guān)于聚集特征和時(shí)間特征的生成方法,將在后續(xù)內(nèi)容中進(jìn)行描述。

對(duì)于上述步驟205、206和207,將第一聚集特征和第一時(shí)間特征確定為第一訓(xùn)練樣本的輸入,將歷史交易行為數(shù)據(jù)的行為判定結(jié)果確定為所述第一訓(xùn)練樣本的輸出,然后將第一訓(xùn)練樣本的輸入和輸出投入底層分類器進(jìn)行訓(xùn)練,完成訓(xùn)練后,即可得到針對(duì)目標(biāo)用戶定制化的底層分類器。可以理解的是,對(duì)于該底層分類器,若目標(biāo)用戶的歷史交易行為數(shù)據(jù)越多、數(shù)據(jù)量越龐大,則底層分類器的學(xué)習(xí)效果越好,其對(duì)目標(biāo)用戶的行為判定越準(zhǔn)確。

進(jìn)一步地,如圖3所示,上述的上層分類器可以通過(guò)以下步驟預(yù)先訓(xùn)練得到:

301、搭建初始的上層分類器;

302、獲取作為樣本數(shù)據(jù)的各個(gè)用戶的交易行為數(shù)據(jù);

303、根據(jù)所述各個(gè)用戶的交易行為數(shù)據(jù)生成基于用戶基本狀態(tài)的第二聚集特征和第二時(shí)間特征;

304、將生成的所述第二聚集特征和第二時(shí)間特征確定為第二訓(xùn)練樣本的輸入;

305、將所述各個(gè)用戶的交易行為數(shù)據(jù)的行為判定結(jié)果確定為所述第二訓(xùn)練樣本的輸出;

306、將所述第二訓(xùn)練樣本的輸入和輸出投入所述上層分類器進(jìn)行訓(xùn)練,得到完成訓(xùn)練的上層分類器。

對(duì)于上述步驟301,該基于用戶橫向整體狀態(tài)(或能力)的上層分類器可以采用基于TensorFlow的人工神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)算法進(jìn)行搭建。

對(duì)于上述步驟302,對(duì)于上層分類器進(jìn)行訓(xùn)練時(shí),由于上層分類器需要為底層分類器承擔(dān)大量的用戶行為數(shù)據(jù)分析工作,從而獲取到用戶群體的共性特征。因此,用于訓(xùn)練上層分類器的樣本應(yīng)當(dāng)包含各個(gè)用戶的交易行為數(shù)據(jù),而不是針對(duì)某個(gè)特定用戶的交易行為數(shù)據(jù)。另外,可以理解的是,各個(gè)用戶的交易行為數(shù)據(jù)中應(yīng)當(dāng)包含正樣本和負(fù)樣本,即既包含有正常行為的交易行為數(shù)據(jù),也包含有詐騙行為的交易行為數(shù)據(jù),以提高上層分類器的準(zhǔn)確性。本實(shí)施例中,對(duì)于正負(fù)樣本偏差(Skewed class distribution)可以從以下幾種策略中進(jìn)行選?。?/p>

(1).欠采樣法–保持正樣本數(shù)量不變,隨機(jī)依次減少負(fù)樣本數(shù)量,使正負(fù)樣本比為1:1,1:2,1:3,1:4…,并訓(xùn)練模型。通過(guò)測(cè)試選擇最佳的正負(fù)樣本比。

(2).代價(jià)敏感學(xué)習(xí)法–通過(guò)設(shè)定不同的代價(jià)變量取值(如FN(falsely consider the real bad guy as the good one,未能偵測(cè))=0.01FP(falsely kill the good guy,錯(cuò)誤預(yù)警),F(xiàn)N=0.1FP,F(xiàn)N=10FP,F(xiàn)N=100FP等)來(lái)構(gòu)建不同的代價(jià)矩陣,并訓(xùn)練相應(yīng)模型。通過(guò)測(cè)試選擇最佳的代價(jià)矩陣。

(3).欠采樣-代價(jià)敏感學(xué)習(xí)結(jié)合法–針對(duì)每一類通過(guò)欠采樣法修改正負(fù)樣本比的訓(xùn)練數(shù)據(jù),都進(jìn)行一次代價(jià)敏感學(xué)習(xí),并訓(xùn)練模型。通過(guò)測(cè)試選擇最佳的正負(fù)樣本比-代價(jià)矩陣組合。

然后,可以通過(guò)(1),(2),(3)每種策略N次不同樣本訓(xùn)練測(cè)試結(jié)果的均值來(lái)選取最佳的樣本策略,盡量降低正負(fù)樣本偏差所帶來(lái)的影響。

對(duì)于上述步驟303,在獲取作為樣本數(shù)據(jù)的各個(gè)用戶的交易行為數(shù)據(jù)之后,可以根據(jù)所述各個(gè)用戶的交易行為數(shù)據(jù)生成基于用戶基本狀態(tài)的第二聚集特征和第二時(shí)間特征。其中,上述的“用戶基本狀態(tài)”已在上述步驟204中描述,此處不再贅述??芍鲜龅牡诙奂卣魇侵富谟脩艋緺顟B(tài)的聚集特征,上述的第二時(shí)間特征是指基于用戶基本狀態(tài)的時(shí)間特征。本實(shí)施例中關(guān)于聚集特征和時(shí)間特征的生成方法,將在后續(xù)內(nèi)容中進(jìn)行描述。

對(duì)于上述步驟304、305和306,將第二聚集特征和第二時(shí)間特征確定為第二訓(xùn)練樣本的輸入,將交易行為數(shù)據(jù)的行為判定結(jié)果確定為所述第二訓(xùn)練樣本的輸出,然后將第二訓(xùn)練樣本的輸入和輸出投入上層分類器進(jìn)行訓(xùn)練,完成訓(xùn)練后,即可得到各個(gè)用戶或群體用戶行為的上層分類器??梢岳斫獾氖牵瑢?duì)于該上層分類器,若各個(gè)用戶的交易行為數(shù)據(jù)越多、數(shù)據(jù)量越龐大,則上層分類器的學(xué)習(xí)效果越好,上層分類器的識(shí)別能力也越強(qiáng)大。在上層分類器訓(xùn)練完成之后,可以將上層分類器的分類器狀態(tài)設(shè)置為底層分類器狀態(tài),以降低底層分類器的Concept drift的影響,提升底層分類器的識(shí)別能力。

圖4示出了由上層分類器和底層分類器組成的FDS系統(tǒng)的構(gòu)架圖。如圖4所示,本發(fā)明通過(guò)原始高緯度訓(xùn)練數(shù)據(jù)衍生出能夠反映用戶消費(fèi)行為動(dòng)態(tài)變化的聚集特征和時(shí)間特征,通過(guò)各個(gè)用戶i具體在時(shí)間t實(shí)時(shí)消費(fèi)的新特征來(lái)訓(xùn)練通過(guò)整體數(shù)據(jù)訓(xùn)練的上層分類器,從而得到針對(duì)特定用戶在時(shí)間t的底層分類器,實(shí)現(xiàn)即時(shí)高效的互聯(lián)網(wǎng)金融FDS。

因此,為了確保底層分類器訓(xùn)練完成,還可以對(duì)底層分類器進(jìn)行ROC曲線評(píng)價(jià),如圖5所示,包括:

501、獲取預(yù)設(shè)的分類器測(cè)試樣本;

502、將所述分類器測(cè)試樣本投入所述底層分類器,得到所述底層分類器輸出的測(cè)試判定結(jié)果;

503、對(duì)所述測(cè)試判定結(jié)果進(jìn)行ROC曲線評(píng)價(jià);

504、若ROC曲線評(píng)價(jià)不通過(guò),則返回執(zhí)行步驟302,重新訓(xùn)練上層分類器和底層分類器,直至ROC曲線評(píng)價(jià)通過(guò)后,整個(gè)FDS系統(tǒng)訓(xùn)練完成。

在本實(shí)施例的FDS系統(tǒng)中,針對(duì)用戶交易行為數(shù)據(jù)進(jìn)行特征工程處理,即聚集特征和時(shí)間特征的確定。

聚集特征

用戶的聚集特征將用戶過(guò)去一段時(shí)間內(nèi)的消費(fèi)記錄(交易行為數(shù)據(jù))通過(guò)用戶ID、消費(fèi)金額、消費(fèi)地點(diǎn)等原數(shù)據(jù)始特征有機(jī)的整合在一起,例如,用戶k聚集特征1為:過(guò)去24小時(shí)內(nèi)在A城市的消費(fèi)金額總量;用戶k聚集特征2為:過(guò)去24小時(shí)內(nèi)在A城市的消費(fèi)次數(shù)。一般的,可以定義滿足條件子集Condi且聚集時(shí)長(zhǎng)為τ的消費(fèi)子集為:

其中tj表示第j筆消費(fèi)的時(shí)間,Dk表示用戶k的消費(fèi)記錄全集,SELECT為篩選函數(shù)。于是,滿足不同條件的聚集特征即可通過(guò)復(fù)雜度為O(1)的計(jì)算符來(lái)獲得,例如次數(shù)

其中count為計(jì)數(shù)函數(shù);例如消費(fèi)金額

再例如消費(fèi)金額占T時(shí)間內(nèi)總消費(fèi)金額的比例

表一示例了由6維原始特征所衍生出來(lái)的5類聚集特征。其中θ1表示用戶0在消費(fèi)記錄Trc#_i(i=1,2,3…)過(guò)去24小時(shí)內(nèi)的交易數(shù)量;θ2表示用戶0在消費(fèi)記錄Trc#_i過(guò)去24小時(shí)內(nèi)的交易額;θ3表示用戶0在消費(fèi)記錄Trc#_i過(guò)去24小時(shí)內(nèi)同一種消費(fèi)類型的交易數(shù)量;θ4表示用戶0在消費(fèi)記錄Trc#_i過(guò)去24小時(shí)內(nèi)同一消費(fèi)地點(diǎn)的交易數(shù)量;θ5表示用戶0在消費(fèi)記錄Trc#_i過(guò)去24小時(shí)內(nèi)同一種消費(fèi)類型且同一消費(fèi)地點(diǎn)的交易數(shù)量。

表一

而上述的第一聚集特征是指基于用戶行為表現(xiàn)的聚集特征,上述的第二聚集特征是指基于用戶基本狀態(tài)的聚集特征,由上述內(nèi)容可知,對(duì)于第一聚集特征和第二聚集特征的確定過(guò)程均類似,不同之處在于,衍生得到第一聚集特征所需的原始特征和衍生得到第二聚集特征所需的原始特征不相同。由于基于用戶行為表現(xiàn)與基于用戶基本狀態(tài)的不同,衍生得到第一聚集特征所需的原始特征更傾向于用戶的個(gè)人特性,例如用戶的IP地址、用戶的MAC地址、用戶的登陸地等;而衍生得到第二聚集特征所需的原始特征更傾向于用戶群體的共性特征,例如授信額度(當(dāng)前剩余授信額度/當(dāng)前授信額度)、額度調(diào)整頻率((最近一次調(diào)整額度日期-首次授信日期)/額度調(diào)整次數(shù))、貸款狀態(tài)(目前活躍的貸款筆數(shù)/貸款筆數(shù))等。

因此,根據(jù)所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)生成基于用戶行為表現(xiàn)的第一聚集特征具體可以包括:從所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)中提取基于用戶行為表現(xiàn)的預(yù)設(shè)第一維度的第一原始特征;根據(jù)所述預(yù)設(shè)第一維度與預(yù)設(shè)第一分類的映射關(guān)系對(duì)所述第一原始特征進(jìn)行整理,得到所述預(yù)設(shè)第一分類對(duì)應(yīng)的各個(gè)第一聚集特征;而,根據(jù)所述各個(gè)用戶的交易行為數(shù)據(jù)生成基于用戶基本狀態(tài)的第二聚集特征具體可以包括:從所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)中提取基于用戶基本狀態(tài)的預(yù)設(shè)第二維度的第二原始特征;根據(jù)所述預(yù)設(shè)第二維度與預(yù)設(shè)第二分類的映射關(guān)系對(duì)所述第二原始特征進(jìn)行整理,得到所述預(yù)設(shè)第二分類對(duì)應(yīng)的各個(gè)第二聚集特征。

時(shí)間特征

在FDS系統(tǒng)內(nèi),除了聚集特征能夠反映的用戶消費(fèi)習(xí)慣外,還有另外一個(gè)層面的用戶消費(fèi)習(xí)慣–用戶消費(fèi)時(shí)間。一般的,用戶通常會(huì)在每天相似的小時(shí)內(nèi)(Day/Hour),或每周相似的天數(shù)內(nèi)(Week/Day),或每月相似的周內(nèi)(Month/Week),或每年相似的月份內(nèi)(Year/Month)進(jìn)行消費(fèi)。這里的相似時(shí)間段并不能夠通過(guò)傳統(tǒng)的算術(shù)平均數(shù)來(lái)表示,因?yàn)樗阈g(shù)平均數(shù)未能反映時(shí)間的周期性特征,例如,對(duì)于發(fā)生在1:00,3:00,20:00,21:00,23:00這5次消費(fèi)來(lái)說(shuō),算數(shù)平均消費(fèi)時(shí)間為13:36,然而,并沒(méi)有一次消費(fèi)記錄發(fā)生在接近13:36。本實(shí)施例可以通過(guò)von Mises(馮·米塞斯)分布將用戶消費(fèi)時(shí)間變量轉(zhuǎn)化為一種周期變量,從而通過(guò)預(yù)定義的顯著水平α來(lái)構(gòu)造用戶消費(fèi)時(shí)間的置信區(qū)間。因此,基于布爾特性的時(shí)間特征便可生成:0表示新的消費(fèi)記錄時(shí)間在置信區(qū)間內(nèi);1表示新的消費(fèi)記錄沒(méi)有在置信區(qū)間內(nèi)。

對(duì)于時(shí)間特征分析,具體的,根據(jù)給定的時(shí)間變量子集I={t1,t2,...tn},von Mises分布定義為:

其中μvm和σvm分別表示周期均值和周期標(biāo)準(zhǔn)差:

圖6示出了基于von Mises分布的用戶消費(fèi)時(shí)間分析示例(Day/Hour)。如圖6所示,基于von Mises分布的用戶時(shí)間特征分析示例(Day/Hour)中,黑色直實(shí)線指向表示消費(fèi)時(shí)間;黑直實(shí)線長(zhǎng)短表示消費(fèi)次數(shù);實(shí)線601表示算數(shù)平均消費(fèi);實(shí)線602表示周期平均消費(fèi);橢圓形虛線區(qū)域61表示擬合的von Mises概率分布;扇形區(qū)域62表示顯著水平為α的消費(fèi)時(shí)間置信區(qū)間。

本實(shí)施例從實(shí)際數(shù)據(jù)維度出發(fā),可以通過(guò)基于Grid Search的思想衍生出高效的FDS聚集特征;同時(shí),根據(jù)對(duì)比由不同聚集時(shí)長(zhǎng)τ(例如24小時(shí),48小時(shí),72小時(shí)等等)衍生出聚集特征的FDS表現(xiàn)來(lái)確定最能反映用戶消費(fèi)習(xí)慣的τ。進(jìn)一步地,為了使底層分類器對(duì)concept drift更敏感,可以將根據(jù)用戶實(shí)際消費(fèi)數(shù)據(jù)找出一年中不同時(shí)段的最佳τ,從而最大限度的降低FP和FN。針對(duì)每一個(gè)用戶提取其不同時(shí)間段(年、月、周、日)內(nèi)的消費(fèi)時(shí)間特征作為底層分類器的訓(xùn)練數(shù)據(jù),從消費(fèi)時(shí)間的維度上衡量用戶消費(fèi)習(xí)慣。本實(shí)施例通過(guò)不同時(shí)間段的消費(fèi)時(shí)間特征以及聚集特征,可以進(jìn)一步使得簡(jiǎn)易的底層分類器更有效地映射concept drift。

對(duì)于時(shí)間特征,上述的第一時(shí)間特征是指基于用戶行為表現(xiàn)的時(shí)間特征,上述的第二時(shí)間特征是指基于用戶基本狀態(tài)的時(shí)間特征。由上述內(nèi)容可知,對(duì)于第一時(shí)間特征和第二時(shí)間特征的確定過(guò)程均類似,不同之處在于,由于基于用戶行為表現(xiàn)與基于用戶基本狀態(tài)的不同,整理得到第一時(shí)間特征所需的時(shí)間變量特征更傾向于用戶的個(gè)人特性,例如用戶首次交易成功的時(shí)間、首次注冊(cè)成功的時(shí)間、第二次交易成功的時(shí)間、首次注冊(cè)成功的時(shí)間等;而整理得到第二時(shí)間特征所需的時(shí)間變量特征更傾向于用戶的個(gè)人特性,用戶群體的共性特征,例如月消費(fèi)時(shí)段(一個(gè)月內(nèi)用戶傾向于在那幾天進(jìn)行消費(fèi))。

因此,根據(jù)所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)生成基于用戶行為表現(xiàn)的第一時(shí)間特征具體可以包括:從所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)中提取基于用戶行為表現(xiàn)的各個(gè)第一時(shí)間變量特征;根據(jù)預(yù)設(shè)的第一聚集時(shí)長(zhǎng)對(duì)所述各個(gè)第一時(shí)間變量特征進(jìn)行整理,得到與所述第一聚集時(shí)長(zhǎng)對(duì)應(yīng)的各個(gè)時(shí)間段的第一時(shí)間特征。而,根據(jù)所述各個(gè)用戶的交易行為數(shù)據(jù)生成基于用戶基本狀態(tài)的第二時(shí)間特征具體可以包括:從所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)中提取基于用戶基本狀態(tài)的各個(gè)第二時(shí)間變量特征;根據(jù)預(yù)設(shè)的第二聚集時(shí)長(zhǎng)對(duì)所述各個(gè)第二時(shí)間變量特征進(jìn)行整理,得到與所述第二聚集時(shí)長(zhǎng)對(duì)應(yīng)的各個(gè)時(shí)間段的第二時(shí)間特征。

在本實(shí)施例中,通過(guò)上層分類器提供的分類器狀態(tài)作為底層分類器的初始化狀態(tài),再針對(duì)地采用目標(biāo)用戶的歷史交易行為數(shù)據(jù)對(duì)底層分類器進(jìn)行訓(xùn)練,訓(xùn)練后對(duì)目標(biāo)用戶的當(dāng)前交易行為數(shù)據(jù)進(jìn)行識(shí)別判斷,得到判定結(jié)果。對(duì)于底層分類器,可以避免對(duì)大量的用戶行為進(jìn)行分析,大大減少了分析耗時(shí),提高了識(shí)別判定的效率,滿足即時(shí)偵測(cè)的要求;同時(shí),由針對(duì)目標(biāo)用戶的歷史交易行為進(jìn)行定制訓(xùn)練,最大程度地降低了Concept drift的影響,提高了FDS的詐騙識(shí)別準(zhǔn)確率。

另外,本發(fā)明實(shí)施例中,提出了一種結(jié)合聚集/時(shí)間特征訓(xùn)練和上層分類器/底層分類器的高效FDS。通過(guò)Data feature reduction由原始特征衍生的聚集特征和時(shí)間特征能夠很好的擬合Concept drift,通過(guò)結(jié)合數(shù)據(jù)平衡法和算法平衡法糾正的Skewed class distribution來(lái)訓(xùn)練基于數(shù)據(jù)整體的后臺(tái)上層分類器;針對(duì)每一個(gè)用戶特定的歷史交易行為數(shù)據(jù)設(shè)定基于后臺(tái)上層分類器的前臺(tái)底層分類器。前臺(tái)底層分類器由用戶個(gè)體的交易行為數(shù)據(jù)訓(xùn)練得來(lái),因此可以滿足特定用戶快速準(zhǔn)確的消費(fèi)分類定位,從而實(shí)現(xiàn)即時(shí)偵測(cè)的高效FDS。

上面主要描述了一種金融詐騙識(shí)別方法,下面將對(duì)一種金融詐騙識(shí)別系統(tǒng)進(jìn)行詳細(xì)描述。

圖7示出了本發(fā)明實(shí)施例中一種金融詐騙識(shí)別系統(tǒng)一個(gè)實(shí)施例示意圖。

本實(shí)施例中,一種金融詐騙識(shí)別系統(tǒng)包括:

當(dāng)前數(shù)據(jù)獲取模塊701,用于獲取目標(biāo)用戶的當(dāng)前交易行為數(shù)據(jù);

行為判定模塊702,用于將所述當(dāng)前交易行為數(shù)據(jù)輸入底層分類器,得到所述底層分類器輸出的判定結(jié)果;

其中,所述底層分類器通過(guò)以下模塊訓(xùn)練得到:

分類器狀態(tài)獲取模塊,用于獲取預(yù)設(shè)的上層分類器的分類器狀態(tài);

初始狀態(tài)設(shè)置模塊,用于將獲取到的所述分類器狀態(tài)設(shè)置為所述底層分類器的初始化狀態(tài);

歷史數(shù)據(jù)獲取模塊,用于獲取目標(biāo)用戶的歷史交易行為數(shù)據(jù);

第一特征生成模塊,用于根據(jù)所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)生成基于用戶行為表現(xiàn)的第一聚集特征和第一時(shí)間特征;

第一樣本輸入確定模塊,用于將生成的所述第一聚集特征和第一時(shí)間特征確定為第一訓(xùn)練樣本的輸入;

第一樣本輸出確定模塊,用于將所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)的行為判定結(jié)果確定為所述第一訓(xùn)練樣本的輸出,所述行為判定結(jié)果為交易行為數(shù)據(jù)對(duì)應(yīng)的交易行為是否為詐騙行為的判定結(jié)果;

底層分類器訓(xùn)練模塊,用于將所述第一訓(xùn)練樣本的輸入和輸出投入所述底層分類器進(jìn)行訓(xùn)練,得到完成訓(xùn)練的底層分類器。

進(jìn)一步地,所述上層分類器可以通過(guò)以下模塊預(yù)先訓(xùn)練得到:

上層分類器搭建模塊,用于搭建初始的上層分類器;

樣本行為數(shù)據(jù)獲取模塊,用于獲取作為樣本數(shù)據(jù)的各個(gè)用戶的交易行為數(shù)據(jù);

第二特征生成模塊,用于根據(jù)所述各個(gè)用戶的交易行為數(shù)據(jù)生成基于用戶基本狀態(tài)的第二聚集特征和第二時(shí)間特征;

第二樣本輸入確定模塊,用于將生成的所述第二聚集特征和第二時(shí)間特征確定為第二訓(xùn)練樣本的輸入;

第二樣本輸出確定模塊,用于將所述各個(gè)用戶的交易行為數(shù)據(jù)的行為判定結(jié)果確定為所述第二訓(xùn)練樣本的輸出;

上層分類器訓(xùn)練模塊,用于將所述第二訓(xùn)練樣本的輸入和輸出投入所述上層分類器進(jìn)行訓(xùn)練,得到完成訓(xùn)練的上層分類器。

進(jìn)一步地,所述金融詐騙識(shí)別系統(tǒng)還可以包括:

測(cè)試樣本獲取模塊,用于獲取預(yù)設(shè)的分類器測(cè)試樣本;

測(cè)試判定模塊,用于將所述分類器測(cè)試樣本投入所述底層分類器,得到所述底層分類器輸出的測(cè)試判定結(jié)果;

判定結(jié)果評(píng)價(jià)模塊,用于對(duì)所述測(cè)試判定結(jié)果進(jìn)行ROC曲線評(píng)價(jià);

觸發(fā)模塊,用于若所述判定結(jié)果評(píng)價(jià)模塊的評(píng)價(jià)結(jié)果為不通過(guò),則返回觸發(fā)所述樣本行為數(shù)據(jù)獲取模塊。

進(jìn)一步地,所述第一特征生成模塊可以包括:

第一聚集特征生成子模塊,用于根據(jù)所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)生成基于用戶行為表現(xiàn)的第一聚集特征;

第一時(shí)間特征生成子模塊,用于根據(jù)所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)生成基于用戶行為表現(xiàn)的第一時(shí)間特征;

所述第一聚集特征生成子模塊可以包括:

第一原始特征提取單元,用于從所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)中提取基于用戶行為表現(xiàn)的預(yù)設(shè)第一維度的第一原始特征;

第一聚集特征整理單元,用于根據(jù)所述預(yù)設(shè)第一維度與預(yù)設(shè)第一分類的映射關(guān)系對(duì)所述第一原始特征進(jìn)行整理,得到所述預(yù)設(shè)第一分類對(duì)應(yīng)的各個(gè)第一聚集特征;

所述第一時(shí)間特征生成子模塊可以包括:

第一變量特征提取單元,用于從所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)中提取基于用戶行為表現(xiàn)的各個(gè)第一時(shí)間變量特征;

第一時(shí)間特征整理單元,用于根據(jù)預(yù)設(shè)的第一聚集時(shí)長(zhǎng)對(duì)所述各個(gè)第一時(shí)間變量特征進(jìn)行整理,得到與所述第一聚集時(shí)長(zhǎng)對(duì)應(yīng)的各個(gè)時(shí)間段的第一時(shí)間特征。

進(jìn)一步地,所述第二特征生成模塊可以包括:

第二聚集特征生成子模塊,用于根據(jù)所述各個(gè)用戶的交易行為數(shù)據(jù)生成基于用戶基本狀態(tài)的第二聚集特征;

第二時(shí)間特征生成子模塊,用于根據(jù)所述各個(gè)用戶的交易行為數(shù)據(jù)生成基于用戶基本狀態(tài)的第二時(shí)間特征;

所述第二聚集特征生成子模塊可以包括:

第二原始特征提取單元,用于從所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)中提取基于用戶基本狀態(tài)的預(yù)設(shè)第二維度的第二原始特征;

第二聚集特征整理單元,用于根據(jù)所述預(yù)設(shè)第二維度與預(yù)設(shè)第二分類的映射關(guān)系對(duì)所述第二原始特征進(jìn)行整理,得到所述預(yù)設(shè)第二分類對(duì)應(yīng)的各個(gè)第二聚集特征;

所述第二時(shí)間特征生成子模塊可以包括:

第二變量特征提取單元,用于從所述目標(biāo)用戶的歷史交易行為數(shù)據(jù)中提取基于用戶基本狀態(tài)的各個(gè)第二時(shí)間變量特征;

第二時(shí)間特征整理單元,用于根據(jù)預(yù)設(shè)的第二聚集時(shí)長(zhǎng)對(duì)所述各個(gè)第二時(shí)間變量特征進(jìn)行整理,得到與所述第二聚集時(shí)長(zhǎng)對(duì)應(yīng)的各個(gè)時(shí)間段的第二時(shí)間特征。

所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的系統(tǒng),裝置和單元的具體工作過(guò)程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過(guò)程,在此不再贅述。

在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過(guò)其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過(guò)一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。

所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。

另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。

所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤(pán)、移動(dòng)硬盤(pán)、只讀存儲(chǔ)器(ROM,Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。

以上所述,以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
通道| 仁寿县| 青浦区| 石楼县| 望奎县| 洪洞县| 彭阳县| 余干县| 萨迦县| 鹿泉市| 崇礼县| 太仆寺旗| 兰西县| 喀喇| 桂平市| 柳江县| 阳信县| 穆棱市| 祁连县| 信丰县| 托里县| 金山区| 鱼台县| 颍上县| 叶城县| 海城市| 锡林郭勒盟| 萨迦县| 资阳市| 南川市| 固始县| 临清市| 虎林市| 呼图壁县| 北碚区| 万安县| 莱阳市| 鱼台县| 青田县| 齐齐哈尔市| 汨罗市|