本申請(qǐng)涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種風(fēng)險(xiǎn)控制模型的訓(xùn)練方法及裝置,以及一種風(fēng)險(xiǎn)控制模型的輸入數(shù)據(jù)確定方法及裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)的發(fā)展,互聯(lián)網(wǎng)業(yè)務(wù)越來(lái)越豐富。隨之而來(lái)的互聯(lián)網(wǎng)業(yè)務(wù)的欺詐行為,也越來(lái)越多。比如,盜取他人賬戶(hù)或盜用他人賬戶(hù)進(jìn)行非法交易、或單個(gè)賬戶(hù)業(yè)務(wù)量激增(信用值炒作)等。因此,為了確保信息操作安全,通常一項(xiàng)互聯(lián)網(wǎng)業(yè)務(wù)所屬的系統(tǒng)需要有風(fēng)險(xiǎn)控制系統(tǒng),這個(gè)系統(tǒng)的核心就是風(fēng)險(xiǎn)控制模型。風(fēng)險(xiǎn)控制模型可以通過(guò)將已完成的業(yè)務(wù)記錄對(duì)應(yīng)的業(yè)務(wù)環(huán)境以及該業(yè)務(wù)的業(yè)務(wù)賬戶(hù)的歷史行為記錄作為輸入數(shù)據(jù),進(jìn)行訓(xùn)練得到。借助于風(fēng)險(xiǎn)控制模型,當(dāng)該模型接收到業(yè)務(wù)請(qǐng)求時(shí),通過(guò)業(yè)務(wù)請(qǐng)求的所在環(huán)境便可進(jìn)行風(fēng)險(xiǎn)識(shí)別。這里業(yè)務(wù)請(qǐng)求所在環(huán)境可以包括業(yè)務(wù)請(qǐng)求中的設(shè)備、ip地址、地理位置等屬性和屬性值。
在目前的模型訓(xùn)練過(guò)程中,如上所述,會(huì)將已完成的業(yè)務(wù)記錄當(dāng)時(shí)對(duì)應(yīng)的業(yè)務(wù)環(huán)境,以及業(yè)務(wù)賬戶(hù)在過(guò)往一段時(shí)間內(nèi)的歷史行為記錄作為輸入數(shù)據(jù),對(duì)模型進(jìn)行訓(xùn)練,但是,該輸入數(shù)據(jù)只有一定時(shí)間段內(nèi)的數(shù)據(jù),比較片面,容易導(dǎo)致由此訓(xùn)練的模型不準(zhǔn)確。
技術(shù)實(shí)現(xiàn)要素:
本申請(qǐng)實(shí)施例提供一種風(fēng)險(xiǎn)控制模型的訓(xùn)練方法,用于提高輸入數(shù)據(jù)的全面性,從而提高模型訓(xùn)練結(jié)果的準(zhǔn)確性。
本申請(qǐng)實(shí)施例提供一種風(fēng)險(xiǎn)控制模型的訓(xùn)練裝置,用于提高輸入數(shù)據(jù)的全 面性,從而提高模型訓(xùn)練結(jié)果的準(zhǔn)確性。
本申請(qǐng)實(shí)施例提供一種風(fēng)險(xiǎn)控制模型的輸入數(shù)據(jù)確定方法,用于提高輸入數(shù)據(jù)的全面性。
本申請(qǐng)實(shí)施例提供一種風(fēng)險(xiǎn)控制模型的輸入數(shù)據(jù)確定裝置,用于提高輸入數(shù)據(jù)的全面性。
本申請(qǐng)實(shí)施例采用下述技術(shù)方案:
一種風(fēng)險(xiǎn)控制模型的訓(xùn)練方法,包括:
獲取第一時(shí)間段內(nèi)已完成業(yè)務(wù)的記錄,所述業(yè)務(wù)記錄包括:業(yè)務(wù)賬戶(hù)和業(yè)務(wù)環(huán)境,所述業(yè)務(wù)環(huán)境中包含若干業(yè)務(wù)屬性;
確定業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率,所述風(fēng)險(xiǎn)率是根據(jù)業(yè)務(wù)環(huán)境包含所述業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù)確定的,所述第二時(shí)間段長(zhǎng)于所述第一時(shí)間段;
根據(jù)確定出的風(fēng)險(xiǎn)率、所述已完成業(yè)務(wù)對(duì)應(yīng)的業(yè)務(wù)環(huán)境、以及對(duì)應(yīng)的業(yè)務(wù)賬戶(hù)在所述第一時(shí)間段內(nèi)的歷史行為記錄,確定輸入數(shù)據(jù);
根據(jù)所述輸入數(shù)據(jù),對(duì)風(fēng)險(xiǎn)控制模型進(jìn)行訓(xùn)練。
優(yōu)選地,確定業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率,包括:
確定各業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率,所述風(fēng)險(xiǎn)率是根據(jù)業(yè)務(wù)環(huán)境單獨(dú)包含各業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù)確定的。
優(yōu)選地,確定業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率,包括:
確定至少兩個(gè)業(yè)務(wù)屬性的屬性值組合對(duì)應(yīng)的風(fēng)險(xiǎn)率,所述風(fēng)險(xiǎn)率是根據(jù)業(yè)務(wù)環(huán)境包含所述至少兩個(gè)業(yè)務(wù)屬性的屬性值組合在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù)確定的。
優(yōu)選地,確定業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率,包括:
確定業(yè)務(wù)屬性的共性屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率,所述風(fēng)險(xiǎn)率是根據(jù)業(yè)務(wù)環(huán)境包含所述業(yè)務(wù)屬性的共性屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次 數(shù)和業(yè)務(wù)完成總次數(shù)確定的。
優(yōu)選地,確定業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率,包括:
查詢(xún)業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率,所述風(fēng)險(xiǎn)率是根據(jù)業(yè)務(wù)環(huán)境包含所述業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù)預(yù)先確定的。
優(yōu)選地,所述歷史業(yè)務(wù)記錄的對(duì)應(yīng)的業(yè)務(wù)賬戶(hù)數(shù)量大于、且包含所述歷史行為記錄對(duì)應(yīng)的業(yè)務(wù)賬戶(hù)數(shù)量。
一種風(fēng)險(xiǎn)控制模型的訓(xùn)練裝置,包括:業(yè)務(wù)獲取單元、風(fēng)險(xiǎn)率確定單元、輸入數(shù)據(jù)確定單元以及模型訓(xùn)練單元,其中,
所述業(yè)務(wù)獲取單元,用于獲取第一時(shí)間段內(nèi)已完成業(yè)務(wù)的記錄,所述業(yè)務(wù)記錄包括:業(yè)務(wù)賬戶(hù)和業(yè)務(wù)環(huán)境,所述業(yè)務(wù)環(huán)境中包含若干業(yè)務(wù)屬性;
所述風(fēng)險(xiǎn)率確定單元,用于確定業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率,所述風(fēng)險(xiǎn)率是根據(jù)業(yè)務(wù)環(huán)境包含所述業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù)確定的,所述第二時(shí)間段長(zhǎng)于所述第一時(shí)間段;
所述輸入數(shù)據(jù)確定單元,用于根據(jù)確定出的風(fēng)險(xiǎn)率、所述已完成業(yè)務(wù)對(duì)應(yīng)的業(yè)務(wù)環(huán)境以及對(duì)應(yīng)的業(yè)務(wù)賬戶(hù)在所述第一時(shí)間段內(nèi)的歷史行為記錄,確定輸入數(shù)據(jù);
所述模型訓(xùn)練單元,用于根據(jù)所述輸入數(shù)據(jù),對(duì)風(fēng)險(xiǎn)控制模型進(jìn)行訓(xùn)練。
優(yōu)選地,所述裝置還包括:風(fēng)險(xiǎn)率生成單元,具體用于:
根據(jù)業(yè)務(wù)環(huán)境包含所述業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù),生成業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率。
優(yōu)選地,所述風(fēng)險(xiǎn)率生成單元,具體用于:
根據(jù)業(yè)務(wù)環(huán)境單獨(dú)包含各業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù),生成各業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率。
優(yōu)選地,所述風(fēng)險(xiǎn)率生成單元,具體用于:
根據(jù)業(yè)務(wù)環(huán)境包含所述至少兩個(gè)業(yè)務(wù)屬性的屬性值組合在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù),生成至少兩個(gè)業(yè)務(wù)屬性的屬性值組合對(duì)應(yīng)的風(fēng)險(xiǎn)率。
優(yōu)選地,所述風(fēng)險(xiǎn)率生成單元,具體用于:
根據(jù)業(yè)務(wù)環(huán)境包含所述業(yè)務(wù)屬性的共性屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù),生成業(yè)務(wù)屬性的共性屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率。
優(yōu)選地,所述風(fēng)險(xiǎn)率生成單元,包括風(fēng)險(xiǎn)率查詢(xún)子單元,具體用于:
查詢(xún)業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率,所述風(fēng)險(xiǎn)率是根據(jù)業(yè)務(wù)環(huán)境單獨(dú)包含各業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù)預(yù)先生成的。
一種風(fēng)險(xiǎn)控制模型的輸入數(shù)據(jù)確定方法,包括:
獲取第一時(shí)間段內(nèi)已完成業(yè)務(wù)的記錄,所述業(yè)務(wù)記錄包括:業(yè)務(wù)賬戶(hù)和業(yè)務(wù)環(huán)境,所述業(yè)務(wù)環(huán)境中包含若干業(yè)務(wù)屬性;
確定業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率,所述風(fēng)險(xiǎn)率是根據(jù)業(yè)務(wù)環(huán)境包含所述業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù)生成的,所述第二時(shí)間段長(zhǎng)于所述第一時(shí)間段;
根據(jù)確定出的風(fēng)險(xiǎn)率、所述已完成業(yè)務(wù)對(duì)應(yīng)的業(yè)務(wù)環(huán)境以及對(duì)應(yīng)的業(yè)務(wù)賬戶(hù)在所述第一時(shí)間段內(nèi)的歷史行為記錄,確定風(fēng)險(xiǎn)控制模型的輸入數(shù)據(jù)。
一種風(fēng)險(xiǎn)控制模型的輸入數(shù)據(jù)確定裝置,包括:業(yè)務(wù)獲取單元、風(fēng)險(xiǎn)率確定單元以及輸入數(shù)據(jù)確定單元,其中,
所述業(yè)務(wù)獲取單元,用于獲取第一時(shí)間段內(nèi)已完成業(yè)務(wù)的記錄,所述業(yè)務(wù)記錄包括:業(yè)務(wù)賬戶(hù)和業(yè)務(wù)環(huán)境,所述業(yè)務(wù)環(huán)境中包含若干業(yè)務(wù)屬性;
所述風(fēng)險(xiǎn)率確定單元,用于確定業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率,所述風(fēng)險(xiǎn)率是根據(jù)業(yè)務(wù)環(huán)境包含所述業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù) 記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù)生成的,所述第二時(shí)間段長(zhǎng)于所述第一時(shí)間段;
所述輸入數(shù)據(jù)確定單元,用于根據(jù)確定出的風(fēng)險(xiǎn)率、所述已完成業(yè)務(wù)對(duì)應(yīng)的業(yè)務(wù)環(huán)境以及對(duì)應(yīng)的業(yè)務(wù)賬戶(hù)在所述第一時(shí)間段內(nèi)的歷史行為記錄,確定風(fēng)險(xiǎn)控制模型的輸入數(shù)據(jù)。
優(yōu)選地,所述裝置還包括:風(fēng)險(xiǎn)率生成單元,具體用于:
根據(jù)業(yè)務(wù)環(huán)境包含所述業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù),生成業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率。
本申請(qǐng)實(shí)施例采用的上述至少一個(gè)技術(shù)方案能夠達(dá)到以下有益效果:通過(guò)第一時(shí)間段內(nèi)已完成業(yè)務(wù)對(duì)應(yīng)的業(yè)務(wù)環(huán)境中包含的業(yè)務(wù)屬性值,確定出業(yè)務(wù)環(huán)境中包含業(yè)務(wù)屬性值的長(zhǎng)于第一時(shí)間段的第二時(shí)間段內(nèi)的已完成業(yè)務(wù)在歷史業(yè)務(wù)中的風(fēng)險(xiǎn)率,并將風(fēng)險(xiǎn)率加入到第一時(shí)間段內(nèi)已完成業(yè)務(wù)對(duì)應(yīng)的業(yè)務(wù)環(huán)境以及對(duì)應(yīng)的業(yè)務(wù)賬戶(hù)在指定時(shí)間段內(nèi)的歷史行為記錄中,綜合確定出輸入數(shù)據(jù)。也就是,利用業(yè)務(wù)環(huán)境中包含屬性值的在較長(zhǎng)時(shí)間段內(nèi)已完成業(yè)務(wù)的風(fēng)險(xiǎn)率,輔助業(yè)務(wù)賬戶(hù)在較短時(shí)間段內(nèi)的歷史行為記錄作為輸入數(shù)據(jù),使得輸入數(shù)據(jù)更加全面,進(jìn)而提高模型訓(xùn)練結(jié)果的準(zhǔn)確性。
附圖說(shuō)明
此處所說(shuō)明的附圖用來(lái)提供對(duì)本申請(qǐng)的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本申請(qǐng)的示意性實(shí)施例及其說(shuō)明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:
圖1為現(xiàn)有的風(fēng)險(xiǎn)控制模型的訓(xùn)練的示意圖;
圖2為本申請(qǐng)實(shí)施例1提供的風(fēng)險(xiǎn)控制模型的訓(xùn)練方法的流程示意圖;
圖3為本申請(qǐng)實(shí)施例1提供的風(fēng)險(xiǎn)控制模型的訓(xùn)練方法的示意圖;
圖4為本申請(qǐng)實(shí)施例2提供的風(fēng)險(xiǎn)控制模型的訓(xùn)練裝置的結(jié)構(gòu)框圖;
圖5為本申請(qǐng)實(shí)施例3提供的風(fēng)險(xiǎn)控制模型的輸入數(shù)據(jù)確定方法的流程示 意圖;
圖6為本申請(qǐng)實(shí)施例4提供的風(fēng)險(xiǎn)控制模型的輸入數(shù)據(jù)確定裝置的結(jié)構(gòu)框圖。
具體實(shí)施方式
為使本申請(qǐng)的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本申請(qǐng)具體實(shí)施例及相應(yīng)的附圖對(duì)本申請(qǐng)技術(shù)方案進(jìn)行清楚、完整地描述。顯然,所描述的實(shí)施例僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。
以下結(jié)合附圖,詳細(xì)說(shuō)明本申請(qǐng)各實(shí)施例提供的技術(shù)方案。
實(shí)施例1
如前所述,如圖1所示,目前在對(duì)風(fēng)險(xiǎn)控制模型進(jìn)行訓(xùn)練時(shí),僅僅會(huì)將已完成的業(yè)務(wù)記錄當(dāng)時(shí)對(duì)應(yīng)的業(yè)務(wù)環(huán)境,以及業(yè)務(wù)賬戶(hù)在過(guò)往一段時(shí)間內(nèi)的歷史行為記錄作為輸入數(shù)據(jù),比如,業(yè)務(wù)1為已經(jīng)完成的業(yè)務(wù),該任務(wù)被確定為是欺詐業(yè)務(wù),該業(yè)務(wù)完成后業(yè)務(wù)記錄中包括業(yè)務(wù)賬戶(hù)a和業(yè)務(wù)環(huán)境,業(yè)務(wù)環(huán)境中包含四種業(yè)務(wù)屬性:移動(dòng)終端、ip地址、地理位置,每種屬性均對(duì)應(yīng)各自的屬性值。那么就可以去獲取賬戶(hù)a在過(guò)去一個(gè)季度的歷史行為記錄(這其中,可能包括修改密碼,更換綁定郵箱等行為,這個(gè)歷史行為記錄對(duì)應(yīng)的業(yè)務(wù)環(huán)境可能包含該業(yè)務(wù)完成時(shí)的業(yè)務(wù)屬性值,也可能不包含,但都可以是這個(gè)賬戶(hù)的行為),從而將該已完成業(yè)務(wù)的業(yè)務(wù)環(huán)境、以及對(duì)應(yīng)業(yè)務(wù)賬戶(hù)在過(guò)往一段時(shí)間內(nèi)的歷史行為記錄作為輸入數(shù)據(jù),對(duì)風(fēng)險(xiǎn)控制模型進(jìn)行訓(xùn)練。但是可以看出,輸入數(shù)據(jù)只有一段時(shí)間內(nèi)的,比較片面,有可能這段時(shí)間內(nèi)的歷史行為記錄不存在欺詐行為的“原因”,如果將全量的歷史行為記錄都作為輸入數(shù)據(jù),又是非常大的數(shù)據(jù)量,并且理論上看相距時(shí)間越久,有用的信息就越少,也就可以認(rèn)為 存在很多垃圾數(shù)據(jù),不僅浪費(fèi)處理資源,還有可能對(duì)模型訓(xùn)練的準(zhǔn)確性造成干擾,所以就很難控制選取歷史行為記錄的時(shí)間段。本申請(qǐng)實(shí)施例就提供了一種風(fēng)險(xiǎn)控制模型的訓(xùn)練方法,用于提高輸入數(shù)據(jù)的全面性,從而提高模型訓(xùn)練結(jié)果的準(zhǔn)確性。該方法的流程示意圖如圖2所示,包括下述步驟:
步驟11:獲取第一時(shí)間段內(nèi)已完成業(yè)務(wù)的記錄。
互聯(lián)網(wǎng)業(yè)務(wù)每時(shí)每刻都會(huì)發(fā)生,每個(gè)業(yè)務(wù)都可以對(duì)應(yīng)一個(gè)業(yè)務(wù)賬戶(hù),在這里可以是指發(fā)起業(yè)務(wù)的業(yè)務(wù)賬戶(hù),比如,賬戶(hù)a發(fā)起了某個(gè)互聯(lián)網(wǎng)業(yè)務(wù),那么賬戶(hù)a就是該互聯(lián)網(wǎng)業(yè)務(wù)對(duì)應(yīng)的業(yè)務(wù)賬戶(hù),所以在已完成的業(yè)務(wù)的記錄中會(huì)包括業(yè)務(wù)賬戶(hù)。此外,每個(gè)業(yè)務(wù)還都會(huì)處在某個(gè)業(yè)務(wù)環(huán)境中,這個(gè)業(yè)務(wù)環(huán)境會(huì)包含若干業(yè)務(wù)屬性,比如設(shè)備(業(yè)務(wù)屬性)是移動(dòng)終端還是固定終端(屬性值);ip(internetprotocol,網(wǎng)絡(luò)之間互連的協(xié)議)地址(122.156.9.6);地理位置(北京、上海);如果涉及電子支付等,還會(huì)有銀行卡的類(lèi)型(儲(chǔ)蓄卡、信用卡),銀行標(biāo)識(shí)(中國(guó)銀行、中國(guó)工商銀行),等。
在獲取第一時(shí)間段內(nèi)已完成業(yè)務(wù)的業(yè)務(wù)記錄時(shí),可以獲取已經(jīng)有結(jié)果(是否存在欺詐行為)的業(yè)務(wù)的記錄,第一時(shí)間段可以是預(yù)先設(shè)定的一個(gè)時(shí)間段,比如獲取一天(或一月、一季度、一年)前的所有已完成的、已經(jīng)有是否存在欺詐結(jié)果的業(yè)務(wù)的記錄,這樣就有訓(xùn)練的價(jià)值,也就可以作為輸入數(shù)據(jù),對(duì)模型進(jìn)行訓(xùn)練。如果沒(méi)有結(jié)果也就是暫時(shí)還不知道是不是存在欺詐行為,也就沒(méi)有必要獲取了。
步驟12:確定業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率。
由于在本實(shí)施例開(kāi)頭已經(jīng)介紹,如果將全量的歷史行為記錄都作為輸入數(shù)據(jù),是非常大的數(shù)據(jù)量(平均每個(gè)賬戶(hù)可能有很多年的數(shù)據(jù)),對(duì)于模型的訓(xùn)練也是一種負(fù)擔(dān),況且時(shí)間相距越遠(yuǎn),參考性也就越低,所以就可以獲取已完成業(yè)務(wù)對(duì)應(yīng)的業(yè)務(wù)賬戶(hù)在第一時(shí)間段內(nèi)的歷史行為記錄,通??梢允且粋€(gè)季度、半年的,但是對(duì)于欺詐行為這個(gè)結(jié)果而言,有可能無(wú)法從第一時(shí)間段內(nèi)的歷史行為中找到“原因”。
所以,本申請(qǐng)實(shí)施例提出業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率。這個(gè)風(fēng)險(xiǎn)率可以是根據(jù)業(yè)務(wù)環(huán)境包含業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù)確定的,當(dāng)然,第二時(shí)間段要長(zhǎng)于第一時(shí)間段,這樣才可以達(dá)到利用比第一時(shí)間段更長(zhǎng)時(shí)間的歷史業(yè)務(wù)的目的,從而達(dá)到提供相對(duì)全面的風(fēng)險(xiǎn)率數(shù)據(jù)的目的。比如,已完成的業(yè)務(wù)的記錄是賬戶(hù)a在2016年3月10日完成的,是一個(gè)欺詐業(yè)務(wù),歷史行為記錄可以是賬戶(hù)a在2015年12月10日至2016年3月10日的所有歷史行為的記錄,而根據(jù)賬戶(hù)a的業(yè)務(wù)環(huán)境中的屬性值a的風(fēng)險(xiǎn)率可以是2010年12月10日至2016年3月10日內(nèi),所有包含屬性值a的欺詐業(yè)務(wù)次數(shù)與完成的總業(yè)務(wù)次數(shù)的比值。具體地,對(duì)于包含業(yè)務(wù)屬性的屬性值的歷史業(yè)務(wù)記錄,比如這個(gè)已完成的業(yè)務(wù)的屬性值中包含的業(yè)務(wù)屬性是信用卡、屬性值是具體某發(fā)卡行的信用卡,那么所有用該發(fā)卡行信用卡完成的歷史業(yè)務(wù)的記錄都是包含這個(gè)業(yè)務(wù)屬性的屬性值的歷史業(yè)務(wù)的記錄;屬性是指地理位置、屬性值是具體某地區(qū),那么所有在這個(gè)地區(qū)完成的歷史業(yè)務(wù)記錄都是包含這個(gè)屬性值的歷史業(yè)務(wù)記錄。需要說(shuō)明的是,歷史業(yè)務(wù)可以與已完成的業(yè)務(wù)中的業(yè)務(wù)賬戶(hù)無(wú)關(guān),也可以包含這個(gè)賬戶(hù)。具體地,風(fēng)險(xiǎn)率的確定方法可以有以下四種:
第一種方法:根據(jù)業(yè)務(wù)環(huán)境單獨(dú)包含各業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù),確定各業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率。
具體地,各業(yè)務(wù)屬性的屬性值,都可以對(duì)應(yīng)一個(gè)單獨(dú)的風(fēng)險(xiǎn)率,比如,用某個(gè)發(fā)卡行或某種類(lèi)型信用卡進(jìn)行支付時(shí)的風(fēng)險(xiǎn)率,某個(gè)品牌移動(dòng)終端在申請(qǐng)業(yè)務(wù)時(shí)的風(fēng)險(xiǎn)率等。具體可以按照下述公式進(jìn)行確定:
risk_ratio=count(risk_a)/count(a);
其中,risk_ratio是指風(fēng)險(xiǎn)率;count為次數(shù);a為屬性值變量;risk_a為包含屬性值a的欺詐業(yè)務(wù);
比如業(yè)務(wù)屬性為信用卡,那risk_ratio就為業(yè)務(wù)環(huán)境包含信用卡的已完成 業(yè)務(wù)的風(fēng)險(xiǎn)率;比如,中國(guó)銀行信用卡、交通銀行visa信用卡,又如,某品牌移動(dòng)終端、某個(gè)操作系統(tǒng)的移動(dòng)終端,等。
在實(shí)際應(yīng)用中,網(wǎng)絡(luò)欺詐行為的業(yè)務(wù)環(huán)境可能不僅一個(gè)屬性是“原因”,也有可能是多個(gè)屬性值代表這個(gè)“原因”,所以就可以有第二種風(fēng)險(xiǎn)率的確定方法。
第二種方法:根據(jù)業(yè)務(wù)環(huán)境包含至少兩個(gè)業(yè)務(wù)屬性的屬性值組合在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù),確定至少兩個(gè)業(yè)務(wù)屬性的屬性值組合對(duì)應(yīng)的風(fēng)險(xiǎn)率。
具體地,包含每?jī)蓚€(gè)業(yè)務(wù)屬性值的組合的已完成業(yè)務(wù),也可以有一個(gè)風(fēng)險(xiǎn)率,比如,同時(shí)用移動(dòng)終端和信用卡進(jìn)行支付時(shí)的風(fēng)險(xiǎn)率,同時(shí)用某個(gè)操作系統(tǒng)的移動(dòng)終端和某個(gè)銀行(的某款)信用卡支付進(jìn)行支付時(shí)的風(fēng)險(xiǎn)率等。具體可以按照下述公式進(jìn)行確定:
risk_ratio=count(risk_ab)/count(ab);
其中,ab為屬性值的組合,是兩個(gè)變量;risk_ab為即包含屬性值a又包含屬性值b的欺詐業(yè)務(wù);
比如業(yè)務(wù)屬性為移動(dòng)終端和信用卡,那risk_ratio就為既用某個(gè)移動(dòng)終端又用某個(gè)信用卡的已完成業(yè)務(wù)的風(fēng)險(xiǎn)率;當(dāng)然,還可以有三個(gè)及以上屬性值的組合。
在實(shí)際應(yīng)用中,屬性值可能是比較具體的,具有很強(qiáng)的特殊性,比如,銀行卡的卡號(hào),ip地址等,但是這其中也是可以找出共性特征的,所以就可以有第三種風(fēng)險(xiǎn)率的確定方法。
第三種方法:根據(jù)業(yè)務(wù)環(huán)境包含業(yè)務(wù)屬性的共性屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù),確定業(yè)務(wù)屬性的共性屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率。
前面已經(jīng)提到,一些具有特殊性的業(yè)務(wù)屬性值中是可能存在共性特征的,所以包含共性屬性值的已完成業(yè)務(wù)也就可以有一個(gè)風(fēng)險(xiǎn)率,比如,銀行卡開(kāi)頭四位是6222的銀行進(jìn)行支付時(shí)的風(fēng)險(xiǎn)率,ip地址前三位是122.156.9在請(qǐng)求業(yè) 務(wù)時(shí)的風(fēng)險(xiǎn)率等。具體可以按照下述公式進(jìn)行確定:
risk_ratio=count(risk_a共)/count(a共);
其中,a共為共性屬性值;risk_a共即為業(yè)務(wù)環(huán)境包含共性屬性值a的欺詐業(yè)務(wù)。
在實(shí)際應(yīng)用中,由于每時(shí)每刻都會(huì)發(fā)生互聯(lián)網(wǎng)業(yè)務(wù),所以業(yè)務(wù)環(huán)境包含屬性值的已完成業(yè)務(wù)的風(fēng)險(xiǎn)率也就可能隨時(shí)在變化,如果只在每次需要輸入數(shù)據(jù)時(shí)才去確定風(fēng)險(xiǎn)率,顯然效率不高,所以就可以設(shè)立一個(gè)單獨(dú)的功能,實(shí)時(shí)或按照一定時(shí)間間隔為業(yè)務(wù)環(huán)境中包含每個(gè)屬性值、屬性值組合以及共性屬性值的已完成業(yè)務(wù)的風(fēng)險(xiǎn)率進(jìn)行動(dòng)態(tài)調(diào)整。所以在一種實(shí)施方式中,本步驟還可以是查詢(xún)業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率,該風(fēng)險(xiǎn)率是根據(jù)業(yè)務(wù)環(huán)境包含所述業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù)預(yù)先確定的。
比如,在步驟11中獲取到了第一時(shí)間段內(nèi)已完成的業(yè)務(wù)記錄以及對(duì)應(yīng)的業(yè)務(wù)環(huán)境后,在本步驟中,就可以在已經(jīng)生成好的第二時(shí)間段內(nèi)的風(fēng)險(xiǎn)率數(shù)據(jù)中,查詢(xún)所需要的風(fēng)險(xiǎn)率。
需要說(shuō)明的是,本步驟用于確定風(fēng)險(xiǎn)率的公式還可以進(jìn)行衍生,比如,以risk_ratio=count(risk_a)/count(a)為例,還可以衍生為
risk_ratio=count2(risk_a)/count(a);或
risk_ratio=count(risk_a)/count2(a);或
risk_ratio=count(risk_a)×p/count(a);其中,p可以是預(yù)先設(shè)定的調(diào)整系數(shù)。
步驟13:根據(jù)確定出的風(fēng)險(xiǎn)率、已完成業(yè)務(wù)對(duì)應(yīng)的業(yè)務(wù)環(huán)境以及對(duì)應(yīng)的業(yè)務(wù)賬戶(hù)在第一時(shí)間段內(nèi)的歷史行為記錄,確定輸入數(shù)據(jù)。
現(xiàn)有的確定輸入數(shù)據(jù)的方案就是,將已完成業(yè)務(wù)對(duì)應(yīng)的業(yè)務(wù)賬戶(hù)和業(yè)務(wù)環(huán)境以及該業(yè)務(wù)賬戶(hù)在第一時(shí)間段內(nèi)的歷史行為記錄,作為輸入數(shù)據(jù),因?yàn)闃I(yè)務(wù)賬戶(hù)在第一時(shí)間段內(nèi)的歷史行為記錄中隱藏了業(yè)務(wù)賬戶(hù)的行為習(xí)慣,所以可以 將該賬戶(hù)的已完成業(yè)務(wù)作為一種驗(yàn)證,來(lái)進(jìn)行模型訓(xùn)練。但由于第一時(shí)間段比較片面,所以本步驟可以綜合業(yè)務(wù)環(huán)境中包含屬性的屬性值的在第二時(shí)間段內(nèi)的已完成業(yè)務(wù)的風(fēng)險(xiǎn)率,作為輸入數(shù)據(jù),甚至第二時(shí)間段可以是全量時(shí)間段,也就是風(fēng)險(xiǎn)率可以通過(guò)全量歷史業(yè)務(wù)記錄來(lái)生成,所以在一定程序上使得輸入數(shù)據(jù)的更加全面。
在實(shí)際應(yīng)用中,畢竟欺詐行為是少數(shù),所以確定出的風(fēng)險(xiǎn)率可能是極低的,比如萬(wàn)分之一,十萬(wàn)分之一等,但是,不同屬性(組合)之間的風(fēng)險(xiǎn)率是有可比性的,比如,哪兩個(gè)屬性值的組合的風(fēng)險(xiǎn)比較高,哪個(gè)屬性值的共性特征的風(fēng)險(xiǎn)比較低等,所以,在確定輸入數(shù)據(jù)時(shí),可以將風(fēng)險(xiǎn)率進(jìn)行歸一化處理,得到相對(duì)的風(fēng)險(xiǎn)率,比如,可以將風(fēng)險(xiǎn)率歸一化到0~100的區(qū)間內(nèi),值越高風(fēng)險(xiǎn)越高,等。
在實(shí)際應(yīng)用中,除了時(shí)間段的選擇外,對(duì)歷史業(yè)務(wù)記錄的對(duì)應(yīng)的業(yè)務(wù)賬戶(hù)數(shù)量的選擇還可以大于、且包含歷史行為記錄對(duì)應(yīng)的業(yè)務(wù)賬戶(hù)數(shù)量。比如,在2016年3月10日,有賬戶(hù)1到賬戶(hù)100,這100個(gè)業(yè)務(wù)賬戶(hù)完成的業(yè)務(wù)的記錄,那么會(huì)選取這100個(gè)賬戶(hù)在在2015年12月10日至2016年3月10日的所有歷史行為的記錄,在確定風(fēng)險(xiǎn)率是,就可以擺脫這100個(gè)賬戶(hù)的束縛,選取包含這100個(gè)賬戶(hù)、并且更多的賬戶(hù)的歷史業(yè)務(wù)記錄,只要是包含著100個(gè)賬戶(hù)已完成業(yè)務(wù)的屬性值就可以用來(lái)確定風(fēng)險(xiǎn)率。
一般地,為了最大程度的追求風(fēng)險(xiǎn)率的全面性,可以以全量的歷史業(yè)務(wù)記錄作為確定風(fēng)險(xiǎn)率的依據(jù)。
步驟14:根據(jù)該輸入數(shù)據(jù),對(duì)風(fēng)險(xiǎn)控制模型進(jìn)行訓(xùn)練。
如圖3所示,就是對(duì)模型訓(xùn)練的過(guò)程,上一步驟已經(jīng)提到,可以將該賬戶(hù)的已完成業(yè)務(wù)對(duì)行為習(xí)慣進(jìn)行驗(yàn)證,來(lái)進(jìn)行模型訓(xùn)練。具體地,訓(xùn)練的邏輯為,如果這個(gè)已完成業(yè)務(wù)的業(yè)務(wù)環(huán)境符合該業(yè)務(wù)賬戶(hù)的行為習(xí)慣,并且為非欺詐業(yè)務(wù),那么就可以保持或微調(diào)該賬戶(hù)的行為習(xí)慣(比如,消費(fèi)額度大于一般習(xí)慣,但沒(méi)有欺詐,所以就可以微調(diào)消費(fèi)額度);如果這個(gè)已完成業(yè)務(wù)的業(yè)務(wù)環(huán)境不 符合該業(yè)務(wù)賬戶(hù)的行為習(xí)慣,并且為欺詐業(yè)務(wù),那么就可以得出只要該賬戶(hù)在請(qǐng)求業(yè)務(wù)時(shí),業(yè)務(wù)環(huán)境不滿(mǎn)足歷史行為習(xí)慣,則風(fēng)險(xiǎn)較高。并且在本步驟中,可以綜合屬性值的風(fēng)險(xiǎn)率,屬性值組合的風(fēng)險(xiǎn)率,以及屬性值的共性特征的風(fēng)險(xiǎn)率,再與原有的已完成業(yè)務(wù)的業(yè)務(wù)環(huán)境和業(yè)務(wù)賬戶(hù)的歷史行為,對(duì)模型進(jìn)行訓(xùn)練。由于模型訓(xùn)練不是本申請(qǐng)的重點(diǎn),所以不多贅述。
采用實(shí)施例1提供的該方法,通過(guò)第一時(shí)間段內(nèi)已完成業(yè)務(wù)對(duì)應(yīng)的業(yè)務(wù)環(huán)境中包含的業(yè)務(wù)屬性值,確定出業(yè)務(wù)環(huán)境中包含業(yè)務(wù)屬性值的長(zhǎng)于第一時(shí)間段的第二時(shí)間段內(nèi)的已完成業(yè)務(wù)在歷史業(yè)務(wù)中的風(fēng)險(xiǎn)率,并將風(fēng)險(xiǎn)率加入到第一時(shí)間段內(nèi)已完成業(yè)務(wù)對(duì)應(yīng)的業(yè)務(wù)環(huán)境以及對(duì)應(yīng)的業(yè)務(wù)賬戶(hù)在指定時(shí)間段內(nèi)的歷史行為記錄中,綜合確定出輸入數(shù)據(jù)。也就是,利用業(yè)務(wù)環(huán)境中包含屬性值的在較長(zhǎng)時(shí)間段內(nèi)已完成業(yè)務(wù)的風(fēng)險(xiǎn)率,輔助業(yè)務(wù)賬戶(hù)在較短時(shí)間段內(nèi)的歷史行為記錄作為輸入數(shù)據(jù),使得輸入數(shù)據(jù)更加全面,進(jìn)而提高模型訓(xùn)練結(jié)果的準(zhǔn)確性。此外,還可以通過(guò)對(duì)屬性值進(jìn)行組合和共性特征提取,并以全量的歷史記錄作為基礎(chǔ),豐富并優(yōu)化風(fēng)險(xiǎn)率。
實(shí)施例2
基于相同的發(fā)明構(gòu)思,實(shí)施例2提供了一種風(fēng)險(xiǎn)控制模型的訓(xùn)練裝置,用于提高輸入數(shù)據(jù)的全面性,從而提高模型訓(xùn)練結(jié)果的準(zhǔn)確性。圖4為該裝置的結(jié)構(gòu)框圖,該裝置包括:業(yè)務(wù)獲取單元21、風(fēng)險(xiǎn)率確定單元22、輸入數(shù)據(jù)確定單元23以及模型訓(xùn)練單元24,其中,
業(yè)務(wù)獲取單元21,可以用于獲取第一時(shí)間段內(nèi)已完成業(yè)務(wù)的記錄,該業(yè)務(wù)記錄包括:業(yè)務(wù)賬戶(hù)和業(yè)務(wù)環(huán)境,該業(yè)務(wù)環(huán)境中包含若干業(yè)務(wù)屬性;
風(fēng)險(xiǎn)率確定單元22,可以用于確定業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率,該風(fēng)險(xiǎn)率是根據(jù)業(yè)務(wù)環(huán)境包含業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù)確定的,該第二時(shí)間段長(zhǎng)于所述第一時(shí)間段;
輸入數(shù)據(jù)確定單元23,可以用于根據(jù)確定出的風(fēng)險(xiǎn)率、該已完成業(yè)務(wù)對(duì)應(yīng) 的業(yè)務(wù)環(huán)境以及對(duì)應(yīng)的業(yè)務(wù)賬戶(hù)在第一時(shí)間段內(nèi)的歷史行為記錄,確定輸入數(shù)據(jù);
模型訓(xùn)練單元24,可以用于根據(jù)所述輸入數(shù)據(jù),對(duì)風(fēng)險(xiǎn)控制模型進(jìn)行訓(xùn)練。
實(shí)施例1中已經(jīng)提到,可以設(shè)立一個(gè)單獨(dú)的功能,所以在實(shí)際應(yīng)用中,出于效率的考慮,風(fēng)險(xiǎn)率也可以是由單獨(dú)的單元來(lái)完成。所以在一種實(shí)施方式中,該裝置還可以包括:風(fēng)險(xiǎn)率生成單元,
該風(fēng)險(xiǎn)率生成單元,可以用于根據(jù)業(yè)務(wù)環(huán)境包含業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù),生成業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率。
具體地,該風(fēng)險(xiǎn)率生成單元,可以用于根據(jù)業(yè)務(wù)環(huán)境單獨(dú)包含各業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù),生成各業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率。
該風(fēng)險(xiǎn)率生成單元,還可以用于根據(jù)業(yè)務(wù)環(huán)境包含至少兩個(gè)業(yè)務(wù)屬性的屬性值組合在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù),生成至少兩個(gè)業(yè)務(wù)屬性的屬性值組合對(duì)應(yīng)的風(fēng)險(xiǎn)率。
該風(fēng)險(xiǎn)率生成單元,還可以用于根據(jù)業(yè)務(wù)環(huán)境包含業(yè)務(wù)屬性的共性屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù),生成業(yè)務(wù)屬性的共性屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率。
在實(shí)際應(yīng)用中,風(fēng)險(xiǎn)率生成單元可以維護(hù)一個(gè)表格,該表格中包含所有業(yè)務(wù)環(huán)境中包含屬性值,包括各種屬性值的組合,以及共性屬性值的已完成業(yè)務(wù)的風(fēng)險(xiǎn)率數(shù)據(jù),并且實(shí)時(shí)更新,為了更加全面,該風(fēng)險(xiǎn)率數(shù)據(jù)就可以根據(jù)全量的歷史記錄來(lái)生成。這時(shí),風(fēng)險(xiǎn)率確定單元22就無(wú)需確定了,所以風(fēng)險(xiǎn)率生成單元22可以包括風(fēng)險(xiǎn)率查詢(xún)子單元,可以用于:在預(yù)先生成的第二時(shí)間段內(nèi)的業(yè)務(wù)屬性值風(fēng)險(xiǎn)率數(shù)據(jù)中,查詢(xún)業(yè)務(wù)環(huán)境包含所述業(yè)務(wù)屬性值的已完成業(yè)務(wù)在歷史業(yè)務(wù)中的風(fēng)險(xiǎn)率。比如,需要某品牌移動(dòng)終端的風(fēng)險(xiǎn)率,就可以從風(fēng)險(xiǎn)率生成單元生成的風(fēng)險(xiǎn)率數(shù)據(jù)的表格中查詢(xún)并獲取。
采用實(shí)施例2提供的該裝置,通過(guò)第一時(shí)間段內(nèi)已完成業(yè)務(wù)對(duì)應(yīng)的業(yè)務(wù)環(huán)境中包含的業(yè)務(wù)屬性值,確定出業(yè)務(wù)環(huán)境中包含業(yè)務(wù)屬性值的長(zhǎng)于第一時(shí)間段的第二時(shí)間段內(nèi)的已完成業(yè)務(wù)在歷史業(yè)務(wù)中的風(fēng)險(xiǎn)率,并將風(fēng)險(xiǎn)率加入到第一時(shí)間段內(nèi)已完成業(yè)務(wù)對(duì)應(yīng)的業(yè)務(wù)環(huán)境以及對(duì)應(yīng)的業(yè)務(wù)賬戶(hù)在指定時(shí)間段內(nèi)的歷史行為記錄中,綜合確定出輸入數(shù)據(jù)。也就是,利用業(yè)務(wù)環(huán)境中包含屬性值的在較長(zhǎng)時(shí)間段內(nèi)已完成業(yè)務(wù)的風(fēng)險(xiǎn)率,輔助業(yè)務(wù)賬戶(hù)在較短時(shí)間段內(nèi)的歷史行為記錄作為輸入數(shù)據(jù),使得輸入數(shù)據(jù)更加全面,進(jìn)而提高模型訓(xùn)練結(jié)果的準(zhǔn)確性。此外,還可以通過(guò)對(duì)屬性值進(jìn)行組合和共性特征提取,并以全量的歷史記錄作為基礎(chǔ),豐富并優(yōu)化風(fēng)險(xiǎn)率。
實(shí)施例3
在前兩個(gè)實(shí)施例中介紹了模型的訓(xùn)練方法,其實(shí)歸根結(jié)底,還是輸入數(shù)據(jù)不夠全面,所以基于相同的發(fā)明思路。本申請(qǐng)實(shí)施例就提供了一種風(fēng)險(xiǎn)控制模型的輸入數(shù)據(jù)確定方法,用于提高輸入數(shù)據(jù)的全面性。該方法的流程示意圖如圖5所示,包括下述步驟:
步驟31:獲取第一時(shí)間段內(nèi)已完成業(yè)務(wù)的記錄。
與實(shí)施例1中步驟11類(lèi)似,業(yè)務(wù)記錄可以包括業(yè)務(wù)賬戶(hù)和業(yè)務(wù)環(huán)境,該業(yè)務(wù)環(huán)境中可以包含若干業(yè)務(wù)屬性。
步驟32:確定業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率。
也與實(shí)施例1中步驟12類(lèi)似,該風(fēng)險(xiǎn)率可以是根據(jù)業(yè)務(wù)環(huán)境包含業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù)生成的,這里的第二時(shí)間段要長(zhǎng)于第一時(shí)間段。
步驟33:根據(jù)確定出的風(fēng)險(xiǎn)率、已完成業(yè)務(wù)對(duì)應(yīng)的業(yè)務(wù)環(huán)境以及對(duì)應(yīng)的業(yè)務(wù)賬戶(hù)在第一時(shí)間段內(nèi)的歷史行為記錄,確定輸入數(shù)據(jù)。
依舊與實(shí)施例1中步驟13類(lèi)似,將風(fēng)險(xiǎn)率作為輔助因素,使用于模型訓(xùn)練的輸入數(shù)據(jù),更加全面。
采用實(shí)施例3提供的該方法,使得輸入數(shù)據(jù)更加全面,也就可以再后續(xù)訓(xùn)練模型的過(guò)程中,提高訓(xùn)練的準(zhǔn)確性。
實(shí)施例4
基于相同的發(fā)明構(gòu)思,本實(shí)施例提供了一種風(fēng)險(xiǎn)控制模型的輸入數(shù)據(jù)確定裝置,用于提高輸入數(shù)據(jù)的全面性。圖6為該裝置的結(jié)構(gòu)框圖,該裝置包括:業(yè)務(wù)獲取單元41、風(fēng)險(xiǎn)率確定單元42以及輸入數(shù)據(jù)確定單元43,其中,
業(yè)務(wù)獲取單元41,可以用于獲取第一時(shí)間段內(nèi)已完成業(yè)務(wù)的記錄,該業(yè)務(wù)記錄可以包括業(yè)務(wù)賬戶(hù)和業(yè)務(wù)環(huán)境,該業(yè)務(wù)環(huán)境中可以包含若干業(yè)務(wù)屬性;
風(fēng)險(xiǎn)率確定單元42,可以用于確定業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率,風(fēng)險(xiǎn)率是根據(jù)業(yè)務(wù)環(huán)境包含業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù)生成的,第二時(shí)間段長(zhǎng)于第一時(shí)間段;
輸入數(shù)據(jù)確定單元43,可以用于根據(jù)確定出的風(fēng)險(xiǎn)率、該已完成業(yè)務(wù)對(duì)應(yīng)的業(yè)務(wù)環(huán)境以及對(duì)應(yīng)的業(yè)務(wù)賬戶(hù)在第一時(shí)間段內(nèi)的歷史行為記錄,確定輸入數(shù)據(jù)。
在一種實(shí)施方式中,該裝置還可以包括:風(fēng)險(xiǎn)率生成單元,
該風(fēng)險(xiǎn)率生成單元,可以用于根據(jù)業(yè)務(wù)環(huán)境包含業(yè)務(wù)屬性的屬性值在第二時(shí)間段內(nèi)的歷史業(yè)務(wù)記錄中欺詐業(yè)務(wù)次數(shù)和業(yè)務(wù)完成總次數(shù),生成業(yè)務(wù)屬性的屬性值對(duì)應(yīng)的風(fēng)險(xiǎn)率。
采用實(shí)施例4提供的該裝置,使得輸入數(shù)據(jù)更加全面,也就可以再后續(xù)訓(xùn)練模型的過(guò)程中,提高訓(xùn)練的準(zhǔn)確性。
本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本申請(qǐng)的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本申請(qǐng)可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本申請(qǐng)可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤(pán)存儲(chǔ)器、 cd-rom、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
本申請(qǐng)是參照根據(jù)本申請(qǐng)實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來(lái)描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專(zhuān)用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過(guò)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
在一個(gè)典型的配置中,計(jì)算設(shè)備包括一個(gè)或多個(gè)處理器(cpu)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。
內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(ram)和/或非易失性?xún)?nèi)存等形式,如只讀存儲(chǔ)器(rom)或閃存(flashram)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì)的示例。
計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動(dòng)和非可移動(dòng)媒體可以由任何方法或技術(shù)來(lái)實(shí)現(xiàn)信息存儲(chǔ)。信息可以是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計(jì)算機(jī)的存儲(chǔ)介質(zhì)的例子包括,但不限于相變內(nèi)存(pram)、靜態(tài)隨機(jī)存取存儲(chǔ)器(sram)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(dram)、其他類(lèi)型的隨機(jī)存取存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、電可擦除可編程只讀 存儲(chǔ)器(eeprom)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤(pán)只讀存儲(chǔ)器(cd-rom)、數(shù)字多功能光盤(pán)(dvd)或其他光學(xué)存儲(chǔ)、磁盒式磁帶,磁帶磁磁盤(pán)存儲(chǔ)或其他磁性存儲(chǔ)設(shè)備或任何其他非傳輸介質(zhì),可用于存儲(chǔ)可以被計(jì)算設(shè)備訪(fǎng)問(wèn)的信息。按照本文中的界定,計(jì)算機(jī)可讀介質(zhì)不包括暫存電腦可讀媒體(transitorymedia),如調(diào)制的數(shù)據(jù)信號(hào)和載波。
還需要說(shuō)明的是,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、商品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、商品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括要素的過(guò)程、方法、商品或者設(shè)備中還存在另外的相同要素。
本領(lǐng)域技術(shù)人員應(yīng)明白,本申請(qǐng)的實(shí)施例可提供為方法、系統(tǒng)或計(jì)算機(jī)程序產(chǎn)品。因此,本申請(qǐng)可采用完全硬件實(shí)施例、完全軟件實(shí)施例或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本申請(qǐng)可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤(pán)存儲(chǔ)器、cd-rom、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
以上僅為本申請(qǐng)的實(shí)施例而已,并不用于限制本申請(qǐng)。對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō),本申請(qǐng)可以有各種更改和變化。凡在本申請(qǐng)的精神和原理之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請(qǐng)的權(quán)利要求范圍之內(nèi)。