本發(fā)明涉及電子交易技術領域,更具體地說,涉及一種欺詐交易檢測方法及系統(tǒng)。
背景技術:
隨著移動互聯(lián)網的發(fā)展,移動終端交易、云閃付業(yè)務逐步普及,在給人們生活帶來極大便利的同時,也給了不法分子有趁之機。
當前各類電子交易中,或多或少都存在這信息泄露、被盜取的風險。一些違法犯罪分子可以通過騙取持卡人交易密碼、短信驗證碼等信息,將持卡人卡號綁定在犯罪分子手機上,然手再進行手機刷卡支付,這會給持卡人、金融機構帶來嚴重損失,為此,相關機構通過設置風險規(guī)則對疑似欺詐綁卡交易進行攔截,這種方式對遏制違法犯罪分子的欺詐綁卡起到了一定效果,但是也存在一些不完善之處,主要包括:
一、依靠專家經驗進行欺詐規(guī)則的提取,費時費力;
二、專家經驗不可能窮盡所有的欺詐規(guī)則;
三、違法犯罪分子總是在測試、避開規(guī)則,經過一段時間后,規(guī)則很容易失效;
四、無法有效利用欺詐卡片及欺詐設備的關聯(lián)關系。
技術實現(xiàn)要素:
本發(fā)明的目的在于提供一種電子交易中的欺詐交易檢測方法,其能夠可靠地、自適應地檢測欺詐交易,克服規(guī)則模型檢測及專家經驗檢測的不足之處。
為實現(xiàn)上述目的,本發(fā)明提供一種技術方案如下:
一種電子交易中的欺詐交易檢測方法,包括如下步驟:a)、建立評分模型;b)、將評分模型與規(guī)則模型相結合,對電子交易進行檢測;其中,步驟a)包括:a1)、根據(jù)欺詐卡片與欺詐設備之間的關聯(lián)關系確定N組樣本數(shù)據(jù),其中,N為欺詐卡片或欺詐設備的分級數(shù),每組樣本數(shù)據(jù)包括用于區(qū)分電子交易是否為欺詐交易的負樣本與正樣本;a2)、對每組樣本數(shù)據(jù)進行特征值計算,以生成N組特征數(shù)據(jù),其中特征值至少包括IV值;a3)、對各組特征數(shù)據(jù)進行劃分以獲得訓練數(shù)據(jù)和測試數(shù)據(jù),基于各組訓練數(shù)據(jù)生成多個評分模型,利用各組測試數(shù)據(jù)來測試多個評分模型;步驟b)包括:b1)、利用多個評分模型分別對當前電子交易進行評分,基于各評分結果對當前電子交易是否為欺詐交易進行投票;b2)、基于投票的結果與規(guī)則模型計算的結果判定當前電子交易是否為欺詐交易。
優(yōu)選地,步驟a1)具體包括:將電子交易欺詐檢測系統(tǒng)檢測出的欺詐卡片確定為第1級欺詐卡片;將與第N級欺詐卡片關聯(lián)的欺詐設備確定第N級欺詐設備,將與第N級欺詐設備關聯(lián)的欺詐卡片確定為第N+1級欺詐卡片;其中N≥1。
優(yōu)選地,步驟a2)具體包括,針對每組樣本數(shù)據(jù):計算該組內負樣本數(shù)量與各組內負樣本數(shù)量之和的比例p1,以及該組內正樣本數(shù)量與各組內正樣本數(shù)量之和的比例p2;計算該組樣本數(shù)據(jù)的WOE值,WOE值表示為以及計算該組樣本數(shù)據(jù)的IV值,IV值表示為IV=(p1-p2)*WOE。
優(yōu)選地,步驟a3)具體包括:利用邏輯回歸算法對訓練數(shù)據(jù)進行訓練,以生成N個評分模型。
優(yōu)選地,步驟a3)還包括:利用測試數(shù)據(jù)分別測試N個評分模型,統(tǒng)計各評分模型的準確率;舍棄準確率低于準確率閾值的評分模型。
本發(fā)明還公開一種欺詐交易檢測系統(tǒng),包括:評分模型單元,其包括:樣本數(shù)據(jù)確定模塊,用于根據(jù)欺詐卡片與欺詐設備之間的關聯(lián)關系確定N組樣本數(shù)據(jù),其中,N為欺詐卡片或欺詐設備的分級數(shù);特征計算模塊,與樣本數(shù)據(jù)確定模塊相耦合,用于對每組樣本數(shù)據(jù)進行特征值計算,以生成N組特征數(shù)據(jù);評分模型訓練及測試模塊,與特征計算模塊相耦合,用于對各組特征數(shù)據(jù)進行劃分以獲得訓練數(shù)據(jù)和測試數(shù)據(jù),基于各組訓練數(shù)據(jù)生成多個評分模型,以及利用各組測試數(shù)據(jù)來測試多個評分模型;以及投票模塊,用于利用多個評分模型對當前電子交易是否為欺詐交易進行投票,以生成第一輸出;規(guī)則模型單元,基于欺詐判定規(guī)則對當前電子交易的特征進行判定,以生成第二輸出;以及決策單元,基于第一、第二輸出識別當前電子交易是否為欺詐交易。
本發(fā)明所提供的欺詐交易檢測方法及檢測系統(tǒng),能夠克服規(guī)則模型檢測及專家經驗檢測的不足之處,基于數(shù)據(jù)之間的關聯(lián)性以及前期的檢測結果來補充、完善后期的檢測,從而可靠地、自適應地檢測欺詐交易。上述檢測方法及檢測系統(tǒng)實現(xiàn)簡單,便于在業(yè)內推廣應用。
附圖說明
圖1示出本發(fā)明第一實施例的欺詐交易檢測方法的流程示意圖。
圖2示出本發(fā)明第二實施例的欺詐交易檢測系統(tǒng)的模塊結構示意圖。
具體實施方式
如圖1所示,本發(fā)明第一實施例提供一種欺詐交易檢測方法,其包括如下步驟:
步驟S10、根據(jù)欺詐卡片與欺詐設備之間的關聯(lián)關系確定N組樣本數(shù)據(jù),其中,N為欺詐卡片或欺詐設備的分級數(shù),每組樣本數(shù)據(jù)包括用于區(qū)分電子交易是否為欺詐交易的負樣本與正樣本。
作為一個示例,該步驟可以按如下方式實現(xiàn):將電子交易欺詐檢測系統(tǒng)(或根據(jù)專家經驗)檢測出的欺詐卡片確定為第1級欺詐卡片;將與第1級欺詐卡片關聯(lián)的欺詐設備確定第1級欺詐設備,并將與第1級欺詐設備關聯(lián)的欺詐卡片確定為第2級欺詐卡片;依次類推,最終可以確定總共N級欺詐卡片以及N級欺詐設備,N為大于等于1的正整數(shù)。
作為另一個示例,可以按照欺詐卡片或欺詐設備出現(xiàn)的頻率或地點等來對欺詐卡片或欺詐設備進行分級,例如,出現(xiàn)頻次屬于第一范圍的欺詐設備歸類于第1級欺詐設備,出現(xiàn)頻次屬于第二范圍的欺詐設備歸類于第2級欺詐設備,依次類推,其中第一范圍的數(shù)值高于第二范圍的數(shù)值。又例如,出現(xiàn)地點屬于第一地域的欺詐設備歸類于第1級欺詐設備,出現(xiàn)地點屬于第二地域的欺詐設備歸類于第2級欺詐設備,等等。
步驟S11、對每組樣本數(shù)據(jù)進行特征值計算,以生成N組特征數(shù)據(jù),其中特征值至少包括IV值。
具體地,在該步驟中,針對每組樣本數(shù)據(jù)分別進行如下操作:計算該組內負樣本數(shù)量與各組內負樣本數(shù)量之和的比例p1,以及該組內正樣本數(shù)量與各組內正樣本數(shù)量之和的比例p2;計算該組樣本數(shù)據(jù)的WOE(Weight ofEvidence)值,WOE值表示為以及計算該組樣本數(shù)據(jù)的IV(Information Value)值,IV值表示為IV=(p1-p2)*WOE。
可見,每組樣本數(shù)據(jù)的特征值可以表示為其中i為組編號??梢?,每組樣本數(shù)據(jù)的特征值可以取決于正樣本、負樣本的數(shù)量與分布。
進一步,可以將IV值小于給定閾值的若干組樣本數(shù)據(jù)剔除。
步驟S12、對各組特征數(shù)據(jù)進行劃分以獲得訓練數(shù)據(jù)和測試數(shù)據(jù),基于各組訓練數(shù)據(jù)生成多個評分模型,利用各組測試數(shù)據(jù)來測試多個評分模型。
作為一種具體實現(xiàn),可以對樣本數(shù)據(jù)組中的每一組樣本數(shù)據(jù),按時間進行抽樣,T時間節(jié)點之前的數(shù)據(jù)形成為訓練數(shù)據(jù),T時間節(jié)點之后的數(shù)據(jù)形成為測試數(shù)據(jù)。
可以利用邏輯回歸算法對訓練數(shù)據(jù)進行訓練,以生成N個評分模型。隨后,利用測試數(shù)據(jù)分別測試N個評分模型。
作為進一步改進,在測試之后,可以統(tǒng)計各評分模型的準確率;并舍棄準確率低于準確率閾值的評分模型。從而,最終評分模型的數(shù)量一般會低于欺詐卡片或欺詐設備的分級數(shù)N。
可以理解,由于評分模型的數(shù)量為多個,并可以分別對應于多個不同級別的欺詐卡片或欺詐設備,從而本發(fā)明提供的方法可以充分利用欺詐卡片或欺詐設備之間的關聯(lián)性,從而實現(xiàn)更準確的欺詐交易檢測。
步驟S20、利用多個評分模型分別對當前電子交易進行評分,基于各評分結果對當前電子交易是否為欺詐交易進行投票。
具體地,該步驟可以包括:可以利用上述多個評分模型分別對當前電子交易進行評分;確定每個評分模型的投票權重;其中,投票權重表示為其中,l為評分模型的數(shù)量,ri為對應評分模型的準確率。
可見,每個評分模型的投票權重取決于該評分模型的準確率??梢岳斫?,當一個評分模型的準確率較高時,意味這該評分模型能夠對樣本數(shù)據(jù)進行更好地表征,也通常表示其能夠更準確地檢測欺詐交易。
步驟S21、基于投票的結果與規(guī)則模型計算的結果判定當前電子交易是否為欺詐交易。
為了克服自動檢測欺詐交易的弊端,該步驟中,結合規(guī)則模型計算的結果(和/或結合專家經驗)來綜合判定當前電子交易是否為欺詐交易。
作為對上述實施例的進一步改進,可以每隔一時間周期,重新執(zhí)行上述步驟S10、S11及S12,以便更新評分模型,從而可以根據(jù)前期的檢測結果來補充、完善后期的檢測,也有利于使不法分子意圖避開檢測規(guī)則的企圖無法實現(xiàn)。
本發(fā)明第二實施例提供一種欺詐交易檢測系統(tǒng),其包括評分模型單元10、規(guī)則模型單元20及決策單元30,如圖2所示。
其中,評分模型單元10包括樣本數(shù)據(jù)確定模塊101、特征計算模塊102、評分模型訓練及測試模塊103以及投票模塊104。其中,樣本數(shù)據(jù)確定模塊101用于根據(jù)欺詐卡片與欺詐設備之間的關聯(lián)關系確定N組樣本數(shù)據(jù),其中,N為欺詐卡片或欺詐設備的分級數(shù);特征計算模塊102與樣本數(shù)據(jù)確定模塊101相耦合,用于對每組樣本數(shù)據(jù)進行特征值計算,以生成N組特征數(shù)據(jù);評分模型訓練及測試模塊103與特征計算模塊102相耦合,用于對各組特征數(shù)據(jù)進行劃分以獲得訓練數(shù)據(jù)和測試數(shù)據(jù),基于各組訓練數(shù)據(jù)生成多個評分模型,以及利用各組測試數(shù)據(jù)來測試多個評分模型;投票模塊104用于利用多個評分模型對當前電子交易是否為欺詐交易進行投票,以生成第一輸出;
規(guī)則模型單元20則基于欺詐判定規(guī)則(或專家經驗)對當前電子交易的特征進行判定,以生成第二輸出。
決策單元30基于上述第一、第二輸出最終識別當前電子交易是否為欺詐交易。
上述各實施例所提供的欺詐交易檢測方法及檢測系統(tǒng),能夠克服規(guī)則模型檢測及專家經驗檢測的不足之處,基于數(shù)據(jù)之間的關聯(lián)性以及前期的檢測結果來補充、完善后期的檢測,從而更可靠地、并自適應地檢測欺詐交易。此外,上述檢測方法及檢測系統(tǒng)實現(xiàn)簡單,便于在業(yè)內推廣應用。
上述說明僅針對于本發(fā)明的優(yōu)選實施例,并不在于限制本發(fā)明的保護范圍。本領域技術人員可作出各種變形設計,而不脫離本發(fā)明的思想及附隨的權利要求。