欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種套用商戶類別碼欺詐行為的檢測方法

文檔序號:9433392閱讀:643來源:國知局
一種套用商戶類別碼欺詐行為的檢測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于信息分類處理技術(shù)領(lǐng)域,更為具體地講,涉及一種套用商戶類別碼欺 詐行為的檢測方法,用于識別套用商戶類別碼進行欺詐的商戶。
【背景技術(shù)】
[0002] 近年來,隨著經(jīng)濟的高速發(fā)展,POS機(Point of Sale,銷售點情報管理系統(tǒng))在 商戶間也得到了不斷普及。安裝POS機中的商戶涉及了各行各業(yè),而不同行業(yè)在POS機使 用中所收取的手續(xù)費亦不盡相同,一些第三方支付機構(gòu)套用商戶類別碼享受低手續(xù)費率的 行為也與日倶增,套用商戶類別碼的欺詐行為造成了發(fā)卡方巨額的損失,嚴(yán)重擾亂POS收 單行業(yè)的金融秩序、讓POS收單行業(yè)滋生不安全因素、是二次清算的病因。
[0003] 目前國內(nèi)的文獻(xiàn)對套用商戶類別碼欺詐檢測技術(shù)的研究比較少,主要集中在信用 卡欺詐檢測研究。對于傳統(tǒng)的套用商戶類別碼欺詐行為的檢測,除了通過法律約束和商戶 自身道德素質(zhì)約束,更多的是通過銀聯(lián)調(diào)查員實地考察從而發(fā)現(xiàn)套用商戶,這往往是費時 費力的。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明的目的在于克服上述人工檢測的不足,提供一種套用商戶類別碼欺詐行為 的檢測方法,以提高識別套用商戶類別碼進行欺詐的商戶的效率。
[0005] 為實現(xiàn)上述發(fā)明目的,本發(fā)明套用商戶類別碼欺詐行為的檢測方法,其特征在于, 包括以下步驟:
[0006] (1)、獲取標(biāo)準(zhǔn)行為模式
[0007] I. 1)、獲取正常商戶交易數(shù)據(jù)并進行預(yù)處理
[0008] 通過銀聯(lián)內(nèi)部數(shù)據(jù)庫獲取每個商戶類別碼下N個正常商戶一年的交易流水?dāng)?shù)據(jù), 對每個正常商戶一年的交易流水?dāng)?shù)據(jù)進行標(biāo)準(zhǔn)初始化即對正常商戶交易流水?dāng)?shù)據(jù),按照小 時、星期天數(shù)、月時間尺度分別統(tǒng)計交易量,最終將交易流水?dāng)?shù)據(jù)表示為具有86維特征的 交易數(shù)據(jù)向量:
[0009] Xi= (x J1, xi 2, . . . , XijG), I ^ i ^ N, G = 86,
[0010] 其中,i表示正常用戶編號,N表示正常商戶數(shù)量;
[0011] 所述的86維特征的交易數(shù)據(jù)向量包括24個按小時統(tǒng)計的交易量以及24個按小 時統(tǒng)計的交易量的一階導(dǎo)數(shù)、7個按周一到周日統(tǒng)計的交易量以及7個按周一到周日統(tǒng)計 的交易量的一階導(dǎo)數(shù)、12個按月統(tǒng)計的交易量以及12個按月統(tǒng)計的交易量的一階導(dǎo)數(shù);
[0012] 86維特征的交易數(shù)據(jù)向量按維進行歸一化處理:
[0014] 其中,Xi nin為第j維的最小值,X i nax為第j維的最大值,X' I j為第i個用戶的第 j維數(shù)據(jù)的歸一化后的數(shù)據(jù);
[0015] I. 2)、刪除異常交易數(shù)據(jù)向量
[0016] 將獲取的各個正常用戶的86維特征的交易數(shù)據(jù)向量中異常交易數(shù)據(jù)向量刪除, 得到M個86維特征的交易數(shù)據(jù)向量;
[0017] 1. 3)、層次聚類獲取標(biāo)準(zhǔn)行為模式
[0018] 對每個商戶類別碼下的M個86維特征的交易數(shù)據(jù)向量運用層次聚類,將相似的商 戶行為模式聚成一類,得到每個商戶類別碼下的一組分別基于小時、星期天數(shù)、月等時間尺 度的標(biāo)準(zhǔn)行為模式。
[0019] (2)、分類器訓(xùn)練
[0020] 2. 1)、獲取商戶交易數(shù)據(jù)并進行預(yù)處理
[0021] 從銀聯(lián)內(nèi)部數(shù)據(jù)庫中,按照正常商戶:套用商戶=1:1的數(shù)量,隨機抽取正常商 戶、套用商戶,然后按照步驟I. 1)的方法,將他們一年的交易流水?dāng)?shù)據(jù)分別表示為具有86 維特征的交易數(shù)據(jù)向量并進行歸一化處理;
[0022] 計算每一個商戶的交易數(shù)據(jù)向量與步驟(1)得到的所有商戶類別碼下的所有標(biāo) 準(zhǔn)行為模式的歐式距離,并且按照距離由小到大形成一個排名表;從排名表中,取距離最小 (匹配程度最高)的標(biāo)準(zhǔn)行為模式的商戶類別碼作為該商戶最相近的商戶類別碼,從而獲 取與商戶類別碼相關(guān)的9維特征:
[0023] 該商戶注冊的商戶類別碼、最相近商戶類別碼、商戶手續(xù)費等級、最相近商戶手續(xù) 費等級、商戶小類ID、最相近商戶小類ID、商戶小類ID與最相近商戶小類ID的差值、商戶 類別碼在排名表中的名次、警告級別;
[0024] 將上述與商戶類別碼相關(guān)的9維特征疊加到該商戶交易數(shù)據(jù)向量上,得到95維 的特征向量;
[0025] 2. 2)、建立分類器模型
[0026] 將正常商戶的真實結(jié)果作為0、套用商戶的真實結(jié)果作為1,抽取正常商戶、套用 商戶的95維的特征向量作為輸入特征向量,通過批量梯度下降方法不斷訓(xùn)練得到邏輯斯 蒂回歸模型的參數(shù),從而得到分類器;
[0027] (3)、分類器分類
[0028] 獲取新商戶一年的交易流水?dāng)?shù)據(jù)按照步驟(2)的方法進行向量化得到95維特征 向量X_= (X nf3Wil, ...,,,代入步驟(2)得到分類器進行計算,得到一個概率 值;
[0029] 將得到的概率值與設(shè)定的閾值作比較,當(dāng)大于設(shè)定的閾值時,該新商戶為套用商 戶,否則為正常商戶。
[0030] 本發(fā)明的目的是這樣實現(xiàn)的
[0031] 本發(fā)明套用商戶類別碼欺詐行為的檢測方法,首先通過獲取正常商戶交易數(shù)據(jù)并 進行預(yù)處理、層次聚類獲取標(biāo)準(zhǔn)行為模式;然后,按照正常商戶:套用商戶=1:1的數(shù)量,隨 機抽取正常商戶、套用商戶的交易流水?dāng)?shù)據(jù)并獲取各商戶的86維特征的交易數(shù)據(jù)向量,通 過歐式距離計算獲取一個9維特征進行疊加,得到95維的特征向量,通過批量梯度下降方 法不斷訓(xùn)練得到邏輯斯蒂回歸模型的參數(shù),從而得到分類器;最后依據(jù)新用戶的一年的交 易流水?dāng)?shù)據(jù)構(gòu)造一個95維的特征向量送入分類器分類,檢測出是否是套用商戶。本發(fā)明利 用計算機系統(tǒng),能夠從多個維度對商戶行為進行識別,從而高效準(zhǔn)確地檢測出商戶套用。
【附圖說明】
[0032] 圖1是本發(fā)明套用商戶類別碼欺詐行為的檢測方法一種【具體實施方式】流程圖;
[0033] 圖2是圖1所示異常數(shù)據(jù)一具體實例圖;
[0034] 圖3是圖1所示層次聚類中異常數(shù)據(jù)分布示意圖;
[0035] 圖4是圖1所示標(biāo)準(zhǔn)行為模式一具體實例圖;
[0036] 圖5是不同商戶類別碼閾值變化曲線圖。
【具體實施方式】
[0037] 下面結(jié)合附圖對本發(fā)明的【具體實施方式】進行描述,以便本領(lǐng)域的技術(shù)人員更好地 理解本發(fā)明。需要特別提醒注意的是,在以下的描述中,當(dāng)已知功能和設(shè)計的詳細(xì)描述也許 會淡化本發(fā)明的主要內(nèi)容時,這些描述在這里將被忽略。
[0038] 本發(fā)明利用聚類、分類、異常檢測等數(shù)據(jù)挖掘方法提供一種套用商戶類別碼欺詐 行為的檢測方法。套用商戶類別碼欺詐行為的檢測是對欺詐可能性的一種量化判斷,首先 根據(jù)正常商戶歷史交易數(shù)據(jù)構(gòu)造分離器模型,然后利用該模型對新商戶的交易行為進行分 析和處理,從中識別該商戶是否是套用商戶。
[0039] 圖1是本發(fā)明套用商戶類別碼欺詐行為的檢測方法一種【具體實施方式】流程圖。
[0040] 在本實施例中,如圖1所示,本發(fā)明套用商戶類別碼欺詐行為的檢測方法包括三 個大的步驟,即獲取標(biāo)準(zhǔn)行為模式、分類器訓(xùn)練、分類器分類,具體如下。
[0041] 一、獲取標(biāo)準(zhǔn)行為模式
[0042] 不同的行業(yè)有不同的行業(yè)營業(yè)時間區(qū)間、營業(yè)高峰或者低谷等的營業(yè)規(guī)律,因此 我們將同一類行業(yè)中商戶具有的整體營業(yè)規(guī)律稱之為該行業(yè)的"行為模式"。
[0043] 1、獲取正常商戶交易數(shù)據(jù)并進行預(yù)處理
[0044] 通過銀聯(lián)內(nèi)部數(shù)據(jù)庫獲取每個商戶類別碼下N個正常商戶一年的交易流水?dāng)?shù)據(jù) (存在少部分異常數(shù)據(jù)),對每個正常商戶一年的交易流水?dāng)?shù)據(jù)進行標(biāo)準(zhǔn)初始化。
[0045] 因為交易流水?dāng)?shù)據(jù)的敏感性,我們只能獲取如表1所示的商戶交易流水?dāng)?shù)據(jù),每 行數(shù)據(jù)包括商戶ID、MCC(商戶類別碼)、商戶扣率、月、周、時、交易量、交易額、套用標(biāo)簽9 列屬性。每一行數(shù)據(jù)描述了該商戶的一部分基本屬性和該商戶在某月的周幾的某個時間段 (1小時)內(nèi)總的交易筆數(shù)和交易金額。最后一列表示該是否商戶被業(yè)務(wù)部門標(biāo)記為套用 商戶,其中"〇"為未套用商戶類別碼的正常商戶、" 1"表示確定為套用商戶類別碼的套用商 戶。
CN 105184574 A 說明書 4/11 頁
[0048] 表1
[0049] 對某個商戶類別碼下選出的正常商戶一年的交易流水?dāng)?shù)據(jù)進行標(biāo)準(zhǔn)初始化,按照 小時、星期天數(shù)、月等時間尺度分別統(tǒng)計交易量,最終將該正常商戶數(shù)據(jù)表示為具有86維 特征的交易數(shù)據(jù)向量Xi= (X m Xi, · · ·,xi,c),1彡i彡N,G = 86。
[0050] 為了方便計算,我們把86維特征的交易數(shù)據(jù)向量進行了歸一化,轉(zhuǎn)換為[0, 1]之 間的86維特征向量。
[0051] 其中,以小時(共24小時)時間尺度統(tǒng)計交易量如表2所示。
24小時的交易量(24維) 24小時交易量的一階導(dǎo)數(shù)(24維)
[0053] 表 2
[0054] 其中,以星期天數(shù)時間尺度統(tǒng)計交易量如表3所示。
[0056] 表 3
[0057] 其中,以月份時間尺度統(tǒng)計交易量如表4所示。
[00
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
汉阴县| 临漳县| 黔东| 呼玛县| 逊克县| 张北县| 射阳县| 新昌县| 安康市| 怀宁县| 迭部县| 淳化县| 富锦市| 拉孜县| 田林县| 天峻县| 淅川县| 温州市| 阿拉尔市| 庆阳市| 宜州市| 夏邑县| 开平市| 方山县| 枝江市| 张家界市| 盐池县| 山丹县| 塘沽区| 右玉县| 辉县市| 临西县| 林周县| 崇礼县| 汝州市| 基隆市| 岚皋县| 即墨市| 青阳县| 格尔木市| 凌源市|