專(zhuān)利名稱(chēng):應(yīng)用數(shù)據(jù)挖掘方法的信用評(píng)分系統(tǒng)及信用評(píng)分方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種信用評(píng)分系統(tǒng),尤其是涉及一種適用于金融機(jī)構(gòu)的應(yīng)用數(shù)據(jù)挖掘(Data Mining)方法的信用評(píng)分系統(tǒng)及方法。
背景技術(shù):
目前,對(duì)信用卡或現(xiàn)金卡等新申請(qǐng)進(jìn)件的評(píng)分,大多采用人工經(jīng)驗(yàn)評(píng)估或利用評(píng)分卡來(lái)建立評(píng)分規(guī)則。一般而言,信用評(píng)分是根據(jù)申請(qǐng)人的歷史繳款數(shù)據(jù),同時(shí)參照個(gè)人屬性數(shù)據(jù),再運(yùn)用統(tǒng)計(jì)原理,將申請(qǐng)人的信用風(fēng)險(xiǎn)予以量化。然后,再依據(jù)此信用評(píng)分來(lái)決定是否核卡,或決定申請(qǐng)人的信用額度的多少。通過(guò)對(duì)申請(qǐng)人的信用評(píng)分,可以減少金融機(jī)構(gòu)的壞帳損失。
然而,隨著社會(huì)大環(huán)境的劇烈變遷,評(píng)分標(biāo)準(zhǔn)也需要隨之變更調(diào)整,但目前所使用的靜態(tài)評(píng)分卡卻無(wú)法實(shí)時(shí)反應(yīng)社會(huì)大環(huán)境的現(xiàn)況。其次,各個(gè)金融機(jī)構(gòu)的客戶(hù)屬性仍具相當(dāng)大的差異,而目前一般所使用的專(zhuān)家型評(píng)分卡(Generic Score Card)卻無(wú)法有效地評(píng)估各金融機(jī)構(gòu)的客戶(hù)的風(fēng)險(xiǎn)。而評(píng)分卡需要完全仰賴(lài)廠(chǎng)商供應(yīng),導(dǎo)致金融機(jī)構(gòu)的自主性降低。再者,評(píng)分卡的購(gòu)置成本相當(dāng)高,從而會(huì)增加金融機(jī)構(gòu)的營(yíng)運(yùn)成本的負(fù)擔(dān)。
由于目前并無(wú)一套完整流程以及評(píng)估方法,可以應(yīng)用于處理信用卡或現(xiàn)金卡新申請(qǐng)者的進(jìn)件的信用評(píng)估系統(tǒng),也無(wú)法使信用評(píng)分的模型實(shí)現(xiàn)最佳化的目標(biāo)。因此,亟需建立一套信用評(píng)分系統(tǒng),以提供最佳化的信用評(píng)分模型。
發(fā)明內(nèi)容
因此,本發(fā)明的目的就是提供一種應(yīng)用數(shù)據(jù)挖掘方法的銀行信用評(píng)分方法,適用于金融機(jī)構(gòu)對(duì)申請(qǐng)者進(jìn)行信用評(píng)分。此信用評(píng)分方法可利用歷史數(shù)據(jù),來(lái)建立呆帳者預(yù)測(cè)模型,借以篩選客戶(hù),減少金融機(jī)構(gòu)的壞帳損失,進(jìn)而達(dá)到降低風(fēng)險(xiǎn)的效果。
本發(fā)明的另一目的是提供一種應(yīng)用數(shù)據(jù)挖掘方法的銀行信用評(píng)分方法,利用數(shù)據(jù)挖掘方法來(lái)建立信用評(píng)分模型。因此,可建立客觀(guān)公正的信用審核標(biāo)準(zhǔn),從而排除人為經(jīng)驗(yàn)判斷的缺陷。
本發(fā)明的又一目的是在提供一種應(yīng)用數(shù)據(jù)挖掘方法的銀行信用評(píng)分方法,具有混合式取樣模塊,因此可平衡數(shù)據(jù)比例,從而解決數(shù)據(jù)挖掘了無(wú)法處理高度不對(duì)稱(chēng)數(shù)據(jù)的問(wèn)題。
本發(fā)明的再一目的是提供一種應(yīng)用數(shù)據(jù)挖掘方法的信用評(píng)分系統(tǒng),金融機(jī)構(gòu)可依據(jù)其所面對(duì)的實(shí)際狀況,自行調(diào)整更新預(yù)測(cè)模型。因此,可有效適應(yīng)外在環(huán)境變化,靈活性極佳。
根據(jù)上述目的,本發(fā)明提出了一種應(yīng)用數(shù)據(jù)挖掘方法的信用評(píng)分方法,適用于一金融機(jī)構(gòu)來(lái)評(píng)估多個(gè)申請(qǐng)者的信用評(píng)分。此信用評(píng)分方法包括先提供一進(jìn)件申請(qǐng)歷史數(shù)據(jù);再進(jìn)行重新取樣(Resample)步驟,以使所提供的進(jìn)件申請(qǐng)歷史數(shù)據(jù)中所取樣的呆帳者筆數(shù)以及正常者筆數(shù)之間成接近比例;接下來(lái),進(jìn)行數(shù)據(jù)挖掘分類(lèi)步驟,以建立多個(gè)呆帳者模型;接著,利用分類(lèi)模型評(píng)估測(cè)量值評(píng)估所建立的呆帳者模型,以評(píng)估這些呆帳者模型的準(zhǔn)確率,以從這些呆帳者模型選出具最佳測(cè)量值的呆帳者模型來(lái)作為預(yù)測(cè)模型;然后,將一新申請(qǐng)進(jìn)件數(shù)據(jù)輸入預(yù)測(cè)模型,從而獲得此新申請(qǐng)進(jìn)件數(shù)據(jù)的信用評(píng)分。
依照本發(fā)明一個(gè)較佳實(shí)施例,進(jìn)件申請(qǐng)歷史數(shù)據(jù)中的呆帳者筆數(shù)與正常者筆數(shù)之間的預(yù)設(shè)比例接近于1。
為實(shí)現(xiàn)上述目的,本發(fā)明還提出了一種應(yīng)用數(shù)據(jù)挖掘方法的信用評(píng)分系統(tǒng),適用于金融機(jī)構(gòu)來(lái)評(píng)估多個(gè)申請(qǐng)者的信用評(píng)分。此信用評(píng)分系統(tǒng)至少包括重新取樣模塊,以將進(jìn)件申請(qǐng)歷史數(shù)據(jù)中不平衡的呆帳者數(shù)據(jù)與正常者數(shù)據(jù)重新取樣,而使進(jìn)件申請(qǐng)歷史數(shù)據(jù)中所取樣的呆帳者筆數(shù)以及正常者筆數(shù)之間成相近比例;以及數(shù)據(jù)挖掘模塊,以建立多個(gè)呆帳者模型,其中利用模型評(píng)估測(cè)量值來(lái)評(píng)估所建立的呆帳者模型,以從這些呆帳者模型選出具最佳測(cè)量值的呆帳者模型作為預(yù)測(cè)模型。
依照本發(fā)明的一個(gè)較佳實(shí)施例,重新取樣模塊包括進(jìn)件歷史數(shù)據(jù)過(guò)度取樣模塊以及進(jìn)件歷史數(shù)據(jù)減量取樣模塊。而且,數(shù)據(jù)挖掘模塊包括數(shù)據(jù)挖掘決策樹(shù)引擎以及數(shù)據(jù)挖掘類(lèi)神經(jīng)網(wǎng)絡(luò)引擎。
通過(guò)結(jié)合混合式取樣模塊以及數(shù)據(jù)挖掘技術(shù),可建立客觀(guān)公正的信用評(píng)分模型,且可根據(jù)金融機(jī)構(gòu)所面對(duì)的實(shí)際狀況的差異進(jìn)行調(diào)整。因此,信用評(píng)分系統(tǒng)不僅具有極為靈活的應(yīng)用性,還可有效篩選客戶(hù),從而大幅減少了金融機(jī)構(gòu)的壞帳損失,進(jìn)而實(shí)現(xiàn)了降低風(fēng)險(xiǎn)的目的。
圖1示意根據(jù)本發(fā)明一較佳實(shí)施例的一種信用評(píng)分的流程圖。
圖2示意根據(jù)本發(fā)明另一較佳實(shí)施例的一種信用評(píng)分的流程圖。
其中,附圖標(biāo)記說(shuō)明如下10進(jìn)件申請(qǐng)歷史數(shù)據(jù)12數(shù)據(jù)處理模塊14數(shù)據(jù)挖掘模塊16數(shù)據(jù)挖掘決策樹(shù)引擎18邏輯斯蒂回歸引擎20數(shù)據(jù)挖掘類(lèi)神經(jīng)網(wǎng)絡(luò)引擎22分類(lèi)模型評(píng)估測(cè)量值 24信用評(píng)分預(yù)測(cè)模型26分?jǐn)?shù)28新進(jìn)件申請(qǐng)數(shù)據(jù)100進(jìn)件申請(qǐng)歷史數(shù)據(jù) 102重新取樣模塊104進(jìn)件歷史數(shù)據(jù)過(guò)度取樣模塊 106進(jìn)件歷史數(shù)據(jù)減量取樣模塊108數(shù)據(jù)挖掘模塊 110數(shù)據(jù)挖掘決策樹(shù)引擎112數(shù)據(jù)挖掘類(lèi)神經(jīng)網(wǎng)絡(luò)引擎 114分類(lèi)模型評(píng)估測(cè)量值116信用評(píng)分預(yù)測(cè)模型 118新進(jìn)件申請(qǐng)數(shù)據(jù)120分?jǐn)?shù) 122邏輯斯蒂回歸引擎具體實(shí)施方式
本發(fā)明公開(kāi)了一種應(yīng)用數(shù)據(jù)挖掘方法的信用評(píng)分系統(tǒng)及方法,適合被金融機(jī)構(gòu)用來(lái)評(píng)估新申請(qǐng)者的信用評(píng)分。為了使本發(fā)明的敘述更加詳盡與完整,可以參照下列描述并配合圖1與圖2。
近年來(lái),隨著信息科技的日新月異,信息系統(tǒng)不論是在巨量數(shù)據(jù)處理,或是在高速運(yùn)算等功能上,均具有相當(dāng)顯著的突破與進(jìn)步。數(shù)據(jù)挖掘?yàn)閿?shù)據(jù)庫(kù)應(yīng)用方式中相當(dāng)重要的一種技術(shù)。其中,數(shù)據(jù)挖掘技術(shù)又可稱(chēng)為數(shù)據(jù)采礦技術(shù),也就是說(shuō),通過(guò)優(yōu)異的數(shù)據(jù)處理以及運(yùn)算能力,在所掌握的大量數(shù)據(jù)中進(jìn)行多維度的搜尋,并更進(jìn)一步地?cái)X取出藏匿在所述大量數(shù)據(jù)中的知識(shí)模式(Knowledge Patterns)。即,經(jīng)由數(shù)據(jù)挖掘所提供的智能型數(shù)據(jù)分析,可更加了解數(shù)據(jù)的內(nèi)涵,進(jìn)而充分且有效地解決所面對(duì)的各種問(wèn)題。目前,數(shù)據(jù)挖掘技術(shù)已廣泛且成功地應(yīng)用在市場(chǎng)調(diào)查、營(yíng)銷(xiāo)分析研究、經(jīng)營(yíng)決策分析、制造工程控制、以及生物科技研究等領(lǐng)域。
因此,本發(fā)明就是運(yùn)用數(shù)據(jù)挖掘技術(shù),再搭配混合式取樣模塊,來(lái)整合出一套信用評(píng)分模型的完整程序。
請(qǐng)參照?qǐng)D1,圖1示意根據(jù)本發(fā)明一較佳實(shí)施例的一種信用評(píng)分的流程圖。本發(fā)明的信用評(píng)分方法可供銀行或金控公司等金融機(jī)構(gòu)的授信單位來(lái)使用,例如信用卡申請(qǐng)審核、現(xiàn)金卡申請(qǐng)審核、個(gè)人小額信貸審核、或中小企業(yè)信用評(píng)級(jí)。通過(guò)該信用評(píng)分方法,金融機(jī)構(gòu)可對(duì)金融商品的新申請(qǐng)者進(jìn)行信用評(píng)分的評(píng)估。此信用評(píng)分方法主要是運(yùn)用信用評(píng)分系統(tǒng),此信用評(píng)分系統(tǒng)至少包括數(shù)據(jù)挖掘模塊14。在本較佳實(shí)施例中,信用評(píng)分系統(tǒng)還可選擇性地設(shè)置數(shù)據(jù)處理模塊12,例如進(jìn)件歷史數(shù)據(jù)取樣模塊,以先行對(duì)為數(shù)眾多的歷史數(shù)據(jù)進(jìn)行處理。數(shù)據(jù)挖掘模塊14可例如包括數(shù)據(jù)挖掘決策樹(shù)引擎16、邏輯斯蒂回歸引擎18及/或數(shù)據(jù)挖掘類(lèi)神經(jīng)網(wǎng)絡(luò)引擎20。
利用上述的信用評(píng)分系統(tǒng)進(jìn)行金融商品新申請(qǐng)者的信用評(píng)分時(shí),先將過(guò)往的進(jìn)件申請(qǐng)歷史數(shù)據(jù)10輸入信用評(píng)分系統(tǒng)中。這些過(guò)往的進(jìn)件申請(qǐng)歷史數(shù)據(jù)為例如信用卡、現(xiàn)金卡、或小額信貸等金融商品申請(qǐng)者的歷史數(shù)據(jù)。這些進(jìn)件申請(qǐng)歷史數(shù)據(jù)包括個(gè)人基本數(shù)據(jù),例如性別、年齡、職業(yè)、年收入、婚姻狀況與居住地等等。接著,可直接利用信用評(píng)分系統(tǒng)的數(shù)據(jù)挖掘模塊14對(duì)進(jìn)件申請(qǐng)歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘分類(lèi)步驟,以分別建立出多個(gè)呆帳者模型。數(shù)據(jù)挖掘模塊14可例如包括數(shù)據(jù)挖掘決策樹(shù)引擎16、數(shù)據(jù)挖掘類(lèi)神經(jīng)網(wǎng)絡(luò)引擎20以及邏輯斯蒂回歸引擎18。數(shù)據(jù)挖掘決策樹(shù)引擎16、數(shù)據(jù)挖掘類(lèi)神經(jīng)網(wǎng)絡(luò)引擎20及/或邏輯斯蒂回歸引擎18可單獨(dú)使用,但較佳是同時(shí)使用。在本發(fā)明中,進(jìn)件申請(qǐng)歷史數(shù)據(jù)10分別進(jìn)入數(shù)據(jù)挖掘決策樹(shù)引擎16、數(shù)據(jù)挖掘類(lèi)神經(jīng)網(wǎng)絡(luò)引擎20及/或邏輯斯蒂回歸引擎18中,經(jīng)數(shù)據(jù)挖掘決策樹(shù)引擎16、數(shù)據(jù)挖掘類(lèi)神經(jīng)網(wǎng)絡(luò)引擎20探勘分類(lèi)及/或邏輯斯蒂回歸引擎18后,產(chǎn)生多組的呆帳者模型。
在本發(fā)明的其它較佳實(shí)施例中,也可先利用數(shù)據(jù)處理模塊12對(duì)進(jìn)件申請(qǐng)歷史數(shù)據(jù)進(jìn)行處理,例如取樣或重新取樣。然后,再使處理后的訓(xùn)練數(shù)據(jù)分別進(jìn)入數(shù)據(jù)挖掘決策樹(shù)引擎16、數(shù)據(jù)挖掘類(lèi)神經(jīng)網(wǎng)絡(luò)引擎20及/或邏輯斯蒂回歸引擎18中,經(jīng)數(shù)據(jù)挖掘決策樹(shù)引擎16、數(shù)據(jù)挖掘類(lèi)神經(jīng)網(wǎng)絡(luò)引擎20探勘分類(lèi)及/或邏輯斯蒂回歸引擎18后,而產(chǎn)生多組的呆帳者模型。因此,本發(fā)明可根據(jù)進(jìn)件申請(qǐng)歷史數(shù)據(jù)的實(shí)際情況,選擇性地使用數(shù)據(jù)處理模塊12。
在呆帳者模型建立后,利用分類(lèi)模型評(píng)估測(cè)量值22,例如正確率、AUC(Area Under the Curve)值等,對(duì)這些呆帳者模型進(jìn)行評(píng)估,以評(píng)估這些呆帳者模型的準(zhǔn)確率,并以從這些呆帳者模型中選出具最佳測(cè)量值的一組呆帳者模型來(lái)作為信用評(píng)分預(yù)測(cè)模型24。此時(shí),即可將一新申請(qǐng)者的新進(jìn)件申請(qǐng)數(shù)據(jù)28輸入此信用評(píng)分預(yù)測(cè)模型24。信用評(píng)分預(yù)測(cè)模型24就可預(yù)估出此新申請(qǐng)者呆帳的機(jī)率,并可將所預(yù)估的呆帳機(jī)率轉(zhuǎn)換成分?jǐn)?shù)26,從而獲得此新申請(qǐng)者的信用評(píng)分。
請(qǐng)參照?qǐng)D2,圖2示意根據(jù)本發(fā)明另一較佳實(shí)施例的一種信用評(píng)分的流程圖。本發(fā)明的信用評(píng)分方法可供金融機(jī)構(gòu)(例如銀行或金控公司的信用卡、現(xiàn)金卡、小額信貸的授信單位等)來(lái)應(yīng)用,例如信用卡申請(qǐng)審核、現(xiàn)金卡申請(qǐng)審核、個(gè)人小額信貸審核、或中小企業(yè)信用評(píng)級(jí)。通過(guò)此信用評(píng)分方法,金融機(jī)構(gòu)可對(duì)金融商品的新申請(qǐng)者進(jìn)行信用評(píng)分的評(píng)估。此信用評(píng)分方法主要運(yùn)用一信用評(píng)分系統(tǒng),此信用評(píng)分系統(tǒng)較佳可包括重新取樣模塊102以及數(shù)據(jù)挖掘模塊108。在本較佳實(shí)施例中,重新取樣模塊102包括進(jìn)件歷史數(shù)據(jù)過(guò)度取樣模塊104及/或進(jìn)件歷史數(shù)據(jù)減量取樣模塊106,且數(shù)據(jù)挖掘模塊108包括數(shù)據(jù)挖掘決策樹(shù)引擎110、數(shù)據(jù)挖掘類(lèi)神經(jīng)網(wǎng)絡(luò)引擎112及/或邏輯斯蒂回歸引擎122。
利用上述的信用評(píng)分系統(tǒng)進(jìn)行金融商品新申請(qǐng)者的信用評(píng)分時(shí),首先,將過(guò)往的進(jìn)件申請(qǐng)歷史數(shù)據(jù)100輸入信用評(píng)分系統(tǒng)中。這些過(guò)往的進(jìn)件申請(qǐng)歷史數(shù)據(jù)為一些金融商品(例如信用卡、現(xiàn)金卡、或小額信貸)申請(qǐng)者的歷史數(shù)據(jù)。這些進(jìn)件申請(qǐng)歷史數(shù)據(jù)包括個(gè)人基本數(shù)據(jù),例如性別、年齡、職業(yè)、年收入、婚姻狀況與居住地等等。接下來(lái),利用重新取樣模塊102對(duì)所輸入的進(jìn)件申請(qǐng)歷史數(shù)據(jù)中不平衡的呆帳者數(shù)據(jù)與正常者數(shù)據(jù)進(jìn)行重新取樣。重新取樣模塊102較佳可包括進(jìn)件歷史數(shù)據(jù)過(guò)度取樣模塊104以及進(jìn)件歷史數(shù)據(jù)減量取樣模塊106。其中,進(jìn)件歷史數(shù)據(jù)過(guò)度取樣模塊104是指對(duì)筆數(shù)較少的數(shù)據(jù)進(jìn)行過(guò)度取樣,而進(jìn)件歷史數(shù)據(jù)減量取樣模塊106是指對(duì)筆數(shù)較多的數(shù)據(jù)進(jìn)行減量取樣。例如,就一般情況而言,銀行或金控公司的信用卡或現(xiàn)金卡等金融商品的使用者中,屬呆帳者的比例與正常者的比例的差異相當(dāng)懸殊。因此,就可利用進(jìn)件歷史數(shù)據(jù)過(guò)度取樣模塊104來(lái)對(duì)呆帳者數(shù)據(jù)進(jìn)行過(guò)度取樣的操作,另外可利用進(jìn)件歷史數(shù)據(jù)減量取樣模塊106對(duì)正常者數(shù)據(jù)進(jìn)行減量取樣的操作。在本較佳實(shí)施例中,進(jìn)件歷史數(shù)據(jù)過(guò)度取樣模塊104與進(jìn)件歷史數(shù)據(jù)減量取樣模塊106可單獨(dú)使用或同時(shí)使用,以將進(jìn)件申請(qǐng)歷史數(shù)據(jù)中不平衡的呆帳者數(shù)據(jù)與正常者數(shù)據(jù)重新取樣,而使所取樣的呆帳者筆數(shù)以及正常者筆數(shù)之間成接近比例,并獲得多組申請(qǐng)者歷史數(shù)據(jù)來(lái)作為訓(xùn)練數(shù)據(jù)。為了使后續(xù)數(shù)據(jù)挖掘引擎能順利建立出呆帳者預(yù)測(cè)模型,所取樣的呆帳者筆數(shù)較佳是接近正常者筆數(shù),更佳是使呆帳者筆數(shù)與正常者筆數(shù)之間的預(yù)設(shè)比例接近于1。
本較佳實(shí)施例一個(gè)的特征就是混合過(guò)度取樣模塊與減量取樣模塊,來(lái)進(jìn)行重新取樣。因此,可解決數(shù)據(jù)高度不對(duì)稱(chēng)的問(wèn)題,有利于數(shù)據(jù)挖掘的進(jìn)行。
接著,利用信用評(píng)分系統(tǒng)的數(shù)據(jù)挖掘模塊108對(duì)重新取樣后所獲得的訓(xùn)練數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘分類(lèi)步驟,以分別建立出多個(gè)呆帳者模型。數(shù)據(jù)挖掘模塊108較佳可包括數(shù)據(jù)挖掘決策樹(shù)引擎110、數(shù)據(jù)挖掘類(lèi)神經(jīng)網(wǎng)絡(luò)引擎112以及邏輯斯蒂回歸引擎122。在本發(fā)明中,數(shù)據(jù)挖掘決策樹(shù)引擎110、數(shù)據(jù)挖掘類(lèi)神經(jīng)網(wǎng)絡(luò)引擎112及/或邏輯斯蒂回歸引擎122可單獨(dú)使用,但較佳是同時(shí)使用。在本發(fā)明的較佳實(shí)施例中,重新取樣后的訓(xùn)練數(shù)據(jù)分別進(jìn)入數(shù)據(jù)挖掘決策樹(shù)引擎110、數(shù)據(jù)挖掘類(lèi)神經(jīng)網(wǎng)絡(luò)引擎112及/或邏輯斯蒂回歸引擎122中,經(jīng)過(guò)數(shù)據(jù)挖掘決策樹(shù)引擎110、數(shù)據(jù)挖掘類(lèi)神經(jīng)網(wǎng)絡(luò)引擎112探勘分類(lèi)及/或邏輯斯蒂回歸引擎122后,而產(chǎn)生多組的呆帳者模型。
這些呆帳者模型建立后,利用分類(lèi)模型評(píng)估測(cè)量值114,例如正確率、AUC值等,對(duì)這些呆帳者模型進(jìn)行評(píng)估,以評(píng)估這些呆帳者模型的準(zhǔn)確率,并以從這些呆帳者模型中選出具最佳測(cè)量值的一組呆帳者模型來(lái)作為信用評(píng)分預(yù)測(cè)模型116。完成信用評(píng)分預(yù)測(cè)模型116后,此時(shí),即可將新申請(qǐng)者的新進(jìn)件申請(qǐng)數(shù)據(jù)118輸入此信用評(píng)分預(yù)測(cè)模型116。信用評(píng)分預(yù)測(cè)模型116就可預(yù)估出此新申請(qǐng)者呆帳的機(jī)率,并可將所預(yù)估的呆帳機(jī)率轉(zhuǎn)換成分?jǐn)?shù)120,而獲得此新申請(qǐng)者的信用評(píng)分。
本較佳實(shí)施例的又一特征就是結(jié)合混合式的重新取樣模塊以及數(shù)據(jù)挖掘技術(shù),來(lái)建立出信用評(píng)分模型的完整流程。
由上述本發(fā)明較佳實(shí)施例可知,本發(fā)明的一個(gè)優(yōu)點(diǎn)就是因?yàn)楸景l(fā)明的信用評(píng)分方法可利用歷史數(shù)據(jù)來(lái)建立呆帳者預(yù)測(cè)模型,并借以篩選客戶(hù)。因此,可減少金融機(jī)構(gòu)的壞帳損失,進(jìn)而達(dá)到降低風(fēng)險(xiǎn)的目的。
由上述本發(fā)明較佳實(shí)施例可知,本發(fā)明的另一優(yōu)點(diǎn)就是因?yàn)楸景l(fā)明的信用評(píng)分方法具有混合式取樣模塊,可平衡數(shù)據(jù)比例。因此,可解決數(shù)據(jù)挖掘無(wú)法處理高度不對(duì)稱(chēng)數(shù)據(jù)的問(wèn)題。
由上述本發(fā)明較佳實(shí)施例可知,本發(fā)明的又一優(yōu)點(diǎn)就是因?yàn)楸景l(fā)明是利用數(shù)據(jù)挖掘方法并結(jié)合混合式重新取樣模塊來(lái)建立信用評(píng)分模型。因此,可建立客觀(guān)公正的信用審核標(biāo)準(zhǔn),從而排除人為經(jīng)驗(yàn)判斷的缺陷。
由上述本發(fā)明的較佳實(shí)施例可知,本發(fā)明的再一優(yōu)點(diǎn)就是金融機(jī)構(gòu)可依據(jù)其所面對(duì)的實(shí)際狀況,自行調(diào)整更新信用評(píng)分系統(tǒng)的預(yù)測(cè)模型。因此,可有效適應(yīng)外在環(huán)境的變化,具有極佳的靈活性。
雖然本發(fā)明已以較佳實(shí)施例公開(kāi)如上,然其并非用以限定本發(fā)明,任何本領(lǐng)域的技術(shù)人員,在不脫離本發(fā)明的精神和范圍內(nèi),應(yīng)當(dāng)可以作各種的更動(dòng)與潤(rùn)飾,因此本發(fā)明的保護(hù)范圍應(yīng)當(dāng)以后附的權(quán)利要求書(shū)所界定的范圍為準(zhǔn)。
權(quán)利要求
1.一種應(yīng)用數(shù)據(jù)挖掘方法的信用評(píng)分方法,適用于金融機(jī)構(gòu)來(lái)評(píng)估多個(gè)申請(qǐng)者的信用評(píng)分,該信用評(píng)分方法包括提供進(jìn)件申請(qǐng)歷史數(shù)據(jù);進(jìn)行數(shù)據(jù)挖掘分類(lèi)步驟,以建立多個(gè)呆帳者模型;利用分類(lèi)模型評(píng)估測(cè)量值評(píng)估所述呆帳者模型,以評(píng)估所述呆帳者模型的準(zhǔn)確率,從而從所述呆帳者模型中選出具有最佳測(cè)量值的呆帳者模型作為預(yù)測(cè)模型;以及將新申請(qǐng)進(jìn)件數(shù)據(jù)輸入該預(yù)測(cè)模型,從而獲得該新申請(qǐng)進(jìn)件數(shù)據(jù)的信用評(píng)分。
2.如權(quán)利要求1所述的應(yīng)用數(shù)據(jù)挖掘方法的信用評(píng)分方法,在提供該進(jìn)件申請(qǐng)歷史數(shù)據(jù)的步驟與該數(shù)據(jù)挖掘分類(lèi)步驟之間,還包括進(jìn)行重新取樣步驟,以使該進(jìn)件申請(qǐng)歷史數(shù)據(jù)中所取樣的呆帳者筆數(shù)以及正常者筆數(shù)之間成接近比例。
3.如權(quán)利要求2所述的應(yīng)用數(shù)據(jù)挖掘方法的信用評(píng)分方法,其中該重新取樣步驟包括使用進(jìn)件歷史數(shù)據(jù)過(guò)度取樣模塊及/或進(jìn)件歷史數(shù)據(jù)減量取樣模塊。
4.如權(quán)利要求2所述的應(yīng)用數(shù)據(jù)挖掘方法的信用評(píng)分方法,其中該接近比例接近于1。
5.如權(quán)利要求1所述的應(yīng)用數(shù)據(jù)挖掘方法的信用評(píng)分方法,其中該數(shù)據(jù)挖掘分類(lèi)步驟包括使用數(shù)據(jù)挖掘決策樹(shù)引擎、數(shù)據(jù)挖掘類(lèi)神經(jīng)網(wǎng)絡(luò)引擎及/或邏輯斯蒂回歸引擎。
6.一種應(yīng)用數(shù)據(jù)挖掘方法的信用評(píng)分系統(tǒng),適用于金融機(jī)構(gòu)來(lái)評(píng)估多個(gè)申請(qǐng)者的信用評(píng)分,該信用評(píng)分系統(tǒng)包括一數(shù)據(jù)挖掘模塊,以建立多個(gè)呆帳者模型,其中利用分類(lèi)模型評(píng)估測(cè)量值來(lái)評(píng)估所述呆帳者模型,以從所述呆帳者模型中選出具有最佳測(cè)量值的呆帳者模型作為預(yù)測(cè)模型。
7.如權(quán)利要求6所述的應(yīng)用數(shù)據(jù)挖掘方法的信用評(píng)分系統(tǒng),還包括重新取樣模塊,以將進(jìn)件申請(qǐng)歷史數(shù)據(jù)中不平衡的呆帳者數(shù)據(jù)與正常者數(shù)據(jù)重新取樣,而使該進(jìn)件申請(qǐng)歷史數(shù)據(jù)中所取樣的呆帳者筆數(shù)以及正常者筆數(shù)之間成接近比例。
8.如權(quán)利要求7所述的應(yīng)用數(shù)據(jù)挖掘方法的信用評(píng)分系統(tǒng),其中該重新取樣模塊包括進(jìn)件歷史數(shù)據(jù)過(guò)度取樣模塊及/或進(jìn)件歷史數(shù)據(jù)減量取樣模塊。
9.如權(quán)利要求7所述的應(yīng)用數(shù)據(jù)挖掘方法的信用評(píng)分系統(tǒng),其中該接近比例接近于1。
10.如權(quán)利要求6所述的應(yīng)用數(shù)據(jù)挖掘方法的信用評(píng)分系統(tǒng),其中該數(shù)據(jù)挖掘模塊包括數(shù)據(jù)挖掘決策樹(shù)引擎、數(shù)據(jù)挖掘類(lèi)神經(jīng)網(wǎng)絡(luò)引擎及/或邏輯斯蒂回歸引擎。
全文摘要
一種應(yīng)用數(shù)據(jù)挖掘(Data Mining)方法的信用評(píng)分系統(tǒng)及方法,適用于金融機(jī)構(gòu)來(lái)評(píng)估多個(gè)申請(qǐng)者的信用評(píng)分。此信用評(píng)分方法包括提供進(jìn)件申請(qǐng)歷史數(shù)據(jù);進(jìn)行一重新取樣(Resample)步驟,以使進(jìn)件申請(qǐng)歷史數(shù)據(jù)中所取樣的呆帳者筆數(shù)以及正常者筆數(shù)之間成一相近比例;進(jìn)行一數(shù)據(jù)挖掘分類(lèi)步驟,以建立多個(gè)呆帳者模型;利用一分類(lèi)模型評(píng)估測(cè)量值評(píng)估這些呆帳者模型,以評(píng)估這些呆帳者模型的準(zhǔn)確率,借以從這些呆帳者模型選出具最佳測(cè)量值者作為一預(yù)測(cè)模型;以及將一新申請(qǐng)進(jìn)件數(shù)據(jù)輸入預(yù)測(cè)模型,而獲得此新申請(qǐng)進(jìn)件數(shù)據(jù)的信用評(píng)分。
文檔編號(hào)G06F17/30GK101046876SQ20061007108
公開(kāi)日2007年10月3日 申請(qǐng)日期2006年3月31日 優(yōu)先權(quán)日2006年3月31日
發(fā)明者張?jiān)獎(jiǎng)? 李建億, 曾新穆, 吳博民 申請(qǐng)人:探宇科技股份有限公司