本發(fā)明涉及數(shù)據(jù)分析及數(shù)據(jù)挖掘應(yīng)用領(lǐng)域,更具體地說涉及一種法人風(fēng)險(xiǎn)評估的實(shí)現(xiàn)方法。
背景技術(shù):
1、隨著信貸業(yè)務(wù)的快速發(fā)展,法人信用風(fēng)險(xiǎn)管理日益成為金融機(jī)構(gòu)關(guān)注的重點(diǎn)。傳統(tǒng)以經(jīng)驗(yàn)為主的信用風(fēng)險(xiǎn)管控方法難以適應(yīng)日益復(fù)雜多樣化的市場環(huán)境,亟需引入新的技術(shù)手段。人工智能機(jī)器學(xué)習(xí)技術(shù)的興起,為信用風(fēng)險(xiǎn)評估提供了新的思路和方法。
2、現(xiàn)有技術(shù)存在類型類似專家系統(tǒng)的方法及應(yīng)用,用于通過該系統(tǒng)實(shí)現(xiàn)基于對現(xiàn)有的法人客戶的過往數(shù)據(jù)進(jìn)行分析,從中預(yù)測出即將或可能違約的法人客戶。這樣金融機(jī)構(gòu)可針對該預(yù)測清單進(jìn)行有針對性的處理,或根據(jù)該預(yù)測清單對后續(xù)的目標(biāo)法人客戶數(shù)量等具有較準(zhǔn)確的預(yù)測。這洋金融機(jī)構(gòu)可有針對性的進(jìn)行人力等資源的提前安排。但是傳統(tǒng)的專家系統(tǒng)主要是通過收集的專家經(jīng)驗(yàn)進(jìn)行分析預(yù)測,其整體預(yù)測的準(zhǔn)確率較低,且需要耗費(fèi)大量的人力資源來完成,因此成本高,且其給金融機(jī)構(gòu)帶來的幫助不大,無法為金融機(jī)構(gòu)提前進(jìn)行有效的法人客戶關(guān)系管理提供有效的支持。容易出現(xiàn)遺漏目標(biāo)法人客戶或篩選出的目標(biāo)法人客戶存在大量的誤差,保護(hù)大量的非真時目標(biāo)法人客戶,導(dǎo)致人力財(cái)力的浪費(fèi)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明所要解決的技術(shù)問題是如何提供提高法人客戶風(fēng)險(xiǎn)預(yù)測的準(zhǔn)確率,滿足金融機(jī)構(gòu)的精細(xì)化管理。
2、為了解決以上問題本發(fā)明提供了一種法人風(fēng)險(xiǎn)評估的實(shí)現(xiàn)方法,其特征在于:
3、步驟1.1選取法人客戶的歷史數(shù)據(jù),對選取的歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理生成第一訓(xùn)練集;
4、步驟1.2將數(shù)據(jù)預(yù)處理完成的第一訓(xùn)練集輸入到xgboost模型中對xgboost模型進(jìn)行訓(xùn)練,經(jīng)過多輪迭代,獲得最優(yōu)xgboost模型和對應(yīng)xgboost模型的最優(yōu)參數(shù);
5、步驟1.3根據(jù)步驟1.2訓(xùn)練,提取重要變量做預(yù)測變量;
6、步驟1.4根據(jù)步驟1.2訓(xùn)練,將訓(xùn)練集中的預(yù)測變量輸入到訓(xùn)練獲得的最優(yōu)xgboost模型,由最優(yōu)xgboost模型輸出法人客戶標(biāo)簽;
7、步驟1.5根據(jù)步驟1.4的結(jié)果提取預(yù)測分?jǐn)?shù)作為目標(biāo)變量;
8、步驟1.6將步驟1.3獲得的預(yù)測變量和步驟1.5獲得的目標(biāo)變量進(jìn)行拼接,拼接成新的第二訓(xùn)練集;
9、步驟1.7用第二訓(xùn)練集訓(xùn)練gbdt模型,訓(xùn)練獲得預(yù)測gbdt模型;
10、步驟1.8待預(yù)測法人客戶觀察期的特征輸入到預(yù)測gbdt模型,獲得待預(yù)測法人客戶的目標(biāo)法人客戶風(fēng)險(xiǎn)等級;
11、步驟1.9根據(jù)獲得的目標(biāo)法人客戶風(fēng)險(xiǎn)等級輸出客戶預(yù)警信息。
12、所述的方法,其特征在于,所述xgboost模型進(jìn)行訓(xùn)練,根據(jù)如下方法進(jìn)行:選擇決策樹作為弱學(xué)習(xí)器;每次訓(xùn)練只訓(xùn)練一個弱學(xué)習(xí)器,提高在前一個弱學(xué)習(xí)器分錯的類的訓(xùn)練數(shù)據(jù)的數(shù)據(jù)權(quán)重后輸入到后一個弱學(xué)習(xí)器中進(jìn)行學(xué)習(xí),采用后一個弱學(xué)習(xí)器來糾正前一個弱學(xué)習(xí)器的殘差,直到殘差達(dá)到預(yù)先設(shè)置的范圍;最后將訓(xùn)練生成的多個弱學(xué)習(xí)器加權(quán)求和,獲得最優(yōu)學(xué)習(xí)器,用于待預(yù)測法人客戶風(fēng)險(xiǎn)等級。
13、所述的方法,其特征在于,所述的決策樹具體為:
14、其中:x是輸入向量,q表示樹的結(jié)構(gòu),結(jié)構(gòu)函數(shù)q(x)表示把輸入映射到葉子的索引號,ω表示對應(yīng)于每個索引號的葉子的分?jǐn)?shù),t是樹中葉節(jié)點(diǎn)的數(shù)量,d為特征維數(shù);
15、一共由k顆決策樹生成k個弱學(xué)習(xí)器,k顆決策樹的集合的輸出為:
16、單顆決策樹的復(fù)雜度表示為:
17、集成樹的復(fù)雜度表示為:
18、t是葉節(jié)點(diǎn)的數(shù)目,γ是范圍在0和1之間的學(xué)習(xí)速率。γ乘以t等于生成樹修剪,防止過度擬合;λ是一個正規(guī)化參數(shù),ω是葉子的質(zhì)量;
19、是xgboost算法的正則項(xiàng),目標(biāo)函數(shù)的第t步的迭代為:
20、第一部分代表真實(shí)值和預(yù)測值函數(shù),l為誤差函數(shù);第二部分代表單顆決策樹的復(fù)雜度之和;已知:,其中為第t輪需要學(xué)習(xí)的決策樹,則目標(biāo)函數(shù)可轉(zhuǎn)化為。
21、一種法人風(fēng)險(xiǎn)評估的實(shí)現(xiàn)方法的系統(tǒng),其特征在于采用了法人風(fēng)險(xiǎn)評估的實(shí)現(xiàn)方法。
22、實(shí)施本發(fā)明具有如下有益效果:引入機(jī)器學(xué)習(xí)模型來進(jìn)行風(fēng)險(xiǎn)評估,在風(fēng)險(xiǎn)管理技術(shù)進(jìn)程邁出了向前一步;通過對法人客戶的違約概率進(jìn)行量化建模,為風(fēng)險(xiǎn)管理提供了定量化的評價依據(jù)。通過選擇了梯度提升樹算法進(jìn)行建模,與傳統(tǒng)的邏輯回歸算法相比,梯度提升樹算法能夠更有效地處理和利用具有復(fù)雜非線性關(guān)系的風(fēng)險(xiǎn)特征因子數(shù)據(jù),從而提高了模型的預(yù)測能力。
1.一種法人風(fēng)險(xiǎn)評估的實(shí)現(xiàn)方法,其特征在于:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述xgboost模型進(jìn)行訓(xùn)練,根據(jù)如下方法進(jìn)行:選擇決策樹作為弱學(xué)習(xí)器;每次訓(xùn)練只訓(xùn)練一個弱學(xué)習(xí)器,提高在前一個弱學(xué)習(xí)器分錯的類的訓(xùn)練數(shù)據(jù)的數(shù)據(jù)權(quán)重后輸入到后一個弱學(xué)習(xí)器中進(jìn)行學(xué)習(xí),采用后一個弱學(xué)習(xí)器來糾正前一個弱學(xué)習(xí)器的殘差,直到殘差達(dá)到預(yù)先設(shè)置的范圍;最后將訓(xùn)練生成的多個弱學(xué)習(xí)器加權(quán)求和,獲得最優(yōu)學(xué)習(xí)器,用于待預(yù)測法人客戶風(fēng)險(xiǎn)等級。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述的決策樹具體為: