本發(fā)明涉及分箱算法,更具體地說,本發(fā)明是一種風控變量的自適應分箱及建模方法。
背景技術:
1、在風險控制中,對風險變量進行分箱操作能夠有效的將連續(xù)變量轉換為離散變量以提升模型的性能,但風險變量與目標變量之間往往并非線性關系,單一的等寬分箱或等頻分箱,難以捕捉風險變量和目標變量之間的非線性關系;
2、另一方面,在風險控制系統(tǒng)中,分箱建模是基于風險控制系統(tǒng)的各方面數(shù)據(jù)構成的,分箱基礎源于風險控制系統(tǒng)自身的可靠性,但風險控制系統(tǒng)的穩(wěn)定性并不是始終不變的,風險控制系統(tǒng)可能會進入混沌狀態(tài),在混沌狀態(tài)中微小的初始條件變化會引起巨大的演化路徑差異,風控變量的分箱邏輯底層也會隨混沌狀態(tài)中非線性變化的無序性而垮塌。
3、為解決上述缺陷,現(xiàn)提出一種風控變量的自適應分箱及建模方法。
技術實現(xiàn)思路
1、本發(fā)明的目的是提供一種風控變量的自適應分箱及建模方法,以解決上述背景技術中的問題。
2、為實現(xiàn)上述目的,本發(fā)明提供如下技術方案:一種風控變量的自適應分箱及建模方法,具體步驟包括分析連續(xù)變量的分布特征及連續(xù)變量與目標變量的關系,對風險控制系統(tǒng)的混沌性進行驗證;
3、根據(jù)驗證結果檢驗風險控制系統(tǒng)的混沌性,并運用分箱算法計算并確定風險控制變量的分箱邊界;
4、根據(jù)分箱效果評估分箱算法的有效性,根據(jù)評估結果對分箱模型進行狀態(tài)分類;
5、根據(jù)分箱模型的狀態(tài)類型進行對工作人員進行決策輔助。
6、優(yōu)選的,對風險控制系統(tǒng)的混沌性進行驗證的方法為:
7、結合風險控制系統(tǒng)的數(shù)學方法模型,根據(jù)風險控制系統(tǒng)的相空間的狀態(tài)軌跡計算lyapunov指數(shù),評估風險控制系統(tǒng)對初始條件的敏感性,具體評估方法為:
8、在風險控制系統(tǒng)的相空間中選擇一個初始點作為參考點;
9、在初始點附近選擇一些微小的擾動點作為相鄰初始點,相鄰初始點滿足對敏感性要求的微小變化;
10、使用風險控制系統(tǒng)的數(shù)學方法模型對初始點和相鄰初始點進行時間演化,根據(jù)初始點生成參考軌跡,根據(jù)相鄰初始點生成擾動軌跡;
11、通過計算參考軌跡和每個擾動軌跡之間的歐氏距離來評估參考軌跡和擾動軌跡之間差異;
12、根據(jù)參考軌跡和擾動軌跡之間差異的增長率來計算lyapunov指數(shù)。
13、優(yōu)選的,風險控制系統(tǒng)的相空間構建方法為:
14、構建風險控制系統(tǒng)的相空間模型,風險控制系統(tǒng)中的風險因素包括市場風險、信用風險、操作風險和流動性風險,每種風險因素均為相空間模型中的一個維度,不同的風險因素對應不同的維度共同構成風險控制系統(tǒng)的相空間。
15、優(yōu)選的,相空間的狀態(tài)軌跡的形成方法為:
16、在風險控制系統(tǒng)的相空間中,每個可能的風險狀態(tài)都用相空間中的一個點來表示,定義這個點為狀態(tài)點,這個點的位置由各個風險因素的取值共同決定,隨著時間的推移,風險控制系統(tǒng)的風險狀態(tài)發(fā)生變化,在相空間中表現(xiàn)為點的移動形成軌跡,定義軌跡為狀態(tài)軌跡。
17、優(yōu)選的,風險控制系統(tǒng)的數(shù)學方法模型為:
18、以時間為自變量,運用隨機過程模型對狀態(tài)軌跡的發(fā)展進行模擬演化,運用數(shù)學方法模型對風險控制系統(tǒng)進行描述,包括通過方差-協(xié)方差方法利用已有的歷史數(shù)據(jù)評估風險資產(chǎn)的預期回報和風險程度,通過限定時間區(qū)間和置信水平運用風險價值方法評估損失程度,使用蒙特卡洛模擬對無風險價值進行評估的模型。
19、優(yōu)選的,對計算所得的lyapunov指數(shù)進行分析,根據(jù)分析結果對風險控制系統(tǒng)的狀態(tài)進行分類,分析方法為:
20、當計算所得的lyapunov指數(shù)小于等于0時,風險控制系統(tǒng)對初始條件不敏感,標記處于非混沌狀態(tài);
21、當計算所得的lyapunov指數(shù)大于0時,風險控制系統(tǒng)對初始條件敏感,標記處于混沌狀態(tài)。
22、優(yōu)選的,運用分箱算法計算并確定風險控制變量的分箱邊界的方法為:
23、當風險控制系統(tǒng)被標記為非混沌狀態(tài)時,將數(shù)據(jù)按連續(xù)變量的值進行排序,并將連續(xù)變量與目標變量相對應排列;
24、根據(jù)數(shù)據(jù)的分布使用等寬分箱或等頻分箱得到一個初始的分箱方案;
25、對于每個分箱計算目標變量的統(tǒng)計量,包括違約率和均值;
26、對相鄰分箱進行合并并保持合并后的分箱在目標變量上仍然具有單調性;
27、根據(jù)合并結果調整分箱,使最終分箱滿足單調要求。
28、優(yōu)選的,當風險控制系統(tǒng)被標記為混沌狀態(tài)時,對分箱算法進行優(yōu)化改進的具體方法為:
29、使用滾動窗口技術周期性地重新計算分箱邊界以適應數(shù)據(jù)變化;
30、通過交叉驗證方法評估不同分箱算法的效果并選取最佳的分箱算法;
31、使用機器學習算法對風險控制變量進行清洗,識別并處理噪音,剔除異常值;
32、通過歸一化、特征選擇和構造對風險控制變量實施特征工程以提高風險控制數(shù)據(jù)的特征表達能力;
33、運用基于信息增益、卡方檢驗和決策樹的方法確定最佳分箱邊界。
34、優(yōu)選的,根據(jù)分箱效果評估分箱算法的有效性的方法為:
35、標定分箱有效性指數(shù)為eb,計算表達式為,式中,psi為人口穩(wěn)定性指數(shù),表達式為,式中,為分箱區(qū)間內(nèi)的實際占比,為分箱區(qū)間內(nèi)的預期占比,為證據(jù)權重,表達式為,式中,i為分箱編號且i為正整數(shù),為第i個分箱中未違約數(shù)量占比,為第i個分箱中違約數(shù)量占比,ks值的表達式為,式中,為第i個分箱中的累計壞賬戶比率,為第i個分箱中的累計好賬戶比率,分別為psi和ks的權重系數(shù),且均為正整數(shù);
36、預設分箱有效性閾值et,當計算所得的分箱有效性指數(shù)eb大于等于分箱有效性閾值et時,則分箱算法的魯棒性、預測能力和區(qū)分能力能夠達到有效性要求,標記分箱建模有效;
37、當計算所得的分箱有效性指數(shù)eb小于分箱有效性閾值et時,則分箱算法的魯棒性、預測能力和區(qū)分能力無法達到有效性要求,標記分箱建模無效。
38、優(yōu)選的,根據(jù)分箱模型的狀態(tài)類型進行對工作人員進行決策輔助的邏輯為:
39、當分箱建模被標記為有效時,則提示工作人員分箱模型具備跨越風險控制系統(tǒng)穩(wěn)定性波動的甄別能力,不需要進行檢驗維護;
40、當分箱建模被標記為有效時,則提示工作人員分箱模型不具備跨越風險控制系統(tǒng)穩(wěn)定性波動的甄別能力,要求工作人員對分箱算法進行優(yōu)化改進。
41、在上述技術方案中,本發(fā)明提供的技術效果和優(yōu)點:
42、本技術通過結合風險控制穩(wěn)定性狀態(tài)指標,將風險控制系統(tǒng)的混沌性納入評估范圍,通過驗證風險控制系統(tǒng)的穩(wěn)定性狀態(tài)對混沌系統(tǒng)進行甄別,將風險控制系統(tǒng)的混沌狀態(tài)囊括入分箱建模的優(yōu)化方法中,以確保在風險控制系統(tǒng)進入混沌狀態(tài)或在混沌狀態(tài)與穩(wěn)定狀態(tài)之間變化的過程中,通過對分箱建模的可行性進行驗證,確保分箱建模的適用性,避免風險控制系統(tǒng)的穩(wěn)定性失衡時,導致分箱算法出現(xiàn)方向性錯誤而引起重大故障,有效提高了分箱建模的穩(wěn)定性和適用范圍。