基于自注意力集成自動多視野的信貸違約預(yù)測方法及裝置

文檔序號：40629035發(fā)布日期：2025-01-10 18:34閱讀：4來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明屬于信貸違約預(yù)測方法，具體涉及一種基于自注意力集成自動多視野的信貸違約預(yù)測方法及裝置。

背景技術(shù)：

1、信用風(fēng)險是金融風(fēng)險的一個重要方面，信用違約是其主要表現(xiàn)形式。信用違約對金融市場穩(wěn)定具有重大影響。由于經(jīng)濟(jì)增長放緩、地緣政治風(fēng)險升級和貿(mào)易摩擦，全球違約率不斷上升。這些違約具有深遠(yuǎn)的影響，包括經(jīng)濟(jì)增長乏力、投資者信心下降以及金融機(jī)構(gòu)遭受重大損失。因此，當(dāng)務(wù)之急是制定有效的信用風(fēng)險管理策略，以減輕信用違約對金融市場和經(jīng)濟(jì)的不利影響。

2、然而，由于數(shù)據(jù)復(fù)雜和稀疏性高等特性，信用違約預(yù)測是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。近年來，最近的研究工作主要集中在統(tǒng)計學(xué)習(xí)和機(jī)器學(xué)習(xí)技術(shù)上，以降低信用違約的風(fēng)險。

3、統(tǒng)計學(xué)習(xí)主要基于信用評級和和邏輯回歸(logistic?regression，lr)進(jìn)行信用分析預(yù)測，然而lr對異常值和缺失數(shù)據(jù)也很敏感，很難在大數(shù)據(jù)集上訓(xùn)練lr模型。盡管存在這些局限性，但由于其良好的可解釋性，lr是一種廣泛使用的信用違約預(yù)測方法。然而，全球金融危機(jī)揭示了lr方法的一些缺點(diǎn)，例如它們對不斷變化的經(jīng)濟(jì)條件的適應(yīng)性較慢，以及它們對經(jīng)濟(jì)、金融和信用變量之間復(fù)雜的非線性相互作用建模的能力有限。

4、機(jī)器學(xué)習(xí)對適應(yīng)數(shù)據(jù)的變化以及容納大量特征集具有較優(yōu)自適應(yīng)能力。決策樹(decision?tree，dt)可以捕獲變量之間的相互作用和非線性關(guān)系，在違約和非違約案例之間提供良好的區(qū)分。然而，dt的重復(fù)屬性分割容易過擬合。集成學(xué)習(xí)通過生長多棵樹并計算它們的平均值來解決這個問題。例如，梯度提升決策樹(gradient?boosting?decisiontree，gbdt)學(xué)習(xí)一系列弱學(xué)習(xí)器來預(yù)測輸出，其中弱學(xué)習(xí)器是dt。chen等人證明gbdt在表格數(shù)據(jù)應(yīng)用程序中優(yōu)于其他方法。已經(jīng)開發(fā)了幾種gbdt算法，例如xgboost、lightgbm和catboost，以成功預(yù)測信用風(fēng)險。盡管這些集成算法表現(xiàn)出差異，但它們在各種任務(wù)中的性能通常相似。

5、由于深度學(xué)習(xí)能夠捕捉變量之間的復(fù)雜模式和非線性關(guān)系，因此它已成為一種很有前途的信用違約預(yù)測方法。tan等人和yang等人提出了改進(jìn)的深度神經(jīng)網(wǎng)絡(luò)(deepneural?network,dnn)，用于比機(jī)器學(xué)習(xí)和cnn更好的信用違約預(yù)測。luo等人使用深度信念網(wǎng)絡(luò)開發(fā)了信用風(fēng)險評估模型，該模型擅長學(xué)習(xí)有效的特征表示和捕獲數(shù)據(jù)中的潛在模式。fu等人結(jié)合dnn和雙向長短期記憶來準(zhǔn)確識別潛在的信用風(fēng)險。這些研究表明，深度學(xué)習(xí)技術(shù)可以顯著提高信用違約模型的預(yù)測性能，使其成為信用風(fēng)險管理中的寶貴工具。

6、此外，一些新方法基于多視圖特征組織來提高模型性能。song等人設(shè)計了基于多視圖的特征采樣來優(yōu)化不平衡學(xué)習(xí)。tan等人提出基于離散、連續(xù)及其相關(guān)符號差異的多視圖特征學(xué)習(xí)是提高預(yù)測精度的有效策略。

7、現(xiàn)有的工作表明gbdt，深度學(xué)習(xí)，以及多視圖集成可以顯著提高模型性能。然而，關(guān)于如何結(jié)合這些優(yōu)化策略以獲得更好的解決方案的探索有限。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明是為解決上述問題而進(jìn)行的，目的在于提供一種準(zhǔn)確率更高、的信貸違約預(yù)測方法及裝置，本發(fā)明采用了如下技術(shù)方案：

2、本發(fā)明提供了一種基于自注意力集成自動多視野的信貸違約預(yù)測方法，其特征在于，包括以下步驟：特征組劃分步驟：基于離散連接性和正負(fù)相關(guān)性將用于模型訓(xùn)練的金融數(shù)據(jù)的特征自動劃分為四個特征組，得到訓(xùn)練集；模型訓(xùn)練步驟：基于所述訓(xùn)練集對基于自注意力機(jī)制的堆疊網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練，得到訓(xùn)練好的所述堆疊網(wǎng)絡(luò)模型，其中，該模型包括四個基神經(jīng)網(wǎng)絡(luò)模型以及自注意力層，四個所述基神經(jīng)網(wǎng)絡(luò)模型分別用于學(xué)習(xí)四個所述特征組的知識，所述自注意力層用于堆疊四個所述特征組的知識，并從中學(xué)習(xí)集成機(jī)制；信貸違約預(yù)測步驟：將待預(yù)測的金融數(shù)據(jù)輸入訓(xùn)練好的所述堆疊網(wǎng)絡(luò)模型，得到信貸違約的預(yù)測結(jié)果。

3、本發(fā)明提供的基于自注意力集成自動多視野的信貸違約預(yù)測方法，還可以具有這樣的技術(shù)特征，其中，所述特征組劃分步驟包括以下子步驟：計算所述金融數(shù)據(jù)的特征和標(biāo)簽之間的皮爾遜相關(guān)系數(shù)；篩選出所述皮爾遜相關(guān)系數(shù)大于預(yù)定值的所述特征作為正相關(guān)特征組，并篩選出所述皮爾遜相關(guān)系數(shù)小于等于所述預(yù)定值的所述特征作為負(fù)相關(guān)特征組；計算各個所述特征的類值數(shù)；計算所有所述類值數(shù)的二分位數(shù)；篩選出所述類值數(shù)大于所述二分位數(shù)的所述特征作為離散特征組，并篩選出所述類值數(shù)小于等于所述二分位數(shù)的所述特征作為連續(xù)特征組；篩選出既存在于所述正相關(guān)特征組又存在于所述離散特征組的所述特征作為正相關(guān)離散組，篩選出既存在于所述負(fù)相關(guān)特征組又存在于所述離散特征組的所述特征作為負(fù)相關(guān)離散組，篩選出既存在于所述正相關(guān)特征組又存在于所述連續(xù)特征組的所述特征作為正相關(guān)連續(xù)組，篩選出既存在于所述負(fù)相關(guān)特征組又存在于所述連續(xù)特征組的所述特征作為負(fù)相關(guān)連續(xù)組。

4、本發(fā)明提供的基于自注意力集成自動多視野的信貸違約預(yù)測方法，還可以具有這樣的技術(shù)特征，其中，每個所述基神經(jīng)網(wǎng)絡(luò)模型均包括依次連接的第一全連接層、批正則化層、第二全連接層、第三全連接層，所述批正則化層用于對所述第一全連接層的輸出進(jìn)行正則化，所述堆疊網(wǎng)絡(luò)模型還包括拼接層和輸出用全連接層，多個所述基神經(jīng)網(wǎng)絡(luò)模型的輸出均連接至所述拼接層，所述拼接層、所述自注意力層和所述輸出用全連接層依次連接，所述拼接層用于拼接各個所述基神經(jīng)網(wǎng)絡(luò)模型的輸出，所述第一全連接層、所述第二全連接層均為基于relu激活函數(shù)的全連接層，所述第三全連接層、所述輸出用全連接層均為基于sigmoid激活函數(shù)的全連接層。

5、本發(fā)明提供的基于自注意力集成自動多視野的信貸違約預(yù)測方法，還可以具有這樣的技術(shù)特征，其中，所述批正則化層對所述第一全連接層的輸出進(jìn)行正則化，得到正則化后的特征，表達(dá)式為：x1＝norm(relu(w1*x+b1))，式中，w1和b1分別是第一全連接層的權(quán)重和偏置，所述第二全連接層對正則化后的特征進(jìn)行進(jìn)一步抽象，表達(dá)式為：x2＝relu(w2*x1+b2)，式中，w2和b2分別是第二全連接層的權(quán)重和偏置，所述第三全連接層對每個所述特征組的第二全連接層的輸出進(jìn)行激活，表達(dá)式為：式中，w3和b3分別是第二全連接層的權(quán)重和偏置，所述拼接層對各個所述第三全連接層的輸出進(jìn)行拼接，得到拼接后的特征，表達(dá)式為：所述自注意力層將拼接后的特征線性映射到查詢矩陣q、鍵矩陣k和值矩陣v，表達(dá)式為：q＝wq*x*+bq，k＝wk*x*+bk，v＝wv*x*+bk，式中，wq、wk和wv為對應(yīng)的權(quán)重，bq、bk和bk為對應(yīng)的偏置項(xiàng)，所述自注意力層計算所述查詢矩陣q和所述鍵矩陣k的每兩個輸入向量之間的注意力值α，從而得到注意力矩陣a，表達(dá)式為：a＝(α)(i,j)＝softmax(q*k)，所述自注意力層計算每兩個所述輸入向量對應(yīng)的輸出向量，表達(dá)式為：xattention＝a*v，所述第四全連接層對所述自注意力層的輸出進(jìn)行激活，表達(dá)式為：ypredict＝sigmoid(w4*xattention+b4)，式中，w4和b4分別是第四全連接層的權(quán)重和偏置。

6、本發(fā)明提供的基于自注意力集成自動多視野的信貸違約預(yù)測方法，還可以具有這樣的技術(shù)特征，其中，所述模型訓(xùn)練步驟包括以下子步驟：初始化用于訓(xùn)練所述堆疊網(wǎng)絡(luò)模型的參數(shù)；基于訓(xùn)練集以及早停策略對所述堆疊網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練，直到達(dá)到預(yù)定的訓(xùn)練輪數(shù)并且該模型的準(zhǔn)確率不再提升，得到訓(xùn)練好的所述堆疊網(wǎng)絡(luò)模型。

7、本發(fā)明提供的基于自注意力集成自動多視野的信貸違約預(yù)測方法，還可以具有這樣的技術(shù)特征，其中，基于adam優(yōu)化器進(jìn)行模型訓(xùn)練，初始化的所述參數(shù)包括所述堆疊網(wǎng)絡(luò)模型的權(quán)重和偏置、所述adam優(yōu)化器的學(xué)習(xí)率、一階矩估計和二階矩估計，利用訓(xùn)練集對所述堆疊網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練的步驟包括：將一組所述訓(xùn)練集輸入所述堆疊網(wǎng)絡(luò)模型，并基于所述權(quán)重和所述偏置計算所述堆疊網(wǎng)絡(luò)模型的梯度；基于所述梯度更新動量的所述一階矩估計和所述二階矩估計；糾正所述一階矩估計和所述二階矩估計的偏差；基于糾正后的所述二階矩估計，更新所述堆疊網(wǎng)絡(luò)模型的權(quán)重和偏置；計算所述堆疊網(wǎng)絡(luò)模型的預(yù)測結(jié)果的準(zhǔn)確率分?jǐn)?shù)；判斷是否到達(dá)預(yù)定的第一訓(xùn)練輪次，在判斷為是時更新所述學(xué)習(xí)率；判斷是否到達(dá)預(yù)定的第二訓(xùn)練輪次且本次迭代的所述準(zhǔn)確率分?jǐn)?shù)相對于上次迭代的所述準(zhǔn)確率分?jǐn)?shù)沒有提升，在判斷為是時，輸出訓(xùn)練好的所述堆疊網(wǎng)絡(luò)模型。

8、本發(fā)明提供的基于自注意力集成自動多視野的信貸違約預(yù)測方法，還可以具有這樣的技術(shù)特征，其中，基于所述權(quán)重和所述偏置計算所述堆疊網(wǎng)絡(luò)模型的梯度，表達(dá)式為：式中，w和b分別為所述堆疊網(wǎng)絡(luò)模型的權(quán)重和偏置，基于所述梯度更新動量的所述一階矩估計，表達(dá)式為：mw＝β1·mw+(1-β1)·gw，mb＝β1·mb+(1-β1)·gb，式中，mw是w的一階矩估計，mb是b的一階矩估計，β1是一階矩估計的指數(shù)衰減率，基于所述梯度更新動量的所述二階矩估計，表達(dá)式為：式中，vw是w的二階矩估計，vb是b的二階矩估計，β2是二階矩估計的指數(shù)衰減率，糾正所述一階矩估計和所述二階矩估計的偏差，表達(dá)式為：式中，是β1的t次方，是β2的t次方，t為當(dāng)前迭代次數(shù)，是糾正后的w的一階矩估計，是糾正后的b的一階矩估計，是糾正后的w的二階矩估計，分別是糾正后的b的二階矩估計，基于糾正后的所述二階矩估計，更新所述堆疊網(wǎng)絡(luò)模型的權(quán)重和偏置，表達(dá)式為：式中，η是學(xué)習(xí)率，∈是用于防止分母為0的預(yù)定值。

9、本發(fā)明提供的基于自注意力集成自動多視野的信貸違約預(yù)測方法，還可以具有這樣的技術(shù)特征，其中，計算所述堆疊網(wǎng)絡(luò)模型的預(yù)測結(jié)果的準(zhǔn)確率分?jǐn)?shù)，表達(dá)式為：acc＝(tp+tn)/(tp+fp+tn+fn)，式中，tp和fp分別是真實(shí)違約用戶被預(yù)測為違約和不違約預(yù)測標(biāo)簽的指標(biāo)，tn和fn分別是不違約用戶被預(yù)測為不違約和違約預(yù)測標(biāo)簽的樣本，所述第一訓(xùn)練輪次為10，更新所述學(xué)習(xí)率的表達(dá)式為：ξi+1＝ξi*0.1，所述第二訓(xùn)練輪次為20。

10、本發(fā)明提供了一種基于自注意力集成自動多視野的信貸違約預(yù)測裝置，其特征在于，包括：特征組劃分部，基于離散連接性和正負(fù)相關(guān)性將用于模型訓(xùn)練的金融數(shù)據(jù)的特征自動劃分為四個特征組，得到訓(xùn)練集；模型訓(xùn)練部，基于所述訓(xùn)練集對基于自注意力機(jī)制的堆疊網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練，得到訓(xùn)練好的所述堆疊網(wǎng)絡(luò)模型，其中，該模型包括四個基神經(jīng)網(wǎng)絡(luò)模型以及自注意力層，四個所述基神經(jīng)網(wǎng)絡(luò)模型分別用于學(xué)習(xí)四個所述特征組的知識，所述自注意力層用于堆疊四個所述特征組的知識，并從中學(xué)習(xí)集成機(jī)制；以及信貸違約預(yù)測部，用于將待預(yù)測的金融數(shù)據(jù)輸入訓(xùn)練好的所述堆疊網(wǎng)絡(luò)模型，得到信貸違約的預(yù)測結(jié)果。

11、發(fā)明作用與效果

12、根據(jù)本發(fā)明的基于自注意力集成自動多視野的信貸違約預(yù)測方法及裝置，該方法包括特征組劃分步驟、模型訓(xùn)練步驟以及信貸違約預(yù)測步驟，其中，特征組劃分步驟中基于離散連接性和正負(fù)相關(guān)性將用于模型訓(xùn)練的金融數(shù)據(jù)的特征自動劃分為四個特征組，省去了費(fèi)時費(fèi)力的相應(yīng)人工標(biāo)注環(huán)節(jié)，并且這種劃分方式使得相同或類似的特征得以聚集，使得相異的特征得以區(qū)分，從而在信息組織層面上實(shí)現(xiàn)了更高的效率，并為模型能夠達(dá)到更優(yōu)的性能提供可能；模型訓(xùn)練步驟中，利用劃分特征組的訓(xùn)練集對基于自注意力機(jī)制的堆疊網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練，該模型運(yùn)用先進(jìn)的自注意力機(jī)制，使得神經(jīng)網(wǎng)絡(luò)能夠更加準(zhǔn)確地識別和理解數(shù)據(jù)之間的內(nèi)在關(guān)聯(lián)，進(jìn)一步，通過基于自注意力機(jī)制的堆疊泛化學(xué)習(xí)，能夠有效集成來自不特征組(不同視野)的信息，并從中學(xué)習(xí)集成機(jī)制，該集成機(jī)制能夠?qū)⒉煌幕窠?jīng)網(wǎng)絡(luò)模型所做出的預(yù)測結(jié)合起來，更精準(zhǔn)地識別和處理來自不同基神經(jīng)網(wǎng)絡(luò)模型預(yù)測中的關(guān)鍵信息，從而提高模型對信貸違約的預(yù)測能力，使得預(yù)測結(jié)果的準(zhǔn)確度和魯棒性得以大幅提升。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：吳杰,譚言丹
技術(shù)所有人：復(fù)旦大學(xué)
我是此專利的發(fā)明人

上一篇：一種割草機(jī)的刀片防護(hù)裝置的制作方法
上一篇：一種具有防凍冷卻功能的激光焊字機(jī)的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于自注意力集成自動多視野的信貸違約預(yù)測方法及裝置