本發(fā)明屬于人工智能領(lǐng)域,具體涉及一種深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)魯棒性自適應(yīng)驗(yàn)證方法及平臺。
背景技術(shù):
1、隨著人工智能技術(shù)的快速發(fā)展和廣泛應(yīng)用,神經(jīng)網(wǎng)絡(luò)在圖像識別、語音識別、自然語言處理等各類任務(wù)中的表現(xiàn)取得了顯著提升。在金融科技領(lǐng)域,尤其是股市風(fēng)險(xiǎn)預(yù)測等復(fù)雜時間序列任務(wù)中,神經(jīng)網(wǎng)絡(luò)逐漸成為重要的工具。通過深度學(xué)習(xí)模型分析和處理大量歷史數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)能夠捕捉金融市場中隱含的模式和趨勢,有效地進(jìn)行股價(jià)預(yù)測和風(fēng)險(xiǎn)評估。然而,盡管神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的學(xué)習(xí)和預(yù)測能力,其魯棒性問題在涉及財(cái)產(chǎn)和人身安全的應(yīng)用場景中引發(fā)了廣泛關(guān)注。
2、當(dāng)前的神經(jīng)網(wǎng)絡(luò)魯棒性驗(yàn)證研究主要集中于基于邊界近似的驗(yàn)證算法,這些算法在大型神經(jīng)網(wǎng)絡(luò)的魯棒性驗(yàn)證中取得了重要進(jìn)展。常見的方法包括使用凸優(yōu)化、符號區(qū)間傳播、拉格朗日乘子約束求解和分支界限等技術(shù),這些方法通過不同的方式來近似求解神經(jīng)網(wǎng)絡(luò)的魯棒性邊界。然而,這些方法也存在一些局限性:雖然計(jì)算復(fù)雜度相較于精確方法較低,但魯班下驗(yàn)證能能力較差。與之相反精確算法往往需要大量的計(jì)算資源,特別是在處理具有數(shù)百萬參數(shù)的大型深度神經(jīng)網(wǎng)絡(luò)時,計(jì)算成本會顯著增加。因此,在小型神經(jīng)網(wǎng)絡(luò)中,近似方法的效率通常不如精準(zhǔn)方法高效,但在大型神經(jīng)網(wǎng)絡(luò)中,近似算法可以大量的節(jié)省驗(yàn)證時長。單一算法無法滿足實(shí)時應(yīng)用的需求,結(jié)合近似和精確算法可以在保證驗(yàn)證性能下減少驗(yàn)證時長。
3、另一方面,現(xiàn)有的魯棒性驗(yàn)證研究大多集中在前饋神經(jīng)網(wǎng)絡(luò)(feedforwardneural?networks,fnn)和卷積神經(jīng)網(wǎng)絡(luò)(convolutional?neural?networks,cnn)上。這些網(wǎng)絡(luò)結(jié)構(gòu)在靜態(tài)圖像和非時間序列數(shù)據(jù)的處理方面表現(xiàn)出色,但在應(yīng)對時序任務(wù)(如股市預(yù)測、傳感器數(shù)據(jù)處理、語音信號處理等)時存在局限性。時序任務(wù)中的數(shù)據(jù)通常具有復(fù)雜的時間依賴性和高噪聲特性,對神經(jīng)網(wǎng)絡(luò)模型的魯棒性提出了更高的要求。針對這些任務(wù)的神經(jīng)網(wǎng)絡(luò)(如長短期記憶網(wǎng)絡(luò)lstm)在魯棒性驗(yàn)證方面的研究相對不足,導(dǎo)致在這些領(lǐng)域的魯棒性驗(yàn)證仍面臨諸多挑戰(zhàn)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提出一種自適應(yīng)驗(yàn)證方法,通過結(jié)合樣本攻擊算法、近似算法和精確算法,構(gòu)建自適應(yīng)驗(yàn)證模型agtn(algorithm?group-timeout?networks),以自動選擇最優(yōu)的驗(yàn)證算法組合和超時時長。該方法提高了驗(yàn)證效率和魯棒性驗(yàn)證的效果,適用于多種類型和規(guī)模的神經(jīng)網(wǎng)絡(luò)模型。
2、實(shí)現(xiàn)本發(fā)明目的的具體技術(shù)方案是:
3、一種深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)魯棒性自適應(yīng)驗(yàn)證方法,包括以下步驟:
4、步驟1、構(gòu)建基于深度學(xué)習(xí)的自適應(yīng)驗(yàn)證策略生成模型;
5、步驟1.1、訓(xùn)練多個不同神經(jīng)元個數(shù)、層度的mlp及cnn模型,改變超參數(shù)獲取準(zhǔn)確率不同的模型;
6、步驟1.2、通過對訓(xùn)練的mlp、cnn模型進(jìn)行魯棒性驗(yàn)證與解析采集自適應(yīng)驗(yàn)證策略生成模型訓(xùn)練數(shù)據(jù);
7、步驟1.2.1、獲取神經(jīng)網(wǎng)絡(luò)模型的全連接層神經(jīng)元個數(shù)、全連接層層數(shù)、卷積層神經(jīng)元個數(shù)、卷積層層數(shù)和準(zhǔn)確率作為特征值;
8、步驟1.2.2、在設(shè)定的超時時長下,采用不同的驗(yàn)證算法組合對訓(xùn)練的模型進(jìn)行魯棒性驗(yàn)證,記錄驗(yàn)證成功樣本個數(shù)最多的算法組合,如果多個算法組合獲取相同的驗(yàn)證成功樣本個數(shù),則記錄總驗(yàn)證時長最短的算法組合;同時記錄該算法下單個樣本驗(yàn)證成功時的最長驗(yàn)證時長作為超時時長;
9、步驟1.2.3、自適應(yīng)驗(yàn)證策略生成模型的輸入特征值取全連接層神經(jīng)元個數(shù)、全連接層層數(shù)、卷積層神經(jīng)元個數(shù)、卷積層層數(shù)和準(zhǔn)確率;目標(biāo)分類標(biāo)簽為算法組合和超時時長;
10、步驟1.3、構(gòu)建自適應(yīng)驗(yàn)證策略生成模型,模型由算法組合、超時時長策略生成模型構(gòu)成;
11、步驟1.3.1、基于深度學(xué)習(xí)前饋神經(jīng)網(wǎng)絡(luò)構(gòu)建算法組合策略生成模型,模型輸入特征值為全連接層神經(jīng)元個數(shù)、全連接層層數(shù)、卷積層神經(jīng)元個數(shù)、卷積層層數(shù)和準(zhǔn)確率,輸出為算法組合分類;
12、步驟1.3.2、基于深度學(xué)習(xí)前饋神經(jīng)網(wǎng)絡(luò)構(gòu)建超時時長策略生成模型,模型輸入特征值為全連接層神經(jīng)元個數(shù)、全連接層層數(shù)、卷積層神經(jīng)元個數(shù)、卷積層層數(shù)、準(zhǔn)確率和算法組合策略生成模型輸出的算法組合分類;輸出為超時時長;
13、步驟1.4、根據(jù)采集的數(shù)據(jù)集訓(xùn)練自適應(yīng)驗(yàn)證策略生成模型,提供后續(xù)生成自適應(yīng)策略時調(diào)用;
14、步驟2、對任一待魯棒性驗(yàn)證的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行解析評估,根據(jù)解析評估結(jié)果確定自適應(yīng)驗(yàn)證策略生成模型的輸入特征值;
15、步驟2.1、根據(jù)解析待驗(yàn)證神經(jīng)網(wǎng)絡(luò)模型的架構(gòu),獲取全連接層神經(jīng)元個數(shù)、全連接層層數(shù)、卷積層神經(jīng)元個數(shù)和卷積層層數(shù)特征;
16、步驟2.2、利用測試樣本評估待驗(yàn)證神經(jīng)網(wǎng)絡(luò)模型的精準(zhǔn)率;
17、步驟2.3、組合全連接層神經(jīng)元個數(shù)、全連接層層數(shù)、卷積層神經(jīng)元個數(shù)和卷積層層數(shù)及精準(zhǔn)率,構(gòu)造自適應(yīng)驗(yàn)證策略生成模型的輸入;
18、步驟3、根據(jù)構(gòu)造好的輸入,調(diào)用自適應(yīng)驗(yàn)證策略生成模型,生成自適應(yīng)驗(yàn)證策略,策略包括驗(yàn)證算法組合與超時時長;
19、步驟3.1、如果待驗(yàn)證模型為lstm則生成適用于lstm魯棒性驗(yàn)證策略,策略為固定的支持lstmcell模型魯棒性驗(yàn)證的算法組合與超時時長;
20、步驟3.2、如果是mlp或cnn模型,則調(diào)用自適應(yīng)驗(yàn)證策略生成模型,生成自適應(yīng)驗(yàn)證策略,策略包括驗(yàn)證算法組合與超時時長;
21、步驟4、根據(jù)生成的魯棒性驗(yàn)證策略對待驗(yàn)證神經(jīng)網(wǎng)絡(luò)模型進(jìn)行魯棒性驗(yàn)證;
22、步驟4.1、判斷是否為lstm模型,如果是則將lstm轉(zhuǎn)換為等效的lstmcell模型;
23、步驟4.1.1、讀取lstm的python文件,并生成對應(yīng)的抽象語法樹ast對象;
24、步驟4.1.2、定位到語法樹中的lstm層代碼,根據(jù)lstm參數(shù)補(bǔ)充替換成等效的lstmcell代碼,保存為臨時lstmcell的python文件;
25、步驟4.1.3、加載lstm與lstmcell模型,并將lstm模型的權(quán)重參數(shù)賦值到lstmcell模型;
26、步驟4.2、根據(jù)生成的魯棒性驗(yàn)證策略對待驗(yàn)證神經(jīng)網(wǎng)絡(luò)模型進(jìn)行多算法組合的魯棒性驗(yàn)證;
27、步驟4.3、輸出驗(yàn)證結(jié)果,包括安全樣本個數(shù)、不安全樣本個數(shù)及未知樣本個數(shù)。
28、進(jìn)一步,所述多算法組合的魯棒性驗(yàn)證,其流程包括:
29、步驟1、加載待驗(yàn)證神經(jīng)網(wǎng)絡(luò)模型;
30、步驟2、加載待驗(yàn)證神經(jīng)網(wǎng)絡(luò)模型的測試樣本;
31、步驟3、驗(yàn)證算法組合包含樣本對抗驗(yàn)證算法(如投影梯度下降pgd)、近似驗(yàn)證算法(如α-crown)、精確驗(yàn)證算法(如混合整數(shù)規(guī)劃mip);組合包含單一算法或者同時包含兩種或三種算法;組合順序?yàn)閷跪?yàn)證算法-近似驗(yàn)證算法-精確驗(yàn)證算法;驗(yàn)證時從左往右依次調(diào)用,如果驗(yàn)證成功則提前結(jié)束返回結(jié)果,或者超過設(shè)定的超時時長則放棄該樣本的驗(yàn)證,繼續(xù)驗(yàn)證下一個測試樣本。
32、一種基于上述方法的神經(jīng)網(wǎng)絡(luò)魯棒性自適應(yīng)驗(yàn)證平臺,包括:
33、神經(jīng)網(wǎng)絡(luò)模型導(dǎo)入管理模塊,讀取用戶保存在平臺指定路徑的onnx或pytorch模型文件,生成神經(jīng)網(wǎng)絡(luò)模型選擇列表;onnx讀取后轉(zhuǎn)換成pytorch模型對象提供后續(xù)驗(yàn)證,pytorch模型文件在代碼中提供平臺要求的方法,用以調(diào)用返回pytorch模型對象;
34、數(shù)據(jù)集導(dǎo)入管理模塊,讀取用戶保存在平臺指定路徑的自定義驗(yàn)證數(shù)據(jù)集,生成自定義數(shù)據(jù)集選擇列表;自定義數(shù)據(jù)集代碼給出系統(tǒng)指定的類,用以生成數(shù)據(jù)集,所需的圖片或csv放在同級文件夾;
35、算法組合-超時時長生成模塊,解析和評估待驗(yàn)證神經(jīng)網(wǎng)絡(luò)模型,獲取自適應(yīng)驗(yàn)證策略生成模型的輸入特征值,采用自適應(yīng)驗(yàn)證策略生成模型生成魯棒性自適應(yīng)驗(yàn)證策略,更新平臺相應(yīng)配置項(xiàng);
36、魯棒性驗(yàn)證模塊,根據(jù)配置項(xiàng)生成配置文件,再根據(jù)配置文件調(diào)用對應(yīng)的算法組合,在設(shè)定的超時時長與擾動值下循環(huán)驗(yàn)證所有驗(yàn)證樣本,返回驗(yàn)證結(jié)果,包括安全樣本個數(shù)、不安全樣本個數(shù)及未知個數(shù);
37、對抗訓(xùn)練模塊,通過pgd對抗訓(xùn)練提高神經(jīng)網(wǎng)絡(luò)模型的魯棒性。
38、本發(fā)明的方法,時序任務(wù)在mlp、cnn下預(yù)測與魯棒性自適應(yīng)驗(yàn)證,包括:
39、mlp模型的數(shù)據(jù)集借助重組,拼接成一維張量;
40、cnn模型采用格拉姆角場(gramian?angular?field,gaf)方法,構(gòu)造圖片形狀的數(shù)據(jù)集;
41、采用深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)魯棒性自適應(yīng)驗(yàn)證方法生成自適應(yīng)驗(yàn)證策略與進(jìn)行魯棒性驗(yàn)證。
42、本發(fā)明提出了一種自適應(yīng)的神經(jīng)網(wǎng)絡(luò)魯棒性驗(yàn)證方法,結(jié)合樣本攻擊算法近似算法和精確算法的優(yōu)點(diǎn),通過構(gòu)建自適應(yīng)驗(yàn)證策略生成模型agtn(algorithm?group-timeoutnetworks),根據(jù)神經(jīng)網(wǎng)絡(luò)的不同特征自動選擇最優(yōu)的驗(yàn)證算法組合和超時時長,以平衡計(jì)算成本與驗(yàn)證效果。該方法特別適用于股市風(fēng)險(xiǎn)預(yù)測等時序任務(wù),能夠有效提高神經(jīng)網(wǎng)絡(luò)的魯棒性驗(yàn)證效率和準(zhǔn)確性,為金融科技和其他安全關(guān)鍵領(lǐng)域的應(yīng)用提供強(qiáng)有力的技術(shù)支持。
43、本發(fā)明通過自適應(yīng)驗(yàn)證策略生成模型實(shí)現(xiàn)對神經(jīng)網(wǎng)絡(luò)模型的魯棒性自適應(yīng)驗(yàn)證,結(jié)合了近似和精確算法,提高了魯棒性驗(yàn)證的效率和準(zhǔn)確性。同時,本發(fā)明通過lstm到lstmcell的轉(zhuǎn)換,增強(qiáng)了驗(yàn)證的適用性,解決了傳統(tǒng)驗(yàn)證方法在時序任務(wù)中效果不佳的問題,尤其適用于股市風(fēng)險(xiǎn)預(yù)測等安全關(guān)鍵領(lǐng)域。