本發(fā)明涉及機器學(xué)習(xí)、深度學(xué)習(xí)和時間序列預(yù)測,具體涉及基于多變量數(shù)據(jù)遲滯性檢測與對齊方法的大氣碳濃度預(yù)測方法及系統(tǒng)。
背景技術(shù):
1、隨著全球碳排放問題的加劇,對大氣中碳產(chǎn)物濃度變化的研究變得愈加重要。二氧化碳(co2)和甲烷(ch4)作為主要的溫室氣體,對全球氣候變化具有深遠(yuǎn)的影響。xco2和xch4分別表示大氣中二氧化碳和甲烷的濃度,通常以體積分?jǐn)?shù)來表征。這些參數(shù)對于監(jiān)測和評估全球碳循環(huán)、氣候變化及溫室氣體排放的影響至關(guān)重要。
2、tccon(total?carbon?column?observing?network,全碳柱觀測網(wǎng))作為全球最為廣泛使用和公認(rèn)的監(jiān)測網(wǎng)絡(luò),提供了重要的數(shù)據(jù)支持。tccon通過全球各地的地面觀測站,利用高分辨率紅外光譜儀測量大氣中的總碳柱(xco2和xch4)。這些測量數(shù)據(jù)為研究人員提供了理解大氣中碳?xì)怏w時空變化的重要參考,幫助監(jiān)測溫室氣體排放并評估全球碳循環(huán)?,F(xiàn)有的預(yù)測模型往往忽視了多變量時間序列中存在的滯后性問題,尤其是在處理復(fù)雜的通道依賴關(guān)系時。
技術(shù)實現(xiàn)思路
1、為了解決以上技術(shù)問題,本發(fā)明提供了基于多變量數(shù)據(jù)遲滯性檢測與對齊方法的大氣碳濃度預(yù)測方法及系統(tǒng),方法包括:
2、步驟s1、將監(jiān)測得到的多變量時間序列數(shù)據(jù)采用滾動窗口的方式,計算各所述大氣碳數(shù)據(jù)變量之間的相關(guān)系數(shù)隨時間的變化趨勢,基于所述變化趨勢構(gòu)建滯后關(guān)系矩陣;
3、步驟s2、基于所述滯后關(guān)系矩陣對所述多變量時間序列數(shù)據(jù)進行調(diào)整對齊,得到對齊后的多變量時間序列數(shù)據(jù);
4、步驟s3、基于所述對齊后的多變量時間序列數(shù)據(jù)構(gòu)建并訓(xùn)練大氣碳濃度預(yù)測模型;
5、步驟s4、使用訓(xùn)練好的大氣碳濃度預(yù)測模型對實時獲取的待預(yù)測大氣碳濃度數(shù)據(jù)進行數(shù)據(jù)處理,得到大氣碳濃度的預(yù)測結(jié)果。
6、可選的,步驟s1中,將監(jiān)測得到的多變量時間序列數(shù)據(jù)采用滾動窗口的方式,計算各所述大氣碳數(shù)據(jù)變量之間的相關(guān)系數(shù)隨時間的變化趨勢,基于所述變化趨勢構(gòu)建滯后關(guān)系矩陣的過程具體包括:
7、步驟s11、設(shè)定所述多變量時間序列數(shù)據(jù)的主變量j窗口x(j)t-l+1:t={x(j)t-l+1,...,x(j)t},協(xié)變量i窗口x(i)t-l+1:t={x(i)t-l+1,...,x(i)t},計算主變量j窗口與協(xié)變量i窗口的滯后滾動相關(guān)評分;
8、步驟s12、將所述協(xié)變量窗口向后移動一步并將所述多變量時間序列數(shù)據(jù)向右移動一個點,基于移動后的協(xié)變量窗口和移動后的多變量時間序列數(shù)據(jù)構(gòu)建填充序列x(i)*={x(i*)t-2l+1,...,x(i*)t-l};
9、步驟s13、重復(fù)步驟s11-步驟s12直到協(xié)變量窗口完全移出,記錄每次的滯后滾動相關(guān)評分以及滯后滾動相關(guān)評分對應(yīng)的滯后距離;
10、步驟s14、從所述滯后滾動相關(guān)評分中尋找最大值,找到與鋒值的滯后滾動相關(guān)評分對應(yīng)的對齊滯后距離;
11、步驟s15、基于所述對齊滯后距離構(gòu)建滯后關(guān)系矩陣。
12、可選的,所述步驟s2中,基于所述滯后關(guān)系矩陣對所述多變量時間序列數(shù)據(jù)進行調(diào)整對齊,得到對齊后的多變量時間序列數(shù)據(jù)的過程具體包括:
13、基于所述滯后關(guān)系矩陣,計算每個協(xié)變量相對于主變量的對齊滯后距離;
14、基于所述對齊滯后距離調(diào)整協(xié)變量直至與所述主變量對齊,得到對齊后的多變量時間序列數(shù)據(jù)。
15、可選的,基于所述對齊滯后距離調(diào)整協(xié)變量直至與所述主變量對齊,得到對齊后的多變量時間序列數(shù)據(jù)的過程具體包括:
16、在調(diào)整協(xié)變量的過程中,丟棄右側(cè)溢出的數(shù)據(jù),并使用所述填充序列補充左側(cè)缺失數(shù)據(jù);
17、確定所述協(xié)變量的對齊滯后距離,將所述協(xié)變量與所述主變量對齊。
18、本發(fā)明公開了基于多變量數(shù)據(jù)遲滯性檢測與對齊方法的大氣碳濃度預(yù)測系統(tǒng),系統(tǒng)包括:矩陣構(gòu)建模塊、數(shù)據(jù)對齊模塊、模型優(yōu)化模塊、碳數(shù)據(jù)預(yù)測模塊;
19、所述矩陣構(gòu)建模塊用于將監(jiān)測得到的多變量時間序列數(shù)據(jù)采用滾動窗口的方式,計算各所述大氣碳數(shù)據(jù)變量之間的相關(guān)系數(shù)隨時間的變化趨勢,基于所述變化趨勢構(gòu)建滯后關(guān)系矩陣;
20、所述數(shù)據(jù)對齊模塊用于基于所述滯后關(guān)系矩陣對所述多變量時間序列數(shù)據(jù)進行調(diào)整對齊,得到對齊后的多變量時間序列數(shù)據(jù);
21、所述模型優(yōu)化模塊用于基于所述對齊后的多變量時間序列數(shù)據(jù)構(gòu)建并訓(xùn)練大氣碳濃度預(yù)測模型;
22、所述碳數(shù)據(jù)預(yù)測模塊用于使用訓(xùn)練好的大氣碳濃度預(yù)測模型對實時獲取的待預(yù)測大氣碳濃度數(shù)據(jù)進行數(shù)據(jù)處理,得到大氣碳數(shù)據(jù)的預(yù)測結(jié)果。
23、可選的,所述矩陣構(gòu)建模塊還包括:滾動評分計算子模塊、填充序列構(gòu)建子模塊、滯后滾動記錄子模塊、滯后距離匹配子模塊和關(guān)系矩陣構(gòu)建子模塊;
24、所述滾動評分計算子模塊用于設(shè)定所述多變量時間序列數(shù)據(jù)的主變量j窗口x(j)t-l+1:t={x(j)t-l+1,...,x(j)t},協(xié)變量i窗口x(i)t-l+1:t={x(i)t-l+1,...,x(i)t},計算主變量j窗口與協(xié)變量i窗口的滯后滾動相關(guān)評分;
25、所述填充序列構(gòu)建子模塊用于將所述協(xié)變量窗口向后移動一步,將所述多變量時間序列數(shù)據(jù)向右移動一個點,基于移動后的協(xié)變量窗口和移動后的多變量時間序列數(shù)據(jù)構(gòu)建填充序列x(i)*={x(i*)t-2l+1,...,x(i*)t-l};
26、所述滯后滾動記錄子模塊用于重復(fù)步驟s11-步驟s12直到協(xié)變量窗口完全移出,記錄每次的滯后滾動相關(guān)評分以及對應(yīng)的滯后值;
27、所述滯后距離匹配子模塊用于從所述滯后滾動相關(guān)評分中尋找最大值,找到與鋒值的滯后滾動相關(guān)評分對應(yīng)的對齊滯后距離;
28、所述關(guān)系矩陣構(gòu)建子模塊用于基于所述對齊滯后距離構(gòu)建滯后關(guān)系矩陣。
29、可選的,所述數(shù)據(jù)對齊模塊還包括:補償距離計算子模塊和序列數(shù)據(jù)對齊子模塊;
30、所述補償距離計算子模塊用于基于所述滯后關(guān)系矩陣,計算每個協(xié)變量相對于主變量的對齊滯后距離;
31、所述序列數(shù)據(jù)對齊子模塊用于基于所述對齊滯后距離調(diào)整協(xié)變量直至與所述主變量對齊,得到對齊后的多變量時間序列數(shù)據(jù)。
32、可選的,所述序列數(shù)據(jù)對齊子模塊的工作流程具體包括:
33、在調(diào)整協(xié)變量的過程中,丟棄右側(cè)溢出的數(shù)據(jù),并使用所述填充序列補充左側(cè)缺失數(shù)據(jù);
34、確定所述協(xié)變量的對齊滯后距離,將所述協(xié)變量與所述主變量對齊。
35、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果為:
36、多元滾動滯后相關(guān)檢測-對齊(mrlcd-a)方法:提出了一種新的“多元滾動滯后相關(guān)檢測對齊(mrlcd-a)”方法,旨在緩解多元時間序列預(yù)測中變量之間的滯后關(guān)系。該方法首先使用多變量互相關(guān)算法來量化變量間關(guān)系并確定滯后步驟,從而檢測滾動滯后相關(guān)性。隨后,采用滑動窗口對齊技術(shù)對滯后變量進行對齊。使用三個獨立的真實世界碳濃度數(shù)據(jù)集和公開可用的時間序列預(yù)測數(shù)據(jù)集來評估基于多變量滾動遲滯性檢測及對齊方法的大氣碳濃度預(yù)測模型及系統(tǒng)。結(jié)果表明,采用mrlcd-a方法的模型顯著改善了最先進的基線。