本發(fā)明屬于氣象預(yù)報(bào)技術(shù)領(lǐng)域,尤其是一種基于遺傳算法改進(jìn)的多模式污染物集成預(yù)報(bào)方法。
背景技術(shù):
隨著大氣污染問(wèn)題日益嚴(yán)峻,大氣污染物預(yù)報(bào)已經(jīng)成為科學(xué)研究的重點(diǎn)。目前大氣污染預(yù)報(bào)方法主要分為統(tǒng)計(jì)預(yù)報(bào)和數(shù)值預(yù)報(bào),統(tǒng)計(jì)預(yù)報(bào)是利用數(shù)理統(tǒng)計(jì)方法針對(duì)大氣污染物進(jìn)行預(yù)報(bào)。數(shù)值預(yù)報(bào)是根據(jù)大氣實(shí)際情況,在一定條件下用計(jì)算機(jī)作數(shù)值計(jì)算進(jìn)行預(yù)測(cè)。國(guó)內(nèi)針對(duì)大氣污染物的預(yù)報(bào)研究大多采用數(shù)值預(yù)報(bào)模式且已經(jīng)得到廣泛應(yīng)用。但由于各個(gè)數(shù)值模式化學(xué)參數(shù)化方案、動(dòng)力框架等方面存在差異,使得各個(gè)模式在預(yù)報(bào)能力上存在不同,多模式集成技術(shù)正是利用各模式中心預(yù)報(bào)的結(jié)果減少模式系統(tǒng)性的偏差,現(xiàn)已作為大氣污染物預(yù)報(bào)的一個(gè)重要發(fā)展方向。
迄今為止,人們已經(jīng)提出許多集成預(yù)報(bào)方法。陳煥盛等采用多元線性回歸方法集成各空氣質(zhì)量模式預(yù)報(bào)大氣污染物濃度,試驗(yàn)結(jié)果表明集成預(yù)報(bào)模式優(yōu)于單個(gè)預(yù)報(bào)模式。張偉建立了神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)模型,結(jié)果表明預(yù)報(bào)精度相對(duì)較高。秦珊珊提出基于人工智能優(yōu)化神經(jīng)網(wǎng)絡(luò)模型,對(duì)pm2.5的濃度進(jìn)行預(yù)報(bào)。zhangping等用改進(jìn)的bp人工神經(jīng)網(wǎng)絡(luò)并結(jié)合地理信息評(píng)價(jià)pm2.5的預(yù)報(bào)效果,結(jié)果顯示當(dāng)隱含層神經(jīng)元數(shù)量為20時(shí)有較高的精度。潘璇等構(gòu)建遺傳算法模型針對(duì)氣象因素進(jìn)行預(yù)測(cè),預(yù)報(bào)結(jié)果顯示平均誤差相對(duì)較小。sun等通過(guò)實(shí)驗(yàn)驗(yàn)證了基于svm的空氣質(zhì)量預(yù)報(bào)模型(pm2.5)能有效應(yīng)用于大氣污染物濃度預(yù)測(cè),但在極端情況下預(yù)報(bào)精度有所下降。
總的來(lái)說(shuō),多模式集成預(yù)報(bào)的研究成果多采用線性回歸、機(jī)器學(xué)習(xí)等方法進(jìn)行預(yù)報(bào)。線性回歸模型無(wú)法很好地解決非線性問(wèn)題,而神經(jīng)網(wǎng)絡(luò)能較好地解決非線性關(guān)系問(wèn)題,非線性擬合能力較強(qiáng),但其中bp神經(jīng)網(wǎng)絡(luò)算法缺陷是學(xué)習(xí)速度較慢、訓(xùn)練過(guò)程會(huì)陷入局部最小及不能確定隱層的神經(jīng)元個(gè)數(shù)問(wèn)題;而遺傳算法缺陷是訓(xùn)練時(shí)間較長(zhǎng),訓(xùn)練過(guò)程中容易出現(xiàn)早熟,不能收斂到最優(yōu)解問(wèn)題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提出一種設(shè)計(jì)合理、性能穩(wěn)定且精度高的基于遺傳算法改進(jìn)的多模式污染物集成預(yù)報(bào)方法。
本發(fā)明解決其技術(shù)問(wèn)題是采取以下技術(shù)方案實(shí)現(xiàn)的:
一種基于遺傳算法改進(jìn)的多模式污染物集成預(yù)報(bào)方法,包括以下步驟:
步驟1、對(duì)原始樣本進(jìn)行數(shù)據(jù)整理并處理極大、極小及缺失數(shù)據(jù);
步驟2、對(duì)處理后的樣本進(jìn)行顯著性檢驗(yàn),采用偏差、相關(guān)性選取單模式;
步驟3、引入遺傳算子改進(jìn)極限學(xué)習(xí)機(jī);
步驟4:采用極限學(xué)習(xí)機(jī)改進(jìn)遺傳算法進(jìn)行大氣污染物集成優(yōu)化預(yù)報(bào)。
進(jìn)一步,所述步驟1的具體方法為:在分季節(jié)預(yù)報(bào)基礎(chǔ)上找到預(yù)報(bào)時(shí)刻最近30天的歷史數(shù)據(jù)作為訓(xùn)練樣本,使得待集成數(shù)據(jù)所對(duì)應(yīng)訓(xùn)練樣本均為滾動(dòng)更新,每個(gè)樣本的實(shí)況值為網(wǎng)絡(luò)訓(xùn)練的輸出,輸出層神經(jīng)元為1。
進(jìn)一步,所述步驟2的具體方法為:針對(duì)不同季節(jié)分別進(jìn)行單模式的選取,所用方法在滿足顯著性檢驗(yàn)基礎(chǔ)上,針對(duì)不同模式以及實(shí)況值通過(guò)相對(duì)偏差sd和相關(guān)系數(shù)r進(jìn)行篩選,計(jì)算公式如下:
式中,cp為模式模擬值,co為觀測(cè)值,
進(jìn)一步,所述步驟3的具體方法為:設(shè)問(wèn)題有n維決策變量,則輸入節(jié)點(diǎn)為n+2,種群適應(yīng)度為adapt,隨機(jī)數(shù)為random,父代種群為
進(jìn)一步,所述步驟4的具體方法為:
首先,隨機(jī)生成單模式權(quán)重并用實(shí)數(shù)編碼組成染色體,形成初始種群;
然后,子種群一部分由遺傳算法通過(guò)最優(yōu)保留選擇方式、選擇算術(shù)交叉方式、動(dòng)態(tài)變異方式的遺傳三算子操作生成下一代種群;子種群另一部分由已經(jīng)訓(xùn)練好的極限學(xué)習(xí)機(jī)進(jìn)化機(jī)制來(lái)生成下一代種群;兩種機(jī)制根據(jù)計(jì)算得到的種群適應(yīng)度adapt的優(yōu)劣來(lái)判斷下一代子種群的分配比例,具體定義規(guī)則如下:
設(shè)問(wèn)題有n維決策變量,輸入節(jié)點(diǎn)為n+2,種群適應(yīng)度為adapt,隨機(jī)數(shù)為random,父代種群為
其中,i為集成預(yù)報(bào)成員模式;t為預(yù)報(bào)時(shí)間點(diǎn);m為成員個(gè)數(shù);n為一次預(yù)報(bào)時(shí)間點(diǎn)數(shù)目;e為集成結(jié)果與實(shí)際數(shù)據(jù)的均方誤差;wi,t為第i個(gè)成員模式在第t個(gè)時(shí)間點(diǎn)上的權(quán)重系數(shù);ri,t為該污染物第i個(gè)成員模式在第t個(gè)時(shí)間點(diǎn)的預(yù)報(bào)值;ri,t為第i個(gè)模式在預(yù)報(bào)時(shí)間點(diǎn)t的實(shí)況值;
根據(jù)兩種方法適應(yīng)度對(duì)子種群分配比例p進(jìn)行調(diào)整,兩種算法的適應(yīng)度分別為adapt1和adapt2,子種群分配比例p的計(jì)算公式如下:
在本步驟中,迭代終止條件為均方根誤差達(dá)到平衡,迭代到最優(yōu)解不再發(fā)生變化即終止迭代。
本發(fā)明的優(yōu)點(diǎn)和積極效果是:
本發(fā)明采用多種單模式預(yù)報(bào)作為算法輸入層,引入遺傳算子改進(jìn)極限學(xué)習(xí)機(jī)訓(xùn)練模型,利用改進(jìn)極限學(xué)習(xí)機(jī)優(yōu)秀的非線性映射能力改進(jìn)遺傳算法迭代速度慢,容易早熟的缺點(diǎn);隨后,利用訓(xùn)練好的模型改進(jìn)遺傳算法迭代策略,在不斷迭代過(guò)程中改進(jìn)子代種群的搜索方向,加快搜索速度,達(dá)到精度高、收斂快的效果,可以較好發(fā)揮大氣污染物預(yù)報(bào)作用,其作為一種非線性、多模式的集成方法,不僅具有最優(yōu)的預(yù)報(bào)精度,而且有效降低了遺傳算法的迭代次數(shù),縮短了時(shí)間成本。本發(fā)明在污染物濃度預(yù)報(bào),包括溫度預(yù)報(bào),降水預(yù)報(bào),霧霾分析預(yù)報(bào)等領(lǐng)域,都具有較好的應(yīng)用價(jià)值。
附圖說(shuō)明
圖1為本發(fā)明的實(shí)現(xiàn)流程圖;
圖2為本發(fā)明在實(shí)驗(yàn)中涉及到co冬季各單模式方案篩選對(duì)比圖;
圖3為本發(fā)明在實(shí)驗(yàn)中涉及到co夏季各單模式方案篩選對(duì)比圖;
圖4為六種大氣污染物采用本發(fā)明方法及對(duì)比單模式和其他集成算法時(shí)的均方根誤差對(duì)比圖;
圖5為三種大氣污染物冬季、春季單月污染物濃度實(shí)況值與本發(fā)明及其他集成算法的預(yù)報(bào)值對(duì)比圖;
圖6為另三種大氣污染物冬季、春季單月污染物濃度實(shí)況值與本發(fā)明及其他集成算法的預(yù)報(bào)值對(duì)比圖。
具體實(shí)施方式
以下結(jié)合附圖對(duì)本發(fā)明實(shí)施例做進(jìn)一步詳述:
本發(fā)明的設(shè)計(jì)原理為:采用多種單模式預(yù)報(bào)作為算法輸入層,引入遺傳算子改進(jìn)極限學(xué)習(xí)機(jī)訓(xùn)練模型,利用改進(jìn)極限學(xué)習(xí)機(jī)優(yōu)秀的非線性映射能力改進(jìn)遺傳算法迭代速度慢,容易早熟的缺點(diǎn);隨后,利用訓(xùn)練好的模型改進(jìn)遺傳算法迭代策略,在不斷迭代過(guò)程中改進(jìn)子代種群的搜索方向,加快搜索速度,達(dá)到精度高、收斂快的效果。以下是兩種算法概述:
遺傳算法作為一種全局優(yōu)化算法,遺傳算法即通過(guò)對(duì)染色體上的基因進(jìn)行操作從而尋找優(yōu)良的染色體作為最優(yōu)解的問(wèn)題?;驹硎侨維向量x=[x1,x2,...,xn]表示成由xi(i=1,2,...,n)所組成的符號(hào)串,符號(hào)串中每一個(gè)xi看作成一個(gè)遺傳基因,則x作為由n個(gè)遺傳基因所組成的染色體鏈,多個(gè)染色體構(gòu)成的種群叫做初始種群。將假設(shè)的染色體置于問(wèn)題中,首先設(shè)定目標(biāo)函數(shù)對(duì)每個(gè)個(gè)體進(jìn)行評(píng)價(jià),給出適應(yīng)度以評(píng)判染色體的優(yōu)劣程度。按照適者生存的原則,選出適應(yīng)度較高的個(gè)體進(jìn)行復(fù)制、交叉以及變異,產(chǎn)生適應(yīng)度更好的新一代種群,個(gè)體x適應(yīng)度越大,越趨近于最優(yōu)解。隨后,根據(jù)適應(yīng)度選取一定的個(gè)體作為下一代種群繼續(xù)進(jìn)化,如此進(jìn)行多次后,算法收斂于最好的染色體。
elm(extremelearningmachine)是一種新型神經(jīng)網(wǎng)絡(luò)算法。主要為克服傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)算法學(xué)習(xí)步長(zhǎng)難確定、迭代次數(shù)多、容易陷入局部最優(yōu)的缺點(diǎn)。elm網(wǎng)絡(luò)機(jī)構(gòu)及工作原理是:給定訓(xùn)練樣本集和隱層神經(jīng)元數(shù)l,其中xi=[xi1,xi2,...,xin]t∈rn,即為樣本的輸入值,ti=[ti1,ti2,...,tin]t∈rn,即為樣本的期望輸出值。存在ai,bi,βi使得:
其中,a=[ai1,ai2,...,ain]為輸入層與隱藏層間第i個(gè)節(jié)點(diǎn)的連接權(quán)值;βi=[βi1,βi2,...,βin]t為隱藏層第i個(gè)節(jié)點(diǎn)與輸出層的連接權(quán)值;g(aixj+bi)為第i個(gè)隱層神經(jīng)元的輸出,g(·)為神經(jīng)元激活函數(shù)。還可以表示為hβ=y(tǒng),h即為神經(jīng)網(wǎng)絡(luò)的隱含層輸出矩陣,具體形為:
通過(guò)實(shí)驗(yàn)研究發(fā)現(xiàn),若給定任意不同的樣本(xi,ti)、任意小誤差ε(ε>0)和一個(gè)任意區(qū)間無(wú)限可微的激活函數(shù)g,則總存在一個(gè)含有k(k≤n)個(gè)隱含層神經(jīng)元的單隱層前饋神經(jīng)網(wǎng)絡(luò),在隨機(jī)賦值初始權(quán)重和偏置的情況下,有||hn×mβm×n-t||<ε,隱藏節(jié)點(diǎn)數(shù)可在開(kāi)始指定,且在訓(xùn)練中保持不變。因此,當(dāng)激活函數(shù)g(xi)無(wú)限可微時(shí),隱含層與輸出層間的連接權(quán)值通過(guò)求解以下的最小二乘值獲得。
h+為隱含層輸出矩陣h的廣義逆。
根據(jù)上述原理,本發(fā)明基于遺傳算法改進(jìn)的多模式污染物集成預(yù)報(bào)方法,如圖1所示,包括以下步驟:
步驟1、預(yù)處理:對(duì)原始樣本進(jìn)行數(shù)據(jù)整理,保證數(shù)據(jù)有效性并簡(jiǎn)化運(yùn)算。
如針對(duì)大氣污染物,將國(guó)家氣象局模式cuace、北京市氣象局模式bremps、歐洲氣溶膠動(dòng)力模式made(modelaerosoldynamicsmodelforeurope)、wrf-chem模式的局地三種邊界層方案myj、myn3和bl以及非局地邊界層方案ysu的天津區(qū)域自動(dòng)氣象站點(diǎn)資料進(jìn)行整理,取出2015年六種大氣污染物(no2,o3,pm2.5,pm10,co,so2)濃度數(shù)據(jù),整理并處理極大、極小及缺失數(shù)據(jù)。在本實(shí)施例中,模式預(yù)報(bào)會(huì)隨季節(jié)變化呈現(xiàn)一定規(guī)律,過(guò)多選取樣本會(huì)造成計(jì)算量大且描述預(yù)報(bào)規(guī)律不準(zhǔn)確,導(dǎo)致過(guò)擬合。最佳方案是在分季節(jié)預(yù)報(bào)基礎(chǔ)上找到預(yù)報(bào)時(shí)刻最近30d的歷史數(shù)據(jù)作為訓(xùn)練樣本,即待集成數(shù)據(jù)所對(duì)應(yīng)訓(xùn)練樣本均為滾動(dòng)更新,每個(gè)樣本的實(shí)況值為網(wǎng)絡(luò)訓(xùn)練的輸出,所以輸出層神經(jīng)元為1。注意模型訓(xùn)練之前要對(duì)數(shù)據(jù)進(jìn)行歸一化處理。
步驟2、模式選?。簩?duì)處理后的樣本進(jìn)行顯著性檢驗(yàn),用偏差、相關(guān)性選取單模式。
在本步驟中,模式選取具體包括以下步驟:采用集成多個(gè)單一預(yù)報(bào)模式的方法,針對(duì)春(3月-5月)夏(6月-8月)秋(9月-11月)冬(12月-2月)4個(gè)季節(jié)分別進(jìn)行單模式的選取。所用方法在滿足顯著性檢驗(yàn)基礎(chǔ)上,針對(duì)8種不同模式以及實(shí)況值通過(guò)相對(duì)偏差(standarddeviation,sd)和相關(guān)系數(shù)(correlationcoefficient,r)進(jìn)行篩選,其中,cp為模式模擬值,co為觀測(cè)值,
步驟3、引入遺傳算子改進(jìn)極限學(xué)習(xí)機(jī)(elm):在極限學(xué)習(xí)機(jī)算法的設(shè)計(jì)中引入種群適應(yīng)度值來(lái)模擬選擇算子優(yōu)勝略汰的特點(diǎn),引入隨機(jī)數(shù)來(lái)體現(xiàn)隨機(jī)變異的特點(diǎn)改進(jìn)輸出權(quán)重準(zhǔn)確度。
在本步驟中,利用elm良好的映射能力來(lái)刻畫遺傳算法中父代和子代之間的復(fù)雜非線性關(guān)系,具體過(guò)程為:引入種群適應(yīng)度值來(lái)模擬選擇算子優(yōu)勝略汰的特點(diǎn),引入隨機(jī)數(shù)來(lái)體現(xiàn)隨機(jī)變異的特點(diǎn)。設(shè)問(wèn)題有n維決策變量,則輸入節(jié)點(diǎn)為n+2:種群適應(yīng)度adapt、隨機(jī)數(shù)random、父代種群
訓(xùn)練樣本的構(gòu)建是引入遺傳算子的elm進(jìn)化機(jī)制的關(guān)鍵,其中父代作為elm進(jìn)化機(jī)制的輸入,而子代作為輸出。引入的種群進(jìn)化代數(shù)evolution,映射出父代種群和子代種群的復(fù)雜非線性關(guān)系,獲得更好搜索方向和搜索范圍。evolution的選擇會(huì)影響種群收斂速度,種群進(jìn)化代數(shù)太少,進(jìn)化速度不快;進(jìn)化代數(shù)太多,訓(xùn)練后的進(jìn)化機(jī)制搜索方向時(shí)效性變差。為此,evolution的選擇通過(guò)實(shí)驗(yàn)仿真選取,且選取多代父種群和子種群以擴(kuò)大訓(xùn)練樣本,避免初始階段進(jìn)化不顯著的缺點(diǎn)。
步驟4、極限學(xué)習(xí)機(jī)改進(jìn)遺傳算法:使遺傳算法生成第一代子種群,子種群一部分由遺傳算法生成下一代種群;另一部分由已經(jīng)訓(xùn)練好的極限學(xué)習(xí)機(jī)進(jìn)化機(jī)制來(lái)生成下一代種群,從而得到更優(yōu)的搜索方向和搜索范圍。通過(guò)獲得更好的搜索方向減少迭代時(shí)間并獲得最優(yōu)預(yù)報(bào)值。
在本步驟中,采取elm結(jié)合改進(jìn)遺傳算法,表示為:首先隨機(jī)生成單模式權(quán)重并用實(shí)數(shù)編碼組成染色體,形成初始種群。隨后,子種群一部分由遺傳算法通過(guò)最優(yōu)保留選擇方式、選擇算術(shù)交叉方式、動(dòng)態(tài)變異方式的遺傳三算子操作生成下一代種群;另一部分由已經(jīng)訓(xùn)練好的elm進(jìn)化機(jī)制來(lái)生成下一代種群。兩種機(jī)制根據(jù)計(jì)算得到的種群適應(yīng)度adapt的優(yōu)劣來(lái)判斷下一代子種群的分配比例,具體定義規(guī)則如下:
假設(shè)設(shè)問(wèn)題有n維決策變量,則輸入節(jié)點(diǎn)為n+2:種群適應(yīng)度adapt、隨機(jī)數(shù)random、父代種群
其中,i為集成預(yù)報(bào)成員模式;t為預(yù)報(bào)時(shí)間點(diǎn);m為成員個(gè)數(shù);n為一次預(yù)報(bào)時(shí)間點(diǎn)數(shù)目;e為集成結(jié)果與實(shí)際數(shù)據(jù)的均方誤差;wi,t為第i個(gè)成員模式在第t個(gè)時(shí)間點(diǎn)上的權(quán)重系數(shù);ri,t為該污染物第i個(gè)成員模式在第t個(gè)時(shí)間點(diǎn)的預(yù)報(bào)值;ri,t為第i個(gè)模式在預(yù)報(bào)時(shí)間點(diǎn)t的實(shí)況值;根據(jù)兩種方法適應(yīng)度對(duì)子種群分配比例進(jìn)行調(diào)整,兩種算法的適應(yīng)度adapt1,adapt2,公式如下:
在本步驟中,迭代終止條件為均方根誤差達(dá)到平衡,迭代到最優(yōu)解不再發(fā)生變化即終止迭代。
本發(fā)明對(duì)于每種大氣污染物精度預(yù)報(bào)均有提高:一氧化碳均方根誤差降低到0.46mg/m3,平均絕對(duì)誤差值降低到0.35mg/m3;二氧化氮均方根誤差降低到12.60mg/m3,平均絕對(duì)誤差值降低到9.36mg/m3;臭氧均方根誤差降低到17.25mg/m3,平均絕對(duì)誤差值降低到11.7mg/m3;pm2.5均方根誤差降低到30.21mg/m3,平均絕對(duì)誤差值降低到23.8mg/m3;pm10均方根誤差降低到60.50mg/m3,平均絕對(duì)誤差值降低到38.9mg/m3;so2均方根誤差降低到10.75mg/m3,平均絕對(duì)誤差值降低到7.76mg/m3。在算法的執(zhí)行時(shí)間上,改進(jìn)算法與遺傳算法相比,30天滾動(dòng)的分季節(jié)遺傳算法在四個(gè)季節(jié)中平均用時(shí)614.98s,引入遺傳算子的elm改進(jìn)遺傳算法集成預(yù)報(bào)用時(shí)281.79s。后者的執(zhí)行時(shí)間明顯更快。其中迭代總數(shù)500次中遺傳算法平均收斂次數(shù)為381次,引入遺傳算子的elm改進(jìn)遺傳算法網(wǎng)絡(luò)為247次。因此,本文算法可以滿足氣象預(yù)報(bào)中高時(shí)效性的要求,能在盡可能短的時(shí)間內(nèi)提供準(zhǔn)確性高的預(yù)報(bào)結(jié)果。
實(shí)驗(yàn)首先對(duì)八種單模式進(jìn)行選取。模式的選取采用各模式與實(shí)況值的顯著性分析檢驗(yàn),顯示p-value大于0.01,小于0.05,表示差異顯著;p-value小于0.01,差異極顯著。針對(duì)顯著的模式方案進(jìn)行相關(guān)性r以及偏差t分析,相關(guān)性r采用統(tǒng)一標(biāo)準(zhǔn):取絕對(duì)值后0<r<0.09為沒(méi)有相關(guān)性,0.1<r<0.3為相關(guān),0.3<r<0.5為低度相關(guān),0.5<r<0.8為中度相關(guān),r≥0.8為高度相關(guān)。在相關(guān)性評(píng)價(jià)基礎(chǔ)上,偏差不宜過(guò)大。圖2和圖3為以co為例的各單模式方案在冬季和夏季的篩選對(duì)比圖。
圖4給出了全年天津站點(diǎn)6種大氣污染物均方根誤差的3種典型單模式以及svm算法、bp算法、遺傳算法與改進(jìn)算法的預(yù)報(bào)結(jié)果對(duì)比圖,按照春夏秋冬四個(gè)季節(jié)進(jìn)行預(yù)報(bào),由圖可知:相較于三種單模式,四種集成模式均展現(xiàn)出了較好的均方根誤差能力,而引入遺傳算子的elm改進(jìn)遺傳算法模式又比其他三種集成模式更優(yōu)秀。改進(jìn)算法的co較單模式和集成算法均方根誤差降低0.05~0.40mg/m3,平均絕對(duì)誤差值降低0.02~0.34mg/m3;no2均方根誤差降低1.88~15.32mg/m3,平均絕對(duì)誤差值降低0.93~16.11mg/m3;o3均方根誤差降低5.72~21.67mg/m3,平均絕對(duì)誤差值降低0.13~16.85mg/m3;pm10均方根誤差降低3.20~21.80mg/m3,平均絕對(duì)誤差值降低0.69~6.86mg/m3;pm2.5均方根誤差降低3.03~20.06mg/m3,平均絕對(duì)誤差值降低0.07~9.08mg/m3;so2均方根誤差降低7.33~17.71mg/m3,平均絕對(duì)誤差值降低0.17~9.24mg/m3。其中冬季預(yù)報(bào)結(jié)果最優(yōu),其次是秋季、春季,預(yù)報(bào)效果最不穩(wěn)定的是夏季。這與參與集成的多個(gè)模式各有優(yōu)劣且夏天受溫度、風(fēng)力等氣象因素影響較大相關(guān),導(dǎo)致預(yù)報(bào)結(jié)果rmse的增長(zhǎng)。
圖4顯示出集成模式預(yù)報(bào)效果普遍高于單模式且冬季和夏季分別是預(yù)報(bào)效果最好和最不穩(wěn)定的季節(jié),圖5、圖6采用6種大氣污染物的svm算法集成模式、bp算法集成模式、遺傳算法集成模式、引入遺傳算子的elm改進(jìn)遺傳算法集成模式與實(shí)況值的預(yù)報(bào)結(jié)果進(jìn)行對(duì)比分析,選取2015年預(yù)報(bào)效果最好的冬季單月以及預(yù)報(bào)較不穩(wěn)定的夏季單月。由圖5、圖6可知:(1)在預(yù)報(bào)效果最好的冬季,4種集成方法均有良好的精度,但從細(xì)節(jié)上可以看出改進(jìn)算法整體上更加貼近實(shí)況值。(2)預(yù)報(bào)效果最不穩(wěn)定的夏季,bp算法和遺傳算法因存在收斂不到最優(yōu)解,整體預(yù)報(bào)不穩(wěn)定的缺點(diǎn),預(yù)測(cè)曲線與實(shí)況值有一定偏差。改進(jìn)算法集成預(yù)報(bào)利用elm改進(jìn)搜索方向,加快收斂速度,較其它三種集成方法明顯更加貼近實(shí)況值且穩(wěn)定,而svm雖然有少量預(yù)報(bào)結(jié)果比較貼近實(shí)況值,但整體上改進(jìn)算法精度更好。
綜上所述,本發(fā)明將過(guò)程劃分為讀取單模式大氣污染物濃度數(shù)據(jù)及預(yù)處理、模式選取、引入遺傳算子改進(jìn)極限學(xué)習(xí)機(jī)、極限學(xué)習(xí)機(jī)改進(jìn)遺傳算法四個(gè)階段,且考慮了季節(jié)性影響且設(shè)置30天動(dòng)態(tài)滾動(dòng)數(shù)據(jù)集。其中,與遺傳算法集成模型相比,改進(jìn)算法預(yù)測(cè)模型改進(jìn)elm算法輸入并模擬遺傳算子操作,運(yùn)用改進(jìn)的elm算法與遺傳算法相結(jié)合,具有收斂速度快,不易陷入局部最小的特點(diǎn),可以較好發(fā)揮大氣污染物預(yù)報(bào)作用;從4個(gè)季節(jié)的預(yù)報(bào)效果看,各單數(shù)值模式在不同季節(jié)中會(huì)展現(xiàn)出不同的預(yù)報(bào)效果,采用選出的數(shù)值模式進(jìn)行集成預(yù)報(bào)均方根誤差較各個(gè)單模式預(yù)報(bào)有很大的改進(jìn),且引入遺傳算子的elm改進(jìn)遺傳算法的集成方法均方根誤差較神經(jīng)網(wǎng)絡(luò)、svm集成預(yù)報(bào)更小。其中冬季預(yù)報(bào)結(jié)果最優(yōu),其次是秋季、春季、夏季;從單季節(jié)的每天預(yù)報(bào)效果看,在預(yù)報(bào)精度較不穩(wěn)定的夏天,引入遺傳算子的elm改進(jìn)遺傳算法展現(xiàn)了較神經(jīng)網(wǎng)絡(luò)、svm集成算法更好的預(yù)報(bào)精度和整體穩(wěn)定度。實(shí)驗(yàn)證明,遺傳算法改進(jìn)的多模式污染物集成預(yù)報(bào)方法不僅具有最優(yōu)的預(yù)報(bào)精度,而且有效降低了遺傳算法的迭代次數(shù),從而縮短了時(shí)間成本,本發(fā)明是對(duì)遺傳方法的一種有效改進(jìn)。
需要強(qiáng)調(diào)的是,本發(fā)明所述的實(shí)施例是說(shuō)明性的,而不是限定性的,因此本發(fā)明包括并不限于具體實(shí)施方式中所述的實(shí)施例,凡是由本領(lǐng)域技術(shù)人員根據(jù)本發(fā)明的技術(shù)方案得出的其他實(shí)施方式,同樣屬于本發(fā)明保護(hù)的范圍。