專利名稱:基于多因子小波神經(jīng)網(wǎng)絡(luò)模型的水文時(shí)間序列預(yù)測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種復(fù)雜時(shí)間序列預(yù)測(cè)方法,尤其涉及一種基于多因子小波神經(jīng)網(wǎng)絡(luò)模型的水文時(shí)間序列預(yù)測(cè)方法,屬于水文預(yù)報(bào)技術(shù)領(lǐng)域。
背景技術(shù):
時(shí)間序列數(shù)據(jù)挖掘研究主要包括預(yù)測(cè)、分類、相似性搜索及序列模式挖掘,而復(fù)雜時(shí)間序列預(yù)測(cè)是數(shù)據(jù)挖掘領(lǐng)域具有挑戰(zhàn)性的問(wèn)題之一。解決復(fù)雜時(shí)間序列預(yù)測(cè)問(wèn)題的一個(gè)較好的方法是基于小波神經(jīng)網(wǎng)絡(luò)模型的時(shí)間序列預(yù)測(cè)方法。小波分析是Rmrier分析發(fā)展史上的一個(gè)里程碑式的進(jìn)展,具有時(shí)、頻同時(shí)局部化的優(yōu)點(diǎn),因此被譽(yù)為數(shù)學(xué)“顯微鏡”。與傅立葉分析僅能夠提供頻域表示相比較,小波變換能夠同時(shí)提供時(shí)頻局部化特征,且克服了短時(shí)傅立葉變換的分辨率有限的缺點(diǎn)。離散小波分解可以對(duì)時(shí)間序列進(jìn)行多尺度分解,能夠提取不同頻率區(qū)間的成分序列,實(shí)現(xiàn)對(duì)時(shí)間序列的分頻研究。借助于小波的多分辨分解功能,可以從原始序列得到分辨率“從粗到細(xì)” 的多尺度特征,通過(guò)對(duì)這些小波特征的學(xué)習(xí)可以對(duì)時(shí)間序列的潛在的多因素變化過(guò)程有更加顯性的描述,所以網(wǎng)絡(luò)更加容易“抓住”輸入和輸出數(shù)據(jù)之間的內(nèi)在的聯(lián)系和規(guī)律。相反,基于傳統(tǒng)的單分辨率學(xué)習(xí)的網(wǎng)絡(luò)通常很難描述復(fù)雜的時(shí)間序列,例如混沌序列,其收斂速度慢,泛化能力差。小波變換將復(fù)雜的時(shí)間序列分解成若干不同頻率的細(xì)節(jié)信號(hào)和背景信號(hào),細(xì)節(jié)信號(hào)是高頻部分,背景信號(hào)是低頻部分,它們是原始時(shí)間序列在不同頻率區(qū)間上的表現(xiàn),相對(duì)原始序列的比重不同,因而對(duì)原始時(shí)間序列的預(yù)測(cè)起到的作用不同。小波網(wǎng)絡(luò)模型結(jié)合了小波分析的在信號(hào)處理上的時(shí)間域-頻率域的多分辨性,和神經(jīng)網(wǎng)絡(luò)的強(qiáng)大的非線性逼近特性,兼有二者的優(yōu)點(diǎn)。以上述方式建立的模型稱為小波網(wǎng)絡(luò)模型(Wavelet Network Model),簡(jiǎn)記為 WNN。很多學(xué)者對(duì)小波網(wǎng)絡(luò)模型對(duì)不同領(lǐng)域的時(shí)間序列預(yù)測(cè)進(jìn)行了研究,例如[Chen Yue—hui,Yang Bo, Dong Ji-wen. Time-series prediction using a local linear wavelet neural network. Neurocomputing,2006,69 (6) :449-465]、[Dash P.K., Nayak Maya, Senapati M. R.,et al,Mining for similarities in time series data using wavelet-based feature vectors and neural networks, Engineering Applications of Artificial Intelligence,2007,20 (2) :185-201]Λ [Gan Xiaobing, Liu Ying, and Austin Francis R. :A prediction method for time series based on wavelet neural networks. Proceedings of CIS2005,pp :902-908]、[Benaouda D.,Murtagh Fionn,and Starck Jean-Luc, et al. Wavelet-based nonlinear multiscale decomposition model for electricity load forecasting. Neurocomputing,2006,70 (1-3) :139-154]、[Chen Di ;Feng Hai-Hang ;Lin Qing-jia ;et al, Multi-scale Internet traffic prediction using wavelet neural network combined model, Proceedings of First International Conference on Communications and Networking in China,2006,pp :1_5]、[李愛國(guó),覃征,滑動(dòng)窗口二次自回歸模型預(yù)測(cè)非線性時(shí)間序列,計(jì)算機(jī)學(xué)報(bào),2004,27 (07) 1004-1008]等。但這些文獻(xiàn)僅僅是利用小波分解對(duì)單道時(shí)間序列進(jìn)行分解。僅僅依靠預(yù)測(cè)時(shí)間序列自身提供的信息,對(duì)于預(yù)測(cè)精度提高的作用具有一定局限性。而在物理意義上,一個(gè)系統(tǒng)內(nèi)的多時(shí)間序列往往具有相關(guān)性。水文預(yù)報(bào)(例如徑流預(yù)報(bào))對(duì)水資源的調(diào)配管理和防洪減災(zāi)的決策有著重要的意義。然而由于氣候和下墊面等因素的綜合影響,徑流表現(xiàn)出復(fù)雜的非線性和非平穩(wěn)性特征, 一般包括確定性成分和隨機(jī)成分。神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的處理大規(guī)模復(fù)雜非線性動(dòng)力學(xué)系統(tǒng)的能力,被廣泛用于河道水情預(yù)報(bào),可以識(shí)別水流運(yùn)動(dòng)變化過(guò)程與其影響因子之間的復(fù)雜非線性關(guān)系,為河道水情預(yù)報(bào)提供了一條新的途徑。徑流序列自身的組成比較復(fù)雜,在一個(gè)徑流中含有多種頻率成份,所以有必要對(duì)其進(jìn)行分頻率研究,而小波變換的方法提供了一種便利的時(shí)頻分析技術(shù)。小波和神經(jīng)網(wǎng)絡(luò)結(jié)合使用的方法近年來(lái)得到廣泛關(guān)注,利用此組合模型進(jìn)行水文預(yù)測(cè)成為研究熱點(diǎn)。文獻(xiàn)[王文圣,熊華康,丁晶,日流量預(yù)測(cè)的小波網(wǎng)絡(luò)模型初探,水科學(xué)進(jìn)展,2004,15 (3) =382-386]中提出了一種小波網(wǎng)絡(luò)模型用于對(duì)日流量進(jìn)行預(yù)測(cè)。該小波網(wǎng)絡(luò)模型是在三層神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,以t時(shí)刻原始信號(hào)分解的小波系數(shù)KdH,《,O作為輸入,以t+T時(shí)刻的原始信號(hào)f (t+T)為輸出而構(gòu)建的模型(T是預(yù)見期)。然而該小波網(wǎng)絡(luò)模型也僅利用單時(shí)間序列分解出來(lái)的小波系數(shù),對(duì)未來(lái)進(jìn)行預(yù)測(cè), 模型的預(yù)測(cè)能力是有限的。由于從原始時(shí)間序列分解出來(lái)的小波系數(shù),已經(jīng)包含對(duì)時(shí)間序列前期變化中長(zhǎng)時(shí)間記憶和短時(shí)間記憶,加入更多的前期小波系數(shù)往往不能夠?qū)︻A(yù)測(cè)目標(biāo)起到更好的輔助作用。而且前期小波系數(shù)的加入,使得模式輸入個(gè)數(shù)增加,相應(yīng)的訓(xùn)練模式集的復(fù)雜度也增加,對(duì)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的確定和訓(xùn)練時(shí)間提出更高要求。對(duì)于更加復(fù)雜時(shí)間序列,僅僅根據(jù)本時(shí)間序列的前期小波系數(shù),不能對(duì)時(shí)間序列未來(lái)的演變進(jìn)行更好的刻畫。 徑流實(shí)際上跟系統(tǒng)內(nèi)的其他水文要素具有相關(guān)關(guān)系,如上下游關(guān)系站或相關(guān)站的水文要素 (包括流量、水位、氣溫和降水等)對(duì)徑流產(chǎn)生具有明顯的影響關(guān)系。不同領(lǐng)域的時(shí)間序列數(shù)據(jù)具有不同特性,僅利用同一種小波函數(shù)進(jìn)行分解是不合適的。文獻(xiàn)[桑燕芳,王棟,水文序列小波分析中小波函數(shù)選擇方法,水利學(xué)報(bào),2008, 39(3) =295-300]從序列重構(gòu)角度,應(yīng)用蒙特卡羅方法,通過(guò)模擬數(shù)據(jù)以及黃河利津站和浙江白溪流域的實(shí)測(cè)水文序列,探討小波分析影響小波函數(shù)選擇的因素,進(jìn)而建立合理選擇小波函數(shù)的依據(jù)。研究結(jié)果表明序列自身的變化特性是小波函數(shù)選擇的重要影響因素。文獻(xiàn)[劉素一,權(quán)先璋,張勇傳,不同小波函數(shù)對(duì)徑流分析結(jié)果的影響,水電能源科學(xué),2003, 21(1) :29-31.]通過(guò)訓(xùn)練多尺度預(yù)測(cè)模型的實(shí)驗(yàn)方法,對(duì)比了幾種小波函數(shù)對(duì)多尺度框架下徑流預(yù)測(cè)的影響。對(duì)于不同數(shù)據(jù),特別是大量數(shù)據(jù)情況下,使用這種類似特征選擇中的 Wrapper方法確定最優(yōu)的小波函數(shù)比較耗時(shí)。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題在于克服現(xiàn)有技術(shù)以單一時(shí)間序列作為小波神經(jīng)網(wǎng)絡(luò)模型的輸入進(jìn)行水文時(shí)間序列預(yù)測(cè)的不足,提供一種基于多因子小波神經(jīng)網(wǎng)絡(luò)模型的水文時(shí)間序列預(yù)測(cè)方法。本發(fā)明的基于多因子小波神經(jīng)網(wǎng)絡(luò)模型的水文時(shí)間序列預(yù)測(cè)方法,首先根據(jù)待預(yù)測(cè)的水文時(shí)間序列建立小波神經(jīng)網(wǎng)絡(luò)水文時(shí)間序列預(yù)測(cè)模型,然后按照建立的預(yù)測(cè)模型進(jìn)行水文時(shí)間序列預(yù)測(cè),其特征在于,所述小波神經(jīng)網(wǎng)絡(luò)水文時(shí)間序列預(yù)測(cè)模型為多因子小波神經(jīng)網(wǎng)絡(luò)水文時(shí)間序列預(yù)測(cè)模型,以多時(shí)間序列信息作為輸入,不僅包括預(yù)測(cè)目標(biāo)時(shí)間序列的當(dāng)前小波系數(shù),還包括與此時(shí)間序列相關(guān)的其它時(shí)間序列的當(dāng)前小波系數(shù)。進(jìn)一步地,所述與預(yù)測(cè)目標(biāo)時(shí)間序列相關(guān)的其它時(shí)間序列,是根據(jù)其與預(yù)測(cè)目標(biāo)時(shí)間序列之間互信息(mutual information)作為評(píng)判兩者相關(guān)性的度量,互信息值較大, 則相關(guān)性強(qiáng);具體按照以下方法確定步驟1、提供與待預(yù)測(cè)序列0可能有關(guān)的若干原始輸入序列I1,I2,. . .,h,n是輸入序列數(shù)目;步驟2、對(duì)待預(yù)測(cè)序列0和原始輸入序列II,12,...,h進(jìn)行離散化,得到離散序列 Do, Dl, D2,…,Dn ;步驟3、分別計(jì)算Do與Dl,D2,. . .,Dn之間的互信息,結(jié)果記為Ml,M2,. . .,Mn ;步驟4、根據(jù)Ml,M2,· · ·,Mn,選擇Mi > Th的原始輸入序列Ii作為待預(yù)測(cè)序列小波神經(jīng)網(wǎng)絡(luò)建模時(shí)的相關(guān)序列,i為1到N之間的整數(shù);Th為預(yù)先設(shè)定的閾值。更進(jìn)一步地,所述多因子小波神經(jīng)網(wǎng)絡(luò)水文時(shí)間序列預(yù)測(cè)模型中所使用的小波函數(shù)按照以下方法確定步驟1、分別使用待選的小波函數(shù)構(gòu)建小波神經(jīng)網(wǎng)絡(luò)水文時(shí)間序列預(yù)測(cè)模型并進(jìn)行預(yù)測(cè);步驟2、對(duì)于每一種待選的小波函數(shù),分別按照以下方法得到相關(guān)系數(shù)向量對(duì)不同水平上的小波分解序列,分別統(tǒng)計(jì)預(yù)測(cè)目標(biāo)時(shí)間序列的小波序列自相關(guān)系數(shù),以及預(yù)測(cè)目標(biāo)時(shí)間序列和與預(yù)測(cè)目標(biāo)時(shí)間序列相關(guān)的其它時(shí)間序列的小波系數(shù)序列的相關(guān)系數(shù);最后采用加權(quán)的方法綜合各個(gè)水平上的相關(guān)系數(shù),得到相關(guān)系數(shù)向量;步驟3、根據(jù)采用各小波函數(shù)預(yù)測(cè)所得到的相關(guān)系數(shù)向量,確定最終使用的小波函數(shù)。其中,兩個(gè)時(shí)間序列的相關(guān)系數(shù),按照以下方法得到假設(shè)兩個(gè)時(shí)間序列分別為〈X⑴,XQ),. . .,X(n) >、<Y(1),Y(2),. . . ,Y (η) >,時(shí)間序列的長(zhǎng)度為N ;則這兩個(gè)時(shí)間序列之間的相關(guān)系數(shù)按照下式計(jì)算,
權(quán)利要求
1.一種基于多因子小波神經(jīng)網(wǎng)絡(luò)模型的水文時(shí)間序列預(yù)測(cè)方法,該方法首先根據(jù)待預(yù)測(cè)的水文時(shí)間序列建立小波神經(jīng)網(wǎng)絡(luò)水文時(shí)間序列預(yù)測(cè)模型,然后按照建立的預(yù)測(cè)模型進(jìn)行水文時(shí)間序列預(yù)測(cè),其特征在于,所述小波神經(jīng)網(wǎng)絡(luò)水文時(shí)間序列預(yù)測(cè)模型為多因子小波神經(jīng)網(wǎng)絡(luò)水文時(shí)間序列預(yù)測(cè)模型,以多時(shí)間序列信息作為輸入,不僅包括預(yù)測(cè)目標(biāo)時(shí)間序列的當(dāng)前小波系數(shù),還包括與此時(shí)間序列相關(guān)的其它時(shí)間序列的當(dāng)前小波系數(shù)。
2.如權(quán)利要求1所述基于多因子小波神經(jīng)網(wǎng)絡(luò)模型的水文時(shí)間序列預(yù)測(cè)方法,其特征在于,所述與預(yù)測(cè)目標(biāo)時(shí)間序列相關(guān)的其它時(shí)間序列,是根據(jù)其與預(yù)測(cè)目標(biāo)時(shí)間序列之間互信息作為評(píng)判兩者相關(guān)性的度量,互信息值較大,則相關(guān)性強(qiáng);具體按照以下方法確定步驟1、提供與待預(yù)測(cè)序列0可能有關(guān)的若干原始輸入序列II,12,…,In,η是輸入序列數(shù)目;步驟2、對(duì)待預(yù)測(cè)序列0和原始輸入序列II,12,-,In進(jìn)行離散化,得到離散序列 Do,Dl,D2, ".,Dn ;步驟3、分別計(jì)算Do與Dl, D2, ...,Dn之間的互信息,結(jié)果記為Ml, M2, ...,Mn ;步驟4、根據(jù)Ml,M2,-,Mn,選擇Mi>Th的原始輸入序列Ii作為待預(yù)測(cè)序列小波神經(jīng)網(wǎng)絡(luò)建模時(shí)的相關(guān)序列,i為1到N之間的整數(shù);Th為預(yù)先設(shè)定的閾值。
3.如權(quán)利要求2所述基于多因子小波神經(jīng)網(wǎng)絡(luò)模型的水文時(shí)間序列預(yù)測(cè)方法,其特征在于,采用等概率劃分法對(duì)待預(yù)測(cè)序列0和原始輸入序列II,12,…,h進(jìn)行離散化。
4.如權(quán)利要求2所述基于多因子小波神經(jīng)網(wǎng)絡(luò)模型的水文時(shí)間序列預(yù)測(cè)方法,其特征在于,所述閾值Th的值為0.15。
5.如權(quán)利要求1一4任一項(xiàng)所述基于多因子小波神經(jīng)網(wǎng)絡(luò)模型的水文時(shí)間序列預(yù)測(cè)方法,其特征在于,所述多因子小波神經(jīng)網(wǎng)絡(luò)水文時(shí)間序列預(yù)測(cè)模型中所使用的小波函數(shù)按照以下方法確定步驟1、分別使用待選的小波函數(shù)構(gòu)建小波神經(jīng)網(wǎng)絡(luò)水文時(shí)間序列預(yù)測(cè)模型并進(jìn)行預(yù)測(cè);步驟2、對(duì)于每一種待選的小波函數(shù),分別按照以下方法得到相關(guān)系數(shù)向量對(duì)不同水平上的小波分解序列,分別統(tǒng)計(jì)預(yù)測(cè)目標(biāo)時(shí)間序列的小波序列自相關(guān)系數(shù), 以及預(yù)測(cè)目標(biāo)時(shí)間序列和與預(yù)測(cè)目標(biāo)時(shí)間序列相關(guān)的其它時(shí)間序列的小波系數(shù)序列的相關(guān)系數(shù);最后采用加權(quán)的方法綜合各個(gè)水平上的相關(guān)系數(shù),得到相關(guān)系數(shù)向量;步驟3、根據(jù)采用各小波函數(shù)預(yù)測(cè)所得到的相關(guān)系數(shù)向量,確定最終使用的小波函數(shù)。
6.如權(quán)利要求5所述基于多因子小波神經(jīng)網(wǎng)絡(luò)模型的水文時(shí)間序列預(yù)測(cè)方法,其特征在于,兩個(gè)時(shí)間序列的相關(guān)系數(shù),按照以下方法得到假設(shè)兩個(gè)時(shí)間序列分別為(2),1..,1( ) >、<7(1),7(2),...,7( ) > ,時(shí)間序列的長(zhǎng)度為N ;則這兩個(gè)時(shí)間序列之間的相關(guān)系數(shù)按照下式計(jì)算,式中,"Ρ 是兩個(gè)序列時(shí)滯為T的相關(guān)系數(shù),ι是第一個(gè)序列的均值-是第二個(gè)序列的均值;單個(gè)時(shí)間序列的時(shí)滯為T的自相關(guān)系數(shù),按照以下方法得到 將該時(shí)間序列向右移動(dòng)T個(gè)位置生成一個(gè)新的時(shí)間序列,然后按照上式計(jì)算該時(shí)間序列與新生成的時(shí)間序列的相關(guān)系數(shù),得到的相關(guān)系數(shù)即為該時(shí)間序列時(shí)滯為T的自相關(guān)系數(shù)。
全文摘要
本發(fā)明公開了一種基于多因子小波神經(jīng)網(wǎng)絡(luò)模型的水文時(shí)間序列預(yù)測(cè)方法。本發(fā)明提出了一種多因子小波神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型用于水文時(shí)間序列預(yù)測(cè),該模型以多時(shí)間序列信息作為輸入,不僅包括預(yù)測(cè)目標(biāo)時(shí)間序列的當(dāng)前小波系數(shù),還包括與此時(shí)間序列相關(guān)的其它時(shí)間序列的當(dāng)前小波系數(shù),并根據(jù)其與預(yù)測(cè)目標(biāo)時(shí)間序列之間互信息作為評(píng)判兩者相關(guān)性的度量,選擇相關(guān)性強(qiáng)的其它時(shí)間序列;進(jìn)一步利用基于加權(quán)相關(guān)系數(shù)的小波函數(shù)選擇標(biāo)準(zhǔn),為該模型選擇最優(yōu)的小波函數(shù)。相比現(xiàn)有技術(shù),本發(fā)明方法具有更高的預(yù)測(cè)準(zhǔn)確性,以及更好的可擴(kuò)展性和實(shí)用價(jià)值。
文檔編號(hào)G06N3/02GK102323970SQ201110130040
公開日2012年1月18日 申請(qǐng)日期2011年5月19日 優(yōu)先權(quán)日2011年5月19日
發(fā)明者萬(wàn)定生, 馮鈞, 朱躍龍, 李士進(jìn), 王繼民, 范青松 申請(qǐng)人:河海大學(xué)