一種分治法與水質周期性結合的水質預測方法
【專利摘要】本發(fā)明公開了一種分治法與水質周期性結合的水質預測方法,屬于水質預測【技術領域】。本發(fā)明提出的水質預測方法針對單一預測器較難對水質數據的復雜變化規(guī)律進行充分學習,易造成預測精度不佳的問題,采用了基于數據驅動問題分解求解框架,該框架在學習過程中能夠根據數據特點對問題空間進行自主劃分,無需人工指定預測器數量,具有更好的魯棒性。通過將預測器效果評價及水質數據周期性進行融合,更好地利用了水質數據在時間尺度上的變化特點,實現(xiàn)了更加準確的問題分解算法。根據框架學習內容,將待預測的數據映射至對應具有預測優(yōu)勢的預測器組中,由對應的預測器加權得到預測結果,具有更好的準確性及穩(wěn)定性。
【專利說明】一種分治法與水質周期性結合的水質預測方法
【技術領域】
[0001]本發(fā)明屬于水質預測【技術領域】,涉及一種分治法與水質周期性結合的水質預測方法。
【背景技術】
[0002]水質預測是水資源管理中的重要一環(huán)。對水質變化規(guī)律的精確預測能夠實現(xiàn)對水質惡化及水華爆發(fā)等污染性事件進行預警,為相關決策提供參照。目前,水質預測方法主要分為兩類。第一類是基于水質機理中水流、物理、化學等因子的模型,如QUASAR及WASP等?;跈C理的模型較好地綜合考慮了水質所受到的各種環(huán)境因素,也在多個流域進行了應用,但其需要較為完備的觀測樣本及先驗知識,在不同流域中所受局限較大。同時,人工智能、機器學習理論的快速發(fā)展為我們提供了更多的預測方法,能夠在多變的環(huán)境下獲得較高的預測準確率。灰度模型(GM)能夠較好地處理時序數據,即使在數據量較小時也能夠保持較好的預測精度。人工神經網絡(ANN)通過具有以任意精度逼近任意非線性函數的能力,當訓練樣本充分多時可獲得精確的預測效果。在過去15年中,人工神經網絡被廣泛使用在水資源及環(huán)境工程領域的指數預測中,其中包含了不同構造的人工神經網絡,如BP神經網絡、RBF神經網絡等。支持向量機(SVM)也在水質預測領域中有所應用,由于參數選擇對支持向量機的預測效果影響較大,因此在將支持向量機與不同參數尋優(yōu)方法結合的水質預測研究方面也有許多研究,如基于遺傳算法的、基于粒子群的。
[0003]除使用單一預測模型的預測方法之外,使用多個預測模型的研究也已開展多年。由于水質數據變化復雜,具有在不同時間、季節(jié)呈現(xiàn)不同變化規(guī)律的特點,單一預測器較難對水質數據的復雜變化規(guī)律進行充分學習,易造成預測精度不佳。而集成預測模型則可將多個預測器聯(lián)合并增強,以獲得更好的學習效果。在水質預測方面,基于多模型集成的研究也是業(yè)界的熱點。如Partalas等人提出的基于貪婪選擇的水質集成預測算法;Faruk將人工神經網絡算法同ARIMA算法混合以處理水質預測問題中的線性部分及非線性部分;孫兆兵等也提出了基于概率組合的水質集成預測模型。
[0004]如上述所提到的研究,通常在集成模型中,對每個子預測器都需進行一次完全的訓練,因此訓練時間也顯著地增加了。同時,尋找子預測器中的差異并對其確定權重是集成模型中的關鍵,因為每個子預測器均被訓練為解決同一個問題。而采用問題分解的分治法可以將整個問題分為若干個子問題,之后對規(guī)模較小的子問題再進行特定的訓練,具有較少的訓練時間。相對地,尋找合適的問題分解算法是分治法的關鍵。
[0005]對水質預測問題來說,因水質數據復雜多變,分解后的子問題數量難以進行人工指定。而基于數據驅動,通過挖掘數據本身特點對模型進行自調整,可以實現(xiàn)對因此具有自適應問題分解能力的分解算法更適合解決水質預測問題。王國胤等提出了基于NARA模型的并行神經網絡結構(PNN),其問題分解算法能夠根據訓練數據的特點,通過各個網絡的擬合情況反應數據的特點,基于數據驅動自行決定問題的劃分及問題分解的數量。其在雙螺旋識別問題上的良好表現(xiàn)也證明PNN算法具有較好的問題分解能力,適用于特征變化復雜的數據集。但當處理水質數據時,PNN算法仍需進行改進以更好地適應水質數據的特征。
【發(fā)明內容】
[0006]有鑒于此,本發(fā)明的目的在于提供一種分治法與水質周期性結合的水質預測方法,該方法針對單一預測器較難對水質數據的復雜變化規(guī)律進行充分學習,易造成預測精度不佳的問題,提出了基于數據驅動問題分解求解框架,并且通過將預測器效果評價及水質數據周期性進行融合,更好地利用了水質數據在時間尺度上的變化特點,實現(xiàn)了更加準確的問題分解算法。
[0007]為達到上述目的,本發(fā)明提供如下技術方案:
[0008]一種分治法與水質周期性結合的水質預測方法,包括以下步驟:步驟一:對原始水質數據進行預處理;步驟二 =DDM-ERM預測模型訓練;步驟三=DDM-ERM模型輸出,在DDM-ERM模型訓練完畢之后,獲得對各個樣本組的子預測器組及其對應權重,對于待預測的樣本,首先根據其所處時間計算出對應樣本組,再將其作為對應樣本組的預測器組輸入,獲取其加權輸出即為模型的預測結果。
[0009]進一步,在步驟一中,DDM-ERM使用固定長度滑動窗口算法從原始水質數據中生成子序列數據并進行一步向前預測,通過將時間序列數據轉化為多個短時子序列數據,更好地對水質變化規(guī)律進行充分學習;設水質時間序列數據中相鄰數據的時間間隔為Tinteval,而某時刻的水質情況與之前Tpm時間內的水質情況呈顯著相關,則在進行一步向前預測時,
取滑動窗口長度為
【權利要求】
1.一種分治法與水質周期性結合的水質預測方法,其特征在于:包括以下步驟: 步驟一:對原始水質數據進行預處理; 步驟二 =DDM-ERM預測模型訓練; 步驟三=DDM-ERM模型輸出,在DDM-ERM模型訓練完畢之后,獲得對各個樣本組的子預測器組及其對應權重,對于待預測的樣本,首先根據其所處時間計算出對應樣本組,再將其作為對應樣本組的預測器組輸入,獲取其加權輸出即為模型的預測結果。
2.根據權利要求1所述的一種分治法與水質周期性結合的水質預測方法,其特征在于:在步驟一中,DDM-ERM使用固定長度滑動窗口算法從原始水質數據中生成子序列數據并進行一步向前預測,通過將時間序列數據轉化為多個短時子序列數據,更好地對水質變化規(guī)律進行充分學習;設水質時間序列數據中相鄰數據的時間間隔為Tinteval,而某時刻的水質情況與之前Tpm時間內的水質情況呈顯著相關,則在進行一步向前預測時,取滑動窗口長度為;其具體步驟如下: 設r = [tit2...tk]為水質時間序列數據,滑動窗口長度為k,子序列集合C = 0 1)設置滑動窗口位置為1,此時位于滑動窗口內的水質數據集合為c= ItiIK= i<=k}; 2)將滑動窗口內的水質數據集合c轉化為一個m的子序列向量r,其中[tit2...tk_J作為該子序列r的輸入,而tk作為該子序列r的輸出; 3)將子序列向量r加入到子序列集合C中,將滑動窗口向后滑動一個單位,若滑動窗口位置P < = n-k則跳至第二步;否則輸出子序列集合C,算法結束; 經過長度為k的滑動窗口算法之后,長度為η的原始水質時間序列數據將會轉化為n-k個子序列數據;子序列數據將作為DDM-ERM模型的訓練及測試數據。
3.根據權利要求2所述的一種分治法與水質周期性結合的水質預測方法,其特征在于:在步驟一中,將同階段水質子序列聚合成組,以組作為問題劃分粒度的方案,以減少問題劃分的噪點,并對水質數據的周期性知識進行更充分的學習,具體包括: 對原始水質時間序列采用離散傅里葉變換,得到其頻域能量分布,取其能量峰值時頻率f,則其顯著周期長度/w7 = J; 在計算獲得數據顯著周期長度Ien之后,對子序列集合C = Ir1, r2,...rn},將其中子序列分為Ien組,每組內的子序列集合Gi = {rm|m = kXlen+i},其中k為大于等于O的整數,
4.根據權利要求3所述的一種分治法與水質周期性結合的水質預測方法,其特征在于:所述步驟二中的模型訓練具體包括以下步驟: 給定輸入子序列樣本集合S= (Ci 11 < = i < = len} 第一步:設置訓練集St = S, j = I ; 第二步:對各個備選的預測器CLRi,使用訓練集St進行訓練,得到各備選預測器在各組驗證集樣本上的均方誤差MREu ;第三步:根據各備選預測器在各組驗證機上的均方誤差MREpj,得到當前備選預測器中最優(yōu)預測器CLRk ; 第四步:根據最優(yōu)預測器CLRk的預測結果及當前訓練集St,計算得出未識別樣本組sunrecog.
5.根據權利要求4所述的一種分治法與水質周期性結合的水質預測方法,其特征在于:通過以下方式設置訓練集:對訓練樣本集合進行臨近擴展,以增加訓練樣本集合,消除局部周期波動性的影響,具體為: 設周期長度為len,臨近擴展長度為β,則對于訓練集S,在獲得預測器RLi對其對應驗證集的識別情況之后,有:
6.根據權利要求5所述的一種分治法與水質周期性結合的水質預測方法,其特征在于:在模型訓練過程的第二步和第三步中,將樣本分為訓練集及驗證集,以預測器對驗證集內的預測結果作為評價標準及輸出精確度的計算方式,具體為: 采取均方誤差作為誤差評價標準,設驗證集樣本組Gi中共有η個樣本,樣本k的期望輸出為Yk,加入預測器RLj后集成預測模型對其輸出為V 則其對驗證集樣本組Gi的均方誤差MREi, j為:
【文檔編號】G06Q50/06GK103886397SQ201410154826
【公開日】2014年6月25日 申請日期:2014年4月17日 優(yōu)先權日:2014年4月17日
【發(fā)明者】鄒軒, 王國胤, 傅劍宇, 吳迪, 茍光磊, 李鴻, 劉 文, 利節(jié) 申請人:中國科學院重慶綠色智能技術研究院