本發(fā)明涉及電力數(shù)據(jù)技術(shù)領(lǐng)域,更具體地說,涉及一種基于日累計(jì)發(fā)行電量的短期售電量預(yù)測(cè)方法,還涉及一種基于日累計(jì)發(fā)行電量的短期售電量預(yù)測(cè)系統(tǒng)。
背景技術(shù):
月度售電量預(yù)測(cè)是電力需求側(cè)管理重要的市場預(yù)測(cè)技術(shù)手段,精準(zhǔn)的售電量預(yù)測(cè)有利于公司制定有效的經(jīng)營計(jì)劃,能否準(zhǔn)確的預(yù)測(cè)售電量,對(duì)電力公司全年經(jīng)營管理及全年經(jīng)濟(jì)效益有著較大影響。短期售電量由于受天氣、經(jīng)濟(jì)等外部因素的波動(dòng)影響較大,在目前外部因素波動(dòng)難以預(yù)測(cè)的情況下,短期售電量預(yù)測(cè)準(zhǔn)確性不高,特別是出現(xiàn)外部因素異常時(shí),預(yù)測(cè)準(zhǔn)確度無法滿足電力公司的要求,預(yù)測(cè)不準(zhǔn)確容易對(duì)決策者造成誤導(dǎo),導(dǎo)致公司效益受損。
目前,對(duì)于短期售電量預(yù)測(cè),主要有環(huán)比預(yù)測(cè)法與同比預(yù)測(cè)法兩種方法:第一,環(huán)比預(yù)測(cè)法,環(huán)比預(yù)測(cè)法是通過分析兩個(gè)相鄰月份(當(dāng)月及前一個(gè)月)的日累計(jì)發(fā)行電量數(shù)據(jù)的比例關(guān)系,預(yù)測(cè)當(dāng)月售電量的方法。例如,今日為2016年10月22日,公司已獲取10月21日的發(fā)行電量數(shù)據(jù),若要預(yù)測(cè)2016年10月的月度售電量,記2016年10月21日日累計(jì)發(fā)行電量為x20161021與2016年9月21日日累計(jì)發(fā)行電量為x20160921,令K1為二者的比值利用該比值K1,可以預(yù)測(cè)2016年10月的月度售電量為K1*P201609,其中P201609為2016年9月的月度售電量。該方法的缺點(diǎn)是:1、受天氣和節(jié)假日天數(shù)變化影響較大;2、受各月天數(shù)不同影響較大;3、由于預(yù)測(cè)結(jié)果完全依賴于一天的累計(jì)電量數(shù)據(jù),每天的預(yù)測(cè)結(jié)果波動(dòng)較大,該方法的預(yù)測(cè)結(jié)果誤差也較大。第二,同比預(yù)測(cè)法,同比預(yù)測(cè)法是通過分析當(dāng)月日累計(jì)發(fā)行電量和去年相同月份的日累計(jì)發(fā)行電量數(shù)據(jù)的比例關(guān)系,預(yù)測(cè)當(dāng)月售電量的方法。例如今日為2016年10月22日,公司已獲取10月21日的發(fā)行電量數(shù)據(jù)。若要預(yù)測(cè)2016年10月的月度售電量,記2016年10月21日日累計(jì)發(fā)行電量為x20161021與2015年10月21日日累計(jì)發(fā)行電量為x20151021,令K2為二者的比值利用該比值K2,可以預(yù)測(cè)2016年10月的月度售電量為K2*P201510,其中,P201510為2015年10月月度售電量。該方法的缺點(diǎn)是:由于預(yù)測(cè)結(jié)果完全依賴于一天的累計(jì)電量數(shù)據(jù),每天的預(yù)測(cè)結(jié)果波動(dòng)較大,預(yù)測(cè)誤差也較大。
現(xiàn)有的基于日累計(jì)發(fā)行電量的短期售電量預(yù)測(cè)方法,存在的問題如下:1、在數(shù)據(jù)預(yù)處理方面,并沒有做異常值剔除、缺失值處理等操作,影響了預(yù)測(cè)結(jié)果的穩(wěn)定性;2、在預(yù)測(cè)方法方面,由于僅利用一天的日累計(jì)電量數(shù)據(jù),同比預(yù)測(cè)法與環(huán)比預(yù)測(cè)法預(yù)測(cè)誤差較大并且預(yù)測(cè)結(jié)果的波動(dòng)也較大;3、預(yù)測(cè)結(jié)果的修正方面,目前方法并沒有考慮對(duì)預(yù)測(cè)結(jié)果進(jìn)行誤差修正。
因此,如何提高基于日累計(jì)發(fā)行電量的預(yù)測(cè)短期售電量的準(zhǔn)確率是本領(lǐng)域技術(shù)人員急需要解決的技術(shù)問題。
技術(shù)實(shí)現(xiàn)要素:
為解決上述技術(shù)問題,本發(fā)明提供一種基于日累計(jì)發(fā)行電量的短期售電量預(yù)測(cè)方法,提高基于日累計(jì)發(fā)行電量的預(yù)測(cè)短期售電量的準(zhǔn)確率。
為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
一種基于日累計(jì)發(fā)行電量的短期售電量預(yù)測(cè)方法,包括:
步驟S1:建立關(guān)于預(yù)測(cè)月份的日累計(jì)發(fā)行電量與去年同期日累計(jì)發(fā)行電量的線性函數(shù)關(guān)系,其中所述預(yù)測(cè)月份的日累計(jì)發(fā)行電量作為應(yīng)變量,所述去年同期日累計(jì)發(fā)行電量為自變量;
步驟S2:將所述預(yù)測(cè)月份的首日至預(yù)測(cè)日的日累計(jì)發(fā)行電量數(shù)據(jù)以及去年同期日累計(jì)發(fā)行電量數(shù)據(jù)代入所述線性函數(shù)關(guān)系,計(jì)算模型參數(shù);
步驟S3:將所述模型參數(shù)代入所述線性函數(shù)關(guān)系,得到短期售電量線性模型;
步驟S4:將去年同期月份最后一天的日累計(jì)發(fā)行電量數(shù)據(jù)代入所述短期售電量線性模型中,得到預(yù)測(cè)月售電量。
優(yōu)選的,在上述方法中,所述步驟S2中,采用最小二乘法算法計(jì)算所述模型參數(shù)。
優(yōu)選的,在上述方法中,所述步驟S4之后,還包括:
若所述預(yù)測(cè)日發(fā)生了變化,則相應(yīng)的對(duì)建模數(shù)據(jù)進(jìn)行更新,得到更新后的短期售電量線性模型。
優(yōu)選的,在上述方法中,所述步驟S2之前,還包括:
將所述預(yù)測(cè)月份的首日至預(yù)測(cè)日的日累計(jì)發(fā)行電量數(shù)據(jù)以及去年同期日累計(jì)發(fā)行電量數(shù)據(jù)進(jìn)行異常值識(shí)別以及缺失值填補(bǔ)。
優(yōu)選的,在上述方法中,利用箱線圖法對(duì)所述預(yù)測(cè)月份的首日至預(yù)測(cè)日的日累計(jì)發(fā)行電量數(shù)據(jù)以及去年同期日累計(jì)發(fā)行電量數(shù)據(jù)進(jìn)行異常值識(shí)別。
優(yōu)選的,在上述方法中,所述步驟S4之后,還包括:利用馬爾科夫鏈對(duì)所述預(yù)測(cè)月售電量進(jìn)行誤差修正。
本發(fā)明提供了一種基于日累計(jì)發(fā)行電量的短期售電量預(yù)測(cè)系統(tǒng),包括:
函數(shù)關(guān)系建立模塊,用于建立關(guān)于預(yù)測(cè)月份的日累計(jì)發(fā)行電量與去年同期日累計(jì)發(fā)行電量的線性函數(shù)關(guān)系,其中所述預(yù)測(cè)月份的日累計(jì)發(fā)行電量作為應(yīng)變量,所述去年同期日累計(jì)發(fā)行電量為自變量;
計(jì)算模塊:用于將所述預(yù)測(cè)月份的首日至預(yù)測(cè)日的日累計(jì)發(fā)行電量數(shù)據(jù)以及去年同期日累計(jì)發(fā)行電量數(shù)據(jù)代入所述線性函數(shù)關(guān)系,計(jì)算模型參數(shù);
模型建立模塊:用于將所述模型參數(shù)代入所述線性函數(shù)關(guān)系,得到短期售電量線性模型;
預(yù)測(cè)模塊,用于將去年同期月份最后一天的日累計(jì)發(fā)行電量數(shù)據(jù)代入所述短期售電量線性模型中,得到預(yù)測(cè)月售電量。
優(yōu)選的,在上述系統(tǒng)中,還包括:
更新模塊,用于若所述預(yù)測(cè)日發(fā)生了變化,則相應(yīng)的對(duì)建模數(shù)據(jù)進(jìn)行更新,得到更新后的短期售電量線性模型。
優(yōu)選的,在上述系統(tǒng)中,還包括:
數(shù)據(jù)處理模塊,用于將所述預(yù)測(cè)月份的首日至預(yù)測(cè)日的日累計(jì)發(fā)行電量數(shù)據(jù)以及去年同期日累計(jì)發(fā)行電量數(shù)據(jù)進(jìn)行異常值識(shí)別以及缺失值填補(bǔ)。
優(yōu)選的,在上述系統(tǒng)中,還包括:
誤差修正模塊,用于利用馬爾科夫鏈對(duì)所述預(yù)測(cè)月售電量進(jìn)行誤差修正。
從上述技術(shù)方案可以看出,本發(fā)明所提供的一種基于日累計(jì)發(fā)行電量的短期售電量預(yù)測(cè)方法,包括:步驟S1:建立關(guān)于預(yù)測(cè)月份的日累計(jì)發(fā)行電量與去年同期日累計(jì)發(fā)行電量的線性函數(shù)關(guān)系,其中所述預(yù)測(cè)月份的日累計(jì)發(fā)行電量作為應(yīng)變量,所述去年同期日累計(jì)發(fā)行電量為自變量;步驟S2:將所述預(yù)測(cè)月份的首日至預(yù)測(cè)日的日累計(jì)發(fā)行電量數(shù)據(jù)以及去年同期日累計(jì)發(fā)行電量數(shù)據(jù)代入所述線性函數(shù)關(guān)系,計(jì)算模型參數(shù);步驟S3:將所述模型參數(shù)代入所述線性函數(shù)關(guān)系,得到短期售電量線性模型;步驟S4:將去年同期月份最后一天的日累計(jì)發(fā)行電量數(shù)據(jù)代入所述短期售電量線性模型中,得到預(yù)測(cè)月售電量。
利用從每月首日開始至預(yù)測(cè)日的所有日累計(jì)發(fā)行電量數(shù)據(jù)和去年同期月份的日累計(jì)發(fā)行電量數(shù)據(jù)進(jìn)行回歸分析,得到短期售電量線性模型,避免了由于一天的電量數(shù)據(jù)波動(dòng)較大導(dǎo)致預(yù)測(cè)結(jié)果波動(dòng)也大的問題,使得每天加入最新日期累計(jì)發(fā)行電量數(shù)據(jù)后的預(yù)測(cè)結(jié)果保持穩(wěn)定。由于日累計(jì)電量曲線與去年同期月份的日累計(jì)電量曲線相關(guān)性較強(qiáng),有明顯的規(guī)律,因此將去年同期月份最后一天的日累計(jì)發(fā)行電量數(shù)據(jù)代入所述短期售電量線性模型中,得到預(yù)測(cè)月售電量,能夠?qū)﹄娏镜亩唐谑垭娏窟M(jìn)行準(zhǔn)確預(yù)測(cè)。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例提供的一種基于日累計(jì)發(fā)行電量的短期售電量預(yù)測(cè)方法示意圖;
圖2為本發(fā)明實(shí)施例提供的2016年10月日累計(jì)售電量發(fā)展規(guī)律示意圖;
圖3為本發(fā)明實(shí)施例提供的一種基于日累計(jì)發(fā)行電量的短期售電量預(yù)測(cè)系統(tǒng)的結(jié)構(gòu)框圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
請(qǐng)參閱圖1,圖1為本發(fā)明實(shí)施例提供的一種基于日累計(jì)發(fā)行電量的短期售電量預(yù)測(cè)方法示意圖。
在一種具體實(shí)施方式中,為了有足夠的樣本構(gòu)建預(yù)測(cè)模型,從每月16日起利用本發(fā)明提出的預(yù)測(cè)方法進(jìn)行當(dāng)月的售電量預(yù)測(cè),后續(xù)每天增加一個(gè)數(shù)據(jù)樣本,隨著樣本數(shù)量增多,售電量預(yù)測(cè)精度將不斷提高。此外,經(jīng)過調(diào)研和對(duì)歷史數(shù)據(jù)分析發(fā)現(xiàn),電力公司的抄表例日和電量電費(fèi)發(fā)行日期幾乎沒有變化,因此本發(fā)明將電力公司去年同期月份的發(fā)行完日期作為今年預(yù)測(cè)月份的發(fā)行完日期,獲得今年發(fā)行完日期的日累計(jì)電量后,將該電量作為本月的售電量預(yù)測(cè)值,不再對(duì)當(dāng)月的售電量進(jìn)行預(yù)測(cè)。
提供一種基于日累計(jì)發(fā)行電量的短期售電量預(yù)測(cè)方法,包括如下步驟:
步驟S1:建立關(guān)于預(yù)測(cè)月份的日累計(jì)發(fā)行電量與去年同期日累計(jì)發(fā)行電量的線性函數(shù)關(guān)系,其中,所述預(yù)測(cè)月份的日累計(jì)發(fā)行電量作為應(yīng)變量,所述去年同期日累計(jì)發(fā)行電量為自變量。
記預(yù)測(cè)月份的日累計(jì)發(fā)行電量數(shù)據(jù)為yi,這里i為日期,如2016年10月21日的日累計(jì)發(fā)行電量為y20161021;記去年同期的日累計(jì)發(fā)行電量數(shù)據(jù)為xi,這里i為日期,如2015年10月21日的日累計(jì)發(fā)行電量為x20151021,建立線性模型yi=kxi+b,k和b為常數(shù)系數(shù)。
步驟S2:將所述預(yù)測(cè)月份的首日至預(yù)測(cè)日的日累計(jì)發(fā)行電量數(shù)據(jù)以及去年同期日累計(jì)發(fā)行電量數(shù)據(jù)代入所述線性函數(shù)關(guān)系,計(jì)算模型參數(shù);
線性回歸是利用數(shù)理統(tǒng)計(jì)中的回歸分析,來確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法之一。變量間的相關(guān)關(guān)系若果存在線性相關(guān)關(guān)系,則由實(shí)驗(yàn)數(shù)據(jù)所得到的數(shù)據(jù)點(diǎn)將散布在某一條直線周圍,可以用一條直線近似表示。
采用最小二乘法算法估計(jì)線性模型中的系數(shù)k和b的值,對(duì)于線性模型,最小二乘法公式為:
其中n為數(shù)據(jù)條數(shù),例如,當(dāng)利用了當(dāng)月1-21日和去年同期月份1-21日的數(shù)據(jù)建立線性模型時(shí),n為21,求解方程(1)可得到模型系數(shù)為:
若獲取了2016年10月1-21日的日累計(jì)售電量,則可以利用2016年10月1日至10月21日的日累計(jì)發(fā)行電量數(shù)據(jù)和2015年10月1日至2015年10月21日的日
累計(jì)發(fā)行電量數(shù)據(jù)進(jìn)行建模,得到如下所示21組數(shù)據(jù)對(duì)作為訓(xùn)練集建立線性模型:(x20151001,y20161001),(x20151002,y20161002)......(x20151021,y20161021)。
步驟S3:將所述模型參數(shù)代入所述線性函數(shù)關(guān)系,得到短期售電量線性模型。
步驟S4:將去年同期月份最后一天的日累計(jì)發(fā)行電量數(shù)據(jù)代入所述短期售電量線性模型中,得到預(yù)測(cè)月售電量。
得到線性模型后,將同期月份月末日的日累計(jì)電量(月末日的累計(jì)電量即為該月的售電量)代入線性模型中,記為第i日預(yù)測(cè)的當(dāng)月月度售電量數(shù)值,這里i為日期,如為利用了2016年10月1-21日的日累計(jì)電量數(shù)據(jù)預(yù)測(cè)的2016年10月售電量預(yù)測(cè)結(jié)果:
此外,利用構(gòu)建的線性模型可以對(duì)后續(xù)每天的日累計(jì)電量進(jìn)行預(yù)測(cè),從而得到當(dāng)月后續(xù)幾天的日累計(jì)售電量發(fā)展規(guī)律,如圖2所示。
進(jìn)一步的,在上述方法中,所述步驟S2中,采用最小二乘法算法計(jì)算所述模型參數(shù)。最小二乘法又稱最小平方法,通過最小化誤差的平方和尋找數(shù)據(jù)的最佳函數(shù)匹配。利用最小二乘法可以簡便的求得未知數(shù)據(jù),并使的這些求得的數(shù)據(jù)與實(shí)際數(shù)據(jù)之間的誤差平方和為最小,最小二乘法一般用于曲線擬合。
在上述方法的基礎(chǔ)上,所述步驟S4之后,還包括:
若所述預(yù)測(cè)日發(fā)生了變化,則相應(yīng)的對(duì)建模數(shù)據(jù)進(jìn)行更新,得到更新后的短期售電量線性模型。
當(dāng)有新增數(shù)據(jù)時(shí),進(jìn)行增量式預(yù)測(cè),如新增了2016年10月22日的數(shù)據(jù),將最新數(shù)據(jù)對(duì)(x20151022,y20161022)加入模型訓(xùn)練集中,利用更新后的數(shù)據(jù)重新建立線性模型。得到更新后的線性模型后,將2015年10月31日的發(fā)行電量數(shù)據(jù)代入線性模型中,可更新得到利用了2016年10月1-22日的日累計(jì)電量數(shù)據(jù)預(yù)測(cè)的月度售電量結(jié)果:
每天新增日累計(jì)發(fā)行電量數(shù)據(jù)后,通過回歸預(yù)測(cè)可得到從10月16日開始直到發(fā)行日期前一天的月度售電量預(yù)測(cè)序列,發(fā)行日期的累計(jì)電量數(shù)據(jù)獲取后由于當(dāng)月電量已經(jīng)發(fā)行完,因此發(fā)行日期后不再進(jìn)行預(yù)測(cè)。利用本發(fā)明提出的方法可以從每月的16號(hào)后,每日對(duì)月售電量進(jìn)行預(yù)測(cè),采用增量式預(yù)測(cè),可以在越接近發(fā)行日期時(shí),預(yù)測(cè)精度越高。以2016年10月為例,利用本發(fā)明的預(yù)測(cè)方法可以得到月度售電量預(yù)測(cè)序列:
在上述方法的基礎(chǔ)上,所述步驟S2之前,還包括:
將所述預(yù)測(cè)月份的首日至預(yù)測(cè)日的日累計(jì)發(fā)行電量數(shù)據(jù)以及去年同期日累計(jì)發(fā)行電量數(shù)據(jù)進(jìn)行異常值識(shí)別以及缺失值填補(bǔ)。
其中,為了避免個(gè)別異常值對(duì)預(yù)測(cè)結(jié)果產(chǎn)生影響,需要對(duì)歷史日累計(jì)發(fā)行電量數(shù)據(jù)中的異常值進(jìn)行識(shí)別和處理。
用箱型圖法進(jìn)行異常值識(shí)別和處理,具體算法過程如下:
設(shè)X=x(i)(i為日期)為日累計(jì)發(fā)行電量數(shù)據(jù),其中i為日期,如x(20161010)為第2016年10月10日的日累計(jì)發(fā)行電量數(shù)據(jù)。
由于日累計(jì)發(fā)行電量數(shù)據(jù)為累計(jì)數(shù)據(jù),因此肯定有x(i+1)>=x(i),對(duì)于不滿足該不等式的數(shù)據(jù),利用插值法進(jìn)行替換,如若存在x(i+1)<x(i),則令x(i+1)=(x(i+2)+x(i))/2對(duì)x(i+1)進(jìn)行填補(bǔ)。
對(duì)于參與建模的日累計(jì)發(fā)行數(shù)據(jù)x(i)進(jìn)行一階差分,即得到日發(fā)行電量u(i)=x(i)-x(i-1),這里對(duì)所有一階差分?jǐn)?shù)據(jù)除去要判斷是否為異常值的數(shù)據(jù)進(jìn)行分箱,確定其上下邊界,即:
up=Q2+1.5*(Q3-Q1) (5)
down=Q2-1.5*(Q3-Q1) (6)
其中,Q2表示u(i)的均值,Q3表示u(i)的上四分位數(shù),Q1表示u(i)的下四分位數(shù)。
判斷目標(biāo)差分?jǐn)?shù)據(jù)是否在界限內(nèi),若存在連續(xù)兩個(gè)差分?jǐn)?shù)據(jù)都不在界限內(nèi),則判定兩個(gè)中的第一個(gè)差分?jǐn)?shù)據(jù)所在時(shí)間點(diǎn)的日累計(jì)發(fā)行電量數(shù)據(jù)為異常值。識(shí)別出異常值后,采用插值法進(jìn)行替換。
對(duì)于數(shù)據(jù)中缺失值,如若數(shù)據(jù)x(i)缺失,則令x(i)=(x(i-2)+x(i+1))/2對(duì)x(i)進(jìn)行填補(bǔ),若第一個(gè)數(shù)據(jù)x(j)(j為序列中第一個(gè)數(shù)據(jù)的日期)缺失,令x(j)=x(j+1)進(jìn)行填補(bǔ);若最后一個(gè)數(shù)據(jù)x(k)(k為序列中最后一個(gè)數(shù)據(jù)的日期)缺失,令x(k)=x(k-1)進(jìn)行填補(bǔ)。
進(jìn)一步的,在上述方法中,利用箱線圖法對(duì)所述預(yù)測(cè)月份的首日至預(yù)測(cè)日的日累計(jì)發(fā)行電量數(shù)據(jù)以及去年同期日累計(jì)發(fā)行電量數(shù)據(jù)進(jìn)行異常值識(shí)別。
其中,箱型圖又稱為箱線圖、盒式圖,是一種用作顯示一組數(shù)據(jù)分散情況資料的統(tǒng)計(jì)圖,因形狀如箱子而得名,在各種領(lǐng)域中也經(jīng)常被使用,常見于品質(zhì)管理。箱型圖利用數(shù)據(jù)中五個(gè)統(tǒng)計(jì)量:最小值、第一四分位數(shù)、中位數(shù)、第三四分位數(shù)和最大值來描述數(shù)據(jù),可以看出數(shù)據(jù)是否具有對(duì)稱性,分布的分散情況等信息,也可以直觀明了的識(shí)別數(shù)據(jù)中的異常值。
利用箱線圖法進(jìn)行異常值識(shí)別,并對(duì)異常值和缺失值進(jìn)行處理,從而提高建模數(shù)據(jù)質(zhì)量,避免異常值和缺失值干擾預(yù)測(cè)結(jié)果。當(dāng)然,需要指出的是,包括但不限于箱線圖法對(duì)其進(jìn)行異常值識(shí)別,還可以利用其它方法,均在保護(hù)范圍內(nèi)。
進(jìn)一步的,在上述方法中,所述步驟S4之后,還包括:利用馬爾科夫鏈對(duì)所述預(yù)測(cè)月售電量進(jìn)行誤差修正。
其中,馬爾科夫鏈?zhǔn)侵笖?shù)學(xué)中具有馬爾科夫性質(zhì)的離散事件隨機(jī)過程。馬爾科夫性質(zhì)是指在已知當(dāng)前狀態(tài)(現(xiàn)在)的條件下,它的未來演變(將來)不依賴于它以前的演變(過去)。
利用馬爾科夫鏈對(duì)歷史預(yù)測(cè)誤差進(jìn)行建模,構(gòu)建誤差修正模型,對(duì)預(yù)測(cè)月售電量進(jìn)行誤差修正,從而提升預(yù)測(cè)準(zhǔn)確度。當(dāng)然,需要指出的是,包括但不限于馬爾科夫鏈對(duì)其進(jìn)行誤差修正,還可以利用其它方法,均在保護(hù)范圍內(nèi)。
本發(fā)明中用馬爾科夫進(jìn)行預(yù)測(cè)誤差修正,具體步驟如下:
步驟1:獲取絕對(duì)誤差序列樣本。
對(duì)2016年10月a日的售電量預(yù)測(cè)結(jié)果進(jìn)行修正,首選需要獲取2014年9月開始的每個(gè)a日的預(yù)測(cè)誤差,記a日的預(yù)測(cè)結(jié)果絕對(duì)誤差序列為
βa={δ201409a,δ201410a,...,δ201609a} (7)
例如,對(duì)于每個(gè)月,利用當(dāng)月日累計(jì)發(fā)行電量數(shù)據(jù)和歷史同期數(shù)據(jù)均可以形成對(duì)月度售電量的一個(gè)預(yù)測(cè)序列(i為日期),預(yù)測(cè)序列從每月16日開始直至發(fā)行日期前一天:
若需要預(yù)測(cè)2016年10月的月度售電量,計(jì)算從2014年9月至2016年9月的月度預(yù)測(cè)序列令
這里Pj為j月的月度售電量真實(shí)值,j為i日的月份,βi為預(yù)測(cè)值的誤差,根據(jù)上述方法可計(jì)算得到2014年9月至2016年9月的所有預(yù)測(cè)值的誤差δi。
由于每個(gè)誤差值均是從16日開始直至發(fā)行日期前一天結(jié)束,因此可按照日期篩選出從16日至發(fā)行日期前一天的誤差集合:{β16,β17,...,β發(fā)行日期-1},這里βa為從2014年9月至2016年9月所有月份a日的誤差集合,例如21日的誤差集合為:
β21={δ20140921,δ20141021,...,δ20160921} (9)
步驟2:利用均值方差法對(duì)預(yù)測(cè)結(jié)果的絕對(duì)誤差序列狀態(tài)區(qū)間劃分;
對(duì)于預(yù)測(cè)結(jié)果的絕對(duì)誤差序列βa,記其均值為均方差為s,利用均值-均方差分級(jí)法后,一般可將序列劃分為5級(jí):其中a1,a4取值在[1.0,1.5]中取值,a2,a3在[0.3,0.6]中取值。
步驟3:計(jì)算馬爾科夫預(yù)測(cè)誤差狀態(tài)概率轉(zhuǎn)移矩陣;
根據(jù)馬爾科夫理論,考慮樣本的絕對(duì)誤差數(shù)據(jù),每一天有多個(gè)誤差狀態(tài)可能發(fā)生,若誤差在Ei的范圍內(nèi),則事件處于狀態(tài)Ei;誤差從第一天的Ei變成第二天的Ej的概率,也就是狀態(tài)Ei經(jīng)過1步變成Ej的概率為:
式中:為樣本中預(yù)測(cè)誤差從Ei一步轉(zhuǎn)移到Ej的轉(zhuǎn)移次數(shù);Ni為狀態(tài)Ei出現(xiàn)的總次數(shù)(若Ni=0,則),則1步狀態(tài)概率轉(zhuǎn)移矩陣為
k步狀態(tài)概率轉(zhuǎn)移矩陣,Pk=(P(1))k,狀態(tài)概率轉(zhuǎn)移矩陣是一個(gè)n階方陣,具有兩個(gè)特點(diǎn):
矩陣各元素非負(fù)性;
即矩陣每行之和為1。
步驟4:根據(jù)狀態(tài)概率轉(zhuǎn)移矩陣計(jì)算出未來時(shí)刻預(yù)測(cè)誤差的狀態(tài)概率,得到誤差預(yù)測(cè)值。
以2016年09月a日的預(yù)測(cè)絕對(duì)誤差δ201609a所在的狀態(tài)作為初始狀態(tài),計(jì)算2016年10月a日的預(yù)測(cè)誤差狀態(tài)向量,初始狀態(tài)向量假設(shè)δ201609a所在狀態(tài)為E3,則
誤差狀態(tài)轉(zhuǎn)移一次后的預(yù)測(cè)絕對(duì)誤差的狀態(tài)向量為
誤差狀態(tài)轉(zhuǎn)移兩次后的預(yù)測(cè)絕對(duì)誤差的狀態(tài)向量為
分別找到或中概率最大的值:
找到一個(gè)概率最大的值所在的位置即是待預(yù)測(cè)的誤差所處的區(qū)間,取區(qū)間的均值即為誤差的預(yù)測(cè)值,E1取的一半即可,E5同理。若概率最大的值超過1個(gè),那么取誤差的預(yù)測(cè)值為這幾個(gè)最大值對(duì)應(yīng)區(qū)間的均值。
由于日發(fā)行電量數(shù)據(jù)中包含了本月天氣、經(jīng)濟(jì)等外部因素和售電量的變化信息,本發(fā)明提出了一種基于日累計(jì)發(fā)行電量的短期售電量預(yù)測(cè)方法,其基本思路分為三步:第一步,選擇預(yù)測(cè)月份的日累計(jì)發(fā)行電量數(shù)據(jù)與去年同期日累計(jì)發(fā)行電量數(shù)據(jù),對(duì)上述數(shù)據(jù)進(jìn)行預(yù)處理,包括利用箱線圖方法識(shí)別異常值,對(duì)異常值和缺失值進(jìn)行處理等。第二步,利用建立關(guān)于預(yù)測(cè)月份的日累計(jì)發(fā)行電量與去年同期日累計(jì)發(fā)行電量的線性函數(shù)關(guān)系,構(gòu)建短期售電量線性模型,并利用最小二乘法對(duì)模型參數(shù)進(jìn)行求解。第三步,利用馬爾科夫鏈誤差修正模型對(duì)預(yù)測(cè)結(jié)果進(jìn)行誤差修正。避免了由于一天的電量數(shù)據(jù)波動(dòng)較大導(dǎo)致預(yù)測(cè)結(jié)果波動(dòng)也大的問題,使得每天加入最新日期累計(jì)發(fā)行電量數(shù)據(jù)后的預(yù)測(cè)結(jié)果保持穩(wěn)定,能夠?qū)﹄娏镜亩唐谑垭娏窟M(jìn)行準(zhǔn)確預(yù)測(cè)。
下面對(duì)本發(fā)明實(shí)施例提供的一種基于日累計(jì)發(fā)行電量的短期售電量預(yù)測(cè)系統(tǒng)進(jìn)行介紹,下文描述的一種基于日累計(jì)發(fā)行電量的短期售電量預(yù)測(cè)系統(tǒng)與上文描述的一種基于日累計(jì)發(fā)行電量的短期售電量預(yù)測(cè)方法可相互對(duì)應(yīng)參照。
請(qǐng)參考圖3,圖3為本發(fā)明實(shí)施例所提供的一種基于日累計(jì)發(fā)行電量的短期售電量預(yù)測(cè)系統(tǒng)的結(jié)構(gòu)框圖;
函數(shù)關(guān)系建立模塊100,用于建立關(guān)于預(yù)測(cè)月份的日累計(jì)發(fā)行電量與去年同期日累計(jì)發(fā)行電量的線性函數(shù)關(guān)系,其中所述預(yù)測(cè)月份的日累計(jì)發(fā)行電量作為應(yīng)變量,所述去年同期日累計(jì)發(fā)行電量為自變量;
計(jì)算模塊200:用于將所述預(yù)測(cè)月份的首日至預(yù)測(cè)日的日累計(jì)發(fā)行電量數(shù)據(jù)以及去年同期日累計(jì)發(fā)行電量數(shù)據(jù)代入所述線性函數(shù)關(guān)系,計(jì)算模型參數(shù);
模型建立模塊300:用于將所述模型參數(shù)代入所述線性函數(shù)關(guān)系,得到短期售電量線性模型;
預(yù)測(cè)模塊400,用于將去年同期月份最后一天的日累計(jì)發(fā)行電量數(shù)據(jù)代入所述短期售電量線性模型中,得到預(yù)測(cè)月售電量。
進(jìn)一步的,在上述系統(tǒng)中,還包括:
更新模塊,用于若所述預(yù)測(cè)日發(fā)生了變化,則相應(yīng)的對(duì)建模數(shù)據(jù)進(jìn)行更新,得到更新后的短期售電量線性模型。
進(jìn)一步的,在上述系統(tǒng)中,還包括:
數(shù)據(jù)處理模塊,用于將所述預(yù)測(cè)月份的首日至預(yù)測(cè)日的日累計(jì)發(fā)行電量數(shù)據(jù)以及去年同期日累計(jì)發(fā)行電量數(shù)據(jù)進(jìn)行異常值識(shí)別以及缺失值填補(bǔ)。
進(jìn)一步的,在上述系統(tǒng)中,還包括:
誤差修正模塊,用于利用馬爾科夫鏈對(duì)所述預(yù)測(cè)月售電量進(jìn)行誤差修正。
本說明書中各個(gè)實(shí)施例采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似部分互相參見即可。
對(duì)所公開的實(shí)施例的上述說明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本發(fā)明將不會(huì)被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開的原理和新穎特點(diǎn)相一致的最寬的范圍。