本發(fā)明涉及智能化燃?xì)夤芾?,具體涉及一種燃?xì)鈿饬款A(yù)測(cè)方法、系統(tǒng)及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著城市化進(jìn)程的加快和居民生活水平的不斷提高,燃?xì)庾鳛橐环N清潔能源在日常生活中的使用越來(lái)越廣泛。然而,傳統(tǒng)的燃?xì)庥昧坎杉椒ㄔ诿鎸?duì)復(fù)雜多變的市場(chǎng)需求時(shí)顯得力不從心。傳統(tǒng)的燃?xì)庥昧坎杉蕾囉诔韱T的人工入戶抄表,這種方式不僅效率低下,而且在某些情況下由于用戶不在家或其它原因?qū)е鲁韱T無(wú)法進(jìn)入戶內(nèi)抄表,只能依靠估算來(lái)填補(bǔ)數(shù)據(jù)空白。這種估值方法往往缺乏科學(xué)依據(jù),依賴于抄表員或管理人員的經(jīng)驗(yàn)和歷史數(shù)據(jù)來(lái)進(jìn)行粗略估計(jì),這種方法雖然簡(jiǎn)單易行,但容易造成較大的偏差,進(jìn)而影響后續(xù)的數(shù)據(jù)分析和決策制定——對(duì)于燃?xì)庥脩舳?,?huì)導(dǎo)致計(jì)費(fèi)不準(zhǔn),造成經(jīng)濟(jì)損失;對(duì)于燃?xì)夤?yīng)商而言,會(huì)導(dǎo)致燃?xì)夤?yīng)量規(guī)劃不準(zhǔn),使得供應(yīng)過(guò)?;蚬?yīng)不足,從而增加運(yùn)營(yíng)成本。
2、而還有的基于趨勢(shì)分析方法、季節(jié)性調(diào)整方法的燃?xì)庥昧抗浪惴椒?,其中,趨?shì)分析則是通過(guò)對(duì)歷史用氣量的長(zhǎng)期跟蹤來(lái)尋找規(guī)律,以此推斷未來(lái)的需求變化,這種方法能夠在一定程度上捕捉到用氣量的趨勢(shì)走向,但對(duì)于突發(fā)性事件或非周期性變化的預(yù)測(cè)能力較弱。季節(jié)性調(diào)整則是在趨勢(shì)分析的基礎(chǔ)上加入了季節(jié)因素的影響,考慮到了一年中不同季節(jié)對(duì)燃?xì)庑枨蟮挠绊?,例如冬季取暖需求增加而夏季需求減少的現(xiàn)象,但這種方法仍然存在明顯的局限性,即它高度依賴于過(guò)去的數(shù)據(jù),并假定未來(lái)的變化趨勢(shì)與歷史保持一致,忽略了外部環(huán)境的變化對(duì)用氣量的潛在影響。
3、綜上所述,現(xiàn)有的燃?xì)庥昧抗浪惴椒ūM管在一定程度上解決了部分問(wèn)題,但仍存在明顯的缺陷——過(guò)于依賴歷史同期數(shù)據(jù),無(wú)法應(yīng)對(duì)數(shù)據(jù)突變,存在估算/預(yù)測(cè)誤差;在多因素考慮方面也存在不足,未能全面涵蓋影響用氣量的所有因素。因此,亟需一種新的技術(shù)手段來(lái)彌補(bǔ)這一不足,以確保燃?xì)夤?yīng)能力與需求相匹配。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明意在提供一種燃?xì)鈿饬款A(yù)測(cè)方法、系統(tǒng)及存儲(chǔ)介質(zhì),能夠智能預(yù)測(cè)燃?xì)庥昧?,并能夠達(dá)到較高的預(yù)測(cè)效率和預(yù)測(cè)精度。
2、為達(dá)到上述目的,本發(fā)明提供如下基礎(chǔ)方案。
3、方案一
4、一種燃?xì)鈿饬款A(yù)測(cè)方法,包括以下步驟:
5、步驟1,采集基礎(chǔ)燃?xì)鈹?shù)據(jù)集;所述基礎(chǔ)燃?xì)鈹?shù)據(jù)集包括歷史燃?xì)庥昧?,以及,與歷史燃?xì)庥昧肯鄬?duì)應(yīng)的時(shí)間特征數(shù)據(jù)、地理特征數(shù)據(jù)和用戶特征數(shù)據(jù);
6、步驟2,預(yù)處理基礎(chǔ)燃?xì)鈹?shù)據(jù)集,并從中提取目標(biāo)特征,并組成目標(biāo)數(shù)據(jù)集;
7、步驟3,構(gòu)建預(yù)測(cè)模型;采用xgboost對(duì)預(yù)測(cè)模型進(jìn)行訓(xùn)練,通過(guò)訓(xùn)練優(yōu)化,得到最終的預(yù)測(cè)模型;并且,在訓(xùn)練過(guò)程中,基于目標(biāo)數(shù)據(jù)集進(jìn)行一階段訓(xùn)練;基于目標(biāo)數(shù)據(jù)集中的歷史燃?xì)庥昧繛?的關(guān)聯(lián)特征數(shù)據(jù),進(jìn)行二階段訓(xùn)練;
8、步驟4,采用預(yù)測(cè)模型進(jìn)行燃?xì)鈿饬款A(yù)測(cè)。
9、方案二
10、一種燃?xì)鈿饬款A(yù)測(cè)系統(tǒng),用于執(zhí)行如方案一所述的一種燃?xì)鈿饬款A(yù)測(cè)方法;包括采集模塊、數(shù)據(jù)處理模塊、模型構(gòu)建模塊和預(yù)測(cè)模塊;
11、所述采集模塊用于采集基礎(chǔ)燃?xì)鈹?shù)據(jù)集;所述基礎(chǔ)燃?xì)鈹?shù)據(jù)集包括歷史燃?xì)庥昧浚约?,與歷史燃?xì)庥昧肯鄬?duì)應(yīng)的時(shí)間特征數(shù)據(jù)、地理特征數(shù)據(jù)和用戶特征數(shù)據(jù);
12、所述數(shù)據(jù)處理模塊用于預(yù)處理基礎(chǔ)燃?xì)鈹?shù)據(jù)集,并從中提取目標(biāo)特征,并組成目標(biāo)數(shù)據(jù)集;所述模型構(gòu)建模塊用于構(gòu)建預(yù)測(cè)模型;采用xgboost對(duì)預(yù)測(cè)模型進(jìn)行訓(xùn)練,通過(guò)訓(xùn)練優(yōu)化,得到最終的預(yù)測(cè)模型;并且,在訓(xùn)練過(guò)程中,基于目標(biāo)數(shù)據(jù)集進(jìn)行一階段訓(xùn)練;基于目標(biāo)數(shù)據(jù)集中的歷史燃?xì)庥昧繛?的關(guān)聯(lián)特征數(shù)據(jù),進(jìn)行二階段訓(xùn)練;
13、所述預(yù)測(cè)模塊中設(shè)有最終的預(yù)測(cè)模型,所述預(yù)測(cè)模型用于進(jìn)行燃?xì)鈿饬款A(yù)測(cè)。
14、方案三
15、一種存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如方案一所述的一種燃?xì)鈿饬款A(yù)測(cè)方法。
16、本發(fā)明的工作原理及優(yōu)點(diǎn)在于:
17、本方案引入多源歷史數(shù)據(jù)作為基礎(chǔ)燃?xì)鈹?shù)據(jù)集,結(jié)合歷史用氣數(shù)據(jù)和其他相關(guān)特征,利用先進(jìn)的機(jī)器學(xué)習(xí)算法,構(gòu)建預(yù)測(cè)模型來(lái)精準(zhǔn)預(yù)測(cè)用戶的月度用氣量,能夠提高估抄的準(zhǔn)確性,實(shí)現(xiàn)燃?xì)庥昧康闹悄茴A(yù)測(cè);并且,預(yù)測(cè)模型還可以用于不同地區(qū)不同時(shí)間段內(nèi)的燃?xì)庑枨罅?,為燃?xì)夤?yīng)方提供數(shù)據(jù)參考,以便于燃?xì)夤?yīng)方及時(shí)調(diào)整供應(yīng)量,避免供不應(yīng)求或供過(guò)于求的情況發(fā)生。其中,預(yù)測(cè)模型的構(gòu)建及訓(xùn)練基于xgboost進(jìn)行,基于xgboost的分布式梯度增強(qiáng)特性,能夠快速執(zhí)行訓(xùn)練過(guò)程,模型訓(xùn)練效率較高。
18、重點(diǎn)在于,本方案還特別關(guān)注了目前燃?xì)庥昧抗浪阒械乃嬖诂F(xiàn)實(shí)問(wèn)題——針對(duì)極端用氣情況(如燃?xì)庥昧繕O大或極?。┑墓乐挡环€(wěn)定問(wèn)題,對(duì)于模型算法而言,基于大數(shù)據(jù)的通用預(yù)測(cè)模型往往會(huì)受到歷史數(shù)據(jù)分布(特別是占比更大的常規(guī)用氣情況數(shù)據(jù)分布)的影響,導(dǎo)致對(duì)于實(shí)際燃?xì)庥昧繕O?。ɑ?yàn)?)的用戶的預(yù)測(cè)值偏大等,導(dǎo)致常規(guī)的預(yù)測(cè)模型在本領(lǐng)域表現(xiàn)不佳。而本方案則在設(shè)置特定模型的基礎(chǔ)上,設(shè)置了兩階段的訓(xùn)練步驟;通過(guò)一階段的訓(xùn)練,可以獲得表現(xiàn)最佳的預(yù)測(cè)模型,再通過(guò)二階段的訓(xùn)練,可以使得模型進(jìn)一步定向?qū)W習(xí)極端用氣情況,進(jìn)而挑選得到的最終預(yù)測(cè)模型能夠應(yīng)對(duì)特殊的燃?xì)庥昧壳闆r(如長(zhǎng)期未用氣的用戶情況),保證后續(xù)對(duì)于不同類型的用戶均保有較高的預(yù)測(cè)精準(zhǔn)度。
1.一種燃?xì)鈿饬款A(yù)測(cè)方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種燃?xì)鈿饬款A(yù)測(cè)方法,其特征在于,所述用戶特征數(shù)據(jù)包括:用戶類型;所述用戶類型包括采暖型用戶和非采暖型用戶。
3.根據(jù)權(quán)利要求1所述的一種燃?xì)鈿饬款A(yù)測(cè)方法,其特征在于,所述預(yù)處理包括以下步驟:數(shù)據(jù)清洗、特征構(gòu)建和數(shù)據(jù)轉(zhuǎn)換;所述數(shù)據(jù)清洗包括處理缺失值、異常值和錯(cuò)誤數(shù)據(jù);
4.根據(jù)權(quán)利要求3所述的一種燃?xì)鈿饬款A(yù)測(cè)方法,其特征在于,在處理缺失值時(shí),當(dāng)歷史燃?xì)庥昧康某¢g隔為2個(gè)月時(shí),按照趨勢(shì)性分配原則,確認(rèn)單月的歷史燃?xì)庥昧浚划?dāng)歷史燃?xì)庥昧康某¢g隔為大于等于3個(gè)月時(shí),按照平均分配原則,確認(rèn)單月的歷史燃?xì)庥昧俊?/p>
5.根據(jù)權(quán)利要求3所述的一種燃?xì)鈿饬款A(yù)測(cè)方法,其特征在于,在步驟4中,在采用預(yù)測(cè)模型進(jìn)行某一用戶的燃?xì)鈿饬款A(yù)測(cè)時(shí),還包括預(yù)判步驟:遍歷該用戶的歷史燃?xì)庥昧浚魵v史燃?xì)庥昧恐写嬖谔囟ㄌ卣?,且特定特征的出現(xiàn)時(shí)段貼近預(yù)測(cè)時(shí)刻,則直接輸出該用戶的燃?xì)鈿饬繛?,并為該用戶附加校驗(yàn)標(biāo)記,以便復(fù)核。
6.根據(jù)權(quán)利要求1所述的一種燃?xì)鈿饬款A(yù)測(cè)方法,其特征在于,還包括步驟5:校驗(yàn)步驟4中的燃?xì)鈿饬款A(yù)測(cè)結(jié)果,并在預(yù)測(cè)結(jié)果符合預(yù)設(shè)條件時(shí),觸發(fā)對(duì)應(yīng)的結(jié)果反饋步驟。
7.根據(jù)權(quán)利要求6所述的一種燃?xì)鈿饬款A(yù)測(cè)方法,其特征在于,所述預(yù)設(shè)條件包括:預(yù)測(cè)結(jié)果中用戶的燃?xì)鈿饬啃∮?方;對(duì)應(yīng)的結(jié)果反饋步驟為:調(diào)取該用戶的目標(biāo)關(guān)聯(lián)數(shù)據(jù);所述目標(biāo)關(guān)聯(lián)數(shù)據(jù)包括:貼近預(yù)測(cè)時(shí)刻的用電數(shù)據(jù)和用水?dāng)?shù)據(jù);若目標(biāo)關(guān)聯(lián)數(shù)據(jù)均小于預(yù)設(shè)基準(zhǔn)值,則判定本預(yù)測(cè)結(jié)果合理,不做處理;若目標(biāo)關(guān)聯(lián)數(shù)據(jù)均大于預(yù)設(shè)基準(zhǔn)值,則判定本預(yù)測(cè)結(jié)果不合理,為該用戶附加校驗(yàn)標(biāo)記,以便復(fù)核。
8.根據(jù)權(quán)利要求7所述的一種燃?xì)鈿饬款A(yù)測(cè)方法,其特征在于,所述預(yù)設(shè)條件還包括:預(yù)測(cè)結(jié)果中用戶的燃?xì)鈿饬看笥?00方;對(duì)應(yīng)的結(jié)果反饋步驟為:調(diào)取該用戶的歷史燃?xì)庥昧?,并進(jìn)行趨勢(shì)分析,得到參考趨勢(shì);若預(yù)測(cè)結(jié)果符合參考趨勢(shì),則判定本預(yù)測(cè)結(jié)果合理,不做處理;若預(yù)測(cè)結(jié)果不符合參考趨勢(shì),則判定本預(yù)測(cè)結(jié)果不合理,為該用戶附加校驗(yàn)標(biāo)記,以便復(fù)核。
9.一種燃?xì)鈿饬款A(yù)測(cè)系統(tǒng),其特征在于,用于執(zhí)行如權(quán)利要求1-8任一項(xiàng)所述的一種燃?xì)鈿饬款A(yù)測(cè)方法;包括采集模塊、數(shù)據(jù)處理模塊、模型構(gòu)建模塊和預(yù)測(cè)模塊;
10.一種存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-8任一項(xiàng)所述的一種燃?xì)鈿饬款A(yù)測(cè)方法。