基于兩階段集成學(xué)習(xí)的風(fēng)電異常數(shù)據(jù)識(shí)別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于風(fēng)電領(lǐng)域,具體涉及一種基于兩階段集成學(xué)習(xí)的風(fēng)電異常數(shù)據(jù)識(shí)別方法。
【背景技術(shù)】
[0002]隨著風(fēng)力發(fā)電的大規(guī)模發(fā)展,風(fēng)電已由小規(guī)模、補(bǔ)充性電源向大規(guī)模、重要性電源的角色轉(zhuǎn)換。風(fēng)電的一系列研究例如風(fēng)功率預(yù)測(cè)、風(fēng)電消納等都需要一個(gè)高質(zhì)量的風(fēng)電數(shù)據(jù),亟需新的技術(shù)方法和手段,分析風(fēng)電數(shù)據(jù)特征,研究風(fēng)電異常數(shù)據(jù)的識(shí)別與原因,提高風(fēng)電數(shù)據(jù)質(zhì)量為后續(xù)研究打下基礎(chǔ)。風(fēng)電系統(tǒng)積累了大量實(shí)際測(cè)量和仿真計(jì)算數(shù)據(jù),但底層數(shù)據(jù)質(zhì)量普遍不高,因此,可以采用數(shù)據(jù)挖掘方法發(fā)現(xiàn)風(fēng)電異常數(shù)據(jù)規(guī)律,進(jìn)而對(duì)原始數(shù)據(jù)預(yù)處理,從而提高原始數(shù)據(jù)質(zhì)量。最常見的數(shù)據(jù)挖掘方法是聚類與分類,對(duì)于如何提高風(fēng)電數(shù)據(jù)異常識(shí)別的準(zhǔn)確率,如何選擇與組合合適的方法與模型是一個(gè)難以解決的問題。
【發(fā)明內(nèi)容】
[0003]本發(fā)明旨在至少解決上述技術(shù)問題之一。
[0004]為此,本發(fā)明的目的在于一種基于兩階段集成學(xué)習(xí)的風(fēng)電異常數(shù)據(jù)識(shí)別方法。
[0005]為了實(shí)現(xiàn)上述目的,本發(fā)明的第一方面的實(shí)施例公開了一種基于兩階段集成學(xué)習(xí)的風(fēng)電異常數(shù)據(jù)識(shí)別方法,包括以下步驟:S1:提取風(fēng)電異常數(shù)據(jù)參數(shù);S2:根據(jù)所述風(fēng)電異常數(shù)據(jù)參數(shù)生成訓(xùn)練樣本和測(cè)試樣本;S3:利用隨機(jī)森林訓(xùn)練所述訓(xùn)練樣本得到隨機(jī)森林模型:S4:根據(jù)所述隨機(jī)森林模型,利用梯度迭代決策樹訓(xùn)練所述訓(xùn)練樣本得到梯度迭代決策樹模型;以及S5:根據(jù)所述隨機(jī)森林模型和所述梯度迭代決策樹模型分別預(yù)測(cè)所述測(cè)試樣本得到預(yù)測(cè)結(jié)果。
[0006]根據(jù)本發(fā)明實(shí)施例的基于兩階段集成學(xué)習(xí)的風(fēng)電異常數(shù)據(jù)識(shí)別方法,提高了風(fēng)電異常數(shù)據(jù)識(shí)別的準(zhǔn)確率。
[0007]另外,根據(jù)本發(fā)明上述實(shí)施例的基于兩階段集成學(xué)習(xí)的風(fēng)電異常數(shù)據(jù)識(shí)別方法,還可以具有如下附加的技術(shù)特征:
[0008]進(jìn)一步地,所述風(fēng)電異常參數(shù)包括:風(fēng)速、風(fēng)功率、風(fēng)速風(fēng)功率隨時(shí)間的變化速率、樣本點(diǎn)的離群系數(shù)和樣本點(diǎn)的分位數(shù)統(tǒng)計(jì)結(jié)果。
[0009]進(jìn)一步地,所述步驟S2進(jìn)一步包括:通過風(fēng)電異常歷史記錄中的時(shí)間間隔來劃分所述訓(xùn)練樣本和所述測(cè)試樣本。
[0010]進(jìn)一步地,所述步驟S3進(jìn)一步包括:S301:使用原始的標(biāo)記值訓(xùn)練所述訓(xùn)練樣本;S302:調(diào)節(jié)所述訓(xùn)練樣本的正負(fù)比例和參數(shù)模型,得到所述隨機(jī)森林模型。
[0011]進(jìn)一步地,所述步驟S4進(jìn)一步包括:使用所述隨機(jī)森林模型的輸出作為所述訓(xùn)練樣本的目標(biāo)值,利用梯度迭代決策樹訓(xùn)練所述訓(xùn)練樣本并調(diào)節(jié)模型參數(shù),得到所述梯度迭代決策樹模型。
[0012]進(jìn)一步地,所述步驟S5進(jìn)一步包括:S501:根據(jù)所述隨機(jī)森林模型預(yù)測(cè)所述測(cè)試樣本得到第一預(yù)測(cè)中間值,根據(jù)所述梯度迭代決策樹模型預(yù)測(cè)所述測(cè)試樣本得到第二預(yù)測(cè)中間值;S502:對(duì)所述第一預(yù)測(cè)中間值和所述第二預(yù)測(cè)中間值求平均值得到所述預(yù)測(cè)結(jié)果O
[0013]本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。
【附圖說明】
[0014]本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
[0015]圖1是本發(fā)明一個(gè)實(shí)施例的訓(xùn)練梯度迭代決策樹模型的流程框圖;
[0016]圖2是本發(fā)明一個(gè)實(shí)施例的通過測(cè)試樣本得到測(cè)試結(jié)果的流程示意圖。
【具體實(shí)施方式】
[0017]下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。
[0018]在本發(fā)明的描述中,需要理解的是,術(shù)語(yǔ)“中心”、“縱向”、“橫向”、“上”、“下”、“前”、“后”、“左”、“右”、“豎直”、“水平”、“頂”、“底”、“內(nèi)”、“外”等指示的方位或位置關(guān)系為基于附圖所示的方位或位置關(guān)系,僅是為了便于描述本發(fā)明和簡(jiǎn)化描述,而不是指示或暗示所指的裝置或元件必須具有特定的方位、以特定的方位構(gòu)造和操作,因此不能理解為對(duì)本發(fā)明的限制。此外,術(shù)語(yǔ)“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性。
[0019]在本發(fā)明的描述中,需要說明的是,除非另有明確的規(guī)定和限定,術(shù)語(yǔ)“安裝”、“相連”、“連接”應(yīng)做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或一體地連接;可以是機(jī)械連接,也可以是電連接;可以是直接相連,也可以通過中間媒介間接相連,可以是兩個(gè)元件內(nèi)部的連通。對(duì)于本領(lǐng)域的普通技術(shù)人員而言,可以具體情況理解上述術(shù)語(yǔ)在本發(fā)明中的具體含義。
[0020]參照下面的描述和附圖,將清楚本發(fā)明的實(shí)施例的這些和其他方面。在這些描述和附圖中,具體公開了本發(fā)明的實(shí)施例中的一些特定實(shí)施方式,來表示實(shí)施本發(fā)明的實(shí)施例的原理的一些方式,但是應(yīng)當(dāng)理解,本發(fā)明的實(shí)施例的范圍不受此限制。相反,本發(fā)明的實(shí)施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。
[0021]以下結(jié)合附圖描述根據(jù)本發(fā)明實(shí)施例的基于兩階段集成學(xué)習(xí)的風(fēng)電異常數(shù)據(jù)識(shí)別方法。
[0022]第一階段模型的輸出作為第二階段模型的輸入,使得第一階段誤分類的樣本點(diǎn)在第二階段得以校正,從而提高了模型整體的準(zhǔn)確率。即,依照以下步驟解決:
[0023]步驟(I):提取風(fēng)電異常數(shù)據(jù)相關(guān)特征。
[0024]特征向量通常是風(fēng)速、風(fēng)功率、風(fēng)速風(fēng)功率隨時(shí)間的變化速率以及樣本點(diǎn)的離群系數(shù)(LOF)和樣本點(diǎn)的分位數(shù)統(tǒng)計(jì)結(jié)果。
[0025]步驟⑵:生成訓(xùn)練樣本和測(cè)試樣本。
[0026]通過已知的歷史記錄根據(jù)時(shí)間間隔來劃分訓(xùn)練樣本和測(cè)試樣本。樣本的輸入為步驟(I)中所提取的特征向量信息。輸出是數(shù)據(jù)異常與否的標(biāo)記:如I表示正常,O表示異常。
[0027]步驟(3):利用RF(隨機(jī)森林)訓(xùn)練樣本數(shù)據(jù)。
[0028]使用原始的標(biāo)記值y訓(xùn)練樣本數(shù)據(jù),調(diào)節(jié)訓(xùn)練樣本的正負(fù)比例以及模型參數(shù),得到最優(yōu)的RF模型,模型輸出為y - yRFO
[0029]步驟(4):利用GBDT (梯度迭代決策樹)訓(xùn)練樣本數(shù)據(jù)。
[0030]使用步驟⑶的輸出y-yR^為樣本目標(biāo)值,再利用GBDT訓(xùn)練樣本數(shù)據(jù),調(diào)節(jié)模型參數(shù),得到最優(yōu)的GBDT模型。
[0031]步驟(5):利用RF、GBDT兩種模型分別預(yù)測(cè)測(cè)試樣本。
[0032]使用步驟(3)所得到的RF模型預(yù)測(cè)測(cè)試樣本得到測(cè)試結(jié)果為yRF,使用步驟(4)所得到的GBDT模型預(yù)測(cè)測(cè)試樣本得到的測(cè)試結(jié)果為y(;BDT,最終所得預(yù)測(cè)結(jié)果為兩者的平均值,即 ypredict — (Y Rf+yCBDT)/2。
[0033]另外,本發(fā)明實(shí)施例的基于兩階段集成學(xué)習(xí)的風(fēng)電異常數(shù)據(jù)識(shí)別方法的其它構(gòu)成以及作用對(duì)于本領(lǐng)域的技術(shù)人員而言都是已知的,為了減少冗余,不做贅述。
[0034]在本說明書的描述中,參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中,對(duì)上述術(shù)語(yǔ)的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。
[0035]盡管已經(jīng)示出和描述了本發(fā)明的實(shí)施例,本領(lǐng)域的普通技術(shù)人員可以理解:在不脫離本發(fā)明的原理和宗旨的情況下可以對(duì)這些實(shí)施例進(jìn)行多種變化、修改、替換和變型,本發(fā)明的范圍由權(quán)利要求及其等同限定。
【主權(quán)項(xiàng)】
1.一種基于兩階段集成學(xué)習(xí)的風(fēng)電異常數(shù)據(jù)識(shí)別方法,其特征在于,包括以下步驟: S1:提取風(fēng)電異常數(shù)據(jù)參數(shù); 52:根據(jù)所述風(fēng)電異常數(shù)據(jù)參數(shù)生成訓(xùn)練樣本和測(cè)試樣本; 53:利用隨機(jī)森林訓(xùn)練所述訓(xùn)練樣本得到隨機(jī)森林模型: 54:根據(jù)所述隨機(jī)森林模型,利用梯度迭代決策樹訓(xùn)練所述訓(xùn)練樣本得到梯度迭代決策樹模型;以及 55:根據(jù)所述隨機(jī)森林模型和所述梯度迭代決策樹模型分別預(yù)測(cè)所述測(cè)試樣本得到預(yù)測(cè)結(jié)果。2.根據(jù)權(quán)利要求1所述的基于兩階段集成學(xué)習(xí)的風(fēng)電異常數(shù)據(jù)識(shí)別方法,其特征在于,所述風(fēng)電異常參數(shù)包括:風(fēng)速、風(fēng)功率、風(fēng)速風(fēng)功率隨時(shí)間的變化速率、樣本點(diǎn)的離群系數(shù)和樣本點(diǎn)的分位數(shù)統(tǒng)計(jì)結(jié)果。3.根據(jù)權(quán)利要求2所述的基于兩階段集成學(xué)習(xí)的風(fēng)電異常數(shù)據(jù)識(shí)別方法,其特征在于,所述步驟S2進(jìn)一步包括: 通過風(fēng)電異常歷史記錄中的時(shí)間間隔來劃分所述訓(xùn)練樣本和所述測(cè)試樣本。4.根據(jù)權(quán)利要求3所述的基于兩階段集成學(xué)習(xí)的風(fēng)電異常數(shù)據(jù)識(shí)別方法,其特征在于,所述步驟S3進(jìn)一步包括: 5301:使用原始的標(biāo)記值訓(xùn)練所述訓(xùn)練樣本; 5302:調(diào)節(jié)所述訓(xùn)練樣本的正負(fù)比例和參數(shù)模型,得到所述隨機(jī)森林模型。5.根據(jù)權(quán)利要求4所述的基于兩階段集成學(xué)習(xí)的風(fēng)電異常數(shù)據(jù)識(shí)別方法,其特征在于,所述步驟S4進(jìn)一步包括: 使用所述隨機(jī)森林模型的輸出作為所述訓(xùn)練樣本的目標(biāo)值,利用梯度迭代決策樹訓(xùn)練所述訓(xùn)練樣本并調(diào)節(jié)模型參數(shù),得到所述梯度迭代決策樹模型。6.根據(jù)權(quán)利要求5所述的基于兩階段集成學(xué)習(xí)的風(fēng)電異常數(shù)據(jù)識(shí)別方法,其特征在于,所述步驟S5進(jìn)一步包括: 5501:根據(jù)所述隨機(jī)森林模型預(yù)測(cè)所述測(cè)試樣本得到第一預(yù)測(cè)中間值,根據(jù)所述梯度迭代決策樹模型預(yù)測(cè)所述測(cè)試樣本得到第二預(yù)測(cè)中間值; 5502:對(duì)所述第一預(yù)測(cè)中間值和所述第二預(yù)測(cè)中間值求平均值得到所述預(yù)測(cè)結(jié)果。
【專利摘要】本發(fā)明公開了一種基于兩階段集成學(xué)習(xí)的風(fēng)電異常數(shù)據(jù)識(shí)別方法,包括以下步驟:S1:提取風(fēng)電異常數(shù)據(jù)參數(shù);S2:根據(jù)所述風(fēng)電異常數(shù)據(jù)參數(shù)生成訓(xùn)練樣本和測(cè)試樣本;S3:利用隨機(jī)森林訓(xùn)練所述訓(xùn)練樣本得到隨機(jī)森林模型:S4:根據(jù)所述隨機(jī)森林模型,利用梯度迭代決策樹訓(xùn)練所述訓(xùn)練樣本得到梯度迭代決策樹模型;以及S5:根據(jù)所述隨機(jī)森林模型和所述梯度迭代決策樹模型分別預(yù)測(cè)所述測(cè)試樣本得到預(yù)測(cè)結(jié)果。本發(fā)明具有如下優(yōu)點(diǎn):提高了風(fēng)電異常數(shù)據(jù)識(shí)別的準(zhǔn)確率。
【IPC分類】G06K9/62
【公開號(hào)】CN105069476
【申請(qǐng)?zhí)枴緾N201510484365
【發(fā)明人】耿天翔, 丁茂生, 李峰, 葛俊, 胡偉, 鄭樂
【申請(qǐng)人】國(guó)網(wǎng)寧夏電力公司, 清華大學(xué), 國(guó)家電網(wǎng)公司
【公開日】2015年11月18日
【申請(qǐng)日】2015年8月10日