本發(fā)明屬于功率曲線建模,具體涉及基于sgbrt和gwo的多變量風(fēng)力功率曲線建模方法。
背景技術(shù):
1、風(fēng)力渦輪機(jī)(wt)的功率曲線可以直接表明其有效地將風(fēng)能轉(zhuǎn)化為電能的能力,準(zhǔn)確建模和監(jiān)測功率曲線,可以實(shí)現(xiàn)及時的風(fēng)能預(yù)測、早期故障檢測和風(fēng)力發(fā)電機(jī)組的狀態(tài)監(jiān)測,這也可以用于制定有效的控制策略,并為大規(guī)模風(fēng)電順利并網(wǎng)提供技術(shù)支持。由于各種實(shí)際因素,如位置、風(fēng)速、風(fēng)向、環(huán)境溫度、大氣壓、機(jī)械、控制、風(fēng)電場的部署以及測量誤差和數(shù)據(jù)處理方法等,經(jīng)驗(yàn)功率曲線可能與理論功率曲線存在顯著差異。因此,使用先進(jìn)的算法提高風(fēng)力發(fā)電機(jī)組功率曲線的建模精度具有重要意義,這對于提高風(fēng)能利用率以及降低整體運(yùn)營和維護(hù)成本至關(guān)重要。
2、現(xiàn)有研究中,改進(jìn)的隨機(jī)非參數(shù)建模方法在功率曲線模型方面取得的成就是顯著的,特別是在可解釋性、準(zhǔn)確性和泛化能力方面。然而,風(fēng)力發(fā)電機(jī)組不斷變化和復(fù)雜的運(yùn)行環(huán)境引入了許多可能影響其功率輸出的外部因素,忽略某些輸入變量或其耦合效應(yīng)也可能降低功率曲線模型的準(zhǔn)確性。此外,現(xiàn)有方法主要側(cè)重于提高建模精度,但隨著小波變換功率曲線的建模過程向使用多變量輸入的方向發(fā)展,在增強(qiáng)特征選擇的適應(yīng)性、訓(xùn)練速度和模型對噪聲數(shù)據(jù)的魯棒性等方面仍需進(jìn)一步研究。因此需要尋找一種基于先進(jìn)機(jī)器學(xué)習(xí)技術(shù)的多變量功率曲線建模方法。
技術(shù)實(shí)現(xiàn)思路
1、根據(jù)以上現(xiàn)有技術(shù)中的不足,本發(fā)明的目的在于提供基于sgbrt和gwo的多變量風(fēng)力功率曲線建模方法,通過結(jié)合sgbrt和gwo算法,實(shí)現(xiàn)了高準(zhǔn)確度、高效率和強(qiáng)適應(yīng)性的風(fēng)力發(fā)電機(jī)組功率曲線預(yù)測,具有顯著的性能優(yōu)勢。
2、為達(dá)到以上目的,本發(fā)明采用的技術(shù)方案是,基于sgbrt和gwo的多變量風(fēng)力功率曲線建模方法,包括以下步驟:
3、s1、將風(fēng)機(jī)的操作區(qū)域分為五個不同階段(即為將風(fēng)機(jī)的運(yùn)行范圍劃分為五個特定的區(qū)域),包括切入階段、最大風(fēng)能跟蹤階段、過渡階段、額定功率階段和切出階段,根據(jù)不同階段的功率控制策略進(jìn)行數(shù)據(jù)清理;
4、s2、根據(jù)偏互信息pmi選擇輸入變量,通過比較互信息來確定外部條件與輸出功率的相關(guān)性,并利用pmi處理輸入變量之間的耦合關(guān)系;
5、s3、基于隨機(jī)梯度增強(qiáng)回歸樹sgbrt進(jìn)行建模,得到sgbrt模型;
6、s4、運(yùn)用灰狼優(yōu)化算法gwo優(yōu)化更新sgbrt模型中的回歸參數(shù);
7、s5、基于優(yōu)化后的sgbrt模型進(jìn)行多變量風(fēng)力功率曲線的建模。
8、作為本發(fā)明的優(yōu)選方案,所述的s1中,定義vwind為實(shí)際風(fēng)速;vcut_in為切入風(fēng)速,即風(fēng)機(jī)切入階段最大運(yùn)行風(fēng)速;vrated為額定風(fēng)速,即風(fēng)機(jī)最大風(fēng)能跟蹤階段最大運(yùn)行風(fēng)速;vcut_out為切出風(fēng)速,即風(fēng)機(jī)額定功率階段最大運(yùn)行風(fēng)速;prated為風(fēng)力發(fā)電機(jī)的額定功率;采用變槳控制系統(tǒng)進(jìn)行槳葉節(jié)距角和風(fēng)輪速度的控制調(diào)整;
9、各個階段及其控制策略為:
10、切入階段:當(dāng)vwind<vcut_in時,風(fēng)機(jī)關(guān)閉;
11、最大風(fēng)能跟蹤階段:當(dāng)vcut_in≤vwind<vrated時,風(fēng)機(jī)開始運(yùn)行,將槳葉節(jié)距角的變槳角度保持在0°,同時,風(fēng)輪速度根據(jù)vwind不斷調(diào)整,以保持風(fēng)機(jī)在最佳葉尖速比工作;
12、過渡階段:當(dāng)vwind在vrated附近上下波動時,槳葉節(jié)距角的俯仰角控制在-5°至5°之間,同時將風(fēng)輪速度保持在額定值,以確保風(fēng)機(jī)運(yùn)行的安全性和穩(wěn)定性;
13、額定功率階段:當(dāng)vrated<vwind≤vcut_out時,增加槳葉節(jié)距角的俯仰角,減少輸出功率波動;
14、切出階段:當(dāng)vwind>vcut_out時,變槳角度調(diào)整到順槳狀態(tài),以停止風(fēng)機(jī)的運(yùn)行;
15、數(shù)據(jù)清理為,原始數(shù)據(jù)包含風(fēng)速、輸出功率、轉(zhuǎn)子速度、環(huán)境條件、傳動部件溫度和振動數(shù)據(jù),對于切入階段和切出階段,隨著風(fēng)機(jī)在切入階段和切出階段中停止工作,清除非零輸出功率值;對于最大風(fēng)能跟蹤階段、過渡階段和額定功率階段,這三個階段的風(fēng)速和輸出功率散點(diǎn)圖呈現(xiàn)帶狀分布,根據(jù)對應(yīng)的功率控制策略,使用混合阿基米德-copula函數(shù)建立自適應(yīng)置信邊界模型,在三維copula空間中對原始數(shù)據(jù)進(jìn)行清理。
16、作為本發(fā)明的優(yōu)選方案,所述的s1中,數(shù)據(jù)清理的具體過程為:
17、s1.1、定義最大風(fēng)能跟蹤階段、過渡階段和額定功率階段的風(fēng)速為v,輸出功率為p,估算最大風(fēng)能跟蹤階段、過渡階段和額定功率階段的風(fēng)速和輸出功率的累積邊際概率分布(此處的估算采用現(xiàn)有技術(shù)即可),分別表示為和,構(gòu)建聯(lián)合頻率直方圖;
18、s1.2、擬合每個操作區(qū)域的混合阿基米德copula函數(shù),表示為:
19、(1);
20、式中,u代表;v代表;e為自然常數(shù);、、分別表示gumbel、clayton和frank?copula函數(shù);、、分別是gumbel、clayton和frankcopula函數(shù)的依賴參數(shù),表示隨機(jī)變量之間的依賴關(guān)系;表示copula函數(shù);、、是位于0和1之間的隨機(jī)數(shù);ln表示以e為底的對數(shù)函數(shù);exp表示以e為底的指數(shù)函數(shù);
21、s1.3、基于式(1),推導(dǎo)出在下的條件概率為:
22、(2);
23、式中,表示偏微分;
24、s1.4、將的置信水平設(shè)置為,限制異常數(shù)據(jù)的數(shù)量,其中為置信水平的補(bǔ)數(shù);定義一個不對稱系數(shù)α,通過式(3)推導(dǎo)出置信水平為的概率分位數(shù):
25、(3);
26、式中,、分別表示低概率分位數(shù)和高概率分位數(shù);
27、s1.5、定義一個風(fēng)速v0,估算其在最大風(fēng)能跟蹤階段、過渡階段和額定功率階段的累積邊際概率分布后,在條件下的的條件概率變?yōu)閱巫兞?,在風(fēng)速v0下,式(3)的輸出、對應(yīng)變?yōu)?、;則v0下的p的分位數(shù)能夠?qū)С觯?/p>
28、(4);
29、式中,表示非參數(shù)條件概率的逆函數(shù);、分別表示v0下風(fēng)力功率曲線的置信下限和置信上限;
30、s1.6、在最大風(fēng)能跟蹤階段、過渡階段和額定功率階段中,以指定的間隔計算每個風(fēng)速的上下限,基于這些點(diǎn)在所有操作區(qū)域進(jìn)行繪制,以獲得風(fēng)力功率曲線的等效置信邊界,通過該邊界識別和消除異常數(shù)據(jù)。
31、作為本發(fā)明的優(yōu)選方案,所述的s2中,根據(jù)偏互信息pmi選擇輸入變量的過程為:
32、s2.1、對于隨機(jī)輸出向量yi,將輸出向量集合標(biāo)記為,n為樣本數(shù)量,即為向量的數(shù)量;y的信息熵通過式(5)計算:
33、(5);
34、式中,pi是對應(yīng)于yi的概率分布;
35、s2.2、對于隨機(jī)輸入變量ui,將其集合標(biāo)記為,ui會影響yi,對于u和y之間的互信息,y中包含的元素通過以下公式計算:
36、(6);
37、式中,表示ui和yi的聯(lián)合概率密度函數(shù);、分別表示ui、yi的邊緣概率密度函數(shù);表示括號內(nèi)兩者之間的互信息(此處即為u和y之間的互信息,其余同理);log是對數(shù)函數(shù),即以10為底的指數(shù)函數(shù)的逆函數(shù);
38、s2.3、對于u中的一個采樣點(diǎn)u,其邊緣概率密度函數(shù)(估計密度)表示為:
39、(7);
40、式中,d表示隨機(jī)輸入變量的維度;是樣本的協(xié)方差矩陣,是的行列式;為u和ui之間的馬氏距離,h是核密度函數(shù),表示為:
41、(8);
42、s2.4、若存在另一個輸入集合u1,那么當(dāng)u和u1之間存在互相關(guān)性時,的計算值不能與實(shí)際值匹配,在這種情況下,在去除u1和y中包含的關(guān)于u的信息后,需要使用pmi來測量u和y之間的相關(guān)性;一旦u的信息被消除,初始u1和y更新為ut和yt:
43、(9);
44、式中,ut和yt是去除u1和y中包含的關(guān)于u的信息后更新的變量集合(即為剩余信息);表示u1在u上的核回歸估計;表示y在u上的核回歸估計,表示為:
45、(10);
46、s2.5、u1和y之間的pmi通過以下公式計算:
47、(11);
48、式中,表示u1和y之間的偏互信息;
49、s2.6、定義c表示為總輸入變量集合,x表示最優(yōu)輸入變量集合,cx表示具有最大pmi值的候選輸入變量集合,基于pmi進(jìn)行變量選擇。
50、作為本發(fā)明的優(yōu)選方案,所述的s2.6中,基于pmi進(jìn)行變量選擇的過程為:
51、s2.6.1、初始時,,表示空集;
52、s2.6.2、如果,根據(jù)式(10)構(gòu)造估計器,表示y在x上的核回歸估計;
53、s2.6.3、計算剩余信息;
54、s2.6.4、對于c中的任意一個元素cj,根據(jù)式(10)推導(dǎo)出,即表示cj在x上的核回歸估計;
55、s2.6.5、計算剩余信息;
56、s2.6.6、計算,并選擇最大的cx;
57、s2.6.7、計算評估條件:
58、(12);
59、式中,pc表示評估值;是用所選變量計算的y的回歸殘差;p是篩選變量的數(shù)量;
60、s2.6.8、如果pc值減小,則將cx選擇到x中;
61、s2.6.9、返回到步驟s2.6.2繼續(xù)循環(huán)計算,如果pc值不再降低,即pc值達(dá)到其最小值時,x中的最優(yōu)輸入變量選擇完成。
62、作為本發(fā)明的優(yōu)選方案,所述的s3中,sgbrt是梯度增強(qiáng)決策樹gbdt的改進(jìn),建模時,給定訓(xùn)練樣本集合m,,xi為最優(yōu)輸入變量集合中的元素,;計算輸出向量集合y的平均值,用于對x進(jìn)行預(yù)測,然后計算當(dāng)前gbdt模型的殘差,并對這些殘差擬合一棵新的決策樹,直到損失函數(shù)在所有樣本分布中具有最小的數(shù)學(xué)期望值,表示為:
63、(13);
64、式中,表示從x到y(tǒng)的映射函數(shù);表示y和x的聯(lián)合分布的期望值;為損失函數(shù),表示括號內(nèi)兩者之間差異的度量(此處即為y和之間差異的度量,其余同理);argmin表示使某個函數(shù)達(dá)到最小值的變量值。
65、作為本發(fā)明的優(yōu)選方案,gbdt的算法流程為:
66、s3.1、定義一個初始常數(shù)函數(shù),使損失函數(shù)最小,以根節(jié)點(diǎn)為創(chuàng)建樹,表示為:
67、(14);
68、式中,β是gbdt模型的初始預(yù)測值;
69、s3.2、迭代構(gòu)建k-boosting樹,包括兩個循環(huán),在第一個循環(huán)“k=1到k”和第二個循環(huán)“i=1到n”之后,將所有回歸樹加在一起,并不斷更新gbdt模型,其中k為樹個數(shù);迭代后計算得到的函數(shù)關(guān)系如下:
70、(15);
71、式中,是增強(qiáng)樹的展開系數(shù);是回歸樹函數(shù);ak是擬合訓(xùn)練數(shù)據(jù)的參數(shù)集合,其集合表示為;
72、k-boosting樹指的是通過迭代地添加決策樹(增強(qiáng)樹)來構(gòu)建模型。每棵新樹都試圖糾正前一棵樹的預(yù)測誤差?;貧w樹函數(shù)是一種決策樹,它在樹的葉節(jié)點(diǎn)上存儲的是連續(xù)的數(shù)值,而不是分類標(biāo)簽,這種類型的決策樹用于回歸問題,即預(yù)測一個連續(xù)的數(shù)值輸出變量。
73、為了求解回歸樹函數(shù)中的損失函數(shù),使用最小二乘法來擬合當(dāng)前的偽殘差,損失函數(shù)的負(fù)梯度計算如下:
74、(16);
75、式中,、分別表示從xi、x到y(tǒng)的映射函數(shù),x為x中的一個樣本點(diǎn);表示在第k輪迭代之前,gbdt模型對括號內(nèi)元素的預(yù)測函數(shù)(此處即為對gbdt模型x的預(yù)測函數(shù),其余同理);k是當(dāng)前迭代的輪數(shù),表示gbdt模型中已經(jīng)添加了k棵決策樹;將用作殘差的估計;
76、利用ak和βk,聯(lián)合適應(yīng)訓(xùn)練數(shù)據(jù),表示為:
77、(17);
78、式中,是回歸樹函數(shù);
79、s3.3、利用最小二乘法擬合,ak表示為:
80、(18);
81、式中,a是a中的一個樣本點(diǎn);
82、βk的最佳值由下式確定:
83、(19);
84、s3.4、在從k=1到k的每次迭代中,用作葉節(jié)點(diǎn)的回歸樹函數(shù)將輸入空間劃分為l個非重疊區(qū)域,表示為,表示第k棵樹在第l個葉節(jié)點(diǎn)所對應(yīng)的區(qū)域,輸入空間即為最優(yōu)輸入變量集合x;
85、在每個區(qū)域中,如下預(yù)測一個單獨(dú)的常數(shù):
86、(20);
87、式中,i是一個指標(biāo)函數(shù),當(dāng)成立時,i=1,否則i等于0;是區(qū)域中估計殘差的平均值;mean函數(shù)是指求平均值的數(shù)學(xué)運(yùn)算;
88、因此,在每個子區(qū)域中,回歸樹在第k次迭代中由第l個葉節(jié)點(diǎn)求解,由于從式(20)中獲得的回歸樹能夠預(yù)測每個區(qū)域中的,因此標(biāo)記為的式(19)的解簡化為:
89、(21);
90、式中,表示第l個葉節(jié)點(diǎn)(終端節(jié)點(diǎn))的預(yù)測值;
91、s3.5、為了監(jiān)督預(yù)測過程的學(xué)習(xí)率,所有學(xué)習(xí)者都被歸一化,設(shè)置學(xué)習(xí)率調(diào)節(jié)因子z以調(diào)整梯度下降的步長,0<z≤1,通過以下方式更新當(dāng)前擬合的gbdt模型:
92、(22);
93、式中,表示在第k輪迭代時,針對x的gbdt模型的預(yù)測函數(shù);
94、s3.6、當(dāng)?shù)Y(jié)束時,最終的表示為:
95、(23)。
96、作為本發(fā)明的優(yōu)選方案,所述的s3中,sgbrt的改進(jìn)為,在gbdt中引入了一個隨機(jī)化過程,即采樣訓(xùn)練數(shù)據(jù)集的一個隨機(jī)子集來擬合基學(xué)習(xí)器,然后基于分離的隨機(jī)子數(shù)據(jù)集計算當(dāng)前迭代的更新sgbrt模型,步驟包括:
97、對于給定的訓(xùn)練樣本集合m,將輸入空間x劃分為l個互不相交的區(qū)域;
98、定義為損失函數(shù),為隨機(jī)置換整數(shù)集得到的序列集,為其中的第i個序列;
99、在不相交區(qū)域的每個樣本集中,隨機(jī)抽取一個未被替換的樣本子集ms,記為,ns為樣本容量且ns<n,、分別為對應(yīng)于的xi和yi;
100、使用ms訓(xùn)練回歸樹,從而得到從x到y(tǒng)的映射;以隨機(jī)子集作為輸入,為每個區(qū)域生成新的回歸樹模型,式(21)更新為:
101、(24);
102、式中,表示更新后的式(19)的解;
103、最終的sgbrt模型通過迭代確定,表示為:
104、(25)。
105、作為本發(fā)明的優(yōu)選方案,所述的s4中,利用gwo算法進(jìn)一步優(yōu)化sgbrt模型中的回歸參數(shù),包括樹個數(shù)k、互不相交的區(qū)域數(shù)量l和學(xué)習(xí)率調(diào)節(jié)因子z。
106、作為本發(fā)明的優(yōu)選方案,所述的s4中,gwo算法的優(yōu)化流程為:
107、s4.1、gwo算法中,灰狼分為i、ii、iii和iv四類,i狼是首席領(lǐng)袖,ii狼和iii狼是下屬,其余iv狼負(fù)責(zé)種群內(nèi)的關(guān)系平衡;根據(jù)狼群的適應(yīng)度值迭代更新狼群的位置,并利用其更新后的位置在問題空間中搜索最優(yōu)解,在狩獵過程中,灰狼圍捕獵物的行為表示為:
108、(26);
109、式中,t表示當(dāng)前迭代次數(shù);、分別表示灰狼在第t次、第t+1次迭代時的位置向量;表示獵物在第t次迭代時的位置向量;q和z是系數(shù)向量,分別表示為:
110、(27);
111、式中,b1和b2是位于0到1之間的隨機(jī)常向量;q是從2到0線性遞減的收斂因子;
112、s4.2、當(dāng)識別到獵物位置時,ii狼和iii狼在i狼的引導(dǎo)下協(xié)調(diào)所有狼包圍獵物,表示為:
113、(28);
114、式中,、、分別表示i狼、ii狼和iii狼的位置向量,表示為:
115、(29);
116、式中,、、分別表示i狼、ii狼和iii狼在第t次迭代時的位置向量;q1、q2、q3分別為i狼、ii狼和iii狼的系數(shù)向量;、、分別表示i狼、ii狼和iii狼與其他個體之間的距離,表示為:
117、(30);
118、式中,z1、z2、z3為隨機(jī)向量;
119、s4.3、構(gòu)建gwo的適應(yīng)度函數(shù),表示為:
120、(31);
121、式中,rmse為均方根誤差;mae為平均絕對誤差;r2為決定系數(shù);、、分別是rmse、mae和r2的權(quán)重因子;c是一個正常數(shù),用于防止除以零誤差。
122、本發(fā)明涉及的算法可以通過電子設(shè)備執(zhí)行,電子設(shè)備包括存儲器、處理器及存儲在存儲器上并可在處理器上運(yùn)行的計算機(jī)程序,通過處理器執(zhí)行軟件實(shí)現(xiàn)上述的算法計算。
123、本發(fā)明所具有的有益效果是:
124、本發(fā)明提出了一種結(jié)合隨機(jī)梯度提升回歸樹(sgbrt)和灰狼優(yōu)化(gwo)算法的風(fēng)力發(fā)電機(jī)組功率曲線預(yù)測模型,通過在三維copula空間中使用概率描述方法對原始數(shù)據(jù)進(jìn)行清理,有效消除了無效和非自然數(shù)據(jù),同時利用偏互信息分析確定關(guān)鍵輸入變量,提高了數(shù)據(jù)質(zhì)量和模型的準(zhǔn)確性。該模型在預(yù)測變速恒頻風(fēng)力發(fā)電機(jī)組的功率曲線方面展現(xiàn)出了卓越的準(zhǔn)確性和效率。
125、本發(fā)明在建模精度、效率和適應(yīng)性方面均表現(xiàn)出色。與參數(shù)化、人工神經(jīng)網(wǎng)絡(luò)和xgboost模型相比,所提出的sgbrt-gwo模型架構(gòu)在歸一化殘差、rmse、mae和r2值方面均顯示出優(yōu)越性能。模型的迭代過程也得到了簡化,減少了計算成本和時間,同時保持了高預(yù)測精度。這些優(yōu)點(diǎn)使得該方案在優(yōu)化風(fēng)能生產(chǎn)和提高風(fēng)力發(fā)電機(jī)組效率方面具有重要的實(shí)際應(yīng)用價值,為風(fēng)力發(fā)電系統(tǒng)的運(yùn)行、維護(hù)和控制提供了有力的技術(shù)支持。