欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于自適應動態(tài)規(guī)劃的單區(qū)域電力系統(tǒng)頻率復合控制方法與流程

文檔序號:12131358閱讀:399來源:國知局
基于自適應動態(tài)規(guī)劃的單區(qū)域電力系統(tǒng)頻率復合控制方法與流程

本發(fā)明涉及電力系統(tǒng)頻率控制技術領域,尤其是涉及一種基于自適應動態(tài)規(guī)劃的單區(qū)域電力系統(tǒng)頻率復合控制方法。



背景技術:

大型電力系統(tǒng)通常由多個區(qū)域組成,每個區(qū)域通過聯(lián)絡線與相鄰區(qū)域相互連接。隨著電能需求的增長和可再生能源發(fā)電技術的日益成熟,現(xiàn)代電力系統(tǒng)逐步發(fā)展為融入分布式發(fā)電和隨機負荷的智能電網(wǎng),負荷需求和發(fā)電量變得越來越隨機,電氣元件也越來越豐富。

當電力系統(tǒng)規(guī)模較小時,可以將整個電力系統(tǒng)看作一個區(qū)域,即單區(qū)域電力系統(tǒng)。單區(qū)域電力系統(tǒng)遇到多個隨機負荷變化時,系統(tǒng)的頻率可能會發(fā)生嚴重振蕩,這時采用有效的電力系統(tǒng)頻率控制方法,維持電力系統(tǒng)頻率穩(wěn)定變得尤其重要。結合單區(qū)域電力系統(tǒng)的特點,一些控制方法逐漸引起了人們的關注。例如,圍繞比例積分微分(Proportion-integration-differentiation,PID)控制、內(nèi)??刂?、滑??刂?、模糊邏輯控制等方法,已經(jīng)開展了一些電力系統(tǒng)負荷頻率控制的研究。這些方法的應用,從不同程度上提高了電力系統(tǒng)頻率控制的性能,但仍然可以提高,因為這些方法缺乏在線學習和自適應能力。

因此,在隨機負荷變化情況下,保證電力系統(tǒng)的安全和頻率穩(wěn)定,已經(jīng)成為智能電網(wǎng)發(fā)展的一個主要挑戰(zhàn)。



技術實現(xiàn)要素:

為了解決現(xiàn)有技術中的上述問題,即為了解決單區(qū)域電力系統(tǒng)在隨機負荷變化情況下,系統(tǒng)實際頻率偏離標稱值的技術問題而提供一種基于自適應動態(tài)規(guī)劃的單區(qū)域電力系統(tǒng)頻率復合控制方法。

為了實現(xiàn)上述目的,提供了以下技術方案:

一種基于自適應動態(tài)規(guī)劃的單區(qū)域電力系統(tǒng)頻率復合控制方法,所述方法包括:

獲取如下測量信號:單區(qū)域電力系統(tǒng)調(diào)速器時間常數(shù)、發(fā)電機時間常數(shù)、區(qū)域負荷時間常數(shù)、區(qū)域負荷增益、單區(qū)域電力系統(tǒng)頻率偏差;

利用比例積分控制器和自適應動態(tài)規(guī)劃控制器,根據(jù)所述測量信號生成比例積分控制信號和自適應動態(tài)規(guī)劃控制信號,并將二者疊加,得到復合控制信號;

將所述復合控制信號應用到所述單區(qū)域電力系統(tǒng)中,進行頻率控制。

優(yōu)選地,所述生成比例積分控制信號具體包括:

根據(jù)下式分別確定調(diào)速器等效模型、發(fā)電機等效模型和當?shù)刎摵傻刃P偷膫鬟f函數(shù)模型:

其中,所述Gg(s)表示所述調(diào)速器等效模型的所述傳遞函數(shù)模型;所述s表示拉普拉斯變換中的復數(shù)變量;所述Tg表示調(diào)速器時間常數(shù);所述Gt(s)表示所述發(fā)電機等效模型的所述傳遞函數(shù)模型;所述Tt表示發(fā)電機時間常數(shù);所述Gp(s)表示所述當?shù)刎摵傻刃P偷乃鰝鬟f函數(shù)模型;所述kp表示區(qū)域負荷增益;所述Tp表示區(qū)域負荷時間常數(shù);

基于所述調(diào)速器、所述發(fā)電機和所述當?shù)刎摵傻乃龅刃P?,建立單區(qū)域電力系統(tǒng)仿真模型;

根據(jù)所述單區(qū)域電力系統(tǒng)仿真模型,使用湊試法獲得比例積分控制器的參數(shù);

基于所述單區(qū)域電力系統(tǒng)仿真模型及所述比例積分控制器的參數(shù),以所述單區(qū)域電力系統(tǒng)頻率偏差為調(diào)節(jié)變量,根據(jù)下式計算所述比例積分控制信號:

其中,所述u1(t)表示所述比例積分控制信號;所述Kp表示比例系數(shù);所述Δf(t)表示所述單區(qū)域電力系統(tǒng)頻率偏差;所述Ki表示積分系數(shù);所述τ表示積分變量;所述t表示時間變量。

優(yōu)選地,所述自適應動態(tài)規(guī)劃控制信號具體包括:

根據(jù)下式確定行為網(wǎng)絡的輸入信號:

mf=max{|Δf(t)|,|Δf(t-Δt)|}

其中,所述xa(t)表示所述行為網(wǎng)絡的輸入信號;所述t表示當前時刻;所述t-Δt表示當前時刻的一步延遲;所述mf表示歸一化系數(shù);所述|Δf(t)|表示所述Δf(t)的絕對值;所述Δf(t)表示t時刻對應的單區(qū)域電力系統(tǒng)頻率偏差;所述|Δf(t-Δt)|表示所述Δf(t-Δt)的絕對值;所述Δf(t-Δt)表示所述t-Δt時刻對應的單區(qū)域電力系統(tǒng)頻率偏差;

根據(jù)下式計算得到所述自適應動態(tài)規(guī)劃控制信號:

其中,paj(t)表示行為網(wǎng)絡第j個隱層神經(jīng)元的輸入;xai(t)表示行為網(wǎng)絡第i個輸入神經(jīng)元的輸入,wa1,ij(t)表示行為網(wǎng)絡第i個輸入神經(jīng)元到第j個隱層神經(jīng)元的權值,表示隱層神經(jīng)元數(shù)目;表示行為網(wǎng)絡輸入層神經(jīng)元數(shù)目;qaj(t)表示行為網(wǎng)絡第j個隱層神經(jīng)元的輸出;σa表示行為網(wǎng)絡的激活函數(shù);vak(t)表示行為網(wǎng)絡第k個輸出神經(jīng)元的輸入,表示輸出層神經(jīng)元數(shù)目;wa2,jk(t)表示行為網(wǎng)絡第j個隱層神經(jīng)元到第k個輸出神經(jīng)元的權值;u2k(t)表示行為網(wǎng)絡第k個輸出神經(jīng)元的輸出。

優(yōu)選地,所述自適應動態(tài)規(guī)劃控制信號具體還包括:

采用評價網(wǎng)絡確定所述自適應動態(tài)規(guī)劃控制器的最小代價;

更新所述行為網(wǎng)絡的權值;

更新所述評價網(wǎng)絡的權值。

優(yōu)選地,所述采用評價網(wǎng)絡確定所述自適應動態(tài)規(guī)劃控制器的最小代價,具體包括:

根據(jù)下式確定所述評價網(wǎng)絡的輸入信號:

其中,所述ci(t)表示所述評價網(wǎng)絡的所述輸入信號;所述表示所述行為網(wǎng)絡輸入信號的轉置;所述表示所述自適應動態(tài)規(guī)劃控制信號的轉置;

根據(jù)所述評價網(wǎng)絡的輸入信號計算所述最小代價:

其中,所述pcj(t)表示所述評價網(wǎng)絡第j個隱層神經(jīng)元的輸入,所述所述表示隱層神經(jīng)元數(shù)目;所述xai(t)表示所述行為網(wǎng)絡第i個輸入神經(jīng)元的輸入,所述所述表示評判網(wǎng)絡輸入層神經(jīng)元數(shù)目,所述wc1,ij(t)表示所述評價網(wǎng)絡第i個輸入神經(jīng)元到第j個隱層神經(jīng)元的權值;所述qcj(t)表示所述評價網(wǎng)絡第j個隱層神經(jīng)元的輸出;所述σc表示所述評價網(wǎng)絡的激活函數(shù);所述表示t時刻的最小代價;所述wc2,j(t)表示所述評價網(wǎng)絡第j個隱層神經(jīng)元到輸出神經(jīng)元的權值。

優(yōu)選地,所述更新所述行為網(wǎng)絡的權值具體包括:

根據(jù)下式確定行為網(wǎng)絡誤差:

其中,所述Eat(l)表示所述行為網(wǎng)絡誤差;所述l表示所述行為網(wǎng)絡權值在t時刻的內(nèi)部迭代次數(shù);所述表示t時刻的最小代價;

設置權值訓練許可誤差和最大迭代次數(shù),并根據(jù)下式進行內(nèi)部迭代,更新所述行為網(wǎng)絡權值:

其中,所述所述所述和所述分別表示t時刻行為網(wǎng)絡隱層神經(jīng)元和輸入層神經(jīng)元第l次迭代的權值梯度;所述和所述分別表示t時刻行為網(wǎng)絡隱層神經(jīng)元和輸入層神經(jīng)元第l+1次迭代的權值;λa表示行為網(wǎng)絡的學習率;

當所述行為網(wǎng)絡誤差滿足第一誤差閾值或所述行為網(wǎng)絡內(nèi)部迭代次數(shù)達到第一次數(shù)閾值時,停止所述行為網(wǎng)絡內(nèi)部迭代,得到行為網(wǎng)絡隱層神經(jīng)元和輸入層神經(jīng)元權值。

優(yōu)選地,所述更新所述評價網(wǎng)絡的權值具體包括:

根據(jù)下式計算效用函數(shù):

其中,所述R(t)表示所述效用函數(shù);所述Q=diag(1,0.5);所述xa(t)表示所述行為網(wǎng)絡的所述輸入信號;表示所述行為網(wǎng)絡輸入信號的轉置;

基于所述效用函數(shù),設置評價網(wǎng)絡權值訓練許可誤差和最大迭代次數(shù),根據(jù)下式確定評價網(wǎng)絡誤差:

其中,所述表示對第次迭代的評價網(wǎng)絡誤差;所述表示所述評價網(wǎng)絡權值在t時刻的內(nèi)部迭代次數(shù);所述表示t時刻的最小代價;所述表示t-Δt時刻的最小代價;所述γ表示折扣因子;所述Δt表示采樣時間;

采用梯度下降法,根據(jù)下式進行內(nèi)部迭代,更新所述評價網(wǎng)絡權值:

其中,所述所述所述和所述分別表示t時刻評價網(wǎng)絡隱層神經(jīng)元和輸入層神經(jīng)元第次迭代的權值梯度;所述和所述表示t時刻評價網(wǎng)絡隱層神經(jīng)元和輸入層神經(jīng)元第次迭代的權值;所述λc表示評價網(wǎng)絡的學習率;

當所述評價網(wǎng)絡誤差滿足第二誤差閾值或評價網(wǎng)絡內(nèi)部迭代次數(shù)達到第二次數(shù)閾值時,停止所述評價網(wǎng)絡內(nèi)部迭代,得到評價網(wǎng)絡隱層神經(jīng)元和輸入層神經(jīng)元權值。

優(yōu)選地,所述將所述復合控制信號應用到所述單區(qū)域電力系統(tǒng)中,進行頻率控制,具體包括:

步驟1:在初始時刻t0,單區(qū)域電力系統(tǒng)管理和控制單元SMMC收到頻率偏差Δf(t0),計算出所述t0時刻的所述比例積分控制信號,并確定出行為網(wǎng)絡的輸入其中,所述mf=1.2|Δf(t0)|,計算出所述t0時刻的所述自適應動態(tài)規(guī)劃控制信號,再將所述比例積分控制信號和所述自適應動態(tài)規(guī)劃控制信號發(fā)送至所述單區(qū)域電力系統(tǒng)中的各參與單元;

步驟2:在[0,1]區(qū)間上隨機初始化行為網(wǎng)絡權值wa2,jk(t0)和wa1,ij(t0)以及評價網(wǎng)絡權值wc2,jk(t0)和wc1,ij(t0);

步驟3:初始化自適應動態(tài)規(guī)劃參數(shù):代價函數(shù)目標值,行為網(wǎng)絡的輸入層神經(jīng)元數(shù)目、隱層神經(jīng)元數(shù)目、輸出層神經(jīng)元數(shù)目,評判網(wǎng)絡的輸入層神經(jīng)元數(shù)目、隱層神經(jīng)元數(shù)目、輸出層神經(jīng)元數(shù)目,行為網(wǎng)絡學習率,評判網(wǎng)絡學習率,行為網(wǎng)絡權值訓練許可誤差,權值訓練最大迭代次數(shù),評判網(wǎng)絡權值訓練許可誤差及最大迭代次數(shù);

步驟4:在時刻t,所述SMMC收到所述頻率偏差Δf(t),計算出所述比例積分控制信號;經(jīng)過數(shù)據(jù)預處理后,得到所述行為網(wǎng)絡的輸入xa(t),使用所述行為網(wǎng)絡權值wa2,jk(t)和wa1,ij(t),計算得到所述自適應動態(tài)規(guī)劃控制信號;使用所述評價網(wǎng)絡權值wc2,jk(t)和wc1,ij(t)輸出最小代價;

步驟5:計算行為網(wǎng)絡誤差、效用函數(shù)和評價網(wǎng)絡誤差,分別更新所述行為網(wǎng)絡權值wa2,jk(t+Δt)和wa1,ij(t+Δt)以及所述評價網(wǎng)絡權值wc2,jk(t+Δt)和wc1,ij(t+Δt),并在下一個時間步長時使用新的權值;

步驟6:將所述比例積分控制信號和所述自適應動態(tài)規(guī)劃控制信號進行疊加,得到復合控制信號并由所述SMMC發(fā)送給所述單區(qū)域電力系統(tǒng)中的所述各參與單元,并進入下一個時間步長t+Δt,重復步驟4至步驟6。

本發(fā)明所構思的技術方案與現(xiàn)有技術相比,具有以下有益效果:

本發(fā)明提供一種基于自適應動態(tài)規(guī)劃的單區(qū)域電力系統(tǒng)頻率復合控制方法。其中,該方法包括:獲取如下測量信號:單區(qū)域電力系統(tǒng)調(diào)速器時間常數(shù)、發(fā)電機時間常數(shù)、區(qū)域負荷時間常數(shù)、區(qū)域負荷增益、單區(qū)域電力系統(tǒng)頻率偏差;利用比例積分控制器和自適應動態(tài)規(guī)劃控制器,然后,根據(jù)測量信號生成比例積分控制信號和自適應動態(tài)規(guī)劃控制信號,并將二者疊加,得到復合控制信號;再將復合控制信號應用到單區(qū)域電力系統(tǒng)中,進行頻率控制。本發(fā)明通過將PI控制量與自適應動態(tài)規(guī)劃控制量相加,構成復合控制量,解決了包含調(diào)速器、發(fā)電機和當?shù)刎摵傻膯螀^(qū)域電力系統(tǒng)在隨機負荷變化情況下,系統(tǒng)實際頻率偏離標稱值的技術問題,實現(xiàn)了快速有效的單區(qū)域電力系統(tǒng)頻率調(diào)節(jié),實現(xiàn)了自適應頻率控制,消除了頻率偏差(頻率波動),是符合智能電網(wǎng)技術的應用需求和發(fā)展趨勢的。

附圖說明

圖1是根據(jù)本發(fā)明實施例的基于自適應動態(tài)規(guī)劃的單區(qū)域電力系統(tǒng)頻率復合控制方法的流程示意圖;

圖2是根據(jù)本發(fā)明實施例的單區(qū)域電力系統(tǒng)等效模型的結構和信號傳輸示意圖;

圖3是根據(jù)本發(fā)明實施例的自適應動態(tài)規(guī)劃控制器原理示意圖;

圖4是根據(jù)本發(fā)明實施例的將基于自適應動態(tài)規(guī)劃的單區(qū)域電力系統(tǒng)頻率復合控制方法應用于單區(qū)域電力系統(tǒng)中進行頻率控制的示意圖;

圖5是根據(jù)本發(fā)明實施例的單區(qū)域電力系統(tǒng)的隨機負荷變化信號示意圖;

圖6是根據(jù)本發(fā)明實施例的單區(qū)域電力系統(tǒng)在隨機負荷變化下,采用比例積分控制器和本發(fā)明實施例所提的復合控制器的頻率偏差的控制效果比較示意圖;

圖7是根據(jù)本發(fā)明實施例的單區(qū)域電力系統(tǒng)在隨機負荷變化下頻率偏差的復合控制量和PI控制量比較示意圖;

圖8是根據(jù)本發(fā)明實施例的在10s、30s、50s、70s時的隨機負荷干擾下,復合控制器中的自適應動態(tài)規(guī)劃控制量的示意圖。

具體實施方式

為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,下面參照附圖來描述本發(fā)明的優(yōu)選實施方式。應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。此外,下面所描述的本發(fā)明實施方式中所涉及到的技術特征只要彼此之間未構成沖突就可以相互組合。

隨著智能控制技術的出現(xiàn),自適應動態(tài)規(guī)劃(Adaptive dynamic programming,ADP)方法已經(jīng)在多個工業(yè)領域得以應用,如機器人、飛行器、化工過程和智能電網(wǎng)。這種方法的主要的優(yōu)點是它的在線學習能力,使被控對象在受擾情況下具有自適應能力。將這種自適應控制技術應用于電力系統(tǒng)的負荷頻率控制(Load frequency control,LFC)中,解決現(xiàn)代電網(wǎng)隨機負荷變化等問題,具有十分重要的意義。

本發(fā)明實施例的基本思想是基于單區(qū)域電力系統(tǒng)頻率控制問題,以比例積分控制器為基礎控制器,對于多個隨機負荷變化,保持PI控制器參數(shù)不變,以自適應動態(tài)規(guī)劃控制器為上層控制器的復合控制策略,對于多個隨機負荷變化,根據(jù)電力系統(tǒng)當前頻率偏差進行在線自適應調(diào)整,在線進行自適應動態(tài)規(guī)劃控制器權值更新,獲得相應的自適應動態(tài)規(guī)劃控制量,使電力系統(tǒng)頻率回到規(guī)定值。

為此,本發(fā)明實施例提供一種基于自適應動態(tài)規(guī)劃的單區(qū)域電力系統(tǒng)頻率復合控制方法。如圖1所示,該方法可以通過步驟S100至步驟S120來實現(xiàn)。其中:

S100:獲取如下測量信號:單區(qū)域電力系統(tǒng)調(diào)速器時間常數(shù)、發(fā)電機時間常數(shù)、區(qū)域負荷時間常數(shù)、區(qū)域負荷增益、單區(qū)域電力系統(tǒng)頻率偏差。

本步驟可以通過分布式傳感器來測量單區(qū)域電力系統(tǒng)的所有信號,再由通信信道傳輸?shù)轿㈦娋W(wǎng)管理和控制系統(tǒng)(Smart Micro-Grid Management and Control,SMMC)。然后,由SMMC處理,產(chǎn)生控制信號,再通過通信信道送至單區(qū)域電力系統(tǒng)中每個參與單元中。

單區(qū)域電力系統(tǒng)包括發(fā)電機、調(diào)速器和單區(qū)域當?shù)刎摵?。其中,發(fā)電機提供電能供給;調(diào)速器控制發(fā)電機的速度,防止發(fā)電機損壞;當?shù)刎摵墒窃撾娏ο到y(tǒng)的需求側,消耗電能。

S110:利用比例積分控制器和自適應動態(tài)規(guī)劃控制器,根據(jù)上述測量信號生成比例積分控制信號和自適應動態(tài)規(guī)劃控制信號,并將二者疊加,得到復合控制信號。

本步驟以比例積分控制器(PI控制器)為基礎控制器,以自適應動態(tài)規(guī)劃控制器為上層控制器。

其中,生成PI(比例積分)控制信號的步驟具體可以包括:

S111:根據(jù)下式分別確定調(diào)速器、發(fā)電機和當?shù)刎摵傻刃P偷膫鬟f函數(shù)模型:

其中,Gg(s)表示調(diào)速器等效模型的傳遞函數(shù)模型;s表示拉普拉斯變換中的復數(shù)變量;Tg表示調(diào)速器時間常數(shù);Gt(s)表示發(fā)電機等效模型的傳遞函數(shù)模型;Tt表示發(fā)電機時間常數(shù);Gp(s)表示當?shù)刎摵傻刃P偷膫鬟f函數(shù)模型;kp表示區(qū)域負荷增益;Tp表示區(qū)域負荷時間常數(shù)。

S112:基于調(diào)速器、發(fā)電機和當?shù)刎摵傻牡刃P?,建立單區(qū)域電力系統(tǒng)仿真模型。

具體地,本步驟進一步可以包括:

SA1:根據(jù)單區(qū)域電力系統(tǒng)頻率偏差及其積分參數(shù),確定狀態(tài)向量。

作為示例,單區(qū)域電力系統(tǒng)的狀態(tài)向量x=[Δf(t),ΔPt(t),ΔXg(t),ΔE(t)]T

SA2:基于狀態(tài)向量,根據(jù)下式建立單區(qū)域電力系統(tǒng)仿真模型:

其中,表示Δf(t)對時間的一階微分,即表示單區(qū)域電力系統(tǒng)頻率偏差;Δd(t)表示單區(qū)域電力系統(tǒng)隨機負荷變化產(chǎn)生的負荷干擾;ΔPt(t)表示單區(qū)域電力系統(tǒng)發(fā)電機輸出功率變化量;表示ΔPt(t)對時間的一階微分,即ΔXg(t)表示單區(qū)域電力系統(tǒng)調(diào)節(jié)器位置偏差值;表示ΔXg(t)對時間的一階微分,即r表示單區(qū)域電力系統(tǒng)的等效阻抗;ΔE(t)表示區(qū)域控制偏差,即單區(qū)域電力系統(tǒng)頻率偏差的積分,表示ΔE(t)對時間的一階微分,即u(t)表示控制信號;ke表示積分增益系數(shù)。

其中,當Δd(t)>0時相當于消耗電能增加;當Δd(t)<0時相當于向電網(wǎng)輸入電能。

圖2示例性地示出了單區(qū)域電力系統(tǒng)等效模型的結構和信號傳輸圖。

S113:根據(jù)單區(qū)域電力系統(tǒng)仿真模型,使用湊試法獲得比例積分控制器的參數(shù)。

具體地,本步驟可以包括:

步驟a1:確定調(diào)節(jié)器的比例系數(shù)和積分系數(shù)的值。

步驟a2:通過改變給定值對系統(tǒng)加一個擾動,觀察曲線形狀。

步驟a3:通過改變比例系數(shù)或積分系數(shù)的值,反復湊試直到被控量符合動態(tài)過程品質要求為止。

步驟a4:保留步驟a3最終得到的比例系數(shù)和積分系數(shù)為PI控制器的參數(shù)。

S114:基于單區(qū)域電力系統(tǒng)仿真模型及比例積分控制器的參數(shù),以單區(qū)域電力系統(tǒng)頻率偏差為調(diào)節(jié)變量,根據(jù)下式計算比例積分控制信號:

其中,u1(t)表示比例積分控制信號;Kp表示比例系數(shù);Δf(t)表示單區(qū)域電力系統(tǒng)頻率偏差;Ki表示積分系數(shù);τ表示積分變量;t表示時間變量,例如時刻。

其中,生成自適應動態(tài)規(guī)劃控制信號的步驟具體可以包括:

S115:根據(jù)下式確定行為網(wǎng)絡的輸入信號:

其中,xa(t)表示行為網(wǎng)絡的輸入信號;t表示當前時刻;t-Δt表示當前時刻的一步延遲;mf表示歸一化系數(shù),mf=max{|Δf(t)|,|Δf(t-Δt)|};|Δf(t)|表示Δf(t)的絕對值;Δf(t)表示t時刻對應的單區(qū)域電力系統(tǒng)頻率偏差;|Δf(t-Δt)|表示Δf(t-Δt)的絕對值;Δf(t-Δt)表示t-Δt時刻對應的單區(qū)域電力系統(tǒng)頻率偏差。

優(yōu)選地,行為網(wǎng)絡采用多層感知機神經(jīng)網(wǎng)絡來實現(xiàn)。

可以對行為網(wǎng)絡的參數(shù)進行如下初始:設置為代價函數(shù)目標值UC=0、行為網(wǎng)絡輸入層神經(jīng)元數(shù)目、隱層神經(jīng)元數(shù)目、輸出層神經(jīng)元數(shù)目、行為網(wǎng)絡學習率、行為網(wǎng)絡權值訓練許可誤差及權值訓練最大迭代次數(shù)。

S116:根據(jù)下式計算得到自適應動態(tài)規(guī)劃控制信號:

其中,paj(t)表示行為網(wǎng)絡第j個隱層神經(jīng)元的輸入;xai(t)表示行為網(wǎng)絡第i個輸入神經(jīng)元的輸入,wa1,ij(t)表示行為網(wǎng)絡第i個輸入神經(jīng)元到第j個隱層神經(jīng)元的權值,表示隱層神經(jīng)元數(shù)目;表示行為網(wǎng)絡輸入層神經(jīng)元數(shù)目;qaj(t)表示行為網(wǎng)絡第j個隱層神經(jīng)元的輸出;σa表示行為網(wǎng)絡的激活函數(shù);vak(t)表示行為網(wǎng)絡第k個輸出神經(jīng)元的輸入,表示輸出層神經(jīng)元數(shù)目;wa2,jk(t)表示行為網(wǎng)絡第j個隱層神經(jīng)元到第k個輸出神經(jīng)元的權值;u2k(t)表示行為網(wǎng)絡第k個輸出神經(jīng)元的輸出。

由于單區(qū)域電力系統(tǒng)的自適應動態(tài)規(guī)劃控制器輸出是一維的,即行為網(wǎng)絡輸出神經(jīng)元數(shù)目為1,即k=1。因此,自適應動態(tài)規(guī)劃控制信號u2(t)=u21(t)。采用行為網(wǎng)絡輸出自適應動態(tài)規(guī)劃控制信號。

在上述實施例的基礎上,本發(fā)明實施例提供的方法還可以包括:

S117:采用評價網(wǎng)絡確定自適應動態(tài)規(guī)劃控制器的最小代價。

優(yōu)選地,評價網(wǎng)絡采用多層感知機神經(jīng)網(wǎng)絡來實現(xiàn)。

圖3示例性地示出了自適應動態(tài)規(guī)劃控制器原理圖。

可以對評價網(wǎng)絡進行如下初始化:設置評判網(wǎng)絡輸入層神經(jīng)元數(shù)目、隱層神經(jīng)元數(shù)目、輸出層神經(jīng)元數(shù)目、評判網(wǎng)絡學習率、評判網(wǎng)絡權值訓練許可誤差和最大迭代次數(shù)。

具體地,本步驟可以包括:

SB1:根據(jù)下式確定評價網(wǎng)絡的輸入信號:

其中,ci(t)表示評價網(wǎng)絡的輸入信號;表示行為網(wǎng)絡輸入信號的轉置;表示自適應動態(tài)規(guī)劃控制信號的轉置。

上述評價網(wǎng)絡的輸入為和組成的向量。

SB2:根據(jù)評價網(wǎng)絡的輸入信號計算最小代價:

其中,pcj(t)表示評價網(wǎng)絡第j個隱層神經(jīng)元的輸入,表示隱層神經(jīng)元數(shù)目;xai(t)表示行為網(wǎng)絡第i個輸入神經(jīng)元的輸入,表示評判網(wǎng)絡輸入層神經(jīng)元數(shù)目,wc1,ij(t)表示評價網(wǎng)絡第i個輸入神經(jīng)元到第j個隱層神經(jīng)元的權值;qcj(t)表示評價網(wǎng)絡第j個隱層神經(jīng)元的輸出;σc表示評價網(wǎng)絡的激活函數(shù);表示t時刻的最小代價,該最小代價可以為評價網(wǎng)絡在t時刻的輸出值;wc2,j(t)表示評價網(wǎng)絡第j個隱層神經(jīng)元到輸出神經(jīng)元的權值。

對于多個隨機負荷變化,保持PI控制器參數(shù)不變。以自適應動態(tài)規(guī)劃控制器為上層控制器,對于多個隨機負荷變化,根據(jù)系統(tǒng)頻率偏差,在線進行自適應動態(tài)規(guī)劃控制器權值更新,獲得相應的自適應動態(tài)規(guī)劃控制量。

S118:更新行為網(wǎng)絡的權值wa1,ij(t)和wa2,jk(t)。

步驟b1:根據(jù)下式確定行為網(wǎng)絡誤差:

其中,Eat(l)表示行為網(wǎng)絡誤差;l表示行為網(wǎng)絡權值在t時刻的內(nèi)部迭代次數(shù);表示t時刻的最小代價。

步驟b2:設置權值訓練許可誤差和最大迭代次數(shù),并根據(jù)下式進行內(nèi)部迭代,更新行為網(wǎng)絡權值:

其中,和分別表示t時刻行為網(wǎng)絡隱層神經(jīng)元和輸入層神經(jīng)元第l次迭代的權值梯度;和分別表示t時刻行為網(wǎng)絡隱層神經(jīng)元和輸入層神經(jīng)元第l+1次迭代的權值;λa表示行為網(wǎng)絡的學習率,優(yōu)選地,λa>0。

其中,和也表示進行內(nèi)部迭代的行為網(wǎng)絡權值wa1,ij(t)和wa2,jk(t)。

步驟b3:當行為網(wǎng)絡誤差滿足第一誤差閾值或行為網(wǎng)絡內(nèi)部迭代次數(shù)達到第一次數(shù)閾值時,停止行為網(wǎng)絡內(nèi)部迭代,得到行為網(wǎng)絡隱層神經(jīng)元和輸入層神經(jīng)元權值。

舉例來說,當獲得的權值和使行為網(wǎng)絡誤差Eat(l)滿足Eat(l)≤εa時,停止行為網(wǎng)絡內(nèi)部迭代,輸出權值和為t+1時刻行為網(wǎng)絡隱層神經(jīng)元和輸入層神經(jīng)元權值,即:

或者當獲得的權值和使行為網(wǎng)絡內(nèi)部迭代次數(shù)l滿足l=Ma時,停止行為網(wǎng)絡內(nèi)部迭代,輸出權值和為t+1時刻行為網(wǎng)絡隱層神經(jīng)元和輸入層神經(jīng)元權值,同樣地,有和

S119:更新評價網(wǎng)絡的權值。

具體地,本步驟可以包括:

步驟c1:根據(jù)下式計算效用函數(shù):

其中,R(t)表示效用函數(shù);Q=diag(1,0.5);xa(t)表示行為網(wǎng)絡的輸入信號;表示行為網(wǎng)絡輸入信號的轉置。

步驟c2:基于效用函數(shù),設置評價網(wǎng)絡權值訓練許可誤差和最大迭代次數(shù),根據(jù)下式確定評價網(wǎng)絡誤差:

其中,表示對第次迭代的評價網(wǎng)絡誤差;表示評價網(wǎng)絡權值在t時刻的內(nèi)部迭代次數(shù);表示t時刻的最小代價;表示t-Δt時刻的最小代價;γ表示折扣因子,優(yōu)選地,0<γ<1;t表示時刻;Δt表示采樣時間。

步驟c3:采用梯度下降法,根據(jù)下式進行內(nèi)部迭代,更新評價網(wǎng)絡權值:

其中,和分別表示t時刻評價網(wǎng)絡隱層神經(jīng)元和輸入層神經(jīng)元第次迭代的權值梯度;和表示t時刻評價網(wǎng)絡隱層神經(jīng)元和輸入層神經(jīng)元第次迭代的權值;λc表示評價網(wǎng)絡的學習率,優(yōu)選地,λc>0。

和也分別表示進行內(nèi)部迭代的評價網(wǎng)絡權值wc1,ij(t)和wc2,j(t)。

步驟c4:當評價網(wǎng)絡誤差滿足第二誤差閾值或評價網(wǎng)絡內(nèi)部迭代次數(shù)達到第二次數(shù)閾值時,停止評價網(wǎng)絡內(nèi)部迭代,得到評價網(wǎng)絡隱層神經(jīng)元和輸入層神經(jīng)元權值。

舉例來說,當獲得的權值和使評價網(wǎng)絡誤差滿足時,停止評價網(wǎng)絡內(nèi)部迭代,輸出權值和為t+1時刻評價網(wǎng)絡隱層神經(jīng)元和輸入層神經(jīng)元權值,即:

或者,當獲得的和使評價網(wǎng)絡內(nèi)部迭代次數(shù)滿足時,停止評價網(wǎng)絡內(nèi)部迭代,輸出權值和為t+1時刻評價網(wǎng)絡隱層神經(jīng)元和輸入層神經(jīng)元權值,同樣地,有和

S120:將上述復合控制信號應用到單區(qū)域電力系統(tǒng)中,進行頻率控制。

圖4示例性地示出了將本發(fā)明實施例提供的方法應用于單區(qū)域電力系統(tǒng)中進行頻率控制的示意圖。

下面結合圖4以一優(yōu)選實施例來對將復合控制信號應用到單區(qū)域電力系統(tǒng)中,進行頻率控制的步驟進行詳細說明。其中,該步驟可以包括:

S121:在初始時刻t0,單區(qū)域電力系統(tǒng)管理和控制單元SMMC收到頻率偏差Δf(t0),計算出t0時刻的比例積分控制信號,并確定出行為網(wǎng)絡的輸入其中,mf=1.2|Δf(t0)|,計算出t0時刻的自適應動態(tài)規(guī)劃控制信號,再將比例積分控制信號和自適應動態(tài)規(guī)劃控制信號發(fā)送至單區(qū)域電力系統(tǒng)中的各參與單元。

S122:在[0,1]區(qū)間上隨機初始化行為網(wǎng)絡權值wa2,jk(t0)和wa1,ij(t0),以及評價網(wǎng)絡權值wc2,jk(t0)和wc1,ij(t0)。

S123:初始化自適應動態(tài)規(guī)劃參數(shù):代價函數(shù)目標值UC=0,行為網(wǎng)絡的輸入層神經(jīng)元數(shù)目隱層神經(jīng)元數(shù)目輸出層神經(jīng)元數(shù)目評判網(wǎng)絡的輸入層神經(jīng)元數(shù)目隱層神經(jīng)元數(shù)目輸出層神經(jīng)元數(shù)目行為網(wǎng)絡學習率λa,評判網(wǎng)絡學習率λc,行為網(wǎng)絡權值訓練許可誤差εa,權值訓練最大迭代次數(shù)Ma,評判網(wǎng)絡權值訓練許可誤差εc及最大迭代次數(shù)Mc

S124:在時刻t,SMMC收到頻率偏差Δf(t),計算出u1(t);經(jīng)過數(shù)據(jù)預處理后,得到行為網(wǎng)絡的輸入xa(t),使用行為網(wǎng)絡權值wa2,jk(t)和wa1,ij(t),計算得到自適應動態(tài)規(guī)劃控制信號u2(t);使用評價網(wǎng)絡權值wc2,jk(t)和wc1,ij(t)輸出最小代價

S125:計算行為網(wǎng)絡誤差Eat(l)、效用函數(shù)R(t)和評價網(wǎng)絡誤差分別更新行為網(wǎng)絡權值wa2,jk(t+Δt)和wa1,ij(t+Δt)以及評價網(wǎng)絡權值wc2,jk(t+Δt)和wc1,ij(t+Δt),并在下一個時間步長時使用新的權值。

S126:將比例積分控制信號和自適應動態(tài)規(guī)劃控制信號進行疊加,得到復合控制信號并由SMMC發(fā)送給單區(qū)域電力系統(tǒng)中的各參與單元,并進入下一個時間步長t+Δt,重復步驟S204至步驟S206。

為使本領域技術人員更好地理解本發(fā)明,下面再結合具體實施例,對單區(qū)域電力系統(tǒng)頻率復合控制方法進行詳細說明。

S301:針對單區(qū)域電力系統(tǒng),進行如下設置:調(diào)速器時間常數(shù)Tg=0.1、發(fā)電機時間常數(shù)Tt=0.3、區(qū)域負荷的時間常數(shù)Tp=10、區(qū)域負荷增益kp=1、電路阻抗r=0.05、積分增益系數(shù)ke=0.4。

S302:針對單區(qū)域電力系統(tǒng),分別在10s、30s、50s、70s時加入幅值為+0.15、-0.3、+0.25、-0.1的隨機階躍信號作為隨機負荷變化信號。

本步驟也就是在10s、30s、50s、70s時的隨機負荷干擾分別是Δd=0.15、Δd=-0.15、Δd=0.1、Δd=0。

圖5示例性地示出了單區(qū)域電力系統(tǒng)的隨機負荷變化信號圖。

S303:使用的比例系數(shù)Kp=10和積分系數(shù)Ki=50設計自適應動態(tài)規(guī)劃控制器。

S304:隨機初始化行為網(wǎng)絡權值wa2,jk(0)和wa1,ij(0)以及評價網(wǎng)絡權值wc2,j(0)和wc1,ij(0),t0=0。

S305:設置自適應動態(tài)規(guī)劃控制器的參數(shù):采樣時間Δt=0.05s,代價函數(shù)目標值UC=0、行為網(wǎng)絡輸入層神經(jīng)元數(shù)目隱層神經(jīng)元數(shù)目輸出層神經(jīng)元數(shù)目評判網(wǎng)絡輸入層神經(jīng)元數(shù)目評判網(wǎng)絡隱層神經(jīng)元數(shù)目評判網(wǎng)絡輸出層神經(jīng)元數(shù)目行為網(wǎng)絡學習率λa=0.05、評判網(wǎng)絡學習率λc=0.05、行為網(wǎng)絡權值訓練許可誤差εa=10-6、權值訓練最大迭代次數(shù)Ma=80、評判網(wǎng)絡權值訓練許可誤差εc=10-7及最大迭代次數(shù)Mc=50。

圖6示例性地示出了單區(qū)域電力系統(tǒng)在隨機負荷變化下,采用比例積分控制器和本發(fā)明實施例所提的復合控制器(比例積分控制器和自適應動態(tài)規(guī)劃控制器)的頻率偏差的控制效果比較示意圖。其中虛線是采用比例積分控制器的頻率偏差的控制效果;實線是采用復合控制器的頻率偏差的控制效果。可見,采用復合控制器,頻率偏差調(diào)節(jié)具有更小的超調(diào),頻率偏差到0的速度也更快。

圖7示例性地示出了單區(qū)域電力系統(tǒng)在隨機負荷變化下頻率偏差的復合控制量(PI控制信號和自適應動態(tài)規(guī)劃控制信號)和PI控制量比較示意圖。該圖說明了復合控制器相比于PI控制器,能夠提供更好的控制性能。當頻率偏差發(fā)生時,在復合控制器的作用下,頻率偏差減小較快,超調(diào)也較小。

圖8示例性地示出了在10s、30s、50s、70s時的隨機負荷干擾下,復合控制器中的自適應動態(tài)規(guī)劃控制量的示意圖。該控制量依據(jù)頻率偏差的變化,自適應地給出控制量,使得復合控制器具有更好的控制性能。

S306:分別確定調(diào)速器、發(fā)電機和當?shù)刎摵傻刃P偷膫鬟f函數(shù)模型。

S307:基于調(diào)速器、發(fā)電機和當?shù)刎摵傻牡刃P停螀^(qū)域電力系統(tǒng)仿真模型。

S308:根據(jù)單區(qū)域電力系統(tǒng)仿真模型,使用湊試法獲得PI控制器的參數(shù)。

S309:基于單區(qū)域電力系統(tǒng)仿真模型及PI控制器的參數(shù),以單區(qū)域電力系統(tǒng)頻率偏差為調(diào)節(jié)變量,生成PI控制信號。

S310:確定行為網(wǎng)絡的輸入信號。

S311:計算出自適應動態(tài)規(guī)劃控制信號。

S312:采用評價網(wǎng)絡確定自適應動態(tài)規(guī)劃控制器的最小代。

S313:更新行為網(wǎng)絡的權值。

S314:更新評價網(wǎng)絡的權值。

S315:采用行為網(wǎng)絡輸出自適應動態(tài)規(guī)劃控制信號。

S316:將PI控制信號和自適應動態(tài)規(guī)劃控制信號,并將二者疊加,得到復合控制信號。

S317:將復合控制信號應用到單區(qū)域電力系統(tǒng)中,進行頻率控制。

單區(qū)域電力系統(tǒng)的隨機負荷變化,導致負荷干擾Δd(t)的出現(xiàn),從而使得系統(tǒng)頻率出現(xiàn)偏差Δf(t)。由于負荷干擾Δd(t)的不確定性,本發(fā)明實施例使用PI控制器為基礎控制器,使用自適應動態(tài)規(guī)劃控制器作為上層控制器,生成自適應動態(tài)規(guī)劃控制信號u2(t)和PI控制信號u1(t),并將二者在單區(qū)域電力系統(tǒng)管理和控制單元SMMC中相加產(chǎn)生控制信號,再通過通信信道將該控制信號送至單區(qū)域電力系統(tǒng)中每個參與單元中。解決了包含調(diào)速器、發(fā)電機和當?shù)刎摵傻膯螀^(qū)域電力系統(tǒng)在隨機負荷變化情況下,系統(tǒng)實際頻率偏離標稱值的技術問題,實現(xiàn)快速有效的單區(qū)域電力系統(tǒng)頻率調(diào)節(jié),實現(xiàn)了自適應頻率控制,消除了頻率偏差,保證了電力系統(tǒng)的安全,是符合智能電網(wǎng)技術的應用需求和發(fā)展趨勢的。

上述實施例中雖然將各個步驟按照上述先后次序的方式進行了描述,但是本領域技術人員可以理解,為了實現(xiàn)本實施例的效果,不同的步驟之間可以不必按照這樣的次序執(zhí)行,其可以同時(并行)執(zhí)行或以顛倒的次序執(zhí)行,這些簡單的變化都在本發(fā)明的保護范圍之內(nèi)。

至此,已經(jīng)結合附圖所示的優(yōu)選實施方式描述了本發(fā)明的技術方案,但是,本領域技術人員容易理解的是,本發(fā)明的保護范圍顯然不局限于這些具體實施方式。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
镇原县| 吴江市| 嘉义县| 沾益县| 东阳市| 丰原市| 光泽县| 竹溪县| 华阴市| 札达县| 民勤县| 拉萨市| 新建县| 体育| 墨脱县| 深州市| 巫山县| 卢湾区| 辽阳市| 潼南县| 拉孜县| 库尔勒市| 工布江达县| 怀集县| 抚州市| 天台县| 霍山县| 芜湖县| 涿鹿县| 甘肃省| 台江县| 富蕴县| 昭平县| 肥东县| 肥东县| 乌拉特前旗| 浏阳市| 桃源县| 阜新| 吴旗县| 集贤县|