本發(fā)明涉及快速路交通控制技術(shù)領(lǐng)域,具體涉及一種快速路交通系統(tǒng)的迭代動態(tài)線性化及自學(xué)習(xí)控制方法。
背景技術(shù):
快速路交通控制是交通工程和智能交通系統(tǒng)中的一個重要領(lǐng)域。高峰期高速公路的頻繁擁堵使交通狀況惡化。造成快速路擁堵最常見的原因包括:交通需求大于設(shè)計能力、交通事故、道路工程和天氣狀況。為了更好地發(fā)揮快速路的性能,入口匝道是普遍采用的策略。入口匝道控制的目的是為了調(diào)節(jié)在其入口匝道處進入快速路主道的交通量,保證在下游干線快速路上保持期望(或最優(yōu))的車流量,使得快速路通行能力達到最大化。實際中,可在入口匝道處,通過交通監(jiān)測裝置和信號配時裝置對進入的汽車數(shù)量進行統(tǒng)計檢測和控制。
目前,基于局部和協(xié)調(diào)反饋的alinea入口匝道策略已成功應(yīng)用到快速路交通系統(tǒng)控制中。它已被證明是一種非常簡單,高效且方便實現(xiàn)的入口匝道控制方法。然而,該方法難以校準影響系統(tǒng)性能的關(guān)鍵模型參數(shù),因為模型參數(shù)會隨著道路條件的幾何結(jié)構(gòu)和環(huán)境因素,如雨水或者霧天而有所不同。此外,快速路交通流系統(tǒng)是強非線性、耦合且不確定的,因此其準確的模型在實際中很難得到。所以,將常見的基于模型的控制方法應(yīng)用于快速路交通控制問題時,常會遇到很多意想不到的困難。
另一方面,宏觀交通流模式一般都是每天重復(fù)的。例如,交通流將從午夜開始并逐漸增加至第一個高峰即早高峰,通常從上午7點到9點,第二個高峰從下午5點到7點。擁堵通常每天在同一位置開始。迭代學(xué)習(xí)控制(ilc)非常適合處理重復(fù)過程的控制問題。在前期的研究中,有學(xué)者提出了一些基于入口匝道策略的ilc方法,并已經(jīng)應(yīng)用于快速路一天或一周的密度控制中。在文獻“freewaytrafficcontrolusingiterativelearningcontrol-basedrampmeteringandspeedsignaling”中,討論了基于ilc的入口匝道和速度控制。在文獻“aniterativelearningapproachfordensitycontroloffreewaytrafficflowviarampmetering”中,研究了以互補方式與純誤差反饋相結(jié)合的學(xué)習(xí)機制,仿真結(jié)果證明了基于ilc的優(yōu)越性。文獻“acomplementarymodularizedrampmeteringapproachbasedoniterativelearningcontrolandalinea”,通過使用基于ilc的入口匝道策略和基于ilc和alinea相結(jié)合的互補入口匝道策略來對輸入飽和進行研究。在文獻“iterativelearningcontroloffreewayflowviarampmeteringandsimulationonparamics”和文獻“flowbasedlocalrampmeteringusingiterativelearningandparamicsplatform”中,進一步評估了基于ilc的入口匝道控制的有效性。
需要注意的是,上述用于入口匝道控制的ilc方法都是基于壓縮映射和固定點理論設(shè)計的線性迭代學(xué)習(xí)算法,這在實際應(yīng)用中會存在兩個主要的限制。第一個限制是,由于跟蹤誤差的收斂性是基于λ范數(shù)獲得的,有時沿迭代軸系統(tǒng)輸出的瞬態(tài)響應(yīng)性能變差。第二個限制是相同初始狀態(tài)及相同參考軌跡必須匹配才能獲得完全跟蹤。
日復(fù)一日的嚴格重復(fù)性是一種理想的交通控制情況。實際中,由于快速路的道路條件和環(huán)境因素,例如雨水和霧天,使得交通流密度和車輛平均速度的初始值,以及跟蹤目標每天都是變化的。因此,研究非嚴格重復(fù)模式的具有隨機初始條件和迭代變化的期望密度軌跡的快速路交通系統(tǒng)的ilc方法是具有一定意義的。
目前,自適應(yīng)迭代學(xué)習(xí)控制(ailc)方案得到了廣泛研究,并且有許多成功的案例。在一般情況下,ailc最具有吸引力的優(yōu)點是其處理迭代變化的參考軌跡的能力,并且這些參考軌跡是有界但可能具有大的隨機初始重置誤差以及干擾等問題。然而,大多數(shù)現(xiàn)有的ailc依賴于這樣一個事實,即未知參數(shù)被已知非線性函數(shù)線性參數(shù)化,由于宏觀交通流模型具有強非線性,因此不能直接用于快速路交通控制問題中。
最近,神經(jīng)網(wǎng)絡(luò)或模糊系統(tǒng)已被應(yīng)用到了ailc中,以解決非線性系統(tǒng)無法線性參數(shù)化的問題。然而,通常難以確定模糊規(guī)則庫和隸屬度函數(shù),并且用大量的操作數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)也比較困難。最近,有學(xué)者通過將動態(tài)線性化方法引入到迭代域,提出了針對一般非線性離散時間系統(tǒng)的一種數(shù)據(jù)驅(qū)動的無模型自適應(yīng)ilc。它實現(xiàn)了隨機初始條件下的完全跟蹤,并且不需要任何外部測試信號或訓(xùn)練過程。但是,目標跟蹤軌跡必須是嚴格重復(fù)的。
受上述討論的啟發(fā),通過引入偽偏導(dǎo)數(shù)(ppd)的新概念,針對快速路交通系統(tǒng)提出了一種新的等價的動態(tài)線性化方法。進一步,提出了一種基于快速路交通系統(tǒng)的迭代動態(tài)線性化的自學(xué)習(xí)控制方法(lineardata-modelbasedadaptiveilc,ldm-ailc),通過匝道調(diào)節(jié)對快速路交通流密度進行控制。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是提出了一種新的快速路交通系統(tǒng)的迭代動態(tài)線性化及自學(xué)習(xí)控制方法,通過匝道調(diào)節(jié)對快速路交通流密度進行控制。
為了實現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案,快速路交通系統(tǒng)的迭代動態(tài)線性化及自學(xué)習(xí)控制方法,包括以下步驟:
(1)建立快速路交通系統(tǒng)的空間離散交通模型;
(2)將所述空間離散交通流模型用一般非線性離散時間系統(tǒng)的形式表示;
(3)將一般非線性離散時間模型轉(zhuǎn)化為動態(tài)線性化數(shù)據(jù)模型;
(4)建立動態(tài)線性化數(shù)據(jù)模型的學(xué)習(xí)控制律和參數(shù)更新律。
進一步地,所述步驟(1)中所述快速路交通系統(tǒng)假設(shè)包括一條單車道的快速路,每一區(qū)段均有一個入口匝道和一個出口匝道,則所述快速路的空間離散交通流模型為:
qi(t)=ρi(t)vi(t),(2)
其中h是采樣時間間隔;t是指第t個時刻;i∈{1,λ,in}是指快速路的第i個區(qū)段;in是總的區(qū)段數(shù);τ,υ,κ,l,m為常數(shù)參數(shù);ρi(t)表示快速路第i個區(qū)段第t個時刻的交通流密度;vi(t)表示快速路第i個區(qū)段第t個時刻的平均速度;qi(t)表示快速路第i個區(qū)段第t個時刻的交通流量;ri(t)表示快速路第i個區(qū)段第t個時刻的入口匝道交通流率;si(t)表示快速路第i個區(qū)段第t個時刻的出口匝道交通流率;li表示快速路第i個區(qū)段的長度,vfree表示快速路第i個區(qū)段的自由速度,ρjam表示最大密度。
進一步地,將所述空間離散交通流模型轉(zhuǎn)化為一般非線性形式為:
y(t+1)=f[y(t),r(t),d(t)],(5)
其中,狀態(tài)向量y(t)∈rn包括所有交通密度、平均速度以及匝道序列;控制向量r(t)∈rn包括所有可控匝道流率;干擾向量d(t)∈rn包括所有入口匝道的需求和轉(zhuǎn)彎速度;f(λ)∈rn是向量值函數(shù)。
進一步地,所述步驟(3)中將一般非線性離散時間模型轉(zhuǎn)化為動態(tài)線性化數(shù)據(jù)模型,需要設(shè)定非線性數(shù)據(jù)模型滿足以下2個假設(shè):
假設(shè)1:f(λ)關(guān)于控制向量r(t)的偏導(dǎo)數(shù)連續(xù);
假設(shè)2:非線性數(shù)據(jù)模型滿足廣義lipschitz條件,即對任意固定的t和||δr(t)||≠0,有
其中,δy(t+1)=y(tǒng)(t+1)-y(t),δr(t+1)=r(t)-r(t-1);
則可得,對于任意的時刻t一定存在一個被稱為ppd矩陣的參數(shù)
δy(t+1)=φ(t)δr(t)(6)
其中,φ(t)∈rn×n且||φ(t)||≤bφ。
進一步地,所述步驟(5)中建立動態(tài)線性化數(shù)據(jù)模型的學(xué)習(xí)控制律和參數(shù)更新律的步驟為:
(51)設(shè)動態(tài)線性化數(shù)據(jù)模型滿足假設(shè)3,同時設(shè)定快速路交通系統(tǒng)在有限的運行時間間隔t內(nèi)重復(fù),
假設(shè)3:ppd參數(shù)矩陣
(52)設(shè)期望交通輸出為yd,k(t)∈rn,對于所有的t∈{0,1,∧,t},k=1,2,∧,yd,k(t)是迭代相關(guān)且有界的,即
其中,byd為正常數(shù)且存在;
(53)定義跟蹤誤差ek(t)=y(tǒng)d,k(t)-yk(t),則
ek(t+1)=y(tǒng)d,k(t+1)-yk(t)-φ(t)δrk(t)=φ(t)(φ(t)-1yd,k(t+1)-φ(t)-1yk(t)-δrk(t))(9)
令
ek(t+1)=φ(t)[θ(t)ζk(t)-δrk(t)](10)
其中,ζk(t)=y(tǒng)d,k(t+1)-yk(t)∈rn,θ(t)=φ(t)-1∈rn×n;
(54)則可得第k次的學(xué)習(xí)控制律可表述為:
其中,
其中,
本發(fā)明所提出的ldm-ailc方法能夠處理非線性系統(tǒng),并且無需已知線性參數(shù)的結(jié)構(gòu),它是一種數(shù)據(jù)驅(qū)動的控制方法,控制器的設(shè)計和分析只取決于i/o數(shù)據(jù)。此外,在具有隨機初始狀態(tài)和迭代變化跟蹤目標的非嚴格可重復(fù)條件下,所提出的ldm-ailc方法仍然能夠獲得完全跟蹤性能。因此,在實踐中更適合于具有更高階、強非線性和非嚴格可重復(fù)條件的這種典型的復(fù)雜快速路交通控制系統(tǒng)。理論分析和仿真結(jié)果均證實了所提方法的有效性。并且本發(fā)明的方法具有以下優(yōu)點:
(1)本發(fā)明的快速路交通系統(tǒng)的迭代動態(tài)線性化方法,與以前的方法相比,不需要模型且完全等價;
(2)本發(fā)明的方法是基于數(shù)據(jù)驅(qū)動的,是利用以前重復(fù)的信息來更新當(dāng)前的操作,與人的經(jīng)驗學(xué)習(xí)類似;
(3)本發(fā)明的方法不需要要求系統(tǒng)每天從同一個初始點開始運行;
(4)本發(fā)明的方法在每天的期望密度和期望速度有所改變時,也可以應(yīng)用。
附圖說明
圖1是具有入口/出口匝道的快速路各區(qū)段描述;
圖2是迭代變化的期望交通密度分布圖;
圖3是初始交通密度迭代100次的變化圖;
圖4是在時間間隔t∈{0,λ,500}內(nèi)的最大跟蹤誤差變化圖。
具體實施方式
下面結(jié)合附圖和實施例對本發(fā)明作進一步的說明。
如圖1所示,快速路交通系統(tǒng)包括一個單車道的快速路,每一區(qū)段都有一個入口匝道和一個出口匝道。它的空間離散交通流模型如下(1)-(4)式所示。
qi(t)=ρi(t)vi(t),(2)
其中,h是采樣時間間隔;t是指第t個時刻,t∈{0,1,∧,t};i∈{1,∧,in}是指快速路的第i個區(qū)段;in是總的區(qū)段數(shù);τ,v,k,l,m為常數(shù)參數(shù);ρi(t)表示快速路第i個區(qū)段第t個時刻的交通流密度;vi(t)表示快速路第i個區(qū)段第t個時刻的平均速度;qi(t)表示快速路第i個區(qū)段第t個時刻的交通流量;ri(t)表示快速路第i個區(qū)段第t個時刻的入口匝道交通流率;si(t)表示快速路第i個區(qū)段第t個時刻的出口匝道交通流率;li表示快速路第i個區(qū)段的長度,vfree表示快速路第i個區(qū)段的自由速度,ρjam表示最大密度。
假設(shè)快速路交通系統(tǒng)在有限的時間間隔t={0,1,λ,t}內(nèi)重復(fù)運行。控制目標是設(shè)計一種不需要已知確切的交通流模型和干擾情況的自適應(yīng)ilc方法。自適應(yīng)ilc將利用歷史的快速路交通數(shù)據(jù)來產(chǎn)生控制輸入序列,以使得交通密度在整個區(qū)間t={0,1,λ,t}上收斂到期望值。
根據(jù)(1)–(4)式,將所述空間離散交通流模型用一般非線性離散時間形式表示為:
y(t+1)=f[y(t),r(t),d(t)],(5)
其中,狀態(tài)向量y(t)∈rn包含所有交通密度、平均速度以及匝道序列;控制向量r(t)∈rn包括所有可控匝道流率;干擾向量d(t)∈rp包含所有入口匝道的需求和轉(zhuǎn)彎速度;f(λ)∈rn是向量值函數(shù)。
假設(shè)1:f(λ)關(guān)于控制輸入r(t)的偏導(dǎo)數(shù)連續(xù)。
假設(shè)2:非線性數(shù)據(jù)模型滿足廣義lipschitz條件,即對任意固定的t和||δr(t)||≠0,有
||δy(t+1)||≤bφ||δr(t)||
其中,δy(t+1)=y(tǒng)(t+1)-y(t),δr(t)=r(t)-r(t-1);bφ是一個正常數(shù)。
假設(shè)1是一般非線性系統(tǒng)控制器設(shè)計的典型條件。假設(shè)2限制由控制輸入的變化驅(qū)動的系統(tǒng)輸出的變化率,它意味著入口匝道交通流量的有限變化不會導(dǎo)致交通密度的無限變化。此外,我們只需要已知bφ這樣一個常數(shù)的存在,而不需要已知它的精確值。
對于滿足假設(shè)1和假設(shè)2的一般非線性離散時間模型,當(dāng)||δr(t)||≠0時,對于任意的時刻t一定存在一個被稱為ppd矩陣的參數(shù)φ(t),使得非線性數(shù)據(jù)模型能夠轉(zhuǎn)化成如下等價的動態(tài)線性化數(shù)據(jù)模型,
δy(t+1)=φ(t)δr(t)(6)
其中,φ(t)∈rn×n且||φ(t)||≤bφ。
由非線性數(shù)據(jù)模型,
令ψ(t)=f[y(t),r(t-1),d(t)]-f[y(t-1),r(t-1),d(t-1)]。由假設(shè)1和微分中值定理,(a1)可重寫為
其中,
ψ(t)=h(t)δr(t)(a3)
因為條件||δr(t)||≠0滿足,方程(a3)至少有一個解h*(t)。事實上,對于每個時刻t,它一定具有無窮多個解。
令
動態(tài)線性化數(shù)據(jù)模型是對一般非線性離散時間模型的一種等價的描述,它與其他的線性形式不同,如泰勒線性化省略了高階項。動態(tài)線性化是一種數(shù)據(jù)驅(qū)動的方法,它的實現(xiàn)只依賴于系統(tǒng)的輸入輸出數(shù)據(jù)。此外,線性數(shù)據(jù)模型非常簡單,不需要任何模糊控制規(guī)則、外部測試信號以及像神經(jīng)網(wǎng)絡(luò)那樣的訓(xùn)練過程。
另一個假設(shè)是關(guān)于ppd參數(shù)的。
ppd參數(shù)矩陣φ(t)是正定或者非負定的。不失一般性,本文中我們假設(shè)φ(t)≥δi>0。
假設(shè)3規(guī)定了控制方向的同向性,這在控制系統(tǒng)中是常見的。
如文獻“datadrivenmodel-freeadaptivecontrolforaclassofmimononlineardiscrete-timesystems”所述,φ(t)表示馬爾可夫參數(shù)或線性系統(tǒng)的傳遞函數(shù),對于僅在有限時間間隔t∈{0,1,λ,t}上沿時間軸變化的快速路交通系統(tǒng),可以合理地假設(shè)φ(t)是嚴格可重復(fù)的,然后通過考慮快速路交通控制系統(tǒng)的重復(fù)性,動態(tài)線性化數(shù)據(jù)模型的等效表達式可表述為,
yk(t+1)=y(tǒng)k(t)+φ(t)δrk(t)(10)
其中,δrk(t)=rk(t)-rk(t-1);t={0,1,λ,t};k=1,2,λ代表迭代次數(shù)。
期望的交通輸出是yd,k(t)∈rn,對于所有的t∈{0,λ,t},k=1,2,λ,它是迭代相關(guān)且有界的,即
其中,我們只需要知道正常數(shù)byd的存在性。
定義跟蹤誤差ek(t)=y(tǒng)d,k(t)-yk(t),t∈{0,1,λ,t}。由(10)式,我們可以得到
ek(t+1)=y(tǒng)d,k(t+1)-yk(t)-φ(t)δrk(t)=φ(t)(φ(t)-1yd,k(t+1)-φ(t)-1yk(t)-δrk(t))(11)
令ζk(t)=y(tǒng)d,k(t+1)-yk(t)∈rn,θ(t)=φ(t)-1∈rn×n。等式(11)可重寫成
ek(t+1)=φ(t)[θ(t)ζk(t)-δrk(t)](12)
那么,第k次的學(xué)習(xí)控制律可表述如下
其中,
其中,
其中,與其它的自適應(yīng)ilc[14-20]不同,ζk(t)=y(tǒng)d,k(t+1)-yk(t)是線性函數(shù),與系統(tǒng)輸出和參考軌跡有關(guān)。因此,自動滿足關(guān)于線性增長條件。
其中,所提的ldm-ailc是一種數(shù)據(jù)驅(qū)動的方法,因為控制器的設(shè)計和分析僅用到系統(tǒng)輸入輸出的可測數(shù)據(jù)。未知參數(shù)θ(t)是隨迭代估計的,也是只用到控制系統(tǒng)可測的i/o數(shù)據(jù)。
針對mimo非線性離散時間系統(tǒng)所提出的ldm-ailc方案,在假設(shè)1–3滿足的條件下,控制律(13)與學(xué)習(xí)更新律(14)能夠保證:
(a)對于所有的t∈{0,λ,t},k=1,2,λ,ppd矩陣估計
(b)當(dāng)k趨于無窮時,跟蹤誤差ek(t),t∈{1,λ,t},沿迭代軸趨于零。
定義參數(shù)估計誤差
注意以下性質(zhì)
性質(zhì)1.
性質(zhì)2.trace(qtvyt)=trace(qtvyt)t=vtqy
其中,a,b,c是方陣,q∈rm×n,v∈rm×1,y∈rn×1。
定義
根據(jù)(14)式,等式(b2)變成
由于以上性質(zhì)2,(b3)變?yōu)?/p>
在(14)式兩邊同時減去θ(t),并用關(guān)系式(b1),可得
考慮到(b5),(b4)式可重寫為
再用關(guān)系式(b1),我們有
由于0<abφ<2,q>0,很明顯
由(b7)和(b8),很容易得到
或者
根據(jù)定理1和假設(shè)3,0<δ≤||φ(t)||≤bφ,所以θ(t)是有界的。進一步,
將(b7)的兩邊從0到k求和,得
由于v0(t)是有界的,vk(t)是非負有界的,考慮到(b8)和(b11),可得
根據(jù)ζk(t)的定義,有
其中,
因此,根據(jù)收斂性質(zhì)(b12)與(b13)即可得到對于所有的t∈{1,λ,t},ek(t)沿迭代軸漸近收斂。
為了驗證本發(fā)明方法的正確性,對本發(fā)明的方法進行了以下仿真:
對于仿真,我們考慮一個區(qū)間的快速路被分為12個區(qū)段。每個區(qū)段的長度為0.5km。進入第1區(qū)段的初始交通量為每小時1600輛車輛。該模型中使用的參數(shù)如下:vi(0)=50km/h,vfree=80km/h,ρjam=80veh/lane/km,l=1.8,m=1.7,κ=13veh/km,τ=0.01h,h=0.00417h,γ=35km2/h,ri(0)=0veh/h,α=0.95。
在第2區(qū)段有一個入口匝道口,已知交通需求,有兩個出口匝道口分別位于第5區(qū)段和第9區(qū)段,出口流量未知。以此來模擬高峰時段的交通情況。未知的出口流量實際上是作為模擬第2區(qū)段的外部干擾。
注意,序列需求實際上對入口匝道的控制輸入施加了一些約束,例如:在k時刻入口匝道的交通流率不能超過當(dāng)前需求與當(dāng)前在入口匝道等待序列的和;因此
其中,li(t)是指在t時刻第i個入口匝道可能存在的等待序列的長度;ηi(t)是在t時刻第i個入口匝道交通需求量(veh/h);在本文仿真中ion=2,指存在入口匝道的區(qū)段數(shù)。另一方面,等待序列是入口匝道的需求與實際流量的差的累積,即
li(t+1)=li(t)+t[ηi(t)-ri(t)],i∈ion(16)
期望的快速路交通密度是ρd,k=30+0.1sin(πk/50),如圖2所示,它是隨迭代次數(shù)不斷變化的。隨機初始交通密度選的是ρi,k(0)=30+0.01rand,如圖3所示。
在仿真中,我們選擇a=0.1,c=0.01,θ0(t)=0.002,u0(t)=0。應(yīng)用所提的ldm-ailc方法,學(xué)習(xí)收斂性如圖4所示。其中橫軸是迭代次數(shù),縱軸是跟蹤誤差的最大絕對值
從圖2-4可看出所提ldm-ailc方法的有效性。盡管初始值隨機以及參考軌跡沿迭代軸隨機變化,跟蹤誤差仍然漸進地逼近零。