:本發(fā)明屬于自動駕駛領(lǐng)域,具體來說是一種基于擾動預(yù)測的無人駕駛汽車管狀模型預(yù)測控制方法。
背景技術(shù)
0、
背景技術(shù):
1、隨著車輛增多,交通安全和通勤效率問題日益突出。自動駕駛汽車被視為解決這些問題的關(guān)鍵,其控制技術(shù)對此至關(guān)重要。路徑跟蹤是無人駕駛汽車運動控制模塊的重要組成部分,其目的是確保汽車能夠按預(yù)定的軌跡安全、準(zhǔn)確、穩(wěn)定地行駛。在跟蹤控制過程中,車輛的動態(tài)行為直接受到輪胎與路面之間作用力的影響。由于駕駛環(huán)境的復(fù)雜多變,這些作用力會因輪胎的氣壓、載荷以及路面條件的變化而呈現(xiàn)非線性變化。其中,輪胎參數(shù)的干擾主要源于兩個方面:一是理想系統(tǒng)未能充分考慮輪胎的非線性特性;二是當(dāng)路面附著狀況發(fā)生變化時,實際的輪胎側(cè)偏剛度與理想系統(tǒng)中的側(cè)偏剛度不匹配。因此,在跟蹤控制中,輪胎側(cè)偏剛度所具有的不確定性因素會對跟蹤精度以及車輛的穩(wěn)定狀況產(chǎn)生不利的影響。由于傳統(tǒng)模型預(yù)測控制(mpc)對模型的依賴性較強,當(dāng)受到外部擾動時,控制器可能會違背系統(tǒng)約束,無法達(dá)到預(yù)期的控制效能。針對這一問題,學(xué)界展開了關(guān)于如何應(yīng)對未來演化不確定性影響的研究。在此背景下,魯棒mpc(rmpc)和隨機mpc(smpc)成為兩種主流方法,分別采用有界集和概率論來描繪未來的不確定性。然而,模型失配之類的不確定性難以通過概率進(jìn)行精準(zhǔn)描述。因此,在自動駕駛控制領(lǐng)域,rmpc相較于smpc展現(xiàn)出更廣闊的應(yīng)用前景。目前,最小-最大模型預(yù)測控制(min-max?mpc)和管狀模型預(yù)測控制(tube-mpc)是實現(xiàn)rmpc的兩大主要思路。前者考慮由不確定性引起的“最壞”情況,若系統(tǒng)能在此情況下穩(wěn)定運行,則對未來任何一種不確定性都能穩(wěn)定運行。但這種方法計算成本太高,且過于保守可能導(dǎo)致模型求解發(fā)散。后者通過分離控制策略,將標(biāo)稱系統(tǒng)從實際系統(tǒng)中分離出來,把對實際系統(tǒng)的控制轉(zhuǎn)化為對標(biāo)稱系統(tǒng)的控制,把系統(tǒng)狀態(tài)控制在一個狀態(tài)約束的子集(即tube)中。通過收緊狀態(tài)約束和施加擾動反饋控制來解決系統(tǒng)的不確定問題,以較低的計算成本保證約束滿足的魯棒性和穩(wěn)定性。
2、管狀模型預(yù)測控制方法能夠適應(yīng)外部環(huán)境變化和內(nèi)部模型的不穩(wěn)定性,提升系統(tǒng)的魯棒性和可靠性。然而,管狀集合的大小和形狀直接依賴于系統(tǒng)模型的不確定性范圍和噪聲水平的估計?,F(xiàn)有的管狀模型預(yù)測控制方法,無法得到外界擾動的精確范圍。同時,為了提高魯棒性,管狀模型預(yù)測控制可能會引入保守性。因此會導(dǎo)致控制器在某些情況下過于保守,限制了控制器的控制性能。
技術(shù)實現(xiàn)思路
0、
技術(shù)實現(xiàn)要素:
1、為解決上述問題,本發(fā)明提出一種基于擾動預(yù)測的無人駕駛汽車管狀模型預(yù)測控制方法。首先,根據(jù)期望的跟蹤路徑和車輛運動模型,預(yù)測未來時刻輪胎側(cè)偏剛度的非線性變化。然后,將預(yù)測值與實際值的偏差視為加性擾動,構(gòu)建擾動預(yù)測模型。最后,根據(jù)預(yù)測的擾動范圍,通過滾動預(yù)測的方法得到更緊湊的擾動多面體,對標(biāo)稱系統(tǒng)的約束進(jìn)行緊縮處理以降低傳統(tǒng)tube-mpc的保守性,實現(xiàn)路徑跟蹤控制效果。
2、本發(fā)明解決技術(shù)問題所采取的技術(shù)方案如下:
3、一種基于擾動預(yù)測的無人駕駛汽車管狀模型預(yù)測控制方法,屬于自動駕駛領(lǐng)域,其特征在于,該方法包括參考路徑模塊、擾動預(yù)測模塊、管狀模型預(yù)測控制器和車輛模型;參考路徑模塊根據(jù)道路信息得到控制器的期望路徑,包括側(cè)向位移和橫擺角,并將其輸入給擾動預(yù)測模塊和管狀模型預(yù)測控制器;在此基礎(chǔ)上,擾動預(yù)測模塊通過逆向求解車輛運動模型,預(yù)測未來時刻的輪胎側(cè)偏剛度,并將預(yù)測值與實際值的偏差視為有界擾動,從而構(gòu)建擾動預(yù)測模型來預(yù)測擾動范圍;管狀模型預(yù)測控制器根據(jù)預(yù)測的擾動范圍,離線計算魯棒不變集,并且對標(biāo)稱系統(tǒng)的約束進(jìn)行緊縮處理,在線多目標(biāo)優(yōu)化求解最優(yōu)的前輪轉(zhuǎn)角,結(jié)合狀態(tài)反饋量,得到實際控制動作輸入車輛模型,控制車輛實現(xiàn)路徑跟蹤。
4、該方法包括以下步驟:
5、步驟1、參考路徑模塊設(shè)計:根據(jù)道路信息得到控制器的期望路徑,包括側(cè)向位移和橫擺角;其過程包括以下子步驟:
6、步驟1.1、控制器規(guī)劃采用sigmoid函數(shù)法求解控制器參考的側(cè)向位移和橫擺角,得到控制器的期望路徑。
7、步驟2、擾動預(yù)測模塊設(shè)計;其過程包括以下子步驟:
8、步驟2.1、擾動預(yù)測:
9、構(gòu)建車輛動力學(xué)模型,其表達(dá)式為:
10、
11、其中,m為車輛質(zhì)量,vx為車輛的縱向速度,vy為車輛的側(cè)向速度,ωr為車輛橫擺角速度,cf、cr分別為前、后輪胎的側(cè)偏剛度,δ為前輪轉(zhuǎn)角,lf和lr分別為車輛質(zhì)心到前軸后軸的距離,iz為繞汽車質(zhì)心鉛垂軸的橫擺轉(zhuǎn)動慣量,為車輛側(cè)向速度,為車輛橫擺角,為大地坐標(biāo)系下汽車的側(cè)向速度;
12、根據(jù)公式(1),整理得:
13、
14、其中,橫擺角速度ωr與側(cè)向速度vy由式(1)整理后求導(dǎo)得到:
15、
16、將參考路徑模塊得到的參考值yref、及其對時間的一階導(dǎo)和二階導(dǎo)帶入公式(3),得到:
17、
18、因此,由公式(2)和公式(4)得到預(yù)測的前、后輪的側(cè)偏剛度為:
19、
20、其中,cf,pre、cr,pre分別為預(yù)測得到的前、后輪側(cè)偏剛度,和λf為補償附著系數(shù)影響的調(diào)節(jié)因子。
21、在公式(4)和公式(5)中引入路面附著系數(shù)調(diào)節(jié)因子,以補償附著系數(shù)對側(cè)偏剛度預(yù)測值大小的影響。
22、由于輪胎力附著極限的影響,公式(5)得到的側(cè)偏剛度值應(yīng)滿足約束:
23、
24、其中,fz,j為輪胎垂直載荷,μ為路面附著系數(shù),j=f,r分別表示前、后輪。
25、步驟2.2、擾動預(yù)測模型構(gòu)建:
26、首先,由公式(5)得到前、后輪側(cè)偏剛度的預(yù)測值cf,pre、cr,pre。將預(yù)測值與當(dāng)前時刻的實際值的偏差視為擾動得:
27、
28、因此,向前取n個參考路徑數(shù)據(jù)點,即可得到未來預(yù)測時域內(nèi)的擾動為:
29、
30、其中,函數(shù)f(·)表示公式(4)、公式(5)和公式(7)的函數(shù)關(guān)系,n=0,1,…,n。
31、預(yù)測的擾動變化量可以表示為:
32、δs(k+n|k)=s(k+n|k)-s(k+n-1|k)????????????????????????????????(9)
33、最終可得到預(yù)測時域內(nèi)的預(yù)測擾動為:
34、
35、由公式(6)可知輪胎側(cè)偏剛度的變化是有界的,因此,擾動變量有界:
36、s(k)∈[smin,smax]??????????????????????????????????(11)
37、δs(k)∈[δsmin,δsmax]??????????????????????????????????(12)
38、其中,s(k)表示在k時刻輪胎側(cè)偏剛度預(yù)測值與實際值的偏差,即k時刻的擾動;δs(k)表示k時刻的擾動變化率;smin,smax表示擾動的極限值;δsmin,δsmax表示擾動變化率的極限值。
39、因為預(yù)測值和實際值的誤差是有界的,所以預(yù)測時域內(nèi)的誤差范圍可以表示為:
40、
41、其中:
42、smin(k+n|k)=min(max(0,s(k)+nδsmax),smax)????????????????????????(14)
43、smax(k+n|k)=max(min(0,s(k)+nδsmin),smin)?????????????????????????(15)
44、根據(jù)公式(1)和公式(10)通過車輛動力學(xué)模型逆向求解,獲取標(biāo)稱系統(tǒng)和實際系統(tǒng)的狀態(tài)預(yù)測偏差(擾動)范圍為w(k)∈w。
45、步驟3、設(shè)計管狀模型預(yù)測控制控制器;其過程包括以下子步驟:
46、步驟3.1、預(yù)測模型構(gòu)建:
47、整理公式(1),得到狀態(tài)空間方程:
48、
49、其中,狀態(tài)量控制量u=δ。
50、
51、
52、將公式(16)通過零階保持的方式進(jìn)行離散化:
53、x(k+1)=adx(k)+bdu(k)(17)
54、其中,ad=eat;t為離散時間。
55、將輪胎模型的非線性視為輪胎參數(shù)的不確定性,由擾動預(yù)測模塊得到狀態(tài)預(yù)測偏差w(k)∈w。則實際被控系統(tǒng)表示為:
56、x(k+1)=adx(k)+bdu(k)+w(k)(18)
57、公式(18)為實際系統(tǒng),其狀態(tài)量x(k)∈r4,控制量u(k)∈r,有界干擾量w(k)∈r4。實際系統(tǒng)受到的約束為x(k)∈x,u(k)∈u,w(k)∈w。分離有界干擾對系統(tǒng)的影響,定義標(biāo)稱系統(tǒng):
58、z(k+1)=adz(k)+bdv(k)(19)
59、其中,為標(biāo)稱系統(tǒng)狀態(tài);v(k)=δv為標(biāo)稱系統(tǒng)控制量。
60、由公式(18)和公式(19),可得實際系統(tǒng)與標(biāo)稱系統(tǒng)的狀態(tài)量偏差為:
61、e(k)=x(k)-z(k)(20)
62、注意到,系統(tǒng)誤差e(k)由擾動項決定,定義tube-mpc控制器的控制律為:
63、u(k)=v(k)+kce(k)(21)
64、其中,v(k)=δv為標(biāo)稱系統(tǒng)優(yōu)化得到的前輪轉(zhuǎn)角,kce(k)=δk為狀態(tài)反饋控制輸入,kc∈r1×4為狀態(tài)反饋增益矩陣。該控制律通過狀態(tài)反饋計算得到系統(tǒng)偏差補償轉(zhuǎn)角,使得標(biāo)稱系統(tǒng)狀態(tài)盡量趨近于參考狀態(tài)。
65、結(jié)合公式(20)、公式(21),可得誤差系統(tǒng)的演化情況如下:
66、e(k+1)=ake(k)+w(k)(22)
67、其中,ak=ad+bdkc。
68、定義e為誤差系統(tǒng)的魯棒不變集(rpi),又稱為tube。對于任意的有界擾動,當(dāng)誤差狀態(tài)位于rpi之內(nèi),其狀態(tài)演化一定還在rpi之內(nèi):
69、
70、集合形式表示為:
71、
72、其中,表示集合之間的閔可夫斯基(minkowski)和運算。
73、則對于給定k時刻標(biāo)稱系統(tǒng)狀態(tài)z(k)和控制輸入v(k),將被約束在通過魯棒不變集e緊縮的邊界之內(nèi),可表示為:
74、
75、其中,θ表示集合之間的龐特里亞金(pontryagin)差運算。
76、步驟3.2、目標(biāo)函數(shù)構(gòu)建:
77、控制目標(biāo)是使車輛保持平穩(wěn)行駛的同時,以最小的誤差跟蹤參考路徑,并保證各狀態(tài)量、控制量不能越過約束邊界。
78、定義tube-mpc控制器的目標(biāo)函數(shù)為:
79、
80、
81、其中,n為預(yù)測時域;q,r,p分別為狀態(tài)量、控制量與終端代價的權(quán)重矩陣;x(0)為實際系統(tǒng)初始狀態(tài);z(0)為標(biāo)稱系統(tǒng)初始狀態(tài);為標(biāo)稱系統(tǒng)的參考狀態(tài)。
82、由公式(26)優(yōu)化求解獲得最優(yōu)控制序列的第一項v*(k)以及標(biāo)稱狀態(tài)量z(k),結(jié)合狀態(tài)反饋量kc(x(k)-z(k)),因此得到實際系統(tǒng)的最終控制量為:
83、u*(k)=v*(k)+kc(x(k)-z(k))(27)
84、最終,將優(yōu)化求解的控制動作輸入給車輛模型,實現(xiàn)路徑跟蹤控制。
85、本發(fā)明的有益效果是:通過對輪胎側(cè)偏剛度非線性趨勢的預(yù)測,將預(yù)測值和真實值的偏差視為擾動。通過滾動預(yù)測擾動范圍放寬標(biāo)稱系統(tǒng)約束的范圍,提高系統(tǒng)魯棒性。通過滾動預(yù)測擾動范圍降低側(cè)偏剛度變化不確定的影響,相較于現(xiàn)有的tube-mpc,有效降低了保守性,提升了控制性能。