本發(fā)明涉及無(wú)人飛行器協(xié)同,尤其是涉及基于改進(jìn)gwo算法的多無(wú)人飛行器協(xié)同航跡規(guī)劃方法。
背景技術(shù):
1、隨著當(dāng)今戰(zhàn)爭(zhēng)形式的復(fù)雜化,無(wú)人飛行器編隊(duì)協(xié)同作戰(zhàn)受到了各國(guó)的青睞。在協(xié)同作戰(zhàn)中,無(wú)人飛行器編隊(duì)協(xié)發(fā)明同航跡規(guī)劃技術(shù)成為了重點(diǎn)研究方向。航跡規(guī)劃是指根據(jù)協(xié)同態(tài)勢(shì)感知作戰(zhàn)環(huán)境信息,在多無(wú)人作戰(zhàn)飛機(jī)協(xié)同目標(biāo)分配方案的基礎(chǔ)上,考慮到無(wú)人飛行器間協(xié)同約束及航跡規(guī)劃約束條件,使得各架無(wú)人作戰(zhàn)飛機(jī)以最低的代價(jià)規(guī)劃出從起始點(diǎn)到目標(biāo)點(diǎn)的可行飛行航跡,使其能夠完成目標(biāo)打擊或識(shí)別任務(wù),提高多無(wú)人作戰(zhàn)飛機(jī)的整體生存能力和作戰(zhàn)效能。
2、當(dāng)前對(duì)多無(wú)人飛行器航跡規(guī)劃的研究還處于探索階段,主要研究無(wú)人飛行器編隊(duì)內(nèi)部各成員之間的協(xié)同關(guān)系。唐頌提出了一種單-雙親遺傳算法的模型來(lái)解決多無(wú)人飛行器協(xié)同航跡規(guī)劃規(guī)模大,效率低的問(wèn)題;魏明基于深度強(qiáng)化學(xué)習(xí)和a*算法的聯(lián)合使用,對(duì)無(wú)人飛行器航跡協(xié)同規(guī)劃進(jìn)行了優(yōu)化;湯淼對(duì)粒子群算法進(jìn)行了改進(jìn),加入極值變異思想,并引入頭狼召喚和優(yōu)勝劣汰機(jī)制,從而提高了算法的尋優(yōu)性能;隋東提出一種增強(qiáng)型多策略蜣螂算法的uav航跡規(guī)劃方法來(lái)解決三維航跡規(guī)劃問(wèn)題。綜上所述,目前在解決無(wú)人飛行器編隊(duì)協(xié)同航跡規(guī)劃問(wèn)題時(shí),使用的算法容易導(dǎo)致函數(shù)陷入局部最優(yōu),從而導(dǎo)致結(jié)果的穩(wěn)定性不佳。因此,本發(fā)明使用灰狼優(yōu)化算法來(lái)解決此問(wèn)題。
3、灰狼優(yōu)化算法(gwo)是mirjalili所提出的一種元啟發(fā)式算法,它模仿了自然界中灰狼的領(lǐng)導(dǎo)等級(jí)制度和狩獵機(jī)制。gwo算法具有結(jié)構(gòu)簡(jiǎn)單,需要調(diào)節(jié)的參數(shù)少,穩(wěn)定性強(qiáng),能較好的避免陷入局部最優(yōu)等優(yōu)點(diǎn)。現(xiàn)有的gwo模型在規(guī)劃領(lǐng)域中得到了廣泛的應(yīng)用,但現(xiàn)有的gwo算法相對(duì)簡(jiǎn)單,初始解對(duì)優(yōu)化結(jié)果影響較大,因此本發(fā)明提出基于改進(jìn)的gwo算法來(lái)進(jìn)行多無(wú)人飛行器協(xié)同航跡規(guī)劃。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是提供基于改進(jìn)gwo算法的多無(wú)人飛行器協(xié)同航跡規(guī)劃方法,以無(wú)人飛行器群穿越危險(xiǎn)區(qū)協(xié)同到達(dá)指定目標(biāo)地點(diǎn)的任務(wù)為背景,在保證損失最小的條件下使得無(wú)人飛行器路線最優(yōu),使用改進(jìn)后的灰狼優(yōu)化算法在多約束條件下對(duì)無(wú)人飛行器群進(jìn)行航跡規(guī)劃,通過(guò)仿真實(shí)驗(yàn)驗(yàn)證了改進(jìn)灰狼算法的有效性,并將此算法與mp-gwo、gwo算法進(jìn)行了有效對(duì)比,結(jié)果表明本發(fā)明算法的效果較好。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供了基于改進(jìn)gwo算法的多無(wú)人飛行器協(xié)同航跡規(guī)劃方法,1.基于改進(jìn)gwo算法的多無(wú)人飛行器協(xié)同航跡規(guī)劃方法,其特征在于,包括以下步驟:
3、s1、無(wú)人飛行器群約束分析,所述約束包括航程約束、飛行間距約束、飛行高度約束和時(shí)間約束;
4、s2、無(wú)人飛行器航跡代價(jià)分析,所述航跡代價(jià)包括燃油消耗代價(jià)、飛行高度代價(jià)、危險(xiǎn)區(qū)域代價(jià)、碰撞代價(jià)和時(shí)間代價(jià);
5、s3、gwo算法及改進(jìn),并基于貪婪思想和變異策略生成初始狼群;
6、s4、進(jìn)行仿真實(shí)驗(yàn)和算法性能分析。
7、優(yōu)選的,步驟s1具體包括以下步驟:
8、s11、航程約束:
9、假設(shè)無(wú)人飛行器各航段的飛行距離為li,能保證安全返航的最遠(yuǎn)航程為lmax,共飛行航段為n,因此,無(wú)人飛行器的航程不得大于最大安全距離,即:
10、
11、s12、飛行間距約束:
12、無(wú)人飛行器之間的最小距離不得小于最小安全飛行的距離,若小于最小安全距離,則視為無(wú)人飛行器碰撞,即:
13、dij≥ds????(2)
14、上式中:dij為第i架無(wú)人飛行器與第j架無(wú)人飛行器航跡點(diǎn)之間的最小距離;ds視為規(guī)定的無(wú)人飛行器之間的最小安全飛行間距;
15、s13、飛行高度約束:
16、假設(shè)無(wú)人飛行器的飛行高度最高為hmax,最低為hmin,因此飛行高度約束為:
17、hmin≤hi≤hmax????(3);
18、s14、時(shí)間約束:
19、無(wú)人飛行器需要在規(guī)定的時(shí)間內(nèi)到達(dá)目標(biāo),假設(shè)任務(wù)需要在tmax時(shí)間內(nèi)完成,因此時(shí)間約束為:
20、ti≤tmax???????(4)。
21、優(yōu)選的,步驟s2中,所述航跡代價(jià),也稱適應(yīng)度,包括燃油消耗代價(jià)、飛行高度代價(jià)、碰撞代價(jià)和危險(xiǎn)區(qū)域代價(jià);單架無(wú)人飛行器的航跡代價(jià)計(jì)算公式如下:
22、燃油消耗總代價(jià):
23、飛行高度總代價(jià):
24、危險(xiǎn)區(qū)域總代價(jià):
25、碰撞總代價(jià):
26、時(shí)間總代價(jià):
27、單機(jī)總代價(jià):
28、
29、上式中:hi為第i段航跡的海拔高度;fo表示與航跡長(zhǎng)度有關(guān)的燃油代價(jià)函數(shù);fh表示與飛行高度有關(guān)的飛行高度代價(jià)函數(shù);fd表示與航程危險(xiǎn)程度有關(guān)的危險(xiǎn)代價(jià)函數(shù);;表示無(wú)人機(jī)第i段航跡與碰撞次數(shù)有關(guān)的碰撞代價(jià)函數(shù);表示無(wú)人機(jī)第i段航跡與飛行時(shí)間有關(guān)的時(shí)間代價(jià)函數(shù);表示第j架飛機(jī)的燃油總代價(jià);表示第j架飛機(jī)的飛行高度總代價(jià);表示第j架飛機(jī)的危險(xiǎn)區(qū)域總代價(jià);表示第j架飛機(jī)的碰撞總代價(jià);表示第j架飛機(jī)的時(shí)間總代價(jià);ω1,ω2,ω3,ω4,ω5為加權(quán)系數(shù),ω1+ω2+ω3+ω4+ω5=1;
30、則多無(wú)人飛行器的航跡代價(jià)計(jì)算公式為:
31、
32、上式中:n為無(wú)人飛行器的數(shù)量;ω1,ω2,ω3,ω4,ω5為各個(gè)代價(jià)的權(quán)重;
33、無(wú)人飛行器在飛行中的速度用總航程的平均速度來(lái)表示,因此單機(jī)的燃油代價(jià)函數(shù)fo用固定比例的飛行距離表示,即:
34、
35、上式中:ρ為一公里油耗量,k為航點(diǎn),xk,yk,zk分別為第k個(gè)航點(diǎn)的橫坐標(biāo)、縱坐標(biāo)和豎坐標(biāo);
36、若無(wú)人飛行器飛行高度過(guò)高或過(guò)低,則會(huì)通過(guò)fh函數(shù)增加代價(jià),即:
37、
38、上式中:a1、a2為增加因子;
39、若無(wú)人飛行器經(jīng)過(guò)危險(xiǎn)區(qū)域,則會(huì)通過(guò)fd函數(shù)增加危險(xiǎn)代價(jià),即:
40、
41、上式中:dgrj是危險(xiǎn)區(qū)域的危險(xiǎn)程度;mxj,myj為第j個(gè)危險(xiǎn)區(qū)域的圓心坐標(biāo),如果dgrj小于危險(xiǎn)區(qū)域的半徑,則說(shuō)明無(wú)人飛行器飛進(jìn)了危險(xiǎn)區(qū)域;
42、若無(wú)人飛行器發(fā)生碰撞,則會(huì)通過(guò)fe函數(shù)增加代價(jià),即:
43、
44、若無(wú)人飛行器抵達(dá)目標(biāo)的時(shí)間過(guò)長(zhǎng),則會(huì)通過(guò)ft函數(shù)增加代價(jià),即:
45、
46、優(yōu)選的,步驟s3中,所述gwo算法通過(guò)模擬灰狼種群的等級(jí)結(jié)構(gòu)和捕獵行為來(lái)優(yōu)化搜索目標(biāo),利用α、β、δ和ω四種類型的灰狼來(lái)模擬社會(huì)等級(jí)關(guān)系;
47、具體的:
48、gwo算法首先在搜索空間中隨機(jī)生成灰狼族群;
49、將適應(yīng)度值最優(yōu)、次優(yōu)和第三優(yōu)的解分別看作α狼、β狼和δ狼,而剩余的解被視為ω狼;
50、然后由α狼、β狼和δ狼來(lái)負(fù)責(zé)引導(dǎo)捕獵,ω狼則跟隨著前面三種狼;
51、灰狼搜索獵物時(shí)會(huì)逐漸地接近獵物,此行為的數(shù)學(xué)模型如下:
52、d=|c*xp(t)-x(t)|????????????????????(19)
53、x(t+1)=xp(t)-a*d??????????????????(20)
54、a=2a*r1-a????(21)
55、c=2r2????(22)
56、上式中:t為當(dāng)前迭代次數(shù);a和c為協(xié)同系數(shù)向量;xp(t)表示獵物的位置向量;x(t)是當(dāng)前灰狼的位置向量;a在整個(gè)貼袋過(guò)程中由2線性降到0;r1和r2是[0,1]中的隨機(jī)向量;
57、灰狼能夠辨認(rèn)獵物的潛在位置,狩獵由α狼引導(dǎo),但灰狼并不知道獵物的確切位置,為了模擬灰狼的狩獵行為,假設(shè)α狼、β狼和δ狼具有更多關(guān)于獵物潛在位置的信息,因此,在每次迭代中,記錄迄今為止獲得的三個(gè)最優(yōu)解,迫使ω狼根據(jù)以下公式更新其位置:
58、
59、其中xα,xβ,xδ代表當(dāng)前迭代中α狼、β狼和δ狼的位置向量,c1,c2,c3為隨機(jī)向量,dα,dβ,dδ代表其他個(gè)體與α狼,β狼,δ狼之間的距離,x(t+1)為更新后的位置向量;
60、生成新的族群后,對(duì)族群元素進(jìn)行邊界控制,并完成一輪迭代;反復(fù)執(zhí)行上述步驟直至滿足算法的終止條件,即達(dá)到預(yù)先設(shè)定的最大迭代次數(shù),然后輸出最佳解決方案;
61、適應(yīng)度值的函數(shù)模型為:
62、
63、聚類分析的過(guò)程為:
64、首先選擇k=5個(gè)初始聚類中心;然后通過(guò)公式(27)計(jì)算每個(gè)數(shù)據(jù)點(diǎn)與每個(gè)聚類中心的距離,將每個(gè)數(shù)據(jù)點(diǎn)分配給最近的聚類中心;其次通過(guò)公式(28)重新計(jì)算每個(gè)聚類的中心;最后進(jìn)行迭代直到達(dá)到最大迭代次數(shù)。
65、
66、上式中,x是數(shù)據(jù)點(diǎn),ci是第i個(gè)聚類中心,d是數(shù)據(jù)的維度,xj和cij分別是x,ci在第j維上的值。
67、
68、上式中,si是第i個(gè)聚類的數(shù)據(jù)點(diǎn)集合,|si|是該集合中數(shù)據(jù)點(diǎn)的數(shù)量。
69、優(yōu)選的,對(duì)gwo算法進(jìn)行改進(jìn),具體包括以下步驟:
70、s31、設(shè)置灰狼種群規(guī)模和最大迭代步數(shù),采用基于貪婪思想和引入變異策略的方式生成初始狼群,初始化參數(shù)a,α狼,β狼和δ狼;
71、s32、對(duì)所有的航跡種群進(jìn)行k-means聚類;
72、s33、根據(jù)公式(26)計(jì)算子種群中每個(gè)灰狼個(gè)體的適應(yīng)度值;
73、s34、將各個(gè)子種群里最優(yōu)的適應(yīng)度值與α狼,β狼和δ狼的適應(yīng)度值進(jìn)行比較,篩選出當(dāng)前迭代期間的各個(gè)子種群的最優(yōu)解α,優(yōu)解β和次優(yōu)解δ,記錄它們對(duì)應(yīng)的航點(diǎn)位置;
74、s35、子種群里的每一個(gè)灰狼個(gè)體根據(jù)公式(25)更新位置;
75、s36、根據(jù)公式(21)和公式(22)計(jì)算各子種群三個(gè)優(yōu)解的a、a和c;
76、s37、在達(dá)到預(yù)先設(shè)定的最大迭代次數(shù)時(shí),輸出最佳協(xié)同航跡和相應(yīng)的最優(yōu)適應(yīng)度值;否則返回步驟s32。
77、因此,本發(fā)明采用上述基于改進(jìn)gwo算法的多無(wú)人飛行器協(xié)同航跡規(guī)劃方法,有益效果如下:
78、(1)本發(fā)明針對(duì)gwo算法初始化效果差的情況,使用貪婪算法和變異策略,降低了無(wú)人飛行器航跡初始化時(shí)的適應(yīng)度值。
79、(2)本發(fā)明引入了k-means聚類的方法,將無(wú)人飛行器航跡分為多個(gè)子種群,讓每個(gè)子種群進(jìn)行單獨(dú)優(yōu)化,此方法可以在搜索解空間的不同區(qū)域?qū)ふ医?,隨著迭代的進(jìn)行,不同種群之間允許個(gè)體之間的信息交流和遷移,以加強(qiáng)全局搜索能力,避免陷入局部最優(yōu)解。
80、(3)通過(guò)對(duì)比改進(jìn)gwo、mp-gwo與gwo三種算法,結(jié)果表明,本發(fā)明所提改進(jìn)gwo算法計(jì)算出的航跡相比于其它兩種算法,航跡代價(jià)較小、收斂精度更高。
81、下面通過(guò)附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。