1.一種基于強(qiáng)化學(xué)習(xí)的多無(wú)人機(jī)航跡動(dòng)態(tài)規(guī)劃與協(xié)同避障方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于強(qiáng)化學(xué)習(xí)的多無(wú)人機(jī)航跡動(dòng)態(tài)規(guī)劃與協(xié)同避障方法,其特征在于:所述步驟s1中,城市低空三維柵格地圖的構(gòu)建方法包括:
3.根據(jù)權(quán)利要求1所述的一種基于強(qiáng)化學(xué)習(xí)的多無(wú)人機(jī)航跡動(dòng)態(tài)規(guī)劃與協(xié)同避障方法,其特征在于:所述步驟s2中,無(wú)人機(jī)初始四維航跡的構(gòu)建方法包括:
4.根據(jù)權(quán)利要求1所述的一種基于強(qiáng)化學(xué)習(xí)的多無(wú)人機(jī)航跡動(dòng)態(tài)規(guī)劃與協(xié)同避障方法,其特征在于:所述步驟s3中,實(shí)時(shí)障礙物檢測(cè)與互惠速度障礙物計(jì)算方法具體包括:
5.根據(jù)權(quán)利要求4所述的一種基于強(qiáng)化學(xué)習(xí)的多無(wú)人機(jī)航跡動(dòng)態(tài)規(guī)劃與協(xié)同避障方法,其特征在于:所述步驟s32中,無(wú)人機(jī)在保持當(dāng)前速度、或在一定速度范圍內(nèi)進(jìn)行移動(dòng)時(shí),可能會(huì)與其他無(wú)人機(jī)發(fā)生碰撞的區(qū)域,該區(qū)域被定義為一系列速度向量集合,當(dāng)無(wú)人機(jī)采取該集合內(nèi)的速度向量時(shí),將導(dǎo)致碰撞;
6.根據(jù)權(quán)利要求1所述的一種基于強(qiáng)化學(xué)習(xí)的多無(wú)人機(jī)航跡動(dòng)態(tài)規(guī)劃與協(xié)同避障方法,其特征在于:所述步驟s4中,時(shí)間序列神經(jīng)網(wǎng)絡(luò)模型考慮時(shí)間依賴(lài)性和空間相關(guān)性,通過(guò)引入循環(huán)神經(jīng)網(wǎng)絡(luò)rnn或長(zhǎng)短期記憶網(wǎng)絡(luò)lstm等結(jié)構(gòu)來(lái)捕捉無(wú)人機(jī)狀態(tài)、觀測(cè)空間隨時(shí)間的動(dòng)態(tài)變化,并輸出無(wú)人機(jī)控制指令;模型訓(xùn)練過(guò)程采用了模擬環(huán)境與實(shí)際飛行數(shù)據(jù)相結(jié)合的方式,以提高模型的泛化能力和魯棒性;同時(shí),通過(guò)不斷迭代優(yōu)化,使模型能夠在復(fù)雜多變的城市環(huán)境中實(shí)現(xiàn)高效、安全的自主導(dǎo)航與避障。
7.根據(jù)權(quán)利要求1所述的一種基于強(qiáng)化學(xué)習(xí)的多無(wú)人機(jī)航跡動(dòng)態(tài)規(guī)劃與協(xié)同避障方法,其特征在于:所述步驟s6中,初始航跡動(dòng)態(tài)調(diào)整與優(yōu)化的具體方法為:在無(wú)人機(jī)運(yùn)行時(shí),記錄無(wú)人機(jī)在每個(gè)時(shí)間步的位置,若在所有無(wú)人機(jī)到達(dá)目標(biāo)點(diǎn)后,航路網(wǎng)內(nèi)無(wú)無(wú)人機(jī)相撞或安全間隔不滿(mǎn)足要求的情況發(fā)生,且無(wú)人機(jī)到達(dá)時(shí)刻與偏離初始航跡的程度滿(mǎn)足要求,則將所有無(wú)人機(jī)的位置-時(shí)間序列作為新的四維航跡集合。