本發(fā)明涉及一種基于神經(jīng)網(wǎng)絡(luò)增強的路徑與軌跡協(xié)同優(yōu)化方法、裝置、介質(zhì)及產(chǎn)品,屬于交通與人工智能交叉。
背景技術(shù):
1、在機場場面等有規(guī)劃運行空間中,為了提升運行的安全性和效率,路徑與軌跡的協(xié)同優(yōu)化成為了關(guān)鍵的技術(shù)需求。現(xiàn)有技術(shù)中,路徑與軌跡的優(yōu)化過程通常被分為兩個相對獨立的步驟。首先,利用最短路算法為航空器或地面車輛分配最優(yōu)路徑。隨后,基于已確定的路徑,進行詳細的軌跡規(guī)劃,以確保運行過程符合既定的安全標(biāo)準(zhǔn)和效率要求。這種分步優(yōu)化的方法在一定程度上簡化了計算過程,使得路徑與軌跡的優(yōu)化能夠在有限的計算資源下得以實現(xiàn)。
2、然而,現(xiàn)有技術(shù)的這種分步優(yōu)化方法存在明顯的不足。首先,路徑與軌跡的優(yōu)化過程缺乏足夠的協(xié)同性,導(dǎo)致優(yōu)化結(jié)果并非全局最優(yōu)。由于路徑規(guī)劃和軌跡規(guī)劃是分開進行的,因此很難在兩者之間找到最佳的平衡點,從而影響了整體運行效果。其次,實際運行過程中需要考慮的優(yōu)化目標(biāo)往往不止一個,可能包括時間、能耗、污染物排放等多個方面,這些目標(biāo)之間經(jīng)常存在沖突,使得路徑與軌跡優(yōu)化問題的復(fù)雜性顯著增加。此外,由于實際運行過程中不可避免存在軌跡跟蹤誤差,對路徑與軌跡優(yōu)化的魯棒性也提出了更高要求。然而,現(xiàn)有技術(shù)中缺乏有效的多目標(biāo)魯棒協(xié)同優(yōu)化方法,難以有效處理多個存在沖突的優(yōu)化目標(biāo)與軌跡跟蹤誤差導(dǎo)致的不確定性,確保路徑與軌跡的魯棒最優(yōu)性。因此,開發(fā)一種有效的路徑與軌跡多目標(biāo)魯棒協(xié)同優(yōu)化方法顯得尤為重要。
3、公開于該背景技術(shù)部分的信息僅僅旨在增加對本發(fā)明的總體背景的理解,而不應(yīng)當(dāng)被視為承認或以任何形式暗示該信息構(gòu)成已為本領(lǐng)域普通技術(shù)人員所公知的現(xiàn)有技術(shù)。
技術(shù)實現(xiàn)思路
1、本發(fā)明所要解決的技術(shù)問題是:解決目前路徑與軌跡多目標(biāo)魯棒協(xié)同優(yōu)化的不足。
2、為解決上述技術(shù)問題,本發(fā)明是采用下述技術(shù)方案實現(xiàn)的。
3、第一方面,本發(fā)明提供一種基于神經(jīng)網(wǎng)絡(luò)增強的路徑與軌跡協(xié)同優(yōu)化方法,其特征在于,包括:
4、獲取移動目標(biāo)的起止節(jié)點以及待求解問題的圖結(jié)構(gòu);
5、根據(jù)所述移動目標(biāo)的起止節(jié)點以及待求解問題的圖結(jié)構(gòu),基于預(yù)先訓(xùn)練的協(xié)同優(yōu)化模型,進行尋優(yōu),得到待求解問題的魯棒帕累托前沿;
6、其中,所述協(xié)同優(yōu)化模型的訓(xùn)練方法與尋優(yōu)方法包括:
7、獲取移動目標(biāo)的歷史起止節(jié)點以及歷史待求解問題的圖結(jié)構(gòu)作為訓(xùn)練樣本;
8、根據(jù)所述訓(xùn)練樣本,利用監(jiān)督學(xué)習(xí)方法進行訓(xùn)練,確定變分自編碼網(wǎng)絡(luò)模型參數(shù)與編碼器生成隱空間特征向量的隱空間;
9、進行尋優(yōu)時,獲取移動目標(biāo)的起止節(jié)點以及待求解問題的圖結(jié)構(gòu);
10、基于預(yù)先訓(xùn)練的變分自編碼網(wǎng)絡(luò)模型,隨機選取隱空間特征向量,根據(jù)移動目標(biāo)的起止節(jié)點以及待求解問題的圖結(jié)構(gòu)生成候選路徑集;
11、獲取候選路徑集中每條候選路徑的理想速度曲線,利用基于深度神經(jīng)網(wǎng)絡(luò)的軌跡生成模型,生成軌跡集;
12、重復(fù)以下步驟,直到尋優(yōu)計算的時間超過閾值:
13、對隱空間特征向量進行變異與交叉計算,得到新的隱空間特征向量;
14、根據(jù)新的隱空間特征向量以及移動目標(biāo)的起止節(jié)點與待求解問題的圖結(jié)構(gòu),基于預(yù)先訓(xùn)練的變分自編碼網(wǎng)絡(luò)模型,生成新的候選路徑集;
15、獲取新的候選路徑集中每條候選路徑的理想速度曲線,利用基于深度神經(jīng)網(wǎng)絡(luò)的軌跡生成模型,生成新的軌跡集;
16、在所述軌跡集和新的軌跡集中篩選魯棒有效解,得到魯棒有效軌跡集合;
17、保留魯棒有效軌跡集合中優(yōu)勢個體對應(yīng)的隱空間特征向量,同時將候選路徑集更新為優(yōu)勢個體對應(yīng)的候選路徑;
18、尋優(yōu)計算結(jié)束后,將最終得到的魯棒有效軌跡集合作為路徑與軌跡協(xié)同優(yōu)化的魯棒帕累托前沿。
19、進一步地,所述協(xié)同優(yōu)化模型包括:
20、變分自編碼網(wǎng)絡(luò)模型,包括編碼器和解碼器;
21、所述編碼器用于將移動目標(biāo)的每條路徑編碼為以圖結(jié)構(gòu)和起止節(jié)點為條件的隱空間特征向量;
22、所述解碼器用于利用編碼器生成的以圖結(jié)構(gòu)與起止節(jié)點為條件的隱空間特征向量,逐步生成候選路徑的節(jié)點序列;
23、基于深度神經(jīng)網(wǎng)絡(luò)的軌跡生成模型,用于接收每條候選路徑的理想速度曲線,生成符合移動目標(biāo)運動特性的軌跡集。
24、進一步地,基于預(yù)先訓(xùn)練的變分自編碼網(wǎng)絡(luò)模型,隨機選取隱空間特征向量,根據(jù)移動目標(biāo)的起止節(jié)點以及待求解問題的圖結(jié)構(gòu)生成候選路徑集,包括:
25、將選取的隱空間特征向量輸入解碼器,以移動目標(biāo)的起止節(jié)點以及待求解問題的圖結(jié)構(gòu)為條件,生成候選路徑;
26、利用多個隱空間特征向量,生成多條候選路徑,形成候選路徑集。
27、進一步地,對隱空間特征向量進行變異與交叉計算,得到新的隱空間特征向量,包括:
28、從當(dāng)前隱空間特征向量中隨機選擇三個不同的隱空間特征向量,作為第一個體、第二個體和第三個體;
29、計算第一個體和第二個體之間的差異;
30、將第一個體和第二個體之間的差異加入第三個體,生成變異個體;
31、利用變異個體與第三個體進行交叉操作,隨機選擇交叉點交換變異個體和第三個體中的基因片段,生成后代個體;
32、將所述后代個體作為新的隱空間特征向量。
33、進一步地,所述計算第一個體和第二個體之間的差異的計算表達式為:
34、(1);
35、式中,表示第一個體和第二個體之間的差異,表示第一個體,表示第二個體。
36、進一步地,所述生成變異個體的計算表達式為:
37、(2);
38、式中,表示變異個體,表示第三個體。
39、進一步地,所述魯棒有效解的定義,包括:
40、對于所述軌跡集中的任意軌跡x:
41、當(dāng)存在其他軌跡y滿足以下條件時,其他軌跡y支配任意軌跡x,任意軌跡x為非魯棒有效解:
42、其他軌跡y屬于所述軌跡集;
43、其他軌跡y在概率空間u上的代價值不大于任意軌跡x在概率空間u上的代價值;
44、存在特定變量屬于概率空間u,使其他軌跡y在特定變量下的代價值小于任意軌跡x在特定變量下的代價值;
45、當(dāng)任意軌跡x不被軌跡集中的其他任何軌跡支配,并且滿足候選路徑上的時間窗約束時,任意軌跡x被視為魯棒有效解。
46、第二方面,本發(fā)明提供一種計算機裝置,包括存儲器、處理器及存儲在存儲器上的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序以實現(xiàn)第一方面所述方法的步驟。
47、第三方面,本發(fā)明提供一種計算機可讀存儲介質(zhì),其上存儲有計算機程序/指令,其特征在于,該計算機程序/指令被處理器執(zhí)行時實現(xiàn)第一方面所述方法的步驟。
48、第四方面,本發(fā)明提供一種計算機程序產(chǎn)品,包括計算機程序/指令,其特征在于,該計算機程序/指令被處理器執(zhí)行時實現(xiàn)第一方面所述方法的步驟。
49、與現(xiàn)有技術(shù)相比,本發(fā)明所達到的有益效果:
50、本發(fā)明通過獲取移動目標(biāo)的起止節(jié)點以及待求解問題的圖結(jié)構(gòu),能夠全面理解移動目標(biāo)的運行需求和限制條件。在此基礎(chǔ)上,利用預(yù)先訓(xùn)練的協(xié)同優(yōu)化模型,本發(fā)明實現(xiàn)了路徑與軌跡的協(xié)同優(yōu)化,并成功獲取了路徑與軌跡協(xié)同優(yōu)化的魯棒帕累托前沿。本發(fā)明提供的方法創(chuàng)新且有效克服了現(xiàn)有技術(shù)中路徑與軌跡優(yōu)化相對獨立、缺乏協(xié)同性的不足,顯著提升了優(yōu)化結(jié)果的全局最優(yōu)性。通過綜合考慮多個優(yōu)化目標(biāo),如時間、能耗和污染物排放等,本發(fā)明的方法能夠在滿足這些目標(biāo)的同時,確保移動目標(biāo)的運行既安全又高效。此外,由于引入了魯棒帕累托前沿的概念,本發(fā)明的方法在面臨軌跡跟蹤誤差等不確定性因素時,仍能保持較高的魯棒性和穩(wěn)定性,從而確保移動目標(biāo)的穩(wěn)定運行。
51、本發(fā)明提供的協(xié)同優(yōu)化模型訓(xùn)練方法獨特且高效。通過獲取移動目標(biāo)的歷史起止節(jié)點以及歷史待求解問題的圖結(jié)構(gòu)作為訓(xùn)練樣本,能夠充分利用歷史數(shù)據(jù)中的信息,提升模型的訓(xùn)練效果和泛化能力。本發(fā)明利用預(yù)先訓(xùn)練的變分自編碼網(wǎng)絡(luò)模型的隱空間特征向量生成候選路徑集,不僅降低了計算復(fù)雜度,還提高了候選路徑生成的多樣性和準(zhǔn)確性。本發(fā)明還通過獲取候選路徑的理想速度曲線,并利用基于深度神經(jīng)網(wǎng)絡(luò)的軌跡生成模型生成軌跡集,進一步實現(xiàn)了軌跡的精細化規(guī)劃。在迭代優(yōu)化過程中,本發(fā)明通過對隱空間特征向量進行變異與交叉計算,不斷探索新的優(yōu)化空間,直至達到時間閾值。最終,通過篩選符合魯棒有效性的優(yōu)勢個體,得到協(xié)同優(yōu)化的魯棒帕累托前沿。本發(fā)明的方法能夠持續(xù)輸出高質(zhì)量、魯棒的路徑與軌跡優(yōu)化方案,也為后續(xù)的動態(tài)運行決策提供了有力支持。