1.一種mec賦能的低空元宇宙系統(tǒng)中基于主動(dòng)推理的優(yōu)化方法,其特征在于,通過初始化智能體全局網(wǎng)絡(luò)參數(shù)和超參數(shù),利用策略分布和轉(zhuǎn)移概率分布進(jìn)行隨機(jī)抽樣,基于主動(dòng)推理和自由能原理計(jì)算累積獎(jiǎng)勵(lì),求得自由能并對(duì)其進(jìn)行平均,生成新的策略分布,以反向傳播算法和梯度下降更新全局網(wǎng)絡(luò)參數(shù),通過反復(fù)訓(xùn)練直至算法收斂,最終實(shí)現(xiàn)智能體在元宇宙環(huán)境中的最優(yōu)聯(lián)合無人機(jī)軌跡規(guī)劃和資源卸載分配。
2.如權(quán)利要求1所述的mec賦能的低空元宇宙系統(tǒng)中基于主動(dòng)推理的優(yōu)化方法,其特征在于,包括以下步驟:
3.如權(quán)利要求2所述的mec賦能的低空元宇宙系統(tǒng)中基于主動(dòng)推理的優(yōu)化方法,其特征在于,所述s102、每個(gè)回合開始時(shí),初始狀態(tài)被設(shè)定;策略分布隨機(jī)抽樣得到j(luò)個(gè)備選策略,再由j個(gè)策略各自隨機(jī)抽樣得到j(luò)個(gè)動(dòng)作;智能體的狀態(tài)表示為:
4.如權(quán)利要求2所述的mec賦能的低空元宇宙系統(tǒng)中基于主動(dòng)推理的優(yōu)化方法,其特征在于,所述s103:基于j個(gè)備選策略得到j(luò)個(gè)條件轉(zhuǎn)移概率分布,并由對(duì)應(yīng)的j個(gè)動(dòng)作計(jì)算出對(duì)應(yīng)的當(dāng)前獎(jiǎng)勵(lì),即時(shí)獎(jiǎng)勵(lì)reward的計(jì)算公式如下:
5.如權(quán)利要求2所述的mec賦能的低空元宇宙系統(tǒng)中基于主動(dòng)推理的優(yōu)化方法,其特征在于,所述s104:根據(jù)主動(dòng)推理和自由能原理,利用累積獎(jiǎng)勵(lì)和條件轉(zhuǎn)移概率分布求得j個(gè)備選策略的自由能,其中自由能相反數(shù)的計(jì)算公式為:
6.如權(quán)利要求2所述的mec賦能的低空元宇宙系統(tǒng)中基于主動(dòng)推理的優(yōu)化方法,其特征在于,所述s108:全局網(wǎng)絡(luò)輸出自由能的預(yù)測(cè)值q(st,at;θ),求與目標(biāo)的誤差函數(shù)l(θ),用反向傳播算法與梯度下降更新全局網(wǎng)絡(luò)參數(shù);損失函數(shù)由下式給出:
7.一種實(shí)施如權(quán)利要求1-6任意一項(xiàng)所述mec賦能的低空元宇宙系統(tǒng)中基于主動(dòng)推理的優(yōu)化方法的mec賦能的低空元宇宙系統(tǒng)中基于主動(dòng)推理的優(yōu)化系統(tǒng),其特征在于,所述mec賦能的低空元宇宙系統(tǒng)中基于主動(dòng)推理的優(yōu)化系統(tǒng)包括:
8.一種計(jì)算機(jī)設(shè)備,其特征在于,所述計(jì)算機(jī)設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí),使得所述處理器執(zhí)行如權(quán)利要求1-6任意一項(xiàng)所述mec賦能的低空元宇宙系統(tǒng)中基于主動(dòng)推理的優(yōu)化方法的步驟。
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí),使得所述處理器執(zhí)行如權(quán)利要求1-6任意一項(xiàng)所述mec賦能的低空元宇宙系統(tǒng)中基于主動(dòng)推理的優(yōu)化方法的步驟。
10.一種信息數(shù)據(jù)處理終端,其特征在于,所述信息數(shù)據(jù)處理終端用于實(shí)現(xiàn)如權(quán)利要求7所述mec賦能的低空元宇宙系統(tǒng)中基于主動(dòng)推理的優(yōu)化系統(tǒng)。