本申請(qǐng)實(shí)施例涉及任務(wù)調(diào)度,尤其涉及一種基于顯式懲罰的多任務(wù)調(diào)度優(yōu)化方法和裝置。
背景技術(shù):
1、任務(wù)(或作業(yè))調(diào)度問(wèn)題是指裝置需要將一系列任務(wù)分配給有限的資源(如機(jī)器、員工、工具、時(shí)間等)進(jìn)行處理。由于資源有限,多個(gè)任務(wù)之間存在競(jìng)爭(zhēng),導(dǎo)致作業(yè)調(diào)度的優(yōu)化問(wèn)題。這類問(wèn)題通常具有多模態(tài)特性,即可能存在多個(gè)相對(duì)最優(yōu)解,代表不同的資源分配方案。
2、在任務(wù)調(diào)度中,裝置需要將多個(gè)任務(wù)合理分配到有限的資源上,這是一種多模態(tài)優(yōu)化問(wèn)題。由于資源有限且任務(wù)間存在競(jìng)爭(zhēng)關(guān)系,傳統(tǒng)的調(diào)度算法常常難以達(dá)到全局最優(yōu)解。
3、近些年來(lái),多種兼顧收斂性和多樣性的多模態(tài)優(yōu)化方法被提出并且已經(jīng)得到了應(yīng)用。第一種是小生境方法,但是小生境方法通常需要大量的計(jì)算資源,并且在參數(shù)調(diào)整上較為復(fù)雜,可能導(dǎo)致收斂速度較慢;第二種是將多模態(tài)優(yōu)化問(wèn)題轉(zhuǎn)換成多目標(biāo)優(yōu)化問(wèn)題,但多目標(biāo)優(yōu)化問(wèn)題可能導(dǎo)致目標(biāo)數(shù)量的激增,以及對(duì)pareto前沿的分析變得更為復(fù)雜。
技術(shù)實(shí)現(xiàn)思路
1、以下是對(duì)本文詳細(xì)描述的主題的概述。本概述并非是為了限制權(quán)利要求的保護(hù)范圍。
2、本公開實(shí)施例的主要目的在于提出一種基于顯式懲罰的多任務(wù)調(diào)度優(yōu)化方法和裝置,能夠解決目前流行的兩種方法的弊端,能夠加快收斂速度,確保在復(fù)雜調(diào)度環(huán)境中的穩(wěn)定性和高效性。
3、本申請(qǐng)實(shí)施例的第一方面提出了一種基于顯式懲罰的多任務(wù)調(diào)度優(yōu)化方法,所述方法包括:
4、獲取由個(gè)個(gè)體組成的第代種群;為正整數(shù),且如果,則第1代種群由待調(diào)度的任務(wù)信息對(duì)應(yīng)的種任務(wù)初始調(diào)度方案生成;
5、將第代種群作為目標(biāo)種群,并執(zhí)行種群進(jìn)化過(guò)程,所述種群進(jìn)化過(guò)程包括:
6、計(jì)算所述目標(biāo)種群中的個(gè)個(gè)體對(duì)應(yīng)的顯式懲罰函數(shù)值;其中計(jì)算所述目標(biāo)種群中的任意一個(gè)個(gè)體的顯式懲罰函數(shù)值的過(guò)程,包括:
7、;
8、其中,為個(gè)體包含的多模態(tài)函數(shù),為懲罰因子,為個(gè)體和鄰居個(gè)體之間的距離,所述鄰居個(gè)體為所述目標(biāo)種群中的比個(gè)體的多模態(tài)函數(shù)值更優(yōu)的多個(gè)個(gè)體中選取出的與個(gè)體距離最近的個(gè)體;
9、根據(jù)所述顯式懲罰函數(shù)值識(shí)別出多個(gè)峰,為所述多個(gè)峰進(jìn)行個(gè)體分配和平衡,得到多峰種群,并根據(jù)峰數(shù)量對(duì)所述多峰種群進(jìn)行全局或局部搜索,以生成由個(gè)個(gè)體組成第代種群;
10、如果小于第一閾值,則將所述第代種群作為目標(biāo)種群,并執(zhí)行所述種群進(jìn)化過(guò)程;如果大于所述第一閾值,則將所述第代種群作為所述待調(diào)度的任務(wù)信息的最優(yōu)解。
11、本申請(qǐng)?zhí)岢鲆环N基于顯式懲罰的多任務(wù)調(diào)度優(yōu)化方法,具有如下有益效果:
12、方法首先利用多樣性信息對(duì)找到的峰進(jìn)行區(qū)分;然后根據(jù)顯式懲罰函數(shù),將種群個(gè)體分配到這些峰上;接下來(lái),調(diào)整每個(gè)峰上的個(gè)體數(shù)量致平衡,以確保每個(gè)峰都能得到充分的開發(fā);此外,如果捕捉到的峰數(shù)量是否合理,選擇在每個(gè)峰附近進(jìn)行局部搜索以進(jìn)行深入開發(fā)或者,在整個(gè)決策空間內(nèi)進(jìn)行全局搜索以增強(qiáng)種群的多樣性。方法通過(guò)將個(gè)體目標(biāo)函數(shù)值(即多模態(tài)函數(shù)值)與多樣性(多樣性通過(guò)個(gè)體與其最近且更優(yōu)的鄰居之間的距離量化)相結(jié)合,構(gòu)建了一個(gè)顯式懲罰函數(shù)。該函數(shù)用于同時(shí)捕捉多個(gè)峰,并在這些峰之間實(shí)現(xiàn)搜索平衡,以加快收斂速度,提升魯棒性,確保在復(fù)雜調(diào)度環(huán)境中的穩(wěn)定性和高效性。
13、本申請(qǐng)實(shí)施例的第二方面提出了基于顯式懲罰的多任務(wù)調(diào)度優(yōu)化裝置,所述裝置包括:
14、數(shù)據(jù)獲取模塊,用于獲取由個(gè)個(gè)體組成的第代種群;為正整數(shù),且如果,則第1代種群由待調(diào)度的任務(wù)信息對(duì)應(yīng)的種任務(wù)初始調(diào)度方案生成;
15、進(jìn)化迭代模塊,用于將第代種群作為目標(biāo)種群,并執(zhí)行種群進(jìn)化過(guò)程,所述種群進(jìn)化過(guò)程包括:
16、計(jì)算所述目標(biāo)種群中的個(gè)個(gè)體對(duì)應(yīng)的顯式懲罰函數(shù)值;其中計(jì)算所述目標(biāo)種群中的任意一個(gè)個(gè)體的顯式懲罰函數(shù)值的過(guò)程,包括:
17、;
18、其中,為個(gè)體包含的多模態(tài)函數(shù),為懲罰因子,為個(gè)體和鄰居個(gè)體之間的距離,所述鄰居個(gè)體為所述目標(biāo)種群中的比個(gè)體的多模態(tài)函數(shù)值更優(yōu)的多個(gè)個(gè)體中選取出的與個(gè)體距離最近的個(gè)體;
19、根據(jù)所述顯式懲罰函數(shù)值識(shí)別出多個(gè)峰,為所述多個(gè)峰進(jìn)行個(gè)體分配和平衡,得到多峰種群,并根據(jù)峰數(shù)量對(duì)所述多峰種群進(jìn)行全局或局部搜索,以生成由個(gè)個(gè)體組成第代種群;
20、進(jìn)化判定模塊,用于如果小于第一閾值,則將所述第代種群作為目標(biāo)種群,并執(zhí)行所述種群進(jìn)化過(guò)程;如果大于所述第一閾值,則將所述第代種群作為所述待調(diào)度的任務(wù)信息的最優(yōu)解。
21、為實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例的第三方面提供一種電子設(shè)備,包括:至少一個(gè)控制處理器和用于與所述至少一個(gè)控制處理器通信連接的存儲(chǔ)器;所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)控制處理器執(zhí)行的指令,所述指令被所述至少一個(gè)控制處理器執(zhí)行,以使所述至少一個(gè)控制處理器能夠執(zhí)行上述的基于顯式懲罰的多任務(wù)調(diào)度優(yōu)化方法。
22、為實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例的第四方面提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令,所述計(jì)算機(jī)可執(zhí)行指令用于使計(jì)算機(jī)執(zhí)行上述的基于顯式懲罰的多任務(wù)調(diào)度優(yōu)化方法。
23、可以理解的是,上述第二方面至第四方面和相關(guān)技術(shù)相比存在的有益效果和上述第一方面和相關(guān)技術(shù)相比存在的有益效果相同,可以參見(jiàn)上述第一方面中的相關(guān)描述,在此不再贅述。
1.一種基于顯式懲罰的多任務(wù)調(diào)度優(yōu)化方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的基于顯式懲罰的多任務(wù)調(diào)度優(yōu)化方法,其特征在于,的取值包括:
3.根據(jù)權(quán)利要求1所述的基于顯式懲罰的多任務(wù)調(diào)度優(yōu)化方法,其特征在于,所述根據(jù)所述顯式懲罰函數(shù)值識(shí)別出多個(gè)峰,包括:
4.根據(jù)權(quán)利要求3所述的基于顯式懲罰的多任務(wù)調(diào)度優(yōu)化方法,其特征在于,所述為所述多個(gè)峰進(jìn)行個(gè)體分配,包括:
5.根據(jù)權(quán)利要求4所述基于顯式懲罰的多任務(wù)調(diào)度優(yōu)化方法,其特征在于,為所述多個(gè)峰進(jìn)行個(gè)體平衡包括:
6.根據(jù)權(quán)利要求5所述的基于顯式懲罰的多任務(wù)調(diào)度優(yōu)化方法,其特征在于,在峰上隨機(jī)生成個(gè)體的過(guò)程包括:
7.根據(jù)權(quán)利要求5所述的基于顯式懲罰的多任務(wù)調(diào)度優(yōu)化方法,其特征在于,所述根據(jù)峰數(shù)量對(duì)所述多峰種群進(jìn)行全局或局部搜索,以生成由個(gè)個(gè)體組成第代種群,包括:
8.一種基于顯式懲罰的多任務(wù)調(diào)度優(yōu)化裝置,其特征在于,所述裝置,包括:
9.一種電子設(shè)備,其特征在于,包括:至少一個(gè)控制處理器和用于與所述至少一個(gè)控制處理器通信連接的存儲(chǔ)器;所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)控制處理器執(zhí)行的指令,所述指令被所述至少一個(gè)控制處理器執(zhí)行,以使所述至少一個(gè)控制處理器能夠執(zhí)行權(quán)利要求1至7任一項(xiàng)所述的基于顯式懲罰的多任務(wù)調(diào)度優(yōu)化方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令,所述計(jì)算機(jī)可執(zhí)行指令用于使計(jì)算機(jī)執(zhí)行權(quán)利要求1至7任一項(xiàng)所述的基于顯式懲罰的多任務(wù)調(diào)度優(yōu)化方法。