本發(fā)明涉及嵌入式系統(tǒng)的電源管理,尤其涉及一種基于能量中性感知的ehes電源管理方法及系統(tǒng)。
背景技術(shù):
1、近年來,小型嵌入式設(shè)備的使用越來越廣泛,在我們的生活中越來越重要,涵蓋了智慧城市、健康檢測、工業(yè)監(jiān)測、農(nóng)業(yè)物聯(lián)網(wǎng)以及可穿戴設(shè)備等領(lǐng)域。電池作為嵌入式設(shè)備的一個(gè)重要的組件,一直是它的主要驅(qū)動(dòng)之一?,F(xiàn)今,有些嵌入式設(shè)備部署在人跡罕至的地區(qū),替換與維護(hù)比較困難,并且電池的壽命有限且維護(hù)成本高,因而限制了設(shè)備的持久運(yùn)行。為解決這一問題,從環(huán)境中獲取能量(如太陽能、機(jī)械能、動(dòng)力學(xué)等)是一種可行的解決方案,能量收集技術(shù)通過能量收集器將環(huán)境能量轉(zhuǎn)換為電能為小型嵌入式設(shè)備供電,從而實(shí)現(xiàn)小型嵌入式設(shè)備的永久運(yùn)行。這種從環(huán)境中收集能量并將能量存儲(chǔ)在能量存儲(chǔ)單元的嵌入式系統(tǒng)被定義為能量收集嵌入式系統(tǒng),它的組成包括傳統(tǒng)的嵌入式系統(tǒng)組件以及能量管理組件。在使用能量收集供能的嵌入式系統(tǒng)中,一個(gè)重要的挑戰(zhàn)是使嵌入式設(shè)備在能量消耗和能量收集之間達(dá)到平衡,使得系統(tǒng)能夠在不依賴于外部電源的情況下持續(xù)運(yùn)行,這種模式被稱為能量中性運(yùn)行。
2、能量收集過程的動(dòng)態(tài)特性表現(xiàn)為非線性變化,這一現(xiàn)象在諸如太陽能收集等場景中尤為顯著。太陽能收集系統(tǒng)的輸出功率受到季節(jié)性光照強(qiáng)度波動(dòng)及云層遮擋等環(huán)境因素的影響,導(dǎo)致能量供應(yīng)呈現(xiàn)出非線性的動(dòng)態(tài)波動(dòng)特性,這種能量收集器所收集能量的非線性動(dòng)態(tài)變化,可能引發(fā)系統(tǒng)因能量供應(yīng)不足而暫時(shí)失效,或因能量過剩而導(dǎo)致能量浪費(fèi)的問題。傳統(tǒng)的電源管理策略,例如動(dòng)態(tài)電壓頻率調(diào)節(jié)(dynamic?voltage?and?frequencyscaling,dvfs)和動(dòng)態(tài)電源管理(dynamic?power?management,dpm),在處理能量收集嵌入式設(shè)備時(shí)顯示出其局限性。這些策略主要側(cè)重于通過調(diào)節(jié)電壓和頻率來降低能耗,而未能充分考慮設(shè)備的實(shí)時(shí)能量供應(yīng)能力,在適應(yīng)能量收集的動(dòng)態(tài)性方面存在不足,極易造成能量浪費(fèi)或系統(tǒng)間歇性的運(yùn)行程序。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明提供一種基于能量中性感知的ehes電源管理方法及系統(tǒng),充分考慮設(shè)備的實(shí)時(shí)能量供應(yīng)能力,依據(jù)能量中性距離感知能量中性狀態(tài),通過調(diào)節(jié)任務(wù)執(zhí)行的電壓和頻率,使嵌入式系統(tǒng)的能量消耗和收集達(dá)到平衡,從而縮短能量中性距離,實(shí)現(xiàn)能量中性運(yùn)行。
2、本發(fā)明實(shí)施例解決其技術(shù)問題所采用的技術(shù)方案是:
3、一種基于能量中性感知的ehes電源管理方法,包括:
4、步驟s1,定義系統(tǒng)能量模型,所述系統(tǒng)能量模型由能量收集模型、能量存儲(chǔ)模型、電源管理模型以及能量消耗模型組成;定義任務(wù)序列γ={τ1,τ2,…,τi},其中,τi為第i個(gè)執(zhí)行的任務(wù),每個(gè)任務(wù)τi的需求向量ri={tai,ci,di,ti,wi,<fi,ui>},其中tai表示任務(wù)的開始時(shí)間,ci表示任務(wù)執(zhí)行時(shí)長,di表示任務(wù)截止時(shí)間,ti表示任務(wù)周期,<fi,ui>表示為cpu工作時(shí)可執(zhí)行的頻率/電壓對,假設(shè)cpu有n個(gè)離散的執(zhí)行頻率,則fi∈{f1,f2,…,fn},并且一個(gè)頻率fi對應(yīng)一個(gè)電壓ui;wi為任務(wù)的負(fù)載,表示任務(wù)執(zhí)行所需要的時(shí)鐘周期數(shù);
5、步驟s2,定義能量中性感知模型<ed(i),es(i),enth,edead,emax>,其中ed(i)為任務(wù)τi執(zhí)行之前的能量中性距離,es(i)為任務(wù)τi執(zhí)行之前的剩余能量,enth為能量中性值,edead為系統(tǒng)死亡最低能量,emax為存儲(chǔ)最大能量;
6、步驟s3,系統(tǒng)初始化,獲取調(diào)度執(zhí)行的任務(wù)序列與系統(tǒng)當(dāng)前的電池能量水平等初始狀態(tài),初始化actor網(wǎng)絡(luò)與critic網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù);
7、步驟s4,定義任務(wù)τi執(zhí)行之前的能量中性距離ed(i)、任務(wù)τi-1執(zhí)行時(shí)的能量收集情況eharvest(i-1)與即將要執(zhí)行的任務(wù)序列γ中的任務(wù)τi構(gòu)成狀態(tài)s(i),s(i)=[ed(i),eharvest(i-1),τi];
8、步驟s5,將所述狀態(tài)s(i)送入智能體,智能體根據(jù)所述狀態(tài)s(i)輸出動(dòng)作a(i),a(i)=[fi,ui],i∈[0,n],其中,a(i)為執(zhí)行s(i)所對應(yīng)的任務(wù)τi所需要的頻率fi和電壓ui;
9、步驟s6,系統(tǒng)通過dvfs技術(shù),根據(jù)所述a(i)對應(yīng)的<fi,ui>調(diào)節(jié)當(dāng)前執(zhí)行任務(wù)的頻率和電壓,使系統(tǒng)實(shí)現(xiàn)能量中性運(yùn)行;
10、步驟s7,在執(zhí)行動(dòng)作a(i)后,根據(jù)任務(wù)τi是否成功執(zhí)行、當(dāng)前能量中性狀態(tài)與任務(wù)執(zhí)行的電壓頻率,給出一個(gè)即時(shí)獎(jiǎng)勵(lì)r(i);
11、步驟s8,使用critic網(wǎng)絡(luò)估算當(dāng)前狀態(tài)的狀態(tài)價(jià)值,并計(jì)算td誤差δ(i);
12、步驟s9,使用隨機(jī)梯度下降法,以β為critic學(xué)習(xí)率更新critic網(wǎng)絡(luò)參數(shù)使critic網(wǎng)絡(luò)的預(yù)測損失達(dá)到最小,實(shí)現(xiàn)critic網(wǎng)絡(luò)更新,其中,critic網(wǎng)絡(luò)的預(yù)測損失函數(shù)lc=(δ(i))2;
13、步驟s10,使用隨機(jī)梯度下降法以α為actor學(xué)習(xí)率更新actor網(wǎng)絡(luò)參數(shù),使actor網(wǎng)絡(luò)的預(yù)測損失達(dá)到最小,實(shí)現(xiàn)actor網(wǎng)絡(luò)更新,其中,actor網(wǎng)絡(luò)的預(yù)測損失函數(shù)la=-πθ(s(i),a(i))δ(i);
14、步驟s11,更新環(huán)境狀態(tài),獲取i+1時(shí)隙執(zhí)行任務(wù)τi+1之前的環(huán)境狀態(tài),即s(i)=s(i+1),s(i+1)=[ed(i+1),eharvest(i),τi+1],并進(jìn)一步基于更新后的環(huán)境狀態(tài)執(zhí)行下一個(gè)任務(wù)τi+1;
15、步驟s12,重復(fù)執(zhí)行步驟s4-步驟s11,直至任務(wù)序列γ中所有任務(wù)執(zhí)行完畢。
16、較優(yōu)地,所述步驟s1中的所述系統(tǒng)能量模型中:
17、能量收集模型:將[t1,t2]時(shí)間間隔內(nèi)收集到的能量定義eharvest為:
18、
19、其中,ph(t)為在t時(shí)刻能量收集的功率;
20、能量存儲(chǔ)模型:在t時(shí)刻存儲(chǔ)單元中存儲(chǔ)的能量estorage定義為:
21、estorage(t+1)=estorage(t)+eharvest(t)-ec(t)
22、當(dāng)存儲(chǔ)的能量超過能量存儲(chǔ)單元的存儲(chǔ)容量時(shí),定義當(dāng)前時(shí)隙t存儲(chǔ)的能量為:
23、estorage(t)=min(estorage(t),emax)
24、其中,emax是系統(tǒng)所能存儲(chǔ)的最大能量;
25、電源管理模型:處理器以頻率f執(zhí)行任務(wù)的動(dòng)態(tài)功耗pd定義為:
26、pd=c×v2×f
27、式中,c是電容,v是電路電壓,f為執(zhí)行任務(wù)時(shí)的cpu頻率;
28、能量消耗模型:完成每個(gè)任務(wù)τi所需要的能耗ec為:
29、ec=pd×ci
30、式中,任務(wù)τi的執(zhí)行時(shí)長ci的計(jì)算公式為:
31、ci=wi×1/fi
32、式中,wi表示執(zhí)行任務(wù)τi所需要的時(shí)鐘周期總數(shù),1/fi表示在頻率fi下每個(gè)時(shí)鐘周期的時(shí)間長度。
33、較優(yōu)地,所述步驟s2中,基于所述能量中性感知模型<ed(i),es(i),enth,edead,emax>,嵌入式設(shè)備在一段時(shí)間t內(nèi)收集到的能量為eharvest,消耗的能量為ec,能量中性運(yùn)行表述為:
34、
35、其中,e0為存儲(chǔ)單元初始的能量水平;
36、能量中性值enth的公式表述為:
37、
38、ed(i)表示es(i)與能量中性值enth的相對距離,公式表述為:
39、ed(i)=es(i)-enth。
40、較優(yōu)地,所述步驟s7中即時(shí)獎(jiǎng)勵(lì)r(i)的函數(shù)表達(dá)式為:
41、
42、其中,tai+ci≤di表示任務(wù)在截止日期之前完成,此時(shí)r(i)為正獎(jiǎng)勵(lì),tai+ci>di表示任務(wù)錯(cuò)過截止日期而執(zhí)行失敗,此時(shí)r(i)為負(fù)獎(jiǎng)勵(lì);
43、式中,是能量中性距離獎(jiǎng)勵(lì)函數(shù),獎(jiǎng)勵(lì)值的范圍為(0,為任務(wù)執(zhí)行的頻率與電壓獎(jiǎng)勵(lì)函數(shù),智能體根據(jù)狀態(tài)給出任務(wù)執(zhí)行的<fi,ui>,dvfs通過調(diào)節(jié)電壓和頻率,縮短能量中性距離,實(shí)現(xiàn)能量中性,獎(jiǎng)勵(lì)值的范圍為(0,1)。
44、較優(yōu)地,所述步驟s8中td誤差δ(i)的計(jì)算公式表述為:
45、δ(i)=r(i)+γvw(s(i+1))-vw(s(i))
46、式中,γ是折扣因子,vw(s(i))是以w為參數(shù)的狀態(tài)價(jià)值函數(shù),表示狀態(tài)s(i)的近似價(jià)值,vw(s(i+1))是以w為參數(shù)的狀態(tài)價(jià)值函數(shù),表示狀態(tài)s(i+1)的近似價(jià)值。
47、由上述技術(shù)方案可知,本發(fā)明實(shí)施例提供的基于能量中性感知的ehes電源管理方法及系統(tǒng),系統(tǒng)感知上個(gè)任務(wù)執(zhí)行期間的能量中性運(yùn)行情況,計(jì)算出能量中性距離,使用dvfs技術(shù)對正在執(zhí)行的任務(wù)的頻率和電壓進(jìn)行調(diào)節(jié),從而實(shí)現(xiàn)該任務(wù)執(zhí)行期間的能量中性運(yùn)行,可以使系統(tǒng)以適當(dāng)?shù)乃俾适褂檬占降哪芰?,保證能量收集嵌入式系統(tǒng)永久工作,提高能源利用效率,確保在能量收集的動(dòng)態(tài)變化中維持系統(tǒng)的穩(wěn)定運(yùn)行和能效最優(yōu)化。