1.一種基于深度強(qiáng)化學(xué)習(xí)的數(shù)據(jù)中心自適應(yīng)流量控制方法,其特征在于:所述數(shù)據(jù)中心自適應(yīng)流量控制方法具體包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于深度強(qiáng)化學(xué)習(xí)的數(shù)據(jù)中心自適應(yīng)流量控制方法,其特征在于:所述步驟1中,選取觸發(fā)流量控制時(shí)發(fā)送暫停幀的閾值作為動(dòng)作空間,選取交換機(jī)收發(fā)數(shù)據(jù)流量、上游交換機(jī)端口暫停時(shí)間作為狀態(tài)空間參數(shù)具體包括如下步驟:
3.根據(jù)權(quán)利要求1所述的基于深度強(qiáng)化學(xué)習(xí)的數(shù)據(jù)中心自適應(yīng)流量控制方法,其特征在于:所述步驟2中根據(jù)動(dòng)作空間與狀態(tài)空間,確定動(dòng)作執(zhí)行前后網(wǎng)絡(luò)環(huán)境的變化,設(shè)計(jì)獎(jiǎng)勵(lì)函數(shù),具體包括如下步驟:
4.根據(jù)權(quán)利要求1所述的基于深度強(qiáng)化學(xué)習(xí)的數(shù)據(jù)中心自適應(yīng)流量控制方法,其特征在于:所述步驟3中設(shè)計(jì)并部署在交換機(jī)上通過執(zhí)行動(dòng)作來獲取狀態(tài)并計(jì)算獎(jiǎng)勵(lì)加以學(xué)習(xí),幫助做出最佳決策的智能體來統(tǒng)一管理交換機(jī)端口隊(duì)列,具體包括如下步驟:
5.根據(jù)權(quán)利要求1所述的基于深度強(qiáng)化學(xué)習(xí)的數(shù)據(jù)中心自適應(yīng)流量控制方法,其特征在于:所述步驟4中,智能體與交換機(jī)交互,計(jì)算獎(jiǎng)勵(lì),更新網(wǎng)絡(luò),訓(xùn)練優(yōu)化網(wǎng)絡(luò)環(huán)境具體包括如下步驟:
6.根據(jù)權(quán)利要求1所述的基于深度強(qiáng)化學(xué)習(xí)的數(shù)據(jù)中心自適應(yīng)流量控制方法,其特征在于:所述步驟5中,若訓(xùn)練的交換機(jī)端口閾值在多個(gè)時(shí)間步內(nèi)均沒有產(chǎn)生獎(jiǎng)勵(lì),說明此閾值與當(dāng)前網(wǎng)絡(luò)環(huán)境適配,暫停訓(xùn)練以降低交換機(jī)性能開銷,具體包括如下步驟:
7.根據(jù)權(quán)利要求1所述的基于深度強(qiáng)化學(xué)習(xí)的數(shù)據(jù)中心自適應(yīng)流量控制方法,其特征在于:所述步驟6具體包括如下步驟: