基于線性相關(guān)性及分段性裝箱理論的虛擬機(jī)資源整合方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于云計(jì)算技術(shù)領(lǐng)域,更為具體地講,涉及一種基于線性相關(guān)性及分段性 裝箱理論的虛擬機(jī)資源整合方法。
【背景技術(shù)】
[0002] 虛擬機(jī)資源整合算法是數(shù)據(jù)中心虛擬資源管理軟件的核心策略。這類虛擬機(jī)資源 整合算法可以通過檢測運(yùn)行虛擬機(jī)中未使用的資源,重新將這些碎片資源回收到虛擬資源 池加入整合利用,從而達(dá)到資源節(jié)約的目的。因此,虛擬機(jī)資源整合的效率在很大的程度上 決定了數(shù)據(jù)中心的運(yùn)行效率。
[0003] 通常,根據(jù)虛擬機(jī)資源利用率采樣序列的不同,可以將對虛擬機(jī)某項(xiàng)資源的整合 算法分為靜態(tài)整合和動(dòng)態(tài)整合兩類。靜態(tài)資源整合算法使用一個(gè)靜態(tài)的數(shù)值,即一個(gè)定值 來表征虛擬機(jī)在整個(gè)算法運(yùn)行時(shí)間段內(nèi)的資源利用率。根據(jù)系統(tǒng)對資源利用率和QoS性能 的不同要求,這個(gè)數(shù)值可以分別使用虛擬機(jī)資源利用均值,峰值或在假設(shè)資源利用率分布 服從正太分布的情況下使用y+2S表征。而動(dòng)態(tài)資源整合算法要求以一定的時(shí)間均勻間 隔預(yù)測生成虛擬機(jī)在未來算法運(yùn)行時(shí)間段內(nèi)的資源利用率序列。因此,動(dòng)態(tài)資源整合算法 的資源利用率是一個(gè)動(dòng)態(tài)變化的隨機(jī)序列。
[0004] 但是這現(xiàn)有的兩類算法都具有明顯的固有缺陷:靜態(tài)整合類算法因?yàn)槭褂霉潭ㄖ?表征資源利用率,雖然這有利用于減小算法進(jìn)行全局優(yōu)化時(shí)的復(fù)雜度,但無法對資源利用 率峰谷時(shí)段的碎片資源進(jìn)行有效利用。而動(dòng)態(tài)整合類算法主要利用線性相關(guān)性分析等技術(shù) 手段搜尋系統(tǒng)內(nèi)資源利用率峰谷互補(bǔ)性最好的虛擬機(jī)進(jìn)行配對整合,使用這種類型的算法 進(jìn)行的整合可以取得良好的局部資源互補(bǔ)效果。但動(dòng)態(tài)整合類算法的整合過程只受線性相 關(guān)系數(shù)約束而缺乏對全局優(yōu)化能力的約束和控制能力,在算法的后段可能會(huì)因?yàn)橄嚓P(guān)系數(shù) 的過大和整合中的整數(shù)線性規(guī)劃問題提前中止算法的運(yùn)行,因此資源整合效率的提升同樣 有限。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種基于線性相關(guān)性及分段性裝箱 理論的虛擬機(jī)資源整合方法,通過分段式迭代線性相關(guān)性整合算法SICC能夠提高虛擬機(jī) 的資源整合效率。
[0006] 為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明一種基于線性相關(guān)性及分段性裝箱理論的虛擬機(jī)資 源整合方法,其特征在于,包括以下步驟:
[0007] (1)、生成各初始狀態(tài)虛擬機(jī)(VM)在未來指定時(shí)間段的資源利用率時(shí)間序列
[0008] (I. 1)、定義一個(gè)標(biāo)準(zhǔn)VM所具有資源量,將其計(jì)為c;
[0009] 收集各VM在過去指定時(shí)間段內(nèi)t次采樣的歷史原始資源使用量乂,k= 1,2,…,M,M表示系統(tǒng)中VM的總臺(tái)數(shù),t= 1,2, 一,IN表示過去指定時(shí)間段內(nèi)采樣的總次 數(shù);
[0010] (I. 2)、計(jì)算各g占標(biāo)準(zhǔn)VM資源量C的百分率,并標(biāo)記為VM歷史狀態(tài)原始資源利 用率;
[0011] (1.3)、利用步驟(I. 1)中各VM的歷史原始資源使用量式構(gòu)成采樣序列《,再檢 測序列C平穩(wěn)性,并完成擬合模型選定和定階;
[0012] (1. 4)、根據(jù)所得模型,采用1步遞推預(yù)測法生成各VM未來指定時(shí)間段的資源利用 率時(shí)間序列靈;
[0013] (2)、求得各VM之間的相關(guān)系數(shù)矩陣Matrixecieff
[0014] (2. 1)、使用皮爾遜相關(guān)系數(shù)公式計(jì)算任意¥1^與VM,之間的相關(guān)系數(shù)ri,, i,je[1,M];
[0016] 其中,客.和名'分別代表VMjPIVM』的N位資源利用率序列,敵)和wcw?(S:)分 另IJ代表VMjPVM郝N位資源利用率序列的均值;
[0017] (2. 2)、利用步驟(2. 1)中的公式求得M(M-I)/2臺(tái)VM的有效相關(guān)系數(shù)值&j,再組 成一個(gè)MXM階相關(guān)系數(shù)矩陣Matrixccieff;
[0019](3)、定義一個(gè)動(dòng)態(tài)整合算法ICMa
[0020] (3. 1)、每次從步驟(2. 2)描述的相關(guān)系數(shù)矩陣中尋找出一個(gè)不大于a的最小值, 標(biāo)記為r_;
[0021] (3. 2)、將步驟(3. 1)選出的最小值4"對應(yīng)的初始狀態(tài)虛擬機(jī)VM種VM郝N個(gè) 資源利用率采樣點(diǎn)進(jìn)行合并配對測試;
[0023] 其中,將VM1對應(yīng)的資源利用率時(shí)間序列記為5,,1中歷史狀態(tài)原始資源利用率 最大值記為Peak1,將VM,對應(yīng)的資源利用率時(shí)間序列記為瓦s 1;中歷史狀態(tài)原始資源利 用率最大值記為Peakj;
[0024] (3. 3)、判斷Peak值
[0025]如果步驟(3. 2)中Peak值不大于100%,則令a=-〇? 5,且將步驟(3. 2)中選出 的VMjPVM,組合配對,結(jié)果簡化為如下的關(guān)系:
[0027]S卩:¥1^與VMj經(jīng)動(dòng)態(tài)算法整合成動(dòng)態(tài)整合虛擬機(jī)DCVM,且DCVM的資源利用率序列 為定值的常數(shù)序列,并進(jìn)入步驟(3.4);
[0028] 如果步驟(3. 2)中Peak值小于或等于100 %,,則將該種配對對應(yīng)的Flj值改設(shè)為 無窮大,并再次返回步驟(3.1);
[0029] (3. 4)、從步驟(2.2)中描述的相關(guān)系數(shù)矩陣Matrixraeff中刪除初始狀態(tài)虛擬機(jī) VM^VMj對應(yīng)的數(shù)據(jù)項(xiàng),并使用新生成的DCVM的數(shù)據(jù)與相關(guān)系數(shù)矩陣Matrixe°eff中除VM丄 和VMj以外的剩余虛擬機(jī),重新生成新的相關(guān)系數(shù)矩陣;
[0030](3. 5)、重復(fù)步驟(3. 1)至(3. 4),直至滿足退出條件:r_> -0? 5或M< 2 ;
[0031](4)、利用SICC算法進(jìn)行虛擬機(jī)資源整合
[0032](4. 1)、將各VM的歷史狀態(tài)原始資源利用率求均值mean,再按照均值mean將所有 的VM分為三組,即:
[0033]
[0034] (4.2)、將三組VM按照步驟(3)所述的方式分別運(yùn)行ICMAa算法,,將整合后的三 組DCVM集中在一起后按照步驟(3)所述的方式再次運(yùn)行ICMa算法;
[0035] (4.3)、將步驟(4.2)運(yùn)行后得到的DCVM按照(3.3)中所述的規(guī)則,設(shè)定靜態(tài)資源 參數(shù)后運(yùn)行降序首次適應(yīng)算法(FirstFitDecreasing,FFD)進(jìn)行靜態(tài)階段的整合,得到最 終整合狀態(tài)的CVM;
[0036](4. 4)、將(4. 3)所得的最終狀態(tài)CVM裝填入物理服務(wù)器。
[0037] 本發(fā)明的發(fā)明目的是這樣實(shí)現(xiàn)的:
[0038] 本發(fā)明基于線性相關(guān)性及分段性裝箱理論的虛擬機(jī)資源整合方法,包括動(dòng)態(tài)整合 和靜態(tài)整合兩個(gè)階段,同時(shí)綜合了兩類算法的優(yōu)點(diǎn)。第一階段利用改進(jìn)的動(dòng)態(tài)整合算法對 系統(tǒng)內(nèi)的初始狀態(tài)虛擬機(jī)(VM)進(jìn)行整合,盡可能地降低整合后虛擬機(jī)(CVM)的資源利用率 峰值-均值差。當(dāng)系統(tǒng)內(nèi)虛擬機(jī)資源利用率平均峰值-均值差低于一個(gè)特定預(yù)設(shè)的閾值 時(shí),可以認(rèn)為系統(tǒng)內(nèi)任意CVM的資源利用率序列不再是動(dòng)態(tài)的隨機(jī)序列,而是一個(gè)常數(shù)值 序列。因此,在進(jìn)行第二階段靜態(tài)合并過程前,使用各CVM的峰值資源利用率數(shù)值作為靜態(tài) 參數(shù)運(yùn)行靜態(tài)算法的行為并不會(huì)造成新的附加資源浪費(fèi)。本發(fā)明的第二階段靜態(tài)整合部分 選用降序首次適應(yīng)(FirstFitDecreasing,F(xiàn)FD)算法。降序首次適應(yīng)算法是當(dāng)前綜合性 能最優(yōu)的離線Bin-Packing算法,能為本發(fā)明的整合過程提供足夠的全局資源優(yōu)化能力。 本發(fā)明綜合以上兩個(gè)階段的算法優(yōu)點(diǎn),在整合過成中同時(shí)具有較強(qiáng)局部和全局優(yōu)化能力, 能提供明顯優(yōu)于現(xiàn)有單一類別整合算法的整合能力。
【附圖說明】
[0039] 圖1是本發(fā)明一種基于線性相關(guān)性及分段性Bin-Packing理論的虛擬機(jī)資源整合 工具的流程圖;
[0040] 圖2是關(guān)于閾值a取值與生成DCVM平均峰值-均值差的關(guān)系研究;
[0041] 圖3是SICC第一階段動(dòng)態(tài)整合完成后DCVM數(shù)量與初始狀態(tài)VM數(shù)量對比;
[0042] 圖4是SICC第二階段完成后各DCVM峰值資源利用率與未進(jìn)行改進(jìn)的純ICM動(dòng) 態(tài)整合算法生成的峰值資源利用率PRU的對比;
[0043] 圖5是100次SICC實(shí)驗(yàn)和純ICMA實(shí)驗(yàn)對比。
【具體實(shí)施方式】
[0044] 下面結(jié)合附圖對本發(fā)明的【具體實(shí)施方式】進(jìn)行描述,以便本領(lǐng)域的技術(shù)人員更好地 理解本發(fā)明。需要特別提醒注意的是,在以下的描述中,當(dāng)已知功能和設(shè)計(jì)的詳細(xì)描述也許 會(huì)淡化本發(fā)明的主要內(nèi)容時(shí),這些描述在這里將被忽略。
[0045] 實(shí)施例
[0046] 為了方便描述,先對【具體實(shí)施方式】中出現(xiàn)的相關(guān)專業(yè)術(shù)語進(jìn)行說明:
[0047] VM(VirtualMachine):虛擬機(jī);
[0048] CVM(ConsolidatedVirtualMachine):已整合虛擬機(jī);
[0049] DCVM(DynamicConsolidatedVirtualMachine):基于動(dòng)態(tài)算法的已整合虛擬 機(jī);
[0050] SICC(SegmentationIterationCorrelationConsolidation):分段式迭代線性 相關(guān)性整合算法;
[0051] ICMAQterativeCorrelationMatchAlgorithm):迭代相關(guān)配對算法。
[0052] 圖1是本發(fā)明一種基于線性相關(guān)性及分段性裝箱理論的虛擬機(jī)資源整合方法的 流程圖。
[0053] 在本實(shí)施例中,如圖1所示,本發(fā)明一種基于線性相關(guān)性及分段性裝箱理論的虛 擬機(jī)資源整合方法,主要包括兩大部分:動(dòng)態(tài)虛擬機(jī)整合過程和靜態(tài)虛擬機(jī)整合過程。
[0054] 下面針對兩個(gè)階段進(jìn)行詳細(xì)說明,具體如下:
[0055] Sl、虛擬機(jī)動(dòng)態(tài)整合階段
[0056] SI. 1、獲取系統(tǒng)內(nèi)虛擬機(jī)的有效歷史資源利用率信息
[0057] 定義一個(gè)標(biāo)準(zhǔn)VM所具有資源量,將其計(jì)為c;
[0058] 收集各VM在過去指定時(shí)間段內(nèi)t次采樣的歷史原始資源使用量p\,k= 1,2,…,M,M表示系統(tǒng)中VM的總臺(tái)數(shù),t= 1,2, 一,IN表示過去指定時(shí)間段內(nèi)采樣的總次 數(shù);
[0059] 計(jì)算各M占標(biāo)準(zhǔn)VM資源量c的百分率,并標(biāo)記為VM歷史狀態(tài)原始資源利用率;
[0060] SI. 2、檢測序列平穩(wěn)性并完成擬合模型識(shí)別、定階和未來資源利用率序列生成
[0061] 利用步驟SI. 1中各VM中剩余的歷史原始資源使用量g構(gòu)成采樣序列乾,并用自 相關(guān)函數(shù)法判定采樣序列€是否平穩(wěn)。并根據(jù)自相關(guān)函數(shù)和偏自相關(guān)函數(shù)的截尾性和拖 尾性判斷采樣序列C的擬合模型。在本實(shí)施例中,擬合模型可以根據(jù)情況選擇自回歸模型AR,滑動(dòng)平均模型MA,以及自回歸滑動(dòng)平均模型ARM中的一種。選定模型后使用AIC法進(jìn) 行定階,進(jìn)行各VM的未來指定時(shí)間段的資源利用率時(shí)間序列靈。因?yàn)轭A(yù)測誤差與預(yù)測步數(shù) 有關(guān),因此模型采用1步遞推預(yù)測法進(jìn)行序列預(yù)測。
[0062] SI. 3、求得各VM之間的相關(guān)系數(shù)矩陣Mecieff
[0063] 使用皮爾遜相關(guān)系數(shù)公式計(jì)算任意¥1^與VM;之間的相關(guān)系數(shù)rVi,jG[1,M];
[0065]其中,安和巧分別代表VMjPVM』的N位資源利用率序列,(交)和獅?(無)分 另IJ代表VMjPVM郝N位資源利用率序列的均值;
[0066] 再利用上述公式,求得M(M-I)/2臺(tái)VM的有效相關(guān)系數(shù)值Flj