本發(fā)明涉及計(jì)算機(jī),尤其涉及一種虛擬化資源分配方法及裝置。
背景技術(shù):
1、虛擬化是一種資源管理技術(shù),將計(jì)算機(jī)中各種物理資源抽象化后重新組合成多個(gè)配置環(huán)境的“新計(jì)算機(jī)”,實(shí)現(xiàn)了物理設(shè)備的切割。gpu虛擬化技術(shù),即通過切割物理gpu,使得計(jì)算機(jī)中每個(gè)gpu都被分解成一個(gè)或多個(gè)“子gpu”,在滿足不同用戶不同大小的gpu資源需求的同時(shí),大幅度提高了gpu資源利用效率,在智算中心面向云計(jì)算、邊緣計(jì)算、云游戲等領(lǐng)域中廣泛運(yùn)用。
2、相關(guān)技術(shù)中的gpu虛擬化方案包括:gpu直通、gpu?sriov、gpu半虛擬化及gpu全虛擬化等,對應(yīng)的實(shí)際應(yīng)用包含云桌面、云游戲、工程應(yīng)用程序等。不同的終端應(yīng)用對gpu資源的需求相差較大,有的僅需要較小的gpu資源(幾十分之一單物理gpu資源),而有的則需要較大的gpu資源(大于或等于一整個(gè)物理gpu資源),常規(guī)分配方式會導(dǎo)致服務(wù)器中剩余的虛擬化資源過小導(dǎo)致無法再匹配任何用戶的需求,被擱置永遠(yuǎn)無法得到利用,造成資源浪費(fèi)。
3、因此,如何合理分配gpu資源,減少資源浪費(fèi)成為亟需解決的問題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種虛擬化資源分配方法及裝置,用以解決現(xiàn)有技術(shù)中虛擬化資源分配會導(dǎo)致資源浪費(fèi)的缺陷,實(shí)現(xiàn)合理分配gpu資源,減少資源浪費(fèi)。
2、本發(fā)明提供一種虛擬化資源分配方法,包括:
3、確定待分配的虛擬化資源需求,所述虛擬化資源需求包括個(gè)gpu虛擬化資源;
4、基于所述虛擬化資源需求,多臺服務(wù)器中各臺服務(wù)器的gpu虛擬化資源使用量,和單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù),確定所述多臺服務(wù)器分別對應(yīng)的完全使用概率,其中,所述服務(wù)器對應(yīng)的完全使用概率用于表征:所述服務(wù)器分配所述個(gè)gpu虛擬化資源后,未來會被完全使用的概率;
5、基于所述多臺服務(wù)器分別對應(yīng)的完全使用概率,確定由目標(biāo)服務(wù)器分配所述個(gè)gpu虛擬化資源。
6、根據(jù)本發(fā)明提供的一種虛擬化資源分配方法,所述單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù)基于以下步驟生成:
7、生成樣本數(shù)據(jù),所述樣本數(shù)據(jù)包括多臺服務(wù)器中各臺服務(wù)器上的用戶數(shù)量和各臺服務(wù)器中g(shù)pu虛擬化資源使用量,其中,各臺服務(wù)器中g(shù)pu虛擬化資源被最大程度使用;
8、基于所述樣本數(shù)據(jù),確定單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù)。
9、根據(jù)本發(fā)明提供的一種虛擬化資源分配方法,所述生成樣本數(shù)據(jù),包括:
10、采集多臺服務(wù)器的歷史數(shù)據(jù),所述歷史數(shù)據(jù)包括各臺服務(wù)器上的用戶數(shù)量和各臺服務(wù)器中g(shù)pu虛擬化資源使用量;
11、調(diào)整所述各臺服務(wù)器中g(shù)pu虛擬化資源使用量,以使所述歷史數(shù)據(jù)中各臺服務(wù)器中g(shù)pu虛擬化資源被最大程度使用;
12、基于調(diào)整后的歷史數(shù)據(jù),生成樣本數(shù)據(jù),其中,為所述多臺服務(wù)器的數(shù)量。
13、根據(jù)本發(fā)明提供的一種虛擬化資源分配方法,所述基于所述樣本數(shù)據(jù),確定單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù),包括:
14、基于所述樣本數(shù)據(jù),確定個(gè)gpu虛擬化資源對應(yīng)的用戶數(shù)量服從參數(shù)為的泊松分布,其中,所述個(gè)gpu虛擬化資源為單臺服務(wù)器上已被個(gè)用戶使用的gpu虛擬化資源,,為所述多臺服務(wù)器的數(shù)量,;
15、基于所述個(gè)gpu虛擬化資源對應(yīng)的用戶數(shù)量服從參數(shù)為的泊松分布,確定個(gè)用戶的gpu虛擬化資源使用量服從伽瑪分布;
16、基于所述個(gè)用戶的gpu虛擬化資源使用量服從伽瑪分布,確定單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù)為:
17、;
18、其中,。
19、根據(jù)本發(fā)明提供的一種虛擬化資源分配方法,所述方法還包括:
20、周期性更新所述樣本數(shù)據(jù),并基于所述更新后的樣本數(shù)據(jù),更新所述單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù)。
21、根據(jù)本發(fā)明提供的一種虛擬化資源分配方法,所述基于所述多臺服務(wù)器分別對應(yīng)的完全使用概率,確定由目標(biāo)服務(wù)器分配所述個(gè)gpu虛擬化資源,包括:
22、從多臺服務(wù)器中確定至少一項(xiàng)候選服務(wù)器,所述候選服務(wù)器對應(yīng)的完全使用概率大于概率閾值;
23、從所述至少一項(xiàng)候選服務(wù)器中確定剩余gpu虛擬化資源最少的服務(wù)器,作為所述目標(biāo)服務(wù)器。
24、根據(jù)本發(fā)明提供的一種虛擬化資源分配方法,所述概率閾值基于預(yù)先設(shè)置確定;或者
25、所述概率閾值基于所述多臺服務(wù)器分別對應(yīng)的完全使用概率確定。
26、本發(fā)明還提供一種虛擬化資源分配裝置,包括:
27、第一確定模塊,用于確定待分配的虛擬化資源需求,所述虛擬化資源需求包括個(gè)gpu虛擬化資源;
28、第二確定模塊,用于基于所述虛擬化資源需求,和單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù),確定多臺服務(wù)器分別對應(yīng)的完全使用概率,其中,所述服務(wù)器對應(yīng)的完全使用概率用于表征:所述服務(wù)器分配所述個(gè)gpu虛擬化資源后,未來會被完全使用的概率;其中,%表示模運(yùn)算,用于取余數(shù),為每臺服務(wù)器所擁有的最大gpu個(gè)數(shù);
29、第三確定模塊,用于基于所述多臺服務(wù)器分別對應(yīng)的完全使用概率,確定由目標(biāo)服務(wù)器分配所述個(gè)gpu虛擬化資源。
30、本發(fā)明還提供一種電子設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如上述任一種所述虛擬化資源分配方法。
31、本發(fā)明還提供一種非暫態(tài)計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述虛擬化資源分配方法。
32、本發(fā)明還提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述虛擬化資源分配方法。
33、本發(fā)明提供的虛擬化資源分配方法及裝置,通過引入單臺服務(wù)器的gpu虛擬化資源使用量的概率密度,計(jì)算出各臺服務(wù)器分別對應(yīng)的完全使用概率,確定各臺服務(wù)器若在分配所述個(gè)gpu虛擬化資源后,未來會被完全使用的概率,并基于該完全使用概率,確定由目標(biāo)服務(wù)器分配gpu虛擬化資源,可以提高各臺服務(wù)器的gpu虛擬資源被充分利用的概率,合理分配gpu資源,減少資源浪費(fèi)。
1.一種虛擬化資源分配方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的虛擬化資源分配方法,其特征在于,所述單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù)基于以下步驟生成:
3.根據(jù)權(quán)利要求2所述的虛擬化資源分配方法,其特征在于,所述生成樣本數(shù)據(jù),包括:
4.根據(jù)權(quán)利要求2所述的虛擬化資源分配方法,其特征在于,所述基于所述樣本數(shù)據(jù),確定單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù),包括:
5.根據(jù)權(quán)利要求2-4任一項(xiàng)所述的虛擬化資源分配方法,其特征在于,所述方法還包括:
6.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的虛擬化資源分配方法,其特征在于,所述基于所述多臺服務(wù)器分別對應(yīng)的完全使用概率,確定由目標(biāo)服務(wù)器分配所述個(gè)gpu虛擬化資源,包括:
7.根據(jù)權(quán)利要求6所述的虛擬化資源分配方法,其特征在于,所述概率閾值基于預(yù)先設(shè)置確定;或者
8.一種虛擬化資源分配裝置,其特征在于,包括:
9.一種電子設(shè)備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述虛擬化資源分配方法。
10.一種非暫態(tài)計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述虛擬化資源分配方法。