基于GPU負荷信息的GPU分配方法及裝置與流程

文檔序號：40462022發(fā)布日期：2024-12-27 09:27閱讀：10來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及計算機領(lǐng)域，尤其涉及一種基于gpu負荷信息的gpu分配方法及裝置。

背景技術(shù)：

1、ai計算算法服務(wù)選擇gpu隨機選擇，可能沒有選擇負荷較少的gpu，或是靜態(tài)指定，不能根據(jù)gpu使用情況自動選擇，ai計算算法服務(wù)需要根據(jù)gpu使用情況選擇gpu，動態(tài)自動選擇負荷較少的gpu。

2、ai計算算法服務(wù)選擇gpu隨機選擇或是靜態(tài)指定，隨機選擇不考慮gpu使用情況，可能導(dǎo)致負荷較多的gpu再被選擇，負荷較少的gpu沒有被選擇，靜態(tài)指定算法服務(wù)啟動指定gpu，算法服務(wù)不獲取gpu使用情況，根據(jù)使用情況選擇gpu。

技術(shù)實現(xiàn)思路

1、針對上述技術(shù)問題，本發(fā)明提供了一種基于gpu負荷信息的gpu分配方法及裝置，可提高gpu的利用率。

2、本發(fā)明的第一方面，提供一種基于gpu負荷信息的gpu分配方法，包括：接收gpu分配請求，所述gpu分配請求來自于ai計算算法服務(wù)；收集gpu信息，在收集gpu信息成功后解析所述gpu信息獲得多個gpu的信息值及gpu?index標(biāo)識；根據(jù)所述多個gpu的信息值計算最小負荷的gpu，選擇所述最小負荷的gpu的gpu?index標(biāo)識返回所述ai計算算法服務(wù)。

3、在一可選實施例中，在收集gpu信息成功后解析所述gpu信息獲得多個gpu的信息值及gpu?index標(biāo)識，包括：

4、獲得多個gpu的信息值的總量內(nèi)存值、使用內(nèi)存值、可用內(nèi)存值、gpu?index標(biāo)識。

5、在一可選實施例中，所述收集gpu信息，在收集gpu信息成功后解析所述gpu信息獲得多個gpu的信息值及gpu?index標(biāo)識，包括：

6、向安裝有g(shù)pu、gpu?exporter的服務(wù)器發(fā)起http請求獲取gpu信息，http響應(yīng)返回消息體，解析消息體獲得總量內(nèi)存值、使用內(nèi)存值、可用內(nèi)存值、gpu?index標(biāo)識。

7、在一可選實施例中，所述根據(jù)所述多個gpu的信息值計算最小負荷的gpu，包括：

8、分別根據(jù)多個gpu的信息值的使用內(nèi)存值與總量內(nèi)存值的比值計算多個gpu的負荷；

9、將多個gpu的負荷相比較，確定最小負荷的gpu。

10、在一可選實施例中，所述根據(jù)所述多個gpu的信息值計算最小負荷的gpu，包括：

11、分別根據(jù)多個gpu的信息值的可用內(nèi)存值與總量內(nèi)存值的比值計算多個gpu的空閑率；

12、將多個gpu的空閑率相比較，確定最大空閑率的gpu為最小負荷的gpu。

13、本發(fā)明的第二方面，提供一種基于gpu負荷信息的gpu分配方法裝置，包括：

14、接收模塊，用于接收gpu分配請求，所述gpu分配請求來自于ai計算算法服務(wù)；

15、收集解析模塊，用于收集gpu信息，在收集gpu信息成功后解析所述gpu信息獲得多個gpu的信息值及gpu?index標(biāo)識；

16、分配模塊，用于根據(jù)所述多個gpu的信息值計算最小負荷的gpu，選擇所述最小負荷的gpu的gpu?index標(biāo)識返回所述ai計算算法服務(wù)。

17、在一可選實施例中，所述分配模塊還包括第一子模塊，所述第一子模塊用于分別根據(jù)多個gpu的信息值的使用內(nèi)存值與總量內(nèi)存值的比值計算多個gpu的負荷；將多個gpu的負荷相比較，確定最小負荷的gpu。

18、在一可選實施例中，所述分配模塊還包括第二子模塊，所述第二子模塊用于分別根據(jù)多個gpu的信息值的可用內(nèi)存值與總量內(nèi)存值的比值計算多個gpu的空閑率；將多個gpu的空閑率相比較，確定最大空閑率的gpu為最小負荷的gpu。

19、本發(fā)明的第三方面，提供一種電子設(shè)備，包括：

20、至少一個處理器；以及與所述處理器通信連接的至少一個存儲器，其中：所述存儲器存儲有可被所述處理器執(zhí)行的程序指令，所述處理器調(diào)用所述程序指令能夠執(zhí)行如本發(fā)明實施例的第一方面所述的方法。

21、本發(fā)明的第四方面，提供一種計算機可讀存儲介質(zhì)，其上存儲有計算機程序，所述計算機程序被計算機運行時，執(zhí)行如本發(fā)明實施例的第一方面所述的方法。

22、本發(fā)明根據(jù)所述多個gpu的信息值計算最小負荷的gpu，選擇所述最小負荷的gpu的gpu?index標(biāo)識返回所述ai計算算法服務(wù)，可避免隨機選擇導(dǎo)致gpu選擇不合理，提升ai計算能力。

技術(shù)特征：

1.一種基于gpu負荷信息的gpu分配方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的基于gpu負荷信息的gpu分配方法，其特征在于，在收集gpu信息成功后解析所述gpu信息獲得多個gpu的信息值及gpu?index標(biāo)識，包括：

3.根據(jù)權(quán)利要求1所述的基于gpu負荷信息的gpu分配方法，其特征在于，所述收集gpu信息，在收集gpu信息成功后解析所述gpu信息獲得多個gpu的信息值及gpu?index標(biāo)識，包括：

4.根據(jù)權(quán)利要求2或3所述的基于gpu負荷信息的gpu分配方法，其特征在于，所述根據(jù)所述多個gpu的信息值計算最小負荷的gpu，包括：

5.根據(jù)權(quán)利要求2或3所述的基于gpu負荷信息的gpu分配方法，其特征在于，所述根據(jù)所述多個gpu的信息值計算最小負荷的gpu，包括：

6.一種基于gpu負荷信息的gpu分配方法裝置，其特征在于，包括：

7.根據(jù)權(quán)利要求6所述的基于gpu負荷信息的gpu分配裝置，其特征在于，所述分配模塊還包括第一子模塊，所述第一子模塊用于分別根據(jù)多個gpu的信息值的使用內(nèi)存值與總量內(nèi)存值的比值計算多個gpu的負荷；將多個gpu的負荷相比較，確定最小負荷的gpu。

8.根據(jù)權(quán)利要求6所述的基于gpu負荷信息的gpu分配裝置，其特征在于，所述分配模塊還包括第二子模塊，所述第二子模塊用于分別根據(jù)多個gpu的信息值的可用內(nèi)存值與總量內(nèi)存值的比值計算多個gpu的空閑率；將多個gpu的空閑率相比較，確定最大空閑率的gpu為最小負荷的gpu。

9.一種電子設(shè)備，其特征在于，包括：

10.一種計算機可讀存儲介質(zhì)，其特征在于，其上存儲有計算機程序，所述計算機程序被計算機運行時，執(zhí)行如權(quán)利要求1至7中任一項所述的基于gpu負荷信息的gpu分配方法。

技術(shù)總結(jié)
本發(fā)明公開基于GPU負荷信息的GPU分配方法及裝置，其方法包括接收GPU分配請求，所述GPU分配請求來自于AI計算算法服務(wù)；收集GPU信息，在收集GPU信息成功后解析所述GPU信息獲得多個GPU的信息值及GPU?index標(biāo)識；根據(jù)所述多個GPU的信息值計算最小負荷的GPU，選擇所述最小負荷的GPU的GPU?index標(biāo)識返回所述AI計算算法服務(wù)。本發(fā)明根據(jù)所述多個GPU的信息值計算最小負荷的GPU，選擇所述最小負荷的GPU的GPU?index標(biāo)識返回所述AI計算算法服務(wù)，可避免隨機選擇導(dǎo)致GPU選擇不合理，提升AI計算能力。

技術(shù)研發(fā)人員：陳建
受保護的技術(shù)使用者：深圳市鐵越電氣有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/26

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳建
技術(shù)所有人：深圳市鐵越電氣有限公司
我是此專利的發(fā)明人

上一篇：一種易安裝的船舶整流器的制作方法
上一篇：一種穩(wěn)定性高的展板的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于GPU負荷信息的GPU分配方法及裝置與流程