模型壓縮方法、裝置、電子設(shè)備及存儲介質(zhì)與流程

文檔序號：40599206發(fā)布日期：2025-01-07 20:39閱讀：8來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本公開涉及人工智能，尤其涉及深度學(xué)習(xí)、模型壓縮、剪枝和知識蒸餾等。

背景技術(shù)：

1、深度神經(jīng)網(wǎng)絡(luò)，依賴于較大的模型參數(shù)和優(yōu)秀的推理能力，已經(jīng)在工業(yè)和學(xué)術(shù)界取得了一定的成功。然而，受限于有限的資源，很多設(shè)備無法安裝較大的神經(jīng)網(wǎng)絡(luò)模型。

2、因此，需要模型壓縮技術(shù)。模型壓縮是深度學(xué)習(xí)領(lǐng)域中的一項關(guān)鍵技術(shù)，它旨在減少模型的大小和計算復(fù)雜度，以減低模型對存儲資源(如內(nèi)存)和計算資源的消耗，最終能夠在資源受限的設(shè)備上部署和運(yùn)行模型。

技術(shù)實(shí)現(xiàn)思路

1、本公開提供了一種模型壓縮方法、裝置、電子設(shè)備及存儲介質(zhì)。

2、根據(jù)本公開的一方面，提供了一種模型壓縮方法，包括：

3、在基于教師網(wǎng)絡(luò)向?qū)W生網(wǎng)絡(luò)進(jìn)行知識轉(zhuǎn)移的過程中，基于剪枝損失和蒸餾損失從學(xué)生網(wǎng)絡(luò)中篩選出至少一個待剪枝通道；

4、基于至少一個待剪枝通道，壓縮學(xué)生網(wǎng)絡(luò)。

5、根據(jù)本公開的另一方面，提供了一種模型壓縮裝置，包括：

6、篩選模塊，用于在基于教師網(wǎng)絡(luò)向?qū)W生網(wǎng)絡(luò)進(jìn)行知識轉(zhuǎn)移的過程中，基于剪枝損失和蒸餾損失從學(xué)生網(wǎng)絡(luò)中篩選出至少一個待剪枝通道；

7、壓縮模塊，用于基于至少一個待剪枝通道，壓縮學(xué)生網(wǎng)絡(luò)。

8、根據(jù)本公開的另一方面，提供了一種電子設(shè)備，包括：

9、至少一個處理器；以及

10、與該至少一個處理器通信連接的存儲器；其中，

11、該存儲器存儲有可被該至少一個處理器執(zhí)行的指令，該指令被該至少一個處理器執(zhí)行，以使該至少一個處理器能夠執(zhí)行本公開實(shí)施例中任一的方法。

12、根據(jù)本公開的另一方面，提供了一種存儲有計算機(jī)指令的非瞬時計算機(jī)可讀存儲介質(zhì)，其中，該計算機(jī)指令用于使該計算機(jī)執(zhí)行根據(jù)本公開實(shí)施例中任一的方法。

13、根據(jù)本公開的另一方面，提供了一種計算機(jī)程序產(chǎn)品，包括計算機(jī)程序，該計算機(jī)程序在被處理器執(zhí)行時實(shí)現(xiàn)根據(jù)本公開實(shí)施例中任一的方法。

14、應(yīng)當(dāng)理解，本部分所描述的內(nèi)容并非旨在標(biāo)識本公開的實(shí)施例的關(guān)鍵或重要特征，也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。

技術(shù)特征：

1.一種模型壓縮方法，包括：

2.根據(jù)權(quán)利要求1所述的方法，其中，所述基于剪枝損失和蒸餾損失從所述學(xué)生網(wǎng)絡(luò)中篩選出至少一個待剪枝通道，包括：

3.根據(jù)權(quán)利要求2所述的方法，其中，所述基于所述多個通道的縮放因子，篩選出所述至少一個待剪枝通道，包括：

4.根據(jù)權(quán)利要求2所述的方法，其中，所述基于所述剪枝損失和所述蒸餾損失確定所述學(xué)生網(wǎng)絡(luò)中多個通道的縮放因子，包括：

5.根據(jù)權(quán)利要求4所述的方法，其中，所述基于所述剪枝損失和所述蒸餾損失確定總損失的表達(dá)式，包括：

6.根據(jù)權(quán)利要求4所述的方法，其中，確定所述蒸餾損失，包括：

7.根據(jù)權(quán)利要求4所述的方法，所述總損失的表達(dá)式中包括可學(xué)習(xí)的剪枝超參數(shù)和蒸餾超參數(shù)，其中：

8.根據(jù)權(quán)利要求7所述的方法，其中，所述剪枝超參數(shù)為所述剪枝損失的權(quán)重；

9.根據(jù)權(quán)利要求7所述的方法，其中，確定所述剪枝超參數(shù)和所述蒸餾超參數(shù)，包括：

10.根據(jù)權(quán)利要求1-9中任一項所述的方法，還包括：

11.根據(jù)權(quán)利要求1所述的方法，其中，所述學(xué)生網(wǎng)絡(luò)為計算機(jī)視覺模型，所述計算機(jī)視覺模型用于對輸入的圖像執(zhí)行目標(biāo)檢測、目標(biāo)分割和目標(biāo)分類任務(wù)中的至少一種。

12.根據(jù)權(quán)利要求1所述的方法，其中，所述學(xué)生網(wǎng)絡(luò)為語言處理模型，所述語言處理模型用于對輸入的語音和/或文本信息進(jìn)行推理分析，以完成人機(jī)對話、語義理解和文生圖任務(wù)中的至少一種任務(wù)。

13.根據(jù)權(quán)利要求1所述的方法，其中，所述學(xué)生網(wǎng)絡(luò)為多模態(tài)模型，所述多模態(tài)模型用于對輸入的多模態(tài)信息進(jìn)行分析，以完成資源推薦、提供自動駕駛決策的依據(jù)中的至少一種任務(wù)。

14.一種模型壓縮裝置，包括：

15.根據(jù)權(quán)利要求14所述的裝置，其中，所述篩選模塊，包括：

16.根據(jù)權(quán)利要求15所述的裝置，其中，所述篩選子單元，具體用于：

17.根據(jù)權(quán)利要求15所述的裝置，其中，所述確定子單元，具體用于：

18.根據(jù)權(quán)利要求17所述的裝置，其中，所述確定子單元具體用于：

19.根據(jù)權(quán)利要求17所述的裝置，其中，所述確定子單元，具體用于：

20.根據(jù)權(quán)利要求17所述的裝置，所述總損失的表達(dá)式中包括可學(xué)習(xí)的剪枝超參數(shù)和蒸餾超參數(shù)，其中：

21.根據(jù)權(quán)利要求20所述的裝置，其中，所述剪枝超參數(shù)為所述剪枝損失的權(quán)重；

22.根據(jù)權(quán)利要求20所述的裝置，其中，所述確定子單元，還用于：

23.根據(jù)權(quán)利要求14-22中任一項所述的裝置，還包括：

24.根據(jù)權(quán)利要求14所述的裝置，其中，所述學(xué)生網(wǎng)絡(luò)為計算機(jī)視覺模型，所述計算機(jī)視覺模型用于對輸入的圖像執(zhí)行目標(biāo)檢測、目標(biāo)分割和目標(biāo)分類任務(wù)中的至少一種。

25.根據(jù)權(quán)利要求14所述的裝置，其中，所述學(xué)生網(wǎng)絡(luò)為語言處理模型，所述語言處理模型用于對輸入的語音和/或文本信息進(jìn)行推理分析，以完成人機(jī)對話、語義理解和文生圖任務(wù)中的至少一種任務(wù)。

26.根據(jù)權(quán)利要求14所述的裝置，其中，所述學(xué)生網(wǎng)絡(luò)為多模態(tài)模型，所述多模態(tài)模型用于對輸入的多模態(tài)信息進(jìn)行分析，以完成資源推薦、提供自動駕駛決策的依據(jù)中的至少一種任務(wù)。

27.一種電子設(shè)備，包括：

28.一種存儲有計算機(jī)指令的非瞬時計算機(jī)可讀存儲介質(zhì)，其中，所述計算機(jī)指令用于使所述計算機(jī)執(zhí)行根據(jù)權(quán)利要求1-13中任一項所述的方法。

29.一種計算機(jī)程序產(chǎn)品，包括計算機(jī)程序，所述計算機(jī)程序在被處理器執(zhí)行時實(shí)現(xiàn)根據(jù)權(quán)利要求1-13中任一項所述的方法。

技術(shù)總結(jié)
本公開提供了模型壓縮方法、裝置、電子設(shè)備及存儲介質(zhì)，涉及人工智能技術(shù)領(lǐng)域，尤其涉及深度學(xué)習(xí)、模型壓縮、剪枝和知識蒸餾等技術(shù)領(lǐng)域。具體實(shí)現(xiàn)方案為：在基于教師網(wǎng)絡(luò)向?qū)W生網(wǎng)絡(luò)進(jìn)行知識轉(zhuǎn)移的過程中，基于剪枝損失和蒸餾損失從學(xué)生網(wǎng)絡(luò)中篩選出至少一個待剪枝通道；基于至少一個待剪枝通道，壓縮學(xué)生網(wǎng)絡(luò)。本公開，實(shí)現(xiàn)在知識蒸餾的同時也能根據(jù)剪枝技術(shù)自動進(jìn)行剪枝，有效的保證了學(xué)生網(wǎng)絡(luò)在推理速度和精度上的要求，從而降低學(xué)生網(wǎng)絡(luò)對存儲資源的占用、對計算資源的消耗。

技術(shù)研發(fā)人員：石昌帥
受保護(hù)的技術(shù)使用者：北京百度網(wǎng)訊科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/6

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：石昌帥
技術(shù)所有人：北京百度網(wǎng)訊科技有限公司
我是此專利的發(fā)明人

上一篇：一種粉塵在線監(jiān)測裝置的制作方法
上一篇：一種藥品托盤的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

模型壓縮方法、裝置、電子設(shè)備及存儲介質(zhì)與流程

模型壓縮方法、裝置、電子設(shè)備及存儲介質(zhì)與流程