欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

卷積神經(jīng)網(wǎng)絡(luò)的映射方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)與流程

文檔序號(hào):40429685發(fā)布日期:2024-12-24 15:03閱讀:17來(lái)源:國(guó)知局
卷積神經(jīng)網(wǎng)絡(luò)的映射方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)與流程

本發(fā)明涉及存內(nèi)計(jì)算,更具體地,涉及一種卷積神經(jīng)網(wǎng)絡(luò)的映射方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)。


背景技術(shù):

1、隨著數(shù)據(jù)規(guī)模的飛速增長(zhǎng),存算密集型的神經(jīng)網(wǎng)絡(luò)應(yīng)用對(duì)硬件算力和數(shù)據(jù)存儲(chǔ)容量的需求也相應(yīng)增大。為了突破傳統(tǒng)馮諾依曼架構(gòu)中計(jì)算存儲(chǔ)分離造成的訪存帶寬瓶頸,越來(lái)越多的研究開(kāi)始關(guān)注高密度的存算一體計(jì)算架構(gòu),以期通過(guò)將計(jì)算和存儲(chǔ)緊密耦合,減少由于數(shù)據(jù)在存儲(chǔ)部件和計(jì)算部件間頻繁搬運(yùn)而額外增加的訪存能耗和帶寬需求,從而最大化硬件架構(gòu)的能效比。

2、存算一體以數(shù)據(jù)為中心,將計(jì)算邏輯放置在內(nèi)存中,或直接利用內(nèi)存本身的特性進(jìn)行計(jì)算,從而大大減少了內(nèi)核與外部存儲(chǔ)的通信開(kāi)銷,特別適用于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)這種大數(shù)據(jù)量并行且存在大規(guī)模并行的應(yīng)用場(chǎng)景,因此出現(xiàn)了采用憶阻器等非易失性存儲(chǔ)器(non-volatile?memory,nvm)為計(jì)算單元的存算一體化的加速器。這類加速器有效地解決了帶寬的瓶頸,并且具有功耗低速度快的特點(diǎn)。

3、憶阻器存儲(chǔ)器(resistive?random?access?memory,reram)是一種泄露功耗幾乎為0的非易失性存儲(chǔ)器,其以阻值狀態(tài)存儲(chǔ)信息,這種阻式存儲(chǔ)原理可以提供固有的計(jì)算能力,因此可以在同一個(gè)物理單元地址同時(shí)集成數(shù)據(jù)存儲(chǔ)與數(shù)據(jù)處理功能。reram支持多種存內(nèi)運(yùn)算操作,可以顯著提高神經(jīng)網(wǎng)絡(luò)的運(yùn)算效率。

4、以reram為計(jì)算單元的存算一體化加速器,將神經(jīng)網(wǎng)絡(luò)計(jì)算中的卷積運(yùn)算的權(quán)重?cái)?shù)據(jù)預(yù)先存儲(chǔ)在reram陣列上,以達(dá)到接收外部輸入數(shù)據(jù)后可以即時(shí)獲得卷積運(yùn)算的結(jié)果。由于網(wǎng)絡(luò)模型中卷積核的形狀、輸入輸出數(shù)據(jù)的大小、硬件行列切換的效率及限制、卷積的方式等因素,造成reram的空間利用率不足,系統(tǒng)整體的計(jì)算效率較低,計(jì)算開(kāi)銷較大。


技術(shù)實(shí)現(xiàn)思路

1、鑒于上述問(wèn)題,本發(fā)明的目的在于提供一種卷積神經(jīng)網(wǎng)絡(luò)的映射方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì),可以提高存儲(chǔ)陣列的空間利用率。

2、根據(jù)本發(fā)明的第一方面,提供一種卷積神經(jīng)網(wǎng)絡(luò)的映射方法,包括:遍歷卷積神經(jīng)網(wǎng)絡(luò)的每個(gè)卷積層獲取卷積層的卷積類型和卷積參數(shù),所述卷積參數(shù)包括卷積核的輸入通道數(shù)、輸出通道數(shù)、卷積核的卷積過(guò)濾器寬度和卷積過(guò)濾器高度;根據(jù)卷積層的卷積參數(shù)以及存儲(chǔ)陣列的參數(shù)獲取卷積層的排布參數(shù),所述卷積層的排布參數(shù)包括卷積層的權(quán)重?cái)?shù)據(jù)在存儲(chǔ)體的排布行數(shù)和排布列數(shù),所述存儲(chǔ)陣列的參數(shù)包括存儲(chǔ)體數(shù)量以及存儲(chǔ)體的行數(shù)和列數(shù);根據(jù)卷積層的卷積類型、卷積參數(shù)以及排布參數(shù)對(duì)多個(gè)卷積層進(jìn)行排序;按照排序的順序依次根據(jù)存儲(chǔ)器損失度和/或均衡度獲取每個(gè)卷積層在存儲(chǔ)陣列中的排布位置。

3、優(yōu)選地,根據(jù)卷積層的卷積類型、卷積參數(shù)以及排布參數(shù)對(duì)多個(gè)卷積層進(jìn)行排序包括:以卷積層的卷積類型為第一優(yōu)先級(jí)進(jìn)行排序;同一卷積類型的卷積層根據(jù)卷積層的卷積參數(shù)和排布參數(shù)進(jìn)行排序。

4、優(yōu)選地,所述卷積層的類型包括普通卷積、深度可分離卷積中的至少一個(gè);普通卷積層的存放在深度可分離卷積層之前。

5、優(yōu)選地,卷積層的卷積參數(shù)和排布參數(shù)的排序優(yōu)先級(jí)為:卷積過(guò)濾器的權(quán)值數(shù)量、輸出通道數(shù)量、排布行數(shù)和排布列數(shù),優(yōu)先級(jí)的順序可調(diào)。

6、優(yōu)選地,根據(jù)存儲(chǔ)器損失度和/或均衡度獲取卷積層在存儲(chǔ)陣列中的排布位置包括:獲取卷積層中待排布卷積核的可選排布位置,所述可選排布位置包括可選起始位置以及可選存儲(chǔ)體;根據(jù)可選起始位置、可選存儲(chǔ)體的權(quán)值排布狀態(tài)以及待排布卷積層的排布參數(shù)獲取每個(gè)可選排布位置的存儲(chǔ)器損失度和/或均衡度;根據(jù)可選排布位置的存儲(chǔ)器損失度確定待排布卷積核的排布位置。

7、優(yōu)選地,普通卷積層的所述可選排布位置的存儲(chǔ)器損失度為待排布卷積核的排布位置之前的空行數(shù)量;普通卷積層的所述可選存儲(chǔ)體的均衡度為各個(gè)存儲(chǔ)體的權(quán)值數(shù)據(jù)排布行數(shù)的最大值與最小值之差。

8、優(yōu)選地,深度可分離卷積層的所述可選排布位置的存儲(chǔ)器損失度為待排布卷積核的排布位置左側(cè)各行的空列數(shù)量之和;深度可分離卷積層的所述可選存儲(chǔ)體的均衡度為可選起始位置所在列與各個(gè)存儲(chǔ)體已排布卷積核的排布起始位置所在列的差。

9、優(yōu)選地,對(duì)多個(gè)存儲(chǔ)體的權(quán)值排布狀態(tài)進(jìn)行合并處理以得到待排布卷積核的可選起始位置。

10、優(yōu)選地,當(dāng)輸出通道數(shù)量小于存儲(chǔ)體的數(shù)量時(shí),每個(gè)卷積層不同輸出通道的卷積過(guò)濾器的權(quán)重?cái)?shù)據(jù)分別排布在不同的存儲(chǔ)體,不同輸出通道的卷積過(guò)濾器的權(quán)重?cái)?shù)據(jù)在不同存儲(chǔ)體的排布位置相同。

11、優(yōu)選地,同一輸出通道的卷積過(guò)濾器的權(quán)重?cái)?shù)據(jù)排布在同一存儲(chǔ)體。

12、根據(jù)本發(fā)明的第二方面,提供一種卷積神經(jīng)網(wǎng)絡(luò)的映射裝置,包括:第一獲取模塊,用于遍歷卷積神經(jīng)網(wǎng)絡(luò)的每個(gè)卷積層獲取卷積層的卷積類型和卷積參數(shù),所述卷積參數(shù)包括卷積核的輸入通道數(shù)、輸出通道數(shù)、卷積核的卷積過(guò)濾器寬度和卷積過(guò)濾器高度;第二獲取模塊,用于根據(jù)卷積層的卷積參數(shù)以及存儲(chǔ)陣列的參數(shù)獲取卷積層的排布參數(shù),所述卷積層的排布參數(shù)包括卷積層的權(quán)重?cái)?shù)據(jù)在存儲(chǔ)體的排布行數(shù)和排布列數(shù),所述存儲(chǔ)陣列的參數(shù)包括存儲(chǔ)體數(shù)量以及存儲(chǔ)體的行數(shù)和列數(shù);排序模塊,用于根據(jù)卷積層的卷積類型、卷積參數(shù)以及排布參數(shù)對(duì)多個(gè)卷積層進(jìn)行排序;映射模塊,用于按照排序的順序依次根據(jù)存儲(chǔ)器損失度和/或均衡度獲取每個(gè)卷積層在存儲(chǔ)陣列中的排布位置。

13、根據(jù)本發(fā)明的第三方面,提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述所述的卷積神經(jīng)網(wǎng)絡(luò)的映射方法。

14、根據(jù)本發(fā)明的第四方面,提供一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上述所述的卷積神經(jīng)網(wǎng)絡(luò)的映射方法。

15、本發(fā)明提供的卷積神經(jīng)網(wǎng)絡(luò)的映射方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì),根據(jù)卷積層的卷積類型、卷積參數(shù)以及存儲(chǔ)陣列的參數(shù)獲取卷積層在存儲(chǔ)陣列的可選排布位置,并根據(jù)可選排布位置的存儲(chǔ)器損失度和/或均衡度對(duì)卷積層在存儲(chǔ)陣列中的排布位置進(jìn)行優(yōu)化,可以提高存儲(chǔ)陣列的空間利用率。

16、進(jìn)一步地,每一卷積核排布完成后對(duì)每個(gè)存儲(chǔ)體的權(quán)重排布狀態(tài)進(jìn)行合并處理以得到待排布卷積核的可選起始位置,使得不同輸出通道的卷積過(guò)濾器的權(quán)重?cái)?shù)據(jù)在不同存儲(chǔ)體的排布位置相同,可以并行計(jì)算,提高計(jì)算效率。



技術(shù)特征:

1.一種卷積神經(jīng)網(wǎng)絡(luò)的映射方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的映射方法,其特征在于,根據(jù)卷積層的卷積類型、卷積參數(shù)以及排布參數(shù)對(duì)多個(gè)卷積層進(jìn)行排序包括:

3.根據(jù)權(quán)利要求2所述的映射方法,其特征在于,所述卷積層的類型包括普通卷積、深度可分離卷積中的至少一個(gè);普通卷積層的存放在深度可分離卷積層之前。

4.根據(jù)權(quán)利要求2所述的映射方法,其特征在于,卷積層的卷積參數(shù)和排布參數(shù)的排序優(yōu)先級(jí)為:卷積過(guò)濾器的權(quán)值數(shù)量、輸出通道數(shù)量、排布行數(shù)和排布列數(shù),優(yōu)先級(jí)的順序可調(diào)。

5.根據(jù)權(quán)利要求1所述的映射方法,其特征在于,根據(jù)存儲(chǔ)器損失度和/或均衡度獲取卷積層在存儲(chǔ)陣列中的排布位置包括:

6.根據(jù)權(quán)利要求5所述的映射方法,其特征在于,普通卷積層的所述可選排布位置的存儲(chǔ)器損失度為待排布卷積核的排布位置之前的空行數(shù)量;普通卷積層的所述可選存儲(chǔ)體的均衡度為各個(gè)存儲(chǔ)體的權(quán)值數(shù)據(jù)排布行數(shù)的最大值與最小值之差。

7.根據(jù)權(quán)利要求5所述的映射方法,其特征在于,深度可分離卷積層的所述可選排布位置的存儲(chǔ)器損失度為待排布卷積核的排布位置左側(cè)各行的空列數(shù)量之和;深度可分離卷積層的所述可選存儲(chǔ)體的均衡度為可選起始位置所在列與各個(gè)存儲(chǔ)體已排布卷積核的排布起始位置所在列的差。

8.根據(jù)權(quán)利要求5所述的映射方法,其特征在于,對(duì)多個(gè)存儲(chǔ)體的權(quán)值排布狀態(tài)進(jìn)行合并處理以得到待排布卷積核的可選起始位置。

9.根據(jù)權(quán)利要求1所述的映射方法,其特征在于,當(dāng)輸出通道數(shù)量小于存儲(chǔ)體的數(shù)量時(shí),每個(gè)卷積層不同輸出通道的卷積過(guò)濾器的權(quán)重?cái)?shù)據(jù)分別排布在不同的存儲(chǔ)體,不同輸出通道的卷積過(guò)濾器的權(quán)重?cái)?shù)據(jù)在不同存儲(chǔ)體的排布位置相同。

10.根據(jù)權(quán)利要求1所述的映射方法,其特征在于,同一輸出通道的卷積過(guò)濾器的權(quán)重?cái)?shù)據(jù)排布在同一存儲(chǔ)體。

11.一種卷積神經(jīng)網(wǎng)絡(luò)的映射裝置,其特征在于,包括:

12.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-10中任一項(xiàng)所述的卷積神經(jīng)網(wǎng)絡(luò)的映射方法。

13.一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1-10中任一項(xiàng)所述的卷積神經(jīng)網(wǎng)絡(luò)的映射方法。


技術(shù)總結(jié)
本申請(qǐng)公開(kāi)一種卷積神經(jīng)網(wǎng)絡(luò)的映射方法及映射裝置,映射方法包括:遍歷卷積神經(jīng)網(wǎng)絡(luò)的每個(gè)卷積層獲取卷積層的卷積類型和卷積參數(shù);根據(jù)卷積層的卷積參數(shù)以及存儲(chǔ)陣列的參數(shù)獲取卷積層的排布參數(shù),卷積層的排布參數(shù)包括卷積層的權(quán)重?cái)?shù)據(jù)在存儲(chǔ)體的排布行數(shù)和排布列數(shù),存儲(chǔ)陣列的參數(shù)包括存儲(chǔ)體數(shù)量以及存儲(chǔ)體的行數(shù)和列數(shù);根據(jù)卷積層的卷積類型、卷積參數(shù)以及排布參數(shù)對(duì)多個(gè)卷積層進(jìn)行排序;按照排序的順序依次根據(jù)存儲(chǔ)器損失度和/或均衡度獲取每個(gè)卷積層在存儲(chǔ)陣列中的排布位置。本申請(qǐng)獲取卷積層在存儲(chǔ)陣列的可選排布位置,并根據(jù)可選排布位置的存儲(chǔ)器損失度和/或均衡度對(duì)卷積層在存儲(chǔ)陣列中的排布位置進(jìn)行優(yōu)化,提高存儲(chǔ)陣列的空間利用率。

技術(shù)研發(fā)人員:王冬梅,劉勇,周兵,熊大鵬
受保護(hù)的技術(shù)使用者:蘇州億鑄智能科技有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2024/12/23
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
通州区| 灵璧县| 淅川县| 长汀县| 泊头市| 沭阳县| 东乌珠穆沁旗| 宁都县| 罗平县| 平阳县| 西充县| 沙湾县| 玛多县| 房产| 石家庄市| 聊城市| 襄汾县| 左贡县| 华安县| 奈曼旗| 葫芦岛市| 康马县| 庆城县| 绍兴市| 瑞安市| 穆棱市| 安陆市| 仙桃市| 林甸县| 临夏市| 新乡市| 郎溪县| 福安市| 石屏县| 灵宝市| 山阳县| 泗阳县| 平乡县| 江山市| 霸州市| 罗江县|