基于高斯分布的GRU量化方法及存儲(chǔ)介質(zhì)、智能設(shè)備與流程

文檔序號(hào)：40462527發(fā)布日期：2024-12-27 09:27閱讀：13來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于高斯分布的GRU量化方法及存儲(chǔ)介質(zhì)、智能設(shè)備與流程

本申請(qǐng)涉及神經(jīng)網(wǎng)絡(luò)，具體涉及一種基于高斯分布的gru量化方法及存儲(chǔ)介質(zhì)、智能設(shè)備。

背景技術(shù)：

1、gru(gated?recurrent?unit，門控循環(huán)單元)模型，又稱gru神經(jīng)網(wǎng)絡(luò)模型，是傳統(tǒng)rnn(recurrent?neural?network，循環(huán)神經(jīng)網(wǎng)絡(luò))模型的一種變體，旨在解決傳統(tǒng)rnn模型中的梯度消失和梯度爆炸問(wèn)題。gru模型與傳統(tǒng)rnn模型之間的關(guān)鍵區(qū)別在于：傳統(tǒng)rnn模型是為了解決數(shù)據(jù)之間的時(shí)序依賴關(guān)系，一般它能很好的學(xué)習(xí)序列中鄰近時(shí)間步數(shù)據(jù)點(diǎn)(短期)之間的關(guān)系，但對(duì)于長(zhǎng)期依賴關(guān)系或者說(shuō)長(zhǎng)序列中的依賴關(guān)系的學(xué)習(xí)則會(huì)變得不穩(wěn)定；而gru模型支持隱藏狀態(tài)的門控，即gru模型通過(guò)引入更新門和重置門來(lái)控制信息的流動(dòng)，從而更好地捕捉長(zhǎng)序列中的依賴關(guān)系，這意味著gru模型有專門的機(jī)制來(lái)確定應(yīng)該何時(shí)更新隱藏狀態(tài)以及重置隱藏狀態(tài)。gru模型能夠以更簡(jiǎn)單的結(jié)構(gòu)實(shí)現(xiàn)傳統(tǒng)rnn模型同等的效果，且計(jì)算速度更快。于此，gru模型已逐漸得到了廣泛的應(yīng)用，當(dāng)gru模型應(yīng)用于低功耗和對(duì)實(shí)時(shí)性要求較高的應(yīng)用場(chǎng)景時(shí)，業(yè)內(nèi)一般通過(guò)gru量化(即是將浮點(diǎn)數(shù)據(jù)轉(zhuǎn)換為定點(diǎn)數(shù)據(jù))來(lái)降低計(jì)算量，從而使得gru模型實(shí)現(xiàn)較高的推理效率。

2、現(xiàn)有的gru量化方法通常是設(shè)置固定上下限的激活函數(shù)定義域、構(gòu)建均勻分布定義域的激活函數(shù)表、采用平均插值法查找激活函數(shù)值來(lái)計(jì)算gru模型的各單元量化值。然而，固定上下限的激活函數(shù)定義域無(wú)法適用于非固定的輸入數(shù)據(jù)，例如無(wú)法適用于訓(xùn)練事件發(fā)生變化所導(dǎo)致的樣本方差波動(dòng)較大的場(chǎng)景，均勻分布定義域的激活函數(shù)表無(wú)法對(duì)靠近均值附近的稠密自變量集合產(chǎn)生高精確度的映射結(jié)果，采用平均插值法查找激活函數(shù)值時(shí)插值點(diǎn)之間的距離相同，無(wú)法利用插值點(diǎn)之間的不同距離來(lái)提高數(shù)值計(jì)算精度。綜合而言，現(xiàn)有的gru量化方法難以適用于非固定的輸入數(shù)據(jù)，且計(jì)算精度有待提高。

技術(shù)實(shí)現(xiàn)思路

1、鑒于此，本申請(qǐng)?zhí)峁┮环N基于高斯分布的gru量化方法及存儲(chǔ)介質(zhì)、智能設(shè)備，可以改善現(xiàn)有g(shù)ru量化方法難以適用于非固定的輸入數(shù)據(jù)、計(jì)算精度有待提高的問(wèn)題。

2、本申請(qǐng)?zhí)峁┑囊环N基于高斯分布的gru量化方法，包括：

3、獲取輸入gru模型的訓(xùn)練數(shù)據(jù)，并計(jì)算得到所述訓(xùn)練數(shù)據(jù)的方差；

4、根據(jù)所述訓(xùn)練數(shù)據(jù)的方差進(jìn)行高斯采樣，以獲取高斯樣本集合；

5、對(duì)所述高斯樣本集合內(nèi)的元素進(jìn)行排序；

6、對(duì)所述gru模型的激活函數(shù)進(jìn)行定義域重構(gòu)，以將所述gru模型的激活函數(shù)的定義域限定至排序后的高斯樣本集合內(nèi)；

7、對(duì)所述定義域重構(gòu)后的激活函數(shù)進(jìn)行插值計(jì)算以得到對(duì)應(yīng)的值域列表；

8、將所述值域列表中的元素映射到定點(diǎn)值域列表以完成gru模型的量化；

9、基于量化后的gru模型計(jì)算重置門、更新門、候選隱藏狀態(tài)及隱藏狀態(tài)。

10、可選的，根據(jù)所述訓(xùn)練數(shù)據(jù)的最大值和最小值，并通過(guò)關(guān)系式1計(jì)算得到所述訓(xùn)練數(shù)據(jù)的方差：

11、σ＝(imax-imin)2???????????關(guān)系式1

12、所述σ表示所述訓(xùn)練數(shù)據(jù)的方差，所述imax表示所述訓(xùn)練數(shù)據(jù)的最大值，所述imin表示所述訓(xùn)練數(shù)據(jù)的最小值。

13、可選的，通過(guò)關(guān)系式2獲取所述高斯樣本集合：

14、

15、所述n(0，σ)表示均值為零且方差為計(jì)算得到的所述訓(xùn)練數(shù)據(jù)的方差的高斯分布，所述dt～n(0，σ)，ι＝1t2，3，...，t表示從所述n(0，σ)中不重復(fù)采樣t次，所述d為所述t次采樣所獲取的高斯樣本集合。

16、可選的，對(duì)所述高斯樣本集合內(nèi)的元素進(jìn)行排序，包括：

17、對(duì)所述高斯樣本集合內(nèi)的元素按照從小到大的順序進(jìn)行排序。

18、可選的，通過(guò)關(guān)系式3對(duì)所述高斯樣本集合內(nèi)的元素進(jìn)行排序：

19、q＝sort(d)＝[qt]，t＝1，2，3，...，t????關(guān)系式3

20、所述q表示排序后的高斯樣本集合，所述sort(d)表示對(duì)所述d采用的排序函數(shù)，所述qt表示所述排序后的高斯樣本集合中第t位的元素。

21、可選的，將所述gru模型的激活函數(shù)的定義域限定至排序后的高斯樣本集合內(nèi)，包括：

22、將所述gru模型的sigmoid激活函數(shù)和tanh激活函數(shù)的定義域均限定至所述排序后的高斯樣本集合內(nèi)。

23、可選的，對(duì)所述定義域重構(gòu)后的激活函數(shù)進(jìn)行插值計(jì)算以得到對(duì)應(yīng)的值域列表，包括：

24、通過(guò)關(guān)系式4計(jì)算得到定義域重構(gòu)后的sigmoid激活函數(shù)的值域列表a，以及通過(guò)關(guān)系式5計(jì)算得到定義域重構(gòu)后的tanh激活函數(shù)的值域列表b：

25、a＝sigmoid(q)＝[sigmoid(qt)]，t＝1，2，3，...，t????關(guān)系式4

26、b＝tanh(q)＝[tanh(qt)]，t＝1，2，3，...，t?????????關(guān)系式5

27、可選的，通過(guò)關(guān)系式6將所述值域列表中的元素映射到定點(diǎn)值域列表，以完成gru模型的量化：

28、

29、所述si表示量化因子，所述b為量化的位寬，所述aq表示所述值域列表a映射的定點(diǎn)值域列表，所述bq表示所述值域列表b映射的定點(diǎn)值域列表。

30、本申請(qǐng)?zhí)峁┑囊环N存儲(chǔ)介質(zhì)，存儲(chǔ)有程序，所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上任一項(xiàng)所述的基于高斯分布的gru量化方法的步驟。

31、本申請(qǐng)?zhí)峁┑囊环N智能設(shè)備，包括處理器，所述處理器可執(zhí)行如上任一項(xiàng)基于高斯分布的gru量化方法的步驟；和/或，包括如上所述的存儲(chǔ)介質(zhì)。

32、如上所述，本申請(qǐng)根據(jù)訓(xùn)練數(shù)據(jù)的方差進(jìn)行高斯采樣以獲取高斯樣本集合，并將gru模型的激活函數(shù)的定義域限定至高斯樣本集合內(nèi)，即激活函數(shù)的定義域的上下限是根據(jù)訓(xùn)練數(shù)據(jù)的方差來(lái)適應(yīng)性設(shè)定的，而非固定的，因此可以適用于非固定的輸入數(shù)據(jù)；并且，本申請(qǐng)基于高斯分布進(jìn)行采樣來(lái)實(shí)現(xiàn)激活函數(shù)的定義域重構(gòu)，由于高斯分布較為真實(shí)的體現(xiàn)樣本的連續(xù)分布情況，因此可以對(duì)靠近均值附近的例如稠密自變量集合產(chǎn)生高精確度的映射結(jié)果，從而可以提高數(shù)值計(jì)算精度；進(jìn)一步的，對(duì)基于高斯分布得到的樣本集合進(jìn)行插值計(jì)算，相當(dāng)于基于離散經(jīng)驗(yàn)插值算法來(lái)計(jì)算得到激活函數(shù)的值，插值點(diǎn)之間的距離是真實(shí)樣本分布的體現(xiàn)，有利于提高數(shù)值計(jì)算精度。

技術(shù)特征：

1.一種基于高斯分布的gru量化方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，根據(jù)所述訓(xùn)練數(shù)據(jù)的最大值和最小值，并通過(guò)關(guān)系式1計(jì)算得到所述訓(xùn)練數(shù)據(jù)的方差：

3.根據(jù)權(quán)利要求1或2所述的方法，其特征在于，通過(guò)關(guān)系式2獲取所述高斯樣本集合：

4.根據(jù)權(quán)利要求1所述的方法，其特征在于，對(duì)所述高斯樣本集合內(nèi)的元素進(jìn)行排序，包括：

5.根據(jù)權(quán)利要求4所述的方法，其特征在于，通過(guò)關(guān)系式3對(duì)所述高斯樣本集合內(nèi)的元素進(jìn)行排序：

6.根據(jù)權(quán)利要求1或5所述的方法，其特征在于，將所述gru模型的激活函數(shù)的定義域限定至排序后的高斯樣本集合內(nèi)，包括：

7.根據(jù)權(quán)利要求6所述的方法，其特征在于，對(duì)所述定義域重構(gòu)后的激活函數(shù)進(jìn)行插值計(jì)算以得到對(duì)應(yīng)的值域列表，包括：

8.根據(jù)權(quán)利要求7所述的方法，其特征在于，通過(guò)關(guān)系式6將所述值域列表中的元素映射到定點(diǎn)值域列表，以完成gru模型的量化：

9.一種存儲(chǔ)介質(zhì)，其特征在于，存儲(chǔ)有程序，所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至8中任一項(xiàng)所述的基于高斯分布的gru量化方法的步驟。

10.一種智能設(shè)備，其特征在于，

技術(shù)總結(jié)
本申請(qǐng)?zhí)岢隽艘环N基于高斯分布的GRU量化方法及存儲(chǔ)介質(zhì)、智能設(shè)備。所述GRU量化方法包括：獲取輸入GRU模型的訓(xùn)練數(shù)據(jù)，并計(jì)算得到訓(xùn)練數(shù)據(jù)的方差；根據(jù)訓(xùn)練數(shù)據(jù)的方差進(jìn)行高斯采樣，以獲取高斯樣本集合；對(duì)高斯樣本集合內(nèi)的元素進(jìn)行排序；對(duì)GRU模型的激活函數(shù)進(jìn)行定義域重構(gòu)，以將GRU模型的激活函數(shù)的定義域限定至排序后的高斯樣本集合內(nèi)；對(duì)定義域重構(gòu)后的激活函數(shù)進(jìn)行插值計(jì)算，得到對(duì)應(yīng)的值域列表；將值域列表中的元素映射到定點(diǎn)值域列表以完成GRU模型的量化；基于量化后的GRU模型計(jì)算重置門、更新門、候選隱藏狀態(tài)及隱藏狀態(tài)?；诖?，本申請(qǐng)可以使得GRU模型適用于非固定的輸入數(shù)據(jù)，并且具有較高的計(jì)算精度。

技術(shù)研發(fā)人員：鞏寧,盧縣,李倩
受保護(hù)的技術(shù)使用者：恒玄科技（上海）股份有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/26

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：鞏寧,盧縣,李倩
技術(shù)所有人：恒玄科技（上海）股份有限公司
我是此專利的發(fā)明人

上一篇：耳機(jī)裝置的制作方法
上一篇：一種長(zhǎng)度可變的橡膠基運(yùn)動(dòng)矯姿帶的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于高斯分布的GRU量化方法及存儲(chǔ)介質(zhì)、智能設(shè)備與流程