欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

目標(biāo)檢測模型訓(xùn)練方法、裝置、電子設(shè)備及存儲介質(zhì)

文檔序號:40461535發(fā)布日期:2024-12-27 09:26閱讀:13來源:國知局
目標(biāo)檢測模型訓(xùn)練方法、裝置、電子設(shè)備及存儲介質(zhì)

本發(fā)明涉及計算機(jī)處理,具體而言,涉及一種目標(biāo)檢測模型訓(xùn)練方法、裝置、電子設(shè)備及存儲介質(zhì)。


背景技術(shù):

1、視頻衛(wèi)星在監(jiān)測、導(dǎo)航、資源管理等領(lǐng)域發(fā)揮著重要作用,視頻衛(wèi)星圖像中的小目標(biāo)檢測是視頻衛(wèi)星圖像目標(biāo)識別中的一項關(guān)鍵任務(wù),作為計算機(jī)視覺領(lǐng)域中的熱點和難點問題,尤其對于視頻衛(wèi)星圖像,由于拍攝距離較遠(yuǎn),地面目標(biāo)自身分辨率較低,目標(biāo)在圖像中所占的像素較少,并受到復(fù)雜背景因素的干擾,直接從輸入圖像中準(zhǔn)確地檢測微小目標(biāo)變得非常困難。

2、目前用于小目標(biāo)檢測的網(wǎng)絡(luò)模型通常采用注意力機(jī)制來提升模型對小目標(biāo)檢測的性能,例如se(squeeze-and-excitation)、eca(efficient?channel?attention)、cbam(convolutional?block?attention?module)、sge(spatial?group-wise?enhance)、ema(efficient?multi-scale?attention)等等。現(xiàn)有的注意力機(jī)制對于特征提取考慮的層面不夠充分,存在微小目標(biāo)檢測精度低、效果差的問題。


技術(shù)實現(xiàn)思路

1、有鑒于此,本技術(shù)實施例的目的在于提供一種目標(biāo)檢測模型訓(xùn)練方法、裝置、電子設(shè)備及存儲介質(zhì),能夠改善傳統(tǒng)目標(biāo)識別類模型對視頻衛(wèi)星圖像中的小目標(biāo)檢測精度低、效果差的問題。

2、為實現(xiàn)上述技術(shù)目的,本技術(shù)采用的技術(shù)方案如下:

3、第一方面,本技術(shù)實施例提供了一種目標(biāo)檢測模型訓(xùn)練方法,所述方法包括:

4、獲取用于模型訓(xùn)練的數(shù)據(jù)集,所述數(shù)據(jù)集包括多個樣本圖像和每個樣本圖像對應(yīng)的真實目標(biāo)的類型和坐標(biāo);

5、將所述數(shù)據(jù)集輸入待訓(xùn)練的初始檢測模型中的特征提取網(wǎng)絡(luò),對于每個所述樣本圖像,通過所述特征提取網(wǎng)絡(luò)對所述樣本圖像進(jìn)行多尺度特征提取和注意力特征提取,得到每個所述樣本圖像對應(yīng)的多個多尺度特征圖;

6、對于每個所述樣本圖像,將各個所述多尺度特征圖輸入所述初始檢測模型中的檢測頭,以得到所述樣本圖像對應(yīng)的檢測結(jié)果,所述檢測結(jié)果包括所述樣本圖像中的待檢測目標(biāo)的類型和坐標(biāo);

7、計算每個所述待檢測目標(biāo)和每個所述待檢測目標(biāo)的類別和坐標(biāo)與對應(yīng)的所述真實目標(biāo)的類型和坐標(biāo)之間的損失值,所述損失值表征所述待檢測目標(biāo)與所述真實目標(biāo)的誤差;

8、判斷所述損失值是否滿足預(yù)設(shè)模型收斂條件,若所述損失值滿足所述預(yù)設(shè)模型收斂條件,則將滿足所述預(yù)設(shè)模型收斂條件的所述初始檢測模型作為目標(biāo)檢測模型,若所述損失值不滿足所述預(yù)設(shè)模型收斂條件,則調(diào)整所述初始檢測模型的參數(shù),并按照調(diào)整后的參數(shù)訓(xùn)練所述初始檢測模型,直到所述損失值滿足所述預(yù)設(shè)模型收斂條件。

9、結(jié)合第一方面,在一些可選的實施方式中,將所述數(shù)據(jù)集輸入待訓(xùn)練的初始檢測模型中的特征提取網(wǎng)絡(luò),對于每個所述樣本圖像,通過所述特征提取網(wǎng)絡(luò)對所述樣本圖像進(jìn)行多尺度特征提取和注意力特征提取,得到每個所述樣本圖像對應(yīng)的多個多尺度特征圖,包括:

10、通過所述骨干網(wǎng)絡(luò)模塊提取所述樣本圖像中的不同尺度的特征圖;

11、確定所述不同尺度的特征圖中,攜帶有所述待檢測目標(biāo)的語義特征的特征圖作為目標(biāo)特征圖,并將各個所述目標(biāo)特征圖輸入所述特征提取網(wǎng)絡(luò)中的頸部網(wǎng)絡(luò)模塊,以通過所述頸部網(wǎng)絡(luò)模塊中的pafpn結(jié)構(gòu)增強(qiáng)所述目標(biāo)特征圖的淺層特征,得到每個所述目標(biāo)特征圖像對應(yīng)的增強(qiáng)后的目標(biāo)特征圖;

12、對于每個所述增強(qiáng)后的目標(biāo)特征圖,將所述增強(qiáng)后的目標(biāo)特征圖輸入所述頸部網(wǎng)絡(luò)模塊中的三叉戟空間融合注意力子模塊,以通過所述三叉戟空間融合注意力子模塊對所述增強(qiáng)后的目標(biāo)特征圖進(jìn)行特征提取,得到每個所述增強(qiáng)后的目標(biāo)特征圖對應(yīng)的多尺度特征圖。

13、結(jié)合第一方面,在一些可選的實施方式中,對于每個所述樣本圖像,所述三叉戟空間注意力子模塊包括3個空間注意力模塊、1個concatenate層和1個cbs模塊;

14、對于每個所述增強(qiáng)后的目標(biāo)特征圖,將所述增強(qiáng)后的目標(biāo)特征圖輸入所述頸部網(wǎng)絡(luò)模塊中的三叉戟空間融合注意力子模塊,以通過所述三叉戟空間融合注意力子模塊對所述增強(qiáng)后的目標(biāo)特征圖進(jìn)行特征提取,得到每個所述增強(qiáng)后的目標(biāo)特征圖對應(yīng)的多尺度特征圖,包括:

15、通過3個所述空間注意力模塊,對所述增強(qiáng)后的目標(biāo)特征圖中的不同維度進(jìn)行特征提取,得到每個維度對應(yīng)的特征信息;

16、通過所述concatenate層對所有特征信息進(jìn)行張量拼接,并通過所述cbs模塊輸出,得到所述多尺度特征圖。

17、結(jié)合第一方面,在一些可選的實施方式中,每個所述空間注意力模塊分別包括第一池化層、第二池化層、第一卷積層和第一激活函數(shù);

18、通過3個所述空間注意力模塊,對所述增強(qiáng)后的目標(biāo)特征圖中的不同維度進(jìn)行特征提取,得到每個維度對應(yīng)的特征信息,包括:

19、對所述增強(qiáng)后的目標(biāo)特征圖進(jìn)行形狀變換,得到三張不同形狀的特征圖;

20、將所述三張不同形狀的特征圖分別輸入每個所述空間注意力模塊的第一池化層進(jìn)行最大池化操作,得到每個所述特征圖對應(yīng)的第一特征圖;

21、將所述三張不同形狀的特征圖分別輸入每個所述空間注意力模塊的第二池化層進(jìn)行平均池化操作,得到每個所述特征圖對應(yīng)的第二特征圖;

22、對于每個所述空間注意力模塊,將所述第一特征圖和所述第二特征圖進(jìn)行張量拼接,得到第三特征圖;

23、將所述第三特征圖輸入每個所述空間注意力模塊的第一卷積層進(jìn)行深度卷積,并通過所述第一激活函數(shù)計算得到深度卷積后的所述第三特征圖對應(yīng)的權(quán)重系數(shù);

24、將所述權(quán)重系數(shù)與所述增強(qiáng)后的目標(biāo)特征圖相乘,得到所述特征信息。

25、結(jié)合第一方面,在一些可選的實施方式中,計算每個所述待檢測目標(biāo)的類別和坐標(biāo)與對應(yīng)的所述真實目標(biāo)的類型和坐標(biāo)之間的損失值,包括:

26、通過所述初始檢測模型的損失函數(shù)確定所述損失值,其中,所述損失值的計算公式如下:

27、

28、

29、

30、

31、式中,ciouloss表示損失值,iou表示預(yù)測框b與標(biāo)注的真值框bgt的交并比,ρ2(b,bgt)表示預(yù)測框的中心點b與真值框的中心點bgt的歐氏距離,c表示能同時包含預(yù)測框和真值框的最小包閉區(qū)域的對角線距離,α表示權(quán)重系數(shù),v表示預(yù)測框和真值框的長寬比的相似性,w表示預(yù)測框的寬,h表示預(yù)測框的高,wgt表示真值框的寬,hgt表示真值框的高。

32、結(jié)合第一方面,在一些可選的實施方式中,所述方法還包括:

33、獲取待識別圖像;

34、將所述待識別圖像輸入所述目標(biāo)檢測模型,以識別所述待識別圖像中的待識別目標(biāo)的目標(biāo)類型。

35、結(jié)合第一方面,在一些可選的實施方式中,在獲取用于模型訓(xùn)練的數(shù)據(jù)集之前,所述方法還包括:

36、獲取樣本圖像集;

37、對所述樣本圖像集中的每個初始樣本圖像進(jìn)行數(shù)據(jù)增強(qiáng)處理,得到數(shù)據(jù)增強(qiáng)后的樣本圖像集;

38、將所述數(shù)據(jù)增強(qiáng)后的樣本圖像集按預(yù)設(shè)比例分為訓(xùn)練集和測試集,以作為所述數(shù)據(jù)集。

39、第二方面,本技術(shù)實施例還提供一種目標(biāo)檢測模型訓(xùn)練裝置,所述裝置包括:

40、第一獲取單元,用于獲取用于模型訓(xùn)練的數(shù)據(jù)集,所述數(shù)據(jù)集包括多個樣本圖像和每個樣本圖像對應(yīng)的真實目標(biāo)的類型和坐標(biāo);

41、特征提取單元,用于將所述數(shù)據(jù)集輸入待訓(xùn)練的初始檢測模型中的特征提取網(wǎng)絡(luò),對于每個所述樣本圖像,通過所述特征提取網(wǎng)絡(luò)對所述樣本圖像進(jìn)行多尺度特征提取和注意力特征提取,得到每個所述樣本圖像對應(yīng)的多個多尺度特征圖;

42、檢測單元,用于對于每個所述樣本圖像,將各個所述多尺度特征圖輸入所述初始檢測模型中的檢測頭,以得到所述樣本圖像對應(yīng)的檢測結(jié)果,所述檢測結(jié)果包括所述樣本圖像中的待檢測目標(biāo)的類型和坐標(biāo);

43、第二獲取單元,用于計算每個所述待檢測目標(biāo)的類別和坐標(biāo)與對應(yīng)的所述真實目標(biāo)的類型和坐標(biāo)之間的損失值,所述損失值表征所述待檢測目標(biāo)與所述真實目標(biāo)的誤差;

44、判斷單元,用于判斷所述損失值是否滿足預(yù)設(shè)模型收斂條件,若所述損失值滿足所述預(yù)設(shè)模型收斂條件,則將滿足所述預(yù)設(shè)模型收斂條件的所述初始檢測模型作為目標(biāo)檢測模型,若所述損失值不滿足所述預(yù)設(shè)模型收斂條件,則調(diào)整所述初始檢測模型的參數(shù),并按照調(diào)整后的參數(shù)訓(xùn)練所述初始檢測模型,直到所述損失值滿足所述預(yù)設(shè)模型收斂條件。

45、第三方面,本技術(shù)實施例還提供一種電子設(shè)備,所述電子設(shè)備包括相互耦合的處理器及存儲器,所述存儲器內(nèi)存儲計算機(jī)程序,當(dāng)所述計算機(jī)程序被所述處理器執(zhí)行時,使得所述電子設(shè)備執(zhí)行上述的方法。

46、第四方面,本技術(shù)實施例還提供一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)中存儲有計算機(jī)程序,當(dāng)所述計算機(jī)程序在計算機(jī)上運(yùn)行時,使得所述計算機(jī)執(zhí)行上述的方法。

47、采用上述技術(shù)方案的發(fā)明,具有如下優(yōu)點:

48、在本技術(shù)提供的技術(shù)方案中,首先獲取用于模型訓(xùn)練的數(shù)據(jù)集,并將數(shù)據(jù)集中的樣本圖像輸入待訓(xùn)練的初始檢測模型中的特征提取網(wǎng)絡(luò),以通過特征提取網(wǎng)絡(luò)對樣本圖像進(jìn)行多尺度特征提取和注意力特征提取,得到多尺度特征圖,然后將多尺度特征圖輸入初始檢測模型中的檢測頭,得到樣本圖像對應(yīng)的檢測結(jié)果,然后獲取檢測結(jié)果中的待檢測目標(biāo)與真實目標(biāo)之間的損失值,當(dāng)損失值滿足預(yù)設(shè)模型收斂條件時,確定該初始檢測模型為目標(biāo)檢測模型。如此,可以改善傳統(tǒng)目標(biāo)識別類模型對視頻衛(wèi)星圖像中的小目標(biāo)檢測精度低、效果差的問題。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
瑞安市| 加查县| 孟村| 辽阳市| 剑阁县| 旬阳县| 宣恩县| 隆化县| 巩留县| 刚察县| 紫金县| 辽阳县| 马山县| 犍为县| 工布江达县| 宁乡县| 山阴县| 河北区| 临湘市| 汉源县| 哈密市| 阜平县| 神池县| 温泉县| 彭阳县| 中方县| 息烽县| 庆城县| 丰宁| 安顺市| 桃园市| 珠海市| 十堰市| 泰来县| 永顺县| 临安市| 右玉县| 灵寿县| 紫阳县| 方正县| 贵德县|