本申請涉及機器學(xué)習(xí),尤其涉及一種計數(shù)模型的訓(xùn)練方法及裝置。
背景技術(shù):
1、目前計數(shù)應(yīng)用比較常見的是人群計算和動物數(shù)量計數(shù)等,這些應(yīng)用場景中需要計數(shù)的對象獨立性較強或者區(qū)別較為明顯,現(xiàn)有的計數(shù)算法或計數(shù)模型也是針對這些對象的。在農(nóng)業(yè)生產(chǎn)中也經(jīng)常需要對單位內(nèi)的農(nóng)作物計數(shù),以了解出苗率,對提高農(nóng)作物的產(chǎn)值有著重大意義。因為一般農(nóng)作物都比較種植的比較密集,各株農(nóng)作物之間還互相遮擋,如果直接使用現(xiàn)有的計數(shù)算法或計數(shù)模型必然準確率較低。
技術(shù)實現(xiàn)思路
1、有鑒于此,本申請實施例提供了一種計數(shù)模型的訓(xùn)練方法、裝置、電子設(shè)備及計算機可讀存儲介質(zhì),以解決現(xiàn)有技術(shù)中農(nóng)作物計數(shù)準確率低的問題。
2、本申請實施例的第一方面,提供了一種計數(shù)模型的訓(xùn)練方法,包括:構(gòu)建坐標注意力網(wǎng)絡(luò)和頭網(wǎng)絡(luò),利用坐標注意力網(wǎng)絡(luò)和殘差網(wǎng)絡(luò)構(gòu)建主干網(wǎng)絡(luò),利用主干網(wǎng)絡(luò)、漸進式特征圖金字塔網(wǎng)絡(luò)和頭網(wǎng)絡(luò)構(gòu)建計數(shù)模型;獲取關(guān)于目標對象的訓(xùn)練圖像,將訓(xùn)練圖像輸入計數(shù)模型:通過主干網(wǎng)絡(luò)處理訓(xùn)練圖像,得到第一特征圖、第二特征圖、第三特征圖和第四特征圖;通過漸進式特征圖金字塔網(wǎng)絡(luò)處理第一特征圖、第二特征圖、第三特征圖和第四特征圖,得到第五特征圖、第六特征圖、第七特征圖和第八特征圖;通過頭網(wǎng)絡(luò)處理第五特征圖、第六特征圖、第七特征圖和第八特征圖,得到訓(xùn)練圖像上目標對象的預(yù)測框和預(yù)測框的類別置信度;基于預(yù)測框、類別置信度、訓(xùn)練圖像的標簽和真實框,計算計數(shù)損失;依據(jù)計數(shù)損失優(yōu)化計數(shù)模型的模型參數(shù),以完成對計數(shù)模型的訓(xùn)練。
3、本申請實施例的第二方面,提供了一種計數(shù)模型的訓(xùn)練裝置,包括:構(gòu)建模塊,被配置為構(gòu)建坐標注意力網(wǎng)絡(luò)和頭網(wǎng)絡(luò),利用坐標注意力網(wǎng)絡(luò)和殘差網(wǎng)絡(luò)構(gòu)建主干網(wǎng)絡(luò),利用主干網(wǎng)絡(luò)、漸進式特征圖金字塔網(wǎng)絡(luò)和頭網(wǎng)絡(luò)構(gòu)建計數(shù)模型;第一處理模塊,被配置為獲取關(guān)于目標對象的訓(xùn)練圖像,將訓(xùn)練圖像輸入計數(shù)模型:通過主干網(wǎng)絡(luò)處理訓(xùn)練圖像,得到第一特征圖、第二特征圖、第三特征圖和第四特征圖;第二處理模塊,被配置為通過漸進式特征圖金字塔網(wǎng)絡(luò)處理第一特征圖、第二特征圖、第三特征圖和第四特征圖,得到第五特征圖、第六特征圖、第七特征圖和第八特征圖;第三處理模塊,被配置為通過頭網(wǎng)絡(luò)處理第五特征圖、第六特征圖、第七特征圖和第八特征圖,得到訓(xùn)練圖像上目標對象的預(yù)測框和預(yù)測框的類別置信度;計算模塊,被配置為基于預(yù)測框、類別置信度、訓(xùn)練圖像的標簽和真實框,計算計數(shù)損失;優(yōu)化模塊,被配置為依據(jù)計數(shù)損失優(yōu)化計數(shù)模型的模型參數(shù),以完成對計數(shù)模型的訓(xùn)練。
4、本申請實施例的第三方面,提供了一種電子設(shè)備,包括存儲器、處理器以及存儲在存儲器中并且可在處理器上運行的計算機程序,該處理器執(zhí)行計算機程序時實現(xiàn)上述方法的步驟。
5、本申請實施例的第四方面,提供了一種計算機可讀存儲介質(zhì),該計算機可讀存儲介質(zhì)存儲有計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)上述方法的步驟。
6、本申請實施例與現(xiàn)有技術(shù)相比存在的有益效果是:因為本申請實施例通過構(gòu)建坐標注意力網(wǎng)絡(luò)和頭網(wǎng)絡(luò),利用坐標注意力網(wǎng)絡(luò)和殘差網(wǎng)絡(luò)構(gòu)建主干網(wǎng)絡(luò),利用主干網(wǎng)絡(luò)、漸進式特征圖金字塔網(wǎng)絡(luò)和頭網(wǎng)絡(luò)構(gòu)建計數(shù)模型;獲取關(guān)于目標對象的訓(xùn)練圖像,將訓(xùn)練圖像輸入計數(shù)模型:通過主干網(wǎng)絡(luò)處理訓(xùn)練圖像,得到第一特征圖、第二特征圖、第三特征圖和第四特征圖;通過漸進式特征圖金字塔網(wǎng)絡(luò)處理第一特征圖、第二特征圖、第三特征圖和第四特征圖,得到第五特征圖、第六特征圖、第七特征圖和第八特征圖;通過頭網(wǎng)絡(luò)處理第五特征圖、第六特征圖、第七特征圖和第八特征圖,得到訓(xùn)練圖像上目標對象的預(yù)測框和預(yù)測框的類別置信度;基于預(yù)測框、類別置信度、訓(xùn)練圖像的標簽和真實框,計算計數(shù)損失;依據(jù)計數(shù)損失優(yōu)化計數(shù)模型的模型參數(shù),以完成對計數(shù)模型的訓(xùn)練。采用上述技術(shù)手段,可以解決現(xiàn)有技術(shù)中,農(nóng)作物計數(shù)準確率低的問題,進而提高農(nóng)作物計數(shù)的準確率。
1.一種計數(shù)模型的訓(xùn)練方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,構(gòu)建坐標注意力網(wǎng)絡(luò)和頭網(wǎng)絡(luò),包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,構(gòu)建坐標注意力網(wǎng)絡(luò),包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,利用所述坐標注意力網(wǎng)絡(luò)和殘差網(wǎng)絡(luò)構(gòu)建主干網(wǎng)絡(luò),包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,通過所述頭網(wǎng)絡(luò)處理所述第五特征圖、所述第六特征圖、所述第七特征圖和所述第八特征圖,得到所述訓(xùn)練圖像上目標對象的預(yù)測框和所述預(yù)測框的類別置信度,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于所述預(yù)測框、所述類別置信度、所述訓(xùn)練圖像的標簽和真實框,計算計數(shù)損失,包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,依據(jù)所述計數(shù)損失優(yōu)化所述計數(shù)模型的模型參數(shù),以完成對所述計數(shù)模型的訓(xùn)練之后,所述方法還包括:
8.一種計數(shù)模型的訓(xùn)練裝置,其特征在于,包括:
9.一種電子設(shè)備,包括存儲器、處理器以及存儲在所述存儲器中并且可在所述處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如權(quán)利要求1至7中任一項所述方法的步驟。
10.一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至7中任一項所述方法的步驟。