本發(fā)明涉及圖像識別,尤其涉及一種輕量級遙感圖像小目標(biāo)檢測方法。
背景技術(shù):
1、利用遙感衛(wèi)星獲取的圖像進(jìn)行目標(biāo)檢測已成為工業(yè)領(lǐng)域的一項關(guān)鍵任務(wù),遙感圖像能夠?qū)Υ蠓秶貐^(qū)進(jìn)行對地觀測,獲取有價值的遙感數(shù)據(jù),并且獲取信息的速度快、周期短,在農(nóng)業(yè)、林業(yè)、氣候管理、環(huán)境保護(hù)等領(lǐng)域都有著廣泛的應(yīng)用;相較于傳統(tǒng)的目標(biāo)檢測任務(wù),遙感圖像具有分辨率高、隨機(jī)方向、多類內(nèi)變異、多尺度場景以及小目標(biāo)密集等特點,這使得遙感圖像的目標(biāo)檢測更加復(fù)雜。
2、盡管光學(xué)遙感圖像技術(shù)取得了快速發(fā)展,在雷達(dá)遙感圖像的小目標(biāo)檢測中仍存在許多挑戰(zhàn);雷達(dá)圖像雖然具備較高的分辨率,但其整體圖像質(zhì)量較差,待檢測目標(biāo)通常特征細(xì)微,表現(xiàn)為特征暗淡、對比度低以及信息不完整,極大增加了檢測難度;此外,雷達(dá)遙感圖像在采集過程中不可避免地會受到不可控的觀測條件及成像鏈中的干擾,如大氣擾動、平臺運動等。這導(dǎo)致了目標(biāo)與背景的混疊,進(jìn)一步加劇了小目標(biāo)檢測的難度;同時,大尺度遙感圖像通常包含豐富的上下文信息,若在實際檢測過程中忽略這些信息,可能會導(dǎo)致誤檢;隨著雷達(dá)傳感器的波段增加和圖像分辨率的提升,生成的遙感圖像數(shù)據(jù)量也在急劇增長,給下游任務(wù)處理帶來了巨大的挑戰(zhàn)。
3、隨著遙感圖像數(shù)據(jù)量急劇增長,將數(shù)據(jù)傳送至地面進(jìn)行處理的模式難以滿足高時效性應(yīng)用(如應(yīng)急救援)的性能需求,因為龐大的數(shù)據(jù)傳輸過程可能導(dǎo)致嚴(yán)重的時間延遲;因此,將檢測算法直接部署在計算資源有限的邊緣終端設(shè)備上以實現(xiàn)實時處理,能夠顯著減輕數(shù)據(jù)傳輸壓力并縮短從信息獲取到?jīng)Q策的時間延遲;然而,終端設(shè)備的資源限制(如功耗、重量和體積)對處理算法的可靠性、速度和規(guī)模提出了更高的要求。
4、在最近的研究中,通過在卷積操作中引入幾何和拓?fù)浼s束靈活應(yīng)對管狀結(jié)構(gòu)的形狀變化,確保分割結(jié)果能夠準(zhǔn)確反映管狀結(jié)構(gòu)的幾何特性,從而改善了分割的準(zhǔn)確性和穩(wěn)定性。該方法通過利用濾波器中的冗余減少了參數(shù)量和浮點運算(flops)的數(shù)量;然而,在通過增加網(wǎng)絡(luò)寬度來彌補精度損失的過程中,該方法的內(nèi)存訪問開銷也隨之增加;
5、involution操作突破了傳統(tǒng)卷積操作中固定卷積核的局限性,involution通過在每個位置動態(tài)調(diào)整卷積核的形狀,使其能夠更好地適應(yīng)圖像中的局部變化,從而顯著提升卷積操作的特征表達(dá)能力,但隨之而來的問題是計算復(fù)雜度和模型復(fù)雜度的增加;
6、lsknet設(shè)計了特殊的大卷積核分解機(jī)制,在減少參數(shù)量的同時實現(xiàn)了性能提升,增強(qiáng)了目標(biāo)檢測中的感受野,然而,這種方法在擴(kuò)大感受野的同時還帶來的大量的邊緣噪聲,這些噪聲會對檢測性能造成影響;
7、mae(masked?autoencoder)通過隨機(jī)遮蔽策略、輕量級解碼器設(shè)計以及編碼器-解碼器分離的架構(gòu)提升了視覺變換器的訓(xùn)練效率和特征表示能力,mae在參數(shù)量和計算量上做出了巨大提升,但該方法仍然難以適配計算資源受限的領(lǐng)域。
技術(shù)實現(xiàn)思路
1、有鑒于此,本發(fā)明提供一種輕量級遙感圖像小目標(biāo)檢測方法,有效提升目標(biāo)特征的表示能力、減弱噪聲干擾,并且在有限的計算資源和存儲空間下保證算法的高效性和準(zhǔn)確性,高效應(yīng)對遙感圖像檢測任務(wù)。
2、為實現(xiàn)上述目的,本發(fā)明一種輕量級遙感圖像小目標(biāo)檢測方法,采用改進(jìn)的cspdarknet作為主干網(wǎng)絡(luò),包括cbs模塊、csp模塊、輕量級特征卷積lfc模塊、sppf模塊和感受野擴(kuò)展rfe模塊;采用改進(jìn)的pan作為頸部網(wǎng)絡(luò),包括cbs模塊、層次融合注意力hfa模塊,包括以下步驟:
3、s1、對輸入的圖片數(shù)據(jù)進(jìn)行預(yù)處理,使用卷積核為3的cbs模塊將原始輸入圖像的3通道擴(kuò)張為16通道,特征圖尺寸減小至320×320,得到特征圖;
4、s2、使用卷積核為3的lfc模塊將特征圖通道擴(kuò)張為32,特征圖尺寸減小至160×160,得到特征圖;
5、s3、在不改變通道數(shù)和特征圖尺寸的同時使用csp模塊增強(qiáng)特征圖特征表達(dá),得到特征圖;
6、s4、重復(fù)步驟s2、步驟s3的操作,將通道數(shù)擴(kuò)張為64,特征圖尺寸減小至80×80,得到特征圖;
7、s5、重復(fù)步驟s2的操作,將通道數(shù)擴(kuò)張為128,特征圖尺寸減小至40×40,得到特征圖;
8、s6、使用rfe模塊對特征圖進(jìn)行處理,得到特征圖;
9、s7、重復(fù)步驟s5、步驟s6的操作,將通道數(shù)擴(kuò)張為256,特征圖尺寸減小至20×20,得到特征圖;
10、s8、使用sppf模塊增強(qiáng)特征圖特征表達(dá),得到特征圖;
11、s9、對特征圖進(jìn)行上采樣操作,將特征圖尺寸恢復(fù)到40×40,沿著通道方向與特征圖進(jìn)行拼接,特征圖;
12、s10、將特征圖輸入到hfa模塊,得到特征圖;
13、s11、重復(fù)步驟s9和步驟s10的操作,將特征圖尺寸擴(kuò)張到80×80,并與特征圖進(jìn)行拼接,得到特征圖;
14、s12、使用卷積核為3的cbs模塊將特征圖通道數(shù)改變?yōu)?4,特征圖尺寸減小至40×40,與步驟s10輸出的特征圖進(jìn)行拼接,并重復(fù)步驟s10的操作,得到特征圖;
15、s13、使用卷積核為3的cbs模塊處理步驟s12輸出的特征圖,將通道數(shù)改變?yōu)?28,特征圖尺寸減小至20×20,與步驟s8輸出的特征圖進(jìn)行拼接,并重復(fù)步驟s10的操作,得到特征圖;
16、s14、通過yolov8檢測頭輸出檢測結(jié)果;
17、yolov8檢測頭分別對特征圖、特征圖和特征圖的特征進(jìn)行分類和定位,得到特征圖檢測結(jié)果、特征圖檢測結(jié)果和特征圖檢測結(jié)果并形成檢測結(jié)果集合,得到目標(biāo)檢測結(jié)果。
18、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
19、本發(fā)明提出的lfc(lightweight?feature?convolution)是一種高效的輕量級卷積操作,顯著減少模型的參數(shù)量和計算量,同時盡可能保持較高的檢測精度;lfc適合部署在計算資源有限的設(shè)備中,用于實時處理遙感圖像,從而減輕數(shù)據(jù)傳輸壓力,縮短從信息獲取到?jīng)Q策的時間延遲;
20、本發(fā)明通過引入感受野擴(kuò)展模塊(receptive?field?expansion?block,rfeb)增強(qiáng)模型的表征能力;rfeb采用多分支膨脹卷積技術(shù),擴(kuò)展了骨干網(wǎng)絡(luò)的感受野,使得模型能夠更好地捕捉小目標(biāo)及其上下文信息,從而提升了檢測性能;
21、本發(fā)明提出層次融合注意力模塊(hierarchical?fusion?attention?block,hfab),通過漸進(jìn)式地堆疊空間注意力和自注意力機(jī)制,實現(xiàn)了從粗粒度到細(xì)粒度的特征融合;這種特征融合策略使得模型能夠更充分地表達(dá)小目標(biāo)的細(xì)節(jié)信息,有效緩解了傳統(tǒng)檢測算法在背景混淆和小目標(biāo)識別中的不足;
22、本發(fā)明在lfc、rfeb和hfab的協(xié)同作用下,在保持精度的前提顯著降低了計算復(fù)雜度,能夠在有限的硬件條件下運行,從而在未來應(yīng)用于實時處理任務(wù)中具有巨大的應(yīng)用潛力;這一輕量化設(shè)計還使本發(fā)明能夠適應(yīng)更多應(yīng)用場景,尤其是在需要快速響應(yīng)和高時效性應(yīng)用的場合,如緊急救援等場景具備極大的潛力。