本發(fā)明涉及遙感圖像分類領(lǐng)域,具體涉及一種基于xgboost和域自適應(yīng)的高光譜圖像農(nóng)作物跨場景分類分類方法。
背景技術(shù):
1、高光譜圖像(hyperspectral?image,hsi)具有豐富的信息和細(xì)微的光譜區(qū)分能力,廣泛應(yīng)用于礦物鑒定、軍事偵察、精準(zhǔn)農(nóng)業(yè)等領(lǐng)域。在農(nóng)業(yè)中,高光譜圖像能夠精確捕捉作物的生長狀態(tài)、病害和養(yǎng)分分布,為農(nóng)作物管理和產(chǎn)量預(yù)測提供了重要的支持。然而,傳統(tǒng)的分類算法,如支持向量機(jī)和決策樹,雖然已經(jīng)在很大程度上滿足了基本的分類需求,但面對高光譜數(shù)據(jù)的高維特性和光譜混合現(xiàn)象時(shí),分類的復(fù)雜性顯著增加,使得這些傳統(tǒng)方法在處理此類數(shù)據(jù)時(shí)面臨諸多挑戰(zhàn)。此外,在實(shí)際應(yīng)用中,高光譜圖像分類還面臨領(lǐng)域差異和標(biāo)記樣本稀缺等問題,尤其在農(nóng)業(yè)領(lǐng)域,不同作物的生長環(huán)境和光譜特征差異大,導(dǎo)致分類模型的泛化性能下降,難以在不同領(lǐng)域中保持高準(zhǔn)確度。目前的高光譜圖像分類方法通常依賴大量標(biāo)記樣本進(jìn)行訓(xùn)練,但在農(nóng)業(yè)應(yīng)用中,獲取足夠的標(biāo)記樣本既昂貴又耗時(shí),且在不同的地理區(qū)域中,農(nóng)作物的光譜特征存在顯著差異,進(jìn)一步增加了分類的難度。
2、為此,一些研究員嘗試將領(lǐng)域自適應(yīng)的方法應(yīng)用于高光譜圖像分類任務(wù)中,用于解決上述問題。領(lǐng)域自適應(yīng)是遷移學(xué)習(xí)的一種代表性方法,其思路是將不同但相近的場景(如兩張拍攝時(shí)間不同但區(qū)域相同的高光譜圖像)映射到同一個特征空間,利用標(biāo)簽豐富的源域樣本提取不同域之間的潛在關(guān)聯(lián)信息(即域不變特征),對缺少標(biāo)簽的目標(biāo)域分類,這種分類方式稱為跨場景分類。此外,在源場景中高光譜圖像常因噪聲影響而降低分類準(zhǔn)確性。特別是當(dāng)標(biāo)簽數(shù)據(jù)本身存在噪聲時(shí),分類模型的性能會進(jìn)一步受損。這種噪聲標(biāo)簽源于傳感器誤差、數(shù)據(jù)傳輸問題或人為標(biāo)注錯誤,因此,如何在噪聲標(biāo)簽的情況下實(shí)現(xiàn)高效、準(zhǔn)確的高光譜圖像農(nóng)作物分類成為一個提升模型性能的關(guān)鍵問題。
3、因此,本發(fā)明提出了一種基于xgboost和域自適應(yīng)的高光譜圖像農(nóng)作物跨場景分類方法,該方法采用集成學(xué)習(xí)思想,集成多個單分類器的分類結(jié)果,結(jié)合置信學(xué)習(xí)評估機(jī)制,去除高光譜圖像中的噪聲標(biāo)簽,以更好地適應(yīng)不同領(lǐng)域的特征分布。此外,通過域自適應(yīng)學(xué)習(xí)策略,能有效利用源域和目標(biāo)域的有限標(biāo)記樣本,提高分類模型的泛化能力,從而提升分類的準(zhǔn)確性和穩(wěn)定性。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明結(jié)合了xgboost和置信域自適應(yīng)學(xué)習(xí)策略,在houston數(shù)據(jù)集上表現(xiàn)出顯著優(yōu)于傳統(tǒng)方法和主流域自適應(yīng)學(xué)習(xí)模型的分類準(zhǔn)確性和魯棒性,尤其在經(jīng)濟(jì)農(nóng)作物中的grass?healthy和grass?stressed類別上取得了顯著提升。這一創(chuàng)新性方法驗(yàn)證了其在高光譜圖像農(nóng)作物分類中的有效性,提升了分類模型的準(zhǔn)確性與魯棒性,對于提高高光譜圖像農(nóng)作物分類的性能和實(shí)際應(yīng)用中的可靠性具有重要的科學(xué)與實(shí)用價(jià)值。
2、本發(fā)明的目的是這樣實(shí)現(xiàn)的:
3、一種基于xgboost和域自適應(yīng)的高光譜圖像農(nóng)作物跨場景分類方法,包括以下步驟:
4、步驟a、輸入待分類的高光譜圖像(hyperspectral?image,hsi)數(shù)據(jù),分別作為源場景和目標(biāo)場景,其中標(biāo)簽豐富的場景為源場景,缺少標(biāo)簽的場景為目標(biāo)場景,隨機(jī)選取訓(xùn)練樣本,構(gòu)建訓(xùn)練集和測試集;
5、步驟b、將源場景和目標(biāo)場景的數(shù)據(jù)分別輸入到深度嵌入模型中,通過將高光譜數(shù)據(jù)嵌入低維空間,以捕捉數(shù)據(jù)的內(nèi)在結(jié)構(gòu)和分布;
6、步驟c、為了提高不同數(shù)據(jù)的可區(qū)分性,在深度嵌入模型中使相似的光譜數(shù)據(jù)的表示更加接近;
7、步驟d、設(shè)計(jì)判別器模型,引入域自適應(yīng)技術(shù),減少不同場景特征分布的差異;
8、步驟e、為了增強(qiáng)不同場景數(shù)據(jù)特征分布的對齊,利用置信學(xué)習(xí)去除不同場景數(shù)據(jù)中的噪聲樣本;
9、步驟f、構(gòu)建集成學(xué)習(xí)框架,整合多個基分類器模型,采用投票組合策略,將多個基分類器集成為一個強(qiáng)分類模型,以有效捕獲數(shù)據(jù)中的復(fù)雜特征,減少單個分類器的偏差,提升整體模型的泛化能力和魯棒性,完成hsi分類訓(xùn)練,得到最終的分類結(jié)果。
10、上述的一種基于xgboost和域自適應(yīng)的高光譜圖像農(nóng)作物跨場景分類,其特征在于,步驟b具體包括以下步驟:
11、步驟b1、分別對源場景和目標(biāo)場景數(shù)據(jù)的訓(xùn)練樣本進(jìn)行patch提取,窗口大小為5×5×nband。
12、步驟b2、構(gòu)建深度嵌入模型,包含了2d卷積層、批量歸一化(batchnormalization,bn)、relu激活函數(shù)、平均池化(avgpool)和全連接層(full?connect,fc)。
13、步驟b3、為了更高效地訓(xùn)練有限樣本,卷積核的大小設(shè)定為1×1,其中padding為0,stride為1,avgpool的大小為5×5,fc的大小為1×128,逐步提取更精細(xì)的特征。
14、上述的一種基于xgboost和域自適應(yīng)的高光譜圖像農(nóng)作物跨場景分類方法,其特征在于,所述步驟c中,為了提高不同數(shù)據(jù)的可區(qū)分性,在深度嵌入模型生成的嵌入空間中,分別設(shè)置兩個模型輸出相同大小的嵌入空間,減少源嵌入空間和目標(biāo)嵌入空間分布的差異性。
15、上述的一種基于xgboost和域自適應(yīng)的高光譜圖像農(nóng)作物跨場景分類方法,其特征在于,所述步驟d中,設(shè)計(jì)判別器模型,包括了全連接層、批歸一化層、relu激活函數(shù),并聯(lián)合域自適應(yīng)技術(shù)減少不同場景特征分布的差異。
16、上述的一種基于xgboost和域自適應(yīng)的高光譜圖像農(nóng)作物跨場景分類方法,其特征在于,所述步驟e中,為了增強(qiáng)不同場景數(shù)據(jù)特征分布的對齊,通過置信學(xué)習(xí)評估機(jī)制估計(jì)噪聲并對實(shí)例進(jìn)行排序,以確保使用高置信度的數(shù)據(jù)進(jìn)行訓(xùn)練,提高目標(biāo)場景的分類精度。
17、上述的一種基于xgboost和域自適應(yīng)的高光譜圖像農(nóng)作物跨場景分類,其特征在于,步驟f具體包括以下步驟:
18、步驟f1、設(shè)計(jì)一個新的目標(biāo)函數(shù),通過優(yōu)化目標(biāo)函數(shù)減小預(yù)測誤差,公式為:
19、
20、式中:n為樣本數(shù),yi為第i個樣本的標(biāo)簽,是第i個樣本的預(yù)測值,代表損失函數(shù),k表示樹的個數(shù),fk表示第k棵樹,ω用來衡量模型的復(fù)雜度。
21、步驟f2、將多個基分類器集成為一個強(qiáng)分類模型,通過逐步構(gòu)建一系列的決策樹,每一棵新樹對之前所有樹的殘差進(jìn)行擬合,以不斷減少預(yù)測誤差。
22、有益效果:
23、本發(fā)明提出基于xgboost和域自適應(yīng)的高光譜圖像農(nóng)作物跨場景分類方法涉及遙感圖像農(nóng)作物分類領(lǐng)域。首先,本發(fā)明將不同場景的houston數(shù)據(jù)集輸入到深度嵌入模型中,通過將高光譜數(shù)據(jù)嵌入低維空間,捕捉其內(nèi)在結(jié)構(gòu)和分布,從而使得相似的光譜在低維空間中的表示更加接近。隨后,本發(fā)明引入置信域自適應(yīng)技術(shù),通過判別器模型減少不同場景特征分布的差異,去除數(shù)據(jù)中的噪聲樣本,加強(qiáng)不同場景數(shù)據(jù)特征分布的對齊。最后,通過集成學(xué)習(xí)框架,采用投票組合策略,將多個基分類器集成為一個強(qiáng)分類模型,有效捕獲數(shù)據(jù)中的復(fù)雜特征,減少單個分類器的偏差,提升整體的泛化能力和魯棒性,最后獲取農(nóng)作物類別。