本發(fā)明涉及礦區(qū)土地利用,尤其涉及一種基于擬態(tài)自學習的礦區(qū)用地智能識別方法及系統(tǒng)。
背景技術(shù):
1、礦產(chǎn)資源的開發(fā)和利用在帶動國民經(jīng)濟發(fā)展的同時,不可避免也造成了一系列嚴重的生態(tài)環(huán)境問題,特別是在露天礦開采過程中,礦區(qū)以及周邊土地資源易受到開采造成的土地壓占、挖損等破壞的直接影響和生態(tài)環(huán)境惡化導(dǎo)致的土地退化的間接影響。因此,實現(xiàn)礦區(qū)用地高效、精準識別是目前亟待解決的問題,對于掌握礦山開采活動、預(yù)防環(huán)境與地質(zhì)風險、實現(xiàn)礦區(qū)可持續(xù)綠色發(fā)展至關(guān)重要。
2、隨著遙感技術(shù)的快速發(fā)展,遙感影像的空間分辨率越來越高,高分辨率遙感影像能夠提供更加清晰的礦區(qū)用地細節(jié)以及紋理特征,在礦區(qū)用地特征信息提取和識別等方面應(yīng)用越來越廣泛。傳統(tǒng)的目視解譯方法雖然對于用地識別的準確率高,但需要耗費大量的人力物力,工作效率低。近年來,結(jié)合深度學習和遙感技術(shù)的礦區(qū)用地識別方法研究取得了一定的進展,高分辨率影像經(jīng)過預(yù)處理后人工制作樣本數(shù)據(jù)集的原始圖像和標簽圖像,從而訓練搭建的深度學習網(wǎng)絡(luò),對特征信息進行提取,實現(xiàn)礦區(qū)用地的識別。但當前基于深度學習方法開展礦區(qū)用地識別的方法,仍然存在以下問題亟需解決:
3、(1)對于深度學習網(wǎng)絡(luò)的訓練需要用到標簽圖像,而標簽圖像的制作通常需要耗費大量時間和人力資源,同時由于礦區(qū)環(huán)境復(fù)雜,常存在標注困難的問題。
4、(2)現(xiàn)有的方法未考慮到影像中包含的多尺度信息,無法對不同尺度下特征信息進行分層提取,同時還存在的同類地物特征的多樣性和不同類地物間信息特征的相似性問題,導(dǎo)致用地識別精度較差。
5、(3)傳統(tǒng)的深度學習網(wǎng)絡(luò)結(jié)構(gòu)無法有效地整合由高分辨率影像提取得到的多尺度特征信息,模型魯棒性較差。
技術(shù)實現(xiàn)思路
1、有鑒于此,本發(fā)明提出了一種基于擬態(tài)自學習的礦區(qū)用地智能識別方法及系統(tǒng),能夠?qū)ΦV區(qū)用地特征信息進行分層提取并整理融合,利用少量的標簽數(shù)據(jù)訓練構(gòu)建的礦區(qū)用地智能識別網(wǎng)絡(luò),實現(xiàn)礦區(qū)用地的智能精準識別,有利于礦區(qū)土地資源的監(jiān)測和保護。
2、具體的,本發(fā)明的目的通過下述技術(shù)方案實現(xiàn):
3、本發(fā)明的第一方面提供一種基于擬態(tài)自學習的礦區(qū)用地智能識別方法,其方法包括:
4、獲取礦區(qū)遙感影像并預(yù)處理,標注礦區(qū)用地并柵格化裁剪為影像塊,作為有標簽樣本,有標簽樣本包括訓練集、驗證集和測試集;
5、構(gòu)建密集型特征融合分割網(wǎng)絡(luò),對有標簽樣本進行特征提取得到礦區(qū)用地特征圖;
6、構(gòu)建基于擬態(tài)自學習的智能識別網(wǎng)絡(luò)模型,向智能識別網(wǎng)絡(luò)模型輸入土地利用有標簽樣本和無標簽樣本進行模型訓練,得到訓練后的智能識別網(wǎng)絡(luò)模型;
7、向訓練后的智能識別網(wǎng)絡(luò)模型輸入待識別礦區(qū)影像得到礦區(qū)用地的識別結(jié)果。
8、需要說明的是,無標簽樣本和有標簽樣本為裁剪得到分辨率相同像素大小的影像塊。
9、根據(jù)本發(fā)明的一個實施例,構(gòu)建密集型特征融合分割網(wǎng)絡(luò)的方法包括:
10、基于u-net架構(gòu)設(shè)計denseunet,整合densenet的密集連接特性,構(gòu)建初步網(wǎng)絡(luò)模型;
11、在初步網(wǎng)絡(luò)模型的編碼和解碼階段加入dense?blocks,使用多層卷積和直接連接技術(shù)提取有標簽樣本深層和表層特征;
12、在解碼階段,將深層特征圖上采樣并與相應(yīng)編碼階段的特征圖融合,恢復(fù)空間信息并強化特征的整合;
13、采用跳躍連接策略在網(wǎng)絡(luò)中不同層級間直接傳遞特征;
14、使用有標簽樣本進行網(wǎng)絡(luò)訓練,應(yīng)用交叉熵損失函數(shù)優(yōu)化分類精度;
15、利用驗證集對模型進行評估,調(diào)整網(wǎng)絡(luò)參數(shù),通過性能指標評價模型效果,得到密集型特征融合分割網(wǎng)絡(luò)。
16、根據(jù)本發(fā)明的一個實施例,構(gòu)建基于擬態(tài)自學習的智能識別網(wǎng)絡(luò)模型的方法包括:
17、基于pscrecnet網(wǎng)絡(luò)模型構(gòu)建學生模型和教師模型框架;
18、對無標簽樣本進行數(shù)據(jù)增強并生成偽標簽;
19、對學生模型與教師模型進行多次迭代的交互訓練和模型驗證,得到最終的智能識別網(wǎng)絡(luò)模型。
20、根據(jù)本發(fā)明的一個實施例,對無標簽樣本進行數(shù)據(jù)增強并生成偽標簽的方法包括:
21、通過弱增強對無標簽樣本進行數(shù)據(jù)增強得到弱增強樣本;
22、通過教師模型使用弱增強樣本生成可靠的偽標簽;
23、通過強增強對無標簽樣本進行數(shù)據(jù)增強得到強增強樣本;
24、通過學生模型使用強增強樣本生成不可靠的偽標簽。
25、根據(jù)本發(fā)明的一個實施例,對學生模型與教師模型進行多次迭代的交互訓練的方法包括:
26、學生模型使用有標簽樣本和可靠的偽標簽進行訓練;
27、在每個訓練周期結(jié)束后,通過對學生模型參數(shù)進行指數(shù)移動平均,更新教師模型的參數(shù);
28、多次迭代更新生成新的可靠的偽標簽和不可靠的偽標簽。
29、根據(jù)本發(fā)明的一個實施例,對學生模型與教師模型進行模型驗證的方法包括:
30、定期使用驗證集對智能識別網(wǎng)絡(luò)模型進行檢驗,采用指標性能評估智能識別網(wǎng)絡(luò)模型的表現(xiàn);
31、根據(jù)反饋結(jié)果調(diào)整訓練策略和模型架構(gòu);
32、訓練完成后,使用獨立的測試集計算學生模型的最終精度,其計算方法為:
33、l=ls+λlu;
34、其中,l是模型總體的損失函數(shù),體現(xiàn)礦區(qū)用地識別模型的性能;ls是有標簽樣本識別的損失函數(shù),通過比較模型對有標簽樣本的預(yù)測和真實標簽之間的差異,來引導(dǎo)模型學習對有標簽數(shù)據(jù)的正確識別;lu是無標簽樣本識別的損失函數(shù),通過比較模型對無標簽樣本的預(yù)測和偽標簽之間的差異,來引導(dǎo)模型學習對無標簽數(shù)據(jù)的識別λ是用于調(diào)整無監(jiān)督分割損失在總體損失中的權(quán)重;
35、
36、其中,n是有標簽樣本的數(shù)量,nu是無監(jiān)督樣本的數(shù)量,h和w分別是分割掩碼的高度和寬度,c是類別數(shù)量,mijc是真實分割標簽的概率值,是對應(yīng)的模型預(yù)測值,是偽標簽的預(yù)測值,β是一致性損失的權(quán)重,是模型對同一樣本的第j行第k列的第c個類別的預(yù)測概率,consistency?loss是一致性損失,用來最小化模型在同一樣本的不同位置上的預(yù)測之間的差異。
37、根據(jù)本發(fā)明的一個實施例,標注礦區(qū)用地并柵格化裁剪為影像塊的方法包括:
38、識別并標注礦區(qū)遙感影像中不同用地類型的邊界,得到礦區(qū)用地的矢量數(shù)據(jù);
39、對標注得到矢量數(shù)據(jù)進行柵格化得到標簽柵格數(shù)據(jù);
40、將原始遙感影像數(shù)據(jù)和標簽柵格數(shù)據(jù)進行裁剪得到分辨率相同像素大小影像塊。
41、根據(jù)本發(fā)明的一個實施例,用地類型包括露天采場、排土場、煤堆、礦山建筑、喬木、灌木、高/中/低覆蓋度草地、草灌喬混交、水體、道路和裸地。
42、根據(jù)本發(fā)明的一個實施例,訓練集、驗證集和測試集的比例為6:4:1。
43、本發(fā)明的第二方面提供一種基于擬態(tài)自學習的礦區(qū)用地智能識別系統(tǒng),包括:
44、樣本獲取模塊:獲取礦區(qū)遙感影像并預(yù)處理,標注礦區(qū)用地并柵格化裁剪為影像塊,作為有標簽樣本,有標簽樣本包括訓練集、驗證集和測試集;
45、特征提取模塊:構(gòu)建密集型特征融合分割網(wǎng)絡(luò),對有標簽樣本進行特征提取得到礦區(qū)用地特征圖;
46、模型構(gòu)建及訓練模塊:構(gòu)建基于擬態(tài)自學習的智能識別網(wǎng)絡(luò)模型,向智能識別網(wǎng)絡(luò)模型輸入土地利用有標簽樣本和無標簽樣本進行模型訓練,得到訓練后的智能識別網(wǎng)絡(luò)模型;
47、礦區(qū)用地識別模塊:向訓練后的智能識別網(wǎng)絡(luò)模型輸入待識別礦區(qū)影像得到礦區(qū)用地的識別結(jié)果。
48、本發(fā)明較現(xiàn)有技術(shù)相比,具有以下優(yōu)點及有益效果:
49、(1)本發(fā)明設(shè)計了多層級差異化密集特征提取模塊。礦區(qū)包含各種不同用地類型,如采場、排土場、植被、水體等,這些用地類型在不同的層級上的特征具有差異,傳統(tǒng)方法難以提?。焕枚鄬蛹壊町惢芗卣魈崛∧K處理不同層級特征信息,能夠更精準地提取多層次的特征,從而增強對復(fù)雜數(shù)據(jù)的表示能力,有助于提高模型對于不同層次抽象特征的理解和表達,使得模型更具有適應(yīng)性和泛化能力。
50、(2)本發(fā)明構(gòu)造了密集u型特征融合分割網(wǎng)絡(luò)。不同用地類型在礦區(qū)大小尺度不同,而全局和局部信息的綜合對于礦區(qū)用地分類是至關(guān)重要的,傳統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)無法有效地整合這些信息,而密集u型特征融合分割網(wǎng)絡(luò)能夠同時關(guān)注不同尺度的特征,有效地整合全局和局部信息,有助于提高模型對于輸入數(shù)據(jù)的全面理解,增強了對不同尺度信息的綜合把握,使得模型能夠更好地適應(yīng)各種復(fù)雜場景和變化,提高模型的魯棒性。
51、(3)本發(fā)明搭建了基于擬態(tài)自學習的礦區(qū)用地智能識別框架。獲取礦區(qū)用地的標簽數(shù)據(jù)通常需要大量時間和人力資源,同時存在標注困難和學習效率低的問題,該礦區(qū)用地智能識別框架通過教師網(wǎng)絡(luò)指導(dǎo)學生網(wǎng)絡(luò)使學生網(wǎng)絡(luò)更迅速地收斂,有效提高了模型學習效率,使得模型能夠更快地適應(yīng)新的任務(wù);并且通過有效整合帶標簽和無標簽數(shù)據(jù),該框架有效減輕了人工標注所需的時間和資源,使得模型在實際應(yīng)用中更具可行性,特別是在大規(guī)模數(shù)據(jù)集的場景下為提高工作效率和降低成本提供了明顯的優(yōu)勢。