本發(fā)明涉及圖像分類技術領域,特別是涉及一種高光譜遙感影像特征提取與分類方法。
背景技術:
近年來,遙感技術取得了巨大的進步。高光譜遙感圖像在描述地面真實信息方面的優(yōu)勢使其成為目標檢測和分類等重要工具。高光譜圖像分類是挖掘高光譜數(shù)據(jù)信息的常用技術。由于高光譜圖像中信息量巨大,在分類前需要進行降維處理。神經(jīng)網(wǎng)絡和支持向量機(svm)已被廣泛應用于高光譜分類,由于其在處理高維數(shù)據(jù)方面的潛力,它們可以用于實現(xiàn)大部分數(shù)據(jù)的分類,但若想獲得詳細信息上則很難取得更好的效果。這個問題使得這些算法在某些領域受到限制。
技術實現(xiàn)要素:
發(fā)明目的:本發(fā)明的目的是提供一種能夠解決現(xiàn)有技術中存在的缺陷的高光譜遙感影像特征提取與分類方法。
技術方案:本發(fā)明所述的高光譜遙感影像特征提取與分類方法,包括以下步驟:
s1:選取高光譜遙感圖像構建訓練集;
s2:進行數(shù)據(jù)預處理操作,以降低數(shù)據(jù)維度;
s3:構建基本深信度網(wǎng)絡模型;
s4:進行特征提取,將數(shù)據(jù)的光譜特征和空間信息分別提取出來;
s5:聯(lián)合光譜空間信息完成圖像的分類;
s6:進行分類結果精度評價。
進一步,所述步驟s2中,數(shù)據(jù)預處理操作采用主成分分析法進行。
進一步,所述步驟s3中,基本深信度網(wǎng)絡模型由限制玻爾茲曼機堆疊而成,采用貪婪非監(jiān)督分層學習的方式學習輸入數(shù)據(jù),并且在網(wǎng)絡中采用逐層初始化的方法更新權重,在網(wǎng)絡的最后一層采用softmax分類器以監(jiān)督方式實現(xiàn)網(wǎng)絡參數(shù)的調(diào)優(yōu)處理。
進一步,所述逐層初始化方法具體為在網(wǎng)絡的每一層用對比散度算法進行預訓練。
進一步,所述步驟s5具體為:將提取出的光譜特征和空間信息同時加入到深信度網(wǎng)絡模型中參與訓練,構建基于聯(lián)合光譜空間特征的深信度網(wǎng)絡模型,從而完成圖像的分類。
有益效果:本發(fā)明公開了一種高光譜遙感影像特征提取與分類方法,在采用深度網(wǎng)絡模型實現(xiàn)高光譜影像分類時,聯(lián)合光譜特征和空間信息進行分類,顯著提升圖像的分類精度,從而提高遙感目標檢測識別的效率。
附圖說明
圖1為本發(fā)明具體實施方式中dbn模型的流程圖;
圖2為本發(fā)明具體實施方式中rbm結構模型示意圖;
圖3為本發(fā)明具體實施方式中印度松樹數(shù)據(jù)集中16種地物光譜圖;
圖4為本發(fā)明具體實施方式中dbn模型結構圖;
圖5為本發(fā)明具體實施方式中聯(lián)合光譜空間分類(jssc)的實驗結果。
具體實施方式
本具體實施方式公開了一種高光譜遙感影像特征提取與分類方法,如圖1所示,具體操作步驟如下:
s1:選取典型類別的目標的高光譜遙感圖像構建訓練集。本實施例選取西北印第安納州的印度松樹測試區(qū)的高光譜數(shù)據(jù)集作為實驗對象,機載可見/紅外成像光譜儀(aviris)獲取。其尺寸為145×145,有224個波段。對原始圖像進行去噪,不進行吸水實驗,保留剩余200個波段。訓練、驗證和測試數(shù)據(jù)的比例為6:2:2。如圖3為選取16類別地物的光譜圖,表1是從印度松樹數(shù)據(jù)集中選取的16種類別地物的樣本分布情況。
表1選取的16種類別地物樣本分布情況
s2:進行數(shù)據(jù)預處理操作,以降低數(shù)據(jù)維度。采用主成分分析法處理整個數(shù)據(jù)集,原始數(shù)據(jù)為矩陣但也需要標準化。
s3:構建深信度網(wǎng)絡模型,如圖4為模型的結構示意圖。。深信度網(wǎng)絡是一種深度學習模型,該模型由多層限制玻爾茲曼機(rbm)堆疊而成,其訓練方法是:使用非監(jiān)督貪婪逐層方法去預訓練獲得權值。
限制玻爾茲曼機是一種生成式隨機神經(jīng)網(wǎng)絡,有兩層神經(jīng)元,一層叫做顯層,由可見單元(對應可見變量v)組成,用于輸入訓練數(shù)據(jù),另一層為隱層,由隱藏單元(對應隱藏變量h)組成,用作特征檢測器??梢娮兞亢碗[藏變量都是二元變量,即取值情況為{0,1}。整個網(wǎng)絡是一個二分圖(如圖2),只有可見單元和隱藏單元之間才存在邊,可見單元之間和隱藏單元之間沒有邊連接。對于一組給定的狀態(tài)(v,h),rbm的聯(lián)合配置能量函數(shù)為:
其中,θ=(wij,ai,bj)是rbm的參數(shù),wij是可見單元v和隱藏單元h之間的邊的權重,bi和aj分別為可見單元和隱藏單元的偏移量。根據(jù)v和h聯(lián)合配置的能量可得v和h的聯(lián)合概率分布為:
其中,
通常采用隨機梯度下降方法最大化l(θ),首先需要求得l(θ)對w的導數(shù):
可見變量和隱藏變量的條件概率分布如下:
在計算聯(lián)合概率期望時,由于計算歸一化因子z(θ)的時間復雜度將達到o(2m+n),計算量非常大,故使用對比散度算法(contrastivedivergence,cd),吉布斯采樣次數(shù)取1次,將抽樣所得的樣本集合看作是p(v,h)的近似,通過這種近似的方式重構數(shù)據(jù)。網(wǎng)絡權重的學習如下:
δwij=edata(vihj)-emodel(vihj)(7)
其中,被減數(shù)等于輸入數(shù)據(jù)能量函數(shù)的期望,減數(shù)等于模型能量函數(shù)的期望,該期望通過對比散度算法獲得。
dbn模型包括數(shù)據(jù)預處理、預訓練和網(wǎng)絡調(diào)優(yōu)三個重要環(huán)節(jié),如圖4所示。在預處理中,將輸入網(wǎng)絡中的三維數(shù)據(jù)轉(zhuǎn)換為二維向量。在預訓練中,逐層訓練每一個非監(jiān)督的rbm網(wǎng)絡,確保輸入向量能被映射到不同特征空間并且盡可能多的保存特征信息。每一層訓練好后才進行下一層的疊加,參數(shù)逐層傳播,后一層可視變量是前一層隱藏變量的雙倍,后一層的特征都是從前一層學習得到。在網(wǎng)絡的最后一層使用softmax分類器對網(wǎng)絡調(diào)優(yōu),并標記每個像素和分類結果。
s4:進行特征提取,將數(shù)據(jù)額光譜的特征和空間特征分別提取出來,為完成圖像的分類做準備。
s5:聯(lián)合光譜空間信息完成圖像的分類。將光譜特征和空間信息同時輸入深信度網(wǎng)絡模型中訓練,監(jiān)督學習率設為0.01,非監(jiān)督學習率設為0.001。為了更好的說明本發(fā)明中所提出方法的有效性,分別采用svm和深信度網(wǎng)絡模型進行分類實驗。用訓練樣本隨機進行100次實驗,獲得svm分類器和dbn分類器下的精度的平均值。
s6:進行分類結果精度評價。為了更好說明比較svm和聯(lián)合光譜空間分類(jssc)的分類性能,采用整體分類精度(overallaccuracy,oa)、平均分類精度(averageaccuracy,aa)、kappa一致性系數(shù)來評價兩種分類器的性能。表2為分別使用jssc(主成分數(shù)量n=3)和svm進行實驗所得分類結果,如圖5展示了jssc實驗所得分類結果。表3為分別jssc-dbn(主成分數(shù)量n=4)和svm作為分類器進行實驗的分類結果。根據(jù)實驗結果,顯然可知本發(fā)明所提出方法的有效性和實用性。
表2jssc和svm的分類精度比較
表3jssc-dbn和svm的分類精度比較