基于波段不相似性的高光譜數(shù)據(jù)波段表征選擇方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于遙感圖像處理技術(shù)領(lǐng)域,更進(jìn)一步涉及遙感圖像數(shù)據(jù)特征選擇方法, 具體是一種基于波段不相似性的高光譜數(shù)據(jù)波段表征選擇方法,用于遙感影像數(shù)據(jù)的維數(shù) 約簡與分類。
【背景技術(shù)】
[0002] 高光譜遙感技術(shù)現(xiàn)已經(jīng)成功應(yīng)用于環(huán)境監(jiān)測,資源勘查,精細(xì)農(nóng)業(yè),國防安全等 領(lǐng)域,是現(xiàn)代高科技技術(shù)之一,但是,高光譜遙感影像的智能化處理水平的發(fā)展則相對滯后 于影像成像設(shè)備等硬件方面的發(fā)展,這使得高光譜遙感技術(shù)進(jìn)一步的推廣應(yīng)用受到制約。 地物分類是對高光譜遙感影像豐富的感知信息進(jìn)行解譯的重要途徑,因此,對高光譜遙感 數(shù)據(jù)工程化應(yīng)用有著十分重要的價(jià)值和意義。
[0003] 高光譜遙感影像包含豐富的地物空間、輻射和光譜信息,具有較高的光譜分辨率。 較高的光譜分辨率在帶來豐富地物信息的同時(shí),使得相鄰波段之間的冗余性增加,因此,在 對高光譜遙感數(shù)據(jù)進(jìn)行利用之前,需要對數(shù)據(jù)進(jìn)行預(yù)處理,減少冗余信息,不僅可以降低數(shù) 據(jù)的維數(shù),為后續(xù)的分類處理減少計(jì)算量,并且可以獲取更加魯棒、精準(zhǔn)的分類結(jié)果。
[0004] 現(xiàn)有的經(jīng)典的維數(shù)約簡方法主要分為兩類:特征提取和特征選擇。特征提取是通 過線性或非線性變換,把特征變換到新的特征空間,使其更具有判別性和表征性。而特征選 擇則是從原來的特征中,選擇部分具有較高判別性的特征子集,來構(gòu)成新的特征空間。特征 提取得到的新的特征,丟失了原來特征的物理意義,在一些實(shí)際的應(yīng)用中,難以解譯,而特 征選擇,可以保持原有特征的物理意義,在實(shí)際的工程實(shí)踐中具有重要的使用價(jià)值和意義。
[0005] 現(xiàn)有的經(jīng)典特征選擇方法主要分為兩類:
[0006] ( -)基于聚類的特征選擇,如K中心(K-medios),通過選擇聚類中心作為新的特 征,該方法對距離度量比較敏感,且選擇的特征不具有較好的判別性能。
[0007] (二)基于互信息理論的特征選擇方法,如WaLuMI (Martinez_Us0A. et. al. ''Clustering-based hyperspectral band selection using information measures".IEEE Transactions on Geoscience and Remote Sensing. Vol. 45 (12), Part 2pp. 4158-4171. December 2007),通過最大化特征之間的信息度量,來選擇冗余度較小的 特征來構(gòu)成新的特征子集。這種方法需要特定的信息度量準(zhǔn)則,且計(jì)算復(fù)雜較高。
[0008] 上述的特征選擇方法,均忽略了高光譜數(shù)據(jù)像元之間的結(jié)構(gòu)性,且計(jì)算復(fù)雜度高, 使得高光譜影像數(shù)據(jù)的結(jié)構(gòu)信息不能有效地利用,進(jìn)而導(dǎo)致后續(xù)分類精度和分類結(jié)果的魯 棒性較差。
【發(fā)明內(nèi)容】
[0009] 本發(fā)明的目的在于針對上述已有技術(shù)的不足,提出一種保持高光譜像元結(jié)構(gòu)一致 性的基于波段不相似性的高光譜數(shù)據(jù)波段表征選擇方法,通過稀疏約束下的跡最小求解, 實(shí)現(xiàn)對高光譜遙感數(shù)據(jù)的波段選擇。
[0010] 實(shí)現(xiàn)本發(fā)明目的技術(shù)方案是:將輸入的高光譜圖像預(yù)處理為可操作的高光譜數(shù) 據(jù),通過構(gòu)造高光譜波段之間成對不相似性矩陣、概率表征矩陣和高光譜像元間的相似度 矩陣,進(jìn)而通過最小化稀疏約束下矩陣的跡求得概率選擇矩陣,實(shí)現(xiàn)高光譜數(shù)據(jù)的波段選 擇。具體步驟包括如下:
[0011] 1.輸入高光譜圖像,將輸入的高光譜圖像預(yù)處理為可操作的高光譜數(shù)據(jù)X ;
[0012] 2.通過歐幾里德距離構(gòu)建高光譜數(shù)據(jù)波段之間的成對不相似矩陣D ;
[0014] 其中,D表示波段間成對不相似矩陣,其元素牝表示第i個高光譜數(shù)據(jù)波段和第j 個高光譜數(shù)據(jù)波段之間的不相似性,其值為第i個高光譜數(shù)據(jù)波段和第j個高光譜數(shù)據(jù)波 段的歐幾里德距離,L表示高光譜數(shù)據(jù)的波段個數(shù),R表示實(shí)數(shù)空間;
[0015] 3.初始化概率表征矩陣Z,用來表示高光譜數(shù)據(jù)波段之間相互表征的概率,初始 化后的概率表征矩陣,其概率約束需滿足兩個條件,約束條件之一為矩陣中每一列的和為 1,約束條件之二為矩陣中每一個元素介于0~1之間;;
[0016] 4.通過高斯核函數(shù)構(gòu)建高光譜像元之間的相似度矩陣G,用來表示輸入高光譜像 元之間的相似性;
[0018] 其中,G表示高光譜數(shù)據(jù)像元之間的相似度矩陣,其元素 glj表示第i個高光譜數(shù) 據(jù)像元第j個高光譜數(shù)據(jù)像元之間的相似度,N表示高光譜數(shù)據(jù)中像元的個數(shù),R表示實(shí)數(shù) 空間;
[0019] 5.根據(jù)高光譜數(shù)據(jù)波段之間的成對不相似矩陣D和初始化概率表征矩陣Z,計(jì)算 高光譜數(shù)據(jù)波段表征的代價(jià):
[0020] Ci= Tr(D TZ)
[0021] 其中,Q表示高光譜數(shù)據(jù)波段表征代價(jià),Tr( ·)表示矩陣的跡,Τ表示矩陣的轉(zhuǎn)置;
[0022] 6.根據(jù)高光譜數(shù)據(jù)像元之間的相似度矩陣G,構(gòu)建高光譜數(shù)據(jù)像元的圖保持正則 項(xiàng),用來保持高光譜數(shù)據(jù)的結(jié)構(gòu)一致性:
[0023] C2 = Tr ((ZX) T (G- Δ G) (ΖΧ))
[0024] 其中,C2表示高光譜數(shù)據(jù)像元的圖保持正則項(xiàng),X表示高光譜數(shù)據(jù),X e d 表示對角矩陣,其對角元素為對應(yīng)于相似度矩陣G的行和,BP
[0025] 7.根據(jù)高光譜數(shù)據(jù)波段表征的代價(jià)Q和高光譜數(shù)據(jù)像元的圖保持正則項(xiàng)C2,構(gòu)建 目標(biāo)函數(shù)J(Z):
[0026] 8.根據(jù)表征學(xué)習(xí)和概率約束條件,構(gòu)造目標(biāo)函數(shù)J⑵的約束條件:
[0027] 9.通過交替方向多乘子方法優(yōu)化目標(biāo)函數(shù)J(Z),求解概率表征矩陣Z ;
[0028] 10.波段子集選擇:選擇與概率表征矩陣Z中非零行位置索引相對應(yīng)的波段組成 新的波段子集,該選擇的波段子集即為所輸入的高光譜數(shù)據(jù)的表征波段子集。
[0029] 與現(xiàn)有技術(shù)相比,本發(fā)明有以下優(yōu)點(diǎn):
[0030] ( -)本發(fā)明借助于表征學(xué)習(xí),將高光譜數(shù)據(jù)波段選擇看作是行稀疏約束下的跡 最小化問題,通過跡最小化問題的求解,實(shí)現(xiàn)了具有較高表征性波段子集的選擇,進(jìn)而提高 了分類的準(zhǔn)確性;
[0031] (二)本發(fā)明在構(gòu)建高光譜數(shù)據(jù)像元的圖保持正則項(xiàng)的過程中,考慮了高光譜數(shù) 據(jù)像元之間的結(jié)構(gòu)性,使得高光譜數(shù)據(jù)的結(jié)構(gòu)信息加以有效利用,保證了波段選擇前后高 光譜數(shù)據(jù)結(jié)構(gòu)的一致性,提高了分類精度的魯棒性。
【附圖說明】
[0032] 圖1是本發(fā)明的流程圖;
[0033] 圖2是10 %標(biāo)記樣本下,采用本發(fā)明方法對KSC高光譜數(shù)據(jù)進(jìn)行波段選擇后,用最 近鄰(NN)分類器的分類結(jié)果與現(xiàn)有的三種波段選擇的分類結(jié)果的對比圖;
[0034] 圖3是10%標(biāo)記樣本下,采用本發(fā)明方法對Pavia University高光譜數(shù)據(jù)進(jìn)行波 段選擇后,用最近鄰(NN)分類器的分類結(jié)果與現(xiàn)有的三種波段選擇的分類結(jié)果的對比圖。
【具體實(shí)施方式】
[0035] 下面結(jié)合附圖對本發(fā)明詳細(xì)說明
[0036] 高光譜遙感影像較高的光譜分辨率在帶來豐富地物信息的同時(shí),使得相鄰波段之 間具有較高的冗余性,在實(shí)際的工程應(yīng)用中,其冗余性帶來較大數(shù)據(jù)量的同時(shí),也導(dǎo)致用于 地物分類精度的下降。鑒于高光譜遙感豐富的感知信息,對高光譜數(shù)據(jù)進(jìn)行特征選擇,降低 冗余性,是進(jìn)行高光譜數(shù)據(jù)應(yīng)用的首要步驟。本發(fā)明正是在這個問題上進(jìn)行的探索和研究。 [0037] 實(shí)施例1
[0038] 本發(fā)明是一種基于波段不相似性的高光譜數(shù)據(jù)波段表征選擇方法,參照圖1,本發(fā) 明的選擇過程包括有:
[0039] 步驟1 :輸入高光譜圖像,將輸入的高光譜圖像預(yù)處理為可操作的高光譜數(shù)據(jù)X, X e #XN,其中L表示高光譜數(shù)據(jù)的波段個數(shù),N表示高光譜數(shù)據(jù)中像元個數(shù),R表示實(shí)數(shù)空 間。輸入的高光譜圖像來自于ROSIS,92AV3C,AVIRIS等傳感設(shè)備,本例中采用的KSC高光 譜圖像來源于AVIRIS傳感設(shè)備,該圖像場景是1996年3月獲得的肯尼迪航天中心測試地, 經(jīng)預(yù)處理后的高光譜數(shù)據(jù),包含13類地物信息,其中波段個數(shù)L= 176,像元