行列式點(diǎn)過程的波段選擇方法
【專利摘要】本發(fā)明提供了一種行列式點(diǎn)過程的波段選擇方法,包括以下步驟:1]對原始高光譜數(shù)據(jù)的波段進(jìn)行劃分,生成不同候選波段子集;2]對候選波段子集進(jìn)行評價(jià),選取符合行列式點(diǎn)過程的候選波段子集;3]根據(jù)初等行列式點(diǎn)過程的性質(zhì),計(jì)算出符合行列式點(diǎn)過程的候選波段子集出現(xiàn)的概率,概率越大說明其出現(xiàn)的可能性越高,即最佳的候選波段子集。該方法解決了原始高光譜數(shù)據(jù)中存在的高度冗余,提高數(shù)據(jù)表達(dá)性難題,克服現(xiàn)有方法判別性差的問題。
【專利說明】
行列式點(diǎn)過程的波段選擇方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,特別涉及一種高光譜波段選擇,具體涉及行列式 點(diǎn)過程的波段選擇方法。
【背景技術(shù)】
[0002] 隨著遙感技術(shù)和成像光譜儀的發(fā)展,高光譜遙感圖像的應(yīng)用越來越廣泛,但其具 有波段數(shù)多、數(shù)據(jù)量龐大等特點(diǎn)給高光譜圖像的分類、識別等帶來了很大的困難。例如,信 息冗余度高、數(shù)據(jù)存儲所需空間大、處理時(shí)間長,且由于高光譜圖像的波段數(shù)多,容易出現(xiàn) 維數(shù)災(zāi)難現(xiàn)象,即分類精度下降。因此,在保證地物分類識別率的情況下,減少數(shù)據(jù)量、節(jié)省 資源的降維處理是非常有必要的。波段選擇是從高光譜圖像所有波段中選擇起主要作用的 波段子集,不僅能大大降低高光譜圖像的數(shù)據(jù)維數(shù),而且能比較完整地保留有用的信息,更 具特殊意義。高光譜圖像的波段選擇是一種很復(fù)雜的波段組合優(yōu)化問題,它要求所選的波 段組合有較好的性能,即選擇出信息量較大、相關(guān)性較小、類別可分性較好的波段組合。
[0003] 高光譜圖像波段選擇的發(fā)展可以看作是搜索最優(yōu)波段子集問題的發(fā)展,即依據(jù) 一定的搜索方法在高光譜圖像所有波段中尋找使準(zhǔn)則函數(shù)最優(yōu)的波段子集。波段選擇方法 根據(jù)搜索方法可分為最優(yōu)搜索波段選擇法和次優(yōu)搜索波段選擇法。
[0004] 最優(yōu)搜索波段選擇法是在圖像所有的波段特征中尋找一組在某種意義下最優(yōu) 的波段子集,使得這一波段子集在降低高光譜圖像維數(shù)且同等條件下最大限度地保留 地物目標(biāo)信息。Hongjun Su 等人在文獻(xiàn)"Hongjun Su,Qian Du,Genshe Chen,Peijun Du,and M. Cristani. Optimized Hyperspectral Band Selection UsingParticle Swarm Optimization. IEEE Journal of Selected Topics in Applied Earth Observations andRemote Sensing, pages 1659 - 2670, 2014"中提出基于粒子群的波段選擇方法。該方法 存在的不足之處是,其計(jì)算量相當(dāng)大。由于高光譜圖像波段數(shù)較多,波段組合數(shù)更多,因此 尋找最優(yōu)波段子集相當(dāng)困難。
[0005] 由于最優(yōu)搜索算法的復(fù)雜性,所以高光譜圖像波段選擇通常采用次優(yōu)搜索算法。 其是依據(jù)某一評價(jià)準(zhǔn)則函數(shù)采用特定搜索策略選擇一組性能比較好的波段子集,但不一定 是最優(yōu)波段子集。于最優(yōu)搜索算法的復(fù)雜性,所以高光譜圖像波段選擇通常采用次優(yōu)搜索 算法。其依據(jù)評價(jià)準(zhǔn)則函數(shù)采用特定搜索策略選擇一組性能比較好的波段子集,但不一定 是最優(yōu)波段子集。該方法存在的不足之處是,由于高光譜圖像波段數(shù)多、數(shù)據(jù)量大,以往的 次優(yōu)搜索算法要么得到的波段子集的性能仍然很低,要么計(jì)算量大、處理時(shí)間長,仍未達(dá)到 令人滿意的效果。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明為了解決上述的技術(shù)問題,提出一種行列式點(diǎn)過程的波段選擇方法,該方 法解決了原始高光譜數(shù)據(jù)中存在的高度冗余,提高數(shù)據(jù)表達(dá)性難題,克服現(xiàn)有方法判別性 差的問題。
[0007] 本發(fā)明的技術(shù)方案:
[0008] -種行列式點(diǎn)過程的波段選擇方法,其特征在于,包括以下步驟:
[0009] 1]對原始高光譜數(shù)據(jù)的波段進(jìn)行劃分,生成不同候選波段子集;
[0010] 2]對候選波段子集進(jìn)行評價(jià),選取符合行列式點(diǎn)過程的候選波段子集;
[0011] 3]根據(jù)初等行列式點(diǎn)過程的性質(zhì),計(jì)算出符合行列式點(diǎn)過程的候選波段子集出現(xiàn) 的概率,概率越大說明其出現(xiàn)的可能性越高,即最佳的候選波段子集。
[0012] 上述步驟1具體是:假設(shè)將原始高光譜數(shù)據(jù)的波段劃分為p個波段B = [By B2, ... Bp],從這p個波段中選出K個波段組成不同的候選波段子集;候選波段子集用一 個長度為N的二進(jìn)制表示,1表示選擇,0表示不選擇,則p波段子集中1的個數(shù)為K。
[0013] 上述步驟3具體是:設(shè)X為原始高光譜數(shù)據(jù),大小為p X q,其中p為波段數(shù)目,q為 每個波段像素總數(shù),A為候選波段子集的標(biāo)志向量,Y是A中非0的索引值,即選擇波段的索 弓丨,長度為選擇的波段子集個數(shù),如A = [0101],則Y= {2,4},表示從四個波段中選擇兩個 波段:第2和第4波段;則候選波段子集Α出現(xiàn)的概率:
[0014] P 〇〇 = det (LY)/det (L+I)
[0015] 其中P(Y)為候選波段子集A對應(yīng)索引值Y的概率。矩陣LY= [Lj^EpdetaY) 表示求矩陣"的行列式,矩陣I為大小p X p單位矩陣,L為波段之間的度量矩陣,可以簡單 表示為:L = XX',因此,Σ det (LY) = det (L+I)。
[0016] 重復(fù)步驟3,對波段選擇后的最佳的候選波段子集進(jìn)行地物分類,統(tǒng)計(jì)分類的正確 率,得出不同波段的準(zhǔn)確率:
[0017]
[0018] 其中,TP (true positive)表示被正確分類的正樣本數(shù)目,TN(true negative)是 正確分類的負(fù)樣本數(shù)目,P是所有正樣本的數(shù)目,N是所有負(fù)樣本的數(shù)目,acc表示正確匹配 正負(fù)樣本占所有樣本的概率,即準(zhǔn)確率。
[0019] 本發(fā)明的優(yōu)點(diǎn):
[0020] 該方法利用行列式點(diǎn)過程選出來具有差異性的波段子集,有效克服了原始數(shù)據(jù)計(jì) 算量大、處理時(shí)間長的問題;原始數(shù)據(jù)的有效信息被用來指導(dǎo)地物分類過程,進(jìn)而取得了更 好的結(jié)果;降低了高光譜圖像的數(shù)據(jù)維數(shù),而且能比較完整地保留有用的信息,可用于地理 國情勘察、軍事偵察和環(huán)境監(jiān)測等方面。
【附圖說明】
[0021] 圖1為本發(fā)明基于行列式點(diǎn)過程的波段選擇流程圖。
【具體實(shí)施方式】
[0022] 參照圖1,本發(fā)明實(shí)現(xiàn)的步驟如下:
[0023] 步驟1,生成不同候選波段子集。
[0024] (la)將原始高光譜數(shù)據(jù)中的圖像集劃分為不同波段子集。建立選擇波段的標(biāo)志向 量,被選擇的波段用1標(biāo)記,否則用〇。
[0025] (lb)隨機(jī)選擇K個波段做初試波段子集,其中標(biāo)志向量中1的個數(shù)為K ;
[0026] 步驟2,建立評價(jià)波段子集好壞的評價(jià)準(zhǔn)則。假設(shè)候選子集符合行列式點(diǎn)過程,則 該子集中波段具有很強(qiáng)的差異性。
[0027] 建立子集的行列式點(diǎn)過程概率。設(shè)X為原始的高光譜數(shù)據(jù),大小為p X q,其中p為 波段數(shù)目,q為每個波段像素總數(shù)。A為選擇波段子集的標(biāo)志向量,Y是A中非0的索引值, 即選擇波段的索引。如A = [0101],則Y= {2, 4}。則子集A被選擇的概率為:
[0028] P(Y) = det (LY)/det (L+I)
[0029] 其中LY= [L j EY,I為大小pXp單位矩陣。L為波段之間的度量矩陣,可以簡 單表示為:L = XX'。很明顯,Σ det (LY) = det (L+I)。
[0030] 步驟3,根據(jù)行列式點(diǎn)過程在不同的子集空間中搜索最佳的子集。
[0031] 根據(jù)行列式點(diǎn)過程的性質(zhì),符合行列式點(diǎn)過程的波段之間具有很強(qiáng)的差異性,同 時(shí)又能很好的表示原始波段。其步驟如下:
[0032] (3a)輸入度量矩陣L,得到特征向量vn和特征值λη。令J = φ,Υ = φ。
[0033] (3b)根據(jù)概率 Prn= λ η/ ( λ η+1),η = 1,· · ·,ρ 選擇波段,使得 J = J U {η},相 應(yīng)的選擇對應(yīng)特征向量V= |vn}nEJ。
[0034] (3c)根據(jù)概率ΡΓι = Σ v E v (vTei)從波段集合B中選擇波段&,對Y和V進(jìn)行更新:
[0035] Y = Y U {i},
[0036] V^Fle ,
[0037] 其中匕t.,是正交與ei的特征向量子集。
[0038] (3d)判斷| V | > 0,滿足輸出得到的子集Y,否則繼續(xù)(3b) (3c)。
[0039] 步驟4,計(jì)算準(zhǔn)確率(acc)。
[0040] 重復(fù)步驟(3),對波段選擇后的數(shù)據(jù)進(jìn)行地物分類,統(tǒng)計(jì)分類的正確率,得出波段 選擇后的準(zhǔn)確率。
[0041] 本發(fā)明的效果可以通過以下實(shí)驗(yàn)做進(jìn)一步的說明。
[0042] 1.仿真條件
[0043] 本發(fā)明是在中央處理器為 Intel (R)Core i3-21303. 4GHZ、內(nèi)存 16G、WIND0WS 8 操 作系統(tǒng)上,運(yùn)用MATLAB軟件進(jìn)行的仿真。
[0044] 2.仿真內(nèi)容
[0045] 首先,采用的高光譜數(shù)據(jù)為真實(shí)高光譜圖像。采集于1992年由美國國家航空航天 局(NASA)的機(jī)載可見/紅外成像光譜儀(AVIRIS)在美國印第安納州西北部印第安遙感 試驗(yàn)區(qū)獲取的。圖像的空間分辨率為20mX 20m,圖像大小為145 X 145,波長范圍為400~ 2500nm。原始的AVIRIS采集器中包含224個波段,但是其中4個波段僅包含0值,所以被 濾除掉了。在大多數(shù)情況下,已知的光譜圖像在一些光譜上會被大氣中的吸水波段影響,在 IndianPine中,這類波段包含了 20個,[104-108],[150-163] and 220波段被去掉后還剩下 200個波段。在整個的圖像數(shù)據(jù)中包含了 16類植被,但不是所有的像素點(diǎn)都屬于這16類, 其中有好多的不相關(guān)區(qū)域被劃分成了背景。
[0046] 在IndianPine數(shù)據(jù)集上,完成本發(fā)明算法(基于行列式點(diǎn)過程的波段選擇)的 實(shí)驗(yàn)。為了證明算法的有效性,綜合考慮算法的流行性、嶄新性,我們選取了 6個對比方 法 CEM-BCM/BDM, CEM-BCC/BDC, LCMV-BCM/BDM, LCMV-BCC/BDC, CBBS-MI 和 CBBS-KLD 進(jìn)行 比較。其中 CEM-BCM/BDM, CEM-BCC/BDC, LCMV-BCM/BDM 和 LCMV-BCC/BDC 是在文獻(xiàn) "C. -Ι· Chang and S. Wang. Constrained band selection for hyperspectral imagery. IEEE Transactions on Geoscience andRemote Sensing, 44 (6) : 1575 - 1585, 2006.',提出的。 CBBS-MI 和 CBBS-KLD 在 "A. M. Us ' 〇, F. Pla,J. M. Sotoca,and P. Garc ' ia-Sevilla. Clustering-based hyperspectral band selection using informationmeasures. IEEE Transactions on Geoscience and Remote Sensing, 45(12):4158 - 4171, 2007."中有詳細(xì) 介紹。
[0047] 利用地物分類的準(zhǔn)確率衡量波段選擇的效果。在IndianPine數(shù)據(jù)集中選取選擇 前50個樣本作訓(xùn)練,剩下的樣本做測試。
[0048] 其次,根據(jù)步驟3中的距離度量公式,計(jì)算測試集合與原型圖像集的距離,并計(jì)算 累計(jì)精度。
[0049] 重復(fù)上述步驟10次,計(jì)算求得平均準(zhǔn)確率精度,其結(jié)果如表1所示。
[0050] 選擇了常用的4種分類器:CART, KNN,Naive和SVM。從表1可見,本發(fā)明的分類準(zhǔn) 確率比現(xiàn)有波段選擇方法的準(zhǔn)確率要高。因此本方法比其他方法更有效,更魯棒。
[0051] 表1波段選擇對地物分類的影響
[0052]
[0053] 經(jīng)過多次實(shí)驗(yàn)數(shù)據(jù)可以得出,本發(fā)明能夠提供準(zhǔn)確的偽彩色圖像,具有明顯的地 物區(qū)分度和可視化效果,便于后期的目標(biāo)檢測和地物觀測。
【主權(quán)項(xiàng)】
1. 一種行列式點(diǎn)過程的波段選擇方法,其特征在于,包括W下步驟: 1] 對原始高光譜數(shù)據(jù)的波段進(jìn)行劃分,生成不同候選波段子集; 2] 對候選波段子集進(jìn)行評價(jià),選取符合行列式點(diǎn)過程的候選波段子集; 3] 根據(jù)初等行列式點(diǎn)過程的性質(zhì),計(jì)算出符合行列式點(diǎn)過程的候選波段子集出現(xiàn)的概 率,概率越大說明其出現(xiàn)的可能性越高,即最佳的候選波段子集。2. 根據(jù)權(quán)利要求1所述的行列式點(diǎn)過程的波段選擇方法,其特征在于,所述步驟1具體 是:假設(shè)將原始高光譜數(shù)據(jù)的波段劃分為P個波段B =怔1,B2,... Bp],從運(yùn)P個波段中選出 K個波段組成不同的候選波段子集;候選波段子集用一個長度為N的二進(jìn)制表示,1表示選 擇,O表示不選擇,則P波段子集中1的個數(shù)為K。3. 根據(jù)權(quán)利要求2所述的行列式點(diǎn)過程的波段選擇方法,其特征在于,所述步驟3具體 是:設(shè)X為原始高光譜數(shù)據(jù),大小為P X q,其中P為波段數(shù)目,q為每個波段像素總數(shù),A為 候選波段子集的標(biāo)志向量,Y是A中非O的索引值,即選擇波段的索引,長度為選擇的波段子 集個數(shù),如A = [0101],則Y = {2,4},表示從四個波段中選擇兩個波段:第2和第4波段; 則候選波段子集A出現(xiàn)的概率: P 燈)=det(Ly)/det(L+I) 其中P(Y)為候選波段子集A對應(yīng)索引值Y的概率,矩陣[Li,EY, det(LY)表示 求矩陣^的行列式,矩陣I為大小P X P單位矩陣;L為波段之間的度量矩陣,可W簡單表示 為:L = XX',因此,X det (Ly) = det 化+1)。4. 根據(jù)權(quán)利要求1或3所述的行列式點(diǎn)過程的波段選擇方法,其特征在于:對波段選 擇后的最佳的候選波段子集進(jìn)行地物分類,統(tǒng)計(jì)分類的正確率,得出不同波段的準(zhǔn)確率:其中,TP(t;rue positive)表示被正確分類的正樣本數(shù)目,TN(t;rue negative)是正確 分類的負(fù)樣本數(shù)目,P是所有正樣本的數(shù)目,N是所有負(fù)樣本的數(shù)目,acc表示正確匹配正負(fù) 樣本占所有樣本的概率,即準(zhǔn)確率。
【文檔編號】G06K9/62GK106033545SQ201510104333
【公開日】2016年10月19日
【申請日】2015年3月10日
【發(fā)明人】袁媛, 盧孝強(qiáng), 鄭向濤
【申請人】中國科學(xué)院西安光學(xué)精密機(jī)械研究所