基于低秩表示的高光譜圖像波段選擇方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,涉及對(duì)高光譜圖像波段選擇,可應(yīng)用于高光譜數(shù) 據(jù)的維數(shù)約減,降低數(shù)據(jù)處理的計(jì)算復(fù)雜度。
【背景技術(shù)】
[0002] 高光譜遙感技術(shù)是上個(gè)世紀(jì)20年代發(fā)展起來的一種重要遙感技術(shù)。高光譜成像 儀可以在多波段、窄間距的條件下獲得幾乎連續(xù)的地物波譜圖像,使得高光譜圖像具有了 相比傳統(tǒng)的遙感圖像更高的空間分辨率和光譜分辨率,并在農(nóng)業(yè)、地質(zhì)、沿海和內(nèi)陸水域環(huán) 境、大氣研究、全球環(huán)境研究等領(lǐng)域得到了廣泛的應(yīng)用。但成百乃至上千的波段也帶來了數(shù) 據(jù)量大、"維數(shù)災(zāi)難"、信息冗余、存在噪聲波段的問題,給高光譜圖像的存儲(chǔ)、傳輸和處理帶 來了很多困難。因此,如何有效地降低高光譜圖像的維數(shù)成為高光譜圖像處理需要解決的 一個(gè)重要問題。
[0003] 傳統(tǒng)的降維方法有兩種,一種是特征提取,另一種是特征選擇。為了保留高光譜圖 像中特定波段的物理意義,一般采取特征選擇的方法。
[0004] 在機(jī)器學(xué)習(xí)中,特征選擇可以被定義為:給定一個(gè)特征集合,從中選擇出一個(gè)特征 子集,使得評(píng)價(jià)標(biāo)準(zhǔn)達(dá)到最優(yōu)。該定義可表述為:
[0005] 對(duì)于給定的特征集合X,其中包含η個(gè)特征,Xl,x2, ...,Xn,假設(shè)經(jīng)過特征選擇后得 到一個(gè)特征子集Xcipt,當(dāng)Xcipt使給定的評(píng)價(jià)準(zhǔn)則達(dá)到最大值時(shí),則X _為最終選擇的特征子 集。
[0006] 經(jīng)典的特征選擇的過程一般包含四個(gè)步驟:子集生成、子集評(píng)價(jià)、停止準(zhǔn)則、結(jié)果 驗(yàn)證。子集的生成是通過搜索實(shí)現(xiàn)的。通過給定的搜索算法得到特征子集,然后根據(jù)評(píng)價(jià) 準(zhǔn)則評(píng)價(jià)特征子集的好壞,更新現(xiàn)有的特征子集,并對(duì)其進(jìn)行評(píng)價(jià),直到滿足停止準(zhǔn)則,最 后輸出最優(yōu)的特征子集。
[0007] 特征選擇是機(jī)器學(xué)習(xí)領(lǐng)域的困難之一。通常情況下,尋找最優(yōu)的特征子集在實(shí)際 的應(yīng)用中是非常困難的,許多與特征選擇相關(guān)的問題均為NP-hard問題。搜索得到使評(píng)價(jià) 準(zhǔn)則最優(yōu)的最小特征子集被證明是一個(gè)NP-hard問題。通常情況下,通過采用如序列向前 搜索SFS、浮動(dòng)序列向前搜索SFFS的啟發(fā)式搜索算法可以在運(yùn)行效率和得到特征子集質(zhì)量 中間尋找一個(gè)折中點(diǎn),這也是SFS被眾多特征選擇算法所采用的原因。
[0008] 序列向前選擇算法SFS :首先初始化一個(gè)空的特征集合,然后每次在特征集合中 加入一個(gè)新的特征,確保每次新加入的特征是最優(yōu)的,依次加入特征直到滿足需要的特征 個(gè)數(shù)。該算法采用貪婪的策略,選擇使評(píng)價(jià)準(zhǔn)則最大的特征加入特征集合。盡管SFS的計(jì) 算量較小,但是由于沒有充分的考慮特征之間的統(tǒng)計(jì)相關(guān)性,使得每次迭代都是選擇使評(píng) 價(jià)準(zhǔn)則達(dá)到最大的那個(gè)特征,在下一步的迭代中,選出的特征是對(duì)上一步選擇的特征的一 個(gè)補(bǔ)充,所以特征被選擇的過程中,選擇的通常是共享率較大的特征子集,很難得到最優(yōu)的 特征子集。
[0009] 序列后向選擇算法SBS :與SFS相對(duì)應(yīng),SBS是一種自上而下的方法。首先將整個(gè) 特征集合作為初始選擇的特征子集,在算法的每一次迭代中,去除對(duì)評(píng)價(jià)準(zhǔn)則貢獻(xiàn)最小的 特征,直到剩下的特征個(gè)數(shù)滿足需要的特征個(gè)數(shù)。由于SBS是從全部的特征集合開始計(jì)算 的,所以計(jì)算量會(huì)比SFS稍大。相對(duì)SFS來說,其更加充分的考慮了特征之間的統(tǒng)計(jì)相關(guān)性, 因而在相同的評(píng)價(jià)準(zhǔn)則下,其效果要略微好于SFS,但是其仍然存在與SFS相似的缺點(diǎn),比 如一個(gè)特征被去除后就再也不可能被考慮,而被去除的特征可能是一些比較重要的特征。
[0010] 廣義序列后向選擇算法GSBS :作為SBS的加速算法,該算法在每次迭代中,根據(jù)評(píng) 價(jià)準(zhǔn)則一次性去除r個(gè)特征,使得評(píng)價(jià)準(zhǔn)則最優(yōu),直到剩下的特征個(gè)數(shù)滿足需要的特征個(gè) 數(shù)。這個(gè)算法的優(yōu)點(diǎn)是速度相對(duì)來說更快,相比SBS有更大的搜索范圍,性能也是相對(duì)比較 好。但是仍然會(huì)導(dǎo)致重要特征的丟失。
[0011] 以上方法均由于只考慮特征的整體結(jié)構(gòu)性,而沒有充分考慮到特征之間相關(guān)性, 所以無法選擇出最優(yōu)的特征子集,導(dǎo)致分類精度較低。
【發(fā)明內(nèi)容】
[0012] 本發(fā)明的目的在于針對(duì)上述已有技術(shù)的不足,提出一種基于低秩表示的高光譜圖 像波段選擇方法,以選擇出最優(yōu)的波段子集,提高高光譜圖像分類精度,降低數(shù)據(jù)處理的計(jì) 算復(fù)雜度。
[0013] 本發(fā)明的技術(shù)思路是:考慮到高光譜波段之間的相關(guān)性,對(duì)高光譜波段進(jìn)行低秩 表示,選擇出的波段子集盡可能地充分表示原始波段數(shù)據(jù),同時(shí)也要降低波段之間的冗余 信息,即在選擇少量波段的同時(shí),選擇出包含信息量最大的波段子集,以有利于后面的分 類。其實(shí)現(xiàn)步驟如下:
[0014] 1、一種基于低秩表示的高光譜圖像波段選擇方法,包括如下步驟:
[0015] (1)輸入高光譜圖像Y e RtixS其中,Q為像素點(diǎn)個(gè)數(shù),L表示波段數(shù)目,該高光譜 圖像包含C類像素點(diǎn),圖像的每一個(gè)像素點(diǎn)為一個(gè)樣本,R表示實(shí)數(shù)域;
[0016] (2)對(duì)高光譜數(shù)據(jù)進(jìn)行歸一化處理,得到歸一化后高光譜數(shù)據(jù)X e RtixS
[0017] (3)對(duì)歸一化后的高光譜數(shù)據(jù)X = [X1, X2,…,Xi, Xj,…,xj e Rqxl進(jìn)行低秩表 示并求解,得到X的低秩表示系數(shù)矩陣Z = [Z1, Z2, ...,Zi, ...,zj e R1^,其中Xi, χ,分別 表示所有像素在第i,和第j個(gè)波段上的光譜強(qiáng)度組成的向量,Z1表示數(shù)據(jù)在第i個(gè)波段的 表示系數(shù)向量,i, j = 1,2,. . .,L ;
[0018] (4)根據(jù)⑶得到的低秩表示系數(shù)矩陣Z e R^,對(duì)波段進(jìn)行聚類:依次分別對(duì)每 一個(gè)波段Xi, i = 1,...,L,利用其低秩表示系數(shù)向量Zi, i = 1,...,L進(jìn)行重構(gòu),計(jì)算重構(gòu) 結(jié)果與其余每個(gè)波段的殘差:
[0020] 從中找出產(chǎn)生最小殘差對(duì)應(yīng)的波段xk,k e {1,2,一,Lhk辛i,則第k個(gè)波段與 第i個(gè)波段具有較強(qiáng)的相關(guān)性,將第k個(gè)波段與第i個(gè)波段合并組成一個(gè)聚類,若其中一個(gè) 波段已與其他波段組成聚類,則將另一個(gè)并入已有聚類;
[0021] (5)計(jì)算每個(gè)聚類的聚類中心,并從每個(gè)聚類中選擇出離聚類中心最近的波段作 為該聚類最具代表性波段,所有聚類的代表性波段組成最終選擇的波段子集;
[0022] (6)根據(jù)最終選擇的波段,對(duì)所有樣本提取所選波段組成新的樣本集合Xse Rtixs, 其中S表示所選波段的數(shù)目;
[0023] (7)根據(jù)波段選擇后的新樣本集合Xs對(duì)高光譜數(shù)據(jù)進(jìn)行分類:從X s中每類選擇 10 %的樣本作為訓(xùn)練樣本集Xp,其余90 %的樣本作為測(cè)試樣本集Xq,將訓(xùn)練樣本集Xp輸入 到支撐矢量機(jī)SVM中進(jìn)行訓(xùn)練,學(xué)習(xí)出一個(gè)分類器,將測(cè)試樣本集X q輸入到這個(gè)分類器中, 得到測(cè)試樣本Xq的分類標(biāo)簽向量Y s,標(biāo)簽向量\即是高光譜圖像的分類結(jié)果。
[0024] 本發(fā)明與現(xiàn)有技術(shù)相比,具有以下優(yōu)點(diǎn):
[0025] 1、本發(fā)明對(duì)高光譜數(shù)據(jù)進(jìn)行低秩表示,由于噪聲會(huì)提高高光譜數(shù)據(jù)的秩,因此在 低秩的約束下自然就去掉了噪聲的干擾,提高了對(duì)噪聲的抗干擾能力;
[0026] 2、本發(fā)明通過對(duì)波段進(jìn)行選擇,不僅除了波段之間的冗余信息,而且在大幅度降 低波段數(shù)目的同時(shí)保留了有用的信息,降低了數(shù)據(jù)的處理復(fù)雜度。
[0027] 3,本發(fā)明通過聚類選擇波段,選擇出相關(guān)性低,包含信息量大的波段子集,因此提 高了分類精度;
【附圖說明】
[0028] 圖1是本發(fā)明的實(shí)現(xiàn)流程圖;
[0029] 圖2是本發(fā)明實(shí)驗(yàn)中所用Indian Pines Scene數(shù)據(jù)集的可視化圖像;
[0030] 圖3是本發(fā)明實(shí)驗(yàn)中所用Pavia University Scene數(shù)據(jù)集的可視化圖像;
[0031] 圖4是本發(fā)明實(shí)驗(yàn)中所用Salinas Scene數(shù)據(jù)集的可視化圖像;
【具體實(shí)施方式】
[0032] 參照?qǐng)D1,本發(fā)明主要包括三個(gè)部分:高光譜數(shù)據(jù)的低秩表示、高光譜數(shù)據(jù)波段選 擇和對(duì)選擇波段的分類。下面分別介紹這三部分的實(shí)施步驟:
[0033] -.高光譜數(shù)據(jù)的低秩表示
[0034] 步驟1 :將高光譜數(shù)據(jù)轉(zhuǎn)化為二維矩陣Y。
[0035] 輸入原始的高光譜數(shù)據(jù)D e Rmxnx^由于高光譜數(shù)據(jù)是三維矩陣,為了便于后續(xù)的 處理,則要將高光譜數(shù)據(jù)轉(zhuǎn)化為二維矩陣Y e ,其中MXN表示像素點(diǎn)數(shù)目,L表示波段 數(shù)目,Q = MXΝ,該高光譜圖像包含c類像素點(diǎn),圖像的每一個(gè)像素點(diǎn)為一個(gè)樣本,R表示實(shí) 數(shù)域。
[0036] 步驟2 :對(duì)二維矩陣Y進(jìn)行歸一化,得到高光譜矩陣X e Rtix匕
[0037] 對(duì)轉(zhuǎn)換的二維矩陣Y e RtjM進(jìn)行數(shù)據(jù)的歸一化,是將Y e RtjM中的像素點(diǎn)歸一化 為0-1之間的值,得到歸一化后的高光譜矩陣X e Rqx匕
[0038] 步驟3 :對(duì)高光譜數(shù)據(jù)X進(jìn)行低秩表示。
[0039] 通常情況下,低秩表示的基本模型為:
[0041] 其中:Z e 為低秩表示系數(shù)矩陣,C表示字典
I2il范數(shù),[E] ^表示噪聲系數(shù)矩陣E第i行,第j列的值,I I ·| I $表示矩陣的核范數(shù),λ表 示平衡參數(shù),E表示噪聲系數(shù)矩陣;
[0042] 本發(fā)明中使用高光譜數(shù)據(jù)X作為字典,即用高光譜數(shù)據(jù)X代替公式中的字典C,將 高光譜數(shù)據(jù)X低秩表示的模型變?yōu)椋?br>[0044] 其中:Z e Rlxl為低秩表示系數(shù)矩陣
稱為l2,i范數(shù),
[ELi j表示噪聲系數(shù)矩陣E第i行,第j列的值,I I · I I $表示矩陣的核范數(shù),λ表示平衡 參數(shù),E表示噪聲系數(shù)矩陣。
[0045] 步驟4 :求解低秩表示系數(shù)矩陣Ζ。
[0046] 求解低秩表示系數(shù)矩陣的現(xiàn)有的常用方法有:QR分解法、LU分解法和增強(qiáng)拉格朗
日乘子ALM算法。本發(fā)明實(shí)例利用增強(qiáng)拉格朗日乘I ALM算法對(duì)高光譜數(shù)據(jù)X的低秩表示 模型進(jìn)行優(yōu)化求解,得到低秩表示系數(shù)矩陣Z = [Z1, z2, . . .,Zi, . . .,zj e R1^,其中2;表 示第i個(gè)波段的低秩表示系數(shù),i = 1,...,L。
[0047] 二.高光譜數(shù)據(jù)波段選擇
[0048] 步驟5 :通過低秩表示系數(shù)矩陣Z對(duì)波段進(jìn)行聚類。
[0049] 本步驟是根據(jù)層次聚類的思想,將每一個(gè)波段初始化為一個(gè)聚類,再利用低秩表 示系數(shù)矩陣Z,對(duì)波段進(jìn)行聚類,其步驟如下:
[0050] (5a)通過第i個(gè)波段的表示系數(shù)&重構(gòu)出第i個(gè)波段Xz i,根據(jù)以下公式計(jì)算重 構(gòu)出的波段Xzi