本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,具體涉及一種基于k最近鄰濾波的高光譜分類方法。
背景技術(shù):
20世紀(jì)60年代,遙感成像技術(shù)得到了快速發(fā)展,光譜分辨率不斷的提高,從黑白成像,彩色攝影,到多光譜掃描成像,再到1980年,高光譜遙感成像技術(shù)誕生。高光譜遙感利用很窄而連續(xù)的光譜通道(一般波段寬小于10nm)對(duì)地物持續(xù)遙感成像的技術(shù),其與常規(guī)遙感的主要區(qū)別是,高光譜成像光譜儀能為每個(gè)像元提供數(shù)十個(gè)至數(shù)百個(gè)窄波段的光譜信息,每個(gè)像元都能產(chǎn)生一條完整和連續(xù)的光譜曲線。
高光譜圖像實(shí)質(zhì)上是一個(gè)三維的數(shù)據(jù)矩陣。高光譜圖像包含地物目標(biāo)的二維空間幾何和一維的光譜信息,將成像技術(shù)和光譜技術(shù)相結(jié)合,實(shí)現(xiàn)了圖譜合一。正因?yàn)楦吖庾V圖像具有圖譜合一的特點(diǎn),包含更多地物的特征信息,對(duì)于分析地球地物信息有明顯的優(yōu)勢(shì),所以在很多方面都有重大應(yīng)用價(jià)值。在海洋遙感方面,高光譜圖像不僅可以用于海水中葉綠素的濃度某些污染物和表層水溫的探測(cè),也可以用于海冰,海岸帶等的探測(cè)。在植被研究方面,有很多成功的實(shí)例,如作物類別識(shí)別,森林樹(shù)種識(shí)別和植物荒漠化研究。另外,還可利用高光譜圖像定量分析植冠的化學(xué)成分,監(jiān)測(cè)由于環(huán)境和大氣引起的植物功能的變化。在軍事偵察和識(shí)別偽裝方面,可以根據(jù)目標(biāo)光譜和偽裝材料光譜特征的不同,利用高光譜技術(shù)從偽裝的物體發(fā)現(xiàn)目標(biāo)。還可以對(duì)軍工廠產(chǎn)生煙霧的光譜特征,直接識(shí)別出生產(chǎn)出來(lái)的武器材料,然后判斷武器的種類。
近年來(lái),研究人員發(fā)現(xiàn),在高光譜圖像分類中,融合光譜信息和空間信息能大大改善分類結(jié)果。基于特征提取的高光譜圖像空譜分類,是高光譜圖像空譜分類相對(duì)成熟的方法之一。實(shí)驗(yàn)已經(jīng)證明該類方法能在實(shí)際高光譜圖像分類取得相對(duì)好得分類精度。然而這類分類方法,一般只考慮相鄰像元的局部空間信息,即使用于提取空間信息的濾波器可以定義不同尺度的濾波操作,獲取相鄰像元不同范圍的空間信息,但還是不能很好地利用整幅高光譜圖像像元間的全局空間信息。另一類結(jié)合光譜信息和空間信息進(jìn)行分類方法就是基于分割的高光譜圖像分類,這類方法一般先把高光譜圖像進(jìn)行分割成無(wú)重疊的各向同性區(qū)域(基于紋理或者灰度),接著根據(jù)高光譜圖像的光譜信息對(duì)高光譜圖像進(jìn)行粗分類,最后利用粗分類結(jié)果進(jìn)行投票決定各向同性區(qū)域的類別得到高光譜圖像最終的分類結(jié)果。這類方法利用分割對(duì)高光譜圖像提取像元間領(lǐng)域空間信息,分割算法的好壞對(duì)于最終分類精度至關(guān)重要。該類方法雖然能取得很好分類結(jié)果,但一般都比較耗時(shí)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于克服已有技術(shù)的不足,即傳統(tǒng)的高光譜圖像空譜分類方法不能很好地利用整幅高光譜圖像像元間的全局空間信息以及基于分割的高光譜圖像分類太過(guò)依賴分割算法的好壞和分類速度比較慢的缺點(diǎn),提取一種基于k最近鄰濾波的高光譜分類方法,即通過(guò)基于k最近鄰的濾波器提取高光譜圖像的全局空間信息,并結(jié)合支持向量機(jī)獲取的高光譜分類結(jié)果相結(jié)合,實(shí)現(xiàn)高光譜圖像的快速高精度分類。
為達(dá)到上述目的,本發(fā)明的技術(shù)方案:
如圖1,一種基于k最近鄰濾波的高光譜分類方法,,包括如下過(guò)程:
(1)支持向量機(jī)對(duì)高光譜圖像進(jìn)行粗分類:利用支持向量機(jī)分類器,根據(jù)光譜信息,對(duì)高光譜圖像進(jìn)行粗分類,得到各個(gè)類別的初始概率圖。
(2)主成分分析對(duì)高光譜圖像進(jìn)行降維:主成分分析法降維得到第一主成分圖像,第一主成分更好地保留了高光譜圖像的光譜信息和空間信息,將其作為用于引導(dǎo)濾波的圖像。
(3)k最近鄰濾波:基于k最近鄰的濾波器在第一主成分圖像的引導(dǎo)下,對(duì)每一幅不同類別的初始概率圖進(jìn)行濾波,得到優(yōu)化后的概率圖。
(4)獲取高光譜圖像的分類結(jié)果:根據(jù)濾波后的優(yōu)化概率圖,得到每個(gè)像元的類別概率,類別概率最大的,就給像元分配該類別的標(biāo)記,得到最后的分類結(jié)果。
步驟(1)按照如下步驟進(jìn)行:令一幅d維n個(gè)像元的高光譜圖像x=(x1,...,xi...,xn)∈rd×n和τ個(gè)標(biāo)記訓(xùn)練樣本tτ≡{(x1,y1),...,(xi,yi),...,(xτ,yτ)}∈(rd×lc).其中xi為高光譜圖像第i個(gè)像元點(diǎn),yi為高光譜像元i的類別標(biāo)識(shí),rd表示高光譜圖像的維數(shù)為d,lc={1,...,l}是各個(gè)類別的標(biāo)記,l是類別的總數(shù);
(a):首先,利用高光譜圖像的標(biāo)記訓(xùn)練樣本對(duì)支持向量機(jī)進(jìn)行訓(xùn)練:其訓(xùn)練的過(guò)程可以轉(zhuǎn)化為解決如下最優(yōu)化問(wèn)題得到支持向量機(jī)模型的最佳參數(shù):
其中,αi為支持向量機(jī)的模型參數(shù),xi為高光譜圖像第i個(gè)像元點(diǎn),yi為高光譜像元點(diǎn)i的標(biāo)識(shí),n為有標(biāo)識(shí)像元點(diǎn)的個(gè)數(shù)。核函數(shù)k(xi,xj)把低維特征空間的點(diǎn)乘映射到高維空間的點(diǎn)乘,實(shí)現(xiàn)了特征向量在高維空間線性可分,核函數(shù)采用高斯徑向基核函數(shù)(rbf核函數(shù));
k(xi,x)=exp(-γ||xi-x||2)
參數(shù)γ為高斯徑向基核函數(shù)的寬度參數(shù),控制了函數(shù)的徑向作用范圍;
(b):接著,利用訓(xùn)練好的支持向量機(jī)對(duì)高光譜圖像進(jìn)行分類,其分類的相應(yīng)的決策函數(shù)為
通過(guò)決策函數(shù)可以得到高光譜圖像的初始概率圖p,其中b為決策函數(shù)的偏移量。
步驟(3)按照如下步驟進(jìn)行:
(a)首先,定義高光譜圖像包含光譜信息和空間信息的特征向量f(x):
f(x)=(i(i),λ·l(i),λ·h(i))
其中i(i)代表高光譜圖像像元i的像素值,i(i)和h(i)表示高光譜圖像像元i的經(jīng)度和維度,即像元在圖像的空間坐標(biāo),參數(shù)λ用于控制像素值與坐標(biāo)空間之間平衡的。
(b)接著,利用k最近鄰算法找出降維后的高光譜第一主成分圖像i每個(gè)像元i的k個(gè)近鄰像元,搜索k個(gè)近鄰點(diǎn),利用如下特征空間的距離公式
li(x)=mink||f(x)-f(xn)||,n=1,...,n
其中n為像元點(diǎn)的個(gè)數(shù),||·||表示某種距離(相似度)度量,一般采用歐式距離作為度量;
(c)最后,利用基于k最近鄰濾波器對(duì)初始概率圖p進(jìn)行濾波,得到優(yōu)化分類概率圖o;根據(jù)以上步驟得到的支持向量機(jī)得到的初始概率圖p和每個(gè)像元i的k個(gè)近鄰像元,基于k最近鄰的非局部濾波器可以被定義為:
其中ωi表示在特征空間f(x)中,像元i的k個(gè)最近鄰點(diǎn)。
步驟(4),按照如下步驟進(jìn)行:
(a)得到濾波后的優(yōu)化概率圖像后o(i),高光譜影像中像素i的類別就可以通過(guò)簡(jiǎn)單的概率最大化的準(zhǔn)則選擇:
該步驟的目的是將概率圖像o(i)轉(zhuǎn)化為最終的分類結(jié)果圖像c(i);
(b)衡量高光譜圖像分類精度,本發(fā)明采用:總精度、平均精度和kappa系數(shù)三個(gè)指標(biāo);
總精度(overaccuracy,oa)反映一個(gè)隨機(jī)樣本的分類類別與真實(shí)類別一致的概率,其可由混淆矩陣計(jì)算求得:
上式n是樣本的類別總數(shù),mii是第i類正確分類的樣本數(shù),通過(guò)各類別的正確率相加除以總類別得到該指標(biāo);
平均精度(averageaccuracy,aa)是指研究目標(biāo)中各類別間被正確分類的平均值,反映了每個(gè)類別精度的平均值:
其中種類精度
kappa系數(shù)需要根據(jù)混淆矩陣中所有因子計(jì)算,不僅考慮了對(duì)角線上像元數(shù)量,還考慮了不在對(duì)角線上漏分錯(cuò)分誤差,能綜合和全面地反映高光譜圖像分類情況;
其中mki表示應(yīng)屬于第i類的樣本被分為第k類的樣本數(shù)量。
本發(fā)明與現(xiàn)有的技術(shù)相比具有以下優(yōu)點(diǎn):
1.通過(guò)基于k最近鄰的濾波優(yōu)化策略,克服了傳統(tǒng)的空譜分類方法需要求解復(fù)雜的全局能量最優(yōu)化問(wèn)題。直接利用基于k最近鄰的濾波器對(duì)由支持向量機(jī)得到的高光譜圖像初分類概率圖進(jìn)行濾波優(yōu)化,即可得到高精度的分類結(jié)果,速度快。
2.高光譜圖像樣本的特征空間的定義,包括高光譜圖像的全局空間信息,克服了基于特征提取的高光譜圖像空譜分類方法不能很好地利用整幅高光譜圖像像元間的全局空間信息的問(wèn)題,能更好的對(duì)高光譜圖像進(jìn)行分類。
3.結(jié)合高光譜圖像的空間信息和光譜信息進(jìn)行分類,精度提高大。
本發(fā)明利用高光譜圖像空間信息和光譜信息相結(jié)合進(jìn)行分類的技術(shù),相比于傳統(tǒng)分類技術(shù),高光譜的分類精度明顯提高,分類速度快。這將在后面的結(jié)果進(jìn)行說(shuō)明。
附圖說(shuō)明
圖1是一種基于k最近鄰濾波的高光譜分類方法的過(guò)程示意圖;
圖2是本發(fā)明用于演示的印度松圖像(indiap)原始圖和參考分類圖;
圖3是本發(fā)明用于演示的博茨瓦納草原濕地植被圖像(botswana)原始圖和參考分類圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明中使用到的兩個(gè)高光譜圖像分別是印度松圖像(indiap)和博茨瓦納草原濕地植被圖像(botswana)。如圖2所示,印度松圖像(indiap)涵蓋了森林區(qū)和混合農(nóng)業(yè)區(qū),玉米耕地和大豆耕地占了大部分區(qū)域,包含16個(gè)類別,其大小為145×145像素,空間分辨率為20m每像素,包含了220個(gè)光譜通道,覆蓋了0.4到2.5um的波段范圍。如圖3所示,高光譜圖像(botswana),大小為1476×256像素,空間分辨率為30米每像素,擁有242個(gè)波段,覆蓋了從0.4um到2.5um的波長(zhǎng)范圍。包含14個(gè)類別:河道與澇原上生長(zhǎng)的蘆葦(reeds)與河草(grasses)也包含熱帶草原上生長(zhǎng)的阿拉伯膠樹(shù)(acacia)與其他密度分布不均的樹(shù)種。
本發(fā)明的實(shí)施過(guò)程如下:
步驟(1):令一幅d維n個(gè)像元的高光譜圖像x=(x1,...,xi...,xn)∈pd×n和τ個(gè)標(biāo)記訓(xùn)練樣本tτ≡{(x1,y1),...,(xi,yi),...,(xτ,yτ)}∈(rd×lc).其中xi為高光譜圖像第i個(gè)像元點(diǎn),yi為高光譜像元i的類別標(biāo)識(shí),rd表示高光譜圖像的維數(shù)為d,lc={1,...,l}是各個(gè)類別的標(biāo)記,l是類別的總數(shù);
(a):首先,利用高光譜圖像的標(biāo)記訓(xùn)練樣本對(duì)支持向量機(jī)進(jìn)行訓(xùn)練:其訓(xùn)練的過(guò)程可以轉(zhuǎn)化為解決如下最優(yōu)化問(wèn)題得到支持向量機(jī)模型的最佳參數(shù):
其中,αi為支持向量機(jī)的模型參數(shù),xi為高光譜圖像第i個(gè)像元點(diǎn),yi為高光譜像元點(diǎn)i的標(biāo)識(shí),n為有標(biāo)識(shí)像元點(diǎn)的個(gè)數(shù)。核函數(shù)k(xi,xj)把低維特征空間的點(diǎn)乘映射到高維空間的點(diǎn)乘,實(shí)現(xiàn)了特征向量在高維空間線性可分,核函數(shù)采用高斯徑向基核函數(shù)(rbf核函數(shù));
k(xi,x)=exp(-γ||xi-x||2)
參數(shù)γ為高斯徑向基核函數(shù)的寬度參數(shù),控制了函數(shù)的徑向作用范圍;
(b):接著,利用訓(xùn)練好的支持向量機(jī)對(duì)高光譜圖像進(jìn)行分類,其分類的相應(yīng)的決策函數(shù)為
通過(guò)決策函數(shù)可以得到高光譜圖像的初始概率圖p,其中b為決策函數(shù)的偏移量。
步驟(2):主成分分析對(duì)高光譜圖像進(jìn)行降維:主成分分析法降維得到第一主成分圖像i,第一主成分更好地保留了高光譜圖像的光譜信息和空間信息,將其作為用于引導(dǎo)濾波的圖像。
步驟(3):
(a)首先,定義高光譜圖像包含光譜信息和空間信息的特征向量f(x):
f(x)=(i(i),λ·l(i),λ·h(i))
其中i(i)代表高光譜圖像像元i的像素值,i(i)和h(i)表示高光譜圖像像元i的經(jīng)度和維度,即像元在圖像的空間坐標(biāo),參數(shù)λ用于控制像素值與坐標(biāo)空間之間平衡的。
(b)接著,利用k最近鄰算法找出降維后的高光譜第一主成分圖像i每個(gè)像元i的k個(gè)近鄰像元,搜索k個(gè)近鄰點(diǎn),利用如下特征空間的距離公式
li(x)=mink||f(x)-f(xn)||,n=1,...,n
其中n為像元點(diǎn)的個(gè)數(shù),||·||表示某種距離(相似度)度量,一般采用歐式距離作為度量;
(c)最后,利用基于k最近鄰濾波器對(duì)初始概率圖p進(jìn)行濾波,得到優(yōu)化分類概率圖o;根據(jù)以上步驟得到的支持向量機(jī)得到的初始概率圖p和每個(gè)像元i的k個(gè)近鄰像元,基于k最近鄰的非局部濾波器可以被定義為:
其中ωi表示在特征空間f(x)中,像元i的k個(gè)最近鄰點(diǎn)。
步驟(4):
(a)得到濾波后的優(yōu)化概率圖像后o(i),高光譜影像中像素i的類別就可以通過(guò)簡(jiǎn)單的概率最大化的準(zhǔn)則選擇:
該步驟的目的是將概率圖像o(i)轉(zhuǎn)化為最終的分類結(jié)果圖像c(i);
(b)衡量高光譜圖像分類精度,本發(fā)明采用:總精度、平均精度和kappa系數(shù)三個(gè)指標(biāo);
總精度(overaccuracy,oa)反映一個(gè)隨機(jī)樣本的分類類別與真實(shí)類別一致的概率,其可由混淆矩陣計(jì)算求得:
上式n是樣本的類別總數(shù),mii是第i類正確分類的樣本數(shù),通過(guò)各類別的正確率相加除以總類別得到該指標(biāo);
平均精度(averageaccuracy,aa)是指研究目標(biāo)中各類別間被正確分類的平均值,反映了每個(gè)類別精度的平均值:
其中種類精度
kappa系數(shù)需要根據(jù)混淆矩陣中所有因子計(jì)算,不僅考慮了對(duì)角線上像元數(shù)量,還考慮了不在對(duì)角線上漏分錯(cuò)分誤差,能綜合和全面地反映高光譜圖像分類情況;
其中mki表示應(yīng)屬于第i類的樣本被分為第k類的樣本數(shù)量。
本發(fā)明提供的基于k最近鄰濾波的高光譜分類方法,克服了傳統(tǒng)的空譜分方法需要求解復(fù)雜的全局能量最優(yōu)化問(wèn)題,直接利用基于k最近鄰的濾波器對(duì)由支持向量機(jī)得到的高光譜圖像初分類概率圖進(jìn)行濾波優(yōu)化,速度快。并且該方法結(jié)合高光譜圖像的全局空間信息和光譜信息對(duì)高光譜圖像進(jìn)行分類,精度高。
參照?qǐng)D2,圖3,本發(fā)明的效果由以下仿真進(jìn)一步說(shuō)明:
1.仿真條件
(1)本發(fā)明分別在兩幅高光譜圖像:印度松圖像(indiap)和博茨瓦納草原濕地植被圖像(botswana)作了仿真,并與其他三種方法支持向量機(jī)(svm)、基于利用多層邏輯模型作為先驗(yàn)知識(shí)和多項(xiàng)式邏輯回歸分類器的算法(lmll)、基于置信度傳播的分類算法(lbp)和基于邊緣保持濾波的分類算法(epf)四種方法作比較。本發(fā)明的方法用knn表示。
(2)對(duì)于每幅高光譜圖像,每種分類方法隨機(jī)地從參考標(biāo)記樣本挑選10%作為訓(xùn)練樣本,并通過(guò)10次實(shí)驗(yàn)求平均值的方式,獲得各個(gè)的分類精度。
2.仿真內(nèi)容與結(jié)果:
表一,給出了在印度松圖像(indiap)數(shù)據(jù)五種分類方法的每類平均正確率(aa),總體正確率(oa)和kappa系數(shù)??梢钥吹?,相較于對(duì)比方法,本發(fā)明的分類算法(knn)幾乎提高了所有類別的分類精度,例如玉米未耕地的分類精度由75.01%提升到100%。對(duì)比emp、lmll、lbp和epf算法,本發(fā)明的分類算法(knn)在oa,aa和kappa指標(biāo)上達(dá)到96.23%,95.65%,95.66%,有相對(duì)的優(yōu)勢(shì)。這表明,本發(fā)明的分類算法(knn)能有效地的提升高光譜圖像的分類精度,速度快。
表二,給出了在博茨瓦納草原濕地植被圖像(botswana)數(shù)據(jù)上五種分類方法的每類平均正確率(aa),總體正確率(oa)和kappa系數(shù)??梢钥闯?,基于非局部最近鄰的分類算法在oa、aa和kappa這三個(gè)指標(biāo)上達(dá)到98.81%,98.91%,98.71%,相比其他幾個(gè)分類方法,具有更出色的表現(xiàn)。
綜上所述,無(wú)論從算法的運(yùn)行速度和分類精度,本發(fā)明的基于k最近鄰濾的高光譜圖像分類方法,與其它四種圖像分類方法相比,效果都是最好的。
以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)所述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
表一
表二