本發(fā)明屬于遙感信息處理技術(shù)領(lǐng)域,特別是一種高光譜數(shù)據(jù)彩色可視化方法。
背景技術(shù):
彩色顯示技術(shù)是對hsi地物信息空間分布的直觀呈現(xiàn),對于科學(xué)決策和信息利用意義重大。但是,有別于普通二維圖像的三信道顯示方法,高維的數(shù)據(jù)立方體結(jié)構(gòu)使得高光譜圖像無法直接在常用顯示設(shè)備中進(jìn)行顯示。因此,通常將三維高光譜數(shù)據(jù)優(yōu)化到三信道彩色顯示系統(tǒng)(如rgb、hsv等色彩空間)顯示,能夠擁有更好的可視化效果并表達(dá)更為豐富的信息。但這種變換到低維的顯示模型無可避免的損失了一部分光譜信息,目前,常用的hsi的彩色可視化方法有以下三種:
其一,遵循不同準(zhǔn)則直接選取三個(gè)光譜波段,使其分別作為rgb空間的信道進(jìn)行假彩色合成。但是這種僅提取部分波段進(jìn)行顯示的方法無可避免地會(huì)造成大量的有用信息的丟失。
其二,直接對原始數(shù)據(jù)進(jìn)行處理,壓縮信息使其變換到三信道并在彩色空間進(jìn)行顯示,該方法可以通過以下幾種方式實(shí)現(xiàn):1)基于簡單變換;2)jacobson和gupta所提出的基于固定線性光譜加權(quán)封裝方法;3)基于矩陣變換的降維方法;4)融合方法;5)遵循某種信息保持準(zhǔn)則的優(yōu)化方法。但是,這些方法產(chǎn)生的圖像往往存在偏暗、無法判斷各主成分的特征排序、各成分之間并非相互獨(dú)立、實(shí)際數(shù)據(jù)非線性、計(jì)算量過大等問題。此外,這些基于hsi原始數(shù)據(jù)立方體的可視化方法,無法根據(jù)觀察需要以滿足不同的顯示側(cè)重,同時(shí)也無法充分利用先驗(yàn)信息。
其三,建立在像素分析結(jié)果之上,對分析結(jié)果進(jìn)行顯示。這類方法較之上面的兩類方法從信息挖掘角度來講明顯具有更為重要的意義,因?yàn)楸绕鹗褂脝我粩?shù)據(jù)變換,使用像素分析結(jié)果的可視化通常能夠產(chǎn)生更好的數(shù)據(jù)分析效果。qiandu等對基于數(shù)據(jù)變換及分類的高光譜圖像可視化方法進(jìn)行了詳盡的對比論述。mignotte提出了考慮類相似性約束的自動(dòng)彩色分配方法,但是該方法僅適用于類別較少的圖像(類別數(shù)),而且這種端元顏色標(biāo)簽選擇方法并不適用于混合像素的顏色表達(dá)。此外,這種在可視化中放棄亮度等信息的方法,不僅削減了彩色圖像所能夠表述的信息,而且削弱了空間分布信息在可視化圖像中的體現(xiàn)。
如上所述,現(xiàn)有的高光譜圖像可視化方法皆可被看作是面向數(shù)據(jù)的方法,這些方法由于缺少顯示的針對性,或者在合成信道時(shí)損失了圖像中的有價(jià)值信息,或者所展示的類別信息并非完全滿足觀察者的需求。尤其對于有監(jiān)督的高光譜數(shù)據(jù),數(shù)據(jù)中已知的先驗(yàn)知識(shí)無法被充分利用。因此,相對于以上所述具有通用性的面對數(shù)據(jù)的可視化方法,面向觀察需求(或面向?qū)ο?的高光譜可視化方法在某些方面更加具有實(shí)用性。例如,對于某塊農(nóng)耕區(qū)域,往往可知其間所種農(nóng)作物類別及大致分布,通過衛(wèi)星圖像也較易確定各類別空間分布信息。因而對于該區(qū)域,觀察者更感興趣的往往是病蟲害信息,抑或同類農(nóng)作物間的長勢區(qū)別或是混入的異類地物,即與同類別相比的異常區(qū)域。但是面向數(shù)據(jù)的可視化方法僅是對該區(qū)域的整體數(shù)據(jù)進(jìn)行處理及無差別顯示,不僅無法充分利用監(jiān)督數(shù)據(jù),更可能無法對某些異常地物進(jìn)行有效的顯示。如若分別對各類別地物進(jìn)行處理,又會(huì)影響圖像信息的整體表述,且所需的顯示圖像難免多且繁瑣。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于使輸出圖像中既顯示數(shù)據(jù)類別又顯示數(shù)據(jù)本身的差異。該圖像在保留監(jiān)督信息的同時(shí),在每類地物內(nèi)部具有較好的距離保持特性的面向類別的高光譜數(shù)據(jù)彩色可視化方法。
本發(fā)明通過如下步驟來實(shí)現(xiàn):
步驟一、根據(jù)有無監(jiān)督信息對數(shù)據(jù)進(jìn)行類別調(diào)整,其中對于非監(jiān)督信息,可利用粗聚類等方法對數(shù)據(jù)分類。然后利用流形學(xué)習(xí)的非線性優(yōu)點(diǎn),根據(jù)監(jiān)督信息對不同類別或不同區(qū)域分別進(jìn)行降維。
步驟二、在選定的顏色空間內(nèi)確定代表監(jiān)督信息中每個(gè)類別獨(dú)有的顏色的色相,以使得在結(jié)果圖像中各類別間具有較好的視覺可分性,本發(fā)明中使用hsv彩色空間后,當(dāng)不使用調(diào)和系數(shù)時(shí),原數(shù)據(jù)直接降維到二維i2作為各象元的飽和度及明度,各元素的色相即為類別色相。當(dāng)選擇使用調(diào)和系數(shù)時(shí),原數(shù)據(jù)經(jīng)降維后成為一個(gè)三維數(shù)據(jù),記為i3,其中前兩維數(shù)據(jù)i2將會(huì)作為各象元的飽和度及明度。提出方法還可以選擇是否使用第三維數(shù)據(jù)(一維)i1作為相應(yīng)象元的色相波動(dòng)值,在剝離系數(shù)r的協(xié)調(diào)下決定各象元的色相值。
步驟三、根據(jù)每個(gè)類別選定的代表色相,結(jié)合降維后類內(nèi)的數(shù)據(jù)關(guān)系確定圖像中每個(gè)象元的飽和度及明度,同時(shí),可以選擇使用在剝離系數(shù)的控制下確定每一個(gè)象元的色相。
步驟四、將上述帶有監(jiān)督信息的數(shù)據(jù)合成三維并在特定的彩色空間可視化。
本發(fā)明與現(xiàn)有技術(shù)相比,具有如下優(yōu)點(diǎn):
更加充分地利用先驗(yàn)信息,進(jìn)而獲得更加令人滿意的可視化效果。使輸出圖像中既顯示數(shù)據(jù)類別又顯示數(shù)據(jù)本身的差異。圖像在保留監(jiān)督信息的同時(shí),在每類地物內(nèi)部具有較好的距離保持特性。
附圖說明
圖1為本發(fā)明的流程示意簡圖;
圖2為本發(fā)明的hsv彩色空間示意圖;
圖3為本發(fā)明的印第安納州農(nóng)林地物(indiana)數(shù)據(jù);
其中,(a)100波段,(b)pca,(c)類別顏色標(biāo)簽;
圖4為本發(fā)明的帕維亞大學(xué)圖像(pavia)數(shù)據(jù);
(a)80波段,(b)pca(c)類別顏色標(biāo)簽;
圖5為本發(fā)明的印第安納州農(nóng)林地物(indiana)數(shù)據(jù)可視化結(jié)果;
圖6為本發(fā)明的帕維亞大學(xué)圖像(pavia)數(shù)據(jù)可視化結(jié)果。
具體實(shí)施方式
下面結(jié)合附圖對本發(fā)明做出更詳細(xì)的描述。
本發(fā)明為一種面向類別的高光譜數(shù)據(jù)彩色可視化方法,采用流形算法來對高光譜數(shù)據(jù)進(jìn)行顯示,下面給出本發(fā)明的詳細(xì)實(shí)施過程,見附圖1。
步驟一,根據(jù)圖像是否有監(jiān)督數(shù)據(jù)分別對圖像進(jìn)行類別調(diào)整。
若所需可視化的圖像無監(jiān)督,則需要在進(jìn)行降維步驟之前進(jìn)行快速分類或粗聚類,隨后將分類結(jié)果作為用于可視化的類別信息并進(jìn)行顯示。對于分類時(shí)所取的類別數(shù)目及分類精度則需要根據(jù)具體情況而確定,類別劃分過細(xì)或精度設(shè)定過高會(huì)導(dǎo)致耗時(shí)的增加,影響隨后應(yīng)用流形算法的降維效果,以及造成生成圖像顏色表達(dá)的混亂;選定過少的類別數(shù)目時(shí),當(dāng)應(yīng)用流形算法對類內(nèi)數(shù)據(jù)進(jìn)行降維時(shí),很可能會(huì)面對內(nèi)存不足的問題,同時(shí)也會(huì)增加降維時(shí)的時(shí)間損耗。
若所需可視化的圖像有監(jiān)督,那么無論是精確的類別空間分布信息還是模糊的地域空間信息,都可作為已知的類別監(jiān)督數(shù)據(jù)。同樣,適當(dāng)?shù)剡x擇類間合并及類內(nèi)再次聚類也是一種增強(qiáng)可視化效果的方法。類間合并能夠減少顯示時(shí)需要重點(diǎn)區(qū)分的類別,避免類別色相選取過多時(shí)導(dǎo)致的圖像內(nèi)代表類別的顏色過多以及色差過小,進(jìn)而增加類間可分性增強(qiáng)視覺效果。類內(nèi)再聚類則會(huì)避免降維時(shí)的數(shù)據(jù)尺度過大的問題及減少降維時(shí)的用時(shí)損耗。
在確定類別信息后,為保持類內(nèi)數(shù)據(jù)在原始高光譜數(shù)據(jù)中的距離特性及其非線性,本發(fā)明中利用流形方法對數(shù)據(jù)中各類別分別進(jìn)行降維處理。
當(dāng)選擇使用調(diào)和系數(shù)時(shí),由n維的原高光譜數(shù)據(jù)降維到二維(飽和度及明度)+一維(色調(diào));當(dāng)不選用調(diào)和系數(shù)時(shí),數(shù)據(jù)由n維直接降維到二維(飽和度及明度)。理想的情況是具有更多類別信息的一維用做確定色調(diào),而其他兩維用以確定飽和度和亮度來區(qū)分相同類別內(nèi)部的變化。但是,對于不同的降維方法,很難說明降維后每維之間所含信息之間的關(guān)系。此外,在彩色空間中,色差可以近似地等于彩色空間中的幾何距離。因此三維數(shù)據(jù)順序的交換在理想假設(shè)下對色差影響不大。所以在本發(fā)明中,人為設(shè)定前兩維作為飽和度及明度信息,第三維用以確定色調(diào)。而本發(fā)明可選用t-sne(t-distributedstochasticneighborembedding)、le、isomap、lle、mds、dk(diffusionkernel)和ltsa等流形算法作為降維方法。
步驟二,各象元顏色的具體確定方法如下:
(1)選取類別標(biāo)簽顏色色相。
本發(fā)明在hsv彩色空間下進(jìn)行顯示,hsv彩色空間示意圖如圖2所示。
當(dāng)圖像中類別數(shù)目較少或需要較快運(yùn)行時(shí)間或者對可視化精度要求不高時(shí),各類別的顏色標(biāo)簽可以選擇由編譯軟件中已較為成熟的編碼方法進(jìn)行確定,如matlab軟件中的顏色映射函數(shù)(colormap)等方法自動(dòng)選取類別的色相。
當(dāng)類別數(shù)目較高或顯示要求較為嚴(yán)格時(shí),選用角度選取繞圓錐中心軸的色相值的方法,選取原則如下:
hj=360°j/n+α,(1)
其中n為類別數(shù)目,hj為第j個(gè)類別的標(biāo)簽色相值且hj∈[0,360°],α為色相的初始相位。α的值可由先驗(yàn)知識(shí)決定,使其能盡量符合所需的預(yù)設(shè)定顏色。如當(dāng)需要的3個(gè)類別的預(yù)設(shè)定顏色為紅、綠、藍(lán)時(shí),只需設(shè)定α=0,n=3,此時(shí)通過公式(1)即可得到相應(yīng)的色相值。當(dāng)?shù)玫礁魃嘀岛?,如對某些類別有預(yù)設(shè)定顏色要求,則優(yōu)先賦予相應(yīng)色相,其余則可以按順序分配。
(2)確定各象元色相。
為更為充分地利用彩色空間,并使顯示的圖像具有更為優(yōu)異的視覺可分性,本發(fā)明中在確定像素象元色相時(shí)引入剝離系數(shù)r,以調(diào)和同類地物間的差異性。r值代表了每個(gè)像素色相值在類別色相值的周圍浮動(dòng)的極限的大小。r值越大,同類別中各像元色相差異越大,色差越大,同時(shí)輸出圖像的距離保持特性越好。r值越小,輸出圖像的類間差異越大。理論上,r的取值范圍可在[0,0.5],即當(dāng)r=0時(shí),各像元色調(diào)即為類別色調(diào)值,當(dāng)r=0.5時(shí),每個(gè)類別中像元的色相的波動(dòng)區(qū)間恰好為繞圓錐中心軸的色相值的一半,此時(shí)各類別像元的取值范圍剛好是
hsv彩色空間的整個(gè)色相范圍。當(dāng)r>0.5時(shí),圖像中表示的不同類別的象元色相范圍將會(huì)產(chǎn)生交叉,因此除有特殊需求外,應(yīng)盡量避免在該范圍內(nèi)取值。因此,為獲得更清晰的顯示結(jié)果,象元色相值描述如下:
hi,j=rjδhi1,i+hj(2)
其中hi,j為第j類中第i個(gè)象元的色相值,hj為第j個(gè)類別的標(biāo)簽色相值且hj∈[0,360°],rj為第j類的協(xié)調(diào)系數(shù),i1,i為第j類高光譜數(shù)據(jù)降維后第3維中第i個(gè)象元的數(shù)值,且i1,i需歸一化,δh為類別標(biāo)簽色相差。通常情況下所有類別的rj選取相同數(shù)值。
當(dāng)使用調(diào)和系數(shù)時(shí),類內(nèi)數(shù)據(jù)經(jīng)流形算法降維后得到一個(gè)三波段的圖像矩陣,其中第三維數(shù)據(jù)(一維)i1作為相應(yīng)象元的色相波動(dòng)值,在剝離系數(shù)r的協(xié)調(diào)下決定各象元的色相值。而當(dāng)不使用r時(shí),像元色相值即為其所屬類別的色相值。
步驟三,所述的整體數(shù)據(jù)在彩色空間中的顯示方法如下:
經(jīng)上述方法得到各象元色相之后,各象元的飽和度及明度仍需要被確定。各類別數(shù)據(jù)分別經(jīng)流形算法降維后,前兩波段即分別作為各象元的飽和度及明度。在hsv彩色空間中,飽和度s和明度v的取值范圍皆為[0,1],如圖2所示。為減少彩色空間邊界的溢出情況,類別降維后的2維數(shù)據(jù)分別作為相應(yīng)象元的飽和度及明度并歸一化到s∈[0,0.9]及v∈[0.1,1]。
步驟四、結(jié)合以上獲得的色相信息,在彩色空間中的三個(gè)彩色信道進(jìn)行顯示。
為了說明本發(fā)明的有效性,特進(jìn)行如下實(shí)驗(yàn)論證。本發(fā)明共對兩組有監(jiān)督的高光譜遙感數(shù)據(jù)進(jìn)行實(shí)驗(yàn),分別為印第安納州農(nóng)林地物(indiana)和帕維亞大學(xué)圖像(pavia)。將兩組數(shù)據(jù)分別用于對本發(fā)明面向類別的高光譜彩色可視化方法的可行性驗(yàn)證,七種分別利用t-sne、le、isomap、lle、mds、dk、ltsa這七種流形算法進(jìn)行實(shí)驗(yàn)。隨后將實(shí)驗(yàn)結(jié)果與傳統(tǒng)面向數(shù)據(jù)的可視化方法,pca,固定線性光譜加權(quán)封裝方法(法簡稱為cmf方法)和基于最優(yōu)擬合的波段選取(簡稱bs方法)進(jìn)行比較。同時(shí),本文實(shí)驗(yàn)將在matlab平臺(tái)下進(jìn)行測試,使用7種流形算法對提出方法進(jìn)行測試,并對各算法的應(yīng)用性能進(jìn)行比較。
所有實(shí)驗(yàn)均選擇在hsv色彩空間中進(jìn)行描述,無預(yù)設(shè)定顏色。類別的色相值利用等角度選取繞圓錐中心軸的方法,色相的初始相位α=0,剝離系數(shù)r=0,各數(shù)據(jù)色相值的選取結(jié)果及pca彩色顯示結(jié)果分別如圖3和圖4中的圖b與圖c所示。利用各流形學(xué)習(xí)方法的面向類別的可視化結(jié)果及面向數(shù)據(jù)的cmf和bs可視化結(jié)果分別見圖5~圖6。
如圖所示,相比于pca、cmf以及bs等傳統(tǒng)面向數(shù)據(jù)的彩色可視化方法,面向類別的可視化方法在視覺的類間可分性方面普遍更優(yōu)。面向數(shù)據(jù)的方法對光譜相近的類別顯示的顏色也更為相近,這直接影響觀察者對不同類別間的區(qū)分,而面向類別的可視化方法對每組數(shù)據(jù)的顯示結(jié)果都充分利用了已知的類別信息,因此在對不同類別間的視覺區(qū)分中更具優(yōu)勢。