本發(fā)明涉及遙感圖像分類技術(shù),具體的說,涉及一種針對(duì)高分辨率多光譜遙感圖像的地表覆蓋分類技術(shù)。
背景技術(shù):
遙感影像分類是利用計(jì)算機(jī)通過對(duì)遙感影像中的各類地物的光譜信息和空間信息進(jìn)行分析,選擇特征,將影像中每個(gè)像元按照某種規(guī)則或算法劃分為不同的類別的過程。遙感分類是從遙感圖像上獲取信息的重要手段,是遙感技術(shù)應(yīng)用中的熱點(diǎn)研究方向,每年都會(huì)有新的分類方法被提出。
地表覆蓋(landcover)是指地球表面各種物質(zhì)類型及其自然屬性與特征的綜合體。由于其空間分布直接影響著地球表面的物質(zhì)和能量循環(huán)過程,且時(shí)間變化綜合地反映著人類活動(dòng)和氣候變化對(duì)自然環(huán)境的影響,近年來國(guó)際社會(huì)一直致力于利用空間遙感技術(shù)研究全球地表覆蓋及其變化。迄今僅有美國(guó)和歐盟完成了空間分辨率為1公里和300米的全球地表覆蓋數(shù)據(jù)產(chǎn)品,但其總體精度較低,分類體系和時(shí)空分辨率均難以有效滿足全球變化與地球系統(tǒng)研究的需求。我國(guó)目前很多機(jī)構(gòu)都在開展利用高分辨率遙感衛(wèi)星數(shù)據(jù)進(jìn)行地表覆蓋制圖的研究。例如國(guó)家基礎(chǔ)地理信息中心牽頭的863重點(diǎn)項(xiàng)目“全球地表覆蓋遙感制圖與關(guān)鍵技術(shù)研究”首次以30米空間分辨率的多光譜衛(wèi)星圖像制作了全球地表覆蓋分類圖,在地表覆蓋分類工程化制圖方面積累了經(jīng)驗(yàn)。
dlg(digitallinegraphic)數(shù)字規(guī)劃地圖是保存地圖要素的矢量數(shù)據(jù)集,我國(guó)的dlg數(shù)據(jù)庫(kù)基本以《1∶2.5萬、1∶5萬、1∶10萬地形圖圖式》(gb12342-90)為標(biāo)準(zhǔn)制作,dlg數(shù)據(jù)庫(kù)中的基本元素是點(diǎn)、線、面,最基本的顯示也是點(diǎn)、線、有色或無色填充面,其要素內(nèi)容參照矢量地形數(shù)據(jù)生產(chǎn)技術(shù)規(guī)定。其中1∶5萬dlg數(shù)據(jù)庫(kù)是我國(guó)迄今為止現(xiàn)勢(shì)性最強(qiáng)、功能最完備、最具權(quán)威性的國(guó)家級(jí)數(shù)字地形圖數(shù)據(jù)庫(kù),它包含了政區(qū)、水系、居民地、交通、測(cè)量控制點(diǎn)、地貌等要素內(nèi)容以及它們的屬性信息,1∶5萬dlg數(shù)據(jù)庫(kù)是以1∶5萬地形圖為主要數(shù)據(jù)源,選取相對(duì)主要的要素內(nèi)容,應(yīng)用spot衛(wèi)星影像、航空影像、車載gps采集的國(guó)省道數(shù)據(jù)、地名數(shù)據(jù)成果等方法來對(duì)數(shù)據(jù)內(nèi)容進(jìn)行更新。1∶5萬地形圖是進(jìn)行工程項(xiàng)目可行性研究和規(guī)劃不可缺少的基礎(chǔ)圖件,是編制更小比例尺地形圖或?qū)n}地圖的基礎(chǔ)資料。利用1∶5萬dlg數(shù)據(jù)庫(kù)進(jìn)行地表覆蓋分類具有成本低、成圖周期短、工作效率高等優(yōu)勢(shì)。
目前大區(qū)域的地表覆蓋分類制圖過程仍然是需要復(fù)雜的人機(jī)交互,工作量大,如何提高遙感分類的自動(dòng)化程度、提高地表覆蓋分類制圖的工作效率成為遙感分類方法的研究的一個(gè)課題,尤其是近年來國(guó)產(chǎn)高分辨率遙感衛(wèi)星的發(fā)射進(jìn)入井噴期,面臨對(duì)海量遙感數(shù)據(jù)進(jìn)行工程化處理的情況下,有關(guān)提高遙感地表覆蓋分類工作效率的研究變得非常迫切。本發(fā)明的出發(fā)點(diǎn)是利用歷史積累的dlg數(shù)據(jù)庫(kù)提高對(duì)高分辨率遙感圖像地表覆蓋分類的效率。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是針對(duì)遙感地表覆蓋分類應(yīng)用,提供一種dlg數(shù)據(jù)輔助分類技術(shù),特別是對(duì)于中國(guó)高分辨率全國(guó)地表覆蓋數(shù)據(jù)產(chǎn)品的生產(chǎn),提供一種有效利用歷史dlg數(shù)據(jù)輔助地表覆蓋分類的技術(shù)流程。本技術(shù)基于現(xiàn)有的遙感圖像分割與分類算法,根據(jù)目前中國(guó)對(duì)生產(chǎn)高分辨率地表覆蓋數(shù)據(jù)產(chǎn)品的需求、現(xiàn)有dlg數(shù)據(jù)積累、以及近年來國(guó)產(chǎn)高分辨率多光譜遙感影像數(shù)據(jù)大量獲取的現(xiàn)狀定制的地表覆蓋分類算法流程。
本發(fā)明的基本思路為:將高分辨率多光譜遙感圖像作為地表覆蓋分類的對(duì)象,將同區(qū)域的最新dlg數(shù)據(jù)作為分類的輔助數(shù)據(jù),首先對(duì)待分類圖像進(jìn)行超像素分割,劃分成大量斑塊,并根據(jù)待分類的類別特性選取dlg數(shù)據(jù)中的多邊形面狀要素,根據(jù)這些多邊形將待分類圖像的斑塊劃分為多邊形內(nèi)的已確定類別斑塊區(qū)域與多邊形外的未確定類別斑塊區(qū)域兩部分,然后在已確定類別區(qū)域內(nèi)自動(dòng)選取待分類各類別樣本斑塊,并利用支持向量機(jī)分類方法(svm)對(duì)樣本進(jìn)行訓(xùn)練獲取分類預(yù)測(cè)模型,最后利用訓(xùn)練得到的預(yù)測(cè)模型對(duì)未確定類別區(qū)域的斑塊進(jìn)行分類,得到地表覆蓋分類結(jié)果。
所述的高分辨率多光譜遙感圖像,數(shù)據(jù)獲取的平臺(tái)可以是衛(wèi)星、無人機(jī),空間分辨率優(yōu)于30米,波段至少包含r、g、b三個(gè)波段。同區(qū)域的dlg數(shù)據(jù)要求至少覆蓋待分類圖像地理覆蓋區(qū)域的一半,并且包含的多邊形面狀要素覆蓋所有待分類類別。待分類圖像獲取時(shí)間與dlg數(shù)據(jù)制圖時(shí)間盡量接近,兩者相差年份過大,則需要檢查地表覆蓋變化區(qū)域的大小,保證dlg數(shù)據(jù)已確定類別的多邊形面狀區(qū)域內(nèi)對(duì)應(yīng)的待分類圖像區(qū)域類別是對(duì)應(yīng)的。
本發(fā)明的技術(shù)方案提供的將dlg數(shù)據(jù)用于高分辨率遙感圖像地表覆蓋分類的方法,其特征在于包括以下實(shí)施步驟:
a對(duì)待分類圖像進(jìn)行分割,并對(duì)分割斑塊編號(hào),計(jì)算待分類圖像的紋理矩陣,統(tǒng)計(jì)分割斑塊的光譜與紋理特征向量作為分類樣本;
b同區(qū)域dlg數(shù)據(jù)多邊形面狀要素與地表覆蓋分類類別對(duì)應(yīng),矢量數(shù)據(jù)轉(zhuǎn)柵格圖像;
c根據(jù)dlg柵格圖像與分割圖像將分類樣本劃分為訓(xùn)練樣本與待分類樣本兩類;
d采用支持向量機(jī)分類(svm)方法對(duì)訓(xùn)練樣本進(jìn)行訓(xùn)練,樣本篩選與參數(shù)優(yōu)選;
e利用訓(xùn)練得到的svm模型對(duì)待分類樣本進(jìn)行分類,保留概率高的分類樣本,低概率分類樣本保持待分類類別;
f對(duì)剩余待分類樣本賦予鄰接斑塊的類別,輸出最終地表覆蓋分類圖。
上述實(shí)施步驟的特征在于:
步驟a中所述對(duì)待分類圖像進(jìn)行分割,采用slic(simplelineariterativeclustering)超像素分割算法,并采用層次區(qū)域合并(hierarchicalstepwiseregionmerging)算法對(duì)分割斑塊進(jìn)行整合;所述計(jì)算待分類圖像的紋理矩陣,指通過先計(jì)算灰度共生矩陣,再在灰度共生矩陣的基礎(chǔ)上計(jì)算由能量、熵、對(duì)比度三個(gè)特征量所表示的紋理特征;所述統(tǒng)計(jì)分割斑塊的光譜與紋理特征向量作為分類樣本,是統(tǒng)計(jì)斑塊內(nèi)所有像素對(duì)應(yīng)到原始待分類圖像的每個(gè)波段的平均像素值與紋理圖像的能量、熵、對(duì)比度平均值構(gòu)成的超像素向量。
步驟b中所述的同區(qū)域dlg數(shù)據(jù)多邊形面狀要素與地表覆蓋分類類別對(duì)應(yīng),是根據(jù)dlg數(shù)據(jù)具體的要素類別與地表覆蓋分類的類別體系確定;所述的矢量數(shù)據(jù)轉(zhuǎn)柵格圖像,是將dlg矢量數(shù)據(jù)轉(zhuǎn)化為和待分類圖像像素尺寸、分辨率、地圖投影一致的柵格圖像,對(duì)有對(duì)應(yīng)類別的多邊形面狀要素,多邊形區(qū)域內(nèi)像素值設(shè)為地表覆蓋分類類別值,對(duì)未確定類別的多邊形區(qū)域外,像素值設(shè)為背景值,一般設(shè)為0。
步驟c中所述的根據(jù)dlg柵格圖像與分割圖像將分類樣本劃分為訓(xùn)練樣本與待分類樣本兩類,具體實(shí)現(xiàn)是統(tǒng)計(jì)每個(gè)分割斑塊內(nèi)對(duì)應(yīng)到dlg柵格圖像中的不同類別所含的像素個(gè)數(shù),如果超過半數(shù)的像素對(duì)應(yīng)到某一類別,則將該斑塊對(duì)應(yīng)的樣本劃分為該類別,并作為訓(xùn)練樣本,否則該樣本劃分為待分類樣本。
步驟d中所述的采用支持向量機(jī)分類(svm)方法對(duì)訓(xùn)練樣本進(jìn)行訓(xùn)練,使用臺(tái)灣大學(xué)林智仁等開發(fā)svm模式識(shí)別與回歸軟件包libsvm,采用c-svc分類,核函數(shù)采用rbf核;所述樣本篩選與參數(shù)優(yōu)選,具體實(shí)現(xiàn)是首先對(duì)歸一化到[1-,1]的訓(xùn)練樣本進(jìn)行第一次訓(xùn)練,得到一個(gè)svm模型;然后利用該svm模型對(duì)歸一化訓(xùn)練樣本進(jìn)行分類,并輸出每個(gè)訓(xùn)練樣本對(duì)于各分類類別的隸屬度,也就是概率,樣本篩選是去除隸屬于最高概率類別的值低于一定閾值的樣本,閾值取值范圍[0.5,0.7];最后對(duì)篩選后的樣本再次進(jìn)行訓(xùn)練,并采用交叉驗(yàn)證選擇最佳參數(shù)c與g,使得訓(xùn)練的svm模型對(duì)篩選后的樣本分類精度盡量高,比較第一次訓(xùn)練與優(yōu)選參數(shù)c與g后得到的訓(xùn)練模型,選擇精度較高的分類模型作為最終分類模型。
步驟e中所述的保留概率高的分類樣本,采用的閾值范圍為[0.5,0.7],具體閾值范圍根據(jù)待分類樣本分類結(jié)果的概率分布進(jìn)行調(diào)整,使得剩余的待分類樣本數(shù)量不超過分類前所有待分類樣本的四分之一的條件下,閾值取值盡量高。
步驟f中所述的對(duì)剩余待分類樣本賦予鄰接斑塊的類別,具體是對(duì)所有剩余待分類樣本對(duì)應(yīng)分割斑塊,查找否與已確定類別的斑塊鄰接,若有則將鄰接邊緣像素最多的斑塊所在類別賦予待分類類別的斑塊,循環(huán)直到所有待分類類別斑塊都有確定類別;所述的輸出最終地表覆蓋分類圖,所有像素都有確定的類別值,符合地表覆蓋分類數(shù)據(jù)產(chǎn)品特性。
本發(fā)明與現(xiàn)有技術(shù)相比有如下特點(diǎn):本發(fā)明提供了一種將dlg數(shù)據(jù)用于高分辨率遙感圖像地表覆蓋分類的解決方案,通過將dlg數(shù)據(jù)中的多邊形面狀要素對(duì)應(yīng)到地表覆蓋分類體系中的部分類別,利用超像素分割得到的斑塊作為分類樣本的統(tǒng)計(jì)單元,樣本向量針對(duì)高分辨率多光譜遙感圖像的特征,結(jié)合了光譜信息與紋理信息,采用svm分類方法對(duì)已確定類別樣本進(jìn)行訓(xùn)練,并用訓(xùn)練的模型對(duì)未確定類別樣本進(jìn)行分類。本方案利用我國(guó)現(xiàn)有豐富的dlg歷史數(shù)據(jù)源,服務(wù)于當(dāng)前我國(guó)高分辨率遙感地表覆蓋分類制圖需求,有著明確的技術(shù)開發(fā)需求與迫切性。本發(fā)明算法自動(dòng)化程度高,處理過程無需過多人機(jī)交互,用戶僅需在分類結(jié)果上進(jìn)行進(jìn)一步的修編獲得最終的地表覆蓋分類產(chǎn)品,極大地提高了工程化生產(chǎn)全國(guó)地表覆蓋分類產(chǎn)品的效率。本發(fā)明涉及的關(guān)鍵分類步驟采用成熟的libsvm軟件包實(shí)現(xiàn),具有較高的穩(wěn)定性與適用性。對(duì)于高分辨率遙感圖像地表覆蓋分類產(chǎn)品的生產(chǎn)提供了關(guān)鍵的技術(shù)支撐。
附圖說明:
圖1是將dlg數(shù)據(jù)用于高分辨率遙感圖像地表覆蓋分類的流程圖;
圖2是dlg數(shù)據(jù)多邊形面狀要素與分類類別對(duì)應(yīng)并柵格化的圖像示意圖;
圖3是超分辨率分割結(jié)果與合并結(jié)果示意圖;
圖4是層次區(qū)域合并示意圖;
圖5是地表覆蓋分類結(jié)果圖像示意圖。
具體實(shí)施方式:
本發(fā)明實(shí)現(xiàn)將dlg數(shù)據(jù)用于高分辨率遙感圖像地表覆蓋分類的流程如圖1所示,現(xiàn)結(jié)合附圖對(duì)其具體實(shí)施方式進(jìn)行描述。附圖1所示的流程中,數(shù)據(jù)單元編號(hào)從a到j(luò),處理單元編號(hào)從1到9。各部分具體實(shí)施細(xì)節(jié)如下:
數(shù)據(jù)單元a.dlg矢量數(shù)據(jù),要求至少覆蓋待分類圖像地理覆蓋區(qū)域的一半,并且包含的多邊形面狀要素覆蓋所有待分類類別。
數(shù)據(jù)單元b.高分辨率多光譜圖像,數(shù)據(jù)獲取的平臺(tái)可以是衛(wèi)星、無人機(jī),空間分辨率優(yōu)于30米,波段至少包含r、g、b三個(gè)波段,如果包含近紅外波段,則可以進(jìn)一步計(jì)算歸一化植被指數(shù)(ndvi)作為植被類別判斷參考。
處理單元1.類別對(duì)應(yīng),是根據(jù)dlg數(shù)據(jù)具體的要素類別與地表覆蓋分類的類別體系確定,例如dlg數(shù)據(jù)中的某河流、某湖泊多邊形面狀要素劃分到地表覆蓋分類體系中的水體,dlg數(shù)據(jù)中的某工廠、某道路多邊形面狀要素劃分到地表覆蓋分類體系中的建筑區(qū),等等。
處理單元2.矢量轉(zhuǎn)柵格,依據(jù)待分類圖像。是根據(jù)待分類圖像的地理范圍、分辨率、地圖投影,將dlg矢量數(shù)據(jù)轉(zhuǎn)化為和待分類圖像像素尺寸一致的柵格圖像,對(duì)有對(duì)應(yīng)類別的多邊形面狀要素,多邊形區(qū)域內(nèi)像素值設(shè)為地表覆蓋分類類別值,對(duì)未確定類別的多邊形區(qū)域外,像素值設(shè)為背景值,一般為0值。dlg矢量數(shù)據(jù)轉(zhuǎn)轉(zhuǎn)柵格圖像可根據(jù)dlg數(shù)據(jù)中面狀要素與地表覆蓋分類類別的對(duì)應(yīng)關(guān)系編寫專門的代碼完成,實(shí)現(xiàn)數(shù)據(jù)的批量轉(zhuǎn)換。同時(shí)考慮到工程生產(chǎn)中dlg數(shù)據(jù)的復(fù)雜性與地表覆蓋的多樣性,很多情況下需要對(duì)dlg數(shù)據(jù)中的面狀要素進(jìn)行人工篩選,只將部分符合地表覆蓋分類的面狀要素對(duì)應(yīng)到地表覆蓋分類的類別,這種情況下可以利用商業(yè)的地理信息系統(tǒng)軟件arcgis完成靈活的dlg要素篩選與矢量柵格化轉(zhuǎn)換。dlg數(shù)據(jù)多邊形面狀要素與分類類別對(duì)應(yīng)并柵格化的圖像示意圖見圖2,其中柵格化后的dlg圖像中黑色部分為待分類區(qū)域。
數(shù)據(jù)單元e.dlg柵格圖。通過矢量轉(zhuǎn)柵格得到的結(jié)果圖像,圖像中待分類的區(qū)域像素值為0,已分類的區(qū)域像素值為具體的類別值,保存為外部臨時(shí)文件,數(shù)據(jù)存儲(chǔ)格式為byte型的8位柵格tif圖像,像素尺寸、地理坐標(biāo)與地圖投影與原始待分類圖像相同。
處理單元3.超像素分割,對(duì)于待分類的高分辨率多光譜遙感圖像進(jìn)行分割、合并、編號(hào)處理,形成編號(hào)的斑塊數(shù)據(jù),后續(xù)的分類操作將以超像素代表的斑塊為待分類的樣本。
超像素概念是2003年xiaofengren提出和發(fā)展起來的圖像分割技術(shù),是指具有相似顏色、紋理等特征的像素構(gòu)成的不規(guī)則像素塊。它利用像素之間特征的相似性將像素分組,用少量的超像素代替所有像素來表達(dá)圖片特征,降低了圖像后處理的復(fù)雜度,目前已經(jīng)廣泛用于圖像分割、姿勢(shì)估計(jì)、目標(biāo)跟蹤、目標(biāo)識(shí)別等計(jì)算機(jī)視覺應(yīng)用。常見的超像素分割方法有turbopixel、slic(simplelineariterativeclustering)、ncut、graph-based、watershed(marker-basedwatershed)、meanshift等等。這里采用slic算法,理由是相比其他的超像素分割方法,slic在運(yùn)行速度、生成超像素的緊湊度、輪廓保持方面都比較理想,且參數(shù)設(shè)置簡(jiǎn)單。
基于slic算法的思想,整個(gè)分割、合并、編號(hào)處理具體實(shí)現(xiàn)的步驟如下:
1.slic超像素分割。首先初始化種子點(diǎn):按照設(shè)定的超像素平均尺寸大小,在圖像內(nèi)均勻的分配種子點(diǎn)。假設(shè)超像素期望尺寸為k個(gè)像素,則對(duì)于長(zhǎng)m像素、寬n像素的圖像,網(wǎng)格化種子點(diǎn)的布置數(shù)量為(m/k)×(n/k)。然后擾亂種子點(diǎn)(perturbseeds),在種子點(diǎn)的n×n(n=3)鄰域內(nèi)計(jì)算所有像素點(diǎn)的梯度值,將種子點(diǎn)移到該鄰域內(nèi)梯度最小的地方。這樣可以避免種子點(diǎn)落在梯度較大的輪廓邊界上,以免影響后續(xù)聚類效果。在每個(gè)種子點(diǎn)周圍的鄰域內(nèi)為每個(gè)像素點(diǎn)分配類標(biāo)簽。若期望的超像素尺寸為k×k,則搜索范圍為2k×2k。之后計(jì)算距離度量,包括顏色距離和空間距離,對(duì)于每個(gè)搜索到的像素點(diǎn),分別計(jì)算它和該種子點(diǎn)的距離。距離計(jì)算公式如下:
其中,dc為顏色距離,ds為空間距離,s為類內(nèi)最大空間距離,可取值s=sqrt(n/k),c為最大顏色距離,取值為固定常數(shù),取值范圍[1,40],一般取10。由于每個(gè)像素點(diǎn)都會(huì)被多個(gè)種子點(diǎn)搜索到,所以每個(gè)像素點(diǎn)都會(huì)有一個(gè)與周圍種子點(diǎn)的距離,取最小值對(duì)應(yīng)的種子點(diǎn)作為該像素點(diǎn)的聚類中心。分割過程需要迭代優(yōu)化,理論上上述步驟不斷迭代直到誤差收斂,統(tǒng)計(jì)上10次迭代對(duì)絕大部分圖片都可以得到較理想效果,所以一般迭代次數(shù)取10。最后對(duì)分割的結(jié)果進(jìn)行粗合并。經(jīng)過上述計(jì)算得到的結(jié)果會(huì)出現(xiàn)多連通、超像素尺寸過小,單個(gè)超像素被切割成多個(gè)不連續(xù)超像素等情況,通過粗合并解決這些問題。遍歷所有超像素,將不連續(xù)的超像素、尺寸過小超像素重新分配給鄰近的超像素,遍歷過的像素點(diǎn)分配給相應(yīng)的標(biāo)簽,直到所有點(diǎn)處理完畢為止。
2.超像素合并。超像素合并是實(shí)現(xiàn)比較精細(xì)的分割重要方法,尤其是對(duì)于遙感圖像分類,超像素合并可以slic分割結(jié)果中將零散的、相鄰的、鄰接部分不存在邊界的超像素斑塊合并,這對(duì)于后續(xù)分類結(jié)果的精度提升是非常重要的。這里采用層次區(qū)域合并(hierarchicalstepwiseregionmerging)算法,層次區(qū)域合并精合并前后比較參見圖3。層次區(qū)域合并采用k.harris的經(jīng)典方法(k.harris,1998ieeetip,hybridimagesegmentationusingwatershedandfastregionmerging),先構(gòu)建區(qū)域鄰接圖,根據(jù)區(qū)域鄰接關(guān)系構(gòu)建的區(qū)域鄰接圖示例見圖4。對(duì)于相鄰的兩個(gè)斑塊區(qū)域,鄰接邊的權(quán)重計(jì)算公式為:
其中ni與nj表示斑塊i與斑塊j的像素?cái)?shù)量,
每次斑塊合并都會(huì)導(dǎo)致整圖的誤差增加,何時(shí)終止區(qū)域合并過程對(duì)于后續(xù)斑塊分類影響非常大,這里將終止合并的閾值作為關(guān)鍵的設(shè)置參數(shù),對(duì)于不同影像的精確分割,如果對(duì)最終的分割合并結(jié)果不滿意,則需要手動(dòng)設(shè)置合并閾值的大小。為了方便該閾值的設(shè)定,我們采用的方法是設(shè)計(jì)專門的分割用戶交互軟件圖像顯示界面,用戶通過鼠標(biāo)拖拽閾值設(shè)定滑塊鍵,對(duì)整幅圖像局部區(qū)域進(jìn)行快速的分割結(jié)果預(yù)覽,根據(jù)預(yù)覽結(jié)果決定閾值參數(shù)的數(shù)值。
3.斑塊編號(hào)。斑塊編號(hào)是對(duì)分割合并后的每個(gè)斑塊所有像素賦予一個(gè)連續(xù)的整數(shù)值的過程,斑塊編號(hào)的目的是便于后續(xù)分類標(biāo)記編程實(shí)現(xiàn)。斑塊編號(hào)從300開始,編號(hào)順序從左到右,從上到下。例如一幅圖像被分割為1234個(gè)斑塊,則斑塊編號(hào)后,斑塊編號(hào)的最小值為300,最大值為1533,編號(hào)為300的斑塊里所有像素的值為300。
由于遙感圖像像素尺寸通常較大,長(zhǎng)寬普遍超過1萬個(gè)像素,對(duì)遙感圖像的處理一般不會(huì)將整個(gè)圖像全部讀入內(nèi)存處理,而是采用分塊處理的方式,將圖像按照一定的塊大小,比如2048×2048像素,分成網(wǎng)格,按照從左到右,從上到下的順序分塊處理。slic超像素分割與超像素合并的計(jì)算便是以分塊為單位處理的,而斑塊編號(hào)則是對(duì)整幅圖像進(jìn)行的。
在后續(xù)的分類中,將像素值超過300的斑塊作為待分類斑塊,確定類別的斑塊則賦予具體的類別值,由于分類結(jié)果圖像采用byte型8位數(shù)據(jù)存儲(chǔ),數(shù)值不超過255,所以確定類別的斑塊像素值不會(huì)與待分類類別編號(hào)沖突。
數(shù)據(jù)單元c.分割圖像。通過slic超像素分割、超像素合并與斑塊編號(hào)得到的結(jié)果圖像,保存為外部臨時(shí)文件,數(shù)據(jù)存儲(chǔ)格式為int型的32位柵格tif圖像,像素尺寸、地理坐標(biāo)與地圖投影與原始待分類圖像相同。
處理單元4.計(jì)算紋理。通過灰度共生矩陣(gray-levelco-occurrencematrix)灰度的空間相關(guān)特性描述紋理,具體包括能量、熵、對(duì)比度。
首先將多波段的待分類遙感圖像轉(zhuǎn)化為單波段灰度圖像,采用固定參數(shù),將r、g、b三個(gè)波段乘上固定的轉(zhuǎn)換系數(shù)并相加得到,公式為r×0.299+g×0.587+b×0.114。
在灰度圖像上計(jì)算灰度共生矩陣,該矩陣定義為像素對(duì)的聯(lián)合分布概率,它反映圖像灰度在相鄰的方向、相鄰間隔、變化幅度的綜合信息,以及相同的灰度級(jí)像素之間的位置分布特征,是計(jì)算紋理特征的基礎(chǔ)。設(shè)f(x,y)為一幅數(shù)字圖像,其大小為m×n,灰度級(jí)別為ng,這里采用16個(gè)灰度級(jí)別,則滿足一定空間關(guān)系的灰度共生矩陣為:
g(i,j)=#(x1,y1),(x2,y2)∈m×n|f(x1,y1)=i,f(x2,y2)=j(luò)}
其中#(x)表示集合x中的元素個(gè)數(shù),g為ng×ng的矩陣,若(x1,y1)與(x2,y2)間距離為d,兩者與坐標(biāo)橫軸的夾角為θ,則可以得到各種間距及角度的灰度共生矩陣(i,j,d,θ)。其中元素(i,j)的值表示一個(gè)灰度為i,另一個(gè)灰度為j的兩個(gè)相距為d的像素對(duì)在角的方向上出現(xiàn)的次數(shù)。這里d取9,θ取定義水平方向的0值。
在計(jì)算得到灰度共生矩陣之后,便可在此基礎(chǔ)上計(jì)算紋理特征量,這里包括能量、熵、對(duì)比度。
能量是灰度共生矩陣各元素值的平方和,是對(duì)圖像紋理的灰度變化穩(wěn)定程度的度量,反應(yīng)了圖像灰度分布均勻程度和紋理粗細(xì)度。能量值大表明當(dāng)前紋理是一種規(guī)則變化較為穩(wěn)定的紋理。計(jì)算公式:
熵是圖像包含信息量的隨機(jī)性度量。當(dāng)共生矩陣中所有值均相等或者像素值表現(xiàn)出最大的隨機(jī)性時(shí),熵最大;因此熵值表明了圖像灰度分布的復(fù)雜程度,熵值越大,圖像越復(fù)雜。計(jì)算公式:
對(duì)比度度量矩陣的值是如何分布和圖像中局部變化的多少,反應(yīng)了圖像的清晰度和紋理的溝紋深淺。紋理的溝紋越深,反差越大,效果清晰;反之,對(duì)比值小,則溝紋淺,效果模糊。計(jì)算公式:
數(shù)據(jù)單元d.紋理圖像。通過計(jì)算紋理得到的結(jié)果圖像,包含記錄能量、熵、對(duì)比度的三個(gè)波段,保存為外部臨時(shí)文件,數(shù)據(jù)存儲(chǔ)格式為float型的32位柵格tif圖像,像素尺寸、地理坐標(biāo)與地圖投影與原始待分類圖像相同。
處理單元5.計(jì)算斑塊樣本。在本發(fā)明中,分類的樣本通過統(tǒng)計(jì)每個(gè)編號(hào)斑塊的特征值獲得,是一種自定義的超像素向量值,該值由像素的光譜信息與紋理信息共同組成。斑塊樣本的具體計(jì)算方式是利用數(shù)據(jù)單元c編號(hào)的分割圖像,將每個(gè)斑塊對(duì)應(yīng)到原始待分類圖像與數(shù)據(jù)單元d的紋理圖像中,統(tǒng)計(jì)斑塊內(nèi)所有像素對(duì)應(yīng)到原始待分類圖像的每個(gè)波段的平均像素值與紋理圖像的能量、熵、對(duì)比度平均值。斑塊樣本值,即斑塊的超像素向量,作為后續(xù)分類的樣本。超像素向量包含元素的個(gè)數(shù)等于原始待分類圖像波段數(shù)與紋理圖像波段數(shù)的和。
斑塊樣本的具體實(shí)現(xiàn)方法是:首先定義一個(gè)存儲(chǔ)斑塊樣本的數(shù)據(jù)結(jié)構(gòu),包括斑塊樣本的編號(hào)、分類類別、斑塊所含像素?cái)?shù)量、斑塊對(duì)應(yīng)到原始待分類圖像中各波段的像素平均值、斑塊對(duì)應(yīng)到紋理圖像中各波段的平均值;然后申請(qǐng)一個(gè)存儲(chǔ)該數(shù)據(jù)結(jié)構(gòu)的數(shù)組,數(shù)組所含元素的個(gè)數(shù)為分割斑塊的總數(shù);最后通過統(tǒng)計(jì)所有斑塊的編號(hào)、像素?cái)?shù)目、各波段光譜均值與紋理均值,完成斑塊樣本的初始化。由于數(shù)據(jù)單元c的分割圖像每個(gè)斑塊都有不同的編號(hào),且編號(hào)即像素值,所以對(duì)斑塊樣本的初始化統(tǒng)計(jì)可簡(jiǎn)單地通過同時(shí)對(duì)分割圖像、原始待分類圖像與紋理圖像進(jìn)行一遍逐像素遍歷即可。遍歷后得到每個(gè)斑塊樣本的像素?cái)?shù)目、各波段光譜累計(jì)值與紋理累計(jì)值,再對(duì)斑塊樣本數(shù)組進(jìn)行一遍遍歷,將各斑塊各波段光譜累計(jì)值與紋理累計(jì)值除以像素?cái)?shù)目,得到各波段光譜與紋理的均值。
數(shù)據(jù)單元f.樣本數(shù)據(jù)。通過計(jì)算斑塊樣本得到的數(shù)組,包含斑塊樣本的編號(hào)、分類類別、斑塊所含像素?cái)?shù)量、斑塊對(duì)應(yīng)到原始待分類圖像中各波段的像素平均值、斑塊對(duì)應(yīng)到紋理圖像中各波段的平均值信息,保存在內(nèi)存中。
處理單元6.劃分樣本。根據(jù)數(shù)據(jù)單元e.dlg柵格圖與數(shù)據(jù)單元c.分割圖像,將數(shù)據(jù)單元f.樣本數(shù)據(jù)劃分為已分類與待分類兩個(gè)類別,并按照后續(xù)分類的需求,將已分類與待分類兩個(gè)類別的樣本按照固定格式輸出到外部文件。
劃分樣本的具體實(shí)現(xiàn)過程是:首先根據(jù)待分類類別數(shù)定義一個(gè)存儲(chǔ)數(shù)據(jù)結(jié)構(gòu),包括斑塊樣本的編號(hào)與每個(gè)分類類別所包含的像素?cái)?shù)目;然后申請(qǐng)一個(gè)存儲(chǔ)該數(shù)據(jù)結(jié)構(gòu)的數(shù)組,數(shù)組所含元素的個(gè)數(shù)為分割斑塊的總數(shù);最后通過統(tǒng)計(jì)所有斑塊的中每個(gè)分類類別所包含的像素?cái)?shù)目,將所含像素?cái)?shù)量最多的類別作為該編號(hào)下樣本的分類類別,賦值給數(shù)據(jù)單元f.樣本數(shù)據(jù)中對(duì)應(yīng)編號(hào)的樣本。由于數(shù)據(jù)單元c的分割圖像每個(gè)斑塊都有不同的編號(hào),且編號(hào)即像素值,可逐像素對(duì)應(yīng)到數(shù)據(jù)單元e.dlg柵格圖像中,根據(jù)dlg柵格圖像的像素值確定像素對(duì)應(yīng)類別,所以劃分樣本可簡(jiǎn)單地通過同時(shí)對(duì)分割圖像與dlg柵格圖像進(jìn)行一遍逐像素遍歷即可。遍歷后得到每個(gè)斑塊樣本所含各分類類別的像素?cái)?shù)目,再對(duì)斑塊樣本數(shù)組進(jìn)行一遍遍歷,得到包含像素?cái)?shù)量最多的類別值。
數(shù)據(jù)單元g.訓(xùn)練樣本。通過劃分樣本得到的已分類樣本,分類類別編號(hào)為實(shí)際類別值,數(shù)值小于255,按照后續(xù)分類處理的輸入要求,按照固定格式保存的外部文件,存儲(chǔ)文件類型為txt。
數(shù)據(jù)單元h.待分類樣本。通過劃分樣本得到的待分類樣本,類別編號(hào)保持與數(shù)據(jù)單元f.樣本數(shù)據(jù)相同,即為數(shù)據(jù)單元c.分割圖像對(duì)應(yīng)斑塊的編號(hào)值,數(shù)值大于300,按照后續(xù)分類處理的輸入要求,按照固定格式保存的外部文件,存儲(chǔ)文件類型為txt。
處理單元7.svm模型訓(xùn)練。包含參數(shù)優(yōu)選與樣本篩選兩部分,采用的工具是libsvm。
libsvm是臺(tái)灣大學(xué)林智仁(chih-jenlin)博士等開發(fā)設(shè)計(jì)的一個(gè)操作簡(jiǎn)單、易于使用、快速有效的通用svm軟件包,可以解決分類問題(c-svc、n-svc)、回歸問題(e-svr、n-svr)以及分布估計(jì)(one-class-svm)等問題,提供了線性、多項(xiàng)式、徑向基和s形函數(shù)四種常用的核函數(shù)供選擇,可以有效地解決多類問題、交叉驗(yàn)證選擇參數(shù)、對(duì)不平衡樣本加權(quán)、多類問題的概率估計(jì)等。libsvm是一個(gè)開源的軟件包,可以從網(wǎng)站http://www.csie.ntu.edu.tw/~cjlin/處獲得。軟件包不僅包含libsvm的c++語言的算法源代碼,還包含python、java、r、matlab、perl、ruby、labview以及c#.net等各種語言的接口,可以在windows或unix平臺(tái)下使用。利用libsvm下載包中的c++源代碼可編譯生成可執(zhí)行文件,包括:對(duì)訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)進(jìn)行縮放操作的svmscale.exe,進(jìn)行支持向量機(jī)訓(xùn)練的svmtrain.exe,以及根據(jù)已獲得的支持向量機(jī)模型對(duì)數(shù)據(jù)集進(jìn)行預(yù)測(cè)的svmpredict.exe。
libsvm使用的一般步驟是:首先,利用svmscale.exe將數(shù)據(jù)歸一化到[-1,1];然后,采用交叉驗(yàn)證選擇最佳參數(shù)c與g;采用最佳參數(shù)c與g對(duì)整個(gè)訓(xùn)練集進(jìn)行訓(xùn)練獲取支持向量機(jī)模型;最后,利用獲取的模型進(jìn)行測(cè)試與預(yù)測(cè)。
這里使用libsvm與一般步驟不同之處在于對(duì)訓(xùn)練樣本的篩選。由于本發(fā)明中使用的訓(xùn)練樣本是通過dlg數(shù)據(jù)庫(kù)中的面狀要素對(duì)應(yīng)地表分類類別得到的,是一種粗對(duì)應(yīng),并不精確。以斑塊為單位就算超像素向量作為樣本,實(shí)際上存在很多錯(cuò)誤樣本,作為噪聲存在。在進(jìn)行參數(shù)優(yōu)選之前有必要進(jìn)行樣本篩選。樣本篩選的方法是:首先對(duì)數(shù)據(jù)單元g的訓(xùn)練樣本利用svmscale.exe歸一化到[-1,1];然后利用svmtrain.exe進(jìn)行第一次訓(xùn)練,采用c-svc分類,核函數(shù)采用rbf核,關(guān)鍵參數(shù)c與g采用默認(rèn)值,得到一個(gè)svm模型;最后將svm模型輸入svmpredict.exe,對(duì)歸一化的訓(xùn)練樣本進(jìn)行分類,并輸出每個(gè)訓(xùn)練樣本對(duì)于分類類別的隸屬度,也就是概率。樣本篩選是去除隸屬于每個(gè)類別的最高概率值低于一定閾值的樣本,閾值取值范圍[0.5,0.7]。
對(duì)篩選后的樣本再次采用svmtrain.exe進(jìn)行訓(xùn)練,采用交叉驗(yàn)證選擇最佳參數(shù)c與g,使得訓(xùn)練的svm模型對(duì)篩選后的樣本分類精度盡量高。比較第一次訓(xùn)練與優(yōu)選參數(shù)c與g后得到的訓(xùn)練模型,選擇精度較高的分類模型作為最終分類模型。
數(shù)據(jù)單元i.svm分類模型。通過svm模型訓(xùn)練得到的svm分類模型。
處理單元8.svm模型分類。利用libsvm的svmpredict.exe與數(shù)據(jù)單元i的svm分類模型,對(duì)數(shù)據(jù)單元h待分類樣本進(jìn)行分類。并輸出待分類樣本每個(gè)樣本對(duì)于各分類類別的隸屬度。
處理單元9.分類結(jié)果整合修正。對(duì)于處理單元8的svm模型分類對(duì)待分類樣本的分類結(jié)果,根據(jù)輸出待分類樣本每個(gè)樣本對(duì)于各分類類別的隸屬度,對(duì)隸屬度超過一定閾值的樣本的斑塊賦予最高概率的類別,閾值取值范圍[0.5,0.7],具體閾值范圍根據(jù)待分類樣本分類結(jié)果的概率分布進(jìn)行調(diào)整,原則是劃分為剩余的待分類斑塊的數(shù)量不超過分類前所有待分類斑塊的四分之一的前提下,閾值取值盡量高。剩余斑塊保持待分類類別。對(duì)所有剩余待分類斑塊賦予鄰接斑塊的類別,具體實(shí)現(xiàn)過程是對(duì)所有剩余待分類類別斑塊,查找否與已確定類別的斑塊鄰接,若有則將鄰接邊緣像素最多的斑塊所在類別賦予待分類類別的斑塊,循環(huán)直到所有待分類類別斑塊都有確定類別。此時(shí),對(duì)應(yīng)到內(nèi)存中的數(shù)據(jù)單元f的樣本數(shù)據(jù),樣本數(shù)組中的所有樣本都有一個(gè)地標(biāo)覆蓋分類的類別,類別值小于255。參照數(shù)據(jù)單元c的編號(hào)分割圖像,遍歷編號(hào)分割圖像的每個(gè)像素,其待分割像素值在樣本數(shù)組中都能對(duì)應(yīng)到某一樣本的地表覆蓋分類類別,利用該類別值替換編號(hào)值,便得到了最終地表覆蓋分類圖。
數(shù)據(jù)單元j.分類結(jié)果。通過上述步驟得到的地表覆蓋分類結(jié)果圖像,圖像中的像素值為具體的類別值,保存為外部臨時(shí)文件,數(shù)據(jù)存儲(chǔ)格式為byte型的8位柵格tif圖像,像素尺寸、地理坐標(biāo)與地圖投影與原始待分類圖像相同。
本發(fā)明的實(shí)例已經(jīng)在pc平臺(tái)上實(shí)現(xiàn),結(jié)合配套的圖像顯示與交互軟件界面,作為提高中國(guó)區(qū)域高分辨率遙感圖像地表覆蓋分類制圖速度的關(guān)鍵技術(shù)之一,目前已經(jīng)交付某行業(yè)部門的用戶方進(jìn)行測(cè)試與使用。圖5是本發(fā)明實(shí)驗(yàn)結(jié)果,左圖是原始待分類圖像局部,右圖是地表覆蓋分類結(jié)果的局部,右圖比較圖2的右圖dlg柵格圖像,可見待分類的黑色區(qū)域都賦予了確定類別,符合地表覆蓋分類制圖的特征。
應(yīng)當(dāng)指出,以上所述具體實(shí)施方式可以使本領(lǐng)域的技術(shù)人員更全面地理解本發(fā)明,但不以任何方式限制本發(fā)明。因此,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,仍然可以對(duì)本發(fā)明進(jìn)行修改或者等同替換;而一切不脫離本發(fā)明的精神和技術(shù)實(shí)質(zhì)的技術(shù)方案及其改進(jìn),其均應(yīng)涵蓋在本發(fā)明專利的保護(hù)范圍當(dāng)中。