專利名稱::一種高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法
技術領域:
:本發(fā)明涉及一種高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,屬于高光譜數(shù)據(jù)處理方法與應用
技術領域:
,適用于高光譜數(shù)據(jù)監(jiān)督分類的理論方法和應用技術研咒。
背景技術:
:高光譜遙感數(shù)據(jù)監(jiān)督分類的方法主要包括兩大類基于光譜特征匹配的方法和基于統(tǒng)計分析模型的方法。由于高光譜數(shù)據(jù)獲取過程中,受到大氣、地形、光照等條件的影響,使得其獲得的地物光譜特征變化較大,因此,基于光譜特征匹配的方法會出現(xiàn)不同地物之間混淆較大、不穩(wěn)定等問題,使得分類結果精度降低;基于統(tǒng)計分析模型的方法主要是對高光譜數(shù)據(jù)樣本的總體特征進行統(tǒng)計分析,根據(jù)樣本采樣點統(tǒng)計分布特征實現(xiàn)不同地物的分類。但是在統(tǒng)計分析模型建立過程中為了實現(xiàn)精確的分類,需要對樣本進行分布假設以及大量的統(tǒng)計參數(shù)實現(xiàn)分類建模。對數(shù)(Logistic)兩分類模型廣泛的應用于醫(yī)學和生物學,尤其在流行病學得到及其廣泛的應用。1989年Hosmer和Lemeshow將Logistic回歸模型的響應變量擴展到*(*>2),使得Logistic回歸模型成功應用到*(*>2)類別的分類問題。近年來隨著遙感技術的發(fā)展和數(shù)據(jù)處理的需求,Logisitc回歸模型被引入到遙感圖像分類應用中。與高斯分類模型相似,Logistic是監(jiān)督分類模型,需要訓練樣本估計模型參數(shù)。但在Logistic回歸模型中,僅僅需要對影響因變量的因素進行線性關系假設,不需要對圖像中樣本進行任何分布假設。通常情況下,需要對高光譜數(shù)據(jù)降維后才能實現(xiàn)Logistic建模,否則將帶來龐大的計算負擔,但是數(shù)據(jù)降維方法將在減少數(shù)據(jù)維數(shù)的同時丟失光譜的細節(jié)特征,從而導致相似類別的混淆。
發(fā)明內(nèi)容本發(fā)明的目的在于克服現(xiàn)有技術的不足,提供一種不需要樣本分布假設、參數(shù)估計少的高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法。本發(fā)明的技術解決方案為一種利用分形理論實現(xiàn)較少訓練樣本條件下的高精度高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,該方法主要利用分形理論和統(tǒng)計分析模型,通過計算光諳的多重分形譜參數(shù)實現(xiàn)Logistic建模,最后利用最大似然估計模型參數(shù)估計,從而實現(xiàn)高光譜數(shù)據(jù)的監(jiān)督分類。多重分形i普主要通過光譜概率測度計算和配分函數(shù)估計得到,并根據(jù)多重分形譜的特點選擇a'、"mm、"max、/(j作為Logistic建模參數(shù),從而在有效降低模型估計參數(shù)數(shù)目的同時增加類間可分性。本發(fā)明一種高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,其步驟如下(1)讀入高光譜數(shù)據(jù);(2)確定分類類別數(shù)目,并選擇訓練樣本和測試樣本;(3)計算多重分形譜參數(shù);(4)建立基于多重分形譜參數(shù)的對數(shù)回歸多類別分類模型;(5)利用極大似然估計進行模型求解;(6)利用概率最大原則進行分類,并計算分類精度。其中,步驟(1)中所述的讀入高光i普數(shù)據(jù)為X-[x"x2,…,xJ,"為像元數(shù)。其中,步驟(2)中所述的分類類別數(shù)目為J,訓練樣本和測試樣本選擇根據(jù)參考圖像和地面調(diào)查確定,且訓練樣本與測試樣本不相同。其中,步驟(3)中所述的多重分形譜/(cO計算如下首先計算光譜概率測度S柳式中,iV(。表示光譜曲線劃分為尺寸是5的一維小盒子的個數(shù),《.(。表示盒子尺寸為5時第/個小盒子內(nèi)所有光譜波段的輻亮度數(shù)值之和;然后估計配分函數(shù),配分函數(shù)a(。為光譜概率測度f(。的g階矩式中,《為權重因子,iV(。為尺度^下的盒子數(shù)目。再通過光譜概率測度計算與配分函數(shù)估計得到的尺度函數(shù)r(《)log2&(《)》,log2《+C(《)式中r(《)為尺度函數(shù)。最后,通過勒讓德(Legendre)變換/()與r(《)聯(lián)系起來,并得到如下關系式其中,《為權重因子。本發(fā)明建模過程中選擇的多重分形譜參數(shù)為其中,《'為多重分形語/(")最大值點對應的Holder指數(shù),"她和"^表示給定條件下概率奇異性的最小值和最大值,/("^)為光譜曲線上Holder指數(shù)取最小值的波段子集分形維數(shù)。其中,步驟(4)所述的基于參考類別NC建立的基于多重分形譜參數(shù)的對數(shù)回歸多類別分類模型如下戶尸WC其中,NC為參考類別,J為類別數(shù)目,j=l,2,...,J-l,S為輸入變量屬于第j個類別的概率,^、"min、"■、/K,J分別為多重分形譜參數(shù),A,為模型待估計參數(shù),j=l,2"."J-l,i=0,l,.."4。其中步驟(5)所述的利用極大似然方法進行模型參數(shù)估計過程如下對步驟(4)建立的模型進行極大似然參數(shù)估計,采用牛頓-拉臾遜(Newton-Raphson)迭代法解得M7為參考類別的Logistic模型參數(shù)的極大似然估計值為A=(U",A2,U,4),7'=1,2,../-1。其中,步驟(6)所述的分類準則為概率最大原則,即z/f(x):maxCf;(x),尸2(x),…A(;c))貝'JxeG,x屬于第/個類別的概率最大,那么就將其歸入類別G,;分類精度分析采用混淆矩陣和Kappa系數(shù)實現(xiàn)。本發(fā)明與現(xiàn)有技術相比的優(yōu)點在于克服了傳統(tǒng)的基于統(tǒng)計分析模型的高光語數(shù)據(jù)監(jiān)督分類方法參數(shù)估計多、樣本假設分布等局限,本方法利用多重分形理論和Logsitic模型,實現(xiàn)了高精度的地物類型分類。它具有以下的優(yōu)點(1)采用統(tǒng)計分析模型,解決了由于光語特征匹配高光譜遙感數(shù)據(jù)監(jiān)督分類方法受大氣、光照、地形等外界影響較大帶來的誤差增多和可靠性下降等問題;(2)利用Logistic多類別模型進行高光譜數(shù)據(jù)分類,不需要對樣本分布進行假設;(3)引入多重分形理論,建立基于多重分形參數(shù)的Logistic多類別分類模型,有效的利用了光譜曲線的差異和細節(jié)信息,并降低了模型估計參數(shù)數(shù)目、提高了類間可分性。圖1為本發(fā)明中多重分形參數(shù)"'、"min、"max、/(",)的定義示意圖;具體實施例方式為了更好的說明本發(fā)明涉及的高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,利用PHI航空高光i普數(shù)據(jù)進行江蘇方麓茶場地區(qū)農(nóng)作物精細分類。本發(fā)明一種高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,具體實現(xiàn)步驟如下(1)讀入高光譜數(shù)據(jù)讀入方麓茶場推掃高光譜成像儀(PHI)高光譜數(shù)據(jù),數(shù)據(jù)大小為210x150x64,波段區(qū)間455~805nm;(2)確定分類類別數(shù)目,并選擇訓練樣本根據(jù)參考圖像,分類類別數(shù)目為」=6,訓練樣本和測試樣本根據(jù)參考圖像獲得,具體的分類類別、訓練樣本與測試樣本如下表所示;<table>tableseeoriginaldocumentpage7</column></row><table>(3)計算多重分形譜參數(shù)首先計算光譜概率測度<formula>formulaseeoriginaldocumentpage7</formula>式中,W(。表示光譜曲線劃分為尺寸是S的一維小盒子的個數(shù),S,(。表示盒子尺寸為5時第/個小盒子內(nèi)所有光讒波段的輻亮度數(shù)值之和;然后估計配分函數(shù),配分函數(shù)a(。為光譜概率測度《(。的^階矩,=1式中,《為權重因子,A^)為尺度5下的盒子數(shù)目。再通過光譜概率測度計算與配分函數(shù)估計得到的尺度函數(shù)r(《)log2&(《)《,l。g2《+C(g)式中r(《)為尺度函數(shù)。最后,通過Legendre變換/(a)與r(《)聯(lián)系起來,并得到如下關系式<formula>formulaseeoriginaldocumentpage7</formula>其中,《為權重因子。本發(fā)明建模過程中選擇的多重分形譜參數(shù)為[">,,",,/(",)]7,其中,"'為多重分形譜/(")最大值點對應的Holder指數(shù),"隨和",表示給定條件下概率奇異性的最小值和最大值,/(,J為光譜曲線上Holder指數(shù)取最小值的波段子集分形維數(shù),各參數(shù)定義如圖l所示;(4)建立基于多重分形譜參數(shù)的Logistic多類別分類模型以水(W2)^作為參考類別,得到Logistic分類模型的判別函數(shù)如下lOg(^)=A。+A,"*+A2"min+A]"max+/^/(min)尸6尸6log(,)=A。++/52amm+A3"max+A4/("咖)(5)利用極大似然估計進行模型求解,得到的以水(W2)^作為參考類別,其余五個類別均具有一套獨立的參數(shù),得到Logistic分類模型的判別函數(shù)如下=譜".柳.-<5W.""m+S7.7脇_+"7.97氛.J《《/og^l")=-〃269+;7W9a'+277.2j。湖-+2W.卵/U(6)利用概率最大原則進行分類,并計算分類精度分類準則為概率最大原則,即,/S(x)-max(S(x),尸2(x),…A(x))則xeG,,x屬于第/個類別的概率最大,那么就將其歸入類別G,;分類精度分析采用混淆矩陣和Kappa系數(shù)實現(xiàn),如下表所示分類精度。多重分形參數(shù)Logisitc分類模型對測試樣本分類混淆矩陣8C4T6T7V2V13W2分類精度C47973000099.625%T616264000094.286%T72427301097.500%V200100240096.000%V130201970198.500%W200000譜100.00%Kappa系數(shù)0.981總體精度98.506%從利用本發(fā)明方法得到的分類結果可以看出總體分類精度達到98.506%,主要原因是經(jīng)過多重分形參數(shù)的計算,類別間的差別較明顯。水稻(C4)、茶(T7)、紅薯(V2)、及水(W2)光譜可分性較高,基于多重分形參數(shù)的Logistic監(jiān)督分類精度都在95。/。以上;對于較難區(qū)分的竹(T6)與香菜(V13),通過提取光譜曲線的多重分形參數(shù),有效的提高了地物間的可分性,建立的基于多重分形參數(shù)的Logistic監(jiān)督分類方法對竹(T6)和香菜(V13)的分類精度分別達94%與98%;多重分形譜參數(shù)的kappa系數(shù)為0.981,分類結果的一致4交高。權利要求1、一種高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,其特征在于它包含以下步驟(1)讀入高光譜數(shù)據(jù);(2)確定分類類別數(shù)目,并選擇訓練樣本和測試樣本;(3)計算多重分形譜參數(shù);(4)建立基于多重分形譜參數(shù)的對數(shù)回歸多類別分類模型;(5)利用極大似然估計進行模型求解;(6)利用概率最大原則進行分類,并計算分類精度。2、根據(jù)權利要求1所述的一種高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,其中步驟(3)計算多重分形譜參數(shù)包括[">m,","_,/("m』7,其中,"'為多重分形i普/(")最大值點對應的Holder指數(shù),"自和"^表示給定條件下概率奇異性的最小值和最大值,/("^)為光譜曲線上Holder指數(shù)取最小值的波段子集分形維數(shù)。3、根據(jù)權利要求1所述的一種高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,其中步驟(4)建立的基于多重分形譜參數(shù)的對數(shù)回歸模型為<formula>formulaseeoriginaldocumentpage2</formula>其中,NC為參考類別,J為類別數(shù)目,j=l,2,...,J-l,巧為輸入變量屬于第j個類別的概率,a'、amin、《_、/(_)分別為多重分形譜參數(shù),A,為模型待估計參數(shù),j=l,2,...,J-l,i=0,l,...,4。全文摘要一種高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,包含以下步驟(1)讀入高光譜數(shù)據(jù);(2)確定類別數(shù)目,并選擇訓練樣本和測試樣本;(3)計算多重分形譜參數(shù);(4)建立基于多重分形譜參數(shù)的對數(shù)回歸多類別分類模型;(5)利用極大似然估計進行模型求解;(6)利用概率最大原則進行分類,并計算分類精度。該方法不需要對變量的概率分布進行任何假設,并且分類器模型中需要估計的參數(shù)數(shù)目較少,通過多重分形特征增加類內(nèi)一致性的同時提高了類間的可分性。因而,該方法在訓練樣本的數(shù)量較小的情況下能夠獲得較高的分類精度。文檔編號G06K9/66GK101667253SQ200910093539公開日2010年3月10日申請日期2009年9月25日優(yōu)先權日2009年9月25日發(fā)明者娜李,牛志宇,賈國瑞,趙慧潔申請人:北京航空航天大學