專利名稱:一種遙感影像決策樹分類系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及遙感遙測技術(shù)領(lǐng)域,特別是一種遙感影像決策樹分類系統(tǒng)及方法。
背景技術(shù):
利用星載或機載傳感器可以獲取反映地球表面地物空間分布及光譜信息的遙感影像。遙感影像覆蓋范圍一般很大,通過人工目視判讀方法識別各種地物類型的空間分布并生成專題圖,需要消耗大量的人力物力,分類結(jié)果也較易受解譯者主觀因素的影響。利用計算機設(shè)備和分類系統(tǒng)對遙感影像進行計算機輔助分類不僅可避免由于人工分類主觀因素太大而引起的分類結(jié)果的非客觀性,而且可以大大提高遙感影像分類速度,從而節(jié)省大量的人力物力,提高工作效率。
決策樹分類技術(shù)是隨者數(shù)字化、網(wǎng)絡(luò)化、信息化時代的到來,在模式識別、數(shù)據(jù)挖掘領(lǐng)域應(yīng)用逐步廣泛的一種模式識別技術(shù)。這種技術(shù)已經(jīng)成功應(yīng)用于網(wǎng)絡(luò)信息的識別和搜索,字符的識別分類,醫(yī)學(xué)影像的分類識別。遙感影像分類系統(tǒng)的核心技術(shù)是分類規(guī)則的生成單元,在本系統(tǒng)中對應(yīng)的是決策樹生長與剪枝單元。國內(nèi)外現(xiàn)有遙感影像分類系統(tǒng)的分類規(guī)則生成單元主要包括平行管道法、馬氏距離法、最小距離法、最大擬然法、光譜角制圖法、神經(jīng)元網(wǎng)絡(luò)分類等,但尚未見采用決策樹的遙感影像分類系統(tǒng)。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種遙感影像決策樹分類系統(tǒng)及方法。
本發(fā)明是一種采用決策樹分類規(guī)則有監(jiān)督生成技術(shù)的遙感影像分類系統(tǒng)。將決策樹分類規(guī)則有監(jiān)督生成技術(shù)成功應(yīng)用于遙感影像分類系統(tǒng)是本方案的技術(shù)創(chuàng)新點。
本系統(tǒng)總的結(jié)構(gòu)、組成如圖1所示。該系統(tǒng)建立在計算機系統(tǒng)之上,由計算機存儲器、計算機處理器、內(nèi)存單元、顯示器等是本系統(tǒng)的基本結(jié)構(gòu)組成,是本系統(tǒng)其它結(jié)構(gòu)單元實現(xiàn)功能的基礎(chǔ)。遙感影像存儲單元、影像顯示、放縮、漫游控制單元,為訓(xùn)練樣地人機交互定義單元的功能實現(xiàn)提供了底層支持。決策樹生長與剪枝單元、決策樹精度評價單元分別完成決策樹的訓(xùn)練生成和精度評價功能。遙感影像分類處理單元利用已經(jīng)生成的決策樹對輸入影像進行逐像元分類處理。系統(tǒng)各個功能的中間處理結(jié)果可以通過四個存儲單元遙感影像存儲單元、訓(xùn)練樣本數(shù)據(jù)文件存儲單元、決策樹及分類精度評價結(jié)果文件存儲單元和分類結(jié)果影像文件存儲單元完成自/到計算機存儲器的讀寫操作。本系統(tǒng)結(jié)構(gòu)單元的相互關(guān)系可通過各單元的功能進一步描述如下(1)通過遙感影像存儲單元將遙感影像讀到計算機內(nèi)存單元,通過影像顯示裝置(顯示器)和影像顯示放縮漫游控制單元顯示影像,并且可以通過用戶交互任意放大、縮小和漫游影像。
(2)用戶通過訓(xùn)練區(qū)域人機交互定義單元,用鼠標(biāo)在顯示的影像上定義一些區(qū)域,用戶知道這些區(qū)域的地物類型,并將該類型信息作為區(qū)域類別屬性加以定義。這些已知類型的區(qū)域稱為訓(xùn)練樣區(qū)。
(3)將定義好的訓(xùn)練樣區(qū)及在計算機內(nèi)存中的影像,輸入訓(xùn)練樣本數(shù)據(jù)提取單元,經(jīng)過處理后得到每個訓(xùn)練區(qū)域的訓(xùn)練樣本數(shù)據(jù)。
(4)訓(xùn)練樣本數(shù)據(jù)輸入決策樹生成單元,生成決策樹;進而在決策樹精度驗證單元進行分類精度計算,并通過決測樹、分類精度評價結(jié)果文件保存單元將處理結(jié)果以文件的形式保存到計算機硬盤中。
(5)以生成的決策樹和遙感影像本身為輸入,遙感影像分類處理單元完成遙感影像的分類處理,并輸出分類結(jié)果影像。
本系統(tǒng)的核心技術(shù)是決策樹分類規(guī)則有監(jiān)督生成的實現(xiàn)方法,即決策樹生長和剪枝方法,簡稱決策樹生成方法。決策樹生成方法是一種通過構(gòu)造決策樹來發(fā)現(xiàn)訓(xùn)練集中分類知識的模式識別方法,其核心是如何構(gòu)造精度高、規(guī)模小的決策樹。決策樹是一棵根樹,內(nèi)部節(jié)點是最佳擴展屬性,葉節(jié)點是類別屬性;內(nèi)部節(jié)點的最佳射出邊是最佳擴展屬性的取值。內(nèi)部節(jié)點對應(yīng)的數(shù)據(jù)集是不純的,根節(jié)點對應(yīng)的數(shù)據(jù)集是訓(xùn)練集E。其它內(nèi)部節(jié)點對應(yīng)的數(shù)據(jù)集是E的子集;葉節(jié)點對應(yīng)的數(shù)據(jù)集是純的訓(xùn)練子集。
如圖4所示,構(gòu)造決策樹生長與剪枝分為三個步驟1)決策樹的生長由訓(xùn)練集生成一個決策樹;2)決測樹剪枝從訓(xùn)練集中隨機抽取訓(xùn)練樣本檢驗生成的決策樹,剪去影響預(yù)測精度的分枝;3)決策樹精度評價及結(jié)果輸出。這三個步驟所涉及的關(guān)鍵技術(shù)方法的說明如下(1)決策樹的生長決策樹的生長采用自上而下的方法,對應(yīng)圖4,處理流程可描述如下1)對于訓(xùn)練集E,若E是純的,類別屬性為Xi,則選擇Xi為葉節(jié)點(也是根節(jié)點),結(jié)束;否則把E作為當(dāng)前數(shù)據(jù)集;2)對于當(dāng)前數(shù)據(jù)集,選擇最佳擴展屬性作為節(jié)點,根據(jù)最佳擴展屬性的取值進行分值,并把數(shù)據(jù)集劃分成不同的子數(shù)據(jù)集E’;3)處理子數(shù)據(jù)集E’,若E’是純的,類別屬性值為X’i,則選擇X’i為葉節(jié)點,轉(zhuǎn)4);否則把該數(shù)據(jù)集作為當(dāng)前數(shù)據(jù)集,轉(zhuǎn)2);4)若子數(shù)據(jù)集處理完,結(jié)束;否則轉(zhuǎn)3)。
在以上過程中,找出最佳擴展屬性是生長決策樹的關(guān)鍵,它需要先確定擴展屬性的形式,找出符合這種形式的所有擴展屬性,然后評價這些擴展屬性,選出最具判別能力的擴展屬性作為最佳擴展屬性。下面三個段落(2)~(5)對具體方法進行了說明。段落(6)對決策樹的剪枝方法進行了說明。
(2)決策樹的擴展屬性形式擴展屬性的形式有單屬性、數(shù)值聯(lián)合屬性和邏輯聯(lián)合屬性。這里決策樹采用的是線性數(shù)值聯(lián)合屬性。線性數(shù)值聯(lián)合屬性的形式為wd+1+Σi=1d(wixi)---(1)]]>其中x1,x2,...,xd是d個不同描述屬性的屬性值變量,w1,w2,w3,...,wd+1為系數(shù)。這類擴展屬性根據(jù)下式wd+1+Σi=1d(wixi)≤0]]>和wd+1+Σi=1d(wixi)>0---(2)]]>將當(dāng)前數(shù)據(jù)集分成兩枝。上式實際上在兩個類別中間確定了一個超平面(Hyperplane)。
(3)決策樹分裂好壞的判斷標(biāo)準(zhǔn)為了在一個樹節(jié)點上找出一個好的超平面,需要定義一個判斷好壞的標(biāo)準(zhǔn)(Goodness)。這里采用“二分”準(zhǔn)則(towing criterion)。該準(zhǔn)則認為一個可以將數(shù)據(jù)集幾乎等分為二個子集的超平面,而且盡量不將屬于同一個類別的樣本分到由超平面化分的兩個子空間中去的超平面是較好的。設(shè)一個分裂(Split)將樣本集劃分為二個子集,落入左面的樣本數(shù)為PL,落入右面的樣本數(shù)為PR,則二分準(zhǔn)則可寫為(PL·PR)(Σj|p(j|L)-p(j|R)|)2---(3)]]>其中p(j|L)和p(j|R)分別表示類j在左、右面的樣本數(shù)。能夠?qū)⑸鲜阶畲蠡姆至鸦虺矫婢褪且粋€好的分裂或超平面。
(4)構(gòu)造超平面的方法尋找一個好的超平面也就是確定(1)式各系數(shù)的數(shù)值,而且可以使(4-9)式達到最大值。這里所采用的方法是假設(shè)P表示在一個樹的節(jié)點上的n個樣本的集合。首先隨機產(chǎn)生一個超平面H,其形式為wd+1+Σi=1d(wixi)=0]]>然后將P中的每一個樣本Pj=(xj1,xj2,...,xjd)代入下式Vj=wd+1+Σi=1d(wixji)---(5)]]>若Vj>0,則樣本Pj在平面的上面,否則在平面的下面。進而利用(3)式判斷超平面的好壞。為了尋找最佳的超平面,可以依此設(shè)定一個參數(shù)wk為待調(diào)整的參數(shù),其它參數(shù)保持當(dāng)前值不變,總可以尋找到一個可以使(3)式最大的wk。
(5)避免陷入局部最大的方法當(dāng)無法改變當(dāng)前的超平面以使二分準(zhǔn)則取得更大的值時,超平面方程參數(shù)的搜索過程就出現(xiàn)了局部最大現(xiàn)象。局部最大使我們無法得到全局最大解。
該決策樹生成方法實現(xiàn)了兩種避免陷入局部最大的方案。一是重新啟動隨機生成初始參數(shù)的過程。二是在當(dāng)前已經(jīng)尋找到的最優(yōu)參數(shù)W的基礎(chǔ)上,生成一個新的參數(shù)W+αR,其中W為參數(shù)向量,W=(w1,w2,...,wd+1),α為常數(shù),R為一個隨即方向向量,R=(r1,r2,...,rd)。
(6)決策樹剪枝方法決策樹剪枝方法采樣后剪枝算法,即在決策樹生成后再進行剪枝,采用的是Brieman等提出的代價復(fù)雜度(Cost Complexity)剪枝法。
本發(fā)明采用這種基于決策樹的遙感影像分類方案,和現(xiàn)有的遙感影像分類方案相比,有如下優(yōu)點(1)是一種非參數(shù)分類器,不要求訓(xùn)練樣本符合特定統(tǒng)計分布的假設(shè);(2)決策樹產(chǎn)生的規(guī)則具有可解釋性強,易于理解的特點;(3)決策樹生成后的分類操作速度快。
圖1是本發(fā)明的遙感影像決策樹分類系統(tǒng)的結(jié)構(gòu)圖。
圖2是圖1遙感影像決策樹分類系統(tǒng)的結(jié)構(gòu)中的決策樹生長與剪枝單元裝置的結(jié)構(gòu)圖。
圖3是本發(fā)明的遙感影像決策樹分類系統(tǒng)的方法流程圖。
圖4是總方法流程圖3中“決策樹生長與剪枝”的方法流程圖。
具體實施例方式
圖1中,遙感影像決策樹分類系統(tǒng)結(jié)構(gòu),由遙感影像存儲單元1、計算機顯示器2、影像顯示放縮漫游控制單元3、訓(xùn)練區(qū)域人機交互定義單元4、訓(xùn)練樣本數(shù)據(jù)提取單元5、訓(xùn)練樣本數(shù)據(jù)文件存儲取單元6、決策樹生長與剪枝單元7、決策樹精度驗證單元8、決策樹及分類精度評價結(jié)果文件保存單元9、遙感影像分類處理單元10、分類結(jié)果影像文件存儲單元組成11,其中,遙感影像存儲單元1連接于計算機存儲器12和影像顯示放縮漫游控制單元3之間,影像顯示放縮漫游控制單元3連接于計算機顯示器2和訓(xùn)練區(qū)域人機交互定義單元4之間,訓(xùn)練區(qū)域人機交互定義單元4連接于訓(xùn)練樣本數(shù)據(jù)提取單元5,訓(xùn)練樣本數(shù)據(jù)提取單元5連接于訓(xùn)練樣本數(shù)據(jù)文件存儲取單元6,訓(xùn)練樣本數(shù)據(jù)文件存儲取單元6分別連接于計算機存儲器12和決策樹生長與剪枝單元7,決策樹生長與剪枝單元7連接于決策樹精度評價單元8和決策樹及分類精度評價結(jié)果文件保存單元9,決策樹及分類精度評價結(jié)果文件保存單元9連接于遙感影像分類處理單元10,遙感影像分類處理單元10連接于分類結(jié)果影像文件存儲單元11,以上各單元運行在計算機處理器和內(nèi)存單元13。
圖2中,遙感影像決策樹分類系統(tǒng)(圖1)中核心單元“決策樹生成及剪枝單元”由順序執(zhí)行的決策樹生長單元14和決策樹剪枝單元15組成,以訓(xùn)練樣本集為最初輸入數(shù)據(jù),剪枝后的決策樹為輸出結(jié)果。決策樹的生長單元14由坐標(biāo)軸平行單變量分裂單元16、不純度計算單元17、斜線多變量分裂單元18、自根節(jié)點到葉節(jié)點分裂循環(huán)過程控制單元19組成。決策樹剪枝單元15由剪枝精度測試子樣本數(shù)據(jù)集隨機抽取單元20、N個不同程度的剪枝方式生成單元21和決策樹剪枝精度評價單元22組成。斜線多變量分裂單元18由超平面方程參數(shù)初始化單元23、方程參數(shù)依此調(diào)整的循環(huán)控制單元24和避免陷入局部最大的循環(huán)控制單元25組成。
各單元間的連接方式為訓(xùn)練樣本數(shù)據(jù)集26分別連接于坐標(biāo)軸平行單變量分裂單元16、斜線多變量分裂單元18、剪枝精度測試子樣本數(shù)據(jù)集隨機抽取單元20;不純度計算單元17分別連接于坐標(biāo)軸平行單變量分裂單元16、超平面方程參數(shù)初始化單元23和當(dāng)前參數(shù)在當(dāng)前節(jié)點樣本集上的不純度單元27;當(dāng)前參數(shù)在當(dāng)前節(jié)點樣本集上的不純度單元27連接于方程參數(shù)依此調(diào)整的循環(huán)控制單元24;方程參數(shù)依此調(diào)整的循環(huán)控制單元24分別連接于當(dāng)前參數(shù)在當(dāng)前節(jié)點樣本集上的不純度單元27、避免陷入局部最大的循環(huán)控制單元25;避免陷入局部最大的循環(huán)控制單元25連接于當(dāng)前參數(shù)在當(dāng)前節(jié)點樣本集上的不純度單元27;坐標(biāo)軸平行單變量分裂單元16連接于最佳分裂方式選擇單元28;最佳分裂方式選擇單元28連接于自根節(jié)點到葉節(jié)點分裂循環(huán)過程控制單元19;自根節(jié)點到葉節(jié)點分裂循環(huán)過程控制單元19連接于決策樹生長單元14;決策樹生長單元14連接于決策樹決策樹剪枝單元15;N個不同程度的剪枝方式生成單元21連接于N個剪枝后的決策樹單元29;N個剪枝后的決策樹單元29連接于決策樹剪枝精度評價單元22;剪枝精度測試子樣本數(shù)據(jù)集隨機抽取單元20連接于決策樹剪枝精度評價單元22;決策樹剪枝精度評價單元22連接于剪枝后的決策樹30。
圖3遙感影像決策樹分類系統(tǒng)的方法,其步驟如下步驟S3-1啟動該遙感影像分類系統(tǒng);步驟S3-2通過遙感影像顯示程序顯示影像,用戶可以對影像進行放縮、漫游等顯示操作;步驟S3-3通過系統(tǒng)提供的訓(xùn)練區(qū)域定義程序,定義各個區(qū)域的類別屬性;這些訓(xùn)練區(qū)域圖形數(shù)據(jù)儲存在計算機內(nèi)存中,也可以永久保存到圖形文件中;步驟S3-4以上一步處理結(jié)果為輸入,通過樣本數(shù)據(jù)提取程序提取訓(xùn)練樣本數(shù)據(jù);這些數(shù)據(jù)儲存在計算機內(nèi)存中,也可永久保存到數(shù)據(jù)文件中;步驟S3-5以上一步處理結(jié)果為輸入,通過決策樹生長與剪枝程序生成決策數(shù),同時計算精度評價指標(biāo),處理結(jié)果可以永久保存為數(shù)據(jù)文件;步驟S3-6以上一步處理結(jié)果為輸入,對遙感影像進行逐像元分類處理,輸出分類結(jié)果影像。
(虛線表示可選擇的程序輸入方式)圖4決策樹生長與剪枝程序的方法,其具體步驟如下步驟S4-1以訓(xùn)練樣本數(shù)據(jù)文件為輸入,從中讀取訓(xùn)練樣本數(shù)據(jù),生成訓(xùn)練樣本集E;步驟S4-2對于訓(xùn)練集E,若E是純的,類別屬性為Xi,則選擇Xi為葉節(jié)點(也是根節(jié)點),轉(zhuǎn)向S4-6;否則把E作為當(dāng)前數(shù)據(jù)集,轉(zhuǎn)S4-3;步驟S4-3對于當(dāng)前數(shù)據(jù)集E,選擇最佳擴展屬性作為節(jié)點,根據(jù)最佳擴展屬性的取值進行分枝,并把數(shù)據(jù)集劃分成不同的子數(shù)據(jù)集E’;步驟S4-4處理子數(shù)據(jù)集E’,若子數(shù)據(jù)集E’是純的,類別屬性值為X’i,則選擇X’i為葉節(jié)點,轉(zhuǎn)S4-5;否則把該數(shù)據(jù)集作為當(dāng)前數(shù)據(jù)集,即令E=E’,轉(zhuǎn)S4-3;步驟S4-5若子數(shù)據(jù)集E’處理完,S4-6;否則轉(zhuǎn)S4-4;步驟S4-6終止決策樹生長過程,將生成的決策樹傳給下一步驟;
步驟S4-7執(zhí)行基于代價復(fù)雜度的決策樹剪枝過程;步驟S4-8決策樹精度評價過程,該過程可以對系統(tǒng)產(chǎn)生的決策樹分別訓(xùn)練樣本集和精度檢驗樣本集進行分類精度評價;步驟S4-9決策樹及分類精度評價結(jié)果文件的輸出(硬盤存儲)。
權(quán)利要求
1.一種遙感影像決策樹分類系統(tǒng),由計算機存儲器、計算機處理器、內(nèi)存單元、顯示器等是本系統(tǒng)的基本結(jié)構(gòu),是本系統(tǒng)的基礎(chǔ),遙感影像存儲單元、影像顯示、放縮、漫游控制單元,為訓(xùn)練樣地人機交互定義單元的功能實現(xiàn)提供了底層支持,決策樹生長與剪枝單元、決策樹精度評價單元分別完成決策樹的訓(xùn)練生成和精度評價,遙感影像分類處理單元利用已經(jīng)生成的決策樹對輸入影像進行逐像元分類處理,系統(tǒng)各個中間處理結(jié)果可以通過四個存儲單元遙感影像存儲單元、訓(xùn)練樣本數(shù)據(jù)文件存儲單元、決策樹及分類精度評價結(jié)果文件存儲單元和分類結(jié)果影像文件存儲單元完成自/到計算機存儲器的讀寫操作。
2.根據(jù)權(quán)利要求1的遙感影像決策樹分類系統(tǒng),其特征在于,遙感影像決策樹分類系統(tǒng),具體構(gòu)成如下由遙感影像存儲單元(1)、計算機顯示器(2)、影像顯示放縮漫游控制單元(3)、訓(xùn)練區(qū)域人機交互定義單元(4)、訓(xùn)練樣本數(shù)據(jù)提取單元(5)、訓(xùn)練樣本數(shù)據(jù)文件存儲取單元(6)、決策樹生長與剪枝單元(7)、決策樹精度驗證單元(8)、決策樹及分類精度評價結(jié)果文件保存單元(9)、遙感影像分類處理單元(10)、分類結(jié)果影像文件存儲單元組成(11),其中,遙感影像存儲單元(1)連接于計算機存儲器(12)和影像顯示放縮漫游控制單元(3)之間,影像顯示放縮漫游控制單元(3)連接于計算機顯示器(2)和訓(xùn)練區(qū)域人機交互定義單元(4)之間,訓(xùn)練區(qū)域人機交互定義單元(4)連接于訓(xùn)練樣本數(shù)據(jù)提取單元(5),訓(xùn)練樣本數(shù)據(jù)提取單元(5)連接于訓(xùn)練樣本數(shù)據(jù)文件存儲取單元(6),訓(xùn)練樣本數(shù)據(jù)文件存儲取單元(6)分別連接于計算機存儲器(12)和決策樹生長與剪枝單元(7),決策樹生長與剪枝單元(7)連接于決策樹精度評價單元(8)和決策樹及分類精度評價結(jié)果文件保存單元(9),決策樹及分類精度評價結(jié)果文件保存單元(9)連接于遙感影像分類處理單元(10),遙感影像分類處理單元(10)連接于分類結(jié)果影像文件存儲單元(11),以上各單元運行在計算機處理器和內(nèi)存單元(13)。
3.根據(jù)權(quán)利要求1的遙感影像決策樹分類系統(tǒng),其特征在于,決策樹生長和剪枝單元構(gòu)成如下;決策樹生成及剪枝單元,由順序執(zhí)行的決策樹生長單元(14)和決策樹剪枝單元(15)組成,以訓(xùn)練樣本集為最初輸入數(shù)據(jù),剪枝后的決策樹為輸出結(jié)果,決策樹的生長單元(14)由坐標(biāo)軸平行單變量分裂單元(16)、不純度計算單元(17)、斜線多變量分裂單元(18)、自根節(jié)點到葉節(jié)點分裂循環(huán)過程控制單元(19)組成,決策樹剪枝單元(15)由剪枝精度測試子樣本數(shù)據(jù)集隨機抽取單元(20)、N個不同程度的剪枝方式生成單元(21)和決策樹剪枝精度評價單元(22)組成,斜線多變量分裂單元(18)由超平面方程參數(shù)初始化單元(23)、方程參數(shù)依此調(diào)整的循環(huán)控制單元(24)和避免陷入局部最大的循環(huán)控制單元(25)組成,各單元間的連接方式為訓(xùn)練樣本數(shù)據(jù)集(26)分別連接于坐標(biāo)軸平行單變量分裂單元(16)、斜線多變量分裂單元(18)、剪枝精度測試子樣本數(shù)據(jù)集隨機抽取單元(20);不純度計算單元(17)分別連接于坐標(biāo)軸平行單變量分裂單元(16)、超平面方程參數(shù)初始化單元(23)和當(dāng)前參數(shù)在當(dāng)前節(jié)點樣本集上的不純度單元(27);當(dāng)前參數(shù)在當(dāng)前節(jié)點樣本集上的不純度單元(27)連接于方程參數(shù)依此調(diào)整的循環(huán)控制單元(24);方程參數(shù)依此調(diào)整的循環(huán)控制單元(24)分別連接于當(dāng)前參數(shù)在當(dāng)前節(jié)點樣本集上的不純度單元(27)、避免陷入局部最大的循環(huán)控制單元(25);避免陷入局部最大的循環(huán)控制單元(25)連接于當(dāng)前參數(shù)在當(dāng)前節(jié)點樣本集上的不純度單元(27);坐標(biāo)軸平行單變量分裂單元(16)連接于最佳分裂方式選擇單元(28);最佳分裂方式選擇單元(28)連接于自根節(jié)點到葉節(jié)點分裂循環(huán)過程控制單元(19);自根節(jié)點到葉節(jié)點分裂循環(huán)過程控制單元(19)連接于決策樹生長單元(14);決策樹生長單元(14)連接于決策樹決策樹剪枝單元(15);N個不同程度的剪枝方式生成單元(21)連接于N個剪枝后的決策樹單元(29);N個剪枝后的決策樹單元(29)連接于決策樹剪枝精度評價單元(22);剪枝精度測試子樣本數(shù)據(jù)集隨機抽取單元(20)連接于決策樹剪枝精度評價單元(22);決策樹剪枝精度評價單元(22)連接于剪枝后的決策樹(30)。
4.一種遙感影像決策樹分類系統(tǒng)的方法,其步驟如下步驟S3-1啟動該遙感影像分類系統(tǒng);步驟S3-2通過遙感影像顯示程序顯示影像,用戶可以對影像進行放縮、漫游等顯示操作;步驟S3-3通過系統(tǒng)提供的訓(xùn)練區(qū)域定義程序,定義各個區(qū)域的類別屬性;這些訓(xùn)練區(qū)域圖形數(shù)據(jù)儲存在計算機內(nèi)存中,也可以永久保存到圖形文件中;步驟S3-4以上一步處理結(jié)果為輸入,通過樣本數(shù)據(jù)提取程序提取訓(xùn)練樣本數(shù)據(jù);這些數(shù)據(jù)儲存在計算機內(nèi)存中,也可永久保存到數(shù)據(jù)文件中;步驟S3-5以上一步處理結(jié)果為輸入,通過決策樹生長與剪枝程序生成決策數(shù),同時計算精度評價指標(biāo),處理結(jié)果可以永久保存為數(shù)據(jù)文件;步驟S3-6以上一步處理結(jié)果為輸入,對遙感影像進行逐像元分類處理,輸出分類結(jié)果影像。
5.根據(jù)權(quán)利要求4的遙感影像決策樹分類系統(tǒng)的方法,其特征在于,決策樹生長與剪枝方法步驟如下分為三個步驟1)決策樹的生長由訓(xùn)練集生成一個決策樹;2)決測樹剪枝從訓(xùn)練集中隨機抽取訓(xùn)練樣本檢驗生成的決策樹,剪去影響預(yù)測精度的分枝;3)決策樹精度評價及結(jié)果輸出。
6.根據(jù)權(quán)利要求4或5的遙感影像決策樹分類系統(tǒng)的方法,其特征在于,決策樹生長與剪枝的方法,其具體步驟如下步驟S4-1以訓(xùn)練樣本數(shù)據(jù)文件為輸入,從中讀取訓(xùn)練樣本數(shù)據(jù),生成訓(xùn)練樣本集E;步驟S4-2對于訓(xùn)練集E,若E是純的,類別屬性為Xi,則選擇Xi為葉節(jié)點(也是根節(jié)點),轉(zhuǎn)向S4-6;否則把E作為當(dāng)前數(shù)據(jù)集,轉(zhuǎn)S4-3;步驟S4-3對于當(dāng)前數(shù)據(jù)集E,選擇最佳擴展屬性作為節(jié)點,根據(jù)最佳擴展屬性的取值進行分枝,并把數(shù)據(jù)集劃分成不同的子數(shù)據(jù)集E’;步驟S4-4處理子數(shù)據(jù)集E’,若子數(shù)據(jù)集E’是純的,類別屬性值為X’i,則選擇X’i為葉節(jié)點,轉(zhuǎn)S4-5;否則把該數(shù)據(jù)集作為當(dāng)前數(shù)據(jù)集,即令E=E’,轉(zhuǎn)S4-3;步驟S4-5若子數(shù)據(jù)集E’處理完,S4-6;否則轉(zhuǎn)S4-4;步驟S4-6終止決策樹生長過程,將生成的決策樹傳給下一步驟;步驟S4-7執(zhí)行基于代價復(fù)雜度的決策樹剪枝過程;步驟S4-8決策樹精度評價過程,該過程可以對系統(tǒng)產(chǎn)生的決策樹分別訓(xùn)練樣本集和精度檢驗樣本集進行分類精度評價;步驟S4-9決策樹及分類精度評價結(jié)果文件的輸出。
全文摘要
本發(fā)明涉及遙感遙測技術(shù)領(lǐng)域,特別是一種遙感影像決策樹分類系統(tǒng)及方法。系統(tǒng)包括遙感影像存儲單元、顯示器、影像顯示放縮漫游控制單元、訓(xùn)練區(qū)域人機交互定義單元、決策樹生長與剪枝單元、決策樹及分類精度評價結(jié)果文件保存單元、遙感影像分類處理單元、分類結(jié)果影像文件存儲單元。方法包括啟動程序啟動分類系統(tǒng);遙感影像顯示程序顯示影像;訓(xùn)練區(qū)域定義程序定義訓(xùn)練樣區(qū);樣本數(shù)據(jù)提取程序提取訓(xùn)練樣本數(shù)據(jù);決策樹生長和剪枝程序生成決策樹;精度評價程序計算分類精度評價指標(biāo);遙感影像逐像元分類處理程序生成分類結(jié)果影像。本發(fā)明可用于星載或機載傳感器獲取的各種遙感影像的分類處理。
文檔編號G06K9/62GK1790379SQ20041009895
公開日2006年6月21日 申請日期2004年12月17日 優(yōu)先權(quán)日2004年12月17日
發(fā)明者陳爾學(xué), 李增元, 白黎娜, 龐勇, 田昕, 譚炳香 申請人:中國林業(yè)科學(xué)研究院資源信息研究所