基于深層特征學(xué)習(xí)和分水嶺的sar圖像分類的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像處理領(lǐng)域,特別是一種涉及SAR圖像分類的方法,可應(yīng)用于目標 識別。
【背景技術(shù)】
[0002] 合成孔徑雷達(SAR)是一種全天時,全天候?qū)Φ厍蜻M行探測和偵察的高分辨微波 成像雷達。SAR能有效識別偽裝和穿透掩蓋物,因此在遙感測繪、軍事偵察、抗震救災(zāi)等軍事 和民用領(lǐng)域得到了廣泛應(yīng)用。SAR圖像具有豐富的紋理信息、較強的乘性相干斑噪聲等特 點。在SAR圖像的成像過程中,不同的地物有不同的后向反射和散射特性,從而呈現(xiàn)不同 的紋理,因此SAR圖像中常常會包含有豐富的紋理信息。另一方面,由于SAR采用的是相干 成像體制,使得成像后的SAR圖像不可避免的受到相干斑噪聲的影響,從而隱藏或減弱SAR 圖像中的精細結(jié)構(gòu),為SAR圖像的理解與解譯帶來困難甚至錯判。SAR圖像分類是SAR圖像 解譯中基本而關(guān)鍵的技術(shù)之一,因此SAR圖像分類技術(shù)研宄是一個具有非常大的研宄價值 的挑戰(zhàn)性課題。
[0003] 目前SAR圖像分類技術(shù)發(fā)展狀況可歸納如下:
[0004] 基于模型驅(qū)動的分類方法。需要對SAR圖像數(shù)據(jù)進行數(shù)學(xué)建模。主要包括概率統(tǒng) 計分布模型和馬爾可夫隨機場模型,以及優(yōu)化模型等。SAR強度圖像的統(tǒng)計特性通常被建 模為Gamma概率分布,但Gamma分布只符合分辨率較低時大部分自然場景的統(tǒng)計特性,隨著 SAR圖像分辨率的提高,SAR圖像的統(tǒng)計特性不在完全符合Gamma分布。目前已有許多不同 的統(tǒng)計模型應(yīng)用于SAR圖像,如經(jīng)驗分布模型:Weibull分布,F(xiàn)isher分布等;基于SAR圖 像乘積模型的統(tǒng)計分布模型:k分布,Beta分布,Gaussian分布等。目前基于馬爾可夫場的 SAR圖像分類方法中廣泛應(yīng)用由SAR圖像乘積模型發(fā)展而來的概率統(tǒng)計分布模型。但是,所 有的統(tǒng)計模型只能夠描述具有簡單內(nèi)容,場景類型較少的區(qū)域。對于具有復(fù)雜內(nèi)容,場景類 型較多的大尺度SAR圖像,使用較少參數(shù)的統(tǒng)計模型來描述整幅圖像是不可行的。
[0005] 基于數(shù)據(jù)驅(qū)動的分類方法。直接利用SAR圖像灰度,紋理等信息進行分類處理。目 前已經(jīng)存在許多不同的SAR圖像分類方法,例如邊緣檢測方法、基于區(qū)域的方法、聚類方法 等。特征提取和表示是SAR圖像分類技術(shù)一個至關(guān)重要的步驟。目前SAR圖像的紋理特征 表示方法主要包括灰度共生矩陣(GLCM)、Gabor濾波、馬爾可夫特征等。雖然Gabor濾波能 夠提取SAR圖像不同頻率,不同方向的特征,但由灰度共生矩陣計算的熵,相關(guān)性等統(tǒng)計特 征能夠更好的分類SAR圖像。因此產(chǎn)生了將Gabor濾波和灰度特征進行融合,原因是Gabor 能夠捕獲低頻紋理信息,GLCM和高頻帶響應(yīng)相關(guān)。但特征融合的同時使得特征向量的維度 過高,并且由于特征內(nèi)部具有很強的互相關(guān)性,因此分類正確率僅有些許提高。
[0006] 挖掘中層特征的圖像分類方法。近年來,基于視覺詞袋模型的分類方法得到 了廣泛關(guān)注。該方法將局部特征量化為基于區(qū)域的直方圖特征,并將其作為中層特征 進行分類。Sheng Xu等人將經(jīng)典的詞袋模型應(yīng)用到了航空圖像分類中,分類效果由 于基于低層特征的分類方法,參見Sheng Xu, Tao Fang. Object classification of aerial images with bag-〇f-visual words,IEEE Geoscience and Remote Sensing Letters,2010,7(2) :366-370。隨后,Jie Feng等人對詞袋模型做出了改進,將該方法推 廣到了 SAR圖像分類中,提出了基于克隆選擇算法的視覺詞袋模型,參見Jie Feng and L. C. Jiao. Bag-〇f-Visual-ffords Based on Clonal Selection Algorithm for SAR Image Classification, 2011:691-695。該方法從優(yōu)化的角度構(gòu)建了更加適于分類的視覺單詞,分 類效果得到了明顯提升。
[0007] 隨著視覺詞袋模型的發(fā)展與不斷改進,圖像分類正確率的僅能得到些許改進。并 且由于SAR圖像的分類是面向單幅圖像的場景分類,應(yīng)用詞袋模型需首先對圖像進行初始 過分割,使得最終分類結(jié)果對初始分割算法非常敏感,初始分割能否保持保持SAR圖像的 邊緣和細節(jié)信息等直接影響到最終的分類效果。另一方面,視覺單詞的構(gòu)建是整個分類過 程至關(guān)重要的一步,應(yīng)用最廣泛的k均值聚類算法受初始化影響嚴重,一旦初始值選擇不 好,可能無法得到有效的聚類中心,從而使詞袋中的每個單詞缺乏代表性。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明意在解決現(xiàn)有挖掘中層特征的SAR圖像分類技術(shù)的缺陷,提出了一種基于 深度學(xué)習(xí)和分水嶺的SAR圖像分類方法。利用局部特征的卷積特性和稀疏自編碼器來挖 掘SAR圖像潛在的本質(zhì)特性,并融合改進的分水嶺算法,從而提高邊緣分辨精度和區(qū)域一 致性。
[0009] 實現(xiàn)本發(fā)明的技術(shù)方案是:應(yīng)用新穎的KSVD字典與低層特征的卷積特性,挖掘低 層特征的潛在屬性,然后利用稀疏自編碼器挖掘高層特性,增強特征之間的對比度,同時結(jié) 合改進的分水嶺的算法,有效克服了原有基于中層特征分類方法分類不精確的缺陷。其具 體實現(xiàn)過程如下:
[0010] (1)對輸入的SAR圖像進行分水嶺過分割,得到分割類標L = IL1, L2, ...,LM},其 中M值為分水嶺分割的總塊數(shù),Lni為第m個子塊類標,m e [1,M];
[0011] (2)對輸入的SAR圖像進行加窗傅里葉(Gabor)變換得到低層特征F1= [I 1; I2;... ;IN],其中N表示輸入的SAR圖像中的像素個數(shù),1"表示每個像素點提取的特征向 量,n e [1,N];
[0012] (3)分別對輸入的SAR圖像中每類場景中的像素點的Gabor特征向量進行隨機采 樣,得到訓(xùn)練樣本Y= [Y1;Y2;... ;YJ,然后對1進行奇異值分解(KSVD),得到的聚類中心 作為字典D = [D1, D2, ···,DJ,其中Y。為采樣得到的第c類場景的Gabor特征,D k表示對Y 進行KSVD聚類后得到的第k個聚類中心,C表示輸入的SAR圖像中的場景類別數(shù),K表示 KSVD中的聚類中心數(shù),K的取值遠大于圖像中的場景類別數(shù)C,ce [l,C],ke [l,K];
[0013] (4)將Gabor變換得到低層特征中每個像素點提取的特征向量In與字典D中每 個聚類中心Dk進行卷積,然后再應(yīng)用最大值池化進行降維,得到的卷積特征F 2作為中層特 征;
[0014] (5)將卷積特征匕輸入到稀疏自編碼器中,得到編碼系數(shù)^= [S1iS2^mSh]然 后將卷積特征F2與編碼系數(shù)W i相乘,得到深層特征F 3,其中Sh為每個隱藏層結(jié)點的編碼系 數(shù),H為隱藏層結(jié)點個數(shù),he [1,H]。
[0015] (6)將F3輸入到支持矢量機(SVM)中進行分類,獲得分類結(jié)果R1,共分為C類場 景;
[0016] (7)在分水嶺過分割結(jié)果的分割類標L的每個子塊類標Lm位置對R 1進行投票,統(tǒng) 計札在L m位置出現(xiàn)次數(shù)最多的場景值c,并將L m位置全部更新為該場景值c,從而得到最 終分類結(jié)果。
[0017] 本發(fā)明與現(xiàn)有技術(shù)相比具有以下優(yōu)點:
[0018] 1、本發(fā)明采用KSVD訓(xùn)練字典,該算法是對原有K-means算法的擴展,能夠最大化 發(fā)揮每個字典原子自身的作用;
[0019] 2、本發(fā)明將低層特征與字典進行卷積,充分挖掘低層特征的本質(zhì)屬性;
[0020] 3、本發(fā)明采用稀疏自編碼器挖掘高層的抽象特征,能夠強化每個像素點的特征, 提高不同場景之間的對比度,增強了算法的魯棒性;
[0021] 4、本發(fā)明將深度的分類結(jié)果在改進的分水嶺分割結(jié)果中進行統(tǒng)計,使得本發(fā)明能 夠有效分類具有不同紋理大小的場景,提高區(qū)域一致性;
[0022] 5、仿