基于視覺詞袋模型的遙感圖像目標(biāo)識別方法
【專利摘要】本發(fā)明公開了一種基于視覺詞袋模型的遙感圖像目標(biāo)識別方法,屬于圖像識別【技術(shù)領(lǐng)域】。本發(fā)明針對傳統(tǒng)遙感圖像目標(biāo)檢測識別算法效果不佳的缺點,將視覺詞袋模型引入到高分辨率遙感圖像中用于目標(biāo)的檢測識別,同時為了精簡視覺單詞碼本得到精簡且最具鑒別力的視覺單詞,本發(fā)明結(jié)合相關(guān)性及冗余度分析去除視覺單詞碼本中不相關(guān)、弱相關(guān)以及冗余的視覺單詞,選出了對目標(biāo)識別最為重要的視覺單詞,減少了后續(xù)測試的計算量,提高了效率,為遙感圖像目標(biāo)的檢測識別提供了一個新的研究方向。
【專利說明】基于視覺詞袋模型的遙感圖像目標(biāo)識別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種遙感圖像目標(biāo)識別方法,尤其涉及一種基于視覺詞袋模型的遙感圖像目標(biāo)識別方法,屬于圖像識別【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002]隨著遙感技術(shù)的迅猛發(fā)展,遙感圖像的空間分辨率越來越高,對遙感圖像中感興趣的目標(biāo)進(jìn)行定位和辨識已經(jīng)成為一個重要的研究方向。利用遙感圖像來檢測目標(biāo),在軍事和民用領(lǐng)域都有著廣泛的應(yīng)用前景。尤其是在軍事方面,利用遙感圖像來檢測重要軍事目標(biāo)(例如飛機(jī)、坦克、導(dǎo)彈發(fā)射井等),已經(jīng)應(yīng)用于國防建設(shè)中。
[0003]常用的目標(biāo)識別算法有兩種:一種是由下而上的數(shù)據(jù)驅(qū)動型,另一種是由上而下的知識驅(qū)動型。目前基于遙感圖像的目標(biāo)檢測技術(shù),大多采用第一種策略,即先對圖像進(jìn)行分割或是邊緣提取,然后采用模板匹配的方法來檢測目標(biāo)。但是由于遙感圖像質(zhì)量和目標(biāo)陰影的影響,分割后的目標(biāo)通常會斷開成幾個區(qū)域,很難完整地提取目標(biāo)的邊緣輪廓,所以還需要再進(jìn)行區(qū)域合并或者邊緣連接,這種方法不僅實現(xiàn)起來復(fù)雜而且抗干擾能力很弱,同時由于待識別目標(biāo)的類型往往很多,很難用一個統(tǒng)一的模板去匹配所有的目標(biāo),因此檢測結(jié)果經(jīng)常不令人滿意。
[0004]視覺詞袋是一種比較流行的基于局部屬性的圖像表示方法,在物體識別、人體行為分析等計算機(jī)視覺問題中得到了廣泛的應(yīng)用,該方法源于文本分析領(lǐng)域中的詞袋表示(bag-of-words),近些年來,基于視覺詞袋的圖像表達(dá)已被廣泛地應(yīng)用到計算機(jī)視覺和多媒體領(lǐng)域。因此,可以考慮采用視覺詞袋模型來進(jìn)行遙感圖像目標(biāo)識別,利用高分辨率遙感目標(biāo)圖像訓(xùn)練集構(gòu)建描述目標(biāo)特性的視覺單詞碼本(visual codebook,),將遙感目標(biāo)圖像從原來由圖像像素點描述轉(zhuǎn)化為視覺詞袋表示(即由該幅圖像所提取的局部特征關(guān)于訓(xùn)練集視覺單詞碼本中各視覺單詞出現(xiàn)頻次的統(tǒng)計值)。但由于視覺單詞碼本規(guī)模較大,一般都包含幾百甚至上千個視覺單詞,且視覺單詞碼本的規(guī)模對于后續(xù)的目標(biāo)檢測尤為重要,會影響整個過程的結(jié)果及效率。
【發(fā)明內(nèi)容】
[0005]本發(fā)明所要解決的技術(shù)問題在于克服現(xiàn)有技術(shù)不足,提供一種基于視覺詞袋模型的遙感圖像目標(biāo)識別方法,使用相關(guān)性和冗余度分析來對視覺單詞碼本中的視覺單詞進(jìn)行選擇,最終得到精簡且鑒別力強(qiáng)的描述目標(biāo)的遙感目標(biāo)圖像視覺單詞碼本,從而能在保證識別準(zhǔn)確率的前提下,有效減少后續(xù)目標(biāo)檢測識別的計算量,提高目標(biāo)檢測識別的效率。
[0006]本發(fā)明的基于視覺詞袋模型的遙感圖像目標(biāo)識別方法,首先選取各典型類別目標(biāo)的遙感圖像構(gòu)建訓(xùn)練集;然后分別提取訓(xùn)練集中各遙感圖像以及測試遙感圖像的視覺詞袋特征;最后利用視覺詞袋特征比較測試遙感圖像與訓(xùn)練集中各遙感圖像之間的相似度,如測試遙感圖像與訓(xùn)練集中各遙感圖像之間的相似度均小于預(yù)設(shè)的相似度閾值,則判定測試遙感圖像不是待識別目標(biāo);如否,則判定測試遙感圖像為待識別目標(biāo),且其類別為與其相似度最大的訓(xùn)練集遙感圖像的目標(biāo)類別;所述視覺詞袋特征按照以下方法提取:
[0007]步驟1、分別提取訓(xùn)練集中各遙感圖像的局部特征,并對所提取出的所有局部特征進(jìn)行聚類,所得到的每個聚類中心作為一個視覺單詞,所有聚類中心構(gòu)成初始視覺單詞碼本;
[0008]步驟2、對初始視覺單詞碼本進(jìn)行精簡,具體如下:
[0009]步驟2-1、對視覺單詞碼本中的每一個視覺單詞,分別計算其與目標(biāo)類別集合之間的類別相關(guān)性,并將與目標(biāo)類別集合之間的類別相關(guān)性小于一預(yù)設(shè)相關(guān)性閾值的視覺單詞從初始視覺單詞碼本中剔除,得到去相關(guān)后的視覺單詞碼本;初始視覺單詞碼本中的第i
個視覺單詞Fi與目標(biāo)類別集合C之間的類別相關(guān)性按照下式計算:
【權(quán)利要求】
1.一種基于視覺詞袋模型的遙感圖像目標(biāo)識別方法,其特征在于,首先選取各典型類別目標(biāo)的遙感圖像構(gòu)建訓(xùn)練集;然后分別提取訓(xùn)練集中各遙感圖像以及測試遙感圖像的視覺詞袋特征;最后利用視覺詞袋特征比較測試遙感圖像與訓(xùn)練集中各遙感圖像之間的相似度,如測試遙感圖像與訓(xùn)練集中各遙感圖像之間的相似度均小于預(yù)設(shè)的相似度閾值,則判定測試遙感圖像不是待識別目標(biāo);如否,則判定測試遙感圖像為待識別目標(biāo),且其類別為與其相似度最大的訓(xùn)練集遙感圖像的目標(biāo)類別;所述視覺詞袋特征按照以下方法提取: 步驟1、分別提取訓(xùn)練集中各遙感圖像的局部特征,并對所提取出的所有局部特征進(jìn)行聚類,所得到的每個聚類中心作為一個視覺單詞,所有聚類中心構(gòu)成初始視覺單詞碼本;步驟2、對初始視覺單詞碼本進(jìn)行精簡,具體如下: 步驟2-1、對視覺單詞碼本中的每一個視覺單詞,分別計算其與目標(biāo)類別集合之間的類別相關(guān)性,并將與目標(biāo)類別集合之間的類別相關(guān)性小于一預(yù)設(shè)相關(guān)性閾值的視覺單詞從初始視覺單詞碼本中剔除,得到去相關(guān)后的視覺單詞碼本;初始視覺單詞碼本中的第i個視覺單詞Fi與目標(biāo)類別集合C之間的類別相關(guān)性按照下式計算:
2.如權(quán)利要求1所述基于視覺詞袋模型的遙感圖像目標(biāo)識別方法,其特征在于,所述局部特征為SIFT特征。
3.如權(quán)利要求2所述基于視覺詞袋模型的遙感圖像目標(biāo)識別方法,其特征在于,利用直方圖相交值作為兩幅遙感圖像間的相似度,兩幅遙感圖像Q、D的直方圖相交值P(Q,D)按照下式得到:
4.如權(quán)利要求2所述基于視覺詞袋模型的遙感圖像目標(biāo)識別方法,其特征在于,所述測試遙感圖像是根據(jù)SIFT特征從高分辨率遙感圖像中篩選得到,具體方法如下: (1)提取所述高分辨率遙感圖像的SIFT特征點,并統(tǒng)計SIFT特征點在該圖像中出現(xiàn)的位置; (2)逐個像素掃描該圖像:對于以當(dāng)前所掃描像素點為中心,邊長為2r個像素的正方形區(qū)域,如果該區(qū)域內(nèi)SIFT特征點的個數(shù)η滿足5≤η≤100且r增加I后SIFT特征點的數(shù)目不會增加,則把這個正方形區(qū)域作為測試圖像區(qū)域;否則跳到步驟(3); (3)若r≤rmax,rmax為預(yù)設(shè)的搜索半徑閾值,則r=r+l,重復(fù)步驟(2)的操作;否則,對下一像素,重復(fù)步驟(2)?(3),直到所有的像素點都被處理完畢; (4)對篩選出的相鄰測試圖像區(qū)域分別進(jìn)行區(qū)域合并,合并的規(guī)則是相鄰測試圖像區(qū)域中心點之間距離小于閾值R ;完成區(qū)域合并后得到的各測試圖像區(qū)域即為所述測試遙感圖像。
5.如權(quán)利要求4所述基于視覺詞袋模型的遙感圖像目標(biāo)識別方法,其特征在于,搜索半徑閾值rmax的值為50。
6.如權(quán)利要求4所述基于視覺詞袋模型的遙感圖像目標(biāo)識別方法,其特征在于,進(jìn)行逐像素搜索時,r的初始值為7。
7.如權(quán)利要求4所述基于視覺詞袋模型的遙感圖像目標(biāo)識別方法,其特征在于,所述閾值R的值為參與合并的兩個測試圖像區(qū)域邊長平均值的70%。
8.如權(quán)利要求2所述基于視覺詞袋模型的遙感圖像目標(biāo)識別方法,其特征在于,所述相似性閾值的取值為0.75。
9.如權(quán)利要求1所述基于視覺詞袋模型的遙感圖像目標(biāo)識別方法,其特征在于,采用K-means聚類方法對所提取出的所有局部特征進(jìn)行聚類。
【文檔編號】G06K9/66GK103440508SQ201310377651
【公開日】2013年12月11日 申請日期:2013年8月26日 優(yōu)先權(quán)日:2013年8月26日
【發(fā)明者】李士進(jìn), 仇建斌, 張 杰, 馮鈞, 萬定生, 朱躍龍 申請人:河海大學(xué), 南京小網(wǎng)科技有限責(zé)任公司