專利名稱:基于選擇性視覺注意機(jī)制的遙感圖像機(jī)場目標(biāo)檢測與識別方法
技術(shù)領(lǐng)域:
本發(fā)明屬于遙感圖像處理技術(shù)領(lǐng)域,具體涉及一種遙感圖像機(jī)場目標(biāo)快速檢測與識別的方法。
背景技術(shù):
遙感圖像中典型目標(biāo)的檢測與識別是當(dāng)前自動目標(biāo)檢測與識別研究的熱點。機(jī)場作為一類特定目標(biāo),在軍事和民用領(lǐng)域都具有十分重要的意義,受到越來越多的關(guān)注。 然而,機(jī)場所處的區(qū)域背景往往很復(fù)雜,這給它的檢測與識別帶來了困難。常用的機(jī)場檢測與識別的方法大致分為兩類[1]基于邊緣提取的方法和基于區(qū)域分割的方法。前者是根據(jù)機(jī)場跑道的平行長直線特性而來的,從圖像中提取它的邊緣,然后通過Hough[2]變換等方法進(jìn)行直線檢測并輔以紋理識別以達(dá)到機(jī)場的確認(rèn)[1][3]M。而后者則是基于機(jī)場與周圍紋理的差異性,通過圖像分割的方法達(dá)到提取備選區(qū)域的目的,再在備選區(qū)域內(nèi)進(jìn)行識別[5]_[7]。上述兩類方法各自有優(yōu)點也有不足。基于邊緣提取的方法速度快、復(fù)雜度低,機(jī)場區(qū)域也能夠檢測出直線,但由于背景的干擾,有許多非機(jī)場目標(biāo)的區(qū)域會被檢測出來,如公路、山脈等等,這些干擾物都會影響識別的準(zhǔn)確性。此外,僅僅使用Hough變換的結(jié)果來定位機(jī)場,由于其所檢測出的直線長度可能超出或短于實際跑道長度,故對機(jī)場的定位相對模糊。而基于紋理分割的方法在刻畫機(jī)場區(qū)域方面要做的更好,而且它不依賴于Hough變換的結(jié)果,干擾相對少,機(jī)場本身固有的一些紋理特性也使其便于特征的訓(xùn)練和識別。但該方法在圖像分割時需要逐像元分析,因而速度慢、復(fù)雜度高,識別效果依賴于分割閾值的選取,并且是否能夠找到對旋轉(zhuǎn)、縮放、平移魯棒性強(qiáng)的用于識別的特征也會影響識別效果。 值得一提的是,目前關(guān)于機(jī)場檢測的文獻(xiàn)中對于識別的虛警率往往避而不談,遙感圖像的覆蓋范圍很廣,當(dāng)我們在對各幅不同的圖像進(jìn)行識別時,不僅要保證目標(biāo)不被遺漏,還要確保沒有目標(biāo)的地方不被識別出目標(biāo),這樣才有實際的應(yīng)用價值。近年來,注意力選擇[8]被廣泛地應(yīng)用到模式識別領(lǐng)域中,并且在自然圖像的目標(biāo)識別方面已經(jīng)收到了很好的效果。所謂視覺注意力,就是指視覺圖像場景中引起我們關(guān)注的區(qū)域。人可以在短時間內(nèi)找出眼前具有顯著特征的物體,機(jī)器視覺卻無法做到,是因為人的注意力選擇機(jī)制在發(fā)揮著作用。注意力選擇過程可分為自底向上(Bottom up)和自頂向下(Top down)兩部分自底向上的過程是指由輸入圖像生成顯著圖的過程,顯著區(qū)域即那些具有較強(qiáng)對比度的區(qū)域或與周圍有明顯差異的區(qū)域,這一過程是數(shù)據(jù)驅(qū)動的,它不受主觀意識支配;而自頂向下的過程則是與人的先驗知識及判斷有關(guān)的,有助于從顯著區(qū)域中確定目標(biāo)區(qū)域。針對機(jī)場檢測問題,由于機(jī)場與周圍的差異性比較大,我們可以認(rèn)為其是顯著的,因而可以將注意力選擇機(jī)制引入到機(jī)場檢測中。目前已有許多學(xué)者對注意力選擇機(jī)制其進(jìn)行了建模。早期Itti和Walther在計算結(jié)構(gòu)上模仿人腦形成視覺顯著性的神經(jīng)機(jī)制而分別提出了 NVT[9]模型和STB_模型,隨后Bruce基于信息論提出了最大熵AIM[11]模型,但上述三種模型計算量大復(fù)雜度高,在工程上難以應(yīng)用。為簡化計算復(fù)雜度,基于頻域的視覺顯著性方法被提出來,包括Hou的SR[12] 模型以及Guo的PFTm和PQFTm模型,這類模型運算速度很快,在自然圖像上收到了不錯的效果。但我們實驗后發(fā)現(xiàn),上述這些模型在遙感圖像復(fù)雜背景的情況下,識別效果不甚理想,因為自然圖像的背景往往是平滑的單一的,目標(biāo)很容易被分離出來,而遙感圖像雜亂無章的地表背景嚴(yán)重干擾了識別效果。與之不同的是,Harel的GBVS[15]模型收到了相對好的效果,只是運行速度上過慢而難以實時操作。如何找出適用于機(jī)場檢測問題的注意力選擇模型,并將它與用于識別的特征描述算子相結(jié)合以檢測、識別機(jī)場,是本發(fā)明主要想解決的問題。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種快速、精確的單波段遙感圖像機(jī)場檢測和識別的方法。本發(fā)明提出的遙感圖像機(jī)場目標(biāo)檢測與識別方法,是一種基于選擇性視覺注意機(jī)制的方法,該方法使用改進(jìn)后的注意力選擇模型GBVS對輸入遙感圖像進(jìn)行顯著性分析,得到顯著區(qū)域,然后提取顯著區(qū)域上的SIFT特征并代入HDR樹中識別,最終確定機(jī)場區(qū)域。與傳統(tǒng)的機(jī)場檢測和識別的方法相比,本發(fā)明不需要逐個像素地對原始圖像進(jìn)行分析,降低了運算復(fù)雜度,同時解決了機(jī)場定位不精確的問題,有效地降低了周圍復(fù)雜背景對檢測過程的干擾。本發(fā)明具有速度快、識別率高、虛警率低的特點,同時對噪聲有較強(qiáng)的魯棒性,非常適用于軍事和民用領(lǐng)域復(fù)雜背景下的實時機(jī)場目標(biāo)檢測,對于實際應(yīng)用具有較大的意義和價值。本發(fā)明提供的遙感圖像機(jī)場檢測與識別方法,包括兩部分改進(jìn)的GBVS視覺注意計算模型和基于視覺顯著性的機(jī)場目標(biāo)檢測與識別,分別描述如下
1.改進(jìn)的GBVS的視覺注意計算模型
GBVS模型是以NVT模型為基礎(chǔ),在獲得多特征通道信息之后,對每張?zhí)卣鲌D運用馬爾可夫隨機(jī)場的特點構(gòu)建二維圖像的馬爾可夫鏈,通過求其平衡分布而得到顯著圖。具體步驟如下
a.獲取多尺度的亮度信息對輸入的灰度圖像./,首先對其使用高斯金字塔低通濾波器進(jìn)行濾波,高斯金字塔的每一階都是一個二維高斯低通濾波器
權(quán)利要求
1.一種改進(jìn)的GBVS的視覺注意計算模型,原始的GBVS模型是在NVT模型基礎(chǔ)上,運用馬爾可夫隨機(jī)場的特點構(gòu)建二維圖像的馬爾可夫鏈,再通過求其平衡分布而得到顯著圖, 具體過程為a.獲取多尺度的亮度信息對輸入的灰度圖像I首先對其使用高斯金字塔低通濾波器進(jìn)行濾波,高斯金字塔的每一階都是一個二維高斯低通濾波器G(x,y, σ) = exPl^-' J(1)σ稱為尺度因子;所謂金字塔,就是指對原始圖像進(jìn)行不斷的1/2降采樣和高斯低通濾波,最終得到一組不同尺度下的濾波結(jié)果;b.獲取多尺度的方位信息用Gabor金字塔濾波器組對原始灰度圖像進(jìn)行濾波,以得到方向上的信息;二維Gabor濾波器表示如下1 ( x2+v2¥TXk 1H (χ, y, σ,θ) = -^ exp -π-^^ esp(i 2π/ {χ cos θ + ysmff))-exp(--) (2).# ( CT 兒2 J其中τ力尺度因子,/為正弦波頻率,5為方位取, ^ π π 3λ" θ= O,—,—,—— L 4 2 4 _即在四個方向上濾波,得到四組不同尺度下的濾波結(jié)果;c.求不同尺度和不同特征圖的馬爾可夫平衡對上述兩個通道五組結(jié)果中的每一組內(nèi)每一個尺度的濾波結(jié)果,求其馬爾可夫平衡分布;d.計算顯著圖將所有組所有尺度的濾波結(jié)果依次計算出平衡分布后,將結(jié)果按照通道疊加起來并歸一化;再將兩個通道的結(jié)果線性相加并歸一化得到最終的顯著圖,其大小與原始圖像一致;其特征在于對GBVS模型作如下改進(jìn)(1)僅使用兩個尺度,且將方向濾波器的數(shù)目從四個擴(kuò)展到八個;(2)對原始圖像進(jìn)行Hough變換并作為單獨的一個通道加入到模型中,將檢測到的直線用值為’ 1’的像素表示,并用高斯函數(shù)平滑,得到Hough通道的特征圖;最后將其與亮度通道、方向通道的特征圖等權(quán)重相加并歸一化,得到最終顯著圖;(3)將前述的顯著圖與經(jīng)過一次濾波的原始灰度圖像相乘,得到新的顯著圖,并作為最終結(jié)果。
2.一種基于選擇性視覺注意機(jī)制的遙感圖像機(jī)場目標(biāo)檢測與識別方法,其特征在于具體步驟如下(1)訓(xùn)練從原始的灰度圖像中選取一些作為訓(xùn)練樣本并提取SIFT特征點,把得到的 SIFT特征點對應(yīng)的特征向量分成兩類屬于機(jī)場區(qū)域的標(biāo)記為1,屬于背景區(qū)域的標(biāo)記為 0,然后把這些帶有標(biāo)簽的訓(xùn)練向量帶入到HDR樹中進(jìn)行訓(xùn)練;(2)預(yù)處理對于一幅待識別的圖像,首先對其是否存在機(jī)場目標(biāo)做一個初步的判斷, 具體的做法是對原始圖像進(jìn)行二值化處理后做Hough變換,如果存在一定范圍長度內(nèi)的直線,則認(rèn)為可能存在機(jī)場并進(jìn)行顯著性分析,否則直接按無目標(biāo)跳過;(3)生成顯著圖對于含有目標(biāo)的圖像,用如權(quán)利要求1所述的改進(jìn)的GBVS模型生成它的顯著圖;(4)生成候選區(qū)記顯著圖上最大像素值為/_:,第一步,從顯著圖中最亮的一個點向周圍八鄰域方向生長,如果某個方向上有某個像素值小于最亮點像素值的倍則該方向停止生長,其中力取值在
間的閾值;這一過程直到所有方向上的生長都停止為止;第二步,將生長完成的區(qū)域的外接矩形框畫出來,此即為一個候選區(qū)域,然后將該候選區(qū)域內(nèi)的所有像素值清零,以免被再次選中;第三步,計算上個候選區(qū)清零后的顯著圖中的最亮點的像素值,如果小于χ ,則表明所有候選區(qū)已提取完畢,進(jìn)行下一環(huán)節(jié);否則回到第一步以提取新的候選區(qū);(5)特征識別對上步提取得到的候選區(qū)依次提取SIFT特征點和對應(yīng)的特征向量,并把特征向量代入到訓(xùn)練好的HDR樹中進(jìn)行識別,獲得每個特征點的標(biāo)簽,待所有特征點標(biāo)識完畢,計算各個候選區(qū)域的特征比柱打…—標(biāo)簽為1的特征點數(shù)…兀―該區(qū)域內(nèi)特征點總數(shù)⑶(6)確定機(jī)場區(qū)域先前的候選區(qū)提取是按照顯著性從大到小的順序確定候選區(qū)域的,那么每個候選區(qū)域有兩個評價參數(shù)顯著性次序和特征比;先只觀察特征比而不考慮區(qū)域顯著性,如果只有一個區(qū)域的特征比大于設(shè)定的閾值於 ,則該區(qū)域即為機(jī)場區(qū)域,不再考察其它區(qū)域;若沒有這樣的區(qū)域,則按照區(qū)域的顯著性大小次序依次考察各個候選區(qū),只要考察的區(qū)域內(nèi)含有機(jī)場特征點,便將該區(qū)域判定為機(jī)場區(qū)域。
全文摘要
本發(fā)明屬于遙感圖像目標(biāo)檢測與識別技術(shù)領(lǐng)域,具體為一種基于選擇性視覺注意機(jī)制的遙感圖像機(jī)場目標(biāo)快速檢測和識別的方法。本發(fā)明用改進(jìn)后的注意力選擇模型GBVS(Graph-basedVisualSaliency)對原始遙感圖像進(jìn)行顯著性分析,得到顯著性區(qū)域,并根據(jù)區(qū)域上的SIFT(Scale-invariantFeatureTransform)特征結(jié)合HDR(HierachicalDiscriminantRegression)樹達(dá)到機(jī)場目標(biāo)識別的目的。本發(fā)明能有效地克服傳統(tǒng)機(jī)場檢測方法中對圖像逐像素分析的缺點。實驗結(jié)果表明,本發(fā)明較現(xiàn)有的其它機(jī)場檢測方法具有速度快、識別率高、虛警率低的特點,同時對噪聲有較強(qiáng)的魯棒性,非常適用于軍事和民用領(lǐng)域復(fù)雜背景下的實時目標(biāo)檢測,對于實際應(yīng)用具有較大的意義和價值。
文檔編號G06K9/00GK102214298SQ20111016600
公開日2011年10月12日 申請日期2011年6月20日 優(yōu)先權(quán)日2011年6月20日
發(fā)明者張立明, 王斌, 王鑫 申請人:復(fù)旦大學(xué)