專利名稱:一種基于多類(lèi)基元自主學(xué)習(xí)的復(fù)雜目標(biāo)自動(dòng)識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域中關(guān)于目標(biāo)識(shí)別的方法,是一種綜合多類(lèi)基元并通過(guò)自主學(xué)習(xí)來(lái)實(shí)現(xiàn)對(duì)圖像中多種類(lèi)型復(fù)雜目標(biāo)自動(dòng)識(shí)別的方法。
背景技術(shù):
隨著信息存儲(chǔ)與傳輸技術(shù)的進(jìn)步,圖像數(shù)量呈現(xiàn)爆炸性增長(zhǎng),圖像處理技術(shù)的應(yīng)用領(lǐng)域也隨之不斷擴(kuò)大。傳統(tǒng)依靠人工來(lái)對(duì)圖像中目標(biāo)進(jìn)行識(shí)別和解譯的方式由于需要耗費(fèi)大量的人力物力而變得不可行。因此,目標(biāo)自動(dòng)識(shí)別作為圖像處理技術(shù)中的一個(gè)重要環(huán)節(jié),日益成為各類(lèi)圖像處理應(yīng)用的基礎(chǔ)。由于現(xiàn)有圖像的數(shù)據(jù)量大,目標(biāo)類(lèi)型多樣、結(jié)構(gòu)復(fù)雜,所處場(chǎng)景的變化也較多,目前目標(biāo)自動(dòng)識(shí)別的準(zhǔn)確度并不是很高,常常出現(xiàn)漏檢和錯(cuò)檢的情況,使得某些需要精確定位目標(biāo)的應(yīng)用難以完成。因而,如何提高圖像中多類(lèi)目標(biāo)特別是復(fù)雜目標(biāo)的識(shí)別效率是一個(gè)很有意義的研究問(wèn)題。作為現(xiàn)實(shí)世界的抽象反映,圖像數(shù)據(jù)在一定程度上可以看成是由點(diǎn)、線、面等要素組合而成的。因而,目前國(guó)內(nèi)外的目標(biāo)識(shí)別方法大致也可以分為三類(lèi)。(1)基于面狀要素的方法在現(xiàn)有的目標(biāo)識(shí)別中廣泛采用的滑動(dòng)窗、網(wǎng)格,以及分割對(duì)象塊,均屬于面狀要素,可較好統(tǒng)計(jì)圖像中一定區(qū)域內(nèi)像素集合的紋理、色彩等特征信息,這類(lèi)方法計(jì)算簡(jiǎn)便,可以人為控制統(tǒng)計(jì)區(qū)域的范圍,但對(duì)于目標(biāo)的尺度和角度變化敏感,受噪聲干擾也較大。(2)基于點(diǎn)狀要素的方法=Lowe等人提出了 SIFT等圖像局部特征點(diǎn)描述子,這些特征點(diǎn)表達(dá)較為簡(jiǎn)單,具備穩(wěn)定的匹配能力,并且受尺度和旋轉(zhuǎn)變化的影響較小,但較難尋找不同示例間的共同特征,對(duì)同類(lèi)目標(biāo)不同示例之間的外觀變化包容度較小。(3)基于線狀要素的方法這類(lèi)要素可以產(chǎn)生出多種樣式來(lái)表達(dá)不同目標(biāo)的輪廓結(jié)構(gòu),即使在只有少量邊界線段的情況下,也能夠憑借二值輪廓成為目標(biāo)外觀中相對(duì)恒定的因素,克服目標(biāo)外觀差異的影響。Opelt和Pinz提出一種基于邊界基元的目標(biāo)提取方法,建立局部模板和全局質(zhì)心的空間約束條件(見(jiàn)A. Opelt, A. Pinz A. Zisserman. A boundary-fragment model for object detection. In Proc. European Conf. on Computer Vision, Graz, Austria, 2006,575-588)。Shotton 和 Blake 則將邊界片段的采樣方式稀疏化,應(yīng)用于目標(biāo)的監(jiān)督分類(lèi)(見(jiàn) J. Shotton,A. Blake,R. Cipolla. Multi-scale categorical object recognition using contour fragments. IEEE Trans Pattern Analysis and Machine Intelligence, 2006)。這類(lèi)方法自動(dòng)化程度高,一定程度上對(duì)旋轉(zhuǎn)和明暗變化等不敏感,但在實(shí)際應(yīng)用中存在著候選邊界過(guò)多,片段重復(fù)聚集,匹配速度慢等缺點(diǎn)。近年來(lái),Borenstein、Ullman等先后指出,利用單一類(lèi)型的要素不足以描述完整的目標(biāo)特征信息,并通過(guò)添加更多不同類(lèi)型的特征來(lái)提高目標(biāo)識(shí)別精度。例如,Agarwal和 Roth等在方法中對(duì)特征信息的描述方法進(jìn)行改進(jìn),在對(duì)分割塊描述的基礎(chǔ)上加入了大量尺度旋轉(zhuǎn)不變的特征點(diǎn),通過(guò)對(duì)局部要素的模板匹配尋找目標(biāo),并在部分?jǐn)?shù)據(jù)集上取得了理想的結(jié)果。然而,片面追求類(lèi)型和數(shù)量的增加,反而會(huì)使得特征維度出現(xiàn)冗余,加大計(jì)算負(fù)擔(dān)。為此,TorralbiMurphy等提出將同一類(lèi)目標(biāo)按不同的變化情況細(xì)分為若干子示例,針對(duì)每個(gè)示例的樣本圖像訓(xùn)練單獨(dú)的二值分類(lèi)器,并組成一個(gè)多分類(lèi)系統(tǒng)。由于很難判定不同示例之間的類(lèi)別界限,這種分類(lèi)系統(tǒng)的構(gòu)成尚未得到廣泛認(rèn)可,而且這類(lèi)方法過(guò)于依賴樣本數(shù)據(jù)的選擇,樣本圖像的質(zhì)量和數(shù)量波動(dòng)會(huì)極大地影響分類(lèi)器的性能。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于多類(lèi)基元自主學(xué)習(xí)的復(fù)雜目標(biāo)自動(dòng)識(shí)別方法,以解決圖像中多種類(lèi)型目標(biāo)的自動(dòng)識(shí)別問(wèn)題。為達(dá)到上述目的,本發(fā)明的技術(shù)解決方案是一種基于多類(lèi)基元自主學(xué)習(xí)的復(fù)雜目標(biāo)自動(dòng)識(shí)別方法,其包括以下步驟第一步,建立多類(lèi)復(fù)雜目標(biāo)的圖像代表集;第二步,對(duì)訓(xùn)練集中的圖像提取點(diǎn)、線、面狀基元,包括步驟a)提取線狀基元,用于描述目標(biāo)的形狀輪廓及內(nèi)部邊界;b)提取面狀基元,用于描述目標(biāo)的區(qū)域統(tǒng)計(jì)特性;C)提取點(diǎn)狀基元,用于描述目標(biāo)的尺度旋轉(zhuǎn)等特性;第三步,針對(duì)從訓(xùn)練圖像中獲取的大量基元,在確認(rèn)圖像集中進(jìn)行匹配計(jì)算、篩選合并,分別構(gòu)建點(diǎn)、線、面三個(gè)基元字典;第四步,從字典中選取一定數(shù)量的基元,配對(duì)組合后作為弱分類(lèi)器,通過(guò)自主學(xué)習(xí)分別訓(xùn)練三類(lèi)基元的強(qiáng)分類(lèi)器;第五步,利用自主學(xué)習(xí)得到的三類(lèi)基元強(qiáng)分類(lèi)器,在概率投票空間下識(shí)別和提取多種類(lèi)型的目標(biāo)。所述的方法,其所述第一步,方法是(1)根據(jù)需要定義J個(gè)類(lèi)別的復(fù)雜目標(biāo),類(lèi)別編號(hào)為1 J,J為自然數(shù);(2)對(duì)每個(gè)目標(biāo)類(lèi)別,選取30-500幅圖像作為代表圖像,任選20-100幅包含目標(biāo)的圖像作為訓(xùn)練集,隨機(jī)選取與訓(xùn)練集數(shù)目相同的圖像作為確認(rèn)集,其中正樣本圖像和負(fù)樣本圖像比例為1 1,其余圖像作為測(cè)試集;(3)對(duì)每幅目標(biāo)圖像進(jìn)行標(biāo)記,標(biāo)記出目標(biāo)所屬類(lèi)別及所在的區(qū)域范圍;(4)將所有J類(lèi)目標(biāo)的圖像代表合并為多類(lèi)目標(biāo)圖像代表集。所述的方法,其所述第二步中a)提取線狀基元,包括(1)使用Carmy算子處理所有訓(xùn)練圖像,連接較短邊界,濾除邊界噪聲;(2)從訓(xùn)練圖像中隨機(jī)抽取邊界片段作為線狀基元?dú)g,計(jì)算基元參數(shù),每個(gè)基元在保持基本信息不變的條件下,都可以按不同的尺寸大小和旋轉(zhuǎn)方向進(jìn)行變換,尋求最佳匹配的形式;依此得到所有的線狀基元;b)提取面狀基元,包括(1)對(duì)于每一幅訓(xùn)練圖像,使用Normalized-cut算法進(jìn)行區(qū)域分割;(2)從訓(xùn)練圖像中隨機(jī)抽取分割塊作為面狀基元6,,基元參數(shù)計(jì)算方式與第二步中a)步( 所述相同;依此得到所有的面狀基元;C)提取點(diǎn)狀基元,包括(1)將所有訓(xùn)練圖像進(jìn)行網(wǎng)格劃分,以每個(gè)網(wǎng)格中心為采樣點(diǎn),在網(wǎng)格區(qū)域內(nèi)計(jì)算梯度直方圖得到SIFT點(diǎn)特征;(2)從訓(xùn)練圖像中隨機(jī)選取特征點(diǎn)作為點(diǎn)狀基元6Λ基元參數(shù)計(jì)算方式與第二步中a)步( 所述相同;依此得到所有的點(diǎn)狀基元。所述的方法,其所述第三步,包括步驟如下(1)對(duì)于訓(xùn)練圖像中隨機(jī)選取的基元,計(jì)算每個(gè)基元的匹配能量Cost(Bi),取最小值為最優(yōu)匹配能量,量化表達(dá)每個(gè)基元所包含的信息;(2)遍歷篩選基元,將每幅訓(xùn)練樣本圖像中的基元匹配能量值由小到大排序,建議保留最優(yōu)的20個(gè)用于后續(xù)處理;(3)對(duì)三類(lèi)篩選得到的基元分別構(gòu)建高斯混合模型,結(jié)合最小描述長(zhǎng)度準(zhǔn)則估計(jì)聚類(lèi)中心個(gè)數(shù),利用K-means算法聚類(lèi)量化構(gòu)成最終的三個(gè)基元字典,分別是面狀基元字典Ω”線狀基元字典Q1*點(diǎn)狀基元字典Ωρ,為保證計(jì)算效率,各類(lèi)字典包含基元的總量不超過(guò)200個(gè)。所述的方法,其所述第四步,包括步驟如下(1)從字典中選取Μ。個(gè)基元配對(duì)組合,取各個(gè)基元預(yù)測(cè)質(zhì)心連線的中點(diǎn)作為基元對(duì)預(yù)測(cè)質(zhì)心的位置,當(dāng)質(zhì)心連線長(zhǎng)度大于d。時(shí),認(rèn)為該基元組合不合理而丟棄,建議取M。為 2至4個(gè),d。為30個(gè)像素;(2)計(jì)算基元對(duì)的似然度函數(shù)RQii, I),該值越小,說(shuō)明目標(biāo)出現(xiàn)概率越?。?3)分別求取三類(lèi)基元的弱分類(lèi)器I^hi以圖像平面上的像素χ為輸入,其輸出是對(duì)X是否為目標(biāo)質(zhì)心的預(yù)測(cè);(4)利用自主學(xué)習(xí)分別構(gòu)建三類(lèi)基元的強(qiáng)分類(lèi)器,對(duì)于C類(lèi)目標(biāo),可以通過(guò) L—Σ , 來(lái)度量,其中仏為用于區(qū)分每個(gè)類(lèi)別的弱分類(lèi)器數(shù)目,Ts為共享使用的弱分類(lèi)器數(shù)目,假設(shè)已經(jīng)學(xué)習(xí)得到了 Ca類(lèi)目標(biāo)的分類(lèi)器,在識(shí)別新出現(xiàn)的目標(biāo)類(lèi)別時(shí),先考察已經(jīng)得到的弱分類(lèi)器是否滿足新的類(lèi)別,若滿足,則將已有弱分類(lèi)器的共享擴(kuò)展到新類(lèi),然后通過(guò)聯(lián)合學(xué)習(xí)得到剩余的信息,即Τ-Α個(gè)弱分類(lèi)器的組合,其中T為預(yù)先定義的弱分類(lèi)器總數(shù)。所述的方法,其所述第四步中(4)步,包括步驟如下a)對(duì)于C類(lèi)目標(biāo),每個(gè)類(lèi)別包含N+幅正樣本確認(rèn)圖像,N_幅負(fù)樣本確認(rèn)圖像,標(biāo)記為/,。,由此輸入確認(rèn)圖像集為(/,,/,。),·..,(/",《),其中e{C,-l},N = N++N_,對(duì)于每個(gè)類(lèi)別 Ci,依據(jù)正樣本確認(rèn)圖像的數(shù)目歸一化權(quán)重;b)當(dāng)Ci = 1,2, ...C時(shí),對(duì)于每個(gè)弱分類(lèi)器hA(I,Sn) e Ha(I,c),其中&為目標(biāo)類(lèi)別列表,若一 <0.5,則有hA = hA(I, Sn η Ci),在此基礎(chǔ)上更新權(quán)重<,令t = t+ι,且
W;c)從η = 1開(kāi)始,循環(huán)迭代C(C+l)/2次,尋找最優(yōu)弱分類(lèi)器ht(I,Sn),確定權(quán)重然后評(píng)估分類(lèi)器的性能Pn ;d)選取最優(yōu)共享,即" = ai_gm axG,并獲取對(duì)應(yīng)的ht,&;e)更新強(qiáng)分類(lèi)器H (I,C)和權(quán)重< ;f)重復(fù)前述a)至e)步,不斷更新?;,直至滿足^ > TVc,時(shí)結(jié)束訓(xùn)練,獲得最終的強(qiáng)分類(lèi)器H(I,c)。所述的方法,其所述第五步,包括步驟如下
(1)按照第二步中a)的⑴步、第二步中b)的⑴步和第二步中C)的⑴步的方法分別對(duì)測(cè)試圖像做預(yù)處理;(2)利用自主學(xué)習(xí)得到的強(qiáng)分類(lèi)器H(I,c)分別對(duì)預(yù)處理后的測(cè)試圖像進(jìn)行概率匹配,得到目標(biāo)類(lèi)別及其對(duì)應(yīng)的預(yù)測(cè)質(zhì)心。所述的方法,其所述第五步中( 步,包括步驟如下a)將每一個(gè)弱分類(lèi)器Iii中包含的基元Bj與預(yù)處理后的測(cè)試圖像I相匹配,并將其映射到w,l]區(qū)間上的類(lèi)概率密度函數(shù)P Oii))進(jìn)行計(jì)算;b)在Hough投票空間下對(duì)圖像上獲取的任一候選質(zhì)心點(diǎn)χ e I進(jìn)行加權(quán)投票,并統(tǒng)計(jì)X的總得票數(shù)700 = ^>,,(/,勻,引入判決閾值thv,當(dāng)v(x) > thv時(shí)表明強(qiáng)分類(lèi)器判
權(quán)利要求
1.一種基于多類(lèi)基元自主學(xué)習(xí)的復(fù)雜目標(biāo)自動(dòng)識(shí)別方法,其特征在于,包括以下步驟第一步,建立多類(lèi)復(fù)雜目標(biāo)的圖像代表集;第二步,對(duì)訓(xùn)練集中的圖像提取點(diǎn)、線、面狀基元,包括步驟a)提取線狀基元,用于描述目標(biāo)的形狀輪廓及內(nèi)部邊界;b)提取面狀基元,用于描述目標(biāo)的區(qū)域統(tǒng)計(jì)特性;c)提取點(diǎn)狀基元,用于描述目標(biāo)的尺度旋轉(zhuǎn)等特性;第三步,針對(duì)從訓(xùn)練圖像中獲取的大量基元,在確認(rèn)圖像集中進(jìn)行匹配計(jì)算、篩選合并,分別構(gòu)建點(diǎn)、線、面三個(gè)基元字典;第四步,從字典中選取一定數(shù)量的基元,配對(duì)組合后作為弱分類(lèi)器,通過(guò)自主學(xué)習(xí)分別訓(xùn)練三類(lèi)基元的強(qiáng)分類(lèi)器;第五步,利用自主學(xué)習(xí)得到的三類(lèi)基元強(qiáng)分類(lèi)器,在概率投票空間下識(shí)別和提取多種類(lèi)型的目標(biāo)。
2.如權(quán)利要求1所述的方法,其特征在于,所述第一步,方法是(1)根據(jù)需要定義J個(gè)類(lèi)別的復(fù)雜目標(biāo),類(lèi)別編號(hào)為1 J,J為自然數(shù);(2)對(duì)每個(gè)目標(biāo)類(lèi)別,選取30-500幅圖像作為代表圖像,任選20-100幅包含目標(biāo)的圖像作為訓(xùn)練集,隨機(jī)選取與訓(xùn)練集數(shù)目相同的圖像作為確認(rèn)集,其中正樣本圖像和負(fù)樣本圖像比例為1 1,其余圖像作為測(cè)試集;(3)對(duì)每幅目標(biāo)圖像進(jìn)行標(biāo)記,標(biāo)記出目標(biāo)所屬類(lèi)別及所在的區(qū)域范圍;(4)將所有J類(lèi)目標(biāo)的圖像代表合并為多類(lèi)目標(biāo)圖像代表集。
3.如權(quán)利要求1所述的方法,其特征在于,所述第二步中a)提取線狀基元,包括(1)使用Carmy算子處理所有訓(xùn)練圖像,連接較短邊界,濾除邊界噪聲;(2)從訓(xùn)練圖像中隨機(jī)抽取邊界片段作為線狀基元辟^計(jì)算基元參數(shù),每個(gè)基元在保持基本信息不變的條件下,都可以按不同的尺寸大小和旋轉(zhuǎn)方向進(jìn)行變換,尋求最佳匹配的形式;依此得到所有的線狀基元;b)提取面狀基元,包括(1)對(duì)于每一幅訓(xùn)練圖像,使用Normalized-cut算法進(jìn)行區(qū)域分割;(2)從訓(xùn)練圖像中隨機(jī)抽取分割塊作為面狀基元^,基元參數(shù)計(jì)算方式與第二步中a) 步(2)所述相同;依此得到所有的面狀基元;c)提取點(diǎn)狀基元,包括(1)將所有訓(xùn)練圖像進(jìn)行網(wǎng)格劃分,以每個(gè)網(wǎng)格中心為采樣點(diǎn),在網(wǎng)格區(qū)域內(nèi)計(jì)算梯度直方圖得到SIFT點(diǎn)特征;(2)從訓(xùn)練圖像中隨機(jī)選取特征點(diǎn)作為點(diǎn)狀基元錢(qián)基元參數(shù)計(jì)算方式與第二步中a) 步(2)所述相同;依此得到所有的點(diǎn)狀基元。
4.如權(quán)利要求1所述的方法,其特征在于,所述第三步,包括步驟如下(1)對(duì)于訓(xùn)練圖像中隨機(jī)選取的基元,計(jì)算每個(gè)基元的匹配能量Cost(Bi),取最小值為最優(yōu)匹配能量,量化表達(dá)每個(gè)基元所包含的信息;(2)遍歷篩選基元,將每幅訓(xùn)練樣本圖像中的基元匹配能量值由小到大排序,建議保留最優(yōu)的20個(gè)用于后續(xù)處理;(3)對(duì)三類(lèi)篩選得到的基元分別構(gòu)建高斯混合模型,結(jié)合最小描述長(zhǎng)度準(zhǔn)則估計(jì)聚類(lèi)中心個(gè)數(shù),利用K-means算法聚類(lèi)量化構(gòu)成最終的三個(gè)字典,分別是面狀基元字典Ω”線狀基元字典Ω 點(diǎn)狀基元字典Ω p,為保證計(jì)算效率,各類(lèi)字典包含基元總量不超過(guò)200個(gè)。
5.如權(quán)利要求1所述的方法,其特征在于,所述第四步,包括步驟如下(1)從字典中選取M。個(gè)基元配對(duì)組合,取各個(gè)基元預(yù)測(cè)質(zhì)心連線的中點(diǎn)作為基元對(duì)預(yù)測(cè)質(zhì)心的位置,當(dāng)質(zhì)心連線長(zhǎng)度大于d。時(shí),認(rèn)為該基元組合不合理而丟棄,建議取M。為2至 4個(gè),d。為30個(gè)像素;(2)計(jì)算基元對(duì)的似然度函數(shù)ROii,I),該值越小,說(shuō)明目標(biāo)出現(xiàn)概率越小;(3)分別求取三類(lèi)基元的弱分類(lèi)器I^hi以圖像平面上的像素χ為輸入,其輸出是對(duì)χ 是否為目標(biāo)質(zhì)心的預(yù)測(cè);(4)利用自主學(xué)習(xí)分別構(gòu)建三類(lèi)基元的強(qiáng)分類(lèi)器,對(duì)于C類(lèi)目標(biāo),可以通過(guò)Ts-J^1I來(lái)度量,其中A為用于區(qū)分每個(gè)類(lèi)別的弱分類(lèi)器數(shù)目,Ts為共享使用的弱分類(lèi)器數(shù)目,假設(shè)已經(jīng)學(xué)習(xí)得到了 Ca類(lèi)目標(biāo)的分類(lèi)器,在識(shí)別新出現(xiàn)的目標(biāo)類(lèi)別時(shí),先考察已經(jīng)得到的弱分類(lèi)器是否滿足新的類(lèi)別,若滿足,則將已有弱分類(lèi)器的共享擴(kuò)展到新類(lèi),然后通過(guò)聯(lián)合學(xué)習(xí)得到剩余的信息,即A個(gè)弱分類(lèi)器的組合,其中T為預(yù)先定義的弱分類(lèi)器總數(shù)。
6.如權(quán)利要求5所述的方法,其特征在于,所述第四步中(4)步,包括步驟如下a)對(duì)于C類(lèi)目標(biāo),每個(gè)類(lèi)別包含N+幅正樣本確認(rèn)圖像,N_幅負(fù)樣本確認(rèn)圖像,標(biāo)記為 ,由此輸入確認(rèn)圖像集為(/』),·..,(、{),其中(e|C,-lj,N = N++N_,對(duì)于每個(gè)類(lèi)別4,依據(jù)正樣本確認(rèn)圖像的數(shù)目歸一化權(quán)重w尸;b)當(dāng)^二丄二,…丄時(shí),對(duì)于每個(gè)弱分類(lèi)器!!^〗』》eHA(I,c),其中&為目標(biāo)類(lèi)別列表,若一 < 0.5,則有hA = hA(I,Sn Π Ci),在此基礎(chǔ)上更新權(quán)重<,令t = t+Ι,且7; = TCj +1 ;c)從η= 1開(kāi)始,循環(huán)迭代C(C+l)/2次,尋找最優(yōu)弱分類(lèi)器ht(I,Sn),確定權(quán)重於,然后評(píng)估分類(lèi)器的性能Pn;d)選取最優(yōu)共享,即"=^gmaxPn,并獲取對(duì)應(yīng)的ht,Sn;e)更新強(qiáng)分類(lèi)器H(I,c)和權(quán)重f)重復(fù)前述a)至e)步,不斷更新&,直至滿足&2 ^Vc,時(shí)結(jié)束訓(xùn)練,獲得最終的強(qiáng)分類(lèi)器 H(I,c)。
7.如權(quán)利要求1所述的方法,其特征在于,所述第五步,包括步驟如下(1)按照第二步中a)的⑴步、第二步中b)的⑴步和第二步中c)的⑴步的方法分別對(duì)測(cè)試圖像做預(yù)處理;(2)利用自主學(xué)習(xí)得到的強(qiáng)分類(lèi)器H(I,c)分別對(duì)預(yù)處理后的測(cè)試圖像進(jìn)行概率匹配, 得到目標(biāo)類(lèi)別及其對(duì)應(yīng)的預(yù)測(cè)質(zhì)心。
8.如權(quán)利要求1或7所述的方法,其特征在于,所述第五步中(2)步,包括步驟如下a)將每一個(gè)弱分類(lèi)器Iii中包含的基元B」與預(yù)處理后的測(cè)試圖像I相匹配,并將其映射到W,l]區(qū)間上的類(lèi)概率密度函數(shù)P Oii)進(jìn)行計(jì)算;b)在Hough投票空間下對(duì)圖像上獲取的任一候選質(zhì)心點(diǎn)χe I進(jìn)行加權(quán)投票,并統(tǒng)計(jì)X的總得票數(shù)MO = Yhχι,C),引入判決閾值thv,當(dāng)V(X) > thv時(shí)表明強(qiáng)分類(lèi)器判定X為目標(biāo)的預(yù)測(cè)質(zhì)心點(diǎn),一般取thv = 0即可;c)得到圖像I平面上分別得到三類(lèi)基元最終的所有質(zhì)心點(diǎn)及可能為某類(lèi)目標(biāo)質(zhì)心的概率后,將這三個(gè)概率進(jìn)行空間疊加,運(yùn)用Mean-Shift聚類(lèi)估計(jì)得到最終的目標(biāo)質(zhì)心,進(jìn)一步統(tǒng)計(jì)選舉中獲勝的基元在圖像I中的匹配位置,得到目標(biāo)的識(shí)別類(lèi)型、空間位置和精確形狀。
9.如權(quán)利要求1或3所述的方法,其特征在于,所述第二步b)步(1)中,使用 Normalized-cut算法進(jìn)行分割的塊數(shù)K的計(jì)算方式如下K = \Ih)}m⑴其中C7為分割系數(shù),Iw和Ib分別為圖像長(zhǎng)寬的像素?cái)?shù),「 為上取整高斯函數(shù)。
10.如權(quán)利要求1或3所述的方法,其特征在于,所述第二步中,每個(gè)基元Bi在利用尺寸和方向變化尋求最佳匹配時(shí)有B' i = Bi i = 1,2,· · .,N (2)其中,B'的變換形式。當(dāng)且僅當(dāng)存在(τ y Ui)滿足以下條件時(shí),等式成立 其中,fjPf' i分別為對(duì)象BjnB' i的像素列表,屯和(1' i分別為對(duì)象BjPB' i 的質(zhì)心到目標(biāo)質(zhì)心的相對(duì)距離,Si和s' i分別為對(duì)象Bi和B' i的尺度因子,約和W分別為對(duì)象Bi和B' i相對(duì)目標(biāo)質(zhì)心水平線的逆時(shí)針旋轉(zhuǎn)角度,τ i為比例參數(shù),、為旋轉(zhuǎn)參數(shù),=表示兩者相等或相似,%,O2分別為T(mén)i, Ui的取值上下限,建議取Ol = 10,Q2 = π /15。
11.如權(quán)利要求1或4所述的方法,其特征在于,所述第三步(1)步中,匹配能量計(jì)算方法如下Cost (Bi) = mm [Costfeal (Bi) ■ Costhc (5,)]( 4 )其中,△為基元Bi依據(jù)不同尺寸和方向得到的變換基元集合;公式⑷中,Costfeat(Bi)用來(lái)度量對(duì)象的特征信息=--(5)其中,N+和N—分別代表正負(fù)樣本確認(rèn)圖像I+和Γ的數(shù)量,diff (Bi, Ij)表示Bi和圖片 Ij的差異度;對(duì)于線狀基元,假設(shè)包含像素個(gè)數(shù)為Mp,將基元沿確認(rèn)圖像Ij的邊界逐步掃描,在位置 χ處的匹配度定義如下其中,1111表示圖像平面上兩點(diǎn)之間的歐氏距離,<表示當(dāng)基元處于位置X時(shí),確認(rèn)圖像中與基元中第i個(gè)邊緣點(diǎn)Pi距離最近的邊緣點(diǎn);對(duì)于面狀基元,計(jì)算得到基元代的12維特征向量Vi,包括灰度均值、標(biāo)準(zhǔn)差、均值比例、 最小/最大像素值、最大差、均一性、對(duì)比性、差異性、熵、角二階矩、相關(guān)性;統(tǒng)計(jì)圖像整體的特征向量V' J來(lái)近似模擬對(duì)象的屬性,有
12.如權(quán)利要求1或5所述的方法,其特征在于,所述第四步(2)步中,似然度函數(shù) ROii, I)定義為
13.如權(quán)利要求1或5所述的方法,其特征在于,所述第四步(3)步中,弱分類(lèi)器Iii的定義為
14.如權(quán)利要求1、5或6所述的方法,其特征在于,所述第四步(4)步a)中,歸一化權(quán)重wf的計(jì)算方式為
15.如權(quán)利要求1、5或6所述的方法,其特征在于,所述第四步(4)步b)中,限定用于權(quán)值更新的錯(cuò)誤、取值為0.3。
16.如權(quán)利要求1、5或6所述的方法,其特征在于,所述第四步(4)步c)中,分類(lèi)器性能Pn的計(jì)算方式為
17.如權(quán)利要求1、5或6所述的方法,其特征在于,所述第四步(4)步e)中,在更新強(qiáng)分類(lèi)器H(I,c)和權(quán)重<時(shí),應(yīng)當(dāng)滿足以下條件 \H(l,c) = H{l,c) + a,hl(l,Sn) '^,(.hA
18.如權(quán)利要求1、7或8所述的方法,其特征在于,所述第五步中(2)步a)中,類(lèi)概率密度函數(shù)P OO進(jìn)行計(jì)算,記作 其中,Q為圖像I中所有匹配的弱分類(lèi)器,且有score Qv I) = 1/R(hi; I)。
全文摘要
一種基于多類(lèi)基元自主學(xué)習(xí)的復(fù)雜目標(biāo)自動(dòng)識(shí)別方法,步驟為a)建立多類(lèi)目標(biāo)圖像代表集;b)對(duì)訓(xùn)練集中的圖像做預(yù)處理,分別提取點(diǎn)狀、線狀、面狀三類(lèi)基元;c)在確認(rèn)圖像集中對(duì)獲取的大量基元進(jìn)行匹配計(jì)算、篩選合并,分別構(gòu)建點(diǎn)、線、面三個(gè)基元字典;d)從字典中選取一定數(shù)量的基元,配對(duì)組合后作為弱分類(lèi)器,通過(guò)自主學(xué)習(xí)分別訓(xùn)練三類(lèi)基元的強(qiáng)分類(lèi)器;e)在概率投票空間下將三類(lèi)基元強(qiáng)分類(lèi)器結(jié)合,實(shí)現(xiàn)多類(lèi)復(fù)雜目標(biāo)的準(zhǔn)確定位、輪廓提取和類(lèi)型識(shí)別。本發(fā)明方法具有較高的智能化程度,能夠滿足多種類(lèi)型復(fù)雜目標(biāo)的識(shí)別和圖像解譯需求。
文檔編號(hào)G06K9/66GK102436589SQ20101029889
公開(kāi)日2012年5月2日 申請(qǐng)日期2010年9月29日 優(yōu)先權(quán)日2010年9月29日
發(fā)明者付琨, 孫顯, 王宏琦 申請(qǐng)人:中國(guó)科學(xué)院電子學(xué)研究所