一種基于多類(lèi)基元自主學(xué)習(xí)的復(fù)雜目標(biāo)自動(dòng)識(shí)別方法

文檔序號(hào)：6486052閱讀：647來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：一種基于多類(lèi)基元自主學(xué)習(xí)的復(fù)雜目標(biāo)自動(dòng)識(shí)別方法
技術(shù)領(lǐng)域：
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域中關(guān)于目標(biāo)識(shí)別的方法，是一種綜合多類(lèi)基元并通過(guò)自主學(xué)習(xí)來(lái)實(shí)現(xiàn)對(duì)圖像中多種類(lèi)型復(fù)雜目標(biāo)自動(dòng)識(shí)別的方法。
背景技術(shù)：
隨著信息存儲(chǔ)與傳輸技術(shù)的進(jìn)步，圖像數(shù)量呈現(xiàn)爆炸性增長(zhǎng)，圖像處理技術(shù)的應(yīng)用領(lǐng)域也隨之不斷擴(kuò)大。傳統(tǒng)依靠人工來(lái)對(duì)圖像中目標(biāo)進(jìn)行識(shí)別和解譯的方式由于需要耗費(fèi)大量的人力物力而變得不可行。因此，目標(biāo)自動(dòng)識(shí)別作為圖像處理技術(shù)中的一個(gè)重要環(huán)節(jié)，日益成為各類(lèi)圖像處理應(yīng)用的基礎(chǔ)。由于現(xiàn)有圖像的數(shù)據(jù)量大，目標(biāo)類(lèi)型多樣、結(jié)構(gòu)復(fù)雜，所處場(chǎng)景的變化也較多，目前目標(biāo)自動(dòng)識(shí)別的準(zhǔn)確度并不是很高，常常出現(xiàn)漏檢和錯(cuò)檢的情況，使得某些需要精確定位目標(biāo)的應(yīng)用難以完成。因而，如何提高圖像中多類(lèi)目標(biāo)特別是復(fù)雜目標(biāo)的識(shí)別效率是一個(gè)很有意義的研究問(wèn)題。作為現(xiàn)實(shí)世界的抽象反映，圖像數(shù)據(jù)在一定程度上可以看成是由點(diǎn)、線、面等要素組合而成的。因而，目前國(guó)內(nèi)外的目標(biāo)識(shí)別方法大致也可以分為三類(lèi)。(1)基于面狀要素的方法在現(xiàn)有的目標(biāo)識(shí)別中廣泛采用的滑動(dòng)窗、網(wǎng)格，以及分割對(duì)象塊，均屬于面狀要素，可較好統(tǒng)計(jì)圖像中一定區(qū)域內(nèi)像素集合的紋理、色彩等特征信息，這類(lèi)方法計(jì)算簡(jiǎn)便，可以人為控制統(tǒng)計(jì)區(qū)域的范圍，但對(duì)于目標(biāo)的尺度和角度變化敏感，受噪聲干擾也較大。(2)基于點(diǎn)狀要素的方法=Lowe等人提出了 SIFT等圖像局部特征點(diǎn)描述子，這些特征點(diǎn)表達(dá)較為簡(jiǎn)單，具備穩(wěn)定的匹配能力，并且受尺度和旋轉(zhuǎn)變化的影響較小，但較難尋找不同示例間的共同特征，對(duì)同類(lèi)目標(biāo)不同示例之間的外觀變化包容度較小。(3)基于線狀要素的方法這類(lèi)要素可以產(chǎn)生出多種樣式來(lái)表達(dá)不同目標(biāo)的輪廓結(jié)構(gòu)，即使在只有少量邊界線段的情況下，也能夠憑借二值輪廓成為目標(biāo)外觀中相對(duì)恒定的因素，克服目標(biāo)外觀差異的影響。Opelt和Pinz提出一種基于邊界基元的目標(biāo)提取方法，建立局部模板和全局質(zhì)心的空間約束條件(見(jiàn)A. Opelt, A. Pinz A. Zisserman. A boundary-fragment model for object detection. In Proc. European Conf. on Computer Vision, Graz, Austria, 2006，575-588)。Shotton 和 Blake 則將邊界片段的采樣方式稀疏化，應(yīng)用于目標(biāo)的監(jiān)督分類(lèi)(見(jiàn) J. Shotton,A. Blake,R. Cipolla. Multi-scale categorical object recognition using contour fragments. IEEE Trans Pattern Analysis and Machine Intelligence, 2006)。這類(lèi)方法自動(dòng)化程度高，一定程度上對(duì)旋轉(zhuǎn)和明暗變化等不敏感，但在實(shí)際應(yīng)用中存在著候選邊界過(guò)多，片段重復(fù)聚集，匹配速度慢等缺點(diǎn)。近年來(lái)，Borenstein、Ullman等先后指出，利用單一類(lèi)型的要素不足以描述完整的目標(biāo)特征信息，并通過(guò)添加更多不同類(lèi)型的特征來(lái)提高目標(biāo)識(shí)別精度。例如，Agarwal和 Roth等在方法中對(duì)特征信息的描述方法進(jìn)行改進(jìn)，在對(duì)分割塊描述的基礎(chǔ)上加入了大量尺度旋轉(zhuǎn)不變的特征點(diǎn)，通過(guò)對(duì)局部要素的模板匹配尋找目標(biāo)，并在部分?jǐn)?shù)據(jù)集上取得了理想的結(jié)果。然而，片面追求類(lèi)型和數(shù)量的增加，反而會(huì)使得特征維度出現(xiàn)冗余，加大計(jì)算負(fù)擔(dān)。為此，TorralbiMurphy等提出將同一類(lèi)目標(biāo)按不同的變化情況細(xì)分為若干子示例，針對(duì)每個(gè)示例的樣本圖像訓(xùn)練單獨(dú)的二值分類(lèi)器，并組成一個(gè)多分類(lèi)系統(tǒng)。由于很難判定不同示例之間的類(lèi)別界限，這種分類(lèi)系統(tǒng)的構(gòu)成尚未得到廣泛認(rèn)可，而且這類(lèi)方法過(guò)于依賴樣本數(shù)據(jù)的選擇，樣本圖像的質(zhì)量和數(shù)量波動(dòng)會(huì)極大地影響分類(lèi)器的性能。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于多類(lèi)基元自主學(xué)習(xí)的復(fù)雜目標(biāo)自動(dòng)識(shí)別方法，以解決圖像中多種類(lèi)型目標(biāo)的自動(dòng)識(shí)別問(wèn)題。為達(dá)到上述目的，本發(fā)明的技術(shù)解決方案是一種基于多類(lèi)基元自主學(xué)習(xí)的復(fù)雜目標(biāo)自動(dòng)識(shí)別方法，其包括以下步驟第一步，建立多類(lèi)復(fù)雜目標(biāo)的圖像代表集；第二步，對(duì)訓(xùn)練集中的圖像提取點(diǎn)、線、面狀基元，包括步驟a)提取線狀基元，用于描述目標(biāo)的形狀輪廓及內(nèi)部邊界；b)提取面狀基元，用于描述目標(biāo)的區(qū)域統(tǒng)計(jì)特性；C)提取點(diǎn)狀基元，用于描述目標(biāo)的尺度旋轉(zhuǎn)等特性；第三步，針對(duì)從訓(xùn)練圖像中獲取的大量基元，在確認(rèn)圖像集中進(jìn)行匹配計(jì)算、篩選合并，分別構(gòu)建點(diǎn)、線、面三個(gè)基元字典；第四步，從字典中選取一定數(shù)量的基元，配對(duì)組合后作為弱分類(lèi)器，通過(guò)自主學(xué)習(xí)分別訓(xùn)練三類(lèi)基元的強(qiáng)分類(lèi)器；第五步，利用自主學(xué)習(xí)得到的三類(lèi)基元強(qiáng)分類(lèi)器，在概率投票空間下識(shí)別和提取多種類(lèi)型的目標(biāo)。所述的方法，其所述第一步，方法是(1)根據(jù)需要定義J個(gè)類(lèi)別的復(fù)雜目標(biāo)，類(lèi)別編號(hào)為1 J，J為自然數(shù)；(2)對(duì)每個(gè)目標(biāo)類(lèi)別，選取30-500幅圖像作為代表圖像，任選20-100幅包含目標(biāo)的圖像作為訓(xùn)練集，隨機(jī)選取與訓(xùn)練集數(shù)目相同的圖像作為確認(rèn)集，其中正樣本圖像和負(fù)樣本圖像比例為1 1，其余圖像作為測(cè)試集；(3)對(duì)每幅目標(biāo)圖像進(jìn)行標(biāo)記，標(biāo)記出目標(biāo)所屬類(lèi)別及所在的區(qū)域范圍；(4)將所有J類(lèi)目標(biāo)的圖像代表合并為多類(lèi)目標(biāo)圖像代表集。所述的方法，其所述第二步中a)提取線狀基元，包括(1)使用Carmy算子處理所有訓(xùn)練圖像，連接較短邊界，濾除邊界噪聲；(2)從訓(xùn)練圖像中隨機(jī)抽取邊界片段作為線狀基元?dú)g，計(jì)算基元參數(shù)，每個(gè)基元在保持基本信息不變的條件下，都可以按不同的尺寸大小和旋轉(zhuǎn)方向進(jìn)行變換，尋求最佳匹配的形式；依此得到所有的線狀基元；b)提取面狀基元，包括(1)對(duì)于每一幅訓(xùn)練圖像，使用Normalized-cut算法進(jìn)行區(qū)域分割；(2)從訓(xùn)練圖像中隨機(jī)抽取分割塊作為面狀基元6,，基元參數(shù)計(jì)算方式與第二步中a)步( 所述相同；依此得到所有的面狀基元；C)提取點(diǎn)狀基元，包括(1)將所有訓(xùn)練圖像進(jìn)行網(wǎng)格劃分，以每個(gè)網(wǎng)格中心為采樣點(diǎn)，在網(wǎng)格區(qū)域內(nèi)計(jì)算梯度直方圖得到SIFT點(diǎn)特征；(2)從訓(xùn)練圖像中隨機(jī)選取特征點(diǎn)作為點(diǎn)狀基元6Λ基元參數(shù)計(jì)算方式與第二步中a)步( 所述相同；依此得到所有的點(diǎn)狀基元。所述的方法，其所述第三步，包括步驟如下(1)對(duì)于訓(xùn)練圖像中隨機(jī)選取的基元，計(jì)算每個(gè)基元的匹配能量Cost(Bi),取最小值為最優(yōu)匹配能量，量化表達(dá)每個(gè)基元所包含的信息；(2)遍歷篩選基元，將每幅訓(xùn)練樣本圖像中的基元匹配能量值由小到大排序，建議保留最優(yōu)的20個(gè)用于后續(xù)處理；(3)對(duì)三類(lèi)篩選得到的基元分別構(gòu)建高斯混合模型，結(jié)合最小描述長(zhǎng)度準(zhǔn)則估計(jì)聚類(lèi)中心個(gè)數(shù)，利用K-means算法聚類(lèi)量化構(gòu)成最終的三個(gè)基元字典，分別是面狀基元字典Ω”線狀基元字典Q1*點(diǎn)狀基元字典Ωρ，為保證計(jì)算效率，各類(lèi)字典包含基元的總量不超過(guò)200個(gè)。所述的方法，其所述第四步，包括步驟如下(1)從字典中選取Μ。個(gè)基元配對(duì)組合，取各個(gè)基元預(yù)測(cè)質(zhì)心連線的中點(diǎn)作為基元對(duì)預(yù)測(cè)質(zhì)心的位置，當(dāng)質(zhì)心連線長(zhǎng)度大于d。時(shí)，認(rèn)為該基元組合不合理而丟棄，建議取M。為 2至4個(gè)，d。為30個(gè)像素；(2)計(jì)算基元對(duì)的似然度函數(shù)RQii, I)，該值越小，說(shuō)明目標(biāo)出現(xiàn)概率越?。?3)分別求取三類(lèi)基元的弱分類(lèi)器I^hi以圖像平面上的像素χ為輸入，其輸出是對(duì)X是否為目標(biāo)質(zhì)心的預(yù)測(cè)；(4)利用自主學(xué)習(xí)分別構(gòu)建三類(lèi)基元的強(qiáng)分類(lèi)器，對(duì)于C類(lèi)目標(biāo)，可以通過(guò) L—Σ , 來(lái)度量，其中仏為用于區(qū)分每個(gè)類(lèi)別的弱分類(lèi)器數(shù)目，Ts為共享使用的弱分類(lèi)器數(shù)目，假設(shè)已經(jīng)學(xué)習(xí)得到了 Ca類(lèi)目標(biāo)的分類(lèi)器，在識(shí)別新出現(xiàn)的目標(biāo)類(lèi)別時(shí)，先考察已經(jīng)得到的弱分類(lèi)器是否滿足新的類(lèi)別，若滿足，則將已有弱分類(lèi)器的共享擴(kuò)展到新類(lèi)，然后通過(guò)聯(lián)合學(xué)習(xí)得到剩余的信息，即Τ-Α個(gè)弱分類(lèi)器的組合，其中T為預(yù)先定義的弱分類(lèi)器總數(shù)。所述的方法，其所述第四步中(4)步，包括步驟如下a)對(duì)于C類(lèi)目標(biāo)，每個(gè)類(lèi)別包含N+幅正樣本確認(rèn)圖像，N_幅負(fù)樣本確認(rèn)圖像，標(biāo)記為/,。，由此輸入確認(rèn)圖像集為(/,，/,。),·..,(/",《)，其中e{C，-l}，N = N++N_，對(duì)于每個(gè)類(lèi)別 Ci，依據(jù)正樣本確認(rèn)圖像的數(shù)目歸一化權(quán)重；b)當(dāng)Ci = 1,2, ...C時(shí)，對(duì)于每個(gè)弱分類(lèi)器hA(I，Sn) e Ha(I，c)，其中&為目標(biāo)類(lèi)別列表，若一 <0.5，則有hA = hA(I, Sn η Ci)，在此基礎(chǔ)上更新權(quán)重<，令t = t+ι，且
W;c)從η = 1開(kāi)始，循環(huán)迭代C(C+l)/2次，尋找最優(yōu)弱分類(lèi)器ht(I，Sn)，確定權(quán)重然后評(píng)估分類(lèi)器的性能Pn ；d)選取最優(yōu)共享，即" = ai_gm axG，并獲取對(duì)應(yīng)的ht，&;e)更新強(qiáng)分類(lèi)器H (I，C)和權(quán)重< ；f)重復(fù)前述a)至e)步，不斷更新？；，直至滿足^ > TVc,時(shí)結(jié)束訓(xùn)練，獲得最終的強(qiáng)分類(lèi)器H(I，c)。所述的方法，其所述第五步，包括步驟如下
(1)按照第二步中a)的⑴步、第二步中b)的⑴步和第二步中C)的⑴步的方法分別對(duì)測(cè)試圖像做預(yù)處理；(2)利用自主學(xué)習(xí)得到的強(qiáng)分類(lèi)器H(I，c)分別對(duì)預(yù)處理后的測(cè)試圖像進(jìn)行概率匹配，得到目標(biāo)類(lèi)別及其對(duì)應(yīng)的預(yù)測(cè)質(zhì)心。所述的方法，其所述第五步中( 步，包括步驟如下a)將每一個(gè)弱分類(lèi)器Iii中包含的基元Bj與預(yù)處理后的測(cè)試圖像I相匹配，并將其映射到w，l]區(qū)間上的類(lèi)概率密度函數(shù)P Oii))進(jìn)行計(jì)算；b)在Hough投票空間下對(duì)圖像上獲取的任一候選質(zhì)心點(diǎn)χ e I進(jìn)行加權(quán)投票，并統(tǒng)計(jì)X的總得票數(shù)700 = ^>,,(/，勻，引入判決閾值thv，當(dāng)v(x) > thv時(shí)表明強(qiáng)分類(lèi)器判
權(quán)利要求
1.一種基于多類(lèi)基元自主學(xué)習(xí)的復(fù)雜目標(biāo)自動(dòng)識(shí)別方法，其特征在于，包括以下步驟第一步，建立多類(lèi)復(fù)雜目標(biāo)的圖像代表集；第二步，對(duì)訓(xùn)練集中的圖像提取點(diǎn)、線、面狀基元，包括步驟a)提取線狀基元，用于描述目標(biāo)的形狀輪廓及內(nèi)部邊界；b)提取面狀基元，用于描述目標(biāo)的區(qū)域統(tǒng)計(jì)特性；c)提取點(diǎn)狀基元，用于描述目標(biāo)的尺度旋轉(zhuǎn)等特性；第三步，針對(duì)從訓(xùn)練圖像中獲取的大量基元，在確認(rèn)圖像集中進(jìn)行匹配計(jì)算、篩選合并，分別構(gòu)建點(diǎn)、線、面三個(gè)基元字典；第四步，從字典中選取一定數(shù)量的基元，配對(duì)組合后作為弱分類(lèi)器，通過(guò)自主學(xué)習(xí)分別訓(xùn)練三類(lèi)基元的強(qiáng)分類(lèi)器；第五步，利用自主學(xué)習(xí)得到的三類(lèi)基元強(qiáng)分類(lèi)器，在概率投票空間下識(shí)別和提取多種類(lèi)型的目標(biāo)。
2.如權(quán)利要求1所述的方法，其特征在于，所述第一步，方法是(1)根據(jù)需要定義J個(gè)類(lèi)別的復(fù)雜目標(biāo)，類(lèi)別編號(hào)為1 J，J為自然數(shù)；(2)對(duì)每個(gè)目標(biāo)類(lèi)別，選取30-500幅圖像作為代表圖像，任選20-100幅包含目標(biāo)的圖像作為訓(xùn)練集，隨機(jī)選取與訓(xùn)練集數(shù)目相同的圖像作為確認(rèn)集，其中正樣本圖像和負(fù)樣本圖像比例為1 1，其余圖像作為測(cè)試集；(3)對(duì)每幅目標(biāo)圖像進(jìn)行標(biāo)記，標(biāo)記出目標(biāo)所屬類(lèi)別及所在的區(qū)域范圍；(4)將所有J類(lèi)目標(biāo)的圖像代表合并為多類(lèi)目標(biāo)圖像代表集。
3.如權(quán)利要求1所述的方法，其特征在于，所述第二步中a)提取線狀基元，包括(1)使用Carmy算子處理所有訓(xùn)練圖像，連接較短邊界，濾除邊界噪聲；(2)從訓(xùn)練圖像中隨機(jī)抽取邊界片段作為線狀基元辟^計(jì)算基元參數(shù)，每個(gè)基元在保持基本信息不變的條件下，都可以按不同的尺寸大小和旋轉(zhuǎn)方向進(jìn)行變換，尋求最佳匹配的形式；依此得到所有的線狀基元；b)提取面狀基元，包括(1)對(duì)于每一幅訓(xùn)練圖像，使用Normalized-cut算法進(jìn)行區(qū)域分割；(2)從訓(xùn)練圖像中隨機(jī)抽取分割塊作為面狀基元^，基元參數(shù)計(jì)算方式與第二步中a) 步(2)所述相同；依此得到所有的面狀基元；c)提取點(diǎn)狀基元，包括(1)將所有訓(xùn)練圖像進(jìn)行網(wǎng)格劃分，以每個(gè)網(wǎng)格中心為采樣點(diǎn)，在網(wǎng)格區(qū)域內(nèi)計(jì)算梯度直方圖得到SIFT點(diǎn)特征；(2)從訓(xùn)練圖像中隨機(jī)選取特征點(diǎn)作為點(diǎn)狀基元錢(qián)基元參數(shù)計(jì)算方式與第二步中a) 步(2)所述相同；依此得到所有的點(diǎn)狀基元。
4.如權(quán)利要求1所述的方法，其特征在于，所述第三步，包括步驟如下(1)對(duì)于訓(xùn)練圖像中隨機(jī)選取的基元，計(jì)算每個(gè)基元的匹配能量Cost(Bi),取最小值為最優(yōu)匹配能量，量化表達(dá)每個(gè)基元所包含的信息；(2)遍歷篩選基元，將每幅訓(xùn)練樣本圖像中的基元匹配能量值由小到大排序，建議保留最優(yōu)的20個(gè)用于后續(xù)處理；(3)對(duì)三類(lèi)篩選得到的基元分別構(gòu)建高斯混合模型，結(jié)合最小描述長(zhǎng)度準(zhǔn)則估計(jì)聚類(lèi)中心個(gè)數(shù)，利用K-means算法聚類(lèi)量化構(gòu)成最終的三個(gè)字典，分別是面狀基元字典Ω”線狀基元字典Ω 點(diǎn)狀基元字典Ω p，為保證計(jì)算效率，各類(lèi)字典包含基元總量不超過(guò)200個(gè)。
5.如權(quán)利要求1所述的方法，其特征在于，所述第四步，包括步驟如下(1)從字典中選取M。個(gè)基元配對(duì)組合，取各個(gè)基元預(yù)測(cè)質(zhì)心連線的中點(diǎn)作為基元對(duì)預(yù)測(cè)質(zhì)心的位置，當(dāng)質(zhì)心連線長(zhǎng)度大于d。時(shí)，認(rèn)為該基元組合不合理而丟棄，建議取M。為2至 4個(gè)，d。為30個(gè)像素；(2)計(jì)算基元對(duì)的似然度函數(shù)ROii,I)，該值越小，說(shuō)明目標(biāo)出現(xiàn)概率越小；(3)分別求取三類(lèi)基元的弱分類(lèi)器I^hi以圖像平面上的像素χ為輸入，其輸出是對(duì)χ 是否為目標(biāo)質(zhì)心的預(yù)測(cè)；(4)利用自主學(xué)習(xí)分別構(gòu)建三類(lèi)基元的強(qiáng)分類(lèi)器，對(duì)于C類(lèi)目標(biāo)，可以通過(guò)Ts-J^1I來(lái)度量，其中A為用于區(qū)分每個(gè)類(lèi)別的弱分類(lèi)器數(shù)目，Ts為共享使用的弱分類(lèi)器數(shù)目，假設(shè)已經(jīng)學(xué)習(xí)得到了 Ca類(lèi)目標(biāo)的分類(lèi)器，在識(shí)別新出現(xiàn)的目標(biāo)類(lèi)別時(shí)，先考察已經(jīng)得到的弱分類(lèi)器是否滿足新的類(lèi)別，若滿足，則將已有弱分類(lèi)器的共享擴(kuò)展到新類(lèi)，然后通過(guò)聯(lián)合學(xué)習(xí)得到剩余的信息，即A個(gè)弱分類(lèi)器的組合，其中T為預(yù)先定義的弱分類(lèi)器總數(shù)。
6.如權(quán)利要求5所述的方法，其特征在于，所述第四步中(4)步，包括步驟如下a)對(duì)于C類(lèi)目標(biāo)，每個(gè)類(lèi)別包含N+幅正樣本確認(rèn)圖像，N_幅負(fù)樣本確認(rèn)圖像，標(biāo)記為，由此輸入確認(rèn)圖像集為(/』),·..，(、{)，其中(e|C，-lj，N = N++N_，對(duì)于每個(gè)類(lèi)別4，依據(jù)正樣本確認(rèn)圖像的數(shù)目歸一化權(quán)重w尸；b)當(dāng)^二丄二，…丄時(shí)，對(duì)于每個(gè)弱分類(lèi)器!!^〗』》eHA(I，c)，其中&為目標(biāo)類(lèi)別列表，若一 < 0.5，則有hA = hA(I,Sn Π Ci)，在此基礎(chǔ)上更新權(quán)重<，令t = t+Ι，且7； = TCj +1 ；c)從η= 1開(kāi)始，循環(huán)迭代C(C+l)/2次，尋找最優(yōu)弱分類(lèi)器ht(I，Sn)，確定權(quán)重於，然后評(píng)估分類(lèi)器的性能Pn;d)選取最優(yōu)共享，即"=^gmaxPn，并獲取對(duì)應(yīng)的ht，Sn；e)更新強(qiáng)分類(lèi)器H(I，c)和權(quán)重f)重復(fù)前述a)至e)步，不斷更新&，直至滿足&2 ^Vc,時(shí)結(jié)束訓(xùn)練，獲得最終的強(qiáng)分類(lèi)器 H(I，c)。
7.如權(quán)利要求1所述的方法，其特征在于，所述第五步，包括步驟如下(1)按照第二步中a)的⑴步、第二步中b)的⑴步和第二步中c)的⑴步的方法分別對(duì)測(cè)試圖像做預(yù)處理；(2)利用自主學(xué)習(xí)得到的強(qiáng)分類(lèi)器H(I，c)分別對(duì)預(yù)處理后的測(cè)試圖像進(jìn)行概率匹配，得到目標(biāo)類(lèi)別及其對(duì)應(yīng)的預(yù)測(cè)質(zhì)心。
8.如權(quán)利要求1或7所述的方法，其特征在于，所述第五步中(2)步，包括步驟如下a)將每一個(gè)弱分類(lèi)器Iii中包含的基元B」與預(yù)處理后的測(cè)試圖像I相匹配，并將其映射到W，l]區(qū)間上的類(lèi)概率密度函數(shù)P Oii)進(jìn)行計(jì)算；b)在Hough投票空間下對(duì)圖像上獲取的任一候選質(zhì)心點(diǎn)χe I進(jìn)行加權(quán)投票，并統(tǒng)計(jì)X的總得票數(shù)MO = Yhχι,C)，引入判決閾值thv，當(dāng)V(X) > thv時(shí)表明強(qiáng)分類(lèi)器判定X為目標(biāo)的預(yù)測(cè)質(zhì)心點(diǎn)，一般取thv = 0即可；c)得到圖像I平面上分別得到三類(lèi)基元最終的所有質(zhì)心點(diǎn)及可能為某類(lèi)目標(biāo)質(zhì)心的概率后，將這三個(gè)概率進(jìn)行空間疊加，運(yùn)用Mean-Shift聚類(lèi)估計(jì)得到最終的目標(biāo)質(zhì)心，進(jìn)一步統(tǒng)計(jì)選舉中獲勝的基元在圖像I中的匹配位置，得到目標(biāo)的識(shí)別類(lèi)型、空間位置和精確形狀。
9.如權(quán)利要求1或3所述的方法，其特征在于，所述第二步b)步(1)中，使用 Normalized-cut算法進(jìn)行分割的塊數(shù)K的計(jì)算方式如下K = \Ih)}m⑴其中C7為分割系數(shù)，Iw和Ib分別為圖像長(zhǎng)寬的像素?cái)?shù)，「為上取整高斯函數(shù)。
10.如權(quán)利要求1或3所述的方法，其特征在于，所述第二步中，每個(gè)基元Bi在利用尺寸和方向變化尋求最佳匹配時(shí)有B' i = Bi i = 1，2，· · .，N (2)其中，B'的變換形式。當(dāng)且僅當(dāng)存在(τ y Ui)滿足以下條件時(shí)，等式成立其中，fjPf' i分別為對(duì)象BjnB' i的像素列表，屯和(1' i分別為對(duì)象BjPB' i 的質(zhì)心到目標(biāo)質(zhì)心的相對(duì)距離，Si和s' i分別為對(duì)象Bi和B' i的尺度因子，約和W分別為對(duì)象Bi和B' i相對(duì)目標(biāo)質(zhì)心水平線的逆時(shí)針旋轉(zhuǎn)角度，τ i為比例參數(shù)，、為旋轉(zhuǎn)參數(shù)，=表示兩者相等或相似，％，O2分別為T(mén)i, Ui的取值上下限，建議取Ol = 10，Q2 = π /15。
11.如權(quán)利要求1或4所述的方法，其特征在于，所述第三步(1)步中，匹配能量計(jì)算方法如下Cost (Bi) = mm [Costfeal (Bi) ■ Costhc (5,)]( 4 )其中，△為基元Bi依據(jù)不同尺寸和方向得到的變換基元集合；公式⑷中，Costfeat(Bi)用來(lái)度量對(duì)象的特征信息=--(5)其中，N+和N—分別代表正負(fù)樣本確認(rèn)圖像I+和Γ的數(shù)量，diff (Bi, Ij)表示Bi和圖片 Ij的差異度；對(duì)于線狀基元，假設(shè)包含像素個(gè)數(shù)為Mp，將基元沿確認(rèn)圖像Ij的邊界逐步掃描，在位置 χ處的匹配度定義如下其中，1111表示圖像平面上兩點(diǎn)之間的歐氏距離，<表示當(dāng)基元處于位置X時(shí)，確認(rèn)圖像中與基元中第i個(gè)邊緣點(diǎn)Pi距離最近的邊緣點(diǎn)；對(duì)于面狀基元，計(jì)算得到基元代的12維特征向量Vi，包括灰度均值、標(biāo)準(zhǔn)差、均值比例、最小/最大像素值、最大差、均一性、對(duì)比性、差異性、熵、角二階矩、相關(guān)性；統(tǒng)計(jì)圖像整體的特征向量V' J來(lái)近似模擬對(duì)象的屬性，有
12.如權(quán)利要求1或5所述的方法，其特征在于，所述第四步(2)步中，似然度函數(shù) ROii, I)定義為
13.如權(quán)利要求1或5所述的方法，其特征在于，所述第四步(3)步中，弱分類(lèi)器Iii的定義為
14.如權(quán)利要求1、5或6所述的方法，其特征在于，所述第四步(4)步a)中，歸一化權(quán)重wf的計(jì)算方式為
15.如權(quán)利要求1、5或6所述的方法，其特征在于，所述第四步(4)步b)中，限定用于權(quán)值更新的錯(cuò)誤、取值為0.3。
16.如權(quán)利要求1、5或6所述的方法，其特征在于，所述第四步(4)步c)中，分類(lèi)器性能Pn的計(jì)算方式為
17.如權(quán)利要求1、5或6所述的方法，其特征在于，所述第四步(4)步e)中，在更新強(qiáng)分類(lèi)器H(I，c)和權(quán)重<時(shí)，應(yīng)當(dāng)滿足以下條件 \H(l,c) = H{l,c) + a,hl(l,Sn) '^,(.hA
18.如權(quán)利要求1、7或8所述的方法，其特征在于，所述第五步中(2)步a)中，類(lèi)概率密度函數(shù)P OO進(jìn)行計(jì)算，記作其中，Q為圖像I中所有匹配的弱分類(lèi)器，且有score Qv I) = 1/R(hi; I)。
全文摘要
一種基于多類(lèi)基元自主學(xué)習(xí)的復(fù)雜目標(biāo)自動(dòng)識(shí)別方法，步驟為a)建立多類(lèi)目標(biāo)圖像代表集；b)對(duì)訓(xùn)練集中的圖像做預(yù)處理，分別提取點(diǎn)狀、線狀、面狀三類(lèi)基元；c)在確認(rèn)圖像集中對(duì)獲取的大量基元進(jìn)行匹配計(jì)算、篩選合并，分別構(gòu)建點(diǎn)、線、面三個(gè)基元字典；d)從字典中選取一定數(shù)量的基元，配對(duì)組合后作為弱分類(lèi)器，通過(guò)自主學(xué)習(xí)分別訓(xùn)練三類(lèi)基元的強(qiáng)分類(lèi)器；e)在概率投票空間下將三類(lèi)基元強(qiáng)分類(lèi)器結(jié)合，實(shí)現(xiàn)多類(lèi)復(fù)雜目標(biāo)的準(zhǔn)確定位、輪廓提取和類(lèi)型識(shí)別。本發(fā)明方法具有較高的智能化程度，能夠滿足多種類(lèi)型復(fù)雜目標(biāo)的識(shí)別和圖像解譯需求。
文檔編號(hào)G06K9/66GK102436589SQ20101029889
公開(kāi)日2012年5月2日申請(qǐng)日期2010年9月29日優(yōu)先權(quán)日2010年9月29日
發(fā)明者付琨, 孫顯, 王宏琦申請(qǐng)人:中國(guó)科學(xué)院電子學(xué)研究所

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：孫顯;付琨;王宏琦
技術(shù)所有人：中國(guó)科學(xué)院電子學(xué)研究所
我是此專利的發(fā)明人

上一篇：一種巖石種類(lèi)的識(shí)別方法
上一篇：一種瓦片地圖數(shù)據(jù)組織方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于多類(lèi)基元自主學(xué)習(xí)的復(fù)雜目標(biāo)自動(dòng)識(shí)別方法