專利名稱:基于多層級結(jié)構(gòu)的多尺度自適應(yīng)高效目標(biāo)圖像識別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種物體特征圖像識別方法,尤其是涉及一種基于多層級結(jié)構(gòu)的多尺度自適應(yīng)高效目標(biāo)圖像識別方法。
背景技術(shù):
如何從圖像中能夠像人眼一樣能夠識別出來特定目標(biāo),例如桌子,汽車等是人類一直一來的夢想和追求。圖像目標(biāo)識別是人工智能領(lǐng)域的一個研究的重要問題,在解決自動化生產(chǎn)和檢測,智能圖像分析和檢索等生產(chǎn)生活問題的核心方法。現(xiàn)階段,目標(biāo)精確定位是識別信息處理的一項關(guān)鍵技術(shù),廣泛應(yīng)用于人臉識別、人機(jī)交互、智能人機(jī)接口等系統(tǒng)中。復(fù)雜背景下眼睛精確定位也是一個極具挑戰(zhàn)性的問題。這除了是由于光照、尺寸、姿態(tài)、平面旋轉(zhuǎn)、圖像質(zhì)量等因素給眼睛外觀帶來復(fù)雜的變化外,眼睛的開閉、眼鏡的反光、頭發(fā)和鏡框的遮擋等也給眼睛的精確定位帶來很多困難;特別是在眼睛閉合的情況下,眉毛以及粗鏡框都會給眼睛定位帶來較大干擾。目前提出的眼睛精確定位主流方法是基于啟發(fā)式規(guī)則的方法。這類方法主要是根據(jù)眼睛的先驗知識來制定定位規(guī)則。這些先驗知識包括器官分布知識、形狀知識、顏色知識、物理特性等。這類方法一般適應(yīng)外界變化的能力較差,往往只能處理器官的一種或幾種變化,穩(wěn)定性和精度與實際應(yīng)用的要求還有差距。造成這個現(xiàn)象的原因主要是它們僅考慮了器官的局部外觀,而沒有考慮器官與鄰近區(qū)域或器官間的約束關(guān)系。這樣當(dāng)臉部存在與目標(biāo)器官外觀相似的物體時,就會給定位帶來影響。比如眼睛閉合時的外觀與眉毛、粗鏡框很相似。所以要綜合考慮器官局部特征以及能夠表達(dá)這種約束關(guān)系的全局特征才能獲得更魯棒的定位效果。隨著技術(shù)的進(jìn)步,在目標(biāo)識別中,如何快速高效的提取目標(biāo)特征并建立相應(yīng)的識別體系是目標(biāo)識別中的一個重要且關(guān)鍵的問題。目前常用的目標(biāo)識別算法中模板匹配(template matching)是一種重要的方法。模版匹配通過采用模版對圖像進(jìn)行全局匹配的方法來對目標(biāo)進(jìn)行識別。具有的有點(diǎn)是算法簡單,容易實現(xiàn)。缺點(diǎn)是算法的魯棒性 (Robustness)特別差,當(dāng)圖像的大小,方向等有變換時,匹配效果非常差,雖然有人提出采用多個不同大小和方向的模版的方法來解決此類問題,但這種解決方法極大的增加了算法的時間復(fù)雜度,使得在實際應(yīng)用當(dāng)中變得幾乎不可能。David Marr, Cannon等提出了不同的邊緣提取(edge detection)是另外一種目標(biāo)識別的方法,其所具有的有點(diǎn)是能夠一定程度上反應(yīng)圖像的幾何特征,對有明暗變換等具有一定的適應(yīng)性。近來David Iowe ¢: "Objectrecognitionfrom local scale-invariant features", "Distinctiveimage features from scale-invariant keypoints”等文獻(xiàn)中提出的‘‘SIFT”算法在目標(biāo)識別中得到越來越多的重視和應(yīng)用。SIFT算法通過采用Gaussian filter bank對圖像進(jìn)行濾波, 然后提取scale-invaraint特征的方法來進(jìn)行識別。這種方法在對特定目標(biāo),例如某個特定的書本,建筑等的識別方面得到了較好的效果。然而SIFT算法在對一類的物體識別, 例如從圖像中挑選出來所有的桌子和汽車等效果并不理想,另外SIFT算法本質(zhì)上來講是
4一系列方法的組合,算法的時間復(fù)雜度很高。且在文獻(xiàn)“Object recognition from local scale-invariant features”中,作者David Iowe提到,SIFT算法只是在一定程度上符合人體的視覺神經(jīng)原理。由于所要識別的圖像目標(biāo)可能存在大小、方向、光照、形變、類間等變化,圖像識別是一個非常復(fù)雜的問題??偟膩碚f,由于目標(biāo)識別問題的復(fù)雜性,現(xiàn)有的方法并沒有能夠在在方法的識別準(zhǔn)確性和速度方面很好的覺得以上問題。特別在(1)圖像的大小,方向,光照,個體等有變化的時候,如何魯棒性的識別目標(biāo)。(2)如何能夠在合理的時間范圍內(nèi)能夠快速識別目標(biāo)。針對目前識別方法的不足或缺陷,本發(fā)明提出了一種全新的具有層級結(jié)構(gòu)的多尺度高效目標(biāo)識別方法主要包括以下幾層首先,用Multi-scale的分析工具(小波分析或金字塔形多尺度分析方法),對圖像進(jìn)行濾波處理,獲得一個層級的分解結(jié)構(gòu),自適應(yīng)選取匹配層進(jìn)行匹配,獲得圖像的二級特征,基于此提取的有效特征,可以進(jìn)行高效率的目標(biāo)識別。
發(fā)明內(nèi)容
本發(fā)明的目的是針對現(xiàn)有技術(shù)中的圖像識別系統(tǒng)不足和缺陷,提供一種有效的快速高效圖像識別方法,具體是一種基于多層級結(jié)構(gòu)的多尺度自適應(yīng)高效目標(biāo)圖像識別方法。通過采用具有具體層級結(jié)構(gòu)(Hierarchical)的多尺度(multi-scale)圖像目標(biāo)識別方法,較全面的解決了在圖像識別中由于圖像的大小變換等因素造成識別系統(tǒng)不夠穩(wěn)定、 識別準(zhǔn)確率和識別速度間的關(guān)系對應(yīng)率較低、識別率不高等問題,同時本發(fā)明的基于多層級結(jié)構(gòu)的多尺度自適應(yīng)高效目標(biāo)圖像識別方法還具有很高的識別速度。為實現(xiàn)上述目的,本發(fā)明是通過以下技術(shù)方案實現(xiàn)的本發(fā)明的一種基于多層級結(jié)構(gòu)的多尺度自適應(yīng)高效目標(biāo)圖像識別方法,其特征在于,該基于多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別方法依次包括以下步驟步驟一、采集目標(biāo)圖像;所述目標(biāo)圖像的采集方法如下首先,在多個輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)上分別安裝有主動遠(yuǎn)紅外光源;其中,選擇整個光譜中波長介于9um和Ilum之間的遠(yuǎn)紅外光譜段作為主動遠(yuǎn)紅外光源,主動遠(yuǎn)紅外光源由波長介于9. 5um和10. 5um之間的N個發(fā)光二極管LED組成,其中N為自然數(shù),Ne [26,36];在組合所述主動遠(yuǎn)紅外光源和所述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)時,將發(fā)光二極管LED和所述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)同軸安置;所述發(fā)光二極管在所述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)平面內(nèi)的呈倒三角形形狀均勻擺放,將光源均勻作用于目標(biāo)圖像;對于目標(biāo)圖像的采集,使用一臺所述輸出附帶圖像采集卡的可見光數(shù)字模擬便攜式攝像機(jī)對準(zhǔn)圖像中的目標(biāo)部位進(jìn)行采集,并通過圖像采集軟件對連接在同一塊圖像采集卡上的上述輸出附帶圖像采集卡的可見光數(shù)字模擬便攜式攝像機(jī)和上述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)進(jìn)行同步采集控制,圖像采集具有同時性;步驟二、采集的原始圖像多層縮放分解顯示;所述采集的原始圖像縮放分解顯示方法如下根據(jù)步驟一中的圖像采集數(shù)據(jù)生成目標(biāo)圖像縮略圖數(shù)據(jù),縮略圖數(shù)據(jù)數(shù)據(jù)類型為一個與顯示設(shè)備顯示點(diǎn)陣匹配的二維數(shù)組;然后根據(jù)所述目標(biāo)圖像縮略圖數(shù)據(jù)生成對應(yīng)的縮略圖,對該生成對應(yīng)的縮略圖,進(jìn)行5層以上塔形方向濾波器組變換;再對所述濾波器
5組變換的縮略圖進(jìn)行重新排列分層歸類,將上述步驟一中的倒三角形頂部對應(yīng)的縮略圖層歸為S1層,步驟一中的倒三角形底部對應(yīng)的縮略圖層歸為&層,所述S1層與&層之間含有若干層,其&中的η為自然數(shù),η e [34,39];其中,相鄰兩縮略圖層間縮略像尺度大小比例為1 2 1,所有縮略圖層的縮略像形成為金字塔型;步驟三、目標(biāo)圖像識別;所述目標(biāo)圖像識別方法如下對上述步驟二中的金字塔型中的所有縮略圖層采用線性支持向量機(jī)進(jìn)行分類,進(jìn)行分類時,選取五分之二到五分之三的縮略圖層作為訓(xùn)練集,其余的縮略圖層作為測試集,然后通過所述線性支持向量機(jī)中生成的顯示曲線上的平衡點(diǎn)作為測試準(zhǔn)確性的標(biāo)準(zhǔn)進(jìn)行多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別。作為優(yōu)選的技術(shù)方案上述步驟二中的相鄰兩縮略圖層間縮略像尺度大小比例為1.414 1。上述步驟二中的S1層與&層之間含有36層。上述步驟二中的對該生成對應(yīng)的縮略圖,進(jìn)行16層塔形方向濾波器組變換。
上述步驟三中的選取一半的縮略圖層作為訓(xùn)練集。上述步驟一中的選擇整個光譜中波長為IOum的遠(yuǎn)紅外光譜段作為主動遠(yuǎn)紅外光源。上述步驟一中的主動遠(yuǎn)紅外光源由波長為10. 5um的N個發(fā)光二極管LED組成。本發(fā)明通過研究分析過去的圖像識別系統(tǒng)的優(yōu)缺點(diǎn),分析圖像識別所面臨的各種挑戰(zhàn)和問題,綜合考慮在圖像識別中的識別準(zhǔn)確率和識別速度間的關(guān)系,通過采用具有具體層級結(jié)構(gòu)(Hierarchical)的多尺度(multi-scale)圖像目標(biāo)識別方法,較全面的解決了在在圖像識別中由于圖像的大小變換等因素造成識別系統(tǒng)不夠穩(wěn)定,識別率不高等問題, 同時此方法具有很高的識別速度。同時,本發(fā)明的整個識別方法構(gòu)成的系統(tǒng)采用符合人體視覺神經(jīng)系統(tǒng)(Visual cortex)的Hierarchical分層結(jié)構(gòu),還可以由S1,C1,S2,C2四大層構(gòu)成。每大層的方法說明如下Sl 在此層中,可以采用Multi-scale分析的方法,對圖像進(jìn)行分解,然后對分解的圖像進(jìn)行從組,得到金字塔型的Multi-resolution處理方案。在對圖像采用Multi-scale的方法進(jìn)行分解以后,會得到一個金字塔型的結(jié)構(gòu)。 通常,此種方法得到的結(jié)構(gòu)中,圖像具有的是2 1尺寸的衰減,即相鄰兩層間圖像大小比例為2 1。為了使圖像層與層直接的大小比例為任意比例,例如1.414 1,而傳統(tǒng)的方法采用插值的方法得到中間圖像,但通過插值的方法得到圖像會有一定程度的失真,同時計算速度比較慢。在此,我們提出一種預(yù)先對圖像進(jìn)行縮放(rescale),然后再進(jìn)行multi-scale分解(小波分解等),然后對分解后的圖像進(jìn)行重新排列(Reorder),然后得到圖像的Sl層。 這樣就可以得到任意band,band間的大小比例為任意比例的結(jié)構(gòu)的方法。Cl :C1層主要相對與視神經(jīng)(visual cortex)中的復(fù)雜細(xì)胞(Complex cell)。通過對相鄰層間多的歸并,得到圖像的Cl層。S2 :S2層相當(dāng)于視覺神經(jīng)(Visual Cortex)中的V2和v4區(qū)域中的簡單細(xì)胞。且在此層,可以進(jìn)行自適應(yīng)的選取不同band進(jìn)行匹配。在此層當(dāng)中,被選中的k個特征和以
6前的模版特征進(jìn)行如下公式的匹配,C2:在本層之中,采用全局最大化的操作,對每一模版特征,得到一個與之相應(yīng)的特征值。得到的特征是符合人體視神經(jīng)系統(tǒng)的生物特征。Classification:然后采用分類器對所獲取的特征值進(jìn)行分類,實現(xiàn)目標(biāo)識別。本發(fā)明的識別方法具有以上通過采用層級的多尺度結(jié)構(gòu),避免了傳統(tǒng)的模板匹配目標(biāo)是把方法需要多個不同尺度的模板的方法,而且通過自適應(yīng)的選取匹配層級(Band) 的方法,實現(xiàn)了匹配的高效率,且整個目標(biāo)識別結(jié)構(gòu)在一定程度上與人的視覺神經(jīng)系統(tǒng)相吻合,較全面的解決了在目標(biāo)識別領(lǐng)域中存在的識別算法的魯棒性和算法時間復(fù)雜度之間的矛盾的問題,實驗結(jié)果表明該方法具有很好的識別準(zhǔn)確率同時具有較高的識別速度。
具體實施例方式下面結(jié)合具體實施方式
,進(jìn)一步闡述本發(fā)明。實施例1 一種基于多層級結(jié)構(gòu)的多尺度自適應(yīng)高效目標(biāo)圖像識別方法,其特征在于,該基于多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別方法依次包括以下步驟步驟一、采集目標(biāo)圖像;所述目標(biāo)圖像的采集方法如下首先,在多個輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)上分別安裝有主動遠(yuǎn)紅外光源;其中,選擇整個光譜中波長介于9um和Ilum之間的遠(yuǎn)紅外光譜段作為主動遠(yuǎn)紅外光源,主動遠(yuǎn)紅外光源由波長介于9. 5um和10. 5um之間的N個發(fā)光二極管LED組成,其中N為自然數(shù),Ne [26,36];在組合所述主動遠(yuǎn)紅外光源和所述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)時,將發(fā)光二極管LED和所述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)同軸安置;所述發(fā)光二極管在所述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)平面內(nèi)的呈倒三角形形狀均勻擺放,將光源均勻作用于目標(biāo)圖像;對于目標(biāo)圖像的采集,使用一臺所述輸出附帶圖像采集卡的可見光數(shù)字模擬便攜式攝像機(jī)對準(zhǔn)圖像中的目標(biāo)部位進(jìn)行采集,并通過圖像采集軟件對連接在同一塊圖像采集卡上的上述輸出附帶圖像采集卡的可見光數(shù)字模擬便攜式攝像機(jī)和上述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)進(jìn)行同步采集控制,圖像采集具有同時性;步驟二、采集的原始圖像多層縮放分解顯示;所述采集的原始圖像縮放分解顯示方法如下根據(jù)步驟一中的圖像采集數(shù)據(jù)生成目標(biāo)圖像縮略圖數(shù)據(jù),縮略圖數(shù)據(jù)數(shù)據(jù)類型為一個與顯示設(shè)備顯示點(diǎn)陣匹配的二維數(shù)組;然后根據(jù)所述目標(biāo)圖像縮略圖數(shù)據(jù)生成對應(yīng)的縮略圖,對該生成對應(yīng)的縮略圖,進(jìn)行16層以上塔形方向濾波器組變換;再對所述濾波器組變換的縮略圖進(jìn)行重新排列分層歸類,將上述步驟一中的倒三角形頂部對應(yīng)的縮略圖層歸為S1層,步驟一中的倒三角形底部對應(yīng)的縮略圖層歸為&層,所述S1層與&層之間含有若干層,其&中的η為自然數(shù),η e [34,36];其中,相鄰兩縮略圖層間縮略像尺度大小比例為1 1,所有縮略圖層的縮略像形成為金字塔型;步驟三、目標(biāo)圖像識別;所述目標(biāo)圖像識別方法如下對上述步驟二中的金字塔型中的所有縮略圖層采用線性支持向量機(jī)進(jìn)行分類,進(jìn)行分類時,選取五分之二的縮略圖層作為訓(xùn)練集,其余的縮略圖層作為測試集,然后通過所述線性支持向量機(jī)中生成的顯示曲線上的平衡點(diǎn)作為測試準(zhǔn)確性的標(biāo)準(zhǔn)進(jìn)行多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別。
實施例2 一種基于多層級結(jié)構(gòu)的多尺度自適應(yīng)高效目標(biāo)圖像識別方法,其特征在于,該基于多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別方法依次包括以下步驟步驟一、采集目標(biāo)圖像;所述目標(biāo)圖像的采集方法如下首先,在多個輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)上分別安裝有主動遠(yuǎn)紅外光源;其中,選擇整個光譜中波長介于9um和Ilum之間的遠(yuǎn)紅外光譜段作為主動遠(yuǎn)紅外光源,主動遠(yuǎn)紅外光源由波長介于9. 5um和10. 5um之間的N個發(fā)光二極管LED組成,其中N為自然數(shù),Ne [26,36];在組合所述主動遠(yuǎn)紅外光源和所述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)時,將發(fā)光二極管LED和所述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)同軸安置;所述發(fā)光二極管在所述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)平面內(nèi)的呈倒三角形形狀均勻擺放,將光源均勻作用于目標(biāo)圖像;對于目標(biāo)圖像的采集,使用一臺所述輸出附帶圖像采集卡的可見光數(shù)字模擬便攜式攝像機(jī)對準(zhǔn)圖像中的目標(biāo)部位進(jìn)行采集,并通過圖像采集軟件對連接在同一塊圖像采集卡上的上述輸出附帶圖像采集卡的可見光數(shù)字模擬便攜式攝像機(jī)和上述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)進(jìn)行同步采集控制,圖像采集具有同時性;步驟二、采集的原始圖像多層縮放分解顯示;所述采集的原始圖像縮放分解顯示方法如下根據(jù)步驟一中的圖像采集數(shù)據(jù)生成目標(biāo)圖像縮略圖數(shù)據(jù),縮略圖數(shù)據(jù)數(shù)據(jù)類型為一個與顯示設(shè)備顯示點(diǎn)陣匹配的二維數(shù)組;然后根據(jù)所述目標(biāo)圖像縮略圖數(shù)據(jù)生成對應(yīng)的縮略圖,對該生成對應(yīng)的縮略圖,進(jìn)行16層以上塔形方向濾波器組變換;再對所述濾波器組變換的縮略圖進(jìn)行重新排列分層歸類,將上述步驟一中的倒三角形頂部對應(yīng)的縮略圖層歸為S1層,步驟一中的倒三角形底部對應(yīng)的縮略圖層歸為&層,所述S1層與&層之間含有若干層,其&中的η為自然數(shù),η e [36,39];其中,相鄰兩縮略圖層間縮略像尺度大小比例為1.414 1,所有縮略圖層的縮略像形成為金字塔型;步驟三、目標(biāo)圖像識別;所述目標(biāo)圖像識別方法如下對上述步驟二中的金字塔型中的所有縮略圖層采用線性支持向量機(jī)進(jìn)行分類,進(jìn)行分類時,選取一半的縮略圖層作為訓(xùn)練集,其余的縮略圖層作為測試集,然后通過所述線性支持向量機(jī)中生成的顯示曲線上的平衡點(diǎn)作為測試準(zhǔn)確性的標(biāo)準(zhǔn)進(jìn)行多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別。實施例3 一種基于多層級結(jié)構(gòu)的多尺度自適應(yīng)高效目標(biāo)圖像識別方法,其特征在于,該基于多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別方法依次包括以下步驟步驟一、采集目標(biāo)圖像;所述目標(biāo)圖像的采集方法如下首先,在多個輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)上分別安裝有主動遠(yuǎn)紅外光源;其中,選擇整個光譜中波長為IOum之間的遠(yuǎn)紅外光譜段作為主動遠(yuǎn)紅外光源,主動遠(yuǎn)紅外光源由波長為10. 5um之間的N個發(fā)光二極管LED組成,其中N為自然數(shù), Ne [26,36];在組合所述主動遠(yuǎn)紅外光源和所述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)時,將發(fā)光二極管LED和所述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)同軸安置;所述發(fā)光二極管在所述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)平面內(nèi)的呈倒三角形形狀均勻擺放,將光源均勻作用于目標(biāo)圖像;對于目標(biāo)圖像的采集,使用一臺所述輸出附帶圖像采集卡的可見光數(shù)字模擬便攜式攝像機(jī)對準(zhǔn)圖像中的目標(biāo)部位進(jìn)行采集,并通過圖像采集軟件對連接在同一塊圖像采集卡上的上述輸出附帶圖像采集卡的可見光數(shù)字模擬便攜式攝像機(jī)和上述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)進(jìn)行同步采集控制,圖像采集具有同時性;步驟二、采集的原始圖像多層縮放分解顯示;所述采集的原始圖像縮放分解顯示方法如下根據(jù)步驟一中的圖像采集數(shù)據(jù)生成目標(biāo)圖像縮略圖數(shù)據(jù),縮略圖數(shù)據(jù)數(shù)據(jù)類型為一個與顯示設(shè)備顯示點(diǎn)陣匹配的二維數(shù)組;然后根據(jù)所述目標(biāo)圖像縮略圖數(shù)據(jù)生成對應(yīng)的縮略圖,對該生成對應(yīng)的縮略圖,進(jìn)行8層以上塔形方向濾波器組變換;再對所述濾波器組變換的縮略圖進(jìn)行重新排列分層歸類,將上述步驟一中的倒三角形頂部對應(yīng)的縮略圖層歸為S1層,步驟一中的倒三角形底部對應(yīng)的縮略圖層歸為&層,所述S1層與&層之間含有若干層,其&中的η為自然數(shù),η e [36,39];其中,相鄰兩縮略圖層間縮略像尺度大小比例為1.414 1,所有縮略圖層的縮略像形成為金字塔型;步驟三、目標(biāo)圖像識別;所述目標(biāo)圖像識別方法如下對上述步驟二中的金字塔型中的所有縮略圖層采用線性支持向量機(jī)進(jìn)行分類,進(jìn)行分類時,選取五分之三的縮略圖層作為訓(xùn)練集,其余的縮略圖層作為測試集,然后通過所述線性支持向量機(jī)中生成的顯示曲線上的平衡點(diǎn)作為測試準(zhǔn)確性的標(biāo)準(zhǔn)進(jìn)行多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別。實施例4 可以采用照相機(jī)和攝影機(jī)等設(shè)備獲取所需的圖像,然后對所獲取的圖像進(jìn)行識別。為了對方法進(jìn)行客觀的評價,采用了標(biāo)準(zhǔn)數(shù)據(jù)庫對方法進(jìn)行測試,數(shù)據(jù)庫包括186 張樹葉,1155張汽車,450張人臉,1074張飛機(jī),擬6張摩托車和900張背景圖片構(gòu)成。在Sl 層,我們采用4個band,每個band有2個scale,相鄰的兩個scale間的scale相差1. 414, 然后按照如圖Fig. 2的方式進(jìn)行重組。在進(jìn)行分類時,選取1000個C2層的特征作為測試特征,采用線性支持向量機(jī)(Support Vector Machine, SVM)進(jìn)行分類.進(jìn)行分類時,我們選取一半的圖像作為訓(xùn)練集,另外一半的作為測試集,然后尋找RoC曲線上的平衡點(diǎn)作為測試準(zhǔn)確性的標(biāo)準(zhǔn)。進(jìn)行測試時,所采用的硬件環(huán)境為Intel Core2,6600 2. 4GHz CPU, 3. 24GB memory,32bit Matlab 2007a,從上述測試中我們能夠看出,采用新方法后,識別的準(zhǔn)備率均有不同程度的提升, 特別是對以前識別效果不是很好的樹葉和汽車等目標(biāo),識別的準(zhǔn)確率有顯著程度的提高。 而且對所有目標(biāo)的識別準(zhǔn)備程度都達(dá)到了 96%以上的高識別率,滿足大部分識別人物的要求。算法的另一個優(yōu)點(diǎn)是識別速度較快,對上述包含5類目標(biāo)的數(shù)據(jù)約5000張圖片庫進(jìn)行測試,在采用matlab平臺和未進(jìn)行硬件優(yōu)化的情況下,平均每張圖片的處理時間少于 2秒鐘,整個系統(tǒng)有望達(dá)到實時處理系統(tǒng)的要求,高速對圖形庫和視頻進(jìn)行實施處理。下表是每種目標(biāo)的平均處理時間
目標(biāo)類別樹葉汽車人臉飛機(jī)摩托車時間1. 8秒1. 5秒1. 9秒1. 6秒1. 8秒上表平均每張圖片處理時間,共約5000張圖片,很有潛力達(dá)到應(yīng)用要求。本發(fā)明不局限于上面的解釋和實施例。相反,旨在本發(fā)明在下面所述的權(quán)利要求所確定的界限內(nèi)廣泛適用。
權(quán)利要求
1.一種基于多層級結(jié)構(gòu)的多尺度自適應(yīng)高效目標(biāo)圖像識別方法,其特征在于,該基于多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別方法依次包括以下步驟步驟一、采集目標(biāo)圖像;所述目標(biāo)圖像的采集方法如下首先,在多個輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)上分別安裝有主動遠(yuǎn)紅外光源;其中,選擇整個光譜中波長介于9um和Ilum之間的遠(yuǎn)紅外光譜段作為主動遠(yuǎn)紅外光源,主動遠(yuǎn)紅外光源由波長介于9. 5um和10. 5um之間的N個發(fā)光二極管LED組成, 其中N為自然數(shù),Ne [26,36];在組合所述主動遠(yuǎn)紅外光源和所述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)時,將發(fā)光二極管LED和所述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)同軸安置;所述發(fā)光二極管在所述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)平面內(nèi)的呈倒三角形形狀均勻擺放,將光源均勻作用于目標(biāo)圖像;對于目標(biāo)圖像的采集,使用一臺所述輸出附帶圖像采集卡的可見光數(shù)字模擬便攜式攝像機(jī)對準(zhǔn)圖像中的目標(biāo)部位進(jìn)行采集,并通過圖像采集軟件對連接在同一塊圖像采集卡上的上述輸出附帶圖像采集卡的可見光數(shù)字模擬便攜式攝像機(jī)和上述輸出附帶圖像采集卡的遠(yuǎn)紅外數(shù)字模擬便攜式攝像機(jī)進(jìn)行同步采集控制,圖像采集具有同時性;步驟二、采集的原始圖像多層縮放分解顯示;所述采集的原始圖像縮放分解顯示方法如下根據(jù)步驟一中的圖像采集數(shù)據(jù)生成目標(biāo)圖像縮略圖數(shù)據(jù),縮略圖數(shù)據(jù)數(shù)據(jù)類型為一個與顯示設(shè)備顯示點(diǎn)陣匹配的二維數(shù)組;然后根據(jù)所述目標(biāo)圖像縮略圖數(shù)據(jù)生成對應(yīng)的縮略圖,對該生成對應(yīng)的縮略圖,進(jìn)行5層以上塔形方向濾波器組變換;再對所述濾波器組變換的縮略圖進(jìn)行重新排列分層歸類,將上述步驟一中的倒三角形頂部對應(yīng)的縮略圖層歸為 S1層,步驟一中的倒三角形底部對應(yīng)的縮略圖層歸為&層,所述S1層與&層之間含有若干層,其&中的η為自然數(shù),η e [34,39];其中,相鄰兩縮略圖層間縮略像尺度大小比例為1 2 1,所有縮略圖層的縮略像形成為金字塔型;步驟三、目標(biāo)圖像識別;所述目標(biāo)圖像識別方法如下對上述步驟二中的金字塔型中的所有縮略圖層采用線性支持向量機(jī)進(jìn)行分類,進(jìn)行分類時,選取五分之二到五分之三的縮略圖層作為訓(xùn)練集,其余的縮略圖層作為測試集,然后通過所述線性支持向量機(jī)中生成的顯示曲線上的平衡點(diǎn)作為測試準(zhǔn)確性的標(biāo)準(zhǔn)進(jìn)行多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別。
2.根據(jù)權(quán)利要求1所述的基于多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別方法,其特征在于上述步驟二中的相鄰兩縮略圖層間縮略像尺度大小比例為1.414 1。
3.根據(jù)權(quán)利要求1所述的基于多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別方法,其特征在于上述步驟二中的&層與&層之間含有36層。
4.根據(jù)權(quán)利要求1所述的基于多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別方法,其特征在于上述步驟二中的對該生成對應(yīng)的縮略圖,進(jìn)行16層塔形方向濾波器組變換。
5.根據(jù)權(quán)利要求1所述的基于多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別方法,其特征在于上述步驟三中的選取一半的縮略圖層作為訓(xùn)練集。
6.根據(jù)權(quán)利要求1所述的基于多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別方法,其特征在于上述步驟一中的選擇整個光譜中波長為IOum的遠(yuǎn)紅外光譜段作為主動遠(yuǎn)紅外光源。
7.根據(jù)權(quán)利要求1所述的基于多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別方法,其特征在于上述步驟一中的主動遠(yuǎn)紅外光源由波長為10. 5um的N個發(fā)光二極管LED組成。
8.根據(jù)權(quán)利要求2所述的基于多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別方法,其特征在于上述步驟一中的主動遠(yuǎn)紅外光源由波長為10. 5um的N個發(fā)光二極管LED組成。
9.根據(jù)權(quán)利要求3或9所述的基于多層級結(jié)構(gòu)的多尺度高效目標(biāo)圖像識別方法,其特征在于上述步驟一中的主動遠(yuǎn)紅外光源由波長為10. 5um的N個發(fā)光二極管LED組成。
全文摘要
本發(fā)明涉及基于多層級結(jié)構(gòu)的多尺度自適應(yīng)高效目標(biāo)圖像識別方法,通過采集目標(biāo)圖像、采集的原始圖像多層縮放分解顯示、目標(biāo)圖像識別步驟,較全面的解決了在圖像識別中由于圖像的大小變換等因素造成識別系統(tǒng)不夠穩(wěn)定、識別準(zhǔn)確率和識別速度間的關(guān)系對應(yīng)率較低、識別率不高等問題,同時本發(fā)明的基于多層級結(jié)構(gòu)的多尺度自適應(yīng)高效目標(biāo)圖像識別方法還具有很高的識別速度。
文檔編號G03B15/05GK102436576SQ20111032156
公開日2012年5月2日 申請日期2011年10月21日 優(yōu)先權(quán)日2011年10月21日
發(fā)明者洪濤 申請人:洪濤