一種基于深度學(xué)習(xí)的車輛品牌型號(hào)識(shí)別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像模式識(shí)別及智能交通領(lǐng)域,具體是關(guān)于智能交通系統(tǒng)中自動(dòng)識(shí)別高清卡口抓拍圖片中的機(jī)動(dòng)車輛的品牌型號(hào)的一種方法。
【背景技術(shù)】
[0002]經(jīng)濟(jì)的飛速發(fā)展,促使機(jī)動(dòng)車數(shù)量急劇上升,涉車犯罪亦越來(lái)越頻繁,如何快速鎖定嫌疑車輛就顯得非常重要。偵破此類案件的過(guò)程中,車牌雖然能夠提供權(quán)威的車輛信息,但對(duì)于假牌、套牌車卻無(wú)能為力。為了有效解決這一問(wèn)題,本發(fā)明提出了一種全新的能夠自動(dòng)識(shí)別出高清卡口抓拍圖片中車輛的品牌型號(hào)的方法,有關(guān)部門將車輛品牌型號(hào)信息與車輛的其他信息(車牌、車身顏色等)相結(jié)合可以有效的查處假牌、套牌車輛。
【發(fā)明內(nèi)容】
[0003]本發(fā)明針對(duì)高清監(jiān)控?cái)z像機(jī)拍攝的卡口圖片,設(shè)計(jì)了一種自動(dòng)識(shí)別圖片中車輛的品牌型號(hào)的方法,該方法支持自動(dòng)識(shí)別不低于三千種車輛的品牌型號(hào)。
[0004]本發(fā)明的技術(shù)方案,一種基于深度學(xué)習(xí)的車輛品牌型號(hào)識(shí)別方法,包括以下步驟:
[0005]S1、準(zhǔn)備數(shù)據(jù)集。本發(fā)明從不同城市的高清卡口點(diǎn)位搜集準(zhǔn)備了 2000多萬(wàn)張抓拍圖片,經(jīng)過(guò)人工篩選,根據(jù)車輛的品牌型號(hào)精確分成三千多類,建立了基本涵蓋各種條件的車輛品牌型號(hào)圖片數(shù)據(jù)庫(kù)。然后再利用車牌識(shí)別技術(shù)精確定位卡口圖片中的車牌位置,根據(jù)車牌位置信息準(zhǔn)確估計(jì)車臉區(qū)域(車臉區(qū)域與車牌的位置關(guān)系參見(jiàn)附圖2),再將車臉區(qū)域圖像進(jìn)行尺度歸一化處理。
[0006]S2、針對(duì)車輛品牌型號(hào)的識(shí)別任務(wù)設(shè)計(jì)一種新的深度卷積網(wǎng)絡(luò)結(jié)構(gòu)。
[0007]本發(fā)明設(shè)計(jì)的深度卷積網(wǎng)絡(luò)由1個(gè)輸入層,4個(gè)卷積層(分別用Cl、C2、C3、C4來(lái)表示),4個(gè)下采樣層(分別用Pl、P2、P3、P4來(lái)表示),2個(gè)全連接層(分別用Fl、F2來(lái)表示)和1個(gè)輸出層(用SoftMax來(lái)表示)組成。其中卷積是一種通過(guò)兩個(gè)函數(shù)生成第三個(gè)函數(shù)的一種數(shù)學(xué)算子。下采樣是指計(jì)算圖像一個(gè)區(qū)域的某一特征值的過(guò)程,常見(jiàn)的有以區(qū)域的平均值或區(qū)域的最大值來(lái)作為下采樣后的特征值。全連接是指把當(dāng)前層和下一層全部連接起來(lái)的一種網(wǎng)絡(luò)結(jié)構(gòu)。
[0008]本發(fā)明設(shè)計(jì)的深度卷積網(wǎng)絡(luò)結(jié)構(gòu)主要有兩點(diǎn)優(yōu)勢(shì):(1)能夠有效的組織不同尺度的卷積圖像特征為識(shí)別所用,融合不同尺度的卷及特征具體體現(xiàn)在本發(fā)明設(shè)計(jì)的深度卷積網(wǎng)絡(luò)的F1層;(2)能夠有效的提取車臉圖像的全局特征和局部特征,增強(qiáng)特征的表達(dá)辨識(shí)能力,本發(fā)明設(shè)計(jì)的深度卷積網(wǎng)絡(luò)中C1層和C2層提取的為全局圖像特征,C3層和C4層提取的為局部圖像特征。(詳細(xì)分析請(qǐng)參見(jiàn)具體實(shí)施例)
[0009]鑒于本發(fā)明設(shè)計(jì)的深度卷積網(wǎng)絡(luò)結(jié)構(gòu)具有以上兩點(diǎn)優(yōu)勢(shì),利用該網(wǎng)絡(luò)提取的圖像特征具備極強(qiáng)的魯棒性和區(qū)分度。
[0010]S3、訓(xùn)練深度卷積網(wǎng)絡(luò),得到每個(gè)層的網(wǎng)絡(luò)權(quán)值。本發(fā)明采用了經(jīng)典的反向傳導(dǎo)算法來(lái)訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò),所述反向傳導(dǎo)算法包括前向傳播和反向傳播兩個(gè)過(guò)程。在訓(xùn)練開(kāi)始前,網(wǎng)絡(luò)的初始權(quán)值采用隨機(jī)數(shù)進(jìn)行初始化,前向傳播過(guò)程中網(wǎng)絡(luò)利用系統(tǒng)的輸入,得到網(wǎng)絡(luò)結(jié)構(gòu)中各個(gè)層的激勵(lì)值,輸出層利用網(wǎng)絡(luò)輸出值和目標(biāo)值求差可得到整個(gè)網(wǎng)絡(luò)的預(yù)測(cè)誤差,誤差沿著網(wǎng)絡(luò)反向傳播回去,可以計(jì)算得到每個(gè)隱藏層的誤差,每層的激勵(lì)值和誤差的乘積就是該層權(quán)值的梯度,網(wǎng)絡(luò)權(quán)值加上權(quán)值對(duì)應(yīng)的梯度與某一比例因子的乘積后就完成了一次權(quán)值更新。如此反復(fù)迭代多直到網(wǎng)絡(luò)輸出誤差滿足要求時(shí)停止。
[0011]S4、利用深度卷積網(wǎng)絡(luò)提取車臉區(qū)域的圖像特征。
[0012]將車臉區(qū)域圖像輸入到本發(fā)明設(shè)計(jì)的深度卷積網(wǎng)絡(luò)結(jié)構(gòu)中,計(jì)算出的F1層和F2層結(jié)果均可作為車型識(shí)別的特征輸入,F(xiàn)1層特征維度較高,稀疏程度較高,存在較多的冗余信息,F(xiàn)2層是F1層經(jīng)過(guò)降維后的特征,保留了區(qū)分度較高特征部分,能更好地描述車臉區(qū)域。本發(fā)明采用F2層的輸出作為最終用于識(shí)別的特征描述子。
[0013]S5、實(shí)現(xiàn)了將深度卷積網(wǎng)絡(luò)和支撐向量機(jī)的完美結(jié)合,將深度卷積網(wǎng)絡(luò)提取的特征輸入到支撐向量機(jī),完成車輛品牌型號(hào)的識(shí)別。
【附圖說(shuō)明】
[0014]下面結(jié)合附圖的詳細(xì)說(shuō)明將更為清晰的解釋本發(fā)明的特征、目的和優(yōu)勢(shì),其中:
[0015]圖1是表示本發(fā)明的整體流程框架示意圖。
[0016]圖2是表示車臉區(qū)域與車牌的相對(duì)位置關(guān)系示意圖。
[0017]圖3是表示本發(fā)明設(shè)計(jì)的深度卷積網(wǎng)絡(luò)結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0018]為了更加清晰的闡述本發(fā)明的內(nèi)容,將結(jié)合附圖和優(yōu)選實(shí)施例來(lái)做進(jìn)一步說(shuō)明。
[0019]參照附圖1,一種基于深度學(xué)習(xí)的車輛品牌型號(hào)識(shí)別方法整體框架包含如下一些步驟:
[0020]S1、準(zhǔn)備車型訓(xùn)練數(shù)據(jù)集合
[0021]不同城市的高清卡口點(diǎn)位搜集準(zhǔn)備了 2000多萬(wàn)張抓拍圖片,經(jīng)過(guò)人工篩選,根據(jù)車輛的品牌型號(hào)精確分成三千多類,建立豐富的涵蓋各種條件的車輛品牌型號(hào)圖片數(shù)據(jù)庫(kù)。
[0022]為了適應(yīng)現(xiàn)實(shí)場(chǎng)景的復(fù)雜多變,本發(fā)明從多個(gè)城市的不同點(diǎn)位卡口中收集了 2000多萬(wàn)張高清卡口圖片,然后經(jīng)過(guò)數(shù)十人幾個(gè)月的手工精確篩選,根據(jù)車輛品牌型號(hào)分為了三千多個(gè)類別,后續(xù)深度卷積網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)就是基于此數(shù)據(jù)集合。然后再利用車牌識(shí)別技術(shù)精確定位卡口圖片中的車牌位置,根據(jù)車牌位置信息準(zhǔn)確的估計(jì)車臉區(qū)域,并將該區(qū)域圖像進(jìn)行尺度歸一化處理(即統(tǒng)一縮放到某一個(gè)固定尺度,優(yōu)選實(shí)施例中采用200x80)。所述的車牌識(shí)別是一種非常成熟的圖像處理技術(shù),是指算法從輸入圖像中經(jīng)過(guò)處理自動(dòng)輸出圖片中機(jī)動(dòng)車的車牌位置及車牌號(hào)碼。車臉區(qū)域與車牌位置的相對(duì)位置關(guān)系示意圖如附圖2所示。
[0023]S2、針對(duì)車輛品牌型號(hào)的識(shí)別設(shè)計(jì)一種新的深度卷積網(wǎng)絡(luò)結(jié)構(gòu)。
[0024]深度卷積網(wǎng)絡(luò)是近年來(lái)迅速崛起的研究領(lǐng)域,以其網(wǎng)絡(luò)權(quán)值共享和網(wǎng)絡(luò)架構(gòu)的靈活多變等諸多優(yōu)勢(shì)到了眾多研究者的親耐,針對(duì)不同的應(yīng)用領(lǐng)域如何設(shè)計(jì)出好的網(wǎng)絡(luò)結(jié)構(gòu),是一個(gè)研究熱點(diǎn)和難點(diǎn),目前基于深度卷積網(wǎng)絡(luò)架構(gòu)的算法技術(shù)已經(jīng)在語(yǔ)音識(shí)別和圖像識(shí)別領(lǐng)域掀起了新一輪的革命。
[0025]本發(fā)明的優(yōu)選實(shí)施例中設(shè)計(jì)的深度卷積網(wǎng)絡(luò)結(jié)構(gòu)示意圖如圖3所示,Cl、C2、C3、C4為卷積層,其中C1和C2為全局共享卷積核的卷積層用于提取全局圖像特征,C3和C4為局部共享卷積核的卷積層用于提取局部圖像特征以增強(qiáng)不同類型的車輛之間的區(qū)分度,Pl、P2、P3、P4為下采樣層,F(xiàn)l、F2為全連接層,SoftMax為網(wǎng)絡(luò)輸出層,網(wǎng)絡(luò)結(jié)構(gòu)中每一層都包括大量的可訓(xùn)練的參數(shù)。本發(fā)明的一個(gè)非常關(guān)鍵的創(chuàng)新點(diǎn)在于在C3和C4兩個(gè)卷積層丟棄了傳統(tǒng)的全局共享卷積核的思想,設(shè)計(jì)了全新的局部共享卷積核的策略,從而能夠提取出更加細(xì)致的圖像特征,同時(shí)還將P3和P4兩種不同尺度的特征聯(lián)合在一起作為后續(xù)層的輸入,進(jìn)一步增強(qiáng)了深度卷積網(wǎng)絡(luò)的辨識(shí)能力。
[0026]本發(fā)明的優(yōu)選實(shí)施例中設(shè)計(jì)的深度卷積網(wǎng)絡(luò)結(jié)構(gòu)中各個(gè)層的參數(shù)為:輸入層為200x 80的單通道灰度圖像;C1層全局共享的卷積核大小為5x 5,步長(zhǎng)為1,卷積核數(shù)量為30個(gè),卷積后的特征尺度為196x 76 ;P1層采樣窗口為3,步長(zhǎng)為3,采樣后的特征數(shù)量為30個(gè),特征尺度為66x 26 ;C2層全局共享的卷積核大小為3x 3,步長(zhǎng)為1,卷積核數(shù)量為60個(gè),卷積后的特征尺度為64x 24 ;P2層采樣窗口為2,步長(zhǎng)為2,采樣后的特征數(shù)量為60個(gè),特征尺度為32x 12 ;C3層采用了局部共享卷積核的策略,將P2層的輸出特征分為了 4個(gè)16x 6,每一個(gè)子區(qū)域共享3x 3的卷積