本發(fā)明涉及視頻監(jiān)控技術(shù)領(lǐng)域,具體涉及一種車型識(shí)別方法及終端。
背景技術(shù):
隨著交通運(yùn)輸業(yè)的快速發(fā)展,人們的出行日益便捷,但與此同時(shí)也伴隨著頻繁發(fā)生的交通事故、交通擁堵等現(xiàn)象,使得交通安全問題越來越成為人們重點(diǎn)關(guān)注的問題。在現(xiàn)代的科技背景下,人們引入了智能交通運(yùn)輸系統(tǒng)(Intelligent Transportation System,ITS)。
目前來看,車型識(shí)別及時(shí)作為智能交通運(yùn)輸系統(tǒng)的一個(gè)重要應(yīng)用,雖然車型識(shí)別技術(shù)已經(jīng)取得了非常大的進(jìn)步,識(shí)別率非常高,速度也很快。但是,該技術(shù)目前還存在很多未被解決的難題,比如光照、角度等問題帶來的識(shí)別上的干擾,因而,如何識(shí)別出兩輛車是否為同一車型的問題有待解決。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供了一種車型識(shí)別方法及終端,以期可識(shí)別出同一車型的車輛。
本發(fā)明實(shí)施例第一方面提供了一種車型識(shí)別方法,包括:
獲取第一目標(biāo)圖像,所述第一目標(biāo)圖像中包含第一車輛;
獲取第二目標(biāo)圖像,所述第二目標(biāo)圖像中包含第二車輛;
確定出所述第一目標(biāo)圖像的第一車輛區(qū)域和所述第二目標(biāo)圖像的第二車輛區(qū)域;
分別將所述第一車輛區(qū)域和所述第二目標(biāo)圖像進(jìn)行對齊,并縮放到指定尺寸,得到第一圖像和第二圖像;
采用目標(biāo)分類器計(jì)算出所述第一圖像和所述第二圖像之間的余弦距離;
在所述余弦距離小于預(yù)設(shè)閾值時(shí),確定所述第一車輛和所述第二車輛為同一車型;
在所述余弦距離大于或等于所述預(yù)設(shè)閾值時(shí),確定所述第一車輛和所述第二車輛為不同車型。
可選地,所述采用目標(biāo)分類器計(jì)算出所述第一圖像和所述第二圖像之間的余弦距離,包括:
采用所述目標(biāo)分類器對所述第一圖像進(jìn)行訓(xùn)練,得到P個(gè)特征,所述P為大于1的整數(shù);
采用所述目標(biāo)分類器對所述第二圖像進(jìn)行訓(xùn)練,得到Q個(gè)特征,所述Q為大于1的整數(shù);
分別對所述P個(gè)特征和所述Q個(gè)特征進(jìn)行主成分分析PCA處理,得到所述P個(gè)目標(biāo)特征和所述Q個(gè)目標(biāo)特征;
根據(jù)所述P個(gè)目標(biāo)特征和所述Q個(gè)目標(biāo)特征確定所述第一圖像和所述第二圖像之間的余弦距離。
可選地,所述目標(biāo)分類器為神經(jīng)網(wǎng)絡(luò)分類器,所述神經(jīng)網(wǎng)絡(luò)分類器的softmax工具箱中加入了center loss函數(shù)。
可選地,所述center loss函數(shù)如下:
其中,表示第yi類的中心深層特征,m表示批量處理圖像的數(shù)據(jù)量大小,xi表示第i張圖像的深層特征,Lc為center loss函數(shù)。
可選地,在所述獲取第一目標(biāo)圖像之前,所述方法還包括:
獲取所述第一車輛的車型的正樣本集和負(fù)樣本集;
對所述正樣本集合所述負(fù)樣本集進(jìn)行特征提取,得到多個(gè)特征;
對所述多個(gè)特征進(jìn)行訓(xùn)練,得到所述目標(biāo)分類器。
本發(fā)明實(shí)施例第二方面提供了一種終端,包括:
第一獲取單元,用于獲取第一目標(biāo)圖像,所述第一目標(biāo)圖像中包含第一車輛;
第二獲取單元,用于獲取第二目標(biāo)圖像,所述第二目標(biāo)圖像中包含第二車輛;
第一確定單元,用于確定出所述第一目標(biāo)圖像的第一車輛區(qū)域和所述第二目標(biāo)圖像的第二車輛區(qū)域;
處理單元,用于分別將所述第一車輛區(qū)域和所述第二目標(biāo)圖像進(jìn)行對齊,并縮放到指定尺寸,得到第一圖像和第二圖像;
計(jì)算單元,用于采用目標(biāo)分類器計(jì)算出所述第一圖像和所述第二圖像之間的余弦距離;
第二確定單元,用于在所述余弦距離小于預(yù)設(shè)閾值時(shí),確定所述第一車輛和所述第二車輛為同一車型;
所述第二確定單元,還具體用于:
在所述余弦距離大于或等于所述預(yù)設(shè)閾值時(shí),確定所述第一車輛和所述第二車輛為不同車型。
可選地,所述計(jì)算單元包括:
訓(xùn)練模塊,用于采用所述目標(biāo)分類器對所述第一圖像進(jìn)行訓(xùn)練,得到P個(gè)特征,所述P為大于1的整數(shù);
所述訓(xùn)練模塊,還具體用于:
采用所述目標(biāo)分類器對所述第二圖像進(jìn)行訓(xùn)練,得到Q個(gè)特征,所述Q為大于1的整數(shù);
處理模塊,用于分別對所述P個(gè)特征和所述Q個(gè)特征進(jìn)行主成分分析PCA處理,得到所述P個(gè)目標(biāo)特征和所述Q個(gè)目標(biāo)特征;
確定模塊,用于根據(jù)所述P個(gè)目標(biāo)特征和所述Q個(gè)目標(biāo)特征確定所述第一圖像和所述第二圖像之間的余弦距離。
可選地,所述目標(biāo)分類器為神經(jīng)網(wǎng)絡(luò)分類器,所述神經(jīng)網(wǎng)絡(luò)分類器的softmax工具箱中加入了center loss函數(shù)。
可選地,所述center loss函數(shù)如下:
其中,表示第yi類的中心深層特征,m表示批量處理圖像的數(shù)據(jù)量大小,xi表示第i張圖像的深層特征,Lc為center loss函數(shù)。
可選地,所述終端還包括:
第三獲取單元,用于在所述第一獲取單元獲取第一目標(biāo)圖像之前,獲取所述第一車輛的車型的正樣本集和負(fù)樣本集;
提取單元,用于對所述正樣本集合所述負(fù)樣本集進(jìn)行特征提取,得到多個(gè)特征;
訓(xùn)練單元,用于對所述多個(gè)特征進(jìn)行訓(xùn)練,得到所述目標(biāo)分類器。
實(shí)施本發(fā)明實(shí)施例,具有如下有益效果:
通過本發(fā)明實(shí)施例,獲取第一目標(biāo)圖像,第一目標(biāo)圖像中包含第一車輛,獲取第二目標(biāo)圖像,第二目標(biāo)圖像中包含第二車輛,確定出,第一目標(biāo)圖像的第一車輛區(qū)域和第二目標(biāo)圖像的第二車輛區(qū)域,分別將,第一車輛區(qū)域和,第二目標(biāo)圖像進(jìn)行對齊,并縮放到指定尺寸,得到第一圖像和第二圖像,采用目標(biāo)分類器計(jì)算出第一圖像和第二圖像之間的余弦距離,在余弦距離小于預(yù)設(shè)閾值時(shí),確定第一車輛和所述第二車輛為同一車型,在余弦距離大于或等于預(yù)設(shè)閾值時(shí),確定第一車輛和所述第二車輛為不同車型。如此,可識(shí)別出同一車型的車輛。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實(shí)施例提供的一種車型識(shí)別方法的第一實(shí)施例流程示意圖;
圖2是本發(fā)明實(shí)施例提供的一種車型識(shí)別方法的第二實(shí)施例流程示意圖;
圖3a是本發(fā)明實(shí)施例提供的一種終端的第一實(shí)施例結(jié)構(gòu)示意圖;
圖3b是本發(fā)明實(shí)施例提供的圖3a所描述的終端的計(jì)算單元的結(jié)構(gòu)示意圖;
圖3c是本發(fā)明實(shí)施例提供的圖3a所描述的終端的又一結(jié)構(gòu)示意圖;
圖4是本發(fā)明實(shí)施例提供的一種終端的第二實(shí)施例結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明的說明書和權(quán)利要求書及所述附圖中的術(shù)語“第一”、“第二”、“第三”和“第四”等是用于區(qū)別不同對象,而不是用于描述特定順序。此外,術(shù)語“包括”和“具有”以及它們?nèi)魏巫冃危鈭D在于覆蓋不排他的包含。例如包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備沒有限定于已列出的步驟或單元,而是可選地還包括沒有列出的步驟或單元,或可選地還包括對于這些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
在本文中提及“實(shí)施例”意味著,結(jié)合實(shí)施例描述的特定特征、結(jié)構(gòu)或特性可以包含在本發(fā)明的至少一個(gè)實(shí)施例中。在說明書中的各個(gè)位置展示該短語并不一定均是指相同的實(shí)施例,也不是與其它實(shí)施例互斥的獨(dú)立的或備選的實(shí)施例。本領(lǐng)域技術(shù)人員顯式地和隱式地理解的是,本文所描述的實(shí)施例可以與其它實(shí)施例相結(jié)合。
本發(fā)明實(shí)施例所描述終端可以包括智能手機(jī)(如Android手機(jī)、iOS手機(jī)、Windows Phone手機(jī)等)、平板電腦、掌上電腦、筆記本電腦、移動(dòng)互聯(lián)網(wǎng)設(shè)備(MID,Mobile Internet Devices)或穿戴式設(shè)備等,上述僅是舉例,而非窮舉,包含但不限于上述終端。
深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)研究中的一個(gè)新領(lǐng)域,這兩年在圖像識(shí)別、語音識(shí)別以及自然語言處理方面取得了巨大的成功。深度學(xué)習(xí)是通過構(gòu)建多層神經(jīng)網(wǎng)絡(luò)模型來訓(xùn)練數(shù)據(jù),可以學(xué)習(xí)出有用的特征,通過對大量樣本學(xué)習(xí)可以得到很高的識(shí)別正確率。但是在同時(shí)需要識(shí)別多個(gè)屬性時(shí),已有的深度學(xué)習(xí)方法往往是通過將各個(gè)屬性獨(dú)立出來,為每一個(gè)屬性訓(xùn)練一個(gè)模型,這無疑大大增加了復(fù)雜度。因此,如何將各個(gè)屬性聯(lián)系起來,通過設(shè)計(jì)一個(gè)模型即可對多個(gè)屬性進(jìn)行識(shí)別成為當(dāng)下繼續(xù)解決的問題。
本發(fā)明實(shí)施例公開一種基于深度學(xué)習(xí)的車型識(shí)別方法。該方法在訓(xùn)練過程中基于softmax loss的基礎(chǔ)上引入center loss,提高了準(zhǔn)確率。主要包括以下3個(gè)步驟:獲取第一目標(biāo)圖像,所述第一目標(biāo)圖像中包含第一車輛;
獲取第二目標(biāo)圖像,所述第二目標(biāo)圖像中包含第二車輛;
確定出所述第一目標(biāo)圖像的第一車輛區(qū)域和所述第二目標(biāo)圖像的第二車輛區(qū)域;
分別將所述第一車輛區(qū)域和所述第二目標(biāo)圖像進(jìn)行對齊,并縮放到指定尺寸,得到第一圖像和第二圖像;
采用目標(biāo)分類器計(jì)算出所述第一圖像和所述第二圖像之間的余弦距離;
在所述余弦距離小于預(yù)設(shè)閾值時(shí),確定所述第一車輛和所述第二車輛為同一車型;
在所述余弦距離大于或等于所述預(yù)設(shè)閾值時(shí),確定所述第一車輛和所述第二車輛為不同車型。
上述步驟可歸納為下述三個(gè)步驟:
1)、首先,將從輸入的圖像中檢測到車型區(qū)域并截取車型區(qū)域圖像,然后將車型圖像對齊,縮放到特定尺寸。
2)、其次,所有訓(xùn)練圖像均由上述預(yù)處理后作為輸入,通過CNN訓(xùn)練得到車型的特征,并在softmax的基礎(chǔ)上加入center loss,使學(xué)到的特征具有更加好的泛化能力和辨別能力。通過懲罰每個(gè)種類的樣本與該種類樣本中心的偏移,使得同一種類的樣本盡量聚合在一起。相對于triplet和contrastive來說,這個(gè)目標(biāo)相對清晰,而且不需要像前兩者那樣構(gòu)造大量的訓(xùn)練對。
3)、最后,兩張車型圖像均經(jīng)過步驟(1)和(2),獲取到相應(yīng)的特征,作為本步的輸入,通過訓(xùn)練好的模型,計(jì)算出兩張車型圖像進(jìn)過PCA后的余弦距離,并與先驗(yàn)的閾值進(jìn)行對比,如距離大于預(yù)設(shè)閾值,則認(rèn)為這兩張車型圖像非同一輛車,否則為同一輛車。
請參閱圖1,為本發(fā)明實(shí)施例提供的一種車型識(shí)別方法的第一實(shí)施例流程示意圖。本實(shí)施例中所描述的車型識(shí)別方法,包括以下步驟:
101、獲取第一目標(biāo)圖像,所述第一目標(biāo)圖像中包含第一車輛。
可選地,第一目標(biāo)圖像中可包含第一車輛。
102、獲取第二目標(biāo)圖像,所述第二目標(biāo)圖像中包含第二車輛。
103、確定出所述第一目標(biāo)圖像的第一車輛區(qū)域和所述第二目標(biāo)圖像的第二車輛區(qū)域。
其中,第一車輛區(qū)域?yàn)榘谝卉囕v的區(qū)域,第二車輛區(qū)域未包含第二車輛的區(qū)域。
104、分別將所述第一車輛區(qū)域和所述第二目標(biāo)圖像進(jìn)行對齊,并縮放到指定尺寸,得到第一圖像和第二圖像。
其中,第一車輛區(qū)域在進(jìn)行對齊及縮放到指定尺寸后,得到第一圖像,第二車輛區(qū)域在進(jìn)行對齊及縮放到指定尺寸后,得到第二圖像。上述指定尺寸可由系統(tǒng)默認(rèn)或者用戶自行設(shè)置。在數(shù)據(jù)預(yù)處理階段,通過對數(shù)據(jù)的增強(qiáng)來提高CNN模型的識(shí)別能力和泛化能力。本發(fā)明將使用以下方法對預(yù)處理階段所得到的車型圖像進(jìn)行數(shù)據(jù)增強(qiáng)。首先,對顏色的數(shù)據(jù)增強(qiáng),主要包括對色彩的飽和度、亮度以及對比度等方面。其次,對CNN網(wǎng)絡(luò)的輸入數(shù)據(jù)進(jìn)行規(guī)范化,計(jì)算車型圖像的RBG顏色通道的均值和標(biāo)準(zhǔn)差,并在整個(gè)訓(xùn)練集上計(jì)算了協(xié)方差矩陣,最后進(jìn)行特征分解得到特征向量和特征值,并做PCA Jittering處理。最后,在訓(xùn)練的時(shí)候采用隨機(jī)的圖像差值方式對車型圖像進(jìn)行裁剪和縮放。
105、采用目標(biāo)分類器計(jì)算出所述第一圖像和所述第二圖像之間的余弦距離。
可選地,上述步驟105中,采用目標(biāo)分類器計(jì)算出所述第一圖像和所述第二圖像之間的余弦距離,可包括如下步驟:
51)、采用所述目標(biāo)分類器對所述第一圖像進(jìn)行訓(xùn)練,得到P個(gè)特征,所述P為大于1的整數(shù);
52)、采用所述目標(biāo)分類器對所述第二圖像進(jìn)行訓(xùn)練,得到Q個(gè)特征,所述Q為大于1的整數(shù);
53)、分別對所述P個(gè)特征和所述Q個(gè)特征進(jìn)行主成分分析PCA處理,得到所述P個(gè)目標(biāo)特征和所述Q個(gè)目標(biāo)特征;
54)、根據(jù)所述P個(gè)目標(biāo)特征和所述Q個(gè)目標(biāo)特征確定所述第一圖像和所述第二圖像之間的余弦距離。
可選地,整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)包括3個(gè)卷積層和3個(gè)局部卷積層以及一個(gè)全連接層。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)已經(jīng)廣泛應(yīng)用于計(jì)算機(jī)視覺領(lǐng)域,顯著提高現(xiàn)有計(jì)算機(jī)視覺水平。在大多數(shù)可用的CNN中,softmax損失函數(shù)被用作訓(xùn)練深度模型的監(jiān)視信號(hào)。為了增強(qiáng)深度學(xué)習(xí)特征的識(shí)別能力,本發(fā)明實(shí)施例為車型識(shí)別任務(wù)提出一種新的監(jiān)視信號(hào),稱作為中心損失函數(shù)(center loss)。center loss的原理主要是在softmax loss的基礎(chǔ)上,通過對訓(xùn)練集的每個(gè)類別在特征空間分別維護(hù)一個(gè)類中心,在訓(xùn)練過程,增加樣本經(jīng)過網(wǎng)絡(luò)映射后在特征空間與類中心的距離約束,從而兼顧了類內(nèi)聚合與類間分離。同樣是作為訓(xùn)練階段的輔助loss,center loss相對于contrastive loss和triplet loss的優(yōu)點(diǎn)顯然省去了復(fù)雜并且含糊的樣本對構(gòu)造過程,只需要在特征輸出層中引入即可。通過softmax和center loss的聯(lián)合監(jiān)視,我們可以訓(xùn)練出足夠強(qiáng)大的CNN,得到兩個(gè)關(guān)鍵學(xué)習(xí)目標(biāo)的深層特征以及盡可能高的類間分散性和類內(nèi)緊密性,有利于提高準(zhǔn)確性。
可選地,上述目標(biāo)分類器為神經(jīng)網(wǎng)絡(luò)分類器,該神經(jīng)網(wǎng)絡(luò)分類器的softmax工具箱中加入了center loss函數(shù)。
進(jìn)一步可選地,所述center loss函數(shù)如下:
其中,表示第yi類的中心深層特征,m表示批量處理圖像的數(shù)據(jù)量大小,xi表示第i張圖像的深層特征,Lc為center loss函數(shù)。
具體地,為了開發(fā)有效的損失函數(shù)來提高辨別力的深層特征學(xué)習(xí),其關(guān)鍵在于最小化類內(nèi)變化同時(shí)保持不同類的特征可分離,因此,本發(fā)明實(shí)施例中提出了中心損失函數(shù)。中心損失函數(shù)定義如下:
其中表示第yi類的中心深層特征,m表示批量處理圖像的數(shù)據(jù)量大小,xi表示第i張圖像的深層特征,Lc為center loss函數(shù),該公式有效地說明了類內(nèi)變化。并采取mini-batch的方式批量更新訓(xùn)練集的中心,在每次迭代過程中,中心由對應(yīng)類的特征所計(jì)算的均值產(chǎn)生。
其聯(lián)合損失函數(shù)定義如下:
其中,公式左邊是softmax損失函數(shù),而右邊屬于center loss,λ參數(shù)用來協(xié)調(diào)兩個(gè)損失函數(shù)之間的平衡。
106、在所述余弦距離小于預(yù)設(shè)閾值時(shí),確定所述第一車輛和所述第二車輛為同一車型。
107、在所述余弦距離大于或等于所述預(yù)設(shè)閾值時(shí),確定所述第一車輛和所述第二車輛為不同車型。
其中,上述預(yù)設(shè)閾值可由系統(tǒng)默認(rèn)或者用戶自行設(shè)置。在上述余弦距離小于預(yù)設(shè)閾值時(shí),確定第一車輛和第二車輛為同一車型。在余弦距離大于或等于預(yù)設(shè)閾值時(shí),確定第一車輛和所述第二車輛為不同車型。上述車型可為:車的樣式或者型號(hào)。例如,轎車和卡車是不同的車型,或者,奔馳轎車與林肯轎車的車型也不一樣。
在實(shí)際應(yīng)用中,上述本發(fā)明實(shí)施例不僅可用于識(shí)別兩輛車的車型是否相同,還可以進(jìn)行如下操作,例如,可獲取多張圖像,每一圖像中包含一個(gè)車輛,可通過本發(fā)明實(shí)施例識(shí)別出屬于同一車型的圖像,也可以將多張圖像中的車輛進(jìn)行分類,例如,從大量車的圖像中找出同款車型。當(dāng)然,還可以從一類車中找出不屬于該類車的車型。上述車型可包括但不僅限于:巴士、卡車、摩托車、面包車等等。
可以看出,通過本發(fā)明實(shí)施例,獲取第一車輛的車型的正樣本集和負(fù)樣本集,對正樣本集合負(fù)樣本集進(jìn)行特征提取,得到多個(gè)特征,對多個(gè)特征進(jìn)行訓(xùn)練,得到目標(biāo)分類器,獲取第一目標(biāo)圖像,第一目標(biāo)圖像中包含第一車輛,獲取第二目標(biāo)圖像,第二目標(biāo)圖像中包含第二車輛,確定出,第一目標(biāo)圖像的第一車輛區(qū)域和第二目標(biāo)圖像的第二車輛區(qū)域,分別將,第一車輛區(qū)域和,第二目標(biāo)圖像進(jìn)行對齊,并縮放到指定尺寸,得到第一圖像和第二圖像,采用目標(biāo)分類器計(jì)算出第一圖像和第二圖像之間的余弦距離,在余弦距離小于預(yù)設(shè)閾值時(shí),確定第一車輛和所述第二車輛為同一車型,在余弦距離大于或等于預(yù)設(shè)閾值時(shí),確定第一車輛和所述第二車輛為不同車型。如此,可識(shí)別出同一車型的車輛。
與上述一致地,請參閱圖2,為本發(fā)明實(shí)施例提供的一種車型識(shí)別方法的第二實(shí)施例流程示意圖。本實(shí)施例中所描述的車型識(shí)別方法,包括以下步驟:
201、獲取第一車輛的車型的正樣本集和負(fù)樣本集。
202、對所述正樣本集合所述負(fù)樣本集進(jìn)行特征提取,得到多個(gè)特征。
203、對所述多個(gè)特征進(jìn)行訓(xùn)練,得到目標(biāo)分類器。
其中,步驟201中的正樣本集可為第一車輛,例如,第一車輛的車型特征等等,正樣本集中包含多個(gè)正樣本。負(fù)樣本集則為用戶想檢索的目標(biāo)之外的景物,負(fù)樣本集中包含多個(gè)負(fù)樣本。上述正樣本集和負(fù)樣本集的包含的樣本數(shù)量當(dāng)然越多,訓(xùn)練出來的模型越準(zhǔn)確,但是,正樣本和負(fù)樣本的數(shù)量越多,也會(huì)增加訓(xùn)練時(shí)候的計(jì)算成本。采用分類器對正樣本集和負(fù)樣本集進(jìn)行訓(xùn)練,就可以得到一個(gè)訓(xùn)練模型。其中,上述分類器可為神經(jīng)網(wǎng)絡(luò)分類器,支持向量基(Support Vector Machine,SVM)分類器、遺傳算法分類器、CNN分類器等等。
204、獲取第一目標(biāo)圖像,所述第一目標(biāo)圖像中包含第一車輛。
205、獲取第二目標(biāo)圖像,所述第二目標(biāo)圖像中包含第二車輛。
206、確定出所述第一目標(biāo)圖像的第一車輛區(qū)域和所述第二目標(biāo)圖像的第二車輛區(qū)域。
207、分別將所述第一車輛區(qū)域和所述第二目標(biāo)圖像進(jìn)行對齊,并縮放到指定尺寸,得到第一圖像和第二圖像。
208、采用所述目標(biāo)分類器計(jì)算出所述第一圖像和所述第二圖像之間的余弦距離。
209、在所述余弦距離小于預(yù)設(shè)閾值時(shí),確定所述第一車輛和所述第二車輛為同一車型。
210、在所述余弦距離大于或等于所述預(yù)設(shè)閾值時(shí),確定所述第一車輛和所述第二車輛為不同車型。
其中,上述步驟204-步驟210可參照圖1所描述的車型識(shí)別方法的對應(yīng)步驟。
可以看出,通過本發(fā)明實(shí)施例,獲取第一目標(biāo)圖像,第一目標(biāo)圖像中包含第一車輛,獲取第二目標(biāo)圖像,第二目標(biāo)圖像中包含第二車輛,確定出,第一目標(biāo)圖像的第一車輛區(qū)域和第二目標(biāo)圖像的第二車輛區(qū)域,分別將,第一車輛區(qū)域和,第二目標(biāo)圖像進(jìn)行對齊,并縮放到指定尺寸,得到第一圖像和第二圖像,采用目標(biāo)分類器計(jì)算出第一圖像和第二圖像之間的余弦距離,在余弦距離小于預(yù)設(shè)閾值時(shí),確定第一車輛和所述第二車輛為同一車型,在余弦距離大于或等于預(yù)設(shè)閾值時(shí),確定第一車輛和所述第二車輛為不同車型。如此,可識(shí)別出同一車型的車輛。
與上述一致地,以下為實(shí)施上述車型識(shí)別方法的裝置,具體如下:
請參閱圖3a,為本發(fā)明實(shí)施例提供的一種終端的第一實(shí)施例結(jié)構(gòu)示意圖。本實(shí)施例中所描述的終端,包括:第一獲取單元301、第二獲取單元302、第一確定單元303、處理單元304、計(jì)算單元305和第二確定單元306,具體如下:
第一獲取單元301,用于獲取第一目標(biāo)圖像,所述第一目標(biāo)圖像中包含第一車輛;
第二獲取單元302,用于獲取第二目標(biāo)圖像,所述第二目標(biāo)圖像中包含第二車輛;
第一確定單元303,用于確定出所述第一目標(biāo)圖像的第一車輛區(qū)域和所述第二目標(biāo)圖像的第二車輛區(qū)域;
處理單元304,用于分別將所述第一車輛區(qū)域和所述第二目標(biāo)圖像進(jìn)行對齊,并縮放到指定尺寸,得到第一圖像和第二圖像;
計(jì)算單元305,用于采用目標(biāo)分類器計(jì)算出所述第一圖像和所述第二圖像之間的余弦距離;
第二確定單元306,用于在所述余弦距離小于預(yù)設(shè)閾值時(shí),確定所述第一車輛和所述第二車輛為同一車型;
所述第二確定單元306,還具體用于:
在所述余弦距離大于或等于所述預(yù)設(shè)閾值時(shí),確定所述第一車輛和所述第二車輛為不同車型。
可選地,如圖3b,圖3b為圖3a所描述的終端的計(jì)算單元305的具體細(xì)化結(jié)構(gòu),所述計(jì)算單元305可包括:訓(xùn)練模塊3051、處理模塊3052和確定模塊3053
訓(xùn)練模塊3051,用于采用所述目標(biāo)分類器對所述第一圖像進(jìn)行訓(xùn)練,得到P個(gè)特征,所述P為大于1的整數(shù);
所述訓(xùn)練模塊3051,還具體用于:
采用所述目標(biāo)分類器對所述第二圖像進(jìn)行訓(xùn)練,得到Q個(gè)特征,所述Q為大于1的整數(shù);
處理模塊3052,用于分別對所述P個(gè)特征和所述Q個(gè)特征進(jìn)行主成分分析PCA處理,得到所述P個(gè)目標(biāo)特征和所述Q個(gè)目標(biāo)特征;
確定模塊3053,用于根據(jù)所述P個(gè)目標(biāo)特征和所述Q個(gè)目標(biāo)特征確定所述第一圖像和所述第二圖像之間的余弦距離。
可選地,所述目標(biāo)分類器為神經(jīng)網(wǎng)絡(luò)分類器,所述神經(jīng)網(wǎng)絡(luò)分類器的softmax工具箱中加入了center loss函數(shù)。
可選地,所述center loss函數(shù)如下:
其中,表示第yi類的中心深層特征,m表示批量處理圖像的數(shù)據(jù)量大小,xi表示第i張圖像的深層特征,Lc為center loss函數(shù)。
可選地,如圖3c,圖3c為圖3a所描述的終端的變型結(jié)構(gòu),與圖3a所描述的終端相比較,其還包括:第三獲取單元307、提取單元308和訓(xùn)練單元309,具體如下:
第三獲取單元307,用于在所述第一獲取單元獲取第一目標(biāo)圖像之前,獲取所述第一車輛的車型的正樣本集和負(fù)樣本集;
提取單元308,用于對所述正樣本集合所述負(fù)樣本集進(jìn)行特征提取,得到多個(gè)特征;
訓(xùn)練單元309,用于對所述多個(gè)特征進(jìn)行訓(xùn)練,得到所述目標(biāo)分類器。
可以看出,通過本發(fā)明實(shí)施例所描述的終端,可獲取第一目標(biāo)圖像,第一目標(biāo)圖像中包含第一車輛,獲取第二目標(biāo)圖像,第二目標(biāo)圖像中包含第二車輛,確定出,第一目標(biāo)圖像的第一車輛區(qū)域和第二目標(biāo)圖像的第二車輛區(qū)域,分別將,第一車輛區(qū)域和,第二目標(biāo)圖像進(jìn)行對齊,并縮放到指定尺寸,得到第一圖像和第二圖像,采用目標(biāo)分類器計(jì)算出第一圖像和第二圖像之間的余弦距離,在余弦距離小于預(yù)設(shè)閾值時(shí),確定第一車輛和所述第二車輛為同一車型,在余弦距離大于或等于預(yù)設(shè)閾值時(shí),確定第一車輛和所述第二車輛為不同車型。如此,可識(shí)別出同一車型的車輛。
與上述一致地,請參閱圖4,為本發(fā)明實(shí)施例提供的一種終端的第二實(shí)施例結(jié)構(gòu)示意圖。本實(shí)施例中所描述的終端,包括:至少一個(gè)輸入設(shè)備1000;至少一個(gè)輸出設(shè)備2000;至少一個(gè)處理器3000,例如CPU;和存儲(chǔ)器4000,上述輸入設(shè)備1000、輸出設(shè)備2000、處理器3000和存儲(chǔ)器4000通過總線5000連接。
其中,上述輸入設(shè)備1000具體可為觸控面板、物理按鍵或者鼠標(biāo)。
上述輸出設(shè)備2000具體可為顯示屏。
上述存儲(chǔ)器4000可以是高速RAM存儲(chǔ)器,也可為非易失存儲(chǔ)器(non-volatile memory),例如磁盤存儲(chǔ)器。上述存儲(chǔ)器4000用于存儲(chǔ)一組程序代碼,上述輸入設(shè)備1000、輸出設(shè)備2000和處理器3000用于調(diào)用存儲(chǔ)器4000中存儲(chǔ)的程序代碼,執(zhí)行如下操作:
上述處理器3000,用于:
獲取第一目標(biāo)圖像,所述第一目標(biāo)圖像中包含第一車輛;
獲取第二目標(biāo)圖像,所述第二目標(biāo)圖像中包含第二車輛;
確定出所述第一目標(biāo)圖像的第一車輛區(qū)域和所述第二目標(biāo)圖像的第二車輛區(qū)域;
分別將所述第一車輛區(qū)域和所述第二目標(biāo)圖像進(jìn)行對齊,并縮放到指定尺寸,得到第一圖像和第二圖像;
采用目標(biāo)分類器計(jì)算出所述第一圖像和所述第二圖像之間的余弦距離;
在所述余弦距離小于預(yù)設(shè)閾值時(shí),確定所述第一車輛和所述第二車輛為同一車型;
在所述余弦距離大于或等于所述預(yù)設(shè)閾值時(shí),確定所述第一車輛和所述第二車輛為不同車型。
可選地,上述處理器3000采用目標(biāo)分類器計(jì)算出所述第一圖像和所述第二圖像之間的余弦距離,包括:
采用所述目標(biāo)分類器對所述第一圖像進(jìn)行訓(xùn)練,得到P個(gè)特征,所述P為大于1的整數(shù);
采用所述目標(biāo)分類器對所述第二圖像進(jìn)行訓(xùn)練,得到Q個(gè)特征,所述Q為大于1的整數(shù);
分別對所述P個(gè)特征和所述Q個(gè)特征進(jìn)行主成分分析PCA處理,得到所述P個(gè)目標(biāo)特征和所述Q個(gè)目標(biāo)特征;
根據(jù)所述P個(gè)目標(biāo)特征和所述Q個(gè)目標(biāo)特征確定所述第一圖像和所述第二圖像之間的余弦距離。
可選地,所述目標(biāo)分類器為神經(jīng)網(wǎng)絡(luò)分類器,所述神經(jīng)網(wǎng)絡(luò)分類器的softmax工具箱中加入了center loss函數(shù)。
可選地,所述center loss函數(shù)如下:
其中,表示第yi類的中心深層特征,m表示批量處理圖像的數(shù)據(jù)量大小,xi表示第i張圖像的深層特征,Lc為center loss函數(shù)。
可選地,上述處理器3000在所述獲取第一目標(biāo)圖像之前,還具體用于:
獲取所述第一車輛的車型的正樣本集和負(fù)樣本集;
對所述正樣本集合所述負(fù)樣本集進(jìn)行特征提取,得到多個(gè)特征;
對所述多個(gè)特征進(jìn)行訓(xùn)練,得到所述目標(biāo)分類器。
本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)存儲(chǔ)介質(zhì),其中,該計(jì)算機(jī)存儲(chǔ)介質(zhì)可存儲(chǔ)有程序,該程序執(zhí)行時(shí)包括上述方法實(shí)施例中記載的任何一種車型識(shí)別方法的部分或全部步驟。
盡管在此結(jié)合各實(shí)施例對本發(fā)明進(jìn)行了描述,然而,在實(shí)施所要求保護(hù)的本發(fā)明過程中,本領(lǐng)域技術(shù)人員通過查看所述附圖、公開內(nèi)容、以及所附權(quán)利要求書,可理解并實(shí)現(xiàn)所述公開實(shí)施例的其他變化。在權(quán)利要求中,“包括”(comprising)一詞不排除其他組成部分或步驟,“一”或“一個(gè)”不排除多個(gè)的情況。單個(gè)處理器或其他單元可以實(shí)現(xiàn)權(quán)利要求中列舉的若干項(xiàng)功能。相互不同的從屬權(quán)利要求中記載了某些措施,但這并不表示這些措施不能組合起來產(chǎn)生良好的效果。
本領(lǐng)域技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、裝置(設(shè)備)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、CD-ROM、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。計(jì)算機(jī)程序存儲(chǔ)/分布在合適的介質(zhì)中,與其它硬件一起提供或作為硬件的一部分,也可以采用其他分布形式,如通過Internet或其它有線或無線電信系統(tǒng)。
本發(fā)明是參照本發(fā)明實(shí)施例的方法、裝置(設(shè)備)和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
盡管結(jié)合具體特征及其實(shí)施例對本發(fā)明進(jìn)行了描述,顯而易見的,在不脫離本發(fā)明的精神和范圍的情況下,可對其進(jìn)行各種修改和組合。相應(yīng)地,本說明書和附圖僅僅是所附權(quán)利要求所界定的本發(fā)明的示例性說明,且視為已覆蓋本發(fā)明范圍內(nèi)的任意和所有修改、變化、組合或等同物。顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。