對(duì)象檢測(cè)方法、對(duì)象檢測(cè)設(shè)備以及圖像拾取設(shè)備的制作方法
【專(zhuān)利摘要】本發(fā)明涉及對(duì)象檢測(cè)方法、對(duì)象檢測(cè)設(shè)備和圖像拾取設(shè)備。該對(duì)象檢測(cè)方法包括:通用模型存儲(chǔ)步驟,事先離線地存儲(chǔ)用于特定對(duì)象類(lèi)型的通用模型,所述通用模型描述預(yù)計(jì)在所述特定對(duì)象類(lèi)型的單個(gè)對(duì)象中共同存在的多個(gè)部件;樣本圖像接收步驟,接收對(duì)一個(gè)或多個(gè)樣本圖像的輸入,所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)均包含同一查詢(xún)對(duì)象,所述查詢(xún)對(duì)象是所述特定對(duì)象類(lèi)型的對(duì)象;對(duì)象檢測(cè)器創(chuàng)建步驟,利用所述通用模型和所述一個(gè)或多個(gè)樣本圖像,創(chuàng)建專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器;以及對(duì)象檢測(cè)步驟,利用所創(chuàng)建的專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器,從目的圖像中檢測(cè)所述查詢(xún)對(duì)象。根據(jù)本發(fā)明,可以高靈活度精確地檢測(cè)出特定對(duì)象類(lèi)型的各種對(duì)象。
【專(zhuān)利說(shuō)明】對(duì)象檢測(cè)方法、對(duì)象檢測(cè)設(shè)備以及圖像拾取設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種對(duì)象檢測(cè)方法、對(duì)象檢測(cè)設(shè)備以及包含所述對(duì)象檢測(cè)設(shè)備的圖像拾取設(shè)備。
【背景技術(shù)】
[0002]在對(duì)象識(shí)別、圖像檢索以及圖像注冊(cè)等的處理中,對(duì)圖像中的視覺(jué)對(duì)象進(jìn)行的分析是重要的。在很多應(yīng)用領(lǐng)域中都涉及這樣的處理,所述很多應(yīng)用領(lǐng)域諸如是(安保用途的)監(jiān)視、視頻取證以及用于計(jì)算機(jī)輔助診斷的醫(yī)療圖像分析等。特別地,由于對(duì)于發(fā)展與真實(shí)世界相關(guān)的系統(tǒng)的需求的增長(zhǎng),對(duì)象識(shí)別已吸引了越來(lái)越多的關(guān)注。
[0003]在常規(guī)對(duì)象識(shí)別方法中,使用基于學(xué)習(xí)/訓(xùn)練的分類(lèi)器,對(duì)于所述基于學(xué)習(xí)/訓(xùn)練的分類(lèi)器,分類(lèi)器參數(shù)的學(xué)習(xí)/訓(xùn)練過(guò)程是不可缺少的。然而,使用一個(gè)對(duì)象(例如,狗)的具體樣本而通過(guò)學(xué)習(xí)/訓(xùn)練過(guò)程獲得的分類(lèi)器可能不能對(duì)于另一對(duì)象(例如,貓)獲得好的性能。為了使分類(lèi)器對(duì)于其它對(duì)象獲得好的性能,不得不使用所述另一對(duì)象的具體樣本來(lái)重新執(zhí)行另一學(xué)習(xí)/訓(xùn)練過(guò)程,以便將分類(lèi)器從用于所述一個(gè)對(duì)象的分類(lèi)器修改為用于所述另一對(duì)象的分類(lèi)器。這并不靈活而且花費(fèi)很長(zhǎng)時(shí)間。
[0004]用于解決以上問(wèn)題的一種方法是訓(xùn)練用于特定對(duì)象類(lèi)型(例如,包括狗和貓的寵物)的通用分類(lèi)器,但是這種通用分類(lèi)器將使精度下降,并且檢測(cè)出用戶并不關(guān)心的對(duì)象。例如,即使用戶僅希望在圖像中檢測(cè)出狗,也會(huì)從該圖像中檢測(cè)出貓。
[0005]在美國(guó)專(zhuān)利申請(qǐng)公布N0.US2010014721A1以及美國(guó)專(zhuān)利公告N0.US7558408B1、N0.US7555148B1和N0.US7551755B1中討論了用于解決以上問(wèn)題的另一方法。這些專(zhuān)利文獻(xiàn)中公開(kāi)的方法首先使用某一對(duì)象類(lèi)型的通用分類(lèi)器(例如,用于寵物的分類(lèi)器)來(lái)定位圖像中的候選對(duì)象的位置,然后使用具體分類(lèi)器(例如,用于貓的分類(lèi)器)來(lái)判斷該候選對(duì)象是否恰好是感興趣的對(duì)象。該方法已被用于照相機(jī)中。根據(jù)這種方法,可以由用戶事先注冊(cè)若干個(gè)具體分類(lèi)器(例如,用于貓的分類(lèi)器、用于一種狗的分類(lèi)器和用于另一種狗的分類(lèi)器),并且,用戶可以在拍攝圖片之前選擇用于要聚焦的對(duì)象的具體分類(lèi)器之一。該照相機(jī)可被配置為自動(dòng)聚焦于從取景器中顯示的圖像檢測(cè)到的對(duì)象。
[0006]然而,本發(fā)明的發(fā)明人發(fā)現(xiàn),上述專(zhuān)利文獻(xiàn)中公開(kāi)的方法也并不足夠好,這是因?yàn)槟軌虮粰z測(cè)的具體對(duì)象還是有限的,而且僅僅由用戶事先注冊(cè)的具體對(duì)象才能被檢測(cè)到。
【發(fā)明內(nèi)容】
[0007]在對(duì)象檢測(cè)技術(shù)中通常涉及兩個(gè)步驟,即訓(xùn)練的步驟和檢測(cè)的步驟。在訓(xùn)練的步驟中,通過(guò)使用對(duì)象的一個(gè)或更多個(gè)樣本進(jìn)行訓(xùn)練來(lái)獲得分類(lèi)器。然后,在檢測(cè)的步驟中,這樣獲得的分類(lèi)器被用于檢測(cè)對(duì)象。為了獲得穩(wěn)定且精確的分類(lèi)器,對(duì)于訓(xùn)練一般需要相當(dāng)大量的樣本,而相當(dāng)大量的樣本將導(dǎo)致增大的計(jì)算量,這使得訓(xùn)練是耗費(fèi)時(shí)間的。在需要實(shí)時(shí)訓(xùn)練分類(lèi)器的情況下,或者在計(jì)算能力有限的情況下(例如在應(yīng)用嵌入式系統(tǒng)的情況下),常規(guī)技術(shù)無(wú)法滿足要求。另一方面,如果試圖通過(guò)簡(jiǎn)單減少樣本數(shù)量來(lái)縮短用于訓(xùn)練分類(lèi)器的時(shí)間,則通過(guò)這樣的訓(xùn)練獲得的分類(lèi)器將不會(huì)足夠穩(wěn)定,并且對(duì)于諸如對(duì)象的姿態(tài)、照明條件或視角等因素將會(huì)非常敏感。
[0008]因此,本發(fā)明所要解決的技術(shù)問(wèn)題之一是提供用于對(duì)象檢測(cè)的新技術(shù),該用于對(duì)象檢測(cè)的新技術(shù)對(duì)于各種對(duì)象都具有靈活性和精確性。此外,還期望該新技術(shù)具有可接受的效率。
[0009]為了解決至少一個(gè)技術(shù)問(wèn)題,本發(fā)明提供一種對(duì)象檢測(cè)方法,包括:通用模型存儲(chǔ)步驟,事先離線地存儲(chǔ)用于特定對(duì)象類(lèi)型的通用模型,所述通用模型描述預(yù)計(jì)在所述特定對(duì)象類(lèi)型的單個(gè)對(duì)象中共同存在的多個(gè)部件;樣本圖像接收步驟,接收對(duì)一個(gè)或多個(gè)樣本圖像的輸入,所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)均包含同一查詢(xún)對(duì)象,所述查詢(xún)對(duì)象是所述特定對(duì)象類(lèi)型的對(duì)象;對(duì)象檢測(cè)器創(chuàng)建步驟,利用所述通用模型和所述一個(gè)或多個(gè)樣本圖像,創(chuàng)建專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器;以及對(duì)象檢測(cè)步驟,利用所創(chuàng)建的專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器,從目的圖像中檢測(cè)所述查詢(xún)對(duì)象。
[0010]此外,為了解決上述技術(shù)問(wèn)題,本發(fā)明提供一種對(duì)象檢測(cè)設(shè)備,包括:通用模型存儲(chǔ)單元,被配置為事先離線地存儲(chǔ)用于特定對(duì)象類(lèi)型的通用模型,所述通用模型描述預(yù)計(jì)在所述特定對(duì)象類(lèi)型的單個(gè)對(duì)象中共同存在的多個(gè)部件;樣本圖像接收單元,被配置為接收對(duì)一個(gè)或多個(gè)樣本圖像的輸入,所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)均包含同一查詢(xún)對(duì)象,所述查詢(xún)對(duì)象是所述特定對(duì)象類(lèi)型的對(duì)象;對(duì)象檢測(cè)器創(chuàng)建單元,被配置為利用所述通用模型和所述一個(gè)或多個(gè)樣本圖像,創(chuàng)建專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器;以及對(duì)象檢測(cè)單元,被配置為利用所創(chuàng)建的專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器,從目的圖像中檢測(cè)所述查詢(xún)對(duì)象。
[0011]此外,本發(fā)明提供一種圖像拾取設(shè)備,包括:攝影光學(xué)系統(tǒng);成像單元,被配置為執(zhí)行成像以形成圖像;如上所述的對(duì)象檢測(cè)設(shè)備,被配置為使用戶能夠輸入或選擇查詢(xún)對(duì)象,以及在所形成的圖像中檢測(cè)所述查詢(xún)對(duì)象;和成像控制單元,被配置為根據(jù)檢測(cè)到的查詢(xún)對(duì)象執(zhí)行成像控制。
[0012]得益于根據(jù)本發(fā)明的方法和設(shè)備,由于查詢(xún)對(duì)象可被用于創(chuàng)建檢測(cè)器,因此該特定對(duì)象類(lèi)型的各種對(duì)象都能夠以高靈活性被精確檢測(cè)。此外,由于從事先離線存儲(chǔ)的通用模型創(chuàng)建檢測(cè)器,因此檢測(cè)的效率也可以是高的。
[0013]更具體地,本說(shuō)明書(shū)中的公開(kāi)內(nèi)容提供一種組合用于檢測(cè)具體對(duì)象的離線訓(xùn)練和在線查詢(xún)的機(jī)制。耗費(fèi)時(shí)間的用于訓(xùn)練分類(lèi)器的步驟被事先離線地僅執(zhí)行一次,而在在線查詢(xún)步驟期間將分類(lèi)器專(zhuān)門(mén)化。以這種方式,施加給在線計(jì)算模塊的計(jì)算量減小,而即使對(duì)于嵌入式系統(tǒng)也能實(shí)時(shí)執(zhí)行操作。根據(jù)本發(fā)明的一些實(shí)施例,用戶能夠輸入(查詢(xún))要被檢測(cè)的對(duì)象,然后使系統(tǒng)在圖像中檢測(cè)查詢(xún)的對(duì)象。此外,根據(jù)本發(fā)明的一些實(shí)施例,由于通過(guò)在離線階段期間使用大量樣本進(jìn)行訓(xùn)練來(lái)獲得分類(lèi)器,因此對(duì)象檢測(cè)具有高的精確度和強(qiáng)健性,并且還具有對(duì)對(duì)象差異的合理的容忍度。從參照附圖的以下描述,本發(fā)明的其他特性特征和優(yōu)點(diǎn)將變得清晰。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0014]并入說(shuō)明書(shū)并且構(gòu)成說(shuō)明書(shū)的一部分的附圖圖示了本發(fā)明的實(shí)施例,并且與描述一起用于說(shuō)明本發(fā)明的原理。[0015]圖1是示出能夠?qū)嵤┍景l(fā)明的實(shí)施例的計(jì)算機(jī)系統(tǒng)的示例性硬件配置的框圖。
[0016]圖2是示出根據(jù)本發(fā)明的實(shí)施例的對(duì)象檢測(cè)方法的流程圖。
[0017]圖3a和3b示出通用模型的一些例子。
[0018]圖4a和4b示出使得用戶能夠在樣本圖像中標(biāo)記部件的用戶界面的例子。
[0019]圖5示出根據(jù)本發(fā)明的示例性實(shí)施例的對(duì)象檢測(cè)器創(chuàng)建步驟的示例性處理。
[0020]圖6是示出根據(jù)示例性實(shí)施例的包括多個(gè)部件之間的位置關(guān)系的通用模型的示意圖。
[0021]圖7示出根據(jù)一個(gè)示例性實(shí)施例的使用通用模型來(lái)生成部件分類(lèi)器的方法的例子。
[0022]圖8示出根據(jù)示例性實(shí)施例的部件分類(lèi)器生成步驟的示例性處理的流程圖。
[0023]圖9示出根據(jù)另一示例性實(shí)施例的使用通用模型來(lái)生成部件分類(lèi)器的方法的例子。
[0024]圖10示出根據(jù)再另一個(gè)示例性實(shí)施例的使用通用模型來(lái)生成部件分類(lèi)器的方法的例子。
[0025]圖11示出根據(jù)該再另一個(gè)示例性實(shí)施例的部件分類(lèi)器生成步驟的示例性處理的流程圖。
[0026]圖12示出根據(jù)示例性實(shí)施例的對(duì)象檢測(cè)步驟的示例性處理的流程圖。
[0027]圖13示出根據(jù)示例性實(shí)施例的第一檢測(cè)子步驟和第二檢測(cè)子步驟的示例性處理的流程圖。
[0028]圖14是示出根據(jù)示例性實(shí)施例的對(duì)象檢測(cè)設(shè)備的示例性配置的框圖。
[0029]圖15是示出根據(jù)示例性實(shí)施例的圖像拾取設(shè)備的示例性配置的框圖。
【具體實(shí)施方式】
[0030]以下,將參照附圖詳細(xì)描述本發(fā)明的實(shí)施例。
[0031]請(qǐng)注意,類(lèi)似的參考數(shù)字和字母指的是圖中的類(lèi)似的項(xiàng)目,因而一旦在一幅圖中定義了 一個(gè)項(xiàng)目,就不需要在之后的圖中討論了。
[0032]圖1是示出能夠?qū)嵤┍景l(fā)明的實(shí)施例的計(jì)算機(jī)系統(tǒng)1000的硬件配置的框圖。
[0033]如圖1中所示,計(jì)算機(jī)系統(tǒng)包括計(jì)算機(jī)1110。計(jì)算機(jī)1110包括經(jīng)由系統(tǒng)總線1121連接的處理單元1120、系統(tǒng)存儲(chǔ)器1130、固定非易失性存儲(chǔ)器接口 1140、可移動(dòng)非易失性存儲(chǔ)器接口 1150、用戶輸入接口 1160、網(wǎng)絡(luò)接口 1170、視頻接口 1190和輸出外圍接口1195。
[0034]系統(tǒng)存儲(chǔ)器1130包括ROM (只讀存儲(chǔ)器)1131和RAM (隨機(jī)存取存儲(chǔ)器)1132。BIOS (基本輸入輸出系統(tǒng))1133駐留在ROM 1131中。操作系統(tǒng)1134、應(yīng)用程序1135、其它程序模塊1136和某些程序數(shù)據(jù)1137駐留在RAM 1132中。
[0035]諸如硬盤(pán)之類(lèi)的固定非易失性存儲(chǔ)器1141連接到固定非易失性存儲(chǔ)器接口1140。固定非易失性存儲(chǔ)器1141例如可以存儲(chǔ)操作系統(tǒng)1144、應(yīng)用程序1145、其它程序模塊1146和某些程序數(shù)據(jù)1147。
[0036]諸如軟盤(pán)驅(qū)動(dòng)器1151和⑶-ROM驅(qū)動(dòng)器1155之類(lèi)的可移動(dòng)非易失性存儲(chǔ)器連接到可移動(dòng)非易失性存儲(chǔ)器接口 1150。例如,軟盤(pán)1152可以被插入到軟盤(pán)驅(qū)動(dòng)器1151中,以及⑶(光盤(pán))1156可以被插入到⑶-ROM驅(qū)動(dòng)器1155中。
[0037]諸如鼠標(biāo)1161和鍵盤(pán)1162之類(lèi)的輸入設(shè)備被連接到用戶輸入接口 1160。
[0038]計(jì)算機(jī)1110可以通過(guò)網(wǎng)絡(luò)接口 1170連接到遠(yuǎn)程計(jì)算機(jī)1180。例如,網(wǎng)絡(luò)接口1170可以經(jīng)由局域網(wǎng)1171連接到遠(yuǎn)程計(jì)算機(jī)1180?;蛘?,網(wǎng)絡(luò)接口 1170可以連接到調(diào)制解調(diào)器(調(diào)制器一解調(diào)器)1172,以及調(diào)制解調(diào)器1172經(jīng)由廣域網(wǎng)1173連接到遠(yuǎn)程計(jì)算機(jī)1180。
[0039]遠(yuǎn)程計(jì)算機(jī)1180可以包括諸如硬盤(pán)之類(lèi)的存儲(chǔ)器1181,其存儲(chǔ)遠(yuǎn)程應(yīng)用程序1185。
[0040]視頻接口 1190連接到監(jiān)視器1191。
[0041]輸出外圍接口 1195連接到打印機(jī)1196和揚(yáng)聲器1197。
[0042]圖1所示的計(jì)算機(jī)系統(tǒng)僅僅是說(shuō)明性的并且決不意圖對(duì)本發(fā)明、其應(yīng)用或用途進(jìn)行任何限制。
[0043]圖1所示的計(jì)算機(jī)系統(tǒng)可以被實(shí)施于任何實(shí)施例,可作為獨(dú)立計(jì)算機(jī),或者也可作為設(shè)備中的處理系統(tǒng),可以移除一個(gè)或更多個(gè)不必要的組件,也可以向其添加一個(gè)或更多個(gè)附加的組件。例如,該計(jì)算機(jī)系統(tǒng)可被適配為適于被裝入照相機(jī)的計(jì)算機(jī)系統(tǒng)。
[0044]圖2是示出根據(jù)實(shí)施例的對(duì)象檢測(cè)方法的流程圖。在圖2所示的對(duì)象檢測(cè)方法中,要從目的圖像中檢測(cè)出特定對(duì)象類(lèi)型的查詢(xún)對(duì)象。
[0045]在步驟S2100中,事先離線地存儲(chǔ)用于特定對(duì)象類(lèi)型的通用模型。所述通用模型能夠描述特定對(duì)象類(lèi)型的對(duì)象的通用特征。更特別地,所述通用模型能夠描述預(yù)計(jì)在所述特定對(duì)象類(lèi)型的單個(gè)對(duì)象中共同存在的多個(gè)部件。
[0046]圖3a和3b示出通用模型的一些例子。根據(jù)圖3a的例子,所述特定對(duì)象類(lèi)型是“哺乳動(dòng)物的臉”,而預(yù)計(jì)在所述特定對(duì)象類(lèi)型的單個(gè)對(duì)象中共同存在的多個(gè)部件例如是“耳朵”、“眼睛”、“鼻子”、“嘴”和“毛發(fā)”。根據(jù)圖3b的例子,所述特定對(duì)象類(lèi)型是“交通工具的正面視圖”,而預(yù)計(jì)在所述特定對(duì)象類(lèi)型的單個(gè)對(duì)象中共同存在的多個(gè)部件例如是“擋風(fēng)玻璃”、“后視鏡”、“頭燈”和“車(chē)牌”。
[0047]圖3a和圖3b中示出的通用模型的例子僅僅是示例性的和說(shuō)明性的??梢愿鶕?jù)具體應(yīng)用來(lái)設(shè)計(jì)各種通用模型。例如,可以將特定對(duì)象類(lèi)型定義為“人體”,由通用模型描述的多個(gè)部件可以包括“胳膊”、“腿”、“頭”和“軀干”。
[0048]根據(jù)實(shí)施例,通用模型被事先離線地存儲(chǔ),并且該通用模型可被用于要被在線輸入的任何查詢(xún)對(duì)象,只要該查詢(xún)對(duì)象屬于該特定對(duì)象類(lèi)型即可。在這里,查詢(xún)對(duì)象意味著要從目的圖像中檢測(cè)的對(duì)象。在特定對(duì)象類(lèi)型是“哺乳動(dòng)物的臉”的情況下(圖3a中所示的例子),查詢(xún)對(duì)象例如可以是具體的貓的臉、具體的狗的臉、或者具體的人的臉等等。
[0049]在步驟S2200中,接收一個(gè)或多個(gè)樣本圖像的輸入。所述一個(gè)或多個(gè)樣本圖像各包括作為所述特定對(duì)象類(lèi)型的對(duì)象的同一查詢(xún)對(duì)象。所述樣本圖像可以是具有歸一化尺寸的圖像。
[0050]也就是說(shuō),可以?xún)H有一個(gè)樣本圖像,或者可以有多個(gè)(即兩個(gè)或更多個(gè))樣本圖像。當(dāng)有多個(gè)樣本圖像時(shí),樣本圖像可以是不同的圖像,但是包括屬于所述特定對(duì)象類(lèi)型的同一查詢(xún)對(duì)象。對(duì)于圖3a所示的例子,查詢(xún)對(duì)象例如可以是特定貓的臉,而所述一個(gè)或多個(gè)樣本圖像可以是包含該特定貓的臉的一個(gè)或多個(gè)圖像。[0051]在步驟S2300中,利用所述通用模型和所述一個(gè)或多個(gè)樣本圖像,創(chuàng)建專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器。
[0052]在此步驟中,使用在樣本圖像中呈現(xiàn)的查詢(xún)對(duì)象,從通用模型來(lái)創(chuàng)建檢測(cè)器。該檢測(cè)器是專(zhuān)用于檢測(cè)該查詢(xún)對(duì)象的檢測(cè)器。對(duì)于圖3a所示的例子,使用哺乳動(dòng)物的臉的通用模型和包括特定貓的臉的一個(gè)或多個(gè)樣本圖像來(lái)創(chuàng)建該檢測(cè)器,以便專(zhuān)門(mén)檢測(cè)該特定貓的臉。
[0053]步驟S2300可以在輸入查詢(xún)對(duì)象之后在線地被執(zhí)行。
[0054]在步驟S2400中,使用所創(chuàng)建的專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器來(lái)從目的圖像檢測(cè)所述查詢(xún)對(duì)象。所述目的圖像可以是來(lái)自數(shù)據(jù)庫(kù)諸如圖像庫(kù)的圖像,或者可以是由照相機(jī)實(shí)時(shí)拍攝的圖像,或者可以是來(lái)自視頻的一幀。所述目的地圖像可以是具有歸一化尺寸的圖像。
[0055]根據(jù)本實(shí)施例的方法,由于通過(guò)使用查詢(xún)對(duì)象從通用模型在線創(chuàng)建具體檢測(cè)器,本方法對(duì)于各種對(duì)象都具有靈活性,并且不限于事先注冊(cè)的對(duì)象。此外,由于通用模型是離線地被生成和存儲(chǔ)的,因此檢測(cè)的效率是能夠令人接受的。
[0056]根據(jù)本發(fā)明的一個(gè)實(shí)施例,在樣本圖像接收步驟S2200中,可以接收或者生成對(duì)所述一個(gè)或多個(gè)樣本圖像中的各個(gè)部件的標(biāo)記。
[0057]對(duì)各個(gè)部件的標(biāo)記可以是由用戶執(zhí)行的。在這種情況下,可以提供用戶界面以有助于所述標(biāo)記。
[0058]圖4a和4b示出使用戶能夠標(biāo)記樣本圖像中的部件的用戶界面的例子。
[0059]在圖4a示出的例子中,在屏幕上示出代表各個(gè)部件的按鈕。在選擇一個(gè)按鈕之后,用戶可以指出或者圈出樣本圖像中的相應(yīng)部件。例如,用戶可選擇部件“眼睛”(圖4a中的部件按鈕上的陰影意味著該部件被選中),然后在樣本圖像中圈出眼睛區(qū)域(在圖4a中用虛線示出由用戶標(biāo)記的圓圈)。
[0060]在圖4b所示的例子中,代表各個(gè)部件的圓圈示出在屏幕上,用戶可以拖動(dòng)圓圈和調(diào)整圓圈尺寸以使得它們包圍樣本圖像中的相應(yīng)部件。如圖4b所示,一只耳朵和一只眼睛已被用戶標(biāo)記出。
[0061]雖然圖4a和4b示出在樣本圖像中標(biāo)記各個(gè)部件的一些例子,但本發(fā)明不限于此。也可以自動(dòng)生成標(biāo)記而無(wú)用戶介入。例如,可以使用通用模型中的分類(lèi)器在樣本圖像中標(biāo)記各個(gè)部件。也可以使用用于該特定對(duì)象類(lèi)型的其它檢測(cè)器在樣本圖像中標(biāo)記各個(gè)部件。此外,還可以首先自動(dòng)執(zhí)行標(biāo)記,然后用戶手動(dòng)進(jìn)行調(diào)整。
[0062]此外,雖然沒(méi)有在圖4a和4b中示出,還可以從樣本圖像中標(biāo)記出整個(gè)查詢(xún)對(duì)象(本例子中為貓的臉)。
[0063]可以接收并且存儲(chǔ)標(biāo)記出的各個(gè)部件的位置和尺寸以供之后使用。也可存儲(chǔ)標(biāo)記出的查詢(xún)對(duì)象的位置和尺寸以供之后使用。
[0064]此外,可以對(duì)于相應(yīng)部件存儲(chǔ)標(biāo)記出的圖像區(qū)域以供之后使用。
[0065]圖5示出根據(jù)本發(fā)明的示例性實(shí)施例的對(duì)象檢測(cè)器創(chuàng)建步驟S2300的示例性處理。
[0066]如圖5所示,步驟S2300可以包括部件分類(lèi)器生成步驟S2310和部件分類(lèi)器組合步驟S2320。[0067]在步驟S2310中,使用通用模型中的各個(gè)部件與所述一個(gè)或多個(gè)樣本圖像中標(biāo)記出的各個(gè)部件之間的匹配,生成專(zhuān)用于所述查詢(xún)對(duì)象的各個(gè)部件的多個(gè)部件分類(lèi)器。
[0068]再以圖3a所示的例子為例,可以在圖3a所示的部件(哺乳動(dòng)物的眼睛和耳朵等)與圖4a和4b所示的部件(特定的貓的眼睛和耳朵等)之間執(zhí)行匹配,并且根據(jù)匹配的結(jié)果生成專(zhuān)用于該特定的貓的部件的多個(gè)部件分類(lèi)器。例如,將生成專(zhuān)用于該特定的貓的眼睛的眼睛分類(lèi)器,且將生成專(zhuān)用于該特定的貓的耳朵的耳朵分類(lèi)器,等等。
[0069]在步驟S2320中,在步驟S2310中對(duì)應(yīng)于各個(gè)部件生成的部件分類(lèi)器被組合以創(chuàng)建專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器。
[0070]在此可以采用組合部件分類(lèi)器的各種方式。
[0071]例如,該組合可以被設(shè)計(jì)為使得:在多于預(yù)定數(shù)量或多于預(yù)定比例(例如,約60%)的部件被所述多個(gè)部件分類(lèi)器檢測(cè)到的情況下(這意味著候選圖像區(qū)域應(yīng)該包括足夠的部件),所創(chuàng)建的專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器判斷為檢測(cè)到查詢(xún)對(duì)象。例如,在通用模型中總共有7個(gè)部件(即兩個(gè)眼睛、兩個(gè)耳朵、一個(gè)嘴、一個(gè)毛發(fā)和一個(gè)鼻子)的情況下,該組合可被設(shè)計(jì)為,在通過(guò)相應(yīng)部件分類(lèi)器在候選圖像區(qū)域中檢測(cè)到4個(gè)或更多個(gè)部件時(shí),使得在候選圖像區(qū)域中檢測(cè)出查詢(xún)對(duì)象。
[0072]通用模型也可以進(jìn)一步包括多個(gè)部件之間的位置關(guān)系。
[0073]圖6是示出根據(jù)示例性實(shí)施例的包括多個(gè)部件之間的位置關(guān)系的通用模型的示意圖。
[0074]使用哺乳動(dòng)物的臉作為例子,部件之間的位置關(guān)系例如可以是:眼睛在毛發(fā)下方,鼻子在眼睛下方,嘴在鼻子下方,等等。
[0075]在這種情況下,所述組合可以被設(shè)計(jì)為使得:在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類(lèi)器檢測(cè)到(這意味著候選圖像區(qū)域應(yīng)該包括足夠的部件)并且進(jìn)一步地,檢測(cè)到的部件之間滿足所述位置關(guān)系(這意味著檢測(cè)到的部件應(yīng)滿足預(yù)定關(guān)系)的情況下,專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器判斷為檢測(cè)到所述查詢(xún)對(duì)象。根據(jù)這種組合,即使在候選圖像區(qū)域中分別檢測(cè)到所有部件,如果該關(guān)系是錯(cuò)誤的(例如,如果一只眼睛在嘴下面或者一只耳朵在眼睛之間),則該檢測(cè)器也將不認(rèn)為在候選圖像區(qū)域中檢測(cè)到查詢(xún)對(duì)象。
[0076]對(duì)于用于定義部件之間的位置關(guān)系的方法和用于判斷兩個(gè)位置關(guān)系是否彼此匹配的方法,例如可以使用部分模型方法(例如見(jiàn)PedroFelzenszwalb等人的“ADiscriminatively Trained, Multiscale, Deformable Part Model,,,IEEE Conference onComputer Vision andPattern Recognition,2008.CVPR 2008, 2008年6 月 23-28 日,第 1-8頁(yè))以及圖形相似度度量方法(例如見(jiàn)Laura Zager的“graphsimilarity and matching”,Thesis for Master of Science, MassachusettsInstitute of Technology,2005 年X
[0077]也可以采用用于定義所述組合的其它方法。例如,可以計(jì)算從各個(gè)部件分類(lèi)器獲得的分類(lèi)分?jǐn)?shù)(例如概率分?jǐn)?shù)或置信度分?jǐn)?shù))的和或平均值,并且在所述和或平均值大于預(yù)定閾值的情況下,檢測(cè)器確定為檢測(cè)到查詢(xún)對(duì)象。也就是說(shuō),在此可設(shè)計(jì)和使用任何組合。
[0078]以下將描述通用模型和部件分類(lèi)器生成步驟S2310的一些示例性實(shí)施例。
[0079]圖7示出根據(jù)一個(gè)示例性實(shí)施例的使用通用模型來(lái)生成部件分類(lèi)器的方法的例子。
[0080]根據(jù)本示例性實(shí)施例的通用模型包括多個(gè)分類(lèi)器組,所述多個(gè)分類(lèi)器組中的每個(gè)分類(lèi)器組都對(duì)應(yīng)于所述多個(gè)部件之一。所述多個(gè)分類(lèi)器組中的每個(gè)分類(lèi)器組都包括用于描述所述特定對(duì)象類(lèi)型的相應(yīng)部件的多種不同特征實(shí)例的多個(gè)候選分類(lèi)器。例如,通用模型包括用于眼睛的分類(lèi)器組I和用于耳朵的分類(lèi)器組2,如圖7所示。雖然未示出,但是通用模型還可包括用于鼻子的分類(lèi)器組3、用于毛發(fā)的分類(lèi)器組4和用于嘴的分類(lèi)器組5。在此,不同的特征實(shí)例是指具有不同特征值的特征,其代表不同的外觀。不同的特征實(shí)例例如可以包括不同顏色、不同形狀或者不同紋理等。
[0081]以分類(lèi)器組I為例,分類(lèi)器組I可包括多個(gè)候選分類(lèi)器,即對(duì)應(yīng)于特定的人的眼睛的候選分類(lèi)器11、對(duì)應(yīng)于特定的貓的眼睛的候選分類(lèi)器12、以及對(duì)應(yīng)于特定的狗的眼睛的候選分類(lèi)器13。類(lèi)似地,分類(lèi)器組2可包括多個(gè)候選分類(lèi)器,即對(duì)應(yīng)于特定的貓的耳朵的候選分類(lèi)器21、對(duì)應(yīng)于特定的狗的耳朵的候選分類(lèi)器22、以及對(duì)應(yīng)于另一特定的狗的耳朵的候選分類(lèi)器23。
[0082]每個(gè)候選分類(lèi)器都是通過(guò)利用相應(yīng)的訓(xùn)練樣本事先離線地被訓(xùn)練而被生成的。例如,一個(gè)眼睛的候選分類(lèi)器是通過(guò)利用該類(lèi)型的眼睛的訓(xùn)練樣本事先離線地被訓(xùn)練而被生成的。多種特征和訓(xùn)練/學(xué)習(xí)方法都可用于生成候選分類(lèi)器。例如,可以使用公知的HOG特征(有向梯度的直方圖)和SVM (支持向量機(jī))方法。分類(lèi)器的一個(gè)簡(jiǎn)單例子可以定義一個(gè)特征空間,該特征空間包括一個(gè)或多個(gè)特征(特征陣列)作為特征點(diǎn)在特征空間中的坐標(biāo),并且,分類(lèi)器對(duì)于輸入圖像輸出的分類(lèi)分?jǐn)?shù)被計(jì)算為特征空間中的中心點(diǎn)(例如,通過(guò)多個(gè)訓(xùn)練圖像產(chǎn)生的特征陣列的統(tǒng)計(jì)模型的均值)與描述該輸入圖像的特征點(diǎn)之間的距離d的函數(shù)f(d)。該函數(shù)f(d)不限于特定的函數(shù),只要它是隨著該距離d的增大而嚴(yán)格單調(diào)減小的函數(shù)即可。計(jì)算該距離之前,也可先將各特征除以相應(yīng)特征的方差而將各特征歸一化或者按照特定應(yīng)用對(duì)各特征進(jìn)行加權(quán)。
[0083]對(duì)于用于生成用于諸如眼睛、鼻子和耳朵之類(lèi)的器官的候選分類(lèi)器的方法,例如可以使用在 Nicolas Courier Daniela Hall James L.Crowley 的 “Facial FeaturesDetection Robust to Pose, Illuminationand Identity,,,IEEE InternationalConference on Systems, Man andCybernetics,2004 年,第 617-622 頁(yè),vol.1 ;NelloCristianini 和 JohnShawe-Taylor 的“An Introduction to Support Vector Machinesandother kernel-based learning methods,,,Cambridge University Press, 2000.1SBN0-521-78019-5 ([2] SVM Book);以及 Corinna Cortes 和 V.Vapnik 的 “Support-VectorNetworks”,Machine Learning, 20,第 273-297 頁(yè),1995 中提出的方法。
[0084]雖然以上作為例子提及了一些分類(lèi)器,但是可以使用所有類(lèi)型的分類(lèi)器,只要該分類(lèi)器能夠?qū)D像作為輸入,并且輸出指示圖像包含該部件的概率或置信度的分類(lèi)分?jǐn)?shù)即可??梢栽O(shè)置閾值,使得如果分類(lèi)器輸出的分類(lèi)分?jǐn)?shù)高于該閾值,則分類(lèi)器就確定為圖像包含該部件。
[0085]在這個(gè)示例性實(shí)施例中,在部件分類(lèi)器生成步驟S2310中,對(duì)于每個(gè)部件,從相應(yīng)分類(lèi)器組中選擇對(duì)于描述所述查詢(xún)對(duì)象的該部件最優(yōu)的候選分類(lèi)器,作為用于該部件的部件分類(lèi)器。
[0086]例如,當(dāng)樣本圖像是圖4a或4b所示的樣本圖像時(shí),對(duì)于描述所述查詢(xún)對(duì)象(樣本圖像中所示的貓)的眼睛最優(yōu)的候選分類(lèi)器可以是候選分類(lèi)器12 (圓的貓眼睛),并且將從分類(lèi)器組I中選擇候選分類(lèi)器12作為用于眼睛的部件分類(lèi)器。類(lèi)似地,將從分類(lèi)器組2中選擇候選分類(lèi)器21作為用于耳朵的部件分類(lèi)器。以這種方式,對(duì)于每個(gè)分類(lèi)器組,選擇對(duì)于描述所述查詢(xún)對(duì)象(在本例子中為特定的貓)的各個(gè)部件最優(yōu)的候選分類(lèi)器,并且將這些最優(yōu)候選分類(lèi)器作為用于查詢(xún)對(duì)象的部件分類(lèi)器。
[0087]圖8示出根據(jù)示例性實(shí)施例的部件分類(lèi)器生成步驟S2310的示例性處理的流程圖。
[0088]如圖8所示,部件分類(lèi)器生成步驟S2310可以包括分類(lèi)器分?jǐn)?shù)獲得步驟S2311和選擇步驟S2312。
[0089]在步驟S2311中,對(duì)于每個(gè)分類(lèi)器組中的每個(gè)候選分類(lèi)器,通過(guò)使在各個(gè)樣本圖像中標(biāo)記的相應(yīng)部件通過(guò)該候選分類(lèi)器而獲得的分類(lèi)分?jǐn)?shù)被相加或取平均值,以獲得該候選分類(lèi)器的分類(lèi)器分?jǐn)?shù)。
[0090]對(duì)于圖7所示的例子,假設(shè)有兩個(gè)樣本圖像(第一樣本圖像和第二樣本圖像),并且,候選分類(lèi)器11從第一和第二樣本圖像獲得的分類(lèi)分?jǐn)?shù)分別為0.3和0.2,候選分類(lèi)器12從第一和第二樣本圖像獲得的分類(lèi)分?jǐn)?shù)分別為0.8和0.7,候選分類(lèi)器13從第一和第二樣本圖像獲得的分類(lèi)分?jǐn)?shù)分別為0.4和0.5。在這種情況下,當(dāng)候選分類(lèi)器的分類(lèi)器分?jǐn)?shù)由分類(lèi)分?jǐn)?shù)的平均值表示時(shí),候選分類(lèi)器11的分類(lèi)器分?jǐn)?shù)為(0.3+0.2)/2=0.25,候選分類(lèi)器12的分類(lèi)器分?jǐn)?shù)為(0.8+0.7) /2=0.75,而候選分類(lèi)器13的分類(lèi)器分?jǐn)?shù)為(0.4+0.5)/2=0.45。
[0091]在步驟S2312中,對(duì)于每個(gè)分類(lèi)器組,具有最大分類(lèi)器分?jǐn)?shù)的候選分類(lèi)器被認(rèn)為對(duì)于描述查詢(xún)對(duì)象的相應(yīng)部件是“最優(yōu)”的,并且被選擇作為用于相應(yīng)部件的部件分類(lèi)器。
[0092]仍對(duì)于圖7所示的例子,由于如以上計(jì)算的那樣,候選分類(lèi)器12具有最大分類(lèi)器分?jǐn)?shù),候選分類(lèi)器12將被選擇作為描述查詢(xún)對(duì)象的眼睛最優(yōu)的部件分類(lèi)器。
[0093]以類(lèi)似的方式,每個(gè)部件將具有通過(guò)利用樣本圖像從相應(yīng)分類(lèi)器組選擇出的一個(gè)部件分類(lèi)器,并且,這些部件分類(lèi)器可以被組合為專(zhuān)用于查詢(xún)對(duì)象的檢測(cè)器。如前文所述,該組合可按照需要或者以合適方式被設(shè)計(jì)。
[0094]根據(jù)本示例性實(shí)施例,由于事先離線準(zhǔn)備包含候選分類(lèi)器的通用模型,不必在每次要檢測(cè)新的查詢(xún)對(duì)象時(shí)構(gòu)建具體分類(lèi)器,因此,檢測(cè)效率可以是高的。此外,由于對(duì)于每個(gè)部件可以有若干個(gè)候選分類(lèi)器,因此該方法對(duì)于各種對(duì)象都具有足夠的靈活性和精確性。例如,在事先使用四個(gè)不同對(duì)象來(lái)訓(xùn)練各個(gè)候選分類(lèi)器時(shí),N個(gè)分類(lèi)器組中的每個(gè)分類(lèi)器組將具有四個(gè)候選分類(lèi)器,并且理論上可以通過(guò)組合這些候選分類(lèi)器而從通用模型生成4N種可能的檢測(cè)器。
[0095]圖9示出根據(jù)另一示例性實(shí)施例的使用通用模型來(lái)生成部件分類(lèi)器的方法的例子。
[0096]根據(jù)本示例性實(shí)施例的通用模型包括多個(gè)粗分類(lèi)器,所述多個(gè)粗分類(lèi)器分別對(duì)應(yīng)于多個(gè)部件。所述多個(gè)粗分類(lèi)器中的每一個(gè)可以描述特定對(duì)象類(lèi)型的相應(yīng)部件的相應(yīng)通用特征。所述通用特征可以包括顏色、形狀、紋理、直方圖特征、或其組合等。通用特征可以具有適用于描述該特定類(lèi)型的所有對(duì)象的相對(duì)寬的值范圍。例如,在用于哺乳動(dòng)物的眼睛的粗分類(lèi)器中,眼睛的長(zhǎng)寬比(長(zhǎng)度與寬度的比值)可以被定義為在0.8?2的范圍內(nèi)(或者是均值為1.4且方差為0.6的統(tǒng)計(jì)模型)。
[0097]在此示例性實(shí)施例中,可以使用粗分類(lèi)器在樣本圖像中自動(dòng)標(biāo)記出各個(gè)部件。[0098]根據(jù)此示例性實(shí)施例,在部件分類(lèi)器生成步驟S2310中,對(duì)于每個(gè)部件,由相應(yīng)的粗分類(lèi)器描述的相應(yīng)通用特征被進(jìn)一步限定(改進(jìn))為根據(jù)所述查詢(xún)對(duì)象的部件的相應(yīng)的具體特征,由此從相應(yīng)粗分類(lèi)器生成用于描述相應(yīng)的具體特征的相應(yīng)部件分類(lèi)器。
[0099]對(duì)于圖9所示的例子,哺乳動(dòng)物的眼睛的通用特征(例如,0.8^2的長(zhǎng)寬比)可被進(jìn)一步限定(改進(jìn))為依據(jù)圖4a和4b中所示的特定的貓的具體特征。例如,當(dāng)樣本圖像示出長(zhǎng)寬比為I的眼睛時(shí),眼睛的該具體特征(眼睛的長(zhǎng)寬比)例如可被改進(jìn)為0.Cl.2 (或者均值為I且方差為均值的20%的統(tǒng)計(jì)模型),這比0.8^2更為具體。對(duì)于另一個(gè)例子,當(dāng)兩個(gè)樣本圖像示出長(zhǎng)寬比為I的眼睛和長(zhǎng)寬比為1.2的眼睛時(shí),眼睛的該具體特征(眼睛的長(zhǎng)寬比)例如可被改進(jìn)為0.9^1.3 (或者均值為(1+1.2)/2且方差為(1.2-1)的統(tǒng)計(jì)模型),這比0.8^2更為具體。以這種方式,可以從粗分類(lèi)器生成具有這種具體特征的部件分類(lèi)器。
[0100]此外,或者作為替換方案,可以通過(guò)添加新的特征而將通用特征(特征陣列)改進(jìn)為具體特征陣列。例如,眼睛的通用特征可能僅包括長(zhǎng)寬比特征,并且可以通過(guò)添加顏色特征和紋理特征而將該通用特征改進(jìn)為更加具體的特征陣列。
[0101]以類(lèi)似的方式,每個(gè)部件將具有通過(guò)使用樣本圖像從通用模型的相應(yīng)粗分類(lèi)器生成的一個(gè)部件分類(lèi)器,并且這些部件分類(lèi)器可以被組合成專(zhuān)用于查詢(xún)對(duì)象的檢測(cè)器。該組合可如前所述根據(jù)需要被設(shè)計(jì)或者以合適的方式被設(shè)計(jì)。
[0102]圖10示出根據(jù)再另一個(gè)示例性實(shí)施例的使用通用模型來(lái)生成部件分類(lèi)器的方法的例子。 [0103]根據(jù)本實(shí)施例的通用模型包括分別對(duì)應(yīng)于多個(gè)部件的多個(gè)不完整分類(lèi)器。所述多個(gè)不完整分類(lèi)器中的每一個(gè)具有尚未確定的特征參數(shù)。
[0104]不完整分類(lèi)器可以具有通用的構(gòu)造,但是該通用構(gòu)造的一個(gè)或多個(gè)特征參數(shù)未被確定。例如,分類(lèi)器可以具有顏色和長(zhǎng)寬比作為其特征,但是顏色和長(zhǎng)寬比的中心值(統(tǒng)計(jì)模型的均值)和/或方差尚未被確定。
[0105]根據(jù)此示例性實(shí)施例,在部件分類(lèi)器生成步驟S2310中,對(duì)于每個(gè)部件,根據(jù)所述查詢(xún)對(duì)象的該部件來(lái)確定相應(yīng)的不完整分類(lèi)器的特征參數(shù),從而從相應(yīng)的不完整分類(lèi)器形成特征參數(shù)已被確定的相應(yīng)的部件分類(lèi)器。
[0106]圖11示出根據(jù)再另一個(gè)示例性實(shí)施例的部件分類(lèi)器生成步驟的示例性處理的流程圖。
[0107]如圖11所示,部件分類(lèi)器生成步驟S2310可以包括特征參數(shù)計(jì)算步驟S2313和組合計(jì)算步驟S2314。
[0108]在步驟S2313中,對(duì)于每個(gè)部件,通過(guò)根據(jù)所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)樣本圖像中所標(biāo)記的該部件來(lái)確定相應(yīng)的不完整分類(lèi)器的特征參數(shù),計(jì)算該樣本圖像的該部件的特征參數(shù)。
[0109]在步驟S2314中,對(duì)于每個(gè)部件,通過(guò)組合所述一個(gè)或多個(gè)樣本圖像的該部件的特征參數(shù),計(jì)算用于相應(yīng)的部件分類(lèi)器的特征參數(shù)。
[0110]在此,組合所述特征參數(shù)例如可以是求這些特征參數(shù)的平均值。也可以按照其它方式來(lái)組合這些特征參數(shù)。也可以從對(duì)多個(gè)特征參數(shù)的組合來(lái)獲得其它值。例如,可以組合來(lái)自一個(gè)樣本圖像的等于2的特征參數(shù)和來(lái)自另一個(gè)樣本圖像的等于4的特征參數(shù),使得獲得均值3和方差2,作為查詢(xún)對(duì)象的特征參數(shù)。因此,該組合不限于任何具體的組合。[0111]對(duì)于圖10所示的例子,用于眼睛的不完整分類(lèi)器可以包括涉及顏色特征和形狀特征的模型,但是尚未確定該模型的參數(shù)。例如,當(dāng)兩個(gè)樣本圖像示出長(zhǎng)寬比為I且RGB顏色為(50,150, 200)的眼睛,以及長(zhǎng)寬比為1.2且RGB顏色為(30,170, 220)的眼睛時(shí),查詢(xún)對(duì)象的眼睛模型的均值(特征空間的中心點(diǎn))可被確定為作為這兩個(gè)樣本圖像的參數(shù)的平均值的長(zhǎng)寬比1.1和RGB顏色(40,160,210)。以這種方式,可以從不完整分類(lèi)器生成參數(shù)已被確定的部件分類(lèi)器。
[0112]以類(lèi)似的方式,每個(gè)部件將具有通過(guò)使用樣本圖像從通用模型的相應(yīng)不完整分類(lèi)器生成的一個(gè)部件分類(lèi)器,并且這些部件分類(lèi)器可以被組合成專(zhuān)用于查詢(xún)對(duì)象的檢測(cè)器。該組合可如前所述根據(jù)需要被設(shè)計(jì)或者以合適的方式被設(shè)計(jì)。
[0113]圖12示出根據(jù)示例性實(shí)施例的對(duì)象檢測(cè)步驟S2400的示例性處理的流程圖。
[0114]如圖12所示,步驟S2400可以包括候選圖像區(qū)域確定步驟S2410、第一檢測(cè)子步驟S2420和第二檢測(cè)子步驟S2430。
[0115]在步驟S2410中,通過(guò)使用滑動(dòng)窗而在目的圖像中確定候選圖像區(qū)域?;瑒?dòng)窗的初始尺寸可以被確定為能夠包含查詢(xún)對(duì)象的可能圖像的最小尺寸,并且可以根據(jù)具體應(yīng)用而被確定。
[0116]在步驟S2420中,檢測(cè)是否在候選圖像區(qū)域中存在多個(gè)部件中的至少一些。例如,在步驟S2420中,可以使用步驟S2300中生成的專(zhuān)用于查詢(xún)對(duì)象的檢測(cè)器的部件分類(lèi)器來(lái)檢測(cè)候選圖像區(qū)域中的部件。
[0117]然后,在步驟S2430中,根據(jù)步驟S2420中的檢測(cè)結(jié)果,確定是否在候選圖像區(qū)域中檢測(cè)到查詢(xún)對(duì)象。
[0118]請(qǐng)注意,在步驟S2400中使用專(zhuān)用于查詢(xún)對(duì)象的檢測(cè)器來(lái)檢測(cè)查詢(xún)對(duì)象,因此步驟S2400中的具體檢測(cè)方式可以對(duì)應(yīng)于步驟S2300中生成檢測(cè)器的具體方式。因此,雖然步驟S241(TS2430示出用于步驟S2400的示例性處理,但是可以采用其它檢測(cè)方式,只要使用在步驟S2300中生成的專(zhuān)用于查詢(xún)對(duì)象的檢測(cè)器即可。
[0119]圖13示出根據(jù)示例性實(shí)施例的第一檢測(cè)子步驟S2420和第二檢測(cè)子步驟S2430的示例性處理的流程圖。
[0120]如圖13所示,步驟S2420可以包括分割步驟S2421和部件檢測(cè)步驟S2422。
[0121]在步驟S2421中,候選圖像區(qū)域被分割成多個(gè)部分候選區(qū)域。部分候選區(qū)域的尺寸可以通過(guò)候選圖像區(qū)域的尺寸和最大預(yù)期部件與查詢(xún)對(duì)象之間的比率而被確定,并且可以根據(jù)具體應(yīng)用而被確定。根據(jù)一個(gè)示例性實(shí)施例,在步驟S2200中,不僅部件而且查詢(xún)對(duì)象(此例子中為貓的臉)的位置和尺寸可以被標(biāo)記,并且,可以根據(jù)步驟S2200中執(zhí)行的標(biāo)記來(lái)確定最大預(yù)期部件與查詢(xún)對(duì)象之間的比率。
[0122]在步驟S2422中,所述多個(gè)部件分類(lèi)器中的每一個(gè)被用于檢測(cè)是否在所述部分候選區(qū)域中的一個(gè)或多個(gè)中存在相應(yīng)部件。更特別地,對(duì)于每個(gè)部件以及對(duì)于每個(gè)部分候選區(qū)域,通過(guò)使用相應(yīng)的部件分類(lèi)器,檢測(cè)該部件是否存在于該部分候選區(qū)域中。可以存儲(chǔ)關(guān)于哪個(gè)部分候選區(qū)域被檢測(cè)出包含哪個(gè)部件的檢測(cè)結(jié)果。
[0123]如圖13所示,步驟S2430可以包括組合確定步驟S2431,該步驟S2431通過(guò)組合步驟S2420中的各個(gè)部件的檢測(cè)結(jié)果來(lái)確定是否在候選圖像區(qū)域中檢測(cè)到所述查詢(xún)對(duì)象。
[0124]在這里,該組合可以對(duì)應(yīng)于在生成專(zhuān)用于查詢(xún)對(duì)象的檢測(cè)器時(shí)使用的組合。[0125]例如,在步驟S2431中,在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類(lèi)器檢測(cè)到的情況下,可確定為在候選圖像區(qū)域中檢測(cè)到查詢(xún)對(duì)象。
[0126]再例如,在步驟S2431中,在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類(lèi)器檢測(cè)到并且檢測(cè)到的部件之間滿足一定位置關(guān)系的情況下,可確定為在候選圖像區(qū)域中檢測(cè)到查詢(xún)對(duì)象。在這種情況下,部件檢測(cè)步驟S2422還需要包括部件位置確定步驟,在檢測(cè)到部分候選區(qū)域包含部件的情況下確定該部件在候選圖像區(qū)域中的位置。可以用各種方式確定部件的位置。例如,部件的位置可以根據(jù)部分候選區(qū)域的位置而被確定,或者可以通過(guò)檢測(cè)部件的中心(幾何中心或重心)的坐標(biāo)而被確定。
[0127]再例如,該組合也可被設(shè)計(jì)為使得在通過(guò)所述多個(gè)部件分類(lèi)器獲得的分類(lèi)分?jǐn)?shù)的加權(quán)和大于預(yù)定閾值的情況下在候選圖像區(qū)域中檢測(cè)到查詢(xún)對(duì)象。
[0128]由于可以使用組合部件分類(lèi)器的各種方式來(lái)生成檢測(cè)器,因此可以使用組合各個(gè)部件的檢測(cè)結(jié)果的相應(yīng)方式,并且這些方式不限于已經(jīng)例示的那些。
[0129]如圖12所示,步驟S2400還可以包括候選圖像區(qū)域更新步驟S2440和對(duì)象定位步驟 S2450。
[0130]判斷是否滿足預(yù)定條件。如果不滿足預(yù)定條件,則流程進(jìn)行到步驟S2440,在步驟S2440中,更新候選圖像區(qū)域。然后,流程回到步驟S2410,并且對(duì)于更新后的候選圖像區(qū)域執(zhí)行候選圖像區(qū)域確定步驟S2410、第一檢測(cè)子步驟S2420和第二檢測(cè)子步驟S2430。
[0131]在此,可以根據(jù)具體應(yīng)用任意定義所述預(yù)定條件。例如,該預(yù)定條件可以是候選圖像區(qū)域達(dá)到了最大尺寸(例如,目的圖像的尺寸)。再例如,該預(yù)定條件可以是已經(jīng)有足夠數(shù)目的候選圖像區(qū)域被檢測(cè)為包含查詢(xún)對(duì)象。
[0132]可以通過(guò)偏移滑動(dòng)窗來(lái)執(zhí)行候選圖像區(qū)域的更新。此外,當(dāng)滑動(dòng)窗已遍歷了整個(gè)目的圖像時(shí),該滑動(dòng)窗可以被偏移到其初始位置,并且被調(diào)整尺寸(例如,尺寸遞增一個(gè)預(yù)
定量)。
[0133]如果滿足了預(yù)定條件,則流程進(jìn)行到步驟S2450,在步驟S2450中,根據(jù)檢測(cè)出查詢(xún)對(duì)象的候選圖像區(qū)域,確定查詢(xún)對(duì)象在目的圖像中的位置。
[0134]有可能將多于一個(gè)候選圖像區(qū)域檢測(cè)為包含查詢(xún)對(duì)象。在這種情況下,可以通過(guò)例如對(duì)被檢測(cè)為包含查詢(xún)對(duì)象的多個(gè)候選圖像區(qū)域的中心位置和尺寸取平均值來(lái)確定查詢(xún)對(duì)象的位置(中心位置和尺寸)。
[0135]通過(guò)參照?qǐng)D12描述的示例性處理,在檢測(cè)到查詢(xún)對(duì)象的情況下,也可以確定查詢(xún)對(duì)象在目的圖像中的位置。
[0136]圖14是示出根據(jù)本發(fā)明的示例性實(shí)施例的對(duì)象檢測(cè)設(shè)備2000的示例性配置的框圖。
[0137]對(duì)象檢測(cè)設(shè)備2000包括:通用模型存儲(chǔ)單元2100,被配置為事先離線地存儲(chǔ)用于特定對(duì)象類(lèi)型的通用模型,所述通用模型描述預(yù)計(jì)在所述特定對(duì)象類(lèi)型的單個(gè)對(duì)象中共同存在的多個(gè)部件;樣本圖像接收單元2200,被配置為接收對(duì)一個(gè)或多個(gè)樣本圖像的輸入,所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)均包含同一查詢(xún)對(duì)象,所述查詢(xún)對(duì)象是所述特定對(duì)象類(lèi)型的對(duì)象;對(duì)象檢測(cè)器創(chuàng)建單元2300,被配置為利用所述通用模型和所述一個(gè)或多個(gè)樣本圖像,創(chuàng)建專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器;以及對(duì)象檢測(cè)單元2400,被配置為利用所創(chuàng)建的專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器,從目的圖像中檢測(cè)所述查詢(xún)對(duì)象。[0138]單元2100、2200、2300和2400可以被配置為分別執(zhí)行步驟S2100、S2200、S2300和S2400的處理。
[0139]根據(jù)示例性實(shí)施例,所述樣本圖像接收單元2200還可被配置為接收或生成對(duì)所述一個(gè)或多個(gè)樣本圖像中的各個(gè)部件的標(biāo)記。在這種情況下,對(duì)象檢測(cè)器創(chuàng)建單元2300可包括部件分類(lèi)器生成單元2310,被配置為利用所述通用模型中的各部件與在所述一個(gè)或多個(gè)樣本圖像中標(biāo)記出的各部件之間的匹配,生成專(zhuān)用于所述查詢(xún)對(duì)象的各部件的多個(gè)部件分類(lèi)器。
[0140]對(duì)象檢測(cè)器創(chuàng)建單元2300還可包括部件分類(lèi)器組合單元2320,被配置為通過(guò)組合對(duì)應(yīng)于各個(gè)部件的所生成的部件分類(lèi)器,創(chuàng)建所述專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器。
[0141]根據(jù)本發(fā)明的示例性實(shí)施例,對(duì)象檢測(cè)單元2400可以包括:候選圖像區(qū)域確定單元2410,被配置為利用滑動(dòng)窗確定目的圖像中的候選圖像區(qū)域;第一檢測(cè)子單元2420,被配置為檢測(cè)所述候選圖像區(qū)域中是否存在所述多個(gè)部件中的至少一些;和第二檢測(cè)子單元2430,被配置為根據(jù)所述第一檢測(cè)子單元中的檢測(cè)結(jié)果,確定是否在所述候選圖像區(qū)域中檢測(cè)到所述查詢(xún)對(duì)象。
[0142]根據(jù)本發(fā)明的示例性實(shí)施例,對(duì)象檢測(cè)單元2400還可以包括:候選圖像區(qū)域更新單元2440,被配置為,如果不滿足預(yù)定條件,則更新候選圖像區(qū)域,所述候選圖像區(qū)域確定單元、所述第一檢測(cè)子單元和所述第二檢測(cè)子單元在更新后的候選圖像區(qū)域上進(jìn)行操作;和對(duì)象定位單元2450,被配置為根據(jù)從哪些候選圖像區(qū)域中檢測(cè)到所述查詢(xún)對(duì)象,確定所述查詢(xún)對(duì)象在所述目的圖像中的位置。
[0143]根據(jù)一些可能的實(shí)施例,部件分類(lèi)器生成單元2310可被配置為執(zhí)行步驟S2310中執(zhí)行的處理(例如,步驟S2311和S2312中的處理或步驟S2313和S2314中的處理)。
[0144]例如,部件分類(lèi)器生成單元2310可以包括:分類(lèi)器分?jǐn)?shù)獲得單元2311,被配置為對(duì)于每個(gè)分類(lèi)器組中的每個(gè)候選分類(lèi)器,對(duì)各樣本圖像中所標(biāo)記的相應(yīng)部件通過(guò)該候選分類(lèi)器所獲得的分類(lèi)分?jǐn)?shù)進(jìn)行求和或求平均值,以獲得該候選分類(lèi)器的分類(lèi)器分?jǐn)?shù);和選擇單元2312,被配置為對(duì)于每個(gè)分類(lèi)器組,選擇具有最大的分類(lèi)器分?jǐn)?shù)的候選分類(lèi)器,作為相應(yīng)部件的部件分類(lèi)器。
[0145]再例如,部件分類(lèi)器生成單元2310可以包括:特征參數(shù)計(jì)算單元2313,被配置為對(duì)于每個(gè)部件,通過(guò)根據(jù)所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)樣本圖像中所標(biāo)記的該部件來(lái)確定相應(yīng)不完整分類(lèi)器的所述特征參數(shù),計(jì)算該樣本圖像的該部件的特征參數(shù);以及組合計(jì)算單元2314,被配置為對(duì)于每個(gè)部件,通過(guò)組合所述一個(gè)或多個(gè)樣本圖像的該部件的特征參數(shù),計(jì)算相應(yīng)部件分類(lèi)器的特征參數(shù)。
[0146]此外,第一檢測(cè)子單元2420可以被配置為執(zhí)行步驟S2420中執(zhí)行的處理(例如,步驟S2421和S2422中的處理)。
[0147]例如,第一檢測(cè)子單元2420可以包括:分割單元2421,被配置為將所述候選圖像區(qū)域分割成多個(gè)部分候選區(qū)域;和部件檢測(cè)單元2422,被配置為利用所述多個(gè)部件分類(lèi)器中的每一個(gè),檢測(cè)是否有一個(gè)或多個(gè)部分候選區(qū)域中存在相應(yīng)部件。
[0148]此外,所述第二檢測(cè)子單元2430可以被配置為執(zhí)行步驟S2430中執(zhí)行的處理(例如步驟S2431中的處理)。例如,第二檢測(cè)子單元2430可以包含:組合確定單元2431,被配置為通過(guò)組合在所述第一檢測(cè)子單元中的對(duì)于各個(gè)部件的檢測(cè)結(jié)果,確定是否在所述候選圖像區(qū)域中檢測(cè)到所述查詢(xún)對(duì)象。
[0149]此外,組合確定單元2431可以包括:用于在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類(lèi)器檢測(cè)到的情況下,確定為在所述候選圖像區(qū)域中檢測(cè)到所述查詢(xún)對(duì)象的單元。
[0150]以上描述的單元和以下要描述的單元是用于實(shí)施本公開(kāi)中描述的處理的示例性和/或優(yōu)選的模塊。這些模塊可以是硬件單元(諸如場(chǎng)可編程門(mén)陣列、數(shù)字信號(hào)處理器或?qū)S眉呻娐返?和/或軟件模塊(諸如計(jì)算機(jī)可讀程序)。以上并未詳盡地描述用于實(shí)施各個(gè)步驟的模塊。然而,只要有執(zhí)行某個(gè)處理的步驟,就可以有用于實(shí)施同一處理的對(duì)應(yīng)的功能模塊或單元(由硬件和/或軟件實(shí)施)。通過(guò)所描述的步驟以及與這些步驟對(duì)應(yīng)的單元的所有組合限定的技術(shù)方案都被包括在本申請(qǐng)的公開(kāi)內(nèi)容中,只要它們構(gòu)成的這些技術(shù)方案是完整并且可應(yīng)用的。
[0151]此外,由各種單元構(gòu)成的上述裝置可以作為功能模塊被并入到諸如計(jì)算機(jī)之類(lèi)的硬件裝置中。除了這些功能模塊之外,計(jì)算機(jī)當(dāng)然可以具有其他硬件或者軟件部件。
[0152]根據(jù)實(shí)施例,由于通用模型被事先離線地生成和存儲(chǔ),不必在每次要檢測(cè)新的查詢(xún)對(duì)象時(shí)都構(gòu)建檢測(cè)器的整個(gè)模型,因此可以提高檢測(cè)的效率。此外,由于通過(guò)使用特定查詢(xún)對(duì)象從通用模型在線地創(chuàng)建具體檢測(cè)器,因此該方法對(duì)于各種對(duì)象都具有靈活性和精確性,而且不限于事先注冊(cè)的對(duì)象。
[0153]本發(fā)明可被用于許多應(yīng)用中。根據(jù)本發(fā)明的對(duì)象檢測(cè)設(shè)備2000例如可被應(yīng)用于圖像拾取設(shè)備。
[0154]圖15是示出根據(jù)示例性實(shí)施例的圖像拾取設(shè)備3000的示例性配置的框圖。
[0155]如圖15所示,圖像拾取設(shè)備3000可以包括:攝影光學(xué)系統(tǒng)3100,其可例如包括用于拍攝的光學(xué)元件;成像單元3200,被配置為執(zhí)行成像以形成圖像,該成像單元3200可以包括諸如CXD傳感器或CMOS傳感器之類(lèi)的成像傳感器;上述的對(duì)象檢測(cè)設(shè)備2000,被配置為使用戶能夠輸入或選擇查詢(xún)對(duì)象,以及在所形成的圖像中檢測(cè)所述查詢(xún)對(duì)象;和成像控制單元3300,被配置為根據(jù)檢測(cè)到的查詢(xún)對(duì)象執(zhí)行成像控制。
[0156]根據(jù)本發(fā)明的示例性實(shí)施例,所述成像控制可以包括:如果檢測(cè)到查詢(xún)對(duì)象,則增大拍攝的分辨率。以這種方式,除非在捕獲的圖像中出現(xiàn)特定對(duì)象,否則圖像拾取設(shè)備可以操作于節(jié)能模式(具有低分辨率)。
[0157]根據(jù)本發(fā)明的另一示例性實(shí)施例,所述成像控制可以包括:如果檢測(cè)到查詢(xún)對(duì)象,則使拍攝光學(xué)系統(tǒng)3100聚焦于檢測(cè)出的查詢(xún)對(duì)象。以這種方式,圖像拾取設(shè)備3000可被配置為聚焦于所感興趣的對(duì)象。
[0158]根據(jù)本發(fā)明的再另一示例性實(shí)施例,所述成像控制可以包括:在檢測(cè)到查詢(xún)對(duì)象時(shí),使拍攝光學(xué)系統(tǒng)3100保持跟蹤所檢測(cè)到的查詢(xún)對(duì)象,以使得查詢(xún)對(duì)象持續(xù)出現(xiàn)在要形成的圖像中。在此示例性實(shí)施例中,拍攝光學(xué)系統(tǒng)3100可以被配置有使得該拍攝光學(xué)系統(tǒng)3100能夠根據(jù)成像控制而自動(dòng)旋轉(zhuǎn)的機(jī)械結(jié)構(gòu)。以這種方式,圖像拾取設(shè)備3000可保持跟蹤感興趣的對(duì)象,并且盡可能多地獲得感興趣的對(duì)象的圖像。
[0159]可以通過(guò)許多方式來(lái)實(shí)施本發(fā)明的方法和設(shè)備。例如,可以通過(guò)軟件、硬件、固件、或其任何組合來(lái)實(shí)施本發(fā)明的方法和設(shè)備。上述的方法步驟的次序僅是說(shuō)明性的,本發(fā)明的方法步驟不限于以上具體描述的次序,除非以其他方式明確說(shuō)明。此外,在一些實(shí)施例中,本發(fā)明還可以被實(shí)施為記錄在記錄介質(zhì)中的程序,其包括用于實(shí)現(xiàn)根據(jù)本發(fā)明的方法的機(jī)器可讀指令。因而,本發(fā)明還覆蓋存儲(chǔ)用于實(shí)現(xiàn)根據(jù)本發(fā)明的方法的程序的記錄介質(zhì)。
[0160]雖然已通過(guò)示例詳細(xì)展示了本發(fā)明的一些具體實(shí)施例,但是本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,上述示例僅意圖是說(shuō)明性的而不限制本發(fā)明的范圍。本領(lǐng)域技術(shù)人員應(yīng)該理解,上述實(shí)施例可以被修改而不脫離本發(fā)明的范圍和實(shí)質(zhì)。本發(fā)明的范圍是通過(guò)所附的權(quán)利要求限定的。
【權(quán)利要求】
1.一種對(duì)象檢測(cè)方法,包括: 通用模型存儲(chǔ)步驟,事先離線地存儲(chǔ)用于特定對(duì)象類(lèi)型的通用模型,所述通用模型描述預(yù)計(jì)在所述特定對(duì)象類(lèi)型的單個(gè)對(duì)象中共同存在的多個(gè)部件; 樣本圖像接收步驟,接收對(duì)一個(gè)或多個(gè)樣本圖像的輸入,所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)均包含同一查詢(xún)對(duì)象,所述查詢(xún)對(duì)象是所述特定對(duì)象類(lèi)型的對(duì)象; 對(duì)象檢測(cè)器創(chuàng)建步驟,利用所述通用模型和所述一個(gè)或多個(gè)樣本圖像,創(chuàng)建專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器;以及 對(duì)象檢測(cè)步驟,利用所創(chuàng)建的專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器,從目的圖像中檢測(cè)所述查詢(xún)對(duì)象。
2.根據(jù)權(quán)利要求1的對(duì)象檢測(cè)方法,其中 在所述樣本圖像接收步驟中,還接收或生成對(duì)所述一個(gè)或多個(gè)樣本圖像中的各部件的標(biāo)記,以及 所述對(duì)象檢測(cè)器創(chuàng)建步驟包含:部件分類(lèi)器生成步驟,利用所述通用模型中的各部件與在所述一個(gè)或多個(gè)樣本圖像中標(biāo)記出的各部件之間的匹配,生成專(zhuān)用于所述查詢(xún)對(duì)象的各部件的多個(gè)部件分類(lèi)器。
3.根據(jù)權(quán)利要求2的對(duì)象檢測(cè)方法,其中 所述通用模型包含分別與所述多個(gè)部件對(duì)應(yīng)的多個(gè)分類(lèi)器組,所述多個(gè)分類(lèi)器組中的每個(gè)分類(lèi)器組包含用于描述所述特定對(duì)象類(lèi)型的相應(yīng)部件的多種不同特征實(shí)例的多個(gè)候選分類(lèi)器,以及 在所述部件分類(lèi)器 生成步驟中,對(duì)于每個(gè)部件,從相應(yīng)的分類(lèi)器組中選擇對(duì)于描述所述查詢(xún)對(duì)象的該部件而言最佳的候選分類(lèi)器,作為部件分類(lèi)器。
4.根據(jù)權(quán)利要求3的對(duì)象檢測(cè)方法,其中 所述部件分類(lèi)器生成步驟包含: 分類(lèi)器分?jǐn)?shù)獲得步驟,對(duì)于每個(gè)分類(lèi)器組中的每個(gè)候選分類(lèi)器,對(duì)各樣本圖像中所標(biāo)記的相應(yīng)部件通過(guò)該候選分類(lèi)器所獲得的分類(lèi)分?jǐn)?shù)進(jìn)行求和或求平均值,以獲得該候選分類(lèi)器的分類(lèi)器分?jǐn)?shù),和 選擇步驟,對(duì)于每個(gè)分類(lèi)器組,選擇具有最大的分類(lèi)器分?jǐn)?shù)的候選分類(lèi)器,作為相應(yīng)部件的部件分類(lèi)器。
5.根據(jù)權(quán)利要求2的對(duì)象檢測(cè)方法,其中 所述通用模型包含分別與所述多個(gè)部件對(duì)應(yīng)的多個(gè)粗分類(lèi)器,所述多個(gè)粗分類(lèi)器中的每個(gè)粗分類(lèi)器用于描述所述特定對(duì)象類(lèi)型的相應(yīng)部件的相應(yīng)通用特征,以及 在所述部件分類(lèi)器生成步驟中,對(duì)于每個(gè)部件,通過(guò)根據(jù)所述查詢(xún)對(duì)象的該部件而將相應(yīng)粗分類(lèi)器所描述的相應(yīng)通用特征進(jìn)一步限定為相應(yīng)具體特征,從相應(yīng)粗分類(lèi)器生成描述所述相應(yīng)具體特征的相應(yīng)部件分類(lèi)器。
6.根據(jù)權(quán)利要求2的對(duì)象檢測(cè)方法,其中 所述通用模型包含分別與所述多個(gè)部件對(duì)應(yīng)的多個(gè)不完整分類(lèi)器,所述多個(gè)不完整分類(lèi)器中的每一個(gè)具有尚未確定的特征參數(shù),以及 在所述部件分類(lèi)器生成步驟中,對(duì)于每個(gè)部件,通過(guò)根據(jù)所述查詢(xún)對(duì)象的該部件來(lái)確定相應(yīng)不完整分類(lèi)器的所述特征參數(shù),分別從相應(yīng)不完整分類(lèi)器形成特征參數(shù)均已被確定的相應(yīng)部件分類(lèi)器。
7.根據(jù)權(quán)利要求6的對(duì)象檢測(cè)方法,其中 所述部件分類(lèi)器生成步驟包含: 特征參數(shù)計(jì)算步驟,對(duì)于每個(gè)部件,通過(guò)根據(jù)所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)樣本圖像中所標(biāo)記的該部件來(lái)確定相應(yīng)不完整分類(lèi)器的所述特征參數(shù),計(jì)算該樣本圖像的該部件的特征參數(shù);以及 組合計(jì)算步驟,對(duì)于每個(gè)部件,通過(guò)組合所述一個(gè)或多個(gè)樣本圖像的該部件的特征參數(shù),計(jì)算相應(yīng)部件分類(lèi)器的特征參數(shù)。
8.根據(jù)權(quán)利要求2-7中任一項(xiàng)的對(duì)象檢測(cè)方法,其中 所述對(duì)象檢測(cè)器創(chuàng)建步驟還包含:部件分類(lèi)器組合步驟,通過(guò)組合對(duì)應(yīng)于各個(gè)部件的所生成的部件分類(lèi)器,創(chuàng)建所述專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器。
9.根據(jù)權(quán)利要求8的對(duì)象檢測(cè)方法,其中 所述組合使得:在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類(lèi)器檢測(cè)到的情況下,所述專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器判斷為檢測(cè)到所述查詢(xún)對(duì)象。
10.根據(jù)權(quán)利要求8的對(duì)象檢測(cè)方法,其中 所述通用模型還包含所述多個(gè)部件之間的位置關(guān)系,以及 所述組合使得:在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類(lèi)器檢測(cè)到并且檢測(cè)到的部件之間滿足所述位置關(guān)系的情況下,所述專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器判斷為檢測(cè)到所述查詢(xún)對(duì)象`。
11.根據(jù)權(quán)利要求2的對(duì)象檢測(cè)方法,其中 所述對(duì)象檢測(cè)步驟包含: 候選圖像區(qū)域確定步驟,利用滑動(dòng)窗確定目的圖像中的候選圖像區(qū)域; 第一檢測(cè)子步驟,檢測(cè)所述候選圖像區(qū)域中是否存在所述多個(gè)部件中的至少一些;和第二檢測(cè)子步驟,根據(jù)在所述第一檢測(cè)子步驟中的檢測(cè)結(jié)果,確定是否在所述候選圖像區(qū)域中檢測(cè)到所述查詢(xún)對(duì)象。
12.根據(jù)權(quán)利要求11的對(duì)象檢測(cè)方法,其中 所述第一檢測(cè)子步驟包含: 分割步驟,將所述候選圖像區(qū)域分割成多個(gè)部分候選區(qū)域;和部件檢測(cè)步驟,利用所述多個(gè)部件分類(lèi)器中的每一個(gè),檢測(cè)是否有一個(gè)或多個(gè)部分候選區(qū)域中存在相應(yīng)部件,以及所述第二檢測(cè)子步驟包含: 組合確定步驟,通過(guò)組合在所述第一檢測(cè)子步驟中的對(duì)于各個(gè)部件的檢測(cè)結(jié)果,確定是否在所述候選圖像區(qū)域中檢測(cè)到所述查詢(xún)對(duì)象。
13.根據(jù)權(quán)利要求12的對(duì)象檢測(cè)方法,其中 所述組合確定步驟包括:在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類(lèi)器檢測(cè)到的情況下,確定為在所述候選圖像區(qū)域中檢測(cè)到所述查詢(xún)對(duì)象。
14.根據(jù)權(quán)利要求12的對(duì)象檢測(cè)方法,其中 所述通用模型還包含所述多個(gè)部件之間的位置關(guān)系, 所述部件檢測(cè)步驟包括:部件位置確定步驟,如果檢測(cè)為一個(gè)部分候選區(qū)域包含部件,則確定所述部件在所述候選圖像區(qū)域中的位置,以及 所述組合確定步驟包括:在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類(lèi)器檢測(cè)到并且檢測(cè)到的部件之間滿足所述位置關(guān)系的情況下,確定為在所述候選圖像區(qū)域中檢測(cè)到所述查詢(xún)對(duì)象。
15.根據(jù)權(quán)利要求11的對(duì)象檢測(cè)方法,其中 所述對(duì)象檢測(cè)步驟還包括: 候選圖像區(qū)域更新步驟,如果不滿足預(yù)定條件,則更新候選圖像區(qū)域,在更新后的候選圖像區(qū)域中執(zhí)行所述候選圖像區(qū)域確定步驟、所述第一檢測(cè)子步驟和所述第二檢測(cè)子步驟;和 對(duì)象定位步驟,根據(jù)從哪些候選圖像區(qū)域中檢測(cè)到所述查詢(xún)對(duì)象,確定所述查詢(xún)對(duì)象在所述目的圖像中的位置。
16.一種對(duì)象檢測(cè)設(shè)備,包括: 通用模型存儲(chǔ)單元,被配置為事先離線地存儲(chǔ)用于特定對(duì)象類(lèi)型的通用模型,所述通用模型描述預(yù)計(jì)在所述特定對(duì)象類(lèi)型的單個(gè)對(duì)象中共同存在的多個(gè)部件; 樣本圖像接收單元,被配置為接收對(duì)一個(gè)或多個(gè)樣本圖像的輸入,所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)均包含同一查詢(xún)對(duì)象,所述查詢(xún)對(duì)象是所述特定對(duì)象類(lèi)型的對(duì)象; 對(duì)象檢測(cè)器創(chuàng)建單元,被配置為利用所述通用模型和所述一個(gè)或多個(gè)樣本圖像,創(chuàng)建專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器;以及 對(duì)象檢測(cè)單元,被配置為利用所創(chuàng)建的專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器,從目的圖像中檢測(cè)所述查詢(xún)對(duì)象。`
17.根據(jù)權(quán)利要求16的對(duì)象`檢測(cè)設(shè)備,其中 所述樣本圖像接收單元還被配置為接收或生成對(duì)所述一個(gè)或多個(gè)樣本圖像中的各部件的標(biāo)記,以及 所述對(duì)象檢測(cè)器創(chuàng)建單元包含:部件分類(lèi)器生成單元,被配置為利用所述通用模型中的各部件與在所述一個(gè)或多個(gè)樣本圖像中標(biāo)記出的各部件之間的匹配,生成專(zhuān)用于所述查詢(xún)對(duì)象的各部件的多個(gè)部件分類(lèi)器。
18.根據(jù)權(quán)利要求17的對(duì)象檢測(cè)設(shè)備,其中 所述通用模型包含分別與所述多個(gè)部件對(duì)應(yīng)的多個(gè)分類(lèi)器組,所述多個(gè)分類(lèi)器組中的每個(gè)分類(lèi)器組包含用于描述所述特定對(duì)象類(lèi)型的相應(yīng)部件的多種不同特征實(shí)例的多個(gè)候選分類(lèi)器,以及 所述部件分類(lèi)器生成單元還被配置為,對(duì)于每個(gè)部件,從相應(yīng)的分類(lèi)器組中選擇對(duì)于描述所述查詢(xún)對(duì)象的該部件而言最佳的候選分類(lèi)器,作為部件分類(lèi)器。
19.根據(jù)權(quán)利要求18的對(duì)象檢測(cè)設(shè)備,其中 所述部件分類(lèi)器生成單元包含: 分類(lèi)器分?jǐn)?shù)獲得單元,被配置為對(duì)于每個(gè)分類(lèi)器組中的每個(gè)候選分類(lèi)器,對(duì)各樣本圖像中所標(biāo)記的相應(yīng)部件通過(guò)該候選分類(lèi)器所獲得的分類(lèi)分?jǐn)?shù)進(jìn)行求和或求平均值,以獲得該候選分類(lèi)器的分類(lèi)器分?jǐn)?shù),和 選擇單元,被配置為對(duì)于每個(gè)分類(lèi)器組,選擇具有最大的分類(lèi)器分?jǐn)?shù)的候選分類(lèi)器,作為相應(yīng)部件的部件分類(lèi)器。
20.根據(jù)權(quán)利要求17的對(duì)象檢測(cè)設(shè)備,其中 所述通用模型包含分別與所述多個(gè)部件對(duì)應(yīng)的多個(gè)粗分類(lèi)器,所述多個(gè)粗分類(lèi)器中的每個(gè)粗分類(lèi)器用于描述所述特定對(duì)象類(lèi)型的相應(yīng)部件的相應(yīng)通用特征,以及 所述部件分類(lèi)器生成單元還被配置為,對(duì)于每個(gè)部件,通過(guò)根據(jù)所述查詢(xún)對(duì)象的該部件而將相應(yīng)粗分類(lèi)器所描述的相應(yīng)通用特征進(jìn)一步限定為相應(yīng)具體特征,從相應(yīng)粗分類(lèi)器生成描述所述相應(yīng)具體特征的相應(yīng)部件分類(lèi)器。
21.根據(jù)權(quán)利要求17的對(duì)象檢測(cè)設(shè)備,其中 所述通用模型包含分別與所述多個(gè)部件對(duì)應(yīng)的多個(gè)不完整分類(lèi)器,所述多個(gè)不完整分類(lèi)器中的每一個(gè)具有尚未確定的特征參數(shù),以及 所述部件分類(lèi)器生成單元還被配置為,對(duì)于每個(gè)部件,通過(guò)根據(jù)所述查詢(xún)對(duì)象的該部件來(lái)確定相應(yīng)不完整分類(lèi)器的所述特征參數(shù),分別從相應(yīng)不完整分類(lèi)器形成特征參數(shù)均已被確定的相應(yīng)部件分類(lèi)器。
22.根據(jù)權(quán)利要求21的對(duì)象檢測(cè)設(shè)備,其中 所述部件分類(lèi)器生成單元包含: 特征參數(shù)計(jì)算單元,被配置為對(duì)于每個(gè)部件,通過(guò)根據(jù)所述一個(gè)或多個(gè)樣本圖像中的每一個(gè)樣本圖像中所標(biāo)記的該部件來(lái)確定相應(yīng)不完整分類(lèi)器的所述特征參數(shù),計(jì)算該樣本圖像的該部件的特征參數(shù);以及 組合計(jì)算單元,被配置為對(duì)于每個(gè)部件,通過(guò)組合所述一個(gè)或多個(gè)樣本圖像的該部件的特征參數(shù),計(jì)算相應(yīng)部件分類(lèi)器的特征參數(shù)。
23.根據(jù)權(quán)利要求17-22中任一項(xiàng)的對(duì)象檢測(cè)設(shè)備,其中` 所述對(duì)象檢測(cè)器創(chuàng)建單元還包含:部件分類(lèi)器組合單元,被配置為通過(guò)組合對(duì)應(yīng)于各個(gè)部件的所生成的部件分類(lèi)器,創(chuàng)建所述專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器。
24.根據(jù)權(quán)利要求23的對(duì)象檢測(cè)設(shè)備,其中 所述組合使得:在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類(lèi)器檢測(cè)到的情況下,所述專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器判斷為檢測(cè)到所述查詢(xún)對(duì)象。
25.根據(jù)權(quán)利要求23的對(duì)象檢測(cè)設(shè)備,其中 所述通用模型還包含所述多個(gè)部件之間的位置關(guān)系,以及 所述組合使得:在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類(lèi)器檢測(cè)到并且檢測(cè)到的部件之間滿足所述位置關(guān)系的情況下,所述專(zhuān)用于所述查詢(xún)對(duì)象的檢測(cè)器判斷為檢測(cè)到所述查詢(xún)對(duì)象。
26.根據(jù)權(quán)利要求17的對(duì)象檢測(cè)設(shè)備,其中 所述對(duì)象檢測(cè)單元包含: 候選圖像區(qū)域確定單元,被配置為利用滑動(dòng)窗確定目的圖像中的候選圖像區(qū)域; 第一檢測(cè)子單元,被配置為檢測(cè)所述候選圖像區(qū)域中是否存在所述多個(gè)部件中的至少一些;和 第二檢測(cè)子單元,被配置為根據(jù)所述第一檢測(cè)子單元的檢測(cè)結(jié)果,確定是否在所述候選圖像區(qū)域中檢測(cè)到所述查詢(xún)對(duì)象。
27.根據(jù)權(quán)利要求26的對(duì)象檢測(cè)設(shè)備,其中 所述第一檢測(cè)子單元包含:分割單元,被配置為將所述候選圖像區(qū)域分割成多個(gè)部分候 選區(qū)域;和 部件檢測(cè)單元,被配置為利用所述多個(gè)部件分類(lèi)器中的每一個(gè),檢測(cè)是否有一個(gè)或多個(gè)部分候選區(qū)域中存在相應(yīng)部件,以及所述第二檢測(cè)子單元包含: 組合確定單元,被配置為通過(guò)組合所述第一檢測(cè)子單元的對(duì)于各個(gè)部件的檢測(cè)結(jié)果,確定是否在所述候選圖像區(qū)域中檢測(cè)到所述查詢(xún)對(duì)象。
28.根據(jù)權(quán)利要求27的對(duì)象檢測(cè)設(shè)備,其中 所述組合確定單元包括:用于在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類(lèi)器檢測(cè)到的情況下,確定為在所述候選圖像區(qū)域中檢測(cè)到所述查詢(xún)對(duì)象的單元。
29.根據(jù)權(quán)利要求27的對(duì)象檢測(cè)設(shè)備,其中 所述通用模型還包含所述多個(gè)部件之間的位置關(guān)系, 所述部件檢測(cè)單元包括:部件位置確定單元,被配置為如果檢測(cè)為一個(gè)部分候選區(qū)域包含部件,則確定所述部件在所述候選圖像區(qū)域中的位置, 所述組合確定單元包括:用于在多于預(yù)定數(shù)量或多于預(yù)定比例的部件被所述多個(gè)部件分類(lèi)器檢測(cè)到并且檢測(cè)到的部件之間滿足所述位置關(guān)系的情況下,確定為在所述候選圖像區(qū)域中檢測(cè)到所述查詢(xún)對(duì)象的單元。
30.根據(jù)權(quán)利要求26的對(duì)象檢測(cè)設(shè)備,其中 所述對(duì)象檢測(cè)單元還包括: 候選圖像區(qū)域更新單元,被配置為,如果不滿足預(yù)定條件,則更新候選圖像區(qū)域,所述候選圖像區(qū)域確定單元、所述第一檢測(cè)子單元和所述第二檢測(cè)子單元在更新后的候選圖像區(qū)域上進(jìn)行操作;和 對(duì)象定位單元,被配置為根據(jù)從哪些候選圖像區(qū)域中檢測(cè)到所述查詢(xún)對(duì)象,確定所述查詢(xún)對(duì)象在所述目的圖像中的位置。
31.一種圖像拾取設(shè)備,包括: 攝影光學(xué)系統(tǒng); 成像單元,被配置為執(zhí)行成像以形成圖像; 根據(jù)權(quán)利要求16-30中的任一項(xiàng)的對(duì)象檢測(cè)設(shè)備,被配置為使用戶能夠輸入或選擇查詢(xún)對(duì)象,以及在所形成的圖像中檢測(cè)所述查詢(xún)對(duì)象;和 成像控制單元,被配置為根據(jù)檢測(cè)到的查詢(xún)對(duì)象執(zhí)行成像控制。
32.根據(jù)權(quán)利要求31的圖像拾取設(shè)備,其中 所述成像控制包括:如果檢測(cè)到查詢(xún)對(duì)象,則增大拍攝的分辨率。
33.根據(jù)權(quán)利要求31的圖像拾取設(shè)備,其中 所述成像控制包括:如果檢測(cè)到查詢(xún)對(duì)象,則使拍攝光學(xué)系統(tǒng)聚焦于檢測(cè)出的查詢(xún)對(duì)象。
34.根據(jù)權(quán)利要求31的圖像拾取設(shè)備,其中 所述成像控制包括:如果檢測(cè)到查詢(xún)對(duì)象,則使拍攝光學(xué)系統(tǒng)保持跟蹤所檢測(cè)到的查詢(xún)對(duì)象,以使得查詢(xún)對(duì)象持續(xù)出現(xiàn)在要形成的圖像中。
【文檔編號(hào)】G06K9/00GK103870798SQ201210550321
【公開(kāi)日】2014年6月18日 申請(qǐng)日期:2012年12月18日 優(yōu)先權(quán)日:2012年12月18日
【發(fā)明者】姜涌, 胥立豐 申請(qǐng)人:佳能株式會(huì)社