欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

對(duì)象分類器的在線學(xué)習(xí)方法和設(shè)備以及檢測(cè)方法和設(shè)備與流程

文檔序號(hào):11831710閱讀:231來(lái)源:國(guó)知局
對(duì)象分類器的在線學(xué)習(xí)方法和設(shè)備以及檢測(cè)方法和設(shè)備與流程
本發(fā)明涉及圖像處理、計(jì)算機(jī)視覺(jué)(computervision)和模式識(shí)別,并且特別地涉及用于一組對(duì)象分類器的在線學(xué)習(xí)方法和設(shè)備以及用于在圖像序列中檢測(cè)對(duì)象的方法和設(shè)備。
背景技術(shù)
:最近幾十年在檢測(cè)特定對(duì)象或種類(諸如臉、人、汽車等)方面已經(jīng)取得很大的進(jìn)展。大部分檢測(cè)器必須被離線訓(xùn)練,其經(jīng)常包含利用手動(dòng)標(biāo)記的訓(xùn)練示例的較大集合的密集學(xué)習(xí)階段。當(dāng)前,越來(lái)越多的用戶傾向于拍攝特定對(duì)象。這意味著用戶需要的不是傳統(tǒng)的像臉/狗/貓檢測(cè)器那樣的檢測(cè)器,而是能夠?qū)W習(xí)用戶自己的對(duì)象(例如,他的寵物)的外觀(appearance)的檢測(cè)器。例如,用戶經(jīng)常想要在拍攝時(shí)自動(dòng)地聚焦于他們的寵物。已經(jīng)開(kāi)發(fā)了一種新穎的技術(shù),稱為“用戶注冊(cè)對(duì)象檢測(cè)(UserRegisteredObjectDetection)”,其能夠基于由用戶作為正樣本提供的一個(gè)或若干個(gè)對(duì)象圖像來(lái)檢測(cè)用戶注冊(cè)對(duì)象。但是一般難以僅僅通過(guò)使用非常小集合的正樣本而從視頻幀序列中準(zhǔn)確地檢測(cè)出對(duì)象。因此,已經(jīng)提出了一種解決方案,其使用基于用于檢測(cè)用戶注冊(cè)對(duì)象的支持向量的單類分類器(one-classclassifier)。這個(gè)方法能夠基于少數(shù)的正樣本(即,由用戶注冊(cè)的對(duì)象圖像)、甚至僅僅一個(gè)正樣本來(lái)對(duì)單類分類器進(jìn)行在線學(xué)習(xí)。由于不使用任何負(fù)樣本,因此該單類分類器能夠適合于任何場(chǎng)景。這個(gè)方法能夠通過(guò)可調(diào)參數(shù)將單類分類器的誤報(bào)警率(falsealarmrate)保持在穩(wěn)定的水平。然而,仍然存在對(duì)在一些特殊應(yīng)用中進(jìn)一步減少誤報(bào)警率的需要。例如,在對(duì)于用戶注冊(cè)對(duì)象的監(jiān)視(surveillance)應(yīng)用中,分類 器需要長(zhǎng)時(shí)間工作在有限場(chǎng)景中。針對(duì)各種照明條件的極低誤報(bào)警率和高魯棒性是重要的要求。技術(shù)實(shí)現(xiàn)要素:鑒于上述內(nèi)容,本發(fā)明的發(fā)明人提出了通過(guò)對(duì)一組對(duì)象分類器進(jìn)行在線學(xué)習(xí)的用于用戶注冊(cè)對(duì)象檢測(cè)的新的解決方案,其能夠?qū)⒄`報(bào)警率保持在極低水平。該組分類器包括一個(gè)或更多個(gè)單類分類器以及一個(gè)或更多個(gè)兩類分類器(binaryclassifier),并且這兩個(gè)類型的分類器都基于支持向量并且當(dāng)它們被在線學(xué)習(xí)時(shí)將在其之間共享支持向量,從而提高在線學(xué)習(xí)效果。此外,可以利用在其之間共享支持向量的這樣一組在線學(xué)習(xí)分類器來(lái)從視頻幀序列中更準(zhǔn)確地檢測(cè)用戶注冊(cè)對(duì)象。請(qǐng)注意,在現(xiàn)有技術(shù)中,兩類分類器是僅僅基于巨大數(shù)量的正樣本和負(fù)樣本離線學(xué)習(xí)的。兩類分類器不能用于僅僅使用小集合樣本的用戶注冊(cè)對(duì)象檢測(cè),因?yàn)樗恼`報(bào)警率將會(huì)非常高。這是因?yàn)閷W(xué)習(xí)兩類分類器需要許多的足夠的負(fù)樣本,但是在用戶注冊(cè)對(duì)象檢測(cè)期間,用戶不能提供足夠的負(fù)樣本來(lái)覆蓋背景中的所有情形。當(dāng)在要檢測(cè)的場(chǎng)景中存在未知的負(fù)樣本時(shí),誤報(bào)警率將會(huì)較高,也就是說(shuō),許多不是用戶注冊(cè)對(duì)象的對(duì)象將被視為對(duì)象。此外,通過(guò)使用直接反饋的對(duì)于兩類分類器的在線學(xué)習(xí)使得檢測(cè)器傾向于漂移(drift),并且錯(cuò)誤地更新將使得檢測(cè)器處于不可靠的狀態(tài)。然而,通過(guò)深入研究,本發(fā)明的發(fā)明人已經(jīng)發(fā)現(xiàn),在用戶注冊(cè)對(duì)象檢測(cè)期間通過(guò)在其之間共享支持向量來(lái)與單類分類器結(jié)合地使用兩類分類器,能夠改善誤報(bào)警率。本發(fā)明的一個(gè)方面提供了一種用于一組對(duì)象分類器的在線學(xué)習(xí)方法,其中所述一組對(duì)象分類器包含至少一個(gè)單類分類器和至少一個(gè)兩類分類器,所述方法包括:特征向量提取步驟,從新添加的樣本中提取特征向量;單類分類器更新步驟,基于所提取的特征向量以及所述至少一個(gè)兩類分類器的支持向量來(lái)更新所述至少一個(gè)單類分類器中的至少一個(gè);兩類分類器更新步驟,基于所提取的特征向量以及在 所述單類分類器更新步驟中已經(jīng)部分地或全部地被更新的所述至少一個(gè)單類分類器的支持向量,來(lái)更新所述至少一個(gè)兩類分類器中的至少一個(gè)。本發(fā)明的另一個(gè)方面提供了一種用于通過(guò)使用已經(jīng)被確定為對(duì)象的至少一個(gè)正樣本在圖像序列中檢測(cè)所述對(duì)象的方法,所述方法包括:?jiǎn)晤惙诸惼鳟a(chǎn)生步驟,根據(jù)所述至少一個(gè)正樣本,產(chǎn)生基于用于對(duì)所述對(duì)象進(jìn)行分類的支持向量的至少一個(gè)單類分類器;兩類分類器產(chǎn)生步驟,基于所述圖像序列的第一圖像以及所述單類分類器產(chǎn)生用于對(duì)所述對(duì)象進(jìn)行分類的至少一個(gè)兩類分類器;對(duì)象檢測(cè)步驟,通過(guò)使用包括所述單類分類器和所述兩類分類器的一組對(duì)象分類器在所述序列中的第二圖像中檢測(cè)所述對(duì)象;分類器更新步驟,通過(guò)使用上述的在線學(xué)習(xí)方法,根據(jù)所述檢測(cè)結(jié)果更新所述一組對(duì)象分類器;以及后續(xù)的檢測(cè)和更新步驟,對(duì)于所述序列中的每一個(gè)后續(xù)的圖像,通過(guò)使用經(jīng)更新的一組對(duì)象分類器在所述后續(xù)的圖像中檢測(cè)所述對(duì)象并且隨后更新所述一組對(duì)象分類器。本發(fā)明的又一個(gè)方面提供了一種用于一組對(duì)象分類器的在線學(xué)習(xí)設(shè)備,其中所述一組對(duì)象分類器包含至少一個(gè)單類分類器和至少一個(gè)兩類分類器,所述設(shè)備包括:特征向量提取單元,被配置為從新添加的樣本中提取特征向量;單類分類器更新單元,被配置為基于所提取的特征向量以及所述至少一個(gè)兩類分類器的支持向量來(lái)更新所述至少一個(gè)單類分類器中的至少一個(gè);兩類分類器更新單元,被配置為基于所提取的特征向量以及由所述單類分類器更新單元已經(jīng)部分地或全部地更新的所述至少一個(gè)單類分類器的支持向量,來(lái)更新所述至少一個(gè)兩類分類器中的至少一個(gè)。本發(fā)明的還一個(gè)方面提供了一種用于通過(guò)使用已經(jīng)被確定為對(duì)象的至少一個(gè)正樣本在圖像序列中檢測(cè)所述對(duì)象的設(shè)備,所述設(shè)備包括:?jiǎn)晤惙诸惼鳟a(chǎn)生單元,被配置為根據(jù)所述至少一個(gè)正樣本,產(chǎn)生基于用于對(duì)所述對(duì)象進(jìn)行分類的支持向量的至少一個(gè)單類分類器;兩類分類器產(chǎn)生單元,被配置為基于所述圖像序列的第一圖像以及所述 單類分類器產(chǎn)生用于對(duì)所述對(duì)象進(jìn)行分類的至少一個(gè)兩類分類器;對(duì)象檢測(cè)單元,被配置為通過(guò)使用包括所述單類分類器和所述兩類分類器的一組對(duì)象分類器在所述序列中的每一個(gè)后續(xù)的圖像中檢測(cè)所述對(duì)象;以及如上所述的在線學(xué)習(xí)設(shè)備,被配置為根據(jù)由所述對(duì)象檢測(cè)單元獲得的檢測(cè)結(jié)果來(lái)更新所述一組對(duì)象分類器。在本發(fā)明的上述方面中,在在線學(xué)習(xí)階段期間將共享來(lái)自單類分類器和兩類分類器兩者的支持向量。因此,將通過(guò)共享支持向量而緊密地結(jié)合這兩個(gè)類型的分類器,使得通過(guò)利用該組分類器進(jìn)行的分類更準(zhǔn)確。此外,更多的特征向量將被用于該組分類器的在線學(xué)習(xí),因此共享支持向量非常適合于在線學(xué)習(xí)應(yīng)用。另外,使用該組分類器將使單獨(dú)的分類器避免漂移問(wèn)題并且因此將誤報(bào)警率保持在極低水平。此外,這組分類器不僅能夠?qū)?duì)象與類似的場(chǎng)景區(qū)分開(kāi),而且能夠避免來(lái)自我們還沒(méi)有發(fā)現(xiàn)的未知的負(fù)樣本的噪聲。鑒于上述內(nèi)容,利用根據(jù)本發(fā)明的在線學(xué)習(xí)和檢測(cè)方法以及設(shè)備,能夠在將檢出率保持在高水平的同時(shí)將誤報(bào)警率降低到極低水平,尤其對(duì)于持續(xù)且有限的場(chǎng)景如此。因此,本發(fā)明尤其適合于監(jiān)視應(yīng)用等。根據(jù)參照附圖的以下描述,本發(fā)明的其它特性特征和優(yōu)點(diǎn)將變得清晰。附圖說(shuō)明并入說(shuō)明書(shū)中并且構(gòu)成說(shuō)明書(shū)的一部分的附圖示出了本發(fā)明的實(shí)施例,并且與描述一起用于說(shuō)明本發(fā)明的原理。圖1是示出能夠?qū)嵤┍景l(fā)明的實(shí)施例的計(jì)算機(jī)系統(tǒng)的硬件配置的框圖。圖2是示出了根據(jù)本發(fā)明的第一實(shí)施例的用于一組對(duì)象分類器的在線學(xué)習(xí)方法的流程圖。圖3示例性地示出用于確定用于更新單類分類器的候選特征向 量的單類分類器的判決超球面(decisionhypersphere)。圖4是示出了根據(jù)本發(fā)明第一實(shí)施例的用于一組對(duì)象分類器的在線學(xué)習(xí)設(shè)備400的框圖。圖5是示出根據(jù)本發(fā)明第二實(shí)施例的用于在圖像序列中檢測(cè)對(duì)象的方法的流程圖。圖6是示出根據(jù)本發(fā)明第二實(shí)施例的用于在圖像序列中檢測(cè)對(duì)象的設(shè)備600的框圖。圖7示出根據(jù)本發(fā)明其它實(shí)施例的圖像拾取設(shè)備的一個(gè)示例。圖8示出將根據(jù)本發(fā)明實(shí)施例的使用一對(duì)分類器的檢測(cè)方法與僅僅使用單類分類器的現(xiàn)有技術(shù)檢測(cè)方法進(jìn)行比較而得到的比較結(jié)果。具體實(shí)施方式下面將參考附圖來(lái)詳細(xì)描述本發(fā)明的優(yōu)選的實(shí)施例。請(qǐng)注意,類似的參考數(shù)字和字母指的是圖中的類似的項(xiàng)目,因而一旦在一幅圖中定義了一個(gè)項(xiàng)目,就不需要在之后的圖中討論了。在本公開(kāi)中,術(shù)語(yǔ)“第一”、“第二”等僅僅被用來(lái)在元件或步驟之間進(jìn)行區(qū)分,而并不意圖表示時(shí)間順序、優(yōu)先級(jí)或重要性。(計(jì)算機(jī)系統(tǒng)的硬件配置)圖1是示出能夠?qū)嵤┍景l(fā)明的實(shí)施例的計(jì)算機(jī)系統(tǒng)1000的硬件配置的框圖。如圖1中所示,計(jì)算機(jī)系統(tǒng)包括計(jì)算機(jī)1110。計(jì)算機(jī)1110包括經(jīng)由系統(tǒng)總線1121連接的處理單元1120、系統(tǒng)存儲(chǔ)器1130、固定非易失性存儲(chǔ)器接口1140、可移動(dòng)非易失性存儲(chǔ)器接口1150、用戶輸入接口1160、網(wǎng)絡(luò)接口1170、視頻接口1190和輸出外圍接口1195。系統(tǒng)存儲(chǔ)器1130包括ROM(只讀存儲(chǔ)器)1131和RAM(隨機(jī)存取存儲(chǔ)器)1132。BIOS(基本輸入輸出系統(tǒng))1133駐留在ROM1131中。操作系統(tǒng)1134、應(yīng)用程序1135、其它程序模塊1136和某些程序 數(shù)據(jù)1137駐留在RAM1132中。諸如硬盤之類的固定非易失性存儲(chǔ)器1141連接到固定非易失性存儲(chǔ)器接口1140。固定非易失性存儲(chǔ)器1141例如可以存儲(chǔ)操作系統(tǒng)1144、應(yīng)用程序1145、其它程序模塊1146和某些程序數(shù)據(jù)1147。諸如軟盤驅(qū)動(dòng)器1151和CD-ROM驅(qū)動(dòng)器1155之類的可移動(dòng)非易失性存儲(chǔ)器連接到可移動(dòng)非易失性存儲(chǔ)器接口1150。例如,軟盤1152可以被插入到軟盤驅(qū)動(dòng)器1151中,以及CD(光盤)1156可以被插入到CD-ROM驅(qū)動(dòng)器1155中。諸如麥克風(fēng)1161和鍵盤1162之類的輸入設(shè)備被連接到用戶輸入接口1160。計(jì)算機(jī)1110可以通過(guò)網(wǎng)絡(luò)接口1170連接到遠(yuǎn)程計(jì)算機(jī)1180。例如,網(wǎng)絡(luò)接口1170可以經(jīng)由局域網(wǎng)1171連接到遠(yuǎn)程計(jì)算機(jī)1180。或者,網(wǎng)絡(luò)接口1170可以連接到調(diào)制解調(diào)器(調(diào)制器-解調(diào)器)1172,以及調(diào)制解調(diào)器1172經(jīng)由廣域網(wǎng)1173連接到遠(yuǎn)程計(jì)算機(jī)1180。遠(yuǎn)程計(jì)算機(jī)1180可以包括諸如硬盤之類的存儲(chǔ)器1181,其存儲(chǔ)遠(yuǎn)程應(yīng)用程序1185。視頻接口1190連接到監(jiān)視器1191。輸出外圍接口1195連接到打印機(jī)1196和揚(yáng)聲器1197。圖1所示的計(jì)算機(jī)系統(tǒng)僅僅是說(shuō)明性的并且決不意圖對(duì)本發(fā)明、其應(yīng)用或用途進(jìn)行任何限制。圖1所示的計(jì)算機(jī)系統(tǒng)可以被實(shí)施于任何實(shí)施例,可作為獨(dú)立計(jì)算機(jī),或者也可作為設(shè)備中的處理系統(tǒng),可以移除一個(gè)或更多個(gè)不必要的組件,也可以向其添加一個(gè)或更多個(gè)附加的組件。(第一實(shí)施例)圖2是示出了根據(jù)本發(fā)明的第一實(shí)施例的用于一組對(duì)象分類器的在線學(xué)習(xí)方法的流程圖,其中所述一組對(duì)象分類器包含至少一個(gè)單類分類器和至少一個(gè)兩類分類器。如圖2所示,在特征向量提取步驟210中,從新添加的樣本中提 取特征向量。此時(shí),該組對(duì)象分類器已經(jīng)基于用戶注冊(cè)對(duì)象圖像(一個(gè)或多個(gè))以及可選地先前檢測(cè)的圖像而被產(chǎn)生,并且將要基于作為新添加樣本的新圖像(例如,捕獲的視頻幀)來(lái)被在線更新。顯然,所提取的特征向量的類型與單類分類器和兩類分類器的支持向量的類型相同,使得這些特征向量能夠在單類分類器和兩類分類器之間被共享。然后,在單類分類器更新步驟220中,基于所提取的特征向量以及所述至少一個(gè)兩類分類器的支持向量來(lái)更新所述至少一個(gè)單類分類器中的至少一個(gè)。在一種實(shí)現(xiàn)方式中,所述單類分類器更新步驟220可以包括:對(duì)于所述至少一個(gè)單類分類器中的一個(gè)單類分類器,計(jì)算從這個(gè)單類分類器的所有支持向量的聚類中心(clusteringcentre)到所提取的特征向量和所述至少一個(gè)兩類分類器的所述支持向量中的每一個(gè)的各個(gè)距離;基于所述單類分類器的支持向量來(lái)設(shè)定閾值;從所提取的特征向量和所述至少一個(gè)兩類分類器的所述支持向量中選擇候選特征向量,其中所述候選特征向量中的每一個(gè)的計(jì)算距離都比所述閾值小;以及通過(guò)使用所述候選特征向量來(lái)更新所述單類分類器的支持向量。下面將詳細(xì)描述這樣的單類分類器更新方法的一個(gè)示例。本領(lǐng)域技術(shù)人員會(huì)理解,本發(fā)明不限于這個(gè)特定的示例,而是能夠使用任何適當(dāng)?shù)姆绞絹?lái)更新單類分類器。在該示例中,單類分類器是基于SVDD的單類分類器,其通過(guò)僅僅使用正樣本來(lái)訓(xùn)練,并且它旨在獲得具有最小體積的球形的邊界使得該球能夠包圍盡可能多的正樣本。單類分類器的支持向量組如下:SVs={(xi,αi)|i=1,2…Np},其中xi是支持向量并且αi是對(duì)應(yīng)的權(quán)重。對(duì)于所提取的特征向量以及所述至少一個(gè)兩類分類器的所述支持向量中的任何一個(gè)特征向量z,可以計(jì)算到這個(gè)單類分類器的所有支持向量的聚類中心的距離。用于從所提取的特征向量以及所述至少一個(gè)兩類分類器的所述支持向量中選擇候選特征向量的判決函數(shù)可以是:fone(z)=Rz2=K(z,z)-2Σxi∈SVsaiK(xi,z)+Σxi∈SVsaiajK(xi,xj)≤RT2---(1)]]>其中,Rz是從特征向量z到聚類中心的距離,RT是基于所述單類分類器的支持向量設(shè)定的閾值,并且K(·)是核函數(shù),例如,公式化為如下的直方圖交叉核(HistogramIntersectionKernel,HIK):K(T,Q)=Σi=1dmin(Ti,Qi)---(2)]]>其中,d是特征向量維度。這里,我們并不試圖找到支持向量的所述聚類中心在特征空間中的位置,我們只是想要確定從任何特征向量z到支持向量的所述聚類中心的距離函數(shù)。在該步驟中,將計(jì)算從所述中心到所提取的特征向量以及兩類分類器的支持向量的所有距離。然后,該方法將通過(guò)使用所述單類分類器的支持向量來(lái)設(shè)定閾值,即,上述RT。下面,假設(shè)參數(shù)P,即,指出將在單類分類器的判決超球面外的正樣本的比率的預(yù)設(shè)概率,通過(guò)使用Rmin和Rmax,產(chǎn)生判決超球面的半徑RT,即,上述閾值。參數(shù)P被定義如下:P=(fT(z)-fmin)/(fmax-fmin)(3)。根據(jù)公式(3),判決超球面的半徑RT可以被確定為:fT(z)=Pfmax+(1-P)fmin⇒πRT2=PπRmax2+(1-P)πPmin2⇒RT2=PRmax2+(1-P)Rmin2---(4)]]>其中Rmin和Rmax是能夠基于公式(1)得到的最小半徑和最大半徑。根據(jù)公式(4),對(duì)于特征向量z,估計(jì)適當(dāng)?shù)拈撝担磃T(z)。最終,對(duì)于所有支持向量Xi∈SVs估計(jì)fT:fT=Σi=1MαifT(Xi)---(5)]]>fT是閾值RT的平方。至于根據(jù)公式(1)的fone(z),K(z,z)將對(duì)于任何特征向量z是固定的,因?yàn)镵(·)是HIK核并且數(shù)據(jù)z已經(jīng)被規(guī)格化(normalize)。fmax(z)=Rmax2=K(z,z)+Σxi∈SVsΣxj∈SVsαiαjK(xi,xj)]]>fmin(z)=Rmin2=fmax-2max(Σxi∈SVsαiK(xi,z))---(6)]]>結(jié)合公式(4)-(6),能夠通過(guò)設(shè)定固定概率Pone來(lái)計(jì)算閾值RT。然后,對(duì)于所提取的特征向量以及所述兩類分類器的所述支持向量中的每一個(gè),將計(jì)算距離與設(shè)定的閾值進(jìn)行比較,并且當(dāng)時(shí),特征向量z被選為候選特征向量,所述候選特征向量被認(rèn)為是位于其半徑為RT的判決超球面內(nèi)的正樣本,如圖3所示。接下來(lái),通過(guò)使用所述候選特征向量來(lái)更新單類分類器的支持向量。這里能夠使用用于具有支持向量的單類分類器的任何更新方法。以下方法是優(yōu)選的:通過(guò)使用由LIBSVM實(shí)現(xiàn)的序列最小優(yōu)化(SequentialMinimalOptimization,SMO)方法,基于先前的支持向量和更新后的候選特征向量對(duì)單類分類器進(jìn)行再學(xué)習(xí)。SMO方法將較大的二次規(guī)劃(quadraticprogramming,QP)優(yōu)化問(wèn)題分解成一系列的最小的可能的QP問(wèn)題。解析地解出這些小的QP問(wèn)題,這避免了使用耗時(shí)的數(shù)值QP優(yōu)化作為內(nèi)循環(huán)。LIBSVM是用于SVM的庫(kù),其自2000年以來(lái)已經(jīng)被開(kāi)發(fā)。它是當(dāng)前使用最廣泛的SVM軟件。接下來(lái),在兩類分類器更新步驟230中,基于所提取的特征向量以及在所述步驟220中已經(jīng)部分地或全部地被更新的所述至少一個(gè)單類分類器的支持向量,來(lái)更新所述至少一個(gè)兩類分類器中的至少一個(gè)。在一種實(shí)現(xiàn)方式中,所述兩類分類器更新步驟230可以包括:對(duì)于所述至少一個(gè)兩類分類器中的一個(gè)兩類分類器,確定所提取的特征向量是正特征向量還是負(fù)特征向量;以及通過(guò)使用所有單類分類器的支持向量作為正特征向量以及使用確定結(jié)果來(lái)更新所述兩類分類器的支持向量。本領(lǐng)域技術(shù)人員會(huì)理解,本發(fā)明不限于這種實(shí)現(xiàn)方式,而是能夠使用任何適當(dāng)?shù)姆绞絹?lái)更新兩類分類器。具體地,單類分類器的支持向量被獲得作為正特征向量。并且所提取的特征向量可以由所述一組分類器或者僅僅單類分類器或者僅僅兩類分類器確定為正特征向量或者負(fù)特征向量。然后,通過(guò)使用所有正特征向量和負(fù)特征向量來(lái)更新兩類分類器的支持向量?;谡卣飨蛄亢拓?fù)特征向量?jī)烧?,可以通過(guò)采用基于直方圖交叉核的SVM來(lái)訓(xùn)練兩類分類器。對(duì)于未確定的樣本z,SVM的判決函數(shù)被示出為:fbinary(z)=Σxi∈SVsαiK(xi,z)+b>0---(7)]]>其中xi是支持向量,αi是對(duì)應(yīng)的權(quán)重因子,K(·)是核函數(shù),并且b是判決偏置(bias)。當(dāng)fbinary(z)>0時(shí),樣本z被分類為正的。此外,如公式(7)所示的SVM的判決函數(shù)能夠被規(guī)格化為概率輸出SVM。對(duì)于兩類SVM的概率輸出被公式化為:fbinary=1.0-11+exp(Af(z)+B)---(8)]]>其中在訓(xùn)練過(guò)程中使用5折交叉驗(yàn)證(5-foldcross-validation)來(lái)估計(jì)A和B。與單類分類器更新方法類似,在訓(xùn)練過(guò)程中的5折交叉驗(yàn)證期間,序列最小優(yōu)化(SMO)方法和LIBSVM能夠被用于更新兩類分類器。本領(lǐng)域技術(shù)人員會(huì)明白的是,任何已知的或者新的適當(dāng)?shù)姆椒軌虮挥糜诟聝深惙诸惼?。?qǐng)注意,在一些示例中,包含單類分類器和兩類分類器的所述一組分類器可以是級(jí)聯(lián)結(jié)構(gòu)(cascadestructure),其通過(guò)這兩個(gè)類型的分類器按合適順序進(jìn)行分類。但是所述一組分類器還可以具有加權(quán)累加結(jié)構(gòu),其通過(guò)所有分類器的加權(quán)累加的分?jǐn)?shù)來(lái)進(jìn)行分類。在所述一組分類器具有加權(quán)累加結(jié)構(gòu)的情況下,根據(jù)第一實(shí)施例的在線學(xué)習(xí)方法在所述兩類分類器更新步驟230之后還可以可選地包括更新單類分類器和兩類分類器的權(quán)重的權(quán)重更新步驟。在加權(quán)累加結(jié)構(gòu)中,兩種類型的分類器具有各自的規(guī)格化的概率 輸出,并且可以通過(guò)如下地對(duì)所有輸出進(jìn)行加權(quán)求和來(lái)計(jì)算最終分類分?jǐn)?shù)。fwin=w1one*f1one+w2one*f2one+…+wmone*fmone+w1binary*f1binary+w2binary*f2binary+…+wnbinary*fnbinary(9)其中w1one,…,wmone和w1binary,…,wnbinary是對(duì)于單類分類器和兩類分類器的各自的權(quán)重,其可以基于用戶體驗(yàn)或者非參數(shù)評(píng)估或者訓(xùn)練來(lái)得到。許多方法可以被用于更新權(quán)重w1one,…,wmone和w1binary,…,wnbinary。以下是優(yōu)選的有效的方法:1)收集包括所提取的特征向量以及所述單類分類器和兩類分類器的支持向量的所有正特征向量和負(fù)特征向量作為F={Xpos,Xneg},以及Xpos={(xi,fi)|i=1,2…Np},Xneg={(xi,fi)|i=1,2…Nn}其中Xpos是正特征向量集合,并且Xneg是負(fù)特征向量集合。2)調(diào)節(jié)權(quán)重w1one,…,wmone和w1binary,…,wnbinary,從而確保正特征向量和負(fù)特征向量的平均分?jǐn)?shù)之間的差值最大;w1one+...+wmone+w1binary+...wnbinary=1diffrence=fpositiveaverage-fnegativeaverage.]]>圖4是示出了根據(jù)本發(fā)明第一實(shí)施例的用于一組對(duì)象分類器的在線學(xué)習(xí)設(shè)備400的框圖,其中所述一組對(duì)象分類器包含至少一個(gè)單類分類器和至少一個(gè)兩類分類器。如圖4所示,用于一組對(duì)象分類器的在線學(xué)習(xí)設(shè)備400包括:特征向量提取單元410、單類分類器更新單元420和兩類分類器更新單元430。更具體地,特征向量提取單元410被配置為從新添加的樣本中提取特征向量。單類分類器更新單元420被配置為基于所提取的特征向量以及所述至少一個(gè)兩類分類器的支持向量來(lái)更新所述至少一個(gè)單類分類器中的至少一個(gè)。兩類分類器更新單元430被配置為基于所提取的特征向量以及 由所述單類分類器更新單元420已經(jīng)部分地或全部地更新的所述至少一個(gè)單類分類器的支持向量,來(lái)更新所述至少一個(gè)兩類分類器中的至少一個(gè)。設(shè)備400中的各個(gè)單元能夠被配置為執(zhí)行圖2中的流程圖中示出的各個(gè)步驟。在上述的用于包含單類分類器和兩類分類器的一組對(duì)象分類器的在線學(xué)習(xí)方法和設(shè)備中,在單類分類器和兩類分類器之間共享支持向量,并且因此能夠在將檢出率保持在高水平的同時(shí)將誤報(bào)警率降低到極低水平。(第二實(shí)施例)本實(shí)施例涉及將根據(jù)第一實(shí)施例的在線學(xué)習(xí)方法和設(shè)備應(yīng)用于在圖像序列中檢測(cè)用戶注冊(cè)對(duì)象。圖5是示出根據(jù)本發(fā)明第二實(shí)施例的通過(guò)使用已經(jīng)確定為對(duì)象的至少一個(gè)正樣本在圖像序列中檢測(cè)對(duì)象的方法的流程圖。如圖5所示,在單類分類器產(chǎn)生步驟510中,根據(jù)所述至少一個(gè)正樣本,產(chǎn)生基于用于對(duì)所述對(duì)象進(jìn)行分類的支持向量的至少一個(gè)單類分類器。本領(lǐng)域技術(shù)人員會(huì)明白的是,任何已知的或者新的適當(dāng)?shù)姆椒軌虮挥糜诋a(chǎn)生單類分類器。接下來(lái),在兩類分類器產(chǎn)生步驟520中,基于所述圖像序列的第一圖像以及所述單類分類器產(chǎn)生用于對(duì)所述對(duì)象進(jìn)行分類的至少一個(gè)兩類分類器。在一種實(shí)現(xiàn)方式中,所述兩類分類器產(chǎn)生步驟520可以包括:將所述第一圖像劃分成多個(gè)區(qū)域并且通過(guò)使用所述單類分類器確定所劃分的區(qū)域中的每一個(gè)是否為所述對(duì)象;收集所述單類分類器的支持向量以及從已經(jīng)被確定為所述對(duì)象的區(qū)域中提取的特征向量,作為正特征向量;收集從已經(jīng)被確定為非對(duì)象的區(qū)域中提取的特征向量,作為負(fù)特征向量;以及通過(guò)使用所收集的正特征向量和負(fù)特征向量訓(xùn)練 至少一個(gè)兩類分類器。下面將詳細(xì)描述這樣的兩類分類器產(chǎn)生方法的一個(gè)示例。本領(lǐng)域技術(shù)人員會(huì)理解,本發(fā)明不限于這個(gè)特定的示例,而是能夠使用任何適當(dāng)?shù)姆绞絹?lái)產(chǎn)生兩類分類器。在該示例中,首先,通過(guò)滑動(dòng)窗來(lái)將第一圖像劃分成多個(gè)窗圖像,然后對(duì)于每個(gè)窗,提取特征向量。然后,單類對(duì)象分類器基于所提取的特征向量來(lái)確定滑動(dòng)窗中的圖像是正的還是負(fù)的,即,確定該圖像是否為待檢測(cè)對(duì)象?;诜诸惤Y(jié)果,收集被分類為正的所有窗,使用非最大抑制(non-maximumsuppression),將正的窗進(jìn)行聚類并且合并以便利用包圍盒(boundingbox)wobj定位對(duì)象。然后,所有所述包圍盒wobj的特征向量被提取,并且被視為正特征向量。此外,單類分類器的所有支持向量也被收集作為正特征向量。在圖像中定位對(duì)象區(qū)域之后,與對(duì)象包圍盒的重合度(overlapratio)小于用戶特定的閾值thr的窗被視為負(fù)的,即:如果則窗ws被視為負(fù)的。所有的負(fù)的窗被收集,并且基于它們的分類分?jǐn)?shù)按升序排列,并且僅僅頭Nn個(gè)窗被選為難(hard)負(fù)樣本,其中Nn=Np,并且Np是通用的單類分類器的正支持向量的數(shù)量。從那些負(fù)樣本中提取特征向量并且將其添加到負(fù)特征向量集合Xneg中。然后,訓(xùn)練基于支持向量的兩類分類器,其可以將對(duì)象與當(dāng)前場(chǎng)景區(qū)分開(kāi)。序列最小優(yōu)化(SMO)方法和LIBSVM也可以被用于這種訓(xùn)練?;谡卣飨蛄亢拓?fù)特征向量(名為Xpos和Xneg)兩者,通過(guò)采用基于直方圖交叉核的SVM來(lái)訓(xùn)練兩類分類器,其將對(duì)象與背景分離。對(duì)于未確定的樣本z,SVM的判決函數(shù)被示出為:fbinary(z)=Σxi∈SVsαiK(xi,z)+b>0---(10)]]>其中xi是支持向量,αi是對(duì)應(yīng)的權(quán)重因子,K(·)是核函數(shù),并且b是判決偏置(bias)。當(dāng)fbinary(z)>0時(shí),樣本z被分類為正的。此外,如公式(10)所示的SVM的判決函數(shù)能夠被規(guī)格化為概率輸出SVM。對(duì)于兩類SVM的概率輸出被公式化為:fbinary=1.0-11+exp(Af(z)+B)---(11)]]>其中在訓(xùn)練過(guò)程中使用5折交叉驗(yàn)證來(lái)估計(jì)A和B。然后,在對(duì)象檢測(cè)步驟530中,通過(guò)使用包括所述單類分類器和所述兩類分類器的一組對(duì)象分類器在所述序列中的跟在第一圖像之后的第二圖像中檢測(cè)所述對(duì)象。在該檢測(cè)之后,該方法執(zhí)行分類器更新步驟540,在該步驟540中通過(guò)使用根據(jù)第一實(shí)施例的在線學(xué)習(xí)方法,根據(jù)所述檢測(cè)結(jié)果來(lái)更新所述一組對(duì)象分類器。然后,該方法返回到對(duì)象檢測(cè)步驟530,以用于通過(guò)使用更新后的對(duì)象分類器在該序列中的下一個(gè)圖像中檢測(cè)所述對(duì)象。對(duì)象檢測(cè)步驟530和分類器更新步驟540被重復(fù),直到該序列中的所有圖像都已經(jīng)被檢測(cè)完或者檢測(cè)結(jié)束。分類器更新步驟540采用根據(jù)第一實(shí)施例的在線學(xué)習(xí)方法,其之前已經(jīng)被詳細(xì)討論并且這里不會(huì)重復(fù)敘述。因此,我們下面將詳細(xì)討論對(duì)象檢測(cè)步驟530。在對(duì)象檢測(cè)方法的一種實(shí)現(xiàn)方式中,檢測(cè)所述對(duì)象可以包括:將所述圖像劃分成多個(gè)區(qū)域;通過(guò)使用所述一組對(duì)象分類器來(lái)對(duì)所劃分的區(qū)域中的每一個(gè)進(jìn)行分類并且從所述一組分類器得到對(duì)于所劃分的區(qū)域中的每一個(gè)的分類分?jǐn)?shù);以及根據(jù)所述分類分?jǐn)?shù)和預(yù)定義的閾值確定所劃分的區(qū)域中的每一個(gè)是所述對(duì)象還是非對(duì)象??商娲?,在另一種實(shí)現(xiàn)方式中,檢測(cè)所述對(duì)象可以包括:將所述圖像劃分成多個(gè)區(qū)域;通過(guò)使用所述單類分類器來(lái)對(duì)所劃分的區(qū)域中的每一個(gè)進(jìn)行分類并且從所述單類分類器得到對(duì)于所劃分的區(qū)域中的每一個(gè)的第一分類分?jǐn)?shù);通過(guò)使用兩類分類器來(lái)對(duì)已經(jīng)由所述單類分類器分類為正的區(qū)域進(jìn)行分類,從兩類分類器得到對(duì)于這些區(qū)域 的第二分類分?jǐn)?shù),并且通過(guò)對(duì)第一分類分?jǐn)?shù)和第二分類分?jǐn)?shù)進(jìn)行加權(quán)求和來(lái)計(jì)算最終分類分?jǐn)?shù);以及收集其最終分類分?jǐn)?shù)大于預(yù)定義的閾值的區(qū)域作為對(duì)象區(qū)域,并且收集其最終分類分?jǐn)?shù)不大于所述預(yù)定義的閾值的區(qū)域作為非對(duì)象區(qū)域。下面將詳細(xì)描述這樣的檢測(cè)方法的一個(gè)示例。本領(lǐng)域技術(shù)人員會(huì)理解,本發(fā)明不限于這個(gè)特定的示例,而是能夠使用任何適當(dāng)?shù)姆绞絹?lái)檢測(cè)對(duì)象。在該示例中,包括單類分類器和兩類分類器的該組分類器具有級(jí)聯(lián)結(jié)構(gòu)。這個(gè)結(jié)構(gòu)的第一級(jí)是單類分類器而第二級(jí)是兩類分類器。通過(guò)該組分類器在圖像中檢測(cè)對(duì)象并且收集正特征向量和負(fù)特征向量以用于接下來(lái)的更新(在線學(xué)習(xí))。具體的檢測(cè)過(guò)程如下。通過(guò)滑動(dòng)窗來(lái)將圖像劃分成多個(gè)樣本窗圖像,然后對(duì)于每個(gè)窗ws,提取特征向量xs。然后,該組分類器如下地對(duì)樣本圖像進(jìn)行分類:1)通過(guò)使用單類分類器對(duì)樣本特征向量xs進(jìn)行分類并且得到分類分?jǐn)?shù)2)如果由單類分類器將該樣本特征向量xs分類為正的,則通過(guò)使用兩類分類器來(lái)對(duì)其進(jìn)行分類并且得到分類分?jǐn)?shù)3)當(dāng)通過(guò)上述兩個(gè)分類器將樣本分類為對(duì)象區(qū)域時(shí),通過(guò)使用公式來(lái)得到最終分類分?jǐn)?shù)fs。在檢測(cè)期間,收集候選的正窗和負(fù)窗:Wpos={(wi,fi)|i=1,…,Np},Wneg={(wi,fi)|i=1,…,Nn},其中每一個(gè)關(guān)聯(lián)一個(gè)分類分?jǐn)?shù),其中Wpos是正窗集合,并且Wneg是負(fù)窗集合。正的候選者Wpos是已經(jīng)被該組分類器分類為正的那些樣本,即,其最終分類分?jǐn)?shù)大于預(yù)定義的閾值的那些樣本,而負(fù)的候選者Wneg是已經(jīng)被單類分類器分類為正的但是被兩類分類器分類為負(fù)的那些樣本,即,其最終分類分?jǐn)?shù)不大于預(yù)定義的閾值的那些樣本。圖6是示出根據(jù)本發(fā)明第二實(shí)施例的用于通過(guò)使用已經(jīng)確定為 對(duì)象的至少一個(gè)正樣本在圖像序列中檢測(cè)對(duì)象的設(shè)備600的框圖。如圖6所示,該設(shè)備600包括:?jiǎn)晤惙诸惼鳟a(chǎn)生單元610、兩類分類器產(chǎn)生單元620、對(duì)象檢測(cè)單元630、以及根據(jù)第一實(shí)施例的在線學(xué)習(xí)設(shè)備400。更具體地,單類分類器產(chǎn)生單元610被配置為根據(jù)所述至少一個(gè)正樣本,基于用于對(duì)所述對(duì)象進(jìn)行分類的支持向量產(chǎn)生至少一個(gè)單類分類器。兩類分類器產(chǎn)生單元620被配置為基于所述圖像序列的第一圖像以及所述單類分類器產(chǎn)生用于對(duì)所述對(duì)象進(jìn)行分類的至少一個(gè)兩類分類器。對(duì)象檢測(cè)單元630被配置為通過(guò)使用包括所述單類分類器和所述兩類分類器的一組對(duì)象分類器在所述序列中的每一個(gè)后續(xù)的圖像中檢測(cè)所述對(duì)象。根據(jù)第一實(shí)施例的在線學(xué)習(xí)設(shè)備400被配置為根據(jù)由所述對(duì)象檢測(cè)單元獲得的檢測(cè)結(jié)果來(lái)更新所述一組對(duì)象分類器。設(shè)備600中的各個(gè)單元能夠被配置為執(zhí)行圖5中的流程圖中示出的各個(gè)步驟。在上述的檢測(cè)方法和設(shè)備中,在單類分類器和兩類分類器之間共享支持向量,并且因此能夠在將檢出率保持在高水平的同時(shí)將誤報(bào)警率降低到極低水平。(其它實(shí)施例)上述的根據(jù)第一實(shí)施例的在線學(xué)習(xí)方法或者根據(jù)第二實(shí)施例的用于在圖像序列中檢測(cè)對(duì)象的方法可被用于許多應(yīng)用中。應(yīng)用之一是用于在圖像拾取設(shè)備中自動(dòng)地聚焦于用戶注冊(cè)對(duì)象。如圖7所示,圖像拾取設(shè)備700可以包括:光學(xué)系統(tǒng)710,被配置為拾取圖像或者視頻;以及根據(jù)第一實(shí)施例的在線學(xué)習(xí)設(shè)備400或者根據(jù)第二實(shí)施例的用于在視頻幀的序列中檢測(cè)對(duì)象的設(shè)備600。此外,圖像拾取設(shè)備700可以被包括在圖像處理設(shè)備中,該圖 像處理設(shè)備例如是照相機(jī)、移動(dòng)電話、臺(tái)式計(jì)算機(jī)、平板計(jì)算機(jī)或者膝上型計(jì)算機(jī)等。(通過(guò)本發(fā)明實(shí)現(xiàn)的技術(shù)效果的評(píng)估)示出了根據(jù)本發(fā)明的原理的用于檢測(cè)對(duì)象的方法與現(xiàn)有技術(shù)中的其它方法的測(cè)試比較的示例。注意,這里示出的示例僅僅是示例性的,用于示出本發(fā)明的有利技術(shù)效果,而不是限制性的。根據(jù)本發(fā)明的對(duì)象檢測(cè)方法被用在用戶注冊(cè)對(duì)象檢測(cè)(UROD)系統(tǒng)中。通過(guò)使用用戶提供的很少的樣本來(lái)訓(xùn)練用于特定對(duì)象的單類分類器;并且視頻序列的第一幀被用來(lái)構(gòu)造兩類分類器。這兩個(gè)分類器被組合以形成一組分類器,并且基于檢測(cè)結(jié)果被在線更新。我們將本發(fā)明的檢測(cè)方法的性能與僅僅使用單類分類器的現(xiàn)有技術(shù)的方法進(jìn)行比較。用于圖像區(qū)域描述的特征是顏色和局部三值模式(Localternarypattern,LTP)。評(píng)估準(zhǔn)則是PASCAL評(píng)估準(zhǔn)則,當(dāng)時(shí),檢測(cè)區(qū)域被視為正確的檢測(cè)區(qū)域。這里,T是0.5。召回率(recallrate),即檢出率,為虛檢率(FPPI)為其中錯(cuò)誤檢出的幀包括不具有對(duì)象但是被檢測(cè)為對(duì)象的幀。表1示出測(cè)試中的硬件和軟件配置。表1評(píng)估示例1圖8示出將根據(jù)本發(fā)明實(shí)施例的使用一對(duì)分類器的檢測(cè)方法與僅使用單類分類器的現(xiàn)有技術(shù)檢測(cè)方法進(jìn)行比較而得到的比較結(jié)果,即,ROC曲線。采用的數(shù)據(jù)集是全部由手持式照相機(jī)拍攝的20個(gè)視頻。待檢測(cè)對(duì)象是許多種動(dòng)物,諸如貓、狗等等。每一種動(dòng)物包括不同的外觀并且背景慢慢地改變。如圖8所示,與僅具有單類分類器的方法相比,根據(jù)本實(shí)施例的方法具有更好的性能(更高的檢出率和更低的FPPI)。評(píng)估示例2在該示例中,同樣,將根據(jù)本發(fā)明實(shí)施例的使用一對(duì)分類器的檢測(cè)方法與僅使用單類分類器的現(xiàn)有技術(shù)檢測(cè)方法進(jìn)行比較。采用的數(shù)據(jù)集是全部由手持式照相機(jī)拍攝的144個(gè)視頻。待檢測(cè)對(duì)象是28種動(dòng)物。在將檢出率保持在92.1%的情況下執(zhí)行FPPI的比較。FPPI被示出在表2中:表2如上述表所示,當(dāng)這兩種方法的檢出率相同時(shí),根據(jù)本發(fā)明的方法的FPPI僅為單類分類器方法的FPPI的約30%。從上面的比較結(jié)果可以看出,根據(jù)本發(fā)明的對(duì)象檢測(cè)方法能夠減少FPPI率(假警報(bào))。也就是說(shuō),單類分類器和兩類分類器的組合能更有效地將對(duì)象與周圍的場(chǎng)景區(qū)分開(kāi)。此外,根據(jù)本發(fā)明的對(duì)象檢測(cè)方法能夠改善檢出率。也就是說(shuō),根據(jù)本發(fā)明的在線學(xué)習(xí)將使得該 組分類器能夠適應(yīng)于對(duì)象的外觀變化??梢酝ㄟ^(guò)許多方式來(lái)實(shí)施本發(fā)明的方法和設(shè)備。例如,可以通過(guò)軟件、硬件、固件、或其任何組合來(lái)實(shí)施本發(fā)明的方法和設(shè)備。上述的方法步驟的次序僅是說(shuō)明性的,本發(fā)明的方法步驟不限于以上具體描述的次序,除非以其它方式明確說(shuō)明。此外,在一些實(shí)施例中,本發(fā)明還可以被實(shí)施為記錄在記錄介質(zhì)中的程序,其包括用于實(shí)現(xiàn)根據(jù)本發(fā)明的方法的機(jī)器可讀指令。因而,本發(fā)明還覆蓋存儲(chǔ)用于實(shí)現(xiàn)根據(jù)本發(fā)明的方法的程序的記錄介質(zhì)。雖然已通過(guò)示例詳細(xì)展示了本發(fā)明的一些具體實(shí)施例,但是本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,上述示例僅意圖是說(shuō)明性的而不限制本發(fā)明的范圍。本領(lǐng)域技術(shù)人員應(yīng)該理解,上述實(shí)施例可以在不脫離本發(fā)明的范圍和實(shí)質(zhì)的情況下被修改。本發(fā)明的范圍是通過(guò)所附的權(quán)利要求限定的。當(dāng)前第1頁(yè)1 2 3 
當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
丰原市| 枣庄市| 丹江口市| 花莲县| 盐城市| 和硕县| 都安| 泾阳县| 乌兰浩特市| 临安市| 临江市| 溆浦县| 玉龙| 湖北省| 肃宁县| 南岸区| 苏尼特左旗| 冕宁县| 稻城县| 桐庐县| 辛集市| 元氏县| 德江县| 漾濞| 龙州县| 红原县| 通榆县| 南京市| 杂多县| 西充县| 南安市| 广宗县| 手机| 博乐市| 万安县| 连南| 青神县| 安乡县| 方正县| 石家庄市| 定边县|