專利名稱:基于第二代曲線波變換的靜態(tài)人體檢測方法
技術(shù)領(lǐng)域:
本發(fā)明屬于模式識別技術(shù)領(lǐng)域,涉及人體檢測方法,可用于對圖像中的人體及其 它復(fù)雜目標(biāo)的分類與檢測。
背景技術(shù):
人體檢測在計算機視覺中有許多重要的應(yīng)用,如視頻監(jiān)控、智能汽車及智能交通、 機器人和高級人機交互等。然而,由于人體自身姿態(tài)的變化、衣服的多樣性和光照等因素的 影響,人體的外觀變化非常大,導(dǎo)致人體檢測成為一個非常困難的問題。目前,靜態(tài)圖像中人體檢測的方法主要有基于人體模型的方法、基于模板匹配的 方法和基于統(tǒng)計分類的方法。基于人體模型的方法有明確的模型,可以處理遮擋問題,并且 可以推斷出人體的姿態(tài)。缺點是模型的構(gòu)建比較難,求解也比較復(fù)雜?;谀0迤ヅ涞姆?法計算簡單,缺點是由于人體姿態(tài)的復(fù)雜性,很難構(gòu)造出足夠的模板以處理不同的姿態(tài)?;?于統(tǒng)計分類的方法通過機器學(xué)習(xí)從一系列訓(xùn)練數(shù)據(jù)中學(xué)習(xí)得到一個分類器,用該分類器來 表示人體,然后利用該分類器對輸入窗口進行分類及識別?;诮y(tǒng)計分類的方法的優(yōu)點是 比較魯棒,缺點是需要很多訓(xùn)練數(shù)據(jù),并且很難解決姿態(tài)和遮擋的問題?;诮y(tǒng)計分類的方法主要包括兩個步驟特征提取和分類器設(shè)計。其中所選特征 的表征能力將直接影響分類器的性能。目前所選的特征包括原始灰度特征空間、Haar小 波特征、形狀描述符特征、Gabor特征、有向梯度直方圖HOG特征和SIFT特征等。其中HOG 特征提取方法的提取速度快,檢測正確率也較高,由此,近年來得到了廣泛的應(yīng)用。如何進 一步提高檢測的正確率,成為該研究領(lǐng)域的核心問題之一。根據(jù)分類器的設(shè)計方法,現(xiàn)有的基于統(tǒng)計分類的方法可分為基于神經(jīng)網(wǎng)絡(luò)NN的 方法、基于支持向量機SVM的方法和基于AdaBoost的方法。AdaBoost是一種具有自適應(yīng)性 的Boosting算法,它通過建立多學(xué)習(xí)機組合使得弱學(xué)習(xí)機的性能得到提升,由于其獨有的 對學(xué)習(xí)機性能的自適應(yīng)和對過學(xué)習(xí)現(xiàn)象的免疫性,近年來引起了廣泛的關(guān)注。經(jīng)典的人體特征提取的方法是Dalal和Trigg提出的方向梯度直方圖HOG的方 法,他們的結(jié)果表明HOG方法較之前的方法在檢測正確率上有了很大的提高;另外一種方 法是edgelet方法,它利用一種稱作edgelet的邊緣方向特征作為描述子^dgelet就是檢 測出的邊緣上的一段直線或者曲線;粒度可調(diào)梯度分區(qū)GGP描述子融合了異質(zhì)特征,通過 粒度的概念表示出來。由于在背景中存在干擾邊緣時,HOG特征表現(xiàn)的比較差,存在把一些 背景中的特征判斷為人體特征的情況,因此檢測的虛警率較高。Candes和Donoho介紹了一種新的多尺度分析系統(tǒng)稱為曲線波變換。曲線波變換 是一個多尺度的金字塔,在每一個尺度有很多的方向和位置。曲線波能有效地表示圖像中 邊緣的不連續(xù)性。MohamedElAroussi等人已經(jīng)將曲線波變換的方法應(yīng)用到了人臉檢測中,提出了基 于塊的曲線波變換的人臉檢測方法,利用從曲線波變換的系數(shù)劃分的塊中提取的統(tǒng)計特征 作為特征向量進行人臉檢測,在ORL,YALE和FERET數(shù)據(jù)集上取得了好的檢測效果,但目前還沒有人將曲線波變換用于人體的檢測。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服上述HOG方法在存在嘈雜背景時虛警率高的問題,提出了 一種基于曲線波變換的邊緣與紋理聯(lián)合特征提取的人體檢測方法,以降低人體檢測的虛警 率,從而提高了檢測的正確率。實現(xiàn)本發(fā)明目的的技術(shù)原理是將上述的基于塊的曲線波變換的人臉檢測的方法 應(yīng)用到人體檢測中,并對上述的方法進行了改進,提出了基于曲線波變換的人體邊緣特征 的提取方法,并加入了提取自曲線波變換后的系數(shù)的紋理特征,提取人體訓(xùn)練樣本集的特 征,通過AdaBoost算法訓(xùn)練這些特征,得到分類器,并使用滑窗掃描的方法實現(xiàn)對靜態(tài)圖 像中人體的檢測。具體過程如下(1)在INRIA數(shù)據(jù)庫中,通過自舉操作獲取負(fù)樣本,這些負(fù)樣本與數(shù)據(jù)庫中其它的 正樣本一起構(gòu)成訓(xùn)練樣本集;(2)提取訓(xùn)練樣本集中每個訓(xùn)練樣本的基于曲線波變換的邊緣特征向量,并對提 取的邊緣特征向量進行了最優(yōu)統(tǒng)計量的選擇;(3)提取訓(xùn)練樣本集中每個訓(xùn)練樣本的基于曲線波變換的紋理特征向量,并將該 紋理特征向量與步驟(2)提取的邊緣特征向量級聯(lián),共同構(gòu)成人體特征向量;(4)計算訓(xùn)練樣本集中所有訓(xùn)練樣本的人體特征向量,組成樣本特征集,利用 AdaBoost分類算法對其進行分類訓(xùn)練,得到一個分類器;(5)輸入任意大小的被測圖像,采用滑窗掃描的方法對被測圖像進行掃描檢測,并 計算所有掃描窗口圖像的基于曲線波變換的人體特征向量,輸入到步驟(4)中所得到的分 類器中進行分類;(6)根據(jù)分類器輸出的分類結(jié)果,利用主窗口合并法,對所有分為人體的掃描窗口 進行組合,形成最終的人體檢測結(jié)果。本發(fā)明與現(xiàn)有的技術(shù)相比具有以下優(yōu)點1、由于本發(fā)明使用了兩種不同的特征提取方法進行負(fù)樣本的自舉操作,使得所獲 得的負(fù)樣本更具代表性,其構(gòu)成的樣本集訓(xùn)練的分類器具有更好的分類性能。2、由于本發(fā)明在提取基于曲線波變換的邊緣特征時使用的曲線波變換后系數(shù)的 統(tǒng)計特征,能夠提取緊湊并且有代表意義的邊緣特征,同時降低了特征的維數(shù),能夠更利于 分類器訓(xùn)練,與特征維數(shù)相近的其它特征相比,對應(yīng)分類器達到相同訓(xùn)練誤差所需的訓(xùn)練 時間大大縮短。3、由于本發(fā)明利用從曲線波變換后系數(shù)的共生矩陣提取的統(tǒng)計信息作為紋理特 征,擴展了邊緣特征,從而進一步提高了檢測的正確率,彌補了 HOG的對于背景嘈雜時檢測 的虛警率高的缺點。4、實驗結(jié)果表明,本發(fā)明中使用的基于曲線波變換的邊緣和紋理聯(lián)合特征能夠更 好的刻畫圖像,使得與傳統(tǒng)的HOG特征提取方法相比,在分類正確率上有明顯的提高,檢測 也更加準(zhǔn)確。
圖1是本發(fā)明的流程示意圖;圖2是本發(fā)明中使用的部分正樣本與負(fù)樣本圖像;圖3是本發(fā)明與傳統(tǒng)HOG特征提取方法以及基于曲線波變換的邊緣特征提取方法 在樣本訓(xùn)練時的誤差衰減對比圖;圖4是本發(fā)明與傳統(tǒng)HOG特征提取方法以及基于曲線波變換的邊緣特征提取方法 在對測試樣本進行分類時的接受者操作特性曲線ROC ;圖5是本發(fā)明的方法訓(xùn)練的分類器對測試樣本進行分類時的一些被錯誤分類的 測試樣本;圖6是本發(fā)明用于靜態(tài)圖像的人體檢測結(jié)果圖。
具體實施例方式本發(fā)明利用曲線波變換,提取曲線波變換系數(shù)的邊緣特征聯(lián)合紋理特征作為圖像 的特征,進行分類并檢測圖像中的人體。在提取基于曲線波變換的邊緣和紋理聯(lián)合特征后, 利用AdaBoost分類算法進行了樣本訓(xùn)練,并將分類結(jié)果與HOG特征進行了比較。詳細(xì)描述 如圖1、圖3和圖4。參照圖1,本發(fā)明的具體實現(xiàn)過程如下步驟一,在INRIA數(shù)據(jù)庫中,通過自舉操作來獲取負(fù)樣本,并與數(shù)據(jù)庫中其它的正 樣本一起構(gòu)成訓(xùn)練樣本集。 本發(fā)明使用的數(shù)據(jù)庫來自INRIA人體數(shù)據(jù)庫,下載地址為http //pascal, inrialpes. fr/data/human/0由于該數(shù)據(jù)庫沒有提供足夠的負(fù)樣本,所以需要以該數(shù)據(jù)庫 為基礎(chǔ),通過負(fù)樣本的自舉操作來獲取負(fù)樣本。本發(fā)明為了使訓(xùn)練樣本更具有代表性,在特征提取時分別使用了 HOG特征及基于 曲線波變換的邊緣和紋理聯(lián)合特征這兩種特征,進行負(fù)樣本的自舉操作,可得到兩個負(fù)樣 本集;然后取其交集作為最終的負(fù)樣本集;最后由這個負(fù)樣本集加上INRIA數(shù)據(jù)庫中的正 樣本集,得到最終的訓(xùn)練樣本集,共有6246個樣本,如圖2所示,其中圖2 (a)為部分正樣 本,圖2(b)為部分負(fù)樣本;將其中的2416個正樣本與1877個負(fù)樣本作為訓(xùn)練集,1132個 正樣本與821個負(fù)樣本作為測試集,樣本的大小均為64X 128像素。所述負(fù)樣本的自舉操作過程如下(1. 1)先從INRIA數(shù)據(jù)庫中任取一小部分正樣本與負(fù)樣本,進行特征提取,訓(xùn)練初 始分類器;(1.2)使用這個初始分類器,檢測數(shù)據(jù)庫中的其余非人體圖像,對這些非人體圖 像,在錯分為正樣本的掃描窗口圖像中隨機挑選一部分與當(dāng)前的負(fù)樣本組成新的負(fù)樣本 集,使用隨機挑選能夠避免混入大量特征相似的樣本圖像;(1. 3)重復(fù)(1. 1)-(1. 2)的特征提取、訓(xùn)練分類器、檢測非人體圖像及組成新的負(fù) 樣本集這一過程直至收集到最終的負(fù)樣本。步驟二,利用曲線波變換,計算所有訓(xùn)練樣本的基于曲線波變換的邊緣特征向量, 并對提取的邊緣特征向量進行最優(yōu)統(tǒng)計量的選擇;(2. 1)對每個訓(xùn)練樣本做快速離散曲線波變換,曲線波變換的參數(shù)設(shè)置為實值曲
6線波變換;且尺度數(shù)為3層;次粗糙層具有8個方向子帶;最精細(xì)層為曲線波系數(shù),具有16 個方向子帶;(2. 2)對于變換后的系數(shù),首先將次粗糙層和最精細(xì)層中具有相同大小的子帶系 數(shù)矩陣進行拼接,然后對每一層的系數(shù)矩陣按照8X8系數(shù)大小進行二進刨分,得到曲線波 塊,剖分過程中塊之間沒有重疊;(2. 3)在各個塊中提取能量、熵、標(biāo)準(zhǔn)差、均值、最大值、最小值和對比度這幾個統(tǒng) 計量,并將不同分塊所得到的統(tǒng)計量進行聯(lián)結(jié)得到圖像的初始邊緣特征向量;并對初始邊 緣特征向量進行了最優(yōu)統(tǒng)計量的選擇;(2. 4)計算所有訓(xùn)練樣本的初始邊緣特征向量,得到訓(xùn)練樣本集的初始邊緣特征 向量,放入到AdaBoost算法中進行訓(xùn)練分類器,由于特征被選中的概率與特征的表征能力 成正比,所以統(tǒng)計訓(xùn)練AdaBoost分類器時,用每種統(tǒng)計量被選中的次數(shù)對步驟(2.3)中的 統(tǒng)計量進行篩選,就能夠獲得最優(yōu)的統(tǒng)計量。最優(yōu)統(tǒng)計量選擇的實驗結(jié)果如表1所示表1最優(yōu)統(tǒng)計量選擇實驗結(jié)果
C能量熵標(biāo)準(zhǔn)節(jié)均值最大值.最小值對H:-1:5017913251:100I21212131:100638iy3.25 .45其中,C為分類器訓(xùn)練輪數(shù),本發(fā)明根據(jù)統(tǒng)計量選擇實驗,優(yōu)先選取了如下幾個統(tǒng)計量作為最優(yōu)統(tǒng)計量能量e=Σ</,熵/exl°g(c5/e),對比度im,標(biāo)準(zhǔn)差
IJ',Ji,j
- )2,最大值maxh.P,其中,Ciij為各個曲線波塊中以(i,j)為坐標(biāo)的系
Uj 丄、Ui ‘
數(shù),N為各個曲線波塊中所含元素的個數(shù);(2. 5)將訓(xùn)練樣本的不同曲線波塊的最優(yōu)統(tǒng)計量進行聯(lián)結(jié),形成一個特征向量,即 邊緣特征向量。步驟三,提取訓(xùn)練樣本集中每個訓(xùn)練樣本的基于曲線波變換的紋理特征向量,并 將該紋理特征向量與步驟二提取的邊緣特征向量級聯(lián),共同構(gòu)成人體特征向量。(3. 1)對于變換后的最粗糙層的子帶系數(shù)采取1/2重疊的方式用8*8的塊進行剖分;(3. 2)對每一個8X8大小的系數(shù)小塊計算其共生矩陣,該共生矩陣的量化級數(shù)為 16 ;(3.3)對于每個8X8大小的系數(shù)小塊的共生矩陣,計算其角二階矩、熵、對比度、 相關(guān)性、均值和和方差和這六項統(tǒng)計量,即
G-I G-I角二階矩ΣΣ彡(D)2; i=0 ;=0
G-I G-I熵-ΣΣ PO, J) loS P(i, J');
i=0 j=0對比度:|>{11如,/>}’其中"=|丨-外其中η = i"j|.
/ =ο I 7=ο ;=οJ
7
相關(guān)性力—明
^ ,
G-I G-IG-I G-I其中μχ,yy,σχ,Oy 分另Ij 定義為Α^Σ Χ^) ’ ^ = Σ^'Σ^Ο'' ,
/=0 ;=0J=O Z=O
G-IG-IG-IG-I
^2=Σ('-Μ,)2Σρ(υ).σ^=Z(J-My)2Zp(^J)-
i=0J=OJ=Oi=0
G G均值和藝極”⑷,其中:A”W= ggKW = 2,3,...,2G.
k=2'+J=A
2GIG方差和UkKWP4k、·
k=2 k=2其中,i表示塊的系數(shù)共生矩陣中元素的行數(shù),j表示塊的系數(shù)共生矩陣中元素的 列數(shù),X>’,y)表示塊的系數(shù)共生矩陣的第(i,j)個元素,G代表曲線波變換的最粗糙層子帶 系數(shù)剖分子塊的共生矩陣的量化級數(shù);(3. 4)將不同塊的系數(shù)的共生矩陣的統(tǒng)計量進行聯(lián)結(jié)得到圖像的紋理特征向量;(3. 5)將圖像的紋理特征向量和步驟二所得的邊緣特征向量進行級聯(lián)作為人體的 特征向量。步驟四,計算訓(xùn)練樣本集中所有訓(xùn)練樣本的人體特征向量,組成訓(xùn)練樣本特征集, 利用AdaBoost分類算法對其進行分類訓(xùn)練,得到一個分類器;(4. 1)分別按照步驟二和步驟三的方法提取訓(xùn)練樣本集中每個樣本的邊緣特征向 量和紋理特征向量,并將提取的每個訓(xùn)練樣本的邊緣特征向量和紋理特征向量進行級聯(lián), 得到每個訓(xùn)練樣本的人體特征向量;(4. 2)假設(shè)人體特征向量為一個M維的向量,訓(xùn)練樣本集中訓(xùn)練樣本的個數(shù)為N, 則對訓(xùn)練樣本集提取的特征向量將形成一個NXM維的矩陣,作為AdaBoost算法的輸入,訓(xùn) 練出一個分類器。所述AdaBoost是一種具有自適應(yīng)性的Boosting算法,它通過建立多學(xué)習(xí)機組合 使得弱學(xué)習(xí)機的性能得到提升,具有自適應(yīng)學(xué)習(xí)機性能并對過學(xué)習(xí)現(xiàn)象免疫。在Adaboost算法中,使用每個樣本的權(quán)重值來表示該樣本被錯分的大小。在每一 輪的權(quán)重更新過程中,被錯分樣本的權(quán)重會變大,如果一個樣本被錯分了很多次,那么這個 樣本的權(quán)重就越來越大。步驟五,輸入任意大小的被測圖像,采用滑窗掃描的方法對被測圖像進行掃描檢 測,并計算所有掃描窗口圖像的基于曲線波變換的人體特征向量,具體實現(xiàn)步驟如下(5.1)輸入任意大小的被測圖像,將其按縮放比為
的比例進行縮放;(5. 2)將按所述比例放縮后的被測圖像左上角的一個樣本大小的區(qū)域作為第一個 掃描窗口,每向右平移8個像素或向下平移8個像素作為一個新的掃描窗口,由此得到一組 掃描窗口 ;(5. 3)對掃描窗口中的圖像部分進行曲線波變換,對于曲線波變換的系數(shù)矩陣,經(jīng) 過系數(shù)矩陣塊拼接后,對每一尺度上的系數(shù)矩陣分別進行8X8的二進刨分,計算每個曲線 波小塊上的能量、熵、對比度、標(biāo)準(zhǔn)差及最大值這幾類統(tǒng)計量,并將不同塊的統(tǒng)計量進行聯(lián)結(jié)得到最后的掃描窗口圖像的邊緣特征向量;(5. 4)對曲線波變換的系數(shù)矩陣最粗糙層的系數(shù)采用1/2的重疊的方式用8*8的 小塊進行剖分;計算每個小塊的角二階矩、熵、對比度、相關(guān)性、均值和和方差和這幾個統(tǒng)計 量,并將不同小塊的統(tǒng)計量進行聯(lián)結(jié)得到掃描窗口圖像的紋理特征向量;(5. 5)將掃描窗口圖像的邊緣特征向量和紋理特征向量進行級聯(lián)得到最終掃描窗 口圖像的特征向量;(5. 6)將所有掃描窗口的特征向量輸入到步驟四所得到的分類器中進行分類,得 到一組判定結(jié)果。分類器將判定所有掃描窗口中的圖像是否是人體。每個掃描窗口會得到一個判定 分?jǐn)?shù),若該判定分?jǐn)?shù)大于0表示該掃描窗口為人體窗口,否則為非人體窗口,將被測圖像的 縮放比、所有掃描窗口圖像的位置及其所得的分類器分?jǐn)?shù)作為分類器輸出的分類結(jié)果。步驟六,根據(jù)分類器輸出的分類結(jié)果,利用主窗口合并法,對所有分為人體的掃描 窗口進行組合,形成最終的人體檢測結(jié)果,具體步驟如下(6. 1)根據(jù)分類器輸出的掃描窗口圖像的分?jǐn)?shù)值,判斷被測圖像中是否包含人體, 若分類器輸出的掃描窗口沒有人體窗口,則被測圖像中不包含人體,否則,從所有的人體窗 口中,找出其分類器分?jǐn)?shù)最高的作為主窗口 ;(6. 2)對主窗口與其他人體窗口進行組合判定,當(dāng)其他人體窗口處于主窗口周圍 且重疊小于1/2時判為不組合,否則進行組合;(6. 3)將主窗口與所有需要組合的人體窗口的邊界均值作為一個檢測結(jié)果,本發(fā) 明,在求邊界均值時,將人體窗口的分類器分?jǐn)?shù)作為邊界的加權(quán)值分類器分?jǐn)?shù)越大的,其 邊界加權(quán)越大,對最終的檢測結(jié)果影響越大;分類器分?jǐn)?shù)越小的,其邊界加權(quán)越小,對最終 的檢測結(jié)果影響也越小,這樣能使人體的檢測位置更加準(zhǔn)確;(6. 4)刪除主窗口及所有參與組合的人體窗口 ;(6. 5)若還有剩余的人體窗口,則再找出其中分類器分?jǐn)?shù)最高的作為主窗口,并重 復(fù)(2)-(4)的操作;(6. 6)在被測人體圖像上標(biāo)出所有檢測結(jié)果,作為該被測圖像最終的人體檢測結(jié) 果,一般采用矩形框來表示檢測結(jié)果,被檢測出的人體處于矩形框內(nèi)。本發(fā)明的效果可通過以下仿真進一步說明1.仿真內(nèi)容采用本發(fā)明所提出的基于曲線波變換的特征提取方法和目前廣泛使用的HOG特 征提取方法進行仿真對比實驗。其中的正樣本集取自INRIA數(shù)據(jù)庫,負(fù)樣本集以該數(shù)據(jù)庫 為基礎(chǔ),通過負(fù)樣本自舉操作得到,最后得到的樣本集共有6246個樣本,其中2416個正樣 本與1877個負(fù)樣本作為訓(xùn)練集,1132個正樣本與821個負(fù)樣本作為測試集,樣本大小均為 64X128像素。圖2給出了其中的部分樣本圖像,其中圖2(a)為部分正樣本,圖2(b)為部 分負(fù)樣本。針對每種特征提取方法,先提取訓(xùn)練集的特征,再使用AdaBoost算法進行分類訓(xùn) 練,得到一個分類器,然后使用該分類器對測試集進行分類測試,最后輸入任意被測圖像, 檢測是否包含人體,如果包含人體則要檢測出人體的位置。其中被測圖像大小為480X640 像素或640*480像素大小,掃描窗口均為64X128像素,縮放因子取
。掃描圖像時,使用濃密掃描,X方向平移8個像素,Y方向平移8個像素。首先 針對縮放尺度,掃描整幅圖像,然后從中提取所有掃描窗口圖像上的特征向量,進行分類識 別,最后將分為人體的窗口組合成檢測結(jié)果,并在原被測圖像上表示出來,其中窗口組合采 用的是主窗口合并的方法,硬件平臺為Jntel Core2 Duo CPU E6550 i 2. 33GHZ、2GB RAM, 軟件平臺為MATLAB 7.2。2.仿真結(jié)果及分析圖3給出了本發(fā)明和傳統(tǒng)HOG特征提取方法在樣本訓(xùn)練時的誤差衰減對比圖。其 中C為訓(xùn)練輪數(shù),Error為訓(xùn)練誤差。從圖3中可以看出,采用基于曲線波變換的邊緣和紋 理聯(lián)合特征在訓(xùn)練時的誤差要始終小于使用HOG特征和只采用基于曲線波變換的邊緣特 征訓(xùn)練時的誤差。可見,使用基于曲線波變換的邊緣和紋理聯(lián)合特征更利于進行分類器訓(xùn) 練,對應(yīng)分類器達到相同訓(xùn)練誤差所需的訓(xùn)練時間大大縮短。表2給出了本發(fā)明與傳統(tǒng)HOG以及只采用基于曲線波變換的邊緣特征提取方法在 對測試樣本進行分類時的性能對比結(jié)果。圖4給出了分別用三種方法訓(xùn)練的分類器對測試樣本進行分類的接受者操作特 性曲線R0C。從圖4中可以看出基于曲線波變換的邊緣特征方法較之前的HOG方法在相同 虛警率的情況下檢出率有了一定的提高,而本發(fā)明的方法,即加入紋理信息之后,檢出率又 有了一定的提高,體現(xiàn)了它在人體檢測上的優(yōu)勢。圖5給出了一些被錯檢的圖像,其中圖5(a)是被錯檢成負(fù)樣本的正樣本,是由于 遮擋、光照的變化和姿態(tài)的變化等原因造成的,圖5(b)是被錯檢成正樣本的負(fù)樣本,即虛 警的情況,由于一些圖像的輪廓或紋理特征與人體有些相似。表2.分類結(jié)果對比
%從表2中100輪的訓(xùn)練誤差就能看出,使用本發(fā)明的特征提取方法,更利于進行分 類器訓(xùn)練。同時,對比相同訓(xùn)練誤差下不同分類器對測試集的分類結(jié)果可以看出,本發(fā)明的 特征提取方法相比HOG特征提取方法,在分類正確率上有了較大的提高,虛警率相對于HOG 方法也有一定的降低。表2中,最后一列為每個樣本特征提取的平均時間,在提取每幅圖像 的特征所用時間上比HOG方法稍長一些,由于要對圖像進行曲線波變換,并提取一些統(tǒng)計 量。圖6給出了本發(fā)明的方法對于某些人體圖像的檢測結(jié)果。其中圖6(a)為對掃描 窗口圖像分類識別的結(jié)果,圖6(b)為對圖像6(a)中的被判定為人體的掃描窗口進行組合的最終人體檢測結(jié)果,圖6 (C)為另一幅圖像的檢測結(jié)果。從圖6中可以看出,使用本發(fā)明 的基于曲線波變換的邊緣和紋理聯(lián)合特征提取方法,能夠準(zhǔn)確的從被測人體圖像中檢測出 人體,尤其在降低虛警率上有了很大的提高。 實驗表明,使用HOG特征提取方法及本發(fā)明的基于曲線波變換的邊緣和紋理聯(lián)合 特征提取方法,均能較準(zhǔn)確的從被測人體圖像中檢測出人體。但本發(fā)明的特征提取方法具 有更高的分類正確率,克服了 HOG特征提取方法所存在的檢測的虛警率高的缺點,提高了 檢測的正確率,非常適合于靜態(tài)圖像的人體檢測。
權(quán)利要求
一種基于第二代曲線波變換的靜態(tài)人體檢測方法,包括如下過程(1)在INRIA數(shù)據(jù)庫中,通過自舉操作獲取負(fù)樣本,這些負(fù)樣本與數(shù)據(jù)庫中其它的正樣本一起構(gòu)成訓(xùn)練樣本集;(2)提取訓(xùn)練樣本集中每個訓(xùn)練樣本的基于曲線波變換的邊緣特征向量,并對提取的邊緣特征向量進行了最優(yōu)統(tǒng)計量的選擇;(3)提取訓(xùn)練樣本集中每個訓(xùn)練樣本的基于曲線波變換的紋理特征向量,并將該紋理特征向量與步驟(2)提取的邊緣特征向量級聯(lián),共同構(gòu)成人體特征向量;(4)計算訓(xùn)練樣本集中所有訓(xùn)練樣本的人體特征向量,組成樣本特征集,利用AdaBoost分類算法對其進行分類訓(xùn)練,得到一個分類器;(5)輸入任意大小的被測圖像,采用滑窗掃描的方法對被測圖像進行掃描檢測,并計算所有掃描窗口圖像的基于曲線波變換的人體特征向量,輸入到步驟(4)中所得到的分類器中進行分類;(6)根據(jù)分類器輸出的分類結(jié)果,利用主窗口合并法,對所有分為人體的掃描窗口進行組合,形成最終的人體檢測結(jié)果。
2.根據(jù)權(quán)利要求1所述的人體檢測方法,其中步驟(1)所述的在INRIA數(shù)據(jù)庫中,通過 自舉操作獲取負(fù)樣本,按如下步驟進行(2a)先從INRIA數(shù)據(jù)庫中任取一部分正樣本與負(fù)樣本;(2b)分別使用HOG特征和基于曲線波變換的人體特征提取方法對正負(fù)樣本進行特征 提取,并使用AdaBoost算法進行分類訓(xùn)練,得到兩個初始分類器;(2c)分別使用這兩個初始分類器,測試INRIA數(shù)據(jù)庫中的其余非人體圖像,對于這些 非人體圖像,在被錯分為人體圖像的掃描窗口圖像中隨機挑選一部分圖像與當(dāng)前負(fù)樣本組 成新的負(fù)樣本集;(2d)重復(fù)(2b-2c),從所得的負(fù)樣本中去除重復(fù)的負(fù)樣本,得到最終的負(fù)樣本集。
3.根據(jù)權(quán)利要求1所述的人體檢測方法,其中步驟(2)所述的提取訓(xùn)練樣本集中每個 訓(xùn)練樣本的基于曲線波變換的邊緣特征向量,并對提取的邊緣特征向量進行了最優(yōu)統(tǒng)計量 的選擇,按如下步驟進行(3a)對每個訓(xùn)練樣本做快速離散曲線波變換,曲線波變換的參數(shù)設(shè)置為實值曲線波變 換,且尺度數(shù)為3層,次粗糙層具有8個方向子帶,最精細(xì)層為曲線波系數(shù);(3b)將次粗糙層和最精細(xì)層上大小相同的子帶系數(shù)矩陣進行拼接形成一個大的系數(shù) 矩陣,并對每一個尺度的系數(shù)矩陣進行8 X 8像素的剖分,將每個8 X 8像素的小塊作為一個 曲線波塊;(3c)計算每個曲線波塊中系數(shù)的能量、熵、標(biāo)準(zhǔn)差、均值、最大值、最小值和對比度這幾 個統(tǒng)計量,并將每個曲線波塊的統(tǒng)計量進行級聯(lián),得到初始的邊緣特征向量;提取所有訓(xùn)練 樣本的初始邊緣特征,得到一個樣本特征集,并用AdaBoost算法進行分類訓(xùn)練;(3d)統(tǒng)計訓(xùn)練AdaBoost分類器時每種統(tǒng)計量被選中的次數(shù),對(3c)中的統(tǒng)計量中進 行篩選,將被選中的次數(shù)較多的統(tǒng)計量作為最優(yōu)的統(tǒng)計特征量為能量、熵、對比度、標(biāo)準(zhǔn)差 和最大值;(3e)將所有的曲線波塊中系數(shù)的最優(yōu)統(tǒng)計量進行聯(lián)結(jié),形成一個特征向量,即邊緣特 征向量。
4.根據(jù)權(quán)利要求1所述的人體檢測方法,其中步驟(3)所述的提取訓(xùn)練樣本集中每個 訓(xùn)練樣本的基于曲線波變換的紋理特征向量,按如下步驟進行(4a)對每個訓(xùn)練樣本曲線波變換后的最粗糙層的系數(shù)矩陣采用1/2重疊的方法進行 8X8系數(shù)大小的剖分,并對每一個8X8大小的系數(shù)小塊計算其共生矩陣,該共生矩陣的量 化級數(shù)為16 ;(4b)對于每個8X8大小的系數(shù)小塊的共生矩陣,計算其角二階矩、熵、對比度、相關(guān) 性、均值和和方差和這六項統(tǒng)計量,將所有8X8大小的系數(shù)小塊的共生矩陣的統(tǒng)計量進行 聯(lián)結(jié),形成一個特征向量,即紋理特征向量。
5.根據(jù)權(quán)利要求1所述的人體檢測方法,其中步驟(4)所述的計算訓(xùn)練樣本集中所 有訓(xùn)練樣本的人體特征向量,組成樣本特征集,是利用AdaBoost分類算法對其進行分類訓(xùn) 練,具體步驟如下;(5a)將提取的每個訓(xùn)練樣本的邊緣特征向量和紋理特征向量進行級聯(lián),得到每個訓(xùn)練 樣本的人體特征向量;(5b)計算訓(xùn)練樣本集中每一個訓(xùn)練樣本的人體特征向量,假設(shè)人體特征向量為一個M 維的向量,訓(xùn)練樣本集中訓(xùn)練樣本的個數(shù)為N,則所有的訓(xùn)練樣本提取的特征向量將形成一 個NXM維的矩陣,作為AdaBoost算法的輸入,訓(xùn)練出一個分類器。
6.根據(jù)權(quán)利要求1所述的人體檢測方法,其中步驟(5)所述的采用滑窗掃描的方法對 被測圖像進行掃描檢測,按如下步驟進行(6a)輸入任意大小的被測圖像,將其按縮放比為
的比例 縮放;(6b)將縮放后的被測圖像左上角的與一個樣本等大小的區(qū)域作為第一個掃描窗口圖 像,每向右平移8個像素或向下平移8個像素作為一個新的掃描窗口,得到一組掃描窗口 ;(6c)對每個掃描窗口部分的圖像分別利用步驟(2)和步驟(3)的方法計算其邊緣特征 向量和紋理特征向量;(6d)將掃描窗口部分圖像提取的邊緣特征向量和紋理特征向量進行級聯(lián)得到最終掃 描窗口圖像的特征向量,并用步驟(4)所得到的分類器進行人體與非人體的判斷。
全文摘要
本發(fā)明提出了一種基于第二代曲線波變換的靜態(tài)人體檢測方法,主要用于解決現(xiàn)有人體檢測技術(shù)的檢測虛警率高的問題,其檢測過程為通過負(fù)樣本的自舉操作獲取負(fù)樣本,并與數(shù)據(jù)庫中其它的正樣本一起構(gòu)成訓(xùn)練樣本集;計算所有訓(xùn)練樣本的基于曲線波變換的特征向量組成一個訓(xùn)練樣本特征集;利用AdaBoost算法,對樣本特征集進行分類訓(xùn)練,得到一個分類器;輸入任意大小的被測圖像,計算被測圖像中所有掃描窗口圖像的基于曲線波變換的特征向量;將所有掃描窗口圖像的基于曲線波變換的特征向量輸入到之前所得的分類器進行分類;根據(jù)分類結(jié)果,利用主窗口合并法,對所有分為人體的掃描窗口進行組合,形成最終的人體檢測結(jié)果。本發(fā)明具有檢測正確率高、同時虛警率低的優(yōu)點,可用于對圖像中人體的分類與檢測。
文檔編號G06K9/62GK101930549SQ20101025956
公開日2010年12月29日 申請日期2010年8月20日 優(yōu)先權(quán)日2010年8月20日
發(fā)明者吳建設(shè), 尚榮華, 李陽陽, 焦李成, 王爽, 范友健, 陳志超, 韓紅 申請人:西安電子科技大學(xué)