專(zhuān)利名稱(chēng):基于GentleBoost機(jī)器學(xué)習(xí)的人眼十字定位法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及模式識(shí)別技術(shù)領(lǐng)域,具體是基于GentleBoost機(jī)器學(xué)習(xí)的人眼十字定位法。
背景技術(shù):
人眼定位是指在一幅包含了人臉的圖像中,自動(dòng)對(duì)人眼進(jìn)行檢測(cè),給出左眼和右眼中心位置的坐標(biāo)。精確的人眼定位是進(jìn)行人臉識(shí)別的一個(gè)關(guān)鍵步驟,人眼定位的精確度直接影響到人臉識(shí)別的準(zhǔn)確度。目前,現(xiàn)有的關(guān)于人眼定位的方法大多是基于自頂向下逐級(jí)精化的搜索方法,即首先通過(guò)機(jī)器學(xué)習(xí)的手段(如Adaboost算法,支撐向量機(jī)等等)獲得人臉和人眼的分類(lèi)器,然后對(duì)包含了人臉的圖像進(jìn)行逐級(jí)精化的搜索,先找出圖像中存在人臉的區(qū)域,再在存在人臉的區(qū)域中進(jìn)行更細(xì)粒度的搜索,從而確定人眼的精確位置?;贏daBoost機(jī)器學(xué)習(xí)算法的分類(lèi)器訓(xùn)練方法是目前人眼檢測(cè)中訓(xùn)練分類(lèi)器的常用方法。Adaboost機(jī)器學(xué)習(xí)算法是解決二類(lèi)劃分問(wèn)題(如確定一幅圖片是否是人臉圖片)的有效方法,該方法依據(jù)給定的樣本集合(包括正樣本和負(fù)樣本)對(duì)該類(lèi)樣本的特征集合(如Haar特征集合)進(jìn)行篩選,進(jìn)而將篩選出的特征經(jīng)過(guò)加權(quán)構(gòu)成一個(gè)分類(lèi)器。由該方法得到的分類(lèi)器具備較高的準(zhǔn)確度和魯棒性,被廣泛應(yīng)用于各種模式識(shí)別系統(tǒng)中,如人物檢測(cè)、人臉檢測(cè)、人眼檢測(cè)系統(tǒng)等等。自頂向下逐級(jí)精華搜索方法步驟一般是輸入圖片首先經(jīng)過(guò)一次多尺度二維滑動(dòng)窗口搜索,確定人臉?biāo)趨^(qū)域,然后再在人臉?biāo)趨^(qū)域的左半邊搜索左眼,在人臉?biāo)趨^(qū)域的又半邊搜索右眼,搜索方法都是二維滑動(dòng)窗口法?,F(xiàn)有的人眼定位方法在進(jìn)行人臉和人眼的搜索過(guò)程中,都是在不同的尺度上以二維滑動(dòng)窗口的方式進(jìn)行搜索,該方法需要將待檢測(cè)區(qū)域在兩個(gè)維度進(jìn)行滑動(dòng),需要對(duì)大量的矩形區(qū)域進(jìn)行測(cè)試,以確定它是否是人臉或人眼。這種搜索過(guò)程需要較大的運(yùn)算量,同時(shí)因?yàn)樵谀繕?biāo)區(qū)域的附近(人臉或人眼區(qū)域), 通常會(huì)檢測(cè)出多個(gè)疑似人臉或人眼的位置,該類(lèi)方法一般將這些疑似人臉的位置進(jìn)行平均,從而得到最終的人臉或人眼位置,這樣得到的檢測(cè)結(jié)果包含較大的隨機(jī)誤差,會(huì)對(duì)后續(xù)的人臉識(shí)別過(guò)程產(chǎn)生較大的影響。為了盡量減少人眼定位過(guò)程中產(chǎn)生的隨機(jī)誤差,本發(fā)明提出人眼的十字定位法, 對(duì)人眼定位過(guò)程中的搜索范圍進(jìn)行限定,一方面可以縮小搜索范圍,降低計(jì)算量,另一方面減小隨機(jī)誤差,提高準(zhǔn)確度。
發(fā)明內(nèi)容
本發(fā)明所解決的技術(shù)問(wèn)題在于提供基于GentleBoost機(jī)器學(xué)習(xí)的人眼十字定位法,以解決上述背景技術(shù)中的缺點(diǎn)。本發(fā)明所解決的技術(shù)問(wèn)題采用以下技術(shù)方案來(lái)實(shí)現(xiàn)基于GentleBoost機(jī)器學(xué)習(xí)的人眼十字定位法,包括以下步驟第一步以GentleBoost機(jī)器學(xué)習(xí)算法為基礎(chǔ),通過(guò)分類(lèi)器訓(xùn)練過(guò)程得到六個(gè)分類(lèi)器人臉?lè)诸?lèi)器、雙眼分類(lèi)器、左眼橫向分類(lèi)器、右眼橫向分類(lèi)器,左眼縱向分類(lèi)器以及右眼縱向分類(lèi)器;第二步使用人臉?lè)诸?lèi)器對(duì)包含人臉的圖像進(jìn)行多尺度二維滑動(dòng)窗口搜索,確定人臉的位置;進(jìn)而,對(duì)人臉區(qū)域進(jìn)行十字交叉搜索,得到左眼和右眼的外廓矩形;第三步計(jì)算左眼和右眼外廓矩形的中心,這兩個(gè)中心點(diǎn)就是左眼和右眼的中心位置。本發(fā)明中,所述分類(lèi)器訓(xùn)練過(guò)程,包括以下步驟第一步樣本標(biāo)定子步驟選取合適的包含人臉圖像的樣本集合并對(duì)該集合內(nèi)的人臉及人眼的位置進(jìn)行人工標(biāo)定,以得到樣本圖像中人眼的坐標(biāo)位置;第二步訓(xùn)練樣本生成子步驟依據(jù)樣本集合的標(biāo)定結(jié)果,對(duì)樣本圖像進(jìn)行分割及大小歸一化,構(gòu)成分類(lèi)器訓(xùn)練樣本;第三步以GentleBoost機(jī)器學(xué)習(xí)算法為基礎(chǔ),以形成的訓(xùn)練樣本為輸入進(jìn)行訓(xùn)練,得到六個(gè)分類(lèi)器人臉?lè)诸?lèi)器、雙眼分類(lèi)器、左眼橫向分類(lèi)器、右眼橫向分類(lèi)器,左眼縱向分類(lèi)器以及右眼縱向分類(lèi)器。本發(fā)明中,所述十字交叉搜索過(guò)程,包括以下步驟第一步使用雙眼分類(lèi)器對(duì)人臉區(qū)域進(jìn)行自上而下一維滑動(dòng)窗口搜索,以確定雙眼的位置;第二步在檢測(cè)到的雙眼區(qū)域內(nèi),使用左眼水平分類(lèi)器在其左半部分進(jìn)行自左而右一維滑動(dòng)窗口搜索,以確定左眼的水平位置,使用右眼水平分類(lèi)器在其右半部分進(jìn)行自左而右一維滑動(dòng)窗口搜索,以確定右眼的水平位置;第三步以左眼和右眼的水平位置的范圍內(nèi),分別使用左右眼垂直分類(lèi)器進(jìn)行自上而下一維滑動(dòng)窗口搜索,以確定左眼和右眼的垂直位置。有益效果本發(fā)明針對(duì)人眼的搜索由二維滑動(dòng)窗口搜索改進(jìn)為十字交叉方式的多個(gè)一維滑動(dòng)窗口搜索,能夠大幅提高人眼檢測(cè)的精確度,同時(shí)縮小搜索范圍,減少計(jì)算量。本發(fā)明所述方法是Adaboost算法的改良版本具有更高的收斂速度和魯棒性。
具體實(shí)施例方式為了使本發(fā)明實(shí)現(xiàn)的技術(shù)手段、創(chuàng)作特征、達(dá)成目的與功效易于明白了解,下面結(jié)合具體圖示,進(jìn)一步闡述本發(fā)明?;贕entleBoost機(jī)器學(xué)習(xí)的人眼十字定位法的具體實(shí)施有兩個(gè)關(guān)鍵步驟,一個(gè)是分類(lèi)器的訓(xùn)練,這包括六個(gè)分類(lèi)器人臉?lè)诸?lèi)器、雙眼分類(lèi)器、左眼水平分類(lèi)器、右眼水平分類(lèi)器、左眼垂直分類(lèi)器以及右眼垂直分類(lèi)器;另一個(gè)是十字搜索過(guò)程。下面對(duì)這兩個(gè)關(guān)鍵步驟進(jìn)行詳細(xì)的描述。在進(jìn)行分類(lèi)器訓(xùn)練過(guò)程中,首先需要對(duì)包含人臉的圖像樣本進(jìn)行人工標(biāo)定,以便生成訓(xùn)練過(guò)程中需要的樣本,在進(jìn)行人臉圖像樣本的人工標(biāo)定過(guò)程中對(duì)于每個(gè)眼睛,需要標(biāo)定三個(gè)點(diǎn)左眼角、右眼角和瞳孔中心。設(shè)它們?cè)趫D像中的坐標(biāo)分別為(Xl,yi)、(Xr,yr)、 及(xp,yp),那么眼睛的中心坐標(biāo)(X。,yc)可通過(guò)如下公式計(jì)算
Xc:= -—-Γ yc - Yp在成功進(jìn)行圖像樣本標(biāo)定之后,也就獲得了圖像樣本中左眼和右眼的中心坐標(biāo)位置,這樣就可以進(jìn)行訓(xùn)練用正樣本的分割和歸一化。如圖2所示,是人臉、雙眼、水平單眼及垂直單眼正樣本的分割方法,其中單眼樣本以左眼為例,右眼是左眼的鏡像。設(shè)兩眼中心的距離、則可計(jì)算出分割的人臉正樣本大小和雙眼正樣本大小,水平單眼樣本大小為dXd,
垂直單眼樣本大小為d X-分割完成后,由于每張圖片中人臉部分的大小不同,得到的正
^ ο
樣本的大小也各不相同,因此,需要對(duì)樣本的大小歸一化,縮放到統(tǒng)一的大小,如可以講所有人臉樣本圖像縮放到22X22,雙眼樣本圖像縮放到32X8,水平單眼樣本的圖像縮放到 16X16。在分類(lèi)器的訓(xùn)練中,不僅要用到正樣本,還需要合適的負(fù)樣本。在進(jìn)行負(fù)樣本生成的時(shí)候,對(duì)于人臉負(fù)樣本,采取從人臉以外的背景部分隨機(jī)割取的方式獲得;對(duì)于雙眼負(fù)樣本,則在人臉區(qū)域內(nèi),沿垂直方向隨機(jī)割取,對(duì)于水平單眼樣本,則在雙眼區(qū)域內(nèi)沿水平方向隨機(jī)割取,對(duì)于垂直單眼負(fù)樣本,則在垂直單眼區(qū)域內(nèi),沿垂直方向隨機(jī)割取。樣本準(zhǔn)備完畢后,即可進(jìn)行以GentleBoost機(jī)器學(xué)習(xí)算法為基礎(chǔ)的分類(lèi)器訓(xùn)練, 訓(xùn)練過(guò)程中使用haar特征作為弱分類(lèi)器。6個(gè)分類(lèi)器分別訓(xùn)練完成后,即可用于人眼的檢測(cè)。十字交叉搜索用于精確定位雙眼的中心點(diǎn),搜索過(guò)程分為四個(gè)層次第一個(gè)層次是粗粒度的二維人臉區(qū)域搜索,通過(guò)在整個(gè)圖像上使用人臉?lè)诸?lèi)器進(jìn)行多尺度二維滑動(dòng)窗口搜索,最終確定人臉?biāo)诘膮^(qū)域;第二個(gè)層次在人臉?biāo)趨^(qū)域內(nèi)自上而下使用雙眼分類(lèi)器進(jìn)行一維滑動(dòng)窗口搜索,最終確定雙眼所在的區(qū)域;第三個(gè)層次是在雙眼所在的區(qū)域內(nèi)自左而右使用水平單眼分類(lèi)器進(jìn)行一維滑動(dòng)窗口搜索,最終確定左眼和右眼的水平位置;第四個(gè)層次是在水平單眼分類(lèi)器搜索得到的區(qū)域內(nèi),使用垂直單眼分類(lèi)器進(jìn)行垂直方向的一維滑動(dòng)窗口搜索,最終得到左眼和右眼的垂直位置。人眼十字定位法還可以依據(jù)實(shí)際的使用情況進(jìn)行一些改進(jìn)。下面給出其中一種常用的改進(jìn)設(shè)計(jì)包含眼鏡處理的人眼十字定位法。人臉識(shí)別系統(tǒng)在實(shí)際使用過(guò)程中必須能夠正確識(shí)別帶無(wú)色眼鏡的人物,這就要求人眼的定位算法不僅能夠處理不戴眼鏡的情況, 也必須能夠處理戴眼鏡的情況。由于戴眼鏡的人臉的眼睛部分與不戴眼鏡的眼睛部分有明顯的不同,因此必須針對(duì)戴眼鏡的樣本訓(xùn)練戴眼鏡的人眼分類(lèi)器,包括水平分類(lèi)器和垂直分類(lèi)器。此外,還必須有一種手段用于判斷當(dāng)前檢測(cè)到的人臉是否是戴眼鏡的人臉。要解決這些問(wèn)題,必須增加分類(lèi)器的數(shù)量,要通過(guò)GentleBoost機(jī)器學(xué)習(xí)算法訓(xùn)練出的分類(lèi)器增加為12個(gè)即人臉?lè)诸?lèi)器、雙眼分類(lèi)器、戴眼鏡雙眼分類(lèi)器、戴眼鏡判別分類(lèi)器、左眼水平分類(lèi)器、戴眼鏡左眼水平分類(lèi)器、右眼水平分類(lèi)器、戴眼鏡右眼水平分類(lèi)器、 左眼垂直分類(lèi)器、戴眼鏡左眼垂直分類(lèi)器、右眼垂直分類(lèi)器以及戴眼鏡右眼垂直分類(lèi)器。其方法是首先輸入圖像經(jīng)過(guò)多尺度二維滑動(dòng)窗口搜索,獲得人臉部分在圖像中的位置,然后分別使用雙眼分類(lèi)器和戴眼鏡雙眼分類(lèi)器對(duì)人臉區(qū)域進(jìn)行垂直一維滑動(dòng)窗口搜索,這樣可以分別得到兩個(gè)雙眼位置的檢測(cè)結(jié)果,接著使用戴眼鏡判別分類(lèi)器對(duì)兩個(gè)雙眼位置的檢測(cè)結(jié)果進(jìn)行判斷,選出正確的雙眼位置,并確定圖像中的人臉是否是戴眼鏡的人臉;最后如果該人臉是戴眼鏡的,則使用戴眼鏡人眼水平分類(lèi)器和垂直分類(lèi)器對(duì)雙眼所在區(qū)域進(jìn)行一維滑動(dòng)窗口搜索,如果該人臉是不戴眼鏡的,則使用不戴眼鏡人眼水平分類(lèi)器和垂直分類(lèi)器對(duì)雙眼所在區(qū)域進(jìn)行一維滑動(dòng)窗口搜索,最終獲得雙眼的精確位置。
以上顯示和描述了本發(fā)明的基本原理和主要特征及本發(fā)明的優(yōu)點(diǎn),本行業(yè)的技術(shù)人員應(yīng)該了解,本發(fā)明不受上述實(shí)施例的限制,上述實(shí)施例和說(shuō)明書(shū)中描述的只是說(shuō)明本發(fā)明的原理,在不脫離本發(fā)明精神和范圍的前提下,本發(fā)明還會(huì)有各種變化和改進(jìn),這些變化和改進(jìn)都落入要求保護(hù)的本發(fā)明范圍內(nèi),本發(fā)明要求保護(hù)范圍由所附的權(quán)利要求書(shū)及其等效物界定。
權(quán)利要求
1.基于GentleBoost機(jī)器學(xué)習(xí)的人眼十字定位法,其特征在于,包括以下步驟第一步以GentleBoost機(jī)器學(xué)習(xí)算法為基礎(chǔ),通過(guò)分類(lèi)器訓(xùn)練過(guò)程得到六個(gè)分類(lèi)器 人臉?lè)诸?lèi)器、雙眼分類(lèi)器、左眼橫向分類(lèi)器、右眼橫向分類(lèi)器,左眼縱向分類(lèi)器以及右眼縱向分類(lèi)器;第二步使用人臉?lè)诸?lèi)器對(duì)包含人臉的圖像進(jìn)行多尺度二維滑動(dòng)窗口搜索,確定人臉的位置;進(jìn)而,對(duì)人臉區(qū)域進(jìn)行十字交叉搜索,得到左眼和右眼的外廓矩形;第三步計(jì)算左眼和右眼外廓矩形的中心,這兩個(gè)中心點(diǎn)就是左眼和右眼的中心位置。
2.根據(jù)權(quán)利要求1所述的基于GentleBoost機(jī)器學(xué)習(xí)的人眼十字定位法,其特征在于, 所述分類(lèi)器訓(xùn)練過(guò)程,包括以下步驟第一步樣本標(biāo)定子步驟選取合適的包含人臉圖像的樣本集合并對(duì)該集合內(nèi)的人臉及人眼的位置進(jìn)行人工標(biāo)定,以得到樣本圖像中人眼的坐標(biāo)位置;第二步訓(xùn)練樣本生成子步驟依據(jù)樣本集合的標(biāo)定結(jié)果,對(duì)樣本圖像進(jìn)行分割及大小歸一化,構(gòu)成分類(lèi)器訓(xùn)練樣本;第三步以GentleBoost機(jī)器學(xué)習(xí)算法為基礎(chǔ),以形成的訓(xùn)練樣本為輸入進(jìn)行訓(xùn)練,得到六個(gè)分類(lèi)器人臉?lè)诸?lèi)器、雙眼分類(lèi)器、左眼橫向分類(lèi)器、右眼橫向分類(lèi)器,左眼縱向分類(lèi)器以及右眼縱向分類(lèi)器。
3.根據(jù)權(quán)利要求1所述的基于GentleBoost機(jī)器學(xué)習(xí)的人眼十字定位法,其特征在于, 所述十字交叉搜索過(guò)程,包括以下步驟第一步使用雙眼分類(lèi)器對(duì)人臉區(qū)域進(jìn)行自上而下一維滑動(dòng)窗口搜索,以確定雙眼的位置;第二步在檢測(cè)到的雙眼區(qū)域內(nèi),使用左眼水平分類(lèi)器在其左半部分進(jìn)行自左而右一維滑動(dòng)窗口搜索,以確定左眼的水平位置,使用右眼水平分類(lèi)器在其右半部分進(jìn)行自左而右一維滑動(dòng)窗口搜索,以確定右眼的水平位置;第三步以左眼和右眼的水平位置的范圍內(nèi),分別使用左右眼垂直分類(lèi)器進(jìn)行自上而下一維滑動(dòng)窗口搜索,以確定左眼和右眼的垂直位置。
全文摘要
基于GentleBoost機(jī)器學(xué)習(xí)的人眼十字定位法,包括以下步驟以GentleBoost機(jī)器學(xué)習(xí)算法為基礎(chǔ),通過(guò)分類(lèi)器訓(xùn)練過(guò)程得到六個(gè)分類(lèi)器人臉?lè)诸?lèi)器、雙眼分類(lèi)器、左眼橫向分類(lèi)器、右眼橫向分類(lèi)器,左眼縱向分類(lèi)器以及右眼縱向分類(lèi)器;使用人臉?lè)诸?lèi)器對(duì)包含人臉的圖像進(jìn)行多尺度二維滑動(dòng)窗口搜索,確定人臉的位置;進(jìn)而,對(duì)人臉區(qū)域進(jìn)行十字交叉搜索,得到左眼和右眼的外廓矩形;計(jì)算左眼和右眼外廓矩形的中心,這兩個(gè)中心點(diǎn)就是左眼和右眼的中心位置。本發(fā)明針對(duì)人眼的搜索由二維滑動(dòng)窗口搜索改進(jìn)為十字交叉方式的多個(gè)一維滑動(dòng)窗口搜索,能夠大幅提高人眼檢測(cè)的精確度,同時(shí)縮小搜索范圍,減少計(jì)算量。
文檔編號(hào)G06K9/00GK102426644SQ201110243778
公開(kāi)日2012年4月25日 申請(qǐng)日期2011年8月24日 優(yōu)先權(quán)日2011年8月24日
發(fā)明者夏東 申請(qǐng)人:夏東