專(zhuān)利名稱(chēng):基于正臉補(bǔ)償算子的多姿態(tài)人臉識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于PCA(主成分分析)的多姿態(tài)人臉識(shí)別技術(shù),更具體地,涉 及一種通過(guò)正臉補(bǔ)償算子來(lái)補(bǔ)償各種姿態(tài)條件下的人臉,通過(guò)使用補(bǔ)償后的人臉進(jìn)行識(shí) 別的方法。
背景技術(shù):
多姿態(tài)人臉識(shí)別近幾年研究地比較多,它被稱(chēng)作是計(jì)算機(jī)視覺(jué)與模式識(shí)別領(lǐng)域 尚未較好解決的重要問(wèn)題之一。人臉易受多種因素影響,如表情、胡須、眼鏡、頭發(fā)、 光照、背景,以及人臉偏轉(zhuǎn)導(dǎo)致只看到側(cè)臉的情形,針對(duì)多姿態(tài)人臉識(shí)別的熱點(diǎn)問(wèn)題提 出的方法大致可以分為三類(lèi)常規(guī)方法、三維研究方法、二維研究方法。常規(guī)算法主要解決由光照、表情、年齡等變化引起的問(wèn)題,而對(duì)于觀察視角的 不同引起的人臉圖像的變化研究較少。三維研究方法一般是需要從盡可能多的角度采集 人臉組成人臉三維模型,并使用三維模型來(lái)構(gòu)建人臉庫(kù),待識(shí)別人臉與這些三維模型逐 個(gè)匹配來(lái)進(jìn)行識(shí)別。三維研究方法的問(wèn)題是計(jì)算量大,需要巨大存儲(chǔ)空間,而且當(dāng)前人 臉庫(kù)不能滿足其需要,因此其走向?qū)嵱没枰^長(zhǎng)時(shí)間。二維研究方法多是尋找各個(gè)較 多多姿態(tài)人臉到正臉的變換關(guān)系,并將待識(shí)別人臉轉(zhuǎn)成正臉來(lái)進(jìn)行識(shí)別,其理論依據(jù)是 同一個(gè)人不同姿態(tài)的人臉圖像差異比不同人相同姿態(tài)人臉之間的差異還要大。二維研究 方法與三維研究方法相比,它的優(yōu)點(diǎn)是計(jì)算復(fù)雜度低,計(jì)算速度快,存儲(chǔ)容量小。但是二維研究方法也有明顯的缺點(diǎn),主要體現(xiàn)在四個(gè)方面1.對(duì)人臉歸一化要求高,而各種識(shí)別算法使用不同的歸一化方式。任何多姿態(tài) 人臉識(shí)別算法都有人臉歸一化要求,然而由于不同人臉之間的形狀差異較大,因此各種 識(shí)別算法只能根據(jù)具體識(shí)別算法使用不同的人臉歸一化方法。2.對(duì)人臉庫(kù)的要求模糊。大多數(shù)多姿態(tài)人臉識(shí)別算法使用的訓(xùn)練人臉都是在多 次嘗試之后選擇的,再次試驗(yàn)該算法時(shí),難找到完全一致的人臉庫(kù)以及對(duì)人臉庫(kù)的處理 方式,算法可重復(fù)操作性差。3. 二維研究算法通常采取將所有訓(xùn)練正臉與多姿態(tài)人臉?lè)謩e構(gòu)成一個(gè)巨大的正 臉矩陣和側(cè)臉矩陣來(lái)進(jìn)行運(yùn)算,計(jì)算量大,處理時(shí)間長(zhǎng)。4.多數(shù)二維算法將人臉切割為僅含雙眼、鼻子和嘴的很小的范圍,去掉了很多 能夠區(qū)分人臉身份的信息。但是在使用一般攝像頭進(jìn)行監(jiān)控的實(shí)際環(huán)境中,經(jīng)過(guò)這樣剪 切之后人臉像素很少,幾乎失去人臉特征,不能進(jìn)行識(shí)別。人臉識(shí)別算法中被采用最多的是PCA算法,它已經(jīng)成為神經(jīng)科學(xué)和計(jì)算機(jī)圖像 處理等領(lǐng)域的一種標(biāo)準(zhǔn)數(shù)據(jù)處理工具?;赑CA的人臉識(shí)別方法將人臉看作一個(gè)整體, 利用統(tǒng)計(jì)學(xué)習(xí)的方法自動(dòng)獲取特征值,其算法簡(jiǎn)單并且完全無(wú)參數(shù)限制。使用PCA算 法,只需簡(jiǎn)單計(jì)算就能將復(fù)雜的數(shù)據(jù)降維簡(jiǎn)化,很多基于PCA的改進(jìn)算法雖然取得了較 好的效果,但是卻增加了算法的復(fù)雜度,通用性低。PCA人臉識(shí)別算法將一高維的向量,通過(guò)一個(gè)特殊的特征向量矩陣,投影到一個(gè)低維的向量空間中,表示為一個(gè)低維向量,并不會(huì)損失有用信息。將人臉圖像進(jìn)行 PCA變換之后,得到人臉的特征值和特征向量,其中較大的特征值對(duì)應(yīng)的特征向量具有 與人臉相似的形狀,所以又稱(chēng)為特征臉,利用這些特征臉作為基底可以描述、表達(dá)和逼 近人臉圖像,進(jìn)行人臉識(shí)別。說(shuō)明書(shū)附圖1(a)給出了使用68張CMUPIE人臉庫(kù)中的正 臉進(jìn)行PCA變換之后,最大的前10個(gè)特征值對(duì)應(yīng)的特征臉,說(shuō)明書(shū)附圖1(b)為最小的 10個(gè)特征值對(duì)應(yīng)的特征臉,兩圖中特征臉均按特征值由大到小排列。特征值越大,對(duì)應(yīng) 的特征臉越重要,特征值大的特征臉包含更多的正臉輪廓信息,而特征值小的特征臉包 含更多的是細(xì)節(jié)信息。人臉識(shí)別的過(guò)程就是將待識(shí)別的人臉圖像映射到特征臉展開(kāi)的子 空間上,比較其與已知人臉在特征空間中的距離,從而進(jìn)行判別。專(zhuān)利CN101515324A公開(kāi)了一種適用于多種姿態(tài)的人臉識(shí)別布控系統(tǒng)及方法。 該方案利用對(duì)應(yīng)姿態(tài)的人臉識(shí)別分類(lèi)器提取人臉特征,并把人臉識(shí)別分類(lèi)器提取的人臉 特征與布控庫(kù)中對(duì)應(yīng)姿態(tài)的人臉特征作對(duì)比并判斷是否報(bào)警。該發(fā)明用人臉三維重建技 術(shù)將后臺(tái)的布控對(duì)象變換出各種姿態(tài)的人臉,同時(shí)用對(duì)應(yīng)姿態(tài)的人臉識(shí)別分類(lèi)器提取特 征,算法復(fù)雜,而且并未明確提及人臉歸一化問(wèn)題。專(zhuān)利CN101458763A公布了一種基于圖像加權(quán)平均的自動(dòng)人臉識(shí)別方法。該方 案首先利用快速線性插值算法將原始圖像映射到標(biāo)準(zhǔn)正面模板,然后自動(dòng)判別圖像中人 臉的左右偏轉(zhuǎn)角度,并依據(jù)該角度賦予每張圖像相應(yīng)的權(quán)值進(jìn)行平均,最后將加權(quán)平均 結(jié)構(gòu)圖向加權(quán)平均形狀圖映射得到加權(quán)平均臉圖像。該發(fā)明僅考慮人臉左右偏轉(zhuǎn)的多姿 態(tài)圖像,利用快速線性插值算法將原始圖像映射到標(biāo)準(zhǔn)正面模板這一過(guò)程準(zhǔn)備度不能保 證,而且原始圖像上需要標(biāo)記34個(gè)特征點(diǎn),處理過(guò)程復(fù)雜。專(zhuān)利CN101320484A公開(kāi)了一種基于人臉全自動(dòng)定位的三維人臉識(shí)別方法。該 方案首先建立二維人臉形狀模型和局部紋理模型,對(duì)二維人臉圖像進(jìn)行精確定位,根據(jù) 定位結(jié)果,對(duì)所述二維人臉圖像進(jìn)行三維重建,得到三維人臉圖像。然后,對(duì)所述三維 人臉圖像進(jìn)行光照模型處理,得到姿態(tài)、光照變化的虛圖像。該發(fā)明計(jì)算量大,算法復(fù) 雜,三維重建后的效果受人臉圖像配合度影響大。
發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)當(dāng)前多姿態(tài)人臉識(shí)別難度大的問(wèn)題,提供一種簡(jiǎn)單有效基 于PCA的多姿態(tài)人臉識(shí)別技術(shù),通過(guò)正臉補(bǔ)償算子來(lái)補(bǔ)償多姿態(tài)人臉,使用補(bǔ)償之后的 人臉來(lái)進(jìn)行識(shí)別的方法。說(shuō)明書(shū)附圖2為本發(fā)明的多姿態(tài)人臉識(shí)別流程圖?;谡樠a(bǔ)償算法的多姿態(tài)人臉識(shí)別方法是這樣實(shí)現(xiàn)的1.剪切少量(20張即可)的人臉正臉與相同數(shù)量對(duì)應(yīng)的近似相同姿態(tài)人臉組成訓(xùn) 練人臉庫(kù),對(duì)這些人臉進(jìn)行簡(jiǎn)單的歸一化。歸一化可以保留頭部全部信息,去掉圖像彩 色信息,確定人眼位置后將人眼固定在特定位置,并把圖像放縮到相同的大小,最后對(duì) 圖像進(jìn)行直方圖均衡化處理;2.計(jì)算訓(xùn)練多姿態(tài)人臉與正臉的平均臉,說(shuō)明書(shū)附圖3(a)為實(shí)驗(yàn)中的45°平均 側(cè)臉,說(shuō)明書(shū)附圖3(b)為平均正臉。平均臉是分別對(duì)訓(xùn)練庫(kù)中人臉對(duì)應(yīng)位置上的像素求 和再取平均值,得到的平均臉弱化了細(xì)節(jié)信息,保留了大的輪廓信息;3.使用平均正臉減去平均多姿態(tài)人臉得到該姿態(tài)下的正臉補(bǔ)償算子,說(shuō)明書(shū)附圖3(c)為45°側(cè)臉的正臉補(bǔ)償算子。該算子不代表每個(gè)人的身份,它弱化了人臉的身份 信息,能彌補(bǔ)人臉側(cè)臉?biāo)狈Φ恼樰喞?.將待識(shí)別人臉進(jìn)行歸一化處理,加上該姿態(tài)下的正臉補(bǔ)償算子進(jìn)行補(bǔ)償,使 用補(bǔ)償之后的人臉進(jìn)行PCA人臉識(shí)別。正臉補(bǔ)償算子補(bǔ)償了待識(shí)別人臉缺乏的正臉輪廓 信息,即PCA大的特征值所對(duì)應(yīng)的特征臉信息,同時(shí)也減少了干擾PCA算法的部分姿態(tài) 偏轉(zhuǎn)輪廓信息。多姿態(tài)人臉圖像缺少正臉輪廓,而包括不需要的部分姿態(tài)偏轉(zhuǎn)輪廓,這 也是使用PCA算法難以進(jìn)行多姿態(tài)人臉識(shí)別的原因。由于本發(fā)明彌補(bǔ)了各種姿態(tài)人臉進(jìn)行PCA識(shí)別時(shí)缺乏的正臉輪廓信息,而且正 臉補(bǔ)償算子是通過(guò)平均臉得到的,不代表任何人的身份辨認(rèn)信息,因而不會(huì)誤導(dǎo)PCA算 法的識(shí)別,最終提高了 PCA算法對(duì)多姿態(tài)人臉的識(shí)別率。與其它技術(shù)相比,本發(fā)明具有以下的優(yōu)點(diǎn)1.使用平均臉計(jì)算,沒(méi)有采用將人臉庫(kù)中人臉組成一個(gè)大矩陣來(lái)進(jìn)行訓(xùn)練的方 法,大幅度地減少了計(jì)算量,提高了計(jì)算速度。2.對(duì)人臉歸一化要求低,只需要將人臉眼睛部位固定在相同位置。很多算法為 了保證算法穩(wěn)定,將人臉切割到僅含眼睛、鼻子和嘴,需要各個(gè)部分嚴(yán)格對(duì)齊,而且剪 切后的人臉圖像像素也不能過(guò)大。本發(fā)明中可以保留人的頭部的所有信息,對(duì)人臉圖像 像素?cái)?shù)也沒(méi)有要求,人臉圖像像素?cái)?shù)越高,識(shí)別效果也越好。3.人臉庫(kù)容易選擇,而且需要的訓(xùn)練人臉數(shù)目很少。需要的人臉庫(kù)無(wú)特別要 求,使用當(dāng)前比較流行的CMU PIE人臉庫(kù)就能達(dá)到很好的效果,任意選擇其中正臉與對(duì) 應(yīng)多姿態(tài)人臉各20張進(jìn)行訓(xùn)練,即可達(dá)到很好的識(shí)別效果。4.除基本PCA算法外,本發(fā)明僅包含簡(jiǎn)單的加減運(yùn)算,沒(méi)有很多多姿態(tài)人臉識(shí) 別算法中包含矩陣乘法運(yùn)算,計(jì)算量明顯小得多。5.本算法能夠解決各種姿態(tài)下的人臉識(shí)別問(wèn)題,如具有一定水平偏轉(zhuǎn)角度的側(cè) 臉的識(shí)別,具有上下偏轉(zhuǎn)角度,不同表情、光照、年齡、背景,包含胡須、眼鏡、頭發(fā) 等各種條件下的多姿態(tài)人臉,算法通用性強(qiáng)。
附圖1示出了 PCA分解得到的特征臉。(a)為最大的10個(gè)特征值對(duì)應(yīng)的特征臉 (按特征值由大到小排列);(b)為最小的10個(gè)特征值對(duì)應(yīng)的特征臉(按特征值由大到小 排列);附圖2示出了多姿態(tài)人臉的整個(gè)處理和識(shí)別過(guò)程;附圖3示出了得到的平均臉與正臉補(bǔ)償算子,(a)為45°平均側(cè)臉,(b)為平均 正臉,(c)為正臉補(bǔ)償算子;附圖4示出了未經(jīng)對(duì)稱(chēng)處理的多姿態(tài)人臉補(bǔ)償與識(shí)別結(jié)果,(a)為補(bǔ)償后的多姿 態(tài)人臉,(b)為補(bǔ)償人臉的識(shí)別結(jié)果;附圖5示出了對(duì)稱(chēng)處理的多姿態(tài)人臉補(bǔ)償與識(shí)別結(jié)果,(a)為補(bǔ)償后的多姿態(tài)人 臉,(b)為補(bǔ)償人臉的識(shí)別結(jié)果。
具體實(shí)施例方式為了更好地理解本發(fā)明,下面將詳細(xì)描述本發(fā)明的具體實(shí)施方式
。CMU PIE人臉庫(kù)是眾多人臉庫(kù)中比較充分地考慮對(duì)多姿態(tài)人臉進(jìn)行識(shí)別的人臉 庫(kù),因此使用CMU PIE人臉庫(kù)來(lái)對(duì)本發(fā)明進(jìn)行詳細(xì)講解。CMU PIE人臉庫(kù)包含68人的 水平偏轉(zhuǎn)角度為士22.5、士45和士67.5的側(cè)臉,一定俯仰角度的人臉,共13種姿態(tài)條 件,43種光照條件和4種表情下的多姿態(tài)人臉。選擇各種姿態(tài)條件下的人臉與對(duì)應(yīng)正臉 進(jìn)行歸一化,然后對(duì)其取平均人臉,得到各個(gè)角度的平均臉,將平均正臉與各個(gè)姿態(tài)下 的平均臉相減,得到各個(gè)姿態(tài)下的正臉補(bǔ)償算子?,F(xiàn)在以水平旋轉(zhuǎn)角度為+45的側(cè)臉識(shí) 別為例進(jìn)行詳細(xì)闡述,其他多姿態(tài)條件下的人臉識(shí)別步驟是完全一樣的。首先是對(duì)人臉進(jìn)行歸一化,由于本發(fā)明對(duì)歸一化要求低,因此只需去掉圖像的 彩色信息,將+45側(cè)臉與正臉圖像的人眼固定在指定位置,并將圖像放縮到相同的大小 (如100X100)。最后,對(duì)人臉圖像進(jìn)行直方圖均衡化,去除不同光照帶來(lái)的噪聲影響。用PO來(lái)表示正臉,用Pk來(lái)表示水平偏轉(zhuǎn)角度為+45的側(cè)臉,假設(shè)使用了 N個(gè)人 的正臉與側(cè)臉進(jìn)行訓(xùn)練,那么歸一化之后,N張正臉與對(duì)應(yīng)的N張水平偏轉(zhuǎn)角度為+45的
側(cè)臉構(gòu)成了訓(xùn)練序列。其中,正臉集表示為,··.,々),側(cè)臉集表示為(χ ··.,4 ),
χ嚴(yán)是正臉#對(duì)應(yīng)的側(cè)臉圖像。則平均正臉可以表示為
權(quán)利要求
1. 一種簡(jiǎn)單有效基于PCA的多姿態(tài)人臉識(shí)別技術(shù),通過(guò)正臉補(bǔ)償算子來(lái)補(bǔ)償多姿態(tài) 人臉,使用補(bǔ)償之后的人臉來(lái)進(jìn)行多姿態(tài)人臉識(shí)別的方法,其特征在于采用以下步驟A、剪切少量(20張即可)的正臉與相同數(shù)量對(duì)應(yīng)的某個(gè)姿態(tài)的人臉組成訓(xùn)練人臉 庫(kù),該人臉庫(kù)對(duì)歸一化性能要求很低,只需將眼睛部位固定在特定位置。B、根據(jù)圖像的清晰度將圖像放縮到相同的大小,并做灰度化和直方圖均衡化處理, 人臉圖像像素?cái)?shù)沒(méi)有小于某一閾值的要求,原則上圖像像素?cái)?shù)越高,識(shí)別效果也越好;C、計(jì)算多姿態(tài)人臉與正臉的平均臉,使用N個(gè)人的正臉與對(duì)應(yīng)某個(gè)姿態(tài)的人臉進(jìn)行訓(xùn)練,N張正臉(々,< ,···,4 )與對(duì)應(yīng)的N張Pk姿態(tài)的人臉力,…)構(gòu)成訓(xùn)練序列,其中4是正臉々對(duì)應(yīng)的Pk姿態(tài)下的人臉圖像,平均正臉表示為
全文摘要
本發(fā)明公開(kāi)了一種簡(jiǎn)單有效的基于PCA算法的多姿態(tài)人臉識(shí)別技術(shù),通過(guò)使用正臉補(bǔ)償算子來(lái)補(bǔ)償多姿態(tài)人臉,并使用補(bǔ)償后的人臉進(jìn)行多姿態(tài)人臉識(shí)別。說(shuō)明書(shū)摘要附圖為整個(gè)多姿態(tài)人臉識(shí)別的流程圖。本發(fā)明使用PCA算法進(jìn)行人臉識(shí)別時(shí),正臉補(bǔ)償算子補(bǔ)償了待識(shí)別多姿態(tài)人臉?biāo)狈Φ恼樰喞畔ⅲ碢CA算法分解出的大特征值所對(duì)應(yīng)的特征臉信息,同時(shí)也減少了干擾PCA算法的部分多姿態(tài)輪廓信息。多姿態(tài)人臉圖像往往缺少正臉輪廓,即對(duì)PCA算法來(lái)講更重要的識(shí)別信息。與其它技術(shù)相比,本發(fā)明使用平均臉計(jì)算,沒(méi)有采用將人臉庫(kù)中人臉組成一個(gè)大矩陣來(lái)進(jìn)行訓(xùn)練的方法,減少了計(jì)算量。同時(shí)對(duì)人臉歸一化要求低,人臉庫(kù)容易選擇,而且需要的訓(xùn)練人臉數(shù)目很少。此外,本發(fā)明使用的算法簡(jiǎn)單,通過(guò)簡(jiǎn)單的加減運(yùn)算就能達(dá)到很好的識(shí)別效果,而且對(duì)各種姿態(tài)人臉進(jìn)行識(shí)別都能通用。本發(fā)明通過(guò)正臉補(bǔ)償算子來(lái)補(bǔ)償多姿態(tài)人臉的方法可為改善多姿態(tài)人臉識(shí)別率提供新的解決思路。
文檔編號(hào)G06K9/00GK102013011SQ20101059139
公開(kāi)日2011年4月13日 申請(qǐng)日期2010年12月16日 優(yōu)先權(quán)日2010年12月16日
發(fā)明者周帥, 張建慧, 方杰, 王保華, 譚曉衡, 陳林 申請(qǐng)人:重慶大學(xué)