專利名稱:一種基于隱馬爾可夫模型的人臉識別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種觀察序列分割方法,用于隱馬爾可夫(Hidden MarkovModel, HMM)的人臉識別,屬于統(tǒng)計方法人臉識別領(lǐng)域。
背景技術(shù):
作為圖像識別的重要研究方向,人臉識別技術(shù)是當(dāng)前生物特征識別技術(shù)中的研究熱點。與其他生物特征的識別相比,人臉圖像能更直觀、更方便地核查人的身份,是人類視覺中最普遍的模式,因此人臉識別的身份鑒定方法在商業(yè)、安全、法律等領(lǐng)域具有廣闊的應(yīng)用前景,己經(jīng)成為計算機(jī)視覺、圖像分析和理解中應(yīng)用最成功的技術(shù)之一。由于人臉識別受到光照,姿態(tài),角度等環(huán)境因素影響,其識別率難以得到保證。從上世紀(jì)八九十年代起,各種人臉識別方法層出不窮,隱馬爾可夫模型方法是一種重要的方法。大多數(shù)研究重點都是放在模型的訓(xùn)練與識別率的提高上。但是由于HMM臉識別的訓(xùn)練結(jié)果是每個人臉都得到一個模型,識別時需要把待識別人臉圖像的特征序列代入每個人臉的HMM用Viterbi算法計算最大相似度。識別一張臉就必須使用一個序列,導(dǎo)致序列計算次數(shù)過多,且識別速度慢,效率低。
發(fā)明內(nèi)容
發(fā)明目的本發(fā)明提出了一種減少觀察序列的計算次數(shù),提高識別效率的人臉識別方法。技術(shù)方案本發(fā)明通過如下技術(shù)手段加以實現(xiàn)一種基于隱馬爾可夫模型的人臉識別方法,包括以下步驟I)建立人臉隱馬爾可夫模型;2)對樣本圖像采樣,得到特征向量,確定模型各初始參數(shù);3)反復(fù)迭代訓(xùn)練隱馬爾可夫模型;4)對待識別圖像采樣,得到特征向量;5)將待識別圖像的特征向量分割,對所有隱馬爾可夫模型遞進(jìn)地計算最大相似度,同時排除相似度最小的隱馬爾可夫模型,最后得到識別結(jié)果;其中建立人臉圖像的隱馬爾可夫模型是以頭發(fā)、額頭、眼睛、鼻子和嘴巴區(qū)域作為隱含狀態(tài)來建立相關(guān)的模型。所述步驟2具體包括如下步驟I)對樣本圖像進(jìn)行預(yù)處理,進(jìn)行灰度化,歸一化處理,去除圖像的色彩信息并歸一為統(tǒng)一的圖像尺寸;2)對樣本圖像窗口進(jìn)行采樣和特征提取,3)對采樣窗口進(jìn)行和特征提取,提取后的特征作為樣本圖像的觀察序列;4)平均分割圖像,并初始化模型參數(shù);步驟4具體包括如下步驟
I)對待識別圖像進(jìn)行預(yù)處理,進(jìn)行灰度化,歸一化處理,去除圖像的色彩信息并歸一為與樣本圖像相同的尺寸;2)對待識別圖像窗口進(jìn)行采樣和特征提取,采樣窗口的寬度、高度均與樣本圖像相同;3)對采樣窗口進(jìn)行和特征提取,提取后的特征作為待識別圖片的觀察序列。步驟5包括如下步驟I)根據(jù)步驟4得到待識別圖片長度為T的觀察序列O=O1O2. . . Ot,其中T>5,表示圖
像采樣窗口的個數(shù).將0平均分割為n份,每份長度為I n彡3 ;
,2)將O=O1O2. . . 0T/n代入所有m個HMM中使用Viterbi算法計算相似度,m表示已經(jīng)訓(xùn)練好的隱馬爾可夫模型的個數(shù),m彡1,得到m個5 T/n(i),6 T/n⑴表示當(dāng)前觀察序列
在隱馬爾可夫模型中的相似度,同時淘汰最小的$個ST/n(i)對應(yīng)的HMM;
n3)將
權(quán)利要求
1.一種基于隱馬爾可夫模型的人臉識別方法,其特征在于,包括以下步驟 1)建立人臉隱馬爾可夫模型; 2)對樣本圖像采樣,得到特征向量,確定模型各初始參數(shù); 3)反復(fù)迭代訓(xùn)練隱馬爾可夫模型,根據(jù)給定樣本個數(shù),對于每個人臉都產(chǎn)生一個具有不同參數(shù)隱馬爾可夫模型,一共m個,m3 I ; 4)對待識別圖像采樣,得到特征向量; 5)將待識別圖像的特征向量分割,對所有隱馬爾可夫模型遞進(jìn)地計算最大相似度,同時排除相似度最小的隱馬爾可夫模型,最后得到識別結(jié)果; 其中建立人臉圖像的隱馬爾可夫模型是以頭發(fā)、額頭、眼睛、鼻子和嘴巴區(qū)域作為隱含狀態(tài)來建立相關(guān)的模型。
2.根據(jù)權(quán)利要求1所述的基于隱馬爾可夫模型的人臉識別方法,其特征在于所述步驟2具體包括如下步驟 1)對樣本圖像進(jìn)行預(yù)處理,進(jìn)行灰度化,歸一化處理,去除圖像的色彩信息并歸一為統(tǒng)一的圖像尺寸; 2)對樣本圖像使用采樣窗口進(jìn)行采樣; 3)對采樣窗口進(jìn)行和特征提取,提取后的特征作為樣本圖像的觀察序列; 4)平均分割圖像,并初始化模型參數(shù)。
3.根據(jù)權(quán)利要求1所述的基于隱馬爾可夫模型的人臉識別方法,其特征在于步驟4具體包括如下步驟 1)對待識別圖像進(jìn)行預(yù)處理,進(jìn)行灰度化,歸一化處理,去除圖像的色彩信息并歸一為與樣本圖像相同的尺寸; 2)對待識別圖像窗口進(jìn)行采樣和特征提取,采樣窗口的寬度、高度均與樣本圖像相同; 3)對采樣窗口進(jìn)行和特征提取,提取后的特征作為待識別圖片的觀察序列。
4.根據(jù)權(quán)利要求1所述的基于隱馬爾可夫模型的人臉識別方法,其特征在于步驟5包括如下步驟I)根據(jù)步驟4得到待識別圖片長度為T的觀察序列O=O1Om2. . . Ot,其中T>5,表示圖像采樣窗口的個數(shù).將O平均分割為η份,每份長度為I,η彡3 ;η 將O=O1O2. . . 0T/n代入所有m個HMM中使用Viterbi算法計算相似度,m表示已經(jīng)訓(xùn)練好的隱馬爾可夫模型的個數(shù),m ^ 1,得到m個δ T/n(i),δ τ/η⑴表示當(dāng)前觀察序列在隱馬爾可夫模型中的相似度,同時淘汰最小的=個ST/n(i)對應(yīng)的HMM; 3)將 0τ/η+10τ/η+1···02τ/ι^;ν M-^ 個 HMM 中,同樣得到 m —:個 δ 2T/n(i),淘汰掉最小的$個δ2Τ/ηω對應(yīng)的HMM; η1上述步驟進(jìn)行η次,每次都帶入工個觀察序列,保存中間結(jié)果δ (i),然后根據(jù)δ (i) 排除最小的一個HMM,最后在剩余的_中計算P1=HiaxHJi)],求出的afgmax外即為識別的結(jié)果; 若存在同屬一個人的待識別圖像,計算每個圖像的識別結(jié)果,取次數(shù)最多的作為結(jié)果輸出。
5.根據(jù)權(quán)利要求1所述的基于隱馬爾可夫模型的人臉識別方法,其特征在于所述步驟I建立的隱馬爾可夫模型的包括 1)隱含狀態(tài)的數(shù)目N,狀態(tài)集為S= Is1, S2,, sN},N=5,分別對應(yīng)人臉區(qū)間的頭發(fā)、額頭、眼睛、鼻子和嘴巴; 2)觀察序列的數(shù)目M,觀察序列集為V= Iv1, V2,. . . , vj , m ^ 1,對于人臉隱馬爾可夫模型,觀察序列集為圖像采樣窗口得到的特征值; 3)狀態(tài)轉(zhuǎn)移矩陣A,A={aij},aij= P[qt+1 = Sj I Qt=Si], I彡i,j彡N。其中qt為在時刻t的狀態(tài)。A為NXN的方陣,行和列都對應(yīng)所有的狀態(tài),表示狀態(tài)之間轉(zhuǎn)移的概率;4)觀察序列概率矩陣B, B= {bj (k)}, bj (k) =P [vt at 11 qt = Sj], I 彡 j 彡 N, I 彡 k 彡 Μ,即表示在時刻t,隱含狀態(tài)為下觀察值為Vt的概率。連續(xù)型HMM的B通過一個連續(xù)的函數(shù)得到觀察序列與狀態(tài)的關(guān)系,常用的是混合高斯概率密度函數(shù); 5)初始狀態(tài)分布概率Π={> J,Ji FPls1 = qj,其中I彡i彡N。則|>,=U對于人i 二I臉隱馬爾可夫模型,總有^=1。
6.根據(jù)權(quán)利要求1所述的基于隱馬爾可夫模型的人臉識別方法,其特征在于所述步驟I中根據(jù)人臉特征建立一維的HMM或二維EHMM。
7.根據(jù)權(quán)利要求1所述的基于隱馬爾可夫模型的人臉識別方法,其特征在于所述步驟2中建立的EHMM圖像寬度為W,高度為H,采樣窗口寬度為Y,長度為L。其中I彡Y<ff,I ( L〈H,采樣窗口水平方向的的重疊部分為Ph,垂直方向的重疊程度為Pv。
8.根據(jù)權(quán)利要求1所述的基于隱馬爾可夫模型的人臉識別方法,其特征在于步驟2中初始化隱馬爾可夫模型的狀態(tài)轉(zhuǎn)移矩陣A和觀察序列概率矩陣B,其中,A為NXN的方陣,行和列都對應(yīng)所有的狀態(tài),表示狀態(tài)之間轉(zhuǎn)移的概率。B表示在各種隱含狀態(tài)表現(xiàn)為不同觀察值的概率。根據(jù)采樣得到的特征向量,計算每個平均每個隱含狀態(tài)包括的特征數(shù),初始化狀態(tài)轉(zhuǎn)移矩陣A。連續(xù)型HMM的觀察序列概率矩陣B通過一個連續(xù)的函數(shù)得到觀察序列與狀態(tài)的關(guān)系,常用的是使用混合高斯概率密度函數(shù)bM) = XcjmN(Ot^imyUjm), m=lI彡j彡N,其中bj (ot)表示觀察序列在時刻t時的值Ot由隱含狀態(tài)j所表現(xiàn)的概率,Cjffl是狀態(tài)j的第m個混合高斯權(quán)重,N(ot, μ Jm, Ujm)是一個均值為μ jm、方差為Ujm的高斯概率密M度函數(shù),M表示混合高斯概率密度函數(shù)混合的數(shù)目,其中混合系數(shù)滿足。 m=l
9.根據(jù)權(quán)利要求1所述的基于隱馬爾可夫模型的人臉識別方法,其特征在于步驟3中使用Baum-Welch算法對模型參數(shù)進(jìn)行重估直到收斂,然后保存各個參數(shù)值。
全文摘要
本發(fā)明涉及一種基于隱馬爾可夫模型的人臉識別方法,具體包括以下步驟建立人臉隱馬爾可夫模型;對樣本圖像采樣,得到特征向量,確定模型各初始參數(shù);反復(fù)迭代訓(xùn)練隱馬爾可夫模型,對于每個人臉都產(chǎn)生一個具有不同參數(shù)隱馬爾可夫模型;對待識別圖像采樣,得到特征向量;將待識別圖像的特征向量分割,對所有隱馬爾可夫模型遞進(jìn)地計算最大相似度,同時排除相似度最小的隱馬爾可夫模型,最后得到識別結(jié)果。本發(fā)明利用人臉HMM的結(jié)構(gòu)確定的隱含狀態(tài)總是從代表頭部的狀態(tài)開始,并且只可能向下一個狀態(tài)轉(zhuǎn)移的特征和Viterbi算法動態(tài)規(guī)劃的特性,將觀察向量分割,并在計算相似度時通過中間結(jié)果來排除可能性較小的人臉模型,達(dá)到減少計算量的效果。
文檔編號G06K9/00GK103034847SQ20121053878
公開日2013年4月10日 申請日期2012年12月13日 優(yōu)先權(quán)日2012年12月13日
發(fā)明者劉惠義, 王志超, 周斌, 秦川 申請人:河海大學(xué)