一種基于結(jié)構(gòu)先驗(yàn)知識的魯棒生物特征識別方法
【專利摘要】本發(fā)明公開了一種基于結(jié)構(gòu)先驗(yàn)知識的魯棒生物特征識別方法,該方法包括:收集圖像數(shù)據(jù)形成訓(xùn)練樣本集和測試樣本集;提取所述訓(xùn)練樣本集中每個訓(xùn)練樣本的特征向量,并將提取得到的特征向量組成字典矩陣X;基于所述字典矩陣X,通過優(yōu)化算法計(jì)算得到與所述測試樣本集中的每一測試樣本對應(yīng)的重構(gòu)系數(shù)向量;基于所述字典矩陣X,使用與所述測試樣本集中的每一測試樣本對應(yīng)的重構(gòu)系數(shù)向量進(jìn)行樣本重構(gòu),得到與每一測試樣本對應(yīng)的分屬于不同類別的重構(gòu)測試樣本,與相應(yīng)測試樣本最為接近的重構(gòu)訓(xùn)練樣本的類別即為所述測試樣本的類別。本發(fā)明可以用在人臉識別等生物特征識別領(lǐng)域,能夠有效處理存在遮擋噪聲情況下的識別分類問題。
【專利說明】—種基于結(jié)構(gòu)先驗(yàn)知識的魯棒生物特征識別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及模式識別與機(jī)器學(xué)習(xí)領(lǐng)域,特別涉及一種基于結(jié)構(gòu)先驗(yàn)知識的生物特征識別方法,該方法使用稀疏表示、半二次最小化等算法進(jìn)行生物特征識別。
【背景技術(shù)】
[0002]近些年,線性表示模型在計(jì)算機(jī)視覺領(lǐng)域得到了廣泛的應(yīng)用,比如人臉識別等生物特征識別。比如說,對于人臉識別問題,同一個人的多張不同人臉圖像一般分布在同一個子空間之中,所以這個人的ー張圖像可以近似用他的其他張圖像來線性表示?;谶@種認(rèn)知,人們提出了一系列線性最小ニ乘方法,例如最近鄰特征線,最近鄰特征平面以及最近鄰特征空間等具體算法。而從稀疏性角度分,線性表示模型又大致分為兩類,即為稀疏線性表示模型與非稀疏線性表示模型,前者采用LI范數(shù)來約束線性表示系數(shù),后者則采用L2范數(shù)進(jìn)行約束。稀疏性主要是考慮當(dāng)用所有的訓(xùn)練樣本去重構(gòu)待測試樣本時,在訓(xùn)練樣本數(shù)量充分冗余,類別分布覆蓋面充分廣的條件下,只有跟測試樣本同類別的訓(xùn)練樣本重構(gòu)能力最強(qiáng)。如果令線性表示系數(shù)是稀疏的,則必然有重構(gòu)能力最強(qiáng)的訓(xùn)練樣本所對應(yīng)的線性表示系數(shù)非零,而其余參加重構(gòu)的訓(xùn)練樣本對應(yīng)的系數(shù)為零。
[0003]對于人臉識別等生物特征識別問題,如何處理有遮擋(墨鏡、圍巾等)情況下的識別與分類困擾著該領(lǐng)域的研究人員,同時也決定了ー個實(shí)際生物特征識別系統(tǒng)的穩(wěn)定性與實(shí)用性。然而,上述中的大多數(shù)模型都不能很好的解決遮擋噪聲對識別分類結(jié)果的干擾,也沒有考慮遮擋這ー常見噪聲的結(jié)構(gòu)特性。為此,本模型中引入遮擋噪聲的空間連續(xù)性先驗(yàn),即使得被恢復(fù)出的遮擋噪聲相鄰像素的ー階差分值盡可能小,進(jìn)而使得模型對像遮擋這樣的連續(xù)性噪聲更加魯棒。
【發(fā)明內(nèi)容】
[0004]為了解決現(xiàn)有技術(shù)存在的空缺,本發(fā)明的目的是提供一種基于結(jié)構(gòu)先驗(yàn)知識的生物特征識別方法,本發(fā)明根據(jù)實(shí)際中遮擋等噪聲一般具有空間連續(xù)性這一先驗(yàn)知識,對線性表示中的噪聲項(xiàng)施加連續(xù)性約束,即令遮擋噪聲項(xiàng)的相鄰像素值的ー階差分值盡可能小。同時本發(fā)明還使用魯棒M估計(jì)子(Robust M-Estimator)來約束重構(gòu)系數(shù)、遮擋噪聲項(xiàng)以及重構(gòu)誤差,從而解決了 LI約束使得優(yōu)化目標(biāo)函數(shù)在原點(diǎn)處不可微,L2約束使得模型對遮擋等大噪聲十分敏感,過分?jǐn)M合噪聲誤差等問題。
[0005]本發(fā)明提出的一種基于結(jié)構(gòu)先驗(yàn)知識的生物特征識別方法包括以下步驟:
[0006]步驟SI,收集圖像數(shù)據(jù)形成訓(xùn)練樣本集和測試樣本集;
[0007]步驟S2,提取所述訓(xùn)練樣本集中每個訓(xùn)練樣本的特征向量,并將提取得到的特征向量組成字典矩陣X ;
[0008]步驟S3,基于所述字典矩陣X,通過優(yōu)化算法計(jì)算得到與所述測試樣本集中的每一測試樣本對應(yīng)的重構(gòu)系數(shù)向量;
[0009]步驟S4,基于所述字典矩陣X,使用與所述測試樣本集中的每ー測試樣本對應(yīng)的重構(gòu)系數(shù)向量進(jìn)行樣本重構(gòu),得到與每ー測試樣本對應(yīng)的分屬于不同類別的重構(gòu)測試樣本,與相應(yīng)測試樣本最為接近的重構(gòu)訓(xùn)練樣本的類別即為所述測試樣本的類別。
[0010]由于本發(fā)明中引入了遮擋噪聲的空間連續(xù)性先驗(yàn)知識,從而使本發(fā)明對生物特征識別的過程中的遮擋類噪聲更加魯棒,進(jìn)而提高了生物特征識別分類的準(zhǔn)確率。
【專利附圖】
【附圖說明】
[0011]圖1是本發(fā)明提出的基于結(jié)構(gòu)先驗(yàn)知識的生物特征識別方法流程圖。
【具體實(shí)施方式】
[0012]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,以下結(jié)合具體實(shí)施例,并參照附圖,對本發(fā)明進(jìn)ー步詳細(xì)說明。
[0013]本發(fā)明通過引入遮擋噪聲的空間連續(xù)性這ー結(jié)構(gòu)先驗(yàn)知識,有效的處理在有遮擋噪聲情況下的生物特征識別問題,使得生物特征識別更加的穩(wěn)定與實(shí)用。
[0014]圖1是本發(fā)明提出的基于結(jié)構(gòu)先驗(yàn)知識的生物特征識別方法流程圖,本發(fā)明的識別方法適用于對于任何生物特征的識別,下文以人臉識別為例對本發(fā)明方法進(jìn)行介紹,如圖1所示,所述生物特征識別方法包括以下步驟:
[0015]步驟S1,收集圖像數(shù)據(jù)形成訓(xùn)練樣本集和測試樣本集;
[0016]其中,每個樣本集中包含有多個類別的圖像,且每個類別包含有多張圖像(例如同一人臉的不同圖像)。
[0017]對于訓(xùn)練樣本集,其中的圖像均為無遮擋噪聲的正常圖像;對于測試樣本集,其中的圖像為有遮擋噪聲(墨鏡、圍巾等)的圖像。
[0018]步驟S2,提取所述訓(xùn)練樣本集中每個訓(xùn)練樣本的特征向量,并將提取得到的特征向量組成字典矩陣X ;
[0019]該步驟中提取所述特征向量的步驟進(jìn)一歩包括:
[0020]步驟S21,將某ー訓(xùn)練樣本的各列像素值順序連接拉直成為ー個新的列向量;
[0021]步驟S22,將得到的列向量進(jìn)行歸一化(比如歸ー化到[0,1]之間)后得到的向量作為該訓(xùn)練樣本的特征向量。
[0022]之后,將訓(xùn)練樣本集中所有訓(xùn)練樣本的特征向量按照類別依次排列就組成了所述字典矩陣X。
[0023]步驟S3,基于所述字典矩陣X,通過優(yōu)化算法計(jì)算得到與所述測試樣本集中的每一測試樣本對應(yīng)的重構(gòu)系數(shù)向量;
[0024]所述步驟S3進(jìn)ー步包括以下步驟:
[0025]步驟S31,將待識別的測試樣本集中的某一測試樣本表示成為重構(gòu)項(xiàng)、噪聲項(xiàng)以及重構(gòu)誤差項(xiàng)z之和:
[0026]y = Xβ +e+z,
[0027]其中,y表示某一測試樣本;P為與該測試樣本對應(yīng)的重構(gòu)系數(shù)向量;X@為與該測試樣本對應(yīng)的重構(gòu)項(xiàng),所述重構(gòu)項(xiàng)也可以理解為是所述訓(xùn)練樣本集中所有訓(xùn)練樣本的特征向量的線性加權(quán)和,加權(quán)系數(shù)即為重構(gòu)系數(shù);e為噪聲向量;z為重構(gòu)誤差向量。
[0028]步驟S32,在上述約束條件下,通過最小化目標(biāo)函數(shù),使重構(gòu)系數(shù)向量0和噪聲向量e稀疏化,重構(gòu)誤差向量z最小化,同時使噪聲向量e的鄰接像素ー階差分最小化,進(jìn)而求得重構(gòu)系數(shù)向量3。
[0029]所述重構(gòu)誤差向量z屬于高斯噪聲,其與噪聲向量e相比較小,實(shí)際中可以忽略不計(jì)。
[0030]在本發(fā)明ー實(shí)施例中,所述目標(biāo)函數(shù)表示為:
【權(quán)利要求】
1.一種基于結(jié)構(gòu)先驗(yàn)知識的魯棒生物特征識別方法,其特征在于,所述方法包括以下步驟: 步驟SI,收集圖像數(shù)據(jù)形成訓(xùn)練樣本集和測試樣本集; 步驟S2,提取所述訓(xùn)練樣本集中每個訓(xùn)練樣本的特征向量,并將提取得到的特征向量組成字典矩陣X ; 步驟S3,基于所述字典矩陣X,通過優(yōu)化算法計(jì)算得到與所述測試樣本集中的每ー測試樣本對應(yīng)的重構(gòu)系數(shù)向量; 步驟S4,基于所述字典矩陣X,使用與所述測試樣本集中的每ー測試樣本對應(yīng)的重構(gòu)系數(shù)向量進(jìn)行樣本重構(gòu),得到與每ー測試樣本對應(yīng)的分屬于不同類別的重構(gòu)測試樣本,與相應(yīng)測試樣本最為接近的重構(gòu)訓(xùn)練樣本的類別即為所述測試樣本的類別。
2.根據(jù)權(quán)利要求1所述的方法,其特征在干,每個樣本集中包含有多個類別的圖像,每個類別包含有多張圖像。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述訓(xùn)練樣本集中的圖像為無遮擋噪聲的圖像;所述測試樣本集中的圖像為有遮擋噪聲的圖像。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S2中提取所述特征向量的步驟進(jìn)ー步包括: 步驟S21,將某ー訓(xùn)練樣本的各列像素值順序連接成為ー個新的列向量; 步驟S22,將得到的列向量進(jìn)行歸一化后得到的向量作為該訓(xùn)練樣本的特征向量。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述字典矩陣X由所述訓(xùn)練樣本集中所有訓(xùn)練樣本的特征向量按照類別依次排列組成。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S3進(jìn)ー步包括以下步驟: 步驟S31,將待識別的測試樣本集中的某一測試樣本表示成為重構(gòu)項(xiàng)、噪聲項(xiàng)以及重構(gòu)誤差項(xiàng)z之和:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述目標(biāo)函數(shù)表示為:
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述變換矩陣的主對角線元素為1,主對角線上方的第一個對角線元素均為-1,其余元素為O。
9.根據(jù)權(quán)利要求7所述的方法,其特征在干,采用乘性半二次最小化算法來優(yōu)化所述目標(biāo)函數(shù)。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S4中,分別計(jì)算不同類別的重構(gòu)測試樣本與相應(yīng)的測試樣本之間的殘差,使得殘差最小的那個重構(gòu)訓(xùn)練樣本的類別即為所述測試樣本的類 別。
【文檔編號】G06K9/62GK103440504SQ201310418307
【公開日】2013年12月11日 申請日期:2013年9月13日 優(yōu)先權(quán)日:2013年9月13日
【發(fā)明者】譚鐵牛, 王亮, 赫然, 王東 申請人:中國科學(xué)院自動化研究所