本發(fā)明屬于模式識別、計算機視覺、圖像處理領域,涉及一種以面部關鍵點局部特征為核心的模糊人臉判別方法,可用于對一般性二維人臉圖像是否模糊進行智能判別。
背景技術:
隨著計算機軟硬件技術的飛速發(fā)展以及圖像和視頻采集設備的不斷普及,以人臉識別為代表的智能圖像數(shù)據(jù)分析識別技術得到了越來越廣泛的認可和應用。然而,再優(yōu)秀的智能分析算法也必須以高質(zhì)量的輸入信息為基本前提,低質(zhì)量的輸入信息必然直接影響算法的整體分析效果。因此,對所獲取的人臉圖像進行自動質(zhì)量評價,避免過低質(zhì)量的圖像被輸入后續(xù)處理環(huán)節(jié)造成判斷失誤,是具有直觀實際意義的應用研究技術。
由聚焦問題、設備分辨率問題、采光問題、數(shù)據(jù)壓縮等造成的圖像模糊是目前直接影響人臉圖像質(zhì)量的重要因素之一。由于直接影響圖像內(nèi)容的描述和表達,圖像模糊能夠?qū)λ惴ň犬a(chǎn)生直接影響,且難以通過后續(xù)處理算法進行修復(基于信息守恒原理)。因此,有效濾除低質(zhì)量模糊人臉圖像無疑能夠直接提升自動分析算法的處理效果,降低發(fā)生誤判的可能性。注:在當今大數(shù)據(jù)時代,信息資源極大豐富,相比于判斷失誤和識別誤差,在絕大多數(shù)情況下,拒絕低質(zhì)量圖像所帶來的損失已經(jīng)非常微小,例如,隨著數(shù)字圖像拍攝設備的普及,當人們發(fā)現(xiàn)拍攝到一幅模糊圖像時,通??梢灾苯釉傺a拍一張,不用付出任何費用。
在相關技術方面,以往的相關研究中,有一些針對一般性圖像的模糊判別工作,如:首先進行圖像邊緣提取,而后進行基于邊緣均值的模糊程度度量方法;利用圖像的奇異值分析判別圖像模糊等。但專門針對人臉圖像自身的具體特點進行模糊判別的相關方法目前并不多見。
技術實現(xiàn)要素:
本發(fā)明的目的是克服現(xiàn)有技術中存在的不足,提出一種能夠?qū)iT針對人臉圖像特點的模糊圖像自動判別方法。為實現(xiàn)該功能,本發(fā)明設計了由“方法訓練階段”和“在線使用階段”兩部分構成的綜合性方法策略,具體技術實現(xiàn)方案如下。
以關鍵點局部鄰域的高頻分析為核心的模糊人臉判別方法,基本步驟包括:
方法訓練階段:
(1)搭建由清晰人臉和模糊人臉圖像組成的訓練樣本集合;
(2)人工標定各訓練人臉圖像上處在核心位置的關鍵點(共49個)的坐標,并進行關鍵點自動提取模型的訓練;
(3)依據(jù)位于眼部的關鍵點的坐標,計算眼部區(qū)域的重心:
其中,xlec和xrec分別表示左眼和右眼的重心;
(4)根據(jù)連接兩眼重心的向量對各人臉圖像進行標準化,標準化過程依據(jù)仿射變換進行;
(5)提取每個關鍵點周圍鄰接的方形局部區(qū)域,以其為特征提取的對象區(qū)域;
(6)基于離散余弦變換方法,提取各關鍵點周圍局部鄰接區(qū)域的高頻圖像特征;
(7)根據(jù)訓練樣本數(shù)據(jù),為每一人臉關鍵點對應的局部鄰接區(qū)域分別訓練一個基于高頻圖像特征的隨機森林分類器,用于判斷區(qū)分模糊區(qū)域和清晰區(qū)域;
(8)基于adaboost算法進行分類器集成,將所有關鍵點局部鄰域的模糊判別分類器集成為一個統(tǒng)一模糊人臉判別分類器;
在線使用階段:
(9)對于待判定的實際圖像,首先基于受限局部模型(clm)方法自動分析提取其上人臉關鍵點的坐標,并采用與對訓練樣本同樣的方法進行人臉圖像標準化處理;
(10)提取待判定人臉圖像上每一關鍵點對應的局部鄰接區(qū)域的高頻圖像特征;
(11)將關鍵點局部鄰域的高頻圖像特征輸入已學習構建的集成分類器,判定整幅人臉圖像是否模糊。
本發(fā)明是一種專門針對普通二維人臉圖像的模糊判別方法,跟現(xiàn)有技術相比,本發(fā)明的主要優(yōu)勢在于:
(1)本發(fā)明以關鍵點的局部鄰接區(qū)域為特征提取對象。由于僅考慮關鍵點周圍鄰接的小局部區(qū)域,該特征與人臉樣貌的相關性較低,使得本發(fā)明方法可以不受輸入人臉與訓練人臉之間相似程度的限制,從而使方法可以擺脫對訓練樣本的依賴,更具泛化能力,一般性更強。此外,由于特征提取區(qū)域的范圍較小,該特征對于人臉的姿態(tài)改變也具有一定適應能力,從而進一步拓寬了方法的適用范圍,增強了魯棒性。
(2)由于與具體人臉樣貌的相關度較小,本發(fā)明的訓練學習僅基于少量訓練樣本即可完成,因此本發(fā)明訓練階段的耗時較短。
(3)本發(fā)明采用的局部細節(jié)特征結合集成分類器的綜合模糊判定策略,既能夠通過特征局部化有效提升判別特征的可靠性和一般性,同時又能夠充分利用面部所有核心特征進行整體綜合判決,從而有效降低局部判斷誤差對全局精度的影響,做到二者兼顧。
(4)本發(fā)明的自動化程度高,實際使用階段基本不需要人工干預,也不需要根據(jù)具體輸入數(shù)據(jù)的差異進行人工參數(shù)調(diào)整,魯棒性好。
(5)本發(fā)明專門針對人臉圖像設計,依據(jù)人臉圖像獨有的專門化特征,在整體策略方面更具針對性,屬于針對具體問題設計的定制化解決思路,專門性更強,因此對比一般性方法更容易達到較高的判別精度。
附圖說明
圖1-1為本發(fā)明方法的訓練階段;圖1-2為本發(fā)明方法的在線使用階段。
圖2本發(fā)明方法所采用的49個面部關鍵點位置。
圖3本發(fā)明設計的關鍵點局部鄰接區(qū)域的范圍示例。
具體實施方式
人臉圖像是一類較為特殊的圖像,其在整體拓撲結構和細節(jié)內(nèi)容方面均與一般性圖像有一定差別,具有一定獨特特質(zhì)。因此,對該類圖像進行模糊判別,不應拘泥于傳統(tǒng)一般性方法(尤其在所采用的判定特征方面),而應將工作重點放在對人臉圖像專屬特征的挖掘和利用上。同時,由于該問題上特征的專門化定制程度較高,采用經(jīng)過針對性訓練學習構建的分類器完成模糊人臉區(qū)分工作更具優(yōu)勢,所以本發(fā)明也設計采用了以分類器為主要工具的判定區(qū)分機制。下文將對本發(fā)明實施方法進行更為具體的介紹和描述:
方法訓練階段:
本發(fā)明中的關鍵點自動定位模型構建和模糊判別分類器的學習模塊均需要依據(jù)一定訓練樣本進行,因此,本發(fā)明方法的實施首先面臨訓練數(shù)據(jù)的選擇問題。為保證正負訓練樣本均衡,本發(fā)明以同樣數(shù)目的清晰和模糊人臉圖像作為訓練樣本。由于采用與具體人臉樣貌相關性較小的關鍵點局部特征,本發(fā)明不需要依賴大量標注訓練樣本進行學習構建,具體操作過程中,僅取100幅清晰人臉和100幅模糊人臉即可達到理想效果。
對原始訓練圖像數(shù)據(jù)進行預處理和統(tǒng)一標準化,去除個體樣本之間由非核心因素造成的圖像內(nèi)容差異,是進行關鍵點自動提取模型構建和分類器學習搭建的基本前提和必要階段。本發(fā)明設計的具體預處理措施包括:1、由于以圖像紋理為主要區(qū)分特征,色彩信息對本發(fā)明方法幾乎沒有幫助,為降低處理數(shù)據(jù)規(guī)模,本發(fā)明首先將所有圖像統(tǒng)一轉(zhuǎn)化為256色灰度圖。2、進行圖像的灰度統(tǒng)一化工作,每幅圖像上的每個像素的灰度值均減去該圖像的灰度均值并除以其灰度標準差。3、由于本發(fā)明方法的分析判斷主要基于局部特征,而面積較小的局部區(qū)域內(nèi)容對圖像的方向和尺度改變均較為敏感,本發(fā)明選擇在提取特征前首先對圖像進行方向和尺度的標準化工作。其中,方向標準化基于兩眼重心連接向量與水平線的夾角進行,尺度標準化基于兩眼重心連接向量的長度統(tǒng)一化進行。二者的實現(xiàn)均基于圖像的仿射變換i(w(x,θ)),其中,i表示圖像,x表示其中的像素坐標,w代表仿射變換,θ為其參數(shù)。θ的具體取值可基于上述兩方面的內(nèi)容直接求解獲得。人臉圖像上兩眼重心的位置則基于位于眼部區(qū)域的面部關鍵點位置進行計算。
圖像的模糊程度主要體現(xiàn)在細節(jié)紋理信息的清晰程度方面,針對人臉圖像的具體特點,本發(fā)明選擇面部49個分布于眼睛、眉毛、嘴巴等核心部位的關鍵點(參見圖2),在其局部鄰域(參加圖3)進行內(nèi)容提取,并分析其中紋理細節(jié)的清晰程度,從而判定整幅圖像的模糊與否。在訓練圖像上,這些關鍵點的位置將由人工進行直接標定(在標定過程中需確保在每一圖像上均在對應部位準確標定出圖2所示的所有關鍵點),并由不同的人進行檢查校驗,確保標定位置準確無誤。而在實際方法應用過程中,顯然一個自動算法不可能由人工進行這一工作,本發(fā)明選擇采用已被廣泛證實在人臉圖像上具有可靠且穩(wěn)定效果的受限局部模型算法進行關鍵點自動獲取定位。由于人臉關鍵點具有較剛性的整體拓撲結構和代表性特征,本發(fā)明選擇在訓練過程中基于標定訓練樣本對受限局部模型進行預先學習訓練。每幅訓練圖像及其上所有標定關鍵點將被作為一個訓練樣本輸入模型進行訓練,使該模型在學習每個關鍵點的細節(jié)特征的同時也著重掌握擬定位人臉關鍵點的整體拓撲結構,從而實現(xiàn)更高精度的關鍵點提取。
在判斷和決策策略方面,考慮到本發(fā)明的特征提取區(qū)域較小,采用adaboost等具有一定特征自主選擇能力的分類器無法完全展開,本發(fā)明選擇直接指定特征,并訓練專屬分類器進行模糊決策。由于直接反映圖像清晰程度的細節(jié)紋理信息的精細程度主要體現(xiàn)在圖像高頻信息部分,本發(fā)明選擇關鍵點局部鄰接圖像區(qū)域的高頻信息作為判斷模糊的主要特征。在高頻信息的獲取方面,本發(fā)明采用運算高效且僅有實值部分的離散余弦變換進行圖像信息向頻域的轉(zhuǎn)換,并經(jīng)大量實驗驗證分析,明確保留90%的高頻信息作為模糊判別特征。
鑒于人臉上每一關鍵點的局部鄰域特征各不相同(如眼部與嘴部關鍵點的局部鄰域特征就偏差較大),且專門化分類器更有利于達到較高的識別精度,本發(fā)明選擇為每一關鍵點的局部鄰域均單獨學習訓練一個模糊判別分類器。在分類器形式方面,基于大量實驗對比分析,隨機森林分類器的判定精度顯著優(yōu)于支持向量機等經(jīng)典分類器,因此被本發(fā)明采用。
由于本發(fā)明方法以對整幅人臉圖像的模糊判別為核心輸出,而本發(fā)明已構建有49個關鍵點特征區(qū)域的模糊判別分類器,因此對各分類器的集成是必須解決的問題。顯而易見,人臉上各不同位置的關鍵點對全局模糊判別的影響能力和側重評價方面各不相同,采用直接投票的方式無疑等價于忽視這些差異,必然影響最終的判定精度?;诖耍景l(fā)明選擇能夠依據(jù)標定訓練樣本自動分析確定各子分類器權重的基于adaboost的分類器智能集成策略,并在訓練階段基于訓練樣本實現(xiàn)對該集成策略的具體學習構建。
在線使用階段:
當通過離線過程完成對本發(fā)明方法的學習構建之后,本發(fā)明方法即可在線全自動使用,不需要任何人工干預,即可實現(xiàn)對面部人臉是否模糊的自動區(qū)分判別。
對待任意一幅輸入的待判別圖像,本發(fā)明方法將依次采用下列處理分析步驟進行智能模糊判別:
首先,對圖像進行灰度化和灰度統(tǒng)一化(具體方法與處理訓練樣本的相同)。隨后基于受限局部模型算法自動分析提取當前圖像上的所有人臉關鍵點,并基于關鍵點坐標進行圖像尺度和方向的標準化處理。而后再基于離散余弦變換提取每個關鍵點對應局部鄰域的高頻圖像特征。最后將這些特征輸入已學習構建的綜合集成分類器,判定整幅人臉圖像是否模糊。