基于三維點(diǎn)云的三維人臉識(shí)別裝置和方法
【專利摘要】本發(fā)明公開一種基于三維點(diǎn)云的三維人臉識(shí)別裝置和方法,裝置包括:對(duì)于三維點(diǎn)云特征區(qū)域進(jìn)行定位的特征區(qū)域檢測(cè)單元;將三維點(diǎn)云進(jìn)行歸一化映射到深度圖像空間的映射單元;利用不同尺度和方向的Gabor濾波器對(duì)三維人臉數(shù)據(jù)進(jìn)行不同尺度和方向的響應(yīng)進(jìn)行計(jì)算的數(shù)據(jù)計(jì)算單元;訓(xùn)練獲得的三維人臉數(shù)據(jù)的視覺詞典的儲(chǔ)存單元;對(duì)于每個(gè)像素獲得的Gabor響應(yīng)向量,與視覺詞典進(jìn)行直方圖映射的映射計(jì)算單元;對(duì)于三維人臉數(shù)據(jù)進(jìn)行粗分類的分類計(jì)算單元;對(duì)于三維人臉數(shù)據(jù)進(jìn)行識(shí)別的識(shí)別計(jì)算單元。采用本發(fā)明的技術(shù)方案,對(duì)于三維數(shù)據(jù)的細(xì)節(jié)紋理描述能力較強(qiáng),同時(shí)對(duì)輸入三維點(diǎn)云人臉數(shù)據(jù)的質(zhì)量適應(yīng)性更好,因而具有更好的應(yīng)用前景。
【專利說明】基于三維點(diǎn)云的三維人臉識(shí)別裝置和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及三維人臉識(shí)別【技術(shù)領(lǐng)域】,尤其涉及一種基于三維點(diǎn)云的三維人臉識(shí)別裝置和方法。
【背景技術(shù)】
[0002]三維人臉識(shí)別相對(duì)于二維人臉識(shí)別,有著其對(duì)光照魯棒、受姿態(tài)以及表情等因素影響較小等優(yōu)點(diǎn),因此在三維數(shù)據(jù)采集技術(shù)飛速發(fā)展以及三維數(shù)據(jù)的質(zhì)量和精度大大提升之后,很多學(xué)者都將他們的研宄投入到該領(lǐng)域中。
[0003]CN201010256907提出了三維彎曲不變量的相關(guān)特征用來進(jìn)行人臉特性描述。該方法通過編碼三維人臉表面相鄰節(jié)點(diǎn)的彎曲不變量的局部特征,提取彎曲不變量相關(guān)特征;對(duì)所述彎曲不變量的相關(guān)特征進(jìn)行簽名并采用譜回歸進(jìn)行降維,獲得主成分,并運(yùn)用K最近鄰分類方法對(duì)三維人臉進(jìn)行識(shí)別。但是由于提取變量相關(guān)特征時(shí)需要復(fù)雜的計(jì)算量,因此在效率上限制了該方法的進(jìn)一步應(yīng)用;
[0004]CN200910197378提出了一種全自動(dòng)三維人臉檢測(cè)和姿勢(shì)糾正的方法。該方法通過對(duì)人臉三維曲面進(jìn)行多尺度的矩分析,提出了臉部區(qū)域特征來粗糙地檢測(cè)人臉曲面,及提出鼻尖區(qū)域特征來準(zhǔn)確地定位鼻尖的位置,然后進(jìn)一步精確地分割出完整的人臉曲面,根據(jù)人臉曲面的距離信息提出鼻根區(qū)域特征來檢測(cè)鼻根的位置后,建立了一個(gè)人臉坐標(biāo)系,并據(jù)此自動(dòng)地進(jìn)行人臉姿勢(shì)的糾正應(yīng)用。該專利目的在于對(duì)三維人臉數(shù)據(jù)的姿態(tài)進(jìn)行估計(jì),屬于三維人臉識(shí)別系統(tǒng)的數(shù)據(jù)預(yù)處理階段。
[0005]三維人臉識(shí)別是三維人臉領(lǐng)域中許多應(yīng)用的基礎(chǔ)性工作。該領(lǐng)域的初始工作大部分是利用三維數(shù)據(jù)的信息:如曲率,深度等等對(duì)人臉進(jìn)行描述,但是由于三維數(shù)據(jù)的采集中有很多數(shù)據(jù)的噪點(diǎn),因此曲率等特征由于其本身對(duì)于噪音的敏感特性,使得其作為三維人臉的特征描述向量在識(shí)別結(jié)果上精度不高;后面在將三維數(shù)據(jù)映射到深度圖數(shù)據(jù)后,很多二維人臉的表象特征開始應(yīng)用到該領(lǐng)域,如主成分分析(PCA)以及Gabor濾波器特征;但是這些特征也有各自的缺點(diǎn):(I)對(duì)于PCA特征,由于其隸屬于全局的表象特征,因此對(duì)于三維數(shù)據(jù)的細(xì)節(jié)紋理描述能力不足(2)對(duì)于Gabor濾波器特征,由于三維數(shù)據(jù)的噪音問題,導(dǎo)致其對(duì)于三維人臉數(shù)據(jù)的描述能力依賴于獲取的三維人臉數(shù)據(jù)的質(zhì)量。
【發(fā)明內(nèi)容】
[0006]為了解決上述技術(shù)問題,本發(fā)明公開一種基于三維點(diǎn)云的三維人臉識(shí)別裝置和方法,本發(fā)明采用如下技術(shù)方案來解決上述技術(shù)問題:
[0007]一種基于三維點(diǎn)云的三維人臉識(shí)別裝置,其特征在于,包括:
[0008]對(duì)于三維點(diǎn)云特征區(qū)域進(jìn)行定位的特征區(qū)域檢測(cè)單元;
[0009]將三維點(diǎn)云進(jìn)行歸一化映射到深度圖像空間的映射單元;
[0010]利用不同尺度和方向的Gabor濾波器對(duì)三維人臉數(shù)據(jù)進(jìn)行不同尺度和方向的響應(yīng)進(jìn)行計(jì)算的數(shù)據(jù)計(jì)算單元;
[0011]訓(xùn)練獲得的三維人臉數(shù)據(jù)的視覺詞典的儲(chǔ)存單元;
[0012]對(duì)于每個(gè)像素獲得的Gabor響應(yīng)向量,與視覺詞典進(jìn)行直方圖映射的映射計(jì)算單元;
[0013]對(duì)于三維人臉數(shù)據(jù)進(jìn)行粗分類的分類計(jì)算單元;
[0014]對(duì)于三維人臉數(shù)據(jù)進(jìn)行人臉識(shí)別的計(jì)算單元。
[0015]優(yōu)選的,在上述的一種基于三維點(diǎn)云的三維人臉識(shí)別裝置中,所述特征區(qū)域檢測(cè)單元包括特征提取單元和對(duì)特征區(qū)域進(jìn)行判斷的特征區(qū)域分類器單元。
[0016]優(yōu)選的,在上述的一種基于三維點(diǎn)云的三維人臉識(shí)別裝置中,所述特征區(qū)域分類器單元為為向量機(jī)或者Adaboost。
[0017]優(yōu)選的,在上述的一種基于三維點(diǎn)云的三維人臉識(shí)別裝置中,所述特征區(qū)域?yàn)楸羌鈪^(qū)域。
[0018]本發(fā)明還公開一種基于三維點(diǎn)云的三維人臉識(shí)別方法,包括如下步驟:
[0019]步驟I數(shù)據(jù)預(yù)處理,首先在三維點(diǎn)云數(shù)據(jù)中根據(jù)數(shù)據(jù)特性定位出特征區(qū)域,作為配準(zhǔn)的基準(zhǔn)數(shù)據(jù),然后對(duì)輸入三維點(diǎn)云數(shù)據(jù)與基礎(chǔ)人臉數(shù)據(jù)進(jìn)行配準(zhǔn);然后利用數(shù)據(jù)的三維坐標(biāo)值,將三維點(diǎn)云數(shù)據(jù)映射為深度圖像;在此數(shù)據(jù)基礎(chǔ)上進(jìn)行表情魯棒區(qū)域的提?。?br>
[0020]步驟2特征提取,進(jìn)行Gabor特征提取,將得到的Gabor響應(yīng)向量構(gòu)成原始圖像的Gabor響應(yīng)向量集合;對(duì)于得到的向量組,將每個(gè)向量都與三維人臉視覺詞典中的每個(gè)視覺詞匯建立對(duì)應(yīng)關(guān)系,從而得到視覺詞典直方圖;
[0021]步驟3粗分類,基于視覺詞典特征向量,得到輸入的三維人臉輸入所對(duì)應(yīng)的具體粗分類;
[0022]步驟4識(shí)別,獲取粗分類信息后,將輸入數(shù)據(jù)的視覺詞典特征向量與數(shù)據(jù)庫中存儲(chǔ)對(duì)應(yīng)粗分類注冊(cè)數(shù)據(jù)的特征向量利用最近鄰分類器進(jìn)行對(duì)比,實(shí)現(xiàn)三維人臉識(shí)別。
[0023]優(yōu)選的,在上述的一種基于三維點(diǎn)云的三維人臉識(shí)別方法中,所述特征區(qū)域?yàn)楸羌鈪^(qū)域,檢測(cè)鼻尖區(qū)域的步驟如下:
[0024]步驟1:確定閾值,確定域平均負(fù)有效能量密度的閾值,定義為thr ;
[0025]步驟2:利用深度信息選取待處理數(shù)據(jù),利用數(shù)據(jù)的深度信息,提取在一定深度范圍內(nèi)的人臉數(shù)據(jù)作為待處理數(shù)據(jù);
[0026]步驟3:法向量的計(jì)算,計(jì)算由深度信息選取出的人臉數(shù)據(jù)的方向量信息;
[0027]步驟4:區(qū)域平均負(fù)有效能量密度的計(jì)算,按照區(qū)域平均負(fù)有效能量密度的定義,求出待處理數(shù)據(jù)中個(gè)連通域的平均負(fù)有效能量密度,選擇其中密度值最大的連通域;
[0028]步驟5:判定是否找到鼻尖區(qū)域,當(dāng)前區(qū)域閾值大于預(yù)定義的thr時(shí),該區(qū)域即為鼻尖區(qū)域,否則回到步驟I重新開始循環(huán)。
[0029]優(yōu)選的,在上述的一種基于三維點(diǎn)云的三維人臉識(shí)別方法中,輸入三維點(diǎn)云數(shù)據(jù)與基礎(chǔ)人臉數(shù)據(jù)利用ICP算法進(jìn)行配準(zhǔn)。
[0030]優(yōu)選的,在上述的一種基于三維點(diǎn)云的三維人臉識(shí)別方法中,在特征提取步驟中,測(cè)試人臉圖像輸入后,經(jīng)過Gabor濾波,將任一濾波向量都與其所在位置相對(duì)應(yīng)的視覺分詞典中的所有基元詞匯比較,通過距離匹配的方式,將其映射到與之距離最為接近的基元上,提取出原始圖像的視覺詞典直方圖特征。
[0031]優(yōu)選的,在上述的一種基于三維點(diǎn)云的三維人臉識(shí)別方法中,粗分類包括訓(xùn)練和識(shí)別兩部分:在訓(xùn)練時(shí),首先對(duì)數(shù)據(jù)集進(jìn)行聚類,將所有數(shù)據(jù)分散到K個(gè)子節(jié)點(diǎn)中存儲(chǔ),將訓(xùn)練后得到的各個(gè)子類的中心作為粗分類參數(shù)存儲(chǔ);在粗分類識(shí)別時(shí),將輸入的數(shù)據(jù)與各子類參數(shù)進(jìn)行匹配,選出最前的η個(gè)子節(jié)點(diǎn)數(shù)據(jù)進(jìn)行匹配。
[0032]優(yōu)選的,在上述的一種基于三維點(diǎn)云的三維人臉識(shí)別方法中,數(shù)據(jù)匹配在粗分類選取的子節(jié)點(diǎn)中進(jìn)行,每個(gè)子節(jié)點(diǎn)返回距離輸入數(shù)據(jù)最近的m個(gè)注冊(cè)數(shù)據(jù),在主節(jié)點(diǎn)中對(duì)此n*m個(gè)注冊(cè)數(shù)據(jù),利用最近鄰分類器實(shí)現(xiàn)人臉識(shí)別。
[0033]與現(xiàn)有技術(shù)相比,本發(fā)明具有如下技術(shù)效果:
[0034]采用本發(fā)明的方案,作為一個(gè)完整的三維人臉識(shí)別解決方案,涵蓋了數(shù)據(jù)預(yù)處理、數(shù)據(jù)配準(zhǔn)、特征提取以及數(shù)據(jù)分類的過程,同現(xiàn)有的基于三維點(diǎn)云的三維人臉識(shí)別方案相比,本發(fā)明的技術(shù)方案對(duì)于三維數(shù)據(jù)的細(xì)節(jié)紋理描述能力較強(qiáng),同時(shí)對(duì)輸入三維點(diǎn)云人臉數(shù)據(jù)的質(zhì)量適應(yīng)性更好,因而具有更好的應(yīng)用前景。
【專利附圖】
【附圖說明】
[0035]圖1為本發(fā)明系統(tǒng)框圖
[0036]圖2為本發(fā)明流程框圖
[0037]圖3為本發(fā)明三維人臉鼻尖區(qū)域示意圖
[0038]圖4為本發(fā)明三維人臉鼻尖區(qū)域定位示意圖
[0039]圖5為本發(fā)明不同姿態(tài)三維人臉配準(zhǔn)示意圖
[0040]圖6為本發(fā)明三維點(diǎn)云數(shù)據(jù)映射為深度圖像的示意圖
[0041]圖7為本發(fā)明三維人臉數(shù)據(jù)的Gabor濾波響應(yīng)示意圖
[0042]圖8為本發(fā)明三維人臉視覺詞典的K均值聚類獲取過程示意圖
[0043]圖9為本發(fā)明三維人臉視覺詞典向量特征的建立過程示意圖
【具體實(shí)施方式】
[0044]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0045]如圖1、2所示,本發(fā)明公開一種基于三維點(diǎn)云的三維人臉識(shí)別裝置,具體包括:
[0046]對(duì)于三維點(diǎn)云特征區(qū)域進(jìn)行定位的特征區(qū)域檢測(cè)單元;
[0047]將三維點(diǎn)云進(jìn)行歸一化映射到深度圖像空間的映射單元;
[0048]利用不同尺度和方向的Gabor濾波器對(duì)三維人臉數(shù)據(jù)進(jìn)行不同尺度和方向的響應(yīng)進(jìn)行計(jì)算的數(shù)據(jù)計(jì)算單元;
[0049]訓(xùn)練獲得的三維人臉數(shù)據(jù)的視覺詞典的儲(chǔ)存單元;
[0050]對(duì)于每個(gè)像素獲得的Gabor響應(yīng)向量,與視覺詞典進(jìn)行直方圖映射的映射計(jì)算單元;
[0051]對(duì)于三維人臉數(shù)據(jù)進(jìn)行粗分類的分類計(jì)算單元;
[0052]對(duì)于三維人臉數(shù)據(jù)進(jìn)行識(shí)別的識(shí)別計(jì)算單元。
[0053]其中,上述的特征區(qū)域檢測(cè)單元包括特征提取單元和對(duì)特征區(qū)域進(jìn)行判斷的特征區(qū)域分類器單元;體征提取單元針對(duì)三維點(diǎn)云的各項(xiàng)特性,如數(shù)據(jù)深度,數(shù)據(jù)密度以及更進(jìn)一步計(jì)算數(shù)據(jù)的三維曲率等內(nèi)在信息,提取點(diǎn)云數(shù)據(jù)的各種特征;而上述的特征區(qū)域分類器單元在上述基礎(chǔ)上行數(shù)據(jù)點(diǎn)的分類計(jì)算,判斷其是否屬于特征區(qū)域;分類器可以是各種強(qiáng)分類器,比如支持向量機(jī),Adaboost等。
[0054]由于鼻尖區(qū)域具有空點(diǎn)密度大,曲率明顯等特性,因此上述特征區(qū)域一般為鼻尖區(qū)域。
[0055]上述的映射單元按照空間信息的(X,y)作為映射的參考空間位置,空間信息的z值作為映射對(duì)應(yīng)數(shù)據(jù)值,構(gòu)建從三維點(diǎn)云到深度圖像的映射,將原始三維點(diǎn)云數(shù)據(jù)按照深度信息映射為深度圖像;
[0056]同時(shí)由于三維數(shù)據(jù)采集過程中存在數(shù)據(jù)噪點(diǎn)(如數(shù)據(jù)空洞或者數(shù)據(jù)跳躍點(diǎn)),可以利用濾波器(如均值濾波)進(jìn)行數(shù)據(jù)噪音過濾。
[0057]如圖1、2所示,本發(fā)明同時(shí)公開一種基于三維點(diǎn)云的三維人臉識(shí)別方法,包括如下步驟:
[0058]步驟I數(shù)據(jù)預(yù)處理,首先在三維點(diǎn)云數(shù)據(jù)中根據(jù)數(shù)據(jù)特性定位出特征區(qū)域,作為配準(zhǔn)的基準(zhǔn)數(shù)據(jù),然后對(duì)輸入三維點(diǎn)云數(shù)據(jù)與基礎(chǔ)人臉數(shù)據(jù)進(jìn)行配準(zhǔn);然后利用數(shù)據(jù)的三維坐標(biāo)值,將三維點(diǎn)云數(shù)據(jù)映射為深度圖像;在此數(shù)據(jù)基礎(chǔ)上進(jìn)行表情魯棒區(qū)域的提取;
[0059]步驟2特征提取,進(jìn)行Gabor特征提取,將得到的Gabor響應(yīng)向量構(gòu)成原始圖像的Gabor響應(yīng)向量集合;對(duì)于得到的向量組,將每個(gè)向量都與三維人臉視覺詞典中的每個(gè)視覺詞匯建立對(duì)應(yīng)關(guān)系,從而得到視覺詞典直方圖;
[0060]步驟3粗分類,基于視覺詞典特征向量,得到輸入的三維人臉輸入所對(duì)應(yīng)的具體粗分類;
[0061]步驟4識(shí)別,獲取粗分類信息后,將輸入數(shù)據(jù)的視覺詞典特征向量與數(shù)據(jù)庫中存儲(chǔ)對(duì)應(yīng)粗分類注冊(cè)數(shù)據(jù)的特征向量利用最近鄰分類器進(jìn)行對(duì)比,實(shí)現(xiàn)三維人臉識(shí)別。
[0062]如圖3、4所示,三維鼻尖區(qū)域具有最高的z值(深度值),明顯的曲率值以及較大的數(shù)據(jù)密度值,因此適合作為數(shù)據(jù)配準(zhǔn)的參考區(qū)域。在本發(fā)明中,特征區(qū)域?yàn)楸羌鈪^(qū)域,檢測(cè)鼻尖區(qū)域的步驟如下:
[0063]步驟1:確定閾值,確定域平均負(fù)有效能量密度的閾值,定義為thr ;
[0064]步驟2:利用深度信息選取待處理數(shù)據(jù),利用數(shù)據(jù)的深度信息,提取在一定深度范圍內(nèi)的人臉數(shù)據(jù)作為待處理數(shù)據(jù);
[0065]步驟3:法向量的計(jì)算,計(jì)算由深度信息選取出的人臉數(shù)據(jù)的方向量信息;
[0066]步驟4:區(qū)域平均負(fù)有效能量密度的計(jì)算,按照區(qū)域平均負(fù)有效能量密度的定義,求出待處理數(shù)據(jù)中個(gè)連通域的平均負(fù)有效能量密度,選擇其中密度值最大的連通域;
[0067]步驟5:判定是否找到鼻尖區(qū)域,當(dāng)前區(qū)域閾值大于預(yù)定義的thr時(shí),該區(qū)域即為鼻尖區(qū)域,否則回到步驟I重新開始循環(huán)。
[0068]如圖5所示,對(duì)于不同姿態(tài)的三維數(shù)據(jù),得到配準(zhǔn)的參考區(qū)域即鼻尖區(qū)域后,按照ICP算法進(jìn)行數(shù)據(jù)的配準(zhǔn);配準(zhǔn)前后的對(duì)比如圖所示。
[0069]圖6為數(shù)據(jù)由三維點(diǎn)云映射到深度圖像的示意圖。將不同姿態(tài)的三維數(shù)據(jù)與參考區(qū)域進(jìn)行配準(zhǔn)后,首先按照深度信息進(jìn)行深度圖像的獲取,然后利用濾波器對(duì)于映射后的深度圖像中的噪音點(diǎn)(數(shù)據(jù)突起點(diǎn)或者空洞點(diǎn))進(jìn)行補(bǔ)償去噪,最后對(duì)表情魯棒區(qū)域進(jìn)行選擇,得到最終的三維人臉深度圖像。
[0070]圖7是三維人臉數(shù)據(jù)的Gabor濾波響應(yīng)示意圖。對(duì)于每一個(gè)尺度每一個(gè)方向,三維深度圖像都會(huì)得到其對(duì)應(yīng)的頻域響應(yīng)。例如四個(gè)方向和五個(gè)尺度的Gabor核函數(shù),則可以得到20個(gè)頻域響應(yīng)圖像。每一個(gè)深度圖像的像素點(diǎn),則得到一個(gè)對(duì)應(yīng)的20維頻域響應(yīng)向量。
[0071]圖8是三維人臉視覺詞典的K均值聚類獲取過程。該視覺詞典是在三維人臉數(shù)據(jù)訓(xùn)練集中通過對(duì)大量數(shù)據(jù)的Gabor濾波響應(yīng)向量集合進(jìn)行K均值聚類獲取的。在實(shí)驗(yàn)數(shù)據(jù)中,每幅深度人臉圖像的大小是80*120。任意選取100幅中性表情人臉圖像作為訓(xùn)練集。如果將這些圖像的Gabor濾波響應(yīng)向量數(shù)據(jù)直接存入一個(gè)三維張量中,其規(guī)模將會(huì)是5*4*80*120*100,包括了 960000個(gè)20維向量。對(duì)于K均值聚類算法來說這是非常巨大的數(shù)據(jù)量。為了解決這個(gè)問題,需要將人臉數(shù)據(jù)首先分割成一系列局部紋理圖像,并對(duì)每個(gè)局部紋理分配一個(gè)三維張量以存儲(chǔ)其Gabor濾波響應(yīng)數(shù)據(jù)。這樣通過將原始數(shù)據(jù)分解,每個(gè)局部紋理三維張量的大小為5*4*20*20*100,是原數(shù)據(jù)規(guī)模的1/24,大大提高了算法的效率。
[0072]圖9說明了三維深度圖像的視覺詞典直方圖特征向量提取流程。當(dāng)測(cè)試人臉圖像輸入后,經(jīng)過Gabor濾波后,將任一濾波向量都與其所在位置相對(duì)應(yīng)的視覺分詞典中的所有基元詞匯比較,通過距離匹配的方式,把它映射到與之距離最為接近的基元上。通過這種方式,就可以提取出原始深度圖像的視覺詞典直方圖特征。其大致流程總結(jié)如下:
[0073]將三維人臉深度圖像分割成一些局部紋理區(qū)域;
[0074]對(duì)于每個(gè)Gabor濾波響應(yīng)向量,按照位置的不同將其映射到其對(duì)應(yīng)的視覺分詞典的詞匯中,并依此為基礎(chǔ)建立視覺詞典直方圖向量作為三維人臉的特診表達(dá);
[0075]將最近鄰分類器用來作為最后的人臉識(shí)別,其中LI距離被選作為距離度量。
[0076]粗分類包括訓(xùn)練和識(shí)別兩部分:在訓(xùn)練時(shí),首先對(duì)數(shù)據(jù)集進(jìn)行聚類,將所有數(shù)據(jù)分散到K個(gè)子節(jié)點(diǎn)中存儲(chǔ),此處聚類方法可以采用多種方式,如K均值,將訓(xùn)練后得到的各個(gè)子類的中心作為粗分類參數(shù)存儲(chǔ);在粗分類識(shí)別時(shí),將輸入的數(shù)據(jù)與各子類參數(shù)(聚類中心)進(jìn)行匹配,選出最前的η個(gè)子節(jié)點(diǎn)數(shù)據(jù)進(jìn)行匹配,以降低匹配的數(shù)據(jù)空間,達(dá)到縮小搜索范圍和加快搜索速度的目的。
[0077]本發(fā)明的方案中,聚類方法采用K均值聚類,其具體步驟如下:
[0078](I)對(duì)于數(shù)據(jù)對(duì)象集,任意選取K個(gè)對(duì)象作為初始的類中心;
[0079](2)根據(jù)類中對(duì)象的平均值,將每個(gè)對(duì)象重新賦給最相似的類;
[0080](3)更新類的平均值,即計(jì)算每個(gè)類中對(duì)象的平均值;
[0081](4)重復(fù)步驟(2) (3)直到不再發(fā)生變化。
[0082]數(shù)據(jù)匹配在粗分類選取的子節(jié)點(diǎn)中進(jìn)行,每個(gè)子節(jié)點(diǎn)返回距離輸入數(shù)據(jù)最近的m個(gè)注冊(cè)數(shù)據(jù),在主節(jié)點(diǎn)中對(duì)此n*m個(gè)注冊(cè)數(shù)據(jù),利用最近鄰分類器實(shí)現(xiàn)人臉識(shí)別。
[0083]獲取粗分類信息后,將輸入數(shù)據(jù)的視覺詞典特征向量與數(shù)據(jù)庫中存儲(chǔ)對(duì)應(yīng)粗分類注冊(cè)數(shù)據(jù)的特征向量利用最近鄰分類器進(jìn)行對(duì)比,從而實(shí)現(xiàn)三維人臉識(shí)別的目的。
[0084]采用本發(fā)明的方案,作為一個(gè)完整的三維人臉識(shí)別解決方案,涵蓋了數(shù)據(jù)預(yù)處理、數(shù)據(jù)配準(zhǔn)、特征提取以及數(shù)據(jù)分類的過程,同現(xiàn)有的基于三維點(diǎn)云的三維人臉識(shí)別方案相比,本發(fā)明的技術(shù)方案對(duì)于三維數(shù)據(jù)的細(xì)節(jié)紋理描述能力較強(qiáng),同時(shí)對(duì)輸入三維點(diǎn)云人臉數(shù)據(jù)的質(zhì)量適應(yīng)性更好,因而具有更好的應(yīng)用前景。
[0085]對(duì)于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實(shí)施例的細(xì)節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實(shí)現(xiàn)本發(fā)明。因此,無論從哪一點(diǎn)來看,均應(yīng)將實(shí)施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化囊括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。
[0086]此外,應(yīng)當(dāng)理解,雖然本說明書按照實(shí)施方式加以描述,但并非每個(gè)實(shí)施方式僅包含一個(gè)獨(dú)立的技術(shù)方案,說明書的這種敘述方式僅僅是為清楚起見,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)將說明書作為一個(gè)整體,各實(shí)施例中的技術(shù)方案也可以經(jīng)適當(dāng)組合,形成本領(lǐng)域技術(shù)人員可以理解的其他實(shí)施方式。
【權(quán)利要求】
1.一種基于三維點(diǎn)云的三維人臉識(shí)別裝置,其特征在于,包括: 對(duì)于三維點(diǎn)云特征區(qū)域進(jìn)行定位的特征區(qū)域檢測(cè)單元; 將三維點(diǎn)云進(jìn)行歸一化映射到深度圖像空間的映射單元; 利用不同尺度和方向的Gabor濾波器對(duì)三維人臉數(shù)據(jù)進(jìn)行不同尺度和方向的響應(yīng)進(jìn)行計(jì)算的數(shù)據(jù)計(jì)算單元; 訓(xùn)練獲得的三維人臉數(shù)據(jù)的視覺詞典的儲(chǔ)存單元; 對(duì)于每個(gè)像素獲得的Gabor響應(yīng)向量,與視覺詞典進(jìn)行直方圖映射的映射計(jì)算單元; 對(duì)于三維人臉數(shù)據(jù)進(jìn)行粗分類的分類計(jì)算單元; 對(duì)于三維人臉數(shù)據(jù)進(jìn)行人臉識(shí)別的計(jì)算單元。
2.根據(jù)權(quán)利要求1所述一種基于三維點(diǎn)云的三維人臉識(shí)別裝置,其特征在于:所述特征區(qū)域檢測(cè)單元包括特征提取單元和對(duì)特征區(qū)域進(jìn)行判斷的特征區(qū)域分類器單元。
3.根據(jù)權(quán)利要求2所述的一種基于三維點(diǎn)云的三維人臉識(shí)別裝置,其特征在于:所述特征區(qū)域分類器單元為為向量機(jī)或者Adaboost。
4.根據(jù)權(quán)利要求1所述的一種基于三維點(diǎn)云的三維人臉識(shí)別裝置,其特征在于:所述特征區(qū)域?yàn)楸羌鈪^(qū)域。
5.一種基于三維點(diǎn)云的三維人臉識(shí)別方法,其特征在于,包括如下步驟: 步驟I數(shù)據(jù)預(yù)處理,首先在三維點(diǎn)云數(shù)據(jù)中根據(jù)數(shù)據(jù)特性定位出特征區(qū)域,作為配準(zhǔn)的基準(zhǔn)數(shù)據(jù),然后對(duì)輸入三維點(diǎn)云數(shù)據(jù)與基礎(chǔ)人臉數(shù)據(jù)進(jìn)行配準(zhǔn);然后利用數(shù)據(jù)的三維坐標(biāo)值,將三維點(diǎn)云數(shù)據(jù)映射為深度圖像;在此數(shù)據(jù)基礎(chǔ)上進(jìn)行表情魯棒區(qū)域的提?。? 步驟2特征提取,進(jìn)行Gabor特征提取,將得到的Gabor響應(yīng)向量構(gòu)成原始圖像的Gabor響應(yīng)向量集合;對(duì)于得到的向量組,將每個(gè)向量都與三維人臉視覺詞典中的每個(gè)視覺詞匯建立對(duì)應(yīng)關(guān)系,從而得到視覺詞典直方圖; 步驟3粗分類,基于視覺詞典特征向量,得到輸入的三維人臉輸入所對(duì)應(yīng)的具體粗分類; 步驟4識(shí)別,獲取粗分類信息后,將輸入數(shù)據(jù)的視覺詞典特征向量與數(shù)據(jù)庫中存儲(chǔ)對(duì)應(yīng)粗分類注冊(cè)數(shù)據(jù)的特征向量利用最近鄰分類器進(jìn)行對(duì)比,實(shí)現(xiàn)三維人臉識(shí)別。
6.根據(jù)權(quán)利要求5所述的一種基于三維點(diǎn)云的人臉識(shí)別方法,其特征在于,所述特征區(qū)域?yàn)楸羌鈪^(qū)域,檢測(cè)鼻尖區(qū)域的步驟如下: 步驟1:確定閾值,確定域平均負(fù)有效能量密度的閾值,定義為thr ; 步驟2:利用深度信息選取待處理數(shù)據(jù),利用數(shù)據(jù)的深度信息,提取在一定深度范圍內(nèi)的人臉數(shù)據(jù)作為待處理數(shù)據(jù); 步驟3:法向量的計(jì)算,計(jì)算由深度信息選取出的人臉數(shù)據(jù)的方向量信息; 步驟4:區(qū)域平均負(fù)有效能量密度的計(jì)算,按照區(qū)域平均負(fù)有效能量密度的定義,求出待處理數(shù)據(jù)中個(gè)連通域的平均負(fù)有效能量密度,選擇其中密度值最大的連通域; 步驟5:判定是否找到鼻尖區(qū)域,當(dāng)前區(qū)域閾值大于預(yù)定義的thr時(shí),該區(qū)域即為鼻尖區(qū)域,否則回到步驟I重新開始循環(huán)。
7.根據(jù)權(quán)利要求5所述的一種基于三維點(diǎn)云的三維人臉識(shí)別方法,其特征在于,輸入三維點(diǎn)云數(shù)據(jù)與基礎(chǔ)人臉數(shù)據(jù)利用ICP算法進(jìn)行配準(zhǔn)。
8.根據(jù)權(quán)利要求5所述的一種基于三維點(diǎn)云的三維人臉識(shí)別方法,其特征在于,在特征提取步驟中,測(cè)試人臉圖像輸入后,經(jīng)過Gabor濾波,將任一濾波向量都與其所在位置相對(duì)應(yīng)的視覺分詞典中的所有基元詞匯比較,通過距離匹配的方式,將其映射到與之距離最為接近的基元上,提取出原始圖像的視覺詞典直方圖特征。
9.根據(jù)權(quán)利要求5所述的一種基于三維點(diǎn)云的三維人臉識(shí)別方法,其特征在于,粗分類包括訓(xùn)練和識(shí)別兩部分:在訓(xùn)練時(shí),首先對(duì)數(shù)據(jù)集進(jìn)行聚類,將所有數(shù)據(jù)分散到K個(gè)子節(jié)點(diǎn)中存儲(chǔ),將訓(xùn)練后得到的各個(gè)子類的中心作為粗分類參數(shù)存儲(chǔ);在粗分類識(shí)別時(shí),將輸入的數(shù)據(jù)與各子類參數(shù)進(jìn)行匹配,選出最前的η個(gè)子節(jié)點(diǎn)數(shù)據(jù)進(jìn)行匹配。
10.根據(jù)權(quán)利要求9所述的一種基于三維點(diǎn)云的三維人臉識(shí)別方法,其特征在于,數(shù)據(jù)匹配在粗分類選取的子節(jié)點(diǎn)中進(jìn)行,每個(gè)子節(jié)點(diǎn)返回距離輸入數(shù)據(jù)最近的m個(gè)注冊(cè)數(shù)據(jù),在主節(jié)點(diǎn)中對(duì)此n*m個(gè)注冊(cè)數(shù)據(jù),利用最近鄰分類器實(shí)現(xiàn)人臉識(shí)別。
【文檔編號(hào)】G06K9/46GK104504410SQ201510006212
【公開日】2015年4月8日 申請(qǐng)日期:2015年1月7日 優(yōu)先權(quán)日:2015年1月7日
【發(fā)明者】夏春秋 申請(qǐng)人:深圳市唯特視科技有限公司