針對(duì)注冊(cè)人臉和待識(shí)別人臉圖片質(zhì)量不同的人臉識(shí)別方法
【技術(shù)領(lǐng)域】
[0001 ]本發(fā)明涉及一種人臉識(shí)別方法。
【背景技術(shù)】
[0002] 已有的人臉識(shí)別都是基于系統(tǒng)中已注冊(cè)人臉和待識(shí)別人臉圖像的質(zhì)量相同的假 設(shè)。而實(shí)際應(yīng)用中的人臉識(shí)別,比如視頻監(jiān)控應(yīng)用中,通常都是已注冊(cè)人臉和待識(shí)別人臉質(zhì) 量存在很大不同,通常情況是數(shù)據(jù)庫(kù)系統(tǒng)中注冊(cè)的人臉圖像質(zhì)量高(正臉、分辨率高、光照 條件良好等),而監(jiān)控視頻中采集到的待識(shí)別人臉圖像質(zhì)量低(側(cè)臉、分辨率低、光照較暗、 模糊等)。如果僅僅是將已注冊(cè)人臉和待識(shí)別人臉變換到同一尺寸,會(huì)導(dǎo)致極大的信息損 失,從而影響人臉識(shí)別的精度。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明的目的是提供一種更加高效、更加魯棒的人臉識(shí)別方法。
[0004] 為了達(dá)到上述目的,本發(fā)明的技術(shù)方案是提供了一種針對(duì)注冊(cè)人臉和待識(shí)別人臉 圖片質(zhì)量不同的人臉識(shí)別方法,其特征在于:針對(duì)不同質(zhì)量的圖像訓(xùn)練不同的神經(jīng)網(wǎng)絡(luò)以 提取特征,并通過(guò)度量學(xué)習(xí)的方法來(lái)計(jì)算兩不同質(zhì)量圖像特征之間的距離,該算法包括以 下步驟:
[0005] 第一步、構(gòu)建一個(gè)Nh層的高質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò),待學(xué)習(xí)參數(shù)為0H、WH,及一個(gè)N L層 的低質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò),待學(xué)習(xí)參數(shù)為9^1^如>凡,將目標(biāo)函數(shù)1定義為:
[0006]
[0007]
[0008]
中:g( ·)表示羅杰斯特?fù)p失函數(shù),τ表示邊緣位置,μ表 示與邊緣的最小距離,h用于標(biāo)定第i個(gè)由高質(zhì)量的人臉圖像/f和低質(zhì)量的人臉圖像/?構(gòu) 成的人臉對(duì)中的臉是否為同一個(gè)人的人臉,如果第i個(gè)由高質(zhì)量的人臉圖像和低質(zhì)量的 人臉圖像/?構(gòu)成的人臉對(duì)中的臉是同一個(gè)人的臉,則1 i = 1,否則,1 i = - 1,
表示第i個(gè)由高質(zhì)量的人臉圖像jf和低質(zhì)量 2. 的人臉圖像構(gòu)成的人臉對(duì)中的兩張臉之間的距離,表示高質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò) 的未經(jīng)過(guò)特征對(duì)齊的輸出,表示低質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò)的未經(jīng)過(guò)特征對(duì)齊的輸出, 表示高質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò)的第η層濾波器,表示低質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò)的第η 層濾波器,λ表示卷積神經(jīng)子網(wǎng)絡(luò)的正則項(xiàng)系數(shù),γ表示用于特征對(duì)齊的全連接層的正則項(xiàng) 系數(shù),表示向量的F范數(shù);
[0009] 第二步、利用樣本集對(duì)高質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò)及低質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò),學(xué)習(xí)得 到參數(shù)0h、Wh、9l、Wl,其中,樣本集包括多對(duì)數(shù)據(jù)對(duì),每對(duì)數(shù)據(jù)對(duì)由一張高質(zhì)量的人臉圖像及 一張低質(zhì)量的人臉圖像組成;
[0010] 第三步、在人臉識(shí)別系統(tǒng)中注冊(cè)高質(zhì)量的人臉圖像,實(shí)時(shí)捕獲低質(zhì)量的人臉圖像 后,將低質(zhì)量的人臉圖像與已注冊(cè)的高質(zhì)量的人臉圖像一一比對(duì),第i對(duì)已注冊(cè)的高質(zhì)量的 人臉圖像/f與低質(zhì)量的人臉圖像/f的比對(duì)步驟包括:
[0011] 步驟3.1、分別將高質(zhì)量的人臉圖像/f及低質(zhì)量的人臉圖像/f輸入訓(xùn)練后的高 質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò)及低質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò),得到對(duì)齊后的輸出 % Gf)及 若心則人臉圖像/f與人臉圖像jf屬于同一個(gè)人,否則,屬于不同人。
[0013] 優(yōu)選地,所述高質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò)為8層,第一層為高質(zhì)量圖像輸入層,最后一 層為高質(zhì)量圖像全連接層,由高質(zhì)量圖像輸入層至高質(zhì)量圖像全連接層依次為:卷積層一、 最大池化層一、卷積層二、最大池化層二、卷積層三、最大池化層三。
[0014] 優(yōu)選地,所述低質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò)為6層,第一層為低質(zhì)量圖像輸入層,最后一 層為低質(zhì)量圖像全連接層,由低質(zhì)量圖像輸入層至低質(zhì)量圖像全連接層依次為:卷積層一、 最大池化層一、卷積層二、最大池化層二。
[0015] 本發(fā)明在兩個(gè)公共數(shù)據(jù)集上與其他方法進(jìn)行比較,包括C0X和PaSC。識(shí)別率可以作 為衡量算法魯棒性和高效性的評(píng)判標(biāo)準(zhǔn),性能評(píng)估是用R0C曲線來(lái)展現(xiàn)的。
[0016] 在兩個(gè)數(shù)據(jù)集的不同實(shí)驗(yàn)設(shè)置情況下,本發(fā)明與現(xiàn)有最好技術(shù)的準(zhǔn)確率對(duì)比,如 下表所示(該表表示在PaSC和C0X兩個(gè)數(shù)據(jù)集上面不同方法的人臉認(rèn)證準(zhǔn)確率)。
[0017]
[0018] 注:SRDML表示本發(fā)明提供的算法。
【附圖說(shuō)明】
[0019] 圖1為高質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu);
[0020] 圖2為低質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu);
[0021] 圖3特征對(duì)齊示意圖;
[0022] 圖4為在COX數(shù)據(jù)集上面,本發(fā)明方法與現(xiàn)有最好技術(shù)的ROC曲線的對(duì)比圖;
[0023] 圖5A為本發(fā)明在椒鹽噪聲影響下的魯棒性分析圖;
[0024] 圖5B為本發(fā)明在高斯噪聲影響下的魯棒性分析圖;
[0025] 圖5C為本發(fā)明在遮擋的影響下的魯棒性分析圖;
[0026] 圖6為不同分辨率下本發(fā)明的算法高效性示意圖;
[0027]圖7A及圖7B為本發(fā)明方法在PaSC數(shù)據(jù)集上部分人臉距離度量的結(jié)果,圖7A為高質(zhì) 量圖像的特征分布圖,圖7B為低質(zhì)量圖像的特征分布圖,圖中,subjectl至subject5為不同 個(gè)人。
【具體實(shí)施方式】
[0028]為使本發(fā)明更明顯易懂,茲以優(yōu)選實(shí)施例,并配合附圖作詳細(xì)說(shuō)明如下。
[0029]本發(fā)明需要解決給定一個(gè)人臉圖像對(duì),判斷該圖像對(duì)是否屬于同一個(gè)人的問題。 詳細(xì)說(shuō)明如下:數(shù)據(jù)集中第i個(gè)人臉對(duì)可以表示成(if,if、it分別表示高、低質(zhì)量的 人臉圖像?;谏疃壬窠?jīng)網(wǎng)絡(luò)的方法會(huì)學(xué)習(xí)到if、/?的更加具有區(qū)分性的特征表達(dá) 算法的目標(biāo)是解決如下問題:當(dāng)人臉對(duì)屬于同一個(gè)人的時(shí)候,d2 當(dāng)人臉對(duì)屬于不同 人的時(shí)候,d22 τ+μ。
[0030]本發(fā)明提供了一種針對(duì)注冊(cè)人臉和待識(shí)別人臉圖片質(zhì)量不同的人臉識(shí)別方法,包 括以下步驟:
[0031] 第一步、構(gòu)建一個(gè)ΝΗ層的高質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò),待識(shí)別參數(shù)為0H、WH,及一個(gè)N L層 的低質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò),待識(shí)別參數(shù)為9L、WL,NH>N L。
[0032] 對(duì)于高質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò)而言,其輸入的圖像尺寸更大,因此其神經(jīng)網(wǎng)絡(luò)的層 數(shù)更深;對(duì)于低質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò)而言,其輸入的圖像尺寸更小,因此其神經(jīng)網(wǎng)絡(luò)的層數(shù) 略淺。如圖1及圖2所示,在本實(shí)施例中,高質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò)為8層,第一層為高質(zhì)量圖像 輸入層,最后一層為高質(zhì)量圖像全連接層,由高質(zhì)量圖像輸入層至高質(zhì)量圖像全連接層依 次為:卷積層一、最大池化層一、卷積層二、最大池化層二、卷積層三、最大池化層三。
[0033] 低質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò)為6層,第一層為低質(zhì)量圖像輸入層,最后一層為低質(zhì)量圖 像全連接層,由低質(zhì)量圖像輸入層至低質(zhì)量圖像全連接層依次為:卷積層一、最大池化層 一、卷積層二、最大池化層二。
[0034] 在圖1及圖2中,最外圈的數(shù)字表示圖像的尺寸大小,而位于外圈左下角的數(shù)字表 示對(duì)應(yīng)的通道數(shù),例如對(duì)于圖1的第一層高質(zhì)量圖像輸入層而言,其圖像大小為134*107,對(duì) 應(yīng)的通道數(shù)為3。由此可見,高質(zhì)量卷積神經(jīng)子網(wǎng)絡(luò)的輸入尺寸更大,低質(zhì)量卷積神經(jīng)子網(wǎng) 絡(luò)的輸入尺寸更小。而且兩個(gè)子網(wǎng)絡(luò)的輸入尺寸是由所有訓(xùn)練樣本尺寸的中位數(shù)決定的。 每一層的中間方框的一圈數(shù)字表示該層的濾波器的尺寸,用于進(jìn)行卷積操作;卷積層的方 塊對(duì)應(yīng)的數(shù)字表示經(jīng)過(guò)卷積后的特征圖的尺寸和對(duì)應(yīng)的通道數(shù),通過(guò)卷積運(yùn)算,可以使原 信號(hào)特征增強(qiáng),并且降低噪音。例如對(duì)于圖1的第一層高質(zhì)量圖像輸入層而言,其濾波器尺 寸為9*9。由圖1及圖2可知,圖像在經(jīng)過(guò)最大池化層操作后,池化后的特征具有更低的維度, 同時(shí)還會(huì)改善結(jié)果(不容易過(guò)擬合)。圖1及圖2中,最后一層,即全連接層的長(zhǎng)方體的數(shù)字表 示對(duì)應(yīng)神經(jīng)元的個(gè)數(shù),全連接層的操作相當(dāng)于特征對(duì)齊的過(guò)程。
[0035] 在本實(shí)施例中,特征對(duì)齊的過(guò)程參見圖3,最底層神經(jīng)元的顏色較淺部分表示與人 臉中眼睛特征有關(guān)的神經(jīng)元,顏色較深部分表示與人臉中嘴巴特征有關(guān)的