用于人臉識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明人臉識(shí)別領(lǐng)域,特別是指一種用于人臉識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法和 裝置。
【背景技術(shù)】
[0002] 隨著深度學(xué)習(xí)的興起,特別是深度卷積神經(jīng)網(wǎng)絡(luò)研究的深入,大量的基于卷積神 經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的網(wǎng)絡(luò)模型被應(yīng)用到圖像處理和圖像識(shí)別 等方面,特別是在人臉識(shí)別領(lǐng)域取得了令人矚目的成績。
[0003] 在人臉識(shí)別和認(rèn)證領(lǐng)域里通常會(huì)有這樣的問題,例如,由于化妝和外部環(huán)境影響 可能會(huì)出現(xiàn)兩個(gè)不同人的照片很相似,相同人的兩張照片差異較大。這類異常樣本是造成 識(shí)別錯(cuò)誤的重要原因。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明提供一種用于人臉識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法和裝置,該方法有效的 避免了由于化妝和外部環(huán)境影響導(dǎo)致的識(shí)別錯(cuò)誤。
[0005] 為解決上述技術(shù)問題,本發(fā)明提供技術(shù)方案如下:
[0006] -種用于人臉識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法,包括:
[0007] 構(gòu)建樣本訓(xùn)練庫;其中:所述樣本訓(xùn)練庫包括多個(gè)樣本類,每個(gè)樣本類中包括多個(gè) 人臉圖像樣本;
[0008] 使用所述樣本訓(xùn)練庫訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò);
[0009] 使用訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)提取所述樣本訓(xùn)練庫中的所有樣本的特征向量;
[0010] 計(jì)算每兩個(gè)特征向量之間的距離;
[0011] 構(gòu)建樣本對(duì)訓(xùn)練庫;其中:所述樣本對(duì)訓(xùn)練庫由所有人臉圖像樣本的樣本對(duì)集合 組成,所述樣本對(duì)集合包括異類樣本對(duì)和同類樣本對(duì),所述異類樣本對(duì)由人臉圖像樣本和 與該人臉圖像樣本距離小于一定值的人臉圖像樣本構(gòu)成,所述同類樣本對(duì)由人臉圖像樣本 和與該人臉圖像樣本距離大于一定值的人臉圖像樣本構(gòu)成;
[0012] 使用所述樣本對(duì)訓(xùn)練庫訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)。
[0013] 一種人臉識(shí)別的方法,包括:
[0014] 米集人臉圖像;
[0015] 使用卷積神經(jīng)網(wǎng)絡(luò)提取人臉圖像的特征向量,所述卷積神經(jīng)網(wǎng)絡(luò)通過上述的方法 訓(xùn)練得到;
[0016] 使用所述特征向量進(jìn)行人臉識(shí)別。
[0017] -種用于人臉識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練裝置,包括:
[0018] 第一構(gòu)建單元,用于構(gòu)建樣本訓(xùn)練庫;其中:所述樣本訓(xùn)練庫包括多個(gè)樣本類,每 個(gè)樣本類中包括多個(gè)人臉圖像樣本;
[0019] 第一訓(xùn)練單元,用于使用所述樣本訓(xùn)練庫訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò);
[0020] 提取單元,用于使用訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)提取所述樣本訓(xùn)練庫中的所有樣本的 特征向量;
[0021] 計(jì)算單元,用于計(jì)算每兩個(gè)特征向量之間的距離;
[0022]第二構(gòu)建單元,用于構(gòu)建樣本對(duì)訓(xùn)練庫;其中:所述樣本對(duì)訓(xùn)練庫由所有人臉圖像 樣本的樣本對(duì)集合組成,所述樣本對(duì)集合包括異類樣本對(duì)和同類樣本對(duì),所述異類樣本對(duì) 由人臉圖像樣本和與該人臉圖像樣本距離小于一定值的人臉圖像樣本構(gòu)成,所述同類樣本 對(duì)由人臉圖像樣本和與該人臉圖像樣本距離大于一定值的人臉圖像樣本構(gòu)成;
[0023]第二訓(xùn)練單元,用于使用所述樣本對(duì)訓(xùn)練庫訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)。
[0024] 一種人臉識(shí)別的裝置,包括:
[0025]采集模塊,用于采集人臉圖像;
[0026] 提取模塊,用于使用卷積神經(jīng)網(wǎng)絡(luò)提取人臉圖像的特征向量,所述卷積神經(jīng)網(wǎng)絡(luò) 通過上述的裝置訓(xùn)練得到;
[0027] 識(shí)別模塊,用于使用所述特征向量進(jìn)行人臉識(shí)別。
[0028]本發(fā)明具有以下有益效果:
[0029] 本發(fā)明首先使用樣本訓(xùn)練庫訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),然后使用訓(xùn)練得到的卷積神經(jīng)網(wǎng) 絡(luò)提取特征,并且計(jì)算兩個(gè)特征向量之間的距離;在根據(jù)距離信息構(gòu)建樣本對(duì)訓(xùn)練庫,然后 使用樣本對(duì)訓(xùn)練再次訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),對(duì)卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)一步調(diào)整。
[0030] 由于樣本對(duì)訓(xùn)練庫由所有人臉圖像樣本的異類樣本對(duì)和同類樣本對(duì)構(gòu)成,異類樣 本對(duì)由人臉圖像樣本和與該人臉圖像樣本距離小于一定值的人臉圖像樣本構(gòu)成,同類樣本 對(duì)由人臉圖像樣本和與該人臉圖像樣本距離大于一定值的人臉圖像樣本構(gòu)成,使用樣本對(duì) 訓(xùn)練庫再次訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),即使得卷積神經(jīng)網(wǎng)絡(luò)對(duì)這些同類樣本對(duì)和異類樣本的差異 更敏感,即前述的"加強(qiáng)差異性對(duì)比",有效的避免了由于化妝和外部環(huán)境影響導(dǎo)致的識(shí)別 錯(cuò)誤。
[0031] 因此,本發(fā)明有效的避免了由于化妝和外部環(huán)境影響導(dǎo)致的識(shí)別錯(cuò)誤。
【附圖說明】
[0032] 圖1為本發(fā)明的用于人臉識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法的一個(gè)實(shí)施例的流程 圖;
[0033] 圖2為本發(fā)明中的卷積神經(jīng)網(wǎng)絡(luò)的一個(gè)實(shí)施例的示意圖;
[0034] 圖3為本發(fā)明的用于人臉識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練裝置的一個(gè)實(shí)施例的示意 圖。
【具體實(shí)施方式】
[0035] 為使本發(fā)明要解決的技術(shù)問題、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖及具 體實(shí)施例進(jìn)行詳細(xì)描述。
[0036] -方面,本發(fā)明實(shí)施例提供一種用于人臉識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法,如圖1 所示,包括:
[0037] 步驟101:構(gòu)建樣本訓(xùn)練庫;其中:樣本訓(xùn)練庫包括多個(gè)樣本類,每個(gè)樣本類中包 括多個(gè)人臉圖像樣本。樣本訓(xùn)練庫是經(jīng)過預(yù)處理的人臉圖像樣本整理形成的樣本全集。具 體的,這些人臉圖像樣分為k個(gè)樣本類(同一個(gè)人的人臉圖像樣分組成一個(gè)樣本類),每個(gè)樣 本類包括多個(gè)人臉圖像樣本。并且每個(gè)人臉圖像樣本均對(duì)應(yīng)有一個(gè)類別標(biāo)簽,一個(gè)樣本類 中的人臉圖像樣本的類別標(biāo)簽相同。
[0038] 步驟102:使用樣本訓(xùn)練庫訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)。訓(xùn)練時(shí),需要在卷積神經(jīng)網(wǎng)絡(luò)后面 附加一個(gè)分類網(wǎng)絡(luò),該分類網(wǎng)絡(luò)能把人臉圖像樣本分成k個(gè)類別(k為前述的樣本類的數(shù) 量),然后通過反向傳播得到卷積神經(jīng)網(wǎng)絡(luò)的各個(gè)參數(shù)值。
[0039] 步驟103:使用訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)提取樣本訓(xùn)練庫中的所有樣本的特征向量。 將每個(gè)人臉圖像樣本都經(jīng)過上述訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò),得到一個(gè)固定維數(shù)的特征向量。
[0040] 步驟104:計(jì)算每兩個(gè)特征向量之間的距離。距離是廣義距離定義下的各種距離, 如歐氏距離、余弦距離或馬氏距離等。
[0041] 步驟105:構(gòu)建樣本對(duì)訓(xùn)練庫;其中:樣本對(duì)訓(xùn)練庫由所有人臉圖像樣本的樣本對(duì) 集合組成,樣本對(duì)集合包括異類樣本對(duì)和同類樣本對(duì),異類樣本對(duì)由人臉圖像樣本和與該 人臉圖像樣本距離小于一定值的人臉圖像樣本構(gòu)成,同類樣本對(duì)由人臉圖像樣本和與該人 臉圖像樣本距離大于一定值的人臉圖像樣本構(gòu)成。
[0042] 步驟106:使用樣本對(duì)訓(xùn)練庫訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)。訓(xùn)練時(shí),需要在卷積神經(jīng)網(wǎng)絡(luò)后 面附加一個(gè)分類網(wǎng)絡(luò),該分類網(wǎng)絡(luò)能把人臉圖像樣本對(duì)的結(jié)果分成個(gè)2類別(即人臉樣本對(duì) 是同一個(gè)人或不同的人),然后通過反向傳播得到卷積神經(jīng)網(wǎng)絡(luò)的各個(gè)參數(shù)值。
[0043] 基于人的認(rèn)知特點(diǎn):通過不斷擴(kuò)大同類物體感知范圍和加強(qiáng)差異性對(duì)比,可以提 高身份的辨識(shí)度。例如,對(duì)于陌生的雙胞胎會(huì)經(jīng)常出現(xiàn)錯(cuò)誤識(shí)別,然而對(duì)于熟悉的雙胞胎則 可以迅速分辨。再如,對(duì)于熟悉的明星即便濃妝艷抹,也可以很容易被認(rèn)出。
[0044] 結(jié)合這一發(fā)現(xiàn),類比到卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練算法中,本發(fā)明實(shí)施例首先使用樣本 訓(xùn)練庫訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),然后使用訓(xùn)練得到的卷積神經(jīng)網(wǎng)絡(luò)提取特征,并且計(jì)算兩個(gè)特 征向量之間的距離;在根據(jù)距離信息構(gòu)建樣本對(duì)訓(xùn)練庫,然后使用樣本對(duì)訓(xùn)練再次訓(xùn)練卷 積神經(jīng)網(wǎng)絡(luò),對(duì)卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)一步調(diào)整。
[0045] 由于樣本對(duì)訓(xùn)練庫由所有人臉圖像樣本的異類樣本對(duì)和同類樣本對(duì)構(gòu)成,異類樣 本對(duì)由人臉圖像樣本和與該人臉圖像樣本距離小于一定值的人臉圖像樣本構(gòu)成,同類樣本 對(duì)由人臉圖像樣本和與該人臉圖像樣本距離大于一定值的人臉圖像樣本構(gòu)成,使用樣本對(duì) 訓(xùn)練庫再次訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),即使得卷積神經(jīng)網(wǎng)絡(luò)對(duì)這些同類樣本對(duì)和異類樣本的差異 更敏感,即前述的"加強(qiáng)差異性對(duì)比",有效的避免了由于化妝和外部環(huán)境影響導(dǎo)致的識(shí)別 錯(cuò)誤。
[0046] 因此,本發(fā)明實(shí)施例有效的避免了由于化妝和外部環(huán)境影響導(dǎo)致的識(shí)別錯(cuò)誤。
[0047] 本發(fā)明實(shí)施例中,可以采用各種方法訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),優(yōu)選的,步驟102中使用 樣本訓(xùn)練庫訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)的方法可以為:
[0048] 使用樣本訓(xùn)練庫,并通過sof tmax分類器訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),sof tmax分類器的分 類數(shù)量與樣本類的數(shù)量相同。
[0049]本實(shí)施例中,在訓(xùn)練時(shí),先通過卷積神經(jīng)網(wǎng)絡(luò)提取出人臉圖像樣本的特征向量,然 后使用softmax分類器進(jìn)行分類,此時(shí)的softmax分類器的分類數(shù)量與樣本類的數(shù)量相同 (即樣本類有幾個(gè),S0f tmax分類器就將人臉圖像樣本分為幾類),再進(jìn)行反向傳播,如此迭 代多次,得到卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)。本發(fā)明實(shí)施例通過softmax分類網(wǎng)絡(luò)進(jìn)行訓(xùn)練,避免了 梯度彌散問題。
[0050] 上述各個(gè)實(shí)施例中,距離是廣義距離定義下的各種距離,即滿足正定性,對(duì)稱性以 及三角不等式的所有度量方法。為計(jì)算方便,優(yōu)選的,距離為歐氏距離、余弦距離或馬氏距 離。
[0051] 進(jìn)一步的,步驟106中,使用樣本對(duì)訓(xùn)練庫訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)進(jìn)一步為:
[0052] 使用樣本訓(xùn)練庫,并通過sof tmax分類器訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),sof tmax分類器為二 分類器。
[0053]本實(shí)施例中,在訓(xùn)練時(shí),先通過卷積神經(jīng)網(wǎng)絡(luò)提取出人臉圖像樣本的特征向量,然 后使用sof tmax分類器進(jìn)行分類,此時(shí)的sof tmax分類器為二分類器(即sof tmax分類器對(duì)樣 本對(duì)進(jìn)行處理,判斷是否為同一類),再進(jìn)行反向傳播,如此迭代多次,得到卷積神經(jīng)網(wǎng)絡(luò)的 參數(shù)。本發(fā)明實(shí)施例通過softmax分類網(wǎng)絡(luò)進(jìn)行訓(xùn)練,簡單方便,避免了梯度彌散問題。 [0054] 而且,如圖2所示,上述卷積神經(jīng)網(wǎng)絡(luò)包括:
[0055] 對(duì)人臉圖像樣本進(jìn)行卷積操作,得到卷積特征圖;
[0056] 對(duì)卷積特征圖進(jìn)行激活操作,得到激活特征圖;
[0057] 對(duì)激活特