基于多造假方式的人臉活體檢測(cè)方法與流程

文檔序號(hào)：11200152閱讀：1065來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及人臉活體檢測(cè)領(lǐng)域，具體而言，涉及一種基于多造假方式的人臉活體檢測(cè)方法。

背景技術(shù)：

由于人臉容易獲取、非接觸式、使用方便等優(yōu)點(diǎn)，人臉識(shí)別受到人們的喜愛，廣泛應(yīng)用在門禁出入境管理系統(tǒng)、登錄系統(tǒng)等。隨著智能設(shè)備的普及，人臉易被他人獲取，通過面具、照片或者視頻對(duì)人臉識(shí)別系統(tǒng)進(jìn)行攻擊。因此，在人臉識(shí)別系統(tǒng)中，人臉活體檢測(cè)變得非常重要，是保證用戶安全的不可或缺的手段，也是人臉識(shí)別得到廣泛推廣的前提?，F(xiàn)有技術(shù)中，針對(duì)三種不同的造假方式，采用通用的網(wǎng)絡(luò)模型進(jìn)行識(shí)別，但是不同的造假方式，攻擊方式不同，所以一個(gè)通用模型無法在如此多的復(fù)雜情況下學(xué)習(xí)到真假之間本質(zhì)的特征，在遇到具體的造假時(shí)往往效果會(huì)變差。

技術(shù)實(shí)現(xiàn)要素：

有鑒于此，本發(fā)明實(shí)施例的目的在于提供一種基于多造假方式的人臉活體檢測(cè)方法，通過訓(xùn)練多個(gè)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行融合，以判斷人臉圖像是否為活體的人臉圖像。

為了達(dá)到上述的目的，本發(fā)明實(shí)施例采用的技術(shù)方案如下所述：

一種基于多造假方式的人臉活體檢測(cè)方法，所述方法包括：

分別訓(xùn)練基于照片造假、視頻造假和面具造假的卷積神經(jīng)網(wǎng)絡(luò)；

利用層疊泛化算法將所述三個(gè)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行融合，得到分類模型；

獲取待檢測(cè)的人臉圖像；

對(duì)所述人臉圖像進(jìn)行歸一化處理；

將處理后的人臉圖像分別輸入至所述三個(gè)卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行概率預(yù)測(cè)；

將所述三個(gè)卷積神經(jīng)網(wǎng)絡(luò)分別的預(yù)測(cè)結(jié)果輸入至所述分類模型；

所述分類模型對(duì)所述預(yù)測(cè)結(jié)果進(jìn)行分析以判斷所述人臉圖像的真假。

進(jìn)一步地，所述利用層疊泛化算法將所述三個(gè)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行融合，得到分類模型的步驟包括：

建立線性回歸模型lr(0),lr(1)，其中，0代表假，1代表真；

三種卷積神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時(shí)，樣本進(jìn)入每種卷積神經(jīng)網(wǎng)絡(luò)，都會(huì)得到該樣本屬于每一類的概率，每一個(gè)樣本經(jīng)過三種卷積神經(jīng)網(wǎng)絡(luò)之后變?yōu)閗*i維的向量，其中k為卷積神經(jīng)網(wǎng)絡(luò)個(gè)數(shù)，即3，i為類別個(gè)數(shù)即2，樣本會(huì)對(duì)應(yīng)k*i個(gè)概率值，當(dāng)訓(xùn)練lr(0)時(shí)，若該樣本屬于0類時(shí)樣本的真實(shí)概率值yn＝1，否則yn＝0，當(dāng)訓(xùn)練lr(1)時(shí)，若該樣本屬于1類時(shí)yn＝1，否則yn＝0；

根據(jù)三種卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的每一類的概率值和真實(shí)概率值，擬合一個(gè)線性回歸模型，以調(diào)整模型對(duì)于每一類的預(yù)測(cè)權(quán)重。

進(jìn)一步地，所述分類模型對(duì)所述預(yù)測(cè)結(jié)果進(jìn)行分析以判斷所述人臉圖像的真假的步驟包括：

所述人臉圖像首先經(jīng)過三種卷積神經(jīng)網(wǎng)絡(luò)，每個(gè)卷積神經(jīng)網(wǎng)絡(luò)給出所述人臉圖像屬于真實(shí)人臉和造假人臉的概率值，將每一個(gè)卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的概率值輸入lr(0)和lr(1)線性回歸模型，計(jì)算得到兩個(gè)回歸值m，n，如果m>n，則該樣本屬于0類，即所述人臉圖像為假，否則屬于1類，即人臉圖像為真。

進(jìn)一步地，所述對(duì)所述人臉圖像進(jìn)行歸一化處理的步驟包括：

通過人臉檢測(cè)的算法，檢測(cè)到所述人臉圖像中的人臉；

利用人臉特征點(diǎn)定位算法，找到所述人臉的準(zhǔn)確區(qū)域，得到準(zhǔn)確的人臉框；

將所述裁剪出來，并歸一化到特定像素。

進(jìn)一步地，所述將所述人臉框裁剪出來的步驟包括：將所述人臉框擴(kuò)大，將擴(kuò)大后的人臉框?qū)?yīng)的原圖中的區(qū)域裁剪出來。

進(jìn)一步地，所述分別訓(xùn)練基于照片造假、視頻造假和面具造假的卷積神經(jīng)網(wǎng)絡(luò)的步驟包括：

構(gòu)建訓(xùn)練集，所述訓(xùn)練集包括造假視頻和真人視頻；

獲取造假視頻和真人視頻中的圖像；

通過人臉檢測(cè)算法檢測(cè)所述圖像中的人臉；

將所述人臉進(jìn)行裁剪；

對(duì)裁剪后出人臉圖像進(jìn)行歸一化處理；

將所述歸一化后的人臉圖像輸入至卷積神經(jīng)網(wǎng)絡(luò)，所述卷積神經(jīng)網(wǎng)絡(luò)包括輸入層、多個(gè)卷積層、relu層、max-pooling層、全連接層、dropout層和softmaxwithloss層；

所述輸入層將所述歸一化后的人臉圖像進(jìn)行隨機(jī)裁剪，將裁剪后的人臉圖像水平翻轉(zhuǎn)，得到特定像素的圖像，將所述特定像素的圖像送入多個(gè)卷積層中的第一個(gè)卷積層；

所述第一個(gè)卷積層包括多個(gè)卷積核，所述第一個(gè)卷積層連接一個(gè)relu層和max-pooling層，所述特定像素的圖像經(jīng)過所述第一個(gè)卷積層后得到與所述第一個(gè)卷積層的卷積核對(duì)應(yīng)數(shù)量的特征圖像，所述relu層使部分神經(jīng)元輸出為0，造成稀疏性，所述max-pooling層對(duì)所述特征圖像進(jìn)行壓縮，提取主要特征，所述特征圖像進(jìn)入第二個(gè)卷積層；

所述第二個(gè)卷積層包括多個(gè)卷積核，所述第二個(gè)卷積層連接一個(gè)relu層和max-pooling層，所述特征圖像經(jīng)過所述第二個(gè)卷積層后得到與所述第二個(gè)卷積層的卷積核對(duì)應(yīng)數(shù)量的特征圖像，所述relu層使部分神經(jīng)元輸出為0，造成稀疏性，所述特征圖像經(jīng)過第二個(gè)max-pooling層后進(jìn)而進(jìn)入第三個(gè)卷積層；

所述第三個(gè)卷積層包括多個(gè)卷積核，所述第三個(gè)卷積層連接一個(gè)relu層和max-pooling層，所述特征圖像經(jīng)過所述第三個(gè)卷積層后得到與所述第三個(gè)卷積層的卷積核對(duì)應(yīng)數(shù)量的特征圖像，所述relu層使部分神經(jīng)元輸出為0，造成稀疏性，所述特征圖像經(jīng)過第三個(gè)max-pooling層后進(jìn)而進(jìn)入第四個(gè)卷積層；

所述第四個(gè)卷積層包括多個(gè)卷積核，所述第四個(gè)卷積層連接一個(gè)relu層和max-pooling層，隨后連接兩個(gè)全連接層，每個(gè)全連接層均依次連接一個(gè)relu層和dropout層，所述特征圖像經(jīng)過所述第四個(gè)卷積層后得到與所述第四個(gè)卷積層的卷積核對(duì)應(yīng)數(shù)量的特征圖像，所述relu層使部分神經(jīng)元輸出為0，造成稀疏性，所述特征圖像經(jīng)過第四個(gè)max-pooling層后進(jìn)而進(jìn)入兩個(gè)全連接層以及與所述全連接層連接的relu層和dropout層；

dropout層通過訓(xùn)練時(shí)，隨機(jī)讓卷積神經(jīng)網(wǎng)絡(luò)某些隱含層節(jié)點(diǎn)的權(quán)重不工作，dropout層之后依次連接一個(gè)全連接層和softmaxwithloss層，最后一個(gè)全連接層輸出所述人臉圖像的得分情況，將得分輸入到最后一層softmaxwithloss層，得到屬于每一類的概率以及該次迭代的損失。

進(jìn)一步地，每一個(gè)所述卷積層和relu層之間均依次連接一個(gè)batchnorm層和一個(gè)scale層，所述batchnorm層將神經(jīng)元的輸出規(guī)范化到均值為0，方差為1，所述scale層逆轉(zhuǎn)所述batchnorm層對(duì)特征的破壞。

進(jìn)一步地，所述構(gòu)建訓(xùn)練集的步驟包括：

按照預(yù)定比例構(gòu)建訓(xùn)練集和驗(yàn)證集，所述訓(xùn)練集和驗(yàn)證集均包括造假視頻和真人視頻。

進(jìn)一步地，所述對(duì)裁剪后出人臉圖像進(jìn)行歸一化處理的步驟包括：

對(duì)裁剪后出人臉圖像歸一化到256×256像素。

進(jìn)一步地，所述輸入層包含rgb三個(gè)通道，大小為256×256，將訓(xùn)練集分為1000個(gè)batch，每個(gè)batch大小為128，所述特定像素的圖像的像素為227×227，所述第一個(gè)卷積層包括96個(gè)卷積核，每個(gè)卷積核的大小為7×7，卷積操作的步長(zhǎng)為2，經(jīng)過第一個(gè)卷積層后得到96個(gè)像素為111×111的特征圖像，經(jīng)過第一個(gè)max-pooling層后，得到96個(gè)像素為55×55的特征圖像，所述第一個(gè)max-pooling層的大小為3×3，步長(zhǎng)為2，所述第二個(gè)卷積層包括256個(gè)卷積核，每個(gè)卷積核的大小為5×5，卷積操作的步長(zhǎng)為2，經(jīng)過第二個(gè)卷積層后得到256個(gè)像素為26×26的特征圖像，經(jīng)過第二個(gè)max-pooling層后，得到256個(gè)像素為26×26的特征圖像，所述第二個(gè)max-pooling層的大小為3×3，步長(zhǎng)為1，邊界填充為1，所述第三個(gè)卷積層包括192個(gè)卷積核，每個(gè)卷積核的大小為3×3，邊界補(bǔ)充1，卷積操作的步長(zhǎng)為1，經(jīng)過第三個(gè)卷積層后得到192個(gè)像素為26×26的特征圖像，經(jīng)過第三個(gè)max-pooling層后，得到192個(gè)像素為26×26的特征圖像，所述第三個(gè)max-pooling層的大小為3×3，步長(zhǎng)為1，邊界填充為1，所述第四個(gè)卷積層包括192個(gè)卷積核，每個(gè)卷積核的大小為3×3，邊界補(bǔ)充1，卷積操作的步長(zhǎng)為1，經(jīng)過第四個(gè)卷積層后得到192個(gè)像素為26×26的特征圖像，經(jīng)過第四個(gè)max-pooling層后，得到192個(gè)像素為13×13的特征圖像，所述第四個(gè)max-pooling層的大小為3×3，步長(zhǎng)為2。本發(fā)明實(shí)施例提供的基于多造假方式的人臉活體檢測(cè)方法，根據(jù)照片、視頻和面具三種造假方式分別用不同的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練，然后通過層疊泛化算法進(jìn)行融合，降低類內(nèi)差異，增大類間差異，卷積神經(jīng)網(wǎng)絡(luò)更易學(xué)習(xí)到有辨別力的特征，每個(gè)卷積神經(jīng)網(wǎng)絡(luò)針對(duì)各種造假方式都有很高的檢測(cè)能力，通過層疊泛化將三種模型進(jìn)行融合，融合之后，預(yù)測(cè)時(shí)會(huì)突出每個(gè)卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果好的一面，抑制每個(gè)卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果較差的一面，提升整個(gè)檢測(cè)效果。

為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能更明顯易懂，下文特舉較佳實(shí)施例，并配合所附附圖，作詳細(xì)說明如下。

附圖說明

為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案，下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹，應(yīng)當(dāng)理解，以下附圖僅示出了本發(fā)明的某些實(shí)施例，因此不應(yīng)被看作是對(duì)范圍的限定，對(duì)于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動(dòng)的前提下，還可以根據(jù)這些附圖獲得其他相關(guān)的附圖。

圖1是本發(fā)明實(shí)施例提供的基于多造假方式的人臉活體檢測(cè)方法的流程示意圖。

圖2-圖3是本發(fā)明實(shí)施例提供的卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練流程示意圖。

圖4是本發(fā)明實(shí)施例提供的訓(xùn)練過程中卷積神經(jīng)網(wǎng)絡(luò)模型的示意圖。

具體實(shí)施方式

為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚，下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例。通常在此處附圖中描述和示出的本發(fā)明實(shí)施例的組件可以以各種不同的配置來布置和設(shè)計(jì)。

因此，以下對(duì)在附圖中提供的本發(fā)明的實(shí)施例的詳細(xì)描述并非旨在限制要求保護(hù)的本發(fā)明的范圍，而是僅僅表示本發(fā)明的選定實(shí)施例?；诒景l(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。

應(yīng)注意到：相似的標(biāo)號(hào)和字母在下面的附圖中表示類似項(xiàng)，因此，一旦某一項(xiàng)在一個(gè)附圖中被定義，則在隨后的附圖中不需要對(duì)其進(jìn)行進(jìn)一步定義和解釋。

請(qǐng)參照?qǐng)D1，是本發(fā)明實(shí)施例提供的基于多造假方式的人臉活體檢測(cè)方法的流程示意圖。該方法包括以下步驟：

步驟s110，分別訓(xùn)練基于照片造假、視頻造假和面具造假的卷積神經(jīng)網(wǎng)絡(luò)。

請(qǐng)參照?qǐng)D2，在本實(shí)施例中，卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方式包括以下步驟：

步驟s111，構(gòu)建訓(xùn)練集，訓(xùn)練集包括造假視頻和真人視頻。

當(dāng)訓(xùn)練集不包括驗(yàn)證集時(shí)，步驟s111還包括按照預(yù)定比例構(gòu)建訓(xùn)練集和驗(yàn)證集，所述訓(xùn)練集和驗(yàn)證集均包括造假視頻和真人視頻。訓(xùn)練集和驗(yàn)證集的比例自由配置，例如可以為8:2或7:3，本發(fā)明實(shí)施例對(duì)此不做限定。造假視頻為錄制的視頻，針對(duì)不同的造假方式，造假視頻錄制內(nèi)容不同，比如對(duì)于照片造假視頻，造假視頻為錄制的造假照片的視頻，對(duì)于視頻造假視頻，造假視頻為錄制的造假視頻的視頻，對(duì)于面具造假視頻，造假視頻為錄制的造假面具的視頻，真人視頻為錄制的真人的視頻。

步驟s112，獲取造假視頻和真人視頻中的圖像。

從造假視頻和真人視頻中，按照預(yù)定規(guī)則分別抽取多幀圖像，比如隔3幀或者隔5幀抽取一張圖像，該圖像包括人臉。

步驟s113，通過人臉檢測(cè)算法檢測(cè)所述圖像中的人臉。

人臉檢測(cè)算法可以為現(xiàn)有的通用的人臉檢測(cè)算法，如adaboost。

步驟s114，對(duì)人臉進(jìn)行裁剪。

在對(duì)人臉進(jìn)行裁剪過程中，利用人臉特征點(diǎn)定位的算法，例如lbf、ser，找到人臉的準(zhǔn)確區(qū)域，得到準(zhǔn)確的人臉框，將該人臉框擴(kuò)大，一般擴(kuò)大1.8倍，將擴(kuò)大后的人臉框?qū)?yīng)的原圖中的區(qū)域裁剪出來，裁剪出來的人臉既包括人臉，也包括一定的背景，一定的背景存在有利于分類真假視頻。

步驟s115，對(duì)裁剪后出人臉圖像進(jìn)行歸一化處理。

裁剪后的人臉圖像經(jīng)過歸一化處理，歸一化到256×256像素。

步驟s116，將歸一化后的人臉圖像輸入至卷積神經(jīng)網(wǎng)絡(luò)，該卷積神經(jīng)網(wǎng)絡(luò)包括輸入層、多個(gè)卷積層、relu層、max-pooling層、全連接層、dropout層和softmaxwithloss層。

步驟s117，對(duì)該卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。

其中，歸一化后的人臉圖像首先進(jìn)入輸入層，請(qǐng)參照?qǐng)D3，是卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程，包括以下步驟：

步驟s1171，輸入層將歸一化后的人臉圖像進(jìn)行隨機(jī)裁剪，將裁剪后的人臉圖像水平翻轉(zhuǎn)，得到特定像素的圖像，將特定像素的圖像送入多個(gè)卷積層中的第一個(gè)卷積層。

其中，輸入層的圖像包含rgb三個(gè)通道，且大小為256×256，將訓(xùn)練集分為1000個(gè)batch，每個(gè)batch大小為128。特定像素的圖像的像素為227×227，將該batch內(nèi)的圖像打亂順序送入第一個(gè)卷積層，該batch內(nèi)的圖像樣本正負(fù)比例1:1，且均屬于同一個(gè)人的人臉圖像，以降低由于不同外貌特征造成的差異，使網(wǎng)絡(luò)學(xué)習(xí)到由于真人和造假之間的本質(zhì)特征，降低類內(nèi)差異。

步驟s1172，第一個(gè)卷積層包括多個(gè)卷積核，第一個(gè)卷積層連接一個(gè)relu層和max-pooling層，特定像素的圖像經(jīng)過第一個(gè)卷積層后得到與第一個(gè)卷積層的卷積核對(duì)應(yīng)數(shù)量的特征圖像，relu層使部分神經(jīng)元輸出為0，造成稀疏性，max-pooling層對(duì)特征圖像進(jìn)行壓縮，提取主要特征，特征圖像進(jìn)入第二個(gè)卷積層。

在本實(shí)施例中，第一個(gè)卷積層的卷積核的個(gè)數(shù)為96個(gè)，每個(gè)卷積核的大小為7×7，卷積操作的步長(zhǎng)為2，經(jīng)過第一個(gè)卷積層后得到96個(gè)像素為111×111的特征圖像，第一個(gè)max-pooling層的大小為3×3，步長(zhǎng)為2，經(jīng)過第一個(gè)max-pooling層后，得到96個(gè)像素為55×55的特征圖像。作為優(yōu)選的，每一個(gè)卷積層和relu層之間依次連接一個(gè)batchnorm層和一個(gè)scale層，經(jīng)過batchnorm層，scale層，relu層并不改變特征圖像的大小。當(dāng)深度網(wǎng)絡(luò)層次太多，信號(hào)和梯度越來越小，深層難以訓(xùn)練，被稱作梯度彌散，也有可能越來越大，又被稱作梯度爆炸，通過batchnorm層將神經(jīng)元的輸出規(guī)范化到均值為0，方差為1，scale層逆轉(zhuǎn)所述batchnorm層對(duì)特征的破壞，以克服深度神經(jīng)網(wǎng)絡(luò)難以訓(xùn)練的弊病。由于深度網(wǎng)絡(luò)在訓(xùn)練時(shí)，每一層的輸入數(shù)據(jù)分布一直是在發(fā)生變化的，因?yàn)榍懊嬉粚拥膮?shù)更新會(huì)導(dǎo)致后面一層的輸入數(shù)據(jù)的分布，batchnorm和scale可以解決訓(xùn)練時(shí)，網(wǎng)絡(luò)中間層的數(shù)據(jù)分布發(fā)生改變的問題，batchnorm層是通過將神經(jīng)元的輸出規(guī)范化到：均值為0，方差為1，通過batchnorm層后，所有神經(jīng)元都規(guī)范化到了一種分布，但輸出限制在均值0方差1的分布又會(huì)使得網(wǎng)絡(luò)的表達(dá)能力變?nèi)?，也破壞了前面層學(xué)習(xí)到的特征，所以加入scale層，通過加入學(xué)習(xí)到的重構(gòu)參數(shù)，逆轉(zhuǎn)對(duì)特征的破壞，逆轉(zhuǎn)的程序由模型訓(xùn)練時(shí)調(diào)整。這樣既將神經(jīng)元做了規(guī)范化又保留前面層所學(xué)到的特征，由于輸入變得穩(wěn)定，促進(jìn)了模型的收斂并一定程度上阻止了過擬合。通過逐層尺度歸一，避免了梯度消失和梯度溢出，而且加速收斂，同時(shí)作為一種正則化技術(shù)也提高了泛化能力；相比使用sigmoidtanh作激活函數(shù)，計(jì)算量大，反向傳播求誤差梯度時(shí)，求導(dǎo)計(jì)算量也很大，并且sigmoidtanh函數(shù)容易飽和，出現(xiàn)梯度消失情況，即在接近收斂時(shí)，變換太緩慢，造成信息丟失。relu層會(huì)使部分神經(jīng)元輸出為0，造成稀疏性，不僅緩解了過擬合，也更接近真實(shí)的神經(jīng)元激活模型克服了梯度消失，在沒有無監(jiān)督預(yù)訓(xùn)練(即訓(xùn)練網(wǎng)絡(luò)的第一個(gè)隱藏層，再訓(xùn)練第二個(gè)…最后用這些訓(xùn)練好的網(wǎng)絡(luò)參數(shù)值作為整體網(wǎng)絡(luò)參數(shù)的初始值)的情況下相比sigmoid和tanh激活函數(shù)顯著加快收斂。

步驟s1173，第二個(gè)卷積層包括多個(gè)卷積核，第二個(gè)卷積層連接一個(gè)relu層和max-pooling層，特征圖像經(jīng)過第二個(gè)卷積層后得到與第二個(gè)卷積層的卷積核對(duì)應(yīng)數(shù)量的特征圖像，所述relu層使部分神經(jīng)元輸出為0，造成稀疏性，所述特征圖像經(jīng)過第二個(gè)max-pooling層后進(jìn)而進(jìn)入第三個(gè)卷積層。

第二個(gè)卷積層包括256個(gè)卷積核，每個(gè)卷積核的大小為5×5，卷積操作的步長(zhǎng)為2，經(jīng)過第二個(gè)卷積層后得到256個(gè)像素為26×26的特征圖像，relu層使部分神經(jīng)元輸出為0，造成稀疏性，特征圖像經(jīng)過第二個(gè)max-pooling層后，得到256個(gè)像素為26×26的特征圖像，第二個(gè)max-pooling層的大小為3×3，步長(zhǎng)為1，邊界填充為1。

步驟s1174，第三個(gè)卷積層包括多個(gè)卷積核，第三個(gè)卷積層連接一個(gè)max-pooling層，特征圖像經(jīng)過第三個(gè)卷積層后得到與第三個(gè)卷積層的卷積核對(duì)應(yīng)數(shù)量的特征圖像，relu層使部分神經(jīng)元輸出為0，造成稀疏性，特征圖像經(jīng)過第三個(gè)max-pooling層后進(jìn)而進(jìn)入第四個(gè)卷積層。

第三個(gè)卷積層包括192個(gè)卷積核，每個(gè)卷積核的大小為3×3，邊界補(bǔ)充1，卷積操作的步長(zhǎng)為1，經(jīng)過第三個(gè)卷積層后得到192個(gè)像素為26×26的特征圖像，經(jīng)過第三個(gè)max-pooling層后，得到192個(gè)像素為26×26的特征圖像，第三個(gè)max-pooling層的大小為3×3，步長(zhǎng)為1，邊界填充為1。

步驟s1175，第四個(gè)卷積層包括多個(gè)卷積核，第四個(gè)卷積層連接一個(gè)max-pooling層，隨后連接兩個(gè)全連接層，每個(gè)全連接層均依次連接一個(gè)relu層和dropout層，relu層使部分神經(jīng)元輸出為0，造成稀疏性，特征圖像經(jīng)過第四個(gè)卷積層后得到與第四個(gè)卷積層的卷積核對(duì)應(yīng)數(shù)量的特征圖像，經(jīng)過第四個(gè)maxpooling層后進(jìn)而進(jìn)入兩個(gè)全連接層以及與全連接層連接的relu層和dropout層。

第四個(gè)卷積層包括192個(gè)卷積核，每個(gè)卷積核的大小為3×3，邊界補(bǔ)充1，卷積操作的步長(zhǎng)為1，經(jīng)過第四個(gè)卷積層后得到192個(gè)像素為26×26的特征圖像，經(jīng)過第四個(gè)max-pooling層后，得到192個(gè)像素為13×13的特征圖像，第四個(gè)max-pooling層的大小為3×3，步長(zhǎng)為2。

步驟s1176，dropout層通過訓(xùn)練時(shí)，隨機(jī)讓卷積神經(jīng)網(wǎng)絡(luò)某些隱含層節(jié)點(diǎn)的權(quán)重不工作，dropout層之后依次連接一個(gè)全連接層和softmaxwithloss層，最后一個(gè)全連接層輸出人臉圖像的得分情況，將得分輸入到最后一層softmaxwithloss層，得到屬于每一類造假和真人的概率以及該次迭代的損失。

dropout層消除減弱了神經(jīng)元節(jié)點(diǎn)間的聯(lián)合適應(yīng)性，增強(qiáng)了泛化能力，dropout層通過訓(xùn)練模型時(shí)，隨機(jī)讓網(wǎng)絡(luò)某些隱含層節(jié)點(diǎn)的權(quán)重不工作的方式防止模型過擬合，正則化手段，提高泛化能力。softmaxwithloss層包括softmax層和多維logisticloss層，softmax層將前面的得分情況映射為屬于每一類的概率，之后接一個(gè)多維logisticloss層，這里得到的是當(dāng)前迭代的損失。把softmax層和多維logisticloss層合并為一層保證了數(shù)值上的穩(wěn)定，兩個(gè)全連接層輸出為512維特征。

請(qǐng)參照?qǐng)D4，是本發(fā)明實(shí)施例中訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)模型的示意圖。

步驟s120，利用層疊泛化算法將三個(gè)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行融合，得到分類模型。

基于照片造假、視頻造假和面具造假的卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練好后，建立線性回歸模型lr(0),lr(1)，其中，0代表假，1代表真，；

三種卷積神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時(shí)，樣本進(jìn)入每種卷積神經(jīng)網(wǎng)絡(luò)，都會(huì)得到該樣本屬于每一類的概率，每一個(gè)樣本經(jīng)過三種卷積神經(jīng)網(wǎng)絡(luò)之后變?yōu)閗*i維的向量，其中k為模型個(gè)數(shù)即3，i為類別個(gè)數(shù)即2，樣本會(huì)對(duì)應(yīng)k*i個(gè)概率值，當(dāng)訓(xùn)練lr(0)時(shí)，若該樣本屬于0類時(shí)樣本的真實(shí)概率值yn＝1，否則yn＝0，當(dāng)訓(xùn)練lr(1)時(shí)，若該樣本屬于1類時(shí)yn＝1，否則yn＝0；

根據(jù)三種卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的每一類的概率值和真實(shí)概率值，擬合一個(gè)線性回歸模型其中l(wèi)為0或1，即有真假兩類，通過最小化得到線性回歸的權(quán)重系數(shù){αkil}，通過該權(quán)重系數(shù)可以調(diào)整模型對(duì)于每一類的預(yù)測(cè)權(quán)重。

步驟s130，獲取待檢測(cè)的人臉圖像。

獲取的人臉圖像可以是通過門禁、電腦或者監(jiān)控器等設(shè)備的攝像頭獲取的人臉圖像。

步驟s140，對(duì)所述人臉圖像進(jìn)行歸一化處理。

本實(shí)施例中，通過人臉檢測(cè)的算法，檢測(cè)到人臉圖像中的人臉，利用人臉特征點(diǎn)定位算法，找到所述人臉的準(zhǔn)確區(qū)域，得到準(zhǔn)確的人臉框，將所述人臉框裁剪出來，并歸一化到特定像素，本實(shí)施例中，特定的像素為256×256。作為優(yōu)選地，人臉框確定后，將該人臉框擴(kuò)大，一般擴(kuò)大1.8倍，將擴(kuò)大后的人臉框?qū)?yīng)的原圖中的區(qū)域裁剪出來，裁剪出來的人臉既包括人臉，也包括一定的背景，一定的背景存在有利于分類真假視頻。

步驟s150，將處理后的人臉圖像分別輸入至三個(gè)卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行概率預(yù)測(cè)。

每個(gè)卷積神經(jīng)網(wǎng)絡(luò)都會(huì)預(yù)測(cè)該人臉圖像屬于每一類的概率，人臉圖像經(jīng)過三種卷積神經(jīng)網(wǎng)絡(luò)之后變?yōu)閗*i維的向量，其中k為卷積神經(jīng)網(wǎng)絡(luò)個(gè)數(shù)，即3，i為類別個(gè)數(shù)即2，人臉圖像會(huì)對(duì)應(yīng)一個(gè)真實(shí)的概率值yn，當(dāng)訓(xùn)練lr(0)時(shí)，若人臉圖像屬于0類時(shí)yn＝1，否則yn＝0，當(dāng)訓(xùn)練lr(1)時(shí)，若該人臉圖像屬于1類時(shí)yn＝1，否則yn＝0，即變?yōu)椋?/p>

[z11n,z12n,...,z1in,...,zk1n,...,zkin,...,zk1n,...,zkin],n＝1,...,n,，

k＝3為卷積神經(jīng)網(wǎng)絡(luò)個(gè)數(shù)，i＝2為類別個(gè)數(shù)，n為驗(yàn)證集的樣本個(gè)數(shù)，n為第n個(gè)樣本，zkin為第k個(gè)卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)第n個(gè)人臉圖像屬于第i類的概率值。

步驟s160，將所述三個(gè)卷積神經(jīng)網(wǎng)絡(luò)分別的預(yù)測(cè)結(jié)果輸入至所述分類模型。

步驟s170，分類模型對(duì)所述預(yù)測(cè)結(jié)果進(jìn)行分析以判斷所述人臉圖像的真假。

人臉圖像首先經(jīng)過三種卷積神經(jīng)網(wǎng)絡(luò)，每個(gè)卷積神經(jīng)網(wǎng)絡(luò)給出所述人臉圖像屬于真實(shí)人臉和造假人臉的概率值，將每一個(gè)卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的概率值輸入lr(0)和lr(1)線性回歸模型，具體的，圖像輸入三類卷積神經(jīng)網(wǎng)絡(luò)，每類卷積神經(jīng)網(wǎng)絡(luò)會(huì)給出該圖像屬于真實(shí)人臉和造假人臉的概率值，比如針對(duì)照片造假的卷積神經(jīng)網(wǎng)絡(luò)模型給出的概率值：0.85，0.15；針對(duì)視頻造假的卷積神經(jīng)網(wǎng)絡(luò)模型給出的概率值：0.91，0.09；針對(duì)面具造假的卷積神經(jīng)網(wǎng)絡(luò)模型給出的概率值：0.43，0.57；(每組的第一個(gè)概率值是判斷為假的概率值，第二個(gè)概率值是判斷為真的概率值，且相加等于1)，最后輸入線性回歸模型的應(yīng)該是(0.85,0.15，0.91,0.09，0.43,0.57)的向量以計(jì)算得到兩個(gè)回歸值m，n，如果m>n，則該樣本屬于0類，即人臉圖像為假，否則屬于1類，即人臉圖像為真。

綜上所述，本發(fā)明實(shí)施例提供了一種基于多造假方式的人臉活體檢測(cè)方法，根據(jù)照片、視頻和面具三種造假方式分別用不同的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練，然后通過層疊泛化算法進(jìn)行融合，降低類內(nèi)差異，增大類間差異，卷積神經(jīng)網(wǎng)絡(luò)更易學(xué)習(xí)到有辨別力的特征，每個(gè)卷積神經(jīng)網(wǎng)絡(luò)針對(duì)各種造假方式都有很高的檢測(cè)能力，通過層疊泛化將三種模型進(jìn)行融合，融合之后，預(yù)測(cè)時(shí)會(huì)突出每個(gè)卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果好的一面，抑制每個(gè)卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果較差的一面，提升整個(gè)檢測(cè)效果。

在本申請(qǐng)所提供的實(shí)施例中，應(yīng)該理解到，所揭露的方法，也可以通過其它的方式實(shí)現(xiàn)。以上所描述的實(shí)施例僅僅是示意性的，例如，附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的實(shí)施例的方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上，流程圖或框圖中的每個(gè)方框可以代表一個(gè)模塊、程序段或代碼的一部分，所述模塊、程序段或代碼的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意，在有些作為替換的實(shí)現(xiàn)方式中，方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如，兩個(gè)連續(xù)的方框?qū)嶋H上可以基本并行地執(zhí)行，它們有時(shí)也可以按相反的順序執(zhí)行，這依所涉及的功能而定。也要注意的是，框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合，可以用執(zhí)行規(guī)定的功能或動(dòng)作的專用的基于硬件的系統(tǒng)來實(shí)現(xiàn)，或者可以用專用硬件與計(jì)算機(jī)指令的組合來實(shí)現(xiàn)。

另外，在本發(fā)明各個(gè)實(shí)施例中的各功能模塊可以集成在一起形成一個(gè)獨(dú)立的部分，也可以是各個(gè)模塊單獨(dú)存在，也可以兩個(gè)或兩個(gè)以上模塊集成形成一個(gè)獨(dú)立的部分。

所述功能如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí)，可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?；谶@樣的理解，本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來，該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中，包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī)，服務(wù)器，或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括：u盤、移動(dòng)硬盤、只讀存儲(chǔ)器(rom，read-onlymemory)、隨機(jī)存取存儲(chǔ)器(ram，randomaccessmemory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。需要說明的是，在本文中，諸如第一和第二等之類的關(guān)系術(shù)語(yǔ)僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來，而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且，術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含，從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素，而且還包括沒有明確列出的其他要素，或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下，由語(yǔ)句“包括一個(gè)……”限定的要素，并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。

以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已，并不用于限制本發(fā)明，對(duì)于本領(lǐng)域的技術(shù)人員來說，本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi)，所作的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。應(yīng)注意到：相似的標(biāo)號(hào)和字母在下面的附圖中表示類似項(xiàng)，因此，一旦某一項(xiàng)在一個(gè)附圖中被定義，則在隨后的附圖中不需要對(duì)其進(jìn)行進(jìn)一步定義和解釋。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張少林;李衛(wèi)軍;韋美麗;寧欣;董肖莉
技術(shù)所有人：北京市威富安防科技有限公司;中國(guó)科學(xué)院半導(dǎo)體研究所
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

人臉活體檢測(cè)相關(guān)技術(shù)

人臉識(shí)別活體檢測(cè)代碼相關(guān)技術(shù)

人臉識(shí)別活體檢測(cè)sdk相關(guān)技術(shù)

近紅外人臉活體檢測(cè)相關(guān)技術(shù)

活體檢測(cè)人臉識(shí)別破解相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于多造假方式的人臉活體檢測(cè)方法與流程