欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

人臉關(guān)鍵點(diǎn)定位方法及裝置與流程

文檔序號(hào):12670721閱讀:501來源:國知局
人臉關(guān)鍵點(diǎn)定位方法及裝置與流程

本公開涉及圖像處理技術(shù)領(lǐng)域,尤其涉及人臉關(guān)鍵點(diǎn)定位方法及裝置。



背景技術(shù):

人臉關(guān)鍵點(diǎn)定位,是指圖像中已確定人臉區(qū)域的基礎(chǔ)上,確定出人臉區(qū)域中的眉毛、眼睛、鼻子或嘴巴等多個(gè)關(guān)鍵部位的位置。在很多技術(shù)領(lǐng)域里,人臉關(guān)鍵點(diǎn)定位技術(shù)有著其獨(dú)特的應(yīng)用價(jià)值,因?yàn)樵摷夹g(shù)是眾多臉部圖片處理的先序步驟,這些應(yīng)用包括但不限于人臉識(shí)別、臉部表情分析、臉部變形動(dòng)畫、人臉動(dòng)畫自動(dòng)合成等。因此,人臉關(guān)鍵點(diǎn)定位的精確性具有重要意義。



技術(shù)實(shí)現(xiàn)要素:

為克服相關(guān)技術(shù)中存在的問題,本公開提供了人臉關(guān)鍵點(diǎn)定位方法及裝置。

根據(jù)本公開實(shí)施例的第一方面,提供一種人臉關(guān)鍵點(diǎn)定位方法,所述方法包括:

確定待定位圖像中的人臉區(qū)域;

針對(duì)所述人臉區(qū)域,采用預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)確定若干個(gè)人臉關(guān)鍵點(diǎn)的初始位置;

根據(jù)各人臉關(guān)鍵點(diǎn)的初始位置,利用所述卷積神經(jīng)網(wǎng)絡(luò)迭代更新各人臉關(guān)鍵點(diǎn)的位置。

可選的,對(duì)于每個(gè)人臉關(guān)鍵點(diǎn),所述根據(jù)各人臉關(guān)鍵點(diǎn)的初始位置,利用所述卷積神經(jīng)網(wǎng)絡(luò)迭代更新各人臉關(guān)鍵點(diǎn)的位置,包括:

獲取本次迭代的人臉關(guān)鍵點(diǎn)的起始位置,以所述本次迭代的人臉關(guān)鍵點(diǎn)的起始位置為中心,在所述人臉區(qū)域中獲取若干個(gè)圖像塊;其中,在第一次迭代時(shí),所述本次迭代的人臉關(guān)鍵點(diǎn)的起始位置為所述初始位置,在第i次迭代時(shí),所述本次迭代的人臉關(guān)鍵點(diǎn)的起始位置為上一次迭代所獲得的人臉關(guān)鍵點(diǎn)的位置Pi-1,i是大于1的正整數(shù);

分別對(duì)所述若干個(gè)圖像塊進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)運(yùn)算,獲得各圖像塊中人臉關(guān)鍵點(diǎn)的第一位置;

計(jì)算各圖像塊中人臉關(guān)鍵點(diǎn)的第一位置的均值,將所述均值更新為本次迭代所獲得的人臉關(guān)鍵點(diǎn)的位置Pi。

可選的,所述方法還包括:

在每一次迭代時(shí),記錄迭代次數(shù);

當(dāng)本次迭代的迭代次數(shù)等于預(yù)設(shè)迭代次數(shù)時(shí),確定迭代結(jié)束,將本次迭代所獲得的人臉關(guān)鍵點(diǎn)的位置作為人臉關(guān)鍵點(diǎn)的目標(biāo)位置;

當(dāng)本次迭代的迭代次數(shù)小于預(yù)設(shè)迭代次數(shù)時(shí),將本次迭代所獲得的人臉關(guān)鍵點(diǎn)的位置作為下一次迭代的人臉關(guān)鍵點(diǎn)的起始位置。

可選的,所述若干個(gè)圖像塊的大小不相同。

可選的,所述卷積神經(jīng)網(wǎng)絡(luò)中包括多個(gè)預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型;

所述分別對(duì)所述若干個(gè)圖像塊進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)運(yùn)算,包括:

針對(duì)每個(gè)圖像塊,采用不同的卷積神經(jīng)網(wǎng)絡(luò)模型分別對(duì)每個(gè)所述圖像塊進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)運(yùn)算。

可選的,在本次迭代中,各人臉關(guān)鍵點(diǎn)對(duì)應(yīng)的各個(gè)圖像塊所采用的卷積神經(jīng)網(wǎng)絡(luò)模型,與已完成的各次迭代中所采用的卷積神經(jīng)網(wǎng)絡(luò)模型都不相同。

根據(jù)本公開實(shí)施例的第二方面,提供一種人臉關(guān)鍵點(diǎn)定位裝置,所述裝置包括:

人臉區(qū)域確定模塊,被配置為:確定待定位圖像中的人臉區(qū)域;

初始位置確定模塊,被配置為:針對(duì)所述人臉區(qū)域,采用預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)確定若干個(gè)人臉關(guān)鍵點(diǎn)的初始位置;

迭代更新模塊,被配置為:根據(jù)各人臉關(guān)鍵點(diǎn)的初始位置,利用所述卷積神經(jīng)網(wǎng)絡(luò)迭代更新各人臉關(guān)鍵點(diǎn)的位置。

可選的,所述迭代更新模塊,包括圖像塊獲取子模塊、運(yùn)算子模塊和均值計(jì)算子模塊;

所述圖像塊獲取子模塊,被配置為:對(duì)于每個(gè)人臉關(guān)鍵點(diǎn),獲取本次迭代的人臉關(guān)鍵點(diǎn)的起始位置,以所述本次迭代的人臉關(guān)鍵點(diǎn)的起始位置為中心,在所述人臉區(qū)域中獲取若干個(gè)圖像塊;其中,在第一次迭代時(shí),所述本次迭代的人臉關(guān)鍵點(diǎn)的起始位置為所述初始位置,在第i次迭代時(shí),所述本次迭代的人臉關(guān)鍵點(diǎn)的起始位置為上一次迭代所獲得的人臉關(guān)鍵點(diǎn)的位置Pi-1,i是大于1的正整數(shù);

所述運(yùn)算子模塊,被配置為:分別對(duì)所述若干個(gè)圖像塊進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)運(yùn)算,獲得各圖像塊中人臉關(guān)鍵點(diǎn)的第一位置;

所述均值計(jì)算子模塊,被配置為:計(jì)算各圖像塊中人臉關(guān)鍵點(diǎn)的第一位置的均值,將所述均值更新為本次迭代所獲得的人臉關(guān)鍵點(diǎn)的位置Pi。

可選的,所述迭代更新模塊還包括:

迭代次數(shù)記錄子模塊,被配置為:在每一次迭代時(shí),記錄迭代次數(shù);

迭代次數(shù)判斷子模塊,被配置為:當(dāng)本次迭代的迭代次數(shù)等于預(yù)設(shè)迭代次數(shù)時(shí),確定迭代結(jié)束,將本次迭代所獲得的人臉關(guān)鍵點(diǎn)的位置作為人臉關(guān)鍵點(diǎn)的目標(biāo)位置;當(dāng)本次迭代的迭代次數(shù)小于預(yù)設(shè)迭代次數(shù)時(shí),將本次迭代所獲得的人臉關(guān)鍵點(diǎn)的位置作為下一次迭代的人臉關(guān)鍵點(diǎn)的起始位置。

可選的,所述若干個(gè)圖像塊的大小不相同。

可選的,所述卷積神經(jīng)網(wǎng)絡(luò)中包括多個(gè)預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型;

所述運(yùn)算子模塊,包括:

模型運(yùn)算子模塊,被配置為:針對(duì)每個(gè)圖像塊,采用不同的卷積神經(jīng)網(wǎng)絡(luò)模型分別對(duì)每個(gè)所述圖像塊進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)運(yùn)算。

可選的,所述模型運(yùn)算子模塊,還被配置為:在本次迭代中,各人臉關(guān)鍵點(diǎn)對(duì)應(yīng)的各個(gè)圖像塊所采用的卷積神經(jīng)網(wǎng)絡(luò)模型,與已完成的各次迭代中所采用的卷積神經(jīng)網(wǎng)絡(luò)模型都不相同。

根據(jù)本公開實(shí)施例的第三方面,提供一種人臉關(guān)鍵點(diǎn)定位裝置,包括:

處理器;

用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;

其中,所述處理器被配置為:

確定待定位圖像中的人臉區(qū)域;

針對(duì)所述人臉區(qū)域,采用預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)確定若干個(gè)人臉關(guān)鍵點(diǎn)的初始位置;

根據(jù)各人臉關(guān)鍵點(diǎn)的初始位置,利用所述卷積神經(jīng)網(wǎng)絡(luò)迭代更新各人臉關(guān)鍵點(diǎn)的位置,獲得各所述人臉關(guān)鍵點(diǎn)的目標(biāo)位置。

本公開的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:

本公開中,針對(duì)所述人臉區(qū)域,采用預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)確定若干個(gè)人臉關(guān)鍵點(diǎn)的初始位置,根據(jù)各人臉關(guān)鍵點(diǎn)的初始位置,利用所述卷積神經(jīng)網(wǎng)絡(luò)迭代更新各人臉關(guān)鍵點(diǎn)的位置,最終可以獲得各所述人臉關(guān)鍵點(diǎn)的精確位置。由于卷積神經(jīng)網(wǎng)絡(luò)利用深度學(xué)習(xí)技術(shù)而獲得,其運(yùn)算能力更強(qiáng),精確度更高,有效的解決了模型的初始化問題和定位精度不足的問題。

本公開中,以人臉關(guān)鍵點(diǎn)為中心截取若干個(gè)圖像塊,通過對(duì)各個(gè)圖像塊進(jìn)行迭代運(yùn)算,因此可以迭代更新人臉關(guān)鍵點(diǎn)的位置,從而逐步逼近人臉關(guān)鍵點(diǎn)的真實(shí)位置。

本公開中,通過在每次迭代時(shí)記錄迭代次數(shù),若達(dá)到預(yù)設(shè)迭代次數(shù),則表示已獲得人臉關(guān)鍵點(diǎn)的較為精確的位置,因此可以終止迭代運(yùn)算,獲得人臉關(guān)鍵點(diǎn)的目標(biāo)位置。

本公開中,通過截取大小不同的圖像塊,可以參考更多的圖像內(nèi)容,從而獲得更為精確的結(jié)果。

本公開中,在針對(duì)圖像塊進(jìn)行位置更新時(shí),可以采用不同的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行運(yùn)算,通過不同的模型,能減少計(jì)算誤差,使得所運(yùn)算的結(jié)果更為精確。

本公開中,在每一次迭代更新時(shí),可以采用不同的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行運(yùn)算,通過不同的模型,以減少計(jì)算誤差,使得所運(yùn)算的結(jié)果更為精確。

應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。

附圖說明

此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實(shí)施例,并與說明書一起用于解釋本公開的原理。

圖1是本公開根據(jù)一示例性實(shí)施例示出的一種人臉關(guān)鍵點(diǎn)定位方法的流程圖。

圖2是本公開根據(jù)一示例性實(shí)施例示出的另一種人臉關(guān)鍵點(diǎn)定位方法的流程圖。

圖3是本公開根據(jù)一示例性實(shí)施例示出的一種人臉關(guān)鍵點(diǎn)定位裝置的框圖。

圖4是本公開根據(jù)一示例性實(shí)施例示出的另一種人臉關(guān)鍵點(diǎn)定位裝置的框圖。

圖5是本公開根據(jù)一示例性實(shí)施例示出的另一種人臉關(guān)鍵點(diǎn)定位裝置的框圖。

圖6是本公開根據(jù)一示例性實(shí)施例示出的另一種人臉關(guān)鍵點(diǎn)定位裝置的框圖。

圖7本公開根據(jù)一示例性實(shí)施例示出的一種用于人臉關(guān)鍵點(diǎn)定位裝置的框圖。

具體實(shí)施方式

這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本公開相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。

在本公開使用的術(shù)語是僅僅出于描述特定實(shí)施例的目的,而非旨在限制本公開。在本公開和所附權(quán)利要求書中所使用的單數(shù)形式的“一種”、“所述”和“該”也旨在包括多數(shù)形式,除非上下文清楚地表示其他含義。還應(yīng)當(dāng)理解,本文中使用的術(shù)語“和/或”是指并包含一個(gè)或多個(gè)相關(guān)聯(lián)的列出項(xiàng)目的任何或所有可能組合。

應(yīng)當(dāng)理解,盡管在本公開可能采用術(shù)語第一、第二、第三等來描述各種信息,但這些信息不應(yīng)限于這些術(shù)語。這些術(shù)語僅用來將同一類型的信息彼此區(qū)分開。例如,在不脫離本公開范圍的情況下,第一信息也可以被稱為第二信息,類似地,第二信息也可以被稱為第一信息。取決于語境,如在此所使用的詞語“如果”可以被解釋成為“在……時(shí)”或“當(dāng)……時(shí)”或“響應(yīng)于確定”。

在人臉關(guān)鍵點(diǎn)定位過程中,圖像中不同的姿態(tài)、表情、光照以及遮擋等因素,會(huì)對(duì)人臉關(guān)鍵點(diǎn)的定位精確度造成一定影響。相關(guān)技術(shù)中,通常是先計(jì)算人臉區(qū)域的人臉關(guān)鍵點(diǎn)平均位置進(jìn)行初始化,之后采用采用線性回歸模型進(jìn)行運(yùn)算;若初始化效果不好,則會(huì)在接下來的求解中陷入局部最小值,影響定位的精度。另外,線性回歸模型的運(yùn)算能力有限,無法獲得精確結(jié)果。

而本公開實(shí)施例所提供的方案,針對(duì)所述人臉區(qū)域,采用預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)確定若干個(gè)人臉關(guān)鍵點(diǎn)的初始位置,根據(jù)各人臉關(guān)鍵點(diǎn)的初始位置,利用所述卷積神經(jīng)網(wǎng)絡(luò)迭代更新各人臉關(guān)鍵點(diǎn)的位置,最終可以獲得各所述人臉關(guān)鍵點(diǎn)的精確位置。由于卷積神經(jīng)網(wǎng)絡(luò)利用深度學(xué)習(xí)技術(shù)而獲得,其運(yùn)算能力更強(qiáng),精確度更高,有效的解決了模型的初始化問題和定位精度不足的問題。接下來對(duì)本公開實(shí)施例進(jìn)行詳細(xì)說明。

如圖1所示,圖1是本公開根據(jù)一示例性實(shí)施例示出的一種人臉關(guān)鍵點(diǎn)定位方法的流程圖,包括以下步驟101至103:

在步驟101中,確定待定位圖像中的人臉區(qū)域。

在步驟102中,針對(duì)所述人臉區(qū)域,采用預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)確定若干個(gè)人臉關(guān)鍵點(diǎn)的初始位置。

在步驟103中,根據(jù)各人臉關(guān)鍵點(diǎn)的初始位置,利用所述卷積神經(jīng)網(wǎng)絡(luò)迭代更新各人臉關(guān)鍵點(diǎn)的位置。

本公開實(shí)施例所提供的方案,可應(yīng)用于個(gè)人計(jì)算機(jī)、計(jì)算設(shè)備、智能手機(jī)、平板電腦或拍攝設(shè)備等。

卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是一種前饋神經(jīng)網(wǎng)絡(luò),在模式分類等領(lǐng)域,由于該網(wǎng)絡(luò)避免了對(duì)圖像的復(fù)雜前期預(yù)處理,可以直接輸入原始圖像,因而得到了更為廣泛的應(yīng)用。CNN的基本結(jié)構(gòu)包括兩層,其一為特征提取層,每個(gè)神經(jīng)元的輸入與前一層的局部接受域相連,并提取該局部的特征。一旦該局部特征被提取后,它與其它特征間的位置關(guān)系也隨之確定下來;其二是特征映射層,網(wǎng)絡(luò)的每個(gè)計(jì)算層由多個(gè)特征映射組成,每個(gè)特征映射是一個(gè)平面,平面上所有神經(jīng)元的權(quán)值相等。特征映射結(jié)構(gòu)采用影響函數(shù)核小的sigmoid函數(shù)作為卷積網(wǎng)絡(luò)的激活函數(shù),使得特征映射具有位移不變性。此外,由于一個(gè)映射面上的神經(jīng)元共享權(quán)值,因而減少了網(wǎng)絡(luò)自由參數(shù)的個(gè)數(shù)。卷積神經(jīng)網(wǎng)絡(luò)中的每一個(gè)卷積層都緊跟著一個(gè)用來求局部平均與二次提取的計(jì)算層,這種特有的兩次特征提取結(jié)構(gòu)減小了特征分辨率。

CNN主要用來識(shí)別位移、縮放及其他形式扭曲不變性的二維圖形。由于CNN的特征檢測層通過訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí),所以在使用CNN時(shí),避免了顯示的特征抽取,而是隱式地從訓(xùn)練數(shù)據(jù)中進(jìn)行學(xué)習(xí);再者,由于同一特征映射面上的神經(jīng)元權(quán)值相同,所以網(wǎng)絡(luò)可以并行學(xué)習(xí),這也是卷積網(wǎng)絡(luò)相對(duì)于神經(jīng)元彼此相連網(wǎng)絡(luò)的一大優(yōu)勢(shì)。卷積神經(jīng)網(wǎng)絡(luò)以其局部權(quán)值共享的特殊結(jié)構(gòu)在語音識(shí)別和圖像處理方面有著獨(dú)特的優(yōu)越性,其布局更接近于實(shí)際的生物神經(jīng)網(wǎng)絡(luò),權(quán)值共享降低了網(wǎng)絡(luò)的復(fù)雜性,特別是多維輸入向量的圖像可以直接輸入網(wǎng)絡(luò)這一特點(diǎn)避免了特征提取和分類過程中數(shù)據(jù)重建的復(fù)雜度。

本公開實(shí)施例中,可以針對(duì)人臉關(guān)鍵點(diǎn)定位的處理任務(wù),預(yù)先準(zhǔn)備已標(biāo)定人臉關(guān)鍵點(diǎn)的圖像作為訓(xùn)練樣本,對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行深度學(xué)習(xí)訓(xùn)練,在訓(xùn)練完成后,采用所得到的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉關(guān)鍵點(diǎn)定位。其中,卷積神經(jīng)網(wǎng)絡(luò)中可以包括多個(gè)不同的卷積神經(jīng)網(wǎng)絡(luò)模型,各模型通過不同的處理任務(wù)訓(xùn)練得到;例如,針對(duì)在待定位圖像的人臉區(qū)域中確定人臉關(guān)鍵點(diǎn)的初始位置的任務(wù),可以對(duì)應(yīng)訓(xùn)練出若干個(gè)卷積神經(jīng)網(wǎng)絡(luò)模型。或者是,針對(duì)在圖像中對(duì)人臉關(guān)鍵點(diǎn)進(jìn)行迭代更新的任務(wù),可以對(duì)應(yīng)訓(xùn)練出若干個(gè)卷積神經(jīng)網(wǎng)絡(luò)模型?;蛘呤?,針對(duì)人臉關(guān)鍵點(diǎn)所指示的不同人臉部位,對(duì)應(yīng)訓(xùn)練出不同的卷積神經(jīng)網(wǎng)絡(luò)模型等等。

其中,人臉關(guān)鍵點(diǎn)表示在圖像中能指示人臉的關(guān)鍵特征點(diǎn),例如眉毛、眼睛、鼻子、嘴巴或臉部輪廓等人臉重要部位的像素點(diǎn)。在實(shí)際應(yīng)用中,可以根據(jù)需要預(yù)先設(shè)定需定位的人臉關(guān)鍵點(diǎn),例如設(shè)定鼻子或嘴巴等。各人臉關(guān)鍵點(diǎn)在圖像中的具體位置,即表示人臉關(guān)鍵點(diǎn)在圖像中的具體坐標(biāo)。

在進(jìn)行定位前,可以對(duì)待定位圖像進(jìn)行人臉檢測,獲得人臉區(qū)域,以用于后續(xù)進(jìn)行人臉關(guān)鍵點(diǎn)定位時(shí),在已框定的人臉區(qū)域中進(jìn)行計(jì)算。具體的,可以采用局部二值模式(Local binary patterns,LBP)與AdaBoost(Adaptive Boosting)相結(jié)合的方式進(jìn)行人臉檢測,從而檢測出待定位圖像中的人臉區(qū)域。

在具體采用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉關(guān)鍵點(diǎn)定位前,還可以對(duì)人臉區(qū)域圖像進(jìn)行預(yù)處理,具體的預(yù)處理過程可以根據(jù)實(shí)際應(yīng)用和卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程而確定。例如,可以將圖像按照訓(xùn)練樣本的規(guī)格而進(jìn)行預(yù)處理,假設(shè)訓(xùn)練過程中所采用的訓(xùn)練圖像大部分為64×64的大小,則可以將待定位圖像中的人臉區(qū)域處理為同樣的尺寸?;蛘?,還可以進(jìn)行灰度處理,以減少計(jì)算量?;蛘撸€可以進(jìn)行歸一化處理,例如將每個(gè)像素點(diǎn)的像素值減去均值、或者除去方差等處理。

在一個(gè)可選的實(shí)現(xiàn)方式中,對(duì)于每個(gè)人臉關(guān)鍵點(diǎn),所述根據(jù)各人臉關(guān)鍵點(diǎn)的初始位置,利用所述卷積神經(jīng)網(wǎng)絡(luò)迭代更新各人臉關(guān)鍵點(diǎn)的位置,包括:

獲取本次迭代的人臉關(guān)鍵點(diǎn)的起始位置,以所述本次迭代的人臉關(guān)鍵點(diǎn)的起始位置為中心,在所述人臉區(qū)域中獲取若干個(gè)圖像塊;其中,在第一次迭代時(shí),所述本次迭代的人臉關(guān)鍵點(diǎn)的起始位置為所述初始位置,在第i次迭代時(shí),所述本次迭代的人臉關(guān)鍵點(diǎn)的起始位置為上一次迭代所獲得的人臉關(guān)鍵點(diǎn)的位置Pi-1,i是大于1的正整數(shù)。

分別對(duì)所述若干個(gè)圖像塊進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)運(yùn)算,獲得各圖像塊中人臉關(guān)鍵點(diǎn)的第一位置。

計(jì)算各圖像塊中人臉關(guān)鍵點(diǎn)的第一位置的均值,將所述均值更新為本次迭代所獲得的人臉關(guān)鍵點(diǎn)的位置Pi。

本公開實(shí)施例中,通過設(shè)定人臉關(guān)鍵點(diǎn)的初始位置,經(jīng)過迭代回歸的方法來迭代更新人臉關(guān)鍵點(diǎn)的當(dāng)前位置,從而逐步逼近人臉關(guān)鍵點(diǎn)的真實(shí)位置。

在進(jìn)行第一次迭代更新時(shí),卷積神經(jīng)網(wǎng)絡(luò)的輸入為人臉關(guān)鍵點(diǎn)的初始位置。卷積神經(jīng)網(wǎng)絡(luò)中包括多個(gè)卷積神經(jīng)網(wǎng)絡(luò)模型,由于每個(gè)人臉關(guān)鍵點(diǎn)指示不同的人臉部位,在具體運(yùn)算時(shí),每個(gè)人臉關(guān)鍵點(diǎn)可以采用對(duì)應(yīng)的模型進(jìn)行運(yùn)算,不同人臉關(guān)鍵點(diǎn)所采用模型可以不同。在利用卷積神經(jīng)網(wǎng)絡(luò)模型更新人臉關(guān)鍵點(diǎn)的位置時(shí),可以以人臉關(guān)鍵點(diǎn)的初始位置作為中心,在原人臉區(qū)域上截取圖像塊,以該圖像塊作為模型的輸入數(shù)據(jù)進(jìn)行運(yùn)算。為使運(yùn)算結(jié)果更為精確,本公開實(shí)施例中,可以在原人臉區(qū)域上截取多個(gè)圖像塊,并利用模型分別對(duì)圖像塊進(jìn)行運(yùn)算。在運(yùn)算結(jié)束,獲得多個(gè)圖像塊中人臉關(guān)鍵點(diǎn)的運(yùn)算結(jié)果(即第一位置)后,可對(duì)運(yùn)算結(jié)果求取均值,作為本次迭代的更新位置。

其中,在所述人臉區(qū)域中獲取若干個(gè)圖像塊時(shí),可以是在所述人臉區(qū)域中獲取若干個(gè)大小不同的圖像塊。采用截取大小不同的圖像塊的目的,是為了參考更多不同大小的圖像內(nèi)容,從而獲得更為精確的結(jié)果。

由于卷積神經(jīng)網(wǎng)絡(luò)中包括多個(gè)預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型,因此,所述分別對(duì)所述若干個(gè)圖像塊進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)運(yùn)算,可以包括:

針對(duì)每個(gè)圖像塊,采用不同的卷積神經(jīng)網(wǎng)絡(luò)模型分別對(duì)每個(gè)所述圖像塊進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)運(yùn)算,通過不同的模型,以減少計(jì)算誤差,使得所運(yùn)算的結(jié)果更為精確。

在進(jìn)行第二次或更多次迭代時(shí),卷積神經(jīng)網(wǎng)絡(luò)的輸入為上一次迭代所獲得的更新位置,使得所計(jì)算的位置可以逐漸逼近真實(shí)位置。在一個(gè)可選的實(shí)現(xiàn)方式中,所述方法還包括:

在每一次迭代時(shí),記錄迭代次數(shù)。

當(dāng)本次迭代的迭代次數(shù)等于預(yù)設(shè)迭代次數(shù)時(shí),確定迭代結(jié)束,將本次迭代所獲得的人臉關(guān)鍵點(diǎn)的位置作為人臉關(guān)鍵點(diǎn)的目標(biāo)位置。

當(dāng)本次迭代的迭代次數(shù)小于預(yù)設(shè)迭代次數(shù)時(shí),將本次迭代所獲得的人臉關(guān)鍵點(diǎn)的位置作為下一次迭代的人臉關(guān)鍵點(diǎn)的起始位置。

其中,每一次迭代更新時(shí),所采用的卷積神經(jīng)網(wǎng)絡(luò)模型不相同。本實(shí)施例中,迭代的收斂條件采用迭代次數(shù),若迭代更新達(dá)到預(yù)先設(shè)定的次數(shù),則可以可以終止迭代運(yùn)算,獲得人臉關(guān)鍵點(diǎn)的目標(biāo)位置。采用迭代次數(shù)來確定是否迭代結(jié)束的方式更易實(shí)現(xiàn),計(jì)算量較低。實(shí)際應(yīng)用中,預(yù)設(shè)迭代次數(shù)可以是3次、4次等數(shù)值,具體的數(shù)值可以在卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練階段確定。

接下來結(jié)合圖2,對(duì)本公開實(shí)施例再次進(jìn)行說明如圖2所示,圖2是本公開根據(jù)一示例性實(shí)施例示出的另一種人臉關(guān)鍵點(diǎn)定位方法的流程圖,包括如下處理過程;

輸入圖像。

人臉檢測:對(duì)于輸入的待定位圖像,首先進(jìn)行人臉檢測,檢測出人臉區(qū)域。本實(shí)施例人臉檢測采用LBP特征+Adaboost的方法。

預(yù)處理:將人臉區(qū)域圖像轉(zhuǎn)為灰度圖,并縮放到64×64大小,然后進(jìn)行歸一化(減均值,除方差)。

人臉關(guān)鍵點(diǎn)初始化:使用一CNN網(wǎng)絡(luò)模型對(duì)歸一化后的人臉區(qū)域圖像進(jìn)行回歸運(yùn)算,得到人臉關(guān)鍵點(diǎn)的初始位置P0。假設(shè)人臉關(guān)鍵點(diǎn)的個(gè)數(shù)為n,則CNN網(wǎng)絡(luò)的輸入為64×64的人臉區(qū)域圖像,輸出為長度2n的向量,也就是人臉關(guān)鍵點(diǎn)的坐標(biāo)P0=(x1,y1,x2,y2,...xn,yn)。其中,(xi,yi)表示第i個(gè)人臉關(guān)鍵點(diǎn)在人臉區(qū)域圖像中的坐標(biāo)。其中,P0作為初始位置。

優(yōu)化更新人臉關(guān)鍵點(diǎn)位置:假設(shè)當(dāng)前的人臉關(guān)鍵點(diǎn)位置為Pt-1,以Pt-1中每一個(gè)人臉關(guān)鍵點(diǎn)為中心截取若干個(gè)小的圖像塊(本實(shí)施例截取3個(gè)),圖像塊的大小分別為15×15、19×19、23×23;然后對(duì)每一個(gè)小圖像塊,采用一CNN網(wǎng)絡(luò)模型進(jìn)行運(yùn)算,得到該小圖像塊所對(duì)應(yīng)的人臉關(guān)鍵點(diǎn)坐標(biāo)的更新位置,然后將每一個(gè)關(guān)鍵點(diǎn)所對(duì)應(yīng)的3個(gè)小圖像塊的結(jié)果進(jìn)行平均,得到該關(guān)鍵點(diǎn)坐標(biāo)的最終更新位置,從而得到所有人臉關(guān)鍵點(diǎn)的最終更新位置Pt。

在此步驟中,針對(duì)每一個(gè)人臉關(guān)鍵點(diǎn)所截取的每一個(gè)小圖像塊分別采用不同的CNN網(wǎng)絡(luò)模型進(jìn)行計(jì)算,也就是針對(duì)每一個(gè)人臉關(guān)鍵點(diǎn)需要訓(xùn)練3個(gè)CNN網(wǎng)絡(luò)模型(n個(gè)人臉關(guān)鍵點(diǎn)的話一共有3n個(gè)CNN網(wǎng)絡(luò)模型),這3個(gè)CNN網(wǎng)絡(luò)的輸入分別為15x15、19x19、23x23的圖像,輸出都為長度為2的向量,表示對(duì)應(yīng)的人臉關(guān)鍵點(diǎn)坐標(biāo)的更新位置。

重復(fù)(4)直到收斂,經(jīng)過t次迭代后,最終的Pt即為最終的人臉關(guān)鍵點(diǎn)位置。本實(shí)施例中,t=3即可達(dá)到很好的結(jié)果。

其中,每一次迭代都需要3n個(gè)CNN模型,也即是,每一次迭代所采用的模型也都不相同。

與前述人臉關(guān)鍵點(diǎn)定位方法的實(shí)施例相對(duì)應(yīng),本公開還提供了人臉關(guān)鍵點(diǎn)定位裝置及其所應(yīng)用的設(shè)備的實(shí)施例。

如圖3所示,圖3是本公開根據(jù)一示例性實(shí)施例示出的一種人臉關(guān)鍵點(diǎn)定位裝置的框圖,所述裝置包括:人臉區(qū)域確定模塊31、初始位置確定模塊32和迭代更新模塊33。

其中,人臉區(qū)域確定模塊31,被配置為:確定待定位圖像中的人臉區(qū)域。

初始位置確定模塊32,被配置為:針對(duì)所述人臉區(qū)域,采用預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)確定若干個(gè)人臉關(guān)鍵點(diǎn)的初始位置。

迭代更新模塊33,被配置為:根據(jù)各人臉關(guān)鍵點(diǎn)的初始位置,利用所述卷積神經(jīng)網(wǎng)絡(luò)迭代更新各人臉關(guān)鍵點(diǎn)的位置。

由上述實(shí)施例可見,針對(duì)所述人臉區(qū)域,采用預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)確定若干個(gè)人臉關(guān)鍵點(diǎn)的初始位置,根據(jù)各人臉關(guān)鍵點(diǎn)的初始位置,利用所述卷積神經(jīng)網(wǎng)絡(luò)迭代更新各人臉關(guān)鍵點(diǎn)的位置,最終可以獲得各所述人臉關(guān)鍵點(diǎn)的精確位置。由于卷積神經(jīng)網(wǎng)絡(luò)利用深度學(xué)習(xí)技術(shù)而獲得,其運(yùn)算能力更強(qiáng),精確度更高,有效的解決了模型的初始化問題和定位精度不足的問題。

如圖4所示,圖4是本公開根據(jù)一示例性實(shí)施例示出的另一種人臉關(guān)鍵點(diǎn)定位裝置的框圖,該實(shí)施例在前述圖3所示實(shí)施例的基礎(chǔ)上,所述迭代更新模塊33,包括圖像塊獲取子模塊331、運(yùn)算子模塊332和均值計(jì)算子模塊333。

所述圖像塊獲取子模塊331,被配置為:對(duì)于每個(gè)人臉關(guān)鍵點(diǎn),獲取本次迭代的人臉關(guān)鍵點(diǎn)的起始位置,以所述本次迭代的人臉關(guān)鍵點(diǎn)的起始位置為中心,在所述人臉區(qū)域中獲取若干個(gè)圖像塊;其中,在第一次迭代時(shí),所述本次迭代的人臉關(guān)鍵點(diǎn)的起始位置為所述初始位置,在第i次迭代時(shí),所述本次迭代的人臉關(guān)鍵點(diǎn)的起始位置為上一次迭代所獲得的人臉關(guān)鍵點(diǎn)的位置Pi-1,i是大于1的正整數(shù)。

所述運(yùn)算子模塊332,被配置為:分別對(duì)所述若干個(gè)圖像塊進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)運(yùn)算,獲得各圖像塊中人臉關(guān)鍵點(diǎn)的第一位置。

所述均值計(jì)算子模塊333,被配置為:計(jì)算各圖像塊中人臉關(guān)鍵點(diǎn)的第一位置的均值,將所述均值更新為本次迭代所獲得的人臉關(guān)鍵點(diǎn)的位置Pi。

由上述實(shí)施例可見,以人臉關(guān)鍵點(diǎn)為中心截取若干個(gè)圖像塊,通過對(duì)各個(gè)圖像塊進(jìn)行迭代運(yùn)算,因此可以迭代更新人臉關(guān)鍵點(diǎn)的位置,從而逐步逼近人臉關(guān)鍵點(diǎn)的真實(shí)位置。

如圖5所示,圖5是本公開根據(jù)一示例性實(shí)施例示出的另一種人臉關(guān)鍵點(diǎn)定位裝置的框圖,該實(shí)施例在前述圖4所示實(shí)施例的基礎(chǔ)上,所述迭代更新模塊33還包括:迭代次數(shù)記錄子模塊334和迭代次數(shù)判斷子模塊335。

迭代次數(shù)記錄子模塊334,被配置為:在每一次迭代時(shí),記錄迭代次數(shù)。

迭代次數(shù)判斷子模塊335,被配置為:當(dāng)本次迭代的迭代次數(shù)等于預(yù)設(shè)迭代次數(shù)時(shí),確定迭代結(jié)束,將本次迭代所獲得的人臉關(guān)鍵點(diǎn)的位置作為人臉關(guān)鍵點(diǎn)的目標(biāo)位置;當(dāng)本次迭代的迭代次數(shù)小于預(yù)設(shè)迭代次數(shù)時(shí),將本次迭代所獲得的人臉關(guān)鍵點(diǎn)的位置作為下一次迭代的人臉關(guān)鍵點(diǎn)的起始位置。

由上述實(shí)施例可見,通過在每次迭代時(shí)記錄迭代次數(shù),若達(dá)到預(yù)設(shè)迭代次數(shù),則表示已獲得人臉關(guān)鍵點(diǎn)的較為精確的位置,因此可以終止迭代運(yùn)算,獲得人臉關(guān)鍵點(diǎn)的目標(biāo)位置。

在一個(gè)可選的實(shí)現(xiàn)方式中,所述若干個(gè)圖像塊的大小不相同。

由上述實(shí)施例可見,通過截取大小不同的圖像塊,可以參考更多的圖像內(nèi)容,從而獲得更為精確的結(jié)果。

如圖6所示,圖6是本公開根據(jù)一示例性實(shí)施例示出的另一種人臉關(guān)鍵點(diǎn)定位裝置的框圖,該實(shí)施例在前述圖4所示實(shí)施例的基礎(chǔ)上,所述卷積神經(jīng)網(wǎng)絡(luò)中包括多個(gè)預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型。

所述運(yùn)算子模塊332,包括:

模型運(yùn)算子模塊3321,被配置為:針對(duì)每個(gè)圖像塊,采用不同的卷積神經(jīng)網(wǎng)絡(luò)模型分別對(duì)每個(gè)所述圖像塊進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)運(yùn)算。

由上述實(shí)施例可見,在針對(duì)圖像塊進(jìn)行位置更新時(shí),可以采用不同的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行運(yùn)算,通過不同的模型,能減少計(jì)算誤差,使得所運(yùn)算的結(jié)果更為精確。

在一個(gè)可選的實(shí)現(xiàn)方式中,所述模型運(yùn)算子模塊3321,還被配置為:在本次迭代中,各人臉關(guān)鍵點(diǎn)對(duì)應(yīng)的各個(gè)圖像塊所采用的卷積神經(jīng)網(wǎng)絡(luò)模型,與已完成的各次迭代中所采用的卷積神經(jīng)網(wǎng)絡(luò)模型都不相同。

由上述實(shí)施例可見,在每一次迭代更新時(shí),可以采用不同的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行運(yùn)算,通過不同的模型,以減少計(jì)算誤差,使得所運(yùn)算的結(jié)果更為精確。

相應(yīng)的,本公開還提供一種裝置,所述裝置包括有處理器;用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;其中,所述處理器被配置為:

確定待定位圖像中的人臉區(qū)域。

針對(duì)所述人臉區(qū)域,采用預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)確定若干個(gè)人臉關(guān)鍵點(diǎn)的初始位置。

根據(jù)各人臉關(guān)鍵點(diǎn)的初始位置,利用所述卷積神經(jīng)網(wǎng)絡(luò)迭代更新各人臉關(guān)鍵點(diǎn)的位置。

上述裝置中各個(gè)模塊的功能和作用的實(shí)現(xiàn)過程具體詳見上述方法中對(duì)應(yīng)步驟的實(shí)現(xiàn)過程,在此不再贅述。

對(duì)于裝置實(shí)施例而言,由于其基本對(duì)應(yīng)于方法實(shí)施例,所以相關(guān)之處參見方法實(shí)施例的部分說明即可。以上所描述的裝置實(shí)施例僅僅是示意性的,其中所述作為分離部件說明的模塊可以是或者也可以不是物理上分開的,作為模塊顯示的部件可以是或者也可以不是物理模塊,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)模塊上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本公開方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動(dòng)的情況下,即可以理解并實(shí)施。

圖7是根據(jù)一示例性實(shí)施例示出的一種人臉關(guān)鍵點(diǎn)定位裝置的結(jié)構(gòu)示意圖。

如圖7所示,根據(jù)一示例性實(shí)施例示出的一種人臉關(guān)鍵點(diǎn)定位裝置700,該裝置700可以是計(jì)算機(jī),移動(dòng)電話,數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺(tái),平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個(gè)人數(shù)字助理等設(shè)備。

參照?qǐng)D7,裝置700可以包括以下一個(gè)或多個(gè)組件:處理組件701,存儲(chǔ)器702,電源組件703,多媒體組件704,音頻組件705,輸入/輸出(I/O)的接口706,傳感器組件707,以及通信組件708。

處理組件701通??刂蒲b置700的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理組件701可以包括一個(gè)或多個(gè)處理器709來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件701可以包括一個(gè)或多個(gè)模塊,便于處理組件701和其它組件之間的交互。例如,處理部件701可以包括多媒體模塊,以方便多媒體組件704和處理組件701之間的交互。

存儲(chǔ)器702被配置為存儲(chǔ)各種類型的數(shù)據(jù)以支持在裝置700的操作。這些數(shù)據(jù)的示例包括用于在裝置700上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲(chǔ)器702可以由任何類型的易失性或非易失性存儲(chǔ)設(shè)備或者它們的組合實(shí)現(xiàn),如靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM),電可擦除可編程只讀存儲(chǔ)器(EEPROM),可擦除可編程只讀存儲(chǔ)器(EPROM),可編程只讀存儲(chǔ)器(PROM),只讀存儲(chǔ)器(ROM),磁存儲(chǔ)器,快閃存儲(chǔ)器,磁盤或光盤。

電源組件703為裝置700的各種組件提供電力。電源組件703可以包括電源管理系統(tǒng),一個(gè)或多個(gè)電源,及其它與為裝置700生成、管理和分配電力相關(guān)聯(lián)的組件。

多媒體組件704包括在所述裝置700和用戶之間的提供一個(gè)輸出接口的屏幕。在一些實(shí)施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實(shí)現(xiàn)為觸摸屏,以接收來自用戶的輸入信號(hào)。觸摸面板包括一個(gè)或多個(gè)觸摸傳感器以感測觸摸、滑動(dòng)和觸摸面板上的手勢(shì)。所述觸摸傳感器可以不僅感測觸摸或滑動(dòng)動(dòng)作的邊界,而且還檢測與所述觸摸或滑動(dòng)操作相關(guān)的持續(xù)時(shí)間和壓力。在一些實(shí)施例中,多媒體組件704包括一個(gè)前置攝像頭和/或后置攝像頭。當(dāng)裝置700處于操作模式,如拍攝模式或視頻模式時(shí),前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個(gè)前置攝像頭和后置攝像頭可以是一個(gè)固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。

音頻組件705被配置為輸出和/或輸入音頻信號(hào)。例如,音頻組件705包括一個(gè)麥克風(fēng)(MIC),當(dāng)裝置700處于操作模式,如呼叫模式、記錄模式和語音識(shí)別模式時(shí),麥克風(fēng)被配置為接收外部音頻信號(hào)。所接收的音頻信號(hào)可以被進(jìn)一步存儲(chǔ)在存儲(chǔ)器702或經(jīng)由通信組件708發(fā)送。在一些實(shí)施例中,音頻組件705還包括一個(gè)揚(yáng)聲器,用于輸出音頻信號(hào)。

I/O接口702為處理組件701和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點(diǎn)擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動(dòng)按鈕和鎖定按鈕。

傳感器組件707包括一個(gè)或多個(gè)傳感器,用于為裝置700提供各個(gè)方面的狀態(tài)評(píng)估。例如,傳感器組件707可以檢測到裝置700的打開/關(guān)閉狀態(tài),組件的相對(duì)定位,例如所述組件為裝置700的顯示器和小鍵盤,傳感器組件707還可以檢測裝置700或裝置700一個(gè)組件的位置改變,用戶與裝置700接觸的存在或不存在,裝置700方位或加速/減速和裝置700的溫度變化。傳感器組件707可以包括接近傳感器,被配置用來在沒有任何的物理接觸時(shí)檢測附近物體的存在。傳感器組件707還可以包括光傳感器,如CMOS或CCD圖像傳感器,用于在成像應(yīng)用中使用。在一些實(shí)施例中,該傳感器組件707還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。

通信組件708被配置為便于裝置700和其它設(shè)備之間有線或無線方式的通信。裝置700可以接入基于通信標(biāo)準(zhǔn)的無線網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個(gè)示例性實(shí)施例中,通信組件708經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號(hào)或廣播相關(guān)信息。在一個(gè)示例性實(shí)施例中,所述通信組件708還包括近場通信(NFC)模塊,以促進(jìn)短程通信。例如,在NFC模塊可基于射頻識(shí)別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(huì)(IrDA)技術(shù),超寬帶(UWB)技術(shù),藍(lán)牙(BT)技術(shù)和其它技術(shù)來實(shí)現(xiàn)。

在示例性實(shí)施例中,裝置700可以被一個(gè)或多個(gè)應(yīng)用專用集成電路(ASIC)、數(shù)字信號(hào)處理器(DSP)、數(shù)字信號(hào)處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列(FPGA)、控制器、微控制器、微處理器或其它電子元件實(shí)現(xiàn),用于執(zhí)行上述方法。

在示例性實(shí)施例中,還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),例如包括指令的存儲(chǔ)器702,上述指令可由裝置700的處理器709執(zhí)行以完成上述方法。例如,所述非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是ROM、隨機(jī)存取存儲(chǔ)器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲(chǔ)設(shè)備等。

其中,當(dāng)所述存儲(chǔ)介質(zhì)中的指令由所述處理器執(zhí)行時(shí),使得裝置700能夠執(zhí)行一種人臉關(guān)鍵點(diǎn)定位方法,包括:

確定待定位圖像中的人臉區(qū)域。

針對(duì)所述人臉區(qū)域,采用預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)確定若干個(gè)人臉關(guān)鍵點(diǎn)的初始位置。

根據(jù)各人臉關(guān)鍵點(diǎn)的初始位置,利用所述卷積神經(jīng)網(wǎng)絡(luò)迭代更新各人臉關(guān)鍵點(diǎn)的位置。

本領(lǐng)域技術(shù)人員在考慮說明書及實(shí)踐這里公開的發(fā)明后,將容易想到本公開的其它實(shí)施方案。本公開旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識(shí)或慣用技術(shù)手段。說明書和實(shí)施例僅被視為示例性的,本公開的真正范圍和精神由下面的權(quán)利要求指出。

應(yīng)當(dāng)理解的是,本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求來限制。

以上所述僅為本公開的較佳實(shí)施例而已,并不用以限制本公開,凡在本公開的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本公開保護(hù)的范圍之內(nèi)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
镇沅| 门头沟区| 涿鹿县| 南通市| 仙居县| 金川县| 平度市| 安平县| 洞口县| 梧州市| 宁蒗| 安图县| 辉县市| 政和县| 涡阳县| 安化县| 夏邑县| 德安县| 道孚县| 邯郸县| 中江县| 鹿邑县| 昌宁县| 文昌市| 鄂尔多斯市| 武城县| 清水县| 开鲁县| 集贤县| 淮安市| 莎车县| 托里县| 蓝山县| 介休市| 阿拉尔市| 保靖县| 大厂| 旌德县| 丰县| 阆中市| 台湾省|