本發(fā)明涉及人臉對(duì)齊處理領(lǐng)域,尤其涉及訓(xùn)練模型生成方法、人臉對(duì)齊處理方法、訓(xùn)練模型生成裝置及人臉對(duì)齊處理裝置。
背景技術(shù):
人臉對(duì)齊技術(shù)主要是在含有人臉的圖像區(qū)域中準(zhǔn)確定位人臉面部的關(guān)鍵點(diǎn),包括人臉輪廓、眼睛、嘴巴、鼻子、眉毛部分。
人臉對(duì)齊技術(shù)是人臉識(shí)別、自動(dòng)美顏、面部情感分類(lèi)、頭部姿態(tài)識(shí)別等技術(shù)的基礎(chǔ)?,F(xiàn)有技術(shù)中有不少人臉對(duì)齊的實(shí)現(xiàn)方法,例如在《Supervised Descent Method and its Applications to Face Alignment》提出的人臉對(duì)齊方法,該方法使用有監(jiān)督的學(xué)習(xí)方式去尋找回歸函數(shù)全局最優(yōu)的回歸矩陣。
然而,根據(jù)當(dāng)前人臉對(duì)齊的實(shí)現(xiàn)方法,為了保證人臉定位的精度,訓(xùn)練出來(lái)的定位模型的大小往往較大,例如幾十兆,甚至上百兆,并不能輕量的集成進(jìn)現(xiàn)有的app程序中。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例所要解決的技術(shù)問(wèn)題在于,提供一種訓(xùn)練模型生成方法、人臉對(duì)齊處理方法、訓(xùn)練模型生成裝置及人臉對(duì)齊處理裝置,解決現(xiàn)有技術(shù)中訓(xùn)練出來(lái)的定位模型的大小往往較大,不利于集成到現(xiàn)有的app程序中的技術(shù)問(wèn)題。
為了解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例第一方面公開(kāi)了一種訓(xùn)練模型生成方法,包括:
獲取含有人臉特征點(diǎn)標(biāo)注的訓(xùn)練樣本;
基于當(dāng)前點(diǎn)位置信息從所述訓(xùn)練樣本中提取方向梯度直方圖HOG特征,生成特征矩陣;其中,初始的當(dāng)前點(diǎn)位置信息為預(yù)設(shè)的初始人臉形狀中人臉特征點(diǎn)的位置信息;
根據(jù)所述人臉特征點(diǎn)標(biāo)注的坐標(biāo)與所述當(dāng)前點(diǎn)位置信息的坐標(biāo)的差值,以及所述特征矩陣,通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息;
根據(jù)所述更新的當(dāng)前點(diǎn)位置信息,迭代執(zhí)行所述基于當(dāng)前點(diǎn)位置信息從所述當(dāng)前訓(xùn)練樣本中提取方向梯度直方圖(Histogram of Oriented Gradient,HOG)特征至所述通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息的步驟M次;所述M為正整數(shù);
保存每次迭代得到而組成的當(dāng)前點(diǎn)位置信息的回歸矩陣,以生成用于人臉對(duì)齊處理的訓(xùn)練模型。
結(jié)合第一方面,在第一種可能的實(shí)現(xiàn)方式中,所述基于當(dāng)前點(diǎn)位置信息從所述訓(xùn)練樣本中提取方向梯度直方圖HOG特征,生成特征矩陣之前,還包括:
設(shè)置平均shape作為所述初始人臉形狀。
結(jié)合第一方面、或者第一方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,所述通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息,包括:
通過(guò)稀疏化回歸求解Ax=b中的x;其中A為所述特征矩陣,所述b為所述人臉特征點(diǎn)標(biāo)注的坐標(biāo)與所述當(dāng)前點(diǎn)位置信息的坐標(biāo)的差值;
將所述x重新乘以所述A,得到b’,將所述b’作為更新的當(dāng)前點(diǎn)位置信息的坐標(biāo);
所述保存每次迭代得到而組成的當(dāng)前點(diǎn)位置信息的回歸矩陣,包括:保存每次迭代得到而組成的稀疏回歸矩陣x。
本發(fā)明實(shí)施例第二方面公開(kāi)了一種人臉對(duì)齊處理方法,包括:
讀取用于人臉對(duì)齊處理的訓(xùn)練模型;其中所述訓(xùn)練模型為通過(guò)權(quán)利要求1-3任一項(xiàng)所述的訓(xùn)練模型生成方法生成的訓(xùn)練模型;
基于當(dāng)前點(diǎn)位置信息從目標(biāo)圖像中提取HOG特征,生成特征矩陣;其中,初始的當(dāng)前點(diǎn)位置信息為預(yù)設(shè)的初始人臉形狀中人臉特征點(diǎn)的位置信息;
根據(jù)所述特征矩陣和所述訓(xùn)練模型中回歸矩陣,計(jì)算人臉特征形狀偏移值;
根據(jù)所述偏移值更新所述當(dāng)前點(diǎn)位置信息;
根據(jù)更新后的當(dāng)前點(diǎn)位置信息,迭代執(zhí)行所述基于當(dāng)前點(diǎn)位置信息從目標(biāo)圖像中提取HOG特征至所述根據(jù)所述偏移值更新所述當(dāng)前點(diǎn)位置信息的步驟M次,得到最終更新的當(dāng)前點(diǎn)位置信息;所述M為正整數(shù)。
結(jié)合第二方面,在第一種可能的實(shí)現(xiàn)方式中,所述訓(xùn)練模型中的回歸矩陣包括所述M層的稀疏回歸矩陣x;所述根據(jù)所述特征矩陣和所述訓(xùn)練模型中回歸矩陣,計(jì)算人臉特征形狀偏移值,包括:
進(jìn)行第K次迭代時(shí),根據(jù)第K次生成的特征矩陣和所述訓(xùn)練模型中的第K層的稀疏回歸矩陣x來(lái)計(jì)算人臉特征形狀偏移值;所述K為大于0,小于等于M的自然數(shù)。
本發(fā)明實(shí)施例第三方面公開(kāi)了一種訓(xùn)練模型生成裝置,包括:
獲取模塊,用于獲取含有人臉特征點(diǎn)標(biāo)注的訓(xùn)練樣本;
矩陣生成模塊,用于基于當(dāng)前點(diǎn)位置信息從所述訓(xùn)練樣本中提取方向梯度直方圖HOG特征,生成特征矩陣;其中,初始的當(dāng)前點(diǎn)位置信息為預(yù)設(shè)的初始人臉形狀中人臉特征點(diǎn)的位置信息;
計(jì)算模塊,用于根據(jù)所述人臉特征點(diǎn)標(biāo)注的坐標(biāo)與所述當(dāng)前點(diǎn)位置信息的坐標(biāo)的差值,以及所述特征矩陣,通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息;
迭代模塊,用于根據(jù)所述更新的當(dāng)前點(diǎn)位置信息,迭代執(zhí)行所述基于當(dāng)前點(diǎn)位置信息從所述當(dāng)前訓(xùn)練樣本中提取方向梯度直方圖HOG特征至所述通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息的步驟M次;所述M為正整數(shù);
保存模塊,用于保存每次迭代得到而組成的當(dāng)前點(diǎn)位置信息的回歸矩陣,以生成用于人臉對(duì)齊處理的訓(xùn)練模型。
結(jié)合第三方面,在第一種可能的實(shí)現(xiàn)方式中,還包括:
設(shè)置模塊,用于在所述矩陣生成模塊基于當(dāng)前點(diǎn)位置信息從所述訓(xùn)練樣本中提取方向梯度直方圖HOG特征,生成特征矩陣之前,設(shè)置平均shape作為所述初始人臉形狀。
結(jié)合第三方面,或者第二方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,所述計(jì)算模塊包括:
稀疏化求解單元,用于通過(guò)稀疏化回歸求解Ax=b中的x;其中A為所述特征矩陣,所述b為所述人臉特征點(diǎn)標(biāo)注的坐標(biāo)與所述當(dāng)前點(diǎn)位置信息的坐標(biāo)的差值;
更新單元,用于將所述x重新乘以所述A,得到b’,將所述b’作為更新的當(dāng)前點(diǎn)位置信息的坐標(biāo);
所述保存模塊具體用于,保存每次迭代得到而組成的稀疏回歸矩陣x。
本發(fā)明實(shí)施例第四方面公開(kāi)了一種人臉對(duì)齊處理裝置,包括:
讀取模塊,用于讀取用于人臉對(duì)齊處理的訓(xùn)練模型;其中所述訓(xùn)練模型為通過(guò)上述訓(xùn)練模型生成方法生成的訓(xùn)練模型;
提取生成模塊,用于基于當(dāng)前點(diǎn)位置信息從目標(biāo)圖像中提取HOG特征,生成特征矩陣;其中,初始的當(dāng)前點(diǎn)位置信息為預(yù)設(shè)的初始人臉形狀中人臉特征點(diǎn)的位置信息;
偏移值計(jì)算模塊,用于根據(jù)所述特征矩陣和所述訓(xùn)練模型中回歸矩陣,計(jì)算人臉特征形狀偏移值;
信息更新模塊,用于根據(jù)所述偏移值更新所述當(dāng)前點(diǎn)位置信息;
迭代更新模塊,用于根據(jù)更新后的當(dāng)前點(diǎn)位置信息,迭代執(zhí)行所述基于當(dāng)前點(diǎn)位置信息從目標(biāo)圖像中提取HOG特征至所述根據(jù)所述偏移值更新所述當(dāng)前點(diǎn)位置信息的步驟M次,得到最終更新的當(dāng)前點(diǎn)位置信息;所述M為正整數(shù)。
結(jié)合第四方面,在第一種可能的實(shí)現(xiàn)方式中,所述訓(xùn)練模型中的回歸矩陣包括所述M層的稀疏回歸矩陣x;所述偏移值計(jì)算模塊具體用于,進(jìn)行第K次迭代時(shí),根據(jù)第K次生成的特征矩陣和所述訓(xùn)練模型中的第K層的稀疏回歸矩陣x來(lái)計(jì)算人臉特征形狀偏移值;所述K為大于0,小于等于M的自然數(shù)。
本發(fā)明實(shí)施例第五方面公開(kāi)了一種計(jì)算機(jī)存儲(chǔ)介質(zhì),所述計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有程序,所述程序執(zhí)行時(shí)包括本發(fā)明實(shí)施例第一方面,或者第一方面的第一種可能的實(shí)現(xiàn)方式,或者第一方面的第二種可能的實(shí)現(xiàn)方式中訓(xùn)練模型生成方法的全部步驟。
本發(fā)明實(shí)施例第六方面公開(kāi)了一種計(jì)算機(jī)存儲(chǔ)介質(zhì),所述計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有程序,所述程序執(zhí)行時(shí)包括本發(fā)明實(shí)施例第二方面,或者第二方面的第一種可能的實(shí)現(xiàn)方式中的人臉對(duì)齊處理方法的全部步驟。
實(shí)施本發(fā)明實(shí)施例,通過(guò)獲取含有人臉特征點(diǎn)標(biāo)注的訓(xùn)練樣本;基于當(dāng)前點(diǎn)位置信息從訓(xùn)練樣本中提取方向梯度直方圖HOG特征,生成特征矩陣;其中,初始的當(dāng)前點(diǎn)位置信息為預(yù)設(shè)的初始人臉形狀中人臉特征點(diǎn)的位置信息;根據(jù)人臉特征點(diǎn)標(biāo)注的坐標(biāo)與當(dāng)前點(diǎn)位置信息的坐標(biāo)的差值,以及特征矩陣,通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息;根據(jù)更新的當(dāng)前點(diǎn)位置信息,迭代執(zhí)行基于當(dāng)前點(diǎn)位置信息從當(dāng)前訓(xùn)練樣本中提取方向梯度直方圖HOG特征至通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息的步驟M次;保存每次迭代得到而組成的當(dāng)前點(diǎn)位置信息的回歸矩陣,以生成用于人臉對(duì)齊處理的訓(xùn)練模型。實(shí)現(xiàn)了一種壓縮特征點(diǎn)定位模型的稀疏矩陣回歸訓(xùn)練方式,能夠很大程序地減少人臉對(duì)齊的訓(xùn)練模型,同時(shí)保持了人臉定位的精度,從而解決了現(xiàn)有技術(shù)中訓(xùn)練出來(lái)的定位模型的大小往往較大,不利于集成到現(xiàn)有的app程序中的技術(shù)問(wèn)題,可以將訓(xùn)練模型輕量地集成進(jìn)移動(dòng)app產(chǎn)品中。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實(shí)施例提供的訓(xùn)練模型生成方法的流程示意圖;
圖2是本發(fā)明提供的訓(xùn)練模型生成方法的另一實(shí)施例的流程示意圖;
圖3是本發(fā)明實(shí)施例提供的人臉對(duì)齊處理方法的流程示意圖;
圖4是本發(fā)明實(shí)施例提供的訓(xùn)練模型生成裝置的結(jié)構(gòu)示意圖;
圖5是本發(fā)明提供的訓(xùn)練模型生成裝置的另一實(shí)施例的結(jié)構(gòu)示意圖;
圖6是本發(fā)明實(shí)施例提供的計(jì)算模塊的結(jié)構(gòu)示意圖;
圖7是本發(fā)明提供的訓(xùn)練模型生成裝置的另一實(shí)施例的結(jié)構(gòu)示意圖;
圖8是本發(fā)明實(shí)施例提供的人臉對(duì)齊處理裝置的結(jié)構(gòu)示意圖;
圖9本發(fā)明提供的人臉對(duì)齊處理裝置的另一實(shí)施例的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明各個(gè)實(shí)施例的訓(xùn)練模型生成方法都可以基于個(gè)人計(jì)算機(jī)來(lái)實(shí)現(xiàn),即技術(shù)人員通過(guò)操作個(gè)人計(jì)算機(jī),編寫(xiě)訓(xùn)練模型的生成運(yùn)行代碼,即可生成訓(xùn)練模型,并最終集成到所需的移動(dòng)app產(chǎn)品中。
本發(fā)明各個(gè)實(shí)施例的人臉對(duì)齊處理方法可以基于個(gè)人計(jì)算機(jī)、個(gè)人數(shù)字助理(Personal Digital Assis tant,PDA)、媒體播放器、智能移動(dòng)設(shè)備(包括移動(dòng)電話、移動(dòng)電腦、平板電腦、智能電視、智能手表、智能眼鏡和智能手環(huán)等)等設(shè)備來(lái)實(shí)現(xiàn)。也就是說(shuō),集成有本發(fā)明實(shí)施例生成的訓(xùn)練模型的移動(dòng)app產(chǎn)品可以運(yùn)行在上述設(shè)備中。
下面我們以圖1示出的本發(fā)明實(shí)施例提供的訓(xùn)練模型生成方法的流程示意圖,來(lái)詳細(xì)說(shuō)明本發(fā)明實(shí)施例提供的訓(xùn)練模型生成方法,包括如下步驟:
步驟S100:獲取含有人臉特征點(diǎn)標(biāo)注的訓(xùn)練樣本;
具體地,可以搜集含有K個(gè)人臉特征點(diǎn)標(biāo)注的訓(xùn)練樣本,該K個(gè)人臉特征點(diǎn)可以為68個(gè)人臉特征點(diǎn),或者72個(gè)人臉特征點(diǎn)等等,本發(fā)明實(shí)施例不作限制。搜集的訓(xùn)練樣本可以有上千個(gè),例如2000多個(gè)訓(xùn)練樣本,本發(fā)明實(shí)施例中的訓(xùn)練樣本都標(biāo)注有人臉特征點(diǎn)的位置信息,例如人臉特征點(diǎn)的坐標(biāo)等。
步驟S102:基于當(dāng)前點(diǎn)位置信息從所述訓(xùn)練樣本中提取方向梯度直方圖HOG特征,生成特征矩陣;
具體地,本發(fā)明實(shí)施例中初始的當(dāng)前點(diǎn)位置信息可以為預(yù)設(shè)的初始人臉形狀中人臉特征點(diǎn)的位置信息;該初始人臉形狀可以為平均shape,也就是說(shuō),步驟S102之前,還可以包括設(shè)置平均shape作為所述初始人臉形狀的步驟。
以訓(xùn)練樣本為68個(gè)人臉特征點(diǎn)為例,那么提取HOG特征生成的特征矩陣即可以為68個(gè)向量組成的特征矩陣。
步驟S104:根據(jù)所述人臉特征點(diǎn)標(biāo)注的坐標(biāo)與所述當(dāng)前點(diǎn)位置信息的坐標(biāo)的差值,以及所述特征矩陣,通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息;
具體地,本發(fā)明實(shí)施例通過(guò)稀疏化回歸的方式進(jìn)行計(jì)算,可以實(shí)現(xiàn)對(duì)特征點(diǎn)定位模型進(jìn)行壓縮,從而能夠很大程序地減少人臉對(duì)齊的訓(xùn)練模型,同時(shí)保持了人臉定位的精度。
步驟S106:根據(jù)所述更新的當(dāng)前點(diǎn)位置信息,迭代執(zhí)行所述基于當(dāng)前點(diǎn)位置信息從所述當(dāng)前訓(xùn)練樣本中提取方向梯度直方圖HOG特征至所述通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息的步驟M次;
具體地,以步驟S104中計(jì)算出的當(dāng)前點(diǎn)位置信息重新執(zhí)行步驟S102至步驟S104,也就是說(shuō)完成M次迭代,本發(fā)明實(shí)施例中的M為正整數(shù)。M的值可以根據(jù)用戶自身的需求或者根據(jù)經(jīng)驗(yàn)值來(lái)設(shè)置,本發(fā)明不做限制。
步驟S108:保存每次迭代得到而組成的當(dāng)前點(diǎn)位置信息的回歸矩陣,以生成用于人臉對(duì)齊處理的訓(xùn)練模型。
具體地,第一次執(zhí)行步驟S104以及后續(xù)迭代過(guò)程中每次執(zhí)行步驟S104,都可以得到一個(gè)當(dāng)前點(diǎn)位置信息,那么保存所有得到的當(dāng)前點(diǎn)位置信息形成回歸矩陣,從而生成了后續(xù)用于人臉對(duì)齊處理的訓(xùn)練模型。
實(shí)施本發(fā)明實(shí)施例,實(shí)現(xiàn)了一種壓縮特征點(diǎn)定位模型的稀疏矩陣回歸訓(xùn)練方式,能夠很大程序地減少人臉對(duì)齊的訓(xùn)練模型,同時(shí)保持了人臉定位的精度,從而解決了現(xiàn)有技術(shù)中訓(xùn)練出來(lái)的定位模型的大小往往較大,不利于集成到現(xiàn)有的app程序中的技術(shù)問(wèn)題,可以將訓(xùn)練模型輕量地集成進(jìn)移動(dòng)app產(chǎn)品中。
進(jìn)一步地,如圖2示出的本發(fā)明提供的訓(xùn)練模型生成方法的另一實(shí)施例的流程示意圖,再舉例來(lái)詳細(xì)說(shuō)明本發(fā)明實(shí)施例提供的訓(xùn)練模型生成方法,包括如下步驟:
步驟S200:獲取含有人臉特征點(diǎn)標(biāo)注的訓(xùn)練樣本;
步驟S202:設(shè)置平均shape作為所述初始人臉形狀;
步驟S204:基于當(dāng)前點(diǎn)位置信息從所述訓(xùn)練樣本中提取方向梯度直方圖HOG特征,生成特征矩陣;
具體地,步驟S200至步驟S204可以參考上述圖1實(shí)施例中的步驟S100至步驟S102,這里不再贅述。
步驟S206:通過(guò)稀疏化回歸求解Ax=b中的x;
具體地,該A為所述特征矩陣,該b為該人臉特征點(diǎn)標(biāo)注的坐標(biāo)與該當(dāng)前點(diǎn)位置信息的坐標(biāo)的差值;將該x設(shè)置作為更新的當(dāng)前點(diǎn)位置信息的坐標(biāo)。
步驟S208:將所述x重新乘以所述A,得到b’,將所述b’作為更新的當(dāng)前點(diǎn)位置信息的坐標(biāo);
具體地,利用了稀疏化回歸求解的原理,將該x重新乘以該A,得到的值b’接近于該b,但不等同于b;將該b’作為新的當(dāng)前位置信息進(jìn)行迭代處理。
步驟S210:根據(jù)所述更新的當(dāng)前點(diǎn)位置信息,迭代執(zhí)行所述基于當(dāng)前點(diǎn)位置信息從所述當(dāng)前訓(xùn)練樣本中提取方向梯度直方圖HOG特征至所述將該x設(shè)置作為更新的當(dāng)前點(diǎn)位置信息的坐標(biāo)的步驟M次;
具體地,以步驟S208中計(jì)算出的當(dāng)前點(diǎn)位置信息重新執(zhí)行步驟S204至步驟S208,也就是說(shuō)完成M次迭代,本發(fā)明實(shí)施例中的M為正整數(shù)。M的值可以根據(jù)用戶自身的需求或者根據(jù)經(jīng)驗(yàn)值來(lái)設(shè)置,本發(fā)明不做限制。
步驟S212:保存每次迭代得到而組成的稀疏回歸矩陣x,以生成用于人臉對(duì)齊處理的訓(xùn)練模型。
為了便于更好地實(shí)施本發(fā)明實(shí)施例的上述方案,本發(fā)明還對(duì)應(yīng)提供了一種人臉對(duì)齊處理方法,下面結(jié)合圖3示出的本發(fā)明實(shí)施例提供的人臉對(duì)齊處理方法的流程示意圖,詳細(xì)說(shuō)明本發(fā)明如何進(jìn)行人臉對(duì)齊處理,包括如下步驟:
步驟S300:讀取用于人臉對(duì)齊處理的訓(xùn)練模型;
具體地,本發(fā)明實(shí)施例讀取的該訓(xùn)練模型為通過(guò)上述圖1至圖2實(shí)施例的訓(xùn)練模型生成方法生成的訓(xùn)練模型;這里不再贅述。
步驟S302:基于當(dāng)前點(diǎn)位置信息從目標(biāo)圖像中提取HOG特征,生成特征矩陣;
具體地,本發(fā)明實(shí)施例中初始的當(dāng)前點(diǎn)位置信息可以為預(yù)設(shè)的初始人臉形狀中人臉特征點(diǎn)的位置信息;該初始人臉形狀可以為平均shape,也就是說(shuō),步驟S302之前,還可以包括設(shè)置平均shape作為所述初始人臉形狀的步驟。
以訓(xùn)練樣本為68個(gè)人臉特征點(diǎn)為例,那么提取HOG特征生成的特征矩陣即可以為68個(gè)向量組成的特征矩陣。
步驟S304:根據(jù)所述特征矩陣和所述訓(xùn)練模型中回歸矩陣,計(jì)算人臉特征形狀偏移值;
具體地,該訓(xùn)練模型中的回歸矩陣可以包括M層的稀疏回歸矩陣x;該M為正整數(shù)。那么在進(jìn)行第K次迭代時(shí),根據(jù)第K次生成的特征矩陣和所述訓(xùn)練模型中的第K層的稀疏回歸矩陣x來(lái)計(jì)算人臉特征形狀偏移值;該K為大于0,小于等于M的自然數(shù)??衫斫獾氖?,當(dāng)K為1時(shí),即進(jìn)行第一次的人臉特征形狀偏移值的計(jì)算。
步驟S306:根據(jù)所述偏移值更新所述當(dāng)前點(diǎn)位置信息;
具體地,根據(jù)偏移值的大小修正當(dāng)前點(diǎn)位置信息的坐標(biāo),從而得到更新的當(dāng)前點(diǎn)位置信息,用于后續(xù)進(jìn)行迭代處理。
步驟S308:根據(jù)更新后的當(dāng)前點(diǎn)位置信息,迭代執(zhí)行所述基于當(dāng)前點(diǎn)位置信息從目標(biāo)圖像中提取HOG特征至所述根據(jù)所述偏移值更新所述當(dāng)前點(diǎn)位置信息的步驟M次,得到最終更新的當(dāng)前點(diǎn)位置信息;
實(shí)施本發(fā)明實(shí)施例,通過(guò)獲取含有人臉特征點(diǎn)標(biāo)注的訓(xùn)練樣本;基于當(dāng)前點(diǎn)位置信息從訓(xùn)練樣本中提取方向梯度直方圖HOG特征,生成特征矩陣;其中,初始的當(dāng)前點(diǎn)位置信息為預(yù)設(shè)的初始人臉形狀中人臉特征點(diǎn)的位置信息;根據(jù)人臉特征點(diǎn)標(biāo)注的坐標(biāo)與當(dāng)前點(diǎn)位置信息的坐標(biāo)的差值,以及特征矩陣,通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息;根據(jù)更新的當(dāng)前點(diǎn)位置信息,迭代執(zhí)行基于當(dāng)前點(diǎn)位置信息從當(dāng)前訓(xùn)練樣本中提取方向梯度直方圖HOG特征至通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息的步驟M次;保存每次迭代得到而組成的當(dāng)前點(diǎn)位置信息的回歸矩陣,以生成用于人臉對(duì)齊處理的訓(xùn)練模型。實(shí)現(xiàn)了一種壓縮特征點(diǎn)定位模型的稀疏矩陣回歸訓(xùn)練方式,能夠很大程序地減少人臉對(duì)齊的訓(xùn)練模型,同時(shí)保持了人臉定位的精度,從而解決了現(xiàn)有技術(shù)中訓(xùn)練出來(lái)的定位模型的大小往往較大,不利于集成到現(xiàn)有的app程序中的技術(shù)問(wèn)題,可以將訓(xùn)練模型輕量地集成進(jìn)移動(dòng)app產(chǎn)品中。
為了便于更好地實(shí)施本發(fā)明實(shí)施例的上述方案,本發(fā)明還對(duì)應(yīng)提供了一種訓(xùn)練模型生成裝置,如圖4示出的本發(fā)明實(shí)施例提供的訓(xùn)練模型生成裝置的結(jié)構(gòu)示意圖,訓(xùn)練模型生成裝置40可以包括:獲取模塊400、矩陣生成模塊402、計(jì)算模塊404、迭代模塊406和保存模塊408,其中,
獲取模塊400用于獲取含有人臉特征點(diǎn)標(biāo)注的訓(xùn)練樣本;
矩陣生成模塊402用于基于當(dāng)前點(diǎn)位置信息從所述訓(xùn)練樣本中提取方向梯度直方圖HOG特征,生成特征矩陣;其中,初始的當(dāng)前點(diǎn)位置信息為預(yù)設(shè)的初始人臉形狀中人臉特征點(diǎn)的位置信息;
計(jì)算模塊404用于根據(jù)所述人臉特征點(diǎn)標(biāo)注的坐標(biāo)與所述當(dāng)前點(diǎn)位置信息的坐標(biāo)的差值,以及所述特征矩陣,通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息;
迭代模塊406用于根據(jù)所述更新的當(dāng)前點(diǎn)位置信息,迭代執(zhí)行所述基于當(dāng)前點(diǎn)位置信息從所述當(dāng)前訓(xùn)練樣本中提取方向梯度直方圖HOG特征至所述通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息的步驟M次;所述M為正整數(shù);
保存模塊408用于保存每次迭代得到而組成的當(dāng)前點(diǎn)位置信息的回歸矩陣,以生成用于人臉對(duì)齊處理的訓(xùn)練模型。
具體地,如圖5示出的本發(fā)明提供的訓(xùn)練模型生成裝置的另一實(shí)施例的結(jié)構(gòu)示意圖,訓(xùn)練模型生成裝置40包括獲取模塊400、矩陣生成模塊402、計(jì)算模塊404、迭代模塊406和保存模塊408外,還可以包括:
設(shè)置模塊4010用于在矩陣生成模塊402基于當(dāng)前點(diǎn)位置信息從所述訓(xùn)練樣本中提取方向梯度直方圖HOG特征,生成特征矩陣之前,設(shè)置平均shape作為所述初始人臉形狀。
進(jìn)一步地,如圖6示出的本發(fā)明實(shí)施例提供的計(jì)算模塊的結(jié)構(gòu)示意圖,計(jì)算模塊404包括:稀疏化求解單元4040和更新單元4042,其中,
稀疏化求解單元4040用于通過(guò)稀疏化回歸求解Ax=b中的x;其中A為所述特征矩陣,所述b為所述人臉特征點(diǎn)標(biāo)注的坐標(biāo)與所述當(dāng)前點(diǎn)位置信息的坐標(biāo)的差值;
更新單元4042用于將所述x重新乘以所述A,得到b’,將所述b’作為更新的當(dāng)前點(diǎn)位置信息的坐標(biāo);
訓(xùn)練模型生成裝置40中的保存模塊408具體可以用于,保存每次迭代得到而組成的稀疏回歸矩陣x。
需要說(shuō)明的是,訓(xùn)練模型生成裝置40中各模塊的功能可對(duì)應(yīng)參考上述各方法實(shí)施例中圖1至圖2實(shí)施例的具體實(shí)現(xiàn)方式,這里不再贅述。
再進(jìn)一步地,請(qǐng)參閱圖7,圖7是本發(fā)明提供的訓(xùn)練模型生成裝置的另一實(shí)施例的結(jié)構(gòu)示意圖。其中,如圖7所示,訓(xùn)練模型生成裝置70可以包括:至少一個(gè)處理器701,例如CPU,至少一個(gè)網(wǎng)絡(luò)接口704,用戶接口703,存儲(chǔ)器705,至少一個(gè)通信總線702以及顯示屏706。其中,通信總線702用于實(shí)現(xiàn)這些組件之間的連接通信。其中,用戶接口703可以包括顯示屏、鍵盤(pán)或鼠標(biāo)等等。網(wǎng)絡(luò)接口704可選的可以包括標(biāo)準(zhǔn)的有線接口、無(wú)線接口(如WI-FI接口)。存儲(chǔ)器705可以是高速RAM存儲(chǔ)器,也可以是非不穩(wěn)定的存儲(chǔ)器(non-volatile memory),例如至少一個(gè)磁盤(pán)存儲(chǔ)器,存儲(chǔ)器705包括本發(fā)明實(shí)施例中的flash。存儲(chǔ)器705可選的還可以是至少一個(gè)位于遠(yuǎn)離前述處理器701的存儲(chǔ)系統(tǒng)。如圖7所示,作為一種計(jì)算機(jī)存儲(chǔ)介質(zhì)的存儲(chǔ)器705中可以包括操作系統(tǒng)、網(wǎng)絡(luò)通信模塊、用戶接口模塊以及訓(xùn)練模型生成程序。
處理器701可以用于調(diào)用存儲(chǔ)器705中存儲(chǔ)的訓(xùn)練模型生成程序,并執(zhí)行以下操作:
可以通過(guò)網(wǎng)絡(luò)接口704等獲取含有人臉特征點(diǎn)標(biāo)注的訓(xùn)練樣本;
基于當(dāng)前點(diǎn)位置信息從所述訓(xùn)練樣本中提取方向梯度直方圖HOG特征,生成特征矩陣;其中,初始的當(dāng)前點(diǎn)位置信息為預(yù)設(shè)的初始人臉形狀中人臉特征點(diǎn)的位置信息;
根據(jù)所述人臉特征點(diǎn)標(biāo)注的坐標(biāo)與所述當(dāng)前點(diǎn)位置信息的坐標(biāo)的差值,以及所述特征矩陣,通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息;
根據(jù)所述更新的當(dāng)前點(diǎn)位置信息,迭代執(zhí)行所述基于當(dāng)前點(diǎn)位置信息從所述當(dāng)前訓(xùn)練樣本中提取方向梯度直方圖HOG特征至所述通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息的步驟M次;所述M為正整數(shù);
通過(guò)存儲(chǔ)器705保存每次迭代得到而組成的當(dāng)前點(diǎn)位置信息的回歸矩陣,以生成用于人臉對(duì)齊處理的訓(xùn)練模型。
具體地,處理器701基于當(dāng)前點(diǎn)位置信息從所述訓(xùn)練樣本中提取方向梯度直方圖HOG特征,生成特征矩陣之前,還可以執(zhí)行:
設(shè)置平均shape作為所述初始人臉形狀。
具體地,處理器701通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息,包括:
通過(guò)稀疏化回歸求解Ax=b中的x;其中A為所述特征矩陣,所述b為所述人臉特征點(diǎn)標(biāo)注的坐標(biāo)與所述當(dāng)前點(diǎn)位置信息的坐標(biāo)的差值;
將所述x重新乘以所述A,得到b’,將所述b’作為更新的當(dāng)前點(diǎn)位置信息的坐標(biāo);
處理器701通過(guò)存儲(chǔ)器705保存每次迭代得到而組成的當(dāng)前點(diǎn)位置信息的回歸矩陣,包括:保存每次迭代得到而組成的稀疏回歸矩陣x。
實(shí)施本發(fā)明實(shí)施例,實(shí)現(xiàn)了一種壓縮特征點(diǎn)定位模型的稀疏矩陣回歸訓(xùn)練方式,能夠很大程序地減少人臉對(duì)齊的訓(xùn)練模型,同時(shí)保持了人臉定位的精度,從而解決了現(xiàn)有技術(shù)中訓(xùn)練出來(lái)的定位模型的大小往往較大,不利于集成到現(xiàn)有的app程序中的技術(shù)問(wèn)題,可以將訓(xùn)練模型輕量地集成進(jìn)移動(dòng)app產(chǎn)品中。
為了便于更好地實(shí)施本發(fā)明實(shí)施例的上述方案,本發(fā)明還對(duì)應(yīng)提供了一種人臉對(duì)齊處理裝置,如圖8示出的本發(fā)明實(shí)施例提供的人臉對(duì)齊處理裝置的結(jié)構(gòu)示意圖,人臉對(duì)齊處理裝置80可以包括:讀取模塊800、提取生成模塊802、偏移值計(jì)算模塊804、信息更新模塊806和迭代更新模塊808,其中,
讀取模塊800用于讀取用于人臉對(duì)齊處理的訓(xùn)練模型;其中所述訓(xùn)練模型為通過(guò)上述訓(xùn)練模型生成方法實(shí)施例生成的訓(xùn)練模型;
提取生成模塊802用于基于當(dāng)前點(diǎn)位置信息從目標(biāo)圖像中提取HOG特征,生成特征矩陣;其中,初始的當(dāng)前點(diǎn)位置信息為預(yù)設(shè)的初始人臉形狀中人臉特征點(diǎn)的位置信息;
偏移值計(jì)算模塊804用于根據(jù)所述特征矩陣和所述訓(xùn)練模型中回歸矩陣,計(jì)算人臉特征形狀偏移值;
信息更新模塊806用于根據(jù)所述偏移值更新所述當(dāng)前點(diǎn)位置信息;
迭代更新模塊808用于根據(jù)更新后的當(dāng)前點(diǎn)位置信息,迭代執(zhí)行所述基于當(dāng)前點(diǎn)位置信息從目標(biāo)圖像中提取HOG特征至所述根據(jù)所述偏移值更新所述當(dāng)前點(diǎn)位置信息的步驟M次,得到最終更新的當(dāng)前點(diǎn)位置信息;所述M為正整數(shù)。
具體地,本發(fā)明實(shí)施例的訓(xùn)練模型中的回歸矩陣包括所述M層的稀疏回歸矩陣x;偏移值計(jì)算模塊804可以具體用于,進(jìn)行第K次迭代時(shí),根據(jù)第K次生成的特征矩陣和所述訓(xùn)練模型中的第K層的稀疏回歸矩陣x來(lái)計(jì)算人臉特征形狀偏移值;所述K為大于0,小于等于M的自然數(shù)。
需要說(shuō)明的是,人臉對(duì)齊處理裝置80中各模塊的功能可對(duì)應(yīng)參考上述各方法實(shí)施例中圖3實(shí)施例的具體實(shí)現(xiàn)方式,這里不再贅述。
再進(jìn)一步地,請(qǐng)參閱圖9,圖9是本發(fā)明提供的人臉對(duì)齊處理裝置的另一實(shí)施例的結(jié)構(gòu)示意圖。其中,如圖9所示,人臉對(duì)齊處理裝置90可以包括:至少一個(gè)處理器901,例如CPU,至少一個(gè)網(wǎng)絡(luò)接口904,用戶接口903,存儲(chǔ)器905,至少一個(gè)通信總線902以及顯示屏906。其中,通信總線902用于實(shí)現(xiàn)這些組件之間的連接通信。其中,用戶接口903可以包括顯示屏、鍵盤(pán)或鼠標(biāo)等等。網(wǎng)絡(luò)接口904可選的可以包括標(biāo)準(zhǔn)的有線接口、無(wú)線接口(如WI-FI接口)。存儲(chǔ)器905可以是高速RAM存儲(chǔ)器,也可以是非不穩(wěn)定的存儲(chǔ)器(non-volatile memory),例如至少一個(gè)磁盤(pán)存儲(chǔ)器,存儲(chǔ)器905包括本發(fā)明實(shí)施例中的flash。存儲(chǔ)器905可選的還可以是至少一個(gè)位于遠(yuǎn)離前述處理器901的存儲(chǔ)系統(tǒng)。如圖9所示,作為一種計(jì)算機(jī)存儲(chǔ)介質(zhì)的存儲(chǔ)器905中可以包括操作系統(tǒng)、網(wǎng)絡(luò)通信模塊、用戶接口模塊以及人臉對(duì)齊處理程序。
處理器901可以用于調(diào)用存儲(chǔ)器905中存儲(chǔ)的人臉對(duì)齊處理程序,并執(zhí)行以下操作:
讀取用于人臉對(duì)齊處理的訓(xùn)練模型;其中所述訓(xùn)練模型為通過(guò)權(quán)利要求1-3任一項(xiàng)所述的訓(xùn)練模型生成方法生成的訓(xùn)練模型;
基于當(dāng)前點(diǎn)位置信息從目標(biāo)圖像中提取HOG特征,生成特征矩陣;其中,初始的當(dāng)前點(diǎn)位置信息為預(yù)設(shè)的初始人臉形狀中人臉特征點(diǎn)的位置信息;
根據(jù)所述特征矩陣和所述訓(xùn)練模型中回歸矩陣,計(jì)算人臉特征形狀偏移值;
根據(jù)所述偏移值更新所述當(dāng)前點(diǎn)位置信息;
根據(jù)更新后的當(dāng)前點(diǎn)位置信息,迭代執(zhí)行所述基于當(dāng)前點(diǎn)位置信息從目標(biāo)圖像中提取HOG特征至所述根據(jù)所述偏移值更新所述當(dāng)前點(diǎn)位置信息的步驟M次,得到最終更新的當(dāng)前點(diǎn)位置信息;所述M為正整數(shù)。
具體地,訓(xùn)練模型中的回歸矩陣包括所述M層的稀疏回歸矩陣x;處理器901所述根據(jù)所述特征矩陣和所述訓(xùn)練模型中回歸矩陣,計(jì)算人臉特征形狀偏移值,可以包括:
進(jìn)行第K次迭代時(shí),根據(jù)第K次生成的特征矩陣和所述訓(xùn)練模型中的第K層的稀疏回歸矩陣x來(lái)計(jì)算人臉特征形狀偏移值;所述K為大于0,小于等于M的自然數(shù)。
綜上所述,實(shí)施本發(fā)明實(shí)施例,通過(guò)獲取含有人臉特征點(diǎn)標(biāo)注的訓(xùn)練樣本;基于當(dāng)前點(diǎn)位置信息從訓(xùn)練樣本中提取方向梯度直方圖HOG特征,生成特征矩陣;其中,初始的當(dāng)前點(diǎn)位置信息為預(yù)設(shè)的初始人臉形狀中人臉特征點(diǎn)的位置信息;根據(jù)人臉特征點(diǎn)標(biāo)注的坐標(biāo)與當(dāng)前點(diǎn)位置信息的坐標(biāo)的差值,以及特征矩陣,通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息;根據(jù)更新的當(dāng)前點(diǎn)位置信息,迭代執(zhí)行基于當(dāng)前點(diǎn)位置信息從當(dāng)前訓(xùn)練樣本中提取方向梯度直方圖HOG特征至通過(guò)稀疏化回歸計(jì)算得出更新的當(dāng)前點(diǎn)位置信息的步驟M次;保存每次迭代得到而組成的當(dāng)前點(diǎn)位置信息的回歸矩陣,以生成用于人臉對(duì)齊處理的訓(xùn)練模型。實(shí)現(xiàn)了一種壓縮特征點(diǎn)定位模型的稀疏矩陣回歸訓(xùn)練方式,能夠很大程序地減少人臉對(duì)齊的訓(xùn)練模型,同時(shí)保持了人臉定位的精度,從而解決了現(xiàn)有技術(shù)中訓(xùn)練出來(lái)的定位模型的大小往往較大,不利于集成到現(xiàn)有的app程序中的技術(shù)問(wèn)題,可以將訓(xùn)練模型輕量地集成進(jìn)移動(dòng)app產(chǎn)品中。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過(guò)計(jì)算機(jī)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲(chǔ)介質(zhì)可為磁碟、光盤(pán)、只讀存儲(chǔ)記憶體(Read-Only Memory,ROM)或隨機(jī)存儲(chǔ)記憶體(Random Access Memory,RAM)等。
以上所揭露的僅為本發(fā)明較佳實(shí)施例而已,當(dāng)然不能以此來(lái)限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。