本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體涉及視頻圖像處理技術(shù)領(lǐng)域,尤其涉及一種圖像處理方法及裝置。
背景技術(shù):
某些互聯(lián)網(wǎng)場(chǎng)景通常會(huì)涉及唇部識(shí)別的過(guò)程,例如:在身份認(rèn)證場(chǎng)景中,為了避免非法用戶采用靜態(tài)圖片混淆視聽,通常需要錄制用戶說(shuō)話的視頻圖像,然后對(duì)該視頻圖像進(jìn)行唇動(dòng)識(shí)別等處理來(lái)確認(rèn)合法用戶身份?,F(xiàn)有技術(shù)中對(duì)圖像進(jìn)行唇動(dòng)識(shí)別處理的其中一種方案為:計(jì)算視頻中每一幀圖像中的唇部區(qū)域的面積大小,再通過(guò)幀圖像之間唇部區(qū)域的面積差確認(rèn)是否發(fā)生唇動(dòng)。另一種方案為:提取視頻中每一幀圖像中唇部開閉狀態(tài),依據(jù)開閉幅度來(lái)檢測(cè)是否發(fā)生唇動(dòng)?,F(xiàn)有技術(shù)均依賴于唇部變化幅度,若唇部變化幅度較小,其唇部區(qū)域的面積變化及唇部開閉狀態(tài)的幅度都不夠明顯,從而會(huì)影響唇動(dòng)識(shí)別結(jié)果的準(zhǔn)確性,影響現(xiàn)有技術(shù)方案的實(shí)用性。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供一種圖像處理方法及裝置,依據(jù)圖像在時(shí)間跨度上的唇部變化識(shí)別唇動(dòng),能夠避免唇部變化幅度的影響,提升識(shí)別結(jié)果準(zhǔn)確性,提升圖像處理的實(shí)用性。
本發(fā)明實(shí)施例第一方面提供一種圖像處理方法,可包括:
在待處理視頻所包含的每一幀圖像中檢測(cè)人臉區(qū)域,并從所述人臉區(qū)域中定位唇部區(qū)域;
從所述每一幀圖像中提取唇部區(qū)域的特征列像素構(gòu)建唇部變化圖;
根據(jù)所述唇部變化圖的紋理特征進(jìn)行唇動(dòng)識(shí)別,獲得識(shí)別結(jié)果。
優(yōu)選地,所述在待處理視頻所包含的每一幀圖像中檢測(cè)人臉區(qū)域,并從所述人臉區(qū)域中定位唇部區(qū)域,包括:
對(duì)待處理視頻進(jìn)行解析獲得至少一幀圖像;
采用人臉檢測(cè)算法在每一幀圖像中檢測(cè)人臉區(qū)域;
采用人臉配準(zhǔn)算法從所述人臉區(qū)域中定位唇部區(qū)域。
優(yōu)選地,所述從所述每一幀圖像中提取唇部區(qū)域的特征列像素構(gòu)建唇部變化圖,包括:
在每一幀圖像中截取唇部區(qū)域圖;
從所述唇部區(qū)域圖中提取特征列像素圖;
按照每一幀圖像的時(shí)間順序?qū)λ崛〉奶卣髁邢袼貓D進(jìn)行拼接處理,獲得唇部變化圖。
優(yōu)選地,所述從所述唇部區(qū)域圖中提取特征列像素圖,包括:
在所述唇部區(qū)域圖中確定預(yù)設(shè)位置;
沿所述預(yù)設(shè)位置繪制縱軸;
提取由所述唇部區(qū)域圖中位于所述縱軸的所有像素點(diǎn)構(gòu)成的一列像素圖作為特征列像素圖。
優(yōu)選地,所述預(yù)設(shè)位置為所述唇部區(qū)域圖的中心像素點(diǎn)位置。
優(yōu)選地,所述根據(jù)所述唇部變化圖的紋理特征進(jìn)行唇動(dòng)識(shí)別,獲得識(shí)別結(jié)果,包括:
計(jì)算所述唇部變化圖的紋理特征,所述紋理特征包括lbp特征和/或hog特征;
采用預(yù)設(shè)分類算法對(duì)所述紋理特征進(jìn)行分類,獲得唇動(dòng)識(shí)別結(jié)果,所述識(shí)別結(jié)果包括:發(fā)生唇動(dòng)或未發(fā)生唇動(dòng)。
本發(fā)明實(shí)施例第二方面提供一種圖像處理裝置,可包括:
定位單元,用于在待處理視頻所包含的每一幀圖像中檢測(cè)人臉區(qū)域,并從所述人臉區(qū)域中定位唇部區(qū)域;
構(gòu)建單元,用于從所述每一幀圖像中提取唇部區(qū)域的特征列像素構(gòu)建唇部變化圖;
唇動(dòng)識(shí)別單元,用于根據(jù)所述唇部變化圖的紋理特征進(jìn)行唇動(dòng)識(shí)別,獲得識(shí)別結(jié)果。
優(yōu)選地,所述定位單元包括:
解析單元,用于對(duì)待處理視頻進(jìn)行解析獲得至少一幀圖像;
人臉檢測(cè)單元,用于采用人臉檢測(cè)算法在每一幀圖像中檢測(cè)人臉區(qū)域;
人臉配準(zhǔn)單元,用于采用人臉配準(zhǔn)算法從所述人臉區(qū)域中定位唇部區(qū)域。
優(yōu)選地,所述構(gòu)建單元包括:
截取單元,用于在每一幀圖像中截取唇部區(qū)域圖;
提取單元,用于從所述唇部區(qū)域圖中提取特征列像素圖;
拼接處理單元,用于按照每一幀圖像的時(shí)間順序?qū)λ崛〉奶卣髁邢袼貓D進(jìn)行拼接處理,獲得唇部變化圖。
優(yōu)選地,所述提取單元包括:
位置確定單元,用于在所述唇部區(qū)域圖中確定預(yù)設(shè)位置;
縱軸確定單元,用于沿所述預(yù)設(shè)位置繪制縱軸;
特征列像素提取單元,用于提取由所述唇部區(qū)域圖中位于所述縱軸的所有像素點(diǎn)構(gòu)成的一列像素圖作為特征列像素圖。
優(yōu)選地,所述預(yù)設(shè)位置為所述唇部區(qū)域圖的中心像素點(diǎn)位置。
優(yōu)選地,所述唇動(dòng)識(shí)別單元包括:
計(jì)算單元,用于計(jì)算所述唇部變化圖的紋理特征,所述紋理特征包括lbp(localbinarypatterns,局部二值模式)特征和/或hog(histogramoforientedgradient,方向梯度直方圖)特征;
分類單元,用于采用預(yù)設(shè)分類算法對(duì)所述紋理特征進(jìn)行分類,獲得唇動(dòng)識(shí)別結(jié)果,所述識(shí)別結(jié)果包括:發(fā)生唇動(dòng)或未發(fā)生唇動(dòng)。
實(shí)施本發(fā)明實(shí)施例,具有如下有益效果:
本發(fā)明實(shí)施例中,對(duì)視頻所包含的每一幀圖像進(jìn)行人臉區(qū)域檢測(cè)及唇部區(qū)域定位,并且從每一幀圖像中提取唇部區(qū)域的特征列像素構(gòu)建唇部變化圖,由于唇部變化圖來(lái)自于每一幀圖像,這使得唇部變化圖能夠整體反映各圖像組成的時(shí)間跨度;通過(guò)唇部變化圖的紋理特征進(jìn)行唇動(dòng)識(shí)別獲得識(shí)別結(jié)果,也就是依據(jù)時(shí)間跨度上的唇部變化識(shí)別唇動(dòng),能夠避免唇部變化幅度的影響,識(shí)別效率較高且識(shí)別結(jié)果準(zhǔn)確度較高。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付 出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例提供的一種圖像處理方法的流程圖;
圖2為本發(fā)明實(shí)施例提供的一種互聯(lián)網(wǎng)設(shè)備的結(jié)構(gòu)示意圖;
圖3為本發(fā)明實(shí)施例提供的一種圖像處理裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明實(shí)施例中,對(duì)視頻所包含的每一幀圖像進(jìn)行人臉區(qū)域檢測(cè)及唇部區(qū)域定位,并且從每一幀圖像中提取唇部區(qū)域的特征列像素構(gòu)建唇部變化圖,由于唇部變化圖來(lái)自于每一幀圖像,這使得唇部變化圖能夠整體反映各圖像組成的時(shí)間跨度;通過(guò)唇部變化圖的紋理特征進(jìn)行唇動(dòng)識(shí)別獲得識(shí)別結(jié)果,也就是依據(jù)時(shí)間跨度上的唇部變化識(shí)別唇動(dòng),能夠避免唇部變化幅度的影響,識(shí)別效率較高且識(shí)別結(jié)果準(zhǔn)確度較高。
本發(fā)明實(shí)施例的圖像處理方法可以被應(yīng)用于許多互聯(lián)網(wǎng)場(chǎng)景中,例如:在語(yǔ)音輸入場(chǎng)景中,可通過(guò)對(duì)用戶說(shuō)話視頻進(jìn)行唇動(dòng)識(shí)別來(lái)控制語(yǔ)音的獲取過(guò)程;再如:在身份認(rèn)證場(chǎng)景中,可通過(guò)對(duì)用戶說(shuō)話視頻進(jìn)行唇動(dòng)識(shí)別來(lái)確認(rèn)合法用戶身份,避免非法用戶采用靜態(tài)圖片混淆視聽;等等。同理,本發(fā)明實(shí)施例的圖像處理裝置可以被應(yīng)用于互聯(lián)網(wǎng)場(chǎng)景中的各個(gè)設(shè)備中,例如:可被應(yīng)用于終端中,或者被應(yīng)用于服務(wù)器中。
基于上述描述,本發(fā)明實(shí)施例提供了一種圖像處理方法,請(qǐng)參見圖1,該方法可執(zhí)行以下步驟s101-s103。
s101,在待處理視頻所包含的每一幀圖像中檢測(cè)人臉區(qū)域,并從所述人臉區(qū)域中定位唇部區(qū)域。
待處理視頻可以是實(shí)時(shí)錄制的視頻,例如:用戶向終端發(fā)起語(yǔ)音輸入請(qǐng)求時(shí),終端可實(shí)時(shí)錄制用戶說(shuō)話視頻作為待處理視頻。待處理視頻也可以是接收到的實(shí)時(shí)視頻,例如:服務(wù)器對(duì)終端側(cè)用戶進(jìn)行身份認(rèn)證時(shí),服務(wù)器可接收終 端實(shí)時(shí)錄制的用戶說(shuō)話視頻作為待處理視頻。人臉檢測(cè)技術(shù)是指采用一定的策略掃描確定所給定的圖像中是否含有人臉,在確定含有后能夠確定人臉在圖像中的位置、大小和姿態(tài)。人臉配準(zhǔn)技術(shù)是指采用一定的算法依據(jù)人臉的位置、大小和姿態(tài)清晰分辨出人臉的眼、鼻、唇部等輪廓。本實(shí)施例的方法在執(zhí)行步驟s101的過(guò)程中具體涉及人臉檢測(cè)技術(shù)和人臉配準(zhǔn)技術(shù);具體地,該方法在執(zhí)行步驟s101時(shí)執(zhí)行如下步驟s11-s13:
s11,對(duì)待處理視頻進(jìn)行解析獲得至少一幀圖像。視頻是由一幀一幀圖像按照時(shí)間順序構(gòu)成的,因此,對(duì)待處理視頻進(jìn)行分幀處理即可得到一幀一幀圖像。
s12,采用人臉檢測(cè)算法在每一幀圖像中檢測(cè)人臉區(qū)域。
人臉檢測(cè)算法可包括但不限于:pca(principalcomponentanalysis,基于主成分分析)算法、基于彈性模型的方法、隱馬爾可夫模型方法(hiddenmarkovmodel)等等。針對(duì)視頻分幀處理獲得的每一幀圖像,采用人臉檢測(cè)算法可確定出人臉區(qū)域,該人臉區(qū)域用于展示人臉在每一幀圖像中的位置、大小及姿態(tài)。
s13,采用人臉配準(zhǔn)算法從所述人臉區(qū)域中定位唇部區(qū)域。
人臉配準(zhǔn)算法可包括但不限于:lasso整臉回歸配準(zhǔn)算法、小波域算法等等。針對(duì)每一幀圖像中的人臉區(qū)域所展示的人臉位置、大小及姿態(tài),采用人臉配準(zhǔn)算法可精確定位唇部區(qū)域。
s102,從所述每一幀圖像中提取唇部區(qū)域的特征列像素構(gòu)建唇部變化圖。
所述唇部變化圖要求從時(shí)間跨度上整體反映唇部變化。由于視頻是由一幀一幀圖像按照時(shí)間順序構(gòu)成,并且視頻在該各幀圖像組成的時(shí)間跨度上能夠動(dòng)態(tài)反映唇部變化情況,因此,本步驟可以采用每一幀圖像中的唇部區(qū)域的變化特征來(lái)構(gòu)建唇部變化圖。具體實(shí)現(xiàn)中,該方法在執(zhí)行步驟s101時(shí)具體執(zhí)行如下步驟s21-s23:
s21,在每一幀圖像中截取唇部區(qū)域圖。由于已從每一幀圖像中精確定位唇部區(qū)域,本步驟s21中可從每一幀圖像中直接截取唇部區(qū)域圖,那么,第一幀圖像中可截取到第一幅唇部區(qū)域圖,第二幀圖像中可截取到第二幅唇部區(qū)域圖,以此類推。
s22,從所述唇部區(qū)域圖中提取特征列像素圖。
特征列像素點(diǎn)是指一幀圖像中能夠反映唇部變化特點(diǎn)的一列像素點(diǎn),該特征列像素點(diǎn)形成的圖像稱為特征列像素圖。具體實(shí)現(xiàn)中,該方法在執(zhí)行步驟s22 時(shí)具體執(zhí)行如下步驟ss221-ss223:
ss221,在所述唇部區(qū)域圖中確定預(yù)設(shè)位置。
所述預(yù)設(shè)位置可以為唇部區(qū)域圖中任意像素點(diǎn)的位置,由于唇動(dòng)時(shí)唇部中央的變化最為明顯,因此,本發(fā)明實(shí)施例優(yōu)選地,所述預(yù)設(shè)位置為所述唇部區(qū)域圖的中心像素點(diǎn)位置。
ss222,沿所述預(yù)設(shè)位置繪制縱軸。
ss223,提取由所述唇部區(qū)域圖中位于所述縱軸的所有像素點(diǎn)構(gòu)成的一列像素圖作為特征列像素圖。
唇動(dòng)時(shí)唇部變化的直接表現(xiàn)為唇部張開,這屬于唇部的縱向變化,因此步驟ss222-ss223中,可以沿預(yù)設(shè)位置縱向提取特征列像素圖;可以理解的是,若該預(yù)設(shè)位置為唇部區(qū)域圖的中心像素點(diǎn)位置,所提取的特征列像素圖即為唇部區(qū)域中央的一列像素圖。
s23,按照每一幀圖像的時(shí)間順序?qū)λ崛〉奶卣髁邢袼貓D進(jìn)行拼接處理,獲得唇部變化圖。
經(jīng)過(guò)上述步驟s22可以從每一幀圖像中的預(yù)設(shè)位置提取出特征列像素圖,步驟s23將從各幀圖像提取到的特征列像素圖拼接后獲得的唇部變化圖,也反映了唇部的預(yù)設(shè)位置處的變化情況。以預(yù)設(shè)位置為唇部區(qū)域圖的中心像素點(diǎn)位置為例:從第一幀圖像中提取到唇部區(qū)域中央列像素圖,可稱為第一中央列像素圖;從第二幀圖像中也提取到唇部區(qū)域中央列像素圖,可稱為第二中央列像素圖;以此類推;那么,本步驟s23中的拼接處理可以為:將第二中央列像素圖橫向拼接于第一中央列像素圖之后,將第三中央列像素圖橫向拼接于第二中央列像素圖之后,以此類推從而形成唇部變化圖,此唇部變化圖反映了唇部中央的變化情況。
s103,根據(jù)所述唇部變化圖的紋理特征進(jìn)行唇動(dòng)識(shí)別,獲得識(shí)別結(jié)果。
唇動(dòng)識(shí)別是確認(rèn)是否發(fā)生唇動(dòng)的過(guò)程。該方法在執(zhí)行步驟s103時(shí)具體執(zhí)行如下步驟s31-s32:
s31,計(jì)算所述唇部變化圖的紋理特征,所述紋理特征包括但不限于:lbp特征和/或hog特征。
lbp特征可有效描述和度量圖像局部的紋理信息,具備旋轉(zhuǎn)不變性和灰度不變性等顯著的優(yōu)點(diǎn);該方法在執(zhí)行步驟s31的過(guò)程中,可以采用lbp算法來(lái) 計(jì)算唇部變化圖的lbp特征。hog特征是一種在圖像處理中用于進(jìn)行物體檢測(cè)的特征描述子;該方法在執(zhí)行步驟s31的過(guò)程中,可以采用hog算法來(lái)計(jì)算唇部變化圖的hog特征??梢岳斫獾氖?,所述紋理特征還可包括諸如sift特征等其他特征,因此該方法在執(zhí)行步驟s31的過(guò)程中還可采用其他算法來(lái)計(jì)算唇部變化圖的紋理特征。
s32,采用預(yù)設(shè)分類算法對(duì)所述紋理特征進(jìn)行分類,獲得唇動(dòng)識(shí)別結(jié)果,所述識(shí)別結(jié)果包括:發(fā)生唇動(dòng)或未發(fā)生唇動(dòng)。
所述預(yù)設(shè)分類算法可包括但不限于:貝葉斯算法、邏輯回歸算法及svm(supportvectormachine,支持向量機(jī))算法。以svm算法為例,將所述紋理特征作為輸入?yún)?shù)代入svm算法分類器中,則svm算法分類器則可以輸出分類結(jié)果(即唇動(dòng)識(shí)別結(jié)果)。
本發(fā)明實(shí)施例通過(guò)運(yùn)行圖像處理方法,對(duì)視頻所包含的每一幀圖像進(jìn)行人臉區(qū)域檢測(cè)及唇部區(qū)域定位,并且從每一幀圖像中提取唇部區(qū)域的特征列像素構(gòu)建唇部變化圖,由于唇部變化圖來(lái)自于每一幀圖像,這使得唇部變化圖能夠整體反映各圖像組成的時(shí)間跨度;通過(guò)唇部變化圖的紋理特征進(jìn)行唇動(dòng)識(shí)別獲得識(shí)別結(jié)果,也就是依據(jù)時(shí)間跨度上的唇部變化識(shí)別唇動(dòng),能夠避免唇部變化幅度的影響,識(shí)別效率較高且識(shí)別結(jié)果準(zhǔn)確度較高。
基于上述實(shí)施例所示的圖像處理方法,本發(fā)明實(shí)施例還提供了一種互聯(lián)網(wǎng)設(shè)備,該互聯(lián)網(wǎng)設(shè)備可以為終端或服務(wù)器;請(qǐng)參見圖2,該互聯(lián)網(wǎng)設(shè)備的內(nèi)部結(jié)構(gòu)可包括但不限于:處理器、用戶接口、網(wǎng)絡(luò)接口及存儲(chǔ)器。其中,互聯(lián)網(wǎng)設(shè)備內(nèi)的處理器、用戶接口、網(wǎng)絡(luò)接口及存儲(chǔ)器可通過(guò)總線或其他方式連接,在本發(fā)明實(shí)施例所示圖2中以通過(guò)總線連接為例。
其中,用戶接口是實(shí)現(xiàn)用戶與該互聯(lián)網(wǎng)設(shè)備進(jìn)行交互和信息交換的媒介,其具體體現(xiàn)可以包括用于輸出的顯示屏(display)以及用于輸入的鍵盤(keyboard)等等,需要說(shuō)明的是,此處的鍵盤既可以為實(shí)體鍵盤,也可以為觸屏虛擬鍵盤,還可以為實(shí)體與觸屏虛擬相結(jié)合的鍵盤。處理器(或稱cpu(centralprocessingunit,中央處理器))是互聯(lián)網(wǎng)設(shè)備的計(jì)算核心以及控制核心,其可以解析互聯(lián)網(wǎng)設(shè)備內(nèi)的各類指令以及處理各類數(shù)據(jù)。存儲(chǔ)器(memory)是互聯(lián)網(wǎng)設(shè)備中的記憶設(shè)備,用于存放程序和數(shù)據(jù)??梢岳斫獾氖?,此處的存 儲(chǔ)器可以是高速ram存儲(chǔ)器,也可以是非不穩(wěn)定的存儲(chǔ)器(non-volatilememory),例如至少一個(gè)磁盤存儲(chǔ)器;可選的還可以是至少一個(gè)位于遠(yuǎn)離前述處理器的存儲(chǔ)裝置。存儲(chǔ)器提供存儲(chǔ)空間,該存儲(chǔ)空間存儲(chǔ)了互聯(lián)網(wǎng)設(shè)備的操作系統(tǒng),還存儲(chǔ)了圖像處理裝置。
在本發(fā)明實(shí)施例中,互聯(lián)網(wǎng)設(shè)備通過(guò)運(yùn)行存儲(chǔ)器中的圖像處理裝置可以執(zhí)行上述圖1所示方法流程的相應(yīng)步驟。請(qǐng)一并參見圖3,該圖像處理裝置運(yùn)行如下單元:
定位單元101,用于在待處理視頻所包含的每一幀圖像中檢測(cè)人臉區(qū)域,并從所述人臉區(qū)域中定位唇部區(qū)域。
構(gòu)建單元102,用于從所述每一幀圖像中提取唇部區(qū)域的特征列像素構(gòu)建唇部變化圖。
唇動(dòng)識(shí)別單元103,用于根據(jù)所述唇部變化圖的紋理特征進(jìn)行唇動(dòng)識(shí)別,獲得識(shí)別結(jié)果。
具體實(shí)現(xiàn)中,該圖像處理裝置在運(yùn)行定位單元101的過(guò)程中,具體運(yùn)行如下單元:
解析單元1001,用于對(duì)待處理視頻進(jìn)行解析獲得至少一幀圖像。
人臉檢測(cè)單元1002,用于采用人臉檢測(cè)算法在每一幀圖像中檢測(cè)人臉區(qū)域。
人臉配準(zhǔn)單元1003,用于采用人臉配準(zhǔn)算法從所述人臉區(qū)域中定位唇部區(qū)域。
具體實(shí)現(xiàn)中,該圖像處理裝置在運(yùn)行構(gòu)建單元102的過(guò)程中,具體運(yùn)行如下單元:
截取單元2001,用于在每一幀圖像中截取唇部區(qū)域圖。
提取單元2002,用于從所述唇部區(qū)域圖中提取特征列像素圖。
拼接處理單元2003,用于按照每一幀圖像的時(shí)間順序?qū)λ崛〉奶卣髁邢袼貓D進(jìn)行拼接處理,獲得唇部變化圖。
具體實(shí)現(xiàn)中,該圖像處理裝置在運(yùn)行提取單元2002的過(guò)程中,具體運(yùn)行如下單元:
位置確定單元2221,用于在所述唇部區(qū)域圖中確定預(yù)設(shè)位置;優(yōu)選地,所述預(yù)設(shè)位置為所述唇部區(qū)域圖的中心像素點(diǎn)位置。
縱軸確定單元2222,用于沿所述預(yù)設(shè)位置繪制縱軸。
特征列像素提取單元2223,用于提取由所述唇部區(qū)域圖中位于所述縱軸的所有像素點(diǎn)構(gòu)成的一列像素圖作為特征列像素圖。
具體實(shí)現(xiàn)中,該圖像處理裝置在運(yùn)行唇動(dòng)識(shí)別單元103的過(guò)程中,具體運(yùn)行如下單元:
計(jì)算單元3001,用于計(jì)算所述唇部變化圖的紋理特征,所述紋理特征包括lbp特征和/或hog特征。
分類單元3002,用于采用預(yù)設(shè)分類算法對(duì)所述紋理特征進(jìn)行分類,獲得唇動(dòng)識(shí)別結(jié)果,所述識(shí)別結(jié)果包括:發(fā)生唇動(dòng)或未發(fā)生唇動(dòng)。
與圖2所示的方法同理,本發(fā)明實(shí)施例通過(guò)運(yùn)行圖像處理裝置,對(duì)視頻所包含的每一幀圖像進(jìn)行人臉區(qū)域檢測(cè)及唇部區(qū)域定位,并且從每一幀圖像中提取唇部區(qū)域的特征列像素構(gòu)建唇部變化圖,由于唇部變化圖來(lái)自于每一幀圖像,這使得唇部變化圖能夠整體反映各圖像組成的時(shí)間跨度;通過(guò)唇部變化圖的紋理特征進(jìn)行唇動(dòng)識(shí)別獲得識(shí)別結(jié)果,也就是依據(jù)時(shí)間跨度上的唇部變化識(shí)別唇動(dòng),能夠避免唇部變化幅度的影響,識(shí)別效率較高且識(shí)別結(jié)果準(zhǔn)確度較高。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過(guò)計(jì)算機(jī)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲(chǔ)介質(zhì)可為磁碟、光盤、只讀存儲(chǔ)記憶體(read-onlymemory,rom)或隨機(jī)存儲(chǔ)記憶體(randomaccessmemory,ram)等。
以上所揭露的僅為本發(fā)明較佳實(shí)施例而已,當(dāng)然不能以此來(lái)限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。