欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

視頻圖像的處理方法、裝置和終端設(shè)備與流程

文檔序號:12917642閱讀:206來源:國知局
視頻圖像的處理方法、裝置和終端設(shè)備與流程

本發(fā)明實(shí)施例涉及人工智能技術(shù)領(lǐng)域,尤其涉及一種視頻圖像的處理方法、裝置和終端設(shè)備。



背景技術(shù):

隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,人們越來越多地使用互聯(lián)網(wǎng)觀看視頻,由此,互聯(lián)網(wǎng)視頻為許多新的業(yè)務(wù)提供了商機(jī)。因?yàn)榛ヂ?lián)網(wǎng)視頻可以成為重要的業(yè)務(wù)流量入口,因而被認(rèn)為是廣告植入的優(yōu)質(zhì)資源。

現(xiàn)有視頻廣告主要通過植入的方式,一種常見的植入方式是在視頻播放的區(qū)域及其周邊區(qū)域的任意位置放置廣告。

但是,這種方式植入的廣告會遮擋視頻,打擾觀眾的正常視頻觀看體驗(yàn),引起觀眾反感,不能達(dá)到預(yù)想的廣告效果。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明實(shí)施例提供了視頻圖像的處理技術(shù)方案。

根據(jù)本發(fā)明實(shí)施例的一個方面,提供了一種視頻圖像的處理方法,包括:獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象;確定所述視頻圖像的背景區(qū)域;采用計(jì)算機(jī)繪圖方式在所述視頻圖像的背景區(qū)域繪制所述業(yè)務(wù)對象。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理方法,其中,所述采用計(jì)算機(jī)繪圖方式在所述視頻圖像的背景區(qū)域繪制所述業(yè)務(wù)對象包括:確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置和所述視頻圖像的前景區(qū)域;根據(jù)所述展示位置判斷所述業(yè)務(wù)對象與所述視頻圖像的前景區(qū)域是否存在重疊部分;若存在,則采用計(jì)算機(jī)繪圖方式,在所述背景區(qū)域繪制所述業(yè)務(wù)對象中除所述重疊部分之外的部分。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理方法,其中,所述確定所述視頻圖像的背景區(qū)域包括:通過預(yù)先訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)模型確定所述視頻圖像的背景區(qū)域。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理方法,其中,所述對所述第一卷積神經(jīng)網(wǎng)絡(luò)模型的預(yù)先訓(xùn)練包括:獲取第一樣本圖像的第一特征向量,其中,所述第一樣本圖像為包含有前景標(biāo)注信息和背景標(biāo)注信息的樣本圖像;對所述第一特征向量進(jìn)行卷積處理,獲取第一特征向量卷積結(jié)果;對所述第一特征向量卷積結(jié)果進(jìn)行放大處理;判斷放大后的所述第一特征向量卷積結(jié)果是否滿足卷積收斂條件;若滿足,則完成對所述第一卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練;若不滿足,則根據(jù)放大后的所述第一特征向量卷積結(jié)果調(diào)整所述第一卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)并根據(jù)調(diào)整后的所述第一卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)對所述第一卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行迭代訓(xùn)練,直至迭代訓(xùn)練后的所述第一特征向量卷積結(jié)果滿足所述卷積收斂條件。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理方法,其中,所述確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置包括:按照設(shè)定規(guī)則確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置;其中,所述設(shè)定規(guī)則包括:預(yù)先設(shè)定的所述業(yè)務(wù)對象在所述視頻圖像的設(shè)定展示位置,或者,根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理方法,其中,所述根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置包括:根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),通過預(yù)先訓(xùn)練的、第二卷積神經(jīng)網(wǎng)絡(luò)模型確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理方法,其中,所述對所述第二卷積神經(jīng)網(wǎng)絡(luò)模型的預(yù)先訓(xùn)練包括:獲取第二樣本圖像的第一特征向量,其中,所述第二特征向量中包含有所述第二樣本圖像中的業(yè)務(wù)對象的位置信息和/或置信度信息,以及所述第二樣本圖像中目標(biāo)對象的目標(biāo)對象特征向量;對所述第二特征向量進(jìn)行卷積處理,獲取第二特征向量卷積結(jié)果;判斷所述第二特征向量卷積結(jié)果中對應(yīng)的業(yè)務(wù)對象的位置信息和/或置信度信息是否滿足業(yè)務(wù)對象收斂條件,并判斷所述第二特征向量卷積結(jié)果中的目標(biāo)對象特征向量是否滿足目標(biāo)對象收斂條件;若均滿足,則完成對所述第二卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練;否則,調(diào)整所述第二卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)并根據(jù)調(diào)整后的所述第二卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)對所述第二卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行迭代訓(xùn)練,直至迭代訓(xùn)練后的業(yè)務(wù)對象的位置信息和/或置信度信息和目標(biāo)對象特征向量均滿足相應(yīng)的收斂條件。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理方法,其中,所述根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置包括:根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)和所述業(yè)務(wù)對象的類型,確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理方法,其中,所述根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)和所述業(yè)務(wù)對象的類型,確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置包括:根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)和所述業(yè)務(wù)對象的類型,獲得所述業(yè)務(wù)對象在所述視頻圖像中的多個展示位置;從所述多個展示位置中選擇至少一個展示位置。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理方法,其中,所述根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置包括:判斷所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)與預(yù)先設(shè)定的動作數(shù)據(jù)是否匹配;若匹配,則從預(yù)先存儲的動作數(shù)據(jù)與展示位置的對應(yīng)關(guān)系中,獲取所述預(yù)先設(shè)定的動作數(shù)據(jù)對應(yīng)的目標(biāo)展示位置作為所述業(yè)務(wù)對象在所述視頻圖像中的展示位置。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理方法,其中,所述業(yè)務(wù)對象包括包含有語義信息的特效;所述視頻圖像為直播類視頻圖像。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理方法,其中,所述業(yè)務(wù)對象包括包含廣告信息的以下至少一種形式的特效:二維貼紙?zhí)匦?、三維特效、粒子特效。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理方法,其中,所述直播類視頻圖像的前景區(qū)域?yàn)槿宋锼诘膮^(qū)域。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理方法,其中,所述直播類視頻圖像的背景區(qū)域?yàn)槌巳宋锼诘膮^(qū)域之外的至少局部區(qū)域。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理方法,其中,所述目標(biāo)對象的動作檢測數(shù)據(jù)包括以下至少之一:眨眼數(shù)據(jù)、張嘴數(shù)據(jù)、點(diǎn)頭數(shù)據(jù)、搖頭數(shù)據(jù)、親吻數(shù)據(jù)、微笑數(shù)據(jù)、揮手?jǐn)?shù)據(jù)、剪刀手?jǐn)?shù)據(jù)、握拳數(shù)據(jù)、托手?jǐn)?shù)據(jù)、大拇指數(shù)據(jù)、手槍姿勢數(shù)據(jù)、ok手?jǐn)?shù)據(jù)。

根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種視頻圖像的處理裝置,包括:獲取模塊,用于獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象;背景區(qū)域確定模塊,用于確定所述視頻圖像的背景區(qū)域;繪制模塊,用于采用計(jì)算機(jī)繪圖方式在所述視頻圖像的背景區(qū)域繪制所述業(yè)務(wù)對象。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理裝置,其中,所述繪制模塊包括:展示位置確定模塊,用于確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置;前景區(qū)域確定模塊,用于確定所述視頻圖像的前景區(qū)域;判斷模塊,用于根據(jù)所述展示位置判斷所述業(yè)務(wù)對象與所述前景區(qū)域是否存在重疊部分;展示模塊,用于若所述業(yè)務(wù)對象與所述前景區(qū)域存在重疊部分,則采用計(jì)算機(jī)繪圖方式,在所述背景區(qū)域繪制所述業(yè)務(wù)對象中除所述重疊部分之外的部分。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理裝置,其中,所述背景區(qū)域確定模塊,用于通過預(yù)先訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)模型確定所述視頻圖像的背景區(qū)域。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理裝置,其中,所述裝置還包括:第一訓(xùn)練模塊,用于對所述第一卷積神經(jīng)網(wǎng)絡(luò)模型的預(yù)先訓(xùn)練;所述第一訓(xùn)練模塊包括:第一特征向量獲取模塊,用于獲取第一樣本圖像的第一特征向量,其中,所述第一樣本圖像為包含有前景標(biāo)注信息和背景標(biāo)注信息的樣本圖像;第一卷積處理模塊,用于對所述第一特征向量進(jìn)行卷積處理,獲取第一特征向量卷積結(jié)果;放大處理模塊,用于對所述第一特征向量卷積結(jié)果進(jìn)行放大處理;第一條件判斷模塊,用于判斷放大后的所述第一特征向量卷積結(jié)果是否滿足卷積收斂條件;第一執(zhí)行模塊,用于若放大后的所述第一特征向量卷積結(jié)果滿足卷積收斂條件,則完成對所述第一卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練;若放大后的所述第一特征向量卷積結(jié)果不滿足卷積收斂條件,則根據(jù)放大后的所述第一特征向量卷積結(jié)果調(diào)整所述第一卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)并根據(jù)調(diào)整后的所述第一卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)對所述第一卷積網(wǎng)絡(luò)模型進(jìn)行迭代訓(xùn)練,直至迭代訓(xùn)練后的所述第一特征向量卷積結(jié)果滿足所述卷積收斂條件。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理裝置,其中,所述展示位置確定模塊,用于按照設(shè)定規(guī)則確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置;其中,所述設(shè)定規(guī)則包括:預(yù)先設(shè)定的所述業(yè)務(wù)對象在所述視頻圖像的設(shè)定展示位置,或者,所述展示位置確定模塊根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理裝置,其中,所述展示位置確定模塊,用于根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),通過預(yù)先訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)模型確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理裝置,其中,所述裝置還包括:第二訓(xùn)練模塊,用于對所述第二卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)先訓(xùn)練;所述第二訓(xùn)練模塊包括:第二特征向量獲取模塊,用于獲取第二樣本圖像的第一特征向量,其中,所述第二特征向量中包含有所述第二樣本圖像中的業(yè)務(wù)對象的位置信息和/或置信度信息,以及所述第二樣本圖像中目標(biāo)對象的目標(biāo)對象特征向量;第二卷積處理模塊,用于對所述第二特征向量進(jìn)行卷積處理,獲取第二特征向量卷積結(jié)果;第二條件判斷模塊,用于判斷所述第二特征向量卷積結(jié)果中對應(yīng)的業(yè)務(wù)對象的位置信息和/或置信度信息是否滿足業(yè)務(wù)對象收斂條件,并判斷所述第二特征向量卷積結(jié)果中的目標(biāo)對象特征向量是否滿足目標(biāo)對象收斂條件;第二執(zhí)行模塊,用于若所述第二特征向量卷積結(jié)果中對應(yīng)的業(yè)務(wù)對象的位置信息和/或置信度信息滿足業(yè)務(wù)對象收斂條件,且所述第二特征向量卷積結(jié)果中的目標(biāo)對象特征向量滿足目標(biāo)對象收斂條件,則完成對所述第二卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練;否則,調(diào)整所述第二卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)并根據(jù)調(diào)整后的所述第二卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)對所述第二卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行迭代訓(xùn)練,直至迭代訓(xùn)練后的業(yè)務(wù)對象的位置信息和/或置信度信息和目標(biāo)對象特征向量均滿足相應(yīng)的收斂條件。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理裝置,其中,所述展示位置確定模塊,用于根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)和所述業(yè)務(wù)對象的類型,確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理裝置,其中,所述展示位置確定模塊包括:展示位置獲得模塊,用于根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)和所述業(yè)務(wù)對象的類型,獲得所述業(yè)務(wù)對象在所述視頻圖像中的多個展示位置;展示位置選擇模塊,用于從所述多個展示位置中選擇至少一個展示位置。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理裝置,其中,所述展示位置確定模塊包括:數(shù)據(jù)判斷模塊,用于判斷所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)與預(yù)先設(shè)定的動作數(shù)據(jù)是否匹配;位置獲取模塊,用于若所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)與預(yù)先設(shè)定的動作數(shù)據(jù)匹配,則從預(yù)先存儲的動作數(shù)據(jù)與展示位置的對應(yīng)關(guān)系中,獲取所述預(yù)先設(shè)定的動作數(shù)據(jù)對應(yīng)的目標(biāo)展示位置作為所述業(yè)務(wù)對象在所述視頻圖像中的展示位置。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理裝置,其中,所述業(yè)務(wù)對象包括包含有語義信息的特效;所述視頻圖像為直播類視頻圖像。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理裝置,其中,所述業(yè)務(wù)對象包括包含廣告信息的以下至少一種形式的特效:二維貼紙?zhí)匦А⑷S特效、粒子特效。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理裝置,其中,所述直播類視頻圖像的前景區(qū)域?yàn)槿宋锼诘膮^(qū)域。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理裝置,其中,所述直播類視頻圖像的背景區(qū)域?yàn)槌巳宋锼诘膮^(qū)域之外的至少局部區(qū)域。

可選地,結(jié)合本發(fā)明實(shí)施例提供的任一種視頻圖像的處理裝置,其中,所述目標(biāo)對象的動作檢測數(shù)據(jù)包括以下至少之一:眨眼數(shù)據(jù)、張嘴數(shù)據(jù)、點(diǎn)頭數(shù)據(jù)、搖頭數(shù)據(jù)、親吻數(shù)據(jù)、微笑數(shù)據(jù)、揮手?jǐn)?shù)據(jù)、剪刀手?jǐn)?shù)據(jù)、握拳數(shù)據(jù)、托手?jǐn)?shù)據(jù)、大拇指數(shù)據(jù)、手槍姿勢數(shù)據(jù)、ok手?jǐn)?shù)據(jù)。

根據(jù)本發(fā)明實(shí)施例的再一方面,還提供了一種終端設(shè)備,包括:處理器、存儲器、通信接口和通信總線,所述處理器、所述存儲器和所述通信接口通過所述通信總線完成相互間的通信;所述存儲器用于存放至少一可執(zhí)行指令,所述可執(zhí)行指令使所述處理器執(zhí)行前述任一所述的視頻圖像的處理方法對應(yīng)的操作。

根據(jù)本發(fā)明實(shí)施例的又一方面,還提供了一種計(jì)算機(jī)可讀存儲介質(zhì),所述計(jì)算機(jī)可讀存儲介質(zhì)存儲有:用于獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象的可執(zhí)行指令;用于確定所述視頻圖像的背景區(qū)域的可執(zhí)行指令;用于采用計(jì)算機(jī)繪圖方式在所述視頻圖像的背景區(qū)域繪制所述業(yè)務(wù)對象的可執(zhí)行指令。

根據(jù)本發(fā)明實(shí)施例提供的技術(shù)方案,獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象,確定待處理的視頻圖像的背景區(qū)域,然后采用計(jì)算機(jī)繪圖方式在視頻圖像的背景區(qū)域繪制業(yè)務(wù)對象,實(shí)現(xiàn)業(yè)務(wù)對象在視頻圖像的背景區(qū)域展示,避免業(yè)務(wù)對象遮擋前景區(qū)域,不影響觀眾的正常視頻觀看體驗(yàn),不易引起觀眾反感,可以有效實(shí)現(xiàn)預(yù)想的效果。

附圖說明

圖1是根據(jù)本發(fā)明實(shí)施例一的一種視頻圖像的處理方法的步驟流程圖;

圖2是根據(jù)本發(fā)明實(shí)施例二的一種視頻圖像的處理方法的步驟流程圖;

圖3是根據(jù)本發(fā)明實(shí)施例三的一種視頻圖像的處理方法的步驟流程圖;

圖4是根據(jù)本發(fā)明實(shí)施例四的一種視頻圖像的處理方法的步驟流程圖;

圖5是根據(jù)本發(fā)明實(shí)施例五的一種視頻圖像的處理裝置的結(jié)構(gòu)框圖;

圖6是根據(jù)本發(fā)明實(shí)施例六的一種視頻圖像的處理裝置的結(jié)構(gòu)框圖;

圖7是根據(jù)本發(fā)明實(shí)施例七的一種終端設(shè)備的結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面結(jié)合附圖(若干附圖中相同的標(biāo)號表示相同的元素)和實(shí)施例,對本發(fā)明實(shí)施例的具體實(shí)施方式作進(jìn)一步詳細(xì)說明。以下實(shí)施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。

本領(lǐng)域技術(shù)人員可以理解,本發(fā)明實(shí)施例中的“第一”、“第二”等術(shù)語僅用于區(qū)別不同步驟、設(shè)備或模塊等,既不代表任何特定技術(shù)含義,也不表示它們之間的必然邏輯順序。

實(shí)施例一

參照圖1,示出了根據(jù)本發(fā)明實(shí)施例一的一種視頻圖像的處理方法的步驟流程圖。

本實(shí)施例的視頻圖像的處理方法包括以下步驟:

步驟s100:獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象。

例如,在直播場景中,獲取當(dāng)前正在顯示的視頻圖像(即直播類視頻圖像);再例如,在視頻錄制場景中,獲取當(dāng)前正在錄制的視頻圖像;又例如,在錄制完成的視頻中,獲取當(dāng)前播放的視頻圖像等。其中,本實(shí)施例對視頻圖像的獲取方式和具體獲取手段不作限制。

另外,本實(shí)施例中以對一張視頻圖像的處理為例,但本領(lǐng)域技術(shù)人員應(yīng)當(dāng)明了,對于多張視頻圖像或視頻流中的視頻圖像序列均可參照本實(shí)施例進(jìn)行視頻圖像的處理。

待展示的業(yè)務(wù)對象用于在視頻圖像中展示。需要說明的是,對待展示的業(yè)務(wù)對象的獲取過程可以與待處理的視頻圖像的獲取過程同時執(zhí)行,也可以在待處理的視頻圖像的獲取過程之后或者之前執(zhí)行,本實(shí)施例對待展示的業(yè)務(wù)對象的獲取過程在本實(shí)施例中的執(zhí)行順序不做限制。

步驟s102:確定視頻圖像的背景區(qū)域。

其中,確定視頻圖像的背景區(qū)域,可以從視頻圖像中檢測視頻圖像的前景區(qū)域和背景區(qū)域;或者,可以從視頻圖像中直接檢測視頻圖像的背景區(qū)域;或者可以從視頻圖像中檢測視頻圖像的前景區(qū)域,然后將視頻圖像的前景區(qū)域以外的區(qū)域確定為視頻圖像的背景區(qū)域。本實(shí)施例對確定視頻圖像的前景區(qū)域的技術(shù)手段不做限制。

步驟s104:采用計(jì)算機(jī)繪圖方式在視頻圖像的背景區(qū)域繪制業(yè)務(wù)對象。

在確定了視頻圖像的背景區(qū)域以后,采用計(jì)算機(jī)繪圖方式將業(yè)務(wù)對象繪制在視頻圖像的背景區(qū)域。需要說明的是,采用計(jì)算機(jī)繪圖方式將業(yè)務(wù)對象繪制在視頻圖像的背景區(qū)域即采用計(jì)算機(jī)繪圖方式將業(yè)務(wù)對象繪制在視頻圖像的整個背景區(qū)域或者部分背景區(qū)域。

其中,采用計(jì)算機(jī)繪圖方式在確定出的背景區(qū)域繪制業(yè)務(wù)對象可以通過適當(dāng)?shù)挠?jì)算機(jī)圖形圖像繪制或渲染等方式實(shí)現(xiàn),包括但不限于:基于opengl圖形繪制引擎進(jìn)行繪制等。opengl定義了一個跨編程語言、跨平臺的編程接口規(guī)格的專業(yè)的圖形程序接口,其與硬件無關(guān),可以方便地進(jìn)行2d或3d圖形圖像的繪制。通過opengl,不僅可以實(shí)現(xiàn)2d效果如2d貼紙的繪制,還可以實(shí)現(xiàn)3d特效的繪制及粒子特效的繪制等等。但不限于opengl,其它方式,如unity或opencl等也同樣適用。

通過本實(shí)施例提供的視頻圖像的處理方法,獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象,確定待處理的視頻圖像的背景區(qū)域,然后采用計(jì)算機(jī)繪圖方式在視頻圖像的背景區(qū)域繪制業(yè)務(wù)對象,實(shí)現(xiàn)業(yè)務(wù)對象在視頻圖像的背景區(qū)域展示,避免業(yè)務(wù)對象遮擋前景區(qū)域,不影響觀眾的正常視頻觀看體驗(yàn),不易引起觀眾反感,可以有效實(shí)現(xiàn)預(yù)想的效果。

實(shí)施例二

參照圖2,示出了根據(jù)本發(fā)明實(shí)施例二的一種視頻圖像的處理方法的步驟流程圖。

本實(shí)施例的視頻圖像的處理方法包括以下步驟:

步驟s200:獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象。

例如,在直播場景中,獲取當(dāng)前正在顯示的視頻圖像(即直播類視頻圖像);再例如,在視頻錄制場景中,獲取當(dāng)前正在錄制的視頻圖像;又例如,在錄制完成的視頻中,獲取當(dāng)前播放的視頻圖像等。其中,本實(shí)施例對視頻圖像的獲取方式和具體獲取手段不作限制。

另外,本實(shí)施例中以對一張視頻圖像的處理為例,但本領(lǐng)域技術(shù)人員應(yīng)當(dāng)明了,對于多張視頻圖像或視頻流中的視頻圖像序列均可參照本實(shí)施例進(jìn)行視頻圖像的處理。

待展示的業(yè)務(wù)對象用于在視頻圖像中展示。需要說明的是,對待展示的業(yè)務(wù)對象的獲取過程可以與待處理的視頻圖像的獲取過程同時執(zhí)行,也可以在待處理的視頻圖像的獲取過程之后或者之前執(zhí)行,本實(shí)施例對待展示的業(yè)務(wù)對象的獲取過程在本實(shí)施例中的執(zhí)行順序不做限制。

步驟s202:確定視頻圖像的前景區(qū)域和背景區(qū)域,以及業(yè)務(wù)對象在視頻圖像中的展示位置。

其中,確定視頻圖像的前景區(qū)域,可以從視頻圖像中檢測視頻圖像的前景區(qū)域和背景區(qū)域;或者,可以從視頻圖像中直接檢測視頻圖像的前景區(qū)域;或者可以從視頻圖像中檢測視頻圖像的背景區(qū)域,然后將視頻圖像的背景區(qū)域以外的區(qū)域確定為視頻圖像的前景區(qū)域。本實(shí)施例對確定視頻圖像的前景區(qū)域的技術(shù)手段不做限制。同理,確定視頻圖像的背景區(qū)域可以參照上述確定視頻圖像的前景區(qū)域的內(nèi)容,在此不再贅述。

業(yè)務(wù)對象是根據(jù)一定的業(yè)務(wù)需求而創(chuàng)建的對象,例如廣告等。展示位置可以是視頻圖像中指定區(qū)域的中心位置,或者可以是上述指定區(qū)域中多個邊緣位置的坐標(biāo)等。

步驟s204:根據(jù)展示位置判斷業(yè)務(wù)對象與前景區(qū)域是否存在重疊部分,若存在,則執(zhí)行步驟s206;若不存在,則執(zhí)行步驟s208。

本步驟中,判斷業(yè)務(wù)對象與前景區(qū)域是否存在重疊部分的目的是判斷業(yè)務(wù)對象是否對視頻圖像的前景區(qū)域造成遮擋。若存在重疊部分,則表示業(yè)務(wù)對象對視頻圖像的前景區(qū)域造成遮擋;若不存在重疊部分,則表示業(yè)務(wù)對象對視頻圖像的前景區(qū)域未造成遮擋。

步驟s206:采用計(jì)算機(jī)繪圖方式,在背景區(qū)域繪制業(yè)務(wù)對象中除重疊部分之外的部分。

一種可行的方式中,例如,業(yè)務(wù)對象y與視頻圖像s的前景區(qū)域q存在重疊部分c,在視頻圖像s的背景區(qū)域b繪制業(yè)務(wù)對象y中除重疊部分c之外的部分w,其中,重疊部分c和部分w共同組成業(yè)務(wù)對象y,前景區(qū)域q和背景區(qū)域b共同組成業(yè)務(wù)對象y。

另一種可行的方式中,若業(yè)務(wù)對象對視頻圖像的前景區(qū)域造成遮擋,則可以采用調(diào)整前景區(qū)域的顯示圖層的方式將前景區(qū)域置于業(yè)務(wù)對象之上展示,或者還可以采用調(diào)整業(yè)務(wù)對象的顯示圖層的方式將業(yè)務(wù)對象置于前景區(qū)域之下展示。本實(shí)施例對將前景區(qū)域置于業(yè)務(wù)對象之上展示的技術(shù)手段不做具體限制。

步驟s208:采用計(jì)算機(jī)繪圖方式,在背景區(qū)域繪制整個業(yè)務(wù)對象。

通過本實(shí)施例提供的視頻圖像的處理方法,獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象,確定待處理的視頻圖像的前景區(qū)域和背景區(qū)域,以及業(yè)務(wù)對象在視頻圖像中的展示位置,然后根據(jù)業(yè)務(wù)對象在視頻圖像中的展示位置判斷業(yè)務(wù)對象與視頻圖像的前景區(qū)域是否存在重疊部分,若存在重疊部分,表示部分或全部業(yè)務(wù)對象位于前景區(qū)域內(nèi),則對于該重疊部分,將前景區(qū)域置于業(yè)務(wù)對象之上展示,避免業(yè)務(wù)對象遮擋前景區(qū)域,不影響觀眾的正常視頻觀看體驗(yàn),不易引起觀眾反感,可以有效實(shí)現(xiàn)預(yù)想的效果。

實(shí)施例三

參照圖3,示出了根據(jù)本發(fā)明實(shí)施例三的一種視頻圖像的處理方法的步驟流程圖。

本實(shí)施例的視頻圖像的處理方法可以由任意具有數(shù)據(jù)采集、處理和傳輸功能的設(shè)備執(zhí)行,包括但不限于移動終端和pc等。本實(shí)施例以移動終端為例,對本發(fā)明實(shí)施例提供的視頻圖像的處理方法進(jìn)行說明,其它設(shè)備可參照本實(shí)施例執(zhí)行。

本實(shí)施例重點(diǎn)強(qiáng)調(diào)與上述實(shí)施例的不同之處,相同之處可以參照上述實(shí)施例的介紹和說明,在此不再贅述。

本實(shí)施例的視頻圖像的處理方法包括以下步驟:

步驟s300:獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象。

例如,在直播場景中,獲取當(dāng)前正在顯示的視頻圖像;再例如,在視頻錄制場景中,獲取當(dāng)前正在錄制的視頻圖像;又例如,在錄制完成的視頻中,獲取當(dāng)前播放的視頻圖像等。本實(shí)施例中的視頻圖像為直播類視頻圖像,而且,本實(shí)施例對視頻圖像的獲取方式和具體獲取手段不作限制。

待展示的業(yè)務(wù)對象用于在視頻圖像中展示。本實(shí)施例中,待展示的業(yè)務(wù)對象包括包含有語義信息的特效,具體地,業(yè)務(wù)對象包括包含廣告信息的以下至少一種形式的特效:二維貼紙?zhí)匦?、三維特效、粒子特效。

需要說明的是,對待展示的業(yè)務(wù)對象的獲取過程可以與待處理的視頻圖像的獲取過程同時執(zhí)行,也可以在待處理的視頻圖像的獲取過程之后或者之前執(zhí)行,本實(shí)施例對待展示的業(yè)務(wù)對象的獲取過程在本實(shí)施例中的執(zhí)行順序不做限制。

步驟s302:通過預(yù)先訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)模型確定視頻圖像的背景區(qū)域。

本實(shí)施例中,使用預(yù)先訓(xùn)練好的、用于分割視頻圖像中的前景區(qū)域和背景區(qū)域的第一卷積神經(jīng)網(wǎng)絡(luò)模型,對視頻圖像進(jìn)行檢測,確定其背景區(qū)域。用于分割視頻圖像中的前景區(qū)域和背景區(qū)域的第一卷積神經(jīng)網(wǎng)絡(luò)模型通過標(biāo)注有前景區(qū)域和背景區(qū)域的樣本圖像進(jìn)行訓(xùn)練后,能夠準(zhǔn)確且高效地確定視頻圖像中的前景區(qū)域和背景區(qū)域。

當(dāng)需要預(yù)先訓(xùn)練第一卷積神經(jīng)網(wǎng)絡(luò)模型時,一種可行的訓(xùn)練方式包括以下過程:

(1)獲取第一樣本圖像的第一特征向量。

其中,第一樣本圖像為包含有前景區(qū)域和背景區(qū)域標(biāo)記信息的樣本圖像,也即,第一樣本圖像為已標(biāo)記了前景區(qū)域和背景區(qū)域的樣本圖像。本實(shí)施例中,前景區(qū)域可以為圖像主體所在區(qū)域,例如人物所在區(qū)域;背景區(qū)域可以為除了主體所在區(qū)域外的其它區(qū)域,可以是其它區(qū)域中的全部或者部分。

在一種優(yōu)選的實(shí)施方式中,第一樣本圖像可以包括至少一個視頻流的多幀樣本圖像。因此,在此方式中,在獲取待第一樣本圖像的第一特征向量之前,還需要將包括多幀樣本圖像的視頻流輸入第一卷積神經(jīng)網(wǎng)絡(luò)模型。在實(shí)現(xiàn)時,一種可行方式包括:先確定視頻流的多個關(guān)鍵幀的圖像為樣本圖像,對這些樣本圖像進(jìn)行前景區(qū)域和背景區(qū)域的標(biāo)注;在此基礎(chǔ)上,將進(jìn)行了標(biāo)注的樣本圖像進(jìn)行組合,再將組合后的包括多幀進(jìn)行了標(biāo)注的樣本圖像的視頻流輸入第一卷積神經(jīng)網(wǎng)絡(luò)模型。其中,對視頻流抽取關(guān)鍵幀,并對抽取的關(guān)鍵幀進(jìn)行標(biāo)注均可以由本領(lǐng)域技術(shù)人員采用任意適當(dāng)?shù)姆绞綄?shí)現(xiàn),如通過均勻采樣的方式抽取關(guān)鍵幀等。在抽取了關(guān)鍵幀后,可以結(jié)合視頻上下文對抽取的關(guān)鍵幀標(biāo)注區(qū)分前景和背景,得到精確的標(biāo)注邊界。將進(jìn)行了標(biāo)注后的樣本圖像作為第一樣本圖像,提取其第一特征向量。此外,本步驟中,對第一特征向量的提取可以采用相關(guān)技術(shù)中的適當(dāng)方式實(shí)現(xiàn),本實(shí)施例在此不再贅述。

(2)對第一特征向量進(jìn)行卷積處理,獲取第一特征向量卷積結(jié)果。

獲取的第一特征向量卷積結(jié)果中包含有用于分辨視頻圖像的前景區(qū)域和背景區(qū)域的信息。

對第一特征向量的卷積處理次數(shù)可以根據(jù)實(shí)際需要進(jìn)行設(shè)定,也即,第一卷積神經(jīng)網(wǎng)絡(luò)模型中,卷積層的層數(shù)根據(jù)實(shí)際需要進(jìn)行設(shè)置。

第一特征向量卷積結(jié)果是對第一特征向量進(jìn)行了特征提取后的結(jié)果,該結(jié)果能夠有效表征視頻圖像中前景區(qū)域和背景區(qū)域的特征和分類。

(3)對第一特征向量卷積結(jié)果進(jìn)行放大處理。

一種可行方式中,對第一特征向量卷積結(jié)果的放大可以采用線性插值的方式,包括但不限于線性插值、雙線性插值、三線性插值等。其中,具體的線性插值公式可以由本領(lǐng)域技術(shù)人員根據(jù)實(shí)際需要采用適當(dāng)?shù)墓剑緦?shí)施例對此不作限制。優(yōu)選地,可以通過對第一特征向量卷積結(jié)果進(jìn)行雙線性插值來放大第一特征向量卷積結(jié)果。通過對第一特征向量卷積結(jié)果進(jìn)行放大處理,可以得到與用于訓(xùn)練的原始圖像同樣大小的輸出圖像,獲得每一個像素點(diǎn)的特征信息,以更為精確地確定圖像的前景區(qū)域和背景區(qū)域。同時,通過對卷積處理后的第一特征向量的放大處理,第一卷積神經(jīng)網(wǎng)絡(luò)模型可以學(xué)習(xí)到一個較為準(zhǔn)確的放大系數(shù),基于該放大系數(shù)和放大后的第一特征向量,可以減少第一卷積神經(jīng)網(wǎng)絡(luò)模型的參數(shù)調(diào)整和計(jì)算量,降低第一卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練成本,提高訓(xùn)練效率,縮短訓(xùn)練時間。

本實(shí)施例中,在獲得第一特征向量卷積結(jié)果后,通過線性插值層對第一特征向量卷積結(jié)果進(jìn)行雙線性插值,以放大卷積處理后的圖像特征,并得到的原始圖像同樣大小(圖像長寬相同)的輸出。需要說明的是,本實(shí)施例中對雙線性插值的具體實(shí)現(xiàn)手段不作限制。

(4)判斷放大后的第一特征向量卷積結(jié)果是否滿足卷積收斂條件。

其中,卷積收斂條件可以由本領(lǐng)域技術(shù)人員根據(jù)實(shí)際需求適當(dāng)設(shè)定。當(dāng)放大后的第一特征向量卷積結(jié)果滿足卷積收斂條件時,可以認(rèn)為第一卷積神經(jīng)網(wǎng)絡(luò)模型中的網(wǎng)絡(luò)參數(shù)設(shè)置適當(dāng);當(dāng)放大后的第一特征向量卷積結(jié)果不能滿足卷積收斂條件時,可以認(rèn)為第一卷積神經(jīng)網(wǎng)絡(luò)模型中的網(wǎng)絡(luò)參數(shù)設(shè)置不適當(dāng),需要對其進(jìn)行調(diào)整,該調(diào)整是一個迭代的過程,直至使用調(diào)整后的網(wǎng)絡(luò)參數(shù)對第一特征向量進(jìn)行卷積處理的結(jié)果滿足卷積收斂條件。

本實(shí)施例中,在通過線性插值層對第一特征向量卷積結(jié)果進(jìn)行放大后,在損失層使用損失函數(shù)對其進(jìn)行計(jì)算,進(jìn)而根據(jù)計(jì)算結(jié)果確定是否滿足卷積收斂條件。也即,使用設(shè)定的損失函數(shù)計(jì)算放大后的第一特征向量卷積結(jié)果的損失值;根據(jù)損失值判斷放大后的第一特征向量卷積結(jié)果是否滿足卷積收斂條件。其中,損失層和損失函數(shù)可以根據(jù)實(shí)際情況由本領(lǐng)域技術(shù)人員適當(dāng)設(shè)定,如通過softmax函數(shù)或者logistic函數(shù)等。通過損失函數(shù)對第一特征向量卷積結(jié)果進(jìn)行計(jì)算,獲得損失值。在獲得損失值后,一種可行方式中,可以根據(jù)該損失值確定本次訓(xùn)練結(jié)果是否滿足卷積收斂條件,如該損失值是否小于或等于設(shè)定閾值;另一種可行方式中,可判斷對該損失值的計(jì)算是否已達(dá)到設(shè)定次數(shù),也即,在本次訓(xùn)練中對第一卷積神經(jīng)網(wǎng)絡(luò)模型的迭代訓(xùn)練次數(shù)是否已達(dá)到設(shè)定次數(shù),如達(dá)到則滿足卷積收斂條件。

需要說明的是,當(dāng)輸入的是視頻流中的多幀圖像時,損失層的損失函數(shù)也可以同時對該視頻流中的多幀圖像進(jìn)行損失值計(jì)算,同時輸出多幀的結(jié)果,使第一卷積神經(jīng)網(wǎng)絡(luò)模型在得到視頻上更加穩(wěn)定的結(jié)果的同時,通過多幀圖像的并行計(jì)算,提升計(jì)算效率。

(5)若滿足卷積收斂條件,則完成對第一卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練;若不滿足卷積收斂條件,則根據(jù)放大后的第一特征向量卷積結(jié)果調(diào)整第一卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)并根據(jù)調(diào)整后的第一卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)對第一卷積說明網(wǎng)絡(luò)模型進(jìn)行迭代訓(xùn)練,直至迭代訓(xùn)練后的第一特征向量卷積結(jié)果滿足卷積收斂條件。

通過對第一卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行上述訓(xùn)練,第一卷積神經(jīng)網(wǎng)絡(luò)模型可以對視頻圖像的圖像特征進(jìn)行特征提取和分類,從而具有確定視頻圖像中的前景區(qū)域和背景區(qū)域的功能。在實(shí)際應(yīng)用中,可以使用該第一卷積射精網(wǎng)絡(luò)模型識別出視頻圖像中的背景區(qū)域。

為了使訓(xùn)練的結(jié)果更為精準(zhǔn),在一種優(yōu)選的實(shí)施方式中,可以通過測試樣本測試該訓(xùn)練出的第一卷積神經(jīng)網(wǎng)絡(luò)模型是否準(zhǔn)確,進(jìn)而根據(jù)測試結(jié)果決定使用該第一卷積神經(jīng)網(wǎng)絡(luò)模型還是對該第一卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行再訓(xùn)練。在此方式中,在完成了對第一卷積神經(jīng)網(wǎng)絡(luò)模型的初步訓(xùn)練后,還可以獲取測試樣本圖像,使用訓(xùn)練后的第一卷積神經(jīng)網(wǎng)絡(luò)模型對測試樣本圖像進(jìn)行前背景區(qū)域的預(yù)測,其中,測試樣本圖像為未進(jìn)行任何標(biāo)注的樣本圖像;進(jìn)而,檢驗(yàn)預(yù)測的前背景區(qū)域是否正確;若不正確,則對第一卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行再次訓(xùn)練;若正確,則可以確定使用該第一卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行視頻圖像的前背景確定,或者,為了使第一卷積神經(jīng)網(wǎng)絡(luò)模型更為精準(zhǔn),再獲取其它測試樣本圖像進(jìn)行測試;或者,使用與原訓(xùn)練樣本圖像不同的樣本圖像進(jìn)行再次訓(xùn)練。

當(dāng)通過測試樣本檢驗(yàn)到使用第一卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)測的前背景區(qū)域不正確時,需要對該第一卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行再次訓(xùn)練。在一種再次訓(xùn)練方式中,可以僅使用從測試樣本圖像中獲取的前背景區(qū)域預(yù)測不正確的樣本圖像作為再次訓(xùn)練使用的樣本圖像;然后,使用這些預(yù)測不正確的樣本圖像對第一卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行再次訓(xùn)練。這些進(jìn)行再次訓(xùn)練的樣本在用于訓(xùn)練前,也需進(jìn)行前背景標(biāo)注。通過這種再訓(xùn)練方式,不僅使得訓(xùn)練更有針對性,也大大節(jié)約了訓(xùn)練成本。當(dāng)然,不限于此,在實(shí)際使用中,也可以使用其它進(jìn)行了前背景標(biāo)注的樣本圖像進(jìn)行訓(xùn)練。

在視頻直播場景中,直播類視頻圖像的前景區(qū)域?yàn)槿宋锼诘膮^(qū)域;直播類視頻圖像的背景區(qū)域?yàn)槌巳宋锼诘膮^(qū)域之外的至少局部區(qū)域。

步驟s304:確定業(yè)務(wù)對象在視頻圖像中的展示位置。

本步驟中,可以確定業(yè)務(wù)對象在視頻圖像中的一個或者多個展示位置,可行的實(shí)現(xiàn)方式包括:

方式一、從業(yè)務(wù)對象對應(yīng)的多幀展示圖像中,確定待展示的展示圖像;確定待展示的展示圖像在視頻圖像中的展示位置。方式二、按照設(shè)定規(guī)則確定業(yè)務(wù)對象在視頻圖像中的展示位置。

以下,分別對上述兩種方式進(jìn)行詳細(xì)說明。

方式一

從業(yè)務(wù)對象對應(yīng)的具有播放順序的多幀展示圖像中,選擇首幀未被播放過的展示圖像,將選擇的展示圖像確定為待展示的展示圖像。

其中,從業(yè)務(wù)對象對應(yīng)的具有播放順序的多幀展示圖像中,選擇首幀未被播放過的展示圖像,具體可以先從業(yè)務(wù)對象對應(yīng)的具有播放順序的多幀展示圖像中,確定播放狀態(tài)為未播放的展示圖像,再選擇播放狀態(tài)為未播放的展示圖像中的首幀展示圖像。在此情況下,在選擇的首幀未被播放過的展示圖像播放完畢之后,對具有播放順序的多幀展示圖像的播放狀態(tài)進(jìn)行更新。

需要說明的是,無論業(yè)務(wù)對象為動態(tài)業(yè)務(wù)對象還是靜態(tài)業(yè)務(wù)對象,業(yè)務(wù)對象均由多幀圖像組成。視頻圖像中的每幀與業(yè)務(wù)對象的每幀保持時間對齊,在視頻圖像播放下一幀時,業(yè)務(wù)對象也可以同步展示對應(yīng)的下一幀。

方式二

按照設(shè)定規(guī)則確定業(yè)務(wù)對象在視頻圖像中的展示位置;其中,設(shè)定規(guī)則包括:設(shè)定規(guī)則1、預(yù)先設(shè)定的業(yè)務(wù)對象在視頻圖像的設(shè)定展示位置,或者,設(shè)定規(guī)則2、根據(jù)前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定業(yè)務(wù)對象在視頻圖像中的展示位置。

設(shè)定規(guī)則1:預(yù)先設(shè)定的業(yè)務(wù)對象與其在視頻圖像中的展示位置存在對應(yīng)關(guān)系,若待展示的業(yè)務(wù)對象確定為預(yù)先設(shè)定的業(yè)務(wù)對象,則待展示的業(yè)務(wù)對象的展示位置相應(yīng)地確定為預(yù)先設(shè)定的業(yè)務(wù)對象在視頻圖像中的設(shè)定展示位置。

設(shè)定規(guī)則2:可以分別使用預(yù)先訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)模型和前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定業(yè)務(wù)對象在視頻圖像中的展示位置;還可以根據(jù)業(yè)務(wù)對象的類型和前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定業(yè)務(wù)對象在視頻圖像中的展示位置;或者可以根據(jù)預(yù)先設(shè)定的動作數(shù)據(jù)和前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)確定業(yè)務(wù)對象在視頻圖像中的展示位置。以下對上述三種確定業(yè)務(wù)對象在視頻圖像中的展示位置的方式進(jìn)行詳細(xì)介紹。

1)使用預(yù)先訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)模型和前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定業(yè)務(wù)對象在視頻圖像中的展示位置。

其中,需要預(yù)先訓(xùn)練一個卷積神經(jīng)網(wǎng)絡(luò)模型(即第二卷積神經(jīng)網(wǎng)絡(luò)模型),訓(xùn)練完成的第二卷積神經(jīng)網(wǎng)絡(luò)模型具有確定業(yè)務(wù)對象在視頻圖像中的展示位置的功能;或者,也可以直接使用第三方已訓(xùn)練完成的、具有確定業(yè)務(wù)對象在視頻圖像中的展示位置的功能的卷積神經(jīng)網(wǎng)絡(luò)模型。

當(dāng)需要預(yù)先訓(xùn)練第二卷積神經(jīng)網(wǎng)絡(luò)模型時,一種可行的訓(xùn)練方式包括以下過程:

(1)獲取第二樣本圖像的第二特征向量。

其中,第二特征向量中包含有第二樣本圖像中的業(yè)務(wù)對象的位置信息和/或置信度信息,以及第二樣本圖像中目標(biāo)對象的目標(biāo)對象特征向量。業(yè)務(wù)對象的置信度信息指示了業(yè)務(wù)對象展示在當(dāng)前位置時,能夠達(dá)到的效果(如被關(guān)注或被點(diǎn)擊或被觀看)的概率,該概率可以根據(jù)對歷史數(shù)據(jù)的統(tǒng)計(jì)分析結(jié)果設(shè)定,也可以根據(jù)仿真實(shí)驗(yàn)的結(jié)果設(shè)定,還可以根據(jù)人工經(jīng)驗(yàn)進(jìn)行設(shè)定。在實(shí)際應(yīng)用中,可以根據(jù)實(shí)際需要,僅對業(yè)務(wù)對象的位置信息進(jìn)行訓(xùn)練,也可以僅對業(yè)務(wù)對象的置信度信息進(jìn)行訓(xùn)練,還可以對二者均進(jìn)行訓(xùn)練。對二者均進(jìn)行訓(xùn)練,能夠使得訓(xùn)練后的第二卷積神經(jīng)網(wǎng)絡(luò)模型更為有效和精準(zhǔn)地確定業(yè)務(wù)對象的位置信息和置信度信息,以便為視頻圖像的處理提供依據(jù)。

第二卷積神經(jīng)網(wǎng)絡(luò)模型對大量的第二樣本圖像進(jìn)行訓(xùn)練,本實(shí)施例中,需要使用包含有業(yè)務(wù)對象的第二樣本圖像對第二卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)明了的是,用來訓(xùn)練的第二樣本圖像中,除了包含業(yè)務(wù)對象外,也應(yīng)當(dāng)包含目標(biāo)對象屬性的信息(即人臉的面部表情和/或動作、人手的手勢和/或動作等等)。此外,本實(shí)施例中的第二樣本圖像中的業(yè)務(wù)對象可以被預(yù)先標(biāo)注位置信息,或者置信度信息,或者二種信息都有。當(dāng)然,在實(shí)際應(yīng)用中,這些信息也可以通過其它途徑獲取。而通過預(yù)先在對業(yè)務(wù)對象進(jìn)行相應(yīng)信息的標(biāo)注,可以有效節(jié)約數(shù)據(jù)處理的數(shù)據(jù)和交互次數(shù),提高數(shù)據(jù)處理效率。

將具有業(yè)務(wù)對象的位置信息和/或置信度信息,以及某種目標(biāo)對象屬性的第二樣本圖像作為訓(xùn)練樣本,對其進(jìn)行特征向量提取,獲得包含有業(yè)務(wù)對象的位置信息和/或置信度信息的業(yè)務(wù)對象特征向量,以及目標(biāo)對象屬性對應(yīng)的目標(biāo)對象特征向量。

可選地,可以使用第二卷積神經(jīng)網(wǎng)絡(luò)模型對目標(biāo)對象和業(yè)務(wù)對象同時進(jìn)行訓(xùn)練,在此情況下,第二樣本圖像的第二特征向量中,也應(yīng)當(dāng)包含目標(biāo)對象的特征。

對第二特征向量的提取可以采用相關(guān)技術(shù)中的適當(dāng)方式實(shí)現(xiàn),本實(shí)施例在此不再贅述。

(2)對第二特征向量進(jìn)行卷積處理,獲取第二特征向量卷積結(jié)果。

在實(shí)施中,獲取的第二特征向量卷積結(jié)果中包含有業(yè)務(wù)對象的位置信息和/或置信度信息,目標(biāo)對象屬性對應(yīng)的目標(biāo)對象特征向量對應(yīng)的特征向量卷積結(jié)果。在對目標(biāo)對象和業(yè)務(wù)對象進(jìn)行聯(lián)合訓(xùn)練的情況下,特征向量卷積結(jié)果中還包含目標(biāo)對象信息。

對第二特征向量的卷積處理次數(shù)可以根據(jù)實(shí)際需要進(jìn)行設(shè)定,也即,第二卷積神經(jīng)網(wǎng)絡(luò)模型中,卷積層的層數(shù)根據(jù)實(shí)際需要進(jìn)行設(shè)置,在此不再贅述。

第二特征向量卷積結(jié)果是對第二特征向量進(jìn)行了特征提取后的結(jié)果,該結(jié)果能夠有效表征視頻圖像中目標(biāo)對象的特征對應(yīng)的業(yè)務(wù)對象。

本實(shí)施例中,當(dāng)?shù)诙卣飨蛄恐屑劝瑯I(yè)務(wù)對象的位置信息,又包含業(yè)務(wù)對象的置信度信息時,也即,對業(yè)務(wù)對象的位置信息和置信度信息均進(jìn)行了訓(xùn)練的情況下,該第二特征向量卷積結(jié)果在后續(xù)分別進(jìn)行收斂條件判斷時共享,無須進(jìn)行重復(fù)處理和計(jì)算,減少了由數(shù)據(jù)處理引起的資源損耗,提高了數(shù)據(jù)處理速度和效率。

(3)判斷第二特征向量卷積結(jié)果中對應(yīng)的業(yè)務(wù)對象的位置信息和/或置信度信息是否滿足業(yè)務(wù)對象收斂條件,并判斷第二特征向量卷積結(jié)果中對應(yīng)的目標(biāo)對象特征向量是否滿足目標(biāo)對象收斂條件。

其中,業(yè)務(wù)對象收斂條件和目標(biāo)對象收斂條件可以由本領(lǐng)域技術(shù)人員根據(jù)實(shí)際需求適當(dāng)設(shè)定。當(dāng)位置信息和/或置信度信息滿足業(yè)務(wù)對象收斂條件,且目標(biāo)對象特征向量滿足目標(biāo)對象收斂條件時,可以認(rèn)為第二卷積神經(jīng)網(wǎng)絡(luò)模型中的網(wǎng)絡(luò)參數(shù)設(shè)置適當(dāng);當(dāng)位置信息和/或置信度信息不滿足業(yè)務(wù)對象收斂條件,或目標(biāo)對象特征向量不滿足目標(biāo)對象收斂條件時,可以認(rèn)為第二卷積神經(jīng)網(wǎng)絡(luò)模型中的網(wǎng)絡(luò)參數(shù)設(shè)置不適當(dāng),需要對其進(jìn)行調(diào)整,該調(diào)整是一個迭代的過程,直至使用調(diào)整后的網(wǎng)絡(luò)參數(shù)對第二特征向量進(jìn)行卷積處理的結(jié)果滿足收斂條件。

一種可行方式中,業(yè)務(wù)對象收斂條件可以根據(jù)預(yù)設(shè)的標(biāo)準(zhǔn)位置和/或預(yù)設(shè)的標(biāo)準(zhǔn)置信度進(jìn)行設(shè)定,如,將第二特征向量卷積結(jié)果中業(yè)務(wù)對象的位置信息指示的位置與預(yù)設(shè)的標(biāo)準(zhǔn)位置之間的距離是否滿足一定閾值作為業(yè)務(wù)對象的位置信息的收斂條件;將第二特征向量卷積結(jié)果中業(yè)務(wù)對象的置信度信息指示的置信度與預(yù)設(shè)的標(biāo)準(zhǔn)置信度之間的差別是否滿足一定閾值作為業(yè)務(wù)對象的置信度信息的收斂條件等。

其中,可選地,預(yù)設(shè)的標(biāo)準(zhǔn)位置可以是對待訓(xùn)練的第二樣本圖像中的業(yè)務(wù)對象的位置進(jìn)行平均處理后獲得的平均位置;預(yù)設(shè)的標(biāo)準(zhǔn)置信度可以是對待訓(xùn)練的第二樣本圖像中的業(yè)務(wù)對象的置信度進(jìn)行平均處理后獲取的平均置信度。因第二樣本圖像為待訓(xùn)練樣本且數(shù)據(jù)量龐大,可依據(jù)待訓(xùn)練的第二樣本圖像中的業(yè)務(wù)對象的位置和/或置信度設(shè)定標(biāo)準(zhǔn)位置和/或標(biāo)準(zhǔn)置信度,這樣設(shè)定的標(biāo)準(zhǔn)位置和標(biāo)準(zhǔn)置信度也更為客觀和精確。

在具體進(jìn)行第二特征向量卷積結(jié)果中對應(yīng)的業(yè)務(wù)對象的位置信息和/或置信度信息是否滿足業(yè)務(wù)對象收斂條件的判斷時,一種可行的方式包括:

獲取第二特征向量卷積結(jié)果中對應(yīng)的業(yè)務(wù)對象的位置信息,通過計(jì)算對應(yīng)的業(yè)務(wù)對象的位置信息指示的位置與預(yù)設(shè)的標(biāo)準(zhǔn)位置之間的歐式距離,得到對應(yīng)的業(yè)務(wù)對象的位置信息指示的位置與預(yù)設(shè)的標(biāo)準(zhǔn)位置之間的第一距離,根據(jù)第一距離判斷對應(yīng)的業(yè)務(wù)對象的位置信息是否滿足業(yè)務(wù)對象收斂條件;和/或,

獲取第二特征向量卷積結(jié)果中對應(yīng)的業(yè)務(wù)對象的置信度信息,計(jì)算對應(yīng)的業(yè)務(wù)對象的置信度信息指示的置信度與預(yù)設(shè)的標(biāo)準(zhǔn)置信度之間的歐式距離,得到對應(yīng)的業(yè)務(wù)對象的置信度信息指示的置信度與預(yù)設(shè)的標(biāo)準(zhǔn)置信度之間的第二距離,根據(jù)第二距離判斷對應(yīng)的業(yè)務(wù)對象的置信度信息是否滿足業(yè)務(wù)對象收斂條件。其中,采用歐式距離的方式,實(shí)現(xiàn)簡單且能夠有效指示收斂條件是否被滿足。但不限于此,其它方式,如馬式距離,巴式距離等也同樣適用。

可選地,如前所述,預(yù)設(shè)的標(biāo)準(zhǔn)位置為對待訓(xùn)練的第二樣本圖像中的業(yè)務(wù)對象的位置進(jìn)行平均處理后獲得的平均位置;和/或,預(yù)設(shè)的標(biāo)準(zhǔn)置信度為對待訓(xùn)練的第二樣本圖像中的業(yè)務(wù)對象的置信度進(jìn)行平均處理后獲取的平均置信度。

當(dāng)?shù)诙卣飨蛄烤矸e結(jié)果中還包含目標(biāo)對象的信息時,對目標(biāo)對象的信息是否收斂的判斷可以參照相關(guān)使用第二卷積神經(jīng)網(wǎng)絡(luò)模型的收斂條件進(jìn)行判斷,在此不再贅述。若目標(biāo)對象的信息滿足收斂條件(即第二特征向量卷積結(jié)果中的目標(biāo)對象特征向量滿足目標(biāo)對象收斂條件),則可對目標(biāo)對象進(jìn)行分類,明確目標(biāo)對象的所屬類別,以為后續(xù)業(yè)務(wù)對象的展示位置確定提供參考和依據(jù)。

(4)若滿足收斂條件(即位置信息和/或置信度信息滿足業(yè)務(wù)對象收斂條件,且目標(biāo)對象特征向量滿足目標(biāo)對象收斂條件),則完成對第二卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練;若不滿足收斂條件(位置信息和/或置信度信息不滿足業(yè)務(wù)對象收斂條件,或目標(biāo)對象特征向量不滿足目標(biāo)對象收斂條件),則根據(jù)第二特征向量卷積結(jié)果中對應(yīng)的業(yè)務(wù)對象的位置信息和/或置信度信息,和第二特征向量卷積結(jié)果中的目標(biāo)對象特征向量調(diào)整第二卷積神經(jīng)網(wǎng)絡(luò)模型的參數(shù)并根據(jù)調(diào)整后的第二卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)對第二卷積睡覺覺網(wǎng)絡(luò)模型進(jìn)行迭代訓(xùn)練,直至迭代訓(xùn)練后的業(yè)務(wù)對象的位置信息和/或置信度信息滿足收斂條件,目標(biāo)對象特征向量滿足目標(biāo)對象收斂條件。

通過對第二卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行上述訓(xùn)練,第二卷積神經(jīng)網(wǎng)絡(luò)模型可以對基于業(yè)務(wù)對象的展示位置進(jìn)行特征提取和分類,從而具有確定業(yè)務(wù)對象在視頻圖像中的展示位置的功能。其中,當(dāng)展示位置包括多個時,通過上述業(yè)務(wù)對象置信度的訓(xùn)練,第二卷積神經(jīng)網(wǎng)絡(luò)模型還可以確定出多個展示位置中的展示效果的優(yōu)劣順序,從而確定最優(yōu)的展示位置。在后續(xù)應(yīng)用中,當(dāng)需要展示業(yè)務(wù)對象時,根據(jù)視頻圖像即可確定出有效的展示位置。

此外,在對第二卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行上述訓(xùn)練之前,還可以預(yù)先對第二樣本圖像進(jìn)行預(yù)處理,包括:獲取多個第二樣本圖像,其中,每個第二樣本圖像中包含有業(yè)務(wù)對象的標(biāo)注信息;根據(jù)標(biāo)注信息確定業(yè)務(wù)對象的位置,判斷確定的業(yè)務(wù)對象的位置與預(yù)設(shè)位置的距離是否小于或等于設(shè)定閾值;將小于或等于設(shè)定閾值的業(yè)務(wù)對象對應(yīng)的第二樣本圖像,確定為待訓(xùn)練的第二樣本圖像。其中,預(yù)設(shè)位置和設(shè)定閾值均可以由本領(lǐng)域技術(shù)人員采用任意適當(dāng)方式進(jìn)行適當(dāng)設(shè)置,如根據(jù)數(shù)據(jù)統(tǒng)計(jì)分析結(jié)果或者相關(guān)距離計(jì)算公式或者人工經(jīng)驗(yàn)等,本實(shí)施例對此不作限制。

在一種可行方式中,根據(jù)標(biāo)注信息確定的業(yè)務(wù)對象的位置可以是業(yè)務(wù)對象的中心位置。在根據(jù)標(biāo)注信息確定業(yè)務(wù)對象的位置,判斷確定的業(yè)務(wù)對象的位置與預(yù)設(shè)位置的距離是否小于或等于設(shè)定閾值時,可以根據(jù)標(biāo)注信息確定業(yè)務(wù)對象的中心位置;進(jìn)而判斷該中心位置與預(yù)設(shè)位置的方差是否小于或等于設(shè)定閾值。

通過預(yù)先對第二樣本圖像進(jìn)行預(yù)處理,可以過濾掉不符合條件的樣本圖像,以保證訓(xùn)練結(jié)果的準(zhǔn)確性。

通過上述過程實(shí)現(xiàn)了第二卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練,訓(xùn)練完成的第二卷積神經(jīng)網(wǎng)絡(luò)模型可以用來確定業(yè)務(wù)對象在視頻圖像中的展示位置。例如,在視頻直播過程中,若主播點(diǎn)擊業(yè)務(wù)對象指示進(jìn)行業(yè)務(wù)對象展示時,在第二卷積神經(jīng)網(wǎng)絡(luò)模型獲得了直播的視頻圖像中主播的面部特征點(diǎn)后,可以指示出展示業(yè)務(wù)對象的最優(yōu)位置如主播的額頭位置,進(jìn)而控制直播應(yīng)用在該位置展示業(yè)務(wù)對象;或者,在視頻直播過程中,若主播點(diǎn)擊業(yè)務(wù)對象指示進(jìn)行業(yè)務(wù)對象展示時,第二卷積神經(jīng)網(wǎng)絡(luò)模型可以直接根據(jù)直播的視頻圖像確定業(yè)務(wù)對象的展示位置。

2)根據(jù)業(yè)務(wù)對象的類型和前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定業(yè)務(wù)對象在視頻圖像中的展示位置。

首先根據(jù)前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)和業(yè)務(wù)對象的類型,獲得業(yè)務(wù)對象在視頻圖像中的多個展示位置;然后從多個展示位置中選擇至少一個展示位置。其中,目標(biāo)對象的類型包括但不限于:人臉類型、手部類型和動作類型。其中,人臉類型用于指示人臉在視頻圖像中占據(jù)主要部分,手部類型用于指示手部在視頻圖像中占據(jù)主要部分,而動作類型則用于指示人物進(jìn)行了某種動作。目標(biāo)對象的動作檢測數(shù)據(jù)包括以下至少之一:眨眼數(shù)據(jù)、張嘴數(shù)據(jù)、點(diǎn)頭數(shù)據(jù)、搖頭數(shù)據(jù)、親吻數(shù)據(jù)、微笑數(shù)據(jù)、揮手?jǐn)?shù)據(jù)、剪刀手?jǐn)?shù)據(jù)、握拳數(shù)據(jù)、托手?jǐn)?shù)據(jù)、大拇指數(shù)據(jù)、手槍姿勢數(shù)據(jù)、ok手?jǐn)?shù)據(jù)。

3)根據(jù)預(yù)先設(shè)定的動作數(shù)據(jù)和前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)確定業(yè)務(wù)對象在視頻圖像中的展示位置。

判斷前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)與預(yù)先設(shè)定的動作數(shù)據(jù)是否匹配;若匹配,則從預(yù)先存儲的動作數(shù)據(jù)與展示位置的對應(yīng)關(guān)系中,獲取預(yù)先設(shè)定的動作數(shù)據(jù)對應(yīng)的目標(biāo)展示位置作為業(yè)務(wù)對象在視頻圖像中的展示位置。

在實(shí)施中,可以預(yù)先設(shè)定多種不同的動作數(shù)據(jù),并對不同的動作數(shù)據(jù)進(jìn)行相應(yīng)的標(biāo)記,如標(biāo)記為臉部的動作或者手部的動作等等。不同的動作數(shù)據(jù)對應(yīng)著不同的展示位置。將前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)與預(yù)先設(shè)定的動作數(shù)據(jù)進(jìn)行匹配,如果動作檢測數(shù)據(jù)與動作數(shù)據(jù)相同,則可以確定前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)與預(yù)先設(shè)定的動作數(shù)據(jù)進(jìn)行匹配。

為了提高匹配的準(zhǔn)確度,可以通過計(jì)算的方式確定上述匹配結(jié)果,例如,可以設(shè)置匹配算法計(jì)算動作檢測數(shù)據(jù)和動作數(shù)據(jù)之間的匹配度,例如,可以使用動作檢測數(shù)據(jù)和預(yù)先設(shè)定的動作數(shù)據(jù)進(jìn)行匹配計(jì)算,得到兩者之間的匹配度數(shù)值,通過上述方式分別計(jì)算動作檢測數(shù)據(jù)與預(yù)先設(shè)定的每一個動作數(shù)據(jù)之間的匹配度數(shù)值,從得到的匹配度數(shù)值中選取最大的匹配度數(shù)值,如果該最大的匹配度數(shù)值超過預(yù)定的匹配閾值,則可以確定最大的匹配度數(shù)值對應(yīng)的預(yù)先設(shè)定的動作數(shù)據(jù)與動作檢測數(shù)據(jù)相匹配。如果該最大的匹配度數(shù)值未超過預(yù)定的匹配閾值,則匹配失敗。

需要說明的是,上述步驟s302和步驟s304可以同時執(zhí)行,也可以按照順序執(zhí)行,例如,先執(zhí)行步驟s302,后執(zhí)行步驟s304,或者先執(zhí)行步驟s304,后執(zhí)行步驟s302,本實(shí)施例對步驟s302和步驟s304的執(zhí)行順序不做具體限定。

步驟s306:根據(jù)展示位置判斷業(yè)務(wù)對象與前景區(qū)域是否存在重疊部分,若存在,則執(zhí)行步驟s308;若不存在,則執(zhí)行步驟s310。

本步驟中,判斷業(yè)務(wù)對象與前景區(qū)域是否存在重疊部分的目的是判斷業(yè)務(wù)對象是否對視頻圖像的前景區(qū)域造成遮擋。若存在重疊部分,則表示業(yè)務(wù)對象對視頻圖像的前景區(qū)域造成遮擋;若不存在重疊部分,則表示業(yè)務(wù)對象對視頻圖像的前景區(qū)域未造成遮擋。

步驟s308:采用計(jì)算機(jī)繪圖方式,在背景區(qū)域繪制業(yè)務(wù)對象中除重疊部分之外的部分。

一種可行的方式中,例如,業(yè)務(wù)對象y與視頻圖像s的前景區(qū)域q存在重疊部分c,在視頻圖像s的背景區(qū)域b繪制業(yè)務(wù)對象y中除重疊部分c之外的部分w,其中,重疊部分c和部分w共同組成業(yè)務(wù)對象y,前景區(qū)域q和背景區(qū)域b共同組成業(yè)務(wù)對象y。

另一種可行的方式中,若業(yè)務(wù)對象對視頻圖像的前景區(qū)域造成遮擋,則可以采用調(diào)整前景區(qū)域的顯示圖層的方式將前景區(qū)域置于業(yè)務(wù)對象之上展示,或者還可以采用調(diào)整業(yè)務(wù)對象的顯示圖層的方式將業(yè)務(wù)對象置于前景區(qū)域之下展示。本實(shí)施例對將前景區(qū)域置于業(yè)務(wù)對象之上展示的技術(shù)手段不做具體限制。

本實(shí)施例中,將前景區(qū)域置于業(yè)務(wù)對象之上展示,具體可以將重疊部分對應(yīng)的前景區(qū)域置于重疊部分對應(yīng)的業(yè)務(wù)對象之上展示。

步驟s310:采用計(jì)算機(jī)繪圖方式,在背景區(qū)域繪制整個業(yè)務(wù)對象。

通過本實(shí)施例提供的視頻圖像的處理方法,獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象,確定待處理的視頻圖像的前景區(qū)域和背景區(qū)域,以及業(yè)務(wù)對象在視頻圖像中的展示位置,然后根據(jù)業(yè)務(wù)對象在視頻圖像中的展示位置判斷業(yè)務(wù)對象與視頻圖像的前景區(qū)域是否存在重疊部分,若存在重疊部分,表示部分或全部業(yè)務(wù)對象位于前景區(qū)域內(nèi),則對于該重疊部分,將前景區(qū)域置于業(yè)務(wù)對象之上展示,避免業(yè)務(wù)對象遮擋前景區(qū)域,不影響觀眾的正常視頻觀看體驗(yàn),不易引起觀眾反感,可以有效實(shí)現(xiàn)預(yù)想的效果。

實(shí)施例四

參照圖4,示出了根據(jù)本發(fā)明實(shí)施例四的一種視頻圖像的處理方法的步驟流程圖。

業(yè)務(wù)對象包括包含有語義信息的特效,具體地,業(yè)務(wù)對象包括包含廣告信息的以下至少一種形式的特效:二維貼紙?zhí)匦А⑷S特效、粒子特效。本實(shí)施例以業(yè)務(wù)對象為二維廣告貼紙?zhí)匦В曨l圖像為直播類視頻圖像為例,對本發(fā)明實(shí)施例的視頻圖像的處理方案進(jìn)行說明。

本實(shí)施例的視頻圖像的處理方法包括以下步驟:

步驟s400:獲取待處理的直播類視頻圖像和待展示的廣告貼紙?zhí)匦А?/p>

從直播類視頻應(yīng)用中獲取待處理的直播類視頻圖像。待展示的廣告貼紙?zhí)匦Э梢詾閺V告商定制的廣告貼紙?zhí)匦?,或者可以為主播選擇的廣告貼紙?zhí)匦А?/p>

步驟s402:確定直播類視頻圖像的主播區(qū)域,以及廣告貼紙?zhí)匦г谥辈ヮ愐曨l圖像中的展示位置。

直播類視頻圖像可以劃分為兩部分區(qū)域,分別為主播區(qū)域和背景區(qū)域。其中,主播區(qū)域?yàn)橹鞑ケ旧淼膮^(qū)域,背景區(qū)域?yàn)橹辈ヮ愐曨l圖像中,主播區(qū)域以外的區(qū)域。

本步驟確定主播區(qū)域以及展示位置的具體執(zhí)行過程可以按照上述實(shí)施例中的相關(guān)內(nèi)容,在此不再贅述。

步驟s404:根據(jù)展示位置判斷廣告貼紙?zhí)匦c主播區(qū)域是否存在重疊部分,若存在,則執(zhí)行步驟s406;若不存在,則執(zhí)行步驟s408。

步驟s406:將主播區(qū)域置于廣告貼紙?zhí)匦е险故尽?/p>

步驟s408:采用計(jì)算機(jī)繪圖方式,在背景區(qū)域繪制整個業(yè)務(wù)對象。

本實(shí)施例中,當(dāng)視頻圖像的主體為主播時,觀眾主要關(guān)注的區(qū)域?yàn)橹鞑サ哪槻繀^(qū)域和肢體動作,為了能夠既讓觀眾注意到廣告貼紙?zhí)匦У膬?nèi)容,同時不會影響到主播,可以通過增強(qiáng)現(xiàn)實(shí)感效果,給視頻圖像相關(guān)區(qū)域加上有語義的虛擬物品如廣告貼紙?zhí)匦А2⑼ㄟ^虛擬物品上的展示效果和信息達(dá)到商業(yè)價值。通過這種方式,既保留了主播的主要形象和動作,同時通過增強(qiáng)現(xiàn)實(shí)的特效為視頻圖像增加了趣味性,減少了觀眾對廣告投放引起的可能的反感,并能夠吸引到觀眾的注意力,形成商業(yè)的價值。例如,若廣告貼紙?zhí)匦橐粋€飛鳥貼紙?zhí)匦?,飛鳥貼紙?zhí)匦г谝曨l圖像中展示,當(dāng)飛鳥貼紙?zhí)匦У恼故疚恢门c主播區(qū)域存在重疊部分時,即飛鳥貼紙?zhí)匦д趽踔鞑^(qū)域時,將主播區(qū)域置于飛鳥貼紙?zhí)匦е险故?。具體地,若飛鳥貼紙?zhí)匦c主播區(qū)域的重疊部分為飛鳥貼紙?zhí)匦У念^部,飛鳥貼紙?zhí)匦У钠溆嗖糠植慌c主播區(qū)域重疊,則將主播區(qū)域置于飛鳥貼紙?zhí)匦У念^部之上展示,展示效果為可見飛鳥貼紙?zhí)匦С^部以外的部分和主播區(qū)域。若飛鳥貼紙?zhí)匦c主播區(qū)域的重疊部分為整個飛鳥貼紙?zhí)匦?,則將主播區(qū)域置于整個飛鳥貼紙?zhí)匦е险故?,展示效果為不可見整個飛鳥貼紙?zhí)匦?,可見主播區(qū)域。

需要說明的是,上述廣告貼紙?zhí)匦?,以飛鳥貼紙?zhí)匦槔?,可以為靜態(tài)的廣告貼紙?zhí)匦В部梢詾閯討B(tài)的廣告貼紙?zhí)匦?。?dāng)廣告貼紙?zhí)匦閯討B(tài)的廣告貼紙?zhí)匦r,可以將動態(tài)的廣告貼紙?zhí)匦У拿恳粠鳛橐粋€靜態(tài)的廣告貼紙?zhí)匦нM(jìn)行處理,具體處理過程可以參照上述實(shí)施例中的相關(guān)內(nèi)容,在此不再贅述。

隨著互聯(lián)網(wǎng)直播的興起,越來越多的視頻以直播的方式出現(xiàn)。這類視頻具有場景簡單、實(shí)時、因觀眾主要在手機(jī)等移動終端上觀看而視頻圖像尺寸較小等特點(diǎn)。在此情況下,對于某些業(yè)務(wù)對象的投放如廣告投放來說,由于移動終端的屏幕展示區(qū)域有限,如果以傳統(tǒng)的固定位置放置廣告,則會占用主要的用戶體驗(yàn)區(qū)域,甚至?xí)趽踔鞑^(qū)域,不僅容易引起用戶反感,還可能導(dǎo)致直播的主播者丟失觀眾。而通過業(yè)務(wù)對象投放廣告,將廣告投放與視頻直播內(nèi)容有效融合,方式靈活,效果生動,不僅不影響用戶的直播觀看體驗(yàn),且提升了廣告的投放效果。對于使用較小的顯示屏幕進(jìn)行業(yè)務(wù)對象展示,廣告投放等場景尤其適用。

通過本實(shí)施例提供的視頻圖像的處理方法,獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象,確定待處理的視頻圖像的前景區(qū)域,以及業(yè)務(wù)對象在視頻圖像中的展示位置,然后根據(jù)業(yè)務(wù)對象在視頻圖像中的展示位置判斷業(yè)務(wù)對象與視頻圖像的前景區(qū)域是否存在重疊部分,若存在重疊部分,表示部分或全部業(yè)務(wù)對象位于前景區(qū)域內(nèi),則對于該重疊部分,將前景區(qū)域置于業(yè)務(wù)對象之上展示,避免業(yè)務(wù)對象遮擋前景區(qū)域,不影響觀眾的正常視頻觀看體驗(yàn),不易引起觀眾反感,可以有效實(shí)現(xiàn)預(yù)想的效果。

此外,本實(shí)施例的視頻圖像處理方法可以在任意適當(dāng)?shù)木哂袛?shù)據(jù)采集、處理和傳輸功能的終端設(shè)備如移動終端或pc上實(shí)現(xiàn),本發(fā)明實(shí)施例對實(shí)現(xiàn)設(shè)備不作限制。

實(shí)施例五

參照圖5,示出了根據(jù)本發(fā)明實(shí)施例五的一種視頻圖像的處理裝置的結(jié)構(gòu)框圖。

本實(shí)施例的視頻圖像的處理裝置包括:獲取模塊500,用于獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象;背景區(qū)域確定模塊502,用于確定視頻圖像的背景區(qū)域;繪制模塊504,用于采用計(jì)算機(jī)繪圖方式在視頻圖像的背景區(qū)域繪制業(yè)務(wù)對象。

通過本實(shí)施例提供的視頻圖像的處理裝置,獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象,確定待處理的視頻圖像的背景區(qū)域,然后采用計(jì)算機(jī)繪圖方式在視頻圖像的背景區(qū)域繪制業(yè)務(wù)對象,實(shí)現(xiàn)業(yè)務(wù)對象在視頻圖像的背景區(qū)域展示,避免業(yè)務(wù)對象遮擋前景區(qū)域,不影響觀眾的正常視頻觀看體驗(yàn),不易引起觀眾反感,可以有效實(shí)現(xiàn)預(yù)想的效果。

實(shí)施例六

參照圖6,示出了根據(jù)本發(fā)明實(shí)施例六的一種視頻圖像的處理裝置的結(jié)構(gòu)框圖。

本實(shí)施例的視頻圖像的處理裝置包括:獲取模塊600,用于獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象;背景區(qū)域確定模塊602,用于確定視頻圖像的背景區(qū)域;繪制模塊604,用于采用計(jì)算機(jī)繪圖方式在視頻圖像的背景區(qū)域繪制業(yè)務(wù)對象。

可選地,繪制模塊604包括:展示位置確定模塊6040,用于確定業(yè)務(wù)對象在視頻圖像中的展示位置;前景區(qū)域確定模塊6042,用于確定視頻圖像的前景區(qū)域;判斷模塊6044,用于根據(jù)展示位置判斷業(yè)務(wù)對象與前景區(qū)域是否存在重疊部分;展示模塊6046,用于若業(yè)務(wù)對象與前景區(qū)域存在重疊部分,則采用計(jì)算機(jī)繪圖方式,在背景區(qū)域繪制業(yè)務(wù)對象中除重疊部分之外的部分。

可選地,背景區(qū)域確定模塊602,用于通過預(yù)先訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)模型確定視頻圖像的背景區(qū)域。

可選地,本實(shí)施例的視頻圖像的處理裝置還包括:第一訓(xùn)練模塊606,用于對第一卷積神經(jīng)網(wǎng)絡(luò)模型的預(yù)先訓(xùn)練;第一訓(xùn)練模塊606包括:第一特征向量獲取模塊6060,用于獲取第一樣本圖像的第一特征向量,其中,第一樣本圖像為包含有前景標(biāo)注信息和背景標(biāo)注信息的樣本圖像;第一卷積處理模塊6062,用于對第一特征向量進(jìn)行卷積處理,獲取第一特征向量卷積結(jié)果;放大處理模塊6064,用于對第一特征向量卷積結(jié)果進(jìn)行放大處理;第一條件判斷模塊6066,用于判斷放大后的第一特征向量卷積結(jié)果是否滿足卷積收斂條件;第一執(zhí)行模塊6068,用于若放大后的第一特征向量卷積結(jié)果滿足卷積收斂條件,則完成對第一卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練;若放大后的第一特征向量卷積結(jié)果不滿足卷積收斂條件,則根據(jù)放大后的第一特征向量卷積結(jié)果調(diào)整第一卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)并根據(jù)調(diào)整后的第一卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)對第一卷積網(wǎng)絡(luò)模型進(jìn)行迭代訓(xùn)練,直至迭代訓(xùn)練后的第一特征向量卷積結(jié)果滿足卷積收斂條件。

可選地,展示位置確定模塊6040,用于按照設(shè)定規(guī)則確定業(yè)務(wù)對象在視頻圖像中的展示位置;其中,設(shè)定規(guī)則包括:預(yù)先設(shè)定的業(yè)務(wù)對象在視頻圖像的設(shè)定展示位置,或者,展示位置確定模塊6040根據(jù)前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定業(yè)務(wù)對象在視頻圖像中的展示位置。

可選地,展示位置確定模塊6040,用于根據(jù)前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),通過預(yù)先訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)模型確定業(yè)務(wù)對象在視頻圖像中的展示位置。

可選地,本實(shí)施例的視頻圖像的處理裝置還包括:第二訓(xùn)練模塊608,用于對第二卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)先訓(xùn)練;第二訓(xùn)練模塊608包括:第二特征向量獲取模塊6080,用于獲取第二樣本圖像的第一特征向量,其中,第二特征向量中包含有第二樣本圖像中的業(yè)務(wù)對象的位置信息和/或置信度信息,以及第二樣本圖像中目標(biāo)對象的目標(biāo)對象特征向量;第二卷積處理模塊6082,用于對第二特征向量進(jìn)行卷積處理,獲取第二特征向量卷積結(jié)果;第二條件判斷模塊6084,用于判斷第二特征向量卷積結(jié)果中對應(yīng)的業(yè)務(wù)對象的位置信息和/或置信度信息是否滿足業(yè)務(wù)對象收斂條件,并判斷第二特征向量卷積結(jié)果中的目標(biāo)對象特征向量是否滿足目標(biāo)對象收斂條件;第二執(zhí)行模塊6086,用于若第二特征向量卷積結(jié)果中對應(yīng)的業(yè)務(wù)對象的位置信息和/或置信度信息滿足業(yè)務(wù)對象收斂條件,且第二特征向量卷積結(jié)果中的目標(biāo)對象特征向量滿足目標(biāo)對象收斂條件,則完成對第二卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練;否則,調(diào)整第二卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)并根據(jù)調(diào)整后的第二卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)對第二卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行迭代訓(xùn)練,直至迭代訓(xùn)練后的業(yè)務(wù)對象的位置信息和/或置信度信息和目標(biāo)對象特征向量均滿足相應(yīng)的收斂條件。

可選地,展示位置確定模塊6040,用于根據(jù)前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)和業(yè)務(wù)對象的類型,確定業(yè)務(wù)對象在視頻圖像中的展示位置。

可選地,展示位置確定模塊6040包括:展示位置獲得模塊60400,用于根據(jù)前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)和業(yè)務(wù)對象的類型,獲得業(yè)務(wù)對象在視頻圖像中的多個展示位置;展示位置選擇模塊60402,用于從多個展示位置中選擇至少一個展示位置。

可選地,展示位置確定模塊6040包括:數(shù)據(jù)判斷模塊60404,用于判斷前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)與預(yù)先設(shè)定的動作數(shù)據(jù)是否匹配;位置獲取模塊60406,用于若前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)與預(yù)先設(shè)定的動作數(shù)據(jù)匹配,則從預(yù)先存儲的動作數(shù)據(jù)與展示位置的對應(yīng)關(guān)系中,獲取預(yù)先設(shè)定的動作數(shù)據(jù)對應(yīng)的目標(biāo)展示位置作為業(yè)務(wù)對象在視頻圖像中的展示位置。

可選地,業(yè)務(wù)對象包括包含有語義信息的特效;視頻圖像為直播類視頻圖像。

可選地,業(yè)務(wù)對象包括包含廣告信息的以下至少一種形式的特效:二維貼紙?zhí)匦?、三維特效、粒子特效。

可選地,直播類視頻圖像的前景區(qū)域?yàn)槿宋锼诘膮^(qū)域。

可選地,直播類視頻圖像的背景區(qū)域?yàn)槌巳宋锼诘膮^(qū)域之外的至少局部區(qū)域。

可選地,目標(biāo)對象的動作檢測數(shù)據(jù)包括以下至少之一:眨眼數(shù)據(jù)、張嘴數(shù)據(jù)、點(diǎn)頭數(shù)據(jù)、搖頭數(shù)據(jù)、親吻數(shù)據(jù)、微笑數(shù)據(jù)、揮手?jǐn)?shù)據(jù)、剪刀手?jǐn)?shù)據(jù)、握拳數(shù)據(jù)、托手?jǐn)?shù)據(jù)、大拇指數(shù)據(jù)、手槍姿勢數(shù)據(jù)、ok手?jǐn)?shù)據(jù)。

本實(shí)施例視頻圖像的處理裝置用于實(shí)現(xiàn)前述多個方法實(shí)施例中相應(yīng)的視頻圖像的處理方法,并具有相應(yīng)的方法實(shí)施例的有益效果,在此不再贅述。

此外,本實(shí)施例的視頻圖像的處理裝置可以設(shè)置于適當(dāng)?shù)慕K端設(shè)備中,包括但不限于移動終端、pc等。

實(shí)施例七

參照圖7,示出了根據(jù)本發(fā)明實(shí)施例七的一種終端設(shè)備的結(jié)構(gòu)示意圖,本發(fā)明具體實(shí)施例并不對終端設(shè)備的具體實(shí)現(xiàn)做限定。

如圖7所示,該終端設(shè)備可以包括:處理器(processor)702、通信接口(communicationsinterface)704、存儲器(memory)706、以及通信總線708。

其中:處理器702、通信接口704、以及存儲器706通過通信總線708完成相互間的通信。

通信接口704,用于與其它設(shè)備比如其它客戶端或服務(wù)器等的網(wǎng)元通信。

處理器702,用于執(zhí)行程序710,具體可以執(zhí)行上述方法實(shí)施例中的相關(guān)步驟。

具體地,程序710可以包括程序代碼,該程序代碼包括計(jì)算機(jī)操作指令。

處理器710可能是中央處理器cpu,或者是特定集成電路asic(applicationspecificintegratedcircuit),或者是被配置成實(shí)施本發(fā)明實(shí)施例的一個或多個集成電路,或者是圖形處理器gpu(graphicsprocessingunit)。終端設(shè)備包括的一個或多個處理器,可以是同一類型的處理器,如一個或多個cpu,或者,一個或多個gpu;也可以是不同類型的處理器,如一個或多個cpu以及一個或多個gpu。

存儲器706,用于存放程序710。存儲器706可能包含高速ram存儲器,也可能還包括非易失性存儲器(non-volatilememory),例如至少一個磁盤存儲器。

程序710具體可以用于使得處理器702執(zhí)行以下操作:獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象;確定視頻圖像的背景區(qū)域;采用計(jì)算機(jī)繪圖方式在視頻圖像的背景區(qū)域繪制業(yè)務(wù)對象。

在一種可選的實(shí)施方式中,程序710還用于使得處理器702在采用計(jì)算機(jī)繪圖方式在視頻圖像的背景區(qū)域繪制業(yè)務(wù)對象時,確定業(yè)務(wù)對象在視頻圖像中的展示位置和視頻圖像的前景區(qū)域;根據(jù)展示位置判斷業(yè)務(wù)對象與視頻圖像的前景區(qū)域是否存在重疊部分;若存在,則采用計(jì)算機(jī)繪圖方式,在背景區(qū)域繪制業(yè)務(wù)對象中除重疊部分之外的部分。

在一種可選的實(shí)施方式中,程序710還用于使得處理器702在確定視頻圖像的背景區(qū)域時,通過預(yù)先訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)模型確定視頻圖像的背景區(qū)域。

在一種可選的實(shí)施方式中,程序710還用于使得處理器702在對第一卷積神經(jīng)網(wǎng)絡(luò)模型的預(yù)先訓(xùn)練時,獲取第一樣本圖像的第一特征向量,其中,第一樣本圖像為包含有前景標(biāo)注信息和背景標(biāo)注信息的樣本圖像;對第一特征向量進(jìn)行卷積處理,獲取第一特征向量卷積結(jié)果;對第一特征向量卷積結(jié)果進(jìn)行放大處理;判斷放大后的第一特征向量卷積結(jié)果是否滿足卷積收斂條件;若滿足,則完成對第一卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練;若不滿足,則根據(jù)放大后的第一特征向量卷積結(jié)果調(diào)整第一卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)并根據(jù)調(diào)整后的第一卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)對第一卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行迭代訓(xùn)練,直至迭代訓(xùn)練后的第一特征向量卷積結(jié)果滿足卷積收斂條件。

在一種可選的實(shí)施方式中,程序710還用于使得處理器702在確定業(yè)務(wù)對象在視頻圖像中的展示位置時,按照設(shè)定規(guī)則確定業(yè)務(wù)對象在視頻圖像中的展示位置;其中,設(shè)定規(guī)則包括:預(yù)先設(shè)定的業(yè)務(wù)對象在視頻圖像的設(shè)定展示位置,或者,根據(jù)前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定業(yè)務(wù)對象在視頻圖像中的展示位置。

在一種可選的實(shí)施方式中,程序710還用于使得處理器702在根據(jù)前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定業(yè)務(wù)對象在視頻圖像中的展示位置時,根據(jù)前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),通過預(yù)先訓(xùn)練的、第二卷積神經(jīng)網(wǎng)絡(luò)模型確定業(yè)務(wù)對象在視頻圖像中的展示位置。

在一種可選的實(shí)施方式中,程序710還用于使得處理器702在對第二卷積神經(jīng)網(wǎng)絡(luò)模型的預(yù)先訓(xùn)練時,獲取第二樣本圖像的第一特征向量,其中,第二特征向量中包含有第二樣本圖像中的業(yè)務(wù)對象的位置信息和/或置信度信息,以及第二樣本圖像中目標(biāo)對象的目標(biāo)對象特征向量;對第二特征向量進(jìn)行卷積處理,獲取第二特征向量卷積結(jié)果;判斷第二特征向量卷積結(jié)果中對應(yīng)的業(yè)務(wù)對象的位置信息和/或置信度信息是否滿足業(yè)務(wù)對象收斂條件,并判斷第二特征向量卷積結(jié)果中的目標(biāo)對象特征向量是否滿足目標(biāo)對象收斂條件;若均滿足,則完成對第二卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練;否則,調(diào)整第二卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)并根據(jù)調(diào)整后的第二卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)對第二卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行迭代訓(xùn)練,直至迭代訓(xùn)練后的業(yè)務(wù)對象的位置信息和/或置信度信息和目標(biāo)對象特征向量均滿足相應(yīng)的收斂條件。

在一種可選的實(shí)施方式中,程序710還用于使得處理器702在根據(jù)前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定業(yè)務(wù)對象在視頻圖像中的展示位置時,根據(jù)前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)和業(yè)務(wù)對象的類型,確定業(yè)務(wù)對象在視頻圖像中的展示位置。

在一種可選的實(shí)施方式中,程序710還用于使得處理器702在根據(jù)前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)和業(yè)務(wù)對象的類型,確定業(yè)務(wù)對象在視頻圖像中的展示位置時,根據(jù)前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)和業(yè)務(wù)對象的類型,獲得業(yè)務(wù)對象在視頻圖像中的多個展示位置;從多個展示位置中選擇至少一個展示位置。

在一種可選的實(shí)施方式中,程序710還用于使得處理器702在根據(jù)前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定業(yè)務(wù)對象在視頻圖像中的展示位置時,判斷前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)與預(yù)先設(shè)定的動作數(shù)據(jù)是否匹配;若匹配,則從預(yù)先存儲的動作數(shù)據(jù)與展示位置的對應(yīng)關(guān)系中,獲取預(yù)先設(shè)定的動作數(shù)據(jù)對應(yīng)的目標(biāo)展示位置作為業(yè)務(wù)對象在視頻圖像中的展示位置。

在一種可選的實(shí)施方式中,業(yè)務(wù)對象包括包含有語義信息的特效;視頻圖像為直播類視頻圖像。

在一種可選的實(shí)施方式中,業(yè)務(wù)對象包括包含廣告信息的以下至少一種形式的特效:二維貼紙?zhí)匦?、三維特效、粒子特效。

在一種可選的實(shí)施方式中,直播類視頻圖像的前景區(qū)域?yàn)槿宋锼诘膮^(qū)域。

在一種可選的實(shí)施方式中,直播類視頻圖像的背景區(qū)域?yàn)槌巳宋锼诘膮^(qū)域之外的至少局部區(qū)域。

在一種可選的實(shí)施方式中,目標(biāo)對象的動作檢測數(shù)據(jù)包括以下至少之一:眨眼數(shù)據(jù)、張嘴數(shù)據(jù)、點(diǎn)頭數(shù)據(jù)、搖頭數(shù)據(jù)、親吻數(shù)據(jù)、微笑數(shù)據(jù)、揮手?jǐn)?shù)據(jù)、剪刀手?jǐn)?shù)據(jù)、握拳數(shù)據(jù)、托手?jǐn)?shù)據(jù)、大拇指數(shù)據(jù)、手槍姿勢數(shù)據(jù)、ok手?jǐn)?shù)據(jù)。

程序710中各步驟的具體實(shí)現(xiàn)可以參見上述實(shí)施例中的相應(yīng)步驟和單元中對應(yīng)的描述,在此不贅述。所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的設(shè)備和模塊的具體工作過程,可以參考前述方法實(shí)施例中的對應(yīng)過程描述,在此不再贅述。

通過本實(shí)施例提供的終端設(shè)備,獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象,確定待處理的視頻圖像的前景區(qū)域和背景區(qū)域,以及業(yè)務(wù)對象在視頻圖像中的展示位置,然后根據(jù)業(yè)務(wù)對象在視頻圖像中的展示位置判斷業(yè)務(wù)對象與視頻圖像的前景區(qū)域是否存在重疊部分,若存在重疊部分,表示業(yè)務(wù)對象的展示位置的全部位置或者部分位置位于前景區(qū)域內(nèi),則將前景區(qū)域置于業(yè)務(wù)對象之上展示,避免業(yè)務(wù)對象遮擋前景區(qū)域,不影響觀眾的正常視頻觀看體驗(yàn),不易引起觀眾反感,可以有效實(shí)現(xiàn)預(yù)想的效果。

需要指出,根據(jù)實(shí)施的需要,可將本發(fā)明實(shí)施例中描述的各個部件/步驟拆分為更多部件/步驟,也可將兩個或多個部件/步驟或者部件/步驟的部分操作組合成新的部件/步驟,以實(shí)現(xiàn)本發(fā)明實(shí)施例的目的。

上述根據(jù)本發(fā)明實(shí)施例的方法可在硬件、固件中實(shí)現(xiàn),或者被實(shí)現(xiàn)為可存儲在記錄介質(zhì)(諸如cdrom、ram、軟盤、硬盤或磁光盤)中的軟件或計(jì)算機(jī)代碼,或者被實(shí)現(xiàn)通過網(wǎng)絡(luò)下載的原始存儲在遠(yuǎn)程記錄介質(zhì)或非暫時機(jī)器可讀介質(zhì)中并將被存儲在本地記錄介質(zhì)中的計(jì)算機(jī)代碼,從而在此描述的方法可被存儲在使用通用計(jì)算機(jī)、專用處理器或者可編程或?qū)S糜布?諸如asic或fpga)的記錄介質(zhì)上的這樣的軟件處理??梢岳斫?,計(jì)算機(jī)、處理器、微處理器控制器或可編程硬件包括可存儲或接收軟件或計(jì)算機(jī)代碼的存儲組件(例如,ram、rom、閃存等),當(dāng)所述軟件或計(jì)算機(jī)代碼被計(jì)算機(jī)、處理器或硬件訪問且執(zhí)行時,實(shí)現(xiàn)在此描述的處理方法。此外,當(dāng)通用計(jì)算機(jī)訪問用于實(shí)現(xiàn)在此示出的處理的代碼時,代碼的執(zhí)行將通用計(jì)算機(jī)轉(zhuǎn)換為用于執(zhí)行在此示出的處理的專用計(jì)算機(jī)。

本領(lǐng)域普通技術(shù)人員可以意識到,結(jié)合本文中所公開的實(shí)施例描述的各示例的單元及方法步驟,能夠以電子硬件、或者計(jì)算機(jī)軟件和電子硬件的結(jié)合來實(shí)現(xiàn)。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對每個特定的應(yīng)用來使用不同方法來實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明實(shí)施例的范圍。

以上實(shí)施方式僅用于說明本發(fā)明實(shí)施例,而并非對本發(fā)明實(shí)施例的限制,有關(guān)技術(shù)領(lǐng)域的普通技術(shù)人員,在不脫離本發(fā)明實(shí)施例的精神和范圍的情況下,還可以做出各種變化和變型,因此所有等同的技術(shù)方案也屬于本發(fā)明實(shí)施例的范疇,本發(fā)明實(shí)施例的專利保護(hù)范圍應(yīng)由權(quán)利要求限定。

本發(fā)明實(shí)施例提供了a1、一種視頻圖像的處理方法,包括:

獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象;

確定所述視頻圖像的背景區(qū)域;

采用計(jì)算機(jī)繪圖方式在所述視頻圖像的背景區(qū)域繪制所述業(yè)務(wù)對象。

a2、根據(jù)a1所述的方法,其中,所述采用計(jì)算機(jī)繪圖方式在所述視頻圖像的背景區(qū)域繪制所述業(yè)務(wù)對象包括:

確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置和所述視頻圖像的前景區(qū)域;

根據(jù)所述展示位置判斷所述業(yè)務(wù)對象與所述視頻圖像的前景區(qū)域是否存在重疊部分;

若存在,則采用計(jì)算機(jī)繪圖方式,在所述背景區(qū)域繪制所述業(yè)務(wù)對象中除所述重疊部分之外的部分。

a3、根據(jù)a1或a2所述的方法,其中,所述確定所述視頻圖像的背景區(qū)域包括:

通過預(yù)先訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)模型確定所述視頻圖像的背景區(qū)域。

a4、根據(jù)a3所述的方法,其中,所述對所述第一卷積神經(jīng)網(wǎng)絡(luò)模型的預(yù)先訓(xùn)練包括:

獲取第一樣本圖像的第一特征向量,其中,所述第一樣本圖像為包含有前景標(biāo)注信息和背景標(biāo)注信息的樣本圖像;

對所述第一特征向量進(jìn)行卷積處理,獲取第一特征向量卷積結(jié)果;

對所述第一特征向量卷積結(jié)果進(jìn)行放大處理;

判斷放大后的所述第一特征向量卷積結(jié)果是否滿足卷積收斂條件;

若滿足,則完成對所述第一卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練;

若不滿足,則根據(jù)放大后的所述第一特征向量卷積結(jié)果調(diào)整所述第一卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)并根據(jù)調(diào)整后的所述第一卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)對所述第一卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行迭代訓(xùn)練,直至迭代訓(xùn)練后的所述第一特征向量卷積結(jié)果滿足所述卷積收斂條件。

a5、根據(jù)a2-a4任一所述的方法,其中,所述確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置包括:

按照設(shè)定規(guī)則確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置;

其中,所述設(shè)定規(guī)則包括:預(yù)先設(shè)定的所述業(yè)務(wù)對象在所述視頻圖像的設(shè)定展示位置,或者,根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置。

a6、根據(jù)a5所述的方法,其中,所述根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置包括:

根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),通過預(yù)先訓(xùn)練的、第二卷積神經(jīng)網(wǎng)絡(luò)模型確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置。

a7、根據(jù)a6所述的方法,其中,所述對所述第二卷積神經(jīng)網(wǎng)絡(luò)模型的預(yù)先訓(xùn)練包括:

獲取第二樣本圖像的第一特征向量,其中,所述第二特征向量中包含有所述第二樣本圖像中的業(yè)務(wù)對象的位置信息和/或置信度信息,以及所述第二樣本圖像中目標(biāo)對象的目標(biāo)對象特征向量;

對所述第二特征向量進(jìn)行卷積處理,獲取第二特征向量卷積結(jié)果;

判斷所述第二特征向量卷積結(jié)果中對應(yīng)的業(yè)務(wù)對象的位置信息和/或置信度信息是否滿足業(yè)務(wù)對象收斂條件,并判斷所述第二特征向量卷積結(jié)果中的目標(biāo)對象特征向量是否滿足目標(biāo)對象收斂條件;

若均滿足,則完成對所述第二卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練;

否則,調(diào)整所述第二卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)并根據(jù)調(diào)整后的所述第二卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)對所述第二卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行迭代訓(xùn)練,直至迭代訓(xùn)練后的業(yè)務(wù)對象的位置信息和/或置信度信息和目標(biāo)對象特征向量均滿足相應(yīng)的收斂條件。

a8、根據(jù)a5所述的方法,其中,所述根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置包括:

根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)和所述業(yè)務(wù)對象的類型,確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置。

a9、根據(jù)a8所述的方法,其中,所述根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)和所述業(yè)務(wù)對象的類型,確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置包括:

根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)和所述業(yè)務(wù)對象的類型,獲得所述業(yè)務(wù)對象在所述視頻圖像中的多個展示位置;

從所述多個展示位置中選擇至少一個展示位置。

a10、根據(jù)a5所述的方法,其中,所述根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置包括:

判斷所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)與預(yù)先設(shè)定的動作數(shù)據(jù)是否匹配;

若匹配,則從預(yù)先存儲的動作數(shù)據(jù)與展示位置的對應(yīng)關(guān)系中,獲取所述預(yù)先設(shè)定的動作數(shù)據(jù)對應(yīng)的目標(biāo)展示位置作為所述業(yè)務(wù)對象在所述視頻圖像中的展示位置。

a11、根據(jù)a1-a10任一所述的方法,其中,所述業(yè)務(wù)對象包括包含有語義信息的特效;所述視頻圖像為直播類視頻圖像。

a12、根據(jù)a11所述的方法,其中,所述業(yè)務(wù)對象包括包含廣告信息的以下至少一種形式的特效:二維貼紙?zhí)匦А⑷S特效、粒子特效。

a13、根據(jù)a12所述的方法,其中,所述直播類視頻圖像的前景區(qū)域?yàn)槿宋锼诘膮^(qū)域。

a14、根據(jù)a11-a13任一所述的方法,其中,所述直播類視頻圖像的背景區(qū)域?yàn)槌巳宋锼诘膮^(qū)域之外的至少局部區(qū)域。

a15、根據(jù)a5-a14任一所述的方法,其中,所述目標(biāo)對象的動作檢測數(shù)據(jù)包括以下至少之一:眨眼數(shù)據(jù)、張嘴數(shù)據(jù)、點(diǎn)頭數(shù)據(jù)、搖頭數(shù)據(jù)、親吻數(shù)據(jù)、微笑數(shù)據(jù)、揮手?jǐn)?shù)據(jù)、剪刀手?jǐn)?shù)據(jù)、握拳數(shù)據(jù)、托手?jǐn)?shù)據(jù)、大拇指數(shù)據(jù)、手槍姿勢數(shù)據(jù)、ok手?jǐn)?shù)據(jù)。

本發(fā)明實(shí)施例還提供了b16、一種視頻圖像的處理裝置,包括:

獲取模塊,用于獲取待處理的視頻圖像和待展示的業(yè)務(wù)對象;

背景區(qū)域確定模塊,用于確定所述視頻圖像的背景區(qū)域;

繪制模塊,用于采用計(jì)算機(jī)繪圖方式在所述視頻圖像的背景區(qū)域繪制所述業(yè)務(wù)對象。

b17、根據(jù)b16所述的裝置,其中,所述繪制模塊包括:

展示位置確定模塊,用于確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置;

前景區(qū)域確定模塊,用于確定所述視頻圖像的前景區(qū)域;

判斷模塊,用于根據(jù)所述展示位置判斷所述業(yè)務(wù)對象與所述前景區(qū)域是否存在重疊部分;

展示模塊,用于若所述業(yè)務(wù)對象與所述前景區(qū)域存在重疊部分,則采用計(jì)算機(jī)繪圖方式,在所述背景區(qū)域繪制所述業(yè)務(wù)對象中除所述重疊部分之外的部分。

b18、根據(jù)b16或b17所述的裝置,其中,所述背景區(qū)域確定模塊,用于通過預(yù)先訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)模型確定所述視頻圖像的背景區(qū)域。

b19、根據(jù)b18所述的裝置,其中,所述裝置還包括:第一訓(xùn)練模塊,用于對所述第一卷積神經(jīng)網(wǎng)絡(luò)模型的預(yù)先訓(xùn)練;

所述第一訓(xùn)練模塊包括:

第一特征向量獲取模塊,用于獲取第一樣本圖像的第一特征向量,其中,所述第一樣本圖像為包含有前景標(biāo)注信息和背景標(biāo)注信息的樣本圖像;

第一卷積處理模塊,用于對所述第一特征向量進(jìn)行卷積處理,獲取第一特征向量卷積結(jié)果;

放大處理模塊,用于對所述第一特征向量卷積結(jié)果進(jìn)行放大處理;

第一條件判斷模塊,用于判斷放大后的所述第一特征向量卷積結(jié)果是否滿足卷積收斂條件;

第一執(zhí)行模塊,用于若放大后的所述第一特征向量卷積結(jié)果滿足卷積收斂條件,則完成對所述第一卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練;若放大后的所述第一特征向量卷積結(jié)果不滿足卷積收斂條件,則根據(jù)放大后的所述第一特征向量卷積結(jié)果調(diào)整所述第一卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)并根據(jù)調(diào)整后的所述第一卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)對所述第一卷積網(wǎng)絡(luò)模型進(jìn)行迭代訓(xùn)練,直至迭代訓(xùn)練后的所述第一特征向量卷積結(jié)果滿足所述卷積收斂條件。

b20、根據(jù)b17-b19任一所述的裝置,其中,所述展示位置確定模塊,用于按照設(shè)定規(guī)則確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置;

其中,所述設(shè)定規(guī)則包括:預(yù)先設(shè)定的所述業(yè)務(wù)對象在所述視頻圖像的設(shè)定展示位置,或者,所述展示位置確定模塊根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置。

b21、根據(jù)b20所述的裝置,其中,所述展示位置確定模塊,用于根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù),通過預(yù)先訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)模型確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置。

b22、根據(jù)b21所述的裝置,其中,所述裝置還包括:

第二訓(xùn)練模塊,用于對所述第二卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)先訓(xùn)練;

所述第二訓(xùn)練模塊包括:

第二特征向量獲取模塊,用于獲取第二樣本圖像的第一特征向量,其中,所述第二特征向量中包含有所述第二樣本圖像中的業(yè)務(wù)對象的位置信息和/或置信度信息,以及所述第二樣本圖像中目標(biāo)對象的目標(biāo)對象特征向量;

第二卷積處理模塊,用于對所述第二特征向量進(jìn)行卷積處理,獲取第二特征向量卷積結(jié)果;

第二條件判斷模塊,用于判斷所述第二特征向量卷積結(jié)果中對應(yīng)的業(yè)務(wù)對象的位置信息和/或置信度信息是否滿足業(yè)務(wù)對象收斂條件,并判斷所述第二特征向量卷積結(jié)果中的目標(biāo)對象特征向量是否滿足目標(biāo)對象收斂條件;

第二執(zhí)行模塊,用于若所述第二特征向量卷積結(jié)果中對應(yīng)的業(yè)務(wù)對象的位置信息和/或置信度信息滿足業(yè)務(wù)對象收斂條件,且所述第二特征向量卷積結(jié)果中的目標(biāo)對象特征向量滿足目標(biāo)對象收斂條件,則完成對所述第二卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練;否則,調(diào)整所述第二卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)并根據(jù)調(diào)整后的所述第二卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)對所述第二卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行迭代訓(xùn)練,直至迭代訓(xùn)練后的業(yè)務(wù)對象的位置信息和/或置信度信息和目標(biāo)對象特征向量均滿足相應(yīng)的收斂條件。

b23、根據(jù)b20所述的裝置,其中,所述展示位置確定模塊,用于根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)和所述業(yè)務(wù)對象的類型,確定所述業(yè)務(wù)對象在所述視頻圖像中的展示位置。

b24、根據(jù)b23所述的裝置,其中,所述展示位置確定模塊包括:

展示位置獲得模塊,用于根據(jù)所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)和所述業(yè)務(wù)對象的類型,獲得所述業(yè)務(wù)對象在所述視頻圖像中的多個展示位置;

展示位置選擇模塊,用于從所述多個展示位置中選擇至少一個展示位置。

b25、根據(jù)b20所述的裝置,其中,所述展示位置確定模塊包括:

數(shù)據(jù)判斷模塊,用于判斷所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)與預(yù)先設(shè)定的動作數(shù)據(jù)是否匹配;

位置獲取模塊,用于若所述前景區(qū)域中的目標(biāo)對象的動作檢測數(shù)據(jù)與預(yù)先設(shè)定的動作數(shù)據(jù)匹配,則從預(yù)先存儲的動作數(shù)據(jù)與展示位置的對應(yīng)關(guān)系中,獲取所述預(yù)先設(shè)定的動作數(shù)據(jù)對應(yīng)的目標(biāo)展示位置作為所述業(yè)務(wù)對象在所述視頻圖像中的展示位置。

b26、根據(jù)b16-b25任一所述的裝置,其中,所述業(yè)務(wù)對象包括包含有語義信息的特效;所述視頻圖像為直播類視頻圖像。

b27、根據(jù)b26所述的裝置,其中,所述業(yè)務(wù)對象包括包含廣告信息的以下至少一種形式的特效:二維貼紙?zhí)匦А⑷S特效、粒子特效。

b28、根據(jù)b27所述的裝置,其中,所述直播類視頻圖像的前景區(qū)域?yàn)槿宋锼诘膮^(qū)域。

b29、根據(jù)b26-b28任一所述的裝置,其中,所述直播類視頻圖像的背景區(qū)域?yàn)槌巳宋锼诘膮^(qū)域之外的至少局部區(qū)域。

b30、根據(jù)b20-b29任一所述的裝置,其中,所述目標(biāo)對象的動作檢測數(shù)據(jù)包括以下至少之一:眨眼數(shù)據(jù)、張嘴數(shù)據(jù)、點(diǎn)頭數(shù)據(jù)、搖頭數(shù)據(jù)、親吻數(shù)據(jù)、微笑數(shù)據(jù)、揮手?jǐn)?shù)據(jù)、剪刀手?jǐn)?shù)據(jù)、握拳數(shù)據(jù)、托手?jǐn)?shù)據(jù)、大拇指數(shù)據(jù)、手槍姿勢數(shù)據(jù)、ok手?jǐn)?shù)據(jù)。

本發(fā)明實(shí)施例還提供了c31、一種終端設(shè)備,包括:處理器、存儲器、通信接口和通信總線,所述處理器、所述存儲器和所述通信接口通過所述通信總線完成相互間的通信;

所述存儲器用于存放至少一可執(zhí)行指令,所述可執(zhí)行指令使所述處理器執(zhí)行如a1-a15任一所述的視頻圖像的處理方法對應(yīng)的操作。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
治多县| 浏阳市| 兴海县| 平武县| 台南市| 桦南县| 南漳县| 连州市| 庆安县| 巴中市| 玉山县| 邵阳县| 涿鹿县| 无棣县| 大安市| 岑溪市| 若尔盖县| 泰州市| 于田县| 南丹县| 巴南区| 甘谷县| 灵武市| 白银市| 孟连| 克东县| 珠海市| 宝山区| 呈贡县| 磐安县| 巴楚县| 柏乡县| 福贡县| 昔阳县| 泌阳县| 万源市| 仁化县| 陵水| 仙桃市| 平安县| 临沂市|