欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

視頻識別方法以及裝置與流程

文檔序號:12127469閱讀:366來源:國知局
視頻識別方法以及裝置與流程

本發(fā)明實施例涉及視頻處理技術領域,具體地,涉及一種視頻識別方法以及一種視頻識別裝置。



背景技術:

隨著三維全景的技術的不斷發(fā)展,全景視頻被越來越多的應用,全景視頻的每一視頻幀都是一個360度的全景,給人身臨其境的感覺。但是本申請發(fā)明人在實現(xiàn)本發(fā)明的過程中發(fā)現(xiàn):全景視頻的視頻源,例如球模型的全景視頻,是經(jīng)過坐標轉換映射成的2:1比例視頻,視頻內容已經(jīng)發(fā)生扭曲,因此,存在難以對全景視頻中的目標對象進行檢測識別或者識別不準確的問題。



技術實現(xiàn)要素:

針對全景視頻的視頻幀中的目標對象識別難以進行或識別不準確的技術問題,本發(fā)明實施例提供一種視頻識別方法,該方法包括:獲取全景視頻,將所述全景視頻的三維視頻幀轉換為目標二維視頻幀;對所述目標二維視頻幀進行目標對象識別和標記,生成標記后的目標二維視頻幀;將所述標記后的目標二維視頻幀轉換為標記后的目標三維視頻幀,其中所述標記后的目標三維視頻幀中標記有所述目標對象。

可選的,所述全景視頻為球模型三維全景視頻,所述將所述全景視頻的三維視頻幀轉換為目標二維視頻幀包括:將所述球模型三維全景視頻的三維視頻幀轉換為具有第一預設形狀的第一二維視頻幀;將所述第一二維視頻幀按照第一預設規(guī)則切割成多個第二二維視頻幀,將所述多個第二二維視頻幀拼接成具有第二預設形狀的目標二維視頻幀,其中,所述第一預設形狀與所述第二預設形狀相匹配。

可選的,所述對所述目標二維視頻幀進行目標對象識別和標記,生成標記后的目標二維視頻幀包括:識別所述目標二維視頻幀中的目標對象;獲取所識別的目標對象的位置;以及根據(jù)所述目標對象的位置,利用幾何區(qū)域標記所述目標對象,以生成標記后的目標二維視頻幀。

可選的,所述將所述標記后的目標二維視頻幀轉換為標記后的目標三維視頻幀包括:獲取所述標記后的目標二維視頻幀的中所述幾何區(qū)域的坐標;將包括有所述幾何區(qū)域的坐標的所述標記后的目標二維視頻幀根據(jù)預定映射關系轉換為多個標記后的第二二維視頻幀;將所述多個標記后的第二二維視頻幀按照第二預設規(guī)則組合為標記后的第一二維視頻幀,其中所述第二預設規(guī)則與所述第一預設規(guī)則相匹配;將所述標記后的第一二維視頻幀的坐標轉換為球模型坐標,生成標記后的目標三維視頻幀。

可選的,該方法還包括:將所述標記后的目標三維視頻幀進行組合,形成標記后的全景視頻。

此外,本發(fā)明實施例還提供了一種視頻識別裝置,該裝置包括:獲取模塊,用于獲取全景視頻;轉換模塊,用于將所述全景視頻的三維視頻幀轉換為目標二維視頻幀;識別和標記模塊,用于對所述目標二維視頻幀進行目標對象識別和標記生成標記后的目標二維視頻幀;以及逆轉換模塊,用于將所述標記后的目標二維視頻幀轉換為標記后的目標三維視頻幀,其中所述標記后的目標三維視頻幀中標記有所述目標對象。

可選的,所述全景視頻為球模型三維全景視頻,所述轉換模塊用于:將所述球模型三維全景視頻的三維視頻幀轉換為具有第一預設形狀的第一二維視頻幀;將所述第一二維視頻幀按照第一預設規(guī)則切割成多個第二二維視頻幀,將所述多個第二二維視頻幀拼接成具有第二預設形狀的目標二維視頻幀,其中,所述第一預設形狀與所述第二預設形狀相匹配。

可選的,所述識別和標記模塊用于:識別所述目標二維視頻幀中的目標對象;獲取所識別的目標對象的位置;以及根據(jù)所述目標對象的位置,利用幾何區(qū)域標記所述目標對象,生成標記后的目標二維視頻幀。

可選的,所述逆轉換模塊用于:獲取所述標記后的目標二維視頻幀的中所述幾何區(qū)域的坐標;將包括有所述幾何區(qū)域的坐標的所述標記后的目標二維視頻幀根據(jù)預定映射關系轉換為多個標記后的第二二維視頻幀;將所述多個標記后的第二二維視頻幀按照第二預設規(guī)則組合為標記后的第一二維視頻幀,其中所述第二預設規(guī)則與所述第一預設規(guī)則相匹配;將所述標記后的第一二維視頻幀的坐標轉換為球模型坐標,生成標記后的目標三維視頻幀。

可選的,該裝置還包括:顯示模塊,用于將所述標記后的目標三維視頻幀進行組合形成標記后的全景視頻。

通過上述技術方案,將獲取的全景視頻轉換為目標二維視頻幀,之后對所述目標二維視頻幀進行目標對象識別并對所識別的目標對象進行標記,最終將標記有目標對象的標記后的目標二維視頻幀轉換為標記后的三維視頻幀,能夠實現(xiàn)精確地、有效地、方便地識別全景視頻幀中的目標對象,避免了因全景視頻幀中視頻圖像的扭曲而造成的難以識別其中目標對象或者識別結果不準確的情況的發(fā)生,為全景視頻的廣泛應用提供了技術基礎。

本發(fā)明實施例的其它特征和優(yōu)點將在隨后的具體實施方式部分予以詳細說明。

附圖說明

附圖是用來提供對本發(fā)明實施例的進一步理解,并且構成說明書的一部分,與下面的具體實施方式一起用于解釋本發(fā)明實施例,但并不構成對本發(fā)明實施例的限制。在附圖中:

圖1是根據(jù)本發(fā)明實施例的一種實施例的視頻識別方法的示例流程圖;

圖2是根據(jù)本發(fā)明實施例的一種實施例的視頻識別方法進行視頻識別過程的示意圖;

圖3是根據(jù)本發(fā)明實施例的一種實施例的視頻識別方法進行視頻識別過程的示意圖;

圖4A-4B是根據(jù)本發(fā)明實施例的一種實施例的視頻識別方法進行視頻識別過程的示意圖;

圖5是根據(jù)本發(fā)明實施例的一種實施例的視頻識別方法進行視頻識別過程的示意圖;

圖6是根據(jù)本發(fā)明實施例的一種實施例的視頻識別方法進行視頻識別過程的示意圖;

圖7是根據(jù)本發(fā)明實施例的一種實施例的視頻識別裝置的結構示意圖;以及

圖8是根據(jù)本發(fā)明實施例的一種實施例的視頻識別裝置的結構示意圖;

具體實施方式

以下結合附圖對本發(fā)明實施例的具體實施方式進行詳細說明。應當理解的是,此處所描述的具體實施方式僅用于說明和解釋本發(fā)明實施例,并不用于限制本發(fā)明實施例。

為了實現(xiàn)對全景視頻的三維視頻幀中的目標對象進行精確地、有效地、方便地識別,本發(fā)明實施例考慮了多種實施例,下面將一一進行詳細地說明:

實施例1

圖1是根據(jù)本發(fā)明實施例的一種實施例的視頻識別方法的示例流程圖,如圖1所示,該方法可以包括以下步驟:

步驟S11,獲取全景視頻,例如可以從視頻庫中獲取待識別的視頻源或者從終端預先存儲的視頻中獲取全景視頻源,例如車輛在公路上行駛的全景視頻。

步驟S12,將所述全景視頻的三維視頻幀轉換為目標二維視頻幀。

步驟S13,對所述目標二維視頻幀進行目標對象識別和標記,生成標記后的目標二維視頻幀。例如,對于車輛在公路上行駛的全景視頻,可以將其中的車輛設定為目標對象,并且,可以使用深度學習的工具(諸如faster-rcnn、yolo等)對全景視頻中的目標對象(例如車輛)進行識別并標記,生成標記后的目標二維視頻幀,以為后續(xù)視頻轉換提供基礎。

步驟S14,將所述標記后的目標二維視頻幀轉換為標記后的目標三維視頻幀,其中所述標記后的目標三維視頻幀中標記有所述目標對象。例如對于上述車輛在公路上行駛的示例,標記后的目標二維視頻幀中包括對于車輛的標記(例如幾何形狀區(qū)域框、車輛邊緣提取線等),將包括該標記的標記后的目標二維視頻幀轉換為標記后的目標三維視頻幀,即將具有標記的二維視頻幀轉換到三維空間,以在全景視頻中顯示出該標記后的目標對象,以為后續(xù)的功能(例如車輛位置檢測等操作)提供數(shù)據(jù)基礎。

采用本實施例,將獲取的全景視頻轉換為目標二維視頻幀,之后對所述目標二維視頻幀進行目標對象識別并對所識別的目標對象進行標記,最終將標記有目標對象的標記后的目標二維視頻幀轉換為標記后的三維視頻幀,能夠實現(xiàn)精確地、有效地、方便地識別全景視頻幀中的目標對象,避免了因全景視頻幀中視頻圖像的扭曲而造成的難以識別其中目標對象或者識別結果不準確的情況的發(fā)生,為全景視頻的廣泛應用提供了技術基礎。

實施例2

圖2-6是根據(jù)本發(fā)明實施例的一種實施例的視頻識別方法進行視頻識別過程的示意圖。如圖2所示,在實施例2中,以球模型三維全景視頻為例來說明對全景視頻的示例識別過程:

首先,在步驟S11,獲取全景視頻,所述全景視頻為球模型三維全景視頻,例如車輛在公路上行駛的球模型三維全景視頻幀a,如圖2所示。

之后,在步驟S12,如圖3所示,將所述全景視頻的三維視頻幀轉換為目標二維視頻幀可以包括:

步驟S121,將所述球模型三維全景視頻的三維視頻幀轉換為具有第一預設形狀的第一二維視頻幀,所述第一預設形狀可以為任何適當?shù)男螤?,例如立方體,所述第一二維視頻幀可以為立方體貼圖,即將所述球模型的三維視頻幀轉換為立方體貼圖,即執(zhí)行過程1001;

步驟S122,將所述第一二維視頻幀按照第一預設規(guī)則切割成多個第二二維視頻幀,例如所述第一預設規(guī)則為將所述立方體貼圖的每個面的二維紋理圖像映射為6宮格視頻幀,其中所述立方體貼圖的每個面(即立方體的上面、下面、左面、右面、前面、后面,6個面)的二維紋理圖像分別對應所述6宮格視頻幀中的每個宮格(對應圖4A的數(shù)字標號3、4、2、1、5、6),根據(jù)上述第一預設規(guī)則可以將立方體貼圖切割成多個第二二維視頻幀,如圖2中的視頻幀b所示,其中多個第二二維視頻幀可以對應圖4A的數(shù)字標號3、4、2、1、5、6,即執(zhí)行過程1002;其中過程1001-1002可以借助一些視頻處理的開源工具實現(xiàn),例如,使用facebook等開源工具完成。

步驟S123,將所述多個第二二維視頻幀拼接成具有第二預設形狀的目標二維視頻幀,其中,所述第一預設形狀與所述第二預設形狀相匹配,例如當所述第一預設形狀為立方體時,所述第二預設形狀可以為十字形,該十字形可以是將立方體的6個面按照幾何分解而得到的十字形圖像。具體地,可以將所述6宮格視頻幀映射為十字形的目標二維視頻幀,例如,如圖2中的視頻幀c所示,即執(zhí)行過程1003。

舉例來說,圖4A-4B是根據(jù)本發(fā)明實施例的一種實施例的視頻識別方法進行視頻識別過程的示意圖,其中示出了將6宮格視頻幀b映射為十字形視頻幀c的一種示例。

具體來說,首先將對6宮格視頻幀b進行按照3x2的劃分,計算出每個小正方形的位置;之后,使用opencv等圖像處理工具,根據(jù)坐標裁剪出6個矩形塊,即圖4A中的1、2、3、4、5、6矩形塊分別對應著立方體貼圖的右面、左面、上面、下面、前面、后面;接著,將六個矩形塊1、2、3、4、5、6重新拼接,拼接成由立方體展開而得到的按4x3進行分割的十字形視頻幀,如圖4B所示。最后,記錄使用圖4A中的數(shù)字標號記錄6宮格圖像與圖4B中十字形圖像中各塊的預定映射關系:

PLANE_43_TO_32_MAP[]={-1,3,-1,-1,2,5,1,6,-1,4,-1,-1}(-1代表無效位置),其中PLANE_43_TO_32_MAP表示映射數(shù)組,數(shù)組標表示其在十字形中的數(shù)字,相應的值為其在6宮格圖像中所在矩形塊的數(shù)字,通過該映射數(shù)組,就可以計算十字形圖像中的任何有效位置(非黑色區(qū)域,黑色區(qū)域為無效區(qū)域)在六宮格圖像中相匹配的坐標,該逆映射過程將在下述逆轉換過程中使用。

接著,在步驟S13,如圖5所示,對所述目標二維視頻幀進行目標對象識別和標記生成標記后的目標二維視頻幀可以包括:

步驟S131,識別所述目標二維視頻幀中的目標對象,例如,使用深度學習的工具(諸如faster-rcnn、yolo等)對視頻幀c中的目標對象(例如車輛car)進行識別。

步驟S132,獲取所識別的目標對象的位置;以及根據(jù)所述目標對象的位置,利用幾何區(qū)域標記所述目標對象,以生成標記后的目標二維視頻幀。例如。可以使用矩形框等的幾何區(qū)域標記所識別的目標對象車輛car,例如,如圖2所示,視頻幀d中使用矩形框標記出了在場景中車輛car的位置,即執(zhí)行過程1004,或者也可以直接高亮描繪車輛的輪廓線。

接著,在步驟S14,如圖6所示,將所述標記后的目標二維視頻幀轉換為標記后的目標三維視頻幀可以包括:

步驟141,獲取所述標記后的目標二維視頻幀的中所述幾何區(qū)域的坐標,例如對于視頻幀d中的矩形框,可以使用(x,y)的形式來表示該矩形框的四個頂點的坐標,根據(jù)該四個頂點的坐標即可以繪制出該矩形框。

步驟S142,將包括有所述幾何區(qū)域的坐標的所述標記后的目標二維視頻幀根據(jù)預定映射關系轉換為多個標記后的第二二維視頻幀,例如根據(jù)過程1003中設置好的預定映射關系(即上述映射數(shù)組),可以將矩形框的四個頂點的坐標映射到6宮格視頻幀,即執(zhí)行過程1005,將具有矩形框的十字形視頻幀映射到6宮格視頻幀上,即執(zhí)行逆映射過程。

步驟S143,將多個標記后的第二二維視頻幀按照第二預設規(guī)則組合為標記后的第一二維視頻幀,其中所述第二預設規(guī)則與所述第一預設規(guī)則相匹配,例如,所述第二預設規(guī)則為將6宮格視頻幀映射為所述立方體貼圖的每個面的二維紋理圖像,其中所述6宮格視頻幀中的每個宮格(對應圖4A的數(shù)字標號3、4、2、1、5、6)分別對應所述立方體貼圖的每個面(即立方體的上面、下面、左面、右面、前面、后面,6個面)的二維紋理圖像,即執(zhí)行過程1006。

步驟S144將所述標記后的第一二維視頻幀的坐標轉換為球模型坐標,以生成標記后的目標三維視頻幀。例如,將所述標記后的立方體貼圖轉換為標記后的球模型的三維視頻幀,具體地,根據(jù)立方體貼圖上的坐標,計算出極坐標α和β,α、β可以分別除以360度和180度,按比例找出在球模型上對應的坐標(在2:1視頻中的像素點),如圖2中的視頻幀e所示,即執(zhí)行過程1007,其中,如圖2所示,視頻幀e在梯形區(qū)域中標記出了在該全景場景中車輛car的位置,實現(xiàn)了本發(fā)明實施例的目的。其中步驟1006-1007可以借助一些視頻處理的開源工具實現(xiàn),例如,使用facebook等開源工具完成。

最后,將通過上述過程1001-1007標記后的目標三維視頻幀進行組合,形成標記后的全景視頻。

可選地,作為本實施例的一種可選實施方式,所述方法還包括:將所述標記后的目標三維視頻幀進行組合以形成標記后的全景視頻,以及顯示所述標記后的全景視頻,例如將如圖2中所示的視頻幀e與其他標記后的視頻幀f\h\i等任意數(shù)量的視頻幀進行組合,以形成標記后的全景視頻,以及最終顯示所述標記后的全景視頻。

相匹配采用本實施例,能夠實現(xiàn)在全景視頻幀中精確地、有效地、方便地識別出目標對象,避免了因全景視頻幀中視頻圖像的扭曲而造成的難以識別其中目標對象或者識別結果不準確的情況的發(fā)生,為全景視頻的廣泛應用提供了技術基礎。

實施例3

圖7是根據(jù)本發(fā)明實施例的一種實施例的視頻識別裝置100的結構示意圖,如圖7所示,該裝置可以包括:獲取模塊10,用于獲取全景視頻,例如可以從視頻庫中獲取待識別的視頻源或者從終端預先存儲的視頻中獲取全景視頻源,例如車輛在公路上行駛的全景視頻;轉換模塊20,用于將所述全景視頻的三維視頻幀轉換為目標二維視頻幀;識別和標記模塊30,用于對所述目標二維視頻幀進行目標對象識別和標記生成標記后的目標二維視頻幀,例如,對于車輛在公路上行駛的全景視頻,可以將其中的車輛設定為目標對象,并且,可以使用深度學習的工具(諸如faster-rcnn、yolo等)對全景視頻中的目標對象(例如車輛)進行識別并標記,生成標記后的目標二維視頻幀,以為后續(xù)視頻轉換提供基礎;以及逆轉換模塊40,用于將所述標記后的目標二維視頻幀轉換為標記后的目標三維視頻幀,其中所述標記后的目標三維視頻幀中標記有所述目標對象。例如對于上述車輛在公路上行駛的示例,標記后的目標二維視頻幀中將包括對于車輛的標記(例如幾何形狀區(qū)域框、車輛邊緣提取線等),將包括該標記的標記后的目標二維視頻幀轉換為標記后的目標三維視頻幀,即將具有標記的二維視頻幀轉換到三維空間,以在全景視頻中顯示出該標記后的目標對象,以為后續(xù)的功能(例如車輛位置檢測等操作)提供數(shù)據(jù)基礎。

采用本實施例,視頻識別裝置100可以將獲取的全景視頻轉換為目標二維視頻幀,之后對所述目標二維視頻幀進行目標對象識別并對所識別的目標對象進行標記,最終將標記有目標對象的標記后的目標二維視頻幀轉換為標記后的三維視頻幀,能夠實現(xiàn)精確地、有效地、方便地識別全景視頻幀中的目標對象,避免了因全景視頻幀中視頻圖像的扭曲而造成的難以識別其中目標對象或者識別結果不準確的情況的發(fā)生,為全景視頻的廣泛應用提供了技術基礎。

實施例4

如圖2所示,在實施例4中,以球模型三維全景視頻為例來說明視頻識別裝置100對全景視頻的示例識別過程:

首先,獲取模塊10可以獲取全景視頻,所述全景視頻為球模型三維全景視頻,例如車輛在公路上行駛的球模型三維全景視頻幀a,如圖2所示。

之后,轉換模塊20可以將所述全景視頻的三維視頻幀轉換為目標二維視頻幀,具體地可以執(zhí)行以下過程:

將所述球模型三維全景視頻的三維視頻幀轉換為具有第一預設形狀的第一二維視頻幀,所述第一預設形狀可以為任何適當?shù)男螤?,例如立方體,所述第一二維視頻幀可以為立方體貼圖,即將所述球模型的三維視頻幀轉換為立方體貼圖,即執(zhí)行過程1001;

將所述第一二維視頻幀按照第一預設規(guī)則切割成多個第二二維視頻幀,例如所述第一預設規(guī)則為將所述立方體貼圖的每個面的二維紋理圖像映射為6宮格視頻幀,其中所述立方體貼圖的每個面(即立方體的上面、下面、左面、右面、前面、后面,6個面)的二維紋理圖像分別對應所述6宮格視頻幀中的每個宮格(對應圖4A的數(shù)字標號3、4、2、1、5、6),根據(jù)上述第一預設規(guī)則可以將立方體貼圖切割成多個第二二維視頻幀,如圖2中的視頻幀b所示,其中多個第二二維視頻幀可以對應圖4A的數(shù)字標號3、4、2、1、5、6,即執(zhí)行過程1002;其中過程1001-1002可以借助一些視頻處理的開源工具實現(xiàn),例如,使用facebook等開源工具完成;

將所述多個第二二維視頻幀拼接成具有第二預設形狀的目標二維視頻幀,其中,所述第一預設形狀與所述第二預設形狀相匹配,例如所述第二預設形狀可以為十字形,該十字形可以是將立方體的6個面按照幾何分解而得到的十字形圖像。具體地,可以將所述6宮格視頻幀映射為十字形的目標二維視頻幀,例如,如圖2中的視頻幀c所示,即執(zhí)行過程1003。

舉例來說,如圖4A-4B所示,其中示出了將6宮格視頻幀b映射為十字形視頻幀c的一種示例。具體來說,首先將對6宮格視頻幀b進行按照3x2的劃分,計算出每個小正方形的位置;之后,使用opencv等圖像處理工具,根據(jù)坐標裁剪出6個矩形塊,即圖4A中的1、2、3、4、5、6矩形塊分別對應著立方體貼圖的右面、左面、上面、下面、前面、后面;接著,將六個矩形塊1、2、3、4、5、6重新拼接,拼接成由立方體展開而得到的按4x3進行分割的十字形視頻幀,如圖4B所示。最后,記錄使用圖4A中的數(shù)字標號記錄6宮格圖像與圖4B中十字形圖像中各塊的預定映射關系:

PLANE_43_TO_32_MAP[]={-1,3,-1,-1,2,5,1,6,-1,4,-1,-1}(-1代表無效位置),其中PLANE_43_TO_32_MAP表示映射數(shù)組,數(shù)組標表示其在十字形中的數(shù)字,相應的值為其在6宮格圖像中所在矩形塊的數(shù)字,通過該映射數(shù)組,就可以計算十字形圖像中的任何有效位置(非黑色區(qū)域,黑色區(qū)域為無效區(qū)域)在六宮格圖像中相匹配的坐標,該逆映射過程將在下述逆轉換模塊40中使用。

接著,識別和標記模塊30可以對所述目標二維視頻幀進行目標對象識別和標記,生成標記后的目標二維視頻幀,具體地,可以執(zhí)行以下過程:

識別所述目標二維視頻幀中的目標對象,例如,使用深度學習的工具(諸如faster-rcnn、yolo等)對視頻幀c中的目標對象(例如車輛car)進行識別;

獲取所識別的目標對象的位置;以及根據(jù)所述目標對象的位置,利用幾何區(qū)域標記所述目標對象,以生成標記后的目標二維視頻幀。例如,可以使用矩形框等的幾何區(qū)域標記所識別的目標對象車輛car,例如,如圖2所示,視頻幀d中使用矩形框標記出了在場景中車輛car的位置,即執(zhí)行過程1004,或者也可以直接高亮描繪車輛的輪廓線。

接著,逆轉換模塊40可以將所述標記后的目標二維視頻幀轉換為標記后的目標三維視頻幀,例如可以執(zhí)行以下過程:

獲取所述標記后的目標二維視頻幀的中所述幾何區(qū)域的坐標,例如所述目標對象的位置信息(例如坐標)以及幾何區(qū)域的坐標,例如對于視頻幀d中的矩形框,可以使用(x,y)的形式來表示該矩形框的四個頂點的坐標,根據(jù)該四個頂點的坐標即可以繪制出該矩形框;

將包括有所述幾何區(qū)域的坐標所述標記后的目標二維視頻幀根據(jù)預定映射關系轉換為多個標記后的第二二維視頻幀,例如根據(jù)過程1003中設置好的預定映射關系(即上述映射數(shù)組),可以將矩形框的四個頂點的坐標映射到6宮格視頻幀,即執(zhí)行過程1005,將具有矩形框的十字形視頻幀映射到6宮格視頻幀上,即執(zhí)行逆映射過程;

將多個標記后的第二二維視頻幀按照第二預設規(guī)則組合為標記后的第一二維視頻幀,其中所述第二預設規(guī)則與所述第一預設規(guī)則相匹配,例如,所述第二預設規(guī)則為將6宮格視頻幀映射為所述立方體貼圖的每個面的二維紋理圖像,其中所述6宮格視頻幀中的每個宮格(對應圖4A的數(shù)字標號3、4、2、1、5、6)分別對應所述立方體貼圖的每個面(即立方體的上面、下面、左面、右面、前面、后面,6個面)的二維紋理圖像,即執(zhí)行過程1006;

將所述標記后的第一二維視頻幀的坐標轉換為球模型坐標,以生成標記后的目標三維視頻幀。例如,將所述標記后的立方體貼圖轉換為標記后的球模型的三維視頻幀,具體地,根據(jù)立方體貼圖上的坐標,計算出極坐標α和β,α、β可以分別除以360度和180度,按比例找出在球模型上對應的坐標(在2:1視頻中的像素點),如圖2中的視頻幀e所示,即執(zhí)行過程1007,其中,如圖2所示,視頻幀e在梯形區(qū)域中標記出了在該全景場景中車輛car的位置,實現(xiàn)了本發(fā)明實施例的目的。其中步驟1006-1007可以借助一些視頻處理的開源工具實現(xiàn),例如,使用facebook等開源工具完成。

最后,可以將通過上述過程1001-1007標記后的目標三維視頻幀進行組合,以形成標記后的全景視頻。

采用本實施例,視頻識別裝置100能夠實現(xiàn)在全景視頻幀中精確地、有效地、方便地識別出目標對象,避免了因全景視頻幀中視頻圖像的扭曲而造成的難以識別其中目標對象或者識別結果不準確的情況的發(fā)生,為全景視頻的廣泛應用提供了技術基礎。

實施例5

圖8是根據(jù)本發(fā)明實施例的一種實施例的視頻識別裝置100的結構示意圖,如圖8所示,該實施例5與實施例3或4的視頻識別裝置100的不同之處在于,該裝置除了包括上述獲取模塊10、轉換模塊20、識別和標記模塊30、逆轉換模塊40外,還可以包括:顯示模塊50,用于將所述標記后的目標三維視頻幀進行組合形成標記后的全景視頻。該顯示模塊50還可以顯示所述標記后的全景視頻,例如將如圖2中所示的視頻幀e與其他標記后的視頻幀f\h\i等任意數(shù)量的視頻幀進行組合,形成標記后的全景視頻,以及最終顯示所述標記后的全景視頻。

采用實施例5,能夠將各個標記后的視頻幀進行組合并顯示最終全景視頻,更加方便、直觀,避免了因全景視頻幀中視頻圖像的扭曲而造成的難以識別其中目標對象或者識別結果不準確的情況的發(fā)生,為全景視頻的廣泛應用提供了技術基礎。

本發(fā)明實施例提供的視頻識別方法以及裝置可以以硬件或軟件的形式實現(xiàn),例如可以以軟件的形式應用于需要對視頻進行識別的任何適當?shù)膱鼍爸?,例如電視機、手機、平板電腦、VR設備、以及智能可穿戴設備等,也可以以硬件的形式與上述場景中的設備集成,本發(fā)明實施例對此不進行限定。

應當理解的是,本領域技術人員可以根據(jù)本發(fā)明實施例的公開選擇上述各種實施例中的任一者,或者選擇上述各種實施例的組合來配置視頻識別方法和裝置,并且其他的替換實施例也落入本發(fā)明實施例的保護范圍。

以上結合附圖詳細描述了本發(fā)明實施例的可選實施方式,但是,本發(fā)明實施例并不限于上述實施方式中的具體細節(jié),在本發(fā)明實施例的技術構思范圍內,可以對本發(fā)明實施例的技術方案進行多種簡單變型,這些簡單變型均屬于本發(fā)明實施例的保護范圍。

另外需要說明的是,在上述具體實施方式中所描述的各個具體技術特征,在不矛盾的情況下,可以通過任何合適的方式進行組合。為了避免不必要的重復,本發(fā)明實施例對各種可能的組合方式不再另行說明。

本領域技術人員可以理解實現(xiàn)上述實施例方法中的全部或部分步驟是可以通過程序來指令相關的硬件來完成,該程序存儲在一個存儲介質中,包括若干指令用以使得一個(可以是單片機,芯片等)或處理器(processor)執(zhí)行本申請各個實施例所述方法的全部或部分步驟。而前述的存儲介質包括:U盤、移動硬盤、只讀存儲器(ROM,Read-Only Memory)、隨機存取存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質。

此外,本發(fā)明實施例的各種不同的實施方式之間也可以進行任意組合,只要其不違背本發(fā)明實施例的思想,其同樣應當視為本發(fā)明實施例所公開的內容。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
迁安市| 黔江区| 仁寿县| 章丘市| 闵行区| 原阳县| 镇安县| 邢台市| 常宁市| 寿光市| 平山县| 正阳县| 平安县| 英山县| 大埔区| 阳高县| 信宜市| 伊金霍洛旗| 长泰县| 隆安县| 芒康县| 会理县| 普宁市| 东乌珠穆沁旗| 财经| 通海县| 蒙城县| 澎湖县| 洛阳市| 游戏| 连山| 余江县| 双鸭山市| 田阳县| 吉林市| 改则县| 辽中县| 古田县| 鹤壁市| 周口市| 桓台县|