專利名稱:運(yùn)動(dòng)特征提取方法和裝置,以及視頻處理裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明總體上涉及計(jì)算機(jī)視覺領(lǐng)域,更具體而言,涉及一種運(yùn)動(dòng)特征提取方法和裝置以及一種視頻處理裝置。
背景技術(shù):
視頻的運(yùn)動(dòng)信息是通過分析同一視頻中不同幀之間的物體的相對(duì)位移得到的關(guān)于視頻中物體的運(yùn)動(dòng)、鏡頭變化以及整個(gè)畫面的移動(dòng)等信息。作為視頻中的重要信息,運(yùn)動(dòng)信息在計(jì)算機(jī)視覺領(lǐng)域的視頻分類、視頻檢索、視頻分段、運(yùn)動(dòng)物體檢測(cè)、事件檢測(cè)、鏡頭邊界檢測(cè)等問題中發(fā)揮著重要作用,有著廣泛的應(yīng)用。如何提取較高層次的運(yùn)動(dòng)特征,以便更加準(zhǔn)確全面地描述視頻的運(yùn)動(dòng)內(nèi)容,對(duì)于后續(xù)的視頻分析、檢測(cè)等有著重要影響。美國(guó)專利公開US 7,852,938B2提出了一種對(duì)運(yùn)動(dòng)矢量處理的方法。在所述方法中,建立運(yùn)動(dòng)矢量金字塔,金字塔的上一層的較大塊尺寸的運(yùn)動(dòng)矢量由相鄰下一層的較小塊尺寸的運(yùn)動(dòng)矢量合并而成,由此得到基于不同塊尺寸的運(yùn)動(dòng)矢量。但是此方法未對(duì)幀內(nèi)不同區(qū)域進(jìn)行區(qū)分。Xavier Gibert, Huiping Li 和 David Doermann 的 “Sports videoclassification using HMMS”, Proceedings of International Conference onMultimedia & Expo, pp. 345-348, 2003中公開了一種通過統(tǒng)計(jì)運(yùn)動(dòng)矢量直方圖來生成運(yùn)動(dòng)特征向量的方法。但此方法僅在整個(gè)幀的范圍內(nèi)統(tǒng)計(jì)直方圖,得到的結(jié)果缺乏對(duì)幀內(nèi)局部運(yùn)動(dòng)信息的描述
發(fā)明內(nèi)容
在下文中給出了關(guān)于本發(fā)明的簡(jiǎn)要概述,以便提供關(guān)于本發(fā)明的某些方面的基本理解。應(yīng)當(dāng)理解,這個(gè)概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關(guān)鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡(jiǎn)化的形式給出某些概念,以此作為稍后論述的更詳細(xì)描述的前序。本發(fā)明的一個(gè)目的是提出一種運(yùn)動(dòng)特征提取方法和裝置,以克服現(xiàn)有技術(shù)中的上述缺陷中的至少一種。本發(fā)明的另一目的是提出一種視頻處理裝置,以利用通過本發(fā)明的運(yùn)動(dòng)特征提取裝置提取的視頻中每一幀的運(yùn)動(dòng)特征對(duì)視頻進(jìn)行處理。根據(jù)本發(fā)明的一個(gè)方面,提供了一種運(yùn)動(dòng)特征提取方法,包括將輸入圖像劃分為多個(gè)子區(qū)域,所述多個(gè)子區(qū)域形成嵌套的“回”字形結(jié)構(gòu);從所述多個(gè)子區(qū)域構(gòu)造子區(qū)域金字塔,所述金字塔包含一層或多層子區(qū)域;生成金字塔的每層中的每個(gè)子區(qū)域的運(yùn)動(dòng)矢量直方圖;以及將金字塔的各個(gè)層中的子區(qū)域的運(yùn)動(dòng)矢量直方圖拼接,得到拼接的運(yùn)動(dòng)矢量直方圖,作為輸入圖像的運(yùn)動(dòng)特征。根據(jù)本發(fā)明的另一方面,提供了一種運(yùn)動(dòng)特征提取裝置,包括子區(qū)域劃分部件,用于將輸入圖像劃分為多個(gè)子區(qū)域,所述多個(gè)子區(qū)域形成嵌套的“回”字形結(jié)構(gòu);金字塔構(gòu)造部件,用于從所述多個(gè)子區(qū)域構(gòu)造子區(qū)域金字塔,所述金字塔包含一層或多層子區(qū)域;直方圖生成部件,用于生成金字塔的每層中的每個(gè)子區(qū)域的運(yùn)動(dòng)矢量直方圖;以及直方圖拼接部件,用于將金字塔的各個(gè)層中的子區(qū)域的運(yùn)動(dòng)矢量直方圖拼接,得到拼接的運(yùn)動(dòng)矢量直方圖,作為輸入圖像的運(yùn)動(dòng)特征。根據(jù)本發(fā)明的另一方面,提供了一種視頻處理裝置,包括運(yùn)動(dòng)特征提取部件,用于提取待處理視頻中的每一幀輸入圖像的運(yùn)動(dòng)特征;以及視頻處理部件,用于利用每一幀的運(yùn)動(dòng)特征對(duì)視頻進(jìn)行處理,其中,所述運(yùn)動(dòng)特征提取部件包括子區(qū)域劃分部件,用于將輸入圖像劃分為多個(gè)子區(qū)域,所述多個(gè)子區(qū)域形成嵌套的“回”字形結(jié)構(gòu);金字塔構(gòu)造部件,用于從所述多個(gè)子區(qū)域構(gòu)造子區(qū)域金字塔,所述金字塔包含一層或多層子區(qū)域;直方圖生成部件,用于生成所述金字塔的每層中的每個(gè)子區(qū)域的運(yùn)動(dòng)矢量直方圖,以及直方圖拼接部件,用于將所述金字塔的各個(gè)層中的子區(qū)域的運(yùn)動(dòng)矢量直方圖拼接,得到拼接的運(yùn)動(dòng)矢量直方圖,作為所述輸入圖像的運(yùn)動(dòng)特征。使用根據(jù)本發(fā)明的以上方面的方法和裝置提取出的運(yùn)動(dòng)特征能夠準(zhǔn)確、全面地描述輸入圖像內(nèi)局部及整體的運(yùn)動(dòng)信息,同時(shí)能夠區(qū)分處理輸入圖像中前景和背景的運(yùn)動(dòng)信
肩、O
本發(fā)明可以通過參考下文中結(jié)合附圖所給出的描述而得到更好的理解,其中在所有附圖中使用了相同或相似的附圖標(biāo)記來表示相同或者相似的部件。所述附圖連同下面的詳細(xì)說明一起包含在本說明書中并且形成本說明書的一部分,而且用來進(jìn)一步舉例說明本發(fā)明的優(yōu)選實(shí)施例和解釋本發(fā)明的原理和優(yōu)點(diǎn)。在附圖中圖1示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的運(yùn)動(dòng)特征提取方法的示意性流程圖;圖2示出根據(jù)本發(fā)明 的一個(gè)實(shí)施例的子區(qū)域劃分示例;圖3示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的子區(qū)域金字塔構(gòu)造示例;圖4示出金字塔的各個(gè)層中的每個(gè)子區(qū)域的運(yùn)動(dòng)矢量直方圖示例;圖5示出將圖4的各個(gè)層中的子區(qū)域的運(yùn)動(dòng)矢量直方圖拼接的示例;圖6示出根據(jù)本發(fā)明的另一個(gè)實(shí)施例的運(yùn)動(dòng)特征提取方法的示意性流程圖;圖7a示出子區(qū)域中的塊的運(yùn)動(dòng)矢量示例;圖7b示出將圖7a中的子區(qū)域中的各塊的運(yùn)動(dòng)矢量劃分到不同方向上的示例;圖7c示出通過合計(jì)圖7b中的運(yùn)動(dòng)矢量得到的示意性運(yùn)動(dòng)矢量直方圖;圖8示出根據(jù)本發(fā)明的另一實(shí)施例的運(yùn)動(dòng)矢量提取方法的流程圖;圖9示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的視頻處理方法的示意性流程圖;圖10示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的運(yùn)動(dòng)特征提取裝置的示意性框圖;圖11示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的金字塔構(gòu)造部件的示意性框圖;圖12示出根據(jù)本發(fā)明的另一個(gè)實(shí)施例的運(yùn)動(dòng)特征提取裝置的示意性框圖;圖13示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的直方圖生成部件的示意性框圖;圖14示出根據(jù)本發(fā)明的另一個(gè)實(shí)施例的運(yùn)動(dòng)特征提取裝置的示意性框圖;圖15示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的視頻處理裝置的示意性框圖;以及圖16示出可以實(shí)現(xiàn)本公開的實(shí)施例/示例的計(jì)算機(jī)的結(jié)構(gòu)的示例性框圖。
具體實(shí)施例方式下面將參照附圖來說明本發(fā)明的實(shí)施例。在本發(fā)明的一個(gè)附圖或一種實(shí)施方式中描述的元素和特征可以與一個(gè)或更多個(gè)其它附圖或?qū)嵤┓绞街惺境龅脑睾吞卣飨嘟Y(jié)合。應(yīng)當(dāng)注意,為了清楚的目的,附圖和說明中省略了與本發(fā)明無關(guān)的、本領(lǐng)域普通技術(shù)人員已知的部件和處理的表示和描述。鑒于現(xiàn)有技術(shù)的上述情形,本申請(qǐng)的發(fā)明人構(gòu)思了一種運(yùn)動(dòng)特征提取方法和裝置,以便從輸入圖像中提取運(yùn)動(dòng)特征。本申請(qǐng)的發(fā)明人還構(gòu)思了一種視頻處理方法和裝置。在本公開中,輸入圖像可以是諸如圖片的靜止圖像或諸如視頻幀的動(dòng)態(tài)圖像。另外,在實(shí)際應(yīng)用中,本發(fā)明的方法和裝置往往應(yīng)用于一組輸入圖像,該組輸入圖像是按時(shí)間順序拍攝的多個(gè)靜止圖像,或者是一段視頻中的多幀動(dòng)態(tài)圖像。以下,將以下面的順序來描述示例性實(shí)施例。1.運(yùn)動(dòng)特征提取方法2.視頻處理方法3.運(yùn)動(dòng)特征提取裝置4.視頻處理裝置5.可實(shí)施本公開的方法/裝置的計(jì)算機(jī)結(jié)構(gòu)〈1.運(yùn)動(dòng)特征提取方法〉下面將參考圖1-8詳細(xì)描述根據(jù)本發(fā)明實(shí)施例的運(yùn)動(dòng)特征提取方法。
圖1示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的運(yùn)動(dòng)特征提取方法的示意性流程圖。如圖1所示,首先,在步驟SllO中,將輸入圖像劃分為多個(gè)子區(qū)域。在本發(fā)明的實(shí)施例中,劃分出的多個(gè)子區(qū)域形成嵌套的“回”字形結(jié)構(gòu)?!盎亍弊中谓Y(jié)構(gòu)的子區(qū)域劃分,能夠突出畫面的中心區(qū)域,也就是大多數(shù)視頻中拍攝對(duì)象集中出現(xiàn)的區(qū)域,從而可以對(duì)輸入圖像中前景和背景中出現(xiàn)的運(yùn)動(dòng)分別進(jìn)行統(tǒng)計(jì)。為了說明而不是限制,以下給出一個(gè)具體的劃分步驟示例。首先,在輸入圖像的中心取一個(gè)矩形區(qū)域;然后,將此矩形區(qū)域的邊緣與輸入圖像的邊緣之間的環(huán)形區(qū)域分割n-1個(gè)環(huán)形子區(qū)域,由此劃分出的n個(gè)子區(qū)域形成嵌套的“回”字形結(jié)構(gòu),n為大于I的自然數(shù)。為了均勻劃分,在其他示例中,可以使劃分出的各個(gè)環(huán)形區(qū)域的橫向?qū)挾然蚩v向?qū)挾认?br>
坐寸o為方便理解,圖2不出將輸入圖像劃分為多個(gè)子區(qū)域的圖案不例。在圖2中,輸入圖像被劃分為4個(gè)子區(qū)域1,2,3和4。為了方便觀看和說明,采用了白色和暗色來區(qū)分不同的子區(qū)域。其中,子區(qū)域I由輸入圖像中心的白色矩形區(qū)域表示,子區(qū)域2由圍繞子區(qū)域I的暗色環(huán)形區(qū)域表示,子區(qū)域3由圍繞子區(qū)域2的白色環(huán)形區(qū)域表示,子區(qū)域4由圍繞子區(qū)域3的暗色環(huán)形區(qū)域表示。這四個(gè)子區(qū)域形成嵌套的“回”字形結(jié)構(gòu)。返回到圖1,在步驟S120中,從所述多個(gè)子區(qū)域構(gòu)造子區(qū)域金字塔。所述金字塔可以包含一層或多層子區(qū)域。作為一個(gè)具體實(shí)施例,可以采用以下步驟來構(gòu)造子區(qū)域金字塔(I)以從輸入圖像劃分的多個(gè)子區(qū)域作為金字塔的最下層子區(qū)域;以及(2)通過將下一層的相鄰兩個(gè)或更多個(gè)子區(qū)域合并以形成金字塔中相鄰上一層的子區(qū)域,自下向上逐一生成金字塔的其他層子區(qū)域。例如,假設(shè)在以上的步驟SllO中將輸入圖像劃分為n個(gè)子區(qū)域,則在構(gòu)造金字塔時(shí),可以以這n個(gè)子區(qū)域作為金字塔的最下層子區(qū)域;將所述n個(gè)子區(qū)域中相鄰的每?jī)蓚€(gè)或多個(gè)子區(qū)域合并,形成
權(quán)利要求
1.一種運(yùn)動(dòng)特征提取方法,包括 將輸入圖像劃分為多個(gè)子區(qū)域,所述多個(gè)子區(qū)域形成嵌套的“回”字形結(jié)構(gòu); 從所述多個(gè)子區(qū)域構(gòu)造子區(qū)域金字塔,所述金字塔包含一層或多層子區(qū)域; 生成所述金字塔的每層中的每個(gè)子區(qū)域的運(yùn)動(dòng)矢量直方圖;以及 將所述金字塔的各個(gè)層中的子區(qū)域的運(yùn)動(dòng)矢量直方圖拼接,得到拼接的運(yùn)動(dòng)矢量直方圖,作為所述輸入圖像的運(yùn)動(dòng)特征。
2.根據(jù)權(quán)利要求1的運(yùn)動(dòng)特征提取方法,其中,從所述多個(gè)子區(qū)域構(gòu)造子區(qū)域金字塔包括 以從所述輸入圖像劃分的所述多個(gè)子區(qū)域作為所述金字塔的最下層子區(qū)域;以及 通過將下一層的相鄰兩個(gè)或更多個(gè)子區(qū)域合并以形成金字塔中相鄰上一層的子區(qū)域,自下向上逐一生成所述金字塔的其他層子區(qū)域。
3.根據(jù)權(quán)利要求1或2的運(yùn)動(dòng)特征提取方法,還包括 將所述輸入圖像劃分為相等大小的多個(gè)塊;以及 計(jì)算所述輸入圖像中的每個(gè)塊的運(yùn)動(dòng)矢量,以及 其中,生成所述金字塔的每層中的每個(gè)子區(qū)域的運(yùn)動(dòng)矢量直方圖包括針對(duì)每個(gè)子區(qū)域按方向合計(jì)所述子區(qū)域中的塊的運(yùn)動(dòng)矢量的模長(zhǎng),由此生成以方向?yàn)榫S度的所述子區(qū)域的運(yùn)動(dòng)矢量直方圖。
4.根據(jù)權(quán)利要求3的運(yùn)動(dòng)特征提取方法,其中,按方向合計(jì)所述子區(qū)域中的塊的運(yùn)動(dòng)矢量的模長(zhǎng)包括 將所述子區(qū)域中的所有塊的運(yùn)動(dòng)矢量由平面直角坐標(biāo)系變換到極坐標(biāo)系中; 將每個(gè)塊的運(yùn)動(dòng)矢量按角度映射到多個(gè)角度范圍之一上,每個(gè)角度范圍對(duì)應(yīng)于一個(gè)方向;以及 合計(jì)映射到每個(gè)方向上的運(yùn)動(dòng)矢量的幅度。
5.根據(jù)權(quán)利要求1或2的運(yùn)動(dòng)特征提取方法,其中,在將所述金字塔的各個(gè)層中的子區(qū)域的運(yùn)動(dòng)矢量直方圖拼接之前,所述方法還包括 針對(duì)所述金字塔中的至少一層,在從所述輸入圖像的中心到外圍的方向上對(duì)所述層中的各個(gè)子區(qū)域的運(yùn)動(dòng)矢量直方圖施以遞減的權(quán)重。
6.一種運(yùn)動(dòng)特征提取裝置,包括 子區(qū)域劃分部件,用于將輸入圖像劃分為多個(gè)子區(qū)域,所述多個(gè)子區(qū)域形成嵌套的“回”字形結(jié)構(gòu); 金字塔構(gòu)造部件,用于從所述多個(gè)子區(qū)域構(gòu)造子區(qū)域金字塔,所述金字塔包含一層或多層子區(qū)域; 直方圖生成部件,用于生成所述金字塔的每層中的每個(gè)子區(qū)域的運(yùn)動(dòng)矢量直方圖;以及 直方圖拼接部件,用于將所述金字塔的各個(gè)層中的子區(qū)域的運(yùn)動(dòng)矢量直方圖拼接,得到拼接的運(yùn)動(dòng)矢量直方圖,作為所述輸入圖像的運(yùn)動(dòng)特征。
7.根據(jù)權(quán)利要求6的運(yùn)動(dòng)特征提取裝置,其中,所述金字塔構(gòu)造部件包括 最下層確定部件,用于以從所述輸入圖像劃分的所述多個(gè)子區(qū)域作為所述金字塔的最下層子區(qū)域;以及其他層生成部件,用于通過將下一層的相鄰兩個(gè)或更多個(gè)子區(qū)域合并以形成金字塔中相鄰上一層的子區(qū)域,自下向上逐一生成所述金字塔的其他層子區(qū)域。
8.根據(jù)權(quán)利要求6或7的運(yùn)動(dòng)特征提取裝置,還包括 塊劃分部件,用于所述輸入圖像劃分為相等大小的多個(gè)塊;以及運(yùn)動(dòng)矢量計(jì)算部件,用于計(jì)算所述輸入圖像中的每個(gè)塊的運(yùn)動(dòng)矢量,以及其中,所述直方圖生成部件進(jìn)一步用于針對(duì)所述金字塔的每層中的每個(gè)子區(qū)域按方向合計(jì)所述子區(qū)域中的塊的運(yùn)動(dòng)矢量的模長(zhǎng),由此生成以方向?yàn)榫S度的所述子區(qū)域的運(yùn)動(dòng)矢量直方圖。
9.根據(jù)權(quán)利要求8的運(yùn)動(dòng)特征提取裝置,其中,所述直方圖生成部件包括 坐標(biāo)變換部件,用于將每個(gè)子區(qū)域中的所有塊的運(yùn)動(dòng)矢量由平面直角坐標(biāo)系變換到極坐標(biāo)系中; 運(yùn)動(dòng)矢量映射部件,用于將每個(gè)塊的運(yùn)動(dòng)矢量按角度映射到多個(gè)角度范圍之一上,每個(gè)角度范圍對(duì)應(yīng)于一個(gè)方向;以及 模長(zhǎng)合計(jì)部件,用于合計(jì)映射到每個(gè)方向上的運(yùn)動(dòng)矢量的幅度。
10.根據(jù)權(quán)利要求6或7的運(yùn)動(dòng)特征提取裝置,還包括 加權(quán)部件,用于在所述直方圖拼接部件將所述金字塔的各個(gè)層中的子區(qū)域的運(yùn)動(dòng)矢量直方圖拼接之前,針對(duì)所述金字塔中的至少一層,在從所述輸入圖像的中心到外圍的方向上對(duì)所述層中的各個(gè)子區(qū)域的運(yùn)動(dòng)矢量直方圖施以遞減的權(quán)重。
11.一種視頻處理裝置,包括 運(yùn)動(dòng)特征提取部件,用于提取待處理視頻中的每一幀輸入圖像的運(yùn)動(dòng)特征;以及 視頻處理部件,用于利用所述每一幀的運(yùn)動(dòng)特征對(duì)所述視頻進(jìn)行處理, 其中,所述運(yùn)動(dòng)特征提取部件包括 子區(qū)域劃分部件,用于將輸入圖像劃分為多個(gè)子區(qū)域,所述多個(gè) 子區(qū)域形成嵌套的“回”字形結(jié)構(gòu), 金字塔構(gòu)造部件,用于從所述多個(gè)子區(qū)域構(gòu)造子區(qū)域金字塔,所 述金字塔包含一層或多層子區(qū)域, 直方圖生成部件,用于生成所述金字塔的每層中的每個(gè)子區(qū)域的運(yùn)動(dòng)矢量直方圖,以及 直方圖拼接部件,用于將所述金字塔的各個(gè)層中的子區(qū)域的運(yùn)動(dòng)矢量直方圖拼接,得到拼接的運(yùn)動(dòng)矢量直方圖,作為所述輸入圖像的運(yùn)動(dòng)特征。
12.根據(jù)權(quán)利要求11的視頻處理裝置,其中,所述處理包括以下中的至少一種視頻分類、視頻檢索、視頻分段、運(yùn)動(dòng)物體檢測(cè)、事件檢測(cè)、以及鏡頭邊界檢測(cè)。
13.根據(jù)權(quán)利要求11的視頻處理裝置,其中,所述金字塔構(gòu)造部件包括 最下層確定部件,用于以從所述輸入圖像劃分的所述多個(gè)子區(qū)域作為所述金字塔的最下層子區(qū)域;以及 其他層生成部件,用于通過將下一層的相鄰兩個(gè)或更多個(gè)子區(qū)域合并以形成金字塔中相鄰上一層的子區(qū)域,自下向上逐一生成所述金字塔的其他層子區(qū)域。
14.根據(jù)權(quán)利要求11至13中的任一項(xiàng)的視頻處理裝置,所述運(yùn)動(dòng)特征提取部件還包括塊劃分部件,用于所述輸入圖像劃分為相等大小的多個(gè)塊;以及運(yùn)動(dòng)矢量計(jì)算部件,用于計(jì)算所述輸入圖像中的每個(gè)塊的運(yùn)動(dòng)矢量,以及其中,所述直方圖生成部件進(jìn)一步用于針對(duì)所述金字塔的每層中的每個(gè)子區(qū)域按方向合計(jì)所述子區(qū)域中的塊的運(yùn)動(dòng)矢量的模長(zhǎng),由此生成以方向?yàn)榫S度的所述子區(qū)域的運(yùn)動(dòng)矢量直方圖。
15.根據(jù)權(quán)利要求14的視頻處理裝置,其中,所述直方圖生成部件包括 坐標(biāo)變換部件,用于將每個(gè)子區(qū)域中的所有塊的運(yùn)動(dòng)矢量由平面直角坐標(biāo)系變換到極坐標(biāo)系中; 運(yùn)動(dòng)矢量映射部件,用于將每個(gè)塊的運(yùn)動(dòng)矢量按角度映射到多個(gè)角度范圍之一上,每個(gè)角度范圍對(duì)應(yīng)于一個(gè)方向;以及 模長(zhǎng)合計(jì)部件,用于合計(jì)映射到每個(gè)方向上的運(yùn)動(dòng)矢量的幅度。
16.根據(jù)權(quán)利要求11至13中任一項(xiàng)的視頻處理裝置,所述運(yùn)動(dòng)特征提取部件還包括 加權(quán)部件,用于在所述直方圖拼接部件將所述金字塔的各個(gè)層中的子區(qū)域的運(yùn)動(dòng)矢量直方圖拼接之前,針對(duì)所述金字塔中的至少一層,在從所述輸入圖像的中心到外圍的方向上對(duì)所述層中的各個(gè)子區(qū)域的運(yùn)動(dòng)矢量直方圖施以遞減的權(quán)重。
全文摘要
本發(fā)明公開一種運(yùn)動(dòng)特征提取方法和裝置,以及一種視頻處理裝置。所述運(yùn)動(dòng)特征提取方法包括將輸入圖像劃分為多個(gè)子區(qū)域,所述多個(gè)子區(qū)域形成嵌套的“回”字形結(jié)構(gòu);從所述多個(gè)子區(qū)域構(gòu)造子區(qū)域金字塔,所述金字塔包含一層或多層子區(qū)域;生成金字塔的每層中的每個(gè)子區(qū)域的運(yùn)動(dòng)矢量直方圖;以及將金字塔的各個(gè)層中的子區(qū)域的運(yùn)動(dòng)矢量直方圖拼接,得到拼接的運(yùn)動(dòng)矢量直方圖,作為輸入圖像的運(yùn)動(dòng)特征。
文檔編號(hào)H04N5/14GK103067646SQ20111033522
公開日2013年4月24日 申請(qǐng)日期2011年10月21日 優(yōu)先權(quán)日2011年10月21日
發(fā)明者王麗華 申請(qǐng)人:索尼公司