專利名稱:一種尺度不變的時空興趣點快速檢測方法
技術(shù)領(lǐng)域:
本發(fā)明屬于視頻分析領(lǐng)域,更具體地,涉及一種尺度不變的時空興趣點快速檢測方法。
背景技術(shù):
近年來,在空間域基于關(guān)鍵點的局部視點不變特征成功地應(yīng)用了在目標(biāo)識別和圖像匹配上,但在空間-時間域,關(guān)鍵點檢測方法研究雖然已有所進展,但是成果有限。目前在國際上公開發(fā)表的論文文獻中已經(jīng)提出了 9種主要時空興趣點檢測方法,主要分為角點檢測法和團塊檢測法兩類。2003年,1.Laptev和T.Lindberg最先提出Harris時空興趣點檢測方法,他們將2維興趣點檢測思想從空間域推廣至空間一時間域,這種推廣考慮了視頻數(shù)據(jù)的3維本質(zhì),可以在空間和時間方向上定位局部點特征,較好地克服了尺度、速度、視角等變化影響,但檢測到的時空角點是稀疏的,不能完成多種動作的分類。2005年,P.Dollar等人發(fā)現(xiàn)時空興趣點法在一些應(yīng)用領(lǐng)域中表示行為所存在的問題,提出了基于Gabor濾波器的特征檢測,它可以同時應(yīng)用于空間域和時間域,獲得了一個稠密集合,有利于更明顯的表示多種行為。該集合在一定程度上可以是稀疏的,但是過于稀疏對行為的有效表示會產(chǎn)生若干問題,同時該方法不能進行時空尺度變換。2005年,Y.Ke等人將積分圖推廣到積分視頻,提出體積特征檢測方法,其尺度可以進行選擇,可以獲得大量的特征點,并可以實現(xiàn)高效的計算特征點,但得到的點太多,需要進行重采樣計算金字塔圖像。2006年,A.0ikonomopoulos等人提出了一種基于熵度量方法的興趣點檢測方法,它是Kadir和Brady的興趣點檢測方法的一種改進形式。他們將凸點與時空區(qū)域的熵相關(guān)聯(lián),描述了檢測興趣點的一個框架,其尺度特性取決于最大熵。在行為數(shù)據(jù)集上測試了該描述符,獲得了較好的識別結(jié)果,但該方法提取的點是是稀疏,且計算效率低。2008年,G.Willems等人提出了,基于3維Hessian矩陣的時空興趣點檢測方法,將2維SURF中特征定位方法盒子過濾器推廣到3維,該方法不用計算高斯時空尺度變化,只需改變3維盒子過濾器尺寸大小,定位和時空尺度選擇同時完成。2009年Wong和R.Cipolla提出了全局信息檢測方法。該檢測方法在標(biāo)準數(shù)據(jù)庫上測試時,可以容易檢測到時空興趣點的全局信息,產(chǎn)生稀疏的點集,但需要動作完整的視頻。另外還有MSER和V-FAST檢測方法,據(jù)2012年Tsz-Ho Yu和J.Woodford對7種檢測算子性能評價后指出,MSER和V-FAST是其中速度最慢的兩種方法。以上論述各種方法都是基于各種不同的興趣點度量方法檢測,各有優(yōu)缺點。存在問題有:或生成點數(shù)量稀疏,或運算量大,或不抗時空尺度變化,或檢測出的興趣點時空位置不準確。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)的缺陷,本發(fā)明的目的在于提供一種尺度不變的時空興趣點快速檢測方法,旨在解決現(xiàn)有技術(shù)基于各種不同的興趣點度量方法檢測導(dǎo)致生成點數(shù)量稀疏、運算量大和時空位置不準確的問題。本發(fā)明提供了一種尺度不變的時空興趣點快速檢測方法,包括下述步驟:S1:根據(jù)三維雙層LOG最優(yōu)化函數(shù)設(shè)置時空興趣點檢測算子在不同時空尺度下的參數(shù);S2:從待處理的視頻中獲取灰度巾貞圖像序列;S3:對所述灰度幀圖像序列中每個像素點的灰度值進行積分運算獲得積分視頻;并根據(jù)所述積分視頻獲得所述檢測算子內(nèi)、外層的體積;S4:根據(jù)檢測算子內(nèi)、外層的體積獲得時空興趣點檢測算子的響應(yīng)函數(shù),并根據(jù)響應(yīng)函數(shù)獲得多時空尺度下的強度響應(yīng)映射圖;S5:在強度響應(yīng)映射圖中,選取各個像素點的多個不同時空尺度對應(yīng)的強度響應(yīng)值,將多個強度響應(yīng)值中最大的強度響應(yīng)值與第一閾值進行比較,當(dāng)最大的強度響應(yīng)值大于第一閾值,將當(dāng)前像素點響應(yīng)的極值處對應(yīng)的時空尺度作為當(dāng)前尺度;S6:將當(dāng)前尺度下強度響應(yīng)值對應(yīng)的像素點作為時空興趣點集的第一候選點,所述第一候選點屬于第一候選點集合;S7:在強度響應(yīng)映射圖中的所述第一候選點的鄰域內(nèi),當(dāng)?shù)谝缓蜻x點對應(yīng)的強度響應(yīng)值是該鄰域的局部最大值時,將第一候選點作為第二候選點,第二候選點屬于第二候選點集合;S8:將所述第二候選點的強度響應(yīng)值與第二閾值進行比較,當(dāng)?shù)诙蜻x點的強度響應(yīng)值大于第二閾值時,將所述第二候選點作為第三候選點,所述第三候選點屬于第三候選點集合;S9:在強度響應(yīng)映射圖中對所述第三候選點的強度響應(yīng)值進行處理獲得三階Hessian矩陣,并計算Hessian矩陣的行列式和跡;SlO:當(dāng)所述行列式小于等于零或跡大于第三閾值時,在所述第三候選點集合中去除Hessian矩陣對應(yīng)的第三候選點,并將第三候選點集合中保留下的時空興趣點作為檢測結(jié)果。更進一步地,在步驟SI中,所述三維雙層LOG最優(yōu)化函數(shù)為:
權(quán)利要求
1.一種尺度不變的時空興趣點快速檢測方法,其特征在于,包括下述步驟: 51:根據(jù)三維雙層LOG最優(yōu)化函數(shù)設(shè)置時空興趣點檢測算子在不同時空尺度下的參數(shù); 52:從待處理的視頻中獲取灰度巾貞圖像序列; 53:對所述灰度幀圖像序列中每個像素點的灰度值進行積分運算獲得積分視頻;并根據(jù)所述積分視頻獲得所述檢測算子內(nèi)、外層的體積; S4:根據(jù)檢測算子內(nèi)、外層的體積獲得時空興趣點檢測算子的響應(yīng)函數(shù),并根據(jù)響應(yīng)函數(shù)獲得多時空尺度下的強度響應(yīng)映射圖; 55:在強度響應(yīng)映射圖中,選取各個像素點的多個不同時空尺度對應(yīng)的強度響應(yīng)值,將多個強度響應(yīng)值中最大的強度響應(yīng)值與第一閾值進行比較,當(dāng)最大的強度響應(yīng)值大于第一閾值,將當(dāng)前像素點響應(yīng)的極值處對應(yīng)的時空尺度作為當(dāng)前尺度; 56:將當(dāng)前尺度下強度響應(yīng)值對應(yīng)的像素點作為時空興趣點集的第一候選點,所述第一候選點屬于第一候選點集合; 57:在強度響應(yīng)映射圖中的所述第一候選點的鄰域內(nèi),當(dāng)?shù)谝缓蜻x點對應(yīng)的強度響應(yīng)值是該鄰域的局部最大值時,將第一候選點作為第二候選點,第二候選點屬于第二候選點集合; 58:將所述第二候選點的強度響應(yīng)值與第二閾值進行比較,當(dāng)?shù)诙蜻x點的強度響應(yīng)值大于第二閾值時,將所述第二候選點作為第三候選點,所述第三候選點屬于第三候選點集合; 59:在強度響應(yīng)映射圖中對所述第三候選點的強度響應(yīng)值進行處理獲得三階Hessian矩陣,并計算Hessian矩陣的行列式和跡; SlO:當(dāng)所述行列式小于等于零或跡大小第三閾值時,在所述第三候選點集合中去除Hessian矩陣對應(yīng)的第三候選點,并將第三候選點集合中保留下的時空興趣點作為檢測結(jié)果。
2.如權(quán)利要求1所述的檢測方法,其特征在于,在步驟SI中,所述三維雙層LOG最優(yōu)化函數(shù)為:
3.如權(quán)利要求1所述的檢測方法,其特征在于,在步驟SI中,所述時空興趣點檢測算子由兩個形狀相同、體積大小不同、中心點位置相同的幾何體內(nèi)外嵌套構(gòu)成;所述幾何體呈幾何中心對稱。
4.如權(quán)利要求3所述的檢測方法,其特征在于,所述時空興趣點檢測算子為雙層立方體檢測算子、雙層球體檢測算子或雙層多面體檢測算子。
5.如權(quán)利要求4所述的檢測方法,其特征在于,在步驟S4中,雙層立方體檢測算子對應(yīng)的響應(yīng)函數(shù)為:令
6.如權(quán)利要求1所述的檢測方法,其特征在于,在步驟S5中,所述當(dāng)前尺度 s*=args’ e Scmax resMap (x, y, t, s’);s’ 表示時空尺度,集合 Sc={l, 2,resMap (x, y, t, s’)為多時空尺度下的強度響應(yīng)映射圖,其數(shù)據(jù)結(jié)構(gòu)用一個4維數(shù)組表示。
7.如權(quán)利要求1所述的檢測方法,其特征在于,所述第一閾值的取值范圍為(0,1),所述第二閾值的取值范圍為(5,500 ),所述第三閾值的取值范圍為[0,+ Oo )。
8.如權(quán)利要求1或7所述的檢測方法,其特征在于,當(dāng)所述第二閾值越大時,所述時空興趣點集越稀疏;當(dāng)所述第二閾值越小時,所述時空興趣點集越稠密。
9.如權(quán)利要求1所述的檢測方法,其特征在于,在步驟S7中,通過邏輯公式R>RC判斷所述第一候選點對應(yīng)的強度響應(yīng)值是否為該鄰域的局部最大值,其中
10.如權(quán)利要求1所述的檢測方法,其特征在于,在步驟S9中,所述三階Hessian矩陣
全文摘要
本發(fā)明應(yīng)用于動作識別、表情分析、視頻檢索、機器人導(dǎo)航、人機交互、目標(biāo)檢測及跟蹤等視頻分析領(lǐng)域;公開了一種尺度不變的時空興趣點快速檢測方法,該方法包括設(shè)置時空興趣點檢測算子在不同時空尺度下的參數(shù);輸入連續(xù)的視頻幀后,計算積分視頻;計算像素點的時空興趣點檢測算子響應(yīng)函數(shù),得到多時空尺度強度響應(yīng)映射圖;選擇時空尺度;經(jīng)過非最大值抑制,得到候選的時空興趣點;將邊緣響應(yīng)的候選時空興趣點去除,得到檢測結(jié)果。本發(fā)明可以檢測出顯著和魯棒的局部時空特征點,定位準確;有較強抵抗噪聲干擾的能力;有一定抗遮擋、旋轉(zhuǎn)、時空尺度變化能力;實時性能好;通過域值選擇可決定輸出稀疏或稠密的點集。
文檔編號G06T7/20GK103218825SQ20131008370
公開日2013年7月24日 申請日期2013年3月15日 優(yōu)先權(quán)日2013年3月15日
發(fā)明者姚開博, 桑農(nóng) 申請人:華中科技大學(xué)