基于動(dòng)態(tài)時(shí)空信息挖掘的人體輪廓重構(gòu)方法
【專利摘要】本發(fā)明公開了一種基于動(dòng)態(tài)時(shí)空信息挖掘的人體輪廓重構(gòu)方法,通過連接人體輪廓測試樣本和前幾幀測試樣本構(gòu)建一個(gè)查詢序列,采用非負(fù)矩陣分解的方法提取查詢序列和已知的人體運(yùn)動(dòng)訓(xùn)練樣本序列中各樣本的形狀描述子,根據(jù)形狀描述子計(jì)算查詢序列與訓(xùn)練樣本序列的代價(jià)矩陣,再通過代價(jià)矩陣計(jì)算累積代價(jià)矩陣,根據(jù)累積代價(jià)矩陣的元素值確定最優(yōu)子序列的末端點(diǎn)下標(biāo),再采用最優(yōu)規(guī)整路徑算法得到起始點(diǎn)下標(biāo),從而得到備選最優(yōu)子序列,再通過預(yù)設(shè)閾值篩選最終的最優(yōu)子序列,最后根據(jù)幾個(gè)最優(yōu)子序列中末端點(diǎn)樣本進(jìn)行加權(quán)擬合得到重構(gòu)的人體輪廓圖像。本發(fā)明通過構(gòu)建查詢序列引入時(shí)空信息,提高人體輪廓重構(gòu)的準(zhǔn)確性和魯棒性。
【專利說明】基于動(dòng)態(tài)時(shí)空信息挖掘的人體輪廓重構(gòu)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于計(jì)算機(jī)視覺【技術(shù)領(lǐng)域】,更為具體地講,涉及一種基于動(dòng)態(tài)時(shí)空信息挖掘的人體輪廓重構(gòu)方法。
【背景技術(shù)】
[0002]人體形狀輪廓重構(gòu)是圖像處理和計(jì)算機(jī)視覺領(lǐng)域中一個(gè)很重要并極富挑戰(zhàn)性的問題。它的目標(biāo)是從帶有噪音干擾的數(shù)據(jù)中將原始信號恢復(fù)出來。一個(gè)有效的解決方案是挖掘人體輪廓序列中潛在的時(shí)空結(jié)構(gòu)信息,并利用這些信息尋找最優(yōu)的模板用于數(shù)據(jù)重構(gòu)。
[0003]目前很多研究工作圍繞人體輪廓的分析進(jìn)行展開?;诹餍螌W(xué)習(xí)(ManifoldLearning)的方法通過對訓(xùn)練樣本非線性降維學(xué)習(xí)出一個(gè)低維的流形空間,針對一個(gè)測試樣本,找到其在低維流形上對應(yīng)的最近鄰點(diǎn)并反投影到原始空間進(jìn)行重構(gòu)。具體算法可參考文獻(xiàn):A. Elgammal and C. S. Lee, Nonlinear Manifold Learning forDynamic Shape and Dynamic Appearance, In Computer Vision and Image Understanding, vol. 106,pp. 31-46,2007.值得注意的是,該類方法在進(jìn)行降維和尋找最近鄰的時(shí)候沒有考慮樣本的時(shí)序信息。實(shí)際上,為了提高魯棒性,越來越多的學(xué)者在他們的方法中引入時(shí)間約束。Cremers通過引入自回歸(autoregression)模型建立當(dāng)前輪廓和前幾中貞輪廓樣本之間的關(guān)系。具體算法可參考文獻(xiàn)[2] :D. Cremers, Nonlinear DynamicalShape Priors for Level Set Segmentation, In Proc. IEEE Conf. Compu. Vision. Patte.Recog.,pp. 1-7,2007。Zhou等人通過連接當(dāng)前測試樣本和其前幾巾貞樣本構(gòu)建一個(gè)子序列,并尋找其中每個(gè)樣本的最近鄰模板集,將重構(gòu)問題轉(zhuǎn)化成尋找連接這些模板集的最短路徑問題。該方法并沒有只單獨(dú)考慮測試樣本,而把子序列當(dāng)成一個(gè)整體,通過進(jìn)行時(shí)序序列匹配來提高對噪音的魯棒性。具體算法可參考文獻(xiàn)[3]:X.Zhou,X.Li,T. J.Chin and
D.Suter, Adaptive Human Silhouette Reconstruction Based on the Exploration ofTemporal Information, In Proc. of ICASSP, pp. 1005-1008,2012。
[0004]對于時(shí)序數(shù)據(jù)匹配,動(dòng)態(tài)時(shí)間規(guī)整算法(Dynamic Time Warping, DTW)是一種非常有效的比較并對齊兩個(gè)時(shí)間序列的方法。DTW算法最早起源于語音處理,現(xiàn)在已經(jīng)成功應(yīng)用于形狀檢索、匹配、分類等領(lǐng)域。在很多實(shí)際應(yīng)用中,往往存在兩個(gè)長度不等的序列,一個(gè)是長的訓(xùn)練序列,另外一個(gè)是短的查詢序列,需要從一個(gè)長序列中找到其中一段子序列和查詢序列最相似,這種情況下不需要將兩個(gè)不等長序列全局進(jìn)行對齊(首尾對應(yīng)點(diǎn)分別對齊)。該算法是傳統(tǒng)DTW算法的變形,稱之為子序列DTW(Subsequence DTff)算法。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種基于動(dòng)態(tài)時(shí)空信息挖掘的人體輪廓重構(gòu)方法,通過挖掘輪廓時(shí)序數(shù)據(jù)中空間和時(shí)間維度上內(nèi)在的結(jié)構(gòu)特性,將人體輪廓從噪音干擾的數(shù)據(jù)中準(zhǔn)確恢復(fù)出來。[0006]為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明基于動(dòng)態(tài)時(shí)空信息挖掘的人體輪廓重構(gòu)方法,其特征在于包括:
[0007]SI :人體運(yùn)動(dòng)訓(xùn)練樣本序列Y = (Y1, J2,... yM)為一組已知的人體輪廓圖像樣本,M表示訓(xùn)練樣本個(gè)數(shù),采集實(shí)際人體運(yùn)動(dòng)過程中的圖像并提取每幀圖像的人體輪廓得到測試序列X = (X1, X2,... xt,, χΝ),N表示測試樣本個(gè)數(shù);對于第t個(gè)測試樣本xt e X,連接該
測試樣本xt和其前L-I個(gè)測試樣本構(gòu)建查詢序列
【權(quán)利要求】
1.一種基于動(dòng)態(tài)時(shí)空信息挖掘的人體輪廓重構(gòu)方法,其特征在于,包括以下步驟: S1:人體運(yùn)動(dòng)訓(xùn)練樣本序列Y = (Y1,12,... yM)為一組已知的人體輪廓圖像樣本,M表示訓(xùn)練樣本個(gè)數(shù),采集實(shí)際人體運(yùn)動(dòng)過程中的圖像并提取每幀圖像的人體輪廓得到測試序列X = (X1, x2,... xt,...,xN) ,N表示測試樣本個(gè)數(shù);對于第t個(gè)測試樣本xt e X,連接該測試樣本xt和其前L-I個(gè)測試樣本構(gòu)建查詢序列
2.根據(jù)權(quán)利要求1所述的人體輪廓重構(gòu)方法,其特征在于,所述步驟S2中樣本的形狀描述子的提取方法包括以下步驟:S2.1:根據(jù)訓(xùn)練樣本序列Y得到非負(fù)的形狀訓(xùn)練數(shù)據(jù)矩陣廠=-Vy,),其中每一列}f=1代表一個(gè)形狀列向量,是由訓(xùn)練樣本序列yj的二值輪廓圖像拉成dX I的列向量,求解最小二乘優(yōu)化問題得到基矩陣W :
【文檔編號】G06K9/62GK103778439SQ201410030682
【公開日】2014年5月7日 申請日期:2014年1月23日 優(yōu)先權(quán)日:2014年1月23日
【發(fā)明者】周雪, 鄒見效, 徐紅兵 申請人:電子科技大學(xué)