一種基于排序?qū)W習(xí)的視頻跟蹤方法
【專利摘要】本發(fā)明公開(kāi)一種基于排序?qū)W習(xí)的視頻跟蹤方法,包括以下步驟,首先,基于壓縮感知理論,利用稀疏測(cè)量矩陣壓縮多尺度圖像特征;其次,采用Median-Flow跟蹤算法作為預(yù)測(cè)器,獲得目標(biāo)的粗略位置,并為RV-SVM算法構(gòu)建訓(xùn)練數(shù)據(jù)集;最后,對(duì)訓(xùn)練樣本進(jìn)行排序,把RV-SVM算法作為二值分類器,將目標(biāo)和背景分開(kāi)以達(dá)到視頻跟蹤的目的。RV-SVM算法的訓(xùn)練過(guò)程是一個(gè)線性規(guī)劃問(wèn)題,減少了在線學(xué)習(xí)的訓(xùn)練時(shí)間,提高了跟蹤系統(tǒng)的效率。通過(guò)將多尺度圖像壓縮特征提取、Median-Flow跟蹤算法和RV-SVM算法結(jié)合,能夠有效處理視頻跟蹤過(guò)程中的目標(biāo)尺度變化、部分遮擋、3D旋轉(zhuǎn)、姿勢(shì)變化和目標(biāo)快速移動(dòng)等問(wèn)題。
【專利說(shuō)明】—種基于排序?qū)W習(xí)的視頻跟蹤方法【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于計(jì)算機(jī)視覺(jué)與模式識(shí)別領(lǐng)域,特別涉及一種基于排序?qū)W習(xí)的視頻跟蹤方法。
【背景技術(shù)】
[0002]視頻跟蹤是計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)關(guān)鍵性的研究課題,在智能視頻監(jiān)控、增強(qiáng)現(xiàn)實(shí)、人機(jī)交互、手勢(shì)識(shí)別以及自動(dòng)駕駛等方面具有廣泛的應(yīng)用前景。近二十年來(lái),盡管國(guó)內(nèi)外研究人員提出了非常多的跟蹤算法,但它依然是一個(gè)非常具有挑戰(zhàn)性的課題,因?yàn)楦咝У囊曨l跟蹤算法需要處理真實(shí)視頻場(chǎng)景中的目標(biāo)尺度變化、光照變化、部分遮擋、相機(jī)旋轉(zhuǎn)、物體變形等問(wèn)題。
[0003]根據(jù)對(duì)目標(biāo)表現(xiàn)建模所用的方法不同,可以將跟蹤算法分為兩類:基于生成模型的目標(biāo)跟蹤算法和基于判別模型的目標(biāo)跟蹤算法。基于生成模型的跟蹤算法首先學(xué)習(xí)一個(gè)目標(biāo)表現(xiàn)模型,然后在每幀圖像上搜索與該模型最相似的目標(biāo)?;谂袆e模型的跟蹤算法將目標(biāo)跟蹤問(wèn)題看作是一個(gè)二元分類問(wèn)題,通過(guò)在線學(xué)習(xí)一個(gè)分類器將目標(biāo)和背景分開(kāi)。
[0004]目前,基于判別模型的跟蹤算法正逐漸成為視頻跟蹤領(lǐng)域的主流方法?;谂袆e模型的視頻跟蹤算法又被稱作基于檢測(cè)的跟蹤(tracking-by-detection),該類算法的主要步驟如下:1)已知目標(biāo)初始位置,抽樣提取當(dāng)前幀的正負(fù)樣本,在線訓(xùn)練分類器;2)讀入下一幀圖像,一般假設(shè)前后兩幀目標(biāo)的位置不變,在目標(biāo)位置周圍抽取圖像樣本;3)將抽取的樣本送入之前訓(xùn)練的分 類器,根據(jù)分類器得分最高的樣本即可確定目標(biāo)的新位置。大部分基于檢測(cè)的視頻跟蹤算法都能處理部分真實(shí)場(chǎng)景中的物體變化,但都不同程度的存在漂移問(wèn)題,導(dǎo)致被跟蹤目標(biāo)的丟失。
[0005]通常為了處理跟蹤過(guò)程中目標(biāo)的尺度變化,需要提取多尺度圖像特征。多尺度圖像特征維數(shù)太高,可利用壓縮感知理論對(duì)多尺度圖像特征進(jìn)行降維。中值-光流(Median-Flow)跟蹤算法跟蹤效果良好,計(jì)算量小,適合用作弱跟蹤器,提供目標(biāo)位置的粗略估計(jì)。排序?qū)W習(xí)算法已經(jīng)在機(jī)器學(xué)習(xí)領(lǐng)域廣泛應(yīng)用,如文本檢索、產(chǎn)品評(píng)級(jí)和語(yǔ)義分析等,最近,排序?qū)W習(xí)算法開(kāi)始被用于計(jì)算機(jī)視覺(jué)領(lǐng)域,排序向量-支持向量機(jī)(RankingVector Support Vector Machine, RV-SVM)算法是一種最新的排序?qū)W習(xí)算法。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的是克服現(xiàn)有技術(shù)的不足,提供一種基于排序?qū)W習(xí)的視頻跟蹤方法。
[0007]基于排序?qū)W習(xí)的視頻跟蹤方法包含以下步驟:
[0008]I)用矩形圖像像素集來(lái)表示目標(biāo)0,目標(biāo)O大小為hXl,利用多尺度矩形濾波器生成目標(biāo)O的多尺度圖像特征;
[0009]2)基于壓縮感知理論,利用稀疏隨機(jī)測(cè)量矩陣壓縮多尺度圖像特征;
[0010]3)采用Median-Flow跟蹤算法作為預(yù)測(cè)器,預(yù)測(cè)目標(biāo)O在下一幀圖像中的粗略位置;[0011]4)構(gòu)建訓(xùn)練樣本集X)、X:3和H,X)是從初始幀和多個(gè)最近幀中抽取的目標(biāo)圖
像塊集,4°是從最近幀圖像中抽取的背景圖像塊集,AT1是從當(dāng)前幀圖像中抽取出來(lái)的弱標(biāo)記訓(xùn)練樣本集;
[0012]5)利用RV-SVM算法作為在線學(xué)習(xí)分類器,將目標(biāo)O和背景分開(kāi)以達(dá)到視頻跟蹤的目的。
[0013]所述的步驟I)為:
[0014]( 1)將目標(biāo)O與一系列多尺度矩形濾波器進(jìn)行卷積
[0015]
【權(quán)利要求】
1.一種基于排序?qū)W習(xí)的視頻跟蹤方法,其特征在于,包含以下步驟: 1)用矩形圖像像素集來(lái)表示目標(biāo)O,目標(biāo)O大小為hXl,利用多尺度矩形濾波器生成目標(biāo)O的多尺度圖像特征; 2)基于壓縮感知理論,利用稀疏隨機(jī)測(cè)量矩陣壓縮多尺度圖像特征; 3)采用Median-Flow跟蹤算法作為預(yù)測(cè)器,預(yù)測(cè)目標(biāo)O在下一幀圖像中的粗略位置;4)構(gòu)建訓(xùn)練樣本纟V和足:P Xi1是從初始幀和多個(gè)最近幀中抽取的目標(biāo)圖像塊集,Aid是從最近幀圖像中抽取的背景圖像塊隼X是從當(dāng)前幀圖像中抽取出來(lái)的弱標(biāo)記訓(xùn)練樣本集; 5)利用RV-SVM算法作為在線學(xué)習(xí)分類器,將目標(biāo)O和背景分開(kāi)以達(dá)到視頻跟蹤的目的。
2.根據(jù)權(quán)利要求1所述的基于排序?qū)W習(xí)的視頻跟蹤方法,其特征在于,所述的步驟I)為: (1)將目標(biāo)O與一系列多尺度矩形濾波器進(jìn)行卷積 1.J(x\y) = s(.\\y)*h ,(.v.f) 其中,--)表示目標(biāo)0,和歹是目標(biāo)O的像素點(diǎn)坐標(biāo),5(x,v)eR^ , R是向量空間,向量空間的維數(shù)為iXk,即為目標(biāo)O的大小,為多尺度矩形濾波器,定義如下, fl, ?.</` 式中,i和j為矩形濾波器標(biāo)號(hào),i = I,..., W, j = I,...,h ; (2)將濾波后的圖像矩陣Ο'.1’)展開(kāi)成列向量lk,k = 1,...,r, r = wXh ; (3)將列向量Ik連接成高維的多尺度圖像特征h: h = {1:,.-J1 ) 式中,h e Rm, m = r2, T表示向量轉(zhuǎn)置。
3.根據(jù)權(quán)利要求1所述的基于排序?qū)W習(xí)的視頻跟蹤方法,其特征在于,所述的步驟2)為: Cl)生成稀疏的隨機(jī)矩陣Φ,Φ e Rnxm, φ的元素Cti j為: I5 P- Xils φ..X \ O, η ~\-X / s '1 >3Λ-1,p = l/2s 式中,s通過(guò)平均概率在2至4之間隨機(jī)選取,P表示概率; (2)利用稀疏的隨機(jī)矩陣Φ對(duì)多尺度圖像特征h做投影, X = Φh 即得到多尺度圖像壓縮特征X,X e RnX1。
4.根據(jù)權(quán)利要求1所述的基于排序?qū)W習(xí)的視頻跟蹤方法,其特征在于,所述的步驟3)為:(1)將目標(biāo)O抽象為IOX10的網(wǎng)格特征點(diǎn),對(duì)每個(gè)特征點(diǎn),用一個(gè)包含該特征點(diǎn)并且大小為4X4的圖像塊來(lái)表示; (2)用金字塔光流法跟蹤這些特征點(diǎn),所用金字塔的層數(shù)為5層; (3)計(jì)算這些特征點(diǎn)的FB誤差和NCC誤差,其中,F(xiàn)B誤差的計(jì)算公式如下:
5.根據(jù)權(quán)利要求1所述的基于排序?qū)W習(xí)的視頻跟蹤方法,其特征在于,所述的步驟4)為: 構(gòu)建訓(xùn)練樣本集
6.根據(jù)權(quán)利要求1所述的基于排序?qū)W習(xí)的視頻跟蹤方法,其特征在于,所述的步驟5)為: (1)提取標(biāo)記訓(xùn)練樣本集A1、X;3和A中每個(gè)圖像塊的多尺度圖像壓縮特征X; (2)設(shè)訓(xùn)練樣本集Z丨中的特征排序高于Z和A中的特征排序,即Xj e Xr U K1,且 Xi 卜勺,其中,i 和 j 為特征序號(hào),i = 1,...,N1, j = N1+!,N^N0, N1 為訓(xùn)練樣本隼X中的樣本個(gè)數(shù),N0為訓(xùn)練樣本集義°和1二中的樣本個(gè)數(shù)之和; (3)根據(jù)步驟(2)中設(shè)定的條件,用訓(xùn)練樣本集X)、尤°和^C1的多尺度圖像壓縮特征X去訓(xùn)練排序函數(shù)Ft+1 (X),先求解線性規(guī)劃問(wèn)題: minL ( α,ξ ) = Σ j a ^ Σ ξ
s.t.Σ j α j (K (Xi, xu) -K (Xi, χν))≥ 1- ξ uv, α ≥ 0,ξ ≥ O 式中,u = 1,...,N1, V = N1+!,...,N^N0, ξ為松弛變量,Κ(.,.)為核函數(shù),對(duì)于線性核,K(x, ζ) =〈X,ζ> ;在得到線性規(guī)劃問(wèn)題的最優(yōu)解α*之后,排序函數(shù)Ft+1(x)可用下式表示
【文檔編號(hào)】G06T7/00GK103886585SQ201410054630
【公開(kāi)日】2014年6月25日 申請(qǐng)日期:2014年2月18日 優(yōu)先權(quán)日:2014年2月18日
【發(fā)明者】于慧敏, 曾雄 申請(qǐng)人:浙江大學(xué)