專利名稱:一種針對(duì)圖像序列的動(dòng)態(tài)紋理識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及針對(duì)圖像序列的動(dòng)態(tài)紋理識(shí)別領(lǐng)域,尤其涉及一種結(jié)合Surfacelet變換和三維HMT模型的動(dòng)態(tài)紋理識(shí)別方法。
背景技術(shù):
隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,信息的表現(xiàn)形式也越來(lái)越豐富,在所有的信息表現(xiàn)形式中視頻占據(jù)了很大的比例,并且這個(gè)比例還將不斷擴(kuò)大。動(dòng)態(tài)紋理是指描述某種動(dòng)態(tài)景觀的具有時(shí)間相關(guān)重復(fù)特征的圖像序列,是一類(lèi)比較特殊的視頻數(shù)據(jù)。動(dòng)態(tài)紋理具備空間上的重復(fù)性和時(shí)間上的穩(wěn)定性,在自然界中廣泛存在,比如海浪、瀑布、飄揚(yáng)的旗幟、飛翔的鳥(niǎo)群等等。動(dòng)態(tài)紋理不同于靜態(tài)紋理,靜態(tài)紋理只是場(chǎng)景某一時(shí)刻的紋理圖像,而動(dòng)態(tài)紋理則可以表示出場(chǎng)景中的紋理隨時(shí)間變化的情況。由于數(shù)據(jù)信息越來(lái)越龐雜,如何對(duì)數(shù)據(jù)進(jìn)行有效的識(shí)別和分類(lèi)就成為一個(gè)非常重要的課題,而動(dòng)態(tài)紋理識(shí)別技術(shù)就是一種識(shí)別和區(qū)分出不同種類(lèi)的動(dòng)態(tài)紋理的技術(shù)。目前,動(dòng)態(tài)紋理識(shí)別技術(shù)的應(yīng)用已經(jīng)越來(lái)越廣泛,例如可以用于火災(zāi)監(jiān)控視頻中的煙火識(shí)別,也可以用于醫(yī)學(xué)圖像序列中的目標(biāo)定位。經(jīng)過(guò)學(xué)者們多年的研究,已經(jīng)有若干動(dòng)態(tài)紋理識(shí)別方法被提出來(lái)?,F(xiàn)有的動(dòng)態(tài)紋理識(shí)別方法大致可以分為四種:基于光流的方法、基于時(shí)空域幾何屬性的方法、基于局部時(shí)空濾波的方法、基于模型參數(shù)估計(jì)和特征提取的方法?;诠饬鞯姆椒ò鸭y理信息和運(yùn)動(dòng)信息組合成特征向量,計(jì)算復(fù)雜度較低而且便于實(shí)現(xiàn),但是其適用性并不是很好;基于時(shí)空域幾何屬性的方法先找到視頻數(shù)據(jù)中的一組運(yùn)動(dòng)輪廓,然后跟蹤這些輪廓,這種動(dòng)態(tài)紋理識(shí)別方法的識(shí)別率比較高,但是找到圖像序列中的運(yùn)動(dòng)輪廓往往是比較困難的,這一弱點(diǎn)制約了該方法的應(yīng)用;基于局部時(shí)空濾波的方法可以更為精細(xì)地對(duì)動(dòng)態(tài)紋理進(jìn)行劃分,比如可以將動(dòng)態(tài)紋理分為平穩(wěn)的、連續(xù)的、不連續(xù)的、閃爍的、發(fā)光的等不同種類(lèi),但是很多動(dòng)態(tài)紋理往往同時(shí)具備上述特性中的幾種特性,所以這種方法的實(shí)用性并不是很強(qiáng);而基于模型參數(shù)估計(jì)和特征提取的方法是目前最為成功的動(dòng)態(tài)紋理識(shí)別方法,該方法從模型的角度來(lái)觀察動(dòng)態(tài)紋理數(shù)據(jù),并提供了 一整套動(dòng)態(tài)紋理分析和識(shí)別的算法框架。已有的動(dòng)態(tài)紋理識(shí)別方法多是在視頻數(shù)據(jù)的時(shí)空域上進(jìn)行的,而很多圖像處理方法則是在頻域上進(jìn)行的。這主要因?yàn)閳D像數(shù)據(jù)是二維數(shù)據(jù),可以看成是二維信號(hào),已經(jīng)有許多方法可對(duì)二維信號(hào)的頻譜進(jìn)行分析,例如小波變換、Contourlet (輪廓波)變換等。相比之下,三維或者更高維度的信號(hào)頻譜分析方法則較少,并且不夠成熟。而Surfacelet (表面波)變換是目前比較成熟的三維信號(hào)分析工具,Surfacelet可以認(rèn)為是將Contourlet變換拓展到三維的情況。Surfacelet 變換綜合使用 3D-DFB (3D Directional Filter Banks,三維方向?yàn)V波器組)和多尺度分解來(lái)實(shí)現(xiàn)三維信號(hào)的變換和分解。Surfacelet變換首先利用多尺度分解技術(shù)將三維信號(hào)的高頻成分和低頻成分分離開(kāi),接著對(duì)信號(hào)的高頻成分進(jìn)行3D-DFB分解,從而將三維信號(hào)的高頻成分分解到不同的方向中去,這樣就完成了單層Surfacelet變換。然后可以對(duì)低頻成分進(jìn)行進(jìn)一步分解,這樣就使Surfacelet變換能夠迭代地進(jìn)行下去,直到將信號(hào)分解至滿足要求的層數(shù)。Surfacelet變換可以對(duì)三維信號(hào)的頻域按照不同方向和不同層次進(jìn)行劃分,因此可以選擇Surfacelet變換對(duì)三維視頻數(shù)據(jù)信號(hào)進(jìn)行頻域處理,然后分析經(jīng)過(guò)Surfacelet變換后得到的系數(shù),進(jìn)而實(shí)現(xiàn)針對(duì)動(dòng)態(tài)紋理的識(shí)別方法。Surfacelet變換的結(jié)果是一系列子帶,及其對(duì)應(yīng)的系數(shù)矩陣,這樣對(duì)動(dòng)態(tài)紋理的識(shí)別就轉(zhuǎn)變成了對(duì)系數(shù)矩陣的識(shí)別。最基本的方法是將子帶數(shù)據(jù)的均值和方差組合為特征向量,然后通過(guò)距離函數(shù)來(lái)評(píng)價(jià)樣本間的相似性,但這種處理方式過(guò)于粗糙??紤]到Surfacelet變換后的系數(shù)分布與廣義高斯分布比較接近,可以針對(duì)系數(shù)建立廣義高斯模型,然后通過(guò)比較高斯函數(shù)的尺度參數(shù)和形狀參數(shù)來(lái)進(jìn)行動(dòng)態(tài)紋理的分類(lèi),但這種方法并沒(méi)有考慮到Surfacelet分解后的各個(gè)層次系數(shù)之間的關(guān)系。小波域的HMT(Hidden MarkovTree,隱馬爾可夫樹(shù))模型考慮到了小波不同層次系數(shù)間的關(guān)系,因此將二維的HMT模型擴(kuò)展到三維,針對(duì)Surfacelet變換后的系數(shù)進(jìn)行建模,然后使用極大似然準(zhǔn)則作為樣本間的相似性判別方法,通過(guò)比較圖像序列的三維HMT模型參數(shù)來(lái)區(qū)分動(dòng)態(tài)紋理數(shù)據(jù),將會(huì)得到更好的分類(lèi)結(jié)果。但目前尚未有相關(guān)研究出現(xiàn)在本領(lǐng)域
發(fā)明內(nèi)容
針對(duì)上述存在的技術(shù)問(wèn)題,本發(fā)明目的是提供一種結(jié)合Surfacelet變換與三維HMT模型的動(dòng)態(tài)紋理識(shí)別方法,以實(shí)現(xiàn)更高精度的針對(duì)圖像序列的動(dòng)態(tài)紋理識(shí)別。為達(dá)到上述目的,本發(fā)明采用如下的技術(shù)方案:一種針對(duì)圖像序列的動(dòng)態(tài)紋理識(shí)別方法,包括以下步驟:步驟1,建立標(biāo)準(zhǔn)動(dòng)態(tài)紋理模型庫(kù)TL,包括以下子步驟,步驟1.1,設(shè)動(dòng)態(tài)紋理種類(lèi)數(shù)目為K,采用K段包含相應(yīng)標(biāo)準(zhǔn)動(dòng)態(tài)紋理的圖像序列為樣本,構(gòu)成標(biāo)準(zhǔn)動(dòng)態(tài)紋理樣本庫(kù)DL;設(shè)第t段圖像序列為Dt,t的取值為1,2…K,標(biāo)準(zhǔn)動(dòng)態(tài)紋理樣本庫(kù)表示為DL= (D1, D2,…DK};步驟1.2,對(duì)標(biāo)準(zhǔn)動(dòng)態(tài)紋理樣本庫(kù)DL中的每段圖像序列進(jìn)行Surfacelet變換與三維HMT建模,設(shè)圖像序列Dt對(duì)應(yīng)的模型參數(shù)為T(mén)t,得到標(biāo)準(zhǔn)動(dòng)態(tài)紋理模型庫(kù)TL= IT1, T2,…
TkI ;步驟2,基于步驟I所得標(biāo)準(zhǔn)動(dòng)態(tài)紋理模型庫(kù)TL,對(duì)待識(shí)別的圖像序列進(jìn)行分類(lèi)判斷,包括以下子步驟,步驟2.1,對(duì)待識(shí)別的圖像序列進(jìn)行Surfacelet變換與三維HMT建模,得到對(duì)應(yīng)的模型參數(shù)T。;步驟2.2,將步驟2.1所得模型參數(shù)T。與標(biāo)準(zhǔn)動(dòng)態(tài)紋理模型庫(kù)TL中的K個(gè)模型參數(shù)逐一比較,計(jì)算待識(shí)別的圖像序列的模型參數(shù)T。基于各樣本的模型參數(shù)Tt的極大似然函M T(TjT1), f (TcIT2),-,f (TcITk);步驟2.3,從步驟2.3所得極大似然函數(shù)值f(T。| T1),f (T。| T2),- ,f(Tc|TK)中尋找最大值,最大值對(duì)應(yīng)的模型參數(shù)Tw所屬動(dòng)態(tài)紋理種類(lèi)為待識(shí)別的圖像序列所屬的動(dòng)態(tài)紋理類(lèi)別。而且,步驟1.2和步驟2.1中,對(duì)一個(gè)圖像序列進(jìn)行Surfacelet變換的實(shí)現(xiàn)過(guò)程包括以下步驟,步驟al,通過(guò)塔形分解實(shí)現(xiàn)針對(duì)圖像序列的多尺度分解,包括以下子步驟,
步驟al.1,將圖像序列分別通過(guò)高通濾波器和低通濾波器,分解得到對(duì)應(yīng)的信號(hào)高頻成分和信號(hào)低頻成分;步驟al.2,判斷信號(hào)是否已經(jīng)分解至用戶預(yù)先設(shè)定的層數(shù),是則得到多尺度分解后的三維信號(hào);否則轉(zhuǎn)至步驟al.3 ;步驟al.3,對(duì)分解得到的信號(hào)低頻成分進(jìn)行2倍的上采樣操作,然后通過(guò)反混疊濾波器減弱上采樣操作帶來(lái)的頻譜混疊現(xiàn)象;步驟al.4,進(jìn)行3倍的下采樣操作;步驟al.5,步驟al.4下采樣后所得的信號(hào)作為新的圖像序列,轉(zhuǎn)至步驟al.1迭代執(zhí)行;步驟a2,通過(guò)兩個(gè)二維方向?yàn)V波器組串聯(lián)的三維方向?yàn)V波器組,對(duì)任一尺度的三維高頻信號(hào)X均執(zhí)行以下子步驟,步驟a2.1,對(duì)三維高頻信號(hào)X首先使用一個(gè)二維方向?yàn)V波器組沿某一方向進(jìn)行分解,得到分解后的信號(hào),此步驟分解后的信號(hào)為楔形的分解子帶;步驟a2.2,對(duì)步驟a2.1分解后的信號(hào)使用另一個(gè)二維方向?yàn)V波器組作另外方向的分解,得到由兩個(gè)楔形區(qū)域重合而成的錐形分解子帶,實(shí)現(xiàn)將三維高頻信號(hào)X分解到不同的方向,得到相應(yīng)尺度各方向的高頻子帶;步驟a3,通過(guò)系數(shù)矩陣存儲(chǔ)Surfacelet變換結(jié)果,包括將步驟al所得低頻子帶和各尺度各方向的高頻子帶的數(shù)據(jù)分別存儲(chǔ)于一個(gè)三維矩陣中,設(shè)有N個(gè)三維矩陣,從N個(gè)三維矩陣提取特征向量,由所有 特征向量組成的矩陣就是存儲(chǔ)Surfacelet變換結(jié)果的系數(shù)矩陣。
而且,步驟1.2和步驟2.1中,針對(duì)一個(gè)圖像序列進(jìn)行Surfacelet變換后所得系數(shù)矩陣建立三維HMT模型實(shí)現(xiàn)過(guò)程包括以下步驟,步驟bl,使用高斯混合模型實(shí)現(xiàn)系數(shù)的分布建模,設(shè)X為系數(shù)矩陣中的任一系數(shù),M為高斯混合模型中標(biāo)準(zhǔn)高斯模型的數(shù)目,則系數(shù)X的概率密度函數(shù)P(X)定義為
權(quán)利要求
1.一種針對(duì)圖像序列的動(dòng)態(tài)紋理識(shí)別方法,其特征在于,包括以下步驟: 步驟1,建立標(biāo)準(zhǔn)動(dòng)態(tài)紋理模型庫(kù)TL,包括以下子步驟, 步驟1.1,設(shè)動(dòng)態(tài)紋理種類(lèi)數(shù)目為K,采用K段包含相應(yīng)標(biāo)準(zhǔn)動(dòng)態(tài)紋理的圖像序列為樣本,構(gòu)成標(biāo)準(zhǔn)動(dòng)態(tài)紋理樣本庫(kù)DL ;設(shè)第t段圖像序列為Dt,t的取值為1,2…K,標(biāo)準(zhǔn)動(dòng)態(tài)紋理樣本庫(kù)表不為DL= (D1, D2, ---Dj ; 步驟1.2,對(duì)標(biāo)準(zhǔn)動(dòng)態(tài)紋理樣本庫(kù)DL中的每段圖像序列進(jìn)行Surfacelet變換與三維HMT建模,設(shè)圖像序列Dt對(duì)應(yīng)的模型參數(shù)為T(mén)t,得到標(biāo)準(zhǔn)動(dòng)態(tài)紋理模型庫(kù)TL= IT1, T2,…Τκ};步驟2,基于步驟I所得標(biāo)準(zhǔn)動(dòng)態(tài)紋理模型庫(kù)TL,對(duì)待識(shí)別的圖像序列進(jìn)行分類(lèi)判斷,包括以下子步驟, 步驟2.1,對(duì)待識(shí)別的圖像序列進(jìn)行Surfacelet變換與三維HMT建模,得到對(duì)應(yīng)的模型參數(shù)Τ。;步驟2.2,將步驟2.1所得模型參數(shù)Τ。與標(biāo)準(zhǔn)動(dòng)態(tài)紋理模型庫(kù)TL中的K個(gè)模型參數(shù)逐一比較,計(jì)算待識(shí)別的圖像序列的模型參數(shù)Τ?;诟鳂颖镜哪P蛥?shù)Tt的極大似然函M T(TjT1), f (TC|T2),-,f (TJTk); 步驟2.3,從步驟2.3所得極大似然函數(shù)值f (Tc I T1),f (Tc I T2),…,f (Tc I Tk)中尋找最大值,最大值對(duì)應(yīng)的模型參數(shù)Tw所屬動(dòng)態(tài)紋理種類(lèi)為待識(shí)別的圖像序列所屬的動(dòng)態(tài)紋理類(lèi)別。
2.根據(jù)權(quán)利要求1所述針對(duì)圖像序列的動(dòng)態(tài)紋理識(shí)別方法,其特征在于:步驟1.2和步驟2.1中,對(duì)一個(gè)圖像序列進(jìn)行Surfacelet變換的實(shí)現(xiàn)過(guò)程包括以下步驟, 步驟al,通過(guò)塔形分解實(shí)現(xiàn)針對(duì)圖像序列的多尺度分解,包括以下子步驟, 步驟al.1,將圖像序列分別通過(guò)高通濾波器和低通濾波器,分解得到對(duì)應(yīng)的信號(hào)高頻成分和信號(hào)低頻成分; 步驟al.2,判斷信號(hào)是否已經(jīng)分解至用戶預(yù)先設(shè)定的層數(shù),是則得到多尺度分解后的三維信號(hào);否則轉(zhuǎn)至步驟al.3; 步驟al.3,對(duì)分解得到的信號(hào)低頻成分進(jìn)行2倍的上采樣操作,然后通過(guò)反混疊濾波器減弱上采樣操作帶來(lái)的頻譜混疊現(xiàn)象; 步驟al.4,進(jìn)行3倍的下采樣操作; 步驟al.5,步驟al.4下采樣后所得的信號(hào)作為新的圖像序列,轉(zhuǎn)至步驟al.1迭代執(zhí)行; 步驟a2,通過(guò)兩個(gè)二維方向?yàn)V波器組串聯(lián)的三維方向?yàn)V波器組,對(duì)任一尺度的三維高頻信號(hào)X均執(zhí)行以下子步驟, 步驟a2.1,對(duì)三維高頻信號(hào)X首先使用一個(gè)二維方向?yàn)V波器組沿某一方向進(jìn)行分解,得到分解后的信號(hào),此步驟分解后的信號(hào)為楔形的分解子帶; 步驟a2.2,對(duì)步驟a2.1分解后的信號(hào)使用另一個(gè)二維方向?yàn)V波器組作另外方向的分解,得到由兩個(gè)楔形區(qū)域重合而成的錐形分解子帶,實(shí)現(xiàn)將三維高頻信號(hào)X分解到不同的方向,得到相應(yīng)尺度各方向的高頻子帶; 步驟a3,通過(guò)系數(shù)矩陣存儲(chǔ)Surfacelet變換結(jié)果,包括將步驟al所得低頻子帶和各尺度各方向的高頻子帶的數(shù)據(jù)分別存儲(chǔ)于一個(gè)三維矩陣中,設(shè)有N個(gè)三維矩陣,從N個(gè)三維矩陣提取特征向量,由所有特征向量組成的矩陣就是存儲(chǔ)Surfacelet變換結(jié)果的系數(shù)矩陣。
3.根據(jù)權(quán)利要求2所述針對(duì)圖像序列的動(dòng)態(tài)紋理識(shí)別方法,其特征在于:步驟1.2和步驟2.1中,針對(duì)一個(gè)圖像序列進(jìn)行Surfacelet變換后所得系數(shù)矩陣建立三維HMT模型實(shí)現(xiàn)過(guò)程包括以下步驟, 步驟bl,使用高斯混合模型實(shí)現(xiàn)系數(shù)的分布建模, 設(shè)X為系數(shù)矩陣中的任一系數(shù),M為高斯混合模型中標(biāo)準(zhǔn)高斯模型的數(shù)目,則系數(shù)X的概率密度函數(shù)P(X)定義為
全文摘要
一種針對(duì)圖像序列的動(dòng)態(tài)紋理識(shí)別方法,通過(guò)三維HMT模型參數(shù)的比較進(jìn)行動(dòng)態(tài)紋理識(shí)別,包括對(duì)圖像序列進(jìn)行Surfacelet變換得到系數(shù)矩陣,即通過(guò)塔形分解實(shí)現(xiàn)針對(duì)圖像序列的多尺度分解,通過(guò)兩個(gè)2D-DFB串聯(lián)的3D-DFB將三維信號(hào)分解到不同方向,通過(guò)三維矩陣存儲(chǔ)Surfacelet變換后得到的子帶數(shù)據(jù)并由提取的特征向量生成系數(shù)矩陣;然后針對(duì)系數(shù)矩陣建立三維HMT模型,即使用高斯混合模型實(shí)現(xiàn)系數(shù)的分布建模,使用三維HMT模型實(shí)現(xiàn)系數(shù)的尺度間連續(xù)性建模,使用EM算法求解HMT模型的參數(shù)。本發(fā)明還對(duì)于所處理數(shù)據(jù)包含多種類(lèi)型動(dòng)態(tài)紋理的情況,提出了相應(yīng)的擴(kuò)展方案。本發(fā)明實(shí)現(xiàn)起來(lái)更加簡(jiǎn)單,適用性更強(qiáng),且識(shí)別效果更好。
文檔編號(hào)G06K9/62GK103116761SQ20131007322
公開(kāi)日2013年5月22日 申請(qǐng)日期2013年3月7日 優(yōu)先權(quán)日2013年3月7日
發(fā)明者趙儉輝, 趙洋, 袁志勇 申請(qǐng)人:武漢大學(xué)蘇州研究院