專利名稱:分割與估算移動目標的運動的方法
技術領域:
本發(fā)明涉及用于編碼圖象信號的面向目標的分析-綜合編碼技術;更具體地,涉及根據(jù)在其中移動的目標分割圖象及估算這些移動目標的各個運動的方法。
在諸如視頻電話、電話會議及高清晰度電視系統(tǒng)等數(shù)字電視系統(tǒng)中,由于視頻幀信號中的一個視頻行信號包含一系列稱作象素值的數(shù)字數(shù)據(jù),而需要大量的數(shù)字數(shù)據(jù)來定義各視頻幀信號。然而,由于一條傳統(tǒng)的傳輸信道的可資利用的頻帶寬度是有限的,為了通過它來傳輸大量的數(shù)字數(shù)據(jù),不可避免地要通過某種數(shù)據(jù)壓縮技術來壓縮或減少數(shù)據(jù)量,尤其是在諸如視頻電話或電話會議系統(tǒng)之類的低比特率視頻信號編碼器中。
用于編碼低比特率編碼系統(tǒng)的視頻信號的方法之一便是稱作面向目標的分析-綜合編碼技術,在這一方法中,其中包含移動目標的一個輸入視頻圖象是根據(jù)這些移動目標劃分的;并且各目標是用三組定義該目標的運動、輪廓(或形狀)與象素數(shù)據(jù)的參數(shù)描述的。
為了達到面向目標的分析-綜合編碼技術的主要目的,即恰當?shù)貙⑤斎胍曨l圖象分成移動目標并精確地估算這些移動目標的各個運動,已經(jīng)提出過若干種方法。其中之一便是分層結構的分割技術(見MichaelHotter等人的“根據(jù)面向目標的映射參數(shù)估算的圖象分割”,Signal Processing(信號處理),15,第三號,315-334頁(1988年10月))。
按照分層結構的分割技術,要分割的輸入視頻圖象的一個區(qū)是由一組作為映射參數(shù)的均勻運動與位置參數(shù)定義的。例如,用8個參數(shù)來描述一個平面剛體的任意三維運動。在第一步驟中,一個變化檢測器鑒別兩個相繼的場中的暫時改變的與不改變的區(qū)。將各個改變的圖象區(qū)看作一個目標。用一組映射參數(shù)來描述各個目標的運動與位置。根據(jù)這些映射參數(shù)與暫時在前場的信息,便能得到暫時接至場的重構。在分層結構的下一步驟中,圖象中并未在映射中正確地描述的區(qū)再一次受到變化檢測器的檢測,并按照在分層結構的第一步驟中所檢測到的改變部分加以處理。然而,在這一技術中,如果在一個改變區(qū)中包含大量的移動目標,便難于適當?shù)貙⑺鼈兎指睢?br>
因此,本發(fā)明的主要目的為提供一種根據(jù)其中的移動目標恰如其分地分割一個圖象并精確地估算該目標的各個運動的改進的方法。
按照本發(fā)明,提供了一種用于一個面向目標的分析-綜合編碼器中的將當前幀的一個圖象分割成移動目標并用一組運動參數(shù)描述這些移動目標的各個運動的方法,該方法包括下述步驟(a)將當前幀與一個前面的幀進行比較以檢測出當前幀中的一個移動區(qū);(b)進一步將當前幀與前面的幀進行比較,為該移動區(qū)中的各象素檢測一個運動矢量,從而生成一個運動矢量場;(c)在該運動矢量場上滑動大小為N×N個象素的窗口塊,N為一個正整數(shù),并計算各窗口塊的一致性度,以選擇一個最一致的窗口塊作為種子塊;
(d)根據(jù)該種子塊確定其運動參數(shù)組的一組初始值;(e)評估包含在該種子塊內(nèi)及其周圍的各運動矢量是否能用該組初始值描述,從而檢測出一個用該組初始值描述的運動矢量所定義的一個修正的區(qū);(f)為來自該修正區(qū)的該組運動參數(shù)確定一組修正值;(g)評估包含在該修正區(qū)內(nèi)及其周圍的各運動矢量是否能用該組修正值描述,從而檢測出一個用該組修正值描述的運動矢量所定義的一個新的修正區(qū);(h)重復步驟(f)與(g)直到當前修正區(qū)與前一修正區(qū)之間的差小于一個預定值為止,從而為該組運動參數(shù)確定一組最終值;以及(i)重復步驟(c)至(h)直到確定了各該移動目標的各組運動參數(shù)為止。
從下面結合附圖給出的較佳實施例的描述中,本發(fā)明的上述與其它目的及特征將是顯而易見的,附圖中
圖1為按照本發(fā)明將一個圖象分割成移動目標及用一組運動參數(shù)描述這些移動目標的各個運動的方框圖;以及圖2為展示圖1中所示的種子塊檢測與區(qū)增長電路的操作流程的流程圖。
圖1描述按照本發(fā)明分割移動目標及用一組運動參數(shù)描述這些移動目標的各個運動的方框圖。
如圖1中所示,分別將兩個輸入信號,即一個當前幀信號及一個重構的前一幀信號饋送給一個變化檢測器100及一個運動估算器102。
變化檢測器100將當前幀信號與重構的前一幀信號進行比較,以從當前幀的背景中檢測出一個改變的區(qū)。將檢測到的改變區(qū)的信息送至運動估算器102及一個運動矢量場檢測器103。
運動估算器102檢測該改變區(qū)中一組選定的象素,即特征點的運動矢量,其中各該特征點為能夠代表其相鄰象素的一個象素。這便是,首先從包含在該改變區(qū)中的所有象素中選擇若干個特征點。然后,通過在各該選定的特征點上形成具有預定大小的一個塊及通過采用一種塊匹配算法(參見諸如J.R.Jain等人的“位移測量及其在幀間圖象編碼中的應用”,IEEE通信學報,COM-29,第12號,1799-1808頁(1981年12月)),確定各該選定的特征點的運動矢量,其中各該運動矢量代表當前幀中的一個特征點與重構的前一幀中的一個對應匹配點(即一個最相似的象素)之間的空間位移。
運動矢量場檢測器103通過求出特征點的運動矢量的平均值而確定該改變區(qū)中的非特征點的運動矢量,從而檢測出該改變區(qū)中所有象素的運動矢量。用其中的所有象素的運動矢量定義的改變區(qū)稱作一個運動矢量場。將有關運動矢量場的信息送至一個種子塊檢測及區(qū)增長電路104。
種子塊檢測與區(qū)增長電路104將運動矢量場分割成移動目標并用一組運動參數(shù)描述這些移動目標的各個運動。按照本發(fā)明,為了描述這些移動目標的各個運動,采用了一種8參數(shù)運動模型(參見諸如Gilad Adiv的“從若干移動目標生成的光流確定三維運動與結構”,IEEE Transactions onPatent Analysis and Machine Intellgence,PAMI-7,第4號,384-401頁,(1985年7月)),該模型可表述如下Vx(x,y)=a1+a2x+a3y+a7x2+a8xy式(1)Vy(x,y)=a4+a5x+a6y+a7xy+a8y2式(2)其中Vx(x,y)為在位置(x,y)上的一個運動矢量的水平分量,而Vy(x,y)則為在位置(x,y)上的運動矢量的垂直分量。
參見圖2,運動矢量場中的各移動目標的8個運動參數(shù)是通過兩個過程確定的一個種子塊檢測過程10及一個區(qū)增長過程20。
種子塊檢測過程10為了確定8個運動參數(shù)的一組初始值而檢測一個種子塊,而區(qū)增長過程20則通過采用一種迭代區(qū)增長算法增加該種子塊的大小,從而為該8個運動參數(shù)估算一組實際值。
在種子塊檢測過程10中有兩個步驟10與12。在步驟10中,一個W×W個象素大小的窗口塊在運動矢量場上滑動;并計算該窗口塊的各位置的一致性度。此后,在步驟12中,選擇一個最一致的窗口塊作為種子塊。一致性度可確定如下D(m,n)=1E(a1*,···,a8*)]]>式(3)E(a1,···,a8)=Σx=mm+W-1Σy=nn+W-1∈(x,y;a1,···,a8)]]>式(4)∈(x,y;a1,···,a8)=(Vx(x,y)-V^x(x,y))2+(Vy(x,y)-V^y(x,y))2]]>式(5)V^x(x,y)=a1+a2x+a3y+a7x2+a8xy]]>式(6)V^y(x,y)=a4+a5x+a6y+a7xy+a8y2]]>式(7)其中D(m,n)表示在一個窗口位置(m,n)上的一致性度,W為一個窗口大小而(a1*,a2*,…,a8*)則為一個窗口塊的一組最佳運動參數(shù)。該組最佳運動參數(shù)是一組8個方程的解,各方程是式(4)對a1,a2,…,a8取偏導數(shù)并令其等于0導出的。如式(3)至(7)中所示,一個窗口塊的一致性度是通過采用一個窗口塊中的一組給定的運動矢量與從該組最佳運動參數(shù)得出的一組估算的運動矢量之間的一個誤差函數(shù)確定的。
檢測出種子塊之后,過程20開始為一組運動參數(shù)確定一組初始值。然后,為了將這些初始值校正為一組實際的運動參數(shù),便通過采用下面描述的區(qū)增長技術執(zhí)行一個收斂過程。
在步驟14中,根據(jù)步驟12中檢測到的種子塊確定一組運動參數(shù)的一組初始值,或根據(jù)在下面步驟16中檢測到的一個修正區(qū)確定該組運動參數(shù)的一組修正值。
運動參數(shù)組的初始值是通過取得種子塊的最佳運動參數(shù)組確定的。而運動參數(shù)組的修正值組是象檢測種子塊的最佳運動矢量組那樣根據(jù)修正區(qū)中所包含的所有運動矢量確定的。
在步驟16中,為了將初始值或修正值校正成一組實際的運動參數(shù),通過估算包含在種子塊或修正區(qū)內(nèi)或它們周圍的各運動矢量是否能用這些初始值或修正值來描述而執(zhí)行一個區(qū)增長過程,從而檢測出修正區(qū)或定義一個新的修正區(qū)。
在步驟18中,將一個當前修正區(qū)與前一修正區(qū)之間的差與一個預定值進行比較,以決定是否繼續(xù)進行區(qū)增長迭代。區(qū)增長迭代重復進行到當前修正區(qū)與前一修正區(qū)之間的差小于該預定值為止,從而為該組運動參數(shù)確定一組最終值。
檢測到該組運動參數(shù)的最終值之后,便通過重復步驟10至18檢測另一組運動矢量,一直進行到確定了各移動目標的各組運動參數(shù)為止。
雖然已相對于特定的實施例展示與描述了本發(fā)明,但對于熟悉本技術的人員而言,顯然可以在不脫離所附的權利要求書所定義的發(fā)明精神與范圍下,作出許多改變與修正。
權利要求
1.一種用于在一個面向目標的分析-綜合編碼器中將一個當前幀的一個包含移動目標的一個圖象分割成其中的移動目標并用一組運動參數(shù)來描述這些移動目標的各個運動的方法,包括下述步驟(a)將當前幀與前一幀進行比較以檢測出當前幀中的一個移動區(qū);(b)進一步將當前幀與前一幀進行比較而為該移動區(qū)中的各象素檢測出一個運動矢量,從而生成一個運動矢量場;(c)在該運動矢量場上滑動大小為N×N個象素的窗口塊,N為一個正整數(shù),并計算各該窗口塊的一致性度以選擇一個最一致的窗口塊作為一個種子塊;(d)根據(jù)該種子塊為該組運動參數(shù)確定一組初始值;(e)評估包含在該種子塊內(nèi)及其周圍的各運動矢量是否能用該組初始值描述,從而檢測出用該組初始值描述的運動矢量所定義的一個修正區(qū);(f)為來自該修正區(qū)的該組運動參數(shù)確定一組修正值;(g)評估包含在該修正區(qū)內(nèi)及其周圍的各運動矢量是否能用該組修正值描述,從而檢測出一個由用該組修正值描述的運動矢量定義的新的修正區(qū);(h)重復步驟(f)與(g)直到當前修正區(qū)與前一修正區(qū)之間的差小于一個預定值為止,從而為該組運動參數(shù)確定一組最終值;以及(i)重復步驟(c)至(h)直到確定各該移動目標的各組運動參數(shù)為止。
全文摘要
一種分割與估算移動目標的運動的方法,包括(a)將當前幀與前一幀比較以檢測出一運動矢量場;(b)在該運動矢量場上滑動窗口塊并計算其一致性度以生成一種子塊;(c)根據(jù)該種子塊為該組運動參數(shù)確定初始值;(d)評估各運動矢量是否能用該組初始值描述以檢測出一修正區(qū);(e)為該組運動參數(shù)確定修正值;(f)評估所述各運動矢量是否能用該組修正值描述,檢測出一新的修正區(qū);(g)重復步驟(e)與(f)直到為該組運動參數(shù)確定一組最終值。
文檔編號H04N7/26GK1133535SQ9510999
公開日1996年10月16日 申請日期1995年7月21日 優(yōu)先權日1995年4月8日
發(fā)明者張圭煥, 丁海默, 金成大, 崔在覺, 李時雄 申請人:大宇電子株式會社