一種變換域全局高精度運動矢量估計方法
【專利摘要】一種變換域的全局高精度運動矢量估計方法,該方法主要應用于平移運動圖像序列運動矢量估計。該方法包括以下步驟:視頻提取步驟,多維矩陣分塊重組步驟,矩陣變換步驟,系數(shù)降維步驟,折疊點提取步驟,窗確定步驟,加窗數(shù)據(jù)篩選步驟,最小二乘直線迭代擬合步驟,獲取運動矢量步驟。從本發(fā)明的實施例也證明了該方法精度誤差能降到10-4量級,運動矢量估計的精度越高,而運動估計精度越高,差值的分布越趨近于零,差值塊的能量越小,最后所產(chǎn)生的碼流比特位率也越少,壓縮性能越好。該方法參考了多幀圖像,具有計算復雜度低,運動估計精度高且結果連續(xù)等特點,有效解決了現(xiàn)有空域內運動矢量估計方法估計結果局部最優(yōu)、估計精度離散、高計算復雜度高的不足。
【專利說明】一種變換域全局高精度運動矢量估計方法
【技術領域】
[0001]本發(fā)明涉及數(shù)字圖像視頻編碼【技術領域】,更具體地,圖像視頻壓縮編碼中一種變換域的全局高精度運動矢量估計方法。其特征是變換域的全局連續(xù)高精度的運動矢量估計,其中變換域,是指將視頻矩陣進行多維矢量矩陣離散余弦變換之后,對其變換后的系數(shù)進行加工處理,從而實現(xiàn)運動矢量估計。
【背景技術】
[0002]視頻可以看作是一系列靜態(tài)圖像幀構成的緩變序列,因此其時域冗余要遠遠大于空域冗余,因此,在前一幀的基礎上對第二幀圖像進行編碼時,可以首先利用第一幀的塊對第二幀進行預測,找出要編碼的幀中每一個塊在參考幀中的位移,稱之為運動矢量,并對運動矢量和兩個塊相減的殘差進行編碼,從而在很大程度上去除了時域冗余度。其中,在編碼端搜索運動矢量的過程稱為運動估計,而在解碼端將預測塊與預測殘差相疊加的過程稱為運動補償。
[0003]運動估計是視頻編碼的關鍵技術,其最基本的原理是利用相鄰幀間的時間相關性,通過預測來減少時間冗余度,在實際編碼中,為了節(jié)省碼率,并不傳輸每一幀的全部數(shù)據(jù),而是利用運動估計求出每一幀與其預測參考幀之間的差值。運動估計越準確,差值的分布越趨近與零,差值塊的能量越小,經(jīng)過變換、量化和嫡編碼后所產(chǎn)生的碼流的比特位率也越少,因此,運動估計搜索的準確程度直接影響到了編碼的壓縮性能。
[0004]另一方面,運動估計是視頻壓縮編碼系統(tǒng)中最耗時的一個模塊,可占到編碼運算總量的60%?80%,是編碼過程中運算最密集的地方,要想提高視頻壓縮系統(tǒng)的編碼速度,達到實時壓縮,必須縮短時間占用比例最大的運動估計所耗費的時間。
[0005]到目前為止,所有的視頻編碼標準都是在空域內尋找參考幀中局部最優(yōu)匹配塊進行運動矢量估計,最新視頻編碼標準H.265運動矢量估計也是采用局部最優(yōu)塊匹配運動矢量估計方法,該方法復雜度非常高,而且運動矢量估計精度是離散化的,H.265運動矢量估計精度為四分之一像素。
【發(fā)明內容】
[0006]為了克服現(xiàn)有空域內運動矢量估計方法局部最優(yōu)、精度離散化、高復雜度的不足,本發(fā)明針對平移視頻序列,提出了變換域運動矢量估計方法,該方法不僅是全局性的,而且復雜度低,精度高且連續(xù),而運動估計精度越高,差值的分布越趨近于零,差值塊的能量越小,最后所產(chǎn)生的碼流比特位率也越少,壓縮性能越好。
[0007]—種變換域全局高精度運動矢量估計方法,至少包括以下幾個步驟:
[0008]第一步:視頻選取步驟
[0009]選取YUV格式視頻,針對平移視頻進行運動矢量估計,Y是亮度分量,U、V是色度分量,人類視覺系統(tǒng)對亮度比彩色更敏感,因此主要提取Y亮度分量作為實驗數(shù)據(jù);
[0010]第二步:多維分塊重組步驟[0011]該步驟主要是對源視頻數(shù)據(jù)進行分塊重組,分成若干個視頻子矩陣,分塊大小一般有 64*64、32*32、16*16 等;
[0012]第三步:矩陣變換步驟
[0013]運用多維矢量矩陣離散余弦變換矩陣,對三維子矩陣進行多維矢量矩陣離散余弦變換,計算出三維系數(shù)矩陣,變換后的系數(shù)也是一個三維矩陣,這個三維矩陣中的每一個的系數(shù)都對應一個三維坐標,該系數(shù)就可以在三維坐標系中對應的位置用一個小圓點表示;
[0014]第四步:系數(shù)降維步驟
[0015]將上一步驟計算得到的三維系數(shù)矩陣中不為O的系數(shù)在三維坐標系中用小圓點表示出來,這些小圓點主要集中在一個折疊平面上,折疊平面的兩個邊沿在三維坐標左右側面上,并且這些點集中在一條折疊的直線段上,提取這兩個含有運動矢量信息的側面,就可以對三維系數(shù)的處理降到二維平面上進行處理;
[0016]第五步:折疊點提取步驟
[0017]首先,對上一步驟中提取的兩個面中的數(shù)據(jù)點進行縱軸最大值和最小值截取,接著,計算出截取的這些點到原點的距離,根據(jù)距離大小分辨出幾個折疊點,最后分別計算出每個折疊點附近點的橫坐標均值,以此作為折疊點的橫坐標;
[0018]第六步:窗確定步驟
[0019]根據(jù)上一步驟計算出的折疊點,進一步通過折疊點的橫坐標來確定窗的范圍;
[0020]第七步:加窗數(shù)據(jù)篩選步驟
`[0021]如果是運動矢量是整數(shù)像素,各段直線都是完整的,但是如果運動矢量是非整數(shù)像素,最后一段是并不是完整的,對于整數(shù)像素,采用上一步驟得到的窗截取出最后一段數(shù)據(jù);對于非整數(shù)像素,加窗截取倒數(shù)第二段數(shù)據(jù);
[0022]第八步:直線迭代擬合步驟
[0023]用上一步驟得到的窗進行數(shù)據(jù)點截取,再分別對剩下的數(shù)據(jù)進行最小二乘直線迭代擬合,計算出擬合直線的斜率為Cl1和d2 ;
[0024]第九步:獲取運動矢量步驟
[0025]根據(jù)上一步驟計算出來的直線斜率Cl1和d2,因此所估計的運動矢量為[ + (I1, ±d2]。
[0026]所述的第二步多維分塊重組主要按以下步驟來實現(xiàn):
[0027]第(I)步,將視頻Y分量左上角定義為坐標原點,橫向向右掃描M1個像素,跳至第二行,橫向向右掃描M1個像素,重復上述過程,直到掃描M2行,此時得到Y第一幀的第一個M1^M2 塊;
[0028]第(2)步,跳至Y第二幀,重復第一步過程,得到Y第二幀的第一個札*112塊,依次跳至Y第三幀、第四幀直至第N1幀,即得到第一個MfM2^N1的視頻子矩陣;
[0029]第(3)步,跳回至Y第一幀,依次右移至第二塊,第三塊直至最后一塊,重復前兩步,實現(xiàn)整幅Y幀的分塊采樣,得到Y幀的所有MfM2^N1三維視頻子矩陣,本發(fā)明中M1和M2相等。
[0030]所述的第三步多維矢量矩陣離散余弦變換步驟,是對多維分塊重組得到的三維視頻子矩陣進行多維矢量矩陣離散余弦變換,變換的公式為:[0031 ]
【權利要求】
1.一種變換域全局高精度運動矢量估計方法,其特征在于:至少包括以下幾個步驟: 第一步:視頻選取步驟 選取YUV格式視頻,Y是亮度分量,U、V是色度分量,人類視覺系統(tǒng)對亮度比彩色更敏感,因此主要提取Y亮度分量作為實驗數(shù)據(jù); 第二步:多維分塊重組步驟 該步驟主要是對源視頻數(shù)據(jù)進行分塊重組,分成若干個視頻子矩陣,分塊大小一般有64*64、32*32、16*16 等; 第三步:矩陣變換步驟 運用多維矢量矩陣離散余弦變換矩陣,對三維子矩陣進行多維矢量矩陣離散余弦變換,計算出三維系數(shù)矩陣,變換后的系數(shù)也是一個三維矩陣,這個三維矩陣中的每一個的系數(shù)都對應一個三維坐標,該系數(shù)就可以在三維坐標系中對應的位置用一個小圓點表示;第四步:系數(shù)降維步驟 將上一步驟計算得到的三維系數(shù)矩陣中不為O的系數(shù)在三維坐標系中用小圓點表示出來,這些小圓點主要集中在一個折疊平面上,折疊平面的兩個邊沿在三維坐標左右側面上,并且這些點集中在一條折疊的直線段上,提取這兩個含有運動矢量信息的側面,就可以對三維系數(shù)的處理降到二維平面上進行處理; 第五步:折疊點提取 步驟 首先,對上一步驟中提取的兩個面中的數(shù)據(jù)點進行縱軸最大值和最小值截取,接著,計算出截取的這些點到原點的距離,根據(jù)距離大小分辨出幾個折疊點,最后分別計算出每個折疊點附近點的橫坐標均值,以此作為折疊點的橫坐標; 第六步:窗確定步驟 根據(jù)上一步驟計算出的折疊點,進一步通過折疊點的橫坐標來確定窗的范圍; 第七步:加窗數(shù)據(jù)篩選步驟 如果是運動矢量是整數(shù)像素,各段直線都是完整的,但是如果運動矢量是非整數(shù)像素,最后一段是并不是完整的,對于整數(shù)像素,采用上一步驟得到的窗截取出最后一段數(shù)據(jù);對于非整數(shù)像素,加窗截取倒數(shù)第二段數(shù)據(jù); 第八步:直線迭代擬合步驟 用上一步驟得到的窗進行數(shù)據(jù)點截取,再分別對剩下的數(shù)據(jù)進行最小二乘直線擬合,計算出擬合直線的斜率為Cl1和d2 ; 第九步:獲取運動矢量步驟 根據(jù)上一步驟計算出來的直線斜率Cl1和d2,因此所估計的運動矢量為[土屯,±d2]。
2.根據(jù)權利要求1所述的一種變換域全局高精度運動矢量估計方法,其特征在于,所述的第二步多維分塊重組主要按以下步驟來實現(xiàn): 第(I)步,將視頻Y分量左上角定義為坐標原點,橫向向右掃描乂個像素,跳至第二行,橫向向右掃描M1個像素,重復上述過程,直到掃描M2行,此時得到Y第一幀的第一個MfM2塊; 第(2)步,跳至Y第二幀,重復第一步過程,得到Y第二幀的第一AMfM2塊,依次跳至Y第三幀、第四幀直至第N1幀,即得到第一個MfM2^N1的視頻子矩陣; 第(3)步,跳回至Y第一幀,依次右移至第二塊,第三塊直至最后一塊,重復前兩步,實現(xiàn)整幅Y幀的分塊采樣,得到Y幀的所有MfM2^N1三維視頻子矩陣,本發(fā)明中M1和M2相等。
3.根據(jù)權利要求1所述的一種變換域全局高精度運動矢量估計方法,其特征在于:所述的第三步多維矢量矩陣離散余弦變換,是對多維分塊重組得到的三維視頻子矩陣進行多維矢量矩陣離散余弦變換,變換的公式為:
4.根據(jù)權利要求1所述的一種變換域全局高精度運動矢量估計方法,其特征在于:所述第八步直線迭代擬合步驟,主要按以下方法來實現(xiàn): 第(I)步,用加窗截取得到數(shù)據(jù)采用最小二乘直線擬合,擬合出一條直線; 第(2)步,計算出各點到該直線的距離,并求出其均值,根據(jù)該均值設定合適的步長; 第(3)步,設定閾值為均值減去步長k倍,k從O開始,每迭代一次k加I ; 第(4)步,用設定的閾值剔除距離大于閾值的點,用剩下的點再次采用最小二乘直線擬合法,擬合出一條直線,將該直線的斜率與第(I)步擬合出直線的斜率進行對比,如果差值小于給定值,則停止迭代,導出第(4)步求得的斜率,如果差值很大,則返回到第(3)步,依次往下進行。
5.根據(jù)權利要求4所述的一種變換域全局高精度運動矢量估計方法,其特征在于:所述的最小二乘直線擬合原理及公式為:以離散分布并且總體呈現(xiàn)直線軌跡的坐標點來求出直線參數(shù),設直線的帶參方程為:
Y = ax+b 利用直線軌跡上某個區(qū)間離散點的坐標(Xi,yi)(i = 1,…,n),定義誤差項
【文檔編號】H04N19/625GK103686187SQ201310682114
【公開日】2014年3月26日 申請日期:2013年12月7日 優(yōu)先權日:2013年12月7日
【發(fā)明者】桑愛軍, 鐘江江, 于洋, 陳綿書, 李曉妮, 陳賀新 申請人:吉林大學