專利名稱:基于空間分辨率變換的視頻轉(zhuǎn)換編碼方法
技術(shù)領(lǐng)域:
本發(fā)明屬于數(shù)據(jù)壓縮及通信領(lǐng)域,涉及視頻壓縮及傳輸領(lǐng)域技術(shù),具體講涉及基于空間分辨率變換的視頻轉(zhuǎn)換編碼方法。
背景技術(shù):
視頻轉(zhuǎn)換編碼可以理解為從一種視頻壓縮格式到另一種視頻壓縮格式的轉(zhuǎn)換,這里所說的格式包括碼流的句法和碼流中的相關(guān)參數(shù),如編碼碼率、視頻圖像空間分辨率、時(shí)間分辨率、對(duì)網(wǎng)絡(luò)帶寬的適應(yīng)能力等,其實(shí)質(zhì)就是為適應(yīng)傳輸網(wǎng)絡(luò)的不同帶寬情況或根據(jù)客戶端的解碼能力,把一種壓縮格式的視頻流轉(zhuǎn)換為同種或另一種壓縮格式的視頻流。
可擴(kuò)展視頻編碼是另一種以多層的方式壓縮視頻并根據(jù)網(wǎng)絡(luò)帶寬的變化情況傳輸其中合適的幾層的編碼方法。它將原始視頻數(shù)據(jù)壓縮成一個(gè)基本層和若干個(gè)增強(qiáng)層,基本層必須保證全部傳輸,帶寬越寬,能傳輸?shù)脑鰪?qiáng)層數(shù)就越多,重建視頻圖像質(zhì)量越好,增強(qiáng)層依賴于基本層,沒有基本層有再多的增強(qiáng)層也沒有用。可擴(kuò)展視頻編碼方法主要有空域分層、時(shí)域分層、SNR(信噪比)分層、FGS(精細(xì)可分層)等方法,它通過進(jìn)行一次編碼,就可以生成一路適合多種信道環(huán)境的碼流,因而其靈活性高于視頻轉(zhuǎn)換編碼方法,但是可擴(kuò)展視頻要求解碼器支持多層解碼,這種復(fù)雜的解碼功能在未來幾年的手持終端上是不容易被支持的,另外其碼率控制方式遠(yuǎn)遠(yuǎn)復(fù)雜于視頻轉(zhuǎn)換編碼,導(dǎo)致流媒體服務(wù)器端的運(yùn)算復(fù)雜度提高,而且由于分層導(dǎo)致頭信息增加,這種編碼方式得到的重建視頻圖像質(zhì)量與在相同的帶寬條件下視頻轉(zhuǎn)換編碼獲得的重建視頻圖像質(zhì)量相比要差。多描述編碼是一種將原始視頻編碼成多路視頻流,其中任何一路視頻流都可單獨(dú)解碼播放,通過多路解碼視頻流的合并來獲得更好的重建圖像質(zhì)量并增強(qiáng)視頻流對(duì)網(wǎng)絡(luò)的適應(yīng)性,但是其實(shí)現(xiàn)復(fù)雜度很高,而且重建視頻圖像質(zhì)量的波動(dòng)通常較大。因此,可擴(kuò)展視頻編碼方法與視頻轉(zhuǎn)換編碼方法相比,運(yùn)算復(fù)雜度高,應(yīng)用范圍有限。
隨著移動(dòng)通信的不斷發(fā)展,無線接入帶寬越來越高,通過屏幕較小的手持終端觀看視頻越來越引人注目,同時(shí)多媒體檢索的不斷發(fā)展也要求能夠用較窄的帶寬、較小的版面瀏覽部分視頻信息,因此需要對(duì)編碼視頻流的空間分辨率轉(zhuǎn)換技術(shù)做深入的研究。
傳統(tǒng)的編碼視頻流的空間分辨率下變換方法是對(duì)待轉(zhuǎn)換的視頻流先解碼,然后在像素域?qū)嵭邢蛳虏蓸?,最后進(jìn)行編碼,然而由于運(yùn)動(dòng)估計(jì)的計(jì)算量極大,使得這種轉(zhuǎn)換編碼計(jì)算量很大,因此出現(xiàn)許多獲得空域下變換后宏塊運(yùn)動(dòng)矢量的快速重估方法。在待轉(zhuǎn)換視頻流的幀間編碼幀中,假如每個(gè)宏塊通過四分之一空域降采樣后變?yōu)橐粋€(gè)8*8大小的塊,同時(shí)原來宏塊的運(yùn)動(dòng)矢量 除以2就變成了該8*8塊的運(yùn)動(dòng)矢量,則獲得轉(zhuǎn)換后視頻流幀間編碼幀中宏塊運(yùn)動(dòng)矢量 最簡(jiǎn)單的方法就是對(duì)構(gòu)成該宏塊的四個(gè)8*8塊的運(yùn)動(dòng)矢量求平均(MEAN),見公式(1-1)。如果構(gòu)成該宏塊的四個(gè)8*8塊的運(yùn)動(dòng)矢量的水平分量和垂直分量的值完全相同,那么采用這種方法是完全合適的,但是當(dāng)構(gòu)成該宏塊的四個(gè)8*8塊的運(yùn)動(dòng)矢量不完全相同時(shí),這種方法會(huì)產(chǎn)生很大的誤差?;诖耍墨I(xiàn)[1]采用自適應(yīng)運(yùn)動(dòng)矢量重采樣方法(AMVR),即用加權(quán)平均的方法來獲得空域降采樣后宏塊的運(yùn)動(dòng)矢量 每個(gè)運(yùn)動(dòng)矢量的權(quán)重 等于其對(duì)應(yīng)的轉(zhuǎn)換前視頻流中宏塊中的4個(gè)8*8塊經(jīng)過DCT變換后的非零交流系數(shù)的個(gè)數(shù)Ai(歸一化后的值),見公式(1-2)。文獻(xiàn)[2]提出了另一種獲取空域下采樣后宏塊運(yùn)動(dòng)矢量的方法,稱為中值法(MEDIAN),從四個(gè)空域降采樣前宏塊的運(yùn)動(dòng)矢量 中選取與其它三個(gè)運(yùn)動(dòng)矢量距離最小的那個(gè)運(yùn)動(dòng)矢量除以2作為降采樣后所得宏塊的運(yùn)動(dòng)矢量 見公式(1-3)。文獻(xiàn)[3]提出用四個(gè)空域降采樣前宏塊的運(yùn)動(dòng)矢量 及其均值進(jìn)行運(yùn)動(dòng)估計(jì),如果通過某個(gè)運(yùn)動(dòng)矢量獲得的SAD值為零,則將該運(yùn)動(dòng)矢量作為最終的運(yùn)動(dòng)矢量 否則通過公式(1-4)獲得一個(gè)新的運(yùn)動(dòng)矢量 然后將該矢量獲得的SAD值與之前獲得的五個(gè)SAD值比較,選擇SAD值最小的那個(gè)運(yùn)動(dòng)矢量作為最終的運(yùn)動(dòng)矢量 v→s=(Σi=14v→i)/8---(1-1)]]>v→s=(Σi=14Ai×v→i/2)---(1-2)]]>di=Σj=1j≠i4|v→i-v→j|---(1-3)]]>v→ni=(Σi=141SADiv→i)/(Σi=141SADi)---(1-4)]]>文獻(xiàn)[1]~[3]研究了有關(guān)空間視頻分辨率轉(zhuǎn)換編碼過程中快速運(yùn)動(dòng)矢量的重估方法以及運(yùn)動(dòng)矢量的更新準(zhǔn)則,但它們獲得的重建視頻圖像質(zhì)量并不盡如人意。
發(fā)明內(nèi)容
為克服現(xiàn)有技術(shù)的不足,本發(fā)明的目的在于提供一種基于空間分辨率變換的視頻轉(zhuǎn)換編碼方法,該方法可極大地減少視頻轉(zhuǎn)換編碼過程中的計(jì)算量,提高編碼速度,而且獲得接近于全搜索塊匹配方法的重建視頻圖像質(zhì)量,并可以有效地降低網(wǎng)絡(luò)帶寬變化對(duì)重建視頻圖像質(zhì)量的影響,提高網(wǎng)絡(luò)帶寬的利用率,同時(shí)保證視頻流的可擴(kuò)展性和交互性,提供極佳的視覺體驗(yàn)。
本發(fā)明采用的技術(shù)方案是一種基于空間分辨率變換的視頻轉(zhuǎn)換編碼方法,通過利用已編碼視頻流中的運(yùn)動(dòng)信息和DCT變換得到的直流系數(shù)重新估計(jì)轉(zhuǎn)換編碼后視頻流的運(yùn)動(dòng)矢量,其特征在于,所述方法在像素域進(jìn)行,空域降采樣濾波器選用四點(diǎn)像素值取平均的方式,選擇大的DC系數(shù)作為宏塊活動(dòng)性的判斷標(biāo)志,空間分辨率轉(zhuǎn)換編碼后得到的編碼視頻流的每一個(gè)宏塊對(duì)應(yīng)于轉(zhuǎn)換前編碼視頻流的四個(gè)宏塊,利用這四個(gè)宏塊及其相鄰八個(gè)宏塊的運(yùn)動(dòng)矢量來計(jì)算轉(zhuǎn)換編碼后編碼視頻流中相應(yīng)宏塊的運(yùn)動(dòng)矢量,如果轉(zhuǎn)換編碼后宏塊對(duì)應(yīng)的轉(zhuǎn)換編碼前的四個(gè)宏塊中任何一個(gè)宏塊采用幀內(nèi)編碼方式,則轉(zhuǎn)換編碼后的宏塊也采用幀內(nèi)編碼方式,否則采用幀間編碼方式,轉(zhuǎn)換編碼后采用幀間編碼方式編碼的宏塊的運(yùn)動(dòng)矢量可由公式(1-5)計(jì)算獲得
v→s=(r×v→i+(1-r)Σj=18wnj×v→nj)/2---(1-5)]]>公式(1-5)中,wnj=0.125,r、 的取值方式如下(1)如果四個(gè) 都相等,所以選取四個(gè)宏塊中任一 作為上式中 的取值,r=1;(2)如果四個(gè) 都不相等,選取四個(gè)宏塊中殘差DCT直流系數(shù)最大的那個(gè) 作為上式中 的取值,r=0.75;(3)如果上述情況都不成立,選取四個(gè)宏塊中殘差DCT直流系數(shù)最小的那個(gè) 作為上式中的取值,使其逼近于物體的總體運(yùn)動(dòng)趨勢(shì),r=1。
為了使 更加精確化,需要根據(jù)轉(zhuǎn)換編碼后宏塊對(duì)應(yīng)的原編碼視頻流中四個(gè)宏塊的運(yùn)動(dòng)矢量 的情況選擇合適的搜索窗口對(duì) 進(jìn)行更新(初始搜索中心為通過 得到的參考幀中的位置),具體步驟如下(1)如果四個(gè) 都相等,表明轉(zhuǎn)換后編碼宏塊包含的四個(gè)8*8塊具有相同的運(yùn)動(dòng)趨勢(shì),不需要對(duì) 進(jìn)行更新;(2)如果四個(gè) 都不相等,搜索窗口大小為±2;(3)如果上述情況都不成立,選取相對(duì)較小的搜索窗口對(duì)其進(jìn)行更新,搜索窗口大小為±1。
本發(fā)明具備以下效果由于通過利用已編碼視頻流中的運(yùn)動(dòng)信息和DCT變換得到的直流系數(shù)重新估計(jì)轉(zhuǎn)換編碼后視頻流的運(yùn)動(dòng)矢量,轉(zhuǎn)換編碼后采用幀間編碼方式編碼的宏塊的運(yùn)動(dòng)矢量公式及對(duì) 更新,因而可極大地減少視頻轉(zhuǎn)換編碼過程中的計(jì)算量,提高編碼速度,而且獲得接近于全搜索塊匹配方法的重建視頻圖像質(zhì)量,并可以有效地降低網(wǎng)絡(luò)帶寬變化對(duì)重建視頻圖像質(zhì)量的影響,提高網(wǎng)絡(luò)帶寬的利用率,同時(shí)保證視頻流的可擴(kuò)展性和交互性,提供極佳的視覺體驗(yàn)。。
圖1是空間分辨率視頻轉(zhuǎn)換編碼中的運(yùn)動(dòng)矢量估計(jì)示意2是DCT直流系數(shù)對(duì)應(yīng)位置示意3是視頻序列使用不同空域轉(zhuǎn)換編碼方法PSNR變化示意圖(相對(duì)于FS)圖4是視頻序列Tennis使用不同空域轉(zhuǎn)換編碼方法所得重建視頻圖像具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例進(jìn)一步說明本發(fā)明。
本發(fā)明提出一種基于空間分辨率變換的視頻轉(zhuǎn)換編碼方法(SFMVRE),該方法通過利用已編碼視頻流中的運(yùn)動(dòng)信息和DCT變換得到的直流系數(shù)重新估計(jì)轉(zhuǎn)換編碼后視頻流的運(yùn)動(dòng)矢量,可減少視頻轉(zhuǎn)換編碼過程中的計(jì)算量,提高編碼速度,而且獲得接近于全搜索塊匹配方法的重建視頻圖像質(zhì)量。需要指出,方法處理均是在像素域進(jìn)行的,不在頻域進(jìn)行的主要原因在于頻域視頻轉(zhuǎn)換編碼建立在運(yùn)動(dòng)補(bǔ)償過程的線性化、不考慮幀緩存前的截?cái)嗪瘮?shù)、DCT/IDCT變換在編解碼過程中具有一致的算術(shù)精度以及轉(zhuǎn)換編碼后每個(gè)宏塊的編碼模式和轉(zhuǎn)換前的編碼模式相一致的四個(gè)假設(shè)條件下,但是通常情況下這四種假設(shè)很難成立,因此會(huì)產(chǎn)生漂移錯(cuò)誤而降低重建視頻圖像的質(zhì)量。
假定轉(zhuǎn)換后編碼視頻流的空間分辨率是轉(zhuǎn)換前編碼視頻流的四分之一,考慮到轉(zhuǎn)換編碼器實(shí)現(xiàn)的復(fù)雜性和速度等因素,空域降采樣濾波器選用最簡(jiǎn)單的四點(diǎn)像素值取平均的方式或其它方法實(shí)現(xiàn)。
視頻編碼國(guó)際標(biāo)準(zhǔn)中,幀間預(yù)測(cè)編碼可采用幀預(yù)測(cè)和場(chǎng)預(yù)測(cè)兩種方式,因此前向預(yù)測(cè)幀的每一宏塊運(yùn)動(dòng)矢量的個(gè)數(shù)可能是一個(gè)或兩個(gè)。如果空間分辨率轉(zhuǎn)換編碼前輸入編碼視頻流中使用幀間編碼方式編碼的宏塊采用幀預(yù)測(cè)方式,那么所得的運(yùn)動(dòng)矢量就是該宏塊的運(yùn)動(dòng)矢量。如果采用場(chǎng)預(yù)測(cè),每一宏塊被分成16*8奇偶兩個(gè)塊,則該宏塊的運(yùn)動(dòng)矢量為DCT變換后擁有大的直流系數(shù)之和的16*8塊對(duì)應(yīng)的運(yùn)動(dòng)矢量,這樣做的原因在于塊匹配方法建立宏塊內(nèi)所有像素都處于平動(dòng)狀態(tài)下且擁有相同的運(yùn)動(dòng)趨勢(shì)這一假設(shè)條件下,但通常在物體邊緣處,這一條件很難滿足,所以塊匹配方法在物體邊緣處存在產(chǎn)生大的預(yù)測(cè)誤差這一趨勢(shì),同時(shí)經(jīng)過運(yùn)動(dòng)補(bǔ)償?shù)玫降臍埐詈陦K的像素值服從拉普拉斯分布,這意味著量化后直流系數(shù)不為零的可能性大于交流系數(shù),且實(shí)驗(yàn)證明宏塊的活動(dòng)性與DCT系數(shù)的能量有關(guān),所以選擇大的DC系數(shù)作為宏塊活動(dòng)性的判斷標(biāo)志。
空間分辨率轉(zhuǎn)換編碼后得到的編碼視頻流的每一個(gè)宏塊對(duì)應(yīng)于轉(zhuǎn)換前編碼視頻流的四個(gè)宏塊,為了加快運(yùn)動(dòng)矢量重估過程,可利用這四個(gè)宏塊及其相鄰八個(gè)宏塊的運(yùn)動(dòng)矢量來計(jì)算轉(zhuǎn)換編碼后編碼視頻流中相應(yīng)宏塊的運(yùn)動(dòng)矢量。如圖1所示, 是轉(zhuǎn)換編碼后編碼視頻流中采用幀間編碼方式編碼的宏塊的運(yùn)動(dòng)矢量, (i=1...4)是構(gòu)成該宏塊對(duì)應(yīng)的四個(gè)轉(zhuǎn)換編碼前對(duì)應(yīng)宏塊的運(yùn)動(dòng)矢量,為降低塊間效應(yīng)對(duì)重建視頻質(zhì)量的影響,方法也利用與它們相鄰的八個(gè)宏塊的運(yùn)動(dòng)矢量 (i=1...8)參與部分宏塊的運(yùn)動(dòng)矢量重估過程來平滑運(yùn)動(dòng)場(chǎng),從而提高重建視頻圖像質(zhì)量。
如果轉(zhuǎn)換編碼后宏塊對(duì)應(yīng)的轉(zhuǎn)換編碼前的四個(gè)宏塊中任何一個(gè)宏塊采用幀內(nèi)編碼方式,則轉(zhuǎn)換編碼后的宏塊也采用幀內(nèi)編碼方式,否則采用幀間編碼方式,原因在于通過適量的引入幀內(nèi)編碼宏塊,能提高重建視頻圖像的質(zhì)量,轉(zhuǎn)換編碼后采用幀間編碼方式編碼的宏塊的運(yùn)動(dòng)矢量可由公式(1-5)計(jì)算獲得。
v→s=(r×v→i+(1-r)Σj=18wnj×v→nj)/2---(1-5)]]>公式(1-5)中,wnj=0.125,r、 的取值方式如下(4)如果四個(gè) 都相等,表明這些宏塊運(yùn)動(dòng)相對(duì)平坦,所以選取四個(gè)宏塊中任一 作為上式中 的取值,r=1;(5)如果四個(gè) 都不相等,表明這些宏塊運(yùn)動(dòng)比較劇烈,轉(zhuǎn)換編碼后產(chǎn)生塊效應(yīng)的可能性較大,需要利用相鄰宏塊的運(yùn)動(dòng)矢量來對(duì)局部運(yùn)動(dòng)矢量場(chǎng)進(jìn)行平滑,同時(shí)考慮到塊匹配運(yùn)動(dòng)估計(jì)在這樣的區(qū)域產(chǎn)生大的預(yù)測(cè)殘差的可能性較大,所以選取四個(gè)宏塊中殘差DCT直流系數(shù)(如圖2所示,構(gòu)成其四個(gè)塊殘差DCT直流系數(shù)之和)最大的那個(gè) 作為上式中 的取值,r=0.75;(6)如果上述情況都不成立,表明四個(gè)宏塊中部分宏塊位于物體內(nèi)部,部分宏塊位于物體邊緣的可能性很大,由于塊匹配運(yùn)動(dòng)估計(jì)固有的缺點(diǎn)使其在物體邊緣處產(chǎn)生的運(yùn)動(dòng)矢量與物體運(yùn)動(dòng)的總體趨勢(shì)可能不一致,從而導(dǎo)致轉(zhuǎn)換編碼后在物體邊緣處產(chǎn)生塊效應(yīng)的可能性增加,所以選取四個(gè)宏塊中殘差DCT直流系數(shù)最小的那個(gè) 作為上式中的取值,使其逼近于物體的總體運(yùn)動(dòng)趨勢(shì),r=1。
完成上述過程后,為了使 更加精確化,需要根據(jù)轉(zhuǎn)換編碼后宏塊對(duì)應(yīng)的原編碼視頻流中四個(gè)宏塊的運(yùn)動(dòng)矢量 的情況選擇合適的搜索窗口對(duì) 進(jìn)行更新(初始搜索中心為通過 得到的參考幀中的位置),具體步驟如下(4)如果四個(gè) 都相等,表明轉(zhuǎn)換后編碼宏塊包含的四個(gè)8*8塊具有相同的運(yùn)動(dòng)趨勢(shì),所以不需要對(duì) 進(jìn)行更新;(5)如果四個(gè) 都不相等,表明轉(zhuǎn)換后編碼宏塊包含的四個(gè)8*8塊具有不同的運(yùn)動(dòng)趨勢(shì),所以應(yīng)選取較大的搜索窗口對(duì)其進(jìn)行更新,搜索窗口大小為±2;(6)如果上述情況都不成立,表明該區(qū)域運(yùn)動(dòng)相對(duì)平緩,所以選取相對(duì)較小的搜索窗口對(duì)其進(jìn)行更新,搜索窗口大小為±1。
空間分辨率轉(zhuǎn)換編碼實(shí)驗(yàn)中,對(duì)七個(gè)不同運(yùn)動(dòng)復(fù)雜度、編碼速率為384kbit/s的CIF格式視頻序列做了測(cè)試,每個(gè)序列均編碼100幀,缺省搜索窗口大小為±7,GOP(group of picture)采用IPPPPPPPPP這樣的結(jié)構(gòu),空域降采樣后編碼速率為96kbit/s。
表1-1不同序列使用各種空域轉(zhuǎn)換編碼方法所得PSNR(單位dB)(相對(duì)于FS) 表1-1中比較了MEAN、AMVR、MEDIAN、PME、SFMVRE、SFMVRE+R方法相對(duì)于FS方法的PSNR變化情況??梢钥闯觯琈EAN方法的重建視頻圖像質(zhì)量最差,原因在于該方法只是簡(jiǎn)單地對(duì)四個(gè)宏塊的運(yùn)動(dòng)矢量做平均而不考慮任何紋理信息;AMVR方法次之,原因在于其通過非零交流系數(shù)的個(gè)數(shù)作為四個(gè)運(yùn)動(dòng)矢量的權(quán)重,所以在視頻序列運(yùn)動(dòng)相對(duì)平緩時(shí)運(yùn)動(dòng)矢量通過該權(quán)重可獲得一定程度的區(qū)分,從而得到略優(yōu)于AMVR方法的重建視頻質(zhì)量,如視頻序列Akiyo、Garden,但當(dāng)視頻序列運(yùn)動(dòng)劇烈時(shí),每個(gè)宏塊都可能包含較多的非零交流系數(shù),那么通過非零交流系數(shù)得到的權(quán)重就失去了意義,此時(shí)AMVR方法類似于MEAN方法,甚至在運(yùn)動(dòng)劇烈的視頻序列Football、Mobile中AMVR方法的重建視頻質(zhì)量低于MEAN方法;MEDIAN方法通過選取四個(gè)運(yùn)動(dòng)矢量中與其它三個(gè)距離最小的運(yùn)動(dòng)矢量作為當(dāng)前宏塊的運(yùn)動(dòng)矢量,當(dāng)視頻運(yùn)動(dòng)相對(duì)平緩時(shí),該方法傾向于選取預(yù)測(cè)殘差小的運(yùn)動(dòng)矢量,所以重建視頻圖像質(zhì)量較好,但當(dāng)運(yùn)動(dòng)劇烈時(shí),由于各宏塊的運(yùn)動(dòng)變化很大,通過該方法選擇的運(yùn)動(dòng)矢量缺乏代表性,所以重建視頻質(zhì)量較差;PME方法通過對(duì)四個(gè)運(yùn)動(dòng)矢量及其均值進(jìn)行塊匹配運(yùn)算等一系列步驟獲得運(yùn)動(dòng)矢量,當(dāng)視頻運(yùn)動(dòng)平緩時(shí),該方法獲得的運(yùn)動(dòng)矢量比較準(zhǔn)確,而且當(dāng)視頻運(yùn)動(dòng)劇烈時(shí),該方法以塊匹配運(yùn)算后SAD值的倒數(shù)作為每個(gè)運(yùn)動(dòng)矢量的權(quán)重,由于利用了當(dāng)前編碼宏塊在參考幀中的實(shí)際SAD值,所以最終獲得的運(yùn)動(dòng)矢量略優(yōu)于上述其它方法;SFMVRE方法通過對(duì)視頻序列中運(yùn)動(dòng)劇烈的區(qū)域進(jìn)行平滑,同時(shí)對(duì)運(yùn)動(dòng)相對(duì)平緩的區(qū)域選擇使其更接近于局部區(qū)域總體運(yùn)動(dòng)趨勢(shì)的方法,很好地改善了重建視頻圖像質(zhì)量,特別是當(dāng)視頻序列運(yùn)動(dòng)劇烈時(shí),如Football、Mobile;SFMVRE+R(refinement)方法通過對(duì)SFMVRE方法得到的運(yùn)動(dòng)矢量進(jìn)行更新,可獲得接近于FS方法的重建視頻圖像質(zhì)量,特別對(duì)Football視頻序列而言,該方法獲得的重建視頻圖像質(zhì)量略高于FS算的重建視頻圖像質(zhì)量,原因在于該序列運(yùn)動(dòng)非常劇烈,所以某些圖像獲得的運(yùn)動(dòng)矢量接近或位于搜索窗的邊緣,此時(shí)再通過進(jìn)一步的更新,可能找到更符合物體運(yùn)動(dòng)趨勢(shì)的運(yùn)動(dòng)矢量,導(dǎo)致重建視頻圖像質(zhì)量會(huì)略高于FS方法。
如圖3所示,通過比較運(yùn)動(dòng)平緩的視頻序列Akiyo和運(yùn)動(dòng)劇烈的視頻序列Football采用不同空域轉(zhuǎn)換編碼方法時(shí)PSNR相對(duì)于FS方法的變化情況,可以看出,本發(fā)明提出的SFMVRE方法對(duì)運(yùn)動(dòng)平緩的視頻序列的重建視頻質(zhì)量改善不大,但運(yùn)動(dòng)劇烈的視頻序列相比其它方法重建視頻圖像質(zhì)量有較明顯的改善。
如圖4所示,視頻序列Tennis通過MEAN、AMVR、MEDIAN方法獲得的重建視頻圖像中乒乓球輪廓比較模糊,同時(shí)在乒乓球運(yùn)動(dòng)的軌跡上有明顯的塊效應(yīng),PME方法獲得的乒乓球輪廓好于MEAN、AMVR、MEDIAN方法,同SFMVRE方法獲得的輪廓接近,但乒乓球運(yùn)動(dòng)的軌跡上的塊效應(yīng)比SFMVRE方法明顯,可以看出,本章提出的SFMVRE方法可獲得更接近于FS方法的重建視頻質(zhì)量。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
參考文獻(xiàn)[1]Bo Shen,et al,Adaptive motion-vector resampling for compressed videodownscaling,IEEE Transactions on Circuits and Systems for Video Technology,1999,Vol.9929-936[2]Juniehi NAKAJIMA,et al,Motion vector re-estimation for fast video transcodingfrom MPEG-2 to MPEG-4,NIT Cyber Space Laboratories Justy.W.C.Wong,Oscar.C.AU,Modified predictive motion estimation forreduced-resolution video from high-resolution compressed video,ISCAS.99,1999,4524-52權(quán)利要求
1.一種基于空間分辨率變換的視頻轉(zhuǎn)換編碼方法,通過利用已編碼視頻流中的運(yùn)動(dòng)信息和DCT變換得到的直流系數(shù)重新估計(jì)轉(zhuǎn)換編碼后視頻流的運(yùn)動(dòng)矢量,其特征在于,所述方法在像素域進(jìn)行,空域降采樣濾波器選用四點(diǎn)像素值取平均的方式,選擇大的DC系數(shù)作為宏塊活動(dòng)性的判斷標(biāo)志,空間分辨率轉(zhuǎn)換編碼后得到的編碼視頻流的每一個(gè)宏塊對(duì)應(yīng)于轉(zhuǎn)換前編碼視頻流的四個(gè)宏塊,利用這四個(gè)宏塊及其相鄰八個(gè)宏塊的運(yùn)動(dòng)矢量來計(jì)算轉(zhuǎn)換編碼后編碼視頻流中相應(yīng)宏塊的運(yùn)動(dòng)矢量,如果轉(zhuǎn)換編碼后宏塊對(duì)應(yīng)的轉(zhuǎn)換編碼前的四個(gè)宏塊中任何一個(gè)宏塊采用幀內(nèi)編碼方式,則轉(zhuǎn)換編碼后的宏塊也采用幀內(nèi)編碼方式,否則采用幀間編碼方式,轉(zhuǎn)換編碼后采用幀間編碼方式編碼的宏塊的運(yùn)動(dòng)矢量可由公式(1-5)計(jì)算獲得v→s=(r×v→i+(1-r)Σj=18wnj×v→nj)/2---(1-5)]]>公式(1-5)中,wnj=0.125,r、 的取值方式如下(1)如果四個(gè) 都相等,所以選取四個(gè)宏塊中任一 作為上式中 的取值,r=1;(2)如果四個(gè) 都不相等,選取四個(gè)宏塊中殘差DCT直流系數(shù)最大的那個(gè) 作為上式中 的取值,r=0.75;(3)如果上述情況都不成立,選取四個(gè)宏塊中殘差DCT直流系數(shù)最小的那個(gè) 作為上式中的取值,使其逼近于物體的總體運(yùn)動(dòng)趨勢(shì),r=1;為了使 更加精確化,需要根據(jù)轉(zhuǎn)換編碼后宏塊對(duì)應(yīng)的原編碼視頻流中四個(gè)宏塊的運(yùn)動(dòng)矢量 的情況選擇合適的搜索窗口對(duì) 進(jìn)行更新(初始搜索中心為通過 得到的參考幀中的位置),具體步驟如下(1)如果四個(gè) 都相等,表明轉(zhuǎn)換后編碼宏塊包含的四個(gè)8*8塊具有相同的運(yùn)動(dòng)趨勢(shì),不需要對(duì) 進(jìn)行更新;(2)如果四個(gè) 都不相等,搜索窗口大小為±2;(3)如果上述情況都不成立,選取相對(duì)較小的搜索窗口對(duì)其進(jìn)行更新,搜索窗口大小為±1。
全文摘要
本發(fā)明屬于數(shù)據(jù)壓縮及通信領(lǐng)域,涉及視頻壓縮及傳輸領(lǐng)域技術(shù)。為提供一種基于空間分辨率變換的視頻轉(zhuǎn)換編碼方法,可極大地減少視頻轉(zhuǎn)換編碼過程中的計(jì)算量,提高編碼速度,并可以有效地降低網(wǎng)絡(luò)帶寬變化對(duì)重建視頻圖像質(zhì)量的影響,同時(shí)保證視頻流的可擴(kuò)展性和交互性,提供極佳的視覺體驗(yàn)。本發(fā)明采用的技術(shù)方案是,在像素域通過利用已編碼視頻流中的運(yùn)動(dòng)信息和DCT變換得到的直流系數(shù)重新估計(jì)轉(zhuǎn)換編碼后視頻流的運(yùn)動(dòng)矢量,空域降采樣濾波器選用四點(diǎn)像素值取平均的方式,選擇大的DC系數(shù)作為宏塊活動(dòng)性的判斷標(biāo)志,利用四個(gè)宏塊及其相鄰八個(gè)宏塊的運(yùn)動(dòng)矢量來計(jì)算轉(zhuǎn)換編碼后編碼視頻流中相應(yīng)宏塊的運(yùn)動(dòng)矢量。本發(fā)明主要用于數(shù)據(jù)壓縮及通信。
文檔編號(hào)H04N7/30GK1801939SQ200510122589
公開日2006年7月12日 申請(qǐng)日期2005年12月22日 優(yōu)先權(quán)日2005年12月22日
發(fā)明者李華, 魯照華, 侯玲 申請(qǐng)人:天津大學(xué)