專利名稱:頻域任意比例降采樣視頻轉(zhuǎn)碼方法及其轉(zhuǎn)碼器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻圖像處理領(lǐng)域,更具體地,涉及一種頻域任意比例的降采樣視頻轉(zhuǎn)碼方法及實現(xiàn)其的轉(zhuǎn)碼器。
背景技術(shù):
隨著計算機、網(wǎng)絡技術(shù)對媒體技術(shù)的發(fā)展,數(shù)字視頻壓縮技術(shù)得到了廣泛地應用。通常視頻信號按照不同的標準和壓縮編碼后,在不同的環(huán)境介質(zhì)中傳播,在不同的終端上顯示播放,就需要對這些壓縮視頻流進行轉(zhuǎn)碼處理。轉(zhuǎn)碼應用涉及視頻服務器、通用多媒體訪問設備、監(jiān)控系統(tǒng)、機頂盒等諸多多媒體設備和系統(tǒng)。
視頻轉(zhuǎn)碼技術(shù)就是將一種標準和格式的壓縮視頻流處理成更適應于某種特定應用的另一種標準和格式的壓縮視頻流。為了加快視頻轉(zhuǎn)碼的速度,頻域上的視頻轉(zhuǎn)碼成為技術(shù)的主流,這些技術(shù)都依靠頻域的運動補償。
目前的視頻轉(zhuǎn)碼器,多是基于解碼器編碼器串連的結(jié)構(gòu)在空間域進行轉(zhuǎn)碼。就是說,待解碼的碼流先經(jīng)過相應的解碼器完全解碼得到視頻幀,然后在空間域上處理解碼幀,最后將處理后的視頻幀再經(jīng)過相應的編碼器完全編碼得到轉(zhuǎn)碼后的文件。降分辨率的過程也在空間域上進行。
現(xiàn)有一些在頻域上進行降采樣的技術(shù),多采用頻域高頻截斷和低頻重構(gòu)的方法進行降采樣,只可以處理整數(shù)倍的降采樣。有一些算法雖然可以處理任意比例的將采樣,但是計算復雜,轉(zhuǎn)碼需要消耗很大的計算量,在實時應用中面臨很多問題。
發(fā)明內(nèi)容
針對上述問題,本發(fā)明提出了一種可以支持任意比例的降采樣轉(zhuǎn)碼方法,包括步驟對輸入視頻流進行部分解碼;得到解碼幀的DCT系數(shù)塊;根據(jù)得到的DCT系數(shù)塊進行降采樣計算,從而實現(xiàn)任意比例的降采樣;對降采樣的結(jié)果進行部分編碼,從而得到轉(zhuǎn)碼的視頻流。
此外,本發(fā)明還提出了一種頻域降采樣視頻轉(zhuǎn)碼器,包括解碼模塊,對輸入視頻流進行部分解碼;DCT域處理模塊,對解碼的結(jié)果進行DCT域降采樣計算,從而實現(xiàn)任意比例的降采樣;對DCT域處理模塊的輸出進行部分編碼,從而得到轉(zhuǎn)碼的視頻流。
利用本發(fā)明的轉(zhuǎn)碼方法,利用降采樣前的DCT系數(shù),經(jīng)過矩陣運算,直接得到降采樣后的DCT系數(shù),避免了從頻域到空間域的轉(zhuǎn)換,大大加快了轉(zhuǎn)碼速度。
圖1示出了根據(jù)本發(fā)明的頻域任意比例降分辨率方法的示意圖 圖2示出了根據(jù)本發(fā)明的轉(zhuǎn)碼器的系統(tǒng)方框圖 圖3示出了根據(jù)本發(fā)明的轉(zhuǎn)碼方法的流程圖 圖4a)示出了根據(jù)本發(fā)明實施例的一幀原始視頻圖像 圖4b)示出了根據(jù)本發(fā)明實施例的降采樣3/4的一幀圖像
具體實施例方式 圖2給出了根據(jù)本發(fā)明的頻域降分辨率轉(zhuǎn)碼器的方框圖。輸入的視頻碼流首先經(jīng)過210變長解碼模塊、220逆量化模塊得到了運動矢量和幀DCT參差系數(shù)。DCT參差系數(shù)與利用230DCT域運動補償模塊獲得的DCT系數(shù)相加,得到解碼幀的DCT系數(shù)。經(jīng)過240DCT域降采樣模塊,對解碼幀的DCT系數(shù)進行DCT域降采樣,并將結(jié)果發(fā)送到250量化模塊,以便進行量化。最后,通過260變長編碼模塊輸出轉(zhuǎn)碼后的視頻碼流。同時,經(jīng)過270逆量化模塊、280DCT域運動補償模塊,輸出編碼端的重構(gòu)幀。在280的運動補償模塊中,用到了210輸出的運動矢量,經(jīng)過290運動矢量復用模塊得到編碼端的運動矢量。
在DCT域降采樣模塊240中,采用了根據(jù)本發(fā)明的頻域任意比例降采樣方法。所述方法的示意圖如圖1所示。
假設對于一下采樣比例因子m(0<m<1),下采樣后的塊b(8×8)來源于未采樣的塊b`(8m×8m)。塊b`不是與原塊劃分重合的,假設它與k*k個DCT塊b``相交疊。在空間域降采樣過程可以描述為b``平移了位移(w,h)然后截斷為b` b′=m*h(h)*b″*w(w)*n(1) 頻域上的表述為 將B`的高頻系數(shù)截斷 l*B′*r=B=l*M*Hh*B″*Ww*N*r(3) B``的8的整數(shù)倍的DCT變換,與Bref的8點DCT變換有如下轉(zhuǎn)換關(guān)系 B″=T*Bref*T′ 這樣有 B=l*M*Hh*T*Bref*T′*Ww*N*r(4) 計算時,可以預先計算出常數(shù)矩陣 B=Tl(h)*Bref*Tr(w)(5) 當實現(xiàn)上述降采樣方法時,對于一個固定比例,可以作為查找表預先計算并存儲Tl(h)和Tr(w),以加快轉(zhuǎn)碼速度。
根據(jù)本發(fā)明方法的流程圖如圖3所示。在頻域上,對于每一個降采樣后的DCT塊,經(jīng)過步驟310獲得當前塊的邊界坐標。在步驟320,然后根據(jù)降采樣比例計算出對應原始幀的塊邊界坐標。在步驟330中,獲得重疊區(qū)域的DCT系數(shù)塊,在步驟340中計算出來重疊區(qū)域的平移量(w,h)。最后查找預先計算好的系數(shù)矩陣(步驟350),經(jīng)過步驟360的計算,就得到降采樣后的DCT系數(shù)塊。在步驟370中,將計算好的DCT塊放入重構(gòu)幀中。在步驟380中,確定是否計算下一個子快,并據(jù)此確定是否繼續(xù)計算。
本發(fā)明提出了一種任意比例降采樣的視頻轉(zhuǎn)碼器和轉(zhuǎn)碼方法,在頻域直接從原始圖像的DCT系數(shù)得到降采樣后的DCT系數(shù)。該轉(zhuǎn)碼器可以從原始的大分辨率視頻,得到任意大小的小尺寸視頻。具有廣泛的應用前景。圖4給出了視頻foreman一幀的降采樣結(jié)果,降采樣比例為3/4,其中圖4a為原始圖像,圖4b為采用根據(jù)本發(fā)明的降采樣方法得到的降采樣圖像。
權(quán)利要求
1.一種頻域視頻轉(zhuǎn)碼方法,包括步驟
對輸入視頻流進行部分解碼;
得到解碼幀的DCT系數(shù)塊;
根據(jù)得到的DCT系數(shù)塊進行降采樣計算,從而實現(xiàn)任意比例的降采樣;
對降采樣的結(jié)果進行部分編碼,從而得到轉(zhuǎn)碼的視頻流。
2.如權(quán)利要求1所述的方法,其中,從原始幀中得到降采樣的DCT系數(shù)塊的重疊區(qū)域和重疊區(qū)域的平移量,并根據(jù)重疊區(qū)域的DCT系數(shù)塊、平移量和有關(guān)降采樣的信息,計算得到降采樣后的DCT系數(shù)塊。
3.如權(quán)利要求1或2所述的方法,其中,在進行降采樣計算時,使用預先計算的查找表來得到有關(guān)降采樣的信息。
4.如權(quán)利要求3所述的方法,其中所述查找表包括以下信息中得至少一個DCT基轉(zhuǎn)換信息T、位移平移量信息H和W、空間域截斷信息M和N以及頻域截斷信息l和r。
5.如權(quán)利要求4所述的方法,其中所述查找表以平移量H和W為索引,并表現(xiàn)為一組二維矩陣系數(shù)的形式。
6.一種頻域降采樣視頻轉(zhuǎn)碼器,包括
解碼模塊,對輸入視頻流進行部分解碼;
DCT域處理模塊,對解碼的系數(shù)塊進行DCT域降采樣計算,以實現(xiàn)任意比例的降采樣;
編碼模塊,對DCT域處理模塊的輸出進行部分編碼,從而得到轉(zhuǎn)碼的視頻流。
全文摘要
一種支持任意比例的降采樣轉(zhuǎn)碼方法,包括步驟對輸入視頻流進行部分解碼;得到解碼幀的DCT系數(shù)塊;根據(jù)得到的DCT系數(shù)塊進行降采樣計算,從而實現(xiàn)任意比例的降采樣;對降采樣的結(jié)果進行部分編碼,從而得到轉(zhuǎn)碼的視頻流。利用本發(fā)明的轉(zhuǎn)碼方法,利用降采樣前的DCT系數(shù),經(jīng)過矩陣運算,直接得到降采樣后的DCT系數(shù),避免了從頻域到空間域的轉(zhuǎn)換,大大加快了轉(zhuǎn)碼速度。
文檔編號H04N7/26GK101309402SQ20071009739
公開日2008年11月19日 申請日期2007年5月15日 優(yōu)先權(quán)日2007年5月15日
發(fā)明者偉 文, 昀 劉, 胡洪濤 申請人:北京三星通信技術(shù)研究有限公司, 三星電子株式會社