專利名稱:數(shù)字視頻信號(hào)的壓縮方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種數(shù)字視頻信號(hào)的壓縮方法及裝置,尤其涉及一種彩色數(shù)字視頻信號(hào)的壓縮方法及裝置。
背景技術(shù):
視頻信號(hào)按其表示形式可分為模擬視頻和數(shù)字視頻。目前,對(duì)數(shù)字視頻信號(hào)的壓縮方法存在一些標(biāo)準(zhǔn)和非標(biāo)準(zhǔn)的方法。下面分別介紹三種廣泛使用的視頻信號(hào)壓縮標(biāo)準(zhǔn)。
1.H.261標(biāo)準(zhǔn)國(guó)際電報(bào)電話咨詢委員會(huì)于1990年12月提出了H216壓縮標(biāo)準(zhǔn)。按此標(biāo)準(zhǔn)組成編/解碼器。編碼器包括幀間差分編碼、幀內(nèi)正交變換編碼和變長(zhǎng)編碼等。幀間差分編碼采用了運(yùn)動(dòng)補(bǔ)嘗幀間預(yù)測(cè)方式,它消除了隨時(shí)間變化的冗余信息;正交變換編碼后,可去除幀內(nèi)空間變化冗余信息。經(jīng)上述兩項(xiàng)措施,可實(shí)現(xiàn)壓縮編碼,大大壓縮數(shù)據(jù)量。最后將變字長(zhǎng)編碼輸出的數(shù)據(jù)送入緩存器中,在輸出時(shí)鐘的作用下送出等字長(zhǎng)的編碼數(shù)據(jù)。為防止緩沖器溢出,利用緩沖器輸出一個(gè)信號(hào)對(duì)量化器進(jìn)行控制,如發(fā)現(xiàn)緩沖器快要溢出,則送出一信號(hào)使它進(jìn)入粗量化,這樣,量化器輸出的數(shù)據(jù)量減小,使緩沖器不致溢出。反之,緩沖器送出一控制信號(hào),使量化器進(jìn)行細(xì)量化,致使輸出數(shù)據(jù)量增加。從而實(shí)現(xiàn)了自適應(yīng)量化的目的。
2.MPEG-1標(biāo)準(zhǔn)1992年,運(yùn)動(dòng)圖像專家組正式提出了該標(biāo)準(zhǔn),用于以大約1.5Mbit/s的比特率對(duì)數(shù)字存儲(chǔ)媒體(光盤,硬盤等)的活動(dòng)圖像及其伴音的編碼。該標(biāo)準(zhǔn)包括系統(tǒng),視頻和伴音三個(gè)部分。其中數(shù)字視頻是標(biāo)準(zhǔn)的核心。MPEG-1標(biāo)準(zhǔn)視頻壓縮編碼主要通過(guò)兩項(xiàng)基本技術(shù)一是基于16×16塊運(yùn)動(dòng)補(bǔ)償,此技術(shù)適用于預(yù)測(cè)編碼和插補(bǔ)編碼,它可以減少幀序列時(shí)間冗余度;二是基于離散余弦變換的壓縮技術(shù),可以減少空間冗余度。在MPEG-1標(biāo)準(zhǔn)中,變換域不僅用于幀內(nèi)壓縮,而且對(duì)幀間預(yù)測(cè)誤差再作變換域變換,以達(dá)到進(jìn)一步壓縮數(shù)據(jù)的目的。MPEG-1標(biāo)準(zhǔn)的各種軟件或硬件實(shí)現(xiàn),加速了多媒體終端的發(fā)展,延伸和完善了通信網(wǎng)絡(luò)。
3.MPEG-2標(biāo)準(zhǔn)MPEG-2標(biāo)準(zhǔn)主要用于對(duì)符合CCIR601廣播質(zhì)量的數(shù)字電視和高清晰度電視的壓縮編碼。該標(biāo)準(zhǔn)對(duì)MPEG-1標(biāo)準(zhǔn)進(jìn)行了兼容性擴(kuò)展,以適應(yīng)在不同比特率和分辨率下的應(yīng)用。MPEG-2支持三種色度信號(hào)的亞取樣方式,即4∶2∶0,4∶2∶2,和4∶4∶4。其運(yùn)動(dòng)補(bǔ)償模式可以是16×8和D-P模式,16×8運(yùn)動(dòng)補(bǔ)償模式只用于場(chǎng)圖像,每個(gè)宏塊中采用兩個(gè)運(yùn)動(dòng)矢量,各對(duì)應(yīng)頂場(chǎng)和底場(chǎng)中的一個(gè)16×8的區(qū)域。如果是雙向預(yù)測(cè),則需要四個(gè)運(yùn)動(dòng)矢量。MPEG-2提供空間和時(shí)間上的分辨率可調(diào)整編碼,適應(yīng)隔行掃描的預(yù)測(cè)方法和塊掃描方式。
由于目前的國(guó)際標(biāo)準(zhǔn)以及其它非標(biāo)準(zhǔn)壓縮方法都將視頻信號(hào)按“場(chǎng)”、“幀”單獨(dú)處理,對(duì)運(yùn)動(dòng)圖像而言,還需要增加“運(yùn)動(dòng)補(bǔ)償”等各種時(shí)空整合技術(shù)。所有編碼技術(shù)都沒有將彩色圖像的“色調(diào)”的冗余信息考慮到編碼過(guò)程中,因此,在彩色視頻信號(hào)的壓縮過(guò)程中,圖像的“高質(zhì)量”與“高壓縮”的矛盾不能很好的解決。
技術(shù)內(nèi)容本發(fā)明的目的在于提供一種視頻信號(hào)的壓縮方法及裝置,在保證視頻信號(hào)質(zhì)量的前提下,極大地提高視頻的壓縮比。
本發(fā)明是通過(guò)如下步驟來(lái)完成對(duì)數(shù)字視頻信號(hào)壓縮的數(shù)據(jù)提取步驟提取數(shù)字彩色視頻信號(hào)的連續(xù)幾個(gè)幀,每幀為紅、綠、蘭三個(gè)單色幀圖像以四維超立方體形數(shù)據(jù)排列成四維矩陣并存儲(chǔ);四維矩陣分割步驟對(duì)上述的四維矩陣劃分為四維子矩陣;四維矩陣變換步驟對(duì)四維子矩陣進(jìn)行四維矩陣離散余弦變換,計(jì)算出四維系數(shù)矩陣;矢量量化步驟對(duì)四維系數(shù)矩陣進(jìn)行矢量量化。
本發(fā)明所提供的數(shù)字彩色視頻信號(hào)壓縮裝置,它由以下裝置組成數(shù)據(jù)提取裝置用于提取數(shù)字彩色視頻信號(hào)的連續(xù)幾個(gè)幀,每幀為紅、綠、蘭三個(gè)單色幀圖像信號(hào),以四維超立方體形數(shù)據(jù)排列成四維矩陣并存儲(chǔ);四維矩陣分割裝置用于對(duì)上述的四維矩陣劃分為四維子矩陣;四維矩陣變換裝置對(duì)四維子矩陣進(jìn)行四維矩陣離散余弦變換,計(jì)算出四維系數(shù)矩陣;矢量量化裝置用于對(duì)四維系數(shù)矩陣進(jìn)行矢量量化。
本發(fā)明全面考慮了彩色視頻信號(hào)的冗余信息,并考慮了時(shí)間、空間和色調(diào)的相關(guān)及整體性,從而在保證信號(hào)質(zhì)量的前提下提高數(shù)字視頻信號(hào)的壓縮比。
下面結(jié)合附圖和實(shí)施方式對(duì)本發(fā)明做進(jìn)一步的說(shuō)明。
圖1、本發(fā)明所指的數(shù)字視頻信號(hào)壓縮方法的流程圖;圖2、本發(fā)明所指的數(shù)字視頻信號(hào)壓縮裝置的方框具體實(shí)施例方式本發(fā)明的核心內(nèi)容是在數(shù)字視頻壓縮方法和裝置中引入了四維矩陣及其算法的定義,以及四維矩陣離散余弦變換;數(shù)據(jù)提取及矢量量化為現(xiàn)有技術(shù)。
四維矩陣基本定義由I×J×K×L個(gè)實(shí)數(shù)aijkl(1≤i≤I,1≤j≤J,1≤k≤K,1≤l≤L)構(gòu)成的I個(gè)行,J個(gè)列,K個(gè)縱序和L個(gè)深度的超立方體形數(shù)據(jù)排列,稱為I×J×K×L階四維矩陣,記為AI×J×K×L=[aijkl]I×J×K×L=]]>
其中aijkl稱為四維矩陣AI×J×K×L的元素四維子矩陣定義對(duì)任何一個(gè)四維矩陣AI×J×K×L都可以用一些橫線,豎線,縱線和深線分成尺寸小的四維矩陣,這樣的小四維矩陣稱為四維矩陣AI×J×K×L的四維子矩陣AU×V×W×S其中U<I;V<J;W<K;S<L。
四維矩陣的運(yùn)算準(zhǔn)則四維矩陣的相等,相加,相乘及變換等準(zhǔn)則如下相等指兩個(gè)同階的四維矩陣AI×J×K×L=[aijkl]I×J×K×L]]>和BI×J×K×L=[bijkl]I×J×K×L]]>有aijkl=bijkl(1≤i≤I,1≤j≤J,1≤k≤K,1≤l≤L)加法指兩個(gè)同階的四維矩陣AI×J×K×L=[aijkl]I×J×K×L]]>和BI×J×K×L=[bijkl]I×J×K×L]]>相加AI×J×K×L+BI×J×K×L=[aijkl+bijkl]I×J×K×L]]>(1≤i≤I,1≤j≤J,1≤k≤K,1≤l≤L)乘法指兩個(gè)四維矩陣AI1×J1×K1×L1=[aijkl]I1×J1×K1×L1]]>和BI2×J2×K2×L2=[bijkl]I2×J2×K2×L2]]>行列乘(I類乘法)(AI1×J1×K1×L1·BI2×J2×K2×L2)I=[Cijkl]I3×J3×K3×L3]]>其中K3=K2=K1L3=L2=L1,J1=I2,I3=I1,J3=J2并且cijkl=Σe=1jaiekl·bejkl]]>(i=1,2,.....I3;j=1,2,..J3,k=1,2,...,K3,l=1,2,...,L3).行縱乘(II類乘法)(AI1×J1×K1×L1·BI2×J2×K2×L2)II=[Cijkl]I3×J3×K3×L3]]>
其中J3=J2=J1,L3=L2=L1,K1=I2,I3=I1,K3=K2并且cijkl=Σe=1kaijel·bejkl]]>(i=1,2,.....I3;j=1,2,....J3,k=1,2,...,K3,l=1,2,...,L3).行高乘(III類乘法)(AI1×J1×K1×L1·BI2×J2×K2×L2)III=[Cijkl]I3×J3×K3×L3]]>其中J3=J2=Jl,K3=K2=K1,L1=I2,I3=I1,L3=L2并且Cijkl=Σe=1laijke·bejkl]]>(i=1,2,.....I3;j=1,2,....J3,k=1,2,...,K3,l=1,2,...,L3).列縱乘(IV類乘法)(AI1×J1×K1×L1·BI2×J2×K2×L2)IV=[Cijkl]I3×J3×K3×L3]]>其中I3=I2=I1,L3=L2=L1,K1=J2,J3=J1,K3=K2并且Cijkl=Σe=1kaijel·biekl]]>(i=1,2,.....I3;j=1,2,....J3,k=1,2,...,K3,l=1,2,...,L3).列高乘(V類乘法)(AI1×J1×K1×L1·BI2×J2×K2×L2)V=[Cijkl]I3×J3×L3]]>其中I3=I2=I1,K3=K2=K1,L1=J2,J3=J1,L3=L2并且cijkl=Σe=1laijke·biekl]]>(i=1,2,.....I3;j=1,2,....J3,k=1,2,...,K3,l=1,2,...,L3).縱高乘(VI類乘法)(AI1×J1×K1×L1·BI2×J2×K2×L2)VI=[Cijkl]I3×J3×K3×L3]]>其中I3=I2=I1,J3=J2=J1,L1=K2,K3=K1,L3=L2并且cijkl=Σe=1laijke·bijel]]>(i=1,2,.....I3;j=1,2,....J3,k=1,2,...,K3,l=1,2,...,L3).四維矩陣離散余弦變換(4D-WDCT)定義設(shè) L=1時(shí),i=u,j=vL=2時(shí),i=u,j=wL=3時(shí),i=u,j=sL=4時(shí),i=v,j=wL=5時(shí),i=v,j=sL=6時(shí),i=w,j=s四維矩陣離散余弦變換公式為B=(C6(C5(C4(C3(C2(C1A1T)IC2T)IIC3T)IIIC4T)IVC5T)VC6T)VI四維矩陣離散余弦逆變換公式為A=(C6(C5(C4(C3(C2(C1BC1T)IC2T)IIC3T)IIIC4T)IVC5T)VC6T)VI其中“T“表示轉(zhuǎn)置,B為4×4×3×3的變換系數(shù)子矩陣,A為輸入視頻四維矩陣中4×4×3×3的子矩陣。
在H.261和MPEG標(biāo)準(zhǔn)中,綜合考慮計(jì)算的復(fù)雜性和圖像的塊效應(yīng),圖像被劃分成8×8的子塊,進(jìn)行離散余弦變換。為了與其兼容及利用現(xiàn)有的技術(shù),并充分考慮到方塊效應(yīng)及計(jì)算復(fù)雜度,本發(fā)明采用4×4×3×3的子矩陣分割方法。
具體實(shí)施步驟為數(shù)據(jù)提取步驟對(duì)每幅圖像大小為M×N的數(shù)字彩色視頻信號(hào)的連續(xù)3個(gè)幀,每幀為紅、綠、蘭三個(gè)單色幀,以四維超立方體形數(shù)據(jù)排列成M×N×3×3的四維矩陣并存儲(chǔ)。其“四維”分別為單幀灰度圖像的行、列、彩色圖像的RGB三幀、以及視頻沿時(shí)間方向的連續(xù)3個(gè)幀;四維矩陣分割步驟對(duì)上述的四維矩陣劃分為4×4×3×3的四維子矩陣;四維矩陣變換步驟對(duì)4×4×3×3的四維子矩陣?yán)蒙鲜龅乃木S矩陣離散余弦變換公式進(jìn)行變換,計(jì)算出四維系數(shù)子矩陣;矢量量化步驟對(duì)M×N/16個(gè)四維系數(shù)子矩陣進(jìn)行矢量量化。
具體裝置為數(shù)據(jù)提取裝置用于提取數(shù)字彩色視頻信號(hào)的連續(xù)幾個(gè)幀,每幀為紅、綠、藍(lán)三個(gè)單色幀圖像信號(hào),以四維超立方體形數(shù)據(jù)排列成四維矩陣并存儲(chǔ);四維矩陣分割裝置用于對(duì)上述的四維矩陣劃分為四維子矩陣,采用4×4×3×3的四維子矩陣分割方法,即分割后的四維子矩陣為4行、4列、3縱序和3深度,分割先按行后按列進(jìn)行;
四維矩陣變換裝置利用上述公式對(duì)四維子矩陣進(jìn)行四維矩陣離散余弦變換,計(jì)算出四維系數(shù)矩陣;矢量量化裝置用于對(duì)四維系數(shù)矩陣進(jìn)行矢量量化。
權(quán)利要求
1.數(shù)字視頻信號(hào)壓縮方法,其特征在于它由以下步驟組成數(shù)據(jù)提取步驟提取數(shù)字彩色視頻信號(hào)的連續(xù)幾個(gè)幀,每幀為紅、綠、藍(lán)三個(gè)單色幀圖像信號(hào),以四維超立方體形數(shù)據(jù)排列成四維矩陣并存儲(chǔ);四維矩陣分割步驟對(duì)上述的四維矩陣劃分為四維子矩陣;四維矩陣變換步驟對(duì)四維子矩陣進(jìn)行四維矩陣離散余弦變換,計(jì)算出四維系數(shù)矩陣;矢量量化步驟對(duì)四維系數(shù)矩陣進(jìn)行矢量量化。
2.根據(jù)權(quán)利要求1所述的數(shù)字視頻信號(hào)壓縮方法,其特征在于四維矩陣分割步驟時(shí)采用4×4×3×3的四維子矩陣分割方法,即分割后的四維子矩陣為4行、4列、3縱序和3深度,分割先按行后按列進(jìn)行。
3.根據(jù)權(quán)利要求1或2所述的視頻信號(hào)壓縮方法,其特征在于四維矩陣變換步驟所采用的四維矩陣離散余弦變換公式為B=(C6(C5(C4(C3(C2(C1AC1T)IC2T)IIC3T)IIIC4T)IVC5T)VC6T)VI其中, L=1時(shí),i=u,j=vL=2時(shí),i=u,j=wL=3時(shí),i=u,j=sL=4時(shí),i=v,j=wL=5時(shí),i=v,j=sL=6時(shí),i=w,j=s
4.數(shù)字視頻信號(hào)壓縮裝置,其特征在于它由以下裝置組成數(shù)據(jù)提取裝置用于提取數(shù)字彩色視頻信號(hào)的連續(xù)幾個(gè)幀,每幀為紅、綠、藍(lán)三個(gè)單色幀圖像信號(hào),以四維超立方體形數(shù)據(jù)排列成四維矩陣并存儲(chǔ);四維矩陣分割裝置用于對(duì)上述的四維矩陣劃分為四維子矩陣;四維矩陣變換裝置對(duì)四維子矩陣進(jìn)行四維矩陣離散余弦變換,計(jì)算出四維系數(shù)矩陣;矢量量化裝置用于對(duì)四維系數(shù)矩陣進(jìn)行矢量量化。
5.根據(jù)權(quán)利要求4所述的數(shù)字視頻信號(hào)壓縮裝置,其特征在于四維矩陣分割裝置采用4×4×3×3的四維子矩陣分割方法,即分割后的四維子矩陣為4行、4列、3縱序和3深度,分割先按行后按列進(jìn)行。
6.根據(jù)權(quán)利要求4或5所述的視頻信號(hào)壓縮裝置,其特征在于四維矩陣變換裝置所采用的四維矩陣離散余弦變換公式為B=(C6(C5(C4(C3(C2(C1AC1T)IC2T)IIC3T)IIIC4T)IVC5T)VC6T)VI其中, L=1時(shí),i=u,j=vL=2時(shí),i=u,j=wL=3時(shí),i=u,j=sL=4時(shí),i=v,j=wL=5時(shí),i=v,j=sL=6時(shí),i=w,j=s
全文摘要
本發(fā)明涉及一種數(shù)字視頻信號(hào)的壓縮方法及裝置,尤其涉及一種彩色數(shù)字視頻信號(hào)的壓縮方法及裝置。具體步驟為數(shù)據(jù)提取步驟、矩陣分割步驟、矩陣變換步驟和矢量量化步驟。具體裝置為數(shù)據(jù)提取裝置、矩陣分割裝置、矩陣變換裝置、矢量量化裝置。本發(fā)明全面考慮了彩色視頻的冗余信息,并考慮了時(shí)間、空間和色調(diào)的相關(guān)性及整體性,從而在保證信號(hào)質(zhì)量的前提下提高了數(shù)字彩色視頻信號(hào)的壓縮比。
文檔編號(hào)H04N9/64GK1419378SQ0113345
公開日2003年5月21日 申請(qǐng)日期2001年11月14日 優(yōu)先權(quán)日2001年11月14日
發(fā)明者陳賀新, 王世剛, 趙巖 申請(qǐng)人:陳賀新