專利名稱:用于消除dct編碼的振鈴現(xiàn)象的后濾波器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種高質(zhì)量視頻編碼/解碼系統(tǒng),包括一個(gè)用于消除噪音現(xiàn)象的濾波器,更具體地說(shuō)涉及一種各向異性擴(kuò)散濾波器,它能夠消除任何基于離散余弦變換(DCT)的視頻解碼系統(tǒng)中的振鈴噪音。
眾所周知,基于象素塊離散余弦變換(象素塊DCT)的圖像壓縮算法在一定的情況下會(huì)產(chǎn)生需要消除的噪音。根據(jù)整個(gè)編碼系統(tǒng)的具體細(xì)節(jié),上述產(chǎn)生噪音的情況會(huì)有所不同,在所述編碼系統(tǒng)中,DCT僅僅是其中的一個(gè)部分。
一種近年來(lái)受到人們關(guān)注的視頻壓縮系統(tǒng)是由動(dòng)畫(huà)專家協(xié)會(huì)(MPEG)所建議的系統(tǒng),該協(xié)會(huì)是屬于國(guó)際標(biāo)準(zhǔn)組織(ISO)下的一個(gè)委員會(huì)。MPEG-2系統(tǒng)是由仿真模式編輯協(xié)會(huì)發(fā)表的題為“ MPEG-2視頻”的論文所提出的,登載在ISO的文件ISO-IEC/13818-21995(E)上,本申請(qǐng)采用其有關(guān)MPEG-2視頻信號(hào)編碼和解碼方法的教導(dǎo)作為背景技術(shù)。這一系統(tǒng)類似于名稱為“三維圖像壓縮視頻信號(hào)編碼”的美國(guó)專利4,999,705號(hào)所述的條件移動(dòng)壓縮插值(CMCI)視頻信號(hào)編碼系統(tǒng),本申請(qǐng)采用其有關(guān)視頻編碼技術(shù)作為背景技術(shù)。
MPEG在單個(gè)的系統(tǒng)中采用了若干熟知的數(shù)據(jù)壓縮技術(shù)。這些技術(shù)包括移動(dòng)壓縮的預(yù)測(cè)編碼、離散余弦編碼(DCT)、自適應(yīng)量化和可變長(zhǎng)度編碼(VLC)。在這些系統(tǒng)中,根據(jù)對(duì)取自輸入圖像的64個(gè)象素所組成的象素塊進(jìn)行離散余弦變換而獲得的系數(shù)值來(lái)進(jìn)行自適應(yīng)量化步驟。
DCT系數(shù)是采用變化的分辨率來(lái)予以量化的,所述分辨率是由編碼操作所產(chǎn)生的數(shù)據(jù)量的函數(shù)。在采用固定帶寬頻道的系統(tǒng)中,如果單個(gè)的圖像幀產(chǎn)生了相對(duì)大量的編碼數(shù)據(jù),則有可能需要增大對(duì)連續(xù)圖像幀所施加的量化步長(zhǎng)(使之粗化),以便減小用于代表這些幀的編碼數(shù)據(jù)量。這樣,就能夠通過(guò)固定帶寬頻道來(lái)傳輸在若干幀間隔中產(chǎn)生的平均數(shù)據(jù)量。當(dāng)量化器對(duì)DCT系數(shù)進(jìn)行粗化量化時(shí),如果被編碼的圖像包括具有相對(duì)較少輪廓的對(duì)象,該對(duì)象的再現(xiàn)圖像有可能產(chǎn)生不希望的量化畸變。這種畸變表現(xiàn)為對(duì)象輪廓的失真。
美國(guó)專利5,294,974和5,325,125中披露了MPEG編碼器,本申請(qǐng)以其有關(guān)MPEG編碼器的教導(dǎo)作為背景技術(shù)。
目前,MPEG-2解碼器已經(jīng)在市場(chǎng)上出售。1994年7月和1994年6月在SGS-Thomson Microelectronics(SGS湯姆森微電子)上刊登的“MPEG-2/CCIR601視頻解碼器”一文以及“IBM MPEG-2解碼器芯片用戶指南”一文分別介紹了兩種這樣的解碼器。本申請(qǐng)以其有關(guān)MPEG-2解碼器的教導(dǎo)作為背景技術(shù)。
一般說(shuō)來(lái),有兩種需要消除的噪音現(xiàn)象,即阻塞和振鈴(見(jiàn)Yuen M.和Wu H.,“數(shù)字視頻信號(hào)壓縮中的再現(xiàn)現(xiàn)象”,Proc.of SPIE,Vol.2419,1995年,pp.455-465,本申請(qǐng)以其關(guān)于阻塞和振鈴噪音現(xiàn)象的教導(dǎo)作為背景技術(shù))。阻塞僅僅發(fā)生在設(shè)定DC系數(shù)(亦即平均強(qiáng)度值)時(shí),在非常低的數(shù)據(jù)率情況下最有可能發(fā)生。振鈴發(fā)生在DCT系數(shù),尤其是高頻AC系數(shù),的粗量化帶來(lái)噪音的情況下。振鈴與強(qiáng)邊緣附近出現(xiàn)的噪音相關(guān)。在高質(zhì)量系統(tǒng)(亦即采用低壓縮比的系統(tǒng))中,振鈴是最容易發(fā)生的現(xiàn)象。由于逐幀之間的細(xì)微變化,振鈴噪音在動(dòng)畫(huà)畫(huà)面中以靠近邊緣的局部閃爍形式被人們所察覺(jué)。這種類型的噪音被稱為“蚊式噪音”。
高質(zhì)量系統(tǒng)比低質(zhì)量系統(tǒng)更為昂貴,但能夠產(chǎn)生較少的噪音。在低質(zhì)量系統(tǒng)中產(chǎn)生的占主導(dǎo)地位的噪音是阻塞噪音,而振鈴噪音則主要出現(xiàn)在高質(zhì)量系統(tǒng)中。在低質(zhì)量系統(tǒng)中,人們已經(jīng)作了大量的工作來(lái)減小阻塞效應(yīng),然而這些措施無(wú)法用來(lái)在高質(zhì)量壓縮系統(tǒng)中減小振鈴噪音。
振鈴現(xiàn)象出現(xiàn)在接近強(qiáng)邊緣的平淡背景上。所述現(xiàn)象強(qiáng)于背景,但弱于邊緣。因此,如果知道了局部邊緣強(qiáng)度,就能夠采用它來(lái)定義一個(gè)等級(jí),凡是低于該等級(jí)的變化就被認(rèn)為是不顯著的。
可以采用被稱為各向異性擴(kuò)散的技術(shù)(見(jiàn)Perona P.和Malik J.,“采用各向異性擴(kuò)散技術(shù)的尺度空間和邊緣檢測(cè)”,IEEE Trans.on PatternAnalasis and Machine Intellegence,Vol.12,1990,pp.629-639,本申請(qǐng)以其有關(guān)各向異性擴(kuò)散的教導(dǎo)作為背景技術(shù))來(lái)減小這種類型的噪音現(xiàn)象。各向異性擴(kuò)散可以有選擇性地平滑低于等級(jí)門(mén)限值K的變化,與此同時(shí)保持或者甚至增強(qiáng)高于該門(mén)限值的變化。
KDD R&D Labs已經(jīng)開(kāi)發(fā)了一種后濾波器,用于在卡拉OK設(shè)備上改善MPEG-1圖像(參見(jiàn)Nakajima Y.,“用于抑制MPEG編碼視頻信號(hào)噪音的后處理算法”,日本IEICE技術(shù)報(bào)告,IE94-7,DSP94-7,1994mpp.45-51,本申請(qǐng)以其有關(guān)后濾波器的教導(dǎo)作為背景技術(shù))。這種系統(tǒng)為了計(jì)算最佳局部噪音清除濾波器的線性最小平方評(píng)估而計(jì)算局部均方差。該濾波器是邊緣保持型的,然而以一種明確而復(fù)雜的形式來(lái)處理邊緣依賴性。KDD系統(tǒng)是高度面向MPEG的。它采用該編碼方式的許多復(fù)雜細(xì)節(jié)以及由該方式予以處理的圖像的統(tǒng)計(jì)數(shù)據(jù)。KDD系統(tǒng)的硬件成本十分昂貴。
已經(jīng)發(fā)表了許多有關(guān)使圖像更為清晰和增強(qiáng)圖像的各向異性擴(kuò)散算法的論文(見(jiàn)Saint-Marc P.,Chen J.,Medioni,“自適應(yīng)平滑一種用于早期版本的通用工具”,IEEE Trans.on PAMI,Vol.13,1990,pp.514-529;Alvarez L.,Lions P.,Morel J.,“采用非線性擴(kuò)散II的圖像選擇性平滑和邊緣檢測(cè)”,SIAM J.數(shù)字分析,Vol.29,1990,pp.845-866;本申請(qǐng)采用其有關(guān)使圖像更為清晰和增強(qiáng)圖像的各向異性擴(kuò)散算法的教導(dǎo)作為背景技術(shù)),然而其中幾乎沒(méi)有文獻(xiàn)考慮將其技術(shù)應(yīng)用于象素塊DCT系統(tǒng)。EL-Fallah聲稱采用了各向異性擴(kuò)散技術(shù)作為前濾波器,用于在進(jìn)行壓縮之前消除噪音(見(jiàn)El-Fallah A.,F(xiàn)ord G.,Algazi V.,Estes R,“采用圖像平均曲率擴(kuò)散的邊緣和角部保持”,Proc.of SPIE,Vol.2421,1995,本申請(qǐng)以其有關(guān)各向異性前濾波器的教導(dǎo)作為背景技術(shù))。它不是用作一個(gè)后濾波器。Osher和Rubin開(kāi)發(fā)了一種與之緊密相關(guān)的“沖擊濾波器”,但是沒(méi)有在任何地方提及象素塊DCT系統(tǒng)(見(jiàn)Osher S.,Rubin L.,“采用沖擊濾波器的面向圖形的圖像增強(qiáng)”,SIAM J.數(shù)字分析,Vol.27,1990,pp.919-940,本申請(qǐng)以其有關(guān)沖擊濾波器的教導(dǎo)作為背景技術(shù))。
在各向異性擴(kuò)散中,如果邊緣強(qiáng)度高于小心定義的臨界門(mén)限值K,就會(huì)禁止越過(guò)邊緣進(jìn)行噪音消除平均。這種禁止的平均的結(jié)果是一種邊緣保留平滑,當(dāng)區(qū)域邊界被識(shí)別為高于上述門(mén)限值邊緣時(shí),就會(huì)消除區(qū)域內(nèi)部的噪音并同時(shí)保持該區(qū)域。
上面所引用的Perona和Malik一文建議,對(duì)于具有靜止圖形的圖像來(lái)說(shuō),將臨界門(mén)限值設(shè)定為等于總梯度的90%,但是他們沒(méi)有提供用于局部改變非靜止圖形的門(mén)限值的具體技術(shù)。上述所引用的El-Fallah等人的論文事實(shí)上表明,他們所采用的方案根本就不具有可調(diào)節(jié)的參數(shù)。
上面所述的已知技術(shù)表明,在噪音消除系統(tǒng)中存在一些困難。因此很明顯,有必要提供一種各向異性后濾波器振鈴噪音消除系統(tǒng),它能夠消除MPEG解碼信號(hào)中的振鈴噪音現(xiàn)象。
本發(fā)明提供了一種在視頻信號(hào)編碼/解碼系統(tǒng)中采用的濾波系統(tǒng),包括用于對(duì)輸入視頻信號(hào)進(jìn)行編碼、傳輸經(jīng)過(guò)編碼的數(shù)據(jù)、以及對(duì)數(shù)據(jù)進(jìn)行解碼和濾波的裝置。該濾波系統(tǒng)接受由解碼器產(chǎn)生的采用光柵掃描格式的解碼數(shù)據(jù)塊,并對(duì)它進(jìn)行各向異性擴(kuò)散,以便抑制振鈴噪音現(xiàn)象。
通過(guò)結(jié)合附圖對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明,本發(fā)明的上述以及其他方面將變得更為清楚。
圖1是采用本發(fā)明一種實(shí)施例的系統(tǒng)的方框圖;圖2(a)(已知技術(shù))是一種視頻信號(hào)編碼系統(tǒng)的方框圖;圖2(b)(已知技術(shù))是顯示宏象素塊結(jié)構(gòu)的示意圖;圖2(c)(已知技術(shù))是顯示圖形段的示意圖;圖2(d)(已知技術(shù))是象素圖,它顯示了圖2(a)所示編碼器所采用的折線式掃描方式;圖3(已知技術(shù))是一種示例視頻信號(hào)解碼系統(tǒng)的方框圖;圖4是本發(fā)明的各向異性擴(kuò)散濾波器的一種實(shí)施例的方框圖;圖5(a)和5(b)是適合用于圖4所示的本發(fā)明實(shí)施例的電路方框圖;圖6(a)顯示了圖像的掃描行,它示出了圖形元素(象素)在行中的相對(duì)位置;圖6(b)是電路方框圖,該電路用于確定如圖4、5(a)、5(b)所示電路的門(mén)限值;圖7(a)、7(b)是導(dǎo)率參數(shù)相對(duì)于梯度的曲線圖,它們對(duì)高斯導(dǎo)率曲線與針對(duì)臨界門(mén)限值分別為10和100的限幅直線近似曲線進(jìn)行了比較;圖8是適合用于如圖5(a)、5(b)所示電路中的導(dǎo)率常數(shù)的電路方框圖9是適合用于在圖5(a)、5(b)所示電路中進(jìn)行亮度處理的電路方框圖;附圖10是適合用于在圖5(a)、5(b)所示電路中進(jìn)行色度處理的電路方框圖。
一般說(shuō)來(lái),本發(fā)明的后濾波器是對(duì)經(jīng)過(guò)編碼、傳輸、和最終解碼之后所獲得的數(shù)據(jù)進(jìn)行處理以生成象素塊。在處理這些以光柵掃描格式提供的象素塊時(shí),后濾波器對(duì)每一象素塊確定一個(gè)邊緣有效性門(mén)限值,確定一個(gè)導(dǎo)率值,對(duì)象素塊進(jìn)行各向異性擴(kuò)散以便平滑變量,從而消除低于門(mén)限值的振鈴噪音現(xiàn)象,但同時(shí)保留或增強(qiáng)高于所述門(mén)限值的圖形。換句話說(shuō),如果邊緣強(qiáng)度大于門(mén)限值,邊緣就不會(huì)受到噪音消除的影響。
盡管本發(fā)明是結(jié)合MPEG解碼系統(tǒng)予以說(shuō)明的,但是它適合于任何視頻解碼系統(tǒng),只要這樣的系統(tǒng)是對(duì)量化空間頻率系數(shù)表示的數(shù)據(jù)進(jìn)行解碼。
圖1是本發(fā)明一種實(shí)施例的系統(tǒng)方框圖。其中,將高質(zhì)量視頻信號(hào)數(shù)據(jù)送到編碼器1,該編碼器采用一種MPEG編碼算法對(duì)上述數(shù)據(jù)進(jìn)行編碼,以便對(duì)數(shù)據(jù)進(jìn)行壓縮。編碼器1產(chǎn)生圖像幀,將數(shù)據(jù)變換成塊格式,并進(jìn)行離散余弦變換(DCT)壓縮。將經(jīng)過(guò)壓縮之后的MPEG數(shù)據(jù)流通過(guò)一個(gè)傳輸通道5送到一個(gè)接受裝置。上述傳輸系統(tǒng)和通道5可以是地面或衛(wèi)星傳播通道,也可以是電纜傳輸通道。當(dāng)接受裝置接收到上述數(shù)據(jù)流時(shí),采用一個(gè)MPEG解碼器9進(jìn)行解碼。該解碼器9采用一個(gè)反離散余弦變換(IDCT)處理器和一個(gè)移動(dòng)補(bǔ)償處理器來(lái)獲得用于顯示的象素塊。然而,在顯示之前,需要首先將這些象素塊轉(zhuǎn)換成為光柵掃描數(shù)據(jù),并將該光柵掃描數(shù)據(jù)送到一個(gè)各向異性擴(kuò)散濾波器13。該濾波器13能夠消除圖形中的振鈴噪音現(xiàn)象。當(dāng)光柵掃描數(shù)據(jù)經(jīng)過(guò)上述各向異性擴(kuò)散濾波器13之后,將作為高質(zhì)量數(shù)字視頻信號(hào)予以顯示。
在圖2(a)中顯示了已知編碼器的實(shí)例。在這樣的系統(tǒng)中,由攝像機(jī)(圖中未示)或者其他視頻信號(hào)源以光柵掃描順序提供用于表述一個(gè)圖像的紅色(R)、綠色(G)、和藍(lán)色(B)信號(hào)。這些信號(hào)由一個(gè)已知彩色矩陣電路104予以處理,產(chǎn)生一個(gè)亮度信號(hào)(Y)和兩個(gè)色差信號(hào)(B-Y)和(R-Y)。上述色差信號(hào)(B-Y)和(R-Y)由相應(yīng)的低通濾波器106和108予以處理。示例的濾波器106和108對(duì)相應(yīng)的色差信號(hào)進(jìn)行空間濾波,以便產(chǎn)生一個(gè)信號(hào),該信號(hào)在水平和垂直方向上各具有亮度信號(hào)的一半的空間分辨率。
上述亮度信號(hào)Y和兩個(gè)經(jīng)過(guò)空間濾波的色差信號(hào)B-Y’和R-Y’被送到象素塊轉(zhuǎn)換器110。該轉(zhuǎn)換器110可以包括諸如一個(gè)已知的雙端口存儲(chǔ)器,將信號(hào)Y、(B-Y)’、和(R-Y)’由光柵掃描格式轉(zhuǎn)換為塊格式。
在塊格式下,每一幀圖像由一系列象素塊來(lái)表示,其中每一象素塊包括64個(gè)象素,這些象素以每行8個(gè)象素和每列8個(gè)象素排列成為一個(gè)矩陣。象素塊轉(zhuǎn)換器110將若干個(gè)連續(xù)的象素塊組合成為一個(gè)被稱為宏象素塊的數(shù)據(jù)結(jié)構(gòu)。圖2(b)顯示了一個(gè)宏象素塊330,這些象素值用8位數(shù)字值來(lái)表示。象素塊轉(zhuǎn)換器110每一次將一個(gè)塊的象素值送到減法器112。
減法器112從象素塊轉(zhuǎn)換器110所提供的宏象素塊的相應(yīng)象素塊中減去由移動(dòng)補(bǔ)償電路134所提供的宏象素塊的相應(yīng)象素塊。減法器112產(chǎn)生的象素塊代表了經(jīng)過(guò)動(dòng)畫(huà)預(yù)測(cè)性差分編碼的宏象素塊。將產(chǎn)生的象素塊送到DCT處理器114。DCT處理器114對(duì)6個(gè)具有差分象素值的塊中的每一個(gè)進(jìn)行離散余弦變換,將它們轉(zhuǎn)換成為6個(gè)相應(yīng)的DCT系數(shù)塊。然后,采用如附圖2(d)所示的折線掃描,將這些塊重新排列成為一個(gè)由64個(gè)系數(shù)組成的直線數(shù)據(jù)串。
對(duì)于任何塊來(lái)說(shuō),上述系數(shù)中的第一個(gè)代表象素塊中象素的直流(DC)空間頻率分量,其余的系數(shù)代表空間頻率的逐個(gè)高次分量。
將DCT處理器114提供的系數(shù)值送到量化器116,該量化器將每一個(gè)系數(shù)值轉(zhuǎn)換成為具有指定位數(shù)的二進(jìn)制值。一般說(shuō)來(lái),由于人眼對(duì)具有較低空間頻率的圖像成分比具有較高空間頻率的圖像成分更為敏感,因此較之高階系數(shù)而言,對(duì)于低階系數(shù)采用更多的位數(shù)。例如,可以通過(guò)采用相應(yīng)的不同值來(lái)分解經(jīng)過(guò)線性化之后的象素塊中的每一個(gè)系數(shù)值實(shí)現(xiàn)上述操作,該不同值與系數(shù)的頻率成正比。包含這些數(shù)值的陣列可以與信號(hào)一起傳輸,以便在信號(hào)的傳輸終點(diǎn)解除對(duì)信號(hào)的量化。
此外,也可以根據(jù)下面將要介紹的量化控制電路122所提供的數(shù)值來(lái)改變?yōu)槊恳粋€(gè)系數(shù)所指定的位數(shù)??梢詫?duì)每一個(gè)宏象素塊施加上述數(shù)值中的一個(gè),以便在通過(guò)與頻率有關(guān)的數(shù)值陣列來(lái)分解系數(shù)之前或之后,采用這些數(shù)值來(lái)分解宏象素塊中每一個(gè)系數(shù)值。量化器116產(chǎn)生了一個(gè)數(shù)字值串,它被送到可變長(zhǎng)度編碼器118和反向量化器124。
上述可變長(zhǎng)度編碼器118采用例如幅值掃描寬度Huffman型編碼對(duì)數(shù)據(jù)進(jìn)行編碼。可變長(zhǎng)度編碼器118產(chǎn)生的信號(hào)被送到一個(gè)先進(jìn)先出(FIFO)緩沖器120,該緩沖器存儲(chǔ)該數(shù)值,以預(yù)定的速率傳送該數(shù)值作為信號(hào)輸出。
在固定帶寬頻道應(yīng)用場(chǎng)合中,量化控制電路122通過(guò)控制量化器116施加的量化步長(zhǎng)來(lái)補(bǔ)償產(chǎn)生被編碼信息的變化速率。根據(jù)各個(gè)有關(guān)緩沖器存滿程度的信號(hào),上述量化控制電路122使得量化器116有條件地為DCT處理器114提供的系數(shù)值提供不同的量化分辨率。當(dāng)緩沖器存儲(chǔ)了更多的數(shù)據(jù)時(shí),控制電路122就讓量化器116對(duì)系數(shù)值提供不斷粗化的量化分辨率。
這樣,當(dāng)FIFO緩沖器120存儲(chǔ)了不斷增多的數(shù)據(jù)時(shí),量化器116通過(guò)更為粗化地量化代表被接受圖像的DCT系數(shù)來(lái)產(chǎn)生較少位的編碼數(shù)據(jù)。當(dāng)數(shù)據(jù)最終被解碼并準(zhǔn)備予以顯示時(shí),上述粗化就會(huì)導(dǎo)致在數(shù)據(jù)中產(chǎn)生振鈴噪音現(xiàn)象。
在傳輸數(shù)值之后,將它們接受并進(jìn)行解碼。圖3顯示了一種典型的解碼器。將捕獲的數(shù)據(jù)送到可變長(zhǎng)度解碼器(VLD)123,它進(jìn)行與附圖2(a)所示的可變長(zhǎng)度編碼器118相反的可變長(zhǎng)度編碼操作。此外,VLD123提取出經(jīng)過(guò)編碼的移動(dòng)向量信息,并將它送到圖形補(bǔ)償處理器134。固定長(zhǎng)度編碼數(shù)據(jù)塊被送到一個(gè)反向量化器124,它進(jìn)行與量化器116相反的操作,以便產(chǎn)生代表被編碼圖像的每一象素塊的近似DCT系數(shù)。
對(duì)應(yīng)于DCT象素塊8行(一個(gè)象素塊)高度的一列,將與DCT塊邊界垂直對(duì)齊的8行定義為一個(gè)圖像片段。每一圖像片段的象素塊數(shù)目等于圖片寬度與DCT塊寬度的比值。這樣,例如480行的MPEG編碼圖片包括60圖像片段,每一個(gè)圖像片段的高度為8行。附圖2(c)顯示了對(duì)應(yīng)于圖片350和DCT宏象素塊360的圖像片段370。
將反向量化器124產(chǎn)生的系數(shù)值塊送到反離散余弦變換(IDCT)處理器126。該處理器進(jìn)行反向離散余弦變換操作,以便形成圖像象素的再現(xiàn)塊或者經(jīng)過(guò)差分移動(dòng)補(bǔ)償?shù)木幋a象素值。
這一再現(xiàn)塊代表了移動(dòng)補(bǔ)償?shù)南笏?,通過(guò)IDCT電路126,與移動(dòng)補(bǔ)償單元134產(chǎn)生的預(yù)測(cè)塊一起送到加法器128。該移動(dòng)補(bǔ)償單元134根據(jù)從VLD處理器123所接受到的信息,提供需要與多幀存儲(chǔ)器130提供的解碼IDCT塊相組合的數(shù)據(jù)。該加法器128對(duì)上述數(shù)值進(jìn)行相加,產(chǎn)生經(jīng)過(guò)解碼的象素值,將這樣的象素值存儲(chǔ)在幀存儲(chǔ)器130中,以便進(jìn)行后處理或顯示。象素值的沒(méi)有經(jīng)過(guò)移動(dòng)補(bǔ)償?shù)南笏貕K被存儲(chǔ)在存儲(chǔ)器130中,不作改變。從存儲(chǔ)器130中以光柵掃描順序提供圖像數(shù)據(jù)。
附圖4顯示了本發(fā)明一種實(shí)施例的各向異性擴(kuò)散濾波器的方框圖。將以光柵掃描順序排列的MPEG解碼數(shù)據(jù)送到該濾波器。對(duì)光柵掃描中的象素計(jì)算出各個(gè)邊緣有效性門(mén)限值20,它對(duì)應(yīng)于由MPEG解碼器所處理的每一個(gè)象素?cái)?shù)據(jù)塊。在確定邊緣有效性門(mén)限值20之后,濾波器進(jìn)行擴(kuò)散處理30。對(duì)于給定的某個(gè)象素來(lái)說(shuō),采用其4個(gè)相鄰的象素來(lái)實(shí)現(xiàn)擴(kuò)散,每一個(gè)相鄰象素提供自己的導(dǎo)率值。所述導(dǎo)率值是根據(jù)ΔI(相鄰象素與中心象素之間的強(qiáng)度差值)和K(包含中心象素的象素塊的邊緣有效性門(mén)限值)來(lái)計(jì)算的。在進(jìn)行擴(kuò)散之后,濾波器送出所獲得的象素值,以便予以顯示。
圖5(a)和5(b)顯示了適合于附圖4所示本發(fā)明實(shí)施例使用的電路方框圖。每一個(gè)輸入幀由一個(gè)亮度幀Y和兩個(gè)色度幀Cr和Cb組成。對(duì)所述亮度幀與所述色度幀彼此獨(dú)立地進(jìn)行處理。附圖5(a)是適合用于進(jìn)行單次各向異性擴(kuò)散操作的電路,而附圖5(b)是適合用于進(jìn)行多次操作的電路。
本發(fā)明的濾波器對(duì)需要處理的數(shù)據(jù)進(jìn)行多次處理。在對(duì)數(shù)據(jù)進(jìn)行第一次濾波之后,將數(shù)據(jù)送回到濾波器,使之第二次通過(guò)濾波器,因而能夠進(jìn)一步地消除噪音。
一般說(shuō)來(lái),象素塊的梯度是選取邊緣有效性門(mén)限值K的基礎(chǔ)。如果象素塊包含一個(gè)高對(duì)比度邊緣,那么沿著該邊緣的梯度值就較大。較強(qiáng)的邊緣在通過(guò)一個(gè)基于DCT的壓縮系統(tǒng)之后產(chǎn)生振鈴,而且振鈴的幅度會(huì)遠(yuǎn)小于邊緣的幅度。因此,根據(jù)實(shí)際邊緣強(qiáng)度來(lái)設(shè)定邊緣有效性門(mén)限值將導(dǎo)致各向異性擴(kuò)散,以消除振鈴。然而,簡(jiǎn)單地將臨界邊緣有效性門(mén)限值K設(shè)定為等于一個(gè)象素塊之內(nèi)的最大梯度將會(huì)導(dǎo)致過(guò)份的平滑化。已發(fā)現(xiàn)最大梯度值的0.5倍能夠提供適度的平滑化。因此,應(yīng)當(dāng)根據(jù)下面的公式1來(lái)確定K值K(塊)=α×(0.5×實(shí)際最大梯度值) (1)其中α=0.75系數(shù)0.75是實(shí)驗(yàn)系數(shù),用于改善導(dǎo)率函數(shù)(下面將予以討論)與梯度值之間的匹配。
上述規(guī)則適合用于黑白圖像,采用下述方法能夠?qū)⑺鼣U(kuò)展到彩色圖像。
彩色圖像系統(tǒng)將彩色視頻信號(hào)當(dāng)做正交信號(hào)(例如R、G、B或者Y、Cr、Cb)的組合來(lái)予以處理。采用彩色矩陣來(lái)實(shí)現(xiàn)在這些正交坐標(biāo)系統(tǒng)中的變換。彩色圖像作為梯度的邊緣的直接擴(kuò)展將導(dǎo)致按照公式(2)將梯度視作三色梯度的歐氏幅值梯度(彩色)=平方根[(R梯度)2+(G梯度)2+(B梯度)2] (2)這一規(guī)則由于彩色次采樣而變得更為復(fù)雜,上述彩色次采樣在電視圖像技術(shù)中經(jīng)常采用。YUV(Y、Cr、Cb)彩色坐標(biāo)系統(tǒng)在電視系統(tǒng)中是最為常見(jiàn)的。每一幀圖像由一個(gè)亮度幀Y和兩個(gè)色度幀Cr、Cb組成。試驗(yàn)表明,U和V可以采用因子2來(lái)水平地予以采樣而不至于產(chǎn)生會(huì)被察覺(jué)的現(xiàn)象。采用這種次采樣的圖像被稱為YUV422圖像。
為了計(jì)算YUV422圖像的彩色梯度,理想的方式是通過(guò)直接補(bǔ)充采樣或者插值方式來(lái)重新建立失去的采樣。然后對(duì)經(jīng)過(guò)補(bǔ)充采樣的圖像進(jìn)行各向異性擴(kuò)散濾波(兩倍于U和V的YUV 422硬件費(fèi)用)。否則,U和V的尺度門(mén)限值就會(huì)按照全尺度來(lái)予以計(jì)算,然而卻錯(cuò)誤地用于半尺度U和V數(shù)據(jù)。本發(fā)明以彼此獨(dú)立的方式來(lái)處理Y、U、V數(shù)據(jù),因而不需要進(jìn)行補(bǔ)充采樣。在每一種情況下,都將積累臨界門(mén)限值K的統(tǒng)計(jì)值,然后在具有適當(dāng)大小的DCT象素塊中予以使用。
絕大多數(shù)文獻(xiàn)都采用熟知的Sobel邊緣算子對(duì)來(lái)計(jì)算梯度的大小。這種計(jì)算方法采用8個(gè)最為接近的相鄰象素的數(shù)據(jù)來(lái)計(jì)算梯度的X分量和Y分量。然后通過(guò)計(jì)算其平方和的平方根將上述分量組合起來(lái)。然而,采用這種梯度計(jì)算方法顯得過(guò)于昂貴了。
本發(fā)明采用較為經(jīng)濟(jì)的形態(tài)梯度。如圖6(b)所示,形態(tài)梯度采用中心象素及4個(gè)與之最為靠近的相鄰象素,僅僅需要進(jìn)行6次比較和一次減法,這一點(diǎn)將在下面結(jié)合圖6(b)予以說(shuō)明。在通常情況下,形態(tài)梯度的缺點(diǎn)是將一個(gè)象素寬度的邊緣擴(kuò)展為兩個(gè)象素寬度。然而,對(duì)于各向異性擴(kuò)散來(lái)說(shuō),上述缺點(diǎn)相反成了優(yōu)點(diǎn)。位于一個(gè)邊緣兩側(cè)的象素被標(biāo)志為具有較高梯度。這就增強(qiáng)了禁止擴(kuò)散跨過(guò)邊緣的所需效果,當(dāng)邊緣跨過(guò)DCT象素塊邊緣時(shí)尤其如此。
擴(kuò)散的各向異性由一個(gè)局部變量來(lái)予以控制,該變量類似于熱導(dǎo)率或電導(dǎo)。這一參數(shù)g是一個(gè)單調(diào)遞減函數(shù)。上述所引用的Perona和Malik一文和其他文獻(xiàn)提供了兩個(gè)這樣的函數(shù)高斯指數(shù)函數(shù)和拉普拉斯函數(shù)。上述文獻(xiàn)指出,高斯指數(shù)函數(shù)對(duì)于保持高對(duì)比度邊緣來(lái)說(shuō)具有更好的效果。El-Fallah認(rèn)為,梯度的倒數(shù)應(yīng)當(dāng)視作導(dǎo)率(見(jiàn)El-Fallah A.和FordG.,“基于非均勻擴(kuò)散和微分幾何的非線性自適應(yīng)圖像濾波”,Proc.ofSPIE,Vol.2182,1994,PP.49-63,本申請(qǐng)引用該文中關(guān)于導(dǎo)率計(jì)算的論述作為背景技術(shù)。)本發(fā)明采用高斯函數(shù),因?yàn)樵摵瘮?shù)經(jīng)過(guò)很少次數(shù)的迭代(例如兩次),就能夠提供有效的擴(kuò)散。高斯導(dǎo)率的公式如下 對(duì)于每一次迭代來(lái)說(shuō),針對(duì)每一個(gè)象素相鄰的4個(gè)象素中的每一個(gè)來(lái)計(jì)算導(dǎo)率G。通過(guò)查表或多項(xiàng)式近似法來(lái)進(jìn)行精確計(jì)算會(huì)過(guò)于昂貴,因?yàn)镵和梯度都是變量(然而,在本發(fā)明的第二中實(shí)施例中采用了查表方法,下面將結(jié)合圖9和10進(jìn)行說(shuō)明)。因此,本發(fā)明采用限幅直線近似法來(lái)取代高斯函數(shù)。通過(guò)彎曲點(diǎn)的該直線在彎曲點(diǎn)上具有與高斯函數(shù)相同的斜率。對(duì)高直線的限幅使得G保持在如下的范圍之內(nèi),即0≤g≤1??梢圆捎孟旅娴墓?,根據(jù)K計(jì)算出gg(梯度)=C1+(C2/K)×梯度(4)
圖7(a)和7(b)所給出的曲線表明,這是一種良好的逼近。此外,這種方法將用于計(jì)算g的硬件簡(jiǎn)化為第一,將梯度與每象素塊的一個(gè)參數(shù)相乘;第二,與一個(gè)常數(shù)相加;以及第三,對(duì)所獲得的結(jié)果進(jìn)行限幅。
為了說(shuō)明這一多次濾波器的工作原理,首先是結(jié)合附圖5(a)對(duì)單次濾波器的工作原理進(jìn)行說(shuō)明,然后再結(jié)合附圖5(b)來(lái)說(shuō)明怎樣將一個(gè)單次濾波器改變成為一個(gè)多次濾波器。在附圖5(a)中,亮度幀由延遲部件207延遲一行時(shí)間間隔(1H),然后由(1H)延遲部件209進(jìn)行第二次延遲。將延遲部件207和209提供的信號(hào)以及原始Y信號(hào)送到梯度計(jì)算器210,以便計(jì)算出邊緣有效性門(mén)限值K。此后,由CaLcC2/k單元215計(jì)算出導(dǎo)率值C2/k。
將該數(shù)據(jù)送到一個(gè)亮度處理器220進(jìn)行處理。送到上述處理器220的輸入信號(hào)包括由CaLcC2/k單元215產(chǎn)生的導(dǎo)率常數(shù)C2/k,F(xiàn)IFO緩沖器206所產(chǎn)生的輸出信號(hào),由上述FIFO緩沖器206產(chǎn)生并經(jīng)過(guò)延遲部件212延遲一行時(shí)間間隔(1H)的輸出信號(hào),以及由上述FIFO緩沖器206產(chǎn)生并由延遲部件214延遲第二個(gè)一行時(shí)間間隔(1H)的輸出信號(hào)。
色度幀Cr和Cb由多路調(diào)制器260混合在一起。多路調(diào)制器260的輸出信號(hào)由延遲部件267延遲一個(gè)水平行時(shí)間間隔(H/2),然后再由延遲元件269第二次延遲一個(gè)水平行時(shí)間間隔(H/2)。應(yīng)當(dāng)注意的是,色度信號(hào)每一行的采樣數(shù)目為亮度信號(hào)采樣數(shù)目的一半。因此,采用H/2延遲部件的延遲行將使得色度信號(hào)延遲一個(gè)水平行時(shí)間間隔。多路調(diào)制器260也存儲(chǔ)在一個(gè)FIFO緩沖器補(bǔ)償延遲部件266中,以便進(jìn)行進(jìn)一步處理。由兩個(gè)延遲部件267和269所提供的信號(hào)以及多路調(diào)制器265所提供的原始輸出信號(hào)被送到一個(gè)梯度計(jì)算器270,以便計(jì)算出邊緣有效性門(mén)限值。此后,由CaLcC2/k計(jì)算器275計(jì)算出導(dǎo)率常數(shù)C2/k。
隨后,將數(shù)據(jù)送到一個(gè)色度處理器280進(jìn)行處理。送到處理器280的輸入信號(hào)包括由CaLcC2/k單元275產(chǎn)生的導(dǎo)率常數(shù)C2/k,F(xiàn)IFO緩沖器266所產(chǎn)生的輸出信號(hào),由上述FIFO緩沖器266產(chǎn)生并經(jīng)過(guò)延遲元件272延遲一行時(shí)間間隔(1H)的輸出信號(hào),以及由上述FIFO緩沖器266產(chǎn)生并由延遲部件274第二次延遲一行時(shí)間間隔(1H)的輸出信號(hào)。
適當(dāng)?shù)剡x取FIFO緩沖器和多路調(diào)制器能夠使得電路以兩倍象素時(shí)鐘頻率運(yùn)行,以便進(jìn)行兩次各向異性擴(kuò)散。如果后濾波電路以兩倍時(shí)鐘頻率予以驅(qū)動(dòng),那么只要增加適當(dāng)?shù)难h(huán)電路,就有時(shí)間進(jìn)行兩次后濾波。這種再循環(huán)電路如附圖5(b)所示。對(duì)于亮度幀來(lái)說(shuō),它包括一個(gè)速率變換電路(由一次象素時(shí)鐘變換到兩次象素時(shí)鐘),該變換電路包括一個(gè)FIFO緩沖器200;一個(gè)再循環(huán)通路(將Y處理輸出送到多路調(diào)制器205);一個(gè)多路調(diào)制器205,用于選擇第一次通過(guò)的數(shù)據(jù)或第二次通過(guò)的數(shù)據(jù);以及由FIFO緩沖器225構(gòu)成的最終頻率變換器,用于收集第二通道的輸出并將它轉(zhuǎn)換回一次象素時(shí)鐘。對(duì)于色度幀來(lái)說(shuō),再循環(huán)電路包括頻率變換和FIFO緩沖器250和255;一個(gè)再循環(huán)通路(將Cr和Cb處理輸出送到多路調(diào)制器265);一個(gè)多路調(diào)制器265,用于選擇第一次通過(guò)的數(shù)據(jù)或第二次通過(guò)的數(shù)據(jù);由FIFO緩沖器285和290構(gòu)成的最終頻率變換器,用于收集第二通道的輸出并將它轉(zhuǎn)換回一次象素時(shí)鐘;以及多路調(diào)制器295,用于將上述Cr和Cb信號(hào)合并成為一個(gè)輸出信號(hào)。
圖6(b)顯示了一種梯度電路的方框圖,該電路適合用于確定如圖5(a)、5(b)所示電路中的邊緣有效性門(mén)限值。如圖6(a)所示的圖像掃描行的象素由圖6(b)所示的電路進(jìn)行處理。在圖6(a)中,OH行中的象素S代表比當(dāng)前行(1H)低一個(gè)水平行的象素,2H行中的象素N代表比當(dāng)前行(1H)高一個(gè)水平行的象素。當(dāng)前行1H中的當(dāng)前象素用標(biāo)記X來(lái)表示。象素E和W分別是緊鄰當(dāng)前行1H中的當(dāng)前象素X之前和之后的象素。
象素S和N分別存儲(chǔ)在鎖存器609和611中,然后由比較器610進(jìn)行比較。具有較大幅值的象素由多路調(diào)制器615提供,具有較小幅值的象素由多路調(diào)制器620提供。同時(shí),采用一對(duì)延遲器604和605來(lái)分離象素E和W,它們?cè)?H行中分別緊鄰當(dāng)前象素X之前和之后。由比較器625對(duì)這兩個(gè)象素進(jìn)行比較,具有較大幅值的象素由多路調(diào)制器630提供,具有較小幅值的象素由多路調(diào)制器635提供。比較器640對(duì)多路調(diào)制器615提供的較大象素幅值和多路調(diào)制器630提供的較大象素幅值進(jìn)行比較,這兩個(gè)幅值中的較大者由多路調(diào)制器645提供。比較器650對(duì)多路調(diào)制器615提供的較小象素幅值和多路調(diào)制器635提供的較小象素幅值進(jìn)行比較,這兩個(gè)幅值中的較小者由多路調(diào)制器655提供。一個(gè)補(bǔ)償延遲部件663以適當(dāng)?shù)亩〞r(shí)將當(dāng)前象素X送到比較器660和670,以便與其周圍的相應(yīng)最大象素值和最小象素值相匹配。由多路調(diào)制器645提供的最大周圍象素幅值在比較器660中與與當(dāng)前象素的幅值進(jìn)行比較,具有更大幅值的象素由多路調(diào)制器665提供。由多路調(diào)制器655提供的最小象素幅值在比較器670中與當(dāng)前象素X進(jìn)行比較,具有更小幅值的象素由多路調(diào)制器675提供。這樣,在5個(gè)被比較的象素(S、X、N、E、W)中,最大的幅值由多路調(diào)制器665提供,最小的幅值由多路調(diào)制器675提供。這兩個(gè)數(shù)值在減法器680中相減,從而提供了最終的結(jié)果,它就是當(dāng)前象素的形態(tài)梯度。圖8顯示了怎樣來(lái)利用上述結(jié)果在圖6中計(jì)算出來(lái)的梯度(在圖8中用標(biāo)記802表示)被送到max部件808的一個(gè)輸入端,其余的輸入端用于接受DCT塊的運(yùn)行最大值。在確定該象素塊中所有象素的最大梯度之后,將最后鎖存的最大值(在寄存器810中)除以2(亦即朝著加權(quán)小的方向移動(dòng)一位),以便為這一象素塊產(chǎn)生邊緣有效性門(mén)限值k。
本申請(qǐng)的發(fā)明人確定了公式(4)中所述的常數(shù)C1和C2分別為1.21和0.85576。這樣,上述公式(4)就簡(jiǎn)化成了下述公式(5)g(梯度)=1.21-(0.85576/K)×梯度(5)
對(duì)于每一個(gè)被轉(zhuǎn)換成為光柵掃描數(shù)據(jù)并隨后予以處理的象素塊來(lái)說(shuō),C1和C2的數(shù)值保持不變。然而,對(duì)于各個(gè)象素塊來(lái)說(shuō),K值是變化的。圖7(a)和7(b)顯示了高斯導(dǎo)率曲線以及分別在K=10和K=100處以限幅直線表示的近似曲線。
圖8顯示了確定如圖5(a)和5(b)所示電路中的導(dǎo)率常數(shù)C2/k的電路方框圖。在max模塊801中,由圖6所示的梯度計(jì)算器802確定的當(dāng)前象素的梯度被送到max比較器808。將當(dāng)前象素塊的當(dāng)前象素列的最大梯度通過(guò)用于存儲(chǔ)runmax(列)的runmax存儲(chǔ)器送到max比較器808。max比較器808對(duì)當(dāng)前象素的梯度與runmax(列)進(jìn)行比較,并提供較大的值。在時(shí)鐘脈沖0-6處,將比較的結(jié)果送到多路調(diào)制器804。
一個(gè)地址發(fā)生和定時(shí)電路850控制在電路中的尋址、讀出、和寫(xiě)入。在象素塊的一列中有8個(gè)時(shí)鐘脈沖(0-7)。
由比較器808進(jìn)行比較的結(jié)果在經(jīng)過(guò)一個(gè)時(shí)鐘脈沖的延遲部件810之后也被送到多路調(diào)制器812,該多路調(diào)制器每經(jīng)過(guò)8個(gè)象素列就將runmax(列)置零。多路調(diào)制器812在0時(shí)鐘脈沖處要么提供0,要么提供存儲(chǔ)在靜態(tài)RAM 820中的runmax(列)。在每8列象素的時(shí)鐘脈沖1,比較器808的比較結(jié)果也被存儲(chǔ)在RAM 820中。這一數(shù)值是象素塊的最大梯度Kmax(塊)。
所示的RAM 820是單端口型的,因此采用延遲來(lái)實(shí)現(xiàn)讀出和寫(xiě)入。在時(shí)鐘脈沖0和1將數(shù)據(jù)寫(xiě)入RAM 820,而在時(shí)鐘脈沖6和7將數(shù)據(jù)讀出RAM820。對(duì)于寬度為W個(gè)象素的圖像來(lái)說(shuō),RAM820具有2×(W/8)字節(jié)的存儲(chǔ)位置,其中,W/8的存儲(chǔ)位置用于存儲(chǔ)runmax(列),另一個(gè)W/8的存儲(chǔ)位置用于存儲(chǔ)Kmax(塊)。地址發(fā)生器850使得多路調(diào)制器812在開(kāi)始一個(gè)新的象素塊之前將0置于runmax中。它也使得寄存器816在每個(gè)象素塊的終點(diǎn)將Kmax值隨著時(shí)鐘脈沖送出。采用這種方式,即使處理是是以光柵掃描次序來(lái)進(jìn)行的,但是通過(guò)將部分結(jié)果加入到正確的象素塊并將正確的K值施加到每一個(gè)象素塊以便進(jìn)行濾波,就能夠精確地記錄所蘊(yùn)涵的象素塊結(jié)構(gòu)。RAM820具有足夠數(shù)目的存儲(chǔ)位置,以便記錄一個(gè)片段中的所有DCT象素塊。
在時(shí)鐘脈沖6,將runmax(列)從RAM820中讀出并在延遲一個(gè)時(shí)鐘脈沖之后送到多路調(diào)制器804,以便騰出runmax存儲(chǔ)區(qū)域806。在時(shí)鐘脈沖7,將Kmax(塊)送到檢查模塊830。該檢查模塊830接受Kmax(塊),并將它送到ROM834,以便確定導(dǎo)率常數(shù)C2/k。該數(shù)值用于隨后的亮度和色度處理,對(duì)此下面將作說(shuō)明。
各向異性擴(kuò)散的實(shí)質(zhì)是一種迭代處理。經(jīng)過(guò)每一次迭代,使邊緣得到細(xì)微的銳化,使平坦區(qū)域得到細(xì)微的平滑。守\恒規(guī)律對(duì)這一過(guò)程施加了一個(gè)自然限制,即在一次迭代中擴(kuò)散給一個(gè)象素周圍的4個(gè)象素的強(qiáng)度總和不可能超過(guò)其自身的強(qiáng)度。因此平均而言,提供給任何一個(gè)周圍象素的強(qiáng)度不可能超過(guò)其自身強(qiáng)度的四分之一。這就是下述公式(6)的總體擴(kuò)散公式中給出λmax=1/4的數(shù)字穩(wěn)定性條件的由來(lái)I(t1)=I(t0)+{∑(Gi×ΔIi) (6)其中ΔIi=(Ii-Icenter)i=4在這一限制中,擴(kuò)散速率可以通過(guò)設(shè)定K來(lái)予以控制。從本質(zhì)上說(shuō),在強(qiáng)的邊緣附近允許實(shí)現(xiàn)更多的擴(kuò)散(平滑)。
對(duì)于圖像段來(lái)說(shuō),已知文獻(xiàn)的最大興趣在于朝著其穩(wěn)定終點(diǎn)的各向異性擴(kuò)散過(guò)程。上述所引用的Alvarez等人的報(bào)告得出的結(jié)論是采用較少次數(shù)的迭代。在本發(fā)明中,已經(jīng)確定對(duì)于λ=1/4來(lái)說(shuō),各向異性擴(kuò)散的兩次迭代能夠?qū)崿F(xiàn)全部有用的噪音消除。上述所引用的Saint-Marc等人的論文指出,最為有用的邊緣增強(qiáng)出現(xiàn)在幾次迭代中,而噪音消除則需要更多的迭代。在本發(fā)明中,K的局部自適應(yīng)使得某些噪音消除能夠在少數(shù)幾次迭代中實(shí)現(xiàn)。
本發(fā)明發(fā)現(xiàn),在第二次迭代中將K縮小一個(gè)因子2,亦即使K2=0.5K1,那么兩次迭代就能夠獲得最好的結(jié)果。保持K不變或者增大K將會(huì)導(dǎo)致過(guò)份的模糊。在自適應(yīng)K值時(shí),采用大于0.5的因子會(huì)有效地消除進(jìn)一步的擴(kuò)散,使得進(jìn)行第二次濾波變得無(wú)意義。因此,在本發(fā)明的一個(gè)實(shí)施例中,在進(jìn)行第一次擴(kuò)散迭代之后(例如圖5(a)和5(b)中的部件205-220),將第二次擴(kuò)散迭代中的K值減小一個(gè)因子2。
圖9是適合在附圖5(a)、5(b)所示電路中用于進(jìn)行亮度處理的電路方框圖。這一電路包括用于計(jì)算導(dǎo)率值G的硬件。對(duì)4組不同的輸入數(shù)據(jù)N、E、E、和S進(jìn)行相同的處理,它們分別是緊鄰當(dāng)前象素X上方的象素、緊鄰當(dāng)前象素X右側(cè)的象素、緊鄰當(dāng)前象素X左側(cè)的象素、以及緊鄰當(dāng)前橡樹(shù)X下方的象素。對(duì)象素S、E、W、和N的處理分別如圖中方框910、930、940、和950所示。
為了處理象素S,在OH(象素S或者緊鄰當(dāng)前象素X下方的象素)存儲(chǔ)在鎖存器911中之后,將它送到減法器913,該減法器從象素S中減去鎖存在鎖存器912中的當(dāng)前象素X。這樣就獲得了公式(6)中所述的ΔIi項(xiàng)。由一個(gè)絕對(duì)值電路914來(lái)確定上述ΔIi的絕對(duì)值,并將它存儲(chǔ)在FIFO緩沖器917中。將附圖8所示電路所獲得的導(dǎo)率常數(shù)C2/k與ΔIi的絕對(duì)值相乘,然后采用減法器920從導(dǎo)率常數(shù)C1中減去上述相乘后的乘積,從而獲得公式(6)中所述的gi項(xiàng)。在電路922中對(duì)上述結(jié)果進(jìn)行限制,使g值保持在0≤g≤1的范圍之內(nèi)。這一操作是根據(jù)公式(4)取g的近似值。乘法器924將上述經(jīng)過(guò)限幅的數(shù)值與存儲(chǔ)在FIFO緩沖器917中的ΔIi相乘。
在本發(fā)明的第二實(shí)施例中,采用ROM915來(lái)取代部件917、918、920、922、和924。發(fā)明人發(fā)現(xiàn),將C2/k表示為一個(gè)4比特?cái)?shù)值,將AIi的絕對(duì)值表示為一個(gè)8比特?cái)?shù)值所獲得的噪音消除結(jié)果在公式(3)給出的計(jì)算的0.1dB之內(nèi)。這樣,總地說(shuō)來(lái)需要12比特,因而采用一個(gè)4K的ROM。根據(jù)公式(6)來(lái)對(duì)ROM915的值進(jìn)行編程。在本發(fā)明的這一實(shí)施例中,可以根據(jù)公式(3)來(lái)確定gi的數(shù)值。在這種情況下,送到ROM915的C2/k輸入值可以由經(jīng)過(guò)近似量化的輸入值K來(lái)取代。
對(duì)象素E、W、N的處理與上述處理相同。
在獲得對(duì)4個(gè)周圍象素的任何一個(gè)的gi×ΔIi項(xiàng)之后,在加法電路960中對(duì)所有的gi×ΔIi項(xiàng)相加。其中加法器962對(duì)象素N和E的gi×ΔIi項(xiàng)進(jìn)行相加,加法器964對(duì)象素W和S的Gi×ΔIi項(xiàng)進(jìn)行相加。采用加法器966來(lái)加入中心象素X,它代表了公式(6)中的I(t0)項(xiàng)。所有上述各項(xiàng)由加法器968進(jìn)行相加,然后予以輸出。
附圖10是適合于在附圖5(a)、5(b)所示的電路中進(jìn)行色度處理的電路方框圖。這一電路進(jìn)行的處理與附圖9所示電路的處理相似。時(shí)鐘控制器994控制該電路的定時(shí)。
當(dāng)前象素X被存儲(chǔ)在FIFO緩沖器992中,位于當(dāng)前象素X周圍的4個(gè)象素(亦即緊鄰當(dāng)前象素X上、下、右、左的象素)被送到多路調(diào)制器980。由減法器982從中減去當(dāng)前象素。這一減法獲得了公式(6)所述的ΔIi項(xiàng)。由一個(gè)絕對(duì)值電路983來(lái)計(jì)算ΔIi項(xiàng)的絕對(duì)值,并存儲(chǔ)在FIFO緩沖器984中。由附圖8所示查看模塊獲得的導(dǎo)率常數(shù)C2/k與上述ΔIi項(xiàng)的絕對(duì)值相乘,然后由減法器987從導(dǎo)率常數(shù)C1中減去上述相乘的乘積,獲得公式(6)中的gi項(xiàng)。這一結(jié)果然后由電路983限幅。限幅后的值由乘法器989與存在FIFO緩存器984中的ΔIi相乘。然后將gi×ΔIi項(xiàng)由加法器與存在FIFO緩存器992中的當(dāng)前象素X(代表等式(6)中的I(t0)項(xiàng))相加并輸出。在本發(fā)明的實(shí)施例中,ROM985代替了部件984、986、987、988、和989。
雖然本發(fā)明已應(yīng)用于MPEG和DVC壓縮,由于它以光柵掃描格式在解碼數(shù)據(jù)上操作,所以仍可用于對(duì)采用量化空間頻率系數(shù)編碼的視頻數(shù)據(jù)進(jìn)行解碼的任何系統(tǒng)。
本發(fā)明是結(jié)合上述實(shí)施例和附圖進(jìn)行敘述的,但是,本發(fā)明技術(shù)領(lǐng)域內(nèi)的一般技術(shù)人員可根據(jù)本發(fā)明的原理對(duì)本發(fā)明的實(shí)施例進(jìn)行修改和變型,因此,本發(fā)明的內(nèi)容享受權(quán)利要求的保護(hù)。
權(quán)利要求
1.一種用于視頻信號(hào)解碼系統(tǒng)的裝置,該系統(tǒng)能夠以數(shù)字方式對(duì)采用量化空間頻率分量進(jìn)行壓縮之后的數(shù)據(jù)值進(jìn)行解碼,該系統(tǒng)包括能夠在圖像重現(xiàn)后抑制噪音的范圍的濾波部件,該裝置的特征在于包括用于接受經(jīng)過(guò)解碼后的數(shù)據(jù)值的裝置,該數(shù)據(jù)值表征了圖像幀的一部分;以及各向異性擴(kuò)散濾波裝置,用于對(duì)接受的數(shù)據(jù)值進(jìn)行濾波,以便有選擇性地壓縮其數(shù)值小于一個(gè)門(mén)限值的信號(hào)邊緣分量。
2.根據(jù)權(quán)利要求1所述的裝置,其中所述門(mén)限值是所述圖像幀的所述部分中的最大梯度值的一個(gè)預(yù)定部分。
3.根據(jù)權(quán)利要求2所述的裝置,其中所述的各向異性擴(kuò)散濾波裝置進(jìn)一步包括一個(gè)根據(jù)導(dǎo)率值對(duì)所述各向異性擴(kuò)散濾波裝置進(jìn)行控制的裝置,該導(dǎo)率值是由圖像幀的所述部分中的最大梯度值來(lái)確定的。
4.根據(jù)權(quán)利要求3所述的裝置,其中所述導(dǎo)率值是通過(guò)一個(gè)限幅直線近似來(lái)確定的。
5.根據(jù)權(quán)利要求4所述的裝置,其中所述導(dǎo)率值是采用下述公式來(lái)確定的g(梯度)=C1+(C2/K)×梯度其中“g”為導(dǎo)率值,“梯度”為最大梯度值,“K”為門(mén)限值,“C1”和“C2”為常數(shù)。
6.根據(jù)權(quán)利要求5所述的裝置,其中C1等于1.21,C2等于-0.85576。
7.根據(jù)權(quán)利要求2所述的裝置,進(jìn)一步包括比較器,用于對(duì)當(dāng)前象素的幅值與4個(gè)緊鄰象素的相應(yīng)幅值進(jìn)行比較,以便確定最大幅值和最小幅值;以及減法器,用于從所述最大幅值中減去所述最小幅值,以便確定所述最大梯度值。
8.根據(jù)權(quán)利要求1所述的裝置,其中所述的各向異性擴(kuò)散濾波裝置包括第一各向異性擴(kuò)散濾波器和第二各向異性擴(kuò)散濾波器。
9.根據(jù)權(quán)利要求8所述的裝置,其中所述濾波裝置進(jìn)一步包括用于將所述門(mén)限值減小一個(gè)因子2,以便供第二各向異性擴(kuò)散濾波器使用的裝置。
10.根據(jù)權(quán)利要求1所述的裝置,其中濾波是根據(jù)下面的公式進(jìn)行計(jì)算的I(t1)=I(t0)+{∑(gi×ΔIi)}其中“I(t1)是經(jīng)過(guò)濾波后的數(shù)值,“λ”是數(shù)字穩(wěn)定性條件,“gi”是當(dāng)前象素的導(dǎo)率值,“ΔIi”是當(dāng)前象素與周圍象素之間的幅值差,“I(t0)”是當(dāng)前象素的幅值。
11.根據(jù)權(quán)利要求1所述的裝置,其中濾波是采用只讀存儲(chǔ)器(ROM)實(shí)現(xiàn)的,該ROM依據(jù)下述公式來(lái)編程I(t1)=I(t0)+{∑(gi×ΔIi)}其中“I(t1)是經(jīng)過(guò)濾波后的數(shù)值,“λ”是數(shù)字穩(wěn)定性條件,“gi”是當(dāng)前象素的導(dǎo)率值,“ΔIi”是當(dāng)前象素與周圍象素之間的幅值差,“I(t0)”是當(dāng)前象素的幅值。
12.一種在以數(shù)字方式對(duì)采用量化空間頻率分量予以壓縮的數(shù)據(jù)值進(jìn)行解碼的視頻信號(hào)解碼系統(tǒng)中對(duì)圖像再現(xiàn)之后抑制噪音范圍的方法,所述方法包括a).接受經(jīng)過(guò)解碼后的數(shù)據(jù)值,該數(shù)據(jù)值表征了圖像幀的一部分;以及b).對(duì)接受的數(shù)據(jù)值進(jìn)行各向異性擴(kuò)散濾波,以便有選擇性地壓縮其數(shù)值小于一個(gè)門(mén)限值的信號(hào)邊緣分量。
13.根據(jù)權(quán)利要求12所述的方法,其中所述門(mén)限值是圖像幀的所述部分中的最大梯度值的一個(gè)預(yù)定部分。
14.根據(jù)權(quán)利要求13所述的方法,其中所述的步驟b)進(jìn)一步包括一個(gè)根據(jù)導(dǎo)率值對(duì)所述各向異性擴(kuò)散濾波裝置進(jìn)行控制的步驟,該導(dǎo)率值是由圖像幀的所述部分中的最大梯度值來(lái)確定的。
15.根據(jù)權(quán)利要求14所述的方法,其中所述導(dǎo)率值是通過(guò)一個(gè)限幅直線近似確定的。
16.根據(jù)權(quán)利要求15所述的方法,其中所述導(dǎo)率值是采用下述公式來(lái)確定的g(梯度)=C1+(C2/K)×梯度其中“g”為導(dǎo)率值,“梯度”為最大梯度值,“K”為門(mén)限值,“C1”和“C2”為常數(shù)。
17.根據(jù)權(quán)利要求16所述的方法,其中C1等于1.21,C2等于-0.85576。
18.根據(jù)權(quán)利要求13所述的方法,其中所述的最大梯度值是根據(jù)如下步驟確定的對(duì)當(dāng)前象素的幅值與4個(gè)緊鄰象素的相應(yīng)幅值進(jìn)行比較,以便確定最大幅值和最小幅值;從所述最大幅值中減去所述最小幅值,以便確定所述最大梯度值。
19.根據(jù)權(quán)利要求12所述的方法,其中所述的步驟b)進(jìn)一步包括采用第一各向異性擴(kuò)散濾波器和第二各向異性擴(kuò)散濾波器對(duì)所接受的數(shù)據(jù)值進(jìn)行濾波的步驟。
20.根據(jù)權(quán)利要求19所述的方法,其中所述步驟b)進(jìn)一步包括將所述門(mén)限值減小一個(gè)因子2,以便供第二各向異性擴(kuò)散濾波器使用的步驟。
21.根據(jù)權(quán)利要求12所述的方法,其中濾波是根據(jù)下面的公式來(lái)進(jìn)行計(jì)算的I(t1)=I(t0)+{∑(gi×ΔIi)}其中“I(t1)是經(jīng)過(guò)濾波后的數(shù)值,“λ”是數(shù)字穩(wěn)定性條件,“gi”是當(dāng)前象素的導(dǎo)率值,“ΔIi”是當(dāng)前象素與周圍象素之間的幅值差,“I(t0)”是當(dāng)前象素的幅值。
22.根據(jù)權(quán)利要求1所述的裝置,其中所述的各向異性擴(kuò)散濾波是采用只讀存儲(chǔ)器(ROM)來(lái)實(shí)現(xiàn)的。
23.根據(jù)權(quán)利要求22所述的方法,其中所述ROM依據(jù)下述公式來(lái)編程I(t1)=I(t0)+{∑(gi×ΔIi)}其中“I(t1)是經(jīng)過(guò)濾波后的數(shù)值,“λ”是數(shù)字穩(wěn)定性條件,“gi”是當(dāng)前象素的導(dǎo)率值,“ΔIi”是當(dāng)前象素與周圍象素之間的幅值差,“I(t0)”是當(dāng)前象素的幅值。
全文摘要
一種視頻信號(hào)編碼/解碼系統(tǒng),通過(guò)采用后濾波器對(duì)解碼數(shù)據(jù)進(jìn)行各向異性擴(kuò)散來(lái)減小振鈴噪音,系統(tǒng)的實(shí)施例采用一種由動(dòng)畫(huà)專家協(xié)會(huì)(MPEG)開(kāi)發(fā)的編碼/解碼技術(shù)。該后濾波器對(duì)單個(gè)的象素塊進(jìn)行處理,為每一個(gè)象素塊指定單個(gè)邊緣有效性門(mén)限值。如果邊緣強(qiáng)度低于該門(mén)限值,則進(jìn)行噪音消除,如果邊緣強(qiáng)度高于所述門(mén)限值,則不進(jìn)行噪音消除。
文檔編號(hào)H04N5/21GK1151662SQ9612037
公開(kāi)日1997年6月11日 申請(qǐng)日期1996年10月21日 優(yōu)先權(quán)日1995年10月20日
發(fā)明者帕屈立克·威廉姆·德維尼, 丹尼爾·查德瑞恩·格那那普瑞克塞姆, 湯姆斯·詹姆斯·李科克 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社