專利名稱:一種分層運動估計方法和超大規(guī)模集成電路的制作方法
技術領域:
本發(fā)明涉及一種MPEG-4中的運動估計方法和超大規(guī)模集成電路,具體地說,涉及MPEG-4中的一種分層運動估計方法和超大規(guī)模集成電路。
背景技術:
當今時代,信息技術和計算機互聯(lián)網(wǎng)飛速發(fā)展,多媒體信息已成為人類獲取信息的最主要載體,多媒體信息數(shù)據(jù)量非常大,對信息存儲設備及通信網(wǎng)絡均提出了很高要求,從而成為阻礙人們有效獲取和使用信息的重大瓶頸,因此研究高效的多媒體數(shù)據(jù)壓縮編碼方法,以壓縮形式存儲和傳輸數(shù)字化的多媒體信息具有重要意義。國際標準化組織于1998年成立了運動圖像壓縮編碼組織(MPEG),經(jīng)過專家組不懈的努力,制定了幾種視頻壓縮標準,其中MPEG-4標準已成為現(xiàn)今國際上的研究熱點。
MPEG-4只處理圖像幀與幀之間有差異的元素而舍棄相同的部分,大大減少了數(shù)據(jù)量。運動估計是去除時間冗余的有效方法,所謂的時間冗余是指圖像幀與幀之間有大量相同元素的存在。MPEG-4中提供了基于塊的運動估計和補償技術來有效地處理各幀之間的時間冗余。MPEG-4認為當前幀每一個圖像塊,都能在下一幀圖像中找到對應塊,在此基礎上,下一幀圖像的對應塊就能夠通過前一幀的圖像塊加上一個預測運動向量來重建。MPEG-4中的運動估計就是要找出當前幀中各圖像塊的預測運動向量。上述圖像塊的大小為16×16、8×8等,16×16、8×8是指,圖像塊在x方向和y方向的寬度都為16或8個象素,整個圖像塊是由256或64個象素點構成的正方形圖像區(qū)域。在MPEG中,所處理的圖像塊為16×16,當前幀中要計算預測運動向量的圖像塊被稱為預測宏塊,下一幀圖像中與當前圖像塊進行匹配操作的圖像塊被稱為搜索圖像塊,當前圖像塊在下一幀圖像中要作搜索的整個圖像區(qū)域稱為搜索窗。
運動估計算法的研究已經(jīng)比較深入,提出了許多有效的方法,比如全搜索算法、三步法、菱形算法等等。同時,隨著手持視頻終端市場的發(fā)展,對低功耗、小尺寸的處理芯片的要求越來越迫切。
在全搜索算法中,需要對當前幀中的預測宏塊與下一幀中的預測宏塊的搜索窗內(nèi)的每一個與預測宏塊相同大小的圖像塊進行匹配,因而全搜索算法雖然性能好,算法規(guī)整,便于硬件實現(xiàn),但是計算量太大,需要的計算陣列也比較龐大,功耗較高,不適合現(xiàn)有市場的需求,其他算法雖然計算量少,但是算法不規(guī)律,算法的每一個步驟取決于之前預測宏塊和搜索圖像塊已經(jīng)匹配的具體結(jié)果,不適合硬件實現(xiàn)。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術問題是設計一種分層運動估計方法和超大規(guī)模集成電路,用于數(shù)字視頻編碼應用中,使采用該方法和超大規(guī)模集成電路的視頻編碼芯片的尺寸和功耗大為降低,并且支持MPEG-4標準下的高級預測模式。MPEG-4的高級預測模式是指在運動估計中,不僅提供16×16預測宏塊的運動估計結(jié)果,還要提供預測宏塊中4個8×8子圖像塊的運動估計結(jié)果。
本發(fā)明的目的是這樣實現(xiàn)的一種分層運動估計方法,該方法包括以下步驟A)對原始圖像進行至少一次低采樣率采樣,在每次低采樣率采樣時,反復調(diào)用N×N圖像塊的匹配搜索來實現(xiàn)預測宏塊的匹配搜索,得到預測宏塊在低采樣率下的預測運動矢量,所述N表示圖像塊的寬度或高度;B)直接處理原始圖像,以A)中獲取的預測宏塊在低采樣率下的預測運動矢量為初始位置作匹配搜索,得到預測宏塊的最終預測運動矢量。
所述N的值取8,4或2。
所述步驟A)包括A1)對原始圖像進行4∶1的采樣,在預測宏塊對應位置處[-4,3]范圍內(nèi)作匹配搜索,得到預測運動矢量V1;A2)對原始圖像進行2∶1的采樣,以A1)中獲取的V1為初始位置作[-2,1]范圍內(nèi)的匹配搜索,得到預測宏塊在低采樣率下的預測運動矢量。
所述步驟A2)進一步包括A21)采用中值法從預測宏塊的三個相鄰宏塊的預測運動矢量中獲得預測運動矢量V2;A22)對原始圖像進行2∶1的采樣,分別以A1)中獲取的V1和A21)中獲取的V2為初始位置作[-2,1]范圍內(nèi)的匹配搜索,得到預測宏塊在低采樣率下的預測運動矢量。
所述步驟A1)包括對原始圖像進行4∶1的采樣,預測宏塊被抽樣為一個4×4的當前圖像塊,預測宏塊在對應位置處[-4,3]范圍內(nèi)的匹配搜索被分解為當前圖像塊在4個起始位置處的匹配搜索進行。
所述步驟A2)包括對原始圖像進行2∶1的采樣,預測宏塊被抽樣為一個8×8的當前圖像塊,預測宏塊在對應位置處[-2,1]范圍內(nèi)的匹配搜索被分解為4個4×4圖像塊的匹配搜索進行,把這4個4×4圖像塊與對應搜索圖像塊的絕對誤差和累加得到當前8×8圖像塊的絕對誤差和。
所述步驟B)包括直接處理預測宏塊,當前圖像塊的大小為16×16,預測宏塊在對應位置處[-2,1]范圍內(nèi)的匹配搜索被分解為16個4×4圖像塊的匹配搜索進行,把這16個4×4圖像塊與對應搜索圖像塊的絕對誤差和累加得到當前圖像塊的絕對誤差和。
所述步驟B)進一步包括,通過以下方式實現(xiàn)MPEG-4的高級預測模式預測宏塊在對應位置處[-2,1]范圍內(nèi)的匹配搜索被分解為16個4×4圖像塊的匹配搜索進行,把這16個4×4圖像塊再分成分別組成預測宏塊的4個8×8子圖像塊的4組,把4組4×4圖像塊的絕對誤差和累加起來并輸出、比較,得到預測宏塊的4個8×8子圖像塊的預測運動矢量即MPEG-4的高級預測結(jié)果。
本發(fā)明的目的是這樣實現(xiàn)的一種分層運動估計超大規(guī)模集成電路,其特征在于該電路包括處理單元陣列、數(shù)據(jù)存儲區(qū)、控制器和比較判別器,其中數(shù)據(jù)存儲區(qū)存儲預測宏塊數(shù)據(jù)和搜索窗數(shù)據(jù);處理單元陣列包括N×N個處理單元,用于計算當前N×N圖像塊與某一位置處[-N/2,N/2-1]范圍內(nèi)N×N個N×N搜索圖像塊的絕對誤差和;比較判決器用于根據(jù)處理單元陣列輸出的計算結(jié)果,得到預測運動矢量并送給控制器;控制器用于從數(shù)據(jù)存儲區(qū)把當前N×N圖像塊數(shù)據(jù)和搜索圖像塊數(shù)據(jù)送到處理單元陣列,控制處理單元陣列的操作,把處理單元陣列的計算結(jié)果送給比較判決器,以及從比較判決器得到預測宏塊的預測運動矢量。
所述的處理單元在控制器的控制下實現(xiàn)當前N×N圖像塊與某一位置處[-N/2,N/2-1]范圍內(nèi)的N×N個搜索圖像塊中一個塊的絕對誤差和的計算,所述搜索圖像塊在[-N/2,N/2-1]范圍內(nèi)的相對位置是固定的。
所述的處理單元在控制器的控制下實現(xiàn)當前N×N圖像塊與多個搜索N×N圖像塊的絕對誤差和累加的計算。
所述的處理單元進一步包括一個由4個累加器組成的累加器組和一個大小為4的寄存器,用以實現(xiàn)MPEG-4的高級預測,其中4個累加器負責分別累加預測宏塊的4個8×8子圖像塊與搜索圖像塊的絕對誤差和,寄存器負責保存4個子圖像塊的預測運動矢量。
所述控制器用于從數(shù)據(jù)存儲區(qū)把搜索圖像塊數(shù)據(jù)送到處理單元陣列的方式為控制器用于把搜索圖像塊數(shù)據(jù)以流水線方式分奇數(shù)和偶數(shù)列像素值兩路送入所述處理單元陣列,奇數(shù)列數(shù)據(jù)比偶數(shù)列數(shù)據(jù)遲滯4個周期,并控制處理單元陣列每隔四個周期其取值對象由其中一路轉(zhuǎn)換為另一路。
所述控制器用于從數(shù)據(jù)存儲區(qū)把當前N×N圖像塊數(shù)據(jù)送到處理單元陣列的方式為控制器用于把當前圖像塊數(shù)據(jù)以并行方式送入處理單元陣列,在同一個周期中,所有處理單元使用當前圖像塊中同一像素值。
本發(fā)明是一種分層運動估計方法和超大規(guī)模集成電路,通過在多種采樣率下進行匹配搜索并把用到的匹配搜索都分解為多個基本搜索單元來進行,從而取得了以下的積極效果搜索速度明顯優(yōu)于全搜索算法;超大規(guī)模集成電路的陣列結(jié)構簡單,功耗低、尺寸小,在不增加計算量和運算陣列的前提下,利用在處理單元中增加的由4個累加器組成的累加器組和一個大小為4的寄存器就能支持MPEG-4標準下的高級預測模式。
圖1是分層運動估計方法流程圖。
圖2是子塊搜索順序圖。
圖3是電路整體示意圖。
圖4是PE陣列結(jié)構圖。
圖5是PE結(jié)構圖。
圖6是用于高級預測模式的累加器組結(jié)構圖。
圖7是數(shù)據(jù)的水平交疊特性圖。
圖8是PE陣列的輸入時序圖。
具體實施例方式
為使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下參照附圖并舉實施例,對本發(fā)明進一步詳細說明,在以下的介紹中,N取值為4,圖像塊的匹配搜索都通過反復調(diào)用4×4圖像塊的匹配搜索來實現(xiàn),PE陣列中PE的數(shù)目等于4×4,即16。
本發(fā)明是一種分層運動估計方法,該方法把MPEG-4中對16×16預測宏塊的運動估計分為四個步驟來實現(xiàn),整個方法流程參見圖1所示,子塊搜索順序參見圖2所示。
101)對原始圖像進行4∶1的采樣,在4∶1采樣下,從x方向4個象素點寬度、y方向4個象素點寬度的一個4×4圖像塊內(nèi)抽取一個象素點作為該圖像塊的采樣值,在MPEG-4中,預測宏塊的大小為16×16,在4∶1采樣下被采樣為1個4×4當前圖像塊。在預測宏塊對應位置處[-4,3]范圍內(nèi)搜索最佳匹配位置,得到預測運動矢量V1。在預測宏塊對應位置處[-4,3]范圍內(nèi)搜索最佳匹配位置,被分解為當前圖像塊在4個起始位置處的基本搜索單元進行,基本搜索單元是指一個4×4當前圖像塊在某一位置處[-2,1]范圍內(nèi)的匹配搜索。在本發(fā)明中,搜索最佳匹配位置采用的準則是絕對誤差和(SAD)準則,與當前圖像塊匹配最佳的搜索圖像塊是與當前圖像塊在相同位置處象素點值差的絕對值之和最小的圖像塊。。
步驟101)中所述的對應位置處[-4,3]的范圍是指以預測宏塊對應位置為中心的、x坐標在[-4,3]范圍內(nèi)、y坐標也在[-4,3]范圍內(nèi)的一個8×8塊,在預測宏塊對應位置處[-4,3]范圍內(nèi)搜索最佳匹配位置,就是把預測宏塊與以這8×8塊內(nèi)每一個點為中心的搜索圖像塊、共64個搜索圖像塊進行匹配。
102)采用中值法從預測宏塊的三個相鄰宏塊的預測運動矢量中獲得一個該預測宏塊的預測運動矢量V2。所述的三個相鄰宏塊為MPEG-4所規(guī)定,在此前的預測中,這三個宏塊的預測運動矢量已經(jīng)取得。
103)對原始圖像進行2∶1的采樣,預測宏塊被采樣為1個8×8的當前圖像塊,當前8×8圖像塊在兩個初始位置V1和V2處作[-2,1]范圍內(nèi)的匹配搜索,獲得一個最佳匹配位置,得到對應的預測運動矢量V3。8×8當前圖像塊在某一位置處[-2,1]范圍內(nèi)的匹配搜索被分解為4個4×4圖像塊的基本搜索單元進行,在匹配搜索過程中,累加4個4×4圖像塊的絕對誤差和得到當前8×8圖像塊的絕對誤差和。
所述的步驟101)和102)中,采用分層運動估計方法與相鄰宏塊預測運動矢量相結(jié)合的方法,為步驟103)提供了兩個初始匹配點,提高了運動估計精度。
104)直接處理原始圖像,預測宏塊就是當前圖像塊,大小為16×16,當前圖像塊在V3處作[-2,1]范圍內(nèi)的匹配搜索,得到預測宏塊的最終預測運動矢量。當前圖像塊所作的[-2,1]范圍內(nèi)的匹配搜索被分解為16個4×4圖像塊的基本搜索單元進行,把這16個4×4圖像塊的SAD累加得到當前圖像塊的SAD。在上述過程中,可以通過以下方式實現(xiàn)MPEG-4的高級預測模式當前圖像塊由16個4×4圖像塊組成,這16個圖像塊又可以分成4組,分別組成預測宏塊的4個8×8子圖像塊,在進行這16個4×4圖像塊的SAD累加時,把4組4×4圖像塊的絕對誤差和累加起來并輸出、比較,得到預測宏塊的4個8×8子圖像塊的預測運動矢量即MPEG-4的高級預測結(jié)果。
本發(fā)明還提供了一種超大規(guī)模集成電路,由PE陣列、數(shù)據(jù)存儲區(qū)、控制器和比較判別器組成,其中數(shù)據(jù)存儲區(qū)由當前數(shù)據(jù)存儲區(qū)域和搜索數(shù)據(jù)存儲區(qū)域2個部分組成,整體電路如圖3所示,圖中當前數(shù)據(jù)存儲區(qū)域,用于存儲預測宏塊數(shù)據(jù),在運行過程中需要反復讀??;搜索數(shù)據(jù)存儲區(qū)域,用于存儲整個搜索窗的數(shù)據(jù);控制器,用于控制當前圖像塊和搜索圖像塊的讀取,處理單元陣列和比較判決器;PE陣列,用于實現(xiàn)基本搜索單元;比較判決器,用于對各個基本搜索單元的計算結(jié)果進行比較判決。
所述的PE陣列由16個PE組成,與判決比較器一起,在控制器的控制下完成4×4圖像塊在某一位置處[-2,1]范圍內(nèi)的匹配搜索,這一匹配搜索稱作基本搜索單元。所述的PE陣列結(jié)構如圖4所示,圖中SW,搜索圖像塊數(shù)據(jù);Cur,當前塊數(shù)據(jù);S00,搜索圖像塊第0列第一個像素值;PE,處理單元;Acc*,累加器組。
所述的PE完成一個4×4圖像塊與某一位置處[-2,1]范圍內(nèi)的16個圖像塊中的一個塊的匹配,得到當前4×4圖像塊與該塊的SAD,并能在控制下累加多個4×4圖像塊的SAD,每個PE還有一個由4個累加器組成的累加器組和一個大小為4的寄存器,以實現(xiàn)MPEG-4的高級預測。PE的結(jié)構組成如圖5所示,圖中Cur,當前塊數(shù)據(jù);SW,搜索圖像塊數(shù)據(jù);Reg,寄存器;Acc,累加器。
所述的PE還包含用于高級預測模式的累加器組,其結(jié)構如圖6所示PE計算得到的16個當前4×4圖像塊與搜索4×4圖像塊的SAD值被分成4組,分別送入4個累加器中,累加得到預測宏塊的4個8×8子圖像塊的SAD值。
本發(fā)明超大規(guī)模集成電路通過以下方式實現(xiàn)一個基本搜索單元,即一個4×4當前圖像塊在某一位置處[-2,1]范圍內(nèi)的匹配搜索。在這一過程中,利用到數(shù)據(jù)的水平交疊特性。水平交疊特性如圖7所示,是指與當前圖像塊先后進行匹配的兩個搜索圖像塊有交疊,即有共同的若干列數(shù)據(jù)。據(jù)此特性,搜索圖像塊數(shù)據(jù)被分為奇偶兩列采取流水線的方式進入PE陣列,其中偶數(shù)列數(shù)據(jù)要比奇數(shù)列遲滯4個周期,搜索圖像塊數(shù)據(jù)在PE陣列的輸入時序如圖8所示,圖中C()代表預測宏塊,S()代表搜索圖像塊,黑體數(shù)據(jù)表示該數(shù)據(jù)取自搜索圖像塊的奇數(shù)列,其他數(shù)據(jù)取自搜索圖像塊的偶數(shù)列。每個PE通過控制器控制的二選一的多路復用器選擇其中一路數(shù)據(jù),與當前4×4圖像塊的數(shù)據(jù)計算差值,并將差值送入累加器累加。在開始計算前,需要經(jīng)過16個周期的數(shù)據(jù)預載,使數(shù)據(jù)在寄存器組中逐步移位至圖4所示狀態(tài),在這之前復用器處于高阻狀態(tài),累加器不從PE接受數(shù)據(jù)。然后復用器進入工作狀態(tài),從兩路數(shù)據(jù)中選擇一路數(shù)據(jù)送入PE,與當前圖像塊數(shù)據(jù)計算差值,將結(jié)果送入累加器累加。前四個計算周期內(nèi),序號為0~3和8~11的PE從奇數(shù)列取值,其他PE從偶數(shù)列取值。四個周期后,他們?nèi)≈档膶ο髣偤谜{(diào)換,序號為0~3和8~11的PE從偶數(shù)列取值,其他單元從奇數(shù)列取值,此后每隔四個周期再次調(diào)換,直到完成一次4×4塊的搜索。計算過程中,兩列寄存器的數(shù)據(jù)繼續(xù)保持移位操作。在十六個周期后,PE陣列得到當前4×4圖像塊與某一位置處[-2,1]范圍內(nèi)共16個搜索圖像塊的SAD值,這些SAD值由各PE輸入到比較判決器,比較判決器確定其中的最小值。每個PE計算的搜索圖像塊在[-2,1]范圍內(nèi)的相對位置是固定的,比較判決器只需要判斷最小的SAD值來自哪個PE,就可以得到對應的預測運動矢量,不需要添加專門存儲位置的附加電路,使本發(fā)明超大規(guī)模集成電路結(jié)構更加簡潔。
在本發(fā)明中,分層運動估計方法的所有搜索,都通過對基本搜索單元的反復調(diào)用實現(xiàn)。下面分別說明本發(fā)明超大規(guī)模集成電路如何實現(xiàn)所述分層運動估計方法中需要用到的各個搜索功能。
當前4×4當前圖像塊在對應位置處[-4,3]范圍內(nèi)的搜索被分解為4個基本搜索單元進行,在這四個基本搜索單元中,由控制電路從搜索數(shù)據(jù)存儲區(qū)域向PE陣列分別載入整個[-4,3]范圍內(nèi)的某個位置處[-2,1]范圍內(nèi)的數(shù)據(jù)。
當前8×8圖像塊在某一位置處[-2,1]范圍內(nèi)的匹配搜索被分解為4個4×4圖像塊的基本搜索單元進行,在搜索過程中,由控制電路對基本搜索單元加以控制,累加這4個4×4圖像塊的SAD得到當前8×8圖像塊的SAD。具體地說,與在基本搜索單元中PE計算完一個4×4的塊就將結(jié)果輸出到比較判決器中、同時進行清零操作不同,在這一搜索中,計算完一個4×4的塊后PE的累加器不清零,在預載下一個4×4塊數(shù)據(jù)的時段內(nèi)保持其值不變,等待下一個4×4塊計算,連續(xù)計算完四個4×4塊才將結(jié)果輸出,即需要累加64次。
當前16×16圖像塊在某一位置處[-2,1]范圍內(nèi)的匹配搜索被分解為16個4×4圖像塊的基本搜索單元進行,由控制電路對基本搜索單元加以控制,把這16個4×4圖像塊的SAD累加得到當前圖像塊的SAD,具體地說,在這一搜索中,計算完一個4×4的塊后PE的累加器不清零,在預載下一個4×4塊數(shù)據(jù)的時段內(nèi)保持其值不變,等待下一個4×4塊計算,連續(xù)計算完16個4×4塊才將結(jié)果輸出,即需要累加256次。
MPEG-4的高級預測模式在進行16×16圖像塊在某一位置處[-2,1]范圍內(nèi)的匹配搜索過程中,分別組成16×16預測宏塊的4個8×8子圖像塊的4組4×4圖像塊的SAD值在控制器的指令下,被輸入到PE的累加器組中對應該8×8子圖像塊的一個累加器中去,由這4個累加器分別累加這4組4×4圖像塊的SAD,并輸出結(jié)果給寄存器,就得到了MPEG-4的高級預測結(jié)果。
在上述實施例的介紹中,N取值為4,本發(fā)明中N的取值還可以為8,2,具體實施方式
與上述實施例類似。
本發(fā)明并不局限于上述實施例的具體介紹。本發(fā)明可進一步更新,或者對本發(fā)明所公開的特征加以新的組合,也可對本發(fā)明所公開的任何方法或者過程進行更新或者進行新組合。
權利要求
1.一種分層運動估計方法,其特征在于,該方法包括以下步驟A)對原始圖像進行至少一次低采樣率采樣,在每次低采樣率采樣時,反復調(diào)用N×N圖像塊的匹配搜索來實現(xiàn)預測宏塊的匹配搜索,得到預測宏塊在低采樣率下的預測運動矢量,所述N表示圖像塊的寬度或高度;B)直接處理原始圖像,以A)中獲取的預測宏塊在低采樣率下的預測運動矢量為初始位置作匹配搜索,得到預測宏塊的最終預測運動矢量。
2.根據(jù)權利要求1所述的分層運動估計方法,其特征在于,N的值取8,4或2。
3.根據(jù)權利要求1所述的分層運動估計方法,其特征在于,所述步驟A)包括A1)對原始圖像進行4∶1的采樣,在預測宏塊對應位置處[-4,3]范圍內(nèi)作匹配搜索,得到預測運動矢量V1;A2)對原始圖像進行2∶1的采樣,以A1)中獲取的V1為初始位置作[-2,1]范圍內(nèi)的匹配搜索,得到預測宏塊在低采樣率下的預測運動矢量。
4.根據(jù)權利要求3所述的分層運動估計方法,其特征在于,所述步驟A2)進一步包括A21)采用中值法從預測宏塊的三個相鄰宏塊的預測運動矢量中獲得預測運動矢量V2;A22)對原始圖像進行2∶1的采樣,分別以A1)中獲取的V1和A21)中獲取的V2為初始位置作[-2,1]范圍內(nèi)的匹配搜索,得到預測宏塊在低采樣率下的預測運動矢量。
5.根據(jù)權利要求3所述的分層運動估計方法,其特征在于,所述步驟A1)包括對原始圖像進行4∶1的采樣,預測宏塊被抽樣為一個4×4的當前圖像塊,預測宏塊在對應位置處[-4,3]范圍內(nèi)的匹配搜索被分解為當前圖像塊在4個起始位置處的匹配搜索進行。
6.根據(jù)權利要求3所述的分層運動估計方法,其特征在于,所述步驟A2)包括對原始圖像進行2∶1的采樣,預測宏塊被抽樣為一個8×8的當前圖像塊,預測宏塊在對應位置處[-2,1]范圍內(nèi)的匹配搜索被分解為4個4×4圖像塊的匹配搜索進行,把這4個4×4圖像塊與對應搜索圖像塊的絕對誤差和累加得到當前8×8圖像塊的絕對誤差和。
7.根據(jù)權利要求1所述的分層運動估計方法,其特征在于,所述步驟B)包括直接處理預測宏塊,當前圖像塊的大小為16×16,預測宏塊在對應位置處[-2,1]范圍內(nèi)的匹配搜索被分解為16個4×4圖像塊的匹配搜索進行,把這16個4×4圖像塊與對應搜索圖像塊的絕對誤差和累加得到當前圖像塊的絕對誤差和。
8.根據(jù)權利要求1所述的分層運動估計方法,其特征在于,所述步驟B)進一步包括,通過以下方式實現(xiàn)MPEG-4的高級預測模式預測宏塊在對應位置處[-2,1]范圍內(nèi)的匹配搜索被分解為16個4×4圖像塊的匹配搜索進行,把這16個4×4圖像塊再分成分別組成預測宏塊的4個8×8子圖像塊的4組,把4組4×4圖像塊的絕對誤差和累加起來并輸出、比較,得到預測宏塊的4個8×8子圖像塊的預測運動矢量即MPEG-4的高級預測結(jié)果。
9.一種分層運動估計超大規(guī)模集成電路,其特征在于該電路包括處理單元陣列、數(shù)據(jù)存儲區(qū)、控制器和比較判別器,其中數(shù)據(jù)存儲區(qū)存儲預測宏塊數(shù)據(jù)和搜索窗數(shù)據(jù);處理單元陣列包括N×N個處理單元,用于計算當前N×N圖像塊與某一位置處[-N/2,N/2-1]范圍內(nèi)N×N個N×N搜索圖像塊的絕對誤差和;比較判決器用于根據(jù)處理單元陣列輸出的計算結(jié)果,得到預測運動矢量并送給控制器;控制器用于從數(shù)據(jù)存儲區(qū)把當前N×N圖像塊數(shù)據(jù)和搜索圖像塊數(shù)據(jù)送到處理單元陣列,控制處理單元陣列的操作,把處理單元陣列的計算結(jié)果送給比較判決器,以及從比較判決器得到預測宏塊的預測運動矢量。
10.根據(jù)權利要求9所述的分層運動估計超大規(guī)模集成電路,其特征在于所述的處理單元在控制器的控制下實現(xiàn)當前N×N圖像塊與某一位置處[-N/2,N/2-1]范圍內(nèi)的N×N個搜索圖像塊中一個塊的絕對誤差和的計算,其中,所述搜索圖像塊在[-N/2,N/2-1]范圍內(nèi)的相對位置是固定的。
11.根據(jù)權利要求9所述的分層運動估計超大規(guī)模集成電路,其特征在于所述的處理單元在控制器的控制下實現(xiàn)當前N×N圖像塊與多個搜索N×N圖像塊的絕對誤差和累加的計算。
12.根據(jù)權利要求9所述的分層運動估計超大規(guī)模集成電路,其特征在于所述的處理單元進一步包括一個由4個累加器組成的累加器組和一個大小為4的寄存器,用以實現(xiàn)MPEG-4的高級預測,其中4個累加器負責分別累加預測宏塊的4個8×8子圖像塊與搜索圖像塊的絕對誤差和,寄存器負責保存4個子圖像塊的預測運動矢量。
13.根據(jù)權利要求9所述的分層運動估計超大規(guī)模集成電路,其特征在于,所述控制器用于從數(shù)據(jù)存儲區(qū)把搜索圖像塊數(shù)據(jù)送到處理單元陣列的方式為控制器用于把搜索圖像塊數(shù)據(jù)以流水線方式分奇數(shù)和偶數(shù)列像素值兩路送入所述處理單元陣列,偶數(shù)列數(shù)據(jù)比奇數(shù)列數(shù)據(jù)遲滯4個周期,并控制處理單元陣列每隔四個周期其取值對象由其中一路轉(zhuǎn)換為另一路。
14.根據(jù)權利要求9所述的分層運動估計超大規(guī)模集成電路,其特征在于,所述控制器用于從數(shù)據(jù)存儲區(qū)把當前N×N圖像塊數(shù)據(jù)送到處理單元陣列的方式為控制器用于把當前圖像塊數(shù)據(jù)以并行方式送入處理單元陣列,在同一個周期中,所有處理單元使用當前圖像塊中同一像素值。
全文摘要
一種分層運動估計方法,對預測宏塊的運動估計分別在多種采樣率下進行,在低采樣率下作較大范圍的搜索,在原始圖像上作較小范圍的搜索,從而既保證了搜索的準確率又保證了方法的執(zhí)行速度。實現(xiàn)該方法的超大規(guī)模集成電路由一個共N×N個處理單元組成的處理陣列、控制電路、存儲區(qū)域和比較判別器組成。本發(fā)明實現(xiàn)了一個結(jié)構簡單、功耗低、尺寸小,搜索速度也要明顯優(yōu)于全搜索算法的分層運動估計超大規(guī)模集成電路,同時,該超大規(guī)模集成電路在不增加計算量和陣列尺寸的前提下支持MPEG-4標準下的高級預測模式。
文檔編號H04N7/32GK1852442SQ20051009321
公開日2006年10月25日 申請日期2005年8月19日 優(yōu)先權日2005年8月19日
發(fā)明者張江山, 喻鵬, 王琳 申請人:深圳市海思半導體有限公司