專利名稱:具有利用局部亮度變化的加權(quán)預(yù)測的視頻編解碼器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般地涉及視頻編碼器和解碼器,更具體而言涉及用于利用局部亮度變化進行加權(quán)預(yù)測視頻編碼和解碼的方法和裝置。
背景技術(shù):
視頻壓縮編碼器和/或解碼器(CODEC)的壓縮多是從幀間預(yù)測獲得的。但是,當(dāng)涉及暫態(tài)的亮度變化時,簡單的幀間技術(shù)無法充分地提高編碼效率。
H.264/JVT/MPEG AVC(“H.264”)視頻壓縮標(biāo)準(zhǔn)提供了一種加權(quán)預(yù)測工具。對于全局亮度變化其效果很好,但是由于可以使用的不同加權(quán)參數(shù)的數(shù)目有限,因此在存在較大的局部亮度變化時可獲得的效果就很小了。
幀間預(yù)測過程形成待編碼的圖片的參考圖片預(yù)測,并且對當(dāng)前圖片和預(yù)測之間的差值進行編碼。預(yù)測與當(dāng)前圖片越緊密相關(guān),壓縮圖片所需要的比特數(shù)就越少。
在現(xiàn)有的視頻編解碼器中,參考圖片是利用先前解碼的圖片形成的。不幸的是,當(dāng)例如由于照明變化、淡入/淡出效應(yīng)、照相機閃光等等而涉及嚴(yán)重的暫態(tài)亮度變化時,傳統(tǒng)的運動補償就可能失敗(或者其效率變得極低)。
在H.264中,加權(quán)預(yù)測(WP)工具被用于提高編碼效率。WP利用積性加權(quán)因子a和加性加權(quán)偏移量b來估計亮度變化,如式(eq1)如示I(x,y,t)=a·I(x+mvx),y+mvy,t-1)+b(1)其中I(x,y,t)是時刻t像素(x,y)的亮度強度,a和b是測量區(qū)域中的常數(shù)值,(mvx,mvy)是運動向量。
在H.264標(biāo)準(zhǔn)的主規(guī)范概要和擴展規(guī)范概要中支持加權(quán)預(yù)測。在圖片參數(shù)集合中,對于P和SP切片(slice)利用weighted_pred_flag字段來指示加權(quán)預(yù)測的使用,而對于B切片則利用weighted_bipred_idc字段來指示加權(quán)預(yù)測的使用。存在兩種WP模式顯式模式(explicit mode)和隱式模式(implicit mode)。顯式模式在P、SP和B切片中都支持。隱式模式只在B切片中支持。
在WP中,所使用的加權(quán)因子是基于當(dāng)前宏塊或宏塊分區(qū)的參考圖片索引的(或者在雙預(yù)測情況下基于多個參考圖片索引)。參考圖片索引或者被編碼在比特流中,或者可以被推導(dǎo)出,例如對于跳過的或直接模式的宏塊。對于當(dāng)前圖片的所有切片的每個參考圖片索引,有單個加權(quán)因子和單個偏移量與之相關(guān)聯(lián)。對于顯式模式,這些參數(shù)被編碼在切片頭部中。對于隱式模式,這些參數(shù)是推導(dǎo)出的。加權(quán)因子和偏移量參數(shù)值也被約束,以允許幀間預(yù)測過程中的16比特算術(shù)運算。
顯式模式由P或SP切片中weighted_pred_flag等于1指示,或者由B切片中weighted_bipred_idc等于1指示。如前所述,在該模式中,WP參數(shù)被編碼在切片頭部中。對于P切片和B切片,可針對列表0中的每個可允許參考圖片編碼每個顏色分量的積性加權(quán)因子和加性偏移量。列表0中的可允許參考圖片的數(shù)目由num_ref_idx_I0_active_minus1指示,而對于列表1(對于B切片)這由num_ref_idx_I1_active_minus1指示。
對于均勻應(yīng)用在整個圖片上的全局亮度變化,單個加權(quán)因子和偏移量就足以高效地對圖片中從同一參考圖片預(yù)測的所有宏塊進行編碼。但是,對于非均勻應(yīng)用的亮度變化,例如對于照明變化或照相機閃光,可以利用參考圖片重排序,使多于一個參考圖片索引與一個特定的參考圖片存儲相關(guān)聯(lián)。這允許了即使在從同一參考圖片預(yù)測時,同一圖片中的不同宏塊也能使用不同的加權(quán)因子。然而,H.264中可用的參考圖片的數(shù)目受當(dāng)前水平和規(guī)范概要的限制,或者受到運動估計復(fù)雜度的約束。這會嚴(yán)重地限制局部亮度變化期間WP的效率。
因此,如果能有一種用于至少克服了上述現(xiàn)有技術(shù)缺陷的加權(quán)預(yù)測視頻編碼的方法和裝置,則將會是非常合乎需要且十分有利的。
發(fā)明內(nèi)容
本發(fā)明解決了現(xiàn)有技術(shù)的這些和其他缺陷和缺點,本發(fā)明針對一種用于利用局部亮度變化進行加權(quán)預(yù)測視頻編碼和解碼的方法和裝置。
根據(jù)本發(fā)明的一個方面,提供了一種用于對圖片的視頻數(shù)據(jù)進行編碼的視頻編碼器。所述視頻數(shù)據(jù)具有局部亮度變化。所述視頻編碼器包括編碼器,該編碼器用于利用局部化的加權(quán)函數(shù)對所述視頻數(shù)據(jù)進行幀間編碼,以確定所述局部亮度變化的權(quán)重。所述局部化加權(quán)函數(shù)的權(quán)重是在不進行顯式編碼的情況下推導(dǎo)出的。
根據(jù)本發(fā)明的另一方面,提供了一種用于對圖片的視頻數(shù)據(jù)進行編碼的方法。所述視頻數(shù)據(jù)具有局部亮度變化。該方法包括以下步驟利用局部化的加權(quán)函數(shù)對所述視頻數(shù)據(jù)進行幀間編碼,以確定所述局部亮度變化的權(quán)重。所述局部化加權(quán)函數(shù)的權(quán)重是在不進行顯式編碼的情況下推導(dǎo)出的。
根據(jù)本發(fā)明的另一方面,提供了一種用于對圖片的視頻數(shù)據(jù)進行解碼的視頻解碼器。所述視頻數(shù)據(jù)具有局部亮度變化。所述視頻解碼器包括解碼器,該解碼器用于利用局部化的加權(quán)函數(shù)對所述視頻數(shù)據(jù)進行解碼,以確定所述局部亮度變化的權(quán)重。所述局部化加權(quán)函數(shù)的權(quán)重是在不進行顯式編碼的情況下推導(dǎo)出的。
根據(jù)本發(fā)明的另一方面,提供了一種用于對圖片的視頻數(shù)據(jù)進行解碼的方法。所述視頻數(shù)據(jù)具有局部亮度變化。該方法包括以下步驟利用局部化的加權(quán)函數(shù)對所述視頻數(shù)據(jù)進行解碼,以確定所述局部亮度變化的權(quán)重。所述局部化加權(quán)函數(shù)的權(quán)重是在不進行顯式編碼的情況下推導(dǎo)出的。
從以下應(yīng)當(dāng)聯(lián)系附圖來理解的對示例性實施例的詳細描述中可清楚看出本發(fā)明的這些和其他方面、特征和優(yōu)點。
根據(jù)以下附圖可更好地理解本發(fā)明,附圖中圖1示出了根據(jù)本發(fā)明原理的運動估計和補償過程的框圖。
圖2A示出了根據(jù)本發(fā)明原理的用于利用加權(quán)預(yù)測對視頻數(shù)據(jù)進行編碼的編碼器的框圖。
圖2B示出了根據(jù)本發(fā)明原理用于利用加權(quán)預(yù)測對視頻數(shù)據(jù)進行編碼的方法的流程圖。
圖3A示出了根據(jù)本發(fā)明原理的用于利用加權(quán)預(yù)測對視頻數(shù)據(jù)進行解碼的解碼器的框圖。
圖3B示出了根據(jù)本發(fā)明原理用于利用加權(quán)預(yù)測對視頻數(shù)據(jù)進行解碼的方法的流程圖。
圖4A示出了利用圖2B的加權(quán)預(yù)測方法和/或H.264標(biāo)準(zhǔn)對視頻數(shù)據(jù)進行編碼的方法的流程圖。
圖4B示出了利用圖3B的加權(quán)預(yù)測方法和/或H.264標(biāo)準(zhǔn)對視頻數(shù)據(jù)進行解碼的方法的流程圖。
圖5示出了本發(fā)明可應(yīng)用到的H.264標(biāo)準(zhǔn)中的宏塊(MB)分區(qū)和亞MB分區(qū)的圖。
具體實施例方式
本發(fā)明針對一種用于利用局部亮度變化進行加權(quán)預(yù)測視頻編碼和解碼的方法和裝置。
在圖示實施例中,本發(fā)明用于遵循H.264的上下文中,其中權(quán)重是根據(jù)源圖片中當(dāng)前塊的先前編碼和重構(gòu)的鄰居像素和參考圖片中其相應(yīng)的運動預(yù)測的(或同位的)像素來估計的。有利的是,本發(fā)明不要求發(fā)送任何額外的比特,因為在編碼器和解碼器中都可獲得用于推導(dǎo)出這些權(quán)重的信息。
這里所使用的“同位(co-located)”一詞是指不同幀、域或圖片中處于同一位置的像素。此外,“鄰居(neighboring)”一詞是指當(dāng)前幀、域或圖片中處于附近(但不同)位置的像素,該位置可以是毗鄰(adjacent)的位置,但不一定要是這樣。
本文說明了本發(fā)明的原理。從而可以意識到,本領(lǐng)域的技術(shù)人員將能夠設(shè)計出各種布置,這些布置雖然在這里沒有明確描述或示出,但是卻體現(xiàn)了本發(fā)明的原理,因而被包括在其精神和范圍之內(nèi)。
這里記載的所有示例和條件語言的打算用于教學(xué)目的,以幫助讀者理解本發(fā)明的原理以及發(fā)明人對改進技術(shù)所貢獻出的思想,它們應(yīng)當(dāng)被理解為并不限于這種具體記載的示例和條件。
此外,這里所有記載本發(fā)明的原理、方面和實施例及其特定示例的陳述都打算涵蓋其結(jié)構(gòu)和功能等同。此外,希望這些等同既包括當(dāng)前已知的等同,也包括未來開發(fā)出來的等同,即開發(fā)來執(zhí)行相同功能的任何要素,不論其結(jié)構(gòu)如何。
從而,例如,正如本領(lǐng)域的技術(shù)人員將會意識到的,這里給出的框圖代表了體現(xiàn)本發(fā)明原理的說明性電路的概念視圖。類似地,將會意識到,任何流程表、流程圖、狀態(tài)轉(zhuǎn)換圖、偽代碼之類的都代表基本上可表示在計算機可讀介質(zhì)中并因此被計算機或處理器執(zhí)行的各種過程,不論這種計算機或處理器是否被明確地示出。
附圖中示出的各種要素的功能可利用專用硬件以及能夠結(jié)合適當(dāng)軟件執(zhí)行軟件的硬件來提供。當(dāng)由處理器提供時,這些功能可由單個專用硬件、單個共享處理器或多個個體處理器(其中某些可能被共享)提供。此外,對“處理器”或“控制器”一詞的明確使用不應(yīng)當(dāng)被理解為只專門指能夠執(zhí)行軟件的硬件,而是也可隱含著包括(但不限于)數(shù)字信號處理器(“DSP”)硬件、用于存儲軟件的只讀存儲器(“ROM”)、隨機訪問存儲器(“RAM”)和非易失性存儲設(shè)備。
也可包括其他傳統(tǒng)的和/或定制的硬件。類似地,附圖中所示的任何開關(guān)只是概念性的。它們的功能可通過程序邏輯的操作、通過專用邏輯、通過程序控制和專用邏輯的交互或者甚至通過手工來執(zhí)行,具體的技術(shù)可由實現(xiàn)者根據(jù)對上下文的具體理解來選擇。
在所附權(quán)利要求中,任何被表達為用于執(zhí)行指定功能的裝置的要素都打算涵蓋任何執(zhí)行該功能的方法,例如包括a)執(zhí)行該功能的電路元素的組合或者(b)任何形式的軟件(因此包括固件、微代碼等等)與用于執(zhí)行該軟件以執(zhí)行該功能的適當(dāng)電路相結(jié)合。這些權(quán)利要求所限定的本發(fā)明存在于以下事實中即由各種記載的裝置提供的功能被以權(quán)利要求所要求的方式組合到一起。因而,認(rèn)為任何能夠提供這些功能的裝置都與這里示出的那些等同。
對于在存在較大局部亮度變化的情況下的編碼,從式1可以看出為了能夠高效地處理局部變化,必須使用加權(quán)參數(shù)a和b的一個相當(dāng)大的集合。不幸的是,將會需要很多比特來對這些參數(shù)編碼。
有利的是,提供了一種方法和裝置來處理局部亮度變化。取代對權(quán)重進行顯式的編碼和發(fā)送,可以從源圖片中當(dāng)前塊的先前編碼和重構(gòu)的鄰居像素和參考圖片中其相應(yīng)的運動預(yù)測的(或同位的)像素來估計這些權(quán)重。由于該信息在編碼器和解碼器中都可獲得,因此可以很容易地推導(dǎo)出權(quán)重,而不需要額外的比特來告知權(quán)重。
轉(zhuǎn)到圖1,運動估計和補償過程總體上由標(biāo)號100指示。運動估計和補償過程100涉及當(dāng)前圖片C和參考圖片R。
給定塊E,將其像素記為c[x,y]=C[x0+x,y0+y],其中[x0,y0]是塊E的左上方像素位置,x=0...N-1,y=0...M-1,N是E的寬度,M是E的高度。此外,將E的先前編碼和重構(gòu)的鄰居樣本記為p[x,y],其中其左方鄰居樣本(如果可用)為p[-1,y]=C[x0-1,y0+y],y=0...M-1,上方鄰居樣本(如果可用)為p[x,-1]=C[x0+x,y0-1],x=0...N-1,左上方鄰居樣本(如果可用)為p[-1,-1]=C[x0-1,y0-1]。此外,將參考圖片R中p[x,y]的相應(yīng)運動預(yù)測的像素記為q[x,y]=R[x0+x+mvx,y0+y+mvy],其中[mvx,mvy]是塊的運動向量。于是,可以從相應(yīng)的鄰居像素p[x,y]和q[x,y]來估計/擬合加權(quán)函數(shù)W,它滿足p=W(F(q)),其中F是濾波器。因此,r[x,y]=W(G(R[x0+x+mvx,y0+y+mvy])),其中r[x,y]是參考圖片R中E的運動預(yù)測塊的像素,G是濾波器。
在更簡單的實施例中,q[x,y]是參考圖片R中的同位像素,而沒有應(yīng)用運動向量,即q[x,y]=R[x0+x,y0+y]。在這種情況下,可以從相應(yīng)的像素p[x,y]來估計/擬合加權(quán)函數(shù)W,即p[x,y]=W(F(R[x0+x,y0+y]))。
因此,為了利用本發(fā)明對圖片進行解碼,解碼器只需要以下知識加權(quán)函數(shù)W、利用可用信息對W的系數(shù)的推導(dǎo)(擬合方法),以及濾波器F和G。
轉(zhuǎn)到圖2A,用于利用加權(quán)預(yù)測對視頻數(shù)據(jù)進行編碼的編碼器總體上由標(biāo)號200指示。編碼器200的輸入與求和點202的同相輸入發(fā)生信號通信連接(求和點的目的是定義編碼器處的輸入與預(yù)測之間的差值,該差值隨后在編碼器中被編碼),并且與運動估計器204的第一輸入發(fā)生信號通信連接。求和點202的輸出與變換器206的輸入發(fā)生信號通信連接。變換器206的輸出與量化器208的輸入發(fā)生信號通信連接。量化器208的輸出與可變長度編碼器(“VLC”)210的輸入發(fā)生信號通信連接,并且與逆量化器212的輸入發(fā)生信號通信連接。VLC 210的輸出可用作編碼器200的外部輸出。
逆量化器212的輸出與逆變換器214的輸入發(fā)生信號通信連接。逆變換器214的輸出與參考圖片存儲216的輸入發(fā)生信號通信連接。參考圖片存儲216的第一輸出與加權(quán)函數(shù)估計器218的輸入發(fā)生信號通信連接。參考圖片存儲216的第二輸出與運動估計器204的第二輸入發(fā)生信號通信連接。參考圖片存儲216的第三輸出與運動補償器220的第一輸出發(fā)生信號通信連接。加權(quán)函數(shù)估計器218的輸出與運動估計器204的第三輸入發(fā)生信號通信連接,并且與加權(quán)函數(shù)模塊222的第一輸入發(fā)生信號通信連接。運動估計器204的輸出與運動補償器220的第二輸入發(fā)生信號通信連接。運動補償器220的輸出與加權(quán)函數(shù)模塊222的第二輸入發(fā)生信號通信連接。加權(quán)函數(shù)模塊222的輸出與求和點202的反相輸入發(fā)生信號通信連接。
轉(zhuǎn)到圖2B,用于利用加權(quán)預(yù)測對視頻數(shù)據(jù)進行編碼的方法總體上由標(biāo)號250指示。
開始塊252將控制傳遞給輸入塊254。輸入塊254接收未經(jīng)壓縮的圖像塊,并且將控制傳遞給功能塊256。功能塊256估計用于參考圖片的加權(quán)函數(shù),并且將控制傳遞給功能塊258。功能塊258利用局部化加權(quán)函數(shù)通過圖像塊和參考圖片之間的差值來計算運動向量,并將控制傳遞給功能塊260。功能塊260利用計算出的運動向量對參考圖片執(zhí)行運動補償,以形成加權(quán)運動補償參考圖像塊,并將控制傳遞給功能塊264。功能塊264從未經(jīng)壓縮的圖像塊中減去加權(quán)運動補償參考圖像塊,并將控制傳遞給功能塊266。功能塊266利用參考圖片索引對未經(jīng)壓縮的圖像塊和加權(quán)運動補償參考塊之間的差值進行編碼,并將控制傳遞給結(jié)束塊268。
轉(zhuǎn)到圖3A,用于利用加權(quán)預(yù)測對視頻數(shù)據(jù)進行解碼的解碼器總體上由標(biāo)號300指示。
視頻解碼器300包括可變長度解碼器(VLD)302,用于接收經(jīng)數(shù)字編碼的視頻序列。VLD 302的輸出與逆量化器304的輸入發(fā)生信號通信連接。逆量化器304的輸出與逆變換器306的輸入發(fā)生信號通信連接。逆變換器306的輸出與求和點308(用于將預(yù)測值與逆變換器306的輸出相結(jié)合以重構(gòu)視頻輸出信號的元件)的第一輸入發(fā)生信號通信連接。
參考圖片存儲314的第一輸出與運動補償器312的輸入發(fā)生信號通信連接。參考圖片存儲314的第二輸出與加權(quán)函數(shù)估計器316的第一輸入發(fā)生信號通信連接。運動補償器312的輸出與加權(quán)函數(shù)模塊310的第一輸入發(fā)生信號通信連接。加權(quán)函數(shù)估計器316的輸出與加權(quán)函數(shù)模塊310的第二輸入發(fā)生信號通信連接。加權(quán)函數(shù)模塊310的輸出與求和點308的第二輸入發(fā)生信號通信連接。求和點308的輸出與加權(quán)函數(shù)估計器316的第二輸入發(fā)生信號通信連接。求和點308的輸出可用作解碼器300的外部輸出。
轉(zhuǎn)到圖3B,用于利用加權(quán)預(yù)測對視頻數(shù)據(jù)進行解碼的方法總體上由標(biāo)號350指示。
開始塊352將控制傳遞給輸入塊354。輸入塊354接收圖像塊數(shù)據(jù),并將控制傳遞給輸入塊356。輸入塊356接收圖像塊的參考圖片索引,并將控制傳遞給功能塊358。功能塊358確定用于接收到的參考圖片索引的加權(quán)函數(shù),并將控制傳遞給功能塊360。功能塊360取得與接收的參考圖片索引相對應(yīng)的參考圖片,并將控制傳遞給功能塊362。功能塊362對取得的參考圖片進行運動補償,并將控制傳遞到功能塊364。功能塊364對經(jīng)運動補償?shù)膮⒖紙D像塊應(yīng)用加權(quán)函數(shù),并將控制傳遞到功能塊366。功能塊366將殘余(residue)添加到經(jīng)加權(quán)的參考圖像塊以形成經(jīng)解碼的圖像塊,并將控制傳遞給結(jié)束塊368。
應(yīng)當(dāng)注意,與雙預(yù)測塊的情形相比,本發(fā)明在單預(yù)測塊(single-predicted block)的情形可提供更好的結(jié)果。從而,在某些情況下,最好通過檢查使用的預(yù)測數(shù)目并相應(yīng)選擇適當(dāng)預(yù)測方法,將H.264現(xiàn)有運動補償方法(沒有權(quán)重或顯式和隱式加權(quán)預(yù)測)與本發(fā)明相結(jié)合。具體而言,可能希望僅對所有單預(yù)測塊使用本發(fā)明的原理,而對于雙預(yù)測塊(bi-predicted blocks)則基于發(fā)送的H.264參數(shù)來考慮權(quán)重。
本發(fā)明的原理可結(jié)合任何基于塊的運動補償視頻編碼器和/或視頻解碼器使用。從而,應(yīng)當(dāng)意識到,雖然在這里出于說明目的描述了本發(fā)明用于H.264編解碼器實施例中的情況,但本發(fā)明并不限于所示出和描述的實施例,從而可以采用其他實施例,同時仍保持本發(fā)明的范圍。例如,本發(fā)明可以按獨立的方式針對局部亮度變化使用。本發(fā)明的這些和其他實現(xiàn)方式可以很容易被本領(lǐng)域和相關(guān)領(lǐng)域的技術(shù)人員設(shè)想出來,同時仍保持本發(fā)明的范圍。
現(xiàn)在將描述與本發(fā)明的說明性實施例有關(guān)的考慮因素。在本文中,將描述以下考慮因素加權(quán)函數(shù)W、濾波器F和G、鄰居樣本、語法改變和顏色分量推廣。
現(xiàn)在將描述加權(quán)函數(shù)W。在解碼器和編碼器中,應(yīng)當(dāng)使用相同的W函數(shù),以及相同的從相應(yīng)鄰居像素p[x,y]和q[x,y]推導(dǎo)/擬合W的方法??梢宰杂蛇x擇W和相應(yīng)的推導(dǎo)/擬合方法。為了簡便,建議使用多項式函數(shù)y=a0+a1x+a2x2...+anxn,其中n=-1,0,1....(注意,n=-1意味著不使用上述方法)以及多項式最小二乘擬合來推導(dǎo)多項式系數(shù)。多項式的次數(shù)n可在頭部中指定。如果n=1,則它與H.264中的加權(quán)預(yù)測函數(shù)相同。
現(xiàn)在將描述濾波器F和G。濾波器F和G可以是相同或不同的濾波器。為了簡便,建議F和G都是相同的濾波器。本發(fā)明并不局限于任何特定類型的濾波器,從而也可采用其他濾波器,同時仍保持本發(fā)明的范圍。例如,可根據(jù)本發(fā)明的原理使用中值濾波器或任何種類的去噪聲濾波器。
現(xiàn)有將描述鄰居樣本。在上述解碼器規(guī)格中,只使用一層鄰居像素。但是,應(yīng)當(dāng)意識到,這可以推廣到多層??梢赃m應(yīng)性地選擇鄰居樣本。例如,可以選擇所有左方、上方和左上方樣本,或者可以基于鄰居塊的運動向量來適應(yīng)性地選擇這些樣本。
現(xiàn)在將描述語法改變。上述方法可與當(dāng)前的H.264編解碼器和語法相結(jié)合。例如,可使用一個參數(shù)(即圖片參數(shù)集合內(nèi)的一個參數(shù)),其告知此方法是否要被用于當(dāng)前圖片/切片。該參數(shù)還可告知是否有另一個不同方法被用于雙預(yù)測。此外,對于每個參考,發(fā)送一個單獨的參數(shù)(即在切片參數(shù)集合內(nèi)的參數(shù)),其指示加權(quán)函數(shù)W的多項式的次數(shù)。最后,在編碼期間,所有可能的變化都可被測試,并且現(xiàn)有的窮舉式拉格朗日速率失真優(yōu)化(RDO)方法可被用于為每個參考圖片選擇最適當(dāng)?shù)姆椒?與H.264方法相比)。
現(xiàn)在將描述顏色分量推廣。相同的方法可以只用于luma Y分量,或者有選擇地用于所有分量。選擇可以隱式地完成,或者可以通過使用圖片或切片參數(shù)來顯式地完成。
本發(fā)明主要影響了當(dāng)前H.264編解碼器中的運動估計和補償步驟。所有其他的編碼和解碼步驟都與H.264中相同。在以下描述中,給出了編碼器和解碼器如何能夠利用本發(fā)明的示例。為了簡便,使用了W的一次多項式,即y=w(x)=a0+x(2)其中a1=1。
曲線擬合方法如下a0=mean(p[x,y]-q[x,y])=mean(p[x,y])-mean(q[x,y])(3)濾波器F和G是相同的濾波器。只使用一層鄰居樣本,并且在式3中應(yīng)用所有可用的上方、左方和左上方樣本來估計權(quán)重。但是應(yīng)當(dāng)意識到,前述配置是說明性的,因而本發(fā)明并不僅限于前述配置,其他配置也可被采用,同時仍保持本發(fā)明的范圍。
本發(fā)明與H.264中使用的加權(quán)預(yù)測相比的一個新穎的方面在于在H.264加權(quán)預(yù)測中,a0必定是固定在切片級別上的,而根據(jù)本發(fā)明的原理,a0是結(jié)合運動向量實時地按塊估計的。
在編碼器處,當(dāng)執(zhí)行運動估計時,不使用量度D(mvx,mvy)=Σ[x,y]∈B|c[x,y]-r[x+mvx,y+mvy]|]]>來度量當(dāng)前圖片中的原始信號c[x,y]和參考圖片中的運動預(yù)測塊r[x+mvx,y+mvy]之間的差值,其中集合B包括所考慮的塊的所有采樣位置,而是使用以下量度Dm(mvx,mvy)=Σ[x,y]∈B|c[x,y]-clip(r[x+mvx,y+mvy]+a0)|---(4)]]>其中 并且a0是結(jié)合運動向量(mvx,mvy)通過式3實時估計的。
然后按下式計算殘余信號res′[x,y]=c[x,y]-clip(r[x+mvx,y+mvy]+a0)(6)在變換和量化之后,殘余信號隨后被進行熵編碼。
注意,在編碼器處,為了去除塊狀假象,在運動估計期間,可以將鄰居像素考慮進來,即在式4中,集合B既包括塊中的像素,又包括其鄰居樣本。
在解碼器處,利用重構(gòu)的殘余信號res′[x,y]和與運動預(yù)測的信號相關(guān)聯(lián)的權(quán)重來對重構(gòu)信號c′[x,y]進行運動補償,如下c′[x,y]=res′[x,y]+clip(r[x+mvx,y+mvy]+a0)(7)轉(zhuǎn)到圖4A,用于利用圖2B的加權(quán)預(yù)測方法或H.264標(biāo)準(zhǔn)對視頻數(shù)據(jù)進行編碼的方法總體上由標(biāo)號400指示。即,圖4A的方法利用了本發(fā)明的方法或H.264方法來對視頻數(shù)據(jù)進行編碼。方法400包括開始塊402,該開始塊初始化與方法400有關(guān)的參數(shù),并且將控制傳遞給判決塊404。判決塊404判定是否要執(zhí)行幀間編碼。如果不會執(zhí)行幀間編碼,則控制被傳遞給功能塊406。否則,如果要執(zhí)行幀間編碼,則控制被傳遞給判決塊410。
功能塊406執(zhí)行幀內(nèi)編碼,并將控制傳遞給結(jié)束塊408。結(jié)束塊408輸出數(shù)據(jù)。
判決塊410判定是否要執(zhí)行H.264幀間編碼。如果不會執(zhí)行H.264幀間編碼,則控制被傳遞給功能塊412。否則,如果要執(zhí)行H.264幀間編碼,則控制被傳遞給功能塊416。
功能塊412利用如這里所述的本發(fā)明對當(dāng)前圖片進行編碼,計算失真,并且將控制傳遞給功能塊414。功能塊414從功能塊412和416的輸出中選擇最佳方法,并且將控制傳遞給結(jié)束塊408。
功能塊416利用H.264對當(dāng)前圖片進行編碼,計算失真,并將控制傳遞給功能塊414。
轉(zhuǎn)到圖4B,用于利用圖3B的加權(quán)預(yù)測方法或H.264標(biāo)準(zhǔn)對視頻數(shù)據(jù)進行解碼的方法總體上由標(biāo)號450指示。即,圖4B的方法利用了本發(fā)明的方法或H.264方法來對視頻數(shù)據(jù)進行解碼。方法450包括開始塊452,該開始塊初始化與方法450有關(guān)的參數(shù),并且將控制傳遞給功能塊454。功能塊454解析頭部(例如確定多項式的次數(shù)n),并且將控制傳遞給判決塊456。判決塊456判定是否要執(zhí)行幀間編碼。如果不會執(zhí)行幀間編碼,則控制被傳遞給功能塊458。否則,如果要執(zhí)行幀間編碼,則控制被傳遞給判決塊462。
功能塊458執(zhí)行幀內(nèi)編碼,并將控制傳遞給結(jié)束塊460。結(jié)束塊460輸出數(shù)據(jù)。
判決塊462判定是否要執(zhí)行H.264幀間編碼。如果不會執(zhí)行H.264幀間編碼,則控制被傳遞給功能塊464。否則,如果要執(zhí)行H.264幀間編碼,則控制被傳遞給功能塊466。
功能塊464利用如這里所述的本發(fā)明對當(dāng)前圖片進行解碼,并且將控制傳遞給功能塊460。
功能塊466利用H.264對當(dāng)前圖片進行解碼,并將控制傳遞給功能塊460。
現(xiàn)在將描述本發(fā)明的另一個實施例,其代表了對本發(fā)明的簡化。H.264使用樹結(jié)構(gòu)的分級宏塊分區(qū)。幀間編碼的16×16像素宏塊可被分解成大小為16×8、8×16或8×8的宏塊分區(qū)。8×8分區(qū)可進一步被分解成8×4、4×8和4×4(見圖5)。轉(zhuǎn)到圖5,本發(fā)明可應(yīng)用到的H.264標(biāo)準(zhǔn)中的宏塊(MB)分區(qū)和亞MB分區(qū)總體上分別由標(biāo)號500和550指示。根據(jù)本發(fā)明的原理,在解碼器處,如果當(dāng)前宏塊的分區(qū)不是16×16,則式3中的每一項被計算多次。為了簡化本發(fā)明的上述實施例,所有的塊大小p[x,y]都固定到其相應(yīng)的16×16宏塊的鄰居像素,記為pmb[x,y]。q[x,y]保持相同。因此,式3被簡化為如下形式a0=mean(pmb[x,y])-mean(q[x,y])(8)從而,當(dāng)前宏塊的鄰居像素的均值在解碼器中只被計算一次,從而降低了復(fù)雜度。
通過將q[x,y]固定到參考圖片中的同位宏塊(運動向量為零)的鄰居像素,記為qmb[x,y],可進一步簡化本發(fā)明的復(fù)雜度。因此,式3可進一步簡化為如下形式a0=mean(pmb[x,y])-mean(qmb[x,y])(9)這樣,在解碼器處對于每個宏塊僅計算a0一次。
現(xiàn)在將描述本發(fā)明所帶來的許多優(yōu)點/特征中的一些。例如,一個優(yōu)點/特征是使用了不要求對權(quán)重進行顯式編碼的加權(quán)函數(shù),從而對具有局部亮度變化的視頻進行了高效的幀間編碼。另一個優(yōu)點/特征是如上所述的加權(quán)函數(shù),其中當(dāng)前圖片中的某個塊的權(quán)重是根據(jù)當(dāng)前圖片中的該塊的先前編碼和重構(gòu)的鄰居像素和參考圖片的相應(yīng)像素估計的。另一個優(yōu)點/特征是具有按上述方式估計的權(quán)重的加權(quán)函數(shù),其中參考圖片中的相應(yīng)像素是同位像素。另一個優(yōu)點/特征是具有按上述方式估計的權(quán)重的加權(quán)函數(shù),其中參考圖片中的相應(yīng)像素根據(jù)用來對塊進行編碼的運動向量被運動補償。此外,另一個優(yōu)點/特征是如上所述的加權(quán)函數(shù),其中加權(quán)函數(shù)被應(yīng)用到參考圖片中的運動預(yù)測塊上,并且運動補償是對加權(quán)預(yù)測運動塊執(zhí)行的。此外,另一個優(yōu)點/特征是如上所述的加權(quán)函數(shù),其中加權(quán)函數(shù)可以是多項式函數(shù)或者任何線性或非線性函數(shù)。另外,另一個優(yōu)點/特征是如上所述的加權(quán)函數(shù),其中權(quán)重是根據(jù)當(dāng)前圖片中塊的先前編碼和重構(gòu)的鄰居像素和參考圖片中其經(jīng)濾波的相應(yīng)運動預(yù)測或同位的像素來估計的。此外,另一個特征/優(yōu)點是如上所述的加權(quán)函數(shù),其中加權(quán)函數(shù)被應(yīng)用到參考圖片中的經(jīng)濾波的運動預(yù)測塊中,并且運動補償是對加權(quán)預(yù)測經(jīng)濾波運動塊執(zhí)行的。另一個優(yōu)點/特征是其中權(quán)重按上述方式估計的加權(quán)函數(shù),或者這樣的加權(quán)函數(shù),其中按上述方式對加權(quán)預(yù)測經(jīng)濾波運動塊執(zhí)行運動補償,并且鄰居像素可以是可用上方像素、可用左方像素、可用左上方像素中的任何一種。此外,另一個優(yōu)點/特征是剛剛描述的加權(quán)函數(shù),其中鄰居像素可以是基于鄰居塊的運動信息適應(yīng)性地選擇的可用上方像素、左方像素、左上方像素中的任何一種。
有關(guān)領(lǐng)域的普通技術(shù)人員基于這里的教導(dǎo)易于確定本發(fā)明的這些和其他特征和優(yōu)點。應(yīng)當(dāng)理解,本發(fā)明的教導(dǎo)可用各種形式的硬件、軟件、固件、專用處理器或其組合來實現(xiàn)。
更具體而言,本發(fā)明的教導(dǎo)被實現(xiàn)為硬件和軟件的組合。此外,該軟件優(yōu)選地被實現(xiàn)為有形地包含在程序存儲單元上的應(yīng)用程序。該應(yīng)用程序可被上載到包括任何合適的體系結(jié)構(gòu)的機器中,并被該機器執(zhí)行。優(yōu)選地,該機器實現(xiàn)在具有諸如一個或多個中央處理單元(“CPU”)、隨機訪問存儲器(“RAM”)和輸入/輸出(“I/O”)接口之類的硬件的計算機平臺上。該計算機平臺還可包括操作系統(tǒng)和微指令代碼。這里描述的各種過程和功能可以是微指令代碼的一部分或應(yīng)用程序的一部分,或者是其任何組合,它們可被CPU執(zhí)行。此外,諸如額外的數(shù)據(jù)存儲單元和打印單元之類的各種其他外圍單元可連接到計算機平臺。
還應(yīng)當(dāng)理解,由于附圖中示出的一些系統(tǒng)構(gòu)成組件和方法優(yōu)選用軟件實現(xiàn),因此,取決于本發(fā)明被編程的方式,系統(tǒng)組件或過程功能塊之間的實際連接可能有所不同。給定這里的教導(dǎo),有關(guān)領(lǐng)域的普通技術(shù)人員將能夠設(shè)想出本發(fā)明的這些和類似的實現(xiàn)方式或者配置。
雖然已經(jīng)參考附圖描述了說明性實施例,但是應(yīng)當(dāng)理解,本發(fā)明并不局限于這些確切的實施例,有關(guān)領(lǐng)域的普通技術(shù)人員可在其中實現(xiàn)各種改變和修改,而不會脫離本發(fā)明的范圍或精神。所有這種改變和修改都希望被包括在所附權(quán)利要求所限定的本發(fā)明的范圍內(nèi)。
權(quán)利要求
1.一種用于對圖片的視頻數(shù)據(jù)進行編碼的裝置,所述視頻數(shù)據(jù)具有局部亮度變化,所述視頻編碼器包括編碼器(200),用于利用局部化的加權(quán)函數(shù)對所述視頻數(shù)據(jù)進行幀間編碼,以確定所述局部亮度變化的權(quán)重,其中所述局部化加權(quán)函數(shù)的權(quán)重是在不進行顯式編碼的情況下推導(dǎo)出的。
2.如權(quán)利要求1所述的裝置,其中所述視頻數(shù)據(jù)可按塊劃分,并且所述圖片中的一個塊的權(quán)重是根據(jù)所述圖片中的該塊的先前編碼和重構(gòu)的鄰居像素和參考圖片中的相應(yīng)像素所估計來的。
3.如權(quán)利要求2所述的裝置,其中所述參考圖片中的所述相應(yīng)像素是同位的像素。
4.如權(quán)利要求2所述的裝置,其中所述參考圖片中的所述相應(yīng)像素根據(jù)用來對所述塊進行幀間編碼的運動向量而被運動補償。
5.如權(quán)利要求2所述的裝置,其中所述重構(gòu)的鄰居像素可以是可用的上方像素、可用的左方像素、可用的左上方像素中的任何一種。
6.如權(quán)利要求2所述的裝置,其中所述重構(gòu)的鄰居像素可以是基于鄰居塊的運動信息而適應(yīng)性地選擇的可用的上方像素、左方像素、左上方像素中的任何一種。
7.如權(quán)利要求1所述的裝置,其中所述局部化加權(quán)函數(shù)被應(yīng)用到參考圖片中的運動預(yù)測塊上,并且運動補償是對加權(quán)預(yù)測運動塊執(zhí)行的。
8.如權(quán)利要求1所述的裝置,其中所述局部化加權(quán)函數(shù)是多項式函數(shù)、線性函數(shù)和非線性函數(shù)之一。
9.如權(quán)利要求1所述的裝置,其中所述局部化加權(quán)函數(shù)是多項式函數(shù),并且該多項式函數(shù)的次數(shù)能夠被用信號告知,并且與參考圖片索引相關(guān)聯(lián)。
10.如權(quán)利要求8所述的裝置,其中,使用一次多項式,其中一次系數(shù)等于1,零次系數(shù)是根據(jù)當(dāng)前圖片中的鄰居像素和參考圖片中的運動預(yù)測的或同位的像素之間的差值的均值所估計來的。
11.如權(quán)利要求10所述的裝置,其中所述視頻數(shù)據(jù)可被劃分成宏塊,對于宏塊支持可變塊大小,并且對于當(dāng)前宏塊中的任何塊,零次系數(shù)被計算為所述當(dāng)前宏塊的鄰居像素的均值和所述參考圖片中當(dāng)前的運動預(yù)測的或同位的塊的鄰居像素的均值之間的差值。
12.如權(quán)利要求11所述的裝置,其中,對于所述當(dāng)前宏塊中的任何塊,所述零次系數(shù)也可計算為所述當(dāng)前宏塊的鄰居像素的均值和所述參考圖片中的同位宏塊的鄰居像素的均值之間的差值。
13.如權(quán)利要求1所述的裝置,其中所述圖像數(shù)據(jù)可按塊劃分,并且所述圖片中的一個塊的權(quán)重是根據(jù)所述圖片中的該塊的先前編碼和重構(gòu)的鄰居像素和參考圖片中經(jīng)濾波的相應(yīng)運動預(yù)測或同位像素所估計來的。
14.如權(quán)利要求13所述的裝置,其中所述重構(gòu)的鄰居像素可以是可用的上方像素、可用的左方像素、可用的左上方像素中的任何一種。
15.如權(quán)利要求13所述的裝置,其中所述重構(gòu)的鄰居像素可以是基于鄰居塊的運動信息而適應(yīng)性地選擇的可用的上方像素、左方像素、左上方像素中的任何一種。
16.如權(quán)利要求1所述的裝置,其中所述局部化加權(quán)函數(shù)被應(yīng)用到參考圖片中的經(jīng)濾波的運動預(yù)測塊上,并且運動補償是對加權(quán)預(yù)測經(jīng)濾波運動塊執(zhí)行的。
17.如權(quán)利要求1所述的裝置,其中,利用頭部中的額外的信號指示是否使用所述編碼器(200)而不是一個或多個現(xiàn)有編碼器,所述編碼器(200)能夠與所述一個或多個現(xiàn)有編碼器相結(jié)合。
18.如權(quán)利要求17所述的裝置,其中用信號告知被用于指示一組預(yù)測方法中的至少一種預(yù)測方法能夠使用所述編碼器。
19.如權(quán)利要求18所述的裝置,其中所述視頻數(shù)據(jù)可被劃分成圖像塊,并且所述一組預(yù)測方法中的預(yù)測方法之間的差異是基于針對當(dāng)前圖像塊的預(yù)測的數(shù)目的。
20.如權(quán)利要求1所述的裝置,其中用信號告知被用于指示一組預(yù)測方法中的至少一種預(yù)測方法能夠使用所述編碼器。
21.如權(quán)利要求1所述的裝置,其中所述視頻數(shù)據(jù)可被劃分成圖像塊,并且所述一組預(yù)測方法中的預(yù)測方法之間的差異是基于針對當(dāng)前圖像塊的預(yù)測的數(shù)目的。
22.如權(quán)利要求1所述的裝置,其中所述局部化加權(quán)函數(shù)僅被應(yīng)用到所述視頻數(shù)據(jù)的Y分量,或者被應(yīng)用到所述視頻數(shù)據(jù)的所有顏色分量。
23.一種用于對圖片的視頻數(shù)據(jù)進行編碼的方法,所述視頻數(shù)據(jù)具有局部亮度變化,該方法包括以下步驟利用局部化的加權(quán)函數(shù)對所述視頻數(shù)據(jù)進行幀間編碼(258),以確定所述局部亮度變化的權(quán)重,其中所述局部化加權(quán)函數(shù)的權(quán)重是在不進行顯式編碼的情況下推導(dǎo)出的。
24.如權(quán)利要求23所述的編碼方法,其中所述視頻數(shù)據(jù)可按塊劃分,并且所述方法還包括以下步驟根據(jù)所述圖片中的一個塊的先前編碼和重構(gòu)的鄰居像素和參考圖片中的相應(yīng)像素來估計(256)所述圖像中的該塊的權(quán)重。
25.如權(quán)利要求24所述的編碼方法,其中所述參考圖片中的所述相應(yīng)像素是同位的像素。
26.如權(quán)利要求24所述的編碼方法,其中所述參考圖片中的所述相應(yīng)像素根據(jù)用來對所述塊進行幀間編碼的運動向量而被運動補償。
27.如權(quán)利要求24所述的編碼方法,其中所述重構(gòu)的鄰居像素可以是可用的上方像素、可用的左方像素、可用的左上方像素中的任何一種。
28.如權(quán)利要求24所述的編碼方法,其中所述重構(gòu)的鄰居像素可以是基于鄰居塊的運動信息而適應(yīng)性地選擇的可用的上方像素、左方像素、左上方像素中的任何一種。
29.如權(quán)利要求23所述的編碼方法,其中所述幀間編碼步驟包括以下步驟在參考圖片中的運動預(yù)測塊上應(yīng)用(262)所述局部化加權(quán)函數(shù),并且對加權(quán)預(yù)測運動塊執(zhí)行(260)運動補償。
30.如權(quán)利要求23所述的編碼方法,其中所述局部化加權(quán)函數(shù)是多項式函數(shù)、線性函數(shù)和非線性函數(shù)之一。
31.如權(quán)利要求23所述的編碼方法,其中所述局部化加權(quán)函數(shù)是多項式函數(shù),并且該多項式函數(shù)的次數(shù)能夠被用信號告知,并且與參考圖片索引相關(guān)聯(lián)。
32.如權(quán)利要求30所述的編碼方法,其中,使用一次多項式,其中一次系數(shù)等于1,零次系數(shù)是根據(jù)當(dāng)前圖片中的鄰居像素和參考圖片中的運動預(yù)測的或同位的像素之間的差值的均值所估計來的。
33.如權(quán)利要求32所述的編碼方法,其中所述視頻數(shù)據(jù)可被劃分成宏塊,對于宏塊支持可變塊大小,并且對于當(dāng)前宏塊中的任何塊,零次系數(shù)被計算為所述當(dāng)前宏塊的鄰居像素的均值和所述參考圖片中當(dāng)前的運動預(yù)測的或同位的塊的鄰居像素的均值之間的差值。
34.如權(quán)利要求33所述的編碼方法,其中,對于所述當(dāng)前宏塊中的任何塊,所述零次系數(shù)也可計算為所述當(dāng)前宏塊的鄰居像素的均值和所述參考圖片中的同位宏塊的鄰居像素的均值之間的差值。
35.如權(quán)利要求23所述的編碼方法,其中所述圖像數(shù)據(jù)可按塊劃分,并且所述幀間編碼步驟包括以下步驟根據(jù)所述圖片中的一個塊的先前編碼和重構(gòu)的鄰居像素和參考圖片中經(jīng)濾波的相應(yīng)運動預(yù)測或同位像素來估計(256)所述圖片中的該塊的權(quán)重。
36.如權(quán)利要求35所述的編碼方法,其中所述重構(gòu)的鄰居像素可以是可用的上方像素、可用的左方像素、可用的左上方像素中的任何一種。
37.如權(quán)利要求35所述的編碼方法,其中所述重構(gòu)的鄰居像素可以是基于鄰居塊的運動信息而適應(yīng)性地選擇的可用的上方像素、左方像素、左上方像素中的任何一種。
38.如權(quán)利要求23所述的編碼方法,其中所述局部化加權(quán)函數(shù)被應(yīng)用到參考圖片中的經(jīng)濾波的運動預(yù)測塊上,并且運動補償是對加權(quán)預(yù)測經(jīng)濾波運動塊執(zhí)行的。
39.如權(quán)利要求23所述的編碼方法,還包括以下步驟利用頭部中的額外的信號指示是否使用所述編碼步驟而不是一個或多個現(xiàn)有編碼步驟,將所述幀間編碼步驟與所述一個或多個現(xiàn)有編碼步驟相結(jié)合(412、416)。
40.如權(quán)利要求39所述的編碼方法,其中用信號告知被用于指示一組預(yù)測方法中的至少一種預(yù)測方法能夠使用所述編碼步驟。
41.如權(quán)利要求40所述的編碼方法,其中所述視頻數(shù)據(jù)可被劃分成圖像塊,并且所述一組預(yù)測方法中的預(yù)測方法之間的差異是基于針對當(dāng)前圖像塊的預(yù)測的數(shù)目的。
42.如權(quán)利要求23所述的編碼方法,其中用信號告知被用于指示一組預(yù)測方法中的至少一種預(yù)測方法能夠使用所述編碼步驟。
43.如權(quán)利要求23所述的編碼方法,其中所述視頻數(shù)據(jù)可被劃分成圖像塊,并且所述一組預(yù)測方法中的預(yù)測方法之間的差異是基于針對當(dāng)前圖像塊的預(yù)測的數(shù)目的。
44.如權(quán)利要求23所述的編碼方法,其中所述局部化加權(quán)函數(shù)僅被應(yīng)用到所述視頻數(shù)據(jù)的Y分量,或者被應(yīng)用到所述視頻數(shù)據(jù)的所有顏色分量。
45.一種用于對圖片的視頻數(shù)據(jù)進行解碼的裝置,所述視頻數(shù)據(jù)具有局部亮度變化,所述視頻解碼器包括解碼器(300),用于利用局部化的加權(quán)函數(shù)對所述視頻數(shù)據(jù)進行解碼,以確定所述局部亮度變化的權(quán)重,其中所述局部化加權(quán)函數(shù)的權(quán)重是隱式地推導(dǎo)出的。
46.如權(quán)利要求45所述的裝置,其中所述視頻數(shù)據(jù)可按塊劃分,并且所述圖片中的一個塊的權(quán)重是根據(jù)所述圖片中的該塊的先前解碼和重構(gòu)的鄰居像素和參考圖片中的相應(yīng)像素所估計來的。
47.如權(quán)利要求45所述的裝置,其中所述參考圖片中的所述相應(yīng)像素是同位的像素。
48.如權(quán)利要求46所述的裝置,其中所述參考圖片中的所述相應(yīng)像素根據(jù)用來對所述塊進行幀間編碼的運動向量而被運動補償。
49.如權(quán)利要求46所述的裝置,其中所述重構(gòu)的鄰居像素可以是可用的上方像素、可用的左方像素、可用的左上方像素中的任何一種。
50.如權(quán)利要求46所述的裝置,其中所述重構(gòu)的鄰居像素可以是基于鄰居塊的運動信息而適應(yīng)性地選擇的可用的上方像素、左方像素、左上方像素中的任何一種。
51.如權(quán)利要求45所述的裝置,其中所述局部化加權(quán)函數(shù)被應(yīng)用到參考圖片中的運動預(yù)測塊上,并且運動補償是對加權(quán)預(yù)測運動塊執(zhí)行的。
52.如權(quán)利要求45所述的裝置,其中所述局部化加權(quán)函數(shù)是多項式函數(shù)、線性函數(shù)和非線性函數(shù)之一。
53.如權(quán)利要求45所述的裝置,其中所述局部化加權(quán)函數(shù)是多項式函數(shù),并且該多項式函數(shù)的次數(shù)能夠被用信號告知,并且與參考圖片索引相關(guān)聯(lián)。
54.如權(quán)利要求52所述的裝置,其中,使用一次多項式,其中一次系數(shù)等于1,零次系數(shù)是根據(jù)當(dāng)前圖片中的鄰居像素和參考圖片中的運動預(yù)測的或同位的像素之間的差值的均值所估計來的。
55.如權(quán)利要求54所述的裝置,其中所述視頻數(shù)據(jù)可被劃分成宏塊,對于宏塊支持可變塊大小,并且對于當(dāng)前宏塊中的任何塊,零次系數(shù)被計算為所述當(dāng)前宏塊的鄰居像素的均值和所述參考圖片中當(dāng)前的運動預(yù)測的或同位的塊的鄰居像素的均值之間的差值。
56.如權(quán)利要求55所述的裝置,其中,對于所述當(dāng)前宏塊中的任何塊,所述零次系數(shù)也可計算為所述當(dāng)前宏塊的鄰居像素的均值和所述參考圖片中的同位宏塊的鄰居像素的均值之間的差值。
57.如權(quán)利要求45所述的裝置,其中所述圖像數(shù)據(jù)可按塊劃分,并且所述圖片中的一個塊的權(quán)重是根據(jù)所述圖片中的該塊的先前解碼和重構(gòu)的鄰居像素和參考圖片中經(jīng)濾波的相應(yīng)運動預(yù)測或同位像素所估計來的。
58.如權(quán)利要求57所述的裝置,其中所述重構(gòu)的鄰居像素可以是可用的上方像素、可用的左方像素、可用的左上方像素中的任何一種。
59.如權(quán)利要求57所述的裝置,其中所述重構(gòu)的鄰居像素可以是基于鄰居塊的運動信息而適應(yīng)性地選擇的可用的上方像素、左方像素、左上方像素中的任何一種。
60.如權(quán)利要求45所述的裝置,其中所述局部化加權(quán)函數(shù)被應(yīng)用到參考圖片中的經(jīng)濾波的運動預(yù)測塊上,并且運動補償是對加權(quán)預(yù)測經(jīng)濾波運動塊執(zhí)行的。
61.如權(quán)利要求45所述的裝置,其中,利用頭部中的額外的信號指示是否使用所述解碼器(300)而不是一個或多個現(xiàn)有解碼器,所述解碼器(300)能夠與所述一個或多個現(xiàn)有解碼器相結(jié)合。
62.如權(quán)利要求61所述的裝置,其中用信號告知被用于指示一組預(yù)測方法中的至少一種預(yù)測方法能夠使用所述解碼器。
63.如權(quán)利要求62所述的裝置,其中所述視頻數(shù)據(jù)可被劃分成圖像塊,并且所述一組預(yù)測方法中的預(yù)測方法之間的差異是基于針對當(dāng)前圖像塊的預(yù)測的數(shù)目的。
64.如權(quán)利要求45所述的裝置,其中用信號告知被用于指示一組預(yù)測方法中的至少一種預(yù)測方法能夠使用所述解碼器。
65.如權(quán)利要求45所述的裝置,其中所述視頻數(shù)據(jù)可被劃分成圖像塊,并且所述一組預(yù)測方法中的預(yù)測方法之間的差異是基于針對當(dāng)前圖像塊的預(yù)測的數(shù)目的。
66.如權(quán)利要求45所述的裝置,其中所述局部化加權(quán)函數(shù)僅被應(yīng)用到所述視頻數(shù)據(jù)的Y分量,或者被應(yīng)用到所述視頻數(shù)據(jù)的所有顏色分量。
67.一種用于對圖片的視頻數(shù)據(jù)進行解碼的方法,所述視頻數(shù)據(jù)具有局部亮度變化,該方法包括以下步驟利用局部化的加權(quán)函數(shù)對所述視頻數(shù)據(jù)進行解碼(358),以確定所述局部亮度變化的權(quán)重,其中所述局部化加權(quán)函數(shù)的權(quán)重是隱式地推導(dǎo)出的。
68.如權(quán)利要求67所述的解碼方法,其中所述視頻數(shù)據(jù)可按塊劃分,并且所述方法還包括以下步驟根據(jù)所述圖片中的一個塊的先前解碼和重構(gòu)的鄰居像素和參考圖片中的相應(yīng)像素來估計(358)所述圖像中的該塊的權(quán)重。
69.如權(quán)利要求68所述的解碼方法,其中所述參考圖片中的所述相應(yīng)像素是同位的像素。
70.如權(quán)利要求68所述的解碼方法,其中所述參考圖片中的所述相應(yīng)像素根據(jù)用來對所述塊進行幀間編碼的運動向量而被運動補償。
71.如權(quán)利要求68所述的解碼方法,其中所述重構(gòu)的鄰居像素可以是可用的上方像素、可用的左方像素、可用的左上方像素中的任何一種。
72.如權(quán)利要求68所述的解碼方法,其中所述重構(gòu)的鄰居像素可以是基于鄰居塊的運動信息而適應(yīng)性地選擇的可用的上方像素、左方像素、左上方像素中的任何一種。
73.如權(quán)利要求67所述的解碼方法,其中所述解碼步驟包括以下步驟在參考圖片中的運動預(yù)測塊上應(yīng)用(364)所述局部化加權(quán)函數(shù),并且對加權(quán)預(yù)測運動塊執(zhí)行(362)運動補償。
74.如權(quán)利要求67所述的解碼方法,其中所述局部化加權(quán)函數(shù)是多項式函數(shù)、線性函數(shù)和非線性函數(shù)之一。
75.如權(quán)利要求67所述的解碼方法,其中所述局部化加權(quán)函數(shù)是多項式函數(shù),并且該多項式函數(shù)的次數(shù)能夠被用信號告知,并且與參考圖片索引相關(guān)聯(lián)。
76.如權(quán)利要求74所述的解碼方法,其中,使用一次多項式,其中一次系數(shù)等于1,零次系數(shù)是根據(jù)當(dāng)前圖片中的鄰居像素和參考圖片中的運動預(yù)測的或同位的像素之間的差值的均值所估計來的。
77.如權(quán)利要求76所述的解碼方法,其中所述視頻數(shù)據(jù)可被劃分成宏塊,對于宏塊支持可變塊大小,并且對于當(dāng)前宏塊中的任何塊,零次系數(shù)被計算為所述當(dāng)前宏塊的鄰居像素的均值和所述參考圖片中當(dāng)前的運動預(yù)測的或同位的塊的鄰居像素的均值之間的差值。
78.如權(quán)利要求77所述的解碼方法,其中,對于所述當(dāng)前宏塊中的任何塊,所述零次系數(shù)也可計算為所述當(dāng)前宏塊的鄰居像素的均值和所述參考圖片中的同位宏塊的鄰居像素的均值之間的差值。
79.如權(quán)利要求67所述的解碼方法,其中所述圖像數(shù)據(jù)可按塊劃分,并且所述解碼步驟包括以下步驟根據(jù)所述圖片中的一個塊的先前解碼和重構(gòu)的鄰居像素和參考圖片中經(jīng)濾波的相應(yīng)運動預(yù)測或同位像素來估計(358)所述圖片中的該塊的權(quán)重。
80.如權(quán)利要求79所述的解碼方法,其中所述重構(gòu)的鄰居像素可以是可用的上方像素、可用的左方像素、可用的左上方像素中的任何一種。
81.如權(quán)利要求79所述的解碼方法,其中所述重構(gòu)的鄰居像素可以是基于鄰居塊的運動信息而適應(yīng)性地選擇的可用的上方像素、左方像素、左上方像素中的任何一種。
82.如權(quán)利要求67所述的解碼方法,其中所述局部化加權(quán)函數(shù)被應(yīng)用到參考圖片中的經(jīng)濾波的運動預(yù)測塊上,并且運動補償是對加權(quán)預(yù)測經(jīng)濾波運動塊執(zhí)行的。
83.如權(quán)利要求67所述的解碼方法,還包括以下步驟利用頭部中的額外的信號指示是否使用所述解碼步驟而不是一個或多個現(xiàn)有解碼步驟,將所述解碼步驟與所述一個或多個現(xiàn)有解碼步驟相結(jié)合(464、466)。
84.如權(quán)利要求83所述的解碼方法,其中用信號告知被用于指示一組預(yù)測方法中的至少一種預(yù)測方法能夠使用所述解碼步驟。
85.如權(quán)利要求84所述的解碼方法,其中所述視頻數(shù)據(jù)可被劃分成圖像塊,并且所述一組預(yù)測方法中的預(yù)測方法之間的差異是基于針對當(dāng)前圖像塊的預(yù)測的數(shù)目的。
86.如權(quán)利要求67所述的解碼方法,其中用信號告知被用于指示一組預(yù)測方法中的至少一種預(yù)測方法能夠使用所述解碼步驟。
87.如權(quán)利要求67所述的解碼方法,其中所述視頻數(shù)據(jù)可被劃分成圖像塊,并且所述一組預(yù)測方法中的預(yù)測方法之間的差異是基于針對當(dāng)前圖像塊的預(yù)測的數(shù)目的。
88.如權(quán)利要求67所述的解碼方法,其中所述局部化加權(quán)函數(shù)僅被應(yīng)用到所述視頻數(shù)據(jù)的Y分量,或者被應(yīng)用到所述視頻數(shù)據(jù)的所有顏色分量。
全文摘要
本發(fā)明提供了用于圖片的視頻數(shù)據(jù)的視頻編碼器、視頻解碼器以及相應(yīng)的編碼和解碼方法,其中所述視頻數(shù)據(jù)具有局部亮度變化。所述視頻編碼器包括編碼器(200),該編碼器用于利用局部化的加權(quán)函數(shù)對所述視頻數(shù)據(jù)進行幀間編碼,以確定所述局部亮度變化的權(quán)重。所述局部化加權(quán)函數(shù)的權(quán)重是在不進行顯式編碼的情況下推導(dǎo)出的。
文檔編號H04N7/50GK101023673SQ200580031221
公開日2007年8月22日 申請日期2005年9月14日 優(yōu)先權(quán)日2004年9月16日
發(fā)明者尹鵬, 吉爾·麥克唐納·伯恩斯, 亞歷山德羅斯·圖阿皮斯 申請人:湯姆遜許可證公司