專利名稱:用于圖像編碼和解碼的裝置及方法、記錄介質(zhì)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像壓縮編碼,尤其涉及一種改善壓縮效率的圖像預(yù)測方法、以及一種用于使用所述圖像預(yù)測方法的圖像編碼和解碼的裝置及方法。
背景技術(shù):
在諸如移動圖像專家組(MPEG)-1、MPEG-2、MPEG-4 Visual、H.261、H.263和H.264標(biāo)準(zhǔn)之類的公知圖像壓縮標(biāo)準(zhǔn)中,一般將畫面劃分成用于圖像編碼的宏塊。在H.264編碼器的情況下,在以可以獲得的間預(yù)測(interprediction)和內(nèi)預(yù)測(intraprediction)編碼模式來編碼每個宏塊后,比較編碼宏塊所需要的比特率和在各種編碼模式中的速率失真(RD)成本。然后,按照比較結(jié)果來選擇適當(dāng)?shù)木幋a模式,并且以所選擇的編碼模式來編碼宏塊。
在內(nèi)預(yù)測中,不是參考基準(zhǔn)畫面,而是通過使用與要編碼的宏塊在空間上相鄰的像素的像素值來計(jì)算要編碼的宏塊的預(yù)測值,并且當(dāng)編碼當(dāng)前畫面的宏塊時編碼在所述預(yù)測值和所述像素值之間的差。
圖1圖解了按照現(xiàn)有技術(shù)的用于當(dāng)前塊a5的內(nèi)預(yù)測的在前宏塊的使用。
參見圖1,將在前宏塊a1、a2、a3、a4用于當(dāng)前宏塊a5的內(nèi)預(yù)測。按照光柵掃描方案,從左到右和從上到下掃描在畫面中包括的宏塊。因此,在當(dāng)前宏塊a5之前掃描和編碼在前宏塊a1、a2、a3、a4。
因?yàn)樵趫D1中由X標(biāo)記的宏塊來被編碼,所以它們不能用于當(dāng)前宏塊a5的預(yù)測編碼。在圖1中由O標(biāo)記的宏塊具有與當(dāng)前宏塊a5的低相關(guān)性。具有與當(dāng)前宏塊a5的低相關(guān)性的宏塊也不用于當(dāng)前宏塊a5的預(yù)測編碼。在使用離散余弦變換(DCT)的變換和量化后,逆量化在前宏塊a1、a2、a3、a4,并且采取逆DCT,然后重構(gòu)在前宏塊。
圖2是用于說明按照現(xiàn)有技術(shù)的、在H.264標(biāo)準(zhǔn)的內(nèi)4×4模式中使用的相鄰像素的參考圖。
參見圖2,小寫字母a-p指示要預(yù)測的4×4塊的像素,位于4×4塊的上面和左邊的大寫字母A-M指示已被編碼和重構(gòu)的4×4塊的內(nèi)預(yù)測所需的相鄰采樣或像素。
圖3是按照現(xiàn)有技術(shù)的在H.264標(biāo)準(zhǔn)中使用的內(nèi)4×4模式。
參見圖3,存在9種內(nèi)4×4模式,即垂直模式0、水平模式1、直流(DC)模式2、對角下左模式3、對角下右模式4、垂直右模式5、水平下模式6、垂直左模式7、水平上模式8。使用所述內(nèi)4×4模式,從相鄰宏塊的像素A-M預(yù)測在圖2中所示的像素a-p的像素值。壓縮效率按照為內(nèi)預(yù)測所選的編碼模式而變化。為了選擇最佳的編碼模式,在每個編碼模式中預(yù)測塊,使用預(yù)定的成本函數(shù)來對每個模式計(jì)算成本,并且選擇具有最小成本的編碼模式以用于編碼。
但是,仍然需要一種能夠改善壓縮效率以向用戶提供高質(zhì)量圖像的編碼方法。
發(fā)明內(nèi)容
按照本發(fā)明的一個方面,提供了一種圖像編碼方法,包括將輸入圖像劃分為至少兩個子平面;對于所劃分的至少兩個子平面執(zhí)行變換和量化;對于所變換和量化的子平面的至少一個執(zhí)行內(nèi)預(yù)測編碼;并且,通過將所述至少一個內(nèi)預(yù)測編碼的子平面用作基準(zhǔn)子平面來對于還沒有被內(nèi)預(yù)測編碼的至少一個剩余的變換和量化的子平面執(zhí)行間預(yù)測編碼。
可以通過將所述至少一個內(nèi)預(yù)測編碼的子平面的對應(yīng)塊用作基準(zhǔn)塊來對于還沒有被內(nèi)預(yù)測編碼的至少一個剩余的變換和量化的子平面的塊執(zhí)行間預(yù)測編碼。
可以通過獲得在所述基準(zhǔn)塊和所述塊之間的差來執(zhí)行間預(yù)測編碼。
可以僅僅對于所述塊的分量的一個模式執(zhí)行間預(yù)測編碼。
可以僅僅對于所述塊的低頻分量執(zhí)行間預(yù)測編碼。
所述預(yù)定塊可以是8×8塊,并且可以僅僅對于所述塊的4×4低頻分量執(zhí)行間預(yù)測編碼。
所述圖像編碼方法可以還包括確定所述輸入圖像的空間特性,其中,可以按照所確定的所述輸入圖像的空間特性來對于所述整個塊或所述塊的一部分執(zhí)行間預(yù)測編碼。
所述輸入圖像的劃分可以包括子采樣所述輸入圖像。
所述圖像編碼方法還可以包括產(chǎn)生模式信息,所述模式信息包括每個子平面的尺寸、子平面數(shù)量和關(guān)于預(yù)測的信息中的至少一種。
按照本發(fā)明的另一個方面,提供了一種圖像編碼器,其包括圖像劃分單元、變換和量化單元、內(nèi)預(yù)測編碼單元和間預(yù)測編碼單元。所述圖像劃分單元將輸入圖像劃分為至少兩個子平面。所述變換和量化單元對于所述至少兩個子平面執(zhí)行變換和量化。所述內(nèi)預(yù)測編碼單元對于所變換和量化的子平面的至少一個執(zhí)行內(nèi)預(yù)測編碼。所述間預(yù)測編碼單元通過將所述至少一個內(nèi)預(yù)測編碼的子平面用作基準(zhǔn)子平面來對于還沒有被內(nèi)預(yù)測編碼的至少一個剩余的變換和量化的子平面執(zhí)行間預(yù)測編碼。
按照本發(fā)明的另一個方面,提供了一種圖像解碼方法,包括接收編碼比特流;熵解碼所接收的比特流;對于在所述熵解碼的圖像數(shù)據(jù)中包括的至少一個內(nèi)預(yù)測編碼的子平面執(zhí)行內(nèi)預(yù)測解碼;通過將所述至少一個內(nèi)預(yù)測解碼的子平面用作基準(zhǔn)子平面來對于在所述熵編碼圖像數(shù)據(jù)中包括的至少一個剩余子平面執(zhí)行間預(yù)測解碼;并且,對于所述內(nèi)預(yù)測解碼和間預(yù)測解碼的子平面執(zhí)行逆量化和逆變換。
所述圖像解碼方法還可以包括通過重新布置內(nèi)預(yù)測解碼和間預(yù)測解碼的子平面來重構(gòu)所述輸入圖像。
可以通過將所述至少一個內(nèi)預(yù)測解碼的子平面的對應(yīng)塊用作基準(zhǔn)塊來對于所述至少一個剩余的子平面的塊執(zhí)行所述間預(yù)測解碼。
可以通過相加所述基準(zhǔn)塊的系數(shù)和所述塊的系數(shù)來執(zhí)行所述間預(yù)測解碼。
可以僅僅對于所述塊的分量的一個模式執(zhí)行所述間預(yù)測解碼。
可以僅僅對于所述塊的低頻分量執(zhí)行所述間預(yù)測解碼。
所述預(yù)定塊可以是8×8塊,可以僅僅對于所述塊的4×4低頻分量執(zhí)行所述間預(yù)測解碼。
所述圖像解碼方法還包括進(jìn)一步從比特流提取模式信息,其中,所述模式信息包括每個子平面的尺寸、子平面數(shù)量、關(guān)于內(nèi)預(yù)測的信息和關(guān)于間預(yù)測的信息中的至少一種。
按照本發(fā)明的另一個方面,提供了一種圖像解碼器,包括熵解碼單元、內(nèi)預(yù)測解碼單元、間預(yù)測解碼單元以及逆量化和逆變換單元。所述熵解碼單元接收編碼的比特流,并且對于所接收的比特流執(zhí)行熵解碼。所述內(nèi)預(yù)測解碼單元對于在所述熵解碼的圖像數(shù)據(jù)中包括的至少一個內(nèi)預(yù)測編碼的子平面執(zhí)行內(nèi)預(yù)測解碼。所述間預(yù)測解碼單元通過將所述至少一個內(nèi)預(yù)測解碼的子平面用作基準(zhǔn)子平面來對于在所述熵解碼的圖像數(shù)據(jù)中包括的至少一個剩余子平面執(zhí)行間預(yù)測解碼。所述逆量化和逆變換單元對于所述內(nèi)預(yù)測解碼和間預(yù)測解碼的子平面執(zhí)行逆量化和逆變換。
按照本發(fā)明的另一個方面,提供了一種計(jì)算機(jī)可讀記錄介質(zhì),其上記錄了用于執(zhí)行圖像編碼方法的程序,所述圖像編碼方法包括將輸入圖像劃分為至少兩個子平面;對于所劃分的至少兩個子平面執(zhí)行變換和量化;對于所變換和量化的子平面的至少一個執(zhí)行內(nèi)預(yù)測編碼;并且,通過將所述至少一個內(nèi)預(yù)測編碼的子平面用作基準(zhǔn)子平面來對于還沒有被內(nèi)預(yù)測編碼的至少一個剩余的變換和量化的子平面執(zhí)行間預(yù)測編碼。
按照本發(fā)明的另一個方面,提供了一種計(jì)算機(jī)可讀記錄介質(zhì),其上記錄了用于執(zhí)行圖像解碼方法的程序,所述圖像解碼方法包括接收編碼比特流;熵解碼所接收的比特流;對于在所述熵解碼的圖像數(shù)據(jù)中包括的至少一個內(nèi)預(yù)測編碼的子平面執(zhí)行內(nèi)預(yù)測解碼;通過將所述至少一個內(nèi)預(yù)測解碼的子平面用作基準(zhǔn)子平面來對于在所述熵編碼的圖像數(shù)據(jù)中包括的至少一個剩余子平面執(zhí)行間預(yù)測解碼;并且,對于所述內(nèi)預(yù)測解碼和間預(yù)測解碼的子平面執(zhí)行逆量化和逆變換。
通過參照附圖詳細(xì)說明本發(fā)明的例證實(shí)施例,本發(fā)明的上述和其他方面將會變得更加清楚,其中圖1圖解了按照現(xiàn)有技術(shù)的用于當(dāng)前宏塊的內(nèi)預(yù)測的在前宏塊;圖2是用于說明按照現(xiàn)有技術(shù)的在所述H.264標(biāo)準(zhǔn)的內(nèi)4×4模式中使用的相鄰像素的參考圖;圖3圖解了按照現(xiàn)有技術(shù)的在H.264標(biāo)準(zhǔn)中使用的內(nèi)4×4模式;圖4是按照本發(fā)明的一個例證實(shí)施例的圖像編碼器的方框圖;圖5A-5C是用于說明按照本發(fā)明的一個例證實(shí)施例的、被劃分的子平面類型的多個示例的視圖;圖6圖解了按照本發(fā)明的一個例證實(shí)施例的由一個畫面劃分的四個子平面;
圖7圖解了通過對于圖6的四個子平面的變換和量化而獲得的系數(shù);圖8A-8D是用于說明按照本發(fā)明的一個例證實(shí)施例的間預(yù)測方法的視圖;圖9是圖解通過圖4的圖像編碼器執(zhí)行的圖像編碼方法的流程圖;圖10A和10B圖解了被應(yīng)用到本發(fā)明的一個例證實(shí)施例的掃描方法的多個示例;圖11是按照本發(fā)明的一個例證實(shí)施例的圖像解碼器的方框圖;以及圖12是圖解通過圖11的圖像解碼器執(zhí)行的圖像解碼方法的流程圖。
具體實(shí)施例方式
圖4是按照本發(fā)明的一個例證實(shí)施例的圖像編碼器的方框圖。
參見圖4,所述圖像編碼器包括圖像劃分單元410、變換單元420、量化單元430、TQ系數(shù)預(yù)測單元440和熵編碼單元450。TQ系數(shù)預(yù)測單元440包括內(nèi)預(yù)測單元和間預(yù)測單元(未示出)。
以下,將參見圖5-8來說明按照本發(fā)明的一個例證實(shí)施例的圖像編碼方法。
圖像劃分單元410對特定大小的輸入圖像進(jìn)行子采樣,并且將所述畫面劃分成多個子平面??梢灶A(yù)先確定輸入圖像尺寸和子平面的數(shù)量。例如,當(dāng)所述輸入圖像為公共中間格式(CIF)時,它可以被劃分成如圖5A中所示的兩個176×288子平面、如圖5B中所示的四個176×144子平面或如圖5C中所示的兩個352×144子平面。畫面被子采樣,并且然后被劃分成多個子平面,但是本總的發(fā)明思想不限于此,可以劃分成任意尺寸的塊。
圖5A-5C是用于說明按照本發(fā)明的一個例證實(shí)施例的畫面可以被劃分為的子平面的類型的視圖。在圖5A中,水平地子采樣輸入圖像以獲得兩個子平面。在圖5B中,子采樣輸入圖像以獲得四個子平面。在圖5C中,垂直地子采樣輸入圖像以獲得兩個子平面。
圖6圖解了按照本發(fā)明的一個例證實(shí)施例的、由畫面劃分的四個子平面62、64、66和68??梢允褂迷趫D5B中所示的子平面劃分方法來獲得圖6的四個子平面。
圖7圖解了通過圖6的四個子平面62、64、66和68的變換和量化而獲得的系數(shù)。
返回圖4,變換單元420和量化單元430對于由圖像劃分單元410從畫面劃分的每個子平面執(zhí)行變換和量化。可以對于每個子平面的宏塊的每個8×8塊執(zhí)行變換和量化。因?yàn)樽儞Q單元420和量化單元430以與在MPEG-4或H.264編碼器中的那些相同的方式來工作,因此將不提供其詳細(xì)說明。
TQ系數(shù)預(yù)測單元440的內(nèi)預(yù)測單元(未示出)對于被變換和量化的所述子平面的至少一個、例如對于第一子平面執(zhí)行內(nèi)預(yù)測??梢允褂糜糜谠贛PEG-4編碼器中的內(nèi)預(yù)測的AC/DC預(yù)測或其它這樣的預(yù)測方法。對于量化的子平面的宏塊的每個8×8塊的變換和量化的系數(shù)(將被稱為TQ系數(shù))執(zhí)行內(nèi)預(yù)測。
所述內(nèi)預(yù)測單元根據(jù)特定標(biāo)準(zhǔn)來確定要內(nèi)預(yù)測的子平面,例如將在特定位置的子平面確定為要內(nèi)預(yù)測的子平面,或者對于所有子平面執(zhí)行內(nèi)預(yù)測并且將具有最小成本的子平面確定為用于剩余的子平面的間預(yù)測編碼的子平面??梢灶A(yù)先確定所述特定標(biāo)準(zhǔn),并且可以預(yù)先確定所述特定位置。
換句話說,在對于所有子平面執(zhí)行內(nèi)預(yù)測后,確定每個子平面的成本。比較所述多個子平面的成本,并且將具有最小成本的子平面確定為用于內(nèi)預(yù)測的子平面。
可以使用各種方法來計(jì)算成本。例如,可以使用諸如絕對差之和(SAD)成本函數(shù)、絕對變換差之和(SATD)成本函數(shù)、方差之和(SSD)函數(shù)、平均絕對差(MAD)成本函數(shù)、拉格朗日(Lagrange)成本函數(shù)之類的成本函數(shù),或可以使用在本領(lǐng)域公知的其它類似函數(shù)。SAD是諸如4×4塊之類的塊的預(yù)測余項(xiàng)的絕對值之和。SATD是通過向4×4塊的預(yù)測余項(xiàng)應(yīng)用哈達(dá)馬(Hadamard)變換而獲得的系數(shù)的絕對值之和。SSD是4×4塊預(yù)測采樣的平方預(yù)測余項(xiàng)之和。MAD是4×4塊預(yù)測采樣的預(yù)測余項(xiàng)的絕對值的平均值。所述Lagrange成本函數(shù)是使用比特流長度信息的改進(jìn)成本函數(shù)。
雖然在本發(fā)明的例證實(shí)施例中使用多個子平面之一來執(zhí)行內(nèi)預(yù)測編碼,但是可以內(nèi)預(yù)測編碼多個子平面。例如,可以首先內(nèi)預(yù)測編碼在四個子平面中的至少一個子平面,例如兩個子平面,并且可以在其后間預(yù)測其它兩個子平面以改善壓縮效率。
接著,TQ系數(shù)預(yù)測單元440的間預(yù)測單元(未示出)對于未被內(nèi)預(yù)測的子平面執(zhí)行間預(yù)測。在本發(fā)明的一個例證實(shí)施例中,使用被內(nèi)預(yù)測的第一子平面作為基準(zhǔn)子平面來執(zhí)行間預(yù)測??梢酝ㄟ^使用除被內(nèi)預(yù)測的第一子平面之外的、先前被間預(yù)測的子平面來作為基準(zhǔn)子平面而執(zhí)行間預(yù)測。
通過獲得在要進(jìn)行間預(yù)測的子平面的塊的TQ系數(shù)和基準(zhǔn)子平面的對應(yīng)塊的TQ系數(shù)(即基準(zhǔn)塊的TQ系數(shù))之間的差來執(zhí)行間預(yù)測。可以預(yù)先確定所述塊。當(dāng)以8×8塊為單位來執(zhí)行間預(yù)測時,可以使用在圖8A-8D中所示的間預(yù)測方法。
因此,在按照本發(fā)明的一個例證實(shí)施例的所述圖像編碼方法中,在空間域中子采樣輸入圖像以產(chǎn)生多個子平面,并且在頻率域中內(nèi)預(yù)測或間預(yù)測每個子平面的TQ系數(shù),由此改善壓縮效率。
圖8A-8D是用于說明按照本發(fā)明的一個例證實(shí)施例的間預(yù)測方法的視圖。
在圖8A中,僅僅基準(zhǔn)塊的4×4低頻分量被用于間預(yù)測。在圖8B中,基準(zhǔn)塊的所有頻率分量被用于間預(yù)測。在圖8C和8D中,僅僅基準(zhǔn)塊的分量的特定模式被用于間預(yù)測??梢灶A(yù)先確定所述特定模式。除了在圖8C和8D中圖解的模式之外,也可以使用基于圖像的空間特性的其它模式。
在圖8A的間預(yù)測方法中,當(dāng)由于圖像劃分或邊緣而導(dǎo)致在高頻分量之間的差時,對高頻分量的間預(yù)測無助于改善壓縮效率。因此,僅僅對低頻分量執(zhí)行間預(yù)測。在這種情況下,對于要進(jìn)行間預(yù)測的當(dāng)前塊的4×4低頻分量執(zhí)行間預(yù)測,即輸出在當(dāng)前塊的4×4低頻分量和基準(zhǔn)塊的對應(yīng)4×4低頻分量之間的差,并且輸出原始系數(shù)以用于剩余的高頻分量。
可以按照圖像的空間特性來自適應(yīng)地使用圖8C和8D的間預(yù)測方法。輸入圖像的空間特性可以包括輸入圖像的方向性、關(guān)于是否在輸入圖像中包括邊緣的信息和邊緣的方向性。
在間預(yù)測期間,可以以宏塊為單位使用圖8A-8D的間預(yù)測方法之一。作為替代方式,可以按照系列的特性或圖像的空間圖像以所述系列或圖像為單位使用所述間預(yù)測方法之一。
熵編碼單元450對于從TQ系數(shù)預(yù)測單元440獲得的被內(nèi)預(yù)測和間預(yù)測的數(shù)據(jù)執(zhí)行熵編碼,并且產(chǎn)生要發(fā)送的比特流。
例如,當(dāng)輸入圖像是畫面時,在完成對每個子平面的所有宏塊的編碼時,對于每個子平面布置數(shù)據(jù),并且插入首標(biāo)。另外,對于每個畫面布置子平面,并且插入畫面首標(biāo)。比特流可以包括N個宏塊的數(shù)據(jù)。
模式信息可以被插入到每個畫面或每個宏塊中,所述模式信息包括子平面尺寸、子平面數(shù)量、子平面類型、劃分方法、關(guān)于內(nèi)預(yù)測或間預(yù)測的信息或其它這樣的模式信息。
圖9是圖解由圖4的圖像編碼器執(zhí)行的圖像編碼方法的流程圖。
在步驟910,輸入圖像被劃分成至少一個子平面。
在步驟920,對于子平面執(zhí)行變換和量化。在本發(fā)明的一個例證實(shí)施例中,對于每個子平面的宏塊的每個8×8塊執(zhí)行變換和量化??梢詫τ诳梢灶A(yù)先確定的特定尺寸的每個宏塊或每個塊執(zhí)行變換和量化。
在步驟930,對于所變換和量化的子平面的至少一個執(zhí)行內(nèi)預(yù)測。在本發(fā)明的一個例證實(shí)施例中,對于在量化的子平面中包括的宏塊的每個8×8塊的TQ系數(shù)執(zhí)行內(nèi)預(yù)測。但是,考慮也可以對于宏塊的8×8塊的子集的TQ系數(shù)執(zhí)行內(nèi)預(yù)測。
在步驟940,通過使用內(nèi)預(yù)測的子平面作為基準(zhǔn)子平面來對于剩余的變換和量化的子平面執(zhí)行間預(yù)測。所述間預(yù)測包含獲得在當(dāng)前塊和基準(zhǔn)塊之間的差。在本發(fā)明的一個例證實(shí)施例中,對于在量化的子平面中包括的宏塊的每個8×8塊執(zhí)行間預(yù)測。但是,考慮也以對于宏塊的8×8塊的子集的TQ系數(shù)執(zhí)行間預(yù)測??梢栽陂g預(yù)測中使用在圖8A-8D中圖解的模式之一。
除了內(nèi)預(yù)測的子平面之外,還可以使用在前的間預(yù)測的子平面作為基準(zhǔn)子平面來執(zhí)行間預(yù)測。另外,可以對于要間預(yù)測的當(dāng)前塊的特定部分(例如低頻分量)或分量的特定模式執(zhí)行間預(yù)測。所述特定部分和所述特定模式都可以預(yù)先確定。換句話說,當(dāng)要進(jìn)行間預(yù)測的當(dāng)前塊是8×8塊時,可以僅僅對于4×4低頻分量執(zhí)行間預(yù)測。
在步驟950,對于在步驟930內(nèi)預(yù)測的數(shù)據(jù)和在步驟940間預(yù)測的數(shù)據(jù)執(zhí)行熵編碼,并且,產(chǎn)生要發(fā)送的編碼的比特流。所述熵編碼可以被省略。
當(dāng)內(nèi)預(yù)測編碼的子平面被用作用于間預(yù)測的基準(zhǔn)子平面時,也以將在前的間預(yù)測編碼的子平面用作基準(zhǔn)子平面。
另外,可以產(chǎn)生關(guān)于在步驟920-940中執(zhí)行的子平面劃分、內(nèi)預(yù)測和間預(yù)測的模式信息,并且所產(chǎn)生的模式信息在熵編碼期間可以被插入比特流中。關(guān)于所述子平面劃分的信息可以是關(guān)于子平面類型、劃分方法、子平面尺寸、子平面數(shù)量的信息或其他這樣的信息。
圖10A和10B圖解了應(yīng)用于本發(fā)明的一個例證實(shí)施例的掃描方法的多個示例。
圖10A圖解了垂直采樣掃描方法,圖10B圖解了水平采樣掃描方法。在本發(fā)明的一個例證實(shí)施例中,將輸入圖像劃分為基于輸入圖像的特性的特定類型的子平面,并且選擇掃描方法來掃描通過對于子平面執(zhí)行內(nèi)預(yù)測而獲得的圖像數(shù)據(jù)??梢灶A(yù)先確定所述特定類型,并且可以預(yù)先確定所述掃描方法。換句話說,按照由輸入圖像劃分的子平面的類型來自適應(yīng)地使用掃描方法。當(dāng)輸入圖像的每個畫面被劃分成子平面時,可以向每個畫面中插入關(guān)于所選擇的掃描方法的信息。
圖11是按照本發(fā)明的一個例證實(shí)施例的圖像解碼器的方框圖。
參見圖11,所述圖像解碼器包括熵解碼單元1110、TQ系數(shù)預(yù)測單元1120、逆量化單元1130、逆變換單元1140和圖像重構(gòu)單元1150。逆量化單元1130和逆變換單元1140以與在傳統(tǒng)圖像解碼器——例如H.264解碼器——中的那些相同的方式來工作,將不提供其詳細(xì)說明。TQ系數(shù)預(yù)測單元1120包括內(nèi)預(yù)測單元和間預(yù)測單元(未示出)。所述圖像解碼器還可以包括子平面重構(gòu)單元(未示出)。
熵解碼單元1110接收編碼比特流,對于所接收的比特流執(zhí)行熵解碼以提取圖像數(shù)據(jù),并且向TQ系數(shù)預(yù)測單元1120發(fā)送所提取的圖像數(shù)據(jù)。熵解碼單元1110也可以從所接收的比特流提取模式信息,并且向TQ系數(shù)預(yù)測單元1120發(fā)送所提取的模式信息。所述模式信息是關(guān)于子平面劃分、內(nèi)預(yù)測和間預(yù)測的信息,并且可以在熵編碼期間被插入到比特流中。關(guān)于子平面劃分的信息是關(guān)于子平面類型、劃分方法、子平面尺寸、子平面數(shù)量的信息或其它這樣的信息。所述模式信息也可以包括關(guān)于掃描方法的信息。
所接收的比特流包括通過下述方式而獲得的圖像數(shù)據(jù)通過對于從輸入圖像劃分的多個子平面執(zhí)行變換和量化,對于所述子平面的至少一個執(zhí)行內(nèi)預(yù)測編碼,并且根據(jù)內(nèi)預(yù)測編碼的子平面來對于所剩余的子平面的至少一個執(zhí)行間預(yù)測編碼。
TQ系數(shù)預(yù)測單元1120的內(nèi)預(yù)測單元(未示出)對于在所提取的圖像數(shù)據(jù)中包括的子平面中的至少一個內(nèi)預(yù)測編碼的子平面執(zhí)行內(nèi)預(yù)測解碼。TQ系數(shù)預(yù)測單元1120可以根據(jù)從所接收的比特流提取的模式信息來重構(gòu)子平面,在這種情況下,所述內(nèi)預(yù)測單元根據(jù)所提取的模式信息對于所述重構(gòu)的子平面的至少一個執(zhí)行內(nèi)預(yù)測解碼。在本發(fā)明的一個例證實(shí)施例中,對于在子平面中包括的宏塊的每個8×8塊的TQ系數(shù)執(zhí)行內(nèi)預(yù)測解碼。
TQ系數(shù)預(yù)測單元的間預(yù)測單元(未示出)通過參考內(nèi)預(yù)測的解碼子平面來執(zhí)行間預(yù)測解碼。通過使用所述內(nèi)預(yù)測解碼的子平面作為基準(zhǔn)塊來對于子平面的塊執(zhí)行間預(yù)測解碼。可以預(yù)先確定所述塊。通過相加基準(zhǔn)塊的系數(shù)和所述塊的系數(shù)來執(zhí)行間預(yù)測解碼。在本發(fā)明的一個例證實(shí)施例中,對于在子平面中包括的宏塊的每個8×8塊執(zhí)行間預(yù)測??梢允褂迷谇暗拈g預(yù)測解碼的子平面作為基準(zhǔn)子平面來執(zhí)行間預(yù)測解碼。
可以按照從所接收的比特流提取的、即對應(yīng)于在圖8A-8D中所示的間預(yù)測編碼的模式信息來自適應(yīng)地執(zhí)行間預(yù)測解碼。換句話說,可以僅僅對于要進(jìn)行間預(yù)測解碼的特定尺寸的當(dāng)前塊的一部分執(zhí)行間預(yù)測解碼,要進(jìn)行間預(yù)測解碼的特定尺寸的當(dāng)前塊的一部分例如8×8塊的4×4低頻分量、整個8×8塊或在圖8C或8D中圖解的分量的一個模式。所述特定尺寸和所述模式都可以預(yù)先確定。
逆量化單元1130和逆變換單元1140對于每個內(nèi)預(yù)測編碼和間預(yù)測解碼的子平面執(zhí)行逆量化和逆變換。在本發(fā)明的當(dāng)前實(shí)施例中,對于在每個子平面中包括的宏塊的每個預(yù)定尺寸的塊、例如對于每個8×8塊執(zhí)行逆變換和量化。逆量化單元1130和逆變換單元1140以與在傳統(tǒng)圖像解碼器——例如MPEG-4或H.264解碼器——中的那些相同的方式來工作,將不提供其詳細(xì)說明。
圖像重構(gòu)單元1150通過重新布置逆量化和逆變換的子平面來重構(gòu)原始圖像。換句話說,從在圖6中圖解的四個子平面來重構(gòu)原始輸入圖像。為此,可以使用關(guān)于在從所接收的比特流提取的模式信息中包括的子平面劃分方法的信息。
所述模式信息包括用于解碼的所有信息,但是可以只發(fā)送指定模式表的索引,所述模式表包括關(guān)于由圖像編碼器和圖像解碼器共享的所有模式的信息。
圖12是圖解由圖11的圖像解碼器執(zhí)行的圖像解碼方法的流程圖。
參見圖12,在步驟1210,編碼的比特流被接收并且被熵解碼以提取在比特流中包括的圖像數(shù)據(jù)。在本發(fā)明的一個例證實(shí)施例中,所述編碼的比特流包括通過下述方式而獲得的圖像數(shù)據(jù)通過對于由輸入圖像劃分的多個子平面執(zhí)行變換和量化,對于所述子平面的至少一個執(zhí)行內(nèi)預(yù)測編碼,以及根據(jù)所述內(nèi)預(yù)測編碼的子平面來對剩余的子平面的至少一個執(zhí)行間預(yù)測編碼??梢詮乃崛〉膱D像數(shù)據(jù)重構(gòu)所述子平面。當(dāng)不對編碼的比特流執(zhí)行熵編碼時,可以省略熵解碼。
編碼的比特流還包括用于解碼的模式信息,并且從比特流提取所述模式信息。所述模式信息包括關(guān)于子平面劃分、內(nèi)預(yù)測和間預(yù)測的信息,所述關(guān)于子平面劃分的信息是關(guān)于子平面類型、劃分方法、子平面尺寸、子平面數(shù)量的信息或其他這樣的信息,所述模式信息可以還包括關(guān)于掃描方法的信息。
在步驟1220,對于在所提取的圖像數(shù)據(jù)中包括的子平面中的內(nèi)預(yù)測編碼的子平面執(zhí)行內(nèi)預(yù)測解碼。在本發(fā)明的一個例證實(shí)施例中,對于在子平面中包括的宏塊的每個8×8塊的TQ系數(shù)執(zhí)行內(nèi)預(yù)測。
在步驟1230,通過參考所述內(nèi)預(yù)測解碼子平面來對于剩余的子平面的至少一個執(zhí)行間預(yù)測解碼。通過使用所述內(nèi)預(yù)測解碼的子平面的對應(yīng)塊作為基準(zhǔn)塊來對子平面的塊執(zhí)行間預(yù)測解碼。可以預(yù)先確定所述塊。在本發(fā)明的一個例證實(shí)施例中,對于在子平面中包括的宏塊的每個8×8塊執(zhí)行間預(yù)測解碼,并且通過相加基準(zhǔn)塊的系數(shù)和所述塊的系數(shù)來執(zhí)行所述間預(yù)測解碼??梢允褂迷谇暗拈g預(yù)測解碼的子平面作為基準(zhǔn)子平面來執(zhí)行間預(yù)測解碼。
在步驟1240,對于解碼的子平面執(zhí)行逆量化和逆變換。在本發(fā)明的一個例證實(shí)施例中,對于在子平面中包括的宏塊的每個尺寸的塊——例如每個8×8塊——執(zhí)行逆量化和逆變換??梢灶A(yù)先確定所述塊的尺寸。
在步驟1250,通過重新布置所述逆量化和逆變換的子平面來重構(gòu)原始圖像,例如畫面。
如上所述,按照本發(fā)明的多個例證實(shí)施例,將要內(nèi)預(yù)測編碼的圖像劃分成具有類似特性的多個子平面,并且在通過對于子平面執(zhí)行變換和量化而獲得的TQ系數(shù)之間執(zhí)行預(yù)測,由此改善圖像壓縮效率。
另外,通過按照輸入圖像的空間特性而自適應(yīng)地選擇多個間預(yù)測編碼方法之一來執(zhí)行間預(yù)測,由此改善圖像壓縮效率。
而且,通過按照輸入圖像的空間特性來自適應(yīng)地選擇多個掃描方法之一而執(zhí)行用于編碼和解碼的掃描,由此改善圖像壓縮效率。
注意,本總的發(fā)明思想也可以被體現(xiàn)為在計(jì)算機(jī)可讀記錄介質(zhì)上的計(jì)算機(jī)可讀代碼。所述計(jì)算機(jī)可讀記錄介質(zhì)是可以存儲數(shù)據(jù)的任何數(shù)據(jù)存儲器件,所述數(shù)據(jù)可以隨后被計(jì)算機(jī)系統(tǒng)讀取。所述計(jì)算機(jī)可讀記錄介質(zhì)的示例包括只讀存儲器(ROM)、隨機(jī)存取存儲器(RAM)、CD-ROM、磁帶、軟盤、光數(shù)據(jù)存儲器件和載波(例如通過因特網(wǎng)的傳輸)。所述計(jì)算機(jī)可讀記錄介質(zhì)也可以被分布在網(wǎng)絡(luò)耦接的計(jì)算機(jī)系統(tǒng)上,以便以分布的方式來存儲和執(zhí)行所述計(jì)算機(jī)可讀代碼。
雖然已經(jīng)參照本發(fā)明的例證實(shí)施例具體示出和說明了本發(fā)明,但是本領(lǐng)域的技術(shù)人員將明白,在不脫離所附的權(quán)利要求所限定的本發(fā)明的精神和范圍的情況下,可以進(jìn)行形式和細(xì)節(jié)上的各種改變。
本申請要求2005年9月9日在韓國專利局提交的韓國專利申請第10-2005-0084240號的優(yōu)先權(quán),在此將其公開內(nèi)容通過引用整體引入。
權(quán)利要求
1.一種圖像編碼方法,包括將輸入圖像劃分為至少兩個子平面;對于所劃分的至少兩個子平面執(zhí)行變換和量化;對于所變換和量化的子平面的至少一個執(zhí)行內(nèi)預(yù)測編碼;以及通過使用所述至少一個內(nèi)預(yù)測編碼的子平面作為基準(zhǔn)子平面來對于還沒有被內(nèi)預(yù)測編碼的至少一個剩余的變換和量化的子平面執(zhí)行間預(yù)測編碼。
2.按照權(quán)利要求1的圖像編碼方法,其中,通過使用所述至少一個內(nèi)預(yù)測編碼的子平面的對應(yīng)塊作為基準(zhǔn)塊來對于還沒有被內(nèi)預(yù)測編碼的至少一個剩余的變換和量化的子平面的塊執(zhí)行間預(yù)測編碼。
3.按照權(quán)利要求2的圖像編碼方法,其中,通過獲得在所述基準(zhǔn)塊和所述塊之間的差來執(zhí)行間預(yù)測編碼。
4.按照權(quán)利要求2的圖像編碼方法,其中,僅僅對于所述塊的分量的一個模式執(zhí)行間預(yù)測編碼。
5.按照權(quán)利要求2的圖像編碼方法,其中,僅僅對于所述塊的低頻分量執(zhí)行間預(yù)測編碼。
6.按照權(quán)利要求2的圖像編碼方法,其中,所述塊是8×8塊,并且僅僅對于所述塊的4×4低頻分量執(zhí)行間預(yù)測編碼。
7.按照權(quán)利要求2的圖像編碼方法,還包括確定所述輸入圖像的空間特性,其中,按照所確定的所述輸入圖像的空間特性來對于所述整個塊或所述塊的一部分執(zhí)行間預(yù)測編碼。
8.按照權(quán)利要求1的圖像編碼方法,其中,所述輸入圖像的劃分包括子采樣所述輸入圖像。
9.按照權(quán)利要求1的圖像編碼方法,還包括產(chǎn)生模式信息,所述模式信息包括每個子平面的尺寸、子平面數(shù)量和關(guān)于預(yù)測的信息中的至少一種。
10.一種圖像編碼器,包括圖像劃分單元,用于將輸入圖像劃分為至少兩個子平面;變換和量化單元,用于對于所述至少兩個子平面執(zhí)行變換和量化;內(nèi)預(yù)測編碼單元,用于對于所變換和量化的子平面的至少一個執(zhí)行內(nèi)預(yù)測編碼;以及間預(yù)測編碼單元,用于通過使用所述至少一個內(nèi)預(yù)測編碼的子平面作為基準(zhǔn)子平面來對于還沒有被內(nèi)預(yù)測編碼的至少一個剩余的變換和量化的子平面執(zhí)行間預(yù)測編碼。
11.按照權(quán)利要求10的圖像編碼器,其中,所述間預(yù)測編碼單元通過使用所述至少一個內(nèi)預(yù)測編碼的子平面的對應(yīng)塊作為基準(zhǔn)塊來對于至少一個剩余的變換和量化的子平面的塊執(zhí)行間預(yù)測編碼。
12.按照權(quán)利要求11的圖像編碼器,其中,所述間預(yù)測編碼單元通過獲得在所述基準(zhǔn)塊和所述塊之間的差來執(zhí)行間預(yù)測編碼。
13.按照權(quán)利要求11的圖像編碼器,其中,所述間預(yù)測編碼單元僅僅對于所述塊的分量的一個模式執(zhí)行間預(yù)測編碼。
14.按照權(quán)利要求11的圖像編碼器,其中,所述間預(yù)測編碼單元僅僅對于所述塊的低頻分量執(zhí)行間預(yù)測編碼。
15.一種圖像解碼方法,包括接收編碼比特流;對所接收的比特流進(jìn)行熵解碼;對于在被熵解碼的圖像數(shù)據(jù)中包括的至少一個內(nèi)預(yù)測編碼的子平面執(zhí)行內(nèi)預(yù)測解碼;通過將所述至少一個內(nèi)預(yù)測解碼的子平面用作基準(zhǔn)子平面來對于在所述被熵編碼的圖像數(shù)據(jù)中包括的至少一個剩余子平面執(zhí)行間預(yù)測解碼;以及對于所述內(nèi)預(yù)測解碼和間預(yù)測解碼的子平面執(zhí)行逆量化和逆變換。
16.按照權(quán)利要求15的圖像解碼方法,還包括通過重新布置內(nèi)預(yù)測解碼和間預(yù)測解碼的子平面來重構(gòu)輸入圖像。
17.按照權(quán)利要求15的圖像解碼方法,其中,通過將所述至少一個內(nèi)預(yù)測解碼的子平面的對應(yīng)塊用作基準(zhǔn)塊來對于至少一個剩余的子平面的塊執(zhí)行間預(yù)測解碼。
18.按照權(quán)利要求17的圖像解碼方法,其中,通過相加所述基準(zhǔn)塊的系數(shù)和所述塊的系數(shù)來執(zhí)行所述間預(yù)測解碼。
19.按照權(quán)利要求17的圖像解碼方法,其中,僅僅對于所述塊的分量的一個模式執(zhí)行所述間預(yù)測解碼。
20.按照權(quán)利要求17的圖像解碼方法,其中,僅僅對于所述塊的低頻分量執(zhí)行所述間預(yù)測解碼。
21.按照權(quán)利要求17的圖像解碼方法,其中,所述塊是8×8塊,僅僅對于所述塊的4×4低頻分量執(zhí)行所述間預(yù)測解碼。
22.按照權(quán)利要求15的圖像解碼方法,還包括從所述比特流提取模式信息,其中,所述模式信息包括每個子平面的尺寸、子平面數(shù)量、關(guān)于內(nèi)預(yù)測的信息和關(guān)于間預(yù)測的信息中的至少一種。
23.一種圖像解碼器,包括熵解碼單元,用于接收編碼的比特流,并且對于所接收的比特流執(zhí)行熵解碼;內(nèi)預(yù)測解碼單元,用于對于在所述被熵解碼的圖像數(shù)據(jù)中包括的至少一個內(nèi)預(yù)測編碼的子平面執(zhí)行內(nèi)預(yù)測解碼;間預(yù)測解碼單元,用于通過將所述至少一個內(nèi)預(yù)測解碼的子平面用作基準(zhǔn)子平面來對于在所述被熵解碼的圖像數(shù)據(jù)中包括的至少一個剩余子平面執(zhí)行間預(yù)測解碼;以及逆量化和逆變換單元,用于對于所述內(nèi)預(yù)測解碼和間預(yù)測解碼的子平面執(zhí)行逆量化和逆變換。
24.按照權(quán)利要求23的圖像解碼器,還包括圖像重構(gòu)單元,用于通過重新布置內(nèi)預(yù)測解碼和間預(yù)測解碼的子平面來重構(gòu)所述輸入圖像。
25.按照權(quán)利要求23的圖像解碼器,其中,所述間預(yù)測解碼單元通過將所述至少一個內(nèi)預(yù)測解碼的子平面的對應(yīng)塊用作基準(zhǔn)塊來對于至少一個剩余的子平面的塊執(zhí)行間預(yù)測解碼。
26.按照權(quán)利要求25的圖像解碼器,其中,所述間預(yù)測解碼單元通過相加所述基準(zhǔn)塊的系數(shù)和所述塊的系數(shù)來執(zhí)行所述間預(yù)測解碼。
27.按照權(quán)利要求25的圖像解碼器,其中,所述間預(yù)測解碼單元僅僅對于所述塊的分量的一個模式執(zhí)行所述間預(yù)測解碼。
28.按照權(quán)利要求25的圖像解碼器,其中,所述間預(yù)測解碼單元僅僅對于所述塊的低頻分量執(zhí)行間預(yù)測解碼。
29.一種計(jì)算機(jī)可讀記錄介質(zhì),其上記錄了用于執(zhí)行圖像編碼方法的程序,所述圖像編碼方法包括將輸入圖像劃分為至少兩個子平面;對于所劃分的至少兩個子平面執(zhí)行變換和量化;對于所變換和量化的子平面的至少一個執(zhí)行內(nèi)預(yù)測編碼;以及通過將所述至少一個內(nèi)預(yù)測編碼的子平面用作基準(zhǔn)子平面來對于還沒有被內(nèi)預(yù)測編碼的至少一個剩余的變換和量化的子平面執(zhí)行間預(yù)測編碼。
30.一種計(jì)算機(jī)可讀記錄介質(zhì),其上記錄了用于執(zhí)行圖像解碼方法的程序,所述圖像解碼方法包括接收編碼比特流;對所接收的比特流進(jìn)行熵解碼;對于在所述被熵解碼的圖像數(shù)據(jù)中包括的至少一個內(nèi)預(yù)測編碼的子平面執(zhí)行內(nèi)預(yù)測解碼;通過將所述至少一個內(nèi)預(yù)測解碼的子平面用作基準(zhǔn)子平面來對于在所述被熵編碼的圖像數(shù)據(jù)中包括的至少一個剩余子平面執(zhí)行間預(yù)測解碼;以及對于所述內(nèi)預(yù)測解碼和間預(yù)測解碼的子平面執(zhí)行逆量化和逆變換。
全文摘要
本發(fā)明提供一種內(nèi)預(yù)測編碼和解碼裝置及方法、以及記錄用于執(zhí)行所述方法的程序的記錄介質(zhì)。所述圖像編碼方法包括將輸入圖像劃分成至少兩個子平面;對所述子平面執(zhí)行變換和量化;對所變換和量化的子平面的至少一個執(zhí)行內(nèi)預(yù)測編碼;通過將所述至少一個內(nèi)預(yù)測編碼的子平面用作基準(zhǔn)子平面來對還未被內(nèi)預(yù)測編碼的至少一個剩余的變換和量化的子平面執(zhí)行間預(yù)測編碼。所述解碼方法包括接收編碼比特流;熵解碼所接收的比特流;對在所述熵解碼的圖像數(shù)據(jù)中包括的至少一個內(nèi)預(yù)測編碼的子平面執(zhí)行內(nèi)預(yù)測解碼;通過將所述內(nèi)預(yù)測解碼的子平面用作基準(zhǔn)子平面來對在所述熵編碼圖像數(shù)據(jù)中包括的至少一個剩余子平面執(zhí)行間預(yù)測解碼;對所解碼的子平面執(zhí)行逆量化和逆變換。
文檔編號H04N7/32GK1929613SQ20061015153
公開日2007年3月14日 申請日期2006年9月11日 優(yōu)先權(quán)日2005年9月9日
發(fā)明者金昭營, 樸正燻, 李相來, 孫有美 申請人:三星電子株式會社