用于視頻的算術(shù)編碼的方法和裝置以及用于視頻的算術(shù)解碼的方法和裝置制造方法
【專利摘要】用于對視頻數(shù)據(jù)進行算術(shù)編碼/解碼的方法和設(shè)備。所述算術(shù)解碼方法包括:通過使用上下文模型對表示塊中的最后有效系數(shù)的二維位置的前綴比特串順序地進行算術(shù)解碼,按照旁路模式對后綴比特串進行算術(shù)解碼,并對被算術(shù)解碼的前綴比特串和后綴比特串執(zhí)行逆二進制化以獲得塊中的最后有效系數(shù)的位置。
【專利說明】用于視頻的算術(shù)編碼的方法和裝置以及用于視頻的算術(shù)解碼的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及視頻的編碼和解碼,更具體地,涉及一種用于對變換系數(shù)信息進行熵編碼和解碼的方法和設(shè)備。
【背景技術(shù)】
[0002]在圖像壓縮方法(諸如,運動圖像專家組(MPEG)-1、MPEG-2和MPEG-4H.264/MPEG-4AVC(先進視頻編碼))中,圖像被劃分為均具有預(yù)定尺寸的塊,并通過使用幀間預(yù)測或幀內(nèi)預(yù)測處理來獲得每個塊的殘差數(shù)據(jù)。通過諸如變換、量化、掃描、游程編碼和熵編碼的處理來對殘差數(shù)據(jù)進行壓縮。在熵編碼操作期間,對語法元素(例如關(guān)于例如變換系數(shù)或預(yù)測模式的信息)進行熵編碼,并輸出比特流。解碼器對比特流進行解析以提取語法元素,并基于提取的語法元素來恢復(fù)圖像。
【發(fā)明內(nèi)容】
[0003]技術(shù)問題
[0004]本發(fā)明提供了一種通過將上下文自適應(yīng)二進制算術(shù)編碼(CABAC)方法和旁路算術(shù)編碼方法進行組合來對變換系數(shù)的符號進行算術(shù)編碼和解碼的方法和設(shè)備,其中,CABAC方法在具有高壓縮性能的同時具有高計算復(fù)雜度,旁路算術(shù)編碼方法在顯示更小的壓縮吞吐量的同時具有比CABAC方法更低的計算復(fù)雜度。
[0005]技術(shù)方案
[0006]根據(jù)本發(fā)明,基于預(yù)定的臨界值將關(guān)于最后有效系數(shù)的位置的符號分類為前綴和后綴,并且對分類為前綴的比特串和分類為后綴的比特串獨立地進行算術(shù)編碼。
[0007]有益效果
[0008]根據(jù)本發(fā)明的實施例,可通過應(yīng)用在具有高壓縮性能的同時具有高計算復(fù)雜度的CABAC方法以及在顯示更小的壓縮吞吐量的同時具有比CABAC方法更低的計算復(fù)雜度的旁路算術(shù)編碼方法,通過計算復(fù)雜度與處理速度之間的平衡來提高算術(shù)編碼和解碼的處理速度和壓縮性能。
【專利附圖】
【附圖說明】
[0009]圖1是根據(jù)本發(fā)明實施例的視頻編碼設(shè)備的框圖;
[0010]圖2是圖1中示出的語法元素編碼單元的框圖;
[0011]圖3是示出根據(jù)本發(fā)明實施例的對每個塊中的變換系數(shù)信息進行算術(shù)編碼和解碼的處理的流程圖;
[0012]圖4是示出根據(jù)本發(fā)明實施例的為了對與變換系數(shù)有關(guān)的語法元素執(zhí)行算術(shù)編碼而通過對塊進行劃分所獲得的子集的示圖;
[0013]圖5是示出根據(jù)本發(fā)明實施例的通過將位置分類為前綴比特串和后綴比特串來對最后有效系數(shù)的位置進行算術(shù)編碼的處理的參考示圖;
[0014]圖6是示出根據(jù)本發(fā)明實施例的對最后有效系數(shù)的位置信息進行算術(shù)編碼的處理的示圖;
[0015]圖7是示出在圖2中示出的常規(guī)編碼單元上執(zhí)行的使用上下文模型的算術(shù)編碼處理的示圖;
[0016]圖8是示出根據(jù)本發(fā)明實施例的用于對視頻進行編碼的算術(shù)編碼方法的流程圖;
[0017]圖9a是示出根據(jù)本發(fā)明實施例的視頻編碼設(shè)備的框圖;
[0018]圖9b是示出包括在圖9a的語法元素解碼單元中的算術(shù)解碼設(shè)備的框圖;
[0019]圖10是示出根據(jù)本發(fā)明實施例的用于對視頻進行解碼的算術(shù)解碼方法的流程圖;
[0020]圖11是根據(jù)本發(fā)明實施例的視頻編碼設(shè)備的框圖;
[0021]圖12是根據(jù)本發(fā)明實施例的視頻解碼設(shè)備的框圖;
[0022]圖13是示出根據(jù)本發(fā)明實施例的編碼單元的概念的示圖;
[0023]圖14是根據(jù)本發(fā)明實施例的基于分層編碼單元的視頻編碼設(shè)備的框圖;
[0024]圖15是根據(jù)本發(fā)明實施例的基于分層編碼單元的視頻解碼設(shè)備的框圖;
[0025]圖16是示出根據(jù)本發(fā)明實施例的根據(jù)深度的編碼單元和分區(qū)的示圖;
[0026]圖17是用于描述根據(jù)本發(fā)明實施例的編碼單元與變換單元之間的關(guān)系的示圖;
[0027]圖18是用于描述根據(jù)本發(fā)明實施例的與編碼深度相應(yīng)的編碼單元的編碼信息的示圖;
[0028]圖19是根據(jù)本發(fā)明實施例的根據(jù)深度的編碼單元的示圖;
[0029]圖20至圖22是用于描述根據(jù)本發(fā)明實施例的編碼單元、預(yù)測單元與頻率變換單兀之間的關(guān)系的不圖;
[0030]圖23是用于描述根據(jù)表I的編碼模式信息的編碼單元、預(yù)測單元與變換單元之間的關(guān)系的示圖;
[0031]最優(yōu)模式
[0032]根據(jù)本發(fā)明的一方面,提供了一種用于對視頻進行解碼的算術(shù)解碼方法,所述方法包括:從接收的比特流獲得分別與第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串相應(yīng)的第一坐標(biāo)前綴語法元素和第一坐標(biāo)后綴語法元素,以及分別與第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串相應(yīng)的第二坐標(biāo)前綴語法元素和第二坐標(biāo)后綴語法元素,其中,通過基于根據(jù)當(dāng)前塊的尺寸確定的臨界值對當(dāng)前塊的最后有效系數(shù)的第一坐標(biāo)位置進行分類來獲得第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串,基于臨界值對最后有效系數(shù)的第二坐標(biāo)位置進行分類來獲得第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串;通過按照第一算術(shù)解碼方法針對第一坐標(biāo)前綴語法元素和第二坐標(biāo)前綴語法元素順序地執(zhí)行算術(shù)解碼操作,以獲得第一坐標(biāo)前綴比特串和第二坐標(biāo)前綴比特串;通過按照第二算術(shù)解碼方法針對第一坐標(biāo)后綴語法元素和第二坐標(biāo)后綴語法元素順序地執(zhí)行算術(shù)解碼操作,以獲得第一坐標(biāo)后綴比特串和第二坐標(biāo)后綴比特串;以及通過對第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串執(zhí)行逆二進制化來恢復(fù)第一坐標(biāo)分量,并通過對第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串執(zhí)行逆二進制化來恢復(fù)第二坐標(biāo)分量。
[0033]根據(jù)本發(fā)明的另一方面,提供了一種視頻解碼設(shè)備,包括:解析器,從接收的比特流獲得分別與第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串相應(yīng)的第一坐標(biāo)前綴語法元素和第一坐標(biāo)后綴語法元素,以及分別與第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串相應(yīng)的第二坐標(biāo)前綴語法元素和第二坐標(biāo)后綴語法元素,其中,通過基于根據(jù)當(dāng)前塊的尺寸確定的臨界值對當(dāng)前塊的最后有效系數(shù)的第一坐標(biāo)位置而獲得的第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串,通過基于臨界值對最后有效系數(shù)的第二坐標(biāo)位置進行分類來獲得第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串;算術(shù)解碼器,通過按照第一算術(shù)解碼方法針對第一坐標(biāo)前綴語法元素和第二坐標(biāo)前綴語法元素順序地執(zhí)行算術(shù)解碼操作來獲得第一坐標(biāo)前綴比特串和第二坐標(biāo)前綴比特串,通過按照第二算術(shù)解碼方法針對第一坐標(biāo)后綴語法元素和第二坐標(biāo)后綴語法元素順序地執(zhí)行算術(shù)解碼操作來獲得第一坐標(biāo)后綴比特串和第二坐標(biāo)后綴比特串,通過對第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串執(zhí)行逆二進制化來恢復(fù)第一坐標(biāo)分量,并通過對第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串執(zhí)行逆二進制化來恢復(fù)第二坐標(biāo)分量。
[0034]根據(jù)本發(fā)明的另一方面,提供了一種用于對視頻進行編碼的算術(shù)編碼方法,所述方法包括:基于根據(jù)當(dāng)前塊的尺寸確定的臨界值,將當(dāng)前塊中的最后有效系數(shù)的位置的第一坐標(biāo)分量分類為第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串;基于所述臨界值將最后有效系數(shù)的位置的第二坐標(biāo)分量分類為第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串;按照第一算術(shù)編碼方法對第一坐標(biāo)前綴比特串和第二坐標(biāo)前綴比特串順序地執(zhí)行算術(shù)編碼;以及按照第二算術(shù)編碼方法對第一坐標(biāo)后綴比特串和第二坐標(biāo)后綴比特串執(zhí)行算術(shù)編碼。
[0035]根據(jù)本發(fā)明的另一方面,提供了一種視頻編碼設(shè)備,包括:圖像編碼器,對通過劃分視頻而獲得的塊執(zhí)行預(yù)測、變換和量化以產(chǎn)生塊的語法元素;熵編碼器,基于根據(jù)當(dāng)前塊的尺寸確定的臨界值將當(dāng)前塊中的最后有效系數(shù)的位置的第一坐標(biāo)分量分類為第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串,基于所述臨界值將最后有效系數(shù)的位置的第二坐標(biāo)分量分類為第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串,按照第一算術(shù)編碼方法對第一坐標(biāo)前綴比特串和第二坐標(biāo)前綴比特串順序地執(zhí)行算術(shù)編碼,以及按照第二算術(shù)編碼方法對第一坐標(biāo)后綴比特串和第二坐標(biāo)后綴比特串執(zhí)行算術(shù)編碼。
[0036]發(fā)明模式
[0037]以下,將參照附圖來詳細(xì)描述本發(fā)明的實施例。在以下描述中,術(shù)語“圖像”可表示靜止圖像或運動圖像(也就是,視頻)。
[0038]首先,將參照圖1到圖10來描述根據(jù)本發(fā)明實施例的算術(shù)編碼方法和視頻編碼設(shè)備以及根據(jù)本發(fā)明實施例的算術(shù)解碼方法和視頻解碼設(shè)備。
[0039]圖1是根據(jù)本發(fā)明實施例的視頻編碼設(shè)備10的框圖。
[0040]視頻編碼設(shè)備10將配置視頻的多個畫面中的一個畫面劃分為分層結(jié)構(gòu)的數(shù)據(jù)單元,并通過使用分層結(jié)構(gòu)的數(shù)據(jù)單元來執(zhí)行預(yù)測、變換和量化。如將隨后參照圖11到圖23描述的,分層結(jié)構(gòu)的數(shù)據(jù)單元可以是最大編碼單元、編碼單元、預(yù)測單元或變換單元??苫诖鷥r而與其它數(shù)據(jù)單元獨立地確定用于預(yù)測處理和變換處理的預(yù)測單元和變換單元。
[0041]由于對最大編碼單元的每個區(qū)域中的具有分層結(jié)構(gòu)的編碼單元中的每一個遞歸地執(zhí)行編碼,故可獲得具有樹結(jié)構(gòu)的數(shù)據(jù)單元。也就是說,可在每個最大編碼單元中確定具有樹結(jié)構(gòu)的編碼單元以及具有樹結(jié)構(gòu)的預(yù)測單元和變換單元。表示具有分層結(jié)構(gòu)的數(shù)據(jù)單元的配置的分層信息和用于解碼的非分層信息必須被發(fā)送以執(zhí)行解碼操作。[0042]與分層結(jié)構(gòu)有關(guān)的信息對確定具有樹結(jié)構(gòu)的編碼單元、具有樹結(jié)構(gòu)的預(yù)測單元和具有樹結(jié)構(gòu)的變換單元是必需的,這將在后面進行描述,并且與分層結(jié)構(gòu)有關(guān)的信息可包括最大編碼單元的尺寸、編碼深度、預(yù)測單元的分區(qū)信息、表示編碼單元是否被劃分的劃分標(biāo)記、變換單元的尺寸信息和表示變換單元是否被劃分的變換單元(TU)尺寸標(biāo)記。除了分層結(jié)構(gòu)信息之外的編碼信息可包括應(yīng)用于每個預(yù)測單元的幀內(nèi)/幀間預(yù)測的預(yù)測模式信息、運動矢量信息、預(yù)測方向信息、當(dāng)使用多個顏色分量時應(yīng)用于相應(yīng)的數(shù)據(jù)單元的顏色分量信息以及變換系數(shù)信息。以下,將被熵編碼和熵解碼的分層信息和非分層信息可稱為語法元素或符號。此外,為了便于描述,數(shù)據(jù)單元稱為塊。在預(yù)測處理期間,塊與預(yù)測單元或分區(qū)相應(yīng),在變換處理期間,塊與變換單元相應(yīng)。
[0043]參照圖1,視頻編碼設(shè)備10包括圖像編碼器11和語法元素編碼器12。
[0044]圖像編碼器11執(zhí)行諸如圖像塊的預(yù)測、變換和量化的操作以產(chǎn)生語法元素。更詳細(xì)地,圖像編碼器11通過在每個塊中進行幀內(nèi)預(yù)測和幀間預(yù)測來產(chǎn)生預(yù)測值,并通過對作為原始塊與預(yù)測值之間的差的殘差進行變換和量化來產(chǎn)生變換系數(shù)。
[0045]語法元素編碼器12對關(guān)于在每個塊中產(chǎn)生的變換系數(shù)的語法元素以及在其它編碼處理中產(chǎn)生的其它各種語法元素執(zhí)行算術(shù)編碼,以產(chǎn)生比特流。具體地,本實施例的語法元素編碼器12基于根據(jù)當(dāng)前塊的寬度或長度確定的臨界值來將最后有效系數(shù)的行位置和列位置分類為前綴和后綴,并通過應(yīng)用根據(jù)上下文自適應(yīng)二進制算術(shù)編碼(CABAC)的上下文模型順序地對通過對前綴執(zhí)行二進制化而獲得的比特串進行算術(shù)編碼,并且在執(zhí)行CABAC之后按照旁路(bypass)模式對通過對后綴執(zhí)行二進制化而獲得的比特串進行算術(shù)編碼,其中,最后有效系數(shù)在塊中的除了 O之外的有效系數(shù)中根據(jù)預(yù)定掃描順序被最后掃描。 [0046]圖2是更詳細(xì)地示出圖1中的語法元素編碼器12的框圖。
[0047]參照圖2,語法元素編碼器20包括二進制化器21、上下文建模器22和二進制算術(shù)編碼器23。另外,二進制算術(shù)編碼器23包括常規(guī)編碼引擎24和旁路編碼引擎25。
[0048]如果語法元素不具有二進制值,則二進制化器21對語法元素進行二進制化以輸出包含二進制值O或I的比特串,也就是,二進制(bin)串。bin表示包含O或I的比特串中的每個比特。根據(jù)語法元素的類型,可使用一元二進制化(unary binarizat1n)、截斷一兀二進制化(truncated unary binarizat1n)、指數(shù)哥倫布二進制化(exponential Golombbinarizat1n)和固定長度二進制化(fixed length binarizat1n)中的一種。
[0049]具體地,本發(fā)明的實施例的二進制化器21基于根據(jù)當(dāng)前塊的尺寸確定的臨界值將當(dāng)前編碼的語法元素分類為前綴和后綴,并可通過使用彼此獨立的二進制化方法來對前綴和后綴進行~ 進制化以輸出如綴比特串和后綴比特串。例如,二進制化器21基于根據(jù)當(dāng)前塊的寬度確定的臨界值將最后有效系數(shù)的列位置分類為前綴和后綴,隨后通過將預(yù)定的第一二進制化方法應(yīng)用于列位置的前綴來輸出列位置的前綴比特串,并通過將預(yù)定的第二二進制化方法應(yīng)用于列位置的后綴來輸出列位置的后綴比特串。第一二進制化方法和第二二進制化方法彼此獨立,也就是說,它們可以彼此相同或彼此不同。
[0050]相似地,二進制化器21可基于根據(jù)當(dāng)前塊的高度確定的臨界值將最后有效系數(shù)的行位置分類為前綴和后綴,隨后通過將預(yù)定的第一二進制化方法應(yīng)用于行位置的前綴來輸出行位置的前綴比特串,并通過將預(yù)定的第二二進制化方法應(yīng)用于行位置的后綴來輸出行位置的后綴比特串。下面將參照圖5來描述將當(dāng)前編碼的語法元素分類為前綴和后綴的處理。
[0051]根據(jù)語法元素的類型,可在常規(guī)編碼引擎24中通過使用上下文模型來對比特串中的每個bin進行算術(shù)編碼,或者可在旁路編碼引擎25中對比特字符串中的每個bin進行算術(shù)編碼。具體地,當(dāng)最后有效系數(shù)的位置被分類為前綴比特串和后綴比特串時,本實施例的常規(guī)編碼引擎24通過順序地應(yīng)用根據(jù)CABAC的上下文模型來對被分類為前綴的比特串進行算術(shù)編碼,旁路編碼引擎25可按照旁路模式對被分類為后綴的比特串進行算術(shù)編碼。
[0052]上下文建模器22對常規(guī)編碼引擎24提供用于對當(dāng)前語法元素進行算術(shù)編碼的上下文模型。具體地,當(dāng)常規(guī)編碼引擎24對最后有效系數(shù)位置的前綴比特串進行算術(shù)編碼時,上下文建模器22將產(chǎn)生用于對前綴比特串中的每個bin進行編碼的二進制值的概率輸出到常規(guī)編碼引擎24。上下文模型是每個bin的概率模型,并且包括關(guān)于O和I中的哪一個與最大概率符號(MPS)和最小概率符號(LPS)相應(yīng)的信息以及MPS或LPS的概率信息。上下文建模器22根據(jù)在常規(guī)編碼引擎24中編碼的比特的值是O還是I來更新上下文模型。
[0053]常規(guī)編碼引擎24基于從上下文建模器22提供的上下文模型(也就是,關(guān)于MPS和LPS的信息以及MPS或LPS的概率信息)對構(gòu)成最后有效系數(shù)位置的前綴比特串的每個bin執(zhí)行算術(shù)編碼。
[0054]旁路編碼引擎25根據(jù)旁路模式對最后有效系數(shù)位置的后綴比特串執(zhí)行算術(shù)編碼。在旁路模式中,產(chǎn)生二進制信號O和I的概率具有固定值。因此,旁路編碼引擎25可對輸入的比特串直接執(zhí)行算術(shù)編碼,這與使用上下文模型的算術(shù)編碼方法不同,在所述使用上下文模型的算術(shù)編碼方法中,在對每個bin進行算術(shù)編碼的同時更新上下文模型并且更新的上下文模型用于對下一 bin的算術(shù)編碼。
[0055]圖7是示出在圖2的常規(guī)編碼引擎24中執(zhí)行的使用上下文模型的算術(shù)編碼處理的示圖。在圖7中,當(dāng)前編碼的符號的二進制值是“010”,為了便于描述,假設(shè)產(chǎn)生I的概率具有0.2的固定值,產(chǎn)生O的概率具有0.8的固定值。實際上,常規(guī)編碼引擎24根據(jù)二進制值“010”中的每個bin的算術(shù)編碼來更新產(chǎn)生二進制值的概率。
[0056]參照圖7,當(dāng)二進制值“010”中的第一 bin值“O”被編碼時,初始區(qū)間[0.0?1.0]中的較小的80%部分(也就是,[0.0?0.8])被更新為新的區(qū)間。此外,當(dāng)下一 bin值“I”被編碼時,區(qū)間[0.0?0.8]中的較大的20%部分(也就是,[0.64?0.8])被更新為新的區(qū)間。此外,當(dāng)下一 bin值“O”被編碼時,區(qū)間[0.64?0.8]中的較小的80%部分(也就是,[0.64?0.768])被更新為新的區(qū)間。在與包括在最終區(qū)間[0.64?0.768]中的實際數(shù)0.75相應(yīng)的二進制數(shù)0.11中,除了初始數(shù)O之外的小數(shù)點后面的數(shù)“11”作為與編碼的符號的二進制值“010 ”相應(yīng)的比特串被輸出。
[0057]以下,下面將詳細(xì)描述與變換系數(shù)有關(guān)的信息(也就是,與變換系數(shù)有關(guān)的語法元素)的算術(shù)編碼和解碼處理。
[0058]圖3是示出根據(jù)本發(fā)明實施例的對每個塊中的變換系數(shù)信息進行算術(shù)編碼和解碼的處理的流程圖。
[0059]參照圖3,在操作31,首先對標(biāo)記coded_block_flag進行算術(shù)編碼或解碼,其中,標(biāo)記coded_block_flag表示包括在當(dāng)前塊中的變換系數(shù)中是否存在除了 O之外的有效系數(shù)。[0060]如果當(dāng)前塊僅具有變換系數(shù)O并且不具有除了 O之外的有效系數(shù),則將值O算術(shù)編碼為COded_blOCk_f lag,并且省略與其它變換系數(shù)有關(guān)的語法元素的算術(shù)編碼處理。
[0061]在操作32,如果在當(dāng)前塊中存在有效系數(shù)(即,coded_block_flag的值是I),則對指示有效系數(shù)的位置的有效圖(SigMap)進行算術(shù)編碼或解碼。
[0062]有效圖SigMap可包括指示最后有效系數(shù)的有效比特和位置的預(yù)定信息。有效比特表示根據(jù)每個掃描索引的變換系數(shù)是有效系數(shù)還是0,并可通過使用significant,coeff_flag[i]而被表示??舍槍νㄟ^劃分當(dāng)前塊而獲得的具有預(yù)定尺寸的每個子集來設(shè)置有效圖SigMap。也就是說,significant_coeff_flag[i]可表示包括在當(dāng)前塊的一個子集中的變換系數(shù)之中的第i掃描索引的變換系數(shù)是否是O。
[0063]在傳統(tǒng)H.264標(biāo)準(zhǔn)中,在每個有效系數(shù)中對指示有效系數(shù)是否是最后有效系數(shù)的標(biāo)記End-Of-Block單獨地進行算術(shù)編碼或解碼。然而,根據(jù)本實施例,關(guān)于最后有效系數(shù)的位置的信息照其原樣被算術(shù)編碼或解碼。例如,如果最后有效系數(shù)位于當(dāng)前塊的第X列(其中,X是整數(shù))和第y行(其中,y是整數(shù)),也就是說,如果最后有效系數(shù)的位置是(X,y),則X和I的值被算術(shù)編碼或解碼。
[0064]具體地,根據(jù)本實施例的語法元素編碼器12基于根據(jù)當(dāng)前塊的寬度確定的臨界值將最后有效系數(shù)的行位置(X)分類為X軸前綴比特串(或第一坐標(biāo)前綴比特串)和X軸后綴比特串(或第一坐標(biāo)后綴比特串),并基于根據(jù)當(dāng)如塊的聞度確定的臨界值將最后有效系數(shù)的列位置(y)分類為y軸前綴比特串(或第二坐標(biāo)前綴比特串)和y軸后綴比特串(或第二坐標(biāo)后綴比特串)。此外,語法元素編碼器12通過應(yīng)用根據(jù)CABAC的上下文模型來執(zhí)行X軸和I軸前綴比特串的算術(shù)編碼,并按照旁路模式對X軸和I軸后綴比特串執(zhí)行算術(shù)編碼。另外,語法元素編碼器12可通過形成各自使用不同算術(shù)編碼類型被編碼的前綴比特串和后綴比特串的組來順序地執(zhí)行算術(shù)編碼。也就是說,語法元素編碼器12通過應(yīng)用上下文模型來對X軸前綴比特串和I軸前綴比特串執(zhí)行算術(shù)編碼,并可在對前綴比特串執(zhí)行的算術(shù)編碼之后或者獨立于對前綴比特串執(zhí)行的算術(shù)編碼處理,按照旁路模式對X軸后綴比特串和y軸后綴比特串執(zhí)行算術(shù)編碼。
[0065]圖4是示出為了對與變換系數(shù)有關(guān)的語法元素執(zhí)行算術(shù)編碼而通過對塊進行劃分所獲得的子集的示圖。在圖4中,標(biāo)號41表示塊40中的最后有效系數(shù)。
[0066]參照圖4,為了對包括在塊40中的與變換系數(shù)有關(guān)的語法元素的算術(shù)編碼執(zhí)行算術(shù)編碼,塊40可被劃分為具有預(yù)定尺寸的子集。變換系數(shù)信息可包括有效圖(SigMap)、指示包括在子集中的有效系數(shù)是否大于I的標(biāo)記(Greaterthanl標(biāo)記)、指示包括在子集中的有效系數(shù)是否大于2的標(biāo)記(Greaterthan2標(biāo)記)、表示有效系數(shù)的級別大于2的信息(level-3)和關(guān)于最后有效系數(shù)41的位置的信息。諸如SigMap、Greaterthanl標(biāo)記、Greaterthan2標(biāo)記和(level-3)的語法元素可按照子集單元被算術(shù)編碼。子集的處理順序可被不同地設(shè)置。例如,如箭頭所指示的,包括在每個子集中的變換系數(shù)信息可按照從子集15到子集O的順序被算術(shù)編碼。本發(fā)明不限于于此,如果塊40的尺寸小,則塊可不被劃分為子集,但是包括在塊40中的諸如SigMap、Greaterthanl標(biāo)記、Greaterthan2標(biāo)記和level-3的語法元素可被算術(shù)編碼。
[0067]如上所述,在包括在塊40中的有效系數(shù)中,根據(jù)預(yù)定掃描順序的最后有效系數(shù)41的行位置(X)和列位置(y)基于當(dāng)前塊40的尺寸被分別分類為前綴比特串和后綴比特串。隨后,通過應(yīng)用根據(jù)CABAC的上下文模型來對前綴比特串進行算術(shù)編碼,并按照旁路模式對后綴比特串進行算術(shù)編碼。
[0068]以下,下面將更詳細(xì)地描述將最后有效系數(shù)的位置分類為前綴比特串和后綴比特串的處理。
[0069]圖5是示出將最后有效系數(shù)的位置分類為前綴比特串和后綴比特串并對比特串進行算術(shù)編碼的處理的參考示圖。
[0070]當(dāng)假設(shè)塊的寬度是w(其中,w是整數(shù))并且塊的高度是h(其中,h是整數(shù))時,塊中的變換系數(shù)的位置具有二維坐標(biāo)值(X,y)。當(dāng)定義在塊的最左上角的變換系數(shù)的位置是(0,0)并且在塊的最右下角的變換系數(shù)的位置是((W-1),(h-D)時,塊中的變換系數(shù)的行位置X具有從O到(w-Ι)的值中的一個值,變換系數(shù)的列位置y具有從O到(h-Ι)的值中的一個值。
[0071]首先,下面將描述將行位置X分類為前綴比特串和后綴比特串并對比特串進行算術(shù)編碼的處理。
[0072]參照圖5,塊中的最后有效系數(shù)的行位置X具有從O到(w-Ι)的值。基于根據(jù)塊的寬度w確定的臨界值th,行位置X被分類為等于或小于臨界值th的前綴和超過臨界值th的后綴(x-th)。
[0073]具體地,如果 最后有效系數(shù)的行位置X的值等于或小于臨界值th,則行位置僅被分類為前綴而不被分類為后綴。如果行位置X的值超過臨界值th,則行位置X被分類為與臨界值th相應(yīng)的前綴和超過臨界值th的后綴(x-th)。也就是說,如果行位置X具有等于或小于臨界值th的值,則行位置僅被分類為前綴并且不存在后綴。此外,僅當(dāng)行位置X超過臨界值th時,行位置X被分類為前綴和后綴。
[0074]換句話說,如果最后有效系數(shù)的行位置X等于或小于臨界值th,則行位置X根據(jù)預(yù)定的第一二進制化方法被二進制化并僅被分類為X軸前綴比特串。如果最后有效系數(shù)的行位置X超過臨界值th,則行位置X被分類為通過按照第一二進制化方法對臨界值th執(zhí)行二進制化而獲得的X軸前綴比特串以及通過按照預(yù)定的第二二進制化方法對值(x-th)執(zhí)行二進制化而獲得的X軸后綴比特串。
[0075]如上所述,臨界值th可基于塊的寬度w而被確定,其中,行位置X基于所述臨界值th而被分類為前綴和后綴。例如,臨界值th可以是在O到(w-Ι)之間的中間值(w/2)-l,其中,O到(w-Ι)是行位置X的可允許范圍。作為另一示例,如果塊的寬度w是2的冪,則可通過以下等式th = (log2w〈〈l)_l來確定臨界值th。臨界值th不限于此,并可以以各種方式被設(shè)置。
[0076]具體地,如果塊的寬度w具有值8,則臨界值th是(8/2)-1 = 3,從而行位置x可基于值3被分類為前綴和后綴。如果行位置X超過3,例如,行位置X具有值5,則由于X =th+2 = 3+2,行位置X被分類為具有值3的前綴和具有值2的后綴。如果行位置X具有3或更小的值,則行位置X被直接二進制化并被分類為前綴,不存在后綴。
[0077]在先前描述的示例中,使用不同的二進制化方法分別對前綴3和后綴2進行二進制化。例如,前綴可通過截斷一元二進制化處理而被二進制化,后綴可通過固定長度二進制化處理而被二進制化。為了描述方便,在圖5中,在行位置X是5并且臨界值th是3的情況下,被分類為前綴的值3通過一元二進制化被二進制化為0001 (52),被分類為后綴的值2通過一般二進制化處理被二進制化為010(54)。
[0078]如上所述,通過應(yīng)用上下文模型來對前綴比特串0001(52)進行算術(shù)編碼。針對“0001”中的每個bin來確定上下文索引,并且可基于確定的上下文索引來確定用于對每個bin進行算術(shù)編碼的上下文模型。按照旁路模式對后綴比特串010(54)進行算術(shù)編碼而不執(zhí)行確定上下文建模的處理。在旁路模式中,由于每個bin具有相同的可能性,也就是說,值O和值I具有相同的固定可能性值1/2,可直接對輸入比特串101(54)進行算術(shù)編碼而不使用上下文模型。
[0079]如上所述,如果行位置X具有等于或小于臨界值th的值,則行位置X僅被分類為前綴,不存在后綴。在上述示例中,假設(shè)行位置X具有小于臨界值th3的值I。在這種情況下,行位置X的值(也就是,I)僅通過預(yù)定的二進制化方法被分類為前綴比特串,并且不存在后綴比特串。如上所述,通過應(yīng)用上下文模型來對前綴比特串進行算術(shù)編碼,并且由于不存在后綴比特串而省略旁路模式中的算術(shù)編碼處理。
[0080]與在將行位置X劃分為前綴比特串和后綴比特串之后執(zhí)行的算術(shù)編碼相似,列位置y可被分類為前綴比特串和后綴比特串并可被算術(shù)編碼。也就是說,基于根據(jù)塊的高度h確定的臨界值th,列位置y被分類為等于或小于臨界值th的前綴和具有超過臨界值th的值(y-th)的后綴。如果列位置y具有等于或小于臨界值th的值,則列位置僅被分類為前綴并且不存在后綴。如果列位置y被分類為前綴和后綴,則使用獨立的二進制化方法對前綴和后綴中的每一個進行二進制化,從而獲得前綴比特串和后綴比特串。
[0081]也就是說,最后有效系數(shù)的列位置y等于或小于臨界值th,使用第一二進制化方法將列位置I 二進制化,并將列位置I分類為I軸前綴比特串。如果最后有效系數(shù)的列位置I超過臨界值th,則列位置y被分類為通過按照第一二進制化方法對臨界值th執(zhí)行二進制化而獲得的y軸前綴比特串以及通過按照第二二進制化方法對值(y-th)執(zhí)行二進制化而獲得的y軸后綴比特串。
[0082]此外,通過應(yīng)用上下文模型來對前綴比特串進行算術(shù)編碼,并且按照旁路模式對后綴比特串進行算術(shù)編碼。
[0083]圖6是示出根據(jù)本發(fā)明實施例的對最后有效系數(shù)的位置信息進行算術(shù)編碼的處理的示圖。
[0084]如上所述,當(dāng)最后有效系數(shù)的行位置X和列位置y基于根據(jù)當(dāng)前塊的尺寸確定的臨界值th而被分別分類為前綴比特串和后綴比特串時,根據(jù)本實施例的語法元素編碼器12通過應(yīng)用根據(jù)CABAC的上下文模型來對前綴比特串執(zhí)行算術(shù)編碼,并按照旁路模式對被分類為后綴的比特串執(zhí)行算術(shù)編碼。
[0085]參照圖6,當(dāng)最后有效系數(shù)的行位置χ61被分類為X軸分量前綴62和x軸分量后綴63,并且列位置y被分類為y軸分量前綴66和y軸分量后綴67,語法元素編碼器12產(chǎn)生X軸分量前綴62和y軸分量前綴66的組,并通過應(yīng)用上下文建模68來對所述組執(zhí)行算術(shù)編碼。此外,在執(zhí)行上下文建模68之后或獨立于上下文建模68,語法元素編碼器12產(chǎn)生X軸分量后綴63和y軸分量后綴67的組,并按照旁路模式69對所述組執(zhí)行算術(shù)編碼。如上所述,本實施例的語法元素編碼器12可針對應(yīng)用了相同算術(shù)編碼方法的比特串的組執(zhí)行處理,從而可提高計算速度。具體地,X軸分量后綴63和y軸分量后綴67被分為一組并且按照旁路模式對所述組執(zhí)行算術(shù)編碼,從而可立即對后綴比特串進行算術(shù)編碼。由于旁路模式使用如上所述的固定概率值,故可直接輸出與整個輸入比特串相應(yīng)的編碼結(jié)果。此夕卜,如上所述,當(dāng)最后有效系數(shù)的行位置X或列位置I具有等于或小于預(yù)定臨界值的值時,不存在行位置和列位置的后綴比特串,從而可省略后綴比特串的算術(shù)編碼處理。
[0086]圖8是示出根據(jù)本發(fā)明實施例的用于對視頻進行編碼的算術(shù)編碼方法的流程圖。
[0087]參照圖8,在操作81,語法元素編碼器12基于根據(jù)當(dāng)前塊的尺寸確定的臨界值將當(dāng)前塊中的最后有效系數(shù)位置的第一坐標(biāo)分量分類為第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串。如上所述,語法元素編碼器12根據(jù)第一預(yù)定二進制化方法對行位置X進行二進制化,并當(dāng)最后有效系數(shù)的行位置X等于或小于臨界值th時將二進制化的結(jié)果分類為X軸前綴比特串。另外,當(dāng)最后有效系數(shù)的行位置X超過臨界值th時,語法元素編碼器12將行位置X分類為通過根據(jù)第一二進制化方法對臨界值th執(zhí)行二進制化而獲得的X軸前綴比特串以及通過根據(jù)第二預(yù)定二進制化方法對值(x-th)執(zhí)行二進制化而獲得的X軸后綴比特串。
[0088]在操作82,語法元素編碼器12基于臨界值將最后有效系數(shù)的第二坐標(biāo)分量分類為第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串。如上所述,當(dāng)最后有效系數(shù)的列位置y等于或小于臨界值th時,語法元素編碼器12根據(jù)第一預(yù)定二進制化方法將列位置y 二進制化,并將二進制化的結(jié)果分類為I軸前綴比特串。另外,當(dāng)最后有效系數(shù)的列位置I超過臨界值th時,語法元素編碼器12將列位置y分類為通過根據(jù)第一二進制化方法對臨界值th執(zhí)行二進制化而獲得的I軸前綴比特串以及通過根據(jù)第二預(yù)定二進制化方法對值(y-th)執(zhí)行二進制化而獲得的I軸后綴比特串。這里,當(dāng)塊的寬度w和高度h彼此相等時,作為用于將行位置X和列位置y分類為前綴和后綴的臨界的臨界值彼此相等。如果塊具有矩形形狀,可分別基于塊的寬度和高度來確定用于將行位置X和列位置I分類為前綴和后綴的臨界值。
[0089]在操作83,語法元素編碼器12根據(jù)第一算術(shù)編碼方法對第一坐標(biāo)前綴比特串和第二坐標(biāo)前綴比特串順序地執(zhí)行算術(shù)編碼。如上所述,語法元素編碼器12可產(chǎn)生前綴比特串的組以通過使用上下文模型執(zhí)行算術(shù)編碼。
[0090]在操作84,語法元素編碼器12根據(jù)第二算術(shù)編碼方法對第一坐標(biāo)后綴比特串和第二坐標(biāo)后綴比特串執(zhí)行算術(shù)編碼。如上所述,語法元素編碼器12可產(chǎn)生按照旁路模型算術(shù)編碼的后綴比特串的組。
[0091]圖9a是示出根據(jù)本發(fā)明實施例的視頻解碼設(shè)備90的框圖。
[0092]參照圖a,視頻解碼設(shè)備包括語法元素解碼器91和圖像恢復(fù)單元92。
[0093]語法元素解碼器91接收表示視頻的編碼數(shù)據(jù)的包括各種語法元素的比特流,并對比特流進行解析以獲得語法元素??稍谡Z法元素解碼器91的解析單元中執(zhí)行上述操作。由于通過上述視頻編碼設(shè)備10對語法元素進行二進制化和算術(shù)編碼,故語法元素解碼器91通過算術(shù)解碼和逆二進制化處理來恢復(fù)語法元素。
[0094]具體地,本實施例的語法元素解碼器91從接收的比特流獲得分別與X軸分量前綴比特串和X軸分量后綴比特串相應(yīng)的X軸分量前綴語法元素和X軸分量后綴語法元素,以及分別與I軸分量前綴比特串和I軸分量后綴比特串相應(yīng)的I軸分量前綴語法元素和X軸分量后綴語法元素,其中,通過基于根據(jù)當(dāng)前塊的尺寸確定的臨界值對當(dāng)前塊的最后有效系數(shù)的X軸位置進行分類來獲得X軸分量前綴比特串和X軸分量后綴比特串,通過基于臨界值對最后有效系數(shù)的I軸位置進行分類來獲得I軸分量前綴比特串和I軸分量后綴比特
串O
[0095]此外,語法元素解碼器91按照第一算術(shù)解碼方法(也就是,使用上下文模型的算術(shù)解碼)針對X軸分量前綴語法元素和y軸分量前綴語法元素順序地執(zhí)行算術(shù)解碼操作,以獲得X軸分量前綴比特串和I軸分量前綴比特串。
[0096]另外,語法元素解碼器91按照第二算術(shù)解碼方法(也就是,旁路模式的算術(shù)解碼)針對X軸分量后綴語法元素和I軸分量后綴語法元素順序地執(zhí)行算術(shù)解碼操作,以獲得X軸分量后綴比特串和I軸分量后綴比特串。如上所述,由于在行位置X和列位置I的值小于預(yù)定的臨界值th的情況下不存在后綴,故在這種情況下省略后綴語法元素的算術(shù)解碼操作。
[0097]當(dāng)獲得X軸分量前綴比特串、y軸分量前綴比特串、X軸分量后綴比特串和I軸分量后綴比特串時,語法元素解碼器對X軸分量前綴比特串和X軸分量后綴比特串執(zhí)行逆二進制化,并添加逆二進制化的X軸分量前綴和X軸分量后綴以恢復(fù)X軸分量。另外,語法元素解碼器91對y軸分量前綴比特串和y軸分量后綴比特串執(zhí)行逆二進制化,并添加逆二進制化的I軸分量前綴和I軸分量后綴以恢復(fù)I軸分量。
[0098]圖像恢復(fù)單元92 通過使用由語法元素解碼器91恢復(fù)的各種語法元素對當(dāng)前塊執(zhí)行逆變換和預(yù)測。圖像恢復(fù)單元92可通過使用每個圖像塊中的恢復(fù)的語法元素執(zhí)行諸如逆量化、逆變換和幀內(nèi)預(yù)測/運動補償?shù)牟僮鳎瑏砘謴?fù)圖像塊。
[0099]圖9b是包括在圖9a的語法元素解碼器91中的算術(shù)解碼設(shè)備的框圖。圖9b中示出的算術(shù)解碼設(shè)備93與圖2中示出的語法元素編碼設(shè)備20相應(yīng)。算術(shù)解碼設(shè)備93執(zhí)行在語法元素編碼設(shè)備20中執(zhí)行的算術(shù)編碼處理的逆處理。
[0100]參照圖9b,算術(shù)解碼設(shè)備93包括上下文建模器94、常規(guī)解碼器95、旁路解碼器96和逆二進制化單元97。
[0101]按照旁路模式編碼的符號被輸出到旁路解碼器96以被解碼,并且由常規(guī)解碼器95對按照常規(guī)編碼方法被編碼的符號進行解碼。常規(guī)解碼器95基于從上下文建模器94提供的上下文模型來對當(dāng)前編碼的符號的二進制化值進行算術(shù)解碼。如上所述,常規(guī)解碼器95針對從接收的比特流獲得的X軸分量前綴語法元素和y軸分量前綴語法元素使用上下文模型來順序地執(zhí)行算術(shù)解碼,從而獲得X軸分量前綴比特串和I軸分量前綴比特串。
[0102]旁路解碼器96針對從接收的比特流獲得的X軸分量后綴語法元素和y軸分量后綴語法元素按照旁路模式執(zhí)行算術(shù)解碼,從而獲得X軸分量后綴比特串和?軸分量后綴比特串。
[0103]逆二進制化單元97針對由常規(guī)解碼器95或旁路解碼器96恢復(fù)的x軸分量前綴比特串、y軸分量前綴比特串、X軸分量后綴比特串和y軸分量后綴比特串執(zhí)行逆二進制化,以恢復(fù)X軸分量前綴、y軸分量前綴、X軸分量后綴和I軸分量后綴。添加X軸分量前綴和X軸分量后綴以獲得最后有效系數(shù)的X軸位置,添加I軸分量前綴和I軸分量后綴以獲得最后有效系數(shù)的I軸位置。
[0104]圖10是示出根據(jù)本發(fā)明實施例的用于對視頻進行解碼的算數(shù)解碼方法的流程圖。
[0105]參照圖10,在操作101,語法元素解碼器91從接收的比特流獲得分別與第一坐標(biāo)分量前綴比特串和第一坐標(biāo)分量后綴比特串相應(yīng)的第一坐標(biāo)分量前綴語法元素和第一坐標(biāo)分量后綴語法元素,以及分別與第二坐標(biāo)分量前綴比特串和第二坐標(biāo)分量后綴比特串相應(yīng)的第二坐標(biāo)分量前綴語法元素和第二坐標(biāo)分量后綴語法元素,其中,通過基于根據(jù)當(dāng)前塊的尺寸確定的臨界值對當(dāng)前塊的最后有效系數(shù)的第一坐標(biāo)位置進行分類來獲得第一坐標(biāo)分量前綴比特串和第一坐標(biāo)分量后綴比特串,通過基于臨界值對最后有效系數(shù)的第二坐標(biāo)位置來獲得第二坐標(biāo)分量前綴比特串和第二坐標(biāo)分量后綴比特串。
[0106]在操作102,語法元素解碼器91按照第一算術(shù)解碼方法(也就是,使用上下文模型的算術(shù)解碼)針對第一坐標(biāo)分量前綴語法元素和第二坐標(biāo)分量前綴語法元素順序地執(zhí)行算術(shù)解碼操作,以獲得第一坐標(biāo)分量前綴比特串和第二坐標(biāo)分量前綴比特串。
[0107]在操作103,語法元素解碼器91按照第二算術(shù)解碼方法(也就是,旁路模式的算術(shù)解碼)針對第一坐標(biāo)分量后綴語法元素和第二坐標(biāo)分量后綴語法元素順序地執(zhí)行算術(shù)解碼操作,以獲得第一坐標(biāo)分量后綴比特串和第二坐標(biāo)分量后綴比特串。
[0108]在操作104,語法元素解碼器91對第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串執(zhí)行逆二進制化以恢復(fù)第一坐標(biāo)分量,并對第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串執(zhí)行逆二進制化以恢復(fù)第二坐標(biāo)分量。
[0109]根據(jù)本發(fā)明的上述實施例,最后有效系數(shù)的位置被分類為前綴比特串和后綴比特串,并且應(yīng)用了相同算術(shù)編碼方法的比特串被構(gòu)造為將被順序處理的組。通過使用上下文建模來對前綴比特串進行算術(shù)編碼和解碼,并按照旁路模式對后綴比特串進行算術(shù)編碼和解碼而不使用上下文建模。因此,與通過僅使用上下文建模來對最后有效系數(shù)的位置進行算術(shù)編碼和解碼的情況相比,減小了計算量,從而可提高算術(shù)編碼和解碼的處理速度。
[0110]如上所述,在根據(jù)本實施例的視頻編碼設(shè)備10和視頻解碼設(shè)備90中,通過將視頻數(shù)據(jù)劃分為具有樹結(jié)構(gòu)的編碼單元來獲得塊,并且預(yù)測單元被用于對編碼單元進行預(yù)測,變換單元用于對編碼單元進行變換。以下,將參照以下圖11到圖23來描述基于具有樹結(jié)構(gòu)的編碼單元、預(yù)測單元和變換單元的視頻編碼方法和設(shè)備以及視頻解碼方法和設(shè)備。
[0111]圖11是根據(jù)本發(fā)明的實施例的視頻編碼設(shè)備100的框圖。
[0112]視頻編碼設(shè)備100包括分層編碼器110和熵編碼器120。
[0113]分層編碼器110劃分被編碼為預(yù)定尺寸的數(shù)據(jù)單元的當(dāng)前畫面,以在每個數(shù)據(jù)單元中執(zhí)行編碼操作。具體地,分層編碼器110可基于作為最大尺寸的編碼單元的最大編碼單元來劃分當(dāng)前畫面。根據(jù)本發(fā)明的實施例的最大編碼單元可以是尺寸為32X32、64X64、128X 128、256X 256等的數(shù)據(jù)單元,其中,數(shù)據(jù)單元的形狀是寬度和高度為2的若干次方的正方形。
[0114]可用最大尺寸和深度來表征根據(jù)本發(fā)明的實施例的編碼單元。所述深度表示編碼單元在空間上從最大編碼單元被劃分的次數(shù),并且隨著深度加深,可從最大編碼單元到最小編碼單元劃分根據(jù)深度的較深層編碼單元。最大編碼單元的深度是最高深度,最小編碼單元的深度是最低深度。由于與每個深度相應(yīng)的編碼單元的尺寸隨著最大編碼單元的深度加深而減小,因此與更高深度相應(yīng)的編碼單元可包括多個與更低深度相應(yīng)的編碼單元。
[0115]如上所述,當(dāng)前畫面的圖像數(shù)據(jù)根據(jù)編碼單元的最大尺寸被劃分成最大編碼單元,每個最大編碼單元可包括根據(jù)深度被劃分的較深層編碼單元。由于根據(jù)本發(fā)明的實施例的最大編碼單元根據(jù)深度被劃分,因此在最大編碼單元中包括的空間域的圖像數(shù)據(jù)可根據(jù)深度被分層地劃分。
[0116]可預(yù)先確定編碼單元的最大深度和最大尺寸,其中,編碼單元的最大深度和最大尺寸限制最大編碼單元的高度和寬度被分層地劃分的總次數(shù)。
[0117]分層編碼器110對通過根據(jù)深度劃分最大編碼單元的區(qū)域而獲得的至少一個劃分區(qū)域進行編碼,并根據(jù)所述至少一個劃分區(qū)域來確定用于輸出最終編碼的圖像數(shù)據(jù)的深度。換句話說,分層編碼器110通過根據(jù)當(dāng)前畫面的最大編碼單元以根據(jù)深度的較深層編碼單元對圖像數(shù)據(jù)進行編碼并選擇具有最小編碼誤差的深度來確定編碼深度。確定的編碼深度和根據(jù)確定的編碼深度的編碼的圖像數(shù)據(jù)被輸出到熵編碼器120。
[0118]基于與等于或小于最大深度的至少一個深度相應(yīng)的較深層編碼單元來對在最大編碼單元中的圖像數(shù)據(jù)進行編碼,并基于每個較深層編碼單元來對編碼圖像數(shù)據(jù)的結(jié)果進行比較??稍趯^深層編碼單元的編碼誤差進行比較之后選擇具有最小編碼誤差的深度??舍槍γ總€最大編碼單元選擇至少一個編碼深度。
[0119]隨著編碼單元根據(jù)深度被分層地劃分以及編碼單元的數(shù)量增加,最大編碼單元的尺寸被劃分。此外,即使在一個最大編碼單元中編碼單元與相同深度相應(yīng),也通過分別測量每個編碼單元的圖像數(shù)據(jù)的編碼誤差來確定是否將與相同深度相應(yīng)的每個編碼單元劃分到更低深度。因此,即使當(dāng)圖像數(shù)據(jù)被包括在一個最大編碼單元中時,圖像數(shù)據(jù)被劃分為根據(jù)深度的區(qū)域并且在一個最大編碼單元中編碼誤差可根據(jù)區(qū)域而不同,從而在圖像數(shù)據(jù)中編碼深度可根據(jù)區(qū)域而不同。因此,可在一個最大編碼單元中確定一個或更多個編碼深度,并可根據(jù)至少一個編碼深度的編碼單元來劃分最大編碼單元的圖像數(shù)據(jù)。
[0120]因此,分層編碼器110可確定在最大編碼單元中包括的具有樹結(jié)構(gòu)的編碼單元。根據(jù)本發(fā)明的實施例的“具有樹結(jié)構(gòu)的編碼單元”包括在最大編碼單元中包括的所有較深層編碼單元中的與被確定為編碼深度的深度相應(yīng)的編碼單元??稍谧畲缶幋a單元的相同區(qū)域中根據(jù)深度來分層地確定編碼深度的編碼單元,并可在不同區(qū)域中獨立地確定編碼深度的編碼單元。類似地,當(dāng)前區(qū)域中的編碼深度可獨立于另一區(qū)域中的編碼深度被確定。
[0121]根據(jù)本發(fā)明的實施例的最大深度是與從最大編碼單元到最小編碼單元執(zhí)行的劃分次數(shù)相關(guān)的索引。根據(jù)本發(fā)明的實施例的第一最大深度可表示從最大編碼單元到最小編碼單元執(zhí)行的劃分總次數(shù)。根據(jù)本發(fā)明的實施例的第二最大深度可表示從最大編碼單元到最小編碼單元的總深度級數(shù)。例如,當(dāng)最大編碼單元的深度是O時,最大編碼單元被劃分一次的編碼單元的深度可設(shè)置為1,并且最大編碼單元被劃分兩次的編碼單元的深度可設(shè)置為2。這里,如果最小編碼單元是最大編碼單元被劃分四次的編碼單元,則存在深度0、1、2、3和4的5個深度級,從而第一最大深度可設(shè)置為4,第二最大深度可設(shè)置為5。
[0122]可根據(jù)最大編碼單元來執(zhí)行預(yù)測編碼和變換。還根據(jù)最大編碼單元,基于根據(jù)等于最大深度的深度或小于最大深度的深度的較深層編碼單元來執(zhí)行預(yù)測編碼和變換。
[0123]由于每當(dāng)最大編碼單元根據(jù)深度被劃分時較深層編碼單元的數(shù)量增加,因此對隨著深度加深而產(chǎn)生的所有較深層編碼單元執(zhí)行包括預(yù)測編碼和變換的編碼。為了方便描述,現(xiàn)在將基于最大編碼單元中的當(dāng)前深度的編碼單元來描述預(yù)測編碼和變換。
[0124]視頻編碼設(shè)備100可不同地選擇用于對圖像數(shù)據(jù)進行編碼的數(shù)據(jù)單元的尺寸或形狀。為了對圖像數(shù)據(jù)進行編碼,執(zhí)行諸如預(yù)測編碼、變換和熵編碼的操作,此時,可針對所有操作都使用相同的數(shù)據(jù)單元,或者可針對每個操作使用不同的數(shù)據(jù)單元。[0125]例如,視頻編碼設(shè)備100不僅可選擇用于對圖像數(shù)據(jù)進行編碼的編碼單元,而且可選擇與編碼單元不同的數(shù)據(jù)單元,以對編碼單元中的圖像數(shù)據(jù)執(zhí)行預(yù)測編碼。
[0126]為了在最大編碼單元中執(zhí)行預(yù)測編碼,可基于與編碼深度相應(yīng)的編碼單元(即,基于不再被劃分成與更低深度相應(yīng)的編碼單元的編碼單元)執(zhí)行預(yù)測編碼。在下文中,現(xiàn)在將不再被劃分并變成用于預(yù)測編碼的基本單元的編碼單元稱為“預(yù)測單元”。通過劃分預(yù)測單元而獲得的分區(qū)可包括通過劃分預(yù)測單元的高度和寬度中的至少一個而獲得的預(yù)測單元或數(shù)據(jù)單元。
[0127]例如,當(dāng)2NX2N的編碼單元(其中,N是正整數(shù))不再被劃分并變成2NX2N的預(yù)測單元時,分區(qū)的尺寸可以是2NX2N、2NXN、NX2N或NXN。分區(qū)類型的示例包括通過對稱地劃分預(yù)測單元的高度或?qū)挾榷@得的對稱分區(qū)、通過非對稱地劃分預(yù)測單元的高度或?qū)挾?諸如l:n或n:l)而獲得的分區(qū)、通過幾何劃分預(yù)測單元而獲得的分區(qū)以及具有任意形狀的分區(qū)。
[0128]預(yù)測單元的預(yù)測模式可以是幀內(nèi)模式、幀間模式和跳過模式中的至少一種。例如,可對2N X 2N、2N X N、N X 2N或N X N的分區(qū)執(zhí)行幀內(nèi)模式或幀間模式。此外,可僅對2N X 2N的分區(qū)執(zhí)行跳過模式。可對編碼單元中的一個預(yù)測單元獨立地執(zhí)行編碼,從而選擇具有最小編碼誤差的預(yù)測模式。
[0129]視頻編碼設(shè)備100還可不僅基于用于對圖像數(shù)據(jù)進行編碼的編碼單元而且基于與所述編碼單元不同的數(shù)據(jù)單元對在編碼單元中的圖像數(shù)據(jù)執(zhí)行變換。
[0130]為了在編碼單元中執(zhí)行變換,可基于具有小于或等于編碼單元的尺寸的數(shù)據(jù)單元來執(zhí)行變換。例如,用于變換的數(shù)據(jù)單元可包括用于幀內(nèi)模式的數(shù)據(jù)單元和用于幀間模式的數(shù)據(jù)單元。
[0131]現(xiàn)在將用作變換的基礎(chǔ)的數(shù)據(jù)單元稱為“變換單元”。類似于編碼單元,可將編碼單元中的變換單元遞歸地劃分成更小尺寸的區(qū)域,使得變換單元可以以區(qū)域為單位被獨立地確定。因此,可基于變換深度根據(jù)具有樹結(jié)構(gòu)的變換單元來劃分編碼單元中的殘差數(shù)據(jù)。
[0132]也可在變換單元中設(shè)置變換深度,其中,變換深度指示通過劃分編碼單元的高度和寬度以達(dá)到變換單元而執(zhí)行劃分的次數(shù)。例如,在2NX2N的當(dāng)前編碼單元中,當(dāng)變換單元的尺寸是2NX2N時,變換深度可以是0,當(dāng)變換單元的尺寸是NXN時,變換深度可以是1,并且當(dāng)變換單元的尺寸是N/2XN/2時,變換深度可以是2。也就是說,也可根據(jù)變換深度來設(shè)置具有樹結(jié)構(gòu)的變換單元。
[0133]根據(jù)與編碼深度相應(yīng)的編碼單元的編碼信息不僅需要關(guān)于編碼深度的信息而且需要關(guān)于與預(yù)測編碼和變換相關(guān)的信息。因此,分層編碼器110不僅確定具有最小編碼誤差的編碼深度,還確定預(yù)測單元中的分區(qū)類型、根據(jù)預(yù)測單元的預(yù)測模式以及用于變換的變換單元的尺寸。
[0134]下面將詳細(xì)描述根據(jù)本發(fā)明的實施例的在最大編碼單元中根據(jù)樹結(jié)構(gòu)的編碼單元以及確定分區(qū)的方法。
[0135]分層編碼器110可通過使用基于拉格朗日乘子的率失真優(yōu)化來測量根據(jù)深度的較深層編碼單元的編碼誤差。
[0136]熵編碼器120將基于由分層編碼器110確定的至少一個編碼深度而編碼的最大編碼單元的圖像數(shù)據(jù)、以及關(guān)于根據(jù)編碼深度的編碼模式的信息輸出在比特流中??赏ㄟ^對圖像的殘差數(shù)據(jù)進行編碼來獲得編碼的圖像數(shù)據(jù)。關(guān)于根據(jù)編碼深度的編碼模式的信息可包括關(guān)于編碼深度、關(guān)于預(yù)測單元中的分區(qū)類型、預(yù)測模式以及變換單元的尺寸的信息。
[0137]可通過使用根據(jù)深度的劃分信息來定義關(guān)于編碼深度的信息,所述劃分信息指示是否對更低深度而不是當(dāng)前深度的編碼單元執(zhí)行編碼。如果當(dāng)前編碼單元的當(dāng)前深度是編碼深度,則當(dāng)前編碼單元中的圖像數(shù)據(jù)被編碼并輸出,從而劃分信息可被定義為不將當(dāng)前編碼單元劃分到更低深度??蛇x地,如果當(dāng)前編碼單元的當(dāng)前深度不是編碼深度,則對更低深度的編碼單元執(zhí)行編碼,從而劃分信息可被定義為劃分當(dāng)前編碼單元以獲得更低深度的編碼單元。
[0138]如果當(dāng)前深度不是編碼深度,則對被劃分成更低深度的編碼單元的編碼單元執(zhí)行編碼。由于在當(dāng)前深度的一個編碼單元中存在更低深度的至少一個編碼單元,因此對更低深度的每個編碼單元重復(fù)地執(zhí)行編碼,從而可針對具有相同深度的編碼單元遞歸地執(zhí)行編碼。
[0139]由于針對一個最大編碼單元確定具有樹結(jié)構(gòu)的編碼單元,并且針對編碼深度的編碼單元確定關(guān)于至少一種編碼模式的信息,因此可針對一個最大編碼單元確定關(guān)于至少一種編碼模式的信息。此外,由于圖像數(shù)據(jù)根據(jù)深度被分層地劃分,因此最大編碼單元的圖像數(shù)據(jù)的編碼深度可根據(jù)位置而不同,從而可針對圖像數(shù)據(jù)設(shè)置關(guān)于編碼深度和編碼模式的信息。
[0140]因此,熵編碼器120可將關(guān)于相應(yīng)編碼深度和編碼模式的編碼信息分配給在最大編碼單元中包括的編碼單元、預(yù)測單元和最小單元中的至少一個。
[0141]根據(jù)本發(fā)明的實施例的最小單元是通過將構(gòu)成最低深度的最小編碼單元劃分成4份而獲得的矩形數(shù)據(jù)單元。可選地,最小單元可以是可在最大編碼單元中所包括的所有的編碼單元、預(yù)測單元、分區(qū)單元和變換單元中包括的最大的矩形數(shù)據(jù)單元。
[0142]例如,可將通過熵編碼器120輸出的編碼信息分類為根據(jù)編碼單元的編碼信息和根據(jù)預(yù)測單元的編碼信息。根據(jù)編碼單元的編碼信息可包括關(guān)于預(yù)測模式和關(guān)于分區(qū)的尺寸的信息。根據(jù)預(yù)測單元的編碼信息可包括關(guān)于估計的幀間模式的方向的信息、關(guān)于幀間模式的參考圖像索引的信息、關(guān)于運動矢量的信息、關(guān)于幀內(nèi)模式的色度分量的信息以及關(guān)于幀內(nèi)模式的插值方法的信息。此外,可將關(guān)于根據(jù)畫面、條帶或GOP定義的編碼單元的最大尺寸的信息以及關(guān)于最大深度的信息插入到比特流的頭中。
[0143]在視頻編碼設(shè)備100中,較深層編碼單元可以是通過將作為上面一層的更高深度的編碼單元的高度或?qū)挾瘸?而獲得的編碼單元。換句話說,當(dāng)當(dāng)前深度的編碼單元的尺寸是2NX 2N時,更低深度的編碼單元的尺寸是NXN。此外,尺寸為2NX 2N的當(dāng)前深度的編碼單元可包括最多4個更低深度的尺寸是NXN的編碼單元。
[0144]因此,視頻編碼設(shè)備10可基于考慮當(dāng)前畫面的特性而確定的最大編碼單元的尺寸和最大深度,通過針對每個最大編碼單元確定具有最佳形狀和最佳尺寸的編碼單元,來形成具有樹結(jié)構(gòu)的編碼單元。此外,由于通過使用各種預(yù)測模式和變換中的任意一種來對每個最大編碼單元執(zhí)行編碼,因此可考慮各種圖像尺寸的編碼單元的特性來確定最佳編碼模式。
[0145]因此,如果以傳統(tǒng)宏塊來對具有高分辨率或大數(shù)據(jù)量的圖像進行編碼,則每個畫面的宏塊數(shù)量過度增加。因此,針對每個宏塊產(chǎn)生的壓縮信息的條數(shù)增加,從而難以發(fā)送壓縮信息,并且數(shù)據(jù)壓縮效率降低。然而,由于在考慮圖像的尺寸時增加編碼單元的最大尺寸,同時在考慮圖像的特性時調(diào)整編碼單元,因此可通過使用視頻編碼設(shè)備100提高圖像壓縮效率。
[0146]圖12是根據(jù)本發(fā)明的實施例的視頻解碼設(shè)備200的框圖。
[0147]視頻解碼設(shè)備200包括語法元素提取器210、熵解碼器220以及分層解碼器230。針對視頻解碼設(shè)備200的各種操作的各種術(shù)語(諸如編碼單元、深度、預(yù)測單元、變換單元以及關(guān)于各種編碼模式的信息)的定義與參照圖11和視頻編碼設(shè)備100描述的術(shù)語相同。
[0148]語法元素提取器210接收并解析編碼視頻的比特流。熵解碼器220針對每個編碼單元從解析的比特流提取編碼的圖像數(shù)據(jù),并將提取的圖像數(shù)據(jù)輸出到分層解碼器230,其中,編碼單元具有根據(jù)每個最大編碼單元的樹結(jié)構(gòu)。
[0149]此外,熵解碼器220從解析的比特流提取根據(jù)每個最大編碼單元的具有樹結(jié)構(gòu)的編碼單元的關(guān)于編碼深度和編碼模式的信息、顏色分量信息和預(yù)測模式信息。提取的關(guān)于編碼深度和編碼模式的信息被輸出到分層解碼器230。換句話說,將比特流中的圖像數(shù)據(jù)劃分成最大編碼單元,使得分層解碼器230針對每個最大編碼單元對圖像數(shù)據(jù)進行解碼。
[0150]可針對通過在編碼終端(如本實施例的視頻編碼設(shè)備100)根據(jù)最大編碼單元和編碼深度在每個編碼單元中重復(fù)地執(zhí)行編碼而被確定為產(chǎn)生最小編碼誤差的關(guān)于編碼深度和編碼模式的信息來設(shè)置由熵解碼器220提取的關(guān)于根據(jù)最大編碼單元的編碼深度和編碼模式的信息。因此,視頻解碼設(shè)備200可通過根據(jù)產(chǎn)生最小編碼誤差的編碼方法對數(shù)據(jù)進行解碼來恢復(fù)圖像。
[0151]由于關(guān)于編碼深度和編碼模式的編碼信息可被分配給在相應(yīng)編碼單元、預(yù)測單元和最小單元中的預(yù)定數(shù)據(jù)單元,因此熵解碼器220可根據(jù)預(yù)定數(shù)據(jù)單元來提取關(guān)于編碼深度和編碼模式的信息。如果在每個預(yù)定數(shù)據(jù)單元中記錄關(guān)于相應(yīng)最大編碼單元的編碼深度和編碼模式的信息,則關(guān)于編碼深度和編碼模式的相同信息被分配的預(yù)定數(shù)據(jù)單元可被推斷為在同一的最大編碼單元中包括的數(shù)據(jù)單元。
[0152]分層解碼器230通過基于關(guān)于根據(jù)最大編碼單元的編碼深度和編碼模式的信息來對每個最大編碼單元中的圖像數(shù)據(jù)進行解碼以恢復(fù)當(dāng)前畫面。換句話說,分層解碼器230可基于提取的關(guān)于針對在每個最大編碼單元中包括的具有樹結(jié)構(gòu)的編碼單元之中的每個編碼單元的分區(qū)類型、預(yù)測模式和變換單元的信息,來對編碼的圖像數(shù)據(jù)進行解碼。解碼處理可包括預(yù)測和逆變換,所述預(yù)測包括幀內(nèi)預(yù)測和運動補償。可根據(jù)逆正交變換或逆整數(shù)變換的方法來執(zhí)行逆變換。
[0153]分層解碼器230可基于關(guān)于根據(jù)編碼深度的編碼單元的預(yù)測單元的分區(qū)類型和預(yù)測模式的信息,根據(jù)每個編碼單元的分區(qū)和預(yù)測模式來執(zhí)行幀內(nèi)預(yù)測或運動補償。
[0154]此外,分層解碼器230可以基于關(guān)于根據(jù)編碼深度的編碼單元的變換單元的尺寸的信息,根據(jù)編碼單元中的每個變換單元來執(zhí)行逆變換,以根據(jù)最大編碼單元執(zhí)行逆變換。
[0155]分層解碼器230可根據(jù)深度通過使用劃分信息來確定當(dāng)前最大編碼單元的至少一個編碼深度。如果劃分信息表示圖像數(shù)據(jù)在當(dāng)前深度下不再被劃分,則當(dāng)前深度是編碼深度。因此,分層解碼器230可通過使用關(guān)于針對與編碼深度相應(yīng)的每個編碼單元的預(yù)測單元的分區(qū)類型、預(yù)測模式和變換單元的尺寸的信息,對當(dāng)前最大編碼單元中的與每個編碼深度相應(yīng)的至少一個編碼單元的編碼數(shù)據(jù)進行解碼,并輸出當(dāng)前最大編碼單元的圖像數(shù)據(jù)。
[0156]換句話說,通過觀察針對在編碼單元、預(yù)測單元和最小單元之中的預(yù)定數(shù)據(jù)單元而分配的編碼信息集來收集包含包括相同劃分信息的編碼信息的數(shù)據(jù)單元,收集的數(shù)據(jù)單元可被認(rèn)為是將由分層解碼器230以相同編碼模式解碼的一個數(shù)據(jù)單元。
[0157]視頻解碼設(shè)備200可獲得關(guān)于當(dāng)針對每個最大編碼單元遞歸地執(zhí)行編碼時產(chǎn)生最小編碼誤差的至少一個編碼單元的信息,并可使用所述信息來對當(dāng)前畫面進行解碼。換句話說,可對在每個最大編碼單元中的被確定為最佳編碼單元的具有樹結(jié)構(gòu)的編碼單元進行解碼。
[0158]因此,即使圖像數(shù)據(jù)具有高分辨率和大數(shù)據(jù)量,仍可通過使用從編碼器接收到的關(guān)于最佳編碼模式的信息,經(jīng)由使用根據(jù)圖像數(shù)據(jù)的特性被自適應(yīng)地確定的編碼單元的尺寸和編碼模式來有效地解碼并恢復(fù)圖像數(shù)據(jù)。
[0159]現(xiàn)在將參照圖13至圖23來描述根據(jù)本發(fā)明的實施例的確定具有樹結(jié)構(gòu)的編碼單元、預(yù)測單元和變換單元的方法。
[0160]圖13是用于描述根據(jù)本發(fā)明的實施例的編碼單元的概念的示圖。
[0161]可以以寬度X高度來表示編碼單元的尺寸,并且編碼單元的尺寸可以是64X64、32X32,16X 16 和 8X8。64X64 的編碼單元可劃分成 64X64、64X32、32X64 或 32X32的分區(qū),32X32的編碼單元可劃分成32X32、32X16、16X32或16X16的分區(qū),16X16的編碼單元可劃分成16X16、16X8、8X16或8X8的分區(qū),并且8X8的編碼單元可劃分成8X8、8X4、4X8 或 4X4 的分區(qū)。
[0162]在視頻數(shù)據(jù)310中,分辨率是1920 X 1080,編碼單元的最大尺寸是64,最大深度是
2。在視頻數(shù)據(jù)320中,分辨率是1920 X 1080,編碼單元的最大尺寸是64,最大深度是3。在視頻數(shù)據(jù)330中,分辨率是352X288,編碼單元的最大尺寸是16,最大深度是I。圖13中所示的最大深度表示從最大編碼單元到最小編碼單元的劃分總次數(shù)。
[0163]如果分辨率高或數(shù)據(jù)量大,則編碼單元的最大尺寸可以是大的,以便不僅增加編碼效率還準(zhǔn)確地反映圖像的特性。因此,具有比視頻數(shù)據(jù)330高的分辨率的視頻數(shù)據(jù)310和320的編碼單元的最大尺寸可以是64。
[0164]由于視頻數(shù)據(jù)310的最大深度是2,因此視頻數(shù)據(jù)310的編碼單元315可包括具有64的長軸尺寸的最大編碼單元,以及由于通過劃分兩次最大編碼單元將深度加深至二層而具有32和16的長軸尺寸的編碼單元。同時,由于視頻數(shù)據(jù)330的最大深度是1,因此視頻數(shù)據(jù)330的編碼單元335可包括具有16的長軸尺寸的最大編碼單元,以及由于通過劃分一次最大編碼單元將深度加深至一層而具有8的長軸尺寸的編碼單元。
[0165]由于視頻數(shù)據(jù)320的最大深度是3,因此視頻數(shù)據(jù)320的編碼單元325可包括具有64的長軸尺寸的最大編碼單元,以及由于通過劃分三次最大編碼單元將深度加深至3層而具有32、16和8的長軸尺寸的編碼單元。隨著深度加深,可精確地表示詳細(xì)信息。
[0166]圖14是根據(jù)本發(fā)明的實施例的基于分層結(jié)構(gòu)的編碼單元的圖像編碼設(shè)備的框圖。
[0167]幀內(nèi)預(yù)測器410在當(dāng)前幀405中以幀內(nèi)模式對編碼單元執(zhí)行幀內(nèi)預(yù)測,運動估計器420和運動補償器425通過使用當(dāng)前幀405和參考幀495在當(dāng)前幀405中以幀間模式對編碼單元執(zhí)行幀間估計和運動補償。[0168]從幀內(nèi)預(yù)測器410、運動估計器420和運動補償器425輸出的數(shù)據(jù)通過變換器430和量化器440被輸出為被量化的變換系數(shù)。被量化的變換系數(shù)通過反量化器460和逆變換器470被恢復(fù)為空間域中的數(shù)據(jù),并且空間域中的恢復(fù)的數(shù)據(jù)在通過去塊單元480和環(huán)路濾波單元490被后處理之后被輸出為參考幀495。被量化的變換系數(shù)可通過熵編碼器450被輸出為比特流455。
[0169]為了使圖像編碼器400應(yīng)用在視頻編碼設(shè)備100中,圖像編碼器400的所有元件(即,幀內(nèi)預(yù)測器410、運動估計器420、運動補償器425、變換器430、量化器440、熵編碼器450、反量化器460、逆變換器470、去塊單元480和環(huán)路濾波單元490)在考慮每個最大編碼單元的最大深度時基于在具有樹結(jié)構(gòu)的編碼單元中的每個編碼單元執(zhí)行操作。
[0170]具體地,幀內(nèi)預(yù)測器410、運動估計器420和運動補償器425在考慮當(dāng)前最大編碼單元的最大尺寸和最大深度時確定在具有樹結(jié)構(gòu)的編碼單元中的每個編碼單元的分區(qū)和預(yù)測模式,并且變換器430確定在具有樹結(jié)構(gòu)的編碼單元中的每個編碼單元中的變換單元的尺寸。
[0171]圖15是根據(jù)本發(fā)明的實施例的基于分層結(jié)構(gòu)的編碼單元的圖像解碼設(shè)備的框圖。
[0172]解析器510從比特流505對將被解碼的編碼圖像數(shù)據(jù)和解碼所需的關(guān)于編碼的信息進行解析。編碼的圖像數(shù)據(jù)通過熵解碼器520和反量化器530被輸出為被反量化的數(shù)據(jù),被反量化的數(shù)據(jù)通過逆變換器540被恢復(fù)成空間域中的圖像數(shù)據(jù)。
[0173]幀內(nèi)預(yù)測器550針對空間域中的圖像數(shù)據(jù),以幀內(nèi)模式對編碼單元執(zhí)行幀內(nèi)預(yù)測,運動補償器560通過使用參考幀585以幀間模式對編碼單元執(zhí)行運動補償。
[0174]經(jīng)過幀內(nèi)預(yù)測器550和運動補償器560的空間域中的圖像數(shù)據(jù)可在通過去塊單元570和環(huán)路濾波單元580被后處理之后被輸出為恢復(fù)幀595。此外,通過去塊單元570和環(huán)路濾波單元580被后處理的圖像數(shù)據(jù)可被輸出為參考幀585。
[0175]為了使圖像解碼器500被應(yīng)用于視頻解碼設(shè)備200,圖像解碼器500的所有元件(即,解析器510、熵解碼器520、反量化器530、逆變換器540、幀內(nèi)預(yù)測器550、運動補償器560、去塊單元570和環(huán)路濾波單元580)針對每個最大編碼單元基于具有樹結(jié)構(gòu)的編碼單元執(zhí)行操作。
[0176]具體地,幀內(nèi)預(yù)測器550和運動補償器560基于針對每個具有樹結(jié)構(gòu)的編碼單元的分區(qū)和預(yù)測模式來執(zhí)行操作,逆變換器540基于針對每個編碼單元的變換單元的尺寸來執(zhí)行操作。
[0177]圖16是示出根據(jù)本發(fā)明的實施例的根據(jù)深度的較深層編碼單元和分區(qū)的示圖。
[0178]視頻編碼設(shè)備100和視頻解碼設(shè)備200使用分層編碼單元以考慮圖像的特性。編碼單元的最大高度、最大寬度和最大深度可根據(jù)圖像的特性被自適應(yīng)地確定,或可被用戶不同地設(shè)置??筛鶕?jù)編碼單元的預(yù)定最大尺寸來確定根據(jù)深度的較深層編碼單元的尺寸。
[0179]在編碼單元的分層結(jié)構(gòu)600中,根據(jù)本發(fā)明的實施例,編碼單元的最大高度和最大寬度均為64,最大深度是4。由于深度沿著分層結(jié)構(gòu)600的垂直軸加深,因此較深層編碼單元的高度和寬度均被劃分。此外,沿著分層結(jié)構(gòu)600的水平軸示出了作為對每個較深層編碼單元進行預(yù)測編碼的基礎(chǔ)的預(yù)測單元和分區(qū)。
[0180]換句話說,編碼單元610是分層結(jié)構(gòu)600中的最大編碼單元,其中,深度是0,尺寸(即,高度乘以寬度)是64X64。深度沿著垂直軸加深,存在尺寸為32X32和深度為I的編碼單元620、尺寸為16X16和深度為2的編碼單元630、尺寸為8X8和深度為3的編碼單元640以及尺寸為4X4和深度為4的編碼單元650。尺寸為4X4和深度為4的編碼單元650是最小編碼單元。
[0181]編碼單元的預(yù)測單元和分區(qū)根據(jù)每個深度沿著水平軸被排列。換句話說,如果尺寸為64 X 64和深度為O的編碼單元610是預(yù)測單元,則可將預(yù)測單元劃分成包括在編碼單元610中的分區(qū),即,尺寸為64X64的分區(qū)610、尺寸為64X32的分區(qū)612、尺寸為32X64的分區(qū)614或尺寸為32X32的分區(qū)616。
[0182]類似地,可將尺寸為32X32和深度為I的編碼單元620的預(yù)測單元劃分成包括在編碼單元620中的分區(qū),即,尺寸為32X32的分區(qū)620、尺寸為32X16的分區(qū)622、尺寸為16X32的分區(qū)624和尺寸為16X16的分區(qū)626。
[0183]類似地,可將尺寸為16 X 16和深度為2的編碼單元630的預(yù)測單元劃分成包括在編碼單元630中的分區(qū),即,包括在編碼單元630中的尺寸為16X16的分區(qū)、尺寸為16X8的分區(qū)632、尺寸為8X16的分區(qū)634和尺寸為8X8的分區(qū)636。
[0184]類似地,可將尺寸為8X8和深度為3的編碼單元640的預(yù)測單元劃分成包括在編碼單元640中的分區(qū),即,包括在編碼單元640中的尺寸為8X8的分區(qū)、尺寸為8X4的分區(qū)642、尺寸為4X8的分區(qū)644和尺寸為4X4的分區(qū)646。
[0185]尺寸為4X4和深度為4的編碼單元650是最小編碼單元和最低深度的編碼單元。編碼單元650的預(yù)測單元僅被分配給尺寸為4X4的分區(qū)。
[0186]為了確定構(gòu)成最大編碼單元610的編碼單元的至少一個編碼深度,視頻編碼設(shè)備100的編碼單元確定器120針對包括在最大編碼單元610中的與每個深度相應(yīng)的編碼單元執(zhí)行編碼。
[0187]包括相同范圍和相同尺寸的數(shù)據(jù)的根據(jù)深度的較深層編碼單元的數(shù)量隨著深度加深而增加。例如,與深度2相應(yīng)的四個編碼單元需要覆蓋包括在與深度I相應(yīng)的一個編碼單元中的數(shù)據(jù)。因此,為了根據(jù)深度比較相同數(shù)據(jù)的編碼結(jié)果,與深度I相應(yīng)的編碼單元和與深度2相應(yīng)的四個編碼單元均被編碼。
[0188]為了針對深度中的當(dāng)前深度執(zhí)行編碼,可沿著分層結(jié)構(gòu)600的水平軸,通過針對與當(dāng)前深度相應(yīng)的編碼單元中的每個預(yù)測單元執(zhí)行編碼來選擇對于當(dāng)前深度的最小編碼誤差。可選地,可通過隨著深度沿分層結(jié)構(gòu)600的垂直軸加深來針對每個深度執(zhí)行編碼并比較根據(jù)深度的最小編碼誤差,來搜索最小編碼誤差??蓪⒕幋a單元610中具有最小編碼誤差的深度和分區(qū)選擇為編碼單元610的編碼深度和分區(qū)類型。
[0189]圖17是用于描述根據(jù)本發(fā)明的實施例的在編碼單元710和變換單元720之間的關(guān)系的不圖。
[0190]視頻編碼設(shè)備100或視頻解碼設(shè)備200針對每個最大編碼單元根據(jù)具有小于或等于最大編碼單元的尺寸的編碼單元對圖像進行編碼或解碼。可基于不大于相應(yīng)編碼單元的數(shù)據(jù)單元來選擇在編碼期間用于變換的變換單元的尺寸。
[0191]例如,在視頻編碼設(shè)備100或視頻解碼設(shè)備200中,如果編碼單元710的尺寸是64X64,則可通過使用尺寸為32X32的變換單元720來執(zhí)行變換。
[0192]此外,可通過對小于64X64的尺寸為32X32、16X 16、8X8和4X4的每個變換單元執(zhí)行變換來對尺寸為64X64的編碼單元710的數(shù)據(jù)進行編碼,然后可選擇具有最小編碼誤差的變換單元。
[0193]圖18是用于描述根據(jù)本發(fā)明的實施例的與編碼深度相應(yīng)的編碼單元的編碼信息的示圖。
[0194]視頻編碼設(shè)備100的輸出單元130可將針對與編碼深度相應(yīng)的每個編碼單元的關(guān)于分區(qū)類型的信息800、關(guān)于預(yù)測模式的信息810以及關(guān)于變換單元的尺寸的信息820編碼為關(guān)于編碼模式的信息并進行發(fā)送。
[0195]信息800指示關(guān)于通過劃分當(dāng)前編碼單元的預(yù)測單元而獲得的分區(qū)的形狀的信息,其中,所述分區(qū)是用于對當(dāng)前編碼單元進行預(yù)測編碼的數(shù)據(jù)單元。例如,可將尺寸為2NX2N的當(dāng)前編碼單元CU_0劃分成尺寸為2NX2N的分區(qū)802、尺寸為2NXN的分區(qū)804、尺寸為NX 2N的分區(qū)806以及尺寸為NXN的分區(qū)808中的任何一種。這里,關(guān)于分區(qū)類型的信息800被設(shè)置來指示尺寸為2NXN的分區(qū)804、尺寸為NX 2N的分區(qū)806以及尺寸為NXN的分區(qū)808中的一種。
[0196]信息810指示每個分區(qū)的預(yù)測模式。例如,信息810可指示對由信息800指示的分區(qū)所執(zhí)行的預(yù)測編碼的模式,即,幀內(nèi)模式812、幀間模式814或跳過模式816。
[0197]信息820指示當(dāng)對當(dāng)前編碼單元執(zhí)行變換時所基于的變換單元。例如,變換單元可以是第一幀內(nèi)變換單元822、第二幀內(nèi)變換單元824、第一幀間變換單元826或第二幀間變換單元828。
[0198]視頻解碼設(shè)備200的圖像數(shù)據(jù)和編碼信息提取器220可根據(jù)每個較深層編碼單元提取并使用用于解碼的信息800、810和820。
[0199]圖19是根據(jù)本發(fā)明的實施例的根據(jù)深度的較深層編碼單元的示圖。
[0200]劃分信息可用來指示深度的改變。劃分信息指示當(dāng)前深度的編碼單元是否被劃分成更低深度的編碼單元。
[0201]用于對深度為O和尺寸為2N_0X2N_0的編碼單元900進行預(yù)測編碼的預(yù)測單元910可包括以下分區(qū)類型的分區(qū):尺寸為2N_0X2N_0的分區(qū)類型912、尺寸為2N_0XN_0的分區(qū)類型914、尺寸為N_0X2N_0的分區(qū)類型916和尺寸為Ν_0ΧΝ_0的分區(qū)類型918。圖19僅示出了通過對稱地劃分預(yù)測單元910而獲得的分區(qū)類型912至918,但是分區(qū)類型不限于此,并且預(yù)測單元910的分區(qū)可包括非對稱分區(qū)、具有預(yù)定形狀的分區(qū)和具有幾何形狀的分區(qū)。
[0202]根據(jù)每種分區(qū)類型,對尺寸為2N_0X2N_0的一個分區(qū)、尺寸為2N_0XN_0的兩個分區(qū)、尺寸為N_0X2N_0的兩個分區(qū)和尺寸為Ν_0ΧΝ_0的四個分區(qū)重復(fù)地執(zhí)行預(yù)測編碼??蓪Τ叽鐬?N_0 X 2N_0、N_0 X 2N_0、2N_0 X N_0和N_0 X N_0的分區(qū)執(zhí)行在幀內(nèi)模式和幀間模式下的預(yù)測編碼??蓛H對尺寸為2N_0X2N_0的分區(qū)執(zhí)行在跳過模式下的預(yù)測編碼。
[0203]如果在尺寸為2N_0X2N_0、2N_0XN_0和N_0X2N_0的分區(qū)類型912至916中的一個分區(qū)類型中編碼誤差最小,則可不將預(yù)測單元910劃分成更低深度。
[0204]如果在尺寸為Ν_0ΧΝ_0的分區(qū)類型918中編碼誤差最小,則深度從O改變到I以在操作920中劃分分區(qū)類型918,并對深度為2和尺寸為Ν_0ΧΝ_0的編碼單元930重復(fù)地執(zhí)行編碼來搜索最小編碼誤差。
[0205]用于對深度為I和尺寸為2N_1 X 2N_1 ( = Ν_0ΧN_0)的編碼單元930執(zhí)行預(yù)測編碼的預(yù)測單元940可包括以下分區(qū)類型的分區(qū):尺寸為2N_1X2N_1的分區(qū)類型942、尺寸為2N_1XN_1的分區(qū)類型944、尺寸為N_1X2N_1的分區(qū)類型946以及尺寸為N_1XN_1的分區(qū)類型948。
[0206]如果在尺寸為N_1 XN_1的分區(qū)類型948中編碼誤差最小,則深度從I改變到2以在操作950中劃分分區(qū)類型948,并對深度為2和尺寸為N_2XN_2的編碼單元960重復(fù)執(zhí)
行編碼來搜索最小編碼誤差。
[0207]當(dāng)最大深度是d時,根據(jù)每個深度的劃分操作可被執(zhí)行直到深度變成d-Ι,并且劃分信息可被編碼直到深度是O至d-2中的一個。換句話說,當(dāng)編碼被執(zhí)行直到在與d-2的深度相應(yīng)的編碼單元在操作970中被劃分之后深度是d-Ι時,用于對深度為d-Ι和尺寸為2N_(d-l) X2N_(d-l)的編碼單元980進行預(yù)測編碼的預(yù)測單元990可包括以下分區(qū)類型的分區(qū):尺寸為2N_(d-l)X2N(d-l)的分區(qū)類型992、尺寸為2N_(d-l)XN(d-l)的分區(qū)類型994、尺寸為N_(d-1) X2N(d-l)的分區(qū)類型996和尺寸為N_(d_l) XN(d_l)的分區(qū)類型998。
[0208]可對分區(qū)類型992至998中的尺寸為2N_(d_l) X2N_(d_l)的一個分區(qū)、尺寸為2N_(d-l) XN_(d-l)的兩個分區(qū)、尺寸為N_(d-1) X2N_(d-l)的兩個分區(qū)、尺寸為1(d-1) XN_(d-l)的四個分區(qū)重復(fù)地執(zhí)行預(yù)測編碼以搜索具有最小編碼誤差的分區(qū)類型。
[0209]即使當(dāng)尺寸為N_(d-1) XN_(d-l)的分區(qū)類型998具有最小編碼誤差時,由于最大深度是d,深度為d-Ι的編碼單元CU_(d-l)也不再被劃分到更低深度,對于構(gòu)成當(dāng)前最大編碼單元900的編碼單元的編碼深度被確定為d-Ι,并且當(dāng)前最大編碼單元900的分區(qū)類型可被確定為N_(d_l) X N (d-1)。此外,由于最大深度是d并且具有最低深度d_l的最小編碼單元980不再被劃分到更低深度,因此不設(shè)置針對最小編碼單元980的劃分信息。
[0210]數(shù)據(jù)單元999可以是用于當(dāng)前最大編碼單元的“最小單元”。根據(jù)本發(fā)明的實施例的最小單元可以是通過將最小編碼單元980劃分成4份而獲得的矩形數(shù)據(jù)單元。通過重復(fù)地執(zhí)行編碼,視頻編碼設(shè)備100可通過根據(jù)編碼單元900的深度比較編碼誤差來選擇具有最小編碼誤差的深度以確定編碼深度,并將相應(yīng)分區(qū)類型和預(yù)測模式設(shè)置為編碼深度的編碼模式。
[0211]因此,在所有深度I至d中比較根據(jù)深度的最小編碼誤差,可將具有最小編碼誤差的深度確定為編碼深度。編碼深度、預(yù)測單元的分區(qū)類型和預(yù)測模式可被編碼為關(guān)于編碼模式的信息并被發(fā)送。此外,由于編碼單元從深度O被劃分到編碼深度,因此僅將編碼深度的劃分信息設(shè)置成0,將排除編碼深度之外的深度的劃分信息設(shè)置到I。
[0212]視頻解碼設(shè)備200的圖像數(shù)據(jù)和編碼信息提取器220可提取并使用關(guān)于編碼單元900的編碼深度和預(yù)測單元的信息以對分區(qū)912進行解碼。視頻解碼設(shè)備200可通過使用根據(jù)深度的劃分信息將劃分信息是O的深度確定為編碼深度,并將關(guān)于相應(yīng)深度的編碼模式的信息用于解碼。
[0213]圖20至圖22是用于描述根據(jù)本發(fā)明的實施例的在編碼單元1010、預(yù)測單元1060和變換單兀1070之間的關(guān)系的不圖。
[0214]編碼單元1010是在最大編碼單元中與由視頻編碼設(shè)備100確定的編碼深度相應(yīng)的具有樹結(jié)構(gòu)的編碼單元。預(yù)測單元1060是編碼單元1010中的每個的預(yù)測單元的分區(qū),變換單元1070是編碼單元1010中的每個的變換單元。[0215]當(dāng)在編碼單元1010中最大編碼單元的深度是O時,編碼單元1012和1054的深度是 1,編碼單元 1014、1016、1018、1028、1050 和 1052 的深度是 2,編碼單元 1020、1022、1024、1026、1030、1032和1048的深度是3,編碼單元1040、1042、1044和1046的深度是4。
[0216]在預(yù)測單元1060中,通過劃分編碼單元來獲得一些編碼單元1014、1016、1022、1032、1048、1050、1052和1054。換句話說,在編碼單元1014、1022、1050和1054中的分區(qū)類型具有2NXN的尺寸,在編碼單元1016、1048和1052中的分區(qū)類型具有NX2N的尺寸,編碼單元1032的分區(qū)類型具有NXN的尺寸。編碼單元1010的預(yù)測單元和分區(qū)小于或等于每個編碼單元。
[0217]在小于編碼單元1052的數(shù)據(jù)單元中對變換單元1070中的編碼單元1052的圖像數(shù)據(jù)執(zhí)行變換或逆變換。此外,變換單元1070中的編碼單元1014、1016、1022、1032、1048、1050和1052在尺寸和形狀方面不同于預(yù)測單元1060中的編碼單元1014、1016、1022、1032、1048、1050和1052。換句話說,視頻編碼設(shè)備100和視頻解碼設(shè)備200可對相同編碼單元中的數(shù)據(jù)單元單獨地執(zhí)行幀內(nèi)預(yù)測、運動估計、運動補償、變換和逆變換。
[0218]因此,在最大編碼單元的每個區(qū)域中對具有分層結(jié)構(gòu)的編碼單元中的每個編碼單元遞歸地執(zhí)行編碼以確定最佳編碼單元,從而可獲得具有遞歸樹結(jié)構(gòu)的編碼單元。編碼信息可包括關(guān)于編碼單元的劃分信息、關(guān)于分區(qū)類型的信息、關(guān)于預(yù)測模式的信息和關(guān)于變換單元的尺寸的信息。表1示出可由視頻編碼設(shè)備100和視頻解碼設(shè)備200設(shè)置的編碼信肩、O
[0219]表1
【權(quán)利要求】
1.一種用于對視頻進行解碼的算術(shù)解碼方法,所述方法包括: 從接收的比特流獲得分別與第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串相應(yīng)的第一坐標(biāo)前綴語法元素和第一坐標(biāo)后綴語法元素,以及分別與第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串相應(yīng)的第二坐標(biāo)前綴語法元素和第二坐標(biāo)后綴語法元素,其中,通過基于根據(jù)當(dāng)前塊的尺寸確定的臨界值對當(dāng)前塊的最后有效系數(shù)的第一坐標(biāo)位置進行分類來獲得第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串,通過基于臨界值對最后有效系數(shù)的第二坐標(biāo)位置進行分類來獲得第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串; 通過按照第一算術(shù)解碼方法針對第一坐標(biāo)前綴語法元素和第二坐標(biāo)前綴語法元素順序地執(zhí)行算術(shù)解碼操作,以獲得第一坐標(biāo)前綴比特串和第二坐標(biāo)前綴比特串; 通過按照第二算術(shù)解碼方法針對第一坐標(biāo)后綴語法元素和第二坐標(biāo)后綴語法元素順序地執(zhí)行算術(shù)解碼操作,以獲得第一坐標(biāo)后綴比特串和第二坐標(biāo)后綴比特串;以及 通過對第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串執(zhí)行逆二進制化來恢復(fù)第一坐標(biāo)分量,并通過對第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串執(zhí)行逆二進制化來恢復(fù)第二坐標(biāo)分量。
2.如權(quán) 利要求1所述的方法,其中,當(dāng)假設(shè)當(dāng)前塊的寬度是w(其中,w是整數(shù)),當(dāng)前塊的高度是h (其中,h是整數(shù)),第一坐標(biāo)分量是最后有效系數(shù)的行位置X (其中,X是從O到(w-Ι)的整數(shù)),第二坐標(biāo)分量是最后有效系數(shù)的列位置y(其中,y是從O到(h-Ι)的整數(shù)),并且臨界值是th,在最后有效系數(shù)的行位置X等于或小于臨界值th的情況下,通過根據(jù)第一預(yù)定二進制化方法對行位置X執(zhí)行二進制化來獲得第一坐標(biāo)前綴比特串,并且在最后有效系數(shù)的行位置X超過臨界值th的情況下,通過根據(jù)第一二進制化方法對臨界值th執(zhí)行二進制化來獲得第一坐標(biāo)前綴比特串并且通過根據(jù)第二預(yù)定二進制化方法對值(x-th)執(zhí)行二進制化來獲得第一坐標(biāo)后綴比特串,以及 在最后有效系數(shù)的列位置I等于或小于臨界值th的情況下,通過根據(jù)第一二進制化方法對列位置I執(zhí)行二進制化來獲得第二坐標(biāo)前綴比特串,并且在最后有效系數(shù)的列位置I超過臨界值th的情況下,通過根據(jù)第一二進制化方法對臨界值th執(zhí)行二進制化來獲得第二坐標(biāo)前綴比特串并且通過根據(jù)第二二進制化方法對值(y-th)執(zhí)行二進制化來獲得第二坐標(biāo)后綴比特串。
3.如權(quán)利要求2所述的方法,其中,第一二進制化方法和第二二進制化方法分別是一元二進制化方法、截斷一元二進制化方法、指數(shù)哥倫布二進制化方法和固定長度二進制化方法中的一種。
4.如權(quán)利要求1所述的方法,其中,根據(jù)第一算術(shù)解碼方法執(zhí)行算術(shù)解碼的步驟包括:通過應(yīng)用根據(jù)上下文自適應(yīng)二進制算術(shù)編碼(CABAC)的上下文模型對第一坐標(biāo)前綴語法元素和第二坐標(biāo)前綴語法元素執(zhí)行算術(shù)解碼,來獲得第一坐標(biāo)前綴比特串和第二坐標(biāo)前綴比特串。
5.如權(quán)利要求4所述的方法,其中,所述上下文模型根據(jù)被預(yù)先分配到第一坐標(biāo)前綴比特串和第二坐標(biāo)前綴比特串中的每個比特的預(yù)定上下文索引而被確定。
6.如權(quán)利要求1所述的方法,其中,根據(jù)第二算術(shù)解碼方法執(zhí)行算術(shù)解碼的步驟包括:通過將旁路模式應(yīng)用到第一坐標(biāo)后綴語法元素和第二坐標(biāo)后綴語法元素,來獲得第一坐標(biāo)后綴比特串和第二坐標(biāo)后綴比特串。
7.如權(quán)利要求1所述的方法,其中,恢復(fù)的步驟包括: 按照預(yù)定二進制化方法對第一坐標(biāo)前綴比特串、第一坐標(biāo)后綴比特串、第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串執(zhí)行逆二進制化;以及 通過將逆二進制化的第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串相加來恢復(fù)第一坐標(biāo)分量,并通過將逆二進制化的第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串相加來恢復(fù)第二坐標(biāo)分量。
8.一種視頻解碼設(shè)備,包括: 解析器,從接收的比特流獲得分別與第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串相應(yīng)的第一坐標(biāo)前綴語法元素和第一坐標(biāo)后綴語法元素,以及分別與第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串相應(yīng)的第二坐標(biāo)前綴語法元素和第二坐標(biāo)后綴語法元素,其中,通過基于根據(jù)當(dāng)前塊的尺寸確定的臨界值對當(dāng)前塊的最后有效系數(shù)的第一坐標(biāo)位置進行分類來獲得第一坐標(biāo)如綴比特串和第一坐標(biāo)后綴比特串,基于臨界值對最后有效系數(shù)的第二坐標(biāo)位置進行分類來獲得第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串;以及 算術(shù)解碼器,通過按照第一算術(shù)解碼方法針對第一坐標(biāo)前綴語法元素和第二坐標(biāo)前綴語法元素順序地執(zhí)行算術(shù)解碼操作來獲得第一坐標(biāo)前綴比特串和第二坐標(biāo)前綴比特串,通過按照第二算術(shù)解碼方法針對第一坐標(biāo)后綴語法元素和第二坐標(biāo)后綴語法元素順序地執(zhí)行算術(shù)解碼操作來獲得第一坐標(biāo)后綴比特串和第二坐標(biāo)后綴比特串,通過對第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串執(zhí)行逆二進制化來恢復(fù)第一坐標(biāo)分量,并通過對第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串執(zhí)行逆二進制化來恢復(fù)第二坐標(biāo)分量。
9.一種用于對視 頻進行編碼的算術(shù)編碼方法,所述方法包括: 基于根據(jù)當(dāng)前塊的尺寸確定的臨界值,將當(dāng)前塊中的最后有效系數(shù)的位置的第一坐標(biāo)分量分類為第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串; 基于所述臨界值將最后有效系數(shù)的位置的第二坐標(biāo)分量分類為第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串; 按照第一算術(shù)編碼方法對第一坐標(biāo)前綴比特串和第二坐標(biāo)前綴比特串順序地執(zhí)行算術(shù)編碼;以及 按照第二算術(shù)編碼方法對第一坐標(biāo)后綴比特串和第二坐標(biāo)后綴比特串執(zhí)行算術(shù)編碼。
10.如權(quán)利要求9所述的方法,其中,當(dāng)假設(shè)當(dāng)前塊的寬度是w(其中,w是整數(shù)),當(dāng)前塊的高度是h (其中,h是整數(shù)),第一坐標(biāo)分量是最后有效系數(shù)的行位置X (其中,X是從O到(w-Ι)的整數(shù)),第二坐標(biāo)分量是最后有效系數(shù)的列位置y(其中,y是從O到(h-Ι)的整數(shù)),并且臨界值是th,所述分類的步驟包括: 在最后有效系數(shù)的行位置X等于或小于臨界值th的情況下,通過根據(jù)第一預(yù)定二進制化方法對行位置X執(zhí)行二進制化來將行位置X僅分類為第一坐標(biāo)前綴比特串,并且在最后有效系數(shù)的行位置X超過臨界值th的情況下,通過根據(jù)第一二進制化方法對臨界值th執(zhí)行二進制化來將行位置X分類為第一坐標(biāo)前綴比特串并且通過根據(jù)第二預(yù)定二進制化方法對值(x-th)執(zhí)行二進制化來將行位置X分類為第一坐標(biāo)后綴比特串;以及 在最后有效系數(shù)的列位置I等于或小于臨界值th的情況下,通過根據(jù)第一二進制化方法對列位置I執(zhí)行二進制化來將列位置I分類為第二坐標(biāo)前綴比特串,并且在最后有效系數(shù)的列位置I超過臨界值th的情況下,通過根據(jù)第一二進制化方法對臨界值th執(zhí)行二進制化來將列位置y分類為第二坐標(biāo)前綴比特串并且通過根據(jù)第二二進制化方法對值(y-th)執(zhí)行二進制化來將列位置y分類為第二坐標(biāo)后綴比特串。
11.如權(quán)利要求10所述的方法,其中,第一二進制化方法和第二二進制化方法分別是一元二進制化方法、截斷一元二進制化方法、指數(shù)哥倫布二進制化方法和固定長度二進制化方法中的一種。
12.如權(quán)利要求9所述的方法,其中,根據(jù)第一算術(shù)編碼方法執(zhí)行算術(shù)編碼的步驟包括:通過應(yīng)用根據(jù)上下文自適應(yīng)二進制算術(shù)編碼(CABAC)的上下文模型來對第一坐標(biāo)前綴比特串和第二坐標(biāo)前綴比特串執(zhí)行算術(shù)編碼。
13.如權(quán)利要求12所述的方法,其中,所述上下文模型根據(jù)被預(yù)先分配到第一坐標(biāo)前綴比特串和第二坐標(biāo)前綴比特串中的每個比特的預(yù)定上下文索引而被確定。
14.如權(quán)利要求9所 述的方法,其中,根據(jù)第二算術(shù)編碼方法執(zhí)行算術(shù)編碼的步驟包括:通過將旁路模式應(yīng)用到第一坐標(biāo)后綴比特串和第二坐標(biāo)后綴比特串來對第一坐標(biāo)后綴比特串和第二坐標(biāo)后綴比特串執(zhí)行算術(shù)編碼。
15.一種視頻編碼設(shè)備,包括: 圖像編碼器,對通過劃分視頻而獲得的塊執(zhí)行預(yù)測、變換和量化以產(chǎn)生塊的語法元素;以及 熵編碼器,基于根據(jù)當(dāng)前塊的尺寸確定的臨界值將當(dāng)前塊中的最后有效系數(shù)的位置的第一坐標(biāo)分量分類為第一坐標(biāo)前綴比特串和第一坐標(biāo)后綴比特串,基于所述臨界值將最后有效系數(shù)的位置的第二坐標(biāo)分量分類為第二坐標(biāo)前綴比特串和第二坐標(biāo)后綴比特串,按照第一算術(shù)編碼方法對第一坐標(biāo)前綴比特串和第二坐標(biāo)前綴比特串順序地執(zhí)行算術(shù)編碼,以及按照第二算術(shù)編碼方法對第一坐標(biāo)后綴比特串和第二坐標(biāo)后綴比特串執(zhí)行算術(shù)編碼。
【文檔編號】H04N19/91GK104041053SQ201280066398
【公開日】2014年9月10日 申請日期:2012年11月8日 優(yōu)先權(quán)日:2011年11月8日
【發(fā)明者】金壹求, 樸正輝 申請人:三星電子株式會社