專利名稱:規(guī)格化視覺品質(zhì)的比特率控制方法與裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種視頻編碼。更具體地,本發(fā)明涉及一種利用前置解碼器可用信息來控制比特率、從而在利用該前置解碼器基于小波的可伸縮(scalable)視頻編碼中最小化峰值信噪比(PSNR)方差的方法與裝置。
背景技術(shù):
可伸縮視頻編碼(其允許以各種解晰度、品質(zhì)以及時(shí)間等級(jí)(level)根據(jù)單個(gè)經(jīng)壓縮的比特流進(jìn)行部分解碼)被廣泛地認(rèn)為是一種異構(gòu)環(huán)境下的高效信號(hào)表示與傳送的有前途的技術(shù)。雖然MPEG-4細(xì)粒度可伸縮性(FGS)被確立為信噪比(SNR)與時(shí)間可伸縮視頻編碼標(biāo)準(zhǔn),但是許多基于小波的可伸縮視頻編碼方案已經(jīng)顯示出它們?cè)赟NR、空間與時(shí)間可伸縮性方面的潛力。關(guān)于MPEG-4FGS的詳細(xì)信息可以從Mr.W.Li發(fā)表的報(bào)告"Overview of finegranularity scalability in MPEG-4 video standard″(IEEE Trans.Circuits Syst.Video Technol.,vol.11,pp.301-317,Mar.2001)中獲得。
圖1為顯示基于現(xiàn)有的速率畸變(R-D)優(yōu)化技術(shù)的視頻編解碼器的總體配置的方框圖。視頻編解碼器100包含速率控制模塊130,其為每個(gè)編碼單元選擇最優(yōu)量化步階或者最優(yōu)比特量;編碼器110,其生成其帶寬受限的比特流40;以及解碼器120,其根據(jù)帶寬受限比特流40重構(gòu)圖像序列20。在現(xiàn)有技術(shù)中,只在編碼器110中進(jìn)行速率控制。
圖2為顯示根據(jù)現(xiàn)有技術(shù)的、基于小波的可伸縮視頻編解碼器的操作配置(operational configuration)的方框圖。
雖然速率控制算法一般會(huì)改進(jìn)R-D性能,但是現(xiàn)有方法都利用只可用于編碼階段的預(yù)測(cè)誤差信息,這暗示著速率控制應(yīng)該在編碼器210中進(jìn)行。對(duì)于要求完全可伸縮視頻編解碼器的大部分應(yīng)用,在考慮品質(zhì)、時(shí)間、與空間要求的同時(shí)編碼器210應(yīng)該生成足夠大的比特流35,以便前置解碼器或代碼轉(zhuǎn)換器220從該比特流中抽取足夠量的比特40。用于抽取符合品質(zhì)、時(shí)間、與空間要求的、適當(dāng)量的比特流的條件被稱為可伸縮性條件。然后,解碼器230可以根據(jù)被截?cái)?truncated)比特流40恢復(fù)視頻序列20。
因?yàn)閷?shí)際比特率在前置解碼器220中確定,所以速率控制應(yīng)該在前置解碼器220而不是編碼器中進(jìn)行。對(duì)于前置解碼器220中的速率控制算法,還沒有什么研究,大部分研究都集中于恒定比特率(CBR)方案。然而Mr.Hsiang在其博士論文″Highly scalable subband/wavelet image and videocoding″(Rensselaer Polytechnic Institute,New York,Jan.2002.)中提出可變比特率(VBR)方案,其也可以用于前置解碼器(此后稱為Hsiang的方案)。在該方案中,用于前置解碼器中的小波位平面(bit plane)數(shù)目相同,以增強(qiáng)現(xiàn)有CBR方案的性能。
此后將詳細(xì)描述Hsiang的方案。
在以下說明書中,所發(fā)送的視頻可以被分為多個(gè)圖片組(GOP),每個(gè)GOP具有多個(gè)幀。這可以簡(jiǎn)化速率分配算法,這是因?yàn)槊總€(gè)GOP被分別編碼。因此,每個(gè)GOP彼此獨(dú)立,但是GOP中的每一幀彼此高度相關(guān)。如果BT為包含N個(gè)GOP的整個(gè)視頻序列的總比特,則速率分配問題可以用公式表示為{R(1)......R(N)}=argmin{R(1)......R(N)}Σi=1ND(i)]]>公式1其中R(i)為對(duì)于第i個(gè)GOP的所分配的比特,D(i)為原始與已解碼的幀之間的絕對(duì)差異。VBR方法的基本方面是向相對(duì)復(fù)雜的場(chǎng)景分配較多比特,向其他場(chǎng)景分配較少比特,以獲得更好的R-D性能或者視覺品質(zhì)。如果我們將場(chǎng)景復(fù)雜度定義為編碼給定圖像幀的困難程度,則對(duì)于GOP的所分配的比特量(所使用的小波位平面數(shù)目恒定)與GOP中的相對(duì)場(chǎng)景復(fù)雜度高度相關(guān)。根據(jù)這一事實(shí),Hsiang的方案提出VBR方案使用于所有幀的位平面數(shù)目的相等。
如果b(i,j)為對(duì)于第i個(gè)GOP和第j個(gè)位平面的經(jīng)編碼的比特(encoded bit)數(shù)目,并且B(i,k)表示使用k個(gè)位平面的所累積的經(jīng)編碼的比特的數(shù)目,則B(i,k)定義為B(i,k)=Σj=1kb(i,j)]]>公式2如果對(duì)于所有幀、所使用的位平面數(shù)目為常數(shù)值K,則B(i,K)給出了第i幀的場(chǎng)景復(fù)雜度的某個(gè)統(tǒng)計(jì),并且所分配的總比特A(K)由以下給出A(K)=Σi=1NB(i,K)]]>公式3其中N為GOP的總數(shù)。如果K*表示其被分配的比特總量最接近BT的整數(shù)個(gè)位平面,則對(duì)于第i個(gè)GOP的最終所分配的比特R0(i)可以由以下給出R0(i)=B(i,K*)公式4其中A(K-1)≤BT<A(K) 公式5通過使用線性內(nèi)插技術(shù),可以通過使經(jīng)編碼的總比特等于BT來獲得場(chǎng)景復(fù)雜度的更精確的統(tǒng)計(jì)。
發(fā)明內(nèi)容
技術(shù)問題基于小波的可伸縮視頻編碼固有地利用嵌入的特性,因此適于將其用于可變比特率(VBR)算法。關(guān)于這一點(diǎn),盡管Hsiang的方案簡(jiǎn)單且有效,但是其還需要進(jìn)一步改進(jìn),以減少PSNR值的變化,這是因?yàn)槠渲恢铝τ谧钚』陀^誤差度量(objective error measure)。即使平均PSNR足夠高,如果PSNR方差高,也可能在低PSNR幀中觀察到顯而易見的視覺假象(artifact)。因此,擁有使PSNR方差最小化的比特分配方案是有意義的。
技術(shù)方案考慮到以上內(nèi)容,提供了一種利用在前置解碼器側(cè)可用的信息來分配比特以使解碼器側(cè)具有最優(yōu)品質(zhì)的方法。
還提供了一種分配可變比特率以便使基于小波的可伸縮視頻編碼的PSNR方差最小化的方法。
根據(jù)本發(fā)明的一個(gè)方面,提供了一種比特率控制方法,包含第一步驟,用來確定來自通過編碼原始運(yùn)動(dòng)畫面而生成的比特流的每個(gè)編碼單元的比特量,以允許該運(yùn)動(dòng)畫面的視覺品質(zhì)相對(duì)于其編碼單元而言是均一的;以及第二步驟,用來通過根據(jù)所確定的比特量截?cái)嘣摫忍亓鞯囊徊糠?,來抽取具有所期望的比特量的比特流?br>
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種比特率控制裝置,包含第一部件,用來確定來自通過編碼原始運(yùn)動(dòng)畫面而生成的比特流的每個(gè)編碼單元的比特量,以使得該運(yùn)動(dòng)畫面的視覺品質(zhì)相對(duì)于其編碼單元而言均一的;以及第二部件,用來通過根據(jù)所確定的比特量截?cái)嘣摫忍亓鞯囊徊糠?,來抽取具有所期望的比特量的比特流?br>
通過以下參照附圖的、對(duì)示范性實(shí)施方式的詳細(xì)描述,本發(fā)明的以上以及其他目的、特征、以及優(yōu)點(diǎn)將變得明顯,其中圖1為圖示基于現(xiàn)有的速率畸變優(yōu)化技術(shù)的視頻編解碼器的總體配置的方框圖;圖2為圖示根據(jù)現(xiàn)有技術(shù)的、基于小波的可伸縮視頻編解碼器的操作配置的方框圖;圖3為圖示根據(jù)本發(fā)明的示范性實(shí)施方式的基于小波的可伸縮視頻編解碼器的操作配置的方框圖;圖4為圖示經(jīng)編碼的Canoa QCIF(Quarter Common Interchange format,四分之一共同交換格式)序列中的、D(i)/D與B(i,K*)的比較的圖;圖5為圖示分配給Football QCIF序列中每個(gè)GOP的比特率的圖;圖6為圖示分配給Football QCIF序列中每個(gè)GOP的平均PSNR的圖;圖7與8分別圖示被編碼成VBR-D和VBR-N的Foreman QCIF序列的第92幀的例子;以及圖9與10分別圖示被編碼成VBR-D和VBR-N的Foreman QCIF序列的第106幀的例子。
具體實(shí)施例方式
此后將參照附圖詳細(xì)描述本發(fā)明的示范性實(shí)施方式。
圖3為圖示根據(jù)本發(fā)明的示范性實(shí)施方式的基于小波的可伸縮視頻編解碼器的操作配置的方框圖。
可伸縮視頻編解碼器300包含編碼器310,其編碼原始運(yùn)動(dòng)畫面10,從而生成足夠大的比特流35;速率控制單元340,其基于用戶期望的比特率30為每個(gè)編碼單元分配最優(yōu)比特量;前置解碼器320,其接收比特流35,并且根據(jù)在速率控制單元340中選擇的最優(yōu)比特量,通過截?cái)嗨邮盏谋忍亓?5的一部分,來抽取具有適當(dāng)比特量的比特流40;以及解碼器330,其根據(jù)所抽取的比特流40解碼運(yùn)動(dòng)畫面的圖像序列,從而重構(gòu)原始運(yùn)動(dòng)畫面。
具體地,本發(fā)明致力于在速率控制單元340中進(jìn)行的操作。速率控制單元340包含四個(gè)步驟,并且進(jìn)行通過利用具有恒定數(shù)目的位平面的比特分布與畸變函數(shù)、定義可用于前置解碼器320的比特速率函數(shù)的步驟;通過修正比特率函數(shù)以獲得均一的視覺品質(zhì)、來對(duì)比特率進(jìn)行推測(cè)(pre-summation)的步驟;通過利用比特分布、對(duì)畸變函數(shù)進(jìn)行近似以確定畸變函數(shù)的步驟;以及規(guī)格化修正后的比特率函數(shù)以使所分配的總比特率等于目標(biāo)比特率的步驟。因?yàn)樗u(píng)定的畫面視覺品質(zhì)一般基于PSNR,所以在本發(fā)明中也使用PSNR作為品質(zhì)評(píng)定的標(biāo)準(zhǔn)。另外,將現(xiàn)有編碼器中使用的平均絕對(duì)分布(meanabsolute distribution MAD)信息用作為場(chǎng)景復(fù)雜度函數(shù)的恒定數(shù)目的位平面的比特分布來替換。
將描述通過利用具有恒定數(shù)目位平面的比特分布與畸變函數(shù)、定義前置解碼器中可用的比特速率函數(shù)的步驟。類似于公式6,我們假設(shè)源統(tǒng)計(jì)為拉普拉斯(Laplacian)分布P(x)=α2e-α|x|]]>公式6其中α為常數(shù)。
如果將差異函數(shù)用做畸變度量,則存在如公式7所導(dǎo)出的速率畸變函數(shù)的閉合形式的解。D(i)表示畸變函數(shù),表示原始圖像與解壓之后的最終圖像之間的差異。
R(i)M(i)=ln(1αD(i))]]>公式7通過引入兩個(gè)新參數(shù)-MAD與非紋理開銷-的公式8,可以進(jìn)一步修正R-D函數(shù)。
R(i)-H(i)M(i)=ln(1αD(i))]]>公式8在公式8中,H(i)表示用于頭部信息與運(yùn)動(dòng)矢量的比特,M(i)表示利用亮度分量的運(yùn)動(dòng)補(bǔ)償殘余計(jì)算的MAD。MAD包含在R-D函數(shù)中,以考慮場(chǎng)景復(fù)雜度,這是因?yàn)樵谙嗤繕?biāo)比特率限制下,應(yīng)該對(duì)相對(duì)復(fù)雜的幀使用較多的比特、對(duì)其他幀使用較少的比特。
雖然現(xiàn)有VBR方案使用B(i,K*)作為所分配的比特,但是本發(fā)明使用B(i,K*)替換M(i),這是因?yàn)锽(i,K*)與第i個(gè)GOP的場(chǎng)景復(fù)雜度高度相關(guān)。通過用B(i,K*)來替換M(i),得到以下的結(jié)果R(i)B(i,K*)=ln(1αD(i))]]>公式9為了標(biāo)記簡(jiǎn)單,在公式9及本說明書剩余文本中未考慮非紋理開銷H(i),這是因?yàn)樗俏⒉蛔愕赖膯栴}。在發(fā)明人的早期試驗(yàn)中,顯示了通過選擇α的最優(yōu)值,該替換對(duì)于比特速率、解晰度、以及序列的許多組合是合理的。
比特率的推測(cè)的步驟通過修正比特率函數(shù)來獲得均一視覺品質(zhì),現(xiàn)在對(duì)其進(jìn)行描述。
如果D為所有GOP的D(i)的平均值,則將ln(D(i)/D)加到公式9的兩側(cè)得到R′(i)B(i,K*)=ln(1αD)]]>公式10其中R′(i)=R(i)+B(i,K*)ln(D(i)D)]]>公式11因?yàn)楣?0的右側(cè)為常數(shù)值,所以對(duì)第i個(gè)GOP分配R′(i)比特導(dǎo)致恒定畸變。為了獲得R′(i),應(yīng)該如公式11所示那樣計(jì)算R(i)與ln(D(i)/D)。然而這可能是個(gè)難題,因?yàn)樵谇爸媒獯a器中不能確定實(shí)際畸變D(i)。
現(xiàn)在描述通過利用比特分布對(duì)畸變函數(shù)進(jìn)行近似,來確定畸變函數(shù)的步驟。
為了解決以上問題,首先設(shè)置初始比特分配R(i)等于上述R0(i),并且通過某些近似來估計(jì)D(i)/D。在公式11中,D(i)/D為畸變的相對(duì)幅度對(duì)平均畸變的比例。因?yàn)楫?dāng)場(chǎng)景復(fù)雜度增加時(shí)畸變的相對(duì)幅度增加,所以假設(shè)D(i)/D可以由場(chǎng)景復(fù)雜度函數(shù)B(i,K*)表示為D(i)D≈B(i,K*)rB]]>公式12其中B=1NΣn=1NB(i,K*)r]]>公式13并且r為用于補(bǔ)償實(shí)際畸變與所分配的比特之間的非線性的試驗(yàn)常數(shù)。圖4顯示按512kbps編碼的Canoa QCIF序列中的D(i)/D與B(i,K*)/B的比較圖,其中值r=0.4。如圖4所示,D(i)/D可以由相對(duì)場(chǎng)景復(fù)雜度B(i,K*)r/B大體模擬。另外,根據(jù)窮盡的前期試驗(yàn),顯示值r=0.4對(duì)于幾乎所有測(cè)試條件都是令人滿意的。
將公式12插入公式11得到R′(i)=R0(i)+B(i,K*)ln(NB(i,K*)rΣj=1NB(j,K*)r)]]>公式14現(xiàn)在將描述規(guī)格化修正后的比特率函數(shù)以使所分配的總比特率等于目標(biāo)比特率的步驟。
因?yàn)镽′(i)是從R(i)修正得來而沒有考慮比特率限制,所以應(yīng)該將R′(i)規(guī)格化,以滿足目標(biāo)比特率要求。簡(jiǎn)單的規(guī)格化得到最終的等式,其被定義為Rn(i)=R′(i)BTΣj=1NR′(i)]]>公式15其中Rn(i)為對(duì)于第i個(gè)GOP的所分配的比特,其可以使畸變變得平坦。
CBR指恒定比特率分配的現(xiàn)有方案,VBR-D指根據(jù)Hsiang的方案的可變速率分配,VBR-N指根據(jù)本發(fā)明的可變速率分配。如表1所示,由于VBR-N方案高效實(shí)現(xiàn)了自適應(yīng)比特分配技術(shù),所以VBR-N方案在性能上超過CBR方案的Foreman OCIF以及Canoa OCIF分別多達(dá)0.9dB和0.6dB的凈余量(clear margin)。另外,對(duì)于這兩個(gè)序列,VBR-D與VBR-N之間的所有性能差距都限制在大約0.2dB內(nèi)。
表1
表2顯示利用CBR、VBR-D、以及VBR-N的PSNR值的標(biāo)準(zhǔn)偏差。首先,該表揭示VBR-D以及VBR-N方案比CBR方案更多地減小了PSNR標(biāo)準(zhǔn)偏差。雖然未明確表示,但是在每幀獲得的PSNR的標(biāo)準(zhǔn)偏差中,與VBR-D相比,VBR-N將其減小了23%至50.8%。因?yàn)閂BR-N采用基于GOP的優(yōu)化技術(shù),所以通過每個(gè)GOP獲得的PSNR的標(biāo)準(zhǔn)偏差(所謂的GOP平均PSNR標(biāo)準(zhǔn)偏差)中,減小百分比變得很大。這說明VBR-N方案在使總體PSNR曲線變平坦方面更有效。參照表2,與VBR-D相比,VBR-N將GOP平均PSNR標(biāo)準(zhǔn)偏差減小了26.1%至89.7%。
表2
圖5為顯示為Football QCIF序列中每個(gè)GOP分配的比特率的圖示,圖6為顯示Football QCIF序列中每個(gè)GOP的平均PSNR的圖示。Football QCIF按512kbps的平均比特率編碼。另外,我們說明GOP平均PSNR而非幀PSNR,以察看PSNR曲線的整體平坦程度。在圖5中,CBR的比特率幾乎恒定,而VBR-D與VBR-N的比特率高度可變,這是因?yàn)樗鼈儽桓叨瓤勺兊膱?chǎng)景特性優(yōu)化了。在另一方面,VBR-N的GOP平均PSNR曲線比CBR和VBR-D要平坦的多。
圖7、8、9、10顯示編碼Foreman QCIF序列的幾個(gè)例子。
圖7顯示由VBR-D生成的第92幀(PSNR=38.02),圖8顯示由VBR-N在相同位置上生成的第92幀(PSNR=39.94)。
如圖所示,VBR-N顯著減少了假象。因?yàn)閂BR-N可以使PSNR曲線變得平坦、并且具有稍小些的平均PSNR,所以這是自然的結(jié)果,由此PSNR的最小值顯著增加。
圖9顯示由VBR-D生成的第106幀(PSNR=44.05),圖10顯示由VBR-N生成的第106幀(PSNR=44.02)。
如這些圖所示,雖然VBR-D的PSNR值大于VBR-N的PSNR值,但是實(shí)際視覺品質(zhì)幾乎相同,這是因?yàn)閮蓚€(gè)PSNR值都高得足以使編碼假象不可察覺。該性質(zhì)對(duì)于主觀視覺品質(zhì)非常有用,這是因?yàn)橥ㄟ^以犧牲非常良好品質(zhì)的幀的PSNR來改進(jìn)差品質(zhì)的幀的PSNR,可以在更容易察覺的意義上控制視覺品質(zhì)。
工業(yè)實(shí)用性根據(jù)本發(fā)明,可以大大減少PSNR標(biāo)準(zhǔn)偏差,同時(shí)幾乎原樣地保持平均PSNR。該性質(zhì)對(duì)于主觀視覺品質(zhì)非常有用,這是因?yàn)橥ㄟ^以犧牲非常良好品質(zhì)的幀的PSNR來改進(jìn)差品質(zhì)的幀的PSNR,可以在更容易察覺的意義上控制視覺品質(zhì)。
根據(jù)本發(fā)明,因?yàn)槭褂昧酥挥性谇爸媒獯a器側(cè)才可用的信息,所以前置解碼器不需要附加信息。
雖然聯(lián)系本發(fā)明的優(yōu)選實(shí)施方式描述了本發(fā)明,但是本領(lǐng)域技術(shù)人員應(yīng)該理解在不脫離本發(fā)明的范圍與精神的前提下可以進(jìn)行各種修改與變動(dòng)。因此,應(yīng)該理解在所有方面,以上實(shí)施方式都是說明性的、而不是限制性的。本發(fā)明的范圍由權(quán)利要求限定,而不是由對(duì)本發(fā)明詳細(xì)說明限定。應(yīng)該將從權(quán)利要求與其對(duì)等物的范圍與精神導(dǎo)出的所有修改與變動(dòng)認(rèn)為是落入本發(fā)明的范圍之中。
權(quán)利要求
1.一種比特率控制方法,包含確定來自于通過編碼原始運(yùn)動(dòng)畫面而生成的比特流的多個(gè)編碼單元中每一個(gè)的比特量,以允許該運(yùn)動(dòng)畫面的視覺品質(zhì)相對(duì)于其編碼單元是均一的;以及通過根據(jù)所確定的比特量截?cái)嘣摫忍亓鞯囊徊糠?,來抽取具有所述比特量的比特流?br>
2.如權(quán)利要求1所述的方法,其中峰值信噪比(PSNR)被用做測(cè)量視覺品質(zhì)的基準(zhǔn)。
3.如權(quán)利要求1所述的方法,其中由編碼器生成的比特流遵從基于小波的視頻編碼方案,并且被前置解碼器按照可伸縮性條件自適應(yīng)地修正。
4.如權(quán)利要求1所述的方法,其中通過增加分配給第一編碼單元的比特、并且減少分配給第二編碼單元的比特,使品質(zhì)測(cè)量基準(zhǔn)平坦,并且其中第一編碼單元與第二編碼單元相比具有較低品質(zhì)的圖像。
5.如權(quán)利要求1所述的方法,其中所述確定比特量包含通過利用具有恒定數(shù)目的位平面的比特分布與畸變函數(shù),來定義前置解碼器中可用的比特率函數(shù);以及通過修正比特率函數(shù)來推測(cè)比特率,以獲得均一視覺品質(zhì)。
6.如權(quán)利要求5所述的方法,其中所述確定比特量還包含最初利用比特分布對(duì)畸變函數(shù)進(jìn)行近似,以利用前置解碼器中可用的信息來確定畸變函數(shù)。
7.如權(quán)利要求6所述的方法,其中所述確定比特量還包含通過修正比特率函數(shù)來規(guī)格化比特率函數(shù)以使所分配的總比特率等于目標(biāo)比特率。
8.一種比特率控制裝置,包含第一部件,用來確定來自于通過編碼原始運(yùn)動(dòng)畫面而生成的比特流的多個(gè)編碼單元中每一個(gè)的比特量,以使該運(yùn)動(dòng)畫面的視覺品質(zhì)相對(duì)于其編碼單元是均一的;以及第二部件,用來通過根據(jù)所確定的比特量截?cái)嘣摫忍亓鞯囊徊糠?,來抽取具有所述比特量的比特流?br>
9.如權(quán)利要求8所述的裝置,其中由編碼器生成的、遵從基于小波的視頻編碼方案的比特流,被前置解碼器按照可伸縮性條件自適應(yīng)地修正。
10.如權(quán)利要求8所述的裝置,其中第一部件包含用來通過利用具有恒定數(shù)目的位平面的比特分布與畸變函數(shù)來定義前置解碼器中可用的比特率函數(shù)、以及通過修正該比特率函數(shù)來推測(cè)比特率、從而獲得均一視覺品質(zhì)的部件。
11.如權(quán)利要求10所述的裝置,其中第一部件還包含用來最初利用比特分布對(duì)畸變函數(shù)進(jìn)行近似,以利用前置解碼器中可用的信息來確定畸變函數(shù)的部件。
12.如權(quán)利要求10所述的裝置,其中第一部件還包含用來通過修正比特率函數(shù)來規(guī)格化比特率函數(shù)以使所分配的總比特率等于目標(biāo)比特率的部件。
13.一種記錄計(jì)算機(jī)程序代碼的計(jì)算機(jī)可讀記錄介質(zhì),所述代碼使計(jì)算機(jī)能夠提供一種比特率控制方法的服務(wù),該方法包含確定來自于通過編碼原始運(yùn)動(dòng)畫面而生成的比特流的多個(gè)編碼單元中每一個(gè)的比特量,以允許該運(yùn)動(dòng)畫面的視覺品質(zhì)相對(duì)于其編碼單元是均一的;以及通過根據(jù)所確定的比特量截?cái)嘣摫忍亓鞯囊徊糠?,來抽取具有所述比特量的比特流?br>
14.一種比特率控制的裝置,包含確定單元,用來確定來自于通過編碼原始運(yùn)動(dòng)畫面而生成的比特流的多個(gè)編碼單元中每一個(gè)的比特量、以使得該運(yùn)動(dòng)畫面的視覺品質(zhì)相對(duì)于其編碼單元是均一的;以及抽取單元,用來通過根據(jù)所確定的比特量截?cái)嘣摫忍亓鞯囊徊糠?、來抽取具有所述比特量的比特流?br>
15.如權(quán)利要求14所述的裝置,其中由編碼器生成的比特流遵從基于小波的視頻編碼方案,并且被前置解碼器按照可伸縮性條件自適應(yīng)地修正。
16.如權(quán)利要求14所述的裝置,其中確定單元包含定義單元,用來通過利用具有恒定數(shù)目的位平面的比特分布與畸變函數(shù)、來定義前置解碼器中可用的比特率函數(shù),以及推測(cè)單元,用來修正比特率函數(shù)以獲得均一視覺品質(zhì)。
17.如權(quán)利要求16所述的裝置,其中確定單元還包含近似單元,用來最初利用比特分布對(duì)畸變函數(shù)進(jìn)行近似、以利用前置解碼器中可用的信息來確定畸變函數(shù)。
18.如權(quán)利要求16所述的裝置,其中確定單元還包含規(guī)格化單元,用來通過修正比特率函數(shù)來規(guī)格化比特率函數(shù)以使所分配的總比特率等于目標(biāo)比特率。
全文摘要
一種可伸縮視頻編解碼器,包含編碼器,其對(duì)原始運(yùn)動(dòng)畫面編碼;速率控制單元,其基于用戶希望的比特率為每個(gè)編碼單元分配最優(yōu)比特量;前置解碼器,其接收比特流,并且抽取具有適當(dāng)比特量的比特流;以及解碼器,其根據(jù)所抽取的比特流解碼運(yùn)動(dòng)畫面圖像序列,從而重構(gòu)原始運(yùn)動(dòng)畫面。具體地,本發(fā)明致力于在速率控制單元340中進(jìn)行的操作。速率控制單元執(zhí)行對(duì)前置解碼器中可用的比特率函數(shù)定義的步驟;推測(cè)步驟,由此獲得均一視覺品質(zhì);近似步驟,以確定畸變函數(shù);以及規(guī)格化步驟,以使所分配的總比特率等于目標(biāo)比特率。
文檔編號(hào)H04N7/26GK1871858SQ200480031027
公開日2006年11月29日 申請(qǐng)日期2004年10月14日 優(yōu)先權(quán)日2003年10月20日
發(fā)明者韓宇鎮(zhèn), 李培根, 河昊振 申請(qǐng)人:三星電子株式會(huì)社