專利名稱:視頻編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻技術(shù)領(lǐng)域,尤其涉及一種視頻編碼方法。
背景技術(shù):
在視頻壓縮領(lǐng)域,為了能夠更好的改善壓縮效率,越來越多的編碼模式被引入到了編碼標(biāo)準(zhǔn)中。例如,在最新的視頻編碼標(biāo)準(zhǔn)H.264/AVC中,共有超過十多種的編碼模式以供選擇,而選擇何種編碼模式作為視頻宏塊的最佳編碼模式是非常重要。為了確定最佳編碼模式,通常采用率失真優(yōu)化(Rate-distortion optimization,簡稱:RD0)技術(shù)。具體的,RDO的表達(dá)式如下:min {J}, where J=D+λ XR其中J是率失真代價(jià),R是一個(gè)編碼單元的編碼比特?cái)?shù),λ是拉格朗日乘子。較早的,由Gary J.Sullivan 和 Thomas Wiegand 在 1998 年的 SignalProcessingMagazine 的第 15 卷第 74-90 頁的“Rate-distortion Optimization forVideoCompression” 一文中提出的率失真模型被應(yīng)用于常見的混合編碼標(biāo)準(zhǔn),比如H.263和
H.264/AVC。但是,在這個(gè)模型中,拉格朗日乘子是固定的。為了使拉格朗日乘子更具有自適應(yīng)性,Lulin Chen 和 Ilie Garbacea 在 2006 年 VCIP 的第 6077 卷第 1-8 頁的“AdaptiveLambda Estimation inLagrangian Rate-distortion Optimization for Video Coding,,中提出了一種自適應(yīng)的基于P-范圍的拉格朗日乘子估計(jì)算法。但是在這個(gè)方法中,由于R和D被直接引入到了拉格朗日乘子的計(jì)算公式中,但由于R和D的誤差問題導(dǎo)致拉格朗日乘子的計(jì)算不穩(wěn)定。Xiang Li> Norbert Oertel、Andreas Hutter 和 AndreKaup 在 2009年 TCSVT 的第 19 卷的第 193-205 頁的 “LaplaceDistribution Based Lagrangian RateDistortion Optimization for Hybrid VideoCoding” 中提出了一種基于變換殘差拉普拉斯分布的動(dòng)態(tài)RDO模型。但在上述的這些模型中,RDO過程中所采用的失真度量方式,比如SSE和MSE,都是客觀上的,未充分考慮人眼主觀視覺特性,即具有相同MSE失真的兩幅圖像可能會(huì)表現(xiàn)出完全不同的感知失真。最近,為了解決這個(gè)問題,Zhou Wang在2004年的TIP第13卷第600-612頁的“Image Quality Assessment:From Error Visibility to StructuralSimilarity,,中提出空域質(zhì)量(Structural Similarity Index Measurement,簡稱:SSIM)指標(biāo)。SSIM 已經(jīng)被證明可以在編碼效率和失真性能之間取得很好的平衡,但是,SSIM是針對(duì)靜態(tài)圖像提出的,所以應(yīng)用到視頻中時(shí)只能考慮到視頻的空域特征。事實(shí)上,視頻的時(shí)域特征對(duì)人眼視覺感知也有很大的影響。因此,現(xiàn)有技術(shù)中未充分考慮人眼主觀視覺特性及視頻的時(shí)域特性獲取的率失真代價(jià)不夠準(zhǔn)確,而根據(jù)率失真代價(jià)確定的視頻編碼模式對(duì)于待編碼視頻來說也是不合適的,從而采用不合適的編碼模式對(duì)視頻編碼重建后使視頻觀看效果不佳
發(fā)明內(nèi)容
本發(fā)明提供一種視頻編碼方法,通過該方法對(duì)視頻編碼后不影響視頻的觀看效
果O本發(fā)明第一方面提供一種視頻編碼方法,包括:分別確定至少兩種編碼模式對(duì)視頻序列當(dāng)前視頻幀的原始宏塊進(jìn)行編碼的率失真代價(jià),且根據(jù)率失真代價(jià)為所述當(dāng)前視頻幀的原始宏塊選擇編碼模式,其中,確定每種編碼模式對(duì)視頻序列當(dāng)前視頻幀的原始宏塊進(jìn)行編碼的率失真代價(jià)的操作包括:采用所述編碼模式對(duì)當(dāng)前視頻幀中的原始宏塊進(jìn)行編碼,以獲取編碼碼流和編碼碼率,且對(duì)所述編碼碼流進(jìn)行重建,以獲取重建宏塊;根據(jù)所述原始宏塊與所述重建宏塊之間的空時(shí)相似性度量,獲取宏塊失真量;根據(jù)所述編碼碼率和所述宏塊失真量的關(guān)系模型獲取拉格朗日乘子;根據(jù)所述編碼碼率、所述宏塊失真量及所述拉格朗日乘子確定所述編碼模式對(duì)應(yīng)的率失真代價(jià)。結(jié)合第一方面,在第一實(shí)現(xiàn)方式中,每個(gè)視頻幀中原始宏塊包括至少一個(gè)原始圖像塊,所述重建宏塊包括至少一個(gè)與所述原始圖像塊對(duì)應(yīng)的重建圖像塊,則所述根據(jù)所述原始宏塊與所述重建宏塊之間的空時(shí)相似性度量,獲取宏塊失真量,包括:根據(jù)當(dāng)前視頻幀中原始宏塊的各個(gè)原始圖像塊與重建宏塊的各個(gè)重建圖像塊的圖像參數(shù)獲取各個(gè)空域質(zhì)量; 分別根據(jù)當(dāng)前視頻幀與歷史幀中各個(gè)原始圖像塊與各個(gè)重建圖像塊對(duì)應(yīng)的圖像參數(shù)獲取各個(gè)時(shí)域質(zhì)量;根據(jù)各個(gè)空域質(zhì)量和各個(gè)時(shí)域質(zhì)量獲取各個(gè)所述原始圖像塊與重建圖像塊之間的各個(gè)預(yù)處理空時(shí)相似性度量;根據(jù)各個(gè)所述預(yù)處理空時(shí)相似性度量獲取所述原始宏塊與所述重建宏塊之間的空時(shí)相似性度量;根據(jù)所述空時(shí)相似性度量獲取宏塊失真量。結(jié)合第一實(shí)現(xiàn)方式,在第二實(shí)現(xiàn)方式中,根據(jù)當(dāng)前視頻幀中每個(gè)原始圖像塊與每個(gè)重建圖像塊的圖像參數(shù)獲取空域質(zhì)量,包括:根據(jù)公式(I)計(jì)算空域質(zhì)量SSIM(x, y):
權(quán)利要求
1.種視頻編碼方法,其特征在于,包括: 分別確定至少兩種編碼模式對(duì)視頻序列當(dāng)前視頻幀的原始宏塊進(jìn)行編碼的率失真代價(jià),且根據(jù)率失真代價(jià)為所述當(dāng)前視頻幀的原始宏塊選擇編碼模式,其中,確定每種編碼模式對(duì)視頻序列當(dāng)前視頻幀的原始宏塊進(jìn)行編碼的率失真代價(jià)的操作包括: 采用所述編碼模式對(duì)當(dāng)前視頻幀中的原始宏塊進(jìn)行編碼,以獲取編碼碼流和編碼碼率,且對(duì)所述編碼流進(jìn)行重建,以獲取重建宏塊; 根據(jù)所述原始宏塊與所述重建宏塊之間的空時(shí)相似性度量,獲取宏塊失真量; 根據(jù)所述編碼碼率和所述宏塊失真量的關(guān)系模型獲取拉格朗日乘子; 根據(jù)所述編碼碼率、所述宏塊失真量及所述拉格朗日乘子確定所述編碼模式對(duì)應(yīng)的率失真代價(jià)。
2.據(jù)權(quán)利要求1所述的方法,其特征在于,每個(gè)視頻幀中原始宏塊包括至少一個(gè)原始圖像塊,所述重建宏塊包括至少一個(gè)與所述原始圖像塊對(duì)應(yīng)的重建圖像塊, 則所述根據(jù)所述原始宏塊與所述重建宏塊之間的空時(shí)相似性度量,獲取宏塊失真量,包括: 分別根據(jù)當(dāng)前視頻幀中原始宏塊的各個(gè)原始圖像塊與重建宏塊的各個(gè)重建圖像塊的圖像參數(shù)獲取各個(gè)空域質(zhì)量; 分別根據(jù)當(dāng)前視頻幀與歷史幀中各個(gè)原始圖像塊與各個(gè)重建圖像塊對(duì)應(yīng)的圖像參數(shù)獲取各個(gè)時(shí)域質(zhì)量; 根據(jù)各個(gè)所述空域質(zhì)量和各個(gè)時(shí)域質(zhì)量獲取各個(gè)所述原始圖像塊與重建圖像塊之間的各個(gè)預(yù)處理空時(shí)相似性度量; 根據(jù)各個(gè)所述預(yù)處理空時(shí)相似性度量獲取所述原始宏塊與所述重建宏塊之間的空時(shí)相似性度量; 根據(jù)所述空時(shí)相似性度量獲取宏塊失真量。
3.據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)當(dāng)前視頻幀中每個(gè)原始圖像塊與每個(gè)重建圖像塊的圖像參數(shù)獲取空域質(zhì)量,包括: 根據(jù)公式(I)計(jì)算空域質(zhì)量SSM(x,y):
4.據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)當(dāng)前視頻幀與歷史幀中每個(gè)原始圖像塊與每個(gè)重建圖像塊對(duì)應(yīng)的圖像參數(shù)獲取時(shí)域質(zhì)量,包括: 根據(jù)公式(2)計(jì)算時(shí)域質(zhì)量SSIM3D(x,y):
5.據(jù)權(quán)利要求4所述的方法,其特征在于,根據(jù)每個(gè)所述空域質(zhì)量和每個(gè)時(shí)域質(zhì)量獲取所述原始圖像塊與所述重建圖像塊之間的每個(gè)預(yù)處理空時(shí)相似性度量包括: 根據(jù)公式(3)計(jì)算每個(gè)預(yù)處理空時(shí)相似性度量stVSSM' (X,y): stVSSM' (x, y) =SSIM(x, y) XSSIM3D(x, y)(3)
6.據(jù)權(quán)利要求5所述的方法,其特征在于,根據(jù)各個(gè)所述預(yù)處理空時(shí)相似性度量獲取所述原始宏塊與所述重建宏塊之間的空時(shí)相似性度量包括: 計(jì)算各個(gè)所述預(yù)處理空時(shí)相似性度量的平均值,以獲取所述原始宏塊與所述重建宏塊之間的空時(shí)相似性度量。
7.據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)所述空時(shí)相似性度量獲取宏塊失真量包括: 根據(jù)公式(4)計(jì)算宏塊失真量Dstvssn1: Dstvssn=l-stVSSIM(4) 其中stVSSIM為所述原始宏塊與所述重建宏塊之間的空時(shí)相似性度量。
8.據(jù)權(quán)利要求1或7所述的方法,其特征在于,所述根據(jù)所述編碼碼率和所述宏塊失真量的關(guān)系模型獲取拉格朗日乘子,包括: 根據(jù)第一關(guān)系模型與第二關(guān)系模型獲取所述拉格朗日乘子,其中,所述第一關(guān)系模型根據(jù)所述編碼模式對(duì)應(yīng)的編碼碼率與宏塊失真量的標(biāo)本視頻數(shù)據(jù)擬合而成,所述第二關(guān)系模型根據(jù)所述編碼模式對(duì)應(yīng)的宏塊失真量與量化參數(shù)的標(biāo)本視頻數(shù)據(jù)擬合而成。
9.據(jù)權(quán)利要求8所述的方法,其特征在于,所述第一關(guān)系模型為
10.據(jù)權(quán)利要求8所述的方法,其特征在于,所述根據(jù)所述編碼碼率和所述宏塊失真量的關(guān)系模型獲取拉格朗日乘子,還包括: 根據(jù)所述原始宏塊的關(guān)注度值獲取拉格朗日調(diào)節(jié)因子; 根據(jù)所述拉格朗日調(diào)節(jié)因子和所述拉格朗日乘子獲取調(diào)節(jié)拉格朗日乘子。
11.據(jù)權(quán)利要求10所述的方法,其特征在于,所述根據(jù)所述原始宏塊的關(guān)注度值獲取拉格朗日調(diào)節(jié)因子,包括:根據(jù)原始宏塊中像素的關(guān)注度值獲取原始宏塊的關(guān)注度值; 根據(jù)所述當(dāng)前視頻幀中全部原始宏塊的關(guān)注度的平均值和所述原始宏塊的關(guān)注度值獲取拉格朗日調(diào)節(jié)因子 。
全文摘要
本發(fā)明提供一種視頻編碼方法,該方法包括分別確定至少兩種編碼模式的率失真代價(jià),并根據(jù)率失真代價(jià)選擇編碼模式,其中,確定率失真代價(jià)的操作包括根據(jù)視頻中的原始宏塊與重建宏塊之間的空時(shí)相似性度量,獲取宏塊失真量;根據(jù)所述編碼碼率和所述宏塊失真量的關(guān)系模型獲取拉格朗日乘子;根據(jù)所述編碼碼率、所述宏塊失真量及所述拉格朗日乘子確定所述編碼模式對(duì)應(yīng)的率失真代價(jià)。由于本發(fā)明所確定的宏塊失真量更符合人眼的視覺失真感知,且拉格朗日乘子是通過準(zhǔn)確的關(guān)系模型而獲取的,因此確定的率失真代價(jià)可真實(shí)的反映出編碼模式是否適用于視頻序列的當(dāng)前視頻幀,從而可準(zhǔn)確確定適用于視頻的編碼模式,使編碼后的視頻的觀看效果處于良好狀態(tài)。
文檔編號(hào)H04N7/26GK103096076SQ20121050107
公開日2013年5月8日 申請(qǐng)日期2012年11月29日 優(yōu)先權(quán)日2012年11月29日
發(fā)明者黃慶明, 胡方振, 蘇荔, 齊洪鋼 申請(qǐng)人:中國科學(xué)院研究生院