專利名稱:比特率指導(dǎo)的頻率加權(quán)矩陣選擇的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般地涉及編碼視頻的縮放,特別地涉及到為一個(gè)使用細(xì)粒度可分級(jí)(Fine-Granularity-Scalability)(FGS)技術(shù)的系統(tǒng)選擇頻率加權(quán)(FW)矩陣的系統(tǒng)和方法。
細(xì)粒度可分級(jí)(FGS)編碼協(xié)議概要作為2001年3月的MPEG-4標(biāo)準(zhǔn)的一部分被采用。MPEG-4 FGS協(xié)議概要將-個(gè)視頻序列編碼成兩個(gè)具有不同的傳輸優(yōu)先權(quán)的比特流基本層(BL)視頻流和增強(qiáng)層(EL)視頻流,這可以適應(yīng)一個(gè)寬范圍的比特速率。BL使用MPEG-4非升級(jí)編碼方案編碼,MPEG-4非升級(jí)編碼方案使用運(yùn)動(dòng)補(bǔ)償和基于塊的DCT(離散余弦變換)編碼。BL被編碼到一個(gè)可接受的最小比特率(基本層比特率),以便于在時(shí)變網(wǎng)絡(luò)上的可用帶寬高于基本層比特率。EL在DCT域中使用位平面編碼對(duì)原始信號(hào)和BL信號(hào)之間的差值進(jìn)行編碼。
在增強(qiáng)層的編碼器方,這些DCT-殘余的位平面以一種改進(jìn)的(精細(xì))方式被壓縮。接著在傳輸時(shí),取決于通過(guò)網(wǎng)絡(luò)的可用帶寬和解碼器容量,只有部分的EL可被發(fā)送。FGS技術(shù)對(duì)于在網(wǎng)絡(luò)上具有可變帶寬的視頻流特別有用,比如因特網(wǎng)視頻流、因特網(wǎng)廣播、蜂窩網(wǎng)絡(luò)或室內(nèi)網(wǎng)絡(luò)的無(wú)線視頻通信、等等。
FGS包括大量的支持各種可升級(jí)的結(jié)構(gòu)并提高了輸出的視覺(jué)質(zhì)量的視頻編碼工具。頻率加權(quán)(FW)就是一種這樣的工具,它對(duì)提高低比特率的編碼的視覺(jué)質(zhì)量特別有用。例如,公知的基本層DCT系數(shù)常規(guī)地沿著從DCT塊的左上到右下的Z字形掃描線分布它們的能量。相應(yīng)地,增強(qiáng)層DCT殘余塊繼承了一個(gè)相似的Z字形能量分布模式。因此,為了確保在較低帶寬限制下的較好編碼質(zhì)量,需要以優(yōu)先的方式發(fā)送較高的能量殘余。FW方法允許對(duì)所選定的ELDCT殘余的位平面移位。因此,和DCT殘余塊同樣大小的一個(gè)“頻率加權(quán)”矩陣,Mfw被定義,其中矩陣的每個(gè)元素Mfw(I)表示了第I個(gè)DCT系數(shù)應(yīng)當(dāng)被移位的位平面的數(shù)目。
圖3圖示了FW在低比特率時(shí)的好處。在左側(cè),示出在不使用FW情況下EL塊的DCT殘余(用虛線描述),并且在右側(cè)示出在使用FW的情況下,EL塊的DCT殘余。正如可見(jiàn)的,每個(gè)EL塊包括幾個(gè)位平面,MSB位于頂部。在平面中,DCT系數(shù)殘余向上擴(kuò)展指向MSB。在左邊的情況下,在低比特率,如果在MSB之下的所有的位平面在服務(wù)器被截?cái)啵獯a器將不接收在EL塊的第一象限的DCT系數(shù)殘余。對(duì)于大多數(shù)的視頻序列,DC的較低精確度以及第一AC的EL殘余在解碼器方轉(zhuǎn)化為視覺(jué)質(zhì)量的降低。換言之,如果一個(gè)FW矩陣被使用,其中在DCT方塊中的第一象限具有Mfw(i)=2,如右側(cè)所示的,該DC和第一AC的EL殘余將成功地編碼到MSB,因此即便在低比特率時(shí)也保證了它們(至少部分地)的傳輸。
和其它的視頻編碼標(biāo)準(zhǔn)相似,MPEG-4只為解碼器標(biāo)準(zhǔn)化了語(yǔ)法以及和它相關(guān)的語(yǔ)義含義。因此,定義創(chuàng)新的算法是系統(tǒng)設(shè)計(jì)者的任務(wù),該創(chuàng)新的算法以這樣的方式使用FW語(yǔ)法,即FGS編碼的視覺(jué)質(zhì)量可以被顯著地提高。為FGS編碼完成FW,一個(gè)關(guān)鍵步驟在于FW矩陣選擇。能夠基于Z字形能量分布特征通過(guò)給較低的頻率系數(shù)較高的加權(quán),選擇一個(gè)普通的FW矩陣,反之亦然。然而,普通的能量損耗準(zhǔn)則不能為確定FW矩陣的精確數(shù)量值提供線索。因此,需要有效地選擇一個(gè)FW矩陣。
本發(fā)明解決了上述的問(wèn)題,還有其它的問(wèn)題,通過(guò)提供一個(gè)新穎的FW矩陣選擇方法,該方法在一個(gè)臨界質(zhì)量比特率使用BL DCT殘余差值。在第一方面,本發(fā)明提供了一種生成頻率加權(quán)(FW)矩陣以在細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng)中使用的系統(tǒng),包括一個(gè)系統(tǒng),用于為一個(gè)既編碼在預(yù)定的基本層比特率還編碼在接近3倍的預(yù)定基本層比特率的抽樣視頻幀生成平均離散余弦變換(DCT)殘余;一個(gè)系統(tǒng),用于繪制生成的平均DCT殘余的差值曲線,其中該差值曲線通過(guò)相應(yīng)于一個(gè)DCT Z字形掃描線的DCT系數(shù)位置來(lái)繪制;以及一個(gè)系統(tǒng),用于將一個(gè)階梯曲線匹配到差值曲線。
第二方面,本發(fā)明提供了一種生成頻率加權(quán)(FW)矩陣以在細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng)中使用的方法,包括步驟為編碼在第一比特率的抽樣視頻幀生成相對(duì)于DCT Z字形掃描線位置的平均離散余弦變換(DCT)殘余的第一曲線;為編碼在多倍第一比特率的抽樣視頻幀生成相對(duì)于DCT Z字形掃描線位置的平均離散余弦變換(DCT)殘余的第二曲線;從第一和第二曲線生成差值曲線;將一個(gè)階梯曲線匹配到差值曲線;并映射階梯曲線的加權(quán)以填充FW矩陣。
第三個(gè)方面,本發(fā)明提供了一種細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng),該系統(tǒng)利用頻率加權(quán)(FW)矩陣以編碼視頻數(shù)據(jù),它包括一個(gè)系統(tǒng),用于確定視頻數(shù)據(jù)的場(chǎng)景特征;和一個(gè)系統(tǒng),用于從大量的FW矩陣中基于確定的視頻數(shù)據(jù)場(chǎng)景特征來(lái)選擇一個(gè)FW矩陣。
第四個(gè)方面,本發(fā)明提供了一種存儲(chǔ)在可記錄媒體中的程序產(chǎn)品,用于生成頻率加權(quán)(FW)矩陣以在細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng)中使用,該程序產(chǎn)品包括為編碼在第一比特率的抽樣視頻幀生成相對(duì)于DCT Z字形掃描線位置的平均離散余弦變換(DCT)殘余的第一曲線的裝置;為編碼在多倍第一比特率的抽樣視頻幀生成相對(duì)于DCT Z字形掃描線位置的平均離散余弦變換(DCT)殘余的第二曲線的裝置;從第一和第二曲線生成差值曲線的裝置;將一個(gè)階梯曲線匹配到差值曲線的裝置;并映射階梯曲線的加權(quán)以填充FW矩陣的裝置。
第五方面,本發(fā)明提供了一種細(xì)粒度可分級(jí)(FGS)視頻解碼系統(tǒng),該系統(tǒng)利用頻率加權(quán)(FW)矩陣來(lái)解碼編碼的視頻數(shù)據(jù),其中FW矩陣的加權(quán)是從平均離散余弦變換(DCT)殘余的差值曲線的階梯曲線匹配得出的,其中平均離散余弦變換(DCT)殘余差值是在一個(gè)抽樣視頻幀的基本層比特率和接近3倍基本層比特率計(jì)算出來(lái)的。
此后將結(jié)合附圖對(duì)本發(fā)明的一個(gè)典型的的實(shí)施例進(jìn)行說(shuō)明,其中相同的標(biāo)號(hào)代表相同的部件,和
圖1描述了根據(jù)本發(fā)明的實(shí)施例的FW矩陣生成系統(tǒng)的方框圖。
圖2描述了根據(jù)本發(fā)明的實(shí)施例的FGS編碼器和FGS解碼器的方框圖。
圖3描述了一個(gè)典型的的頻率加權(quán)位平面。
圖4描述了一個(gè)使用FGS+BL和單層轉(zhuǎn)換編碼的(SLS)Foreman視頻序列的圖形化的比較。
圖5描述對(duì)于Foreman視頻序列、編碼在100kbps和300kbps的BL的DCT殘余差值。
圖6分別為Foreman視頻序列、編碼在100kbps和300kbps的單個(gè)視頻幀的DCT殘余幅度的一個(gè)曲線。
圖7描述了圖6的曲線的平均殘余差值以及匹配階梯曲線。
圖8描述了兩個(gè)不同的視頻序列的平均殘余差值和匹配階梯曲線。
現(xiàn)在參見(jiàn)附圖,圖1描述了一個(gè)頻率加權(quán)(FW)矩陣生成系統(tǒng)10,它接收一個(gè)或多個(gè)抽樣視頻序列12和一個(gè)基本層(BL)比特率14,并輸出一組FW矩陣22。每個(gè)抽樣視頻序列12包括一個(gè)可以典型地被細(xì)粒度可分級(jí)系統(tǒng)FGS系統(tǒng)處理的獨(dú)特的場(chǎng)景類型或特征,如示于圖2中的。因此,例如“抽樣視頻序列A”包含一個(gè)高活動(dòng)性的場(chǎng)景,“抽樣視頻序列B”包含一個(gè)中等活動(dòng)性的場(chǎng)景,并且“抽樣視頻序列C”包含一個(gè)低活動(dòng)性的場(chǎng)景。
FW矩陣生成系統(tǒng)10為每個(gè)輸入的抽樣視頻序列生成一個(gè)獨(dú)特的FW矩陣,以便于每個(gè)FW矩陣和一個(gè)預(yù)定的場(chǎng)景類型相關(guān)。因此,舉例來(lái)說(shuō),F(xiàn)W矩陣A將對(duì)應(yīng)于一個(gè)高活動(dòng)性場(chǎng)景,F(xiàn)W矩陣B將對(duì)應(yīng)于一個(gè)中等活動(dòng)性場(chǎng)景,F(xiàn)W矩陣C將對(duì)應(yīng)于一個(gè)低活動(dòng)性場(chǎng)景。所生成的FW矩陣22的數(shù)目可根據(jù)期望的FGS應(yīng)用而改變。簡(jiǎn)單的應(yīng)用(比如視頻電話)可以只要求從低活動(dòng)性、低運(yùn)動(dòng)的抽樣視頻序列導(dǎo)出的單個(gè)矩陣。其它比較復(fù)雜的應(yīng)用要求一個(gè)矩陣數(shù)據(jù)庫(kù),以處理許多不同的場(chǎng)景類型。另外,在一個(gè)場(chǎng)景中的任何的標(biāo)準(zhǔn)(如,活動(dòng)性,運(yùn)動(dòng),亮度等等)可以用于將一個(gè)抽樣視頻序列(因而,F(xiàn)W矩陣)同其它的相區(qū)別。
在圖1的實(shí)施例中,F(xiàn)W矩陣生成系統(tǒng)10利用DCT殘余生成系統(tǒng)16,一個(gè)殘余差值繪圖系統(tǒng)18,一個(gè)階梯曲線填充系統(tǒng)20和一個(gè)加權(quán)調(diào)整系統(tǒng)21,以生成FW矩陣22。這些系統(tǒng)的運(yùn)行在下面詳細(xì)地描述。
FW矩陣生成系統(tǒng)10從在一個(gè)臨界質(zhì)量比特率計(jì)算的抽樣視頻幀的離散余弦變換(DCT)殘余的差值階梯曲線匹配,來(lái)為每個(gè)矩陣確定加權(quán),通常包括(1)選定的比特率,和(2)選定的比特率的多倍。臨界比特率可被選擇作為任意值,其取決于例如,特定的應(yīng)用、分辨率/大小、幀率,等等。
在一個(gè)典型的的實(shí)施例中,臨界比特率包括基本層的編碼比特率(RBL)14,和三倍于基本層比特率的編碼比特率(即,3*RBL)。各種實(shí)驗(yàn)已經(jīng)示出在SLS和FGS之間的最大質(zhì)量差距出現(xiàn)在接近3倍的FGS BL比特率。舉例來(lái)說(shuō),下面的關(guān)于“Foreman”序列的分析示出RBL和3*RBL為臨界比特率。圖4示出了用一個(gè)非可分級(jí)(non-scalable)編碼器(即,SLS-單層轉(zhuǎn)接)和用一個(gè)具有100kbps的基本層比特率的FGS編碼器編碼的峰值信噪比(PSNR)。如同所能見(jiàn)到的,在100kbps-1Mbps的比特率范圍之內(nèi),在FGS和非可分級(jí)編碼器之間的最大的PSNR質(zhì)量惡化差距在300kbps附近。因此,F(xiàn)GS和SLS在3*RBL具有臨界質(zhì)量差距。因此,在該實(shí)施例中,F(xiàn)W矩陣選擇是基于在臨界質(zhì)量比特率3*RBL和RBL的平均DCT殘余值,并且使用在這些比特率的DCT殘余的FW矩陣選擇比在其它的比特率上的選擇具有更好的效果。應(yīng)當(dāng)明白其它的臨界質(zhì)量比特率和/或RBL的多倍(例如,2.5,3.5,4,4.5等等)也可用于限定臨界質(zhì)量差距,而不會(huì)脫離本發(fā)明的范圍。
圖5示出了在100kbps和300kbps比特率的“Foreman”序列平均殘余的基于幀的差值的一個(gè)3-D網(wǎng)孔。在此情況下,對(duì)于“Foreman”序列這里有兩種場(chǎng)景類型。很顯然,對(duì)于某個(gè)特定的場(chǎng)景特征,殘余特征對(duì)于該場(chǎng)景中的所有幀都是相似的。因此,來(lái)自抽樣視頻序列的單個(gè)的幀可用來(lái)為所有的具有相似的場(chǎng)景特征的幀生成FW矩陣。
回來(lái)參見(jiàn)圖1,F(xiàn)W矩陣生成系統(tǒng)10的運(yùn)行如下描述。DCT殘余生成系統(tǒng)16為在臨界質(zhì)量比特率(在此情況下,為RBL和3*RBL)的輸入視頻序列的一個(gè)選定的幀生成(并繪制)平均DCT殘余。每個(gè)的平均DCT殘余被繪制為它們?cè)贒CT數(shù)據(jù)方塊中的位置的函數(shù)。優(yōu)選地,殘余從自左上至右下的Z字形線(即,“DCT”Z字形掃描線)中提取出來(lái)以跟隨能量消耗的趨勢(shì)。在此處示出的例子中,系數(shù)號(hào)1-64為在一個(gè)8*8 DCT方塊中的每個(gè)殘余提供了Z字形位置。
1 2 6 7 |15 16 28 293 5 8 14|17 27 30 434 9 13 18|26 31 42 4410 12 19 25|32 41 45 54---------+----------11 20 24 33|40 46 53 5521 23 34 39|47 52 56 6122 35 38 48|51 57 60 6236 37 49 50|58 59 63 64該64殘余值之后將如圖6所示的被繪制。圖6示出了圖5的用一個(gè)MPEG-4非可分級(jí)編碼器編碼在100kbps和300kbps比特率的“Foreman”序列的第50幀的一個(gè)典型的的曲線。從圖6中,可以看出在兩個(gè)比特率的DCT系數(shù)殘余的輪廓對(duì)于低頻的殘余尤其不同。如果SLS在100kbps的殘余被編碼在FGS增強(qiáng)層,在300kbps比較FGS和SLS,明顯地在FGS殘余在傳輸側(cè)的位平面斷開(kāi)點(diǎn)導(dǎo)致了FGS和SLS編碼之間的質(zhì)量差距。然而,如果通過(guò)FW低頻率的殘余得到了位平面編碼中較高的優(yōu)先權(quán),則在傳輸側(cè)的同一位平面斷開(kāi)點(diǎn)將導(dǎo)致在接收側(cè)的較小的低頻率殘余衰落,這將為FGS層帶來(lái)較好的輸出質(zhì)量。FGS數(shù)量被這兩個(gè)比特率之間的殘余差值支配。較低的頻率殘余得到的補(bǔ)償越多,則在300kbps的FGS和SLS之間的質(zhì)量差距越小。
接下來(lái),差值繪圖系統(tǒng)18(圖1)繪制兩個(gè)DCT殘余曲線的平均殘余差值曲線。圖7描述了一個(gè)典型的的曲線,它示出了圖6的兩個(gè)曲線的平均殘余曲線的差值曲線60(即,在100kbps的曲線減去在300kbps的曲線)。差值曲線60根據(jù)相應(yīng)于DCT Z字形掃描線的DCT系數(shù)位置繪制,如上所示。階梯曲線填充系統(tǒng)20接著將一階梯曲線62匹配到差值曲線60。
用基于兩個(gè)不同的比特率(例如,100kbps和300kbps比特率)的平均DCT殘余的殘余差值作為指導(dǎo),F(xiàn)W矩陣加權(quán)使用匹配到殘余差值之形狀的階梯曲線62進(jìn)行選擇。每個(gè)DCT系數(shù)的匹配階梯值則以如上所述的相同的Z形配置映射到FW矩陣。例如,在一個(gè)由64個(gè)元素組成的、以從左上到右下以遵循能量消耗的Z字形線中的四象限矩陣中,來(lái)自階梯曲線的DCT系數(shù)將被設(shè)置在FW矩陣中,如下所示1 2 6 7 |15 16 28 293 5 8 14|17 27 30 434 9 13 18|26 31 42 4410 12 19 25|32 41 45 54---------+---------11 20 24 33|40 46 53 5521 23 34 39|47 52 56 6122 35 38 48|51 57 60 6236 37 49 50|58 59 63 64一個(gè)典型的的FW矩陣包含了實(shí)際系數(shù)值,看起如下4433211043321100332110003211000021100000110000001000000000000000]]>應(yīng)當(dāng)注意到在系統(tǒng)實(shí)現(xiàn)中所采用的位平面的總數(shù)會(huì)限制FW矩陣的加權(quán)。特別地,當(dāng)一個(gè)或多個(gè)由階梯匹配所選定的加權(quán)大于位平面總數(shù)的上限時(shí),該加權(quán)應(yīng)當(dāng)被加權(quán)調(diào)整系統(tǒng)21規(guī)格化。舉例來(lái)說(shuō),在圖6中,第一DCT系數(shù)有一個(gè)7的加權(quán)。然而,如果位平面的數(shù)目限制到6,第一系數(shù)的加權(quán)將超過(guò)上限。在此情況下,加權(quán)調(diào)整系統(tǒng)21將通過(guò)必要地向左移位直到第一系數(shù)的加權(quán)等于可用的位平面的總數(shù)的上限,來(lái)修改生成的階梯曲線。照此,該規(guī)格化的階梯曲線保持并行于原始的階梯曲線。可以理解,其它的調(diào)整算法同樣可被使用而不脫離本發(fā)明的范圍。
用于“Foreman”序列(即一個(gè)室外場(chǎng)景和一個(gè)熒光屏(face))的兩個(gè)不同場(chǎng)景的兩個(gè)典型的的階梯曲線匹配的FW矩陣示于圖8中。
參見(jiàn)圖2,一個(gè)FGS增強(qiáng)層編碼系統(tǒng)50被示出,它包括(1)一個(gè)FGS編碼器32,用于編碼視頻數(shù)據(jù)30,和(2)一個(gè)FGS增強(qiáng)層解碼器40,用于解碼所編碼的增強(qiáng)層視頻數(shù)據(jù)38和生成解碼的視頻數(shù)據(jù)46。FGS編碼器32包括一個(gè)序列分析系統(tǒng)34,一個(gè)矩陣選擇系統(tǒng)36,和如上所述的從FW矩陣生成系統(tǒng)10中生成的一組FW矩陣22。序列分析系統(tǒng)34檢查進(jìn)來(lái)的視頻數(shù)據(jù)30以確定一個(gè)或多個(gè)場(chǎng)景特征(例如,高活動(dòng)性,低亮度,等等)。矩陣選擇系統(tǒng)36接著從相應(yīng)于該場(chǎng)景特征的一組FW矩陣22中選擇一個(gè)矩陣44。接著所選擇的FW矩陣44被用于編碼視頻數(shù)據(jù)30,所選擇的FW矩陣44也被包括在編碼的增強(qiáng)層視頻數(shù)據(jù)38的輸出序列的報(bào)頭中。當(dāng)場(chǎng)景特征變化時(shí),一個(gè)新的FW矩陣44能被更新并被重傳。
為每種類型的場(chǎng)景選擇一個(gè)FW矩陣。因此,如果一個(gè)場(chǎng)景的改變沒(méi)有被檢測(cè)到,F(xiàn)W矩陣選擇只需要實(shí)施一次。當(dāng)場(chǎng)景改變(或殘余特征改變)發(fā)生時(shí),F(xiàn)W矩陣需要被重新選擇并發(fā)射。
場(chǎng)景改變可以通過(guò)分析場(chǎng)景特征來(lái)識(shí)別,場(chǎng)景特征比如為在EL數(shù)據(jù)中的亮度、運(yùn)動(dòng)、活動(dòng)性等等。一個(gè)魯棒場(chǎng)景改變檢測(cè)算法可用來(lái)在序列特征上適應(yīng)FW,例如,通過(guò)使用運(yùn)動(dòng)矢量,復(fù)雜性測(cè)量XI,時(shí)間相關(guān)計(jì)算或者這些的組合。這些場(chǎng)景特征參數(shù)不加入顯著的復(fù)雜性,因?yàn)橐呀?jīng)在基本層編碼/率-控制中計(jì)算過(guò)的參數(shù)可以被重新使用。
再參見(jiàn)圖2,F(xiàn)GS增強(qiáng)層解碼器40被描述為接收并解碼編碼的增強(qiáng)層視頻數(shù)據(jù)38。正如提到的,選擇的FW矩陣44在序列的報(bào)頭中和編碼的增強(qiáng)層視頻數(shù)據(jù)38一起被發(fā)射,并被FGS解碼器40用來(lái)處理和解碼所編碼的增強(qiáng)層視頻數(shù)據(jù)38。當(dāng)一個(gè)新的FW矩陣被接收并被解碼,適配系統(tǒng)41替換舊的FW矩陣,并且新的FW矩陣被用來(lái)解碼后面的視頻比特流。
應(yīng)當(dāng)懂得在此描述的系統(tǒng)、功能、機(jī)構(gòu)、方法和模塊可以在硬件、軟件、或者在硬件和軟件的混合中實(shí)現(xiàn)。它們可以由任何類型的計(jì)算機(jī)系統(tǒng)或其它的適于完成在此描述的方法的裝置來(lái)實(shí)現(xiàn)。硬件和軟件的一個(gè)典型的混合可以為一個(gè)公用的計(jì)算機(jī)系統(tǒng),程序的裝載和執(zhí)行時(shí),控制該計(jì)算機(jī)系統(tǒng),以完成在此描述的方法。可選擇地,可以使用一個(gè)特定用途的計(jì)算機(jī),該計(jì)算機(jī)包含特定的硬件以完成發(fā)明的一個(gè)或多個(gè)功能的任務(wù)。本發(fā)明也可以嵌入在一個(gè)計(jì)算機(jī)程序產(chǎn)品中,該計(jì)算機(jī)程序產(chǎn)品包括了能實(shí)現(xiàn)在此描述的方法和功能的所有的特征,并且在裝載到一個(gè)計(jì)算機(jī)系統(tǒng)時(shí),能完成這些方法和功能。計(jì)算機(jī)程序、軟件程序、程序、程序產(chǎn)品、或軟件,在現(xiàn)有的上下文中意指指令集的任何的表達(dá)、以任意的語(yǔ)言、碼和符號(hào),指令集使該系統(tǒng)具有信息處理能力以執(zhí)行某個(gè)特定的功能,或者直接地或者在經(jīng)過(guò)下列兩種處理之后(a)轉(zhuǎn)換到另一種語(yǔ)言、碼或符號(hào);和/或(b)以不同的物質(zhì)形式再現(xiàn)。
為了圖示和說(shuō)明的目的,前面已經(jīng)給出了對(duì)本發(fā)明的優(yōu)選實(shí)施例的描述。這些描述不是作為對(duì)發(fā)明的窮舉,也不是將發(fā)明局限在公開(kāi)的精確的形式,并且明顯地,在上述的教導(dǎo)下可能做出許多的修改及變形。這樣的對(duì)本領(lǐng)域技術(shù)人員來(lái)說(shuō)是顯而易見(jiàn)的修改及變形被包括在本發(fā)明的范圍之內(nèi),如同本發(fā)明所附的權(quán)利要求所限定的一樣。
權(quán)利要求
1.一個(gè)系統(tǒng)[10],用于生成一個(gè)頻率加權(quán)(FW)矩陣[22],以在細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng)[50]中使用的,該系統(tǒng)包括一個(gè)系統(tǒng)[16],用于為既編碼在預(yù)定的基本層比特率[14]還編碼在接近3倍的預(yù)定基本層比特率的一個(gè)抽樣視頻幀[12]生成平均離散余弦變換(DCT)殘余;一個(gè)系統(tǒng)[18],用于繪制所生成的平均DCT殘余的差值曲線,其中該差值曲線通過(guò)相應(yīng)于一個(gè)DCT Z字形掃描線的DCT系數(shù)位置來(lái)繪制;和一個(gè)系統(tǒng)[20],用于將一個(gè)階梯曲線匹配到差值曲線。
2.權(quán)利要求1所述的系統(tǒng)[10],其中在階梯曲線上處于每個(gè)DCT系數(shù)位置上的值在相應(yīng)于DCT Z字形掃描線的位置上被映射到FW矩陣。
3.權(quán)利要求2所述的系統(tǒng)[10],還包括一個(gè)加權(quán)調(diào)整系統(tǒng)[21],用于在當(dāng)從階梯曲線確定的加權(quán)大于在FGS視頻編碼系統(tǒng)[50]中的位平面數(shù)目的上限時(shí),變更階梯曲線。
4.權(quán)利要求1所述的系統(tǒng)[10],其中抽樣視頻幀[12]從一個(gè)具有預(yù)定的場(chǎng)景特征的抽樣視頻序列中選擇。
5.權(quán)利要求4所述的系統(tǒng)[10],其中預(yù)定的場(chǎng)景特征包括從一個(gè)組中選出的一個(gè)標(biāo)準(zhǔn),該組包括亮度級(jí)、運(yùn)動(dòng)級(jí)和一個(gè)活動(dòng)性級(jí)。
6.權(quán)利要求1所述的系統(tǒng)[10],其中預(yù)定的基本層比特率[14]取決于應(yīng)用、分辨率和幀率。
7.一種方法,用于生成頻率加權(quán)(FW)矩陣[22]以在細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng)[50]中使用,該方法包括步驟為編碼在第一比特率的抽樣視頻幀生成相對(duì)于DCT Z字形掃描線位置的平均離散余弦變換(DCT)殘余的第一曲線;為編碼在多倍第一比特率的抽樣視頻幀生成相對(duì)于DCT Z字形掃描線位置的平均離散余弦變換(DCT)殘余的第二曲線;生成第一和第二曲線的差值曲線;將一個(gè)階梯曲線匹配到差值曲線;以及從階梯曲線映射加權(quán)以填充FW矩陣。
8.權(quán)利要求7的方法,其中第一比特率包括一個(gè)基本層比特率[14]。
9.權(quán)利要求8的方法,其中的多倍包括基本層比特率[14]的3倍。
10.權(quán)利要求7的方法,進(jìn)一步地包括步驟當(dāng)從階梯曲線確定的加權(quán)大于在FGS視頻編碼系統(tǒng)[50]中的位平面數(shù)目的上限時(shí),規(guī)格化階梯曲線。
11.權(quán)利要求7的方法,其中的視頻幀從一個(gè)具有預(yù)定場(chǎng)景特征的抽樣視頻序列[12]中選擇。
12.一種細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng)[50],該系統(tǒng)利用頻率加權(quán)(FW)矩陣[44]來(lái)編碼視頻數(shù)據(jù)[30],它包括一個(gè)系統(tǒng)[34],用于確定視頻數(shù)據(jù)的場(chǎng)景特征;以及一個(gè)系統(tǒng)[36],用于從多個(gè)FW矩陣[22]中基于確定的視頻數(shù)據(jù)場(chǎng)景特征來(lái)選擇一個(gè)FW矩陣[44]。
13.權(quán)利要求12所述的FGS視頻編碼系統(tǒng)[50],其中多個(gè)FW矩陣[22]中的每一個(gè)和多個(gè)的預(yù)定的場(chǎng)景特征中的一個(gè)特征相關(guān)。
14.權(quán)利要求13所述的FGS視頻編碼系統(tǒng)[50],其中每個(gè)矩陣的加權(quán)是從為一個(gè)抽樣視頻幀在第一和第二臨界質(zhì)量比特率計(jì)算出的一個(gè)平均離散余弦變換(DCT)殘余的階梯曲線匹配中確定的。
15.權(quán)利要求14所述的FGS視頻編碼系統(tǒng)[50],其中第一和第二臨界質(zhì)量比特率包括基本層比特率[14]和3倍的基本層比特率。
16.權(quán)利要求14所述的FGS視頻編碼系統(tǒng)[50],其中抽樣視頻幀是從一個(gè)具有多個(gè)預(yù)定的場(chǎng)景特征之一的視頻序列中導(dǎo)出的。
17.權(quán)利要求12所述的FGS視頻編碼系統(tǒng)[50],其中所確定的場(chǎng)景特征包括從以下組中選出一個(gè)標(biāo)準(zhǔn),該組包括亮度級(jí)、運(yùn)動(dòng)級(jí)和一個(gè)活動(dòng)級(jí)。
18.一種存儲(chǔ)在可記錄介質(zhì)中的程序產(chǎn)品,用于生成頻率加權(quán)(FW)矩陣以在細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng)[50]中使用,該程序產(chǎn)品包括裝置[16],用于為編碼在第一比特率的抽樣視頻幀生成相對(duì)于DCT Z字形掃描線位置的平均離散余弦變換(DCT)殘余的第一曲線;裝置[16],用于為編碼在多倍第一比特率的抽樣視頻幀生成相對(duì)于DCT Z字形掃描線位置的平均離散余弦變換(DCT)殘余的第二曲線;裝置[18],用于生成第一和第二曲線的差值曲線;裝置[20],用將一個(gè)階梯曲線匹配到差值曲線;用于將從階梯曲線映射的加權(quán)填充到FW矩陣的裝置。
19.權(quán)利要求18的程序產(chǎn)品,其中第一比特率包括一個(gè)基本層比特率[14],并且其中的多倍包括基本層比特率[14]的3倍。
20.權(quán)利要求18的程序產(chǎn)品,進(jìn)一步包括裝置[21],用于在從階梯曲線確定的加權(quán)大于在FGS視頻編碼系統(tǒng)[50]中的位平面數(shù)目的上限時(shí),規(guī)格化階梯曲線。
21.一種細(xì)粒度可分級(jí)(FGS)視頻解碼系統(tǒng)[40],該系統(tǒng)利用頻率加權(quán)(FW)矩陣[44]以解碼編碼的視頻數(shù)據(jù)[38],其中對(duì)FW矩陣[44]的加權(quán)是從平均離散余弦變換(DCT)殘余的差值的階梯曲線匹配確定的,其中平均離散余弦變換(DCT)殘余的差值是在一個(gè)抽樣視頻幀的基本層比特率和接近3倍基本層比特率計(jì)算出來(lái)的。
22.權(quán)利要求21所述的FGS視頻解碼系統(tǒng)[40],進(jìn)一步包括系統(tǒng)[41],用于當(dāng)一個(gè)場(chǎng)景特征改變時(shí)自適應(yīng)地改變FW矩陣[44]。
全文摘要
一種系統(tǒng)(10)和方法,用于生成一個(gè)頻率加權(quán)(FW)矩陣(22),以在細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng)中使用,該系統(tǒng)包括一個(gè)系統(tǒng)(16)用于為一個(gè)既編碼在預(yù)定的基本層比特率還編碼在接近3倍的預(yù)定基本層比特率的抽樣視頻幀繪制與Z字形的DCT掃描線位置相對(duì)的平均離散余弦變換(DCT)殘余曲線;一個(gè)系統(tǒng)(18),用于為一個(gè)既編碼在預(yù)定的基本層比特率還編碼在接近3倍的預(yù)定基本層比特率的抽樣視頻幀生成與Z字形的DCT掃描線位置相對(duì)的DCT殘余的差值曲線;和一個(gè)系統(tǒng)(20),用于將一個(gè)階梯曲線匹配并規(guī)格化到平均差值曲線,其中階梯曲線值可以進(jìn)一步地映射到FW矩陣的加權(quán)中。
文檔編號(hào)H04N7/30GK1579096SQ02821459
公開(kāi)日2005年2月9日 申請(qǐng)日期2002年10月18日 優(yōu)先權(quán)日2001年10月29日
發(fā)明者S·龐, M·范德沙爾 申請(qǐng)人:皇家飛利浦電子股份有限公司