比特率指導(dǎo)的頻率加權(quán)矩陣選擇的制作方法

文檔序號(hào)：7747178閱讀：257來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：比特率指導(dǎo)的頻率加權(quán)矩陣選擇的制作方法
技術(shù)領(lǐng)域：
本發(fā)明一般地涉及編碼視頻的縮放，特別地涉及到為一個(gè)使用細(xì)粒度可分級(jí)(Fine-Granularity-Scalability)(FGS)技術(shù)的系統(tǒng)選擇頻率加權(quán)(FW)矩陣的系統(tǒng)和方法。
細(xì)粒度可分級(jí)(FGS)編碼協(xié)議概要作為2001年3月的MPEG-4標(biāo)準(zhǔn)的一部分被采用。MPEG-4 FGS協(xié)議概要將-個(gè)視頻序列編碼成兩個(gè)具有不同的傳輸優(yōu)先權(quán)的比特流基本層(BL)視頻流和增強(qiáng)層(EL)視頻流，這可以適應(yīng)一個(gè)寬范圍的比特速率。BL使用MPEG-4非升級(jí)編碼方案編碼，MPEG-4非升級(jí)編碼方案使用運(yùn)動(dòng)補(bǔ)償和基于塊的DCT(離散余弦變換)編碼。BL被編碼到一個(gè)可接受的最小比特率(基本層比特率)，以便于在時(shí)變網(wǎng)絡(luò)上的可用帶寬高于基本層比特率。EL在DCT域中使用位平面編碼對(duì)原始信號(hào)和BL信號(hào)之間的差值進(jìn)行編碼。
在增強(qiáng)層的編碼器方，這些DCT-殘余的位平面以一種改進(jìn)的(精細(xì))方式被壓縮。接著在傳輸時(shí)，取決于通過(guò)網(wǎng)絡(luò)的可用帶寬和解碼器容量，只有部分的EL可被發(fā)送。FGS技術(shù)對(duì)于在網(wǎng)絡(luò)上具有可變帶寬的視頻流特別有用，比如因特網(wǎng)視頻流、因特網(wǎng)廣播、蜂窩網(wǎng)絡(luò)或室內(nèi)網(wǎng)絡(luò)的無(wú)線視頻通信、等等。
FGS包括大量的支持各種可升級(jí)的結(jié)構(gòu)并提高了輸出的視覺(jué)質(zhì)量的視頻編碼工具。頻率加權(quán)(FW)就是一種這樣的工具，它對(duì)提高低比特率的編碼的視覺(jué)質(zhì)量特別有用。例如，公知的基本層DCT系數(shù)常規(guī)地沿著從DCT塊的左上到右下的Z字形掃描線分布它們的能量。相應(yīng)地，增強(qiáng)層DCT殘余塊繼承了一個(gè)相似的Z字形能量分布模式。因此，為了確保在較低帶寬限制下的較好編碼質(zhì)量，需要以優(yōu)先的方式發(fā)送較高的能量殘余。FW方法允許對(duì)所選定的ELDCT殘余的位平面移位。因此，和DCT殘余塊同樣大小的一個(gè)“頻率加權(quán)”矩陣，Mfw被定義，其中矩陣的每個(gè)元素Mfw(I)表示了第I個(gè)DCT系數(shù)應(yīng)當(dāng)被移位的位平面的數(shù)目。
圖3圖示了FW在低比特率時(shí)的好處。在左側(cè)，示出在不使用FW情況下EL塊的DCT殘余(用虛線描述)，并且在右側(cè)示出在使用FW的情況下，EL塊的DCT殘余。正如可見(jiàn)的，每個(gè)EL塊包括幾個(gè)位平面，MSB位于頂部。在平面中，DCT系數(shù)殘余向上擴(kuò)展指向MSB。在左邊的情況下，在低比特率，如果在MSB之下的所有的位平面在服務(wù)器被截?cái)啵獯a器將不接收在EL塊的第一象限的DCT系數(shù)殘余。對(duì)于大多數(shù)的視頻序列，DC的較低精確度以及第一AC的EL殘余在解碼器方轉(zhuǎn)化為視覺(jué)質(zhì)量的降低。換言之，如果一個(gè)FW矩陣被使用，其中在DCT方塊中的第一象限具有Mfw(i)＝2，如右側(cè)所示的，該DC和第一AC的EL殘余將成功地編碼到MSB，因此即便在低比特率時(shí)也保證了它們(至少部分地)的傳輸。
和其它的視頻編碼標(biāo)準(zhǔn)相似，MPEG-4只為解碼器標(biāo)準(zhǔn)化了語(yǔ)法以及和它相關(guān)的語(yǔ)義含義。因此，定義創(chuàng)新的算法是系統(tǒng)設(shè)計(jì)者的任務(wù)，該創(chuàng)新的算法以這樣的方式使用FW語(yǔ)法，即FGS編碼的視覺(jué)質(zhì)量可以被顯著地提高。為FGS編碼完成FW，一個(gè)關(guān)鍵步驟在于FW矩陣選擇。能夠基于Z字形能量分布特征通過(guò)給較低的頻率系數(shù)較高的加權(quán)，選擇一個(gè)普通的FW矩陣，反之亦然。然而，普通的能量損耗準(zhǔn)則不能為確定FW矩陣的精確數(shù)量值提供線索。因此，需要有效地選擇一個(gè)FW矩陣。
本發(fā)明解決了上述的問(wèn)題，還有其它的問(wèn)題，通過(guò)提供一個(gè)新穎的FW矩陣選擇方法，該方法在一個(gè)臨界質(zhì)量比特率使用BL DCT殘余差值。在第一方面，本發(fā)明提供了一種生成頻率加權(quán)(FW)矩陣以在細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng)中使用的系統(tǒng)，包括一個(gè)系統(tǒng)，用于為一個(gè)既編碼在預(yù)定的基本層比特率還編碼在接近3倍的預(yù)定基本層比特率的抽樣視頻幀生成平均離散余弦變換(DCT)殘余；一個(gè)系統(tǒng)，用于繪制生成的平均DCT殘余的差值曲線，其中該差值曲線通過(guò)相應(yīng)于一個(gè)DCT Z字形掃描線的DCT系數(shù)位置來(lái)繪制；以及一個(gè)系統(tǒng)，用于將一個(gè)階梯曲線匹配到差值曲線。
第二方面，本發(fā)明提供了一種生成頻率加權(quán)(FW)矩陣以在細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng)中使用的方法，包括步驟為編碼在第一比特率的抽樣視頻幀生成相對(duì)于DCT Z字形掃描線位置的平均離散余弦變換(DCT)殘余的第一曲線；為編碼在多倍第一比特率的抽樣視頻幀生成相對(duì)于DCT Z字形掃描線位置的平均離散余弦變換(DCT)殘余的第二曲線；從第一和第二曲線生成差值曲線；將一個(gè)階梯曲線匹配到差值曲線；并映射階梯曲線的加權(quán)以填充FW矩陣。
第三個(gè)方面，本發(fā)明提供了一種細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng)，該系統(tǒng)利用頻率加權(quán)(FW)矩陣以編碼視頻數(shù)據(jù)，它包括一個(gè)系統(tǒng)，用于確定視頻數(shù)據(jù)的場(chǎng)景特征；和一個(gè)系統(tǒng)，用于從大量的FW矩陣中基于確定的視頻數(shù)據(jù)場(chǎng)景特征來(lái)選擇一個(gè)FW矩陣。
第四個(gè)方面，本發(fā)明提供了一種存儲(chǔ)在可記錄媒體中的程序產(chǎn)品，用于生成頻率加權(quán)(FW)矩陣以在細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng)中使用，該程序產(chǎn)品包括為編碼在第一比特率的抽樣視頻幀生成相對(duì)于DCT Z字形掃描線位置的平均離散余弦變換(DCT)殘余的第一曲線的裝置；為編碼在多倍第一比特率的抽樣視頻幀生成相對(duì)于DCT Z字形掃描線位置的平均離散余弦變換(DCT)殘余的第二曲線的裝置；從第一和第二曲線生成差值曲線的裝置；將一個(gè)階梯曲線匹配到差值曲線的裝置；并映射階梯曲線的加權(quán)以填充FW矩陣的裝置。
第五方面，本發(fā)明提供了一種細(xì)粒度可分級(jí)(FGS)視頻解碼系統(tǒng)，該系統(tǒng)利用頻率加權(quán)(FW)矩陣來(lái)解碼編碼的視頻數(shù)據(jù)，其中FW矩陣的加權(quán)是從平均離散余弦變換(DCT)殘余的差值曲線的階梯曲線匹配得出的，其中平均離散余弦變換(DCT)殘余差值是在一個(gè)抽樣視頻幀的基本層比特率和接近3倍基本層比特率計(jì)算出來(lái)的。
此后將結(jié)合附圖對(duì)本發(fā)明的一個(gè)典型的的實(shí)施例進(jìn)行說(shuō)明，其中相同的標(biāo)號(hào)代表相同的部件，和

圖1描述了根據(jù)本發(fā)明的實(shí)施例的FW矩陣生成系統(tǒng)的方框圖。
圖2描述了根據(jù)本發(fā)明的實(shí)施例的FGS編碼器和FGS解碼器的方框圖。
圖3描述了一個(gè)典型的的頻率加權(quán)位平面。
圖4描述了一個(gè)使用FGS+BL和單層轉(zhuǎn)換編碼的(SLS)Foreman視頻序列的圖形化的比較。
圖5描述對(duì)于Foreman視頻序列、編碼在100kbps和300kbps的BL的DCT殘余差值。
圖6分別為Foreman視頻序列、編碼在100kbps和300kbps的單個(gè)視頻幀的DCT殘余幅度的一個(gè)曲線。
圖7描述了圖6的曲線的平均殘余差值以及匹配階梯曲線。
圖8描述了兩個(gè)不同的視頻序列的平均殘余差值和匹配階梯曲線。
現(xiàn)在參見(jiàn)附圖，圖1描述了一個(gè)頻率加權(quán)(FW)矩陣生成系統(tǒng)10，它接收一個(gè)或多個(gè)抽樣視頻序列12和一個(gè)基本層(BL)比特率14，并輸出一組FW矩陣22。每個(gè)抽樣視頻序列12包括一個(gè)可以典型地被細(xì)粒度可分級(jí)系統(tǒng)FGS系統(tǒng)處理的獨(dú)特的場(chǎng)景類型或特征，如示于圖2中的。因此，例如“抽樣視頻序列A”包含一個(gè)高活動(dòng)性的場(chǎng)景，“抽樣視頻序列B”包含一個(gè)中等活動(dòng)性的場(chǎng)景，并且“抽樣視頻序列C”包含一個(gè)低活動(dòng)性的場(chǎng)景。
FW矩陣生成系統(tǒng)10為每個(gè)輸入的抽樣視頻序列生成一個(gè)獨(dú)特的FW矩陣，以便于每個(gè)FW矩陣和一個(gè)預(yù)定的場(chǎng)景類型相關(guān)。因此，舉例來(lái)說(shuō)，F(xiàn)W矩陣A將對(duì)應(yīng)于一個(gè)高活動(dòng)性場(chǎng)景，F(xiàn)W矩陣B將對(duì)應(yīng)于一個(gè)中等活動(dòng)性場(chǎng)景，F(xiàn)W矩陣C將對(duì)應(yīng)于一個(gè)低活動(dòng)性場(chǎng)景。所生成的FW矩陣22的數(shù)目可根據(jù)期望的FGS應(yīng)用而改變。簡(jiǎn)單的應(yīng)用(比如視頻電話)可以只要求從低活動(dòng)性、低運(yùn)動(dòng)的抽樣視頻序列導(dǎo)出的單個(gè)矩陣。其它比較復(fù)雜的應(yīng)用要求一個(gè)矩陣數(shù)據(jù)庫(kù)，以處理許多不同的場(chǎng)景類型。另外，在一個(gè)場(chǎng)景中的任何的標(biāo)準(zhǔn)(如，活動(dòng)性，運(yùn)動(dòng)，亮度等等)可以用于將一個(gè)抽樣視頻序列(因而，F(xiàn)W矩陣)同其它的相區(qū)別。
在圖1的實(shí)施例中，F(xiàn)W矩陣生成系統(tǒng)10利用DCT殘余生成系統(tǒng)16，一個(gè)殘余差值繪圖系統(tǒng)18，一個(gè)階梯曲線填充系統(tǒng)20和一個(gè)加權(quán)調(diào)整系統(tǒng)21，以生成FW矩陣22。這些系統(tǒng)的運(yùn)行在下面詳細(xì)地描述。
FW矩陣生成系統(tǒng)10從在一個(gè)臨界質(zhì)量比特率計(jì)算的抽樣視頻幀的離散余弦變換(DCT)殘余的差值階梯曲線匹配，來(lái)為每個(gè)矩陣確定加權(quán)，通常包括(1)選定的比特率，和(2)選定的比特率的多倍。臨界比特率可被選擇作為任意值，其取決于例如，特定的應(yīng)用、分辨率/大小、幀率，等等。
在一個(gè)典型的的實(shí)施例中，臨界比特率包括基本層的編碼比特率(RBL)14，和三倍于基本層比特率的編碼比特率(即，3*RBL)。各種實(shí)驗(yàn)已經(jīng)示出在SLS和FGS之間的最大質(zhì)量差距出現(xiàn)在接近3倍的FGS BL比特率。舉例來(lái)說(shuō)，下面的關(guān)于“Foreman”序列的分析示出RBL和3*RBL為臨界比特率。圖4示出了用一個(gè)非可分級(jí)(non-scalable)編碼器(即，SLS-單層轉(zhuǎn)接)和用一個(gè)具有100kbps的基本層比特率的FGS編碼器編碼的峰值信噪比(PSNR)。如同所能見(jiàn)到的，在100kbps-1Mbps的比特率范圍之內(nèi)，在FGS和非可分級(jí)編碼器之間的最大的PSNR質(zhì)量惡化差距在300kbps附近。因此，F(xiàn)GS和SLS在3*RBL具有臨界質(zhì)量差距。因此，在該實(shí)施例中，F(xiàn)W矩陣選擇是基于在臨界質(zhì)量比特率3*RBL和RBL的平均DCT殘余值，并且使用在這些比特率的DCT殘余的FW矩陣選擇比在其它的比特率上的選擇具有更好的效果。應(yīng)當(dāng)明白其它的臨界質(zhì)量比特率和/或RBL的多倍(例如，2.5，3.5，4，4.5等等)也可用于限定臨界質(zhì)量差距，而不會(huì)脫離本發(fā)明的范圍。
圖5示出了在100kbps和300kbps比特率的“Foreman”序列平均殘余的基于幀的差值的一個(gè)3-D網(wǎng)孔。在此情況下，對(duì)于“Foreman”序列這里有兩種場(chǎng)景類型。很顯然，對(duì)于某個(gè)特定的場(chǎng)景特征，殘余特征對(duì)于該場(chǎng)景中的所有幀都是相似的。因此，來(lái)自抽樣視頻序列的單個(gè)的幀可用來(lái)為所有的具有相似的場(chǎng)景特征的幀生成FW矩陣。
回來(lái)參見(jiàn)圖1，F(xiàn)W矩陣生成系統(tǒng)10的運(yùn)行如下描述。DCT殘余生成系統(tǒng)16為在臨界質(zhì)量比特率(在此情況下，為RBL和3*RBL)的輸入視頻序列的一個(gè)選定的幀生成(并繪制)平均DCT殘余。每個(gè)的平均DCT殘余被繪制為它們?cè)贒CT數(shù)據(jù)方塊中的位置的函數(shù)。優(yōu)選地，殘余從自左上至右下的Z字形線(即，“DCT”Z字形掃描線)中提取出來(lái)以跟隨能量消耗的趨勢(shì)。在此處示出的例子中，系數(shù)號(hào)1-64為在一個(gè)8*8 DCT方塊中的每個(gè)殘余提供了Z字形位置。
1 2 6 7 |15 16 28 293 5 8 14|17 27 30 434 9 13 18|26 31 42 4410 12 19 25|32 41 45 54---------+----------11 20 24 33|40 46 53 5521 23 34 39|47 52 56 6122 35 38 48|51 57 60 6236 37 49 50|58 59 63 64該64殘余值之后將如圖6所示的被繪制。圖6示出了圖5的用一個(gè)MPEG-4非可分級(jí)編碼器編碼在100kbps和300kbps比特率的“Foreman”序列的第50幀的一個(gè)典型的的曲線。從圖6中，可以看出在兩個(gè)比特率的DCT系數(shù)殘余的輪廓對(duì)于低頻的殘余尤其不同。如果SLS在100kbps的殘余被編碼在FGS增強(qiáng)層，在300kbps比較FGS和SLS，明顯地在FGS殘余在傳輸側(cè)的位平面斷開(kāi)點(diǎn)導(dǎo)致了FGS和SLS編碼之間的質(zhì)量差距。然而，如果通過(guò)FW低頻率的殘余得到了位平面編碼中較高的優(yōu)先權(quán)，則在傳輸側(cè)的同一位平面斷開(kāi)點(diǎn)將導(dǎo)致在接收側(cè)的較小的低頻率殘余衰落，這將為FGS層帶來(lái)較好的輸出質(zhì)量。FGS數(shù)量被這兩個(gè)比特率之間的殘余差值支配。較低的頻率殘余得到的補(bǔ)償越多，則在300kbps的FGS和SLS之間的質(zhì)量差距越小。
接下來(lái)，差值繪圖系統(tǒng)18(圖1)繪制兩個(gè)DCT殘余曲線的平均殘余差值曲線。圖7描述了一個(gè)典型的的曲線，它示出了圖6的兩個(gè)曲線的平均殘余曲線的差值曲線60(即，在100kbps的曲線減去在300kbps的曲線)。差值曲線60根據(jù)相應(yīng)于DCT Z字形掃描線的DCT系數(shù)位置繪制，如上所示。階梯曲線填充系統(tǒng)20接著將一階梯曲線62匹配到差值曲線60。
用基于兩個(gè)不同的比特率(例如，100kbps和300kbps比特率)的平均DCT殘余的殘余差值作為指導(dǎo)，F(xiàn)W矩陣加權(quán)使用匹配到殘余差值之形狀的階梯曲線62進(jìn)行選擇。每個(gè)DCT系數(shù)的匹配階梯值則以如上所述的相同的Z形配置映射到FW矩陣。例如，在一個(gè)由64個(gè)元素組成的、以從左上到右下以遵循能量消耗的Z字形線中的四象限矩陣中，來(lái)自階梯曲線的DCT系數(shù)將被設(shè)置在FW矩陣中，如下所示1 2 6 7 |15 16 28 293 5 8 14|17 27 30 434 9 13 18|26 31 42 4410 12 19 25|32 41 45 54---------+---------11 20 24 33|40 46 53 5521 23 34 39|47 52 56 6122 35 38 48|51 57 60 6236 37 49 50|58 59 63 64一個(gè)典型的的FW矩陣包含了實(shí)際系數(shù)值，看起如下4433211043321100332110003211000021100000110000001000000000000000]]>應(yīng)當(dāng)注意到在系統(tǒng)實(shí)現(xiàn)中所采用的位平面的總數(shù)會(huì)限制FW矩陣的加權(quán)。特別地，當(dāng)一個(gè)或多個(gè)由階梯匹配所選定的加權(quán)大于位平面總數(shù)的上限時(shí)，該加權(quán)應(yīng)當(dāng)被加權(quán)調(diào)整系統(tǒng)21規(guī)格化。舉例來(lái)說(shuō)，在圖6中，第一DCT系數(shù)有一個(gè)7的加權(quán)。然而，如果位平面的數(shù)目限制到6，第一系數(shù)的加權(quán)將超過(guò)上限。在此情況下，加權(quán)調(diào)整系統(tǒng)21將通過(guò)必要地向左移位直到第一系數(shù)的加權(quán)等于可用的位平面的總數(shù)的上限，來(lái)修改生成的階梯曲線。照此，該規(guī)格化的階梯曲線保持并行于原始的階梯曲線。可以理解，其它的調(diào)整算法同樣可被使用而不脫離本發(fā)明的范圍。
用于“Foreman”序列(即一個(gè)室外場(chǎng)景和一個(gè)熒光屏(face))的兩個(gè)不同場(chǎng)景的兩個(gè)典型的的階梯曲線匹配的FW矩陣示于圖8中。
參見(jiàn)圖2，一個(gè)FGS增強(qiáng)層編碼系統(tǒng)50被示出，它包括(1)一個(gè)FGS編碼器32，用于編碼視頻數(shù)據(jù)30，和(2)一個(gè)FGS增強(qiáng)層解碼器40，用于解碼所編碼的增強(qiáng)層視頻數(shù)據(jù)38和生成解碼的視頻數(shù)據(jù)46。FGS編碼器32包括一個(gè)序列分析系統(tǒng)34，一個(gè)矩陣選擇系統(tǒng)36，和如上所述的從FW矩陣生成系統(tǒng)10中生成的一組FW矩陣22。序列分析系統(tǒng)34檢查進(jìn)來(lái)的視頻數(shù)據(jù)30以確定一個(gè)或多個(gè)場(chǎng)景特征(例如，高活動(dòng)性，低亮度，等等)。矩陣選擇系統(tǒng)36接著從相應(yīng)于該場(chǎng)景特征的一組FW矩陣22中選擇一個(gè)矩陣44。接著所選擇的FW矩陣44被用于編碼視頻數(shù)據(jù)30，所選擇的FW矩陣44也被包括在編碼的增強(qiáng)層視頻數(shù)據(jù)38的輸出序列的報(bào)頭中。當(dāng)場(chǎng)景特征變化時(shí)，一個(gè)新的FW矩陣44能被更新并被重傳。
為每種類型的場(chǎng)景選擇一個(gè)FW矩陣。因此，如果一個(gè)場(chǎng)景的改變沒(méi)有被檢測(cè)到，F(xiàn)W矩陣選擇只需要實(shí)施一次。當(dāng)場(chǎng)景改變(或殘余特征改變)發(fā)生時(shí)，F(xiàn)W矩陣需要被重新選擇并發(fā)射。
場(chǎng)景改變可以通過(guò)分析場(chǎng)景特征來(lái)識(shí)別，場(chǎng)景特征比如為在EL數(shù)據(jù)中的亮度、運(yùn)動(dòng)、活動(dòng)性等等。一個(gè)魯棒場(chǎng)景改變檢測(cè)算法可用來(lái)在序列特征上適應(yīng)FW，例如，通過(guò)使用運(yùn)動(dòng)矢量，復(fù)雜性測(cè)量XI，時(shí)間相關(guān)計(jì)算或者這些的組合。這些場(chǎng)景特征參數(shù)不加入顯著的復(fù)雜性，因?yàn)橐呀?jīng)在基本層編碼/率-控制中計(jì)算過(guò)的參數(shù)可以被重新使用。
再參見(jiàn)圖2，F(xiàn)GS增強(qiáng)層解碼器40被描述為接收并解碼編碼的增強(qiáng)層視頻數(shù)據(jù)38。正如提到的，選擇的FW矩陣44在序列的報(bào)頭中和編碼的增強(qiáng)層視頻數(shù)據(jù)38一起被發(fā)射，并被FGS解碼器40用來(lái)處理和解碼所編碼的增強(qiáng)層視頻數(shù)據(jù)38。當(dāng)一個(gè)新的FW矩陣被接收并被解碼，適配系統(tǒng)41替換舊的FW矩陣，并且新的FW矩陣被用來(lái)解碼后面的視頻比特流。
應(yīng)當(dāng)懂得在此描述的系統(tǒng)、功能、機(jī)構(gòu)、方法和模塊可以在硬件、軟件、或者在硬件和軟件的混合中實(shí)現(xiàn)。它們可以由任何類型的計(jì)算機(jī)系統(tǒng)或其它的適于完成在此描述的方法的裝置來(lái)實(shí)現(xiàn)。硬件和軟件的一個(gè)典型的混合可以為一個(gè)公用的計(jì)算機(jī)系統(tǒng)，程序的裝載和執(zhí)行時(shí)，控制該計(jì)算機(jī)系統(tǒng)，以完成在此描述的方法。可選擇地，可以使用一個(gè)特定用途的計(jì)算機(jī)，該計(jì)算機(jī)包含特定的硬件以完成發(fā)明的一個(gè)或多個(gè)功能的任務(wù)。本發(fā)明也可以嵌入在一個(gè)計(jì)算機(jī)程序產(chǎn)品中，該計(jì)算機(jī)程序產(chǎn)品包括了能實(shí)現(xiàn)在此描述的方法和功能的所有的特征，并且在裝載到一個(gè)計(jì)算機(jī)系統(tǒng)時(shí)，能完成這些方法和功能。計(jì)算機(jī)程序、軟件程序、程序、程序產(chǎn)品、或軟件，在現(xiàn)有的上下文中意指指令集的任何的表達(dá)、以任意的語(yǔ)言、碼和符號(hào)，指令集使該系統(tǒng)具有信息處理能力以執(zhí)行某個(gè)特定的功能，或者直接地或者在經(jīng)過(guò)下列兩種處理之后(a)轉(zhuǎn)換到另一種語(yǔ)言、碼或符號(hào)；和/或(b)以不同的物質(zhì)形式再現(xiàn)。
為了圖示和說(shuō)明的目的，前面已經(jīng)給出了對(duì)本發(fā)明的優(yōu)選實(shí)施例的描述。這些描述不是作為對(duì)發(fā)明的窮舉，也不是將發(fā)明局限在公開(kāi)的精確的形式，并且明顯地，在上述的教導(dǎo)下可能做出許多的修改及變形。這樣的對(duì)本領(lǐng)域技術(shù)人員來(lái)說(shuō)是顯而易見(jiàn)的修改及變形被包括在本發(fā)明的范圍之內(nèi)，如同本發(fā)明所附的權(quán)利要求所限定的一樣。
權(quán)利要求
1.一個(gè)系統(tǒng)[10]，用于生成一個(gè)頻率加權(quán)(FW)矩陣[22]，以在細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng)[50]中使用的，該系統(tǒng)包括一個(gè)系統(tǒng)[16]，用于為既編碼在預(yù)定的基本層比特率[14]還編碼在接近3倍的預(yù)定基本層比特率的一個(gè)抽樣視頻幀[12]生成平均離散余弦變換(DCT)殘余；一個(gè)系統(tǒng)[18]，用于繪制所生成的平均DCT殘余的差值曲線，其中該差值曲線通過(guò)相應(yīng)于一個(gè)DCT Z字形掃描線的DCT系數(shù)位置來(lái)繪制；和一個(gè)系統(tǒng)[20]，用于將一個(gè)階梯曲線匹配到差值曲線。
2.權(quán)利要求1所述的系統(tǒng)[10]，其中在階梯曲線上處于每個(gè)DCT系數(shù)位置上的值在相應(yīng)于DCT Z字形掃描線的位置上被映射到FW矩陣。
3.權(quán)利要求2所述的系統(tǒng)[10]，還包括一個(gè)加權(quán)調(diào)整系統(tǒng)[21]，用于在當(dāng)從階梯曲線確定的加權(quán)大于在FGS視頻編碼系統(tǒng)[50]中的位平面數(shù)目的上限時(shí)，變更階梯曲線。
4.權(quán)利要求1所述的系統(tǒng)[10]，其中抽樣視頻幀[12]從一個(gè)具有預(yù)定的場(chǎng)景特征的抽樣視頻序列中選擇。
5.權(quán)利要求4所述的系統(tǒng)[10]，其中預(yù)定的場(chǎng)景特征包括從一個(gè)組中選出的一個(gè)標(biāo)準(zhǔn)，該組包括亮度級(jí)、運(yùn)動(dòng)級(jí)和一個(gè)活動(dòng)性級(jí)。
6.權(quán)利要求1所述的系統(tǒng)[10]，其中預(yù)定的基本層比特率[14]取決于應(yīng)用、分辨率和幀率。
7.一種方法，用于生成頻率加權(quán)(FW)矩陣[22]以在細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng)[50]中使用，該方法包括步驟為編碼在第一比特率的抽樣視頻幀生成相對(duì)于DCT Z字形掃描線位置的平均離散余弦變換(DCT)殘余的第一曲線；為編碼在多倍第一比特率的抽樣視頻幀生成相對(duì)于DCT Z字形掃描線位置的平均離散余弦變換(DCT)殘余的第二曲線；生成第一和第二曲線的差值曲線；將一個(gè)階梯曲線匹配到差值曲線；以及從階梯曲線映射加權(quán)以填充FW矩陣。
8.權(quán)利要求7的方法，其中第一比特率包括一個(gè)基本層比特率[14]。
9.權(quán)利要求8的方法，其中的多倍包括基本層比特率[14]的3倍。
10.權(quán)利要求7的方法，進(jìn)一步地包括步驟當(dāng)從階梯曲線確定的加權(quán)大于在FGS視頻編碼系統(tǒng)[50]中的位平面數(shù)目的上限時(shí)，規(guī)格化階梯曲線。
11.權(quán)利要求7的方法，其中的視頻幀從一個(gè)具有預(yù)定場(chǎng)景特征的抽樣視頻序列[12]中選擇。
12.一種細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng)[50]，該系統(tǒng)利用頻率加權(quán)(FW)矩陣[44]來(lái)編碼視頻數(shù)據(jù)[30]，它包括一個(gè)系統(tǒng)[34]，用于確定視頻數(shù)據(jù)的場(chǎng)景特征；以及一個(gè)系統(tǒng)[36]，用于從多個(gè)FW矩陣[22]中基于確定的視頻數(shù)據(jù)場(chǎng)景特征來(lái)選擇一個(gè)FW矩陣[44]。
13.權(quán)利要求12所述的FGS視頻編碼系統(tǒng)[50]，其中多個(gè)FW矩陣[22]中的每一個(gè)和多個(gè)的預(yù)定的場(chǎng)景特征中的一個(gè)特征相關(guān)。
14.權(quán)利要求13所述的FGS視頻編碼系統(tǒng)[50]，其中每個(gè)矩陣的加權(quán)是從為一個(gè)抽樣視頻幀在第一和第二臨界質(zhì)量比特率計(jì)算出的一個(gè)平均離散余弦變換(DCT)殘余的階梯曲線匹配中確定的。
15.權(quán)利要求14所述的FGS視頻編碼系統(tǒng)[50]，其中第一和第二臨界質(zhì)量比特率包括基本層比特率[14]和3倍的基本層比特率。
16.權(quán)利要求14所述的FGS視頻編碼系統(tǒng)[50]，其中抽樣視頻幀是從一個(gè)具有多個(gè)預(yù)定的場(chǎng)景特征之一的視頻序列中導(dǎo)出的。
17.權(quán)利要求12所述的FGS視頻編碼系統(tǒng)[50]，其中所確定的場(chǎng)景特征包括從以下組中選出一個(gè)標(biāo)準(zhǔn)，該組包括亮度級(jí)、運(yùn)動(dòng)級(jí)和一個(gè)活動(dòng)級(jí)。
18.一種存儲(chǔ)在可記錄介質(zhì)中的程序產(chǎn)品，用于生成頻率加權(quán)(FW)矩陣以在細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng)[50]中使用，該程序產(chǎn)品包括裝置[16]，用于為編碼在第一比特率的抽樣視頻幀生成相對(duì)于DCT Z字形掃描線位置的平均離散余弦變換(DCT)殘余的第一曲線；裝置[16]，用于為編碼在多倍第一比特率的抽樣視頻幀生成相對(duì)于DCT Z字形掃描線位置的平均離散余弦變換(DCT)殘余的第二曲線；裝置[18]，用于生成第一和第二曲線的差值曲線；裝置[20]，用將一個(gè)階梯曲線匹配到差值曲線；用于將從階梯曲線映射的加權(quán)填充到FW矩陣的裝置。
19.權(quán)利要求18的程序產(chǎn)品，其中第一比特率包括一個(gè)基本層比特率[14]，并且其中的多倍包括基本層比特率[14]的3倍。
20.權(quán)利要求18的程序產(chǎn)品，進(jìn)一步包括裝置[21]，用于在從階梯曲線確定的加權(quán)大于在FGS視頻編碼系統(tǒng)[50]中的位平面數(shù)目的上限時(shí)，規(guī)格化階梯曲線。
21.一種細(xì)粒度可分級(jí)(FGS)視頻解碼系統(tǒng)[40]，該系統(tǒng)利用頻率加權(quán)(FW)矩陣[44]以解碼編碼的視頻數(shù)據(jù)[38]，其中對(duì)FW矩陣[44]的加權(quán)是從平均離散余弦變換(DCT)殘余的差值的階梯曲線匹配確定的，其中平均離散余弦變換(DCT)殘余的差值是在一個(gè)抽樣視頻幀的基本層比特率和接近3倍基本層比特率計(jì)算出來(lái)的。
22.權(quán)利要求21所述的FGS視頻解碼系統(tǒng)[40]，進(jìn)一步包括系統(tǒng)[41]，用于當(dāng)一個(gè)場(chǎng)景特征改變時(shí)自適應(yīng)地改變FW矩陣[44]。
全文摘要
一種系統(tǒng)(10)和方法，用于生成一個(gè)頻率加權(quán)(FW)矩陣(22)，以在細(xì)粒度可分級(jí)(FGS)視頻編碼系統(tǒng)中使用，該系統(tǒng)包括一個(gè)系統(tǒng)(16)用于為一個(gè)既編碼在預(yù)定的基本層比特率還編碼在接近3倍的預(yù)定基本層比特率的抽樣視頻幀繪制與Z字形的DCT掃描線位置相對(duì)的平均離散余弦變換(DCT)殘余曲線；一個(gè)系統(tǒng)(18)，用于為一個(gè)既編碼在預(yù)定的基本層比特率還編碼在接近3倍的預(yù)定基本層比特率的抽樣視頻幀生成與Z字形的DCT掃描線位置相對(duì)的DCT殘余的差值曲線；和一個(gè)系統(tǒng)(20)，用于將一個(gè)階梯曲線匹配并規(guī)格化到平均差值曲線，其中階梯曲線值可以進(jìn)一步地映射到FW矩陣的加權(quán)中。
文檔編號(hào)H04N7/30GK1579096SQ02821459
公開(kāi)日2005年2月9日申請(qǐng)日期2002年10月18日優(yōu)先權(quán)日2001年10月29日
發(fā)明者S·龐, M·范德沙爾申請(qǐng)人:皇家飛利浦電子股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：S.龐;M.范德沙爾
技術(shù)所有人：皇家飛利浦電子股份有限公司
我是此專利的發(fā)明人

上一篇：壓縮的制作方法
上一篇：維持及/或在質(zhì)量上改善一繼電器系統(tǒng)上之通訊信道的方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開(kāi)發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開(kāi)發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

加權(quán)矩陣相關(guān)技術(shù)

頻率加權(quán)相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

比特率指導(dǎo)的頻率加權(quán)矩陣選擇的制作方法