專利名稱:減少視頻譯碼器處理能力需求的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及減少視頻譯碼器處理能力需求的一種方法,更具體地說,涉及數(shù)字式視頻譯碼器以及這些譯碼器的計(jì)算需求量的減少。
數(shù)字電視在家用電子領(lǐng)域已經(jīng)得到廣泛應(yīng)用,這在很大程度上由于諸如MPEG1(見國際標(biāo)準(zhǔn)組織制訂的“最高達(dá)1.5Mb每秒用于數(shù)字存儲(chǔ)媒體的移動(dòng)畫面及相關(guān)音頻CD11172編碼,ISO MPEG Document,ISO-IEC/JTC1/SC2/WG11,1994),MPEG2(見“國際標(biāo)準(zhǔn)組織制訂的移動(dòng)畫面及相關(guān)音頻IS1818通用編碼”,ISO MPEG Document,ISO-IEC/JTC1/SC2/WG11,1994)等數(shù)字電視標(biāo)準(zhǔn)的出現(xiàn),以及正在出臺(tái)的MPEG4標(biāo)準(zhǔn)。MPEG4標(biāo)準(zhǔn)包括了在MPEG1和MPEG2標(biāo)準(zhǔn)之上進(jìn)一步附加的功能及質(zhì)量。在MPEG1和MPEG2標(biāo)準(zhǔn)的譯碼器中,有一些有關(guān)譯碼器計(jì)算能力的期望值,必須使它達(dá)到要求以便與各自相應(yīng)標(biāo)準(zhǔn)一致。例如,在MPEG2標(biāo)準(zhǔn)中,主剖面(MainProfile)及主能級(jí)(Main Level)(MP@ML)描述了比特流和相關(guān)視頻上的一系列所有統(tǒng)一的MP@ML譯碼器必須遵守的限制。
在許多場(chǎng)合中,譯碼器缺乏足夠的計(jì)算能力以按照人們的需求對(duì)比特流進(jìn)行譯碼。因特網(wǎng)就是一個(gè)例子,這里可以找到典型的MPEG1視頻比特流并可利用從高端科學(xué)工作站到簡(jiǎn)單的個(gè)人計(jì)算機(jī)等不同的計(jì)算機(jī)對(duì)比特流進(jìn)行譯碼。當(dāng)計(jì)算能力受到限制時(shí),譯碼器能夠減少它的計(jì)算能力需求的一個(gè)途徑就是僅僅使該譯碼器輸出畫面速率放慢到足以完成全部譯碼。這是在個(gè)人計(jì)算機(jī)上運(yùn)行的以軟件為基礎(chǔ)的MPEG1視頻譯碼器所通用的一種方法。另一種方法是階段性地跳過某些畫面的譯碼。例如,雙向預(yù)測(cè)畫面(B pictures)可以被跳過,從而通過畫面遺失有效地減少了譯碼器輸出畫面的速度。MPEG4包含了視頻對(duì)象的概念,這一概念可以用來在一個(gè)場(chǎng)景中描述可分離的對(duì)象的圖象順序。如果場(chǎng)景中包含許多視頻對(duì)象,其中最不重要的視頻對(duì)象可以被丟掉以便把必要的計(jì)算能力用于將重要的視頻對(duì)象進(jìn)行譯碼。
數(shù)字式視頻比特流的豐富程度在不斷增加,而且與之相應(yīng)的計(jì)算能力的需求也在不斷增加。由于可用于視頻譯碼的平臺(tái)的寬范圍,則要求譯碼器在不具有為滿足一致性準(zhǔn)則所需求的全部計(jì)算能力的情況下能夠?qū)Ρ忍亓鬟M(jìn)行譯碼?,F(xiàn)有的諸如圖象顯示速度降低,圖象遺失或視頻對(duì)象遺失等技術(shù)中,對(duì)計(jì)算能力的減少是以影響譯碼視頻圖畫質(zhì)量和幀同步為代價(jià)的。例如,改變圖象顯示速度和圖象遺失會(huì)對(duì)通常稱之為口形同步的音頻和視頻的同步感覺產(chǎn)生影響。它還會(huì)使運(yùn)動(dòng)的畫面出現(xiàn)顛簸。
本發(fā)明的一個(gè)目的在于使視頻譯碼器可減少對(duì)比特流進(jìn)行譯碼的計(jì)算能力的需求而又不影響畫面速度。這樣會(huì)保持口形同步,又照顧了畫面質(zhì)量。它也使得使用圖象遺失技術(shù)時(shí)變得顛簸的場(chǎng)景會(huì)更順暢。類似地,在犧牲圖象質(zhì)量的情況下它將容許場(chǎng)景中出現(xiàn)更多的對(duì)象,因?yàn)橛?jì)算能力可以被分配至更多的視頻對(duì)象上。
本發(fā)明的一個(gè)目的是容許將一比特流統(tǒng)一譯碼的計(jì)算能力不足的視頻譯碼器在不同程度的圖面質(zhì)量下降情況下對(duì)比特流進(jìn)行譯碼。這樣可制造多種多樣的譯碼器,每種都具有不同的成本/性能定位選擇。具有很高計(jì)算能力的昂貴的譯碼器,可以被用來對(duì)比特流進(jìn)行譯碼,其最終質(zhì)量要比計(jì)算能力低,價(jià)格便宜的譯碼器譯碼的效果好得多。利用本發(fā)明,同一比特流可以用具有較寬范圍計(jì)算能力的不同譯碼器進(jìn)行譯碼,得到的是不同程度的可接受的畫面質(zhì)量。
本發(fā)明的一個(gè)目標(biāo)在于降低視頻譯碼器的成本。通過設(shè)計(jì)能夠滿足那些如由MPEG2標(biāo)準(zhǔn)的MP@ML限制條件所施加的約束的視頻譯碼器,必須在譯碼器中建立過量的綜合計(jì)算能力以保證最壞情況下(高度復(fù)雜)也能進(jìn)行比特流實(shí)時(shí)畫面譯碼。換句話說,既使在最壞情況下對(duì)比特流進(jìn)行譯碼,畫面也應(yīng)按時(shí)譯出。然而,使用本發(fā)明,可制造出其性能限制得到滿足時(shí)會(huì)適度降低畫面質(zhì)量的譯碼器。
為了解決上述問題,發(fā)明了減少所述視頻譯碼器處理能力需求的方法。所述處理能力的需求可以基于一個(gè)節(jié)流量進(jìn)行控制。所述節(jié)流量則基于對(duì)一個(gè)或多個(gè)比特流進(jìn)行譯碼所需處理能力的一個(gè)或多個(gè)測(cè)量值、所述譯碼處理器處理容量的一個(gè)或多個(gè)測(cè)量值、或者是這些測(cè)量值的某些組合。
對(duì)一個(gè)比特流進(jìn)行譯碼所需處理能力的測(cè)量可以包括對(duì)所述比特流中的語法成份的指示,所述比特流需要的處理方式的指示,所述比特流需要的處理量的指示,或者是這些指示的某些組合。
處理能力需求的減少是通過以某種方式限制所述譯碼器功能來減少用于完成一個(gè)或多個(gè)譯碼器功能的處理能力來實(shí)現(xiàn)的。
對(duì)譯碼器功能的限制包括取消一個(gè)或多個(gè)通常用于修正某個(gè)運(yùn)動(dòng)補(bǔ)償基準(zhǔn)的運(yùn)動(dòng)矢量的應(yīng)用。這可以通過從常常被用來修正象素區(qū)域運(yùn)動(dòng)補(bǔ)償基準(zhǔn)預(yù)測(cè)器區(qū)域的運(yùn)動(dòng)矢量與一個(gè)或多個(gè)應(yīng)用被取消的運(yùn)動(dòng)矢量組合中選擇來進(jìn)行。
所述運(yùn)動(dòng)矢量的選擇可以包括對(duì)具有暫時(shí)最長(zhǎng)距離的運(yùn)動(dòng)矢量的選擇,對(duì)與正被譯碼的畫面區(qū)周圍區(qū)域的那些運(yùn)動(dòng)矢量相關(guān)程度最低的運(yùn)動(dòng)矢量的選擇,對(duì)具有立體空間上最長(zhǎng)距離的運(yùn)動(dòng)矢量的選擇,全部運(yùn)動(dòng)矢量的選擇,或者是這些及其它選擇準(zhǔn)則的任意組合。
限制所述譯碼器功能的另一種方法包括有變更運(yùn)動(dòng)矢量,很有可能通過限制一個(gè)或多個(gè)譯碼器運(yùn)動(dòng)矢量的精確度和/或范圍來實(shí)現(xiàn)。
限制所述譯碼器功能的另一種方法包括有減少逆向量化及逆向DCT轉(zhuǎn)換的系數(shù)的數(shù)量,這可以通過有選擇地把這些系數(shù)設(shè)置為替換值(如零)來完成。
限制所述譯碼器功能的另一方法包括有減少用于視頻比特流的彩色成分譯碼的譯碼器處理量。
限制所述譯碼器功能的另一種方法包括有減少在譯碼器輸出的視頻圖畫上執(zhí)行的處理量。
節(jié)流量用來以某種方式控制對(duì)所述譯碼器功能限制的對(duì)象和程度。從一個(gè)或多個(gè)比特流中確定譯碼器的處理能力需求以及譯碼器現(xiàn)有處理容量,并且利用這一信息來決定在所述對(duì)比特流譯碼期間對(duì)所述譯碼器功能進(jìn)行節(jié)流或限制的對(duì)象和程度是可能的。通過限制譯碼器功能,可以減少其處理能力。
做出對(duì)哪種功能以及用何種方式來限制的識(shí)別可以使用對(duì)諸如在所述比特流中的語法成分以及所述比特流需要的處理類型及處理量等的指示信息來進(jìn)行。所述的限制包括基于參考比特流中有哪些運(yùn)動(dòng)矢量存在的指示或其它一些來自于比特流或譯碼器的指示做出的決定的取消對(duì)通常用于修正運(yùn)動(dòng)補(bǔ)償基準(zhǔn)的一個(gè)或多個(gè)運(yùn)動(dòng)矢量的應(yīng)用。
一個(gè)畫面中取消哪些運(yùn)動(dòng)矢量的選擇可以通過下列方式進(jìn)一步細(xì)化選擇暫時(shí)具有最長(zhǎng)距離的那此運(yùn)動(dòng)矢量,選擇與被譯畫面區(qū)周圍區(qū)域的那些運(yùn)動(dòng)矢量相關(guān)程度最低的運(yùn)動(dòng)矢量,選擇具有立體空間上最長(zhǎng)矩離的那些運(yùn)動(dòng)矢量,選擇全部運(yùn)動(dòng)矢量,或者是這些及其它選擇準(zhǔn)則的任意組合。
類似地,所述限制可以包括通過對(duì)一個(gè)或多個(gè)譯碼器運(yùn)動(dòng)矢量的精確度和/或范圍的限制或其它的變更。
限制所述譯碼器功能的另一種方法包括減少逆向量化及逆向DCT轉(zhuǎn)換的系數(shù)的數(shù)量,這可以通過有選擇地把這些系數(shù)設(shè)置為容易進(jìn)行逆向量化及逆向DCT轉(zhuǎn)換的替換值比如零來實(shí)現(xiàn)。限制這些譯碼器功能的決定可以基于有關(guān)所述比特流和/或所述譯碼器的信息作出。
限制所述譯碼器功能的另一種方法包括消除部分或全部在對(duì)彩色成分譯碼期間所需的處理。
限制所述譯碼器功能的另一種方法包括限制對(duì)于已譯碼視頻圖象進(jìn)行的處理。
圖1是本發(fā)明第一實(shí)施例的方框圖,圖2是本發(fā)明第二實(shí)施例的方框圖,圖3是使用運(yùn)動(dòng)矢量節(jié)流的流程圖,圖4是使用圖象尺寸和速率的流程圖,圖5為顯示1/2象素運(yùn)動(dòng)補(bǔ)償?shù)膱D,圖6為顯示變更系數(shù)值的圖。
本發(fā)明的第一實(shí)施例如圖1所示,一個(gè)或多個(gè)比特流通過比特流輸入端100,101輸入。視頻譯碼器110為將比特流譯碼并輸出經(jīng)過譯碼的視頻120,121。比特流的處理需求測(cè)量值130及譯碼器處理容量測(cè)量值131從視頻譯碼器110傳送至譯碼器節(jié)流器140。節(jié)流量132從譯碼器節(jié)流器140傳送至視頻譯碼器110。
現(xiàn)在對(duì)圖1所示實(shí)施例的工作過程加以描述。視頻譯碼器110從輸入比特流101中提取比特流處理需求的測(cè)量值并把這些測(cè)量值130傳送至譯碼器節(jié)流器140。視頻譯碼器110還決定了它對(duì)比特流譯碼的處理容量并把該測(cè)量值131傳送至譯碼器節(jié)流器140。譯碼器節(jié)流器140利用這些測(cè)量值130,131來決定如何對(duì)視頻譯碼器110的功能進(jìn)行節(jié)流并把這一節(jié)流量132的信息傳送至視頻譯碼器110。
有可能未得到比特流測(cè)量值130,因而未將之傳送至譯碼器節(jié)流器140。在這種情況下,譯碼器節(jié)流器140決定如何通過使用譯碼器處理容量131測(cè)量值,或其它測(cè)量值對(duì)視頻譯碼器110節(jié)流。也有可能因未得到譯碼器處理容量測(cè)量值131而未將之傳送到譯碼器節(jié)流器140。在這種情況下,譯碼器節(jié)流器140通過使用比特流處理需求130測(cè)量值中其它測(cè)量值來決定如何對(duì)視頻譯碼器110節(jié)流。
也可能未得到比特流測(cè)量值130或譯碼器處理容量測(cè)量值131,因而未將其傳送到譯碼器節(jié)流器140。在這種情況下,譯碼器節(jié)流器140通過使用其它測(cè)量值或使用某個(gè)預(yù)定方法來決定如何對(duì)視頻譯碼器110節(jié)流。例如,有可能依據(jù)一些有關(guān)譯碼器110和譯碼器節(jié)流器140的在對(duì)它們進(jìn)行構(gòu)造設(shè)計(jì)時(shí)即已知的某些信息進(jìn)行節(jié)流。譯碼器節(jié)流器140總可以以相同的方式進(jìn)行節(jié)流。對(duì)這些測(cè)量值的數(shù)量和測(cè)量值的來源在本發(fā)明中未作限制。
圖1所示的實(shí)施例的效果是視頻譯碼器對(duì)它的執(zhí)行需求進(jìn)行節(jié)流的能力。
本發(fā)明第2實(shí)施例如圖2所示。一個(gè)或多個(gè)比特流通過比特流輸入端200,201輸入,視頻譯碼器210對(duì)比特流進(jìn)行譯碼并輸出經(jīng)過譯碼的視頻220,221。輸入比特流202被傳送至比特流指示符提取裝置250,在這里進(jìn)行有關(guān)比特流的測(cè)量。諸如語法成分251,進(jìn)行譯碼所需處理類型252,以及所需處理量253等的指示被傳送至譯碼器節(jié)流器240。譯碼器處理能力231從視頻譯碼器210傳送至譯碼器節(jié)流器240。節(jié)流量232從譯碼器節(jié)流器240傳送至視頻譯碼器210。
現(xiàn)在對(duì)圖2實(shí)施例的工作過程進(jìn)行描述。比特流指示符提取裝置250從輸入比特流202提取比特流處理需求的測(cè)量值。它決定表征比特流內(nèi)容和對(duì)比特流進(jìn)行譯碼所需處理類型及處理量的指示符并把這些指示符251,252,253分別傳送至譯碼器節(jié)流器240。視頻譯碼器210也決定它對(duì)比特流譯碼的容量并把該測(cè)量值231傳送至譯碼器節(jié)流器240。譯碼器節(jié)流器240使用這些指示符230,231來決定視頻譯碼器210的功能如何被節(jié)流并把這一節(jié)流量232的信息傳送至視頻譯碼器210。
可能由比特流指示符提取裝置250得到的某些或全部指示符251,252,253未被譯碼器節(jié)流器240利用。在這種情況下,譯碼器節(jié)流器240通過使用譯碼器處理能力測(cè)量值231或其它測(cè)量值來決定如何對(duì)視頻譯碼器210進(jìn)行節(jié)流。也有可能沒有采用譯碼器處理容量的測(cè)量值231,因而無測(cè)量值被傳送至譯碼器節(jié)流器240。在這種情況下,譯碼器節(jié)流器240通過使用由比特流指示符提取裝置250決定的指示符251,252,253來確定如何對(duì)視頻譯碼器210進(jìn)行節(jié)流。有可能未采用比特流指示符251,252,253或譯碼器處理容量測(cè)量值231,因而無該信息未被傳送至譯碼器節(jié)流器240。在這種情況下,譯碼器節(jié)流器240通過使用另外一些信息,或使用某個(gè)預(yù)定方法決定如何對(duì)視頻譯碼器210進(jìn)行節(jié)流。例如,可以依據(jù)某些有關(guān)譯碼器210和譯碼器節(jié)流器240的在對(duì)它們進(jìn)行構(gòu)造設(shè)計(jì)時(shí)即知的信息進(jìn)行節(jié)流,譯碼器節(jié)流器240總可以以相同的方式進(jìn)行節(jié)流。對(duì)這些指示符和測(cè)量值的數(shù)目以及指示符和測(cè)量值的來源本發(fā)明未作限制。
圖2和圖3可被用來描述本發(fā)明的另一實(shí)施例。在這一實(shí)施例中,使用了一種MPEG2視頻譯碼器。下列是由比特流指示符提取裝置250提取的數(shù)據(jù)·畫面-編碼-類型(Picture-Coding-type)(I,P,B,D)·暫時(shí)參照(temporal-reference)·圖3描述了用來決定在雙向預(yù)測(cè)畫面(B-picture)中哪些運(yùn)動(dòng)矢量(向前或向后)被拋棄的流程圖。暫時(shí)參照(temporal-reference)信息用來決定向前或向后的參照是否具有與被譯碼圖畫更遠(yuǎn)的暫時(shí)距離。最遠(yuǎn)距離的參照不被使用,即有效地取消了代表它的運(yùn)動(dòng)矢量。換句話說,雙向預(yù)測(cè)畫面在這一實(shí)施例中僅使用單向預(yù)測(cè)。
圖3中,|TR-TRfor|是畫面被譯碼時(shí)間與畫面被用作運(yùn)動(dòng)補(bǔ)償向前參照的時(shí)間的差的絕對(duì)值,而|TR-TRback|是畫面被譯碼的時(shí)間與畫面被用作運(yùn)動(dòng)補(bǔ)償向后參照的時(shí)間的差的絕對(duì)值。
畫面編碼類型(Picture-Coding-type)和暫時(shí)參照(temporal-reference)并不是可被提取并被用于對(duì)視頻譯碼器210進(jìn)行節(jié)流的僅有的比特流特征。本發(fā)明未限制用于決定對(duì)視頻譯碼器210進(jìn)行節(jié)流的方式的指示符類型和數(shù)量。本發(fā)明未限制某些具體的語法成分的特征。例如,該特征可以是不屬于具體語法成分的指示符,比如某一特殊類型的宏區(qū)塊數(shù)量的指示符。
這些指示符也許已經(jīng)被編碼器插入比特流或者被某些比特流成分所包含。這些指示符可以在一較高語法水平,例如系統(tǒng)比特流水平。這些從比特流中為某一特殊成分取得的指示符也許不被用于控制該特殊成份的譯碼。例如,與某畫面相聯(lián)系的指示符可以被用來控制對(duì)另一圖面的譯碼。例如,前一畫面的指示符能被用來控制當(dāng)前畫面的譯碼。
本發(fā)明也不局限于由圖3中所示實(shí)施例所描述那樣進(jìn)行節(jié)流的視頻譯碼器210的頻率。例如,是否使用雙向預(yù)測(cè)的決定可以在象素區(qū)由區(qū)域框作出。例如,這樣的決定使每一宏區(qū)塊都被重新求值。
另外,前面的實(shí)施例未描述譯碼器處理容量的測(cè)量值231的使用。這些可用來檢測(cè)譯碼器何時(shí)非常繁忙,哪一時(shí)刻不能實(shí)現(xiàn)比特流的實(shí)時(shí)譯碼,因而需要譯碼器節(jié)流等。類似地,譯碼器處理容量測(cè)量值231可以表示何時(shí)譯碼器不忙并可能實(shí)現(xiàn)實(shí)時(shí)視頻譯碼而不需要對(duì)它的功能進(jìn)行節(jié)流等。換句話說,本發(fā)明未對(duì)作出是否取消某些運(yùn)動(dòng)矢量和與它們相關(guān)的參照補(bǔ)償處理的決定加以限制。
本實(shí)施例的效果是對(duì)雙向預(yù)測(cè)畫面的框架記憶存取和處理的顯著縮減。參考框架記憶讀數(shù)由于運(yùn)動(dòng)補(bǔ)償參照雙向處理的缺少而被有效地縮減了一半。盡管最終被譯碼視頻的質(zhì)量降低了,但這被認(rèn)為是本發(fā)明的可以接受的副作用,因?yàn)楸景l(fā)明就是用來通過畫面質(zhì)量降低來減少譯碼器成本的。由于雙向預(yù)測(cè)畫面不被用作進(jìn)行進(jìn)一步預(yù)測(cè),由節(jié)流引入的畫面中的錯(cuò)誤不會(huì)傳播給另一些畫面。
圖4所示為另一實(shí)施例,其中畫面尺寸和速率用來指示比特流所需的處理量253。在本實(shí)施例中,下面是由一個(gè)比特流決定的附加成分·水平尺寸(horizontal-Size)·垂直尺寸(Vertical-Size)·框架速率值(frame-rate-value)然后這些成分以比特流所需譯碼器輸出象素速率為基礎(chǔ)被用來決定譯碼器是否將利用某些節(jié)流技術(shù)。在所示例子中,它被用來使得運(yùn)動(dòng)矢量按圖3所描述那樣節(jié)流,但并不僅限于此。
本發(fā)明方法的另一實(shí)施例按某種方式變更運(yùn)動(dòng)矢量以減少譯碼器計(jì)算上的和/或記憶帶寬的需求。一個(gè)實(shí)施例運(yùn)用了運(yùn)動(dòng)矢量的精確度。
圖5描述了如何通過使用相鄰全象素值來決定1/2象素運(yùn)動(dòng)補(bǔ)償參照。如果一個(gè)空間區(qū)域需要1/2象素內(nèi)插,則需要更多參考框架記憶象素?cái)?shù)據(jù)。例如,如果需要8×8象素區(qū)使用全象素運(yùn)動(dòng)矢量,則需要閱讀8×8的區(qū)域。另一方面,如果水平和豎直1/2象素運(yùn)動(dòng)補(bǔ)償都需要,必須閱讀9×9區(qū)域。在最鄰近全象素值的1/2象素內(nèi)插之后,所需8×8區(qū)域會(huì)被確定下來。因此,有可能通過把視頻譯碼器的運(yùn)動(dòng)矢量的精確度限制為全象素精確度來減少視頻譯碼器的處理需求。
本發(fā)明不把運(yùn)動(dòng)矢量精確度的減低限制在從1/2象素至全象素值的范圍內(nèi)。事實(shí)上,許多視頻譯碼器不是一個(gè)象素一個(gè)象素地存取參照框架記憶,而是把象素組合成可存取的詞匯。因此,把運(yùn)動(dòng)矢量精確度限制于參考框架記憶的詞匯尺寸大小是可以實(shí)施的。
這一實(shí)施例的結(jié)果是用運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)減少對(duì)畫面的框架記憶存取和處理。盡管最終被譯碼的視頻質(zhì)量降低了,但被認(rèn)為是本發(fā)明的一個(gè)可接受的副作用,因?yàn)楸景l(fā)明就是通過降低畫面質(zhì)量來降低譯碼器成本的。
本發(fā)明方法的另一個(gè)實(shí)施例是減少了運(yùn)動(dòng)矢量范圍。例如,假如運(yùn)動(dòng)矢量范圍是±64象素,該范圍在譯碼器中可被限制在±16。被限制的范圍并非本實(shí)施例僅有的。例如,它可被限制于0象素。該實(shí)施例的結(jié)果是框架記憶存取被限制到該畫面的較小區(qū)域。這在使用高速緩沖存儲(chǔ)器的運(yùn)動(dòng)補(bǔ)償結(jié)構(gòu)中是特別有用的。從緩沖器中存取的象素越多,緩沖器撞擊越少。緩沖器撞擊說明所需的象素不在緩沖器存儲(chǔ)中,因而它們必須從常規(guī)的更大更慢的存有所需象素的記憶裝置中取出。緩沖器撞擊的總體效果是操作效能降低。減少運(yùn)動(dòng)矢量范圍的結(jié)果是減少緩沖器撞擊數(shù)量,因而改善了操作性能。
本發(fā)明方法的另一個(gè)實(shí)施例為變更從比特流譯碼得到的一些系數(shù)值,以使得這些系數(shù)的下行處理具有較低的計(jì)算強(qiáng)度。這種變更的一個(gè)例子如圖6所示。來自于比特流600的原始系數(shù)經(jīng)過變更而成為變更值601。在此例中,全部在灰色區(qū)域602外側(cè)的數(shù)值被置于0。在一個(gè)DCT為基礎(chǔ)的,其視頻譯碼器在逆向DCT轉(zhuǎn)換之前先執(zhí)行逆向量化的系統(tǒng)中(以MPEG2為例),這樣做的結(jié)果是通過把從比特流譯碼得出的系數(shù)值設(shè)置為容易逆向量化的數(shù)值,減少逆向量化的處理需求。例如,如果某些系數(shù)被置0,則在這些系數(shù)逆向量化之后的結(jié)果可以被置0而不用進(jìn)行由MPEG2標(biāo)準(zhǔn)所定義的通常的計(jì)算。
另外,逆向DCT轉(zhuǎn)換的一些執(zhí)行過程利用為0的被探測(cè)系數(shù)越來越減少逆向DCT轉(zhuǎn)換的計(jì)算需求。例如,在一個(gè)單獨(dú)的其中系數(shù)的一個(gè)子集要被轉(zhuǎn)換的逆向DCT轉(zhuǎn)換中,如果子集全是0,其結(jié)果也將全是0。在這種情況下,逆向轉(zhuǎn)換能夠更容易地完成,只要把結(jié)果置0即可,而不用對(duì)逆向轉(zhuǎn)換進(jìn)行計(jì)算。本發(fā)明沒有限定將來自于比特流的系數(shù)值置0。它們可以被變更為任何能導(dǎo)致減少下行處理的數(shù)值。
本發(fā)明也未限制對(duì)哪些值進(jìn)行變更。例如,有可能在一個(gè)區(qū)塊的限制數(shù)達(dá)到時(shí),僅僅通過停止對(duì)來自于比特流的數(shù)值的儲(chǔ)存來限制一個(gè)區(qū)塊中非零系數(shù)的數(shù)量。
本發(fā)明未限定于使用逆向DCT轉(zhuǎn)換作為它的轉(zhuǎn)換形式的譯碼器。其它轉(zhuǎn)換系數(shù)也可進(jìn)行變更來減少它們的計(jì)算需求。
本發(fā)明的另一實(shí)施例是對(duì)一個(gè)或兩個(gè)彩色成分處理的減少或清除。例如,這些系數(shù)值可以被拋棄并把彩色成分的象素值置于中性位置,在這種情況下,沒有被譯碼器所需的彩色成分的進(jìn)一步處理。例如,彩色成分并不需要逆向量化,逆向DCT轉(zhuǎn)換和運(yùn)動(dòng)補(bǔ)償。這一實(shí)施例的結(jié)果是譯碼器處理需求的顯著降低。另一個(gè)結(jié)果則是在所展示畫面中色彩的損失,但這是由減少譯碼器計(jì)算所帶來的可接受的質(zhì)量下降。
本發(fā)明的另一實(shí)施例是在被譯碼視頻畫面上執(zhí)行的處理的減少。例如,后置過濾器可以被視頻譯碼器使用來消除由編碼和譯碼處理帶來的某些短粗的噪音。減少這一過濾的結(jié)果是后置過濾器計(jì)算需求的減少。該項(xiàng)處理的減少可以是后置過濾器使用的抽頭數(shù)量減少。其它后處理的形式如格式變換過濾器也可被縮減。
有許多種發(fā)明方法的組合可以被用來減少視頻譯碼器的處理能力需求。本發(fā)明不限制這些方法的組合。例如,運(yùn)動(dòng)矢量可以被變更,從比特流提取的系數(shù)可以被變更,并且在被譯碼的畫面上執(zhí)行的處理可以被限制在同一譯碼器范圍內(nèi)。本發(fā)明的綜合效果就是對(duì)視頻譯碼器的處理需求及輸出圖畫質(zhì)量控制的有一極大的自由度。這一控制在對(duì)單個(gè)比特流或具有相關(guān)優(yōu)先權(quán)的多個(gè)比特流譯碼時(shí)是有用的。
本發(fā)明的一個(gè)結(jié)果在于視頻譯碼器的處理能力能夠被減少,容許具有高計(jì)算需求的比特流被具有較低計(jì)算能力的譯碼器譯碼。通過基于對(duì)比特流譯碼所需處理能力的測(cè)量值,所述譯碼器處理能力的測(cè)量值,或者這些測(cè)量值的某種組合作限制的譯碼器功能的類型和數(shù)量的決定,可以給出使計(jì)算需求和畫面質(zhì)量平衡協(xié)調(diào)的合適的限制選擇。
使用比特流中語法成分和該比特流中處理類型和數(shù)量的指示值的作用在于能夠在考慮比特流內(nèi)容的情況下做出譯碼器功能限制的類型和數(shù)量,因而可得到更合適和視覺上更動(dòng)人的有關(guān)功能限制的選擇。
使用譯碼器處理能力測(cè)量值的作用在于它使限制功能的選擇以譯碼器能力為基礎(chǔ),這又是基于譯碼器的構(gòu)造的。
減少譯碼器中一個(gè)或多個(gè)功能的計(jì)算能力的作用在于使該譯碼器計(jì)算能力減少。
取消對(duì)通常用于修正運(yùn)動(dòng)補(bǔ)償參照的一個(gè)或多個(gè)運(yùn)動(dòng)矢量的應(yīng)用的作用在于處理能力和參考框架記憶存取帶寬的減少。
有選擇地取消一個(gè)或多個(gè)運(yùn)動(dòng)矢量的應(yīng)用的作用在于有可能選擇取消那些比其它運(yùn)動(dòng)矢量對(duì)畫面質(zhì)量產(chǎn)生較少損害的運(yùn)動(dòng)矢量,因而實(shí)現(xiàn)畫面質(zhì)量和計(jì)算需求定向間的平衡協(xié)調(diào)。
限制那些具有暫時(shí)最長(zhǎng)距離的運(yùn)動(dòng)矢量的作用在于取消某些暫時(shí)最長(zhǎng)的運(yùn)動(dòng)矢量時(shí)比取消具有較短暫時(shí)距離的運(yùn)動(dòng)矢量時(shí)對(duì)畫面質(zhì)量的影響要小。
限制與被譯碼圖畫區(qū)周圍區(qū)域的那些運(yùn)動(dòng)矢量相關(guān)程度最低的運(yùn)動(dòng)矢量的作用在于由這些運(yùn)動(dòng)矢量造成這些區(qū)域的畫面質(zhì)量降低的感覺可能比高度相關(guān)運(yùn)動(dòng)矢量造成的要少。如果不使用相關(guān)程度較低的運(yùn)動(dòng)矢量,還有使得具有運(yùn)動(dòng)補(bǔ)償功能的以緩沖器為基礎(chǔ)的構(gòu)造具有較少緩沖器撞擊的作用。
選擇具有空間上最長(zhǎng)距離的運(yùn)動(dòng)矢量的作用在于它使得當(dāng)運(yùn)動(dòng)參照更靠近在一起時(shí),以緩沖器為基礎(chǔ)的構(gòu)造具有較少緩沖器撞擊。這是因?yàn)閰⒖紨?shù)據(jù)不大可能經(jīng)常走出緩沖器之外。
變更運(yùn)動(dòng)矢量或限制一個(gè)或多個(gè)譯碼器運(yùn)動(dòng)矢量的精確度和/或范圍的作用在于在存取運(yùn)動(dòng)補(bǔ)償參照時(shí)記憶存取的數(shù)量可以被減少。
通過有選擇地把逆向量化和逆向DCT轉(zhuǎn)換系數(shù)設(shè)置為替換值(如0值)來減少逆向量化和逆向DCT轉(zhuǎn)換系數(shù)的數(shù)量的作用在于逆向量化和逆向DCT轉(zhuǎn)換的計(jì)算需求可以被減少。
減少彩色成分處理的作用是使譯碼器處理的總量減少。
權(quán)利要求
1.一種減少視頻譯碼器處理能力需求的方法,其特征在于,它包括通過使用一預(yù)定的節(jié)流量控制所述譯碼器的所述處理能力需求。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,其中對(duì)所述預(yù)定節(jié)流量的確定包括下列一個(gè)或多個(gè)測(cè)量值的應(yīng)用對(duì)一個(gè)或多個(gè)比特流進(jìn)行譯碼所需處理能力的一個(gè)或多個(gè)測(cè)量值;所述譯碼器處理容量的一個(gè)或多個(gè)測(cè)量值。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,其中對(duì)比特流譯碼所需處理能力的測(cè)量值包括下列一個(gè)或多個(gè)指示一所述比特流中語法成分的指示;一對(duì)于所述比特流所需處理類型的指示;一對(duì)于所述比特流所需處理數(shù)量的指示;一對(duì)于所述比特流處理類型和數(shù)量的組合。
4.根據(jù)權(quán)利要求1、2或3所述的方法,其特征在于,其中對(duì)所述處理需求的所述控制包括通過以某種方式限制所述譯碼器功能來減少用于一個(gè)或多個(gè)譯碼器功能的處理能力。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,其中對(duì)所述譯碼器功能進(jìn)行的所述限制包括停止通常用于修正一運(yùn)動(dòng)補(bǔ)償參照的一個(gè)或多個(gè)運(yùn)動(dòng)矢量的應(yīng)用。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,其中對(duì)所述譯碼器功能進(jìn)行所述限制包括下列步驟從表示不同參考畫面的活動(dòng)矢量的某種選擇中選出一個(gè)或多個(gè)運(yùn)動(dòng)矢量而停止其使用;并且停止通常用來修正一運(yùn)動(dòng)補(bǔ)償參照的所選擇的運(yùn)動(dòng)矢量的使用。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,其中所述對(duì)運(yùn)動(dòng)矢量的選擇由下列一個(gè)或多個(gè)選擇組成選擇具有暫時(shí)最長(zhǎng)距離的運(yùn)動(dòng)矢量;選擇與被譯碼畫面區(qū)周圍區(qū)域的那些運(yùn)動(dòng)矢量相關(guān)程度最低的運(yùn)動(dòng)矢量。選擇具有空間最長(zhǎng)距離的運(yùn)動(dòng)矢量;及選擇全部運(yùn)動(dòng)矢量,
8.根據(jù)權(quán)利要求4所述的方法,其特征在于,其中對(duì)所述譯碼器功能進(jìn)行的所述限制包括變更一個(gè)或多個(gè)譯碼器運(yùn)動(dòng)矢量的值。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,其中所述數(shù)值變更包括限制一個(gè)或多個(gè)譯碼器運(yùn)動(dòng)矢量的精確度。
10.根據(jù)權(quán)利要求8所述的方法,其特征在于,其中所述數(shù)值變更包括限制一個(gè)或多個(gè)譯碼器運(yùn)動(dòng)矢量的范圍。
11.根據(jù)權(quán)利要求4所述的方法,其特征在于,其中對(duì)所述譯碼器功能的所述限制包括通過有選擇地把逆向量化和逆向DCT轉(zhuǎn)換的系數(shù)設(shè)置為替換值來減少這些系數(shù)的數(shù)量。
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,其中所述替換值包括0數(shù)值。
13.根據(jù)權(quán)利要求4所述的方法,其特征在于,其中對(duì)所述譯碼器功能的所述限制包括消除一個(gè)或多個(gè)彩色成分的譯碼器處理。
14.根據(jù)權(quán)利要求4所述的方法,其特征在于,其中對(duì)所述譯碼器功能的所述限制包括減少在被譯碼畫面顯示之前對(duì)它們執(zhí)行的處理量。
全文摘要
本發(fā)明容許具有不同程度計(jì)算能力的視頻譯碼器對(duì)比特流譯碼時(shí)伴隨不同程度的視覺質(zhì)量損失。一種方法是通過變更運(yùn)動(dòng)矢量的應(yīng)用或數(shù)值來減少運(yùn)動(dòng)補(bǔ)償處理,如取消某些運(yùn)動(dòng)補(bǔ)償,或者在譯碼期間限制運(yùn)動(dòng)矢量的精確度。另一種方法是通過限制系數(shù)處理以減少計(jì)算需求。再一種方法是限制彩色成分的處理,還有一種方法是通過減少在譯碼器輸出視頻畫面上執(zhí)行的過濾量來進(jìn)行的。
文檔編號(hào)H04N7/32GK1215282SQ9812042
公開日1999年4月28日 申請(qǐng)日期1998年10月16日 優(yōu)先權(quán)日1997年10月16日
發(fā)明者威廉·布倫特·威爾遜 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社