專利名稱::用于生成視頻內(nèi)容中感興趣區(qū)域的方法、裝置和系統(tǒng)的制作方法用于生成視頻內(nèi)容中感興趣區(qū)域的方法、裝置和系統(tǒng)駄艦本發(fā)明一般地涉及視頻處理,并且更具體地涉及用于在具體用于視頻回放設(shè)備中的顯示的視頻內(nèi)容中生成感興趣區(qū)域(ROI)的系統(tǒng)和方法。
背景技術(shù):
:近些年中具有視頻顯示器的移動和手持設(shè)備已變得很流行。然而,由于它們的小尺寸,所以大多手持設(shè)備不能以髙分辨率顯示視頻或圖像。通常,在手持設(shè)備接收了諸如來自廣播標(biāo)準(zhǔn)清晰度(SD)或高清晰度(HD)的視頻信號之后,視頻必須被下采樣(downsample)到手持設(shè)備屏幕分辨率的尺寸,至通用中間格式(CommonIntermediateFormat,CIF)或者甚至四分之一通用中間格式(quartercommonintermediateformat,QCIF)。CIF—般被限定為它希望用于的視頻系統(tǒng)的'全'分辨率的四分之一。由于這樣的尺寸縮小,有時候視頻的最令人感興趣的部分被丟失。例如,在諸如足球、網(wǎng)球等之類的體育視頻中球可能變得^不見。這樣,利用這樣的設(shè)備,一般的下采樣在這樣的情況下將不能很好工作。此外,對圖像的簡單裁剪(crop)也是不可行的,因?yàn)楦信d趣區(qū)域經(jīng)常在移動,并且此外,相機(jī)可能在移動鏡頭或變焦。已進(jìn)行了一些努力(例如XindingSun改.al.,"RegionofInterestExtractionandVirtualCameraControlBasedonPanoramicVideoCapturing",IEEETrans.Multimedia,Vol.7No.5,pp.981-990,October11,2005),ifl于-在編碼器側(cè)生成感興趣區(qū)域。例如,可根據(jù)常識或基于視覺注意力模型米生成ROI。在這樣的情況下,ROI的元數(shù)據(jù)需要發(fā)送至解碼器。解碼器使用該信息來回放ROI內(nèi)的視頻。然而,此方法存在若干缺點(diǎn)。第一,每個接收機(jī)得到相同的ROI,而不同的人們在他們認(rèn)為什么是用于觀看的感興趣區(qū)域方面具有不同的口味。第二,因?yàn)镽OI是自動生成的,所以如果一些東西出錯了,那么每個人將接收到錯誤信息,此外該錯誤信息不能在接收機(jī)處糾正。第三,元數(shù)據(jù)需要與視頻信號一起被發(fā)送,這因此增加了比特率。因此,避免現(xiàn)有技術(shù)的限制和缺陷的、用于生成視頻中的感興趣區(qū)域的系統(tǒng)和方法是非常期望的。糊,根據(jù)本發(fā)明的各種實(shí)施例的方法、裝置和系統(tǒng)通過在一個實(shí)施例中基于在接收機(jī)側(cè)的例如(一個或多個)用戶偏好來提供感興趣區(qū)域(ROI)檢測和生成,而設(shè)法解決了現(xiàn)有技術(shù)的缺陷。在本發(fā)明的一個實(shí)施例中,一種用于生成視頻內(nèi)容中的感興趣區(qū)域的方法包括識別視頻內(nèi)容中的至少一個節(jié)目類型,分類視頻內(nèi)容的節(jié)目類型的場景,以及通過識別場景中的感興趣的位置和對象中的至少一個,來在所分類的場景中的至少一個場景中限定至少一個感興趣區(qū)域。在本發(fā)明的一個實(shí)施例中,感興趣區(qū)域利用對于所識別的節(jié)目內(nèi)容和所表現(xiàn)的場眾內(nèi)容的用戶偏好信息而被限定。在本發(fā)明的另一實(shí)施例中,一種用于在視頻內(nèi)容中生成感興趣區(qū)域的裝置包括被配置為執(zhí)行以下步驟的處理模塊識別視頻內(nèi)容的爭少一個節(jié)目類型,分類節(jié)目類型中的至少一個節(jié)目類型的場景,以及通過識別場嵐中的感興趣的位置和對象中的至少一個,來在場景中的至少一個場JS屮限定至少一個感興趣區(qū)域。在本發(fā)明的一個實(shí)施例中,該裝置包括用于存儲視頻內(nèi)容的所識別的節(jié)目類型和所分類的場景的存儲器,以及用于使用戶能標(biāo)識偏好的用戶接口,該偏好用于限定視頻內(nèi)容的所識別的節(jié)目類型和所分類的場景中的感興趣區(qū)域。在本發(fā)明的另一實(shí)施例中,一種用于生成視頻內(nèi)容屮的感興趣區(qū)域的系統(tǒng)包括用于廣播視頻內(nèi)容的內(nèi)容源,用于接收視頻內(nèi)容并且配貨用f顯示的所接收的視頻內(nèi)容的接收設(shè)備,用于顯示來自接收設(shè)各的視頻內(nèi)容的顯示設(shè)備,以及被配置為執(zhí)行以下步驟的處理模塊識別視頻內(nèi)容的至少一個節(jié)目類型,分類節(jié)目類型中的至少一個節(jié)目類型的場景,以及通過識別場景中的感興趣的位置和對象中的至少一個,來在所分類的場景中的至少一個場景中限定至少一個感興趣區(qū)域。在本發(fā)明的一個實(shí)施例中,處理模塊位于接收設(shè)備中,并且接收設(shè)備包括用于存儲視頻內(nèi)容的所識別的節(jié)目類型和所分類的場景的存儲器。在這樣的實(shí)施例中,接收設(shè)備還可包括用于使用戶能標(biāo)識偏好的用戶接口,該偏好用于限定視頻內(nèi)容的所識別的節(jié)目類型和所分類的場景中的感興趣區(qū)域。在另一實(shí)施例中,處理模塊位于內(nèi)容源中,并且內(nèi)容源包括用于存儲視頻內(nèi)容的所識別的節(jié)目類型和所分類的場景的存儲器。在這樣的實(shí)施例中,內(nèi)容源還可包括用于使用戶能標(biāo)識偏好的用戶接口,該偏好用于限定視頻內(nèi)容的所識別的節(jié)目類型和所分類的場景中的感興趣區(qū)域。國綱可通過與附圖一起考慮以下的詳細(xì)描述,來容易地理解本發(fā)明的教導(dǎo),其中圖1描繪了根據(jù)本發(fā)明的實(shí)施例的用于限定和生成感興趣區(qū)域的接收機(jī)的高級框圖2描繪了根據(jù)本發(fā)明的實(shí)施例的用于限定和生成感興趣K域的系統(tǒng)的高級框圖3描繪了根據(jù)本發(fā)明的實(shí)施例的適用于圖1和圖2的撥收機(jī)中的使用的用戶接口的高級框圖4描繪了根據(jù)本發(fā)明的實(shí)施例的本發(fā)明的方法的流程圖5描繪了根據(jù)本發(fā)明的實(shí)施例的用于基于用戶輸入來限定感興趣區(qū)域的方法的流程圖。應(yīng)當(dāng)理解,附圖是出于示出本發(fā)明的概念的H的,并tL未必是用f-示出木發(fā)明的唯一可能的配置。為了促進(jìn)理解,相同的標(biāo)號己被用在可能的地方以標(biāo)明對于附圖是共用的相同元素。具體實(shí)施方式本發(fā)明有利地提供了用于生成視頻內(nèi)容中感興趣區(qū)域(ROI)的方法、裝置和系統(tǒng)。雖然將主要在廣播視頻環(huán)境和接收機(jī)設(shè)備的語境內(nèi)描述本發(fā)明,但是本發(fā)明的具體實(shí)施例不應(yīng)當(dāng)視為限制了本發(fā)明的范圍。本領(lǐng)域的技術(shù)人員將會認(rèn)識到并且本發(fā)明的教導(dǎo)將會告知的是,本發(fā)明的概念可有利地應(yīng)用在用于在視頻內(nèi)容中生成感興趣區(qū)域(ROI)的任何環(huán)境和或接收和發(fā)送設(shè)備中。例如,本發(fā)明的概念可實(shí)現(xiàn)在被配置為接收/處理/顯示/發(fā)送視頻內(nèi)容的任何設(shè)備中,諸如便攜手持視頻回放設(shè)備、手持TV、PDA、具有AV能力的蜂窩電話、便攜式計算機(jī)、發(fā)射機(jī)、服務(wù)器等。可通過使用專用硬件以及與適當(dāng)軟件相關(guān)聯(lián)的能夠執(zhí)行軟件的硬件來提供附圖所示的各種元素的功能。當(dāng)通過處理器提供時,可通過單個專用處理器、通過單個共享處理器或者通過多個獨(dú)立處理器(其中一些可被共享),來提供功能。此外,術(shù)語"處理器"或"控制器"的明確使用不應(yīng)當(dāng)理解為排他性地指能夠執(zhí)行軟件的硬件,并且可隱含地?zé)o限制地包括數(shù)字信號處理器("DSP")硬件、用于存儲軟件的只讀存儲器("ROM")、隨機(jī)存取存儲器("RAM")以及非易失性存儲裝置。此外,這里列舉了本發(fā)明的原理、方面和實(shí)施例的所有陳述,及艽具體示例,希望包括其結(jié)構(gòu)的和功能的等同物。此外,希望這樣的等同物包括蘭'l前已知的等同物以及將來開發(fā)的等同物(即,不管結(jié)構(gòu)如何,執(zhí)行了相同功能的所開發(fā)的任何元素)。因此,例如,本領(lǐng)域的技術(shù)人員將會認(rèn)識到,這里所呈現(xiàn)的框圖農(nóng)示實(shí)施了本發(fā)明的原理的例示系統(tǒng)部件和/或電路的概念性視圖。類似地,將被認(rèn)識到的是,任何流程圖表、流程圖、狀態(tài)轉(zhuǎn)換圖、偽代碼等表示各種處理,這些各種處理可以實(shí)質(zhì)上表示在計算機(jī)可讀介質(zhì)中,并且因此由計算機(jī)或處理器執(zhí)行,無論這樣的計算機(jī)或處理器是否被明確示出。根據(jù)本發(fā)明的各種實(shí)施例,用于生成視頻內(nèi)容中的感興趣區(qū)域(ROI)的方法、裝置和系統(tǒng)提供了節(jié)目庫、場景(scene)庫以及對象(object)/位置庫,并且包括與這些庫通信的感興趣區(qū)域模塊,該校塊被配置為基于來自這些庫的數(shù)據(jù)以及用戶偏好在所接收的視頻內(nèi)容中生成定制的感興趣區(qū)域。在各種實(shí)施例中,使用戶能限定例如與他們想選擇視頻中的什么區(qū)域/對象作為用于觀看的ROI有關(guān)的他們的(一個或多個)偏好。在服務(wù)器正在向多個接收機(jī)廣播視頻內(nèi)容的本發(fā)明的實(shí)施例中,如果在本地接收機(jī)中一些東西出錯了,那么錯誤僅影響那一個接收機(jī),并且可被容易地糾正。根據(jù)本原理的系統(tǒng)因此比現(xiàn)有可用的系統(tǒng)更穩(wěn)健,并且使用戶能控制和觀看具有比先前可用的相對更高分辨率的視頻內(nèi)容中的感興趣區(qū)域或?qū)ο?。例如,圖1描繪了根據(jù)本發(fā)明的實(shí)施例的用于限定和生成感興趣區(qū)域的接收機(jī)。圖1的接收機(jī)100例示地包括存儲裝置101、用戶接口109和解碼器111。圖1的接收機(jī)100例示地包括數(shù)據(jù)庫103和感興趣區(qū)域(ROI)模塊105。圖1的接收機(jī)100的數(shù)據(jù)庫103例示地包括節(jié)目庫107、場景庫102和對象/位置庫104。在本發(fā)明的一個實(shí)施例中,節(jié)目庫107、場景庫102和對象庫104被配置為分別存儲各種分類的節(jié)目類型、場景類型和對象類型,下面將更詳細(xì)地描述。圖1的接收機(jī)100的ROI模塊105可被配置為根據(jù)觀看者輸入以及/或者節(jié)目庫107、場景庫102和對象庫104中的預(yù)先存儲的信息,在所接收的視頻內(nèi)容中創(chuàng)建(一個或多個)感興趣區(qū)域。也就是說,觀看者可經(jīng)由用戶接口109向接收機(jī)100提供輸入,結(jié)果(一個或多個)感興趣區(qū)域在顯示器被顯示給觀看者。例如,圖2描繪了根據(jù)本發(fā)明的實(shí)施例的用于限定和生成感興趣區(qū)域的系統(tǒng)的高級框圖。圖2的系統(tǒng)200例示地包括用于向本發(fā)明的接收機(jī)100提供視頻內(nèi)容的視頻內(nèi)容源(例示地,服務(wù)器)206。如上所述,接收機(jī)可被配置為根據(jù)經(jīng)由用戶接口109輸入的觀看者輸入以及/或者節(jié)H庫107、場景庫102和對象庫104中的預(yù)先存儲的信息,在所接收的視頻內(nèi)容中創(chuàng)建(一個或多個)感興趣區(qū)域。所得到的(一個或多個)感興趣區(qū)域然后在系統(tǒng)200的顯示器207上顯示給觀看者。雖然在圖l中,接收機(jī)100被例示地描繪為包括用戶接口109和解碼器111,但是在本幼訴的替代實(shí)施例中,用戶接口109和/或解碼器lll可包括與接收機(jī)IOO通信的分離部件。此夕卜,雖然在圖2的系統(tǒng)200中,數(shù)據(jù)庫103和ROI模塊105被例示地描繪為位于接收機(jī)100內(nèi),但是在本發(fā)明的替代實(shí)施例中,本發(fā)明的數(shù)據(jù)庫和ROI模塊可以代替接收機(jī)100中的數(shù)據(jù)庫和ROI模塊或者除了接收機(jī)100中的數(shù)據(jù)庫和ROI模塊之外,被包括在服務(wù)器206中。在本發(fā)明的這樣的實(shí)施例中,視頻內(nèi)容中感興趣區(qū)域的選擇可在服務(wù)器206中被執(zhí)行,并且像這樣接收機(jī)接收已經(jīng)被指定了感興趣區(qū)域的視頻內(nèi)容。這樣,接收機(jī)中的ROI模塊會檢測服務(wù)器所限定的ROI感興趣區(qū)域并且將這樣的ROI感興趣區(qū)域應(yīng)用在將被顯示的內(nèi)容中。此外,在本發(fā)明的這樣的實(shí)施例中,包括本發(fā)明的數(shù)據(jù)庫和ROI模塊的服務(wù)器還可包括用于提供用戶輸入的用戶接口,用于根據(jù)本發(fā)明創(chuàng)建感興趣區(qū)域。圖3描繪了根據(jù)本發(fā)明的實(shí)施例的適用于圖1和圖2的接收機(jī)100屮的使用的用戶接口109的高級框圖。如上所述,根據(jù)本發(fā)明的實(shí)施例,用戶接口109被設(shè)置用于傳輸觀看者輸入,這些觀看者輸入用于在所接收的視頻內(nèi)容中創(chuàng)建感興趣區(qū)域。用戶接口109可包括具有屏幕或顯示器302的控制面板300,或者可以以軟件方式被實(shí)現(xiàn)為圖形用戶界面??丶?10一322可包括真實(shí)的柄/桿310、小鍵盤/鍵盤324、按鈕318—322、虛擬的柄/桿和/或按鈕314、鼠標(biāo)326、操縱桿330等,取決于用戶接l-]109的實(shí)現(xiàn)方式。在圖2的本發(fā)明的實(shí)施例中,服務(wù)器206將視頻內(nèi)容通信至接收機(jī)100。在接收機(jī)100處,判斷所接收的視頻內(nèi)容是否被編碼以及是否滯嬰被解碼。如果是這樣,那么視頻內(nèi)容被解碼器1U解碼。在解碼了視頻內(nèi)容后,視頻內(nèi)容的節(jié)目被識別。也就是說,在木發(fā)明的一個實(shí)施例屮,從視頻內(nèi)容源(例如,發(fā)射機(jī))206獲得的信息(例如,電子節(jié)目引導(dǎo)信息)可用來識別所接收的視頻內(nèi)容中的節(jié)目類型。來向視頻內(nèi)容源206的這樣的信息可存儲在接收機(jī)100中,例如在節(jié)目庫107中。在本發(fā)明的替代實(shí)施例中,例如來自用戶接口109的用戶輸入可用來識別所接收的視頻內(nèi)容的節(jié)目。也就是說,在一個實(shí)施例中,用戶可例如利用顯示器207來預(yù)覽視頻內(nèi)容,并且通過名字或標(biāo)題來識別顯示器207中不同的節(jié)曰類型。經(jīng)山用戶輸入所識別的視頻內(nèi)容的節(jié)卩j的各種類型的標(biāo)題或標(biāo)識符可存儲在接收機(jī)100的存儲裝置101中,例如在節(jié)目庫107中。還是在木發(fā)明的替代實(shí)施例中,從內(nèi)容源206接收的信息以及來自用戶接口109的用戶輸入兩者的組合可用來識別所接收的視頻內(nèi)容的節(jié)目。在本發(fā)明的各種實(shí)施例中,不能利用預(yù)先存儲的信息和/或用戶輸入來精確分類的節(jié)目類型可視為節(jié)目的新類型,并且可因此被增加到節(jié)目庫107中。以下的表l描繪了一些示例性節(jié)目類型。_Ei_節(jié)目類型足球_賽車_籃球_網(wǎng)球_訪談節(jié)目_迪士尼電影西部片綜合_在識別了視頻內(nèi)容中的節(jié)目類型后,節(jié)目類型的場景被分類。這類似于識別節(jié)目類型,在本發(fā)明的一個實(shí)施例中,從視頻內(nèi)容源(例如,M、J"機(jī))206獲得的信息(例如,電子節(jié)目引導(dǎo)信息)可用來分類所識別的TJ'目類型的場景。來自視頻內(nèi)容源206的這樣的信息可存儲在接收機(jī)100屮,例如在場景庫102中。在本發(fā)明的替代實(shí)施例中,例如來自用戶接口109的用戶輸入可用來分類所識別的節(jié)目類型的場景。也就是說,類似于識別節(jié)目類型,用戶可例如利用顯示器207來預(yù)覽視頻內(nèi)容,并目.通過名字或標(biāo)題來識別顯示器207中節(jié)目類型的不同場景分類。經(jīng)由用戶輸入所識別的各種場景分類的標(biāo)題或標(biāo)識符可存儲在接收機(jī)100的存儲裝鬼101中,例如在場景庫102中。還是在本發(fā)明的替代實(shí)施例中,從內(nèi)容源206接收的信息以及來自用戶接口109的用戶輸入兩者的組合可用來分類視頻內(nèi)容的所識別的節(jié)目類型的場景。在本發(fā)明的各種實(shí)施例中,不能利用預(yù)先存儲的信息和/或用戶輸入來精確分類的場景可視為場景的新類型,并且可因此被增加到場景庫102中。表2根據(jù)本發(fā)明例示地描繪了一些示例性場景分類。場景分類<table>tableseeoriginaldocumentpage12</column></row><table>在識別了視頻內(nèi)容中的場景分類和節(jié)目類型之后,先前所分類的字段(例如,節(jié)目類型和場景分類)中的感興趣(-寸或多個)位置和/或(一個或多個)對象可被限定。在本發(fā)明的一個實(shí)施例中,用戶可將本發(fā)明的系統(tǒng)配置為自動增加對象和/或位置到對象/位置庫104中,或者配置為使它們被存儲在隨后可增加或丟棄的臨時存儲器(未示出)中。此外,在本發(fā)明的各種實(shí)施例中,從視頻內(nèi)容源(例如,發(fā)射機(jī))206獲得的倌息可用來限定感興趣(一個或多個)對象和/或(一個或多個)位置。來自視頻內(nèi)容源206的這樣的信息可存儲在接收機(jī)100中,例如在對象/位置庫104中。來自視頻源的這樣的信息可由用戶在接收機(jī)地點(diǎn)生成。也就是說,在本發(fā)明的各種實(shí)施例中,視頻內(nèi)容源206可提供源內(nèi)容的多個版本,毎個都具有與各種版本相關(guān)聯(lián)的不同的感興趣區(qū)域,任何的這些版本都可由用戶在接收機(jī)位置選擇。響應(yīng)于用戶選擇了源內(nèi)容的可用版本,相關(guān)聯(lián)的感興趣區(qū)域可被通信至接收機(jī)用于在接收機(jī)位置處理。然而在木發(fā)明的替代實(shí)施例中,響應(yīng)于用戶選擇了源內(nèi)容的可用版本,僅包含與有關(guān)感興趣區(qū)域相關(guān)聯(lián)的視頻的視頻內(nèi)容被通信至接收機(jī)。在本發(fā)明的替代實(shí)施例中,例如來自用戶接口109的用戶輸入可用來選擇所識別的節(jié)目類型和所分類的場景中的感興趣區(qū)域。也就是說,類似于識別節(jié)目類型和分類場景,用戶可例如利用顯示器207來預(yù)覽視頻內(nèi)容,并且通過對象和/或位置來限定顯示器207中不同的感興趣區(qū)域。在本發(fā)明的各種實(shí)施例中,這樣的用戶選擇可在視頻內(nèi)容源或在接收機(jī)進(jìn)行。經(jīng)由用戶輸入所限定的各種感興趣區(qū)域的標(biāo)題或標(biāo)識符可存儲在接收機(jī)100的存儲裝置101中,例如在對象/位置庫104中。還是在本發(fā)明的替代實(shí)施例中,從內(nèi)容源206接收的信息以及來自用戶接口109的用戶輸入兩者的組合可用來限定視頻內(nèi)容中的感興趣區(qū)域。根據(jù)本發(fā)明,用戶可人工選擇期望觀察的對象和/或位置,或者可以可替代地將某些(一個或多個)對象、對象類型和或位置設(shè)置為期望在所有節(jié)目中觀看的感興趣區(qū)域。在與包含足球節(jié)目的所接收的視頻內(nèi)容有關(guān)的表3中描繪了示例性對象類型。表3<table>tableseeoriginaldocumentpage13</column></row><table>如以上表3中所描繪的,在特寫足球場景中,諸如足球、運(yùn)動員之類的對象可被限定為感興趣對象。在限定了用于主題視頻內(nèi)容的感興趣區(qū)域之后,視頻內(nèi)容的所選擇的感興趣區(qū)域可被顯示例如在顯示器207中。圖4描繪了根據(jù)本發(fā)明的實(shí)施例的本發(fā)明的方法的流程圖。方法400在步驟401開始,在步驟401中本發(fā)明的接收機(jī)接收包括視頻內(nèi)容的視頻節(jié)目和/或視聽信號(AV)信號。方法400然后進(jìn)至歩驟403。在步驟403,判斷節(jié)目/AV信號是否被編碼以及是否需要被解碼。如果信號被編碼并且需要被解碼,那么方法400進(jìn)至步驟405。如果信號不需要被解碼,那么方法400跳至步驟407。在步驟405,信號被解碼。方法然后進(jìn)至步驟407。在步驟407,(一個或多個)感興趣區(qū)域(ROI)被限定。方法400然后進(jìn)至步驟409。在步驟409,所限定的感興趣區(qū)域可被顯示。也就是說,在步驟409,由所選擇和所限定的感興趣區(qū)域所限定的視頻信號的相應(yīng)區(qū)域被顯示或被發(fā)送用于顯示。然后退出方法400。圖5描繪了用于如圖4的方法400的步驟407中所列舉的那樣限定感興趣區(qū)域的方法的流程圖。方法500在步驟501開始,在步驟501中視頻內(nèi)容例如被本發(fā)明的ROI模塊接收。方法500然后進(jìn)至步驟503。在步驟503,所接收的視頻內(nèi)容的節(jié)目被識別。也就是說,在步驟503,從視頻內(nèi)容源(例如,發(fā)射機(jī))206獲得的信息(例如,電子節(jié)目引導(dǎo)信息)以及/或者例如來自用戶接口109的用戶輸入可用來識別所接收的視頻內(nèi)容的節(jié)目類型。在節(jié)目的類型被識別之后,方法500進(jìn)至步驟505。在步驟505,場景劃分(分類)和場景改變檢測可被確定。也就是說,如上所述,可以提供數(shù)據(jù)庫,其具有包括場景庫的預(yù)先存儲的信息(504),該場景庫具有預(yù)定的場景類型,該信息被存儲并B.可用于參與場景分類的處理。在本發(fā)明的各種實(shí)施例中,不能利用預(yù)先存儲的信息和/或用戶輸入來精確分類的場景被視為場景的新類型,并且可因此被增加到數(shù)據(jù)庫中。在主題場景被分類后,方法500進(jìn)至步驟507。在步驟507,先前所分類的字段(例如,節(jié)目類型和場景分類)屮的(一個或多個)感興趣對象可被限定。例如,在本發(fā)明的一個實(shí)施例中,在特寫足球場景中,諸如足球、運(yùn)動員之類的對象可被限定為感興趣對象。在(一個或多個)感興趣對象被識別之后,方法然后進(jìn)至步驟509。在步驟509,定制的感興趣區(qū)域(ROD在步驟507中所限定的具休(一個或多個)對象周圍被創(chuàng)建。然后在步驟511退出方法。在本發(fā)明的替代實(shí)施例中,還可按照觀看者的習(xí)慣或預(yù)先指定的優(yōu)選的對象'愛好'(例如喜愛的運(yùn)動員、喜愛的位置等)、根據(jù)本發(fā)明來自動創(chuàng)建ROI。根據(jù)本發(fā)明,在(一個或多個)感興趣區(qū)域被限定之后,所期望的(一個或多個)感興趣對象或位置可被從幀到幀地跟蹤,并且可因此被顯示給觀看者。應(yīng)當(dāng)注意,ROI的尺寸可根據(jù)喜愛的對象的具體數(shù)目和/或它們的位置而在回放期間常常改變。根據(jù)本發(fā)明,用戶可限定ROI的幾個級別或尺寸。這樣,ROI可由用戶細(xì)化以指定哪個級別或尺寸的ROI是用戶期望的。這樣,根據(jù)本發(fā)明的實(shí)施例,ROI模塊可創(chuàng)建具體或定制級別/尺寸的ROI以滿足用戶的需要或偏好。在本發(fā)明的各種實(shí)施例中,例如,默認(rèn)的級別/尺寸可包括ROI的最頻繁使用的級別/尺寸。雖然圖4和圖5的以上方法400、500是針對如下應(yīng)用描述的,在該應(yīng)用中,優(yōu)選地,視頻內(nèi)容被全部發(fā)送至根據(jù)本原理的實(shí)施例的接收機(jī)設(shè)備,但是在本發(fā)明的替代實(shí)施例中,內(nèi)容源(例如,發(fā)射機(jī)/服務(wù)器)可至少包括本發(fā)明的ROI模塊。這樣的源ROI模塊可以是除了位于本發(fā)明的接收機(jī)中的ROI模塊之外的或者代替位于本發(fā)明的接收機(jī)中的ROI模塊。例如,在視頻內(nèi)容將被通信至僅僅一個接收機(jī)的本發(fā)明的實(shí)施例中,接收機(jī)可向源(例如,發(fā)射機(jī))通信用戶的偏好,并且發(fā)射機(jī)可因此生成(一個或多個)感興趣區(qū)域。在這樣的實(shí)施例中,發(fā)送至接收機(jī)的視頻內(nèi)容的量被減少,因此減小了向接收機(jī)發(fā)送內(nèi)容所需要的帶寬,并且接收機(jī)處所需要的處理的量也被減少(這是特別有利的,因?yàn)榉?wù)器/發(fā)射機(jī)具有更大的處理能力)。在本發(fā)明的替代實(shí)施例中,各種ROI可在源側(cè)(例如,在服務(wù)器/發(fā)射機(jī)側(cè))被提供,并且可被提供用于在接收機(jī)側(cè)由用戶選擇。也就是說,發(fā)射機(jī)(服務(wù)器)可生成各種優(yōu)選的感興趣區(qū)域并且通過分離的多播信道發(fā)送每個ROI。這樣,用戶可選擇/訂購具有優(yōu)選ROI的信道。這樣的實(shí)施例有利地減小了處理時間以及從發(fā)射機(jī)/服務(wù)器發(fā)送的比特數(shù)目。還是在本發(fā)明的替代實(shí)施例中,可根據(jù)流行的用戶偏好在發(fā)射機(jī)/發(fā)送器生成本發(fā)明的ROI。更具體地,可根據(jù)各個接收機(jī)的流行選擇,針對各個接收機(jī)預(yù)定各個ROI,并且像這樣所確定的ROI可發(fā)送至各個接收機(jī)。應(yīng)當(dāng)注意,涉及在根據(jù)本發(fā)明的發(fā)射機(jī)側(cè)的ROI處理的上述替代實(shí)施例在處理/發(fā)送容量是個問題的情況下可能特別有用。已經(jīng)描述了用于如下方法、裝置和系統(tǒng)的優(yōu)選實(shí)施例,這些方法、裝置和系統(tǒng)用于在視頻內(nèi)容中生成感興趣區(qū)域(ROI)(優(yōu)選實(shí)施例希望是例示性的而且不是限制性的),注意,考慮到以上教導(dǎo)本領(lǐng)域的技術(shù)人員可進(jìn)行修改和變化。因此將被理解的是,可以在所公開的本發(fā)明的具體實(shí)施例中進(jìn)行由權(quán)利要求概述的本發(fā)明的范圍和精神內(nèi)的改變。雖然以上所述的是針對本發(fā)明的各種實(shí)施例的,但是在不脫離其基本范圍的情況下可設(shè)計本發(fā)明的其他和進(jìn)一步的實(shí)施例。權(quán)利要求1.一種用于生成視頻內(nèi)容中的感興趣區(qū)域的方法,包括識別所述視頻內(nèi)容的至少一個節(jié)目類型;分類所述節(jié)目類型中的至少一個節(jié)目類型的場景;以及通過識別所述場景中的感興趣的位置和對象中的至少一個,在所述場景中的至少一個場景中限定至少一個感興趣區(qū)域。2.根據(jù)權(quán)利要求1所述的方法,其中所述至少一個感興趣區(qū)域通過用戶輸入而被限定。3.根據(jù)權(quán)利要求1所述的方法,其中所述至少一個感興趣區(qū)域通過應(yīng)用所述場景中的預(yù)定的感興趣的位置和對象中的至少一個而被限定。4.根據(jù)權(quán)利要求1所述的方法,其中所述至少一個感興趣區(qū)域通過用戶輸入以及所述場景中的預(yù)定的感興趣的位置和對象中的至少一個的組合而被限定。5.根據(jù)權(quán)利要求1所述的方法,其中所述至少一個感興趣K域通過應(yīng)用先前的用戶選擇而被限定。6.根據(jù)權(quán)利要求1所述的方法,其中所述至少一個感興趣區(qū)域通過應(yīng)用從遠(yuǎn)程源接收的信息而被限定。7.根據(jù)權(quán)利要求6所述的方法,其中所述從遠(yuǎn)程源接收的信息包拈在所述遠(yuǎn)程源處所確定感興趣的位置和對象以及川戶選擇中的至少一個。8.根據(jù)權(quán)利要求1所述的方法,其中所述至少一個所限定的感興趣區(qū)域在接收機(jī)處被確定。9.根據(jù)權(quán)利要求1所述的方法,其中所述至少一個所限定的感興趣區(qū)域在視頻內(nèi)容源處被確定,并且被通信至遠(yuǎn)程接收機(jī)。10.根據(jù)權(quán)利要求1所述的方法,其中所述至少一個節(jié)目類型和所述場景利用所接收的信息而被識別和分類。11.根據(jù)權(quán)利要求IO所述的方法,其中用于識別和分類所述至少一個節(jié)目類型和所述場景的信息是從所述視頻內(nèi)容的遠(yuǎn)程源接收的。12.—種用于生成視頻內(nèi)容中的感興趣區(qū)域的裝貿(mào),包括處理模塊,被配置為執(zhí)行以下步驟識別所述視頻內(nèi)容的至少一個節(jié)目類型;分類所述節(jié)目類型中的至少一個節(jié)目類型的場景;以及通過識別所述場景中的感興趣的位置和對象中的至少一個,來在所述場景中的至少一個場景中限定至少一個感興趣區(qū)域。13.根據(jù)權(quán)利要求12所述的裝置,還包括用于解碼所接收的經(jīng)編碼的視頻內(nèi)容的解碼器。14.根據(jù)權(quán)利要求12所述的裝置,還包括用于存儲所述視頻內(nèi)容的所識別的節(jié)目類型和所分類的場景的存儲器。15.根據(jù)權(quán)利要求14所述的裝置,其中存儲在所述存儲器中的所述所識別的節(jié)目類型包括節(jié)目庫。16.根據(jù)權(quán)利要求14所述的裝置,其中存儲在所述存儲器中的所述所分類的場景包括場景庫。17.根據(jù)權(quán)利要求14所述的裝置,其中所述所識別的感興趣的位置和對象被存儲在所述存儲器中并且包括對象庫。18.根據(jù)權(quán)利要求12所述的裝置,還包括用于使用戶能標(biāo)識用于限定感興趣區(qū)域的偏好的用戶接口。19.根據(jù)權(quán)利要求18所述的裝置,其中所述用戶接口包括無線巡控器、諸如鼠標(biāo)或軌跡球的指向設(shè)備、話音識別系統(tǒng)、觸摸屏、屏上選^、按鈕以及柄中的至少一個。20.根據(jù)權(quán)利要求12所述的裝置,其中所述裝覽包括回放設(shè)備。21.根據(jù)權(quán)利要求12所述的裝置,其中所述裝置包括接收機(jī)。22.根據(jù)權(quán)利要求12所述的裝置,其中所述裝置包括發(fā)射機(jī)設(shè)各。23.—種用于生成視頻內(nèi)容中的感興趣區(qū)域的系統(tǒng),包括用于廣播所述視頻內(nèi)容的內(nèi)容源;用于接收所述視頻內(nèi)容并且配置所述接收的視頻內(nèi)容用子顯示的接收設(shè)備;用于顯示來自所述接收設(shè)備的所述視頻內(nèi)容的顯示設(shè)備;以及處理模塊,所述處理模塊被配置為執(zhí)行以下步驟識別所述視頻內(nèi)容的至少一個節(jié)目類型;分類所述節(jié)目類型中的至少一個節(jié)目類型的場景;以及通過識別所述場景中的感興趣的位置和對象中的至少一個,來在所述場景中的至少一個場景中限定至少一個感興趣區(qū)域。24.根據(jù)權(quán)利要求23所述的系統(tǒng),其中所述處理模塊位于所述接收設(shè)備中,并且所述接收設(shè)備包括用于存儲所述視頻內(nèi)容的所識別的節(jié)目類型和所分類的場景的存儲器。25.根據(jù)權(quán)利要求24所述的系統(tǒng),其中所述接收設(shè)備還包括用于使用戶能標(biāo)識用于限定感興趣區(qū)域的偏好的用戶接口。26.根據(jù)權(quán)利要求23所述的系統(tǒng),其中所述處理模塊位于所述內(nèi)容源中,并且所述內(nèi)容源包括用于存儲所述視頻內(nèi)容的所識別的節(jié)目類型和所分類的場景的存儲器。27.根據(jù)權(quán)利要求26所述的系統(tǒng),其中所述內(nèi)容源還包括用于使用戶能標(biāo)識用于限定感興趣區(qū)域的偏好的用戶接口。28.根據(jù)權(quán)利要求23所述的系統(tǒng),其中所述接收設(shè)各包括視頻/音頻回放設(shè)備。29.根據(jù)權(quán)利要求23所述的系統(tǒng),其中所述內(nèi)容源包括服務(wù)器。全文摘要用于生成視頻內(nèi)容中感興趣區(qū)域的方法、裝置和系統(tǒng)包括識別所接收的視頻內(nèi)容的節(jié)目內(nèi)容,分類所識別的節(jié)目內(nèi)容的場景內(nèi)容,以及通過識別場景中的感興趣的位置和對象中的至少一個,來在所表現(xiàn)的場景中的至少一個中限定至少一個感興趣區(qū)域。在本發(fā)明的一個實(shí)施例中,利用對于所識別的節(jié)目內(nèi)容和所分類的場景內(nèi)容的用戶偏好信息而限定感興趣區(qū)域。文檔編號G06T7/00GK101529467SQ200680056170公開日2009年9月9日申請日期2006年10月20日優(yōu)先權(quán)日2006年10月20日發(fā)明者伊澤特·何科邁特·伊澤特,樹林申請人:湯姆遜許可證公司