基于感興趣對象的圖像處理的制作方法

文檔序號：6484635閱讀：281來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于感興趣對象的圖像處理的制作方法
【專利摘要】本發(fā)明提供一種裝置、方法和系統(tǒng)，其中，所述系統(tǒng)包括編碼引擎，該編碼引擎以比用于編碼和/或壓縮各個(gè)圖像幀的背景的比特密度更高的比特密度來編碼和/或壓縮在所述各個(gè)圖像幀內(nèi)的一個(gè)或多個(gè)感興趣對象。所述系統(tǒng)可以進(jìn)一步包括上下文引擎，該上下文引擎識別包括所述一個(gè)或多個(gè)感興趣對象的至少一部分的感興趣區(qū)域并且按比例增加各個(gè)圖像幀內(nèi)的所述感興趣區(qū)域以強(qiáng)調(diào)所述感興趣對象。
【專利說明】基于感興趣對象的圖像處理
【技術(shù)領(lǐng)域】
[0001]本公開通常涉及數(shù)據(jù)處理，特別是涉及基于感興趣對象的圖像處理。
【背景技術(shù)】
[0002]除非本文以其它方式進(jìn)行了指示，在這一部分中描述的材料對于本申請中的權(quán)利要求不是現(xiàn)有技術(shù)，并且不通過包括在這一部分中而被承認(rèn)作為現(xiàn)有技術(shù)。
[0003]通常，成像處理應(yīng)用，并且特別是視頻會議解決方案，可以從一個(gè)或多個(gè)攝像機(jī)接收或捕獲直播視頻圖像幀，壓縮捕獲的視頻圖像幀，并且向一個(gè)或多個(gè)接收方發(fā)射壓縮的視頻圖像幀，該接收方可以然后對接收的視頻圖像幀進(jìn)行解壓縮。今天，通過網(wǎng)絡(luò)使用移動設(shè)備來進(jìn)行越來越多的諸如視頻會議的圖像處理應(yīng)用，與配置為使用靜止設(shè)備支持所述應(yīng)用的傳統(tǒng)網(wǎng)絡(luò)相比較，所述網(wǎng)絡(luò)會具有相對較低的帶寬。這樣，發(fā)射的視頻的質(zhì)量以及這些應(yīng)用的用戶體驗(yàn)可能常常不太理想。
【專利附圖】

【附圖說明】
[0004]將通過示例性說明而非限制的方式來描述附圖中示出的本公開的實(shí)施例，在附圖中，相似的附圖標(biāo)記指代類似的元件，并且其中:
[0005]圖1是說明根據(jù)本公開各種實(shí)施例的示例圖像處理設(shè)備的框圖；
[0006]圖2是說明根據(jù)本公開各種實(shí)施例的視頻信號的示例單獨(dú)圖像幀的框圖；
[0007]圖3是說明根據(jù)本公開各種實(shí)施例的圖像處理設(shè)備的編碼引擎的操作的一部分的流程圖；
[0008]圖4是說明根據(jù)本公開各種實(shí)施例的圖像處理設(shè)備的上下文引擎的操作的一部分的流程圖；
[0009]圖5是說明根據(jù)本公開各種實(shí)施例的圖像處理設(shè)備的操作的一部分的流程圖；
[0010]圖6是說明根據(jù)本公開實(shí)施例的適合于用于實(shí)踐描述的方法和/或裝置的各種方面的示例計(jì)算機(jī)系統(tǒng)的框圖；并且
[0011]圖7是說明根據(jù)本公開實(shí)施例的具有配置為使一種裝置實(shí)踐圖像處理設(shè)備的各種操作的編程指令的制造物品的框圖。
【具體實(shí)施方式】
[0012]本公開的各種實(shí)施例可以描述包括編碼引擎的裝置、方法和系統(tǒng)，該編碼引擎配置為以比用于編碼和/或壓縮單獨(dú)圖像幀的背景的比特密度更高的比特密度來編碼和/或壓縮在所述圖像幀內(nèi)的一個(gè)或多個(gè)感興趣對象。所述圖像處理系統(tǒng)可以進(jìn)一步包括上下文引擎，該上下文引擎配置為識別包括所述一個(gè)或多個(gè)感興趣對象的至少一部分的感興趣區(qū)域并且縮放所述各個(gè)幀內(nèi)的所述感興趣區(qū)域以強(qiáng)調(diào)所述感興趣對象。
[0013]在各種實(shí)施例中，一種裝置可以包括編碼引擎，該編碼引擎配置為接收視頻信號的多個(gè)圖像幀，并且以比用于編碼和/或壓縮各個(gè)圖像幀的背景的比特密度更高的一個(gè)或多個(gè)比特密度為基礎(chǔ)來編碼和/或壓縮與所述各個(gè)圖像幀內(nèi)的一個(gè)或多個(gè)感興趣對象相關(guān)聯(lián)的一個(gè)或多個(gè)區(qū)域，其中，所述背景和所述一個(gè)或多個(gè)區(qū)域形成所述各個(gè)圖像幀。所述裝置可以進(jìn)一步包括發(fā)射機(jī)，該發(fā)射機(jī)耦接到所述編碼引擎并且配置為向一個(gè)或多個(gè)接收方發(fā)射編碼/壓縮的多個(gè)圖像幀。
[0014]在各種實(shí)施例中，所述一個(gè)或多個(gè)感興趣對象可以包括視頻會議的參與者的一個(gè)或多個(gè)面部。
[0015]在各種實(shí)施例中，所述裝置可以進(jìn)一步包括上下文引擎，該上下文引擎耦接到所述編碼引擎并且配置為識別所述各個(gè)圖像幀內(nèi)的所述一個(gè)或多個(gè)感興趣對象。
[0016]在各種實(shí)施例中，所述上下文引擎可以進(jìn)一步配置為識別所述各個(gè)圖像幀內(nèi)的感興趣區(qū)域，其中，所述感興趣區(qū)域可以至少部分地包括所述一個(gè)或多個(gè)感興趣對象。
[0017]在各種實(shí)施例中，所述上下文引擎可以進(jìn)一步配置為按比例增加所述各個(gè)圖像幀內(nèi)的所述感興趣區(qū)域以增加所述各個(gè)圖像幀內(nèi)的所述感興趣區(qū)域的突出性。
[0018]在各種實(shí)施例中，所述上下文引擎可以進(jìn)一步配置為調(diào)整所述感興趣區(qū)域，以將所述一個(gè)或多個(gè)感興趣對象中的至少一個(gè)居中地放置在所述各個(gè)圖像幀內(nèi)。
[0019]在各種實(shí)施例中，所述上下文引擎可以進(jìn)一步配置為以上下文信息為基礎(chǔ)來調(diào)整所述感興趣區(qū)域，以將所述一個(gè)或多個(gè)感興趣對象中的至少一個(gè)放置在所述各個(gè)圖像幀內(nèi)的偏離中心的位置中。
[0020]在各種實(shí)施例中，所述裝置的所述一個(gè)或多個(gè)感興趣對象可以包括視頻會議的參與者的一個(gè)或多個(gè)面部，并且所述上下文信息可以包括所述一個(gè)或多個(gè)面部的面部取向。
[0021]在各種實(shí)施例中，所述發(fā)射機(jī)可以進(jìn)一步配置為分開地發(fā)射所述一個(gè)或多個(gè)感興趣對象和所述背景。
[0022]在各種實(shí)施例中，一種方法可以包括:接收視頻信號的多個(gè)圖像幀；并且以比用于編碼和/或壓縮各個(gè)圖像幀的背景的比特密度更高的一個(gè)或多個(gè)比特密度為基礎(chǔ)來編碼和/或壓縮與所述各個(gè)圖像幀內(nèi)的一個(gè)或多個(gè)感興趣對象相關(guān)聯(lián)的一個(gè)或多個(gè)區(qū)域，其中，所述背景和所述一個(gè)或多個(gè)區(qū)域形成所述各個(gè)圖像幀。
[0023]在各種實(shí)施例中，所述方法可以進(jìn)一步包括識別所述各個(gè)圖像幀內(nèi)的所述一個(gè)或多個(gè)感興趣對象。
[0024]在各種實(shí)施例中，所述方法可以進(jìn)一步包括識別所述各個(gè)圖像幀內(nèi)的感興趣區(qū)域，其中，所述感興趣區(qū)域至少部分地包括所述一個(gè)或多個(gè)感興趣對象。
[0025]在各種實(shí)施例中，所述方法可以進(jìn)一步包括按比例增加所述各個(gè)圖像幀內(nèi)的所述感興趣區(qū)域，以增加所述各個(gè)圖像幀內(nèi)的所述感興趣區(qū)域的突出性。
[0026]在各種實(shí)施例中，所述方法可以進(jìn)一步包括調(diào)整所述各個(gè)圖像幀內(nèi)的所述感興趣區(qū)域，以將所述一個(gè)或多個(gè)感興趣對象中的至少一個(gè)居中地放置在所述各個(gè)圖像幀內(nèi)。
[0027]在各種實(shí)施例中，所述方法可以進(jìn)一步包括以上下文信息為基礎(chǔ)來調(diào)整所述感興趣區(qū)域，以將所述一個(gè)或多個(gè)感興趣對象中的至少一個(gè)放置在所述各個(gè)圖像幀內(nèi)的偏離中心的位置處。
[0028]在各種實(shí)施例中，所述方法的所述一個(gè)或多個(gè)感興趣對象可以包括視頻會議的參與者的一個(gè)或多個(gè)面部，并且其中，所述上下文信息可以包括所述一個(gè)或多個(gè)面部的面部取向。[0029]在各種實(shí)施例中，所述方法可以進(jìn)一步包括向一個(gè)或多個(gè)接收方發(fā)射編碼/壓縮的多個(gè)圖像幀，其中，所述發(fā)射可以包括分開地發(fā)射所述一個(gè)或多個(gè)感興趣對象和所述背
旦
[0030]在各種實(shí)施例中，一種系統(tǒng)可以包括:配置為捕獲具有多個(gè)圖像幀的視頻信號的攝像機(jī)；可操作地耦接到所述攝像機(jī)并且配置為執(zhí)行下列操作的編碼引擎:接收多個(gè)捕獲的圖像幀；并且以比用于編碼和/或壓縮各個(gè)圖像幀的背景的比特密度更高的一個(gè)或多個(gè)比特密度為基礎(chǔ)來編碼和/或壓縮所述各個(gè)圖像幀內(nèi)的一個(gè)或多個(gè)感興趣對象，其中，所述背景和所述一個(gè)或多個(gè)感興趣對象形成所述各個(gè)圖像幀。所述系統(tǒng)可以進(jìn)一步包括發(fā)射機(jī)，該發(fā)射機(jī)耦接到所述編碼引擎并且配置為向一個(gè)或多個(gè)接收方發(fā)射編碼/壓縮的多個(gè)圖像幀。
[0031]在各種實(shí)施例中，其中，所述上下文信息可以包括所述一個(gè)或多個(gè)接收方中的一個(gè)的視角；并且其中，所述系統(tǒng)的所述上下文引擎可以進(jìn)一步配置為控制所述攝像機(jī)以便以所述一個(gè)或多個(gè)接收方中的一個(gè)的視角為基礎(chǔ)來調(diào)整捕獲的視頻信號。
[0032]在各種實(shí)施例中，一種制造物品可以包括:有形和非暫態(tài)的計(jì)算機(jī)可讀存儲介質(zhì)；以及存儲在所述存儲介質(zhì)中的多個(gè)編程指令，所述編程指令配置為使一種裝置響應(yīng)于所述編程指令的執(zhí)行而執(zhí)行操作，所述操作包括:接收視頻信號的多個(gè)圖像幀；并且以比用于編碼和/或壓縮各個(gè)圖像幀的背景的比特密度更高的一個(gè)或多個(gè)比特密度為基礎(chǔ)來編碼和/或壓縮所述各個(gè)圖像幀內(nèi)的一個(gè)或多個(gè)感興趣對象，其中，所述背景和所述一個(gè)或多個(gè)感興趣對象形成所述圖像幀。
[0033]在下面的詳細(xì)描述中，參考形成該詳細(xì)描述的一部分的附圖，并且其中通過可以實(shí)踐本公開的說明實(shí)施例的方式來示出所述詳細(xì)描述。應(yīng)該理解，在不偏離本公開的范圍的情況下，可以利用其它實(shí)施例，并且可以做出結(jié)構(gòu)或邏輯改變。因此，并不意在以限制的意義來做出下面的詳細(xì)描述，并且根據(jù)本公開實(shí)施例的范圍由所附權(quán)利要求及其等同物來限定。
[0034]可以將各種操作按照可能對理解本公開實(shí)施例有幫助的方式順次地描述為多個(gè)分立的操作；然而，不應(yīng)該將描述的順序解釋為暗含這些操作是順序依賴的。
[0035]出于描述的目的，具有形式“Α/B”或具有形式“A和/或B”的短語意指(A)、(B)或(A和B)。出于描述的目的，具有形式“A、B和C中的至少一個(gè)”的短語意指(A)、(B)、(C)、(A和B)、(A和C)、(B和C)或(A、B和C)。出于描述的目的，具有形式“(A) B”的短語意指(B)或(AB)，即，A是可選的元素。
[0036]所述描述可以使用短語“在一實(shí)施例中”或“在實(shí)施例中”，這兩個(gè)短語可以分別指代相同或不同實(shí)施例中的一個(gè)或多個(gè)。而且，如關(guān)于本公開實(shí)施例使用的術(shù)語“包括”、“包含”、“具有”等等是同義詞。所述描述可以指代各個(gè)圖像幀的“感興趣對象”和“背景”。出于這一申請的目的，包括權(quán)利要求，術(shù)語“背景”指代減去圖像幀的一個(gè)或多個(gè)“感興趣對象”的剩余部分，除非上下文清晰地以其它方式進(jìn)行了指示。
[0037]圖1是說明根據(jù)本公開各種實(shí)施例的示例圖像處理設(shè)備的框圖。如圖1中說明的，圖像處理設(shè)備100可以包括經(jīng)由總線140彼此耦接的編碼引擎110、上下文引擎120和發(fā)射機(jī)130。盡管圖1闡釋了經(jīng)由總線140耦接的設(shè)備100的各種部件，但是在各種實(shí)施例中，編碼引擎110、上下文引擎120和發(fā)射機(jī)130可以經(jīng)由諸如一個(gè)或多個(gè)點(diǎn)到點(diǎn)連接或者總線層級的任何適當(dāng)機(jī)制進(jìn)行耦接。
[0038]盡管圖1闡釋了特定部件，但是設(shè)備100可以包括便于圖像處理和/或發(fā)射的其它適當(dāng)部件，例如天線、攝像機(jī)、解碼引擎、顯示器等等，為了容易理解本公開，沒有示出這些部件。進(jìn)而，盡管將圖1中示出的部件闡釋為設(shè)備100內(nèi)的單獨(dú)方框，但是可以將由這些方框中的一些執(zhí)行的功能集成到單個(gè)部件內(nèi)，或者可以使用兩個(gè)或更多個(gè)單獨(dú)部件來進(jìn)行進(jìn)一步再分。例如，可以將解碼引擎(未示出)和編碼引擎110集成到單個(gè)解碼/編碼引擎中。此外，可以將包括編碼引擎110、上下文引擎120和發(fā)射機(jī)130的全部或部分的設(shè)備100實(shí)現(xiàn)在軟件或硬件或其組合中。
[0039]在各種實(shí)施例中，圖像處理設(shè)備100可以包括有線或無線電子設(shè)備，例如桌上型計(jì)算機(jī)、膝上型計(jì)算機(jī)、手持計(jì)算機(jī)、平板計(jì)算機(jī)、蜂窩電話、尋呼機(jī)、音頻和/或視頻播放器(例如，MP3播放器或DVD播放器)、游戲設(shè)備、視頻攝像機(jī)、數(shù)字?jǐn)z像機(jī)、導(dǎo)航設(shè)備(例如，GPS設(shè)備)、無線外圍設(shè)備(例如，打印機(jī)、掃描儀、頭戴式耳機(jī)、鍵盤、鼠標(biāo)等等)、醫(yī)療設(shè)備(例如，心率監(jiān)測儀、血壓監(jiān)測儀等等)、機(jī)頂盒和/或其它適當(dāng)?shù)南鄬o止的、便攜式或移動電子設(shè)備。
[0040]在各種實(shí)施例中，圖像處理設(shè)備100可以經(jīng)由一個(gè)或多個(gè)有線或無線網(wǎng)絡(luò)連接來發(fā)射處理的圖像，該有線或無線網(wǎng)絡(luò)連接例如是私人網(wǎng)絡(luò)、個(gè)人區(qū)域網(wǎng)(PAN)、局域網(wǎng)(LAN)、虛擬私人網(wǎng)絡(luò)(VPN)、城域網(wǎng)(MAN)、廣域網(wǎng)(WAN)、專有網(wǎng)絡(luò)或通常被稱為互聯(lián)網(wǎng)的公共網(wǎng)絡(luò)或其組合。
[0041]在各種實(shí)施例中，圖像處理設(shè)備100可以具有使用各種調(diào)制技術(shù)來無線地發(fā)射處理的圖像的能力，該調(diào)制技術(shù)包括擴(kuò)頻調(diào)制(例如，直接序列碼分多址(DS-CDMA)和/或跳頻碼分多址(FH-CDMA))、時(shí)分復(fù)用(TDM)調(diào)制、頻分復(fù)用(FDM)調(diào)制、正交頻分復(fù)用(OFDM)調(diào)制、多載波調(diào)制(MDM)、正交頻分多址(OFDMA)、SC-FDMA (單載波FDMA)和/或其它適當(dāng)?shù)恼{(diào)制技術(shù)，以經(jīng)由無線鏈路進(jìn)行通信。在一個(gè)示例中，視頻會議設(shè)備100可以根據(jù)要求非常低功率的適當(dāng)?shù)臒o線通信協(xié)議進(jìn)行操作，該無線通信協(xié)議例如是藍(lán)牙、Zigbee、近場通信(NFC)、超寬帶(UWB)和/或射頻識別(RFID)，以實(shí)現(xiàn)無線個(gè)人域網(wǎng)(WPAN)、無線局域網(wǎng)(WLAN)和/或無線城域網(wǎng)(WMAN)。
[0042]在各種實(shí)施例中，圖像處理設(shè)備100可以是視頻會議應(yīng)用或系統(tǒng)的一部分，并且可以利用可以類似于或不類似于圖像處理設(shè)備100的一個(gè)或多個(gè)其它圖像處理設(shè)備(未示出)來促進(jìn)視頻會議。
[0043]在各種實(shí)施例中，編碼引擎110可以接收包括一系列圖像幀的視頻信號。在各種實(shí)施例中，所述視頻信號可以包括未壓縮的原始數(shù)據(jù)格式的圖像幀。在各種實(shí)施例中，可能已經(jīng)按照有損或無損編碼/壓縮方案對所述視頻信號進(jìn)行了編碼/壓縮，該有損或無損編碼方案例如是1984年由國際電信聯(lián)盟電信標(biāo)準(zhǔn)化組織(ITU-T)公布的H.261、1993由國際標(biāo)準(zhǔn)化組織(ISO)公布的MPEG-1部分2以及1998年由ISO公布的H.264/MPEG-4AVC等等。編碼引擎110可以從設(shè)備100的通信接口(未示出)接收視頻信號，該設(shè)備100可以從外部源接收視頻信號?？蛇x地，編碼引擎110可以經(jīng)由總線140從附接到設(shè)備100或以其它方式與設(shè)備100集成的視頻攝像機(jī)接收視頻信號。
[0044]編碼引擎110可以配置為作為流逐個(gè)地或并行地編碼和/或壓縮圖像幀。編碼引擎110可以對視頻信號進(jìn)行變換編碼(例如，對視頻信號進(jìn)行解碼并且以不同的方案為基礎(chǔ)對該視頻信號進(jìn)行重新編碼)，如果該視頻信號已經(jīng)被編碼/壓縮。編碼引擎110可以對附加信息進(jìn)行編碼或者將該附加信息添加到視頻信號，該附加信息例如是與視頻信號、子標(biāo)題和數(shù)字版權(quán)管理等等的搜索的前向、后向或隨機(jī)訪問有關(guān)的信息。編碼引擎110可以使用任何已知的視頻/圖像壓縮方案或方法來編碼/壓縮圖像幀，該視頻/圖像壓縮方案或方法例如是幀間壓縮、幀內(nèi)壓縮、離散余弦變換(DCT)、片段壓縮、匹配追蹤、離散小波變換(DWT)等等。
[0045]在各種實(shí)施例中，編碼引擎110可以具有與一個(gè)或多個(gè)圖像幀內(nèi)的一個(gè)或多個(gè)感興趣對象(001)有關(guān)的信息。001可以與設(shè)備100的應(yīng)用或使用場景有關(guān)。示例001可以包括在視頻會議會話期間講話者的面部和/或肩部區(qū)域、在電視播送期間經(jīng)過跑道行駛的機(jī)動車輛、由監(jiān)視攝像機(jī)捕獲和/或跟蹤的移動對象等等。在各種實(shí)施例中，包含在視頻信號的圖像幀內(nèi)的001區(qū)域的數(shù)量可以逐幀地改變。例如，在圖像幀中可以存在單個(gè)001，并且在隨后或其它圖像幀中可以存在多個(gè)001。
[0046]圖2是說明根據(jù)本公開各種實(shí)施例的視頻流的示例單獨(dú)圖像幀的框圖。如說明的，圖像幀200可以包括001區(qū)域210、001區(qū)域212、001區(qū)域214和圍繞001區(qū)210-214并且由圖像幀200內(nèi)的陰影區(qū)域指示的背景230。盡管圖2闡釋了具有三個(gè)001區(qū)域的圖像幀200，但是在各種實(shí)施例中，圖像幀200可以包括更多或更少的001區(qū)域。盡管圖2說明了具有相同尺寸和形狀的多個(gè)001區(qū)域210-214，但是應(yīng)該理解，各種001區(qū)域210-214的尺寸、形狀和位置僅僅是說明性的，并且在各種實(shí)施例中可以不同。進(jìn)而，示例說明示出了圍繞001區(qū)域210-214的背景230，但是在其它圖像幀中，背景230可以僅部分地圍繞或相鄰于001區(qū)域210-214。
[0047]在各種實(shí)施例中，編碼引擎可以應(yīng)用不同的量化參數(shù)來編碼/壓縮一個(gè)或多個(gè)001區(qū)域210-214和背景230，該背景230連同001區(qū)域210-214 —起構(gòu)成圖像幀。在某些實(shí)施例中，編碼引擎Iio可以配置為使用比用于編碼/壓縮背景230的比特密度更高的一個(gè)或多個(gè)比特密度來編碼/壓縮一個(gè)或多個(gè)001區(qū)域210-214。例如，在使用設(shè)備100的視頻會議應(yīng)用中，可以將在講話者的面部和肩部周圍的區(qū)域分別識別為兩個(gè)001區(qū)域。編碼引擎110可以使用可以允許其他會議出席者更清楚地看到講話者的面部表情的高比特密度來編碼/壓縮在講話者的面部周圍的區(qū)域，并且可以使用中等比特密度來編碼/壓縮在講話者的肩部周圍的區(qū)域，并且可以使用低比特密度來編碼/壓縮圖像幀的背景。這樣，與每一個(gè)圖像幀內(nèi)的非面部區(qū)域(例如，背景)的比特相比較，可以向講話者的面部區(qū)域(例如，一個(gè)或多個(gè)001區(qū)域)分配更多的比特。構(gòu)成高、中或低比特密度的內(nèi)容可以逐應(yīng)用地變化。
[0048]在各種實(shí)施例中，除了或代替上述的比特密度優(yōu)先編碼和/或壓縮，編碼引擎110可以使用基于區(qū)域的編碼技術(shù)來編碼/壓縮圖像幀200。例如，可以使用不同的編碼/壓縮模型來單獨(dú)地編碼/壓縮001區(qū)域210-214和背景230。編碼引擎110可以以非參數(shù)背景模型為基礎(chǔ)來編碼/壓縮背景230。編碼引擎110可以以單獨(dú)的編碼和/或壓縮模型為基礎(chǔ)來編碼/壓縮和壓縮001區(qū)域210-214?？梢詫D像幀200的編碼/壓縮的001區(qū)域210-214與編碼/壓縮的背景230單獨(dú)地經(jīng)由發(fā)射機(jī)130發(fā)射到一個(gè)或多個(gè)接收方(圖1中未示出)。一個(gè)或多個(gè)接收方可以如接收那樣單獨(dú)地對背景和001區(qū)域進(jìn)行解壓縮和解碼，并且組合該區(qū)域和背景以重構(gòu)完整的圖像幀。[0049]在各種實(shí)施例中，編碼引擎110可以以先前或隨后的圖像幀為基礎(chǔ)來編碼/壓縮特定圖像幀200以例如通過使用幀間壓縮等等來實(shí)現(xiàn)更有效的壓縮。
[0050]在例如視頻會議應(yīng)用的各種實(shí)施例中，背景230在大部分時(shí)間內(nèi)可以靜止或?qū)嵸|(zhì)上靜止，并且可以不改變或最低限度地逐幀改變。因此，代替在每一個(gè)圖像幀中發(fā)射背景，發(fā)射機(jī)130可以周期性地每兩個(gè)或更多個(gè)圖像幀地發(fā)射背景230。在其它實(shí)施例中，在檢測到一個(gè)或多個(gè)先前圖像幀上的背景的(明顯)改變時(shí)，發(fā)射機(jī)130可以動態(tài)地發(fā)射背景230。通過使用比特密度優(yōu)化的編碼和/或其中對背景和001區(qū)域進(jìn)行分開地編碼、壓縮和發(fā)射的基于區(qū)域的編碼/壓縮技術(shù)，可以增強(qiáng)設(shè)備100的編碼和/或發(fā)射效率。因此，可以改善以設(shè)備100為基礎(chǔ)的視頻會議應(yīng)用的用戶體驗(yàn)，特別是在使用其中網(wǎng)絡(luò)帶寬可能受限的移動設(shè)備進(jìn)行的視頻會議中。
[0051]在各種實(shí)施例中，上下文引擎120可以配置為檢測、識別和/或跟蹤圖像幀200內(nèi)或視頻流中的一個(gè)或多個(gè)001區(qū)域210-214，并且向編碼引擎110提供與001區(qū)域210-214有關(guān)的信息。上下文引擎120可以以對于對象跟蹤或面部識別已知的各種技術(shù)為基礎(chǔ)來檢測001區(qū)域210-214。這樣的對象跟蹤技術(shù)之一可以是以AdaBoost分類器的級聯(lián)為基礎(chǔ)來無遺漏地掃描圖像幀上的窗口。在各種實(shí)施例中，上下文引擎120可以提供001信息以輔助編碼引擎110編碼和/或壓縮圖像幀。
[0052]在各種實(shí)施例中，上下文引擎120可以進(jìn)一步配置為識別圖像幀內(nèi)可以包括所述一個(gè)或多個(gè)001區(qū)域的至少一部分的感興趣區(qū)域(R0I)。示例ROI可以是被說明為由圖2中的虛線圍繞的區(qū)域?？梢砸岳?Rx，Ry)的R0I220的坐標(biāo)表示的邊框?yàn)榛A(chǔ)來識別該R0I220的位置和尺寸。在各種實(shí)施例中，R0I220可以包括或不包括背景230的部分。
[0053]在各種實(shí)施例中，上下文引擎120還可以識別ROI區(qū)域220內(nèi)的中心點(diǎn)P。。在某些實(shí)施例中，可以將P。定義為ROI內(nèi)的所有001區(qū)域的加權(quán)中心。例如，可以以下面的表達(dá)式為基礎(chǔ)來識別P。:
N
[0054]Pc = YjP1ZN

J-O _
[0055]其中Pi是每一個(gè)檢測的001區(qū)域的中心位置，并且N是檢測的001區(qū)域的數(shù)量。在其它實(shí)施例中，可以將P。識別為ROI內(nèi)的最大001區(qū)域的中心點(diǎn)，例如，最接近攝像機(jī)的感興趣對象。例如，可以將P。定義為:
[0056]Pc=argmax (size (Pi))
[0057]其中argmaxkizeTi))是具有最大尺寸的001區(qū)域的中心點(diǎn)。在又一些其它實(shí)施例中，P。可以是從一個(gè)或多個(gè)先前幀檢測到改變的001的中心點(diǎn)。例如，P?？梢杂糜谥甘敬懋?dāng)前正在視頻會議中與多個(gè)參與者講話的人或被監(jiān)視攝像機(jī)跟蹤的移動對象之一的001。在各種實(shí)施例中，如上面討論的，P?？梢允腔虿皇荝0I220的真實(shí)“中心”。
[0058]在各種實(shí)施例中，如說明的，上下文引擎120可以通過包括所有001區(qū)域210-214的邊框來識別ROI區(qū)域220。在各種實(shí)施例中，一旦識別了 R0I220，上下文引擎120就可以調(diào)整該R0I220，包括調(diào)整其尺寸、位置并縮放，以使中心點(diǎn)P。在圖像幀200的中心部分處或在該中心部分附近。在各種實(shí)施例中，也可以連同R0I220 —起移動和/或縮放圍繞R0I220的區(qū)域，以維持R0I220和圍繞R0I220的背景230的部分之間的空間相關(guān)性。
[0059]在某些實(shí)施例中，上下文引擎120可以將R0I220按比例盡可能地增加到圖像幀200的維度(或原始尺寸)，其可以使或不使R0I220內(nèi)的圖像失真。在某些實(shí)施例中，R0I220的維度(或長寬比)可以不按比例增加以匹配圖像幀200的維度(或長寬比)。因此，上下文引擎可以選擇性地選擇包括背景區(qū)域230的一部分，或者移除R0I220的一部分，以按照正確的長寬比來顯示ROI220內(nèi)的圖像。類似地，上下文引擎120可以選擇性地移除/包括R0I220和背景230的一部分，以便在圖像幀200的中心位置處或附近移動中心點(diǎn)P。。結(jié)果，R0I220內(nèi)的至少一個(gè)001，例如001210，可以在圖像幀200的中心部分處或附近表現(xiàn)得更大并聚焦。
[0060]在各種實(shí)施例中，上下文引擎120可以向編碼引擎110提供包括縮放/修改的R0I220的圖像幀，以輔助編碼引擎110進(jìn)行編碼和/或壓縮以及圖像幀的隨后發(fā)射，如先前公開的。
[0061]在各種實(shí)施例中，可以將攝像機(jī)(未示出)附接到設(shè)備100或者以其它方式與設(shè)備100集成，以捕獲具有圖像幀的流的視頻信號。上下文引擎120可以可操作地耦接到攝像機(jī)并且配置為控制該攝像機(jī)。在識別每一個(gè)圖像幀內(nèi)的R0I220而不是按比例增加或移動R0I220時(shí)，上下文引擎120可以控制攝像機(jī)以放大或縮小或橫搖攝像機(jī)角度，以便聚焦在R0I220上，從而將R0I220內(nèi)的至少一個(gè)001放置在圖像幀200的中心部分中。
[0062]在各種實(shí)施例中，上下文引擎120可以進(jìn)一步配置為調(diào)整R0I220的尺寸和位置以便以一條或多條上下文信息為基礎(chǔ)來有意地將至少一個(gè)001放置在偏離中心的位置處。上下文信息可以取決于設(shè)備100的應(yīng)用或使用場景。例如，在視頻會議會話中，上下文引擎120可以使用當(dāng)前講話者的面部取向(例如，姿勢)作為上下文信息。
[0063]在各種實(shí)施例中，面部取向信息可以用于推導(dǎo)除了識別的ROI之外的潛在的感興趣區(qū)域，并且可以用于使ROI的提取穩(wěn)定。例如，如果講話者正在直視攝像機(jī)，則可以將該講話者表示為位于視頻的中心部分處或附近。然而，如果講話者在說話的同時(shí)朝向他/她的右側(cè)看，則在各種實(shí)施例中，上下文引擎120可以將R0I220的窗口選擇性地移動或橫搖到講話者的“右側(cè)”、按比例增加或減小或者以其它方式調(diào)整R0I220，以在講話者的“右側(cè)”顯示更多的背景230。對于另一示例，視頻會議可以包括多個(gè)參與者。上下文引擎120可以初始地識別所有參與者作為感興趣對象，并且繪制ROI以包括所有參與者。然而，面部取向信息可以指示參與者之一沒有正在看攝像機(jī)，但他/她的頭低下(也許正在閱讀)。在各種實(shí)施例中，上下文引擎120可以選擇從ROI中臨時(shí)排除該參與者(或001)，以使得當(dāng)前從事談話的人可以更突出地顯示在屏幕的中心處。在各種實(shí)施例中，在檢測到該參與者的面部取向的(明顯)改變時(shí)，上下文引擎120可以重新調(diào)整R0I220以將該參與者包括在圖像中。
[0064]在各種實(shí)施例中，上下文引擎120可以配置為分析圖像幀200并且產(chǎn)生上下文信息。例如，在視頻會議應(yīng)用中，為了包括講話者的面部取向作為上下文信息，上下文引擎120可以配置為分析講話者的面部取向。上下文引擎120可以以面部的三個(gè)不同角度，例如俯仰、偏航和滾轉(zhuǎn)，的測量和分析為基礎(chǔ)來分析該講話者的面部取向。
[0065]在各種實(shí)施例中，代替上下文引擎120分析圖像幀以產(chǎn)生上下文信息，可以向上下文引擎120提供上下文信息。例如，可以經(jīng)由網(wǎng)絡(luò)通過設(shè)備100的發(fā)射機(jī)130向一個(gè)或多個(gè)接收方發(fā)射視頻?？梢杂砂惭b在接收方側(cè)處的一個(gè)或多個(gè)攝像機(jī)以先前描述的類似面部取向跟蹤方法或其它已知方法為基礎(chǔ)來跟蹤一個(gè)或多個(gè)接收方的視點(diǎn)(或視角)?？蛇x地，除了面部取向跟蹤，可以通過例如從華盛頓州Redmond的微軟公司可得到的Xbox360?Kinect?攝像機(jī)套件的具有合適軟件的攝像機(jī)利用任何已知方法來類似地識別和/或跟蹤一個(gè)或多個(gè)接收方的姿勢。因此，在某些實(shí)施例中，上下文信息可以包括視頻的一個(gè)或多個(gè)接收方的視點(diǎn)和/或姿勢。例如，如果接收方正在朝向視頻的左側(cè)看，則可以經(jīng)由網(wǎng)絡(luò)將這樣的視點(diǎn)信息反饋到上下文引擎120，并且上下文引擎120可以調(diào)整該視頻的ROI區(qū)域220或者一個(gè)或多個(gè)附接的攝像機(jī)，以朝向視頻的左側(cè)顯示更多的信息。出于類似的目的，也可以將接收方的姿勢反饋到上下文引擎120?？蛇x地，視頻的接收方可以經(jīng)由其它輸入方法向上下文引擎120提供上下文信息，該其它輸入方法例如是鍵盤、鼠標(biāo)、經(jīng)由麥克風(fēng)的語音輸入等等。因此，通過從一個(gè)或多個(gè)接收方接收上下文信息，設(shè)備100可以能夠向視頻會議的參加者提供虛擬現(xiàn)實(shí)效應(yīng)或者向視頻的接收方提供遠(yuǎn)程控制能力。
[0066]在各種實(shí)施例中，上下文引擎120可以以該上下文信息為基礎(chǔ)來向編碼引擎110提供包括調(diào)整的R0I220的圖像幀，以輔助該圖像幀的編碼和/或壓縮，以及通過發(fā)射機(jī)130的這樣的圖像幀的隨后發(fā)射，如先前公開的。
[0067]圖3是說明根據(jù)本公開各種實(shí)施例的圖像處理設(shè)備的編碼引擎的操作的一部分的流程圖。在方框310中，編碼引擎110可以接收圖像幀的流或者與嵌入在每一個(gè)圖像幀中的一個(gè)或多個(gè)001區(qū)域有關(guān)的信息。在方框320中，編碼引擎110可以使用如先前公開的比特密度優(yōu)先編碼/壓縮和/或基于區(qū)域的差分編碼/壓縮來編碼/壓縮每一個(gè)圖像幀。在基于區(qū)域的編碼/壓縮中，發(fā)射機(jī)130可以向一個(gè)或多個(gè)接收方分開地發(fā)射背景和一個(gè)或多個(gè)001區(qū)域。發(fā)射機(jī)130可以每兩個(gè)或更多個(gè)圖像幀地周期性地發(fā)射背景，或者在檢測到背景中的改變時(shí)動態(tài)地發(fā)射背景。編碼引擎110可以重復(fù)上面的操作，直到處理了所有圖像?？梢栽诿恳粋€(gè)圖像幀中發(fā)射一個(gè)或多個(gè)001區(qū)域。一個(gè)或多個(gè)接收方可以然后如接收那樣對該圖像進(jìn)行解壓縮和重構(gòu)。
[0068]圖4是說明根據(jù)本公開各種實(shí)施例的圖像處理設(shè)備的上下文引擎的操作的一部分的流程圖。在方框410中，上下文引擎120可以接收圖像幀的流，并且可以配置為逐個(gè)或并行地處理該圖像幀的流。上下文引擎120可以與編碼引擎110并行地接收圖像幀的流，或者可選地，在編碼引擎110之前處理該圖像幀。在方框420中，上下文引擎120可以識別圖像幀內(nèi)的一個(gè)或多個(gè)001區(qū)域，并且向編碼引擎110提供001區(qū)域信息，用于如先前公開的編碼和/或壓縮。在方框430中，上下文引擎120可以在圖像幀內(nèi)建立包括至少一個(gè)001區(qū)域的R0I。上下文引擎120可以縮放該ROI并且減小在圖像幀內(nèi)的ROI外部的區(qū)域，以使得可以在圖像的中心處突出地顯示一個(gè)或多個(gè)001區(qū)域并且該一個(gè)或多個(gè)001區(qū)域表現(xiàn)為聚焦在圖像內(nèi)。上下文引擎120可以調(diào)整ROI的尺寸和位置，以將至少一個(gè)或多個(gè)001居中地放置在圖像幀內(nèi)。在方框440中，上下文引擎120可以分析圖像幀以產(chǎn)生與該圖像幀相關(guān)聯(lián)的上下文信息。在方框450中，上下文引擎120可以以該上下文信息為基礎(chǔ)來調(diào)整R0I,以將一個(gè)或多個(gè)001區(qū)域中的至少一個(gè)放置在圖像幀內(nèi)偏離中心的位置中。上下文引擎120可以在具有或者不具有在上下文信息下的調(diào)整的情況下，將001和/或ROI信息傳遞到編碼引擎110。上下文引擎120可以重復(fù)上述步驟，直到處理了所有圖像。
[0069]圖5是說明根據(jù)本公開各種實(shí)施例的圖像處理設(shè)備的操作的一部分的流程圖。在方框510中，附接到圖像處理設(shè)備100的一個(gè)或多個(gè)視頻攝像機(jī)(在圖1中未示出)可以捕獲二維(2D)或三維(3D)格式的視頻圖像。在方框520中，上下文引擎可以分析每一個(gè)圖像幀以識別一個(gè)或多個(gè)001區(qū)域。在方框530中，上下文引擎120可以在圖像幀內(nèi)建立ROI并且在圖形幀內(nèi)縮放ROI，以將至少一個(gè)OOI放置在該圖像幀的中心部分處。在方框540中，上下文引擎可以分析圖像幀并產(chǎn)生一條或多條上下文信息，包括面部取向信息的估計(jì)，并且根據(jù)上下文信息修改R0I。上下文引擎120可以向編碼引擎110轉(zhuǎn)發(fā)包括修改的ROI的圖像幀。在方框550中，編碼引擎110可以以比特密度優(yōu)先或基于區(qū)域的差分編碼和/或壓縮為基礎(chǔ)來逐個(gè)或并行地編碼/壓縮圖像幀的流。在方框560中，發(fā)射機(jī)130可以將編碼/壓縮的圖像幀發(fā)射到一個(gè)或多個(gè)接收方。上下文引擎120、編碼引擎110和發(fā)射機(jī)130可以重復(fù)上面的步驟，直到處理了所有圖像幀。
[0070]圖6是說明根據(jù)本公開實(shí)施例適合于用于實(shí)踐描述的方法和/或裝置的各種方面的示例計(jì)算機(jī)系統(tǒng)的框圖。如圖所示，計(jì)算機(jī)系統(tǒng)600可以包括電源單元601、多個(gè)處理器或處理器內(nèi)核602、系統(tǒng)存儲器604、海量存儲606和通信接口 610。出于本申請的目的，包括權(quán)利要求，術(shù)語“處理器”和“處理器內(nèi)核”可以被認(rèn)為是同義詞，除非上下文明確地以其它方式要求。
[0071]此外，計(jì)算系統(tǒng)600可以包括一個(gè)或多個(gè)有形的非暫態(tài)計(jì)算機(jī)可讀海量存儲設(shè)備606 (例如磁盤、硬驅(qū)、壓縮盤只讀存儲器(⑶ROM)等等)、輸入/輸出設(shè)備108 (例如鍵盤、光標(biāo)控制等等)。在各種實(shí)施例中，I/o設(shè)備608可以包括一個(gè)或多個(gè)攝像機(jī)618。元件可以經(jīng)由系統(tǒng)總線612進(jìn)行彼此耦接并且耦接到較早列舉的元件，系統(tǒng)總線612代表一條或多條總線。在多條總線的情況下，它們可以由一個(gè)或多個(gè)總線橋(未示出)橋接。數(shù)據(jù)可以經(jīng)過系統(tǒng)總線612從I/O設(shè)備608，例如從攝像機(jī)618，傳遞到處理器602。
[0072]系統(tǒng)存儲器604和海量存儲606可以用于存儲實(shí)現(xiàn)在本文中被共同表示為622的一個(gè)或多個(gè)操作系統(tǒng)、固件模塊或驅(qū)動器、應(yīng)用等等的編程指令的作業(yè)拷貝和永久拷貝。在由處理器602執(zhí)行時(shí)，該編程指令可以使計(jì)算系統(tǒng)600執(zhí)行編碼引擎110、上下文引擎120和/或發(fā)射機(jī)130的操作，如先前公開的。攝像機(jī)618可以捕獲視頻圖像的流，并且可以受到如前面公開的上下文引擎120的控制。
[0073]可以將編程指令的永久拷貝例如經(jīng)過例如壓縮盤(⑶)的分配介質(zhì)(未示出)或經(jīng)過通信接口 610(來自分配服務(wù)器(未示出))放置到工廠中或現(xiàn)場中的永久存儲606中。也就是說，具有代理程序?qū)崿F(xiàn)的一個(gè)或多個(gè)分配介質(zhì)可以用于分配代理并且對各種計(jì)算設(shè)備進(jìn)行編程。
[0074]這些元件601-622的剩余構(gòu)成是已知的，并且因此將不再進(jìn)行進(jìn)一步描述。
[0075]圖7說明了根據(jù)本公開實(shí)施例的具有配置為使一種裝置能夠?qū)嵺`圖像處理設(shè)備的各種操作的編程指令的制造物品。如圖所示，制造物品700可以包括計(jì)算機(jī)可讀的非暫態(tài)存儲介質(zhì)710。存儲介質(zhì)710可以包括配置為實(shí)現(xiàn)圖像處理設(shè)備的編程指令720。
[0076]存儲介質(zhì)710代表本領(lǐng)域中已知的寬范圍的永久性存儲介質(zhì)，包括但不局限于閃存、光盤或磁盤。具體地，編程指令720可以響應(yīng)于通過圖像處理裝置對這些指令的執(zhí)行而使該裝置執(zhí)行操作，該操作包括:接收視頻信號的多個(gè)圖像幀；并且以比用于編碼和/或壓縮各個(gè)圖像幀的背景的比特密度更高的一個(gè)或多個(gè)比特密度為基礎(chǔ)來編碼和/或壓縮所述各個(gè)圖像幀內(nèi)的一個(gè)或多個(gè)感興趣對象，其中所述背景和所述一個(gè)或多個(gè)感興趣對象形成所述各個(gè)圖像幀。
[0077]盡管本文說明和描述了具體實(shí)施例，但是本領(lǐng)域的普通技術(shù)人員將意識到，在不偏離本公開實(shí)施例的范圍的情況下，各種可選和/或等同實(shí)現(xiàn)可以替代示出和說明的具體實(shí)施例。本申請意在涵蓋本文討論的實(shí)施例的任何修改或變化。因此，本公開的實(shí)施例顯然意在僅由權(quán)利要求及其等同物來限制。
【權(quán)利要求】
1.一種裝置，包括: 編碼引擎，該編碼引擎配置為: 接收視頻信號的多個(gè)圖像幀；并且以比用于編碼或壓縮背景的比特密度更高的一個(gè)或多個(gè)比特密度為基礎(chǔ)來編碼或壓縮與在各個(gè)圖像幀內(nèi)的一個(gè)或多個(gè)感興趣對象相關(guān)聯(lián)的一個(gè)或多個(gè)區(qū)域，其中，所述背景和所述一個(gè)或多個(gè)區(qū)域形成所述各個(gè)圖像幀；以及發(fā)射機(jī)，該發(fā)射機(jī)耦接到所述編碼引擎并且配置為向一個(gè)或多個(gè)接收方發(fā)射編碼或壓縮的多個(gè)圖像幀。
2.如權(quán)利要求1所述的裝置，其中，所述一個(gè)或多個(gè)感興趣對象包括視頻會議的參與者的一個(gè)或多個(gè)面部。
3.如權(quán)利要求1所述的裝置，進(jìn)一步包括上下文引擎，該上下文引擎耦接到所述編碼引擎并且配置為識別所述各個(gè)圖像幀內(nèi)的所述一個(gè)或多個(gè)感興趣對象。
4.如權(quán)利要求3所述的裝置，其中，所述上下文引擎進(jìn)一步配置為識別所述各個(gè)圖像幀內(nèi)的感興趣區(qū)域，其中，所述感興趣區(qū)域至少部分地包括所述一個(gè)或多個(gè)感興趣對象。
5.如權(quán)利要求4所述的裝置，其中，所述上下文引擎進(jìn)一步配置為按比例增加所述各個(gè)圖像幀內(nèi)的所述感興趣區(qū)域，以增加所述各個(gè)圖像幀內(nèi)的所述感興趣區(qū)域的突出性。
6.如權(quán)利要求4所述的裝置，其中，所述上下文引擎進(jìn)一步配置為調(diào)整所述感興趣區(qū)域，以將所述一個(gè)或多個(gè)感興趣對象中的至少一個(gè)居中地放置在所述各個(gè)圖像幀內(nèi)。
7.如權(quán)利要求4所述的裝置，其中，所述上下文引擎進(jìn)一步配置為以上下文信息為基礎(chǔ)來調(diào)整所述感興趣區(qū)域，以將所述一個(gè)或多個(gè)感興趣對象中的至少一個(gè)放置在所述各個(gè)圖像幀內(nèi)的偏離中心的位置中。
8.如權(quán)利要求6所述的裝置，其中，所述一個(gè)或多個(gè)感興趣對象包括視頻會議的參與者的一個(gè)或多個(gè)面部，并且其中，所述上下文信息包括所述一個(gè)或多個(gè)面部的面部取向。
9.如權(quán)利要求1所述的裝置，其中，所述發(fā)射機(jī)進(jìn)一步配置為分開地發(fā)射所述一個(gè)或多個(gè)感興趣對象和所述背景。
10.一種方法，包括: 接收視頻信號的多個(gè)圖像幀；并且以比用于編碼或壓縮背景的比特密度更高的一個(gè)或多個(gè)比特密度為基礎(chǔ)來編碼與在各個(gè)圖像幀內(nèi)的一個(gè)或多個(gè)感興趣對象相關(guān)聯(lián)的一個(gè)或多個(gè)區(qū)域，其中，所述背景和所述一個(gè)或多個(gè)感興趣對象形成所述各個(gè)圖像幀。
11.如權(quán)利要求10所述的方法，進(jìn)一步包括識別所述各個(gè)圖像幀內(nèi)的所述一個(gè)或多個(gè)感興趣對象。
12.如權(quán)利要求10所述的方法，進(jìn)一步包括識別所述各個(gè)圖像幀內(nèi)的感興趣區(qū)域，其中，所述感興趣區(qū)域至少部分地包括所述一個(gè)或多個(gè)感興趣對象。
13.如權(quán)利要求12所述的方法，進(jìn)一步包括按比例增加所述各個(gè)圖像幀內(nèi)的所述感興趣區(qū)域，以增加所述各個(gè)圖像幀內(nèi)的所述感興趣區(qū)域的突出性。
14.如權(quán)利要求12所述的方法，進(jìn)一步包括調(diào)整所述各個(gè)圖像幀內(nèi)的所述感興趣區(qū)域，以將所述一個(gè)或多個(gè)感興趣對象中的至少一個(gè)居中地放置在所述各個(gè)圖像幀內(nèi)。
15.如權(quán)利要求12所述的方法，進(jìn)一步包括以上下文信息為基礎(chǔ)來調(diào)整所述感興趣區(qū)域，以將所述一個(gè)或多個(gè)感興趣對象中的至少一個(gè)放置在所述各個(gè)圖像幀內(nèi)的偏離中心的位置處。
16.如權(quán)利要求15所述的方法，其中，所述一個(gè)或多個(gè)感興趣對象包括視頻會議的參與者的一個(gè)或多個(gè)面部，并且其中，所述上下文信息包括所述一個(gè)或多個(gè)面部的面部取向。
17.如權(quán)利要求9所述的方法，進(jìn)一步包括向一個(gè)或多個(gè)接收方發(fā)射編碼或壓縮的多個(gè)圖像幀，其中，所述發(fā)射包括分開地發(fā)射所述一個(gè)或多個(gè)感興趣對象和所述背景。
18.—種系統(tǒng),包括: 攝像機(jī)，該攝像機(jī)配置為捕獲具有多個(gè)圖像幀的視頻信號；編碼引擎，該編碼引擎可操作地耦接到所述攝像機(jī)并且配置為執(zhí)行下列操作: 接收多個(gè)捕獲的圖像幀；并且以比用于編碼或壓縮各個(gè)圖像幀的背景的比特密度更高的一個(gè)或多個(gè)比特密度為基礎(chǔ)來編碼或壓縮所述各個(gè)圖像幀內(nèi)的一個(gè)或多個(gè)感興趣對象，其中，所述背景和所述一個(gè)或多個(gè)感興趣對象形成所述各個(gè)圖像幀；以及發(fā)射機(jī)，該發(fā)射機(jī)耦接到所述編碼引擎并且配置為向一個(gè)或多個(gè)接收方發(fā)射編碼或壓縮的多個(gè)圖像幀。
19.如權(quán)利要求18所述的系統(tǒng)，進(jìn)一步包括上下文引擎，該上下文引擎耦接到所述攝像機(jī)并且配置為執(zhí)行下列操作: 接收多個(gè)捕獲的圖像幀；并且識別在所述各個(gè)圖像幀中的所述一個(gè)或多個(gè)感興趣對象。
20.一種制造物品，包括: 有形和非暫態(tài)的計(jì)算機(jī)可讀存儲介質(zhì)；以及多個(gè)編程指令，該多個(gè)編程指令存儲在所述存儲介質(zhì)中，并且配置為使一種裝置響應(yīng)于所述編程指令的執(zhí)行而執(zhí)行操作，所述操作包括: 接收視頻信號的多個(gè)圖像幀；并且以比用于編碼或壓縮各個(gè)圖像幀的背景的比特密度更高的一個(gè)或多個(gè)比特密度為基礎(chǔ)來編碼或壓縮在所述各個(gè)圖像幀內(nèi)的一個(gè)或多個(gè)感興趣對象，其中，所述背景和所述一個(gè)或多個(gè)感興趣對象形成所述各個(gè)圖像幀。
【文檔編號】G06T9/00GK103460250SQ201180070040
【公開日】2013年12月18日申請日期:2011年4月11日優(yōu)先權(quán)日:2011年4月11日
【發(fā)明者】栗強(qiáng), 李文龍, 王鵬, 王濤, 杜楊洲, 李建國申請人:英特爾公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：栗強(qiáng);李文龍;王鵬;王濤;杜楊洲;李建國
技術(shù)所有人：英特爾公司
我是此專利的發(fā)明人

上一篇：多孔介質(zhì)中流量的變量高保真模擬的制作方法
上一篇：個(gè)性化廣告選擇系統(tǒng)和方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

圖像處理移除小對象相關(guān)技術(shù)

基于matlab的圖像處理相關(guān)技術(shù)

基于fpga的圖像處理相關(guān)技術(shù)

基于dsp的圖像處理相關(guān)技術(shù)

基于opencv的圖像處理相關(guān)技術(shù)

基于stm32的圖像處理相關(guān)技術(shù)

基于arm的圖像處理相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于感興趣對象的圖像處理的制作方法