欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

圖像遮罩生成的制作方法

文檔序號:2519818閱讀:601來源:國知局
專利名稱:圖像遮罩生成的制作方法
技術(shù)領(lǐng)域
本公開涉及圖形圖像處理,以及更具體地,涉及選擇圖像的多
個(gè)部分。
背景技術(shù)
通常,對于圖像中的每個(gè)像素,圖像遮罩表示每個(gè)像素是否被
選擇。有時(shí),可以將圖像遮罩稱為圖像蒙板(image matte)、選擇 遮罩或者a通道。二進(jìn)制遮罩是一種圖像遮罩,可以將其用于指示 每個(gè)像素的兩個(gè)互斥狀態(tài)中的一個(gè)狀態(tài)"被選擇"或者"未被選 擇,,、"前景,,或者"背景,,等。有時(shí)將不透明度遮罩稱為分級不 透明度遮罩,這種圖像遮罩表示每個(gè)像素處于兩種互斥狀態(tài)之一的 程度。不透明度遮罩可用以表示例如某些像素完全是前景或者完全 是背景,而其他像素在很大程度上是前景而在很少程度上是背景。 不透明度遮罩將給定像素標(biāo)識為前景的程度可以稱為關(guān)于不透明度 遮罩的像素不透明度。
通常,使用不透明度遮罩來選擇描繪具有軟邊緣(例如,該邊 緣與所描繪的其他對象或者背景相融合)的對象的圖像的區(qū)域。通 常,此類對象包括毛發(fā)、毛皮、羽毛、火、煙等??梢酝ㄟ^對二 進(jìn)制遮罩的邊緣進(jìn)行人工羽化或者軟化(例如,模糊),從二進(jìn)制 遮罩生成不透明度遮罩。然而,得到的不透明度遮罩通常表現(xiàn)出相 干的軟化邊緣,而該邊緣不能反映在圖像中描繪的特征(例如,邊
可以通過選擇顏色范圍來為圖像生成不透明度遮罩。可以使用 顏色范圍來確定不透明度遮罩是將圖像中的像素標(biāo)識為前景還是 背景。例如,包括藍(lán)色陰影的顏色范圍可用于生成不透明度遮罩,其中該不透明度遮罩基于像素中藍(lán)色的量而對每個(gè)像素標(biāo)識不透明 度值。例如,完全藍(lán)色的像素是前景,完全紅色或者綠色的像素標(biāo) 識為背景。然而,如在圖1中所描繪的圖像100的不透明度遮罩中 明顯看到的那樣,這一技術(shù)通常產(chǎn)生沒有完全包括期望區(qū)域(例如,
整個(gè)中央人物,不含人物的復(fù)制副本140)的不透明度遮罩。在圖像 100中,以與像素的不透明度值表示其為背景像素的程度成比例的方 式,用白色色調(diào)來高亮顯示像素。在圖2中示出了沒有遮罩處理的 原始圖像。注意,在圖像100中,盡管某些區(qū)域130具有正確標(biāo)識 前景區(qū)域的不透明度值,然而不期望的是,其他區(qū)域(諸如,人物 的眼睛)IIO被標(biāo)識為背景。用戶通常通過煩瑣的試錯(cuò)法過程來選擇 顏色范圍,該試錯(cuò)法過程依賴于檢查單獨(dú)顏色通道(例如,紅、綠 和藍(lán))或者顏色通道的組合,使用其專家式判斷來選擇顏色范圍并 且估計(jì)所得到的不透明度遮罩。

發(fā)明內(nèi)容
通常,在一方面中,實(shí)施方式特征在于將光柵圖像中的第一 批像素標(biāo)識為前景像素,以及將所述光柵圖像中不同的第二批像素 標(biāo)識為背景像素。所述前景像素以及背景像素中的每個(gè)均具有各自 的顏色值。使用所述前景像素的顏色值以及所述背景像素的顏色值 來求解不透明度顏色模型。使用所述不透明度顏色模型來確定所述 光柵圖像中像素的不透明度值。此方面的其他實(shí)施方式包括相應(yīng)的 系統(tǒng)、裝置和計(jì)算機(jī)程序產(chǎn)品。
這些以及其他實(shí)施方式可選地包括以下一個(gè)或者多個(gè)特4正。所 述不透明度顏色模型可以是非線性的。所述像素的顏色值可以包括 基于在圍繞所述像素的局部領(lǐng)域中的像素的顏色值的非局部信息。 可以基于所述光柵圖像中每個(gè)像素的不透明度值,來生成針對所述 光柵圖像的不透明度遮罩。求解所述不透明度顏色模型可以包括 標(biāo)識一個(gè)函數(shù),所述函數(shù)將給定像素的顏色值作為自變量,并且所 述函數(shù)的值是所述給定像素的不透明度值,其中所述函數(shù)是多個(gè)項(xiàng)的和,所述每個(gè)項(xiàng)是相應(yīng)的未確定的系數(shù)與相應(yīng)的單項(xiàng)式的乘積, 所述單項(xiàng)式具有與所述給定像素的顏色值的每個(gè)分量相對應(yīng)的一個(gè)
或者多個(gè)變量;以及通過確定所述函數(shù)中每個(gè)系數(shù)的值,來導(dǎo)出不 透明度顏色模型,所述導(dǎo)出基于所述前景像素和背景像素的顏色值。 使用所述不透明度顏色模型確定所述光柵圖像中像素的不透明度值 可以包括使用所述像素的顏色值來估計(jì)不透明度顏色模型。
求解不透明度顏色模型可以包括使用偏置以便偏向于前景像 素的顏色值或者背景像素的顏色值??梢越邮沾_定所述偏置的用戶 輸入。可以接收指定不透明度顏色模型的復(fù)雜度的用戶輸入??梢?使用所述不透明度顏色模型的復(fù)雜度來確定在不透明度顏色模型中 使用的顏色組合的數(shù)目?;谒霾煌该鞫阮伾P?,可以將所述 光柵圖像中的像素相干地分類為前景或者背景。
標(biāo)識所述光柵圖像中的所述第一批像素可以包括接收用戶輸 入,所述用戶輸入將來自所述圖像的多個(gè)像素標(biāo)識為所述第 一批像 素。標(biāo)識所述光柵圖像中的所述不同的第二批像素可以包括以下一 個(gè)或者多個(gè)步驟l)接收用戶輸入,所述用戶輸入將來自所述圖像 的多個(gè)像素標(biāo)識為所述第二批像素;2)選擇沿著所述圖像的邊界的 多個(gè)像素作為所述第二批像素;3)通過隨機(jī)采樣來選擇多個(gè)像素作 為所述第二批像素;以及4)選擇如下像素作為所述第二批像素,該 像素的顏色值與所述第 一 批像素中的像素的顏色值最不相似。
通常,在另一方面,實(shí)施方式的特征在于接收用戶輸入,所 述用戶輸入將光柵圖像中的第 一批像素標(biāo)識為前景像素或者背景像 素中的一種。所述光柵圖像中的每個(gè)像素均具有各自的顏色值。將 所述光柵圖像中不同的第二批像素標(biāo)識為前景像素或者背景像素中 的另 一種。使用所述前景像素的顏色值以及所述背景像素的顏色值 來求解不透明度顏色模型。通過使用所述不透明度顏色模型來確定 所述光柵圖像中每個(gè)像素各自的不透明度值,來生成針對所述光柵 圖像的不透明度遮罩。此方面的其他實(shí)施方式包括相應(yīng)的系統(tǒng)、裝 置以及計(jì)算機(jī)程序產(chǎn) 品O這些以及其他實(shí)施方式可選地包括以下一個(gè)或者多個(gè)特征。所 述不透明度顏色模型是非線性的。求解所述不透明度顏色模型可以
包括標(biāo)識一個(gè)函數(shù),所述函數(shù)將給定像素的顏色值作為自變量, 并且所述函數(shù)的值是所述給定像素的不透明度值,其中所述函數(shù)是 多個(gè)項(xiàng)的和,所述每個(gè)項(xiàng)是相應(yīng)的未確定的系數(shù)與相應(yīng)的單項(xiàng)式的 乘積,所述單項(xiàng)式具有與所述給定像素的顏色值的每個(gè)分量相對應(yīng) 的一個(gè)或者多個(gè)變量;以及通過確定所述函數(shù)中每個(gè)系數(shù)的值,來 導(dǎo)出不透明度顏色模型,所述導(dǎo)出基于所述前景像素和背景像素的 顏色值。使用所述不透明度顏色模型確定所述光柵圖像中像素的不 透明度值可以包括使用所述像素的顏色值來估計(jì)不透明度顏色模 型。在顯示器上更新光柵圖像的呈現(xiàn),以便在正在標(biāo)識所述第一批 像素時(shí)描繪所述不透明度遮罩。接收標(biāo)識所述第 一 批像素的用戶輸 入可以包括接收在所述圖像上繪制的筆畫。在所述圖像上繪制的 所述筆畫覆蓋的每個(gè)像素處于所述第一批像素之中。標(biāo)識所述光柵 圖像中所述不同的第二批像素包括以下一個(gè)或者多個(gè)步驟1 )接收 用戶輸入,所述用戶輸入將來自所述圖像的多個(gè)像素標(biāo)識為所述第 二批像素;2)選擇沿著所述圖像的邊界的多個(gè)像素作為所述第二批 像素;3)通過隨機(jī)采樣來選擇多個(gè)像素作為所述第二批像素;以及 4)選擇如下像素作為所述第二批像素,該像素的顏色值與所述第一 批像素中的像素的顏色值最不相似。
可以執(zhí)行在此說明書中描述的主題的特定實(shí)施方式,以便實(shí)現(xiàn) 以下的一個(gè)或者多個(gè)優(yōu)點(diǎn)。響應(yīng)于由用戶標(biāo)識的l象素,可以快速并 且精確地確定不透明度遮罩。由于可以通過單一地標(biāo)識背景像素或 者前景像素之一來生成不透明度遮罩,用戶不必既標(biāo)識前景像素又 標(biāo)識背景像素。對于通常由用戶使用傳統(tǒng)顏色范圍選擇技術(shù)而實(shí)踐 的人工試錯(cuò)法過程來說,從不透明度顏色模型生成不透明度遮罩基 本上實(shí)現(xiàn)了自動(dòng)化。通過向用戶提供進(jìn)一步控制(尤其是在準(zhǔn)確性 和性能之間),可以由用戶來操縱不透明度顏色模型的復(fù)雜度(例 如,項(xiàng)數(shù))。非線性的不透明度顏色模型可以生成高質(zhì)量的不透明
10度遮罩,即使對于包含三種或者更多主要顏色的圖像來說也是如此。 使用非線性的不透明度顏色模型是足夠高效的,使得當(dāng)接收到輸入 時(shí),可以響應(yīng)于用戶輸入來進(jìn)行所確定圖像遮罩的可視渲染,由此 使得不透明度遮罩的確定成為交互過程。
在下文的附圖以及說明書中闡明了本發(fā)明的一個(gè)或者多個(gè)實(shí)施 方式的細(xì)節(jié)。從說明書、附圖以及權(quán)利要求書中,本發(fā)明的其他特 征、方面和優(yōu)點(diǎn)將變得清楚明了。


本專利或者申請文件包括以彩色方式制作的至少 一副畫面。在 請求和支付必要費(fèi)用的情況下,可提供具有彩色畫面的本專利或者 專利申請公開的副本。
圖1示出了具有基于現(xiàn)有技術(shù)的顏色范圍選擇技術(shù)的不透明度
遮罩的圖像。
圖2示出了具有前景和背景筆畫的圖像。 圖3示出了不透明度顏色模型的函數(shù)通式。 圖4示出了繪出前景和背景像素的兩種顏色分量的示圖。 圖5示出了圖2的圖像,其中該圖像的一部分被高亮顯示。 圖6示出了針對圖5中圖像的不透明度遮罩的渲染(render)。 圖7A是用于確定圖像中像素的不透明值的流程圖。 圖7 B是當(dāng)接收用戶輸入時(shí)用于確定圖像中像素的不透明值的流 程圖。
圖8示出了用于確定圖像不透明度遮罩的系統(tǒng)。 在不同附圖中,相似的參考標(biāo)號表示相似的元件。
具體實(shí)施例方式
圖2示出了具有前景210和背景220筆畫的圖像200,從該圖像 中可以生成不透明度遮罩。圖像可以表示為像素光柵(例如,像素 的二維陣列),其中每個(gè)像素對描述特定位置處的圖像的值(例如,顏色、強(qiáng)度、或者兩者)進(jìn)行編碼。彩色圖像通常以彩色模型編碼,
諸如RGB彩色模型(紅、綠、藍(lán))或者CMYK彩色模型(青、品 紅、黃、黑)。可以對黑白圖像或者灰度圖像進(jìn)行編碼,以便每個(gè) 像素值表示灰度的強(qiáng)度。其他顏色或者灰度編碼也是可行的(例如, CIELAB、 CIEXYZ、 CIE LUV、 YCC、 YIQ、 HSB或者HSL)。像
素值對應(yīng)于將圖像進(jìn)行編碼的顏色模型的相應(yīng)的顏色分量。例如, 在RGB編碼圖像中,通過對應(yīng)于RGB的三個(gè)顏色分量(紅、綠、 藍(lán))中每個(gè)分量的至少三個(gè)值來編碼每個(gè)像素的值。
通常,以具有諸如以下格式之類的圖像格式的文件來描述和存 儲(chǔ)圖像及其組成像素聯(lián)合圖像專家組(JPEG)格式、便攜網(wǎng)絡(luò)圖 形(PNG)格式、圖形交互格式(GIF)格式、位圖(BMP)格式、 標(biāo)簽圖像文件格式(TIFF)格式,等等。
示出了添加在圖像200上的單獨(dú)筆畫210和220,并且表示用戶 希望去除中央人物(例如,由筆畫210覆蓋的人物)的復(fù)制副本。 已經(jīng)被筆畫覆蓋的像素被標(biāo)識為處于由不透明度遮罩表示的兩種狀 態(tài)之一 (例如,前景或者背景)中的像素。例如,筆畫210標(biāo)識前 景像素而筆畫220標(biāo)識背景像素。
通常,例如由用戶操縱輸入設(shè)備,可以將圖像中任意數(shù)量的像 素標(biāo)識為背景或者前景。例如,用戶可以使用計(jì)算機(jī)鼠標(biāo)、觸敏屏 幕、軌跡墊、壓敏板或者其他輸入設(shè)備,在圖像200上繪制筆畫210。 可選地,可以由系統(tǒng)自動(dòng)地(例如,基于由運(yùn)動(dòng);險(xiǎn)測、邊》彖;險(xiǎn)測或 者機(jī)器視覺系統(tǒng)執(zhí)行的識別)將像素或者標(biāo)識為前景、或者標(biāo)識為 背景。例如,通過選擇不透明度狀態(tài)(例如,切換前景/背景按鈕) 或者通過調(diào)整輸入方式(例如,使用鼠標(biāo)左鍵或者鼠標(biāo)右鍵),用 戶可以指示他們正在提供的輸入是標(biāo)識前景像素還是標(biāo)識背景像 素。
響應(yīng)于標(biāo)識圖像中的像素,可以向用戶提供可視反饋,該可視 反饋以可視化方式強(qiáng)調(diào)了所標(biāo)識的像素。例如,將由前景筆畫210 覆蓋的像素進(jìn)行高亮顯示(例如,將其以明亮顏色著色)??梢砸粤硪活伾珌韺⒁呀?jīng)標(biāo)識為背景(例如,筆畫220)的像素進(jìn)行高亮顯
示。在其他實(shí)現(xiàn)中,可以利用半透明的色調(diào)描繪已標(biāo)識像素,使所 述已標(biāo)識像素進(jìn)行高亮顯示或者模糊??蛇x地,可以呈現(xiàn)(例如, 作為半透明輪廓或者作為動(dòng)畫顯示的虛線)圍繞已標(biāo)識像素的鄰近 區(qū)域的邊界。
在其他實(shí)現(xiàn)中,代替僅強(qiáng)調(diào)已標(biāo)識像素的是,可以呈現(xiàn)響應(yīng)于 標(biāo)識像素而生成的不透明度遮罩的可視描繪。
可以將圖像的不透明度遮罩可視化為單色圖像,其中每個(gè)像素
的強(qiáng)度反映每個(gè)像素的不透明度(例如,參見圖6)。在其他實(shí)現(xiàn)中, 可以通過調(diào)整不透明度遮罩所應(yīng)用于的圖像的渲染來將不透明度遮 罩進(jìn)行可視化。例如,可以通過以全色方式渲染圖像的前景區(qū)域(如 由不透明度遮罩所標(biāo)識),來將不透明度遮罩可視化,而以非彩色 方式(例如,如圖l和圖5中所示的灰、黑或者白)渲染圖像的背 景區(qū)域。在其他實(shí)現(xiàn)中,在渲染之前,可以由圖像濾鏡來過濾如由 不透明度遮罩所標(biāo)識的主要是前景或者背景的圖像區(qū)域(例如,背 景像素被模糊或者從彩色向灰度轉(zhuǎn)換)。不透明度遮罩的其他描繪 方式(例如,單獨(dú)描繪不透明度遮罩,或者圍繞標(biāo)識為主要是前景
或者背景的圖像區(qū)繪制動(dòng)畫形式的虛線)也是可行的。以不同方式 渲染圖像的前景像素和背景像素允許用戶區(qū)分其輸入對于不透明度
遮罩的影響。
如在許多圖像中常見的那樣,在圖像200中,存在主要包括特 定顏色(例如,橙色和棕色)的區(qū)域230以及包括其他顏色(例如, 具有藍(lán)色色調(diào)的橙色和棕色)的區(qū)域240。在圖像中還可以存在其他 區(qū)(例如,毛發(fā)、毛皮、火、或者半透明或模糊對象之間的過渡區(qū)), 在這些區(qū)中像素具有在兩個(gè)區(qū)域中共有的顏色(例如,諸如由背景 筆畫220所標(biāo)識的各像素區(qū)域)。
結(jié)合不透明度的顏色模式使用已標(biāo)識像素(例如,由筆畫210 和220覆蓋),以便確定圖像的不透明度遮罩。參考圖3在下文中 示出了顏色模式及其出處的描述。對于圖像中每個(gè)像素,不透明度遮罩描述了該像素處于兩種互斥狀態(tài)(例如,前景或者背景)之一 的程度。在某些實(shí)現(xiàn)中,可以由通常范圍處于0和1之間的數(shù)字值 來度量像素的不透明度,其中0和1分別表示背景和前景。其他數(shù)
字標(biāo)度也是可行的,例如,不透明度值的范圍可以介于0和255之間。
不透明度的顏色模型基于具有以下通式的不透明度顏色模型函
數(shù),其中c表示特定像素的值,而/、 y'和A的范圍為該像素值的量 (例如,顏色分量的數(shù)量,對于RGB圖像是三,而對于CMYK圖 像是四)
= w'o + 2沐'wC, + 2沐2 '.,' + 5、C * +(1)
每個(gè)總和針對各分量或者分量組合(例如,y是顏色分量z和乂
的組合)求和。例如,適用于RGB顏色模型的函數(shù)通式可以表達(dá)為
"/ "(;/'/V(/', g,&) vv'0 + h'、r + h,3g' + vt.-';/; + h'4/"十n',5rg + vv6r6 + + wgg^ + h、Z 丄十*',
盡管只給出了函數(shù)的前十項(xiàng),但是不透明度的顏色模型函數(shù)可
以具有更多高階項(xiàng)。通常,不透明度顏色模型函數(shù)是各項(xiàng)的總和, 其中每個(gè)項(xiàng)是系數(shù)(例如,Wo、 Wl和w2)與顏色分量的獨(dú)特組合(例 如,r2、 g^或者g3)的乘積。當(dāng)添加項(xiàng)時(shí),等式的次數(shù)增加。只要
函數(shù)的次數(shù)超過顏色分量的數(shù)量(例如,當(dāng)項(xiàng)中的顏色分量提高至2
的冪或者更高時(shí)),則函數(shù)是非線性的。
圖3示出了顏色通道對于RGB模型的不透明度顏色模型的通式 的貢獻(xiàn)。函數(shù)310如上文所示。圖像中像素的每個(gè)顏色分量可以標(biāo) 識為顏色通道320;顏色通道有時(shí)還可以稱為顏色面(color plane)。 在不透明度顏色模型函數(shù)中的每個(gè)低階項(xiàng)捕獲單獨(dú)顏色通道320對 于不透明度遮罩中像素的不透明度的貢獻(xiàn)。函數(shù)中的高階項(xiàng)捕獲顏 色通道組合330的貢獻(xiàn)。例如"rg"組合顏色通道是紅色通道和綠色 通道的組合。通過在不透明度顏色模型函數(shù)中包括其他高階項(xiàng),可 以任意復(fù)雜的組合來組合顏色通道。
對多個(gè)顏色通道進(jìn)行組合類似于專家用戶通常用以生成不透明 度遮罩的實(shí)踐。例如,諸如Photosh叩(來自加利福尼亞州圣何塞的Adobe Systems公司)之類的工具允許用戶查看圖像的單獨(dú)顏色通道。 為了生成圖像遮罩,用戶通常檢查每個(gè)通道以便主觀地評價(jià)何種顏 色范圍將產(chǎn)生適當(dāng)?shù)牟煌该鞫日谡?。為了改進(jìn)其遮罩,用戶還可以 以變化的組合來組合一個(gè)或者多個(gè)顏色通道,以1更尋找適合的顏色范圍。
不透明度顏色模型函數(shù)中項(xiàng)的數(shù)量可以是預(yù)定的、自動(dòng)確定的、 可由用戶定制的,或者在實(shí)現(xiàn)中有所變化。在某些實(shí)現(xiàn)中,可以基 于用戶輸入來確定不透明度顏色模型函數(shù)中項(xiàng)的數(shù)量。由于提高了 不透明度顏色模型的復(fù)雜度(例如,項(xiàng)的數(shù)量),所以也提高了每 個(gè)較高階項(xiàng)中顏色分量組合的復(fù)雜度。每個(gè)額外的顏色分量組合意 味著,不透明度顏色模型更容易產(chǎn)生最佳的顏色區(qū)分,并且繼而針 對圖像中的像素產(chǎn)生更為準(zhǔn)確的不透明度值。
為了求解不透明度顏色模型,基于標(biāo)識為前景和背景的像素, 來導(dǎo)出不透明度顏色模型函數(shù)的系數(shù)的值。選擇模型的系數(shù)值以便 產(chǎn)生理想?yún)^(qū)分,該區(qū)分可以將前景像素和背景像素進(jìn)行分離。
圖4示出了 二維圖400,其繪出了通過對RG顏色空間中的圖像 的前景像素和背景像素進(jìn)行刷涂而標(biāo)識的像素的兩個(gè)顏色分量,即 紅色420和綠色410。圖400示出了不透明度顏色模型的系數(shù)值如何 影響前景像素和背景像素的區(qū)分方式。
圖400描繪了兩個(gè)分開的區(qū)域, 一個(gè)區(qū)域?qū)?yīng)于前景像素430 的紅/綠值,而另一區(qū)域?qū)?yīng)于背景像素440的紅/綠值。出于示出目 的,將使用針對RG顏色空間的最簡化的不透明度顏色模型函數(shù)
為函數(shù)系數(shù)指定值,這確定了將RG顏色空間劃分為兩個(gè)子空間 的線的位置和斜率(例如,線460或者線470 )。例如,在圖400 中,線470表示一個(gè)潛在的劃分。然而,得出的前景分區(qū)(例如, 該分區(qū)主要包括前景像素)包括多個(gè)背景像素443。作為比較,線 460表示更為理想的劃分,其中大多數(shù)前景像素430和背景像素440 是分開的。
15通常,前景和背景區(qū)域并不能如圖400所建議的那樣容易地用 直線劃分。然而通常,不透明度顏色模型是非線性函數(shù),該函數(shù)描 述了 n維空間中的彎曲的W維超表面,其中"是圖像中顏色分量的 數(shù)量。隨著不透明度顏色模型復(fù)雜度的增加,函數(shù)的表達(dá)也更復(fù)雜, 并且更可能的是,對于每個(gè)系數(shù)存在一組值,其將前景像素與背景 像素進(jìn)行了理想劃分。
有可能不存在將所有前景像素與所有背景像素分開的劃分。如 果這種劃分是不可能的,則理想劃分是可以將劃分誤差最小化的劃 分。可以通過將背景分區(qū)中的前景像素以及前景分區(qū)中的背景像素 進(jìn)行比較,來度量特定劃分的劃分誤差。劃分誤差越低,則在其相 應(yīng)劃分的錯(cuò)誤側(cè)存在的像素越少。
尤其是,如果前景像素的不透明度等于不透明度值1 (例如,不
透明度=1),并且背景像素的不透明度等于不透明度值O(例如,不 透明度=0),則在某些實(shí)現(xiàn)中,通過以下函數(shù)來給出劃分誤差,其 中大寫字母表示矢量
在上述函數(shù)中,第一總和覆蓋每個(gè)前景像素而第二總和覆蓋 每個(gè)背景像素L變量『表示在不透明度顏色模型函數(shù)中每項(xiàng)的系 數(shù)的矢量,而Z表示在不透明度顏色模型函數(shù)中每項(xiàng)中的像素值組 合的矢量。例如,對于RGB圖像和具有十項(xiàng)的不透明度顏色模型函 數(shù)
<formula>formula see original document page 16</formula>A'{ S 、 r' g' /), rg、 r/,', //,,
在其他實(shí)現(xiàn)中,矢量I可以包括非局部顏色導(dǎo)出信息,其中矢 量中的像素值或者其分量(例如,r、 g或者6)是在局部像素鄰域 (neighborhood)上的像素的像素值的函數(shù)。對于給定像素,其局部 領(lǐng)域例如可以是最靠近的4個(gè)、8個(gè)、12個(gè)或者24個(gè)像素。例如, 上述示例中的r、 g和Z 顏色分量還可以包括顏色分量水平(x)和 豎直(y)梯度(例^口, rx、 7、 gx、 g_y、 6x和/ 7)。作為一辜4戈或^卜充,每個(gè)分量還可以包括如下信息,諸如整體梯度量值、領(lǐng)域平
均、中值、雙向?yàn)V鏡值或者紋理度量。可以將所有這些潛在分量與 顏色分量組合,以便擴(kuò)充不透明度的非線性模型。以此方式,像素 處的不透明度值可以合并有諸如局部紋理和邊緣信息之類的較高級
的信息。
當(dāng)誤差最小化時(shí),對等式(1)求微分并且對『進(jìn)行求解,產(chǎn)生
以下解
『=Ar'-》r,.
其中M"是矩陣M的逆,并且其中M中的每個(gè)Z、乂元素定義為
通過將矢量『中給出的系數(shù)代入不透明度顏色模型函數(shù)(1 )中, 來導(dǎo)A不透明度顏色模型??梢酝ㄟ^簡單地使用與像素相關(guān)聯(lián)的值 估計(jì)不透明度顏色模型,來確定圖像中每個(gè)像素的不透明度值。
在某些實(shí)現(xiàn)中,在確定不透明度顏色模型的系數(shù)值時(shí),可以使 用偏置參數(shù)來為背景像素或者前景像素給出更大的權(quán)重(例如,更
為偏向于一個(gè)或者另一個(gè))。在這樣的實(shí)現(xiàn)中,可以將偏置I3組合 到矩陣M之中,得出
在上述等式中,當(dāng)偏置較大時(shí),則偏向于背景像素。相反,當(dāng) 偏置較小時(shí),偏向于前景像素。考慮這樣的像素,其不透明度值指 示出其既不是完全前景也不是完全背景。當(dāng)偏置較小時(shí)(而不是偏 置較大時(shí)),該像素具有的不透明度值指示其更多是作為前景而不 是背景。理想的是,偏置參數(shù)可以基于用戶輸入,提供用戶控制以 便確定背景和前景像素標(biāo)識的相對權(quán)重。
在某些實(shí)現(xiàn)中,在不透明度顏色模型估計(jì)期間,可以約束不透 明度的顏色模型,以便確保由用戶標(biāo)識為前景和背景的像素是如此
標(biāo)識的。受約束的不透明度顏色模型(即,opacity')給出如下
0/肌//>''(/') = min( max( fj/逾:'/(v'(7),八(/) ), 1一 / (,))
在上述函數(shù)中,/是圖像中的第/個(gè)像素,而/+是前景像素的矢量,其中如果在圖像中的第/個(gè)像素被標(biāo)識為前景像素,則每個(gè)元素
Z是l;否則為0。在背景像素的矢量/.中,如果圖像中的第f個(gè)像素 被標(biāo)識為背景像素,則每個(gè)第/個(gè)元素是l;否則為0。受約束的不 透明度顏色模型有效地將標(biāo)識為前景的像素的不透明度值設(shè)置為1, 而將標(biāo)識為背景像素的像素的不透明度值設(shè)置為0,而與由(不受約 束的)不透明度顏色模型所確定的其不透明度值無關(guān)。
盡管用戶可以標(biāo)識前景像素和背景像素兩者,但不必嚴(yán)格地要 求用戶必須標(biāo)識出前景像素和背景像素兩者。在某些實(shí)現(xiàn)中,標(biāo)識 前景像素或者背景像素中的一個(gè)就足夠了。在此類實(shí)現(xiàn)中,如果標(biāo) 識了一個(gè)狀態(tài)(例如,前景)的像素,則可以自動(dòng)標(biāo)識另一狀態(tài)(例 如,背景)的像素。代替接收明確標(biāo)識(例如,由用戶或者其他標(biāo) 識裝置或者處理來標(biāo)識,諸如可以作為邊緣檢測系統(tǒng)的結(jié)果而執(zhí)行) 的是,可以使用自動(dòng)標(biāo)識的像素。在下文關(guān)于自動(dòng)像素選擇的描述 中,假定僅標(biāo)識了前景像素。注意,作為代替,如果初始已經(jīng)標(biāo)識 了背景像素,則在下文中描述的關(guān)于自動(dòng)標(biāo)識的技術(shù)還適用于自動(dòng) 選沖奪前景像素。
在某些實(shí)現(xiàn)中,自動(dòng)標(biāo)識背景像素可以包括選擇距離已標(biāo)識前 景像素最遠(yuǎn)的像素。例如,假定在圖像左上部區(qū)域中選擇前景像素, 則可以自動(dòng)地從圖像右下部區(qū)域中的邊界區(qū)域自動(dòng)標(biāo)識背景像素。 在某些實(shí)現(xiàn)中,可以離邊界區(qū)域的預(yù)定距離內(nèi)自動(dòng)標(biāo)識多個(gè)像素。
在某些其他實(shí)現(xiàn)中,可以從圖像中隨機(jī)采樣像素,并且將每個(gè) 采樣像素與前景像素進(jìn)行比較。可以將采樣中的如下像素自動(dòng)標(biāo)識 為背景像素,其中該像素的顏色值與前景像素的顏色值最不相似。 顏色空間中的兩個(gè)像素各自顏色之間的距離可用以確定一個(gè)像素的 顏色與另 一像素的顏色是如何相似或如何不同。
圖5示出了圖像200的渲染500,其中將該圖像的一部分高亮顯 示(例如,背景是白色510),向用戶提供在給定當(dāng)前的前景像素和 背景像素的標(biāo)識的情況下圖像中像素的不透明度值的反饋。注意, 相對于圖像100來說,更有效地去除了圖像500中的中央人物的復(fù)制副本。全色的圖像區(qū)域520向用戶指出該區(qū)域中像素的不透明 度值更接近于1而不是0(例如,更多地作為前景而不是作為背景)。 在其他實(shí)現(xiàn)中,基于像素的特定不透明值,可以通過將像素進(jìn)行高 亮顯示(例如,以半透明著色方式高亮顯示)來繪出像素的不透明 度值。還可以使用其他方式繪出不透明度遮罩(例如,圍繞具有超 過預(yù)定閾值或者用戶提供的閾值的不透明度值的像素區(qū),繪制動(dòng)畫 形式的虛線)。
在某些實(shí)現(xiàn)中,在用戶標(biāo)識前景像素或背景像素之一時(shí),提供 關(guān)于所得到的不透明度遮罩的信息的圖像渲染可以被連續(xù)地更新。 例如,可以響應(yīng)于/人用戶4妄收的用戶4lT入的每個(gè)實(shí)例(例如,鼠標(biāo) 繪出筆畫的每次運(yùn)動(dòng)),來調(diào)整圖像中的高亮顯示區(qū)域。通常,一 旦接收到輸入,就立刻確定不透明度顏色模型函數(shù)的系數(shù),并且估 計(jì)圖像的不透明度遮罩。指示當(dāng)前不透明度遮罩的圖像渲染向用戶 提供實(shí)況的可視反饋,這允許用戶來感知輸入正在如何影響不透明
度遮罩。
圖6示出了從用戶輸入確定的、用于圖5中圖像的不透明度遮 罩的渲染600。在渲染600中,其不透明度值接近零或?yàn)榱愕膱D像區(qū) 610(例如,背景)被渲染為黑色。其不透明度值接近一或?yàn)橐坏膱D 像區(qū)620 (例如,前景)被渲染為白色。諸如在區(qū)域630中的像素之 類的具有在零和一之間的不透明度值的像素(例如,處于前景和背 景之間某處))被渲染為與其各自的不透明度值呈比例的灰色。
圖7A是使用不透明度顏色模型來確定圖像中像素的不透明度 值的方法700的流程圖。方法700包括從圖像中標(biāo)識或者是前景或 者是背景的像素(步驟710)。通常,基于接收的用戶輸入來標(biāo)識此 類像素。例如,用戶可以使用鼠標(biāo)在圖像之上繪出前景筆畫,并且 由前景筆畫所覆蓋的像素被標(biāo)識為前景像素。
可選地,可以通過在圖像之上繪出的矢量路徑來標(biāo)識像素。可 以沿著路徑畫出預(yù)定的或者用戶指定的半徑的涂刷以便標(biāo)識像素。像素的屬性依賴于圖像內(nèi)部的像素顏色或者像素位置??梢允褂瞄?值或者范圍以及 一 個(gè)或者多個(gè)像素屬性來標(biāo)識圖像中的像素。例如, 可以基于其亮度、離圖像中心的遠(yuǎn)近或者顏色飽和度來標(biāo)識像素。 可以將具有低于下限閾值的屬性值的像素標(biāo)識為前景(或者背景), 并且可以將具有高于上限閾值的屬性值的像素標(biāo)識為背景(或者前 景)。
在另一實(shí)現(xiàn)中,可以根據(jù)初始圖像遮罩來標(biāo)識像素。初始圖像 遮罩可以是由用戶來標(biāo)識的、預(yù)定的(例如,基于模板)或者自動(dòng) 確定的。如果初始遮罩是二進(jìn)制遮罩,則可以利用高斯或者其他模 糊函數(shù)來將二進(jìn)制遮罩進(jìn)行模糊處理,以便生成初始不透明度遮罩。 可以將其不透明度低于下限閾值的像素標(biāo)識為背景(或者前景), 而將其不透明度高于上限閾值的像素標(biāo)識為前景(或者背景)。
響應(yīng)于標(biāo)識前景像素,方法700包括標(biāo)識背景像素(步驟720)。 在某些實(shí)現(xiàn)中,背景像素可以通過用戶輸入來標(biāo)識,其方式與標(biāo)識 前景像素的方式相同(例如,通過在圖像之上進(jìn)行刷涂)。可選地, 可以基于圖像中的前景像素的位置或者像素的顏色值來自動(dòng)標(biāo)識背 景像素。步驟720被描述為響應(yīng)于標(biāo)識前景像素而標(biāo)識背景像素。 然而,可替代地,如果在步驟710中標(biāo)識了背景像素,則以相同方 式在步驟720中標(biāo)識前景像素。
方法700包括標(biāo)識具有固定項(xiàng)數(shù)的不透明度顏色模型函數(shù)(步 驟730 )。函數(shù)中的項(xiàng)數(shù)可以是預(yù)定的,或者可以從用戶接收,或者 可以自動(dòng)確定。在一個(gè)實(shí)現(xiàn)中,用戶可以在標(biāo)識前景像素和背景像 素之前、期間或者之后對這種參數(shù)進(jìn)行指定和操縱。例如,可以根 據(jù)默認(rèn)值來初始預(yù)定不透明度顏色模型函數(shù)中的項(xiàng)數(shù)。響應(yīng)于接收 到對前景像素以及背景像素的標(biāo)識,由方法700確定初始不透明度 遮罩(參見下文中的步驟)。用戶可以提供用戶輸入來影響(例如, 增加或者減少)不透明度顏色模型函數(shù)中的項(xiàng)數(shù)。作為響應(yīng),從新 的不透明度顏色模型函數(shù)來確定新的不透明度遮罩。
通過使用已標(biāo)識的不透明度顏色模型函數(shù),方法700包括根
20據(jù)之前已經(jīng)標(biāo)識的前景像素和背景像素來確定函數(shù)的系數(shù)(步驟 740)??梢酝ㄟ^將以下函數(shù)最小化來導(dǎo)出上述函數(shù)的系數(shù),所述函 數(shù)度量利用不透明度顏色模型將圖像顏色空間中的前景像素與背景 像素相區(qū)分時(shí)的誤差。
方法700可以包括使用不透明度顏色模型來估計(jì)圖像中的每 個(gè)像素,以便確定針對每個(gè)已估計(jì)像素的不透明度值(步驟750 )。 圖像中所有像素的不透明度值構(gòu)成不透明度遮罩。不透明度遮罩例 如可以用于限制后續(xù)圖像操縱操作的影響。例如,依賴于像素的不 透明度值,可以將像素進(jìn)行過濾,諸如顏色著色、顏色調(diào)整、模糊 等等。在另一示例中,使用不透明度遮罩來選擇圖像內(nèi)部的像素(例 如,前景像素或者其不透明度值大于特定閾值的像素)。
在某些實(shí)現(xiàn)中,還可將估計(jì)顏色模型的結(jié)果用作對其他圖像處 理技術(shù)的輸入。例如,可以與相干分類(coherent classification )相 結(jié)合來使用像素的不透明度值,如在2006年9月6日提交的美國專
利申請No._中所述的那樣,該專利申請名稱為LIVE
COHERENT IMAGE SELECTION,發(fā)明人為Gregg Wilensky、 Scott Cohen以及Jen-Chan Chien。在此類實(shí)現(xiàn)中,作為對使用常數(shù)值來確 定將像素分類為前景或者背景的區(qū)域代價(jià)的替代,該區(qū)域代價(jià)可以 是像素的不透明度的函數(shù)。可以對用于對圖像中的像素進(jìn)行相干分 類的代價(jià)函數(shù)進(jìn)行修改,以便使得與將像素Z分類為前景或者背景相 關(guān)聯(lián)的區(qū)域代價(jià)可以分別由以下函數(shù)來描述
< 二 log( 1 /opaczXK0 )和《=log( 1/(1 —1^""々0')))
有利的是,與相干分類相結(jié)合來使用不透明度顏色模型可以產(chǎn) 生擴(kuò)充的選擇,其中可以從相對較少的已標(biāo)識像素(例如,對圖像 進(jìn)行刷涂的用戶輸入)中選擇圖像的大量部分。通常,可以足夠快 速地確定圖像中像素的不透明度值,從而可以重復(fù)并且連續(xù)使用相 結(jié)合的技術(shù)以便在接收到用戶輸入時(shí)生成并渲染選擇。
圖7B是當(dāng)接收到用戶輸入時(shí)用于確定圖像中像素的不透明度值 的方法705的流程圖。方法705包括從用戶接收標(biāo)識來自圖像的像素的輸入,其中該輸入將像素標(biāo)識為前景或者背景中的任何一個(gè)(步 驟715)。相應(yīng)于用戶輸入,可以將像素自動(dòng)地標(biāo)識為前景或者背景
(步驟725 )(例如,如果用戶輸入標(biāo)識了前景像素,則自動(dòng)標(biāo)識背
景像素)。如果用戶已經(jīng)標(biāo)識了前景像素以及背景像素兩者(例如, 通過先前接收到的用戶輸入),則不必自動(dòng)標(biāo)識圖像中的任何像素。 根據(jù)已標(biāo)識的前景像素和背景像素來標(biāo)識不透明度顏色模型函 數(shù),并確定該函數(shù)的系數(shù),并且使用該函數(shù)來確定圖像中像素的不
透明度值(步驟730-750 ),其方式與參考圖7A所述的方式相同。 可以更新圖像的呈現(xiàn),以便描繪圖像中像素的當(dāng)前不透明度值 (步驟760 )。例如,可以將背景中的像素進(jìn)行模糊(例如,以灰度 渲染、或者以與其不透明度值成比例的有色色調(diào)來渲染)。更新呈 現(xiàn)允許用戶來鑒別獲得的不透明度遮罩并且相應(yīng)地調(diào)整其輸入。
在某些實(shí)現(xiàn)中,當(dāng)接收到用戶輸入時(shí),確定像素不透明度值并 且更新圖像的渲染。如果從用戶接收到標(biāo)識像素的其他輸入(步驟 770 ),則接收并處理進(jìn)一步的輸入(返回步驟715)。當(dāng)已經(jīng)獲得 期望的不透明度遮罩時(shí),通常,可以將不透明度遮罩用于后續(xù)圖像 處理操作(例如,選擇或者變換),這些后續(xù)圖像處理操作通常與 不透明度遮罩值相稱(例如,僅使前景像素經(jīng)歷全部操作)。
圖8示出了使用非線性不透明度顏色模型來確定圖像不透明度 遮罩的系統(tǒng)800。系統(tǒng)800通常包括模塊(例如,模塊840至890 ) 以及資源(例如,資源810以及820 )。通常,模塊是不同的功能性 單元,其可以向其他模塊提供信息,或者從其他模塊接收信息。模 塊可以輔助與輸入或者輸出設(shè)備(例如,顯示模塊890或者輸入模 塊880 )進(jìn)行通信。模塊可以對資源進(jìn)行操作。資源是可以由模塊操 作的信息集合。
系統(tǒng)800包括圖像810,該圖像包括其不透明度值能夠被確定的 像素。圖像810中的每個(gè)像素的不透明度值構(gòu)成不透明度遮罩820。 不透明度遮罩820可以是與圖像810分離的單獨(dú)資源,然而,在某 些實(shí)現(xiàn)中,不透明度遮罩可以表示在圖像資源810中。系統(tǒng)800包括輸入模塊880,用于從用戶接收像素標(biāo)識(例如, 前景像素和背景像素)。輸入模塊880可以從一個(gè)或者多個(gè)輸入設(shè) 備(例如,鍵盤或者鼠標(biāo))885來接收輸入。輸入模塊880還可以確 定像素標(biāo)識的特定狀態(tài)(例如,前景或者背景)。例如,該標(biāo)識可 以基于設(shè)備的狀態(tài),諸如鍵盤按鍵的狀態(tài)(是在使用鼠標(biāo)左鍵還是 右鍵)或者向?qū)懽职逶O(shè)備提供輸入的筆的類型。在其他實(shí)現(xiàn)中,輸 入模塊880可以基于在從照相機(jī)880接收的圖像中的邊緣或者運(yùn)動(dòng) 檢測,來確定像素標(biāo)識。
像素標(biāo)識器840可以從輸入模塊880接收已標(biāo)識像素。像素標(biāo) 識器840可以自動(dòng)標(biāo)識圖像中的如下像素,該像素具有與從輸入模 塊880接收的像素相反的標(biāo)識??梢詫?biāo)識了圖像中的前景像素和 背景像素兩者的信息提供至不透明度顏色模型導(dǎo)出模塊860。
不透明度顏色模型函數(shù)生成器850標(biāo)識具有特定項(xiàng)數(shù)的特定不 透明度顏色模型函數(shù)。在一個(gè)實(shí)現(xiàn)中,模塊850可以接收來自輸入 處理器的用戶輸入,以便確定函數(shù)中的項(xiàng)數(shù)。將特定不透明度顏色 模型函數(shù)提供至不透明度顏色模型導(dǎo)出模塊860。
不透明度顏色模型導(dǎo)出模塊860使用像素標(biāo)識以及不透明度顏 色模型函數(shù),來導(dǎo)出圖像的不透明度顏色模型。導(dǎo)出不透明度顏色 模型要求確定不透明度顏色模型函數(shù)的系數(shù),該系數(shù)與前景像素以 及背景像素標(biāo)識匹配。將不透明度顏色模型提供至不透明度顏色模 型估計(jì)器模塊870。
不透明度顏色模型估計(jì)器模塊870訪問圖像810,并且使用由模 塊860導(dǎo)出的不透明度顏色模型來估計(jì)圖像810中的每個(gè)像素。對 像素的不透明度顏色模型進(jìn)行估計(jì)生成該像素的不透明度值。像素 的不透明度值可以存儲(chǔ)在不透明度遮罩820中。
顯示模塊890可以使用來自不透明度遮罩820的信息以及關(guān)于 圖像810的信息,從而生成不透明度遮罩和圖像的可視渲染(例如, 從而使得具有背景不透明度值的像素被高亮顯示或者模糊)。在某 些實(shí)現(xiàn)中,來自像素標(biāo)識器840的信息還可用以渲染由用戶標(biāo)識的像素(例如,在圖像之上繪制筆畫)。顯示模塊890可以連接至一
個(gè)或者多個(gè)顯示設(shè)備895。
系統(tǒng)800描述了用于從非線性不透明度顏色模型生成不透明度 遮罩的一種潛在實(shí)現(xiàn)。通常,可以將模塊和資源進(jìn)行組合或者劃分, 并且在由一個(gè)或者多個(gè)網(wǎng)絡(luò)連接的一個(gè)或者多個(gè)計(jì)算設(shè)備上的硬件 或者軟件的某種組合中實(shí)現(xiàn)。
本說明書中描述的主題和功能性操作的實(shí)施方式可以在數(shù)字電 子電路中實(shí)現(xiàn),或者在計(jì)算機(jī)軟件、固件或硬件中實(shí)現(xiàn)(包括本說 明書中公開的結(jié)構(gòu)及其等同結(jié)構(gòu)),或者在它們的一個(gè)或多個(gè)的組 合中實(shí)現(xiàn)。本說明書中描述的主題的實(shí)施方式可以實(shí)現(xiàn)為一個(gè)或多 個(gè)計(jì)算機(jī)程序產(chǎn)品,也即,在計(jì)算機(jī)可讀介質(zhì)上編碼的、用于由數(shù) 據(jù)處理裝置執(zhí)行或用于控制數(shù)據(jù)處理裝置的操作的一個(gè)或多個(gè)計(jì)算 機(jī)程序指令模塊。計(jì)算機(jī)可讀介質(zhì)可以是機(jī)器可讀的存儲(chǔ)設(shè)備、機(jī) 器可讀的存儲(chǔ)襯底、存儲(chǔ)器設(shè)備、實(shí)現(xiàn)計(jì)算機(jī)可讀的傳播信號的物 質(zhì)的組合、或者它們中的一個(gè)或多個(gè)的組合。術(shù)語"數(shù)據(jù)處理裝置" 包括用于處理數(shù)據(jù)的所有裝置、設(shè)備和機(jī)器,例如包括可編程處理 器、計(jì)算機(jī),或者多個(gè)處理器或計(jì)算機(jī)。除了硬件之外,該裝置可 以包括為所考慮的計(jì)算機(jī)程序創(chuàng)建執(zhí)行環(huán)境的代碼,例如,構(gòu)成處 理器固件、協(xié)議棧、數(shù)據(jù)庫管理系統(tǒng)、操作系統(tǒng)、或者它們中一個(gè) 或多個(gè)的組合的代碼。傳播信號是人工產(chǎn)生的信號,例如,機(jī)器產(chǎn) 生的電信號、光信號或者電磁信號,生成該信號以對信息進(jìn)行編碼, 以便傳輸?shù)竭m當(dāng)?shù)慕邮掌餮b置。
計(jì)算機(jī)程序(也稱為為程序、軟件、軟件應(yīng)用、腳本或代碼) 可以由任意形式的編程語言編寫,包括編譯語言或解釋語言,并且 該計(jì)算機(jī)程序可以任意形式部署,包括部署為單獨(dú)的程序或模塊、 組件、子例程,或者適于在計(jì)算環(huán)境中使用的其他單元。計(jì)算機(jī)程 序無需對應(yīng)于文件系統(tǒng)中的文件。程序可以存儲(chǔ)在保存其他程序或 數(shù)據(jù)的文件的一部分(例如,存儲(chǔ)在標(biāo)記語言文檔中的一個(gè)或多個(gè) 腳本)中,可以存儲(chǔ)在專門用于所考慮的程序的單個(gè)文件中,或者存儲(chǔ)在多個(gè)協(xié)同文件(例如,存儲(chǔ)一個(gè)或多個(gè)模塊、子程序,或代 碼部分的文件)中??梢詫⒂?jì)算機(jī)程序部署為在一個(gè)計(jì)算機(jī)上執(zhí)行, 或者將其部署為在位于一個(gè)地點(diǎn)的多個(gè)計(jì)算機(jī)上執(zhí)行或跨過多個(gè)地 點(diǎn)分布且通過通信網(wǎng)絡(luò)互連的多個(gè)計(jì)算機(jī)上執(zhí)行。
本說明書中描述的處理和邏輯流程可以由執(zhí)行一個(gè)或多個(gè)計(jì)算 機(jī)程序的 一 個(gè)或多個(gè)可編程處理器執(zhí)行,用于通過對輸入數(shù)據(jù)進(jìn)行 操作以及產(chǎn)生輸出來執(zhí)行功能。該處理和邏輯流程還可以由例如
FPGA (現(xiàn)場可編程門陣列)或ASIC (專用集成電路)之類的專用 邏輯電路執(zhí)行,并且也可以將裝置實(shí)現(xiàn)為所述專用邏輯電路。
適于計(jì)算機(jī)程序執(zhí)行的處理器例如包括通用和專用處理器兩
者、以及任意類型的數(shù)字計(jì)算機(jī)的任意一個(gè)或多個(gè)處理器。通常, 處理器將從只讀存儲(chǔ)器或隨機(jī)訪問存儲(chǔ)器或這兩者處接收指令和數(shù) 據(jù)。計(jì)算機(jī)的基本元件是用于執(zhí)行指令的處理器以及用于存儲(chǔ)指令 和數(shù)據(jù)的一個(gè)或多個(gè)存儲(chǔ)器設(shè)備。通常,計(jì)算機(jī)還將包括用于存儲(chǔ) 數(shù)據(jù)的 一個(gè)或多個(gè)海量存儲(chǔ)設(shè)備,或被操作性地耦合為從所述用于 存儲(chǔ)數(shù)據(jù)的一個(gè)或多個(gè)海量存儲(chǔ)設(shè)備接收數(shù)據(jù)、向其傳送數(shù)據(jù)、或 者進(jìn)行這兩者,該海量存儲(chǔ)設(shè)備例如磁盤、磁光盤、或光盤。然而, 計(jì)算機(jī)不必非得具有這樣的設(shè)備。而且,計(jì)算機(jī)可以嵌入在其他設(shè) 備中,例如移動(dòng)電話、個(gè)人數(shù)字助理(PDA)、移動(dòng)音頻播放器、 全球定位系統(tǒng)(GPS)接收器,等等。適于存儲(chǔ)計(jì)算機(jī)程序指令和數(shù) 據(jù)的計(jì)算機(jī)可讀介質(zhì)包括所有形式的非易失性存儲(chǔ)器、介質(zhì)和存儲(chǔ) 器設(shè)備,例如包括半導(dǎo)體存儲(chǔ)器設(shè)備,如EPROM、 EEPROM和閃 存設(shè)備;磁盤,如內(nèi)部硬盤或可移動(dòng)硬盤;磁光盤;以及CD-ROM 和DVD-ROM盤。處理器和存儲(chǔ)器可以由專用邏輯電路補(bǔ)充或是包 括在專用邏輯電路中。
為了提供與用戶的交互,本說明書中描述的主題的實(shí)施方式可 以在具有用于向用戶顯示信息的顯示設(shè)備以及用戶可以通過其向計(jì) 算機(jī)提供輸入的鍵盤和指示設(shè)備的計(jì)算機(jī)上實(shí)現(xiàn),其中顯示設(shè)備例 如CRT (陰極射線管)或者LCD (液晶顯示器)顯示器,指示設(shè)備例如鼠標(biāo)或者軌跡球。也可以使用其他類型的設(shè)備來提供與用戶的
交互;例如,提供給用戶的反饋可以是任何形式的感觀反饋,例如 視覺反饋、聲覺反饋、或者觸覺反饋;并且可以接收來自用戶的任
意形式的輸入,包括聲音、語音或觸覺輸入。
本說明書中描述的主題的實(shí)施方式可以實(shí)現(xiàn)在包括后端組件的
計(jì)算系統(tǒng)中,例如數(shù)據(jù)服務(wù)器;或?qū)崿F(xiàn)在包括中間件組件的計(jì)算系 統(tǒng)中,例如應(yīng)用服務(wù)器;或?qū)崿F(xiàn)在包括前端組件的計(jì)算系統(tǒng)中,例 如具有圖形用戶界面或者Web瀏覽器的客戶端計(jì)算機(jī),用戶通過該 圖形用戶界面或Web瀏覽器可以與本說明書中描述的主題的實(shí)現(xiàn)進(jìn) 行交互;或?qū)崿F(xiàn)在一個(gè)或多個(gè)這樣的后端、中間件、或前端組件的 任意組合中。系統(tǒng)組件可以與任意形式或介質(zhì)的數(shù)字?jǐn)?shù)據(jù)通信(例 如,通信網(wǎng)絡(luò))互連。通信網(wǎng)絡(luò)的示例包括局域網(wǎng)("LAN")和 廣域網(wǎng)("WAN")(例如,互聯(lián)網(wǎng))。
計(jì)算系統(tǒng)可以包括客戶端和服務(wù)器??蛻舳撕头?wù)器 一 般相互 遠(yuǎn)離,并且通常通過通信網(wǎng)絡(luò)進(jìn)行交互??蛻舳撕头?wù)器的關(guān)系是 借助于在各自計(jì)算機(jī)上運(yùn)行的、彼此具有客戶端-服務(wù)器關(guān)系的計(jì)算 機(jī)程序得到的。
盡管本說明書包含多種特定細(xì)節(jié),但是不應(yīng)將其理解為是對本 發(fā)明或者所要求保護(hù)內(nèi)容的范圍的限制,而應(yīng)當(dāng)理解為是對本發(fā)明具體實(shí)施方式
的特定特征的描述。本說明書中描述的在各個(gè)實(shí)施方 式的上下文中的某些特征也可以在單個(gè)實(shí)施方式中組合實(shí)現(xiàn)。相反, 在單個(gè)實(shí)施方式上下文中描述的各種特征也可以分別實(shí)現(xiàn)在多個(gè)實(shí) 施方式中或者任意適當(dāng)?shù)淖咏M合中。而且,盡管上文可能將特征描 述為在特定的組合中操作,甚至初始也是這樣要求保護(hù)的,但是來 自所要求保護(hù)的組合的一個(gè)或多個(gè)特征在一些情況下可以從該組合 中去除,并且所要求保護(hù)的組合可以針對子組合或子組合的變形。
類似地,盡管在附圖中以特定的順序描述操作,但是不應(yīng)將其
或是要求執(zhí)行全部所示的操作,以得到期望的結(jié)果。在特定環(huán)境中,
26多任務(wù)和并行處理可能是有利的。而且,在上述實(shí)施方式中多個(gè)系
統(tǒng)組件的分離不應(yīng)被理解為在所有實(shí)施方式中都需要這種分離,而 應(yīng)當(dāng)將其理解為所描述的程序組件和系統(tǒng)通??梢栽趩蝹€(gè)軟件產(chǎn)品
中集成在一起,或是被打包到多個(gè)軟件產(chǎn)品中。
已經(jīng)在說明書中描述了主題的特定實(shí)施方式。其他實(shí)施方式也 落入所附權(quán)利要求書的范圍內(nèi)。例如,可以以不同的次序執(zhí)行權(quán)利 要求書中所述的動(dòng)作,并且仍然實(shí)現(xiàn)期望的結(jié)果。
權(quán)利要求
1.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括將光柵圖像中的第一批像素標(biāo)識為前景像素,以及將所述光柵圖像中不同的第二批像素標(biāo)識為背景像素,所述前景像素以及背景像素中的每個(gè)均具有各自的顏色值;使用所述前景像素的顏色值以及所述背景像素的顏色值來求解不透明度顏色模型;以及使用所述不透明度顏色模型來確定所述光柵圖像中像素的不透明度值。
2. 根據(jù)權(quán)利要求1所述的方法,其中 所述不透明度顏色模型是非線性的。
3. 根據(jù)權(quán)利要求1所述的方法,其中像素的所述顏色值包括基于在圍繞所述像素的局部鄰域中的像 素的顏色值的非局部信息。
4. 根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括基于所述光柵圖像中每個(gè)像素的不透明度值,來生成針對所述 光柵圖像的不透明度遮罩。
5. 根據(jù)權(quán)利要求1所述的方法,其中求解所述不透明度顏色模 型進(jìn)一步包括標(biāo)識一個(gè)函數(shù),所述函數(shù)將給定像素的顏色值作為自變量,并 且所述函數(shù)的值是所述給定像素的不透明度值,其中所述函數(shù)是多 個(gè)項(xiàng)的和,所述每個(gè)項(xiàng)是相應(yīng)的未確定的系數(shù)與相應(yīng)的單項(xiàng)式的乘 積,所述單項(xiàng)式具有與所述給定像素的顏色值的每個(gè)分量相對應(yīng)的 一個(gè)或者多個(gè)變量;以及通過確定所述函數(shù)中每個(gè)系數(shù)的值,來導(dǎo)出不透明度顏色模型, 所述導(dǎo)出基于所述前景像素和背景像素的顏色值。
6. 根據(jù)權(quán)利要求1所述的方法,其中使用所述不透明度顏色模 型確定所述光柵圖像中像素的不透明度值進(jìn)一步包括使用所述像素的顏色值來估計(jì)不透明度顏色模型。
7. 根據(jù)權(quán)利要求1所述的方法,其中求解不透明度顏色模型進(jìn)一步包括使用偏置以便偏向于前景像素的顏色值或者背景像素的顏色值。
8. 根據(jù)權(quán)利要求7所述的方法,進(jìn)一步包括 接收確定所述偏置的用戶輸入。
9. 根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括接收指定不透明度顏色模型的復(fù)雜度的用戶輸入。
10. 根據(jù)權(quán)利要求9所述的方法,其中所述不透明度顏色模型的復(fù)雜度確定在不透明度顏色模型中使 用的多個(gè)顏色組合。
11. 根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括 基于所述不透明度顏色模型,將所述光柵圖像中的像素相干地分類為前景或者背景。
12. 根據(jù)權(quán)利要求1所述的方法,其中標(biāo)識所述光柵圖像中的 所述第一批像素包括接收用戶輸入,所述用戶輸入將來自所述圖像的多個(gè)像素標(biāo)識 為所述第一批像素。
13. 根據(jù)權(quán)利要求1所述的方法,其中標(biāo)識所述光柵圖像中的 所述不同的第二批像素包括以下一個(gè)或者多個(gè)步驟接收用戶輸入,所述用戶輸入將來自所述圖像的多個(gè)像素標(biāo)識 為所述第二批像素;選擇沿著所述圖像的邊界的像素作為所述第二批像素;通過隨機(jī)采樣來選擇多個(gè)像素作為所述第二批像素;以及 選擇如下像素作為所述第二批像素,該像素的顏色值與所述第一批像素中的像素的顏色值最不相似。
14. 一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括接收用戶輸入,所述用戶輸入將光柵圖像中的第一批像素標(biāo)識為前景像素或者背景像素中的 一 種,所述光柵圖像中的每個(gè)像素均具有各自的顏色值;將所述光柵圖像中不同的第二批像素標(biāo)識為前景像素或者背景像素中的另一種;使用所述前景像素的顏色值以及所述背景像素的顏色值來求解 不透明度顏色模型;以及通過使用所述不透明度顏色模型來確定所述光柵圖像中每個(gè)像 素各自的不透明度值,來生成針對所述光柵圖像的不透明度遮罩。
15. 根據(jù)權(quán)利要求14所述的方法,其中 所述不透明度顏色模型是非線性的。
16. 根據(jù)權(quán)利要求14所述的方法,其中求解所述不透明度顏色 模型進(jìn)一步包括標(biāo)識一個(gè)函數(shù),所述函數(shù)將給定像素的顏色值作為自變量,并 且所述函數(shù)的值是所述給定像素的不透明度值,其中所述函數(shù)是多 個(gè)項(xiàng)的和,所述每個(gè)項(xiàng)是相應(yīng)的未確定的系數(shù)與相應(yīng)的單項(xiàng)式的乘 積,所述單項(xiàng)式具有與所述給定像素的顏色值的每個(gè)分量相對應(yīng)的 一個(gè)或者多個(gè)變量;以及通過確定所述函數(shù)中每個(gè)系數(shù)的值,來導(dǎo)出不透明度顏色模型, 所述導(dǎo)出基于所述前景像素和背景像素的顏色值。
17. 根據(jù)權(quán)利要求14所述的方法,其中使用所述不透明度顏色 模型確定所述光柵圖像中像素的不透明度值包括使用所述像素的顏色值來估計(jì)不透明度顏色模型。
18. 根據(jù)權(quán)利要求14所述的方法,進(jìn)一步包括 在顯示器上更新光柵圖像的呈現(xiàn),以便在正在標(biāo)識所述第一批像素時(shí)描繪所述不透明度遮罩。
19. 根據(jù)權(quán)利要求14所述的方法,其中接收標(biāo)識所述第一批像 素的用戶輸入進(jìn)一步包括接收在所述圖像上繪制的筆畫。
20. 根據(jù)權(quán)利要求19所述的方法,其中在所述圖像上繪制的所述筆畫覆蓋的每個(gè)像素處于所述第 一批像素之中。
21. 根據(jù)權(quán)利要求14所述的方法,其中標(biāo)識所述光柵圖像中所 述不同的第二批像素包括以下一個(gè)或者多個(gè)步驟接收用戶輸入,所述用戶輸入將來自所述圖像的多個(gè)像素標(biāo)識 為所述第二批像素;選擇沿著所述圖像的邊界的多個(gè)像素作為所述第二批像素;通過隨機(jī)采樣來選擇多個(gè)像素作為所述第二批像素;以及 選擇如下像素作為所述第二批像素,該像素的顏色值與所述第 一批像素中的像素的顏色值最不相似。
22. —種編碼在計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)程序產(chǎn)品,其適用 于使得數(shù)據(jù)處理裝置來執(zhí)行以下操作,包括將在光柵圖像中的第 一批像素標(biāo)識為前景像素,以及將所述光 柵圖像中不同的第二批像素標(biāo)識為背景像素,所述前景像素以及背 景像素中的每個(gè)均具有各自的顏色值;使用所述前景像素的顏色值以及所述背景像素的顏色值來求解 不透明度顏色模型;以及使用所述不透明度顏色模型來確定所述光柵圖像中像素的不透 明度值。
23. —種編碼在計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)程序產(chǎn)品,其適用 于使得數(shù)據(jù)處理裝置來執(zhí)行以下操作,包括接收用戶輸入,所述用戶輸入將光柵圖像中的第 一批像素標(biāo)識 為前景像素或者背景像素中的 一種,所述光柵圖像中的每個(gè)像素均 具有各自的顏色值;將所述光柵圖像中不同的第二批像素標(biāo)識為前景像素或者背景 像素中的另一種;使用所述前景像素的顏色值以及所述背景像素的顏色值來求解 不透明度顏色模型;以及通過使用所述不透明度顏色模型來確定所述光柵圖像中每個(gè)像 素各自的不透明度值,來生成針對所述光柵圖像的不透明度遮罩。
24. —種系統(tǒng),包括標(biāo)識裝置,用于將在光柵圖像中的第 一批像素標(biāo)識為前景像素, 以及將所述光柵圖像中不同的第二批像素標(biāo)識為背景像素,所述前 景像素以及背景像素中的每個(gè)均具有各自的顏色值;求解裝置,用于使用所述前景像素的顏色值以及所述背景像素 的顏色值來求解不透明度顏色模型;以及確定裝置,用于使用所述不透明度顏色模型來確定所述光柵圖 像中像素的不透明度值。
25. —種系統(tǒng),包括接收裝置,接收用戶輸入,所述用戶輸入將光柵圖像中的第一 批像素標(biāo)識為前景像素或者背景像素中的 一種,所述光柵圖像中的 每個(gè)像素均具有各自的顏色值;標(biāo)識裝置,用于將所述光柵圖像中不同的第二批像素標(biāo)識為前景像素或者背景像素中的另一種;求解裝置,用于使用所述前景像素的顏色值以及所述背景像素 的顏色值來求解不透明度顏色模型;以及生成裝置,用于通過使用所述不透明度顏色模型來確定所述光 柵圖像中每個(gè)像素各自的不透明度值,來生成針對所述光柵圖像的 不透明度遮罩。
全文摘要
公開了一種方法、系統(tǒng)和設(shè)備,其中包括計(jì)算機(jī)程序產(chǎn)品,其特征在于將光柵圖像中的第一批像素標(biāo)識為前景像素,以及將所述光柵圖像中不同的第二批像素標(biāo)識為背景像素。所述前景像素以及背景像素均具有各自的顏色值。使用所述前景像素的顏色值以及所述背景像素的顏色值來求解不透明度顏色模型。使用所述不透明度顏色模型來確定所述光柵圖像中像素的不透明度值。
文檔編號G09G5/00GK101529495SQ200780040517
公開日2009年9月9日 申請日期2007年9月18日 優(yōu)先權(quán)日2006年9月19日
發(fā)明者G·D·威倫斯基 申請人:奧多比公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
定安县| 无棣县| 宜章县| 绿春县| 云龙县| 右玉县| 盐城市| 兴隆县| 木里| 铜山县| 栾川县| 滕州市| 包头市| 宝清县| 旬邑县| 怀化市| 乐山市| 连平县| 赤峰市| 霍山县| 定兴县| 江都市| 金乡县| 密云县| 高密市| 常宁市| 鹤壁市| 江津市| 莒南县| 五家渠市| 高邑县| 宣威市| 荣昌县| 开封市| 罗山县| 扬州市| 澎湖县| 台中县| 老河口市| 二连浩特市| 班玛县|