本發(fā)明涉及計算機程序和系統(tǒng)領域,并且更具體地涉及用于壓縮三維建模對象的方法、系統(tǒng)和程序。
背景技術:
網(wǎng)格簡化的領域旨在重新安排和修剪網(wǎng)格的頂點以便減少網(wǎng)格中弧線的數(shù)量并因此允許網(wǎng)格上更快的計算、更好的壓縮率以及整體更好的算法效率。可以在Alliez等,Recent Advances in remeshing of Surfaces,Shape Analysis and Structuring,2008中找到網(wǎng)格重構(gòu)算法的全面回顧。
Wang等,Content-Aware Geometry Image Resizing,Computer Graphics International 2010(CGI 2010)Short Papers,SIngapore,2010中公開了被應用于幾何圖像以便以一種使得將重點放在具有最多細節(jié)的網(wǎng)格部分上同時移除不太明顯的頂點的非統(tǒng)一的方式減小其尺寸和其內(nèi)容的內(nèi)容感知的圖像尺寸調(diào)整算法。幾何圖像的概念由Gu等在Gu等,Geometry Images,SIGGRAPH,2002中討論,其中針對被稱為幾何圖像的2D結(jié)構(gòu)的創(chuàng)建來進行網(wǎng)格參數(shù)化。在該Geometry Images中,模型中的每個頂點xyz與對該xyz值進行編碼的RGB值相關聯(lián)。這個非常高效的方案指引由該圖像的柵格結(jié)構(gòu)強加的正規(guī)化網(wǎng)格的創(chuàng)建。
然而,Wang等的方法遭受至少下述兩個缺點。第一,使用的內(nèi)容感知的圖像重新定位目標算法并不創(chuàng)建該圖像的平滑轉(zhuǎn)換因此造成當它的減小很大時該網(wǎng)格中的視覺假象,例如偽頂點。非平滑變形造成幾何圖像的導數(shù)中的局部最大,因此導致進一步的壓縮更加困難。舉例來說,隨著圖像的減小此圖像的壓縮率降低;這歸因于圖像及其導數(shù)的連續(xù)性中的偽像的產(chǎn)生。
第二,使用的算法專門為圖像創(chuàng)建,因此完全不考慮最終的制成品是簡化的網(wǎng)格這一事實。舉例來說,當執(zhí)行網(wǎng)格簡化時保護幾何圖像的邊界規(guī)則性可以是無關的。
在這一上下文中,仍存在對一種用于三維網(wǎng)格的簡化的改進的方法的需求。特別地,該方法應當以一種平滑和規(guī)則的方式選擇性地減小該幾何圖像。
技術實現(xiàn)要素:
因此提供了一種用于壓縮三維建模對象的計算機實現(xiàn)的方法。該方法包括提供三維建模對象的網(wǎng)格;在二維平面上對該網(wǎng)格進行參數(shù)化(u,v);將參數(shù)化的網(wǎng)格轉(zhuǎn)換成圖像I;定義來自圖像I的單元的柵格,每個單元由控制點的集合來進行定義;計算該柵格的每個單元的相關性;確定具有相關性低于預定閾值的至少一個單元;調(diào)整該至少一個確定的單元的大小并計算得到的柵格;根據(jù)該得到的網(wǎng)格來計算該圖像的每個像素的變換;以及將該計算的變換應用至圖像I。
該方法可以進一步包括:
-所述相關性低于預定閾值的至少一個單元的確定包括具有最低相關性的單元的集合的確定;
-通過計算圖像I中每個像素的顯著性來提供圖像顯著性;
-提取顯著性圖像的原始空間域Ω;
-提供變換Tθ,其由控制點的集合參數(shù)化為插值樣條,從原始空間域Ω至調(diào)整大小的空間域Ω′;
-定義來自圖像I的單元的柵格包括將原始空間域Ω細分為單元,每個單元由該集合的控制點的子集合定義;
-計算該柵格的每個單元的相關性包括針對每個單元計算該單元中像素的顯著性的加權(quán)平均,使用該插值樣條來計算該加權(quán)平均;并且其中根據(jù)得到的網(wǎng)格來計算圖像I的每個像素的變換包括根據(jù)得到的網(wǎng)格在通過參數(shù)化網(wǎng)格的轉(zhuǎn)換獲得的圖像I的空間域上計算變換Tθ;
-變換Tθ被參數(shù)化為自由變形插值樣條,并且其中位移函數(shù)uθ(x)由下述等式定義
其中B0,B1,B2,B3是三次B樣條函數(shù),θ是表示控制點的函數(shù),sw是在水平方向的兩個控制點之間的間隔,sh是在垂直方向的兩個控制點之間的間隔,xw是水平軸上在原始空間域Ω中的像素的位置,xh是垂直軸上在原始空間域Ω中的像素的位置;并且其中來自柵格的控制點集合和θ是表示控制點的柵格的函數(shù);
-使用下述函數(shù)來實施對每個像素的顯著性的計算:
SI=αEgeom+(1-α)Enorm
其中α∈[0;1];
其中并且geom(c)是圖像I的第c個顏色通道并且Gσ是高斯核;
其中并且norm(c)是法線圖像的第c個顏色通道并且Gσ是高斯核;
-每個像素的顯著性的計算進一步包括基于用戶動作,選擇網(wǎng)格的兩個或更多個頂點;將用戶選擇轉(zhuǎn)換為頂點的圖表;設置系數(shù)α=0以使鏈接至該圖表的頂點的該幾何圖像的像素的顯著性最小化;
-每個像素的顯著性的計算進一步包括基于用戶動作,選擇網(wǎng)格的兩個或更多個頂點;將用戶選擇轉(zhuǎn)換為頂點的圖表;設置系數(shù)α=1以使鏈接至該圖表的頂點的該幾何圖像的像素的顯著性最大化;
-定義來自圖像I的單元的柵格、計算該柵格的每個單元的相關性、確定具有相關性低于預定閾值的至少一個單元、確定具有相關性低于預定閾值的至少一個單元、調(diào)整至少一個確定的單元的大小并計算得到的柵格、根據(jù)得到的柵格來計算該圖像的每個像素的變換、以及將該計算的變換應用至圖像I的步驟迭代執(zhí)行直到對圖像I的計算的變換滿足壓縮標準;
-當下述壓縮標準的至少一個得到滿足時該迭代停止,該柵格中不再有單元的相關性低于預定閾值;通過將計算的變換應用至圖像I獲得的新圖像J的壓縮率達到指定閾值;通過將計算的變換應用至圖像I獲得的新圖像J的多個像素達到指定值閾值;
-對于每次迭代,該集合的控制點的數(shù)量遞增。
-調(diào)整該至少一個確定的單元的大小包括減小所述至少一個確定的單元,其中通過使得在該單元左方和右方的所有頂點更接近所述至少一個確定的單元的頂點;以及使得在該單元頂部和底部的所有頂點更接近所述至少一個確定的單元的頂點,來執(zhí)行所述至少一個確定的單元的減??;
-包括根據(jù)通過將計算的變換應用至圖像I獲得的新圖像J來建立三維建模的對象。
進一步提供了一種包括用于執(zhí)行上述方法的指令的計算機程序。
進一步提供了一種其上記錄了上述計算機程序的計算機可讀存儲介質(zhì)。
進一步提供了一種包括耦合至存儲器的處理電路的系統(tǒng),該存儲器其上記錄有上述計算機程序。
附圖說明
現(xiàn)將以非限制性示例的方式并參考各附圖來描述本發(fā)明的各實施例,在附圖中:
-圖1示出了該方法的示例的流程圖;
-圖2示出了3D建模對象的網(wǎng)格的示例;
-圖3示出了圖2的網(wǎng)格上的圖表的創(chuàng)建;
-圖4示出了在被參數(shù)化后的圖2的網(wǎng)格;
-圖5示出了從圖4的參數(shù)化網(wǎng)格獲得的幾何圖像;
-圖6和圖7示出了該系統(tǒng)的示例的圖像顯著性計算的示例;
-圖8和圖9示出了概要圖像計算的示例;
-圖10示出了根據(jù)本發(fā)明獲得的幾何圖像;
-圖11示出了正向映射變換的示例;
-圖12示出了反向映射變換的示例;
-圖13示出了B樣條插值柵格的示例;
-圖14示出了B樣條插值柵格的控制點的移位效果的示例;
-圖15示出了用于執(zhí)行本發(fā)明的計算機程序的計算模塊的示例;
-圖16示出了用于實現(xiàn)根據(jù)本發(fā)明的方法的計算機系統(tǒng)的示例。
具體實施方式
參考圖1的流程圖,提出了一種用于壓縮三維(3D)建模對象的計算機實現(xiàn)的方法。該方法包括提供3D建模對象的網(wǎng)格。然后,在二維(2D)平面上對該網(wǎng)格進行參數(shù)化(u,v)。該參數(shù)化的網(wǎng)格然后被轉(zhuǎn)換為圖像I,例如,該圖像I是幾何圖像。然后,定義來自圖像I的單元的柵格。該柵格的每個單元由控制點的集合來進行定義。因此根據(jù)該控制點的集合形成該柵格。然后計算該柵格的每個單元的相關性;所有單元一起形成概要圖像。然后,確定其相關性低于預定閾值的一個或多個單元,例如,選擇具有最低相關性的k個單元。然后,通過移動(或置換)控制點來調(diào)整所確定的單元的大小,并計算得到的柵格。該得到的柵格是在一個或多個控制點已被置換后獲得的新柵格。然后,根據(jù)該得到的柵格來計算該圖像的每個像素的變換,并且該計算的變換被應用至圖像I。這一方法改進了三維網(wǎng)格的簡化。
顯而易見地,本發(fā)明允許以平滑和規(guī)則的方式來減小該幾何圖像。確實,本發(fā)明移除了其中顏色并不改變或輕微改變的幾何圖像的各區(qū)域。因此通過移除包括關于該網(wǎng)格的冗余的(并因此無用的)信息的該幾何圖像的各區(qū)域來減小由幾何圖像表示的該模型。此外,本發(fā)明并不保存正方形的幾何圖像。這允許在不考慮圖像邊界的情況下執(zhí)行信息的最小化。
該方法是計算機實現(xiàn)的。這意味著該方法的各步驟(或者大體所有步驟)由至少一個計算機或任何類似的系統(tǒng)執(zhí)行。因此,該方法的各步驟由計算機可以完全自動地,或半自動地執(zhí)行。在各示例中,該方法的至少某些步驟的觸發(fā)可以通過用戶-計算機的交互執(zhí)行。所需的用戶-計算機交互的水平可以取決于預見的自動化的水平并與實現(xiàn)用戶愿望的需求達成平衡。在各示例中,此水平可以是用戶定義的和/或預定義的。
舉例來說,提供的步驟可以基于用戶動作而被觸發(fā),例如,用戶選擇要被壓縮的3D模型。
該方法的計算機實現(xiàn)的典型示例是使用適于此目的的系統(tǒng)來執(zhí)行該方法。該系統(tǒng)包括耦合至存儲器的處理器(還稱為處理電路)。該系統(tǒng)還可以包括圖形用戶界面(GUI)。該存儲器具有其上記錄的包括用于執(zhí)行該方法的指令的計算機程序。該存儲器還可以存儲數(shù)據(jù)庫。該存儲器是適于這種存儲的任意硬件,可以包括多個物理上不同的部件(例如,一個用于程序,并且可以一個用于數(shù)據(jù)庫)。
該方法一般操縱建模的對象。建模的對象是由例如存儲在該數(shù)據(jù)庫中的數(shù)據(jù)定義的任意對象。通過擴展,語句“建模的對象”指定數(shù)據(jù)本身。根據(jù)該系統(tǒng)的類型,該建模的對象可以由不同種類的數(shù)據(jù)定義。該系統(tǒng)實際上可以為CAD系統(tǒng)、CAE系統(tǒng)、CAM系統(tǒng)、PDM系統(tǒng)和/或PLM系統(tǒng)的任意組合。在那些不同的系統(tǒng)中,建模的對象由相應的數(shù)據(jù)定義。相應地可以談到CAD對象、PLM對象、PDM對象、CAE對象、CAM對象、CAD數(shù)據(jù)、PLM數(shù)據(jù)、PDM數(shù)據(jù)、CAM數(shù)據(jù)、CAE數(shù)據(jù)。然而,這些系統(tǒng)并不排除其他的一個,因為建模的對象可以由對應于這些系統(tǒng)的任意組合的數(shù)據(jù)來進行定義。一種系統(tǒng)因此很可以為CAD和PLM系統(tǒng)兩者。
通過CAD系統(tǒng),此外它還意味著至少適于基于該建模的對象的圖形化的表示來設計建模的對象的任意系統(tǒng),諸如CATIA。在這種情況下,定義建模的對象的數(shù)據(jù)包括允許表示該建模的對象的數(shù)據(jù)。CAD系統(tǒng)例如可以使用邊或線來提供CAD建模的對象的表示,在某些情況下使用面或表面。線、邊或者表面可以以多種方式表示,例如,非均勻有理B樣條(NURBS)。特別地,CAD文件包含規(guī)格,根據(jù)該規(guī)格可以生成幾何結(jié)構(gòu),它轉(zhuǎn)而允許要生成的表示。建模的對象的規(guī)格可以存儲在單個CAD文件或多個文件中。在CAD系統(tǒng)中表示建模的對象的文件的典型大小處于每部分1兆字節(jié)的范圍內(nèi)。并且建模的對象可以典型地為數(shù)千個部件的集合。
在CAD的上下文中,建模的對象可以典型地為3D建模的對象,例如,表示產(chǎn)品,諸如部件或部件的組件,或者可以為產(chǎn)品的組件。通過“3D建模的對象”,它是指由允許它的3D表示的數(shù)據(jù)建模的任意對象。3D表示允許從所有角度查看該部件。舉例來說,3D建模的對象,當進行3D表示時,可以被操作并繞著它的任意軸轉(zhuǎn)動,或者繞著在顯示該表示的屏幕中的任意軸轉(zhuǎn)動。這明顯排除2D圖標,它并不是3D建模的。3D表示的顯示方便了設計(即,提高了設計者在統(tǒng)計上完成他們的工作的速度)。這加速了工業(yè)中的制造過程,因為產(chǎn)品的設計是該制造過程的一部分。
該3D建模的對象可以表示在使用例如CAD軟件解決方案或CAD系統(tǒng)完成它的虛擬設計后要在真實世界中制造的產(chǎn)品的幾何結(jié)構(gòu),諸如(例如,機械)部件或部件的組件(或等價的部件的組件,因為部件的組合從本方法的觀點上可看作部件本身,或者可以對該組合的每個部件獨立地應用本方法),或者更一般地任何剛性體組件(例如,可移動機構(gòu))。CAD軟件解決方案允許多種和非限制的工業(yè)領域中的產(chǎn)品的設計,包括:航天、建筑、建設、消費品、高科技設備、工業(yè)裝備、運輸、航海、和/或海洋油/氣生產(chǎn)或運輸。由該方法設計的3D建模的對象因此可以表示一種可以為任意機械部件的工業(yè)產(chǎn)品,諸如陸地車輛的一部分(包括例如汽車和輕型貨車裝備、賽車、摩托車、貨車和電機裝備、貨車和公交車、火車),飛行器的一部分(包括例如機身裝備、航空裝備、推進裝備、防御產(chǎn)品、航線裝備、空間裝備),海軍載具的一部分(包括例如海軍裝備、商船、海洋裝備、游艇和作業(yè)船、航海設備),一般的機械部件(包括例如工業(yè)制造機械、重型可移動機械或裝備、安裝的裝備、工業(yè)裝備產(chǎn)品、制造的金屬產(chǎn)品、輪胎制造產(chǎn)品),機電或電子部件(包括例如消費類電子產(chǎn)品、安全和/或控制和/或儀器產(chǎn)品、計算和通信裝備、半導體、醫(yī)療設備和裝備),消費產(chǎn)品(包括例如家具、家庭和園藝產(chǎn)品、休閑產(chǎn)品、時尚產(chǎn)品、耐用品零售商的產(chǎn)品、消耗品零售商的產(chǎn)品),包裝(包括例如食物和飲料以及煙草、美容和個人護理、日常產(chǎn)品包裝)。
圖16示出了該系統(tǒng)的示例,其中該系統(tǒng)是客戶端計算機系統(tǒng),例如用戶的工作站。
該示例的客戶端計算機包括連接至內(nèi)部通信總線1000的中央處理單元(CPU)1010,同樣連接至該總線的隨機存取存儲器(RAM)1070。該客戶端計算機進一步被提供有與連接至該總線的視頻隨機存取存儲器1100關聯(lián)的圖形處理單元(GPU)1110。視頻RAM 1100在本領域中還稱為幀緩沖器。大容量存儲設備控制器1020管理對大容量存儲器設備(諸如,硬盤驅(qū)動器1030)的訪問。適于有形地實現(xiàn)計算機程序指令和數(shù)據(jù)的大容量存儲器設備包括所有形式的非易失性存儲器,以示例的方式包括半導體存儲設備,諸如EPROM、EEPROM以及閃存設備;磁盤諸如內(nèi)部硬盤和可移除磁盤;磁-光盤;以及CD-ROM盤1040。任意前述設備可以由特別設計的ASIC(專用集成電路)來補充或并入該ASIC。網(wǎng)絡適配器1050管理對網(wǎng)絡1060的訪問。該客戶端計算機還可以包括觸覺設備1090諸如光標控制設備、鍵盤等。該光標控制設備在客戶端計算機中使用以允許該用戶選擇性地將光標放置在顯示器1080上的任何期望的位置。此外,該光標控制設備允許用戶選擇多種命令,以及輸入控制信號。該光標控制設備包括多個信號生成設備以將控制信號輸入至系統(tǒng)。典型地,光標控制設備可以為鼠標,該鼠標的按鈕用于生成該信號。作為選擇地或此外,該客戶端計算機系統(tǒng)可以包括感應板,和/或感應屏。
該計算機程序可以包括可由計算機執(zhí)行的指令,該指令包括使得上述系統(tǒng)執(zhí)行該方法的單元。該程序可記錄在任意數(shù)據(jù)存儲介質(zhì)上,包括該系統(tǒng)的存儲器。該程序可以實現(xiàn)在例如數(shù)字電子電路中,或者計算機硬件、固件、軟件或它們的組合中。該程序可以實現(xiàn)為裝置,例如有形地體現(xiàn)在機器可讀存儲設備上的產(chǎn)品以由可編程處理器執(zhí)行。方法步驟可以由執(zhí)行各指令的程序的可編程處理器執(zhí)行以通過對輸入數(shù)據(jù)操作并生成輸出來執(zhí)行該方法的功能。該處理器因此可以為可編程的并且耦合至至少一個輸入設備以及至少一個輸出設備,以從數(shù)據(jù)存儲系統(tǒng)接收數(shù)據(jù)和指令,并發(fā)送數(shù)據(jù)和指令至該數(shù)據(jù)存儲系統(tǒng)。該應用程序可以以高級程序或面向?qū)ο蟮木幊陶Z言實現(xiàn),或者如果需要以匯編或機器語言實現(xiàn)。在任意情況下,該語言可為編譯型或解釋型語言。該程序可以為完全安裝的程序或更新程序。在該系統(tǒng)上該程序的應用在任意情況下均導致用于執(zhí)行該方法的指令。
重新參考圖1,在步驟S10,提供3D對象的網(wǎng)格。該3D對象可以為3D建模的對象。此步驟可以基于用戶動作執(zhí)行,例如,用戶選擇可以存儲在存儲器上的3D建模的對象。這也可以通過執(zhí)行該方法的計算機系統(tǒng)自動達成。提供意味著該3D建模的對象的網(wǎng)格可用于該計算機系統(tǒng),也就是說,該系統(tǒng)可訪問涉及該網(wǎng)格的數(shù)據(jù)。典型地,一旦3D建模的對象的網(wǎng)格對于該系統(tǒng)可用,則該計算機系統(tǒng)可以顯示該3D建模的對象的網(wǎng)格,如例如示出了對頭部進行建模的3D建模的對象的網(wǎng)格的圖2所呈現(xiàn)的。
然后,在步驟S20,在2D平面中對在步驟S10提供的網(wǎng)格進行參數(shù)化(u,v)。在2D平面中對該網(wǎng)格進行參數(shù)化意味著確定在2D空間中具有3D建模的對象的規(guī)格所必需的參數(shù)。實際上,該參數(shù)化包括在2D平面中對該網(wǎng)格的每個頂點的有效坐標(u,v)的完整集合的識別。參數(shù)化以本領域公知的方式執(zhí)行,例如可以使用ABF++參數(shù)化算法。舉例來說可這樣做從而該整個網(wǎng)格可以在較少失真的情況下在二維平面中展開或者從而分割成少量圖表的該網(wǎng)格可以在較少失真的情況下在二維平面中展開。
圖4示出了已經(jīng)在2D平面中被參數(shù)化的圖2的網(wǎng)格。該網(wǎng)格的參數(shù)化產(chǎn)生具有2D平面中的二維坐標(u,v)的頂點的集合。有趣的是,該3D建模的對象的原始網(wǎng)格的每個頂點由2D平面中的一個頂點表示。
該參數(shù)化之前可以為將該網(wǎng)格分割成圖表的步驟。這在圖3中闡明,它示出了被提供作為步驟S10處輸入的圖2的網(wǎng)格上的圖表創(chuàng)建。這允許處理任意種類的網(wǎng)格(該形狀中的拓撲“孔洞”的數(shù)量)并將它減小至單個拓撲盤(topological disc),如本領域所公知的。
然后,在步驟S30,在步驟S20參數(shù)化的網(wǎng)格被轉(zhuǎn)換為圖像;也就是圖像I。這意味著該網(wǎng)格的參數(shù)化產(chǎn)生具有形成光柵圖像的2D坐標的頂點的集合,其中該集合的每一個頂點是該光柵圖像的像素,并且該集合的每個頂點的坐標(x,y,z)存儲在該光柵圖像的顏色通道紅色/藍色/綠色中。
因此,步驟S30的輸出是幾何圖像。幾何圖像已經(jīng)在Xianfeng Gu,Steven J.Gortler以及Hugues Hoppe,幾何圖像(Geometry images),計算機圖形和交互技術第29屆年度會議的論文集(Proceedings of the 29th annual conference on Computer graphics and interactive techniques),第355-361頁,ACM Press,2002中公開。幾何圖像提供從多邊形網(wǎng)格至2D圖像表示的改進的轉(zhuǎn)換。幾何圖像,如本領域中所公知的,是從3D建模的對象的任意表面變換為作為2D圖像的靜態(tài)網(wǎng)格獲得的,它是3D建模的對象的原始幾何結(jié)構(gòu)的完全規(guī)則的網(wǎng)格重劃,并且它支持逆變換。該幾何圖像提供了完全規(guī)則的結(jié)構(gòu),它將幾何結(jié)構(gòu)捕獲為量化的點的簡單2D陣列。表面信號諸如法線和顏色使用相同隱含表面參數(shù)化(缺失紋理坐標)而被存儲在相似的2D陣列中。
圖5闡明了從圖2的網(wǎng)格獲得的幾何圖像。形成這一圖像的每個像素是一個頂點,并且該像素的顏色該頂點的坐標(x,y,z)進行編碼。
僅為了解釋,現(xiàn)在討論圖像的數(shù)學定義。圖像是從空間域Ω(該空間域Ω的維度為d)至為圖像值的空間的V(V的維度為c)的映射。不對Ω或V的性質(zhì)作出假定以便以它最一般的含義來定義圖像。
舉例來說,大小為m乘n的2D圖像I,它在計算機存儲器中跨越256個灰度,可被定義為映射(等式1):
在此示例中,該空間域Ω的維度d=2,并且該圖像值的空間V的維度c=1。該2D圖像可被認為是離散圖像,因為它被定義在離散的空間域Ω上。這與定義在形式為的空間域Ω上的連續(xù)圖像相反。
離散變換通常是指在離散圖像上進行的變換,而連續(xù)變換在連續(xù)圖像上進行。因為在計算機存儲器中僅可表示一個離散的圖像空間,所以多種方法諸如插值被用于計算在整數(shù)位置的該圖像的值,如本領域所公知的。
接下來的步驟S40至S80旨在根據(jù)幾何圖像(例如,在步驟S30輸出的幾何圖像)輸出所謂的概要圖像。概要圖像是將顯著性圖像鏈接至基于樣條的圖像插值的計算方法。舉例來說,樣條可以是基于B樣條的自由變形。然而,步驟S40至S80可以使用基于其他樣條的插值執(zhí)行,例如,NURBS。該顯著性圖像允許識別圖像中的相關部分。該顯著性圖像與原始圖像(例如,該幾何圖像)的大小相同,對于原始圖像中的每個像素,該顯著性圖像中的像素定義改變原始圖像中的相應像素的開銷。用于幾何圖像的該顯著性圖像的計算將參考步驟40進行討論。
在原始圖像域上,定義了自由變形網(wǎng)格(或基于任意其他樣條的插值圖)。或者反過來說,定義來自圖像I的單元的柵格,每個單元由控制點的集合進行定義。移動該圖的控制點改變了應用至該圖像的變換,并繼而變換該圖像。舉例來說,該變換可以為微分同胚變換,它使用平滑導數(shù)來平滑地渲染獲得的圖像。
單元的變形明顯關聯(lián)于頂點的移位,并繼而影響該圖像的變形。作為由至少3個頂點定界的圖的閉合環(huán)路的單元,實際上是在自由變形的柵格的情況下的柵格的單元。并且然后引出定義在變形柵格中的哪些頂點應當被移動以及移動多少的問題,示出了在某些假定下頂點的移動總是引起微分同胚的變換。為了解答這一問題,定義了概要圖像。該概要圖像示出了針對該柵格的每個單元計算的相關性的結(jié)果。因此,該概要圖像用作該顯著性圖像的代理并且量化了由顯著性圖像定義的圖中對單元進行變形的開銷。該概要圖像計算和該變形圖中的單元數(shù)量一樣多的像素,并且該概要圖像中的每個像素量化了對該圖中的相應單元進行變形的開銷。該概要圖像的計算將參考步驟50至80進行討論。
再次參考圖1的流程圖,在步驟S40,通過計算圖像I(例如,該幾何圖像)中每個像素的顯著性來提供顯著性圖像S。該圖像顯著性被定義為與該圖像的每個像素相關的開銷。此開銷直接關聯(lián)于該像素傳達的信息量。由像素傳達的信息量可以為,但不限于,該圖像中的像素的相關性,例如,該相關性可以由用戶確定。該圖像I的像素的顯著性針對該圖像的完整性量化該像素的顯著性。因此,圖像I的圖像顯著性示出了圖像I中的比其他像素傳達更多信息的各像素。
舉例來說在圖6中,減小字符的左側(cè)和右側(cè)的白色區(qū)域?qū)⒉桓淖冊搱鼍暗囊曈X理解:實際上,旁觀者將從圖6的任一圖像中以及其中白色區(qū)域被減小的那個收集相同的信息。理想的說,在沒有對視覺外觀進行重大改變的情況下,圖像顯著性將在內(nèi)容不能被篡改的區(qū)域中具有更高值。
實際上,該圖像顯著性本身被表示為圖像。此外,該圖像和該顯著性圖像兩者的空間域是相同的;換句話說,兩幅圖像中的像素位置都表示相同的空間位置。
為顯著性圖像的每個像素分配的值表示由像素傳達的信息量。這在圖7中闡明,它示出了根據(jù)圖6的圖像獲取的顯著性圖像:在圖7中,更暗的區(qū)域表示高信息量內(nèi)容區(qū)。該顯著性圖像的表示允許簡單地理解在不嚴重影響圖像全局信息量的情況下所有白色區(qū)域都可被減小。
可使用本領域中已知的任意圖像顯著性計算方法。舉例來說,可以使用用于計算圖像顯著性的最基本的方式的其中一種:圖像梯度范數(shù)的平滑化版本,其中使用2D高斯濾波器實現(xiàn)該平滑。圖7顯示了圖6的圖像,其中圖像的梯度范數(shù)已經(jīng)被平滑。作為圖像顯著性計算的另一示例,可以使用圖像顯著性計算。圖像顯著性旨在找出用于圖像分割的圖像的相關部分。有趣的是,圖像顯著性還可以通過使用當圖像不是靜態(tài)而是動態(tài)時的運動信息來進行計算,例如,在視頻的情況下。這在當重定向視頻時是特別有用的,以保持視頻的各重定向幀之間的時間相干性。該運動信息通常編碼為該圖像的光流并可使用本領域已知的任意方法計算。
優(yōu)選地,該顯著性圖像SigI使用等式7的函數(shù)計算:
Sig I=αEgeom+(1-α)Enorm其中α∈[0;1]
該術語Egeom是圖像I的第c個顏色通道并且術語Enorm是法線圖像的第c個顏色通道。
Egeom被定義如下(等式7a):
并且Enorm由等式7b定義:
在等式7a和7b兩者中,使用對于多尺度計算來說允許在尺度σ定義顯著性的高斯核Gσ。特別是,在幾何圖像中,減少具有冗余頂點的更高優(yōu)先級的區(qū)域是關鍵的,它轉(zhuǎn)換為具有低梯度的平滑區(qū)域。這是幾何圖像顯著性SigI的定義的關鍵。當可用時該參數(shù)化的網(wǎng)格法線的使用允許進一步保護具有顯著脊的網(wǎng)格中的區(qū)域。
有趣的是,每個像素的顯著性的計算(也就是,顯著性圖像的計算)還可以包括用于保護要壓縮的網(wǎng)格中的區(qū)域的用戶交互。用戶選擇要保護的網(wǎng)格的頂點(例如,他選擇該網(wǎng)格的區(qū)域)。這被轉(zhuǎn)換為要被保護的頂點的圖表。整個圖表的開銷在該圖像顯著性中被設置為非常高:對于關聯(lián)至該圖表的頂點的幾何圖像的各像素來說系數(shù)α被設置為α=0。α的值可以被設置為接近于0;舉例來說,α的值可以包含在取值范圍[0;0,2]中。
相反地,該網(wǎng)格的一個區(qū)域可以需要強烈的簡化。用戶選擇要保護的網(wǎng)格的頂點(例如,他選擇該網(wǎng)格的區(qū)域)。此用戶選擇被轉(zhuǎn)換為要保護的頂點的圖表。整個圖表開銷在圖像顯著性中被設置為非常低:對于關聯(lián)至該圖表的頂點的幾何圖像的各像素來說系數(shù)α被設置為α=1。α的值可以被設置為接近于1;舉例來說,α的值可以包含在取值范圍[0,8;1]中。
接下來,在步驟S50,提取該顯著性圖像的原始空間域。該原始空間域記為Ω。該空間域是其中數(shù)字圖像由其像素的空間坐標(在2D圖像的情況下為x,y,在一般情況下)定義的域(例如,平面)。如所討論的,該顯著性圖像的空間域可以與要壓縮的圖像I的空間域相同。在其中顯著性圖像和圖像I兩者的空間域相同的情況下,兩幅圖像中的像素位置表示相同的空間位置。
然后,在步驟S40,提供了一種變換,記為Tθ。Tθ從原始空間域(Ω)至調(diào)整大小的空間域(Ω′)借由控制點的集合被參數(shù)化為插值樣條。術語變換是指應用至圖像I像素位置并簡單移位I的現(xiàn)有像素的位置產(chǎn)生調(diào)整大小的圖像J的操作。因此,該變換作用于該像素坐標,并非他們的值。任意種類的變換都是可能的,從其中涉及要調(diào)整圖像I的像素坐標的僅子集的大小的離散變換,到其中涉及圖像I的所有像素的連續(xù)變換。該變換記為Tθ,其中T用于指定變換并且θ用于指定該變換的參數(shù),正如稍后它將被解釋的那樣。
為了解釋,現(xiàn)在討論該變換Tθ的數(shù)學定義。諸如變換Tθ的圖像變換是從輸入空間域Ω至輸出空間域Ω′的映射。該輸入空間域Ω可以是在步驟S40提取的顯著性圖像的原始空間域。該輸出空間域Ω′可為調(diào)整大小的圖像J的空間域。Ω′是Ω的調(diào)整大小的版本。Ω和Ω′具有相同的密度。術語密度對該空間內(nèi)部的值的類型(實數(shù)的、量化的、整數(shù)的...)進行特征化,但可能具有不同的邊界。該變換已經(jīng)得到從Ω到Ω′的映射的所有屬性,即如果該映射是線性的那么該變換被認為是線性的,如果該映射是連續(xù)的那么該變換是連續(xù)的。
該調(diào)整大小的圖像J被定義為應用該變換Tθ的要調(diào)整大小的圖像I。因此,對于Ω中各像素的所有位置x,應用下述等式(等式2):
J(Tθ(x))=I(x)
換句話說,在像素的每個新位置y=Tθ(x),I(x)的值被拷貝至J(y)。各像素的值不被修改,僅僅它們的位置可被修改。各像素從要調(diào)整大小的圖像的坐標系“向前”移動至調(diào)整大小的圖像;在這種情況下,執(zhí)行向前映射,如圖11所闡明的,其中陰影的方形圖示了空像素,因為該變換映射至新圖像中的非整數(shù)位置。
有趣的是,變換Tθ是可逆的。也就是說,該變換可逆。在這種情況下,對于要調(diào)整大小的圖像I的空間域Ω中的所有位置x,應用下述等式(等式3):
J(x)=I(Tθ-1(X))
作為等式3的結(jié)果,調(diào)整大小的圖像J中的每個像素在圖像I中將被分配一個位置。像素從調(diào)整大小的圖像J的坐標系“向后”移動至要調(diào)整大小的圖像J;在這種情況下,執(zhí)行向后映射,如圖12所闡明的。此向后映射可被執(zhí)行,因為當處理原始位置空間中的非整數(shù)位置時,插值方案是可能的。實際上,可以使用任意變換逆方案。舉例來說,可以使用在Gary E.Christensen,Hans J.Johnson:一致的圖像配準(Consistent Image Registration),IEEE會刊.醫(yī)學成像(IEEE Trans.Med.Imaging)20(7):568-582(2001)中討論的逆方案。
在步驟S60提供的變換Tθ可以是微分同胚變換Tθ。微分同胚變換是一種連續(xù)的、雙射的、可微的、雙射可導的變換,它的逆同樣是連續(xù)和可微的。有利地,微分同胚的變換在即使在要調(diào)整大小的圖像的導數(shù)中不產(chǎn)生任何人工效果的情況下將要調(diào)整大小的圖像以平滑的方式進行變換。這與分段平滑變換相反,在分段平滑變換中輸入空間域Ω被劃分,它在分區(qū)的邊緣產(chǎn)生人工效果。這些人工效果的每一個都產(chǎn)生渲染沒有壓縮傾向的圖像的高頻。微分同胚變換的另一優(yōu)點在于該變換是可逆的:看起來不自然的所有變換都被丟棄,因此避免了公知的重影問題。確實,當該變換在一個地方不可逆時,可以獲得在空間域Ω中的兩個不同的像素位置映射至調(diào)整大小的空間域Ω′中的相同像素位置。它產(chǎn)生與自己重影的圖像的視覺效果。
變換Tθ被參數(shù)化。這意味著該變換并不明確地在整個空間域Ω上執(zhí)行因為它在計算上是不切實際的,因為空間域Ω可以非常大(可以是無窮的)??稍讦钢械拿總€和所有的位置中評價該參數(shù)化的變換,但是針對小于Ω的基數(shù)的限量的參數(shù)。
變換Tθ被參數(shù)化為插值的樣條。樣條,如本領域中公知的,是分段定義的多項式函數(shù),取決于樣條的階,可設置分段間的連接處的平滑度。在分段連接中的樣條的平滑度也是樣條的總的平滑度。樣條具有控制點,還稱為插值節(jié)點。該控制點的移位修改了樣條的形狀。因此,變換Tθ由對Tθ進行參數(shù)化的插值樣條的控制點的集合來進行參數(shù)化。
可考慮任意類型的樣條用于對變換函數(shù)Tθ進行參數(shù)化。實際上,存在用于圖像處理的特別感興趣的樣條例如,但不限于:
在Bookstein,F(xiàn)red L.“主要的彎曲:薄板樣條和變形的分解(Principal warp:Thin-plate splines and the decomposition of deformations)”,模式分析和機器智能存檔的IEEE會刊(IEEE Transactions on Pattern Analysis and Machine Intelligence archive),第11卷第6期,1989年6月,第567-585頁中討論的薄板樣條;
在Sederberg,Thomas W.以及Scott R.Parry,“固體幾何模型的自由形式變形(Free-form deformation of solid geometric models)”,計算機圖形和交互技術的第13屆會議的計算機圖形圖像專業(yè)組織的’86論文集的論文集(Proceeding of SIGGRAPH′86 Proceedings of the 13th annual conference on Computer graphics and interactive techniques),第151-160頁中討論的自由形式的變形;
在Piegl,Les A.和Wayne Tiller,“NURBS書(The NURBS book)”中討論的非均勻有理B樣條或NURBS。
該變換是從輸入空間域Ω到輸出空間域Ω′的映射。該變換Tθ可以是,對于每個像素,像素位置x及其移位uθ(x)的和,其中uθ是從Ω到Ω′的映射。對于Ω中的所有位置x,該變換Tθ可由下述等式(等式4)表示:
Tθ=x+uθ(x)
使用變換Tθ的這一表示有利地允許在像素的移位方面表示Tθ,同時不喪失普遍性。該變換被分解為與其位置和該像素位置的真正移位相關的組分,即使當該移位小時(在大的域上)變換可相當大。
現(xiàn)在參考圖13,其中闡明了在從顯著性圖像提取的原始空間域Ω上定義的控制點的集合的示例。順便地,可注意到多個控制點位于原始空間域Ω之外。在這一示例中,該原始空間域Ω的維度為d=2并由有陰影的矩形表示。該控制點的集合控制對變換Tθ進行參數(shù)化的插值樣條的參數(shù),并且它們由黑色圓點表示。僅為了解釋,該討論集中于自由變形(FFD)插值樣條。
每個控制點位置的位置可表示為θ(i,j),其中θ(i,j)是表示(i,j)控制點的位置的2D向量。該控制點分別使用索引i和j從左至右以及從上到下被任意索引。兩個控制點在水平方向上的間隔可表示為sw,并且在垂直方向上為sh,以相同的方式在原始空間域Ω中位置x在水平軸上的投影為xw并且在原始空間域Ω中位置x在垂直軸上的投影為xh。要調(diào)整大小的圖像I的空間域同樣被認為是從左至右和從上至下被定向。
該水平和垂直方向是任意選擇的并可以使用參考系(x,y)定義。舉例來說,在圖13中,參考系由具有共同起源的兩個箭頭表示,它位于Ω的左上角。因此,在圖13中,x軸表示水平方向,并且y軸表示垂直方向。
仍參考圖13,該控制點的集合形成規(guī)則的柵格,其中控制點平均散布在原始空間域Ω上。已經(jīng)從FFD獲得了控制點的柵格;已經(jīng)計算了2D貝塞爾插值樣條,其取決于該樣條的階,在此示例中由四個控制點支持。術語規(guī)則柵格涉及兩個控制點間的原始水平間隔sw的值總是相同。相似地,兩個控制點之間的原始垂直間隔sh的值總是相同的。該水平間隔sw可以與垂直間隔sh具有相同的值,如圖13所示。要理解,圖13的控制點的集合中的控制點可以在本發(fā)明的處理期間被移動,如下文將要解釋的那樣。
有趣的是,控制點的集合創(chuàng)建在原始空間域Ω上定義的新的域。此新的域命名為Λ并稍后討論。Λ作用于Ω上,這意味著控制點的移位(諸如圖14中的控制點140)將影響該樣條,繼而,將局部影響Ω。
如上面所討論的,該變換Tθ是從輸入空間域Ω至輸出空間域Ω′的映射,從Ω至Ω′的變換為像素位置x及其移位uθ(x)的和。根據(jù)任意像素位置,該移位函數(shù)uθ(x)可以從該控制點位置獲得。因此,等式4的移位函數(shù)uθ可以定義為控制點的位置的加權(quán)線性合并,如下面的等式5所示:
在等式5中,F(xiàn)FD的表示使用三次B樣條:函數(shù)Bk和B1是三次B樣條,它們還符合相同階數(shù)的伯恩斯坦多項式,如本領域所公知的。應理解,可使用不同階的任意B樣條并且本發(fā)明不限于三階B樣條。本發(fā)明并不限于與FFD關聯(lián)的B樣條,而是如前面所討論的任意類型的樣條。
如前面所討論的,每個控制點的位置可記為θ(i,j)。在等式5中,θ是表示參數(shù)化變換的控制點集合的函數(shù)。特別地,該函數(shù)θ是變換Tθ的唯一參數(shù):確實,θ的知識允許完整描述移位uθ以及因此變換Tθ。結(jié)果,柵格中的控制點的移位將相應地改變該變換Tθ??刂泣c的移位僅影響空間域Ω的局部:確實,如等式5所描述的,僅控制點位置周圍的大小4sh×4sw的鄰近區(qū)域中的Ω中的像素位置x被它的移動所影響。應理解,該鄰近區(qū)域大小可以與低階B樣條不同。
基于等式5的三次B樣條的FFD是有意平滑至第三階的;當伯恩斯坦多項式的次數(shù)較低時該階較小。通過關于控制點移位的約束達成該移位以及它的第一導數(shù)的可逆性和雙射性:如果該控制點的移位小于0.48乘以控制點的間隔sh和sw,則來源于FFD移位的變換是微分同胚的;此結(jié)果是本領域公知的,例如,在Lee,Seungyong等,“具有分散特征約束的圖像變形(Image metamorphosis with scattered feature constrains)”,視覺和計算機圖形存檔的IEEE會刊(IEEE Transactions on Visualization and Computer Graphics archive),第2卷第4期,1996年12月,第337-354頁中。因此,來源于控制點的移動的Ω中位置x的移位將在控制點的移位之后。結(jié)果,將兩個控制點彼此靠近將減小在控制點的位置之間的該圖像,而擴大控制點之間的空間將放大控制點的位置之間的圖像。要理解,在Ω中移位的位置x的周圍區(qū)域(4sh×4sw)也被影響以便保持該變換中的連續(xù)性。
再次參考圖1,在步驟S70,原始空間域Ω被劃分為單元。每個單元由該集合的控制點的子集定義。因此,術語單元定義了調(diào)整大小的空間域Ω′的子部分,并且此子部分由控制點的子集限定。單元是由連接該集合的控制點的邊限定的封閉的表面。單元的集合形成了空間域Ω上的空間域。一個單元是封閉的表面,這包括單元由至少三個控制點形成。
在圖13中,單元130由連接四個控制點的四條邊定義。兩條斜邊,它們在單元130的封閉表面內(nèi),未被表示;這兩條邊并不用于限定該單元的封閉表面。仍參考圖13,該控制點形成單元的規(guī)則柵格;舉例來說,單元130,它由四個控制點定義,是由四個控制點限定的多邊形。要理解,控制點的集合并不必需形成規(guī)則柵格;舉例來說,可以使用多于或少于四個控制點的單元。
從控制點的集合獲得的柵格可以被認為是在空間域Ω中控制點的坐標的表示。
控制點在空間域Ω中未被定義,但是某些控制點的位置與空間域Ω重疊,該單元在空間域Ω中使用與Ω重疊的控制點進行定義。
該單元的集合可以看作在原始空間域Ω之上的層。每個單元與原始空間域Ω的一個或多個像素相關:由每個單元形成的區(qū)域覆蓋一個或多個像素。Ω與Λ是未分離的,Λ是Ω的細分。在其中Λ是Ω之上的4個單元的規(guī)則柵格的情況下,我們得到單元索引(0,0),(0,1),(1,0)和(1,1),并且每個單元是Ω的子域,例如單元(0,0)包含來自Ω的這相當于指明多邊形被畫在該圖像上,該多邊形中的每個和所有像素都屬于該單元。
減小單元的尺寸,即減小它的表面積與促使圍繞該單元的控制點靠近在一起相同,并因此與減小該單元的位置處的圖像域相同。這在增大該單元的大小的情況下也是真實的。該圖像域?qū)嶋H上與該單元被變形的表現(xiàn)方式相同。并且如果在空間域Ω外部定義的控制點被固定為保持在位于空間域Ω內(nèi)的控制點的距離sw和sh,那么輸出圖像域的空間域Ω′將具有與內(nèi)部單元的聚集的區(qū)域相同的區(qū)域。應理解,需要被固定的控制點的數(shù)量將取決于該樣條的階。這來源于在等式4中定義的變換Tθ。
在步驟S70,已經(jīng)確定了劃分原始空間域Ω的單元的集合。此單元的集合定義了原始空間域Ω的離散域,記為Λ。每個單元可以以與圖像的像素位置相同的方式考慮并可以相同的方式進行索引。舉例來說,如果已經(jīng)在等式1的空間域Ω上定義了四個單元,那么該四個單元分別索引(0,0),(0,1),(1,0)和(1,1),并且每個單元是Ω的子域,例如單元(0,0)包含來自Ω的[0,1,...,(m/2)-1]×[0,1,...,(n/2)-1]。
然后,在步驟S80,針對Λ的每個單元計算在單元中的像素的顯著性的加權(quán)平均。因此,定義Λ上的顯著性。根據(jù)形成Λ的單元集合形成概要圖像S:該概要圖像的每個單元可被認為是該概要圖像的像素。
因為Λ由Ω的分區(qū)組成,所以域Λ可被寫作Λ={Ω(0,0),Ω(0,1),...,Ω(K,L)},其中K和L是Ω的每個方向上的分區(qū)數(shù)量,并且Ω(i,j)是Ω的分區(qū),該域由單元(i,j)覆蓋。Ω的水平和垂直方向可以隨意選擇,并可以使用參考系(x,y)來進行定義,如已經(jīng)討論的那樣。
使用插值樣條來計算該加權(quán)平均。確實,對于Λ中的每個y=(i,j)位置,可以定義用于三次B樣條FFD的概要圖像。該概要圖像SI可由等式6定義:
其中,S(x)是表示提供的顯著性圖像的函數(shù)。
現(xiàn)在參考圖8,它示出了圖7的圖像的顯著性圖像,在其上單元的集合定義原始空間域Ω的離散域Λ。該域Λ覆蓋顯著性圖像的原始空間域Ω。在圖8中,域Λ完全覆蓋了圖7的原始空間域Ω。進一步的,從形成均勻散布在原始空間域Ω的控制點的柵格的控制點的集合獲得該單元的集合,如參考圖13所討論的。
現(xiàn)在參考圖9,示出了從形成Λ的單元的集合計算的概要圖像,針對每個單元計算單元中的像素的顯著性的加權(quán)平均。使用用于表示單元的顯著性的灰度來對該概要圖像的每個單元進行著色,以及因此像素的集合的顯著性包含在該單元中。舉例來說,該字符的左側(cè)和右側(cè)的區(qū)域被表示為白色,因此意味著這些區(qū)域?qū)τ谠搱鼍暗囊曈X理解來說并不重要。
回到圖1的流程圖,在步驟S90,選擇該概要圖像的一個或多個單元,因此形成單元的集合。根據(jù)該概要圖像中每個單元的相關性來執(zhí)行該選擇。選擇具有的相關性低于預定閾值的單元。在此示例中該相關性是顯著性,也就是,選擇具有低于預定閾值的顯著性的單元。
典型地,對該概要圖像的一個或多個單元的選擇可以包括確定具有最低相關性,或者最低多個最低相關性的一個或多個單元-在此后者的情況下。舉例來說,為了同時減少單元的有限數(shù)量k,該k個單元具有最低概要圖像相關性。k是正自然數(shù)。作為另一示例,可使用具有最低相關性的百分比p個單元。要理解單元的選擇并不限于上面提到的選擇策略。有趣的是,在本發(fā)明中當減少單元時的最佳策略受益于較寬的搜索空間,因為無需考慮對矩形圖像邊界方面的任何約束。因此,可以每次減少單元,無需試圖在該圖像的單元的路徑中強加規(guī)則性。
現(xiàn)在,已經(jīng)根據(jù)它們的相關性選擇了概要圖像的單元。在步驟S100至S120減少該概要圖像,也就是說,簡化包括關于圖像I的網(wǎng)格的無用信息在內(nèi)的該幾何圖像的有色區(qū)域。通過概要圖像中的不同單元以迭代的方式實現(xiàn)該減少,并同樣以多尺度的方式來避免顯著性圖像中的局部最小以及能夠減少最終網(wǎng)格中的大區(qū)域和小區(qū)域。
回到圖1的流程圖,在步驟S100,修改在步驟S90預先確定的一個或多個單元。這相當于指明了對樣條的控制點進行移位。通過移位具有更小加權(quán)平均的單元的一個或多個控制點來對原始空間域Ω的單元進行變形,因為該單元的相關性已經(jīng)根據(jù)每個單元的像素的顯著性的加權(quán)平均進行了計算。
在用于移除或添加像素以調(diào)整圖像大小的內(nèi)容感知算法的領域中使用的已知算法中的一種算法可以直接應用至該概要圖像,除非這些算法將在單元(也就是,控制點的組)而不是像素上操作。這些算法由圖像顯著性引導并將根據(jù)某些最佳約束來調(diào)整變換參數(shù)以改變圖像同時最少地改變該圖像概要。正如已經(jīng)解釋的,該圖像并不需要保持直邊并且不需要扭曲至少該圖像。
在單元上操作因此涉及該算法(i)識別具有較小加權(quán)平均的一個或多個單元(步驟S90),以及(ii)修改識別的單元的大小(步驟S100)而不是像這些算法那樣移除或添加像素)。相應單元的大小將被修改,如前面所討論的:
-當所述單元已經(jīng)被該算法識別時減小單元的大小因為需要被移除;
-當所述單元已經(jīng)由該算法識別時增加單元的大小因為需要添加像素。實際上,單元的調(diào)整大小可以實現(xiàn)為0.48乘以控制點的間隔以便保持該變換的微分同胚。
當減少某單元的大小時,這是在減小幾何圖像期間的最典型的情況,這可以通過促使該單元左方和右方的所有頂點接近該單元的各頂點以減少,以及通過促使該單元的頂部和底部的所有頂點接近所述單元的各頂點執(zhí)行以減少來執(zhí)行。這是減小規(guī)則柵格的單元的最有效的方式——規(guī)則柵格僅包括矩形或方形單元。單元的減小優(yōu)選地通過移位該柵格的其他單元來完成,例如,移動圍繞該減小的單元的柵格的各單元從而一個單元的減小導致該圖像的減小。換句話說,當單元正被減小時未減小的各單元被強制移動:向已經(jīng)被移位的周圍單元提交在減小該單元后獲得的空白領域(還稱為空白區(qū)域)。這里該周圍單元是沒有減小的其他單元(與減小的單元相反)。應理解用于減小單元的控制點的移位并不限于此示例:可以應用用于減小單個單元的很多啟發(fā)式方法。
然后,在步驟S110,根據(jù)獲得的柵格針對該圖像的每個像素計算變換,也就是說,根據(jù)在步驟S100變形的該柵格。
在該流程圖的示例中,使用移位的一個或多個控制點在圖像I的空間域計算變換Tθ。等式5的函數(shù)θ是表示參數(shù)化的變換的控制點集合的函數(shù),并且函數(shù)θ是變換Tθ的唯一參數(shù)。因此,一旦控制點已經(jīng)被移位,如步驟S70所執(zhí)行的,該變換Tθ的參數(shù)被設置。因此可能的是計算如等式5中所定義的變換Tθ。
最后,在步驟S120,通過將計算的變換Tθ應用至幾何圖像I的空間域來計算圖像J(也可稱之為新圖像J)。在調(diào)整大小的空間域Ω′上定義該圖像J。應用該計算的變換Tθ意味著執(zhí)行從圖像I的輸入空間域Ω到圖像J的輸出空間域Ω′的映射:依據(jù)等式3和4來修改每個像素的位置。
如已經(jīng)討論的,通過概要圖像中的不同單元以迭代的方式來實現(xiàn)該減小,這樣步驟S40-S120被重復執(zhí)行直到獲得可接受的結(jié)果。可使用停止該迭代的很多標準。舉例來說,當柵格中不再有單元具有的相關性低于該預定閾值時該迭代可以停止。作為另一示例,當所有單元已經(jīng)被修改時它可以停止。另一標準可以為新的圖像J的壓縮率到達甚至超過了特定值。停止該迭代的標準的另一個示例是新圖像J的像素數(shù)量到達指定閾值,例如,J的像素數(shù)量是圖像I的像素數(shù)量的二分之一。
步驟S40至S120的迭代過程可以進一步包括在指定數(shù)量的迭代的每個集合處增加該集合的控制點數(shù)量。這也稱為多尺度變換圖更新。這避免了顯著性圖像中的局部最小,并允許減小最終網(wǎng)格中的大區(qū)域以及小區(qū)域。
此新圖像J是表示在方法的輸入處提供的網(wǎng)格的幾何圖像I的減小版本。使用已知的圖像壓縮算法可進一步壓縮此圖像J,例如但不限于,JPEG,...。
新圖像J可用于重新建立新網(wǎng)格。通過使用圖像J來執(zhí)行該創(chuàng)建。有趣的是,無需存儲任何連通性數(shù)據(jù):實際上,提供的網(wǎng)格的變換可以優(yōu)選地包括將該網(wǎng)格切分至圖表的步驟,如先前參考圖3所討論的。因此,由于該提供的網(wǎng)格沿著孔洞已經(jīng)被切分,所以可在壓縮的網(wǎng)格上(也就是,在圖像J上)使用任意網(wǎng)格重劃算法。
圖10示出了圖5的幾何圖像的新圖像J。有趣的是,以黑色表示的區(qū)域100a至100d并不屬于新圖像J,并且這里僅用于示出該壓縮的圖像J無需保持直邊,因為這對于壓縮幾何圖像來說不是必需的。
現(xiàn)在參考圖15,它示出了用于執(zhí)行根據(jù)本發(fā)明的3D網(wǎng)格壓縮的計算機程序的計算模塊的示例。每個模塊包括可由計算機實現(xiàn)的指令,例如,圖16的計算機系統(tǒng)的處理電路。
幾何圖像計算模塊1510將3D建模的網(wǎng)格1500作為輸入用于壓縮(步驟S10)。模塊1520計算由模塊1510計算的幾何圖像I的每個像素的顯著性(步驟S20-30)。模塊1520的輸出依據(jù)步驟S40計算圖像I的顯著性圖像。模塊1520進一步依據(jù)步驟S50-S80計算概要圖像。應理解,兩個分離的模塊可以執(zhí)行模塊1520的計算;一個模塊用于計算顯著性圖像,一個模塊用于計算概要圖像。因此,模塊1520計算對變換Tθ進行參數(shù)化的插值樣條的控制點集合。概要圖像計算模塊1520可以實現(xiàn)多種插值樣條函數(shù);可以基于用戶動作或默認地執(zhí)行對一個樣條函數(shù)的選擇。根據(jù)該插值樣條獲得的控制點的集合可以表示為柵格,例如,其中控制點均勻分布于圖像I的原始空間域Ω的控制點的規(guī)則柵格。
最小單元減小和優(yōu)化模塊將該概要圖像作為輸入。該優(yōu)化模塊返回其相關性(顯著性)低于預定閾值的概要圖像的單元(步驟S90)。此模塊實現(xiàn)能夠識別具有較小加權(quán)平均的一個或多個單元并作出決定以修改識別的單元的大小的一個或多個已知算法可以被使用。因此,此模塊提供該概要圖像的變換參數(shù)。在多種算法中選擇一種算法可以基于用戶動作或默認地執(zhí)行。
控制點移動模塊1540定義一個或多個控制點的移位,如步驟S100所定義的。模塊1540輸出因此為修改控制點的柵格的變換參數(shù)。此模塊根據(jù)模塊40的輸出來推斷控制點位置。
變換模塊1550計算變換Tθ(步驟S110)并在網(wǎng)格的圖像I的空間域上應用計算的變換Tθ以進行壓縮(步驟S120)。該變換模塊的輸出是調(diào)整大小的圖像J。
然后由測試模塊1570來測試圖像I的新大小(也就是,圖像J的大小)與是否遵守標準。如果圖像J沒有達到可接受的結(jié)果,那么,該過程被迭代。由迭代模塊1580管理該迭代,并且該迭代的控制依靠模塊1570和1580。在圖像J符合期望標準的情況下(例如,J的像素數(shù)),則變換模塊1550的輸出被認為是圖像J。在該調(diào)整大小的圖像并不符合期望大小的情況下,使用新變換參數(shù)來重復整個過程(步驟S40至S120):由模塊1530和1540來決定控制點的新移位。
有趣的是,如果在顯著性圖像模塊1520中使用的算法需要重新計算該圖像顯著性時,可在任意時刻使用當前移位的柵格來重新計算該圖像顯著性。當獲得的變換被應用至原始圖像I時,僅在最后計算一次最終圖像。
本發(fā)明有利地允許重新使用已經(jīng)在用的具有當前內(nèi)容感知的圖像重定向的某些計算模塊,諸如在用于內(nèi)容感知的圖像調(diào)整大小的接縫雕刻(Seam carving for content-aware image resizing)中所描述的那些??梢灾匦率褂矛F(xiàn)有的顯著性計算模塊1520,優(yōu)化單元模塊1530以及變換模塊1550。這有利地限制了開發(fā)開銷并簡化了本發(fā)明與當前內(nèi)容感知的圖像重定向軟件的集成。
模塊網(wǎng)格重組/配對模塊1590根據(jù)圖像J,也就是根據(jù)壓縮的圖像I來重構(gòu)該網(wǎng)格。此模塊的輸出1592是基本上與在步驟S10提供的網(wǎng)格相同的網(wǎng);該壓縮移除了原始網(wǎng)格的某些頂點從而未壓縮的網(wǎng)格與步驟S10的原始網(wǎng)格稍有差別。如在前參考圖3提到的,該輸入網(wǎng)格可以為任意種類并且它初始被切分以將它減少至單個拓撲盤。在幾何圖像中裝入了任意形狀的圖表。使用配對算法以移除圖表邊界之間的不連續(xù)性并創(chuàng)建水密表面(watertight space),如本領域所公知的。該網(wǎng)格重劃的圖表被束縛在一起。此配對操作典型地由模塊1590執(zhí)行。
已經(jīng)描述了本發(fā)明的優(yōu)選實施例。將理解的是,在不脫離本發(fā)明的精神和范圍的情況下可以作出多種修改。因此,其他實現(xiàn)方式處于下面的權(quán)利要求的范圍內(nèi)。舉例來說,在本發(fā)明中也可使用提高計算速度的多尺度/多解析度方法而無需對該算法作出任何改變(如Lee,Seungyong,George Wolberg以及Sung Yong Shin,“使用多層次B樣條的分散數(shù)據(jù)插值(Scattered data interpolation with multilevel B-splines)”,視覺和計算機圖形學的IEEE會刊,第3卷第3期,1997年7月,第228-244頁所描述的);在每個新尺度/解析度層次后僅需要重新計算該圖像顯著性。