本發(fā)明涉及一種二維等間距投影圖的數(shù)字化方法。
背景技術(shù):
近幾十年以來,海洋觀測技術(shù)發(fā)展迅速,特別是隨著衛(wèi)星技術(shù)的成熟,海洋數(shù)據(jù)大量增加,極大的推動(dòng)了研究工作的進(jìn)展。很多類型的海洋數(shù)據(jù)可以通過網(wǎng)絡(luò)或其他方式直接獲取,但同時(shí),還有一部分?jǐn)?shù)據(jù)只以圖像的形式向外發(fā)布,很難直接獲得原始數(shù)據(jù),比如不公開算法的衛(wèi)星反演的圖像、人工繪制的歷史圖像等等。此類圖像大都具有非常重要的研究價(jià)值,但因其數(shù)據(jù)獲取的難度給科研工作帶來了極大的不便,因此發(fā)展一種圖像數(shù)字化的方法,特別是難度較大的二維圖像,就顯得格外重要。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明要解決的技術(shù)問題是提供一種二維等間距投影圖的數(shù)字化方法。
為了解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案是,二維等間距投影圖的數(shù)字化方法,包括以下步驟:
(1)色標(biāo)的確定
將圖像的色標(biāo)讀入,讀入的數(shù)據(jù)為RGB值,以三維矩陣儲存;色標(biāo)以黑線為外邊框,黑色的RGB值都為0,故以此為指標(biāo),剔除邊框及以外的部分,只留下色標(biāo)內(nèi)部數(shù)據(jù);
(2)待提取數(shù)據(jù)圖像的處理
(3)數(shù)據(jù)提取
(4)數(shù)據(jù)提取優(yōu)化
(5)確定坐標(biāo)
由于是二維等間距投影圖,得到數(shù)據(jù)矩陣的行列像素點(diǎn)個(gè)數(shù)后,將全球的橫縱坐標(biāo)均勻分配即可得到各點(diǎn)的坐標(biāo)值。
作為優(yōu)選,步驟(1)中所述色標(biāo)的確定包括以下步驟:
a)統(tǒng)計(jì)出每行RGB值為0的點(diǎn)的個(gè)數(shù)記為row(i),i為圖像像素點(diǎn)的行數(shù);
b)將統(tǒng)計(jì)的相鄰兩行相減:delt(n)=row(n+1)-row(n),n=1,2,…,i-1,得到相鄰兩行黑點(diǎn)個(gè)數(shù)的變化情況;
c)將delt(n)均分為上下兩部分,從上部分找到delt(n)最小的行數(shù),即相鄰兩行是從黑點(diǎn)較多的邊框轉(zhuǎn)變?yōu)楹邳c(diǎn)較少的非邊框部分,即色標(biāo)的上邊界;從下部分找到delt(n)最大的行數(shù),即相鄰兩行是從非邊框轉(zhuǎn)變?yōu)檫吙虿糠郑瓷珮?biāo)的下邊界;
d)同理統(tǒng)計(jì)出每列RGB值為0的個(gè)數(shù)記為column(j),j為圖像像素點(diǎn)的列數(shù);并將相鄰兩列相減:delt(m)=column(m+1)-column(m),m=1,2…,j-1,得到相鄰兩列黑點(diǎn)個(gè)數(shù)的變化情況;將delt(m)均分為左右兩部分,從左部分找到delt(m)最小的列數(shù),為色標(biāo)的左邊界;從右部分找到delt(m)最大的列數(shù),為色標(biāo)的右邊界;
e)選取剔除后區(qū)域的中間一行的RGB數(shù)據(jù),并通過色標(biāo)的下標(biāo)將每個(gè)RGB值與數(shù)據(jù)值建立對應(yīng)關(guān)系,建立對應(yīng)關(guān)系數(shù)組,儲存第一部分為RGB值,第二部分對應(yīng)的數(shù)據(jù)值。
作為另外一個(gè)優(yōu)選,步驟(2)中所述待提取數(shù)據(jù)圖像的處理包括以下步驟:
f)讀入圖像后,剔除邊框以及邊框外部分,方法同色標(biāo)的剔除過程,剔除后得到只包含數(shù)據(jù)點(diǎn)的最小矩陣;
g)在得到數(shù)據(jù)區(qū)域后,需給定陸地點(diǎn)的RGB值;包括以下兩種實(shí)現(xiàn)方法:第一種,直接輸入給定陸地點(diǎn)的RGB值;第二種,從原圖像中截取只含陸地區(qū)域部分,并將該圖像讀入后就可提取出RGB值。若原圖像中不存在陸地點(diǎn)則可直接輸入白點(diǎn)的RGB值,代表無陸地點(diǎn);
h)區(qū)分有數(shù)據(jù)點(diǎn)和無數(shù)據(jù)點(diǎn);定義矩陣mask,矩陣大小等同數(shù)據(jù)區(qū)域。若原數(shù)據(jù)區(qū)域中某點(diǎn)的RGB值都為255,即無數(shù)據(jù)點(diǎn),或等于陸地點(diǎn)的RGB值,則對應(yīng)mask在該點(diǎn)上的值為0,其余存在數(shù)據(jù)的點(diǎn),mask對應(yīng)點(diǎn)的值為1。
還有一個(gè)優(yōu)選是,步驟(3)中所述數(shù)據(jù)提取包括以下步驟:
i)定義矩陣result,矩陣大小等同數(shù)據(jù)區(qū)域,初始值都賦為無效值,默認(rèn)無效值設(shè)為32767,可按使用需要進(jìn)行更改;
j)以mask各點(diǎn)的值為依據(jù),若mask(i,j)=1,則該點(diǎn)為有數(shù)據(jù)點(diǎn),將該點(diǎn)的RGB值與cell數(shù)組cb中第一維儲存的RGB值進(jìn)行匹配,并將該點(diǎn)賦值為對應(yīng)的數(shù)據(jù)值;若mask(i,j)=0,即該點(diǎn)為無數(shù)據(jù)點(diǎn),則自動(dòng)跳過,不進(jìn)行匹配,該點(diǎn)的值仍為無效值。
另一個(gè)優(yōu)選是,步驟(4)中所述數(shù)據(jù)提取優(yōu)化包括以下步驟:
經(jīng)過執(zhí)行步驟(3),大部分點(diǎn)的數(shù)據(jù)提取已基本完成,有一部分的點(diǎn)仍為無效值,原因在于數(shù)字化所用的圖像大多是從文獻(xiàn)或網(wǎng)頁上獲得,部分點(diǎn)的RGB值由于圖像截取或在圖像保存過程中發(fā)生了些許變化,無法與從色標(biāo)中提取的RGB值相匹配;另外,若圖像產(chǎn)生的年份較早,在經(jīng)幾次轉(zhuǎn)載復(fù)制之后圖像的RGB值也會發(fā)生一定的變化,造成無法匹配的現(xiàn)象;為解決上述問題,采用插值的方法將原本有數(shù)據(jù),但又無法匹配賦值的點(diǎn)進(jìn)行補(bǔ)全。
本發(fā)明的有益效果是:
本方法可以應(yīng)用于多個(gè)專業(yè)領(lǐng)域,將二維等間距投影圖像數(shù)字化,提取圖像中的數(shù)據(jù)。
1)可以應(yīng)用于衛(wèi)星圖像的數(shù)據(jù)提取。文章或網(wǎng)上發(fā)布的衛(wèi)星圖像大都不公開其衛(wèi)星算法,很難獲得圖像中的原始數(shù)據(jù);
2)可以應(yīng)用于文獻(xiàn)中圖像的數(shù)據(jù)提取。發(fā)布在文獻(xiàn)中的圖像基本都不提供原始數(shù)據(jù);
3)可以應(yīng)用于較早圖像的數(shù)據(jù)重現(xiàn)。部分圖像產(chǎn)生年代較早,其原始數(shù)據(jù)已丟失或難以重新計(jì)算得到。
從以上三點(diǎn)來看,本方法的應(yīng)用可以得到大量原本難以得到但又有很高實(shí)用價(jià)值的數(shù)據(jù),且根據(jù)專業(yè)的不同還存在大量的應(yīng)用空間。因此本方法的實(shí)現(xiàn)有非常大的實(shí)用價(jià)值。
附圖說明
下面結(jié)合附圖和具體實(shí)施方式對本發(fā)明作進(jìn)一步詳細(xì)的說明。
圖1是本發(fā)明二維等間距投影圖的數(shù)字化方法的流程圖。
圖2是本發(fā)明二維等間距投影圖的數(shù)字化方法實(shí)施例的Levitus全球海表溫度圖。
圖3是本發(fā)明二維等間距投影圖的數(shù)字化方法實(shí)施例的數(shù)字化結(jié)果再現(xiàn)圖。
圖4是本發(fā)明二維等間距投影圖的數(shù)字化方法實(shí)施例的Levitus原始數(shù)據(jù)與數(shù)字化結(jié)果的散點(diǎn)對比圖。
圖5左列是本發(fā)明二維等間距投影圖的數(shù)字化方法實(shí)施例的由衛(wèi)星數(shù)據(jù)反演得到的2001年2、5、8、11月全球月平均白冠覆蓋率圖像,右列是數(shù)字化再現(xiàn)的2001年2、5、8、11月全球月平均白冠覆蓋率圖像。
具體實(shí)施方式
1圖片數(shù)字化方法
該方法的流程如圖1所示。
1.1數(shù)據(jù)介紹
Levitus是由美國國家海洋數(shù)據(jù)中心(NODC)的海洋氣候?qū)嶒?yàn)室制作的氣候態(tài)海洋數(shù)據(jù),是目前國際上比較常用的氣候態(tài)溫鹽資料。具有年平均、季節(jié)平均和月平均三種不同時(shí)間尺度,空間分辨率為1°,經(jīng)度范圍從0.5°E到0.5°W,緯度范圍從89.5°S到89.5°N,垂直方向分為33層。如圖2是一月份月平均的全球海表溫度資料。
1.2方法介紹
讀取圖像,可直接獲得圖像RGB值,但如果要獲取各RGB值對應(yīng)的數(shù)據(jù)值,則應(yīng)確定RGB顏色值與數(shù)據(jù)值的對應(yīng)關(guān)系,通常這些關(guān)系包含在色標(biāo)的內(nèi)容中。本部分內(nèi)容以Levitus的全球海表溫度為例,先將Levitus原始數(shù)據(jù)圖像化,得到RGB圖像,再從RGB顏色值與溫度數(shù)據(jù)值中找到一一對應(yīng)關(guān)系,重現(xiàn)圖像的數(shù)據(jù)。將重現(xiàn)數(shù)據(jù)與原始數(shù)據(jù)做了誤差分析,得到了可靠的圖像信息。具體過程如下:
(1)讀取色標(biāo)圖像
欲將圖像轉(zhuǎn)化為數(shù)據(jù),需要知道每種顏色所對應(yīng)的數(shù)據(jù)值的大小。所以,首先讀入色標(biāo)圖像,從色標(biāo)中依次提取各個(gè)顏色值,再根據(jù)色標(biāo)的下標(biāo)確定每種顏色對應(yīng)的數(shù)據(jù)值,得到顏色值和數(shù)據(jù)值的一一對應(yīng)關(guān)系。所需輸入?yún)?shù)包括:色標(biāo)圖像名、起始顏色所對應(yīng)的數(shù)據(jù)值和色標(biāo)下標(biāo)數(shù)據(jù)值的間隔。運(yùn)算后輸出一矩陣,包括色標(biāo)中各個(gè)顏色值和每個(gè)顏色值相對應(yīng)的數(shù)據(jù)值,建立顏色值與數(shù)據(jù)值之間的一一對應(yīng)關(guān)系。
(2)進(jìn)行顏色值到數(shù)據(jù)值的轉(zhuǎn)換
確定顏色值和數(shù)據(jù)值的關(guān)系后,為將圖像中的顏色值轉(zhuǎn)換到數(shù)據(jù)值做好了準(zhǔn)備。首先讀入原始圖像,并將圖像的邊框及以外部分剔除,即只保留含有數(shù)據(jù)的最小矩形區(qū)域。值得注意的是,由于海洋和大氣數(shù)據(jù)圖像往往存在陸地區(qū)域,因此需從原始圖像中截取陸地區(qū)域圖像,同樣讀入代表陸地的顏色值,這樣在數(shù)字化的過程中可以剔除陸地的像素點(diǎn),只對海水點(diǎn)進(jìn)行處理。完成了數(shù)據(jù)區(qū)域選取的處理,之后,就可以將原始圖像中含有數(shù)據(jù)的像素點(diǎn),通過顏色值和數(shù)據(jù)值的一一對應(yīng)關(guān)系,將原始圖片的顏色值轉(zhuǎn)換為數(shù)據(jù)值。同時(shí)因圖像本身原因或圖像采集過程,某些點(diǎn)的RGB值發(fā)生些許變化,無法與原色標(biāo)中的RGB值相匹配,產(chǎn)生轉(zhuǎn)換不成功現(xiàn)象。為此采用插值進(jìn)行轉(zhuǎn)換失敗點(diǎn)的數(shù)據(jù)補(bǔ)全。最后通過給定的橫縱坐標(biāo)范圍確定每個(gè)像素點(diǎn)的坐標(biāo)值。
所需輸入?yún)?shù)包括待提取數(shù)據(jù)圖像的圖像名,顏色值與數(shù)據(jù)值的對應(yīng)關(guān)系矩陣,數(shù)據(jù)的坐標(biāo)范圍,可選輸入?yún)?shù)可以是陸地圖像或陸地顏色的RPG值。經(jīng)運(yùn)算后,輸出量包括圖像各像素點(diǎn)的數(shù)據(jù)值,若值為32767,則該點(diǎn)為陸地點(diǎn)或無數(shù)據(jù)點(diǎn);各像素點(diǎn)的水陸判別信息,1代表水點(diǎn),0代表陸地點(diǎn);橫向各個(gè)像素點(diǎn)的坐標(biāo)值,縱向各個(gè)像素點(diǎn)的坐標(biāo)值。
圖3是將數(shù)字化的數(shù)據(jù)結(jié)果進(jìn)行作圖再現(xiàn),通過對原始圖像進(jìn)行數(shù)字化處理,提取出其中的數(shù)據(jù)后,將得到的數(shù)據(jù)重新作圖,與原始圖像進(jìn)行直觀的對比。
1.3圖像數(shù)字化模型檢驗(yàn)
圖4為原始數(shù)據(jù)與數(shù)字化結(jié)果的散點(diǎn)對比圖??梢钥闯鰯?shù)字化的提取結(jié)果與原始數(shù)據(jù)具有較好的一致性,經(jīng)計(jì)算,原始數(shù)據(jù)與再現(xiàn)數(shù)據(jù)平均誤差(ME)為0.14679℃,絕對平均誤差(MAE)為0.21501℃,均方根誤差(RMSE)為0.27504℃,相關(guān)系數(shù)(R)為0.99986,結(jié)果良好。故總體而言,通過本實(shí)施例的數(shù)字化方法提取的數(shù)據(jù)是可信的,可以運(yùn)用到進(jìn)一步的研究工作中。
2圖片數(shù)字化方法實(shí)際應(yīng)用
將該方法應(yīng)用到2001年2、5、8、11月全球月平均白冠覆蓋率圖像,如圖5左列的(a)~(d),圖像原始數(shù)據(jù)是從衛(wèi)星資料反演得到,其中包括SSM/I的海表面亮溫(TB)、大氣柱水汽含量(V)、云中液態(tài)水含量(L)數(shù)據(jù)、AVHRR的海表面溫度(TS)數(shù)據(jù)、WOA05的海表面鹽度(S)數(shù)據(jù)和QuikSCAT的海面10米風(fēng)場(U10)數(shù)據(jù)等。該反演方法較復(fù)雜,對于物理模型的驗(yàn)證來說非常的耗時(shí)。
按照上一部分中圖片的數(shù)字化方法,經(jīng)過選取色標(biāo)顏色值,建立顏色值與數(shù)據(jù)值對應(yīng)關(guān)系,選取數(shù)據(jù)矩形區(qū)域,剔除陸地點(diǎn),顏色值與數(shù)據(jù)值的轉(zhuǎn)換,經(jīng)緯度的確定等一系列處理,最終從圖像中提取出數(shù)據(jù),圖5右列的(e)~(h)即為將提取的數(shù)據(jù)重新作圖的結(jié)果。從圖中可以發(fā)現(xiàn),數(shù)字化再現(xiàn)圖像與原圖像的空間布局基本一致,數(shù)據(jù)大小基本吻合,數(shù)字化提取結(jié)果較為滿意,實(shí)現(xiàn)了快速獲取圖像信息的功能。
3結(jié)語
本數(shù)字化方法能夠很方便的對圖像進(jìn)行有效的數(shù)據(jù)提取。該數(shù)字化方法應(yīng)用于等間距投影的二維圖像,并且主要針對因某些原因只向外提供圖像但沒有原始數(shù)據(jù)的情況,如原始數(shù)據(jù)具有較高研究價(jià)值的衛(wèi)星圖像,繪制時(shí)間較早且原始數(shù)據(jù)丟失的圖像,人工繪制的歷史圖像等。
上述圖像數(shù)字化方法可為此類無法直接獲取的數(shù)據(jù)提供便捷的數(shù)字化,相對于圖像,數(shù)字化后得到的數(shù)據(jù)更具有靈活性。并且,若進(jìn)行數(shù)字化的圖像包含的數(shù)據(jù)范圍較大,如全球范圍的數(shù)據(jù),其原始數(shù)據(jù)的分辨率一般較低,而數(shù)字化過程中將數(shù)據(jù)范圍均勻分配到各個(gè)像素點(diǎn)上,對于一般分辨率的圖像,橫縱像素點(diǎn)個(gè)數(shù)相對較大,因此最后提取得到的數(shù)據(jù)分辨率相對與原始數(shù)據(jù)有所提高,而對于包含較小數(shù)據(jù)區(qū)域的圖像,原始數(shù)據(jù)分辨率相對較高,通過數(shù)字化提取的數(shù)據(jù)也能保持相當(dāng)?shù)姆直媛省?/p>
同時(shí)對數(shù)字化提取結(jié)果的有效性進(jìn)行了檢驗(yàn),原始數(shù)據(jù)與再現(xiàn)數(shù)據(jù)平均誤差為0.14679℃,絕對平均誤差為0.21501℃,均方根誤差為0.27504℃,相關(guān)系數(shù)為0.99986,檢驗(yàn)結(jié)果較為滿意,可將數(shù)據(jù)運(yùn)用到進(jìn)一步的研究工作中以供后續(xù)使用。
目前上述提出的方法僅僅適用于空間等間距投影圖像,對于那些空間非等間距投影的圖像暫時(shí)無法取得令人滿意的結(jié)果,有必要對該類問題做進(jìn)一步的研究。
以上所述的本發(fā)明實(shí)施方式,并不構(gòu)成對本發(fā)明保護(hù)范圍的限定。任何在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的權(quán)利要求保護(hù)范圍之內(nèi)。