本發(fā)明屬于遙感數(shù)據(jù)的時空分析領(lǐng)域,尤其是公開了一種多尺度嵌套的空間統(tǒng)計(jì)單元構(gòu)建方法。
背景技術(shù):
在大數(shù)據(jù)時代,數(shù)據(jù)挖掘和數(shù)據(jù)分析愈來愈顯得至關(guān)重要,特別是在地學(xué)領(lǐng)域,隨著對地觀測技術(shù)的迅猛發(fā)展,積累了海量的時空數(shù)據(jù)。目前全球共發(fā)射了320顆對地觀測衛(wèi)星,包括陸地、大氣和海洋等各個領(lǐng)域。通過對地觀測衛(wèi)星所攜帶的各類傳感器,可以對大氣和地球表面的各類物理和化學(xué)參數(shù)進(jìn)行監(jiān)測。經(jīng)過50多年的發(fā)展,采集積累了大量的衛(wèi)星遙感時空觀測數(shù)據(jù),但目前對于遙感數(shù)據(jù)的分析處理能力還需要進(jìn)一步加強(qiáng),特別是對于時空大數(shù)據(jù)的挖掘分析。盡管目前計(jì)算機(jī)硬件技術(shù)快速發(fā)展,但也難以追趕數(shù)據(jù)量的幾何級增長。對于時空大數(shù)據(jù)的統(tǒng)計(jì)分析,若簡單以最小觀測單元(如像元)為統(tǒng)計(jì)單元,則無疑會帶來巨大的計(jì)算負(fù)擔(dān),同時也存在信息冗余的問題,換句話說,并不是統(tǒng)計(jì)單元越小越合理,目前人們在對時空遙感數(shù)據(jù)統(tǒng)計(jì)分析時,大都慣以像元為空間統(tǒng)計(jì)單元,這樣做不但難以將復(fù)雜的時空分析方法引入時空大數(shù)據(jù)分析領(lǐng)域,而且在理論上也難以站住腳。
對于遙感數(shù)據(jù)的時空分析問題,一般都以固定的像元尺度進(jìn)行時空統(tǒng)計(jì)分析,通常以3*3像元的一階空間鄰接考慮空間相關(guān)性,而這樣并不能反映時空過程中的多尺度耦合效應(yīng),其對時空格局的探測和研究結(jié)果可能存在偏差。
現(xiàn)有空間統(tǒng)計(jì)單元選取或構(gòu)建技術(shù)的一個共同缺點(diǎn)是:擬通過固定尺度的空間統(tǒng)計(jì)單元來測度多尺度耦合的時空變化過程,顯然有失合理性和科學(xué)性。再者,若以原始像元為空間統(tǒng)計(jì)單元,不但在存在上述理論缺陷,而且還會帶來巨大的冗余計(jì)算負(fù)擔(dān),致使很多時空分析方法無法實(shí)施;而若以固定的較大尺度格網(wǎng)單元為空間統(tǒng)計(jì)單元,也同樣會存在上述理論缺陷,且會降低原始數(shù)據(jù)的精度,丟失很多有用的信息。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明克服現(xiàn)有技術(shù)存在的不足,提供一種在不降低原始時空遙感大數(shù)據(jù)精度和不丟失有用信息的前提下,一種多尺度嵌套的空間統(tǒng)計(jì)單元構(gòu)建方法,為進(jìn)一步深入分析打下堅(jiān)實(shí)基礎(chǔ),也為順利將眾多復(fù)雜、科學(xué)、優(yōu)良的時空分析技術(shù)順利引入時空遙感大數(shù)據(jù)分析領(lǐng)域創(chuàng)造有利條件。
為了解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案為:
一種多尺度嵌套的空間統(tǒng)計(jì)單元構(gòu)建方法,其特征在于,包括以下步驟:
步驟1:確定格網(wǎng)局部均質(zhì)閾值,即變異系數(shù)閾值
步驟2:構(gòu)建第n階尺度正方形格網(wǎng);假設(shè)原來像元尺度為
步驟3,構(gòu)建(n-1)階尺度正方形格網(wǎng)單元;計(jì)算每一個n階尺度正方形格網(wǎng)包含像元屬性值的變異系數(shù),記第
按照上述過程遍歷完所有的n階尺度正方形格網(wǎng)后,則已經(jīng)構(gòu)建出n階和(n-1)階兩個尺度嵌套的空間統(tǒng)計(jì)單元,前者尺度為
步驟4,構(gòu)建(n-2),(n-3),......,2,1階尺度正方形格網(wǎng)單元;在步驟3的基礎(chǔ)上,計(jì)算每一個(n-1)階尺度正方形格網(wǎng)包含像元屬性值的變異系數(shù),若其包含像元屬性值的變異系數(shù)大于
優(yōu)選的,所述步驟1中計(jì)算原始遙感數(shù)據(jù)的變異系數(shù)的公示為:
變異系數(shù)=平均值/標(biāo)準(zhǔn)差。
優(yōu)選的,所述步驟1中確定格網(wǎng)局部均質(zhì)閾值
表1不同原始數(shù)據(jù)變異系數(shù)條件下的格網(wǎng)局部均質(zhì)閾值選取參考表
優(yōu)選的,所述步驟2中n的取值為4-6。
優(yōu)選的,所述步驟2中的正方形格網(wǎng)需要滿足兩個條件:
第一,正方形格網(wǎng)邊界須與像素邊界齊整,即須恰好包含
第二,所有正方形格網(wǎng)包含的像素屬性值計(jì)算的變異系數(shù)不能都大于格網(wǎng)局部均質(zhì)閾值
本發(fā)明與現(xiàn)有技術(shù)相比有以下有益效果:
現(xiàn)有技術(shù)中以像元為統(tǒng)計(jì)單元進(jìn)行時空統(tǒng)計(jì)分析,不僅難以描述多尺度耦合的時間過程,同時巨大的計(jì)算負(fù)擔(dān)也使得很多時空分析方法難以實(shí)施,而按照本發(fā)明的多尺度嵌套的空間統(tǒng)計(jì)單元構(gòu)建后,空間統(tǒng)計(jì)單元數(shù)縮減少,同時嵌套的多尺度空間統(tǒng)計(jì)格網(wǎng)的統(tǒng)計(jì)性質(zhì)與原始數(shù)據(jù)基本一致,也就是并不影響時空變化規(guī)律的探測與挖掘。其次,根據(jù)本發(fā)明構(gòu)建的多尺度嵌套的空間統(tǒng)計(jì)單元則巧妙地解決了以上問題,有效過濾了冗余信息,在提高計(jì)算效率的同時,突破了原來以固定尺度統(tǒng)計(jì)分析時空現(xiàn)象,既保證了理論的合理性和科學(xué)性,也使得一些復(fù)雜和優(yōu)良的時空分析方法(如貝葉斯時空交互模型)順利應(yīng)用到遙感大數(shù)據(jù)的分析領(lǐng)域中。
附圖說明
圖1展示了一個包含4階尺度剖分的格網(wǎng)示例;
圖2是根據(jù)2014年亞洲pm2.5年均濃度遙感反演數(shù)據(jù)情況進(jìn)行的多尺度嵌套的空間統(tǒng)計(jì)格網(wǎng)單元構(gòu)建結(jié)果;
圖3是2014年全球pm2.5年均濃度遙感反演數(shù)據(jù)多尺度空間統(tǒng)計(jì)單元構(gòu)建結(jié)構(gòu)圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例,對本發(fā)明的具體實(shí)施方式作進(jìn)一步詳細(xì)描述,以下實(shí)施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。
一種多尺度嵌套的空間統(tǒng)計(jì)單元構(gòu)建方法,其特征在于,包括以下步驟:
將對2014年全球pm2.5年均濃度遙感反演數(shù)據(jù)進(jìn)行多尺度嵌套的空間統(tǒng)計(jì)單元積進(jìn)行構(gòu)建。原始數(shù)據(jù)空間分辨率為0.10.1,共有1,455,488個像元。
以下將按照本發(fā)明技術(shù)方案對其進(jìn)行多尺度空間統(tǒng)計(jì)單元構(gòu)建:
步驟1:確定格網(wǎng)局部均質(zhì)閾值----變異系數(shù)閾值
步驟2:將n值確定為5,即最高階尺度格網(wǎng)為5階尺度正方形格網(wǎng),其空間尺度分辨率為1.6°′1.6°;
步驟3:構(gòu)建4階尺度正方形格網(wǎng)單元;計(jì)算每一個5階尺度正方形格網(wǎng)包含像元屬性值的變異系數(shù),記第
步驟4:構(gòu)建3、2、1階尺度正方形格網(wǎng)單元;在步驟3的基礎(chǔ)上,計(jì)算每一個4階尺度正方形格網(wǎng)包含像元屬性值的變異系數(shù),若其包含像元屬性值的變異系數(shù)大于8.0%,則對其進(jìn)行四叉樹剖分,形成3階尺度正方形格網(wǎng),對應(yīng)尺度為0.4°′0.4°,若其包含像元屬性值的變異系數(shù)
對于本實(shí)例而言,到3階尺度正方形格網(wǎng)剖分后,其所有的空間統(tǒng)計(jì)單元包含的像元屬性值的變異系數(shù)都小于8.0%,因此,最小尺度的空間統(tǒng)計(jì)單元為3階尺度正方形格網(wǎng),尺度為0.4°′0.4°。最終,共構(gòu)建了10314個多尺度空間統(tǒng)計(jì)單元格網(wǎng),具體如圖3所示,其中5階尺度格網(wǎng)有5547個,4階尺度格網(wǎng)有4131個,3階尺度格網(wǎng)有636個,其中彩色圖為原遙感數(shù)據(jù)。
圖2顯示的是根據(jù)2014年亞洲pm2.5年均濃度遙感反演數(shù)據(jù)情況進(jìn)行的多尺度嵌套的空間統(tǒng)計(jì)格網(wǎng)單元構(gòu)建結(jié)果,底圖是2014年亞洲pm2.5年均濃度遙感反演原數(shù)據(jù)的平均值分布圖。原始遙感數(shù)據(jù)的空間分辨率為0.1°′0.1°,具有70,656個像元單元,如果以像元為統(tǒng)計(jì)單元進(jìn)行時空統(tǒng)計(jì)分析,不僅難以描述多尺度耦合的時間過程,同時巨大的計(jì)算負(fù)擔(dān)也使得很多時空分析方法難以實(shí)施,而按照本發(fā)明的多尺度嵌套的空間統(tǒng)計(jì)單元構(gòu)建后,空間統(tǒng)計(jì)單元數(shù)縮減為為4481個,其中1587個4階尺度格網(wǎng),2286個3階尺度格網(wǎng),608個2階尺度格網(wǎng),同時嵌套的多尺度空間統(tǒng)計(jì)格網(wǎng)的統(tǒng)計(jì)性質(zhì)與原始數(shù)據(jù)基本一致,也就是并不影響時空變化規(guī)律的探測與挖掘。
若以原有像元單位為空間統(tǒng)計(jì)單元的話,由于巨大的計(jì)算負(fù)擔(dān),性質(zhì)良好的貝葉斯時空交互模型統(tǒng)將難以進(jìn)行實(shí)施,如若通過平均值池化到較大尺度格網(wǎng)后計(jì)算,則又損失了原始遙感數(shù)據(jù)的精度,也會丟失很多有用信息,而且計(jì)算出的結(jié)果也會存在一定的偏差。而根據(jù)本發(fā)明構(gòu)建的多尺度嵌套的空間統(tǒng)計(jì)單元則巧妙地解決了以上問題,有效過濾了冗余信息,在提高計(jì)算效率的同時,突破了原來以固定尺度統(tǒng)計(jì)分析時空現(xiàn)象,既保證了理論的合理性和科學(xué)性,也使得一些復(fù)雜和優(yōu)良的時空分析方法(如貝葉斯時空交互模型)順利應(yīng)用到遙感大數(shù)據(jù)的分析領(lǐng)域中。
以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,盡管參照前述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,對于本領(lǐng)域的技術(shù)人員來說,其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。