一種利用輔助變量數(shù)據(jù)進(jìn)行采樣點(diǎn)布局的方法
【專利摘要】本發(fā)明公開一種利用輔助變量數(shù)據(jù)進(jìn)行采樣點(diǎn)布局的方法,所述方法包括:S1.從預(yù)設(shè)的K維輔助變量空間中,獲取K維輔助變量數(shù)據(jù),將所述K維輔助變量數(shù)據(jù)與預(yù)設(shè)的采樣區(qū)域進(jìn)行疊加,所述預(yù)設(shè)的采樣區(qū)域的形狀為多邊形Rvalid,提取疊加后的采樣區(qū)域內(nèi)的柵格單元,得到樣本總體中的樣本單元,所述樣本單元的集合構(gòu)成樣本總體N;S2.根據(jù)所述樣本總體N,得到輔助變量特征子空間和n′個(gè)地理子空間,所述n′由所述樣本總體N確定;S3.根據(jù)所述地理子空間,得到由n個(gè)采樣單元構(gòu)成的初始采樣點(diǎn)布局?jǐn)?shù)據(jù),所述n為預(yù)設(shè)值;S4.根據(jù)所述初始采樣點(diǎn)布局?jǐn)?shù)據(jù),得到n個(gè)采樣點(diǎn)的布局?jǐn)?shù)據(jù)。
【專利說明】一種利用輔助變量數(shù)據(jù)進(jìn)行采樣點(diǎn)布局的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及【技術(shù)領(lǐng)域】,具體涉及一種利用輔助變量數(shù)據(jù)進(jìn)行采樣點(diǎn)布局的方法。【背景技術(shù)】
[0002] 空間采樣調(diào)查是地理研究、資源評(píng)估以及空間制圖的基礎(chǔ)。采樣點(diǎn)布局是采樣調(diào) 查的核心內(nèi)容之一。利用輔助變量數(shù)據(jù)指導(dǎo)空間采樣是區(qū)域采樣點(diǎn)布局的發(fā)展趨勢(shì)。
[0003] 目前,利用輔助變量數(shù)據(jù)進(jìn)行采樣點(diǎn)布局的方法大多利用輔助變量數(shù)據(jù)實(shí)現(xiàn)采樣 區(qū)域內(nèi)的地理空間分層,消除空間異質(zhì)性,從而增強(qiáng)采樣精度。
[0004] 但是,現(xiàn)有的利用輔助變量數(shù)據(jù)進(jìn)行采樣點(diǎn)布局的方法沒有考慮采樣點(diǎn)在特征空 間分布的均勻性。地理空間均勻性可以利用限制樣點(diǎn)地理位置實(shí)現(xiàn),而如何反映目標(biāo)變量 在特征空間的分布狀況才是利用輔助變量的關(guān)鍵?;谔卣骺臻g的均衡設(shè)計(jì)方法能利用輔 助變量數(shù)據(jù)構(gòu)建采樣優(yōu)化特征空間,并在工業(yè)實(shí)驗(yàn)抽樣設(shè)計(jì)得到應(yīng)用,但該方法只適用于 連續(xù)數(shù)值型變量,且要求各變量的分層數(shù)相同,故不能滿足類別型變量參與下的采樣點(diǎn)布 局優(yōu)化的需要??梢?,對(duì)目標(biāo)變量的影響因素中類別型變量占據(jù)一定的比重,如何構(gòu)建類型 變量參與下的多維特征空間、及特征空間無偏優(yōu)化目標(biāo)函數(shù),以及特征空間和地理空間無 偏的雙重優(yōu)化目標(biāo)函數(shù)是無偏采樣布設(shè)優(yōu)化的關(guān)鍵。
[0005] 傳統(tǒng)分層采樣法沒有考慮采樣點(diǎn)在地理空間和輔助變量特征空間中分布的均勻 性,無法充分利用輔助變量數(shù)據(jù)對(duì)目標(biāo)變量的空間變異結(jié)構(gòu)的描述信息;應(yīng)用于工業(yè)設(shè)計(jì) 實(shí)驗(yàn)抽樣的均衡設(shè)計(jì)方法無法實(shí)現(xiàn)樣點(diǎn)在地理空間上的均勻性分布,同時(shí)無法將類別型輔 助變量應(yīng)用到采樣布局優(yōu)化中。上述方法都導(dǎo)致無法充分輔助變量數(shù)據(jù),空間采樣效率低, 難以滿足目標(biāo)變量總體估計(jì)、空間變異特征估計(jì)和空間插值分析等采樣目標(biāo)的需要。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明所要解決的技術(shù)問題是如何實(shí)現(xiàn)既能兼顧采樣點(diǎn)在地理空間和輔助變量 特征空間中分布的均勻性,又能利用類別型輔助變量構(gòu)建輔助變量特征空間的采樣點(diǎn)布 局。
[0007] 為此目的,本發(fā)明提出一種利用輔助變量數(shù)據(jù)進(jìn)行采樣點(diǎn)布局的方法,該方法包 括:
[0008] SI.從預(yù)設(shè)的K維輔助變量空間中,獲取K維輔助變量數(shù)據(jù),所述K為正整數(shù),所述 K維輔助變量數(shù)據(jù)的結(jié)構(gòu)為柵格結(jié)構(gòu),所述K維輔助變量數(shù)據(jù)的分辨率相同;
[0009] 將所述K維輔助變量數(shù)據(jù)與預(yù)設(shè)的采樣區(qū)域進(jìn)行疊加,所述預(yù)設(shè)的采樣區(qū)域的形 狀為多邊形Rvalid,提取疊加后的采樣區(qū)域內(nèi)的柵格單元,得到樣本總體中的樣本單元,所 述樣本單元的集合構(gòu)成樣本總體N;
[0010]S2.根據(jù)所述樣本總體N,得到輔助變量特征子空間和n'個(gè)地理子空間,所述n' 由所述樣本總體N確定;
[0011] S3.根據(jù)所述地理子空間,得到由η個(gè)采樣單元構(gòu)成的初始采樣點(diǎn)布局?jǐn)?shù)據(jù),所述 η為預(yù)設(shè)值;
[0012] S4.根據(jù)所述初始采樣點(diǎn)布局?jǐn)?shù)據(jù),根據(jù)所述初始采樣點(diǎn)數(shù)據(jù)布局,得到η個(gè)采樣 點(diǎn)的布局?jǐn)?shù)據(jù),所述采樣點(diǎn)布局?jǐn)?shù)據(jù)包括輔助變量特征子空間中的采樣點(diǎn)布局?jǐn)?shù)據(jù)以及地 理子空間中的采樣點(diǎn)布局?jǐn)?shù)據(jù);
[0013] 所述輔助變量特征子空間采樣點(diǎn)布局?jǐn)?shù)據(jù)滿足:
[0014] 特征子空間布設(shè)的采樣點(diǎn)/采樣點(diǎn)數(shù)η=特征子空間中柵格單元的個(gè)數(shù)/樣本總 體N;
[0015] 所述地理子空間采樣點(diǎn)布局?jǐn)?shù)據(jù)滿足:
[0016] 地理子空間布設(shè)的采樣點(diǎn)/采樣點(diǎn)數(shù)η=地理子空間中柵格單元的個(gè)數(shù)/樣本總 體Ν。
[0017] 可選的,在步驟S2中,所述輔助變量特征子空間包括:連續(xù)數(shù)值型變量特征子空 間以及類別型變量特征子空間;
[0018] 所述連續(xù)數(shù)值型變量特征子空間的獲取步驟包括:
[0019] 將所述連續(xù)數(shù)值型變量進(jìn)行排序,獲得連續(xù)數(shù)值型變量數(shù)據(jù)累積分布曲線;
[0020] 根據(jù)所述連續(xù)數(shù)值型變量數(shù)據(jù)累積分布曲線,通過等頻數(shù)方法,將所述連續(xù) 數(shù)值型變量劃分成R段,形成R個(gè)子空間,每個(gè)子空間中的采樣單元個(gè)數(shù)相同,其中, ,即為大于*的最小整數(shù)。
[0021] 可選的,所述類別型變量特征子空間的獲取步驟包括:
[0022] 將所述類別型變量進(jìn)行排序,獲得類別型變量數(shù)據(jù)累積分布曲線;
[0023]根據(jù)所述類別型變量數(shù)據(jù)累積分布曲線,通過類別型變量的類別值個(gè)數(shù)R',將所 述類別型變量劃分成R'個(gè)子空間,子空間中的采樣單元個(gè)數(shù)為對(duì)應(yīng)類別值所占的柵格單元 數(shù)。
[0024] 可選的,在步驟S2中,所述n'個(gè)地理子空間的獲取步驟包括:
[0025] 獲取地理子空間在X軸方向上的間距dx以及在y軸方向上的間距dy,所述dx與dy 的計(jì)算公式如下:
【權(quán)利要求】
1. 一種利用輔助變量數(shù)據(jù)進(jìn)行采樣點(diǎn)布局的方法,其特征在于,該方法包括:
51. 從預(yù)設(shè)的K維輔助變量空間中,獲取K維輔助變量數(shù)據(jù),所述K為正整數(shù),所述K維 輔助變量數(shù)據(jù)的結(jié)構(gòu)為柵格結(jié)構(gòu),所述K維輔助變量數(shù)據(jù)的分辨率相同; 將所述K維輔助變量數(shù)據(jù)與預(yù)設(shè)的采樣區(qū)域進(jìn)行疊加,所述預(yù)設(shè)的采樣區(qū)域的形狀為 多邊形Rvalid,提取疊加后的采樣區(qū)域內(nèi)的柵格單元,得到樣本總體中的樣本單元,所述樣 本單元的集合構(gòu)成樣本總體N;
52. 根據(jù)所述樣本總體N,得到輔助變量特征子空間和n'個(gè)地理子空間,所述n'由所 述樣本總體N確定;
53. 根據(jù)所述地理子空間,得到由η個(gè)采樣單元構(gòu)成的初始采樣點(diǎn)布局?jǐn)?shù)據(jù),所述η為 預(yù)設(shè)值;
54. 根據(jù)所述初始采樣點(diǎn)布局?jǐn)?shù)據(jù),得到η個(gè)采樣點(diǎn)的布局?jǐn)?shù)據(jù),所述采樣點(diǎn)布局?jǐn)?shù)據(jù) 包括輔助變量特征子空間中的采樣點(diǎn)布局?jǐn)?shù)據(jù)以及地理子空間中的采樣點(diǎn)布局?jǐn)?shù)據(jù); 所述輔助變量特征子空間采樣點(diǎn)布局?jǐn)?shù)據(jù)滿足: 特征子空間布設(shè)的采樣點(diǎn)/采樣點(diǎn)數(shù)η=特征子空間中柵格單元的個(gè)數(shù)/樣本總體N; 所述地理子空間采樣點(diǎn)布局?jǐn)?shù)據(jù)滿足: 地理子空間布設(shè)的采樣點(diǎn)/采樣點(diǎn)數(shù)η=地理子空間中柵格結(jié)構(gòu)的個(gè)數(shù)/樣本總體Ν。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,在步驟S2中,所述輔助變量特征子空間包 括:連續(xù)數(shù)值型變量特征子空間以及類別型變量特征子空間; 所述連續(xù)數(shù)值型變量特征子空間的獲取步驟包括: 將所述連續(xù)數(shù)值型變量進(jìn)行排序,獲得連續(xù)數(shù)值型變量數(shù)據(jù)累積分布曲線; 根據(jù)所述連續(xù)數(shù)值型變量數(shù)據(jù)累積分布曲線,通過等頻數(shù)方法,將所述連續(xù)數(shù)值型變 量劃分成R段,形成R個(gè)子空間,每個(gè)子空間中的采樣單元個(gè)數(shù)相同,其中,W=Ceil(W), 即為大于^的最小整數(shù)。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述類別型變量特征子空間的獲取步驟 包括: 將所述類別型變量進(jìn)行排序,獲得類別型變量數(shù)據(jù)累積分布曲線; 根據(jù)所述類別型變量數(shù)據(jù)累積分布曲線,通過類別型變量的類別值個(gè)數(shù)R',將所述類 別型變量劃分成R'個(gè)子空間,子空間中的采樣單元個(gè)數(shù)為對(duì)應(yīng)類別值所占的柵格單元數(shù)。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,在步驟S2中,所述n'個(gè)地理子空間的獲 取步驟包括: 獲取地理子空間在X軸方向上的間距dx以及在y軸方向上的間距dy,所述dx與dy的 計(jì)算公式如下:
具甲,xmin,x_,ymin,y_分別為很據(jù)米秤兇域的外接矩形的最小、最大X軸坐標(biāo)及最小、 最大y軸坐標(biāo),ns為X軸和y軸坐標(biāo)上的分段數(shù),所述ns的計(jì)算公式如下: ?_) m= ceilI^rect χη; 式中,ceilΟ函數(shù)表示大于自變量的最小整數(shù),S_t為采樣區(qū)域外接矩形面積,Ssara為 采樣區(qū)域面積,η為預(yù)設(shè)值; 根據(jù)所述dx與dy,將采樣區(qū)域外接矩形分割成nsXns個(gè)子矩形,利用子矩形與采樣區(qū) 域進(jìn)行疊加,去除與采樣區(qū)域沒有相交的子矩形,得到n'個(gè)地理子空間。
5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S3包括:所述步驟S3包括:從 η'個(gè)地理子空間中隨機(jī)選擇η個(gè)地理子空間,從η個(gè)地理子空間中的每個(gè)地理子空間中隨 機(jī)選擇一個(gè)采樣單元,得到η個(gè)采樣單元,所述η個(gè)采樣單元構(gòu)成初始采樣點(diǎn)布局?jǐn)?shù)據(jù)。
6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S4包括:根據(jù)所述初始采樣點(diǎn) 布局?jǐn)?shù)據(jù),通過啟發(fā)式模擬算法一空間模擬退火算法,得到采樣點(diǎn)布局?jǐn)?shù)據(jù)。
【文檔編號(hào)】G06F17/30GK104239446SQ201410441570
【公開日】2014年12月24日 申請(qǐng)日期:2014年9月1日 優(yōu)先權(quán)日:2014年9月1日
【發(fā)明者】潘瑜春, 高秉博, 李淑華, 劉玉, 周艷兵, 郝星耀 申請(qǐng)人:北京農(nóng)業(yè)信息技術(shù)研究中心