本發(fā)明涉及地球化學領域,特別涉及一種地球化學數(shù)據(jù)異常信息的提取方法及系統(tǒng)。
背景技術:
現(xiàn)有的地球化學異常識別方法,需要事先要求地球化學數(shù)據(jù)滿足假定的分布形式,還需要設定固定閾值,在區(qū)分背景與異常的過程中并不能充分考慮元素組合的內(nèi)在相關性、數(shù)據(jù)的空間結構性以及區(qū)域分布上的周期性特征,并不能準確提取地球化學數(shù)據(jù)中的異常信息。
技術實現(xiàn)要素:
本發(fā)明提供了一種地球化學數(shù)據(jù)異常信息的提取方法及系統(tǒng),解決了現(xiàn)有技術不能準確提取地球化學數(shù)據(jù)中的異常信息的技術問題。
本發(fā)明解決上述技術問題的技術方案如下:一種地球化學數(shù)據(jù)異常信息的提取方法,包括:
s1、從地球化學數(shù)據(jù)集合中抽取多個樣品數(shù)據(jù),每個樣品數(shù)據(jù)均具有相同的變量組,所述變量組包含多個變量,將所述變量組設置為原始矩陣;
s2、將所述原始矩陣構造成反映所述地球化學數(shù)據(jù)集合中數(shù)據(jù)的實際空間分布信息的典型變量組合,將所述多個樣品數(shù)據(jù)的坐標構造成反映所述地球化學數(shù)據(jù)集合中數(shù)據(jù)的模擬空間分布信息的典型坐標組合;
s3、當所述典型變量組合與所述典型坐標組合滿足第一預設條件時,計算得到所述典型變量組合的第一系數(shù)與所述典型坐標組合的第二系數(shù);
s4、基于所述第一系數(shù)和所述第二系數(shù),當所述典型變量組合與所述典型坐標組合滿足第二預設條件時,計算得到第一常數(shù)向量與第二常數(shù)向量之間的關系式;
s5、基于所述第一系數(shù)、所述第二系數(shù)和所述第一常數(shù)向量與所述第二常數(shù)向量之間的關系式,當所述典型變量組合與所述典型坐標組合滿足第三預設條件時,得到所述地球化學數(shù)據(jù)集合的組合異常信息。
優(yōu)選地,步驟s1中,從地球化學數(shù)據(jù)集合中抽取n個樣品數(shù)據(jù),所述變量組包括m個變量,所述原始矩陣為x=(β1,β2,,βm),m和n均為正整數(shù)。
優(yōu)選地,步驟s2中,將所述原始矩陣構造成典型變量組合u=a1β1+a2β2+…+amβm,設所述第一系數(shù)a=(a1,a2,…,am),則u=xa。
優(yōu)選地,步驟s2中,設第i個樣品數(shù)據(jù)的坐標(xi,yi),i=1,2,…,n,j=1,2,…,m,設n個樣品數(shù)據(jù)的橫坐標x=(x1,x2,…,xn)和縱坐標y=(y1,y2,…,yn),用n個樣品數(shù)據(jù)的坐標的傅里葉有限項級數(shù)表達另一典型變量v:
將上式展開,得到
其中,k為x方向上的調和階數(shù),l為y方向上的調和階數(shù),αkl為第k階、l階調和的余弦-余弦項系數(shù),為bkl第k階、l階調和的正弦-余弦項系數(shù),ckl為第k階、l階調和的余弦-正弦項系數(shù),dkl為第k階、l階調和的正弦-正弦項系數(shù),m為x方向上的最高調和階數(shù),n為y方向上的最高調和階數(shù),l為x方向上取樣長度之半,h為y方向上取樣長度之半,p為正整數(shù)。
優(yōu)選地,步驟s3中,當u與υ滿足所述第一預設條件:u與υ的相關系數(shù)
優(yōu)選地,步驟s4中,將所述第一系數(shù)a和所述第二系數(shù)b代入q=||u-(c+dυ)||2,當q取最小值時,計算得到所述第一常數(shù)向量c與所述第二常數(shù)向量d的關系式c+dυ。
優(yōu)選地,步驟s5中,將所述第一系數(shù)a、所述第二系數(shù)b和所述關系式c+dυ代入r=u-(c+dυ),得到所述組合異常信息r。
一種地球化學數(shù)據(jù)異常信息的提取系統(tǒng),包括:
定義模塊,用于從地球化學數(shù)據(jù)集合中抽取多個樣品數(shù)據(jù),每個樣品數(shù)據(jù)均具有相同的變量組,所述變量組包含多個變量,將所述變量組設置為原始矩陣;
構造模塊,用于將所述原始矩陣構造成反映所述地球化學數(shù)據(jù)集合中數(shù)據(jù)的實際空間分布信息的典型變量組合,將所述多個樣品數(shù)據(jù)的坐標構造成反映所述地球化學數(shù)據(jù)集合中數(shù)據(jù)的模擬空間分布信息的典型坐標組合;
第一計算模塊,用于當所述典型變量組合與所述典型坐標組合滿足第一預設條件時,計算得到所述典型變量組合的第一系數(shù)與所述典型坐標組合的第二系數(shù);
第二計算模塊,用于基于所述第一系數(shù)和所述第二系數(shù),當所述典型變量組合與所述典型坐標組合滿足第二預設條件時,計算得到第一常數(shù)向量和第二常數(shù)向量;
綜合模塊,用于基于所述第一系數(shù)、所述第二系數(shù)、所述第一常數(shù)向量和所述第二常數(shù)向量,當所述典型變量組合與所述典型坐標組合滿足第三預設條件時,得到所述地球化學數(shù)據(jù)集合的組合異常信息。
附圖說明
圖1為本發(fā)明實施例提供的一種地球化學數(shù)據(jù)異常信息的提取方法的流程示意圖;
圖2為本發(fā)明另一實施例提供的一種地球化學數(shù)據(jù)異常信息的提取系統(tǒng)的結構示意圖。
具體實施方式
以下結合附圖對本發(fā)明的原理和特征進行描述,所舉實例只用于解釋本發(fā)明,并非用于限定本發(fā)明的范圍。
如圖1所示,一種地球化學數(shù)據(jù)異常信息的提取方法,包括:
s1、從地球化學數(shù)據(jù)集合中抽取多個樣品數(shù)據(jù),每個樣品數(shù)據(jù)均具有相同的變量組,變量組包含多個變量,將變量組設置為原始矩陣;
s2、將原始矩陣構造成反映地球化學數(shù)據(jù)集合中數(shù)據(jù)的實際空間分布信息的典型變量組合,將多個樣品數(shù)據(jù)的坐標構造成反映地球化學數(shù)據(jù)集合中數(shù)據(jù)的模擬空間分布信息的典型坐標組合;
s3、當?shù)湫妥兞拷M合與典型坐標組合滿足第一預設條件時,計算得到典型變量組合的第一系數(shù)與典型坐標組合的第二系數(shù);
s4、基于第一系數(shù)和第二系數(shù),當?shù)湫妥兞拷M合與典型坐標組合滿足第二預設條件時,計算得到第一常數(shù)向量與第二常數(shù)向量之間的關系式;
s5、基于第一系數(shù)、第二系數(shù)和第一常數(shù)向量與第二常數(shù)向量之間的關系式,當?shù)湫妥兞拷M合與典型坐標組合滿足第三預設條件時,得到地球化學數(shù)據(jù)集合的組合異常信息。
典型變量分析(canonicalvariateanalysis,cva),用來研究兩組或兩組以上的樣本內(nèi)的相互關系。
應理解,地質現(xiàn)象與過程均具有周期性的特征,因為所形成的各種地質痕跡均攜帶有這種特征,諸如地層、裙皺、構造斷裂、礦帶、礦床或礦體、元素分布以及海浪、地球的磁場變化等均表現(xiàn)出周期性重復現(xiàn)象,地質演替過程符合螺旋遞進法則。調和分析是研究這類現(xiàn)象的一種方法。每一種地質因子都具有其固有頻率,多種地質因子振幅的調和疊加,即可以綜合成各種比較復雜的波形。事實上,當調和的數(shù)目無限增大時就可以綜合成非常廣泛的—類周期函數(shù),并且當調和的項數(shù)和觀測點數(shù)足夠多時,可以任意地趨近實際曲線或實際曲面,如同用足夠高次的多項式按照任意的精確度來擬合實際曲線或實際曲面。反之,一類周期函數(shù)可以分解成若干個調和因子。調和分析實質上就是綜合、分析周期性現(xiàn)象的一種方法,對于研究周期性現(xiàn)象特別有效。對于沉積巖與變質巖建造等具有多旋回性或周期性分布的地質復合體而言,因其分布范圍較廣,涵蓋地質內(nèi)容較多,空間趨勢面模型一般以調和趨勢分析為主,即表達成三角級數(shù)多項式模型。
該方法不同于現(xiàn)有應用的地球化學異常識別方法,并不事先要求地球化學數(shù)據(jù)滿足假定的分布形式,也無需設定固定閾值,而是將地球化學背景看成一個連續(xù)起伏變化的自然空間曲面,意即每一樣品數(shù)據(jù)的地球化學背景值和異常閾值均為變化值,在區(qū)分背景與異常的過程中充分考慮元素組合的內(nèi)在相關性、數(shù)據(jù)的空間結構性以及區(qū)域分布上的周期性特征,由于這種方法的構造基礎是以非線性表達的,屬于非線性建模中的一種。大區(qū)域大樣本地球化學元素的組合信息較強于單元素提供的地球信息;地球化學異常識別方法不應以固定值來考慮地球化學背景,而應考慮為隨區(qū)域變化而確定為變化值,這樣才能保證在一個研究區(qū)內(nèi)可以同時考慮高背景的異常和低背景下有意義的弱小異常,即異常閾值也應考慮成變值。非線性多元調和因子方法綜合考慮了元素組合內(nèi)在相關性,數(shù)據(jù)的空間結構性及分布的周期性,較貼近于客觀實際,線性多元調和因子分析方法用于從區(qū)域變化的地球化學背景中識別地球化學異常。
具體地,步驟s1中,從地球化學數(shù)據(jù)集合中抽取n個樣品數(shù)據(jù),變量組包括m個變量,原始矩陣為x=(β1,β2,,βm),m和n均為正整數(shù)。
具體地,步驟s2中,將原始矩陣構造成典型變量組合u=a1β1+a2β2+…+amβm,設第一系數(shù)a=(a1,a2,…,am),則u=xa。
具體地,步驟s2中,設第i個樣品數(shù)據(jù)的坐標(xi,yi),i=1,2,…,n,j=1,2,…,m,設n個樣品數(shù)據(jù)的橫坐標x=(x1,x2,…,xn)和縱坐標y=(y1,y2,…,yn),將n個樣品數(shù)據(jù)的坐標的傅里葉有限項級數(shù)表達另一典型坐標組合v:
將上式展開,得到
其中,k為x方向上的調和階數(shù),l為y方向上的調和階數(shù),αkl為第k階、l階調和的余弦-余弦項系數(shù),為bkl第k階、l階調和的正弦-余弦項系數(shù),ckl為第k階、l階調和的余弦-正弦項系數(shù),dkl為第k階、l階調和的正弦-正弦項系數(shù),m為x方向上的最高調和階數(shù),n為y方向上的最高調和階數(shù),l為x方向上取樣長度之半,h為y方向上取樣長度之半,p為正整數(shù)。
應理解,構造典型坐標組合,能更好的體現(xiàn)觀測數(shù)據(jù)所具有的周期性特征。對于不同地質背景下的地球化學空間分布狀態(tài),更利于進行地球化學信息的識別。
具體地,步驟s3中,當u與υ滿足第一預設條件:u與υ的相關系數(shù)
應理解,相關系數(shù)是用以反映變量之間相關關系密切程度的統(tǒng)計指標。構造地球化學數(shù)據(jù)變量與坐標之間相關關系,充分體現(xiàn)數(shù)據(jù)的空間結構性。
具體地,步驟s4中,將第一系數(shù)a和第二系數(shù)b代入q=||u-(c+dυ)||2,當q取最小值時,計算得到第一常數(shù)向量c與第二常數(shù)向量d的關系式c+dυ。
具體地,步驟s5中,將第一系數(shù)a、第二系數(shù)b和關系式c+dυ代入r=u-(c+dυ),得到組合異常信息r。
在實施例中,設在研究區(qū)內(nèi)共抽取n個樣品,對每個樣品均考察m個變量指標,構成原始矩陣x=(βij)n×m=(β1,β2,…,βm),第i樣品坐標為(xi,yi),i=1,2,…,n。
將m個變量構造成典型變量組合:
u=a1β1+a2β2+…+amβm(1)
可令a=(a1,a2,…,am),則u=xa。
(1)式用來代表主礦化因子,再用坐標(x,y)的傅里葉有限項級數(shù)表達另一典型變量υ:
(2)式中,υ為關于坐標調和趨勢的典型組合;k為x方向上的調和階數(shù);l為y方向上的調和階數(shù);αkl為第k階、l階調和的余弦-余弦項系數(shù);bkl為第k階、l階調和的正弦-余弦項系數(shù);ckl為第k階、l階調和的余弦-正弦項系數(shù);dkl為第k階、l階調和的正弦-正弦項系數(shù);m為x方向上的最高調和階數(shù);n為y方向上的最高調和階數(shù);l為x方向上取樣長度之半,h為y方向上取樣長度之半。其中,設:
為方便起見,我們將(2)式υ中各項表達成z1,z2,…,zp。全部坐標(xi,yi)調和多項式構成矩陣z=(z1,z2,…,zp),則作典型坐標組合
可令b=(b1,b2,…,bm),則υ=zb。
現(xiàn)考察u與υ之間滿足最大相關條件,即
依(4)式求取兩典型組合的典型系數(shù),為此作增廣陣:
d=[x,z]n×p(5)
其中,x=(βij)n×m,z=(zij)n×p,兩者均是標準化后數(shù)據(jù)。
依(5)式,則d的協(xié)方差陣是:
則
業(yè)已證明,上述典型變量的典型系數(shù)a與b可通過求取如下矩陣的特征值與特征向量來完成。具體為:令
則(8)式中u與υ中的典型系數(shù)滿足如下關系:
根據(jù)問題的需要,a與b的選擇有一維與多維之分,不妨確定為r維,做法是在全部特征值λ序列中選前r個特征值之算術根:
λ1≥λ2≥…≥λr>0(10)
根據(jù)(8)(9)式,可得u1,u2,…,ur,及υ1,υ2,…,υm,對于其中uk,若
akj=max[akl]1≤l≤m(11)
將uk作為以元素xj為主的礦化因子。依具體的實際需要,這一步可適當?shù)膽谜?guī)方差極大旋轉處理。
考慮異常信息識別過程,由于υk是n維向量(υ'k1,υ'k2,…,υ'kn)作變換:
w=c+dυ(12)
(12)式中c、d為常數(shù)向量,則在
q=||u-w||2→min(13)
在(13)式條件下可求得c、d。
主礦化因子可表為:
u=f(x,y)+r=(c+dυ)+r(14)
其中,r即為組合異常。
對每個uk重復上述計算,可作k個剩余系列,k即是礦化因子的個數(shù),重復上述過程可獲取實際需要的若干主礦化因子異常信息。
應理解,由于地球化學行為過程是隨地理氣候及地貌特征變化而變化的,則元素空間分布必然呈現(xiàn)周期性特征;因此,元素地球化學背景在區(qū)域上呈現(xiàn)起伏振蕩形態(tài),這意味著不應以固定值來考慮地球化學背景的確定,而應考慮為隨區(qū)域變化而確定為變化值,這樣才能保證在一個研究區(qū)內(nèi)可以同時考慮高背景的異常和低背景下有意義的弱小異常,即異常閾值也應考慮成變值。將地球化學背景看成一個連續(xù)起伏變化的自然空間曲面,即每一樣品數(shù)據(jù)的地球化學背景值和異常閾值均為變化值,充分體現(xiàn)數(shù)據(jù)區(qū)域分布上的周期性特征。u代表區(qū)域地球化學樣品所反映出的實際空間分布情況,v代表的是區(qū)域上模擬的分布趨勢情況,是一種波動的趨勢。u與v之間的差異就是剩余的異常信息,即實際區(qū)域屬性信息去除波動趨勢信息后的差異信息。
如圖2所示,一種地球化學數(shù)據(jù)異常信息的提取系統(tǒng),包括:
定義模塊1,用于從地球化學數(shù)據(jù)集合中抽取多個樣品數(shù)據(jù),每個樣品數(shù)據(jù)均具有相同的變量組,變量組包含多個變量,將變量組設置為原始矩陣;
構造模塊2,用于將原始矩陣構造成反映地球化學數(shù)據(jù)集合中數(shù)據(jù)的實際空間分布信息的典型變量組合,將多個樣品數(shù)據(jù)的坐標構造成反映地球化學數(shù)據(jù)集合中數(shù)據(jù)的模擬空間分布信息的典型坐標組合;
第一計算模塊3,用于當?shù)湫妥兞拷M合與典型坐標組合滿足第一預設條件時,計算得到典型變量組合的第一系數(shù)與典型坐標組合的第二系數(shù);
第二計算模塊4,用于基于第一系數(shù)和第二系數(shù),當?shù)湫妥兞拷M合與典型坐標組合滿足第二預設條件時,計算得到第一常數(shù)向量和第二常數(shù)向量;
綜合模塊5,用于基于第一系數(shù)、第二系數(shù)、第一常數(shù)向量和第二常數(shù)向量,當?shù)湫妥兞拷M合與典型坐標組合滿足第三預設條件時,得到地球化學數(shù)據(jù)集合的組合異常信息。
以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。