基于深度回歸模型的遙感水質(zhì)監(jiān)測(cè)方法
【專利摘要】本發(fā)明公開了一種基于深度回歸模型的遙感水質(zhì)監(jiān)測(cè)方法,對(duì)待處理遙感圖像預(yù)處理,得到選定水體的遙感數(shù)據(jù);對(duì)監(jiān)測(cè)水體區(qū)域采樣點(diǎn)進(jìn)行采樣,得到采樣點(diǎn)的實(shí)際水質(zhì)參數(shù)和對(duì)應(yīng)的遙感數(shù)據(jù);將所有采樣點(diǎn)的實(shí)際水質(zhì)參數(shù)和遙感數(shù)據(jù)作為訓(xùn)練樣本,利用多層自動(dòng)編碼機(jī)逐層進(jìn)行訓(xùn)練,得到每層自動(dòng)編碼機(jī)的輸出,直至最后一層自動(dòng)編碼機(jī)訓(xùn)練完畢,得到多層自動(dòng)編碼機(jī)的輸出;最后將該多層自動(dòng)編碼機(jī)的輸出利用支持向量機(jī)回歸算法反演水質(zhì)參數(shù),得到水質(zhì)回歸模型;利用水質(zhì)回歸模型對(duì)待處理遙感圖像進(jìn)行反演,得到待處理遙感圖像中水體需要監(jiān)測(cè)項(xiàng)目的濃度值。本方法對(duì)各種水體適應(yīng)性好、監(jiān)測(cè)精度高、適合長(zhǎng)期連續(xù)監(jiān)測(cè)。
【專利說(shuō)明】
基于深度回歸模型的遙感水質(zhì)監(jiān)測(cè)方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及水質(zhì)監(jiān)測(cè),具體指一種基于深度回歸模型的遙感水質(zhì)監(jiān)測(cè)方法,屬于 水質(zhì)監(jiān)測(cè)分析技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 水是自然環(huán)境中最重要的影響因子之一,是人類生產(chǎn)、生活不可缺少的重要資源 之一,水質(zhì)的好壞直接關(guān)系到人類的生存與發(fā)展。水質(zhì)監(jiān)測(cè)是水質(zhì)評(píng)價(jià)與水污染防治的主 要依據(jù),隨著水體污染問(wèn)題的日益嚴(yán)重,水質(zhì)污染問(wèn)題成為了社會(huì)經(jīng)濟(jì)可持續(xù)發(fā)展必須解 決的重大問(wèn)題,尤其是內(nèi)陸水體,其水質(zhì)好壞直接影響到國(guó)民生產(chǎn)和人們的日常生活。因 此,準(zhǔn)確、快捷的水質(zhì)監(jiān)測(cè)顯得尤為重要。
[0003] 常規(guī)監(jiān)測(cè)手段通常是在水域內(nèi)定點(diǎn)定剖面,常年累月進(jìn)行監(jiān)測(cè),采樣進(jìn)行物理和 化學(xué)分析才能得到準(zhǔn)確的水質(zhì)信息,受人力、物力和氣候、水文條件的限制,采集的數(shù)據(jù)量 不可能太多,對(duì)于整個(gè)水域而言,這些監(jiān)測(cè)點(diǎn)數(shù)據(jù)只具有局部和典型的代表意義,但是對(duì)于 大多數(shù)區(qū)域的水質(zhì)的狀況并不能反映出來(lái),且成本高、速度慢、難于長(zhǎng)時(shí)間跟蹤監(jiān)測(cè),不能 給出這些表面水質(zhì)指標(biāo)在空間和時(shí)間上的分布狀況,不能及時(shí)的全面反映水域生態(tài)環(huán)境的 變化。隨著遙感技術(shù)的發(fā)展,尤其是遙感行業(yè)與光譜分辨率的提高,為應(yīng)用遙感技術(shù)進(jìn)行水 體污染監(jiān)測(cè)和研究開辟了新途徑。利用衛(wèi)星遙感信息進(jìn)行大面積范圍內(nèi)水質(zhì)空間分布及動(dòng) 態(tài)的定量分析,能夠在一定程度上彌補(bǔ)水面采樣觀測(cè)時(shí)空間隔大且費(fèi)時(shí)的缺陷,還能發(fā)現(xiàn) 常規(guī)方法難以揭示的污染物排放源、迀移擴(kuò)散方向、影響范圍以及與清潔水混合解釋的特 征,有利于查明污染物的來(lái)龍去脈,為科學(xué)地布設(shè)地面監(jiān)測(cè)點(diǎn)提供依據(jù),衛(wèi)星遙感還以其特 有的周期性優(yōu)勢(shì)成為持久監(jiān)測(cè)區(qū)域乃至全球尺度上湖泊,水庫(kù)的有效手段。利用遙感技術(shù) 進(jìn)行水質(zhì)監(jiān)測(cè)主要是由于被污染水體具有獨(dú)特的有別于清潔水體的光譜特征,這些光譜特 征在于其特定波長(zhǎng)的光的吸收或反射,而且這些光譜特征能夠?yàn)檫b感器所捕獲并在遙感圖 像中體現(xiàn)出來(lái)。由于遙感圖像具有直觀明了、宏觀性強(qiáng)的特點(diǎn),能清楚地反映出區(qū)域或整個(gè) 流域污染現(xiàn)狀和空間分布特征。利用多時(shí)相遙感數(shù)據(jù)還可以對(duì)同一流域水體污染歷史和污 染趨勢(shì)做出研究和預(yù)測(cè),為水資源保護(hù)和規(guī)劃以及可持續(xù)發(fā)展提供動(dòng)態(tài)基礎(chǔ)數(shù)據(jù)和科學(xué)決 策依據(jù)。
[0004] 在水質(zhì)預(yù)測(cè)研究初期,主要采用一些簡(jiǎn)單的時(shí)間序列預(yù)測(cè)方法,包括移動(dòng)平均法、 指數(shù)平滑法、馬爾可夫預(yù)測(cè)法和回歸預(yù)測(cè)法等。這些方法在分析未來(lái)的結(jié)果與過(guò)去、現(xiàn)在各 種因素之間的關(guān)系時(shí),效果比較好,且數(shù)據(jù)處理簡(jiǎn)單,但需要時(shí)間穩(wěn)定延續(xù),并不適合長(zhǎng)期 預(yù)測(cè),并且數(shù)據(jù)需要服從特殊的統(tǒng)計(jì)分布,只能按相同規(guī)律構(gòu)建線性模型。
[0005] 但是,實(shí)際應(yīng)用中水質(zhì)時(shí)間序列呈現(xiàn)非線性模型,主要預(yù)測(cè)方法有:灰色預(yù)測(cè)方 法、人工神經(jīng)網(wǎng)絡(luò)、混沌理論、支持向量機(jī)算法等。灰色系統(tǒng)是鄧聚龍教授于1982年提出的, 在分析一些貧信息系統(tǒng)時(shí)具有較好的適應(yīng)性,主要缺點(diǎn)是數(shù)據(jù)灰度越高,預(yù)測(cè)精度越低,不 適合長(zhǎng)期預(yù)測(cè)。人工神經(jīng)網(wǎng)絡(luò)在高精確的非線性映射中,具有較強(qiáng)的自適應(yīng)能力,運(yùn)用BP神 經(jīng)網(wǎng)絡(luò)模型構(gòu)建了河流地表水中有機(jī)物和其主要影響因素間的映射關(guān)系,其預(yù)測(cè)結(jié)果客 觀,具有較強(qiáng)泛化能力,但BP神經(jīng)網(wǎng)絡(luò)在樣本不足時(shí),計(jì)算精度不高,同時(shí)神經(jīng)網(wǎng)絡(luò)常因結(jié) 構(gòu)過(guò)大而容易出現(xiàn)"過(guò)擬合"。支持向量機(jī)是一種以結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則為基礎(chǔ)的機(jī)器學(xué)習(xí) 方法,在解決非線性、小樣本及高維數(shù)問(wèn)題中展現(xiàn)出很多特有的優(yōu)勢(shì),近年支持向量機(jī)在水 質(zhì)預(yù)測(cè)中,取得了較大的成果,但核函數(shù)和參數(shù)選取困難,同時(shí)模型對(duì)不同水質(zhì)數(shù)據(jù)特點(diǎn)的 適應(yīng)性差。
[0006] 2006年,加拿大多倫多大學(xué)Hinton教授建立了深度學(xué)習(xí)模型,它通過(guò)模擬建立人 腦的分層模型結(jié)構(gòu),能對(duì)原始數(shù)據(jù)逐級(jí)提取出由底層到高層更加抽象的特征。由于深度學(xué) 習(xí)具有優(yōu)異的特征學(xué)習(xí)能力,得到的特征對(duì)數(shù)據(jù)有更本質(zhì)的刻劃。近年來(lái),不僅在理論驗(yàn)證 方面得到了成功,而且在實(shí)際應(yīng)用方面,也得到了巨大且迅速的推廣和發(fā)展。在理論模型方 面,主要分成了三種類型結(jié)構(gòu),其中包括生成性深度結(jié)構(gòu)、區(qū)分性深度結(jié)構(gòu)和混合型結(jié)構(gòu)。 在實(shí)際應(yīng)用方面,主要在語(yǔ)言識(shí)別和信號(hào)處理、物體識(shí)別、自然語(yǔ)言處理和多任務(wù)學(xué)習(xí)方面 得到了成功的應(yīng)用。目前,深度學(xué)習(xí)的模型主要有:受限玻爾茲曼機(jī)(Restricted Boltzmann Machine)及其深層模型--深度置信網(wǎng)絡(luò)(Deep Belief Network)、深度玻爾 茲曼機(jī)(Deep Boltzmann Machine);自動(dòng)編碼機(jī)(Autoencoder)、降噪自動(dòng)編碼機(jī) (Denoising Autoencoder)及其深層模型--堆棧自動(dòng)編碼機(jī)(Stacked Autoencoder); Pooling Unit以及卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks)等。
【發(fā)明內(nèi)容】
[0007] 針對(duì)現(xiàn)有技術(shù)存在的上述不足,本發(fā)明的目的在于提供一種基于深度回歸模型的 遙感水質(zhì)監(jiān)測(cè)方法,本方法對(duì)各種水體適應(yīng)性好、監(jiān)測(cè)精度高、適合長(zhǎng)期連續(xù)監(jiān)測(cè)。
[0008] 本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
[0009] 基于深度回歸模型的遙感水質(zhì)監(jiān)測(cè)方法,步驟如下,
[0010] 1)將遙感圖像數(shù)據(jù)導(dǎo)入計(jì)算機(jī),提取出包含需要監(jiān)測(cè)水體的矩形范圍作為待處理 遙感圖像;
[0011] 2)利用掩模矩陣對(duì)待處理遙感圖像每個(gè)波段進(jìn)行掩膜,并從每個(gè)波段中去掉光譜 值為〇的背景信息,再做歸一化處理,得到選定水體的遙感數(shù)據(jù);
[0012] 3)在監(jiān)測(cè)水體區(qū)域選取不同的點(diǎn)作為采樣點(diǎn),對(duì)采樣點(diǎn)進(jìn)行需要監(jiān)測(cè)項(xiàng)目的水質(zhì) 參數(shù)實(shí)地采集,得到采樣點(diǎn)的實(shí)際水質(zhì)參數(shù),并確定所有采樣點(diǎn)對(duì)應(yīng)的遙感數(shù)據(jù);采樣點(diǎn)的 實(shí)際水質(zhì)參數(shù)包含監(jiān)測(cè)項(xiàng)濃度較大,中等及較小的數(shù)據(jù)分布;
[0013] 4)將所有采樣點(diǎn)的實(shí)際水質(zhì)參數(shù)和采樣點(diǎn)的遙感數(shù)據(jù)作為訓(xùn)練樣本,利用多層自 動(dòng)編碼機(jī)逐層進(jìn)行訓(xùn)練,以逐層提取遙感水質(zhì)圖像的特征,從而得到每層自動(dòng)編碼機(jī)的輸 出,并作為下一層自動(dòng)編碼機(jī)的輸入;如此遞推,直至最后一層自動(dòng)編碼機(jī)訓(xùn)練完畢,得到 多層自動(dòng)編碼機(jī)的輸出;最后將該多層自動(dòng)編碼機(jī)的輸出利用支持向量機(jī)回歸算法反演水 質(zhì)參數(shù),得到水質(zhì)回歸模型;
[0014] 5)利用所構(gòu)建的水質(zhì)回歸模型對(duì)待處理遙感圖像進(jìn)行反演,得到待處理遙感圖像 中水體需要監(jiān)測(cè)項(xiàng)目的濃度值;根據(jù)其處于不同的濃度區(qū)間賦予不同的顏色,從而直觀顯 示整個(gè)水體水質(zhì)參數(shù)的濃度情況,實(shí)現(xiàn)水體水質(zhì)遙感監(jiān)測(cè)。
[0015] 第4)步多層自動(dòng)編碼機(jī)中每層自動(dòng)編碼機(jī)按如下方法訓(xùn)練,
[0016] 假設(shè)單層自動(dòng)編碼機(jī)輸入層x包含d個(gè)輸入神經(jīng)元,隱層y含有h個(gè)神經(jīng)元;重構(gòu)層z 含有與輸入層相同的神經(jīng)元數(shù)目;網(wǎng)絡(luò)中各個(gè)神經(jīng)元的激活函數(shù)設(shè)定為sigmoid函數(shù):
[0018] 在訓(xùn)練過(guò)程中,模型首先將輸入向量X(XGRd)映射到隱層中,以得到隱層特征y(y GR h),然后將隱層特征y(yGRh)映射到重構(gòu)層,得到重構(gòu)層特征z(ZGR d);這兩個(gè)映射環(huán)節(jié) 分別用如下兩個(gè)公式表示:
[0019] y = sigmoid (WyX+by) (2)
[0020] z = sigmoid(ffzy+bz) (3)
[0021] 其中Wy,Wz分別是輸入層-隱層以及隱層-重構(gòu)層的連接權(quán)值矩陣;by,b z是隱層與 重構(gòu)層每個(gè)神經(jīng)元的偏置;為了減少模型中需要訓(xùn)練的參數(shù),給出如下約束:
[0022] ffy=ffz=ff (4)
[0023]對(duì)于這樣的自動(dòng)編碼機(jī),訓(xùn)練就意味著學(xué)習(xí)模型中包含的三組參數(shù)W,by,bz;
[0024]模型的訓(xùn)練則是一個(gè)對(duì)該目標(biāo)函數(shù)的最優(yōu)化過(guò)程,即調(diào)節(jié)W,by,bz來(lái)最小化重構(gòu)的 輸出與輸入之間的差異;故確定這樣的目標(biāo)函數(shù): 「00251 ideal reconstruction = arg min [cosl(.v,z)] (5) L 」 汗'表,6:
[0026]這里的z在x給定的情況下取決于模型的參數(shù)W, by, bz; cost (x,z)是重建與輸入的 差異的度量,定義目標(biāo)函數(shù)為:
[0028] 式中,d代表輸入向量的大小,m代表每一份小批量數(shù)據(jù)的大小;xik或zik表示小批 量數(shù)據(jù)中的第i個(gè)輸入或重建的第k個(gè)元素;里層的求和是在輸入向量的維度上進(jìn)行的,而 外層的求和則是對(duì)于小批量數(shù)據(jù)的每一個(gè)樣本進(jìn)行;
[0029] 在確定好了優(yōu)化目標(biāo)函數(shù)以后,通過(guò)隨機(jī)梯度下降法來(lái)訓(xùn)練網(wǎng)絡(luò)側(cè)參數(shù),參數(shù)更 新的規(guī)則定義如下,其中n代表學(xué)習(xí)率:
[0033]推導(dǎo)式(7)~(9)的具體形式;
[0034]首先,用標(biāo)量形式重寫重構(gòu)的輸出:
[0038]式中(或)表示對(duì)于小批量數(shù)據(jù)中的第i個(gè)樣本,第p (或k)個(gè)隱層(或輸出 層)神經(jīng)元的凈輸入;
[0039]式(1)的一階和二階導(dǎo)數(shù)如下:
[0040] f'(x)=f(x)[l-f(x)] (13)
[0041] f,,(x)=f(x)[l-f(x)] [ l~2f (x) ] (14)
[0042]根據(jù)式(10)~(12),就可以計(jì)算重構(gòu)的輸出z對(duì)于W,by,bz三個(gè)參數(shù)的偏導(dǎo)數(shù);使用 標(biāo)量形式來(lái)表示這些偏導(dǎo)數(shù):
[0046]式中Wrs表示連接第r個(gè)輸入節(jié)點(diǎn)與第s個(gè)隱層節(jié)點(diǎn)的連接權(quán)值;byr、b zr代表第r個(gè) 隱層、輸出層節(jié)點(diǎn)的偏置;
[0047]綜合式(10)~(17),代價(jià)函數(shù)式(6)對(duì)于W,by,bz三個(gè)參數(shù)的偏導(dǎo)數(shù)表達(dá)式為:
[0049] 將這些表達(dá)式代入式(7)~(9),即可得到權(quán)值的更新公式;
[0050] 在訓(xùn)練完模型后,把隱層-重構(gòu)層挪去,隱層的輸出y即作為下一層自動(dòng)編碼機(jī)的 輸入,或者作為支持向量機(jī)回歸算法的輸入。
[0051] 第4)步支持向量回歸算法具體過(guò)程為,設(shè)訓(xùn)練樣本集S為{(Xl,yi),i = l,2,..., n},其中XiGRd為輸入向量,yi為輸出向量;對(duì)于非線性支持向量回歸,通過(guò)核函數(shù)k( Xi,Xj) 將輸入樣本空間非線性映射到高維特征空間進(jìn)行線性回歸,非線性回歸估計(jì)函數(shù)f(x〇可 表示為:
[0052] /(x,.) = u'?滬(x.,.) + b (19)
[0053] 式(19)中w卞(X,)表示向量w與供(xj的內(nèi)積,w為權(quán)值向量,為非線性映射函數(shù),b 為閾值,bGR;
[0054] 為使支持向量回歸保持較好的稀疏性,引入不敏感損失函數(shù)£最小化經(jīng)驗(yàn)風(fēng)險(xiǎn),得 到損失函數(shù)為
[0055] c(x,y,f)= |y-f(x) |e=max{0, |y-f(x) |-e} (20)
[0056] 若點(diǎn)x的觀察值y和回歸預(yù)測(cè)函數(shù)值f(x)之間的差別小于£時(shí),損失為0;
[0057]為求解支持向量回歸函數(shù)中的w與b,在滿足不敏感損失函數(shù)e前提下將 '最小
化;引入松弛變量1,〇0,進(jìn)一步將式(19)轉(zhuǎn)化為如下優(yōu)化問(wèn)題:
(21)
[0059] 其中約束條件為:
[0060] ?=' - vf. + w ) + < £* + (22) / = 1,2,…,EL
[0061] 式(22)中,C為懲罰因子,用于平衡模型復(fù)雜項(xiàng)和訓(xùn)練誤差項(xiàng)的權(quán)重參數(shù),C越大表 示對(duì)訓(xùn)練誤差大于e的樣本懲罰越大;不敏感損失函數(shù)%規(guī)定了回歸函數(shù)的誤差要求 都為松弛變量。
[0062] 將Lagrange函數(shù)引入式(21 ),用核函數(shù)K (xi,xj)將高維空間內(nèi)積運(yùn)算通過(guò)原空間 運(yùn)算來(lái)實(shí)現(xiàn),有 n
[0063] u' = Z(a,. - G,*)辦x,) Z-1
[0064] 以和以為拉格朗日算子,(ai_c〇辛0的訓(xùn)練樣本為支持向量,得到回歸函數(shù): n,
[0065] /(x) = U'.供(x) + b = [[cf,. -< |人'(>,.,x) + b ^24) /-i
[0066] 式(24)中n為支持向量個(gè)數(shù),核函數(shù)采用高斯徑向基(RBF)函數(shù):
[0067] K(Xi,Xj) = exp{_ | Xi_Xj 12/(2〇2)} (25)〇
[0068] 相比現(xiàn)有技術(shù),本發(fā)明具有如下有益效果:
[0069] (1)提出了一種基于深度回歸的遙感水質(zhì)監(jiān)測(cè)方法。遙感圖像數(shù)據(jù)呈現(xiàn)復(fù)雜的非 線性分布,與傳統(tǒng)的淺層回歸模型相比,運(yùn)用深度學(xué)習(xí)方法可以挖掘出隱藏其中的本質(zhì)規(guī) 律,消除波段的相關(guān)性,降低冗余度,為建立效果良好的水質(zhì)反演模型提供了有力的保證。
[0070] (2)建立了一種適用于小樣本的非線性水質(zhì)反演模型,即利用深度學(xué)習(xí)得到少量 水質(zhì)遙感數(shù)據(jù)的本質(zhì)特征,并對(duì)本質(zhì)特征數(shù)據(jù)點(diǎn)和對(duì)應(yīng)的水質(zhì)參數(shù)實(shí)地監(jiān)測(cè)數(shù)據(jù)利用支持 向量回歸算法進(jìn)行學(xué)習(xí),得到適合整個(gè)水體的水質(zhì)反演模型。適用于對(duì)地面樣本數(shù)據(jù)少的 水質(zhì)遙感圖像進(jìn)行水質(zhì)評(píng)價(jià)和動(dòng)態(tài)監(jiān)測(cè)。
【附圖說(shuō)明】
[0071] 圖1-自動(dòng)編碼機(jī)結(jié)構(gòu)示意圖。
[0072]圖2-堆棧自動(dòng)編碼回歸模型示意圖。
[0073]圖3-基于深度回歸模型的遙感水質(zhì)檢測(cè)流程圖。
[0074]圖4_渭河流域不意圖。
[0075]圖5-渭河流域的遙感影像。
[0076]圖6-3組測(cè)試樣本反演結(jié)果。
[0077]圖7-13組監(jiān)測(cè)數(shù)據(jù)的反演結(jié)果。
[0078] 圖8-整個(gè)水體氨氮參數(shù)的濃度分布圖。
【具體實(shí)施方式】
[0079] 為能全面有效地監(jiān)測(cè)某水域的水質(zhì)質(zhì)量,本發(fā)明提出了一種深度回歸模型遙感水 質(zhì)監(jiān)測(cè)方法,根據(jù)堆棧自動(dòng)編碼機(jī)的基本原理,構(gòu)建了基于堆棧自動(dòng)編碼回歸(Stacked Autoencoder Regression,SAER)的遙感水質(zhì)監(jiān)測(cè)模型,并用該模型對(duì)真實(shí)的遙感圖像進(jìn)行 了水質(zhì)參數(shù)反演,得到了水質(zhì)質(zhì)量分布情況圖。
[0080] 下面結(jié)合附圖對(duì)本發(fā)明基于深度回歸模型的遙感水質(zhì)監(jiān)測(cè)方法各步驟進(jìn)行詳細(xì) 說(shuō)明,具體可結(jié)合圖3。
[0081] 1)將遙感圖像數(shù)據(jù)導(dǎo)入計(jì)算機(jī),提取出包含需要監(jiān)測(cè)水體范圍作為待處理遙感圖 像;
[0082] 2)利用掩模矩陣對(duì)待處理遙感圖像每個(gè)波段進(jìn)行掩膜,并從每個(gè)波段中去掉光譜 值為〇的背景信息,再做歸一化處理,得到選定水體的遙感數(shù)據(jù);
[0083] 3)在監(jiān)測(cè)水體區(qū)域選取不同的點(diǎn)作為采樣點(diǎn),對(duì)采樣點(diǎn)進(jìn)行需要監(jiān)測(cè)項(xiàng)目的水質(zhì) 參數(shù)實(shí)地采集,得到采樣點(diǎn)的實(shí)際水質(zhì)參數(shù),并確定所有采樣點(diǎn)對(duì)應(yīng)的遙感數(shù)據(jù);
[0084] 4)將所有采樣點(diǎn)的實(shí)際水質(zhì)參數(shù)和采樣點(diǎn)的遙感數(shù)據(jù)作為訓(xùn)練樣本,利用多層自 動(dòng)編碼機(jī)逐層進(jìn)行訓(xùn)練,以逐層提取遙感水質(zhì)圖像的特征,從而得到每層自動(dòng)編碼機(jī)的輸 出,并作為下一層自動(dòng)編碼機(jī)的輸入;如此遞推,直至最后一層自動(dòng)編碼機(jī)訓(xùn)練完畢,得到 多層自動(dòng)編碼機(jī)的輸出;最后將該多層自動(dòng)編碼機(jī)的輸出利用支持向量機(jī)回歸算法反演水 質(zhì)參數(shù),得到水質(zhì)回歸模型;
[0085] 5)利用所構(gòu)建的水質(zhì)回歸模型對(duì)待處理遙感圖像進(jìn)行反演,得到待處理遙感圖像 中水體需要監(jiān)測(cè)項(xiàng)目的濃度值;根據(jù)其處于不同的濃度區(qū)間賦予不同的顏色,從而直觀顯 示整個(gè)水體水質(zhì)參數(shù)的濃度情況,實(shí)現(xiàn)水體水質(zhì)遙感監(jiān)測(cè)。
[0086]在步驟4)中,本發(fā)明用到了自動(dòng)編碼機(jī)、堆棧自動(dòng)編碼回歸和支持向量機(jī)回歸算 法。下面分別對(duì)其進(jìn)行詳細(xì)說(shuō)明。
[0087] 一、自動(dòng)編碼機(jī)
[0088] 自動(dòng)編碼機(jī)是一種數(shù)據(jù)驅(qū)動(dòng)的、非監(jiān)督地學(xué)習(xí)數(shù)據(jù)特征的神經(jīng)網(wǎng)絡(luò)模型,其結(jié)構(gòu) 如圖1所示??梢园阉闯墒且粋€(gè)輸出節(jié)點(diǎn)數(shù)與輸入節(jié)點(diǎn)數(shù)相等的多層神經(jīng)網(wǎng)絡(luò)。在輸入-隱層中,模型將計(jì)算數(shù)據(jù)(圖中用x表示)在各個(gè)隱層節(jié)點(diǎn)上的值(圖中用y表示)。這些值構(gòu) 成了數(shù)據(jù)的特征,也稱作"表達(dá)"。在隱層一輸出層中,則根據(jù)這一組特征的值重新恢復(fù)出輸 入數(shù)據(jù)(圖中用Z表示)。在重建Z的過(guò)程中,只用了特征y而沒有用輸入X,因此,所有Z中的信 息都只由y得來(lái);正因如此,y中是否保留了足夠多的輸入信息即可通過(guò)Z的重建質(zhì)量來(lái)評(píng) 價(jià)。因此,提取特征的過(guò)程就可以被這么設(shè)定:訓(xùn)練這樣一個(gè)神經(jīng)網(wǎng)絡(luò),使得它重建得到的 輸出與輸入盡可能地一致。這樣的模型使得可以根據(jù)數(shù)據(jù)本身來(lái)無(wú)監(jiān)督地訓(xùn)練網(wǎng)絡(luò)。
[0089] 假設(shè)自動(dòng)編碼機(jī)包含d個(gè)輸入神經(jīng)元,隱藏層y則含有h個(gè)神經(jīng)元。重建層z含有與 輸入層相同的神經(jīng)元數(shù)目。網(wǎng)絡(luò)中各個(gè)神經(jīng)元的激活函數(shù)設(shè)定為sigmoid函數(shù):
[0091]在訓(xùn)練過(guò)程中,模型首先將輸入向量X(xGRd)映射到隱層中,以得到隱層特征y(y GRh)這一步所對(duì)應(yīng)的網(wǎng)絡(luò)如圖1中框線內(nèi)部分所示。稱這部分網(wǎng)絡(luò)為"編碼器"。然后y被下 一層網(wǎng)絡(luò)(稱為"解碼器")映射到輸出層,稱這一層的輸出為"重建的輸出" Z(ZGRd)。這兩 個(gè)步驟可以用如下兩個(gè)公式表示:
[0092] y = sigmoid (WyX+by) (2)
[0093] z = sigmoid(ffzy+bz) (3)
[0094] 其中Wy,Wz分別是輸入一隱層,隱層一輸出層的連接權(quán)值矩陣;層與輸出層每個(gè)神 經(jīng)元的偏置。為了減少模型中需要訓(xùn)練的參數(shù),b y,bz是隱給出如下約束:
[0095] ffy=ffz=ff (4)
[0096] 此時(shí)稱這樣的自動(dòng)編碼機(jī)具有"約束的權(quán)值"。因此,對(duì)于這樣的自動(dòng)編碼機(jī),訓(xùn)練 就意味著學(xué)習(xí)模型中包含的三組參數(shù)W,by,b z。
[0097] 模型的訓(xùn)練則是一個(gè)對(duì)該目標(biāo)函數(shù)的最優(yōu)化過(guò)程。即調(diào)節(jié)W,by,bz來(lái)最小化重建的 輸出與輸入之間的差異。所以可以確定這樣的目標(biāo)函數(shù):
[0098] ideal reconstruction = ax廷 min [cosl(.v, z)] (5)
[0099] 這里的z在x給定的情況下取決于模型的參數(shù)1,匕,132。(3〇#(^2)是重建與輸入的 差異的度量,本文使用這兩者之間的互熵來(lái)度量這種差異。在實(shí)際的實(shí)現(xiàn)中,權(quán)值的更新是 基于小批量數(shù)據(jù)的。即,累積一小批數(shù)據(jù)的差異后再更新權(quán)值。這樣的做法有助于提高算法 在處理大規(guī)模數(shù)據(jù)時(shí)的學(xué)習(xí)速率。即定義的目標(biāo)函數(shù)為:
[0101 ]式中,d代表輸入向量的大小,m代表每一份小批量數(shù)據(jù)的大小。Xik(或Zik)表不小 批量數(shù)據(jù)中的第i個(gè)輸入(或重建)的第k個(gè)元素。里層的求和是在輸入向量的維度上進(jìn)行 的;而外層的求和則是對(duì)于小批量數(shù)據(jù)的每一個(gè)樣本進(jìn)行。
[0102]在確定好了優(yōu)化目標(biāo)及罰函數(shù)以后,可以通過(guò)隨機(jī)梯度下降法來(lái)訓(xùn)練網(wǎng)絡(luò)側(cè)參 數(shù)。參數(shù)更新的規(guī)則定義如下(其中n代表學(xué)習(xí)率):
[0106] 現(xiàn)在推導(dǎo)式(7)~(9)的具體形式。這之中最重要的部分即是對(duì)罰函數(shù)對(duì)于三個(gè)參 數(shù)W,by,bz與偏導(dǎo)數(shù)形式的推導(dǎo)。
[0107] 首先,用標(biāo)量形式重寫重建的輸出:
[0108] n《,=U+byP 〇°) h
[0109] 船G ) +/!」' (11) 產(chǎn) 1
[0110] Zik = f (〇 'f{twtpf + byp、+ b:k) (12) #=1 t/=l
[0111] 式中〃<(或€校)表示對(duì)于小批量數(shù)據(jù)中的第i個(gè)樣本,第p(或k)個(gè)隱層(或輸出 層)神經(jīng)元的凈輸入。
[0112]式(1)的一階和二階導(dǎo)數(shù)如下:
[0113] f ,(x)=f(x)[l-f(x)] (13)
[0114] f,,(x)=f(x)[l-f(x)] [ l~2f (x) ] (14)
[0115]根據(jù)式(10)~(12),就可以計(jì)算重建的輸出z對(duì)于W,by,bz三個(gè)參數(shù)的偏導(dǎo)數(shù)。為了 簡(jiǎn)化標(biāo)記,依然使用標(biāo)量形式來(lái)表示這些偏導(dǎo)數(shù):
[0119] 式中Wrs表示連接第r個(gè)輸入節(jié)點(diǎn)與第s個(gè)隱層節(jié)點(diǎn)的連接權(quán)值。byr (或bzr)代表第r 個(gè)隱層(輸出層)節(jié)點(diǎn)的偏置。
[0120] 綜合式(10)~(17},代價(jià)函數(shù)(式(6))對(duì)于W,by,bz三個(gè)參數(shù)的偏導(dǎo)數(shù)表達(dá)式為:
[0122] 將這些表達(dá)式代入式(7)~(9},即可得到權(quán)值的更新公式。
[0123] 在訓(xùn)練完模型后,把隱層一輸出層挪去,隱層的輸出y即可作為下一層某個(gè)分類器 的輸入,或者輸出給下一級(jí)的自動(dòng)編碼機(jī)。
[0124] 自動(dòng)編碼機(jī)這一模型的優(yōu)勢(shì)即在于這種基于重建的訓(xùn)練。值得注意的是,在重建 的過(guò)程中,只利用了隱藏層的特征y,而y是在編碼機(jī)中由輸入得到的。如果模型可以由y成 功地重建輸入,那就意味著y這一組特征包含了來(lái)自輸入的足夠充分的信息。因此,學(xué)習(xí)所 得到的那個(gè)由權(quán)值和偏置所定義的非線性變換,即可被看作一個(gè)很好的非線性特征提取 器。
[0125] 二、堆棧自動(dòng)編碼回歸
[0126] 2.1堆棧自動(dòng)編碼回歸模型
[0127]堆棧自動(dòng)編碼回歸是指利用普通的自動(dòng)編碼機(jī)層疊后,再在頂層加上一個(gè)單層的 支持向量機(jī)回歸得到的整個(gè)深層神經(jīng)網(wǎng)絡(luò)回歸模型。這樣含有多層自動(dòng)編碼機(jī)的網(wǎng)絡(luò),可 以逐層地提取遙感水質(zhì)圖像的特征,得到深層更抽象更具可分性的特征,最后利用支持向 量回歸反演水質(zhì)參數(shù)。
[0128] 如圖2示出了一個(gè)含有3個(gè)堆疊起來(lái)的自動(dòng)編碼機(jī)與一個(gè)支持向量回歸所構(gòu)成的 堆棧自動(dòng)編碼回歸模型。該網(wǎng)絡(luò)一共含有5層,將初始的輸入數(shù)據(jù)轉(zhuǎn)化為了輸出層水質(zhì)參數(shù) 的濃度值。第一層自動(dòng)編碼機(jī)將第〇層的輸入映射成為第1層上的特征。訓(xùn)練這層網(wǎng)絡(luò)的方 法與前面所介紹的訓(xùn)練單層的自動(dòng)編碼機(jī)方法相同,訓(xùn)練后只保留了編碼機(jī)部分的網(wǎng)絡(luò)。 當(dāng)訓(xùn)練完第一層自動(dòng)編碼機(jī)后,下一層的自動(dòng)編碼機(jī)將第一層的特征映射為第二層上的特 征。訓(xùn)練方法也與單層自動(dòng)編碼機(jī)一樣,只是這時(shí)的輸入改為前一層己訓(xùn)練網(wǎng)絡(luò)的輸出。如 此遞推,直至將每一層自動(dòng)編碼機(jī)訓(xùn)練完畢。
[0129] 如此逐層地堆疊自動(dòng)編碼機(jī)可以在每一層上都最小化信息的損失。同時(shí),提取出 的特征逐層地變得更抽象、具有更好的不變性。這也是使用堆棧自動(dòng)編碼機(jī)用于提取深層 特征的出發(fā)點(diǎn)所在。
[0130] 2.2支持向量回歸
[0131 ] Vapnik等人于 1963年提出 了支持向量機(jī)(Support Vector Machines,SVM)原理。 SVM以VC維理論(統(tǒng)計(jì)學(xué))和結(jié)構(gòu)風(fēng)險(xiǎn)最小化為基礎(chǔ),憑借有限的樣本信息在訓(xùn)練樣本的學(xué) 習(xí)精度和正確識(shí)別任意樣本的能力,即模型復(fù)雜度和學(xué)習(xí)能力之間尋求最好的推廣能力。 SVM原理是在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上提出的一種機(jī)器學(xué)習(xí)方法,在許多領(lǐng)域都得到了推廣 和應(yīng)用。
[0132] 支持向量回歸(Support Vector Regression,SVR)是在SVM原理基礎(chǔ)上建立的一 種回歸技術(shù),在時(shí)間序列的預(yù)測(cè)、非線性建模與預(yù)測(cè)及優(yōu)化控制等方面,具有泛化能力強(qiáng)和 預(yù)測(cè)準(zhǔn)確度高等優(yōu)點(diǎn)。設(shè)訓(xùn)練樣本集3為{(^, 7〇4 = 1,2,...,11},其中^£1?(1為輸入向量, yi為輸出向量。對(duì)于非線性支持向量回歸,通過(guò)核函數(shù))x㈧')將輸入樣本空 間非線性映射到高維特征空間進(jìn)行線性回歸,非線性回歸估計(jì)函數(shù)f( Xl)可表示為:
[0133] /.(x,.) 十 b H9)
[0134] 式(19)中w,(x,)表示向量w與穿(X;)的內(nèi)積,w為權(quán)值向量,少為非線性映射函數(shù),b 為閾值,bGR。
[0135] 為使支持向量回歸保持較好的稀疏性,引入不敏感損失函數(shù)£最小化經(jīng)驗(yàn)風(fēng)險(xiǎn),得 到損失函數(shù)為
[0136] c(x,y,f)= |y-f(x) |e=max{0, |y-f(x) |-e} (20)
[0137] 若點(diǎn)x的觀察值y和回歸預(yù)測(cè)函數(shù)值f(x)之間的差別小于£時(shí),損失為0。
[0138] 為求解支持向量回歸函數(shù)中的w與b,在滿足不敏感損失函數(shù)e前提下將4_|6>||2最小 化。引入松弛變量1,〇0,進(jìn)一步將式(19)轉(zhuǎn)化為如下優(yōu)化問(wèn)題:
(21)
[0140]其中約束條件為:
[0141] < -yi+w-(p{xi)Jrh<s + ^* (22) z' = l,2,"vn
[0142] 式(22)中,C為懲罰因子,用于平衡模型復(fù)雜項(xiàng)和訓(xùn)練誤差項(xiàng)的權(quán)重參數(shù),C越大表 示對(duì)訓(xùn)練誤差大于e的樣本懲罰越大。不敏感損失函數(shù)£,規(guī)定了回歸函數(shù)的誤差要求。
[0143] 將Lagrange函數(shù)引入式(21 ),用核函數(shù)K (xi,xj)將高維空間內(nèi)積運(yùn)算通過(guò)原空間 運(yùn)算來(lái)實(shí)現(xiàn),有 n:
[0144] u' = Z (?,. - 〇?(.'.) (23) i=l
[0145] c^Pc^為拉格朗日算子,(cu-O辛0的訓(xùn)練樣本為支持向量,得到回歸函數(shù): n
[0146] /(x) = u',(x)+b = Z[a,.-a,]AXx,,x) + b (24) /-I
[0147] 式(24)中n為支持向量個(gè)數(shù),核函數(shù)采用高斯徑向基(RBF)函數(shù):
[0148] K(xi,xj) = exp{_ | Xi_Xj 12/(2〇2)} (25)
[0149] 以下結(jié)合具體實(shí)施例對(duì)本發(fā)明所涉及監(jiān)測(cè)方法進(jìn)行詳細(xì)說(shuō)明。
[0150] 渭河流域是陜西省的人口密集地帶和重要工業(yè)基地,流域內(nèi)集中了全省61%的人 口和上千家工礦企業(yè),其工業(yè)總產(chǎn)值占全省82%,城市生活污水和工業(yè)污水多以排入支流 后排入渭河。渭河沿岸工業(yè)企業(yè)集中,城鎮(zhèn)人口密集,自然是工業(yè)廢水和城市生活污水的主 要產(chǎn)區(qū),來(lái)自兩岸諸多點(diǎn)源的廢污水,將渭河作為唯一的排泄通道,自上而下排量沿程不斷 增加,水污染超標(biāo)程度不斷增加。根據(jù)環(huán)境監(jiān)測(cè)部門監(jiān)測(cè)顯示,1998年,全省廢污水年排放 量為7.03億m 2,其中工業(yè)廢水3.45億m2,城鎮(zhèn)生活污水3.58億m2,而渭河干流兩岸納入的廢 水污水量達(dá)到5.52億m 2,占全省污水排放量的78.5%。在渭河全段尤其以洋河入渭河至零 河入渭河口段,即西安市區(qū)所在區(qū)段,年排放量達(dá)1.97億m 2,占渭河全程年排放量的40.3 % 其次為林家村至蔡家坡(即寶雞市所在區(qū)段),年廢污水量為1.25億m2,占渭河全程年排放 量的25.8%,咸陽(yáng)公路橋至洋河入渭河口段(即咸陽(yáng)市所在區(qū)段),年廢污水排放量為1.05 億m 2,占渭河全程年排放量的21.2% ;渭南市區(qū)所在河段,年廢污水排放量為0.6億m2,占渭 河全程排放量的12.2。另外據(jù)2005年統(tǒng)計(jì),陜西省境內(nèi)渭河干支流排污口增至290個(gè),這52 條大小河流,年廢污水排放量達(dá)8.07億m 2,占全省廢污水排放量的81.6%,與1998年相比, 年排放量增加2.54億m2,7年中平均每年以0.36億m 2的速度遞增。渭河流域水土流失嚴(yán)重,大 面積的水土流失對(duì)渭河水質(zhì)造成嚴(yán)重污染。農(nóng)藥、化肥的使用,大部分殘留隨著農(nóng)田退水和 地表徑流進(jìn)入水體,造成污染。一些工礦企業(yè)的工業(yè)廢棄物和垃圾隨意堆積在河灘或直接 傾入渭河中,造成了水體污染。多年調(diào)查統(tǒng)計(jì)數(shù)據(jù)表明:渭河是陜西省多條大河流中接納廢 污水量最多的河流,是污染最嚴(yán)重的河流。圖4為渭河流域示意圖。
[0151] 利用本發(fā)明對(duì)2006年渭河陜西段水質(zhì)遙感圖像數(shù)據(jù)進(jìn)行水質(zhì)監(jiān)測(cè)。2006年渭河陜 西段水質(zhì)遙感圖像有4個(gè)波段,共3451 X 3654個(gè)數(shù)據(jù)。選定[1260:2100,400:2300]范圍以包 含所有監(jiān)測(cè)點(diǎn),包括耿鎮(zhèn)和成陽(yáng)等地段,共841X1901個(gè)數(shù)據(jù),其中包含60944個(gè)水體數(shù)據(jù), 其遙感影像如圖5所示。同時(shí)獲取了 2000-2006年間渭河陜西段部分監(jiān)測(cè)點(diǎn)共13組水質(zhì)遙感 數(shù)據(jù)和對(duì)應(yīng)的實(shí)地監(jiān)測(cè)數(shù)據(jù),數(shù)據(jù)分布在渭河陜西段9個(gè)監(jiān)測(cè)斷面,水質(zhì)參數(shù)指標(biāo)包括各監(jiān) 測(cè)點(diǎn)的高錳酸鹽指數(shù)(C0D m)、氨氮(NH3-N)和重鉻酸鹽指數(shù)(C0DCT)等,由于渭河陜西段的污 染情況主要為有機(jī)物污染,因此在水質(zhì)參數(shù)指標(biāo)上首選耗氧有機(jī)物指標(biāo)及氧平衡指標(biāo),本 例選擇氨氮(NH 3-N)進(jìn)行數(shù)據(jù)分析和實(shí)驗(yàn)。
[0152] 具體步驟為:
[0153] 1)將遙感圖像數(shù)據(jù)讀入計(jì)算機(jī),并提取出包含水體的矩形范圍:計(jì)算機(jī)讀入2006 年渭河陜西段水質(zhì)遙感圖像,選定[1260: 2100,400:2300]的矩形范圍,得到包含所有監(jiān)測(cè) 點(diǎn)的遙感圖像。
[0154] 2)通過(guò)ENVI軟件平臺(tái),人工解譯生成掩模矩陣。利用掩模矩陣對(duì)遙感圖像每個(gè)波 段進(jìn)行掩膜,并從每個(gè)波段中去掉光譜值為〇的背景信息,再做歸一化處理,得到選定水體 60944行4列的遙感數(shù)據(jù)矩陣B= {xi,X2,…,xi,…,X6〇944}T,i G [1,60944],xi是第i個(gè)數(shù)據(jù)點(diǎn) 4個(gè)波段的光譜值構(gòu)成的列向量。
[0155] 3)采用獲取的13組水質(zhì)遙感數(shù)據(jù)和對(duì)應(yīng)的實(shí)地監(jiān)測(cè)數(shù)據(jù),從中選取10組數(shù)據(jù)作為 訓(xùn)練樣本,剩下的3組作為測(cè)試樣本??紤]到數(shù)據(jù)的大小不一致,為了使訓(xùn)練樣本和測(cè)試樣 本的數(shù)據(jù)分布較為均勻,盡量使訓(xùn)練樣本中的濃度數(shù)據(jù)能夠包含較大,中等及較小的數(shù)據(jù), 而測(cè)試樣本也符合這種分布。
[0156] 4)通過(guò)訓(xùn)練樣本對(duì)本發(fā)明的深度回歸模型進(jìn)行建模,在建模時(shí),網(wǎng)絡(luò)層數(shù)設(shè)置為 4,其中第一層為輸入層,中間二層為隱含層,最C后一層為輸出層。兩隱含層的節(jié)點(diǎn)數(shù)分別 為6和3,輸出層的懲罰參數(shù)和核參數(shù) 〇分別設(shè)置為50和5。
[0157] 5)根據(jù)構(gòu)建的模型,對(duì)測(cè)試樣本進(jìn)行反演,其反演結(jié)果如圖6所示,圖7為13組數(shù)據(jù) 的反演結(jié)果,根據(jù)圖5和圖6的反演結(jié)果可知,該模型能夠達(dá)到較理想的效果。其中:+ :代表 原數(shù)據(jù),即真實(shí)值;?:代表預(yù)測(cè)數(shù)據(jù)。
[0158] 6)利用所構(gòu)建的模型對(duì)渭河流域陜西段進(jìn)行反演,將整個(gè)水體水質(zhì)參數(shù)的濃度值 根據(jù)其處于不同的區(qū)間賦予不同的顏色,濃度值在0~4范圍內(nèi)的地段以綠色顯示;濃度值 在4~8范圍內(nèi)的地段以紅色顯示;濃度值在8~12范圍內(nèi)的地段以藍(lán)色顯示;濃度值超過(guò)12 的地段以紫色顯示;從而直觀顯示整個(gè)水體水質(zhì)參數(shù)的濃度情況,實(shí)現(xiàn)水體的水質(zhì)評(píng)價(jià)和 監(jiān)測(cè)。圖8為整個(gè)水體氨氮參數(shù)的濃度分布圖。
[0159] 7)為了更好的查看氨氮參數(shù)的濃度分布,可以將各個(gè)濃度區(qū)間內(nèi)的氨氮分別通過(guò) 圖進(jìn)行顯示。
[0160] 根據(jù)實(shí)驗(yàn)結(jié)果可知,咸陽(yáng)段的氨氮濃度值最高,這是由于沿河兩岸城鎮(zhèn)居民數(shù)量 居多,大量生活污水直接排入地表水體;農(nóng)業(yè)面源也是主要污染源,大量使用化肥農(nóng)藥導(dǎo)致 地表水體中氨氮濃度的升高;擁有多家工業(yè)企業(yè)(如咸陽(yáng)造紙廠、興平造紙廠)排放的污水, 也造成了氨氮濃度較大。與此同時(shí),河流上游地區(qū)取水灌溉,使河流的流量降低,河流的同 化、自凈能力減弱。
[0161]最后需要說(shuō)明的是,本發(fā)明的上述實(shí)例僅僅是為說(shuō)明本發(fā)明所作的舉例,而并非 是對(duì)本發(fā)明的實(shí)施方式的限定。盡管
【申請(qǐng)人】參照較佳實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說(shuō)明,對(duì) 于所屬領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在上述說(shuō)明的基礎(chǔ)上還可以做出其他不同形式的變化和 變動(dòng)。這里無(wú)法對(duì)所有的實(shí)施方式予以窮舉。凡是屬于本發(fā)明的技術(shù)方案所引申出的顯而 易見的變化或變動(dòng)仍處于本發(fā)明的保護(hù)范圍之列。
【主權(quán)項(xiàng)】
1. 基于深度回歸模型的遙感水質(zhì)監(jiān)測(cè)方法,其特征在于:步驟如下, 1) 將遙感圖像數(shù)據(jù)導(dǎo)入計(jì)算機(jī),提取出包含需要監(jiān)測(cè)水體的矩形范圍作為待處理遙感 圖像; 2) 利用掩模矩陣對(duì)待處理遙感圖像每個(gè)波段進(jìn)行掩膜,并從每個(gè)波段中去掉光譜值為 O的背景信息,再做歸一化處理,得到選定水體的遙感數(shù)據(jù); 3) 在監(jiān)測(cè)水體區(qū)域選取不同的點(diǎn)作為采樣點(diǎn),對(duì)采樣點(diǎn)進(jìn)行需要監(jiān)測(cè)項(xiàng)目的水質(zhì)參數(shù) 實(shí)地采集,得到采樣點(diǎn)的實(shí)際水質(zhì)參數(shù),并確定所有采樣點(diǎn)對(duì)應(yīng)的遙感數(shù)據(jù); 4) 將所有采樣點(diǎn)的實(shí)際水質(zhì)參數(shù)和采樣點(diǎn)的遙感數(shù)據(jù)作為訓(xùn)練樣本,利用多層自動(dòng)編 碼機(jī)逐層進(jìn)行訓(xùn)練,W逐層提取遙感水質(zhì)圖像的特征,從而得到每層自動(dòng)編碼機(jī)的輸出,并 作為下一層自動(dòng)編碼機(jī)的輸入;如此遞推,直至最后一層自動(dòng)編碼機(jī)訓(xùn)練完畢,得到多層自 動(dòng)編碼機(jī)的輸出;最后將該多層自動(dòng)編碼機(jī)的輸出利用支持向量機(jī)回歸算法反演水質(zhì)參 數(shù),得到水質(zhì)回歸模型; 5) 利用所構(gòu)建的水質(zhì)回歸模型對(duì)待處理遙感圖像進(jìn)行反演,得到待處理遙感圖像中水 體需要監(jiān)測(cè)項(xiàng)目的濃度值;根據(jù)其處于不同的濃度區(qū)間賦予不同的顏色,從而直觀顯示整 個(gè)水體水質(zhì)參數(shù)的濃度情況,實(shí)現(xiàn)水體水質(zhì)遙感監(jiān)測(cè)。2. 根據(jù)權(quán)利要求1所述的基于深度回歸模型的遙感水質(zhì)監(jiān)測(cè)方法,其特征在于:第3)步 采樣點(diǎn)的實(shí)際水質(zhì)參數(shù)包含監(jiān)測(cè)項(xiàng)濃度較大,中等及較小的數(shù)據(jù)分布。3. 根據(jù)權(quán)利要求1所述的基于深度回歸模型的遙感水質(zhì)監(jiān)測(cè)方法,其特征在于:第4)步 多層自動(dòng)編碼機(jī)中每層自動(dòng)編碼機(jī)按如下方法訓(xùn)練, 假設(shè)單層自動(dòng)編碼機(jī)輸入層X包含d個(gè)輸入神經(jīng)元,隱層y含有h個(gè)神經(jīng)元;重構(gòu)層Z含有 與輸入層相同的神經(jīng)元數(shù)目;網(wǎng)絡(luò)中各個(gè)神經(jīng)元的激活函數(shù)設(shè)定為sigmoid函數(shù):在訓(xùn)練過(guò)程中,模型首先將輸入向量X(XGRd)映射到隱層中,W得到隱層特征y(y G Rh),然后將隱層特征y(yGRh)映射到重構(gòu)層,得到重構(gòu)層特征Z(ZGRd);運(yùn)兩個(gè)映射環(huán)節(jié)分 別用如下兩個(gè)公式表示: y = sigmoid(WyX+by) (2) Z = sigmoid (Wzy+bz) (3) 其中Wy,Wz分別是輸入層-隱層W及隱層-重構(gòu)層的連接權(quán)值矩陣;by, bz是隱層與重構(gòu)層 每個(gè)神經(jīng)元的偏置;為了減少模型中需要訓(xùn)練的參數(shù),給出如下約束: Wy = Wz = W (4) 對(duì)于運(yùn)樣的自動(dòng)編碼機(jī),訓(xùn)練就意味著學(xué)習(xí)模型中包含的=組參數(shù)W,by,bz; 模型的訓(xùn)練則是一個(gè)對(duì)該目標(biāo)函數(shù)的最優(yōu)化過(guò)程,即調(diào)節(jié)W,by,bz來(lái)最小化重構(gòu)的輸出 與輸入之間的差異;故確定運(yùn)樣的目標(biāo)函數(shù):樹 運(yùn)里的Z在X給定的情況下取決于模型的參數(shù)W,by,bz;cost(x,z)是重建與輸入的差異 的度量,定義目標(biāo)函數(shù)為:式中,d代表輸入向量的大小,m代表每一份小批量數(shù)據(jù)的大小;Xi域Z化表示小批量數(shù)據(jù) 中的第i個(gè)輸入或重建的第k個(gè)元素;里層的求和是在輸入向量的維度上進(jìn)行的,而外層的 求和則是對(duì)于小批量數(shù)據(jù)的每一個(gè)樣本進(jìn)行; 在確定好了優(yōu)化目標(biāo)函數(shù)W后,通過(guò)隨機(jī)梯度下降法來(lái)訓(xùn)練網(wǎng)絡(luò)側(cè)參數(shù),參數(shù)更新的 規(guī)則定義如下,其中n代表學(xué)習(xí)率: 推導(dǎo)式(7)~(9)的具體形式;首先,用標(biāo)量形式重寫重構(gòu)的輸出:式中《6讀(或心每)表示對(duì)于小批量數(shù)據(jù)中的第i個(gè)樣本,第P(或k)個(gè)隱層(或輸出層)神 經(jīng)元的凈輸入; 式(1)的一階和二階導(dǎo)數(shù)如下: f'(x)=f(x)[l-f(x)] (13) r(x)=f(x)[l-f(x)][l-2f(x)] (14) 根據(jù)式(10)~(12),就可W計(jì)算重構(gòu)的輸出Z對(duì)于W,by,bzミ個(gè)參數(shù)的偏導(dǎo)數(shù);使用標(biāo)量 形式來(lái)表示運(yùn)些偏導(dǎo)數(shù):式中Wrs表示連接第r個(gè)輸入節(jié)點(diǎn)與第S個(gè)隱層節(jié)點(diǎn)的連接權(quán)值;byr、bzr代表第r個(gè)隱層、 輸出層節(jié)點(diǎn)的偏置; 綜合式(10)~(17),代價(jià)函數(shù)式(6)對(duì)于W,by,bz =個(gè)參數(shù)的偏導(dǎo)數(shù)表達(dá)式為:將運(yùn)些表達(dá)式代入式(7)~(9),即可得到權(quán)值的更新公式; 在訓(xùn)練完模型后,把隱層-重構(gòu)層挪去,隱層的輸出y即作為下一層自動(dòng)編碼機(jī)的輸入, 或者作為支持向量機(jī)回歸算法的輸入。4.根據(jù)權(quán)利要求1所述的基于深度回歸模型的遙感水質(zhì)監(jiān)測(cè)方法,其特征在于:第4)步 支持向量回歸算法具體過(guò)程為,設(shè)訓(xùn)練樣本集S為{佔(zhàn),71),1 = 1,2,...,11},其中義1£1?4為 輸入向量,yi為輸出向量;對(duì)于非線性支持向量回歸,通過(guò)核函數(shù)k(xi, Xj)將輸入樣本空間 非線性映射到高維特征空間進(jìn)行線性回歸,非線性回歸估計(jì)函數(shù)f(Xi)可表示為:(19) 式(19)中VV?口(X,.)表示向量W與界氏)的內(nèi)積,W為權(quán)值向量,(65為非線性映射函數(shù),b為闊 值,bGR; 為使支持向量回歸保持較好的稀疏性,引入不敏感損失函數(shù)e最小化經(jīng)驗(yàn)風(fēng)險(xiǎn),得到損 失函數(shù)為 c(x,y,f)= |y-f(x) I e=max{0, |y-f(x) |-e} (20) 若點(diǎn)X的觀察值y和回歸預(yù)測(cè)函數(shù)值f (X)之間的差別小于e時(shí),損失為0; 為求解支持向量回歸函數(shù)中的W與b,在滿足不敏感損失函數(shù)e前提下將最小化; 引入松弛變量1,〇0,進(jìn)一步將式(19)轉(zhuǎn)化為如下優(yōu)化問(wèn)題:(21) 其中約芽 (22) 式(22)中,C為懲罰因子,用于平衡模型復(fù)雜項(xiàng)和訓(xùn)練誤差項(xiàng)的權(quán)重參數(shù),C越大表示對(duì) 訓(xùn)練誤差大于e的樣本懲罰越大;不敏感損失函數(shù)e,規(guī)定了回歸函數(shù)的誤差要求;|,1聲良為 松弛變量。 將Lagrange函數(shù)引入式(21),用核函數(shù)K(xi,xj)將高維空間內(nèi)積運(yùn)算通過(guò)原空間運(yùn)算 來(lái)實(shí)現(xiàn),有(23) Qi和ai%拉格朗日算子,(ai-a乃聲0的訓(xùn)練樣本為支持向量,得到回歸函數(shù): (24) 式(24)中n為支持向量個(gè)數(shù),核函數(shù)采用高斯徑向基(RBF)函數(shù): K(xi,xj) = exp{-|xi-xj P/(202)} (25)。
【文檔編號(hào)】G06N5/02GK105912790SQ201610234580
【公開日】2016年8月31日
【申請(qǐng)日】2016年4月15日
【發(fā)明人】黃鴻, 羅甫林, 石光耀, 金瑩瑩
【申請(qǐng)人】重慶大學(xué)