基于徑向基神經(jīng)網(wǎng)絡(luò)的光譜分析模型轉(zhuǎn)移技術(shù)的制作方法
【專利摘要】本發(fā)明公開了一種基于徑向基神經(jīng)網(wǎng)絡(luò)的光譜分析模型轉(zhuǎn)移技術(shù),主要涉及了徑向基神經(jīng)網(wǎng)絡(luò)在光譜分析模型轉(zhuǎn)移技術(shù)上的應(yīng)用,這種引入徑向基神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)光譜轉(zhuǎn)移的技術(shù)能夠消除量測(cè)光譜間的非線性差異和光譜分段直接校正中出現(xiàn)的奇異銳峰,簡(jiǎn)化光譜模型轉(zhuǎn)移的參數(shù)選擇,整個(gè)操作過程精確、可靠。
【專利說明】
基于徑向基神經(jīng)網(wǎng)絡(luò)的光譜分析模型轉(zhuǎn)移技術(shù)
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及一種光譜分析模型轉(zhuǎn)移技術(shù),具體是指基于徑向基神經(jīng)網(wǎng)絡(luò)的光譜分 析模型轉(zhuǎn)移技術(shù)。
【背景技術(shù)】
[0002] 模型轉(zhuǎn)移技術(shù)就是將一臺(tái)儀器上建立的定性或定量校正模型可靠地移植到其它 相同或類似的儀器上使用,或?qū)⒃谀骋粭l件建立的模型用于同一臺(tái)儀器另一條件采集的光 譜;為節(jié)省建模費(fèi)用,在行業(yè)分析中,實(shí)現(xiàn)模型庫共享,進(jìn)而實(shí)現(xiàn)校正模型的可移植轉(zhuǎn)換就 非常有意義。
[0003] 雖然模型轉(zhuǎn)移后預(yù)測(cè)集的預(yù)測(cè)標(biāo)準(zhǔn)差與主儀器上直接建模的預(yù)測(cè)標(biāo)準(zhǔn)差存在一定 的差異,運(yùn)可能是由于CCD光譜儀與傅立葉變化光譜儀之間的差異有關(guān),另外在PDS模型轉(zhuǎn) 移過程中,由于算法內(nèi)部的局部模型利用化S或PCR對(duì)信息的有限提取計(jì)算來轉(zhuǎn)換系數(shù)和, 運(yùn)可能導(dǎo)致一部分信息的丟失,或是窗口光譜段的特征值交換化igenvalus Swapping)出 現(xiàn)奇異銳峰(Arti化cts),從而導(dǎo)致模型轉(zhuǎn)移效果的降低。
[0004] 圖4所示是在PDS模型轉(zhuǎn)移中,部分光譜段出現(xiàn)的奇異銳峰,運(yùn)可能是由于局部模 型計(jì)算轉(zhuǎn)換系數(shù)而時(shí),由于因子數(shù)確定不準(zhǔn)而導(dǎo)致窗口光譜段的特征值交換出現(xiàn)奇異銳 峰。通常,一般在模型轉(zhuǎn)移過程中預(yù)先設(shè)定闊值來控制局部模型的主因子數(shù)。然而當(dāng)局部模 型的主因子數(shù)過大時(shí),導(dǎo)致數(shù)據(jù)的過擬合,從而引起奇異銳峰的出現(xiàn)。在標(biāo)準(zhǔn)化前后對(duì)一個(gè) 獨(dú)立樣品光譜的分析和驗(yàn)證,來發(fā)現(xiàn)和減少PDS轉(zhuǎn)移奇異銳峰。當(dāng)轉(zhuǎn)移光譜與原始光譜之間 存在大的殘差時(shí),意味著在PDS模型轉(zhuǎn)移中存在不正確的局部主因子數(shù)。對(duì)于運(yùn)些出現(xiàn)高殘 差的波長(zhǎng)區(qū)域,適當(dāng)降低局部主因子數(shù)的大小來構(gòu)造新的PDS轉(zhuǎn)移模型。對(duì)局部主因子數(shù)的 不正確選取,從而導(dǎo)致窗口光譜段的特征值交換,并且導(dǎo)致在PDS轉(zhuǎn)移光譜中出現(xiàn)不連續(xù)的 現(xiàn)象。同時(shí)可W觀察到,在運(yùn)些出現(xiàn)相似的特征值交換的光譜片斷,光譜數(shù)據(jù)的微小變動(dòng)都 將使所建立的模型與臨近窗口光譜段出現(xiàn)大的差異。運(yùn)種模型構(gòu)造中突然的變動(dòng),將使光 譜產(chǎn)生不連續(xù)的現(xiàn)象。為了更好的研究奇異銳峰的出現(xiàn),引入徑向基神經(jīng)網(wǎng)絡(luò)(RBF-AN)代 替化S或PCR求取轉(zhuǎn)換系數(shù)bKPDS-ΑΓ^Ν算法)無疑是非常精確、可靠的技術(shù)方法,它能消除因 特征值變換引起的奇異銳峰,并試圖消除從儀器的隨機(jī)噪音、解決主儀器和從儀器信號(hào)間 的復(fù)雜非線性問題。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明所要解決的技術(shù)問題在于克服現(xiàn)有技術(shù)的缺陷而提供一種能夠消除量測(cè) 光譜間的非線性差異和光譜分段直接校正中出現(xiàn)的奇異銳峰,簡(jiǎn)化光譜模型轉(zhuǎn)移參數(shù)選擇 的基于徑向基神經(jīng)網(wǎng)絡(luò)的光譜分析模型轉(zhuǎn)移技術(shù)。
[0006] 本發(fā)明的技術(shù)問題通過W下技術(shù)方案實(shí)現(xiàn): 一種基于徑向基神經(jīng)網(wǎng)絡(luò)的光譜分析模型轉(zhuǎn)移技術(shù),其包括如下步驟: 步驟一、通過徑向基神經(jīng)網(wǎng)絡(luò)的訓(xùn)練創(chuàng)建兩部分訓(xùn)練集,一部分為校正集,預(yù)測(cè)誤差反 向傳輸,用于調(diào)節(jié)權(quán)重;另一部分為監(jiān)控集,不參與訓(xùn)練,預(yù)測(cè)誤差平方和用于控制網(wǎng)絡(luò)的 訓(xùn)練;設(shè)定一個(gè)終止闊值時(shí),網(wǎng)絡(luò)停止訓(xùn)練; 步驟二、利用徑向基神經(jīng)網(wǎng)絡(luò)進(jìn)行光譜模型間的轉(zhuǎn)移,從結(jié)構(gòu)上看,徑向基神經(jīng)網(wǎng)絡(luò)屬 于多層前向神經(jīng)網(wǎng)絡(luò),包括輸入層、隱含層和輸出層,其基本思想是:用徑向基函數(shù)作為隱 含層的"基",構(gòu)成隱含空間,隱含層對(duì)輸入矢量進(jìn)行變換,將低維的模式輸入數(shù)據(jù)變換到高 維空間,使得在低維空間內(nèi)的線性不可分問題在高維空間內(nèi)可分; 步驟Ξ、根據(jù)程序默認(rèn)的參數(shù)進(jìn)行徑向基神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,選取平方和誤差參數(shù)為 0.02,展開常量為1,W輸入層向量的數(shù)目作為隱含層基函數(shù)的個(gè)數(shù);W標(biāo)樣數(shù)和窗口寬度 與訓(xùn)練集的預(yù)測(cè)標(biāo)準(zhǔn)差作圖,來確定合適的標(biāo)樣數(shù)和徑向基神經(jīng)網(wǎng)絡(luò)的窗口寬度; 步驟四、通過去檢驗(yàn)來比較光譜模型轉(zhuǎn)移前后的預(yù)測(cè)能力。
[0007]與現(xiàn)有技術(shù)相比,本發(fā)明主要是引入徑向基神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)光譜的轉(zhuǎn)移,運(yùn)種轉(zhuǎn) 移技術(shù)能夠消除量測(cè)光譜間的非線性差異和光譜分段直接校正中出現(xiàn)的奇異銳峰,簡(jiǎn)化光 譜模型轉(zhuǎn)移的參數(shù)選擇,整個(gè)操作過程精確、可靠。
【附圖說明】
[000引圖1為基于神經(jīng)網(wǎng)絡(luò)的PDS模型轉(zhuǎn)移結(jié)構(gòu)示意圖。
[0009]圖2為經(jīng)PDS-RBF算法模型轉(zhuǎn)移前后的部分光譜區(qū)域。
[0010]圖3為數(shù)據(jù)集'bj3"的預(yù)測(cè)集經(jīng)PDS-RBF處理后的預(yù)測(cè)標(biāo)準(zhǔn)差(RMSEP)隨標(biāo)樣數(shù)和 窗口寬度。
[00川圖4為PDS算法模型轉(zhuǎn)移中光譜部分區(qū)域出現(xiàn)的奇異銳峰。
【具體實(shí)施方式】
[0012] 下面將按上述附圖對(duì)本發(fā)明實(shí)施例再作詳細(xì)說明。
[0013] 基于徑向基神經(jīng)網(wǎng)絡(luò)的光譜分析模型轉(zhuǎn)移技術(shù),如圖1所示,主要設(shè)及了徑向基神 經(jīng)網(wǎng)絡(luò)在光譜分析模型轉(zhuǎn)移技術(shù)上的應(yīng)用。
[0014] 其中,人工神經(jīng)網(wǎng)絡(luò)是由大量簡(jiǎn)單的處理單元廣泛互連而形成的復(fù)雜網(wǎng)絡(luò)系統(tǒng); 常用的人工神經(jīng)網(wǎng)絡(luò)為BP(Back-Propagation)神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)一般分為3層:輸入層、隱 含層及輸出層。輸入層輸入的變量經(jīng)權(quán)重加和后進(jìn)入隱含層進(jìn)行非線性變換,隱含層的輸 出經(jīng)權(quán)重加和后進(jìn)入輸出層,經(jīng)線性變換得到輸出結(jié)果。在網(wǎng)絡(luò)訓(xùn)練過程中,輸出的預(yù)測(cè)值 (帶)與期望值(束)相比較,所得誤差經(jīng)反向傳輸,調(diào)整權(quán)重,使目標(biāo)變量史=權(quán)-玄)f(y-索I 為最小(T為矩陣的轉(zhuǎn)置),最終得到的權(quán)重用于人工神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)。
[0015] 3層BP神經(jīng)網(wǎng)絡(luò)可任意精度擬合任意連續(xù)函數(shù),因而具有強(qiáng)大的非線性建模 能力。為解決過擬合問題,本發(fā)明設(shè)及的轉(zhuǎn)移技術(shù)是將訓(xùn)練集分為兩部分,一部分為校正 集,預(yù)測(cè)誤差反向傳輸,用于調(diào)節(jié)權(quán)重;另一部分為監(jiān)控集,不參與訓(xùn)練,預(yù)測(cè)誤差平方和用 于控制網(wǎng)絡(luò)的訓(xùn)練。一般設(shè)定一個(gè)終止闊值時(shí),網(wǎng)絡(luò)停止訓(xùn)練。
[0016] 先采用目前應(yīng)用最廣的3層BP-A順網(wǎng)絡(luò),輸入層的節(jié)點(diǎn)數(shù)隨窗口大小的變化和變 化,用BP算法進(jìn)行訓(xùn)練,如圖1所示,所采用的網(wǎng)絡(luò)訓(xùn)練方法為L(zhǎng)evenberg-Marquardt算法, 網(wǎng)絡(luò)中隱層轉(zhuǎn)移函數(shù)為雙曲正切函數(shù);考慮到待測(cè)成分與近紅外光譜間可能具有一定的線 性關(guān)系,故輸出層神經(jīng)元分別采用線性(purelin)函數(shù),均方差目標(biāo)為0.01,對(duì)于每個(gè)光譜 點(diǎn)用不同的網(wǎng)絡(luò)權(quán)重,由網(wǎng)絡(luò)自動(dòng)調(diào)節(jié);選擇了測(cè)試集的平均絕對(duì)誤差(MAE)和所建立數(shù)學(xué) 模型的相關(guān)系數(shù)(R)來比較對(duì)神經(jīng)網(wǎng)絡(luò)的影響。
[0017] 根據(jù)標(biāo)樣數(shù)目、窗口大小W及神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)果來優(yōu)選參數(shù),但BP網(wǎng)絡(luò)的訓(xùn)練 速度慢,程序運(yùn)行時(shí)間過長(zhǎng),并且在BP神經(jīng)網(wǎng)絡(luò)中存在各種參數(shù)的設(shè)定W及優(yōu)化,例如隱含 層數(shù)及隱含層神經(jīng)元的選擇、訓(xùn)練集與確證集的數(shù)目及選擇,學(xué)習(xí)規(guī)則、學(xué)習(xí)效率、勢(shì)態(tài)因 子、控制誤差等參數(shù)的選擇;要使網(wǎng)絡(luò)性能達(dá)到最佳,防止網(wǎng)絡(luò)的過度學(xué)習(xí)及網(wǎng)絡(luò)泛化能力 降低等現(xiàn)象,由于上述參數(shù)的確定均無確定理論依據(jù),目前只能靠反復(fù)試驗(yàn),進(jìn)行網(wǎng)絡(luò)訓(xùn)練 來確定。運(yùn)樣,由于PDS-BP模型轉(zhuǎn)移算法運(yùn)行時(shí)間過長(zhǎng),無法用循環(huán)優(yōu)化來選取最優(yōu)參數(shù), 降低了不同光譜間的轉(zhuǎn)移效果,雖然運(yùn)用BP神經(jīng)網(wǎng)絡(luò)部分解決了 PDS模型轉(zhuǎn)移過程中出現(xiàn) 的奇異銳峰,但降低了模型的預(yù)測(cè)能力,沒有達(dá)到運(yùn)用BP神經(jīng)網(wǎng)絡(luò)解決PDS模型轉(zhuǎn)移問題的 最初設(shè)想。
[0018] 考慮到利用神經(jīng)網(wǎng)絡(luò)進(jìn)行模型轉(zhuǎn)移的速度和參數(shù)選擇的復(fù)雜性,嘗試?yán)脧较蚧?神經(jīng)網(wǎng)絡(luò)(Radial-Basis Function,ΚΒΡ·)進(jìn)行光譜間的轉(zhuǎn)移。從結(jié)構(gòu)上看,RB巧巾經(jīng)網(wǎng)絡(luò)屬 于多層前向神經(jīng)網(wǎng)絡(luò),其基本思想是:用徑向基函數(shù)(RBF)作為隱含層的"基",構(gòu)成隱含空 間,隱含層對(duì)輸入矢量進(jìn)行變換,將低維的模式輸入數(shù)據(jù)變換到高維空間,使得在低維空間 內(nèi)的線性不可分問題在高維空間內(nèi)可分。因此,具有網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單、訓(xùn)練簡(jiǎn)潔而且學(xué)習(xí)收斂 速度快,能夠逼近任意非線性函數(shù)等特點(diǎn)。
[0019] 根據(jù)程序默認(rèn)的參數(shù)進(jìn)行RBF網(wǎng)絡(luò)的訓(xùn)練,選取平方和誤差參數(shù)為0.02,展開常量 為1,W輸入層向量的數(shù)目作為隱含層基函數(shù)的個(gè)數(shù)。W標(biāo)樣數(shù)和窗口寬度與預(yù)測(cè)集的預(yù)測(cè) 標(biāo)準(zhǔn)差(RMSEP)作圖,來確定合適的標(biāo)樣數(shù)和RB巧巾經(jīng)網(wǎng)絡(luò)的窗口寬度。
[0020] 圖3所示為數(shù)據(jù)集"bj3"的光譜經(jīng)PDS-RBF轉(zhuǎn)移后預(yù)測(cè)集的RMSEP隨標(biāo)樣數(shù)和窗口 寬度的變化趨勢(shì)圖。從圖3中可W看出,隨標(biāo)樣數(shù)的增多,RMSEP逐漸下降,當(dāng)標(biāo)樣數(shù)增至8 時(shí),RMSEP變化趨于平穩(wěn),因此選取標(biāo)樣數(shù)為8。另外,對(duì)與窗口寬度的選擇,窗口寬度的加大 反而導(dǎo)致預(yù)測(cè)效果的變差,運(yùn)與PDS模型轉(zhuǎn)移算法的結(jié)果是一致的,說明兩臺(tái)儀器之間并不 存在大的波長(zhǎng)漂移;當(dāng)窗口寬度取5(2 X 2 +1 = 5)時(shí),RMSEP最小。
[0021] 表1分別為模型經(jīng)PDS-RBF轉(zhuǎn)移前后"bjl","bj2","bj3"預(yù)測(cè)集的預(yù)測(cè)標(biāo)準(zhǔn)差 (RMSEP)。由結(jié)果可W看出,雖然對(duì)于3臺(tái)從儀器之間的轉(zhuǎn)移效果存在一定的差異,但與原始 光譜相比,轉(zhuǎn)移之后的RMS邸得到很大程度的改善,收到了初步滿意的效果。
[0022] 表1模型轉(zhuǎn)移前后預(yù)測(cè)集的預(yù)測(cè)標(biāo)準(zhǔn)偏差
注:表1中的(*)及(**)分別表示基于BP神經(jīng)網(wǎng)絡(luò)和徑向基神經(jīng)的模型轉(zhuǎn)移算法 通過護(hù)檢驗(yàn)、即方差齊性檢驗(yàn)來比較模型轉(zhuǎn)移前后的預(yù)測(cè)能力。根據(jù)^^檢驗(yàn),在曰= 0.025水平上,刮〇-975化:1巧=3淵:,將叩扣',"^2","^3";個(gè)數(shù)據(jù)集的圖譜經(jīng)口05,口05- BP,PDS-RBF算法校正后的預(yù)測(cè)結(jié)果與在分別各自儀器上重建模型的預(yù)測(cè)效果相比,其礦 檢驗(yàn)值如表2所示。在α = 〇.025水平上,除個(gè)別數(shù)據(jù)(*)與模型轉(zhuǎn)移算法外,護(hù)檢驗(yàn)二者差異 均不顯著,說明PDS、PDS-BF和PDS-RBF模型轉(zhuǎn)移算法將"bj3"上的圖譜轉(zhuǎn)移后,其預(yù)測(cè)效果 與在"從儀器"上重新建模的效果相當(dāng)。
[0023] 表2模型轉(zhuǎn)移前后的F檢驗(yàn)值
從表1,表2中的實(shí)驗(yàn)最終的RMSEP值和F檢驗(yàn)值可知,對(duì)于W上3個(gè)不同的從儀器數(shù)據(jù) 集"bjl","bj2","bj3",應(yīng)用神經(jīng)網(wǎng)絡(luò)的思想進(jìn)行光譜之間的轉(zhuǎn)移,雖然消除了轉(zhuǎn)移光譜中 的奇異銳峰,但并沒有得到比PDS更好的模型轉(zhuǎn)移效果。運(yùn)說明,在主儀器與從儀器之間并 沒有大的非線性差異,一般只需通過線性的PDS-化討莫型轉(zhuǎn)移算法就能達(dá)到較為滿意的轉(zhuǎn) 移效果。
[0024] 本發(fā)明所述實(shí)施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。此外還應(yīng)理 解,在閱讀了本發(fā)明講授的內(nèi)容之后,本領(lǐng)域技術(shù)人員可W對(duì)本發(fā)明作各種改動(dòng)或修改,運(yùn) 些等價(jià)形式同樣落于本申請(qǐng)所附權(quán)利要求書所限定的范圍內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于徑向基神經(jīng)網(wǎng)絡(luò)的光譜分析模型轉(zhuǎn)移技術(shù),其包括如下步驟: 步驟一、通過徑向基神經(jīng)網(wǎng)絡(luò)的訓(xùn)練創(chuàng)建兩部分訓(xùn)練集,一部分為校正集,預(yù)測(cè)誤差反 向傳輸,用于調(diào)節(jié)權(quán)重;另一部分為監(jiān)控集,不參與訓(xùn)練,預(yù)測(cè)誤差平方和用于控制網(wǎng)絡(luò)的 訓(xùn)練;設(shè)定一個(gè)終止閾值時(shí),網(wǎng)絡(luò)停止訓(xùn)練; 步驟二、利用徑向基神經(jīng)網(wǎng)絡(luò)進(jìn)行光譜模型間的轉(zhuǎn)移,從結(jié)構(gòu)上看,徑向基神經(jīng)網(wǎng)絡(luò)屬 于多層前向神經(jīng)網(wǎng)絡(luò),包括輸入層、隱含層和輸出層,其基本思想是:用徑向基函數(shù)作為隱 含層的"基",構(gòu)成隱含空間,隱含層對(duì)輸入矢量進(jìn)行變換,將低維的模式輸入數(shù)據(jù)變換到高 維空間,使得在低維空間內(nèi)的線性不可分問題在高維空間內(nèi)可分; 步驟三、根據(jù)程序默認(rèn)的參數(shù)進(jìn)行徑向基神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,選取平方和誤差參數(shù)為 0.02,展開常量為1,以輸入層向量的數(shù)目作為隱含層基函數(shù)的個(gè)數(shù);以標(biāo)樣數(shù)和窗口寬度 與訓(xùn)練集的預(yù)測(cè)標(biāo)準(zhǔn)差作圖,來確定合適的標(biāo)樣數(shù)和徑向基神經(jīng)網(wǎng)絡(luò)的窗口寬度; 步驟四、通過·Τ檢驗(yàn)來比較光譜模型轉(zhuǎn)移前后的預(yù)測(cè)能力。
【文檔編號(hào)】G06N3/08GK106067065SQ201610396494
【公開日】2016年11月2日
【申請(qǐng)日】2016年6月7日 公開號(hào)201610396494.9, CN 106067065 A, CN 106067065A, CN 201610396494, CN-A-106067065, CN106067065 A, CN106067065A, CN201610396494, CN201610396494.9
【發(fā)明人】王豪, 林振興, 鄔蓓蕾, 徐善浩, 袁麗鳳, 羅川
【申請(qǐng)人】寧波檢驗(yàn)檢疫科學(xué)技術(shù)研究院