欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種光譜分析中波長變量優(yōu)選方法

文檔序號:6030499閱讀:934來源:國知局

專利名稱::一種光譜分析中波長變量優(yōu)選方法
技術(shù)領(lǐng)域
:本發(fā)明涉及光譜分析技術(shù),尤其涉及一種光譜分析中波長變量優(yōu)選方法。
背景技術(shù)
:結(jié)合多元校正模型的光譜分析技術(shù),是一項(xiàng)快速、無損檢測樣品中成分含量或性質(zhì)的新技術(shù)。由于被測樣品成分含量或性質(zhì)發(fā)生變化時(shí)會引起吸收光譜的變化,所以先通過對樣品光譜和其濃度或性質(zhì)進(jìn)行關(guān)聯(lián),建立多元校正模型,然后通過多元校正模型和被測樣品的光譜信息來預(yù)測該被測樣品中未知的成分濃度或組分性質(zhì)。但是,由于各種干擾的存在,光譜信息復(fù)雜且易重疊,因此,需要從復(fù)雜的光譜信息中剔除冗余信息、提取有用信息,以建立高效率、高精度的多元校正模型。然而,在建立多元校正模型時(shí),有時(shí)為了不丟失光譜的信息,會采用全部波長范圍內(nèi)的光譜數(shù)據(jù)進(jìn)行建模,但釆用全部光譜數(shù)據(jù)建模,不僅計(jì)算量大,而且光譜選擇性較差,有些波長處的光譜噪聲較大、包含的有用信息少,這種情況下,多元校正模型的預(yù)測精度未必能達(dá)到最佳值,因此選擇不同波長范圍下的光譜數(shù)據(jù)建模將直接影響多元校正模型的測量精度??梢?,如何選擇波長變量,以獲得光譜中最有效的譜圖信息,簡化數(shù)據(jù)運(yùn)算,使多元校正模型具有最好的預(yù)測能力,是建立多元校正模型所面臨的一個(gè)重要問題。實(shí)際上,波長變量的優(yōu)選方法很多,例如釆用多元回歸分析中的向前選擇變量法、向后刪除變量法或逐步回歸法來進(jìn)行波長變量優(yōu)選,然而在理論上,這些波長變量優(yōu)選方法都是針對無相關(guān)性的數(shù)據(jù)而言的,在多重相關(guān)性十分嚴(yán)重的情況下,這些方法得到結(jié)論的可靠性受到一定的影響;又如相關(guān)分析方法、顯變分析方法和根據(jù)被測成分的多元校正模型的回歸系數(shù)與光譜殘差的比值進(jìn)行波長變量優(yōu)選的方法等,但是這些波長變量優(yōu)選方法僅適用于一些測量情況不是特別復(fù)雜的光譜應(yīng)用中,對于提高多元校正模型質(zhì)量的效果并不很明顯。目前,有一些全局優(yōu)化方法應(yīng)用在波長變量優(yōu)選上,如模擬退火法、遺傳算法等,其中,模擬退火法是受金屬加熱技術(shù)的啟迪而發(fā)展起來的一種隨機(jī)搜索方法;遺傳算法是一種用計(jì)算機(jī)模擬生物自然進(jìn)化過程搜索最優(yōu)解的方法。盡管模擬退火法、遺傳算法等搜索算法具有相當(dāng)強(qiáng)的搜索能力,但這類方法參數(shù)設(shè)置復(fù)雜,影響了搜索到全局最優(yōu)解和局部最優(yōu)解的能力,且這些參數(shù)的設(shè)置還依賴于研究者的經(jīng)驗(yàn)及其對所研究問題的把握,因此具有一定的主觀性和隨機(jī)性。另外,采用遺傳算法進(jìn)行波長變量優(yōu)選時(shí),雖然單次實(shí)驗(yàn)時(shí)多元校正模型的預(yù)測能力很高,但由于其存在一定的隨機(jī)性,導(dǎo)致多元校正模型的適應(yīng)性很低,所以遺傳算法優(yōu)選出來的波長并沒有提高多元校正模型的穩(wěn)健性和適應(yīng)性。
發(fā)明內(nèi)容有鑒于此,本發(fā)明的主要目的在于提供一種光譜分析中波長變量優(yōu)選方法,以簡化數(shù)據(jù)處理,并提高建模效率、預(yù)測精度。為達(dá)到上述目的,本發(fā)明提供了一種光譜分析中波長變量優(yōu)選方法,包括對所獲取的原始光譜進(jìn)行預(yù)處理,獲得消除無用信息后的光譜矩陣;在所獲得的光譜矩陣中,計(jì)算各波長變量的純度值,選出純度值最大的波長變量作為第l個(gè)波長變量;計(jì)算第j個(gè)波長變量與已選出的前(j-l)個(gè)波長變量的相關(guān)權(quán)函數(shù),并計(jì)算加入該相關(guān)權(quán)函數(shù)后各波長變量的純度值,選出純度值最大的波長變量作為第j個(gè)波長變量,其中,j為大于等于2的整數(shù);用優(yōu)選出的不同個(gè)數(shù)的波長變量進(jìn)行偏最小二乘回歸建模,并計(jì)算預(yù)測均方根誤差;所述預(yù)測均方根誤差最小時(shí)建模所選取的波長變量組合即為最優(yōu)的波長變量組合。'其中,所述優(yōu)選出的不同個(gè)數(shù)的波長變量可為依次選出的前j個(gè)波長變量。本發(fā)明所提供的光譜分析中波長變量的優(yōu)選方法,在對校正樣本集中樣本的光譜數(shù)據(jù)進(jìn)行預(yù)處理,去除噪聲、背景干擾以及與被分析物不相關(guān)的信息后,計(jì)算預(yù)處理后光譜矩陣中各波長變量的純度值,選出最大純度值的波長變量作為第l個(gè)波長變量,在計(jì)算第j(j^)個(gè)波長變量的純度值時(shí),要將第j個(gè)波長變量與已選出的前(j-l)個(gè)波長變量的相關(guān)權(quán)函數(shù)計(jì)入其中。上述過程的可重復(fù)性很好,不具有隨機(jī)性,是一種確定性算法。本發(fā)明方法只需在計(jì)算純度值時(shí)設(shè)置一個(gè)補(bǔ)償因子參數(shù),能克服現(xiàn)有波長變量優(yōu)選方法中參數(shù)設(shè)置復(fù)雜的難題。可見,本發(fā)明的這種波長變量優(yōu)選方法簡單易于實(shí)現(xiàn)。此外,本發(fā)明所述的方法是一種自模型的波長變量選擇方法,即針對光譜本身的數(shù)據(jù)進(jìn)行分析,不同于現(xiàn)有技術(shù)中的一些與濃度信息作相關(guān)的波長變量選擇方法。而且,由于所選出來的波長變量為原始的波長,在對預(yù)測結(jié)果分析時(shí)可作為參考,以評價(jià)被測物質(zhì)中的分子或基團(tuán)的信息。另外,本發(fā)明的方法在應(yīng)用選出的波長變量建模時(shí),可依次選擇不同個(gè)數(shù)的波長變量進(jìn)行偏最小二乘(PLS,PartialLeastSquaresMethod)回歸建模,并計(jì)算預(yù)測均方根誤差(RMSEP,RootMeanSquareErrorofPrediction),當(dāng)預(yù)測均方根誤差最小時(shí),建模所選取的波長變量組合即為最優(yōu)選的波長變量組合,如此,可明顯提高所建立多元校正模型的預(yù)測精度。由此可見,本發(fā)明所述波長變量優(yōu)選方法能夠最小化冗余信息;由于引入相關(guān)權(quán)函數(shù),本發(fā)明所述方法可解決波長變量間共線性問題,故所選出的波長變量個(gè)數(shù)少,本發(fā)明通過選擇的少數(shù)波長變量能建立具有較高預(yù)測精度的光譜定量校正模型,可明顯提升建模速度和效率。圖l為本發(fā)明光譜分析中波長變量優(yōu)選方法的流程示意圖2(a)為本發(fā)明所述方法實(shí)施例預(yù)處理前的原始近紅外光譜圖2(b)為本發(fā)明所述方法實(shí)施例經(jīng)小波變換方法預(yù)處理后的近紅外光譜圖3(a)為本發(fā)明所述方法實(shí)施例在選擇第二個(gè)波長變量時(shí)的各波長處純度值曲線的分布圖3(b)為本發(fā)明所述方法實(shí)施例在選擇第二個(gè)波長變量時(shí)的各波長處標(biāo)準(zhǔn)差值曲線的分布圖4為本發(fā)明所述方法實(shí)施例依次選擇不同個(gè)數(shù)波長變量建模時(shí)所得的RMSEP值的分布圖5為本發(fā)明所述方法實(shí)施例優(yōu)選波長變量的分布圖6為本發(fā)明所述方法實(shí)施例最優(yōu)波長變量組合所建立的PLS多元校正模型的預(yù)測結(jié)果示意圖。具體實(shí)施例方式為使本發(fā)明上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施例對本發(fā)明作進(jìn)一步詳細(xì)的說明。本發(fā)明的基本思想是首先,對校正樣本集中樣本的光譜數(shù)據(jù)進(jìn)行預(yù)處理,再對預(yù)處理后的光譜數(shù)據(jù)進(jìn)行自模型波長變量優(yōu)選,選出最大純度值的波長變量作為第l個(gè)波長變量;在計(jì)算第j(j^2)個(gè)波長變量的純度值時(shí),將第j個(gè)波長變量的純度值計(jì)入第j個(gè)波長變量與已選出的前(j-l)個(gè)波長變量的相關(guān)權(quán)函數(shù);然后依次選擇不同個(gè)數(shù)的波長變量進(jìn)行PLS回歸建模,并計(jì)算預(yù)測均方根誤差;當(dāng)預(yù)測均方根誤差最小時(shí),所選取的建模波長變量組合即為最優(yōu)選的波長變量組合。需要說明的是,在進(jìn)行波長變量優(yōu)選之前,可將預(yù)先實(shí)驗(yàn)獲得的光譜樣本分為訓(xùn)練集和預(yù)測集,其中,所述訓(xùn)練集樣本用來進(jìn)行波長變量的優(yōu)選和多元校正模型的訓(xùn)練,而所述預(yù)測集樣本用來評價(jià)波長變量的優(yōu)選和多元校正模型的預(yù)測精度。一般地,所述樣本的光譜測量數(shù)據(jù)中可能包含由于儀器噪聲、測量條件變化等造成的高頻噪聲,以及其它化學(xué)成分光吸收產(chǎn)生的背景干擾等無用信息,因此,所述預(yù)處理主要就是為了去除光譜中這些與被測樣品的成分濃度或性質(zhì)不相關(guān)的信息,以保證選擇的變量盡可能地與被測樣品的成分濃度或性質(zhì)參數(shù)相關(guān),進(jìn)而提高光譜質(zhì)量。實(shí)際上,對原始光譜進(jìn)行預(yù)處理的方法有幾種相關(guān)分析法、無用信息變量消除法、以及小波變換方法等,下面舉例詳細(xì)說明預(yù)處理方法的實(shí)現(xiàn)。第一種光譜預(yù)處理方法一_相關(guān)分析法,該方法包括以下步驟步驟A101、將測定的成分濃度或組分性質(zhì)數(shù)據(jù)Y(nxi)與樣品的光譜數(shù)據(jù)X(nxm)進(jìn)行關(guān)聯(lián),按公式(1)求出每個(gè)波長處的相關(guān)系數(shù)C:其中,n為樣本個(gè)數(shù),m為變量個(gè)數(shù),;c,為光譜數(shù)據(jù)X中的元素,乂為數(shù)據(jù)Y中的元素,3f、歹分別為《和乂所在列的均值。步驟A102、設(shè)定相關(guān)系數(shù)的閾值Co,相關(guān)系數(shù)超過該閾值即Ck〉Co所對應(yīng)的第k個(gè)波長被選擇。步驟A103、由選擇的波長變量組成新的矩陣XNEw,以用于進(jìn)一步的光譜處理。第二種光譜預(yù)處理方法一一無用信息變量消除方法,該方法包括以下步驟步驟A201、將樣本集光譜矩陣X(nxm)和濃度矩陣Y(nxl)進(jìn)行PLS回歸分析,并選取主成分個(gè)數(shù)f,其中f為正整數(shù);其中,n表示樣品的數(shù)目,m表示波長變量的數(shù)目。步驟A202、產(chǎn)生隨機(jī)噪聲矩陣R(nxm),將X與R組合成矩陣XR(nx2m);這里,所組合成的矩陣XR前m列為X,后m列為R。步驟A203、對矩陣XR和Y進(jìn)行PLS回歸,每次剔除一個(gè)樣本的交互驗(yàn)證,得到一個(gè)回歸系數(shù)向量b,共得到n個(gè)PLS回歸系數(shù)組成矩陣B(nx2m)。步驟A204、按列計(jì)算矩陣B(nx2m)的標(biāo)準(zhǔn)差std(b)和平均值mean(b),然后計(jì)算Cj-mean(bi)/std(bi),其中1=1,2,…,2m。步驟A205、在[m+l,2m]區(qū)間取C的最大絕對值Cm狀-max(abs(C))。步驟A206、在[l,m]區(qū)間去除矩陣X對應(yīng)Ci〈Cm^的變量,并將剩余變量組成經(jīng)無用信息變量消除方法選取的新矩陣XNEW,為后續(xù)的光譜處理做好準(zhǔn)備。第三種光譜預(yù)處理方法一一小波變換方法。小波變換具有多分辨分析特性,由于在光譜信號中,噪聲及其他成分光吸收產(chǎn)生的背景多表現(xiàn)于低尺度細(xì)節(jié)系數(shù)和高尺度近似成分,因此利用小波變換可同時(shí)去除各種噪聲及背景干擾等無用信息。采用小波變換對原始光譜進(jìn)行預(yù)處理的過程包括以下步驟步驟A301、產(chǎn)生一個(gè)隨機(jī)噪聲和背景矩陣R(nxm),將樣品集光譜矩陣X(nxm)與R組合成矩陣XR(nx2m);其中,n為樣本個(gè)數(shù)、m為變量個(gè)數(shù),組合矩陣XR前m列為X,后m列為R。步驟A302、將矩陣XR的每條信號的進(jìn)行小波分解,選擇小波基及小波分解層數(shù)k,得到小波細(xì)節(jié)系數(shù)矩陣D(kx2m/(ix2))和近似成分矩陣A(kx2m),其中i-1,2,…,k。步驟A303、按列計(jì)算矩陣D(kx2m/(ix2))的標(biāo)準(zhǔn)差std(di)和平均值mean(di),然后計(jì)算Cdi=mean(di)/std(di)。步驟A304、按列計(jì)算矩陣A(kx2m)的標(biāo)準(zhǔn)差std(bi)和平均值mean(bi),然后計(jì)算Cai=mean(ai)/std(ai)。步驟A305、若[l,m/(ix2)]區(qū)間ICdil值與[m+l,2m]區(qū)間|(^|值相似,則該細(xì)節(jié)系數(shù)代表的成分作為噪聲剔除,其中i-l,2,...,k;若[l,m]區(qū)間ICail值小于[m+l,2m]區(qū)間ICail值,則其對應(yīng)的成分作為背景去除。步驟A306、用去噪、去背景后的第k層低頻和高頻系數(shù)進(jìn)行信號重構(gòu),利用重構(gòu)光譜信號建立校正模型,根據(jù)預(yù)測均方根誤差可選擇最優(yōu)小波基;重構(gòu)的各條光譜信號組成新的光譜矩陣XNEW,以便于進(jìn)行波長變量的優(yōu)選等光譜處理工作。需要指出的是,本發(fā)明優(yōu)選實(shí)施例的預(yù)處理方法并不僅僅局限于上述方法,其他任何去除噪聲、背景等無用信息的預(yù)處理方法都應(yīng)屬于本發(fā)明的保護(hù)范圍?;谏厦嫠龅念A(yù)處理方法,如圖l所示,本發(fā)明光譜分析中波長變量優(yōu)選方法的流程示意圖,包括如下步驟品的原始光譜數(shù)據(jù)進(jìn)行預(yù)處理,以獲取消除無用信息后的光譜矩陣;通過預(yù)處理來消除無用信息,可提高光譜質(zhì)量,使光譜與被分析物成分濃度或性質(zhì)之間的關(guān)系更緊密。在上述的預(yù)處理方法中,所述相關(guān)分析法與無用信息變量消除法適用于光譜不復(fù)雜的情況,一般僅用于去除噪聲;而小波變換方法,憑借其多分辨分析特性,可同時(shí)去除噪聲及背景等無用信息。可根據(jù)具體情況,來選擇光譜預(yù)處理的方法。步驟S102、在預(yù)處理后的光譜矩陣XNEw中,計(jì)算各波長變量的純度值,并選擇純度值最大的波長變量作為選出的第l個(gè)波長變量;所述純度值用以表征各變量對多元校正模型的貢獻(xiàn),可表示為所述波長變量的離散程度與增加了補(bǔ)償因子之后的集中趨勢的百分比;所述離散程度為波長變量的標(biāo)準(zhǔn)差,而所述集中趨勢為所述波長變量的均值。另外,在信號比較微弱、噪聲與信號相當(dāng)?shù)那闆r下,可通過補(bǔ)償因子加以調(diào)節(jié)。一般地,所述補(bǔ)償因子可以設(shè)置為所述均值的1%至5%。光譜矩陣XNEw中,各波長變量i的純度值的計(jì)算方法如下公式(2)所示"〃C",+")(2)其中,q為標(biāo)準(zhǔn)差,A,為均值,"為補(bǔ)償因子。由公式(2)求得的各波長變量i的純度值A(chǔ),,,然后判斷A,值的大小,具有最大A,值的第i個(gè)波長變量即為選出的第l個(gè)波長變量。步驟S103、計(jì)算第j個(gè)波長變量的相關(guān)權(quán)函數(shù),并計(jì)算各波長變量計(jì)入相關(guān)權(quán)函數(shù)之后的純度值,選擇純度值最大的波長變量作為選出的第j個(gè)波長變量;其中,j為大于或等于2的整數(shù);所述相關(guān)權(quán)函數(shù),用以表征第j個(gè)波長變量與已選出的前(j-l)個(gè)波長變量之間的關(guān)系重要程度。選擇第j()個(gè)波長變量的一般過程具體如下計(jì)算光譜矩陣X^w中各波長變量i的長度/,.,如公式(3)所示(3)其中,《;為光譜矩陣XNEw中第i行第j列元素,有,"=《乂/)〃,2+0,+)2,得到關(guān)系矩陣c-"(/)"/)T/",其中,zx/)為由元素"(/),,,組成的矩陣;并計(jì)算相關(guān)權(quán)函數(shù)/^,如公式(4)所示。<formula>formulaseeoriginaldocumentpage10</formula>(4)其中,j表示待確定的第j個(gè)波長變量的序號,Pj-,表示目前已經(jīng)選定了的第(j-l)個(gè)波長變量在關(guān)系矩陣C中的序號,Pi表示所選擇的第l個(gè)波長變量在關(guān)系矩陣C中的序號,那么,第j個(gè)波長變量純度值A(chǔ),為""(^/C",+"))(5)具有最大A,值的波長變量即為選出的第j個(gè)波長變量,且相應(yīng)的標(biāo)準(zhǔn)差值、表達(dá)式如式(6)所示。J"=A,(6)一般地,具有最大/^值的波長變量的標(biāo)準(zhǔn)差值^也會相對較高,因此標(biāo)準(zhǔn)差值、可以作為參考值,以監(jiān)督所選出的波長變量。步驟S1(M、依次選擇不同個(gè)數(shù)的波長變量進(jìn)行PLS回歸建模,并計(jì)算預(yù)測均方根誤差RMSEP;一般地,RMSEP的計(jì)算公式為RMSEP=(7)其中,j),為預(yù)測值,^為參考值。預(yù)測均方根誤差RMSEP反映了測量數(shù)據(jù)偏離真實(shí)值的程度,一般情況下:RMSEP的值越小,表示測量精度越高,因此可用RMSEP作為評定這一測量過程精度的標(biāo)準(zhǔn)。當(dāng)RMSEP的值最小時(shí),所選擇的建模波長變量組合即為最優(yōu)的波長變量組合。而步驟S104主要就是通過依次迭代選擇的波長變量作PLS回歸分析,進(jìn)而對所選取的建模波長變量個(gè)數(shù)進(jìn)行判定。步驟S105、判斷RMSEP的值是否達(dá)到最小值,若是,則執(zhí)行步驟S106,否則返回步驟S103;一般地,當(dāng)本次建模獲得的RMSEP的值大于其前一次建模時(shí)所獲得的結(jié)果時(shí),即認(rèn)為所述前一次的RMSEP為最小值;若RMSEP的值未達(dá)到最小值,則重復(fù)步驟S103,依次迭代,直至選擇出最優(yōu)的波長變量組合。另外,也可以在算法開始時(shí),預(yù)先設(shè)定一個(gè)最小的RMSEP值,用以作為結(jié)東循環(huán)的條件。步驟S106、當(dāng)RMSEP達(dá)到最小值時(shí),即可結(jié)東本次波長變量的優(yōu)選,完成建模。本發(fā)明的波長變量優(yōu)選方法可以應(yīng)用MATLAB程序設(shè)計(jì),可實(shí)現(xiàn)波長變量的自動選擇。根據(jù)依次迭代選擇的波長變量建立多元校正模型,再利用交互驗(yàn)證的RMSEP進(jìn)行判斷,當(dāng)RMSEP值最小時(shí)用于建模的變量組合即為選擇的最優(yōu)波長變量組合。需要強(qiáng)調(diào)的是,本發(fā)明的波長變量優(yōu)選方法也可以先選出一定數(shù)量的波長變量,再用這些已選出的波長變量進(jìn)行PLS回歸建模,其中,更為優(yōu)選的是,建模時(shí)所用的不同個(gè)數(shù)的波長變量可為依次選出的波長變量;否則,可進(jìn)一步結(jié)合一些變量選擇方法(如窮舉法、遺傳算法及蒙特卡羅方法等)來選出部分波長變量進(jìn)行建模。然后計(jì)算RMSEP的值,并判斷RMSEP的值是否為最小,若已出現(xiàn)最小的RMSEP值,則可以停止波長變量的選擇;否則,繼續(xù)進(jìn)行波長變量的優(yōu)選。下面結(jié)合一個(gè)具體實(shí)施例,對本發(fā)明光譜分析中波長變量的優(yōu)選方法做詳細(xì)介紹。以人體血漿近紅外光譜血糖檢測實(shí)驗(yàn)為例,對樣品中葡萄糖濃度進(jìn)行預(yù)測分析。本實(shí)施例中人體血漿近紅外光譜實(shí)驗(yàn)釆用傅立葉變換紅外光譜儀,采集光譜的范圍為9003600nm,采用的檢測器為液態(tài)氮冷卻的InSb檢測器,此外本實(shí)驗(yàn)還選用了lmm石英樣品池、蠕動泵自動進(jìn)樣系統(tǒng)以及全自動生化分析儀等儀器。血漿實(shí)驗(yàn)樣品的配置步驟為在全血中加入肝素抗凝劑在離心機(jī)中經(jīng)過每分鐘1500轉(zhuǎn)、10min后分離出,然后在分離出來的血漿中加入葡萄糖,用全自動生化分析儀和葡萄糖氧化酶法標(biāo)定血糖值。本次血漿實(shí)驗(yàn)共獲得樣本33個(gè),其中22個(gè)樣本作為訓(xùn)練集,用來進(jìn)行波長變量優(yōu)選和多元校正模型的訓(xùn)練;ll個(gè)樣本作為預(yù)測集,用來評價(jià)波長變量優(yōu)選和多元校正模型的預(yù)測精度。另外,葡萄糖濃度范圍為10.444.4mg/dL,且隨機(jī)分布,其濃度標(biāo)準(zhǔn)差為8.5mg/dL。本實(shí)施例的波長變量優(yōu)選方法的實(shí)現(xiàn)過程包括以下步驟步驟S201、對實(shí)驗(yàn)所有樣品的光譜數(shù)據(jù)進(jìn)行預(yù)處理,去除噪聲和背景等無用信息。選擇光譜分析范圍為10001890.36nm,每條光譜共有4711個(gè)波長變量。對每條光譜都應(yīng)用小波變換方法去除無用信息,選擇小波基db3,通過Mallat分解,其分解尺度為12,去除尺度分別為l、2、3、IO所對應(yīng)的成分,然后重構(gòu)光譜倌白巧、o如圖2(a)所示,為本實(shí)施例預(yù)處理前的原始近紅外光譜圖,而圖2(b)為本實(shí)施例經(jīng)小波變換方法預(yù)處理后的近紅外光譜圖,預(yù)處理后光譜即為新的光譜矩陣X^w。由于光譜矩陣XNEW中的光譜數(shù)據(jù)量較大(33x4711的矩陣),可參照圖2(b)所示。步驟S202、對經(jīng)預(yù)處理后的光譜數(shù)據(jù)XNEw進(jìn)行波長變量優(yōu)選,計(jì)算訓(xùn)練集樣本光譜矩陣XwEw中各波長變量i的純度值,以選出第l個(gè)波長變量;本實(shí)施例將補(bǔ)償因子"的值設(shè)置為均值的5%。通過比較由步驟B1計(jì)算的各波長變量處純度值和標(biāo)準(zhǔn)差值,可以得出最大純度值為A,,0.0431,因此可以確定所選出的第l個(gè)波長變量為變量標(biāo)號為l的波長變量(波長為1000nm)。步驟S203、選擇第二個(gè)波長變量;根據(jù)公式(5)和公式(6)計(jì)算加入相關(guān)權(quán)函數(shù)后的純度值和標(biāo)準(zhǔn)差值,所獲得的純度值與各波長變量之間的對應(yīng)結(jié)果如圖3(a)所示,為本實(shí)施例在選擇第二個(gè)波長變量時(shí)的各波長處純度值曲線的分布圖;所獲得的標(biāo)準(zhǔn)差值與各波長變量之間的對應(yīng)結(jié)果如圖3(b)所示,為本實(shí)施例在選擇第二個(gè)波長變量時(shí)的各波長處標(biāo)準(zhǔn)差值曲線的分布圖。從圖3中可以看出,所選擇的第二個(gè)波長變量為具有最大值的第4711個(gè)波長變量(波長為1890.36nm)。重復(fù)步驟S203,進(jìn)而得到所選擇的第316個(gè)波長變量分別為第4223個(gè)變量(波長為1730.7nm)、第1944個(gè)變量(波長為1241.16nm)、第2655個(gè)變量(波長為1361.29nm)、第4700個(gè)變量(波長為1886.44nm)、第3281個(gè)變量(波長為1488.1nm)、第4684個(gè)變量(波長為1880.76nm)、第2973個(gè)變量(波長為1422.88nm)、第3857個(gè)變量(波長為1627.6nm)、第2814個(gè)變量(波長為1391.4nm)、第1232個(gè)變量(波長為U40.38nm)、第2558個(gè)變量(波長為1343.54nm)、第4078個(gè)變量(波長為1688.33nm)。步驟S204、判斷選擇的波長變量個(gè)數(shù)。用依次選擇的第1至第16個(gè)波長變量建立PLS回歸多元校正模型,由交互驗(yàn)證法可以得到釆用不同個(gè)數(shù)的波長變量進(jìn)行建模時(shí)的RMSEP。如圖4所示,為本實(shí)施例依次選擇不同個(gè)數(shù)波長變量建模時(shí)所得的RMSEP值的分布圖,圖4中倒三角表示RMSEP值,曲線表示RMSEP值隨著波長變量個(gè)數(shù)的變化而變化的趨勢??梢?,在選擇前14個(gè)波長變量建模時(shí),RMSEP值最小,所以最優(yōu)的波長變量個(gè)數(shù)為14,此時(shí)所選取的這前14個(gè)波長變量組合為最優(yōu)的波長變量組合,如圖5所示,為本實(shí)施例優(yōu)選波長變量的分布圖,可反映出所優(yōu)選出的波長變量的范圍,圖5中圓圈表示選擇的波長變量,曲線表示光譜曲線。通過本發(fā)明所述的波長變量優(yōu)選方法,建立PLS回歸多元校正模型,對預(yù)測集樣本進(jìn)行預(yù)測,可得到RMSEP的值為1.9mg/dL,該多元校正模型的預(yù)測結(jié)果的相關(guān)系數(shù)(Correlation)為0.94,其相關(guān)關(guān)系如圖6所示,為本實(shí)施例最優(yōu)波長變量組合所建立的PLS多元校正模型的預(yù)測結(jié)果示意圖。在圖6中,黑點(diǎn)表示參考值和預(yù)測值的相關(guān)性,直線則代表該相關(guān)性的一個(gè)基準(zhǔn)。當(dāng)所述黑點(diǎn)越靠近直線時(shí),表示預(yù)測值和參考值的相關(guān)性越大。如表1所示,為選用不同波長變量范圍建模的預(yù)測參數(shù),本實(shí)施例應(yīng)用自模型波長變量優(yōu)選方法選出14個(gè)波長變量進(jìn)行建模,與選用4711個(gè)波長變量進(jìn)行全譜建模的效果相比,本發(fā)明所述的自模型波長變量優(yōu)選方法不僅簡單易實(shí)現(xiàn)、建模效率高,而且其所建的多元校正模型的預(yù)測精度也明顯提高。<table>tableseeoriginaldocumentpage14</column></row><table>表1在上述實(shí)施例中,對各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述即可。以上所述,僅為本發(fā)明的較佳實(shí)施例而已,只是用來解釋說明本發(fā)明,并非用于限定本發(fā)明的保護(hù)范圍。對于上述的各實(shí)施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。另外,在本發(fā)明的精神和權(quán)利要求保護(hù)范圍之內(nèi),對本發(fā)明作用的任何修改和改變,都落入本發(fā)明的保護(hù)范圍。權(quán)利要求1、一種光譜分析中波長變量優(yōu)選方法,其特征在于,該方法包括對所獲取的原始光譜進(jìn)行預(yù)處理,獲得消除無用信息后的光譜矩陣;在所獲得的光譜矩陣中,計(jì)算各波長變量的純度值,選出純度值最大的波長變量作為第1個(gè)波長變量;計(jì)算第j個(gè)波長變量與已選出的前(j-1)個(gè)波長變量的相關(guān)權(quán)函數(shù),并計(jì)算加入該相關(guān)權(quán)函數(shù)后各波長變量的純度值,選出純度值最大的波長變量作為第j個(gè)波長變量,其中,j為大于等于2的整數(shù);用優(yōu)選出的不同個(gè)數(shù)的波長變量進(jìn)行偏最小二乘回歸建模,并計(jì)算預(yù)測均方根誤差;所述預(yù)測均方根誤差最小時(shí)建模所選取的波長變量組合即為最優(yōu)的波長變量組合。2、根據(jù)權(quán)利要求l所述的方法,其特征在于,所述優(yōu)選出的不同個(gè)數(shù)的波長變量為依次選出的前j個(gè)波長變量。3、根據(jù)權(quán)利要求l所述的方法,其特征在于,所述預(yù)處理為釆用相關(guān)分析法、或無用信息變量消除法、或小波變換方法對所獲取的原始光譜進(jìn)行處理。4、根據(jù)權(quán)利要求l所述的方法,其特征在于,所述純度值為所述波長變量的標(biāo)準(zhǔn)差與增加補(bǔ)償因子之后的均值的百分比。5、根據(jù)權(quán)利要求4所述的方法,其特征在于,所述補(bǔ)償因子為所述均值的1%至50/0。6、根據(jù)權(quán)利要求l所述的方法,其特征在于,所述預(yù)測均方根誤差為預(yù)測值和參考值之差的平方的算術(shù)平均值再開方。7、根據(jù)權(quán)利要求l所述的方法,其特征在于,該方法進(jìn)一步包括預(yù)先設(shè)定一個(gè)預(yù)測均方根誤差值為其最小值。8、根據(jù)權(quán)利要求1或7所述的方法,其特征在于,本次建模所得的預(yù)測均方根誤差值大于前一次建模時(shí)的預(yù)測均方根誤差值時(shí),前一次的預(yù)測均方根誤差值為最小值。全文摘要本發(fā)明公開了一種光譜分析中波長變量優(yōu)選方法,包括對所獲取的原始光譜進(jìn)行預(yù)處理,獲得消除無用信息后的光譜矩陣;在所獲得的光譜矩陣中,計(jì)算各波長變量的純度值,選出純度值最大的波長變量作為第1個(gè)波長變量;計(jì)算第j個(gè)波長變量與已選出的前(j-1)個(gè)波長變量的相關(guān)權(quán)函數(shù),并計(jì)算加入該相關(guān)權(quán)函數(shù)后各波長變量的純度值,選出純度值最大的波長變量作為第j個(gè)波長變量,其中,j為大于等于2的整數(shù);用優(yōu)選出的不同個(gè)數(shù)的波長變量進(jìn)行偏最小二乘回歸建模,并計(jì)算預(yù)測均方根誤差;該預(yù)測均方根誤差最小時(shí)建模所選取的波長變量組合為最優(yōu)的波長變量組合。所述方法選出的波長變量個(gè)數(shù)少,能最小化冗余信息,可明顯提升建模速度和效率。文檔編號G01N21/31GK101430276SQ200810239588公開日2009年5月13日申請日期2008年12月15日優(yōu)先權(quán)日2008年12月15日發(fā)明者張廣軍,李麗娜,李慶波申請人:北京航空航天大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
上蔡县| 梁山县| 宿松县| 洞头县| 铜梁县| 水富县| 石景山区| 平湖市| 锡林郭勒盟| 天长市| 萝北县| 资兴市| 新晃| 哈尔滨市| 顺昌县| 咸丰县| 郸城县| 嘉定区| 光山县| 高尔夫| 淄博市| 体育| 涞源县| 铜山县| 根河市| 南昌县| 晴隆县| 富蕴县| 于田县| 皋兰县| 景德镇市| 千阳县| 开原市| 沂源县| 台北县| 马鞍山市| 新宁县| 玛曲县| 榆林市| 马龙县| 大英县|