一種假高粱及其近似物種的快速檢測(cè)方法
【專利摘要】本發(fā)明公開了一種基于近紅外光譜的假高粱及其近似物種的快速檢測(cè)方法,包括以下步驟:采用近紅外光譜獲取高粱、假高粱、蘇丹草三種高粱屬種子在325-1075nm之間的光譜反射特征曲線,采用偏最小二乘法進(jìn)行模式特征分析,經(jīng)過交互驗(yàn)證法判別,確定最佳主成分?jǐn)?shù)為9。完成特征提取后,將9種主成分作為神經(jīng)網(wǎng)絡(luò)的輸入變量,建立了三層BP神經(jīng)網(wǎng)絡(luò),計(jì)算各種子所屬類別。本發(fā)明通過紅外光譜分析結(jié)合化學(xué)計(jì)量學(xué)的方法快速準(zhǔn)確判別三種高粱屬種子所屬類別,大大縮短了檢測(cè)的時(shí)間,提高了檢測(cè)效率,降低了檢測(cè)成本。
【專利說明】一種假高粱及其近似物種的快速檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及出入境檢驗(yàn)檢疫領(lǐng)域,特別涉及一種假高粱及其近似物種的快速檢測(cè)方法。
【背景技術(shù)】
[0002]高粱屬(Sorghum)有多種植物作為糧食、飼料和工業(yè)用原料在世界各個(gè)干旱地區(qū)被廣泛種植。但是高粱屬中也有相當(dāng)一部分屬于入侵植物或具有入侵性的種類,其中最具代表性的有假高粱(S.halepenSe(L.Pers))。假高梁是世界十大惡性雜草之一,它能以根狀莖和種子共同繁殖,破壞我國(guó)植被多樣性能力強(qiáng),其危害大、繁殖快、難防治,是我國(guó)進(jìn)境植物檢疫性有害生物。假高粱原僅在福建、廣東、臺(tái)灣地區(qū)有引種分布,但隨著糧食進(jìn)口數(shù)量的不斷增大,在海南、廣西等10多個(gè)省及直轄市報(bào)道曾有假高粱的分布。高粱(Sorghumbicolor)、黑高梁(S.almum)及蘇丹草(S.sudanense)是假高粱的近緣種,在形態(tài)上與假高粱十分相似,雖然形態(tài)近似,但檢疫地位卻不盡相同,黑高梁屬于入侵性種類,而高梁和蘇丹草則屬于栽培經(jīng)濟(jì)作物可作為牧草,沒有表現(xiàn)出人侵性。因此,正確鑒定高粱屬植物,在口岸檢疫上具有重要應(yīng)用價(jià)值?,F(xiàn)有的針對(duì)高粱屬植物的鑒定分類方法是基于細(xì)胞學(xué)方法及DNA檢測(cè)進(jìn)行區(qū)別,這些方法耗時(shí)長(zhǎng),操作過程復(fù)雜。本發(fā)明提供一種快速簡(jiǎn)便無損的分析方法對(duì)高粱屬的植物進(jìn)行鑒別。
[0003]紅外光譜技術(shù)以其具有的“指紋”特性,近年來越來越受到人們的重視。紅外光譜法是一種快速簡(jiǎn)便無損的分析方法,可以反映物質(zhì)內(nèi)部的有機(jī)成分,特別是C-H、0-H、N-H等基閉的倍頻和合頻吸收,可用于定量測(cè)定物質(zhì)有機(jī)物質(zhì)的含量。紅外光譜法已被廣泛應(yīng)用于農(nóng)業(yè)、食品、飼料、醫(yī)藥、石油化工等行業(yè)。國(guó)內(nèi)外很多學(xué)者利用近紅外光譜技術(shù)進(jìn)行物質(zhì)品種鑒別。在高粱屬種子快速檢測(cè)研究中具有廣泛的應(yīng)用潛力。
【發(fā)明內(nèi)容】
[0004]為了解決現(xiàn)有口岸檢疫檢測(cè)技術(shù)存在的問題,本發(fā)明提供一種快速簡(jiǎn)便無損的分類鑒定方法對(duì)相類似的高粱屬種子進(jìn)行鑒別,該發(fā)明在口岸檢疫上具有重要應(yīng)用價(jià)值。
[0005]一種基于近紅外光譜的假高粱及其近似物種的快速檢測(cè)方法,包括如下步驟:
[0006]I)利用近紅外光譜儀采集已知樣本的原始光譜數(shù)據(jù),并對(duì)采集到的原始光譜數(shù)據(jù)預(yù)處理;
[0007]2)運(yùn)用遺傳算法抽取原始光譜數(shù)據(jù)的15個(gè)特征波長(zhǎng)的原始光譜數(shù)據(jù);
[0008]3)對(duì)步驟(2)抽取的15個(gè)特征波長(zhǎng)的原始光譜數(shù)據(jù)依次運(yùn)用偏最小二乘法進(jìn)行模式特征分析、再經(jīng)過交互驗(yàn)證判別法完成特征提取、最后建立三層BP神經(jīng)網(wǎng)絡(luò);
[0009]4)采用步驟(3)建立的三層BP神經(jīng)網(wǎng)絡(luò)對(duì)未知樣本進(jìn)行預(yù)測(cè)。
[0010]所述采集原始光譜數(shù)據(jù)的波長(zhǎng)范圍為325-1075nm。
[0011]所述已知樣本均用直徑為40-50mm,高度8_10mm的培養(yǎng)皿盛裝,每個(gè)培養(yǎng)皿裝滿作為一個(gè)實(shí)驗(yàn)樣本。[0012]所述近紅外光譜儀置于已知樣本的正上方,距已知樣本表面90_100mm ;分析譜區(qū)采用了部分的掃描區(qū)間進(jìn)行分析,采用500-750nm范圍的數(shù)據(jù),間隔點(diǎn)為3,即在500_750nm區(qū)間每三個(gè)波長(zhǎng)點(diǎn)選取一個(gè)數(shù)據(jù)點(diǎn)。
[0013]所述原始光譜數(shù)據(jù)預(yù)處理的方法依次為:先對(duì)原始光譜數(shù)據(jù)進(jìn)行SavitzkyGolayDerivatives處理;再采用Savitzky-Golay平滑法對(duì)原始光譜數(shù)據(jù)進(jìn)行處理,選用平滑點(diǎn)數(shù)為9 ;最后對(duì)原始光譜數(shù)據(jù)進(jìn)行SNV處理。運(yùn)用遺傳算法抽取15個(gè)特征波長(zhǎng)分別是:543nm, 378nm, 747nm, 817nm, 730nm, 545nm, 610nm, 663nm, 915nm, 676nm, 582nm,506nm,756nm,459nm,446nm。
[0014]所述BP神經(jīng)網(wǎng)絡(luò)為誤差反向傳播網(wǎng)絡(luò),建立BP神經(jīng)網(wǎng)絡(luò)的方法如下:首先采用主成分分析對(duì)抽取的15個(gè)特征波長(zhǎng)的原始光譜數(shù)據(jù)進(jìn)行壓縮和降維,得到的主成分作為BP神經(jīng)網(wǎng)絡(luò)輸入;BP神經(jīng)網(wǎng)絡(luò)分3層即輸入層、隱含層和輸出層,采用sigmoid激發(fā)函數(shù),并運(yùn)用改進(jìn)的BP算法-LevenberMarquardt方法。
[0015]所述網(wǎng)絡(luò)輸入層、隱含層、輸出層節(jié)點(diǎn)數(shù)分別為7、7、1,其中輸入層的7個(gè)節(jié)點(diǎn)來自PLS分析得到的主成分;最小訓(xùn)練速率為0.1,訓(xùn)練迭代次數(shù)為1000次。
[0016]與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:現(xiàn)有的針對(duì)高粱屬植物的鑒定分類方法是基于細(xì)胞學(xué)方法及DNA檢測(cè)進(jìn)行區(qū)別,這些方法耗時(shí)長(zhǎng),操作過程復(fù)雜。本發(fā)明應(yīng)用近紅外光譜技術(shù)結(jié)合特征波長(zhǎng)提取方法提取15個(gè)特征波長(zhǎng),提取的特征波長(zhǎng)分別是:543nm,378nm,747nm,817nm,730nm,545nm,610nm,663nm,915nm,676nm,582nm,506nm,756nm,459nm,446nm,建立了高粱屬種子類別鑒別的模型,該模型對(duì)未知樣品的預(yù)測(cè)相對(duì)誤差均在4%以下,識(shí)別精度高,該模型的預(yù)測(cè)效果能夠滿足實(shí)際應(yīng)用要求。說明運(yùn)用近紅外光譜可以快速、準(zhǔn)確對(duì)高粱屬種子類別進(jìn)行鑒別。
【專利附圖】
【附圖說明】
[0017]圖1是本發(fā)明的系統(tǒng)框圖;
[0018]圖2是本發(fā)明建模集樣本分類結(jié)果散點(diǎn)分布圖。
【具體實(shí)施方式】
[0019]如圖1所示,本發(fā)明一種基于近紅外光譜的假高粱及其近似物種的快速檢測(cè)方法,包括如下步驟:
[0020]I)利用近紅外光譜儀采集已知樣本的原始光譜數(shù)據(jù),并對(duì)采集到的原始光譜數(shù)據(jù)預(yù)處理;
[0021]2)運(yùn)用遺傳算法抽取原始光譜數(shù)據(jù)的15個(gè)特征波長(zhǎng)的原始光譜數(shù)據(jù);
[0022]3)對(duì)步驟(2)抽取的15個(gè)特征波長(zhǎng)的原始光譜數(shù)據(jù)依次運(yùn)用偏最小二乘法進(jìn)行模式特征分析、再經(jīng)過交互驗(yàn)證判別法完成特征提取、最后建立三層BP神經(jīng)網(wǎng)絡(luò);
[0023]4)采用步驟(3)建立的三層BP神經(jīng)網(wǎng)絡(luò)對(duì)未知樣本進(jìn)行預(yù)測(cè)。
[0024]所述采集原始光譜數(shù)據(jù)的波長(zhǎng)范圍為325_1075nm。
[0025]所述已知樣本均用直徑為40-50mm,高度8_10mm的培養(yǎng)皿盛裝,每個(gè)培養(yǎng)皿裝滿作為一個(gè)實(shí)驗(yàn)樣本。
[0026]所述近紅外光譜儀置于已知樣本的正上方,距已知樣本表面90_100mm ;分析譜區(qū)采用了部分的掃描區(qū)間進(jìn)行分析,采用500-750nm范圍的數(shù)據(jù),間隔點(diǎn)為3,即在500_750nm區(qū)間每三個(gè)波長(zhǎng)點(diǎn)選取一個(gè)數(shù)據(jù)點(diǎn)。
[0027]所述原始光譜數(shù)據(jù)預(yù)處理的方法依次為:先對(duì)原始光譜數(shù)據(jù)進(jìn)行SavitzkyGolayDerivatives處理;再采用Savitzky-Golay平滑法對(duì)原始光譜數(shù)據(jù)進(jìn)行處理,選用平滑點(diǎn)數(shù)為9 ;最后對(duì)原始光譜數(shù)據(jù)進(jìn)行SNV處理。
[0028]運(yùn)用遺傳算法抽取15個(gè)特征波長(zhǎng)分別是:543nm,378nm,747nm,817nm,730nm,545nm,610nm,663nm,915nm,676nm,582nm,506nm,756nm,459nm,446nm。
[0029]所述BP神經(jīng)網(wǎng)絡(luò)為誤差反向傳播網(wǎng)絡(luò),建立BP神經(jīng)網(wǎng)絡(luò)的方法如下:首先采用主成分分析對(duì)抽取的15個(gè)特征波長(zhǎng)的原始光譜數(shù)據(jù)進(jìn)行壓縮和降維,得到的主成分作為BP神經(jīng)網(wǎng)絡(luò)輸入;BP神經(jīng)網(wǎng)絡(luò)分3層即輸入層、隱含層和輸出層,采用sigmoid激發(fā)函數(shù),并運(yùn)用改進(jìn)的BP算法-LevenberMarquardt方法。
[0030]所述網(wǎng)絡(luò)輸入層、隱含層、輸出層節(jié)點(diǎn)數(shù)分別為7、7、1,其中輸入層的7個(gè)節(jié)點(diǎn)來自PLS分析得到的主成分;最小訓(xùn)練速率為0.1,訓(xùn)練迭代次數(shù)為1000次。
[0031]實(shí)施例
[0032]采集對(duì)象為高粱、假高粱、蘇丹草三種高粱屬種子。該檢測(cè)方法也適用于高粱屬其它種子。
[0033]采集范圍在325-1075nm之間的光譜數(shù)據(jù),光譜采樣間隔為1.5nm,掃描次數(shù)30次,探頭視場(chǎng)角為20度。光源采用與光譜儀配套的14.5V鹵素?zé)簟?br>
[0034]三種高粱屬種子共120個(gè)樣本(每個(gè)品種40個(gè))。各種樣本均用直徑為40_50mm,高度8-lOmm的培養(yǎng)皿盛裝。為了減小實(shí)驗(yàn)誤差保證被測(cè)物體與儀器等距,將每個(gè)培養(yǎng)皿裝滿作為一個(gè)實(shí)驗(yàn)樣本。每個(gè)品種各做40個(gè)樣本,共計(jì)120個(gè)樣本。全部實(shí)驗(yàn)樣本隨機(jī)分成建模集和預(yù)測(cè)集,建模集有90個(gè)樣本(每個(gè)品種30個(gè)),預(yù)測(cè)集有30個(gè)樣本(每個(gè)品種10個(gè))。光譜儀經(jīng)白板校準(zhǔn)后進(jìn)行測(cè)試。光譜儀置于樣本的上方,距大米表面90-100mm,對(duì)每一個(gè)樣本掃描20次,取平均值。
[0035]為了去除隨機(jī)噪音、基線漂移、光散射、樣本不均勻等影響,需要對(duì)采集到的光譜數(shù)據(jù)進(jìn)行預(yù)處理。先對(duì)數(shù)據(jù)進(jìn)行SavitzkyGolayDerivatives —階微分處理,平滑點(diǎn)數(shù)設(shè)置為6,用以去除同波長(zhǎng)無關(guān)的漂移。再采用MovingAverageSmoothing平滑法,平滑點(diǎn)數(shù)設(shè)置為9,用以提高分析信號(hào)的信噪比,有效地濾除各種因素產(chǎn)生的高頻噪音。最后對(duì)數(shù)據(jù)進(jìn)行多元散射校正處理,MSC可以去除近紅外漫反射光譜中樣品的鏡面反射及不均勻性造成的噪聲,消除漫反射光譜的基線及光譜的不重復(fù)性。處理后的光譜數(shù)據(jù)作為遺傳算法的輸入。
[0036]遺傳算法控制參數(shù)設(shè)定:初始群體100,遺傳迭代次數(shù)50,交叉概率0.8,變異概率
0.1。將預(yù)處理后的光譜數(shù)據(jù)用GA進(jìn)行波長(zhǎng)篩選,共提取15個(gè)特征波長(zhǎng)作為PLS輸入變量。經(jīng)過主成分分析得出的前面7個(gè)主成分已經(jīng)包含了大部分光譜信息。因此,將這7個(gè)特征變量作為BP神經(jīng)網(wǎng)絡(luò)的輸入變量,即網(wǎng)絡(luò)輸入層、隱含層、輸出層節(jié)點(diǎn)數(shù)分別為7、7、
1。最小訓(xùn)練速率為0.1,設(shè)定訓(xùn)練迭代次數(shù)為1000次,對(duì)輸入樣本進(jìn)行標(biāo)準(zhǔn)化處理。訓(xùn)練集和預(yù)測(cè)集樣本數(shù)為90和30。對(duì)30個(gè)未知樣本的預(yù)測(cè)結(jié)果表明這3個(gè)品種,擬和殘差為
0.0013,30個(gè)樣本的預(yù)測(cè)相對(duì)偏差均在4%以下,即預(yù)測(cè)的正確率可以滿足實(shí)際要求。
[0037]如圖2所示,應(yīng)用近紅外光譜技術(shù)建立了高粱屬種子類別鑒別的模型,該模型的預(yù)測(cè)效果能夠滿足實(shí)際應(yīng)用要求,對(duì)未知樣品的預(yù)測(cè)相對(duì)誤差均在4%以下,識(shí)別精度高。說明運(yùn)用近紅外光譜可以快速、準(zhǔn)確對(duì)高粱屬種子類別進(jìn)行鑒別。采用遺傳算法對(duì)特征波長(zhǎng)進(jìn)行提取,并用偏最小二乘法進(jìn)行主成分分析,最后結(jié)合BP神經(jīng)網(wǎng)絡(luò)對(duì)預(yù)測(cè)樣本進(jìn)行預(yù)測(cè),識(shí)別精度得到了很大提高。采用從PLS分析中得到的主成分作為BP神經(jīng)網(wǎng)絡(luò)的輸入,不但減少了計(jì)算量,加快了訓(xùn)練速率,同時(shí)因?yàn)槿コ斯庾V干擾信息,也提高了預(yù)測(cè)的正確率。因此,應(yīng)用遺傳算法、偏最小二乘法結(jié)合BP神經(jīng)網(wǎng)絡(luò)的模式識(shí)別方法和近紅外光譜技術(shù)可以對(duì)高粱屬種子類別進(jìn)行快速準(zhǔn)確鑒別。
【權(quán)利要求】
1.一種基于近紅外光譜的假高粱及其近似物種的快速檢測(cè)方法,其特征包括如下步驟: 1)利用近紅外光譜儀采集已知樣本的原始光譜數(shù)據(jù),并對(duì)采集到的原始光譜數(shù)據(jù)預(yù)處理; 2)運(yùn)用遺傳算法抽取原始光譜數(shù)據(jù)的15個(gè)特征波長(zhǎng)的原始光譜數(shù)據(jù); 3)對(duì)步驟(2)抽取的15個(gè)特征波長(zhǎng)的原始光譜數(shù)據(jù)依次運(yùn)用偏最小二乘法進(jìn)行模式特征分析、再經(jīng)過交互驗(yàn)證判別法完成特征提取、最后建立三層BP神經(jīng)網(wǎng)絡(luò); 4)采用步驟(3)建立的三層BP神經(jīng)網(wǎng)絡(luò)對(duì)未知樣本進(jìn)行預(yù)測(cè)。
2.根據(jù)權(quán)利要求1所述的一種基于近紅外光譜的假高粱及其近似物種的快速檢測(cè)方法,其特征在于:所述采集原始光譜數(shù)據(jù)的波長(zhǎng)范圍為325-1075nm。
3.根據(jù)權(quán)利要求1所述的一種基于近紅外光譜的假高粱及其近似物種的快速檢測(cè)方法,其特征在于:所述已知樣本均用直徑為40-50mm,高度8_10mm的培養(yǎng)皿盛裝,每個(gè)培養(yǎng)皿裝滿作為一個(gè)實(shí)驗(yàn)樣本。
4.根據(jù)權(quán)利要求1所述的一種基于近紅外光譜的假高粱及其近似物種的快速檢測(cè)方法,其特征在于:所述近紅外光譜儀置于已知樣本的正上方,距已知樣本表面90-100mm;分析譜區(qū)采用了部分的掃描區(qū)間進(jìn)行分析,采用500-750nm范圍的數(shù)據(jù),間隔點(diǎn)為3,即在500-750nm區(qū)間每三個(gè)波長(zhǎng)點(diǎn)選取一個(gè)數(shù)據(jù)點(diǎn)。
5.根據(jù)權(quán)利要求1所述的一種基于近紅外光譜的假高粱及其近似物種的快速檢測(cè)方法,其特征在于:所述原始光譜數(shù)據(jù)預(yù)處理的方法依次為:先對(duì)原始光譜數(shù)據(jù)進(jìn)行SavitzkyGolayDerivatives處理;再采用Savitzky-Golay平滑法對(duì)原始光譜數(shù)據(jù)進(jìn)行處理,選用平滑點(diǎn)數(shù)為9 ;最后對(duì)原始光譜數(shù)據(jù)進(jìn)行SNV處理。
6.根據(jù)權(quán)利要求1所述的一種基于近紅外光譜的假高粱及其近似物種的快速檢測(cè)方法,其特征在于:運(yùn)用遺傳算法抽取15個(gè)特征波長(zhǎng)分別是:543nm,378nm,747nm,817nm,730nm,545nm,610nm,663nm,915nm,676nm,582nm,506nm,756nm,459nm,446nm。
7.根據(jù)權(quán)利要求1所述的一種基于近紅外光譜的假高粱及其近似物種的快速檢測(cè)方法,其特征在于:所述BP神經(jīng)網(wǎng)絡(luò)為誤差反向傳播網(wǎng)絡(luò),建立BP神經(jīng)網(wǎng)絡(luò)的方法如下:首先采用主成分分析對(duì)抽取的15個(gè)特征波長(zhǎng)的原始光譜數(shù)據(jù)進(jìn)行壓縮和降維,得到的主成分作為BP神經(jīng)網(wǎng)絡(luò)輸入;BP神經(jīng)網(wǎng)絡(luò)分3層即輸入層、隱含層和輸出層,采用sigmoid激發(fā)函數(shù),并運(yùn)用改進(jìn)的BP算法-LevenberMarquardt方法。
8.根據(jù)權(quán)利要求7所述的一種基于近紅外光譜的假高粱及其近似物種的快速檢測(cè)方法,其特征在于:所述網(wǎng)絡(luò)輸入層、隱含層、輸出層節(jié)點(diǎn)數(shù)分別為7、7、1,其中輸入層的7個(gè)節(jié)點(diǎn)來自PLS分析得到的主成分;最小訓(xùn)練速率為0.1,訓(xùn)練迭代次數(shù)為1000次。
【文檔編號(hào)】G01N21/359GK103743705SQ201410042766
【公開日】2014年4月23日 申請(qǐng)日期:2014年1月28日 優(yōu)先權(quán)日:2014年1月28日
【發(fā)明者】林萍, 陳永明, 胡國(guó)文 申請(qǐng)人:鹽城工學(xué)院