本發(fā)明涉及農(nóng)業(yè)技術(shù)領(lǐng)域,通過測算水稻種子近紅外光譜中種殼光譜和糙米光譜組成比例,扣除來自種殼的干擾模型的光譜信息,由此優(yōu)化相應(yīng)的近紅外光譜模型。
背景技術(shù):
水稻為禾本科植物,所結(jié)子實即稻谷,是世界主要的糧食作物之一,屬于直接經(jīng)濟作物。稻谷整體可分為兩個部分:稻殼和糙米,其中米是東亞和東南亞人口的主食,營養(yǎng)成分較多,包括:淀粉、蛋白質(zhì)、維生素等,它還可以用于釀酒等傳統(tǒng)行業(yè);稻殼則可以作為飼料等。近紅外(NIR)光譜是物質(zhì)在780-2526nm波長的吸收譜,因其具有無損、快速、多成分、無污染的分析特點,在農(nóng)業(yè)上獲得了廣泛的應(yīng)用。目前,水稻、小麥、大豆、玉米等糧食作物的各類近紅外光譜模型均在不同程度上用于各種領(lǐng)域中,如相應(yīng)的蛋白質(zhì)、淀粉、脂肪、水分等近紅外光譜模型在飼料行業(yè)、糧油行業(yè)、育種行業(yè)等領(lǐng)域發(fā)揮了舉足輕重的作用。
但是,水稻種子的近紅外光譜模型分析難度較高,這主要是因為相對于小麥、大豆,水稻種子含種殼和糙米兩個不同部分,而且種殼、糙米化學(xué)物質(zhì)含量差別較大,只采用一般的的化學(xué)計量學(xué)方法較難建立準確的近紅外光譜模型。所以,目前對于水稻種子還沒有令人滿意的近紅外光譜定量分析模型。在此發(fā)明中,我們設(shè)計和發(fā)明了一種新的水稻種子NIR處理和分析方法,通過分析水稻種殼和糙米部分的近紅外光譜特性,建立了一種對水稻種子近紅外模型優(yōu)化方法。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是為了解決現(xiàn)有技術(shù)中水稻種子的近紅外光譜模型分析難度高、預(yù)測不準確的缺陷,提供一種基于光譜比例扣除的稻谷近紅外光譜模型優(yōu)化方法來解決上述問題。
本發(fā)明通過以下技術(shù)方案來實現(xiàn)上述技術(shù)目的:
一種基于光譜比例扣除的稻谷近紅外光譜模型優(yōu)化方法,包括以下步驟:
1)近紅外平均光譜的計算
多次測定近紅外光譜模型中水稻種子的種子、種殼、糙米的近紅外光譜,得到種子、種殼和糙米近紅外平均光譜;
2)擬合光譜計算
根據(jù)公式:
種子平均光譜=K1×水稻糙米平均光譜+K2×水稻種殼平均光譜,對種子平均光譜進行線性回歸擬合,由此得到系數(shù)K1、K2,使得其擬合結(jié)果與種子平均光譜的標準偏差最?。?/p>
3)近紅外光譜模型的建立
根據(jù)K1、K2系數(shù)大小,扣除近紅外光譜模型中水稻種子光譜包含種殼或糙米部分的重合信息的影響,即得到公式:
糙米的擬合光譜=(種子平均光譜-K2×種殼平均光譜)/K1,
或
種殼的擬合光譜=(種子平均光譜-K1×糙米平均光譜)/K2。
得到擬合光譜后,由此基于擬合光譜建立近紅外光譜模型;
優(yōu)選的,所述步驟1)包括:
11)判斷影響近紅外光譜模型的主要部分
先判斷該模型建立的主要信息存在于水稻哪個部位,再按照光譜組成比例系數(shù)K1和K2去除影響模型準確性的重復(fù)信息;
12)測量種殼和糙米的近紅外光譜
先選取建立近紅外光譜模型的水稻種子樣本群體,然后將群體每粒樣本進行種殼和糙米分離,然后分別對種殼和糙米進行多次近紅外光譜測定,求得種殼和糙米的平均光譜;
優(yōu)選的,所述步驟2)包括:
根據(jù)步驟12)中求得的種殼和糙米的平均光譜,以種子光譜為擬合對象,求得種殼和糙米的組成比例系數(shù)K1、K2。
優(yōu)選的,建立水稻種子水分近紅外光譜模型的方法包括以下步驟:
1)構(gòu)建水稻種子水分梯度
建模集為:將種子分別放置在常溫、20℃、30℃、40℃4個溫度值,11%、43%、75%、97%共4個濕度值,放置不同的時間建立相應(yīng)的水分梯度,共38個點;
預(yù)測集為:將種子分別放置于20℃、25℃、30℃、35℃溫度和11%、43%、75%濕度下5個月的種子,共12個點;
2)建立、分析水稻種子水分近紅外光譜模型
采集建模集和預(yù)測集的水稻種子的近紅外漫反射光譜,波數(shù)范圍為12000-4000cm-1,分辨率16cm-1;去除12000~10500cm-1波數(shù)范圍,選擇10500~4000cm-1波數(shù)范圍,對建模集在均值化處理下建立水稻種子水分偏最小二乘模型,后對預(yù)測集進行預(yù)測分析;
3)判斷影響水分模型的主要部位
通過對種子各部位的含水量的比對,得出影響水稻種子水分模型的主要部位為糙米,應(yīng)按比例扣除種殼的光譜比例;
4)計算光譜組成比例K1、K2
取建模集的種子,通過搖晃反復(fù)測定水稻種子近紅外光譜15次,求得水稻種子的平均光譜;輕輕剝開種殼,用鑷子夾出水稻糙米,后將種殼恢復(fù)原樣,保持其形態(tài)一致,反復(fù)測定近紅外漫反射光譜15次,求得種殼、糙米的平均光譜;再計算糙米光譜、種殼光譜的回歸系數(shù)K1和K2;
5)用擬合光譜替換實際近紅外光譜,重新分析水分模型
以K1、K2為系數(shù),將水分模型中所有建模集和預(yù)測集的種子光譜都按照如下公式處理,即:
糙米擬合光譜=(種子的平均光譜–K2×種殼平均光譜)/K1
然后用求得的糙米擬合光譜代替實際測量的糙米平均光譜,基于擬合光譜而建立新的近紅外光譜模型。
本發(fā)明與現(xiàn)有技術(shù)相比,具有以下有益效果:
水稻種子光譜實際上由水稻種殼和糙米光譜兩部分組成,不同水稻種子中相應(yīng)的組成比例系數(shù)K1和K2不同;能夠根據(jù)K1、K2系數(shù)大小,去除水稻種子近紅外光譜模型中部分干擾模型的非本質(zhì)多余信息的影響,從而可以提升關(guān)于水稻種子中某種成分分析的近紅外光譜模型的預(yù)測準確度。
附圖說明
圖1為本發(fā)明一種基于光譜比例扣除的稻谷近紅外光譜模型優(yōu)化方法實施例1中根據(jù)實際測量近紅外光譜的種子水分模型的建模結(jié)果(a)和預(yù)測結(jié)果(b);
圖2為本發(fā)明實施例1中按照比例扣除干擾因素(種殼)的影響,得到與平均光譜吻合很好的擬合光譜;
圖3為本發(fā)明實施例1中基于擬合光譜的建模結(jié)果(a)和預(yù)測結(jié)果(b)。
具體實施方式
為使對本發(fā)明的結(jié)構(gòu)特征及所達成的功效有更進一步的了解與認識,用以較佳的實施例及附圖配合詳細的說明,說明如下:
本發(fā)明是一種通過測量和分析稻谷在近紅外光譜中糙米和種殼光譜的組成比例去優(yōu)化稻谷近紅外光譜模型的方法。包括以下步驟:
步驟1.判斷影響近紅外光譜模型的主要部分
按照光譜組成比例去除干擾模型的信息以前,我們需要先判斷該模型分析的主要信息存在于水稻哪個部位。比如:對于建立水稻種子水分模型,水稻種子中水分主要存在于糙米部分之中,那么,我們需按照一定的光譜比例去除來自種殼的干擾模型建立的光譜信息。
步驟2.測量種殼和糙米近紅外光譜
由于不同的水稻種子其近紅外光譜中糙米和種殼光譜的組成比例不同,所以我們必須選取用于建立近紅外光譜模型的水稻種子為樣本。對樣本群體反復(fù)測定近紅外光譜多次,次數(shù)越多,平均光譜越穩(wěn)定,建立模型越準確。測量時,將樣本群體小心剝開,注意盡量保持樣本狀態(tài)一致,后分別對糙米、種殼反復(fù)測定近紅外光譜多次,由此求平均光譜。
步驟3.計算種殼、糙米組成比例系數(shù)K1、K2
選擇合適的近紅外光譜模型的建模波數(shù)范圍,以種子光譜為擬合對象,按以下公式:
種子近紅外光譜=K1×糙米近紅外光譜+K2×種殼近紅外光譜(1)
通過線性回歸方法擬合種子近紅外光譜,使得其擬合結(jié)果與種子光譜的標準偏差(RMSE)最小,由此可以得到糙米和種殼光譜組成比例系數(shù)K1、K2。
步驟4.根據(jù)種子的擬合光譜建立近紅外光譜模型
將上述K1、K2系數(shù)用于建立近紅外光譜模型;即:由公式(1)推得的擬合光譜代替實際測量的近紅外光譜,由此建立新的近紅外光譜分析模型。
比如:優(yōu)化水稻種子水分模型過程中,首先計算糙米、種殼的組成比例系數(shù)K1、K2,由于影響其模型的主要部分為糙米,所以按照公式(1)得到:
糙米的擬合光譜=(種子平均光譜-K2×種殼平均光譜)/K1(2)
即:扣除稻谷水分模型中種殼重合信息的影響,然后重新建立相應(yīng)的種子水分的近紅外光譜模型。
實施例1
建立水稻種子水分近紅外光譜模型,具體步驟為:
步驟1.構(gòu)建水稻種子水分梯度
本實施例中,我們將此方法用于分析9311常規(guī)稻群體種子近紅外光譜水分模型,平均模型的建模集為:將水稻種子分別放置在常溫、20℃、30℃、40℃4個溫度值,11%、43%、75%、97%共4個濕度值,放置不同的時間建立相應(yīng)的水分梯度,共38個點。不同溫度、不同時間、不同濕度的構(gòu)建方法能夠有效避免模型內(nèi)部非水分的變量同水分變化產(chǎn)生相同的變化趨勢,影響模型的后續(xù)分析。
預(yù)測集則是將9311種子分別放置于20℃、25℃、30℃、35℃溫度和11%、43%、75%濕度下5個月的種子,共12個點。
雖然相對于其它農(nóng)作物的近紅外光譜模型,此模型數(shù)目較少,但由于水分與近紅外光譜相關(guān)性較強,且本模型中采用的是同種常規(guī)稻9311種子,所以變量數(shù)較少,滿足分子光譜多元校正定量分析通則(GBT 29858-2013)中校正集的數(shù)目要求。
步驟2.建立、分析水稻種子水分模型
使用德國布魯克MPA近紅外光譜儀采集水稻種子的近紅外漫反射光譜,波數(shù)范圍為12000-4000cm-1,分辨率16cm-1。去除12000~10500cm-1波數(shù)范圍(這部分光譜噪聲大),選擇10500~4000cm-1波數(shù)范圍,利用Unscramble9.5軟件對建模集在均值化處理下建立水稻種子水分偏最小二乘模型,后對預(yù)測集進行預(yù)測分析;結(jié)果如圖1(a)、圖1(b)所示。
步驟3.判斷影響水分模型的主要部位
采用烘干法測得9311種子含水量為11.758%,糙米含水量為12.733%,種殼含水量為7.937%種子中糙米比重較大,且種殼透氣性較好,水分揮發(fā)速度較快,所以我們認為影響水稻種子水分模型的主要部位為糙米,應(yīng)該扣除種殼的光譜比例。
步驟4.計算光譜組成比例K1、K2
取建模集的種子,通過搖晃反復(fù)測定水稻種子近紅外光譜15次,求得水稻種子的平均光譜;輕輕剝開種殼,用鑷子夾出水稻糙米,后將種殼恢復(fù)原樣,保持其形態(tài)一致,然后同種子一樣,反復(fù)測定近紅外漫反射光譜15次,求得種殼、糙米的平均光譜。通過線性回歸擬合的方法計算糙米光譜、種殼光譜的組成比例系數(shù)K1和K2。在本例中,根據(jù)擬合光譜與種子光譜的標準偏差最小,由此得到K1=0.428,K2=0.633。
步驟5.用擬合光譜替換實際測量的種子近紅外光譜,重新建立和分析新的水分模型
以K1、K2為系數(shù),將所有建模集和預(yù)測集的種子光譜都按照如下公式(2)處理,即:
水分模型中各組糙米擬合光譜=(水分模型中各組種子的平均光譜–K2×水分模型中各組種子種殼平均光譜)/K1;
然后用上述糙米擬合光譜代替實際測量光譜,建立水分的近紅外光譜模型,與未扣除重合信息前的近紅外光譜模型進行對比,如圖3(a)、圖3(b)所示,結(jié)果為:扣除種殼信息的近紅外光譜模型在預(yù)測能力上明顯提高,其中RMSEP降低0.357,平均絕對偏差降低0.2085,如表1。
另外,我們發(fā)現(xiàn):與基于原始測量光譜相比,擬合光譜模型的變量殘余信息在前4個主成分較少,并且較少的主成分可以得到較高的預(yù)測準確度,如表2所示,這說明我們本專利的發(fā)明方法確實可以提升種子近紅外分析與預(yù)測能力。
綜上所述,我們提出這種新的基于光譜比例扣除的方法,可以優(yōu)化稻谷近紅外光譜模型,并且通過具體實例,說明我們的方法確實成功優(yōu)化了水稻種子水分模型,提高了預(yù)測種子水分含量的準確度,由此證明了此方法的有效性。
以上顯示和描述了本發(fā)明的基本原理、主要特征和本發(fā)明的優(yōu)點。本行業(yè)的技術(shù)人員應(yīng)該了解,本發(fā)明不受上述實施例的限制,上述實施例和說明書中描述的只是本發(fā)明的原理,在不脫離本發(fā)明精神和范圍的前提下本發(fā)明還會有各種變化和改進,這些變化和改進都落入要求保護的本發(fā)明的范圍內(nèi)。本發(fā)明要求的保護范圍由所附的權(quán)利要求書及其等同物界定。