技術(shù)領(lǐng)域:
:本發(fā)明涉及水果的近紅外無(wú)損檢測(cè)
技術(shù)領(lǐng)域:
,具體涉及一種基于近紅外光譜技術(shù)的蘋果分類方法。
背景技術(shù):
::蘋果是世界四大水果之一,也是中國(guó)第一大水果,我國(guó)蘋果的總產(chǎn)量、栽培面積、人均占有量與出口量均居世界第一,已成為世界上最大的蘋果生產(chǎn)和消費(fèi)國(guó),在果品的生成、消費(fèi)和對(duì)外貿(mào)易中占有舉足輕重的地位。蘋果的采后處理、品質(zhì)判斷以及檢測(cè)一直是農(nóng)產(chǎn)品加工研究的重要課題。隨著生活水平的日益提升,消費(fèi)者對(duì)優(yōu)秀品種的蘋果需求越來(lái)越大,但市場(chǎng)上以次充好的現(xiàn)象屢禁不止,蘋果品種的鑒別變得越來(lái)越重要。所以,研究一種快速、非破壞的蘋果品種鑒別方法是非常必要的。近紅外光譜區(qū)是指波長(zhǎng)在780-2526nm范圍內(nèi)的電磁波,是分子振動(dòng)光譜倍頻和合頻吸收譜。近紅外光譜主要是由于分子振動(dòng)的非諧振性使得分子振動(dòng)從基態(tài)向高能級(jí)躍遷時(shí)產(chǎn)生的,記錄的主要是含氫基團(tuán)振動(dòng)的倍頻和合頻吸收。不同基團(tuán)(如甲基、苯環(huán)等)或統(tǒng)一基團(tuán)在不同化學(xué)環(huán)境中的近紅外吸收波長(zhǎng)與強(qiáng)度都有明顯差別,近紅外光譜具有豐富的結(jié)構(gòu)和組成信息,非常適合用于碳?xì)溆袡C(jī)物質(zhì)的組成與性質(zhì)的測(cè)量。支持向量機(jī)是一種有監(jiān)督的機(jī)器學(xué)習(xí)算法(vapnikvn,vapnikv.statisticallearningtheory[m].newyork:wiley,1998.),可用于模式分類和非線性回歸。支持向量機(jī)的主要思想是建立一個(gè)分類超平面作為決策曲面,使得正例和反例之間的隔離邊緣被最大化;支持向量機(jī)的理論基礎(chǔ)是統(tǒng)計(jì)學(xué)習(xí)理論,更精確地說(shuō),支持向量機(jī)是結(jié)構(gòu)風(fēng)險(xiǎn)最小化的近似實(shí)現(xiàn)。目前,大多數(shù)水果內(nèi)部品質(zhì)的質(zhì)量檢測(cè)仍然沿用化學(xué)分析方法?;瘜W(xué)分析方法具有較高的準(zhǔn)確度與可靠性,但是,該類方法屬于破壞性檢測(cè),消耗大量的人力且檢測(cè)時(shí)間較長(zhǎng)。技術(shù)實(shí)現(xiàn)要素::為了解決上述存在的問題,本發(fā)明提供了一種基于近紅外光譜的蘋果分類方法。該方法利用usb2000+vis-nir-es微型光譜儀和oceanview光譜采集軟件,在340-1022nm特征波段范圍內(nèi),采用漫反射的模式,隨機(jī)選取每個(gè)蘋果樣品的環(huán)赤道面上的15個(gè)點(diǎn)進(jìn)行光譜采集,對(duì)每一個(gè)樣本的15個(gè)采集點(diǎn)采集到的光譜數(shù)據(jù)求平均值,用主成分分析方法對(duì)平均之后的光譜數(shù)據(jù)進(jìn)行降維處理。對(duì)于相同種類的蘋果標(biāo)記同一標(biāo)簽值,對(duì)于不同種類的蘋果標(biāo)記不同的標(biāo)簽值。利用處理后的光譜數(shù)據(jù)、蘋果種類標(biāo)簽值以及支持向量機(jī)學(xué)習(xí)算法建立蘋果品種的分類模型。本發(fā)明屬于有監(jiān)督學(xué)習(xí)方法,需要一定的學(xué)習(xí)樣本,能夠快速、無(wú)損地分類蘋果。本發(fā)明依據(jù)的原理:研究表明,蘋果的近紅外漫反射光譜中包含了蘋果內(nèi)部的物理化學(xué)性質(zhì)的信息,例如:酸度、可溶性固形物等。品種不同的蘋果所對(duì)應(yīng)的近紅外漫反射光譜也不同。利用一些樣本信息以及支持向量機(jī)算法建立的模型能夠有效實(shí)現(xiàn)不同蘋果品種的分類。根據(jù)上述原理,采用的技術(shù)方案包括一下步驟:步驟1、物料準(zhǔn)備:準(zhǔn)備一批由不同種類的蘋果組成的待測(cè)樣品,需要保證樣品中同一種類的蘋果大小尺寸近似,并且確保蘋果樣品表面沒有明顯腐爛或霉變的現(xiàn)象發(fā)生。隨機(jī)從每一個(gè)品種的蘋果樣本中挑選少量樣品作為測(cè)試集,其余的蘋果樣品作為訓(xùn)練集。步驟2、在室溫環(huán)境(23-25℃)下,蘋果樣本近紅外光譜的采集:針對(duì)不同品種的蘋果樣本,利用近紅外光譜儀對(duì)蘋果樣品進(jìn)行測(cè)量,通過oceanview軟件獲得蘋果樣本的近紅外漫反射光譜數(shù)據(jù)。步驟3、對(duì)蘋果樣本近紅外光譜數(shù)據(jù)進(jìn)行預(yù)處理:將得到的光譜文本數(shù)據(jù)統(tǒng)一整理輸入matlabr2014b軟件,為了減少誤差,需要隨機(jī)測(cè)量蘋果環(huán)赤道面上15個(gè)點(diǎn)的光譜數(shù)據(jù),并對(duì)15組光譜數(shù)據(jù)求平均值,然后利用主成分分析方法(pca)對(duì)平均光譜數(shù)據(jù)進(jìn)行降維處理,并保存這些數(shù)據(jù)。步驟4、獲取不同種類蘋果的標(biāo)簽值:對(duì)不同種類的蘋果樣品標(biāo)記不同的標(biāo)簽值,對(duì)同一種類的蘋果樣品標(biāo)記相同的標(biāo)簽值,記錄所有蘋果樣品的標(biāo)簽值。步驟5、分類模型的建立:利用經(jīng)過預(yù)處理的訓(xùn)練集蘋果樣品的近紅外光譜數(shù)據(jù),訓(xùn)練集蘋果樣品的標(biāo)簽值以及支持向量機(jī)算法,建立蘋果品種分類模型,利用該模型可以對(duì)不同品種的蘋果進(jìn)行分類。所述步驟2中近紅外漫反射光譜信息是指光譜范圍為340-1022nm,采集到的每個(gè)蘋果樣本的光譜是2047維的數(shù)據(jù)。所述步驟3中用主成分分析方法進(jìn)行降維時(shí),在滿足主成份的累計(jì)可信度≥95%的條件下選取主成分個(gè)數(shù)。本發(fā)明具有如下優(yōu)點(diǎn):利用近紅外光譜技術(shù)實(shí)現(xiàn)了對(duì)于不同種類蘋果的快速無(wú)損分類,通過測(cè)試集對(duì)蘋果分類模型進(jìn)行檢驗(yàn),分類準(zhǔn)確率達(dá)到了96.67%。該試驗(yàn)平臺(tái)操作方法簡(jiǎn)答、易于控制、檢測(cè)精度高。本發(fā)明可用于蘋果的在線分類檢測(cè)。附圖說(shuō)明:通過參考附圖能夠更加清楚地了解本發(fā)明的特征,附圖是示意性的而不應(yīng)理解為對(duì)本發(fā)明進(jìn)行任何限制,在附圖中:圖1是本發(fā)明的流程圖;圖2是蘋果樣本的近紅外光譜圖;具體實(shí)施方式:下面對(duì)本發(fā)明技術(shù)方案進(jìn)行詳細(xì)說(shuō)明,但是本發(fā)明的保護(hù)范圍不局限于所述實(shí)施例。所述方法如無(wú)特別說(shuō)明均為常規(guī)方法。所述原料如無(wú)特別說(shuō)明均能從公開商業(yè)途徑獲得。下述實(shí)施例每步驟的數(shù)據(jù)處理均通過美國(guó)mathworks公司出售的科學(xué)計(jì)算軟件matlabr2014b編程處理,光譜數(shù)據(jù)的獲取通過美國(guó)海洋光學(xué)公司出售的軟件oceanview獲取并轉(zhuǎn)換出.txt格式的光譜數(shù)據(jù)。本發(fā)明適用于不同種類蘋果的品種分類,實(shí)施流程如圖1所示,具體實(shí)施如下:步驟一、物料準(zhǔn)備:在當(dāng)?shù)厥袌?chǎng)購(gòu)買富士、嘎啦、澳洲青蘋以及國(guó)光等4個(gè)不同種類的蘋果共213個(gè),其中富士蘋果57個(gè),嘎啦蘋果30個(gè),國(guó)光蘋果35個(gè),澳洲青蘋89個(gè),購(gòu)買時(shí)需要確保同一個(gè)種類中的樣品大小尺寸接近,并且所有蘋果樣品的表面無(wú)明顯的腐爛或霉變的現(xiàn)象發(fā)生。隨機(jī)挑選嘎啦蘋果5個(gè),國(guó)光蘋果5個(gè),富士蘋果10個(gè),澳洲青蘋10個(gè)共30個(gè)蘋果作為測(cè)試集,其余蘋果樣本作為訓(xùn)練集。步驟二、蘋果樣本近紅外光譜的采集:在恒溫恒濕的環(huán)境下,將近紅外光譜檢測(cè)設(shè)備連接,接通電源,將光源預(yù)熱30分鐘,待光源溫度穩(wěn)定后,采用漫反射模式采集所有蘋果樣品的近紅外光譜,光譜范圍為340-1022nm,采集到的每個(gè)樣品的光譜是2047維的數(shù)據(jù)。對(duì)于每一個(gè)蘋果樣品,為減少誤差,隨機(jī)選擇蘋果環(huán)赤道面上的15個(gè)點(diǎn)進(jìn)行掃描,獲取這15個(gè)點(diǎn)的光譜數(shù)據(jù)后,取其平均值作為最終的實(shí)驗(yàn)數(shù)據(jù),如表1。表1、經(jīng)過求平均值處理后的蘋果樣品近紅外光譜數(shù)據(jù)表步驟三、蘋果樣本近紅外光譜數(shù)據(jù)的降維處理:采用主成分分析法將蘋果樣本的近紅外光譜數(shù)據(jù)從2047維降到容易處理的低維數(shù)據(jù)。通過計(jì)算可知,近紅外光譜數(shù)據(jù)經(jīng)過處理后,前i個(gè)主成分的累計(jì)可信度如表2所示(累計(jì)可信度=前i個(gè)主成分特征值除以總的特征值之和)。若取前2個(gè)主成分,則累計(jì)可信度可達(dá)%;若取前個(gè)主成分,則累計(jì)可信度可達(dá)100%。表2、主成分累計(jì)可信度步驟四、獲取蘋果樣品的種類標(biāo)簽值:人工標(biāo)記蘋果樣品的種類標(biāo)簽值,對(duì)于不同種類的蘋果樣品標(biāo)記不同的標(biāo)簽值,對(duì)于同一種類的蘋果樣品標(biāo)記相同的標(biāo)簽值,并且記錄所有蘋果樣品的標(biāo)簽值。步驟五、蘋果分類模型的建立:利用經(jīng)過預(yù)處理的訓(xùn)練集蘋果樣品近紅外光譜數(shù)據(jù)以及訓(xùn)練集蘋果樣品的標(biāo)簽數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),結(jié)合支持向量機(jī)算法,建立蘋果分類模型。在本例中,支持向量機(jī)中的核函數(shù)使用徑向基核函數(shù),其余參數(shù)均使用默認(rèn)值。對(duì)待測(cè)樣本的近紅外光譜數(shù)據(jù)預(yù)處理辦法務(wù)必與建立分類模型時(shí)數(shù)據(jù)預(yù)處理辦法相同,在完成數(shù)據(jù)輸入,模型載入后可完成對(duì)待測(cè)蘋果樣品品種的分類及預(yù)測(cè)種類的讀取。實(shí)例中試驗(yàn)以183個(gè)樣本為訓(xùn)練集,建立蘋果分類模型。再利用該分類模型對(duì)測(cè)試集30個(gè)樣本進(jìn)行預(yù)測(cè),得到品種分類結(jié)果。表3、測(cè)試集樣本品種預(yù)測(cè)值與真實(shí)值統(tǒng)計(jì)表編號(hào)預(yù)測(cè)值真實(shí)值1富士蘋果富士蘋果2富士蘋果富士蘋果…富士蘋果富士蘋果21富士蘋果嘎啦蘋果…嘎啦蘋果嘎啦蘋果29國(guó)光蘋果國(guó)光蘋果30國(guó)光蘋果國(guó)光蘋果表3為測(cè)試集30個(gè)蘋果樣品在分類模型下個(gè)蘋果樣本的品種預(yù)測(cè)值與真實(shí)值統(tǒng)計(jì)表,由表3可知,30個(gè)預(yù)測(cè)樣本中,只有1個(gè)樣本預(yù)測(cè)錯(cuò)誤,分類準(zhǔn)確率達(dá)到了96.67%。如上所述,盡管參照特定的實(shí)施例已經(jīng)表示和表述了本發(fā)明,但其不得解釋為對(duì)本發(fā)明自身的限制。在不脫離所附權(quán)利要求定義的本發(fā)明的精神和范圍的前提下,可對(duì)其在形式上和細(xì)節(jié)上作出各種變化。當(dāng)前第1頁(yè)12