本發(fā)明屬于光譜分析技術領域,具體涉及一種基于小波變換激光誘導擊穿光譜的谷類作物產地鑒別方法,該方法能夠直接對不同產地的谷類作物進行光譜信號采集,提高了檢測的效率。
背景技術:
食品質量安全是全世界廣為關注的焦點,關注食品安全就是關注健康。水稻是最主要的三大糧食作物之一,播種面積占糧食播種面積的1/5,年產量約4.8億噸,占世界糧食總產量的1/4,全世界1/2以上的人口以水稻為主食,同時也是我國最主要的栽培作物之一。近年來,食品安全問題頻發(fā),如“鎘大米”、“劣質大米冒充優(yōu)質大米”等事件,致使消費者迫切期待能夠對所購買食品溯源有一個全面的了解。食品溯源的鑒別不僅有利于實施地方特色產品的保護,更有利于快速控制問題食品的來源。
食品溯源追蹤技術主要分為兩大類:傳統(tǒng)的電子信息編碼技術和新型的綜合性溯源技術。綜合性溯源技術包含礦物元素分析技術、穩(wěn)定同位素技術和其他成分分析技術。常用的礦物元素分析方法主要有紫外-可見分光光度法、原子光譜法、電感耦合等離子體質譜法和儀器中子活化法等。中國專利文獻《一種基于礦物質分析技術的大米產地鑒定方法與應用》(公告號為104914156A,公告日為2015年9月16日)公開了一種采用電感耦合等離子體質譜(Inductively Coupled Plasma Mass Spectrometry,ICP-MS)測定大米中礦物質元素含量進行大米產地分類的方法。該方法在大米產地分類中獲得了較高的識別精度,但由于在分析中需要對樣品進行濕法消解,使得檢測過程復雜、分析速度慢,且易造成二次污染,不能滿足工業(yè)應用的需求。
激光誘導擊穿光譜(Laser-induced Breakdown Spectroscopy,LIBS)技術是一種基于激光誘導等離子體發(fā)射光譜分析的物質成分分析方法,因具有制樣簡單、分析快速、多元素同時分析等優(yōu)點,已廣泛應用于工業(yè)、生物醫(yī)療、食品和土壤等領域。LIBS技術通過獲取等離子體發(fā)射譜線的強度信息來確定被測樣品中成分組成,而實際的LIBS光譜是多個元素特征譜線組成,在譜線的提取過程中,譜線過多過少影響分析的準確度,而譜峰選擇通常需要對光譜進行一一查找,譜峰尋找過程耗時、復雜,因此急需采取一種自動化選擇特征譜峰的方法。
中國專利文獻《一種基于小波變換的煤質特性測量方法》(公告號為CN103543132A,公告日為2014年1月29日)公開了一種基于小波變換的去噪方法用于扣除LIBS光譜的環(huán)境噪聲和背景噪聲,將去噪后的小波系數代入偏最小二乘定標模型,能夠提高定標模型的測量精度。小波變換雖然在定量分析中取得了不錯的結果,采用小波變換譜峰提取的定性分析有效性尚未可知。
由于存在上述缺陷和不足,本領域亟需做出進一步的完善和改進,設計一種谷類作物產地鑒別方法,使其能夠避免噪音干擾,快速準確地對谷類作物的產地進行識別,以便現在食品安全管理的需要。
技術實現要素:
針對現有技術的以上缺陷或改進需求,本發(fā)明提供了一種基于小波變換激光誘導擊穿光譜的谷類作物產地鑒別方法,是一種基于連續(xù)小波變換的譜峰自動提取方法,該方法包括連續(xù)小波變換的譜峰自動提取,SVM分類模型和產地識別三個過程,目的在于進一步提高LIBS對谷類作物產地鑒別,以期達到快速準確識別的目的。該方法避免了針對傳統(tǒng)的谷類作物產地鑒別檢測效率低,檢測過程復雜的缺點,能夠直接對不同產地谷類作物進行光譜信號采集,縮短了樣品制樣時間和復雜的化學分析過程,避免了二次污染,提高了檢測的效率,十分適用于食品溯源地的監(jiān)控。
為實現上述目的,按照本發(fā)明的一個方面,提供了一種基于小波變換激光誘導擊穿光譜的谷類作物產地鑒別方法,其特征在于,具體包括如下步驟:
S1.準備不同產地的谷類作物樣品,利用激光誘導擊穿光譜(LIBS)對谷類作物樣品進行光譜數據采集;
S2.利用小波變換對步驟S1中采集的谷類作物樣品光譜進行譜峰提取,得到不同產地谷類作物的譜峰強度值;
S3.結合步驟S2中提取的谷類作物譜峰強度值,建立SVM分類模型:
S4.根據步驟S1-S2中得到的光譜數據和譜峰強度值,結合步驟S3中建立的SVM分類模型,對未知的谷類作物進行產地識別。
進一步優(yōu)選地,在步驟S1中,利用LIBS對不同產地谷類作物樣品直接進行檢測時,對n個不同產地的谷類作物進行LIBS光譜數據采集,每種產地谷類作物樣品采集m個等離子體光譜,共獲得N=n×m個等離子體光譜,
其中,n為不同谷類作物產地,n=1,2,…,1000,m為LIBS采集的每種樣品的光譜幅數,m=1,2,…,1000。
優(yōu)選地,在步驟S2中,采用小波變化進行譜峰強度值提取的過程具體包括如下步驟:
S2.1對LIBS光譜信號進行連續(xù)小波分解:
選用墨西哥帽小波函數系列,分別對光譜信號進行連續(xù)小波分解,每種小波函數對應的分解層數為s,位移步長為t;
S2.2通過局域最大值方式對s層的小波變換選擇脊線,從而得到相應位置的譜峰,并剔除脊線所對應重復的譜峰位置;
S2.3設定信背比和信噪比雙閾值對步驟S2.2中脊線選擇后的譜峰進一步篩選,得到p個譜峰強度值作為算法分析指標;
S2.4信噪比與信背比閾值選擇后的譜峰距離較近導致仍有部分譜峰產生重疊,剔除相隔0.1nm波長范圍內重疊的t個譜峰強度值,最終每種谷類作物得到p-t個譜峰強度值;
S2.5由小波函數提取得到的不同產地谷類作物的等離子體光譜的p-t個譜峰強度值進行歸一化處理,即選擇p-t個譜峰強度值中的一個特征譜線強度對其他p-t-1個譜峰強度值作歸一化處理。
優(yōu)選地,在步驟S2.3中,所述信背比的值為采集的光譜強度值減去背景信號強度值后除以背景值,所述信噪比的值為采集的光譜強度值減去背景信號強度值后除以噪聲值。
優(yōu)選地,在步驟S3中,SVM分類模型將線性不可分的數據通過構造內核映射函數的方式映射到高維空間中,從而在高維空間得到線性區(qū)分,所述內核映射函數采用徑向基函數;將N組谷類作物光譜數據,選擇部分組譜峰強度值作為訓練集,用于建立支持向量機模型,將剩余組譜峰強度值作為模型測試集,用于測試所建立支持向量機模型識別精度。
優(yōu)選地,在步驟S4中進行產地識別時,具體步驟如下:
S41.按照步驟S1-S2對待識別谷類作物進行光譜數據采集、小波譜峰提取,得到若干組谷類作物光譜數據;
S42.利用步驟S3中建立的不同產地谷類作物的SVM分類模型,對未知產地的光譜數據進行分類,從而得到相應的產地預測。
總體而言,通過本發(fā)明所構思的以上技術方案與現有技術相比,具備以下優(yōu)點和有益效果:
(1)本發(fā)明方法與傳統(tǒng)的谷類作物產地識別方法相比,不需要復雜的化學前處理,本發(fā)明通過激光誘導擊穿光譜技術直接對不同產地谷類作物進行光譜信號采集,縮短了樣品制樣時間和復雜的化學分析過程,避免了二次污染,提高了檢測的效率。
(2)本發(fā)明基于連續(xù)小波變換對LIBS譜峰自動提取的方法,并結合SVM分類模型對不同產地的谷類作物進行鑒別,具有快速,綠色,識別準確度高的優(yōu)點。本發(fā)明采用支持向量機算法,結合LIBS快速物質分析的優(yōu)點,對不同產地的谷類作物進行快速、準確分類。本發(fā)明方法僅采用連續(xù)小波變換對谷類作物特征譜線進行提取,縮短譜峰提取的時間。
(3)本發(fā)明方法靈活度高,還可以與其他智能算法如遺傳算法(Genetic Algorithm,GA)、隨機森林(Random Forest,RF)、神經網絡(Artificial Neural Network,ANN)等方法相結合,進一步提高分類的準確性。
(4)本發(fā)明方法不局限谷類作物的產地識別,同樣適用其他物質的識別。且方法具有檢測成本低,檢測效率高、檢測結果精度高等優(yōu)點,十分適用于食品安全的監(jiān)控。
附圖說明
圖1為本發(fā)明實例提供的LIBS光譜采集裝置的結構示意圖;
圖2位本發(fā)明的基于小波變換激光誘導擊穿光譜的谷類作物產地鑒別方法的流程圖。
在所有附圖中,相同的附圖標記用來表示相同的元件或結構,其中:
其中,1-激光器;2-激光波長反射鏡;3-聚焦透鏡;4-待測樣品;5-信號采集裝置;6-光纖;7-光譜儀;8-觸發(fā)線;9-ICCD;10-數據線;11-位移平臺;12-計算機。
具體實施方式
下面結合具體實施例對本發(fā)明的具體實施方式進一步說明。在此需要說明的是,對于這些實施方式的說明用于幫助理解本發(fā)明,但并不構成對本發(fā)明的限定。此外,下面所描述的本發(fā)明各個實施方式中所涉及到的技術特征只要彼此之間未構成沖突就可以相互組合。
由于谷類作物生長環(huán)境的不同,直接導致不同產地生長出來的同種谷類作物之間的成分含量存在差異,因此根據谷類作物中的物質成分來對不同產地的谷類作物進行區(qū)分是可行的。本發(fā)明實例提供的一種基于小波變換的激光誘導擊穿光譜谷類作物產地鑒別方法。
本發(fā)明方法包括連續(xù)小波變換的譜峰自動提取,SVM分類模型和產地識別三個過程,具體包括下述步驟:
S1.樣品的LIBS光譜數據采集
利用激光誘導擊穿光譜對不同產地的谷類作物樣品直接進行檢測,對n個不同產地的谷類作物進行LIBS光譜數據采集,每種產地谷類作物樣品采集m個等離子體光譜,共獲得N=n×m個等離子體光譜,其中,n為不同谷類作物產地,n=1,2,…,1000,m為LIBS采集的每種樣品的光譜幅數,m=1,2,…,1000;
S2.連續(xù)小波變換的自動譜峰提取
利用連續(xù)小波變換對谷類作物樣品的光譜進行譜峰強度值提取,具體包括下述過程:
S2.1對LIBS光譜信號進行小波分解:
選用墨西哥帽小波函數系列,分別對光譜信號進行小波分解,每種小波函數對應的分解層數為s,位移步長為t,具體抽象公式如下所示:
其中s為分解層數,s=1,2,…,t為位移步長,t=1,2,…;ψ為墨西哥帽小波函數;
S2.2通過局域最大值方式對s層的變換選擇脊線(每個譜峰歸屬于一條脊線),從而得到相應位置的譜峰,并剔除重復的譜峰位置;具體實施如下:對光譜信號進行連續(xù)小波變換,獲得二維小波系數矩陣;在每一個尺度內,求出小波系數矩陣的局域最大值點對應的位置;通過左右偏移2個像素點相對應的局域最大值組成一條脊線,遍歷所有尺度,將滿足條件的局域最大值點依次添加到脊線中,并剔除只包含兩個局域最大值以下的脊線,然后將選出每條脊線在其左右5個像素內找到最大值強度最為譜峰;
S2.3通過信背比閾值(信背比具體的計算是通過采集的光譜強度值減去背景信號強度值除以背景值)和信噪比閾值(信噪比具體的計算是通過采集的光譜強度值減去背景信號強度值除以噪聲值)對譜峰進行篩選,具體操如下:步驟S2.2所得到的譜峰,在其譜峰位置左右500個像素點內以25個像素點為計算噪聲和譜峰背景的波長范圍(不包括譜峰位置),步長為5,依次循環(huán),取得計算得到的最大信背比和信噪比作為該譜峰光譜強度的信背比和信噪比,并與預先設定的信背比、信噪比閾值進行比較,剔除在閾值之下的譜峰;最終得到p個譜峰強度值作為算法分析指標,p為譜峰強度值數目,p=1,2,…,10000;
S2.4剔除相隔0.1nm波長范圍內重疊的t個譜峰(光譜儀的分辨率為0.05nm左右),具體操作:由步驟S2.3選擇出來的譜峰依舊有重疊,將兩兩相距0.1nm波長范圍內的譜峰進行剔除,即找到0.1nm范圍內對應的最大光譜強度作為距離為0.1nm波長范圍的譜峰,t為剔除的譜峰數目,t=1,2,…,5000。最終得到p-t個譜峰強度值數目;
S2.5由小波函數提取得到的不同產地谷類作物的等離子體光譜的p-t個譜峰強度值進行歸一化處理,具體就是選擇p-t個譜峰強度值中的一個特征譜線強度對其他p-t-1個譜峰強度值作歸一化處理(一般生物類樣品采用C I 247.85nm的強度進行歸一化處理,通常經過前述步驟的譜峰選擇,C I 247.85nm在所選譜線的范圍之內,如果不在則單獨對C I 247.85nm進行相應的提取);
S3.建立SVM分類模型:
SVM分類模型將線性不可分的數據通過構造內核映射函數的方式映射到高維空間中,從而在高維空間得到線性區(qū)分,所述內核映射函數采用徑向基函數;
訓練SVM分類模型的數學過程如下:設訓練集中每個實例為(Xi,yi),i=1,…,n,Xi,yi分別表示第i個樣本數據和其對應的標簽值,其中Xi(xi1,xi2,…,xir)∈Rr,Rr表示訓練樣本數據集,r表示屬性值的數目;yi∈{1,2,3,…},1,2,3,…為每組屬性值的標簽值。算法重要的特點是將線性不可分的數據通過構造核函數的方式映射到高維空間中,從而在高維空間得到線性區(qū)分。本發(fā)明選擇徑向基函數(Radial Basis Function,RBF)作為內核映射函數:
由此得到的非線性SVM分類器方程為:
約束條件:
其中,表示預測集的樣本數據;表示預測集樣本的映射函數;表示二范數距離;l表示訓練集的數目;αi為拉格朗日乘子;b為方程中的偏置因子;c為懲罰參數,g為映射內核參數。
由方程可看出c,g參數對模型建立有重要影響。一般設置c、g的選擇范圍:c=2e,g=2w,e、w∈{-10,-9,…,9,10}。
本發(fā)明實例采用支持向量機軟件進行數據處理,支持向量機軟件選用林智仁等人開發(fā)的支持向量機軟件工具箱(A Library for Support Vector Machines-LIBSVM)。將N組谷類作物光譜數據選擇其中部分組光譜作為訓練集,用于建立支持向量機模型,剩余組光譜作為模型測試集,用于測試所建立支持向量機模型識別精度。
S4.產地識別
S4.1按照步驟S1至S2對待識別谷類作物進行光譜數據采集、小波譜峰提取,得到若干組谷類作物光譜數據;
S4.2利用步驟S3中建立的不同產地谷類作物的SVM分類模型,對未知產地的光譜數據進行分類,從而得到相應的產地預測。
為更好地解釋本發(fā)明,以下給出幾個具體實施例:
實施例1
1.樣品制備
本實施案例選取10種不同產地的大米樣本(表1所示),樣本具體名稱和產地如下:金豚泰國香米(廣東佛山)、湖北觀廟山特產有機大米(湖北枝江)、廣西巴馬正宗糯米(廣西巴馬)、盤府豐錦大米(遼寧盤錦)、五常稻花香大米(黑龍江五常)、東北糙米(吉林四平雙遼)、渡民御貢(安徽安慶)、湘池大米(湖南桃源)、萬年貢米(江西上饒)和崇明島大米(江蘇泰州)。采用本發(fā)明方法對它們進行產地分類。為了簡化分析過程,對不同產地大米進行分別編號,標簽值依次為:1,2,3,4,5,6,7,8,9,10;對應的產地以地名簡稱廣東(GD),湖北(HB),廣西(GX),遼寧(LN),黑龍江(HLJ),吉林(JL),安徽(AH),湖南(HN),江西(JX),江蘇(JS)。每個產地大米稱量15g,將其倒入直接為40mm的鋁盒中;然后使用刀片對樣品進行簡單推平作為被測樣品,每種產地大米壓制4個。
表1為不同省份不同產地大米清單
2.大米樣品的LIBS光譜數據采集
光譜采集在空氣環(huán)境下進行,實驗裝置如圖1所示。采用調Q開關Nd:YAG脈沖激光器1(Quantel Brilliant B,波長532nm,脈沖寬度8ns,最大重復頻率10Hz)作為激發(fā)光源,激發(fā)出的等離子體輻射光由采集頭5收集并傳輸至光譜儀7(Andor Technology,Mechelle5000,波長范圍200~975nm,分辨率λ/△λ=5000)進行分光,ICCD 9(Andor Technology,iStar DH-334T,1024×1024像素)對光譜儀傳過來的光譜信號進行光電轉換。光譜采集過程中使用電動位移平臺11控制樣品表面沿X方向和Y方向做“弓”形運動。為防止空氣擊穿,激光聚焦透鏡3(焦距10cm)焦點位于樣品表面以下1.25mm處。為獲得最佳的光譜強度和光譜信背比,激光脈沖能量設為40mJ,ICCD延時和門寬分別設為1.5μs和3μs。在以上工藝參數下,采集10種大米的等離子體的光譜,每種樣品采集100個光譜,因此10種大米共采集1000個光譜。
3.小波變換的譜峰提取
選用墨西哥帽小波函數系列,分別對光譜信號進行連續(xù)小波分解,每種小波函數對應的分解層數為6,位移步長為1,通過局域最大值方式對6層的變換選擇脊線,從而得到相應位置的譜峰,并剔除重復的譜峰位置;并與預先設定的信背比10、信噪比20閾值進行對比,剔除在閾值之下的譜峰,得到93個譜峰強度值作為算法分析指標;剔除相隔0.1nm的左右偏移的10個譜峰,根據信噪比值可以得到83個譜峰強度值;為降低光譜強度波動對分類結果的影響,各特征譜線強度均除以C I 247.86nm譜線強度進行歸一化處理,最終每個產地大米得到82個譜峰強度值。
4.SVM分類模型建立
在Matlab2010b版的軟件環(huán)境下使用LIBSVM工具箱來進行數學建模,采用的內核函數為徑向基函數,適合非線性數據的分類,有較高穩(wěn)定性。內核徑向基函數中的g參數和對松弛變量的懲罰因子c參數是影響SVM算法性能的主要因素,算法的核心原理也是找出最佳的映射內核參數g與懲罰因子c。為了訓練結果更具說服力,防止建模過學習,采用交互驗證法來優(yōu)化影響因子,c、g參數分別為36.7583和0.0272。
5.產地識別
按照上述過程中得到的光譜數據,利用SVM分類模型,對未知產地的光譜數據進行分類,從而得到相應的產地預測。對具體的不同產地識別結果如表2所示。最終運用SVM訓練模型得到訓練集識別率為99%,預測集識別率為99.4%,因此通過LIBS結合連續(xù)小波變換輔助支持向量機能夠有效的對大米產地進行識別,為產地識別提供新的技術手段。
表2為不同省份不同產地大米SVM分類的結果
實施例2
1.樣品制備
本實施案例選取同一省份6種不同產地的大米樣本(如表3),樣本具體產品名稱和產地如下:七河源(黑龍江綏化)、五常稻花香大米(黑龍江五常)、寶寶輔食(黑龍江寧安蓮花村)、萃林糯米(黑龍江齊齊哈爾)、東北響水大米(黑龍江寧安響水村)和素食貓?zhí)﹣泶竺?黑龍江齊齊哈爾)。采用本發(fā)明方法對它們進行產地分類。為了簡化分析過程,對不同產地大米進行分別編號,標簽值依次為:1,2,3,4,5,6;對應的產地以地名簡稱綏化(SH),五常(WC),蓮花(LH),齊齊哈爾1(QQHE1),響水(XS),齊齊哈爾2(QQHE2)。同樣每個產地大米稱量15g,將其倒入直接為40mm的鋁盒中;然后使用刀片對樣品進行簡單推平作為被測樣品,每種產地大米壓制4個。
表3為同一省份不同產地大米清單
2.大米樣品的LIBS光譜數據采集
在相同的實驗條件下,采集6種大米的等離子體的光譜,每種樣品采集100個光譜,因此6種大米共采集600個光譜。
3.小波變換的譜峰提取
選用墨西哥帽小波函數系列,分別對光譜信號進行連續(xù)小波分解,每種小波函數對應的分解層數為6,位移步長為1,通過局域最大值方式對6層的變換選擇脊線,從而得到相應位置的譜峰,并剔除重復的譜峰位置;并與預先設定的信背比10、信噪比20閾值進行對比,剔除在閾值之下的譜峰,得到101個譜峰強度值作為算法分析指標;剔除相隔0.1nm的左右偏移的4個譜峰,根據信噪比值可以得到97個譜峰強度值;為降低光譜強度波動對分類結果的影響,各特征譜線強度均除以C I 247.86nm譜線強度進行歸一化處理,最終每個產地大米得到96個譜峰強度值。
4.SVM分類模型建立
在Matlab2010b版的軟件環(huán)境下使用LIBSVM工具箱來進行數學建模。c、g參數分別為36.7583和0.009。
5.產地識別
按照上述過程中得到的光譜數據,利用SVM分類模型,對未知產地的光譜數據進行分類,從而得到相應的產地預測。對具體的不同產地識別結果如表4所示。最終運用SVM訓練模型得到訓練集識別率為99.33%,預測集識別率為98.33%,獲得了較高的識別率。
表4為同一省份不同產地大米SVM分類的結果
實施例3
1.樣品制備
本實施案例選取10個不同省份20種不同產地的大米樣本(如表5),樣本具體產品名稱和產地如下:金豚泰國香米(廣東佛山)、湖北觀廟山特產有機大米(湖北枝江)、七河源(黑龍江綏化)、靚蝦王香軟米(廣東東莞)、天地糧人(遼寧朝陽)、廣西巴馬正宗糯米(廣西巴馬)、盤府豐錦大米(遼寧盤錦)、五谷雜糧小西米(廣東廣州)、五常稻花香大米(黑龍江五常)、寶寶輔食(黑龍江寧安蓮花村)、萃林糯米(黑龍江齊齊哈爾)、東北糙米(吉林四平雙遼)、渡民御貢(安徽安慶)、東北響水大米(黑龍江寧安響水村)湘池大米(湖南桃源)、萬年貢米(江西上饒)、崇明島大米(江蘇泰州)、一江秋富硒大米(江西吉安)、竹溪貢米(湖北十堰竹溪)和素食貓?zhí)﹣泶竺?黑龍江齊齊哈爾)。采用本發(fā)明方法對它們進行產地分類。為了簡化分析過程,對不同產地大米進行分別編號,標簽值依次為:1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20;對應的產地以地名簡稱佛山(FS)、枝江(ZJ)、綏化(SH)、東莞(DG)、朝陽(CY)、河池(HC)、盤錦(PJ)、廣州(GZ)、五常(WC)、蓮花村(LHC)、齊齊哈爾(QQHE)、雙遼(SL)、安慶(AQ)、響水村(XSC)、桃源(TY)、上饒(SR)、泰州(TZ)、吉安(JA)、竹溪(ZX)和黑龍江(HLJ)。同樣每個產地大米稱量15g,將其倒入直接為40mm的鋁盒中;然后使用刀片對樣品進行簡單推平作為被測樣品,每種產地大米壓制4個。
表5為不同省份與同一省份不同產地大米清單
2.大米樣品的LIBS光譜數據采集
在相同的實驗條件下,采集20種大米的等離子體的光譜,每種樣品采集100個光譜,因此20種大米共采集2000個光譜。
3.小波變換的譜峰提取
選用墨西哥帽小波函數系列,分別對光譜信號進行連續(xù)小波分解,每種小波函數對應的分解層數為6,位移步長為1,通過局域最大值方式對6層的變換選擇脊線,從而得到相應位置的譜峰,并剔除重復的譜峰位置;并與預先設定的信背比10、信噪比20閾值進行對比,剔除在閾值之下的譜峰,得到93個譜峰強度值作為算法分析指標;剔除相隔0.1nm的左右偏移的10個譜峰,根據信噪比值可以得到83個譜峰強度值;為降低光譜強度波動對分類結果的影響,各特征譜線強度均除以C I 247.86nm譜線強度進行歸一化處理,最終每個產地大米得到82個譜峰強度值。
4.SVM分類模型建立
在Matlab2010b版的軟件環(huán)境下使用LIBSVM工具箱來進行數學建模。c、g參數分別為337.794和0.009。
5.產地識別
按照上述過程中得到的光譜數據,利用SVM分類模型,對未知產地的光譜數據進行分類,從而得到相應的產地預測。對具體的不同產地識別結果如表6所示。最終運用SVM訓練模型得到訓練集識別率為98.3%,預測集識別率為98.6%,獲得了較高的識別率。
表6為不同省份與同一省份不同產地大米SVM分類的結果
以上顯示和描述了本發(fā)明的基本原理和主要特征以及本發(fā)明的優(yōu)點。本行業(yè)的科研人員應該了解,本發(fā)明不受上述實施例的限制,上述實施例和說明書中描述的只是說明本發(fā)明的原理,在不脫離本發(fā)明精神和范圍的前提下,本發(fā)明還會有各種變化和改進,這些變化和改進都落入要求保護的本發(fā)明范圍內。本發(fā)明要求保護范圍由所附的權利要求書及其等效物界定。