本發(fā)明涉及茶葉香氣分類(lèi)方法,尤其是涉及一種參數(shù)優(yōu)化支持向量機(jī)的茶葉香氣分類(lèi)方法。
背景技術(shù):
:氣味是食品品質(zhì)評(píng)價(jià)的一個(gè)重要指標(biāo),目前對(duì)食品氣味的評(píng)判主要依靠有經(jīng)驗(yàn)的專(zhuān)業(yè)人員來(lái)完成。主要采用感官定量描述分析法、主成分分析法和傳統(tǒng)評(píng)分法相結(jié)合的方法來(lái)完成評(píng)估。同樣的氣味,不同的人很難得到一致的評(píng)價(jià)結(jié)果;甚至同一個(gè)人在不同的環(huán)境、不同的情緒時(shí),對(duì)同一種氣味也有不同的感受和評(píng)價(jià)。從而使得采用人的感官進(jìn)行評(píng)判存在一定的局限性,為了減少評(píng)判的錯(cuò)誤率,用機(jī)器模擬人的感官(如模擬人視覺(jué)的電子眼、模擬人的味覺(jué)的電子舌、模擬人的嗅覺(jué)的電子鼻等)進(jìn)行食品品質(zhì)評(píng)判已成為一種趨勢(shì)。電子鼻作為一種新興的感官分析技術(shù),已經(jīng)廣泛應(yīng)用于食品、煙草、醫(yī)學(xué)、環(huán)境監(jiān)測(cè)和爆炸物檢測(cè)等領(lǐng)域。其中在新鮮度、成熟度判別、病害檢測(cè)、品質(zhì)監(jiān)控、質(zhì)量評(píng)價(jià)和安全檢測(cè)中顯示出獨(dú)特優(yōu)點(diǎn),具有快速、無(wú)損、重復(fù)性好的優(yōu)點(diǎn)。電子鼻主要由氣味取樣操作器、氣味傳感器陣列和信號(hào)處理系統(tǒng)組成,是利用氣味傳感器陣列的響應(yīng)曲線來(lái)識(shí)別氣味。由于電子鼻得到的是樣品中揮發(fā)出的氣味信息,而不是樣品中某成分的定量或定性結(jié)果。茶葉的香氣,主要是由芳香物質(zhì)的種類(lèi)、濃度決定的。電子鼻提供一種快速無(wú)損的方式來(lái)測(cè)定茶葉香氣的揮發(fā)物質(zhì),從而對(duì)待測(cè)茶葉的氣味進(jìn)行客觀評(píng)價(jià)。因此,電子鼻提供一種快速無(wú)損的方式來(lái)測(cè)定食品揮發(fā)物質(zhì),從而對(duì)待測(cè)樣品的品質(zhì)進(jìn)行客觀評(píng)價(jià)。茶葉的香氣一般是由復(fù)混物組成,比較復(fù)雜,不同品種茶葉的香氣不一樣,甚至產(chǎn)地不同的同一種茶葉香氣也不完全一樣,尤其當(dāng)茶葉貯放一段時(shí)間后,香氣、滋味、顏色就會(huì)在短時(shí)期內(nèi)發(fā)生變化。所以不同的人對(duì)同一種茶甚至同一杯茶香氣有不同的看法,這可能是由個(gè)人的喜好、習(xí)慣、經(jīng)驗(yàn)、敏感度造成的。因此,傳統(tǒng)的香氣判斷方法無(wú)法正確快速的進(jìn)行分類(lèi)判斷。而支持向量機(jī)算法(SupportVectorMachine,SVM)是在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上發(fā)展起來(lái)的一種分類(lèi)方法,由Cortes和Vapnik在1995年首先提出的,SVM算法是根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳,以獲得最優(yōu)的泛化推廣能力。在解決小樣本問(wèn)題、非線性問(wèn)題以及高維數(shù)據(jù)等問(wèn)題中表現(xiàn)出特有的優(yōu)勢(shì),已被廣泛應(yīng)用于判斷、處理預(yù)測(cè)、數(shù)據(jù)擬合、綜合評(píng)價(jià)以及模式識(shí)別等諸多問(wèn)題。在對(duì)茶葉氣味分類(lèi)的問(wèn)題上,已經(jīng)有了典型判別分析法及神經(jīng)網(wǎng)絡(luò)方法等,但是在面對(duì)大量茶葉香氣數(shù)據(jù)時(shí),這些算法都存在準(zhǔn)確率不高的問(wèn)題,本專(zhuān)利針對(duì)這個(gè)問(wèn)題,采用算法優(yōu)化SVM參數(shù)的方法,對(duì)茶葉的香氣進(jìn)行不同程度的分類(lèi),提高分類(lèi)的準(zhǔn)確率。技術(shù)實(shí)現(xiàn)要素:本發(fā)明要解決的技術(shù)問(wèn)題是提供一種參數(shù)優(yōu)化支持向量機(jī)的茶葉香氣分類(lèi)方法。本發(fā)明是通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn)的。通過(guò)電子鼻采集茶葉香氣數(shù)據(jù),將檢測(cè)到的芳香苯,氮氧化合物,芳香氨類(lèi),氫氣,芳香烷烴,甲基烷烴,無(wú)機(jī)硫化物,羰基類(lèi)和醇類(lèi),有機(jī)硫化物,長(zhǎng)鏈烷烴指標(biāo)的校正集數(shù)據(jù)作為輸入樣本,通過(guò)算法優(yōu)化懲罰因子C和核函數(shù)參數(shù)g,構(gòu)建支持向量機(jī)進(jìn)行自分類(lèi)。得到訓(xùn)練好的茶葉分類(lèi)模型,并據(jù)此計(jì)算出茶葉預(yù)測(cè)集數(shù)據(jù)的分類(lèi)準(zhǔn)確率。懲罰因子C和核函數(shù)參數(shù)g通過(guò)遺傳算法或網(wǎng)格搜索法優(yōu)化得到。本發(fā)明的有益效果:本發(fā)明將遺傳算法優(yōu)化支持向量機(jī)和網(wǎng)格搜索法優(yōu)化支持向量機(jī)應(yīng)用于實(shí)際的茶葉數(shù)據(jù)中,對(duì)茶葉香氣進(jìn)行分類(lèi),有效地提高了茶葉香氣的分類(lèi)準(zhǔn)確率,保證了茶葉的鮮嫩口感??商岣哳A(yù)測(cè)茶葉香氣分類(lèi)的效率和準(zhǔn)確度,為消費(fèi)者提供茶葉香氣分類(lèi)的有效方法。附圖說(shuō)明圖1為毛峰茶葉樣本集主成分分析的載荷圖。圖2為本發(fā)明遺傳算法優(yōu)化支持向量機(jī)毛峰茶葉香氣分類(lèi)方法的流程示意圖。圖3為毛峰茶葉香氣的GA-SVM算法運(yùn)行10次的準(zhǔn)確率。圖4為毛峰茶葉香氣的GA-SVM算法運(yùn)行10次的建模時(shí)間。圖5為毛峰茶葉香氣的遺傳算法在訓(xùn)練過(guò)程中的適應(yīng)度曲線。圖6為GA-SVM算法毛峰茶葉香氣可視化結(jié)果。圖7為SVM算法毛峰茶葉香氣可視化結(jié)果。圖8為網(wǎng)格搜索算法優(yōu)化支持向量機(jī)毛峰茶葉香氣分類(lèi)方法的流程示意圖。圖9為毛峰茶葉香氣分類(lèi)的SVM參數(shù)選擇等高線圖。圖10為毛峰茶葉香氣分類(lèi)的SVM參數(shù)選擇3D視圖。圖11為GridSearch-SVM算法的毛峰茶葉香氣分類(lèi)可視化結(jié)果圖。圖12為SVM算法的毛峰茶葉香氣分類(lèi)可視化結(jié)果圖。具體實(shí)施方式實(shí)施例1:下面根據(jù)附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明,以毛峰茶葉為例。步驟1:確定毛峰茶葉檢測(cè)指標(biāo);步驟1.1毛峰茶葉樣品的準(zhǔn)備;各個(gè)等級(jí)的毛峰茶葉分別準(zhǔn)備70個(gè)重復(fù)樣品,每個(gè)重復(fù)樣品質(zhì)量為5g,雙層薄膜密封在500ml的燒杯中,室溫下靜置45min。根據(jù)感官評(píng)審時(shí)的要求,茶、水比1:50,取5g茶葉用250ml水沖泡。泡茶用水為沸滾適度100℃的純凈水,沖泡時(shí)間為5min,然后將茶水濾出。將茶水和茶底分別在500ml的燒杯中密封、靜置45min使得燒杯頂空富集茶葉揮發(fā)性成分的同時(shí),水溫也冷卻至室溫,室溫保持25±3℃。由于茶水和茶底中水蒸氣很多,所以檢測(cè)時(shí)要放些硅膠,以減少水蒸氣的影響。同樣對(duì)每個(gè)等級(jí)的茶葉也各準(zhǔn)備70個(gè)重復(fù)。由于這部分的樣品中水蒸氣含量較多,雖然用硅膠預(yù)處理過(guò),但水蒸氣含量扔相對(duì)較大,所有要結(jié)合吸附/解吸附單元使用,對(duì)檢測(cè)的揮發(fā)性成分進(jìn)行富集、濃縮和清潔,以減少對(duì)傳感器陣列的影響。把吸附/解吸附單元與電子鼻系統(tǒng)連接好,運(yùn)行其配套氣味指紋分析處理軟件,首先檢測(cè)吸附/解吸附單元是否連接好;然后設(shè)定系統(tǒng)各參數(shù),即可開(kāi)始檢測(cè)。步驟1.2毛峰茶葉指標(biāo)檢測(cè);電子鼻采用德國(guó)Airsense公司生產(chǎn)的PEN3型電子鼻,含有10個(gè)不同的金屬氧化物傳感器。電子鼻的原理是利用特定的金屬氧化物和生物膜,根據(jù)揮發(fā)性物質(zhì)分子接觸引起膜電位微小的變化來(lái)判斷是否有氣味和氣味的強(qiáng)弱,以特定的傳感器和模式識(shí)別系統(tǒng)進(jìn)行快速提供被測(cè)樣品的全面信息,提示樣品的隱含特征。傳感器的輸出為傳感器接觸揮發(fā)性氣體的電導(dǎo)率與傳感器經(jīng)過(guò)活性炭過(guò)濾后純凈空氣的電導(dǎo)率之比。得到10個(gè)傳感器特征值。這種氣敏傳感器具有可靠性高、靈敏度好和重復(fù)性強(qiáng)等特點(diǎn)。電子鼻PEN3的標(biāo)準(zhǔn)傳感器陣列見(jiàn)表1。表1PEN3的標(biāo)準(zhǔn)傳感器陣列步驟2毛峰茶葉建立樣本集;步驟2.1毛峰茶葉樣本數(shù)據(jù)獲??;由電子鼻檢測(cè)到毛峰茶數(shù)據(jù)的部分?jǐn)?shù)據(jù)的詳細(xì)信息情況見(jiàn)表2。其中,1到10號(hào)傳感器記錄在不同時(shí)間下,傳感器接觸揮發(fā)性氣體的電導(dǎo)率與傳感器經(jīng)過(guò)活性炭過(guò)濾后純凈空氣的電導(dǎo)率之比,香氣是感官審評(píng)的陳化程度值。該數(shù)據(jù)集包括452個(gè)樣本,10個(gè)樣本屬性,2個(gè)類(lèi)別。表2毛峰茶數(shù)據(jù)情況步驟2.2毛峰茶葉樣本數(shù)據(jù)主成分分析對(duì)該樣本集進(jìn)行主成分分析,得到6個(gè)主成分,其載荷圖如圖1所示,提取的6個(gè)主成分分別為:氫氣,甲基烷烴,無(wú)機(jī)硫化物,羰基類(lèi)和醇類(lèi),有機(jī)硫化物,長(zhǎng)鏈烷烴指標(biāo)值。步驟2.3毛峰茶葉樣本歸一化處理;為了使分類(lèi)更準(zhǔn)確,對(duì)毛峰茶葉樣本數(shù)據(jù)進(jìn)行歸一化處理。使所有的樣本數(shù)據(jù)都?xì)w一為[0,1]之間,對(duì)于輸出向量通過(guò)反歸一化處理,得到原值。采用的數(shù)據(jù)歸一化處理計(jì)算公式為:P′=(P-Pmin)/(Pmax-Pmin)式中,P′、P、Pmax、Pmin分別為歸一化后樣本數(shù)據(jù),原始樣本數(shù)據(jù),原始樣本數(shù)據(jù)的最大值和最小值。步驟3支持向量機(jī)的輸入向量數(shù)目,選定核函數(shù);步驟3.1輸入向量數(shù)目,選定核函數(shù);對(duì)毛峰茶葉樣本數(shù)據(jù)按照校正集和測(cè)試集4:1進(jìn)行劃分,校正集作為支持向量機(jī)的輸入向量數(shù)目,支持向量機(jī)核函數(shù)選用徑向基(RBF)核函數(shù)。步驟3.2參數(shù)的設(shè)定;支持向量機(jī)懲罰因子C的范圍設(shè)為[0,100],核函數(shù)參數(shù)g的范圍設(shè)為[0,1000]。遺傳算法種群規(guī)模的大小關(guān)系著算法性能的好壞。種群規(guī)模太大,計(jì)算時(shí)間就會(huì)增加,同時(shí)降低了算法的競(jìng)爭(zhēng)力。種群規(guī)模太小,就會(huì)導(dǎo)致算法優(yōu)化的質(zhì)量不高。本專(zhuān)利選取種群規(guī)模選取為20。遺傳算法迭代次數(shù)是表示遺傳算法運(yùn)行結(jié)束條件的一個(gè)參數(shù),本實(shí)施例迭代次數(shù)選取為200。遺傳算法交叉概率一般取值較大,但如果太大,它會(huì)破壞群體中的優(yōu)良模式,對(duì)進(jìn)化運(yùn)算不利。本實(shí)施例交叉概率選取為0.7。遺傳算法變異概率取值太大,則容易破壞群體中的優(yōu)良模式,使得遺傳算法的搜索趨于隨機(jī)性;若取值過(guò)小,則它產(chǎn)生新個(gè)體和抑制早熟的能力會(huì)較差。本實(shí)施例變異概率選取為0.1。步驟4利用遺傳算法優(yōu)化支持向量機(jī),以下又稱GA-SVM,進(jìn)行模型訓(xùn)練,輸出最佳懲罰因子C和核函數(shù)參數(shù)g;步驟4.1模型訓(xùn)練;本實(shí)施例采用遺傳算法優(yōu)化支持向量機(jī)對(duì)毛峰茶香氣品質(zhì)進(jìn)行分類(lèi)。遺傳算法是基于自熱選擇的生物進(jìn)化,是一種模擬生物進(jìn)化過(guò)程的隨機(jī)方法。是一種具有自適應(yīng)能力的、全局性的概率搜索算法。步驟4.2使用遺傳算法優(yōu)化支持向量機(jī)懲罰因子C和核函數(shù)參數(shù)g。具體包括:步驟4.2.1編碼工作;對(duì)數(shù)值進(jìn)行二進(jìn)制編碼來(lái)離散化,使用的編碼符號(hào)集由二進(jìn)制符號(hào)0和1所組成的二值符號(hào)集{0,1},它所構(gòu)成的個(gè)體基因型是一個(gè)二進(jìn)制編碼符號(hào)串。假定其進(jìn)化次數(shù)為t=1,…,T;假定長(zhǎng)度為n的染色體表示為符號(hào)串x=x1,x2,...,x3,其中:記號(hào)xi(i=1,2,...,n)代表一個(gè)遺傳基因,所有等位基因的組合構(gòu)成了解的基本空間:A=x1×x2×...×xn=Πxi=1ni]]>步驟4.2.2構(gòu)造個(gè)體適應(yīng)度函數(shù);遺傳算法常將目標(biāo)函數(shù)直接作為適應(yīng)度函數(shù),但由于在執(zhí)行選擇操作時(shí),它要按與個(gè)體適應(yīng)度成正比的概率來(lái)決定當(dāng)前群體中每個(gè)個(gè)體遺傳到下一代群體中的幾率,而要正確計(jì)算此概率,要求所有個(gè)體的適應(yīng)度值必須非負(fù)所以實(shí)際操作時(shí)。將待求解的的目標(biāo)函數(shù)做適當(dāng)處理后再轉(zhuǎn)化為適應(yīng)度函數(shù),即:式中Cmax為發(fā)f(x)的最大估計(jì)值。步驟4.2.3選擇操作;根據(jù)適者生存的原則,選擇適應(yīng)度高的個(gè)體,可有效地避免有效基因的損失,使高性能的個(gè)體得以較大的概率生存,從而提高全局收斂性和計(jì)算效率。選擇操作采用輪盤(pán)賭操作,令PP0=0,計(jì)算公式為:pi=fitness(xi)Σi=1NΓfitness(xi)]]>PP1為累計(jì)概率,pi為個(gè)體的選擇概率,fitness(Xi)為個(gè)體適應(yīng)度。共轉(zhuǎn)輪NP次(NP為種群個(gè)體數(shù)),每次轉(zhuǎn)輪時(shí),隨機(jī)產(chǎn)生0到1之間的隨機(jī)數(shù)r,當(dāng)PPi-1≤r≤PPi時(shí)選擇個(gè)體i。步驟4.2.4交叉操作;交叉選擇是將兩個(gè)選擇出來(lái)的個(gè)體(染色體)在交叉點(diǎn)進(jìn)行交叉互換,重組后生成兩個(gè)嶄新的子代個(gè)體(染色體),這兩個(gè)新的子代個(gè)體的性狀是由它們父代個(gè)體的性狀組合而成的。假設(shè)在兩個(gè)個(gè)體之間進(jìn)行算術(shù)交叉、則交叉運(yùn)算后所產(chǎn)生出的兩個(gè)新個(gè)體是:式中,α為一參數(shù)。XAt+1=αXBt+(1-α)XAtXBt+1=αXAt+(1-α)XBt]]>步驟4.2.5變異操作;變異操作就是由于一些偶然因素,引起了基因結(jié)構(gòu)的改變,從而產(chǎn)生了新的染色體。變異操作的一般過(guò)程是:1.從種群中任意的選取某個(gè)個(gè)體(染色體)。2.以某個(gè)概率對(duì)該個(gè)體的染色體編碼的某一個(gè)位置上的字符進(jìn)行改變。得到了變異后的個(gè)體(染色體)。使用變異操作對(duì)交叉操作結(jié)果進(jìn)行處理,得到新的基因值x′k由下式確定:xk′=xk+Δ(t,Umaxk-vk),random(0,1)=0xk-Δ(t,Umaxk-vk),random(0,1)=1]]>式中,random(0,1)表示隨機(jī)取0或1,vk為xk取值范圍中的一個(gè)隨機(jī)數(shù),Δ(t,y)(y代表和)表示[0,y]范圍內(nèi)符合非均勻分布的一個(gè)隨機(jī)數(shù)。步驟4.2.6得到最佳的懲罰因子C和核函數(shù)參數(shù)g;當(dāng)達(dá)到最大迭代次數(shù),通過(guò)解碼得到的最優(yōu)懲罰因子C和核函數(shù)參數(shù)g,此時(shí),C=0.515,g=6.998,遺傳算法優(yōu)化支持向量機(jī)毛峰茶葉香氣的流程圖如圖2所示。步驟5毛峰茶葉的香氣分類(lèi);根據(jù)上述步驟,本實(shí)施例選用支持向量機(jī)和遺傳算法優(yōu)化支持向量機(jī)對(duì)毛峰茶葉進(jìn)行香氣分類(lèi),由于優(yōu)化的結(jié)果具有一定的隨機(jī)性,對(duì)遺傳算法優(yōu)化支持向量機(jī)算法進(jìn)行10組運(yùn)算,10次運(yùn)算所得C、g和時(shí)間t如表3,準(zhǔn)確率如圖3所示。建模時(shí)間如圖4所示。對(duì)其運(yùn)算指標(biāo)取均值進(jìn)行對(duì)比分析。計(jì)算結(jié)果如表4所示。遺傳算法在訓(xùn)練過(guò)程中的適應(yīng)度曲線如圖5所示,當(dāng)遺傳算法運(yùn)行到110代以后平均適應(yīng)度值已增加到最大值且趨于平穩(wěn)狀態(tài),而最佳適應(yīng)度值隨著迭代次數(shù)的增加一直保持不變,直到運(yùn)行到200代后,算法停止。此時(shí),輸出的SVM最優(yōu)參數(shù)C=0.665,g=7.843,建模時(shí)間為54.98s。表3遺傳算法優(yōu)化支持向量機(jī)10次C和g值表4顯示了采用支持向量機(jī)算法和遺傳算法優(yōu)化支持向量機(jī)算法對(duì)毛峰茶葉的香氣分類(lèi)對(duì)比結(jié)果,從表中可以看出,在建模時(shí)間上,支持向量機(jī)具有相對(duì)更快的建模速度,只用了0.25s;在準(zhǔn)確率上,遺傳算法優(yōu)化支持向量機(jī)的準(zhǔn)確率相對(duì)高很多,與支持向量機(jī)相比,高了33.33%。結(jié)果表明,遺傳算法優(yōu)化支持向量機(jī)對(duì)茶葉的香氣的分類(lèi)準(zhǔn)確率更高。尤其是在面對(duì)要求高精度時(shí),效果更顯著。表4分類(lèi)結(jié)果對(duì)比茶葉數(shù)據(jù)集包含2個(gè)類(lèi)別屬性:“0”、“1”。GA-SVM算法的毛峰茶葉香氣可視化結(jié)果如圖6所示。SVM算法的毛峰茶葉香氣可視化結(jié)果如圖7所示。圖中X軸表示測(cè)試集樣本,Y軸表示類(lèi)別標(biāo)簽,圖中圓形表示實(shí)際測(cè)試集分類(lèi),星形表示預(yù)測(cè)測(cè)試集分類(lèi)。本實(shí)施例利用遺傳算法的計(jì)算時(shí)間少,魯棒性高、具有很好的收斂性等優(yōu)點(diǎn),將該方法應(yīng)用于支持向量機(jī)算法的懲罰因子C和核函數(shù)參數(shù)g的選取,進(jìn)而構(gòu)建GA-SVM毛峰茶葉香氣分類(lèi)模型,本發(fā)明不僅為消費(fèi)者提供一種有效的茶葉香氣分類(lèi)方法,而且進(jìn)一步提高了分類(lèi)精度,得到較好的結(jié)果。實(shí)施例2使用網(wǎng)格搜索算法優(yōu)化支持向量機(jī),以下又稱GridSearch-SVM,得出最佳懲罰因子C和核函數(shù)參數(shù)g。將實(shí)施例1中的步驟4和步驟5替換為以下技術(shù)方案:步驟4利用網(wǎng)格搜索算法優(yōu)化支持向量機(jī),進(jìn)行模型訓(xùn)練,輸出最佳懲罰因子C和核函數(shù)參數(shù)g;步驟4.1模型訓(xùn)練;本實(shí)施例采用網(wǎng)格搜索算法優(yōu)化支持向量機(jī)對(duì)毛峰茶香氣品質(zhì)進(jìn)行分類(lèi)。針對(duì)本發(fā)明的支持向量機(jī)而言,所需要搜索的參數(shù)組為懲罰因子C和核函數(shù)參數(shù)g。因此,可以將這兩個(gè)參數(shù)在二維空間劃分一個(gè)網(wǎng)格并通過(guò)遍歷測(cè)試的方式尋找最優(yōu)參數(shù)組。首先,給出這兩個(gè)參數(shù)的搜索范圍并設(shè)定其移動(dòng)的步距,通常為0.1。之后根據(jù)所設(shè)置的移動(dòng)步距逐一取值測(cè)試。對(duì)于所選取的懲罰因子C和核函數(shù)參數(shù)g利用5階交叉驗(yàn)證方法得到其在該組參數(shù)下校正集的分類(lèi)準(zhǔn)確率,使校正集分類(lèi)準(zhǔn)確率最高的那組C和g就是所要尋找的最優(yōu)參數(shù)。網(wǎng)格搜索算法優(yōu)化支持向量機(jī)對(duì)毛峰茶葉分類(lèi)的流程圖如圖8所示。步驟4.2使用網(wǎng)格搜素算法優(yōu)化支持向量機(jī)懲罰因子C和核函數(shù)參數(shù)g;步驟4.2.1數(shù)據(jù)初始化:設(shè)定初始搜索步長(zhǎng)、參數(shù)范圍;本實(shí)施例中選擇參數(shù)C的搜索范圍圍為[-8,8],搜索步長(zhǎng)為0.8,參數(shù)g的搜索范圍為[-8,8],搜索步長(zhǎng)為0.8。步驟4.2.2網(wǎng)格搜索建模方法;根據(jù)茶葉預(yù)處理后的數(shù)據(jù),使用5折交叉驗(yàn)證方法(將校正集分為互不交叉的5個(gè)子集,輪流選擇其中的4個(gè)子集進(jìn)行參數(shù)訓(xùn)練,剩余的一個(gè)子集對(duì)選擇的參數(shù)進(jìn)行驗(yàn)證)計(jì)算出每組懲罰因子C和核函數(shù)參數(shù)g分類(lèi)準(zhǔn)確率。步驟4.2.3根據(jù)網(wǎng)格搜索算法結(jié)束條件,得到支持向量機(jī)最佳的懲罰因子C和核函數(shù)參數(shù)g。其中:C=0.25,g=2.83。步驟5毛峰茶葉的香氣分類(lèi);根據(jù)上述方法,本實(shí)施例選用支持向量機(jī)和網(wǎng)格搜索法優(yōu)化支持向量機(jī)參數(shù)對(duì)毛峰茶葉進(jìn)行分類(lèi),對(duì)其運(yùn)算指標(biāo)取均值進(jìn)行對(duì)比分析。計(jì)算結(jié)果如表3所示。網(wǎng)格搜索法參數(shù)選擇結(jié)果如圖9、圖10所示。從圖可以看出,取-2<log2c<0,-2<log2g<2時(shí),此時(shí)分類(lèi)效果最好,此時(shí),SVM最好,此時(shí),SVM最優(yōu)參數(shù)C=0.25,g=2.83,建模時(shí)間為5.69s。表5分類(lèi)結(jié)果對(duì)比表5顯示了采用支持向量機(jī)算法和網(wǎng)格搜索法優(yōu)化支持向量機(jī)參數(shù)對(duì)毛峰茶葉的分類(lèi)性能對(duì)比結(jié)果,從表中可以看出,在建模時(shí)間上,支持向量機(jī)算法具有相對(duì)更快的建模速度,只用了0.25s;在分類(lèi)準(zhǔn)確率上,網(wǎng)格搜索優(yōu)化支持向量機(jī)的分類(lèi)準(zhǔn)確率相對(duì)高很多,與支持向量機(jī)相比,高了31.69%,其準(zhǔn)確率與基于遺傳算法優(yōu)化的支持向量機(jī)分類(lèi)相當(dāng),但是建模時(shí)間遠(yuǎn)遠(yuǎn)小于GA-SVM。結(jié)果表明,網(wǎng)格搜索優(yōu)化支持向量機(jī)的具有更高的分類(lèi)準(zhǔn)確率。網(wǎng)格搜索優(yōu)化支持向量機(jī)所得到的分類(lèi)模型的分類(lèi)效果更好,尤其是在面對(duì)大數(shù)據(jù)時(shí),效果更顯著。茶葉數(shù)據(jù)集包含2個(gè)類(lèi)別屬性:“0”、“1”。GridSearch-SVM算法的毛峰茶葉香氣可視化結(jié)果如圖11所示。SVM算法的毛峰茶葉香氣可視化結(jié)果如圖12所示。圖中X軸表示測(cè)試集樣本,Y軸表示類(lèi)別標(biāo)簽,圖中圓形表示實(shí)際測(cè)試集分類(lèi),星形表示預(yù)測(cè)測(cè)試集分類(lèi)。本實(shí)施例利用網(wǎng)格搜索法在參數(shù)空間上取若干分格,遍歷輸入空間中所有網(wǎng)格交叉點(diǎn),得到最優(yōu)解。將該方法應(yīng)用于支持向量機(jī)算法的懲罰因子C和核函數(shù)參數(shù)g的選取,進(jìn)而構(gòu)建GridSearch-SVM毛峰茶葉香氣分類(lèi)模型,本實(shí)施例不僅為消費(fèi)者提供一種有效的茶葉香氣分類(lèi)方法,而且進(jìn)一步提高了分類(lèi)精度,得到較好的結(jié)果。當(dāng)前第1頁(yè)1 2 3