本發(fā)明屬于介電頻譜測(cè)量技術(shù)領(lǐng)域,特別是涉及一種基于介電頻譜技術(shù)的牛乳蛋白質(zhì)含量快速檢測(cè)方法。
背景技術(shù):
牛乳含有豐富的蛋白質(zhì)、脂肪、糖類和礦物質(zhì),而且比例分布合理,容易消化,是一種營(yíng)養(yǎng)全面的理想食品,其在人們?nèi)粘I钪姓加兄匾恢?。蛋白質(zhì)是牛乳中最重要的營(yíng)養(yǎng)成分,尤其對(duì)于生鮮乳,蛋白質(zhì)含量是決定牛乳質(zhì)量和價(jià)格的核心指標(biāo)?,F(xiàn)階段常用的檢測(cè)牛乳中蛋白質(zhì)含量的方法主要有:凱氏定氮法、分光光度法、燃燒法等,但這些方法都存在費(fèi)時(shí)費(fèi)力、成本高、需專業(yè)人員、且不能應(yīng)用于實(shí)時(shí)或現(xiàn)場(chǎng)檢測(cè)的缺點(diǎn)。為了能滿足對(duì)牛乳蛋白質(zhì)含量的高效、快速以及在線檢測(cè)的需求,開發(fā)便捷的牛乳蛋白質(zhì)檢測(cè)技術(shù)勢(shì)在必行。
近年來(lái),基于蛋白質(zhì)分子對(duì)光的散射、反射等現(xiàn)象,一些科研人員將近紅外光譜、可見光光譜或者激光技術(shù)等應(yīng)用于牛乳蛋白質(zhì)含量的檢測(cè)中,但光譜技術(shù)很難應(yīng)用于在線檢測(cè)牛乳蛋白質(zhì)含量。此外,由于牛乳中脂肪球的粒徑大小與近紅外光譜的波長(zhǎng)比較接近,脂肪球?qū)獾纳⑸浜头瓷涞挠绊懯沟迷摷夹g(shù)對(duì)蛋白質(zhì)含量的檢測(cè)精度較差。
介電頻譜技術(shù)是一種獲得物質(zhì)在某一頻率范圍內(nèi)介電特性參數(shù)的儀器測(cè)量方法。它具有測(cè)量迅速,一次測(cè)量可以獲得多個(gè)介電特性參數(shù)譜,尤其對(duì)于液態(tài)樣品無(wú)需樣品預(yù)處理的優(yōu)點(diǎn)。對(duì)食品介電頻譜的研究結(jié)果表明,食品中的組織成分,如含水率、含鹽量、脂肪、蛋白質(zhì)、糖等影響食品的介電頻譜,也即介電頻譜反映了食品組織成分的變化,應(yīng)用介電頻譜可以檢測(cè)食品中的某些組織成分?,F(xiàn)有對(duì)于牛乳蛋白質(zhì)含量與介電頻譜的相關(guān)研究主要局限于不同的蛋白質(zhì)類型對(duì)牛乳介電頻譜的影響規(guī)律或者建立單一牛乳樣品的介電特性參數(shù)與蛋白質(zhì)含量的關(guān)系。由于不同個(gè)體奶牛所產(chǎn)牛乳的蛋白質(zhì)含量存在差異,即使同一頭奶牛,其所產(chǎn)牛乳的蛋白質(zhì)含量也因奶牛的泌乳期、季節(jié)、飲食、環(huán)境溫度和身體狀況等因素的變化而發(fā)生變化,這使得基于單一樣本建立的蛋白質(zhì)預(yù)測(cè)模型很難應(yīng)用于實(shí)際大樣本牛乳蛋白質(zhì)含量的檢測(cè)中。而目前尚未見基于介電頻譜技術(shù)檢測(cè)大樣本牛乳蛋白質(zhì)含量的研究論文或?qū)@?/p>
技術(shù)實(shí)現(xiàn)要素:
發(fā)明目的:本發(fā)明旨在克服傳統(tǒng)測(cè)量牛乳中蛋白質(zhì)含量方法的不足,提供一種基于介電頻譜技術(shù)的牛乳蛋白質(zhì)含量快速檢測(cè)方法,為乳品品質(zhì)快速、高效、準(zhǔn)確、實(shí)時(shí)、在線檢測(cè)儀器的開發(fā)奠定基礎(chǔ)。本發(fā)明要解決的技術(shù)問(wèn)題是:基于大樣本獲得的牛乳介電頻譜和采用國(guó)標(biāo)規(guī)定的蛋白質(zhì)測(cè)量方法測(cè)量的大樣本牛乳的蛋白質(zhì)含量,建立預(yù)測(cè)牛乳蛋白質(zhì)含量的預(yù)測(cè)模型,為牛乳中蛋白質(zhì)含量檢測(cè)儀器的研發(fā)提供方法基礎(chǔ)。本發(fā)明的方法也可以用于其它乳品(如羊乳)蛋白質(zhì)含量的檢測(cè)中。
一種基于介電頻譜技術(shù)快速預(yù)測(cè)牛乳蛋白質(zhì)含量的方法,其特征在于,包含以下步驟:
(1)收集樣本:收集一批來(lái)源于不同地區(qū)、不同飼養(yǎng)條件、不同奶牛品種、不同奶牛個(gè)體、不同產(chǎn)乳期、不同季節(jié)、數(shù)量足夠(如超過(guò)80)、蛋白質(zhì)含量有一定差異的生鮮牛乳樣品;樣品在2℃~4℃下保存,24小時(shí)內(nèi)在室溫下完成介電頻譜的采集;根據(jù)國(guó)標(biāo)規(guī)定的方法測(cè)量各牛乳樣品的蛋白質(zhì)含量。
(2)介電頻譜的采集:測(cè)量前將樣品回溫到室溫,在室溫下采用網(wǎng)絡(luò)分析儀和同軸探頭組成的測(cè)量裝置完成介電頻譜的采集;采集前先校準(zhǔn)好測(cè)量裝置并設(shè)置好采集軟件,包括設(shè)置好適量的采集頻率點(diǎn);然后測(cè)量牛乳樣品在射頻/微波范圍內(nèi)的介電頻譜,該介電頻譜包括相對(duì)介電常數(shù)頻譜、介質(zhì)損耗因數(shù)頻譜;
所述的網(wǎng)絡(luò)分析儀也可以用阻抗分析儀替代;
所述的相對(duì)介電常數(shù)頻譜、介質(zhì)損耗因數(shù)頻譜也可以被基于這兩個(gè)介電頻譜計(jì)算可得到的介電參數(shù)頻譜代替。
(3)樣本劃分:采用SPXY法將牛乳樣本劃分為校正集和預(yù)測(cè)集;校正集和預(yù)測(cè)集的樣品比例按照2:1或3:1或4:1劃分;校正集的樣品數(shù)大于預(yù)測(cè)集的樣品數(shù),蛋白質(zhì)含量為最小值和最大值的牛乳樣品要?jiǎng)澐诌M(jìn)校正集。
(4)特征介電變量的提?。悍謩e采用連續(xù)投影算法、無(wú)信息變量消除法、無(wú)信息變量消除法協(xié)同連續(xù)投影算法、蒙特卡羅法對(duì)校正集中牛乳樣品的介電頻譜數(shù)據(jù)進(jìn)行降維處理,在整個(gè)測(cè)量頻率范圍內(nèi)的介電頻譜數(shù)據(jù)中提取出能反映牛乳樣品蛋白質(zhì)含量的特征介電變量;特征介電變量對(duì)應(yīng)的頻率為特征頻率;
特征介電變量不但可以單獨(dú)從相對(duì)介電常數(shù)頻譜數(shù)據(jù)或介質(zhì)損耗因數(shù)頻譜數(shù)據(jù)中提取,也可以從介電常數(shù)頻譜和介質(zhì)損耗因數(shù)頻譜兩種數(shù)據(jù)中共同提?。惶崛〉奶卣鹘殡娮兞恳话闶遣襟E(2)中采集的部分介電頻譜數(shù)據(jù),但也可以是步驟(2)中采集的全部介電頻譜數(shù)據(jù)。
(5)牛乳蛋白質(zhì)含量預(yù)測(cè)模型的建立:以步驟(4)提取的特征介電變量為輸入?yún)?shù),以牛乳樣品的蛋白質(zhì)含量為輸出參數(shù),分別以偏最小二乘法、最小二乘支持向量機(jī)法、極限學(xué)習(xí)機(jī)法和廣義神經(jīng)網(wǎng)絡(luò)法建立基于校正集樣品數(shù)據(jù)的牛乳蛋白質(zhì)含量的線性或非線性預(yù)測(cè)模型。
(6)模型的驗(yàn)證:利用預(yù)測(cè)集的樣品數(shù)據(jù)檢驗(yàn)步驟(5)所建立的多個(gè)牛乳蛋白質(zhì)含量預(yù)測(cè)模型的性能,將預(yù)測(cè)結(jié)果均方根誤差最小的模型確定為預(yù)測(cè)牛乳蛋白質(zhì)含量的最佳模型;分析預(yù)測(cè)集的誤差規(guī)律并確定出誤差修正值。
(7)未知牛乳樣品蛋白質(zhì)含量的預(yù)測(cè):對(duì)于未知蛋白質(zhì)含量的牛乳樣品,按照步驟(2)完成介電頻譜的采集,將采集的未知牛乳樣品介電頻譜數(shù)據(jù)中與步驟(4)確定的特征頻率下的介電頻譜數(shù)據(jù)代入步驟(6)確定的牛乳蛋白質(zhì)含量的最佳模型中,就可以快速計(jì)算出該未知牛乳樣品的蛋白質(zhì)含量。該方法對(duì)牛乳蛋白質(zhì)含量的檢測(cè)誤差為0.094%。
(8)誤差修正:利用步驟(6)中得到的誤差修正值對(duì)步驟(7)的預(yù)測(cè)結(jié)果進(jìn)行修正;修正后的結(jié)果就是未知牛乳樣品蛋白質(zhì)含量最終測(cè)量結(jié)果。
該方法可用于生鮮牛乳、超高溫消毒牛乳和巴士消毒牛乳的蛋白質(zhì)含量快速檢測(cè),也可用于羊乳的蛋白質(zhì)含量快速檢測(cè)。
步驟(7)中,未知蛋白質(zhì)含量的牛乳樣品介電頻譜數(shù)據(jù)的采集,也可以用針對(duì)特征頻率開發(fā)專門的介電頻譜測(cè)量?jī)x器,僅測(cè)量這些特征頻率下的介電變量,將所測(cè)數(shù)值代入所建的最佳模型,也能快速、廉價(jià)地計(jì)算出牛乳的蛋白質(zhì)含量。
本發(fā)明具有如下優(yōu)點(diǎn):本發(fā)明基于獲取的牛乳介電頻譜信息,采用多種數(shù)據(jù)降維方法提取表達(dá)蛋白質(zhì)含量的特征介電變量,進(jìn)而建立檢測(cè)牛乳蛋白質(zhì)含量的線性或非線性模型,以均方根誤差最小的模型作為預(yù)測(cè)牛乳蛋白質(zhì)含量的最佳模型,將采集的未知蛋白質(zhì)含量的牛乳的特征頻率下的介電頻譜數(shù)據(jù)代入所建模型就可以快速計(jì)算出牛乳的蛋白質(zhì)含量,這為牛乳蛋白質(zhì)含量的快速、準(zhǔn)確、實(shí)時(shí)、現(xiàn)場(chǎng)以及在線檢測(cè)提供了一種方法。該方法對(duì)牛乳蛋白質(zhì)含量的檢測(cè)誤差為0.094%,已接近國(guó)標(biāo)規(guī)定的傳統(tǒng)方法的檢測(cè)精度,且能實(shí)現(xiàn)牛乳成分快速檢測(cè)或在線檢測(cè)。
附圖說(shuō)明
圖1:基于介電譜檢測(cè)牛乳蛋白質(zhì)含量的方法流程圖
圖2:連續(xù)投影算法在不同特征變量數(shù)下的均方根誤差
圖3:無(wú)信息變量消除法所提取的特征相對(duì)介電常數(shù)(a)和介質(zhì)損耗因數(shù)的分布(b)。
具體實(shí)施方式
本發(fā)明方法對(duì)生鮮牛乳、超高溫消毒牛乳和巴士消毒牛乳均以及羊乳具有很好的通用性。在此,以生鮮牛乳為實(shí)施實(shí)例,其他類型乳蛋白質(zhì)的檢測(cè)可參照該實(shí)施例的方法進(jìn)行。具體根據(jù)所測(cè)乳的類型,建立一個(gè)適用于該類型乳蛋白質(zhì)含量檢測(cè)的模型,就可以基于介電頻譜對(duì)該類乳的蛋白質(zhì)含量進(jìn)行檢測(cè)。
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明。
依據(jù)本發(fā)明實(shí)施例的方法包括以下步驟:
步驟(1):從不同的奶牛養(yǎng)殖場(chǎng)以及奶牛的不同泌乳期收集一批大樣本的生鮮牛乳,該批牛乳的樣本數(shù)為145,樣品的蛋白質(zhì)含量范圍為2.52~4.18%,樣本蛋白質(zhì)含量的平均值為3.06%,標(biāo)準(zhǔn)偏差為0.30%。
步驟(2),采集該批牛乳樣品的相對(duì)介電常數(shù)頻譜和介質(zhì)損耗因數(shù)頻譜。本實(shí)施例采用美國(guó)安捷倫公司的E5071C矢量網(wǎng)絡(luò)分析儀和85070E-020同軸探頭測(cè)量樣品的介電頻譜。介電頻譜的采集條件是:介電頻譜測(cè)量范圍為20~4500MHz,對(duì)數(shù)坐標(biāo)下等間隔采集201個(gè)點(diǎn),介電頻譜的采集時(shí)樣品的溫度為23~25℃。
步驟(3):樣本劃分:采用SPXY法按照2:1的比例將樣本劃分為校正集和預(yù)測(cè)集,校正集包含97個(gè)樣品,其蛋白質(zhì)含量的范圍為2.52~4.18%,其平均值為3.07%,標(biāo)準(zhǔn)偏差為0.32%;其預(yù)測(cè)集包含48個(gè)樣品,其蛋白質(zhì)含量的范圍為2.69~4.13%,其平均值為3.02%,標(biāo)準(zhǔn)偏差為0.25%。校正集中包含了蛋白質(zhì)含量為最小值和最大值的樣品。
步驟(4):以校正集樣品為對(duì)象,采用連續(xù)投影算法、無(wú)信息變量消除法、無(wú)信息變量消除法+連續(xù)投影算法等數(shù)據(jù)降維方法從具有201個(gè)頻率點(diǎn)的相對(duì)介電常數(shù)全譜和201點(diǎn)的介質(zhì)損耗因數(shù)全譜(共402介電參數(shù)值)中提取出表達(dá)牛乳蛋白質(zhì)含量的特征介電變量。
采用連續(xù)投影算法提取特征介電變量時(shí),設(shè)定提取的特征介電變量數(shù)的范圍為1~13,計(jì)算各特征介電變量數(shù)下的校正集均方根誤差,根據(jù)最小的校正集均方根誤差確定最佳特征變量數(shù)。不同特征變量數(shù)下的校正集均方根誤差的計(jì)算結(jié)果如圖2所示。結(jié)果說(shuō)明,當(dāng)特征變量數(shù)為10時(shí)校正集均方根誤差最小。圖2中“■”對(duì)應(yīng)的橫坐標(biāo)值表示經(jīng)連續(xù)投影算法優(yōu)選出的最佳特征介電變量數(shù)。因此,采用連續(xù)投影算法提取了10個(gè)特征介電變量,分別是頻率為39.3、 119.8、和3747.3 MHz下的相對(duì)介電常數(shù)和頻率為20.7、21.4、23.6、25.0、27.9、48.0和4311.8 MHz時(shí)的介質(zhì)損耗因數(shù)。
采用無(wú)信息變量消除法選擇出了152個(gè)特征介電變量,其中包括66個(gè)不同頻率下的相對(duì)介電常數(shù)和86個(gè)不同頻率下的介質(zhì)損耗因數(shù)。圖3a和圖3b所示分別是無(wú)信息變量消除法所選擇的特征相對(duì)介電常數(shù)和介質(zhì)損耗因數(shù)的分布。圖中曲線表示某一牛乳樣品的相對(duì)介電常數(shù)和介質(zhì)損耗因數(shù)頻譜,豎線表示提取的特征介電變量所在的頻率。
當(dāng)采用無(wú)信息變量消除法+連續(xù)投影算法提取特征介電變量時(shí),對(duì)經(jīng)過(guò)無(wú)信息變量消除法篩選的152個(gè)特征介電變量再用連續(xù)投影算法進(jìn)一步提取特征介電變量,進(jìn)而提取出了7個(gè)特征介電變量,包括4個(gè)相對(duì)介電常數(shù)和3個(gè)介質(zhì)損耗因數(shù),這4個(gè)相對(duì)介電常數(shù)處于20、 44.3、130.7和4029.5 MHz下,3個(gè)介質(zhì)損耗因數(shù)處于 20.7、 84.6、和4311.8MHz下。
步驟(5):以步驟四提取出的特征介電變量或介電全譜(20~4500MHz范圍內(nèi)的201個(gè)點(diǎn)下的相對(duì)介電常數(shù)和201個(gè)介質(zhì)損耗因數(shù))為輸入變量,以牛乳的蛋白質(zhì)含量為輸出變量,建立預(yù)測(cè)牛乳蛋白質(zhì)含量的偏最小二乘、最小二乘支持向量機(jī)、極限學(xué)習(xí)機(jī)等線性或非線性模型。
步驟(6):用預(yù)測(cè)集樣品檢驗(yàn)步驟五所建立的各種模型,比較所建各個(gè)模型的預(yù)測(cè)均方根誤差,以預(yù)測(cè)均方根誤差最小的模型作為檢測(cè)牛乳蛋白質(zhì)含量的最佳模型。針對(duì)本實(shí)施例,預(yù)測(cè)牛乳蛋白質(zhì)含量的最佳模型為基于無(wú)信息變量消除法+連續(xù)投影算法提取的7個(gè)特征介電變量建立的最小二乘支持向量機(jī)模型,該模型對(duì)牛乳蛋白質(zhì)含量的檢測(cè)誤差為0.094%。分析預(yù)測(cè)集的誤差規(guī)律并確定出誤差修正值。
步驟(7):按照步驟二采集任意一未知蛋白質(zhì)含量的牛乳在20~4500MHz間201個(gè)點(diǎn)下的相對(duì)介電常數(shù)譜和介質(zhì)損耗因數(shù)譜,從中提取出20、 44.3、130.7和4029.5 MHz的相對(duì)介電常數(shù)和20.7、 84.6、和4311.8MHz的介質(zhì)損耗因數(shù),將所提取的介電值代入步驟六所確定的最佳模型中,就可以快速計(jì)算出牛乳的蛋白質(zhì)含量。也可以針對(duì)特征介電變量對(duì)應(yīng)的頻率,開發(fā)專門的儀器,僅測(cè)量這些頻率下的介電變量,將所測(cè)數(shù)值代入所建的最佳模型,也能快速地計(jì)算出牛乳的蛋白質(zhì)含量。
步驟(8):利用步驟(6)中得到的誤差修正值對(duì)步驟(7)的預(yù)測(cè)結(jié)果進(jìn)行修正;修正后的結(jié)果就是未知牛乳樣品蛋白質(zhì)含量最終測(cè)量結(jié)果。該步驟用于進(jìn)一步降低預(yù)測(cè)誤差。
由以上實(shí)施例可以看出,本發(fā)明利用介電頻譜技術(shù)檢測(cè)牛乳的蛋白質(zhì)含量具有檢測(cè)精度高、便捷、高效等優(yōu)點(diǎn),而同軸探頭可以插入到牛乳中,從而能夠?qū)崿F(xiàn)牛乳蛋白質(zhì)含量的在線和現(xiàn)場(chǎng)檢測(cè)。
以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明技術(shù)原理的前提下,還可以做出若干改進(jìn)和變型,這些改進(jìn)和變型也應(yīng)視為本發(fā)明的保護(hù)范圍。