本發(fā)明屬于近紅外檢測領域,具體涉及一種基于主成分分析的反向人工神經(jīng)網(wǎng)絡算法的六味地黃丸小蜜丸生藥粉多指標快速檢測方法。
背景技術:
六味地黃丸小蜜丸生藥粉是熟地黃、酒萸肉、牡丹皮、山藥、茯苓和澤瀉這六種藥材以一定的比例粉碎成細粉,過篩,混勻得到的粉末。六味地黃丸小蜜丸生藥粉是六味地黃丸小蜜丸生產(chǎn)中重要的原藥材。2010版中國藥典中記載六味地黃丸具有滋陰補腎的功效,可用于腎陰虧損,頭暈耳鳴,腰膝酸軟,骨蒸潮熱,盜汗遺精,消渴。六味地黃丸小蜜丸生藥粉是多種藥材的混合,其化學成分比較復雜,主要包括多糖、丹皮酚、芍藥苷、馬錢苷、莫諾苷等化學物質。
近紅外(nir)光譜技術作為一種快速無損的綠色分析技術,具有快速分析、樣品處理簡單、無需消耗試劑等特點。近年來,近紅外光譜技術作為一種間接分析技術,已經(jīng)陸續(xù)用于藥效成分的含量測定、制藥過程的在線檢測和監(jiān)控、天然藥物鑒別、中藥材的產(chǎn)地鑒別等。將近紅外光譜技術應用于六味地黃丸小蜜丸生藥粉的質量快速檢測,從六味地黃丸小蜜丸生產(chǎn)的源頭控制其質量,從而保證最終產(chǎn)品質量的安全性、穩(wěn)定性和有效性,達到快速、高效質量控制的目的。
偏最小二乘回歸法(plsr)、人工神經(jīng)網(wǎng)絡法(ann)、多元線性回歸(mlr)、支持向量機法(svm)等是近紅外定量分析常用的建模方法。反向人工神經(jīng)網(wǎng)絡法(bp-ann)是應用最廣泛的人工神經(jīng)網(wǎng)絡,當樣品物化性質區(qū)域較大及非線性效應較強時,其顯示出較強的預測能力。bp人工神經(jīng)網(wǎng)絡是一種有監(jiān)督的前饋運行的人工神經(jīng)網(wǎng)絡,它由輸入層、隱含層、輸出層以及各層之間的節(jié)點的連接權所組成。這個學習過程的算法由信息的正向傳播和誤差的反向傳播構成。在正向傳播過程中,輸入信息從輸入層經(jīng)隱含層逐層處理,并傳向輸出層,每一層神經(jīng)元只影響下一層神經(jīng)元的輸出。如果不能在輸出層得到期望的輸出,則轉入反向傳播。主成分分析-反向人工神經(jīng)網(wǎng)絡方法是先對光譜輸入變量進行主成分分析,以消除變量間相關性和冗余信息,提取主特征變量。使用少數(shù)的主特征變量作為神經(jīng)網(wǎng)絡的輸入,用于建立預測模型,使建模效率和預測精度大大提高。本研究建立一種基于主成分分析的反向人工神經(jīng)網(wǎng)絡算法的六味地黃丸小蜜丸生藥粉中多個指標快速檢測方法。
近年來,近紅外光譜技術已經(jīng)廣泛應用于原藥材、成品及制藥過程中關鍵指標的檢測。近紅外光譜應用于六味地黃丸已有文獻“六味地黃丸近紅外光譜定性分析方法的建立”、“近 紅外光譜法快速檢測六味地黃丸中的定量指標”、“近紅外漫反射光譜法快速鑒別不同廠家的六味地黃丸”等。然而這些文獻多數(shù)針對是六味地黃丸濃縮丸成品中單一或少數(shù)指標成分,且多數(shù)采用偏最小二乘回歸算法作為定量模型的建模方法,將基于主成分分析的反向人工神經(jīng)網(wǎng)絡用于六味地黃丸小蜜丸生藥粉中多個質控指標測定仍未見相關報道。本方法在六味地黃丸小蜜丸生藥粉及其成品質量快速分析領域具有重要前景和意義。
技術實現(xiàn)要素:
本發(fā)明目的在于提供一種六味地黃丸小蜜丸生藥粉多指標同時快速檢測方法,應用該方法建立的定量校正模型能快速準確地測定水分、芍藥苷、馬錢苷、丹皮酚4個質控指標的含量,實現(xiàn)對不同批次六味地黃丸小蜜丸生藥粉整體質量的全面快速評價。
本發(fā)明的目的是通過以下技術方案實現(xiàn):
一種六味地黃丸小蜜丸生藥粉快速檢測方法,包括如下步驟:
(1)采集不同生產(chǎn)批次的六味地黃丸小蜜丸生藥粉:藥材經(jīng)過粉碎后,過80-120目篩,優(yōu)選100目篩,混合,得到混合均勻的六味地黃丸小蜜丸生藥粉粉末;
(2)測定六味地黃丸小蜜丸生藥粉中的關鍵質控指標:選取水分含量、馬錢苷含量、芍藥苷含量和丹皮酚含量作為六味地黃丸小蜜丸生藥粉的關鍵質控指標;其中水分含量采用烘干稱重法測定,芍藥苷、馬錢苷和丹皮酚含量采用高效液相色譜法測定:其中液相色譜條件為:色譜柱:c18色譜柱,優(yōu)選waterscortecsc18分析柱,4.6×150mm,2.7μm;流動相:水(a)-乙腈(b),梯度洗脫;檢測波長0-30min,240nm,30-60min,274nm;流速為0.8ml·min-1,進樣量為10μl,柱溫30℃,所述梯度洗脫按照如下表1進行,
表1梯度洗脫表
(3)采集六味地黃丸小蜜丸生藥粉近紅外光譜數(shù)據(jù):采集六味地黃丸小蜜丸生藥粉校正集樣品和驗證集樣品的近紅外原始光譜數(shù)據(jù),稱取六味地黃丸小蜜丸生藥粉粉末,采用漫反射內置光源采集近紅外光譜,粉末厚度為1cm,以空氣為參比,掃描次數(shù)為32,分辨率為8cm-1,掃描光譜范圍為4000~10000cm-1,通過3次重復裝樣掃描得到3張光譜,平均光譜后得到該藥材樣本的最終光譜圖;
(4)選擇合適的近紅外光譜建模波段和近紅外原始光譜預處理方法:針對步驟(3)采集的近紅外原始光譜數(shù)據(jù),包括校正集和驗證集樣本,采用標準正則化變換(snv)和二階導數(shù)法(savitzky-golay平滑)預處理,分別用于消除基線漂移、噪音及固體顆粒對光譜的影響;預處理后,建模波段選擇為:水分和芍藥苷含量模型采用4500~7500cm-1波段,馬錢苷含量模型采用7400~8200cm-1和9291~9345cm-1波段,丹皮酚含量模型采用4600~6900cm-1波段;
(5)建立六味地黃丸小蜜丸生藥粉中各關鍵質控指標的近紅外定量校正模型:應用化學計量學軟件將所得到的近紅外光譜信息和參比方法所測得的標準值進行關聯(lián),采用基于主成分的反向人工神經(jīng)網(wǎng)絡(pca-bpann)建立近紅外光譜和關鍵質控指標之間的定量校正模型;
(6)測定待測的六味地黃丸小蜜丸生藥粉樣品的近紅外光譜數(shù)據(jù),導入步驟(5)所述定量校正模型,經(jīng)模型計算得到待測樣品中水分、馬錢苷、芍藥苷、丹皮酚的預測含量。
本發(fā)明所述步驟(5)具體實現(xiàn)如下:經(jīng)步驟(4)對光譜進行波段選擇和預處理后,采用基于主成分分析的bp人工神經(jīng)網(wǎng)絡(pca-bpann)計算方法建立近紅外特征光譜信息與水分含量、芍藥苷含量、馬錢苷含量和丹皮酚含量這4個質控指標的定量校正模型,并通過各模型性能評價指標考察模型性能,將驗證集數(shù)據(jù)導入已建的pca-bpann定量校正模型,通過模型性能評價指標判斷模型的穩(wěn)定性和預測能力;其中應用主成分分析法(pca)對六味地黃丸小蜜丸生藥粉光譜特征變量進行數(shù)據(jù)降維處理,提取出有效的主特征變量,作為反向人工神經(jīng)網(wǎng)絡的輸入層單元數(shù),將已測得的校正集樣本各質控指標的含量作為標準輸出,建立隱藏層為2的反向人工神經(jīng)網(wǎng)絡(bp-ann)網(wǎng)絡模型;根據(jù)模型的精密度和預測的準確性,尋找最優(yōu)隱藏層單元數(shù),輸入層到隱含層的傳遞函數(shù)為正切s形傳遞函數(shù)(tansig),隱含層到輸出層的傳遞函數(shù)為線性傳遞函數(shù)(purelin),同時采用levenberg-marquardt規(guī)則訓練網(wǎng)絡,學習速率為0.1,重復訓練次數(shù)為1000,訓練終止目標為4×10-7;最終經(jīng)校正集樣本數(shù)據(jù)訓練得到六味地黃丸小蜜丸生藥粉各質控指標的基于主成分分析的反向人工神經(jīng)網(wǎng)絡(pca-bp-ann)定量模型;利用驗證集樣品對訓練好的pca-bpann定量模型進行驗證和測試,輸入經(jīng)同樣預處理的驗證集樣本近紅外光譜數(shù)據(jù),輸出為該樣本近紅外光譜所對應的六味地黃丸小蜜丸生藥粉水分、芍藥苷、馬錢苷和丹皮酚的含量。通過模型性能評價指標判斷4個定量模型的穩(wěn)定性和預測能力;所述定量校正模型性能評價指標包括:相關系數(shù)(r)、校正集均方差(rmsec)、預測集均方差(rmsep)、相對偏差(rsep)。當r值接近于1,rmsec和rmsep值較小且互相接近時,說明模型的穩(wěn)定性好,預測精度高。當rsep值小于10%時,評價模型具有較好的預測能力,能夠滿足六味地黃丸小蜜丸生藥粉快速檢測的要求。
本發(fā)明的有益效果:
(1)本發(fā)明將近紅外光譜技術引入到六味地黃丸小蜜丸生藥粉檢測領域中,并將反向人工神經(jīng)網(wǎng)絡理論與近紅外光譜技術相結合,先利用主成分分析(pca)進行光譜數(shù)據(jù)有效特征提取,提高數(shù)據(jù)處理效率和模型訓練精度,建立六味地黃丸小蜜丸生藥粉中水分含量、馬錢苷含量、芍藥苷含量、丹皮酚含量的近紅外定量校正模型,可以同時對水分、芍藥苷、馬錢苷和丹皮酚含量進行快速無損分析,分析結果準確可靠,與常規(guī)的復雜分析方法相比,本發(fā)明所建立的近紅外快速分析方法操作簡便,準確有效,能用于六味地黃丸小蜜丸生藥粉成分快速測定。
(2)本發(fā)明從源頭上控制了原料藥材的質量,縮短檢測時間,節(jié)約生產(chǎn)成本,提高生產(chǎn)效率和經(jīng)濟效益,能全面反映六味地黃丸小蜜丸生藥粉的質量,保證六味地黃丸小蜜丸成品質量的安全性、有效性和均一性。
附圖說明
附圖1是六味地黃丸小蜜丸生藥粉近紅外原始吸收光譜圖
附圖2是六味地黃丸小蜜丸生藥粉水分含量實測值與近紅外預測值的相關圖
附圖3是六味地黃丸小蜜丸生藥粉驗證集水分含量實測值與預測值柱狀圖
附圖4是六味地黃丸小蜜丸生藥粉芍藥苷含量實測值與近紅外預測值的相關圖
附圖5是六味地黃丸小蜜丸生藥粉驗證集芍藥苷含量實測值與預測值柱狀圖
附圖6是六味地黃丸小蜜丸生藥粉馬錢苷含量實測值與近紅外預測值的相關圖
附圖7是六味地黃丸小蜜丸生藥粉驗證集馬錢苷含量實測值與預測值柱狀圖
附圖8是六味地黃丸小蜜丸生藥粉丹皮酚含量實測值與近紅外預測值的相關圖
附圖9是六味地黃丸小蜜丸生藥粉驗證集丹皮酚含量實測值與預測值柱狀圖
具體實施方式
實施例1
(1)采集不同生產(chǎn)批次的六味地黃丸小蜜丸生藥粉:采集53批次六味地黃丸小蜜丸生藥粉,由六味地黃丸小蜜丸處方藥材經(jīng)過粉碎后,過100目篩,混合,得到混合均勻的六味地黃丸小蜜丸生藥粉粉末;
(2)測定六味地黃丸小蜜丸生藥粉中的關鍵質控指標:
①六味地黃丸小蜜丸水分含量測定
水分測定方法:根據(jù)藥典烘干法,取烘干至恒重(連續(xù)兩次稱重差異小于5mg)的扁形 瓶(x0),取2g六味地黃丸小蜜丸生藥粉,精密稱重(x1),置真空烘箱中105℃烘5h,取出置干燥器中冷卻30min,稱重,再置真空烘箱中烘1h,稱重(x2),重量差異5mg以上者繼續(xù)置烘箱中烘,直至差異小于5mg。根據(jù)減少的重量,計算供試品中含水量(%)。
水分含量(%)=(x1-x2+x0)/x1×100
②六味地黃丸小蜜丸生藥粉中芍藥苷、馬錢苷和丹皮酚含量測定
芍藥苷、馬錢苷和丹皮酚含量采用高效液相色譜法測定:a.預處理方法為:取六味地黃丸小蜜丸生藥粉粉末約1g,精密稱定,置具塞錐形瓶中,精密加50ml的甲醇,超聲0.5h,再稱重,用甲醇補足失重。提取液至1.5ml的離心管中離心10min,轉速為13000r·min-1,取上清液,既得。b.液相色譜條件:色譜柱:waterscortecsc18分析柱(4.6×150mm,2.7μm);流動相:乙腈(b)-水(a)為流動相,梯度洗脫(按0~30min,流動相(b)5→15%,30~35min,流動相(b)15%,35~60min,15→60%);檢測波長0~30min:240nm,30~60min:274nm;流速為0.8ml·min-1;進樣量為10μl;柱溫30℃,理論塔板數(shù)按丹皮酚計算不應低于3500。
(3)采集六味地黃丸小蜜丸生藥粉校正集樣品和驗證集樣品的近紅外原始光譜數(shù)據(jù):
將53批次(包括37個校正集,16個驗證集)六味地黃丸小蜜丸生藥粉,稱取一定質量的六味地黃丸小蜜丸生藥粉,采用漫反射內置光源采集近紅外光譜,粉末厚度為1cm,以空氣為參比,掃描次數(shù)為32,分辨率為8cm-1,掃描光譜范圍為4000-10000cm-1,通過3次重復裝樣掃描得到3張光譜,平均光譜后得到該藥材樣本的最終光譜圖。六味地黃丸小蜜丸生藥粉近紅外吸收光譜圖見附圖1。
(4)選擇合適的近紅外光譜建模波段和近紅外原始光譜預處理方法
采用標準正則化變換(snv)和二階導數(shù)法(savitzky-golay平滑)預處理近紅外光譜原始數(shù)據(jù),分別用于消除基線漂移、噪音及固體顆粒等對光譜的影響。光譜預處理后,進行建模波段選擇:水分和芍藥苷含量模型采用4500~7500cm-1波段,馬錢苷含量模型采用7400~8200cm-1和9291~9345cm-1波段,丹皮酚含量模型采用4600~6900cm-1波段。
(5)六味地黃丸小蜜丸生藥粉的近紅外定量校正模型建立:
①水指標的近紅外定量校正模型:在4500~7500cm-1范圍內,對預處理后的近紅外光譜數(shù)據(jù)(包括37個校正集,16個驗證集),首先應用主成分分析法(pca)對六味地黃丸小蜜丸生藥粉校正集樣本光譜特征變量進行降維,提取出前25個主成分,其累計貢獻率達到99%以上,作為反向人工神經(jīng)網(wǎng)絡(bp-ann)的輸入層單元數(shù),將已測得的37個校正集樣本水分含量作為標準輸出層,建立2層結構bpann模型。通過選擇不同的中間隱藏層單元數(shù)進行反復試驗,最終確定了經(jīng)校正集樣本訓練得到pca-bpann定量校正模型。
②馬錢苷、芍藥苷和丹皮酚近紅外定量模型:對預處理后的近紅外光譜數(shù)據(jù),利用主成分分析法進行數(shù)據(jù)降維,對于芍藥苷、丹皮酚和馬錢苷分別提取出前35、33、33個主成分為主特征變量,其累計總貢獻率均大于99%。因此將主特征變量作為bp神經(jīng)網(wǎng)絡的輸入,將已測得的37個校正集樣品的馬錢苷、芍藥苷和丹皮酚含量作為標準輸出,建立隱藏層為2的bpann模型。最終確定隱藏層單元數(shù)分別為10,10時,訓練結束后得到的芍藥苷、丹皮酚和馬錢苷含量的pca-bpann模型精度最高。
③六味地黃丸小蜜丸生藥粉中各指標近紅外定量模型的建立及驗證
隨機選擇約三分之二樣本作為校正集,剩余的三分之一樣本作為驗證集用于預測。建立隱藏層為2的bp-ann網(wǎng)絡模型。根據(jù)模型的精密度和預測的準確性,尋找最優(yōu)隱藏層單元數(shù),輸入層到隱含層的傳遞函數(shù)為正切s形傳遞函數(shù)(tansig),隱含層到輸出層的傳遞函數(shù)為線性傳遞函數(shù)(purelin),同時采用levenberg-marquardt規(guī)則訓練網(wǎng)絡,學習速率為0.1,重復訓練次數(shù)為1000,訓練終止目標為4×10-7。最終經(jīng)校正集樣本數(shù)據(jù)訓練得到六味地黃丸小蜜丸生藥粉各質控指標的pca-bp-ann定量模型。
所建立的定量校正模型采用相關系數(shù)(r)、校正集均方差(rmsec)、預測集均方差(rmsep)等參數(shù)來考察模型性能,當模型相關系數(shù)r越接近1,分析準確度越高,當rmsec和rmsep值越小且彼此越接近時,模型具有較高的預測能力。同時采用預測相對偏差(rsep)來評價模型對未知樣品的預測能力,當rsep值小于10%且越小時評價模型具有較好的預測能力,能夠滿足六味地黃丸生藥粉有效成分指標成分快速檢測的要求。
表2為六味地黃丸小蜜丸生藥粉中各個指標模型評價結果。從表2中可以看出四個指標的pca-bpann模型校正集相關系數(shù)均大于0.89,線性良好,rmsec和rmsep均較小,且比較接近。對已建立模型進行預測,可以從表中看出已建立的水分模型預測能力較好,rsep小于5%,另外芍藥苷和丹皮酚模型的rsep小于12%,能夠滿足粉末近紅外光譜建模的預測能力要求。所建立的pca-bpann模型的校正和驗證結果相近,泛化能力強,具有較好的預測能力和模型穩(wěn)定性。
表2六味地黃丸小蜜丸生藥粉中各指標含量模型評價結果
(6)測定待測的六味地黃丸小蜜丸生藥粉樣品的近紅外光譜數(shù)據(jù),導入步驟(5)所述定量校正模型,經(jīng)模型計算得到待測樣品中水分、馬錢苷、芍藥苷、丹皮酚的預測含量。
將4個定量模型分別用于預測驗證集樣品中水分、芍藥苷、馬錢苷和丹皮酚的含量。水分含量的實測值和近紅外預測值的比較見附圖2-3,芍藥苷含量的實測值和近紅外預測值的比較見附圖4-5,馬錢苷含量的實測值和近紅外預測值的比較見附圖6-7,丹皮酚含量的實測值和近紅外預測值的比較見附圖8-9。可以看出六味地黃丸小蜜丸生藥粉的4個指標含量實測值與近紅外預測值接近。表明本發(fā)明所采用的方法適用于六味地黃丸小蜜丸生藥粉中各指標的快速定量分析,該方法的穩(wěn)定性和適用性較好。