專利名稱:用于維護復(fù)雜體系光譜校正模型預(yù)測能力的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于維護光譜校正模型預(yù)測能力的方法,屬于化工、食品、制藥、 環(huán)境等行業(yè)的光譜或色譜等儀器分析和檢測領(lǐng)域;本方法能實現(xiàn)光譜校正模型在同類儀器 之間的共享,以及即使在實驗條件發(fā)生變化的情況下長期使用的有效性。
背景技術(shù):
近年來,由于光纖探針技術(shù)的快速發(fā)展,使得光譜分析技術(shù)具有分析速度快、很少 需要或不需要對樣本進行預(yù)處理、非常適合原位、實時、快速分析大量的復(fù)雜化學(xué)與生物樣 本。原位實時光譜過程分析技術(shù)如傅立葉變換紅外光譜、近紅外光譜、激光拉曼光譜等在精 細化工、農(nóng)業(yè)、食品、制藥、生物分析、以及臨床診斷等領(lǐng)域越來越受到重視。包括美國藥品 與食品管理局(FDA)在內(nèi)的官方機構(gòu)正在積極地推動過程分析技術(shù)(PAT);為了從過程、工 藝上保證藥品質(zhì)量,改變目前只能依靠嚴(yán)格而生硬的認(rèn)證規(guī)范的現(xiàn)狀,歐盟國家科學(xué)家也 在2007年11月召開第二次過程分析技術(shù)大會,起草過程分析技術(shù)倡議書。PAT技術(shù)能為精 細化工、制藥等行業(yè)帶來1)消除產(chǎn)品質(zhì)量隱患;2)提高生產(chǎn)效率;3)實現(xiàn)產(chǎn)品質(zhì)量是可 以從生產(chǎn)過程中預(yù)見的,而不只是檢測出來的;4)節(jié)省分析成本。國內(nèi)近期在食品和藥品 領(lǐng)域安全事件的頻繁發(fā)生(如三聚氰氨事件)更加凸顯快速分析的重要性。光譜過程分 析技術(shù)能為解決這些問題提供可靠的途徑。使用光譜儀器對復(fù)雜化學(xué)和生物體系進行分析時,通常不是光譜數(shù)據(jù)本身而是光 譜數(shù)據(jù)中隱含的化學(xué)信息(如樣本中待測組分的濃度)才能用于產(chǎn)品質(zhì)量的控制、疾病的 診斷(注化學(xué)信息是指樣本中待測化學(xué)組分的濃度,或樣本的其他化學(xué)和物理性質(zhì);本說 明書中僅以待測組分的濃度檢測為例來闡明本發(fā)明的原理,但本發(fā)明提供的方法同樣適用 于樣本的其他化學(xué)和物理性質(zhì)的檢測)。因此需要運用數(shù)據(jù)分析方法從樣本的光譜數(shù)據(jù)中 提取出有用的化學(xué)信息。通常可以通過測量一批校正樣本(其待測組分的濃度或其他化學(xué) 和物理性質(zhì)是已知的)的光譜數(shù)據(jù),然后在校正樣本的光譜數(shù)據(jù)與校正樣本中待測化學(xué)組 分濃度(或其他化學(xué)和物理性質(zhì))之間建立一校正模型。校正模型建立后就可以用于從待 測樣本的光譜數(shù)據(jù)中預(yù)測出待測樣本中待測組分的濃度或其他化學(xué)和物理性質(zhì)(參見圖 1)。由于要建立一穩(wěn)健的校正模型一般需要較多的校正樣本,這也就意味著需要花費一定 的人力和物力,所以校正模型一經(jīng)建立,通常希望它的有效使用期限盡可能長。但是,校正模型預(yù)測結(jié)果的有效性是建立在如下假設(shè)的基礎(chǔ)上1)待測樣本與校 正樣本的光譜是在同一光譜儀器上測得;2)待測樣本與校正樣本的光譜是在同樣的實驗 條件(如溫度)下測得。如果以上兩個假設(shè)得不到滿足,則校正模型預(yù)測結(jié)果的準(zhǔn)確度就 很難保證。然而在實際的應(yīng)用中,光譜儀器部件的老化、儀器部件的更換、或?qū)嶒灄l件的變 化可能會嚴(yán)重影響光譜校正模型預(yù)測結(jié)果的準(zhǔn)確度。另外,當(dāng)將在某一光譜儀器建立起的 光譜校正模型應(yīng)用于其他同類型的光譜儀上時,光譜校正模型預(yù)測結(jié)果的有效性也很難保 證。當(dāng)出現(xiàn)上述情況時,可以使用“光譜校正模型維護方法”來維護光譜校正模型預(yù)測結(jié)果 的準(zhǔn)確度,從而避免再次耗費大量的人力和物力重新建立光譜校正模型。
自20世紀(jì)八十年代以來,光譜校正模型維護方法在光譜分析與檢測領(lǐng)域受到了 人們的廣泛關(guān)注。現(xiàn)已開發(fā)出多個用于維護光譜校正模型預(yù)測能力的方法和專利。這些方 法和專利可大致分為三大類,即校正模型參數(shù)更新方法見參考文獻1-3,預(yù)測結(jié)果糾正 方法見參考文獻4-6,以及光譜標(biāo)準(zhǔn)化方法見參考文獻7-14。校正模型參數(shù)更新方法 如Global Partial Least Square (GPLS)的原理是通過在原校正樣本集中加入幾個在新光 譜儀或新實驗條件下測試的代表性標(biāo)準(zhǔn)樣本,然后重新計算校正模型參數(shù)。這一方法只適 用于比較簡單的情況。當(dāng)由光譜儀器或?qū)嶒灄l件的變化而產(chǎn)生的光譜響應(yīng)的變化比較復(fù) 雜時,校正模型參數(shù)更新方法的性能就不太理想。預(yù)測結(jié)果糾正方法如Univariate Slope and Bias Correction(SBC)的基本原理是在對幾個代表性標(biāo)準(zhǔn)樣本的預(yù)測結(jié)果與其真實 結(jié)果之間建立一單變量校正模型。與校正模型參數(shù)更新方法一樣,這種單變量預(yù)測結(jié)果糾 正方法也只適用于比較簡單的情況。光譜標(biāo)準(zhǔn)化方法如Direct Standardization(DS)和 Piecewise Direct Standardization(PDS)的主要思想則是通過一轉(zhuǎn)換矩陣將待測樣本在 新光譜儀或新實驗條件下測得的光譜數(shù)據(jù)進行標(biāo)準(zhǔn)化,使其等價于在原光譜儀或原實驗條 件下測得的光譜數(shù)據(jù)。因而,原光譜校正模型的預(yù)測結(jié)果的有效性可得到有效的維護。標(biāo) 準(zhǔn)化矩陣可按以下方案獲得1)選擇幾個有代表性的標(biāo)準(zhǔn)樣本,2)在原光譜儀或原實驗條 件下測得標(biāo)準(zhǔn)樣本的光譜數(shù)據(jù)X1 (注其每一行代表一個樣本的光譜),3)在新光譜儀或新 實驗條件下測得標(biāo)準(zhǔn)樣本的光譜數(shù) 據(jù)X2 ;4)轉(zhuǎn)換矩陣B可通過將X1對X2進行回歸而獲得 (X1 = X2B)。雖然光譜標(biāo)準(zhǔn)化方法可適用于比較復(fù)雜的情況,但是它不但要求獲得標(biāo)準(zhǔn)樣本 在新光譜儀器或新實驗條件下的光譜,而且還要求獲得標(biāo)準(zhǔn)樣本在原光譜儀器或原實驗條 件下的光譜。在實際應(yīng)用中(如復(fù)雜多相化學(xué)和生物體系的在線監(jiān)測),這一要求很難得到 滿足。因此,非常有必要開發(fā)一種適用于各種復(fù)雜體系、且容易實現(xiàn)的性能優(yōu)良的光譜校正 模型維護方法?;谶@樣的背景,本發(fā)明旨在開發(fā)一種簡單實用、性能優(yōu)良的光譜校正模型維護 方法,并實現(xiàn)了光譜校正模型在同類型的不同光譜儀器之間,以及不同實驗條件之間的正
常使用。參考文獻1H. Swierenga, A. P. de ffeijer, L. M. C. Buydens, J. Chemom. 1999,13,237-2492C.V. Greensill, P. J. Wolfs, C. H. SpiegeIman, K. B. Walsh, Appl. Spectrosc. 2001,55,647-3]C. L. Stork, B. R. Kowalski, Chemom. Intell. Lab. Syst. 1999,43,151-164Ε· Bouveresse, C. Hartmann, D. L. Massart, I. R. Last, K. A. Prebblle, Anal. Chem. 1996,68,982-9905J. A. Jones, I. R. Last, B. F. MacDonald, K. A. Prebble, J. Pharma. Biomed. Anal. 1993,11,1227-126E. Bouveresse, D. L. Massart, P. Dardenne, Anal. Chim. Acta, 1994, 297, 405-417J.S.Shenk,M.0.Westerhaus,U.S.Patent4866644, Sept 12,19898E. Bouveresse, D. L. Massart, P. Dardenne, Anal. Chem. 1995,67,1381-13899Y.D. Wang, D. J. Veltkamp, B. R. Kowalski, Anal. Chem. 1991,63,2750—27510F.ff. Koehler, G. ff. Small, R. J. Combs, B. B. Knapp, R. T. Kroutil, Anal. Chem. 2000,72,1690-169811F. Despagne, B. ffalczak, D. L. Massart, Appl. Spectrosc. 1998,52,732-7412R.Good£icre, E. M. Timmins, A. Jones, D. B. Kel 1, J. Maddock, M. L. Heginbothom, J. T. Magee,Anal.Chim. Acta,1997,348,511-13D.T. Andrews, P. D. ffentzell, Anal. Chim. Acta, 1997,350,341—314Y.L. Xie, P. K. Hopke, Anal. Chim. Acta, 1999,384,193-20
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是,為了克服現(xiàn)有光譜校正模型維護方法不適用于復(fù)雜 體系、對數(shù)據(jù)的要求比較苛刻、以及不能應(yīng)用于復(fù)雜多相化學(xué)和生物體系的在線監(jiān)測等缺 點,提出一種用于維護復(fù)雜體系光譜校正模型預(yù)測能力的方法,以解決光譜校正模型在實 際應(yīng)用中其預(yù)測結(jié)果的準(zhǔn)確度隨光譜儀器或?qū)嶒灄l件的變化而變化的普遍問題,實現(xiàn)光譜 校正模型在同類儀器之間的共享,以及即使在實驗條件發(fā)生變化的情況下長期使用的有效 性。本發(fā)明所述用于維護光譜校正模型預(yù)測能力的方法包括以下步驟(1)在原光譜儀和原實驗條件下,測得一校正樣本集的光譜數(shù)據(jù)X。al (注其每一 行代表一個樣本的光譜),然后在校正樣本集光譜數(shù)據(jù)X。al與校正樣本待測組分的濃度之 間建立光譜校正模型c = f(x);其中x為樣本的光譜數(shù)據(jù),c為樣本中待測組分的濃度;(2)選擇幾個有代表性的標(biāo)準(zhǔn)樣本(注標(biāo)準(zhǔn)樣本中待測組分的濃度矢量cstand是 已知的,或可通過高效液相色譜HPLC等儀器測得),在新光譜儀或新實驗條件下測得標(biāo)準(zhǔn) 樣本的光譜數(shù)據(jù)Xstand,利用建立在校正樣本光譜數(shù)據(jù)上的光譜校正模型從標(biāo)準(zhǔn)樣本的光譜 數(shù)據(jù)中預(yù)測出標(biāo)準(zhǔn)樣本中待測組分的濃度,并計算出預(yù)測結(jié)果的系統(tǒng)偏差;一般地,代表性 的標(biāo)準(zhǔn)樣本的數(shù)目不應(yīng)少于樣本中的對光譜數(shù)據(jù)有顯著貢獻的化學(xué)組分的數(shù)目r ;(3)在標(biāo)準(zhǔn)樣本的光譜數(shù)據(jù)與校正模型預(yù)測結(jié)果的系統(tǒng)偏差之間建立預(yù)測結(jié)果糾 正模型;(4)在新光譜儀或新實驗條件下測得未知待測樣本的光譜數(shù)據(jù)Xtest,然后綜合運 用預(yù)測結(jié)果糾正模型與原光譜校正模型,從未知待測樣本的光譜數(shù)據(jù)Xtest中對待測樣本中 待測組分的濃度ctest作出準(zhǔn)確預(yù)測。以下對本發(fā)明做出進一步說明。本發(fā)明中,所述在標(biāo)準(zhǔn)樣本的光譜數(shù)據(jù)與校正模型預(yù)測結(jié)果的系統(tǒng)偏差之間建立 預(yù)測結(jié)果糾正模型,采用以下步驟a)首先對Xcal和Xstand分別進行奇異值分解(SVD)Xca| = Ucai^^V^, ;Xstand = "^咖時!^切⑶乂工⑶其中,上標(biāo)‘T’代表矩陣轉(zhuǎn)置操作;Ucal,Ustand、V。al*Vstand均為列正交矩陣;E cal 和E stand均為對角矩陣,其對角元素分別為光譜數(shù)據(jù)矩陣X。al和Xstand的奇異值,且按照由 大到小的順序排列;取V。al的前K列組成載荷矩陣P。al,取Vstand的前K列組成載荷矩陣Pstand,其中,K 為主成份數(shù)目,且K可設(shè)定為樣本中的對光譜數(shù)據(jù)有顯著貢獻的化學(xué)組分?jǐn)?shù)目或一稍大的數(shù)值;b)在標(biāo)準(zhǔn)樣本的光譜數(shù)據(jù)與校正模型預(yù)測結(jié)果的系統(tǒng)偏差之間建立預(yù)測結(jié)果糾 正模型/(Xstand)-Cstand = Xstand (PsLd )+ PsLd [I ■ (Pd,)+ Pi ^其中,上標(biāo)‘ +,表示矩陣的Moor-Penrose廣義逆;I為一單位矩陣,其階數(shù)與 (PcTal)+PcTal相同;b為回歸矢量;然后用主成份回歸(PCR)或偏最小二乘回歸(PLSR)等多元回歸方法從上式中估 計出回歸矢量b ;在所述估計回歸矢量b時,所使用的潛變量數(shù)應(yīng)不大于樣本中的對光譜數(shù) 據(jù)有顯著貢獻的化學(xué)組分?jǐn)?shù)目r ;上述預(yù)測結(jié)果糾正模型可能有以下幾個變種f (Xstand)-Cstand = Xstandb 或 /(Xstand)-Cstand =Xstand(Pi d)+PsLdb 或
/(Xstend ) - Cstand = XstandP “ (^Ι ) + Pcal I*3所述從未知待測樣本的光譜數(shù)據(jù)Xtest中準(zhǔn)確預(yù)測待測樣本中待測組分濃度Ctest, 采用以下計算公式Ctest = /(Xtest) - Xtest (PsIand)+ Pld [I - (Pi)+ Pi ]b所述幾個變種預(yù)測結(jié)果糾正模型對應(yīng)的計算未知待測樣本中待測組分濃度Ctest 的計算公式如下Ctest = f (Xtest) "Xtestb或 Qst =/(Xtest)-Xtest(PsLd)+pJandb 或
Ctest = /(Xtest) 一 Xtest 卩“(PIl)+ ^Iai ]b本發(fā)明所述除適用于需要預(yù)測的是樣本中待測組分濃度的情況之外,還適用于需 要預(yù)測的是樣本的其他化學(xué)或物理性質(zhì)的情況。本發(fā)明方法中所述光譜儀(原光譜儀和新光譜儀)可以是近紅外光譜儀器,還可 以是紅外光譜儀、熒光光譜儀,紫外-可見光譜儀、拉曼光譜儀、原子吸收光譜儀、原子發(fā)射 光譜儀或X-射線光譜儀等其他光譜儀器,以及其他分析儀器(如氣相色譜、液相色譜、質(zhì) 譜、核磁共振儀等)。本發(fā)明方法不僅適用于儀器發(fā)生改變(如儀器性能隨時間的變化,儀器部件的 更換、以及使用另一臺儀器)的情況,還適用于實驗條件(如溫度、濕度、壓力、攪拌速度、進 樣量、甚至地點等)發(fā)生變化的情況。本發(fā)明從光譜分析領(lǐng)域中使用的最基本的線性模型開始(X = CXSt,其中X為光 譜數(shù)據(jù)矩陣,其第i行代表第i個樣本的光譜;C為濃度矩陣,其第(i,j)元素代表第i個 樣本中第j個化 學(xué)組分的濃度;S為純光譜矩陣,其第j列代表樣本中第j個化學(xué)組分的純 光譜;上標(biāo)‘T’代表矩陣轉(zhuǎn)置操作),通過嚴(yán)格的數(shù)學(xué)推導(dǎo)闡述了光譜儀器或?qū)嶒灄l件的變 化對光譜校正模型預(yù)測結(jié)果的影響,首次提出了在標(biāo)準(zhǔn)樣本的光譜數(shù)據(jù)與校正模型預(yù)測結(jié) 果的系統(tǒng)偏差之間建立預(yù)測結(jié)果糾正模型來維護光譜校正模型預(yù)測能力的思想。本發(fā)明采用了預(yù)測結(jié)果糾正模型的策略來維護光譜校正模型在光譜儀器或?qū)嶒?條件發(fā)生變化的情況下的預(yù)測能力。由于在標(biāo)準(zhǔn)樣本的光譜數(shù)據(jù)與校正模型預(yù)測結(jié)果的系 統(tǒng)偏差之間建立的預(yù)測結(jié)果糾正模型是多變量回歸模型,其應(yīng)對復(fù)雜光譜變化的能力要比單變量預(yù)測結(jié)果糾正方法(如SBC)強的多。另外,本方法不要求獲得標(biāo)準(zhǔn)樣本在原光譜儀 器或原實驗條件下的光譜數(shù)據(jù),因此無需保存標(biāo)準(zhǔn)樣本。其應(yīng)用范圍要比光譜標(biāo)準(zhǔn)化方法 (如DS和PDS)的應(yīng)用范圍廣,可以方便地應(yīng)用于復(fù)雜化學(xué)和生物體系的在線監(jiān)測,在精細 化工、農(nóng)業(yè)、食品、制藥、生物分析、以及臨床診斷等領(lǐng)域中真正實現(xiàn)實時、原位、無損光譜分 析。由以上描述可知,本發(fā)明為一種在光譜儀器或?qū)嶒灄l件發(fā)生變化的情況下用于維 護光譜校正模型預(yù)測能力的方法,它克服了現(xiàn)有光譜校正模型維護方法對光譜數(shù)據(jù)要求苛 刻,不能應(yīng)對復(fù)雜光譜變化,以及不能適用于復(fù)雜化學(xué)和生物體系的實時在線監(jiān)測等諸多 方面的不足,其優(yōu)點可概括如下1)本發(fā)明是建立在合理的、且已經(jīng)驗證的假設(shè)上,所有公式均是通過嚴(yán)格的數(shù)學(xué) 推導(dǎo)獲得的。因此本發(fā)明具有理論基礎(chǔ)完善的特點;2)本發(fā)明只要求獲得幾個標(biāo)準(zhǔn)樣本在新光譜儀器或新實驗條件下的光譜數(shù)據(jù)以 及這些標(biāo)準(zhǔn)樣本中待測組分的濃度。在實際應(yīng)用中,這一要求很容易得到滿足。因此本發(fā) 明具有應(yīng)用范圍廣的優(yōu)勢;3)本發(fā)明所涉及的較高級的數(shù)學(xué)計算僅包括奇異值分解(SVD)和主成份回歸 (PCR)或偏最小二乘回歸(PLSR)等多元回歸方法。而這些方法的原理已十分成熟、計算過 程比較簡單。因此本發(fā)明又具有使用簡單的優(yōu)點,適合非專業(yè)人員使用。
圖1是現(xiàn)有從待測樣本的光譜數(shù)據(jù)中預(yù)測出待測樣本中待測組分的濃度或其他 化學(xué)和物理性質(zhì)的流程圖;圖2是本發(fā)明技術(shù)方案圖示;圖3是標(biāo)準(zhǔn)樣本數(shù)目對光譜校正模型維護方法性能的影響圖示(〇本發(fā)明,A PDS,D :GPLSR,0 :SBC);均方根誤差(RMSE)的計算是建立在除標(biāo)準(zhǔn)樣本外的所有樣本基 礎(chǔ)上的;圖4是考察了 P。al和Pstand中主成份數(shù)目K的取值對本發(fā)明性能的影響圖示(標(biāo)準(zhǔn) 樣本的數(shù)目為13),均方根誤差(RMSE)的計算建立在除標(biāo)準(zhǔn)樣本外的所有樣本的基礎(chǔ)上;圖5是由不同方法預(yù)測出“測試批處理過程1”中產(chǎn)物的濃度曲線(黑色實線)(a PLSR,b :GPLSR, c :SBC-PLSR, d 本發(fā)明-PLSR);圓圈:HPLC離線測得的產(chǎn)物濃度。
具體實施例方式實施例1 藥片中活性成分近紅外光譜校正模型的維護本實施例使用了公開的近紅外光譜數(shù)據(jù)(http://www. idrc-chambersburg.org/ shootout2002. html)來測試本發(fā)明在光譜儀器發(fā)生變化時對光譜校正模型預(yù)測能力進行 維護的性能。該光譜數(shù)據(jù)是由在兩臺Foss NIRsystems近紅外光譜儀(其中一臺叫做“主 光譜儀”,另一臺叫做“從光譜儀”)上測得的655片藥片的共1308條吸收光譜組成(波長 范圍600nm 1638nm,波長間隔2nm)。每一片藥片中的活性成分的含量通過高效液相色 譜法進行測定。將每一臺儀器上測得的655條光譜分成校正集(155條光譜)、測試集(460 條光譜)和驗證集(40條光譜)。校正集藥片樣本中活性成分的含量在151. 6 239. lmg之間。本實驗的主要步驟如下1)采用偏最小二乘回歸法(PLSR)在“主光譜儀”上測得的校正樣本的光譜數(shù)據(jù)與 校正樣本中活性組分含量之間建立光譜校正模型。通過考察回歸模型對測試集的預(yù)測誤差 來確定PLS回歸模型中使用的潛變量數(shù)。2)將在“主光譜儀”上建立的光譜校正模型應(yīng)用于在“從光譜儀”上測得光譜數(shù)據(jù), 考察光譜儀器變化對光譜校正模型的預(yù)測結(jié)果的影響。3)從測試集樣本中隨機選取6個代表性標(biāo)準(zhǔn)樣本后,考察本發(fā)明與GPLS、SBC以 及PDS在維護光譜校正模型預(yù)測能力方面的性能差異。表1列出了本實驗的主要結(jié)果。從表1的結(jié)果可以看出光譜儀器的變化對原光 譜校正模型預(yù)測結(jié)果的準(zhǔn)確度有著十分顯著的影響;當(dāng)光譜儀器發(fā)生變化,且沒有采用適 當(dāng)?shù)墓庾V校正模型維護方法的情況下,原光譜校正模型將很難給出準(zhǔn)確的預(yù)測結(jié)果;光譜 校正模型維護方法SBC、GPLS、PDS以及本發(fā)明的使用均能有效地提高原光譜校正模型預(yù)測 結(jié)果的準(zhǔn)確度。其中,本發(fā)明的效果最好。使用本發(fā)明能有效地消除光譜儀器變化對于光 譜校正模型預(yù)測結(jié)果準(zhǔn)確度的影響。雖然PDS在本例中的效果與本發(fā)明相當(dāng),但PDS不但 要求獲得標(biāo)準(zhǔn)樣本在新光譜儀器或新實驗條件下的光譜,而且還要求獲得標(biāo)準(zhǔn)樣本在原光 譜儀器或原實驗條件下的光譜。在實際應(yīng)用中(如復(fù)雜多相化學(xué)和生物體系的在線監(jiān)測), 這一要求很難得到滿足。圖3顯示的是標(biāo)準(zhǔn)樣本數(shù)目對光譜校正模型維護方法性能的影響。由圖3可知 本發(fā)明只需要很少的標(biāo)準(zhǔn)樣本就可以有效地維護光譜校正模型的預(yù)測能力;相比于SBC、 GPLS以及PDS而言,本發(fā)明能在明顯少得多的標(biāo)準(zhǔn)樣本的基礎(chǔ)上達到同樣的光譜校正模型 維護的效果。圖4考察了 P。al和Pstand中主成份數(shù)目K的取值對本發(fā)明性能的影響。從圖4可 以看出,K的取值對本發(fā)明的性能有一定的影響。但K值在一較寬的范圍內(nèi)變化時,本發(fā)明 的性能非常良好且沒有太大的變化。這說明本發(fā)明對K值的變化不是太敏感。因此,在實 際應(yīng)用中K可設(shè)定為樣本中的對光譜數(shù)據(jù)有顯著貢獻的化學(xué)組分?jǐn)?shù)目或一稍大的數(shù)值。實施例2 生物發(fā)酵過程中抗生素產(chǎn)物近紅外光譜校正模型的維護本實施例中使用了在一生物反應(yīng)過程中記錄的近紅外光譜數(shù)據(jù)來測試本發(fā)明在 實驗條件發(fā)生變化時對光譜校正模型預(yù)測能力進行維護的性能。該生物反應(yīng)是一在12升 反應(yīng)器中的鏈霉菌發(fā)酵生產(chǎn)抗生素的過程。該過程涉及兩個階段,即生長階段和生產(chǎn)階 段。生產(chǎn)階段是一持續(xù)時間為140小時左右的批處理過程。在本實例,一共進行了兩組實 驗。第一組由7個批處理過程組成,稱為“校正批處理過程”。第二組由3個批處理過程組 成,稱為“測試批處理過程”。7個校正批處理過程均在相同的實驗條件下進行。3個“測試 批處理過程”則是在不同的實驗條件下進行的。對所有10個批處理反應(yīng)過程的生產(chǎn)階段均 用近紅外光譜儀(Zeiss Corona 45NIR,Carl Zeiss,Germany)進行在線監(jiān)測,每15分鐘記 錄一條反射近紅外光譜Log (1/R)(波長范圍1064nm 1430nm,間隔6歷,掃描次數(shù)10)。 使用高效液相色譜(HPLC)離線測定批處理反應(yīng)過程中產(chǎn)物的濃度。在每一批處理過程中, 大約可以獲得10個左右的離線產(chǎn)物濃度值。本實驗的主要步驟如下
9
1)采用偏最小二乘回歸法(PLSR)在“校正批處理過程”中HPLC離線測得的產(chǎn)物 濃度與相應(yīng)樣本的近紅外光譜數(shù)據(jù)之間建立光譜校正模型。PLS回歸模型中使用的最優(yōu)潛 變量數(shù)是通過Leave-One-Batch-Out交互檢驗法來確定的。2)將在“校正批處理過程”的光譜數(shù)據(jù)上建立的光譜校正模型應(yīng)用于在 “測試批 處理過程”中測得光譜數(shù)據(jù),考察實驗條件變化對光譜校正模型預(yù)測結(jié)果的影響。3)對每一“測試批處理過程”,選取前兩個離線產(chǎn)物濃度值對應(yīng)的樣本作為標(biāo)準(zhǔn)樣 本,考察本發(fā)明與GPLS以及SBC在維護光譜校正模型預(yù)測能力方面的性能差異。表2和圖5列出了本實驗的主要結(jié)果。從表2和圖5可以看出當(dāng)沒有使用模型 維護方法時,由于實驗條件的變化,建立在“校正批處理過程”上的光譜校正模型無法準(zhǔn)確 預(yù)測“測試批處理過程”中產(chǎn)物的濃度。雖然GPLS和SBC的使用可以顯著降低光譜校正模 型的預(yù)測誤差,但它們的結(jié)果還是不太理想(圖5b、5c)。本發(fā)明的性能明顯優(yōu)于其他兩個 模型維護方法。本發(fā)明的使用能使建立在“校正批處理過程”上的光譜校正模型準(zhǔn)確地預(yù) 測出“測試批處理過程”中產(chǎn)物的濃度。表1 當(dāng)使用“從光譜儀器”測定藥片樣本的光譜數(shù)據(jù)時,原光譜校正模型與不同 的維護方法結(jié)合使用后對活性組分含量預(yù)測結(jié)果的均方根誤差(RMSE) 注1 :PLSR:原光譜校正模型;SBC-PLSR:原光譜校正模型結(jié)合SBC維護方法; GPLS :Global Partial Least Square Regression ;PDS_PLSR 原光譜校正模型結(jié)合 PDS 維 護方法;本發(fā)明-PLSR 原光譜校正模型結(jié)合本發(fā)明維護方法。注2 光譜校正模型維護方法(SBC,GPLSR,PDS和本發(fā)明)均使用相同的6個代表 性的標(biāo)準(zhǔn)樣本。注3 括號中的值表示當(dāng)使用“主光譜儀器”測定藥片樣本的光譜數(shù)據(jù)時,原校正 模型對樣本中活性組分含量預(yù)測結(jié)果的均方根誤差。表2 原光譜校正模型與不同的維護方法結(jié)合使用后對測試批處理過程中產(chǎn)物含 量預(yù)測結(jié)果的均方根誤差(RMSE) 注由于PDS不但要求獲得標(biāo)準(zhǔn)樣本在新實驗條件下的光譜,而且還要求獲得標(biāo) 準(zhǔn)樣本在原實驗條件下的光譜,因此PDS無法應(yīng)用本體系。
權(quán)利要求
一種用于維護光譜校正模型預(yù)測能力的方法,具體步驟為(1)在原光譜儀和原實驗條件下,測得一校正樣本集光譜數(shù)據(jù)Xcal,在校正樣本集光譜數(shù)據(jù)Xcal與校正樣本待測組分的濃度之間建立光譜校正模型c=f(x);其中x為樣本的光譜數(shù)據(jù),c為樣本中待測組分的濃度(2)選擇幾個有代表性的標(biāo)準(zhǔn)樣本,在新光譜儀或新實驗條件下測得標(biāo)準(zhǔn)樣本的光譜數(shù)據(jù)Xstand,利用建立在校正樣本光譜數(shù)據(jù)上的光譜校正模型從標(biāo)準(zhǔn)樣本的光譜數(shù)據(jù)中預(yù)測出標(biāo)準(zhǔn)樣本中待測組分的濃度,并計算出預(yù)測結(jié)果的系統(tǒng)偏差;(3)在標(biāo)準(zhǔn)樣本的光譜數(shù)據(jù)與校正模型預(yù)測結(jié)果的系統(tǒng)偏差之間建立預(yù)測結(jié)果糾正模型;(4)在新光譜儀或新實驗條件下測得的未知待測樣本的光譜數(shù)據(jù)xtest,然后綜合運用預(yù)測結(jié)果糾正模型與原光譜校正模型,從未知待測樣本的光譜數(shù)據(jù)xtest中對待測樣本中待測組分的濃度ctest作出準(zhǔn)確預(yù)測。
2.根據(jù)權(quán)利要求1所述用于維護光譜校正模型預(yù)測能力的方法,其特征是,所述在標(biāo) 準(zhǔn)樣本的光譜數(shù)據(jù)與校正模型預(yù)測結(jié)果的系統(tǒng)偏差之間建立預(yù)測結(jié)果糾正模型,采用以下 步驟(1)對X。al*Xstand分別進行奇異值分解(SVD)Y 一 tt y t^T ^ 一 TT y VTAcal 一 ^ cal^cal Vcal stand 一 U stand ^ stand V stand其中,上標(biāo)‘T’代表矩陣轉(zhuǎn)置操作;U。al,Ustmd、Vcal和Vstand均為列正交矩陣;E。al和 E stand均為對角矩陣,其對角元素分別為光譜數(shù)據(jù)矩陣X。al和Xstand的奇異值,且按照由大 到小的順序排列;取Vcal的前K列組成載荷矩陣P。al,取Vstand的前K列組成載荷矩陣Pstand,其中,K為主 成份數(shù)目且K可設(shè)定為樣本中的對光譜數(shù)據(jù)有顯著貢獻的化學(xué)組分?jǐn)?shù)目或一稍大的數(shù)值;(2)在標(biāo)準(zhǔn)樣本的光譜數(shù)據(jù)與校正模型預(yù)測結(jié)果的系統(tǒng)偏差之間建立預(yù)測結(jié)果糾正模型/(Xstand)-v stand =Xstanci (Pgtand ) Pstand [工"(-^cal) ^cal ]b其中,上標(biāo)‘ +,表示矩陣的Moor-Penrose廣義逆;I為一單位矩陣,其階數(shù)與(P^+Pi 相同;b為回歸矢量;然后用主成份回歸(PCR)或偏最小二乘回歸(PLSR)等多元回歸方法從上式中估計出 回歸矢量b ;在所述估計回歸矢量b時,所使用的潛變量數(shù)應(yīng)不大于樣本中的對光譜數(shù)據(jù)有 顯著貢獻的化學(xué)組分?jǐn)?shù)目r。
3.根據(jù)權(quán)利要求2所述用于維護光譜校正模型預(yù)測能力的方法,其特征是,所述預(yù)測 結(jié)果糾正模型的其他可能變種為f (Xstand) _cstand 一 Xstandb ^^/"(X^tanci) 一 Cstand 一 ^stand (^stand ) ^standb或/(Xstand ) “ Cstand = Xstand [I - (PCal) Peal ]bo
4.根據(jù)權(quán)利要求1所述用于維護光譜校正模型預(yù)測能力的方法,其特征是,所述從未 知待測樣本的光譜數(shù)據(jù)xtest中準(zhǔn)確預(yù)測待測樣本中待測組分濃度ctest,采用以下計算公 式Ctest 二 /(Xtest ) 一 X test (^stand ) ^stand P " (Peal) ^cal ]b
5.根據(jù)權(quán)利要求3所述用于維護光譜校正模型預(yù)測能力的方法,其特征是,所述變種 預(yù)測結(jié)果糾正模型對應(yīng)的計算未知待測樣本中待測組分濃度ctest的計算公式為ctest 一 f (xtest) _xtestb 或〔test _ /XXfest ) _ ^test (Pstand ) Pstandb或Ctest ~ /(Xtest) 一 Xtest 卩"(Peal) -^cal ]b
6.根據(jù)權(quán)利要求1所述用于維護光譜校正模型預(yù)測能力的方法,其特征是,它用于預(yù) 測樣本中待測組分濃度,或用于預(yù)測樣本的其他化學(xué)或物理性質(zhì)。
7.根據(jù)權(quán)利要求1所述用于維護光譜校正模型預(yù)測能力的方法,其特征是,所述光譜 儀為近紅外光譜儀器或紅外光譜儀、熒光光譜儀,紫外_可見光譜儀、拉曼光譜儀、原子吸 收光譜儀、原子發(fā)射光譜儀、X-射線光譜儀,或是氣相色譜、液相色譜、質(zhì)譜、核磁共振儀。
全文摘要
本發(fā)明提供了一種用于在光譜儀器或者實驗條件發(fā)生變化的情況下維護光譜校正模型預(yù)測能力的方法,其步驟為1)首先測得數(shù)個標(biāo)準(zhǔn)樣本的光譜數(shù)據(jù);2)運用原光譜校正模型從標(biāo)準(zhǔn)樣本的光譜數(shù)據(jù)中預(yù)測其待測組分的濃度(或其他化學(xué)和物理性質(zhì)),并計算預(yù)測系統(tǒng)偏差;3)在標(biāo)準(zhǔn)樣本的光譜數(shù)據(jù)與校正模型預(yù)測結(jié)果的系統(tǒng)偏差之間建立一預(yù)測結(jié)果糾正模型;4)將預(yù)測結(jié)果糾正模型和原校正模型結(jié)合使用,從而解決光譜校正模型在實際應(yīng)用中其預(yù)測結(jié)果的準(zhǔn)確度隨光譜儀器或?qū)嶒灄l件的變化而變化的普遍問題。本發(fā)明使用簡單、適用范圍廣泛,實現(xiàn)了光譜校正模型在同類儀器之間的共享,以及即使在實驗條件發(fā)生變化的情況下長期使用的有效性。
文檔編號G01N21/25GK101865828SQ20101018721
公開日2010年10月20日 申請日期2010年5月31日 優(yōu)先權(quán)日2010年5月31日
發(fā)明者俞汝勤, 陳增萍 申請人:湖南大學(xué)