專利名稱:一種丹參注射液生產濃縮過程密度的軟測量方法
技術領域:
本發(fā)明屬中藥生產過程測量方法,涉及一種中藥生產過程的軟測量方法, 尤其是一種丹參注射液濃縮過程濃縮液密度的軟測量方法,包括基于多元線性
回歸(MLR)、主成分回歸(PCR)、偏最小二乘(PLS)以及人工神經網絡(ANN)
多種多變量分析方法的軟測量模型。
背景技術:
中藥制藥過程包含提取、濃縮、醇沉等基本步驟。濃縮工序是中藥生產的 一個重要環(huán)節(jié),它將提取工序獲取的藥液進行蒸發(fā)濃縮使藥液的密度達到生產 的要求,因此該環(huán)節(jié)直接關系到中藥產品的質量。傳統(tǒng)的濃縮工序主要依靠人 工觀察的辦法,通過提取藥液與濃縮后藥液比例進行估計,這樣難以保證不同 批次的藥品成份的穩(wěn)定性。很多制藥企業(yè)已將在線密度計用于實時監(jiān)控濃縮液 的密度。由于密度計是接觸式的傳感器,而濃縮罐是密封的,不利于密度傳感 器的安裝。大多采用從濃縮罐引出一條流通管道,將密度計安裝于管道中。由 于中藥濃縮液是粘稠狀的液體,隨著濃縮液密度的增加,其流動性較差,導致 濃縮液殘留在密度計探頭上,使探頭的靈敏度下降。 一般的解決辦法是定時清 洗,但傳感器拆卸不便,清洗頻次較高,會影響生產中密度的實時測定。
軟測量技術近年來在過程控制和檢測領域涌現(xiàn)出的一種新技術,它主要是 通過間接測量的思路,利用易于獲得的其他測量信息,通過計算機來實現(xiàn)被檢 測量的估計。利用這一技術,我們可以依據(jù)易測得的過程變量(溫度、壓力、 進液量等)與密度之間的數(shù)學關系,建立密度的軟測量模型。目前國內尚未有 針對注射液濃縮過程的軟測量方面的專利成果。
發(fā)明內容
針對上述問題,本發(fā)明的目的是提供一種丹參注射液生產濃縮過程密度的 軟測量方法。利用丹參濃縮過程中的歷史數(shù)據(jù),從中選取與密度相關程度較高 的易于獲得的過程變量,篩選出具有代表性的數(shù)據(jù)集,使用多變量分析方法, 包括多元線性回歸(MLR)、主成分回歸(PCR)、偏最小二乘(PLS)以及人 工神經網絡(ANN)方法建立密度的軟測量模型,并利用軟測量模型對密度進 行實時預測,控制濃縮過程。提供了多種基于多變量分析技術的快速的密度軟 測量方法,充分利用了生產過程中得到的歷史數(shù)據(jù),有利于丹參注射液生產的質量控制。
本發(fā)明通過以下步驟實現(xiàn) (1 )采集丹參注射液生產濃縮過程中各傳感器及密度計獲取的數(shù)據(jù)集(AT, D}:首先是采集歷史數(shù)據(jù),丹參注射液生產濃縮過程在減壓濃縮蒸發(fā)收膏裝置 中進行,使用傳感器在線采集注射液生產濃縮過程6 (6^3)個批次,每個批
次采集&個時刻的樣本a》30),得到歷史數(shù)據(jù)集(AT, D}。其中,AT為各傳 感器數(shù)據(jù),包括加熱器、進液流量、蒸發(fā)器真空度、氣相溫度、液相溫度、液 位、緩沖罐壓力和冷卻上水流量,D為濃縮液的實測密度值,使用密度計采集 得到。
(2) 變量選擇和代表性數(shù)據(jù)篩選從各傳感器數(shù)據(jù)集(X, D)中選取與密
度D相關程度較高的過程變量,并去除其中的奇異樣本,篩選出具有代表性的 數(shù)據(jù)集(J^, "},劃分為訓練樣本和預測樣本。選擇主要的過程變量,通過相
關系數(shù)法計算各變量與密度D的相關程度,得到主要的過程變量^^ = (7> 7), P,丄),其中7^為氣相溫度、7)為液相溫度、尸為蒸發(fā)器真空度和Z為濃縮液 液位;再去除數(shù)據(jù)集中的奇異樣本,保留具有代表性的數(shù)據(jù),將其劃分為訓練 樣本和預測樣本。
(3) 建立軟測量模型分別使用多種多變量分析方法,包括多元線性回 歸(MLR)、主成分回歸(PCR)、偏最小二乘(PLS)以及人工神經網絡(ANN) 方法,將(2)中選取的過程變量作為輸入,密度值作為輸出,使用訓練樣本 訓練建立密度的軟測量模型。以^^ = (&, 7),尸,丄)為自變量,Z)為因變量, 使用訓練數(shù)據(jù)集{&, AJ建立模型,預測數(shù)據(jù)集{^^^, }進行模型評 價。
使用預測樣本對模型進行評價;
① 建立密度的MLR軟測量模型如下
Z\ = A^—frZjM^+e =Z>27)+ 63jP+ 其中,e為誤差項。由訓練樣本計算得到回歸系數(shù)Z^w-(A^/AT^)"J^/A,, 對預測集未知樣本的模型估計為mw = Xw,e》m^。
② 建立密度的PCR軟測量模型如下-
其中,e為誤差項,T^為主成分分解AT^-7V^V/得到的得分矩陣。計算
可得主成分回歸系數(shù)6pa^(7;」/7^)—7V/iV對預測集未知樣本,首先計 算其得分矩陣7V^^;^,^^—,,,然后由回歸系數(shù)計算模型估計值為ZV<PCT =③ 建立密度的PLS軟測量模型如下
仏=l」》+e
其中,e為誤差項,^,為主成分分解;^」,7v&iv/得到的得分矩陣,t^由 主成分分解Ar"必/得到。計算可得回歸系數(shù)& = /7v一"2v/ f4。由 主成分分解a^""/得可以建立與&之間的關系
對預測集未知樣本,由PLS回歸系數(shù)6piS即可計算模型估計值為
二X附j^e"6尸LS0
④ 將J^作為輸入,密度"作為輸出,使用人工神經網絡對訓練樣本建立密度 的軟測量模型。首先選擇網絡類型,常用的用于預測建模的神經網絡類型有
BP神經網絡、RBF神經網絡等。
其次,確定網絡結構及傳遞函數(shù)。網絡層數(shù)"》3,包括輸入層、隱層和輸 出層。其中,輸入層神經元數(shù)目即為^中變量的個數(shù),輸出層神經元數(shù)為1 個,隱層數(shù)目及隱層包含的神經元個數(shù)通過不同的取值來選取最優(yōu)值,輸入層、 中間隱層、輸出層之間的傳遞函數(shù)可選常用的tora/g函數(shù)、/ww""函數(shù)、 G做m/朋函數(shù)、門限函數(shù)等。
最后,訓練網絡模型。隨機選取網絡的初始權值,設定學習速率和終止條 件,通過優(yōu)化學習算法訓練得到網絡連接權值、閾值。使用訓練好的模型對預 測樣本進行評價。
(4)將模型應用于生產線,在線實時采集丹參注射液生產濃縮過程的過 程變量:^ = (7;, 7),尸,£),使用密度軟測量模型實時預測濃縮液的密度值, 實時監(jiān)控濃縮過程進行質量控制,指導生產。
本發(fā)明的特點和有益的效果在于,其原理是通過容易獲得的丹參注射液生 產濃縮過程的過程變量,使用多變量分析方法,構造數(shù)學模型,實現(xiàn)對難以在 線實時測量的濃縮液密度的軟測量。所建立的基于MLR的軟測量模型計算簡 單,適用于線性關系好的簡單體系,模型解釋能力強,具有實際物理化學含義; 所建立的基于PCR的軟測量模型可最大利用有用信息,通過忽略那些次要成 分,可抑制噪聲對模型的影響,進一步提高模型的預測能力;所建立的基于PLS 的軟測量模型不僅消除自變量中的噪聲信息,而且去除了因變量中的無用信 息,是多元線性回歸和主成分分析的結合,可顯著提高模型的預測能力;所建立的基于ANN的軟測量模型是非線性模型,具有自學習、自組織、自適應能 力,很強的容錯能力和并行處理信息的功能及高度非線性表達能力,這是其他 傳統(tǒng)方法所不具備的。訓練好的軟測量模型可使用篩選得到的過程變量對密度 值進行預測,為注射液的濃縮過程的優(yōu)化調控提供更合適的實現(xiàn)技術。該方法 不僅適用于丹參注射液濃縮過程,而且可推廣到其他的制藥過程,具有良好的 應用前景。
附圖1為丹參注射液濃縮過程密度的軟測量方法原理框圖。 附圖2為密度觀測值與PLS軟測量模型預測值的相關性曲線。 附圖3為密度觀測值與神經網絡軟測量模型預測值的相關性曲線。 附圖4為測試集樣本密度的觀測值與神經網絡軟測量模型預測值比較。
具體實施例方式
本發(fā)明結合附圖和實施例做進一步的解釋,但本發(fā)明不限于此實例。附圖 為本發(fā)明的實施例,兩個實施例分別使用線性PLS方法和非線性ANN方法建 立丹參注射液濃縮過程密度的軟測量模型。
實施例l:丹參注射液濃縮過程密度的線性軟測量方法(PLS) 本發(fā)明方法的原理參見圖1。
歷史數(shù)據(jù)集(X, 0}來自某制藥公司丹參注射液生產的濃縮工段,選取3 個批次的數(shù)據(jù),每個批次采樣點數(shù)為60個,樣本的選取均勻分布整個濃縮過 程。其中,X為生產線容易由傳感器獲得且比較精確的過程變量數(shù)據(jù),包括9 個過程變量加熱器(&)、進液流量(AT2)、進液累積量(AT3)、蒸發(fā)器真空 度OT4)、氣相溫度OT5)、液相溫度(X6)、液位CV7)、緩沖罐壓力(X8)和 冷卻上水流量(X9); D為濃縮液的實測密度值,使用在線密度計采集得到。 為減少系統(tǒng)誤差,數(shù)據(jù)進行4點采樣平均處理,得到每個批次的數(shù)據(jù)的采樣點 數(shù)為15個,得到A^(A, AT2, ..., J^)為45x9矩陣,Z)為45xl向量。
根據(jù)先驗知識選擇主要的過程變量,并通過相關系數(shù)法分別計算9個過程 變量&, X2, ..., X9與密度Z)的相關程度,保留主要的過程變量& = (7;, 7}, 尸,丄),其中&為氣相溫度、r,為液相溫度、尸為蒸發(fā)器真空度和丄為濃縮液 液位。其次,去除數(shù)據(jù)集中的奇異樣本(過程開始階段系統(tǒng)不穩(wěn)定,應去除), 保留具有代表性的數(shù)據(jù),最后得到的數(shù)據(jù)^為30x4矩陣,A^為30x1向量。
數(shù)據(jù)集{^^ = (7^, r,,尸,zo, AJ將用于后續(xù)軟測量模型的建立。將數(shù)據(jù)集劃分為訓練樣本和預測樣本,方法如下按照密度值大小排列樣本,等間隔選取 2/3作為訓練集樣本,余下1/3作為預測樣本。使用訓練數(shù)據(jù)集(J^,, AJ建立
模型,預測數(shù)據(jù)集(;^,^ iv^進行模型評價。
建立密度的PLS軟測量模型如下
<formula>formula see original document page 9</formula>
其中,(-0.064, 0.121,-0.017, 0.008f為PLS回歸系數(shù)。對預測集未知樣本 的模型估計只需將J^^w帶入上式即可。圖2給出了密度觀測值與PLS軟測 量模型預測值的相關性曲線,其中訓練樣本的相關系數(shù)R: 0.9542,校正均方 根誤差RMSEC-2.36。/c,預測集樣本的相關系數(shù)Rpred = 0.9468,預測均方根 誤差RMSEP二2.75y。??梢?,結果相關性較高,均方根誤差均小于3%,符合 工業(yè)現(xiàn)場應用要求。
此外,還建立了密度的其他線性軟測量模型
① MLR軟測量模型
Dfr = ATW ,力肌w+e = -0.0167^+ 0.1467) -0.089尸十0.007Z+1,151, 回歸系數(shù)6肌k = (-0.016, 0.146, -0.089, 0.007)7",對預測集未知樣本的模型估計只
需將;^^^帶入上式即可。
② PCR軟測量模型
<formula>formula see original document page 9</formula>
其中,r^為主成分分解;^^r^/v/得到的得分矩陣,戶"為載荷矩陣,
6尸o = (-0.024, -0.018,0.133, -0.104f為主成分回歸系數(shù)。該模型為主成分數(shù)m=4 時的模型,若需要主成分數(shù)小于4 (gPw<4)的模型,可將上式中i^^的后幾 列(4-m列)去除,相應的回歸系數(shù)&cw的后幾行(4-m行)去除即可。對預 測集未知樣本的模型估計只需將J^』w帶入上式即可。實施例2:丹參注射液濃縮過程密度的非線性軟測量方法(ANN)
歷史數(shù)據(jù)集(AT, 0}來自某制藥公司丹參注射液生產的濃縮工段,選取5 個批次的數(shù)據(jù),每個批次采樣點數(shù)為80個,樣本的選取均勻分布整個濃縮過 程。其中,X為生產線容易由傳感器獲得且比較精確的過程變量數(shù)據(jù),包括9 個過程變量加熱器(X)、進液流量(X2)、進液累積量(JV3)、蒸發(fā)器真空
度(a:4)、氣相溫度o:5)、液相溫度or6)、液位(x7)、緩沖罐壓力o:8)和
冷卻上水流量(AT9); D為濃縮液的實測密度值,使用在線密度計采集得到。 為減少系統(tǒng)誤差,數(shù)據(jù)進行4點采樣平均處理,得到每個批次的數(shù)據(jù)的采樣點 數(shù)為20個,得到X-(ATp AT2,…,X9)為100x9矩陣,Z)為100x1向量。
根據(jù)先驗知識選擇主要的過程變量,并通過相關系數(shù)法分別計算9個過程 變量&, X2, ..., A與密度D的相關程度,保留主要的過程變量;^ = (7^, 7}, 尸,丄),其中7^為氣相溫度、7)為液相溫度、P為蒸發(fā)器真空度和£為濃縮液 液位。其次,去除數(shù)據(jù)集中的奇異樣本(過程開始階段系統(tǒng)不穩(wěn)定,應去除), 保留具有代表性的數(shù)據(jù),最后得到的數(shù)據(jù)&為72x4矩陣,^為72x1向量。 數(shù)據(jù)集{^ = (7;, 7), P,丄),AJ將用于后續(xù)軟測量模型的建立。將數(shù)據(jù)集劃 分為訓練樣本、驗證樣本和測試樣本,方法如下按照密度值大小排列樣本, 等間隔選取l/2作為訓練樣本,1/4作為驗證樣本,余下的1/4作為測試樣本。 使用訓練數(shù)據(jù)集(^n), AJ建立模型,驗證和測試數(shù)據(jù)集(A^』w, A^J進行 模型評價。
網絡類型選擇BP神經網絡,網絡層數(shù)"=3,包括輸入層、 一個中間隱層和 輸出層。將J^作為輸入,密度D作為輸出,隨機選取網絡的初始權值,設定 學習速率"=0.8,終止條件為最大訓練次數(shù)A^1000,對訓練樣本建立密度的軟 測量模型。模型可用如下函數(shù)關系式表示
<formula>formula see original document page 10</formula>其中,輸入層神經元數(shù)目即為J^中變量的個數(shù)4,輸出層神經元數(shù)為1個, 中間隱層的神經元個數(shù)通過不同的取值來選取最優(yōu)值,輸入層、中間隱層、輸 出層之間的傳遞函數(shù)分別用tom/g函數(shù)和pwe//"函數(shù)
<formula>formula see original document page 10</formula>從而上述函數(shù)關系式即為
其中,《為輸入變量,W/,為輸入層節(jié)點/與隱層節(jié)點y'之間的權值,^為隱層節(jié)點/的閾值,h^為隱層節(jié)點A與輸出層節(jié)點之間的權值,"為輸出層節(jié)點
的閾值。參數(shù),、m;w、 ~和"均采用誤差反向傳播算法(BP)和 Levevberg-Marquardt學習算法訓練得到。
圖3給出了密度觀測值與神經網絡軟測量模型預測值的相關性曲線,其中 訓練樣本的相關系數(shù)R^ 0.9459,校正均方根誤差RMSEC:2.51。/。,驗證集樣 本的相關系數(shù)Rva: 0.9135,驗證均方根誤差RMSEV = 3.11%,預測集樣本的 相關系數(shù)Rpred: 0.9348,預測均方根誤差RMSEP = 2.75%??梢?,結果相關 性較高,均方根誤差均小于4%。圖4給出了 18個樣本的預測結果,準確性較 高,滿足工業(yè)現(xiàn)場應用需求。
權利要求
1、一種丹參注射液生產濃縮過程密度的軟測量方法。其特征在于該軟測量方法包括以下步驟(1)采集數(shù)據(jù)集采集丹參注射液生產濃縮過程中各傳感器及密度計獲取的數(shù)據(jù)集{X,D};(2)變量選擇和代表性數(shù)據(jù)篩選從各傳感器數(shù)據(jù)集{X,D}中選取與密度D相關程度較高的過程變量,并去除其中的奇異樣本,篩選出具有代表性的數(shù)據(jù)集{Xm,D},劃分為訓練樣本和預測樣本;(3)建立軟測量模型使用多變量分析方法,包括多元線性回歸、主成分回歸、偏最小二乘以及人工神經網絡方法,將(2)中選取的過程變量作為輸入,密度值作為輸出,使用訓練樣本訓練得到密度的軟測量模型,并使用預測樣本對模型進行評價,其中以Xm=(Tg,Tl,P,L)為自變量,D為因變量,使用訓練數(shù)據(jù)集{Xm_tr,Dtr}建立模型;(4)在線采集過程生產濃縮變量Xm=(Tg,Tl,P,L),使用軟測量模型對密度進行實時預測,控制濃縮過程。
2、 根據(jù)權利要求1所述的一種丹參注射液生產濃縮過程密度的軟測量方法,其特征在于,步驟(1)所述數(shù)據(jù)集采集具體步驟為丹參注射液生產濃縮過程在減壓濃縮裝置中進行,使用傳感器在線采集注射液生產濃縮過程6 (6^3)個批次,每個批次采集A個時刻的樣本a ^30),得到數(shù)據(jù)集(x, "},其中,x為各傳感器數(shù)據(jù),包括加熱器溫度、進液流量、 蒸發(fā)器真空度、氣相溫度、液相溫度、濃縮液液位、緩沖罐壓力和冷卻水流量,Z)為濃縮液的實測密度值,使用密度計采集得到。
3、 根據(jù)權利要求1所述的一種丹參注射液生產濃縮過程密度的軟測量方法,其特征是,步驟(2)所述數(shù)據(jù)集篩選具體步驟為篩選數(shù)據(jù)集(AT, "},根據(jù)經驗選擇主要的過程變量,驗證各變量與密度D 的相關程度,保留主要的過程變量& = (7^ ",尸,丄),其中7^為氣相溫度、 T)為液相溫度、尸為蒸發(fā)器真空度和丄為濃縮液液位;去除數(shù)據(jù)集中的奇異樣 本,保留具有代表性的數(shù)據(jù),將其劃分為訓練樣本和預測樣本;
4、 根據(jù)權利要求1所述的一種丹參注射液生產濃縮過程密度的軟測量方 法,其特征是,步驟(3)所述軟測量模型建立具體步驟為以A = (rg, 7},戶,丄)為自變量,Z)為因變量,使用訓練數(shù)據(jù)集(J^j,AJ建立模型,預測數(shù)據(jù)集P^』W, D,J進行模型評價,① 建立密度的MLR軟測量模型如下<formula>formula see original document page 3</formula>其中,e為誤差項。由訓練樣本計算得到回歸系數(shù)<formula>formula see original document page 3</formula>對預測集未知樣本的模型估計為<formula>formula see original document page 3</formula>② 建立密度的PCR軟測量模型如下<formula>formula see original document page 3</formula>其中,e為誤差項,r^為主成分分解<formula>formula see original document page 3</formula>得到的得分矩陣,計算可得主成分回歸系數(shù)<formula>formula see original document page 3</formula>對預測集未知樣本,首先計算其得分矩陣乙^e^A^』^^w,,然后由回歸系數(shù)計算模型估計值為<formula>formula see original document page 3</formula>③ 建立密度的PLS軟測量模型如下-<formula>formula see original document page 3</formula>其中,e為誤差項,7V^為主成分分解<formula>formula see original document page 3</formula>得到的得分矩陣,t^由主成分分解<formula>formula see original document page 3</formula>得到,計算可得回歸系數(shù)<formula>formula see original document page 3</formula>由主成分分解A,C4込/得可以建立A,與XM之間的關系<formula>formula see original document page 3</formula>對預測集未知樣本,由PLS回歸系數(shù)^^即可計算模型估計值為i^w—PW④ 將J^作為輸入,密度"作為輸出,使用人工神經網絡對訓練樣本建立密度 的軟測量模型,首先選擇網絡類型,常用的用于預測建模的神經網絡類型有 BP神經網絡、RBF神經網絡等,其次,確定網絡結構及傳遞函數(shù)。網絡層數(shù)"23,包括輸入層、隱層和輸 出層,其中,輸入層神經元數(shù)目即為A中變量的個數(shù),輸出層神經元數(shù)為1 個,隱層數(shù)目及隱層包含的神經元個數(shù)通過不同的取值來選取最優(yōu)值,輸入層、 中間隱層、輸出層之間的傳遞函數(shù)可選常用的函數(shù)、函數(shù)、 Gm/^/朋函數(shù)、門限函數(shù)等;最后,訓練網絡模型。隨機選取網絡的初始權值,設定學習速率和終止條 件,通過優(yōu)化學習算法訓練得到網絡連接權值、閾值,使用訓練好的模型對預 測樣本進行評價。
5、根據(jù)權利要求1所述的一種丹參注射液生產濃縮過程密度的軟測量方法,其特征在于,步驟(4)所述對濃縮過程密度實時預測具體步驟為將模型應用于生產線,在線實時采集丹參注射液生產濃縮過程的過程變量 xm = (rg, r,,戶,丄),使用步驟(3)軟測量模型預測濃縮液的密度值,實時監(jiān) 控濃縮過程進行質量控制。
全文摘要
本發(fā)明提供一種丹參注射液生產濃縮過程密度的軟測量方法,首先采集丹參濃縮過程中各傳感器及密度計的歷史數(shù)據(jù),涉及濃縮液密度值和生產過程在線采集的傳感器數(shù)據(jù);從各傳感器數(shù)據(jù)選取與密度相關程度較高的易于獲得的包括氣相溫度、液相溫度、壓力、濃縮液液位過程變量,篩選代表性的數(shù)據(jù)集;使用多變量分析方法,建立密度的軟測量模型;在線采集過程變量,使用軟測量模型對密度進行實時預測,控制濃縮過程。本發(fā)明針對丹參注射液生產的濃縮過程中密度難以實時監(jiān)測的問題,提供了一種具有高精度的快速密度軟測量方法,充分利用了生產過程中得到的各傳感器獲取的歷史數(shù)據(jù),有利于提高丹參注射液生產的質量控制。
文檔編號G05B19/048GK101673096SQ200910153700
公開日2010年3月17日 申請日期2009年10月26日 優(yōu)先權日2009年10月26日
發(fā)明者方利民, 瞿海斌, 程翼宇 申請人:浙江大學