基于cca和塊式rpls的分布式在線建模方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及化工過(guò)程建模技術(shù)領(lǐng)域,尤其涉及一種基于CCA和塊式RPLS的分布式 在線建模方法。
【背景技術(shù)】
[0002] 在復(fù)雜的化工過(guò)程中,由于被控系統(tǒng)很難通過(guò)建立機(jī)理模型的方式獲得系統(tǒng)的 數(shù)學(xué)模型,通常采用系統(tǒng)辨識(shí)的方法得到系統(tǒng)的數(shù)學(xué)模型,如偏最小二乘(partial least square,PLS)[l]等。然而當(dāng)被控系統(tǒng)本身比較復(fù)雜或者處于的環(huán)境比較惡劣時(shí),系統(tǒng)結(jié)構(gòu) 參數(shù)會(huì)隨著時(shí)間和運(yùn)行環(huán)境的改變而改變,如催化作用的衰減、漂移以及能效的降低等。此 時(shí)離線的系統(tǒng)辨識(shí)得到模型很難滿足動(dòng)態(tài)系統(tǒng)的模型精度要求,給基于模型的控制器設(shè)計(jì) 帶來(lái)巨大的挑戰(zhàn)。所以在這些環(huán)境下,如果能獲得變化后的新數(shù)據(jù),可以采用遞推PLS算法
[2] 有效地在線實(shí)時(shí)更新系統(tǒng)的模型。
[0003] 目前,隨著對(duì)化工原材料利用率的不斷提高,生產(chǎn)過(guò)程的復(fù)雜化程度在逐步加深。 對(duì)整個(gè)大系統(tǒng)采用集中式建??刂品椒?,勢(shì)必導(dǎo)致模型結(jié)構(gòu)相對(duì)復(fù)雜、并且模型精度難以 保證和計(jì)算繁瑣等諸多問(wèn)題[3]。采用分散式的建模方法,可以將大系統(tǒng)劃分為若干個(gè)相互 獨(dú)立的子系統(tǒng),在一定程度上使模型的復(fù)雜度降低,但是由于分散式建模方法沒(méi)有考慮各 子系統(tǒng)間的相互作用[4],系統(tǒng)的全局性無(wú)法得到滿足。然而分布式建模方法能很好的克服 這一不足,但是將復(fù)雜系統(tǒng)如何劃分為幾個(gè)相互作用的子系統(tǒng),是分布式在線建模首先要 解決的問(wèn)題,典型相關(guān)分析算法[5]則為這個(gè)問(wèn)題提供了一個(gè)很好的解決方法。
[0004] 分布式模型預(yù)測(cè)控制(Model Predictive Control,MPC)算法實(shí)施的第一步就需 要獲取分布式模型,但是大化工過(guò)程內(nèi)部關(guān)系非常復(fù)雜,獲取精度比較高的分布式模型是 比較困難的。為了使分布式預(yù)測(cè)控制在實(shí)際化工裝置中更好的應(yīng)用推廣,對(duì)大化工過(guò)程進(jìn) 行分布式在線建模方法研宄具有重要的意義,可為實(shí)際大化工過(guò)程的子系統(tǒng)分解,輸入輸 出變量的確定,以及在線建模算法提供依據(jù)和方法指導(dǎo)。
[0005] TE過(guò)程(Tennessee Eastman Process)是一個(gè)實(shí)際化工過(guò)程的仿真模擬,它是由 美國(guó)Tennessee Eastman化學(xué)公司過(guò)程控制小組的J. J. Downs和E. F. Vogel提出的,被廣 泛的應(yīng)用于過(guò)程控制技術(shù)的研宄。這個(gè)過(guò)程模型首先是以FORTRAN源代碼的形式提供給過(guò) 程控制學(xué)界,主要描述了裝置、物料和能量之間的非線性關(guān)系。
[0006] 由于實(shí)際工業(yè)生產(chǎn)裝置無(wú)法實(shí)時(shí)變動(dòng),所以TE過(guò)程的提出為專(zhuān)家學(xué)者提供了一 個(gè)很好的研宄平臺(tái),因此對(duì)它進(jìn)行研宄具有很重要的實(shí)際意義[6]。TE模型主要可以被 用來(lái)進(jìn)行裝置控制方案的設(shè)計(jì),多變量控制,優(yōu)化,模型預(yù)測(cè)控制,非線性控制,過(guò)程故障診 斷,教學(xué)等。
[0007] TE過(guò)程由五個(gè)操作單元組成[7] :Reactor (反應(yīng)器)、Condenser (冷凝器)、Vap/ Lip Separator (氣液分離器)、Stripper (汽提塔)、Compressor (循環(huán)壓縮機(jī)),如圖1所 示,該過(guò)程包括12個(gè)操作變量,41個(gè)測(cè)量變量。TE過(guò)程主要由四種氣態(tài)物進(jìn)料分別為A、 C、D和E (C中含有少量惰性氣體B),經(jīng)反應(yīng)后生成G、H兩種主產(chǎn)物和副產(chǎn)品F。反應(yīng)方程 式如下:
[0008] A (g)+C (g)+D (g) - G (I),productl
[0009] A (g)+C (g)+E (g) - H(I),product2
[0010] A (g)+E (g) - F (I),byproduct I
[0011] 3D (g) - 2F (I),byproduct〗
[0012] 反應(yīng)物進(jìn)入反應(yīng)器反應(yīng)后,產(chǎn)物首先到冷凝器冷凝,進(jìn)行第一次分離;冷凝后的混 合物,進(jìn)入氣液分離器,進(jìn)行第二次分離。在這個(gè)過(guò)程中沒(méi)有被壓縮的組分,通過(guò)循環(huán)壓縮 單元重新返回到反應(yīng)器的進(jìn)料端,進(jìn)行再次利用;被壓縮的組分進(jìn)入到提餾段進(jìn)行提餾處 理,從而可以進(jìn)一步去除未反應(yīng)完的成分。從提餾段出來(lái)的產(chǎn)物G、H在最后的精餾段中被 分離。惰性氣體B、副產(chǎn)品F,采用放空的手段進(jìn)行去除。
[0013] 由于TE過(guò)程是對(duì)實(shí)際工業(yè)過(guò)程的模擬,且是由多個(gè)單元組成的一個(gè)復(fù)雜裝置,過(guò) 程變量眾多,并且每個(gè)操作單元之間存在著較強(qiáng)的耦合作用,且系統(tǒng)開(kāi)環(huán)不穩(wěn)定。綜合TE 過(guò)程的各項(xiàng)特點(diǎn),以TE過(guò)程為研宄對(duì)象,進(jìn)行基于典型相關(guān)分析(canonical correlation analysis,CCA)和塊式遞推偏最小二乘(Recursive partial least square,RPLS)的分布 式在線建模算法的研宄是可行的。關(guān)于TE過(guò)程的建模問(wèn)題,已有部分學(xué)者進(jìn)行了研宄,包 括機(jī)理模型[8],子空間辨識(shí)方法建立的模型[9]和輸入輸出模型[10]等。這些模型都是 屬于集中式建模,把整個(gè)過(guò)程作為整體,存在模型結(jié)構(gòu)復(fù)雜,建模困難且模型精度難以保證 的問(wèn)題。文獻(xiàn)[11]提出了一種分布式離線建模方法,此方法雖然降低了模型結(jié)構(gòu)的復(fù)雜 度,但是隨著工況的改變離線一次性建立的模型的適應(yīng)性難以保證,會(huì)降低模型預(yù)測(cè)精度。
[0014] 專(zhuān)利號(hào)為201410281218. 9的發(fā)明公開(kāi)了一種基于CCA-PLS的大化工過(guò)程分布式 建模方法,該發(fā)明先對(duì)大規(guī)?;み^(guò)程采集所有的過(guò)程變量,根據(jù)過(guò)程質(zhì)量指標(biāo)確定輸出 變量,采用典型相關(guān)分析方法提取過(guò)程變量的特征成分,根據(jù)特征成分計(jì)算各輸出變量與 所有輸入變量間的最大相關(guān)系數(shù)以及相應(yīng)的主軸向量,根據(jù)主軸向量各分量的絕對(duì)值大 小,選擇各子系統(tǒng)的獨(dú)立輸入變量及相互作用輸入變量,實(shí)現(xiàn)大系統(tǒng)分解。子系統(tǒng)劃分后對(duì) 各個(gè)子系統(tǒng)采用PLS算法進(jìn)行建模,提取使得輸入輸出變量間協(xié)方差最大的成分,采用回 歸建模技術(shù)而得到子系統(tǒng)模型。本發(fā)明的有益效果是僅利用過(guò)程輸入輸出數(shù)據(jù),采用典型 相關(guān)分析原理進(jìn)行子系統(tǒng)輸入變量篩選,降低了模型維數(shù),簡(jiǎn)化了模型結(jié)構(gòu),采用PLS建模 算法進(jìn)行子系統(tǒng)建模,消除了實(shí)際應(yīng)用中大量存在的變量共線所造成的計(jì)算上的困難。但 是該發(fā)明缺點(diǎn)為:建模效率比較低,模型精度和抗干擾能力還需進(jìn)一步加強(qiáng)。
【發(fā)明內(nèi)容】
[0015] 本發(fā)明所要解決的技術(shù)問(wèn)題在于,提供一種基于CCA和塊式RPLS的分布式在線建 模方法,該發(fā)明建模效率高,模型精度和抗干擾能力更強(qiáng)。
[0016] 為了解決上述技術(shù)問(wèn)題,本發(fā)明提供了一種基于CCA和塊式RPLS的分布式在線建 模方法,包括步驟:
[0017] SlOl :分析大化工過(guò)程的質(zhì)量指標(biāo),選擇與所述質(zhì)量指標(biāo)密切相關(guān)的關(guān)鍵變量作 為輸出變量,選擇過(guò)程變量作為輸入變量,從而得到輸入變量集X和輸出變量集Y ;
[0018] S102 :將輸入變量集X和輸出變量集Y中的每一個(gè)分量對(duì)應(yīng)組合構(gòu)成輸入輸出數(shù) 據(jù),采用典型相關(guān)分析法對(duì)所述輸入輸出數(shù)據(jù)進(jìn)行子系統(tǒng)分解,并確定子系統(tǒng)的輸入變量 和輸出變量;
[0019] S103 :根據(jù)所確定的子系統(tǒng)及相應(yīng)的輸入變量和輸出變量,構(gòu)造各子系統(tǒng)的樣本 數(shù)據(jù)集{Xi,YJ,并采用塊式RPLS算法依次對(duì)所有子系統(tǒng)在線建立模型。
[0020] 進(jìn)一步的,所述S103具體包括步驟:
[0021] S1031 :將模型的三個(gè)參數(shù):數(shù)據(jù)塊寬度s、數(shù)據(jù)塊隊(duì)列長(zhǎng)度w和遺忘因子λ進(jìn)行 確定;
[0022] S1032 :對(duì)數(shù)據(jù)對(duì)矩陣{X^YJ進(jìn)行歸一化,其中,¥1表示輸出變量集Y中的第i個(gè) 分量;Xi表示典型相關(guān)分析分解后得到的子系統(tǒng)i的輸入變量集。
[0023] S1033 :根據(jù)歸一化后的數(shù)據(jù)對(duì)矩陣{Xi,YJ使用PLS回歸算法建立初始的PLS模 型
,獲得回歸系數(shù)
[0024] S1034 :根據(jù)泛化均方根誤差判斷所述PLS模型的誤差;若所述PLS模型的誤差不 在預(yù)設(shè)閾值范圍內(nèi),則返回執(zhí)行S1032,否則執(zhí)行S1035 ;
[0025] S1035 :將所述PLS模型的模型參數(shù).彳/f,Z?,g,7 }加入到數(shù)據(jù)塊隊(duì)列中;
[0026] S1036 :當(dāng)數(shù)據(jù)塊隊(duì)列中的新數(shù)據(jù)塊{Χη,Υη}到來(lái)時(shí),對(duì)數(shù)據(jù)塊{Χη,Υ η}進(jìn)行歸一 化,并執(zhí)行PLS得到PLS子模型
[0027] S1037 :更新
返回步驟S1032和S1033對(duì)所述PLS 模型進(jìn)行更新,獲得新的回歸系數(shù)??=,其中,λ為遺忘因子,
[0028]
[0029] S1038 :按照S1035~S1037推廣到有w組數(shù)據(jù)塊的情況,獲得此時(shí)的回歸系數(shù)Ciw, 完成所有子系統(tǒng)的建模,其中,
[0030]
[0031] 進(jìn)一步的,在所述S1038之后還包括步驟:
[0032] S1039:當(dāng)數(shù)據(jù)塊隊(duì)列中的模型參數(shù)個(gè)數(shù)超出了設(shè)定值w時(shí),去除數(shù)據(jù)塊隊(duì)列中最 老的一個(gè),并對(duì)隊(duì)列中各個(gè)數(shù)據(jù)塊的可信度進(jìn)行更新,對(duì)更新后的數(shù)據(jù)塊隊(duì)列再次進(jìn)行PLS 建模,得到當(dāng)前時(shí)刻的預(yù)測(cè)模型,并返回執(zhí)行S1032。
[0033] 進(jìn)一步的,所述S1033具體包括步驟:
[0034] S10331 :歸一化 XjP Y i,初始化Z,1 = U1 =乃,人=1,
[0035] S10332 :令l/f 為If 中的第一列;
[0036] S I 0 3 3 3 :令
< =If gf ,從而建立PLS外部模型,并重復(fù)循環(huán)計(jì)算,直到if收斂;
[0037] S10334 :計(jì)算 Xi的負(fù)載向量 ,其中,= (Zf)' )' /f ;
[0038] S10335 :令 W = (W,")' < )' ,從而建立 PLS 內(nèi)部模型;
[0039] S10336:計(jì)算余量矩陣 Zf+1 和 if+1,其中,,
[0040] S10337 :計(jì)算得到
[0041] 從而構(gòu)造矩陣
[0042]
[0043]
[0044]
[0045]
[0046]
[0047] S10338 :計(jì)算回歸系數(shù)Cm' = ,得到第i個(gè)子系統(tǒng)的PLS模型 Y1=X1Cfis;
[0048] S10339 :驗(yàn)證子系統(tǒng)的PLS模型的精度