一種基于嵌套迭代費(fèi)舍爾判別分析的故障診斷方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于化工過(guò)程統(tǒng)計(jì)監(jiān)測(cè)領(lǐng)域,特別是涉及一種基于嵌套迭代費(fèi)舍爾判別分 析的故障診斷方法。
【背景技術(shù)】
[0002] 作為工業(yè)生產(chǎn)中一種重要的生產(chǎn)方式,化工過(guò)程與人們的生活息息相關(guān),已被廣 泛應(yīng)用于冶金、煉油、造紙、制革等領(lǐng)域。如何保證化工過(guò)程生產(chǎn)安全,提高產(chǎn)品質(zhì)量和經(jīng)濟(jì) 效益是人們關(guān)注的焦點(diǎn)。隨著化工過(guò)程日益復(fù)雜,在線故障檢測(cè)及診斷也越來(lái)越重要。故 障診斷是指在檢測(cè)到故障發(fā)生后,進(jìn)一步判斷發(fā)生了哪種故障。提早診斷出故障可以保障 生產(chǎn)的安全可靠運(yùn)行以及產(chǎn)品的高質(zhì)量,從而可以避免重大安全事故,減少人員傷亡以及 提高經(jīng)濟(jì)效益。隨著技術(shù)的發(fā)展,工業(yè)現(xiàn)場(chǎng)可以獲得越來(lái)越多的數(shù)據(jù),基于數(shù)據(jù)的在線故障 診斷策略越來(lái)越受到研宄人員和現(xiàn)場(chǎng)工程師的青睞。化工過(guò)程的統(tǒng)計(jì)建模、在線監(jiān)測(cè)、故障 診斷及質(zhì)量預(yù)測(cè)已成為廣泛的研宄課題。
[0003] 前人對(duì)此已經(jīng)作了相應(yīng)的研宄與探討,基于不同的角度提出了相應(yīng)的在線故障診 斷辦法。歸納起來(lái)有如下幾種:基于重構(gòu)指標(biāo)的方法、基于相似度計(jì)算的模式匹配方法、基 于模型的改進(jìn)隔離方法以及降維的方法。其中,降維的方法如主元分析、費(fèi)舍爾判別分析能 有效處理高維度、高相關(guān)性的數(shù)據(jù),它們通過(guò)構(gòu)造潛變量將高維度原始測(cè)量數(shù)據(jù)投影到低 維度的監(jiān)測(cè)空間,從而提高了故障診斷精度,被廣泛應(yīng)用于工業(yè)過(guò)程在線故障診斷。總體來(lái) 說(shuō),上述幾種基于降維的故障診斷方法各有各的適用場(chǎng)合與優(yōu)缺點(diǎn)。相對(duì)而言,費(fèi)舍爾判別 分析方法側(cè)重于區(qū)分具有不同特性的數(shù)據(jù),在故障診斷方面更有優(yōu)勢(shì)。但是,基于傳統(tǒng)費(fèi)舍 爾判別分析的在線故障診斷方法應(yīng)用于實(shí)際化工過(guò)程時(shí)存在三方面的問(wèn)題:首先,化工過(guò) 程數(shù)據(jù)往往是高度耦合的,這可能導(dǎo)致類內(nèi)散布矩陣是奇異的,從而無(wú)法進(jìn)行奇異值分解 提取過(guò)程數(shù)據(jù)潛在信息。其次,由于類間散布矩陣奇異,有可能導(dǎo)致判別成分的個(gè)數(shù)小于類 別的個(gè)數(shù),從而使得散布矩陣無(wú)法提供充足的過(guò)程信息。最后,在每個(gè)類中,所提取的判別 成分是線性相關(guān)的,這就導(dǎo)致所提取的過(guò)程信息冗余。針對(duì)傳統(tǒng)費(fèi)舍爾判別分析方法的不 足,研宄人員提出了一系列的改進(jìn)方法??偟膩?lái)說(shuō),這些方法均采用兩步法解決高耦合數(shù)據(jù) 帶來(lái)的散步矩陣奇異性問(wèn)題,其關(guān)鍵在于如何在進(jìn)行費(fèi)舍爾判別分析之前進(jìn)行數(shù)據(jù)降維。 然而,前人的方法在解決奇異性問(wèn)題時(shí)均存在一定程度的問(wèn)題,如數(shù)據(jù)壓縮不當(dāng)而導(dǎo)致無(wú) 法提取出過(guò)程數(shù)據(jù)的關(guān)鍵潛在信息,或者過(guò)程重要信息缺失等等,從而導(dǎo)致故障診斷精度 欠缺。
[0004] 本發(fā)明的內(nèi)容深入考慮了化工過(guò)程的復(fù)雜性以及數(shù)據(jù)的高維度高耦合性,提出了 一種基于嵌套迭代費(fèi)舍爾判別分析的故障診斷方法。該方法充分發(fā)掘了過(guò)程數(shù)據(jù)所包含的 潛在信息,能有效區(qū)分不同類別的過(guò)程數(shù)據(jù),大大提高了在線故障診斷性能。到目前為止, 尚未見(jiàn)到與本發(fā)明相關(guān)的研宄報(bào)道。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于針對(duì)現(xiàn)有針對(duì)化工生產(chǎn)過(guò)程的在線故障診斷技術(shù)的不足,提供 一種基于嵌套迭代費(fèi)舍爾判別分析的故障診斷方法。
[0006] 本發(fā)明的目的是通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn)的:一種基于嵌套迭代費(fèi)舍爾判別分析 的故障診斷方法,該方法包括以下步驟:
[0007] (1)獲取過(guò)程分析數(shù)據(jù):設(shè)一個(gè)化工生產(chǎn)過(guò)程具有J個(gè)測(cè)量變量和操作變量,則每 一次采樣可得到一個(gè)1XJ的向量,采樣K次后得到的數(shù)據(jù)表述為一個(gè)二維矩陣X(KXJ),所 述測(cè)量變量為運(yùn)行過(guò)程中可被測(cè)量的狀態(tài)參數(shù),包括流量、溫度、速率;所述操作變量包括 給料量、閥門開(kāi)度;分別獲取正常數(shù)據(jù)二維矩陣Xn(KXJ)和故障數(shù)據(jù)二維矩陣Xf,m(KXJ), 其中,下標(biāo)n表示正常數(shù)據(jù),下標(biāo)f?表示故障數(shù)據(jù),m表示故障的類別;將正常數(shù)據(jù)和故障數(shù) 據(jù)統(tǒng)一標(biāo)示為\(KXJ),其中下標(biāo)i表示數(shù)據(jù)的類別;
[0008] (2)選取正常數(shù)據(jù)樣本和一類故障數(shù)據(jù)樣本作為總樣本
【主權(quán)項(xiàng)】
1. 一種基于嵌套迭代費(fèi)舍爾判別分析的故障診斷方法,其特征在于,該方法包括以下 步驟: (1) 獲取過(guò)程分析數(shù)據(jù):設(shè)一個(gè)化工生產(chǎn)過(guò)程具有J個(gè)測(cè)量變量和操作變量,則每一次 采樣可得到一個(gè)IX J的向量,采樣K次后得到的數(shù)據(jù)表述為一個(gè)二維矩陣X (K X J),所述測(cè) 量變量為運(yùn)行過(guò)程中可被測(cè)量的狀態(tài)參數(shù),包括流量、溫度、速率;所述操作變量包括給料 量、閥門開(kāi)度;分別獲取正常數(shù)據(jù)二維矩陣X n(KXJ)和故障數(shù)據(jù)二維矩陣Xtm(KXJ),其中, 下標(biāo)η表示正常數(shù)據(jù),下標(biāo)f表示故障數(shù)據(jù),m表示故障的類別;將正常數(shù)據(jù)和故障數(shù)據(jù)統(tǒng) 一標(biāo)示為X i (K X J),其中下標(biāo)i表示數(shù)據(jù)的類別; (2) 選取正常數(shù)據(jù)樣本和一類故障數(shù)據(jù)樣本作為總樣本
.其中,
由Xi (i = 1,2)從上到下排列組成; (3) 數(shù)據(jù)準(zhǔn)備:分別計(jì)算總樣本均值向量?、每類樣本均值向量€、總類內(nèi)散布矩陣Sw 和類間的散布矩陣Sb,計(jì)算公式如下:
其中,31是每個(gè)類的散布矩陣; (4) 提取初始判別成分,該步驟由以下子步驟來(lái)實(shí)現(xiàn): (4. 1)最大化類間離散度:求取使類間離散度最大的權(quán)重向量w,即相當(dāng)于求取類間散 布矩陣Sb的最大特征值所對(duì)應(yīng)的特征向量w,所述類間離散度為w TSbw,獲取w后,按公式 (2)求取相應(yīng)的總樣本初始判別成分t ;
(2) 其中,X是減均值中心化后的總樣本,那么對(duì)于每一類樣本,其所對(duì)應(yīng)的類判別成分為 夂=零w,可知,t由&從上到下依次排列構(gòu)成; (4. 2)數(shù)據(jù)壓縮:對(duì)減均值中心化后的總樣本文根據(jù)下式進(jìn)行數(shù)據(jù)壓縮:
其中:P表示總樣本的負(fù)載向量,E表示總樣本X中與t無(wú)關(guān)的殘差; 同理,對(duì)于每類樣本I,都可以通過(guò)公式(4)得到與&無(wú)關(guān)的殘差%,且E由E,從上 到下排列組成:
(4) 最后,用上述數(shù)據(jù)壓縮關(guān)系WPt更新每一個(gè)類的信息,以保證判別成分的正交性: Ei= X I-XiWp1 (5) (4. 3)迭代更新過(guò)程數(shù)據(jù) (4. 3. 1)用步驟(4. 2)中獲得的EiR替步驟(3)中的Xi,按步驟(3)重新計(jì)算總樣本均 值?、每類樣本均值向量f、總類內(nèi)散布矩陣Sw和類間的散布矩陣S b,按步驟(4. 1)、(4. 2) 再次提取初始判別成分; (4. 3. 2)重復(fù)步驟(4. 3. 1)直到所提取的初始判別成分的個(gè)數(shù)等于Sw的階數(shù)N ;那么, 同時(shí)可以得到由權(quán)重向量w組成的權(quán)重矩陣W (J X N)和相應(yīng)的負(fù)載向量p組成的負(fù)載矩陣 P(JXN)、總樣本初始判別成分t組成的總樣本的初始判別成分矩陣;其中,T V /-I J 由Ti按從上至下排列構(gòu)成,τ i是每個(gè)類的判別成分矩陣;最后,求取初始判別成分的系數(shù)矩 陣R = W(PtW)'且I^PTi可直接由系數(shù)矩陣根據(jù)公式(6)求出:
(6) (5) 提取最終判別成分,該步驟通過(guò)以下子步驟來(lái)實(shí)現(xiàn): (5. 1)過(guò)程數(shù)據(jù)預(yù)處理:使用XiR代替每類初始數(shù)據(jù)集合Xi,按步驟(3)重新計(jì)算每類 樣本均值萬(wàn)、總樣本均值¥,總類內(nèi)散布矩陣S/以及類間散布矩陣S (5. 2)確定最終判別成分:最終判別成分通過(guò)以下步驟來(lái)確定: (5.2. 1)求取最優(yōu)判別成分方向向量w%使得類間散布矩陣與類內(nèi)散布矩陣的比值 J( Θ )最大;其中,
《#則可通過(guò)公式(7)求取矩陣S1T 1S1; 最大特征值所對(duì)應(yīng)的特征向量得到: Sw^1SbV= λ¥* (7) (5. 2. 2)求取每類的最終判別成分向量?Λ tj*= X jRw*= X i θ (8) θ = Rw* (5. 2. 3)將人上至下依次排列構(gòu)成總樣本的最終判別成分向量
(5. 3)壓縮過(guò)程數(shù)據(jù):為了保證每類樣本的判別成分之間是正交的,進(jìn)行如下處理: Pi*T= (t ;ν)_? (9) Ei*= X AVt 其中,P#(JX 1)是每類的負(fù)載向量,是與t ^無(wú)關(guān)的殘差; (6) 迭代更新過(guò)程數(shù)據(jù),該步驟包括以下子步驟: (6.1)用步驟(5.3)中代替步驟(3)中的Xi,按步驟(3)重新計(jì)算每類樣本均值、 總樣本均值,總類內(nèi)散布矩陣S/以及類間散布矩陣S b%按步驟(4)和步驟(5)再次提取最 終判別成分向量 (6.2) 重復(fù)步驟(6. 1)直至獲得足夠的最終判別成分并構(gòu)成最終的判別成分矩陣 !?,所保留的最終判別成分個(gè)數(shù)為R,所述R通過(guò)交叉檢驗(yàn)的方法確定;相應(yīng)的,同時(shí) 可以獲得權(quán)重矩陣Θ (JXR)和負(fù)載矩陣P^(JXR);其中,Θ (JXR)和P^(JXR)分別由 Θ (JXl)和 PiYJX 1)構(gòu)成; (6.3) 求取最終系數(shù)矩陣I^(JXR): Ri*= θ (Ρ^ΘΓ1 (10) 那么最終判別成分矩陣I?可由最終系數(shù)矩陣按公式(11)直接求出:
(11) 至此,步驟(2)中所選取的該類故障的最終判別成分矩陣及相應(yīng)的最終系數(shù)矩陣 R/,m和負(fù)載矩陣PtnT都被求取出來(lái); (7) 選取正常數(shù)據(jù)和另一類故障數(shù)據(jù)作為總樣本,重復(fù)步驟(4)-(6),獲得該類故障樣 本的最終判別成分矩陣、最終系數(shù)矩陣以及負(fù)載矩陣; (8) 重復(fù)步驟(7)直到M類故障的判別成分矩陣T:;",(/〃 = L2,....M)及相應(yīng)的最終系數(shù) 矩陣<.,力》= 1,2…M)和負(fù)載矩陣pf;:(m= i,2,...,M)都被求取出來(lái); (9) 對(duì)每類故障求取統(tǒng)計(jì)指標(biāo),建立控制限;該步驟由以下子步驟完成: (9. 1)求取每類故障基于最終判別成分矩陣的T2指標(biāo):
其中,表示不同類型的故障樣本的最終判別成分均值;Sf 則表示由每類故障樣 本的最終判別成分的方差構(gòu)成的對(duì)角矩陣,如果方差過(guò)小而趨近于〇,那么它們將被置為 1 ; (9. 2)建立每類故障基于T2指標(biāo)的控制限:由于過(guò)程數(shù)據(jù)服從多變量正態(tài)分布,那么 可知T2統(tǒng)計(jì)量服從帶權(quán)重的X 2分布,則可依據(jù)帶權(quán)重的X 2分布建立T 2統(tǒng)計(jì)量的控制限 Ctr :: Lf.m (10) 基于最終判別成分的在線故障診斷,該步驟由以下子步驟完成: (10. 1)按照步驟(1)獲取新數(shù)據(jù)x_(JX1),依次采用每類故障訓(xùn)練樣本均值對(duì)新 數(shù)據(jù)XnratCJX 1)進(jìn)行中心化處理;其中,下標(biāo)f表示故障樣本,m代表故障類別; (10.2)依次計(jì)算新數(shù)據(jù)Xnrat (JXl)在每類故障下的新T2指標(biāo)Tmw2:
其中,ΓΛ",表示每類故障樣本的最終判別成分均值,表示每類故障樣本的最終判 別成分的系數(shù)矩陣,Σ f,Jlj表示由每類故障樣本的最終判別成分的方差構(gòu)成的對(duì)角矩陣, 為新數(shù)據(jù)的最終判別成分; (10. 3)在線故障類型判斷:依次將新的T2指標(biāo)與所對(duì)應(yīng)的控制限進(jìn)行比較,若T2指標(biāo) 沒(méi)有超出控制限,則說(shuō)明新數(shù)據(jù)屬于該類故障;若T2指標(biāo)超出所有類故障的控制限,則說(shuō)明 有新類型的故障發(fā)生。
【專利摘要】本發(fā)明公開(kāi)了一種基于嵌套迭代費(fèi)舍爾判別分析的故障診斷方法,該方法克服了傳統(tǒng)方法存在的類內(nèi)散布矩陣奇異性問(wèn)題、判別成分的個(gè)數(shù)局限問(wèn)題、判別成分線性相關(guān)問(wèn)題,充分發(fā)掘了過(guò)程數(shù)據(jù)所包含的潛在信息,能有效區(qū)分不同類別的過(guò)程數(shù)據(jù)。該方法簡(jiǎn)單易于實(shí)施,大大提高了在線故障診斷的性能,增強(qiáng)了實(shí)際在線故障診斷的可靠性和可信度,有助于工業(yè)工程師對(duì)故障進(jìn)行準(zhǔn)確的修復(fù),從而保證實(shí)際生產(chǎn)的安全可靠運(yùn)行和產(chǎn)品的高質(zhì)量追求。
【IPC分類】G05B23-02
【公開(kāi)號(hào)】CN104536439
【申請(qǐng)?zhí)枴緾N201510028871
【發(fā)明人】趙春暉, 李文卿
【申請(qǐng)人】浙江大學(xué)
【公開(kāi)日】2015年4月22日
【申請(qǐng)日】2015年1月20日