專利名稱::基于矩陣奇異值關(guān)聯(lián)規(guī)則挖掘的傳感器數(shù)據(jù)校驗(yàn)方法
技術(shù)領(lǐng)域:
:本發(fā)明是利用矩陣奇異值來尋找具有相似關(guān)聯(lián)規(guī)則的測(cè)點(diǎn)組合的數(shù)據(jù)挖掘方法,并用于火電廠傳感器數(shù)據(jù)校驗(yàn)和故障檢測(cè)。涉及到數(shù)據(jù)挖掘和數(shù)據(jù)校驗(yàn)領(lǐng)域。
背景技術(shù):
:數(shù)據(jù)挖掘從大量的數(shù)據(jù)中挖掘出有用的信息,它是一個(gè)多學(xué)科交叉研究領(lǐng)域。關(guān)聯(lián)規(guī)則是挖掘發(fā)現(xiàn)大量數(shù)據(jù)中有價(jià)值的關(guān)聯(lián)關(guān)系,它在數(shù)據(jù)挖掘中是一個(gè)重要的課題,最近幾年己被業(yè)界所廣泛研究。目前關(guān)聯(lián)規(guī)則挖掘廣泛地應(yīng)用于商業(yè)界、醫(yī)療保險(xiǎn)、金融業(yè)、電信部門、工業(yè)生產(chǎn)領(lǐng)域等,因此對(duì)它的研究有著極其重要的意義。關(guān)聯(lián)規(guī)則在實(shí)際應(yīng)用中,還存在不少問題,比如,僅憑支持度和置信度這兩個(gè)評(píng)價(jià)關(guān)聯(lián)規(guī)則的標(biāo)準(zhǔn),可能會(huì)遺漏一些其他關(guān)聯(lián)關(guān)系,因而研制一些新的評(píng)價(jià)標(biāo)準(zhǔn)很有必要。另外,計(jì)算復(fù)雜度依賴于具體的實(shí)現(xiàn)細(xì)節(jié)和硬件環(huán)境,在數(shù)據(jù)挖掘中,由于操作對(duì)象是海量數(shù)據(jù)庫(kù),因此,空間和時(shí)間的復(fù)雜度問題將是非常重要的一個(gè)環(huán)節(jié),尋求新的方法以降低數(shù)據(jù)挖掘計(jì)算復(fù)雜度和計(jì)算量是十分有益的工作?;痣姀S是能量轉(zhuǎn)換的場(chǎng)所,為國(guó)民經(jīng)濟(jì)持續(xù)發(fā)展提供源源不斷的動(dòng)力?;痣姀S的安全經(jīng)濟(jì)運(yùn)行十分重要,所以對(duì)火電廠的運(yùn)行監(jiān)控一直是重大研究課題。監(jiān)控?cái)?shù)據(jù)來源于感應(yīng)器、傳感器、變送器等組成的測(cè)量系統(tǒng)對(duì)運(yùn)行設(shè)備的測(cè)量,其中任何一個(gè)設(shè)備出現(xiàn)故障都會(huì)響應(yīng)數(shù)據(jù)的準(zhǔn)確性。然而火電廠發(fā)電在高溫高壓的環(huán)境中進(jìn)行,運(yùn)行環(huán)境惡劣,上萬的測(cè)點(diǎn)難免出現(xiàn)故障,從現(xiàn)場(chǎng)運(yùn)行數(shù)據(jù)來看,經(jīng)常出現(xiàn)一些測(cè)點(diǎn)數(shù)據(jù)異常,比如突然變大,突然變?yōu)榱悖鞣N不規(guī)則躍變等等。直接影響運(yùn)行人員對(duì)實(shí)時(shí)數(shù)據(jù)的判斷;對(duì)于實(shí)時(shí)歷史數(shù)據(jù)庫(kù)而言,出現(xiàn)一些無意義的數(shù)據(jù),影響歷史數(shù)據(jù)的有效獲取,進(jìn)而影響對(duì)歷史數(shù)據(jù)的分析,獲取有效信息,對(duì)機(jī)組歷史趨勢(shì)的把握?,F(xiàn)有的基于神經(jīng)網(wǎng)絡(luò)方法的數(shù)據(jù)檢驗(yàn),傳感器故障定位等方法需要用到具有相似關(guān)聯(lián)關(guān)系的測(cè)點(diǎn)。而在尋找這些測(cè)點(diǎn)的傳統(tǒng)方法通過對(duì)設(shè)備數(shù)學(xué)模型的分析,通過對(duì)趨勢(shì)曲線直接觀察等定性的方法來確定測(cè)點(diǎn)間相似關(guān)聯(lián)關(guān)系,具有對(duì)測(cè)點(diǎn)相關(guān)性把握不準(zhǔn)確,選擇測(cè)點(diǎn)較困難等缺點(diǎn)。神經(jīng)網(wǎng)絡(luò)方法是基于風(fēng)險(xiǎn)最小化原理,沒有足夠的數(shù)學(xué)理論支持,而支持向量機(jī)是基于結(jié)構(gòu)最小化原理,有充分的數(shù)學(xué)理論支持,很多領(lǐng)域研究表明支持向量機(jī)有更高的可靠性和更好的回歸精度。
發(fā)明內(nèi)容技術(shù)問題針對(duì)以上描述中存在的問題,本發(fā)明提供了一種基于矩陣奇異值關(guān)聯(lián)規(guī)則挖掘的傳感器數(shù)據(jù)校驗(yàn)方法,并將挖掘發(fā)現(xiàn)的具有相似關(guān)聯(lián)的測(cè)點(diǎn)用最小二乘支持向量回歸的方法進(jìn)行傳感器數(shù)據(jù)校驗(yàn)和故障檢測(cè)。技術(shù)方案本發(fā)明的基于矩陣奇異值關(guān)聯(lián)規(guī)則挖掘的傳感器數(shù)據(jù)校驗(yàn)方法,其特征在于,該方法的實(shí)現(xiàn)分為兩部分,具體如下第一部分相似關(guān)聯(lián)規(guī)則測(cè)點(diǎn)挖掘步驟l:收集需要挖掘相似關(guān)聯(lián)規(guī)則的W個(gè)測(cè)點(diǎn)置于程序列表中,M為測(cè)點(diǎn)個(gè)數(shù);步驟2:按照C^方式將測(cè)點(diǎn)任意兩兩組合,采集某時(shí)間段采樣時(shí)間間隔A,正常運(yùn)行數(shù)據(jù),組成一個(gè)WX2階矩陣義,W為樣本數(shù)目,X由2個(gè)測(cè)點(diǎn)w個(gè)采樣值組成的wx2階矩陣;步驟3:將矩陣X各列分別歸一化處理,得到矩陣^,將矩陣^進(jìn)行奇異值分解,分解為爿-C/xSxr,其中矩陣爿為矩陣X各列分別歸一化后的wx2階矩陣,f/為wxw階正交陣,K為2x2階正交陣,S二力ag(。,o"2),S為wx2階對(duì)角陣,20"2,0",>0,ct220,q為矩陣Z的較大的一個(gè)奇異值,0"2為矩陣^4的較小的一個(gè)奇異值,求得兩測(cè)點(diǎn)波動(dòng)相似度d為"^I;步驟4:重復(fù)步驟2和步驟3,有C〗個(gè)組合,得到C〗個(gè)對(duì)應(yīng)的波動(dòng)相似度,按照C方式的任意兩兩組合共計(jì)(WX(M-1))/2對(duì)測(cè)點(diǎn)組合;步驟5:選擇波動(dòng)相似度^大于80%的相關(guān)測(cè)點(diǎn)組合,從而獲得一組具有相似關(guān)聯(lián)關(guān)系的多個(gè)測(cè)點(diǎn);第二部分傳感器數(shù)據(jù)在線校驗(yàn)將尋找的具有相似關(guān)聯(lián)的測(cè)點(diǎn)組用于最小二乘支持向量回歸建模,訓(xùn)練樣本選取全工況數(shù)據(jù),目的是覆蓋所有運(yùn)行工況;對(duì)于"個(gè)測(cè)點(diǎn),一共需要建立(M+1)個(gè)回歸模型,包括1個(gè)用于運(yùn)行數(shù)據(jù)監(jiān)測(cè)的"《輸入-W輸出"的"殘差生成模塊";W個(gè)用于各個(gè)測(cè)點(diǎn)運(yùn)行數(shù)據(jù)重構(gòu)的"("_1)輸入-單輸出"的"ffl(數(shù)據(jù)重構(gòu)模塊","為數(shù)據(jù)在線校驗(yàn)的傳感器個(gè)數(shù);傳感器數(shù)據(jù)在線校驗(yàn)前,需要對(duì)"殘差生成模塊"、各線路數(shù)據(jù)的"#K數(shù)據(jù)重構(gòu)模塊"進(jìn)行全工況數(shù)據(jù)訓(xùn)練;對(duì)運(yùn)行數(shù)據(jù)的監(jiān)測(cè),故障判斷,數(shù)據(jù)重構(gòu)數(shù)據(jù)校驗(yàn)流程如下1)現(xiàn)場(chǎng)數(shù)據(jù)通過網(wǎng)絡(luò)交換機(jī)后,得到兩路數(shù)據(jù),一路進(jìn)入傳感器數(shù)據(jù)校驗(yàn)?zāi)K,進(jìn)行數(shù)據(jù)校驗(yàn);另一路直連接到數(shù)據(jù)采集接口機(jī),作為傳感器數(shù)據(jù)校驗(yàn)的冗余,防止數(shù)據(jù)流中斷;2)現(xiàn)場(chǎng)數(shù)據(jù)從數(shù)據(jù)輸入接口進(jìn)入傳感器數(shù)據(jù)校驗(yàn)?zāi)K,到達(dá)上下限判斷模塊;在這個(gè)模塊,首先對(duì)各線路數(shù)據(jù)進(jìn)行上下限判斷,如果發(fā)現(xiàn)M線路數(shù)據(jù)超出上下限,系統(tǒng)認(rèn)為該線路有故障,直接送到ftK數(shù)據(jù)重構(gòu)模塊,用其他正常數(shù)據(jù)重構(gòu)該線路數(shù)據(jù),并發(fā)出報(bào)警信號(hào),顯示ttK線路故障;3)數(shù)據(jù)沒有超出上下限,則進(jìn)入殘差生成模塊;在這個(gè)模塊,通過最小二乘支持向量回歸模型對(duì)各參數(shù)運(yùn)行數(shù)據(jù)生成對(duì)應(yīng)的殘差;4)各線路數(shù)據(jù)和殘差進(jìn)入殘差判斷模塊;在這個(gè)模塊,判斷各線路殘差是否有異常,如果沒有異常,各線路數(shù)據(jù)直接進(jìn)入數(shù)據(jù)輸出接口;如果發(fā)現(xiàn)ffl(線路殘差異常,將各線路數(shù)據(jù)送到ttK數(shù)據(jù)重構(gòu)模塊,用其他正常數(shù)據(jù)重構(gòu)該線路數(shù)據(jù),并發(fā)出報(bào)警信號(hào),顯示ttK線路故障;5)數(shù)據(jù)通過數(shù)據(jù)輸出接口,連接數(shù)據(jù)采集接口機(jī),由數(shù)據(jù)采集接口機(jī)判斷采用哪一線路信號(hào)發(fā)送到顯示屏,并將數(shù)據(jù)寫入實(shí)時(shí)數(shù)據(jù)庫(kù)。兩測(cè)點(diǎn)波動(dòng)相似度J指非間斷性工業(yè)生產(chǎn)設(shè)備、特別是火電機(jī)組運(yùn)行設(shè)備上兩個(gè)測(cè)點(diǎn)或兩個(gè)參數(shù)的運(yùn)行數(shù)據(jù)在時(shí)間軸上隨著時(shí)間上下波動(dòng)具有一定的相似程度。兩測(cè)點(diǎn)波動(dòng)相似度J大于80%,則可認(rèn)為兩測(cè)點(diǎn)具有相似關(guān)聯(lián)關(guān)系。采樣時(shí)間間隔的取值范圍為30秒到120秒;采集樣本數(shù)目的取值范圍為500個(gè)到2000個(gè)。"殘差判斷模塊"的數(shù)據(jù)異常判斷有3個(gè)判據(jù)一是測(cè)點(diǎn)殘差超過0.02;二是異常數(shù)據(jù)殘差與正常數(shù)據(jù)殘差正負(fù)異號(hào),三是異常數(shù)據(jù)殘差絕對(duì)值大于正常數(shù)據(jù)殘差。1個(gè)用于運(yùn)行數(shù)據(jù)監(jiān)測(cè)的"w輸入-w輸出"的"殘差生成模塊",W個(gè)用于各個(gè)測(cè)點(diǎn)運(yùn)行數(shù)據(jù)重構(gòu)的"O-l)輸入-單輸出"的"ttK數(shù)據(jù)重構(gòu)模塊",共計(jì)(w+l)個(gè)回歸模型均通過最小二乘支持向量回歸方法建立。有益效果1、本發(fā)明在非間斷性工業(yè)生產(chǎn)領(lǐng)域提出運(yùn)行設(shè)備測(cè)點(diǎn)間波動(dòng)相似度的概念,將關(guān)聯(lián)規(guī)則的概念擴(kuò)展到波動(dòng)相似關(guān)聯(lián)規(guī)則,是對(duì)關(guān)聯(lián)規(guī)則在這一領(lǐng)域的補(bǔ)充和有效的拓展,具有實(shí)際意義。2、本發(fā)明在尋找波動(dòng)相似關(guān)聯(lián)關(guān)系時(shí)具有計(jì)算量小,運(yùn)算速度快,尋找具有相似關(guān)聯(lián)規(guī)則測(cè)點(diǎn)準(zhǔn)確等優(yōu)點(diǎn),不需要對(duì)海量數(shù)據(jù)整體進(jìn)行運(yùn)算,只需要取其中小部分正常運(yùn)行數(shù)據(jù)既可得出有價(jià)值的關(guān)聯(lián)關(guān)系。3、本發(fā)明能很好地解決在非間斷性工業(yè)生產(chǎn)、特別是大型火電廠的傳統(tǒng)數(shù)據(jù)校驗(yàn)方法定性尋找關(guān)聯(lián)測(cè)點(diǎn)的不足,將測(cè)點(diǎn)間的相似關(guān)聯(lián)規(guī)則用波動(dòng)相似度來定量衡量,能夠更加準(zhǔn)確的選取具有關(guān)聯(lián)規(guī)則的測(cè)點(diǎn),在實(shí)際中更好的應(yīng)用。4、實(shí)時(shí)顯示數(shù)據(jù)的可靠性得到提高,更好的為運(yùn)行人員操作提供可靠的數(shù)據(jù),避免虛假數(shù)據(jù)或者錯(cuò)誤數(shù)據(jù)給運(yùn)行人員帶來的誤指導(dǎo)。5、存入實(shí)時(shí)數(shù)據(jù)庫(kù)的運(yùn)行數(shù)據(jù)的有效性得到提高,能夠更好的反映機(jī)組運(yùn)行情況,為電廠歷史數(shù)據(jù)分析提供更多的有效數(shù)據(jù),更好地把握機(jī)組運(yùn)行狀況。6、為電廠監(jiān)測(cè)信息系統(tǒng)(如SIS)的各個(gè)高級(jí)功能模塊(如機(jī)組運(yùn)行優(yōu)化、狀態(tài)監(jiān)測(cè)與故障診斷等)的運(yùn)算提供更加可靠的數(shù)據(jù)。圖1基于矩陣奇異值的相似關(guān)聯(lián)測(cè)點(diǎn)挖掘流程圖。圖2傳感器數(shù)據(jù)校驗(yàn)流程圖。圖3第一級(jí)壓力與調(diào)節(jié)級(jí)壓力波動(dòng)曲線(相似度99.5W。圖4第一級(jí)壓力與中壓缸排汽壓力波動(dòng)曲線(相似度81.1%)。圖5除氧器進(jìn)汽壓力與中壓缸排汽溫度波動(dòng)曲線(相似度29.0W。圖6殘差故障定位示意圖。圖7高壓排汽壓力數(shù)據(jù)重構(gòu)示意圖。圖8高壓排汽壓力測(cè)量值與重構(gòu)值的相對(duì)誤差。圖9經(jīng)過數(shù)據(jù)校正的再熱器壓力數(shù)據(jù)兩線。圖3到圖5是選取三個(gè)不同等級(jí)的波動(dòng)相似度測(cè)點(diǎn)組合,以表明波動(dòng)相似度與波動(dòng)曲線的內(nèi)在關(guān)系。圖6是各線路生成殘差,高壓排汽壓力殘差與其他殘差異號(hào),而且絕對(duì)值明顯大于其他參數(shù)的殘差,由此判斷高壓排汽壓力有故障。圖8表明了本發(fā)明數(shù)據(jù)重構(gòu)的精度。圖9虛線是某電廠#2機(jī)組再熱器壓力測(cè)點(diǎn)從2008-2-280:00:00開始的一段時(shí)間實(shí)際運(yùn)行數(shù)據(jù),數(shù)據(jù)出現(xiàn)異常波動(dòng)現(xiàn)象;實(shí)線是經(jīng)過傳感器數(shù)據(jù)校驗(yàn)后數(shù)據(jù)得到很好的復(fù)原。具體實(shí)施例方式首先通過矩陣奇異值挖掘具有相似關(guān)聯(lián)規(guī)則的測(cè)點(diǎn),再通過這些測(cè)點(diǎn)建模,包括殘差生成模型和各個(gè)輸入線路數(shù)據(jù)重構(gòu)模型。實(shí)現(xiàn)過程分為兩個(gè)部分,具體描述如下第一部分相似關(guān)聯(lián)規(guī)則測(cè)點(diǎn)挖掘通過矩陣奇異值挖掘具有相似關(guān)聯(lián)規(guī)則的測(cè)點(diǎn),具體步驟如下步驟1:收集需要挖掘相似關(guān)聯(lián)規(guī)則的n個(gè)測(cè)點(diǎn)置于程序列表中,n為測(cè)點(diǎn)個(gè)數(shù);步驟2:按照C^方式將測(cè)點(diǎn)任意兩兩組合,采集某時(shí)間段采樣時(shí)間間隔AZ正常運(yùn)行數(shù)據(jù),組成一個(gè)wx2階矩陣JT,w為樣本數(shù)目,X由2個(gè)測(cè)點(diǎn)m個(gè)采樣值組成的wx2階矩陣;步驟3:將矩陣X各列分別歸一化處理,得到矩陣Z,將矩陣v4進(jìn)行奇異值分解,分解為J-f/xSxF,其中矩陣爿為矩陣X各列分別歸一化后的wx2階矩陣,f/為wxw階正交陣,r為2x2階正交陣,S:^agOp(t2),S為wx2階對(duì)角陣,q2o^ct,>0,ct220,q為矩陣^的較大的一個(gè)奇異值,0"2為矩陣^的較小的一個(gè)奇異值,求得兩測(cè)點(diǎn)波動(dòng)相似度J為"^LZ^;ct,+cr2步驟4:重復(fù)步驟2和步驟3,有C^個(gè)組合,得到<2個(gè)對(duì)應(yīng)的波動(dòng)相似度,按照C方式的任意兩兩組合共計(jì)("X(W-l))/2對(duì)測(cè)點(diǎn)組合;步驟5:選擇波動(dòng)相似度^大于80%的相關(guān)測(cè)點(diǎn)組合,從而獲得一組具有相似關(guān)聯(lián)關(guān)系的多個(gè)測(cè)點(diǎn);波動(dòng)相似度指非間斷性工業(yè)生產(chǎn)設(shè)備、特別是火電機(jī)組運(yùn)行設(shè)備上兩個(gè)測(cè)點(diǎn)或兩個(gè)參數(shù)的運(yùn)行數(shù)據(jù)在時(shí)間軸上隨著時(shí)間上下波動(dòng)具有一定的相似程度;波動(dòng)相似度范圍是0%100%,如果波動(dòng)相似度大于80%,則認(rèn)為這兩個(gè)測(cè)點(diǎn)具有相似關(guān)聯(lián)規(guī)則;步驟2中采樣時(shí)間間隔A/的取值范圍為30秒到120秒;采集樣本數(shù)目w的取值范圍500個(gè)到2000個(gè)。第二部分傳感器數(shù)據(jù)在線校驗(yàn)將尋找的具有相似關(guān)聯(lián)的測(cè)點(diǎn)組用于最小二乘支持向量回歸(LS-SVR)建模,訓(xùn)練樣本選取全工況數(shù)據(jù),目的是覆蓋所有運(yùn)行工況;對(duì)于w個(gè)測(cè)點(diǎn),建立("+l)個(gè)回歸模型,包括-1個(gè)用于運(yùn)行數(shù)據(jù)監(jiān)測(cè)的"M輸入-"輸出"的"殘差生成模塊";W個(gè)用于各個(gè)測(cè)點(diǎn)運(yùn)行數(shù)據(jù)重構(gòu)的"(w-l)輸入-單輸出"的"脹數(shù)據(jù)重構(gòu)模塊";1個(gè)"殘差生成模塊"和;i個(gè)"弁K數(shù)據(jù)重構(gòu)模塊"共計(jì)0+i)個(gè)回歸模型均通過最小二乘支持向量回歸方法建立。系統(tǒng)在線數(shù)據(jù)校驗(yàn)啟動(dòng)前,需要對(duì)"殘差生成模塊"、各線路數(shù)據(jù)的"#K數(shù)據(jù)重構(gòu)模塊"進(jìn)行全工況數(shù)據(jù)訓(xùn)練;對(duì)運(yùn)行數(shù)據(jù)的監(jiān)測(cè),故障判斷,數(shù)據(jù)重構(gòu)等數(shù)據(jù)校驗(yàn)流程如下傳感器數(shù)據(jù)在線校驗(yàn)前,需要對(duì)"殘差生成模塊"、各線路數(shù)據(jù)的"#K數(shù)據(jù)重構(gòu)模塊"進(jìn)行全工況數(shù)據(jù)訓(xùn)練;對(duì)運(yùn)行數(shù)據(jù)的監(jiān)測(cè),故障判斷,數(shù)據(jù)重構(gòu)等數(shù)據(jù)校驗(yàn)流程如下1.現(xiàn)場(chǎng)數(shù)據(jù)通過"網(wǎng)絡(luò)交換機(jī)"后,得到兩路數(shù)據(jù),一路進(jìn)入傳感器數(shù)據(jù)校驗(yàn)?zāi)K,進(jìn)行數(shù)據(jù)校驗(yàn)另一路直連接到"數(shù)據(jù)采集接口機(jī)",作為傳感器數(shù)據(jù)校驗(yàn)的冗余,防止數(shù)據(jù)流中斷;2.現(xiàn)場(chǎng)數(shù)據(jù)從"數(shù)據(jù)輸入接口"進(jìn)入傳感器數(shù)據(jù)校驗(yàn)?zāi)K,到達(dá)"上下限判斷模塊";在這個(gè)模塊,首先對(duì)各線路數(shù)據(jù)進(jìn)行上下限判斷,如果發(fā)現(xiàn)ttK線路數(shù)據(jù)超出上下限,系統(tǒng)認(rèn)為該線路有故障,直接送到"W(數(shù)據(jù)重構(gòu)模塊",用其他正常數(shù)據(jù)重構(gòu)該線路數(shù)據(jù),并發(fā)出報(bào)警信號(hào),顯示抓線路故障;3.數(shù)據(jù)沒有超出上下限,則進(jìn)入"殘差生成模塊";在這個(gè)模塊,通過最小二乘支持向量回歸模型對(duì)各參數(shù)運(yùn)行數(shù)據(jù)生成對(duì)應(yīng)的殘差;4.各線路數(shù)據(jù)和殘差進(jìn)入"殘差判斷模塊";在這個(gè)模塊,判斷各線路殘差是否有異常,如果沒有異常,各線路數(shù)據(jù)直接進(jìn)入"數(shù)據(jù)輸出接口";如果發(fā)現(xiàn)ffi線路殘差異常,將各線路數(shù)據(jù)送到"抓數(shù)據(jù)重構(gòu)模塊",用其他正常數(shù)據(jù)重構(gòu)該線路數(shù)據(jù),并發(fā)出報(bào)警信號(hào),顯示ffi線路故障;5.數(shù)據(jù)通過"數(shù)據(jù)輸出接口",連接"數(shù)據(jù)采集接口機(jī)",由"數(shù)據(jù)采集接口機(jī)"判斷采用哪一線路信號(hào)發(fā)送到顯示屏,并將數(shù)據(jù)寫入實(shí)時(shí)數(shù)據(jù)庫(kù)。在第4步的"殘差判斷模塊",數(shù)據(jù)異常的3個(gè)判據(jù)一是殘差超過0.02;二是異常數(shù)據(jù)殘差與正常數(shù)據(jù)殘差異號(hào),三是異常數(shù)據(jù)殘差絕對(duì)值大于正常數(shù)據(jù)殘差。結(jié)合本發(fā)明方法的內(nèi)容,給出以下火電廠生產(chǎn)運(yùn)行數(shù)據(jù)相似關(guān)聯(lián)規(guī)則挖掘以及在線數(shù)據(jù)校驗(yàn)和傳感器故障檢測(cè)實(shí)例。過程分為兩部分進(jìn)行,第一部分通過歷史數(shù)據(jù)離線進(jìn)行,第二部分在線數(shù)據(jù)過濾。以某300MW機(jī)組運(yùn)行數(shù)據(jù)為例。第一部分相似關(guān)聯(lián)規(guī)則測(cè)點(diǎn)挖掘數(shù)據(jù)從集散控制系統(tǒng)(DCS)通過傳感器由接口程序采集得到,并將數(shù)據(jù)存儲(chǔ)到實(shí)時(shí)數(shù)據(jù)庫(kù)PI中。基于矩陣奇異值的關(guān)聯(lián)規(guī)則挖掘,尋找具有相似關(guān)聯(lián)規(guī)則的測(cè)點(diǎn)步驟如下1)收集表1中的21個(gè)測(cè)點(diǎn)(測(cè)點(diǎn)描述、位號(hào)),將表1中測(cè)點(diǎn)置于程序列表中。(注步驟1取測(cè)點(diǎn)時(shí),可以通過程序從實(shí)時(shí)數(shù)據(jù)庫(kù)PI中自動(dòng)獲取機(jī)組所有模擬量的描述和位號(hào),進(jìn)行全機(jī)組測(cè)點(diǎn)相似關(guān)聯(lián)規(guī)則挖掘。)表1待計(jì)算測(cè)點(diǎn)<table>tableseeoriginaldocumentpage8</column></row><table>2)程序?qū)驯?中的測(cè)點(diǎn)任意兩兩組合,在實(shí)時(shí)數(shù)據(jù)庫(kù)PI中讀取(2008-2-2312:00:00,2008-2-2322:00:00)IO小時(shí)內(nèi)數(shù)據(jù),采集時(shí)間間隔為60秒,采集600個(gè)數(shù)據(jù)。生成600x2的矩陣X6^2。3)將矩陣X^"兩列分別進(jìn)行歸一化處理,得到矩陣^6<>()><2,進(jìn)行奇異值分解,J=C/XSXK,其中[/6恥x柳,S咖x2,F(xiàn)2X2,4)S-^ag(o"pt^),2(T2,fT,>0,o"2》0,求得波動(dòng)相似度d為"A—0"2。q+cr25)重復(fù)步驟(2)和(3),有C^個(gè)組合,得到210個(gè)對(duì)應(yīng)的波動(dòng)相似度;如表2所示,表2列出其中的一部分。表2測(cè)點(diǎn)波動(dòng)相似度(%)#1高#2高除氧器加進(jìn)加進(jìn)汽進(jìn)汽壓汽壓壓力第一級(jí)調(diào)節(jié)級(jí)再熱器壓力壓力壓力高壓缸中壓缸排汽壓排汽壓力力給水溫度高壓缸中壓缸再熱器排汽溫排汽溫出口溫度度度#1高加進(jìn)汽壓10092.884.391.591.491.893.586.881.359.027.120.0#2高加進(jìn)汽壓92.810083.588.087.998.398.187.581.060.124.019.7除氧器進(jìn)汽壓力84.383.510079.679.583.383.991.284.662.529.024.0第一級(jí)壓力91.588.079.610099.587.689.181.176.154.728.920.1調(diào)節(jié)級(jí)壓力91.487.979.599.510087.689.081.176.054.728.920.1再熱器壓力91.898.383.387.687.610097.987.380.860.023.719.7高壓缸排汽壓力93.598.183.989.1訓(xùn)97.910087.581.059.724.619.7中壓缸排汽壓力86.887.591.281.181.187.387.510085.263.226.823.0給水溫度81.381.084.676.176.080.881.085.210066.225.522.1高壓缸排汽溫度59.060.162.554.754.760.059.763.266.210016.824.2中壓缸排汽溫度27.124.029.028.928.923.724.626.825.516.810017.1再熱器出口溫度20.019.724.020.120.119.719.723.022.124.217.11006)選擇波動(dòng)相似度rf大于80%的組合,即為具有相似關(guān)聯(lián)規(guī)則的測(cè)點(diǎn),如表3所示,是一組具有相似關(guān)聯(lián)關(guān)系的測(cè)點(diǎn)。表3—組波動(dòng)相似關(guān)聯(lián)規(guī)則測(cè)點(diǎn)<table>tableseeoriginaldocumentpage10</column></row><table>第二部分傳感器數(shù)據(jù)在線校驗(yàn)為了全面說明本發(fā)明的有效性和實(shí)用性,實(shí)例分為以下幾個(gè)步驟步驟一選取一組具有波動(dòng)相似關(guān)聯(lián)關(guān)系的測(cè)點(diǎn),準(zhǔn)備全工況訓(xùn)練樣本數(shù)據(jù)。在表3中選擇以下6個(gè)測(cè)點(diǎn)ttl高加進(jìn)汽壓,高壓缸排汽壓力,中壓排汽壓力,再熱器壓力,除氧器進(jìn)汽壓力,四抽壓力作為本實(shí)例的在線數(shù)據(jù)校驗(yàn)的一組測(cè)點(diǎn)。收集全工況訓(xùn)練樣本,用于系統(tǒng)運(yùn)行前對(duì)各個(gè)模型進(jìn)行訓(xùn)練。訓(xùn)練樣本選取全工況共計(jì)1000個(gè)點(diǎn),機(jī)組運(yùn)行功率范圍從鄉(xiāng)到110%。步驟二驗(yàn)證本發(fā)明數(shù)據(jù)校正的有效性和精度。在高壓排汽壓力正常數(shù)據(jù)疊加定值偏差型數(shù)據(jù)故障,通過殘差生成模塊生成的殘差定位故障。基于支持向量回歸的數(shù)據(jù)重構(gòu)方法判斷故障有兩點(diǎn)一是故障殘差與其他殘差異號(hào),二是故障殘差絕對(duì)值明顯大于其他參數(shù)殘差絕對(duì)值。圖6示,高壓排汽壓力殘差與其他殘差異號(hào),而且絕對(duì)值明顯大于其他參數(shù)的殘差,由此判斷高壓排汽壓力有故障。圖8明了本發(fā)明數(shù)據(jù)重構(gòu)的精度,由此可知,本發(fā)明的數(shù)據(jù)重構(gòu)精度控制非常理想,在0.4%以內(nèi),完全滿足工業(yè)過程的要求。精度高的重要原因在于通過本發(fā)明矩陣奇異值相似關(guān)聯(lián)規(guī)則挖掘,尋找到波動(dòng)相似度很高的測(cè)點(diǎn)組,進(jìn)而說明本發(fā)明數(shù)據(jù)挖掘方法以及基于支持向量回歸的數(shù)據(jù)重構(gòu)方法的有效性。步驟三實(shí)際運(yùn)行參數(shù)故障檢測(cè)與數(shù)據(jù)校正。在精度達(dá)到要求的基礎(chǔ)上,為了說明實(shí)際應(yīng)用效果,實(shí)例給出了現(xiàn)場(chǎng)運(yùn)行中由于某種原因?qū)е碌倪\(yùn)行數(shù)據(jù)殘缺的情況。圖9中虛線是某電廠ft2機(jī)組再熱器壓力測(cè)點(diǎn)從2008-2-280:00:00之后的一段時(shí)間的實(shí)際運(yùn)行數(shù)據(jù),可以看出中間有一段時(shí)間由于傳感器跳動(dòng),數(shù)據(jù)出現(xiàn)異常波動(dòng)現(xiàn)象。這種情況下,運(yùn)行人員監(jiān)視的顯示器也出現(xiàn)異常波動(dòng),不能得到準(zhǔn)確運(yùn)行信息;同時(shí),存儲(chǔ)到數(shù)據(jù)庫(kù)的運(yùn)行數(shù)據(jù)由此失效。異常數(shù)據(jù)經(jīng)過傳感器數(shù)據(jù)校驗(yàn)后,數(shù)據(jù)得到很好的復(fù)原,如圖9實(shí)線所示。權(quán)利要求1、一種基于矩陣奇異值關(guān)聯(lián)規(guī)則挖掘的傳感器數(shù)據(jù)校驗(yàn)方法,其特征在于,該方法的實(shí)現(xiàn)分為兩部分,具體如下第一部分相似關(guān)聯(lián)規(guī)則測(cè)點(diǎn)挖掘步驟1收集需要挖掘相似關(guān)聯(lián)規(guī)則的n個(gè)測(cè)點(diǎn)置于程序列表中,n為測(cè)點(diǎn)個(gè)數(shù);步驟2按照方式將測(cè)點(diǎn)任意兩兩組合,采集某時(shí)間段采樣時(shí)間間隔Δt正常運(yùn)行數(shù)據(jù),組成一個(gè)m×2階矩陣X,m為樣本數(shù)目,X由2個(gè)測(cè)點(diǎn)m個(gè)采樣值組成的m×2階矩陣;步驟3將矩陣X各列分別歸一化處理,得到矩陣A,將矩陣A進(jìn)行奇異值分解,分解為A=U×S×V,其中矩陣A為矩陣X各列分別歸一化后的m×2階矩陣,U為m×m階正交陣,V為2×2階正交陣,S=diag(σ1,σ2),S為m×2階對(duì)角陣,σ1≥σ2,σ1>0,σ2≥0,σ1為矩陣A的較大的一個(gè)奇異值,σ2為矩陣A的較小的一個(gè)奇異值,求得兩測(cè)點(diǎn)波動(dòng)相似度d為步驟4重復(fù)步驟2和步驟3,有個(gè)組合,得到個(gè)對(duì)應(yīng)的波動(dòng)相似度,按照方式的任意兩兩組合共計(jì)(n×(n-1))/2對(duì)測(cè)點(diǎn)組合;步驟5選擇波動(dòng)相似度大于80%的相關(guān)測(cè)點(diǎn)組合,從而獲得一組具有相似關(guān)聯(lián)關(guān)系的多個(gè)測(cè)點(diǎn);第二部分傳感器數(shù)據(jù)在線校驗(yàn)將尋找的具有相似關(guān)聯(lián)的測(cè)點(diǎn)組用于最小二乘支持向量回歸建模,訓(xùn)練樣本選取全工況數(shù)據(jù),目的是覆蓋所有運(yùn)行工況;對(duì)于n個(gè)測(cè)點(diǎn),一共需要建立(n+1)個(gè)回歸模型,包括1個(gè)用于運(yùn)行數(shù)據(jù)監(jiān)測(cè)的“n輸入-n輸出”的“殘差生成模塊”;n個(gè)用于各個(gè)測(cè)點(diǎn)運(yùn)行數(shù)據(jù)重構(gòu)的“(n-1)輸入-單輸出”的“#K數(shù)據(jù)重構(gòu)模塊”,n為數(shù)據(jù)在線校驗(yàn)的傳感器個(gè)數(shù);傳感器數(shù)據(jù)在線校驗(yàn)前,需要對(duì)“殘差生成模塊”、各線路數(shù)據(jù)的“#K數(shù)據(jù)重構(gòu)模塊”進(jìn)行全工況數(shù)據(jù)訓(xùn)練;對(duì)運(yùn)行數(shù)據(jù)的監(jiān)測(cè),故障判斷,數(shù)據(jù)重構(gòu)數(shù)據(jù)校驗(yàn)流程如下1.)現(xiàn)場(chǎng)數(shù)據(jù)通過網(wǎng)絡(luò)交換機(jī)后,得到兩路數(shù)據(jù),一路進(jìn)入傳感器數(shù)據(jù)校驗(yàn)?zāi)K,進(jìn)行數(shù)據(jù)校驗(yàn);另一路直連接到數(shù)據(jù)采集接口機(jī),作為傳感器數(shù)據(jù)校驗(yàn)的冗余,防止數(shù)據(jù)流中斷;2.)現(xiàn)場(chǎng)數(shù)據(jù)從數(shù)據(jù)輸入接口進(jìn)入傳感器數(shù)據(jù)校驗(yàn)?zāi)K,到達(dá)上下限判斷模塊;在這個(gè)模塊,首先對(duì)各線路數(shù)據(jù)進(jìn)行上下限判斷,如果發(fā)現(xiàn)#K線路數(shù)據(jù)超出上下限,系統(tǒng)認(rèn)為該線路有故障,直接送到#K數(shù)據(jù)重構(gòu)模塊,用其他正常數(shù)據(jù)重構(gòu)該線路數(shù)據(jù),并發(fā)出報(bào)警信號(hào),顯示#K線路故障;3.)數(shù)據(jù)沒有超出上下限,則進(jìn)入殘差生成模塊;在這個(gè)模塊,通過最小二乘支持向量回歸模型對(duì)各參數(shù)運(yùn)行數(shù)據(jù)生成對(duì)應(yīng)的殘差;4.)各線路數(shù)據(jù)和殘差進(jìn)入殘差判斷模塊;在這個(gè)模塊,判斷各線路殘差是否有異常,如果沒有異常,各線路數(shù)據(jù)直接進(jìn)入數(shù)據(jù)輸出接口;如果發(fā)現(xiàn)#K線路殘差異常,將各線路數(shù)據(jù)送到#K數(shù)據(jù)重構(gòu)模塊,用其他正常數(shù)據(jù)重構(gòu)該線路數(shù)據(jù),并發(fā)出報(bào)警信號(hào),顯示#K線路故障;5.)數(shù)據(jù)通過數(shù)據(jù)輸出接口,連接數(shù)據(jù)采集接口機(jī),由數(shù)據(jù)采集接口機(jī)判斷采用哪一線路信號(hào)發(fā)送到顯示屏,并將數(shù)據(jù)寫入實(shí)時(shí)數(shù)據(jù)庫(kù)。2、根據(jù)權(quán)利1所述的基于矩陣奇異值關(guān)聯(lián)規(guī)則挖掘的傳感器數(shù)據(jù)校驗(yàn)方法,其特征在于,兩測(cè)點(diǎn)波動(dòng)相似度^指非間斷性工業(yè)生產(chǎn)設(shè)備、特別是火電機(jī)組運(yùn)行設(shè)備上兩個(gè)測(cè)點(diǎn)或兩個(gè)參數(shù)的運(yùn)行數(shù)據(jù)在時(shí)間軸上隨著時(shí)間上下波動(dòng)具有一定的相似程度。3、根據(jù)權(quán)利1所述的基于矩陣奇異值關(guān)聯(lián)規(guī)則挖掘的傳感器數(shù)據(jù)校驗(yàn)方法,其特征在于,兩測(cè)點(diǎn)波動(dòng)相似度^大于80%,則可認(rèn)為兩測(cè)點(diǎn)具有相似關(guān)聯(lián)關(guān)系。4、根據(jù)權(quán)利1所述的基于矩陣奇異值關(guān)聯(lián)規(guī)則挖掘的傳感器數(shù)據(jù)校驗(yàn)方法,其特征在于,采樣時(shí)間間隔A/的取值范圍為30秒到120秒;采集樣本數(shù)目w的取值范圍為500個(gè)到2000個(gè)。5、根據(jù)權(quán)利1所述的基于矩陣奇異值關(guān)聯(lián)規(guī)則挖掘的傳感器數(shù)據(jù)校驗(yàn)方法,其特征在于,"殘差判斷模塊"的數(shù)據(jù)異常判斷有3個(gè)判據(jù)一是測(cè)點(diǎn)殘差超過0.02;二是異常數(shù)據(jù)殘差與正常數(shù)據(jù)殘差正負(fù)異號(hào),三是異常數(shù)據(jù)殘差絕對(duì)值大于正常數(shù)據(jù)殘差。6、根據(jù)權(quán)利1所述的基于矩陣奇異值關(guān)聯(lián)規(guī)則挖掘的傳感器數(shù)據(jù)校驗(yàn)方法,其特征在于,1個(gè)用于運(yùn)行數(shù)據(jù)監(jiān)測(cè)的"w輸入-n輸出"的"殘差生成模塊",w個(gè)用于各個(gè)測(cè)點(diǎn)運(yùn)行數(shù)據(jù)重構(gòu)的"("-l)輸入-單輸出"的"#K數(shù)據(jù)重構(gòu)模塊",共計(jì)("+l)個(gè)回歸模型均通過最小二乘支持向量回歸方法建立。全文摘要基于矩陣奇異值關(guān)聯(lián)規(guī)則挖掘的傳感器數(shù)據(jù)校驗(yàn)方法的實(shí)現(xiàn)分為兩部分,具體如下第一部分為相似關(guān)聯(lián)規(guī)則測(cè)點(diǎn)挖掘,第二部分為傳感器數(shù)據(jù)在線校驗(yàn);將尋找的具有相似關(guān)聯(lián)的測(cè)點(diǎn)組用于最小二乘支持向量回歸建模,訓(xùn)練樣本選取全工況數(shù)據(jù),目的是覆蓋所有運(yùn)行工況;對(duì)于n個(gè)測(cè)點(diǎn),一共需要建立(n+1)個(gè)回歸模型,包括1個(gè)用于運(yùn)行數(shù)據(jù)監(jiān)測(cè)的“n輸入-n輸出”的“殘差生成模塊”;n個(gè)用于各個(gè)測(cè)點(diǎn)運(yùn)行數(shù)據(jù)重構(gòu)的“(n-1)輸入-單輸出”的“#K數(shù)據(jù)重構(gòu)模塊”,n為數(shù)據(jù)在線校驗(yàn)的傳感器個(gè)數(shù);本發(fā)明在非間斷性工業(yè)生產(chǎn)領(lǐng)域提出運(yùn)行設(shè)備測(cè)點(diǎn)間波動(dòng)相似度的概念,將關(guān)聯(lián)規(guī)則的概念擴(kuò)展到波動(dòng)相似關(guān)聯(lián)規(guī)則,是對(duì)關(guān)聯(lián)規(guī)則在這一領(lǐng)域的補(bǔ)充和有效的拓展,具有實(shí)際意義。文檔編號(hào)G05B23/02GK101477375SQ20091002801公開日2009年7月8日申請(qǐng)日期2009年1月5日優(yōu)先權(quán)日2009年1月5日發(fā)明者司風(fēng)琪,徐治皋,邱鳳翔申請(qǐng)人:東南大學(xué)