一種基于大數(shù)據(jù)技術(shù)的二次設(shè)備隱患挖掘方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及電力系統(tǒng)數(shù)據(jù)處理方法,具體是提出了針對電力系統(tǒng)一種基于大數(shù)據(jù) 技術(shù)的二次設(shè)備隱患挖掘方法。
【背景技術(shù)】
[0002] 電氣設(shè)備根據(jù)功能不同,可分為一次設(shè)備和二次設(shè)備。電氣二次設(shè)備主要包括繼 電保護、自動裝置、故障錄波、就地監(jiān)控和遠動。它們正??煽康倪\行是保障電網(wǎng)穩(wěn)定和電 力設(shè)備安全的基本要求。隨著微機在繼電保護及自動裝置的廣泛應(yīng)用,繼電保護的可靠性、 定值整定的靈活性大大提高。
[0003] 電力系統(tǒng)的二次設(shè)備的傳統(tǒng)檢修方法,一般是以時間為基礎(chǔ)的,即不管設(shè)備的實 際狀況如何,到期必修。它缺乏對設(shè)備的綜合分析,并且由于多依靠手段落后的人工統(tǒng)計方 法來指導(dǎo)設(shè)備檢修,往往不是檢修過量,就是檢修不足。而且定檢試驗過程復(fù)雜,試驗時考 慮不周可能引起其它開關(guān)誤動。在檢修周期內(nèi)保護異常不能及時發(fā)現(xiàn)。當(dāng)前隨著技術(shù)的發(fā) 展,出現(xiàn)了依靠監(jiān)控系統(tǒng)和微機保護的智能報警,由常規(guī)的控制系統(tǒng)發(fā)出警報信號,然后現(xiàn) 場操作人員報警信號,并依據(jù)現(xiàn)場的經(jīng)驗來完成。當(dāng)時這種模式存在的主要問題是,當(dāng)設(shè)備 出現(xiàn)報警時要么是一些不太重要的告警,要么是設(shè)備已經(jīng)嚴重損害的告警。而在設(shè)備的狀 態(tài)監(jiān)測數(shù)據(jù)表面處于"正常"的階段中,設(shè)備已經(jīng)處于緩慢的劣化進程,處于正常與故障的 隱患狀態(tài)。
[0004] 因此,急需一種對于設(shè)備的隱患狀態(tài)發(fā)覺的方法,及時發(fā)現(xiàn)二次設(shè)備的隱患狀態(tài), 或識別二次設(shè)備向故障狀態(tài)發(fā)展的趨勢,從而為二次設(shè)備的狀態(tài)檢修提供有價值的信息。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于提供一種基于大數(shù)據(jù)技術(shù)的二次設(shè)備狀態(tài)監(jiān)測數(shù)據(jù)的隱患挖 掘方法,利用數(shù)據(jù)挖掘方法,從同種型號的二次設(shè)備在歷史上積累的海量監(jiān)測數(shù)據(jù),找到設(shè) 備狀態(tài)與監(jiān)測數(shù)據(jù)之間的關(guān)系,及時發(fā)現(xiàn)二次設(shè)備的隱患狀態(tài),或識別二次設(shè)備向故障狀 態(tài)發(fā)展的趨勢,從而為二次設(shè)備的狀態(tài)檢修提供有價值的信息。
[0006] 本發(fā)明的目的可通過以下的技術(shù)措施來實現(xiàn):
[0007] -種基于大數(shù)據(jù)技術(shù)的二次設(shè)備隱患挖掘方法,包含兩個過程:基于二次設(shè)備歷 史數(shù)據(jù)的模型訓(xùn)練和異常樣本辨識。
[0008] 其中,第一個過程包含獲取二次設(shè)備監(jiān)測數(shù)據(jù)的特征矩陣、二次設(shè)備樣本數(shù)據(jù)主 成分分析、可靠統(tǒng)計概率分布,輸出的模型為降維轉(zhuǎn)換矩陣、映射矩陣和樣本狀態(tài)評價模 型。這些模型支撐異常樣本的辨識過程。
[0009] 第二個過程的降維轉(zhuǎn)換、樣本映射、樣本辨識分別依賴于第一個過程中降維轉(zhuǎn)換 矩陣、映射矩陣和樣本狀態(tài)評價模型。最終輸出的異常樣本辨識指標(包括異常程度指標 和穩(wěn)定程度指標),作為對單臺設(shè)備一段時間內(nèi)監(jiān)測數(shù)據(jù)的分析評估結(jié)果。
[0010] 1)所述基于二次設(shè)備歷史數(shù)據(jù)的模型訓(xùn)練步驟的具體內(nèi)容如下:
[0011] I. 1)獲取二次設(shè)備監(jiān)測數(shù)據(jù)的特征矩陣具體過程如下:
[0012] 根據(jù)專業(yè)二次設(shè)備主要涉及變電站中合并單元、智能終端、保護測控裝置、直流系 統(tǒng)、網(wǎng)絡(luò)設(shè)備等二次設(shè)備的相關(guān)信息,而每類專業(yè)的檢測指標是不同的,如離線信息、在線 信息、原始資料狀態(tài)量、運行情況狀態(tài)量、檢修試驗情況狀態(tài)量等。在構(gòu)造階段還需要對各 類二次設(shè)備的不同的原始信息進行預(yù)處理和規(guī)范化,形成設(shè)備特征樣本矩陣。在構(gòu)造特征 樣本矩陣時,將同一型號的不同設(shè)備,混排在樣本數(shù)據(jù)的矩陣中,所述樣本數(shù)據(jù)的矩陣如下 式所示:
[0013] Rawdataj= [ID T f J1 fj 2 . . . fj m]
[0014] (j = l,2"",N) (I)
[0015] 式(2)中,Rawdataj代表第j條某個二次設(shè)備(編號為ID)在某個時刻T的狀態(tài) 檢測樣本數(shù)據(jù),該類二次設(shè)備有m個特征指標,依次構(gòu)成監(jiān)測特征數(shù)據(jù)。其中的監(jiān)測特征數(shù) 據(jù)的特征矩陣為:
[0016] Featurej= [f J1 fj 2 . . . fj m]
[0017] (j = l,2^..,N) (3)
[0018] 同樣,j為樣本索引,m代表第m個特征指標,N表示樣本數(shù);
[0019] 1. 2)二次設(shè)備樣本數(shù)據(jù)主成分分析具體過程如下:
[0020] 因數(shù)據(jù)挖掘往往涉及到向量、矩陣運算,而該類計算隨著維數(shù)的增加,計算量呈指 數(shù)倍增長,即所謂的"維數(shù)災(zāi)"現(xiàn)象,而且構(gòu)造的原始的樣本數(shù)據(jù)的矩陣很多信息是重復(fù)與 冗余的,也不利于挖掘結(jié)果的可視化。二次設(shè)備樣本數(shù)據(jù)主成分分析目標是在減少數(shù)據(jù)集 維數(shù)的同時,盡可能多地保留原數(shù)據(jù)集的信息。
[0021] 假設(shè)一個數(shù)據(jù)集X = {xm},其中m = 1,2,…,M,而每個xm是一個N維的行向量。 主成分分析是將X映射到一個K維空間內(nèi),其中K的維度〈N,同時使保留下來的數(shù)據(jù)能最大 化表示原始數(shù)據(jù)集的信息。
[0022] 將所述步驟1.1)中樣本數(shù)據(jù)的監(jiān)測數(shù)據(jù)的特征矩陣[fu fu ... f^],經(jīng)過主 成分分析后,生成降維后特征矩陣FEATURES+PCAj= [f u f,2 . . . fjik],即用k個主成分涵 蓋原數(shù)據(jù)集絕大部分信息量,同時保存降維轉(zhuǎn)換矩陣QT。
[0023] 1. 3)計算可靠統(tǒng)計概率分布具體步驟如下:
[0024] 生成將降維后特征矩陣FEATURES+PCAj= [f u f,2 ... f,k]后,需要統(tǒng)計概率分 布。分布的中心與形狀分別由均值與協(xié)方差表示,是后續(xù)計算距離時的依據(jù)。但是由于均 值與協(xié)方差都極易受異常點的影響,因此需要一種能夠排除異常點、可靠估計概率分布的 算法,算法步驟如下:
[0025] 初始化:從降維特征矩陣FEATURES_PCA中隨機抽取H個樣本,其中 N/2 < H < 3N/4,計算其樣本均值Tl和協(xié)方差矩陣Sl ;
[0026] 樣本偏離中心距離計算,這里計算公式如下:
[0028] 其中Tl為樣本均值和Sl為協(xié)方差矩陣。
[0029] 迭代優(yōu)化:從降維特征矩陣中選擇對應(yīng)馬氏距離最小的H個樣本,迭代計算其樣 本均值T2和協(xié)方差矩陣S2,當(dāng)滿足det (S2) = det (SI)或det (S2) = O時,將Tl和SI分 別作為降維特征矩陣總體分布期望T和方差S的可靠估計。
[0030] 將大量歷史樣本經(jīng)過之前1)_3)步驟后的計算,得到樣本狀態(tài)評價模型,即:降維 特征矩陣總體分布期望T和方差S的可靠估計量,即基于馬氏距離的期望T和方差S。其 中,該馬氏距離服從自由度為K的卡方分布,當(dāng)滿足d > Clthrashcild時視為異常樣本。
[0031] 2)異常樣本辨識的具體過程
[0032] 異常樣本辨識的目標是基于樣本狀態(tài)評價模型,將某個設(shè)備某一段時間的監(jiān)測樣 本進行計算和評價,并且給出相關(guān)的量化指標:異常程度及穩(wěn)定程度。異常程度指標是指 反映設(shè)備在該時間段工況偏離正常狀態(tài)的程度,穩(wěn)定程度指標是反映該設(shè)備在該時間段的 表現(xiàn)是否穩(wěn)定,是對異常程度的補充(比較典型的情況,某些設(shè)備,其異常程度指標即局部 均值可能是正常的,但是其局部方差是較大的,說明該設(shè)備可能處于正常與劣化的交界階 段)。
[0033] 2. 1)設(shè)定觀察目標對象即二次設(shè)備的ID,及該二次設(shè)備的觀測時間段[tlt2],從 樣本數(shù)據(jù)中取出滿足條件的數(shù)據(jù)子集,作為待測樣本;
[0034] 2. 2)利用步驟1. 2)中生成的降維轉(zhuǎn)換矩陣Qt對待測樣本進行降維,得到降維后 的待測樣本;
[0035] 2. 3)利用步驟1. 3)中生成的協(xié)方差矩陣S作為映射矩陣,將降維后的待測樣本投 影到總體樣本空間,得到規(guī)范化的待測樣本。
[0036] 2. 4)計算規(guī)范化待測樣本的局部均值與方差。將待測樣本均值與步驟1. 3)迭代 優(yōu)化后的總體樣本均值進行距離計算作為異常程度指標值,將待測樣本方差作為穩(wěn)定程度 指標值。
[0037] 本發(fā)明對比現(xiàn)有技術(shù),有如下優(yōu)點:
[0038] 本發(fā)明的基于二次設(shè)備監(jiān)測歷史數(shù)據(jù)的隱患挖掘方法,及早的發(fā)現(xiàn)狀態(tài)監(jiān)測數(shù)據(jù) 表面處于'正常'的階段,而已經(jīng)處于緩慢的劣化趨勢中的隱患設(shè)備。該方法基于歷史監(jiān)測 大數(shù)據(jù),經(jīng)過樣本數(shù)據(jù)構(gòu)造、主成分分析、距離計算、可靠統(tǒng)計概率分布和異常樣本識別等 流程,對設(shè)備的表現(xiàn)的穩(wěn)定性和異常程度有了量化的評價,克服了當(dāng)前二次設(shè)備檢修中無 法正確掌握設(shè)備健康狀態(tài)的不足,便于運維人員在二次設(shè)備故障之前及早發(fā)現(xiàn)隱患,縮小 設(shè)備維修的范圍,減小維修的成本。同時,還可以以同樣的方法將維修后的監(jiān)測數(shù)據(jù)進行距 離計算,對維修后的效果進行量化的評估。
【附圖說明】
[0039] 圖1是本發(fā)明二次設(shè)備隱患挖掘方法示意圖;
[0040] 圖2為主元貢獻度曲線示意圖;
[0041] 圖3 (a)和3(b)為兩個設(shè)定時間段內(nèi)設(shè)備狀態(tài)的異常程度及狀態(tài)的穩(wěn)定程度示意 圖。
【具體實施方式】
[0042] 以某種二次設(shè)備的為例,說明如何應(yīng)用歷史監(jiān)測數(shù)據(jù)進行隱患挖掘,方法步驟如 圖1所示。
[0043] 首先,收集某型號的二次設(shè)備的狀態(tài)監(jiān)測數(shù)據(jù),如下表1所示,樣本數(shù)為32915 :
[0046] 其中ID列為該型號的某個設(shè)備,Time為監(jiān)