一種基于信息瓶頸的變壓器故障診斷方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于信息瓶頸的變壓器故障診斷方法,屬于變壓器故障診斷技術(shù) 領(lǐng)域。
【背景技術(shù)】
[0002] 作為電力系統(tǒng)中的重要組成部分之一,變壓器的運(yùn)行狀態(tài)直接決定了整個(gè)系統(tǒng)的 穩(wěn)定性。為了保證電網(wǎng)安全運(yùn)行,需要對(duì)變壓器故障進(jìn)行早期預(yù)警。油中溶解氣體分析 (DissolvedGasAnalysis,DGA)是變壓器故障診斷主要方法之一,可以對(duì)變壓器故障做出 有效診斷。目前,業(yè)界主流應(yīng)用的DGA診斷方法是基于規(guī)則的大衛(wèi)三角形法,該方法基于三 種油中溶解氣體:甲烷(CH4),乙烯(C2H4)和乙炔(C2H2)的數(shù)量進(jìn)行運(yùn)算并根據(jù)結(jié)果點(diǎn)在大 衛(wèi)三角形中的位置來(lái)判斷故障類型。該方法具有簡(jiǎn)單、高效且直觀地優(yōu)點(diǎn)。除了基于規(guī)則 的診斷方法外,近年來(lái)模式識(shí)別方法被廣泛引入到變壓器故障診斷問(wèn)題中,如人工神經(jīng)網(wǎng) 絡(luò)(ANN)、支持向量機(jī)(SVM)、貝葉斯(Bayes)方法和半監(jiān)督分類方法等都取得了一定的效 果。但是上述方法的在變壓器故障診斷的正確率不是太高。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明的目的是提供一種基于信息瓶頸的變壓器故障診斷方法,以解決現(xiàn)有變壓 器故障診斷的正確率不高的問(wèn)題。
[0004] 本發(fā)明為解決上述技術(shù)問(wèn)題而提供一種基于信息瓶頸的變壓器故障診斷方法,該 故障診斷方法包括以下步驟:
[0005] 1)采集變壓器DGA數(shù)據(jù)作為樣本數(shù)據(jù)集;
[0006] 2)采用IB方法對(duì)樣本數(shù)據(jù)集進(jìn)行聚類,得到k個(gè)結(jié)果簇;
[0007] 3)對(duì)每一個(gè)待測(cè)樣本,通過(guò)各個(gè)簇中訓(xùn)練樣本的投票決定待測(cè)樣本的類標(biāo)號(hào),從 而實(shí)現(xiàn)對(duì)變壓器故障的診斷。
[0008] 所述的每個(gè)數(shù)據(jù)樣本包括八個(gè)屬性,分別為H2、CH4、C2H6、C2H4、C2H2、ZTING、C0、 C02的含量和專家標(biāo)定的數(shù)據(jù)類標(biāo)號(hào)。
[0009] 所述變壓器DGA數(shù)據(jù)還需要進(jìn)行數(shù)據(jù)清洗和規(guī)整,其過(guò)程如下:
[0010]A)刪除沒(méi)有專家標(biāo)定的類別號(hào)的樣本;
[0011] B)刪除重復(fù)樣本;
[0012] C)刪除有缺失屬性的樣本;
[0013] D)刪除屬性值為0的樣本。
[0014] 所述步驟1)中的變壓器DGA數(shù)據(jù)還需進(jìn)行數(shù)據(jù)變換。
[0015] 所述的數(shù)據(jù)變換為Max-Min法、對(duì)數(shù)特征變換法和反正切函數(shù)法中的任意一種。
[0016] 所述步驟2)的具體過(guò)程如下:
[0017]a)將樣本數(shù)據(jù)集中的樣本數(shù)據(jù)進(jìn)行訓(xùn)練集和測(cè)試集劃分,分為測(cè)試樣本和訓(xùn)練樣 本;
[0018] b)依次將每一個(gè)測(cè)試樣本合并到訓(xùn)練集;
[0019] c)采用IB方法聚類并得到k個(gè)結(jié)果簇。
[0020] 所述的步驟3)中采用的投票方式包括簡(jiǎn)單多數(shù)投票和加權(quán)投票兩種,所述簡(jiǎn)單 多數(shù)投票是指簡(jiǎn)單多數(shù)選舉,所述加權(quán)投票是指以各個(gè)類別的先驗(yàn)概率為權(quán)來(lái)進(jìn)行加權(quán)投 票。
[0021] 本發(fā)明的有益效果是:本發(fā)明采用信息瓶頸方法對(duì)數(shù)據(jù)進(jìn)行聚類以得到簇內(nèi)相 似性最大的結(jié)果簇,然后通過(guò)簇內(nèi)訓(xùn)練樣本的投票決定待測(cè)樣本的類標(biāo)號(hào),從而確定故障 類別,本發(fā)明的分類結(jié)果優(yōu)于基于規(guī)則的大衛(wèi)三角形方法、基于模式識(shí)別的BPNN算法和基 于模式識(shí)別的Bayes方法,在變壓器故障診斷方面,可以有效提高診斷的正確率。
【附圖說(shuō)明】
[0022] 圖1是本發(fā)明基于信息瓶頸的變壓器故障診斷方法的流程圖。
【具體實(shí)施方式】
[0023] 下面結(jié)合附圖對(duì)本發(fā)明的【具體實(shí)施方式】作進(jìn)一步的說(shuō)明。
[0024] 信息瓶頸方法(InformationBottleneck,IB)是一種基于信息論的模式識(shí)別方 法,被廣泛應(yīng)用于文檔聚類、圖像分析、DNA處理和視頻圖像檢索等領(lǐng)域。為提高變壓器故 障診斷的正確率,本發(fā)明將信息瓶頸法應(yīng)用到變壓器DGA診斷中,提出了一種基于信息瓶 頸法的變壓器故障診斷方法,如圖1所示,具體過(guò)程如下。
[0025] 1.采用信息瓶頸法對(duì)樣本數(shù)據(jù)集(包括訓(xùn)練樣本和待測(cè)樣本)進(jìn)行聚類,得到k 個(gè)結(jié)果簇。
[0026] 2.對(duì)每一個(gè)待測(cè)樣本,通過(guò)各個(gè)簇中訓(xùn)練樣本的投票決定待測(cè)樣本的類標(biāo)號(hào)。
[0027] 先取一個(gè)測(cè)試樣本,并將其合并到訓(xùn)練集中;采用IB法聚類并得到k個(gè)結(jié)果簇; 如果x屬于某個(gè)簇t,則使用該簇中所有訓(xùn)練樣本進(jìn)行投票,投票方式采用簡(jiǎn)單多數(shù)投票 和加權(quán)投票兩種方式。簡(jiǎn)單多數(shù)投票為簡(jiǎn)單多數(shù)選舉方式,加權(quán)投票時(shí)以各個(gè)類別的先 驗(yàn)概率為權(quán)來(lái)進(jìn)行加權(quán)投票。例如假設(shè)目標(biāo)類c= (1,2, 3),先驗(yàn)概率Pc= (1/4,1/2, 1/4)。如果簇A中包含10個(gè)訓(xùn)練樣本和1個(gè)待測(cè)樣本,而10個(gè)訓(xùn)練樣本的類標(biāo)號(hào)為 [1,3, 1,1,2, 1,2, 2, 1]。則這10個(gè)訓(xùn)練樣本的簡(jiǎn)單多數(shù)投票為結(jié)果為類標(biāo)號(hào)1,即對(duì)待測(cè)樣 本標(biāo)定為類屬1,而加權(quán)投票結(jié)果為類標(biāo)號(hào)2,即對(duì)待測(cè)樣本表定為類屬號(hào),從中可以看出, 簡(jiǎn)單多數(shù)和加權(quán)投票可以產(chǎn)生不同的類標(biāo)號(hào),而加權(quán)投票的可靠程度依賴于先驗(yàn)知識(shí)。
[0028] 在采用基于模式識(shí)別方法對(duì)DGA數(shù)據(jù)進(jìn)行診斷時(shí),不同的算法有著不同的數(shù)據(jù)預(yù) 處理要求。例如,神經(jīng)網(wǎng)絡(luò)算法要求數(shù)據(jù)做歸一化處理,以避免具有較大值域的屬性左右算 法結(jié)果;貝葉斯算法要求對(duì)連續(xù)數(shù)據(jù)進(jìn)行離散化以便進(jìn)行概率計(jì)算。而對(duì)于IB算法而言, 只要求數(shù)據(jù)為非負(fù)數(shù)據(jù)即可,以便能計(jì)算信息熵和互信息值并以此判定樣本重新指派的代 價(jià)。因此,本發(fā)明在實(shí)驗(yàn)中常識(shí)性采用了一些數(shù)據(jù)變換方法來(lái)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,根據(jù)DGA 數(shù)據(jù)特征,本發(fā)明可選擇選擇Max-Min法、對(duì)數(shù)特征變換法和反正切函數(shù)法三種數(shù)據(jù)變換 方法中的任意一種。
[0029] 本發(fā)明的實(shí)驗(yàn)數(shù)據(jù)取自于實(shí)際生產(chǎn)數(shù)據(jù),總共搜集到609個(gè)樣本,每個(gè)樣本共包 括八個(gè)屬性(H2、CH4、C2H6、C2H4、C2H2、ZTNC、CO、C02)和專家標(biāo)定的數(shù)據(jù)類標(biāo)號(hào),數(shù)據(jù)清 洗和規(guī)整的的步驟如下:
[0030] 1)刪除沒(méi)有專家標(biāo)定的類別號(hào)的樣本;
[0031] 2)刪除重復(fù)樣本;
[0032] 3)刪除有缺失屬性的樣本;
[0033] 4)刪除屬性值為0的樣本。
[0034] 經(jīng)過(guò)上述步驟處理,最終得到的有效數(shù)據(jù)樣本個(gè)數(shù)為350個(gè),數(shù)據(jù)樣本的故障類 型分布見(jiàn)表1。
[0035] 表 1
【主權(quán)項(xiàng)】
1. 一種基于信息瓶頸的變壓器故障診斷方法,其特征在于,該故障診斷方法包括以下 步驟: 1) 采集變壓器DGA數(shù)據(jù)作為樣本數(shù)據(jù)集; 2) 采用IB方法對(duì)樣本數(shù)據(jù)集進(jìn)行聚類,得到k個(gè)結(jié)果簇; 3) 對(duì)每一個(gè)待測(cè)樣本,通過(guò)各個(gè)簇中訓(xùn)練樣本的投票決定待測(cè)樣本的類標(biāo)號(hào),從而實(shí) 現(xiàn)對(duì)變壓器故障的診斷。
2. 根據(jù)權(quán)利要求1所述的基于信息瓶頸的變壓器故障診斷方法,其特征在于,所述的 每個(gè)數(shù)據(jù)樣本包括八個(gè)屬性,分別為H2、CH4、C2H6、C2H4、C2H2、ZTING、CO、C02的含量和專 家標(biāo)定的數(shù)據(jù)類標(biāo)號(hào)。
3. 根據(jù)權(quán)利要求2所述的基于信息瓶頸的變壓器故障診斷方法,其特征在于,所述變 壓器DGA數(shù)據(jù)還需要進(jìn)行數(shù)據(jù)清洗和規(guī)整,其過(guò)程如下: A) 刪除沒(méi)有專家標(biāo)定的類別號(hào)的樣本; B) 刪除重復(fù)樣本; C) 刪除有缺失屬性的樣本; D) 刪除屬性值為O的樣本。
4. 根據(jù)權(quán)利要求3所述的基于信息瓶頸的變壓器故障診斷方法,其特征在于,所述步 驟1)中的變壓器DGA數(shù)據(jù)還需進(jìn)行數(shù)據(jù)變換。
5. 根據(jù)權(quán)利要求4所述的基于信息瓶頸的變壓器故障診斷方法,其特征在于,所述的 數(shù)據(jù)變換為Max-Min法、對(duì)數(shù)特征變換法和反正切函數(shù)法中的任意一種。
6. 根據(jù)權(quán)利要求4所述的基于信息瓶頸的變壓器故障診斷方法,其特征在于,所述步 驟2)的具體過(guò)程如下: a) 將樣本數(shù)據(jù)集中的樣本數(shù)據(jù)進(jìn)行訓(xùn)練集和測(cè)試集劃分,分為測(cè)試樣本和訓(xùn)練樣本; b) 依次將每一個(gè)測(cè)試樣本合并到訓(xùn)練集; c) 采用IB方法聚類并得到k個(gè)結(jié)果簇。
7. 根據(jù)權(quán)利要求6所述的基于信息瓶頸的變壓器故障診斷方法,其特征在于,所述的 步驟3)中采用的投票方式包括簡(jiǎn)單多數(shù)投票和加權(quán)投票兩種,所述簡(jiǎn)單多數(shù)投票是指簡(jiǎn) 單多數(shù)選舉,所述加權(quán)投票是指以各個(gè)類別的先驗(yàn)概率為權(quán)來(lái)進(jìn)行加權(quán)投票。
【專利摘要】本發(fā)明涉及一種基于信息瓶頸的變壓器故障診斷方法,屬于變壓器故障診斷技術(shù)領(lǐng)域。本發(fā)明采用信息瓶頸方法對(duì)數(shù)據(jù)進(jìn)行聚類以得到簇內(nèi)相似性最大的結(jié)果簇,然后通過(guò)簇內(nèi)訓(xùn)練樣本的投票決定待測(cè)樣本的類標(biāo)號(hào),從而確定故障類別,本發(fā)明的分類結(jié)果優(yōu)于基于規(guī)則的大衛(wèi)三角形方法、基于模式識(shí)別的BPNN算法和基于模式識(shí)別的Bayes方法,在變壓器故障診斷方面,可以有效提高診斷的正確率。
【IPC分類】G06F19-00
【公開(kāi)號(hào)】CN104809328
【申請(qǐng)?zhí)枴緾N201410527345
【發(fā)明人】雍明超, 路光輝, 牧繼清, 龔東武, 王勝輝, 趙寶, 郭宏燕, 周水斌, 牟濤, 王龍閣, 王志成
【申請(qǐng)人】許繼電氣股份有限公司, 許昌許繼軟件技術(shù)有限公司
【公開(kāi)日】2015年7月29日
【申請(qǐng)日】2014年10月9日