本發(fā)明涉及電力設備識別,具體而言,涉及一種電力設備缺陷識別方法、裝置、電子設備及存儲介質(zhì)。
背景技術(shù):
1、電力高壓設備的缺陷識別關系到電力系統(tǒng)的安全穩(wěn)定運行,因此如何高效、準確地從大量文本數(shù)據(jù)中提取和分類設備缺陷信息成為研究的熱點問題之一。
2、目前,現(xiàn)有的文本分類模型無法充分利用文本中的上下文信息,導致對設備缺陷文本的理解不夠全面和準確。這種局限性在處理長文本和包含復雜語義關系的文本時尤為明顯,從而影響了缺陷識別的效果。
技術(shù)實現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供一種電力設備缺陷識別方法、裝置、電子設備及存儲介質(zhì),以提高缺陷識別的準確率。
2、第一方面,提供一種電力設備缺陷識別方法,方法包括:
3、將目標設備的待識別的缺陷文本輸入到預構(gòu)建的文本提取模型得到缺陷文本的目標詞向量;其中,文本提取模型包括輸入層、transformer編碼層及bi-lstm輸出層;
4、輸入層用于將待識別的缺陷文本轉(zhuǎn)換為初始詞向量;
5、transformer編碼層用于基于多頭注意力機制計算每個初始詞向量與其上下文間的語義關系,根據(jù)該語義關系對初始詞向量進行更新得到包含語義信息的中間詞向量;
6、bi-lstm輸出層用于對中間詞向量的上下文語義信息進行雙向語義提取,得到包含雙向語義信息的目標詞向量;
7、將目標詞向量及電力設備信息輸入到預構(gòu)建的設備缺陷識別模型中,以由設備缺陷識別模型構(gòu)建目標詞向量與電力設備信息之間的關系拓撲圖,并基于該關系拓撲圖進行缺陷分類,得到目標設備的缺陷識別結(jié)果。
8、可選地,基于多頭注意力機制計算每個初始詞向量與其上下文間的語義關系,根據(jù)該語義關系對初始詞向量進行更新得到包含語義信息的中間詞向量包括:
9、基于每個初始詞向量生成查詢向量、鍵向量和值向量,生成計算式為:
10、q=xwq,k=xwk,v=xwv
11、其中,x為初始詞向量,wq,wk,wv分別為對應于查詢向量、鍵向量及值向量的權(quán)重矩陣;q表示查詢向量;k表示鍵向量;v表示值向量;
12、基于查詢向量、鍵向量和值向量計算每頭注意力機制關注的上下文信息的注意力輸出向量,計算式為:
13、
14、其中,headi表示第i頭注意力機制的注意力輸出向量;
15、將每頭注意力機制關注的上下文信息的注意力輸出向量進行連接得到多頭注意力機制關注的上下文信息的向量,并將該向量確定為中間詞向量,其中,拼接式如下:
16、muitihead(q,k,v)=concat(head1,head2…h(huán)eadk)wo;
17、其中,concat表示將每個headi矩陣相連后與連接矩陣wo相乘。
18、可選地,電力設備信息包括設備文檔和設備基礎信息,設備文檔是指與電力高壓設備相關的所有正式文件和記錄,包括但不限于設備說明書、操作手冊、維護記錄、設計圖紙、技術(shù)規(guī)范;設備基礎信息至少包括設備id;設備缺陷識別模型包括嵌入層、圖卷積層以及分類層;
19、嵌入層用于基于設備基礎信息、設備文檔及目標詞向量分別確定電力設備、文檔及詞的初始特征向量;
20、圖卷積層用于基于電力設備、文檔及詞的初始特征向量構(gòu)建包含電力設備、文檔及詞三個類型節(jié)點的無向圖,并對無向圖中的中心節(jié)點進行圖卷積操作以更新中心節(jié)點的初始特征向量,得到聚合了三種節(jié)點特征信息及圖結(jié)構(gòu)的目標特征向量;
21、分類層用于對目標特征向量進行缺陷分類得到目標設備的缺陷識別結(jié)果。
22、可選地,基于設備基礎信息、設備文檔及目標詞向量分別確定電力設備、文檔及詞的初始特征向量包括:
23、對設備基礎信息、設備文檔及目標詞向量進行離散化處理;
24、對離散化后的設備基礎信息、設備文檔及目標詞向量進行one-hot編碼處理得到電力設備、文檔及詞的one-hot向量,以one-hot向量作為初始特征向量。
25、可選地,基于電力設備、文檔及詞的初始特征向量構(gòu)建包含電力設備、文檔及詞三個類型節(jié)點的無向圖包括;
26、基于電力設備、文檔及詞的初始特征向量構(gòu)建無向圖的三種類型的節(jié)點及節(jié)點之間的邊;其中,節(jié)點之間的邊包括電力設備節(jié)點與文檔節(jié)點之間的邊、文檔節(jié)點與詞節(jié)點之間的邊以及詞節(jié)點與詞節(jié)點之間的邊;
27、將電力設備節(jié)點與文檔節(jié)點之間的邊的權(quán)重配置為固定權(quán)重值;
28、基于tf-idf(term?frequency-inverse?document?frequency,詞頻-逆文檔頻率)算法計算文檔節(jié)點與詞節(jié)點之間的邊的權(quán)重;
29、基于pmi(pointwise?mutual?information,點互信息)算法計算詞節(jié)點與詞節(jié)點之間的邊的權(quán)重。
30、可選地,對無向圖中的中心節(jié)點進行圖卷積操作以更新中心節(jié)點的初始特征向量,得到聚合了三種節(jié)點特征信息的目標特征向量包括:
31、對無向圖中的中心節(jié)點進行鄰居采樣,得到鄰居節(jié)點集合;
32、通過消息傳遞機制聚合鄰居節(jié)點集合的初始特征向量,得到聚合了三種節(jié)點特征信息的目標特征向量。
33、可選地,對無向圖中的中心節(jié)點進行鄰居采樣,得到鄰居節(jié)點集合包括:
34、確定鄰居節(jié)點采樣數(shù)量;
35、判斷無向圖的中心節(jié)點周圍的鄰居節(jié)點的總數(shù)量是否大于鄰居節(jié)點采樣數(shù)量;
36、若大于,則隨機選取預設采樣數(shù)量的節(jié)點,得到鄰居節(jié)點集合;
37、若小于,則采用有放回的隨機采樣方式獲得采樣數(shù)量的鄰居節(jié)點集合。
38、第二方面,提供一種電力設備缺陷識別裝置,裝置包括:
39、文本提取單元,用于將目標設備的待識別的缺陷文本輸入到預構(gòu)建的文本提取模型得到缺陷文本的目標詞向量;其中,文本提取模型包括輸入層、transformer編碼層及bi-lstm輸出層;
40、輸入層用于將待識別的缺陷文本轉(zhuǎn)換為初始詞向量;
41、transformer編碼層用于基于多頭注意力機制計算每個初始詞向量與其上下文間的語義關系,根據(jù)該語義關系對初始詞向量進行更新得到包含語義信息的中間詞向量;
42、bi-lstm輸出層用于對中間詞向量的上下文語義信息進行雙向語義提取,得到包含雙向語義信息的目標詞向量;
43、缺陷識別單元,用于將目標詞向量及電力設備信息輸入到預構(gòu)建的設備缺陷識別模型中,以由設備缺陷識別模型構(gòu)建目標詞向量與電力設備信息之間的關系拓撲圖,并基于該關系拓撲圖進行缺陷分類,得到目標設備的缺陷識別結(jié)果。
44、第三方面,提供一種電子設備,包括處理器、通信接口、存儲器和通信總線,其中,處理器,通信接口,存儲器通過通信總線完成相互間的通信;
45、存儲器,用于存放計算機程序;
46、處理器,用于執(zhí)行存儲器上所存放的程序時,實現(xiàn)第一方面任一所述的方法步驟。
47、第四方面,提供一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)內(nèi)存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)第一方面任一所述的方法步驟。
48、本發(fā)明實施例提供一種電力設備缺陷識別方法、裝置、電子設備及存儲介質(zhì),通過將目標設備的待識別的缺陷文本輸入到預構(gòu)建的文本提取模型得到缺陷文本的目標詞向量;通過transformer編碼層及bi-lstm輸出層的結(jié)合,能夠?qū)γ總€詞向量的上下文信息的學習更加全面、完整,從而提高了提取的詞向量的準確率,為后續(xù)的缺陷識別提供高準確率的數(shù)據(jù)支持,并進一步將目標詞向量及電力設備信息輸入到預構(gòu)建的設備缺陷識別模型中進行缺陷識別,充分考慮了目標詞向量與電力設備信息之間的相關性,并根據(jù)該相關性進行缺陷分類,從而提高了缺陷識別結(jié)果的準確性。
49、為使本發(fā)明的上述目的、特征和優(yōu)點能更明顯易懂,下文特舉較佳實施例,并配合所附附圖,作詳細說明如下。