本發(fā)明涉及電力數(shù)據(jù),特別是涉及一種基于聯(lián)邦學(xué)習(xí)的電力多模態(tài)數(shù)據(jù)共享方法。
背景技術(shù):
1、電力作為社會各項(xiàng)活動的關(guān)鍵能源,國家的年用電數(shù)據(jù)可以直觀的反映出我國的社會經(jīng)濟(jì)發(fā)展水平。進(jìn)行電力大數(shù)據(jù)研究,充分提取電力數(shù)據(jù)的社會化、商業(yè)化價值成為電力行業(yè)信息化發(fā)展的方向。電力多模態(tài)大數(shù)據(jù)處理的關(guān)鍵點(diǎn)包括:1、數(shù)據(jù)的采集與融合。電力系統(tǒng)涉及發(fā)電、輸電、配電、用電等多個環(huán)節(jié),每個環(huán)節(jié)都會產(chǎn)生大量數(shù)據(jù)。這些數(shù)據(jù)包括:電氣數(shù)據(jù):如電壓、電流、功率、頻率等。設(shè)備數(shù)據(jù):如設(shè)備型號、運(yùn)行狀態(tài)、故障信息等。環(huán)境數(shù)據(jù):如溫度、濕度、風(fēng)速等。人員數(shù)據(jù):如巡檢記錄、檢修記錄等。2、數(shù)據(jù)處理與分析。電力多模態(tài)大數(shù)據(jù)處理需要對采集到的數(shù)據(jù)進(jìn)行清洗、預(yù)處理、特征提取、模型訓(xùn)練、分析預(yù)測等。
2、電力多模態(tài)數(shù)據(jù)融合是電力系統(tǒng)中一個至關(guān)重要的環(huán)節(jié),它涉及將來自不同源和模態(tài)的數(shù)據(jù)進(jìn)行有效整合,以提供更全面、精確的信息來支持電力系統(tǒng)的運(yùn)維、分析和決策。目前,電力多模態(tài)數(shù)據(jù)融合主要有三種融合方式:數(shù)據(jù)級融合、決策級融合和特征級融合。其中,數(shù)據(jù)級融合:將多個獨(dú)立的數(shù)據(jù)集融合成一個單一的特征向量,然后輸入到機(jī)器學(xué)習(xí)分類器中。這種方法能夠充分利用原始數(shù)據(jù)的豐富信息,但可能面臨數(shù)據(jù)冗余和特征提取的挑戰(zhàn)。在實(shí)際應(yīng)用中,前端融合常常與特征提取方法相結(jié)合,如主成分分析(pca)、最大相關(guān)最小冗余算法(mrmr)等,以剔除冗余信息并提取關(guān)鍵特征。決策級融合:將不同模態(tài)數(shù)據(jù)分別訓(xùn)練好的分類器輸出打分(決策)進(jìn)行融合。這種方法可以保留各個模態(tài)數(shù)據(jù)的獨(dú)立性和特點(diǎn),并在決策層面進(jìn)行綜合。集成學(xué)習(xí)是決策級融合的典型代表,它通過組合多個分類器的輸出,提高了分類的準(zhǔn)確性和魯棒性。特征級融合:介于數(shù)據(jù)級融合和決策級融合之間,可以在數(shù)據(jù)處理的任何階段進(jìn)行融合。特征級融合具有較大的靈活性,可以根據(jù)具體應(yīng)用場景和需求選擇合適的融合位置和策略。
3、然而現(xiàn)有技術(shù)的電力數(shù)據(jù)分析方法的技術(shù)缺點(diǎn)主要有兩點(diǎn):1、現(xiàn)有的數(shù)據(jù)處理方法依賴于集中式的數(shù)據(jù)存儲和處理,為數(shù)據(jù)共享與隱私保護(hù)帶來了不便;2、現(xiàn)有的電力數(shù)據(jù)處理方式不能適應(yīng)大量異構(gòu)多模態(tài)電力數(shù)據(jù)的數(shù)據(jù)融合分析處理需求。
4、因此,設(shè)計一種基于聯(lián)邦學(xué)習(xí)的電力多模態(tài)數(shù)據(jù)共享方法是十分有必要的。
技術(shù)實(shí)現(xiàn)思路
1、為了克服現(xiàn)有技術(shù)的不足,本發(fā)明的目的是提供一種基于聯(lián)邦學(xué)習(xí)的電力多模態(tài)數(shù)據(jù)共享方法。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供了如下方案:
3、本發(fā)明第一方面提供了一種基于聯(lián)邦學(xué)習(xí)的電力多模態(tài)數(shù)據(jù)共享方法,包括:
4、獲取電力多模態(tài)數(shù)據(jù),并對其進(jìn)行預(yù)處理操作;
5、初始化聯(lián)邦學(xué)習(xí)框架,并確定參與聯(lián)邦學(xué)習(xí)的節(jié)點(diǎn),建立安全的通信通道,將聯(lián)邦學(xué)習(xí)框架分發(fā)至各個參與節(jié)點(diǎn);
6、基于預(yù)處理操作后的參與節(jié)點(diǎn)的電力多模態(tài)數(shù)據(jù)對聯(lián)邦學(xué)習(xí)的本地模型進(jìn)行訓(xùn)練;
7、各個參與節(jié)點(diǎn)將訓(xùn)練得到的本地模型的參數(shù)發(fā)送至中央服務(wù)器或協(xié)調(diào)節(jié)點(diǎn),中央服務(wù)器或協(xié)調(diào)節(jié)點(diǎn)對收到的參數(shù)進(jìn)行聚合操作,得到全局模型參數(shù);
8、中央服務(wù)器或協(xié)調(diào)節(jié)點(diǎn)將全局模型參數(shù)分發(fā)回各個參與節(jié)點(diǎn),各個參與節(jié)點(diǎn)根據(jù)收到的全局模型參數(shù)更新本地模型,進(jìn)行下一個迭代周期的訓(xùn)練;
9、重復(fù)進(jìn)行上述步驟,直至滿足預(yù)設(shè)的停止條件,結(jié)束迭代,得到全局模型;
10、對全局模型進(jìn)行評估,若評估結(jié)果符合預(yù)設(shè)要求,則完成訓(xùn)練,若不符合,則重復(fù)進(jìn)行本地模型訓(xùn)練、模型參數(shù)聚合及全局模型更新與分發(fā),直至得到符合預(yù)設(shè)要求的全局模型。
11、優(yōu)選地,獲取電力多模態(tài)數(shù)據(jù),并對其進(jìn)行預(yù)處理操作,具體為:
12、參與節(jié)點(diǎn)獲取來自不同電力數(shù)據(jù)源的多模態(tài)數(shù)據(jù),并對獲取的數(shù)據(jù)進(jìn)行清洗、去噪及歸一化操作。
13、優(yōu)選地,所述聯(lián)邦學(xué)習(xí)框架包括特征預(yù)處理模塊、二次特征提取模塊、注意力模塊及mlp模塊,所述特征預(yù)處理模塊用于基于預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)對多模態(tài)數(shù)據(jù)進(jìn)行特征提取,得到初步特征;所述二次特征提取模塊用于學(xué)習(xí)初步特征的時序特征及概率分布信息,得到多模態(tài)特征;所述注意力模塊用于通過注意力機(jī)制處理多模態(tài)特征;所述mlp模塊為多層感知機(jī),用于輸出最終預(yù)測結(jié)果。
14、優(yōu)選地,所述特征預(yù)處理模塊設(shè)置有三個預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò),分別為mobilenetv2、mobilebert及mfcc,其中,mobilenetv2用于視頻特征提取,mobilebert用于文本特征提取,所述mfcc用于音頻特征提取。
15、優(yōu)選地,所述中央服務(wù)器或協(xié)調(diào)節(jié)點(diǎn)通過fedavg算法對收到的參數(shù)進(jìn)行聚合操作。
16、根據(jù)本發(fā)明提供的具體實(shí)施例,本發(fā)明公開了以下技術(shù)效果:
17、本發(fā)明提供了一種基于聯(lián)邦學(xué)習(xí)的電力多模態(tài)數(shù)據(jù)共享方法,包括獲取電力多模態(tài)數(shù)據(jù),并對其進(jìn)行預(yù)處理操作,初始化聯(lián)邦學(xué)習(xí)框架,并確定參與聯(lián)邦學(xué)習(xí)的節(jié)點(diǎn),建立安全的通信通道,將聯(lián)邦學(xué)習(xí)框架分發(fā)至各個參與節(jié)點(diǎn),基于預(yù)處理操作后的參與節(jié)點(diǎn)的電力多模態(tài)數(shù)據(jù)對聯(lián)邦學(xué)習(xí)的本地模型進(jìn)行訓(xùn)練,各個參與節(jié)點(diǎn)將訓(xùn)練得到的本地模型的參數(shù)發(fā)送至中央服務(wù)器或協(xié)調(diào)節(jié)點(diǎn),中央服務(wù)器或協(xié)調(diào)節(jié)點(diǎn)對收到的參數(shù)進(jìn)行聚合操作,得到全局模型參數(shù),中央服務(wù)器或協(xié)調(diào)節(jié)點(diǎn)將全局模型參數(shù)分發(fā)回各個參與節(jié)點(diǎn),各個參與節(jié)點(diǎn)根據(jù)收到的全局模型參數(shù)更新本地模型,進(jìn)行下一個迭代周期的訓(xùn)練,重復(fù)進(jìn)行上述步驟,直至滿足預(yù)設(shè)的停止條件,結(jié)束迭代,得到全局模型,對全局模型進(jìn)行評估,若評估結(jié)果符合預(yù)設(shè)要求,則完成訓(xùn)練,若不符合,則重復(fù)進(jìn)行本地模型訓(xùn)練、模型參數(shù)聚合及全局模型更新與分發(fā),直至得到符合預(yù)設(shè)要求的全局模型。本發(fā)明能夠在保護(hù)隱私的同時,利用分布式數(shù)據(jù)提升電力領(lǐng)域的模型性能。
1.一種基于聯(lián)邦學(xué)習(xí)的電力多模態(tài)數(shù)據(jù)共享方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,獲取電力多模態(tài)數(shù)據(jù),并對其進(jìn)行預(yù)處理操作,具體為:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述聯(lián)邦學(xué)習(xí)框架包括特征預(yù)處理模塊、二次特征提取模塊、注意力模塊及mlp模塊,所述特征預(yù)處理模塊用于基于預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)對多模態(tài)數(shù)據(jù)進(jìn)行特征提取,得到初步特征;所述二次特征提取模塊用于學(xué)習(xí)初步特征的時序特征及概率分布信息,得到多模態(tài)特征;所述注意力模塊用于通過注意力機(jī)制處理多模態(tài)特征;所述mlp模塊為多層感知機(jī),用于輸出最終預(yù)測結(jié)果。
4.如權(quán)利要求3所述的方法,其特征在于,所述特征預(yù)處理模塊設(shè)置有三個預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò),分別為mobilenetv2、mobilebert及mfcc,其中,mobilenetv2用于視頻特征提取,mobilebert用于文本特征提取,所述mfcc用于音頻特征提取。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述中央服務(wù)器或協(xié)調(diào)節(jié)點(diǎn)通過fedavg算法對收到的參數(shù)進(jìn)行聚合操作。