本發(fā)明屬于物聯(lián)網(wǎng)和人工智能,具體涉及一種輕量化網(wǎng)絡(luò)小樣本數(shù)據(jù)自動提取方法。
背景技術(shù):
1、在當(dāng)今數(shù)字化與萬物智聯(lián)的時代背景下,大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)的采集、處理與分析對于解決各類現(xiàn)實問題具有舉足輕重的地位。然而,在高山峽谷等地理條件復(fù)雜、通信基礎(chǔ)設(shè)施薄弱的地區(qū),網(wǎng)絡(luò)數(shù)據(jù)的獲取與處理變得尤為棘手。高山峽谷以其陡峭的山峰、深邃的峽谷和多變的地形而著稱,這些特殊地貌導(dǎo)致網(wǎng)絡(luò)信號覆蓋不全、信號強(qiáng)度不穩(wěn)定以及設(shè)備供電困難等問題頻發(fā),傳統(tǒng)傳感網(wǎng)絡(luò)數(shù)據(jù)提取方法在此類環(huán)境中難以施展拳腳。
2、為了應(yīng)對高山峽谷地區(qū)物聯(lián)網(wǎng)節(jié)點數(shù)據(jù)采集的難題,自動數(shù)據(jù)提取技術(shù)應(yīng)運(yùn)而生。通過自動化、輕量化的手段,該技術(shù)能在幾乎無需人力參與的情況下,遠(yuǎn)程完成傳感器節(jié)點的數(shù)據(jù)提取工作,從而確保數(shù)據(jù)提取的實時性與準(zhǔn)確性,并降低物聯(lián)網(wǎng)節(jié)點的能耗。因此,解決高山峽谷地區(qū)的數(shù)據(jù)自動提取問題,對于推動該地區(qū)的資源開發(fā)、環(huán)境保護(hù)及自然災(zāi)害監(jiān)測等應(yīng)用至關(guān)重要,這也是近年來學(xué)術(shù)界和產(chǎn)業(yè)界共同關(guān)注的焦點。
3、盡管現(xiàn)有的物聯(lián)網(wǎng)數(shù)據(jù)提取技術(shù)在提升高山峽谷地區(qū)的數(shù)據(jù)提取能力方面取得了一定進(jìn)展,但仍面臨諸多挑戰(zhàn)。一方面,由于地理環(huán)境的嚴(yán)酷性和人工成本的高昂,該地區(qū)的物聯(lián)網(wǎng)節(jié)點通常設(shè)計為低功耗傳感器,其數(shù)據(jù)采集量小、傳輸速度慢,僅能提供有限的數(shù)據(jù)樣本,這無疑增加了提取有效信息的難度。另一方面,地形復(fù)雜、信號覆蓋不全等因素導(dǎo)致采集的數(shù)據(jù)樣本存在不完整、規(guī)模小等問題。此外,高山峽谷地區(qū)的網(wǎng)絡(luò)信號波動大、強(qiáng)度不穩(wěn)定,對數(shù)據(jù)提取的實時性提出了更高要求。
4、針對這些挑戰(zhàn),本發(fā)明專利致力于設(shè)計一種輕量化網(wǎng)絡(luò)小樣本數(shù)據(jù)自動提取方法。該方法充分考慮了高山峽谷地區(qū)網(wǎng)絡(luò)狀態(tài)的多變性、原始采集數(shù)據(jù)的冗余異構(gòu)性以及數(shù)據(jù)樣本規(guī)模小的特點,旨在實現(xiàn)低時延、低功耗的數(shù)據(jù)采集和高準(zhǔn)確度的數(shù)據(jù)特征提取,為高山峽谷地區(qū)的數(shù)據(jù)處理與應(yīng)用提供強(qiáng)有力的技術(shù)支持。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供了一種輕量化網(wǎng)絡(luò)小樣本數(shù)據(jù)自動提取方法,該方法具體包含數(shù)據(jù)采集過程和數(shù)據(jù)處理過程兩部分的設(shè)計。在數(shù)據(jù)采集過程,針對每個物聯(lián)網(wǎng)節(jié)點設(shè)計基于壓縮感知的數(shù)據(jù)采集方案,將節(jié)點采集的原始數(shù)據(jù)進(jìn)行稀疏化表述,通過隨機(jī)測量矩陣將稀疏數(shù)據(jù)壓縮為較小體量的數(shù)據(jù)包進(jìn)行傳輸;對多節(jié)點壓縮數(shù)據(jù)包的傳輸過程引入中繼節(jié)點多跳轉(zhuǎn)發(fā)機(jī)制,通過將數(shù)據(jù)包發(fā)送至距離較近的中繼節(jié)點,降低高山峽谷區(qū)域部署的物聯(lián)網(wǎng)節(jié)點功耗,增強(qiáng)節(jié)點持續(xù)工作能力,實現(xiàn)高山峽谷區(qū)域內(nèi)物聯(lián)網(wǎng)節(jié)點采集數(shù)據(jù)的高效匯集。數(shù)據(jù)處理過程。在數(shù)據(jù)提取處理過程,本發(fā)明提出基于數(shù)據(jù)增強(qiáng)的長短期記憶網(wǎng)絡(luò)(long?short-term?memory,lstm),對采集到小樣本時序數(shù)據(jù)進(jìn)行處理,捕獲數(shù)據(jù)的時間特征信息;采用知識蒸餾技術(shù)將構(gòu)建的lstm網(wǎng)絡(luò)進(jìn)行模型壓縮,使得模型可以部署在高山峽谷中資源受限的低功耗物聯(lián)網(wǎng)節(jié)點。
2、具體而言,本發(fā)明是通過如下技術(shù)方案實現(xiàn)的:
3、一種輕量化網(wǎng)絡(luò)小樣本數(shù)據(jù)自動提取方法,包括以下步驟:步驟s1:采集低功耗物聯(lián)網(wǎng)節(jié)點的傳感數(shù)據(jù),基于壓縮感知技術(shù)在保證關(guān)鍵信息不丟失的前提下降低數(shù)據(jù)傳輸量;步驟s2:設(shè)計基于斯坦納樹的中繼節(jié)點選擇機(jī)制,實現(xiàn)傳輸功耗最小化的數(shù)據(jù)多跳轉(zhuǎn)發(fā)匯聚;步驟s3:訓(xùn)練部署基于數(shù)據(jù)增強(qiáng)的長短期記憶網(wǎng)絡(luò),提取小樣本傳感數(shù)據(jù)特征信息,結(jié)合知識蒸餾技術(shù),實現(xiàn)深度學(xué)習(xí)模型的輕量化,使其可以部署在資源受限設(shè)備。
4、在某實施方式中,設(shè)計針對低功耗物聯(lián)網(wǎng)節(jié)點的數(shù)據(jù)采集機(jī)制,基于壓縮感知將原始采集數(shù)據(jù)進(jìn)行稀疏化表示,通過隨機(jī)測量矩陣,將稀疏信號壓縮為體量較小的數(shù)據(jù)包。
5、在某實施方式中,數(shù)據(jù)接收節(jié)點對接收到的壓縮感知后的數(shù)據(jù)包進(jìn)行解壓縮和重構(gòu),基于壓縮感知矩陣將傳輸數(shù)據(jù)解碼為稀疏數(shù)據(jù),進(jìn)一步利用最小二乘法的數(shù)據(jù)重建算法,將數(shù)據(jù)從稀疏數(shù)據(jù)恢復(fù)到原始數(shù)據(jù)。
6、在某實施方式中,在對每個物聯(lián)網(wǎng)節(jié)點的傳輸數(shù)據(jù)進(jìn)行壓縮后,進(jìn)一步規(guī)劃節(jié)點傳輸路由,從而實現(xiàn)大規(guī)模物聯(lián)網(wǎng)節(jié)點的自動數(shù)據(jù)匯集。
7、在某實施方式中,規(guī)劃節(jié)點傳輸路由、選擇傳輸中繼節(jié)點,將高山峽谷內(nèi)傳感網(wǎng)絡(luò)的傳輸過程構(gòu)建為有向圖模型,尋找圖模型中的最小斯坦納樹,從而確定傳輸功耗最優(yōu)的中繼節(jié)點選擇方案。
8、在某實施方式中,圖模型中的節(jié)點為高山峽谷內(nèi)的傳感器節(jié)點,有向邊表示傳感器節(jié)點可進(jìn)行無線通信,節(jié)點權(quán)重為傳感器節(jié)點靜態(tài)能量開銷。這里的靜態(tài)能量開銷指的是傳感器在未進(jìn)行數(shù)據(jù)通信時,單位時間內(nèi)維持節(jié)點存活的能耗。圖模型的邊權(quán)重為兩個節(jié)點的通信在單位時間內(nèi)的能耗開銷。根據(jù)構(gòu)建的有向圖模型,利用prim算法尋找最小斯坦納樹,以確定高山峽谷傳感網(wǎng)絡(luò)的中繼節(jié)點選擇和多跳傳輸路由策略。
9、在某實施方式中,針對匯集到的高山峽谷中小樣本傳感數(shù)據(jù),執(zhí)行數(shù)據(jù)增強(qiáng)以擴(kuò)充數(shù)據(jù)集。通過隨機(jī)平移和縮放來模擬不同時間點和不同尺度下的傳感器數(shù)據(jù),以增加數(shù)據(jù)的多樣性和豐富性。
10、在某實施方式中,基于增強(qiáng)后的高山峽谷地區(qū)的傳感數(shù)據(jù)集,構(gòu)建用于時間序列數(shù)據(jù)處理的lstm網(wǎng)絡(luò),以捕獲數(shù)據(jù)之間的長期時間關(guān)聯(lián)關(guān)系。lstm網(wǎng)絡(luò)的訓(xùn)練過程,采用基于adam的自適應(yīng)學(xué)習(xí)率訓(xùn)練方法,進(jìn)行參數(shù)的更新和調(diào)優(yōu),以最小化損失函數(shù)并提高模型的性能。
11、在某實施方式中,在訓(xùn)練好的lstm模型上運(yùn)用知識蒸餾技術(shù)進(jìn)行模型輕量化,將原始復(fù)雜模型的知識轉(zhuǎn)移給輕量化后的模型來實現(xiàn)模型的壓縮。經(jīng)過輕量化操作后的網(wǎng)絡(luò)模型可以部署到高山峽谷地區(qū)中的低功耗物聯(lián)網(wǎng)節(jié)點,從而實現(xiàn)模型在低功耗物聯(lián)網(wǎng)節(jié)點的高效數(shù)據(jù)特征提取與分析。
12、本發(fā)明具有如下的優(yōu)點和有益效果:
13、1、本發(fā)明針對高山峽谷中物聯(lián)網(wǎng)設(shè)備能耗受限、設(shè)備位置分散不均、網(wǎng)絡(luò)通信環(huán)境復(fù)雜等挑戰(zhàn),設(shè)計基于壓縮感知的物聯(lián)網(wǎng)設(shè)備數(shù)據(jù)傳輸方案和基于斯坦納樹的中繼轉(zhuǎn)發(fā)路由技術(shù),降低節(jié)點傳輸能耗、增強(qiáng)節(jié)點持續(xù)工作能力、實現(xiàn)傳感數(shù)據(jù)的高效匯集。
14、2、本發(fā)明針對高山峽谷中物聯(lián)網(wǎng)設(shè)備采集數(shù)據(jù)樣本小、設(shè)備資源受限等特點,設(shè)計基于基于數(shù)據(jù)增強(qiáng)的長短期記憶網(wǎng)絡(luò)來提取采集數(shù)據(jù)特征,并利用知識蒸餾技術(shù)對構(gòu)建的深度學(xué)習(xí)模型進(jìn)行輕量化處理,使得模型可以部署在資源受限的物聯(lián)網(wǎng)節(jié)點。
15、以上披露的技術(shù)方案/特征,旨在對具體實施方式部分中所描述的技術(shù)方案、技術(shù)特征進(jìn)行概括,因而記載的范圍可能不完全相同。但是該部分披露的這些新的技術(shù)方案同樣屬于本發(fā)明文件所公開的眾多技術(shù)方案的一部分,該部分披露的技術(shù)特征與后續(xù)具體實施方式部分公開的技術(shù)特征、未在說明書中明確描述的附圖中的部分內(nèi)容,以相互合理組合的方式披露更多的技術(shù)方案。
16、本發(fā)明任意位置所披露的所有技術(shù)特征所組合出的技術(shù)方案,用于支撐對技術(shù)方案的概括、專利文件的修改、技術(shù)方案的披露。
1.一種輕量化網(wǎng)絡(luò)小樣本數(shù)據(jù)自動提取方法,其特征在于,包括:以下步驟:
2.根據(jù)權(quán)利要求1所述的輕量化網(wǎng)絡(luò)小樣本數(shù)據(jù)自動提取方法,其特征在于:
3.根據(jù)權(quán)利要求1所述的輕量化網(wǎng)絡(luò)小樣本數(shù)據(jù)自動提取方法,其特征在于:
4.根據(jù)權(quán)利要求1所述的輕量化網(wǎng)絡(luò)小樣本數(shù)據(jù)自動提取方法,其特征在于:
5.根據(jù)權(quán)利要求1所述的輕量化網(wǎng)絡(luò)小樣本數(shù)據(jù)自動提取方法,其特征在于:
6.根據(jù)權(quán)利要求1所述的輕量化網(wǎng)絡(luò)小樣本數(shù)據(jù)自動提取方法,其特征在于:
7.根據(jù)權(quán)利要求1所述的輕量化網(wǎng)絡(luò)小樣本數(shù)據(jù)自動提取方法,其特征在于:
8.根據(jù)權(quán)利要求1所述的輕量化網(wǎng)絡(luò)小樣本數(shù)據(jù)自動提取方法,其特征在于:
9.根據(jù)權(quán)利要求1所述的輕量化網(wǎng)絡(luò)小樣本數(shù)據(jù)自動提取方法,其特征在于: