欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種全鏈路數據溯源方法、裝置及電子設備與流程

文檔序號:40603006發(fā)布日期:2025-01-07 20:43閱讀:5來源:國知局
一種全鏈路數據溯源方法、裝置及電子設備與流程

本技術涉及數據處理,尤其涉及一種全鏈路數據溯源方法、裝置及電子設備。


背景技術:

1、隨著信息技術的快速發(fā)展,數據已經成為企業(yè)和組織最重要的資產之一。然而,接踵而至的是數據泄露、非法訪問等安全問題。在這些情況下,對數據進行高效、準確地進行數據溯源變得至關重要。

2、相關技術中,通常利用網絡流量、日志數據等的訪問時間、操作語句特征、訪問的數據內容等信息進行鏈路關聯。然而,在微服務架構中,某個服務請求可能跨多個應用層網絡協議。示例性的,用戶a通過超文本傳輸協議(hypertext?transfer?protocol,http)協議訪問web應用,而web應用在通過mysql協議訪問后端的mysql數據庫。位于同一協議內可以通過tcp層請求-響應機制關聯,而不同應用層協議之間無法通過tcp層關聯。因此,若是通過時間先后順序、數據內容相關度進行鏈路關聯,在跨協議和高并發(fā)的場景下,數據匹配和溯源的準確率較低。


技術實現思路

1、本技術實施例提供了一種全鏈路數據溯源方法、裝置及電子設備,用以實現在高并發(fā)、大流量的場景下進行數據溯源和匹配,提高數據溯源的準確率以及匹配速度。

2、第一方面,本技術實施例提供了一種全鏈路數據溯源方法,所述方法包括:

3、將獲取到的網絡流量數據劃分為第一網絡流量數據段和第二網絡流量數據段;其中,第一網絡流量數據段和第二網絡流量數據段各自具有目標標識信息;

4、分別提取第一網絡流量數據段中第一窗口和第二網絡流量數據段中第二窗口的各個特征數據;其中,特征數據用于表征所述網絡流量數據段的操作行為;

5、基于第一窗口和第二窗口中的各個特征數據,構建網絡鏈路記錄,并將網絡鏈路記錄保存至數據溯源數據庫;其中,網絡鏈路記錄表征目標網絡流量數據在網絡節(jié)點中的流向

6、基于數據溯源數據庫,對待溯源的敏感數據進行數據溯源,獲得數據溯源結果。

7、通過上述方法,利用多個布隆過濾器實現網絡鏈路記錄重復次數的檢測,溯源準確率高、匹配速度快,避免了傳統流量擬合高并發(fā)場景下匹配準確率低的問題。

8、在一種可選的實施方式中,基于第一窗口和第二窗口中的各個特征數據,構建網絡鏈路記錄,并將網絡鏈路記錄保存至數據溯源數據庫,包括:

9、根據第一窗口對應的m個特征數據以及第二窗口對應的k個特征數據,兩兩交叉生成網絡鏈路記錄標識;

10、根據各個網絡鏈路記錄標識的特征相似度和/或時間關聯度,獲得網絡鏈路記錄,并保存至所述數據溯源數據庫。

11、通過上述方法,針對網絡鏈路記錄標識進行哈希運算,能夠將網絡鏈路記錄的出現次數依次保存在各個布隆過濾器中,實現了網絡鏈路記錄的保存,便于進行數據溯源。

12、在一種可選的實施方式中,基于所述數據溯源數據庫,對待溯源的敏感數據進行數據溯源,獲得數據溯源結果,包括:

13、根據待溯源網絡流量數據對應的網絡鏈路記錄標識,確定網絡鏈路記錄標識的出現次數是否被目標布隆過濾器記錄;其中,所述目標布隆過濾器是根據網絡鏈路記錄匹配概率確定的;

14、若是,則獲得待溯源網絡流量數據對應的溯源結果,并輸出待溯源網絡流量數據對應的網絡鏈路記錄;

15、若否,則依次從第一個布隆過濾器開始,確定網絡鏈路記錄標識的出現次數是否被記錄,直至待溯源網絡流量數據的在每一個布隆過濾器中的出現次數之和大于預設閾值,輸出待溯源網絡流量數據對應的網絡鏈路記錄。

16、通過上述方法,根據網絡鏈路記錄匹配概率,能夠直接從對應位置的布隆過濾器中對網絡鏈路記錄進行查找,在未查找到網絡鏈路記錄時,能夠對網絡鏈路記錄進行保存。

17、在一種可選的實施方式中,在獲得待溯源網絡流量數據對應的溯源結果之后,還包括:

18、對待溯源網絡流量數據進行敏感數據提取,獲得敏感數據的數量;

19、基于敏感數據的數量以及不同敏感數據項數量,獲得更新后的網絡鏈路記錄匹配概率。

20、通過上述的方法,根據敏感數據進行網絡鏈路記錄匹配,并更新網絡鏈路記錄匹配概率,進一步提高了數據溯源的準確率。

21、在一種可選的實施方式中,在對待溯源網絡流量數據進行敏感數據提取,獲得敏感數據的數量之前,還包括:

22、分別建立多個布隆過濾器;其中,多個布隆過濾器用于各自用于管理不同類別的敏感數據;

23、采用多個布隆過濾器,對不同敏感數據各自對應的數據標識進行記錄。

24、通過上述的方法,建立不同的布隆過濾器,實現了對不同類型的敏感數據的保存。

25、第二方面,本技術提供了一種全鏈路數據溯源裝置,所述裝置包括:

26、處理模塊,將獲取到的網絡流量數據劃分為第一網絡流量數據段和第二網絡流量數據段;其中,第一網絡流量數據段和第二網絡流量數據段各自具有目標標識信息;

27、提取模塊,分別提取第一網絡流量數據段中第一窗口和第二網絡流量數據段中第二窗口的各個特征數據;其中,特征數據用于表征所述網絡流量數據段的操作行為;

28、構建模塊,用于基于第一窗口和第二窗口中的各個特征數據,構建網絡鏈路記錄,并將網絡鏈路記錄保存至數據溯源數據庫其中,網絡鏈路記錄表征目標網絡流量數據在網絡節(jié)點中的流向;

29、溯源模塊,用于基于數據溯源數據庫,對待溯源的敏感數據進行數據溯源,獲得數據溯源結果。

30、在一種可選的實施方式中,在基于第一窗口和第二窗口中的各個特征數據,構建網絡鏈路記錄,并將網絡鏈路記錄保存至數據溯源數據庫時,所述構建模塊具體用于:

31、根據第一窗口對應的m個特征數據以及第二窗口對應的k個特征數據,兩兩交叉生成網絡鏈路記錄標識;

32、根據各個網絡鏈路記錄標識的特征相似度和/或時間關聯度,獲得網絡鏈路記錄,并保存至所述數據溯源數據庫。

33、在一種可選的實施方式中,在基于所述數據溯源數據庫,對待溯源的敏感數據進行數據溯源,獲得數據溯源結果時,所述溯源模塊具體用于:

34、根據待溯源網絡流量數據對應的網絡鏈路記錄標識,確定網絡鏈路記錄標識的出現次數是否被目標布隆過濾器記錄;其中,所述目標布隆過濾器是根據網絡鏈路記錄匹配概率確定的;

35、若是,則獲得待溯源網絡流量數據對應的溯源結果,并輸出待溯源網絡流量數據對應的網絡鏈路記錄;

36、若否,則依次從第一個布隆過濾器開始,確定網絡鏈路記錄標識的出現次數是否被記錄,直至待溯源網絡流量數據的在每一個布隆過濾器中的出現次數之和大于預設閾值,輸出待溯源網絡流量數據對應的網絡鏈路記錄。

37、在一種可選的實施方式中,在獲得所述待溯源網絡流量數據對應的溯源結果之后,所述溯源模塊還用于:

38、對待溯源網絡流量數據進行敏感數據提取,獲得敏感數據的數量;

39、基于敏感數據的數量以及不同敏感數據項數量,獲得更新后的網絡鏈路記錄匹配概率。

40、在一種可選的實施方式中,在對待溯源網絡流量數據進行敏感數據提取,獲得敏感數據的數量之前,所述構建模塊還用于:

41、分別建立多個布隆過濾器;其中,多個布隆過濾器用于各自用于管理不同類別的敏感數據;

42、采用多個布隆過濾器,對不同敏感數據各自對應的數據標識進行記錄。

43、第三方面,本技術提供了一種電子設備,其包括處理器和存儲器,其中,所述存儲器存儲有程序代碼,當所述程序代碼被所述處理器執(zhí)行時,使得所述處理器執(zhí)行上述第一方面所述的全鏈路數據溯源方法的步驟。

44、第四方面,本技術提供了一種計算機可讀存儲介質,其包括程序代碼,當所述程序代碼在電子設備上運行時,所述程序代碼用于使所述電子設備執(zhí)行上述第一方面所述的全鏈路數據溯源方法的步驟。

45、第五方面,本技術提供了一種計算機程序產品,所述計算機程序產品在被計算機調用時,使得所述計算機執(zhí)行如第一方面所述的全鏈路數據溯源方法步驟。

46、此外,本技術的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者,通過實施本技術而了解。本技術的目的和其他優(yōu)點可通過在所寫的說明書、權利要求書、以及附圖中所特別指出的結構來實現和獲得。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
鲜城| 监利县| 琼海市| 滨州市| 鸡东县| 武川县| 织金县| 孟连| 杭州市| 双柏县| 太和县| 新乡市| 镇原县| 清苑县| 东兴市| 饶平县| 扬中市| 巢湖市| 镇原县| 思南县| 彭水| 绿春县| 霞浦县| 峨山| 福建省| 洪泽县| 阿拉善右旗| 图木舒克市| 灵山县| 鸡东县| 香格里拉县| 锡林浩特市| 威海市| 岳普湖县| 和平区| 双牌县| 丹棱县| 商水县| 嘉鱼县| 祁门县| 镇江市|