本發(fā)明涉及網(wǎng)絡(luò)安全,尤其涉及一種基于java的通用數(shù)據(jù)脫敏方法及其系統(tǒng)。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)應(yīng)用的廣泛普及,個人數(shù)據(jù)的收集、存儲和處理變得日益頻繁和復(fù)雜。用戶對個人數(shù)據(jù)隱私的關(guān)注度提高,監(jiān)管機構(gòu)對數(shù)據(jù)安全的法規(guī)要求也更為嚴格。
2、傳統(tǒng)的靜態(tài)數(shù)據(jù)脫敏(如靜態(tài)字符替換)已經(jīng)不能滿足實時處理和動態(tài)應(yīng)用場景的需求。動態(tài)數(shù)據(jù)脫敏技術(shù)能夠在數(shù)據(jù)使用的同時,保護敏感信息的隱私安全,不影響數(shù)據(jù)的可用性和格式。市面上出現(xiàn)的動態(tài)脫敏存在以下一些問題:1、配置靈活性較低,維護成本高,版本迭代、數(shù)據(jù)變更時,需要交由人工自行判斷是否需要脫敏,人工需要定期維護脫敏配置,來保障敏感數(shù)據(jù)有效脫敏。2、覆蓋面窄,顆粒度不夠細,對外交互接口脫敏大部分方案是在特定接口寫入注解的形式進行脫敏,無法以接口為單位做到數(shù)據(jù)可視化下的全局脫敏。3、可用性較低,對于例如文本、樹型結(jié)構(gòu)數(shù)據(jù)會中存在敏感數(shù)據(jù)的問題,會存在漏脫,多脫,導(dǎo)致數(shù)據(jù)結(jié)構(gòu)被破壞,造成數(shù)據(jù)完全不可用的情況。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于java的通用數(shù)據(jù)脫敏方法及其系統(tǒng),從靈活和可用性角度出發(fā),針對每一個傳輸接口、適配不同使用場景、無需修改原代碼,并結(jié)合nlp語義分析技術(shù)自動對包含敏感數(shù)據(jù)接口做脫敏配置,保障全面覆蓋接口,從而實現(xiàn)更通用、簡潔、維護成本低的動態(tài)脫敏。
2、本發(fā)明采用的技術(shù)方案是:
3、一種基于java的通用數(shù)據(jù)脫敏系統(tǒng),其包括以下模塊:
4、responsebodyadvice模塊:對全系統(tǒng)接口所返回的數(shù)據(jù)進行攔截保障數(shù)據(jù)脫敏的覆蓋面;
5、elk模塊:用于對攔截數(shù)據(jù)的源信息進行記錄,實現(xiàn)全流程可溯源;
6、nlp模塊:用于對攔截數(shù)據(jù)進行文本預(yù)處理,分析并標(biāo)注含有敏感信息的數(shù)據(jù);
7、數(shù)據(jù)脫敏模塊:用于對標(biāo)注的含有敏感信息的數(shù)據(jù)進行脫敏,得到脫敏數(shù)據(jù)返回給外部調(diào)用側(cè)。
8、進一步地,源信息包括調(diào)用者信息、結(jié)果路徑、參數(shù);
9、進一步地,人工通過elk模塊對特定接口進行人工輔助脫敏,實現(xiàn)全流程可溯源。
10、進一步地,nlp模塊的文本預(yù)處理包括分詞和文本清洗操作。
11、進一步地,nlp模塊通過句法、詞法和語義三個維度的分析攔截數(shù)據(jù)。
12、進一步地,nlp模塊將標(biāo)注的含有敏感信息的數(shù)據(jù)寫入redis配置中。
13、進一步地,數(shù)據(jù)脫敏模塊通過讀取redis配置的方式獲取標(biāo)注的含有敏感信息的數(shù)據(jù)。
14、一種基于java的通用數(shù)據(jù)脫敏方法,其包括以下步驟:
15、步驟1,web瀏覽器的頁面發(fā)起請求;
16、步驟2,后端服務(wù)從數(shù)據(jù)庫讀取頁面請求所需的數(shù)據(jù);
17、步驟3,后端服務(wù)的對外接口將所需數(shù)據(jù)組裝打包形成返回數(shù)據(jù)包;
18、步驟4,responsebodyadvice模塊對全系統(tǒng)接口所返回的數(shù)據(jù)進行攔截,保障數(shù)據(jù)脫敏的覆蓋面;
19、步驟5,elk模塊對所攔截的數(shù)據(jù)包進行源信息記錄,實現(xiàn)全流程可溯源;
20、步驟6,nlp模塊利用nlp技術(shù)對攔截的返回數(shù)據(jù)包進行文本分析,標(biāo)注含有敏感信息的數(shù)據(jù);
21、步驟7,數(shù)據(jù)脫敏模塊對返回數(shù)據(jù)包被標(biāo)記的數(shù)據(jù)進行脫敏,得到脫敏數(shù)據(jù)包返回給外部調(diào)用側(cè)的web瀏覽器;
22、步驟8,web瀏覽器的頁面接收脫敏數(shù)據(jù)并使用。
23、進一步地,步驟5中源信息包括調(diào)用者信息、結(jié)果路徑、參數(shù);
24、進一步地,步驟5中后續(xù)人工通過elk模塊對特定接口進行人工輔助脫敏,實現(xiàn)全流程可溯源。
25、進一步地,步驟6中nlp模塊將標(biāo)注的含有敏感信息的數(shù)據(jù)寫入redis配置;通過讀取redis配置的方式提供給數(shù)據(jù)脫敏模塊。
26、具體地,nlp模塊對數(shù)據(jù)進行文本預(yù)處理,包括分詞和文本清洗等操作。隨后,通過句法、詞法和語義三個維度的分析,標(biāo)注可能含有敏感信息的數(shù)據(jù),并將其寫入redis配置中。最后將分析結(jié)果通過讀取redis配置的方式提供給數(shù)據(jù)脫敏模塊。
27、本發(fā)明采用以上技術(shù)方案,大大降低敏感數(shù)據(jù)泄露的可能:對市面上存在的數(shù)據(jù)脫敏進行改進,在responsebodyadvice模塊基礎(chǔ)上,增加nlp模塊。當(dāng)數(shù)據(jù)通過接口傳輸至responsebodyadvice模塊時,使用nlp模塊對數(shù)據(jù)進行文本預(yù)處理,包括分詞和文本清洗等操作。隨后,通過句法、詞法和語義三個維度的分析,標(biāo)注可能含有敏感信息的數(shù)據(jù)。這種方法顯著降低了由于人工配置不完全可能導(dǎo)致的數(shù)據(jù)泄露風(fēng)險。本發(fā)明對復(fù)雜數(shù)據(jù)的處理更具有優(yōu)勢:在處理文本、樹形結(jié)構(gòu)和多維數(shù)據(jù)的脫敏時,通常是開發(fā)者面臨的一大挑戰(zhàn),需要耗費大量時間來維護數(shù)據(jù)脫敏配置。本技術(shù)方案顯著改善了這一現(xiàn)狀,通過將復(fù)雜數(shù)據(jù)的處理交由nlp模塊進行,借助海量數(shù)據(jù)的訓(xùn)練,能夠更精準(zhǔn)地標(biāo)注復(fù)雜數(shù)據(jù)中的敏感信息。這種方法大大降低了人工維護的成本。
1.一種基于java的通用數(shù)據(jù)脫敏系統(tǒng),其特征在于:其包括以下模塊:
2.根據(jù)權(quán)利要求1所述的一種基于java的通用數(shù)據(jù)脫敏系統(tǒng),其特征在于:源信息包括調(diào)用者信息、結(jié)果路徑、參數(shù)。
3.根據(jù)權(quán)利要求1所述的一種基于java的通用數(shù)據(jù)脫敏系統(tǒng),其特征在于:人工通過elk模塊對特定接口進行人工輔助脫敏,實現(xiàn)全流程可溯源。
4.根據(jù)權(quán)利要求1所述的一種基于java的通用數(shù)據(jù)脫敏系統(tǒng),其特征在于:nlp模塊的文本預(yù)處理包括分詞和文本清洗操作。
5.根據(jù)權(quán)利要求1所述的一種基于java的通用數(shù)據(jù)脫敏系統(tǒng),其特征在于:nlp模塊通過句法、詞法和語義三個維度的分析攔截數(shù)據(jù)。
6.根據(jù)權(quán)利要求1所述的一種基于java的通用數(shù)據(jù)脫敏系統(tǒng),其特征在于:nlp模塊將標(biāo)注的含有敏感信息的數(shù)據(jù)寫入redis配置中,數(shù)據(jù)脫敏模塊通過讀取redis配置的方式獲取標(biāo)注的含有敏感信息的數(shù)據(jù)。
7.一種基于java的通用數(shù)據(jù)脫敏方法,根據(jù)權(quán)利要求1至6之一所述的一種基于java的通用數(shù)據(jù)脫敏系統(tǒng),其特征在于:方法包括以下步驟:
8.根據(jù)權(quán)利要求7所述的一種基于java的通用數(shù)據(jù)脫敏方法,其特征在于:步驟5中源信息包括調(diào)用者信息、結(jié)果路徑、參數(shù);后續(xù)人工通過elk模塊對特定接口進行人工輔助脫敏,實現(xiàn)全流程可溯源。
9.根據(jù)權(quán)利要求7所述的一種基于java的通用數(shù)據(jù)脫敏方法,其特征在于:步驟6中nlp模塊將標(biāo)注的含有敏感信息的數(shù)據(jù)寫入redis配置;通過讀取redis配置的方式提供給數(shù)據(jù)脫敏模塊。
10.根據(jù)權(quán)利要求7所述的一種基于java的通用數(shù)據(jù)脫敏方法,其特征在于:步驟6中nlp模塊對數(shù)據(jù)進行文本預(yù)處理后,通過句法、詞法和語義三個維度的分析并標(biāo)注含有敏感信息的數(shù)據(jù),并將含有敏感信息的數(shù)據(jù)寫入redis配置中;將分析結(jié)果通過讀取redis配置的方式提供給數(shù)據(jù)脫敏模塊。