本發(fā)明是一種投入決定的安全性可定義的基于數(shù)據(jù)圖譜、信息圖譜和知識圖譜的資源安全保護方法,將以數(shù)據(jù)、信息和知識等形態(tài)的資源根據(jù)資源存儲代價和資源挖掘代價的比較確定應在哪一層圖譜存儲架構上進行存儲。主要用于對數(shù)據(jù)、信息和知識等資源的隱私性和安全性維護,屬于分布式計算和軟件工程學技術交叉領域。
背景技術:
:大數(shù)據(jù)是進幾年來科技界的高頻詞匯,然而大數(shù)據(jù)時代下隱私保護的缺失也成為人們面臨的嚴峻挑戰(zhàn)。資源的收集和使用會產(chǎn)生價值,然而數(shù)據(jù)隱私的保護卻尚未得到管理。資源維護必須保證資源不會受到未經(jīng)授權情況下對資源的使用、篡改、丟失、銷毀以及其他情況的發(fā)生。本發(fā)明提出的一種投入決定的安全性可定義的基于數(shù)據(jù)圖譜、信息圖譜和知識圖譜的資源安全保護方法的關鍵技術在于對在不同層次圖譜上存儲資源時量化資源的存儲代價和搜索代價,從而計算出資源在不同圖譜上存儲時的安全系數(shù)。在為資源擁有者提供資源保護服務時,根據(jù)資源擁有者的投入對其待保護的資源進行合理組織和存儲。技術實現(xiàn)要素:技術問題:本發(fā)明的目的是提供一種對數(shù)據(jù)(datadik)、信息(informationdik)和知識(knowledgedik)等形態(tài)的資源的原始表述的自然語言的機器理解、自動處理、自動綜合和自動分析方法,用于解決對不同類型、不同規(guī)模資源的合理存儲,提高資源安全系數(shù),為資源提供主動防護,降低被攻擊者獲取的概率。技術方案:本發(fā)明是一種投入決定的安全性可定義的基于數(shù)據(jù)圖譜、信息圖譜和知識圖譜的資源安全保護方法,從應對自動增量式結合經(jīng)驗知識和減少人工專家交互負擔等兩個方面考慮,從資源建模、資源處理、處理優(yōu)化和資源管理等角度進行研究,基于對現(xiàn)有知識圖譜(knowledgegraph)概念的拓展提出了一種三層可自動抽象調(diào)整的解決架構。這個架構包括:數(shù)據(jù)圖譜(datagraphdik)、信息圖譜(informationgraphdik)和知識圖譜(knowledgegraphdik)等三個層面?;诓煌瑢哟蔚膱D譜架構存儲資源擁有者需要保護的資源,根據(jù)資源擁有者的投入確定資源維護的安全系數(shù)。體系結構圖1給出了投入決定的安全性可定義的基于數(shù)據(jù)圖譜、信息圖譜和知識圖譜的資源安全保護方法的流程圖,獲取到用戶的資源保護需求后,計算在不同資源空間上搜索的代價和存儲代價,根據(jù)用戶投入確定最終方案。表1所示為對datadik、intormationdik和knowledgedik等形態(tài)的資源以及對應圖譜層次的介紹。表2所示為單位資源不同類型之間的轉(zhuǎn)換代價。下面我們給出datagraphdik,informationgraphdik和knowledgegraphdik的具體說明:datagraphdik:datagraphdik:=collection{array,list,stack,queue,tree,graph}.datagraphdik是各種數(shù)據(jù)結構包括數(shù)組(array)、鏈表(list)、棧(stack)、隊列(queue)、樹(tree)和圖(graph)等的集合(collection)。datagraphdik只能對圖譜上表示的datadik進行靜態(tài)分析,無法分析和預測datadik的動態(tài)變化。informationgraphdik:informationgraphdik:=combination{relateddatadik}。informationgraphdik是相互關聯(lián)的datadik(relateddatadik)的組合(combination),informationdik是通過datadik和datadik組合之后的上下文傳達的,經(jīng)過概念映射和相關關系組合之后的適合分析和解釋的信息。在informationgraphdik上進行數(shù)據(jù)清洗,消除冗余數(shù)據(jù),根據(jù)結點之間的交互度進行初步抽象,提高設計的內(nèi)聚性。knowledgegraphdik:knowledgegraphdik:=collection{statisticrules}。knowledgegraphdik實質(zhì)是語義網(wǎng)絡和由informationdik總結出的統(tǒng)計規(guī)則(statisticrules)的集合(collection)。knowledgegraphdik蘊含豐富的語義關系,在knowledgegraphdik上能通過信息推理和實體鏈接提高knowledgegraphdik的邊密度和結點密度,knowledgegraphdik的無結構特性使得其自身可以無縫鏈接。信息推理需要有相關關系規(guī)則的支持,這些規(guī)則可以由人手動構建,但往往耗時費力,得到復雜關系中的所有推理規(guī)則更加困難。使用路徑排序算法將每個不同的關系路徑作為一維特征,通過在knowledgegraphdik中構建大量的關系路徑來構建關系分類的特征向量和關系分類器來提取關系,本發(fā)明將搜索目標資源集合定義為ipr:={ipr1,ipr2,ipr3},ipr的類型集合為x={x1,x2,x3},每種資源的規(guī)模為n={n1,n2,n3},資源空間為sor={sor1,sor2,sor3},sor的類型集合為y={y1,y2,y3},每種資源的規(guī)模為m={m1,m2,m3},假定ipr中所有類型資源已在當前資源存儲空間(sor)以任意一種存儲方案存儲完畢。類型變量集合為z={datadik,informationdik,knowledgedik},對不同類型變量進行賦值,datadik:=1,informationdik:=2,knowledgedik:=3。表1.資源類型的漸進形式表2.ipr中單位資源類型轉(zhuǎn)換的原子代價datadikinformationdikknowledgedikx1c11c12c13x2c21c22c23x3c31c32c33標注:c11:從x1轉(zhuǎn)移到datadik的代價;c12:從x1轉(zhuǎn)移到informationdik的代價;c13:從x1轉(zhuǎn)移到knowledgedik的代價;c21:從x2轉(zhuǎn)移到datadik的代價;c22:從x2轉(zhuǎn)移到informationdik的代價;c23:從x2轉(zhuǎn)移到knwledgedik的代價;c31:從x3轉(zhuǎn)移到datadik的代價;c32:從x3轉(zhuǎn)移到informationdik的代價;c33:從x3轉(zhuǎn)移到knowledgedik的代價。表3.sor中單位資源類型轉(zhuǎn)換的原子代價標注:c’11:從datadik轉(zhuǎn)移到y(tǒng)1的代價;c’12:從informationdik轉(zhuǎn)移到y(tǒng)1的代價;c’13:從knowledgedik轉(zhuǎn)移到y(tǒng)1的代價;c’21:從datadik轉(zhuǎn)移到y(tǒng)2的代價;c’22:從informationdik轉(zhuǎn)移到y(tǒng)2的代價;c’23:從knwledgedik轉(zhuǎn)移到y(tǒng)2的代價;c’31:從datadik轉(zhuǎn)移到y(tǒng)3的代價;c’32:從informationdik轉(zhuǎn)移到y(tǒng)3的代價;c’33:從knowledgedik轉(zhuǎn)移到y(tǒng)3的代價。有益效果:本發(fā)明提出了一種基于數(shù)據(jù)圖譜、信息圖譜和知識圖譜的安全性驅(qū)動的分類型資源存儲方法,主要用于解決對于以datadik,informaitiondik和knowledgedik形態(tài)存在的資源存儲和資源保護等問題。通過使用本發(fā)明提出的方法可以實現(xiàn)對不同類型資源的合理組織和存儲,根據(jù)資源擁有者的投入決定資源的安全系數(shù)。該方法具有如下優(yōu)點:1)對資源類型的劃分;將資源劃分為datadik、informationdik和knowledgedik,便于挖掘資源之間的聯(lián)系,從datadik經(jīng)過抽象得到informationdik、knowledgedik,從knowledgedik進行推理得到datadik、informationdik;2)允許跨層存儲資源僅僅通過資源類型無法判斷出資源應存儲在哪一類圖譜上,本發(fā)明提出資源存儲代價和搜索代價的計算,根據(jù)代價和安全系數(shù)確定資源的存儲位置;3)資源擁有者投入驅(qū)動基于datagraphdik,informationgraphdik和knowledgegraphdik的代價計算的分類型資源存儲方法,提出在不同圖譜上存儲代價和安全系數(shù)的衡量,通過參數(shù)化存儲過程和搜索過程,確定安全系數(shù)最高的資源存儲框架,根據(jù)資源擁有者的投入確定在哪一層圖譜上存儲其需要保護的資源。附圖說明圖1是一種投入決定的安全性可定義的基于數(shù)據(jù)圖譜、信息圖譜和知識圖譜的資源安全保護方法的體系結構流程圖。具體實施方式投入決定的安全性可定義的基于數(shù)據(jù)圖譜、信息圖譜和知識圖譜的資源安全保護方法,其特征在于對以datadik,informaitiondik和knowledgedik形態(tài)存在的資源根據(jù)存儲代價和安全系數(shù)進行合理的組織和存儲,僅僅通過資源類型無法判斷資源應存儲在哪一層圖譜上。具體實現(xiàn)步驟為:步驟1)對應于圖1中操作001,對x中每個元素依次取z中的值,形成組合情形x={x1i,x2j,x3k},i,j,k∈{1,2,3};步驟2)對應于圖1中操作002,對每種情形,根據(jù)公式1計算ipr中資源當前情形向每種情形轉(zhuǎn)移的代價(costmt1):costmt1ijk=c1i*n1+c2j*n2+c3k*n3,(1)i,j,k∈{1,2,3}步驟3)對應于圖1中操作003,對y中每個元素依次取z中的值,形成組合情形y={y1m,y2n,y3p},m,n,p∈{1,2,3};步驟4)對應于圖1中操作004,根據(jù)公式2計算在sor中搜索ipr中資源所要花費的計算代價(cost計算):cost計算=λ*m+(1-λ)*αm*βc(xli,x2j,x3p→y1m,y2n,y3p)(2)其中c(x1i,x2j,x3p->y1m,y2n,y3p)為在sor中查找ipr所要花費的代價,α和β分別表示圖譜規(guī)模和資源類型轉(zhuǎn)換代價占cost計算的權重,均可通過數(shù)據(jù)訓練得出,λ表示資源是否需要轉(zhuǎn)換不同類型,若需要轉(zhuǎn)換,則用0表示,否則,用1表示;步驟5)對應于圖1中操作005,對y中每種情形,根據(jù)公式3計算y中每種資源形態(tài)向sor中資源當前情形轉(zhuǎn)移的代價(costmt2):costmt2mnp=c′m1*m1+c′n2*m2+c′p3*m3,(3)m,n,p∈{1,2,3}步驟6)對應于圖1中操作006,根據(jù)步驟2、4、5得到的costmt1ijk、costmt2mnp和cost計算,根據(jù)公式4計算從當前ipr向x轉(zhuǎn)移的代價和y中資源向sor狀態(tài)轉(zhuǎn)移的代價和計算代價的總和(total_cost):total_cost=costmt1ijk+costmt2mnp+cost計算(4)步驟7)根據(jù)步驟5得到的在不同圖譜上搜索資源的cost計算,由高到低進行排序,將cost計算最高的方案定為最優(yōu)方案,設定最優(yōu)方案安全系數(shù)為100,并根據(jù)公式5計算當前方案和其他方案資源的安全性系數(shù)st:其中cost計算i表示方案i的計算代價,max(cost計算)表示最優(yōu)方案的計算代價;步驟8)對應于圖1中操作007,獲取用戶預期投入(inve0)。本發(fā)明設定一個總代價(total_cost0),對應于圖1中操作008,將不同情形下total_cost的值與total_cost0進行比較,并將對應情形所需用戶投入(inve)和inve0作比較,判斷是否滿足條件“total_costi>total_cost0&invei<inve0”。009當total_cost大于total_cost0時,令total_cost0等于當前total_cost,若total_cost小于total_cost0時,執(zhí)行下一步操作,inve的計算方法如公式5所示:inve=γ*total_cost(5)其中γ表示單位代價所需用戶投入,可通過數(shù)據(jù)訓練得出;步驟9)對應于圖1中操作010,判斷當x或y中的組合是否窮舉完畢。若沒有窮舉完畢,返回步驟1繼續(xù)窮舉。若窮舉完,對應于圖1中操作011,按照當前total_cost0對應的的方案調(diào)整ipr和sor中資源的類型;步驟10)輸出調(diào)整后方案的安全系數(shù)。當前第1頁12