一種使用代理云進(jìn)行數(shù)據(jù)拷貝留痕的方法
【專利摘要】本發(fā)明公開了一種使用代理云進(jìn)行數(shù)據(jù)拷貝留痕的方法。本發(fā)明在文件上傳時(shí),用戶在本地將待上傳文件分為多個(gè)數(shù)據(jù)塊,并將各數(shù)據(jù)塊標(biāo)識(shí)發(fā)送給代理云,代理云為各其分配云存儲(chǔ)位置后,用戶端進(jìn)行文件上傳,上傳完畢后將數(shù)據(jù)塊的連接順序通過(guò)安全通道發(fā)送給代理云,代理云在本地保存文件上傳日志、包含文件上傳者和數(shù)據(jù)塊連接順序的數(shù)據(jù)元;當(dāng)有拷貝請(qǐng)求時(shí),將所請(qǐng)求文件的數(shù)據(jù)元拷貝到對(duì)應(yīng)用戶數(shù)據(jù)區(qū),并在本地保存文件拷貝日志;當(dāng)有文件下載請(qǐng)求時(shí),代理云在其用戶數(shù)據(jù)區(qū)查找到對(duì)應(yīng)的數(shù)據(jù)元并發(fā)送給請(qǐng)求端,請(qǐng)求端基于其進(jìn)行下載后將各數(shù)據(jù)塊拼接為完整文件,同時(shí)代理云在本地保存文件下載日志。本發(fā)明能實(shí)現(xiàn)拷貝留痕,進(jìn)行大數(shù)據(jù)行為追蹤。
【專利說(shuō)明】
一種使用代理云進(jìn)行數(shù)據(jù)拷貝留痕的方法
技術(shù)領(lǐng)域
[0001]本發(fā)明屬于移動(dòng)互聯(lián)網(wǎng)領(lǐng)域,特別涉及一種將數(shù)據(jù)通過(guò)代理云進(jìn)行傳輸和拷貝,通過(guò)該方法可以實(shí)現(xiàn)拷貝留痕,進(jìn)行大數(shù)據(jù)行為追蹤。
【背景技術(shù)】
[0002]數(shù)據(jù)上傳和下載是信息時(shí)代數(shù)據(jù)流通的主要方式,隨著互聯(lián)網(wǎng)的興起,數(shù)據(jù)的急劇增加,云存儲(chǔ)逐漸成為數(shù)據(jù)存儲(chǔ)的主流,人們對(duì)于數(shù)據(jù)拷貝的安全性、可靠性以及可擴(kuò)展性等方面提出了越來(lái)越高的要求,傳統(tǒng)拷貝技術(shù)的弊端逐漸顯現(xiàn),而新技術(shù)的發(fā)展應(yīng)用總是需要時(shí)間的考驗(yàn)。隨著技術(shù)的發(fā)展,出現(xiàn)了各種各樣的拷貝技術(shù)。廣泛使用的阿里云、百度云等云,通過(guò)為用戶分配云空間,可以根據(jù)用戶需求進(jìn)行定制,雖然在一定程度上滿足了用戶對(duì)于存儲(chǔ)空間和成本的需求,但是其數(shù)據(jù)的安全性和保密性都存在很大的風(fēng)險(xiǎn),一旦數(shù)據(jù)被竊取,很難對(duì)數(shù)據(jù)所有者進(jìn)行判斷,只能通過(guò)知識(shí)產(chǎn)權(quán)局等部門對(duì)所有者進(jìn)行判斷,維權(quán)困難。廣為人知的SSH(安全外殼協(xié)議)技術(shù),雖然能實(shí)現(xiàn)數(shù)據(jù)拷貝的便利性,但是沒(méi)有將元數(shù)據(jù)同數(shù)據(jù)分離,這樣進(jìn)行的數(shù)據(jù)拷貝速度慢,當(dāng)存在大量數(shù)據(jù)拷貝時(shí)候會(huì)花費(fèi)大量處理時(shí)間。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的發(fā)明目的在于:針對(duì)上述存在的問(wèn)題,提供一種方便安全、簡(jiǎn)單快捷的利用代理云實(shí)現(xiàn)拷貝留痕,進(jìn)行大數(shù)據(jù)行為追蹤的方法。
[0004]本發(fā)明的使用代理云進(jìn)行數(shù)據(jù)拷貝留痕的方法,包括下列步驟:
[0005]文件上傳:
[0006]步驟al:代理云收到文件上傳請(qǐng)求時(shí),對(duì)文件上傳者進(jìn)行身份認(rèn)證,若通過(guò),則進(jìn)入步驟1-2;否則,拒絕;
[0007]步驟a2:文件上傳者通過(guò)本地客戶端將待上傳文件碎片化,得到多個(gè)數(shù)據(jù)塊,并將各數(shù)據(jù)塊的分塊標(biāo)識(shí)發(fā)送給代理云;
[0008]步驟a3:代理云為每個(gè)數(shù)據(jù)塊分配云存儲(chǔ)位置并發(fā)送給文件上傳者;
[0009]步驟a4:文件上傳者基于所接收的云存儲(chǔ)位置對(duì)各數(shù)據(jù)塊進(jìn)行上傳,上傳完成后,將各數(shù)據(jù)塊的連接順序通過(guò)安全信道傳輸?shù)酱碓疲?br>[0010]步驟a5:代理云在本地為待上傳文件設(shè)置文件日志區(qū),并將上傳日志存入待上傳文件的文件日志區(qū),所述文件上傳日志包括:各數(shù)據(jù)塊的開始上傳時(shí)間、上傳結(jié)束時(shí)間以及文件上傳者;同時(shí)將文件上傳者、數(shù)據(jù)塊的連接順序和云存儲(chǔ)位置記錄到待上傳文件的元數(shù)據(jù)中,所述元數(shù)據(jù)保存在代理云上;
[0011]文件拷貝:
[0012]步驟bl:代理云收到文件拷貝請(qǐng)求時(shí),對(duì)拷貝請(qǐng)求者進(jìn)行身份認(rèn)證,若通過(guò),則執(zhí)行步驟b2;否則,拒絕;
[0013]步驟b2:代理云收將請(qǐng)求文件的元數(shù)據(jù)拷貝到拷貝請(qǐng)求者在代理云上的用戶數(shù)據(jù)區(qū),并將文件拷貝日志存入請(qǐng)求文件的文件日志區(qū),所述文件拷貝日志包括:拷貝請(qǐng)求者、請(qǐng)求文件、請(qǐng)求文件的文件上傳者;
[0014]文件下載:
[0015]步驟cl:代理云收到文件下載請(qǐng)求時(shí),對(duì)下載請(qǐng)求者進(jìn)行身份認(rèn)證,若通過(guò),則執(zhí)行步驟b2;否則,拒絕;
[0016]步驟c2:代理云在下載請(qǐng)求者的用戶數(shù)據(jù)區(qū)查找請(qǐng)求文件的元數(shù)據(jù),若不存在,則下載失敗;否則將所查找的元數(shù)據(jù)發(fā)送給下載請(qǐng)求者;
[0017]步驟c3:下載請(qǐng)求者通過(guò)本地客戶端對(duì)所接收的元數(shù)據(jù)進(jìn)行解析,獲取請(qǐng)求文件的各數(shù)據(jù)塊的云存儲(chǔ)位置并下載;同時(shí)代理云將問(wèn)卷下載日志存入請(qǐng)求文件的文件日志區(qū),所述下文件日志區(qū)包括:下載請(qǐng)求者、請(qǐng)求文件、請(qǐng)求文件的文件上傳者、各數(shù)據(jù)塊的開始下載時(shí)間和下載結(jié)束時(shí)間;
[0018]步驟c4:并基于元數(shù)據(jù)中的數(shù)據(jù)塊的連接順序?qū)ο螺d的數(shù)據(jù)塊進(jìn)行拼接,得到完整的請(qǐng)求文件。
[0019]由于采用了上述技術(shù)方案,本發(fā)明的有益效果是:
[0020](I)現(xiàn)有的云存儲(chǔ)技術(shù)雖然有設(shè)備獨(dú)立、成本低、量身定制等優(yōu)點(diǎn),然而,企業(yè)和個(gè)人將大量的數(shù)據(jù)轉(zhuǎn)移到云存儲(chǔ),在很大程度上存在著數(shù)據(jù)丟失、竊取和數(shù)據(jù)版權(quán)等問(wèn)題;而在本發(fā)明中,在使用代理云進(jìn)行數(shù)據(jù)傳輸、拷貝、以及下載時(shí),數(shù)據(jù)在用戶和云之間傳輸?shù)倪^(guò)程中,會(huì)在中間的代理云上留下數(shù)據(jù)流動(dòng)痕跡,從而當(dāng)數(shù)據(jù)被竊取之后可以通過(guò)數(shù)據(jù)流動(dòng)痕跡追蹤到數(shù)據(jù)竊取者,確保數(shù)據(jù)安全不被非法使用。
[0021](2)本發(fā)明在通過(guò)代理云進(jìn)行數(shù)據(jù)拷貝留痕技術(shù)中,代理云提供一種取證的角色。當(dāng)出現(xiàn)版權(quán)糾紛時(shí),可以通過(guò)數(shù)據(jù)流動(dòng)痕跡(代理云保存的各文件的日志文件所記錄的相關(guān)信息)追蹤到數(shù)據(jù)的源,判斷出數(shù)據(jù)所有者,從而有效解決數(shù)據(jù)版權(quán)糾紛問(wèn)題。
[0022](3)本發(fā)明通過(guò)代理云進(jìn)行數(shù)據(jù)拷貝留痕,在代理云上留下的大量數(shù)據(jù)流通訪問(wèn)痕跡,能幫助數(shù)據(jù)管理人員實(shí)現(xiàn)用戶行為跟蹤,從而對(duì)這些數(shù)據(jù)進(jìn)行大數(shù)據(jù)分析,更好的服務(wù)大眾。
[0023](4)傳統(tǒng)拷貝技術(shù)只能實(shí)現(xiàn)單云拷貝,拷貝的是整個(gè)數(shù)據(jù),速度慢;而本發(fā)明通過(guò)代理云進(jìn)行拷貝只需要拷貝元數(shù)據(jù),可擴(kuò)展性高,且在進(jìn)行數(shù)據(jù)下載和上傳時(shí)通過(guò)多個(gè)云實(shí)現(xiàn),速度更快。
【附圖說(shuō)明】
[0024]圖1是本發(fā)明的過(guò)程示意圖;
[0025]圖2是文件D的上傳流程圖;
[0026]圖3是用戶拷貝文件D的流程圖;
[0027]圖4是用戶下載文件D的流程圖。
【具體實(shí)施方式】
[0028]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合實(shí)施方式和附圖,對(duì)本發(fā)明作進(jìn)一步地詳細(xì)描述。
[0029]參見圖1,云用戶(文件所有者OWNER、對(duì)文件進(jìn)行拷貝和下載的使用者USER)通過(guò)代理云(AgentCloud)可以實(shí)現(xiàn)文件上傳、下載等,所上傳的文件的各數(shù)據(jù)塊(D1, D2,‘"Dm)分別存儲(chǔ)在 AgentCloud 所分配的不同數(shù)據(jù)云(Cloudi,Cloud2,......,CloudnOlc3AgentCloud
用于處理云用戶的文件上傳請(qǐng)求、文件拷貝請(qǐng)求以及文件下載請(qǐng)求等,為每個(gè)上傳文件設(shè)置一個(gè)文件日志區(qū),用于保存上傳文件的文件日志(記錄對(duì)文件的相關(guān)操作信息:文件上傳日志、文件拷貝日志、文件下載日志等),以及為每個(gè)云用戶設(shè)置一個(gè)用戶數(shù)據(jù)區(qū),用于記錄云用戶對(duì)數(shù)據(jù)的操作信息。
[0030](I )0WNER將文件D上傳到云的過(guò)程參見圖2:
[0031]①OWNER通過(guò)本地客戶端向AgentCloud發(fā)出上傳文件請(qǐng)求,若OWNER已進(jìn)行用戶登錄,貝IjAgentCloud直接接受上傳文件請(qǐng)求;否則發(fā)起對(duì)OWNER的身份認(rèn)證過(guò)程(例如通過(guò)單點(diǎn)登錄進(jìn)行身份認(rèn)證),若認(rèn)證通過(guò),則接受(執(zhí)行后續(xù)步驟);否則,拒絕上傳請(qǐng)求;
[0032]②OWNER通過(guò)本地客戶端將文件D碎片化,將文件D分成多個(gè)(D1, D2,......,Dm)數(shù)據(jù)塊,同時(shí)將文件分塊信息(文件D的分塊個(gè)數(shù)、各數(shù)據(jù)塊標(biāo)識(shí))發(fā)送給AgentCloud ;
[0033]③AgentCloud為文件D的各數(shù)據(jù)塊分配云存儲(chǔ)位置并返回給OWNER所在客戶端;同時(shí)AgentCloud在本地為文件D創(chuàng)建一個(gè)文件日志區(qū),用于存放文件D的相關(guān)日志,本實(shí)施方式中,AgentCloud在本地創(chuàng)建一個(gè)日志文件夾H,用于存放文件D的相關(guān)日志。
[0034]④OWNER通過(guò)本地客戶端將數(shù)據(jù)塊D1,D2,......,Dm按照分配的云存儲(chǔ)位置上傳到各個(gè)云,上傳成功后,通過(guò)安全信道將文件D各數(shù)據(jù)塊的連接順序傳輸?shù)紸gentCloud。
[0035]⑤AgentCloud在日志文件夾H寫入一個(gè)文件上傳日志,該文件上傳日志記錄的信息包括:文件D的上傳者OWNER、文件D各數(shù)據(jù)塊的開始上傳時(shí)間和上傳結(jié)束時(shí)間。同時(shí)將文件上傳者、文件標(biāo)識(shí)、文件數(shù)據(jù)塊的云存儲(chǔ)位置、各數(shù)據(jù)塊的連接順序等保存到文件D的元數(shù)據(jù)K中,其中元數(shù)據(jù)K保存在AgentCloud本地。
[0036]⑥文件D上傳成功。
[0037](2)其他云用戶USER通過(guò)代理云進(jìn)行數(shù)據(jù)拷貝過(guò)程,參見圖3:
[0038]①USER通過(guò)本地客戶端向AgentCloud發(fā)出拷貝文件D的請(qǐng)求,若當(dāng)前USER已進(jìn)行用戶登錄,則AgentCloud直接接受拷貝文件請(qǐng)求;否則發(fā)起對(duì)USER的身份認(rèn)證過(guò)程,若認(rèn)證通過(guò),則接受;否則AgentCloud返回拒絕服務(wù)信息給USER,拒絕該用戶對(duì)數(shù)據(jù)進(jìn)行拷貝;
[0039]②當(dāng)USER通過(guò)身份認(rèn)證之后,AgentCloud會(huì)將文件D的元數(shù)據(jù)K拷貝到USER的用戶數(shù)據(jù)區(qū),同時(shí),AgentCloud在日志文件夾H中寫入一個(gè)文件拷貝日志,該文件拷貝日志記錄的信息包括:拷貝請(qǐng)求者(USER)、請(qǐng)求文件(D)、文件D的OWNER;
[0040]③文件拷貝完成。
[0041](3)其他云用戶USER通過(guò)代理云進(jìn)行數(shù)據(jù)下載的過(guò)程,參見圖4:
[0042]①USER通過(guò)本地客戶端向AgentCloud發(fā)出請(qǐng)求下載文件D的請(qǐng)求,若當(dāng)前USER已進(jìn)行用戶登錄,則AgentCloud直接接受下載文件請(qǐng)求;否則發(fā)起對(duì)USER的身份認(rèn)證過(guò)程,若認(rèn)證通過(guò),則接受;否則拒絕;
[0043]②AgentCloud從當(dāng)前USER的用戶數(shù)據(jù)區(qū)查找與文件D對(duì)應(yīng)的元數(shù)據(jù)K,如果元數(shù)據(jù)K不存在,則向當(dāng)前USER返回下載失敗;否則,取出元數(shù)據(jù)K并發(fā)送給當(dāng)前USER;
[0044]③USER通過(guò)本地客戶端對(duì)元數(shù)據(jù)K進(jìn)行解析,獲取各數(shù)據(jù)塊的云存儲(chǔ)位置并各將數(shù)據(jù)塊(D1, D2,......,Dm)從各個(gè)云上下載到USER本地。同時(shí)AgentCloud在日志文件夾H中寫入一個(gè)文件下載日志,該文件下載日志記錄的信息包括:下載人(USER)、下載文件D、文件D的上傳者OWNER、文件D各數(shù)據(jù)塊的開始下載時(shí)間和下載結(jié)束時(shí)間等;
[0045]④USER的本地客戶端將下載的各數(shù)據(jù)塊基于元數(shù)據(jù)K中的各數(shù)據(jù)塊的連接順序進(jìn)行拼接,得到完整的文件D。
【主權(quán)項(xiàng)】
1.一種使用代理云進(jìn)行數(shù)據(jù)拷貝留痕的方法,其特征在于,包括下列步驟: 文件上傳: 步驟al:代理云收到文件上傳請(qǐng)求時(shí),對(duì)文件上傳者進(jìn)行身份認(rèn)證,若通過(guò),則進(jìn)入步驟1-2;否則,拒絕; 步驟a2:文件上傳者通過(guò)本地客戶端將待上傳文件碎片化,得到多個(gè)數(shù)據(jù)塊,并將各數(shù)據(jù)塊的分塊標(biāo)識(shí)發(fā)送給代理云; 步驟a3:代理云為每個(gè)數(shù)據(jù)塊分配云存儲(chǔ)位置并發(fā)送給文件上傳者; 步驟a4:文件上傳者基于所接收的云存儲(chǔ)位置對(duì)各數(shù)據(jù)塊進(jìn)行上傳,上傳完成后,將各數(shù)據(jù)塊的連接順序通過(guò)安全信道傳輸?shù)酱碓疲?步驟a5:代理云在本地為待上傳文件設(shè)置文件日志區(qū),并將上傳日志存入待上傳文件的文件日志區(qū),所述文件上傳日志包括:各數(shù)據(jù)塊的開始上傳時(shí)間、上傳結(jié)束時(shí)間以及文件上傳者;同時(shí)將文件上傳者、數(shù)據(jù)塊的連接順序和云存儲(chǔ)位置記錄到待上傳文件的元數(shù)據(jù)中,所述元數(shù)據(jù)保存在代理云上; 文件拷貝: 步驟bl:代理云收到文件拷貝請(qǐng)求時(shí),對(duì)拷貝請(qǐng)求者進(jìn)行身份認(rèn)證,若通過(guò),則執(zhí)行步驟b2;否則,拒絕; 步驟b2:代理云收將請(qǐng)求文件的元數(shù)據(jù)拷貝到拷貝請(qǐng)求者在代理云上的用戶數(shù)據(jù)區(qū),并將文件拷貝日志存入請(qǐng)求文件的文件日志區(qū),所述文件拷貝日志包括:拷貝請(qǐng)求者、請(qǐng)求文件、請(qǐng)求文件的文件上傳者; 文件下載: 步驟cI:代理云收到文件下載請(qǐng)求時(shí),對(duì)下載請(qǐng)求者進(jìn)行身份認(rèn)證,若通過(guò),則執(zhí)行步驟b2;否則,拒絕; 步驟c2:代理云在下載請(qǐng)求者的用戶數(shù)據(jù)區(qū)查找請(qǐng)求文件的元數(shù)據(jù),若不存在,則下載失敗;否則將所查找的元數(shù)據(jù)發(fā)送給下載請(qǐng)求者; 步驟c3:下載請(qǐng)求者通過(guò)本地客戶端對(duì)所接收的元數(shù)據(jù)進(jìn)行解析,獲取請(qǐng)求文件的各數(shù)據(jù)塊的云存儲(chǔ)位置并下載;同時(shí)代理云將問(wèn)卷下載日志存入請(qǐng)求文件的文件日志區(qū),所述下文件日志區(qū)包括:下載請(qǐng)求者、請(qǐng)求文件、請(qǐng)求文件的文件上傳者、各數(shù)據(jù)塊的開始下載時(shí)間和下載結(jié)束時(shí)間; 步驟c4:并基于元數(shù)據(jù)中的數(shù)據(jù)塊的連接順序?qū)ο螺d的數(shù)據(jù)塊進(jìn)行拼接,得到完整的請(qǐng)求文件。
【文檔編號(hào)】G06F17/30GK105893511SQ201610192868
【公開日】2016年8月24日
【申請(qǐng)日】2016年3月30日
【發(fā)明人】佘堃, 呂赫, 楊瑞瑞, 馬曉菲, 唐前昭, 王偉東
【申請(qǐng)人】電子科技大學(xué)