專利名稱:一種基于云平臺的信息收集存儲和加密檢索系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于云平臺的信息收集存儲和加密檢索系統(tǒng),特別涉及一種智能收集網(wǎng)絡(luò)上交互信息并將信息加密存儲,不經(jīng)過解密就可以實(shí)現(xiàn)信息檢索的系統(tǒng),屬于信息安全技術(shù)領(lǐng)域。
背景技術(shù):
隨著網(wǎng)絡(luò)社區(qū)技術(shù)的成熟,網(wǎng)絡(luò)個體用戶融入更多樣化的群組集合。除了電子郵件,近幾年誕生了幾種新型的信息資訊交互形式,比如微博、SNS、即時通訊工具。這些信息都是分布在網(wǎng)絡(luò)的各個信息服務(wù)提供商中,用戶需要花費(fèi)大量的時間登陸服務(wù)器去瀏覽信息,給用戶的使用帶來了很大的不便。網(wǎng)絡(luò)的發(fā)展還引起了網(wǎng)絡(luò)信息量,特別是交互信息量的急速增長。無論是對企事業(yè)單位還是個人而言,數(shù)據(jù)的存儲和管理變得越來越困難。采用傳統(tǒng)的本地存儲方法已經(jīng)逐漸難于滿足人們對數(shù)據(jù)的存儲和管理需求。云存儲技術(shù)是解決數(shù)據(jù)存儲和管理的有效途徑,而且將數(shù)據(jù)信息存儲在云服務(wù)器中,無論你身在何處,都可以隨時隨地下載所需的數(shù)據(jù)信息,再也沒有空間限制。但目前還沒有云存儲的有效實(shí)現(xiàn)途徑。網(wǎng)絡(luò)的普及給人們帶來了很大的便利,與此同時,正是因為網(wǎng)絡(luò)的普及,網(wǎng)絡(luò)上個人的信息和資料的安全正受到嚴(yán)峻的考驗,人們也越來越重視網(wǎng)絡(luò)信息資料的安全。雖然目前已經(jīng)存在許多網(wǎng)絡(luò)服務(wù)供應(yīng)商提供信息加密服務(wù),但是這些信息并不是用戶個人加密的,所以信息的安全問題仍未解決,用戶的信息資料仍存在泄露的危機(jī)。信息的加密能提高安全性,但是卻給信息的檢索帶來了困難。傳統(tǒng)的方法是先將信息解密,然后再進(jìn)行檢索。這種方法不僅效率低,而且很難實(shí)際應(yīng)用起來。
發(fā)明內(nèi)容
本發(fā)明的目的是針對上述個人信息的瀏覽和加密檢索問題,將云存儲技術(shù)、信息數(shù)據(jù)加密技術(shù)和信息智能收集技術(shù)結(jié)合起來,提出一種基于云平臺的帶有加密功能的個人信息智能收集存儲系統(tǒng)?!N基于云平臺的信息收集存儲和加密檢索系統(tǒng),具體包括數(shù)據(jù)信息收集模塊、 數(shù)據(jù)信息加密模塊、數(shù)據(jù)信息檢索模塊和數(shù)據(jù)訪問接口模塊;其中,數(shù)據(jù)信息收集模塊包括收集模塊和處理模塊,兩個模塊順次連接;數(shù)據(jù)信息檢索模塊包括模糊關(guān)鍵字集構(gòu)造模塊、 檢索模塊和排序模塊,三個模塊順次連接;數(shù)據(jù)訪問接口模塊包括上傳模塊、查找模塊和下載模塊,三個模塊并聯(lián)。系統(tǒng)各部分的連接關(guān)系為數(shù)據(jù)信息收集模塊的處理模塊與數(shù)據(jù)信息加密模塊連接,數(shù)據(jù)信息加密模塊與數(shù)據(jù)訪問接口模塊的上傳模塊連接,上傳模塊和下載模塊與外界提供云存儲的云存儲服務(wù)器連接;數(shù)據(jù)信息檢索模塊通過檢索模塊與數(shù)據(jù)訪問接口模塊的查找模塊互連,排序模塊的輸出傳至用戶。所述的數(shù)據(jù)信息收集模塊中,收集模塊的功能為根據(jù)用戶需求,利用信息服務(wù)提供商提供的API編程接口訪問服務(wù)器,收集分布在網(wǎng)絡(luò)各處的信息郵件、微博等個人信息,并將信息輸入到處理模塊。處理模塊將所有收集到的信息轉(zhuǎn)化為統(tǒng)一格式,分成多個數(shù)據(jù)文件保存到云存儲服務(wù)器,以節(jié)省用戶登錄不同服務(wù)器所需的時間,并方便用戶的瀏覽和管理。所述的數(shù)據(jù)信息加密模塊對信息進(jìn)行加密,根據(jù)用戶的選定的主密鑰 (MasterKey)生成數(shù)據(jù)文件的加密子密鑰(key)。各個數(shù)據(jù)文件使用不同的密鑰加密,即文件FILEi使用keyi進(jìn)行加密,能有效地抵抗唯密文攻擊,加強(qiáng)云存儲服務(wù)器中數(shù)據(jù)的機(jī)密性。所述的數(shù)據(jù)檢索模塊接收用戶的檢索請求,對云存儲服務(wù)器中存儲的數(shù)據(jù)信息進(jìn)行檢索,并將檢索結(jié)果返回給用戶。其中,模糊關(guān)鍵字集構(gòu)造模塊以編輯距離來衡量模糊度,所述編輯距離是指單詞Wl變換到單詞W2所需要編輯的字母數(shù)。模糊關(guān)鍵字集構(gòu)造模塊根據(jù)用戶預(yù)先設(shè)定的模糊度,從預(yù)先建立好的字典文件中選出符合模糊度的單詞,連同用戶輸入的檢索關(guān)鍵字構(gòu)成模糊關(guān)鍵字集。所述的字典文件是通過從網(wǎng)上下載大量各個領(lǐng)域的文章作為語料,然后對語料進(jìn)行分詞,分詞得到的單詞按照字母順序排序存儲而得。字典文件存儲在模糊關(guān)鍵字集構(gòu)造模塊中。檢索模塊通過數(shù)據(jù)訪問接口模塊訪問存儲在云存儲服務(wù)器中的數(shù)據(jù)信息,對模糊關(guān)鍵字集中所有關(guān)鍵字進(jìn)行檢索,得出檢索結(jié)果。排序模塊根據(jù)檢索結(jié)果與關(guān)鍵字的匹配程度對檢索結(jié)果進(jìn)行排序,返回給用戶。上述的檢索方法需要建立索引文件。在用戶上傳數(shù)據(jù)完畢后,系統(tǒng)的上傳模塊會從上傳數(shù)據(jù)中過濾信息量低的單詞,提取信息量高的關(guān)鍵字,建立關(guān)鍵字到文件的映射,采用倒排索引結(jié)構(gòu),保存為索引子文件,然后再將索引子文件加密上傳到云存儲服務(wù)器中,與服務(wù)器中已有的索引文件進(jìn)行合并,更新索引文件。用戶每次上傳數(shù)據(jù)后都需要對索引文件進(jìn)行更新。索引文件也是加密的,保證用戶個人數(shù)據(jù)信息的安全。通過查找索引文件得出檢索結(jié)果,不需要對數(shù)據(jù)解密就可以進(jìn)行檢索,節(jié)省了數(shù)據(jù)解密時間,提高了檢索的效率。 數(shù)據(jù)訪問接口模塊是利用云存儲服務(wù)器的API編程接口去訪問云存儲服務(wù)器中的數(shù)據(jù)信息。上傳模塊將數(shù)據(jù)上傳到云存儲服務(wù)器中存儲起來,并建立和更新索引文件;查找模塊接收用戶的檢索關(guān)鍵字,在云存儲服務(wù)器中查找索引文件,返回檢索結(jié)果;下載模塊將云存儲服務(wù)器中文件下載下來。本發(fā)明所述的系統(tǒng)上傳到云服務(wù)器的數(shù)據(jù)信息都是經(jīng)過用戶加密的,而且在上傳、下載及檢索的過程中,數(shù)據(jù)信息也是加密的,解密只能由用戶執(zhí)行,比現(xiàn)在存在的云存儲服務(wù)更具有安全性。本發(fā)明的信息收集存儲和加密檢索系統(tǒng)的工作流程為用戶發(fā)出收集指令,數(shù)據(jù)信息收集模塊開始從用戶設(shè)定的各信息服務(wù)提供商中收集信息并處理后,輸入到數(shù)據(jù)信息加密模塊進(jìn)行加密;加密后的信息經(jīng)數(shù)據(jù)訪問接口模塊中的上傳模塊傳至提供云存儲的云存儲服務(wù)器。待用戶輸入所需信息的關(guān)鍵字,數(shù)據(jù)信息檢索模塊的模糊關(guān)鍵字集構(gòu)造模塊生成模糊關(guān)鍵字集,提供給檢索模塊;通過查找模塊在云存儲服務(wù)器中查找索引文件,將結(jié)果返回檢索模塊,輸入到排序模塊排序后輸出至用戶。本發(fā)明的系統(tǒng)根據(jù)用戶的需要,還可以接受用戶上傳文件或信息存儲在云存儲服務(wù)器中,并建立索引文件。用戶可以通過系統(tǒng)登錄云存儲服務(wù)器,下載文件或信息。有益效果本發(fā)明可以智能地收集用戶所需的信息,并將信息統(tǒng)一起來,方便用戶瀏覽,提高效率和節(jié)省大量的時間;用戶的個人信息是用戶使用自己的密鑰加密后存儲在云服務(wù)器中,增強(qiáng)了信息的安全性,而且信息是存儲在云服務(wù)器中,用戶隨時隨地都可以訪問獲取所需的信息。加密信息檢索方法不需要經(jīng)過解密就可以檢索到用戶所需的信息,既保證了信息的安全,又不會降低檢索效率和影響用戶的使用體驗。本發(fā)明適用于個人、公司和機(jī)關(guān)單位,可以安裝在個人電腦或者移動設(shè)備上,為數(shù)據(jù)信息的收集、存儲、加密和檢索帶來便利。
圖1為本發(fā)明的系統(tǒng)架構(gòu)圖;圖2為本發(fā)明的系統(tǒng)結(jié)構(gòu)示意圖;圖3為具體實(shí)施方式
中信息收集存儲和加密檢索系統(tǒng)的用戶界面圖;圖4為具體實(shí)施例中信息檢索結(jié)果圖。
具體實(shí)施例方式下面結(jié)合附圖和具體實(shí)施例子,具體說明本發(fā)明的目的和優(yōu)點(diǎn)。本實(shí)施方式實(shí)現(xiàn)了一種基于云平臺的信息收集存儲和加密檢索系統(tǒng),如圖2所示,包括數(shù)據(jù)信息收集模塊、數(shù)據(jù)信息加密模塊、數(shù)據(jù)訪問接口模塊以及數(shù)據(jù)信息檢索模塊,其中數(shù)據(jù)信息收集模塊包括收集模塊和處理模塊,數(shù)據(jù)信息檢索模塊包括模糊關(guān)鍵字集構(gòu)造模塊、檢索模塊和排序模塊。本實(shí)施方式采用C#程序語言編程及設(shè)計用戶界面,生成的信息收集存儲和加密檢索系統(tǒng)的用戶界面如圖3所示。用戶只要登錄系統(tǒng),點(diǎn)擊“開始收集”按鈕,就可以瀏覽所有設(shè)定的賬戶信息。只需在關(guān)鍵字輸入框輸入關(guān)鍵字,點(diǎn)擊“檢索”按鈕就可以檢索到所需的信息,方便快捷,節(jié)省大量的時間。本系統(tǒng)還可以作為網(wǎng)絡(luò)U盤使用,用戶點(diǎn)擊“文件上傳”按鈕,選擇需要上傳的文件上傳到云存儲服務(wù)器中。用戶可以隨時隨地下載文件,點(diǎn)擊 “文件下載”按鈕,選中需要下載的文件即可下載。本實(shí)施例中,用戶A有三個郵箱,兩個微博賬戶。這三個郵箱由不同的三個信息服務(wù)提供商提供,兩個微博賬號分別是新浪和騰訊的微博。用戶A需要分別登陸三個郵箱的服務(wù)器去查看郵件,分別登陸兩個微博賬號去關(guān)注好友。多次登陸服務(wù)器造成時間上的浪費(fèi)。用戶A登陸本系統(tǒng),點(diǎn)擊“開始收集”,系統(tǒng)執(zhí)行如下步驟收集信息1)調(diào)用數(shù)據(jù)信息收集模塊中收集模塊,將三個郵箱的郵件和兩個微博賬號的好友信息下載下來,輸入到處理模塊;2)處理模塊將收集到的各種格式的信息統(tǒng)一轉(zhuǎn)化為txt格式,輸入到數(shù)據(jù)信息加密模塊;3)數(shù)據(jù)信息加密模塊將信息加密后,輸入到數(shù)據(jù)訪問接口模塊的上傳模塊;4)上傳模塊將加密后的數(shù)據(jù)信息上傳到云存儲服務(wù)器存儲起來;5)上傳模塊對上傳數(shù)據(jù)信息建立索引子文件,并將索引子文件加密后上傳到云存儲服務(wù)器,更新已有的索引文件。當(dāng)三個郵箱和兩個微博賬戶的郵件和信息都收集處理完畢后,用戶A即可在系統(tǒng)中瀏覽當(dāng)天的所有信息,不需要多次登陸服務(wù)器,方便快捷。若用戶A只關(guān)心他朋友B的微博,他在檢索框中輸入B的名字,然后點(diǎn)擊“檢索”按鈕,系統(tǒng)執(zhí)行如下步驟進(jìn)行檢索1)接收到用戶輸入的關(guān)鍵字“B”,模糊關(guān)鍵字集構(gòu)造模塊根據(jù)模糊度,從字典文件中選擇符合模糊度的單詞,構(gòu)成模糊關(guān)鍵字集,輸入到檢索模塊;2)檢索模塊通過數(shù)據(jù)訪問接口模塊,通過查找云存儲服務(wù)器中的索引文件,得出檢索結(jié)果“B 今天和A去看了一部不錯的電影! ”輸入到排序模塊;3)排序模塊返回檢索結(jié)果給用戶;整個檢索過程只用不到0. 1秒的時間。如圖4所示,當(dāng)檢索完畢,系統(tǒng)顯示檢索結(jié)果,用戶可以很快地獲得需要的信息, 不必浪費(fèi)時間去一一瀏覽所有信息。當(dāng)用戶使用的交互服務(wù)越多,本系統(tǒng)的優(yōu)勢就越明顯。以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn),或者對其中部分技術(shù)特征進(jìn)行等同替換,這些改進(jìn)和替換也應(yīng)視為本發(fā)明的保護(hù)范圍。
權(quán)利要求
1.一種基于云平臺的信息收集存儲和加密檢索系統(tǒng),其特征在于包括數(shù)據(jù)信息收集模塊、數(shù)據(jù)信息加密模塊、數(shù)據(jù)信息檢索模塊和數(shù)據(jù)訪問接口模塊;其中,數(shù)據(jù)信息收集模塊包括收集模塊和處理模塊,兩個模塊順次連接;數(shù)據(jù)信息檢索模塊包括模糊關(guān)鍵字集構(gòu)造模塊、檢索模塊和排序模塊,三個模塊順次連接;數(shù)據(jù)訪問接口模塊包括上傳模塊、查找模塊和下載模塊,三個模塊并聯(lián);上述各部分的連接關(guān)系為數(shù)據(jù)信息收集模塊的處理模塊與數(shù)據(jù)信息加密模塊連接,數(shù)據(jù)信息加密模塊與數(shù)據(jù)訪問接口模塊的上傳模塊連接,上傳模塊和下載模塊與外界提供云存儲的云存儲服務(wù)器連接;數(shù)據(jù)信息檢索模塊通過檢索模塊與數(shù)據(jù)訪問接口模塊的查找模塊互連,排序模塊的輸出傳至用戶;所述的數(shù)據(jù)信息收集模塊中,收集模塊根據(jù)用戶需求,利用信息服務(wù)提供商提供的API 編程接口訪問服務(wù)器,收集分布在網(wǎng)絡(luò)各處的個人信息,并將信息輸入到處理模塊;處理模塊將所有收集到的信息轉(zhuǎn)化為統(tǒng)一格式,分成多個數(shù)據(jù)文件保存到云存儲服務(wù)器;所述的數(shù)據(jù)信息加密模塊對信息進(jìn)行加密,根據(jù)用戶的選定的主密鑰生成數(shù)據(jù)文件的加密子密鑰;所述的數(shù)據(jù)檢索模塊接收用戶的檢索請求,對云存儲服務(wù)器中存儲的數(shù)據(jù)信息進(jìn)行檢索,并將檢索結(jié)果返回用戶;數(shù)據(jù)訪問接口模塊利用云存儲服務(wù)器的API編程接口去訪問云存儲服務(wù)器中的數(shù)據(jù)信息;其中,上傳模塊將數(shù)據(jù)上傳到云存儲服務(wù)器中存儲,并建立和更新索引文件;查找模塊接收用戶的檢索關(guān)鍵字,在云存儲服務(wù)器中查找索引文件,返回檢索結(jié)果;下載模塊將云存儲服務(wù)器中文件下載下來。
2.根據(jù)權(quán)利要求1所述的一種基于云平臺的信息收集存儲和加密檢索系統(tǒng),其特征在于所述的模糊關(guān)鍵字集構(gòu)造模塊以編輯距離來衡量模糊度,所述編輯距離是單詞wl變換到單詞w2所需要編輯的字母數(shù);模糊關(guān)鍵字集構(gòu)造模塊根據(jù)用戶預(yù)先設(shè)定的模糊度,從預(yù)先建立好的字典文件中選出符合模糊度的單詞,連同用戶輸入的檢索關(guān)鍵字構(gòu)成模糊關(guān)鍵字集。
3.根據(jù)權(quán)利要求1所述的一種基于云平臺的信息收集存儲和加密檢索系統(tǒng),其特征在于所述的檢索模塊通過數(shù)據(jù)訪問接口模塊訪問存儲在云存儲服務(wù)器中的數(shù)據(jù)信息,根據(jù)模糊關(guān)鍵字集中所有關(guān)鍵字在索引文件中進(jìn)行檢索,得出檢索結(jié)果;排序模塊根據(jù)檢索結(jié)果與關(guān)鍵字的匹配程度對檢索結(jié)果進(jìn)行排序,返回給用戶。
4.根據(jù)權(quán)利要求1所述的一種基于云平臺的信息收集存儲和加密檢索系統(tǒng),其特征在于所述的數(shù)據(jù)信息加密模塊對各個數(shù)據(jù)文件使用不同的密鑰加密。
5.根據(jù)權(quán)利要求1所述的一種基于云平臺的信息收集存儲和加密檢索系統(tǒng),其特征在于所述的上傳、下載及檢索的數(shù)據(jù)信息均為加密的,解密只能由用戶執(zhí)行。
6.根據(jù)權(quán)利要求2所述的一種基于云平臺的信息收集存儲和加密檢索系統(tǒng),其特征在于所述的字典文件的生成方法為從網(wǎng)上下載各個領(lǐng)域的大量文章作為語料,對語料進(jìn)行分詞,得到的單詞按照字母順序排序存儲而得;字典文件存儲在模糊關(guān)鍵字集構(gòu)造模塊中。
7.根據(jù)權(quán)利要求3所述的一種基于云平臺的信息收集存儲和加密檢索系統(tǒng),其特征在于所述索引文件的建立方法為系統(tǒng)從上傳數(shù)據(jù)中過濾信息量低的單詞,提取信息量高的關(guān)鍵字,建立關(guān)鍵字到文件的映射,采用倒排索引結(jié)構(gòu),保存為索引子文件,再將索引子文件加密上傳到云存儲服務(wù)器中,與服務(wù)器中已有的索引文件合并,更新索引文件;用戶每次上傳數(shù)據(jù)后都更新索引文件;所述索引文件由上傳模塊生成,并加密。
全文摘要
本發(fā)明涉及一種基于云平臺的信息收集存儲和加密檢索系統(tǒng),特別涉及一種智能收集網(wǎng)絡(luò)上交互信息并將信息加密存儲,不經(jīng)過解密就可以實(shí)現(xiàn)信息檢索的系統(tǒng),屬于信息安全技術(shù)領(lǐng)域;具體包括數(shù)據(jù)信息收集模塊、數(shù)據(jù)信息加密模塊、數(shù)據(jù)信息檢索模塊和數(shù)據(jù)訪問接口模塊。本發(fā)明智能地收集用戶所需的信息,加密信息檢索方法不需要經(jīng)過解密就可以檢索到用戶所需的信息,用戶隨時隨地都可以訪問獲取所需的信息,既提高效率和節(jié)省大量的時間,又保證了信息的安全;適用于個人、公司和機(jī)關(guān)單位,可以安裝在個人電腦或者移動設(shè)備上,為數(shù)據(jù)信息的收集、存儲、加密和檢索帶來便利。
文檔編號H04L29/06GK102325143SQ20111027778
公開日2012年1月18日 申請日期2011年9月19日 優(yōu)先權(quán)日2011年9月19日
發(fā)明者劉暢, 吳俊宏, 李龍一佳, 楊震, 祝烈煌 申請人:北京理工大學(xué)