信息采集方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及信息采集方法和裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的快速發(fā)展,惡意代碼的黑色利益鏈已經(jīng)形成,每日新增的惡意代碼樣本已經(jīng)數(shù)以萬計(jì),傳統(tǒng)的客戶端檢測(cè)方式轉(zhuǎn)變?yōu)樵撇闅⒌臋z測(cè)方式,因此云端需要收集大量的文件數(shù)據(jù)。為了提升客戶端檢測(cè)的準(zhǔn)確性,需要收集相關(guān)客戶端軟件的行為日志信息,在云端形成大數(shù)據(jù)日志分析,通過海量數(shù)據(jù)分析調(diào)整鑒定策略,從而有效提升產(chǎn)品的檢測(cè)能力。然而,提升產(chǎn)品檢測(cè)能力的前提條件是通過客戶端采集相關(guān)的數(shù)據(jù)信息,并通過傳輸機(jī)制把數(shù)據(jù)信息回傳到云端的數(shù)據(jù)存儲(chǔ)中心,再經(jīng)過大數(shù)據(jù)的分析處理,反饋于產(chǎn)品應(yīng)用。
[0003]現(xiàn)有技術(shù)采用了云數(shù)據(jù)采集方法,采集客戶端數(shù)據(jù)信息時(shí),一般會(huì)直接使用機(jī)器系統(tǒng)信息作為用戶標(biāo)識(shí)號(hào),例如,使用機(jī)器名稱作為用戶標(biāo)識(shí)號(hào),將采集的數(shù)據(jù)信息完全上傳,而機(jī)器系統(tǒng)信息可能會(huì)存在用戶的個(gè)人信息等敏感信息,因此缺乏安全性的考慮。
【發(fā)明內(nèi)容】
[0004]本申請(qǐng)的目的在于提出一種保護(hù)隱私的信息采集方法和裝置,來解決以上【背景技術(shù)】部分提到的技術(shù)問題。
[0005]第一方面,本申請(qǐng)?zhí)峁┝艘环N信息采集方法,所述方法包括:采集客戶端系統(tǒng)信息,并將所述系統(tǒng)信息模糊化處理;采集各種運(yùn)行相關(guān)數(shù)據(jù);在所述運(yùn)行相關(guān)數(shù)據(jù)包含身份標(biāo)識(shí)的情況下,將所述運(yùn)行相關(guān)數(shù)據(jù)進(jìn)行過濾處理;將經(jīng)處理的所述系統(tǒng)信息和所述運(yùn)行相關(guān)數(shù)據(jù)通過加密后上傳服務(wù)器,其中,上傳的所述系統(tǒng)信息和所述運(yùn)行相關(guān)數(shù)據(jù)在所述服務(wù)器中是分塊存儲(chǔ)的。
[0006]在一些實(shí)施例中,所述將經(jīng)處理的所述系統(tǒng)信息和所述運(yùn)行相關(guān)數(shù)據(jù)通過加密后上傳傳服務(wù)器,包括:對(duì)所述運(yùn)行相關(guān)數(shù)據(jù)進(jìn)行檢測(cè);如果檢測(cè)到不能識(shí)別的可移植的執(zhí)行體文件,則上傳所述可移植的執(zhí)行體文件的路徑信息;根據(jù)分片采集指令分片上傳所述可移植的執(zhí)行體文件,其中,所述分片采集指令由所述服務(wù)器基于所述路徑信息而生成并下發(fā)的。
[0007]在一些實(shí)施例中,所述如果檢測(cè)到不能識(shí)別的可移植的執(zhí)行體文件,則上傳所述可移植的執(zhí)行體文件的路徑信息,包括:在上傳所述可移植的執(zhí)行體文件的所述路徑信息時(shí),將所述路徑信息中包含的用戶名進(jìn)行過濾處理。
[0008]在一些實(shí)施例中,所述系統(tǒng)信息包括以下至少一項(xiàng):已安裝的軟件列表信息,系統(tǒng)配置實(shí)用程序列表信息,服務(wù)列表信息,操作系統(tǒng)版本信息,瀏覽器版本信息,網(wǎng)卡Mac地址、硬盤序列號(hào)、內(nèi)存信息、系統(tǒng)結(jié)構(gòu)信息。
[0009]在一些實(shí)施例中,所述采集客戶端系統(tǒng)信息,并將所述系統(tǒng)信息模糊化處理,包括:采集客戶端系統(tǒng)信息,將所述系統(tǒng)信息生成文件,對(duì)所述文件進(jìn)行哈希計(jì)算,生成唯一標(biāo)識(shí)號(hào)。
[0010]在一些實(shí)施例中,所述各種運(yùn)行相關(guān)數(shù)據(jù)包括以下至少一項(xiàng):軟件行為數(shù)據(jù)、用戶操作行為數(shù)據(jù)、用戶統(tǒng)一資源定位符數(shù)據(jù)、檢測(cè)威脅日志數(shù)據(jù)、文件信息及內(nèi)容數(shù)據(jù)。
[0011 ] 第二方面,本申請(qǐng)?zhí)峁┝艘环N信息采集裝置,所述裝置包括第一采集單元,配置用于采集客戶端系統(tǒng)信息,并將所述系統(tǒng)信息模糊化處理;第二采集單元,配置用于采集各種運(yùn)行相關(guān)數(shù)據(jù);過濾處理單元,配置用于在所述運(yùn)行相關(guān)數(shù)據(jù)包含身份標(biāo)識(shí)的情況下,將所述運(yùn)行相關(guān)數(shù)據(jù)進(jìn)行過濾處理;傳輸單元,配置用于將經(jīng)處理的所述系統(tǒng)信息和所述運(yùn)行相關(guān)數(shù)據(jù)通過加密后上傳服務(wù)器,其中,上傳的所述系統(tǒng)信息和所述運(yùn)行相關(guān)數(shù)據(jù)在所述服務(wù)器中是分塊存儲(chǔ)的。在一些實(shí)施例中,所述傳輸單元進(jìn)一步配置用于:對(duì)所述運(yùn)行相關(guān)數(shù)據(jù)進(jìn)行檢測(cè);如果檢測(cè)到不能識(shí)別的可移植的執(zhí)行體文件,則上傳所述可移植的執(zhí)行體文件的路徑信息;根據(jù)分片采集指令分片上傳所述可移植的執(zhí)行體文件,其中,所述分片采集指令由所述服務(wù)器基于所述路徑信息而生成并下發(fā)的。
[0012]在一些實(shí)施例中,所述過濾處理單元進(jìn)一步配置用于:在上傳所述可移植的執(zhí)行體文件的所述路徑信息時(shí),將所述路徑信息中包含的用戶名進(jìn)行過濾處理。
[0013]在一些實(shí)施例中,所述系統(tǒng)信息包括以下至少一項(xiàng):網(wǎng)卡Mac地址、硬盤序列號(hào)、內(nèi)存信息、系統(tǒng)結(jié)構(gòu)信息。
[0014]在一些實(shí)施例中,所述模糊處理單元進(jìn)一步配置用于:采集客戶端系統(tǒng)信息,將所述系統(tǒng)信息生成文件,對(duì)所述文件進(jìn)行哈希計(jì)算,生成唯一標(biāo)識(shí)號(hào)。
[0015]在一些實(shí)施例中,所述各種運(yùn)行相關(guān)數(shù)據(jù)包括以下至少一項(xiàng):軟件行為數(shù)據(jù)、用戶操作行為數(shù)據(jù)、用戶統(tǒng)一資源定位符數(shù)據(jù)、檢測(cè)威脅日志數(shù)據(jù)、文件信息及內(nèi)容數(shù)據(jù)。
[0016]本申請(qǐng)?zhí)峁┑男畔⒉杉椒ê脱b置,通過采集客戶端系統(tǒng)信息,并將上述系統(tǒng)信息模糊化處理,再采集各種運(yùn)行相關(guān)數(shù)據(jù),在上述運(yùn)行相關(guān)數(shù)據(jù)包含身份標(biāo)識(shí)的情況下,將上述運(yùn)行相關(guān)數(shù)據(jù)進(jìn)行過濾處理,最后將經(jīng)處理的上述系統(tǒng)信息和上述運(yùn)行相關(guān)數(shù)據(jù)通過加密后上傳,從而降低了采集信息的敏感度,減少信息采集帶來的安全性問題。
【附圖說明】
[0017]通過閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本申請(qǐng)的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0018]圖1是本申請(qǐng)可以應(yīng)用于其中的示例性系統(tǒng)架構(gòu)圖;
[0019]圖2是根據(jù)本申請(qǐng)的信息采集方法的一個(gè)實(shí)施例的流程圖;
[0020]圖3是根據(jù)本申請(qǐng)的信息采集方法的又一個(gè)實(shí)施例的流程圖;
[0021]圖4是根據(jù)本申請(qǐng)的信息采集裝置的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖;
[0022]圖5是適于用來實(shí)現(xiàn)本申請(qǐng)實(shí)施例的終端設(shè)備或服務(wù)器的計(jì)算機(jī)系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0023]下面結(jié)合附圖和實(shí)施例對(duì)本申請(qǐng)作進(jìn)一步的詳細(xì)說明??梢岳斫獾氖牵颂幩枋龅木唧w實(shí)施例僅僅用于解釋相關(guān)發(fā)明,而非對(duì)該發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與有關(guān)發(fā)明相關(guān)的部分。
[0024]需要說明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本申請(qǐng)。
[0025]圖1示出了可以應(yīng)用本申請(qǐng)的信息采集方法或信息采集裝置的實(shí)施例的示例性系統(tǒng)架構(gòu)100。
[0026]如圖1所示,系統(tǒng)架構(gòu)100可以包括終端設(shè)備101、102、103,網(wǎng)絡(luò)104和服務(wù)器105。網(wǎng)絡(luò)104用以在終端設(shè)備101、102、103和服務(wù)器105之間提供通信鏈路的介質(zhì)。網(wǎng)絡(luò)104可以包括各種連接類型,例如有線、無線通信鏈路或者光纖電纜等等。
[0027]用戶可以使用終端設(shè)備101、102、103通過網(wǎng)絡(luò)104與服務(wù)器105交互,以接收或發(fā)送消息等。終端設(shè)備101、102、103上可以安裝有各種客戶端軟件應(yīng)用,例如可能涉及用戶信息采集的即時(shí)通信工具、郵箱客戶端、社交平臺(tái)軟件等。
[0028]終端設(shè)備101、102、103可以是各種電子設(shè)備,包括但不限于個(gè)人電腦、智能手機(jī)、智能手表、平板電腦、個(gè)人數(shù)字助理等等。
[0029]服務(wù)器105可以是提供各種服務(wù)的服務(wù)器。服務(wù)器可以對(duì)接收到的數(shù)據(jù)進(jìn)行存儲(chǔ)、分析等處理,并將處理結(jié)果反饋給終端設(shè)備。
[0030]需要說明的是,本申請(qǐng)實(shí)施例所提供的信息采集方法一般由終端設(shè)備101、102、103執(zhí)行。相應(yīng)的,信息采集裝置一般設(shè)于終端設(shè)備101、102、103中。
[0031]應(yīng)該理解,圖1中的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器的數(shù)目?jī)H僅是示意性的。根據(jù)實(shí)現(xiàn)需要,可以具有任意數(shù)目的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器。
[0032]繼續(xù)參考圖2,其示出了根據(jù)本申請(qǐng)的信息采集方法的一個(gè)實(shí)施例的示例性流程200。所述的信息采集方法,包括以下步驟:
[0033]步驟201,采集客戶端系統(tǒng)信息,并將系統(tǒng)信息模糊化處理。
[0034]在本實(shí)施例中,信息采集方法運(yùn)行于其上的電子設(shè)備(例如圖1所示的終端設(shè)備)可以采集系統(tǒng)信息。具體而言,當(dāng)用戶在上述電子設(shè)備上安裝客戶端軟件時(shí),客戶端軟件可以從本地獲取上述系統(tǒng)信息,并將上述系統(tǒng)信息模糊化處理。
[0035]在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,上述系統(tǒng)信息可以包括以下至少一項(xiàng):已安裝的軟件列表信息,系統(tǒng)配置實(shí)用程序(Microsoft Syste