技術(shù)總結(jié)
本發(fā)明公開了一種基于網(wǎng)絡(luò)關(guān)系圖的網(wǎng)站分類方法,包括以下步驟:以“安全聯(lián)盟”的惡意數(shù)據(jù)作為樣本數(shù)據(jù)源,獲取已有的數(shù)據(jù)分類和URL數(shù)據(jù);形成站點(diǎn)映射表和詞頻分析表、提取樣本指紋特征,用于構(gòu)建特征表、形成類型表;由各站點(diǎn)和其連接權(quán)重構(gòu)成一個(gè)無向權(quán)重圖;眾多的站點(diǎn)和權(quán)重構(gòu)成一個(gè)網(wǎng)絡(luò)關(guān)系圖,通過圖聚類算法把一個(gè)大圖分成若干個(gè)子圖;各任務(wù)單元在各自的服務(wù)器上通過站點(diǎn)指紋特征提取器和分類器來抽取指紋特征并分類。本發(fā)明顯著地提高網(wǎng)站分類的檢測速度,區(qū)分具體類型;對于不斷新增的站點(diǎn),依據(jù)其與現(xiàn)有的連接關(guān)系來確定處理單元,有效地減少計(jì)算復(fù)雜度以及訓(xùn)練的迭代次數(shù),節(jié)省計(jì)算資源。
技術(shù)研發(fā)人員:楊珩
受保護(hù)的技術(shù)使用者:成都知道創(chuàng)宇信息技術(shù)有限公司
文檔號碼:201610831775
技術(shù)研發(fā)日:2016.09.19
技術(shù)公布日:2017.02.22