本發(fā)明公開了一種對IDC機(jī)房流量最優(yōu)的流量監(jiān)測分析方法,該方法實現(xiàn)的系統(tǒng)采用旁路的方式部署在IDC機(jī)房,對機(jī)房內(nèi)的回向流量進(jìn)行采樣監(jiān)測,通過加長采樣時間達(dá)到非采樣監(jiān)控同等的效果。
背景技術(shù):
隨著信息技術(shù)的發(fā)展和互聯(lián)網(wǎng)管理技術(shù)手段的進(jìn)步,互聯(lián)網(wǎng)綜合管理平臺采集、處理、積累的數(shù)據(jù)越來越多,數(shù)據(jù)量增速也越來越快?;ヂ?lián)網(wǎng)數(shù)據(jù)中心(簡稱IDC)在信息安全監(jiān)控方面有著重要的地位,加強對互聯(lián)網(wǎng)站的監(jiān)管力度,這是一個制高點,根據(jù)信息安全管理系統(tǒng)的要求,需要在監(jiān)管機(jī)房部署探針設(shè)備實現(xiàn)對互聯(lián)網(wǎng)流量數(shù)據(jù)的監(jiān)測、管控、分析等信息。由于全國IDC機(jī)房的流量巨大,并且每年以指數(shù)級的速度進(jìn)行帶寬擴(kuò)容,這樣在實施和部署管控系統(tǒng)和技術(shù)方面要投入非常大的成本,并且要根據(jù)帶寬的增長不斷的投入新的設(shè)備進(jìn)行全面監(jiān)控,成本巨大。
本發(fā)明的目的在于提供一種IDC機(jī)房出向流量中,對數(shù)據(jù)流進(jìn)行周期性調(diào)整監(jiān)控不同采樣比的情況下,模擬并發(fā)固定次數(shù)的訪問IDC機(jī)房內(nèi)網(wǎng)站靶點關(guān)鍵字等內(nèi)容,并記錄下靶點內(nèi)容在不同時間范圍內(nèi)被發(fā)現(xiàn)的概率值,從而分析推斷出該機(jī)房環(huán)境下最佳的采樣比和投入比,減少投入成本達(dá)到最佳的監(jiān)控效果。
技術(shù)實現(xiàn)要素:
本發(fā)明公開了一種對IDC機(jī)房流量最優(yōu)的流量監(jiān)測分析方法。本發(fā)明方法在某IDC機(jī)房出向流量中,對數(shù)據(jù)流進(jìn)行周期性調(diào)整監(jiān)控不同采樣比的情況下,模擬并發(fā)固定次數(shù)的訪問IDC機(jī)房內(nèi)網(wǎng)站靶點關(guān)鍵字等內(nèi)容,并記錄下靶點內(nèi)容在不同時間范圍內(nèi)被發(fā)現(xiàn)的概率值,從而分析推斷出該機(jī)房環(huán)境下最佳的采樣比和投入比,減少投入成本達(dá)到最佳的監(jiān)控效果。本方法適用于所有IDC機(jī)房網(wǎng)站內(nèi)容監(jiān)控匹配的應(yīng)用。
本發(fā)明具有以下特征:
1、通過降低覆蓋機(jī)房鏈路的采樣率,減少投入管控設(shè)備,達(dá)到降低成本的效果;
2、在加長采樣時間前提下,降低采樣率,關(guān)鍵字內(nèi)容的匹配和發(fā)現(xiàn)效果不受影響;
3、在實際的網(wǎng)絡(luò)背景環(huán)境,通過搭建的模擬測試環(huán)境,能夠快速的確定不同數(shù)據(jù)、不同業(yè)務(wù)環(huán)境下的IDC機(jī)房的最佳采樣比。
附圖說明
圖1一種IDC機(jī)房流量采樣監(jiān)測分析的機(jī)房測試拓?fù)涫疽鈭D。
圖2域名、IP地址及對應(yīng)訪問量的上報和存儲的示意圖。
圖3 IP規(guī)則下自動關(guān)聯(lián)分類示意圖。
圖4 IDC機(jī)房網(wǎng)站分級管控示意圖。
圖5、圖6互聯(lián)網(wǎng)用戶訪問控制流程圖。
具體實施方式
現(xiàn)網(wǎng)數(shù)據(jù)測試是在IDC機(jī)房數(shù)據(jù)環(huán)境下,流控設(shè)備分別設(shè)置10%、15%、20%、30%的抽樣率時,IDC系統(tǒng)的發(fā)現(xiàn)網(wǎng)站頁面功能、關(guān)鍵字監(jiān)測功能分別達(dá)到怎樣的效果。將測試數(shù)據(jù)進(jìn)行對比,得出不同時間段、不同背景流量、不同抽樣率下系統(tǒng)性能指標(biāo)的一組數(shù)據(jù)。
計劃測試周期為3天,將每天分為3個時間片段進(jìn)行測試。分別為每天的10:00-13:00、15:00-18:00、19:00-22:00。每個時間片段內(nèi),再分出抽樣比10%、15%、20%、30%這四種情況。通過模擬客戶訪問網(wǎng)站的方式,分別在不同的抽樣比下,20個并發(fā)訪問請求,測試所有靶點URL(1000個),頁面及關(guān)鍵字被系統(tǒng)發(fā)現(xiàn)的時間、針對靶點頁面內(nèi)容的關(guān)鍵字監(jiān)測的準(zhǔn)確率。
按照測試流程可以劃分為12個任務(wù),分別是任務(wù)P-1-1、P-1-2、P-1-3、P-1-4,P-2-1、P-2-2、P-2-3、P-2-4,P-3-1、P-3-2、P-3-3、P-3-4。其中P代表本項測試計劃,中間的數(shù)字代表一天中的第一個測試時間段,最后一位數(shù)字代表4個抽樣率條件。這12個任務(wù)將按照時間順序依次執(zhí)行下面所有步驟。
任務(wù)P-1-1開始測試之前依次執(zhí)行以下步驟:
1、首次測試本項時,將模擬終端訪問的啟動時間設(shè)置好;
2、測試人員和技術(shù)支持人員確定測試環(huán)境已經(jīng)被還原到初始狀態(tài),相關(guān)模塊不存在上次測試產(chǎn)生的數(shù)據(jù);
3、登陸測試系統(tǒng),下發(fā)監(jiān)測指令;
4、測試人員在表中記錄啟動時間;
任務(wù)P-1-1測試期間依次執(zhí)行以下步驟:
1、測試人員確保模擬終端訪問正常運行;
任務(wù)P-1-1測試結(jié)束后依次執(zhí)行以下步驟:
1、本項測試結(jié)束之后,測試人員將本次測試結(jié)果轉(zhuǎn)存到指定文件路徑下;
2、本項測試結(jié)束后立即通知技術(shù)支持人員,讓他在現(xiàn)場執(zhí)行腳本清除本項測試在EU端產(chǎn)生的數(shù)據(jù);
3、測試人員導(dǎo)出發(fā)現(xiàn)數(shù)據(jù)之后,執(zhí)行腳本清除本項測試中產(chǎn)生的數(shù)據(jù);
4、循環(huán)順序執(zhí)行其他任務(wù)。