一種網(wǎng)絡(luò)應(yīng)用系統(tǒng)智能監(jiān)控結(jié)構(gòu)與方法
【技術(shù)領(lǐng)域】
[0001 ]本發(fā)明設(shè)及一種網(wǎng)絡(luò)監(jiān)控結(jié)構(gòu)與方法。
【背景技術(shù)】
[0002] 隨著云計算網(wǎng)絡(luò)技術(shù)應(yīng)用領(lǐng)域的不斷擴大,云計算網(wǎng)絡(luò)服務(wù)安全問題給人們的生 活帶來了很多煩惱。在過去的幾年中,許多國家的云計算機網(wǎng)絡(luò)應(yīng)用系統(tǒng)頻繁出現(xiàn)擁痕狀 況,運些云計算網(wǎng)絡(luò)的應(yīng)用系統(tǒng)在發(fā)生故障時沒有給出預(yù)警信息,發(fā)生故障后系統(tǒng)不能進 行自我修復(fù)及故障定位,使得系統(tǒng)的維護非常困難。因此,探索一種云計算網(wǎng)絡(luò)應(yīng)用系統(tǒng)智 能預(yù)警、故障定位及自我修復(fù)機制成為亟待解決的問題,W便在應(yīng)用服務(wù)器關(guān)鍵硬件負載 過重和應(yīng)用軟件遭受攻擊時應(yīng)用系統(tǒng)能夠進行自動預(yù)警、故障定位及自我修復(fù)。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明針對現(xiàn)有技術(shù)中的不足,提供了一種網(wǎng)絡(luò)應(yīng)用系統(tǒng)智能監(jiān)控結(jié)構(gòu)與方法, 本結(jié)構(gòu)和方法實現(xiàn)了對硬件支撐環(huán)境和應(yīng)用軟件工作狀態(tài)的并行同步監(jiān)控,具有更強的整 體實用性;在硬件支撐環(huán)境監(jiān)控中具有預(yù)警和故障定位功能,能夠指導(dǎo)系統(tǒng)維護人員對故 障點進行精確的定位;在應(yīng)用軟件工作狀態(tài)監(jiān)控中具有應(yīng)用軟件的自我修復(fù)功能,可W縮 短應(yīng)用軟件遭受攻擊或感染病毒時的系統(tǒng)恢復(fù)時間,減少系統(tǒng)維護人員的工作量。
[0004] 為了解決上述技術(shù)問題,本發(fā)明通過下述技術(shù)方案得W解決:一種網(wǎng)絡(luò)應(yīng)用系統(tǒng) 智能監(jiān)控結(jié)構(gòu)與方法,包括應(yīng)用服務(wù)器集群、數(shù)據(jù)交換系統(tǒng)和智能監(jiān)測系統(tǒng),所述的服務(wù)器 集群包括若干個應(yīng)用服務(wù)器,所述的智能監(jiān)測系統(tǒng)采用二級監(jiān)測與安全結(jié)構(gòu)通過數(shù)據(jù)交換 系統(tǒng)對應(yīng)用服務(wù)器進行狀態(tài)監(jiān)測;第一級監(jiān)測與安全結(jié)構(gòu)設(shè)置在應(yīng)用服務(wù)器中的應(yīng)用軟件 運行環(huán)境層面,由硬件工作狀態(tài)檢測器來實現(xiàn),監(jiān)測對象包括應(yīng)用服務(wù)器的CPU平均工作負 載,內(nèi)存使用率和網(wǎng)絡(luò)帶寬專用率;第二級監(jiān)測與安全結(jié)構(gòu)設(shè)置在應(yīng)用服務(wù)器中的應(yīng)用軟 件層面,由應(yīng)用軟件狀態(tài)監(jiān)測器及應(yīng)用軟件修復(fù)控制器來實現(xiàn),監(jiān)控對象包括應(yīng)用軟件目 錄數(shù)量、目錄中的文件數(shù)量及文件長度,并在發(fā)現(xiàn)異常后對軟件進行修復(fù)。
[0005] 上述技術(shù)方案中,優(yōu)選的,還包括應(yīng)用服務(wù)器特征信息庫,應(yīng)用服務(wù)器特征信息庫 記錄每個應(yīng)用服務(wù)器的名稱信息、IP地址信息和CPU核屯、數(shù)量信息,并把運些信息傳遞到智 能監(jiān)測系統(tǒng)。
[0006] 上述技術(shù)方案中,優(yōu)選的,所述的硬件工作狀態(tài)檢測器包括工作狀態(tài)掃描器、硬件 掃描結(jié)果數(shù)據(jù)庫、特征數(shù)據(jù)提取模塊、數(shù)據(jù)分析模塊和硬件報警模塊,所述工作狀態(tài)掃描器 包括CPU狀態(tài)掃描模塊、內(nèi)存狀態(tài)掃描模塊、網(wǎng)絡(luò)接口狀態(tài)掃描模塊。
[0007] 上述技術(shù)方案中,優(yōu)選的,第一級監(jiān)測與安全結(jié)構(gòu)對應(yīng)用服務(wù)器集群進行監(jiān)控的 主要步驟為:步驟A):硬件工作狀態(tài)檢測器從應(yīng)用服務(wù)器特征信息庫中依次讀取每個應(yīng)用 服務(wù)器的名稱信息、IP地址信息和CPU核屯、數(shù)量信息;步驟B):CPU狀態(tài)掃描模塊根據(jù)智能監(jiān) 測系統(tǒng)提供的IP地址信息,實時監(jiān)測IP地址信息指定應(yīng)用服務(wù)器CPU任務(wù)隊列的長度,獲得 應(yīng)用服務(wù)器1、5、15分鐘內(nèi)的CPU的平均負載值,將其寫入硬件掃描結(jié)果數(shù)據(jù)庫中;步驟C): 內(nèi)存狀態(tài)掃描模塊根據(jù)智能監(jiān)測系統(tǒng)提供的IP地址信息,實時監(jiān)測IP地址信息指定的應(yīng)用 服務(wù)器內(nèi)存的使用量和總量值,并將運兩個值追加寫入硬件掃描結(jié)果數(shù)據(jù)庫中;步驟D):網(wǎng) 絡(luò)接口狀態(tài)掃描模塊根據(jù)智能監(jiān)測系統(tǒng)提供的IP地址信息,實時監(jiān)測IP地址信息指定應(yīng)用 服務(wù)器網(wǎng)卡接口的數(shù)據(jù)流量、傳輸速率值和總帶寬值,并將運Ξ個值追加寫入硬件掃描結(jié) 果數(shù)據(jù)庫中;步驟E):特征數(shù)據(jù)提取模塊從硬件掃描結(jié)果數(shù)據(jù)庫中讀取CPU在指定監(jiān)測周期 內(nèi)的平均負載值、內(nèi)存使用量值、內(nèi)存總量值、網(wǎng)卡接口數(shù)據(jù)流量值、網(wǎng)絡(luò)傳輸速率值和網(wǎng) 卡接口帶寬值,傳遞給數(shù)據(jù)分析模塊進行分析處理。步驟F):數(shù)據(jù)分析模塊根據(jù)特征數(shù)據(jù)提 取模塊傳遞過來的特征數(shù)據(jù)計算應(yīng)用服務(wù)器CPU每個核屯、的工作負載、內(nèi)存使用率和網(wǎng)絡(luò) 帶寬占用率并判斷是否過載,同時輸出是否過載的結(jié)果信息;步驟G):硬件報警模塊接受來 自數(shù)據(jù)分析模塊的CPU、內(nèi)存及網(wǎng)絡(luò)負載狀態(tài)結(jié)果輸出值,并根據(jù)接收到的結(jié)果輸出值判斷 是否對相應(yīng)的應(yīng)用服務(wù)器進行報警。
[0008] 上述技術(shù)方案中,優(yōu)選的,在步驟F中和步驟G中,CPU工作負載計算及過載判定方 法為:設(shè)置單獨CPU核屯、的工作負載值為Fgpu,實時監(jiān)測獲得的應(yīng)用服務(wù)器CPU平均工作負載 總值為Fgpu-average,被監(jiān)測的應(yīng)用服務(wù)器CPU的核屯、數(shù)量值為Ngpu,CPU正常工作負載臨界值為 Mcpui,CPU超載臨界值為Mcpu2,其中Fcpu = Fcpu-average/Ncpu;當(dāng)Fcpu<Mcpui時判定CPU工作正常并 輸出0,當(dāng)Mcpui鄒cpu<Mcpu2時判定CPU工作繁忙并輸出1,當(dāng)Fcpu含Mcpu2時判定CPU工作超載并 輸出2,輸出值為1或2時硬件報警模塊發(fā)出不同的報警聲。
[0009] 上述技術(shù)方案中,優(yōu)選的,在步驟F中和步驟G中,內(nèi)存使用率計算及過載判定方法 為,設(shè)置應(yīng)用服務(wù)器內(nèi)存的使用率為Fram,內(nèi)存使用量為Gram,被監(jiān)測的應(yīng)用服務(wù)器的內(nèi)存總 量值為Go,內(nèi)存正常工作負載臨界值為Mrami,內(nèi)存超載臨界值為Mrm2,其中Fram=Grm/Go ;當(dāng) Frm<Mrm擁判定內(nèi)存負載正常并輸出0,當(dāng)Mrmi含F(xiàn)rm<Mrm2時判定內(nèi)存負載繁忙并輸出1, 當(dāng)Frm>Mrm2時判定內(nèi)存負載超載并輸出2,輸出值為1或2時硬件報警模塊發(fā)出不同的報警 聲。
[0010] 上述技術(shù)方案中,優(yōu)選的,在步驟F中和步驟G中,網(wǎng)絡(luò)帶寬占用率計算及過載判定 方法為,設(shè)置應(yīng)用服務(wù)器網(wǎng)絡(luò)帶寬使用率為Fnet,網(wǎng)絡(luò)的實際數(shù)據(jù)傳輸速率值為Lnet,被監(jiān)測 應(yīng)用服務(wù)器的網(wǎng)絡(luò)帶寬值為Lo,網(wǎng)絡(luò)正常工作流量負載臨界值為Μνετι,網(wǎng)絡(luò)流量超載臨界值 為Μνετ2,其中Fnet = Lnet/Lo,當(dāng)Fnet<Mneti時判定網(wǎng)絡(luò)正常并輸出0,當(dāng)Μνετι鄒ΝΕΤ<ΜνΕΤ2時判定 網(wǎng)絡(luò)繁忙并輸出1,當(dāng)Fnet含ΜΝΕΤ2時判定網(wǎng)絡(luò)超載并輸出2,輸出值為1或2時硬件報警模塊發(fā) 出不同的報警聲。
[0011] 上述技術(shù)方案中,優(yōu)選的,應(yīng)用軟件狀態(tài)監(jiān)測器包括工作狀態(tài)掃描器、軟件掃描結(jié) 果數(shù)據(jù)庫、與原始庫對比處理模塊、比對結(jié)果數(shù)據(jù)庫、智能模塊和應(yīng)用軟件修復(fù)控制器,應(yīng) 用服務(wù)器包括應(yīng)用軟件整體更新觸發(fā)器和應(yīng)用軟件原始代碼池,應(yīng)用軟件原始代碼池保存 著應(yīng)用軟件完整的原始代碼備份。
[0012] 上述技術(shù)方案中,優(yōu)選的,第二級監(jiān)測與安全結(jié)構(gòu)對應(yīng)用服務(wù)器集群進行監(jiān)控的 主要步驟為:步驟A):應(yīng)用軟件狀態(tài)監(jiān)測器從應(yīng)用服務(wù)器特征信息庫中依次讀取每個應(yīng)用 服務(wù)器的IP地址信息;步驟B):工作狀態(tài)掃描器通過目錄操作指令實時掃描應(yīng)用服務(wù)器中 處于工作目錄中應(yīng)用軟件的子目錄和文件長度信息,將掃描結(jié)果W覆蓋方式寫入軟件掃描 結(jié)果數(shù)據(jù)庫中;步驟C):軟件掃描結(jié)果數(shù)據(jù)庫是一個文本文件,其中保存有使用指定IP地址 信息的應(yīng)用服務(wù)器中應(yīng)用軟件的子目錄名稱、目錄下的文件名稱W及它們的長度值;步驟 D):通過文本文件比較的方式將軟件掃描結(jié)果數(shù)據(jù)庫與相應(yīng)應(yīng)用服務(wù)器中應(yīng)用軟件原始代 碼池進行對比分析,并將比對結(jié)果W覆蓋方式寫入比對結(jié)果數(shù)據(jù)庫;步驟E):比對結(jié)果數(shù)據(jù) 庫中如果兩個比對文件不存在差異則比對結(jié)果數(shù)據(jù)庫長度為0,如果兩個比對文件存在差 異則比對結(jié)果數(shù)據(jù)庫中保存著差異部分的名稱信息;步驟F):智能模塊首先打開比對結(jié)果 數(shù)據(jù)庫,若對比結(jié)果數(shù)據(jù)庫長度是0,表明軟件掃描結(jié)果數(shù)據(jù)庫與應(yīng)用軟件原始代碼池一 致,應(yīng)用軟件工作狀態(tài)正常,若對比結(jié)果數(shù)據(jù)庫長度不是0,表明軟件掃描結(jié)果數(shù)據(jù)庫與應(yīng) 用軟件原始代碼池中應(yīng)用軟件的掃描文件不一致,應(yīng)用軟件代碼已被篡改或已遭受攻擊, 此時激活應(yīng)用軟件修復(fù)控制器;步驟G):應(yīng)用軟件修復(fù)控制器接受來自智能模塊的激活信 息和IP地址信息,使用IP地址信息定位應(yīng)用服務(wù)器集群中的應(yīng)用服務(wù)器,啟動應(yīng)用服務(wù)器 內(nèi)的應(yīng)用軟件整體更新觸發(fā)器,首先強制刪除應(yīng)用服務(wù)器應(yīng)用軟件工作目錄中的所有子目 錄和文件,然后將應(yīng)用軟件原始代碼池中子目錄和文件復(fù)制到應(yīng)用服務(wù)器應(yīng)用軟件工作目 錄中,使得網(wǎng)絡(luò)用戶在后續(xù)的訪問中及時使用正確的應(yīng)用軟件代碼,獲得正確的訪問數(shù)據(jù), 實現(xiàn)應(yīng)用軟件的代碼自動復(fù)原。
[0013] 云計算網(wǎng)絡(luò)應(yīng)用系統(tǒng)主要由應(yīng)用服務(wù)器硬件和應(yīng)用軟件構(gòu)成,應(yīng)用服務(wù)器硬件是 應(yīng)用軟件的運行載體,應(yīng)用軟件為網(wǎng)絡(luò)用戶提供應(yīng)用服務(wù)。應(yīng)用服務(wù)器關(guān)鍵硬件的承載狀 態(tài)及應(yīng)用軟件自身的工作狀態(tài)是云計算網(wǎng)絡(luò)應(yīng)用系統(tǒng)服務(wù)安全的重要因素,通過對應(yīng)用服 務(wù)器中央處理器、內(nèi)存、網(wǎng)絡(luò)流量、應(yīng)用軟件目錄、文件等