1.一種媒體大數(shù)據(jù)hadoop集群監(jiān)控的方法,其特征在于:該方法的步驟如下:
步驟一、設(shè)置監(jiān)控管理機(jī)和短信網(wǎng)關(guān),并將短信網(wǎng)關(guān)與監(jiān)控管理機(jī)相連,監(jiān)控管理機(jī)與hadoop集群連接;
步驟二、監(jiān)控進(jìn)程,接收監(jiān)控管理機(jī)的控制命令:?jiǎn)?dòng)、停止、更新監(jiān)控閾值、更新監(jiān)控指標(biāo)、更新監(jiān)控腳本,按時(shí)間片判斷監(jiān)控時(shí)間間隔,如到達(dá)時(shí)間間隔則進(jìn)行監(jiān)控指標(biāo)采集循環(huán);對(duì)hadoop的關(guān)鍵服務(wù)通過(guò)進(jìn)程狀態(tài)查詢(xún)命令得到這些服務(wù)的狀態(tài);對(duì)hadoop的Syslog日志文件進(jìn)行讀取,運(yùn)行監(jiān)控腳本讀取其中的關(guān)鍵字和關(guān)鍵指標(biāo);對(duì)系統(tǒng)資源通過(guò)內(nèi)存、存儲(chǔ)、cpu使用率查詢(xún)命令得到指標(biāo)數(shù)據(jù)指標(biāo),將采集的指標(biāo)與閾值進(jìn)行比較,達(dá)到則產(chǎn)生告警事件數(shù)據(jù),將告警事件數(shù)據(jù)推送給監(jiān)控管理機(jī);
步驟三、提供操作界面供用戶(hù)設(shè)置監(jiān)控指標(biāo)、閾值、監(jiān)控腳本、告警短信接收號(hào)碼等,向監(jiān)控進(jìn)程推送監(jiān)控指標(biāo)、閾值、監(jiān)控腳本,提供操作界面供用戶(hù)發(fā)出監(jiān)控開(kāi)始、停止命令,將命令推送至監(jiān)控進(jìn)程,接收監(jiān)控進(jìn)程推送來(lái)的監(jiān)控事件告警數(shù)據(jù)后,轉(zhuǎn)換為短信網(wǎng)關(guān)接口格式,添加接受號(hào)碼,發(fā)送至短信網(wǎng)關(guān),實(shí)現(xiàn)告警短信發(fā)送。
2.根據(jù)權(quán)利要求1所述的一種媒體大數(shù)據(jù)hadoop集群監(jiān)控的方法,其特征在于:監(jiān)控管理機(jī)采用小型計(jì)算機(jī)。
3.根據(jù)權(quán)利要求1所述的一種媒體大數(shù)據(jù)hadoop集群監(jiān)控的方法,其特征在于:不同的Hadoop集群的監(jiān)控解析代碼通用,且統(tǒng)一部署在syslog服務(wù)器后臺(tái)運(yùn)行,對(duì)于未來(lái)新增的Hadoop集群,進(jìn)行相關(guān)配置即可實(shí)現(xiàn)對(duì)Hadoop集群的監(jiān)控。