一種Linux服務器硬盤在線狀態(tài)的監(jiān)控方法
【專利摘要】本發(fā)明公開了一種Linux服務器硬盤在線狀態(tài)的監(jiān)控方法,其主要內(nèi)容包括:1)對需要進行硬盤狀態(tài)監(jiān)控的Linux服務器部署HDmon腳本,復制腳本文件至任意目錄;2)賦予HDmon腳本文件可執(zhí)行權限;3)設置接收警報的郵箱帳號;4)設置后臺執(zhí)行腳本程序;通過定期掃描主板SCSI總線上的塊設備,實時更新配置文件,并跟初始狀態(tài)進行對比,實現(xiàn)對硬盤在線狀態(tài)的監(jiān)控;當硬盤故障或者離線時,將會自動觸發(fā)報警機制并生成錯誤日志,實現(xiàn)對服務器的硬盤進行實時健康檢查、例行維護等目的。
【專利說明】一種Linux服務器硬盤在線狀態(tài)的監(jiān)控方法
[0001]
【技術領域】
[0002]本發(fā)明涉及硬盤監(jiān)控技術,具體地說是一種Linux服務器硬盤在線狀態(tài)的監(jiān)控方法。
【背景技術】
[0003]隨著服務器技術的不斷發(fā)展,服務器所支持的硬盤數(shù)量變得越來越多,在滿足服務器日益增長的數(shù)據(jù)存儲空間的同時,也使得我們監(jiān)控硬盤在線狀態(tài)的工作變得越來越繁瑣。通常情況下,如果服務器配置了陣列卡,出現(xiàn)硬盤離線時可能會有報警聲,缺點是只有運維人員進入機房聽到報警聲之后才知道有硬盤發(fā)生了故障,而我們一般都在辦公室進行運維監(jiān)控,因此很難第一時間發(fā)現(xiàn)問題。另外,對于互聯(lián)網(wǎng)大客戶,服務器大都配置了 SAS卡,而SAS卡本身不具備報警功能。同時互聯(lián)網(wǎng)客戶對磁盤空間的要求較高,大多采用大容量SATA硬盤,而SATA硬盤由于協(xié)議上的原因,有時不會觸發(fā)背板報警燈點亮,這更是增加了發(fā)現(xiàn)硬盤掉線故障的難度。
[0004]雖然目前也有較多的硬盤在線監(jiān)控工具,但是大都針對Windows系統(tǒng),極少的幾款針對Linux系統(tǒng)的工具也因為安裝麻煩、監(jiān)控和告警手段單一等缺點而少有人使用。
【發(fā)明內(nèi)容】
[0005]針對現(xiàn)有技術存在的不足之處,本發(fā)明提出了一種Linux服務器的硬盤在線狀態(tài)實時監(jiān)控方法,以及發(fā)生硬盤離線時的報警與分析方法。
[0006]本發(fā)明所述一種Linux服務器硬盤在線狀態(tài)的監(jiān)控方法,解決上述技術問題采用的技術方案如下:該監(jiān)控方法提出了一個監(jiān)控程序,通過定期掃描主板SCSI總線上的塊設備,及時更新塊設備的狀態(tài)并記錄到配置文件中,在程序初次運行時會生成一個初始配置,并將每次掃描的結(jié)果跟初始配置進行對比,即可發(fā)現(xiàn)硬盤狀態(tài)差異;當硬盤故障或離線時,程序會通過算法得出故障硬盤的盤符和槽位號,同時會自動觸發(fā)報警機制并生成故障信息日志文件,通過報警機制快速獲取硬盤故障信息,提醒維護人員及時更換硬盤,實現(xiàn)對Linux服務器的硬盤進行實時健康檢查、例行維護等目的,保障了業(yè)務的穩(wěn)定性;同時,本發(fā)明所述監(jiān)控方法中,當硬盤正常時,不會生成日志文件,并且當硬盤故障排除后自動刪除日志文件;
該Linux服務器硬盤在線狀態(tài)的監(jiān)控方法的具體內(nèi)容包括:1)對需要進行硬盤狀態(tài)監(jiān)控的Linux服務器部署HDmon腳本,復制腳本文件至任意目錄;2)賦予HDmon腳本文件可執(zhí)行權限;3)設置接收警報的郵箱帳號;4)設置后臺執(zhí)行腳本程序。
[0007]本發(fā)明所述Linux服務器硬盤在線狀態(tài)的監(jiān)控方法具有的有益效果:
所述Linux服務器硬盤在線狀態(tài)的監(jiān)控方法,通過定期掃描主板SCSI總線上的塊設備,實時更新配置文件,并跟初始狀態(tài)進行對比,實現(xiàn)對硬盤在線狀態(tài)的監(jiān)控;當硬盤發(fā)生故障或者跟背板接觸不良,導致系統(tǒng)無法識別該硬盤時,將會自動觸發(fā)報警機制并生成錯誤日志,實現(xiàn)對服務器的硬盤進行實時健康檢查、例行維護等目的;
相比目前Linux服務器的硬盤在線監(jiān)控方法具有:
1.無需安裝第三方軟件,簡單易用;
2.使用Shell腳本編寫,通用性強,可跨平臺使用;
3.支持自定義掃描間隔,適應不同的監(jiān)控環(huán)境;
4.支持后臺監(jiān)控,無需人為干預;
5.支持郵件提醒,便于維護人員及時發(fā)現(xiàn)并處理等優(yōu)點。
【專利附圖】
【附圖說明】
[0008]附圖1為本發(fā)明所述監(jiān)控方法的流程圖。
【具體實施方式】
[0009]參照說明書附圖和具體實施例,對本發(fā)明的Linux服務器硬盤在線狀態(tài)的監(jiān)控方法作以下詳細地說明。
[0010]本發(fā)明所述Linux服務器硬盤在線狀態(tài)的監(jiān)控方法,提出了一個監(jiān)控程序,該監(jiān)控程序通過定期掃描主板SCSI總線上的塊設備,及時更新塊設備的狀態(tài)并記錄到配置文件中,在程序初次運行時會生成一個初始配置,并將每次掃描的結(jié)果跟初始配置進行對比,即可發(fā)現(xiàn)差異;當硬盤故障或離線時,程序會通過算法得出故障硬盤的盤符和槽位號,同時會自動觸發(fā)報警機制并生成故障信息日志文件,通過報警機制快速獲取硬盤故障信息,提醒維護人員及時更換硬盤,實現(xiàn)對Linux服務器的硬盤進行實時健康檢查、例行維護等目的,保障了業(yè)務的穩(wěn)定性;同時,本發(fā)明所述監(jiān)控方法中,當硬盤正常時,不會生成日志文件,并且當硬盤故障排除后自動刪除日志文件;
該Linux服務器硬盤在線狀態(tài)的監(jiān)控方法的具體內(nèi)容包括:1)對需要進行硬盤狀態(tài)監(jiān)控的Linux服務器部署HDmon腳本,復制腳本文件至任意目錄;2)賦予HDmon腳本文件可執(zhí)行權限;3)設置接收警報的郵箱帳號;4)設置后臺執(zhí)行腳本程序。
[0011]實施例:
下面通過一個實施例,對本發(fā)明所述Linux服務器硬盤在線狀態(tài)的監(jiān)控方法的內(nèi)容進行詳細說明。
[0012]本實施例中,該Linux服務器硬盤在線狀態(tài)的監(jiān)控方法的使用過程包括:
1)對需要進行硬盤狀態(tài)監(jiān)控的Linux服務器部署HDmon腳本,復制腳本文件至任意目錄,比如/root目錄等;
2)賦予HDmon腳本文件可執(zhí)行權限:#chmod777 HDmon ;
3)設置接收警報的郵箱帳號:#viHDmon ;接收警報的郵箱賬號的程序如下:
【權利要求】
1.一種Linux服務器硬盤在線狀態(tài)的監(jiān)控方法,其特征在于,提出了一個監(jiān)控程序,通過定期掃描主板SCSI總線上的塊設備,及時更新塊設備的狀態(tài)并記錄到配置文件中,在程序初次運行時會生成一個初始配置,并將每次掃描的結(jié)果跟初始配置進行對比,即可發(fā)現(xiàn)硬盤狀態(tài)差異;當硬盤故障或離線時,程序會通過算法得出故障硬盤的盤符和槽位號,同時會自動觸發(fā)報警機制并生成故障信息日志文件,通過報警機制快速獲取硬盤故障信息,提醒維護人員及時更換硬盤,實現(xiàn)對Linux服務器的硬盤進行實時健康檢查、例行維護等目的,保障了業(yè)務的穩(wěn)定性;同時,本發(fā)明所述監(jiān)控方法中,當硬盤正常時,不會生成日志文件,并且當硬盤故障排除后自動刪除日志文件; 該Linux服務器硬盤在線狀態(tài)的監(jiān)控方法的具體內(nèi)容包括:1)對需要進行硬盤狀態(tài)監(jiān)控的Linux服務器部署HDmon腳本,復制腳本文件至任意目錄;2)賦予HDmon腳本文件可執(zhí)行權限;3)設置接收警報的郵箱帳號;4)設置后臺執(zhí)行腳本程序。
2.根據(jù)權利要求1所述的Linux服務器硬盤在線狀態(tài)的監(jiān)控方法,其特征在于,所述報警機制為郵件告警。
3.根據(jù)權利要求1所述的Linux服務器硬盤在線狀態(tài)的監(jiān)控方法,其特征在于,當硬盤正常時,沒有日志文件產(chǎn)生;當硬盤故障排除后,日志文件自動刪除。
4.根據(jù)權利要求1所述的Linux服務器硬盤在線狀態(tài)的監(jiān)控方法,其特征在于,所述HDmon腳本程序為:
5.根據(jù)權利要求2或3所述的Linux服務器硬盤在線狀態(tài)的監(jiān)控方法,其特征在于,該監(jiān)控方法的具體流程為:在Linux服務器上運行HDmon腳本程序,對硬盤狀態(tài)開始監(jiān)控,按設定掃描時間自動掃描服務器當前的硬盤狀態(tài),并記錄到disk, now文件中,跟初始配置文件進行比對;若硬盤全部在線,則無任何日志文件生成,并對硬盤繼續(xù)監(jiān)控;若有硬盤離線,則將異常信息寫入日志,生成日志文件,并觸發(fā)郵件告警,提醒維護人員進行故障處理,故障排除后自動刪除日志文件,此時故障硬盤恢復正常,程序繼續(xù)監(jiān)控全部硬盤;若日志文件沒有自動刪除還存在,則繼續(xù)發(fā)出郵件告警,提醒維護人員繼續(xù)進行故障處理。
【文檔編號】G06F11/34GK103970642SQ201410215504
【公開日】2014年8月6日 申請日期:2014年5月21日 優(yōu)先權日:2014年5月21日
【發(fā)明者】李洋, 陳彬 申請人:浪潮電子信息產(chǎn)業(yè)股份有限公司