本發(fā)明涉及信息存儲技術領域,尤其涉及一種硬盤監(jiān)控方法及裝置。
背景技術:
硬盤是服務器系統(tǒng)不可缺少的存儲設備,硬盤損壞會導致數據無法正常讀寫,影響服務器可靠性。
對硬盤參數和健康狀態(tài)進行實時監(jiān)控,及時發(fā)現故障盤并隔離是一種防止業(yè)務受損的廉價有效方法。當前服務器所支持的硬盤數量變得越來越多,在滿足服務器日益增長的數據存儲空間同時,也使得我們監(jiān)控硬盤在線狀態(tài)的工作變得越來越繁瑣。服務器上運行的主要是linux系統(tǒng)和windows系統(tǒng),存儲模塊由物理盤、邏輯盤和控制器組成,不同類型設備參數有差異,目前的監(jiān)控工具多數只針對單一系統(tǒng)單一類型,對硬盤發(fā)生的故障只有告警提示,沒有區(qū)分故障類型,采取不同的應對措施。
技術實現要素:
本發(fā)明提供一種硬盤監(jiān)控方法及裝置,用以解決現有技術中對硬盤的監(jiān)控針對單一系統(tǒng)單一類型,對硬盤發(fā)生的故障只有告警提示,沒有區(qū)別故障類型的問題。
具體技術方案如下:
一種硬盤監(jiān)控的方法,包括:
獲取硬盤中的各項運行狀態(tài)參數;
判定所述各項運行狀態(tài)參數中是否存在異常參數;
若存在異常參數時,確定異常參數對應的類別,并生成對應類別的告警信息。
可選的,獲取硬盤中的各項運行狀態(tài)參數,包括:
調取配置的掃描周期;
根據所述掃描周期,周期性掃描所述硬盤中的各項運行狀態(tài)參數。
可選的,獲取硬盤中的各項運行狀態(tài)參數,具體為:獲取硬盤中的物理盤參數和/或邏輯盤參數和/或控制器參數;
所述判定所述各項運行狀態(tài)參數中是否存在異常參數,包括:
分別將物理盤參數與設定物理盤參數進行比較,將邏輯盤參數與設定邏輯盤參數進行比較,將控制器參數與設定控制器參數進行比較;
根據比較結果,確定所述物理盤參數和/或邏輯盤參數和/或控制器參數中是否存在異常參數。
可選的,在若存在異常參數時,確定異常參數對應的類別,并生成對應類別的告警信息,包括:
若確定物理盤參數異常時,則生成物理盤異常告警信息;
若確定邏輯盤參數異常時,則生成邏輯盤異常告警信息;
若確定控制器參數異常時,則生成控制器異常告警信息;
通過顯示界面呈現所述物理盤異常告警信息和/或邏輯盤異常告警信息和/或控制器異常告警信息以及采集到的所述物理盤參數和/或邏輯盤參數和/或控制器參數。
可選的,在若存在異常參數時,確定異常參數對應的類別,并生成對應類別的告警信息之后,所述方法還包括:
確定產生異常參數的故障裝置,并生成控制信號,其中,所述控制信號用于控制消除所述故障裝置的故障的執(zhí)行裝置;
將所述控制信號發(fā)送至所述執(zhí)行裝置。
一種硬盤監(jiān)控裝置,包括:
獲取模塊,用于獲取硬盤中的各項運行狀態(tài)參數;
判定模塊,用于判定所述各項運行狀態(tài)參數中是否存在異常參數;
處理模塊,用于若存在異常參數時,確定異常參數對應的類別,并生成對應類別的告警信息。
可選的,所述獲取模塊,具體用于調取配置的掃描周期;根據所述掃描周期,周期性掃描所述硬盤中的物理盤參數和/或邏輯盤參數和/或控制器參數。
可選的,所述獲取模塊,具體用于獲取硬盤中的物理盤參數和/或邏輯盤 參數和/或控制器參數;
所述判定模塊,具體用于分別將物理盤參數與設定物理盤參數進行比較,將邏輯盤參數與設定邏輯盤參數進行比較,將控制器參數與設定控制器參數進行比較;根據比較結果,確定所述物理盤參數和/或邏輯盤參數和/或控制器參數中是否存在異常參數。
可選的,所述處理模塊,具體用于若確定物理盤參數異常時,則生成物理盤異常告警信息;若確定邏輯盤參數異常時,則生成邏輯盤異常告警信息;若確定控制器參數異常時,則生成控制器異常告警信息;通過顯示界面呈現所述物理盤異常告警信息和/或邏輯盤異常告警信息和/或控制器異常告警信息以及采集到的所述物理盤參數和/或邏輯盤參數和/或控制器參數。
可選的,所述處理模塊,還用于確定產生異常參數的故障裝置,并生成控制信號,其中,所述控制信號用于控制消除所述故障裝置的故障的執(zhí)行裝置;將所述控制信號發(fā)送至所述執(zhí)行裝置。
本發(fā)明中硬盤監(jiān)控裝置獲取硬盤中的各項運行狀態(tài)參數,判定各項運行狀態(tài)參數中是否存在異常參數,若存在異常參數時,確定異常參數對應的類別,并生成對應類別的告警信息,也就是說,硬盤監(jiān)控裝置可以根據確定異常參數的類別,然后根據確定出的類別,生成對應類別的告警信息,從而解決了對硬盤發(fā)生的故障只有告警提示,沒有區(qū)別故障類型的問題,并且實現了對不同類別的異常參數進行對應類別的告警,提升了硬盤故障檢測的準確性。
附圖說明
圖1為本發(fā)明實施例中一種硬盤監(jiān)控方法的流程圖;
圖2為本發(fā)明實施例中一種硬盤監(jiān)控裝置的結構示意圖。
具體實施方式
本發(fā)明實施例提供了一種硬盤監(jiān)控的方法及裝置,該方法包括:獲取硬盤中的各項運行狀態(tài)參數,判定各項運行狀態(tài)參數中是否存在異常參數,若存在異常參數時,確定異常參數對應的類別,并生成對應類別的告警信息,也就是說,硬盤監(jiān)控裝置可以根據確定異常參數的類別,然后根據確定出的類別,生 成對應類別的告警信息,從而解決了對硬盤發(fā)生的故障只有告警提示,沒有區(qū)別故障類型的問題,并且實現了對不同類別的異常參數進行對應類別的告警,提升了硬盤故障檢測的準確性。
下面通過附圖以及具體實施例對本發(fā)明技術方案做詳細的說明,應當理解,本發(fā)明實施例以及實施例中的具體技術特征只是對本發(fā)明技術方案的說明,而不是限定,在不沖突的情況下,本發(fā)明實施例以及實施例中的具體技術特征可以相互組合。
如圖1所示為本發(fā)明實施例中一種硬盤監(jiān)控方法的流程圖,該方法包括:
s101,獲取硬盤中的各項運行狀態(tài)參數;
具體來講,當前的硬盤主要由物理盤、邏輯盤、控制器三個部分,物理盤的參數主要包括:物理盤溫度、尺寸、容量、型號、物理位置、硬盤編碼、健康狀態(tài)。
邏輯盤參數包括:容量、名稱、健康狀態(tài)、raid重建進度、cache狀態(tài);
控制器參數包括:型號、固件版本號、oprom版本號、緩存大小、溫度、bbu在位信息、bbu溫度、bbu電壓等。
在硬盤運行時,硬盤監(jiān)控裝置將獲取到上述的參數。
進一步,在本發(fā)明實施例中,為了使得硬盤的各項運行狀態(tài)參數被實時的獲取到,因此,為硬盤監(jiān)控裝置設置了一個掃描周期,在硬盤監(jiān)控裝置檢測硬盤的各項運行狀態(tài)參數時,該硬盤監(jiān)控裝置將調取出配置的掃描周期,根據掃描周期,周期性的掃描硬盤中的物理盤參數和/或邏輯盤參數和/或控制器參數。這種周期性的掃描方式不僅可以保證數據的采集效率,并且還可以在一定程度上減低硬盤監(jiān)控裝置的功耗。
s102,判定各項運行狀態(tài)參數中是否存在異常參數;
在s101中,硬盤監(jiān)控裝置獲取到硬盤的各項運行狀態(tài)參數,這些運行狀態(tài)參數中就包含了上述的各種參數。
硬盤監(jiān)控裝置將獲取到的各項運行狀態(tài)參數與設置好的硬盤參數進行比較,即:將物理盤參數與設定物理盤參數進行比較;將邏輯盤參數與設定邏輯盤參數進行比較;將控制器參數與設定控制器參數進行比較。
在上述的比較之后,硬盤監(jiān)控裝置將得到比較結果,根據比較結果,確定 物理盤參數和/或邏輯盤參數和/或控制器參數中是否存在異常參數。
比如說,硬盤監(jiān)控裝置獲取到物理盤中的各項運行狀態(tài)參數時,即:物理盤溫度、尺寸、容量、型號、物理位置、硬盤編碼、健康狀態(tài),硬盤監(jiān)控裝置將物理盤溫度與設定溫度進行比較,將容量與設定容量進行比較等,根據比較就可以得到的一個比較結果,從而確定是否存在異常參數。同理,邏輯盤以及控制器的處理方式與物理盤的處理方式一致,這里就不在一一說明。
s103,若存在異常參數時,確定異常參數對應的類別,并生成對應類別的告警信息。
具體來講,在s102中確定存在異常參數時,首選確定該異常參數對應的類別。
若是該異常參數為物理盤的溫度異常時,則硬盤監(jiān)控裝置確定物理硬盤參數異常,此時該硬盤監(jiān)控裝置將生成物理硬盤異常告警信息;
若是該異常參數為邏輯盤降低異常時,則硬盤監(jiān)控裝置將確定邏輯盤參數異常,此時該硬盤監(jiān)控裝置將生成邏輯盤異常告警信息;
若是該異常參數為控制器的bbu溫度參數異常時,則硬盤監(jiān)控裝置將確定控制器異常,此時該硬盤監(jiān)控裝置將生成控制器異常告警信息。
在上述的實施例中,硬盤監(jiān)控裝置可以根據參數的類別,生成對應類別的告警信息,這樣解決了硬盤監(jiān)控裝置只針對單一系統(tǒng)單一類型的問題,并且通過上述的方法還可以保證告警信息可以準確的反應出現異常的裝置,從而方便用戶可以及時的獲知以及處理故障問題。
進一步,在本發(fā)明實施例中,為了方便用戶可以及時查看到硬盤運行狀態(tài)參數以及異常告警信息,因此,在硬盤監(jiān)控裝置監(jiān)測到運行狀態(tài)參數以及異常告警信息之后,硬盤監(jiān)控裝置將檢測運行狀態(tài)參數以及異常告警信息通過顯示裝置進行顯示。
進一步,在本發(fā)明實施例中,硬盤監(jiān)控裝置在確定產生異常參數的故障裝置,并生成控制信號,將控制信號發(fā)送至執(zhí)行裝置,這里的控制信號用于控制消除故障裝置的執(zhí)行裝置。
比如說,硬盤監(jiān)控裝置檢測到物理硬盤的溫度異常時,硬盤監(jiān)控裝置將生成用于控制風扇提高轉速的控制信號,并且將該控制信號發(fā)送至風扇,風扇在 接收到控制信號之后將提高轉速,從而來降低物理硬盤的溫度,直至物理硬盤的溫度恢復到正常溫度,通過該方法不僅可以檢測硬盤出現的故障,并且還可以基于故障來自動的控制對應的裝置來的消除故障,提升了硬盤運行的穩(wěn)定性。
另外,在本發(fā)明實施例中,針對linux系統(tǒng)和windows系統(tǒng)來講,通過安裝不同的監(jiān)控程序與bmc通訊,從而bmc就可以得到硬盤的運行狀態(tài)參數,然后將運行狀態(tài)參數添加到管理界面中,并將管理界面直接呈現給用戶,用戶可以通過該管理界面來獲知以及管理硬盤的運行狀態(tài)。
對應本發(fā)明實施例中一種硬盤監(jiān)控的方法,本發(fā)明實施例還提供了一種硬盤監(jiān)控裝置,如圖2所示為本發(fā)明實施例中一種硬盤監(jiān)控裝置的結構示意圖,該裝置包括:
獲取模塊201,用于獲取硬盤中的各項運行狀態(tài)參數;
判定模塊202,用于判定所述各項運行狀態(tài)參數中是否存在異常參數;
處理模塊203,用于若存在異常參數時,確定異常參數對應的類別,并生成對應類別的告警信息。
進一步,在本發(fā)明實施例中,所述獲取模塊201,具體用于調取配置的掃描周期;根據所述掃描周期,周期性掃描所述硬盤中的物理盤參數和/或邏輯盤參數和/或控制器參數。
進一步,在本發(fā)明實施例中,所述獲取模塊201,具體用于獲取硬盤中的物理盤參數和/或邏輯盤參數和/或控制器參數;
所述判定模塊202,具體用于分別將物理盤參數與設定物理盤參數進行比較,將邏輯盤參數與設定邏輯盤參數進行比較,將控制器參數與設定控制器參數進行比較;根據比較結果,確定所述物理盤參數和/或邏輯盤參數和/或控制器參數中是否存在異常參數。
進一步,在本發(fā)明實施例中,所述處理模塊203,具體用于若確定物理盤參數異常時,則生成物理盤異常告警信息;若確定邏輯盤參數異常時,則生成邏輯盤異常告警信息;若確定控制器參數異常時,則生成控制器異常告警信息;通過顯示界面呈現所述物理盤異常告警信息和/或邏輯盤異常告警信息和/或控制器異常告警信息以及采集到的所述物理盤參數和/或邏輯盤參數和/或控制器參數。
進一步,在本發(fā)明實施例中,所述處理模塊203,還用于確定產生異常參數的故障裝置,并生成控制信號,其中,所述控制信號用于控制消除所述故障裝置的故障的執(zhí)行裝置;將所述控制信號發(fā)送至所述執(zhí)行裝置。
為使本發(fā)明實施例的目的、技術方案和優(yōu)點更加清楚,下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。