本發(fā)明涉及計(jì)算機(jī)軟件開發(fā)領(lǐng)域,具體涉及一種服務(wù)器整機(jī)燒機(jī)的檢測方法,通過該方法對服務(wù)器產(chǎn)品進(jìn)行出廠測試,能夠有效檢測服務(wù)器存在的異常狀況,可以減少人力、物力及流程管理的成本,提高測試覆蓋率。
背景技術(shù):
目前在服務(wù)器生產(chǎn)過程中,對于需要出廠的服務(wù)器都需要進(jìn)行出廠測試,即服務(wù)器的整機(jī)燒機(jī)測試(runing test)。通常的測試都是在服務(wù)器上電后,運(yùn)行一些特定程序,測試下一些功能模塊是否正常,比如對CPU、內(nèi)存等的特定測試程序,如果在測試過程中發(fā)現(xiàn)問題,無法繼續(xù)完成測試程序(fail),就中斷并退出測試程序。這種測試方法對一般比較常見的問題能夠發(fā)現(xiàn)。但是對于那些不常見的問題,尤其是服務(wù)器穩(wěn)定性方面的問題很難檢測出來。且由于服務(wù)器產(chǎn)品一般都工作在非常復(fù)雜的環(huán)境中,比如高溫、潮濕,惡略環(huán)境下,這就要求交付給用戶的服務(wù)器產(chǎn)品必須滿足比較高的穩(wěn)定性,如果仍按照通常的那種異常檢測方法,很可能會將工作狀態(tài)不穩(wěn)定產(chǎn)品交付客戶,從而影響公司的信譽(yù),甚至導(dǎo)致客戶投訴乃至索賠。
針對上述問題,本申請發(fā)明了一種對服務(wù)器出廠時(shí)進(jìn)行的整機(jī)燒機(jī)的檢測方法,可以很好提高服務(wù)器產(chǎn)品出廠時(shí)進(jìn)行的燒機(jī)測試覆率,從而有效地解決這些問題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明是為提高服務(wù)器產(chǎn)品燒機(jī)測試覆率所作的。首先,在待測試的服務(wù)器系統(tǒng)中運(yùn)行一個(gè)守護(hù)進(jìn)程,讓其可以永遠(yuǎn)運(yùn)行在服務(wù)器產(chǎn)品中,除非需要結(jié)束它;在守護(hù)進(jìn)程中設(shè)置錯(cuò)誤檢查步驟,添加內(nèi)存錯(cuò)誤檢查和糾正(Error Checking and Correcting,ECC)的定期異常檢查;在守護(hù)進(jìn)程中設(shè)置判斷是否有異常產(chǎn)生步驟,如果守護(hù)進(jìn)程有異常產(chǎn)生,將異常產(chǎn)生日志(log)寫入到隊(duì)列中;讀取分析記錄步驟,當(dāng)測試結(jié)束后,讀取服務(wù)器系統(tǒng)中的日志(log)數(shù)據(jù),分析是否有異常產(chǎn)生;判斷檢測是否通過步驟,如果沒有異常產(chǎn)生,則判斷檢測通過;否則為檢測未通過。
所述的服務(wù)器整機(jī)燒機(jī)的檢測方法,其特征還在于,在守護(hù)進(jìn)程中的判斷是否有異常產(chǎn)生步驟中,后面檢查出的異??梢躁懤m(xù)寫入日志。
所述的服務(wù)器整機(jī)燒機(jī)的檢測方法,其特征還在于,在守護(hù)進(jìn)程中的錯(cuò)誤檢查步驟中,還可以添加管理控制站(BMC)系統(tǒng)事件日志(SEL log)的定期異常檢查,檢查管理控制站系統(tǒng)事件日志(BMC)是否發(fā)生異常。
所述的服務(wù)器整機(jī)燒機(jī)的檢測方法,其特征還在于,在守護(hù)進(jìn)程中的錯(cuò)誤檢查步驟中,還可以添加主機(jī)總線適配器(Host Bus Adapter,HBA)的定期異常檢查,檢查主機(jī)總線適配器是否發(fā)生異常。
所述的服務(wù)器整機(jī)燒機(jī)的檢測方法,其特征還在于,在守護(hù)進(jìn)程中的錯(cuò)誤檢查步驟中,還可以添加硬盤的定期異常檢查,檢查硬盤是否發(fā)生異常。
所述的服務(wù)器整機(jī)燒機(jī)的檢測方法,其特征還在于,在守護(hù)進(jìn)程中的錯(cuò)誤檢查步驟中,還可以添加網(wǎng)卡的定期異常檢查,檢查網(wǎng)卡是否發(fā)生異常。
所述的服務(wù)器整機(jī)燒機(jī)的檢測方法,其特征還在于,在守護(hù)進(jìn)程中的錯(cuò)誤檢查步驟,定期檢查一般可以設(shè)置五分鐘檢查一次。
所述的服務(wù)器整機(jī)燒機(jī)的檢測方法,其特征還在于,判斷是否有異常產(chǎn)生步驟中,日志(log)可以分設(shè)不同的錯(cuò)誤嚴(yán)重級別,根據(jù)錯(cuò)誤種類分別寫入。
附圖說明
圖1、服務(wù)器測試流程圖
圖2、本發(fā)明中守護(hù)進(jìn)程的工作流程圖
具體實(shí)施方式
下面對本發(fā)明的內(nèi)容進(jìn)行更加詳細(xì)的闡述:
本發(fā)明申請需要測試的服務(wù)器為一般情況下安裝Linux操作系統(tǒng)中。在待測試的服務(wù)器系統(tǒng)中運(yùn)行一個(gè)守護(hù)進(jìn)程,讓其可以永遠(yuǎn)運(yùn)行在服務(wù)器產(chǎn)品中,除非需要手動結(jié)束運(yùn)行它。
在守護(hù)進(jìn)程中,可以設(shè)置對不同的設(shè)備或內(nèi)存進(jìn)行檢查。在本發(fā)明中,對內(nèi)存錯(cuò)誤檢查和糾正(Error Checking and Correcting,ECC),管理控制站(BMC)系統(tǒng)事件日志(SEL log),主機(jī)總線適配器(Host Bus Adapter,HBA),硬盤以及網(wǎng)卡都可以進(jìn)行定期檢查。
可以根據(jù)需要設(shè)置定期檢查的時(shí)間,本發(fā)明中,定期優(yōu)選的時(shí)間為5分鐘。
假設(shè)測試8個(gè)小時(shí),測試期間,守護(hù)進(jìn)程一直運(yùn)行不會停。當(dāng)測試出異常后,守護(hù)進(jìn)程會將異常信息寫入log日志,根據(jù)異常的類型,和錯(cuò)誤的嚴(yán)重情況,可以將日志進(jìn)行分類,將不同的錯(cuò)誤信息寫入不同的日志中。后續(xù)發(fā)現(xiàn)異常后,異常信息仍會陸續(xù)寫入到隊(duì)列中。
對服務(wù)器進(jìn)行燒機(jī)測試的時(shí)候只需要執(zhí)行該守護(hù)進(jìn)程即可。
守護(hù)進(jìn)程的程序代碼如下,守護(hù)進(jìn)程可以用C++語言寫,或其他語言。
當(dāng)服務(wù)器燒機(jī)測試的時(shí)間結(jié)束后,可以檢查日志,看是否存在錯(cuò)誤報(bào)告,如果沒有,則檢測合格,如果檢查到錯(cuò)誤,可以進(jìn)行后續(xù)的異常分析、故障排除等操作。
采用本發(fā)明這種對服務(wù)器出廠時(shí)進(jìn)行的整機(jī)燒機(jī)的檢測方法,可以很好提高服務(wù)器產(chǎn)品出廠時(shí)進(jìn)行的燒機(jī)測試覆率,從而有效發(fā)現(xiàn)服務(wù)器存在的問題。