一種多結(jié)點(diǎn)mic卡檢測方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種多結(jié)點(diǎn)MIC卡檢測方法及系統(tǒng),應(yīng)用于Linux集群管理領(lǐng)域:上述方法包括以下步驟:獲取/etc/hosts下各結(jié)點(diǎn)IP地址并根據(jù)獲取的所述各結(jié)點(diǎn)IP地址以ssh方式訪問各結(jié)點(diǎn);對可連通結(jié)點(diǎn)上MIC卡狀況進(jìn)行檢測并根據(jù)檢測結(jié)果,進(jìn)行變量標(biāo)識并用相應(yīng)顏色顯示;通過實(shí)施本發(fā)明的技術(shù)方案,通過多結(jié)點(diǎn)MIC卡檢測腳本工具實(shí)現(xiàn)多個結(jié)點(diǎn)上MIC卡是否正常工作的自動化檢測,并通過不同的顏色來提醒操作者各結(jié)點(diǎn)的狀態(tài),減少手動檢測的步驟和工作量。
【專利說明】一種多結(jié)點(diǎn)MIC卡檢測方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及Linux集群管理領(lǐng)域,尤其涉及一種多結(jié)點(diǎn)MIC卡檢測方法及系統(tǒng)?!颈尘凹夹g(shù)】
[0002]隨著集群以及超級計算機(jī)計算能力的快速提高以及廣泛應(yīng)用,可以預(yù)見采用加速部件(如MIC卡)進(jìn)行并行計算加速的情形會越來越多;加速部件可以提供幾十甚至成百上千的并行進(jìn)程,并行進(jìn)程中的資源競爭是顯而易見的,這也使得在使用加速部件時,內(nèi)存溢出以及其他異常現(xiàn)象會使得加速部件工作不正常。
[0003]目前,檢測多結(jié)點(diǎn)MIC卡,需要手動去登錄每一個結(jié)點(diǎn)并驗證MIC是否工作正常,如果對于上百或上千結(jié)點(diǎn)的MIC卡進(jìn)行檢測,將要手動進(jìn)行登錄結(jié)點(diǎn)以及MIC基本信息查詢及查看等大量操作,此時手動輸入將會增加人為因素出錯幾率,所以對各結(jié)點(diǎn)上的加速部件是否正常工作的自動檢測,是當(dāng)前亟待解決的問題。
【發(fā)明內(nèi)容】
[0004]本發(fā)明提供一種多結(jié)點(diǎn)MIC卡檢測方法及系統(tǒng),以解決上述問題。
[0005]本發(fā)明提供一種多結(jié)點(diǎn)MIC卡檢測方法。上述方法包括以下步驟:
[0006]獲取/etc/hosts下各結(jié)點(diǎn)IP地址并根據(jù)獲取的所述各結(jié)點(diǎn)IP地址以ssh方式訪問各結(jié)點(diǎn);
[0007]對可連通結(jié)點(diǎn)上MIC卡狀況進(jìn)行檢測并根據(jù)檢測結(jié)果,進(jìn)行變量標(biāo)識并用相應(yīng)顏色顯示。
[0008]本發(fā)明還提供一種多結(jié)點(diǎn)MIC卡檢測系統(tǒng),包括:獲取模塊、訪問模塊、檢測模塊、反饋模塊;所述獲取模塊通過所述訪問模塊與檢測模塊相連;所述檢測模塊與所述反饋模塊相連;
[0009]所述獲取模塊,用于獲取/etc/hosts下各結(jié)點(diǎn)IP地址并將獲取的各結(jié)點(diǎn)IP地址輸出給所述訪問模塊;
[0010]所述訪問模塊,用于根據(jù)獲取的所述各結(jié)點(diǎn)IP地址以SSh方式訪問各結(jié)點(diǎn);
[0011]所述檢測模塊,用于對可連通結(jié)點(diǎn)上MIC卡狀況進(jìn)行檢測并將檢測結(jié)果輸出給所述反饋模塊;
[0012]所述反饋模塊,用于根據(jù)檢測結(jié)果,進(jìn)行變量標(biāo)識并用相應(yīng)顏色顯示。
[0013]通過實(shí)施本發(fā)明的技術(shù)方案,通過多結(jié)點(diǎn)MIC卡檢測腳本工具實(shí)現(xiàn)多個結(jié)點(diǎn)上MIC卡是否正常工作的自動化檢測,并通過不同的顏色來提醒操作者各結(jié)點(diǎn)的狀態(tài),減少手動檢測的步驟和工作量。
【專利附圖】
【附圖說明】
[0014]此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本申請的一部分,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:[0015]圖1所示為本發(fā)明的實(shí)施例1的多結(jié)點(diǎn)MIC卡檢測方法流程圖;
[0016]圖2所示為本發(fā)明的實(shí)施例2的多結(jié)點(diǎn)MIC卡檢測系統(tǒng)結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0017]下文中將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本發(fā)明。需要說明的是,在不沖突的情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相互組合。
[0018]本發(fā)明提供一種多結(jié)點(diǎn)MIC卡檢測方法,其特征在于,包括以下步驟:
[0019]獲取/etc/hosts下各結(jié)點(diǎn)IP地址并根據(jù)獲取的所述各結(jié)點(diǎn)IP地址以ssh方式訪問各結(jié)點(diǎn);
[0020]對可連通結(jié)點(diǎn)上MIC卡狀況進(jìn)行檢測并根據(jù)檢測結(jié)果,進(jìn)行變量標(biāo)識并用相應(yīng)顏色顯示。
[0021]其中,獲取/etc/hosts下各結(jié)點(diǎn)IP地址的過程為:通過腳本讀入Linux系統(tǒng)/etc/hosts文件獲得各結(jié)點(diǎn)IP地址。
[0022]其中,將獲得的各結(jié)點(diǎn)IP地址傳入變量中。
[0023]其中,根據(jù)獲取的所述各結(jié)點(diǎn)IP地址以ssh方式訪問各結(jié)點(diǎn)的過程包括:各結(jié)點(diǎn)ssh檢測及ssh登陸。
[0024]其中,各結(jié)點(diǎn)ssh檢測及ssh登陸是指:依據(jù)獲得的所述各節(jié)點(diǎn)IP地址,進(jìn)行ssh連通性檢測,并登陸到可連通結(jié)點(diǎn)。
[0025]其中,依據(jù)獲得的所述各節(jié)點(diǎn)IP地址,進(jìn)行ssh連通性檢測,并登陸到可連通結(jié)點(diǎn)的過程為:對包含IP地址的變量,使用SSh命令連接相應(yīng)IP地址,并獲得執(zhí)行SSh命令的返回值,如返回值正常則ssh可連通,如返回至異常則ssh無法連通,對于可連通的IP地址進(jìn)行ssh登陸。
[0026]其中,對可連通結(jié)點(diǎn)上MIC卡狀況進(jìn)行檢測的過程為:登陸到可連通結(jié)點(diǎn)并檢測所述可連通結(jié)點(diǎn)上MIC卡是否正常工作。
[0027]其中,登陸到可連通結(jié)點(diǎn)并檢測所述可連通結(jié)點(diǎn)上MIC卡是否正常工作的過程為:執(zhí)行Linux系統(tǒng)命令I(lǐng)spci查詢pci總線相關(guān)信息,將查詢獲得的pci總線相關(guān)信息進(jìn)行篩選,如果有MIC卡的相關(guān)信息,說明系統(tǒng)正常識別MIC卡;若正常識別MIC卡,則執(zhí)行MIC卡驅(qū)動自帶命令micinfo,將查詢獲得的MIC卡相關(guān)信息進(jìn)行篩選,如果有異常信息,說明MIC卡工作異常。
[0028]其中,根據(jù)檢測結(jié)果,進(jìn)行變量標(biāo)識并用相應(yīng)顏色顯示的過程為:若MIC卡識別異?;騇IC卡相關(guān)信息異常,則標(biāo)識該結(jié)點(diǎn)的相應(yīng)變量,并以紅色字體閃爍顯示該結(jié)點(diǎn)及MIC編號;若MIC卡識別正常并且MIC卡相關(guān)信息正常,則標(biāo)識該結(jié)點(diǎn)的相應(yīng)變量,并以綠色字體顯示該結(jié)點(diǎn)及MIC編號。
[0029]本發(fā)明通過腳本工具來達(dá)到簡化操作的目的,適用于多結(jié)點(diǎn)MIC卡檢測腳本工具主要分為:獲取/etc/hosts下各結(jié)點(diǎn)IP地址;各結(jié)點(diǎn)ssh檢測及ssh登陸;各結(jié)點(diǎn)MIC狀況檢測;各結(jié)點(diǎn)MIC狀況變量標(biāo)識并用相應(yīng)顏色顯示。
[0030]其中:獲取/etc/hosts下各結(jié)點(diǎn)IP地址是通過腳本讀入Linux系統(tǒng)/etc/hosts文件獲得各結(jié)點(diǎn)IP地址;將獲得的各結(jié)點(diǎn)IP地址傳入變量中。
[0031 ] 其中,各結(jié)點(diǎn)ssh檢測及ssh登陸是依據(jù)所獲得的IP地址,進(jìn)行ssh連通性檢測,并登陸到可連通結(jié)點(diǎn);各結(jié)點(diǎn)SSh檢測及SSh登陸是依據(jù)所獲得的IP地址,進(jìn)行SSh連通性檢測,并登陸到可連通結(jié)點(diǎn)的具體過程為:對包含IP地址的變量,使用ssh命令連接相應(yīng)IP地址,并獲得執(zhí)行ssh命令的返回值,如返回值正常則ssh可連通,如返回至異常則ssh無法連通,對于可連通的IP地址進(jìn)行SSh登陸。
[0032]其中,各結(jié)點(diǎn)MIC狀況檢測是指:登陸到可連通結(jié)點(diǎn)并檢測所述可連通結(jié)點(diǎn)上MIC卡是否正常工作;登陸到可連通結(jié)點(diǎn)并檢測所述可連通結(jié)點(diǎn)上MIC卡是否正常工作的具體過程為:執(zhí)行Linux系統(tǒng)命令I(lǐng)spci查詢pci總線相關(guān)信息,將查詢獲得的pci總線相關(guān)信息進(jìn)行篩選,如果有MIC卡的相關(guān)信息,說明系統(tǒng)正常識別MIC卡;若正常識別MIC卡,則執(zhí)行MIC卡驅(qū)動自帶命令micinfo,將查詢獲得的MIC卡相關(guān)信息進(jìn)行篩選,如果有異常信息,說明MIC卡工作異常。
[0033]各結(jié)點(diǎn)MIC狀況變量標(biāo)識并用相應(yīng)顏色顯示是指:依據(jù)MIC卡是否正常工作來標(biāo)識變量,并用相應(yīng)的顏色進(jìn)行顯示;其中,各結(jié)點(diǎn)MIC狀況變量標(biāo)識并用相應(yīng)顏色顯示是指:依據(jù)MIC卡是否正常工作來標(biāo)識變量,并用相應(yīng)的顏色進(jìn)行顯示的具體過程為:若MIC卡識別異?;騇IC卡相關(guān)信息異常,則標(biāo)識該結(jié)點(diǎn)的相應(yīng)變量,并以紅色字體閃爍顯示該結(jié)點(diǎn)及MIC編號;若MIC卡識別正常并且MIC卡相關(guān)信息正常,則標(biāo)識該結(jié)點(diǎn)的相應(yīng)變量,并以綠色字體顯示該結(jié)點(diǎn)及MIC編號。
[0034]圖1所示為本發(fā)明的實(shí)施例1的多結(jié)點(diǎn)MIC卡檢測方法流程圖,包括以下步驟:
[0035]步驟101:獲取/etc/hosts下各結(jié)點(diǎn)IP地址并根據(jù)獲取的所述各結(jié)點(diǎn)IP地址以ssh方式訪問各結(jié)點(diǎn);
[0036]步驟102:對可連通結(jié)點(diǎn)上MIC卡狀況進(jìn)行檢測并根據(jù)檢測結(jié)果,進(jìn)行變量標(biāo)識并用相應(yīng)顏色顯示。
[0037]圖2所示為本發(fā)明的實(shí)施例2的多結(jié)點(diǎn)MIC卡檢測系統(tǒng)結(jié)構(gòu)圖,包括:獲取模塊、訪問模塊、檢測模塊、反饋模塊;所述獲取模塊通過所述訪問模塊與檢測模塊相連;所述檢測模塊與所述反饋模塊相連;
[0038]所述獲取模塊,用于獲取/etc/hosts下各結(jié)點(diǎn)IP地址并將獲取的各結(jié)點(diǎn)IP地址輸出給所述訪問模塊;
[0039]所述訪問模塊,用于根據(jù)獲取的所述各結(jié)點(diǎn)IP地址以ssh方式訪問各結(jié)點(diǎn);
[0040]所述檢測模塊,用于對可連通結(jié)點(diǎn)上MIC卡狀況進(jìn)行檢測并將檢測結(jié)果輸出給所述反饋模塊;
[0041]所述反饋模塊,用于根據(jù)檢測結(jié)果,進(jìn)行變量標(biāo)識并用相應(yīng)顏色顯示
[0042]通過實(shí)施本發(fā)明的技術(shù)方案,通過多結(jié)點(diǎn)MIC卡檢測腳本工具實(shí)現(xiàn)多個結(jié)點(diǎn)上MIC卡是否正常工作的自動化檢測,并通過不同的顏色來提醒操作者各結(jié)點(diǎn)的狀態(tài),減少手動檢測的步驟和工作量。
[0043]以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種多結(jié)點(diǎn)Mic卡檢測方法,其特征在于,包括以下步驟: 獲取/etc/hosts下各結(jié)點(diǎn)IP地址并根據(jù)獲取的所述各結(jié)點(diǎn)IP地址以ssh方式訪問各結(jié)點(diǎn); 對可連通結(jié)點(diǎn)上MIC卡狀況進(jìn)行檢測并根據(jù)檢測結(jié)果,進(jìn)行變量標(biāo)識并用相應(yīng)顏色顯/Jn ο
2.根據(jù)權(quán)利要求1所述的方法,其特征在于:獲取/etc/hosts下各結(jié)點(diǎn)IP地址的過程為:通過腳本讀入Linux系統(tǒng)/etc/hosts文件獲得各結(jié)點(diǎn)IP地址。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于:將獲得的各結(jié)點(diǎn)IP地址傳入變量中。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于:根據(jù)獲取的所述各結(jié)點(diǎn)IP地址以ssh方式訪問各結(jié)點(diǎn)的過程包括:各結(jié)點(diǎn)ssh檢測及ssh登陸。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于:各結(jié)點(diǎn)ssh檢測及ssh登陸是指:依據(jù)獲得的所述各節(jié)點(diǎn)IP地址,進(jìn)行SSh連通性檢測,并登陸到可連通結(jié)點(diǎn)。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于:依據(jù)獲得的所述各節(jié)點(diǎn)IP地址,進(jìn)行ssh連通性檢測,并登陸到可連通結(jié)點(diǎn)的過程為:對包含IP地址的變量,使用SSh命令連接相應(yīng)IP地址,并獲得執(zhí)行SSh命令的返回值,如返回值正常則SSh可連通,如返回至異常則SSh無法連通,對于可連通的IP地址進(jìn)行SSh登陸。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于:對可連通結(jié)點(diǎn)上MIC卡狀況進(jìn)行檢測的過程為:登陸到可連通結(jié)點(diǎn)并檢測所述可連通結(jié)點(diǎn)上MIC卡是否正常工作。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于:登陸到可連通結(jié)點(diǎn)并檢測所述可連通結(jié)點(diǎn)上MIC卡是否正常工作的過程為:執(zhí)行Linux系統(tǒng)命令I(lǐng)spci查詢pci總線相關(guān)信息,將查詢獲得的Pci總線相關(guān)信息進(jìn)行篩選,如果有MIC卡的相關(guān)信息,說明系統(tǒng)正常識別MIC卡;若正常識別MIC卡,則執(zhí)行MIC卡驅(qū)動自帶命令micinfo,將查詢獲得的MIC卡相關(guān)信息進(jìn)行篩選,如果有異常信息,說明MIC卡工作異常。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于:根據(jù)檢測結(jié)果,進(jìn)行變量標(biāo)識并用相應(yīng)顏色顯示的過程為:若MIC卡識別異?;騇IC卡相關(guān)信息異常,則標(biāo)識該結(jié)點(diǎn)的相應(yīng)變量,并以紅色字體閃爍顯示該結(jié)點(diǎn)及MIC編號;SMIC卡識別正常并且MIC卡相關(guān)信息正常,則標(biāo)識該結(jié)點(diǎn)的相應(yīng)變量,并以綠色字體顯示該結(jié)點(diǎn)及MIC編號。
10.一種多結(jié)點(diǎn)MIC卡檢測系統(tǒng),其特征在于,包括:獲取模塊、訪問模塊、檢測模塊、反饋模塊;所述獲取模塊通過所述訪問模塊與檢測模塊相連;所述檢測模塊與所述反饋模塊相連; 所述獲取模塊,用于獲取/etc/hosts下各結(jié)點(diǎn)IP地址并將獲取的各結(jié)點(diǎn)IP地址輸出給所述訪問模塊; 所述訪問模塊,用于根據(jù)獲取的所述各結(jié)點(diǎn)IP地址以ssh方式訪問各結(jié)點(diǎn); 所述檢測模塊,用于對可連通結(jié)點(diǎn)上MIC卡狀況進(jìn)行檢測并將檢測結(jié)果輸出給所述反饋豐吳塊; 所述反饋模塊,用于根據(jù)檢測結(jié)果,進(jìn)行變量標(biāo)識并用相應(yīng)顏色顯示。
【文檔編號】G06F11/32GK103713986SQ201410016682
【公開日】2014年4月9日 申請日期:2014年1月14日 優(yōu)先權(quán)日:2014年1月14日
【發(fā)明者】陳博文 申請人:浪潮(北京)電子信息產(chǎn)業(yè)有限公司