可配置和容錯(cuò)的基板管理控制器安排的制作方法
【專(zhuān)利摘要】系統(tǒng)和方法利用多節(jié)點(diǎn)系統(tǒng)中的可配置容錯(cuò)基板管理控制器(BMC)安排。在一個(gè)示例中,該方法可包括將該多個(gè)BMC的第一BMC指定為主BMC的角色、確定該第一BMC可不再充當(dāng)該主BMC的角色、以及指定除該第一BMC之外的BMC充當(dāng)該主BMC的角色。
【專(zhuān)利說(shuō)明】可配置和容錯(cuò)的基板管理控制器安排
[0001]背景
【技術(shù)領(lǐng)域】
[0002]實(shí)施例總體上涉及減輕多節(jié)點(diǎn)服務(wù)器系統(tǒng)中的故障的影響。更具體而言,實(shí)施例涉及利用多節(jié)點(diǎn)服務(wù)器中的基板管理控制器(BMC)安排。
[0003]討論
[0004]服務(wù)器系統(tǒng)可利用包含多個(gè)節(jié)點(diǎn)的單個(gè)機(jī)架。這些服務(wù)器系統(tǒng)可利用與節(jié)點(diǎn)分離的機(jī)架管理控制器以便集中地管理系統(tǒng)資源。然而,如果機(jī)架管理控制器出故障,整個(gè)系統(tǒng)的操作會(huì)出故障。因此,實(shí)現(xiàn)可配置和容錯(cuò)的服務(wù)器系統(tǒng)實(shí)施例可以是有益的。
[0005]附圖簡(jiǎn)要說(shuō)明
[0006]通過(guò)閱讀以下說(shuō)明書(shū)和所附權(quán)利要求書(shū)并且通過(guò)參考以下附圖,本發(fā)明實(shí)施例的各種優(yōu)點(diǎn)將對(duì)本領(lǐng)域普通技術(shù)人員變得明顯,在附圖中:
[0007]圖1是根據(jù)本發(fā)明的實(shí)施例的實(shí)現(xiàn)可配置和容錯(cuò)的基板管理控制器安排的計(jì)算系統(tǒng)的示例的框圖;以及
[0008]圖2是根據(jù)本發(fā)明的實(shí)施例的利用可配置和容錯(cuò)的基板管理控制器安排的方法的示例的流程圖。
[0009]詳細(xì)描述
[0010]現(xiàn)在轉(zhuǎn)向圖1,示出利用可配置和容錯(cuò)的基板管理控制器安排的計(jì)算系統(tǒng)10的框圖。計(jì)算系統(tǒng)10可包括(除其他事項(xiàng)之外)機(jī)架100、第一節(jié)點(diǎn)服務(wù)器200、第二節(jié)點(diǎn)服務(wù)器300、第三節(jié)點(diǎn)服務(wù)器400、輸入/輸出(I/O)擴(kuò)展器600。計(jì)算系統(tǒng)10可耦合到網(wǎng)絡(luò)1100。
[0011]機(jī)架100可包括第一節(jié)點(diǎn)101、第二節(jié)點(diǎn)102、和第三節(jié)點(diǎn)103。節(jié)點(diǎn)101、102、103
可以是包括一個(gè)或多個(gè)組件的任何可替換單元。這些組件的示例包括(除其他事項(xiàng)之外)硬盤(pán)驅(qū)動(dòng)器、基板、側(cè)板、或?qū)影濉?br>
[0012]機(jī)架100還可包括第一風(fēng)扇105、第二風(fēng)扇106、和第三風(fēng)扇107。風(fēng)扇105、106、107可用于使機(jī)架100內(nèi)的組件冷卻。機(jī)架還可包括電源104。電源104可用于為機(jī)架100內(nèi)的各組件供電。如在此所使用的,風(fēng)扇105、106、107和電源104可以是系統(tǒng)資源的示例。其他系統(tǒng)資源可包括硬盤(pán)驅(qū)動(dòng)器、傳感器、硬盤(pán)驅(qū)動(dòng)器和存儲(chǔ)背板。
[0013]第一節(jié)點(diǎn)服務(wù)器200可以是被配置成用于監(jiān)控、管理、支持、和控制第一節(jié)點(diǎn)101的操作的多個(gè)方面的計(jì)算機(jī)服務(wù)器系統(tǒng)。類(lèi)似地,第二節(jié)點(diǎn)服務(wù)器300和第三節(jié)點(diǎn)服務(wù)器400可被配置成用于分別監(jiān)控、管理、支持、和控制第二節(jié)點(diǎn)102和第三節(jié)點(diǎn)103的操作的多個(gè)方面。
[0014]第一節(jié)點(diǎn)服務(wù)器200可包括第一節(jié)點(diǎn)存儲(chǔ)器組件201、第一節(jié)點(diǎn)固件組件202、和第一節(jié)點(diǎn)處理組件203。類(lèi)似地,第二節(jié)點(diǎn)服務(wù)器300可包括第二節(jié)點(diǎn)存儲(chǔ)器組件301、第二節(jié)點(diǎn)固件組件302、和第二節(jié)點(diǎn)處理組件303。同樣,第三節(jié)點(diǎn)服務(wù)器400可包括第三節(jié)點(diǎn)存儲(chǔ)器組件401、第三節(jié)點(diǎn)固件組件402、和第三節(jié)點(diǎn)處理組件403。
[0015]第一節(jié)點(diǎn)存儲(chǔ)器組件201可包括第一節(jié)點(diǎn)服務(wù)器應(yīng)用204,其可被配置成用于(除其他事項(xiàng)之外)監(jiān)控、管理、支持、和控制第一節(jié)點(diǎn)101的操作的多個(gè)方面。類(lèi)似地,第二節(jié)點(diǎn)存儲(chǔ)器組件301可包括第二節(jié)點(diǎn)服務(wù)器應(yīng)用304,可相對(duì)于第二節(jié)點(diǎn)102類(lèi)似地利用該第二節(jié)點(diǎn)服務(wù)器應(yīng)用。同樣,第三節(jié)點(diǎn)存儲(chǔ)器組件401可包括第三節(jié)點(diǎn)服務(wù)器應(yīng)用404,可相對(duì)于第三節(jié)點(diǎn)103類(lèi)似地利用該第三節(jié)點(diǎn)服務(wù)器應(yīng)用。
[0016]第一節(jié)點(diǎn)服務(wù)器200可包括第一節(jié)點(diǎn)BMC 205,其可被配置成用于監(jiān)控、管理、支持、和控制多節(jié)點(diǎn)系統(tǒng)的操作的多個(gè)方面。在本實(shí)施例中,除其他事項(xiàng)之外,其可被配置成用于監(jiān)控、管理、支持、和控制其相關(guān)聯(lián)的節(jié)點(diǎn)(第一節(jié)點(diǎn)101)的操作的多個(gè)方面。
[0017]例如,第一節(jié)點(diǎn)BMC 205可被配置成用于(除其他事項(xiàng)之外)傳遞與第一節(jié)點(diǎn)101的操作相關(guān)的信息(例如,功率水平、溫度讀數(shù)、和電壓電平信息)。附加地,第一節(jié)點(diǎn)BMC205還可被配置成用于促進(jìn)第一節(jié)點(diǎn)101與被配置成用于監(jiān)控、管理、支持、和控制第一節(jié)點(diǎn)101的操作的任何實(shí)體(例如,第一節(jié)點(diǎn)服務(wù)器應(yīng)用204)之間的接口連接。第二節(jié)點(diǎn)BMC 305可被配置成用于相對(duì)于第二節(jié)點(diǎn)102類(lèi)似地操作。同樣,第三節(jié)點(diǎn)BMC 405可被配置成用于相對(duì)于第三節(jié)點(diǎn)103類(lèi)似地操作。
[0018]第一節(jié)點(diǎn)BMC 205可包括第一節(jié)點(diǎn)BMC固件組件206。類(lèi)似地,第二節(jié)點(diǎn)BMC 305可包括第二節(jié)點(diǎn)BMC固件組件306。同樣,第三節(jié)點(diǎn)BMC可包括第三節(jié)點(diǎn)BMC存儲(chǔ)器組件406,其中,第三節(jié)點(diǎn)BMC存儲(chǔ)器組件406可包括第三節(jié)點(diǎn)BMC軟件應(yīng)用407。第一節(jié)點(diǎn)BMC固件組件206、第二節(jié)點(diǎn)BMC固件組件306、和第三節(jié)點(diǎn)BMC軟件應(yīng)用407可被配置成用于(除其他事項(xiàng)之外)通過(guò)經(jīng)由電源管理總線(xiàn)500向電源104傳輸指令將電源指引到機(jī)架100。
[0019]I/O擴(kuò)展器600可以是(除其他事項(xiàng)之外)可允許BMC(例如,第一節(jié)點(diǎn)BMC 205)檢測(cè)計(jì)算系統(tǒng)10內(nèi)是否存在節(jié)點(diǎn)(例如,第一節(jié)點(diǎn)101)。I/O擴(kuò)展器600可通過(guò)節(jié)點(diǎn)間BMC總線(xiàn)700耦合到第一節(jié)點(diǎn)BMC 205、第二節(jié)點(diǎn)BMC 305、和第三節(jié)點(diǎn)BMC 405。
[0020]網(wǎng)絡(luò)1100可通過(guò)第一網(wǎng)絡(luò)接口 800、第二網(wǎng)絡(luò)接口 900、和第三網(wǎng)絡(luò)接口 1000分別耦合到第一節(jié)點(diǎn)BMC 205、第二節(jié)點(diǎn)BMC 305、和第三節(jié)點(diǎn)BMC 405。這些網(wǎng)絡(luò)接口可用于(除其他事項(xiàng)之外)遠(yuǎn)程地配置計(jì)算系統(tǒng)10的各組件。
[0021]在本發(fā)明的實(shí)施例中,任何耦合BMC可承擔(dān)多節(jié)點(diǎn)系統(tǒng)的“主” BMC的角色。一旦BMC已經(jīng)被指定為主,所指定的主BMC可充當(dāng)系統(tǒng)內(nèi)的所有耦合節(jié)點(diǎn)(包括其相關(guān)聯(lián)的節(jié)點(diǎn))的主BMC。換言之,主BMC可相對(duì)于多節(jié)點(diǎn)系統(tǒng)的操作充當(dāng)中央接口。當(dāng)指定了主BMC時(shí),多節(jié)點(diǎn)系統(tǒng)內(nèi)的任何其他BMC可承擔(dān)“從”的角色。
[0022]可由主BMC實(shí)現(xiàn)的節(jié)點(diǎn)的操作的多個(gè)方面的示例可包括但不限于監(jiān)控系統(tǒng)組件的多個(gè)方面(例如,溫度、功率)、管理(例如,向系統(tǒng)組件傳輸相關(guān)有關(guān)數(shù)據(jù))系統(tǒng)組件、支持(例如,獲得和安裝固件和軟件更新)、和控制(例如,指引系統(tǒng)資源的配置)系統(tǒng)組件。通過(guò)單個(gè)主BMC實(shí)現(xiàn)這些方面可(除其他事項(xiàng)之外)降低系統(tǒng)擁塞(例如,通信總線(xiàn)上的業(yè)務(wù)量)以及避免冗余(例如,在安裝軟件更新時(shí))。
[0023]在本發(fā)明的實(shí)施例中,算法可被配置成用于指定主BMC。該算法可尤其確定將初始地指定哪個(gè)BMC作為主、或者一旦當(dāng)前主BMC可能不再可用就將哪個(gè)BMC指定作為新主。當(dāng)前的主BMC可能出于各種原因不再可用,各種原因包括系統(tǒng)組件的故障、移除(例如,物理移除)、或指示。實(shí)際上,如將更詳細(xì)地描述的,系統(tǒng)組件諸如固件組件(例如,第一節(jié)點(diǎn)BMC固件組件206)或軟件應(yīng)用(例如,第三節(jié)點(diǎn)BMC軟件應(yīng)用407)可初始地執(zhí)行主BMC、從當(dāng)前主BMC移除主狀態(tài)、以及指定新的主BMC等等。
[0024]在某些實(shí)施例中,算法可基于節(jié)點(diǎn)標(biāo)識(shí)號(hào)指定主BMC。例如,一個(gè)這種算法可基于最低標(biāo)識(shí)號(hào)指定主BMC。這樣,在圖1中描述的實(shí)施例中,這種算法可首先將第一節(jié)點(diǎn)BMC206指定為主BMC,然后是第二節(jié)點(diǎn)BMC 207,以此類(lèi)推。
[0025]在本發(fā)明的實(shí)施例中,主BMC可由各種裝置指定和配置。例如,主BMC可由BMC固件組件(例如,第一節(jié)點(diǎn)固件組件202)或通過(guò)執(zhí)行軟件應(yīng)用(例如,第一節(jié)點(diǎn)服務(wù)器應(yīng)用204)來(lái)指定和配置。
[0026]在其他實(shí)施例中,可通過(guò)由任何耦合節(jié)點(diǎn)附屬的主機(jī)接口使用應(yīng)用配置BMC。這種應(yīng)用的示例可以是設(shè)置實(shí)用程序,如基本輸入輸出系統(tǒng)(B1S)。
[0027]還可通過(guò)遠(yuǎn)程連接配置BMC。例如,網(wǎng)絡(luò)(諸如網(wǎng)絡(luò)1100)可使用網(wǎng)絡(luò)接口(例如,第一網(wǎng)絡(luò)接口 800)來(lái)遠(yuǎn)程地(例如,通過(guò)以太網(wǎng)、局域網(wǎng)(LAN)等等)指定和配置主BMC。
[0028]主BMC可傳輸有關(guān)主BMC對(duì)主狀態(tài)的所有權(quán)的信息(例如,配置信息、設(shè)置信息),以便促進(jìn)將主BMC的角色傳輸給另一個(gè)BMC,如果需要的話(huà)。這樣,例如,如果第一節(jié)點(diǎn)BMC205被指定為主,其可周期性地將信息傳輸給從BMC (例如,第二節(jié)點(diǎn)BMC 305、第三節(jié)點(diǎn)BMC405),以便促進(jìn)(未來(lái))將主的角色傳輸給從。
[0029]圖1中描繪的框的安排和編號(hào)可不旨在暗示操作順序從而排除其他可能性。本領(lǐng)域普通技術(shù)人員將認(rèn)識(shí)到能夠?qū)ο到y(tǒng)和方法進(jìn)行各種修改和改動(dòng)。
[0030]例如,在圖1中描述的實(shí)施例中,一個(gè)BMC(例如,BMC 206)可主要地附屬有一個(gè)節(jié)點(diǎn)(例如,節(jié)點(diǎn)101)。這無(wú)需是這種情況。本發(fā)明的其他實(shí)施例可允許單個(gè)BMC監(jiān)控、管理、支持、以及控制多于一個(gè)節(jié)點(diǎn)。
[0031]現(xiàn)在轉(zhuǎn)向圖2,示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的使用可配置和容錯(cuò)的基板管理控制器安排的示例性方法的流程圖。該方法可被實(shí)現(xiàn)為存儲(chǔ)在使用電路技術(shù)(諸如專(zhuān)用集成電路(ASIC)、互補(bǔ)金屬氧化物半導(dǎo)體(CMOS)或晶體管-晶體管邏輯(TTL)技術(shù)或其任意組合)的固定功能硬件中的可配置邏輯(諸如可編程邏輯陣列(PLA)、現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)、復(fù)雜可編程邏輯設(shè)備(CPLD)、)中的機(jī)器或計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)(諸如隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、可編程ROM(PROM)、固件、閃存等等)中的邏輯指令集。例如,可用一種或多種編程語(yǔ)言的任意組合編寫(xiě)用于執(zhí)行該方法中所示的操作的計(jì)算機(jī)程序代碼,包括面向?qū)ο蟮木幊陶Z(yǔ)言,諸如C++等等,以及常規(guī)程序編程語(yǔ)言,諸如“C”編程語(yǔ)H或類(lèi)似的編程語(yǔ)目。
[0032]在本實(shí)施例中,在第二節(jié)點(diǎn)BMC(諸如第二節(jié)點(diǎn)BMC 305 (圖1))和第三節(jié)點(diǎn)BMC(諸如第三節(jié)點(diǎn)BMC 405 (圖1))之后,第一節(jié)點(diǎn)BMC(諸如第一節(jié)點(diǎn)BMC 205 (圖1))可上線(xiàn)。第一節(jié)點(diǎn)BMC可具有標(biāo)識(shí)號(hào)1,第二節(jié)點(diǎn)可具有標(biāo)識(shí)號(hào)2,以此類(lèi)推。
[0033]該方法可在處理框2000開(kāi)始。在處理框2010,第二節(jié)點(diǎn)BMC和第三節(jié)點(diǎn)BMC可上線(xiàn)。在處理框2020,第二節(jié)點(diǎn)BMC和第三節(jié)點(diǎn)BMC可通過(guò)I/O擴(kuò)展器(諸如I/O擴(kuò)展器600 (圖1))檢測(cè)彼此的存在。在處理框2030,由第二節(jié)點(diǎn)BMC的BMC固件組件(諸如第二節(jié)點(diǎn)BMC固件組件306 (圖1))實(shí)現(xiàn)的算法可基于最低節(jié)點(diǎn)標(biāo)識(shí)號(hào)確定第二節(jié)點(diǎn)BMC應(yīng)當(dāng)承擔(dān)主BMC狀態(tài)的角色。具有更高節(jié)點(diǎn)標(biāo)識(shí)號(hào)的第三節(jié)點(diǎn)BMC可作為從BMC運(yùn)行。
[0034]在處理框2040,第一節(jié)點(diǎn)BMC可上線(xiàn)。在處理框2050,第一節(jié)點(diǎn)BMC的BMC固件組件(諸如第一節(jié)點(diǎn)BMC固件組件206(圖1))可基于最低標(biāo)識(shí)號(hào)(即,I)確定其應(yīng)當(dāng)聲明主BMC狀態(tài)。在處理框2060,第一節(jié)點(diǎn)BMC可傳輸消息以便通知其可承擔(dān)主BMC的角色。
[0035]在處理框2070,仍以主角色運(yùn)行的第二節(jié)點(diǎn)BMC可向第一節(jié)點(diǎn)BMC傳輸指示其將放棄主BMC的角色的響應(yīng)。該消息還可包括與第二節(jié)點(diǎn)BMC作為主BMC的角色有關(guān)的信息(例如,系統(tǒng)資源配置、系統(tǒng)狀態(tài)信息等等)。在處理框2080,第一節(jié)點(diǎn)BMC可開(kāi)始超時(shí)周期從而允許任何系統(tǒng)組件反對(duì)其承擔(dān)主BMC的角色。
[0036]在處理框2090,在超時(shí)周期在沒(méi)有任何反對(duì)的情況下過(guò)去之后,第一節(jié)點(diǎn)BMC可從第二節(jié)點(diǎn)BMC承擔(dān)主BMC的角色。在處理框2100,第一節(jié)點(diǎn)BMC可在超時(shí)周期內(nèi)傳輸通信(例如,系統(tǒng)狀態(tài)信息)以便指示可完成其承擔(dān)主BMC的角色。在處理框2110,第一節(jié)點(diǎn)BMC可周期性地傳輸有關(guān)第一節(jié)點(diǎn)BMC對(duì)主狀態(tài)的所有權(quán)的信息(例如,配置信息、設(shè)置信息),以便促進(jìn)轉(zhuǎn)移主BMC的角色等等,如果需要的話(huà)。
[0037]在處理框2120,第一節(jié)點(diǎn)BMC可能出故障(例如,由于固件故障)。在處理框2130,在第一節(jié)點(diǎn)BMC在超時(shí)周期內(nèi)不能發(fā)送出消息之后,其他耦合節(jié)點(diǎn)中的至少一個(gè)可確定當(dāng)前主BMC(即,第一節(jié)點(diǎn)BMC)可能不再工作,并且確定哪個(gè)節(jié)點(diǎn)應(yīng)當(dāng)是新的主BMC。在這種情況下,第二節(jié)點(diǎn)BMC的BMC固件組件可確定第二節(jié)點(diǎn)BMC應(yīng)當(dāng)承擔(dān)主角色(即,基于最低標(biāo)識(shí)號(hào))。
[0038]在處理框2140,第二節(jié)點(diǎn)BMC可聲明主BMC狀態(tài)。在處理框2150,第二節(jié)點(diǎn)BMC可訪問(wèn)主要由第一節(jié)點(diǎn)BMC傳輸?shù)挠嘘P(guān)第一節(jié)點(diǎn)BMC對(duì)主狀態(tài)的所有權(quán)的信息,以便促進(jìn)其承擔(dān)主BMC的角色。在處理框2160,第二節(jié)點(diǎn)BMC可承擔(dān)主BMC的角色。在處理框2170,該過(guò)程可結(jié)束。
[0039]圖2中描繪的處理框的順序和編號(hào)不旨在暗示操作順序從而排除其他可能性。本領(lǐng)域普通技術(shù)人員將認(rèn)識(shí)到能夠?qū)ο到y(tǒng)和方法進(jìn)行各種修改和改動(dòng)。
[0040]例如,在上述實(shí)施例中,算法可實(shí)現(xiàn)BMC固件組件基于最低節(jié)點(diǎn)標(biāo)識(shí)號(hào)聲明主BMC狀態(tài)(即,處理框2020)。然而,不一定是這種情況。在其他實(shí)施例中,具有更低標(biāo)識(shí)號(hào)的BMC可僅在當(dāng)前主BMC出故障之后被指定為主BMC。
[0041]同樣,在上述實(shí)施例中,第二節(jié)點(diǎn)BMC可向第一節(jié)點(diǎn)BMC傳輸指示其放棄主BMC的角色的響應(yīng)(即,處理框2070)。然而,不一定是這種情況。在其他實(shí)施例中,在發(fā)送這種消息之前,第二節(jié)點(diǎn)BMC可首先指示其“忙碌”(例如,在電源更新中間)。如果第二節(jié)點(diǎn)BMC指示其可能忙碌,請(qǐng)求第一節(jié)點(diǎn)BMC可周期性地重新發(fā)送其承擔(dān)主BMC的角色的請(qǐng)求,直至其成功。
[0042]實(shí)施例因此可提供在多節(jié)點(diǎn)系統(tǒng)中使用可配置和容錯(cuò)的基板管理控制器(BMC)安排的方法,包括檢測(cè)多個(gè)BMC、將該多個(gè)BMC中的第一 BMC指定為主BMC的角色、以及將除該第一 BMC之外的BMC指定為從BMC的角色。該方法還可包括由該第一 BMC傳輸有關(guān)該第一 BMC作為主BMC的角色的信息、確定該第一 BMC可不再充當(dāng)該主BMC的角色、以及指定除該第一 BMC之外的該BMC充當(dāng)該主BMC的角色。此外,該方法還可包括由除該第一 BMC之外的該BMC承擔(dān)該主BMC的角色以及除該第一 BMC之外的該BMC使用有關(guān)該第一 BMC作為主BMC的角色的信息來(lái)承擔(dān)主BMC的角色。
[0043]在一個(gè)示例中,該方法可包括實(shí)施超時(shí)周期以便允許反對(duì)該指定除該第一 BMC以外的該BMC充當(dāng)該主BMC的角色。
[0044]在一個(gè)示例中,該主BMC的角色包括相對(duì)于該多節(jié)點(diǎn)系統(tǒng)的監(jiān)控、管理、支持、以及控制方面中的至少一項(xiàng)充當(dāng)中央接口。
[0045]在另一個(gè)示例中,基于算法確定以下的至少一項(xiàng):指定該多個(gè)BMC中的第一 BMC充當(dāng)主BMC的角色;以及指定除該多個(gè)BMC中的該第一 BMC以外的BMC充當(dāng)從BMC的角色。
[0046]在另一個(gè)示例中,該算法確定是由固件組件和軟件應(yīng)用中的至少一項(xiàng)進(jìn)行的。
[0047]在又一個(gè)示例中,該算法確定使用標(biāo)識(shí)號(hào)。
[0048]在一個(gè)示例中,由于系統(tǒng)組件的故障、物理移除、和指示中的一項(xiàng),該第一 BMC不再充當(dāng)該主BMC的角色。
[0049]在又一個(gè)不例中,該第一 BMC和除該第一 BMC以外的該BMC中的至少一個(gè)通過(guò)網(wǎng)絡(luò)接口被遠(yuǎn)程地配置。
[0050]在一個(gè)示例中,該第一 BMC被配置成用于節(jié)點(diǎn)的監(jiān)控、管理、支持、和控制方面中的至少一項(xiàng)。
[0051]在仍另一個(gè)示例中,該第一 BMC被配置成用于多個(gè)節(jié)點(diǎn)的監(jiān)控、管理、支持、和控制方面中的至少一項(xiàng)。
[0052]實(shí)施例還可包括至少一種機(jī)器可讀介質(zhì),包括多個(gè)指令,響應(yīng)于在計(jì)算設(shè)備上被執(zhí)行,該多個(gè)指令致使該計(jì)算設(shè)備執(zhí)行上述方法的任何示例。實(shí)施例還可包括一種用于利用多節(jié)點(diǎn)系統(tǒng)中的可配置和容錯(cuò)的基板管理控制器(BMC)安排的裝置,包括處理組件、包括第一應(yīng)用的存儲(chǔ)器組件、以及被配置成用于實(shí)施前述方法的任何示例的BMC。實(shí)施例還可包括一種用于利用多節(jié)點(diǎn)系統(tǒng)中的可配置和容錯(cuò)的基板管理控制器(BMC)安排的系統(tǒng),包括:機(jī)架,包括多個(gè)節(jié)點(diǎn)和電源;以及節(jié)點(diǎn)服務(wù)器,包括處理組件、包括第一應(yīng)用的存儲(chǔ)器組件、以及被配置成用于實(shí)施前述方法的任何示例的BMC。
[0053]又一個(gè)實(shí)施例可提供一種利用多節(jié)點(diǎn)系統(tǒng)中的可配置和容錯(cuò)的基板管理控制器安排的方法,包括指定多個(gè)控制器中的第一控制器作為主控制器的角色、以及指定除該第一控制器之外的控制器作為從控制器的角色、確定該第一控制器不再充當(dāng)該主控制器的角色、以及通過(guò)除該第一控制器之外的該控制器承擔(dān)該主控制器的角色。
[0054]在一個(gè)不例中,該方法可包括由該第一控制器傳輸與該第一控制器作為主控制器的角色相關(guān)的信息。
[0055]在一個(gè)示例中,該方法可包括指定除該第一控制器以外的該控制器充當(dāng)該主控制器的角色。
[0056]在仍另一個(gè)示例中,該方法可包括由該除該第一控制器以外的該控制器利用與該第一控制器充當(dāng)主控制器的角色相關(guān)的信息以便承擔(dān)該主控制器的角色。
[0057]在一個(gè)示例中,該方法可包括實(shí)施超時(shí)周期以便允許反對(duì)該指定該除該第一控制器以外的該控制器充當(dāng)該主控制器的角色。
[0058]在仍另一個(gè)示例中,該主控制器的角色包括相對(duì)于該多節(jié)點(diǎn)系統(tǒng)的監(jiān)控、管理、支持、以及控制方面中的至少一項(xiàng)充當(dāng)中央接口。
[0059]在仍另一個(gè)示例中,基于算法確定以下的至少一項(xiàng):指定該多個(gè)控制器中的第一控制器充當(dāng)主控制器的角色;以及指定除該多個(gè)控制器中的該第一控制器以外的控制器充當(dāng)從控制器的角色。
[0060]在一個(gè)示例中,該算法確定是由固件組件和軟件應(yīng)用中的至少一項(xiàng)進(jìn)行的。
[0061]在仍另一個(gè)示例中,該算法確定使用標(biāo)識(shí)號(hào)。
[0062]在一個(gè)不例中,由于系統(tǒng)組件的故障、物理移除、和指不中的一項(xiàng),該第一控制器不再充當(dāng)該主控制器的角色。
[0063]在仍另一個(gè)示例中,該第一控制器和除該第一控制器以外的該控制器中的至少一個(gè)通過(guò)網(wǎng)絡(luò)接口被遠(yuǎn)程地配置。
[0064]在一個(gè)示例中,該第一控制器被配置成用于節(jié)點(diǎn)的監(jiān)控、管理、支持、和控制方面中的至少一項(xiàng)。
[0065]在另一個(gè)示例中,該第一控制器被配置成用于多個(gè)節(jié)點(diǎn)的監(jiān)控、管理、支持、和控制方面中的至少一項(xiàng)。
[0066]實(shí)施例還可包括至少一種機(jī)器可讀介質(zhì),包括用于利用多節(jié)點(diǎn)系統(tǒng)中的可配置和容錯(cuò)的控制器安排的多個(gè)指令,響應(yīng)于在計(jì)算設(shè)備上被執(zhí)行,該多個(gè)指令致使所述計(jì)算設(shè)備執(zhí)行上述方法的任何示例。實(shí)施例還可包括一種用于利用多節(jié)點(diǎn)系統(tǒng)中的可配置和容錯(cuò)的控制器的裝置,包括:處理組件、包括第一應(yīng)用的存儲(chǔ)器組件、以及被配置成用于實(shí)施前述方法的任何示例的控制器。
[0067]實(shí)施例還可包括一種用于利用多節(jié)點(diǎn)系統(tǒng)中的可配置和容錯(cuò)的控制器安排的系統(tǒng),包括:機(jī)架,包括多個(gè)節(jié)點(diǎn)和電源;以及節(jié)點(diǎn)服務(wù)器,包括處理組件、包括第一應(yīng)用的存儲(chǔ)器組件、以及被配置成用于實(shí)施前述方法的任何示例的控制器。
[0068]仍另一個(gè)實(shí)施例可包括至少一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),包括用于使用多節(jié)點(diǎn)系統(tǒng)中的可配置和容錯(cuò)的基板管理控制器(BMC)安排的指令集。如果被處理器執(zhí)行,該指令集致使計(jì)算機(jī)檢測(cè)多個(gè)BMC、將該多個(gè)BMC中的第一 BMC指定為主BMC的角色、以及將除該第一 BMC以外的BMC指定為從BMC的角色。如果被執(zhí)行,該指令集還通過(guò)該第一 BMC傳輸有關(guān)該第一 BMC作為主BMC的角色的信息、確定該第一 BMC可不再充當(dāng)該主BMC的角色、以及指定除該第一 BMC之外的該BMC充當(dāng)該主BMC的角色。如果被執(zhí)行,該指令集還通過(guò)除該第一 BMC之外的該BMC承擔(dān)該主BMC的角色以及除該第一 BMC之外的該BMC使用有關(guān)該第一 BMC作為主BMC的角色的信息承擔(dān)該主BMC的角色。
[0069]另一個(gè)實(shí)施例可包括一種用于使用多節(jié)點(diǎn)系統(tǒng)中的可配置和容錯(cuò)的基板管理控制器(BMC)安排的裝置,包括:處理組件、包括第一應(yīng)用的存儲(chǔ)器組件、以及包括包含指令集的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的BMC。如果被處理器執(zhí)行,該指令集致使計(jì)算機(jī)檢測(cè)多個(gè)BMC、將該多個(gè)BMC中的第一 BMC指定為主BMC的角色、以及將除該第一 BMC以外的BMC指定為從BMC的角色、以及由該第一 BMC傳輸有關(guān)該第一 BMC作為主BMC的信息。如果被執(zhí)行,該指令集還確定該第一 BMC可不再充當(dāng)該主BMC的角色以及指定除該第一 BMC之外的該BMC充當(dāng)該主BMC的角色。如果被執(zhí)行,該指令集還通過(guò)除該第一 BMC之外的該BMC承擔(dān)該主BMC的角色以及除該第一 BMC之外的該BMC使用有關(guān)該第一 BMC作為主BMC的角色的信息承擔(dān)該主BMC的角色。
[0070]仍另一個(gè)實(shí)施例還可包括一種用于利用多節(jié)點(diǎn)系統(tǒng)中的可配置和容錯(cuò)的基板管理控制器(BMC)安排的系統(tǒng),包括:機(jī)架,包括多個(gè)節(jié)點(diǎn)和電源;以及節(jié)點(diǎn)服務(wù)器,包括處理組件、包括第一應(yīng)用的存儲(chǔ)器組件、以及BMC。該BMC可包括計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),包括指令集,如果被處理器執(zhí)行,該指令集致使計(jì)算機(jī)檢測(cè)多個(gè)BMC、將該多個(gè)BMC中的第一BMC指定為主BMC的角色、以及將除該第一 BMC以外的BMC指定為從BMC的角色。如果被執(zhí)行,該指令集還通過(guò)該第一 BMC傳輸有關(guān)該第一 BMC作為主BMC的角色的信息、確定該第一 BMC可不再充當(dāng)該主BMC的角色、以及指定除該第一 BMC之外的該BMC充當(dāng)該主BMC的角色。如果被執(zhí)行,該指令集還通過(guò)除該第一 BMC之外的該BMC承擔(dān)主BMC的角色以及除該第一 BMC之外的該BMC使用有關(guān)該第一 BMC作為主BMC的角色的信息承擔(dān)主BMC的角色。
[0071]對(duì)獲得本公開(kāi)的益處的本領(lǐng)域普通技術(shù)人員將明顯的是可在不脫離在此描述的實(shí)施例的更寬泛精神和范圍的情況下對(duì)這些實(shí)施例做出各種修改和變化。因此,將以說(shuō)明性而不是限制性的意義對(duì)待說(shuō)明書(shū)和附圖。
[0072]本領(lǐng)域普通技術(shù)人員將從前述說(shuō)明中認(rèn)識(shí)到本發(fā)明實(shí)施例的大量技術(shù)可以用不同的形式實(shí)現(xiàn)。因此,盡管已經(jīng)結(jié)合其具體示例描述了本發(fā)明實(shí)施例,本方面實(shí)施例的真實(shí)范圍不應(yīng)當(dāng)被如此限制,因?yàn)楫?dāng)學(xué)習(xí)附圖、說(shuō)明書(shū)和以下權(quán)利要求書(shū)時(shí),其他修改將對(duì)本領(lǐng)域普通技術(shù)人員變得明顯。
[0073]附加地,在某些附圖中,可用線(xiàn)路表示信號(hào)導(dǎo)線(xiàn)。某些線(xiàn)路可能更粗以用于指示更多組成信號(hào)路徑,具有號(hào)碼標(biāo)簽以指示組成信號(hào)路徑的數(shù)量,和/或在一個(gè)或多個(gè)端部具有箭頭以指示主信息流方向。然而,這不應(yīng)當(dāng)以限制性的方式解釋。而是,這種附加細(xì)節(jié)可結(jié)合一個(gè)或多個(gè)示例性實(shí)施例使用,以便促進(jìn)更容易地理解。任何所表示的信號(hào)線(xiàn)(不管是否具有附加信息)可實(shí)際上包括一個(gè)或多個(gè)信號(hào),該一個(gè)或多個(gè)信號(hào)可在多個(gè)方向上傳播并且可用任意合適類(lèi)型的信號(hào)方案實(shí)現(xiàn),例如用差分對(duì)、光纖線(xiàn)路、和/或單端線(xiàn)路實(shí)現(xiàn)的數(shù)字或模擬線(xiàn)路。
[0074]已經(jīng)給出示例大小/模型/值/范圍,盡管本發(fā)明實(shí)施例不限于此。隨著制造技術(shù)(例如,光刻法)日益成熟,所期望的是可制造具有更小大小的設(shè)備。附加地,為了簡(jiǎn)單地展示和討論,并且為了不混淆本發(fā)明實(shí)施例的某些方面,可以或可以不在附圖中展示公知的電/地連接和其他組件。進(jìn)一步地,可以用框圖的形式示出安排,以便避免混淆本發(fā)明實(shí)施例,并且還鑒于以下事實(shí):針對(duì)這種框圖安排的實(shí)現(xiàn)方式的詳情高度地取決于將在其中實(shí)現(xiàn)實(shí)施例的平臺(tái),即,這些詳情應(yīng)當(dāng)在本領(lǐng)域普通技術(shù)人員的范圍內(nèi)。當(dāng)列出特定細(xì)節(jié)以便描述本發(fā)明的示例實(shí)施例時(shí),對(duì)于本領(lǐng)域普通技術(shù)人員而言應(yīng)當(dāng)明顯的是本發(fā)明實(shí)施例可在不具有或具有這些特定細(xì)節(jié)的變體的情況下實(shí)踐。因此,本說(shuō)明書(shū)應(yīng)當(dāng)被認(rèn)為是展示性的而不是限制性的。
[0075]術(shù)語(yǔ)“耦合”可在此用于指代有關(guān)組件之間的任何類(lèi)型的關(guān)系(直接的或間接的)并且可應(yīng)用到電、機(jī)械、流體、光、電磁、機(jī)電或其他連接。附加地,術(shù)語(yǔ)“第一”、“第二”等等可在此僅用于方便討論并且不帶有任何特定的時(shí)間或時(shí)間順序的意義,除非另外指明。
[0076]已經(jīng)詳細(xì)地參照具體實(shí)施例僅通過(guò)舉例而非通過(guò)限制示出和描述了本發(fā)明的實(shí)施例的若干特征和方面。本領(lǐng)域普通技術(shù)人員將認(rèn)識(shí)到對(duì)所公開(kāi)的實(shí)施例的可替代的實(shí)現(xiàn)方式和各種修改在本公開(kāi)的范圍和設(shè)想內(nèi)。因此,旨在認(rèn)為本發(fā)明僅由所附權(quán)利要求書(shū)的范圍限制。
【權(quán)利要求】
1.一種利用多節(jié)點(diǎn)系統(tǒng)中的可配置和容錯(cuò)的基板管理控制器(BMC)安排的方法,包括 檢測(cè)多個(gè)BMC ; 將所述多個(gè)BMC中的第一 BMC指定為主BMC的角色,以及將除所述第一 BMC以外的BMC指定為從BMC的角色; 由所述第一 BMC傳輸與作為主BMC的所述第一 BMC角色相關(guān)的信息; 確定所述第一 BMC不再充當(dāng)所述主BMC的角色; 指定除所述第一 BMC以外的所述BMC充當(dāng)所述主BMC的角色; 由除所述第一 BMC以外的所述BMC承擔(dān)所述主BMC的角色; 由除所述第一 BMC以外的所述BMC利用與所述第一 BMC作為主BMC的角色相關(guān)的所述信息以承擔(dān)所述主BMC的角色。
2.如權(quán)利要求1所述的方法,包括實(shí)施超時(shí)周期以便允許反對(duì)所述指定除所述第一BMC以外的所述BMC充當(dāng)所述主BMC的角色。
3.如權(quán)利要求1所述的方法,其中,所述主BMC的角色包括相對(duì)于所述多節(jié)點(diǎn)系統(tǒng)的監(jiān)控、管理、支持、以及控制方面中的至少一項(xiàng)充當(dāng)中央接口。
4.如權(quán)利要求1所述的方法,其中,基于算法確定以下的至少一項(xiàng):所述指定所述多個(gè)BMC中的第一 BMC充當(dāng)主BMC的角色;以及所述指定除所述多個(gè)BMC中的所述第一 BMC以外的BMC充當(dāng)從BMC的角色。
5.如權(quán)利要求4所述的方法,其中,所述算法確定是由固件組件和軟件應(yīng)用中的至少一項(xiàng)進(jìn)行的。
6.如權(quán)利要求4所述的方法,其中,所述算法確定利用標(biāo)識(shí)號(hào)。
7.如權(quán)利要求1所述的方法,其中,由于系統(tǒng)組件的故障、物理移除、和指示中的一項(xiàng),所述第一 BMC不再充當(dāng)所述主BMC的角色。
8.如權(quán)利要求1所述的方法,其中,所述第一BMC和除所述第一 BMC以外的所述BMC中的至少一個(gè)通過(guò)網(wǎng)絡(luò)接口被遠(yuǎn)程地配置。
9.如權(quán)利要求1所述的方法,其中,所述第一BMC被配置成用于節(jié)點(diǎn)的監(jiān)控、管理、支持、和控制方面中的至少一項(xiàng)。
10.如權(quán)利要求1所述的方法,其中,所述第一BMC被配置成用于多個(gè)節(jié)點(diǎn)的監(jiān)控、管理、支持、和控制方面中的至少一項(xiàng)。
11.包括利用多節(jié)點(diǎn)系統(tǒng)中的可配置和容錯(cuò)的基板管理控制器(BMC)安排的多個(gè)指令的至少一種機(jī)器可讀方法,響應(yīng)于在計(jì)算設(shè)備上被執(zhí)行,所述指令致使所述計(jì)算設(shè)備執(zhí)行根據(jù)權(quán)利要求1至10中任一項(xiàng)所述的方法。
12.一種利用多節(jié)點(diǎn)系統(tǒng)中的可配置和容錯(cuò)的基板管理控制器(BMC)安排的裝置,包括 處理組件; 存儲(chǔ)器組件,包括第一應(yīng)用;以及 BMC,被配置成用于執(zhí)行權(quán)利要求1至10中任一項(xiàng)所述的方法。
13.一種利用多節(jié)點(diǎn)系統(tǒng)中的可配置和容錯(cuò)的基板管理控制器(BMC)安排的系統(tǒng),包括: 機(jī)架,包括多個(gè)節(jié)點(diǎn)和電源;以及 節(jié)點(diǎn)服務(wù)器,包括: 處理組件; 存儲(chǔ)器組件,包括第一應(yīng)用;以及 BMC,被配置成用于執(zhí)行權(quán)利要求1至10中任一項(xiàng)所述的方法。
14.一種利用多節(jié)點(diǎn)系統(tǒng)中的可配置和容錯(cuò)的基板管理控制器(BMC)安排的方法,包括: 將多個(gè)控制器中的第一控制器指定為主控制器的角色,以及將除所述第一控制器以外的控制器指定為從控制器的角色; 確定所述第一控制器不再充當(dāng)所述主控制器的角色;以及 由除所述第一控制器以外的所述控制器承擔(dān)所述主控制器的角色。
15.如權(quán)利要求14所述的方法,進(jìn)一步包括由所述第一控制器傳輸與所述第一控制器作為主控制器的角色相關(guān)的信息。
16.如權(quán)利要求14所述的方法,進(jìn)一步包括指定除第一控制器以外的所述控制器充當(dāng)所述主控制器的角色。
17.如權(quán)利要求14所述的方法,進(jìn)一步包括由除所述第一控制器以外的所述控制器利用與所述第一控制器作為主控制器的角色相關(guān)的信息承擔(dān)所述主控制器的角色。
18.如權(quán)利要求16所述的方法,包括實(shí)施超時(shí)周期以便允許反對(duì)所述指定所述除所述第一控制器以外的所述控制器充當(dāng)所述主控制器的角色。
19.如權(quán)利要求14所述的方法,其中,所述主控制器的角色包括相對(duì)于所述多節(jié)點(diǎn)系統(tǒng)的監(jiān)控、管理、支持、以及控制方面中的至少一項(xiàng)充當(dāng)中央接口。
20.如權(quán)利要求16所述的方法,其中,基于算法確定以下的至少一項(xiàng):所述指定所述多個(gè)控制器中的第一控制器充當(dāng)主控制器的角色;以及所述指定除所述多個(gè)控制器中的所述第一控制器以外的控制器充當(dāng)從控制器的角色。
21.如權(quán)利要求20所述的方法,其中,所述算法確定是由固件組件和軟件應(yīng)用中的至少一項(xiàng)進(jìn)行的。
22.如權(quán)利要求20所述的方法,其中,所述算法確定利用標(biāo)識(shí)號(hào)。
23.如權(quán)利要求14所述的方法,其中,由于系統(tǒng)組件的故障、物理移除、和指示中的一項(xiàng),所述第一控制器不再充當(dāng)所述主控制器的角色。
24.如權(quán)利要求14所述的方法,其中,所述第一控制器和除所述第一控制器以外的所述控制器中的至少一個(gè)通過(guò)網(wǎng)絡(luò)接口被遠(yuǎn)程地配置。
25.如權(quán)利要求14所述的方法,其中,所述第一控制器被配置成用于節(jié)點(diǎn)的監(jiān)控、管理、支持、和控制方面中的至少一項(xiàng)。
26.如權(quán)利要求14所述的方法,其中,所述第一控制器被配置成用于多個(gè)節(jié)點(diǎn)的監(jiān)控、管理、支持、和控制方面中的至少一項(xiàng)。
27.包括利用多節(jié)點(diǎn)系統(tǒng)中的可配置和容錯(cuò)的控制器安排的多個(gè)指令的至少一種機(jī)器可讀方法,響應(yīng)于在計(jì)算設(shè)備上被執(zhí)行,所述指令致使所述計(jì)算設(shè)備執(zhí)行根據(jù)權(quán)利要求14至26中任一項(xiàng)所述的方法。
28.一種利用多節(jié)點(diǎn)系統(tǒng)中的可配置和容錯(cuò)的控制器的裝置,包括: 處理組件;存儲(chǔ)器組件,包括第一應(yīng)用;以及控制器,被配置成用于執(zhí)行權(quán)利要求14至26中任一項(xiàng)所述的方法。
29.一種利用多節(jié)點(diǎn)系統(tǒng)中的可配置和容錯(cuò)的控制器安排的系統(tǒng),包括:機(jī)架,包括多個(gè)節(jié)點(diǎn)和電源;以及節(jié)點(diǎn)服務(wù)器,包括:處理組件;存儲(chǔ)器組件,包括第一應(yīng)用;以及控制器,被配置成用于執(zhí)行權(quán)利要求14至26中任一項(xiàng)所述的方法。
【文檔編號(hào)】G06F15/76GK104169905SQ201280071730
【公開(kāi)日】2014年11月26日 申請(qǐng)日期:2012年3月28日 優(yōu)先權(quán)日:2012年3月28日
【發(fā)明者】D·理查德森, B·肯尼迪 申請(qǐng)人:英特爾公司