專(zhuān)利名稱(chēng):用于在刀片中心機(jī)架內(nèi)加強(qiáng)供電控制的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及數(shù)據(jù)處理系統(tǒng),并且具體地涉及被稱(chēng)作刀片式服務(wù)器的通信網(wǎng)絡(luò)設(shè)備。
背景技術(shù):
將服務(wù)器作為通信網(wǎng)絡(luò)內(nèi)的設(shè)備的使用是在本領(lǐng)域中眾所周知的。服務(wù)器是讓訪(fǎng)問(wèn)該服務(wù)器所服務(wù)的網(wǎng)絡(luò)的客戶(hù)終端/站能獲得可用的文件、數(shù)據(jù)庫(kù)、打印、傳真、通信或其它服務(wù)的裝置。當(dāng)服務(wù)器允許客戶(hù)/終端站訪(fǎng)問(wèn)外部通信網(wǎng)絡(luò)時(shí),它有時(shí)被稱(chēng)作網(wǎng)關(guān)。服務(wù)器可具有不同尺寸、外形和種類(lèi)。服務(wù)器可以遍布整個(gè)網(wǎng)絡(luò)或者它們可以集中在集中式數(shù)據(jù)中心內(nèi)。
集中式數(shù)據(jù)中心的發(fā)展已導(dǎo)致服務(wù)器設(shè)備的更小形狀因子(formfactor),并導(dǎo)致處理單元密集度的增加,由此減少了計(jì)算基礎(chǔ)設(shè)施的空間需求。在本領(lǐng)域中已將一個(gè)常用的形狀因子命名為“刀片式服務(wù)器”,該服務(wù)器包括被構(gòu)造為垂直插入機(jī)架的設(shè)備,該機(jī)架可容納在公共背板(即,刀片中心)上共享電源和其他連接的多個(gè)設(shè)備。就像書(shū)架中的書(shū)一樣,薄的可進(jìn)行熱交換的刀片式服務(wù)器(這里又稱(chēng)“刀片”)裝配在單個(gè)機(jī)架內(nèi),而且每個(gè)服務(wù)器帶有它自己的處理器、存儲(chǔ)器、存儲(chǔ)裝置、網(wǎng)絡(luò)控制器、操作系統(tǒng)以及應(yīng)用的獨(dú)立服務(wù)器。刀片式服務(wù)器滑入機(jī)架內(nèi)的機(jī)架并插入中間板或背板,與其他刀片式服務(wù)器共享電源、風(fēng)扇、軟盤(pán)驅(qū)動(dòng)器、開(kāi)關(guān)和端口。對(duì)于僅添加和移除服務(wù)器卻要擔(dān)負(fù)著將數(shù)百條電纜擰起來(lái)穿過(guò)機(jī)架這一任務(wù)的任何人來(lái)說(shuō),刀片式服務(wù)器的方案的好處是很明顯的。通過(guò)共享的開(kāi)關(guān)和電源單元,釋放了寶貴的空間,而且刀片式服務(wù)器能夠容易得多地實(shí)現(xiàn)更高密集度。通過(guò)單個(gè)機(jī)架內(nèi)的大量高性能服務(wù)器刀片,刀片技術(shù)實(shí)現(xiàn)了高層次的密集度。
盡管隨著刀片中心的使用,單位處理能力的功耗和設(shè)備復(fù)雜度實(shí)際上可能降低了,但是由于計(jì)算設(shè)備的物理密集度已增加,并且由于整體計(jì)算能力已增加,所以對(duì)處理能力和冷卻的功耗需求也已增強(qiáng)。刀片中心機(jī)架具有像供電和冷卻這樣的由機(jī)殼內(nèi)多個(gè)組件共享的資源。在每個(gè)機(jī)架內(nèi)提供負(fù)責(zé)管理機(jī)架內(nèi)所有組件以及它們之間關(guān)系的管理模塊。每個(gè)刀片分配有固定的功率值或冷卻能力。如果任何刀片超過(guò)了其分配值,它可能促使整個(gè)機(jī)架超過(guò)閥值,這接下來(lái)將可能促使公共電源關(guān)閉,這導(dǎo)致其他刀片被關(guān)掉。另一個(gè)風(fēng)險(xiǎn)在于,任何超過(guò)其分配值的刀片都可能會(huì)導(dǎo)致其他刀片由于溫度超過(guò)了它們的臨界閥從而被關(guān)閉。
很可能地,與服務(wù)器相關(guān)聯(lián)的最為緊迫的問(wèn)題之一是可管理性,并且具體而言是被應(yīng)用于安裝在機(jī)架上的服務(wù)器的可管理性。這種類(lèi)型的服務(wù)器內(nèi)的可管理性的一個(gè)方面涉及分配供電資源,在過(guò)去的配置中已經(jīng)由系統(tǒng)體系結(jié)構(gòu)解決了該方面。當(dāng)管理模塊提出請(qǐng)求時(shí),刀片上的服務(wù)處理器需要征求管理模塊允許來(lái)進(jìn)行加電或關(guān)閉。在這種配置中,刀片式服務(wù)器繼續(xù)保持對(duì)它自己的功耗的控制。在過(guò)去的系統(tǒng)體系結(jié)構(gòu)中,這種特征被保存下來(lái),使得刀片式服務(wù)器可在不存在管理模塊的環(huán)境下繼續(xù)工作。盡管過(guò)去的體系結(jié)構(gòu)如此處理了大多數(shù)情況,但是它們沒(méi)有處理刀片式服務(wù)器誤操作(即,沒(méi)有恰當(dāng)?shù)仨憫?yīng)管理模塊的指示)的情況。因此,過(guò)去的刀片中心系統(tǒng)體系結(jié)構(gòu)容易受到單個(gè)刀片不遵循供電管理所需協(xié)議的誤操作(例如在不恰當(dāng)?shù)那樾蜗逻x擇加電)的影響,由此危及機(jī)架內(nèi)其他刀片的工作。
考慮到上面的問(wèn)題,需要有一種更可靠的系統(tǒng)和方法來(lái)加強(qiáng)刀片中心機(jī)架內(nèi)的供電控制,以防止由于違規(guī)誤操作的刀片式服務(wù)器引起供電和冷卻資源過(guò)載。
發(fā)明內(nèi)容
本發(fā)明通過(guò)提供一種用于改變刀片物理供電的所有權(quán)的機(jī)制來(lái)解決上述需求。當(dāng)存在管理模塊時(shí),管理模塊將維持刀片的供電控制。當(dāng)不存在管理模塊時(shí),將刀片的供電控制切換給刀片上的服務(wù)處理器。這種對(duì)刀片供電控制的仲裁是通過(guò)在管理模塊和控制刀片供電的開(kāi)關(guān)之間的監(jiān)視計(jì)時(shí)器機(jī)制來(lái)完成的。當(dāng)管理模塊存在于機(jī)架內(nèi)并正常工作時(shí),管理模塊負(fù)責(zé)反饋(tickle)(即在離散的時(shí)間間隔上連續(xù)觸發(fā))該監(jiān)視計(jì)時(shí)器。這種機(jī)制給管理模塊提供了對(duì)供電的控制。如果管理模塊誤操作或被移除,那么只要監(jiān)視計(jì)時(shí)器沒(méi)有被管理模塊所反饋就將供電控制切換給本地服務(wù)處理器。
本發(fā)明的一個(gè)目的是提供一種用于控制刀片中心內(nèi)的刀片式服務(wù)器的供電的機(jī)制,由此當(dāng)管理模塊存在于機(jī)架中時(shí)供電控制由管理模塊保留。
本發(fā)明的另一個(gè)目的是阻止機(jī)架誤操作或有故障并因此不再遵從用于供電控制的體系結(jié)構(gòu)協(xié)議的刀片式服務(wù)器在刀片中心機(jī)架內(nèi)加電。
本發(fā)明的另一個(gè)目的是當(dāng)管理模塊做出指示時(shí)強(qiáng)制誤操作的刀片式服務(wù)器斷電。
因此,本發(fā)明的另一個(gè)目的是保護(hù)刀片中心機(jī)架內(nèi)的刀片式服務(wù)器免于誤操作或有故障的刀片式服務(wù)器的不利影響,例如由于公共電源過(guò)載引起的刀片中心機(jī)架內(nèi)的全部供電損失,或者保護(hù)刀片中心機(jī)架內(nèi)的刀片式服務(wù)器不會(huì)遭受過(guò)熱負(fù)載。
本發(fā)明的另一個(gè)目的是通過(guò)提供針對(duì)像公共電源過(guò)載或過(guò)熱負(fù)載這樣的誤操作或有故障的刀片式服務(wù)器的不利影響的容錯(cuò)來(lái)提供刀片中心機(jī)架內(nèi)的刀片式服務(wù)器的安全和可靠工作。
本發(fā)明的另一個(gè)目的是提供一種可將供電獨(dú)立地切換給占據(jù)刀片中心機(jī)架的插槽的刀片的裝置。
本發(fā)明的另外一個(gè)目的是提供一種監(jiān)視計(jì)時(shí)器機(jī)制,當(dāng)管理模塊不存在或者管理模塊被詢(xún)問(wèn)時(shí)沒(méi)有響應(yīng)時(shí),該機(jī)制可將供電開(kāi)關(guān)的控制返還給各個(gè)刀片式服務(wù)器。
前述內(nèi)容已經(jīng)相當(dāng)廣地概括了本發(fā)明的特征和技術(shù)優(yōu)點(diǎn),以便使接下來(lái)的對(duì)本發(fā)明的詳細(xì)描述可被更好地理解。在下文中將描述本發(fā)明附加的特征和優(yōu)點(diǎn),它們形成本發(fā)明的權(quán)利要求的主體。
為了更完整地理解本發(fā)明以及其優(yōu)點(diǎn),現(xiàn)在結(jié)合附圖來(lái)參考后面的描述,在附圖中圖1說(shuō)明了現(xiàn)有技術(shù)的刀片中心內(nèi)的系統(tǒng)組件的實(shí)施例。
圖2說(shuō)明了本發(fā)明一實(shí)施例中的系統(tǒng)組件。
圖3說(shuō)明了本發(fā)明一實(shí)施例中的系統(tǒng)組件。
圖4是現(xiàn)有技術(shù)的供電循環(huán)過(guò)程的流程圖。
圖5是本發(fā)明一實(shí)施例中的供電循環(huán)過(guò)程中加電部分的流程圖。
圖6是本發(fā)明一實(shí)施例中的供電循環(huán)過(guò)程中斷電部分的流程圖。
圖7說(shuō)明了刀片中心管理子系統(tǒng)的示意圖。
圖8說(shuō)明了根據(jù)本發(fā)明實(shí)施例的刀片中心機(jī)架的前側(cè)、頂側(cè)和右側(cè)的分解透視圖。
圖9說(shuō)明了根據(jù)本發(fā)明實(shí)施例的刀片中心機(jī)架背部的背側(cè)、頂側(cè)和左側(cè)的透視圖。
具體實(shí)施例方式
在下面的描述中,給出了許多像具體的字或字節(jié)長(zhǎng)度等等這樣的具體細(xì)節(jié),以提供對(duì)本發(fā)明的精確理解。然而,對(duì)于本領(lǐng)域技術(shù)人員而言,顯然可以不以這種具體細(xì)節(jié)來(lái)實(shí)踐本發(fā)明。在其他例子中,已經(jīng)用方框圖的形式示出了眾所周知的電路,以便不讓不必要的細(xì)節(jié)混淆本發(fā)明。對(duì)于絕大多數(shù)部分,關(guān)于計(jì)時(shí)考慮等等的細(xì)節(jié)已經(jīng)被省略,因?yàn)檫@些細(xì)節(jié)對(duì)于獲得對(duì)本發(fā)明的完整理解是不必要的,并且是屬于本領(lǐng)域普通技術(shù)人員的技能之中的。
現(xiàn)在參看附圖,其中所描述的單元不是必然按比例顯示,并且其中同樣或類(lèi)似的單元在多個(gè)圖中用同一標(biāo)號(hào)來(lái)指定。
圖1和4分別說(shuō)明了現(xiàn)有技術(shù)的在刀片中心機(jī)架內(nèi)用來(lái)控制供電的系統(tǒng)組件和體系結(jié)構(gòu)。參考圖1,刀片中心機(jī)架100包含下列與控制供電有關(guān)的組件駐留于機(jī)架插槽120中的刀片式服務(wù)器130;可包含其本身的管理模塊處理器117的管理模塊(MM)110;公共電源140和通風(fēng)器150;以及這些組件間的通信接口125、141、151和131。在典型的現(xiàn)有技術(shù)的系統(tǒng)中,刀片130上的服務(wù)處理器(SP)135需要經(jīng)由雙向接口125向MM 110上的MM處理器117征求允許在由MM 110提出請(qǐng)求時(shí)加電或關(guān)閉。在這樣的體系結(jié)構(gòu)中,公共電源140經(jīng)由電源總線(xiàn)145被路由給機(jī)架100內(nèi)的所有插槽120。沒(méi)有任何可供MM 110用來(lái)直接約束各個(gè)刀片130的供電的機(jī)制。MM 110經(jīng)由總線(xiàn)141控制公共電源140,并且經(jīng)由總線(xiàn)151控制通風(fēng)器150。MM處理器117和SP 135之間的雙向接口可以是多點(diǎn)RS-485接口??梢詫?shí)現(xiàn)用于125的其它接口協(xié)議??刂瓶偩€(xiàn)141、151、131可以是I2C接口。
在圖4中,通過(guò)刀片中心機(jī)架100的機(jī)架插槽120中的服務(wù)器刀片130的加電過(guò)程410和斷電過(guò)程450的例子,說(shuō)明了圖1中的現(xiàn)有技術(shù)的系統(tǒng)的工作。在加電過(guò)程410中,除非存在刀片130否則不會(huì)采取任何行動(dòng)411。如果不存在MM 110 412,那么刀片130不用外部控制就加電416。如果存在MM 110,那么刀片130需要從MM 110請(qǐng)求允許來(lái)加電413。MM 110負(fù)責(zé)決定414刀片130是否可以加電。MM 110將遵循有效地確定供電操作是否應(yīng)該進(jìn)行的任何規(guī)則。如果MM 110決定拒絕加電請(qǐng)求,那么刀片130可以用及時(shí)方式重復(fù)請(qǐng)求413用以重新考慮。如果MM 110允許加電請(qǐng)求413,那么MM 110向刀片130發(fā)出加電命令415,基于該命令,刀片被允許加電416。
在現(xiàn)有技術(shù)的情況下值得注意的是,刀片130維持由SP 135執(zhí)行的在物理上和邏輯上的加電控制416,SP 135在總線(xiàn)131上為開(kāi)關(guān)模塊132發(fā)出命令以接通從公共電源140到刀片130的供電145。物理控制是指控制提供電源連接(例如,向關(guān)閉功率繼電器開(kāi)關(guān)的繼電器線(xiàn)圈提供電流)的執(zhí)行器階段。邏輯控制是指發(fā)出命令以啟用供電連接,由此控制供電決定的策略和時(shí)機(jī)。在一個(gè)例子中,可以使用像靜態(tài)12V直流數(shù)字輸出這樣的數(shù)字控制信號(hào)來(lái)聲明邏輯控制。在另外一個(gè)例子中,可以首先通過(guò)向控制單元發(fā)送二進(jìn)制命令來(lái)聲明邏輯控制,該控制單元接著直接響應(yīng)于該二進(jìn)制命令而執(zhí)行另外的邏輯控制。在另外的例子中,可以使用合適的接口和驅(qū)動(dòng)程序按并行或串行的順序逐位地發(fā)送二進(jìn)制命令。重要的是要注意可以使用邏輯電路或通過(guò)響應(yīng)于軟件命令的電路來(lái)轉(zhuǎn)移邏輯控制。物理控制的轉(zhuǎn)移一般將會(huì)包括對(duì)用來(lái)切換電源的控制路徑進(jìn)行重新路由。
同樣重要之處在于在這種現(xiàn)有技術(shù)的體系結(jié)構(gòu)中,刀片130可能會(huì)誤操作以及忽略經(jīng)由接口125來(lái)自MM 110、117的命令,或者可能在任何時(shí)候違背體系結(jié)構(gòu)協(xié)議410。這種錯(cuò)誤模式給該機(jī)架內(nèi)其他刀片造成了極大的風(fēng)險(xiǎn),尤其在誤操作刀片130加電416的情況下更是如此。刀片的這種類(lèi)型的違規(guī)可以導(dǎo)致功耗超過(guò)閥值,這樣可以導(dǎo)致對(duì)整個(gè)刀片中心機(jī)架100的供電損失。可替換地,誤操作刀片可以導(dǎo)致其他刀片因?yàn)闇囟瘸^(guò)它們的閥值而關(guān)閉。因此,單個(gè)誤操作刀片130可能破壞MM 110將刀片機(jī)架100內(nèi)的供電和溫度維持在閥值以?xún)?nèi)的努力。
在450中說(shuō)明了現(xiàn)有技術(shù)的斷電過(guò)程。如果不存在MM 451,那么刀片可在任何時(shí)間直接進(jìn)行斷電454。如果存在MM 451,那么系統(tǒng)一直處于加電狀態(tài),直到該MM決定452發(fā)出斷電命令453。在其他例子中,該MM在決定斷電452時(shí)可以響應(yīng)像供電切換或關(guān)閉命令這樣的外部輸入。一旦刀片從該MM接收到斷電命令,它就必須使它自己進(jìn)行斷電454。注意在450的這種情況下,刀片130的誤操作可能會(huì)拒絕斷電453,這樣就發(fā)生像上面針對(duì)情況410所提及的同樣的對(duì)于資源管理的負(fù)面暗示。由于該MM處理器117不擁有對(duì)用于切換對(duì)刀片132供電的電路的物理控制,也不擁有對(duì)SP 135的邏輯控制,所以當(dāng)誤操作刀片130拒絕斷電454時(shí)誤操作刀片130同樣會(huì)破壞MM 110管理供電和溫度的努力。
本發(fā)明提供了一種用于改變刀片物理供電的所有權(quán)的機(jī)制。在圖2中,說(shuō)明了本發(fā)明的實(shí)施例的硬件配置。刀片230上的SP 235維持到刀片式服務(wù)器230上的開(kāi)關(guān)模塊232的接口231。然而,來(lái)自刀片230的電源總線(xiàn)接口222被路由通過(guò)位于機(jī)架插槽220上的附加控制開(kāi)關(guān)225,出于這個(gè)目的對(duì)該開(kāi)關(guān)225進(jìn)行修改。機(jī)架200內(nèi)的每個(gè)機(jī)架插槽220均包含附加的開(kāi)關(guān)模塊225,用于各自將供電221從公共電源240切換到刀片230。SP 235經(jīng)由接口226與該MM處理器217進(jìn)行通信。修改后的MM 210包含監(jiān)視計(jì)時(shí)器模塊215,MM處理器217經(jīng)由總線(xiàn)212反饋該模塊215。該監(jiān)視計(jì)時(shí)器215可以經(jīng)由總線(xiàn)接口211聲明對(duì)該機(jī)架插槽控制開(kāi)關(guān)225的控制。如果該MM 210出于任何原因不響應(yīng)或者不存在,則該監(jiān)視計(jì)時(shí)器215釋放對(duì)開(kāi)關(guān)225的控制(在一個(gè)例子中是通過(guò)關(guān)閉該開(kāi)關(guān)),而同時(shí)由SP 235注冊(cè)接口226中的超時(shí),SP 235通過(guò)經(jīng)由接口231來(lái)重新聲明對(duì)開(kāi)關(guān)232的本地控制而進(jìn)行響應(yīng)。圖2的硬件配置中值得注意的是,在MM 210在機(jī)架200內(nèi)管理供電和溫度的努力中,可以強(qiáng)制刀片230遵循MM 210的決定,而不給刀片230留下誤操作以及危害該機(jī)架200內(nèi)其他裝置的可能性。
在圖3中,說(shuō)明了本發(fā)明的硬件配置的可選實(shí)施例。刀片330上的SP335維持到機(jī)架插槽320內(nèi)的開(kāi)關(guān)模塊325的接口331,開(kāi)關(guān)模塊325相應(yīng)地進(jìn)行修改。來(lái)自刀片330的電源總線(xiàn)接口322被直接路由通過(guò)控制開(kāi)關(guān)325;刀片330不再需要它自己的電源切換電路。機(jī)架300內(nèi)的每個(gè)機(jī)架插槽320都包含開(kāi)關(guān)模塊325,用于各自將供電321從公共電源340直接切換到刀片330。SP 335經(jīng)由接口326與MM處理器317進(jìn)行通信。修改后的MM 310包含監(jiān)視計(jì)時(shí)器模塊315,該MM處理器317經(jīng)由總線(xiàn)312反饋該模塊315。該監(jiān)視計(jì)時(shí)器315可以經(jīng)由總線(xiàn)接口311聲明對(duì)該機(jī)架插槽控制開(kāi)關(guān)325的控制。如果該MM出于任何原因不響應(yīng)或不存在,則該監(jiān)視計(jì)時(shí)器315釋放對(duì)開(kāi)關(guān)325的控制,而同時(shí)由SP 335注冊(cè)接口326中的超時(shí),SP 335通過(guò)經(jīng)由接口331來(lái)重新聲明對(duì)開(kāi)關(guān)325的控制而進(jìn)行響應(yīng)。圖3的硬件配置中值得注意的是,在MM 310在機(jī)架300內(nèi)管理供電和溫度的努力中,可以強(qiáng)制刀片330遵循MM 310的決定,而不給刀片330留下誤操作以及危害該機(jī)架300內(nèi)其他裝置的可能性。
圖5說(shuō)明了本發(fā)明的一實(shí)施例中的供電循環(huán)過(guò)程中的加電部分510。當(dāng)MM 210、310存在時(shí),它將聲明對(duì)刀片230、330的供電221的控制513。在一個(gè)例子中,MM 210通過(guò)經(jīng)由接口226命令SP 235不操作開(kāi)關(guān)232來(lái)聲明控制。在另外一個(gè)例子中,MM 310通過(guò)經(jīng)由接口326命令SP 335不操作開(kāi)關(guān)325以及通過(guò)監(jiān)視計(jì)時(shí)器315來(lái)聲明控制,監(jiān)視計(jì)時(shí)器315經(jīng)由接口311增強(qiáng)325的控制。在另外一個(gè)例子中,MM 210通過(guò)在首先開(kāi)啟開(kāi)關(guān)225的同時(shí)強(qiáng)制開(kāi)關(guān)232關(guān)閉來(lái)聲明控制。在本發(fā)明的實(shí)施例中可以實(shí)施用于可由MM 210或310聲明對(duì)刀片供電的物理或邏輯控制的其他機(jī)制。在聲明了控制之后,MM處理器217、317開(kāi)始經(jīng)由接口212、312反饋514監(jiān)視計(jì)時(shí)器215、315。反饋包括以預(yù)定時(shí)間間隔向監(jiān)視計(jì)時(shí)器215、315發(fā)送觸發(fā)脈沖或消息。在本發(fā)明的范圍內(nèi)可以實(shí)施監(jiān)視計(jì)時(shí)器215、315的其他配置,例如對(duì)通信226、326的直接監(jiān)視,或者在機(jī)架插槽220、320上安裝監(jiān)視計(jì)時(shí)器215、315。盡管監(jiān)視計(jì)時(shí)器215、315已被反饋,但是刀片230、330還可以從MM 210、310請(qǐng)求515加電。MM 210、310可決定516對(duì)刀片230、330加電,并且接下來(lái)在本發(fā)明的一個(gè)例子中,經(jīng)由開(kāi)關(guān)模塊225、325來(lái)進(jìn)行加電517。MM可以決定516不對(duì)刀片230、330加電,并且只要MM 210、310存在并進(jìn)行響應(yīng)518,刀片就可以繼續(xù)發(fā)布另外的加電請(qǐng)求515,因?yàn)橹灰O(jiān)視計(jì)時(shí)器215、315被反饋,刀片230、330就不具有對(duì)供電開(kāi)關(guān)225、325的控制。如果MM 210、310停止518反饋監(jiān)視計(jì)時(shí)器215、315,則監(jiān)視計(jì)時(shí)器215、315經(jīng)由到SP 235、335的總線(xiàn)211、311對(duì)供電開(kāi)關(guān)225、325的控制進(jìn)行重置519。在此時(shí),刀片230、330接下來(lái)可以進(jìn)行加電520。
圖6說(shuō)明了本發(fā)明的一實(shí)施例中的供電循環(huán)過(guò)程中的斷電部分610。注意,可以在MM 210、310的控制下(其中情形503表示該過(guò)程的繼續(xù)路徑)或者在SP 235、335的控制下(其中情形504表示該過(guò)程的繼續(xù)路徑)來(lái)達(dá)到加電狀態(tài)。如果刀片230、330由SP 235、335經(jīng)由504加電520,那么如果MM 210、310被插入611,則MM 210、310聲明控制513并且開(kāi)始反饋514監(jiān)視計(jì)時(shí)器215、315。如果MM 210、310沒(méi)有被插入,那么控制保留在SP 235、335,并且刀片230、330可以將自己關(guān)閉614。如果MM 210、310存在并且正在反饋監(jiān)視計(jì)時(shí)器215、315,那么路徑503一直表示刀片230、330的加電狀態(tài),直到刀片發(fā)布斷電請(qǐng)求616為止。如果MM 210、310決定對(duì)刀片230、330斷電613,那么MM 210、310可以通過(guò)開(kāi)啟開(kāi)關(guān)225、325并且中斷到刀片的機(jī)架插槽220、320的電源總線(xiàn)221來(lái)對(duì)該刀片斷電613。在本發(fā)明的其他實(shí)施例中可以實(shí)現(xiàn)用于執(zhí)行斷電613的其他輔助機(jī)制,例如經(jīng)由總線(xiàn)231指示SP 235物理地使開(kāi)關(guān)232斷電,或經(jīng)由總線(xiàn)331指示SP 335物理地使開(kāi)關(guān)325斷電。然而,MM 210、310總是維持對(duì)開(kāi)關(guān)225、325的優(yōu)先的物理和邏輯控制,以加強(qiáng)在刀片230、330誤操作情況下的供電策略。如果MM 210、310決定612不對(duì)刀片230、330斷電并且MM 210、310繼續(xù)反饋監(jiān)視計(jì)時(shí)器615,那么刀片就沒(méi)有別的選擇而只有發(fā)布另外一個(gè)斷電請(qǐng)求。如果MM 210、310停止615反饋監(jiān)視計(jì)時(shí)器215、315,則監(jiān)視計(jì)時(shí)器215、315經(jīng)由到SP 235、335的總線(xiàn)211、311對(duì)供電開(kāi)關(guān)225、325的控制進(jìn)行重置519。在此時(shí),刀片230、330接下來(lái)可以進(jìn)行斷電614。在斷電狀態(tài),機(jī)架插槽220、320沒(méi)有排除對(duì)于操作SP 235、335來(lái)說(shuō)足夠的補(bǔ)救性的電源以及刀片230、330上其他必要的控制電路。
圖7是刀片中心機(jī)架管理子系統(tǒng)的示意圖,其示出了之前通過(guò)MM210、310示意性表示的各個(gè)管理模塊MM1-MM4的工程細(xì)節(jié),并且示出了在之前對(duì)刀片中心機(jī)架200、300示意性的表示中所包含的各個(gè)組件。參考該圖,每個(gè)管理模塊具有到從開(kāi)關(guān)模塊SM1至SM4中的每個(gè)的獨(dú)立的以太網(wǎng)鏈路。這樣,管理模塊MM1經(jīng)由以太網(wǎng)鏈路MM1-ENet1至MM1-ENet4被鏈接到開(kāi)關(guān)模塊SM1至SM4,并且管理模塊MM2經(jīng)由以太網(wǎng)鏈路MM2-ENet1至MM2-ENet4被鏈接到開(kāi)關(guān)模塊。此外,管理模塊還經(jīng)由兩種眾所周知的串行I2C總線(xiàn)SM-I2C-BusA和SM-I2C-BusB耦合到開(kāi)關(guān)模塊,這兩種串行總線(xiàn)提供了在管理模塊和開(kāi)關(guān)模塊間的“帶外”通信。類(lèi)似地,管理模塊還經(jīng)由兩種串行I2C總線(xiàn)(對(duì)應(yīng)于接口241、341)PM-I2C-BusA和PM-I2C-BusB耦合到供電模塊(之前用240、340來(lái)示意性地表示)PM1至PM4。另外兩種I2C總線(xiàn)Panel-I2C-BusA和Panel-I2C-BusB耦合到媒體盤(pán)MT和背板。通過(guò)獨(dú)立的串行總線(xiàn)Fan1和Fan2(對(duì)應(yīng)于接口251、351)來(lái)控制吹風(fēng)機(jī)BL1和BL2(之前用250、350來(lái)示意性地表示)。兩種眾所周知的RS485串行總線(xiàn)RS485-A和RS485-B(對(duì)應(yīng)于接口226和326)耦合到服務(wù)器刀片PB1至PB14,用于管理模塊和服務(wù)器刀片之間的“帶外”通信。
圖8說(shuō)明了服務(wù)器刀片系統(tǒng)的前側(cè)、頂側(cè)和右側(cè)的分解透視圖,其示出了之前對(duì)刀片中心機(jī)架200、300的示意性描述中所包含的各個(gè)組件的工程細(xì)節(jié)。參考該圖,主機(jī)架CH1容納有服務(wù)器刀片系統(tǒng)的所有組件??蓪⒍嘀?4個(gè)處理器刀片PB1至PB14(或像存儲(chǔ)刀片這樣的其他刀片)熱插入進(jìn)機(jī)架CH1前面的14個(gè)插槽內(nèi)。雖然在整個(gè)說(shuō)明書(shū)和權(quán)利要求書(shū)中使用術(shù)語(yǔ)“服務(wù)器刀片”、“刀片式服務(wù)器”、“處理器刀片”或者只是“刀片”,但是應(yīng)當(dāng)理解的是這些術(shù)語(yǔ)并不限于只執(zhí)行“處理器”或“服務(wù)器”功能的刀片,而是還包括執(zhí)行其他功能的刀片,例如典型地包括硬盤(pán)驅(qū)動(dòng)器并且首要功能是數(shù)據(jù)存儲(chǔ)的存儲(chǔ)刀片。
處理器刀片提供工業(yè)標(biāo)準(zhǔn)服務(wù)器的固件、處理器、存儲(chǔ)器和硬盤(pán)存儲(chǔ)裝置。此外,它們包括經(jīng)由控制面板的鍵盤(pán)、視頻和鼠標(biāo)(“KVM”)選項(xiàng)、板上服務(wù)處理器和對(duì)媒體盤(pán)內(nèi)的軟盤(pán)和CD-ROM驅(qū)動(dòng)器的訪(fǎng)問(wèn)。子卡可以經(jīng)由板上PCI-X接口來(lái)進(jìn)行連接并且被用于提供到多種模塊的額外的高速鏈路。每個(gè)處理器刀片還有前面板,該前面板具有5個(gè)用來(lái)指示當(dāng)前狀態(tài)的LED,加上用于加電/斷電、選擇處理器刀片、重置和用于本地控制的信息轉(zhuǎn)儲(chǔ)的NMI的四個(gè)按鈕開(kāi)關(guān)。
刀片可以進(jìn)行“熱交換”,而不會(huì)影響系統(tǒng)內(nèi)其他刀片的工作。服務(wù)器刀片典型地實(shí)現(xiàn)成單個(gè)插槽卡(394毫米×227毫米);然而,在某些情況下單個(gè)處理器刀片可能需要兩個(gè)插槽。只要處理器刀片符合服務(wù)器刀片系統(tǒng)的供電和冷卻需求以及機(jī)械和電接口,它就可以使用任何微處理器技術(shù)。
為了冗余,處理器刀片有兩個(gè)信號(hào)和電源連接器;一個(gè)連接到中間板MP的相應(yīng)插槽的上連接器(如下面所描述),而另一個(gè)連接到中間板的相應(yīng)的下連接器。處理器刀片經(jīng)由中間板接口與服務(wù)器刀片系統(tǒng)內(nèi)的其他組件相接口,該中間板接口包括1)吉比特以太網(wǎng);2)光纖信道;3)管理模塊串行鏈路;4)VGA模擬視頻鏈路;5)鍵盤(pán)/鼠標(biāo)USB鏈路;6)CD-ROM和軟盤(pán)驅(qū)動(dòng)器(“FDD”)USB鏈路;7)12VDC電源;以及8)各種混雜的控制信號(hào)。這些接口提供了與服務(wù)器刀片系統(tǒng)內(nèi)像管理模塊、開(kāi)關(guān)模塊、CD-ROM和FDD這樣的其他組件進(jìn)行通信的能力。在中間板上復(fù)制這些接口以提供冗余。典型地,處理器刀片支持從媒體盤(pán)CDROM或FDD、網(wǎng)絡(luò)(光纖信道或以太網(wǎng))、或者它的本地硬盤(pán)驅(qū)動(dòng)器上進(jìn)行的引導(dǎo)。
媒體盤(pán)MT包括可被耦合到14個(gè)刀片中的任何一個(gè)刀片的軟盤(pán)驅(qū)動(dòng)器和CD-ROM驅(qū)動(dòng)器。媒體盤(pán)還容納有其上安裝著接口LED、用于測(cè)量進(jìn)氣溫度的熱敏電阻和4端口USB控制器集線(xiàn)器的接口板。系統(tǒng)級(jí)接口控制由電源、位置、過(guò)熱、信息以及通用故障LED和USB端口所組成。
中間板電路板MP大致位于機(jī)架CH1的中間,并且包括兩行連接器;頂上一行包括連接器MPC-S1-R1至MPC-S14-R1,而底下一行包括連接器MPC-S1-R2至MPC-S14-R2。因此,這14個(gè)插槽中的每個(gè)包括一對(duì)中間板連接器,其中一個(gè)位于另一個(gè)上(例如,連接器MPC-S1-R1和MPC-S1-R2),而每對(duì)中間板連接器與位于每個(gè)處理器刀片后沿的一對(duì)連接器(圖8中不可見(jiàn))相配對(duì)。
圖9是服務(wù)器刀片系統(tǒng)背部的背側(cè)、頂側(cè)和左側(cè)的透視圖。參考圖8和9,機(jī)架CH2容納有用來(lái)冷卻、供電、控制和切換的各種可熱插入的組件。機(jī)架CH2滑進(jìn)并鎖入主機(jī)架CH1的背部。
兩種可熱插入的吹風(fēng)機(jī)BL1和BL2(之前由250、350來(lái)示意性地表示)包括反向彎曲葉輪式吹風(fēng)機(jī)并且給服務(wù)器刀片系統(tǒng)組件提供冗余的冷卻。氣流是從機(jī)架CH1的前部到機(jī)架CH1的背部。處理器刀片PB1至PB14中的每個(gè)包括前格柵以允許空氣進(jìn)入,并且使用了基于小尺寸的蒸汽室的散熱器來(lái)冷卻刀片內(nèi)的處理器。穿過(guò)系統(tǒng)機(jī)架的整個(gè)氣流在0.7英寸的H2O靜態(tài)壓降下為大約300CFM機(jī)架。在吹風(fēng)機(jī)故障或被移除的事件中,其余吹風(fēng)機(jī)的速度自動(dòng)增長(zhǎng)以維持所需的氣流,直到安裝了替代單元為止。吹風(fēng)機(jī)速度控制也是經(jīng)由不間斷地監(jiān)視入氣溫度的熱敏電阻來(lái)控制的。服務(wù)器刀片系統(tǒng)組件的溫度也被監(jiān)視,并且響應(yīng)于由各種溫度傳感器所報(bào)告的溫度上升程度,吹風(fēng)機(jī)的速度將自動(dòng)增加。
四個(gè)可熱插入的電源模塊PM1至PM4(之前由240、340示意性地表示)給處理器刀片和其他組件提供DC工作電壓。一對(duì)電源模塊給所有管理模塊和開(kāi)關(guān)模塊加上任何插入插槽1-6的刀片供電。其他對(duì)的電源模塊給插槽7-14中的任何刀片供電。在每對(duì)電源模塊內(nèi),一個(gè)電源模塊在第一個(gè)電源模塊出故障或被移除的事件中充當(dāng)其他電源模塊的備份。因此,最少需要兩個(gè)有效電源模塊來(lái)給裝載有14個(gè)處理器刀片、4個(gè)開(kāi)關(guān)模塊、2個(gè)吹風(fēng)機(jī)和2個(gè)管理模塊210的具有全部特征和完整配置的機(jī)架供電。然而,需要四個(gè)電源模塊來(lái)提供完整的冗余和備份能力。電源模塊被設(shè)計(jì)成在50/60Hz的200VAC至240VAC的AC輸入電壓范圍之間進(jìn)行工作,并且使用IEC320C14的插入式電器耦合器。電源模塊將+12VDC的輸出提供給所有服務(wù)器刀片系統(tǒng)組件從中獲得它們的供電的中間板。兩個(gè)+12VDC的中間板電源總線(xiàn)被用于冗余,并且執(zhí)行在冗余的電源模塊之間的輸出負(fù)載的有效電流共享。
管理模塊MM1至MM4(之前面由210、310來(lái)示意性地表示)是可熱插入的組件,其提供像控制、監(jiān)視、警告、重啟和診斷這樣的基本管理功能。參考圖2和3,在本發(fā)明的實(shí)施例中,管理模塊210、310包含MM處理器217、317和帶有到各個(gè)開(kāi)關(guān)模塊225、325的接口211、311的監(jiān)視計(jì)時(shí)器215、315。管理模塊還提供管理共享資源所需的其他功能,例如在處理器刀片之間切換公共鍵盤(pán)、視頻和鼠標(biāo)信號(hào)的能力。
雖然已經(jīng)詳細(xì)地描述了本發(fā)明及其優(yōu)點(diǎn),但是應(yīng)當(dāng)理解,在不背離如權(quán)利要求所限定的精神和范圍的情況下,可以在此做出各種改變、替代和變型。
權(quán)利要求
1.一種用于控制對(duì)刀片中心機(jī)架內(nèi)的刀片式服務(wù)器的供電的方法,其中管理模塊被安裝在所述刀片中心機(jī)架內(nèi),所述方法包括以下步驟將已切換到占據(jù)所述刀片中心機(jī)架內(nèi)的機(jī)架插槽的刀片式服務(wù)器的電源連接的物理和邏輯控制轉(zhuǎn)移給所述管理模塊。
2.根據(jù)權(quán)利要求1所述的方法,還包括以下步驟啟用由所述管理模塊進(jìn)行反饋的監(jiān)視計(jì)時(shí)器。
3.根據(jù)權(quán)利要求1所述的方法,其中當(dāng)在所述刀片中心機(jī)架內(nèi)安裝所述刀片式服務(wù)器時(shí),所述刀片式服務(wù)器占據(jù)多個(gè)機(jī)架插槽。
4.根據(jù)權(quán)利要求1所述的方法,其中所述將物理和邏輯控制轉(zhuǎn)移給所述管理模塊還包括以下步驟所述管理模塊與位于所述刀片式服務(wù)器上的服務(wù)處理器進(jìn)行雙向通信;所述服務(wù)處理器將對(duì)位于所述刀片式服務(wù)器上的電源切換電路的所述控制釋放給所述管理模塊;以及所述管理模塊聲明對(duì)位于所述機(jī)架上用于將供電切換給由所述刀片式服務(wù)器所占據(jù)的各個(gè)機(jī)架插槽的電源切換電路的控制。
5.根據(jù)權(quán)利要求4所述的方法,還包括以下步驟所述管理模塊強(qiáng)制位于所述刀片式服務(wù)器上的電源切換電路關(guān)閉。
6.根據(jù)權(quán)利要求4所述的方法,還包括以下步驟所述服務(wù)處理器將對(duì)位于所述機(jī)架上用于將供電切換給由所述刀片式服務(wù)器所占據(jù)的各個(gè)機(jī)架插槽的所述電源切換電路的所述控制釋放給所述管理模塊。
7.根據(jù)權(quán)利要求2所述的方法,還包括以下步驟當(dāng)所述管理模塊在已經(jīng)超時(shí)后仍無(wú)法反饋所述監(jiān)視計(jì)時(shí)器時(shí),觸發(fā)所述監(jiān)視計(jì)時(shí)器轉(zhuǎn)移所述控制;以及將已切換到所述刀片式服務(wù)器的所述電源連接的所述控制轉(zhuǎn)移給所述服務(wù)處理器,其中所述電源連接包括位于所述刀片式服務(wù)器上的電源切換電路和位于所述機(jī)架中的電源切換電路,用來(lái)將供電切換給由所述刀片式服務(wù)器所占據(jù)的所述機(jī)架插槽。
8.一種刀片中心機(jī)架裝置,機(jī)架包括多個(gè)用來(lái)接收刀片式服務(wù)器的機(jī)架插槽;管理模塊;由所述多個(gè)機(jī)架插槽公用的、用來(lái)給占據(jù)所述多個(gè)機(jī)架插槽的多個(gè)刀片式服務(wù)器供電的電源;以及裝在所述機(jī)架中用于獨(dú)立地將供電切換給由刀片式服務(wù)器所占據(jù)的所述多個(gè)機(jī)架插槽中的每個(gè)機(jī)架插槽的電路,其中當(dāng)從所述機(jī)架插槽中移除所述刀片式服務(wù)器時(shí),所述機(jī)架內(nèi)的所述電路保持可以工作。
9.根據(jù)權(quán)利要求8所述的裝置,還包括由所述管理模塊進(jìn)行反饋的監(jiān)視計(jì)時(shí)器,其中所述監(jiān)視計(jì)時(shí)器還包括用來(lái)將對(duì)位于所述機(jī)架內(nèi)用于獨(dú)立地將供電切換給由刀片式服務(wù)器所占據(jù)的所述多個(gè)機(jī)架插槽中的每個(gè)機(jī)架插槽的所述電路的物理和邏輯控制轉(zhuǎn)移給所述管理模塊或者轉(zhuǎn)移給占據(jù)機(jī)架插槽的刀片式服務(wù)器的電路。
10.根據(jù)權(quán)利要求8所述的裝置,其中所述管理模塊還包括用來(lái)對(duì)位于所述機(jī)架內(nèi)用于獨(dú)立地將供電切換給由刀片式服務(wù)器所占據(jù)的所述多個(gè)機(jī)架插槽中的每個(gè)機(jī)架插槽的電路進(jìn)行物理和邏輯控制的電路。
11.根據(jù)權(quán)利要求8所述的裝置,其中所述管理模塊還包括用來(lái)對(duì)位于所述刀片式服務(wù)器上的電源切換電路進(jìn)行物理和邏輯控制的電路。
12.一種刀片式服務(wù)器,包括用于通信和資源管理功能的服務(wù)處理器,其中所述服務(wù)處理器還包括被使能將對(duì)用來(lái)把供電切換給刀片式服務(wù)器的電源切換電路的物理和邏輯控制釋放給刀片中心管理模塊的電路;以及被使能響應(yīng)于與所述管理模塊的通信中的超時(shí),向所述刀片式服務(wù)器重新聲明對(duì)用于將供電切換給所述刀片式服務(wù)器的電源切換電路的物理和邏輯控制。
13.根據(jù)權(quán)利要求12所述的刀片式服務(wù)器,還包括用于在位于刀片中心機(jī)架上用來(lái)將供電切換給由所述刀片式服務(wù)器所占據(jù)的各個(gè)機(jī)架插槽的電路與被使能用于數(shù)據(jù)處理功能的包括CPU、存儲(chǔ)器和本地總線(xiàn)的電路之間的邏輯上不可中斷的供電連接的電路。
14.根據(jù)權(quán)利要求12所述的刀片式服務(wù)器,其中用來(lái)將供電切換給所述刀片式服務(wù)器的所述電源切換電路位于所述刀片式服務(wù)器上。
15.根據(jù)權(quán)利要求12所述的刀片式服務(wù)器,其中用來(lái)將供電切換給所述刀片式服務(wù)器的所述電源切換電路位于用來(lái)獨(dú)立地將供電切換給由所述刀片式服務(wù)器所占據(jù)的機(jī)架插槽的刀片中心機(jī)架內(nèi)。
全文摘要
一種用于改變對(duì)刀片中心機(jī)架內(nèi)的刀片式服務(wù)器的物理供電的所有權(quán)的機(jī)制,所述機(jī)制防止誤操作刀片危及所述機(jī)架內(nèi)的其他組件。當(dāng)管理模塊不存在時(shí),將對(duì)所述刀片的供電控制切換給所述刀片上的服務(wù)處理器。這種對(duì)刀片的供電控制的仲裁是通過(guò)實(shí)現(xiàn)監(jiān)視計(jì)時(shí)器機(jī)制來(lái)完成的。當(dāng)所述管理模塊存在于所述機(jī)架內(nèi)并正常工作時(shí),所述管理模塊負(fù)責(zé)對(duì)所述監(jiān)視計(jì)時(shí)器進(jìn)行反饋。這種機(jī)制給所述管理模塊提供了對(duì)供電的控制。如果所述管理模塊誤操作或被移除,那么只要所述監(jiān)視計(jì)時(shí)器沒(méi)有被反饋就將供電控制切換給所述刀片式服務(wù)器上的本地服務(wù)處理器。
文檔編號(hào)H04L12/24GK1920746SQ20061011599
公開(kāi)日2007年2月28日 申請(qǐng)日期2006年8月22日 優(yōu)先權(quán)日2005年8月23日
發(fā)明者A·E·默金, T·M·布雷, J·E·伯蘭 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司