欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

在信息存儲(chǔ)和檢索系統(tǒng)中提供故障恢復(fù)保護(hù)的設(shè)備和方法

文檔序號(hào):7620545閱讀:191來源:國知局
專利名稱:在信息存儲(chǔ)和檢索系統(tǒng)中提供故障恢復(fù)保護(hù)的設(shè)備和方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種在信息存儲(chǔ)和檢索系統(tǒng)中提供故障恢復(fù)(failover)保護(hù)的設(shè)備和方法。
背景技術(shù)
數(shù)據(jù)存儲(chǔ)和檢索系統(tǒng)用來存儲(chǔ)由一個(gè)或多個(gè)主機(jī)計(jì)算機(jī)系統(tǒng)提供的信息。這樣的數(shù)據(jù)存儲(chǔ)和檢索系統(tǒng)接收向一個(gè)或多個(gè)次級(jí)存儲(chǔ)設(shè)備寫入信息的請(qǐng)求、以及從這些一個(gè)或多個(gè)次級(jí)存儲(chǔ)設(shè)備檢索信息的請(qǐng)求。當(dāng)接收到寫請(qǐng)求時(shí),該系統(tǒng)在數(shù)據(jù)高速緩存中存儲(chǔ)從主機(jī)計(jì)算機(jī)接收的信息。在特定實(shí)現(xiàn)中,還將該信息的副本存儲(chǔ)在非易失性存儲(chǔ)設(shè)備中。當(dāng)接收到讀請(qǐng)求時(shí),系統(tǒng)從該一個(gè)或多個(gè)次級(jí)存儲(chǔ)設(shè)備取回(recall)信息,并且將該信息移動(dòng)到數(shù)據(jù)高速緩存。這樣,系統(tǒng)不斷地向和從存儲(chǔ)設(shè)備以及向和從數(shù)據(jù)高速緩存移動(dòng)信息。
很多數(shù)據(jù)處理應(yīng)用要求有時(shí)被稱作的“24/7/365”工作能力,即數(shù)據(jù)存儲(chǔ)和檢索系統(tǒng)最優(yōu)地不斷處于工作中。為了提供這樣的“24/7/365”工作能力,一些信息存儲(chǔ)和檢索系統(tǒng)包括多個(gè)群集。需要一種在一個(gè)群集出現(xiàn)故障之后并且安設(shè)在該工作群集內(nèi)的設(shè)備適配器隨后出現(xiàn)故障之后在多群集信息存儲(chǔ)和檢索系統(tǒng)中提供故障恢復(fù)保護(hù)的方法。

發(fā)明內(nèi)容
本發(fā)明包括一種信息存儲(chǔ)和檢索系統(tǒng),其包括多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備;第一設(shè)備適配器,與該多個(gè)存儲(chǔ)設(shè)備互連;第二設(shè)備適配器,與該多個(gè)存儲(chǔ)設(shè)備互連;第一群集,包括第一處理器、第一數(shù)據(jù)高速緩存、用于該第一設(shè)備適配器的工作設(shè)備驅(qū)動(dòng)程序(driver)、以及用于該第二設(shè)備適配器的備用(standby)設(shè)備驅(qū)動(dòng)程序;第二群集,包括第二處理器、第二數(shù)據(jù)高速緩存、用于該第二設(shè)備適配器的工作設(shè)備驅(qū)動(dòng)程序、以及用于所述第一設(shè)備適配器的備用設(shè)備驅(qū)動(dòng)程序;以及遠(yuǎn)程I/O網(wǎng)絡(luò),互連第一群集、第二群集、第一設(shè)備適配器和第二設(shè)備適配器。
本發(fā)明還包括一種用于在本發(fā)明的信息存儲(chǔ)和檢索系統(tǒng)中進(jìn)行故障恢復(fù)保護(hù)的方法。本發(fā)明的方法提供用于第一設(shè)備適配器的第一設(shè)備驅(qū)動(dòng)程序和用于第二設(shè)備適配器的第二設(shè)備驅(qū)動(dòng)程序,并且將這些設(shè)備驅(qū)動(dòng)程序安設(shè)在兩個(gè)群集中。然后,該方法將安設(shè)在第一群集中的第一設(shè)備驅(qū)動(dòng)程序置于工作中,將安設(shè)在第二群集中的第二設(shè)備驅(qū)動(dòng)程序置于工作中,并且將安設(shè)在第二群集中的第一設(shè)備驅(qū)動(dòng)程序置于備用模式中。
隨后,本發(fā)明的方法檢測(cè)第一群集的故障,隨后是第二設(shè)備適配器的故障。然后,該方法使安設(shè)在第二群集中的第一設(shè)備驅(qū)動(dòng)程序工作,并且使用第一設(shè)備適配器和安設(shè)在第二群集中的第一設(shè)備驅(qū)動(dòng)程序繼續(xù)訪問存儲(chǔ)在該多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備中的信息。


通過閱讀下面結(jié)合附圖的詳細(xì)描述,本發(fā)明將會(huì)變得更好理解,其中相同的附圖標(biāo)記用來指定相同的單元,并且其中圖1是現(xiàn)有技術(shù)的信息存儲(chǔ)和檢索系統(tǒng)的方框圖;圖2A是圖1的現(xiàn)有技術(shù)系統(tǒng)的方框圖,其示出了群集故障;圖2B是圖1的現(xiàn)有技術(shù)系統(tǒng)的方框圖,其示出了與設(shè)備適配器故障組合的群集故障;圖3是本發(fā)明的信息存儲(chǔ)和檢索系統(tǒng)的方框圖;圖4A是圖3的本發(fā)明系統(tǒng)的方框圖,其示出了群集故障;圖4B是圖3的本發(fā)明系統(tǒng)的方框圖,其示出了與設(shè)備適配器故障組合的群集故障;圖5是示出圖4B的系統(tǒng)的方框圖,其中該系統(tǒng)具有經(jīng)過重新配置的設(shè)備驅(qū)動(dòng)程序;
圖6是概述本發(fā)明方法的第一實(shí)施例的步驟的流程圖;以及圖7是概述本發(fā)明方法的第二實(shí)施例的步驟的流程圖。
具體實(shí)施例方式
參照附圖在下文的優(yōu)選實(shí)施例中描述本發(fā)明,其中相同的附圖標(biāo)記表示相同或類似的單元。本發(fā)明將被描述為在包括兩個(gè)群集、兩個(gè)設(shè)備適配器和一個(gè)存儲(chǔ)設(shè)備環(huán)(1oop)的數(shù)據(jù)處理系統(tǒng)中實(shí)施。然而,下面對(duì)本發(fā)明的設(shè)備和方法的描述不旨在將本發(fā)明局限于任何具體數(shù)據(jù)處理系統(tǒng),而是這里的本發(fā)明可以一般性地應(yīng)用于為數(shù)據(jù)存儲(chǔ)系統(tǒng)提供故障恢復(fù)保護(hù)。
現(xiàn)在參照?qǐng)D1,現(xiàn)有技術(shù)的信息存儲(chǔ)和檢索系統(tǒng)100包括第一群集110、第二群集120、第一設(shè)備適配器艙(bay)140、第二設(shè)備適配器艙150、通信總線130、設(shè)備環(huán)180、以及多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備190。通信總線130互連群集110、群集120、包括設(shè)備適配器160的設(shè)備適配器艙140、以及包括設(shè)備適配器170的設(shè)備適配器艙150。設(shè)備環(huán)180互連設(shè)備適配器160、設(shè)備適配器170和多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備190。
群集110還包括處理器111、數(shù)據(jù)高速緩存112、DA1設(shè)備驅(qū)動(dòng)程序114、I/O橋115、I/O總線116以及可選的非易失性存儲(chǔ)裝置(“NVS”)113。I/O總線116互連處理器111、數(shù)據(jù)高速緩存112、設(shè)備驅(qū)動(dòng)程序114、I/O橋115以及可選的NVS 113。
I/O總線116可以采取各種形式。在特定實(shí)施例中,I/O總線116包括PCI總線,其在通常小于一英尺的短距離上支持并行數(shù)據(jù)、多站式I/O適配器環(huán)境。在其它實(shí)施例中,I/O總線116以串行方式傳送數(shù)據(jù),支持點(diǎn)到點(diǎn)拓?fù)浣Y(jié)構(gòu),并且可以跨越一公里或更大的距離。I/O橋115接口I/O總線116與通信總線130。I/O處理器111和設(shè)備適配器160管理向和從數(shù)據(jù)高速緩存112的數(shù)據(jù)流動(dòng),控制I/O設(shè)備190,并且在需要時(shí)執(zhí)行數(shù)據(jù)協(xié)議翻譯。
群集120還包括處理器121、數(shù)據(jù)高速緩存122、DA2設(shè)備驅(qū)動(dòng)程序124、I/O橋125、I/O總線126以及可選的非易失性存儲(chǔ)裝置123。I/O總線126互連處理器121、數(shù)據(jù)高速緩存122、設(shè)備驅(qū)動(dòng)程序124、I/O橋125以及可選的NVS 123。
I/O總線126可以采取各種形式。在特定實(shí)施例中,I/O總線126包括PCI總線,其在通常小于一英尺的短距離上支持并行數(shù)據(jù)、多站式I/O適配器環(huán)境。在其它實(shí)施例中,I/O總線126以串行方式傳送數(shù)據(jù),支持點(diǎn)到點(diǎn)拓?fù)浣Y(jié)構(gòu),并且可以跨越一公里或更大的距離。I/O橋125接口I/O總線126與通信總線130。I/O處理器121和設(shè)備適配器170管理向和從數(shù)據(jù)高速緩存122的數(shù)據(jù)流動(dòng),控制I/O設(shè)備190,并且在需要時(shí)執(zhí)行數(shù)據(jù)協(xié)議翻譯。
現(xiàn)在參照?qǐng)D2A,在系統(tǒng)100中的群集之一例如群集120出現(xiàn)故障的情況下,則不能使用出現(xiàn)故障的群集向多個(gè)I/O設(shè)備190寫入或者從其讀取信息。其余工作群集,例如圖2A的所示實(shí)施例中的群集110,仍然可以向多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備190寫入數(shù)據(jù)和/或從其讀取數(shù)據(jù)。
參照?qǐng)D2B,在安設(shè)在系統(tǒng)100中的第一群集例如群集120出現(xiàn)故障然后安設(shè)在第二群集中的設(shè)備適配器例如設(shè)備適配器160也出現(xiàn)故障的情況下,則不能向該多個(gè)存儲(chǔ)設(shè)備190寫入或者從其讀取數(shù)據(jù)。
現(xiàn)在參照?qǐng)D3,本發(fā)明的信息存儲(chǔ)和檢索系統(tǒng)300包括第一群集310、第二群集320、第一設(shè)備適配器艙140、第二設(shè)備適配器艙150、遠(yuǎn)程I/O網(wǎng)絡(luò)330、設(shè)備環(huán)180以及多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備190。遠(yuǎn)程I/O(“RIO”)網(wǎng)絡(luò)330互連群集310、群集320、包括設(shè)備適配器160的設(shè)備適配器艙140、以及包括設(shè)備適配器170的設(shè)備適配器艙150。設(shè)備環(huán)180互連設(shè)備適配器160、設(shè)備適配器170和多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備190。在特定實(shí)施例中,設(shè)備環(huán)180包括光纖通道仲裁環(huán)(Fibre ChannelArbitrated Loop)。
群集310還包括處理器311、數(shù)據(jù)高速緩存312、I/O橋315、I/O總線316以及可選的非易失性存儲(chǔ)裝置313。群集310還包括用于安設(shè)在設(shè)備適配器艙140中的設(shè)備適配器160的設(shè)備適配器驅(qū)動(dòng)程序314,即DA1設(shè)備驅(qū)動(dòng)程序,其中該第一設(shè)備適配器驅(qū)動(dòng)程序314工作。群集310還包括用于安設(shè)在設(shè)備適配器艙150中的設(shè)備適配器170的設(shè)備適配器驅(qū)動(dòng)程序318,即DA2設(shè)備驅(qū)動(dòng)程序,其中該第二設(shè)備適配器驅(qū)動(dòng)程序318不工作,但是被置于備用模式中。I/O總線316互連處理器311、數(shù)據(jù)高速緩存312、設(shè)備驅(qū)動(dòng)程序314、設(shè)備驅(qū)動(dòng)程序318、I/O橋315以及可選的NVS 313。
這里所謂的設(shè)備驅(qū)動(dòng)程序正在“工作”或者被置于“工作模式”中是指設(shè)備驅(qū)動(dòng)程序已被裝載、初始化和配置。在此,“配置”設(shè)備驅(qū)動(dòng)程序是指在設(shè)備驅(qū)動(dòng)程序例如設(shè)備驅(qū)動(dòng)程序314與適配器本身之間設(shè)置接口,其中讀/寫適配器的PCI配置空間,并且其中在設(shè)備驅(qū)動(dòng)程序與適配器之間交換存儲(chǔ)器地址,從而使得命令的交換因而是可能的。
這里所謂的“備用”設(shè)備驅(qū)動(dòng)程序或者將設(shè)備驅(qū)動(dòng)程序置于“備用模式”中是指設(shè)備驅(qū)動(dòng)程序已被裝載和初始化,但是未被配置。在設(shè)置PCI接口之后,該設(shè)備適配器及其對(duì)應(yīng)的設(shè)備適配器可以服務(wù)I/O請(qǐng)求。根據(jù)系統(tǒng)負(fù)載,裝載和初始化設(shè)備驅(qū)動(dòng)程序可能花費(fèi)數(shù)毫秒到數(shù)秒,而配置該設(shè)備驅(qū)動(dòng)程序的PCI接口僅花費(fèi)大約一毫秒。這樣,可以在大約一毫秒內(nèi)使“備用”設(shè)備驅(qū)動(dòng)程序工作。
群集320還包括處理器321、數(shù)據(jù)高速緩存322、I/O橋325、I/O總線326以及可選的非易失性存儲(chǔ)裝置323。I/O總線326互連處理器321、數(shù)據(jù)高速緩存322、NVS 323、設(shè)備驅(qū)動(dòng)程序324、以及I/O橋325。群集320還包括用于安設(shè)在設(shè)備適配器艙150中的設(shè)備適配器170的第一設(shè)備適配器驅(qū)動(dòng)程序324,即DA2設(shè)備驅(qū)動(dòng)程序,其中該第一設(shè)備適配器驅(qū)動(dòng)程序324工作。群集320還包括用于安設(shè)在設(shè)備適配器艙140中的設(shè)備適配器160的第二設(shè)備適配器驅(qū)動(dòng)程序328,即DA1設(shè)備驅(qū)動(dòng)程序,其中如上所述該第二設(shè)備適配器驅(qū)動(dòng)程序328不工作,但是被置于備用模式中。
在特定實(shí)施例中,在RIO網(wǎng)絡(luò)330上傳送的每組信號(hào)包括8個(gè)數(shù)據(jù)、1個(gè)時(shí)鐘以及1個(gè)標(biāo)志線。在特定實(shí)施例中,RIO網(wǎng)絡(luò)330能夠以高達(dá)大約500MB(單向或雙向)傳輸數(shù)據(jù)。RIO網(wǎng)絡(luò)330包括面向分組的總線。通過硬件分組重試和替換路徑重試來采用鏈路級(jí)流控制,以確保數(shù)據(jù)的可靠傳遞。分組的長(zhǎng)度大小范圍為12到276字節(jié),其包括8到12字節(jié)首標(biāo)、4字節(jié)尾部循環(huán)冗余校驗(yàn)(“CRC”)、以及0到260字節(jié)的數(shù)據(jù)有效載荷。對(duì)I/O操作的低延遲管理進(jìn)行強(qiáng)調(diào)。命令已被設(shè)計(jì)成高效執(zhí)行常規(guī)I/O操作例如編程I/O(PIO)、裝載和存儲(chǔ)、中斷處理、包括有序和無序傳輸?shù)倪x項(xiàng)的數(shù)據(jù)讀/寫、以及高速緩存協(xié)調(diào)。
在特定實(shí)施例中,以有規(guī)律的間隔,控制器311發(fā)送“心跳”信號(hào)到控制器321。當(dāng)接收到該心跳信號(hào)時(shí),控制器321將響應(yīng)心跳信號(hào)發(fā)送到目標(biāo)控制器311。只要第一群集中的處理器在規(guī)定的心跳響應(yīng)間隔內(nèi)從相鄰群集中的控制器接收到心跳信號(hào),控制器就確定相鄰群集工作。另一方面,例如,如果控制器311沒有在心跳響應(yīng)間隔內(nèi)從控制器321接收到響應(yīng)心跳信號(hào),則控制器311確定群集320不再工作,即該群集320出現(xiàn)“故障”。
在特定實(shí)施例中,心跳響應(yīng)間隔由制造商在安設(shè)在每個(gè)群集內(nèi)的固件中設(shè)置。在特定實(shí)施例中,心跳響應(yīng)間隔由系統(tǒng)300的操作員設(shè)置。在特定實(shí)施例中,心跳響應(yīng)間隔由一個(gè)或多個(gè)互連的主機(jī)計(jì)算機(jī)設(shè)置。在特定實(shí)施例中,心跳響應(yīng)間隔在100毫秒與5秒之間。
本發(fā)明包括一種方法,其使用本發(fā)明的信息存儲(chǔ)和檢索系統(tǒng)300在群集故障加上設(shè)備適配器故障的期間提供故障恢復(fù)保護(hù)。圖6概述了本發(fā)明方法的第一實(shí)施例的步驟。現(xiàn)在參照?qǐng)D6,在步驟610,本發(fā)明方法提供雙群集信息存儲(chǔ)和檢索系統(tǒng),例如系統(tǒng)300(圖3),其中除了兩個(gè)群集之外,該系統(tǒng)還包括兩個(gè)或更多個(gè)設(shè)備適配器例如設(shè)備適配器160和170、以及多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備例如多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備190。
在步驟615,本發(fā)明方法將用于兩個(gè)設(shè)備適配器的設(shè)備驅(qū)動(dòng)程序安設(shè)在每個(gè)群集中。在特定實(shí)施例中,這些設(shè)備驅(qū)動(dòng)程序被安設(shè)在位于第一群集的處理器例如處理器311內(nèi)的RAM、以及位于第二群集的處理器例如處理器321內(nèi)的RAM中。在特定實(shí)施例中,這些設(shè)備驅(qū)動(dòng)程序被寫入到安設(shè)在每個(gè)群集中的NVS,例如NVS 313和NVS 323。在特定實(shí)施例中,這些設(shè)備驅(qū)動(dòng)程序被寫入到安設(shè)在每個(gè)群集中的數(shù)據(jù)高速緩存,例如高速緩存312和高速緩存322。
在步驟620,本發(fā)明方法使安設(shè)在第一群集中的用于第一設(shè)備適配器的設(shè)備驅(qū)動(dòng)程序工作。在特定實(shí)施例中,步驟620包括裝載、初始化并配置該設(shè)備驅(qū)動(dòng)程序。在特定實(shí)施例中,步驟620由安設(shè)在第一群集如群集310中的處理器如處理器311執(zhí)行。在特定實(shí)施例中,在系統(tǒng)啟動(dòng)時(shí)、或者在每次系統(tǒng)重啟時(shí)執(zhí)行步驟620。
在步驟625,本發(fā)明方法將安設(shè)在第一群集中的用于第二設(shè)備適配器的設(shè)備驅(qū)動(dòng)程序置于備用模式中。在特定實(shí)施例中,步驟625包括裝載并初始化,但是不配置該設(shè)備驅(qū)動(dòng)程序。在特定實(shí)施例中,步驟625由安設(shè)在第一群集如群集310中的處理器如處理器311執(zhí)行。在特定實(shí)施例中,在系統(tǒng)啟動(dòng)時(shí)、或者在每次系統(tǒng)重啟時(shí)執(zhí)行步驟625。
在步驟630,本發(fā)明方法使安設(shè)在第二群集中的用于第二設(shè)備適配器的設(shè)備驅(qū)動(dòng)程序工作。在特定實(shí)施例中,步驟630包括裝載、初始化并配置該設(shè)備驅(qū)動(dòng)程序。在特定實(shí)施例中,步驟630由安設(shè)在第二群集如群集320中的處理器如處理器321執(zhí)行。在特定實(shí)施例中,在系統(tǒng)啟動(dòng)時(shí)、或者在每次系統(tǒng)重啟時(shí)執(zhí)行步驟630。
在步驟635,本發(fā)明方法將安設(shè)在第二群集中的用于第一設(shè)備適配器的設(shè)備驅(qū)動(dòng)程序置于備用模式中。在特定實(shí)施例中,步驟635包括裝載并初始化,但是不配置該設(shè)備驅(qū)動(dòng)程序。在特定實(shí)施例中,步驟635由安設(shè)在第二群集如群集320中的處理器如處理器321執(zhí)行。在特定實(shí)施例中,在系統(tǒng)啟動(dòng)時(shí)、或者在每次系統(tǒng)重啟時(shí)執(zhí)行步驟635。
步驟620、625、630和635可以以任何次序執(zhí)行。步驟620、625、630和635可以在步驟615之后和步驟640之前的任何時(shí)間執(zhí)行。
在步驟640,本發(fā)明方法檢測(cè)兩個(gè)群集之一的故障,例如群集320的故障。在特定實(shí)施例中,步驟640由安設(shè)在未出現(xiàn)故障的群集如群集310中的處理器如處理器311執(zhí)行。
現(xiàn)在參照?qǐng)D4A,在步驟645,在第一群集例如群集320的故障之后,本發(fā)明方法使用第一設(shè)備適配器例如設(shè)備適配器160和第一設(shè)備驅(qū)動(dòng)程序例如設(shè)備驅(qū)動(dòng)程序314,通過工作群集,例如圖4A的所示實(shí)施例中的群集310,訪問多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備190。
參照?qǐng)D4B和6,在步驟650,本發(fā)明方法檢測(cè)安設(shè)在另外工作群集例如群集310中的設(shè)備適配器例如設(shè)備適配器160的故障。在特定實(shí)施例中,步驟650由安設(shè)在工作群集中的處理器,例如圖4B的所示實(shí)施例中的處理器311執(zhí)行。
現(xiàn)在參照?qǐng)D5和6,在步驟655,本發(fā)明方法使在步驟625/635置于備用模式中的設(shè)備驅(qū)動(dòng)程序工作。例如,如果在步驟640檢測(cè)到群集320的故障,并且在步驟650檢測(cè)到設(shè)備適配器160的故障,則在步驟655,本發(fā)明方法使設(shè)備驅(qū)動(dòng)程序318工作。在特定實(shí)施例中,步驟655包括配置設(shè)備驅(qū)動(dòng)程序318。在特定實(shí)施例中,在大約1毫秒的總時(shí)間內(nèi)執(zhí)行步驟650和655。在特定實(shí)施例中,步驟655由安設(shè)在工作群集中的處理器例如圖4B的所示實(shí)施例中的處理器311執(zhí)行。
在步驟660,本發(fā)明方法使用工作群集例如圖5的所示實(shí)施例中的群集310、設(shè)備驅(qū)動(dòng)程序318、RIO網(wǎng)絡(luò)330和設(shè)備適配器170,繼續(xù)訪問多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備。
圖7概述了本發(fā)明方法的第二實(shí)施例的步驟。步驟710、715、720和730對(duì)應(yīng)于圖6所示的步驟610、615、620和625。在步驟735,安設(shè)在每個(gè)群集中的處理器向/從安設(shè)在其它群集中的處理器發(fā)送/接收心跳信號(hào)。如上所述,心跳響應(yīng)間隔在100毫秒與5秒之間。
在步驟737,本發(fā)明方法確定是否檢測(cè)到群集故障,即是否在心跳響應(yīng)間隔內(nèi)沒有接收到心跳信號(hào)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,步驟737還包括檢索預(yù)定的心跳響應(yīng)間隔。在特定實(shí)施例中,步驟737由每個(gè)群集中的處理器執(zhí)行。
如果本發(fā)明方法在步驟737確定沒有檢測(cè)到群集故障,則該方法從步驟737轉(zhuǎn)到步驟735并且繼續(xù)??蛇x地,如果本發(fā)明方法在步驟737確定第一群集例如群集320出現(xiàn)故障,則該方法從步驟737轉(zhuǎn)到步驟740,其中該方法將安設(shè)在第二群集即工作群集310中的用于第一設(shè)備適配器如設(shè)備適配器170的設(shè)備驅(qū)動(dòng)程序如設(shè)備驅(qū)動(dòng)程序318置于備用狀態(tài)。在特定實(shí)施例中,步驟740包括裝載并初始化該設(shè)備驅(qū)動(dòng)程序。步驟745、750、755和760對(duì)應(yīng)于圖6所述的步驟645、650、655和660。隨后,在步驟755配置在步驟740裝載并配置的設(shè)備驅(qū)動(dòng)程序。
可以單獨(dú)實(shí)現(xiàn)圖6和/或7所述的本發(fā)明方法的實(shí)施例。而且,在特定實(shí)施例中,可以對(duì)圖6和/或7所述的各個(gè)步驟進(jìn)行組合、去除或重新排序。
在特定實(shí)施例中,本發(fā)明包括駐留在存儲(chǔ)器例如數(shù)據(jù)高速緩存312(圖3)和/或NVS 313(圖3)和/或數(shù)據(jù)高速緩存322(圖3)和/或NVS323中的指令,其中這些指令由處理器311(圖3)和/或處理器321(圖3)執(zhí)行,以執(zhí)行圖6所示的步驟620到660和/或圖7所示的步驟720到760。
在其它實(shí)施例中,本發(fā)明包括駐留在任何其它計(jì)算機(jī)程序產(chǎn)品中的指令,其中這些指令由外部或內(nèi)部于系統(tǒng)300的計(jì)算機(jī)執(zhí)行,以執(zhí)行圖6所示的步驟620到660和/或圖7所示的步驟720到760。在任何情況下,這些指令可被編碼在信息存儲(chǔ)介質(zhì)中,該信息存儲(chǔ)介質(zhì)包括例如磁信息存儲(chǔ)介質(zhì)、光信息存儲(chǔ)介質(zhì)、電子信息存儲(chǔ)介質(zhì)等。在此,“電子存儲(chǔ)介質(zhì)”例如是指諸如PROM、EPROM、EEPROM、快閃PROM、致密閃存(compactflash)、智能介質(zhì)(smartmedia)等的設(shè)備。
盡管對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行了詳細(xì)的闡述,但是顯而易見,在不脫離如所附權(quán)利要求所述的本發(fā)明范圍的情況下,本領(lǐng)域的技術(shù)人員可以對(duì)這些實(shí)施例進(jìn)行變更和修改。
權(quán)利要求
1.一種信息存儲(chǔ)和檢索系統(tǒng),包括多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備;第一設(shè)備適配器,與所述多個(gè)存儲(chǔ)設(shè)備互連;第二設(shè)備適配器,與所述多個(gè)存儲(chǔ)設(shè)備互連;第一群集,包括第一處理器、第一數(shù)據(jù)高速緩存、用于所述第一設(shè)備適配器的工作設(shè)備驅(qū)動(dòng)程序、以及用于所述第二設(shè)備適配器的備用設(shè)備驅(qū)動(dòng)程序;第二群集,包括第二處理器、第二數(shù)據(jù)高速緩存、用于所述第二設(shè)備適配器的工作設(shè)備驅(qū)動(dòng)程序、以及用于所述第一設(shè)備適配器的備用設(shè)備驅(qū)動(dòng)程序;以及遠(yuǎn)程I/O網(wǎng)絡(luò),互連所述第一群集、所述第二群集、所述第一設(shè)備適配器和所述第二設(shè)備適配器。
2.如權(quán)利要求1所述的信息存儲(chǔ)和檢索系統(tǒng),其中裝載、初始化并配置安設(shè)在所述第一群集中的所述工作設(shè)備驅(qū)動(dòng)程序;以及其中裝載、初始化并配置安設(shè)在所述第二群集中的所述工作設(shè)備驅(qū)動(dòng)程序。
3.如權(quán)利要求2所述的信息存儲(chǔ)和檢索系統(tǒng),其中裝載并初始化,但是不配置安設(shè)在所述第一群集中的所述備用設(shè)備驅(qū)動(dòng)程序。
4.如權(quán)利要求3所述的信息存儲(chǔ)和檢索系統(tǒng),其中裝載并初始化,但是不配置安設(shè)在所述第二群集中的所述備用設(shè)備驅(qū)動(dòng)程序。
5.如權(quán)利要求4所述的信息存儲(chǔ)和檢索系統(tǒng),其中所述遠(yuǎn)程I/O網(wǎng)絡(luò)能夠單向或雙向地以高達(dá)大約500MB傳輸數(shù)據(jù)。
6.如權(quán)利要求4所述的信息存儲(chǔ)和檢索系統(tǒng),其中所述遠(yuǎn)程I/O網(wǎng)絡(luò)包括面向分組的總線,其中所述分組的長(zhǎng)度大小范圍為12到276字節(jié),其包括8到12字節(jié)首標(biāo)、4字節(jié)尾部循環(huán)冗余校驗(yàn)、以及0到260字節(jié)的數(shù)據(jù)有效載荷。
7.如權(quán)利要求4所述的信息存儲(chǔ)和檢索系統(tǒng),還包括光纖通道仲裁環(huán),其互連所述多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備、所述第一設(shè)備適配器和所述第二設(shè)備適配器。
8.一種用于在信息存儲(chǔ)和檢索系統(tǒng)中進(jìn)行故障恢復(fù)保護(hù)的方法,其中所述信息存儲(chǔ)和檢索系統(tǒng)包括兩個(gè)群集、兩個(gè)設(shè)備適配器以及多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備,該方法包括以下步驟提供用于第一設(shè)備適配器的第一設(shè)備驅(qū)動(dòng)程序和用于第二設(shè)備適配器的第二設(shè)備驅(qū)動(dòng)程序;將所述第一設(shè)備驅(qū)動(dòng)程序和所述第二設(shè)備驅(qū)動(dòng)程序安設(shè)在兩個(gè)群集中;將安設(shè)在第一群集中的所述第一設(shè)備驅(qū)動(dòng)程序置于工作中;將安設(shè)在第二群集中的所述第二設(shè)備驅(qū)動(dòng)程序置于工作中;將安設(shè)在所述第二群集中的所述第一設(shè)備驅(qū)動(dòng)程序置于備用模式中;檢測(cè)所述第一群集的故障;檢測(cè)第二設(shè)備適配器的故障;使安設(shè)在所述第二群集中的所述第一設(shè)備驅(qū)動(dòng)程序工作;以及使用所述第一設(shè)備適配器和安設(shè)在所述第二群集中的所述第一設(shè)備驅(qū)動(dòng)程序,訪問存儲(chǔ)在所述多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備中的信息。
9.如權(quán)利要求8所述的方法,其中所述訪問步驟還包括使用所述第二群集和所述第一設(shè)備適配器向所述多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備中的一個(gè)或更多個(gè)寫入數(shù)據(jù)。
10.如權(quán)利要求8所述的方法,其中所述訪問步驟還包括使用所述第二群集和所述第一設(shè)備適配器從所述多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備中的一個(gè)或更多個(gè)讀取數(shù)據(jù)。
11.如權(quán)利要求8所述的方法,還包括以下步驟將安設(shè)在第一群集中的用于第二設(shè)備適配器的設(shè)備驅(qū)動(dòng)程序置于備用模式中。
12.如權(quán)利要求8所述的方法,還包括以下步驟由所述第一處理器監(jiān)視所述第二群集的狀態(tài)。
13.如權(quán)利要求12所述的方法,其中所述監(jiān)測(cè)步驟還包括以下步驟由所述第一處理器向所述第二處理器發(fā)送查詢心跳信號(hào);由所述第二處理器接收所述查詢心跳信號(hào);由所述第二處理器向所述第一處理器發(fā)送響應(yīng)心跳信號(hào);由所述第一處理器接收所述響應(yīng)心跳信號(hào)。
14.如權(quán)利要求13所述的方法,還包括以下步驟設(shè)置心跳響應(yīng)間隔;由所述第一處理器確定是否在所述心跳響應(yīng)間隔內(nèi)接收到答復(fù)心跳信號(hào);如果所述第一處理器沒有在所述心跳響應(yīng)間隔內(nèi)接收到答復(fù)心跳信號(hào),則工作,從而由所述第一處理器確定所述第二群集出現(xiàn)故障。
15.如權(quán)利要求8所述的方法,還包括以下步驟提供遠(yuǎn)程I/O網(wǎng)絡(luò);使用所述遠(yuǎn)程I/O網(wǎng)絡(luò),互連所述第一群集、所述第二群集、所述第一設(shè)備適配器和所述第二設(shè)備適配器。
16.如權(quán)利要求15所述的方法,其中所述訪問步驟還包括使用所述遠(yuǎn)程I/O網(wǎng)絡(luò)在所述第二群集與所述第一設(shè)備適配器之間單向或雙向地以高達(dá)大約500MB提供數(shù)據(jù)。
17.如權(quán)利要求16所述的方法,其中所述訪問步驟還包括使用所述遠(yuǎn)程I/O網(wǎng)絡(luò)提供一個(gè)或多個(gè)信息分組,其中所述分組的長(zhǎng)度在大約12到大約276字節(jié)之間,其包括8到12字節(jié)首標(biāo)、4字節(jié)尾部循環(huán)冗余校驗(yàn)、以及0到260字節(jié)的數(shù)據(jù)有效載荷。
18.如權(quán)利要求8所述的方法,還包括以下步驟提供光纖通道仲裁環(huán);使用所述光纖通道仲裁環(huán),互連所述第一設(shè)備適配器、所述第二設(shè)備適配器和所述多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備。
19.一種產(chǎn)品,包括處理器、存儲(chǔ)器設(shè)備、第一設(shè)備驅(qū)動(dòng)程序、第二設(shè)備驅(qū)動(dòng)程序、以及計(jì)算機(jī)可用介質(zhì),所述計(jì)算機(jī)可用介質(zhì)具有安設(shè)在其中的計(jì)算機(jī)可讀程序代碼,以提供故障恢復(fù)保護(hù),其中所述產(chǎn)品能夠與使用所述第一設(shè)備驅(qū)動(dòng)程序的第一設(shè)備適配器和與使用所述第二設(shè)備驅(qū)動(dòng)程序的第二設(shè)備適配器通信,并且其中所述第一設(shè)備適配器和所述第二設(shè)備適配器能夠與多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備通信,并且其中所述產(chǎn)品能夠與計(jì)算群集通信,該計(jì)算機(jī)可讀程序代碼包括一系列計(jì)算機(jī)可讀程序步驟以實(shí)現(xiàn)將所述第一設(shè)備驅(qū)動(dòng)程序置于工作中;將所述第二設(shè)備驅(qū)動(dòng)程序置于備用模式中;使用所述第一設(shè)備驅(qū)動(dòng)程序和所述第一設(shè)備適配器,訪問存儲(chǔ)在所述多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備中的信息;檢測(cè)所述計(jì)算群集的故障;檢測(cè)所述第一設(shè)備適配器的故障;使所述第二設(shè)備驅(qū)動(dòng)程序工作;以及使用所述第二設(shè)備驅(qū)動(dòng)程序和所述第二設(shè)備適配器,繼續(xù)訪問存儲(chǔ)在所述多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備中的信息。
20.如權(quán)利要求19所述的產(chǎn)品,其中繼續(xù)訪問信息的所述可讀程序代碼還包括一系列計(jì)算機(jī)可讀程序步驟,以實(shí)現(xiàn)使用所述第二設(shè)備驅(qū)動(dòng)程序和所述第二設(shè)備適配器向所述多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備中的一個(gè)或更多個(gè)寫入數(shù)據(jù)。
21.如權(quán)利要求19所述的產(chǎn)品,其中繼續(xù)訪問信息的所述可讀程序代碼還包括一系列計(jì)算機(jī)可讀程序步驟,以實(shí)現(xiàn)使用所述第二設(shè)備驅(qū)動(dòng)程序和所述第二設(shè)備適配器從所述多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備中的一個(gè)或更多個(gè)讀取數(shù)據(jù)。
22.如權(quán)利要求19所述的產(chǎn)品,所述計(jì)算機(jī)可讀程序代碼還包括一系列計(jì)算機(jī)可讀程序步驟,以實(shí)現(xiàn)將所述第二設(shè)備驅(qū)動(dòng)程序置于備用模式中。
23.如權(quán)利要求19所述的產(chǎn)品,所述計(jì)算機(jī)可讀程序代碼包括一系列計(jì)算機(jī)可讀程序步驟,以實(shí)現(xiàn)由所述處理器監(jiān)視所述計(jì)算群集的狀態(tài)。
24.如權(quán)利要求23所述的產(chǎn)品,其中監(jiān)視狀態(tài)的所述可讀程序代碼還包括一系列計(jì)算機(jī)可讀程序步驟,以實(shí)現(xiàn)由所述處理器將查詢心跳信號(hào)發(fā)送到所述計(jì)算群集;從所述計(jì)算群集接收響應(yīng)心跳信號(hào)。
25.如權(quán)利要求24所述的產(chǎn)品,其中監(jiān)視狀態(tài)的所述可讀程序代碼還包括一系列計(jì)算機(jī)可讀程序步驟,以實(shí)現(xiàn)檢索心跳響應(yīng)間隔;由所述處理器確定是否在所述心跳響應(yīng)間隔內(nèi)接收到所述響應(yīng)心跳信號(hào);如果所述處理器沒有在所述心跳響應(yīng)間隔內(nèi)接收到所述響應(yīng)心跳信號(hào),則工作,從而由所述處理器確定所述計(jì)算群集出現(xiàn)故障。
26.如權(quán)利要求19所述的產(chǎn)品,還包括遠(yuǎn)程I/O網(wǎng)絡(luò),其互連所述產(chǎn)品、所述計(jì)算群集、所述第一設(shè)備適配器和所述第二設(shè)備適配器,所述計(jì)算機(jī)可讀程序代碼還包括一系列計(jì)算機(jī)可讀程序步驟,以在所述產(chǎn)品與所述第一設(shè)備適配器之間以及在所述產(chǎn)品與所述第二設(shè)備適配器之間單向或雙向地以高達(dá)大約500MB提供數(shù)據(jù)。
27.如權(quán)利要求26所述的產(chǎn)品,所述計(jì)算機(jī)可讀程序代碼還包括一系列計(jì)算機(jī)可讀程序步驟,以實(shí)現(xiàn)使用所述遠(yuǎn)程I/O網(wǎng)絡(luò)提供一個(gè)或多個(gè)信息分組,其中所述分組的長(zhǎng)度在約12到約276字節(jié)之間,其包括8到12字節(jié)首標(biāo)、4字節(jié)尾部循環(huán)冗余校驗(yàn)、以及0到260字節(jié)的數(shù)據(jù)有效載荷。
28.一種可用于可編程計(jì)算機(jī)處理器的計(jì)算機(jī)程序產(chǎn)品,其具有包含在其中以向信息存儲(chǔ)和檢索系統(tǒng)提供故障恢復(fù)保護(hù)的計(jì)算機(jī)可讀程序代碼,所述信息存儲(chǔ)和檢索系統(tǒng)包括多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備;第一設(shè)備適配器,與所述多個(gè)存儲(chǔ)設(shè)備互連;第二設(shè)備適配器,與所述多個(gè)存儲(chǔ)設(shè)備互連;第一群集,包括可編程計(jì)算機(jī)處理器、第一數(shù)據(jù)高速緩存、用于所述第一設(shè)備適配器的工作設(shè)備驅(qū)動(dòng)程序、用于所述第二設(shè)備適配器的備用設(shè)備驅(qū)動(dòng)程序;第二群集,包括第二數(shù)據(jù)高速緩存、用于所述第二設(shè)備適配器的工作設(shè)備驅(qū)動(dòng)程序、以及用于所述第一設(shè)備適配器的備用設(shè)備驅(qū)動(dòng)程序;以及遠(yuǎn)程I/O網(wǎng)絡(luò),互連所述第一群集、所述第二群集、所述第一設(shè)備適配器和所述第二設(shè)備適配器,所述計(jì)算機(jī)程序產(chǎn)品包括使所述可編程計(jì)算機(jī)處理器將安設(shè)在所述第一群集中的所述第一設(shè)備驅(qū)動(dòng)程序置于工作中的計(jì)算機(jī)可讀程序代碼;使所述可編程計(jì)算機(jī)處理器將安設(shè)在所述第一群集中的所述第二設(shè)備驅(qū)動(dòng)程序置于備用模式中的計(jì)算機(jī)可讀程序代碼;使所述可編程計(jì)算機(jī)處理器檢測(cè)所述第二群集的故障的計(jì)算機(jī)可讀程序代碼;使所述可編程計(jì)算機(jī)處理器檢測(cè)所述第一設(shè)備適配器的故障的計(jì)算機(jī)可讀程序代碼;使所述可編程計(jì)算機(jī)處理器讓安設(shè)在所述第一群集中的所述第二設(shè)備驅(qū)動(dòng)程序工作的計(jì)算機(jī)可讀程序代碼;以及使所述可編程計(jì)算機(jī)處理器使用所述第二設(shè)備適配器和安設(shè)在所述第一群集中的所述第二設(shè)備驅(qū)動(dòng)程序訪問存儲(chǔ)在所述多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備中的信息的計(jì)算機(jī)可讀程序代碼。
29.如權(quán)利要求28所述的計(jì)算機(jī)程序產(chǎn)品,其中訪問信息的所述計(jì)算機(jī)可讀程序代碼還包括使所述可編程計(jì)算機(jī)處理器使用所述第一群集和所述第二設(shè)備適配器向所述多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備中的一個(gè)或更多個(gè)寫入數(shù)據(jù)的計(jì)算機(jī)可讀程序代碼。
30.如權(quán)利要求28所述的計(jì)算機(jī)程序產(chǎn)品,其中訪問信息的所述計(jì)算機(jī)可讀程序代碼還包括使所述可編程計(jì)算機(jī)處理器使用所述第一群集和所述第二設(shè)備適配器從所述多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備中的一個(gè)或更多個(gè)讀取數(shù)據(jù)的計(jì)算機(jī)可讀程序代碼。
31.如權(quán)利要求28所述的計(jì)算機(jī)程序產(chǎn)品,還包括使所述可編程計(jì)算機(jī)處理器監(jiān)視所述第二群集的狀態(tài)的計(jì)算機(jī)可讀程序代碼。
32.如權(quán)利要求31所述的計(jì)算機(jī)程序產(chǎn)品,還包括使所述可編程計(jì)算機(jī)處理器確定心跳響應(yīng)間隔的的計(jì)算機(jī)可讀程序代碼;使所述可編程計(jì)算機(jī)處理器向所述第二群集發(fā)送查詢心跳信號(hào)的計(jì)算機(jī)可讀程序代碼;使所述可編程計(jì)算機(jī)處理器從所述第二群集接收響應(yīng)心跳信號(hào)的計(jì)算機(jī)可讀程序代碼。
33.如權(quán)利要求32所述的計(jì)算機(jī)程序產(chǎn)品,還包括使所述可編程計(jì)算機(jī)處理器確定是否在所述心跳響應(yīng)間隔內(nèi)接收到所述響應(yīng)心跳信號(hào)的計(jì)算機(jī)可讀程序代碼;如果在所述心跳響應(yīng)間隔內(nèi)沒有接收到所述響應(yīng)心跳信號(hào)則使所述可編程計(jì)算機(jī)處理器確定所述第二群集出現(xiàn)故障的計(jì)算機(jī)可讀程序代碼。
34.如權(quán)利要求28所述的計(jì)算機(jī)程序產(chǎn)品,其中所述信息存儲(chǔ)和檢索系統(tǒng)還包括遠(yuǎn)程I/O網(wǎng)絡(luò),其互連所述第一群集、所述第二群集、所述第一設(shè)備適配器和所述第二設(shè)備適配器,還包括使所述可編程計(jì)算機(jī)處理器在所述第一群集與所述第一設(shè)備適配器之間以及在所述第一群集與所述第二設(shè)備適配器之間單向或雙向地以高達(dá)大約500MB提供數(shù)據(jù)的計(jì)算機(jī)可讀程序代碼。
35.如權(quán)利要求34所述的計(jì)算機(jī)程序產(chǎn)品,還包括使所述可編程計(jì)算機(jī)處理器使用所述遠(yuǎn)程I/O網(wǎng)絡(luò)提供一個(gè)或多個(gè)信息分組的計(jì)算機(jī)可讀程序代碼,其中所述分組的長(zhǎng)度在大約12到大約276字節(jié)之間,其包括8到12字節(jié)首標(biāo)、4字節(jié)尾部循環(huán)冗余校驗(yàn)、以及0到260字節(jié)的數(shù)據(jù)有效載荷。
全文摘要
本發(fā)明公開一種用于在信息存儲(chǔ)和檢索系統(tǒng)中進(jìn)行故障恢復(fù)保護(hù)的方法,該信息存儲(chǔ)和檢索系統(tǒng)包括兩個(gè)群集、兩個(gè)設(shè)備適配器、以及多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備。該方法提供用于第一和第二設(shè)備適配器的第一和第二設(shè)備驅(qū)動(dòng)程序并將這些設(shè)備驅(qū)動(dòng)程序安設(shè)在兩個(gè)群集中。然后,該方法將安設(shè)在第一群集中的第一設(shè)備驅(qū)動(dòng)程序置于工作中,將安設(shè)在第二群集中的第二設(shè)備驅(qū)動(dòng)程序置于工作中,并且將安設(shè)在第二群集中的第一設(shè)備驅(qū)動(dòng)程序置于備用模式中。該方法檢測(cè)第一群集的故障,隨后第二設(shè)備適配器的故障。然后,該方法使安設(shè)在第二群集中的第一設(shè)備驅(qū)動(dòng)程序工作,并且使用第一設(shè)備適配器和安設(shè)在第二群集中的第一設(shè)備驅(qū)動(dòng)程序繼續(xù)訪問存儲(chǔ)在該多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備中的信息。
文檔編號(hào)H04L12/56GK1763721SQ200510083310
公開日2006年4月26日 申請(qǐng)日期2005年7月12日 優(yōu)先權(quán)日2004年10月22日
發(fā)明者邁克爾·P.·瓦格萊內(nèi) 申請(qǐng)人:國際商業(yè)機(jī)器公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
积石山| 海阳市| 永春县| 定日县| 利津县| 七台河市| 邵阳市| 吉隆县| 大足县| 岫岩| 麻城市| 英吉沙县| 桐柏县| 兴化市| 若尔盖县| 闽清县| 修文县| 拉萨市| 长岭县| 荆州市| 建宁县| 大新县| 竹山县| 余姚市| 南漳县| 建德市| 涡阳县| 温泉县| 郸城县| 汽车| 云霄县| 云浮市| 都安| 柏乡县| 博野县| 玉屏| 濮阳县| 高清| 三台县| 德格县| 辽宁省|