專利名稱:計算機系統(tǒng)、現(xiàn)用系統(tǒng)計算機和待機系統(tǒng)計算機的制作方法
技術領域:
本發(fā)明涉及計算機系統(tǒng)中的數(shù)據(jù)備份技術,所述計算機系統(tǒng)復制數(shù)據(jù),特別是以異步方法來復制數(shù)據(jù)。
背景技術:
在包括多個計算機的計算機系統(tǒng)領域中,在抵抗故障方面,從不同角度推薦了多種技術。例如,專利文獻I中公開的計算機系統(tǒng)包括用于預測計算機中的故障的故障預測裝置,所述故障預測裝置正常停止在預測為產生故障的計算機上運行的所有服務,并在另一計算機上執(zhí)行這些服務。在另一計算機上重新執(zhí)行了所有這些服務之后,故障預測裝置·停止預測為產生故障的計算機。這種計算機系統(tǒng)被解釋為在預測為產生故障的計算機上發(fā)生故障之前轉移在該計算機上運行的服務,并正常停止預測為產生故障的計算機,而無需系統(tǒng)管理員的干預。此外,在專利文獻2公開的計算機備份系統(tǒng)中,業(yè)務計算機(現(xiàn)用系統(tǒng)計算機)包括異常檢測傳感器,用于檢測計算機中的出錯標記,并當檢測到該標記時經由網絡將應當備份的電子信息發(fā)送到備份計算機。當備份計算機從業(yè)務計算機接收到所述電子信息時,備份計算機將所述電子信息保存到包含在該備份計算機中的存儲介質中。這種備份計算機被解釋為在災害發(fā)生之前立即保存在業(yè)務計算機上創(chuàng)建的電子信息。此外,在專利文獻3公開的數(shù)據(jù)庫系統(tǒng)中,現(xiàn)用系統(tǒng)設備包括現(xiàn)用系統(tǒng)TM(交易管理器),用于處理交易;以及現(xiàn)用系統(tǒng)DBMS (數(shù)據(jù)庫管理系統(tǒng)),用于反映由交易而產生的更新數(shù)據(jù)。待機系統(tǒng)設備包括待機系統(tǒng)TM,其中從現(xiàn)用系統(tǒng)TM將更新數(shù)據(jù)通知給所述待機系統(tǒng)TM ;以及待機系統(tǒng)DBMS,將存儲的數(shù)據(jù)內容與現(xiàn)用系統(tǒng)DBMS同步?,F(xiàn)用系統(tǒng)TM將通過執(zhí)行交易而產生的更新數(shù)據(jù)通知給現(xiàn)用系統(tǒng)DBMS,并通過同步通信來通知待機系統(tǒng)?,F(xiàn)用系統(tǒng)DBMS將由現(xiàn)用系統(tǒng)TM通知的更新數(shù)據(jù)反映在由現(xiàn)用系統(tǒng)DBMS自身來管理的數(shù)據(jù)庫中,并通過異步通信將更新數(shù)據(jù)通知給待機系統(tǒng)DBMS。待機系統(tǒng)TM將通知的更新數(shù)據(jù)存儲到差分文件中,在預定的觸發(fā)點從所述差分文件讀取更新數(shù)據(jù),并通知待機系統(tǒng)DBM。待機系統(tǒng)DBMS將從現(xiàn)用系統(tǒng)DBMS或待機系統(tǒng)TM獲得的更新數(shù)據(jù)反映在由該待機系統(tǒng)DBMS管理的數(shù)據(jù)庫中。根據(jù)該數(shù)據(jù)庫系統(tǒng),在數(shù)據(jù)庫同步技術中,一個計算機組織和發(fā)送更新數(shù)據(jù)以及更新數(shù)據(jù)的控制信息,而另一計算機基于控制信息來匯編更新數(shù)據(jù),如果在組織更新數(shù)據(jù)的過程中一個計算機發(fā)生故障,就將更新數(shù)據(jù)返回到交易單元并反映在另一數(shù)據(jù)庫中,當使用這種數(shù)據(jù)庫同步技術時,已經說過可以解決一個計算機上的數(shù)據(jù)庫和另一計算機上的數(shù)據(jù)庫無法同步的問題,從而提高了數(shù)據(jù)庫同步的可靠性。注意,盡管在專利文獻I和專利文獻2公開的系統(tǒng)中,現(xiàn)用系統(tǒng)計算機中故障的發(fā)生可以被例如專利文獻4中公開的包含在系統(tǒng)中的異常檢測傳感器或故障預測裝置獲知,然而已知這種技術是通過接收災害通知信息來獲知故障發(fā)生的,所述災害通知信息通知了預測到會發(fā)生災害?,F(xiàn)有技術文獻專利文獻專利文獻I :日本待審專利申請公開No. 2004-334713專利文獻2 :日本待審專利申請公開No. 2004-326365專利文獻3 :日本待審專利申請公開No. 2008-310517專利文獻4 :日本待審專利申請公開No. 2007-09492
發(fā)明內容
本發(fā)明要解決的技術問題本文關注于為了避免故障而對數(shù)據(jù)的復制(下文中稱作數(shù)據(jù)復制)。為了避免故障,需要執(zhí)行前述的數(shù)據(jù)復制,以將通過在現(xiàn)用系統(tǒng)計算機上執(zhí)行業(yè)務應用而產生的新數(shù)據(jù)備份到待機系統(tǒng)計算機。作為在現(xiàn)用系統(tǒng)計算機和待機系統(tǒng)計算機之間的數(shù)據(jù)復制,同步復制和異步復制是兩種主要技術。同步復制是指現(xiàn)用系統(tǒng)計算機與待更新數(shù)據(jù)的產生同步,將數(shù)據(jù)發(fā)送至待機系統(tǒng)計算機,并使待機系統(tǒng)計算機保存該數(shù)據(jù)。異步復制是指在將所產生的待更新數(shù)據(jù)發(fā)送至待機系統(tǒng)計算機之前,將控制返回到執(zhí)行寫入的應用,然后將待更新數(shù)據(jù)發(fā)送至待機系統(tǒng)計算機,而不是在與待更新數(shù)據(jù)的產生同步之后將控制返回到執(zhí)行寫入的應用并將數(shù)據(jù)發(fā)送至待機系統(tǒng)計算機??梢耘R時累積所產生的待更新數(shù)據(jù),并在預定的觸發(fā)點將累積的數(shù)據(jù)集中發(fā)送至待機系統(tǒng)計算機。根據(jù)使用異步復制來進行數(shù)據(jù)復制的系統(tǒng),優(yōu)點在于可以減小現(xiàn)用系統(tǒng)計算機中數(shù)據(jù)復制的通信延遲。然而在發(fā)生故障時會存在以下問題尚未從現(xiàn)用系統(tǒng)計算機發(fā)送至待機系統(tǒng)計算機的數(shù)據(jù)丟失,當稍后通過將待機系統(tǒng)計算機切換成現(xiàn)用系統(tǒng)計算機來執(zhí)行業(yè)務操作時,需要針對丟失的數(shù)據(jù)執(zhí)行恢復過程,從而花費長時間來恢復操作。專利文獻I公開的技術停止在預測為產生故障的計算機上執(zhí)行的所有服務,并且在這些服務在另一計算機上被再次執(zhí)行之后將預測為產生故障的計算機停止。盡管專利文獻I中沒有關于數(shù)據(jù)復制的特定記載,假定使用異步復制來進行數(shù)據(jù)復制,那么就需要在預測到故障時的時間點處才對尚未發(fā)送至另一計算機的數(shù)據(jù)進行發(fā)送,以重新執(zhí)行在預測為產生故障的計算機上執(zhí)行的所有服務。然而當在完成上述過程之前就發(fā)生故障時,沒有辦法獲知預測為產生故障的計算機上的數(shù)據(jù)的發(fā)送程度,從而在另一計算機上恢復服務時產生問題。此外,專利文獻2公開的技術在異常檢測傳感器檢測到業(yè)務計算機中的出錯標記時,將業(yè)務計算機中的數(shù)據(jù)發(fā)送至備份計算機。該技術可能是基本的異步復制。當在從檢測業(yè)務計算機中的出錯標記到完成向備份計算機的數(shù)據(jù)發(fā)送的這段時間內發(fā)送故障時,該技術也具有與在說明根據(jù)對比文獻I的技術時提到的問題相同的問題。專利文獻3公開的技術通過使用同步復制和異步復制兩者來進行數(shù)據(jù)復制基本上解決了異步復制的上述問題。然而這產生的問題是限制了異步復制的優(yōu)點。
基于上述觀點而提出了本發(fā)明,本發(fā)明提供了一種復制技術,其在數(shù)據(jù)復制中采用異步復制,并且還在故障時保證了待機系統(tǒng)計算機上備份的數(shù)據(jù)的可靠性。解決問題的技術手段本發(fā)明一方面涉及一種現(xiàn)用系統(tǒng)計算機,在所述現(xiàn)用系統(tǒng)計算機上執(zhí)行業(yè)務應用,在現(xiàn)用系統(tǒng)計算機和待機系統(tǒng)計算機之間對通過執(zhí)行業(yè)務應用而產生的數(shù)據(jù)執(zhí)行異步復制。現(xiàn)用系統(tǒng)計算機包括存儲設備,用于業(yè)務應用向所述存儲設備中寫入數(shù)據(jù);發(fā)送隊列、接收單元、控制單元和發(fā)送單元。發(fā)送隊列在通過業(yè)務應用寫入存儲設備的數(shù)據(jù)之中,對尚未發(fā)送至待機系統(tǒng)計算機的數(shù)據(jù)進行排隊。接收裝置,接收用于給出故障預測的預先通知?!ぴ诮邮昭b置接收到預先通知時,控制裝置停止業(yè)務應用的執(zhí)行。當接收裝置接收到預先通知時,發(fā)送裝置依次將發(fā)送開始信息、在發(fā)送隊列中排隊的數(shù)據(jù)以及發(fā)送完成信息發(fā)送至待機系統(tǒng)計算機,其中所述發(fā)送開始信息指示了數(shù)據(jù)發(fā)送的開始以避免故障,所述發(fā)送完成信息指示了數(shù)據(jù)發(fā)送的完成。本發(fā)明的另一方面涉及一種待機系統(tǒng)計算機,在所述待機系統(tǒng)計算機上利用執(zhí)行業(yè)務應用的現(xiàn)用系統(tǒng)計算機執(zhí)行對數(shù)據(jù)的異步復制,所述數(shù)據(jù)是通過在現(xiàn)用系統(tǒng)計算機上執(zhí)行業(yè)務應用而產生的。待機系統(tǒng)計算機包括存儲設備和備份裝置,所述備份裝置將來自現(xiàn)用系統(tǒng)計算機的數(shù)據(jù)與異步復制一起寫入存儲設備。備份裝置在接收到發(fā)送開始信息時,將在發(fā)送開始信息之后接收到的數(shù)據(jù)寫入存儲設備并產生和保持第一可靠性保證信息,所述第一可靠性保證信息指示在發(fā)送開始信息之前接收到的數(shù)據(jù)是可靠數(shù)據(jù)。所述發(fā)送開始信息是指示以下內容的信息當現(xiàn)用系統(tǒng)計算機接收到用于給出故障預測的預先通知時為了避免故障而執(zhí)行的“數(shù)據(jù)發(fā)送”的開始;以及意味著對尚未發(fā)送至待機系統(tǒng)計算機的數(shù)據(jù)進行發(fā)送的“數(shù)據(jù)發(fā)送”的開始。此外,備份單元在接收到在完成數(shù)據(jù)發(fā)送之后發(fā)送的發(fā)送完成信息時,產生和保持第二可靠性保證信息,所述第二可靠性保證信息指示在發(fā)送完成信息之前接收到的數(shù)據(jù)是可靠數(shù)據(jù)。注意,代替根據(jù)上述方面的現(xiàn)用系統(tǒng)計算機或待機系統(tǒng)計算機的方法、設備或系統(tǒng);使計算機執(zhí)行現(xiàn)用系統(tǒng)計算機或待機系統(tǒng)計算機的操作的程序;記錄所述程序的計算機可讀介質;包括現(xiàn)用系統(tǒng)計算機和待機系統(tǒng)計算機的計算機系統(tǒng)等等也可以作為本發(fā)明的方面。本發(fā)明的有益效果根據(jù)本發(fā)明的技術,可以在數(shù)據(jù)復制中采用異步復制,還在故障時保證了備份在待機系統(tǒng)計算機上的數(shù)據(jù)的可靠性。
圖I是示出了用于說明根據(jù)本發(fā)明的技術原理的計算機系統(tǒng)的圖;圖2是說明了圖I所示計算機系統(tǒng)中諸如發(fā)送開始信息等的含義的圖;圖3是示出了根據(jù)本發(fā)明示例實施例的計算機系統(tǒng)的圖4是示出了圖3所示計算機系統(tǒng)中每個計算機的配置的圖;圖5是說明了圖4所示計算機的發(fā)送隊列中排隊的寫入信息的寫入時間與臨時保持時間信息之間的關系的圖;圖6是說明了發(fā)送隊列中排隊的附加時間信息以及寫入數(shù)據(jù)的圖;圖7是說明了圖3所示計算機系統(tǒng)中的同步開始分組的含義的圖;圖8是示出了圖3所示計算機系統(tǒng)中現(xiàn)用系統(tǒng)計算機的處理的流程圖;圖9是示出了圖3所示計算機系統(tǒng)中待機系統(tǒng)計算機的處理的流程圖;以及圖10是說明了圖3所示計算機系統(tǒng)中在故障之后的切換的圖。
具體實施例方式為了清楚地進行說明,對以下說明進行了適當?shù)氖÷院秃喕?。此外,圖中以執(zhí)行各種處理的功能塊的形式示出的每個組件可以作為硬件的CPU、存儲器和其他電路來配置,并且可以由作為軟件加載到存儲器中的程序來實現(xiàn)。因此,本領域技術人員將理解,這些功能塊可以僅由硬件、軟件來實現(xiàn)或以二者組合的形式來實現(xiàn),并且不限于這些形式中的任何一種。此外,例如可以通過執(zhí)行從存儲設備讀出的程序來實現(xiàn)以下圖中所示的每個設備的配置。此外,使用任何類型的非暫時性計算機可讀介質將這些程序存儲并提供至計算機。非暫時性計算機可讀介質包括任何類型的實體存儲介質。非暫時性計算機可讀介質的示例包括磁存儲介質(如,軟盤、磁帶、硬盤驅動器等等)、光磁存儲介質(磁光盤)、CD-ROM (光盤只讀存儲器)以及半導體存儲器(如,掩模R0M、PR0M(可編程ROM)、EPR0M(可擦PROM)、閃速ROM、RAM(隨機存取存儲器)等等)??梢允褂萌魏晤愋偷臅簳r性計算機可讀介質將程序提供給計算機。暫時性計算機可讀介質的示例包括電信號、光信號和電磁波。暫時性計算機可讀介質可以經由有線通信線路(例如,電線和光纖)或無線通信線路將程序提供給計算機。在說明本發(fā)明的特定示例實施例之前,首先參考圖I所示的計算機系統(tǒng)100來說明根據(jù)本發(fā)明的技術原理。如圖I所示,計算機系統(tǒng)100包括通信連接的現(xiàn)用系統(tǒng)計算機100和待機系統(tǒng)計算機130?,F(xiàn)用系統(tǒng)計算機100是執(zhí)行業(yè)務應用的計算機,利用待機系統(tǒng)130對通過執(zhí)行現(xiàn)用系統(tǒng)計算機110中的業(yè)務應用而產生的數(shù)據(jù)進行異步復制。如上所述,數(shù)據(jù)的異步復制是指與向待機系統(tǒng)計算機發(fā)送數(shù)據(jù)的過程異步地向業(yè)務應用返回寫入控制,并將數(shù)據(jù)發(fā)送至待機系統(tǒng)計算機,從而用于備份,而不是在產生數(shù)據(jù)時向待機系統(tǒng)計算機發(fā)送數(shù)據(jù)并在發(fā)送完成之后將控制返回到業(yè)務應用??梢耘R時累積所產生的數(shù)據(jù),并且可以在預定觸發(fā)點(例如,以預定的時間間隔)或者當現(xiàn)用計算機的處理負載較小時將累積的數(shù)據(jù)集中發(fā)送至待機系統(tǒng)計算機。此外,待機系統(tǒng)計算機可以每當從現(xiàn)用系統(tǒng)計算機接收到數(shù)據(jù)就向包含在該待機系統(tǒng)計算機中的存儲設備進行寫入,或者可以將數(shù)據(jù)累積在差分文件中并在預定觸發(fā)點從所述差分文件中集中讀取所述數(shù)據(jù)以寫入所述存儲設備。在計算機系統(tǒng)100中,在現(xiàn)用系統(tǒng)計算機110和待機系統(tǒng)計算機130之間執(zhí)行的數(shù)據(jù)復制可以是任何常規(guī)已知的異步復制技術。因此,省略了異步復制的細節(jié)以及對異步復制所需的功能塊的說明,其中說明根據(jù)本發(fā)明的技術所需的點除外。如圖I所示,計算機系統(tǒng)100包括存儲設備112、應用執(zhí)行單元114、主處理單元115、發(fā)送單元116、發(fā)送隊列118、接收單元120以及控制單元122。應用執(zhí)行單元114對業(yè)務應用的執(zhí)行和停止加以控制。主處理單元115將通過執(zhí)行業(yè)務應用而產生的寫入數(shù)據(jù)寫入存儲設備112,并將與寫入到存儲設備112的數(shù)據(jù)相同的數(shù)據(jù)累積在發(fā)送隊列118中。存儲設備112是諸如硬盤之類的存儲介質,其存儲由主處理單元115寫入的數(shù)據(jù)。
發(fā)送單元116將與主處理單元115寫入存儲設備112的數(shù)據(jù)相同的數(shù)據(jù)發(fā)送至待機系統(tǒng)計算機130,由發(fā)送單元116執(zhí)行的數(shù)據(jù)發(fā)送與由主處理單元115向存儲設備112的寫入同步。具體地,發(fā)送單元116包括發(fā)送隊列118,將與主處理單元115寫入到存儲設備112的數(shù)據(jù)相同的數(shù)據(jù)累積在發(fā)送隊列118中,并在可發(fā)送時順序地發(fā)送至待機系統(tǒng)計算機130。取代在可發(fā)送時順序發(fā)送的方法,可以在預定的觸發(fā)點集中向待機系統(tǒng)計算機130發(fā)送。接收單元120用于接收給出故障預測的預先通知,并相應地在接收到預先通知時通知控制單元122?!邦A先通知”用于預測現(xiàn)用系統(tǒng)計算機110中的故障,并且可以是預測在現(xiàn)用系統(tǒng)計算機110中發(fā)生故障的任何信息。例如,“預先通知”可以是來自故障預測組織的信息或來自裝置的信息,所述故障預測組織預測在現(xiàn)用系統(tǒng)計算機110的安裝位置處的包括地震在內的災害,所述裝置例如使用現(xiàn)用系統(tǒng)計算機110的存儲器和CPU的監(jiān)控狀態(tài)結果來預測故障。當接收單元120接收到預先通知時,控制單元122對應用執(zhí)行單元114和主處理單元115執(zhí)行用于避免故障的控制。具體地,當從接收單元120接收到預先通知時,控制單元122使應用執(zhí)行單元114停止執(zhí)行業(yè)務應用。此外,控制主處理單元115,使得按照發(fā)送開始信息、數(shù)據(jù)發(fā)送和發(fā)送完成信息這一順序來執(zhí)行向待機系統(tǒng)計算機130的發(fā)送。上述“數(shù)據(jù)發(fā)送”指的是順序地將存儲到發(fā)送隊列118中的數(shù)據(jù)發(fā)送至待機系統(tǒng)計算機130以避免故障。此外,“發(fā)送開始信息”和“發(fā)送完成信息”是分別對上述數(shù)據(jù)發(fā)送的開始和結束加以指示的信息。待機系統(tǒng)計算機130包括存儲設備132和備份單元140。存儲設備132是諸如硬盤之類的記錄介質,所述記錄介質存儲由備份單元140寫入的數(shù)據(jù)。備份單元140通過數(shù)據(jù)的異步復制將來自現(xiàn)用系統(tǒng)計算機HO的數(shù)據(jù)寫入存儲設備132,在從現(xiàn)用系統(tǒng)計算機110接收到前述發(fā)送開始信息時,將在發(fā)送開始信息之后接收到的數(shù)據(jù)寫入存儲設備132,并且還產生和保持第一可靠性保證信息,所述第一可靠性保證信息指示在發(fā)送開始信息之前接收到的數(shù)據(jù)是可靠數(shù)據(jù)。隨后,當從現(xiàn)用系統(tǒng)計算機110接收到發(fā)送完成信息時,產生和保持第二可靠性保證信息,所述第二可靠性保證信息指示在發(fā)送完成信息之前接收到的數(shù)據(jù)是可靠數(shù)據(jù)。前述發(fā)送開始信息和發(fā)送結束信息可以是任何格式的,只要可以由現(xiàn)用系統(tǒng)計算機110通知“數(shù)據(jù)傳輸”的開始和完成以避免故障。例如,發(fā)送開始信息可以是同步開始分組,所述同步開始分組指示前述“數(shù)據(jù)發(fā)送”的開始,或者在前述“數(shù)據(jù)發(fā)送”的發(fā)送隊列中累積的數(shù)據(jù)的首隊列的時間信息;發(fā)送完成信息可以是同步完成分組,所述同步完成分組指示前述“數(shù)據(jù)發(fā)送”的完成,以及在前述“數(shù)據(jù)發(fā)送”的發(fā)送隊列中累積的數(shù)據(jù)的上一隊列的時間信息。第一可靠性保證信息可以是任何格式的,只要該第一可靠性保證信息能夠指示在發(fā)送開始信息之前接收到的數(shù)據(jù)是可靠數(shù)據(jù)。例如,第一可靠性保證信息可以是對發(fā)送開始信息之前最后一次接收到的數(shù)據(jù)加以指示的信息。即,在計算機系統(tǒng)100中,在現(xiàn)用系統(tǒng)計算機110的接收單元120接收到預先通知之前,在現(xiàn)用系統(tǒng)計算機110和待機系統(tǒng)計算機130之間對現(xiàn)用系統(tǒng)計算機110上執(zhí)行的業(yè)務應用所產生的數(shù)據(jù)進行異步復制,并且在現(xiàn)用系統(tǒng)計算機110的發(fā)送隊列118中累積等待發(fā)送至待機系統(tǒng)計算機130的數(shù)據(jù)。在可發(fā)送時將發(fā)送隊列118中累積的數(shù)據(jù)順序地發(fā)送至待機系統(tǒng)計算機130。當現(xiàn)用系統(tǒng)計算機110的接收單元120接收到預先通知時,啟動“數(shù)據(jù)發(fā)送”以避免故障,所述“數(shù)據(jù)發(fā)送”將發(fā)送隊列118中累積的數(shù)據(jù)發(fā)送至待機系統(tǒng)計算機130。在該數(shù)據(jù)發(fā)送開始時和完成時分別發(fā)送開始信息和發(fā)送完成信息。此外,在 待機系統(tǒng)計算機130中,當接收到發(fā)送開始信息時,保持第一可靠性保證信息,所述第一可靠性保證信息指示在發(fā)送開始信息之前接收到的數(shù)據(jù)是可靠數(shù)據(jù);當接收到發(fā)送完成信息時,保持第二可靠性保證信息,所述第二可靠性保證信息指示在發(fā)送完成信息之前接收到的數(shù)據(jù)是可靠數(shù)據(jù)。參考圖2來說明發(fā)送開始信息、發(fā)送完成信息、第一可靠性保證信息和第二可靠性保證信息的含義。在圖2中,對于發(fā)送開始信息和發(fā)送完成信息,“〇”表示“被待機系統(tǒng)計算機130接收到”,“ X ”表示“沒有被待機系統(tǒng)計算機130接收到”。此外,對于第一可靠性保證信息和第二可靠性保證信息,“ O ”表示“被保持到待機系統(tǒng)計算機130”,“ X ”表示“沒有被保持到待機系統(tǒng)計算機130”。情況I如圖2所示,當待機系統(tǒng)計算機130尚未接收到來自現(xiàn)用系統(tǒng)計算機110的發(fā)送開始信息時(當然,也尚未接收到發(fā)送完成信息),第一可靠性保證信息和第二可靠性保證信息也沒有被保持到待機系統(tǒng)計算機130中。這種情況是當沒有接收到用于給出現(xiàn)用系統(tǒng)計算機110中的故障預測的預先通知時,例如當執(zhí)行正常異步復制時的情況。情況2同時,當待機系統(tǒng)計算機130已經接收到來自現(xiàn)用系統(tǒng)計算機110的發(fā)送開始信息但沒有接收到發(fā)送完成信息時,第一可靠性保證信息被保持到待機系統(tǒng)計算機130中而第二可靠性保證信息沒有被保持到待機系統(tǒng)計算機130中。這種情況是當現(xiàn)用系統(tǒng)計算機110已經接收到預先通知并且執(zhí)行了將尚未發(fā)送的數(shù)據(jù)發(fā)送至待機系統(tǒng)計算機130的數(shù)據(jù)發(fā)送(下文中可以稱作“數(shù)據(jù)同步”)但尚未完整執(zhí)行數(shù)據(jù)同步時,例如,當數(shù)據(jù)同步期間發(fā)生故障時的情況。情況3此外,當待機系統(tǒng)計算機130已經從現(xiàn)用系統(tǒng)計算機110接收到發(fā)送開始信息和發(fā)送完成信息兩者時,第一可靠性保證信息和第二可靠性保證信息均被保持到待機系統(tǒng)計算機130。這種情況是在現(xiàn)用系統(tǒng)計算機110已經接收到預先通知之后執(zhí)行了數(shù)據(jù)同步并且完整地執(zhí)行了該數(shù)據(jù)同步的情況。
因此,在將待機系統(tǒng)計算機130切換到現(xiàn)用系統(tǒng)計算機以執(zhí)行業(yè)務應用時,可以確認在待機系統(tǒng)計算機130的存儲設備132上備份的數(shù)據(jù)的可靠性,并采取措施,例如從哪里開始執(zhí)行業(yè)務應用。例如,在保持了 “第一可靠性保證信息”而沒有保持“第二可靠性保證信息”的前述情況2中,可以看出在發(fā)送開始信息之前接收到的數(shù)據(jù)是可靠數(shù)據(jù),可以從可靠數(shù)據(jù)之中最后一次接收到的數(shù)據(jù)開始來執(zhí)行業(yè)務應用。此外,在保持了 “第一可靠性保證信息”和“第二可靠性保證信息”前述情況3中,可以看出在發(fā)送完成信息之前接收到的數(shù)據(jù)是可靠數(shù)據(jù),并且可以從所述可靠數(shù)據(jù)之中最后一次接收到的數(shù)據(jù)開始來執(zhí)行業(yè)務應用。計算機系統(tǒng)100的這種配置使得可以在現(xiàn)用系統(tǒng)計算機110和待機系統(tǒng)計算機130進行數(shù)據(jù)的異步復制,直到現(xiàn)用系統(tǒng)計算機110接收到預先通知。當現(xiàn)用系統(tǒng)計算機110接收到預先通知時,在現(xiàn)用系統(tǒng)計算機110和待機系統(tǒng)計算機130之間執(zhí)行數(shù)據(jù)同步,由待機系統(tǒng)計算機130產生數(shù)據(jù)同步是否完成(即,數(shù)據(jù)可靠程度)的信息(第一可靠性 保證信息和第二可靠性保證信息)并將該信息保持到待機系統(tǒng)計算機130。因此,在數(shù)據(jù)復制中采用異步復制的同時,可以在故障時保證待機系統(tǒng)計算機上備份的數(shù)據(jù)的可靠性。此外,在計算機系統(tǒng)100中,現(xiàn)用系統(tǒng)計算機110可以通過上述數(shù)據(jù)同步來減小發(fā)送至接收單元120的數(shù)據(jù)量,而通過停止正在執(zhí)行的業(yè)務應用來提高完成數(shù)據(jù)同步的概率。接下來說明采用上述原理的示例實施例。圖3示出了根據(jù)北方那么示例實施例的計算機系統(tǒng)200。該計算機系統(tǒng)200包括多個計算機(在圖中僅以兩個計算機210和220為例)和故障預測服務設備240。這些計算機和故障預測設備240經由諸如LAN和WAN之類的網絡230相連。該示例實施例的計算機系統(tǒng)200中包含的這多個計算機具有相似的配置。如圖3所示,計算機210安裝有操作系統(tǒng)(下文中稱作OS) 214、復制軟件216和業(yè)務應用(下文中稱作AP)218,并且包括用于從中讀取軟件數(shù)據(jù)和向其寫入軟件數(shù)據(jù)的第一存儲設備212以及與第一存儲設備212不同的第二存儲設備213。類似地,計算機220安裝有OS 224、復制軟件226和AP 228,并且包括用于從中讀取軟件數(shù)據(jù)和向其寫入軟件數(shù)據(jù)的第一存儲設備222以及與第一存儲設備222不同的第二存儲設備223。在圖3所示示例中,安裝在計算機210上的AP 218和安裝在220上的AP 228是相同的業(yè)務應用,由實線框表示的AP 218正在執(zhí)行,而由虛線框表示的AP 228被停止。即,在這種情況下,計算機210是現(xiàn)用系統(tǒng)計算機,而計算機220是待機系統(tǒng)計算機。此外,通過異步復制,將通過執(zhí)行AP 218而產生的數(shù)據(jù)發(fā)送至計算機220并備份在計算機220上。故障預測服務設備240經由控制信道連接單元230向計算機發(fā)送用于給出故障預測的預先通知。在該示例實施例中,例如,故障預測服務設備240用于給出可能在計算機中產生故障的諸如地震之類的自然災害的預測,并且被安裝在預測災害的組織等中。在計算機系統(tǒng)200中,現(xiàn)用系統(tǒng)計算機和待機系統(tǒng)計算機通常執(zhí)行異步數(shù)據(jù)布置。該異步復制是由安裝在現(xiàn)用系統(tǒng)計算機和待機系統(tǒng)計算機上的復制軟件來執(zhí)行的。當接收到預先通知時,現(xiàn)用系統(tǒng)計算機停止正在執(zhí)行的業(yè)務應用,并開始數(shù)據(jù)同步,待機系統(tǒng)計算機將數(shù)據(jù)同步過程中從現(xiàn)用系統(tǒng)計算機發(fā)送的數(shù)據(jù)備份到該待機系統(tǒng)計算機自己的存儲設備中。圖4示出了計算機系統(tǒng)200中每個計算機的特定配置。注意,圖4僅示出了與前述“數(shù)據(jù)同步”相關的部分,而省略了其他部分的描述和說明。此外,在該示例實施例中,由于每個計算機具有相同的配置,所以以計算機210為代表來進行說明。如圖4所示,計算機210包括第一存儲設備212、第二存儲設備213、收發(fā)機單元300、控制單元302、主處理單元310、I/O請求隊列312、發(fā)送隊列314、解壓縮單元316、壓縮單元318以及差分存儲單元320。這些功能塊是由包含在計算機210中的硬件和安裝在計算機210中的軟件協(xié)同實現(xiàn)的。計算機210可以是現(xiàn)用系統(tǒng)計算機和待機系統(tǒng)計算機中的任何一個。在圖4中,每個功能塊之間的實現(xiàn)指示當計算機210是現(xiàn)用系統(tǒng)計算機時的數(shù)據(jù)流和信號,虛線指示當計算機210是待機系統(tǒng)計算機時的數(shù)據(jù)流和信號。主處理單元310包括用于執(zhí)行業(yè)務應用的功能和備份功能。當計算機210是現(xiàn)用 系統(tǒng)計算機時,執(zhí)行用于執(zhí)行業(yè)務應用的功能;當計算機210是待機系統(tǒng)計算機時,執(zhí)行備份功能。即,當計算機210是現(xiàn)用系統(tǒng)計算機時,主處理單元310可以作為應用執(zhí)行單元來操作;當計算機210是待機系統(tǒng)計算機時,主處理單元310可以作為備份單元來操作。下文中,說明計算機210中每個功能塊的操作,將計算機210是現(xiàn)用系統(tǒng)計算機的情況和計算機210是待機系統(tǒng)計算機的情況分開。<計算機210是現(xiàn)用系統(tǒng)計算機的情況>在這種情況下,主處理單元310在I/O請求隊列312和發(fā)送隊列314中對通過執(zhí)行業(yè)務應用而產生的寫入數(shù)據(jù)進行排隊。當在發(fā)送隊列314中進行排隊時,在對臨時保持時間信息(稍后將作為附加時間信息來描述該臨時保持時間信息)與寫入數(shù)據(jù)一起進行排隊的同時,以該寫入發(fā)生時間(下文中稱作寫入時間)來更新臨時保持時間信息。參考圖5來說明數(shù)據(jù)寫入時間和臨時保持時間信息之間的關系。作為示例,按時間順序產生數(shù)據(jù)O、數(shù)據(jù)I和數(shù)據(jù)2的寫入,并假定數(shù)據(jù)的寫入時間分別是時間O、時間I、時間2和時間3。主處理單元310保持最后一次寫入發(fā)生時間作為臨時保持時間信息。如圖5所示,在時間O處產生數(shù)據(jù)O的寫入,將時間O保存為臨時保持時間數(shù)據(jù)。接下來,由于在時間I處產生數(shù)據(jù)I的寫入,以時間I來更新臨時保持時間數(shù)據(jù)。之后,當寫入數(shù)據(jù)2時,以時間2來更新臨時保持時間信息,當寫入數(shù)據(jù)3時,以時間3來更新臨時保持時間信息。當主處理單元115在發(fā)送隊列314中對寫入數(shù)據(jù)進行排隊時,將更新之前的臨時保持時間信息與要排隊的數(shù)據(jù)相關聯(lián)。參考圖6來說明這一點。正在保持的臨時保持時間信息是數(shù)據(jù)O的寫入時間(時間O),所述數(shù)據(jù)O的寫入時間緊接在數(shù)據(jù)I的寫入時間(時間I)之前。因此,在時間1,將數(shù)據(jù)I與要作為時間O的附加時間信息一起在發(fā)送隊列314中排隊。相應地,以時間I來更新臨時保持時間信息。類似地,由于臨時保持時間信息是緊接在數(shù)據(jù)2的寫入時間(時間2)之前的時間1,所以在時間2,將數(shù)據(jù)2與要作為時間I的附加時間信息一起在發(fā)送隊列314中排隊。相應地,以時間2來更新臨時保持時間信息。此外,由于臨時保持時間信息是緊接在數(shù)據(jù)3的寫入時間(時間3)之前的時間2,所以在時間3,將數(shù)據(jù)3與要作為時間2的附加時間信息一起在發(fā)送隊列314中排隊。相應地,以時間3來更新臨時保持時間信息。S卩,在該示例實施例中,寫入數(shù)據(jù)和前一寫入數(shù)據(jù)的寫入時間相關聯(lián),并且在發(fā)送隊列314中排隊。I/O請求隊列312將排隊的數(shù)據(jù)順序地出列到第一存儲設備212。第一存儲設備212存儲來自I/O請求隊列312的數(shù)據(jù)。此外,發(fā)送隊列314將排隊的寫入數(shù)據(jù)順序地出列到壓縮單元318中。壓縮單元318壓縮來自發(fā)送隊列314的數(shù)據(jù)并將數(shù)據(jù)輸出到收發(fā)機單元300。收發(fā)機單元300經由網絡230將來自壓縮單元318的數(shù)據(jù)(下文中稱作壓縮數(shù)據(jù))順序地輸出到待機系統(tǒng)計算機(在這種情況下是計算機220)。
根據(jù)異步復制規(guī)則對數(shù)據(jù)執(zhí)行每個上述過程,在此省略了詳細說明。注意,在無法與待機系統(tǒng)計算機通信的情況下,主處理單元310不在發(fā)送隊列314中對數(shù)據(jù)進行排隊,而是將數(shù)據(jù)存儲到差分存儲單元320。伺候,當可以與待機系統(tǒng)計算機通信時,將存儲到差分存儲單元320的數(shù)據(jù)在發(fā)送隊列314中進行排隊。如上所述,在該示例實施例中,經由網絡230來發(fā)送來自故障預測服務設備240的預先通知。即,計算機210的收發(fā)機單元300還用作接收該預先通知的接收單元。當接收到預先通知時,收發(fā)機單元300相應地通知控制單元302。在通知了控制單元302從控制單元302接收到預先通知時,控制單元302向主處理單元310輸出數(shù)據(jù)同步的開始指令,并與數(shù)據(jù)同步的開始指令異步地輸出業(yè)務應用的停止指令。輸出數(shù)據(jù)同步的開始指令而不等待業(yè)務應用停止使得可以即刻開始數(shù)據(jù)同步過程并即刻將第一可靠性保證信息通知給待機系統(tǒng)。當接收到業(yè)務應用的停止指令時,主處理單元310停止業(yè)務應用。那么,業(yè)務應用不產生新的數(shù)據(jù)。當接收到數(shù)據(jù)同步的開始指令時,主處理單元310如下操作。首先,主處理單元310中斷在發(fā)送隊列314中累積的發(fā)送數(shù)據(jù),并使收發(fā)機單元300發(fā)送對數(shù)據(jù)同步的開始加以指示的“同步開始分組”。在發(fā)送隊列314中累積的數(shù)據(jù)的首隊列的附加時間信息包含在該同步開始分組中。該附加時間信息是排隊到發(fā)送隊列314首部的寫入數(shù)據(jù)的時間信息,即,前一寫入數(shù)據(jù)的寫入時間。然后,控制發(fā)送隊列314、壓縮單元318和收發(fā)機單元300,使得在前述“同步數(shù)據(jù)分組”之后順序地發(fā)送發(fā)送隊列314中累積的寫入數(shù)據(jù)。當發(fā)送隊列314中累積的所有數(shù)據(jù)都被壓縮和發(fā)送之后,主處理單元310使收發(fā)機單元300發(fā)送對數(shù)據(jù)同步的完成加以指示的“同步完成分組”。該同步完成分組是當前的臨時保持時間信息,即,發(fā)送隊列314中累積的數(shù)據(jù)的尾隊列的寫入時間。換言之,當在計算機210是現(xiàn)用系統(tǒng)計算機的情況下接收到給出故障預測(在該示例實施例中是災害預測)的預先通知時,在計算機210中停止正在執(zhí)行的業(yè)務應用,并且從計算機210發(fā)送同步開始分組、在發(fā)送隊列314中排隊的數(shù)據(jù)的壓縮數(shù)據(jù)以及同步完成分組。<計算機210是待機系統(tǒng)計算機的情況>在這種情況下,收發(fā)機單元300將來自現(xiàn)用系統(tǒng)計算機的數(shù)據(jù)與數(shù)據(jù)的異步復制一起接收。該數(shù)據(jù)是在現(xiàn)用系統(tǒng)計算機中的執(zhí)行期間產生的數(shù)據(jù)的壓縮數(shù)據(jù)。主處理單元310使解壓縮單元316對收發(fā)機單元300接收到的壓縮數(shù)據(jù)進行解壓縮。解壓縮單元316將解壓縮的數(shù)據(jù)輸出至I/O請求隊列312。I/O請求隊列312將來自解壓縮單元316的數(shù)據(jù)順序地出列到第一存儲設備212。第一存儲設備212存儲來自I/O請求隊列312的數(shù)據(jù)。前述過程是在執(zhí)行數(shù)據(jù)的異步時由待機系統(tǒng)計算機側執(zhí)行的過程,在此省略了詳細說明。當收發(fā)機單元300接收到“同步開始分組”時,主處理單元310將同步開始分組中包含的附加時間信息作為第一可靠性保證信息輸出至I/o請求隊列312。此外,控制I/O請求隊列312將該附加時間信息出列到第二存儲設備213。
此外,主處理單元310使解壓縮單元316對收發(fā)機單元300在“同步開始分組之后”接收到的每個數(shù)據(jù)順序地解壓縮,并將該數(shù)據(jù)輸出至I/o請求隊列312。主處理單元310控制I/O請求隊列312將該數(shù)據(jù)出列到第一存儲設備212。此外,當收發(fā)機單元300接收到“同步完成分組”時,主處理單元310將同步完成分組中包含的臨時保持時間信息作為第二可靠性保證信息輸出至I/O請求隊列312。此外,控制I/O請求隊列312將該臨時保持時間信息出列到第二存儲設備213。參考圖7來說明該示例實施例中同步開始分組、同步完成分組、第一可靠性保證信息和第二可靠性保證信息的含義。與圖2中的方式相類似,在圖7中,對于同步開始分組和同步完成分組,“ O ”表示“被待機系統(tǒng)計算機接收到”,“ X ”表示“沒有被待機系統(tǒng)計算機接收到”。此外,對于第一可靠性保證信息(在此是包含在同步開始分組中的附加時間信息)和第二可靠性保證信息(在此是包含在同步完成分組中的臨時保持時間信息),“〇”表示“被記錄在待機系統(tǒng)計算機的存儲設備上”,“ X ”表示“沒有被記錄在待機系統(tǒng)計算機的存儲設備上”。情況I如圖7所示,當待機系統(tǒng)計算機尚未接收到來自現(xiàn)用系統(tǒng)計算機的同步開始分組時(當然,也尚未接收到同步完成分組),不將包含在同步開始分組中的附加時間信息和包含在同步完成分組中的臨時保持時間信息記錄在待機系統(tǒng)計算機的第二存儲設備上。這種情況是現(xiàn)用系統(tǒng)計算機尚未接收到給出故障預測的預先通知時,例如當執(zhí)行正常異步復制時的情況。情況2另一方面,當待機系統(tǒng)計算機已經接收到同步開始分組但沒有接收到同步完成分組時,將包含在同步開始分組中的附加時間信息記錄在待機系統(tǒng)計算機的第二存儲設備上,而將不包含在同步完成分組中的臨時保持時間信息記錄在待機系統(tǒng)計算機的第二存儲設備上。這種情況是當現(xiàn)用系統(tǒng)計算機已經接收到預先通知并且執(zhí)行了將尚未發(fā)送的數(shù)據(jù)發(fā)送至待機系統(tǒng)計算機的數(shù)據(jù)發(fā)送(下文中可以稱作“數(shù)據(jù)同步”)但尚未完整執(zhí)行數(shù)據(jù)同步時,例如,當數(shù)據(jù)同步期間發(fā)生故障時的情況。情況3此外,當待機系統(tǒng)計算機已經從現(xiàn)用系統(tǒng)計算機接收到同步開始分組和同步完成分組兩者時,將包含在同步開始分組中的附加時間信息和包含在同步完成分組中的臨時保持時間信息均記錄在待機系統(tǒng)計算機的第二存儲設備上。這種情況是在現(xiàn)用系統(tǒng)計算機已經接收到預先通知之后執(zhí)行了數(shù)據(jù)同步并且完整地執(zhí)行了該數(shù)據(jù)同步的情況。圖8是示出了計算機系統(tǒng)200中的現(xiàn)用系統(tǒng)計算機的處理流程的流程圖。如圖8所示,現(xiàn)用系統(tǒng)計算機執(zhí)行業(yè)務應用,并且利用待機系統(tǒng)計算機對通過執(zhí)行業(yè)務應用而產生的數(shù)據(jù)執(zhí)行異步復制,直到接收到預先通知(S100 :否;S102)。步驟S102中數(shù)據(jù)的異步復制具體是以下過程與向待機系統(tǒng)計算機發(fā)送數(shù)據(jù)的過程異步地將寫入控制返回給業(yè)務應用,壓縮發(fā)送隊列中累積的數(shù)據(jù),并將數(shù)據(jù)發(fā)送至待機系統(tǒng)計算機。在現(xiàn)用系統(tǒng)計算機中,當接收到預先通知時,控制單元發(fā)起業(yè)務應用停止指令以及數(shù)據(jù)同步開始指令(步驟Slio和S120)。當接收到業(yè)務應用停止指令時,現(xiàn)用系統(tǒng)計算機的主處理單元停止正在執(zhí)行的業(yè)務應用(S112)。 此外,當接收到數(shù)據(jù)同步開始指令時,現(xiàn)用系統(tǒng)計算機的主處理單元使收發(fā)機單元向待機系統(tǒng)計算機發(fā)送同步開始分組,所述同步開始分組包含在發(fā)送隊列中累積的數(shù)據(jù)的首隊列的附加時間信息;然后壓縮并發(fā)送發(fā)送隊列中累積的數(shù)據(jù),直到發(fā)送隊列為空(S124 ;S126 :否;以及在S124之后)當發(fā)送隊列中所有數(shù)據(jù)的壓縮和發(fā)送都完成之后,主處理單元使發(fā)送單元將包括臨時保持時間信息的同步完成分組發(fā)送至待機系統(tǒng)計算機。圖9是示出了計算機系統(tǒng)200中待機系統(tǒng)計算機中的處理流程的流程圖。如圖9所示,待機系統(tǒng)計算機備份來自現(xiàn)用系統(tǒng)計算機的數(shù)據(jù)(壓縮數(shù)據(jù)),直到接收到來自現(xiàn)用系統(tǒng)計算機的同步開始分組(S150 :否;以及S152)。步驟S152中的備份具體為解壓縮來自現(xiàn)用系統(tǒng)計算機的壓縮數(shù)據(jù),在I/O請求隊列中進行排隊,以及從I/O請求隊列向第一存儲設備出列)。當接收到同步開始分組時,待機系統(tǒng)計算機的主處理單元經由I/O請求隊列將同步開始分組中包含的附加時間信息作為第一可靠性保證信息記錄在第二存儲設備上,備份來自現(xiàn)用系統(tǒng)計算機的壓縮數(shù)據(jù),并將壓縮數(shù)據(jù)寫入第一存儲設備,直到接收到同步完成分組(S150 :是;S160 :否;以及在S164之后)。當接收到同步完成分組時,待機系統(tǒng)計算機的主處理單元經由I/O請求隊列將同步完成分組中包含的臨時保持時間信息作為第二可靠性保證信息記錄在第二存儲設備上(S162 :是;以及 S170)。圖10是示出了在發(fā)生故障之后執(zhí)行業(yè)務應用的計算機的手動或自動切換的示例。圖10示出了將HA群軟件與復制軟件一起安裝在每個計算機上的示例。安裝在每個計算機上的HA群軟件監(jiān)控每個其他計算機的狀態(tài),并排他地執(zhí)行業(yè)務應用。安裝有業(yè)務應用并且執(zhí)行業(yè)務應用的計算機與沒有執(zhí)行的計算機之間,復制軟件執(zhí)行異步數(shù)據(jù)復制。HA群軟件還在執(zhí)行業(yè)務應用的計算機中發(fā)生故障時切換計算機來執(zhí)行業(yè)務應用??梢栽谧詣釉O置或手動設置中選擇這種切換。如圖10所不,該不例是在計算機210是現(xiàn)用系統(tǒng)計算機而計算機220是待機系統(tǒng)計算機時切換的示例。在故障發(fā)生之后,將曾經是現(xiàn)用系統(tǒng)的計算機210停止。計算機220中的HA群軟件227執(zhí)行AP 228。然后,將曾經是待機系統(tǒng)的計算機220切換成現(xiàn)用系統(tǒng)。注意,在執(zhí)行AP 228時,HA群軟件227檢驗同步開始分組中包含的附加時間信息和同步完成分組中包含的臨時保持時間信息是否被記錄在計算機220的第二存儲設備223上,并基于檢驗結果來確定AP 228的執(zhí)行起始點。具體地,當只有包含在同步開始分組中的附加時間信息被記錄在第二存儲設備223上時,HA群軟件227在發(fā)送時間之前發(fā)送和接收的數(shù)據(jù)(是存儲到第一存儲設備222的可靠數(shù)據(jù))之中獲得最后一個數(shù)據(jù)時的時間點處執(zhí)行AP 228。同時,當同步開始分組中包含的附加時間信息和同步完成分組中包含的臨時保持時間信息均被記錄在第二存儲設備223上時,HA群軟件227在同步完成分組之前接收到的數(shù)據(jù)(是存儲到第一存儲設備222的可靠數(shù)據(jù))之中獲得最后一個數(shù)據(jù)時的時間點處執(zhí)行AP228。該示例實施例的計算機系統(tǒng)200是體現(xiàn)圖I所示計算機系統(tǒng)的示例,可以實現(xiàn)計算機系統(tǒng)100的每個效果。
此外,在計算機系統(tǒng)200中,由于數(shù)據(jù)被壓縮以在現(xiàn)用系統(tǒng)計算機與待機系統(tǒng)計算機之間傳輸,所以可以減少流經網絡230的數(shù)據(jù)量。此外,讀取與第一存儲設備不同的第二存儲設備上的第一可靠性保證信息和第二可靠性保證信息使得待機系統(tǒng)計算機可以匹配現(xiàn)用系統(tǒng)計算機和待機系統(tǒng)計算機的第一存儲設備中的數(shù)據(jù)。目前為止基于示例實施例說明了本發(fā)明。這些示例實施例是示例,在不脫離本發(fā)明的范圍的前提下可以對上述每一個實施例進行各種修改、增加、減少和組合。本領域技術人員將理解,這些修改、增加、減少和組合在本發(fā)明的范圍之內。例如,在計算機系統(tǒng)200中,在每個計算機上都安裝了現(xiàn)用系統(tǒng)計算機的功能和待機系統(tǒng)計算機的功能兩者。然而,上述兩個功能也可以僅安裝在例如要作為服務器的計算機上。此外,在這種情況下,可以僅將現(xiàn)用系統(tǒng)計算機的功能安裝在現(xiàn)用系統(tǒng)服務器上,可以僅將待機系統(tǒng)計算機的功能安裝在待機系統(tǒng)服務器上。此外,可以按照以下方式來執(zhí)行操作將現(xiàn)用系統(tǒng)計算機的功能安裝在現(xiàn)用系統(tǒng)共享存儲裝置上,將待機系統(tǒng)計算機的功能也安裝在待機系統(tǒng)共享存儲裝置上。此外,盡管將計算機系統(tǒng)200描述為經由網絡來接收預先通知,然而可以通過任何通信系統(tǒng)(如,射頻)來接收預先通知,只要能接收到預先通知即可。本發(fā)明要求2010年3月8日在日本專利局提交的日本專利申請No. 2010-050784的優(yōu)先權并且基于該申請,其全部公開一并在此作為參考。工業(yè)應用本發(fā)明可以用于計算機系統(tǒng)中數(shù)據(jù)的備份,所述計算機系統(tǒng)復制數(shù)據(jù),特別是以異步的方式來復制數(shù)據(jù)。附圖標記的說明100計算機系統(tǒng) 110現(xiàn)用系統(tǒng)計算機112存儲設備114應用執(zhí)行單元115主處理單元116發(fā)送單元118發(fā)送隊列120接收單元122控制單元130待機系統(tǒng)計算機
132存儲設備140備份單元200計算機系統(tǒng)210計算機212第一存儲設備213第二存儲設備214OS 216 復制軟件217HA群軟件218應用220計算機222第一存儲設備
223第二存儲設備2240S226復制軟件227HA群軟件228應用230網絡240故障預測服務設備300收發(fā)機單元302控制單元310主處理單元312I/O請求隊列314發(fā)送隊列316解壓縮單元318壓縮單元320差分存儲單元
權利要求
1.一種計算機系統(tǒng),包括 現(xiàn)用系統(tǒng)計算機,在所述現(xiàn)用系統(tǒng)計算機上執(zhí)行業(yè)務應用;以及待機系統(tǒng)計算機,利用現(xiàn)用系統(tǒng)計算機在所述待機系統(tǒng)計算機上執(zhí)行對數(shù)據(jù)的異步復制,所述數(shù)據(jù)是通過在現(xiàn)用系統(tǒng)計算機上執(zhí)行業(yè)務應用而產生的,其中所述現(xiàn)用系統(tǒng)計算機包括 存儲設備,業(yè)務應用向所述存儲設備中寫入數(shù)據(jù); 發(fā)送隊列,在通過業(yè)務應用寫入存儲設備的數(shù)據(jù)之中,對尚未發(fā)送至待機系統(tǒng)計算機的數(shù)據(jù)進行排隊; 接收裝置,接收用于給出故障預測的預先通知; 控制裝置,當接收裝置接收到預先通知時停止業(yè)務應用的執(zhí)行;以及發(fā)送裝置,當接收裝置接收到預先通知時,依次將發(fā)送開始信息、在發(fā)送隊列中排隊的數(shù)據(jù)以及發(fā)送完成信息發(fā)送至待機系統(tǒng)計算機,其中所述發(fā)送開始信息指示了數(shù)據(jù)發(fā)送的開始以避免故障, 所述發(fā)送完成信息指示了數(shù)據(jù)發(fā)送的完成, 所述待機系統(tǒng)計算機包括 存儲設備;以及 備份裝置,將來自現(xiàn)用系統(tǒng)計算機的數(shù)據(jù)與異步復制一起寫入存儲設備;并且 所述備份裝置 在接收到發(fā)送開始信息時,將在發(fā)送開始信息之后接收到的數(shù)據(jù)寫入存儲設備并產生和保持第一可靠性保證信息,所述第一可靠性保證信息指示在發(fā)送開始信息之前接收到的數(shù)據(jù)是可靠數(shù)據(jù);以及 在接收到發(fā)送完成信息時,產生和保持第二可靠性保證信息,所述第二可靠性保證信息指示在發(fā)送完成信息之前接收到的數(shù)據(jù)是可靠數(shù)據(jù)。
2.根據(jù)權利要求I所述的計算機,其中, 發(fā)送開始信息包括在現(xiàn)用系統(tǒng)計算機中的發(fā)送隊列的首部排隊的數(shù)據(jù)之前產生的前一數(shù)據(jù)的寫入時間; 發(fā)送完成信息包括在發(fā)送隊列的末尾排隊的數(shù)據(jù)的寫入時間,并且待機系統(tǒng)計算機中的備份裝置保持發(fā)送開始信息和發(fā)送完成信息中包含的寫入時間,分別作為第一可靠性保證信息和第二可靠性保證信息。
3.一種現(xiàn)用系統(tǒng)計算機,在所述現(xiàn)用系統(tǒng)計算機上執(zhí)行業(yè)務應用,利用待機系統(tǒng)計算機對通過執(zhí)行業(yè)務應用而產生的數(shù)據(jù)執(zhí)行異步復制,所述現(xiàn)用系統(tǒng)計算機包括 存儲設備,業(yè)務應用向所述存儲設備中寫入數(shù)據(jù); 發(fā)送隊列,在通過業(yè)務應用寫入存儲設備的數(shù)據(jù)之中,對尚未發(fā)送至待機系統(tǒng)計算機的數(shù)據(jù)進行排隊; 接收裝置,接收用于給出故障預測的預先通知; 控制裝置,當接收裝置接收到預先通知時停止業(yè)務應用的執(zhí)行;以及發(fā)送裝置,當接收裝置接收到預先通知時,依次將發(fā)送開始信息、在發(fā)送隊列中排隊的數(shù)據(jù)以及發(fā)送完成信息發(fā)送至待機系統(tǒng)計算機,其中所述發(fā)送開始信息指示了數(shù)據(jù)發(fā)送的開始以避免故障,所述發(fā)送完成信息指示了數(shù)據(jù)發(fā)送的完成。
4.根據(jù)權利要求3所述的現(xiàn)用系統(tǒng)計算機,其中, 發(fā)送開始信息包括在發(fā)送隊列的首部排隊的數(shù)據(jù)之前產生的前一數(shù)據(jù)的寫入時間;并且 發(fā)送完成信息包括在發(fā)送隊列的末尾排隊的數(shù)據(jù)的寫入時間。
5.一種待機系統(tǒng)計算機,利用現(xiàn)用系統(tǒng)計算機在所述待機系統(tǒng)計算機上執(zhí)行對數(shù)據(jù)的異步復制,所述數(shù)據(jù)是通過在現(xiàn)用系統(tǒng)計算機上執(zhí)行業(yè)務應用而產生的,所述待機系統(tǒng)計算機包括 存儲設備;以及 備份裝置,將來自現(xiàn)用系統(tǒng)計算機的數(shù)據(jù)與異步復制一起寫入存儲設備;并且 所述備份裝置 在從現(xiàn)用系統(tǒng)計算機接收到發(fā)送開始信息時,將在發(fā)送開始信息之后接收到的數(shù)據(jù)寫入存儲設備并產生和保持第一可靠性保證信息,所述發(fā)送開始信息指示當現(xiàn)用系統(tǒng)計算機接收到用于給出故障預測的預先通知時為了避免故障而執(zhí)行的數(shù)據(jù)發(fā)送以及對于尚未發(fā)送至待機系統(tǒng)計算機的數(shù)據(jù)的發(fā)送的開始,所述第一可靠性保證信息指示在發(fā)送開始信息之前接收到的數(shù)據(jù)是可靠數(shù)據(jù);以及 在現(xiàn)用系統(tǒng)計算機接收到在完成數(shù)據(jù)發(fā)送之后發(fā)送的發(fā)送完成信息時,產生和保持第二可靠性保證信息,所述第二可靠性保證信息指示在發(fā)送完成信息之前接收到的數(shù)據(jù)是可靠數(shù)據(jù)。
6.根據(jù)權利要求2所述的現(xiàn)用系統(tǒng)計算機,其中, 發(fā)送開始信息包括在發(fā)送隊列的首部排隊的數(shù)據(jù)之前產生的前一數(shù)據(jù)的寫入時間;并且 發(fā)送完成信息包括在發(fā)送隊列的末尾排隊的數(shù)據(jù)的寫入時間。
根據(jù)權利要求5所述的待機系統(tǒng)計算機,其中,備份裝置保持發(fā)送開始信息和發(fā)送完成信息中包含的寫入時間分別作為第一可靠性保證信息和第二可靠性保證信息。
7.根據(jù)權利要求5或6所述的待機系統(tǒng)計算機,還包括與所述存儲設備不同的另一存儲設備,其中所述備份裝置通過向所述另一存儲設備中寫入來保存所述第一可靠性保證信息和第二可靠性保證信息。
8.一種存儲程序的非暫時性計算機可讀介質,所述程序使執(zhí)行業(yè)務應用的現(xiàn)用系統(tǒng)計算機接收用于給出故障預測的預先通知,利用待機系統(tǒng)計算機對通過執(zhí)行業(yè)務應用而產生的數(shù)據(jù)執(zhí)行異步復制,以執(zhí)行包括以下步驟的處理 當接收到預先通知時, 停止業(yè)務應用的執(zhí)行;以及 依次將發(fā)送開始信息、在通過業(yè)務應用而存儲到存儲設備的數(shù)據(jù)之中尚未發(fā)送至待機系統(tǒng)計算機的數(shù)據(jù)、以及發(fā)送完成信息發(fā)送至待機系統(tǒng)計算機,其中所述發(fā)送開始信息指示了數(shù)據(jù)發(fā)送的開始以避免故障,所述發(fā)送完成信息指示了數(shù)據(jù)發(fā)送的完成。
9.一種存儲程序的非暫時性計算機可讀介質,所述程序使待機系統(tǒng)計算機執(zhí)行包括以下步驟的處理,在所述代理系統(tǒng)計算機上,利用現(xiàn)用系統(tǒng)計算機對通過在現(xiàn)用系統(tǒng)計算機上執(zhí)行業(yè)務應用而產生的數(shù)據(jù)執(zhí)行異步復制 在從現(xiàn)用系統(tǒng)計算機接收到發(fā)送開始信息時,將在發(fā)送開始信息之后接收到的數(shù)據(jù)寫入存儲設備并產生和保持第一可靠性保證信息,其中所述發(fā)送開始信息指示當現(xiàn)用系統(tǒng)計算機接收到用于給出故障預測的預先通知時為了避免故障而執(zhí)行的數(shù)據(jù)發(fā)送以及對于尚未發(fā)送至待機系統(tǒng)計算機的數(shù)據(jù) 的發(fā)送的開始,所述第一可靠性保證信息指示在發(fā)送開始信息之前接收到的數(shù)據(jù)是可靠數(shù)據(jù);以及 在現(xiàn)用系統(tǒng)計算機接收到在完成數(shù)據(jù)發(fā)送之后發(fā)送的發(fā)送完成信息時,產生和保持第二可靠性保證信息,所述第二可靠性保證信息指示在發(fā)送完成信息之前接收到的數(shù)據(jù)是可靠數(shù)據(jù)。
全文摘要
當接收到預先通知時,利用待機系統(tǒng)計算機執(zhí)行業(yè)務應用的現(xiàn)用系統(tǒng)計算機停止業(yè)務應用,并依次將發(fā)送開始信息、在發(fā)送隊列118中排隊的數(shù)據(jù)以及發(fā)送完成信息發(fā)送至待機系統(tǒng)計算機,其中所述發(fā)送開始信息指示了數(shù)據(jù)發(fā)送的開始,所述發(fā)送完成信息指示了數(shù)據(jù)發(fā)送的完成。待機系統(tǒng)計算機在接收到發(fā)送開始信息時產生和保持第一可靠性保證信息,在接收到在完成數(shù)據(jù)發(fā)送之后發(fā)送的發(fā)送完成信息時產生和保持第二可靠性保證信息,所述第一可靠性保證信息指示在發(fā)送開始信息之前接收到的數(shù)據(jù)是可靠數(shù)據(jù),所述第二可靠性保證信息指示在發(fā)送完成信息之前接收到的數(shù)據(jù)是可靠數(shù)據(jù)。因此,在采用異步復制來進行數(shù)據(jù)復制的同時,保證了在故障時待機系統(tǒng)計算機上備份的數(shù)據(jù)的可靠性。
文檔編號G06F3/06GK102792287SQ20108006526
公開日2012年11月21日 申請日期2010年10月13日 優(yōu)先權日2010年3月8日
發(fā)明者竹本平 申請人:日本電氣株式會社