利用delta卷復(fù)制數(shù)據(jù)的系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001]本公開一般性地涉及用于復(fù)制諸如備份或歷史數(shù)據(jù)的系統(tǒng)和方法。特別地,本公開涉及利用增量卷(delta volume)來復(fù)制數(shù)據(jù)的過程。
【背景技術(shù)】
[0002]磁盤上的數(shù)據(jù)存儲(chǔ)已經(jīng)快速地超額增長(zhǎng)典型地意味著需要將那些磁盤上的數(shù)據(jù)備份到諸如磁帶的可移動(dòng)存儲(chǔ)器上。同時(shí),提供節(jié)省成本的備份副本的需求已經(jīng)超出了諸如實(shí)際需求和貿(mào)易與聯(lián)邦規(guī)則/立法。
[0003]單個(gè)且簡(jiǎn)單的遠(yuǎn)程復(fù)制目標(biāo)站點(diǎn)可以滿足存儲(chǔ)歷史數(shù)據(jù)的需求。然而,在遠(yuǎn)程站點(diǎn)處維護(hù)在源站點(diǎn)處攝取的每個(gè)快照的成本可能是過高的。導(dǎo)致這些成本的項(xiàng)目包括但不局限于:所使用的帶寬的機(jī)會(huì)成本;帶寬的實(shí)際貨幣成本;遠(yuǎn)程站點(diǎn)的實(shí)際貨幣成本(包括例如站點(diǎn)的大小、操作該站點(diǎn)所需要的功率、該站點(diǎn)的雇員成本等);復(fù)制的管理成本;以及存儲(chǔ)成本(包括磁盤或其他塊存儲(chǔ)設(shè)備的成本)。
[0004]將數(shù)據(jù)復(fù)制到備份存儲(chǔ)器上的常規(guī)方法能夠?qū)е骂~外的、不需要的數(shù)據(jù)在源站點(diǎn)與備份站點(diǎn)之間傳遞。例如,在對(duì)數(shù)據(jù)進(jìn)行復(fù)制的一個(gè)示例性方法中,考慮具有本地存儲(chǔ)器102和備份或遠(yuǎn)程存儲(chǔ)器104的數(shù)據(jù)存儲(chǔ)系統(tǒng)100,如圖1所示。在維護(hù)活動(dòng)數(shù)據(jù)(activedata)輸入/輸出(I/O)的本地存儲(chǔ)器102處,該系統(tǒng)被配置成以8小時(shí)的間隔進(jìn)行本地恢復(fù)快照,即快照106、108、110和112。每個(gè)快照識(shí)別其與之前快照之間的變化或增量(delta)。例如,快照108僅識(shí)別變化,因?yàn)榭煺?08攝取于或者攝取自上午12點(diǎn)至上午8點(diǎn)。相反地,備份存儲(chǔ)器104可以例如被配置成用于僅夜間備份,即每隔24小時(shí)備份一次,因?yàn)橛捎谠趥浞菡军c(diǎn)處數(shù)據(jù)是不太活動(dòng)或不活動(dòng)的,所以針對(duì)備份數(shù)據(jù)的更長(zhǎng)備份間隔周期在整個(gè)存儲(chǔ)器使用中是足夠且更高效的。然而,盡管在備份存儲(chǔ)器104處采用24小時(shí)備份周期,但是由于本地存儲(chǔ)器處的快照僅識(shí)別每個(gè)快照之間的增量,所以盡管如此,在一天當(dāng)中,每個(gè)快照將仍然被至少臨時(shí)復(fù)制到備份存儲(chǔ)器中(如圖1所示),以使得備份存儲(chǔ)系統(tǒng)識(shí)別整天的變化并且恰當(dāng)?shù)貏?chuàng)建24小時(shí)日備份。為了節(jié)省空間,一旦24小時(shí)備份118被提交(commit)就刪除任何中間備份114、116。盡管如此,假設(shè)示例性的10兆兆字節(jié)(TB)數(shù)據(jù)組以及本地存儲(chǔ)器處每8個(gè)小時(shí)該數(shù)據(jù)組就100%變化的最壞情況場(chǎng)景,這種常規(guī)方法將需要每8個(gè)小時(shí)就將整個(gè)1TB傳遞給備份存儲(chǔ)器104,從而導(dǎo)致30TB的總?cè)諅鬟f。
[0005]在上面的示例中,僅24小時(shí)快照118和120是感興趣的,并且如果中間快照114、116能夠被消除,那么即使在最壞情況場(chǎng)景中,從本地存儲(chǔ)器102至備份存儲(chǔ)器104的數(shù)據(jù)的日傳遞都將從30TB減小至10TB。在例如僅數(shù)據(jù)組遠(yuǎn)大于30TB的情況中、本地存儲(chǔ)器以短于8小時(shí)的間隔攝取快照的情況中和/或備份存儲(chǔ)器以大于I天的更大間隔進(jìn)行備份的情況中,該問題或許更大。然而,已經(jīng)意識(shí)到,在數(shù)據(jù)組遠(yuǎn)大于30TB、本地存儲(chǔ)器以長(zhǎng)于8小時(shí)的間隔攝取快照和/或備份存儲(chǔ)器以小于I天的間隔進(jìn)行備份的情況下的系統(tǒng)將有可能具有相同的問題。
[0006]因此,在本領(lǐng)域中,需要提供針對(duì)例如備份或歷史數(shù)據(jù)的更節(jié)省成本和/或更高效的復(fù)制過程。
【發(fā)明內(nèi)容】
[0007]在一個(gè)實(shí)施方式中,本公開涉及將數(shù)據(jù)從第一數(shù)據(jù)存儲(chǔ)設(shè)備復(fù)制至第二數(shù)據(jù)存儲(chǔ)設(shè)備的方法。該方法可以包括在第一數(shù)據(jù)存儲(chǔ)設(shè)備處以隔開的時(shí)間間隔生成第一數(shù)據(jù)存儲(chǔ)設(shè)備的邏輯數(shù)據(jù)卷的多個(gè)快照,該邏輯數(shù)據(jù)卷是一個(gè)或多個(gè)物理存儲(chǔ)設(shè)備的數(shù)據(jù)塊的摘要,以及每個(gè)快照用于識(shí)別自最近的之前快照開始的至少一部分邏輯數(shù)據(jù)卷的數(shù)據(jù)變化。在一些實(shí)施方式中,隔開的時(shí)間間隔是預(yù)定的時(shí)間間隔。而且,在第一數(shù)據(jù)存儲(chǔ)設(shè)備處,該方法包括生成增量卷,該增量卷用于指示兩個(gè)非連續(xù)快照之間至少一部分邏輯數(shù)據(jù)卷的數(shù)據(jù)的變化。該方法還包括將增量卷復(fù)制到第二數(shù)據(jù)存儲(chǔ)設(shè)備,以及在第二數(shù)據(jù)存儲(chǔ)設(shè)備處復(fù)制其中指示的對(duì)數(shù)據(jù)的改變。在增量卷被復(fù)制到第二數(shù)據(jù)存儲(chǔ)設(shè)備之后可以在第一存儲(chǔ)設(shè)備處丟棄該增量卷。該方法還可以包括以隔開的時(shí)間間隔生成多個(gè)增量卷。
[0008]在另一實(shí)施方式中,該方法可以包括生成組合增量卷,該組合增量卷指示兩個(gè)不連續(xù)增量卷之間至少一部分邏輯數(shù)據(jù)卷的數(shù)據(jù)的變化。還可以以隔開的時(shí)間間隔生成多個(gè)這種組合增量卷。類似地,組合增量卷可以被復(fù)制到第三數(shù)據(jù)存儲(chǔ)設(shè)備,并且其中指示的對(duì)數(shù)據(jù)的改變可以因此在第三數(shù)據(jù)存儲(chǔ)設(shè)備處被復(fù)制。
[0009]在另一實(shí)施方式中,本公開還涉及從第一數(shù)據(jù)存儲(chǔ)設(shè)備至第二數(shù)據(jù)存儲(chǔ)設(shè)備的數(shù)據(jù)復(fù)制的方法。該方法可以包括在第二數(shù)據(jù)存儲(chǔ)設(shè)備處接收增量卷并且在第二數(shù)據(jù)存儲(chǔ)設(shè)備處復(fù)制其中指示的對(duì)數(shù)據(jù)的改變,該增量卷指示第一數(shù)據(jù)存儲(chǔ)設(shè)備的至少一部分邏輯數(shù)據(jù)卷的數(shù)據(jù)的變化。就這一點(diǎn)而言,第一數(shù)據(jù)存儲(chǔ)設(shè)備可以生成針對(duì)邏輯數(shù)據(jù)卷的多個(gè)快照,該邏輯數(shù)據(jù)卷是一個(gè)或多個(gè)物理存儲(chǔ)設(shè)備的數(shù)據(jù)塊的摘要,其中每個(gè)快照用于識(shí)別自最近的之前快照開始至少一部分邏輯數(shù)據(jù)卷的數(shù)據(jù)變化。該增量卷可以因此指示兩個(gè)不連續(xù)快照之間至少一部分邏輯數(shù)據(jù)卷的數(shù)據(jù)變化。
[0010]在又一實(shí)施方式中,本公開涉及用于數(shù)據(jù)存儲(chǔ)系統(tǒng)的增量卷,該增量卷包括數(shù)據(jù)存儲(chǔ)系統(tǒng)的兩個(gè)不連續(xù)快照之間數(shù)據(jù)變化的指示,其中每個(gè)快照用于指示自最近的之前快照開始至少一部分?jǐn)?shù)據(jù)存儲(chǔ)系統(tǒng)的數(shù)據(jù)變化。每個(gè)快照可以識(shí)別自最近的之前快照開始數(shù)據(jù)存儲(chǔ)系統(tǒng)的邏輯卷的數(shù)據(jù)變化。
[0011]雖然公開了多個(gè)實(shí)施方式,但是通過下面的示出并描述了本發(fā)明示例性實(shí)施方式的【具體實(shí)施方式】部分,本公開的其他實(shí)施方式對(duì)于本領(lǐng)域技術(shù)人員而言將是顯而易見的。如將意識(shí)到,本公開的各種實(shí)施方式能夠在各種顯著的方面進(jìn)行修改,所有修改都不背離本公開的精神和范圍。因此,附圖和具體描述將被認(rèn)為本質(zhì)上是示例性的而非限制性的。
【附圖說明】
[0012]雖然本說明書以特別指出并清楚地要求保護(hù)被認(rèn)為形成本公開的各種實(shí)施方式的主題的權(quán)利要求書結(jié)束,但是應(yīng)該相信,本發(fā)明將通過以下結(jié)合附圖的描述中得到更好的理解,其中:
[0013]圖1是本地至備份存儲(chǔ)器的常規(guī)復(fù)制過程的示意圖。
[0014]圖2是適用于本公開各種實(shí)施方式的磁盤系統(tǒng)的示意圖。
[0015]圖3是根據(jù)本公開一個(gè)實(shí)施方式的快照方案的示意圖。
[0016]圖4是根據(jù)本公開一個(gè)實(shí)施方式的增量卷的示意圖。
[0017]圖5是根據(jù)本公開一個(gè)實(shí)施方式的利用增量卷進(jìn)行復(fù)制的示例性使用的示意圖。
【具體實(shí)施方式】
[0018]本公開涉及用于復(fù)制諸如備份或歷史數(shù)據(jù)的新穎且有益的系統(tǒng)和方法。特別地,本公開涉及用于利用增量卷復(fù)制數(shù)據(jù)的新穎且有益的系統(tǒng)和方法。
[0019]本公開的系統(tǒng)和方法在磁盤系統(tǒng)或虛擬磁盤系統(tǒng)(諸如2009年11月3日發(fā)布的、發(fā)明名稱為“Virtual Disk Drive System and Method” 的美國(guó)專利 N0.7613945 中所描述的系統(tǒng),該專利的全部?jī)?nèi)容通過引用被合并到本文)是特別有用的。這種磁盤系統(tǒng)允許通過基于RAID向磁盤的映射而在存儲(chǔ)器的頁面池上或磁盤存儲(chǔ)塊矩陣上以及多個(gè)磁盤上動(dòng)態(tài)地分配數(shù)據(jù)來進(jìn)行高效的數(shù)據(jù)存儲(chǔ)。它們可以通過以例如預(yù)定時(shí)間間隔、用戶配置的動(dòng)態(tài)時(shí)間戳(諸如每隔幾分鐘或幾小時(shí)等)或者以服務(wù)器所指定的時(shí)間來動(dòng)態(tài)地生成并存儲(chǔ)系統(tǒng)的快照或時(shí)間點(diǎn)副本或者磁盤存儲(chǔ)塊的矩陣來避免數(shù)據(jù)遭受例如系統(tǒng)故障或病毒攻擊。這些有時(shí)間戳的快照允許在系統(tǒng)故障之前從之前的時(shí)間點(diǎn)恢復(fù)數(shù)據(jù),從而將系統(tǒng)恢復(fù)為那個(gè)時(shí)間處所呈現(xiàn)的樣子。在主存儲(chǔ)器能夠保持可操作性的同時(shí),這些快照或時(shí)間點(diǎn)數(shù)據(jù)還可以被系統(tǒng)或系統(tǒng)用戶用于其它用途,諸如但不局限于測(cè)試。通常,通過使用快照性能,用戶可以查看之前時(shí)間點(diǎn)中存儲(chǔ)系統(tǒng)所呈現(xiàn)的狀態(tài)。
[0020]圖2示出了計(jì)算機(jī)環(huán)境202中磁盤或數(shù)據(jù)存儲(chǔ)系統(tǒng)200的一個(gè)實(shí)施方式,諸如在美國(guó)專利N0.7613945中所公開并且適用于本公開的各種實(shí)施方式的磁盤或數(shù)據(jù)存儲(chǔ)系統(tǒng)。如圖2所示,磁盤系統(tǒng)200可以包括數(shù)據(jù)存儲(chǔ)子系統(tǒng)204(如本領(lǐng)域技術(shù)人員將意識(shí)到的,其可以包括RAID子系統(tǒng))和磁盤管理器206 (其具有至少一個(gè)磁盤存儲(chǔ)系統(tǒng)控制器)。數(shù)據(jù)存儲(chǔ)子系統(tǒng)204和磁盤管理器206能夠基于例如RAID向磁盤的映射或其他存儲(chǔ)映射技術(shù)來在多個(gè)磁盤的磁盤空間208之間動(dòng)態(tài)地分配數(shù)據(jù)。
[0021]如上面一般性地描述的那樣,數(shù)據(jù)存儲(chǔ)系統(tǒng)204可以自動(dòng)地生成系統(tǒng)的快照(snapshot)或時(shí)間點(diǎn)副本(Point-1n_Time Copy, PITC)或者其磁盤存儲(chǔ)塊