欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

分布式主動(dòng)混合存儲(chǔ)系統(tǒng)的制作方法

文檔序號(hào):11450206閱讀:518來源:國(guó)知局
分布式主動(dòng)混合存儲(chǔ)系統(tǒng)的制造方法與工藝

優(yōu)先權(quán)聲明

本申請(qǐng)要求2014年10月3日提交的新加坡專利申請(qǐng)no.10201406349v的優(yōu)先權(quán)。

本發(fā)明涉及一種用于數(shù)據(jù)中心的存儲(chǔ)系統(tǒng)。更具體地說,本發(fā)明涉及一種用于數(shù)據(jù)中心的分布式主動(dòng)混合存儲(chǔ)系統(tǒng)。



背景技術(shù):

目前的存儲(chǔ)裝置或容量具有很少的智能或者就沒有智能。它們是可被指示執(zhí)行簡(jiǎn)單的讀取/寫入操作的虛擬裝置。它依賴于存儲(chǔ)服務(wù)器中的一組系統(tǒng)軟件來提取基于塊的存儲(chǔ)裝置。數(shù)據(jù)中心的數(shù)據(jù)越多,就需要越多的存儲(chǔ)服務(wù)器來管理裝置并提供存儲(chǔ)摘要。這不僅增加了硬件成本,而且還增加了服務(wù)器維護(hù)的成本。

隨著中央處理單元(cpu)和非易失性存儲(chǔ)器(nvm)技術(shù)的發(fā)展,越來越可行的是,將系統(tǒng)和集群軟件實(shí)現(xiàn)和其它數(shù)據(jù)管理的功能并入較小的控制板以優(yōu)化系統(tǒng)的效率和性能,從而降低總擁有成本(toc)。nvm是一種以非常高的速度和/或非常低的延遲訪問時(shí)間來存儲(chǔ)數(shù)據(jù)的固態(tài)存儲(chǔ)器和存儲(chǔ)技術(shù),并且即使隨著電力的移除nvm仍會(huì)保留存儲(chǔ)的數(shù)據(jù)。nvm技術(shù)的例子包括但不限于stt-mram(自旋力矩轉(zhuǎn)移mram)、reram(阻變r(jià)am)和閃存儲(chǔ)器。也可以通過各種不同的nvm技術(shù)的混合或組合來提供nvm,以實(shí)現(xiàn)成本和性能之間平衡。

因此,需要一種系統(tǒng),其利用cpu和nvm技術(shù)來給存儲(chǔ)裝置提供智能并減少或消除它們對(duì)用于這種智能的存儲(chǔ)服務(wù)器的依賴。此外,結(jié)合附圖和本公開文本的背景,根據(jù)隨后的具體實(shí)施方式和附隨的屬權(quán)利要求,其它期望的特點(diǎn)和特征將變得明顯。



技術(shù)實(shí)現(xiàn)要素:

根據(jù)本發(fā)明的一個(gè)方面,公開了一種主動(dòng)存儲(chǔ)系統(tǒng)。該主動(dòng)存儲(chǔ)系統(tǒng)包括存儲(chǔ)裝置、非易失性存儲(chǔ)器和主動(dòng)驅(qū)動(dòng)控制器。該主動(dòng)驅(qū)動(dòng)控制器在主動(dòng)存儲(chǔ)系統(tǒng)中執(zhí)行數(shù)據(jù)管理和/或集群管理,該主動(dòng)驅(qū)動(dòng)控制器還包括用于至少接收對(duì)象和/或文件數(shù)據(jù)的數(shù)據(jù)接口。

根據(jù)本發(fā)明的另一方面,還公開了另一種主動(dòng)存儲(chǔ)系統(tǒng)。該主動(dòng)存儲(chǔ)系統(tǒng)包括元數(shù)據(jù)服務(wù)器和一個(gè)或多個(gè)主動(dòng)混合節(jié)點(diǎn)。每個(gè)主動(dòng)混合節(jié)點(diǎn)都包括多個(gè)混合對(duì)象存儲(chǔ)裝置(hosd)和對(duì)應(yīng)的多個(gè)主動(dòng)驅(qū)動(dòng)控制器,多個(gè)主動(dòng)驅(qū)動(dòng)控制器中的每個(gè)都包括用于至少接收對(duì)應(yīng)hosd的對(duì)象和/或文件數(shù)據(jù)的數(shù)據(jù)接口。多個(gè)主動(dòng)驅(qū)動(dòng)控制器中的一個(gè)還包括主動(dòng)管理節(jié)點(diǎn),該主動(dòng)管理節(jié)點(diǎn)與元數(shù)據(jù)服務(wù)器和多個(gè)主動(dòng)驅(qū)動(dòng)存儲(chǔ)裝置中的每個(gè)進(jìn)行交互以管理和監(jiān)控主動(dòng)混合節(jié)點(diǎn)。

附圖說明

在附圖中,相同的附圖標(biāo)記是指所有單獨(dú)視圖中相同或功能相似的元件,將附圖連同下面的具體實(shí)施方式一起并入說明書中,并形成說明書的一部分,附圖僅通過非限制性實(shí)例的方式來示例各種實(shí)施例和說明根據(jù)本發(fā)明的各種原理和優(yōu)勢(shì)。

參考下面的附圖,在下文中描述本發(fā)明的實(shí)施例,其中:

圖1是描繪根據(jù)本實(shí)施例的主動(dòng)驅(qū)動(dòng)存儲(chǔ)系統(tǒng)的例子的圖示。

圖2是描繪根據(jù)本實(shí)施例的主動(dòng)驅(qū)動(dòng)分布式存儲(chǔ)系統(tǒng)體系結(jié)構(gòu)的例子的圖示。

圖3是描繪根據(jù)本實(shí)施例的主動(dòng)驅(qū)動(dòng)存儲(chǔ)系統(tǒng)的例子的方框圖的圖示。

圖4是描繪根據(jù)本實(shí)施例的一對(duì)一的鍵值到對(duì)象的映射的的視圖的圖示。

圖5是描繪根據(jù)本實(shí)施例的多對(duì)一的鍵值到對(duì)象的映射的視圖的圖示。

圖6是描繪根據(jù)本實(shí)施例的一對(duì)多的鍵值到對(duì)象的映射的視圖的圖示。

圖7是描繪根據(jù)本實(shí)施例的主動(dòng)混合節(jié)點(diǎn)(ahn)體系結(jié)構(gòu)的例子的方框圖。

圖8是描繪根據(jù)本實(shí)施例的主動(dòng)管理節(jié)點(diǎn)(amn)軟件體系結(jié)構(gòu)的方框圖。

圖9是描繪常規(guī)分布式存儲(chǔ)系統(tǒng)中的數(shù)據(jù)更新過程的方框圖。

圖10是描繪根據(jù)本實(shí)施例的分布式主動(dòng)混合存儲(chǔ)系統(tǒng)的示例性網(wǎng)絡(luò)優(yōu)化的方框圖。

圖11是描繪根據(jù)本實(shí)施例的交換機(jī)控制板(scb)中的可編程交換包轉(zhuǎn)發(fā)流程的流程圖。

圖12是描述根據(jù)本實(shí)施例的在遇到hosd失效時(shí)的重建過程的流程圖。

技術(shù)人員應(yīng)該意識(shí)到,為了簡(jiǎn)單清晰,圖中的元件是示例性的,并且不一定按比例繪制。

具體實(shí)施方式

下面的詳細(xì)描述實(shí)際上僅是示例性的,并且不意指限制本發(fā)明或本發(fā)明的應(yīng)用和用途。此外,不意指受本發(fā)明前面的背景或下面的詳細(xì)描述所提出的任何理論的約束。本發(fā)明的目的是提出一種主動(dòng)存儲(chǔ)系統(tǒng),該主動(dòng)存儲(chǔ)系統(tǒng)包括耦合到用于執(zhí)行數(shù)據(jù)管理和集群管理的系統(tǒng)中的混合存儲(chǔ)裝置的主動(dòng)驅(qū)動(dòng)控制器,集群管理包括與元數(shù)據(jù)服務(wù)器和其它主動(dòng)驅(qū)動(dòng)控制器交互以發(fā)現(xiàn)和加入集群或形成和維持集群。根據(jù)本實(shí)施例的主動(dòng)驅(qū)動(dòng)控制器包括用于接收對(duì)象數(shù)據(jù)、文件數(shù)據(jù)和鍵值數(shù)據(jù)的數(shù)據(jù)接口。

參考圖1,圖100描繪了根據(jù)本實(shí)施例系統(tǒng)100的主動(dòng)驅(qū)動(dòng)存儲(chǔ)系統(tǒng)的例子。主動(dòng)驅(qū)動(dòng)存儲(chǔ)系統(tǒng)包括三個(gè)主要組成部分:應(yīng)用服務(wù)器102、主動(dòng)混合節(jié)點(diǎn)(ahn)104和主動(dòng)管理節(jié)點(diǎn)(amn)106。ahn104是一種具有附接的硬盤驅(qū)動(dòng)器(hdd)112和非易失性存儲(chǔ)器(nvm)110的混合存儲(chǔ)節(jié)點(diǎn)。多個(gè)ahn104可以形成集群120。amn106包含少量的nvm作為存儲(chǔ)介質(zhì)。數(shù)據(jù)包130經(jīng)由網(wǎng)絡(luò)140在應(yīng)用服務(wù)器102和ahn104之間流動(dòng)。

參考圖2,其描繪了根據(jù)本實(shí)施例的主動(dòng)驅(qū)動(dòng)分布式存儲(chǔ)系統(tǒng)200的體系結(jié)構(gòu)的例子。主動(dòng)驅(qū)動(dòng)分布式存儲(chǔ)系統(tǒng)包括經(jīng)由因特網(wǎng)204耦合到多個(gè)主動(dòng)混合驅(qū)動(dòng)器206的應(yīng)用/客戶端服務(wù)器202。在數(shù)據(jù)中心配置中,主動(dòng)混合驅(qū)動(dòng)器206可被安裝在機(jī)架(諸如42u機(jī)架210)中,該機(jī)架包括用于將安裝在其中的主動(dòng)混合驅(qū)動(dòng)器206耦合到應(yīng)用/客戶端服務(wù)器202的可編程交換機(jī)220。由于數(shù)據(jù)直接傳輸?shù)街鲃?dòng)混合驅(qū)動(dòng)器206,所以這種體系結(jié)構(gòu)消除了存儲(chǔ)節(jié)點(diǎn)。

參考圖3,其示例了根據(jù)本實(shí)施例的分布式主動(dòng)混合驅(qū)動(dòng)存儲(chǔ)系統(tǒng)302的例子的示意圖300。應(yīng)用服務(wù)器102耦合到ahn104、304,其中一些ahn104包括nvm110、hdd112和主動(dòng)驅(qū)動(dòng)控制器306,其它的ahn304包括nvm110、固態(tài)驅(qū)動(dòng)器(ssd)310和主動(dòng)驅(qū)動(dòng)控制器306。多個(gè)ahn104、304可形成集群315。為了提高性能和增加存儲(chǔ)利用率,分布式主動(dòng)混合存儲(chǔ)系統(tǒng)302采用并行數(shù)據(jù)訪問和糾刪碼。為了寫入數(shù)據(jù),應(yīng)用服務(wù)器102可將數(shù)據(jù)分條到不同的ahn104、304,使用元數(shù)據(jù)服務(wù)器320跟蹤部分?jǐn)?shù)據(jù)。在讀取數(shù)據(jù)期間,應(yīng)用服務(wù)器102可同時(shí)從不同的ahn104、304中同步讀取多個(gè)條以實(shí)現(xiàn)高性能。

參考圖4,映射圖400描繪了根據(jù)本實(shí)施例的一對(duì)一的鍵值與對(duì)像映射的視圖。對(duì)象410由三部分組成:對(duì)象標(biāo)識(shí)(oid)412、對(duì)象數(shù)據(jù)414和對(duì)象元數(shù)據(jù)416。oid412是對(duì)象410的唯一id/名稱。對(duì)象數(shù)據(jù)414是對(duì)象410的實(shí)際內(nèi)容。對(duì)象元數(shù)據(jù)416可以是對(duì)象410的任何預(yù)先設(shè)定的屬性或信息。

鍵值(kv)接口建立在對(duì)象存儲(chǔ)的頂部。映射層被設(shè)計(jì)和實(shí)現(xiàn)為將kv條目420映射到對(duì)象410。將kv映射到對(duì)象有各種機(jī)制。在如映射圖400所描繪的一對(duì)一映射中,每個(gè)kv條目420都被映射到單個(gè)對(duì)象410。kv條目420包括鍵422、值424和其它信息426。鍵422被映射432到對(duì)象id412。值424被映射434到對(duì)象數(shù)據(jù)414。其它信息426可包括版本、校驗(yàn)和值大小,并被映射436到對(duì)象元數(shù)據(jù)416。

圖5描繪了根據(jù)本實(shí)施例的多對(duì)一映射方案的視圖的映射圖500。多個(gè)kv條目520被映射到同一個(gè)對(duì)象510。對(duì)象id512表示鍵的范圍522。具有在范圍522內(nèi)的鍵的kv條目520都被映射到這個(gè)對(duì)象510。對(duì)于每個(gè)條目520,其鍵524和屬性526都被映射532到對(duì)象元數(shù)據(jù)516。屬性526可通過在對(duì)象元數(shù)據(jù)516中搜索鍵524來找到。有存儲(chǔ)在對(duì)象元數(shù)據(jù)516中的命名為“偏移”的屬性526,當(dāng)每個(gè)值528都被映射534到對(duì)像數(shù)據(jù)514時(shí),“偏移”表示鍵值的存儲(chǔ)代表的偏移540。

圖6描繪了根據(jù)本實(shí)施例的一對(duì)多的鍵值到對(duì)象的映射的視圖的映射圖,其中每個(gè)kv條目620被映射到多個(gè)對(duì)象610。鍵622被映射到多個(gè)對(duì)象id612,每個(gè)對(duì)象id612都組合有后綴(#000、#001等)的鍵622。屬性624存儲(chǔ)在第一對(duì)象610的元數(shù)據(jù)614中。屬性strip_sz626表示映射到每個(gè)對(duì)象數(shù)據(jù)616的值630的片段大小628。最后的對(duì)象數(shù)據(jù)616可存儲(chǔ)比strip_sz628少的字節(jié)。備選地,每個(gè)對(duì)象610可存儲(chǔ)不同的片段大小628,單個(gè)片段大小存儲(chǔ)在對(duì)象614、615的元數(shù)據(jù)中。

參考圖7,方框圖700描繪了具有節(jié)點(diǎn)后臺(tái)程序704的ahn702的體系結(jié)構(gòu)。后臺(tái)程序是作為后臺(tái)進(jìn)程運(yùn)行的一種計(jì)算機(jī)程序,并且可以有許多后臺(tái)程序,諸如混合對(duì)象存儲(chǔ)裝置(hosd)后臺(tái)程序,該hosd后臺(tái)程序包括一個(gè)或多個(gè)hosd或映射減少工作706,其在ahn702是大的大數(shù)據(jù)存儲(chǔ)池的存儲(chǔ)節(jié)點(diǎn)時(shí)能處理映射減少工作。還可以有實(shí)現(xiàn)的其它后臺(tái)程序,諸如重建后臺(tái)程序708或元數(shù)據(jù)分類后臺(tái)程序(例如,以將數(shù)據(jù)分類以用于本地存儲(chǔ))。應(yīng)用或客戶端服務(wù)器(例如,服務(wù)器102)可將工作發(fā)布和安裝到ahn702中執(zhí)行,節(jié)點(diǎn)后臺(tái)程序704中的消息處理程序710為ahn702提供了與應(yīng)用/客戶端服務(wù)器102通信的信息處理能力,其中客戶端服務(wù)器可以是對(duì)象客戶端712或鍵值(kv)客戶端714。

ahn702還包括對(duì)象存儲(chǔ)716、本地文件存儲(chǔ)718和混合存儲(chǔ)720,混合存儲(chǔ)720包括hdd112和nvm110。本地文件存儲(chǔ)包括對(duì)象元數(shù)據(jù)416(或?qū)ο笤獢?shù)據(jù)516、614、615)和對(duì)象數(shù)據(jù)文件414(或?qū)ο髷?shù)據(jù)文件514、616)。對(duì)象存儲(chǔ)716包括用于與對(duì)象客戶端712接口的對(duì)象接口722和用于與kv客戶端714接口的鍵值接口724。鍵值接口724負(fù)責(zé)kv到對(duì)象的映射,如圖4、5和6所示的映射,對(duì)象存儲(chǔ)716中的文件存儲(chǔ)726負(fù)責(zé)對(duì)象到文件的映射。數(shù)據(jù)壓縮和混合數(shù)據(jù)管理728也是對(duì)象存儲(chǔ)716的控制形式。

更詳細(xì)地描述了形成ahn702的操作和功能的軟件體系結(jié)構(gòu)和模塊??蓤?zhí)行軟件存儲(chǔ)在用于程序代碼存儲(chǔ)的非易失性介質(zhì)中,并在執(zhí)行啟動(dòng)時(shí)通過ahn處理器將其召回到主存儲(chǔ)器中。ahn702提供了與對(duì)象客戶端服務(wù)器712和kv客戶端服務(wù)器714中的應(yīng)用接口的對(duì)象接口和鍵值(kv)接口。對(duì)象接口722是關(guān)于基礎(chǔ)對(duì)象存儲(chǔ)716的本地接口。對(duì)象存儲(chǔ)716可被備選地實(shí)現(xiàn)為文件存儲(chǔ)(例如,文件存儲(chǔ)726)以將對(duì)象存儲(chǔ)為文件。

軟件有三個(gè)主要層:節(jié)點(diǎn)后臺(tái)程序704、對(duì)象存儲(chǔ)716和本地文件系統(tǒng)718。節(jié)點(diǎn)后臺(tái)程序?qū)?04是指各種獨(dú)立運(yùn)行的程序或軟件后臺(tái)程序。消息處理后臺(tái)程序710處理與其它anh、amn和客戶終端的、用于形成和保持分布式集群系統(tǒng)并在客戶端服務(wù)器和anh之間提供數(shù)據(jù)傳輸?shù)?、基于tcp/ip的通信協(xié)議。

重建后臺(tái)程序708負(fù)責(zé)通過對(duì)來自相關(guān)的尚存的數(shù)據(jù)和校驗(yàn)碼驅(qū)動(dòng)器的數(shù)據(jù)進(jìn)行解碼而執(zhí)行從系統(tǒng)中的失效驅(qū)動(dòng)器重建丟失的數(shù)據(jù)的過程。映射減少后臺(tái)程序706為映射減少框架中的工作跟蹤提供映射減少和大數(shù)據(jù)分布式文件系統(tǒng)(hdfs)接口,以將數(shù)據(jù)分析任務(wù)指定給anh執(zhí)行,使得處理所需要的數(shù)據(jù)可以在anh節(jié)點(diǎn)中的多個(gè)存儲(chǔ)裝置中的一個(gè)存儲(chǔ)裝置中被直接本地訪問??蛻舳丝砂惭b程序后臺(tái)程序730被配置為執(zhí)行存儲(chǔ)在附接到anh的任何一個(gè)或多個(gè)存儲(chǔ)裝置上的程序。由于應(yīng)用或客戶端服力器可將工作發(fā)布和安裝到ahn中執(zhí)行,所以客戶端可安裝程序后臺(tái)程序可與客戶終端進(jìn)行通信,以將可執(zhí)行程序上傳和安裝到附接到anh的一個(gè)或多個(gè)存儲(chǔ)裝置。

運(yùn)行在ahn702中計(jì)算的數(shù)據(jù)的原則是使計(jì)算更接近存儲(chǔ),即后臺(tái)程序大部分時(shí)間只需要訪問來自本地ahn702的數(shù)據(jù)和將工作的結(jié)果發(fā)送回應(yīng)用或客戶端服務(wù)器。在許多情況下,數(shù)據(jù)計(jì)算的結(jié)果的大小要比用于計(jì)算的本地?cái)?shù)據(jù)小很多。這樣,可以減少需要在網(wǎng)絡(luò)140上傳輸?shù)臄?shù)據(jù)量,并可隨著存儲(chǔ)資源分配大數(shù)據(jù)處理或計(jì)算,以便大大提高整個(gè)系統(tǒng)性能。

對(duì)象存儲(chǔ)716是一種將對(duì)象接口722和kv接口724提供到節(jié)點(diǎn)后臺(tái)程序?qū)?04的軟件層。對(duì)象存儲(chǔ)層716還通過文件存儲(chǔ)726將對(duì)象映射到文件,以使對(duì)象能被下層的文件系統(tǒng)存儲(chǔ)和管理。數(shù)據(jù)壓縮和混合數(shù)據(jù)管理是對(duì)象存儲(chǔ)層716中的另外兩個(gè)主要模塊(為了簡(jiǎn)單通過圖7的單模塊728示出)。根據(jù)本實(shí)施例,數(shù)據(jù)壓縮分別對(duì)數(shù)據(jù)寫入和讀取執(zhí)行行內(nèi)數(shù)據(jù)編碼和解碼。混合數(shù)據(jù)管理根據(jù)本實(shí)施例管理混合存儲(chǔ),以使經(jīng)常使用的數(shù)據(jù)存儲(chǔ)在nvm中。在對(duì)象存儲(chǔ)層716中還可實(shí)現(xiàn)其它的數(shù)據(jù)管理服務(wù),諸如存儲(chǔ)服務(wù)質(zhì)量(qos)。

本地文件系統(tǒng)層718通過將每個(gè)對(duì)象分解成一個(gè)或多個(gè)存儲(chǔ)裝置的對(duì)應(yīng)扇區(qū)塊,來提供用于存儲(chǔ)對(duì)象元數(shù)據(jù)416和對(duì)象數(shù)據(jù)414的下層的一個(gè)或多個(gè)存儲(chǔ)裝置的數(shù)據(jù)塊的文件系統(tǒng)管理。根據(jù)本實(shí)施例,用于刪除對(duì)象的數(shù)據(jù)扇區(qū)塊被本地文件系統(tǒng)層718回收,以便將來分配用于存儲(chǔ)新創(chuàng)建的對(duì)象的扇區(qū)空間。

參考圖8,方框圖800描繪了根據(jù)本實(shí)施例的主動(dòng)管理節(jié)點(diǎn)(amn)802的軟件體系結(jié)構(gòu)的例子。amn802可經(jīng)由消息處理后臺(tái)程序812與amn802所屬的集群中的其它amn(如果有)804、ahn806、應(yīng)用服務(wù)器808和交換機(jī)控制板(scb)交換機(jī)810進(jìn)行通信。

amn802是一種多功能節(jié)點(diǎn)。除了集群管理和監(jiān)控功能814之外,由于新節(jié)點(diǎn)的加入或、失效和不活動(dòng)的ahn、或?qū)hn的不平衡的數(shù)據(jù)訪問,amn802從數(shù)據(jù)遷移和重建后臺(tái)程序816發(fā)送遷移數(shù)據(jù)的指令。此外,amn802還能夠通過經(jīng)由交換機(jī)控制器后臺(tái)程序818向scb交換機(jī)810發(fā)送向發(fā)送器未指定的目的地轉(zhuǎn)發(fā)數(shù)據(jù)包的指令,有利地減少網(wǎng)絡(luò)流量。

消息處理程序后臺(tái)程序812實(shí)現(xiàn)了與其它amn(如果有)、集群中的ahn、應(yīng)用服務(wù)器和可編程交換機(jī)的通信協(xié)議。集群管理和監(jiān)控后臺(tái)程序814提供了形成和保持有關(guān)集群的信息的算法和功能??蛻舴?wù)器與集群管理和監(jiān)控后臺(tái)程序814進(jìn)行通信,以在集群中提取最新的hosd拓?fù)浣Y(jié)構(gòu),以便確定相應(yīng)的hosd來存儲(chǔ)或檢索數(shù)據(jù)。基于集群的監(jiān)控狀態(tài),由于新節(jié)點(diǎn)的加入、或失效和不活動(dòng)的ahn、或?qū)hn的不平衡的數(shù)據(jù)訪問,amn802從數(shù)據(jù)遷移和重建后臺(tái)程序816發(fā)送遷移數(shù)據(jù)的指令。此外,amn802還可以經(jīng)由交換機(jī)控制器后臺(tái)程序818向可編程交換機(jī)發(fā)送復(fù)制和轉(zhuǎn)發(fā)數(shù)據(jù)包到目的地的指令,以自主地減少客戶端通信的負(fù)載。

參考圖9,方框圖900描繪了具有為可靠性而實(shí)現(xiàn)有糾刪碼的常規(guī)分布式存儲(chǔ)系統(tǒng)中的數(shù)據(jù)更新過程。應(yīng)用服務(wù)器902經(jīng)由網(wǎng)絡(luò)交換機(jī)904耦合到包括數(shù)據(jù)節(jié)點(diǎn)906(即,dn1、dn2,…,dnn)和校驗(yàn)節(jié)點(diǎn)908(即,pn1、pn2和pn3)的存儲(chǔ)器。校驗(yàn)節(jié)點(diǎn)908保持來自dn1至dnn的編碼數(shù)據(jù),以便每當(dāng)將數(shù)據(jù)寫入數(shù)據(jù)節(jié)點(diǎn)(例如,在步驟912將數(shù)據(jù)w寫入dn1),就將數(shù)據(jù)復(fù)制到校驗(yàn)節(jié)點(diǎn)908(例如,在步驟914將數(shù)據(jù)w復(fù)制到pn1、pn2和pn3)。如果校驗(yàn)節(jié)點(diǎn)908的編碼數(shù)據(jù)由reedsolomon碼來計(jì)算,則存儲(chǔ)系統(tǒng)可同時(shí)維持三個(gè)節(jié)點(diǎn)失效。元數(shù)據(jù)服務(wù)器910還經(jīng)由網(wǎng)絡(luò)交換機(jī)904耦合到數(shù)據(jù)節(jié)點(diǎn)906和校驗(yàn)節(jié)點(diǎn)908。

參考圖10,方框圖1000示例了根據(jù)本實(shí)施例的分布式主動(dòng)混合存儲(chǔ)系統(tǒng)1002的示例性網(wǎng)絡(luò)優(yōu)化。應(yīng)用服務(wù)器902經(jīng)由網(wǎng)絡(luò)交換機(jī)904與分布式主動(dòng)混合存儲(chǔ)系統(tǒng)1002進(jìn)行通信。網(wǎng)絡(luò)交換機(jī)904與分布式主動(dòng)混合存儲(chǔ)系統(tǒng)1002的可編程交換機(jī)1004進(jìn)行接口,以與ahn數(shù)據(jù)節(jié)點(diǎn)1006和ahn校驗(yàn)節(jié)點(diǎn)1008通信??删幊探粨Q機(jī)1004包括流量表1010和校驗(yàn)節(jié)點(diǎn)索引1012,并響應(yīng)于來自amn1014的可編程命令進(jìn)行操作。數(shù)據(jù)節(jié)點(diǎn)1006和校驗(yàn)節(jié)點(diǎn)1008可以是在amn1014控制下的主動(dòng)混合驅(qū)動(dòng)存儲(chǔ)集群中的hosd。應(yīng)用服務(wù)器902和存儲(chǔ)節(jié)點(diǎn)(即,數(shù)據(jù)節(jié)點(diǎn)1006和校驗(yàn)節(jié)點(diǎn)1008)之間的數(shù)據(jù)傳輸使用tcp/ip作為傳輸和路由協(xié)議在網(wǎng)絡(luò)上實(shí)現(xiàn)。數(shù)據(jù)節(jié)點(diǎn)1006和校驗(yàn)節(jié)點(diǎn)1008是主動(dòng)混合節(jié)點(diǎn),諸如ahn702(圖7),并使用主動(dòng)混合節(jié)點(diǎn)702的軟件體系結(jié)構(gòu)解除了將多個(gè)數(shù)據(jù)副本發(fā)送到不同存儲(chǔ)節(jié)點(diǎn)的應(yīng)用服務(wù)器902。這種結(jié)構(gòu)還降低了數(shù)據(jù)中心網(wǎng)絡(luò)交換機(jī)904帶寬的消耗。

參考圖11,流程圖1100描繪了根據(jù)本實(shí)施例的、在可編程交換機(jī)1004(圖10)的交換機(jī)控制板(scb)中的、用于轉(zhuǎn)發(fā)應(yīng)用服務(wù)器902的引入數(shù)據(jù)的可編程交換包轉(zhuǎn)發(fā)流程。當(dāng)從應(yīng)用服務(wù)器902接收1102數(shù)據(jù)包時(shí),可編程交換機(jī)1004的scb檢查數(shù)據(jù)包報(bào)頭和對(duì)應(yīng)的有效載荷參數(shù)信息,并檢查1104流量表1010和校驗(yàn)節(jié)點(diǎn)1012,以確定該數(shù)據(jù)包是否是寫入數(shù)據(jù)包并將該包轉(zhuǎn)發(fā)到ahn節(jié)點(diǎn)1006。

如果在流量表中沒有找到1106相關(guān)條目,則將數(shù)據(jù)包報(bào)頭和相關(guān)的有效載荷參數(shù)發(fā)送到amn1014以獲得用于這個(gè)包或流量的新條目,并根據(jù)從包含新表?xiàng)l目信息的amn1014接收的響應(yīng),在可編程交換機(jī)1004中更新1108流量和校驗(yàn)節(jié)點(diǎn)表。當(dāng)找到1106該條目時(shí),將數(shù)據(jù)包轉(zhuǎn)發(fā)1110到包含該條目所指示的目標(biāo)hosd的ahn。從應(yīng)用服務(wù)器902接收的具有相同數(shù)據(jù)的獨(dú)立數(shù)據(jù)寫入請(qǐng)求通過可編程交換機(jī)1004來重復(fù)1112、1114,以轉(zhuǎn)發(fā)到與校驗(yàn)節(jié)點(diǎn)表1012中的對(duì)應(yīng)條目所列出的數(shù)據(jù)節(jié)點(diǎn)1006相關(guān)的每個(gè)校驗(yàn)節(jié)點(diǎn)1008。校驗(yàn)節(jié)點(diǎn)1008和數(shù)據(jù)節(jié)點(diǎn)1006由分布式存儲(chǔ)集群中的hosd來提供。

參考圖12,流程圖1200描繪了在一個(gè)或多個(gè)hosd失效時(shí)的重建過程。最初,ahn識(shí)別1202其附接的hosd/hdd失效。一旦識(shí)別出替代驅(qū)動(dòng)器,就開始重建過程。在單個(gè)hosd/hdd失效1204和來自同一ahn的多個(gè)hosd/hdd失效1206的情況下,附接到出現(xiàn)hosd失效的ahn的amn802的重建后臺(tái)程序使用ahn702包含的對(duì)象映射開始1208重建過程。首先,重建后臺(tái)程序816搜索1210在所附接的nvm中可用的數(shù)據(jù),并將其直接復(fù)制到替代hosd/hdd。在重建每個(gè)對(duì)象之后或者在重建1214多個(gè)對(duì)象之后,更新1212也用作重建映射的對(duì)象映射。

對(duì)于多個(gè)hosd/hdd失效橫跨不同的ahn1216發(fā)生的情況,每個(gè)ahn將負(fù)責(zé)自己的hosd/hdd重建1218。對(duì)于每個(gè)ahn,重建過程是重建后臺(tái)程序816,該重建后臺(tái)程序816查找1220在所附接的nvm中可用的數(shù)據(jù)并將其直接復(fù)制到替代hosd/hdd,以及在重建每個(gè)對(duì)象之后或者在重建1214多個(gè)對(duì)象之后,更新1212也用作重建映射的對(duì)象映射。

因此,可以看出,本實(shí)施例提供了一種系統(tǒng),其利用cpu和nvm技術(shù)給存儲(chǔ)裝置提供智能并減少或消除它們?yōu)榱诉@種智能而對(duì)該存儲(chǔ)服務(wù)器的依賴。此外,本實(shí)施例提供了一種有利的方法,其通過使數(shù)據(jù)計(jì)算更接近數(shù)據(jù)存儲(chǔ)和只轉(zhuǎn)發(fā)數(shù)據(jù)計(jì)算結(jié)果來減少網(wǎng)絡(luò)通信,其中數(shù)據(jù)計(jì)算結(jié)果大小比在網(wǎng)絡(luò)上用于計(jì)算的本地?cái)?shù)據(jù)小很多。在這種方式中,能夠減少需要在網(wǎng)絡(luò)上傳輸?shù)臄?shù)據(jù)量,并能隨著存儲(chǔ)資源分配大數(shù)據(jù)處理或計(jì)算,從而大大提高了整個(gè)系統(tǒng)性能。雖然在本發(fā)明的上述詳細(xì)描述中已經(jīng)給出了示例性實(shí)施例,但應(yīng)該意識(shí)到會(huì)存在大量變化。

應(yīng)該進(jìn)一步意識(shí)到,示例性實(shí)施例僅是示例性的,并不意指以任何方式限制本發(fā)明的范圍、適用性、操作或配置。相反地,前述詳細(xì)描述將為本領(lǐng)域的技術(shù)人員提供實(shí)現(xiàn)本發(fā)明的示例性實(shí)施例的方便路線圖,應(yīng)該理解,在不偏離附屬權(quán)利要求所闡述的本發(fā)明的范圍的情況下,可在示例性實(shí)施例所描述的元件的功能和布置和操作的方法方面制造各種變更。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
梁山县| 夹江县| 洛南县| 龙山县| 临西县| 青浦区| 平邑县| 舒兰市| 汉川市| 天长市| 昌吉市| 金湖县| 临洮县| 连平县| 延川县| 兴安盟| 定南县| 民和| 阜南县| 伽师县| 武夷山市| 行唐县| 凌海市| 阜南县| 芦山县| 卢氏县| 奉节县| 双峰县| 班戈县| 元阳县| 庆安县| 石棉县| 金川县| 谷城县| 桂阳县| 榆社县| 嘉义县| 怀宁县| 巧家县| 紫金县| 荔波县|