專利名稱:一種磁盤存儲(chǔ)系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)存儲(chǔ)設(shè)備領(lǐng)域,特別是涉及一種高效的磁盤存儲(chǔ)系統(tǒng)。
背景技術(shù):
隨著計(jì)算機(jī)應(yīng)用領(lǐng)域的不斷拓展,用戶對(duì)于磁盤存儲(chǔ)系統(tǒng)的性能要求也在日益提高。希望其具有更大的容量、更快的速度、以及更高的可靠性和可用性。針對(duì)這一挑戰(zhàn),人們找到了用多個(gè)磁盤驅(qū)動(dòng)器組成獨(dú)立冗余磁盤陣列(RAID)來獲取高的傳輸率和大的存儲(chǔ)容量的辦法。并且現(xiàn)在隨著存儲(chǔ)數(shù)據(jù)容量增長和對(duì)可靠性的要求越來越高,存儲(chǔ)系統(tǒng)已從主機(jī)的附屬外設(shè),向多主機(jī)共享的集中存儲(chǔ)方式發(fā)展。
現(xiàn)有的大容量RAID磁盤陣列存儲(chǔ)系統(tǒng)的結(jié)構(gòu)參見圖1所示,主要包括與外部主機(jī)相連的主機(jī)接口101、高速緩存102和磁盤陣列103三部分。主機(jī)接口101、高速緩存102以及用于連接磁盤陣列103的磁盤接口104通過同一根共享總線105連接。
該系統(tǒng)的具體內(nèi)部結(jié)構(gòu)可參見圖2所示。若干個(gè)主機(jī)接口101、高速緩存102和磁盤接口104掛接在同一條內(nèi)部共享總線105上。主機(jī)接口101通過系統(tǒng)外部的存儲(chǔ)交換機(jī)201與主機(jī)連接。并且每個(gè)主機(jī)接口101都含有獨(dú)立的協(xié)議處理器,用于處理主機(jī)對(duì)磁盤的訪問請(qǐng)求。其詳細(xì)結(jié)構(gòu)參見圖3所示,主機(jī)接口101中主要包括協(xié)議處理器301和目標(biāo)器302,外部主機(jī)上的主機(jī)適配卡303中含有啟動(dòng)器304,協(xié)議處理器301通過目標(biāo)器302和啟動(dòng)器304實(shí)現(xiàn)與外部主機(jī)之間的信息交互。
然而這種結(jié)構(gòu)存儲(chǔ)系統(tǒng)的缺點(diǎn)是由于所有系統(tǒng)內(nèi)部的信息交互都是通過同一根共享總線進(jìn)行,因此很容易形成帶寬瓶頸。要解決高速緩存訪問帶寬瓶頸問題,需要提供很大的總線帶寬和強(qiáng)大的處理能力,則造成系統(tǒng)結(jié)構(gòu)復(fù)雜,成本很高。
系統(tǒng)的主機(jī)接口需要通過交換機(jī)與系統(tǒng)外部的主機(jī)連接,否則每個(gè)主機(jī)接口只能處理與之相連鏈路上的主機(jī)磁盤訪問請(qǐng)求,一方面使系統(tǒng)的使用成本增加,而另一方面協(xié)議處理器利用率低、故障率高,當(dāng)一個(gè)協(xié)議處理器出現(xiàn)故障時(shí),與之相連的主機(jī)端口的業(yè)務(wù)將中斷。
高速緩存集中放置,不利于對(duì)高速緩存的管理及數(shù)據(jù)保護(hù),并且所有主機(jī)接口及磁盤接口都要能夠?qū)Ω咚倬彺孢M(jìn)行高速訪問,容易形成帶寬瓶頸,要解決高速緩存訪問帶寬瓶頸問題,需要提供很大的總線帶寬和強(qiáng)大的處理能力,而這會(huì)造成系統(tǒng)結(jié)構(gòu)復(fù)雜和成本增加。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提供一種高效的存儲(chǔ)系統(tǒng),使其能夠提高設(shè)備利用率,消除帶寬瓶頸,提高數(shù)據(jù)傳輸速度,并增加保護(hù)機(jī)制,提高系統(tǒng)可靠性。
一種磁盤存儲(chǔ)系統(tǒng),至少包括主機(jī)接口模塊、高速緩存、磁盤接口和磁盤陣列,其中所述主機(jī)接口模塊包括具有交換功能的主機(jī)接口通道和一個(gè)以上的協(xié)議處理單元,每個(gè)外部主機(jī)通過主機(jī)接口通道與每個(gè)協(xié)議處理單元連接;且進(jìn)一步包括用于協(xié)議處理單元與磁盤接口間信息傳輸具有交換功能的內(nèi)部高速通道;每個(gè)協(xié)議處理單元通過內(nèi)部高速通道與每個(gè)磁盤接口連接,且每個(gè)磁盤接口上掛接有高速緩存;磁盤接口與磁盤陣列相連。
該存儲(chǔ)系統(tǒng)所述主機(jī)接口通道與協(xié)議處理單元之間通過雙路徑連接。
該存儲(chǔ)系統(tǒng)所述主機(jī)接口模塊包括兩個(gè)互為獨(dú)立的主機(jī)接口通道,每個(gè)主機(jī)接口通道均與所有協(xié)議處理單元連接。
該存儲(chǔ)系統(tǒng)所述協(xié)議處理單元與內(nèi)部高速通道之間通過雙路徑連接,內(nèi)部高速通道與磁盤接口之間通過雙路徑連接。
該存儲(chǔ)系統(tǒng)所述內(nèi)部高速通道為兩個(gè)互為獨(dú)立的內(nèi)部高速通道,每個(gè)內(nèi)部高速通道與所有協(xié)議處理單元連接,且每個(gè)內(nèi)部高速通道與所有磁盤接口連接。
該存儲(chǔ)系統(tǒng)所述磁盤接口兩兩成對(duì)配置,每對(duì)磁盤接口上的高速緩存互為鏡像,互為鏡像的高速緩存互相保存一份鏡像數(shù)據(jù)。
該存儲(chǔ)系統(tǒng)所述磁盤接口的對(duì)數(shù)為4~8對(duì)。
該存儲(chǔ)系統(tǒng)所述主機(jī)接口通道為高速交換網(wǎng)設(shè)備。
該存儲(chǔ)系統(tǒng)所述內(nèi)部高速通道為高速交換網(wǎng)設(shè)備。
該存儲(chǔ)系統(tǒng)所述高速交換網(wǎng)設(shè)備為光纖通道交換機(jī)。
該存儲(chǔ)系統(tǒng)所述協(xié)議處理單元包括用于處理主機(jī)訪問請(qǐng)求的協(xié)議處理器,與外部主機(jī)進(jìn)行信息交互的目標(biāo)器,及與磁盤接口進(jìn)行信息交互的啟動(dòng)器,目標(biāo)器和啟動(dòng)器連接在協(xié)議處理器上,目標(biāo)器與主機(jī)接口通道連接,啟動(dòng)器與內(nèi)部高速通道連接。
該存儲(chǔ)系統(tǒng)所述協(xié)議處理單元含有兩個(gè)目標(biāo)器和啟動(dòng)器,兩個(gè)目標(biāo)器分別連接在主機(jī)接口通道與協(xié)議處理單元之間的兩條路徑上,兩個(gè)協(xié)議處理器分別連接在協(xié)議處理單元與內(nèi)部高速通道之間的兩條路徑上。
該存儲(chǔ)系統(tǒng)所述磁盤接口含有兩個(gè)與協(xié)議處理單元進(jìn)行信息交互的目標(biāo)器,兩個(gè)目標(biāo)器分別連接在內(nèi)部高速通道與磁盤接口之間的兩條路徑上。
由上述方案可以看出,本發(fā)明所提供的一種磁盤存儲(chǔ)系統(tǒng)采用分布式結(jié)構(gòu),分級(jí)處理、業(yè)務(wù)負(fù)荷分擔(dān)模式,每個(gè)協(xié)議處理單元被所有主機(jī)訪問端口共享,提高了協(xié)議處理的效率,擴(kuò)展主機(jī)端口數(shù)。分布式高速緩存,降低了高速緩存的管理及數(shù)據(jù)保護(hù)的復(fù)雜性,通過磁盤接口單元內(nèi)部總線對(duì)高速緩存進(jìn)行訪問,不占用系統(tǒng)帶寬,降低了系統(tǒng)總線帶寬的壓力,簡化了系統(tǒng)結(jié)構(gòu),提高了性能。
圖1為現(xiàn)有技術(shù)中存儲(chǔ)系統(tǒng)的結(jié)構(gòu)示意圖;圖2為現(xiàn)有技術(shù)中存儲(chǔ)系統(tǒng)的詳細(xì)結(jié)構(gòu)圖;圖3為現(xiàn)有技術(shù)中主機(jī)接口的內(nèi)部結(jié)構(gòu)圖;
圖4為本發(fā)明的磁盤存儲(chǔ)系統(tǒng)結(jié)構(gòu)示意圖;圖5為本發(fā)明的協(xié)議處理單元結(jié)構(gòu)示意圖;圖6為本發(fā)明的高速緩存分布式結(jié)構(gòu)示意圖。
具體實(shí)施例方式
下面結(jié)合附圖及具體實(shí)施例對(duì)本發(fā)明再作進(jìn)一步詳細(xì)的說明。
本發(fā)明的高效存儲(chǔ)系統(tǒng)的結(jié)構(gòu)參見圖4所示。包括主機(jī)接口模塊401、內(nèi)部高速通道402、磁盤接口模塊403和磁盤陣列103。
其中,主機(jī)接口模塊401中包括主機(jī)接口通道404和協(xié)議處理單元405。主機(jī)接口通道404是高速交換網(wǎng)絡(luò)設(shè)備,可以與多個(gè)不同類型主機(jī)的接口相連。同時(shí)主機(jī)接口通道404采用雙路徑冗余設(shè)計(jì),如圖4所示,物理上采用兩條獨(dú)立的主機(jī)接口通道404,每個(gè)主機(jī)接口通道404都單獨(dú)連接所有內(nèi)部協(xié)議處理單元405,即主機(jī)接口通道404與每個(gè)協(xié)議處理單元405之間都通過兩條相互獨(dú)立的路徑連接,兩條路徑之間沒有公共部分,采用負(fù)荷分擔(dān)方式工作,同時(shí)為確保通道路徑的冗余設(shè)計(jì),每條路徑的帶寬可以滿足本業(yè)務(wù)單元的全部業(yè)務(wù),當(dāng)一條路徑中斷時(shí),業(yè)務(wù)可全部走另一條路徑。
主機(jī)對(duì)磁盤的訪問請(qǐng)求經(jīng)過主機(jī)接口通道分配到各協(xié)議處理單元405處理,主機(jī)接口模塊401中可以配置多個(gè)協(xié)議處理單元405,協(xié)議處理單元405與外部主機(jī)的接口卡之間沒有一一對(duì)應(yīng)的關(guān)系,所有協(xié)議處理單元405都可被所有主機(jī)共享;采用全冗余負(fù)荷分擔(dān)方式工作,各主機(jī)的訪問請(qǐng)求由各協(xié)議處理單元405分擔(dān)處理,任何一個(gè)業(yè)務(wù)單元故障,其本身的業(yè)務(wù)都可以由其它業(yè)務(wù)單元承擔(dān);并可以通過增加協(xié)議處理單元405的配置數(shù)量,來提高主機(jī)訪問性能,實(shí)現(xiàn)RAID系統(tǒng)性能擴(kuò)容。
協(xié)議處理單元405的內(nèi)部結(jié)構(gòu)參見圖5所示,主要包括目標(biāo)器302、啟動(dòng)器304和協(xié)議處理器301。由于業(yè)務(wù)單元間采用雙路徑的結(jié)構(gòu),因此本發(fā)明中協(xié)議處理單元405需要兩組目標(biāo)器302和啟動(dòng)器304,并且將在下文中提到的磁盤接口406上的目標(biāo)器302也應(yīng)是兩個(gè)。主機(jī)適配卡303是插在系統(tǒng)外部主機(jī)中的接口卡,當(dāng)主機(jī)訪問磁盤陣列103的時(shí),主機(jī)適配卡303上的啟動(dòng)器304發(fā)出訪問命令,在協(xié)議處理單元405中的目標(biāo)器302收到命令后,將訪問命令發(fā)送到協(xié)議處理器301,協(xié)議處理器301是一個(gè)高性能的CPU,由CPU對(duì)主機(jī)命令協(xié)議進(jìn)行翻譯處理后,送到協(xié)議處理單元405的啟動(dòng)器304,在經(jīng)內(nèi)部高速通道402發(fā)送到磁盤接口406的目標(biāo)器302,通過磁盤接口406對(duì)磁盤進(jìn)行讀寫操作。
另外,本發(fā)明中主機(jī)與主機(jī)接口通道404之間也可采用雙路徑連接,其連接關(guān)系及工作方式也與上述主機(jī)接口通道404和協(xié)議處理單元405之間的雙路徑結(jié)構(gòu)相同,只是在每個(gè)主機(jī)中需要相應(yīng)的配備兩個(gè)主機(jī)適配卡303。
參見圖4,內(nèi)部高速通道402是實(shí)現(xiàn)主機(jī)接口模塊401與磁盤接口模塊403之間無阻塞通信的冗余通道。它與各業(yè)務(wù)單元之間的連接方式及內(nèi)部結(jié)構(gòu)都與主機(jī)接口通道404類似。同樣采用兩個(gè)獨(dú)立的內(nèi)部高速通道402,每條內(nèi)部高速通道402都單獨(dú)與所有主機(jī)接口模塊401中的協(xié)議處理單元405和磁盤接口模塊403中的磁盤接口406相連,路徑之間相互獨(dú)立、負(fù)荷分擔(dān)、并可以替換,可實(shí)現(xiàn)路徑間相互保護(hù)。內(nèi)部高速通道402與主機(jī)接口通道404的內(nèi)部結(jié)構(gòu)也基本相同,均采用高速交換網(wǎng)絡(luò)設(shè)備,如光纖通道交換機(jī)等,在本發(fā)明中內(nèi)部高速通道402和主機(jī)接口通道404采用自行設(shè)計(jì)制作的高速交換網(wǎng)板。
磁盤接口模塊403用于完成磁盤的IO操作,包括磁盤接口406和高速緩存407。磁盤接口406成對(duì)配置,每個(gè)磁盤接口406上掛接一個(gè)大容量高速緩存407共同成為磁盤接口單元,且每對(duì)磁盤接口406上的兩個(gè)高速緩存中的數(shù)據(jù)互為鏡像,互相保存一份鏡像數(shù)據(jù),作為備份,防止因單個(gè)磁盤接口單元403故障而造成數(shù)據(jù)丟失。
磁盤接口406的數(shù)量可以根據(jù)磁盤數(shù)量的多少任意配置,磁盤接口406與主機(jī)接口模塊401中的協(xié)議處理單元405之間沒有一一對(duì)應(yīng)的關(guān)系,根據(jù)磁盤陣列103的規(guī)模和主機(jī)磁盤訪問性能要求,可以增加磁盤接口單元的數(shù)量,以實(shí)現(xiàn)磁盤陣列103的擴(kuò)容。圖4中只示出了一對(duì)磁盤接口406組成的磁盤接口對(duì),含多個(gè)磁盤接口對(duì)的磁盤接口模塊403參見圖6所示。圖6中畫出了三個(gè)磁盤接口對(duì)601,在具體實(shí)施中4~8個(gè)磁盤接口對(duì)601比較合適。高速緩存407采用分布式結(jié)構(gòu),分布在每個(gè)磁盤接口單元中,用于主機(jī)高速訪問性能要求和磁盤低速的機(jī)械操作之間的緩沖,以實(shí)現(xiàn)高速磁盤訪問。磁盤接口406對(duì)高速緩存的訪問通過其內(nèi)部總線,不占用系統(tǒng)帶寬。
當(dāng)主機(jī)發(fā)出磁盤陣列103訪問命令,通過主機(jī)接口通道分配給協(xié)議處理單元405,經(jīng)過協(xié)議處理單元405處理后,經(jīng)內(nèi)部高速通道402將指令發(fā)送給磁盤接口模塊403,再由磁盤接口模塊403對(duì)磁盤陣列103進(jìn)行讀寫操作。對(duì)于寫指令操作,將磁盤接口406接收的數(shù)據(jù)先保存在該磁盤接口406掛接的高速緩存407,再由磁盤接口406將數(shù)據(jù)寫入磁盤陣列103;對(duì)于讀指令操作,磁盤接口406先將數(shù)據(jù)從磁盤陣列103中讀出,保存在所掛接的高速緩存407,再將數(shù)據(jù)傳送給外部主機(jī)。
在本發(fā)明實(shí)施例中主機(jī)接口通道和內(nèi)部高速通道采用光纖通道協(xié)議工作,協(xié)議處理單元和磁盤接口采用SCSI協(xié)議。當(dāng)系統(tǒng)的某個(gè)業(yè)務(wù)單元或連接路徑出現(xiàn)故障時(shí),與之相關(guān)的業(yè)務(wù)單元將會(huì)收到告警,同時(shí)根據(jù)告警信息,自動(dòng)將業(yè)務(wù)處理轉(zhuǎn)移到正常工作的業(yè)務(wù)模塊或連接路徑,以實(shí)現(xiàn)故障隔離與業(yè)務(wù)的自動(dòng)恢復(fù)。
本發(fā)明的技術(shù)方案采用分布式結(jié)構(gòu),分級(jí)處理、業(yè)務(wù)負(fù)荷分擔(dān)模式。系統(tǒng)結(jié)構(gòu)包括主機(jī)接口、內(nèi)部高速通道、磁盤接口??蓪?shí)現(xiàn)體系結(jié)構(gòu)無單點(diǎn)故障,系統(tǒng)故障自動(dòng)隔離和自動(dòng)恢復(fù)。
權(quán)利要求
1.一種磁盤存儲(chǔ)系統(tǒng),至少包括主機(jī)接口模塊、高速緩存、磁盤接口和磁盤陣列,其特征在于所述主機(jī)接口模塊包括具有交換功能的主機(jī)接口通道和一個(gè)以上的協(xié)議處理單元,每個(gè)外部主機(jī)通過主機(jī)接口通道與每個(gè)協(xié)議處理單元連接;進(jìn)一步包括用于協(xié)議處理單元與磁盤接口間信息傳輸具有交換功能的內(nèi)部高速通道;每個(gè)協(xié)議處理單元通過內(nèi)部高速通道與每個(gè)磁盤接口連接,且每個(gè)磁盤接口上掛接有高速緩存;磁盤接口與磁盤陣列相連。
2.根據(jù)權(quán)利要求1所述的存儲(chǔ)系統(tǒng),其特征在于所述主機(jī)接口通道與協(xié)議處理單元之間通過雙路徑連接。
3.根據(jù)權(quán)利要求2所述的存儲(chǔ)系統(tǒng),其特征在于所述主機(jī)接口模塊包括兩個(gè)互為獨(dú)立的主機(jī)接口通道,每個(gè)主機(jī)接口通道均與所有協(xié)議處理單元連接。
4.根據(jù)權(quán)利要求1所述的存儲(chǔ)系統(tǒng),其特征在于所述協(xié)議處理單元與內(nèi)部高速通道之間通過雙路徑連接,內(nèi)部高速通道與磁盤接口之間通過雙路徑連接。
5.根據(jù)權(quán)利要求4所述的存儲(chǔ)系統(tǒng),其特征在于所述內(nèi)部高速通道為兩個(gè)互為獨(dú)立的內(nèi)部高速通道,每個(gè)內(nèi)部高速通道與所有協(xié)議處理單元連接,且每個(gè)內(nèi)部高速通道與所有磁盤接口連接。
6.根據(jù)權(quán)利要求1或4所述的存儲(chǔ)系統(tǒng),其特征在于所述磁盤接口兩兩成對(duì)配置,每對(duì)磁盤接口上的高速緩存互為鏡像,互為鏡像的高速緩存互相保存一份鏡像數(shù)據(jù)。
7.根據(jù)權(quán)利要求6所述的存儲(chǔ)系統(tǒng),其特征在于所述磁盤接口的對(duì)數(shù)為4~8對(duì)。
8.根據(jù)權(quán)利要求1所述的存儲(chǔ)系統(tǒng),其特征在于所述主機(jī)接口通道為高速交換網(wǎng)設(shè)備。
9.根據(jù)權(quán)利要求1所述的存儲(chǔ)系統(tǒng),其特征在于所述內(nèi)部高速通道為高速交換網(wǎng)設(shè)備。
10.根據(jù)權(quán)利要求8或9所述的存儲(chǔ)系統(tǒng),其特征在于所述高速交換網(wǎng)設(shè)備為光纖通道交換機(jī)。
11.根據(jù)權(quán)利要求1所述的存儲(chǔ)系統(tǒng),其特征在于所述協(xié)議處理單元包括用于處理主機(jī)訪問請(qǐng)求的協(xié)議處理器,與外部主機(jī)進(jìn)行信息交互的目標(biāo)器,及與磁盤接口進(jìn)行信息交互的啟動(dòng)器,目標(biāo)器和啟動(dòng)器連接在協(xié)議處理器上,目標(biāo)器與主機(jī)接口通道連接,啟動(dòng)器與內(nèi)部高速通道連接。
12.根據(jù)權(quán)利要求2所述的存儲(chǔ)系統(tǒng),其特征在于協(xié)議處理單元與內(nèi)部高速通道之間通過雙路徑連接,協(xié)議處理單元含有兩個(gè)目標(biāo)器和啟動(dòng)器,兩個(gè)目標(biāo)器分別連接在主機(jī)接口通道與協(xié)議處理單元之間的兩條路徑上,兩個(gè)協(xié)議處理器分別連接在協(xié)議處理單元與內(nèi)部高速通道之間的兩條路徑上。
13.根據(jù)權(quán)利要求12所述的存儲(chǔ)系統(tǒng),其特征在于所述磁盤接口含有兩個(gè)與協(xié)議處理單元進(jìn)行信息交互的目標(biāo)器,兩個(gè)目標(biāo)器分別連接在內(nèi)部高速通道與磁盤接口之間的兩條路徑上。
全文摘要
本發(fā)明公開了一種磁盤存儲(chǔ)系統(tǒng),至少包括主機(jī)接口模塊、高速緩存、磁盤接口和磁盤陣列,其中所述主機(jī)接口模塊包括具有交換功能的主機(jī)接口通道和一個(gè)以上的協(xié)議處理單元,每個(gè)外部主機(jī)通過主機(jī)接口通道與每個(gè)協(xié)議處理單元連接;進(jìn)一步包括用于協(xié)議處理單元與磁盤接口間信息傳輸具有交換功能的內(nèi)部高速通道;每個(gè)協(xié)議處理單元通過內(nèi)部高速通道與每個(gè)磁盤接口連接,且每個(gè)磁盤接口上掛接有高速緩存;磁盤接口與磁盤陣列相連。該存儲(chǔ)系統(tǒng)通過采用分布式結(jié)構(gòu),分級(jí)處理、業(yè)務(wù)負(fù)荷分擔(dān)工作模式,消除了帶寬瓶頸,提高數(shù)據(jù)傳輸速度,并增加保護(hù)機(jī)制,提高系統(tǒng)可靠性。
文檔編號(hào)G06F13/42GK1519736SQ0310246
公開日2004年8月11日 申請(qǐng)日期2003年1月24日 優(yōu)先權(quán)日2003年1月24日
發(fā)明者鄭珉, 胡鵬, 鄭 珉 申請(qǐng)人:華為技術(shù)有限公司