專利名稱:用于集群系統(tǒng)的節(jié)點機遠程克隆方法
技術領域:
本發(fā)明屬于計算機應用領域,是一種用于集群系統(tǒng)的節(jié)點機遠程克隆技術。
隨著集群系統(tǒng)規(guī)模的增大,節(jié)點機上的操作系統(tǒng)和應用軟件的安裝成了一個繁重、累贅、重復的體力勞動。對于節(jié)點機個數(shù)在一百個以上的集群系統(tǒng),這種安裝過程往往需要幾個星期,其中所耗費的時間主要是安裝過程中的人機交互,而且在人機交互的過程中難免由于操作人員的疲勞而出差錯,某些諸如硬盤分區(qū)的差錯可能導致安裝工作的重做,還會導致安裝模塊的不一致。在這種情況下,需要提出一個很好的解決方案,使得安裝的過程自動化,也就是最大限度地減少安裝過程中的人機交互。有人提出了一種單一節(jié)點上的硬盤復制方案,其技術要點是母盤和要復制的硬盤安裝在同一臺機器上,然后通過硬盤之間所有的扇區(qū)復制來達到硬盤復制的目的。該方案只能解決本地硬盤復制問題,而且每次只能復制一塊硬盤。
可以認為硬盤間的復制是一個較好的解決方案,但是只適用于單機,且每次只能復制一個節(jié)點,復制的過程還要比較多的人機交互如硬盤的插拔、目的硬盤的選擇、源盤所在節(jié)點的頻繁重新啟動等,因此它的易用性還不夠。
本發(fā)明的目的是針對現(xiàn)有技術中的不足,實現(xiàn)基于集群服務器的本地或者異地硬盤復制,而且可以多塊硬盤并行復制。
本發(fā)明所說的用于集群系統(tǒng)的節(jié)點機遠程克隆方法是按照下述方法實現(xiàn)的,其結構圖如
圖1。位于上面的方框是克隆服務器1,該服務器上安裝有一塊固定的母盤2和一塊固定的系統(tǒng)盤3,下面方框是同時進行克隆的節(jié)點1到節(jié)點n,每個節(jié)點機4的網(wǎng)卡5上插有一塊Flash ROM或者EPROM 6,這些只讀存儲器里面存放著節(jié)點機的啟動映像。服務器1和節(jié)點機4通過網(wǎng)絡相連。在所說的用于集群系統(tǒng)的節(jié)點機遠程克隆方法發(fā)明中包含有三個軟件1.克隆服務器端軟件(安裝在克隆服務器上)2.克隆客戶端軟件(安裝在克隆服務器上,待節(jié)點機啟動后上傳到節(jié)點機上運行)
3.節(jié)點機啟動映像(寫入到節(jié)點機網(wǎng)卡上的Flash ROM或者EPROM上,用于啟動節(jié)點機)本發(fā)明所說的用于集群系統(tǒng)的節(jié)點機遠程克隆方法為節(jié)點機在加電自舉后,BIOS檢測到網(wǎng)卡5上的EPROM 6,然后把計算機的控制權轉給EPROM 6里面的啟動映像,該映像在網(wǎng)絡上每隔幾秒鐘廣播一個報文,克隆服務器1接收到這個報文后,通過DHCP協(xié)議給該節(jié)點機4分配一個IP,節(jié)點機4利用這個IP把克隆服務器1上經(jīng)過修改的Linux內(nèi)核映像通過TFTP協(xié)議下載到本機并且在本機上啟動該映像,等到該映像啟動完畢,一個簡潔的Linux系統(tǒng)就在節(jié)點機4上運行。經(jīng)過修改的Linux內(nèi)核會立刻啟動克隆程序的客戶端,客戶端會自動地和服務器連接,當用戶指定目的硬盤7后便開始網(wǎng)絡間硬盤的復制,也就是所提到的克隆。
本發(fā)明所說的用于集群系統(tǒng)的節(jié)點機遠程克隆方法所用到的包Etherboot 4.7.6DHCPTFTPNFSClone PacketEtherboot主要是用來生成寫在EPROM或者是Flash ROM上啟動的映像,而該EPROM/Flash ROM插在網(wǎng)卡上的Boot ROM插槽上。DHCP是動態(tài)主機配置協(xié)議(Dynamic Host Configuration Protocol)的簡寫,它被安裝到克隆服務器上,并且通過文件/etc/dhcpd.conf來配置,通過命令dhcpd-d-f來啟動,主要是根據(jù)節(jié)點機上網(wǎng)卡的硬件地址來指定節(jié)點機的IP地址。節(jié)點機通過啟動映像啟動后,就會在網(wǎng)絡上查找啟動了DHCP服務的主機(克隆服務器)。該主機根據(jù)DHCP配置文件/etc/dhcpd.conf給該節(jié)點機分配一個有效的IP地址。節(jié)點機使用這個IP地址,通過TFTP(一般的文件傳輸協(xié)議Trivial FileTransfer Protocol)從主機上下載經(jīng)過修改的Linux內(nèi)核映像,而主機上必須啟動TFTP服務,具體的配置文件是/etc/inet.conf。所說的修改的Linux內(nèi)核,主要修改了以下部分把啟動shell的語句替換成啟動Clone Packet。節(jié)點機在啟動Linux內(nèi)核完畢后,自動裝載克隆服務器上輸出的網(wǎng)絡文件系統(tǒng)作為本機的文件系統(tǒng),這是通過配置克隆服務器上的NFS服務來實現(xiàn)的。這一切完成后,節(jié)點機運行克隆客戶端程序,該程序和克隆服務器端程序通信,他們各自打開本地的磁盤設備,在建立連接后進行扇區(qū)之間的復制。
所說的克隆服務器有以下優(yōu)點1.多個節(jié)點機可以同時進行克隆。當多個節(jié)點機同時要求進行克隆的時候,克隆服務器可以同時和他們建立聯(lián)接并進行硬盤間的數(shù)據(jù)傳輸。
2.節(jié)點之間的克隆完全自動地進行,用戶所要做的只是打開節(jié)點機的電源、敲入一個回車來選擇目的盤,之后的事就完全由克隆服務器和克隆客戶程序自動完成。
3.由克隆服務器端提供的直觀的圖形界面、可讓用戶方便地查看克隆進行的狀況。
4.可避免安裝過程中由于人機交互而導致的出錯以及模塊之間的不一致性。
圖1克隆服務器和克隆客戶的工作流程。
實施例利用本發(fā)明所說的克隆技術,在具有16個節(jié)點機上的集群系統(tǒng)實現(xiàn)了克隆,節(jié)點機和克隆服務器的具體配置如下
在每個節(jié)點機上安裝下列系統(tǒng)和應用程序RedHat Linux 6.1K Development 1.2Qmail 1.03PVM 3.4.2JIAJIA 2.1MySQLSnortFTP ServerApache Server
如果依照現(xiàn)有技術進行人工安裝,每安裝和配置一個節(jié)點需要5個人時,如果采用單機版的硬盤復制工具,安裝16個節(jié)點需要32次硬盤的拆卸和安裝、16次操作系統(tǒng)的重新啟動,因為每一次只能復制一塊硬盤,而每次復制時間大概要1個小時,再加上上述繁雜的手工操作,整個安裝過程需要兩個工作日的時間。
如果采用本發(fā)明所說的克隆技術,每克隆一個節(jié)點大概需要1個小時20分鐘,但是由于允許多個節(jié)點同時進行克隆,如果在實現(xiàn)的過程中讓4個節(jié)點同時克隆,這樣,每個節(jié)點克隆的時間變?yōu)?個小時,時間雖然變長,但是因為有4個節(jié)點同時克隆,實際上克隆的時間大大變短,變?yōu)?0分鐘/節(jié)點,這主要得益于Linux讀取硬盤時使用了緩沖區(qū)。這樣一來,整個安裝過程只需要8個小時。
附圖中的剖面線部分,標記6表示為插在網(wǎng)卡上面的Flash ROM或者EPROM。
權利要求
1.一種用于集群系統(tǒng)的節(jié)點機遠程克隆方法,其特征在于,所說的集群系統(tǒng)的節(jié)點機遠程克隆方法是在克隆服務器安裝有固定的母盤和固定的系統(tǒng)盤;對同時進行克隆的節(jié)點1到節(jié)點n,每個節(jié)點機的網(wǎng)卡上插有一塊FlashROM或者EPROM,這些只讀存儲器里面存放著節(jié)點機的啟動映像;服務器和節(jié)點機通過網(wǎng)絡相連;所說的節(jié)點機遠程克隆方法中包含三個軟件a.安裝在克隆服務器上的克隆服務器端軟件;b.安裝在克隆服務器上,待節(jié)點機啟動后上傳到節(jié)點機上運行的克隆客戶端軟件;c.寫入到節(jié)點機網(wǎng)卡上的Flash ROM或者EPROM上,用于啟動節(jié)點機的節(jié)點機啟動映像;本發(fā)明所說的用于集群系統(tǒng)的節(jié)點機遠程克隆方法為節(jié)點機在加電自舉后,BIOS檢測到網(wǎng)卡上的EPROM,然后把計算機的控制權轉給EPROM里面的啟動映像,該映像在網(wǎng)絡上每隔幾秒鐘廣播一個報文,克隆服務器接收到這個報文后,通過DHCP協(xié)議給該節(jié)點機分配一個IP,節(jié)點機利用這個IP把克隆服務器上經(jīng)過修改的Linux內(nèi)核映像通過TFTP協(xié)議下載到本機并且在本機上啟動該映像,等到該映像啟動完畢,一個簡潔的Linux系統(tǒng)就在節(jié)點機上運行;經(jīng)過修改的Linux內(nèi)核會立刻啟動克隆程序的客戶端,客戶端會自動地和服務器連接,當用戶指定目的硬盤后便開始網(wǎng)絡間硬盤的復制;
2.按照權利要求1所說的用于集群系統(tǒng)的節(jié)點機遠程克隆方法,其特征在于,所用到的包有Etherboot 4.7.6;DHCP;TFTP;NFS;Clone Packet。
3.按照權利要求2所說的用于集群系統(tǒng)的節(jié)點機遠程克隆方法,其特征在于,所說的Etherboot主要是用來生成寫在EPROM或者是Flash ROM上啟動的映像,而該EPROM/Flash ROM插在網(wǎng)卡上的Boot ROM插槽上。
4.按照權利要求2所說的用于集群系統(tǒng)的節(jié)點機遠程克隆方法,其特征在于,所說的DHCP是動態(tài)主機配置協(xié)議,它被安裝到克隆服務器上,并且通過文件/etc/dhcpd.conf來配置,通過命令dhcpd-d-f來啟動,根據(jù)節(jié)點機上網(wǎng)卡的硬件地址來指定節(jié)點機的IP地址。
5.按照權利要求2所說的用于集群系統(tǒng)的節(jié)點機遠程克隆方法,其特征在于,所說的節(jié)點機通過啟動映像啟動后,在網(wǎng)絡上查找啟動了DHCP服務的主機即克隆服務器。該主機根據(jù)DHCP配置文件/etc/dhcpd.conf給該節(jié)點機分配一個有效的IP地址。
6.按照權利要求2所說的用于集群系統(tǒng)的節(jié)點機遠程克隆方法,其特征在于,所說的節(jié)點機使用'地址,通過TFTP從主機上下載經(jīng)過修改的Linux內(nèi)核映像,而主機上必須啟動TFTP服務,具體的配置文件是/etc/inet.conf。
7.按照權利要求2所說的用于集群系統(tǒng)的節(jié)點機遠程克隆方法,其特征在于,所說的修改的Linux內(nèi)核,主要修改了以下部分把啟動shell的語句替換成啟動的Clone Packet。
全文摘要
一種用于集群系統(tǒng)的節(jié)點機遠程克隆方法,在克隆服務器安裝有固定的母盤和固定的系統(tǒng)盤;對同時進行克隆的節(jié)點1到節(jié)點n,每個節(jié)點機的網(wǎng)卡上插有一塊Flash ROM或者EPROM,服務器和節(jié)點機通過網(wǎng)絡相連;在克隆方法中含三個軟件:克隆服務器端軟件、克隆客戶端軟件、節(jié)點機啟動映像。所說的克隆方法是:通過DHCP協(xié)議給節(jié)點機分配IP,利用這個IP把經(jīng)過修改的Linux內(nèi)核映像下載到本機并啟動該映像,啟動克隆程序的客戶端自動地和服務器連接,當指定目的硬盤后便開始網(wǎng)絡間硬盤的復制。
文檔編號G06F9/46GK1308275SQ0110648
公開日2001年8月15日 申請日期2001年2月15日 優(yōu)先權日2001年2月15日
發(fā)明者金海 , 江文毅, 龐麗萍 申請人:華中科技大學