專利名稱:一種基于cpu/mic異構(gòu)體系結(jié)構(gòu)的高效能系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及高性能計算領(lǐng)域,具體地說是一種基于CPU/MIC異構(gòu)體系結(jié)構(gòu)的 聞效能系統(tǒng)。
背景技術(shù):
高性能計算是信息領(lǐng)域的前沿高技術(shù),隨著信息化社會的飛速發(fā)展,人類對信息處理能力的要求越來越高 ,不僅石油勘探、氣象預(yù)報、航天國防、科學研究等需求高性能計算,而金融、政府信息化、教育、企業(yè)、網(wǎng)絡(luò)游戲等更廣泛的領(lǐng)域?qū)Ω咝阅苡嬎愕男枨笱该驮鲩L。計算速度對于高性能計算尤為重要,高性能計算將朝多核、眾核發(fā)展,采用異構(gòu)并行提升應(yīng)用計算速度,目前CPU+GPU是非常成熟的異構(gòu)協(xié)同計算模式,但由于GPU在編程效率、細粒度并行算法、大規(guī)模并行性能上都存在巨大挑戰(zhàn)。MIC (Many Integrated Core)是Intel公司開發(fā)的,用于高性能并行計算的眾核芯片。它是從已有的Xeon處理器產(chǎn)品基礎(chǔ)上發(fā)展而來,它專為超高性能計算而生的新架構(gòu)。MIC在計算機體系中,作為CPU的協(xié)處理器而存在。MIC芯片通常有50個以上精簡的x86核心,每個core支持4個硬件線程,可并行執(zhí)行的任務(wù)數(shù)達到200以上,提供高度并行的計算能力,其雙精峰值性能達到lTFlops。MIC技術(shù)將加快高性能計算的發(fā)展,快速解決高性能計算應(yīng)用的性能瓶頸。
發(fā)明內(nèi)容
本發(fā)明鑒于現(xiàn)有計算機異構(gòu)并行提升效能中存在的不足之處,及MIC眾核芯片具有高性能并行計算的特點,提供一種基于CPU/MIC異構(gòu)體系結(jié)構(gòu)的高效能系統(tǒng)。本發(fā)明所提出的系統(tǒng)針對高性能計算應(yīng)用,采用CPU/MIC異構(gòu)體系結(jié)構(gòu),融合了CPU平臺的多核計算能力與MIC的眾核計算能力,解決了高性能計算應(yīng)用的性能瓶頸。該系統(tǒng)是按如下方式解決所述技術(shù)問題的整個系統(tǒng)設(shè)計包括三個方面硬件部分設(shè)計、系統(tǒng)環(huán)境配置及軟件部分設(shè)計;該系統(tǒng)實現(xiàn)軟硬件一體化設(shè)計,采用CPU/MIC異構(gòu)體系結(jié)構(gòu),其中CPU參加邏輯計算和密集核心計算,而MIC僅參與核心密集計算,通過CPU與MIC共同計算,實現(xiàn)性能最大化。下面對該系統(tǒng)的組成部分分別進行說明
(1)硬件部分設(shè)計
a)系統(tǒng)的每個節(jié)點采用雙路,能支持兩塊CPU同時工作;
b)系統(tǒng)帶有兩個以上PCIE插槽,能插兩塊MIC卡;
c)系統(tǒng)的內(nèi)存配置要大,是原有CPU系統(tǒng)的2倍以上;
d)系統(tǒng)的每個節(jié)點功耗能支持1300 以上;
(2)系統(tǒng)環(huán)境配置
a)操作系統(tǒng)能支持MIC,需要安裝Linux操作系統(tǒng);b)編譯器能支持MIC,采用Intel的icc、icpc、ifort編譯器;
c)支持MIC的驅(qū)動;
(3)軟件部分設(shè)計
a)選擇高性能計算應(yīng)用算法;
b)對原有應(yīng)用分析,若原有程序?qū)崿F(xiàn)是采用單線程運行在CPU平臺,則首先利用CPU多核平臺,采用OpenMP編程模型把應(yīng)用程序以多線程方式實現(xiàn);
c)然后在CPU多線程程序基礎(chǔ)上在MIC卡上實現(xiàn)線程擴展,采用120個線程并行,使其在MIC上并行執(zhí)行;
d)把整個系統(tǒng)的計算能力劃分為3個設(shè)備第一塊MIC卡作為設(shè)備0,第二塊MIC卡作為設(shè)備1,兩塊CPU作為設(shè)備2 ;
e)把整個計算任務(wù)按照這三個設(shè)備的計算能力進行劃分,使三個設(shè)備同時并行計算,實現(xiàn)CPU與MIC同時計算,并保證負載均衡。本發(fā)明的一種基于CPU/MIC異構(gòu)體系結(jié)構(gòu)的高效能系統(tǒng)的有益效果是該系統(tǒng)通過CPU與MIC協(xié)同計算,解決了高性能計算應(yīng)用的性能瓶頸和功耗問題,具有高性能、低功耗的特點,且降低了機房構(gòu)建成本和管理、運行、維護費用。
附圖1為本發(fā)明所述系統(tǒng)的計算設(shè)備劃分示意圖。
具體實施例方式為了使本發(fā)明的目的、技術(shù)方案更加清晰,下面結(jié)合附圖和實施例,對本發(fā)明作進一步詳細說明。本發(fā)明的目的在于利用CPU/MIC異構(gòu)體系結(jié)構(gòu)實現(xiàn)一種高效能系統(tǒng),整個系統(tǒng)設(shè)計主要由硬件部分設(shè)計、系統(tǒng)環(huán)境配置及軟件部分設(shè)計三部分組成。該系統(tǒng)通過實現(xiàn)軟硬件一體化設(shè)計,采用CPU/MIC異構(gòu)體系結(jié)構(gòu),融合了 CPU平臺的多核計算能力與MIC的眾核計算能力,其中CPU參加邏輯計算和密集核心計算,而MIC僅參與核心密集計算,CPU與MIC共同計算,實現(xiàn)性能最大化。下面對本發(fā)明的整個系統(tǒng)設(shè)計的各個部分進行說明
(1)硬件部分設(shè)計
a)系統(tǒng)的每個節(jié)點采用雙路,支持兩塊CPU同時工作;
b)系統(tǒng)帶有兩個以上PCIE插槽,能夠插兩塊MIC卡;
c)系統(tǒng)的內(nèi)存配置要大,是原有CPU系統(tǒng)的2倍以上;
d)系統(tǒng)的每個節(jié)點功耗支持1300 以上;
(2)系統(tǒng)環(huán)境配置
d)操作系統(tǒng)要求支持MIC,需要安裝Linux操作系統(tǒng);
e)編譯器支持MIC,采用Intel的icc、icpc、ifort編譯器;
f)支持MIC的驅(qū)動;
(3)軟件部分設(shè)計
此系統(tǒng)要實現(xiàn)高效,必須軟硬件一體化設(shè)計,讓應(yīng)用軟件運行跑在此系統(tǒng)上效率最高,整個軟件部分設(shè)計如下
a)選擇高性能計算應(yīng)用算法,此算法有高并行任務(wù),并行任務(wù)之間數(shù)據(jù)無依賴,并行性好,整個應(yīng)用對系統(tǒng)性能要求高;
b)對原有應(yīng)用分析,當原有程序?qū)崿F(xiàn)是采用單線程運行在CPU平臺上時,則首先利用CPU多核平臺;采用OpenMP編程模型把應(yīng)用程序以多線程方式實現(xiàn),使其兩塊CPU的所有核的計算能力全部發(fā)揮出來;
c)然后在CPU多線程程序基礎(chǔ)上在MIC卡上實現(xiàn)線程擴展,采用120各線程并行,使其在MIC上并行執(zhí)行,發(fā)揮出MIC眾核的計算能力;
d)把整個系統(tǒng)的計算能力劃分為3個設(shè)備第一塊MIC卡作為設(shè)備0,第二塊MIC卡作為設(shè)備1,兩塊CPU作為設(shè)備2 ;如圖1所示;
e)把整個計算任務(wù)按照這三個設(shè)備的計算能力進行劃分,使三個設(shè)備同時并行計算,實現(xiàn)CPU與MIC同時計算,并保證負載均衡,整個系統(tǒng)實現(xiàn)高性能。實施例
下面通過一個實施例來詳細說明該高效能系統(tǒng)的技術(shù)特點和優(yōu)點。該實施例中高效能系統(tǒng)如下設(shè)計。(I)硬件部分設(shè)計
a)系統(tǒng)的每個節(jié)點采用雙路,支持兩塊CPU同時工作,本實施過程系統(tǒng)采用2塊intel Xeon56756 核 CPU,主頻為 3. 07GHz ;
b)系統(tǒng)帶有兩個以上PCIE插槽,能夠插2塊MIC卡,本系統(tǒng)采用2塊MIC卡,每個卡上有30個核心;
c)系統(tǒng)的內(nèi)存配置要大,本系統(tǒng)每個節(jié)點配置96GB內(nèi)存;
d)系統(tǒng)的每個節(jié)點功耗支持1300 以上,保證整個系統(tǒng)正常運轉(zhuǎn),本系統(tǒng)最大功率支持1300w。(2)系統(tǒng)環(huán)境配置
a)操作系統(tǒng)要求支持MIC,本實施過程采用Red Hat Enterprise Linux 6.0 GA64-bit kernel 2.6. 32-71 ;
b)編譯器支持MIC,采用 Intel 編譯器 l_ccompxe_2013_beta. 0. 047 ;
c)支持MIC 的驅(qū)動,采用 KNC-AlphaUpdate 1-2.1. 2430-9。(3)軟件部分設(shè)計
a)選擇地震疊前時間偏移(PSTM)作為我們應(yīng)用的實施的高性能計算應(yīng)用,此應(yīng)用算法的并行任務(wù)達到幾十萬,并行任務(wù)之間數(shù)據(jù)無依賴,并行性好,其對性能要求高;
b)原有PSTM程序以單線程運行在CPU平臺,首先利用CPU多核平臺,采用OpenMP編程模型把它以多線程方式實現(xiàn),把所用計算任務(wù)采用16個線程并行起來,使2塊CPU的所有核的計算能力全部發(fā)揮出來;
c)然后在PSTMCPU多線程并行程序基礎(chǔ)上在MIC卡上實現(xiàn)線程擴展,把所有計算任務(wù)數(shù)采用120個線程并行起來,使其在MIC上并行執(zhí)行,發(fā)揮出MIC眾核的計算能力;
d)把整個系統(tǒng)的計算能力劃分為3個設(shè)備, 第一塊MIC卡作為設(shè)備0,啟動120個線程,第二塊MIC卡作為設(shè)備1,啟動120個線程,2塊CPU作為設(shè)備2,啟動16個線程;如附圖1所示; e)把整個PSTM的計算任務(wù)按照這三個設(shè)備的計算能力進行劃分,使三個設(shè)備同時并行計算,即這256個線程會共同參與計算,達到CPU與MIC同時計算的效果,并且保證負載均衡,整個系統(tǒng)實現(xiàn)高性能。(4)性能及正確性測試
測試91條測線,每條測線上963個CMP點,輸入110000道數(shù)據(jù)進行偏移,在原有CPU同構(gòu)系統(tǒng)下,PSTM以單線程串行方式花費的時間為76053s,而本系統(tǒng)運行時間為1075s,性能大大提升。CPU串行版PSTM運行的效果與本系統(tǒng)運行的效果基本一致,運行結(jié)果正確。從實施例可以看出整個系統(tǒng)實現(xiàn)高性能、低功耗,大大滿足了高性能應(yīng)用的科研要求和工業(yè)生產(chǎn)要求,并且減少了機房構(gòu)建成本和管理、運行、維護費用。除說明書所述技術(shù)特征之外,均為本專業(yè)技術(shù)人員的已知技術(shù)。
權(quán)利要求
1.一種基于CPU/MIC異構(gòu)體系結(jié)構(gòu)的高效能系統(tǒng),其特征在于整個系統(tǒng)設(shè)計包括三個方面硬件部分設(shè)計、系統(tǒng)環(huán)境配置及軟件部分設(shè)計; 該系統(tǒng)實現(xiàn)軟硬件一體化設(shè)計,采用CPU/MIC異構(gòu)體系結(jié)構(gòu),融合了 CPU平臺的多核計算能力與MIC的眾核計算能力,其中CPU參加邏輯計算和密集核心計算,而MIC僅參與核心密集計算,通過CPU與MIC共同計算,實現(xiàn)性能最大化。
2.根據(jù)權(quán)利要求1所述的高效能系統(tǒng),其特征在于所述硬件部分設(shè)計如下 系統(tǒng)的每個節(jié)點采用雙路,能支持兩塊CPU同時工作; 系統(tǒng)帶有兩個以上PCIE插槽,能插兩塊MIC卡; 系統(tǒng)的內(nèi)存配置要大,是原有CPU系統(tǒng)的2倍以上; 系統(tǒng)的每個節(jié)點功耗能支持1300 以上。
3.根據(jù)權(quán)利要求1所述的高效能系統(tǒng),其特征在于所述系統(tǒng)環(huán)境配置如下 操作系統(tǒng)能支持MIC,需要安裝Linux操作系統(tǒng); 編譯器能支持MIC,采用Intel的icc、icpc、ifort編譯器; 支持MIC的驅(qū)動。
4.根據(jù)權(quán)利要求1所述的高效能系統(tǒng),其特征在于所述軟件部分設(shè)計如下 選擇高性能計算應(yīng)用算法; 對原有應(yīng)用分析,若原有程序?qū)崿F(xiàn)是采用單線程運行在CPU平臺,則首先利用CPU多核平臺,采用OpenMP編程模型把應(yīng)用程序以多線程方式實現(xiàn); 然后在CPU多線程程序基礎(chǔ)上在MIC卡上實現(xiàn)線程擴展,采用120個線程并行,使其在MIC上并行執(zhí)行; 把整個系統(tǒng)的計算能力劃分為3個設(shè)備第一塊MIC卡作為設(shè)備0,第二塊MIC卡作為設(shè)備I,兩塊CPU作為設(shè)備2 ; 把整個計算任務(wù)按照這三個設(shè)備的計算能力進行劃分,使三個設(shè)備同時并行計算,實現(xiàn)CPU與MIC同時計算,并保證負載均衡。
全文摘要
本發(fā)明提供了一種基于CPU/MIC異構(gòu)體系結(jié)構(gòu)的高效能系統(tǒng),涉及到計算機高性能計算領(lǐng)域。本發(fā)明的整個系統(tǒng)設(shè)計包括三個方面硬件部分設(shè)計、系統(tǒng)環(huán)境配置及軟件部分設(shè)計;該系統(tǒng)實現(xiàn)軟硬件一體化設(shè)計,采用CPU/MIC異構(gòu)體系結(jié)構(gòu),融合了CPU平臺的多核計算能力與MIC的眾核計算能力,其中CPU參加邏輯計算和密集核心計算,而MIC僅參與核心密集計算,通過CPU與MIC共同計算,實現(xiàn)性能最大化。本發(fā)明的有益效果是該系統(tǒng)通過CPU與MIC協(xié)同計算,解決了高性能計算應(yīng)用的性能瓶頸和功耗問題,具有高性能、低功耗的特點,且降低了機房構(gòu)建成本和管理、運行、維護費用。
文檔編號G06F9/50GK103049329SQ201210475848
公開日2013年4月17日 申請日期2012年11月22日 優(yōu)先權(quán)日2012年11月22日
發(fā)明者張清, 張廣勇 申請人:浪潮電子信息產(chǎn)業(yè)股份有限公司