一種基于多fpga平臺的ncs算法并行化的方法
【專利摘要】本發(fā)明涉及一種基于多FPGA平臺的NCS算法并行化的方法,包括子孔徑處理與合成孔徑處理,所述子孔徑處理與合成孔徑處理通過兩級流水線并行處理;所述子孔徑處理中采用流水并行處理方式;所述子孔徑處理與合成孔徑處理中相互獨立的若干數(shù)據(jù)處理任務(wù)分配在若干個芯片中并行執(zhí)行。有益效果為:利用了多核硬件架構(gòu),將將運算任務(wù)劃分為多個子任務(wù)分配到不同芯片的處理單元中分別處理,從而實現(xiàn)任務(wù)處理的并行化,有效的提高了片上軟件的效率。
【專利說明】—種基于多FPGA平臺的NCS算法并行化的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及NCS算法的并行化方法,尤其涉及一種基于多FPGA平臺的NCS算法并行化的方法。
【背景技術(shù)】
[0002]合成孔徑雷達(SAR)成像已經(jīng)廣泛運用在國民經(jīng)濟和軍事各個領(lǐng)域。常規(guī)的SAR成像算法有RD算法以及CS算法等,但是RD算法難以滿足對分辨率要求高的大場景、大斜視的雷達成像要求,而CS算法在大斜視角的情況下將引起很大的散焦,因此NCS算法在此基礎(chǔ)上應(yīng)運而生。傳統(tǒng)的串行算法效率比較低,很難達到實時成像的要求。引入子孔徑結(jié)構(gòu)的NCS算法,可以更好的適應(yīng)更大的斜視角,并能更容易的進行任務(wù)并行化,提高效率。但是現(xiàn)有的NCS算法片上軟件的運算效率低下,對存儲器的讀取速度以及處理器性能要求較聞。
【發(fā)明內(nèi)容】
[0003]本發(fā)明目的在于克服以上現(xiàn)有技術(shù)之不足,提供一種基于多FPGA平臺的NCS算法并行化的方法,具體有以下技術(shù)方案實現(xiàn):
所述基于多FPGA平臺的NCS算法并行化的方法,包括子孔徑處理與合成孔徑處理,
所述子孔徑處理與合成孔徑處理通過兩級流水線并行處理;
所述子孔徑處理中采用流水并行處理方式;
所述子孔徑處理與合成孔徑處理中相互獨立的若干數(shù)據(jù)處理任務(wù)分配在若干個芯片中并行執(zhí)行。
[0004]所述基于多FPGA平臺的NCS算法并行化的方法的進一步設(shè)計在于,所述芯片為FPGA芯片。
[0005]所述基于多FPGA平臺的NCS算法并行化的方法的進一步設(shè)計在于,所述FPGA芯片為四片。
[0006]所述基于多FPGA平臺的NCS算法并行化的方法的進一步設(shè)計在于,采用兩片F(xiàn)PGA芯片做子孔徑處理,另外兩片做合成孔徑,形成兩級流水.所述基于多FPGA平臺的NCS算法并行化的方法的進一步設(shè)計在于,每片F(xiàn)PGA芯片內(nèi)部集成4個運算簇單元,所述子孔徑處理與合成孔徑處理中的數(shù)據(jù)處理平均分配至各運算簇單元處理。
[0007]所述基于多FPGA平臺的NCS算法并行化的方法的進一步設(shè)計在于,處理孔徑部分的兩片F(xiàn)PGA芯片,每片芯片處理半幅圖的源數(shù)據(jù),每次子孔徑完成4M Byte的數(shù)據(jù)處理。
[0008]所述基于多FPGA平臺的NCS算法并行化的方法的進一步設(shè)計在于,處理孔徑部分的兩片F(xiàn)PGA芯片分別處理奇數(shù)次的子孔徑運算與偶數(shù)次的子孔徑運算。
[0009]本發(fā)明的優(yōu)點如下:
本發(fā)明提供的基于多FPGA平臺的NCS算法并行化的方法充分利用了多核硬件架構(gòu),將將運算任務(wù)劃分為多個子任務(wù)分配到不同芯片的處理單元中分別處理,從而實現(xiàn)任務(wù)處理的并行化,有效的提高了片上軟件的效率。
【專利附圖】
【附圖說明】
[0010]圖1是多FPGA平臺全互聯(lián)示意圖。
[0011]圖2是NCS算法整體流程圖。
[0012]圖3是子孔徑和合成孔徑的流水圖。
[0013]圖4是子孔徑流水圖。
[0014]圖5是子孔徑并行化后的流程圖。
[0015]圖6是合成孔徑并行化后的流程圖。
【具體實施方式】
[0016]下面結(jié)合附圖對本發(fā)明方案進行詳細說明。
[0017]本實施例基于由4片Xilinx XC6VLX550T FPGA芯片構(gòu)成的多FPGA平臺,如圖1所示,每片F(xiàn)PGA芯片內(nèi)設(shè)計有基于4*4 2D mesh架構(gòu)的異構(gòu)多核原型芯片,數(shù)據(jù)位寬64位,通過FPGA間的高速通道將4*4 2D mesh架構(gòu)擴展成16*16 2D mesh架構(gòu)。每片F(xiàn)PGA芯片內(nèi)集成4個運算簇單元和I個轉(zhuǎn)置簇單元,完成NCS算法中的大量計算和轉(zhuǎn)置。NCS算法的整體軟件流程如圖2所示。下面結(jié)合NCS算法,以數(shù)據(jù)量為32M Byte的圖像規(guī)模為例,具體說明流水方法以及任務(wù)并行化方法。
[0018]本實施例提供的基于多FPGA平臺的NCS算法并行化的方法,包括子孔徑處理與合成孔徑處理。其中,子孔徑處理與合成孔徑處理通過兩級流水線并行處理;子孔徑處理中采用流水并行處理方式;子孔徑處理與合成孔徑處理中相互獨立的若干數(shù)據(jù)處理任務(wù)分配在若干個芯片中并行執(zhí)行。
[0019]根據(jù)子孔徑和合成孔徑各自處理的數(shù)據(jù)量的大小,結(jié)合多FPGA平臺現(xiàn)有硬件資源,采用兩片F(xiàn)PGA做子孔徑,另外兩片做合成孔徑,形成兩級流水,流水方式見圖3,實際成圖時間將大大縮短。
[0020]另外子孔徑部分由兩片F(xiàn)PGA芯片完成,也是流水操作,每片芯片處理半幅圖的源數(shù)據(jù),每次子孔徑完成4M Byte的數(shù)據(jù)處理。第一片F(xiàn)PGA芯片完成一幅圖的第1,3,5,7次子孔徑運算,第二片F(xiàn)PGA芯片完成一幅圖的第2,4,6,8次子孔徑運算,大大提高了處理數(shù)據(jù)的效率,子孔徑流水方式如圖4所示。
[0021]算法中涉及的大量運算由FPGA芯片內(nèi)的運算簇單元完成,每片F(xiàn)PGA內(nèi)有4個同構(gòu)的運算簇單元,所以在任務(wù)劃分時,綜合考慮負載平衡以及通信調(diào)度等方面的問題,可以將運算任務(wù)平均劃分到4個運算簇內(nèi),子孔徑任務(wù)劃分如圖5,合成孔徑任務(wù)劃分如圖6所
/Jn ο
[0022]本實施例提供的基于多FPGA平臺的NCS算法并行化的方法充分利用了多核硬件架構(gòu),將將運算任務(wù)劃分為多個子任務(wù)分配到不同芯片的處理單元中分別處理,從而實現(xiàn)任務(wù)處理的并行化,有效的提高了片上軟件的效率。
【權(quán)利要求】
1.一種基于多FPGA平臺的NCS算法并行化的方法,特征在于包括子孔徑處理與合成孔徑處理, 所述子孔徑處理與合成孔徑處理通過兩級流水線并行處理; 所述子孔徑處理中采用流水并行處理方式; 所述子孔徑處理與合成孔徑處理中相互獨立的若干數(shù)據(jù)處理任務(wù)分配在若干個芯片中并行執(zhí)行。
2.根據(jù)權(quán)利要求1所述的基于多FPGA平臺的NCS算法并行化的方法,其特征在于所述芯片為FPGA芯片。
3.根據(jù)權(quán)利要求1所述的基于多FPGA平臺的NCS算法并行化的方法,其特征在于所述FPGA芯片為四片。
4.根據(jù)權(quán)利要求3所述的基于多FPGA平臺的NCS算法并行化的方法,其特征在于采用兩片F(xiàn)PGA芯片做子孔徑處理,另外兩片做合成孔徑,形成兩級流水。
5.根據(jù)權(quán)利要求4所述的基于多FPGA平臺的NCS算法并行化的方法,其特征在于每片F(xiàn)PGA芯片內(nèi)部集成4個運算簇單元,所述子孔徑處理與合成孔徑處理中的數(shù)據(jù)處理平均分配至各運算簇單元處理。
6.根據(jù)權(quán)利要求4所述的基于多FPGA平臺的NCS算法并行化的方法,其特征在于對于處理孔徑部分的兩片F(xiàn)PGA芯片,每片芯片處理半幅圖的源數(shù)據(jù),每次子孔徑完成4M Byte的數(shù)據(jù)處理。
7.根據(jù)權(quán)利要求6所述的基于多FPGA平臺的NCS算法并行化的方法,其特征在于處理孔徑部分的兩片F(xiàn)PGA芯片分別處理奇數(shù)次的子孔徑運算與偶數(shù)次的子孔徑運算。
【文檔編號】G06F15/16GK103810137SQ201410004881
【公開日】2014年5月21日 申請日期:2014年1月7日 優(yōu)先權(quán)日:2014年1月7日
【發(fā)明者】潘紅兵, 錢禹, 李麗, 鄭昱, 李磊, 余慧, 徐峰, 黃炎 申請人:南京大學(xué), 中國電子科技集團公司第十四研究所