專利名稱:Ct圖像重建的gpu加速方法
技術(shù)領(lǐng)域:
本發(fā)明屬于X射線CT技術(shù)領(lǐng)域,是一種基于計算機圖形處理器(Graphics Processing Unit,縮寫為GPU)的CT圖像重建加速方法。
背景技術(shù):
如何提高CT圖像的重建速度一直都是至關(guān)重要的問題,尤其針對三維錐 束CT的體重建問題。錐束CT的數(shù)據(jù)量大,計算復(fù)雜度高,因此重建速度較慢, 它是目前制約三維錐束CT應(yīng)用的主要因素之一。在CPU上即使是優(yōu)化的重建 方法也要需要較長的時間,如從360個512x512的投影數(shù)據(jù)重建512x512x512 的體數(shù)據(jù)大約也需要5分鐘。欲重建高分辨的CT圖像,需要更大規(guī)模的投影數(shù) 據(jù),如美國VARIAN公司PaxScan2520面板探測器圖像矩陣1920*1536,探測器 單元0.127*0.127平方毫米。為了使直徑243.84mm的視野范圍內(nèi)分辨率約達到 0.127~0.213mm,需要的投影個數(shù)(角度數(shù))^3600,相應(yīng)的數(shù)據(jù)量將大于19GB. 即使投影個數(shù)為720,相應(yīng)的數(shù)據(jù)量也約4GB。
商業(yè)CT機中多采用專用集成電路(ASIC)和可編程邏輯陣列(FPGA)來 實現(xiàn)CT算法加速,但其昂貴的價格一定程度上限制了在研究和醫(yī)學(xué)等方面的 廣泛應(yīng)用,更主要的缺點是ASIC或FPGA缺乏靈活性和可更改性,不利于升級 或更新。
GPU的單指令多數(shù)據(jù)流(Single Instruction Multiple Data,縮寫為SIMD)的處
理模式可并行地對大規(guī)模數(shù)據(jù)進行同樣的操作。由于計算機游戲和工程設(shè)計的 巨大市場驅(qū)動,GPU的發(fā)展速度大大超過了CPU的發(fā)展速度,圖形流水線的高 速度和高帶寬極大地提高了圖形處理能力,近年來發(fā)展起來的可編程功能為圖 形處理以外的通用計算提供了高性價比的運行平臺,使得基于GPU的通用計 算成為近年來的研究熱點之一。
CT數(shù)據(jù)形成的平行束投影和錐束投影的概念分別與計算機圖形學(xué)中的正 交投影和透視投影的概念非常相似,CT圖像重建正投影和反投影過程與計算機 圖形學(xué)的渲染過程也很相似,CT理論中的X光源和探測器分別對應(yīng)于計算機 圖形學(xué)中的攝像機和渲染目標,CT理論中的投影地址的概念也對應(yīng)于圖形學(xué)中紋理坐標的概念。由于GPU利用專用的紋理映射硬件計算紋理坐標(投影地址): 并能夠并行處理多個被投影的數(shù)據(jù),利用GPU可以將投影操作的速度提升一到
兩個數(shù)量級(與用CPU執(zhí)行投影操作相比較)。反投影操作類似幻燈機將幻燈片 投影到屏幕的過程,利用GPU也可以方便實現(xiàn)。因此利用GPU加速CT重建受 到人們的廣泛關(guān)注。
經(jīng)對現(xiàn)有技術(shù)的文獻檢索發(fā)現(xiàn)利用GPU加速CT重建速度的文章主要分為 兩類 一類是利用GPU加速CT重建的反投影過程,其中所用到的數(shù)據(jù)是在CPU 上事先濾波好的,僅在GPU內(nèi)完成反投影過程;另一類是利用GPU進行迭代法 的加速,其中加權(quán)數(shù)據(jù)需要在CPU上事先計算好,迭代時需將加權(quán)數(shù)據(jù)表用紋 理傳入,因此占用了有限的顯存空間,難以從大數(shù)據(jù)重建CT圖像。美國紐約大 學(xué)《/^^^恥//^博士是國際上最早研究0 11加速(:丁重建的學(xué)者之一,2007年 A7au Afwe〃er, FawgZw禾口 7Veo/ /z_ytos iVecp/^fow在57V五£7ec^-o"/c 7w"gz'"g 2007'
5oarofe卩(7尸t/^ we〃々r acce/era打.o" < Cow/ wfed 7b附o^a/ /zy 》。 ^也們
認為GPU不適合進行FFT運算,因此采用CPU下的FFT進行濾波,投影數(shù)據(jù)預(yù) 處理也在CPU上完成,沒有充分利用GPU圖形流水線的高速度和高帶寬特點; 2006年A7az^ Tl^e//^和Fa g I"在生物學(xué)和醫(yī)學(xué)圖像 5zow^fca/ /wagz力g)發(fā)表的文章《/^4C77C4丄CCW57D五W77(9MS F(^
GPC/JCC£Z^W7Ei)Cr》中為了提高重建速度進行了體數(shù)據(jù)分塊,盡管在一定
程度上提高了重建速度,但是由于重建每塊體數(shù)據(jù)均用到所有的投影數(shù)據(jù),因
此投影數(shù)據(jù)的反復(fù)傳輸造成了CPU到GPU帶寬的較大浪費。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種CT圖像重建的GPU加速方法,針對目前GPU 顯存不足,以及內(nèi)存到顯存數(shù)據(jù)傳輸速度慢的瓶頸問題,提出了對大數(shù)據(jù)處理 采用分塊處理方法,與己有方法不同,本分塊方法可以大幅度減少數(shù)據(jù)傳輸, 從而可提高整個體重建速度。本發(fā)明的技術(shù)方案如下
一種CT圖像重建的GPU加速方法,軟件部分通常包括基于GPU的CT 數(shù)據(jù)預(yù)處理模塊、基于GPU的CT數(shù)據(jù)濾波模塊、基于GPU的CT正投影模 塊和基于GPU的CT圖像重建反投影模塊,通過如下步驟實現(xiàn)
(1)從掃描的X射線強度數(shù)據(jù)獲得投影數(shù)據(jù)并用基于GPU的CT數(shù)據(jù)預(yù) 處理模塊進行數(shù)據(jù)的去噪和去除環(huán)狀偽影的處理;(2)對投影數(shù)據(jù)用基于GPU的CT數(shù)據(jù)濾被模塊和基于GPU的CT反投 影模塊采用濾波反投影型算法或反投影濾波型算法獲得重建體,或者用基于 GPU的CT正投影模塊和基于GPU的CT反投影模塊采用迭代算法獲得重建體。為了保證重建CT圖像的質(zhì)量,在上述方案中掃描數(shù)據(jù)、暗場數(shù)據(jù)、亮場 數(shù)據(jù)和重建體數(shù)據(jù)均存儲成32位浮點格式紋理,以保證重建圖像的精度。利 用GPU的渲染到紋理的技術(shù),以提高處理數(shù)據(jù)的效率,采用多紋理技術(shù),以減 少GPU的渲染次數(shù)。所述的基于GPU的CT數(shù)據(jù)預(yù)處理模塊用于數(shù)據(jù)的去噪、 數(shù)據(jù)的提取、環(huán)狀偽影的去除,以及從掃描的X射線強度數(shù)據(jù)獲得投影數(shù)據(jù)等, 所述的基于GPU的CT數(shù)據(jù)濾波模塊用于對投影數(shù)據(jù)的各種濾波,所述的基于 GPU的CT正投影模塊用于模擬CT的掃描過程,用于獲得掃描投影數(shù)據(jù)或用 于迭代法求解,所述的基于GPU的CT反投影模塊用于獲得反投影圖像或者反 投影重建體,也用于迭代法求解?;贕PU的CT數(shù)據(jù)濾波模塊,將數(shù)據(jù)通過GPU上FFT變換到頻域,頻 域濾波后通過GPU上的逆FFT獲得濾波后的數(shù)據(jù)?;贕PU的CT數(shù)據(jù)濾波 模塊在GPU上實現(xiàn)FFT變換的方法為FFT排序部分在GPU上完成,將預(yù)算 好的FFT的系數(shù)和蝶式索引存成紋理,通過多次渲染實現(xiàn)蝶式運算,通過拷貝 到紋理技術(shù)將處理后的數(shù)據(jù)替換原投影數(shù)據(jù)。上述方案中,基于GPU的CT數(shù)據(jù)濾波模塊和基于GPU的CT反投影模 塊組合可以實現(xiàn)多種解析類CT重建算法,包括濾波反投影類重建算法和反投 影濾波類重建算法。本發(fā)明的技術(shù)方案中,基于GPU的CT正投影模塊,采用GPU的可編程 管線實現(xiàn)多種掃描模式的模擬,其中基于GPU的CT正投影模塊,采用了正投 影權(quán)值實時計算的并行算法?;贕PU的CT反投影模塊根據(jù)系統(tǒng)參數(shù)來設(shè)置 變換矩陣,包括投影變換矩陣和模式變換矩陣。進一步講,所述的基于GPU的 CT反投影模塊中將鄰近四角度投影數(shù)據(jù)存儲在一張紋理的四個通道,分別計 算投影矩陣,所述的基于GPU的CT反投影模塊中將鄰近4片切層體數(shù)據(jù)存儲 在一張紋理的四個通道。另外,基于GPU的CT反投影模塊根據(jù)計算機顯存配 置情況選擇適宜方法對重建體進行分塊重建。上述技術(shù)方案中,相比于通過"依賴紋理"傳遞權(quán)值的方法,不僅提高了權(quán) 值的計算速度,避免了權(quán)值在內(nèi)存和顯存之間的傳遞,且節(jié)省了顯存用于保存 權(quán)值所用的空間。所述的基于GPU的CT正投影模塊,采用了 GPU的可編程管線,算法靈活,可以實現(xiàn)多種掃描模式的模擬,包括圓軌跡斷層掃描,圓軌跡 錐束掃描,單層螺旋軌跡掃描,螺旋錐束掃描,斷層大視野掃描,斷層多次超視野掃描,錐束大視野掃描,錐束多次超視野掃描等掃描模式。所述的基于GPU 的CT正投影模塊,在一次渲染中即可計算出物體7片切片的正投影,而基于 固定管線的正投影方法經(jīng)過兩次渲染才能計算出一片切片的正投影,本發(fā)明的 算法所需計算步驟少,計算更簡潔。所述的基于GPU的CT反投影模塊中沒有 采用傳統(tǒng)的四對稱的投影數(shù)據(jù)存儲方法,而是將鄰近四角度投影數(shù)據(jù)存儲在一 張紋理的四個通道,分別計算投影矩陣。此方法直接重建出待重建切層,不需要 額外在CPU上進行體數(shù)據(jù)的累加。所述的基于GPU的CT反投影模塊中也沒 有采用傳統(tǒng)的四對稱的體數(shù)據(jù)存儲方法,而是將鄰近4片切層體數(shù)據(jù)存儲在一 張紋理的四個通道,分別計算投影矩陣。此方法可以一次渲染直接重建出4片 待重建切層,減少了 GPU的渲染次數(shù)。所述的基于GPU的CT反投影模塊根 據(jù)計算機顯存配置對重建體進行分塊重建,克服了顯存大小對重建體的影響。上述方案中,基于GPU的CT正投影模塊和基于GPU的CT反投影模塊 組合可以實現(xiàn)多種迭代重建算法,包括代數(shù)迭代算法、EM迭代算法、子集排序 的代數(shù)迭代算法和子集排序EM迭代算法等。本發(fā)明充分利用GPU可編程管線(programmable pipeline)的特點,完全在 GPU內(nèi)實現(xiàn)了多種CT重建算法的加速。本發(fā)明包括基于GPU的CT數(shù)據(jù)預(yù)處 理模塊、基于GPU的CT數(shù)據(jù)濾波模塊、基于GPU的CT的正投影模塊(也稱 投影數(shù)據(jù)生成模塊)和基于GPU的CT圖像重建反投影模塊。提出了合理的利用 GPU實現(xiàn)數(shù)據(jù)濾波方案,數(shù)據(jù)處理部分和重建部分均在GPU內(nèi)實現(xiàn)。針對目 前GPU顯存不足,以及內(nèi)存到顯存數(shù)據(jù)傳輸速度慢的瓶頸問題,提出了對大數(shù) 據(jù)分塊處理方法,與已有方法不同,本分塊方法可以大幅度減少數(shù)據(jù)傳輸,從 而可提高整個體重建速度。下面將按模塊更為詳細的描述本發(fā)明的技術(shù)方案-(l)基于GPU的CT數(shù)據(jù)預(yù)處理模塊①將相鄰4個角度的數(shù)據(jù)分別存儲到一張四通道矩形紋理的4個通道中, 紋理格式Gi^i GA4,設(shè)投影個數(shù)為7Vwm^g/e,每張紋理用toc[Z4唯/e]表示, "wg/e = (), .,iVw^wg/e/4-l;暗場數(shù)據(jù)存儲成一張單通道矩形紋理,記作 紋理格式G丄」iV7^iVS/7T;亮場數(shù)據(jù)存儲成一張矩形紋理,記作to7Vw/,紋理 格式GZ —/M^VS/7T。紋理的長和寬分別均記作附a和/ftoc,紋理用32位浮點格式,以保證計算的精度。② 將數(shù)據(jù)紋理tec[""g/e],暗場數(shù)據(jù)紋理tecM^e和亮場數(shù)據(jù)紋理tecJV。n^/ , 利用多紋理技術(shù)貼到一長為附e;c,寬為Me;c的矩形框上,投影矩陣為正交投影 矩陣。③ 頂點變換用固定管線的變換,編寫元處理器,使得三片紋理按 尸,Cofo,.-log欣油函;-^胸w形式混合,g/ F gO^,為最后的混合結(jié)果。④ 利用拷貝到紋理技術(shù),將混合后的結(jié)果拷貝到數(shù)據(jù)紋理^[""g/e]。不難理解,同樣原理和方法,修改片元W^^程序,即可實現(xiàn)對數(shù)據(jù)的其它 方式的預(yù)處理。(2)基于GPU的CT數(shù)據(jù)濾波模塊① 利用GPU上的FFT將數(shù)據(jù)變換到頻域。由于本發(fā)明的目的是對大量數(shù)據(jù) 進行一維頻域濾波,因此采用FFT系數(shù)和蝶式索引預(yù)先計算的方法,而沒有采 用通常FFT系數(shù)和蝶式索引臨時計算的方法。GPU上數(shù)據(jù)的FFT變換分以下 幾步實現(xiàn)第一步,對數(shù)據(jù)紋理toc["唯/e]補零,使其長度為2的整次冪記作 = 2",寬度不變?yōu)閕ftec ,補零的方法是將紋理tec[Z4唯/e]貼在長為 寬為幼e;c的矩形框上,投影矩陣為正交投影矩陣。利用渲染到紋理技術(shù),渲染到 一新的紋理^dw,格式為GL —/ GA4,長為附e;dVeM',寬為Z/toc;第二步,在CPU上計算出FFT系數(shù)和蝶式索引以及濾波器的頻域數(shù)據(jù),將 這些數(shù)據(jù)存儲成一張紋理,記作欣0#,紋理格式Gi^i G5丄長為附exiV,,寬 為iW + l;第三步,頂點變換用固定管線的變換,編寫片元處理器,在片元AWer中訪 問紋理欣0#,利用它所存儲的FFT系數(shù)和蝶式索引經(jīng)過M次渲染實現(xiàn)蝶式算 法.獲得數(shù)據(jù)的頻域表示。② 將頻域數(shù)據(jù)與濾波函數(shù)的頻域數(shù)據(jù)點乘,實現(xiàn)頻域濾波。由于紋理tocQ^ 己存儲了濾波函數(shù)的頻域數(shù)據(jù),利用多紋理混合可容易實現(xiàn)點乘運算。③ 利用GPU上FFT的逆變換將數(shù)據(jù)變換到實域。眾所周知,傅里葉正變 換與傅里葉逆變換具有對稱關(guān)系,記/(0原函數(shù),F(xiàn)(^)為/(/)的傅里葉變換= jr[/州,則有y[F(f)]-2;r/(-w),因此很容易利用GPU上FFT實現(xiàn)GPU上FFT逆變換。④將紋理todw貼在長為肌ex,寬為Z/toc的矩形框上,投影矩陣為正交投影 矩陣,利用拷貝到紋理技術(shù),將渲染后的結(jié)果拷貝到數(shù)據(jù)紋理toc[""g/e]。(3) 基于GPU的CT正投影模塊本發(fā)明的正投影模塊完全在GPU的可編程管線中實現(xiàn),不僅支持32bit浮 點運算精度,而且算法需要的計算步驟少,實現(xiàn)更加靈活;采用GPU的正投影 權(quán)值實時并行算法,相比于通過"依賴紋理"傳遞權(quán)值的方法,不僅提高了權(quán)值的 計算速度,避免了權(quán)值在內(nèi)存和顯存之間的傳遞,且節(jié)省了顯存用于保存權(quán)值 所用的空間。①將被測物體按豎切片刨切成M^/ 。w片切片,每片切片和與它有對稱關(guān)系 的切片的數(shù)據(jù)存儲在一張四通道的矩形紋理中,紋理格式C^一/ GA4,長為② 根據(jù)被測物體的切片模型,將切片紋理映射到所對應(yīng)得幾何體切片上,紋理坐標的映射關(guān)系通過可編程管線計算獲得,利用GPU渲染到紋理技術(shù),將多 個切片渲染到平板探測器對應(yīng)的紋理上,經(jīng)過多次渲染,將所有切片渲染到平板 探測器對應(yīng)的紋理上獲得沒有校正的投影數(shù)據(jù)。③ 根據(jù)正投影的幾何參數(shù),利用GPU可編程管線計算正投影權(quán)值,對投影 數(shù)據(jù)進行校正。 采用了 OpenGL快速數(shù)據(jù)傳輸擴展PBO (Pixel Buffer Object)進行切片紋 理數(shù)據(jù)和投影數(shù)據(jù)的傳輸,該數(shù)據(jù)傳輸擴展不僅能加快數(shù)據(jù)在內(nèi)存和顯存之間 傳輸速度,而且支持數(shù)據(jù)傳輸和GPU計算同步進行。(4) 基于GPU的CT反投影模塊① 投影數(shù)據(jù)的存儲,投影數(shù)據(jù)尺寸為M/w肌cM x M^說Zg似x ,存儲 成A^mJ"g/e/4片四通道矩形紋理,紋理格式—7 G&4 ,長為M/w附^/ ,寬為 M^/^g化,每4個相鄰角度的投影數(shù)據(jù)存儲在一張紋理的四個通道中。② 重建體數(shù)據(jù)的存儲,假設(shè)重建體為A^m及,xMw^,xM/w幼",橫切片的存儲方法是將重建體存儲成M^幼"/4片Gi: —i G^(格式的矩形紋理,長為 M/m/tow,寬為Mm7及,.每4個相鄰橫層切片的重建體數(shù)據(jù)存儲在一張紋理的四 個通道中,豎切片的存儲方法是將重建體存儲成7^mi mW4片Gi^^m4格式的矩 形紋理,長為7V"/7z/ cw,寬為M^幼ce,每4個相鄰豎層切片的重建體數(shù)據(jù)存儲在 一張紋理的四個通道中。③ 根據(jù)CT系統(tǒng)的參數(shù)設(shè)定透視投影矩陣,CT系統(tǒng)的參數(shù)包括探測器單 元的尺寸,面陣探測器的行單元個數(shù),面陣探測器的列單元個數(shù),射線源到轉(zhuǎn) 臺的距離,射線源到探測器的距離等。CT系統(tǒng)中射線源與圖形學(xué)中視點概念相 對應(yīng),探測器與圖形學(xué)中投影平面概念相對應(yīng),CT錐束掃描與透視投影模式相 對應(yīng),因此根據(jù)CT系統(tǒng)參數(shù)容易計算透視投影矩陣。④ 利用投影紋理技術(shù)實現(xiàn)反投影,將投影數(shù)據(jù)紋理貼到待重建切層(橫切 層或豎切層)上,紋理坐標利用待重建切層上的重建點在投影平面上的投影坐標 得到。在實際應(yīng)用中有兩種方法減少顯存消耗, 一種是將所有投影角度下的投影 數(shù)據(jù)紋理全部反投重建一片重建體紋理后,將重建體紋理傳出顯存,因此顯存 中除放置所有投影數(shù)據(jù)紋理外,只需要放置一片重建體紋理即可。另一種方法 是將一片投影數(shù)據(jù)紋理或幾片投影數(shù)據(jù)紋理對所有的重建切層進行反投影,然 后釋放這幾片投影數(shù)據(jù)紋理,從內(nèi)存重新讀入新的投影數(shù)據(jù)紋理,繼續(xù)對重建 切層進行反投影,因此顯存中除了放置重建切層紋理外,只需要放置幾片投影數(shù) 據(jù)紋理即可。上述兩種方法的選擇需要根據(jù)實際情況中重建體大小和投影數(shù)據(jù)大小來定, 如果重建體數(shù)據(jù)較大,則選擇前一種將重建切層分次重建的方法,如果投影數(shù) 據(jù)較大,則選擇后一種將投影數(shù)據(jù)紋理分次讀入的辦法。⑤ 大數(shù)據(jù)量下的重建問題,盡管④中的兩種方法都可降低顯存消耗,但是 都無法解決投影數(shù)據(jù)和重建體數(shù)據(jù)均超出顯存限制的問題。當投影數(shù)據(jù)和重建 體數(shù)據(jù)均超出顯存限制時,本發(fā)明采用對投影數(shù)據(jù)和重建體數(shù)據(jù)同時分塊的方 法,重建體的紋理存儲采用橫切片的紋理存儲方式,然后根據(jù)顯存大小計算可 以容納的切層數(shù)量,依據(jù)重建體的橫切層分塊情況對每個投影角度下的投影數(shù) 據(jù)進行分塊,也就是計算重建每一塊時所需要的每個投影下的投影數(shù)據(jù),將它 分次傳入顯存。之所以選擇橫切片的體數(shù)據(jù)存儲方式是因為每片橫切片在每個 投影角度小只需要少量幾行投影數(shù)據(jù),因此可以達到解決大數(shù)據(jù)量下的圖像重建問題。(5)模塊組合實現(xiàn)多種GPU上的CT重建算法① 圓軌跡FDK重建算法首先利用基于GPU的CT數(shù)據(jù)預(yù)處理模塊對射線強度數(shù)據(jù)進行處理,在處 理的過程中投影數(shù)據(jù)的獲得和投影數(shù)據(jù)預(yù)校正同時進行;然后利用基于GPU的 CT數(shù)據(jù)濾波模塊選擇斜坡濾波器沿探測器行方向?qū)ν队皵?shù)據(jù)進行一維濾波; 利用基于GPU的CT反投影模塊進行加權(quán)反投影,權(quán)重采用實時計算的方法, 模型變換矩陣設(shè)置為繞探測器的豎直方向旋轉(zhuǎn)的旋轉(zhuǎn)變換矩陣,透視投影矩陣 根據(jù)系統(tǒng)參數(shù)設(shè)置。② 錐束多次掃描數(shù)據(jù)的BPF型重建算法首先利用基于GPU的CT數(shù)據(jù)預(yù)處理模塊對射線強度數(shù)據(jù)進行處理,在處 理的過程中投影數(shù)據(jù)的獲得和投影數(shù)據(jù)沿探測器行方向的求導(dǎo)同時進行;然后 利用基于GPU的CT反投影模塊生成投影數(shù)據(jù)導(dǎo)數(shù)的三維反投影圖像(也稱三維 DBP圖像),其中設(shè)置模型變換矩陣為先沿探測器的水平方向平移,再繞探測器 的豎直方向旋轉(zhuǎn)的平移旋轉(zhuǎn)變換矩陣,根據(jù)系統(tǒng)參數(shù)設(shè)置透視投影矩陣;最后 利用基于GPU的CT數(shù)據(jù)濾波模塊對三維DBP圖像沿行方向進行一維濾波,濾 波核函數(shù)為Hilbert逆變換函數(shù)。③ 代數(shù)迭代重建算法首先利用基于GPU的CT數(shù)據(jù)預(yù)處理模塊將探測器獲取的射線強度數(shù)據(jù)轉(zhuǎn) 換成投影數(shù)據(jù);然后給待重建的體數(shù)據(jù)付初始值,利用基于GPU的CT正投影 模塊獲得投影數(shù)據(jù)的估計值;接著利用基于GPU的CT數(shù)據(jù)預(yù)處理模塊計算估 計值和實際投影值的殘差;再利用基于GPU的CT反投影模塊將殘差值反投影 給初始的待重建體數(shù)據(jù)。這樣就完成了一次迭代,將重建結(jié)果作為下次迭代的 初始值實現(xiàn)多步迭代過程。
圖1為實采數(shù)據(jù)利用本發(fā)明重建的效果圖;圖2為圖1的局部體顯示圖;圖3為用于測試的模型的照片;圖4為基于GPU的大視野重建的DBP效果圖,圖4 (a)為主視方向的中心 切層圖,圖4(b)為俯視方向的中心切層圖,圖4(c)為側(cè)視的中心切層圖;圖5為基于GPU的大視野重建的效果圖,圖5(a)為重建體的體渲染圖, 圖5(b)為正視圖的中心切層圖,圖5(c)為俯視圖的中心切層圖,圖5(d)為側(cè) 視的中心切層圖。
具體實施方式
下面將結(jié)合實施例對本發(fā)明作進一步的說明。利用本發(fā)明的錐束多次掃描 數(shù)據(jù)的BPF型重建算法對一次偏置大視野的CT數(shù)據(jù)進行重建,掃描模型為 Shepp-logan模型,GPU使用Nvidia的Quadro FX 4600芯片。(1) 投影數(shù)據(jù)大小為512x512x360,待重建體的大小為512x512x512,重建 體數(shù)據(jù)大于投影數(shù)據(jù),因此選取數(shù)據(jù)紋理一次存儲成紋理,重建切層分次重建 的反投影方法;(2) 將投影數(shù)據(jù)存成90片長為512,寬為512,格式為GZ —i GA4的四通道32 位浮點矩形紋理,每4個相鄰角度的投影數(shù)據(jù)存儲在一張紋理的四個通道中;(3) 利用基于GPU的CT數(shù)據(jù)預(yù)處理模塊對投影數(shù)據(jù)紋理沿行方向進行求導(dǎo), 利用拷貝到紋理技術(shù)將求導(dǎo)后的投影數(shù)據(jù)替換原投影數(shù)據(jù);(4) CT系統(tǒng)參數(shù)為探測器單元尺寸為0.127 mm,轉(zhuǎn)臺中心到探測器的距 離為240 mm,轉(zhuǎn)臺中心到主射線方向的距離為50.5mm,射線源到探測器的距 離為2150mm。根據(jù)上述參數(shù)設(shè)定變換矩陣,包括透視投影矩陣和模型視圖矩 陣;(5) 利用基于GPU的CT反投影模塊對重建體進行反投影,獲取導(dǎo)數(shù)的反投 影三維圖像,在反投影中需要根據(jù)投影地址計算符號函數(shù)和權(quán)重。重建效果如 圖4所示,投影數(shù)據(jù)導(dǎo)數(shù)的反投影圖像也稱DBP圖像。(6) 利用基于GPU的CT數(shù)據(jù)濾波模塊對重建的三維圖像沿行方向進行濾 波,濾波核函數(shù)為Hilbert逆變換函數(shù)。整個重建過程從硬盤數(shù)據(jù)的讀入到重建數(shù)據(jù)的硬盤保存共耗時30秒,重建 效果如圖5所示。需要說明的是雖然上述的實施例闡述了本發(fā)明的模塊組合能夠?qū)崿F(xiàn)的幾 種重建算法,但是本領(lǐng)域的研究人員可以理解,本發(fā)明可以將濾波反投影類重 建算法、反投影濾波類重建算法、迭代類重建算法通過本發(fā)明的模塊移植到GPU上實現(xiàn),進而來提高它們的重建速度。
權(quán)利要求
1. 一種CT圖像重建的GPU加速方法,軟件部分通常包括基于GPU的CT數(shù)據(jù)預(yù)處理模塊、基于GPU的CT數(shù)據(jù)濾波模塊、基于GPU的CT正投影模塊和基于GPU的CT圖像重建反投影模塊,通過如下步驟實現(xiàn)(1)從掃描的X射線強度數(shù)據(jù)獲得投影數(shù)據(jù)并用基于GPU的CT數(shù)據(jù)預(yù)處理模塊進行數(shù)據(jù)的去噪和去除環(huán)狀偽影的處理;(2)對投影數(shù)據(jù)用基于GPU的CT數(shù)據(jù)濾波模塊和基于GPU的CT反投影模塊采用濾波反投影型算法或反投影濾波型算法獲得重建體,或者用基于GPU的CT正投影模塊和基于GPU的CT反投影模塊采用迭代算法獲得重建體。
2. 如權(quán)利要求l所述的CT圖像重建的GPU加速方法,其特征在于掃描 數(shù)據(jù)、暗場數(shù)據(jù)、亮場數(shù)據(jù)和重建體數(shù)據(jù)均存儲成32位浮點格式紋理。
3. 如權(quán)利要求2所述的CT圖像重建的GPU加速方法,其特征在于對投 影數(shù)據(jù)用基于GPU的CT數(shù)據(jù)濾波模塊和基于GPU的CT反投影模塊采用濾 波反投影型算法或反投影濾波型算法獲得重建體,基于GPU的CT數(shù)據(jù)濾波模 塊,將數(shù)據(jù)通過GPU上FFT變換到頻域,頻域濾波后通過GPU上的逆FFT 獲得濾波后的數(shù)據(jù)。
4. 如權(quán)利要求3所述的CT圖像重建的GPU加速方法,其特征在于所述 的基于GPU的CT數(shù)據(jù)濾波模塊中在GPU上實現(xiàn)FFT,其中FFT排序部分在 GPU上完成,將預(yù)算好的FFT的系數(shù)和蝶式索引存成紋理,通過多次渲染實現(xiàn) 蝶式運算,通過拷貝到紋理技術(shù)將處理后的數(shù)據(jù)替換原投影數(shù)據(jù)。
5. 如權(quán)利要求2所述的CT圖像重建的GPU加速方法,其特征在于用基 于GPU的CT正投影模塊和基于GPU的CT反投影模塊采用迭代算法獲得重 建體,基于GPU的CT正投影模塊,采用了GPU的可編程管線,實現(xiàn)多種掃 描模式的模擬。
6. 如權(quán)利要求5所述的CT圖像重建的GPU加速方法,其特征在于所述 的基于GPU的CT正投影模塊,采用正投影權(quán)值實時計算的并行算法。
7. 如權(quán)利要求3或5所述的CT圖像重建的GPU加速方法,其特征在于 所述的基于GPU的CT反投影模塊根據(jù)系統(tǒng)參數(shù)來設(shè)置變換矩陣,包括投影變 換矩陣和模式變換矩陣。
8. 如權(quán)利要求7所述的CT圖像重建的GPU加速方法,其特征在于所述 的基于GPU的CT反投影模塊中將鄰近四角度投影數(shù)據(jù)存儲在一張紋理的四個 通道,分別計算投影矩陣。
9. 如權(quán)利要求7所述的CT圖像重建的GPU加速方法,其特征在于所述 的基于GPU的CT反投影模塊中將鄰近4片切層體數(shù)據(jù)存儲在一張紋理的四個 通道。
10. 如權(quán)利要求8或9所述的CT圖像重建的GPU加速方法,其特征在于 所述的基于GPU的CT反投影模塊根據(jù)計算機顯存配置對重建體進行分塊重 建。
全文摘要
一種基于GPU硬件加速的CT圖像重建方法,屬于X射線CT技術(shù)領(lǐng)域。本發(fā)明軟件部分通常包括基于GPU的CT數(shù)據(jù)預(yù)處理模塊、基于GPU的CT數(shù)據(jù)濾波模塊、基于GPU的CT正投影模塊和基于GPU的CT圖像重建反投影模塊。本發(fā)明利用GPU硬件實現(xiàn)了對CT圖像重建算法的加速,重建部分和數(shù)據(jù)處理部分均在GPU上完成。針對目前GPU顯存不足以及內(nèi)存到顯存數(shù)據(jù)傳輸速度慢的瓶頸問題,提出了對大數(shù)據(jù)處理采用分塊處理方法,與已有方法不同,本分塊方法對每塊待重建體重建時只需要用到部分投影數(shù)據(jù),減少了數(shù)據(jù)傳輸,從而可提高整個體重建速度。
文檔編號A61B6/03GK101283913SQ20081011384
公開日2008年10月15日 申請日期2008年5月30日 優(yōu)先權(quán)日2008年5月30日
發(fā)明者堯 張, 朋 張, 張慧滔, 濤 楊, 星 趙, 陳德峰 申請人:首都師范大學(xué)