Ct圖像重建的gpu加速方法

文檔序號：1228351閱讀：394來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>醫(yī)藥醫(yī)療技術(shù)的改進;醫(yī)療器械制造及應(yīng)用技術(shù)

專利名稱：Ct圖像重建的gpu加速方法
技術(shù)領(lǐng)域：
本發(fā)明屬于X射線CT技術(shù)領(lǐng)域，是一種基于計算機圖形處理器(Graphics Processing Unit,縮寫為GPU)的CT圖像重建加速方法。
背景技術(shù)：
如何提高CT圖像的重建速度一直都是至關(guān)重要的問題，尤其針對三維錐束CT的體重建問題。錐束CT的數(shù)據(jù)量大，計算復(fù)雜度高，因此重建速度較慢, 它是目前制約三維錐束CT應(yīng)用的主要因素之一。在CPU上即使是優(yōu)化的重建方法也要需要較長的時間，如從360個512x512的投影數(shù)據(jù)重建512x512x512 的體數(shù)據(jù)大約也需要5分鐘。欲重建高分辨的CT圖像，需要更大規(guī)模的投影數(shù) 據(jù)，如美國VARIAN公司PaxScan2520面板探測器圖像矩陣1920*1536，探測器單元0.127*0.127平方毫米。為了使直徑243.84mm的視野范圍內(nèi)分辨率約達到 0.127~0.213mm，需要的投影個數(shù)(角度數(shù))^3600,相應(yīng)的數(shù)據(jù)量將大于19GB. 即使投影個數(shù)為720，相應(yīng)的數(shù)據(jù)量也約4GB。
商業(yè)CT機中多采用專用集成電路(ASIC)和可編程邏輯陣列(FPGA)來實現(xiàn)CT算法加速，但其昂貴的價格一定程度上限制了在研究和醫(yī)學(xué)等方面的廣泛應(yīng)用，更主要的缺點是ASIC或FPGA缺乏靈活性和可更改性，不利于升級或更新。
GPU的單指令多數(shù)據(jù)流(Single Instruction Multiple Data,縮寫為SIMD)的處
理模式可并行地對大規(guī)模數(shù)據(jù)進行同樣的操作。由于計算機游戲和工程設(shè)計的巨大市場驅(qū)動，GPU的發(fā)展速度大大超過了CPU的發(fā)展速度，圖形流水線的高速度和高帶寬極大地提高了圖形處理能力，近年來發(fā)展起來的可編程功能為圖形處理以外的通用計算提供了高性價比的運行平臺，使得基于GPU的通用計算成為近年來的研究熱點之一。
CT數(shù)據(jù)形成的平行束投影和錐束投影的概念分別與計算機圖形學(xué)中的正交投影和透視投影的概念非常相似，CT圖像重建正投影和反投影過程與計算機圖形學(xué)的渲染過程也很相似，CT理論中的X光源和探測器分別對應(yīng)于計算機圖形學(xué)中的攝像機和渲染目標，CT理論中的投影地址的概念也對應(yīng)于圖形學(xué)中紋理坐標的概念。由于GPU利用專用的紋理映射硬件計算紋理坐標(投影地址): 并能夠并行處理多個被投影的數(shù)據(jù)，利用GPU可以將投影操作的速度提升一到
兩個數(shù)量級(與用CPU執(zhí)行投影操作相比較)。反投影操作類似幻燈機將幻燈片投影到屏幕的過程，利用GPU也可以方便實現(xiàn)。因此利用GPU加速CT重建受到人們的廣泛關(guān)注。
經(jīng)對現(xiàn)有技術(shù)的文獻檢索發(fā)現(xiàn)利用GPU加速CT重建速度的文章主要分為兩類一類是利用GPU加速CT重建的反投影過程，其中所用到的數(shù)據(jù)是在CPU 上事先濾波好的，僅在GPU內(nèi)完成反投影過程；另一類是利用GPU進行迭代法的加速，其中加權(quán)數(shù)據(jù)需要在CPU上事先計算好，迭代時需將加權(quán)數(shù)據(jù)表用紋理傳入，因此占用了有限的顯存空間，難以從大數(shù)據(jù)重建CT圖像。美國紐約大學(xué)《/^^^恥//^博士是國際上最早研究0 11加速(:丁重建的學(xué)者之一，2007年 A7au Afwe〃er, FawgZw禾口 7Veo/ /z_ytos iVecp/^fow在57V五￡7ec^-o"/c 7w"gz'"g 2007'
5oarofe卩(7尸t/^ we〃々r acce/era打.o" < Cow/ wfed 7b附o^a/ /zy 》。 ^也們
認為GPU不適合進行FFT運算，因此采用CPU下的FFT進行濾波，投影數(shù)據(jù)預(yù) 處理也在CPU上完成，沒有充分利用GPU圖形流水線的高速度和高帶寬特點; 2006年A7az^ Tl^e//^和Fa g I"在生物學(xué)和醫(yī)學(xué)圖像 5zow^fca/ /wagz力g)發(fā)表的文章《/^4C77C4丄CCW57D五W77(9MS F(^
GPC/JCC￡Z^W7Ei)Cr》中為了提高重建速度進行了體數(shù)據(jù)分塊，盡管在一定
程度上提高了重建速度，但是由于重建每塊體數(shù)據(jù)均用到所有的投影數(shù)據(jù)，因
此投影數(shù)據(jù)的反復(fù)傳輸造成了CPU到GPU帶寬的較大浪費。

發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種CT圖像重建的GPU加速方法，針對目前GPU 顯存不足，以及內(nèi)存到顯存數(shù)據(jù)傳輸速度慢的瓶頸問題，提出了對大數(shù)據(jù)處理采用分塊處理方法，與己有方法不同，本分塊方法可以大幅度減少數(shù)據(jù)傳輸，從而可提高整個體重建速度。本發(fā)明的技術(shù)方案如下
一種CT圖像重建的GPU加速方法，軟件部分通常包括基于GPU的CT 數(shù)據(jù)預(yù)處理模塊、基于GPU的CT數(shù)據(jù)濾波模塊、基于GPU的CT正投影模塊和基于GPU的CT圖像重建反投影模塊，通過如下步驟實現(xiàn)
(1)從掃描的X射線強度數(shù)據(jù)獲得投影數(shù)據(jù)并用基于GPU的CT數(shù)據(jù)預(yù) 處理模塊進行數(shù)據(jù)的去噪和去除環(huán)狀偽影的處理；(2)對投影數(shù)據(jù)用基于GPU的CT數(shù)據(jù)濾被模塊和基于GPU的CT反投影模塊采用濾波反投影型算法或反投影濾波型算法獲得重建體，或者用基于 GPU的CT正投影模塊和基于GPU的CT反投影模塊采用迭代算法獲得重建體。為了保證重建CT圖像的質(zhì)量，在上述方案中掃描數(shù)據(jù)、暗場數(shù)據(jù)、亮場數(shù)據(jù)和重建體數(shù)據(jù)均存儲成32位浮點格式紋理，以保證重建圖像的精度。利用GPU的渲染到紋理的技術(shù)，以提高處理數(shù)據(jù)的效率，采用多紋理技術(shù)，以減少GPU的渲染次數(shù)。所述的基于GPU的CT數(shù)據(jù)預(yù)處理模塊用于數(shù)據(jù)的去噪、數(shù)據(jù)的提取、環(huán)狀偽影的去除，以及從掃描的X射線強度數(shù)據(jù)獲得投影數(shù)據(jù)等，所述的基于GPU的CT數(shù)據(jù)濾波模塊用于對投影數(shù)據(jù)的各種濾波，所述的基于 GPU的CT正投影模塊用于模擬CT的掃描過程，用于獲得掃描投影數(shù)據(jù)或用于迭代法求解，所述的基于GPU的CT反投影模塊用于獲得反投影圖像或者反投影重建體，也用于迭代法求解?；贕PU的CT數(shù)據(jù)濾波模塊，將數(shù)據(jù)通過GPU上FFT變換到頻域，頻域濾波后通過GPU上的逆FFT獲得濾波后的數(shù)據(jù)?；贕PU的CT數(shù)據(jù)濾波模塊在GPU上實現(xiàn)FFT變換的方法為FFT排序部分在GPU上完成，將預(yù)算好的FFT的系數(shù)和蝶式索引存成紋理，通過多次渲染實現(xiàn)蝶式運算，通過拷貝到紋理技術(shù)將處理后的數(shù)據(jù)替換原投影數(shù)據(jù)。上述方案中，基于GPU的CT數(shù)據(jù)濾波模塊和基于GPU的CT反投影模塊組合可以實現(xiàn)多種解析類CT重建算法，包括濾波反投影類重建算法和反投影濾波類重建算法。本發(fā)明的技術(shù)方案中，基于GPU的CT正投影模塊，采用GPU的可編程管線實現(xiàn)多種掃描模式的模擬，其中基于GPU的CT正投影模塊，采用了正投影權(quán)值實時計算的并行算法?；贕PU的CT反投影模塊根據(jù)系統(tǒng)參數(shù)來設(shè)置變換矩陣，包括投影變換矩陣和模式變換矩陣。進一步講，所述的基于GPU的 CT反投影模塊中將鄰近四角度投影數(shù)據(jù)存儲在一張紋理的四個通道，分別計算投影矩陣，所述的基于GPU的CT反投影模塊中將鄰近4片切層體數(shù)據(jù)存儲在一張紋理的四個通道。另外，基于GPU的CT反投影模塊根據(jù)計算機顯存配置情況選擇適宜方法對重建體進行分塊重建。上述技術(shù)方案中，相比于通過"依賴紋理"傳遞權(quán)值的方法，不僅提高了權(quán) 值的計算速度，避免了權(quán)值在內(nèi)存和顯存之間的傳遞，且節(jié)省了顯存用于保存權(quán)值所用的空間。所述的基于GPU的CT正投影模塊，采用了 GPU的可編程管線，算法靈活，可以實現(xiàn)多種掃描模式的模擬，包括圓軌跡斷層掃描，圓軌跡錐束掃描，單層螺旋軌跡掃描，螺旋錐束掃描，斷層大視野掃描，斷層多次超視野掃描，錐束大視野掃描，錐束多次超視野掃描等掃描模式。所述的基于GPU 的CT正投影模塊，在一次渲染中即可計算出物體7片切片的正投影，而基于固定管線的正投影方法經(jīng)過兩次渲染才能計算出一片切片的正投影，本發(fā)明的算法所需計算步驟少，計算更簡潔。所述的基于GPU的CT反投影模塊中沒有采用傳統(tǒng)的四對稱的投影數(shù)據(jù)存儲方法，而是將鄰近四角度投影數(shù)據(jù)存儲在一張紋理的四個通道，分別計算投影矩陣。此方法直接重建出待重建切層，不需要額外在CPU上進行體數(shù)據(jù)的累加。所述的基于GPU的CT反投影模塊中也沒有采用傳統(tǒng)的四對稱的體數(shù)據(jù)存儲方法，而是將鄰近4片切層體數(shù)據(jù)存儲在一張紋理的四個通道，分別計算投影矩陣。此方法可以一次渲染直接重建出4片待重建切層，減少了 GPU的渲染次數(shù)。所述的基于GPU的CT反投影模塊根據(jù)計算機顯存配置對重建體進行分塊重建，克服了顯存大小對重建體的影響。上述方案中，基于GPU的CT正投影模塊和基于GPU的CT反投影模塊組合可以實現(xiàn)多種迭代重建算法，包括代數(shù)迭代算法、EM迭代算法、子集排序的代數(shù)迭代算法和子集排序EM迭代算法等。本發(fā)明充分利用GPU可編程管線(programmable pipeline)的特點，完全在 GPU內(nèi)實現(xiàn)了多種CT重建算法的加速。本發(fā)明包括基于GPU的CT數(shù)據(jù)預(yù)處理模塊、基于GPU的CT數(shù)據(jù)濾波模塊、基于GPU的CT的正投影模塊(也稱投影數(shù)據(jù)生成模塊)和基于GPU的CT圖像重建反投影模塊。提出了合理的利用 GPU實現(xiàn)數(shù)據(jù)濾波方案，數(shù)據(jù)處理部分和重建部分均在GPU內(nèi)實現(xiàn)。針對目前GPU顯存不足，以及內(nèi)存到顯存數(shù)據(jù)傳輸速度慢的瓶頸問題，提出了對大數(shù) 據(jù)分塊處理方法，與已有方法不同，本分塊方法可以大幅度減少數(shù)據(jù)傳輸，從而可提高整個體重建速度。下面將按模塊更為詳細的描述本發(fā)明的技術(shù)方案-(l)基于GPU的CT數(shù)據(jù)預(yù)處理模塊①將相鄰4個角度的數(shù)據(jù)分別存儲到一張四通道矩形紋理的4個通道中，紋理格式Gi^i GA4，設(shè)投影個數(shù)為7Vwm^g/e，每張紋理用toc[Z4唯/e]表示， "wg/e = ()， .，iVw^wg/e/4-l;暗場數(shù)據(jù)存儲成一張單通道矩形紋理，記作紋理格式G丄」iV7^iVS/7T;亮場數(shù)據(jù)存儲成一張矩形紋理，記作to7Vw/,紋理格式GZ —/M^VS/7T。紋理的長和寬分別均記作附a和/ftoc，紋理用32位浮點格式，以保證計算的精度。② 將數(shù)據(jù)紋理tec[""g/e]，暗場數(shù)據(jù)紋理tecM^e和亮場數(shù)據(jù)紋理tecJV。n^/ ，利用多紋理技術(shù)貼到一長為附e;c,寬為Me;c的矩形框上，投影矩陣為正交投影矩陣。③ 頂點變換用固定管線的變換，編寫元處理器，使得三片紋理按尸，Cofo,.-log欣油函;-^胸w形式混合，g/ F gO^,為最后的混合結(jié)果。④ 利用拷貝到紋理技術(shù)，將混合后的結(jié)果拷貝到數(shù)據(jù)紋理^[""g/e]。不難理解，同樣原理和方法，修改片元W^^程序，即可實現(xiàn)對數(shù)據(jù)的其它方式的預(yù)處理。(2)基于GPU的CT數(shù)據(jù)濾波模塊① 利用GPU上的FFT將數(shù)據(jù)變換到頻域。由于本發(fā)明的目的是對大量數(shù)據(jù) 進行一維頻域濾波，因此采用FFT系數(shù)和蝶式索引預(yù)先計算的方法，而沒有采用通常FFT系數(shù)和蝶式索引臨時計算的方法。GPU上數(shù)據(jù)的FFT變換分以下幾步實現(xiàn)第一步，對數(shù)據(jù)紋理toc["唯/e]補零，使其長度為2的整次冪記作 = 2",寬度不變?yōu)閕ftec ，補零的方法是將紋理tec[Z4唯/e]貼在長為寬為幼e;c的矩形框上，投影矩陣為正交投影矩陣。利用渲染到紋理技術(shù)，渲染到一新的紋理^dw，格式為GL —/ GA4，長為附e;dVeM',寬為Z/toc;第二步，在CPU上計算出FFT系數(shù)和蝶式索引以及濾波器的頻域數(shù)據(jù)，將這些數(shù)據(jù)存儲成一張紋理，記作欣0#,紋理格式Gi^i G5丄長為附exiV，，寬為iW + l;第三步，頂點變換用固定管線的變換，編寫片元處理器，在片元AWer中訪問紋理欣0#,利用它所存儲的FFT系數(shù)和蝶式索引經(jīng)過M次渲染實現(xiàn)蝶式算法.獲得數(shù)據(jù)的頻域表示。② 將頻域數(shù)據(jù)與濾波函數(shù)的頻域數(shù)據(jù)點乘，實現(xiàn)頻域濾波。由于紋理tocQ^ 己存儲了濾波函數(shù)的頻域數(shù)據(jù)，利用多紋理混合可容易實現(xiàn)點乘運算。③ 利用GPU上FFT的逆變換將數(shù)據(jù)變換到實域。眾所周知，傅里葉正變換與傅里葉逆變換具有對稱關(guān)系，記/(0原函數(shù)，F(xiàn)(^)為/(/)的傅里葉變換= jr[/州，則有y[F(f)]-2;r/(-w)，因此很容易利用GPU上FFT實現(xiàn)GPU上FFT逆變換。④將紋理todw貼在長為肌ex,寬為Z/toc的矩形框上，投影矩陣為正交投影矩陣，利用拷貝到紋理技術(shù)，將渲染后的結(jié)果拷貝到數(shù)據(jù)紋理toc[""g/e]。(3) 基于GPU的CT正投影模塊本發(fā)明的正投影模塊完全在GPU的可編程管線中實現(xiàn)，不僅支持32bit浮點運算精度，而且算法需要的計算步驟少，實現(xiàn)更加靈活；采用GPU的正投影權(quán)值實時并行算法，相比于通過"依賴紋理"傳遞權(quán)值的方法，不僅提高了權(quán)值的計算速度，避免了權(quán)值在內(nèi)存和顯存之間的傳遞，且節(jié)省了顯存用于保存權(quán)值所用的空間。①將被測物體按豎切片刨切成M^/ 。w片切片，每片切片和與它有對稱關(guān)系的切片的數(shù)據(jù)存儲在一張四通道的矩形紋理中，紋理格式C^一/ GA4，長為② 根據(jù)被測物體的切片模型，將切片紋理映射到所對應(yīng)得幾何體切片上，紋理坐標的映射關(guān)系通過可編程管線計算獲得，利用GPU渲染到紋理技術(shù)，將多個切片渲染到平板探測器對應(yīng)的紋理上，經(jīng)過多次渲染，將所有切片渲染到平板探測器對應(yīng)的紋理上獲得沒有校正的投影數(shù)據(jù)。③ 根據(jù)正投影的幾何參數(shù)，利用GPU可編程管線計算正投影權(quán)值，對投影數(shù)據(jù)進行校正。采用了 OpenGL快速數(shù)據(jù)傳輸擴展PBO (Pixel Buffer Object)進行切片紋理數(shù)據(jù)和投影數(shù)據(jù)的傳輸，該數(shù)據(jù)傳輸擴展不僅能加快數(shù)據(jù)在內(nèi)存和顯存之間傳輸速度，而且支持數(shù)據(jù)傳輸和GPU計算同步進行。(4) 基于GPU的CT反投影模塊① 投影數(shù)據(jù)的存儲，投影數(shù)據(jù)尺寸為M/w肌cM x M^說Zg似x ,存儲成A^mJ"g/e/4片四通道矩形紋理，紋理格式—7 G&4 ,長為M/w附^/ ,寬為 M^/^g化，每4個相鄰角度的投影數(shù)據(jù)存儲在一張紋理的四個通道中。② 重建體數(shù)據(jù)的存儲，假設(shè)重建體為A^m及，xMw^,xM/w幼"，橫切片的存儲方法是將重建體存儲成M^幼"/4片Gi: —i G^(格式的矩形紋理，長為 M/m/tow,寬為Mm7及，.每4個相鄰橫層切片的重建體數(shù)據(jù)存儲在一張紋理的四個通道中，豎切片的存儲方法是將重建體存儲成7^mi mW4片Gi^^m4格式的矩形紋理，長為7V"/7z/ cw,寬為M^幼ce，每4個相鄰豎層切片的重建體數(shù)據(jù)存儲在一張紋理的四個通道中。③ 根據(jù)CT系統(tǒng)的參數(shù)設(shè)定透視投影矩陣，CT系統(tǒng)的參數(shù)包括探測器單元的尺寸，面陣探測器的行單元個數(shù)，面陣探測器的列單元個數(shù)，射線源到轉(zhuǎn) 臺的距離，射線源到探測器的距離等。CT系統(tǒng)中射線源與圖形學(xué)中視點概念相對應(yīng)，探測器與圖形學(xué)中投影平面概念相對應(yīng)，CT錐束掃描與透視投影模式相對應(yīng)，因此根據(jù)CT系統(tǒng)參數(shù)容易計算透視投影矩陣。④ 利用投影紋理技術(shù)實現(xiàn)反投影，將投影數(shù)據(jù)紋理貼到待重建切層(橫切層或豎切層)上，紋理坐標利用待重建切層上的重建點在投影平面上的投影坐標得到。在實際應(yīng)用中有兩種方法減少顯存消耗，一種是將所有投影角度下的投影數(shù)據(jù)紋理全部反投重建一片重建體紋理后，將重建體紋理傳出顯存，因此顯存中除放置所有投影數(shù)據(jù)紋理外，只需要放置一片重建體紋理即可。另一種方法是將一片投影數(shù)據(jù)紋理或幾片投影數(shù)據(jù)紋理對所有的重建切層進行反投影，然后釋放這幾片投影數(shù)據(jù)紋理，從內(nèi)存重新讀入新的投影數(shù)據(jù)紋理，繼續(xù)對重建切層進行反投影，因此顯存中除了放置重建切層紋理外，只需要放置幾片投影數(shù) 據(jù)紋理即可。上述兩種方法的選擇需要根據(jù)實際情況中重建體大小和投影數(shù)據(jù)大小來定，如果重建體數(shù)據(jù)較大，則選擇前一種將重建切層分次重建的方法，如果投影數(shù) 據(jù)較大，則選擇后一種將投影數(shù)據(jù)紋理分次讀入的辦法。⑤ 大數(shù)據(jù)量下的重建問題，盡管④中的兩種方法都可降低顯存消耗，但是都無法解決投影數(shù)據(jù)和重建體數(shù)據(jù)均超出顯存限制的問題。當投影數(shù)據(jù)和重建體數(shù)據(jù)均超出顯存限制時，本發(fā)明采用對投影數(shù)據(jù)和重建體數(shù)據(jù)同時分塊的方法，重建體的紋理存儲采用橫切片的紋理存儲方式，然后根據(jù)顯存大小計算可以容納的切層數(shù)量，依據(jù)重建體的橫切層分塊情況對每個投影角度下的投影數(shù) 據(jù)進行分塊，也就是計算重建每一塊時所需要的每個投影下的投影數(shù)據(jù)，將它分次傳入顯存。之所以選擇橫切片的體數(shù)據(jù)存儲方式是因為每片橫切片在每個投影角度小只需要少量幾行投影數(shù)據(jù)，因此可以達到解決大數(shù)據(jù)量下的圖像重建問題。(5)模塊組合實現(xiàn)多種GPU上的CT重建算法① 圓軌跡FDK重建算法首先利用基于GPU的CT數(shù)據(jù)預(yù)處理模塊對射線強度數(shù)據(jù)進行處理，在處理的過程中投影數(shù)據(jù)的獲得和投影數(shù)據(jù)預(yù)校正同時進行；然后利用基于GPU的 CT數(shù)據(jù)濾波模塊選擇斜坡濾波器沿探測器行方向?qū)ν队皵?shù)據(jù)進行一維濾波; 利用基于GPU的CT反投影模塊進行加權(quán)反投影，權(quán)重采用實時計算的方法, 模型變換矩陣設(shè)置為繞探測器的豎直方向旋轉(zhuǎn)的旋轉(zhuǎn)變換矩陣，透視投影矩陣根據(jù)系統(tǒng)參數(shù)設(shè)置。② 錐束多次掃描數(shù)據(jù)的BPF型重建算法首先利用基于GPU的CT數(shù)據(jù)預(yù)處理模塊對射線強度數(shù)據(jù)進行處理，在處理的過程中投影數(shù)據(jù)的獲得和投影數(shù)據(jù)沿探測器行方向的求導(dǎo)同時進行;然后利用基于GPU的CT反投影模塊生成投影數(shù)據(jù)導(dǎo)數(shù)的三維反投影圖像(也稱三維 DBP圖像)，其中設(shè)置模型變換矩陣為先沿探測器的水平方向平移，再繞探測器的豎直方向旋轉(zhuǎn)的平移旋轉(zhuǎn)變換矩陣，根據(jù)系統(tǒng)參數(shù)設(shè)置透視投影矩陣；最后利用基于GPU的CT數(shù)據(jù)濾波模塊對三維DBP圖像沿行方向進行一維濾波，濾波核函數(shù)為Hilbert逆變換函數(shù)。③ 代數(shù)迭代重建算法首先利用基于GPU的CT數(shù)據(jù)預(yù)處理模塊將探測器獲取的射線強度數(shù)據(jù)轉(zhuǎn) 換成投影數(shù)據(jù)；然后給待重建的體數(shù)據(jù)付初始值，利用基于GPU的CT正投影模塊獲得投影數(shù)據(jù)的估計值；接著利用基于GPU的CT數(shù)據(jù)預(yù)處理模塊計算估計值和實際投影值的殘差；再利用基于GPU的CT反投影模塊將殘差值反投影給初始的待重建體數(shù)據(jù)。這樣就完成了一次迭代，將重建結(jié)果作為下次迭代的初始值實現(xiàn)多步迭代過程。

圖1為實采數(shù)據(jù)利用本發(fā)明重建的效果圖；圖2為圖1的局部體顯示圖；圖3為用于測試的模型的照片；圖4為基于GPU的大視野重建的DBP效果圖，圖4 (a)為主視方向的中心切層圖，圖4(b)為俯視方向的中心切層圖，圖4(c)為側(cè)視的中心切層圖；圖5為基于GPU的大視野重建的效果圖，圖5(a)為重建體的體渲染圖，圖5(b)為正視圖的中心切層圖，圖5(c)為俯視圖的中心切層圖，圖5(d)為側(cè) 視的中心切層圖。
具體實施方式
下面將結(jié)合實施例對本發(fā)明作進一步的說明。利用本發(fā)明的錐束多次掃描數(shù)據(jù)的BPF型重建算法對一次偏置大視野的CT數(shù)據(jù)進行重建，掃描模型為 Shepp-logan模型，GPU使用Nvidia的Quadro FX 4600芯片。(1) 投影數(shù)據(jù)大小為512x512x360,待重建體的大小為512x512x512，重建體數(shù)據(jù)大于投影數(shù)據(jù)，因此選取數(shù)據(jù)紋理一次存儲成紋理，重建切層分次重建的反投影方法；(2) 將投影數(shù)據(jù)存成90片長為512，寬為512，格式為GZ —i GA4的四通道32 位浮點矩形紋理，每4個相鄰角度的投影數(shù)據(jù)存儲在一張紋理的四個通道中；(3) 利用基于GPU的CT數(shù)據(jù)預(yù)處理模塊對投影數(shù)據(jù)紋理沿行方向進行求導(dǎo), 利用拷貝到紋理技術(shù)將求導(dǎo)后的投影數(shù)據(jù)替換原投影數(shù)據(jù)；(4) CT系統(tǒng)參數(shù)為探測器單元尺寸為0.127 mm,轉(zhuǎn)臺中心到探測器的距離為240 mm,轉(zhuǎn)臺中心到主射線方向的距離為50.5mm，射線源到探測器的距離為2150mm。根據(jù)上述參數(shù)設(shè)定變換矩陣，包括透視投影矩陣和模型視圖矩陣；(5) 利用基于GPU的CT反投影模塊對重建體進行反投影，獲取導(dǎo)數(shù)的反投影三維圖像，在反投影中需要根據(jù)投影地址計算符號函數(shù)和權(quán)重。重建效果如圖4所示，投影數(shù)據(jù)導(dǎo)數(shù)的反投影圖像也稱DBP圖像。(6) 利用基于GPU的CT數(shù)據(jù)濾波模塊對重建的三維圖像沿行方向進行濾波，濾波核函數(shù)為Hilbert逆變換函數(shù)。整個重建過程從硬盤數(shù)據(jù)的讀入到重建數(shù)據(jù)的硬盤保存共耗時30秒，重建效果如圖5所示。需要說明的是雖然上述的實施例闡述了本發(fā)明的模塊組合能夠?qū)崿F(xiàn)的幾種重建算法，但是本領(lǐng)域的研究人員可以理解，本發(fā)明可以將濾波反投影類重建算法、反投影濾波類重建算法、迭代類重建算法通過本發(fā)明的模塊移植到GPU上實現(xiàn)，進而來提高它們的重建速度。
權(quán)利要求
1. 一種CT圖像重建的GPU加速方法，軟件部分通常包括基于GPU的CT數(shù)據(jù)預(yù)處理模塊、基于GPU的CT數(shù)據(jù)濾波模塊、基于GPU的CT正投影模塊和基于GPU的CT圖像重建反投影模塊，通過如下步驟實現(xiàn)(1)從掃描的X射線強度數(shù)據(jù)獲得投影數(shù)據(jù)并用基于GPU的CT數(shù)據(jù)預(yù)處理模塊進行數(shù)據(jù)的去噪和去除環(huán)狀偽影的處理；(2)對投影數(shù)據(jù)用基于GPU的CT數(shù)據(jù)濾波模塊和基于GPU的CT反投影模塊采用濾波反投影型算法或反投影濾波型算法獲得重建體，或者用基于GPU的CT正投影模塊和基于GPU的CT反投影模塊采用迭代算法獲得重建體。
2. 如權(quán)利要求l所述的CT圖像重建的GPU加速方法，其特征在于掃描數(shù)據(jù)、暗場數(shù)據(jù)、亮場數(shù)據(jù)和重建體數(shù)據(jù)均存儲成32位浮點格式紋理。
3. 如權(quán)利要求2所述的CT圖像重建的GPU加速方法，其特征在于對投影數(shù)據(jù)用基于GPU的CT數(shù)據(jù)濾波模塊和基于GPU的CT反投影模塊采用濾波反投影型算法或反投影濾波型算法獲得重建體，基于GPU的CT數(shù)據(jù)濾波模塊，將數(shù)據(jù)通過GPU上FFT變換到頻域，頻域濾波后通過GPU上的逆FFT 獲得濾波后的數(shù)據(jù)。
4. 如權(quán)利要求3所述的CT圖像重建的GPU加速方法，其特征在于所述的基于GPU的CT數(shù)據(jù)濾波模塊中在GPU上實現(xiàn)FFT，其中FFT排序部分在 GPU上完成，將預(yù)算好的FFT的系數(shù)和蝶式索引存成紋理，通過多次渲染實現(xiàn) 蝶式運算，通過拷貝到紋理技術(shù)將處理后的數(shù)據(jù)替換原投影數(shù)據(jù)。
5. 如權(quán)利要求2所述的CT圖像重建的GPU加速方法，其特征在于用基于GPU的CT正投影模塊和基于GPU的CT反投影模塊采用迭代算法獲得重建體，基于GPU的CT正投影模塊，采用了GPU的可編程管線，實現(xiàn)多種掃描模式的模擬。
6. 如權(quán)利要求5所述的CT圖像重建的GPU加速方法，其特征在于所述的基于GPU的CT正投影模塊，采用正投影權(quán)值實時計算的并行算法。
7. 如權(quán)利要求3或5所述的CT圖像重建的GPU加速方法，其特征在于所述的基于GPU的CT反投影模塊根據(jù)系統(tǒng)參數(shù)來設(shè)置變換矩陣，包括投影變換矩陣和模式變換矩陣。
8. 如權(quán)利要求7所述的CT圖像重建的GPU加速方法，其特征在于所述的基于GPU的CT反投影模塊中將鄰近四角度投影數(shù)據(jù)存儲在一張紋理的四個通道，分別計算投影矩陣。
9. 如權(quán)利要求7所述的CT圖像重建的GPU加速方法，其特征在于所述的基于GPU的CT反投影模塊中將鄰近4片切層體數(shù)據(jù)存儲在一張紋理的四個通道。
10. 如權(quán)利要求8或9所述的CT圖像重建的GPU加速方法，其特征在于所述的基于GPU的CT反投影模塊根據(jù)計算機顯存配置對重建體進行分塊重建。
全文摘要
一種基于GPU硬件加速的CT圖像重建方法，屬于X射線CT技術(shù)領(lǐng)域。本發(fā)明軟件部分通常包括基于GPU的CT數(shù)據(jù)預(yù)處理模塊、基于GPU的CT數(shù)據(jù)濾波模塊、基于GPU的CT正投影模塊和基于GPU的CT圖像重建反投影模塊。本發(fā)明利用GPU硬件實現(xiàn)了對CT圖像重建算法的加速，重建部分和數(shù)據(jù)處理部分均在GPU上完成。針對目前GPU顯存不足以及內(nèi)存到顯存數(shù)據(jù)傳輸速度慢的瓶頸問題，提出了對大數(shù)據(jù)處理采用分塊處理方法，與已有方法不同，本分塊方法對每塊待重建體重建時只需要用到部分投影數(shù)據(jù)，減少了數(shù)據(jù)傳輸，從而可提高整個體重建速度。
文檔編號A61B6/03GK101283913SQ20081011384
公開日2008年10月15日申請日期2008年5月30日優(yōu)先權(quán)日2008年5月30日
發(fā)明者堯張, 朋張, 張慧滔, 濤楊, 星趙, 陳德峰申請人:首都師范大學(xué)

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張慧滔;趙星;張堯;陳德峰;楊濤;張朋
技術(shù)所有人：首都師范大學(xué)
我是此專利的發(fā)明人

上一篇：具有鎮(zhèn)痛活性的化合物及其制備方法和應(yīng)用的制作方法
上一篇：一種人體理療裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、司老師：1.制漿造紙 2.植物資源精細化工與化學(xué) 3.生物質(zhì)精煉 4.天然產(chǎn)物化學(xué)
2、薛老師：1.CRISPR-Cas系統(tǒng) 2.基因編輯 3.基因修復(fù) 4.天然產(chǎn)物合成 5.單分子技術(shù)開發(fā)與應(yīng)用
3、戴老師：1.天然藥物（中藥）合成生物學(xué)研究 2.酵母生物學(xué)與工程化研究
4、孟老師：1. 基于糖類的抗腫瘤藥物的合成和活性評價及糖類疫苗的研制 2.功能糖類的化學(xué)酶法合成及構(gòu)效關(guān)系研究 3.多糖及仿生材料功能的開發(fā)及應(yīng)用
5、滿老師：1.天然產(chǎn)品的提取分離與活性研究 2.天然產(chǎn)物活性與安全性評價 3.中藥組方配伍機制研究
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

ct圖像重建方法相關(guān)技術(shù)

超分辨率圖像重建相關(guān)技術(shù)

圖像重建相關(guān)技術(shù)

ct圖像重建相關(guān)技術(shù)

超分辨率圖像重建代碼相關(guān)技術(shù)

ct圖像重建算法相關(guān)技術(shù)

圖像重建算法相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

Ct圖像重建的gpu加速方法