基于cuda架构的gpu并行加速双能谱ct重建方法

文档序号:8923267阅读:361来源:国知局
基于cuda架构的gpu并行加速双能谱ct重建方法
【技术领域】
[0001] 本发明涉及X射线CT技术领域双能CT解析重建算法,尤其涉及一种基于CUDA架 构的GPU并行加速双能谱CT解析重建方法。
【背景技术】
[0002] 对于CT加速领域,采用GPU加速已经成为重要的方法,而具体的加速方法是提高 CT产品的处理速度的关键环节,既是本领域技术人员研宄的核心技术,也直接决定产品的 市场竞争力。
[0003] 与单能CT重建不同,双能CT重建并不是前者的简单重复执行,而具有其特殊性。 双能CT解析重建算法分为后处理重建和预处理重建两种算法。其中,后处理重建和单能 CT解析重建方法一致,是对投影数据直接重建,获得被检物的高低能线衰减系数信息,重建 的形状精度较好,但由于不能从根本上消除射术硬化效应,重建的被检物材料精度难以保 证;而预处理重建与后处理算法相比,预处理重建算法要对双能投影数据进行分解,预处理 重建算法分为"基效应分解模型"和"基材料分解模型"两种模型,两种模型是统一的,对分 解后的基材料(或基效应)投影数据进行重建,再根据基材料的重建图像计算等效原子序 数和电子密度图像。这种预处理算法理论上可以得到不受能谱影响的被检物的等效原子序 数和电子密度信息,重建的材料精度较高。双能CT重建想要同时获得上述四种重建图像信 息,时间因素是算法能否实际应用的关键。
[0004] 如现有技术中,公开号为:101283913,名称:CT图像重建的GPU加速方法,该发明 专利申请公开了一种基于GPU硬件加速的CT图像重建方法,该发明软件部分通常包括基 于GPU的CT数据预处理模块、基于GPU的CT数据滤波模块、基于GPU的CT正投影模块和 基于GPU的CT图像重建反投影模块,该发明利用GPU硬件实现了对CT图像重建算法的加 速,重建部分和数据处理部分均在GPU上完成,通过对大数据处理采用分块处理方法,对每 块待重建体重建时只需要用到部分投影数据,减少了数据传输,从而可提高整个体重建速 度。
[0005] 又如现有技术中,公开号为:101596113,名称:一种CT并行重建系统及成像方法, 该发明专利申请公开了一种CT并行重建系统及其成像方法,该发明所述系统包括前端采 样器、中心节点、以及与所述中心节点连接的多个子节点,每个所述子节点均安装有图形 处理器。该发明所述成像方法包括如下步骤:1)将重建图像划分为多个BLOCK区域;2)中 心节点接收前端采样器所采集的各角度下的原始投影数据;3)中心节点为各节点分配计 算任务,每个分配了计算任务的子节点计算一个或多个BLOCK区域的重建值;4)各子节点 完成所分配的重建计算;5)中心节点组合出完整的重建图像。该发明采取划分重建图像子 区域的方法充分挖掘CT扫描及重建的并行特性,在数据采集的同时进行GPU的并行重建, 重建时间由现有技术的分钟级降低为毫秒级,达到准实时的被测对象的断层图像重建显 不〇
[0006] 由此可知,现有技术基本上都是利用GPU并行实现单一的CT图像重建过程,以达 到加速图像重建的目的,由于CT重建本身计算量大,耗时高,算法速度一直是CT相关算法 能否在实际中使用的关键影响因素,对于双能CT解析重建算法中预处理重建算法的特殊 性,现有技术中并没有给出有针对性的完善的并行加速解决方法,基于上述现有技术中的 不足,这也成为双能CT解析重建算法发展过程中亟待解决的问题。

【发明内容】

[0007] 为了弥补现有技术的缺陷,本发明提供一种基于CUDA架构的GPU并行加速双能谱 CT解析重建方法,结合双能CT重建的特点,提供一种基于CUDA架构利用GPU的并行能力, 进行双能CT快速解析重建同时获得四幅重建图像的方法,S卩:后处理重建的高低能线衰减 系数图像和预处理重建的等效原子序数和电子密度图像。
[0008] 为了实现上述目的,本发明所述采取的技术解决方案是:本发明所述一种基于 CUDA架构的GPU并行加速双能谱CT解析重建方法,所述方法包括以下基本步骤:
[0009] S1 :高低能采样数据快速配准;
[0010] S2 :并行计算原始投影数据及投影分解和投影加权;
[0011] S3 :双能投影或者分解投影同步快速卷积滤波;
[0012] S4 :同时并行反投影重建几类图像;
[0013] 进一步的,也可以包括:
[0014] S5 :由分解重建图像计算等效原子序数图像和电子密度图像。
[0015] 根据不同应用,上述步骤也可以调整为S1对原始投影数据进行快速配准;S2双能 投影分解和投影加权。
[0016] 进一步的,其中所述步骤S1的具体特征为:
[0017] S11 :所述高低能采样数据由双能谱CT系统采样获得,其双能谱为通过快速切换 射线源产生的真实双能谱或者通过使用双层夹心探测器获得的伪双能谱;
[0018] S12 :所述双能谱CT系统的扫描模式为圆周扫描或者螺旋扫描;双能均采用顺时 针扫描或者逆时针扫描;
[0019] S13 :所述双能谱CT系统的探测器为单排探测器或者多排探测器或者面阵探测 器;
[0020] S14 :所述的CT系统相关参数在GPU设备端定义为常量参数,并在初始化时赋值, 以便加快GPU内核函数对其访问的速度;
[0021] S15:所述的配准是为保证双能CT预处理投影分解重建算法的分解精度,先对双 能采样数据进行视角配准,其特征在于:
[0022] S16:所述的双能快速配准使用计算最大互相关系数方法,为加速将计算双能二维 采样数据的互相关系数简化为对采样数据进行一维投影,再计算双能一维投影的互相关系 数;
[0023] S17 :采用GPU并行方式对高低能采样进行局部探测器单元数据二值化,并对二值 化后的数据进行行方向的一维投影;
[0024] S18 :通过双能一维投影的卷积实现计算互相关系数加速,使用CUFFT对双能采样 的一维投影变换到频域进行,获得互相关系数数组,寻找数组中最大互相关系数所在位置 即为配准需要调整的行数。
[0025] 进一步地,其中所述步骤S2的具体特征在于:
[0026] S21 :计算原始双能投影为加快读取数据的速度,将采样数据和空采明场数据都存 储在纹理存储器中;
[0027] S22:基于查找表实现双能投影分解,初始化时将预先离线生成的"投影分解查找 表"存储到显存的二维纹理存储器以便提高读取速度,该查找表纹理采用非归一化的浮点 型拾取坐标,将高低能投影值作为横纵坐标查找对应的分解投影值,并利用纹理存储器硬 件实现的线性模式滤波功能对读取的浮点型返回值进行插值,实现快速高精度双能投影分 解;
[0028] S23:在同一内核函数中按照像素级并行先计算高低能原始投影数据,再利用高低 能原始投影数据到查找表纹理中查找分解投影数据,并对原始投影和分解投影的同时进行 加权操作。根据具体应用场景不同,加权值可以离线计算后,初始化时导入显存纹理中,在 加权操作时读取,或者在该内核函数中实现同步计算该像素点的加权值。在同一内核函数 中同时实现上述计算的优点在于节省存取中间结果的时间,加快处理速度。
[0029] 进一步地,其中所述步骤S3的具体特征在于:
[0030] S31 :滤波过程中使用CUDA架构提供的基于GPU的快速傅里叶变换函数库CUFFT;
[0031] S32 :初始化时将滤波核用FFT变换到频域,并存储到一维纹理存储器中,以便在 频域运算时加快读取速度;
[0032] S33 :同步进行双能和双分解后投影的FFT变换,利用复数的实部和虚部同时进行 高低能投影的FFT变换或者分解后的双投影的FFT变换;
[0033] S34 :利用FFT同时处理一批一维离散傅里叶变换,并将变换后的复数值存储到复 数纹理以便计算频域点积时加快读取速度;
[0034] S35:使用同一内核函数同步对双能和双分解后频域投影进行与滤波核的点积计 算,将滤波后的结果数据绑定到纹理存储器,以便反投影重建时加快读取速度。
[0035] 进一步地,其中所述步骤S4的具体特征在于:
[0036] S41 :采用像素驱动的反投影重建,不存在对存储重建图像的全局显存的"写冲 突";
[0037] S42 :同一内核函数中按照像素级并行进行几类图像反投影重建,同一线程完成四 种类型重建图像的同一像素位置的反投影计算,即同时完成高低能线衰减系数图像和两种 分解图像中各自的同一像素位置的重建;
[0038] S43 :重建图像存储在全局存储器中,内核函数内部使用寄存器变量临时存储计算 用的变量,计算过程中不访问全局存储器,每个内核函数完成X个均匀分布视角的反投影 计算,计算完X个视角后再给全局存储器的相应像素位置赋值,以便节省反投影重建的访 存时间,根据具体应用环境不同,该X=N/M。N为扫描一圈采集的全部视角;M为用来并行 处理视角的线程数量,且能够被N整除,M等于1时,对重建的像素点不存在"写冲突",可以 不使用原子加操作进行写入全局存储器,当M大于1时,
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1