显微ct机用gpu数字图像系统及其控制方法

文档序号:921966阅读:182来源:国知局
专利名称:显微ct机用gpu数字图像系统及其控制方法
技术领域
本发明属于显微CT机成像系统领域,尤其是一种加快并行图像处理速度、从而可在便携式显微CT机上使用的显微CT机用GPU数字图像系统及其控制方法。
背景技术
目前,显微CT机成像系统图像处理速度慢、使用范围受到限制。

发明内容
本发明的目的是提供一种加快并行图像处理速度、从而可在便携式显微CT机上使用的显微CT机用GPU数字图像系统及其控制方法。本发明的技术方案是:显微CT机用GPU数字图像系统,其特征是由为成像光源(I)、CMOS或CXD成像器
(3)、嵌入式成像和光源控制系统(6)、精密机电耦合XYZ和旋转被测物体成像平台(12)、Linux Os为基础的CPU运算平台(15)组成,其中,成像光源(I)通过RS232串行线与嵌入式成像和光源控制系统(6)连接;CMOS或CXD成像器(3)的成像聚集导轨(9)与嵌入式成像和光源控制系统(6)中的步进电机驱动单元阵列(10)连接;精密机电耦合XYZ和旋转被测物体成像平台(12)与光源控制系统(6)中的步进电机驱动单元阵列(10)连接;Linux Os为基础的CPU运算平台(15)通过路由器(14)与光源控制系统(6)连接。显微CT机用GPU数字图像系统的控制方法,其特征是包括下列步骤:步骤26:主机CPU启动CMOS或CXD成像器,成像器经过控制函数API获取数字图像 I Inner(x, y);步骤27:检测该数字图像的X方向和Y方向的解析度Rx、Ry ;步骤28:假若GPU的本地内存25为MEM_local大于数字图像I Inner (x,y)的2.5倍,则执行步骤29 ;否则将数字图像I Inner (X,y)分割成子图像I Inner_sub (x, y),使得本地内存MEM_local大于子图像的2.5倍,然后执行步骤29 ;步骤29:将数字图像I Inner (X,y)全部读入该内存中,步骤30:对存于TPC内存中的图像或子图像进行二维拉普拉斯-高斯算子卷积:第一步:首先选取两维卷积用高斯核kernel, G(x, y; x0, yO, S),如式(I),其中x0,y0设定为0,0点,S根据图像质量选取,常见选取值为[2,3],x,y的单位为像素(pixel):G(x, y;x0, yO, u, S)=I/ (sqrt (2 pi) *S) exp {[ (χ-χ0) '2+ (y-y0) '2) ] / (2 S*S)}…(I)第二步:对高斯核进行拉普拉斯算子运算,如式(2):d2/dx2+d2/dy2 [G (x, y; x0, yO, u, S) ]...(2)第三步:使用式(2) 二维拉普拉斯-高斯算子对GPU本地内存中的数字图像进行两维卷积运算,即G(z, y;uz, uy, S)*I (Z, y),并将运算结果存储于GPU本地内存中;步骤31:检查是否对数字图像I Inner (X,y)分割后的每个子图像都进行了读入TPC本地内存,并进行了步骤30第三步的处理,如果没有,则执行步骤29,如果是,则结束。本发明的效果是:本发明采用基于GPU图形图像处理显卡组成的CPU-GPU系统实现便携式显微CT (Computed Tomography)机使用的并行高速二维拉普拉斯-高斯算子数字图像处理。所述CPU-GPU系统优化了线程处理阵列(TPC,Thread Processing Clus ter)与被处理图像解析度(resolution)的优化稱合,通过嵌入式实时图像获取系统的软件驱动函数将图像解析参数与CPU-GPU算法结合,优选了图像分割阵列处理,简化了 CPU与GPU之间的图像数据交换,将每个线程处理阵列拥有的N(SP)个流处理器(SP, Stream Processor)流多处理器(SM, Streaming Multiprocessor)的运算进行了并行优化处理,解决了 GPU没有分支预测机制,因此在分支得到机会执行之前运算被挂起,等待所有的分支路径执行完成的运算瓶颈,加快了并行图像处理速度,从而可在便携式显微CT机上使用。实现对二维拉普拉斯-高斯算子数字图像处理的并行高速处理,加速微小物体三维断层扫描数字成像计算。下面结合附图和实施例对本发明做进一步的说明。


图1是本发明的结构示意图;图2是图1中显微CT用GPU系统结构示意图;图3是本发明的控制流程图。
具体实施例方式图1中,显微CT机用GPU数字图像系统,由为成像光源1、CM0S或CXD成像器3、嵌入式成像和光源控制系统6、精密机电耦合XYZ和旋转被测物体成像平台12、Linux Os为基础的CPU运算平台15组成。其中,成像光源I通过RS232串行线与嵌入式成像和光源控制系统6连接;CM0S或CCD成像器3的成像聚集导轨9与嵌入式成像和光源控制系统6中的步进电机驱动单元阵列10连接;精密机电耦合XYZ和旋转被测物体成像平台12与光源控制系统6中的步进电机驱动单元阵列10连接;Linux Os为基础的CPU运算平台15通过路由器14与光源控制系统6连接。图中,2为被测三维物体;3为CMOS或CCD成像器,该成像器形成数字图像IInner (X,y) ;4为光源主射线RCenter (ray equation) ; 5为在光源S下形成的角锥状投影(CONE Pro jection)的边缘射线RPeripheral ;7为连接X光源到嵌入式控制系统的RS232串行线;8为CMOS或CCD成像器的USB控制连线;9为成像聚集导轨,该导轨含有快进和微调慢进功能;11为连接步进电机驱动单元阵列到成像聚集导轨步进电机的控制线;12为精密机电耦合XYZ和旋转被测物体成像平台,该平台具有XYZ和旋转四维自由度;13为连接步进电机驱动单元阵列到精密机电稱合XYZ和旋转被测物体成像平台步进电机的控制线。图2中,17为CPU平台的内存; 18为CPU ;19为GPU单元的多个线程处理阵列TPC ;20为线程处理阵列的控制单元;21为流处理器SP ;22为多个流处理器SP组成的一个流多处理器SM ;23为流多处理器的本地内存;24为流多处理器的特殊函数单元SFU ;25为线程处理阵列TPC的本地内存。图3中,显微CT机用GPU数字图像系统的控制方法,包括下列步骤:步骤26:主机CPU启动CMOS或CXD成像器,成像器经过控制函数API获取数字图像 I Inner(x, y);步骤27:检测该数字图像的X方向和Y方向的解析度Rx、Ry ;步骤28 HggGPU的本地内存25为MEM_local大于数字图像I Inner (x,y)的2.5倍,则执行步骤29 ;否则将数字图像I Inner (X,y)分割成子图像I Inner_sub (x, y),使得本地内存MEM_local大于子图像的2.5倍,然后执行步骤29 ;步骤29:将数字图像I Inner (X,y)全部读入该内存中,步骤30:对存于TPC内存中的图像或子图像进行二维拉普拉斯-高斯算子卷积:第一步:首先选取两维卷积用高斯核kernel, G(x, y; x0, yO, S),如式(I),其中x0,y0设定为0,0点,S根据图像质量选取,常见选取值为[2,3],x,y的单位为像素(pixel):G(x, y;x0, yO, u, S)=I/ (sqrt (2 pi) *S) exp {[ (χ-χΟ)'2+(y-yO) ~2) ] / (2S*S)}…(I)第二步:对高斯核进行拉普拉斯算子运算,如式(2):d2/dx2+d2/dy2 [G (x, y; x0, yO, u, S) ]...(2)第三步:使用式(2) 二维拉普拉斯-高斯算子对GPU本地内存中的数字图像进行两维卷积运算,即G(z, y;uz, uy, S)*I (z, y),并将运算结果存储于GPU本地内存中;步骤31:检查是否对数字图像I Inner (X,y)分割后的每个子图像都进行了读入TPC本地内存,并进行了步骤30第三步的处理,如果没有,则执行步骤29,如果是,则结束。本发明的主要功能为:1、采用基于GPU图形图像处理显卡组成的CPU-GPU系统实现便携式显微CT(Computed Tomography)机的并行图像处理功能。2、采用CPU-GPU处理平台,并实现了其线程处理阵列(TPC, Thread ProcessingCluster)与被处理图像解析度(resolution)的优化稱合,通过嵌入式实时图像获取系统的软件驱动函数将图像解析参数与CPU-GPU算法结合,优选了图像分割阵列处理,简化了CPU与GPU之间的图像数据交换,将每个线程处理阵列拥有的N(SP)个流处理器(SP, StreamProcessor)流多处理器(SM, Streaming Multiprocessor)的运算进行了并行优化处理,解决了 GPU没有分支预测机制,因此在分支得到机会执行之前运算被挂起,等待所有的分支路径执行完成的运算瓶颈, 加快了并行图像处理速度。
权利要求
1.显微CT机用GPU数字图像系统,其特征是由为成像光源(I)、CMOS或CXD成像器(3)、嵌入式成像和光源控制系统(6)、精密机电耦合XYZ和旋转被测物体成像平台(12)、Linux Os为基础的CPU运算平台(15)组成, 其中,成像光源(I)通过RS232串行线与嵌入式成像和光源控制系统(6)连接;CM0S或CXD成像器(3)的成像聚集导轨(9)与嵌入式成像和光源控制系统(6)中的步进电机驱动单元阵列(10)连接;精密机电耦合XYZ和旋转被测物体成像平台(12)与光源控制系统(6)中的步进电机驱动单元阵列(10)连接;Linux Os为基础的CPU运算平台(15)通过路由器(14)与光源控制系统(6)连接。
2.如权利要求1所述的显微CT机用GPU数字图像系统的控制方法,其特征是包括下列步骤: 步骤26:主机CPU启动CMOS或CXD成像器,成像器经过控制函数API获取数字图像IInner(X,y); 步骤27:检测该数字图像的X方向和Y方向的解析度Rx、Ry ; 步骤28:假若GPU的本地内存25为MEM_local大于数字图像I Inner (x, y)的2.5倍,则执行步骤29 ;否则将数字图像IInner (X,y)分割成子图像I Inner_sub (x, y),使得本地内存MEM_local大于子图像的2.5倍,然后执行步骤29 ; 步骤29:将数字图像I Inner (x,y)全部读入该内存中, 步骤30:对存于TPC内存中的图像或子图像进行二维拉普拉斯-高斯算子卷积:第一步:首先选取两维卷积用高斯核kerne I, G(x, y; x0, yO, S),如式(I),其中x0, y0设定为0,O点,S根据图像质量选取,常见选取值为[2,3], X, y的单位为像素(pixel):G(x, y;x0, yO, u, S)=` I/ (sqrt (2pi) *S) exp {[ (x_x0) '2+ (y-yO) ~2) ] / (2S*S)}...(I) 第二步:对高斯核进行拉普拉斯算子运算,如式(2): d2/dx2+d2/dy2[G(x, y;x0, yO, u, S)]...(2) 第三步:使用式(2) 二维拉普拉斯-高斯算子对GPU本地内存中的数字图像进行两维卷积运算,即G(z, y;uz, uy, S)*I (z, y),并将运算结果存储于GPU本地内存中; 步骤31:检查是否对数字图像I Inner (x,y)分割后的每个子图像都进行了读入TPC本地内存,并进行了步骤30第三步的处理,如果没有,则执行步骤29,如果是,则结束。
全文摘要
一种加快并行图像处理速度、从而可在便携式显微CT机上使用的显微CT机用GPU数字图像系统。技术方案是其特征是由为成像光源(1)、CMOS或CCD成像器(3)、嵌入式成像和光源控制系统(6)、精密机电耦合XYZ和旋转被测物体成像平台(12)、LinuxOs为基础的CPU运算平台(15)组成。本发明还公开了其控制方法。
文档编号A61B6/03GK103099635SQ201210581660
公开日2013年5月15日 申请日期2012年12月27日 优先权日2012年12月27日
发明者李华 申请人:李华
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1