一种局灶性病灶的非参数自动检测方法与流程

文档序号:11732728阅读:188来源:国知局
一种局灶性病灶的非参数自动检测方法与流程
本发明涉及医学图像中的病灶自动检测方法,具体来说涉及一种医学图像中局灶性病灶的非参数自动检测方法。

背景技术:
在临床诊断中,医学图像中的病灶检测和分割十分重要,因为所提取的病灶区域可以为医生提供病灶的解剖结构信息,并为后续的治疗和病人跟踪提供依据。然而,人工检测和分割病灶区域非常费时,由于一些病灶组织与其周围的正常组织对比度不明显,不同的临床专家所分割的病灶区域可能存在差异,容易增加后续诊断和跟踪的难度。针对人工检测和分割病灶区域的不足,研究人员提出了很多自动检测和分割病灶的方法。其中大多数自动检测病灶的方法都是基于建立参数化模型,通过训练样本来学习和调整模型中的参数,然后使用模型对图像中的像素点或区域进行分类判别,判断其是否属于病灶边界或病灶区域。这种基于参数化模型的病灶检测和分割方法有几点不足:首先,针对不同的训练样本(如:不同的病灶类型图像),该方法都需要重新训练模型中的参数,不够简便;其次,由于训练样本一般比较少,从而参数模型会产生过拟合的现象,即对于训练样本能很好地进行分类判断,但是对于样本集以外的数据分类性能较差。相对于参数模型,非参数模型不需要经过训练阶段,因此,非参数模型使用简便,而且可以避免参数模型中的过拟合问题。现有技术中,在计算机视觉领域,基于词袋(BagofVisualWords,BoW)模型的方法是进行图像分类的常用方法。词袋模型需要对图像局部描述子进行量化,而量化会降低图像局部描述子的鉴别能力。因此,针对现有技术不足,提供一种能精确检测局灶性病灶的非参数自动检测方法甚为必要。

技术实现要素:
本发明的目的在于针对现有技术不足,提供一种医学图像中局灶性病灶的非参数自动检测方法,该方法不需预先建立参数化模型,且不需要对图像局部描述子进行量化,应用灵活,图像局部描述子鉴别能力强,能精确检测局灶性病灶。本发明的上述目的通过如下技术方案实现。一种局灶性病灶的非参数自动检测方法,预先以已经勾画好病灶的医学病灶图像作为样本构建样本集A1数据库,分别提取样本集A1中每一幅图像的目标区域和背景区域的局部描述子,得到样本集A1中所有目标区域局部描述子组成的目标特征库F1和样本集A1中所有背景区域局部描述子组成的背景特征库F2;处理时具体包括下列步骤:(1)将待处理的医学病灶图像I分为多个子区域;(2)用NBNN分类器对每个子区域进行分类;(3)计算目标函数,得到病灶检测结果。步骤(1)具体是将待处理的医学病灶图像I进行过分割,第i个小区域记为Ri。优选的,步骤(1)具体是采用超像素算法将待处理的医学病灶图像I进行过分割。步骤(2)用NBNN分类器对每个小区域进行分类,具体包括:(2.1)对区域Ri内的每个像素点提取其局部描述子,记为fj,用区域Ri内的所有局部描述子组成Ri的特征集Fi′,Fi′={fj,j=1,...,n},其中,n为区域Ri内局部描述子的个数;(2.2)用NBNN分类器对区域Ri进行分类:区域Ri分类属于某个类别C的最大后验概率为:C*=argmaxCp(C|Ri)=argmaxCp(Ri|C)……(Ⅰ),其中,C∈{+1,-1},+1表示目标区域,-1表示背景区域;在朴素贝叶斯假设的条件下,区域Ri中的每一个像素点对应的局部描述子fj是相互独立的,故:C*=argmaxClog(p(Ri|C))=argmaxC∑ilogp(fj|C)……(Ⅱ);将式(Ⅱ)中logp(fj|C)用高斯核密度估计进行近似,令k=1,可得:其中,NNC(fj)表示在类别C特征库中与fj最相近的局部描述子,σ表示标准偏差;将式(Ⅲ)中的p(fj|C)代入式(Ⅱ),得:C*=argminC∑j||fj-NNC(fj)||2……(Ⅳ);定义Dist(Ri,C)=∑j||fj-NNC(fj)||2为区域Ri到某个类别C的距离;NBNN分类算法的目标就是找到使区域Ri到某个类别C距离最小的那个类别,即NBNN分类器对区域Ri的分类结果为:步骤(3)具体为:定义目标函数g(Ri)=Dist(Ri,-1)-Dist(Ri,+1),对于图像I进行计算,选出g(Ri)>0的区域作为病灶检测的结果。优选的,具体通过如下方式获得样本集A1的目标特征库F1和背景特征库F2:(0.1)定义作为样本的医学病灶图像中的病灶区域为目标区域,病灶以外区域为背景区域,对目标区域内的每个像素点提取其局部描述子;对背景区域内的每个像素点同样提取其局部描述子,其中,像素点对应的局部描述子的提取过程如下所述:(0.1.1)以该像素点为圆心,分别按照半径R=﹛20、21、22、23、24、……、2n﹜像素作圆,其中n为自然数,得到一系列半径在对数尺度等间隔变化的同心圆,令最大的同心圆的半径Rmax=16像素,得到5个同心圆;(0.1.2)以所述圆心为起点沿8个方向画直线,8个方向的直线将圆面均分为八等份,并取这8条直线与所述的5个同心圆的相交的像素点,把圆心以及这些与同心圆相交的像素点以从圆心向外的顺序、并以逆时针方向排列成一个队列,然后将队列中,位于图像内的像素点分别替换为所对应的灰度值,位于图像外的像素点的灰度值分别赋予零,得到该像素点的灰度特征向量;(0.1.3)获取该像素点在图像上的坐标(x,y),对(x,y)进行归一化处理得到归一化的坐标(x′,y′),即x′=x/w,y′=y/h,其中,w和h分别为图像的宽和长,把步骤(0.1.2)中所得到的灰度特征向量与坐标(x′,y′)首尾连接排列成新的向量,得到该像素点的局部描述子;(0.2)把步骤(0.1)中所产生的样本集A1中所有目标区域的局部描述子组成目标特征库F1,同样,把所有背景区域的局部描述子组成背景特征库F2。本发明的一种局灶性病灶的非参数自动检测方法,具有以下的有益效果:由于目标特征库F1和背景特征库F2都是直接从样本集A1中每幅图像的每个像素点提取局部描述子集合得到的,不需要经过局部描述子量化,从而完整地保留了局部描述子的鉴别能力。本发明使用非参数的NBNN分类方法来对图像进行分类,避免了参数模型的建立,以及参数的训练过程,从而增加了临床使用的便捷性。本发明以超像素(superpixel)为基本单元来判断区域的类别,相比于以像素点为单位的分类方法,更能获得稳定的类别估计。故,本发明的一种医学图像中局灶性病灶的非参数自动检测方法,不需预先建立参数化模型,且不需要对图像局部描述子进行量化,应用灵活,图像局部描述子鉴别能力强,能精确检测局灶性病灶。附图说明利用附图对本发明作进一步的说明,但附图中的内容不构成对本发明的任何限制。图1为本发明一种局灶性病灶的非参数自动检测方法的流程示意图;图2为本发明方法用于肝部CT图像局灶性病灶检测的示例图,其中,编号为Ⅰ的轮廓线是用本发明的非参数模型得到的局灶性病灶的检测结果;编号为Ⅱ的轮廓线是局灶性病灶的手工勾画结果。具体实施方式下面结合具体的实施例对本发明进行详细描述。实施例1。本发明的一种局灶性病灶的非参数自动检测方法,如图1所示,预先以已经勾画好病灶的医学病灶图像作为样本构建样本集A1数据库,分别提取样本集A1中每一幅图像的目标区域和背景区域的局部描述子,得到样本集A1中所有目标区域局部描述子组成的目标特征库F1和样本集A1中所有背景区域局部描述子组成的背景特征库F2。具体通过如下方式获得样本集A1的目标特征库F1和背景特征库F2:(0.1)定义作为样本的医学病灶图像中的病灶区域为目标区域,病灶以外区域为背景区域,对目标区域内的每个像素点提取其局部描述子;对背景区域内的每个像素点同样提取其局部描述子。其中,像素点对应的局部描述子的提取过程如下所述:(0.1.1)以该像素点为圆心,分别按照半径R=﹛20、21、22、23、24、……、2n﹜像素作圆,其中n为自然数,得到一系列半径在对数尺度等间隔变化的同心圆,所取半径越大,相应的局部描述子的描述能力越强,但所产生的特征维数也越高,会导致计算量增加,为了平衡计算量和描述力,令最大的同心圆的半径Rmax=16像素,得到5个同心圆;(0.1.2)以所述圆心为起点沿8个方向画直线,8个方向的直线将圆面均分为八等份,并取这8条直线与(0.1.1)所述的5个同心圆的相交的像素点,把圆心以及这些与同心圆相交的像素点以从圆心向外的顺序、并以逆时针方向排列成一个队列,然后将队列中,位于图像内的像素点分别替换为所对应的灰度值,位于图像外的像素点的灰度值分别赋予零,得到该像素点的灰度特征向量;(0.1.3)获取该像素点在图像上的坐标(x,y),对(x,y)进行归一化处理得到归一化的坐标(x′,y′),即x′=x/w,y′=y/h,其中,w和h分别为图像的宽和长,把步骤(0.1.2)中所得到的灰度特征向量与坐标(x′,y′)首尾连接排列成新的向量,得到该像素点的局部描述子;(0.2)把步骤(0.1)中所产生的样本集A1中所有目标区域的局部描述子组成目标特征库F1,同样,把所有背景区域的局部描述子组成背景特征库F2。处理时具体包括下列步骤:(1)将待处理的医学病灶图像I分为多个子区域;具体是将待处理的医学病灶图像I进行过分割,优选采用超像素算法将待处理的医学病灶图像I进行过分割,过分割即把I分成一系列大小几乎一致的,连续同质的小区域,第i个小区域记为Ri,一般来说,I中的病灶区域都包含1个或以上相连的小区域。(2)用NBNN分类器对每个子区域进行分类。步骤(2)用NBNN分类器对每个小区域进行分类,具体包括:(2.1)对区域Ri内的每个像素点提取其局部描述子,记为fj,用区域Ri内的所有局部描述子组成Ri的特征集Fi′,Fi′={fj,j=1,...,n},其中,n为区域Ri内局部描述子的个数;(2.2)用NBNN分类器对区域Ri进行分类:区域Ri分类属于某个类别C的最大后验概率为:C*=argmaxCp(C|Ri)=argmaxCp(Ri|C)……(Ⅰ),其中,C∈{+1,-1},+1表示目标区域,-1表示背景区域;在朴素贝叶斯假设的条件下,区域Ri中的每一个像素点对应的局部描述子fj是相互独立的,故:C*=argmaxClog(p(Ri|C))=argmaxC∑ilogp(fj|C)……(Ⅱ);将式(Ⅱ)中logp(fj|C)用高斯核密度估计进行近似,其中,当类别C中的样本数Nc足够大时,logp(fj|C)可以进一步用k近邻来近似,在NBNN分类算法中,令k=1,可得:其中,NNC(fj)表示在类别C特征库中与fj最相近的局部描述子,σ表示标准偏差;将式(Ⅲ)中的p(fj|C)代入式(Ⅱ),得:C*=argminC∑j||fj-NNC(fj)||2……(Ⅳ);定义Dist(Ri,C)=∑j||fj-NNC(fj)||2为区域Ri到某个类别C的距离;NBNN分类算法的目标就是找到使区域Ri到某个类别C距离最小的那个类别,分别计算区域Ri中所包含的局部描述子fj到目标特征库F1和背景特征库F2中的各个局部描述子的距离,即计算Dist(Ri,+1)和Dist(Ri,-1)。由于目标特征库F1和背景特征库F2所包含的局部描述子的数量是非常巨大的,如果对Ri中每个局部描述子都要分别找到其在F1和F2中最接近的局部描述子,是十分费时的,因此,采用随机KD-树来解决这个问题;NBNN分类算法的目标就是找到使区域Ri到某个类别C距离最小的那个类别,即NBNN分类器对区域Ri的分类结果为:(3)计算目标函数,得到病灶检测结果。步骤(3)具体为:定义目标函数g(Ri)=Dist(Ri,-1)-Dist(Ri,+1),对于图像I进行计算,选出g(Ri)>0的区域作为病灶检测的结果。本发明的一种局灶性病灶的非参数自动检测方法,(1)由于目标特征库F1和背景特征库F2都是直接从样本集A1中每幅图像的每个像素点提取局部描述子集合得到的,不需要经过局部描述子量化,从而完整地保留了局部描述子的鉴别能力;(2)本发明使用非参数的NBNN分类方法来对图像进行分类,避免了参数模型的建立,以及参数的训练过程,从而增加了临床使用的便捷性;(3)本发明以超像素(superpixel)为基本单元来判断区域的类别,相比于以像素点为单位的分类方法,更能获得稳定的类别估计。故,本发明的一种医学图像中局灶性病灶的非参数自动检测方法,不需预先建立参数化模型,且不需要对图像局部描述子进行量化,应用灵活,图像局部描述子鉴别能力强,能精确检测局灶性病灶。实施例2。以一具体实施例对本发明的方法进行说明。本实施例所使用的数据库存有458幅肝部CT图像样本集,其中包括:肝癌178幅、肝囊肿98幅、肝血管瘤182幅,且每张CT图像已人工勾画好了病灶轮廓。以下参照图1详细描述通过所述数据库中CT图像的局灶性病灶的非参数自动检测方法。读取所述数据库中的已勾画好病灶的CT图像,把所有图像分为2份,其中一份作为建立特征库的样本集,记为样本集A1,剩下一份作为测试样本集,记为样本集A2。对样本集A1中的每一幅CT图像进行以下处理:首先对图像进行预处理,其过程为:由于在CT图像中,肝脏及其病灶的灰度值在[-50,250]HU的范围内,因此,可以用阈值化方法把图像中的空气、脂肪和骨头等部分去掉;把预处理后剩下的最大连通区域作为后续计算的感兴趣区域,经过预处理这一步骤,可以减少后续计算的计算量。(0.1)定义CT图像中的病灶区域为目标区域,病灶以外、感兴趣区域以内的区域为背景区域,对目标区域内的每个像素点提取其局部描述子,同样,对背景区域内的每个像素点提取其局部描述子;其中,某个像素点对应的局部描述子的提取过程如下所述:(0.1.1)以该像素点为圆心,分别按照半径R=﹛20、21、22、23、24、……、2n﹜像素作圆,其中n为自然数,得到一系列半径在对数尺度等间隔变化的同心圆,所取半径越大,相应的局部描述子的描述能力越强,但所产生的特征维数也越高,会导致计算量增加,为了平衡计算量和描述力,我们令最大的同心圆的半径Rmax=16像素,可得到5个同心圆。(0.1.2)以步骤(0.1.1)所述的圆心为起点,向东、西、南、北、东北、西北、西南、东南等8个方向画直线,并取这8条直线与步骤(0.1.1)所述的5个同心圆的相交的像素点,把圆心点以及这些与同心圆相交的像素点以从圆心向外的顺序,并以逆时针方向排列成一个队列,然后将队列中,位于图像内的像素点分别替换为所对应的灰度值,位于图像外的像素点的灰度值分别赋予零,从而得到该点的灰度特征向量。(0.1.3)获取该像素点在图像上的坐标(x,y),对(x,y)进行归一化处理得到归一化的坐标(x′,y′),即x′=x/w,y′=y/h,其中,w和h分别为图像的宽和长,把步骤(0.1.2)中所得到的灰度特征向量与坐标(x′,y′)首尾连接排列成新的一个向量,便得到该像素点的局部描述子。(0.2)把步骤(0.1)中所产生的样本集A1中所有目标区域的局部描述子组成目标特征库F1,同样,把所有背景区域的局部描述子组成背景特征库F2。对样本集A2的任一幅CT图像,用NBNN方法对病灶进行自动检测;具体包括:首先把该CT图像记为I,对I进行预处理,用阈值化方法把图像中的空气、脂肪和骨头等部分去掉;把预处理后剩下的最大连通区域作为后续计算的感兴趣区域ROI。(1)对图像I实行过分割,过分割可以采用超像素算法(superpixelalgorithms),即把I分成一系列大小几乎一致的,连续同质的小区域,第i个小区域记为Ri,一般来说,I中的病灶区域都包含1个或以上相连的小区域。(2)在此,我们只针对I中的ROI区域,对ROI区域中的每个小区域进行以下处理:(2.1)对区域Ri内的每个像素点提取其局部描述子,记为fj,用区域Ri内的所有局部描述子组成Ri的特征集Fi′,Fi′={fj,j=1,...,n},其中,n为区域Ri内局部描述子的个数;(2.2)用NBNN分类器对区域Ri进行分类:区域Ri分类属于某个类别C的最大后验概率为:C*=argmaxCp(C|Ri)=argmaxCp(Ri|C)……(Ⅰ),其中,C∈{+1,-1},+1表示目标区域,-1表示背景区域;在朴素贝叶斯假设的条件下,区域Ri中的每一个像素点对应的局部描述子fj是相互独立的,故:C*=argmaxClog(p(Ri|C))=argmaxC∑ilogp(fj|C)……(Ⅱ);将式(Ⅱ)中logp(fj|C)用高斯核密度估计进行近似,其中,当类别C中的样本数Nc足够大时,logp(fj|C)可以进一步用k近邻来近似,在NBNN分类算法中,令k=1,可得:其中,NNC(fj)表示在类别C特征库中与fj最相近的局部描述子,σ表示标准偏差;将式(Ⅲ)中的p(fj|C)代入式(Ⅱ),得:C*=argminC∑j||fj-NNC(fj)||2……(Ⅳ);定义Dist(Ri,C)=∑j||fj-NNC(fj)||2为区域Ri到某个类别C的距离;NBNN分类算法的目标就是找到使区域Ri到某个类别C距离最小的那个类别,分别计算区域Ri中所包含的局部描述子fj到目标特征库F1和背景特征库F2中的各个局部描述子的距离,即计算Dist(Ri,+1)和Dist(Ri,-1)。由于目标特征库F1和背景特征库F2所包含的局部描述子的数量是非常巨大的,如果对Ri中每个局部描述子都要分别找到其在F1和F2中最接近的局部描述子,是十分费时的,因此,采用随机KD-树来解决这个问题;NBNN分类算法的目标就是找到使区域Ri到某个类别C距离最小的那个类别,即NBNN分类器对区域Ri的分类结果为:(3)计算目标函数,得到病灶检测结果。步骤(3)具体为:定义目标函数g(Ri)=Dist(Ri,-1)-Dist(Ri,+1),对于图像I进行计算,选出g(Ri)>0的区域作为病灶检测的结果。图2是本发明用于肝部CT图像局灶性病灶检测的结果示例图,其中,编号为Ⅰ的轮廓线是用本发明所述的非参数模型得到的局灶性病灶的检测结果;编号为Ⅱ的轮廓线是局灶性病灶的手工勾画结果。从图2可以看出,使用本发明的方法能够比较精确地检测局灶性病灶。本发明的一种局灶性病灶的非参数自动检测方法,(1)由于目标特征库F1和背景特征库F2都是直接从样本集A1中每幅图像的每个像素点提取局部描述子集合得到的,不需要经过局部描述子量化,从而完整地保留了局部描述子的鉴别能力;(2)本发明使用非参数的NBNN分类方法来对图像进行分类,避免了参数模型的建立,以及参数的训练过程,从而增加了临床使用的便捷性;(3)本发明以超像素(superpixel)为基本单元来判断区域的类别,相比于以像素点为单位的分类方法,更能获得稳定的类别估计。故,本发明的一种医学图像中局灶性病灶的非参数自动检测方法,不需预先建立参数化模型,且不需要对图像局部描述子进行量化,应用灵活,图像局部描述子鉴别能力强,能精确检测局灶性病灶。最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1