一种乳腺癌风险评估中乳腺密度定量化计算的方法与流程

文档序号:17942117发布日期:2019-06-18 23:12阅读:471来源:国知局
一种乳腺癌风险评估中乳腺密度定量化计算的方法与流程

本发明涉及医学图像处理领域,尤其涉及一种乳腺癌风险评估中乳腺密度定量化计算的方法。



背景技术:

乳腺癌风险评估模型分为两类,一类是经验性风险模型如gail模型,另一类是侧重基因突变的ibis模型。其中gail模型最常用,该模型用来评估计算个性化乳腺癌患癌的风险值,包括多个与乳腺癌相关的风险因子,模型给予各风险因子不同的权重系数,经加权组合计算得到一个量化的患癌风险值。gail模型中的风险因子包括体重、年龄、乳腺腺体类型、月经初潮和绝经时间、哺乳喂养情况、bmi指数、吸烟或饮酒情况、精神压力情况等,其中乳腺腺体类型主要是依靠经验丰富的影像医生依据乳腺影像报告和数据系统(bi-rads)给出乳腺致密等级。乳腺腺体类型仅给出了腺体密度的定性估计,若能给出腺体密度的定量计算值将使得评估模型更加精确。

目前最常用的腺体密度定量化计算方法是基于影像医生手工交互式的半自动化的腺体分割方法,影像医生通过在影像归档和通信系统(pacs)下手工勾绘出乳房中腺体轮廓线,系统工具中自动计算出轮廓线内腺体的像素个数和,腺体密度值等于腺体内像素个数和与整体乳房像素个数和的比值。

基于影像医生手工交互式的半自动化的腺体分割方法往往受影像医生的主观性因素影响较大,结果不够客观;虽然依据乳腺影像报告和数据系统(bi-rads)的指导,但是医生影像也存在疲劳阅片的情况,视觉上的疲劳往往会导致乳腺轮廓分割出现误差。因此,有必要提出一种对乳腺腺体进行客观判断的方法,以辅助医生对乳腺癌风险进行判断。



技术实现要素:

本发明的目的在于克服基于影像医生手工交互式半自动化的腺体分割方法存在误差的缺陷,提供一种全自动的乳腺腺体分割方法,能够定量计算出乳房中腺体的密度值。

本发明解决其技术问题所采用的技术方案是:

一种乳腺癌风险评估中乳腺密度定量化计算的方法,具体包括以下步骤:

步骤1、对乳腺钼靶原始图像预处理,进行直方图均衡化、高斯滤波、下采样;

步骤2、从预处理过的乳腺钼靶图像中分割乳房区域,检测到乳房外边缘线和胸肌内边缘线,进而得出乳房区域大小;

步骤3、对乳房区域中的像素使用模糊c均值作无监督聚类,得到聚类簇;

步骤4、提取聚类簇区域的特征,将聚类簇合并归类到腺体和脂肪两类中,对聚类簇作二分类识别;

步骤5、对乳房区域进行二分类,训练线性判别lda分类器;

步骤6、根据分类结果计算出乳房区域中的腺体部分的像素个数,即腺体大小。

作为优选的技术方案,所述步骤1的乳腺钼靶原始图像选自mlo钼靶图和cc钼靶图。

作为优选的技术方案,所述步骤2具体包括:

步骤2.1:求取预处理的钼靶图像的灰度强度直方图,直观的区分出背景空气区域和乳房区域的像素分布图,从图中找出背景空气和乳腺区域的区分阈值,从而提取出乳房区域的边缘;

步骤2.2:通过canny边缘算子初步提取乳房区域的边缘图,再使用霍夫变换来获得乳房区域的二维极坐标化的直线参数直方图,而胸肌边缘直线近似位于极坐标的确定角度范围;

步骤2.3:以所述提取的内外边缘线为界,分割得到的区域即为乳房,经过二值化处理后,统计内部像素个数,即为乳房区域大小。

作为优选的技术方案,所述步骤3具体包括:

步骤3.1:首先自适应地选取簇个数,对乳房区域使用零均值正态分布归一化处理,再使用高斯滤波器对乳腺区域图像平滑滤波,将处理后的乳房灰度直方图的峰值个数作为聚类簇的个数,设置簇个数上限阈值,当峰值个数超过上限阈值时,取上限阈值个数作为簇个数;

步骤3.2:对乳房区域像素值进行归一化和下采样处理,设置初始聚类中心,使用模糊c均值对初始中心值按像素值等比例计算,求出乳房图像中每个像素到每个中心的距离,以距离最小为评价函数,多次迭代直到聚类中心不变为止,计算出乳房区域每个像素到每个簇中心的距离;

步骤3.3:接着对乳房区域中属于每个簇的像素进行标注,将乳房区域分成簇个数的子区域图像,并以乳房中每个像素到各簇中心的欧式距离绘制每个簇区域的能量谱图,从能量谱图中大致可以看出各簇在乳房中的区域分布图。

作为优选的技术方案,所述步骤4中的聚类簇作二分类识别,具体方法为使用灰度共生矩阵提取乳房整体和各子区域的纹理特征,包括对比度、相关度、能量、熵和异质性;使用区域描述算子提取乳房整体和各子区域相关属性值,包括区域像素数、最小矩形边界、质心;计算乳房图像的三阶矩值、四阶矩值、偏态值和峰度值;计算每个子区域像素的均值、偏度值和峰度值、相联区域密度差、紧凑度。

作为优选的技术方案,所述步骤5中乳房区域进行二分类的方法包括:首先给训练集中每个样本图像中每个聚类簇区域作标签,需要经验丰富的影像医生手工对训练集中的每个样本图像的每个聚类簇区域分别作标签,再使用标好签的图像数据来训练lda分类器模型,最后使用该lda分类器对乳房图像作二分类,区分出乳房中的腺体区域和脂肪区域。

作为优选的技术方案,所述步骤6中腺体大小可以用于计算腺体密度值,计算公式为:腺体密度值=腺体像素个数/乳房像素个数。

通过以上技术方案,相对于现有技术,本发明具有以下有益效果:依据人工智能算法和大数据技术来分析乳腺钼靶图像,从乳房图像中自动分割出腺体区域,近而计算出腺体密度值。与半自动交互式方法相比,该方法的计算结果更加客观,同时也减轻了影像医生大量阅片的负担。

附图说明

下面结合附图和实施例对本发明进一步说明。

图1是本发明实施例中的乳房腺体组织密度定量化计算方法流程图;

图2是本发明实施例中某乳房钼靶mlo原始图像;

图3是本发明实施例中同一乳房区域二值图;

图4是本发明实施例中同一乳房初始聚类簇个数对应的灰度直方峰值图;

图5是本发明实施例中同一乳房子区域簇的密度能量谱图;

图6是本发明实施例中同一乳房子区域标签能量谱图;

图7本发明实施例中同一乳房乳房轮廓(外部)及腺体轮廓(内部)图。

具体实施方式

现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。

图1为本发明一个实施例的乳房腺体组织密度定量化计算方法流程图。如图所示,所述方法包括以下步骤:

步骤1、对如图2所示的乳腺钼靶原始图像预处理,进行直方图均衡化去除原始图像干扰、高斯滤波、下采样。

步骤2、从预处理的乳腺钼靶原始图像中分割乳房区域,检测到乳房外边缘线和胸肌内边缘线,具体步骤包括:

2.1求取预处理的钼靶图像的灰度强度直方图,直观的区分出背景空气区域和乳房区域的像素分布图,从图中找出背景空气和乳腺区域的区分阈值,从而提取出乳房区域的边缘;

2.2通过canny边缘算子初步提取乳房区域的边缘图,再使用霍夫变换来获得乳房区域的二维极坐标化的直线参数直方图,而胸肌边缘直线近似位于极坐标的确定角度范围,计算出二值化后的乳房区域的像素个数,即为乳房区域大小。

步骤3、对乳房区域中的像素使用模糊c均值作无监督聚类,进而将乳房划分成多个聚类簇,构成聚类簇集,具体步骤为:

3.1首先自适应地选取簇个数,对乳房区域使用零均值正态分布归一化处理,再使用高斯滤波器对乳腺区域图像平滑滤波,将处理后的乳房的灰度直方图的峰值个数作为聚类簇中心;

3.2对乳房区域像素值进行归一化和下采样处理,设置初始聚类中心,使用模糊c均值对初始中心值按像素值等比例计算求得,求出乳房图像中每个像素到每个中心的距离,以距离最小为评价函数,多次迭代直到聚类中心不变为止,计算乳房区域每个像素到每个簇中心的距离;

由此对乳房区域中属于每个簇的像素进行标注,将乳房区域分成簇个数的子区域图像,并以乳房中每个像素到各簇中心的欧式距离绘制每个簇区域的能量谱图,从能量谱图中大致可以看出各簇在乳房中的区域分布图。

步骤4、提取聚类簇区域的特征,乳房区域内部主要是由腺体和非腺体的脂肪两部分组成,将步骤3得到的聚类簇合并归类到腺体和脂肪两类中,即对聚类簇作二分类识别,对各簇提取合适的特征,对每个聚类簇子区域提取的特征有灰度直方图统计特征(如曲率、峰度)、灰度纹理特征(如能量、熵)、形态描述子(如紧凑度和周长)。

步骤5、乳房区域的二分类,训练线性判别lda分类器,首先要给训练集中每个样本图像中每个聚类簇区域作标签,需要经验丰富的影像医生手工对集中训练每个样本图像的每个聚类簇区域分别作标签,再使用标好签的图像数据来训练lda分类器模型,最后使用该lda分类器对乳房图像作二分类,获得腺体区域部分。

步骤6、根据分类结果计算出乳房区域中的腺体部分的像素个数,即腺体大小,腺体密度值=腺体像素个数/乳房像素个数。

乳腺钼靶图像通常包含了内侧斜位(mlo)和头足位(cc)两个方位的左、右侧乳房四张影像图,cc位的影像仅包含了乳房部分,而mlo位的影像还包含胸肌部分,需要先将胸肌分割去除,本发明将以较复杂的某乳房钼靶mlo原始图像2来进行分析。

实施例一

本发明一个实施例的乳房腺体组织密度定量化计算方法,具体包括以下步骤:

步骤1、对如图2所示的钼靶mlo原始图像预处理,具体的操作包括对像素取对数、取反、求平方使得原本不太规范的图像归一标准化;再使用三次样条插值对像素大小为2294*1914的图像作四倍降采样得到像素大小为574*479的图像,在保证有用信息不被模糊的前提下提高后续算法的处理速度。

步骤2、从预处理的钼靶mlo图像中分割出完整的乳房区域,图像包括胸肌、乳房和空气背景三部分区域。首先分割乳房外轮廓,即乳房和空气背景的轮廓线,乳房和空气背景之间存在明显的边缘线,求取预处理的钼靶图像灰度强度直方图,直观的找出阈值区分出空气背景和乳房区域;其次分割乳房内轮廓,即乳房和胸肌的轮廓线,此处默认轮廓线为直线,使用霍夫变换得乳房区域的二维极坐标化的直线参数直方图,而胸肌边缘直线近似位于极坐标角度40o-80o之间。最终获得分割后完整的如图3所示的乳房区域二值图,使用四倍上采样获得原始图像的乳房区域,统计乳房区域像素个数,计为tp。

步骤3、使用无监督聚类算法分割乳房区域,本发明使用自适应模糊c均值算法分割乳房。首先自适应地选取聚类簇个数,对乳房区域像素值使用零均值正态分布归一化处理,再用高斯滤波器平滑滤波,从而获得处理后的乳房灰度直方图,最终以直方图中的峰值个数为簇的个数,设置簇个数的上限为15,得到如图4所示的初始聚类簇中心的灰度直方图峰值图;其次设置簇中心值,初始中心值取像素区域的均值,求每个像素到15个簇中心的距离,以距离最小为评价函数,迭代直到簇中心不变为止,从而将乳房分成15个子区域,计算每个子区域到各自簇中心的欧式距离,并作归一化获得各子区域簇的密度能量谱图5,对各子区域标签,画出乳房子区域的标签能量谱图6。

步骤4、对各子区域提取特征,此处提取每个子区域的相关特征量,以便下一步对乳房分类。分别使用灰度共生矩阵提取乳房整体和各子区域的纹理特征,包括对比度、相关度、能量、熵和异质性;使用区域描述算子提取乳房整体和各子区域相关属性值,包括区域像素数、最小矩形边界、质心;计算乳房图像的三阶矩值、四阶矩值、偏态值和峰度值;计算每个子区域像素的均值、偏度值和峰度值、相联区域密度差、紧凑度。

步骤5、使用线性判别分类器lda对乳房区域二分类,识别出乳房中致密性的腺体部分和非致密的脂肪部分。训练样本集由资深影像医生手工对15个子区域标签为腺体或者脂肪,对训练集中各样本的各子区域提取特征,使用该特征集来训练lda分类器模型,最终使用训练成熟的lda分类器来识别测试集中的样本的各子区域的类别。

步骤6、使用lda分类器识别出乳房区域中的腺体部分,计算出腺体部分的像素个数,计为bp;乳腺密度=bp/tp*100%;最终绘制出乳房轮廓(红色线)及腺体轮廓(绿色线),如图7所示。

现有的影像医生只能依据乳腺影像报告和数据系统对乳腺密度作定性化等级划分,给出的等级结果往往具有很强的主观性,同时还存在疲劳阅片带来的错误。本发明能够实现乳房中乳腺组织的全自动化分割,实现腺体组织的精准化定量计算,进一步计算出乳腺密度值,在给出客观结果的同时大大减轻了影像医生的负担。

以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1