基于机器学习的胸部扫描图像分类方法与流程

文档序号:27426775发布日期:2021-11-17 20:33阅读:190来源:国知局
基于机器学习的胸部扫描图像分类方法与流程

1.本发明涉及医学图像识别,特别涉及一种基于机器学习的胸部扫描图像分类方法。


背景技术:

2.图像中的目标分割或识别在医学领域广泛应用。断层扫描图像已经能够自动收集肺部组织的纳米级图像。一个新的趋势是使用机器学习,通过训练计算机模拟人类的边缘判断来提高诊断准确性,例如确定成像组织中的肿瘤的范围。现有技术利用基于局部图像特征的边缘检测。图像中的像素被自动标记为边缘与目标,并且基于标记的像素,图像被分割成目标。边缘像素的自动标记可以基于参数技术,并且在训练过程中确定参数,其中使用一组训练图像及对应的边缘标记来确定在处理未知图像时要使用的参数。这种方法的精确度取决于图像中被正确识别为属于图像中相同或不同目标的像素对的平均数量,如果在训练样本扫描图像的自动确定的分割和在标记过程中确定的训练分割之间进行逐像素匹配,则将对图像处理的实时性带来不良的影响。


技术实现要素:

3.为解决上述现有技术所存在的问题,本发明提出了一种基于机器学习的胸部扫描图像分类方法,包括:从肺部样本中接收包括表示多个目标的肺部图像的像素的扫描图像数据,并将图像分割函数应用于扫描图像数据,分割参数用于根据图像分割函数来控制图像分割模块的操作;接收包括多个训练图像的像素的训练样本扫描图像和训练图像的相应训练分割数据,并产生分割参数,所述训练分割数据表征训练图像中多个目标的空间位置和训练图像中像素位置对的单个目标的连通性;所述分割参数根据参数选择函数来选择,所述参数选择函数包括根据基于以下标准来选择分割参数:像素位置对之间的路径连通性,包括非相邻像素位置之间的路径连通性,以及训练图像中目标的拓扑结构;以及成本函数,所述成本函数取决于使用分割参数应用图像分割函数的输出;其中所述图像分割函数根据包括表示肺部图像的像素的扫描图像数据和分割参数来确定像素位置对之间的连通性,以及根据所确定的像素位置对之间的连通性来形成片段;并且确定训练数据的相邻像素对之间的加权连通性,其中形成所述片段包括,对所述加权连通性应用阈值以形成二进制连通性,并且识别经由相邻像素上的序列连接的像素;所述参数选择函数包括用于更新分割参数的第一子函数和用于将训练分割数据与来自应用图像分割函数的输出进行比较的第二子函数。
4.优选地,所述参数选择函数迭代训练图像中的多对像素位置,并且对于每对像素位置,根据相邻像素对之间的估计连通性对所述图像的估计分割的贡献,来识别所述像素
对位置之间的路径上的相邻像素对,并且更新影响所述相邻像素之间的估计加权连通性的分割参数的子集。
5.优选地,所述参数选择函数迭代训练图像中的多对像素位置,包括多对不相邻的像素位置,并且对于每对像素位置,识别该对像素位置之间的路径上的两个像素位置之间的边,所识别的边表示该对像素位置之间的最小边的像素位置对的路径上的最大值。
6.优选地,所述图像分割函数根据所述肺部图像的扫描数据和所述分割参数,将标记确定为背景或目标,并根据所确定的标记形成所述片段。
7.优选地,其中所述更新分割参数包括,根据分割数据的估计像素标记和像素标记之间的匹配来应用梯度更新;该方法还包括,交替执行更新分割参数的第一子函数和训练分割数据的第二子函数。
8.本发明相比现有技术,具有以下优点:本发明提出了一种基于机器学习的胸部扫描图像分类方法,不需要在样本扫描图像训练和标记过程中进行逐像素匹配,并且保证胸部扫描图像分类的精确度。
附图说明
9.图1是根据本发明实施例的基于机器学习的胸部扫描图像分类方法的流程图。
具体实施方式
10.下文与图示本发明原理的附图一起提供对本发明一个或者多个实施例的详细描述。结合这样的实施例描述本发明,但是本发明不限于任何实施例。本发明的范围仅由权利要求书限定,并且本发明涵盖诸多替代、修改和等同物。在下文描述中阐述诸多具体细节以便提供对本发明的透彻理解。出于示例的目的而提供这些细节,并且无这些具体细节中的一些或者所有细节也可以根据权利要求书实现本发明。
11.本发明的一方面提供了一种基于机器学习的胸部扫描图像分类方法。图1是根据本发明实施例的基于机器学习的胸部扫描图像分类方法流程图。该方法包括步骤一:从肺部样本中接收包括表示多个目标的肺部图像的像素的扫描图像数据,并将图像分割函数应用于扫描图像数据,分割参数用于根据图像分割函数来控制图像分割模块的操作;步骤二:接收包括多个训练图像的像素的训练样本扫描图像和训练图像的相应训练分割数据,并产生分割参数,训练分割数据表征训练图像中多个目标的空间位置和训练图像中像素位置对的单个目标的连通性;其中分割参数根据参数选择函数来选择,参数选择函数包括根据基于以下标准来选择分割参数:像素位置对之间的路径连通性,包括非相邻像素位置之间的路径连通性,以及训练图像中目标的拓扑结构;以及成本函数,成本函数取决于使用分割参数应用图像分割函数的输出;其中图像分割函数根据包括表示肺部图像的像素的扫描图像数据和分割参数来确定像素位置对之间的连通性,以及根据所确定的像素位置对之间的连通性来形成片段;并且确定训练数据的相邻像素对之间的加权连通性,其中形成片段包括,对加权连通性应
用阈值以形成二进制连通性,并且识别经由相邻像素上的序列连接的像素;参数选择函数包括用于更新分割参数的第一子函数和用于将训练分割数据与来自应用图像分割函数的输出进行比较的第二子函数。
12.参数选择函数迭代训练图像中的多对像素位置,并且对于每对像素位置,根据相邻像素对之间的估计连通性对图像的估计分割的贡献,来识别像素对位置之间的路径上的相邻像素对,并且更新影响相邻像素之间的估计加权连通性的分割参数的子集。
13.可选地,参数选择函数迭代训练图像中的多对像素位置,包括多对不相邻的像素位置,并且对于每对像素位置,识别该对像素位置之间的路径上的两个像素位置之间的边,所识别的边表示该对像素位置之间的最小边的像素位置对的路径上的最大值。
14.图像分割函数根据肺部图像的扫描数据和分割参数,将标记确定为背景或目标,并根据所确定的标记形成片段。
15.更新分割参数包括,根据分割数据的估计像素标记和像素标记之间的匹配来应用梯度更新;并且交替执行更新分割参数的第一子函数和训练分割数据的第二子函数。
16.具体而言,在步骤一中,首先在断层扫描设备处理肺部组织的样本以产生三维图像数据,例如在像素位置的直线排列中的每个体素位置提供强度等级。图像分割模块处理图像数据并产生分割数据。分割数据包括根据每个单独目标的不同标记。这种标记为分段。图像分割模块在训练阶段中根据分割参数来配置。在具体的示例中,临床医生可以提供分割参数的输入数据。
17.在步骤二中,确定分割参数的训练过程使用训练样本扫描图像,训练样本扫描图像包括断层扫描设备对于相应的一组肺部样本的输出。训练样本扫描图像在人工标记过程中被标记,以产生训练分割数据。训练分割数据识别训练样本扫描图像中目标的位置,为相应图像数据中的所有像素提供分割值。参数选择模块与图像分割模块相通信,参数选择模块处理训练样本扫描图像和相应的训练分割数据,以产生图像分割模块用于未知图像的分割参数。在本发明描述的方法中,参数选择模块选择分割参数以匹配训练图像中目标的整体结构,而不需要再现训练样本扫描图像的自动确定的分割和在标记过程中确定的训练分割之间的逐像素匹配。
18.在边缘分类过程中,首先将图像数据传递到边缘分类器。分类器输出加权相似度图,加权相似度图提供了连接图像中相邻像素的每个边缘属于同一目标相对于形成目标之间的边缘的数值表示。分类器利用分割参数,分割参数使用下面描述的过程来训练。加权相似度图通过阈值函数将数值表示转换成二进制相似度图,并且组件标识符从二进制相似度形成连接的组件,以在图像分割模块的输出端产生分割数据。
19.分割参数的训练包括更新边缘分类器的参数,以集中在显著影响分割结果的加权亲和图中的边缘。根据与连接相邻像素的每个边相关联的边缘相似性数据来确定计算机分割。为了将训练集中在影响分割的边上,在训练中考虑像素对。校正该误差的训练集中在特定边缘上。沿着路径的连通性根据最小相似性值来评估,并且具有最大这种最小值的路径被归因于误差。通过考虑彼此固定距离内的像素对和从人工标记的子集中选择的像素对,并且对于识别图像中对训练数据分割贡献最大的部分即边缘的每对像素,在分类器权重的重新训练中,对导致组件错误合并或分裂的边进行更高的加权,从而将训练集中在由加权相似性数据确定的整体分割的精度上。
20.初始训练使用一组图像i和对应的真实像素分类s*。误差函数e定义如下:通过改变w而最小化误差函数e,例如,使用基于梯度的增量训练。其中l为图中的所有边的集合。w为估计参数。m(l;i;w)为给定图像i和估计参数w,为边l生成的超度量。表示图中边l的相异度。
21.考虑像素对i和j的选择。计算连接节点的极小极大边是l
i,j
(最大值),因此m
i,j
=ml
i,j
(最大值)。训练数据指定真实度量应当为m
i,j
*。
22.对应于一对节点i和j的极小极大边对误差函数的贡献计算为:其中表示从i到j的路径上的极小极大边,定义为,如果节点i和j在一个连接的组件中,则=0,否则为。
23.分割和合并的训练过程是迭代随机的节点对(i,j),并且对于每个节点对,根据所述误差函数来更新权重w。
24.给定根据参数w确定的链路相异度m
l
,为图的节点形成最小生成树。生成树形成子图,使得对于任意一对节点i和j,极小极大边位于生成树中从i到j的路径上。
25.在具有随机节点对(i,j)的迭代中,极小极大边位于生成树中,并且更新w的参数。在更新参数之后,根据更新的参数重新计算生成树的一部分,并且迭代继续。
26.所述图像分割模块利用像素分类器,像素分类器接受输入图像数据并产生加权图,其为每个像素位置提供范围[0,1]内的值。较大的值表示像素在目标中的确定性较大,较低的值表示像素在背景中的确定性较大。将加权图输入组件识别器中进行处理,组件识别器输出分割数据作为分割模块的输出。
[0027]
像素分类器使用的分割参数的训练过程的目标是找到将图像块映射到中心像素被标记为“1”的概率估计的函数,本文称为图像块分类器。如果将分类器应用于图像中以所有位置为中心的面片,将生成输出图像。考虑相同图像的二进制机器标记t和人工标记l*。优化像素误差时,理想情况下,希望最小化t和l*之间的二进制差异:σ
i
δ(t
i
,l
i*
),其中像素位置i的机器和人工标记分别用t
i
和l
i
*表示。
[0028]
图像块分类器是将图像块映射到中心像素作为边缘的概率估计的函数。像素分类器的输出为边缘图f
i
(w),其中i是图像,w指定分割参数中的可调参数。在标量值θ将边缘图中的模拟值进行阈值化,以产生二进制边缘标记h(f
i
(w)

θ),其中图像量化函数h(m)表示应用于图m中每个像素位置的阶跃函数。
[0029]
在监督学习阶段,相对于分类器参数(w)的像素误差||h(f
i
(w)

θ)

l*||2的最小化,其中l是同一图像的人工边缘标记。并通过平方误差:d(f
i
(w)

l)=∑
i
||f
i
(w)

l
i
||来优化依赖于分类器实值输出的平滑代价函数。
[0030]
其中f
i
(w)和l
i
分别为位置i的边缘图和人工边缘标记。
[0031]
由于平方误差成本函数平滑地依赖于分类器的模拟输出,梯度下降可以用于寻找局部最小值。
[0032]
对于分割参数的任何选择,找到训练分割的最佳变形以匹配从像素分类器输出的边缘图。具体来说,本发明将翘曲误差定义为:d(t||l*)=min
l<l*
||t

l||2翘曲误差用于优化分类器权重,将权重选择表示为相对于w来优化d(f
i
(w)||l*)。即:min(h(f
i
(w)

θ)||l*)使用卷积网络二进制误差的平滑近似。优选地,所述卷积网络包含6个隐藏层、每个隐藏层中的24个特征图以及相邻层中特征图之间的连通性。每个单独的过滤器有5
×
5个像素。
[0033]
在其他实施例中,可以使用对重要边缘或像素分类参数的其他聚焦。例如,在像素分类方法中,某些像素的正确分类的重要性可能因像素而异,因此可以使用对重要像素的加权。此外,更新极大极小边缘的参数的方法可以集中于所有边缘,根据它们接近极大极小值的程度来加权其贡献。
[0034]
本发明的技术方案基于训练分类器来将每个像素位置分类为肿瘤对非肿瘤,或者将相邻位置分类为相同和不同的目标,例如,两个肿瘤或两个正常肿瘤之间的过渡/边缘。
[0035]
对于大小为n的数据集i,形成一个有n个节点的全连通图。根据上述方法形成参数化链路度量的w的初始估计。为对新数据点进行分类,使用训练的超度量来识别与新数据点最近的训练数据点,以根据在训练数据中找到的类别之一对新数据点进行分类。参数估计方法包括基于未知数据集的部分标记或校正来适配参数。
[0036]
基于上述分割算法,在进一步的实施例中,将其应用于检测肺结节生长,具体包括:分别接收在时间戳t1和t2生成的胸部扫描图像a1和a2;从胸部扫描图像a1和a2中确定图像数据中肺结节的位置;从胸部扫描图像a1和a2分割与肺组织相关联的扫描图像数据;通过先后执行全局对准和局部对准来配准来自胸部扫描图像a1和a2的与肺组织相关联的分割图像数据;从来自胸部扫描图像a1和a2的与肺组织相关联的配准和分割图像数据中分割与肺结节相关联的扫描图像数据;然后使用来自胸部扫描图像a1和a2的与肺结节相关联的分割图像数据来确定胸部扫描图像a1和a2之间肺结节的体积变化。
[0037]
其中,分割与肺组织相关联的扫描图像数据包括,对于胸部扫描图像a1和a2,通过对肺组织体素之间的空间相互作用和肺组织体素的强度分布进行建模来分割与肺组织相关联的扫描图像数据。具体地,在对所述肺组织体素之间的空间相互作用和所述肺组织体素的强度分布进行建模过程中,使用具有正负分量的离散高斯模型的线性组合来估计肺组织的边缘密度;从离散高斯模型生成肺组织的初始分割;估计马尔可夫随机条件场模型的空间相互作用参数;并使用离散高斯模型和马尔可夫随机条件场模型来细化肺组织的初始分割。
[0038]
在配准与所述肺组织相关联的分割图像数据时,首先将来自胸部扫描图像a1和a2的与肺组织相关联的分割图像数据变换到吉布斯能量场;使用将吉布斯能量最大化的仿射平移来执行与来自胸部扫描图像a1和a2的肺组织相关联的分割图像数据的全局对准;在执行全局对准之后,通过基于吉布斯能量匹配为与来自胸部扫描图像a1和a2的肺组织相关联
的分割图像数据生成的表面,执行与来自胸部扫描图像a1和a2的肺组织相关联的分割图像数据的局部对准。
[0039]
综上所述,本发明提出了一种基于机器学习的胸部扫描图像分类方法,不需要在样本扫描图像训练和标记过程中进行逐像素匹配,并且保证胸部扫描图像分类的精确度。
[0040]
显然,本领域的技术人员应该理解,上述的本发明的各模块或各步骤可以用通用的计算系统来实现,它们可以集中在单个的计算系统上,或者分布在多个计算系统所组成的网络上,可选地,它们可以用计算系统可执行的程序代码来实现,从而,可以将它们存储在存储系统中由计算系统来执行。这样,本发明不限制于任何特定的硬件和软件结合。
[0041]
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边缘、或者这种范围和边缘的等同形式内的全部变化和修改例。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1