一种医疗图像分类模型训练方法、医疗图像分类方法

文档序号:37888964发布日期:2024-05-09 21:32阅读:12来源:国知局
一种医疗图像分类模型训练方法、医疗图像分类方法

本发明涉及深度学习领域,具体来说,涉及深度学习领域中的医疗图像分类技术,更具体地说,涉及基于深度神经网络模型的医疗图像分类技术,即一种医疗图像分类模型训练方法、医疗图像分类方法。


背景技术:

1、近年来,深度学习已经成为人工智能领域最重要的技术之一。因强大的数据特征表达能力,深度神经网络模型已经被成功应用到众多视觉识别任务中并取得了显著的突破,如物体检测、语义分割和医疗图像分类等。深度神经网络模型的成功源于其大量的模型参数对任务模式的学习,而这一过程需要大量的标注数据进行模型训练。在传统的深度神经网络模型训练中,标注数据的类别分布往往受人为调整而变得均衡,即不同类别的样本数量无明显差别。

2、而在实际应用中,如医疗图像分类任务,自然采集的医疗图像数据类别通常表现为长尾分布,即一小部分医疗图像类别拥有大量的样本(正常医疗图像),而其余的大部分类别只有较少的样本(异常医疗图像)。这样的数据分布特性会使得深度神经网络模型在训练的过程中,往往会过于关注拥有大量样本的类别(正常医疗图像),而忽视拥有小部分样本的类别(异常医疗图像)。也就是说,在长尾数据下训练的深度神经网络模型容易偏向训练数据中的正常医疗图像,即正常医疗图像的特征空间往往大于异常医疗图像的特征空间,且分类决策边界(分类阈值)也会向正常医疗图像方向偏移以确保更好地分类正常医疗图像,这一现象会导致训练得到的深度神经网络模型在数量有限的的少数类(异常医疗图像)上表现不佳,即训练得到的深度神经网络模型更容易识别正常医疗图像,不易识别异常医疗图像,进而不利于执行医疗图像分类任务。

3、为了解决数据分布不均衡的问题(正常医疗图像和异常医疗图像的数据分布不平衡),有研究人员提出可以通过auc指标来评估不同分类阈值下的深度神经网络模型的性能以得到在数据长尾分布下性能表现良好的深度神经网络模型。通过auc指标可以选择合适的区分正常医疗图像与异常医疗图像之间的分类阈值,使得深度神经网络模型既能充分学习到正常医疗图像的信息,也不会忽视异常医疗图像的信息。其中,所谓的auc指标是通过roc曲线下的面积来定义的,roc曲线的横坐标为假阳性率(fpr),纵坐标为真阳性率(tpr),其为不同分类阈值下一系列点(fpr,tpr)构成的曲线。深度神经网络模型预估的是0到1之间的概率,设定不同的分类阈值才能确定深度神经网络模型预测的是正常医疗图像还是异常医疗图像,即计算对应分类阈值下的假阳性率和真阳性率。从roc曲线上看,横轴(fpr)只关心异常医疗图像样本,与正常医疗图像样本无关;而纵轴(tpr)只关心正常医疗图像样本,与异常医疗图像样本无关,所以横纵轴都不受正常医疗图像和异常医疗图像数据分布影响。由此可知,auc指标对正常医疗图像和异常医疗图像的数据分布并不敏感,即使是在正常医疗图像和异常医疗图像数据分布不均衡的情况下,也能给出合理的评估结果,因此,auc指标成为了长尾学习的热门指标,被广泛用于评估训练数据长尾分布时深度神经网络模型的性能。基于此,许多与auc指标相关的优化方法被提出,比如,pauc优化方法、wauc优化方法等。

4、为了解决数据分布不均衡的问题,研究人员提出还可以基于代价敏感学习对深度神经网络模型进行训练,以获取数据长尾分布下性能表现良好的深度神经网络模型。代价敏感学习是一种常见的数据挖掘方法,其主要目标是将误分类代价纳入深度神经网络模型损失中,使得训练得到的深度神经网络模型与现实场景更为兼容。之所以要引入误分类代价,是因为若采用传统的训练方式对深度神经网络模型进行训练,那么训练得到的深度神经网络模型会偏向正常医疗图像,此时深度神经网络模型容易将异常医疗图像分类为正常医疗图像,且将一个异常医疗图像分类为正常医疗图像所造成的损失远远大于将正常医疗图像分类为异常医疗图像的损失。因此,在此种情况下,可以基于代价敏感学习将误分类代价纳入深度神经网络模型的损失中,即在计算迭代损失是增加一些约束和权重条件,使得深度神经网络模型在训练过程中既能充分学习到正常医疗图像样本的信息,也不会忽略异常医疗图像样本的信息。

5、虽然现有技术提出的方法能够解决数据分布不均衡的问题,但是无论是采用auc相关的优化方法还是采用代价敏感学习方法,训练得到的深度神经网络模型均存在缺陷。其中,采用auc相关的优化方法训练出来的深度神经网络模型在代价分布偏移的测试数据上的表现不佳;而采用代价敏感学习方法训练得到的深度神经网络模型仅能考虑特定的代价和数据类别不平衡的场景,在数据类别偏移的测试数据上的表现不佳。


技术实现思路

1、因此,本发明的目的在于克服上述现有技术的缺陷,提供一种医疗图像分类模型训练方法、一种医疗图像分类方法和一种医疗图像分类系统。

2、本发明的目的是通过以下技术方案实现的。

3、根据本发明的第一方面,提供一种医疗图像分类模型训练方法,所述方法包括:s1、从目标诊疗场景中采样多个诊疗错误的医疗图像以构建经验代价集,其中,所述经验代价集包括多个正常医疗图像和多个异常医疗图像,且每个正常医疗图像和每个异常医疗图像均对应一个误分类代价,所述误分类代价为其对应的正常医疗图像或异常医疗图像诊疗错误所造成的经济损失;s2、从所述目标诊疗场景中采样多个医疗图像以构建训练集,所述训练集中包括多个正常医疗图像和多个异常医疗图像,且所述每个正常医疗图像的标签为无病,所述每个异常医疗图像的标签为有病;s3、根据所述经验代价集确定分类阈值,并基于分类阈值采用所述训练集对医疗图像分类模型进行多轮迭代训练直至收敛。

4、在本发明的一些实施例中,在所述步骤s3中,每轮迭代训练包括:s31、从所述训练集中随机采样多个医疗图像得到当前轮第一数据集,并基于所述经验代价集和当前轮第一数据集进行多次内层迭代计算以得到当前轮分类阈值。

5、在本发明的一些实施例中,所述每次内层迭代计算包括:基于所述经验代价集和当前轮第一数据集按照预设的内层损失函数计算当前次内层迭代损失,并基于当前次内层迭代损失按照预设的梯度算子计算梯度信息以更新上一次内层迭代计算得到的分类阈值得到当前次分类阈值。

6、在本发明的一些实施例中,所述预设的内层损失函数为:

7、

8、其中,

9、

10、其中,表示内层损失函数,nτ表示经验代价集中所有医疗图像的误分类代价对应的分类阈值τ的数量,表示代价损失函数,w表示当前轮医疗图像分类模型的权重参数,τl表示cl对应的分类阈值,cl表示经验代价集中第l个医疗图像对应的误分类代价,τ表示分类阈值,c表示误分类代价,π表示当前轮第一数据集中正常医疗图像的比例,n+表示当前轮第一数据集中正常医疗图像的数量,pi表示当前轮第一数据集中第i个正常医疗图像的权重,n-表示当前轮第一数据集中异常医疗图像的数量,nj表示当前轮第一数据集中第j个异常医疗图像的权重,m′和m表示预设的正整数,ψ(·)表示softplus函数,s(·)表示医疗图像分类模型,表示当前轮医疗图像分类模型对正常医疗图像处理后的分类概率,表示当前轮医疗图像分类模型对异常医疗图像处理后的分类概率。

11、在本发明的一些实施例中,在所述步骤s3中,每轮迭代训练还包括:s32、从所述训练集中随机采样多个医疗图像得到当前轮第二数据集,并基于所述经验代价集、当前轮分类阈值和当前轮第二数据集按照预设的外层损失函数计算当前轮迭代损失以更新医疗图像分类模型参数。

12、在本发明的一些实施例中,所述预设的外层损失函数为:

13、

14、其中,

15、

16、其中,

17、

18、其中,表示外层损失函数,表示wauc目标函数,表示优化目标函数,n+′表示当前轮第二数据集中正常医疗图像的数量,n-′表示当前轮第二数据集中异常医疗图像的数量,表示当前轮第二数据集中第i个正常医疗图像,表示当前轮第二数据集中第j个异常医疗图像,表示当前轮医疗图像分类模型对正常医疗图像处理后的分类概率,表示当前轮医疗图像分类模型对异常医疗图像处理后的分类概率,σ(·)表示sigmoid函数,k(·)表示核密度估计的目标函数,表示当前轮分类阈值的估计值,m表示核密度估计的平滑参数,τ*表示当前轮分类阈值的理论值。

19、根据本发明的第二方面,提供一种医疗图像分类方法,所述方法包括:t1、获取待处理医疗图像;t2、采用如本发明第一方面所述方法训练得到的医疗图像分类模型对所述待处理医疗图像进行分类处理并将处理结果作为所述待处理医疗图像的分类结果。

20、根据本发明的第三方面,提供一种医疗图像分类系统,所述系统包括:数据获取模块,用于获取待处理医疗图像;如本发明第一方面所述方法训练得到的医疗图像分类模型,用于对所述数据获取模块获取的待处理医疗图像进行分类处理并将处理结果作为所述待处理医疗图像的分类结果。

21、与现有技术相比,本发明的优点在于:(1)从真实的诊疗场景中采样医疗图像样本以构建经验代价集,以便在缺乏先验信息时构建更接近现实世界的代价分布场景;(2)采用内层迭代与外层迭代相结合的双层迭代优化的方式训练医疗图像分类模型,其中,在内层迭代过程中通过经验代价集计算分类阈值分布,并在外层迭代中以内层迭代计算得到的分类阈值分布为约束条件最小化外层迭代损失以更新医疗图像分类模型的权重参数,使得训练完成的医疗图像分类模型能够适用于代价分布偏移和类别偏移的场景。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1