一种基于改进注意力机制的医学图像分类方法与流程

文档序号:36796446发布日期:2024-01-23 12:19阅读:19来源:国知局
一种基于改进注意力机制的医学图像分类方法与流程

本发明涉及人工智能,具体涉及一种基于改进注意力机制的医学图像分类方法。


背景技术:

1、近年来,以深度学习为中心的计算机视觉技术引起了人们的关注,并逐渐应用于医学领域。其中,肿瘤是判断生命体组织是否正常的重要局部特征,对医学图像中的肿瘤进行分类,可以为医生诊断提供重要依据。

2、深度学习网络在医学图像处理中取得了巨大进展,涌现了许多新型神经网络,但其应用于脑肿瘤分类相对较少。由于来自不同病理类型的肿瘤可能呈相似外观,导致分类困难。现有的深度卷积神经网络虽然显著提高了模型的分类能力,但也导致模型参数数量急剧增加,难以训练,从而影响结果。此外,用于脑肿瘤分类的方法没有充分利用图像的全局和局部显著特征,以及特征图的通道特性,因此识别准确率有待进一步提高。

3、获得精准的深度学习模型需要对大规模的病灶样本数据进行特征映射和参数优化调整。然而,随着人工智能的发展,社会对于数据隐私和安全保护的关注度在不断提高,这使得不能将各个医疗机构的图像数据直接收集汇合在一起,形成了各自孤立的数据孤岛。医学图像的一个重要特点是不平衡性。由于受各自属性及地域环境的影响,医院的数据分布差异极大,这给利用这些数据带来了挑战。为了克服数据孤岛和隐私保护的难题,研究人员提出了联邦学习这一框架,其旨在让分散的各参与方在不向其他参与方批露隐私数据的前提下,协作进行机器学习的模型训练,做到“数据不动模型动,数据可用不可见”。这一框架不仅可以保护各参与方的隐私性,还能利用各方的小规模图像数据共同构建一个与自己方单独训练相比更好的模型。

4、在脑肿瘤图像四分类任务上,已经有一些代表性的研究成果。[vankdothu,r.,hameed,m.a.,&fatima,h.(2022).abrain tumor identification and classificationusing deep learningbased on cnn-lstm method.computers and electricalengineering,101,107960]中vankdothu等人结合了cnn和lstm,实现了92%的准确率;[alnowami,m.,taha,e.,alsebaeai,s.,anwar,s.m.,&alhawsawi,a.(2022).mr imagenormalization dilemma and theaccuracy of brain tumor classificationmodel.journal of radiation research and applied sciences,15(3),33-39]中alnowami等人评估了不同的数据预处理方法对densenet性能的影响,实现了96.52%的最优准确率;[rajeev,s.k.,rajasekaran,m.p.,vishnuvarthanan,g.,&arunprasath,t.(2022).a biologically-inspired hybrid deep learning approach for braintumorclassification from magnetic resonance imaging using improved gaborwavelet transform andelmann-bilstm network.biomedical signal processing andcontrol,78,103949.]中rajeev等人先采用改进的gabor小波变换(improved gaborwavelet transform,igwt)提取脑肿瘤特征,再输入混合的elman双向lstm(elmanbidirectional lstm,ebilstm)进行分类,准确率达到了98.4%。这些方法有的需要额外的传统特征提取方法,有的容易出现梯度消失及过拟合问题。

5、专利公开号为cn104834943a的申请文件公开一种基于深度学习的脑肿瘤分类方法,该技术采用gabor小波变换,算法复杂度高:提取不同尺度和方向上的gabor小波纹理特征需要进行大量的计算,因此算法复杂度较高。受图像质量影响大:gabor小波纹理特征提取方法对图像质量要求较高,对于低质量的图像,特征提取的效果可能较差。

6、专利公开号为cn104834935a的申请文件公开了一种稳定的脑肿瘤非监督疾病分类学成像方法,该技术容易受到噪声影响:mrsi数据中容易出现噪声,这些噪声会影响nmf和pca的结果,因此需要对数据进行预处理和降噪处理。空间分布恢复不准确:由于mrsi数据的空间分辨率较低,因此空间分布恢复可能存在误差,尤其是对于组织分布较为复杂的区域。


技术实现思路

1、针对现有技术中的上述不足,本发明提供了一种基于改进注意力机制的医学图像分类方法。

2、为了达到上述发明目的,本发明采用以下技术方案来实现。

3、本发明提供了一种基于改进注意力机制的医学图像分类方法,包括以下步骤:

4、s1、获取用于分类的医学图像数据集,并对医学图像数据集进行预处理;

5、s2、构建基于改进注意力机制的医学图像分类网络模型,利用预处理后的医学图像数据集进行模型训练;基于改进注意力机制的医学图像分类网络模型具体包括:依次连接的特征预提取模块、若干结构相同的添加改进注意力机制的深度特征提取模块和特征输出模块;所述特征提取模块用于对输入的原始图像提取图像特征;所述添加改进注意力机制的深度特征提取模块包括由改进通道注意力机制单元和深度可分离空间注意力机制单元组成的改进注意力机制模块;所述改进通道注意力机制单元对输入特征图采用压缩输入特征映射的空间维度方法计算输入特征图中每个通道的权重,并将计算的通道权重通过乘法逐通道加权到输入特征图上;所述深度可分离空间注意力机制单元对通道加权后的特征图利用特征间的空间关系计算特征图中每个特征点的权重,并将计算的特征权重通过乘法逐通道加权到特征图上;

6、s3、利用训练后的基于改进注意力机制的医学图像分类网络模型对待分类医学图像进行分类,得到待分类医学图像的分类结果。

7、进一步地,步骤s1中对图像数据集进行预处理具体包括:

8、s11、对医学图像数据集中的各个医学图像进行去除噪声、增强对比度、归一化的预处理;

9、s12、对步骤s11处理后的医学图像数据集进行随机旋转、翻转、缩放的数据增强处理;

10、s13、将医学图像数据集中所有医学图像调整为统一尺寸,并根据每个医学图像的图像信息对相应的医学图像添加分类标签。

11、进一步地,所述特征预提取模块具体包括:

12、依次连接的卷积层、批归一化层、激活层和最大池化层。

13、进一步地,所述改进通道注意力机制单元具体包括:

14、最大池化层、平均池化层、通道注意力卷积层和激活层;

15、所述最大池化层和平均池化层分别对输入特征图进行最大池化和平均池化操作后,经过通道注意力在通道维度上进行卷积操作,最后经过激活层得到输入特征图中每个通道的权重。

16、改进通道注意力机制单元的计算公式为:

17、

18、favg=avgpool(f)

19、fmax=maxpool(f)

20、mc(f)=σ(conv1×1(concatenate([favg,fmax])))

21、其中,f表示输入特征图,ft表示改进通道注意力机制单元的输出特征图,favg和fmax分别为经过平均池化和最大池化操作得到的特征图,concatenate表示在通道维度上拼接操作,conv1×1表示1x1卷积操作,σ表示sigmoid函数,mc(f)表示通道注意力机制,表示逐元素相乘。

22、进一步地,所述深度可分离空间注意力机制单元具体包括:

23、最大池化层、平均池化层、深度可分离卷积层和激活层;

24、所述最大池化层和平均池化层对输入特征图沿着每一个特征点的通道方向依次进行最大池化和平均池化操作并堆叠起来生成一个特征描述符,然后通过深度可分离卷积层聚合空间特征,最后经过激活层得到特征图中每个特征点的权重。

25、深度可分离空间注意力机制单元的计算公式为:

26、ms(ft)=σ(wconv2*([avgpool(ft);maxpool(ft)]))

27、

28、其中,wconv2是深度可分离卷积层的权重,ft表示改进通道注意力机制单元的输出特征图,[avgpool(ft);maxpool(ft)]表示对特征图ft进行平均池化和最大池化操作得到的特征图拼接而成的特征描述符,σ是sigmoid激活函数,用于将注意力权重限制在[0,1]范围内,f′表示深度可分离空间注意力机制单元的输出。

29、进一步地,所述添加改进注意力机制的深度特征提取模块还包括位于改进注意力机制模块前的卷积残差块和位于改进注意力机制模块后的两个残差块。

30、进一步地,所述特征输出模块具体包括:

31、依次连接的平均池化层、展开层和全连接层。

32、进一步地,步骤s2中利用预处理后的医学图像数据集进行模型训练具体包括:

33、将医学图像数据集分发到多个本地设备上;

34、对基于改进注意力机制的医学图像分类网络模型进行初始化,并由中心服务器初始化一个全局模型,并将全局模型发送到各个本地设备;

35、在每个本地设备上,使用本地图像数据对模型进行训练,在训练过程中由本地设备计算模型参数更新;

36、将每个本地设备计算的模型参数更新发送到中心服务器,由中心服务器采用fedavg聚合算法将各个模型参数更新进行加权平均,得到全局模型参数更新;

37、由中心服务器使用全局模型参数更新全局模型,并将更新后的全局模型发送回各个本地设备;

38、重复进行本地训练、模型聚合和全局模型更新,直到模型收敛或达到预定的训练轮数。

39、本发明具有以下有益效果:

40、本发明通过构建基于改进注意力机制的医学图像分类网络模型,能够降低模型的参数数量和计算复杂度,提高模型的计算效率和泛化能力,并且进一步提高网络的性能,使得医学图像的分类准确率与精确度得到了提高,在保持模型性能和泛化能力的前提下,还能提高模型的计算效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1