基于混合注意力编码器的医学图像分割算法

文档序号：36861265发布日期：2024-02-02 20:43阅读：17来源：国知局

本发明涉及深度学习。具体地说，涉及一种医学图像分割算法。

背景技术：

1、医学影像分割是计算机辅助诊断中的一项基础且关键的任务，目的在于从像素级别准确识别出目标器官、组织或病变区域。不同于自然场景下的图像，医学影像往往纹理复杂，同时受限于成像技术和成像设备，并且医学影像噪声大，边界模糊而不易判断。而且对医学影像进行标注极大依赖于医疗专家的认知和经验，这一点造成了可用于训练中的标注数据少。由于上述的医学影像边缘模糊不清、训练数据较少和标注误差较大等特点，基于传统图像分割算法搭建的辅助诊断系统不足以满足临床应用的要求。

2、近年来，cnn逐渐成为一种主流的图像处理方法。随后，研究者们提出了用于图像分割的全卷积神经网络(fcn)和 u-net 卷积网络，u-net 网络架构的应用更加广泛。由于u-net在图像分割中的卓越性能,它被广泛应用于眼部、心脏、肝脏、脑部、皮肤、前列腺和乳腺等器官的病灶分割。因此，研究者们基于u-net模型进行了一系列的改进，以满足实际应用需求，进一步提升了网络性能。例如，anu-net, diu-net, attunet, mrunet, hdc-ne,fac-net。

3、由于transformer具有捕获远程依赖关系的能力，研究者们试图将transformer引入计算机视觉领域。陈等人首先提出用于医学图像分割的transformer架构transunet，它采用cnn提取特征，并将提取到的特征输入transformer进行远程依赖关系计算。张等人基于vit提出了transfuse，它将transformer和cnn提取到的特征进行融合。valanarasu等人基于轴向注意力机制提出了medt，它证明了可以在小规模数据集上应用transformer。这些模型的成功表明了transformer在医学图像分割方面的巨大潜力。但是transformer主要是对图像的全局上下文建模，它对于提取局部特征的能力不足。而医学图像是很复杂的，它们的边缘信息模糊不清，有些前景信息与它周围背景信息难以区分。因此，对于局部信息的提取是非常重要的。

技术实现思路

1、针对transformer提取局部特征的能力不足这一点，本发明提出了一种基于混合注意力编码器的医学图像分割算法。该方法以深度学习技术为依托，能够显著提高医学图像分割精度，输出的预测分割图所包含的分割边界更加完整。

2、基于混合注意力编码器的医学图像分割算法，所述医学图像分割方法包括以下步骤：

3、（1）构建基于混合注意力编码器的医学图像分割网络uanet；

4、（1a）采用uctransnet作为提取图像特征的基础网络；

5、（1b）构建高效注意力模块eam，该模块将分别细化来自编码器端四个级别的卷积层输出特征，增强图像特征信息，输出与输入相同维度的完备特征；

6、（1c）构建双路移位mlp模块ds-mlp，利用ds-mlp模块在更细粒度的空间上对最底层的卷积输出特征进行局部滤波和强化；

7、（2）对基于混合注意力编码器的医学图像分割网络uanet进行训练；

8、（2a）从公开的医学图像分割数据集网址下载结肠组织图像中的腺体分割数据集（glas）和多器官细胞核分割数据集（monuseg）,将glas数据集统一分辨率为224×224，将monuseg数据集统一分辨率为512×512；

9、（2b）利用在线数据增广技术对训练集进行数据增广；

10、（2c）将经过扩充后的训练集数据输入到uanet网络的编码器，通过前向传播得到输出的预测分割图，利用混合损失函数计算预测分割图与真实标签之间的损失值，经过多轮训练迭代后，损失函数值将收敛，此时模型已被训练好，并且可以达到精准分割的要求；

11、（3）利用训练完备的基于混合注意力编码器的医学图像分割网络uanet进行医学图像分割，将测试集的原图输入到训练好的uanet网络中，此时网络通过前向传播将输出预测分割图，其像素值为0或255。

12、本发明与现有技术相比具有以下优点：

13、第一：本发明构建了高效注意力模块eam，该模块将分别细化来自编码器端四个级别的卷积层输出特征，它不仅能够突出前景信息，还可以弱化背景信息对分割结果带来的消极影响，为下一步的全局建模奠定基础，有利于最终输出具有完整分割边界的预测图；

14、第二：本发明构建了双路移位mlp模块，该模块能够有效的在更细粒度的空间上对特征进行局部建模，为解码器恢复特征奠定了基础；

15、第三：本发明构建的uanet网络不需要预训练以及繁琐的图像预处理就可以得到较准确的输出预测分割图。

技术特征：

1.一种基于混合注意力编码器的医学图像分割算法，其特征在于，包括：

2.如权利要求1所述的基于混合注意力编码器的医学图像分割算法，其特征在于：所述（1a）中，采用uctransnet作为提取图像特征的基础网络。

3.如权利要求1所述的基于混合注意力编码器的医学图像分割算法，其特征在于：所述（2b）中的数据增广技术是将医学图像分割数据集在输入网络前使用翻转（垂直和水平）和旋转（随机）两种形式的操作，将经过这些操作后形成的数据并入训练集，最终形成增广后的训练集。

4.如权利要求1所述的基于混合注意力编码器的医学图像分割算法，其特征在于：所述（1b）中，设计一种细化卷积输出的算法是至关重要的，由于transformer对局部信息的感知力较弱，我们提出了eam模块，eam模块的核心思想是突出样本的前景信息，削弱背景信息对分割效果的消极影响，使得模型能够探究局部信息的重要性；

5.如权利要求1所述的基于混合注意力编码器的医学图像分割算法，其特征在于：所述（1c）中，设计一种可以在瓶颈块中提炼样本前景信息的模块是至关重要的，为了能够为解码器提供更加精细的前景信息，我们提出了ds-mlp模块，ds-mlp的核心思想是：采用空ds-mlp模块用公式(4)表示：

技术总结
本发明提供了一种基于混合注意力编码器的医学图像分割算法，主要解决了医学图像模糊边界的误分割、分割轮廓不平滑等问题。具体方案为构建高效注意力模块，构建双路移位MLP模块；利用这些模块构建基于混合注意力编码器的医学图像分割网络；获取医学图像分割数据集对网络进行训练；然后运用训练好的网络进行图像分割。本发明构建了高效注意力模块和双路移位MLP模块，提升了网络局部建模的性能，同时使分割边界更加完整。该方法可为医生对人体病变部位的观察和判断提供帮助。

技术研发人员：安丽静,汪烈军,程述立
受保护的技术使用者：新疆大学
技术研发日：
技术公布日：2024/2/1

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：安丽静,汪烈军,程述立
技术所有人：新疆大学
我是此专利的发明人

上一篇：一种基于密度峰值聚类分析的速度谱拾取方法与流程
上一篇：台式空气制水机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。