面向医疗场景的肝脏肿瘤图像分割方法、装置和可读存储介质

文档序号:36996592发布日期:2024-02-09 12:38阅读:23来源:国知局
面向医疗场景的肝脏肿瘤图像分割方法、装置和可读存储介质

本发明涉及医学图像分割的,具体而言,涉及一种面向医疗场景的肝脏肿瘤图像分割方法、计算机装置和计算机可读存储介质。


背景技术:

1、人工智能被普遍认为是第四次工业革命,全世界的科技公司都将目光转向其中。随着新时代通讯技术的诞生以及硬件设备的进步,人工智能离我们距离逐渐缩短。技术的进步使人类对智能化有了重新的定义。现阶段,人们希望机器能够像人类一样具有学习、理解和规划等能力。在日常感知外界信息时,我们至少有80%以上的信息是通过视觉感知的。因此,视觉是人类最重要的感知方式。同样地,计算机视觉在人工智能领域也是一项十分关键的技术。计算机视觉已经成为人工智能中不可或缺的组成部分之一。随着深度学习的发展与进步,计算机视觉正在以前所未有的速度高速发展。计算机视觉已经成为当下发展最快的领域之一。

2、医学图像是指通过医学影像设备(如x射线、ct扫描、mri、超声等设备)获取的用于医学诊断、研究和治疗的图像数据。医学图像在临床医学和医学研究中起着重要的作用,可以帮助医生了解人体内部的解剖结构、病理变化和疾病状态。肝脏是人体最大的解毒器官,肝癌是起源于肝脏细胞的恶性肿瘤,据统计肝癌是全世界最常见的癌症之一,是第五大致死的癌症。ct(计算机断层扫描)图像是通过多个x射线投影图像的组合,生成人体横截面的图像,用于详细观察器官和组织的内部结构。ct扫描可以提供三维图像显示肝脏结构、肝内肿瘤和肝外转移瘤的位置、大小、形态等信息,临床医师可根据获取的病灶信息制定适当的治疗方案。然而由于肝脏与周围器官和肿瘤周围组织在灰度对比上的差异小,导致ct图像通常具有边界模糊,结构复杂等问题,且人工标注工作繁琐耗时,分割结果的精确性极其依赖放射科医师专家的主观经验判断,因此如何使用计算机辅助诊断,实时、精确的分割肝脏肿瘤是一项非常具有挑战性的任务。

3、在深度学习兴起之前,早期的肝脏肿瘤图像分割研究主要尝试采用一些基于传统方法和基于机器学习的图像处理技术,但是在实际应用中,传统方法通常需要手动选择特征,算法参数的调整比较困难,并且对图像的质量要求也比较高,而基于机器学习的方法对肿瘤区域分割效果不佳并且模型泛化能力比较差。如今,由于深度学习技术的发展、高精度的数据集标签以及gpu(graphics processing unit,简称gpu,图形处理器)性能的提升,从而我们可以使用深度卷积神经网络来自动学习并获取我们所需的特征,这极大程度上促进了医学图像处理和语义分割技术的发展。

4、然而,现有的基于深度学习的肝脏肿瘤分割模型仍然存在一些缺陷和问题:

5、(1)现有的肝脏肿瘤分割模型中,肿瘤特征信息提取不佳,导致形状小且不规则的肿瘤难以分割,且需要大量参数和计算资源,实际应用对硬件要求较高;

6、(2)肝脏作为腹部较大的器官,可能存在多个肿瘤区域,现有的肝脏肿瘤分割模型对多肿瘤区域分割效果较差,且肝脏肿瘤与周边组织的相似度较高,使得网络输出的肿瘤分割边界较为模糊。


技术实现思路

1、本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。

2、为此,本发明的第一目的在于提出一种面向医疗场景的肝脏肿瘤图像分割方法。

3、本发明的第二目的在于提出一种计算机装置。

4、本发明的第三目的在于提出一种计算机可读存储介质。

5、为了实现上述目的,本发明的第一方面的技术方案,提供了一种面向医疗场景的肝脏肿瘤图像分割方法,包括:步骤s1:获取肝脏肿瘤图像数据集,并按照预设比例将所述肝脏肿瘤图像数据集划分为训练数据集和测试数据集;其中,所述肝脏肿瘤图像数据集为有标签的图像数据集;步骤s2:对所述肝脏肿瘤图像数据集进行预处理,以得到肝脏肿瘤图像的二维图像;步骤s3:搭建面向医疗场景的肝脏肿瘤图像分割网络模型,所述网络模型为编码器解码器架构,所述网络模型包括:编码器部分和解码器部分,所述编码器部分和所述解码器部分均为四层,所述编码器部分包括:第一编码器、第二编码器、第三编码器和第四编码器;所述解码器部分包括:第一解码器、第二解码器、第三解码器和第四解码器;每一编码器和每一解码器的对应层之间设置有一个strip pooling池化模块;每一编码器和每一解码器均由两个chd卷积注意力模块组成;每个chd卷积注意力模块包括:第一线性层、第二线性层、第三线性层、深度可分离卷积层、hadamard卷积调制层、归一化层和gelu激活函数;所述第一线性层的输出端通过深度可分离卷积层连接hadamard卷积调制层的第一输入端,所述第二线性层的输出端直接连接hadamard卷积调制层的第二输入端,所述hadamard卷积调制层的输出端依次通过第三线性层、残差连接、归一化层与gelu激活函数的输入端连接;编码器部分的每一gelu激活函数的输出端分别连接对应的strip pooling池化模块的输入端和对应的下一阶段编码器的输入端;解码器部分的每一gelu激活函数的输出端连接对应的strip pooling池化模块的输出端,拼接二者输出进行特征融合;所述第一线性层和第二线性层的输入端与残差连接是同一输入端;步骤s4:构建混合损失函数,用于衡量训练所述面向医疗场景的肝脏肿瘤图像分割网络模型时输出的实际值和预测值之间的差异;步骤s5:基于所述混合损失函数,并使用预处理后的训练数据集对所述面向医疗场景的肝脏肿瘤图像分割网络模型进行训练及优化,保存最优模型;步骤s6:将预处理后的测试数据集输入最优模型进行肝脏肿瘤图像分割,得到肝脏肿瘤图像的分割结果。

6、优选地,所述混合损失函数的表达式为:

7、lloss=θlbce+(1-θ)ldice

8、其中,lbce为交叉熵损失函数;ldice为dice损失函数;θ为手动赋予的权重;

9、所述交叉熵损失函数的表达式为:

10、

11、其中,n为像素点的数量;m为预测类别的数量;yic为类别c的标签对应的值,取值为1或0;pic为预测样本i属于类别c的概率;

12、所述dice损失函数的表达式为:

13、

14、其中,x表示预测值的集合;y表示标签集合;tp表示真阳性,预测值和真实值都为正样本的像素数;fn表示假阴性,预测为负样本,但真实值为正样本的像素数;fp表示假阳性,预测为正样本,但真实值为正样本的像素数。

15、优选地,θ的值为0.3。

16、优选地,所述基于所述混合损失函数,并使用预处理后的训练数据集对所述面向医疗场景的肝脏肿瘤图像分割网络模型进行训练及优化,保存最优模型的步骤,具体包括:基于所述混合损失函数,采用adam优化算法进行训练及优化;训练过程中,将预处理后的训练数据集输入编码器部分,以提取图像的多尺度特征;各个解码器将对应的编码器提取到的多尺度特征进行上采样操作以恢复图像的分辨率,并与对应的strip pooling 池化模块操作细化后的特征信息进行拼接融合,得到最终特征图;通过解码器部分输出最终特征图后,再通过一层1x1的卷积层和softmax激活函数生成最终的输出图像,并将此时训练好的最优模型进行保存。

17、优选地,所述对所述肝脏肿瘤图像数据集进行预处理的步骤具体包括:将原始的三维的肝脏肿瘤图像数据集转换为二维的肝脏肿瘤图像数据集;进行数据增强操作;进行归一化处理。

18、本发明的第二方面的技术方案,还提供了一种计算机装置,该计算机装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一技术方案中的面向医疗场景的肝脏肿瘤图像分割方法的步骤。

19、本发明的第三方面的技术方案,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一技术方案中的面向医疗场景的肝脏肿瘤图像分割方法的步骤。

20、本发明的有益效果:

21、(1)为了解决现有的肝脏肿瘤分割模型中,肿瘤特征信息提取不佳,导致形状小且不规则的肿瘤难以分割的同时,还需要大量参数和计算资源,进而导致实际应用对硬件要求较高的问题,本发明设计了chd卷积注意力模块,该模块通过计算深度可分离卷积层和线性层特征值之间的hadamard积来得到输出,对形状小且不规则的肿瘤分割效果较好,减少了网络参数量,节省了计算资源。

22、(2)为了解决现有的肝脏肿瘤分割模型对多肿瘤区域分割效果较差,且肝脏肿瘤与周边组织的相似度较高,使得网络输出的肿瘤分割边界较为模糊的问题,本发明从网络跳跃连接入手。具体地,考虑到编码器部分提取到的图像浅层特征信息往往包含图像的低级别特征,而解码器部分提取到的高层特征信息却包含更高层次的语义信息,将这两种特征信息直接拼接则会导致信息冗余,降低模型的泛化能力。因此,本发明在编码器部分与解码器部分之间的跳跃连接中引入在之前应用在场景语义分割领域的strip pooling池化模块,该操作注重捕获肿瘤区域之间的长距离关系,减少图像底层冗余信息,解决了多肿瘤区域分割边界模糊、分割效果差的问题,达到优化编码器部分提取到的多尺度特征信息的目的。

23、本发明的附加方面和优点将在下面的描述中变得明显,或通过本发明的实践了解到。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1