一种基于CBAM-CNN的阿尔兹海默症识别方法

文档序号:32005676发布日期:2022-11-02 13:04阅读:230来源:国知局
一种基于CBAM-CNN的阿尔兹海默症识别方法
一种基于cbam-cnn的阿尔兹海默症识别方法
技术领域
1.本发明属于病患数据识别技术领域,具体涉及一种基于cbam-cnn的阿尔兹海默症患者数据识别方法。


背景技术:

2.阿尔茨海默病(ad)是一种起病隐匿的进行性发展的神经系统退行性疾病。国际上通用的确诊标准是atn标准,包括了aβ沉积,病理性tau和神经变性三种标志物。这三个标志物中影响最大的是aβ淀粉沉积,但是需要患者进行pet或者csf才能获得,这些测试花费巨大,并且对患者有一定损害,所以很难大量采集此类数据。在这些诊断标准中,只有神经变性最具有普适性,可以通过核磁共振(mri)进行检查,mri能够量化大脑区域的体积,皮质厚度和形状,通过患者脑部的结构性变化来预测ad。所以如何从最普适性的mri数据进行ad诊断是一个很重要的课题。
3.进行ad诊断的一个有效方法就是深度学习。深度学习的成功推动了ai医疗的发展,基于深度学习的医疗诊断算法越来越多。将深度学习技术应用到ad诊断中,不仅能够较传统方法提升预测的精度,而且可以省去传统方法中复杂的手工提取特征操作,同时也是对深度学习理论发展的一个补充。
4.近年来,专家学者根据对人类注意力的研究,提出了注意力机制,本质上说就是实现信息处理资源的高效分配。当一个场景进入人类视野时,往往会先关注场景中的一些重点,如动态的点或者突兀的颜色,剩下的静态场景可能会被暂时性地忽略。例如当人们需要寻找图片中的人物信息时,会更多地注意符合人物特征的图片区域,而忽略那些不符合人物特征的图片区域,这样就是注意力的合理有效分配。通道空间注意力机制(cbam)就是常应用于图像领域的一种。
5.虽然深度模型具有很好的学习能力,但是却有着较大的参数量,尤其是一些深层的神经网络,能够学习十分复杂的特征,却在模型的实际部署阶段产生一定的困难。模型轻量化是深度学习的研究重点之一,其中可分离卷积技术就能够使得普通卷积的参数量显著下降。


技术实现要素:

6.针对上述问题,本文发明了一种基于cbam-cnn的阿尔兹海默症识别方法,包括以下步骤:
7.sa:将通道空间注意力(cbam)模块加入卷积神经网络(cnn),提升诊断精度;
8.sb:使用可分离卷积替换网络中的基础卷积,减少参数量。
9.作为一种优选的技术方案,还包括以下步骤:
10.s1:将mri数据和临床数据作为多元信息的训练数据;
11.s2:构建基础cnn网络,并加入cbam模块,可分离卷积机制;
12.s3:训练网络;
13.s4:模型结果验证。
14.作为一种优选的技术方案,步骤1中的mri数据进行了空间配准与归一化,临床数据中,对性别、遗传信息等采用one-hot编码,将离散的特征数字化。对年龄、认知评估测试等采取标准化处理,将数据映射到区间0-1。
15.作为一种优选的技术方案,步骤2中的基础cnn网络包含了多元信息输入、特征提取模块、输出模块。数据分为了两部分,一部分是边长为110的三维矩阵,另一部分是21维的特征向量,三维矩阵输入到卷积模块进行特征提取,分别进入到卷积层、批规范化层、elu激活函数、最大池化层、dropout层等操作序列。特征向量输入到全连接模块进行特征提取。在特征提取模块的最后,将两部分输入数据提取到的信息进行融合,再输入到全连接层,最后将结果输出到0-1的区间作为预测概率。概率值趋向于1的样本分类为ad,概率值趋向于0的样本分类为nc,中间的阈值设定为0.5。
16.作为一种优选的技术方案,对步骤2中的基础cnn网络进行改进,加入cbam模块,该模块分为三步:
17.1:通道注意力机制,是将特征图在空间维度上进行压缩,得到一个一维的矢量。具体是先通过空间池化和最大池化得到两个一维矢量,然后共同输入一个共享网络,再逐元素进行合并,最后通过sigmoid激活函数以产生通道注意力图。
18.2:空间注意力机制:将通道注意力机制得到的特征图与原始特征图进行相乘,再进行最大池化和平均池化,然后再通过卷积操作,再通过sigmoid激活函数即得到空间注意力特征图。
19.3:将通道注意力机制得到的特征图与原始特征图进行相乘,得到的结果再与通道注意力特征图相乘,最后结果即为输出特征。
20.作为一种优选的技术方案,继续对步骤2中的基础cnn网络进行改进,基础的cnn虽然有着比较好的特征提取能力,但是参数量却是巨大的,故创造性地将普通卷积更换为可分离卷积,在大大减少参数量地情况下,依旧能保持较高地准确率。
21.作为一种优选的技术方案,步骤3将实验样本的80%作为训练集,20%作为测试集,采用五折交叉训练的方法来保证实验结果的可靠性,根据数据的不同划分来训练不同的权重模型,之后对这五个模型进行统一测试,以平均值作为最后的实验结果。
22.作为一种优选的技术方案,步骤4用对比试验来验证模型的有效性和鲁棒性。
附图说明
23.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
24.图1为本发明的深度学习模型示意图;
25.图2为本发明卷积操作模块的操作序列图;
具体实施方式
26.结合以下本发明的优选实施方法的详述以及包括的实施例可进一步地理解本发明的内容。具体实施方案包括以下步骤:
27.s1:将mri数据和临床数据作为多元信息的训练数据;
28.s2:构建基础cnn网络,并加入cbam模块,可分离卷积机制;
29.s3:训练网络;
30.s4:模型结果验证。
31.本实例采用的数据是来自阿尔茨海默病神经影像学倡议(adni)数据库。adni数据集是用于ad诊断的最大的可公开访问的数据集之一,并已广泛用于科学研究。实验共使用387个实验样本,包括了233名正常老人和154名阿尔兹海默症患者。每个样本都包含了mri图像数据和临床数据。
32.作为一种优选的技术方案,步骤1中的mri数据进行了空间配准与归一化,临床数据中,对性别、遗传信息等采用one-hot编码,将离散的特征数字化。对年龄、认知评估测试等采取标准化处理,将数据映射到区间0-1。
33.作为一种优选的技术方案,步骤2中的基础cnn网络包含了多元信息输入、特征提取模块、输出模块。数据分为了两部分,一部分是边长为110的三维矩阵,另一部分是21维的特征向量,三维矩阵输入到卷积模块进行特征提取,分别进入到卷积层、批规范化层、elu激活函数、最大池化层、dropout层等操作序列。特征向量输入到全连接模块进行特征提取。在特征提取模块的最后,将两部分输入数据提取到的信息进行融合,再输入到全连接层,最后将结果输出到0-1的区间作为预测概率。概率值趋向于1的样本分类为ad,概率值趋向于0的样本分类为nc,中间的阈值设定为0.5。
34.作为一种优选的技术方案,对步骤2中的基础cnn网络进行改进,加入cbam模块,该模块分为三步:
35.1:通道注意力机制,是将特征图在空间维度上进行压缩,得到一个一维的矢量。具体是先通过空间池化和最大池化得到两个一维矢量,然后共同输入一个共享网络,再逐元素进行合并,最后通过sigmoid激活函数以产生通道注意力图。
36.2:空间注意力机制:将通道注意力机制得到的特征图与原始特征图进行相乘,再进行最大池化和平均池化,然后再通过卷积操作,再通过sigmoid激活函数即得到空间注意力特征图。
37.3:将通道注意力机制得到的特征图与原始特征图进行相乘,得到的结果再与通道注意力特征图相乘,最后结果即为输出特征。
38.作为一种优选的技术方案,继续对步骤2中的基础cnn网络进行改进,基础的cnn虽然有着比较好的特征提取能力,但是参数量却是巨大的,故创造性地将普通卷积更换为可分离卷积,在大大减少参数量地情况下,依旧能保持较高地准确率。
39.作为一种优选的技术方案,步骤3将实验样本的80%作为训练集,20%作为测试集,采用五折交叉训练的方法来保证实验结果的可靠性,根据数据的不同划分来训练不同的权重模型,之后对这五个模型进行统一测试,以平均值作为最后的实验结果。
40.作为一种优选的技术方案,步骤4设计了不同的对比试验来验证模型的有效性和鲁棒性,主要包括以下几个部分:
41.s1.1:注意力机制实验,验证了通道空间注意力模块的有效作用,在标准cnn模型基础上准确率提升了0.02;并通过位置的对比试验得出该模块的最佳位置,放在模型中部的位置准确率最高,达到了0.989。
42.s1.2:可分离卷积实验,将六个卷积层逐渐替换成可分离卷积层,虽然准确率有所
下降,但是参数量最高可下降50%左右。在进行准确率与参数量的取舍之后,本文认为替换三个卷积层是最佳选择,准确率依旧能保持在0.976,而参数量下降了30%左右。
43.s1.3:多元数据实验,将mri数据与多元输入进行对比试验,验证了多元数据对结果的贡献,说明多元数据能更好的描述病人的病理特征。
44.s1.4:不均衡数据实验,由于在实际的医疗环境中,阿尔兹海默症患者与正常的人群比例是不均衡的,故本文模拟了这种情况对模型进行训练,发现模型在ad与nc数量比为3/10-10/10的范围内都能有不错的表现效果,验证了模型的鲁棒性。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1