基于多粒度卷积降噪自动编码器技术的医疗图像分类方法与流程

文档序号:16975930发布日期:2019-02-26 18:59阅读:333来源:国知局
基于多粒度卷积降噪自动编码器技术的医疗图像分类方法与流程

本发明属于计算机视图技术领域,特别是涉及一种基于多粒度卷积降噪自动编码器技术的医疗图像分类方法。



背景技术:

图像分类是计算机视觉中一个非常活跃的应用研究方向,其目的是对各种类别的图像进行分门别类,特征相似的图像被分到同一个类中,而不同类的图像则被分到不同的类中。在现有的研究中,图像分类大致可以分为以下几个步骤:(1)图像预处理;(2)特征提取;(3)特征选择;(4)分类器的选择与设计。在这几个步骤中,特征提取起着关键的作用,决定了最后分类结果的精度与性能的稳定性。在过去的研究中,进行特征提取的过程通常是提取局部特征或者全局特征,比如:localbinarypattern(lbp),histogramoforientedgradients(hog),scaleinvariantfeaturetransform(sift)。近几年来,随着机器学习的兴起研究者们把目光聚集在了发展最快的深度学习,这是因为已有研究表明深度学习算法具有模拟人类大脑结构的功能,能将底层低级的特征逐层抽象为高级特征,可以更有效的来表达和描述图像。由于此研究领域具有较高的理论研究与实际应用价值,国内外许多研究者提出了较多医疗图像分类的技术,但大致包含了三个方面的工作:特征学习、特征提取以及分类。首先,对原始的医疗图像数据进行特征学习;其次,提取出图像的高级特征,最后,基于提取到的高级特征对图像进行分类分析。

尽管研究人员在图像分类领域上已经取得了一些成果,但由于实际医疗图像类间差异极小,特征分布十分的复杂,还有噪声干扰的问题,使得现有技术并不成熟。主要存在以下几方面的缺陷。(1)现有卷积神经网络需要大量的有类标的数据;在现实生活中数据类标的获得是困难的,且严重依赖人们手工和专家知识,这就需要耗费大量的资源;(2)现有的基于特征提取的图像分类算法中,提取到的特征具有单一性,由于传统卷积神经网络只使用一种大小的卷积核,导致提取到的高级特征不具备多样性,最后会导致算法的精度有所下降。(3)大部分的分类算法的稳定性是有限的,当遇到一些复杂的环境,比如噪声问题的时候,算法的泛化性能显著下降。

因此,如何在没有先验知识的条件下,合理地组合不同的深度学习算法来提高模型的鲁棒性已达到最优的分类结果是一个亟待解决的问题。



技术实现要素:

本发明的目的在于提供一种基于多粒度卷积降噪自动编码器技术的医疗图像分类方法,以实现构造一个泛化能力强,抗干扰性高的医疗图像分类器,同时充分发挥每个子组件在特征提取方面的性能;以解决现有技术中数据类标获得困难且耗费资源多、提取特征单一和对复杂环境的抗干扰能力低导致泛化性显著下降的问题。

本发明所采用的技术方案是,提供一种基于多粒度卷积降噪自动编码器技术的医疗图像分类方法,包括以下步骤:

步骤1),医疗图像预处理:调用opencv工具包,将医疗图像的尺寸大小调整为256×256,调整后的图像进行归一化处理,并作为图像数据集,按照8:2的医疗图像张数比例将所述图像数据集划分为医疗图像训练集和医疗图像测试集;

步骤2),建立医疗图像分类模型:

a.运用多粒度卷积降噪自动编码器编码部分的网络结构对单张医疗图像进行编码操作;所述多粒度卷积降噪自动编码器编码部分同时采用1×1、3×3、5×5三种尺寸的卷积核,将步骤1)中经过预处理后尺寸为256×256的单张医疗图像即对应维度为65536的输入向量xi加入高斯噪声,得到被损坏医疗图像数据特征,所述被损坏医疗图像数据特征定义为干扰输入向量再通过线性映射进入非线性的激活函数得到中间层的特征表示向量αi

其中,αi为干扰输入向量经过两个隐藏层抽象后得到的中间层特征表示向量,角标i为医疗图像训练集中图像的维度;xi为输入向量;为原始干净的输入向量在加入噪声干扰之后得到的被损坏的干扰输入向量,即干扰输入向量;w1为多粒度卷积降噪自动编码器的输入层到中间层的权值矩阵,b1为自动编码器的输入层到中间层的偏置向量;表示的函数为编码函数,表示的函数为神经元的激活函数,通常取sigmoid函数或者恒等函数relu;

b.基于多粒度卷积降噪自动编码器的解码部分与编码部分的网络结构完全对称,运用自动编码器解码部分的网络结构进行解码操作,对中间层的高级特征即干扰输入向量进行解码操作,经过隐藏层的中间特征向量αi通过线性映射进入非线性的激活函数,输出被损坏医疗图像的重构图像,所述被损坏医疗图像的重构图像对应重构后的输出向量zi

zi=g(αi)=l(w2αi+b2);(2)

其中,zi为重构后的输出向量,即干扰输入向量的一个重构;g(αi)为解码函数,w2为自动编码器中间层到输出层的权值矩阵,b2是自动编码器中间层到输出层的偏置向量;l(w2αi+b2)表示的函数为神经元的激活函数;

c.建立代价函数,衡量自动编码器的重构性能:基于前述步骤a和b,建立以干扰输入向量与输出向量zi之间的重构误差为变量的代价函数,通过将代价函数最小化,使干扰输入向量与重构后的输出向量zi相似;代价函数l(x,z)如下所示,代价函数的损失值l越小,编码器部分特征提取越准确;

其中,x代表输入的医疗图像训练集,z表示输出的重构医疗图像数据;

d.将公式(3)针对医疗图像训练集中的所有医疗图像进行损失值的求和计算,并引入正则化约束,得到多粒度卷积降噪自动编码器在医疗图像训练集上的总体代价函数j(w,b)如下:

其中,j为整个医疗图像训练集中图像的损失值,w和b分别为整个多粒度卷积降噪自动编码器网络的权值矩阵和偏置向量,为正则化项,λ为惩罚因子,m为医疗图像训练集中图像的数量;

e.基于贪婪逐层预训练的方法将前述步骤a至d重复三遍,得到三个多粒度卷积降噪自动编码器堆叠成的深度神经网络,即构成由三个多粒度卷积降噪自动编码器叠加而成的深度神经网络;

f.解除深度多粒度卷积降噪自动编码器的解码器部分,在剩余的深度神经网络后接上softmax分类器,对深度多粒度卷积自动编码器的编码器部分提取到的医疗图像高级特征进行分类,softmax分类器的函数表达式如下:

其中,wi是输入向量xi的权值向量,m为医疗图像训练集图像的数量,k为不同医疗图像数据集的类别数;为评分函数,表示医疗图像反应的特征与某一疾病类别的相近程度,故f(x)函数称为归一化概率,表示预测医疗图像确认为某一疾病类别的概率;e为指数函数的数字常数;

g.微调,使深度神经网络的参数w1、w2、b1、b2达到最优值;

步骤3),将医疗图像测试集中的图像输入步骤2)建立的医疗图像分类模型中,通过测试集上的分类精度判断医疗图像归属的疾病类别,分类精度越高,医疗图像归属的该疾病类别的准确性越高,即达到精准分类的目的;分类精度的表达公式为:

其中,f为基于多粒度卷积降噪自动编码器的医疗图像分类方法,d为医疗图像测试集,n为医疗图像测试集中图像的数量,xi为医疗图像测试集d中的第i张图像,yi为医疗图像测试集d中第i张图像的真实类标,f(xi)为基于多粒度卷积降噪自动编码器的医疗图像分类方法对医疗图像进行特征学习后的预测类标。

本发明的有益效果是:

(1)本发明基于无监督学习的特征学习方法,把卷积神经网络中的卷积操作运用于传统自动编码器的网络结构当中,具有比单一技术更高的分类精度,达到了稀疏连接的效果;同时卷积权值共享的特性使得网络参数数量显著减小,降低了计算量;并将严重依赖于有类标数据的卷积神经网络运用到了无监督学习的领域,拓宽了卷积神经网络的发展。

(2)本发明的多粒度卷积核提取高级特征的方法,在高效提取特征的基础上,保证了提取的高级特征的多样性,能全面的表征图像的关键特征,有利于提高分类的精度,达到最优分类结果。

(3)本发明对于复杂的环境具有较强的抗干扰能力。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是自动编码器网络结构图。

图2是基于多粒度卷积降噪自动编码器的特征学习算法示意图。

图3是深度多粒度卷积降噪自动编码器示意图。

图4是不同噪声比例下分类性能对比图。

图5是脑膜炎脑脊液显微镜下的成像图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在脑膜炎数据集上,本发明公布的基于多粒度卷积降噪自动编码器技术的医疗图像分类方法得到了较好的验证。如图5所示,脑膜炎分为四类,分别是化脓性脑膜炎、结核性脑膜炎、病毒性脑膜炎、隐球菌性脑膜炎。从图5中可以看出,脑脊液在显微镜下的成像类间差距极小,缺乏专业知识的人或者临床经验不够的医生很难判断出脑膜炎的具体类型。一般情况下,医生根据病人的临床表现以及脑脊液检查综合确诊患病的类型然后才能进行相应的治疗。但是,医生在观察脑脊液在显微镜下的成像时,会受到个人的经验、知识、条件等的影响;来自不同医院的图像数据或者来自同一个医院的同种不同规格的医疗设备采集到的图像数据也会有一定的差异,以至于最后确诊的结果会受到这些众多因素的影响。因此,需要运用本发明的分类方法进行准确分类。

具体过程如下:

1.图像预处理:脑膜炎数据集原始尺寸为3184×4230,故当得到这些图像数据时,首先要进行预处理。在本发明的实施例中,预处理可分为三步:1)调整图像大小:调用opencv工具包,来对脑膜炎图像进行调整大小的操作,在本文的具体操作中,把脑膜炎图像尺寸统一处理成256×256大小;2)归一化处理:在许多图像处理过程中,对图像进行归一化处理是必须的预处理过程,所谓的归一化处理就是使图像像素值分布在0-255之间的点的值分布在[0,1]之间,处理后可以加快模型参数收敛的速度,在这里,我们也对脑膜炎图像进行归一化操作,使网络参数在训练过程中快速收敛,节约训练时间;3)划分数据集:将来自某三甲医院的148张图像脑膜炎图像数据集按照8:2的图像张数比例随机分成脑膜炎图像训练集和脑膜炎图像测试集,其中,脑膜炎图像训练集用来训练本发明的医疗图像分类模型,脑膜炎图像测试集用来评估本发明医疗图像分类模型在具体脑膜炎图像分类任务上的性能。特别地,四类脑膜炎疾病都均匀的分布在脑膜炎图像训练集和脑膜炎图像测试集中。

2.建立医疗图像分类建模:为了捕获到医疗图像的多样性的和全局性的特征以及提高模型的鲁棒性(抗噪能力),本发明提出了多粒度卷积降噪自动编码器的算法模型。该模型作为一个完全对称的网络结构,可分为编码器和解码器两个部分。

a.首先,如图1所示,编码器部分对输入的脑膜炎图像进行编码操作,逐层抽象得到中间层的高级特征;即运用多粒度卷积降噪自动编码器编码部分的网络结构对单张医疗图像进行编码操作;所述多粒度卷积降噪自动编码器编码部分同时采用1×1、3×3、5×5三种尺寸的卷积核,将步骤1)中经过预处理后尺寸为256×256的单张医疗图像即对应维度为65536的输入向量xi加入高斯噪声,得到被损坏医疗图像数据特征,所述被损坏医疗图像数据特征定义为干扰输入向量再通过线性映射进入非线性的激活函数得到中间层的特征表示向量αi

其中,αi为干扰输入向量经过两个隐藏层抽象后得到的中间层特征表示向量,角标i为医疗图像训练集中图像的维度;xi为输入向量;为原始干净的输入向量在加入噪声干扰之后得到的被损坏的干扰输入向量,即干扰输入向量;w1为多粒度卷积降噪自动编码器的输入层到中间层的权值矩阵,b1为自动编码器的输入层到中间层的偏置向量;表示的函数为编码函数,表示的函数为神经元的激活函数,通常取sigmoid函数或者恒等函数relu。

b.如图2所示,对中间层的高级特征进行解码操作,得到输入脑膜炎图像的重构表示。即运用自动编码器解码部分的网络结构进行解码操作,对中间层的高级特征即干扰输入向量进行解码操作,经过隐藏层的中间特征向量αi通过线性映射进入非线性的激活函数,输出被损坏医疗图像的重构图像,所述被损坏医疗图像的重构图像对应重构后的输出向量zi

zi=g(αi)=l(w2αi+b2);(2)

其中,zi为重构后的输出向量,即干扰输入向量的一个重构;g(αi)为解码函数,w2为自动编码器中间层到输出层的权值矩阵,b2是自动编码器中间层到输出层的偏置向量;

l(w2αi+b2)表示的函数为神经元的激活函数。

c.要训练该对称神经网络,针对一张图像需要构建一个代价函数,本发明将脑膜炎图像的重构误差作为代价函数。实际训练中,使代价函数尽可能的小,以促使分类模型在学习脑膜炎图像训练集的时候选择最优的参数来更好的捕获脑膜炎图像的高级特征。因此,基于建模过程a和b,建立以干扰输入向量与输出向量zi之间的重构误差为变量的代价函数,通过将代价函数最小化,使干扰输入向量与重构后的输出向量zi相似;代价函数l(x,z)如下所示,最小化代价函数的损失值l越小,编码器部分特征提取越准确;

其中,x代表输入的医疗图像训练集,z表示输出的重构医疗图像数据;

d.对多张图像建立总体代价函数,即针对医疗图像训练集中的所有医疗图像进行损失值的求和计算,并引入正则化约束,得到多粒度卷积降噪自动编码器在医疗图像训练集上的总体代价函数j(w,b)如下:

其中,j为整个医疗图像训练集中图像的损失值,w和b分别为整个多粒度卷积降噪自动编码器网络的权值矩阵和偏置向量,为正则化项,λ为惩罚因子,m为医疗图像训练集中图像的数量;

e.每个多粒度卷积降噪自动编码器中含有三种不同尺寸的卷积核,在第一个多粒度卷积降噪自动编码器训练结束后,基于贪婪逐层预训练的方法,重复以上训练过程,得到三个多粒度卷积降噪自动编码器堆叠成的深度神经网络,即构成由三个多粒度卷积降噪自动编码器叠加而成的深度神经网络,从而提到分类精准度,如图3所示,首先训练第一个多粒度卷积降噪自动编码器,训练结束后,固定其参数并将其中间层的输出作为第二个多粒度卷积降噪自动编码器的输入,接着训练第二个多粒度卷积降噪自动编码器,训练结束后,固定其参数将其中间层的输出作为第三个多粒度卷积降噪自动编码器的输入,以此类推,训练出由三个多粒度卷积降噪自动编码器构成的深度堆叠式神经网络,固定参数将其中间层的输出作为softmax分类器的输入,训练该分类器,进而完成整个训练。其中,分别对应第一个多粒度卷积降噪自动编码器的输入层到中间层的权值矩阵、偏置向量以及中间层的特征表示向量,同理,以及为第二个多粒度卷积降噪自动编码器的输入层到中间层的权值矩阵、偏置向量以及中间层的特征表示向量,分别为第三个多粒度卷积降噪自动编码器的输入层到中间层的权值矩阵、偏置向量以及中间层的特征表示向量。

如图4所示,三个多粒度卷积自动降噪编码器在叠加之后的分类精准度明显提高;

f.如图3所示,移除该深度神经网络解码器部分,剩下的编码器部分的输出就是医疗图像分类模型进行分类所需要的高级特征,在剩余的深度神经网络后接上softmax分类器,对深度多粒度卷积自动编码器的编码器部分提取到的脑膜炎图像高级特征进行分类;softmax分类器的函数表达式如下:

其中,wi是输入向量xi的权值向量,m为医疗图像训练集图像的数量,k为不同图像数据集的类别数;为评分函数,表示医疗图像反应的特征与某一疾病类别的相近程度,故f(x)函数称为归一化概率,表示预测医疗图像确认为某一疾病类别的概率;e为指数函数的数字常数;

g.深度神经网络的参数w1、w2、b1、b2在经过预训练后都达到了局部最优值,然而这时对脑膜炎图像的具体疾病类别的分类正确率并不是最高的,最后需要对该网络进行微调,经过微调后,该网络的参数w1、w2、b1、b2达到了全局最优,此时医疗图像分类模型对脑膜炎图像所属的疾病类型的分类正确率达到最高值。

3.预测:为了评估本发明医疗图像分类模型的泛化性能,需要在脑膜炎图像测试集上进行实验,与此同时,为了验证本发明的分类模型与其他分类模型在脑膜炎医疗图像上分类的性能差异,本文将本发明的医疗图像分类方法与其他分类方法均基于脑膜炎医疗图像测试集进行分类正确率的对比。分类正确率通过分类精度公式表达如下:

其中,f为基于多粒度卷积降噪自动编码器的医疗图像分类方法,d为医疗图像测试集,n为医疗图像测试集中图像的数量,xi为医疗图像测试集d中的第i张图像,yi为医疗图像测试集d中第i张图像的真实类标,f(xi)为基于多粒度卷积降噪自动编码器的医疗图像分类方法对医疗图像进行特征学习后的预测类标。

通过实验结果看出,本发明在脑膜炎医疗图像测试集上的分类正确率达到了72.83%,明显高于其他算法模型,如表1所示。充分证明了本发明的分类方法在医疗图像分类中具备较高的准确性。

表1脑膜炎医疗图像不同算法的分类正确率对比

另外,在脑膜炎医疗图像数据集的实验中,本发明采用的是三个多粒度卷积降噪自动编码器堆叠而成的深度神经网络。将本发明与不同卷积核尺寸的三个单粒度卷积自动编码器的叠加分别在脑膜炎医疗图像集中进行分类比较,得到各自不同的分类准确性的对比数据,如表2所示。

表2基于不同粒度的算法在脑膜炎医疗图像集中测试的正确率对比

从表2中可以看出,相比具有单粒度卷积核的卷积自动编码器,多粒度卷积核的设计能捕获到图像全面的高级特征,有利于提高分类模型的分类精度。

为了提高分类模型的鲁棒性,本发明在模型的训练过程中加入了高斯噪声,迫使本发明的医疗图像分类模型从被损坏从的医疗图像中学习到更加具有鲁棒性的高级特征,以下实验将对比加入高斯噪声之后对算法在脑膜炎图像数据集上进行分类比较,得到各自不同的分类准确性的对比数据,验证加入高斯噪声的有效性。其中cdae为具有单一粒度卷积核的卷积降噪自动编码器。

表3加入噪声之后不同算法的测试正确率对比

从表3可以看出,相比没有加入高斯噪声,加入高斯噪声之后,卷积自动编码器在脑膜炎图像数据集上的分类正确率明显提高,这验证了加入高斯噪声能使算法在训练过程中提取到医疗图像更加具有鲁棒性的高级特征,以此提高分类正确率。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1