基于深度卷积神经网络和全局特征的肺部肿瘤识别方法与流程

文档序号:13663114阅读:5036来源:国知局
基于深度卷积神经网络和全局特征的肺部肿瘤识别方法与流程
本发明涉及应用卷积神经网络的图像处理
技术领域
,尤其涉及一种基于深度卷积神经网络和全局特征的肺部肿瘤识别方法。
背景技术
:肺癌作为世界上发病率和死亡率最高的恶性肿瘤之一,严重威胁人民健康和生命。由于肺癌患者早期无明显症状或影像学表现不典型0,难以发现和诊断,导致确诊时大部分处于中晚期,错过了治疗的最佳时间,所以早检查早诊断对于肺癌患者至关重要。在肺癌早期诊断中多层螺旋ct通过重建技术能够清晰显示出横断面、矢状面和冠状面的病灶特征,中期诊断中螺旋ct诊断联合表面遮蔽和多平面重建能够清晰显示肿瘤部位、内部结构、边缘特征、血液供应、侵犯周围组织程度以及周边组织的改变,具有较高的诊断准确率[2],所以ct图像对于肺癌的诊断和识别提供重要的参考依据,针对海量医学影像数据,医生借助于计算机辅助诊断(computeraideddiagnosis,cad)可以减轻其工作负担,提高诊断率、降低误诊率和漏诊率。深度学习[3]作为机器学习研究新领域,通过建立、模拟人脑分析解释数据,尤其卷积神经网络独特的深层结构可以有效地学习输入与输出之间的复杂映射,具有良好的特征学习和泛化能力。目前对于dcnn模型的设计主要集中在模型参数、激活函数、感受野大小、池化层操作等方面,在经典模型lenet-5结构的基础上,陈先昌[4]通过调节网络模型的各层滤波器数量参数和层间连接方式构建多个不同的卷积神经网络用于光学数字识别;马苗[5]去掉lenet-5第3层卷积层,并用svm分类器代替最后输出层中的softmax分类器用于街景门牌号码的识别,简化网络结构的分类效率有所提升;2012年hinton等人加深网络层数,使用的5个卷积层的卷积神经网络在imagenet数据集[6]上取得了良好的成绩;高惠琳[7]在传统cnn的基础上对图片进行白化预处理,在亚采样层采用stochasticpooling方法提高网络泛化能力用于军事图像的分类;张军[8]构建了7层的dcnn用于5种车型的识别,对主要参数进行对比研究,识别率达到96.8%;郭鹏[9]设计的dcnn用于手写体字符识别,实验结果表明感受野大小显著影响模型参数个数,对识别率影响不大,但运行时间呈反向变化趋势,为合理选择感受野大小提供理论实践参考;he等人[10]探讨了在限定训练时间和计算复杂度上如何平衡卷积神经网络中层数、特征图数量及卷积核大小等问题,说明具有更小卷积核且深度更深的cnn结构比大卷积核同时深度较浅的cnn更易得到好的识别结果。总之,针对不同的研究问题构建模型结构和确定模型参数时常采用人工设置方法,再根据实验观察所得训练模型的识别性能,最后根据训练时间和识别结果确定最合适的参数和模型结构。深度卷积神经网络[11](deepconvolutionalneuralnetwork)能够自动提取图像的高层次特征并对图像进行有效的表达,通过对输入数据进行多层线性或非线性变换,将数据映射到新的空间里表达,可以稳定有效地提取图像的本质特征,但是针对特定的研究对象和应用领域需进行相应的优化改进。以下对本领域的基本概念作简单解释如下:1.dcnn模型结构:深度卷积神经网络模型(deepconvolutionalneuralnetwork,dcnn)是模拟视觉皮层中简单细胞和复杂细胞的功能,通过卷积层和池化层的交替处提取图像特征,结合相应的分类器实现图像分类识别。1.1卷积层:每一个卷积层[12]由多张特征图组成,每张特征图中的神经元与前一层输入层或池化层中感受野的神经元相连,并且同一张特征图中的神经元与对应的感受野中神经元连接权重共享,每个输出特征图可以组合卷积多个特征图:是卷积层l的第j个通道的输出,是卷积核矩阵,是对卷积后特征图的偏置。卷积核中权重不同,图像的卷积可以起到不同的作用。1.2下采样:每一个下采样层[13]也由多张特征图组成,其特征图的数量与其前面的卷积层中的特征图个数相同,池化层中的神经元输入是其前面的卷积层中采样窗口中的神经元,神经元值是通过对卷积层采样窗口中的神经元聚集(如最大值或平均值)计算而来。下采样过程如下:其中down(·)表示下采样函数,每个输出图像都有自己的乘型偏置β以及加型偏置b。1.3全连接层:全连接层中,将所有二维图像的特征图连接为一维特征作为全连接网络的输入,通过输入加权求和并通过激活函数的响应得到全连接层的输出:xl=f(wlxl-1+bl),其中wl是全连接网络的权重系数,xl-1是特征图,bl是全连接层的偏置项。2.dcnn训练方法:dcnn的训练过程主要采用的是反向传播算法,即输入训练数据,先前向计算各神经元的激活值,然后再反方向计算误差,并对误差求各个权值和偏置的梯度,并据此调整各个权值和偏差。2.1全连接层的梯度计算:对于dcnn的全连接层,采用bp反向传播规则[14]计算误差函数e对应于网络权值的偏导。假设一个多分类问题包括n个训练样本和c个类别,其误差函数为:其中表示第n个样本中第k维对应的类别标签,表示第n个输入样本中第k维对应的预测输出值。将网络反向传播的‘误差’看作是每个神经单元对于偏差的‘敏感程度’(即残差),基于梯度的反向传播学习算法就是要找到误差相对于网络中参数的偏导数,定义如下:其中输出层的神经元灵敏度计算公式:δl=f'(ul)ο(yn-tn),其中“ο”表示点乘,即矩阵中对应元素相乘。全连接层l的灵敏度计算公式:δl=(wl+1)tδl+1οf'(ul)对于神经元权重的更新规则就是将该神经元的输入与该神经元的三角阵相乘。如果用向量表示,就是输入向量和残差向量的内积:在实际应用中,通常每个权重wij都有对应的不同ηij。2.2卷积层的梯度计算:cnn的每个卷积层l后都连接着下采样层l+1,反向传播过程中需要将l+1层中所有对应于该神经元的残差求和,来计算出l层中神经元的残差,并将这些残差乘上对应的权值,然后再乘上当前神经元的激活函数相对于输入的偏导。通过链式求导计算灵敏度:其中up(·)表示上采样操作。通过对中所有元素求和来计算出偏置b的梯度:最后核函数的权重的梯度为:其中表示中区域块,在卷积过程中,输出卷积图中(u,v)元素是将区域块与逐个元素相乘得到的。可采用matlab中卷积函数卷积有效的重叠区域来实现:2.3下采样层的梯度计算:采样层的反向传播过程中首先计算残差图,然后更新β和b这两个可学习参数。在计算下采样层梯度时,找到残差图中的给定像素对应于上一层的残差图中的区域块,再利用δ的递推过程,将残差反向传播回来。另外,需要乘以输入区域块和输出像素之间连接的权值,这个权值实际上就是卷积核的权值。上述过程可以使用下面的函数公式实现:加型偏置b的梯度即对残差图中元素的求和:乘型偏置β的梯度表示为:3.评价指标:有六个评价指标衡量实验结果,包括由真正类(turepositive,tp),假正类(falsepositive,fp),正负类(truenegative,tn),假负类(falsenegative,nn)计算得出的识别准确率(accuracy)、灵敏度(sensitivity)、特异度(specificity)、马修相关系数(matthewscorrelationcoefficient,mcc)、f1score[15]和运行时间。其中,tp表示肺部正常图像被预测为正常图像的情况,fp表示肺部肿瘤图像被预测为正常图像的情况,tn表示肺部肿瘤图像被预测为肺部肿瘤图像,fn表示肺部正常图像被预测为肺部肿瘤图像的情况。(1)运行时间(trainingtime)是表示算法从开始运行到终止所花费的时间,在卷积神经网络运行过程中表示达到指定的迭代次数后整个训练过程和测试过程所耗费的时间总和。(2)准确率(accuracy)是描述分类器正确识别肺部ct图像所属类别占所有图像的比例数值,该值在0到1之间,值越大说明分类器效果越好,该值能够反映被正确判定的性能。(3)灵敏度(sensitivity)和特异度(specificity):灵敏度表示肺部正常图像的识别数占所有图像的识别比例,特异度表示肺部肿瘤图像被准确识别的比例数占总识别总数的比重。(4)mcc是一种更加平衡的评价标准,它考虑到真正的误报和漏报,尤其在各类别数不同的情况下,一般被认为是一种平衡的措施。mcc本质上是一个相关系数之间的观察和预测的二进制分类,返回-1和1之间的值,1表示一个完美的预测,0想当于随机预测和-1表示分类结果完全错误。mcc公式如下:(5)f1score是统计学中用来衡量二分类模型精确度的一种指标,同时兼顾了分类的准确率和召回率,可以看作是模型准确率(precision)和召回率(recall)的一种加权平均,它的最大值是1,最小值是0,值越接近1表示准确率越高。公式如下:参考文献:[1]余顺强,彭俊辉.早期肺癌的影像学诊断[j].中国现代药物应用,2014,8(23):205-206.[2]张忠凤,张春.多层螺旋ct对肺癌的诊断价值[j].实用临床医学,2016,17(1):53-54.[3]yannlecun,yoshuabengio,geoffreyhinton.deeplearning[j].nature,2015,521(7553):436-444.[4]陈先昌.基于卷积神经网络的深度学习算法与应用研究[d].浙江工商大学,2014.[5]马苗,陈芳,郭敏,等.基于改进lenet-5的街景门牌号码识别方法[j].云南大学学报(自然科学版),2016,38(2):197-203.[6]alexk,ilyas,geoffh.imagenetclassificationwithdeepconvolutionalneuralnetworks[j].advancesinneuralinformationprocessingsystems,2012,25(2):1106-1114.[7]高惠琳.基于卷积神经网络的军事图像分类[j/ol].[2016-10-12].http://www.arocmag.com/article/02-2017-10-012.html.[8]张军,张婷,杨正瓴,等.深度卷积神经网络的汽车车型识别方法[j].传感器与微系统,2016,35(11):19-22.[9]郭鹏.深度卷积神经网络及其在手写体汉字识别中的应用研究[d].四川师范大学,2016.[10]hekai-ming,sunjian.convolutionalneuralnetworksatconstrainedtimecost//proceedingsoftheieeeconferenceoncomputervisionandpatternrecognition(cvpr),boston,usa,2015:5353-5360.[11]yoshuabengio,aaroncourville,pascalvincent.representationlearning:areviewandnewperspectives[j].ieeetransactionsonpatternanalysisandmachineintelligence,2013,35(8):1798-1828.[12]李敬.基于卷积神经网络的烟草病害自动识别研究[d].山东农业大学,2016.[13]龚丁禧,曹长荣.基于卷积神经网络的植物叶片分类[j].计算机与现代化,2014,(4):12-19.[14]yannlecun,b.boser,j.s.denker,etal.backpropagationappliedtohandwrittenzipcoderecognition[j].neuralcomputation,1989,11(4):541-551.[15]赵鑫欣.基于卷积神经网络的铁轨扣件异常状态监测研究[d].北京交通大学,2016.技术实现要素:本发明的目的是为了克服现有技术中的不足,提供一种基于深度卷积神经网络和全局特征的肺部肿瘤识别方法,本发明通过构建深度卷积神经网络用于肺部肿瘤ct全局特征图像的识别,在初始构建的深度卷积神经网络(dcnn)基础上探讨不同模型参数、模型结构和优化算法对识别性能的影响,验证深度卷积神经网络对于肺部肿瘤全局特征辅助诊断的可行性,并探讨不同影响因素对网络识别结果的影响程度,提供应用于肺部肿瘤识别的最优的深度卷积神经网络(dcnn),为肺部肿瘤计算机辅助诊断提供参考依据。本发明的目的是通过以下技术方案实现的:基于深度卷积神经网络和全局特征的肺部肿瘤识别方法,包括以下步骤:(1)收集具有肺部全局特征的ct图像,包括具有肺部肿瘤的ct图像和正常的ct图像;(2)将ct图像转换为灰度图像,并归一化为相同大小的实验数据,得到用于深度卷积神经网络训练和测试的肺部肿瘤ct数据集;(3)结合肺部肿瘤的全局特征构建初始深度卷积神经网络结构;(4)针对ct全局特征样本空间集,通过选择不同分辨率的ct图像和不同的迭代次数得到对初始深度卷积神经网络结构识别率和训练时间的影响,以确定最佳的ct图像分辨率和最佳的迭代次数;(5)通过改变初始深度卷积神经网络结构的卷积核大小、特征图数量和网络层数,得到不同的深度卷积神经网络结构对于肺部肿瘤全局特征不同的的识别性能,以确定最佳的深度卷积神经网络结构;(6)通过使用不同的池化方法、激活函数及训练算法,得到对于深度卷积神经网络结构的识别结果的影响,以确定最佳的池化方法、激活函数和训练算法;(7)构建用于肺部肿瘤识别的最佳的深度卷积神经网络。步骤(1)中所述ct图像的格式为dicom格式且至少为5000个,其中具有肺部肿瘤的ct图像数和正常的ct图像数各占肺部ct图像总数的50%。所述初始深度卷积神经网络结构由1层输入层、3层卷积层、3层池化层、2层全连接层和1层输出层组成,并采用softmax分类器。步骤(6)中池化方法包括均值采样方法和最大池采样方法;激活函数包括sigmoid函数和relu函数;训练算法包括批量梯度下降法和带有弹性动量的梯度下降法;具体流程为:首先对均值采样方法和最大池采样方法进行对比实验;然后对relu和sigmoid两种激活函数进行对比实验;最后通过对批量梯度下降法和带有弹性动量的梯度下降法的对比实验,依次得到对深度卷积神经网络结构的识别结果的影响。一种用于肺部肿瘤识别的深度卷积神经网络结构,由一层输入层、三层卷积层、三层池化层、两层全连接层和一层输出层组成,并采用softmax分类器,卷积核的大小为5-11-11(三个卷积层中每一层卷积核的大小分别是5×5,11×11,11×11),三层下采样层的特征图数量分别为6-12-24(表示三个卷积层中每层的特征图数目依次是6,12,24);隐含层数为6,隐含层由三层卷积层和三层下采样层构成。与现有技术相比,本发明的技术方案所带来的有益效果是:1.本发明利用深度卷积神经网络的特征表示能力,在不进行图像处理和提取特征提取的情况下直接将深度卷积神经网络(dcnn)用于肺部肿瘤ct全局特征分类识别,从模型参数、网络结构和训练算法三个方面进行对比分析,结果验证了dcnn用于肺部肿瘤ct全局特征的可行性,实验表明结合输入图像分辨率大小,需选择合适的卷积核大小、特征图数量和网络层数才能保证良好的识别性能,验证了深度卷积神经网络良好的特征学习能力和良好的泛化能力及鲁棒性。2.在深度卷积神经网络模型结构中,层数越深、特征图数目越多,则网络能够表示的特征空间就越大,网络学习能力也越强,然而计算复杂度也更大,容易出现过拟合现象,因此,在针对特定领域的实际应用过程中应适当选取网络深度、特征图数、卷积核大小及其他参数,通过本发明得到最优的网络深度卷积神经网络以训练出更好的模型同时保证相对少的训练时间。附图说明图1-1至图1-5为经过灰度转换后得到的肺部肿瘤异常的ct图像。图2-1至图2-5为经过灰度转换后得到的肺部肿瘤正常的ct图像。具体实施方式下面结合附图和具体实施例对本发明作进一步的描述。本发明针对肺部ct图像全局特征保护了一种基于深度卷积神经网络和全局特征的肺部肿瘤识别方法。针对肺部ct图像的特征和医学图像的复杂性,本发明从深度卷积神经网络模型参数、模型结构和优化算法三方面的进行研究,首先分析不同分辨率、迭代次数不同模型参数对识别结果的影响,然后从卷积核大小、特征维数和网络层数构建不同深度卷积神经网络(dcnn)模型结构分析其识别性能,最后从采样方法、激活函数和梯度下降法分析对比均值采样和最大值采样、sigmoid和relu函数、批量梯度下降法和带弹性动量的梯度下降法不同优化算法对网络识别结果的影响,从而得到适用于肺部肿瘤辅助诊断的最优dcnn模型。本实施例的具体步骤如下:(1)数据收集:从医院收集整理了5000幅原始dicom格式肺部ct图像,根据医生标记和医嘱选取2500幅作为肺部肿瘤cr图像,2500幅正常的ct图像作为对比图像;(2)图像预处理:将收集到的图像转化为灰度图像,然后归一化为相同大小的实验数据,构建肺部肿瘤ct数据集用于dcnn的训练和测试;(3)构建dcnn:结合肺部肿瘤全局特征初始构建8层的深度卷积神经网络,包括一层输入层,三层卷积层,三层池化层,两层全连接层和一层输出层,采用softmax分类器;(4)相同模型结构不同模型参数研究:针对ct全局特征样本空间集,探讨不同分辨率输入图像和不同迭代次数对dcnn识别率和训练时间的影响;(5)不同模型结构的研究:在初始构建的8层网络结构基础上,通过改变卷积核大小、特征图数量和网络层数探讨不同模型结构对于肺部肿瘤全局特征识别性能;(6)不同优化算法对比分析:选择合适的模型结构后,对比分析池化方法(均值采样和最大池采样)、激活函数(sigmoid函数和relu函数)以及训练算法(批量梯度下降法和带有弹性动量的梯度下降法)对于识别结果的影响;(7)决策评价:通过对比实验和不同模型参数和结构的分析研究,构建最优的深度卷积神经网络,为应用肺部肿瘤ct全局特征的计算机在辅助诊断时提供参考依据,以提高识别率和训练时间,增强鲁棒性和泛化能力。本实施例中,肺部肿瘤ct数据集指肺部肿瘤ct图像的集合;ct全局特征是指的整幅ct图像(因为卷积神经网络是对整幅图像进行识别,不需要提取特征);由于卷积神经网络可以直接输入原始图像并且对于复杂图像的识别具有明显优势,目前ct广泛应用于肺部肿瘤识别诊断,但因ct图像中病灶区域占整幅图像很少的区域,特征不明显且难以分辨,所以实施例所构建深度卷积神经网络提取肺部肿瘤深层特征用于计算机辅助诊断。其中,输入层:输入图像为64×64大小的肺部肿瘤ct整幅图像,也就是肺部图像全局特征输入用于dcnn分类识别;c1层:为第一层卷积层,每个神经元与输入图像5×5的局部感受野进行卷积,特征图大小为60×60,c1层共包含6个不同的特征图;s2层:为第一层下采样层,是对c1层2×2邻域进行下采样,特征图大小为30×30,特征图数量不变为6个;c3层:为第二层卷积层,采用12个7×7大小的卷积核进行卷积操作,卷积后的特征图大小为24×24,特征图数量为卷积核数量12个;s4层:为第二层下采样层,对上一层卷积层2×2邻域不重复采样,得到12×12大小的特征图,不改变特征图数量依旧为12个;c5层:为第三层卷积层,由18个8×8大小的特征图组成;s6层:为第三层池化层,由18个4×4大小的特征图组成;f7层:为第一层全连接层,包含120个神经元,与s6层全连接;f8层:为第二层全连接层,包含84个神经元,与上一层全连接,并与输出层连接;输出层:输出层采用softmax分类器,计算图像属于不同类型的概率,公式为:式中w=[w1,w2]∈rd×2和a=[a1,a2]∈rd×2是分类器参数,t是矩阵转置的意思,是对样本x(i)属于第j类的可能性预测,最后输出两类即正常和异常肺部图像,通过计算出图像属于不同类别的概率d1,d2,选择其中的最大值dj,表明该图像属于第j种图像;aj中,j=1或2,表示分类器自身的参数,即一个阈值。进一步的,对本实施例所构建的深度卷积神经网络(dcnn)模型进行仿真实验:该实验中所涉及的软、硬件环境如下:软件环境:windows7操作系统,matlabr2014b;硬件环境:intelxeoncpue5-2407v2@2.40ghz,32.0gb内存,3.5tb硬盘。a.实验数据数据来源:从宁夏医科大学核医学科获得肺部ct数据共5000例,专家标记为肺部肿瘤的2500例,正常ct影像2500例:肺部肿瘤ct图像为医生对应pet/ct三模态影像标记的其中一个模态,正常的ct影像为带有医嘱的患者断层扫描的dicom图像。数据预处理:首先根据pet/ct三模态影像标记提取肺部肿瘤ct影像,然后根据dicom文件和医嘱说明提取肺部正常ct影像,其次将实验数据去伪彩并转化为灰度图像,最后将待实验数据归一化为相同大小,随机选择训练数据4000例,测试数据1000例,进行后续的三个实验,预处理后的图像如图1-1至图2-5所示。b.具体实验分析过程实验一:基于相同模型结构不同模型参数的研究1.中间特征图的输出深度卷积神经网络对于图像识别是基于隐含层抽象特征的识别,隐含层的特征与全局特征类似,经过卷积运算,图像尺寸减小,卷积神经网络就是对图像本身的识别,不是对提取的特征识别。在输入肺部ct整幅图像后,三层卷积层和三层下采样层分别对原始图像进行不同角度的特征提取和输出,随机选取两幅图像的中间特征图输出结果。前两层是对输入图像边缘信息和轮廓信息的提取,即底层的卷积层提取底层(low-level)的特征如图像的边、线、角等,而后边层数是对图像更高级语义信息和本质信息的抽象,基本无法肉眼识别,这也正是深度学习优越的特征学习能力的体现,总之dcnn的底层可以学习边缘、形状等物理特征,随着网络隐含层层数增多可以学习到更多复杂、抽象的视觉特征。2.不同分辨率对识别结果的影响由于训练样本使用的图像的分辨率的不同会进行不同的卷积和下采样操作从而影响模型的识别率,所以本实验首先在相同模型深度卷积神经网络结构的基础上,选择不同分辨率的肺部ct图像进行实验,包括28×28、32×32、64×64和100×100四种不同分辨率的图像进行对比分析,实验结果见表1。表1不同分辨率样本对实验结果的影响表由表可以看出:(1)图像分辨率越高,训练时间呈明显的上升趋势,也说明了样本越复杂,训练时间越长,模型运行处理的时间越长。(2)分辨率越高,识别准确率也随之升高,因为图像分辨率的降低表示图像输入信息不同程度的丢失,所以当分辨率减小时,模型的识别率较低。(3)不论分辨率大小如何,其灵敏度普遍高于特异度,说明肺部肿瘤图像容易被识别为正常图像,也符合肺部结节或肿瘤漏诊率高的现状,而对于mcc和f1score的评价指标,分辨率越高,其值也越高。总之,高分辨率图像块不仅会导致更多的处理时间,而且也会减少空间质量分辨率,但是深度卷积神经网络对于高分辨率的识别率会相应升高,所以本实施例基于时间复杂度和识别精度的考虑选择64×64分辨率的ct图像进行后续实验,即进行不同深度卷积神经网络模型结构和优化方法对识别结果影响的探讨。3.迭代次数对分类结果的影响卷积神经网络模型使用的权值计算方法是迭代法,每一次迭代都会重新调整权值,减少误差,经过不同次数的迭代得到的实验结果也不尽相同的,本实验是在经过多次的迭代实验基础上获得了理想的权值参数,然后探讨迭代次数对识别结果的影响,实验结果见表2。表2不同迭代次数对实验结果的影响表迭代次数1103050100150200250300识别率(%)50.0059.9877.2575.5583.4386.8384.1383.9385.33训练时间(s)25.08256.78700.351250.682429.523750.235016.186274.237803.60从表2可以看出,随着迭代次数的不断增加,识别率先增加后降低,而训练时间随着迭代次数的增加呈不断增长趋势。识别率呈现先增后减的趋势主要原因在于:迭代次数低于正常次数时,卷积神经网络的学习不充分,训练的模型不能得到准确的预期分类结果,随着迭代次数的增加,网络在充足的训练和学习过程中取得了较高的识别率,但是继续增加迭代次数时,超过一定的程度,网络模型的识别正确率会随着迭代次数的增加而下降,说明在合适的迭代次数下训练得到的网络模型,各参数已经优化到最优状态,网络也进入收敛阶段,此时的网络模型性能最佳。网络迭代次数的增加会影响训练时间的变化,而且这种变化呈现正向相关性,而测试时间的变化与迭代次数的变化没有直接的联系。实验二:基于不同模型结构的分类识别本实施例首次构建的深度卷积神经网络为1层输入层、3层卷积层、3层下采样层、2层全连接层和1层输出层,输入图像为64×64大小的肺部ct全局特征图像,卷积层特征图数量分别为6-12-18,表示该模型有3个卷积层,每层的特征图数目依次是:6,12,18;卷积核大小分别为5-7-5,表示三个卷积层中每一层卷积核的大小分别是5×5,7×7和5×5。激活函数选择sigmoid函数,输出层选择softmax分类器,输出2类即肺部正常和肺部肿瘤异常图像。在初始构建的深度卷积神经网络结构的基础上改变卷积核大小、特征图数量和网络深度,从而探讨不同模型结构对肺部肿瘤识别结果的影响。1.不同卷积核大小在深度卷积神经网络结构固定不变的情况下,使用不同大小卷积核的网络对肺部ct图像进行训练,探讨不同卷积核大小对dcnn识别结果的影响,结果见表3。表3不同卷积核大小对实验结果的影响在初次采用卷积核为5-7-5,识别率为85.3%的基础上,首先减小卷积核大小为5-5-5,识别率降低为69.7%,然后又增大卷积核大小为5-9-9,识别率回升为80.9%,再继续增大至5-11-11,识别率继续升高为86.3%,当卷积核增大至11-11-9时,识别率开始降低,总之,cnn网络对卷积核不敏感,随着卷积核的不断增大,运行时间也随之升高,卷积核越小,训练时间越少,因为小的卷积核训练参数少,空间复杂度和时间复杂度都会降低,但是当卷积核太大或太小时,识别率都会降低,因为卷积核的大小决定一个神经元感受野的大小,当卷积核过小时,无法提取有效的局部特征,而当卷积核过大时,提取的特征的复杂度可能远远超过卷积核的表示能力,一般地,小卷积核能够精细的处理图像,但需要增加层数才能达到良好的抽象效果,大卷积核对图像的“抽象”效果较好,但需要的训练参数也就更多。在卷积核为5-11-11时,其灵敏度达到99.6%,灵敏度高于特异度,mcc和f1score两个指标与识别率变化一致,在选择相对最优卷积核时,f1score达到0.86。因此,结合输入图像尺度合理设置适当的卷积核大小,对于提高cnn的性能至关重要,同时也是cnn参数调优的保障。经过不同卷积核大小探讨,本实施例选择5-11-11的卷积核,在保证较高的识别率的前提下进行后续实验分析。2.不同特征图数量特征图数量即为每一层卷积后提取的特征数量,与每一层卷积核数量相同,在保证卷积核大小不变的前提下,实施例在6-12-18的基础上改变特征图数量,探讨提取的特征维数对识别结果的影响,实验结果见表4。表4特征图数量对实验结果的影响从表4可以看出,减少特征图数量,运行时间减少,但识别率没有显著升高,随着第三层特征图数量的增加,运行时间呈明显的上升趋势,识别率也在逐渐增加,当特征图数量继续增加时,虽然得到了更多的ct图像特征数量,但训练时间也继续增加,识别率和其他评价指标值反而下降,尤其在特征图数量达到16-32-200之多时,耗时两个多小时,但识别率仅为71.7%,总体来说,随着提取特征数目的适当增加,识别率、灵敏度、特异度和mcc、f1score都在升高,当特征图数量达到6-12-24时,识别率达到89.3%最佳值。从实验结果分析,第一层特征图数量较少,后边层特征图数呈2倍比例增加,取得了最高的识别率。由于较小的特征图数量会使特征描述不充分,较大的特征图数目会产生过拟合现象,所以,在选取中间特征图数量即卷积核数量时,应参考所使用的数据图像大小,根据实际样本的特征和复杂度调整特征维数,一般使用更多的卷积核会获得更好的性能,适当的增加特征图数目对整体算法有一定帮助,达到理想的分类效果。经过不同特征图数量的探讨,本实施例选择6-12-24的特征图数量,在保证较高的识别率和适当运行时间的前提下进行后续实验。3.不同网络层数虽然深度学习与浅层学习最本质的区别在于网络隐含层数的多少,一般地,隐含层数越多越容易学习图像深层次特征,对此针对复杂的64×64大小的肺部ct全局特征,本实验构建了深度卷积神经网络,并通过改变网络层数进行探讨dcnn模型对识别结果的影响。构建两层的特殊层,不断增加隐含层数,具体层数分配和实验结果见表5,其中c1表示第一层卷积层,s1表示第一层下采样层,c2表示第二层卷积层,依次类推。表5卷积层数与识别性能的关系从表5可以看出,随着网络层数的增多,由2层至8层,识别率首先升高然后降低,在只有一层卷积层和一层下采样层的情况下,识别率仅为随机概率50%,说明层数太少对于准确识别影响很大,随着层数的增加至6层时,识别率达到89.3%,再增加一层卷积层则识别率又开始下降至85.4%,达到8层隐含层时识别率降低为76%,总体来说,深度网络结构可以促进特征的重复利用并获得高层表达中更抽象的特征,所以随着网络层数的增加,识别率也在增加,但是网络层数太多,需要卷积和下采样操作增多,网络参数增多,使得训练时间迅猛增长,总之,适当的增加网络层数会保证运行时间基本不变的情况下提高识别率,但层数过多会导致参数过剩,过拟合现象的发生反而降低识别率。mcc和f1score两个指标随着识别率的变化呈一致的变化趋势,在隐含层数为6层时,两个指标值最高,说明该网络结构的识别效率和拟合效果最好。实验三:基于不同优化方法的分类识别本实施例通过对dcnn模型结构和模型参数的研究,选择较优dcnn模型结构进行不同优化方法的探讨,首先是对两种不同池化方法的对比分析,然后对relu和sigmoid两种激活函数进行分析比较,最后通过优化训练方法,对比基于批量梯度下降法和基于弹性动量的梯度下降法的优化方法对于dcnn识别结果的影响。1.均值采样与最大池采样深度卷积神经网络模型主要是由卷积层和下采样两种特殊的隐层组成,而下采样层可以在很大程度上降低特征维度,减少网络计算量,防止过拟合现象发生,并能提供一定程度的平移和旋转不变性。目前常用的下采样方法有均值采样(mean-pooling)和最大池采样(max-pooling)(见y-lanboureau,jeanponce,yannlecun.atheoreticalanalysisoffeaturepoolinginvisualrecognition[j].internationalconferenceonmachinelearning,2010,32(4):111-118.),均值采样即对邻域内特征点求平均,而最大池采样即对邻域内特征点取最大值。本实验通过两组实验探讨不同采样方法对最后识别结果的影响,学习率选择0.0005,batchsize为200,采用已构建好的两个dcnn进行实验分析,结果见表6、7。表6不同采样方法的实验结果表7不同采样方法的实验结果结果表明,在相同dcnn模型结构下,最大池化采样的识别率高于下采样池化方法,但是两种方法对于训练时间影响不大,特征图数目为6-16-120,迭代次数为12次时,采用max池化方法的识别率达到79.94%,而平均池化方法的识别率为76.65%,两种方法都是随着迭代次数的增加,识别率先升高在下降。当减少特征图数量为6-16-24时,收敛速度缓慢,直到迭代次数为150次时,最大池化方法的dcnn识别率达到86.83%,平均池化识别率为83.43%,迭代150次的训练时间为两个多小时,总之,dcnn对于肺部肿瘤ct全局特征的识别过程中,采取最大池化的方法优于平均池化方法。根据模式识别理论,特征提取的误差主要来自两个方面,第一是邻域大小受限造成的估计值方差增大,第二是卷积层参数误差造成估计均值的偏移(见刘万军,梁雪剑,曲海成.不同池化模型的卷积神经网络学习性能研究[j].中国图象图形学报,2016,21(9):1178-1190.)。一般来说,均值采样能减少第一种误差,更多的保留图像的背景信息,而最大值采样能减少第二种误差,更多的保留纹理信息。从平均意义上来说,与均值采样近似,从局部意义上说,则服从最大池化的准则,所以对于肺部ct图像的识别,应该关注的是病灶区域即更多的保留局部roi区域的纹理信息,从而更好的为识别做铺垫,所以,最大值采样较优于均值采样。2.sigmoid函数和relu函数(见vinodnair,geoffreye.hinton.clementfarabet.rectifiedlinearunitsimproverestrictedboltzmannmachines//proceedingsofthe27thinternationalconferenceonmachinelearning,haifa,israel,2010:807-814.)激活函数是用来加入非线性因素,因为线性模型的表达能力不够,通过激活函数将数值映射到指定范围内,激活函数有很多种:sigmoid函数和relu函数,sigmoid函数是一种最常用的激活函数,公式如下:relu激活函数的计算量可以大大降低,而且有助于特征效果,公式如下:r(z)=max(0,x)针对不同的激活函数,选择两种不同dcnn模型,在最大池化采样的基础上探讨两种常见的激活函数对于肺部肿瘤全局特征识别的影响。结果见表8。表8不同激活函数的实验结果由表可知,在保证dcnn模型结构不变的情况下,使用sigmoid函数在迭代150次时达到73.82%的识别率,而使用relu函数在迭代3次后已达到72.07%识别率,相比于饱和激活函数,relu具有更快的收敛速度,并能得到更低的训练误差。虽然使用relu激活函数的识别率较之sigmoid函数识别率没有明显提升,但是其很快收敛,训练时间明显减少,所以可以使用relu函数加快收敛速度,减少训练时间,提升识别性能。3.批量梯度下降法和带弹性动量的梯度下降法针对批量梯度下降法(见dsilver,ahuang,cjmaddison,etal.masteringthegameofgowithdeepneuralnetworksandtreesearch[j].nature,2016,529(7587):484-489.),由于其是选择不同批量的大小进行每一次迭代和参数调整,所以本实验首先探讨批次大小对分类结果的影响,然后选择合适批次大小的批量梯度下降法与基于弹性动量下降法比较,实验结果见表9。表9批次大小对实验结果的影响批次大小运行时间(s)识别率(%)错误率(%)灵敏度(%)特异度(%)mccf1score201816.2290.509.5098.8082.200.820.90501708.2191.708.3099.4084.000.840.921001619.9489.9010.1097.2082.600.810.902001533.3786.3013.7099.6073.000.750.863001526.6685.6014.4099.4071.800.740.855001508.1068.4031.60100.0036.80.470.65从表可以看出,批次大小与识别结果紧密相关,批次越小,运行时间越长,但是识别率会不断增加,但是当批次太小,识别率也会基本维持在一定水准,因为批次太小,训练不够充分,对参数的调整不够,使得识别率下降。所以需要结合训练集的大小,选择合适的批次大小,保证每次参数调整基于足够的训练和反向传播。表10批量梯度下降法和弹性动量法的识别结果从表可以看出,加入弹性动量的梯度下降法比批量梯度下降法识别率更高,达到96.4%的识别率,灵敏度和特异度都高达95%以上,mcc和f1score接近1,说明基于弹性动量的梯度下降法的dcnn对于肺部ct识别更优。采用有动量的梯度下降法训练网络,减小了神经网络学习过程的振荡趋势,使得网络能够较快的达到收敛,并且动量法可降低网络对于误差曲面局部细节的敏感性,有效抑制网络陷入局部极小。综上,利用深度卷积神经网络的特征表示能力,在不进行图像处理和提取特征提取的情况下直接将dcnn用于肺部肿瘤ct全局特征分类识别,从模型参数、网络结构和训练算法三个方面进行对比分析,结果验证了dcnn用于肺部肿瘤ct全局特征的可行性,实验表明结合输入图像分辨率大小,需选择合适的卷积核大小、特征图数量和网络层数才能保证良好的识别性能,过大过小都会使得特征学习不充分或参数过拟合,而对于肺部肿瘤图像识别,最大池采样结果优于均值采样,relu激活函数的选择可以加快收敛速度,减少运行时间,基于弹性动量的梯度下降法不仅提高了识别率,也使得dcnn对于肺部肿瘤ct全局特征的识别率达到94.6%,验证了深度卷积神经网络良好的特征学习能力和良好的泛化能力及鲁棒性。总之,在深度卷积神经网络模型结构中,层数越深、特征图数目越多,则网络能够表示的特征空间就越大,网络学习能力也越强,然而计算复杂度也更大,容易出现过拟合现象,因此,在针对特定领域的实际应用过程中应适当选取网络深度、特征图数、卷积核大小及其他参数,以训练出更好的模型同时保证相对少的训练时间。本发明并不限于上文描述的实施方式。以上对具体实施方式的描述旨在描述和说明本发明的技术方案,上述的具体实施方式仅仅是示意性的,并不是限制性的。在不脱离本发明宗旨和权利要求所保护的范围情况下,本领域的普通技术人员在本发明的启示下还可做出很多形式的具体变换,这些均属于本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1