一种病变识别模型训练方法、装置及存储设备与流程

文档序号:16236974发布日期:2018-12-11 22:42阅读:183来源:国知局
一种病变识别模型训练方法、装置及存储设备与流程

本发明涉及深度学习领域,尤其是病变识别模型训练方法、装置及存储设备。

背景技术

深度学习这一概念最早于2006年被提出,近年来微软、谷歌、百度等公司都推出了各自的深度学习系统,深度学习本质上是一种计算机模拟人脑神经网络的的算法,目前常见的有卷积神经网络(cnn)、循环神经网络(rnn)、深度神经网络(dnn)。图像识别技术是人工智能领域目前应用相对广泛且技术相对最为成熟的应用之一,图像识别技术中应用较多的是卷积神经网络(cnn)和深度神经网络(dnn)。

某些疾病比如消化道疾病,通常需要通过内镜治疗仪来获取相关影像和图片来为医生提供检查和诊断的依据。在获得医疗影像和图片之后,医生通过实际观察做出对应的诊疗结果,这对医生的经验和业务能力均有非常高的要求。如果医生的临床经验较少、业务能力不强或者对应的影像资料存在部分瑕疵,都可能导致医生诊疗结果的失误,对患者造成极大的损失和伤害。



技术实现要素:

基于现有技术的上述缺陷,本发明实施例提供一种将人工智能图像识别技术应用于病变诊断的模型训练方法、设备及存储介质。

本发明能够以多种方式实现,包括方法、系统、设备、装置或计算机可读介质,在下面论述本发明的几个实施例。

一种病变识别模型训练方法,包括:

获取初始训练集;

对所述初始训练集进行增广操作得到增强训练集;

利用所述增强训练集训练深度残差网络,通过超参数搜索,得到测试精度最高的训练模型作为病变识别模型。

进一步地,所述增广操作包括对所述初始训练集进行旋转和镜像操作。

进一步地,利用所述增强训练集训练深度残差网络,具体包括:以概率p舍弃神经元,并让其它神经元以概率1-p保留,每个神经元被关闭的概率相同。

进一步地,利用所述增强训练集训练深度残差网络,具体包括:训练过程中使用基于梯度的损失优化方法,梯度更新值产生震荡,梯度值减小,否则梯度值增加。

进一步地,,所述深度残差网络包括18层卷积层,第1至第17层卷积层舍弃神经元的概率依次为0.9、0.9、0.8、0.8、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7和0.6。

进一步地,对所述初始训练集进行旋转操作,具体包括,对初始训练集的原始图像进行n*30°的旋转,n=1、2、3、4、5、6、7、8、9、10、11。

进一步地,对初始训练集的原始图像进行左右、上下镜像操作。

进一步地,还设置有测试集,利用所述测试集验证训练模型,并利用验证结果对所述训练模型进行参数调优。

一种病变识别模型训练装置,包括处理器,适于实现各指令;以及存储设备,适于存储多条指令,所述指令适于由处理器加载并执行权利要求1至8任一项所述的提取方法。

一种存储设备,其中存储多条指令,所述指令适用于由处理器加载并执行如权利要求1至8任一项所述的提取方法的步骤。

本发明可实现的积极有益技术效果包括:通过对初始训练集进行增广操作得到增强训练集,实现同一内容图片的不同角度训练,通过超参数搜索,得到测试精度最高的训练模型作为病变识别模型,病变识别模型精确度高,识别能力强,泛化能力优越;利用所述病变识别模型协助医生进行影像、图片相关病历的分析和诊断,有利于降低医生误诊、漏诊率,尤其适用于医疗资源相对落后、医生业务能力相对较低的基层和偏远地区卫生院所。

本发明的其他方面和优点根据下面结合附图的详细的描述而变得明显,所述附图通过示例说明本发明的原理。

附图说明

本发明将通过例子并参照附图的方式说明,其中:

图1为本发明实施例提供的病变识别模型训练方法流程图。

具体实施方式

本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。

本说明书中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。

图1为本发明实施例提供的病变识别模型训练方法流程图,如图1所示,包括步骤:

获取初始训练集;

对所述初始训练集进行增广操作得到增强训练集;

利用所述增强训练集训练深度残差网络,通过超参数搜索,得到测试精度最高的训练模型作为病变识别模型。

获取初始训练集步骤中,首先搜集大量患者病历样本,将病历样本中的图片信息人工提取出来,将正常无病变的病历图片归类为一类样本,将存在病变的病历图片按照息肉、新生物、静脉曲张等具体病种细分归类为n类样本。对病变数据分类完成后,按病变类别随机将80%的病变图像及其对应的标签图像用作初始训练集,剩余的20%病变图像及其对应的标签图像用作测试集。训练集用于训练识别模型,测试集用于验证病别模型,并利用验证结果对所述识别模型进行参数调优。

对初始训练集进行增广操作得到增强训练集步骤中,所述增广操作包括对初始训练集进行旋转和镜像操作。旋转操作为对初始训练集的原始图像进行n*30°的旋转,n=1、2、3、4、5、6、7、8、9、10、11;镜像操作为对初始训练集的原始图像进行左右、上下镜像操作。增广操作可实现初始训练集原始图像的13倍扩充,原始图像经扩充后,可得到同一内容图片的不同角度图片副本,进而可实现同一内容图片的不同角度训练,训练出的结果更加精确,识别能力更强,训练得到的识别模型的泛化能力也就越强。

利用增强训练集训练深度残差网络步骤中,以概率p舍弃神经元,并让其它神经元以概率1-p保留,每个神经元被关闭的概率相同。过拟合是深度神经网络(dnn)的一个常见问题,针对过拟合的解决方案中,dropout具有简单性并取得了良好的结果,dropout的思想是训练整体dnn,并平均整个集合结果,而非训练单个dnn,dnns是以概率p舍弃部分神经元,其他神经元以概率1-p保留,舍去的神经元输出置为0,由于dropout在训练阶段阻止了神经元的共适应,因此其在实践中能够良好地工作。

训练过程利用的深度残差网络包括18层卷积层,其结构为:

层1:输入图像像素为116×116,填充值是2,卷积核为6×6,步幅为2,膨胀值为1,经过relu(rectifiedlinearunits,修正线性单元)单元激活后的输出像素为58×58×32,可调参数个数1184;

层2:输入图像像素58×58×32,填充值是1,卷积核为3×3,步幅为1,膨胀值为1,经过relu单元激活后的输出像素为58×58×32,可调参数个数9248;

层3:输入图像像素58×58×32,填充值是1,卷积核为3×3,步幅为2,膨胀值为1,经过relu单元激活后的输出像素为29×29×64,可调参数个数18496;

层4:输入图像像素29×29×64,填充值是1,卷积核为3×3,步幅为1,膨胀值为1,经过relu单元激活后的输出像素为29×29×64,可调参数个数36928;

层5:输入图像像素29×29×64,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过relu单元激活后的输出像素为29×29×128,可调参数个数73856;

层6:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过relu单元激活后的输出像素为29×29×128,可调参数个数147584;

层7:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过relu单元激活后的输出像素为29×29×128,可调参数个数147584;

层8:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过relu单元激活后的输出像素为29×29×128,可调参数个数147584;

层9:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过relu单元激活后的输出像素为29×29×128,可调参数个数147584;

层10:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过relu单元激活后的输出像素为29×29×128,可调参数个数147584;

层11:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过relu单元激活后的输出像素为29×29×128,可调参数个数147584;

层12:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过relu单元激活后的输出像素为29×29×128,可调参数个数147584;

层13:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过relu单元激活后的输出像素为29×29×128,可调参数个数147584;

层14:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过relu单元激活后的输出像素为29×29×128,可调参数个数147584;

层15:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过relu单元激活后的输出像素为29×29×128,可调参数个数147584;

层16:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过relu单元激活后的输出像素为29×29×128,可调参数个数147584;

层17:输入图像像素29×29×128,填充值是4,卷积核为3×3,步幅为1,膨胀值为4,经过relu单元激活后的输出像素为29×29×256,可调参数个数295168;

层18:输入图像像素29×29×256,填充值是14,卷积核为8×8,步幅为1,膨胀值为4,的输出像素为29×29×1,可调参数个数16385。

其中,第1至第17层卷积层舍弃神经元的概率依次为0.9、0.9、0.8、0.8、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7和0.6。

模型配置统称为模型超参数,超参数的选择是无限的,有限时间内,除验证人工预设的几种超参数组合外,还可通过启发式搜索方法对超参数组合进行调优。利用所述增强训练集训练深度残差网络过程中,使用基于梯度的损失优化方法,梯度更新值产生震荡,梯度值减小,否则梯度值增加。具体地,训练过程中用于计算损失的优化算法为rmsprop,rmsprop是一种基于梯度的损失优化方法,更新方程如下:

(wt+1)i=(wt)i-α(vt)i

其中,v表示动量,δ表示数值稳定量,w表示权重,l表示全局学习率,α表示衰减速率,i表示迭代次数,t为变量角标,无实际含义。

梯度更新值发生震荡,梯度值减小(乘以1-δ),否则梯度值增加(增加δ),训练中δ值取为0.02。深度残差网络训练使用30个epoch,第29个epoch时的测试准确率取得最大值99.2%,对应的损失值为0.7036,得到最终部署内镜影像判定仪使用的深度残差网络模型。

一种病变识别模型训练装置,包括处理器,适于实现各指令;以及存储设备,适于存储多条指令,所述指令适于由处理器加载并执行权利要求1至8任一项所述的提取方法。

一种存储设备,其中存储多条指令,所述指令适用于由处理器加载并执行如权利要求1至8任一项所述的提取方法的步骤。

本发明的不同方面、实施例、实施方式或特征能够单独使用或任意组合使用。

本发明优选由软件实现,但是也能够以硬件或硬件和软件的组合实现。本发明也能够被实施为计算机可读介质上的计算机可读代码。计算机可读介质是能够存储之后可由计算机系统读取的数据的任何数据存储设备。计算机可读介质的示例包括:只读存储器、随机存储存储器、cd-rom、dvd、磁带、光学数据存储设备和载波。计算机可读介质也可分布在网络连接的计算机系统上,从而以分布式方式存储和执行计算机可读代码。

本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何新的组合。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1