一种基于卷积神经网络的宫颈细胞图像识别方法与流程

文档序号:12471739阅读:1330来源:国知局
一种基于卷积神经网络的宫颈细胞图像识别方法与流程

本发明涉及细胞图像处理技术领域,具体是一种基于卷积神经网络的宫颈细胞图像识别方法。



背景技术:

在我国,目前传统的宫颈细胞图像识别方法主要还是巴氏人工阅片技术,巴氏人工阅片技术要靠人在镜下观察大量细胞图像,工作强度大,而且极易使人感到疲劳,识别的准确率和识别效率低下。



技术实现要素:

本发明的目的是针对现有技术的不足,而提供一种基于卷积神经网络的宫颈细胞图像识别方法。

这种方法自动化程度高、自适应能力强,不但能提高宫颈细胞图像识别的效率,而且也能提高宫颈细胞图像识别的准确率。

实现本发明目的的技术方案是:

一种基于卷积神经网络的宫颈细胞图像识别方法,包括如下步骤:

1)准备训练样本:

(1-1)读入现有图库中的宫颈细胞图像作为训练样本并分类:将读入的所有的宫颈细胞图像分为正常宫颈细胞训练样本和病变宫颈细胞训练样本;

(1-2)灰度化:将宫颈细胞图像预处理为灰度图像块,并将宫颈细胞图像中的彩色图片转化为灰度图像,然后把得到的灰度图像尺寸归一化为32*32的灰度图像块;

2)构建卷积神经网络层:构建一个具有自适应识别分类功能的包括加入BN算法的改进卷积神经网络,改进卷积神经网络为一个多层的神经网络,通过可训练的卷积核作为滤波器,对图像进行逐层滤波,并将每一层滤波结果进行自动组合,最终自动提取出对分类最有利的特征,提取完特征之后,从所有特征参数中根据分类类别不同,进行参数分类,之后对不同类别之间的特征参数进行组和合训练和识别,并根据识别结果的不同,调整训练特征向量,当根据本次特征参数组合获得的识别结果小于之前的识别结果时,则根据现有的特征向量,添加或删除相应的特征参数,以期再次识别时获得更高的识别率;

提取宫颈细胞的特征包括形态、色度、光密度、纹理特征等,其中形态特征包括细胞(核)面积、周长、高度、宽度、圆形度、矩形度、伸长度等,色度特征包括细胞核(质)在RGB颜色分量上的均值、方差和色度变化系数等,光密度特征包括细胞核(质)的积分光密度、平均光密度、光密度系数等,纹理特征使用Haralick两特征和Tamura的两种特征,共四种纹理特征;

改进卷积神经网络可以将图像数据直接作为网络输入变量,经网络处理之后产生作为结果的分类号,实现端到端的处理,减少或避免图像预处理和人工特征抽取等复杂过程;

(3)构建二分类器:将步骤1)得到的正常宫颈细胞训练样本和病变宫颈细胞训练样本输入改进卷积神经网络,改进卷积神经网络被训练为能够识别正常宫颈细胞和病变宫颈细胞的二分类器;

(4)得到识别结果:将待测试的宫颈细胞图片输入改进卷积神经网络,改进卷积神经网络自动进行识别、归类。

所述加入BN算法的改进卷积神经网络为在经典的卷积神经网络结构中加入了批归一化算法,即在每一个卷积层与下采样层之后都连接一个BN层,在下采样S2之后连接3个全连接层,全连接层后同样各自接入相应BN层,最后一层全连接层使用sigmoid激活函数,直接输出图像。

所述批归一化算法,即BN算法为:

BN层和卷积层,下采样层和全连接层一样,也是网络中的一层结构,是一个归一化的过程,进行标准化维度:

式(1)把上一层的输出转变为标准正态分布,训练过程中采用mini-batch随机梯度下降,E[x(k)]指每一批训练数据神经元x(k)的期望值,为x(k)激活值的标准差,同时为防止影响每一层学习到的特征,引入变换重构,加入可学习参数γ和β:

式(2)把转变为正态分布的特征在一定程度上还原回去,让它保持它的初始分布趋势,还原程度则是由卷积神经网络自己学习得来,设置可以恢复原始激活值,即恢复出原始某层学到的特征,γ和β的引入可以让卷积神经网络学习恢复出原始网络要学习的特征分布,Batch Normalization前向传导公式为:

式(3)是一批mini-batch中所有样本里的每个样本在同一神经元上的输入均值,式(4)为一批mini-batch中所有样本里的每个样本在同一神经元上的输入方差,式(5)是把这批mini-batch中所有样本里的每个样本在同一神经元上的输入进行标准化后得到的结果,式(6)为同构变换。

这种方法自动化程度高、自适应能力强,不但能提高宫颈细胞图像识别的效率,而且也能提高宫颈细胞图像识别的准确率。

附图说明

图1是C3层特征图组合;

图2为实施例改进卷积神经网络结构示意图;

图3为实施例的方法流程示意图。

具体实施方式

下面结合附图和实施例对本发明内容做进一步的阐述,但不是对本发明的限定。

实施例:

参照图3,一种基于卷积神经网络的宫颈细胞图像识别方法,包括如下步骤:

1)准备训练样本:

(1-1)读入现有图库中的宫颈细胞图像作为训练样本并分类:将读入的所有的宫颈细胞图像分为正常宫颈细胞训练样本和病变宫颈细胞训练样本;

(1-2)灰度化:将宫颈细胞图像预处理为灰度图像块,并将宫颈细胞图像中的彩色图片转化为灰度图像,然后把得到的灰度图像尺寸归一化为32*32的灰度图像块;

2)构建卷积神经网络层:构建一个具有自适应识别分类功能的包括加入BN算法的改进卷积神经网络,改进卷积神经网络为一个多层的神经网络,通过可训练的卷积核作为滤波器,对图像进行逐层滤波,并将每一层滤波结果进行自动组合,最终自动提取出对分类最有利的特征,提取完特征之后,从所有特征参数中根据分类类别不同,进行参数分类,之后对不同类别之间的特征参数进行组和合训练和识别,并根据识别结果的不同,调整训练特征向量,当根据本次特征参数组合获得的识别结果小于之前的识别结果时,则根据现有的特征向量,添加或删除相应的特征参数,以期再次识别时获得更高的识别率;

如图2所示,本实施例中采用的改进卷积神经网络是一个多层的神经网络,改进加入BN层,在每一个卷积层与下采样层之后都连接一个BN层,在下采样S2之后连接3个全连接层,全连接层后同样各接入相应BN层。卷积神经网络是专为二维图像而设计的拓扑结构,最重要的特点是特征提取与模式分类同时进行,优于浅层机器学习算法的模式分类要额外提取图像特征。此外,卷积神经网络的权值共享减少了网络的训练参数,再加上其多次特征提取,使其具有很强的鲁棒性;

如图2所示的11层卷积神经网络,包括两个卷积层,即特征提取层,两个下采样层,即特征映射层,四个BN层和三个全连层,前两次卷积层即C层后都紧跟着一个BN层,然后接一层用来求局部加权平均的下采样层即S层作为二次特征提取,这种特有的两次特征提取相结合的结构使网络在模式分类时对输入图片具有一定的容忍噪声的能力,即表现为网络的鲁棒性;

卷积神经网络的输入层是32*32的灰度图,卷积层C1有6张特征图,下采样层S2有6张特征图,卷积层C3由S2层的6张特征图经卷积后组合得到16张特征图,组合方式如图1所示,下采样层S4有16张特征图,全连接层C5设置84个节点,全连接层F6设置120个节点,输出层设置两个节点;

C1层经过5*5的卷积模板卷积后,6个特征图的大小均为28*28,特征图中每个神经元与输入中5*5的卷积模板相连,每个滤波器5*5共25个元参数和一个偏置参数,共6个滤波器,一共(5*5+1)*6=156个可训练参数,总共156*(28*28)=122304个连接;S2层经下采样后得到6个14*14的特征图,特征图中的每个单元与C1中对应特征图的2*2领域连接,S2层每个单元的4个输入相加,乘以一个可训练参数,再加一个可训练偏置,下采样的作用为模糊图像,使用2*2次采样模板时不重叠,因为S2中每个特征图的大小是14*14,一共(2*2+1)*(14*14)=5880个连接;C3层有5*5*60+16=1516个可训练参数;

提取宫颈细胞的特征包括形态、色度、光密度、纹理特征等,其中形态特征包括细胞(核)面积、周长、高度、宽度、圆形度、矩形度、伸长度等,色度特征包括细胞核(质)在RGB颜色分量上的均值、方差和色度变化系数等,光密度特征包括细胞核(质)的积分光密度、平均光密度、光密度系数等,纹理特征使用Haralick两特征和Tamura的两种特征,共四种纹理特征;

改进卷积神经网络可以将图像数据直接作为网络输入变量,经网络处理之后产生作为结果的分类号,实现端到端的处理,减少或避免图像预处理和人工特征抽取等复杂过程;

(3)构建二分类器:将步骤1)得到的正常宫颈细胞训练样本和病变宫颈细胞训练样本输入改进卷积神经网络,改进卷积神经网络被训练为能够识别正常宫颈细胞和病变宫颈细胞的二分类器,具体为:用一些不同的小随机数初始化网络中待训练参数,向如图2的改进卷积神经网络输入N1个训练样本来训练改进卷积神经网络,每个样本包括输入向量,理想输出向量,输入向量经过层层变换,传送到输出层,得到实际输出向量;

使用交叉熵损失函数,结合反向传播BP算法调整改进卷积神经网络参数,利用均方误差的反向传播,完成训练;

(4)得到识别结果:将待测试的宫颈细胞图片输入改进卷积神经网络,改进卷积神经网络自动进行识别、归类。

所述加入BN算法的改进卷积神经网络为在经典的卷积神经网络结构中加入了批归一化算法,即在每一个卷积层与下采样层之后都连接一个BN层,在下采样S2之后连接3个全连接层,全连接层后同样各自接入相应BN层,最后一层全连接层使用sigmoid激活函数,直接输出图像。

所述批归一化算法,即BN算法为:

BN层和卷积层,下采样层和全连接层一样,也是网络中的一层结构,是一个归一化的过程,进行标准化维度:

式(1)把上一层的输出转变为标准正态分布,训练过程中采用mini-batch随机梯度下降,E[x(k)]指每一批训练数据神经元x(k)的期望值为x(k)激活值的标准差,同时为防止影响每一层学习到的特征,引入变换重构,加入可学习参数γ和β:

式(2)把转变为正态分布的特征在一定程度上还原回去,让它保持它的初始分布趋势,还原程度则是由卷积神经网络自己学习得来,设置可以恢复原始激活值,即恢复出原始某层学到的特征,γ和β的引入可以让卷积神经网络学习恢复出原始网络要学习的特征分布,Batch Normalization前向传导公式为:

式(3)是一批mini-batch中所有样本里的每个样本在同一神经元上的输入均值,式(4)为一批mini-batch中所有样本里的每个样本在同一神经元上的输入方差,式(5)是把这批mini-batch中所有样本里的每个样本在同一神经元上的输入进行标准化后得到的结果,式(6)为同构变换。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1