一种基于变换域特征和CNN的细胞图像识别分类方法与流程

文档序号:12064266阅读:385来源:国知局
一种基于变换域特征和CNN的细胞图像识别分类方法与流程

本发明涉及医疗健康诊断领域,尤其是一种基于变换域特征和CNN(Convolutional Neural Network,卷积神经网络)的细胞图像识别分类方法。



背景技术:

随着科技的发展,医学影像技术广泛应用于临床疾病的诊断、治疗中。在医学影像的帮助下,医师在诊断前能更准确,更及时的患病部位进行定位和辅助定性,方便进一步的疾病诊断和治疗,X光、B超、CT等均采用了医学影像技术。细胞图像处理是医学影像的一个重要分支,由于细胞图像的复杂性,制片质量不一,当前主要依赖人工阅片,由于医师长时间观察带来的视觉疲劳以及医师临床经验和病理分析水平不一,对疾病的诊断也常常收到医师的主观影响,最终诊断结果往往出现较高的误诊,要改善这些问题,除了提高制片技术,引入计算机图像识别诊断技术进行自动分析处理也一直是图像处理领域的热点和难点,并且在医疗领域里有一定的的应用,然而现有的细胞图像处理技术中由于受影像照明光照强度的影响,导致对细胞进行分类时鲁棒性不够,计算机图像识别诊断准确度不够。



技术实现要素:

本发明的目的是针对现有技术的不足,而提供一种基于变换域特征和CNN结合的图像识别分类技术,能够在训练集数量不足以训练常规CNN模型的情况下,更有效的训练CNN模型参数,对细胞图像进行分类,鲁棒性很强,更有利于计算机图像识别诊断准确度提升。

本文采用的是ICPR(International Conference On Pattern Recognition,ICPR)2012年举办的hep2细胞分类竞赛的的官方hep2数据集(http://mivia.unisa.it/hep2contest/index.shtml),图像是通过荧光显微镜放大倍数为40倍外加50W汞蒸气灯与数字摄像机获取的,分割出1455张hep图像(721张样本图像,734张测试图像),由于图像数量不足以有效训练常规CNN模型,本方法可以有效训练CNN模型,并有较高预测效果。

本发明的目的是通过下述的技术方案来实现的:一种基于变换域特征和CNN的细胞图像识别分类方法,设定CNN神经网络包括输入层,隐含层和输出层,其中输入层包含三通道72×72×3个神经元,隐藏层为三个卷积层、三个池化层和两个全连阶层,所述细胞图像识别分类方法包括如下步骤:

S10:设计CNN输入层模型,将细胞图像变换域特征与原图像数据融合

S11,选择图片进行随机对比度变换

设DA为输入图像,为输入图像的概率分布,Dmax为输入图像灰度最值,fA、fB为线性变换斜率和y轴截距,c为尺度比例常数,随机采用直方图归一化、线性变换和非线性变换方法中的一种进行对比度变换,得到对比度DB,其中对比度变换公式分别如下:

直方图归一化:

线性变换为:DB=f(DA)=fADA+fB

非线性变换:DB=f(DA)=clog(1+DA)

S12:将不同对比度的图片存入训练集中,并保持原始类别标签,然后对训练集中图像进行随机旋转,包括翻转,同样将其结果存入训练集中,并保持原始类别标签;

S13:对图像用prewitt算子和canny算子求图像特征

定义Prewitt算子

改进canny算子为:四个方向上的一阶梯度分量Gx(x,y)、Gy(x,y)、G45(x,y)和G135(x,y)可由四个一阶算子对图像进行卷积得到,由四个方向一阶梯度分量求得梯度幅值M(x,y)和梯度角度θ(x,y):

再用Ostu方法求得最大类间方差获得最佳阈值,求得canny算子运算结果;

S14:再对两种特征与原图像进行数据融合

将三通道图像原图像第二通道保留,第一通道变为canny求得的信息,第三通道变为Prewitt的边缘信息,将新图像进行随机洗牌,组合成多个需要测试集集合,并将新测试集依次输入到隐藏层;

S20:设计CNN隐藏层与输出层模型,输入图像训练CNN模型

S21:对于输入层,输入图像A,选择尺寸M×M的矩阵,卷积后得到矩阵B,则输出为conv1=relu(B+b),其中为卷积运算,W为卷积核矩阵和b为偏置,Relu对卷积加偏置结果进行矫正,避免出现负值;

S22:对图片池化操作

对conv1进行池化得到pool1,使得到的图像尺寸减少;

S23:然后将池化结果进行局部归一化得到norm1

假设为在(x,y)处应用核函数后再经过Relu得到的非线性结果,则局部归一化为

S24:对于池化后的结果,再次卷积池化得到pool2,局部归一化得到norm2;

S25:重复步骤S23和S24得到结果输入到全连阶层,通过尺度变换将其维度降低,再次使用Relu对其非线性化处理,得到local function的结果x输出,最终将local function得到的结果x输入到softmax中;

S26:对于输入结果x,用hypothesis函数针对每一个类别j估算出概率值p(y=j|x),通过hypothesis函数输出一个k维的向量来表示这k个估计的概率值,

其中k维hypothesis函数为

代价函数为

在softmax算法中将x分类为j的概率为

通过最陡下降法最小化代价函数,对CNN模型中各节点权值和偏置进行反向调整,使分类结果为j的概率最大,输入训练集,最陡下降法流程如下:S261:选取初始点x0,给定终止误差ε>0,令k=0;

S262:计算取

S263:若停止迭代.输出xk,否则进行步骤S264;

S264:采用一维寻优法或微分法求最优步长tk,使得

S265令xk+1=xk+tkpk,k=k+1,进行步骤S266;

S266:若k值达到最大迭代次数,停止迭代,输出xk,否则转入步骤S262。

通过上述方法最小化代价函数后,CNN各个节点的权值和偏置都被优化,最终使softmax输出类别与训练集标记的类别误差尽可能小。通过再次输入与训练集不同的测试集,通过CNN模型后,CNN模型最终输出的类别信息与医学专家事先标记好的对应类别进行对比,发现该模型对新图像数据具有较好的类别判断能力。

进一步地,在步骤S264中,采用一维寻优法确定最优步长tk,则已成为步长t的一元函数,用式求出tk

进一步地,在步骤S264中,采用微分法确定最优步长tk,则令进而以解出近似最优步长tk的值。

通过上述方法最小化代价函数后,CNN各个节点的权值和偏置都被优化,从而具有预测图片类别的能力,从而使得计算机能更准确的识别细胞图像并进行分类,提升自动识别能力。本发明的基于变换域特征与CNN的细胞图像识别分类方法可以有效的识别hep-2细胞,并且对采集到的图片质量敏感性较低。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:

图1为本发明方法中的prewitt算子

图2为本发明方法中改进的canny算子

图3为本发明方法中六种类别细胞图像的prewitt对照图

图4为本发明方法中六种类别细胞图像的canny对照图

图5本发明方法中增加特征的输入层示意图

图6为本发明方法中CNN结构示意图

图7为本发明方法中最陡下降法流程图

图8为本发明方法中训练过程误差分布情况图

图9为本发明方法中预测集的分类准确率柱状图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。

本实施例采用的是ICPR(International Conference On Pattern Recognition,ICPR)2012年举办的hep2细胞分类竞赛的的官方hep2数据集(http://mivia.unisa.it/hep2contest/index.shtml),图像是通过荧光显微镜放大倍数为40倍外加50W汞蒸气灯与数字摄像机获取的,分割出1455张hep图像(721张样本图像,734张测试图像),由于图像数量不足以有效训练常规CNN模型,本实施例的方法有效训练CNN模型,并形成更高预测效果。

一种基于变换域特征和CNN的细胞图像识别分类方法,如图5所示设定CNN神经网络包括输入层,隐含层和输出层,输入层输入图像数据,其中输入层包含三通道72×72×3个神经元,隐藏层为三个卷积层、三个池化层和两个全连阶层,隐藏层对数据进行卷积核池化运算,最后由输出层输出分类结果,如图6所示,设计了一个十层CNN模型,通过对数据集进行预处理,细胞图像识别分类方法包括如下步骤:步骤S10:设计CNN输入层模型,将细胞图像变换域特征与原图像数据融合;S20:设计CNN隐藏层与输出层模型,输入图像训练CNN模型。

步骤S10具体包括以下子步骤:

S11,选择图片进行随机对比度变换

设DA为输入图像,为输入图像的概率分布,Dmax为输入图像灰度最值,fA、fB为线性变换斜率和y轴截距,c为尺度比例常数,随机采用直方图归一化、线性变换和非线性变换方法中的一种进行对比度变换,得到对比度DB,其中对比度变换公式分别如下:

直方图归一化:

线性变换为:DB=f(DA)=fADA+fB

非线性变换:DB=f(DA)=clog(1+DA)

S12:将不同对比度的图片存入训练集中,并保持原始类别标签,然后对训练集中图像进行随机旋转,包括翻转,同样将其结果存入训练集中,并保持原始类别标签;即对数据集中图片进行明暗对比度、旋转变换,再与原图像组成新数据集1;

S13:对图像用prewitt算子和canny算子求图像特征

定义Prewitt算子如图1,

改进canny算子为:四个方向上的一阶梯度分量Gx(x,y)、Gy(x,y)、G45(x,y)和G135(x,y)可由图2所示的四个一阶算子对图像进行卷积得到,由四个方向一阶梯度分量求得梯度幅值M(x,y)和梯度角度θ(x,y):

再用Ostu方法求得最大类间方差获得最佳阈值,求得canny算子运算结果,图3、图4为六种类型的细胞变换域特征和原始图像的对比图,上图为原始图,下图为变换域特征图;

S14:再对两种特征与原图像进行数据融合

将原图(三通道图像)像第二通道保留,第一通道变为canny求得的信息,第三通道变为Prewitt的边缘信息,将新图像进行随机洗牌,组合成若干需要测试集集合,并将新测试集依次输入到隐藏层,即可再对数据集1加入canny和prewitt的信息组成新数据集2作为输入集合,同样将其结果存入训练集中,并保持原始类别标;

步骤S20中,具体包括以下子步骤:

S21:对于输入层,输入图像A,选择尺寸5×5的矩阵,卷积后得到矩阵B,以尺寸为3×3简要说明如下

则输出为conv1=relu(B+b),其中为卷积运算,W为卷积核矩阵和b为偏置,Relu对卷积加偏置结果进行矫正,避免出现负值;

S22:对图片池化操作

池化操作是为了在提高图片张数的同时,减少图片的大小,故对conv1进行池化得到pool1,使得到的图像尺寸减少,本实施例使用2为步长进行池化,池化后图像张数不变,但是尺寸减少为原图像25%;

S23:然后将池化结果进行局部归一化得到norm1

假设为在(x,y)处应用核函数后再经过Relu得到的非线性结果,则局部归一化为

k=2,n=5,α=10-4,β=0.75,n为同一空间位置相邻的核映射的数量,N为本层核函数的总数;

S24:对于池化后的结果,再次卷积池化得到pool2,局部归一化得到norm2;

S25:重复步骤S23和S24得到的结果输入到全连阶层,通过尺度变换将其维度降低,再次使用Relu对其非线性化处理,得到local function的结果x输出,最终将local function得到的结果x输入到softmax中,通过softmax对图像进行分类得到预测分类集合为pre_labels;

S26:对于输入结果x,用hypothesis函数针对每一个类别j估算出概率值p(y=j|x),通过hypothesis函数输出一个k维的向量(向量元素的和为1)来表示这k个估计的概率值,对分类得到的pre_lables与已知训练集labels求代价函数,

其中k维hypothesis函数为

代价函数为

在softmax算法中将x分类为j的概率为

通过最陡下降法最小化代价函数,对CNN模型中各节点权值和偏置进行反向调整,使分类结果为j的概率最大,输入训练集,最陡下降法流程如图7所示,包括步骤如下:

S261:选取初始点x0,给定终止误差ε>0,令k=0;

S262:计算取

S263:若停止迭代.输出xk,否则进行步骤S264;

S264:采用一维寻优法或微分法求最优步长tk,使得

若采用任一种一维寻优法求最优步长tk,此时的已成为步长t的一元函数,故可用任何一种一维寻优法求出tk,即

若采用微分法求最优步长tk,因为所以在一些简单情况下,可令以解出近似最优步长tk的值;

S265令xk+1=xk+tkpk,k=k+1,进行步骤S266;

S266:若k值达到最大迭代次数,停止迭代,输出xk,否则转入步骤S262。

通过训练集使用最陡下降法最小化代价函数的方式确定卷积神经网络节点的权重W和偏置b,从而得到CNN模型。

通过上述方法最小化代价函数后,CNN各个节点的权值和偏置都被优化,从而具有预测图片类别的能力,从而使得计算机能更准确的识别细胞图像并进行分类,提升自动识别能力。

本发明设计的基于变换域特征与CNN的细胞图像分类方法可以有效的识别hep-2细胞,并且对采集到的图片质量敏感性较低。

为了验证本实施例技术方案的效果,利用搭建CNN模型进行实验,下面结合预测性能对比实验进一步说明本实施例的效果。

设计了原始数据训练集测试集,在没有经过随机对比度变换,随机旋转以及随机洗牌的情况下进行CNN模型训练和预测,与本发明提出的具有随机变换,随机旋转,随机洗牌的CNN模型下使用具有变换域特征的训练集测试集进行对比实验。在实验中,可以看出,如图8所示,“+”表示改进的CNN模型训练过程中错误率的变换过程,‘*’表示未改进的CNN模型训练过程中错误率的变换过程,从图中看出未改进模型虽然有训练CNN模型的参数,但是错误率分布较为分散,在第750次训练后错误率突然上升,意味着训练并没有很有效的训练CNN模型。进一步用已经训练好的模型对预测集进行预测,改进模型预测结果为67.62%,而未改进的模型训练结果仅为29.46%,和其他方法模型的对比如图9所示。

综上所述,本实施例在使用小训练集去训练大CNN模型上有明显的优势,hep2识别率比改进前提高了38.16%。

以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的创造性精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1