一种基于深度学习的细胞分裂检测方法与流程

文档序号:11951443阅读:319来源:国知局
一种基于深度学习的细胞分裂检测方法与流程
一种基于深度学习的细胞分裂检测方法,用于细胞分裂检测,涉及深度学习、机器视觉、细胞生物学等
技术领域

背景技术
:细胞生物学是生命科学的一个重要研究方向,其目的在于研究细胞的基本生命活动规律,研究成果对于癌症治疗,免疫调节,体外器官培养等关乎人类健康与寿命的问题具有重要意义。细胞生物学的研究一般从细胞功能结构,细胞分化增值,细胞衰老死亡等层面进行展开。细胞分裂作为一个重要研究对象,引起了很多研究者的注意。传统的细胞分裂检测大多依靠人工完成,并且对完成检测工作的人员有较高的背景知识要求,而且人工进行的细胞分裂检测工作需要耗费极大的人力,同时还容易出错,导致细胞生物实验可重复性不高,影响实验效率。此外,伴随着电子显微镜技术的发展,显微镜的成像分辨率的飞速提高,给人工细胞分裂检测工作带来了巨大挑战。20世纪末,美国及欧洲一些国家对细胞生物实验分析的自动化开始了先驱性的研究,不管是在成像硬件设备,还是在成像质量、自动化定量分析等方面,都有十分迅猛的进展。近些年的研究发现,基于深度学习的方法以其独特的优势逐渐发展成为了视觉数据分析方法的主流。目前的细胞分裂检测方法中,主要有差分法、图像特征方法等。考虑到细胞分裂是一种活动明显的现象,差分法主要是对显微镜图像序列中的两帧做差分运算以滤除图像中的其他相对静态的对象的干扰来获得正在分裂中的细胞的信息。两帧相减,得到两帧图像的亮度差,取这个差的绝对值,以这个绝对值是否大于某一阈值来分析细胞分裂现象。图像差分法极容易受到噪声以及光照变化的影响,并且对于某些亮度变化剧烈的成像技术(比如相差显微镜)所构成的图像数据处理,应用该方法非常困难。图像特征方法的基本原理是:对于细胞分裂的图像区域进行特征建模,将原图像进行细分,划分成指定大小的块,针对不同的块可以采用比如LBP,HOG,SIFT构造分裂细胞图像区域的特征向量,再将局部的特征向量根据规则进行组合或者构造直方图,从而进一步组成具有全局特征的向量,这些特征向量具有一定的抽象能力与判别能力,可用于细胞分裂现象的判别分析。但是该方法需要人工设计图像特征,并且在构造这些特征的过程中会丢失大量信息,造成最终的模型判别能力不强,从而影响检测的准确率。技术实现要素:本发明针对现有技术的不足之处提供了一种基于深度学习的细胞分裂检测方法,解决细胞分裂检测中图像特征难以设计、模型计算效率低、检测结果不准确、处理大量数据率低、对于图像的变化不具有抗平移的特性等问题。为了实现上述目的,本发明采用的技术方案为:一种基于深度学习的细胞分裂检测方法,其特征在于,包括如下步骤:(1)获取细胞培养过程中的图像,并根据一定时间间隔获取的图像构成连续的图像序列;(2)对图像序列中所有的细胞分裂过程进行判定比较,并对细胞分裂中可清晰观察到父细胞分裂为两个子细胞膜的位置进行标注,从而构成训练全卷积神经网络模型所需的标注的数据集;(3)构建全卷积神经网络模型,确定全卷积神经网络模型的参数,在全卷积神经网络模型中载入标注的数据集,使用深度学习方法直接从图像序列上进行特征学习,得到训练好的全卷积神经网络模型;(4)将训练好的全卷积神经网络模型进行部署,用于相似类型细胞培养数据的细胞分裂的自动检测。进一步,所述步骤(1)中,获取细胞培养过程中的图像包括如下步骤:(11)选取一种待培养的动物组织细胞,分为多个对比组,并且在配备了电子显微镜和特定培养液的培养基中进行培养;(12)对不同的组加入会对细胞产生刺激的培养液,用电子显微镜观察细胞在一定周期内的变化,并根据一定的时间间隔进行图像拍摄。进一步,所述步骤(2)包括如下步骤:(21)对获取到的序列图像数据进行观察分析,找出所有父细胞分裂为两个子细胞的现象;(22)观察父细胞分裂为两个子细胞的现象,在父细胞分裂出来的子细胞刚好可以清晰辨认出细胞膜的特定时间点,对细胞分裂的像素点的位置进行像素点级别的标注;(23)多位生物组织学家进行标注,并对来自不同生物组织学家的标记结果进行统一,构成最后的标注的数据集。进一步,所述步骤(3)具体包括如下步骤:(31)构建一个全卷积神经网络模型,整个全卷积神经网络模型的层可以划分为六个部分,第一部分包含两个卷积层和一个最大池化层,第二部分包含两个卷积层和一个最大池化层,第三部分包含三个卷积层和一个最大池化层,第四部分包含三个卷积层和一个池化层,然后连接一个dropout层,第五部分包含三个卷积层,第六部分包含一个上采样的反卷积层,最后连接一个Sigmoid层和交叉熵误差函数层,反卷积层的权重使用双线性插值方式进行初始化,通过连续堆叠的卷积层和下采样池化层构造出的全卷积神经网络模型,可以自动提取到对于输入图像数据不同大小感受野的、呈层次性的图像特征,并且通过反卷积层可以精确的定位出检测目标的位置;(32)取标注的数据集进行划分,一部分作为训练集,一部分作为测试集,其中测试集中包括验证集;(33)确定全卷积神经网络模型的参数,将训练集中的数据随机载入全卷积神经网络模型,使用深度学习方法直接从图像序列上进行全卷积神经网络模型训练;(34)使用多重交叉验证对于全卷积神经网络模型训练过程中的误差值进行记录,当验证集的误差不再下降的时候,停止训练,保存当前的权重值作为训练好的全卷积神经网络模型,观察训练好的全卷积神经网络模型在测试集上性能的变化,若在测试集上性能差异过大,应该调整学习速率重新训练直至找到泛化性能较好的模型参数。进一步,所述步骤(31)中,其中卷积层的卷积运算在二维情况下可由如下述公式表示:ax,y,nl=f(bnl-1+Σc=1oΣi=0pΣj=0qwi,j,c,nl-1·ax+i,y+j,cl-1)]]>上式中,表示l层的第n张特征图,O表示前一层输入的特征图的数量,(x,y)表示特征图上的指定位置,w表示卷积核,即卷积神经网络中的权重参数,c表示的是[1,O]的下标变量,p、q表示卷积核的高和宽,i表示[0,p]的下标变量、j表示[0,q]的下标变量,表示l-1层的第n个通道的的偏置值,f是局部线性的rectify函数,其函数形式可表示如下:y=xx>00otherwise.]]>进一步,所述步骤(22)中,对细胞分裂的像素点的位置,使用以该像素点位置为中心的高斯分布来进行替代表示,并且对使用一种类别平衡的基于加权的交叉熵函数作为误差函数;该误差函数形式如下:E=-1N[αΣn∈Y+ynlogPrn+(1-α)Σn∈Y-(1-yn)log(1-Prn)];]]>其中,N表示训练集中一张图像上像素点的总数量,Prn表示全卷积网络预测出的像素点n处为分裂现象中心点的概率值,yn表示像素点n处为分裂现象中心点的真实值,Y+表示经过高斯分布替代以后概率大于0的像素点的集合,即正例集合,Y-表示剩余的像素点的集合,即负例集合,二者存在如下关系:N=|Y+|+|Y-|;误差函数中α表示正例所占的比例,1-α表示负例所占的比例,即有如下关系:α=Y+N;]]>(1-α)=Y-N.]]>进一步,所述步骤(4)包括如下步骤:(41)调整训练阶段所使用的全卷积神经网络模型的结构,将最后的交叉熵误差函数层去掉,并替换为Sigmoid层,使用步骤3中得到的全卷积神经网络模型作为参数来初始化网络;(42)将初始化后的网络载入待检测的细胞序列数据进行细胞分裂检测,然后使用局部极大值抑制来获取最终的检测结果。与现有技术相比,本发明的优点在于:一、本发明可以很大程度减缓细胞分裂检测中梯度消失问题、提高了计算效率,从而实现了细胞分裂特征的学习;二、本发明对于图像的变化具有抗平移的特性,对于光照影响具有健壮性,无需手工设计图像特征,可高效处理大量数据;三、本发明可被扩展到多种类型细胞的自动分裂检测上,大大减少细胞生物实验中研究人员对于细胞分裂现象分析所需的细胞生物背景知识的依赖以及人工分析的工作量;四、本发明具有较高的运行效率和自动检测准确率,对细胞生物学的探索与研究具有重要意义。附图说明图1为本发明中细胞检测算法整体流程图;图2为本发明中全卷积神经网络结构图;图3为本发明中局部线性的rectify函数图。具体实施方式下面结合附图和实施例对本发明作进一步说明。参见图1,一种基于深度学习的细胞分裂检测方法,包括如下步骤:(1)获取细胞培养过程中的图像,并根据一定时间间隔获取的图像构成连续的图像序列;获取细胞培养过程中的图像包括如下步骤:(11)选取一种待培养的动物组织细胞,分为多个对比组,并且在配备了电子显微镜和特定培养液的培养基中进行培养;(12)根据生物实验的需要,对不同的组加入会对细胞产生特定刺激的培养液,用电子显微镜观察细胞在一定周期内的变化,并根据一定的时间间隔进行图像拍摄。(2)生物细胞学家对图像序列进行分析,将图像序列中所有的细胞分裂过程进行判定比较,并对细胞分裂中可清晰观察到父细胞分裂为两个子细胞膜的位置进行标注,从而构成训练神经网络模型所需的标注的数据集;包括如下步骤:(21)对获取到的序列图像数据进行观察分析,找出所有父细胞分裂为两个子细胞的现象;(22)观察父细胞分裂为两个子细胞的现象,在父细胞分裂出来的子细胞刚好可以清晰辨认出细胞膜的特定时间点,对细胞分裂的像素点的位置进行像素点级别的标注;对细胞分裂的像素点的位置,使用以该像素点位置为中心的高斯分布来进行替代表示,并且对使用一种类别平衡的基于加权的交叉熵函数作为误差函数;该误差函数形式如下:E=-1N[αΣn∈Y+ynlogPrn+(1-α)Σn∈Y-(1-yn)log(1-Prn)];]]>其中,N表示训练集中一张图像上像素点的总数量,Prn表示全卷积网络预测出的像素点n处为分裂现象中心点的概率值,yn表示像素点n处为分裂现象中心点的真实值,真实的分裂现象中心点通过使用高斯分布以30像素作为半径进行扩充,从而使得标记的中心点的值为1,在这个半径范围内依次衰减表示这些点越来越偏离中心点,其余的为0表示远离分裂的中心点,Y+表示经过高斯分布替代以后概率大于0的像素点的集合,即正例集合,Y-表示剩余的像素点的集合,即负例集合,二者存在如下关系:N=|Y+|+|Y-|;误差函数中α表示正例所占的比例,1-α表示负例所占的比例,即有如下关系:α=Y+N;]]>(1-α)=Y-N.]]>(23)多位生物组织学家进行标注,并对来自不同生物组织学家的标记结果进行统一,构成最后的标注的数据集。(3)构建全卷积神经网络训练模型,确定全卷积神经网络模型的参数,在全卷积神经网络模型中载入标注的数据集,使用深度学习方法直接从图像序列上进行特征学习,得到训练好的全卷积神经网络模型;具体包括如下步骤:(31)构建一个全卷积神经网络模型,整个全卷积神经网络模型的层可以划分为六个部分,第一部分包含两个卷积层和一个最大池化层,第二部分包含两个卷积层和一个最大池化层,第三部分包含三个卷积层和一个最大池化层,第四部分包含三个卷积层和一个池化层,然后连接一个dropout层,第五部分包含三个卷积层,第六部分包含一个上采样的反卷积层,最后连接一个Sigmoid层和交叉熵误差函数层,反卷积层的权重使用双线性插值方式进行初始化,通过连续堆叠的卷积层和下采样池化层构造出的全卷积神经网络模型,可以自动提取到对于输入图像数据不同大小感受野的、呈层次性的图像特征,并且通过反卷积层可以精确的定位出检测目标的位置,全卷积神经网络模型中所有的卷积核都使用3x3大小,采用的步长大小为1,使用池化层的大小为2x2,网络的最后使用反卷积层来对特征图进行上采样,从而将特征图恢复到原图大小。网络的训练使用批大小为1的随机梯度下降;其中卷积层的卷积运算在二维情况下可由如下述公式表示:ax,y,nl=f(bnl-1+Σc=1oΣi=0pΣj=0qwi,j,c,nl-1·ax+i,y+j,cl-1);]]>上式中,表示l层的第n张特征图,O表示前一层输入的特征图的数量,(x,y)表示特征图上的指定位置,w表示卷积核,即卷积神经网络中的权重参数,C表示的是[1,o]的下标变量,p、q表示卷积核的高和宽,i表示[0,p]的下标变量、j表示[0,q]的下标变量,表示l-1层的第n个通道的的偏置值,f是局部线性的rectify函数,其函数形式可表示如下:y=xx>00otherwise.]]>dropout是增加网络泛化能力的一个关键技术,抽象的神经网络的前向模型计算过程可以如下表示:zi(l+1)=wi(l+1)yl+bil+1;]]>yi(i+1)=f(zi(l+1));]]>使用dropout以后的计算过程可以表示如下:rjl~Bernoulli(p);]]>y~i(l)=r(l)*yl;]]>zi(l+1)=wi(l+1)y~l+bil+1;]]>yi(l+1)=f(zi(l+1)).]]>其中p是一个伯努利随机变量,表示是1的概率。表示第l+1层第i个隐层神经元的净输入,w为对应的权重,b是偏置值,y为净输出,r偏表示服从伯努利分布,p值取0.5。(32)取标注的数据集进行划分,80%作为训练集,20%分作为测试集,其中测试集的50%为验证集;(33)确定全卷积神经网络模型的参数,参数包括模型层数,参数数量,激活函数,参数初始化方法,学习率,冲量,批大小,权重衰减系数,误差函数参数优化方法等;学习率为1e-10,批大小为1,即每次训练只在一张图上进行,将训练集中的数据随机载入全卷积神经网络模型,使用深度学习方法直接从图像序列上进行全卷积神经网络模型训练,对训练数据的载入顺序进行随机打乱,从而使得训练出来的模型更加鲁棒;(34)使用多重交叉验证对于全卷积神经网络模型训练过程中的误差值进行记录,当验证集的误差不再下降的时候,停止训练,保存当前的权重值作为训练好的全卷积神经网络模型,观察训练好的全卷积神经网络模型在测试集上性能的变化,若在测试集上性能差异过大,应该调整学习速率重新训练直至找到泛化性能较好的模型参数。(4)将训练好的全卷积神经网络模型进行部署,用于相似类型细胞培养数据的细胞分裂的自动检测。将训练好的模型进行部署,用于相似类型细胞培养数据的细胞分裂的自动检测,包括如下步骤:(41)调整训练阶段所使用的全卷积神经网络模型的结构,将最后的交叉熵误差函数层去掉,并替换为Sigmiod层,使用步骤3中得到的全卷积神经网络模型作为参数来初始化网络;(42)将初始化后的网络载入待检测的细胞序列数据进行细胞分裂检测,然后使用局部极大值抑制来获取最终的检测结果。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1