一种基于人工智能的细胞荧光图像分类方法和系统与流程

文档序号:11143375阅读:575来源:国知局
一种基于人工智能的细胞荧光图像分类方法和系统与制造工艺

本发明涉及细胞学技术领域,更具体地,涉及一种基于人工智能的细胞荧光图像分类方法和系统。



背景技术:

免疫荧光技术是在免疫学、生物化学和显微镜技术的基础上建立起来的一项技术。通过抗体分子与一些荧光示踪物质结合,可利用抗原抗体反应进行组织或细胞内抗原物质的定位。由于组织或细胞内抗原物质的表达和分布情况与遗传背景、疾病、细胞分化等存在一定的关联,利用一种或多种免疫荧光对组织或细胞进行共同表征,可以在蛋白水平明确细胞中目标蛋白质的表达状况,从而为药物研究、疾病诊断、细胞亚群分类提供实验依据。

由于实验中可能存在非特异性染色等问题,荧光染色结果判定的客观性不足,如果在实验中同时使用多种荧光染色,对结果判定的难度有较大提高。目前业界通行的解决方法是采集各个荧光通道的细胞图像,对图像加伪彩并做多通道融合后,由人工或软件方法对细胞荧光图像进行分类。

人工识别细胞荧光图像进行分类,对操作人员的知识水平和实践经验有较高要求,并且人眼容易疲劳,人工方法的效率明显较低。而业界目前的软件分析方法主要通过设定各通道图像直观特征的分析阈值,通过多个阈值的组合来对细胞荧光图像进行分类。主要的特征包括:各荧光通道的细胞面积、各荧光通道图像的平均像素值或强度积分值、细胞的圆度、细胞核比例等。但由于组织或全血等复杂样品中细胞亚型较多、杂质组成复杂、染色效果不稳定等诸多干扰因素,基于阈值的图像分类方法往往效果不佳,仍然需要有经验的操作人员付出大量劳动,不断修正软件分类参数,并对结果做人工复核。

为了更进一步提高细胞荧光图像分类的效率,我们提出了一种基于人工智能模型的细胞荧光图像分类算法。其基本思想来源于神经科学的启发:人脑从视网膜(Retina)出发,经过低级的V1区提取边缘特征,到V2区的基本形状或目标的局部,再到高层V4的整个目标(如判定为一张人脸),以及到更高层的PFC(前额叶皮层)进行分类判断等。也就是说高层的特征是低层特征的组合,从低层到高层的特征表达越来越抽象和概念化。我们设定了一种人工智能模型,能够提取原始的细胞荧光图像特征,经过多层级的运算,实现对初级特征的抽象、泛化、重建,获得图像高级特征的评分,并对图像进行分类。



技术实现要素:

本发明提供一种克服上述问题或者至少部分地解决上述问题的基于人工智能的细胞荧光图像分类方法和系统,能够基于人工智能模型提取图像特征,提高识别的精度与自动化程度,有效避免基于图像像素阈值识别所带来的误差,显著提高了细胞荧光图像的分类效率,降低了时间与人工资源的消耗。

根据本发明的一个方面,提供一种细胞荧光图像分类方法,包括以下步骤:

S1、将阳性细胞荧光图像、阴性细胞荧光图像作为样本输入到人工智能模型中进行训练,得到细胞荧光图像分类模型;

S2、将待测细胞荧光图像样本输入到已经训练完成的细胞荧光图像分类模型中进行荧光图像分类。

作为优选的,在步骤S1中,还包括将非细胞杂质荧光图像作为样本输入到人工智能模型中进行训练。

作为优选的,在步骤S1中,所述人工智能模型包括卷积计算、池化计算和全连接计算,所述每个卷积计算后都有相应的激活函数;

所述卷积计算用于对细胞荧光图像进行特征提取;

所述激活函数用于通过函数将细胞荧光图像的特征保留并映射出来;

所述池化计算用于对卷积计算提取的特征进行聚合统计;

所述全连接计算的每一个结点都与上一层的所有输出向量相连,用来把已提取到的特征综合起来。

作为优选的,所述人工智能模型包括3步卷积计算、3步池化计算和2步全连接计算,其连接顺序依次为第一卷积计算、第一池化计算、第二卷积计算、第二池化计算、第三卷积计算、第三池化计算、第一全连接计算、第二全连接计算。

作为优选的,所述步骤S1具体包括:

S11、将每个阳性细胞的R、G、B三个通道图像作为正样本,非阳性细胞(含阴性细胞、与细胞相似的杂质)的R、G、B三个通道图像作为负样本;

S12、对正样本和负样本分别进行标记;

S13、将多个正样本和负样本输入到人工智能模型中进行训练,得到判断结果错误率;

S14、修改人工智能模型的优化参数和学习率,回到步骤S13;

S15、重复步骤S13至S14,直至loss收敛,错误率基本稳定。

作为优选的,所述步骤S12具体包括:每一个样本定义一个初始二值化识别标签,1代表正样本,0代表负样本。

作为优选的,所述步骤S13具体包括:将多个正样本和负样本组合成一批数据输入到人工智能模型中进行训练,依次经过卷积计算、激活函数、池化计算和全连接计算,得到样本二值化分类的预测矢量,通过预测结果和输入样本标记计算得到判断结果错误率。

作为优选的,所述步骤S13中,所述预测矢量的判断方法包括:将正负样本经过卷积计算,经池化计算、全连接计算,并通过Softmax Regression计算得到二分类概率预测,每一个图像样本得到细胞荧光图像两个概率预测值,将较大的概率预测值判为识别结果。

一种细胞荧光图像分类系统,包括用于对阳性细胞荧光图像、阴性细胞荧光图像和非细胞杂质荧光图像进行分类的人工智能模型,所述人工智能模型包括:

卷积计算模块,用于对细胞荧光图像进行特征提取;

所述每层卷积计算模块计算后都使用激活函数评分,用于通过函数将细胞荧光图像的特征保留并映射出来;

池化计算模块,用于对卷积计算模块提取的特征进行聚合统计;

全连接计算模块,所述全连接计算模块的每一个结点都与上一步输出的所有向量相连,用来把已提取到的特征综合起来。

作为优选的,包括3个卷积计算模块、3个池化计算模块和2个全连接计算模块,其连接顺序依次为第一卷积计算模块、第一池化计算模块、第二卷积计算模块、第二池化计算模块、第三卷积计算模块、第三池化计算模块、第一全连接计算模块、第二全连接计算模块。

与现有技术相比,本发明的有益效果在于:本发明通过建立人工智能模型,对细胞荧光图像进行训练学习,经过模型对样本的带标签学习,使得模型能够精准对细胞荧光图像进行分类,区分正样本和负样本,有效避免基于阈值分类所带来的误差,显著提高了细胞荧光图像的分类准确度和分类效率,降低了时间与人工资源的消耗。

附图说明

图1为本发明实施例的细胞荧光图像分类方法流程框图;

图2为本发明实施例中单一通道阳性细胞样本荧光图像示意图;

图3为本发明实施例中单一通道非阳性细胞样本荧光图像示意图;

图4为本发明中人工智能模型运算结构框图。

具体实施方式

下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。

图1至图3示出了一种细胞荧光图像分类方法,包括以下步骤:

S1、将阳性细胞荧光图像、阴性细胞荧光图像和非细胞杂质荧光图像作为样本输入到人工智能模型中进行训练,得到细胞荧光图像分类模型;

S2、将待测细胞荧光图像样本输入到细胞荧光图像分类模型中对细胞荧光图像进行分类。

作为优选的,在步骤S1中,所述人工智能模型包括卷积计算、池化计算和全连接计算,所述每个卷积计算后都有相应的激活函数;

所述卷积计算用于对细胞荧光图像进行特征提取;

所述激活函数用于通过函数将细胞荧光图像的特征保留并映射出来;

所述池化计算用于对卷积计算提取的特征进行聚合统计;

所述全连接计算所述全连接计算的每一个结点都与上一层的所有结点相连,用来把已提取到的特征综合起来。

所述人工智能模型包括3步卷积计算、3步池化计算和2步全连接计算,其连接顺序依次为第一卷积计算、第一池化计算、第二卷积计算、第二池化计算、第三卷积计算、第三池化计算、第一全连接计算、第二全连接计算。

作为优选的,所述步骤S1具体包括:

S11、将阳性细胞的R、G、B三个通道图像作为正样本,阴性细胞和与细胞相似的杂质的R、G、B三个通道图像作为负样本;1)将截取的细胞样本通过人工验证,分成正样本和负样本两类;2)每一类都将图像重定义大小为64*64(可变更),按0,1,2,3...重命名,读取到图像队列当中作为输入。在本实施例中,如图2所示,图中每一行的三个图像分别对应一个正样本的R通道,G通道,B通道,图3中,每一行的三个图像分别对应一个负样本的R通道,G通道,B通道。

S12、对正样本和负样本分别进行标记;每个样本都有一个初始二值化识别标签,1代表正样本,0代表负样本。

S13、将多个正样本和负样本输入到人工智能模型中进行训练,得到判断结果错误率;

S14、修改人工智能模型的优化参数和学习率,回到步骤S13;

S15、重复步骤S13至S14,直至错误率收敛,即错误率稳定在一个较小数值不变。此时网络便训练结束,可用于实际测试。

所述步骤S12具体包括:每一个样本定义一个初始二值化识别标签,1代表正样本,0代表负样本。

作为优选的,所述步骤S13具体包括:将多个正样本和负样本组合成一批数据输入到人工智能模型中进行训练,依次经过卷积计算、激活函数、池化计算和全连接计算,得到样本分类的预测矢量,通过预测结果和输入样本标记计算得到判断结果错误率。

作为优选的,所述步骤S13中,所述预测矢量的判断方法包括:将正负样本图像输入,经过卷积计算(每个卷积计算后都有相应的激活函数)、池化计算、全连接计算计算,再使应用Softmax Regression计算得到二分类概率预测。每一个图像样本得到两个概率预测值(分别为细胞荧光图像),将概率较大的那个判为识别结果。识别结果为一个二值化标签向量,1代表正样本,0代表负样本,如[1,1,1,0,0,1,0,...]。

在本实施例中,每一个样本均含R、G、B三张单通道的图像,读取时每三张图像依次读入对应通道作为一个样本,如当前正样本数为2161(每个样本包含3张单通道图片,即为6483张),为提高模型训练效果,防止负样本过多造成样本偏倚,进行正样本的数据增广,增广后正样本数为38898。负样本有160万左右。得到大量图像簇样本数据后就能够用于训练。将多个正负样本及它们的标签(正样本为1,负样本为0)组合成一批数据(称为一个batch)输入到网络中进行训练,依次经过卷积计算,激活函数,池化计算,全连接计算等构成的网络结构,最后经过预测矢量及判断器得到预测结果相比于输入标签的错误率。

在本实施例中,所述步骤S2的测试步骤包括:

1)将截取的细胞样本通过人工挑选,分成正样本和负样本两类。每一类都将图像重定义大小为64*64(可变更),按0,1,2,3...重命名,读取到图像队列当中作为输入。

2)将正负样本图像输入本发明中,此时人工智能模型已经训练好,各项参数固定。经过计算得到一个二分类概率预测。每一个图像样本得到两个概率预测值(分别为细胞荧光图像),将概率较大的那个判为识别结果。

3)识别结果为一个二值化标签向量,1代表正样本,0代表负样本,如[1,1,1,0,0,1,0,...]。

图4示出了一种细胞荧光图像分类系统,包括用于对细胞荧光图像进行分类的人工智能模型,所述人工智能模型包括:

卷积计算模块,用于对细胞荧光图像进行特征提取;

所述每层卷积计算后都连接有激活函数,用于通过函数将细胞荧光图像的特征保留并映射出来;

池化计算模块,用于对卷积计算模块提取的特征进行聚合统计;

全连接计算模块,所述全连接计算模块的每一个结点都与上一层的所有输出矢量相连,用来把已提取到的特征综合起来。

在本实施例中,所述人工智能模型包括3个卷积计算模块,3个池化计算模块和2个全连接计算模块,其连接顺序依次为第一卷积计算模块、第一池化计算模块、第二卷积计算模块、第二池化计算模块、第三卷积计算模块、第三池化计算模块、第一全连接计算模块、第二全连接计算模块。

卷积计算模块参数:w0:卷积核大小为5*5,输入维数为3,输出维数为24。b0:维数24。w1:卷积核大小为3*3,输入维数为24,输出维数为48。b1:维数48。w2:卷积核大小为3*3,输入维数为48,输出维数为64。b2:维数64。卷积核4维滑动步长均为[1,1,1,1]。

池化计算模块参数:pool0:4维池化窗口为[1,3,3,1],4维池化步长为[1,2,2,1]。pool1:4维池化窗口为[1,3,3,1],4维池化步长为[1,2,2,1]。pool3:4维池化窗口为[1,3,3,1],4维池化步长为[1,2,2,1]。

全连接计算模块参数:fc1_weights:size为[4096,64]。fc1_biases:size为[64]。fc2_weights:size为[64,2]。fc2_biases:size为[2]。

与现有技术相比,本发明的有益效果在于:本发明通过建立人工智能模型,对细胞荧光图像进行训练学习,经过网络对样本的带标签学习,使得网络能够精准的对细胞荧光图像进行分类,辨别正样本和负样本,有效避免基于阈值分类所带来的误差,显著提高了细胞荧光图像的分类效率和进度,降低了时间与人工资源的消耗。

最后,本申请的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1