本发明涉及图像识别领域,尤其涉及一种急性白血病的细胞图像识别算法。
背景技术
急性白血病是造血干细胞的恶性克隆性疾病,发病时骨髓中异常的原始细胞及幼稚细胞大量增殖,蓄积于骨髓并抑制正常造血,广泛浸润肝、脾、淋巴结等髓外脏器。表现为贫血、出血、感染和浸润等征象。急性白血病若不经特殊治疗,平均生存期仅3个月左右,短者甚至在诊断数天后即死亡。经过现代治疗,已有不少患者获得病情缓解以至长期存活,甚至获得治愈。骨髓象骨髓细胞形态学检查是诊断急性白血病的基础,结合细胞组织化学染色可进一步对急性白血病进行分类分型。
在癌症发病率逐年上升的情况下,现在医院诊断癌症主要还是由医生人工去辨别医学显微图像,这就要求检测人员或医师具有丰富的临床经验,但这样的诊断方式存在着工作效率低,强度大,易疲劳和产生人为误差等诸多缺点。利用量子神经网络对显微细胞图像进行分类,以此来辅助医生进行分析和识别病变显微细胞图像,并且得到病理等方面的重要信息,这对于帮助医务人员进行肿瘤的诊断和治疗具有非常重要的临床意义。
但是,作为一类医学图像,首先,肿瘤细胞之间具有较大的复杂性和差异性并且组织器官的形状不是规则的;其次,肿瘤细胞图像数据具有高阶统计的特性,使其服从非高斯分布,这样就导致肿瘤细胞图像存在大量的冗余信息。最后,肿瘤细胞之间存在严重的黏连性,在图像识别过程产生干扰。因此,一些常用的线性分类算法在对肿瘤细胞图像进行分类识别时效果不理想。将人工神经网络与量子计算理论结合起来的量子神经网络能够很好地模拟人脑对信息处理的过程,同时量子神经网络具有很强的模式概括和泛化能力。
技术实现要素:
有鉴于此,本发明提出了一种分类速度快、识别率高的急性白血病的细胞图像识别算法。
本发明的技术方案是这样实现的:本发明提供了一种急性白血病的细胞图像识别算法,其包括以下步骤,
s1,提供n幅m×n维大小的急性白血病的肿瘤细胞图像,针对每幅图像灰度化;
s2,每幅图像按照行顺序抽取得到一维行向量,选定其中s张为训练样本,剩余的作为测试样本,对训练样本和测试样本进行归一化,然后采用pca降维得到降维后的训练样本和测试样本;
s3,将训练样本和测试样本转换为量子态描述,同时初始化输入层神经元个数、竞争层神经元个数、最大循环步数max、学习速率η0、领域半径γ0、循环计数s、聚类阀值θ和网络初始权值;
s4,计算各竞争层节点的网络坐标;
s5,计算学习速率η和领域半径γ;
s6,按行有序地从训练样本矩阵中取出一个特征向量,计算竞争获胜神经元j*,调整以j*为中心半径r的领域内的神经元权值;
s7,若s<max,则s=s+1返回步骤s5继续执行;否则循环计数s重新赋值为0,转向步骤s8;
s8,按序对每一个类样本集合mj,求取该类中心样本;
s9,计算学习速率,然后按序取出一个类样本集合,根据该类中心样本对应的获胜神经调整网络权值;
s10,若s<max,则s=s+1返回步骤s9;否则保存网络权值和类样本集合m对应获胜神经元集合d;
s11,按序从测试样本矩阵取出一个特征向量,计算获胜神经元;
s12,判断获胜神经元是否属于获胜神经元集合d中某一类,若属于归入相应的分类;否则,归入未知分类。
在以上技术方案的基础上,优选的,所述步骤s1中通过建立点的亮度y与r、g、b三个颜色分量的对应关系:y=0.3r+0.59g+0.11b,来代表图像灰度值。
在以上技术方案的基础上,优选的,步骤s2中归一化采用以下线性函数进行转换,
y=(x-minvalue)/(maxvalue-minvalue),
minvalue,maxvalue为样本中最小值和最大值。
在以上技术方案的基础上,优选的,步骤s2中采用pca降维的步骤包括以下过程,
s2.1,定义一个样本集合x,包含n个样本,每个样本的维度都为d,即:
x={x1,x2,…,xn}xi=(xi1,xi2,…,xid)∈rd,i=1,2,…,n
将样本构成一个二维矩阵,矩阵的每一行为一个样本,矩阵的每一列为一个维度,
得到样本矩s,s∈rn×d,利用样本矩阵的每一列与其对应的均值相减来中心化s均值计算如下:
s2.2,按下述公式计算求取样本矩阵的协方差矩阵
s2.3,通过协方差矩阵的特征值分解,得到前k最大特征值对应的特征向量并构成投影矩阵p;
s2.4,投影原始样本矩阵,得到经过降维后的样本矩阵。
本发明的急性白血病的细胞图像识别算法相对于现有技术具有以下有益效果:
(1)基于自组织特征映射神经网络,能够很好的保持网络拓扑结构和概率拓扑结构的分布,网络收敛性稳定;
(2)对图像进行灰度化处理,既可以减少图像的维数也可以去除图像多余的冗余信息;
(3)对图像灰度归一化操作,加快神经网络训练时的收敛性;
(4)使用pca方法进行降维,提高分类速度和准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的急性白血病的细胞图像识别算法的流程图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,本发明的急性白血病的细胞图像识别算法,其包括以下步骤,
s1,提供n幅m×n维大小的急性白血病的肿瘤细胞图像,针对每幅图像灰度化。
基于以下考虑,需要对图像进行灰度化:
1、由于彩色图片信息量大,有的时候我们仅仅用灰度图像里的信息就已经够了,为了提高运算速度自然就会采用灰度图;
2、图像识别时最关键的因素是梯度,梯度意味着边缘,这是最本质的部分,而计算梯度,自然就用到灰度图像;
3、颜色本身,非常容易受到光照等因素的影响,同类的物体颜色有很多变化。所以颜色本身难以提供关键信息。
具体的,通过建立点的亮度y与r、g、b三个颜色分量的对应关系:y=0.3r+0.59g+0.11b,来代表图像灰度值。
s2,每幅图像按照行顺序抽取得到一维行向量,选定其中s张为训练样本,剩余的作为测试样本,对训练样本和测试样本进行归一化,然后采用pca降维得到降维后的训练样本和测试样本。
具体的,步骤s2中归一化采用以下线性函数进行转换,
y=(x-minvalue)/(maxvalue-minvalue),
minvalue,maxvalue为样本中最小值和最大值。
由于肿瘤细胞图像作为一种自然图像具有复杂性、高维数、差异性和存在大量冗余信息,所以如果直接作为分类器的输入,会导致分类时间长和不准确性。需要寻找一种有效的降维方法来降低肿瘤细胞图像维数并分离无效信息。因此,本发明提出了使用pca方法进行降维,具体的,包括以下过程,
s2.1,定义一个样本集合x,包含n个样本,每个样本的维度都为d,即:
x={x1,x2,…xn}xi=(xi1,xi2,…,xid)∈rd,i=1,2,…,n
将样本构成一个二维矩阵,矩阵的每一行为一个样本,矩阵的每一列为一个维度,
得到样本矩s,s∈rn×d,利用样本矩阵的每一列与其对应的均值相减来中心化s均值计算如下:
s2.2,按下述公式计算求取样本矩阵的协方差矩阵
s2.3,通过协方差矩阵的特征值分解,得到前k最大特征值对应的特征向量并构成投影矩阵p
s2.4,投影原始样本矩阵,得到经过降维后的样本矩阵。
s3,将训练样本和测试样本转换为量子态描述,同时初始化输入层神经元个数、竞争层神经元个数、最大循环步数max、学习速率η0、领域半径γ0、循环计数s、聚类阀值θ和网络初始权值;
s4,计算各竞争层节点的网络坐标;
s5,计算学习速率η和领域半径γ;
s6,按行有序地从训练样本矩阵中取出一个特征向量,计算竞争获胜神经元j*,调整以j*为中心半径r的领域内的神经元权值;
s7,若s<max,则s=s+1返回步骤s5继续执行;否则循环计数s重新赋值为0,转向步骤s8;
s8,按序对每一个类样本集合mj,求取该类中心样本;
s9,计算学习速率,然后按序取出一个类样本集合,根据该类中心样本对应的获胜神经调整网络权值;
s10,若s<max,则s=s+1返回步骤s9;否则保存网络权值和类样本集合m对应获胜神经元集合d;
s11,按序从测试样本矩阵取出一个特征向量,计算获胜神经元;
s12,判断获胜神经元是否属于获胜神经元集合d中某一类,若属于归入相应的分类;否则,归入未知分类。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。