肿瘤癌变细胞fish基因状态自动检测方法

文档序号:6427049阅读:672来源:国知局
专利名称:肿瘤癌变细胞fish基因状态自动检测方法
技术领域
本发明涉及医学图像分析技术领域,特别是一种肿瘤癌变细胞FISH基因状态自动检测方法。
背景技术
近几年研究显示,肿瘤细胞由非典型性发育异常向癌转变的过程中几乎都伴有人类染色体hTERC基因(定位于3号染色体)扩增。另外,HER-2原癌基因(定位于17号染色体)的扩增状态与肿瘤转移预后预知都有密切关系,同时在分子靶向治疗和术后新辅助治疗方面也有很大应用前景。因此对基因扩增的准确检测和正确判读在临床上也越来越受重视。基因扩增可通过多种方法检测,经FDA批准用于检测的方法有两种测定蛋白的免疫组织化学(IHC)法和检测基因的荧光原位杂交(FISH)法。IHC操作简单,判读方便,价格低廉,但因标本的固定、包埋、不同抗体敏感性的差异、评估体系不同造成其检测结果的差异;而FISH方法具有高度的重复性和可靠性,与临床疗效相关性好,FISH检测方法利用特异性分子探针与癌细胞中基因结合,以染色体着丝粒信号作为参照,在荧光显微镜下观察基因是否有扩增。FISH技术检测基因扩增状态结果客观准确,目前被公认为是检测基因扩增的金标准。采用FISH双色荧光探针杂交,在荧光显微镜下细胞核(细胞以核的形式呈现,以下统称细胞)显蓝色,位于细胞内的染色体基因显红色信号点,染色体着丝粒显绿色信号点,当红色与绿色信号重叠时呈现为黄色。目前肿瘤FISH基因状态评估方法是由病理科医师在荧光显微镜下,目测选取几十个形态完整、杂交信号强的细胞并人工统计各类信号点(信号颗粒/信号簇)的数量,计算红绿信号点数比值,最后依据信号点类别细胞的统计数量及分布情况进行基因状态(高扩增/低扩增/无扩增)的结果评估。检测过程较繁琐费时,并存在人为主观因素所造成的误差和不一致性,从而影响了对癌的整体预知转移预后的评估,容易误导癌的发现和治疗。肿瘤FISH图像的组织分布有细胞、各类信号点、背景等目标。FISH存在自身的限制细胞存在粘连现象,且粘连分布结构复杂多样;信号不能达到100%杂交,有些细胞杂交信号弱;存在荧光强度不均及颜色重叠渗透现象,灰度具有含糊性,各组织之间边界不明确。FISH的自身限制使得基因状态的自动辨识的过程存在以下难点1)细胞粘连结构的复杂多样性,难以归纳出先验知识,因此基于知识规则的方法不适合于分离检出细胞, 只能依赖机器学习方法;2)细胞形态不规则、类别特征模糊及细胞内信号点的随机分布、信号强弱等因素使得常规以特征为依据的识别方法在选择合格细胞上有其局限性;3)由于杂交的不稳定和采集图像环境光线的影响,以及红绿色比重不一的融合引起黄色具有不确定的偏向性,使得同一副图像中同类信号存在颜色偏差,区域越大色差越严重。

发明内容
本发明的目的在于提供一种肿瘤癌变细胞FISH基因状态自动检测方法,该方法不仅有利于提高检测的准确性,减少主观因素造成的误差,而且检测效率高,使用效果好。为实现上述目的,本发明的技术方案是一种肿瘤癌变细胞FISH基因状态自动检测方法,其特征在于该方法在进行级联结构训练和协同模式训练的基础上,对基因状态进行辨识;
所述级联结构训练按如下步骤进行
首先,选择基因状态评估结果分别为高扩增、低扩增、无扩增的各种肿瘤FISH片,采集各类典型的基因信号的图像作为训练图集,并将所述基因状态评估结果作为训练的类别信息;从所述训练图集中分别裁剪一批正例样本和反例样本构成正例样本集和反例样本集, 所述正例样本包括合格细胞子窗口和不合格细胞子窗口两个类别,所述反例样本为非细胞子窗口,对所述正例样本集和反例样本集分别进行颜色转换;然后,迭代训练基于Haar型特征的AdaBoost级联结构,得到能表征细胞特性的Haar型特征组及AdaBoost级联结构细胞检测器;
所述协同模式训练过程按如下步骤进行
将正例样本集作为训练样本集,进行原型选择算法、序参量构造法及注意参数设置机制的训练学习,依据敏感度、特异性、准确率的评估准则进行效果分析,不断优化调整相关算法权重参数,得到协同模式细胞分类器; 所述基因状态辨识过程按如下步骤进行
步骤1 对待处理的肿瘤多视野FISH图集中的图像进行颜色转换,然后送入所述级联结构细胞检测器进行子窗口筛选检测;
步骤2 若检测到的为细胞子窗口,送入所述协同模式细胞分类器进行识别,并转步骤 3 ;否则继续检测下一个子窗口 ;
步骤3 对识别为合格的细胞子窗口进行彩色图像分割处理,检测并统计出细胞内红色与绿色信号点数量,依据红色与绿色信号点数量的比值将细胞分类,同时获取相关形态属性特征参数;否则返回继续检测下一个子窗口,直至处理完一副图像的所有子窗口 ;
步骤4:重复步骤1、2、3,直至肿瘤多视野FISH图集中的所有图像处理完毕之后,根据该病例检测统计结果进行基因状态扩增结果评估,并将各种形态属性特征参数入库保存。本发明的有益效果是采用AdaBoost级联结构模型检测细胞以解决细胞检出问题,然后采用基于原型的协同模型选择合格细胞,最后在单细胞小区域内识别信号点类别, 从而基本排除了大区域色差的干扰。本发明实现了肿瘤癌变细胞FISH基因状态的一次性自动检测,自动实现病理图象分割、组织目标识别提取、定量检测、统计分析、参数自动入库等步骤,并可以进行自动批处理,大大方便医务工作者的使用。本发明可减少病理科医师因主观因素造成的误差,可提高免疫病理的准确性和工作效率,为肿瘤病人的药物选择提供更准确依据。


图1是本发明实施例的工作流程图。
具体实施例方式本发明的肿瘤癌变细胞FISH基因状态自动检测方法,在进行级联结构训练和协同模式训练的基础上,对基因状态进行辨识。该方法的工作流程如图1所示。上述级联结构训练按如下步骤进行
首先,选择基因状态评估结果分别为高扩增、低扩增、无扩增的各种肿瘤FISH片,采集各类典型的基因信号(包括小颗粒信号、大颗粒信号、簇信号)的图像作为训练图集,并将所述基因状态评估结果(高扩增、低扩增、无扩增)作为训练的类别信息;从所述训练图集中分别裁剪一批正例样本和反例样本构成正例样本集和反例样本集,所述正例样本包括合格细胞子窗口和不合格细胞子窗口两个类别,所述反例样本为非细胞子窗口,对所述正例样本集和反例样本集分别进行颜色转换;然后,迭代训练基于Haar型特征的AdaBoost级联结构,得到能表征细胞特性的Haar型特征组及AdaBoost级联结构细胞检测器。上述协同模式训练过程按如下步骤进行
将正例样本集作为训练样本集,进行原型选择算法、序参量构造法及注意参数设置机制的训练学习。其中,原型选择算法对形态多样的同类样本集进行模糊动态聚类,将聚类中心集作为该类的原型,序参量构造法以流形学习的测地线距离作为距离评价函数,直接依据测试样本与各原型模式之间流形距离关系构造序参量,注意参数设置机制中,注意参数是基于测试样本和原型模式之间的关系来设置的,让协同网络“关注”那些与测试样本较相近的原型模式。然后,依据敏感度、特异性、准确率的评估准则进行效果分析,不断优化调整相关算法权重参数,得到协同模式细胞分类器。上述基因状态辨识过程按如下步骤进行
步骤1 对待处理的肿瘤多视野FISH图集中的图像进行YCbCr颜色转换,然后送入所述级联结构细胞检测器进行子窗口筛选检测;
步骤2 若检测到的为细胞子窗口,送入所述协同模式细胞分类器进行识别,并转步骤 3 ;否则继续检测下一个子窗口 ;
步骤3 对识别为合格的细胞子窗口进行彩色图像分割处理,检测并统计出细胞内红色与绿色信号点数量,依据红色与绿色信号点数量的比值将细胞分类(正常/异常细胞),同时获取相关形态属性特征参数(细胞面积、周长、等园直径、圆形度;信号数量、面密度、 分布散度、粘连度);否则返回继续检测下一个子窗口,直至处理完一副图像的所有子窗口 ; 步骤4:重复步骤1、2、3,直至肿瘤多视野FISH图集中的所有图像处理完毕之后,根据该病例检测统计的异常细胞数量与计数细胞数量的比值r进行基因状态扩增结果评估 (r>kl 高扩增;r>k2 低扩增;K=k2 无扩增,kl,k2为扩增阈值参数),并将各种形态属性特征参数入库保存。下面对本发明涉及的部分内容作进一步说明。1.基于Haar型特征的AdaBoost级联结构细胞检测器
集成学习AdaBoost算法是一种迭代方法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。级联结构是一系列强分类器的组合,每一层都是由AdaBoost算法训练得到的一个强分类器。级联分类器的最终目标就是要达到尽可能高的检测率和尽可能低的误检率。本发明利用Haar型特征检测窗口的选择;实现偏向误检率的训练样本权重调整策略及加强高检测率的弱分类器权重分配机制,在达到降低误检率的同时保证检出率;在级联结构设计上,前段部分侧重筛查背景区域并保证细胞区域进入下一级,后段部分在侧重筛查粘连反例样本的同时保证粘连正样本的识别能力,以确保级联结构具有快速的强检测能力。2.协同模式细胞分类器主要涉及原型集的选择、序参量构造和注意参数的设置
等三方面。1)原型模式的选择由于聚类法能对给定的样本进行自动聚合,而且时间复杂性也较遗传算法低,且原型模式中融合多样本信息。因此,本发明采用基于聚类思想的原型选择方法,根据细胞形态特点,实现原型集模式选择。2)序参量构造经典的序参量构造算法是基于伪逆的方法,所需的运算量很大。为了避免求逆矩阵,直接依据测试样本与各原型模式之间模糊相似度关系构造序参量,解决学习与检测速度问题。3)注意参数的设置一般协同模型中注意参数设置采用的是静态设置方式,即仅根据原型模式来设置注意参数,而细胞图像测试样本与原型样本有一定差距,本发明采用动态注意参数设置方法。3. FISH图像分割FISH图像具有模糊性和不均勻的特点,同一种组织的灰度存在差异,某些目标边缘模糊等,针对FISH图像细胞内各目标组织之间低对比度并且边界模糊的特点,根据特征点将图像转换到模糊连通空间,禾_图像的边缘、颜色等信息获得模糊边界,求出色差自适应阈值来分割图像。FISH技术已逐渐被广大医学工作者所接受,未来发展空间巨大,但在手工检测基因信号过程中医生普遍感觉工作量大,专业知识要求较高,容易发生人为误差,迫切需要自动化程度高的检测方法及系统。本发明实现了对细胞进行定量分析和研究,并利用自动识别效率高、提取参数全、 一致性强等特点,进行大宗的分析和探讨,找出一个较好识别模式和评估参数,实现了一种肿瘤癌变细胞FISH基因状态自动检测方法。本发明利用Haar型特征选择方法和偏向误检率的训练样本权重调整策略,改进了高检测率的弱分类器权重分配机制,达到在降低误检率的同时保证检出率,所设计检测率与误检率平衡的快速级联结构,可确保级联结构具有快速的强检测能力。本发明还采用基于聚类思想的原型选择方法、直接求测地线距离关系相似度的序参量重构方法和注意参数动态设置方法,以提高学习扩展能力、学习速度、分类正确率及量化指标参数准确度等。降低癌症的发病率及死亡率,筛查癌前病变和监测预后是关键。本发明的肿瘤癌变细胞FISH基因状态自动检测方法可辅助病理医生提高诊断效率,可提高医院的经济效益,具有巨大的长远社会效益。以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。
权利要求
1. 一种肿瘤癌变细胞FISH基因状态自动检测方法,其特征在于该方法在进行级联结构训练和协同模式训练的基础上,对基因状态进行辨识; 所述级联结构训练按如下步骤进行首先,选择基因状态评估结果分别为高扩增、低扩增、无扩增的各种肿瘤FISH片,采集各类典型的基因信号的图像作为训练图集,并将所述基因状态评估结果作为训练的类别信息;从所述训练图集中分别裁剪一批正例样本和反例样本构成正例样本集和反例样本集, 所述正例样本包括合格细胞子窗口和不合格细胞子窗口两个类别,所述反例样本为非细胞子窗口,对所述正例样本集和反例样本集分别进行颜色转换;然后,迭代训练基于Haar型特征的AdaBoost级联结构,得到能表征细胞特性的Haar型特征组及AdaBoost级联结构细胞检测器;所述协同模式训练过程按如下步骤进行将正例样本集作为训练样本集,进行原型选择算法、序参量构造法及注意参数设置机制的训练学习,依据敏感度、特异性、准确率的评估准则进行效果分析,不断优化调整相关算法权重参数,得到协同模式细胞分类器; 所述基因状态辨识过程按如下步骤进行步骤1 对待处理的肿瘤多视野FISH图集中的图像进行颜色转换,然后送入所述级联结构细胞检测器进行子窗口筛选检测;步骤2 若检测到的为细胞子窗口,送入所述协同模式细胞分类器进行识别,并转步骤 3 ;否则继续检测下一个子窗口 ;步骤3 对识别为合格的细胞子窗口进行彩色图像分割处理,检测并统计出细胞内红色与绿色信号点数量,依据红色与绿色信号点数量的比值将细胞分类,同时获取相关形态属性特征参数;否则返回继续检测下一个子窗口,直至处理完一副图像的所有子窗口 ;步骤4:重复步骤1、2、3,直至肿瘤多视野FISH图集中的所有图像处理完毕之后,根据该病例检测统计结果进行基因状态扩增结果评估,并将各种形态属性特征参数入库保存。
全文摘要
本发明涉及一种肿瘤癌变细胞FISH基因状态自动检测方法,其特征在于该方法在进行级联结构训练和协同模式训练的基础上,对基因状态进行辨识;该方法首先采用Haar型特征的AdaBoost级联结构细胞检测器检测细胞以解决细胞检出问题,然后采用基于原型的协同模式细胞分类器选择合格细胞,最后在单细胞小区域内识别信号点类别,进行基因状态扩增结果评估。该方法不仅有利于提高检测的准确性,减少主观因素造成的误差,而且检测效率高,使用效果好。
文档编号G06K9/66GK102270307SQ20111017307
公开日2011年12月7日 申请日期2011年6月24日 优先权日2011年6月24日
发明者刘秉瀚, 王伟智 申请人:福州大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1