基于机器学习的免疫组化图像自动化判读系统的制作方法

文档序号:9598042阅读:830来源:国知局
基于机器学习的免疫组化图像自动化判读系统的制作方法
【技术领域】
[0001]本发明涉及计算机技术领域,特别是涉及一种基于机器学习的免疫组化图像自动化判读系统。
【背景技术】
[0002]免疫组织化学(Immunohistochemistry, IHC)是病理学诊断领域中的一种重要检测方法学,其通过对染色图片结果中阳性区域的细胞数目及染色强度的解读而进行半定量的判定。在传统病理学诊断中,医生主要根据其掌握的病理学诊断知识和临床经验来对IHC图片进行人工解读。该方法对医生的诊断经验要求较高,且诊断结果易受图像本身特性的干扰,因此,人们考虑引入计算机技术和图像处理技术对免疫组化图片进行定量分析。
[0003]目前,大部分的免疫组化定量分析研究均集中于图像分析领域,其一般过程为:首先选定测量区域,再进行图像分割提取出阳性区域,最后应用光密度等参数进行定量测定。其代表软件如Definiens公司生产的Definiens Tissue Stud1图像处理系统和MediaCybernetics公司生产的Image Pro Plus图像分析软件。但这类软件价格较为昂贵,且不同操作者之间存在一定的数据波动性,并不适宜在临床上进行推广。
[0004]机器学习(Machine Learning, ML)是人工智能研究的核心技术,广泛应用于计算机和金融等领域,其通过对已知信息的提取和建模学习而获得一系列模式,并以此对新数据进行预测。目前,随着计算机技术的普及,已经有学者将机器学习方法引入到医学图像领域中来,特别是在计算机辅助的诊断学领域。其中应用最为成功的当属计算机辅助的乳房造影摄片诊断技术。
[0005]典型的计算机辅助诊断流程包括以下关键步骤:1)应用自动化的图像处理技术对医学图像进行数字化处理;2)提取定量化的图像特征组成特征向量;3)应用特征向量建立模型,并调用分类器对其进行分类判别。其中,抽取图像的有效特征是完成识别,进行后续判读的首要任务。
[0006]图像特征提取是计算机视觉分析领域中的重要概念,S卩,使用计算机提取图像信息。常用的图像特征可分为整体性特征,如颜色特征和纹理特征等,以及局部特征,如角点特征等,其经典提取方法包括颜色直方图法、Gabor小波法和SIFT (Scale-1nvariantfeature transform)算法。
[0007]本发明应用经典的图像特征提取方法,并结合多种机器学习算法,首次提出一种免疫组化图像的全自动化判读方法,能有效识别出图像中的阳性区域并进行阳性程度预测。其全部采用跨平台的开源程序包进行软件设计,方便快速,可移植性好,更适宜于在病理学诊断领域进行推广。

【发明内容】

[0008]鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于机器学习的免疫组化图像自动化判读系统,以实现一种免疫组化图像的全自动化判读系统,能有效识别出图像中的阳性区域并进行阳性程度预测。
[0009]为实现上述目的及其他相关目的,本发明提供一种基于机器学习的免疫组化图像自动化判读系统,包括:
[0010]图像数字化处理模块,用于对原始图片进行格式转换及超像素分割,将其分解成不重复的碎片集合;
[0011]图像特征提取模块,用于对碎片集合中的每个碎片进行颜色直方图计算、Gabor小波及局部二分值计算、及SIFT特征点检测计算,并将计算所得的各个特征组合为特征向量;
[0012]阳性区域抽提模块,用于比较每个碎片与人工选定的阳性参考图片集中每个图片的特征向量间的距离,选取相似度高于预设标准的碎片作为阳性碎片,并在原始图片中进行突出展示;
[0013]特征选择及机器学习模块,用于对阳性碎片进行特征效能评估,得到分类效果最佳的特征组合作为特征向量,以此建立判别模型并进行阳性程度得分预测。
[0014]作为本发明的基于机器学习的免疫组化图像自动化判读系统的一种优选方案,所述图像数字化处理模块包括:
[0015]格式转换单元,用于将原始图片转换成灰度图;
[0016]超像素分割单元,用于在灰度图上进行超像素分割,将灰度图片分解为大小不一且相互之间不重叠的多个图形区域;
[0017]碎片获取单元,用于按照图形区域分割信息,获取来源于原始图片的碎片集合。
[0018]作为本发明的基于机器学习的免疫组化图像自动化判读系统的一种优选方案,所述图像特征提取模块包括:
[0019]颜色特征计算单元,用于获取每个碎片的HSV颜色直方图信息作为颜色特征;
[0020]纹理特征计算单元,用于获取每个碎片的Gabor小波图像并进行局部二分值计算作为纹理特征;
[0021]角点特征计算单元,用于获取每个碎片的特征点集合,并依照最多特征点碎片的特征值数目用0.0补足,使之特征值总数相等作为角点特征;
[0022]特征向量组合单元,用于将所有特征组合为一维特征向量。
[0023]作为本发明的基于机器学习的免疫组化图像自动化判读系统的一种优选方案,所述阳性区域抽提模块包括:
[0024]主成分分析单元,用于进行主成分分析,选取残差解释率达99%的转化特征集构成新的特征向量,并依据该模型将训练集和阳性区域参考图片集中的所有碎片的特征向量转化为新的特征向量;
[0025]相似度计算单元,用于计算训练集中每个碎片与人工选定的阳性区域参考图片集中所有图片新的特征向量间的平均距离,作为相似度的表征,随后对训练集中同一张原始图片来源的所有碎片的相似度进行数据分布分析,以相似度数值不小于平均值与方差之和作为过滤标准,获得潜在阳性碎片集;
[0026]潜在阳性碎片显示单元,用于将各个潜在阳性碎片在原始图片中进行突出显示。
[0027]进一步地,所述训练集为高清扫描得到的免疫组化图片,所述阳性区域参考图片集为从训练集所有图片中截取的具有代表性的阳性区域碎片。
[0028]作为本发明的基于机器学习的免疫组化图像自动化判读系统的一种优选方案,所述特征选择及机器学习模块包括:
[0029]特征选择单元,用于对阳性参考图片集中图片的原有特征向量和其阳性程度读分进行相关性评估,并结合机器学习算法选出分类效果最好的特征组合;
[0030]机器学习建模与预测单元,用于按照特征选择单元得到的特征组合对训练集数据进行特征筛选,得到新的特征向量,采用十折交叉检验法进行机器学习及阳性程度得分预测。
[0031]进一步地,所述机器学习建模与预测单元包括采用直接应用主成分分析、线性判别分析的一种或两种以上联用的方式对特征向量进行降维处理的途径建立的机器学习模型。
[0032]如上所述,本发明提供一种基于机器学习的免疫组化图像自动化判读系统,包括:图像数字化处理模块,用于对原始图片进行格式转换及超像素分割,将其分解成不重复的碎片集合;图像特征提取模块,用于对碎片集合中的每个碎片进行颜色特征计算、纹理特征计算、及角点特征计算,并将计算所得的各个特征组合为特征向量;阳性区域抽提模块,用于比较每个碎片与人工选定的阳性参考图片集中每个图片的特征向量间的距离,选取相似度高于预设标准的碎片作为阳性碎片,并在原始图片中进行突出展示;特征选择及机器学习模块,用于对阳性碎片进行特征效能评估,得到分类效果最佳的特征组合作为特征向量,以此建立判别模型并进行阳性程度得分预测。本发明全部采用跨平台的开源程序包进行软件设计,可移植性好,能有效识别出图像中的阳性区域并进行阳性程度预测,且运算速度快,适合在临床上加以推广。
【附图说明】
[0033]图1显示为本发明的基于机器学习的免疫组化图像自动化判读系统的结构示意图。
[0034]图2显示为本发明的基于机器学习的免疫组化图像自动化判读系统的图像数字化处理模块的结构示意图。
[0035]图3显示为本发明的基于机器学习的免疫组化图像自动化判读系统的图像特征提取模块的结构示意图。
[0036]图4显示为本发明的基于机器学习的免疫组化图像自动化判读系统的阳性区域抽提模块的结构示意图。
[0037]图5显示为本发明的基于机器学习的免疫组化图像自动化判读系统的特征选择
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1