一种训练集合生成方法

文档序号:6429223阅读:610来源:国知局
专利名称:一种训练集合生成方法
技术领域
本发明涉及一种图像分类方法,特别是涉及一种训练集合生成方法。
背景技术
传统的数字图像对象分类方法,通常需要把专家总结出来的图形对象分类规则通过算法变成计算机程序才能实现比较准确的机器自动分类,在实践中通常会遇到软件专家不能理解需要分类的图形对象领域专家的分类判定标准或者他们有时难以表述自己心中的分类规则的情形,造成分类不当或分类错误概率过大,对用户造成诸多影响。

发明内容
为了解决上述技术问题,本发明提供一种通用性强,方便实用的训练集合生成方法。本发明解决其技术问题所采用的技术方案是一种训练集合生成方法,包括以下步骤
A 通过图像标注模块标注待训练的图像对象的类型,生成标注结果文件; B 由通用特征提取模块或者特定特征提取模块提取特征; C 把标注结果文件与对应图像对象的特征结合在一起生成训练集合。进一步作为优选的实施方式,所述步骤A包括以下步骤 Al 在图像标注选项进行手动标注;
A2 保存标注结果到标注结果文件中,并且从标注结果文件中把标注结果重新调入到图像文件里面。进一步作为优选的实施方式,在执行Al和A2步骤后如需要删除标注结果文件,可进行以下步骤
当原图像不需要保留标记
A3 删除标注结果文件,图像上的标记随之消失,原图像没有更改;
当原图像需要保留标记
A4 删除标注结果文件,图像上的标记不消失。进一步作为优选的实施方式,所述步骤B包括以下步骤 Bl 自动地找到图像中目标的区域和位置;
B2 从目标的区域和位置提取出上述特征参数作为特征向量。进一步作为优选的实施方式,其步骤B2所述的特征参数包括血细胞的面积、周长、圆度、色度、均值、能量、熵、对比度、直方图特征、haar特征和边缘特征的一种或多种组进一步作为优选的实施方式,所述步骤C包括以下步骤
Cl 采用中心点匹配法和/或区域匹配法,对标注图像和对应图像对象的特征进行配
对;C2 按照匹配分数最高优先配对的原则判断出配对是否成功;
C3 配对成功的人工标注信号与自动提取的特征相结合形成训练向量;
C4 把若干个训练向量放在一起形成训练矢量集合。本发明的有益效果本发明涉及的一种训练集合生成方法采用人工标注和自动特征提取相结合的方法,生成训练集合,有效克服了过去相关领域专家与软件专家因专业鸿沟引起的图像分类错误或分类不当,此方法通用性和实用性强,面向用户,分类错误概率低,具有广阔的应用前景。


下面结合附图对本发明作进一步说明 图1是本发明的训练集合生成方法流程图; 图2是本发明的步骤A详细流程图3是本发明的步骤B详细流程图; 图4本发明的步骤C详细流程图。
具体实施例方式一图像标注模块,其是一个可视化的分类信号输入模块,在图像标注选项进行手动标注,通过可视化界面在目标图像中标注类型;
一通用特征提取模块,其为训练和分类提供需要分类的对象的特征参数; 一特定对象特征提取模块,只提供其特征的数据形式和特征接口,供第三方提供指定的特征提取方法,与特征接口相连接获得特征向量。权利要求书中所述的中心点匹配法标注阶段标注对象的中心点,计算人工标注记录中的坐标与特征中坐标的两两之间的距离,距离越小匹配分数越高。权利要求书中所述的区域匹配法标注阶段标注对象区域,进行区域匹配,相似程度越高,匹配分数越高。参照图1,一种训练集合生成方法,包括以下步骤
A 通过图像标注模块标注待训练的图像对象的类型,生成标注结果文件; B 由通用特征提取模块或者特定特征提取模块提取特征; C 把标注结果文件与对应图像对象的特征结合在一起生成训练集合。参照图2,所述步骤A包括以下步骤 Al 在图像标注选项2进行手动标注;
A2 保存标注结果到标注结果文件中,并且从标注结果文件中把标注结果重新调入到图像文件里面。在执行Al和A2步骤后如需要删除标注结果文件,可进行以下步骤 当原图像不需要保留标记
A3 删除标注结果文件,图像上的标记随之消失,原图像没有更改;
当原图像需要保留标记
A4 删除标注结果文件,图像上的标记不消失。参照图3,所述步骤B包括以下步骤Bl 自动地找到图像中目标的区域和位置;
B2 从目标的区域和位置提取出上述特征参数作为特征向量。步骤B2所述的特征参数包括血细胞的面积、周长、圆度、色度、均值、能量、熵、对比度、直方图特征、haar特征和边缘特征的一种或多种组合。参照图4,所述步骤C包括以下步骤
Cl 计算人工标注记录中的坐标与特征中坐标的两两之间的距离; C2 按照距离最近的优先配对原则进行配对;
C3 配对成功的人工标注信号与自动提取的特征相结合形成训练向量; C4 把若干个训练向量放在一起形成训练矢量集合。在一种实施例中,本发明主要通过图像采集设备对需要进行分类的图片进行采集,然后通过人工标记图中白细胞或者红细胞,图像标注模块允许用户自定义所需要标注的图像类型,并且有可视化的标注界面,标注结果修改和标注结果保存,调入等功能。然后通过通用特征提取来进行医学图像细胞特征的提取方式,如果不是处理医学细胞图像,本发明还包括可扩展的特定特征提取模块,用于连接其他特征提取方式来进行特征提取,最终通过配对和特征结合,生成训练集。当然,本发明创造并不局限于上述实施方式,熟悉本领域的技术人员在不违背本发明精神的前提下还可作出等同变形或替换,这些等同的变型或替换均包含在本申请权利要求所限定的范围内。
权利要求
1.一种训练集合生成方法,其特征在于包括以下步骤A 通过图像标注模块标注待训练的图像对象的类型,生成标注结果文件; B 由通用特征提取模块或者特定特征提取模块提取特征; C 把标注结果文件与对应图像对象的特征结合在一起生成训练集合。
2.根据权利要求1所述的一种训练集合生成方法,其特征在于 所述步骤A包括以下步骤Al 在图像标注选项进行手动标注;A2 保存标注结果到标注结果文件中,并且从标注结果文件中把标注结果重新调入到图像文件里面。
3.根据权利要求2所述的一种训练集合生成方法,其特征在于 在执行Al和A2步骤后如需要删除标注结果文件,可进行以下步骤当原图像不需要保留标记,执行步骤A3 ;当原图像需要保留标记,执行步骤A4 ; A3 删除标注结果文件,图像上的标记随之消失,原图像没有更改; A4 删除标注结果文件,图像上的标记不消失。
4.根据权利要求1所述的一种训练集合生成方法,其特征在于 所述步骤B包括以下步骤Bl 自动地找到图像中目标的区域和位置;B2 从目标的区域和位置提取出特征参数作为特征向量。
5.根据权利要求4所述的一种训练集合生成方法,其特征在于其步骤B2所述的特征参数包括血细胞的面积、周长、圆度、色度、均值、能量、熵、对比度、直方图特征、haar特征和边缘特征的一种或多种组合。
6.根据权利要求1所述的一种训练集合生成方法,其特征在于 所述步骤C包括以下步骤Cl 采用中心点匹配法和/或区域匹配法,对标注图像和对应图像对象的特征进行配对;C2 按照匹配分数最高优先配对的原则判断出配对是否成功;C3 配对成功的人工标注信号与自动提取的特征相结合形成训练向量;C4 把若干个训练向量放在一起形成训练矢量集合。
全文摘要
本发明公开了一种训练集合生成方法,该发明涉及一种图像分类方法,特别是涉及一种训练集合生成方法。所述的一种训练集合生成方法,通过人工标注待训练的图像对象的类型,再由通用特征提取模块或者特定特征提取模块提取特征;最后把标注结果文件与对应图像对象的特征结合在一起生成训练集合,此方法有效克服了过去相关领域专家与软件专家因专业鸿沟引起的图像分类错误或分类不当,具有通用性和实用性强,面向用户等优点,分类错误概率低,前景十分广阔,可应用于图像处理和分类中。
文档编号G06K9/46GK102254195SQ201110208790
公开日2011年11月23日 申请日期2011年7月25日 优先权日2011年7月25日
发明者吴新忠, 张云超, 徐宁, 黄志海 申请人:广州市道真生物科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1