基于机器学习方法的图像轮廓检测算法

文档序号:6638135阅读:3471来源:国知局
基于机器学习方法的图像轮廓检测算法
【专利摘要】本发明公开了一种基于机器学习方法的一种图像轮廓检测算法,根据测试集图像计算得到的三层特征和gPb提供的图像特征,利用监督学习进行分类器交叉验证训练,得到预测模型。基于该模型可对新输入的图像进行预测,得到该图像的精确轮廓,摆脱过去图像轮廓检测算法中对于人的主观设置的依赖。该方法判断图像轮廓时,兼顾了图像多通道下的局部特征以及图像像素间的全局特征,得到的图像轮廓具有优秀的显著性。采用本发明的基于机器学习方法的图像轮廓检测算法,相对于gPb轮廓检测算法具有更高的准确率以及召回率,能有效地捕捉复杂环境下图像的轮廓信息。
【专利说明】基于机器学习方法的图像轮廓检测算法

【技术领域】
[0001] 本发明涉及一种对数字图像的轮廓检测、划分的技术,特别是加入了机器学习的 方法,使得图像的轮廓检测任务从过去的主观依赖型过渡为自主判断型,不再需要人作为 主体参与轮廓的判断活动,实现在智能化方向的突破。

【背景技术】
[0002] 识别物体的边缘轮廓是人类视觉功能中不可或缺的一个能力。一个优秀的轮廓检 测算法具有很多实际意义,它可以被应用在许多不同的领域中,包括图像切割,模式识别, 人工智能,以及医学图片分析等。可以说它是计算机视觉领域的基石。类似于"纹理"或者 "人脸"这样的计算机视觉领域内的概念,物体的轮廓这个概念是人们依据自身平时积累的 经验而得到的产物,而不是一个严格的数学定义。当我们在判断一个视觉特征是否可以被 认为是一个轮廓时,人的主观判断几乎可以说是唯一可行的标准。
[0003] 考虑到物体轮廓这样的特性,一直以来轮廓检测方面的研究都把目标放在如何更 加精确且快速的从局部(颜色,亮度,纹理)和全局(连续性,闭合性)的角度,提取图片的 特征信息来判断轮廓。但是这类的研究在判断这些轮廓时始终都完全离不开人的最终判 断,计算机无法通过这些特征告诉我们这些像素是否为最终轮廓,它能提供给我们的只是 这张图片中的一些特征信息。所以,让计算机独自模拟识别轮廓的过程,摆脱对人的主观判 断的依赖,同时获得具有优秀效果的图片轮廓,成为了我们在研究这个问题时最终的目标。


【发明内容】

[0004] 本发明是为了解决现有技术中的问题,而提供了一种特征全面、进一步提高图像 轮廓获取准确率、解决了摆脱在判断数字图像轮廓时人的主观判断问题、用于数字图像的 一种基于机器学习方法的图像轮廓检测算法。
[0005] 本发明为解决公知技术中存在的技术问题所采用的技术方案是:
[0006] 本发明的基于机器学习方法的一种轮廓检测算法,对于测试集中的每一张图像中 的每一个像素,该方法在考虑gPb轮廓检测算法提供的104个图像像素特征的同时,利用面 向方向的轮廓检测算法消除gPb在计算时产生的冗余问题,再对图像像素间的走势方向方 面的特征进行补充形成260个新特征,共364个特征。将所生产的364个特征作为机器学 习分类器的输入,采用十折叠交叉验证训练得到预测模型。根据预测模型对新输入图片的 图像像素特征进行预测,得到图像轮廓;其中,
[0007] 判断轮廓过程包括如下步骤:
[0008] (1)对于测试集中每一张图片的像素特征信息,根据gPb轮廓检测算法进行计算 得到104个特征。
[0009] (2)计算新的三层特征。对于每一个像素点,根据半径画圆,在圆中依据圆心角,通 过中心对称的方式,找到一组对称点,以及对称点3x3的邻域,计算他们之间RGB上的欧几 里得距离,得到第一层特征。(半径和角度具有多个值)
[0010] (3)找到第一层特征值和最小和最大的方向,并把最小方向上下Θ邻域内的像素 点的第二层特征赋值为〇,最大和与最小和作为圆心像素点的第二层特征。
[0011] (4)通过中心对称的方式,找到一组对称点,但是并不再与其邻域计算距离。仅仅 计算两个对称点之间在RGB三个通道的色差距离。然后,找到特征值和最小的方向,并把最 小方向上以及其上下Θ邻域内的像素点的特征更改为0,得到像素点第三层特征。三层特 征一共有260个。
[0012] (5)将上述364个特征作为机器学习分类器的输入,根据交叉验证获得训练模型。
[0013] (6)对于新的待预测图片,其像素特征经计算后作为分类器输入,根据之前获得的 训练模型进行预测,根据预测的结果获得图片轮廓。

【专利附图】

【附图说明】
[0014] 图1是算法分解示意图。
[0015] 图2是第二层特征以及第三层特征计算方法。
[0016] 图3是部分验证图片输入后的轮廓结果。

【具体实施方式】
[0017] 以下参照附图及实施例对本发明进行详细说明。
[0018] 本发明的基于机器学习方法的一种轮廓检测算法,对于测试集中的每一张图像中 的每一个像素,该方法在考虑gPb轮廓检测算法的同时,利用面向方向的轮廓检测算法消 除gPb在计算时产生的冗余问题,再对图像像素间的走势方向方面的特征进行补充形成新 特征。得到的所有像素特征构成机器学习的训练样本输入分类器,经过交叉验证,得到线性 模型。根据模型对新输入的图片的图像像素特征进行预测后,得到图像轮廓(图1)。该方 法处理图像时,通过机器学习摆脱了人对于轮廓判断活动的参与,具有智能性的同时获得 了高准确率的图像轮廓。
[0019] 判断轮廓过程包括如下步骤:
[0020] (1)对于测试集中每一张图片的像素特征信息,根据gPb轮廓检测算法进行计算 得到104个特征。
[0021] (2)计算新的三层特征。对于每一个像素点,根据半径画圆,在圆中依据圆心角,通 过中心对称的方式,找到一组对称点,以及对称点3x3的邻域,计算他们之间RGB上的欧几 里得距离,得到第一层特征(图2)。(半径和角度具有多个值)
[0022] (3)找到第一层特征值和最小和最大的方向,并把最小方向上下Θ邻域内的像素 点的第二层特征赋值为〇,最大和与最小和作为圆心像素点的第二层特征(图2)。
[0023] (4)通过中心对称的方式,找到一组对称点,但是并不再与其邻域计算距离。仅仅 计算两个对称点之间在RGB三个通道的色差距离。然后,找到特征值和最小的方向,并把最 小方向上以及其上下Θ邻域内的像素点的特征更改为0,得到像素点第三层特征。三层特 征一共有260个。
[0024] (5) 200张具有154401个像素点的测试图片,经过特征提取,对应生成共 200X154401X364个训练样本。样本在经过子集划分后,作为分类器(LIBLINEAR)的输入,根 据交叉验证获得训练模型。
[0025] (6)对于新的待预测图片,其像素特征经计算后作为分类器输入,根据之前获得的 训练模型进行预测,根据预测的结果获得图片轮廓。
[0026] 本发明采用BSDS提供的轮廓评价方法对算法生成的最终轮廓进行了性能测试。 这个评价方法是一个以边界为基础的precision-recall框架,它从准确率(precision), 真正的正样本比例(fraction of true positive),召回率(recall),探测出来的真实轮廓 像素点的比例等方面对一个轮廓检测算法进行评价。除此之外,在整个评价算法中,准确率 和召回率在最优处的调和平均数,F-measure,为我们提供了一个概括性的得分(score)。
[0027] 在测试中,本发明提供三种指标来显示算法的性能:最好的F-Hieasure(BF),以及 他们的准确率(Precision)和召回率(Recall)。随机对十五张 BSDS500提供的测试图片进 行了测试,在表1中记录了结果以及与gPb轮廓检测算法的对比结果。图3是部分验证图 片输入后的轮廓结果。
[0028] 表1.基于机器学习的轮廓检测算法和gPb算法性能结果比较。BF代表准确率和 召回率在最优处的调和平均数,Fneasure ;准确率Precision ;召回率Recall。
[0029]

【权利要求】
1. 一种基于机器学习思想的图像边缘轮廓检测算法,该方法在考虑gpb轮廓检测算法 提供的104个图像像素特征的同时,利用面向方向的轮廓检测算法消除gPb在计算时产生 的冗余问题,再对图像像素间的走势方向方面的特征进行补充形成260个新特征,共364个 特征。采用机器学习方法,经过交叉验证得到线性模型。根据模型对新输入的图片的图像 像素特征进行计算与预测后,得到图像轮廓。其期特征在于, (1) 对于测试集中每一张图片的像素特征信息,根据gPb轮廓检测算法进行计算得到 104个特征。 (2) 计算新的三层特征。对于每一个像素点,根据半径画圆,在圆中依据圆心角,通过中 心对称的方式,找到一组对称点,以及对称点3x3的邻域,计算两像素点之间RGB三通道上 的欧几里得距离,得到第一层特征。(半径和角度具有多个值) (3) 找到第一层特征值和最小和最大的方向,并把最小方向上下0邻域内的像素点的 第二层特征赋值为0,最大和与最小和作为圆心像素点的第二层特征。 (4) 通过中心对称的方式,找到一组对称点,但是并不再与其邻域计算距离。仅仅计算 两个对称点之间在RGB三个通道的色差距离。然后,找到特征值和最小的方向,并把最小方 向上以及其上下9邻域内的像素点的特征更改为〇,得到像素点第三层特征。三层特征一 共有260个。 (5) 将上述364个特征作为机器学习分类器的输入,根据交叉验证获得训练模型。 (6) 对于新的待预测图片,其像素特征经计算后,作为分类器输入,根据之前获得的训 练模型,进行预测,根据预测的结果获得图片轮廓。
【文档编号】G06K9/66GK104361367SQ201410757813
【公开日】2015年2月18日 申请日期:2014年12月11日 优先权日:2014年12月11日
【发明者】陈科, 刘浩 申请人:天津工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1