一种基于超像素分割的滑动窗口快速目标检测方法与流程

文档序号:12471820阅读:1189来源:国知局
一种基于超像素分割的滑动窗口快速目标检测方法与流程

本发明属于图像处理与计算机视觉领域,涉及一种基于超像素分割的滑动窗口快速目标检测方法。



背景技术:

视觉是人类获取外界信息的重要途径,而图像则是信息的重要载体。随着图像处理技术的日益发展,图像的尺寸、分辨率逐渐增大,其包含的信息也在不断丰富。研究表明,人类在观察图像时视线通常在图像所包含的物体之间移动,而对背景等其他区域并不感兴趣,大部分的视觉技术,如行人检测、人脸识别、目标跟踪和目标识别等,也是作用于上述包含物体的区域。因此如何在整幅图像中快速、有效地检测感兴趣物体区域具有重要的研究意义。

目标检测是图像理解、目标识别领域的重要内容,其主要任务包括从一幅给定图像中定位目标,其中基于滑窗搜索的方法在目标检测中得到广泛应用。上述方法将分类函数应用于不同位置、尺度和长宽比下的窗口,对窗口所覆盖的图像区域进行评价,具有最大响应的窗口视为物体的预测区域。但基于滑窗搜索的方法在实际应用中主要面临两个问题:

1、由于窗口滑动步长的影响,窗口所覆盖的矩形区域通常不能够对目标的边缘进行较好的覆盖,如图2中白色实线所示。为提高窗口的覆盖准确性,如果降低窗口的滑动步长,又会造成搜索效率的下降;

2、如何有效地训练具有位置判别特征的泛化分类器。

针对第一个问题,已有的改进大都采用启发式算法,首先对目标在图像中的分布进行初步估计,在概率高的区域进行精细搜索,在概率低的区域进行粗略搜索,从而达到提高搜索效率的目的,但其搜索精度依赖于初始的位置分布精度,且会增大目标误检和漏检的概率。基于滑窗搜索的算法虽然效率较低,但仍具有精度高,漏检率低的优点。因此采用结合上述两种搜索方式的优点,发展一种运行速度快、误检率低的搜索方法,同时保证目标检测结果与实际尽可能吻合,具有十分重要的意义。



技术实现要素:

要解决的技术问题

为了避免现有技术的不足之处,本发明提出一种基于超像素分割的滑动窗口快速目标检测方法,弥补现有的滑窗搜索算法在运行速度、目标检测精度的不足。

技术方案

一种基于超像素分割的滑动窗口快速目标检测方法,其特征在于步骤如下:

步骤1、图像超像素分割:采用SLIC算法将图像分割为互不重合超像素的图像块,每个图像块有唯一的标记信息i,N表示超像素的总数目,i=0,1,2,…N-1;

步骤2、滑动窗口初始化:将滑动窗口的尺度分别设置为图像尺寸的1/2,1/3或1/4;每个尺度的滑动窗口的长宽比分别设置为1:1,2:1,1:2,3:2,2:3,16:9或9:16,得到21组尺寸/长宽比的滑动窗口;

步骤3、滑动窗口超像素激活:将其中一个滑动窗口作为初始窗口,将初始窗口所覆盖像素点对应的超像素集合作为实际的滑动窗口为超像素激活区域;所述超像素集合中所有像素点横坐标的最小值作为激活区域的左边界,最大值作为激活区域的右边界,所有像素点纵坐标的最小值作为激活区域的上边界,最大值作为激活区域的下边界;

步骤4、激活区域评价:采用目标评价函数计算当前的超像素激活区域包含有目标概率;

步骤5:将滑动窗口滑动至下一个区域,再重复步骤3~步骤4得到下一个区域的目标概率;

步骤6、基于超像素激活区域的滑窗搜索:

对21组尺寸/长宽比的滑动窗口重复步骤3~步骤5,得到每个滑动窗口在不同位置的目标概率;

将得到的21组评价概率由高到低进行排列,取每组内排列前三的评价概率的3个滑动窗口作为目标的检测候选滑动窗口,21种组合共生成63个目标候选区域;

以0.5作为窗口覆盖率阈值,采用非极大值抑制算法对63个目标候选区域筛选出具有全局最大概率的超像素激活区域,作为最终的目标检测区域。窗口覆盖率γ:

其中,i≠j且1≤i,j≤63,pi,pj分别表示第i,j个超像素激活区域;|·|表示对应区域的像素个数。

有益效果

本发明提出的一种基于超像素分割的滑动窗口快速目标检测方法,其主要由图像超像素分割、滑动窗口初始化、滑动窗口超像素激活、激活区域评价和基于超像素激活区域的滑窗搜索五部分构成。

与现有技术相比,本发明具有以下有益效果:

1.通过控制图像分割算法参数,本发明能够方便地改变超像素的尺寸和内部的特征一致性,从而改变同一滑动窗口所激活的超像素区域,实现提高目标检测精度的目的;

2.当滑动窗口未能与目标边界较好吻合时,本发明能够将其覆盖像素点对应的超像素区域纳入滑动窗口,由于超像素的特征一致性保证了其对目标边界较好的分割效果,因此本发明能够保证激活区域与目标边界有较好理想的符合度。

3.由于超像素具有一定的尺寸,本发明能够在一定范围内增大窗口的滑动步长,同时保证其对应的激活区域不变,从而达到提高算法运行效率的目的。

本发明的方法易于实现,其应用价值主要体现在以下几个方面:

1.可以在保证搜索精度的前提下,显著提升搜索步长设置,从而加速传统基于像素点的滑窗搜索算法;

2.本发明可以方便地嵌入现有的滑窗搜索算法,在不改变算法实施方式的前提下提高现有算法对目标的检测精度。

附图说明

图1为本发明的流程图;

图2为本发明的超像素激活窗口与原初始窗口的对比示意图;

图3为本发明的不同阶段的算法效果图,其中,(a)为输入图像的超像素分割效果图,(b)、(c)分别为不同尺度/长宽比组合下的目标检测结果,(d)为应用非极大值抑制后的最终检测结果。

具体实施方式

现结合实施例、附图对本发明作进一步描述:

参见图1,本发明为一种基于超像素分割的滑动窗口快速目标检测方法,其主要由图像超像素分割、滑动窗口初始化、滑动窗口超像素激活、激活区域评价和基于超像素激活区域的滑窗搜索五部分构成。

该方法具体包括步骤如下:

1.图像超像素分割

选取包含目标的图像作为待处理图像,应用SLIC(Simple Linear Iterative Clustering)算法将图像分割为尺寸相当、内部元素特征相似的超像素。超像素互不重合,且有唯一的标记信息i(i=0,1,2,…N-1),N表示超像素的总数目。简要做法如下:

1)按固定采样步长s初始化聚类中心点,每个像素的标记设为-1,距最近中心点的距离设为正无穷;

2)对每一个中心点,计算其2s×2s邻域中每个像素点距此中心点的距离,并与该像素点已有的距离进行比较,较小的值设为当前像素点的距离,并保持像素点标记与该聚类中心点标记一致;

3)更新聚类中心点,计算分割误差;

4)重复执行步骤2)和3),直到误差满足条件。

2.滑动窗口初始化

为使滑动窗口能够尽可能完整地覆盖图像中的目标,需给滑动窗口设置不同的尺度和长宽比。在本发明中,滑动窗口的尺度分别设置为图像尺寸的1/2,1/3,1/4,每个尺度的滑动窗口的长宽比分别设置为1:1,2:1,1:2,3:2,2:3,16:9,9:16,共有21组尺寸/长宽比组合情况。选定一组组合参数,生成初始化滑动窗口。

3.滑动窗口超像素激活

将其中一个滑动窗口作为初始窗口,将初始窗口所覆盖像素点对应的超像素区域的集合作为实际的滑动窗口,即超像素激活区域。超像素集合中所有像素点横坐标的最小值作为激活区域的左边界,最大值作为激活区域的右边界;同理,计算所有像素点纵坐标的最小值作为激活区域的上边界,最大值作为激活区域的下边界。当初始窗口由于滑动步长的影响未能与目标边界较好符合时,由于其能够覆盖一部分的超像素像素点,而超像素内部具有较好的特征一致性,其对边界的分割效果较为理想,因此将这些像素点对应的超像素区域纳入滑动窗口,能够保证激活区域与目标边界有良好的符合度,如图2中白色虚线所示。

当每个超像素均只包含1个像素点时,本方法退化为传统的滑动窗口搜索算法,因此本是对传统算法的一般化。

4.激活区域评价

采用目标评价函数对当前的超像素激活区域进行评价,计算其中包含有目标的概率。目标评价函数的选取同传统滑动窗口算法一致,此处不再赘述。

5.将滑动窗口滑动至下一个区域,再重复步骤3~步骤4得到下一个区域的目标概率;

6.基于超像素激活区域的滑窗搜索

生成新一组尺度/长宽比组合,重复执行步骤3和步骤4,直到所有组合完成遍历。针对每一组合,将其产生的超像素激活区域按照评价概率由高到低进行排列,取最高的3组区域作为目标的检测候选区域,21种组合共生成63个目标候选区域。

最后以0.5作为窗口覆盖率阈值,采用非极大值抑制算法(NMS,Non-Maximal Suppression)筛选出具有全局最大概率的超像素激活区域,作为最终的目标检测区域。窗口覆盖率γ定义如下:

其中,i≠j且1≤i,j≤63,pi,pj分别表示第i,j个超像素激活区域。|·|表示对应区域的像素个数。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1