自然场景中的显著目标的自动检测方法

文档序号:9274928阅读:426来源:国知局
自然场景中的显著目标的自动检测方法
【技术领域】
[0001] 本发明涉及人类视觉模拟技术领域,具体地讲是一种自然场景中的显著目标的自 动检测方法。
【背景技术】
[0002] 随着信息技术的发展,计算机视觉已经被广泛应用于低层特征检测和描述、模式 识别、人工智能推理和机器学习算法等领域。然而,传统的计算机视觉方法通常是任务驱动 型,即需要限定许多条件,并根据实际任务来设计相应的算法,缺乏通用性;需要解决高维 非线性特征空间、超大数据量对问题求解和实时处理等问题,使得其研宄和应用面临巨大 的挑战。
[0003] 人类视觉系统能够在不同环境下高效、可靠地工作,其具有以下优点:具有关注 机制、显著性检测和与此相关的视觉处理中的选择性和目的性;能够从低层视觉处理中利 用先验知识,使数据驱动的自底向上处理与自顶向下的知识指导在视觉处理中相互协调配 合;上下境信息在视觉处理的各个层次都发挥着重要作用,并且能够综合利用环境中各种 模态的信息。但在人类视觉感知机理尚不完全明了的情况下,如何构造具有人类视觉特点 的机器视觉仍存在较大困难,若能够构建模拟人类视觉的机器视觉系统,必然会给计算机 视觉的各个实际应用领域带来重要的影响。

【发明内容】

[0004] 有鉴于此,本发明要解决的技术问题是,提供一种能够模拟人类视觉的自然场景 中的显著目标的自动检测方法,通过模拟人类主动视觉行为、对目标场景作快速有效注视, 实现机器对目标场景中显著目标的自动检测。
[0005] 本发明的技术解决方案是,提供以下步骤的自然场景中的显著目标的自动检测方 法,包括以下各步骤:
[0006] 1)通过谱残差法对目标图像作显著性检测,得到相应的像素显著度图,所述像素 显著度图与所述目标图像的像素位置信息一致;
[0007] 2)对所述的像素显著度图中的显著点,依据显著度进行排序;
[0008] 3)选取前N个显著点作为注视点,包含这些注视点的最小矩形范围作为注视区 域;
[0009] 4)对所述的注视区域内部像素进行随机采样,并对注视区域外部进行等量的像素 随机采样;采样得到的注视区域内部像素作为正样本,注视区域外部像素作为负样本;
[0010] 5)利用支持向量机集成训练策略,训练得到多个二分类的SVM模型,通过这些模 型分类所述目标图像的全部像素,将被分为正样本的像素区域做投票集成后、作为第一检 测结果;
[0011] 选取前N+M个显著点作为注视点,依照步骤3)形成注视区域,再经步骤4)和5) 得到相应的第二检测结果;
[0012] 比较第一检测结果和第二检测结果的重叠程度,重叠程度大则表明对目标的视觉 感知强度大;重叠程度小则表明还未形成足够的对目标的视觉感知强度,继续重复上述过 程,直至达到足够的视觉感知强度,最终的检测结果为上述过程所有检测结果的叠加;
[0013] 获得最终的检测结果后,在目标图像和像素显著度图中该区域被清零,对更新后 的像素显著度图中的显著点,依据显著度再次排序,重复步骤3)、4)和5),得到新的检测结 果,直至目标图像中的所有目标检测完毕。
[0014] 采用本发明的方法,与现有技术相比,本发明具有以下优点:通过谱残差法进行显 著性检测,能够快速形成像素显著度图;依据显著度排序像素,可粗略定位显著度高的注视 区域;对该区域内部和外部同时进行少量像素采样,组成正负样本数据集训练SVM(支持向 量机)模型,随后借助该SVM模型分类像素,能获得显著度高的、更精确的区域作为第一检 测结果;且可在建立第一检测结果的基础上,适当扩大显著度高的注视区域范围,再次经 SVM学习-分类形成相应的检测结果,并与第一检测结果进行比较,以判断注视目标区是否 稳定。本发明根据人类视觉注视的过程,通过注视点排序和SVM模型,来模拟人类视觉,实 现机器对目标场景中显著目标的自动检测。
[0015] 作为改进,所述的谱残差法是指通过超复数傅立叶变换,将彩色图像中的红、绿、 蓝三个分量作为超复数的三个虚部参与傅立叶变换,只保留幅度谱残差和相位谱信息,经 傅立叶反变换获得像素显著度图。该设计用于解决现有技术仅能处理灰度图像的问题,有 效地针对彩色图像相应地改进了原谱残差法的具体步骤。
[0016] 作为改进,所述随机采样针对的像素所具有的梯度值大于其所在区域的平均梯度 值。这是由于图像中由梯度较大像素产生的信息熵会大于原图信息熵,表明高梯度像素对 所注视的目标区域具有代表性,有助于消除图像信息冗余。
【附图说明】
[0017] 图1为本发明自然场景中的显著目标的自动检测方法的流程图。
【具体实施方式】
[0018] 下面就具体实施例对本发明作进一步说明,但本发明并不仅仅限于这些实施例。
[0019] 本发明涵盖任何在本发明的精髓和范围上做的替代、修改、等效方法以及方案。为 了使公众对本发明有彻底的了解,在以下本发明优选实施例中详细说明了具体的细节,而 对本领域技术人员来说没有这些细节的描述也可以完全理解本发明。此外,本发明之附图 中为了示意的需要,并没有完全精确地按照实际比例绘制,在此予以说明。
[0020] 如图1所示,本发明的自然场景中的显著目标的自动检测方法,包括以下各步骤:
[0021] 1)通过谱残差法对目标图像作显著性检测,得到相应的像素显著度图,所述像素 显著度图与所述目标图像的像素位置信息一致;
[0022] 2)对所述的像素显著度图中的显著点,依据显著度进行排序;
[0023] 3)选取前N个显著点作为注视点,包含这些注视点的最小矩形范围作为注视区 域;
[0024] 4)对所述的注视区域内部像素进行随机采样,并对注视区域外部进行等量的像素 随机采样;采样得到的注视区域内部像素作为正样本,注视区域外部像素作为负样本;
[0025] 5)利用支持向量机集成训练策略,训练得到多个二分类的SVM模型,通过这些模 型分类所述目标图像的全部像素,将被分为正样本的像素区域做投票集成后、作为第一检 测结果;
[0026] 选取前N+M个显著点作为注视点,依照步骤3)形成注视区域,再经步骤4)和5) 得到相应的第二检测结果;
[0027] 比较第一检测结果和第二检测结果的重叠程度,重叠程度大则表明对目标的视觉 感知强度大;重叠程度小则表明还未形成足够的对目标的视觉感知强度,继续重复上述过 程,直至达到足够的视觉感知强度,最终的检测结果为上述过程所有检测结果的叠加;
[0028] 获得最终的检测结果后,在目标图像和像素显著度图中该区域被清零,对更新后 的像素显著度图中的显著点,依据显著度再次排序,重复步骤3)、4)和5),得到新的检测结 果,直至目标图像中的所有目标检测完毕。
[0029]自然场景相当于人类视觉所注视的场景,无论场景大小,在视网膜上成像的范围 的不变的,因而自然场景之于机器之于机器视觉也是如此。
[0030] 通过谱残差法对目标图像作显著性检测,可采用以下步骤实施:对于给定的待感 知图像I(x)(此处x表示像素坐标向量),首先对其进行二维离散傅里叶变换F[I(x)],将 图像由空间域转换到频域,得到幅值A(f)和相位P(f)信息:
[0031] A(f) = |F[I(x)] (1)
[0032]
-- (2)
[0033] 接着对幅值取对数,得到log谱L(f):
[0034] L(f) = log(A(f)) (3)
[0035] 式中F表示二维离散傅里叶变换,|. |表示幅值运算,P()表示相位运算。由于log 曲线满足局部线性条件,所以用局部平均滤波器hn(f)对其进行平滑,获得log谱的大致形 状:
[0036]V(f) =L(f)*hn(f) (4)
[0037] 其中hn(f)是一个nXn的矩阵(本实施例实验中n= 3。),定义如下:
[0038] ' , (5)
[0039] 谱残差R(f)则是对图像中的突变区域的描述:
[0040] R(f) = L(f)-V(f) (6)
[0041] 通过傅里叶逆变换,可以在空间域得到显著度图像。
[0042] S(x) = |F^[exp{R(f)+jP(f)}] |2 (7)
[0043] 显著度图上每点的值表示该位置的显著度。考虑到人眼视觉的局部成组效应,为 了消除少数孤立的显著点,得到更好的视觉效果,可在得到S(x)后再用平均滤波器进行一 次平滑,得到最终的显著度图Z(x)。
[0044] Z(x) = S(x)*hn(f) (8)
[0045] 图1中,涉及训练数据、分类模型、结果等均为采用支持向量机(SVM)训练策略相 应实施过程。具体实施过程如下:
[0046] 设包含1
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1