基于压缩感知分类的目标感知方法

文档序号:9304821阅读:261来源:国知局
基于压缩感知分类的目标感知方法
【技术领域】
[0001] 本发明涉及人类视觉仿真技术领域,具体地讲是一种基于压缩感知分类的目标感 知方法。
【背景技术】
[0002] 随着信息技术的发展,计算机视觉已经被广泛应用于低层特征检测和描述、模式 识别、人工智能推理和机器学习算法等领域。然而,传统的计算机视觉方法通常是任务驱动 型,即需要限定许多条件,并根据实际任务来设计相应的算法,缺乏通用性;需要解决高维 非线性特征空间、超大数据量对问题求解和实时处理等问题,使得其研究和应用面临巨大 的挑战。
[0003] 人类视觉系统能够在不同环境下高效、可靠地工作,其具有以下优点:具有关注 机制、显著性检测和与此相关的视觉处理中的选择性和目的性;能够从低层视觉处理中利 用先验知识,使数据驱动的自底向上处理与自顶向下的知识指导在视觉处理中相互协调配 合;上下境信息在视觉处理的各个层次都发挥着重要作用,并且能够综合利用环境中各种 模态的信息。但在人类视觉感知机理尚不完全明了的情况下,如何构造具有人类视觉特点 的机器视觉仍存在较大困难,若能够构建模拟人类视觉的机器视觉系统,以此来对目标场 景进行感知,则必然会给目标的识别和感知等应用带来重要的影响。

【发明内容】

[0004] 有鉴于此,本发明要解决的技术问题是,提供一种能够模拟人类视觉的基于压缩 感知分类的目标感知方法,通过模拟人类主动视觉行为、对目标场景作快速有效注视,实现 机器对目标场景的视觉感知。
[0005] 本发明的技术解决方案是,提供以下步骤的基于压缩感知分类的目标感知方法, 包括以下各步骤:
[0006] 1)通过谱残差法对目标图像作显著性检测,得到相应的像素显著度图,所述像素 显著度图与所述目标图像的像素位置信息一致;
[0007] 2)对所述的像素显著度图中的显著点,依据显著度进行排序;
[0008] 3)选取前N个显著点作为注视点,包含这些注视点的最小矩形范围作为注视区 域;
[0009]4)对所述的注视区域内部像素进行随机采样,并对注视区域外部进行等量的像素 随机采样;采样得到的注视区域内部像素作为正样本,注视区域外部像素作为负样本;
[0010] 5)利用压缩感知分类器策略,得到一个二分类的像素分类模型,通过该模型分类 所述目标图像的全部像素,将被分为正样本的像素区域作为第一注视目标区。
[0011] 采用本发明的方法,与现有技术相比,本发明具有以下优点:通过谱残差法进行显 著性检测,能够快速形成像素显著度图;依据显著度排序像素,可粗略定位显著度高的注视 区域;对该区域内部和外部同时进行少量像素采样,组成正负样本数据集,并作为一个完备 字典提供给压缩感知分类模型,随后借助该模型分类像素,能获得显著度高的、更精确的区 域作为第一注视目标区;且可建立第一注视目标区的基础上,适当扩大显著度高的注视区 域范围,再次构建一个完备字典,经压缩感知分类模型分类形成相应的注视目标区,并与第 一注视目标区进行比较,以判断注视目标区是否稳定。本发明根据人类视觉注视的过程,通 过注视点排序和像素分类模型,来模拟人类视觉,对目标场景作快速有效注视,实现机器对 目标场景的视觉感知。
[0012] 作为改进,选取前N+M个显著点作为注视点,依照步骤3)形成注视区域,再经步骤 4)和5)得到相应的第二注视目标区;比较第一注视目标区和第二注视目标区的重叠程度, 重叠程度大则表明对目标的视觉感知强度大;重叠程度小则表明还未形成足够的对目标的 视觉感知强度,继续重复上述过程,直至达到足够的视觉感知强度,最终的注视目标区为上 述过程所有注视目标区的叠加。该设计能够加快视觉感知目标的生成与输出,并得到更为 稳定的注视目标区,注视的结果更为可靠。
[0013] 作为改进,获得注视目标区后,获得注视目标区后,在目标图像和像素显著度图中 该区域被清零,对更新后的像素显著度图中的显著点,依据显著度再次排序,重复步骤3)、 4)和5),得到新的注视目标区,依次获得图像中的多个目标区。这样能够完成对整幅图像 的有效信息进行注视识别和读取,提高注视的准确性和完整度。
[0014] 作为改进,所述的谱残差法是指通过傅立叶变换,只保留幅度谱的残差和相位谱 信息,经傅立叶反变换获得像素显著度图;并通过扰动目标图像尺度,得到目标图像在不同 尺度下的多个显著度图,再将这些显著度图缩放到同一尺度进行叠加。该设计用于解决现 有技术对图像尺度变化敏感的问题,可有效地提高显著度图的信噪比,增强谱残差法的适 应性。
【附图说明】
[0015] 图1为本发明基于压缩感知分类的目标感知方法的流程图。
【具体实施方式】
[0016] 下面就具体实施例对本发明作进一步说明,但本发明并不仅仅限于这些实施例。
[0017] 本发明涵盖任何在本发明的精髓和范围上做的替代、修改、等效方法以及方案。为 了使公众对本发明有彻底的了解,在以下本发明优选实施例中详细说明了具体的细节,而 对本领域技术人员来说没有这些细节的描述也可以完全理解本发明。此外,本发明之附图 中为了示意的需要,并没有完全精确地按照实际比例绘制,在此予以说明。
[0018] 如图1所示,本发明的基于压缩感知分类的目标感知方法,包括以下各步骤:
[0019] 1)通过谱残差法对目标图像作显著性检测,得到相应的像素显著度图,所述像素 显著度图与所述目标图像的像素位置信息一致;
[0020] 2)对所述的像素显著度图中的显著点,依据显著度进行排序;
[0021] 3)选取前N个显著点作为注视点,包含这些注视点的最小矩形范围作为注视区 域;
[0022] 4)对所述的注视区域内部像素进行随机采样,并对注视区域外部进行等量的像素 随机采样;采样得到的注视区域内部像素作为正样本,注视区域外部像素作为负样本;
[0023] 5)利用压缩感知分类器策略,得到一个二分类的像素分类模型,通过该模型分类 所述目标图像的全部像素,将被分为正样本的像素区域作为第一注视目标区。
[0024] 对目标场景的感知,图像相当于人类视觉所注视的场景,无论场景大小,在视网膜 上成像的范围的不变的,因而图像之于机器视觉也是如此。
[0025] 通过与其他显著性检测方法比较,谱残差法的计算速度很快。本文用该类算法作 为图像感兴趣区域的自动检测工具。通过谱残差法对目标图像作显著性检测的具体步骤如 下:
[0026] 对于给定的待感知图像I(X)(此处x表示像素坐标向量),首先对其进行二维离散 傅里叶变换F[I(x)],将图像由空间域转换到频域,得到幅值A(f)和相位P(f)信息:
[0027]A(f) = |F[I(x)] (1)
[0028] P(f) = <p(F[!(x)]) (2)
[0029] 接着对幅值取对数,得到log谱L(f):
[0030]L(f) =log(A(f)) (3)
[0031] 式中F表示二维离散傅里叶变换,|. |表示幅值运算,表示相位运算。由于log 曲线满足局部线性条件,所以用局部平均滤波器hn (f)对其进行平滑,获得log谱的大致形 状:
[0032]V(f) =L(f)*hn(f) (4)
[0033] 其中hn(f)是一个nXn的矩阵(本实施例实验中n= 3。),定义如下:
[0034] (5)
[0035] 谱残差R(f)则是对图像中的突变区域的描述:
[0036]R(f) =L(f)-V
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1