仿真人类低层视觉的目标感知方法

文档序号:9288602阅读:577来源:国知局
仿真人类低层视觉的目标感知方法
【技术领域】
[0001] 本发明涉及人类视觉仿真技术领域,具体地讲是一种仿真人类低层视觉的目标感 知方法。
【背景技术】
[0002] 随着信息技术的发展,计算机视觉已经被广泛应用于低层特征检测和描述、模式 识别、人工智能推理和机器学习算法等领域。然而,计算机视觉是一种任务驱动型的方法, 即需要限定许多条件,并根据实际任务来设计相应的算法,缺乏通用的算法,因而经常会遇 到高维非线性特征空间、超大数据量对问题求解和实时处理等问题,使得其研究和应用面 临巨大的挑战。
[0003] 对于人类视觉系统来说,能够在不同环境下高效、可靠地工作,其具有以下优点: 具有关注机制、显著性检测以及与此相关的视觉处理中的选择性和目的性;能够从低层视 觉处理中利用先验知识,使数据驱动的自底向上处理与自顶向下的知识指导在视觉处理中 相互协调配合;上下境信息在视觉处理的各个层次都发挥着重要作用,并且能够综合利用 环境中各种模态的信息。但在人类视觉感知机理尚不完全明了的情况下,如何构造具有人 类视觉特点的机器视觉仍存在较大困难,若能够仿真人类视觉以实现对目标的感知,则必 然会给目标的识别和感知等应用带来重要的影响。

【发明内容】

[0004] 有鉴于此,本发明要解决的技术问题是,提供一种能够仿真人类视觉,实现对目标 场景的快速有效注视的仿真人类低层视觉的目标感知方法。
[0005] 本发明的技术解决方案是,提供以下步骤的仿真人类低层视觉的目标感知方法, 包括以下各步骤:
[0006] 1)通过频域法对目标图像作显著性检测,得到相应的像素显著度图,所述像素显 著度图与所述目标图像的像素位置信息一致;
[0007] 2)对所述的像素显著度图中的显著点,依据显著度进行排序;
[0008] 3)选取前N个显著点作为注视点,包含这些注视点的最小矩形范围作为注视区 域;
[0009] 4)对所述的注视区域内部像素进行随机采样,并对注视区域外部进行等量的像素 随机采样;采样得到的注视区域内部像素作为正样本,注视区域外部像素作为负样本; [0010] 5)利用支持向量机训练策略,训练得到一个二分类的SVM模型,通过该模型分类 所述目标图像的全部像素,将被分为正样本的像素区域作为第一注视目标区。
[0011] 采用本发明的方法,与现有技术相比,本发明具有以下优点:通过频域法进行显著 性检测,能够快速形成像素显著度图,该图与目标图像的像素位置信息一致,并根据显著度 予以排序,将选取的注视点所构成的最小矩形范围作为注视区域进行采样,与外部样本一 起进入神经网络,将显著度高的区域作为第一注视目标区,且可建立第一注视目标区的基 础上,再次扩大注视范围,形成相应的注视目标区,并与第一注视目标区进行比较,以判断 第一注视目标区的结果是否稳定。本发明根据人类视觉注视的过程,通过注视点排序和神 经网络模型,来仿真人类视觉,从而实现对目标场景快速有效注视和感知。
[0012] 作为改进,选取前N+M个显著点作为注视点,依照步骤3)形成注视区域,再经步骤 4)和5)得到相应的第二注视目标区;比较第一注视目标区和第二注视目标区的重叠程度, 重叠程度大则表明对目标的视觉感知强度大;重叠程度小则表明还未形成足够的对目标的 视觉感知强度,继续重复上述过程,直至达到足够的视觉感知强度,最终的注视目标区为上 述过程所有注视目标区的叠加。该设计能够加快视觉感知目标的生成与输出,并得到更为 稳定的注视目标区,注视的结果更为可靠。
[0013] 作为改进,获得注视目标区后,在目标图像和像素显著度图中该区域被清零,对更 新后的像素显著度图中的显著点,依据显著度再次排序,重复步骤3)、4)和5),得到新的注 视目标区,依次获得图像中的多个目标区。这样能够完成对整幅图像的有效信息进行注视 识别和读取,提高注视的准确性和完整度。
[0014] 作为改进,所述的频域法是指通过超复数傅立叶变换,将彩色图像中的红、绿、蓝 三个分量作为超复数的三个虚部参与傅立叶变换,只保留相位谱信息,经傅立叶反变换获 得像素显著度图。该设计用于解决现有技术仅能处理黑白图像识别的问题,有效地针对彩 色图像相应地改进了频域法的具体步骤。
【附图说明】
[0015] 图1为本发明仿真人类低层视觉的目标感知方法的流程图。
【具体实施方式】
[0016] 下面就具体实施例对本发明作进一步说明,但本发明并不仅仅限于这些实施例。
[0017] 本发明涵盖任何在本发明的精髓和范围上做的替代、修改、等效方法以及方案。为 了使公众对本发明有彻底的了解,在以下本发明优选实施例中详细说明了具体的细节,而 对本领域技术人员来说没有这些细节的描述也可以完全理解本发明。此外,本发明之附图 中为了示意的需要,并没有完全精确地按照实际比例绘制,在此予以说明。
[0018] 如图1所示,本发明的仿真人类低层视觉的目标感知方法,包括以下各步骤:
[0019] 1)通过频域法对目标图像作显著性检测,得到相应的像素显著度图,所述像素显 著度图与所述目标图像的像素位置信息一致;
[0020] 2)对所述的像素显著度图中的显著点,依据显著度进行排序;
[0021] 3)选取前N个显著点作为注视点,包含这些注视点的最小矩形范围作为注视区 域;选取最小矩形范围既能确保采样的精准,也能提高注视目标区的准确性和稳定性;
[0022] 4)对所述的注视区域内部像素进行随机采样,并对注视区域外部进行等量的像素 随机采样;采样得到的注视区域内部像素作为正样本,注视区域外部像素作为负样本;
[0023] 5)利用支持向量机训练策略,训练得到一个二分类的SVM模型,通过该模型分类 所述目标图像的全部像素,将被分为正样本的像素区域作为第一注视目标区。
[0024] 对于仿真人类视觉进行感知来说,图像相当于人类视觉所注视的场景,无论场景 大小,在视网膜上成像的范围的不变的,因而图像之于机器之于机器视觉也是如此。
[0025] 通过频域法对目标图像作显著性检测,可采用以下步骤实施:对待目标图像I(i, j)进行二维离散傅里叶变换F[I(i,j)],将图像由空间域转换到频域,得到相位P(u,v)信 息:
[0026] (1)
[0027] 式中F表示二维离散傅里叶变换,舛)表示相位运算。将相位信息经傅里叶逆变换 后,可以在空间域得到显著度图像Sa_Map。
[0028] Sa_Map(i,j) = | F 1 [exp {jP (u, v)} ] |2 (2)
[0029] 图I中,涉及训练数据、分类模型、结果等均为采用支持向量机(SVM)训练策略相 应实施过程。具体实施过程如下:
[0030] 设包含1个样本的训练集,Xi eC为输入向量,yke {-1,+1}为正负 类别标识。SVM首先要用训练集学习建模,目的是在特征空间寻找最优分类超平面,将测试 数据尽可能正确地分类。考虑一般情况,训练集为非线性可分时,先选择一个高斯径向基核 函数
[0031] K (X,Xi) = exp {-q I Ix-Xi I 12} (3)
[0032] 将训练集数据X1映射到一个高维线性特征空间中构造最优分类超平面。其中q为 径向基核函数参数,则分类器的判别函数为
[0033]

[0034] 训练过程是已知q等条件下,利用二次规划求解方法获得(4)式中的 b% a ^和支持向量(SV)作为训练得到的SVM模型;测试过程则是利用该SVM模型,将未知 的数据X代入(4)式,获得其预测类别。
[0035] SVM利用核函数技巧避免了传统学习算法面临的维数灾难问题。基
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1