基于压缩感知分类的目标感知方法_2

文档序号:9304821阅读:来源:国知局
(f) (6)
[0037] 通过傅里叶逆变换,可以在空间域得到显著度图像。
[0038]S(x) =iF'texptRCD+jPCf)}] |2 (7)
[0039] 显著度图上每点的值表示该位置的显著度。考虑到人眼视觉的局部成组效应,为 了消除少数孤立的显著点,得到更好的视觉效果,我们在得到S(x)后再用平均滤波器进行 一次平滑,得到最终的显著度图Z(x)。
[0040]Z(x) =S(x)*hn(f) (8)
[0041] 谱残差算法对像素的操作是一种批处理,算法简单、快速、易实现,且对于噪声具 有一定的鲁棒性。
[0042] 图1中,涉及训练数据、分类模型、完备字典、结果等均为采用压缩感知分类器训 练策略相应实施过程。利用压缩感知分类器策略,得到一个二分类的像素分类模型,具体实 施过程如下:
[0043] 1)建立训练样本矩阵
[0044] 压缩感知分类技术的核心可简述为:用训练样本的基矩阵来获得测试样本的线性 表示。首先依据正负两类像素样本的特征向量构成训练样本矩阵,即:
[0045] B= [B1B2B3. . .Bv] (9)
[0046] 其中,v为训练样本个数,矩阵B被称为完备字典。
[0047] 2)对测试样本进行稀疏分解
[0048] 将测试样本像素z表示为关于B的线性表示,即下式,
[0049] z=BPhi (j〇)
[0050] 其中,z在B中各训练样本上的投影系数为
[0051] Pn, (11)
[0052] 由压缩感知和稀疏表示理论可以得出,若凡,是稀疏的,则可通过LI范数意义下的 最小化过程来求解,如下式,
[0053]
(12)
[0054] 因此,当已知z和B的情况下,可依据公式(12)做L1范数意义下的稀疏化矩阵分 解。理想情形下,测试样本z在它所属的类别上的投影系数不为零,而在其他类别上的投影 系数均为零。
[0055] 3)对测试样本进行分类识别
[0056] 假设z属于第j类,则只用凡,=[凡…凡,"-凡]中的第j类样本 的投影系数/^=[/?/,^,,2^^ /,",7]来重构一次测试样本%
[0057]
(13)
[0058] 求测试样本z与重构样本%的最小残差对应的类别,即被测样本的预测类别。
[0059]
(14)
[0060] 压缩感知分类的优点是:a)不过分依赖于参数模型,有效避免了由于知识的不精 确和不完整带来的误差。b)算法无需对分类器进行训练,直接用训练样本作为完备字典,降 低了对程序与设备的需求,可加快程序运行速度。
[0061] 为了优化本发明,采用分类器多次分类像素方式获得稳定的注视目标区。框图中 则体现为判断是否存在稳定的输出。因此需要形成进一步的目标区:
[0062] 选取前N+M个显著点作为注视点,依照步骤3)形成注视区域,再经步骤4)和5) 得到相应的第二注视目标区;比较第一注视目标区和第二注视目标区的重叠程度,重叠程 度大则表明对目标的视觉感知强度大;重叠程度小则表明还未形成足够的对目标的视觉感 知强度,继续重复上述过程,直至达到足够的视觉感知强度,最终的注视目标区为上述过程 所有注视目标区的叠加。
[0063] 获得注视目标区后,在目标图像和像素显著度图中该区域被清零,对更新后的像 素显著度图中的显著点,依据显著度再次排序,重复步骤3)、4)和5),得到新的注视目标 区,依次获得图像中的多个目标区。这样便可从图中分割出所有有效注视区域的信息,构建 了模拟人类视觉的机器视觉。
[0064] 所述的谱残差法是指目标图像通过二维傅立叶变换后,只保留幅度谱残差和相位 谱信息,经傅立叶反变换获得像素显著度图。然而原谱残差法对图像尺度变化比较敏感,检 测得到的显著图随图像尺度变化而改变。为了克服这种问题,一种改进策略是通过扰动源 图像尺度,得到同一源图像在不同尺度下的k个显著度图;再将这些显著度图缩放到同一 尺度进行叠加,具体如下式:
[0065]
(15)
[0066] 根据统计学原理,若图像中存在随机噪声,则显著图叠加可明显降低噪声影响,增 加显著度高区域的信噪比。
[0067] 以上仅就本发明较佳的实施例作了说明,但不能理解为是对权利要求的限制。本 发明不仅局限于以上实施例,其具体结构允许有变化。总之,凡在本发明独立权利要求的保 护范围内所作的各种变化均在本发明的保护范围内。
【主权项】
1. 一种基于压缩感知分类的目标感知方法,其特征在于:包括以下步骤: 1) 通过谱残差法对目标图像作显著性检测,得到相应的像素显著度图,所述像素显著 度图与所述目标图像的像素位置信息一致; 2) 对所述的像素显著度图中的显著点,依据显著度进行排序; 3) 选取前N个显著点作为注视点,包含这些注视点的最小矩形范围作为注视区域; 4) 对所述的注视区域内部像素进行随机采样,并对注视区域外部进行等量的像素随机 采样;采样得到的注视区域内部像素作为正样本,注视区域外部像素作为负样本; 5) 利用压缩感知分类器策略,得到一个二分类的像素分类模型,通过该模型分类所述 目标图像的全部像素,将被分为正样本的像素区域作为第一注视目标区。2. 根据权利要求1所述的基于压缩感知分类的目标感知方法,其特征在于:选取前N+M 个显著点作为注视点,依照步骤3)形成注视区域,再经步骤4)和5)得到相应的第二注视 目标区; 比较第一注视目标区和第二注视目标区的重叠程度,重叠程度大则表明对目标的视觉 感知强度大;重叠程度小则表明还未形成足够的对目标的视觉感知强度,继续重复上述过 程,直至达到足够的视觉感知强度,最终的注视目标区为上述过程所有注视目标区的叠加。3. 根据权利要求1所述的基于压缩感知分类的目标感知方法,其特征在于:获得注视 目标区后,在目标图像和像素显著度图中该区域被清零,对更新后的像素显著度图中的显 著点,依据显著度再次排序,重复步骤3)、4)和5),得到新的注视目标区,依次获得图像中 的多个目标区。4. 根据权利要求1或2所述的基于压缩感知分类的目标感知方法,其特征在于:所述 的谱残差法是指目标图像通过傅立叶变换,只保留幅度谱残差和相位谱信息,经傅立叶反 变换获得像素显著度图;并通过扰动源图像尺度,得到同一源图像在不同尺度下的多个显 著度图,再将这些显著度图缩放到同一尺度进行叠加。
【专利摘要】本发明公开了一种基于压缩感知分类的目标感知方法,包括以下各步骤:1)通过谱残差法对目标图像作显著性检测,得到相应的像素显著度图;2)对所述的像素显著度图中的显著点,依据显著度排序;3)选取前N个显著点作为注视点,包含这些注视点的最小矩形范围作为注视区域;4)对所述的注视区域内部像素进行随机采样,并对注视区域外部进行等量的像素随机采样;5)利用压缩感知分类器策略,得到一个二分类的像素分类模型,通过该模型分类所述目标图像的全部像素,将被分为正样本的像素区域作为第一注视目标区。本发明根据人类视觉注视的过程,通过注视点排序和像素分类模型,来模拟人类视觉,对目标场景作快速有效注视,实现机器对目标场景的视觉感知。
【IPC分类】G06K9/62, G06K9/46
【公开号】CN105023016
【申请号】CN201510377145
【发明人】潘晨
【申请人】中国计量学院
【公开日】2015年11月4日
【申请日】2015年6月25日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1