基于局部评估和全局优化的注视点检测方法与流程

文档序号:12468512阅读:来源:国知局

技术特征:

1.基于局部评估和全局优化的注视点检测方法,其特征在于,步骤如下:

(1)提取待检测图像上存在物体的区域,以检测到的候选目标作为后续处理的基本单位;

(2)利用微调后的卷积神经网络提取候选目标的深度特征;

(3)局部评估的总体训练:根据候选目标的深度特征评估该区域受注视的程度,采用自顶向下的监督学习方式训练分类器,评判每一个候选目标是人眼注视区域的可能性;首先,根据注视点信息的真值,从训练集图像的候选框中挑出训练样本框;然后,利用训练集图像的样本框的深度特征训练支持向量机SVM;在测试阶段,把测试集图像的候选目标输入支持向量机,得到对应的评估分数;

(4)局部评估的具体训练:采用半耦合字典学习(SCDL)算法,实现一张图像对应一个分类器;给定一张图像I,通过卷积神经网络得到其深度特征xI;再从图像I中选取100个正负样本训练SVM,得到SVM的权重向量wI;对于训练集图像S,候选目标特征集合为其中每一列代表一张图像的深度特征,d为特征向量维数,N为数据库中图像个数;对应的SVM权重向量集合为分别定义为特征字典、权重字典、映射字典;k是字典大小;那么,字典的联合优化问题的公式如下:

<mrow> <munder> <mi>min</mi> <mrow> <mo>{</mo> <mrow> <msub> <mi>D</mi> <mi>X</mi> </msub> <mo>,</mo> <msub> <mi>D</mi> <mi>W</mi> </msub> <mo>,</mo> <mi>M</mi> </mrow> <mo>}</mo> </mrow> </munder> <mi>&Phi;</mi> <mrow> <mo>(</mo> <msub> <mi>D</mi> <mi>X</mi> </msub> <mo>,</mo> <msub> <mi>D</mi> <mi>W</mi> </msub> <mo>,</mo> <mi>M</mi> <mo>,</mo> <msub> <mi>&Lambda;</mi> <mi>X</mi> </msub> <mo>,</mo> <msub> <mi>&Lambda;</mi> <mi>W</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

Φ=Edata(DX,XS)+Edata(DW,WS)+Emap(M)+EregXW,M,DX,DW) (2)

上式中ΛX和ΛW代表编码系数,Edata(·,·)代表重构误差,Emap(·)代表映射误差项,Ereg(·)是编码系数,映射矩阵和字典的正则项;通过求解,根据其深度特征得到对应的SVM,实现对待检测图像的具体评估任务;

(5)对局部评估得到的结果使用proposal子集优化算法:删除空间位置上孤立的高分框,保留空间位置密集高分框,通过减少离群值增加局部评估的置信度;进一步将密集高分框聚类,原则如下:

1)聚类个数尽可能低;

2)同一类中的候选目标尽可能重叠,且尽可能相似;

3)不同类的聚类中心重叠越低越好;

(6)设计新的特征训练回归模型对受注视程度进行预测,新特征包括候选目标的全局对比度、边界对比度、局部评估的分数;在算法总体框架上,采用局部评估与全局优化两个阶段,分别体现候选目标的自身特征和所处的图像上下文环境。

2.根据权利要求1所述的注视点检测方法,其特征在于,步骤(1)提取方式采用edge boxes算法。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1