基于局部评估和全局优化的注视点检测方法与流程

文档序号：12468512阅读：来源：国知局

技术特征：

1.基于局部评估和全局优化的注视点检测方法，其特征在于，步骤如下：

(1)提取待检测图像上存在物体的区域，以检测到的候选目标作为后续处理的基本单位；

(2)利用微调后的卷积神经网络提取候选目标的深度特征；

(3)局部评估的总体训练：根据候选目标的深度特征评估该区域受注视的程度，采用自顶向下的监督学习方式训练分类器，评判每一个候选目标是人眼注视区域的可能性；首先，根据注视点信息的真值，从训练集图像的候选框中挑出训练样本框；然后，利用训练集图像的样本框的深度特征训练支持向量机SVM；在测试阶段，把测试集图像的候选目标输入支持向量机，得到对应的评估分数；

(4)局部评估的具体训练：采用半耦合字典学习(SCDL)算法，实现一张图像对应一个分类器；给定一张图像I，通过卷积神经网络得到其深度特征x_I；再从图像I中选取100个正负样本训练SVM，得到SVM的权重向量w_I；对于训练集图像S，候选目标特征集合为其中每一列代表一张图像的深度特征，d为特征向量维数，N为数据库中图像个数；对应的SVM权重向量集合为分别定义为特征字典、权重字典、映射字典；k是字典大小；那么，字典的联合优化问题的公式如下：

$<mrow> <munder> <mi>min</mi> <mrow> <mo>{</mo> <mrow> <msub> <mi>D</mi> <mi>X</mi> </msub> <mo>,</mo> <msub> <mi>D</mi> <mi>W</mi> </msub> <mo>,</mo> <mi>M</mi> </mrow> <mo>}</mo> </mrow> </munder> <mi>Φ</mi> <mrow> <mo>(</mo> <msub> <mi>D</mi> <mi>X</mi> </msub> <mo>,</mo> <msub> <mi>D</mi> <mi>W</mi> </msub> <mo>,</mo> <mi>M</mi> <mo>,</mo> <msub> <mi>Λ</mi> <mi>X</mi> </msub> <mo>,</mo> <msub> <mi>Λ</mi> <mi>W</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>$

Φ＝E_data(D_X,X^S)+E_data(D_W,W^S)+E_map(M)+E_reg(Λ_X,Λ_W,M,D_X,D_W) (2)

上式中Λ_X和Λ_W代表编码系数，E_data(·,·)代表重构误差，E_map(·)代表映射误差项，E_reg(·)是编码系数，映射矩阵和字典的正则项；通过求解，根据其深度特征得到对应的SVM，实现对待检测图像的具体评估任务；

(5)对局部评估得到的结果使用proposal子集优化算法：删除空间位置上孤立的高分框，保留空间位置密集高分框，通过减少离群值增加局部评估的置信度；进一步将密集高分框聚类，原则如下：

1)聚类个数尽可能低；

2)同一类中的候选目标尽可能重叠，且尽可能相似；

3)不同类的聚类中心重叠越低越好；

(6)设计新的特征训练回归模型对受注视程度进行预测，新特征包括候选目标的全局对比度、边界对比度、局部评估的分数；在算法总体框架上，采用局部评估与全局优化两个阶段，分别体现候选目标的自身特征和所处的图像上下文环境。

2.根据权利要求1所述的注视点检测方法，其特征在于，步骤(1)提取方式采用edge boxes算法。

完整全部详细技术资料下载

当前第2页1 2 3