一种图像特征提取方法及行人检测方法及装置的制造方法_3

文档序号:9433079阅读:来源:国知局
] 其中Λ= {A1, \2}是一组优化参数,用以平衡重建误差
I、稀疏 程度
与鉴别力约束Γ。通过求解此优化问题,就可以得到基于鉴别力增强的 隐含语义特征表示。
[0102] 由于目标函数
对于D和X同时 来说并不是一个凸函数,本方案中采用一种有效的算法来交替优化D和X,优化求解算法包 含两个主要步骤:稀疏编码和字典更新。对于稀疏编码步骤,采用了一种迭代贪婪方法来解 决这个问题:第一步是从字典D中挑选出一个原子,使得只利用这个原子作为字典进行稀 疏分解而得到的所有样本的稀疏编码能够保证目标函数F取得最小值。假设用于进行稀疏 分解的字典D中的原子集合为△,则稀疏编码可以由标准正交匹配追踪或基追踪方法计算 得到:
[0104] 其中Da是只由在集合△中的原子所组成的字典子集。类似地,在接下来的步骤 中,我们每次从字典D剩余的原子中再挑出一个原子,将其与上一步骤中已有的原子组成 新的原子集合,使得利用这个原子集合作为字典进行稀疏分解而得到的稀疏编码能够保证 目标函数F取得最小值,如此循环反复不停地更新所选的原子集合,直到达到设定的终止 条件。这里终止条件可以是预先设定好的用于进行稀疏分解的原子数目,也可以当目标函 数F的取值不再减小时即终止。对于字典更新步骤,采用标准K-SVD算法中的字典更新方法 来进行计算,这样,通过交替迭代稀疏编码和字典更新步骤,就可以有效求解此优化问题, 最终得到基于鉴别力增强的隐含语义特征表示。
[0105] 与现有方法相比,该方案考虑到更高层次的语义信息和更强有力的鉴别力信息也 是决定特征性能的关键因素,通过同时优化所提出的隐含语义特征学习问题和最大鉴别力 约束获得了一种包含信息更加丰富、鉴别力更强的特征,从而能取得更高的行人检测准确 率。
[0106] 本方案之所以具有上述效果,其原因在于:将隐含语义特征学习建模为一种特定 的稀疏编码问题,其中字典和稀疏编码系数均基于图像的中层表示(词包模型)优化得到, 使得学习出的特征具有更高层次的丰富语义信息,以及应对图像变化的更好鲁棒性;同时, 在特征学习阶段直接加入鉴别性信息,通过在上述隐含语义特征学习问题中引入鉴别力约 束项,使得学习得到的特征如果来自于同一类别则相互靠近,来自于不同类别则相互疏远, 因而具备更强的分类鉴别力,最终能够有效提高行人检测的准确性
[0107] 实施例3
[0108] 本实施例提供一种行人检测的方法,将实施例1中的图像特征提取方法应用于行 人检测中,如图2所示,包括如下步骤:
[0109] S11、针对每个训练样本提取基础特征。与实施例2中相同,不再赘述。
[0110] S12、获取所述基础特征的所述隐含语义特征,提取方式与实施例1和2相同,此处 不再赘述。
[0111] S13、根据所述隐含语义特征建立行人检测模型。
[0112] 得到所述的训练样本的隐含语义特征X后,本方案中按照类似于HOG特征的方式 将这些隐含语义特征在规则图像单元中统计成直方图的形式,具体地,对于X中每个不为 零的Xi,采用双线性插值方法将其绝对值IxiI分配给四个与其空间相邻的单元之一。这样 在每个图像单元中,通过对局部邻域内的值进行平均,就可以得到一个稠密特征向量FV,最 后再对FV进行L2归一化,以减少特征对于图像对比度的依赖,并增强其鲁棒性。基于这些 特征,本发明中采用一定深度的决策树作为弱分类器,并将若干个弱分类器通过级联的方 式合并为一个强分类器,用以判断样本是否为行人。
[0113] 采用Adaboost算法实现对弱分类器的迭代优化,和级联合并增强。具体地, Adaboost算法执行T轮选择,每一轮中选择一个分类误差最小的弱分类器,并计算相应的 权重。最终,Adaboost算法可以通过线性加权融合T个选择出来的弱分类器得到一个最终 的强分类器。在此方式下,只有当样本依次通过了所有弱分类器的检验,才会被判别为行人 正例,而只要未通过其中任何一个分类器的检验,则会被判别为负例。
[0114] S14、获取待测样本。对于输入的待检测图像,利用滑动窗检测策略将其分为许多 重叠的窗口作为候选行人区域。
[0115] S15、根据所述行人检测模型对所述待测样本进行检测,输出检测结果。
[0116] 对于每个候选行人区域使用所述的分类器判断其是否包含行人,最后使用非极大 值抑制方法去除重复的窗口以得到最终的检测结果。
[0117] 本实施例中行人检测方法,在特征学习阶段直接加入鉴别性信息,通过在上述隐 含语义特征学习问题中引入鉴别力约束项,使得学习得到的特征如果来自于同一类别则相 互靠近,来自于不同类别则相互疏远,因而具备更强的分类鉴别力,最终能够有效提高行人 检测的准确性。
[0118] 实施例4:
[0119] 本实施例中提供一种行人隐含语义特征的提取方法及基于该方法的行人检测方 法,其流程如图3所示,具体包含以下步骤:
[0120] (1)将行人检测数据库分为训练集和测试集,并分别对每个样本提取基础特征。其 中,训练集用于建立分类器,分类器通过隐含语义特征来训练,测试集用于对分类器的分类 效果进行验证。
[0121] 本实施例中,对每个样本首先以固定步长(例如3个像素)为间隔提取稠密SIFT 特征描述子,然后采用k-means聚类算法将这些特征描述子量化为基于词包模型的固定维 数(例如512维)直方图作为样本的基础特征。具体可以描述为:给定一个视觉特征的字 典
其中M为字典的维数,w为字典中的视觉关键词,则每个样本可以表示为 一个基于视觉词包模型的直方图Rreq(Wi) :i = 1,2,. . .,M},其中freq(Wi)为视觉关键词 W1在每个样本中出现的频率。
[0122] (2)基于所述的基础特征进行隐含语义特征学习。
[0123] 步骤(1)中对每个样本提取的基础特征直方图,可以看作是样本的一种中层表 示,我们的目标是通过发掘中层特征之间的隐含关系,从视觉字典V中进一步学习得到一 组含有更高层次信息的隐含语;
其中K < M,表示学习得到的更高层次的图 像特征更加紧凑。具体地,此隐含语义特征学习问题可以建模为如下一个特殊的稀疏编码 问题。
[0124] 将每个图像中层特征记为一个向量yn= {freq(w ;)} e RM,其中η = 1,2, · · ·,N, 则可以得到原始的特征表示为Y = [yp y2, . . .,yN] e Rmxn。给定一个包含K个元素的字 典D= [dpcU.ddJ eRMXK,其中每个元素代表着一个更高层次的特征表示,则每个中层 特征Y1可以通过稀疏编码算法转换为一个K维的编码,且是一个大部分元素为零的稀疏编 码。上述对应优化问题可以具体定义为:
[0126] 其中X = [XpX2,...,xN] e RkxnSy的一组稀疏编码,I |x」I1S L为稀疏约束项, L为预先设定好的稀疏程度。若将稀疏约束项引入到目标函数中,则其可以重新定义为:
[0128] 其中第一项为重建误差约束,第二项为稀疏约束。λ >〇为一个标量优化参数,用 以平衡重建误差与稀疏程度。
[0129] 为了进一步增强所学特征的分类鉴别力,我们希望来自于相同类别的样本表示为 特征后能够保持相互靠近,而来自于不同类别的样本则相互疏远。因此,在特征学习过程 中,不同类别之间的距离应该尽量最大化。为了达到这个目的,本实施例中采用如下的最大 间隔准则作为鉴别力约束项:
[0131] 其中?1和P 分别为类别C种C ,的先验概率,d(C p C,)为两个类别CjP C ,之间 的距离(间隔),具体定义如下:
[0132] d (Ci,Cj) = d (IIii,m.j) tr (Si) -tr (Sj)
[0133] 其中叫和m j分别为类别C JP C j的样本均值向量:

;而SjP S j分别为类别C JP C j的协方差矩阵:

而tr (Si)和tr (Sj分别是 矩阵SjPS,的迹,描述了每个类别中样本的散布程度。这里采用欧氏距离作为(Km1, m])的 衡量标准,则最大间隔准则可以简化为如下形式:
[0134] J = tr (Sb-Sw)
[0135] 其中SjP Sw分别表示不同类别之间的散布矩阵和每个类别内部的散布矩阵,具体 为
为所 有类别中样本的总均值向量。
[0136] 最后,将最大化函数J的问题转换为一个等同的最小化函数J'的问题:
[0137] J1 =tr (Sw-Sb)
[0138] 然后将这个鉴别力约束项加入上述的目标函数,就可以得到一个新的基于鉴别力 增强的隐含语义特征学习问题:
[0140] 其中Λ= {λρ λ2}是一组优化参数,用以平衡重建误差
,稀疏 程度
与鉴别力约束Γ。通过求解此优化问题,就可以得到基于鉴别力增强的隐 含语义特征表示。
[0141] 由于目标函数
对于D和X同时来 说并不是一个凸函数,本实施例中采用一种有效的算法来交替优化D和X,优化求解算法包 含两个主要步骤:稀疏编码和字典更新。对于稀疏编码步骤,采用了一种迭代贪婪方法来解 决这个问题:第一步是从字典D中挑选出一个原子,使得只利用这个原子作为字典进行稀 疏分解而得到的所有样本的稀疏编码能够保证目标函数F取得最小值。假设用于进行稀疏 分解的字典D中的原子集合为△,则稀疏编码可以由标准正交匹配追踪或基追踪方法计算 得到:
[0143] 其中Da是只由在集合△中的
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1