一种图像特征提取方法及行人检测方法及装置的制造方法

文档序号:9433079阅读:1036来源:国知局
一种图像特征提取方法及行人检测方法及装置的制造方法
【技术领域】
[0001] 本发明涉及图像处理领域,具体涉及一种图像特征提取方法及行人检测方法。
【背景技术】
[0002] 图像信息的应用日益广泛,图像特征的提取成为关键技术之一。图像特征表达的 是否合适,对图像检测、识别的结果具有重要的影响。例如,对行人进行准确可靠的检测是 许多基于行人的计算机视觉和模式识别应用中的重要环节,例如视频监控、辅助驾驶、自动 机器人导航等等。得益于强有力的特征表示、鲁棒的行人建模方法和有效的检测策略,当前 的行人检测技术不论在精度上还是速度上都取得了显著的进步,其性能在过去数十年来已 经提高了约两个数量级,而这些进步很大程度上得益于更好和更有效的特征表示。通过比 较不同的检测方法,其背后最重要的原因之一就是所采用的特征表示方法得到了极大的丰 富和加强,例如,更有鉴别力的信息、更多的特征种类、更细的尺度划分、增强的归一化方法 等等。因此在行人检测方法框架的各个组成部分中,特征扮演着很重要的角色。
[0003] 但是目前的情况是,一方面由于行人不同的衣着、姿态、遮挡、光照、复杂背景所引 起的行人外貌的巨大变化,使得想要取得理想的检测结果仍然具有极大的难度和挑战性; 另一方面,现有的主流特征,绝大多数都是人工设计的。以最为流行的HOG特征为例,它是 Dalal 等人在文献"Histograms of Oriented Gradients for Human Detection" 中提出 的,它有很多地方都是人为设计的,比如固定的9个梯度方向、4种归一化方式等,都是为了 达到更好的精度和速度而人为调校过。因此,尽管HOG特征已成功应用到许多检测方法中, 但它只是基于图像中的梯度信息,对图像中更丰富模式的表示能力有限。另外,这些经过人 工设计的特征通常只是对特定问题或任务进行了优化,因此很难对新问题或新任务做到普 适。
[0004] 近期,一种新的特征提取方式开始越来越多地被注意和使用,即利用手头现有的 训练数据自动学习相应的特征,以使得到的特征具有更好的表示丰富信息的能力,同时去 除特征提取过程中人为设计所带来的缺陷,因为低层特征可以进行人工设计,但能够表示 更丰富信息的更高层次特征就难以进行人工设计了。Sermanet等人在文献"Pedestrian Detection with Unsupervised Multi-Stage Feature Learning',中提出了 一种卷积 神经网络模型来学习多阶段的特征。Ouyang等人在文献"Joint Deep Learning for Pedestrian Detection"中也提出了一种深度学习框架来进行特征学习,并且同时优化特 征学习、行人模型和分类方法。Ren等人在文献"Histograms of Sparse Codes for Object Detection"中提出了一种新的特征叫做稀疏编码直方图(HSC),此特征基于图像的稀疏表 示,通过稀疏编码算法学习得到。通过与经典的HOG特征相比较,作者在目标检测实验中证 明了这种特征的有效性。然而,这种特征提取方法也存在以下不足:(1)其特征是直接基于 低层图像像素来进行学习的,因而对于图像中丰富模式的表示能力有限;(2)其特征是通 过简单的标准稀疏编码算法学习得到的,只能保证最小的重建误差,鉴别能力有限。

【发明内容】

[0005] 因此,本发明要解决的技术问题在于克服现有技术中的图像特征基于低层图像像 素提取、鉴别能力有限的缺陷,从而提供一种图像特征提取方法及行人检测方法。
[0006] 本发明提供一种图像特征提取方法,包括如下步骤:
[0007] 获取目标图像中的图像中层特征;
[0008] 获取隐含语义特征的初始值;
[0009] 根据所述图像中层特征和隐含语义特征的初始值分别确定重建误差约束项、稀疏 性约束项和鉴别力约束项;
[0010] 根据重建误差约束项、稀疏性约束项和鉴别力约束项,确定隐含语义特征。
[0011] 优选地,所述根据重建误差约束项、稀疏性约束项和鉴别力约束项,确定隐含语义 特征的步骤包括:
[0012] 确定重建误差约束项、稀疏性约束项和鉴别力约束项的求和最小值,公式如下:
[0013] minM+AiB+AJ' }
[0014] 其中,A为重建误差约束项,B为稀疏性约束项,Γ为鉴别力约束项,A1S第一比 例因子,λ 2为第二比例因子;
[0015] 获取所述求和最小值对应的隐含语义特征。
[0016] 优选地,所述根据重建误差约束项、稀疏性约束项和鉴别力约束项,确定隐含语义 特征的步骤包括:
[0017] 确定重建误差约束项、稀疏性约束项和鉴别力约束项的乘积最小值,公式如下:
[0018] min{A*A3B*A4J,}
[0019] 其中,A为重建误差约束项,B为稀疏性约束项,Γ为鉴别力约束项,人3为第三比 例因子,λ4为第四比例因子;
[0020] 获取所述乘积最小值对应的隐含语义特征。
[0021] 优选地,所述重建误差约束项为:
[0023] 其中,y表示所述的图像中层特征,X表示所述的隐含语义特征,i表示第i个,X1表示第i个隐含语义特征,yi表示第i个图像中层特征,N表示特征向量的维数,D表示稀 疏编码基础字典,
表示根据字典D和隐含语义特征X对中层特征y进行 重建后的误差,此项取值越小表明重建误差越小。
[0024] 优选地,所述稀疏性约束项为:
[0026] 其中,X表示所述的隐含语义特征,X1表示第i个隐含语义特征,N表示特征向量 的维数
表示隐含语义特征的稀疏性,即特征向量中非零元素的个数,此项取值 越小表明特征向量的稀疏性越高,即其中非零元素的个数越少。
[0027] 优选地,所述鉴别力约束项为:
[0028] J1 =tr (Sw-Sb) CN 105184260 A 说明书 3/15 页
[0029] 其中,
表示不同类别之间的散布矩阵,
表示每个类别内部的散布矩阵,C1表示类别,p i分别为类别C1的先验概率,
分别为类别C1的样本均值向量,
^为所有类别中样本的总 均值向量, _
分别为类别(^的协方差矩阵,tr (Sw-Sb)表示 所有类别内部的散布程度与不同类别之间的散布程度的差值,此项取值越小表明每个类别 内部的散度越小,而不同类别之间的距离越大,因而分类鉴别力越强。
[0030] 优选地,根据重建误差约束项、稀疏性约束项和鉴别力约束项,确定隐含语义特征 的过程,还包括
[0031] 更新稀疏编码基础字典和隐含语义特征;
[0032] 通过更新的隐含语义特征和稀疏编码基础字典计算新的重建误差约束项、稀疏性 约束项和鉴别力约束项;
[0033] 反复循环迭代此过程以获得多组重建误差约束项、稀疏性约束项和鉴别力约束 项。
[0034] 此外,本发明还提供一种行人检测的方法,包括如下步骤:
[0035] 针对每个训练样本提取基础特征;
[0036] 根据所述基础特征获取所述隐含语义特征;
[0037] 根据所述隐含语义特征建立行人检测模型;
[0038] 获取待测样本;
[0039] 根据所述行人检测模型对所述待测样本进行检测,输出检测结果。
[0040] 本发明技术方案,具有如下优点:
[0041] 1.本发明提供的图像特征提取方法,首先,获取目标图像中的图像中层特征,然后 获取隐含语义特征的初始值,并根据所述图像中层特征和隐含语义特征的初始值分别确定 重建误差约束项、稀疏性约束项和鉴别力约束项;最后根据重建误差约束项、稀疏性约束项 和鉴别力约束项,确定隐含语义特征。由于重建误差约束项、稀疏性约束项和鉴别力约束项 分别从不同方面约束了隐含语义特征的表示能力和鉴别力,使得所述隐含语义特征具有更 强的表示能力和分类鉴别力,该方案考虑到更高层次的语义信息和更强有力的鉴别力信息 也是决定特征性能的关键因素,通过同时优化所提出的隐含语义特征学习问题和最大鉴别 力约束获得了一种包含信息更加丰富、鉴别力更强的特征,从而能取得更高的行人检测的 准确率。
[0042] 2.本发明提供的图像特征提取方法,根据重建误差约束项、稀疏性约束项和鉴别 力约束项确定隐含语义特征,采用求和或求积最小的方式来进行优化,从而获得隐含语义 特征,使得其综合了重建误差约束项、稀疏性约束项和鉴别力约束项的影响,增强该隐含语 义特征的鉴别力。
[0043] 3.本发明还提供一种行人检测的方法,用于使用所述隐含语义特征进行行人检 测,由于隐含语义特征具有更高的鉴别能力,将隐含语义特征学习建模为一种特定的稀疏 编码问题,其中字典和稀疏编码系数均基于图像的中层表示(词包模型)优化得到,使得学 习出的特征具有更高层次的丰富语义信息,以及应对图像变化的更好鲁棒性;同时,在特征 学习阶段直接加入鉴别性信息,通过在上述隐含语义特征学习问题中引入鉴别力约束项, 使得学习得到的特征如果来自于同一类别则相互靠近,来自于不同类别则相互疏远,因而 具备更强的分类鉴别力,最终能够有效提高行人检测的准确性。
【附图说明】
[0044] 为了更清楚地说明本发明【具体实施方式】或现有技术中的技术方案,下面将对具体 实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的 附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1