一种基于stdf特征的人体行为识别算法

文档序号:9226057阅读:411来源:国知局
一种基于stdf特征的人体行为识别算法
【技术领域】
[0001] 本发明设及到视频处理的技术领域,尤其设及到一种基于STDF特征的人体行为 识别算法。
【背景技术】
[0002] 基于视频图像的行为识别在智能视频监控、视频检索、人机交互和智能家居等方 面有着广泛的应用。行为识别的主要任务是利用计算机对包含行人的图像序列进行分析, 从而识别人的动作。在基于计算机视觉的行为识别中,主要包括行为特征提取W及行为分 类两个步骤,目前,行为识别算法中使用的特征主要包括全局特征和局部特征两大类。
[0003] 在视频图像中不仅单幅图像空间中存在联系,帖与帖之间也相互关联,因此,在各 类特种中,时空体特征受到了学者广泛的关注。全局时空体特征主要W检测轮廓、边缘、光 流为主。局部时空体特征,主要W检测时空兴趣点为主。基于局部时空体兴趣点的动作表 示和识别的方法,首先从图像序列中提取能够代表行为的时空兴趣点,再使用兴趣点的特 征对运动进行表征,最后建立动作分类器进行动作识别。Laptev I首次提出时空体兴趣点 的检测,在Harris角点检测中加入时空信息。为了得到更加稠密的兴趣点,Dollar提出通 过构造一系列的1D G油or滤波器对图像序列进行Gaussian卷积,,从而检测局部最大的 化boids特征进行兴趣点的提取。Willems提出使用化ssian3D检测兴趣点,并且扩展SURF 描述子,更加有效的检测复杂的时空体兴趣点。由于时上述方法提取出的空体兴趣点较为 稀疏,Wang在综述了现有局部时空体特征后,提出采用稠密网格取样的方法进行行为识别 的识别率最高。
[0004] 通过检测局部时空体兴趣点和稠密取样的方式提取时空特征都有一定的局限性。 大部分时空体兴趣点是由2D空间的兴趣点检测器扩展而来,而该些2D的兴趣点检测器最 初是用于特征匹配,而并非用于数据分类。因此,提取时空体特征时需要对像素点进行逐 一的计算,特征提取的计算量较大,并且提取出的兴趣点较为稀疏,使用时空兴趣点作为特 征,描述性不强。相反,稠密取样可W提取大量的样本点,但是,稠密取样得到的样本点数量 巨大,对行为的表现力不强,同时引入了对于行为识别不必要背景信息。在复杂场景下,稠 密取样的识别效率低,效果不佳。

【发明内容】

[0005] 本发明的目的是为了克服现有技术的不足,提供了一种人体行为识别算法。
[0006] 本发明是通过W上技术方案实现:
[0007] 本发明提供了一种人体行为识别算法,该人体行为识别算法包括W下步骤:
[000引依据视频序列深度信息,提取对应的STDF特征;
[0009] 提取采样点STDF特征,依据LPM模型建立BoW模型;
[0010] 使用基于RBF核函数的SVM对建立的BoW中的数据进行分析得到结果。
[0011] 优选的,所述提取采样点STDF特征具体步骤为:
[0012] 根据视频序列深度信息求取运动显著性区域;
[0013] 确定显著性区域的区域活跃度;
[0014] 提取显著性区域的时空特征点。
[0015] 优选的,所述确定显著性区域的区域活跃度具体为;由视频的深度信息确定人体 的头部、四肢作为显著性区域;计算显著性区域的Lucas-Kanade光流特征,作为能量函数, 恒量该区域运动运动激烈程度。
[0016] 优选的,所述能量函数为计算所述显著性区域内像素点的流光之和。
[0017] 优选的,所述能量函数包括:
[0020] 其中Vi为区域内第i个像素点的光流矢量(V h,Viy) ; Ivil表示光流矢量的幅值, 区域内能量函数EK(n)值越大,则认为区域越活跃。
[0021] 本发明的有益效果是:算法依据运动剧烈区域在行为识别中提供更多判别信息的 思想,利用视频图像的深度信息确定人体运动显著性区域,通过计算区域内光流特征作为 度量区域活跃度的能量函数,依据能量函数对运动显著性区域进行高斯取样,使样本点分 布于运动剧烈区域。将采集到的样本点作为动作底层特征描述人体行为,结合BoW词袋模 型,采用SVM分类器对行为进行识别。实验数据表明,基于STDF特征的人体行为识别算法, 在SwustDepth数据集中平均行为识别准确率能够达到92%。
【具体实施方式】
[0022] 为了使本发明的目的、技术方案及优点更加清楚明白,W下结合实施例,对本发明 进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用W解释本发明,并不用 于限定本发明。
[0023] 本发明实施例提供了一种人体行为识别算法,该人体行为识别算法包括W下步 骤:依据视频序列深度信息,提取对应的STDF特征;
[0024] 提取采样点STDF特征,依据LPM模型建立BoW模型;
[0025] 使用基于RBF核函数的SVM对建立的BoW中的数据进行分析得到结果。
[0026] 优选的,所述提取采样点STDF特征具体步骤为:
[0027] 根据视频序列深度信息求取运动显著性区域;
[002引确定显著性区域的区域活跃度;
[0029] 提取显著性区域的时空特征点。
[0030] 优选的,所述确定显著性区域的区域活跃度具体为;由视频的深度信息确定人体 的头部、四肢作为显著性区域;计算显著性区域的Lucas-Kanade光流特征,作为能量函数, 恒量该区域运动运动激烈程度。
[0031] 优选的,所述能量函数为计算所述显著性区域内像素点的流光之和。
[0032] 优选的,所述能量函数包括:
[003引其中Vi为区域内第i个像素点的光流矢量(V h,Viy) ; |vi|表示光流矢量的幅值, 区域内能量函数EK(n)值越大,则认为区域越活跃。
[0036] 本实施例提供的算法依据运动剧烈区域在行为识别中提供更多判别信息的思想, 利用视频图像的深度信息确定人体运动显著性区域,通过计算区域内光流特征作为度量区 域活跃度的能量函数,依据能量函数对运动显著性区域进行高斯取样,使样本点分布于运 动剧烈区域。将采集到的样本点作为动作底层特征描述人体行为,结合BoW词袋模型,采 用SVM分类器对行为进行识别。实验数据表明,基于STDF特征的人体行为识别算法,在 SwustDepth数据集中平均行为识别准确率能够达到92%。
[0037] 为了方便对本实施例的理解,下面结合具体的实施例进行详细的说明。
[003引A1 ;建立LPM模型;,对于一个大小为2W*2H*2T的视频Vp,对其进行降采样,得到 一个大小为W*H*2T,分辨率为原视频一半的视频V,,使用不同尺度的滑动窗口在视频V,中, 提取粗略3D局部时空块,作为"root"时空块。而对于每一个"root"时空块都有8个对应 从Vp中提取的高分辨率的"parts"特征。此模型,旨在建立BoW模式时,使提取的时空块 特征包含空间结构信息和时间顺序信息。
[0039] A2;提取 STDF 特征;
[0040] A21基于深度信息的显著性区域确定
[0041] 利用可见光图像的行为识别,常遭遇光照变化、阴影、物体遮挡W及环境变化等因 素的干扰。深度图像仅与CCD到物体表面的距离有关。因此,深度图像具有颜色无关性,不 会遇到光照、阴影、环境变化等因素的影响。其次,根据距离很容易确定人体的不同区域。将 前景与背景W及前景中人的不同区域分割出来。
[0042] 算法中,使用Jamie Shotton提出的随机森林算法,估计人体不同的区域。首先, 使用场景的深度信息,由远到近的分析每个像素,确定最可能为人体的区域,再通过边缘检 巧版术确定区域,获取人体的完整轮廓,将前景中的人分割出来。然后根据分割出人体身体 的区域,识别人体轮廓区域内的各个身体部位。实验中使用Kinect同时获取颜色和深度 信息,通过深度信息获取人体部位的随机森林模型,利用mean shift算法预测各部位节点。 使用深度信息,粗略确定
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1