基于视频技术的人体动作视频识别方法与流程

文档序号：16250795发布日期：2018-12-12 00:01阅读：201来源：国知局

本发明涉及视频识别技术领域，特别涉及一种基于视频技术的人体动作视频识别方法。

背景技术：

随着互联网及数码设备的日益普及,视频的内容分析和处理受到各界的广泛关注。其中，基于视频的人体动作识别方法在近年来被广泛应用于各个领域，成为热门的研究方向。但是该研究方向还存在许多挑战，比如较大的人体动作的自由度、拍摄的背景环境差异、相机的移动和缩放、拍摄角度变化、视频中的噪声和遮挡等，都会对识别的准确性造成影响。目前这对人体动作的视频表示方法包括：1)基于全局特征描述的方法和基于局部特征描述的方法；在图像中运用背景减除或目标跟踪的方式定位到运动的人体，进而提取人体的特征来对图像序列进行表示。这种表示方式能够囊括图像序列的大部分信息，因此，对图像的描述比较准确；但基于全局特征描述的方法还存在很多缺陷：如过分依赖精确的定位、背景减除和跟踪技术，当运动背景较复杂，或对运动物体的跟踪不精确时，都会影响运动人体的提取，进而影响动作的描述；并且其对视角的变化、噪声和遮挡等干扰更敏感。基于局部特征描述的表示方法则将观察部分表示为一系列独立单元的集合，这类方法对于噪声和部分遮挡不敏感，并没有严格要求使用背景消除或跟踪算法。但是，该方法需要在图像或视频中提取足量的感兴趣点。

技术实现要素：

本发明的目的在于解决现有技术中存在的上述技术问题，提供一种基于视频技术的人体动作视频识别方法，其基于判别性区域提取方法，可有效提高识别准确率，并可有效消除复杂背景的干扰。

为解决上述技术问题，本发明采用的技术方案如下：

基于视频技术的人体动作视频识别方法，包括以下步骤：

1)采集视频，对采集的视频进行多层级过分割；将一个视频序列分割成多个超体素，在分割时对分割的精细度进行调整；

2)对视频的各帧图像进行显著图计算，计算过程中将时空特征参数和真实场景特征参数作为参量；

3)提取视频的判别性图块，根据显著度加权和判别性图块的位置对视频超体素进行判别度计算，得到视频的判别性区域；

4)采用融合各层的判别性区域，对视频进行多层表示；采用svm支持向量机分类模型进行训练和人体动作识别。

上述技术方案中，进一步地，所述步骤3)中，得到视频的判别性区域的处理流程为：

对视频库中的视频进行划分，分别p1和p2两类，将p1类视频库中的视频分为两部分，分别为s1和s2；将视频进行关键帧提取，在关键帧上进行图块采样，将图块采用方向梯度直方图特征进行表示，将p1的所有图块使用k-means法聚为k类；通过一个迭代过程，用聚类后的每个类的成员训练一个该类的svm模型；在迭代结束后，能够得到数个svm模型，每一个模型对应一个象征性的图块，当需要提取视频的判别性区域块时，只需要将视频帧进行图块分割，计算图块在每个svm模型上的得分值，若在任意一模块上的得分值高于某一阈值，则认为该图块是判别性的图块。

上述技术方案中，进一步地，所述迭代过程为：1)将i类的类成员作为训练的正样本，s1中的所有图块作为训练的负样本；2)以p2中的图块作为预测样本，在训练出的svm模型上进行预测；3)在预测的结果中，取得分数高的图块，将图块添加到i类梯度中；4)对训练和预测样本进行更换，采用对p1、p1对调的方式，同时对s1、s2进行对调；依次迭代，n次后结束迭代过程。

本发明所具有的有益效果：本发明方法通过迭代训练和筛选过程，自动地提取视频中有代表性和区分性的区域；同时采用词袋模型对判别性区域进行统计，抽取视频中的语义信息，可有效消除光照、拍摄角度和噪声等影响，提高动作识别的准确性。

具体实施方式

基于视频技术的人体动作视频识别方法，包括以下步骤：

1)采集视频，对采集的视频进行多层级过分割；将一个视频序列分割成多个超体素，在分割时对分割的精细度进行调整；

2)对视频的各帧图像进行显著图计算，计算过程中将时空特征参数和真实场景特征参数作为参量；

3)提取视频的判别性图块，根据显著度加权和判别性图块的位置对视频超体素进行判别度计算，得到视频的判别性区域；

4)采用融合各层的判别性区域，对视频进行多层表示；采用svm支持向量机分类模型进行训练和人体动作识别。

所述步骤3)中，得到视频的判别性区域的处理流程为：

1)对视频库中的视频进行划分，分别p1和p2两类，将p1类视频库中的视频分为两部分，分别为s1和s2；将视频进行关键帧提取，在关键帧上进行图块采样，将图块采用方向梯度直方图特征进行表示，将p1的所有图块使用k-means法聚为k类。

2)通过一个迭代过程，用聚类后的每个类的成员训练一个该类的svm模型。所述迭代过程为：a)将i类的类成员作为训练的正样本，s1中的所有图块作为训练的负样本；b)以p2中的图块作为预测样本，在训练出的svm模型上进行预测；c)在预测的结果中，取得分数高的图块，将图块添加到i类梯度中；d)对训练和预测样本进行更换，采用对p1、p1对调的方式，同时对s1、s2进行对调；依次迭代，n次后结束迭代过程。

在迭代结束后，能够得到数个svm模型，每一个模型对应一个象征性的图块，当需要提取视频的判别性区域块时，只需要将视频帧进行图块分割，计算图块在每个svm模型上的得分值，若在任意一模块上的得分值高于某一阈值，则认为该图块是判别性的图块。

该视频识别方法融合了多层过分割和视觉显著性,能够减少视频尺度缩放对识别造成的影响；通过视频的显著图加权计算判别度，通过显著图进一步对判别性区域进行筛选,提取对视频有表征作用的判别性超体素；通过验证采用该方法能够使视频的识别对视频的缩放不敏感，且整体的识别准确度有所提高。

本发明的说明书被认为是说明性的而非限制性的，在本发明基础上，本领域技术人员根据所公开的技术内容，不需要创造性的劳动就可以对其中一些技术特征做出一些替换和变形，均在本发明的保护范围内。

技术特征：

技术总结
本发明中公开了一种基于视频技术的人体动作视频识别方法，包括以下步骤：1)采集视频，对采集的视频进行多层级过分割；2)对视频的各帧图像进行显著图计算，计算过程中将时空特征参数和真实场景特征参数作为参量；3)提取视频的判别性图块，根据显著度加权和判别性图块的位置对视频超体素进行判别度计算，得到视频的判别性区域；4)采用融合各层的判别性区域，对视频进行多层表示；采用SVM支持向量机分类模型进行训练和人体动作识别。通过迭代训练和筛选过程，自动地提取视频中有代表性和区分性的区域；同时抽取视频中的语义信息，可有效消除光照、拍摄角度和噪声等影响，提高动作识别的准确性。

技术研发人员：佘本龙
受保护的技术使用者：四川铭利达科技有限公司
技术研发日：2018.06.28
技术公布日：2018.12.11

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：佘本龙
技术所有人：四川铭利达科技有限公司
我是此专利的发明人

上一篇：一种分散机上的紊流发生机构的制作方法
上一篇：一种桥梁吊装用缓冲定位底座的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。