基于可判别性二叉树投票的动作识别方法

文档序号：8488120阅读：303来源：国知局

基于可判别性二叉树投票的动作识别方法
【技术领域】
[0001] 本发明属计算机视觉技术领域，具体涉及一种基于可判别性二叉树投票的动作识别方法。
【背景技术】
[0002] 人行为动作识别是计算机视觉领域中前沿的科学研宄之一，在视频处理方面发挥着非常重要的作用。人行为分析包括对视频图像中人物进行检测、跟踪、目标分类和行为理解方面，主要通过对人物动作对应像素点变化来确定动作的行为类别。但是由于人在形状、外观、尺度、视角和姿势的高动态性，识别人的行为就变的很困难，使得这项研宄变得很有挑战性。
[0003] 早期的研宄方法是研宄在简单的，静态的背景下的单人视频图像，方法比较简单，抗干扰能力弱，分析的效果一般。现在正在尝试引进人物特征采样分析的方法来研宄，而且在动作分类、确定人行为的类别也有了进一步的跟进，但是在低分辨率，人物动作模糊的情况下，很难有足够的稳定性和准确性。
[0004] 西安电子科技大学提出的专利申请"一种基于霍夫森林的目标跟踪算法"（专利申请号201410507656. 2,公开号CN104299243A)，通过训练已知目标样本建立霍夫森林，检测视频序列依次进入已训练霍夫森林，叶结点对目标中心进行投票，获取目标中心位置并初始化卡尔曼滤波参数，然后与上一帧的目标位置进行阈值比较，如果不符合标准，则通过卡尔曼滤波器进行目标预测位置。该方法虽然对目标中心进行检测和修正，但是在建立卡尔曼模型和目标中心均值耗费运行时间，增加算法复杂度，卡尔曼滤波器预测结果往往非常准确的，如果出现预测失误，会导致目标跟踪失败，而且该方法在人物动作识别方面没有内容。
[0005] 上海交通大学提出的专利申请"一种人体动作识别的方法"（专利申请号 201310054812.X，公开号CN103164694A)公开了一种基于目标时空特征提取和半监督分类器的动作识别方法，在较少的目标样本中，该方法能够实现动作行为的判定，但是算法的复杂度很高，判断人物动作轮廓，提取时空特征，建立k近邻图，通过拉普拉斯矩阵进行求解动作类别标签。此方法中的最终特征向量维数过高，求解广义的拉普拉斯矩阵变换复杂度过高，并不能够实时的对人物动作进行准确判断。

【发明内容】

[0006] 本发明的目的在于提供一种高效的人体动作识别方法，二叉树作为机器学习中的优秀分类器，稳定性好，二叉树通过收集树的子结点对各个类别投票，选择最多的投票作为判断结果。
[0007] 本发明的基于可判别性二叉树投票的动作识别方法，包括下列步骤：
[0008] 1构建可判别性二叉树，具体包括下列步骤：
[0009] 1. 1对训练视频序列进行分类处理，将含有目标的动作类别定义为正样本，对正样本进行标记，不同的动作类别区别标记；将目标区域外的定义为负样本，负样本中只含有背景，负样本统一标记；
[0010] 1. 2人的动作行为在时间和空间上都含有信息，为了准确描述不同人的动作行为，将训练视频中整套动作在空间和时间上进行分解，其值设置为16x16x5大小的彩色立体块 {Pi=(Ii,ci；di)},
[0011] 其中A表示三维立体块；Ii表示第i立体块提取的特征值，
【主权项】
1. 一种基于可判别性二叉树投票的动作识别方法，其特征在于包括下列步骤： 1.1构建可判别性二叉树，具体包括下列步骤： 1.1.1对训练视频序列进行分类处理，将含有目标的动作类别定义为正样本，对正样本进行标记，不同的动作类别区别标记；将目标区域外的定义为负样本，负样本中只含有背景，负样本统一标记； 1. 1. 2人的动作行为在时间和空间上都含有信息，为了准确描述不同人的动作行为，将训练视频中整套动作在空间和时间上进行分解，其值设置为16x16x5大小的彩色立体块{Pi =(Ii,ci；di)}, 其中：Pi表示三维立体块；Ii表示第i立体块提取的特征值，/f)容纳多通道特征值，"表示在第i个立体块中特征通道fe(1，2,…，F)对应的特征值；Ci表示为动作类别标签，标记不同数字的立体块代表不同的动作类别，标记数字〇的立体块代表负样本表示立体块中心到达时空域动作中心的三维矢量值；16x16和5分别表示训练视频序列的空间信息和时间信息； 1. 1. 3对1. 1. 2步骤中的立体块进行特征提取和标记，立体块特征包括：灰度强度、位置坐标对时间的导数和位置上的光流值；记录检测序列的立体块类别标记和立体块中心到三维完整动作中心的矢量值； 1. 1. 4设定二叉树的截止条件：根据构建二叉树的规则，指定树的最大深度dMax和叶子含有最小立体块的数量1^，当达到树的最大深度dMax或每个叶子集合中的立体块少于最小立体块的数量Nmin时立刻停止； 1. 1. 5从根结点开始构建二叉树，输入步骤1. 1. 3中提取的立体块三维信息，进行二值测试，通过比较特征通道f中位置PeR3和qeR3的特征值大小，其中R3表示三维空间，二值测试定义如下：
(1) 其中：t表示特征阈值，特征阈值通过遍历此特征通道中最小值到最大值，即min If(p) <t<maxIf(q)，由于给出已知视频序列，minIf(p)和maxIf(q)通过计算求得； If(P)表示在位置中心P时，立体块中特征通道f的特征值，特征值按1. 1. 3步骤选取，特征通道f?为1.1.2步骤所描述；T (r)表示以两个不同位置p和q为中心的立体块在特征通道f中特征值的比较值，当特征通道f中以位置P为中心的立体块特征值小于以位置q为中心的立体块特征值与阈值t的和时，二值比较值取0,当特征通道f中以位置p 为中心的立体块特征值大于或等于以位置q为中心的立体块特征值与阈值t的和时，二值比较值取1 ; 对所有立体块{Pi= (I而言，随机选取p、q和t值，会产生二值测试集合 {tk}，其中k表示集合的数量，二值集合{tk}有两类立体块，一类是特征通道f中特征值的比较值为〇的立体块集合1，记为(Cl# (//) = 〇}，另一类是特征通道f中特征值的比较值为 1的立体块集

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王世刚;鲁奉军;赵晓琳;赵文婷;卢洋;
技术所有人：吉林大学;
我是此专利的发明人

上一篇：一种基于二值描述符的三维目标识别方法
上一篇：一种取证验证仪的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。