基于可判别性二叉树投票的动作识别方法

文档序号:8488120阅读:303来源:国知局
基于可判别性二叉树投票的动作识别方法
【技术领域】
[0001] 本发明属计算机视觉技术领域,具体涉及一种基于可判别性二叉树投票的动作识 别方法。
【背景技术】
[0002] 人行为动作识别是计算机视觉领域中前沿的科学研宄之一,在视频处理方面发挥 着非常重要的作用。人行为分析包括对视频图像中人物进行检测、跟踪、目标分类和行为理 解方面,主要通过对人物动作对应像素点变化来确定动作的行为类别。但是由于人在形状、 外观、尺度、视角和姿势的高动态性,识别人的行为就变的很困难,使得这项研宄变得很有 挑战性。
[0003] 早期的研宄方法是研宄在简单的,静态的背景下的单人视频图像,方法比较简单, 抗干扰能力弱,分析的效果一般。现在正在尝试引进人物特征采样分析的方法来研宄,而且 在动作分类、确定人行为的类别也有了进一步的跟进,但是在低分辨率,人物动作模糊的情 况下,很难有足够的稳定性和准确性。
[0004] 西安电子科技大学提出的专利申请"一种基于霍夫森林的目标跟踪算法"(专利申 请号201410507656. 2,公开号CN104299243A),通过训练已知目标样本建立霍夫森林,检 测视频序列依次进入已训练霍夫森林,叶结点对目标中心进行投票,获取目标中心位置并 初始化卡尔曼滤波参数,然后与上一帧的目标位置进行阈值比较,如果不符合标准,则通过 卡尔曼滤波器进行目标预测位置。该方法虽然对目标中心进行检测和修正,但是在建立卡 尔曼模型和目标中心均值耗费运行时间,增加算法复杂度,卡尔曼滤波器预测结果往往非 常准确的,如果出现预测失误,会导致目标跟踪失败,而且该方法在人物动作识别方面没有 内容。
[0005] 上海交通大学提出的专利申请"一种人体动作识别的方法"(专利申请号 201310054812.X,公开号CN103164694A)公开了一种基于目标时空特征提取和半监督分 类器的动作识别方法,在较少的目标样本中,该方法能够实现动作行为的判定,但是算法的 复杂度很高,判断人物动作轮廓,提取时空特征,建立k近邻图,通过拉普拉斯矩阵进行求 解动作类别标签。此方法中的最终特征向量维数过高,求解广义的拉普拉斯矩阵变换复杂 度过高,并不能够实时的对人物动作进行准确判断。

【发明内容】

[0006] 本发明的目的在于提供一种高效的人体动作识别方法,二叉树作为机器学习中的 优秀分类器,稳定性好,二叉树通过收集树的子结点对各个类别投票,选择最多的投票作为 判断结果。
[0007] 本发明的基于可判别性二叉树投票的动作识别方法,包括下列步骤:
[0008] 1构建可判别性二叉树,具体包括下列步骤:
[0009] 1. 1对训练视频序列进行分类处理,将含有目标的动作类别定义为正样本,对正样 本进行标记,不同的动作类别区别标记;将目标区域外的定义为负样本,负样本中只含有背 景,负样本统一标记;
[0010] 1. 2人的动作行为在时间和空间上都含有信息,为了准确描述不同人的动作行为, 将训练视频中整套动作在空间和时间上进行分解,其值设置为16x16x5大小的彩色立体块 {Pi=(Ii,ci;di)},
[0011] 其中A表示三维立体块;Ii表示第i立体块提取的特征值,
【主权项】
1. 一种基于可判别性二叉树投票的动作识别方法,其特征在于包括下列步骤: 1.1构建可判别性二叉树,具体包括下列步骤: 1.1.1对训练视频序列进行分类处理,将含有目标的动作类别定义为正样本,对正样 本进行标记,不同的动作类别区别标记;将目标区域外的定义为负样本,负样本中只含有背 景,负样本统一标记; 1. 1. 2人的动作行为在时间和空间上都含有信息,为了准确描述不同人的动作行为,将 训练视频中整套动作在空间和时间上进行分解,其值设置为16x16x5大小的彩色立体块{Pi =(Ii,ci;di)}, 其中:Pi表示三维立体块;Ii表示第i立体块提取的特征值,/f)容纳多 通道特征值,"表示在第i个立体块中特征通道fe(1,2,…,F)对应的特征值;Ci表示为 动作类别标签,标记不同数字的立体块代表不同的动作类别,标记数字〇的立体块代表负 样本表示立体块中心到达时空域动作中心的三维矢量值;16x16和5分别表示训练视频 序列的空间信息和时间信息; 1. 1. 3对1. 1. 2步骤中的立体块进行特征提取和标记,立体块特征包括:灰度强度、位 置坐标对时间的导数和位置上的光流值;记录检测序列的立体块类别标记和立体块中心到 三维完整动作中心的矢量值; 1. 1. 4设定二叉树的截止条件:根据构建二叉树的规则,指定树的最大深度dMax和叶子 含有最小立体块的数量1^,当达到树的最大深度dMax或每个叶子集合中的立体块少于最小 立体块的数量Nmin时立刻停止; 1. 1. 5从根结点开始构建二叉树,输入步骤1. 1. 3中提取的立体块三维信息,进行二值 测试,通过比较特征通道f中位置PeR3和qeR3的特征值大小,其中R3表示三维空间, 二值测试定义如下:
(1) 其中:t表示特征阈值,特征阈值通过遍历此特征通道中最小值到最大值,即min If(p) <t<maxIf(q),由于给出已知视频序列,minIf(p)和maxIf(q)通过计算求得; If(P)表示在位置中心P时,立体块中特征通道f的特征值,特征值按1. 1. 3步骤选取, 特征通道f?为1.1.2步骤所描述;T (r)表示以两个不同位置p和q为中心的立体块 在特征通道f中特征值的比较值,当特征通道f中以位置P为中心的立体块特征值小于以 位置q为中心的立体块特征值与阈值t的和时,二值比较值取0,当特征通道f中以位置p 为中心的立体块特征值大于或等于以位置q为中心的立体块特征值与阈值t的和时,二值 比较值取1 ; 对所有立体块{Pi= (I而言,随机选取p、q和t值,会产生二值测试集合 {tk},其中k表示集合的数量,二值集合{tk}有两类立体块,一类是特征通道f中特征值的 比较值为〇的立体块集合1,记为(Cl# (//) = 〇},另一类是特征通道f中特征值的比较值为 1的立体块集
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1