一种基于贝叶斯模型的视觉人体行为识别方法与流程

文档序号：12123729阅读：来源：国知局

技术特征：

1.一种基于贝叶斯模型的视觉人体行为识别方法，该方法包括以下步骤：

步骤1：提取训练视频中的特征，形成对所述训练视频中人体行为的底层表达；

步骤2：从所述特征出发，构建分层贝叶斯模型，以提取所述训练视频中不同尺度下的人体行为模式，得到基于高层语义信息的人体行为表达；

步骤3：嵌入最大间隔机制，实现判别式的分层贝叶斯模型的学习；

步骤4：学习所述判别式的分层贝叶斯模型的参数，以确定所述参数。

2.根据权利要求1所述的方法，其特征在于，所述步骤1包括：

步骤1a：以所述训练视频中像素点的像素值变化为基础，检测所述训练视频中的人体行为的显著点；

步骤1b：以各所述显著点为中心，分别构建描述子，形成对各所述显著点为中心的局部区域的描述；

步骤1c：对所有所述描述子进行聚类，形成相应的视觉单词和视觉词典，进而构建基于词包模型的直方图向量，形成所述训练视频中人体行为的所述底层表达。

3.根据权利要求2所述的方法，其特征在于，所述描述子为3DSIFT描述子。

4.根据权利要求2所述的方法，其特征在于，所述步骤2包括：

步骤2a：根据参数为M的先验分布Uniform(M)抽取训练视频d∈{1，...，M}，其中，M为全部所述训练视频的数量；

步骤2b：根据参数为θ_d的全局行为模式分布，从被抽取的所述训练视频d抽取全局行为模式z_d，n＝k，k＝1，...，K，其中K表示所有不同全局行为模式的数目；

步骤2c：根据依赖于被抽取的所述全局行为模式z_d，n＝k、参数为τ_k的局部行为模式分布，抽取局部行为模式h_d，n＝r，r＝1，...，R，其中R表示所有不同局部行为模式的数目；

步骤2d：根据依赖于被抽取的所述局部行为模式h_d，n＝r、参数为φ_r的所述视觉单词的分布，抽取视觉单词w_d，n∈{1，...，V}。

5.根据权利要求4所述的方法，其特征在于，对所述参数θ_d、τ_k和φ_r分别赋予参数为α的K维狄利克雷先验分布、参数为γ的R维狄利克雷先验分布和参数为β的V维狄利克雷先验分布。

6.根据权利要求4所述的方法，其特征在于，所述全局行为模式分布和/或所述局部行为模式分布和/或所述视觉单词的分布为多项式分布。

7.根据权利要求4所述的方法，其特征在于，所述步骤3包括：

步骤3a：以各所述训练视频中所述全局行为模式出现频次的平均值作为对所述训练视频的表达；

步骤3b：将所述表达输送到系数参数为η_c的线性分类器中，得到判别函数的值其中c＝1,…,C表示第c类，C表示类别数目；

步骤3c：计算基于最大间隔准则的损失其中当所述视频的真实类别是c时，否则

步骤3d：引入与所述损失ζ_d，c对应的隐变量λ_d，c，并将所述损失ζ_d，c表达为混合分布形式。

8.根据权利要求7所述的方法，其特征在于，所述步骤4包括：

步骤4a：对所述训练视频中的每个视觉单词所属的全局行为模式与局部行为模式分别赋予区间[1,K]和[1,R]内的随机整数值；

步骤4b：计算h_d,n＝r、z_d，n＝k、λ_d，c、η_d，c的后验分布，并分别进行轮流重复采样，直至收敛或达到一预定的采样次数；

步骤4c：以所述参数θ_d、τ_k和φ_r的后验分布均值联合采样后的各统计量得到对所述参数θ_d、τ_k和φ_r的估计；

步骤4d：记录相关统计量，以用于测试视频的推断过程。

9.根据权利要求8所述的方法，其特征在于，包括对测试视频进行识别的步骤5，所述步骤5包括：

步骤5a：对测试视频中的每个视觉单词所属的全局行为模式与局部行为模式分别赋予区间[1,K]和[1,R]内的随机整数值；

步骤5b：联合在上述步骤4中得到的训练视频中的各参数值与统计量，对所述测试视频中各个视觉单词所属的全局行为模式z_d，n与局部行为模式h_d，n进行采样，直到达到收敛条件或达到一预定的采样次数；

步骤5c：计算所述测试视频中所有全局行为模式的出现频次的平均值作为对所述测试视频的表达；

步骤5d：利用学习得到的判别函数参数η_c，计算所述测试视频属于各类的分值并将所述测试视频划分到分值最大的那一类，完成识别。

10.根据权利要求1-9中任一项所述的方法，其特征在于，步骤1中提取的所述特征为局部特征。

完整全部详细技术资料下载

当前第2页1 2 3