基于多特征融合的行为识别方法

文档序号：6523950阅读：1746来源：国知局

基于多特征融合的行为识别方法
【专利摘要】本发明公开了一种基于多特征融合的行为识别方法，包括下述步骤：S1、对训练集和测试集的视频进行预处理；S2、对步骤S1预处理后的视频，检测特征点；S3、对视频中的特征立方体，提取代表不同信息的描述子，形成综合描述子；S4、利用步骤S3提取出来的训练集的描述子，使用K-SVD算法训练字典；S5、对步骤S3提取出来测试集的描述子，进行特征融合，用级联字典分类算法进行分类。本发明对能量信息、空间信息、时间信息进行多特征融合，抽象出本质的运动特征，描述子信息提取全面，系统鲁棒性好。
【专利说明】基于多特征融合的行为识别方法

【技术领域】
[0001] 本发明涉及图像识别与处理的【技术领域】，特别涉及一种基于多特征融合的行为识别方法。

【背景技术】
[0002] 在计算机视觉领域中，行为识别随着人体运动分析的发展在智能视频监控领域具有越来越高的应用价值。但是由于：1)数据采集的环境复杂多样，行为序列背景分割技术还不十分完善；2)在时间尺度上以及空间尺度上，同一种行为或者相似行为通常具有不同的含义；3)由于分类器的学习能力有限而且兴趣点提取的几种方法有利有弊，所以同一段视频行为同时被判别为属于几个类别常常发生。以上种种因素使得人体行为识别成为一个非常具有挑战性的研究领域。

【发明内容】

[0003] 本发明的目的在于克服现有技术的缺点与不足，提供一种基于多特征融合的行为识别方法。
[0004] 本发明的目的通过下述技术方案实现：
[0005] 基于多特征融合的行为识别方法，包括下述步骤：
[0006] S1、对训练集和测试集的视频进行预处理；
[0007] S2、对步骤S1预处理后的视频，检测特征点；
[0008] S3、对视频中的特征立方体，提取代表不同信息的描述子，形成综合描述子；
[0009] S4、利用步骤S3提取出来的训练集的描述子，使用K-SVD算法训练字典；
[0010] S5、对步骤S3提取出来测试集的描述子，进行特征融合，用级联字典分类算法进行分类。
[0011] 步骤S1中对视频进行预处理的具体方法为：
[0012] S11、采用平滑滤波的方法降低噪声的影响；
[0013] S12、采用光照补偿的方法保证图像的对比度，补偿光照的影响；
[0014] S13、通过背景建模的方法实现提取运动前景，其中采用：a)多层混合背景模型融合彩色空间的颜色测量和局部的纹理特征对背景进行建模；b)利用交叉双边滤波器强化相似区域，更好地检测结果和保留边界信息。
[0015] 步骤S2中，采用Harris3D角点提取算法来检测特征点，具体为：
[0016] S21、使用初始空间尺度

【权利要求】
1. 基于多特征融合的行为识别方法，其特征在于，包括下述步骤： 51、对训练集和测试集的视频进行预处理； 52、对步骤S1预处理后的视频，检测特征点； 53、对视频中的特征立方体，提取代表不同信息的描述子，形成综合描述子； 54、利用步骤S3提取出来的训练集的描述子，使用K-SVD算法训练字典； 55、对步骤S3提取出来测试集的描述子，进行特征融合，用级联字典分类算法进行分类。
2. 根据权利要求1所述基于多特征融合的行为识别方法，其特征在于，步骤S1中对视频进行预处理的具体方法为： 511、采用平滑滤波的方法降低噪声的影响； 512、采用光照补偿的方法保证图像的对比度，补偿光照的影响； 513、通过背景建模的方法实现提取运动前景，其中采用：a)多层混合背景模型融合彩色空间的颜色测量和局部的纹理特征对背景进行建模；b)利用交叉双边滤波器强化相似区域，更好地检测结果和保留边界信息。
3. 根据权利要求1所述基于多特征融合的行为识别方法，其特征在于，步骤S2中，采用 Harris3D角点提取算法来检测特征点，具体为： 521、使用初始空间尺度
和时间尺度
稀疏选定的组合，以及积分尺度
和
在时间和空间上找到时空角点函数H(8)的极大值点
这些点就是兴趣点； 522、对每个兴趣点pj进行处理； 523、在（xj, yj, tj)处计算
和在周边那些
和 δ =-〇. 25, 0, 0. 25的地方计算出联合尺度
524、选出那些使得
最大化的联合积分尺度
525、如果
或者
用积分尺度
局部尺度
在最靠近（Xj，y」，tp的位置
处重新提取兴趣点
令
然后返回步骤S23重新开始执行。
4. 根据权利要求1所述基于多特征融合的行为识别方法，其特征在于，步骤S2中，采用 Cuboid Feature的角点检测算法来检测特征点，具体为：将视频图像的像素点序列记为I，根据响应函数 R= (I*g*hev) 2+ (I^g#^)2,计算每个像素点序列的响应值R，计算得到一组响应值R，R的极大值点即为所求兴趣点；其中
其中w=4/ji ; 其中g(x，y; σ )是2D高斯平滑滤波来提供空间兴趣点的探测，hev和L是lDGabor滤波器的正交对。
5. 根据权利要求1所述的基于多特征融合的行为识别方法，其特征在于，步骤S3中，在时空兴趣点周围提取局部块，计算其光流信息，根据光流的角度、强度计算其统计信息，得到光流的统计直方图，作为运动特征描述子；所述运动特征描述子包括H0F，H0G3D和LMP 描述子。
6. 根据权利要求5所述的基于多特征融合的行为识别方法，其特征在于，所述H0F提取算法的具体步骤如下： (1) 对视频每一帧计算光流，得到光流场； (2) 对每一帧光流场进行直方图统计，得到每帧的描述子； (3) 对每帧的描述子向量求和，得到特征立方体的描述子。
7. 根据权利要求5所述的基于多特征融合的行为识别方法，其特征在于，所述hog3D描述子的计算方法如下： (1) 利用sobel算子对图像分别在两个维度进行差分运算，得到矢量图； (2) 对矢量图进行直方图统计，得到每帧的描述子； (3) 对每帧的描述子向量求和，得到特征立方体的描述子。
8. 根据权利要求5所述的基于多特征融合的行为识别方法，其特征在于，LMP描述子的计算方法如下：滤波后的立方体记为v e IRqX qxl，由1个小平面组成；对每一个像素点在时间上计算二、三、四阶中心矩；定义对应于v的高阶矩矩阵； ΜΓ=[πι^·] i, j=l, 2, L η 其中
vijt表示第1个小平面,位置为{i, j}的像素点的灰度值；每一个高阶矩矩阵凡，r= {2, 3, 4}可以变换为一个向量nv e IR'对于r的说那个不同取值，高阶矩矩阵可以整合为一个矩阵m e IRd，其中d=3 η2 :
向量m为LMP描述子。
9. 根据权利要求1所述基于多特征融合的行为识别方法，其特征在于，步骤S4中， K-SVD训练字典的具体方法为： 1)稀疏编码；固定Φ，计算X，即：
为解决上式描述的NP难的优化问题，采用正交匹配追踪求解； 2)字典更新：字典Φ中的元素相继被更新，允许X中相关系数的变化；更新字典中的元素涉及计算秩1近似的误差矩阵：
其中
是Φ除去第i列形成的矩阵，尤是X除去第i行形成的，秩1近似通过使Ei 为奇异值矩阵实现。
10.根据权利要求1所述基于多特征融合的行为识别方法，其特征在于，步骤S5中，用级联字典分类算法进行分类的具体方法为： 551、对训练集视频的特征向量，用K-SVD算法训练字典； 552、由这些字典Φ1、Φ2、· · 生成新的字典Φ。： Φ〇=[Φ?|Φ2|· · *|〇k]； 553、对测试集视频的特征向量Q，通过正交匹配追踪找到其稀疏表示XQ :
s. t. | | X | | 〇 ^ k3 ； 554、乂(3可以写成： Χ^ΕΧ^ΙΧφ」· · · |ΧΦΚ]，其中，Χφι是Φ,的系数矩阵；S55、对XQ进行分类：类 sargmaXi e 12，...，c| | X Φ ι | |0。
【文档编号】G06K9/46GK104091169SQ201310688324
【公开日】2014年10月8日申请日期:2013年12月12日优先权日:2013年12月12日
【发明者】徐向民, 张源, 王在炯, 杨倩倩申请人:华南理工大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐向民;张源;王在炯;杨倩倩
技术所有人：华南理工大学
我是此专利的发明人

上一篇：一种把离线算法在线进行计算的方法及装置制造方法
上一篇：用于模拟毛发的动力学的技术的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。