一种基于不相关性约束的低秩表示人体行为识别方法

文档序号：6631568阅读：652来源：国知局

一种基于不相关性约束的低秩表示人体行为识别方法
【专利摘要】本发明属于图像处理【技术领域】，具体公开了一种基于不相关性约束的低秩表示人体行为识别方法，主要用于解决现有技术中对特征的编码方法中没有考虑行为之间的不相关性的问题。其实现步骤为：(1)输入人体行为视频序列,提取初级特征；(2)对初级特征聚类得到字典；(3)对初级特征进行不相关性约束的低秩表示编码；(4)利用稀疏表示分类方法对视频进行分类；(5)输出分类结果。本发明在低秩表示的基础上，加入了人体行为不相关性约束，增强了人体行为视频序列编码的判别性，提高了人体行为识别的准确性，可用于智能监控。
【专利说明】一种基于不相关性约束的低秩表示人体行为识别方法

【技术领域】
[0001] 本发明属于图像处理【技术领域】，涉及机器学习和计算机视觉【技术领域】，具体是一种基于不相关性约束的低秩表示人体行为识别方法，本发明可以通过对人体的行为视频中的特征进行学习，得到不同的人体行为的特征表示，从而在此基础上实现计算机自主的对于人体行为进行识别和跟踪等。

【背景技术】
[0002] 人体行为识别包含从人体行为视频中提取出相关的初级特征，通过对该初级特征的学习，从而得到对不同人体行为进行特征表示，最终以该特征表示识别人体行为。人体行为的识别已经成为现代计算机视觉领域中的研究热点问题，其研究主要致力于寻找精确的特征学习方法和识别人类行为的技术方法。最为普遍的人体行为识别方法通常是：首先从包含人体行为视频中提取初级特征，通过对初级特征的学习得到人体行为的高级特征，并在此基础上对人体行为进行识别分类。在该过程中，如何对不同的人体行为进行恰当的表示是一个关键问题，表示的合理与否将会影响到最终的分类精度和识别精度。
[0003] 传统的词袋BoF模型已经成功的运用于行为识别领域。在行为之别中，BoF模型将人体行为表示成一个基于字典原子的统计直方图。该模型中，该模型存在的缺点是，人体行为的每个特征单独的对应于字典的一个原子，没有考虑特征之间的相关性，使得最终的特征表示不够精确。
[0004] Changhong Liu 等人在论文"Human action recognition using sparse representation"（ICIS, 2009)中利用Sparse Coding的方法进行行为识别。该方法将每个特征单独的表示成基于字典原子的稀疏表示向量，没有考虑特征之间的相互关系。因此，使得最终的表不不够精确。
[0005] GuangCan Liu 等人在论文"Robust Subspace Segmentation by Low-Rank 尺印代86拉&^〇11(扣1^，2010)"中利用低秩表示的方法对数据进行子空间分割。该方法从全局出发对原始数据进行表示，考虑了特征之间的相关性。然而，在行为识别领域，低秩表示并没有考虑行为之间的不相关性。

【发明内容】

[0006] 本发明针对上述现有技术的不足，提出一种基于不相关性约束的低秩表示人体行为识别方法。该方法在低秩表示的基础上加入了人体行为间的不相关性约束，使得人体行为的表示更具判别性，从而提高了对人体行为的识别能力。
[0007] 本发明的技术方案是：一种基于不相关性约束的低秩表示人体行为识别方法，包括如下步骤：
[0008] (1)输入人体行为视频，利用Cuboid检测子和描述子分别对视频中的人体行为进行特征提取，得到人体行为的初级特征矩阵

【权利要求】
1. 一种基于不相关性约束的低秩表示人体行为识别方法，其特征在于：包括如下步骤： (1) 输入人体行为视频，利用Cuboid检测子和描述子分别对视频中的人体行为进行特征提取，得到人体行为的初级特征矩阵
其中，Xi表示第i个初级特征，i = 1，2,. . .，n，d表示初级特征的维数； (2) 对所有视频的初级特征进行聚类得到字典：利用k-均值聚类方法，对所有人体行为初级特征进行聚类，聚类中心作为字典的原子，从而得到字典：
其中：?表示字典的原子，i = 1，2,…，N， N表示原子的个数； (3) 利用不相关性约束的低秩表示对每个视频的初级特征进行编码，得到其高级特征表不： (3a)利用低秩表示方法，求解基于字典A的每个视频中人体行为初级特征的编码系数矩阵，利用如下公式进行编码：
其中：Z表示编码系数矩阵，E表示噪声项，|| Z || #表示编码系数矩阵的核范数，即编码系数矩阵的奇异值之和，参数λ用来平衡噪声的影响，|| Ε||2?1表示对E的12?1范数，
Ευ为第i行第j列元素； (3b)利用中间变量J代替步骤（3a)中的Z，将编码公式转化为：
利用增强拉格朗日乘子（ALM)算法对该公式进行求解，得到人体行为的编码系数矩阵
i = 1，2,…，η ; (3c)对人体行为的编码系数矩阵应用最大化池算法，将每个人体行为的编码系数表示成一个以隹的列向量：又=[乃,}；2,...只...,少\.]7"￡'：丨?"1，其中％=11^(|2 11|，|212|，···， | zik|，…，I zin|)，i = 1，2,…，N，k = 1，2,…n，zik 表示 Z 的第 i 行第 k 列元素； (3d)利用步骤（3b)中得到的结果初始化下式中的编码系数矩阵，对每个视频中人体行为的初级特征进行再次编码，得到高级编码系数矩阵，编码公式如下：
s. t. Xi = AZi+Ei 其中：Μ表示人体行为视频的个数，Zi表示第i个视频中人体行为初级特征矩阵的高级编码系数矩阵，Ei为噪声项，γ表示不相关约束项的权值，= || 1-Υ」| 22表示Zi和Ζ」的权重，Yi和t表示第i个和第j个编码系数矩阵经过最大化池得到的列向量，II Z/Zi || /表示Zi和t的乘积F范数的平方； (3e)对得到的高级编码系数矩阵进行如步骤（3c)所述的最大化池算法，得到人体行为的高级特征表示，将其表示为，=[?...Λ,Λ? Yxl; (4) 利用稀疏表示分类方法对视频进行分类： (4a)将一个动作者的所有行为视频的高级特征表示作为测试样本集，其他动作者的所有行为视频的高级特征表示作为训练集，训练样本个数为m，利用所有训练样本组成字典
=l，2，...，m，其中m是字典D的原子个数； (4b)利用下式，得到每个测试样本》的编码系数β :
其中，II · II2表示向量的12范数，II · II i表示向量的li范数，η是用于平衡重建误差和编码稀疏性的参数，取值范围为0-1 ; (4c)计算每个测试样本在每类字典上的残差0(50:
其中：是测试样本在第j类字典1^.上的编码系数，如果在第j类字典上的残差最小，则测试样本的类标为j; (5) 输出分类结果：重复步骤（4)，依次对每个动作者的所有行为进行分类，得到各自的类标，输出结果。
2. 根据权利要求1所述的一种基于不相关性约束的低秩表示人体行为识别方法，其特征在于，步骤（1)中所述的特征维数d = 100。
3. 根据权利要求1所述的一种基于不相关性约束的低秩表示人体行为识别方法，其特征在于，步骤（2)中所述的字典原子的个数N = 500,即就是k均值聚类算法中设定的聚类中心个数。
4. 根据权利要求1所述的一种基于不相关性约束的低秩表示人体行为识别方法，其特征在于，为了便于求解步骤（3d)中的编码公式，分别对每一个初级特征进行如下编码：
s. t. Xi = AZi+Ei
，将上式转化为如下表达式： s. t. Xi = AZi+Ei

> 其中：I是一个常量，该常量表示的系数；为求解方便，利用字母J替换上式中的Ζ，得到如下表达式：
s. t. Xi = ΑΖ±+ΕΠ li = ]i 利用增强拉格朗日乘子ALM算法对上式进行求解，得到人体行为的高级编码系数尤[叫，4、，，" _ ·，，心"]^ ，1 1，2，···，！!。
【文档编号】G06K9/66GK104298977SQ201410578539
【公开日】2015年1月21日申请日期:2014年10月24日优先权日:2014年10月24日
【发明者】张向荣, 焦李成, 贾航华, 侯彪, 王爽, 马文萍, 马晶晶, 杨淑媛, 刘若辰申请人:西安电子科技大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张向荣;焦李成;贾航华;侯彪;王爽;马文萍;马晶晶;杨淑媛;刘若辰
技术所有人：西安电子科技大学
我是此专利的发明人

上一篇：大空间三维实体放线方法
上一篇：章节式文本的章节完整性的识别方法和装置制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。