一种无监督多视图特征选择的人体行为识别方法

文档序号:6518566阅读:298来源:国知局
一种无监督多视图特征选择的人体行为识别方法
【专利摘要】本发明公开了一种无监督多视图特征选择的人体行为识别方法。该方法首先对预先采集包含不同人体行为类型的视频数据集提取多种类型的视觉特征表达,得到多视图特征数据矩阵;接着对各个视图构建视图相关的视觉相似图和几何拉普拉斯矩阵,以此构建求解多视图特征选择矩阵与数据聚类类别矩阵的目标函数;然后采用迭代梯度下降法优化计算多视图特征选择矩阵,并依据的行排序结果得到二值特征选择矩阵;最后将待识别视频数据转换为相应的多视图特征数据,比较特征选择后的待识别数据与预先采集的多视图特征数据之间的距离,将待识别视频标识为距离最近的预采集视频数据人体行为类型。本方法计算速度快,具有较高的识别准确率和抗噪声干扰能力。
【专利说明】一种无监督多视图特征选择的人体行为识别方法
【技术领域】
[0001]本发明涉及机器学习与计算机视觉研究中的无监督学习、多视图学习、特征选择和人体行为识别这几个主题,尤其涉及一种无监督多视图特征选择的人体行为识别方法。
【背景技术】
[0002]随着现代计算机计算性能的飞速提升和计算机视觉技术,尤其是特征提取技术的发展,人们对视频和图像处理对象会提取不同类型的视觉特征表达。例如对图像而言,常会提取包括全局特征,如颜色直方图、纹理特征和轮廓外形特征,以及局部特征,如SIFT、LBP和GLOH等。而对于视频对象,除了外观特征(如颜色、纹理、边缘)和运动特征(如运动历史图和运动能量图特征),还会提取局部时刻特征(如STIP特征)。这种对同一对象提取多种异构类型的特征所构成的数据被称为多视图数据。
[0003]由于传统的机器学习方法都是针对处理单一类型特征数据进行设计的,因此在处理多视图数据的时候无法充分挖掘发挥多视图数据中不同模特数据之间的关联性,因此无法取得最佳的方法效果。虽然一种简单的处理办法是将这些不同类型的特征拼接起来,构成新的单类型特征,但是这种方式忽略了不同类型特征本身所存在的鉴别能力强弱上的差异性,因此也不是一种理想的处理办法。为了解决这个问题,多视图学习方法在最近得到兴起,并成功应用到数据聚类,分类和数据降维等应用中,显著地提高了学习方法的性能。
[0004]具体到特征选择应用中,传统的方法,无论是有监督学习的Fisher Scores方法和Sparse Mult1- output regression 方法,还是无监督的 Laplacian Score 方法、FeatureRanking和Mult1-Cluster Feature Selection方法,都是面向传统的单类型特征设计的,并不是针对多视图数据。因此在进行特征选择的时候,传统的特征选择方法无法充分发挥多视图特征优势。
[0005]另外一方面,在基于视频的人体行为识别研究中,虽然各种不同类型的视觉特征被不断提出来,多特征之间如何进行组合和应用,在一些文献中也有关的研究和讨论,但是对于多特征之间如何进行快速有效的特征选择,这方面的研究相对比较少。
[0006]针对上述问题,本发明提出一种无监督多视图特性选择的人体行为识别方法。与上面提到的传统方法不同,本方法充分利用多视图数据中不同视图之间的内在关联性,通过对不同类型的特征赋予不同的视图权重,从而将多种异构类型的特征最优地组织在一起。于此同时,本方法还将不同类型特征数据内存在的数据空间结构关系考虑进来,对不同视图分别构建表征该类型数据之间空间结构关系的图,采用几何拉普拉斯图,将数据之间的几何结构关系引入到目标函数中。通过对目标函数中特征选择矩阵添加12Λ范数约束,利用U1范数的行稀疏特性,实现对特征分量的排序,进而实现特征选择的功能。最后,本方法在进行识别的时候,采用特征选择后的结果,在低维特征空间上比较待视频数据与预先采集的视频数据之间的相似性,可以有效地减少计算复杂性,增强方法的抗噪声干扰能力。将该方法应用到基于视频的人体行为识别应用中,可以快速准确地对视频中的人体行为进行识别。
【发明内容】

[0007]本发明的目的是克服现有技术的不足,提供一种无监督多视图特征选择的人体行为识别方法。
[0008]无监督多视图特征选择的人体行为识别方法包括如下步骤:
[0009]I)选用公共人体行为数据集KTH作为预先采集的包含不同人体行为类型的视频数据集,选用通过视频采集设备录取的人体行为视频作为待识别的人体行为视频;
[0010]2)对预先采集的包含不同人体行为类型的视频数据集提取m种类型的视觉特征表达,得到该视频数据集所对应的多视图特征数据矩阵X = [X(1), x(2),...,X(m)]T,其中
^、?,^,…,^叩是第V个视图下的特征数据矩阵,x:'}是从第i个视频数据中提取的 第V种类型的视觉特征表达,η是该视频数据集中所包含的视频数目;
[0011]3)对任意第V个视图,构建该视图相关的视觉相似图Aw,定义如下:
[0012]
【权利要求】
1.一种无监督多视图特征选择的人体行为识别方法,其特征在于包括如下步骤: 1)选用公共人体行为数据集KTH作为预先采集的包含不同人体行为类型的视频数据集,选用通过视频采集设备录取的人体行为视频作为待识别的人体行为视频; 2)对预先采集的包含不同人体行为类型的视频数据集提取m种类型的视觉特征表达,得到该视频数据集所对应的多视图特征数据矩阵X= [X(1),X(2),...,X(m)]T,其中f〗=是第V个视图下的特征数据矩阵,是从第i个视频数据中提取的第V种类型的视觉特征表达,η是该视频数据集中所包含的视频数目; 3)对任意第V个视图,构建该视图相关的视觉相似图Α(ν),定义如下:
【文档编号】G06K9/66GK103577841SQ201310557008
【公开日】2014年2月12日 申请日期:2013年11月11日 优先权日:2013年11月11日
【发明者】肖俊, 冯银付, 庄越挺, 计明明, 张鹿鸣 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1