一种基于流行学习的人体行为识别方法

文档序号：8498829阅读：157来源：国知局

一种基于流行学习的人体行为识别方法
【技术领域】
[0001] 本发明涉及行为识别判断领域，具体涉及一种基于流行学习的人体行为识别方法。
【背景技术】
[0002] 人体行为识别是一个新兴的研宄领域，其涉及到图像处理、模式识别、人工智能等多门学科，并在智能监控、人机交互、智能机器人、虚拟现实和运动分析等领域有着广泛的应用。
[0003] 人体行为识别研宄形式多样，内容丰富，既有手势识别、表情分析等局部的识别研宄，也有针对独立个体的行为识别研宄，还包括群体间的交互行为分析等。总体来说按照数据采集方式可以将人体行为识别研宄分为基于非视觉的方式和基于视觉的方式。基于非视觉的方式主要是利用放置在人体或者人的活动空间内的传感器获取人体运动参数。这种方法获取的人体运动参数较为精确，却会给人们生活带来不便。相对于前者，基于视觉的方式能够获得更丰富的信息，目前基于视觉的方式是人体行为识别研宄的主流方法。
[0004] 近年来，国内加速推进人体行为识别领域的研宄及其成果的产业化应用，取得了较大进展。据不完全统计，2012年新立项的973项目"面向公共安全的社会感知数据处理"，将运动目标行为分析和群体行为分析列为待突破的关键技术之一；973项目子课题"非结构化信息的内容理解与语义表征"，将基于计算机视觉的行为识别列为主要研宄内容之一。科技部设立了中德合作重点项目"智能家庭服务监控机器人"，涉及到室内发生的人体跌倒等异常行为检测关键技术研宄，交通部设立了"长途客车运输驾驶疲劳机理与检测方法研宄"课题，用于驾驶员行为分析研宄。此外，近年来国家每年还资助了多项与人体行为有关的863计划项目、国家自然科学基金面上项目、国家自然科学青年基金项目，主要涵盖了以下研宄内容：各种活动场景和各种摄像条件下基于计算机视觉的单人/多人/群体行为分析、异常行为检测、驾驶员疲劳行为监测及预警、运动技术诊断等，基于可穿戴传感的行为感知、生理状态监测、运动技术诊断、人机交互等，基于多模传感的行为识别以及面向无线传感网络（如移动终端）的用户行为识别研宄等。
[0005] 人体行为识别的关键步骤是人体行为数据的处理。采集人体的行为数据往往拥有很高的维度，其中夹杂着很多的噪音数据。常用的降维方式有主成分分析法（PCA)与高斯过程隐变量模型（GPLVM)。相比较PCA，流行学习能够保持数据集中数据之间的局部领域关系，跟适合表征人体运动。相比较GPLVM，流行学习不需要对数据进行大量优化，并且能够把高炜数据点的局部关系传递到低炜空间中。所以用流行学习，数据库越大，训练得到的运动模型就能覆盖更多的运动变化。将流行学习用到行为识别的数据处理方面，有跟好的识别效果。

【发明内容】

[0006] 本发明的主要目的在于克服现有技术的不足，提供一种基于流行学习的人体行为识别的方法，通过流行学习在降低维度方面的优越性，提高行为识别的准确度。
[0007] -种基于流行学习的人体行为识别方法，包括如下步骤：
[0008] 通过kinect获取人体场景深度数据；
[0009] 对深度数据进行处理，获取笛卡尔坐标系下三维投影图；
[0010] 将笛卡尔坐标系下三维投影图数据输入流行学习算法中，获得降维去噪后低维稳定的流行深度数据；
[0011] 根据流行深度数据进行行为分类识别。
[0012] 本发明的有益效果在于，本发明主要使用计算机高级程序语言并借助微软.net 框架、微软的kinectsdk和微软kinect摄像头实现，提供一种基于流行学习的人体行为识别方法，降低了行为识别特征数据的维度，把高维度不稳定数据转变为低维度稳定的行为特征，很好的提高了行为识别的准确度。
[0013] 当前，流行学习已经成为数据降维研宄中的一个热点方法，尤其在模式识别领域得到快速的应用，并且获得了很好的效果。通常情况下数据集的本征维数总是比其真实的维数即表象维数要小很多，所以在数据高维情形下，降维方法成为了对现实世界中待研宄的复杂对象进行建模、分析的有力工具。降维方法不仅可以使要处理的数据量锐减，带来计算量上的精简，而且还可以大大改善数据的可理解性。
[0014] Kinect是微软研发的一款RGB-D摄像头，相对于传统的摄像头采取RGB图像，Kinect可以采集深度图像。利用深度图像可以很好的还原场景的三维立体结构，为提取行为识别的特征提供了更多的选择。利用Kinect研宄人体行为可以融合视觉和非视觉研宄方法的优点，可以像佩戴式传感器一样精确地获得人体关节点三维信息，而不会给人带来生活不便，同时Kinect能够获得场景图像，部分基于视觉的行为识别技术也可以继续使用，且结合深度信息的视觉处理方法可以有效屏蔽复杂背景的干扰，这是单纯基于视觉的研宄方法所不容易实现的。
【附图说明】
[0015] 图1所示为本发明识别人体行为方法流程图。
[0016] 图2所示为本发明人体场景深度示意图。
[0017] 图3所示为本发明人体遮照示意图。
[0018] 图4所示为本发明人体分割示意图。
[0019] 图5所示为本发明笛卡尔坐标系示意图
[0020] 图6所示为本发明笛卡尔投影图
[0021] 具体的实施方式
[0022] 下文将结合附图详细描述本发明的实施例。应当注意的是，下述实施例中描述的技术特征或者技术特征的组合不应当被认为是孤立的，它们可以被相互组合从而达到更好的技术效果。在下述实施例的附图中，各附图所出现的相同标号代表相同的特征或者部件，可应用于不同实施例中。
[0023] 本发明主要使用计算机高级程序语言并借助微软.net框架、微软的kinectsdk 和微软kinect摄像头实现，能够实现对人体行为的识别。
[0024] -种基于流行学习的人体行为识别方法，步骤如下：
[0025] 步骤SI10获取人体场景深度数据。
[0026] 利用kinect摄像头获取人体场景深度图像，如图2所示。深度图像与普通的图像不同点在于其每一像素数值代表着深度的距离，深度图像能更好的还原三维的信息，深度图像有着很高的抗干扰性，外界光线强弱不同的情况下，kinect摄像头能采集相同的深度数据，所以能在白天和夜晚很好的工作。利用深度数据检测到人体深度数据。
[0027] 步骤S120对深度数据进行处理，获取笛卡尔坐标系下三维投影深度图。
[0028] 利用场景深度图，通过最优阈值法将场景场景深度图中的人体识别出来生成人体遮照图，如图3所示。根据图像的灰度特性来确定一个灰度阈值，并将图像中每个像素的灰度值与所确定的灰度阈值相比较，如果属于同一个部分的像素，则表明该像素的集合就是同一个物体。
[0029]把M*N的二维图像X在像素（i，j)处灰度值记为f(i，j)，设t为图像的一个阈值，则分割原则为：
[0030] 目标部分：0 = {f(i，j)彡t| (i，j)GX}
[0031]背景部分：B={f(i,j)>11(i,j)GX}
[0032] 在确定阈值时，如果阈值定的过高，物体点可能会被认作背景；如果定的过低，贝lj 会发生背景点当做目标点。判断最优阈值过程如下：
[0033] (1)随即初始一阈值T;
[0034] (2)对f(x，y)的每行进行检测，产生的图像AUy)的灰度遵循如下规则：如果 ;^，7)和;^，7-1)处在不同的灰度带上，则;^(1，7)=1^ ;否则;^(1，7)=1^。1^是指定的边缘灰度级，"是背景灰度级；
[0035] (3)对f(x，y)的每列进行检测，产生的图像f2(x，y)的灰度遵循如下规则：如果 ;^，7)和;^-1，7)处在不同的灰度带上，则;^(1，7)=1^ ;否则;^(1，7)=1^;
[0036] (4)对于边缘图像，如果f(X，y)和f2(x,y)中任何一个等于LE，则f(X，y) =LE;否贝1Jf(x，y)=Lb;
[0037] (5)图像中的最小和最大灰度分别为ZJPZm，令阈值为：
[0038]
【主权项】
1. 一种基于流行学习的人体行为识别方法，其特征在于，包括如下步骤：通过kinect获取人体场景深度数据；对深度数据进行处理，获取笛卡尔坐标系下三维投影图；将笛卡尔坐标系下三维投影图数据输入流行学习算法中，获得降维去噪后低维稳定的流行深度数据；根据流行深度数据进行分类识别。
2. 如权利要求1所述的一种基于流行学习的人体行为识别方法，其特征在于，所述的对深度数据进行处理，获取笛卡尔坐标系下三维投影图步骤包括：利用场景深度图体识别出来生成人体遮照图；利用人体深度遮照图得到人体分割图；利用人体分割图中深度数据，投影到笛卡尔坐标系，得到三维投影图。
3. 如权利要求1所述的一种基于流行学习的人体行为识别方法，其特征在于，所述的根据流行深度数据进行行为分类识别步骤包括：将得到的三维投影图数据输入流行学习算法中，获得低炜稳定的流行深度数据；将流行深度数据输入SVM分类器中，使用高斯核函数进行分类；识别出人体行为。
4. 如权利要求1所述的一种基于流行学习的人体行为识别方法，其特征在于，所述的根据流行学习，其步骤包括：构造邻接图G。计算每个样本点与其它所有样本点之间的欧式距离（欧几里得距离）；计算最短路径。对于样本点xl和x2,计算在邻接图G中的最短路径；计算d维嵌入。将多维尺度分析算法应用到最短路径距离矩阵％中，构造保持内部流形全局几何特性的d维嵌入坐标Y，我们通过极小化下列目标函数来获得全局低维坐标 Y ：
5. 如权利要求1所述的一种基于流行学习的人体行为识别方法，其特征在于，所述的根据流行深度数据进行分类识别，其包括：利用svm二维分类推广到多分类，采取如下svm决策函数：
取决策函数f1 (Xi)，f2 (Xi)，???，fm (Xi)中最大的上标J，则将样本划分到J类，即识别出行为。
【专利摘要】本发明提供一种基于流行学习的人体行为识别方法，主要利用计算机高级程序语言并借助微软.net框架、微软的kinect sdk和微软kinect摄像头实现。流行学习人体行为识别方法步骤包括：获取人体场景深度数据；对深度数据进行处理，获取在笛卡尔坐标系下的三维投影图；将投影后的三维投影图放入流行算法中降维去噪，获得降维去噪后的流行深度数据；将流行深度数据输入svm分类器中识别人体行为。本发明降低了行为识别特征数据的维度，提取低维稳定的行为特征，能够有效识别人体行为，提高识别准确率。
【IPC分类】G06K9-66, G06K9-00
【公开号】CN104820821
【申请号】CN201510179381
【发明人】侯振杰, 陆中秋, 陈辰, 陈永康, 吴卓燃, 张健
【申请人】常州大学
【公开日】2015年8月5日
【申请日】2015年4月15日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：侯振杰;陆中秋;陈辰;陈永康;吴卓燃;张健;
技术所有人：常州大学;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。