基于DLLE模型的数据降维与特征理解方法与流程

文档序号:11865267阅读:684来源:国知局

本发明属于计算机视觉领域,提出一种有选择的、基于差分函数的智能降维新方法用于提高人体动作识别的准确性。



背景技术:

在计算机视觉领域,人体动作识别技术是一门比较重要的研究课题,人类日常生活所需的绝大多数的客观世界信息是通过视觉来获取的。随着科技的进步,使计算机视觉具有与人相似的视觉功效成为新的趋势。不仅要求智能计算机具有自主学习、理解、分析的能力,还要求其可以识别并理解外部环境中目标的动作,并进行更高层次的分析。目前人体动作识别的方法主要分为基于模板匹配的方法和基于状态空间的方法。模板匹配法是将输入视频转换成图像序列,然后在数据库中将样本序列进行标注,并提取特征作为动作模板,在待分类视频中通过已标注的动作模板比较之后进行识别,这种方法具有计算代价低,简单高效的优点,但是对动作持续的时间周期和噪声比较敏感。基于状态空间方法是将动作序列中的各个静态姿态或者动作状态作为一个状态节点,再把这些状态节点以概率的形式联系起来。其中每一个动作序列都被认为是这些静态姿态在不同状态节点中的一次遍历过程,计算出这些遍历过程中对应的联合概率,并选取最大的概率值作为标准实现动作分类。状态空间方法虽然解决了模板匹配法对对动作持续的时间周期和噪声比较敏感问题,但是状态空间方法涉及复杂的迭代运算。申请号为200810059129.4的专利提出了一种基于模板匹配的视点无关的人体动作识别方法,能在视频中识别几种预先定义的典型动作。构造模板时首先为每个样例动作计算多个投影视点下的动作历史图并提取极坐标特征,采用传统的流形学习方法将这些极坐标特征映射到至低维子空间中。但是传统的流形降维方法处理人体动作识别过程中的高维数据降低了人体动作识别的实时性、准确性。

基于人体动作特征位于嵌入在高维空间的低维流形结构这一事实,流形学习方法在人体动作识别方面逐渐得到应用。Roweis,S.指出了一个数据集或者图像的主要信息位于一个流形结构上,并提出局部非监督流形学习观点。Blackburn提出采用ISOMAP算法进行人体动作特征的非线性降维,实现人体动作识别。样本点密度稀疏程度、数据集间的关联性是传统的LLE算法提取图像低维特征过程中没有很好的解决问题,最后往往会导致从高维到低维的映射,获取的人体低维流形结构向量存在一定偏差,从而影响识别效果与鲁棒性。



技术实现要素:

针对此问题,本方法在LLE算法的基础上进一步改进,提出了基于DLLE(Linear Local Embedding of Difference)模型的人体动作识别新方法,DLLE模型引入判别样本点周围信息的选择机制,排除异类点干扰保证同类样本点更加紧密;为进一步增加样本点与周围点之间的关联性,采用样本点与周围点的差分作为基函数来拟合样本点信息。最后在真实环境下进行实验。结果证明了该方法在人体动作识别效果过程中有较强的鲁棒性和准确性。

为实现上述目的,本发明采用如下的技术方案如下:

首先,通过视觉传感器获取图像序列,进而对输入的动作图像序列进行分析,通过背景减除法提取出前景人体轮廓区域并二值化,研究动作的周期特性,对每个动作序列进行关键帧提取,提取出一个完整的动作周期序列。通过DLLE算法进行流行降维,得到低维特征向量,将其保存到动作数据库中。通过比较测试序列与训练样本库中动作序列的均值Hausdorff距离经最近邻分类器进行识别。具体包含以下步骤:

步骤1,获取图像。

使用Kinect采集人体动作,每2~4秒为一个动作序列。

步骤2,图像预处理与人体动作检测。

动作特征识别问题的首要环节是对视频图像进行预处理,并从视频图像序列中检测出目标动作质量较高的图像。高质量的人体动作目标提取结果对后续的人体动作特征提取和分类识别等研究起到了基础性的作用。

步骤2.1,获取视频序列:

背景建模:

设定在由1,2,……,n帧图片组成的视频序列,则采集这n帧图像中与(x,y)相同位置处的点的灰度值即可得到一个数组序列:{pi(x,y),i=1,2,...,n},其中i表示图像帧数。所以该点多对应的背景图像的像素就能够用这n帧图像像素值序列的中间值表示出来,即:

B(x,y)=Median(p(x,y)) (1)

其中,B(x,y)为背景图像在点(x,y)表示了像素的位置。

步骤2.2,人体动作提取。

背景减除法在静态背景下提取出的运动目标精确度较高。设当前图像帧为fc(x,y),背景图像参数帧为b(x,y),将当前图像帧与背景图像参数帧进行差分运算就可以得到前景图像dc(x,y)如下式:

dc(x,y)=|fc(x,y)-b(x,y)| (2)

由于背景减除后得到的背景图像仍为灰度图像,通常情况下直接使用灰度图像进行特征处理效果不好,需要进行二值分割,即图像二值化处理。首先选择分割阀T,前景图像表示 为dc(x,y),二值化化处理得到的差分图像用Rc(x,y)来表示,则计算图像Rc(x,y)的方法为:

步骤2.3,对二值化图像进行距离变换。

常用的几种距离:1)欧式距离,2)城市街区距离,3)棋盘距离,本方法采用欧式距离。

假设A(i,j)和B(m,n)为二值图像I中任意两个像素点,(i,j)和(m,n)分别是A和B两个像素点在二值图像I中的坐标,欧式距离被看做两点在高维空间中的真实距离,即:

距离变换针对的是二值图像,其中心问题是计算平面上的点到其中一个指定的子集中所有点的最小距离。应用在二值图像中,定义为所有像素点到前景目标像素点的距离。距离变换之后的灰度图像能够保持像素点间的空间信息,其直观的表现为,图像中前景目标的边缘、骨架得到加强。具体定义如下所示:

I为一幅二值图像,其中大小为m×n对I中任一点I(x,y)∈{0,1}其中x代表该像素行坐标,y代表列坐标,I(x,y)表示像素点的像素值。根据像素值将图像划分为两个集合(ob,Bg),其中ob={I(x,y)|I(x,y)=1}表示目标像素点集,ob={I(x,y)|I(x,y)=0}表示为背景像素点集。

对二值图像I的距离变换理解为I中所有像素I(x,y)到目标像素集ob像素的最短距离:

dt(x,y)=min{d((x,y),(x0,y0))} I(x0,y0)=1 (5)

步骤3,人体动作特征提取。

人体动作为的行走、跑步、跳跃,在一段连续的时间内会呈现重复性,为了减少识别过程的数据量,需要确定一个动作的开始与终止的位置,从而提取出一个周期的完整动作,使特征提取复杂度降低和提高特征识别效果,保证分类识别始终处于统一模式下,同时可以有效排除冗余图像的干扰,提高识别率。

通过研究人体运动轮廓采用运动人体轮廓的时空变化曲线分析行为的周期性,本方法对提取的运动人体轮廓,分别分析其高度、宽度、面积以及宽高比,统计其随时间变化所呈现出的周期特性。取出的跑步、行走、侧行动作的关键帧,提取出的每个动作的关键帧序列包括一个完整周期动作。

步骤4,DLLE模型的低维特征进行降维。

步骤4.1,寻找与样本点同类的、距离最近的M个近邻点。

本步骤中采用Dijkstra距离即流形空间中的一种测地线距离,它能够保持样本点之间的曲面特性,用它作为约束以增加类别信息,其具体公式如下:

Y'=Y+βmax(Y)Δ (6)

其中Y'为计算后的距离,Y为Dijkstra距离,max(Y)为同类点之间所允许出现的最大距离,β∈[0,1]为经验参数,它表示各个点间的距离权重的大小。Δ取0或1,当属于同类时取1,不属于同类时取0。

步骤4.2,引入误差能量函数ε(A)。

Ai-Aj表示Ai的M个近邻点的差分函数,表示Ai与Ai-Aj之间的权重系数,且满足如下约束条件:

步骤4.3,将随机选取的样本点通过权值矩阵映射到低维空间中。

映射条件满足如下所示能量函数:

其中ε(B)为损失函数值,Bi为Ai的输出量,Bi-Bj表示Bi的M个近邻点的差分函数,约束条件为:其中I为n×n维单位矩阵。存储在N×N的稀疏矩阵A中。当Aj是Ai的近邻点时,否则,则损失函数可重写为:

其中M是一个N×N的对称矩阵,其表达式为:

M=(I-D)T(I-D) (10)

步骤5,MVHD(The Hausdorff Of Moving Variance)算法人体动作识别。

步骤5.1,计算每个行为序列的15帧图片Hu矩Bi与模板A的Hu矩之间的距离:

其中

Bi的每一列表示一帧图像的Hu矩,共15组。

A的表达式:

步骤5.2,计算矩阵Bi与模板A的Hausdorff距离。

s(B(i),A)=min||B(i)-A(j)|| (13)

得到距离向量为di=(di1,....di15),i=1,...,48。这个距离向量表示第i个行为序列的15帧图片与模板A的距离。

步骤5.3,在Hausdorff距离(HD)的基础上进行去方差再取均值。

将di的每个分量都减去均值并求取方差

设定阀值,当方差大于该阀值时,则舍去该方差所对应的然后将剩余的分量求均值作为判别依据,即:

其中n=15,i=1,2,...,48,m为方差大于阀值分量的个数。

与现有技术相比,本发明具有以下优点:

本方法提出了基于差分函数与类别信息的邻域保持嵌入算法在智能服务机器人对人体动作识别中的运用,DLLE模型在降维时既能保持流形的局部几何结构,又能充分利用原始高维数据的类别信息,实现了从无监督到有监督的扩展。通过对DLLE模型的实验,证明其降维的有效性、高效性;并充分证明了其在动作识别方面的优越性。本专利定性和定量地验证了所提方法能够有效提高人体动作识别的精度。

附图说明

图1为本发明所涉及方法的流程图。

具体实施方式

下面结合附图对本发明专利进行进一步详细说明。

基于DLLE模型的低维特征在人体动作识别流程图如附图1所示,具体包含以下几个步骤:

步骤1,获取图像。

步骤2,图像预处理与人体动作检测。

运动特征识别问题的首要环节是对视频图像进行预处理,并从视频图像序列中检测出质量较高的运动目标图像。高质量的运动目标提取结果对后续的运动特征提取和分类识别等研究起到了基础性的作用。

步骤2.1,获取视频序列。

步骤2.2,人体动作提取。

步骤2.3,对二值化图像进行距离变换。

采用的欧式距离参与的距离变换,欧式距离可以看做两点在高维空间中的真实距离。

步骤3,人体动作特征提取。

步骤4,DLLE模型的低维特征进行降维。

步骤4.1,寻找与样本点同类的、距离最近的M个近邻点。

步骤4.2,引入误差能量函数ε(A)。

步骤4.3,将随机选取的样本点通过权值矩阵映射到低维空间中。

步骤5,MVHD(The Hausdorff Of Moving Variance)算法人体动作识别。

MVHD算法优点:一是计算均值和方差,从而删除掉一些异常数据;二是选取剩余数据的均值而不是最大值作为距离判断的标准,可以进一步平滑噪声;三是选取15帧图片来判断一个行为,当某帧图片出现异常时不会明显的影响到整个行为的识别。

步骤5.1,计算每个行为序列的15帧图片Hu矩Bi与模板A的Hu矩之间的距离。

步骤5.2,计算矩阵Bi与模板A的Hausdorff距离。

步骤5.3,在Hausdorff距离(HD)的基础上进行去方差再取均值。

最后,度量两动作的相似度进行最终的人体动作识别。

本文提出了基于差分函数与类别信息的邻域保持嵌入算法在人体动作识别中的运用,DLLE模型在降维时既能保持流形的局部几何结构,又能充分利用原始高维数据的类别信息,实现了从无监督到有监督的扩展。通过对DLLE模型的实验,证明其降维的有效性、高效性;并充分证明了其在动作识别方面的优越性。本专利定性和定量地验证了所提方法能够有效提高人体动作识别的精度。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1