基于非负矩阵分解的人体动作视频识别方法与流程

文档序号:12007370阅读:来源:国知局
基于非负矩阵分解的人体动作视频识别方法与流程

技术特征:
1.一种基于非负矩阵分解的人体动作视频识别方法,包括如下步骤:(1)预处理视频图像:(1a)输入90个人体动作视频图像;(1b)在输入的人体动作视频图像中,任选80个人体动作视频图像作为一个人体动作视频训练样本集,其余的10个人体动作视频图像各自作为一个人体动作视频训练样本集;(1c)利用矩阵实验室matlab的横向连接字符串strcat函数,将人体动作视频训练样本集和人体动作视频测试样本集中的人体动作视频图像,转换为时间连续的单幅图片序列;(1d)对单幅图片序列进行隔行采样,获得预处理的降采样图片序列;(2)检测空间兴趣点:(2a)分别将人体动作视频训练样本集和人体动作视频测试样本集中的降采样图片序列等分成8段;(2b)在每段降采样图片序列的第一帧图片中,采用多尺度2DHarris检测算子公式,计算获得每段降采样图片序列的第一帧图片中所有像素点处的响应值;(2c)将每段降采样图片序列的第一帧图片中像素点处的响应值大于等于1000的像素点定义为空间兴趣点;(3)构建立方体:(3a)在每个空间兴趣点所在的第一帧图片上,截取一个以空间兴趣点为中心,以24个像素点为边长的正方形图像块;(3b)沿着人体动作视频的时域方向,在第一帧图片之后的所有降采样图像序列的相同位置处截取一个正方形图像块,将所提取的正方形图像块,按照每帧图片在人体动作视频中的先后顺序排列组成一个立方体;(4)构造特征矩阵:(4a)用一个二维高斯Gaussian滤波器,分别对输入视频图像的所有立方体进行滤波处理,得到模糊化立方体;(4b)用模糊化立方体中各自所有像素点的灰度值,分别减去该模糊化立方体的像素点的灰度均值,获得去均值立方体;(4c)计算所有去均值立方体各自的二阶、三阶、四阶中心距矩阵;(4d)将去均值立方体的二阶、三阶、四阶中心距矩阵分别转换为一个列向量,将三个列向量首尾级联,组成一个列向量a;(4e)对人体动作视频训练样本集和测试样本集所有去均值立方体,重复步骤(4d),得到人体动作视频训练样本集的所有列向量b和10个人体动作视频测试样本集各自所有列向量;(4f)将人体动作视频训练样本集的所有列向量b,组成一个人体动作视频训练集特征矩阵,将10个人体动作视频测试样本集各自所有列向量,分别组成10个人体动作视频测试集特征矩阵;(5)训练字典:采用下式,对人体动作视频训练集特征矩阵进行分解,得到超完备字典:X≈D×Hs.t.||X-DH||22≤ε其中,X表示人体动作视频训练集特征矩阵,≈表示约等操作,D表示人体动作视频训练集特征矩阵分解得到的超完备字典,H表示人体动作视频训练集特征矩阵分解得到的系数矩阵,s.t.表示公式的约束条件,||·||2表示取二范数操作,ε表示满足约束条件的值;(6)分类:(6a)采用正交匹配跟踪OMP公式,利用超完备字典,计算10个人体动作视频测试集特征矩阵各自的稀疏表示系数向量;(6b)采用稀疏重构公式,分别利用10个人体动作视频测试集特征矩阵各自的稀疏表示系数向量,得到10个人体动作视频测试集特征矩阵各自的稀疏重构矩阵;(6c)用人体动作视频测试集特征矩阵减去该人体动作视频测试集特征矩阵的稀疏重构矩阵,得到一个与每类人体动作视频相对应的残差矩阵;(6d)对10个人体动作视频测试集特征矩阵,重复步骤(6c),得到10个与每类人体动作视频相对应的残差矩阵;(6e)从10个与每类人体动作视频相对应的残差矩阵中,分别找到每个残差矩阵中矩阵元素的最小值,将每个人体动作视频测试集归入与各自残差矩阵中矩阵元素最小值相对应的人体动作视频的所属的同一类中。2.根据权利要求1所述基于非负矩阵分解的人体动作视频识别方法,其特征在于,步骤(2b)所述的多尺度2DHarris检测算子公式如下:R=det(M)-0.04×tr2(M)其中,R表示每段降采样图片序列的第一帧图片中像素点处的响应值,det(M)表示莫拉维茨Moravec算子矩阵M的行列式,M表示莫拉维茨Moravec算子矩阵,tr(M)表示莫拉维茨Moravec算子矩阵M的迹。3.根据权利要求1所述基于非负矩阵分解的人体动作视频识别方法,其特征在于,步骤(4c)所述的计算所有去均值立方体各自的二阶、三阶、四阶中心距矩阵的步骤如下:第一步,按照下式,分别计算去均值立方体的二阶、三阶、四阶中心距矩阵元素的值:其中,mij表示去均值立方体的r阶中心距矩阵中位于i,j位置处的矩阵元素值,r表示去均值立方体中心距矩阵的阶数,r=2,3,4,i,j分别表示去均值立方体的像素点所处的坐标位置值,i=1,2,...24,j=1,2,...24,l表示组成去均值立方体的图像块个数,t表示组成去均值立方体的图像块在立方体中的序号,vijt表示组成去均值立方体的第t个图像块上位于i,j处的像素值;第二步,将去均值立方体的二阶、三阶、四阶中心距矩阵元素的值,构成去均值立方体的二阶、三阶、四阶中心距矩阵。4.根据权利要求1所述基于非负矩阵分解的人体动作视频识别方法,其特征在于,步骤(6a)所述的正交匹配跟踪OMP公式如下:argmin||T-DZ||2其中,T表示人体动作视频测试集特征矩阵,D表示超完备字典,Z表示人体动作视频测试集特征矩阵的稀疏表示系数向量,argmin表示取最小值操作,||·||2表示取二范数操作。5.根据权利要求1所述基于非负矩阵分解的人体动作视频识别方法,其特征在于,步骤(6b)所述的稀疏重构公式如下:C=D×Z其中,C表示人体动作视频测试集特征矩阵的稀疏重构矩阵,D表示超完备字典,Z表示人体动作视频测试集特征矩阵的稀疏表示系数向量。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1