基于3D平稳小波的运动轨迹行为识别方法与流程

文档序号：11211658阅读：569来源：国知局

本发明属于视频处理技术领域，更进一步涉及一种行为识别方法，可用于异常行为检测和人机交互。

背景技术：

近年来，计算机视觉作为一门新兴学科发展十分迅速，行为识别作为视频分析和理解的关键技术，重要的学术价值、潜在的商业价值和巨大的应用前景使其迅速成为计算机视觉领域研究的热点和难点，已广泛应用于视频检索、智能监控、机器人导航、智能交通及游戏娱乐等人机交互领域，越来越多的学者和机构在相关方面相继进行了大量的研究工作。人体行为分析的关键就是捕获视频中的运动信息以及帧序列间的关系，如何有效的从视频数据中获取时空信息成为行为识别领域的研究重点。一些学者发现小波变换多分辨率分析能力和优秀的时频分析特性有助于时空信息的挖掘和提取，将其与现有特征描述方法相结合用于行为识别。

(1).shaol,gaor.awaveletbasedlocaldescriptorforhumanactionrecognition[c]//bmvc.2010:1-10。这种方法将二维小波变换与兴趣点检测方法相结合用于人体行为识别。该方法在时空兴趣点周围的立方体中进行2d小波分解，可以获得具备鉴别性和可靠性的描述子，特征维度低，对噪声、光照等影响具有一定的容许性，但该方法在进行小波分解时只选取局部立方体内的三个代表平面，对数据的覆盖范围不足，获取空时信息不充分。此外对于运动或背景较复杂的情况，基于兴趣点检测方法鲁棒性较差。

(2).omidyeganehm,ghaemmaghamis,shirmohammadis.applicationof3d-waveletstatisticstovideoanalysis[j].multimediatoolsandapplications,2013,65(3):441-465。这种方法将3d小波变换与概率统计方法相结合用于人体行为识别。该方法将小波系数使用广义高斯分布拟合，能够在一定程度上获取视频序列空时信息以及小波系数间的依赖性，选用概率模型参数作为特征描述子有助于特征降维，但是仅采用全局特征表示方法对视频结构信息获取不足，且对复杂背景、噪声等干扰较为敏感。

视频中的二维空间域和一维时间域的特性存在很大的差异，因此从直觉上应该针对这两者采用不同的处理方式而不是仅将二维空间方法扩展应用于联合三维空间，沿着视频序列对兴趣点进行跟踪是近些年学者们发现的适于处理上述问题的方法，然而目前并没有学者使用小波变换提取视频中运动轨迹，以将轨迹的优势引入小波域行为识别。

技术实现要素：

本发明的目的在于针对上述已有技术的不足，提出一种基于3d平稳小波的运动轨迹行为识别方法，以更充分地提取视频序列中的时空信息，提高人体行为识别准确率。

实现本发明目的的方案是：利用时空可分离的3d平稳小波变换提取视频中的运动信息，通过基于熵的高频和中频小波系数子带加权融合和基于能量阈值的特征点提取，提高对噪声、背景干扰的鲁棒性，依据连续帧间特征点小波描述子欧式距离最小原则对特征点进行追踪提取运动轨迹，充分获取视频时空信息，并进一步滤除无关特征点。在所提取轨迹周围按不同系数子带方向统计并构建能量特征，最后使用词袋模型编码特征后，输入svm分类器实现行为识别，其具体实现步骤包括如下：

(1)对行为视频进行时空可分离的3d平稳小波分解：

(1a)将彩色视频数据转换为灰度数据，完成对视频数据的预处理；

(1b)沿时间维方向对视频数据进行一维平稳小波分解，分解总级数为2，得到三个包含时域信息的系数子带：低频系数子带tll，高频系数子带th和中频系数子带tlh；

(1c)分别逐帧对三个小波系数子带tll，th和tlh进行二维平稳小波分解，获取包含时空域信息的12×ls个12个方向的系数子带：tll-llj，tll-lhj，tll-hlj，tll-hhj；th-llj，th-lhj，th-hlj，th-hhj；tlh-llj，tlh-lhj，tlh-hlj，tlh-hhj，其中j为小波分解级数，j＝1,2,...,ls，ls为分解总级数；

(2)基于系数子带的熵对高频th和中频子带tlh进行加权：

(2a)将高频子带th和中频子带tlh中系数值量化到[0-255]的灰度值范围内，分别在两个频率子带内，计算高频子带th的熵eh和中频子带tlh的熵em；

(2b)计算高频子带th和中频子带tlh的权值：

其中，wh和wm分别表示高频子带th和中频子带tlh对应的权值，表示向上取整；

(2c)对高频子带th和中频子带tlh进行加权融合，得到融合后的系数子带：

fu＝wh×th+wm×tlh；

(3)基于系数能量阈值在融合后的子带内提取特征点：

(3a)对于融合之后的系数子带fu中的每一个点，在其三维立方体邻域内，计算该邻域中所有系数值的平均能量值

(3b)将作为融合之后的系数子带fu中的每一个系数的能量值e(x,y,t)，设定阈值为te，通过比较e(x,y,t)和te的大小，区分出特征点：

若e(x,y,t)≥te，则认为该能量值对应的像素点为特征点，

若e(x,y,t)＜te，则认为该能量值对应的像素点不是特征点；

(4)使用步骤(1c)中获得的各方向小波系数子带，对特征点进行描述，得到特征点的小波系数描述子；

(5)依据两点的小波系数描述子间的欧式距离最小原则，对相邻帧间特征点进行匹配，得到视频的运动轨迹；

(6)在沿轨迹弯曲的立方体内，构造小波方向能量直方图特征：

(6a)以提取的各条轨迹为中心，构建沿轨迹弯曲的立方体；

(6b)以步骤(1c)中获得的子带tlh-lhj为例，根据步骤(3)中能量计算方法，计算tlh-lhj中系数的能量值；

(6c)在沿轨迹弯曲的立方体中，将各级小波分解所得子带tlh-llj的系数所对应的能量值进行直方图统计，得到tll-llj子带方向的能量直方图向量ve；

(6d)依次计算高频子带th分解所得的th-llj，th-lhj，th-hlj，th-hhj，以及中频子带tlh分解所得的tlh-llj，tlh-lhj，tlh-hlj，tlh-hhj，共八个子带方向的能量直方图向量，并将八个能量直方图串接，得到描述当前轨迹的小波方向能量直方图特征vh＝[ve1,ve2,...,ved,...,ve8]，其中，ved表示第d个子带方向的能量直方图向量，d＝1,2,...,8；

(7)将所有视频样本的小波方向能量直方图特征划分为训练集vhtr和测试集vhte，使用词袋模型获到训练集vhtr的直方图向量htr和测试集vhte的直方图向量hte；

(8)使用训练集的直方图向量htr训练svm分类器，将测试集的直方图向量hte输入到训练好的svm中，输出测试集vhte对应的测试样本所属的行为类别。

本发明与现有技术相比具有以下优点：

1)本发明将轨迹跟踪引入小波域行为识别，能更有效的挖掘和获取视频中空时信息；同时结合基于熵的子带加权和基于能量阈值的特征点提取，提高了对背景、光照、噪声等的鲁棒性，并有效降低算法的计算复杂度；

2)本发明采用可时空分离的3d平稳小波变换，在保证平移稳定性的情况下，能获得更多方向的小波系数子带，并进一步降低计算复杂度；通过对小波系数能量的分方向统计，提高了系数能量特征的判别性。

附图说明

图1是本发明的实现流程图。

具体实施方式

参照图1，本发明的基于3d平稳小波的运动轨迹行为识别方法，步骤如下：

步骤1，使用时空可分离的3d平稳小波变换对行为视频进行分解，获得包含时域运动信息的高频和中频系数子带以及包含空时信息的各方向小波系数子带。

将行为视频视为由x,y,t三个方向构成的三维直角坐标系中的三维数据，其中x,y分别表示视频帧的宽方向和高方向，t表示时间方向；

3d平稳小波变换的实现过程是依次沿着x、y和t三个方向进行1d小波变换。为了获取更多结构信息，本发明采用时空可分离的3d平稳小波分解，首先沿着时间维t方向进行1d平稳小波变换，再对所获得的时域子带依次沿着x和y方向进行1d平稳小波变换，也就是空间维的2d平稳小波变换，此分解方法可以获得更多方向子带，且时间维和空间维的小波分解总级数可独立选择，能在一定程度上降低计算复杂度，其分解步骤如下：

(1.1)将数据集中的视频样本进行由彩色数据转换为灰度数据的预处理，以降低计算复杂度；

(1.2)沿视频数据t方向进行两级1d平稳小波分解，即沿时间维方向，将预处理后的视频数据分解为包含低频系数子带tll，高频系数子带th和中频系数子带tlh的三个时域系数子带；

(1.3)分别逐帧对三个小波系数子带tll，th和tlh进行2d平稳小波分解，获取包含时空域信息的12×ls个12个方向的系数子带：tll-llj，tll-lhj，tll-hlj，tll-hhj；th-llj，th-lhj，th-hlj，th-hhj；tlh-llj，tlh-lhj，tlh-hlj，tlh-hhj，其中j为小波分解级数，j＝1,2,...,ls，ls为分解总级数。

步骤2，利用熵值对步骤1中获取的时域高频子带th和中频子带tlh进行加权，实现不同频率的子带间融合。

(2.1)高频子带th表示行为视频帧间变化较剧烈的信息，即主要运动信息，系数值分布较集中；而中频子带tlh是分解低频系数子带tll所得，因此比高频子带th包含较多的近似信息，其中有非主要运动部位附带的运动信息或干扰信息，系数值分布较分散；系数值的分散程度可以用系数子带的熵来衡量，将高频子带th和中频子带tlh中系数值量化到[0-255]的灰度值范围内，分别在两个频率子带内，计算高频子带th的熵eh和中频子带tlh的熵em：

其中，mi表示高频子带th中，灰度值为i的系数所占比例，ni表示中频子带tlh中，灰度值为i的系数所占比例，log的底选为2。

(2.2)根据子带内系数值的分散程度与子带成正比，高频子带th的熵小于中频子带tlh的熵，且th包含的信息比中频子带tlh包含的运动信息更重要的特性，在进行加权处理时，给th设置较大的权值wh，给tlh设置较小的权值wm，这两个权值wh和wm的计算公式如下：

其中，wh和wm分别表示高频子带th和中频子带tlh对应的权值，表示向上取整；加权融合对非主要运动和干扰信息有一定的抑制作用；

(2.2)对高频子带th和中频子带tlh进行加权融合，得到融合后的系数子带：

fu＝wh×th+wm×tlh。

步骤3，基于系数能量阈值在融合后的子带内提取特征点。

(3.1)对于融合之后的系数子带fu中的每一个点，在其三维立方体邻域内，计算该邻域中所有系数值的平均能量值

其中，n为三维邻域中系数的总个数，w(x,y,t)表示融合后系数子带fu中位置为(x,y,t)的系数值；

(3.2)将作为融合之后的系数子带fu中的每一个点的能量值e(x,y,t)，设定阈值为te，通过比较e(x,y,t)和te的大小，区分出特征点：

若e(x,y,t)≥te，则说明该能量值对应的像素点属于主要运动的点，因此认为其是特征点；

若e(x,y,t)＜te，则说明该能量值对应的像素点对应非运动点，或者其产生的运动是非主要运动或是干扰运动，因此认为其不是特征点。

步骤4，使用步骤(1.3)中获得的各方向小波系数子带，对特征点进行描述，得到特征点的小波系数描述子，具体实现如下：

(4.1)以系数子带tll-llj为例，将各级小波分解所得子带tll-llj中与步骤(3.2)得到的一个特征点相对应的系数连接为一个向量，得到子带tll-llj中该特征点的描述向量其中，aj为特征点在第j级子带中对应的系数；

(4.2)计算步骤(1c)中得到的12个方向的系数子带中特征点fp对应的描述向量，并将这12个向量串接，得到特征点fp的小波系数描述子v＝[v1,v2,...,vk,...v12]，其中，vk表示第k个方向系数子带中特征点fp对应的描述向量，k＝1,2,...,12。

步骤5，依据小波系数描述子间欧式距离最小原则，通过相邻帧间特征点匹配，实现视频运动轨迹的提取：

(5.1)选取视频的第t帧为轨迹起始帧，对于第t帧中的一个特征点pt，依据特征点的小波系数描述子间欧式距离最小原则，在t+1帧中的一个m×m的窗口中寻找特征点pt的最佳匹配点pt+1：

其中，des(pt)表示当前帧特征点pt的小波系数描述子，des(pt+1)表示下一帧中的候选特征点pt+1的小波系数描述子，t＝1,2,...,nf，nf为视频的总帧数；

当在t+1帧的邻域窗口中未匹配到特征点pt+1时，则放弃当前轨迹，从第t帧中的下一个特征点开始新的特征点匹配；

(5.2)对步骤(5.1)中匹配到的候选特征点pt+1，以t+1帧为当前帧，按照步骤(5.1)中的方法，在t+2帧的指定窗口中为其匹配特征点pt+2，得到沿时间方向逐渐延伸的轨迹；

(5.3)重复步骤(5.2)，直到轨迹长度达到l时，从轨迹起始帧中的下一个特征点重新开始下一条轨迹的跟踪，其中，l是一个人为设定的固定值，可以避免因为轨迹过长而造成的轨迹漂移问题；

(5.4)在遍历了当前轨迹起始帧中所有的特征点之后，将下一帧作为新的轨迹起始帧，重复步骤(5.1)到(5.3)进行轨迹的跟踪，直到轨迹起始帧为第nf-l+2帧时，轨迹跟踪结束，得到视频中所有的运动轨迹，这样可以保证轨迹能覆盖视频绝大部分信息，此时获得的一系列特征点的坐标，就是从该视频中提取的人体行为运动轨迹。

步骤6，在沿轨迹弯曲的立方体内，构造小波方向能量直方图特征：

(6.1)在每条轨迹周围构建的一个大小均为c×r×l的立方体，其中c和r分别为立方体一个时间点横截面的长和宽，l为轨迹的长度。

(6.2)以步骤(1.3)中获得的子带tlh-lhj为例，根据步骤3中能量的计算方法，计算tlh-lhj中系数的能量值；

(6c)在沿轨迹弯曲的立方体中，将各级小波分解所得子带tlh-llj的系数所对应的能量值进行直方图统计，得到tll-llj子带方向的能量直方图向量ve；

步骤7，对小波方向能量直方图特征构建词袋模型，获取视频的表示，并训练svm分类器。

(7.1)根据不同人体数据集常用划分比例，将所有视频样本对应的小波方向能量直方图特征划分为训练集vhtr和测试集vhte；以人体行为数据库ucf-sports为例，该数据库包含10种不同的行为，共150个视频样本，每次将其中149个样本对应的小波方向能量直方图特征作为训练集，剩余1个样本对应的小波方向能量直方图特征作为测试集；

(7.2)对训练集vhtr采用k-means聚类方法生成词典dide×ce，通过词典dide×ce，将训练集vhtr和测试集vhte进行量化编码，得到训练集vhtr的直方图向量htr和测试集vhte的直方图向量hte，其中de表示特征维数，ce表示聚类中心数。

步骤8，使用训练集的直方图向量htr训练svm分类器，将测试集的直方图向量hte输入到训练好的svm中，输出测试集vhte对应的测试样本所属的行为类别。

为验证本发明的有效性，在常用的人体行为数据库kth和ucf-sports上，利用本发明进行行为识别；

识别的结果为：在数据库kth上的正确识别率为96.32％，在数据库ucf-sports上的正确识别率为95.33％。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：同鸣;李金鹏
技术所有人：西安电子科技大学
我是此专利的发明人

上一篇：一种装修用涂料及其制备方法与流程
上一篇：一种快速捕获视频流中新增运动区域的方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。