复杂视频监控场景中光流特征自适应量化方法

文档序号：6541836阅读：214来源：国知局

复杂视频监控场景中光流特征自适应量化方法
【专利摘要】一种数字图像处理【技术领域】的复杂视频监控场景中光流特征自适应量化方法，通过对视频空间进行基于光流特征的概率去噪后计算局部统计特征，然后进行视频空间位置的自适应量化，并将视频空间分割为若干个微型块区域；最后采用运动复杂度阈值过滤每一个微型块区域并判断量化数量，生成视觉字典，实现自适应量化。本发明基于光流的局部统计特征，描述视频监控场景中运动的有效性和多样性。融合有效像素比和运动复杂度特征，描述局部运动的活跃度，实现光流特征位置的自适应量化。基于运动复杂度特征，描述局部运动的多样性，实现光流特征方向的自适应量化。光流特征的自适应量化使其在下一步的基于词袋模型的场景分析中能发挥更好辨别力。
【专利说明】复杂视频监控场景中光流特征自适应量化方法
【技术领域】
[0001]本发明涉及的是一种数字图像处理【技术领域】的方法，具体是一种复杂视频监控场景中光流特征自适应量化方法。
【背景技术】
[0002]在智能视频监控中计算机视觉技术变得越来越重要，比如交通流量监控、事件检测或者拥堵检测等。在计算机视觉应用中行为分析是一项基本任务。但是鉴于环境条件的复杂性，如光照和天气变化、拥挤等，行为分析仍旧面临一些挑战。目前关于行为分析的研究主要分为两大类。一类是基于目标跟踪特征的方法。但是在复杂的场景下，仍旧缺乏可靠的多目标跟踪算法。此外，跟踪算法很难适应突然改变的运动在复杂的场景下，仍旧缺乏可靠的多目标跟踪算法。此外，跟踪算法很难适应突然改变的运动。因此另一类直接基于底层运动特征的方法更适合复杂监控场景分析。其中使用最多的一种特征是光流(opticalflow)，包含了大量的局部运动信息。
[0003]经对现有技术文献检索发现，一般通过对光流特征进行位置和方向的固定量化，如文献 Wang X,Ma X, Grimson WEL.“Unsupervised activity perception in crowdedand complicated scenes using hierarchical bayesian models，，([J].Pattern Analysisand Machine Intelligence, IEEE Transactions on, 2009, 31 (3): 539 -555.),将视频片段采用词袋方式表示，其中光流方向均匀量化成4个，位置量化通过对视频监控场景网格化实现，每个块区域尺寸为10X10。
[0004]这种固定量化方式使得其面临如下三个问题:1)降低量化精度会造成空间位置和方向分辨率的损失；2)提高量化精度会降低损失，但是会造成数据量增加；3)采用统一的量化精度，未考虑视频监控场景中实际的运动分布特征。

【发明内容】

[0005]本发明针对现有技术存在的上述不足，提出一种复杂视频监控场景中光流特征自适应量化方法，基于光流的局部统计特征，描述视频监控场景中运动的有效性和多样性。融合有效像素比和运动复杂度特征，描述局部运动的活跃度，实现光流特征位置的自适应量化。基于运动复杂度特征，描述局部运动的多样性，实现光流特征方向的自适应量化。光流特征的自适应量化使其在下一步的基于词袋模型的场景分析中能发挥更好辨别力。
[0006]本发明是通过以下技术方案实现的，本发明包括以下步骤:
[0007]第一步:对视频空间进行基于光流特征的概率去噪，具体步骤为:
[0008]1.1)对视频空间中每个空间点(X，y)上产生的光流特征数进行统计，并进行归一.V
化处理
【权利要求】
1.一种复杂视频监控场景中光流特征自适应量化方法，其特征在于，包括以下步骤: 第一步:对视频空间进行基于光流特征的概率去噪；第二步:对去噪后的视频空间计算局部统计特征，进行视频空间位置的自适应量化，并将视频空间分割为若干个微型块区域；第三步:采用运动复杂度阈值过滤每一个微型块区域并判断量化数量，生成视觉字典，实现自适应量化。
2.根据权利要求1所述的方法，其特征是，所述的第一步具体包括以下步骤: 1.1)对视频空间中每个空间点(x，y)上产生的光流特征数进行统计，并进行归一化处理:n
3.根据权利要求2所述的方法，其特征是，所述的噪声动态区域是指:对于给定最大阈值Thrmax,当P(x, y)>Thrmax,则空间点(x, y)属于噪声动态区域；所述的静态区域是指:对于给定最小阈值Thrmin,当P (X，y) <Thrmin,则空间位置(x, y)属于。
4.根据权利要求1所述的方法，其特征是，所述的第二步具体包括以下步骤: 2.1)将视频空间位置网格化，每个块区域大小为HXH，2 < HS 64，且H为整数； 2.2)对于视频空间中的块区域，计算有效像素比VPP以及运动复杂度MCD ； 2.3)根据有效像素比和运动复杂度，得到块区域活跃度ADzyVPP+d-1OMCD，其中:μ表示混合参数，O ^ μ ^ I ;然后对活跃的块区域进一步分割； 2.4)重复上述步骤2.2)和2.3)，直至块区域无法进一步分割，即所有的块区域均为不活跃，并得以将整个视频空间分割成L个微型块区域，对每个微型块区域从I到L进行编号。
5.根据权利要求4所述的方法，其特征是，所述的有效像素比
6.根据权利要求4所述的方法，其特征是，所述的分割是指:对于给定的活跃度阈值Thrffl,当AD≤Thrffl,且当前块区域的尺寸没有达到最小值LX L，2≤L≤10，L〈H，且L为正整数，则将当前块区域空间上分割成四个大小相等的块区域；当AD〈ThrAD，则表示当前块区域不活跃，不再进行分割。
7.根据权利要求1所述的方法，其特征是，所述的过滤是指:当第i个微型块区域的运动复杂度MCDi ^ ThrMCD, Thrra为运动复杂度阈值则将发生在该微型块区域内的光流特征的方向量化成8个，否则量化成4个。
8.根据权利要求1所述的方法，其特征是，所述的视觉字典是指:每个视觉单词编码形式为:A.R.D，其中:A表示微型块区域的编号且I;R表示方向量化的精度且R=4或者R=8 ；D表示方向编号且I≤D≤8 ;该视觉字典中包含的视觉单词总数为:(:.=Σ尺.其

i中=Csize表示字典的规模；民表示第i个块区域内方向量化的精度。
【文档编号】G06T7/20GK103871080SQ201410114805
【公开日】2014年6月18日申请日期:2014年3月25日优先权日:2014年3月25日
【发明者】樊亚文, 郑世宝, 吴双申请人:上海交通大学

完整全部详细技术资料下载

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。