一种基于频域的视频流模糊检测方法

文档序号:7818630阅读:417来源:国知局
一种基于频域的视频流模糊检测方法
【专利摘要】一种基于频域的视频流模糊检测方法,包括如下步骤:对输入视频流按照场景不同进行分割,计算运动矢量;计算视频块的DCT系数,并统计出整帧各个频率分量的非零DCT系数个数矩阵A1;计算视频块的主导方向角度;计算视频块主导方向的后验概率密度;计算出权重值,构造初始权重矩阵,对初始权重矩阵中的各个参数作对应调整,得到权重矩阵;计算帧清晰指数和块清晰指数,并对和作归一化;由和归一化后的清晰指数求出模糊指数,确定整个场景的全局模糊阀值,判断出全局模糊帧和局部模糊帧。本发明大大减少了算法运算复杂度与所需内存空间,能准确检测出全局模糊帧和局部模糊帧并定量判断模糊程度;适用于各种视频流尤其是体育运动视频流的模糊检测。
【专利说明】一种基于频域的视频流模糊检测方法

【技术领域】
[0001] 本发明属于计算机软件算法领域,涉及视频图像处理技术,特别是一种基于频域 的视频流模糊检测方法。

【背景技术】
[0002] 随着三网融合的最主要应用--"泛视频"产业的蓬勃发展,大量非专业摄影视频 数据如泉水般突涌出来,并被广泛地应用于手机视频、CMMB (中国移动多媒体广播)手机电 视、IPTV (Internet Protocol Television)和互联网视频业务。然而由于普通摄影器材 的局限性以及广大摄影爱好者拍摄技术的参差不齐,使得非专业摄影采集到的视频流质量 差异巨大,难于只经过简单的常规后期处理就直接应用于节目制作、压缩存储、视频传输和 视频搜索等业务。
[0003] 模糊,尤其运动模糊是泛视频中最常见最头痛的问题;竞技体育视频中,运动模糊 更是最普遍的现象。因此作为视频预处理技术之一的自动模糊检测技术倍受关注。该技术 能为视频编辑、视频搜索和视频压缩等技术的实施带来方便,并为上述技术改进提供素材、 开辟创新观点。视频模糊检测是一项判断视频帧是否模糊、模糊程度是多少的技术。在视 频非线性编辑领域模糊检测技术能协助视频预处理人员丢弃模糊程度大的视频帧,提高编 辑效率;在视频搜索领域模糊检测技术能提高关键帧和重要区域检测与提取效能,从而大 大改进搜索技术的准确性和实时性;在视频压缩领域模糊检测技术能检测出模糊帧与模糊 区域,针对模糊帧和模糊区域的特殊编码模式(如:模糊帧不能作为参考帧编码、模糊区域 采用大量化步长)能进一步推动基于视频内容的智能压缩技术的深化改革与日趋成熟;在 视频传输领域模糊检测能协助预测编码后的码率,从而为实现泛视频在通信网络和数字终 端的智能高效传输添砖加瓦。
[0004] 现有的视频模糊检测技术大多是基于视频帧像素的统计参数判断,比如像素的自 相关函数、熵、灰度值变化情况、梯度值、能量、密度函数。其中Stefan Roth和Zhu提出的 用整帧图像的灰度梯度呈现出的重尾分布(如图1所示,大量灰度梯度值集中于小值区域 形成比后重的拖尾,少量灰度梯度值具有显著的大值形成尖峰。当图像清晰时灰度梯度分 布会呈现出后重宽大的拖尾,图像越模糊拖尾越窄越薄)进行模糊检测能有效地判断出两 个视频帧谁更具有全局模糊,用视频帧中各物体部分的灰度梯度的重尾分布进行模糊检测 能有效地判断出两个视频帧中相同物体部分谁更具局部模糊。该方案首先对同一场景的视 频流进行背景建模,然后提取运动目标,当运动目标区域比例s (s=前景物体区域大小/视 频帧大小)小于阀值?;时认为该视频帧没有运动目标而结束模糊检测;当s大于?\时认为 整个视频帧都是运动目标,从而用整帧图像灰度梯度的重尾分布确定该视频帧是否具有全 局模糊;当s小于?\大于?;时认为该视频帧有部分运动目标,从而用部分运动目标的重尾 分布确定该视频帧是否具有局部模糊。
[0005] 在频域进行模糊检测的方法中Karl S. Ni和Hanghang Tong提出的方法具有代 表性,该方案通过哈尔小波变换来分析整幅视频图像的边缘类型和尖锐程度,并与清晰的 参考图像进行比较从而判断被检测视频图像是否模糊,及模糊程度如何。
[0006] Stefan Roth和Zhu提出的灰度梯度重尾分布方案有如下缺点:1.运算复杂耗时 对同一场景的视频流进行背景建模需要几十到上百幅视频帧进行大量的迭代运算,有时算 法会不收敛从而得不到该场景的背景图像,最终导致检测方案失败。2.所需内存大、成本 高背景重构和运动目标提取工作需要将几十至上百幅未压缩的视频帧放入内存进行处 理,以CIF大小(352X288)的视频为例所需存储空间100MB,而普通高清视频(1920X1080) 则需要1.6GB的存储空间。3.检测准确度不够高不同内容不同清晰度的视频帧可能会有 近似的灰度梯度分布4.仅适用于固定摄像头的监测视频的模糊检测,不适用于普通视频尤 其是体育竞技视频的模糊检测。
[0007] Karl S. Ni和Hanghang Tong提出的哈尔小波变换分析方案有如下缺点:1.只 能检测视频帧的全局模糊,不能检测出视频帧的局部模糊。2.需要清晰的内容相同或相近 的视频巾贞作为参考判断。


【发明内容】

[0008] 为克服现有视频图像模糊检测方法运算量大,所需占用硬件存储设备容量巨大, 需要清晰参考帧的技术缺陷,本发明公开了一种基于频域的视频流模糊检测方法。
[0009] 本发明所述基于频域的视频流模糊检测方法一种基于频域的视频流模糊检测方 法,包括如下步骤: 51. 对输入视频流按照场景不同进行分割,对同一场景的视频帧按照从左到右、从上 到下的顺序分为若干BxXB y大小的视频块,Bx、By分别表示水平和垂直方向视频块中像素点 个数,计算视频块的DCT系数,并统计出整帧各个频率分量的非零DCT系数个数矩阵A1 ;按 照(1)式,计算视频块的主导方向特征,并取与(1)式计算值最接近的划分角度作为主导方 向角度;

【权利要求】
1. 一种基于频域的视频流模糊检测方法,其特征在于,包括如下步骤:
51. 对输入视频流按照场景不同进行分割,对同一场景的视频帧按照从左到右、从上 到下的顺序分为若干BxXB y大小的视频块,Bx、By分别表示水平和垂直方向视频块中像素点 个数,计算视频块的DCT系数,并统计出整帧各个频率分量的非零DCT系数个数矩阵A1 ;按 照(1)式,计算视频块的主导方向特征,并取与(1)式计算值最接近的划分角度作为主导方 向角度;
其中F(0, j)与F(i,0)为DCT系数,所述划分角度为: 0,1*360° /B,2* 360° /B,…(B-l)*360° /B;B 为角度划分参数;
52. 按照(2)式计算视频块主导方向的后验概率密度;
其中
为针对内容content的概率,
为该主导方向角度〃的概率;根据 Α-- ?.?ι按内容和主导角度对视频帧的每个块进行分类,统计得到各种分类各个频率 分量下的非零DCT系数个数矩阵Α2 ; 按照(3)式对同一场景不同视频帧的分块进行运动矢量计算找出同一场景视频帧中各 类块的匹配块;
(3) 其中s表示当前视频帧的像素值,c表示参考视频帧的像素值,MVX、MVy分别表示水平 或垂直运动矢量,Bx、By分别表示水平和垂直方向视频块中像素点个数,SAD ()表示对括 号内的内容计算绝对误差和;min ()表示取最小值;
53. 按照(4)式计算出权重值,
(4) 其中奮+*|·为权重调整函数; 构造B阶矩阵作为初始权重矩阵,将根据(4)式得到的权重值对初始权重矩阵中的各 个参数作对应调整,得到最终权重矩阵;
54. 用步骤S1统计出的整帧各个频率分量的非零DCT系数个数矩阵A1乘以该帧的权 重矩阵得到帧清晰指数用步骤S2统计出的各类视频块各个频率分量下的非零DCT系 数个数矩阵A2乘以其相应的权重矩阵得到各视频块的块清晰指数,并对元^.和作 归一化;
55. 由匕和+?...归一化后的清晰指数求出模糊指数,根据模糊指数分布将场景中的 各个帧分为清晰帧与非清晰帧两类,以非清晰帧中的最大模糊指数作为该整个场景的全局 模糊阀值DTA ; 再根据各类匹配块的模糊指数分布分为清晰块和非清晰块,以非清晰块中的最大模糊 指数作为该类视频块的局部模糊阀值DTP ; 对每一个视频帧的模糊指数与全局模糊阀值DTA进行比较,超过DTA阀值则视为全局 模糊帧,模糊指数与模糊阀值的比值计为全局模糊程度;对每一类视频块的模糊指数与该 类的局部模糊阀值DTP进行比较,超过DTP阀值视为模糊块,当模糊块的个数超过占整个视 频帧总块数的C%时,视该帧为局部模糊帧,所述C为预设的局部模糊帧比例判断阀值,各块 模糊指数与对应的局部模糊阀值比值的平均值计为局部模糊程度。
2. 如权利要求1所述的基于频域的视频流模糊检测方法,其特征在于,所述步骤S1、S3 中角度划分参数B=8,所述划分角度为0°、45°、90°、135°、180°、225°、270°、315° ; 所述(4)式为:
3. 如权利要求1所述的基于频域的视频流模糊检测方法,其特征在于,所述步骤S2中 根据按内容和主导角度对视频帧的每个块进行分类。
4. 如权利要求1所述的基于频域的视频流模糊检测方法,其特征在于,所述步骤S5中 将清晰帧与非清晰帧、清晰块与非清晰块的模糊指数分成两类的方法为K-中心点聚类法。
5. 如权利要求1所述的基于频域的视频流模糊检测方法,其特征在于,所述C=15至 40。
【文档编号】H04N17/00GK104301722SQ201410607582
【公开日】2015年1月21日 申请日期:2014年11月3日 优先权日:2014年11月3日
【发明者】邬震宇, 沈晓峰, 万群, 冯健, 周代英 申请人:电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1