一种基于光流方法的视频检索系统的制作方法

文档序号:6451858阅读:145来源:国知局
专利名称:一种基于光流方法的视频检索系统的制作方法
技术领域
本实用新型涉及计算机模式识别处理系统,特别是涉及一种基于光流方法的视频检索系统。
背景技术
基于内容的视频检索系统一直是多媒体信息研究领域的热点问题。系统的大致工作模式是把给定的原始视频依据图像帧之间的突变或是渐变方式分割成若干相关的独立单元镜头;然后,对每个被分割出来的镜头提取一定的特征作为该镜头的索引结构;最后, 依据所建立的索引结构计算待测镜头与目标镜头之间的相似度,从而使得用户在提交了浏览或查询的请求时匹配出相应的结果。依据提取特征的不同,视频检索的现有系统可以细分为基于颜色特征的系统、基于域空间特征的系统、基于形状特征的系统、基于运动特征的系统等。基于颜色特征系统的代表工作首先是由!^erman等人提出来的(参见A. M. Ferman, A. M. Tekalp,and R. Mehrotra. Robust Color Histogram Descriptors for Video Segment Retrieval and Identification. IEEE Transaction on Image Processing,Vol. 11,No. 5, pp. 497-508,2002)。他们综合考虑镜头中所有帧的颜色直方图信息,利用阿尔法裁剪颜色直方图的系统去构造视频的镜头索引结构,对所有帧相应直方图量化分量上的值进行排序,然后根据排序计算出排序的中值,围绕中值选取相应的邻域求取均值,以此作为最后的直方图,当邻域选取为0时,阿尔法裁减平均算子退化为中值,当邻域选取可以覆盖镜头内所有的帧时,该算子退化为均值。然而,基于阿尔法裁剪颜色直方图的系统具有两个缺点 首先,它丢弃了帧内的空间信息;第二,对于检索排序而言每一个直方图的系数分量都要进行计算,通常直方图的尺寸较大,这使得检索的过程极为费时。对于一个镜头,我们还可以考虑其帧内的空间频率内容和帧间的统计信息,即域空间特征。空间频率的内容由离散余弦变换(DCT)获得,对于不同的频率系数,基于一定的概率统计模型去描述其在一个镜头内的信息。由于在DCT域中,低频分量具有更大信息。Lee等人提出了基于由粗至精级联结构的快速检索方案(参见H. C. Lee and S.D.Kim. Rate-driven Key Frame Selection Using Temporal Variation of Visual Content. Electronics Letters, Vol. 38,No. 5, pp. 217-218,200 ,该方案仅根据首几个低频 DCT 系数便可去除大量的不相似的镜头,仅有少量的镜头就能够传至更精细的下一级进行细检, 计算量因此被大大减少。域空间特征的缺点就是很多时候并不能真实反映视频的语义内容,因此就限制了只能在某些特殊的场合使用。镜头的关键帧可以作为镜头内容的重要表示,一旦关键帧选定,研究的对象就从视频转化为图像,利用图像中物体或区域的形状特征是一个有效而重要的手段。现有的基于形状特征的视频检索方法主要有两种,一种是^iang等人[9]使用的轮廓特征 (参见 D. S. Zhang and G. J. Lu. Generic Fourier Descriptor for Shape-based Image Retrieval. IEEE International Conference on Multimedia and Expo, pp.425—428,2002),采用物体边界的傅立叶变换作为其形状描述;一种是区域特征,主要用来描述物体上的每一点与其他点之间的联系程度,这方面的代表工作有Li等人使用的形状无关矩(参 JAL Ζ. M. Li, J. Zhang, Y. J. Liu, and H. Li. The Curve-structure Invariant Moments for Shape Analysis and Recognition. Ninth International Conference on Computer Aided Design and Computer Graphics, pp. 163-197,2005)、Cakmakov 等人使用的旋转函数(参 JAL D. Cakmakov and Ε. Celakoska. Shape Matching of Digital Curves. Proceedings of the 4th International Symposium on Image and Signal Processing and Analysis, pp. 457-461,2005)和 Zhang 等人使用的小波描述符(参见 H. Μ. Zhang, Q. H. Wang, Y. X. Kan, J. H. Liu,and Y. W. Gong. Researches on Hierarchical Image Retrieval Model Based on Wavelet Descriptor and Indexed by Half-Axes-Angle using R-Tree. International Conference on Machine Learning and Cybernetics, pp. 3755-3759,2006)。注意到合适的形状特征必须满足对变换、旋转和缩放无关,这对形状相似度的计算带来了极大难度,所以无论是基于轮廓特征还是基于区域特征,都有其应用的局限性。运动特征是视频的重要内容。运动特征又可以分为两类,一类是镜头的运动特征,主要是利用MPEG视频中的帧类型、宏块类型、运动矢量这些压缩参数信息建立索引, Haubold 等人(参见 A. Haubold and Μ. Naphade. Classification of Video Events using 4—dimensional time-compressed Motion Features. ACM International Conference on Image and Video Retrieval,pp. 178-185,2007)和 Wang 等人(参见 F. Wang,Y. G. Jiang, C. W. Ngo. Event-based Semantic Detection Using Motion Relativity and Visual Relatedness. IEEE International Conference on Multimedia,pp. 239-248,2008)在这方面都做出了不错的工作。这些系统具有计算成本低的特点,但此类系统的缺陷也是明显的,因为它们所表示的并不是视频内容中运动物体真实的运动情况,仅仅是镜头间的运动变化情况,而人的视觉系统往往更容易被前者所作用和吸引。视频内容中运动物体的运动特征是第二类重要的特征,Tahayna 等人(参见 B. Tahayna,M. Belkhatir, and S. Alhashmi. Motion Information for Video Retrieval.IEEE international conference on Multimedia and Expo, pp. 870—873,2009)禾口 Feng 等人(参见 B. L. Feng, J. Cao, S. X. Lin, Y.D.Zhang, and K.Tao. Motion Region-based Trajectory Analysis and Re-ranking for Video Retrieval. IEEE international conference on Multimedia and Expo, pp. 378-381,2009)在他们提出的系统中关注于通过视频中运动物体的运动轨迹来检索,实验证明,使用运动轨迹在检索精度上和识别率上远优于使用镜头的运动特征,但运动轨迹的刻画也需要建立相应的模型,由此会比第一类运动特征增加较多的计算成本,花费较多的运行时间。

实用新型内容本实用新型提供一种基于光流方法的视频检索系统,该系统通过对视频镜头的图像帧集合采取捕捉光流特征进行分类,并对每一类构造相应的光流直方图,通过比较不同直方图之间的距离匹配待检索的视频内容,其系统框架参见图1。一种基于光流方法的视频检索系统,其特征在于包括视频摄取装置;[0010]视频镜头预处理装置,其对摄取的视频镜头进行帧分割,对每帧图像进行卷积平滑;光流特征提取器,其对视频镜头预处理装置平滑后的每相邻的两帧图像计算像素点的光流值,进而得到光流的模长与幅角信息;视频图像帧分类器,其对视频镜头中的帧图像进行区分,将光流特征提取器提取的具有相似模长大小与幅角方向的图像帧归为一类;光流直方图矩阵计算装置,其对视频图像帧分类器分好的每一类图像帧构造基于模长与幅角的光流直方图,分别得到基于模长与幅角的视频镜头光流直方图矩阵;匹配检索装置,其基于光流直方图矩阵的距离函数,从视频数据库中匹配出类似于给定视频镜头的视频镜头,检索出匹配图像;显示装置,显示匹配检索结果。基于内容的视频检索指的是能自动识别或理解视频序列的重要特征,根据视频和视频对象的内容及上下文联系在大规模视频数据库中检索出用户所需要的视频信息,其应用的现实性是迫切急需的。本实用新型提出了一种新颖的图像检索系统,采用光流特征作为检索的依据,能很好的反映出视频本身的动态内容,快速地找出匹配镜头。本实用新型系统明确,运行鲁棒,可以植入代理服务器的防火墙,通过管理员设置相应的安全级别,从而对相关视频的信息进行检索识别;还可以运行于主机托管的Web服务器上,通过在Web服务器上加装过滤监控软件,验证防止非法用户上传包含敏感信息视频的有效性。

图1为本实用新型的系统框架图;图2为本实用新型的技术方案流程图;图3为视频镜头预处理流程图;图4为图像帧分类流程图;图5为构造光流直方图流程图;图6为匹配待检索视频流程图。
具体实施方式
一种基于光流方法的视频检索系统,首先,将给出的视频镜头预处理,将其分割成图像帧,进行卷积平滑,计算相应的光流数据;然后,根据得到的光流信息将图像帧进行分类;接着,对每类图像构造光流的模长与幅角直方图,进而得到整个视频镜头的光流直方图矩阵;最后,基于光流直方图的距离函数,从视频数据库中匹配出类似于给定视频镜头的视频镜头,完成检索过程。具体流程参见图2。下面具体介绍关键的实现细节1.视频镜头预处理,流程如图3所示;对于一个给定的视频镜头,我们将其分割成N+1个图像帧,图像帧的大小为XX Y, 对于每个图像帧ft(x,y),其中1彡t彡Ν+1,0<χ<Χ-1,0彡y彡Y-1,使用卷积函数h(x, y),得到平滑后的图像gt (χ, y),其中gt(x,y) =h(x,y)*ft(x,y)。(1)[0028]任意相邻的gt (χ, y)和 gt+1 (χ, y) (1 彡 t 彡 N),可算得光流场(ut(x,y), vt (χ, y))。 从而我们可以构造出像素点的运动大小因子MOMP和运动方向因子D0MP,即
ιx+l y+i ι-MOMPt(x,y)^Σ ZW(X + V'2(X’,力,(2)
(2/ + 1) x'=x-i y=y-i jx+l y+lDOMP1 (x,y)=Σ Σ ar^' O’,乂),K (X’,')),( 3)
(2/ + 1) X1=X-/ y'^y^l其中,0是光流的模长,arg(.,. ) e W,2 π )是光流的幅角主值,而参数1控制图像模版窗口的尺寸大小。2.图像帧的分类,流程如图4所示;对于每帧图像&(x,y),计算它的运动大小函数M(t)与运动方向函数D(t),
X-\ Y-IM(t) = Σ Σ MOMPt O,少),(4)
X=O 少=0
X-\ Y-\D(t) = Σ Σ D0MP> (χ,力。(5 )
X=O 产 0选取合适的参数I1和I2,定义基于运动大小的分类函数M' (t)和基于运动方向的分类函数D' (t),如下
M\t)= + 0.5,(6)
L 」
D'(t)=禮+ 0.5,(7)
_ I! .其中|_#」表示不超过#的最大整数。这样,分别基于M' (t)和D' (t),我们可以
将任意的图像帧进行归类,即在同一类的任意两帧图像A (U)和A (U)必须满足M' (、)=Μ' (t2),(8)或者D' U1) = D' (t2)(9)最后,基于运动大小我们可以将图像帧分为m类,而基于运动方向我们可以将图像帧分为d类。3.构造光流直方图,流程如图5所示;首先考察光流的运动大小信息,令Mtl是在整个视频数据集中MOMPt (X,y) 的最大值,~是光流运动大小直方图的个数,对每一个依据M' (t)所得到的分类 Cf -^nw(X5J)) (1 ( i 彡 m),每一个 ρ e {1,...,n(i)}定义如下的直方图 k
因子<
权利要求1. 一种基于光流方法的视频检索系统,其特征在于包括 视频摄取装置;视频镜头预处理装置,其对摄取的视频镜头进行帧分割,对每帧图像进行卷积平滑; 光流特征提取器,其对视频镜头预处理装置平滑后的每相邻的两帧图像计算像素点的光流值,进而得到光流的模长与幅角信息;视频图像帧分类器,其对视频镜头中的帧图像进行区分,将光流特征提取器提取的具有相似模长大小与幅角方向的图像帧归为一类;光流直方图矩阵计算装置,其对视频图像帧分类器分好的每一类图像帧构造基于模长与幅角的光流直方图,分别得到基于模长与幅角的视频镜头光流直方图矩阵;匹配检索装置,其基于光流直方图矩阵的距离函数,从视频数据库中匹配出类似于给定视频镜头的视频镜头,检索出匹配图像; 显示装置,显示匹配检索结果。
专利摘要一种基于光流方法的视频检索系统,其包括视频镜头预处理装置,其对摄取的视频镜头进行帧分割,对每帧图像进行卷积平滑;光流特征提取器,其对每相邻的两帧图像计算像素点的光流值,进而得到光流的模长与幅角信息;视频图像帧分类器,其对视频镜头中的帧图像进行区分,将光流特征提取器提取的具有相似模长大小与幅角方向的图像帧归为一类;光流直方图矩阵计算装置,其对视频图像帧分类器分好的每一类图像帧构造基于模长与幅角的光流直方图,分别得到基于模长与幅角的视频镜头光流直方图矩阵;匹配检索装置,其基于光流直方图矩阵的距离函数,从视频数据库中匹配出类似于给定视频镜头的视频镜头,检索出匹配图像;显示装置,显示匹配检索结果。
文档编号G06F17/30GK202306549SQ201120428559
公开日2012年7月4日 申请日期2011年11月3日 优先权日2011年11月3日
发明者李家, 杜耀刚, 陈颖 申请人:北京电子科技学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1