一种视频动态基元库的构建方法与流程

文档序号:13760809阅读:341来源:国知局
本发明涉及图像处理及计算机应用
技术领域
,特别涉及一种视频动态基元库的构建方法。
背景技术
:随着社会经济和科学技术的飞速发展,视频已被广泛地应用于各种场所,例如,在银行、机场、居民生活区等地区安装用于安防的监控系统,每天产生大量的监控视频数据;再例如,在互联网上存储着海量的视频节目,而且每时每刻还在不断地高速增长。如何在如此海量的视频数据中快速准确地检索到我们所期望的内容,是一个具有重要研究价值和巨大应用价值的实际问题,这一问题的有效解决将对相关产业的深入发展起到重要的促进和推动作用。视频内容分析技术的一个重要环节是构建视频样本集的基元库(也称为词典、词包等)。基元库的作用是寻找最能表达视频样本集的典型特征向量,降低视频表示的复杂度,提高视频表示的准确度,从而提升视频检索与识别的精度。基元库的构造主要包括两个方面的内容:第一,计算视频样本集局部特征两两之间的距离度量;第二,对局部特征进行聚类,确定聚类中心。根据视频样本集局部特征提取方法和描述方法的不同,最终所得到的基元库存在很大差别。目前常用的局部特征描述方法包括梯度方向直方图(HOG)、光流直方图(HOF)和运动边界直方图(MBH)等。梯度方向直方图通过计算时空局部特征中每帧图像的梯度方向信息来描述局部特征。这种方法注重特征的静态表观信息,但忽略了特征中帧与帧之间的运动信息。光流直方图着重考虑了特征中帧与帧之间的运动信息,但这种方法很难处理镜头自身运动的情况。运动边界直方图在光流直方图的基础上,通过计算光流场的梯度信息,能有效过滤镜头自身运动的信息,因此能更好地描述视频中感兴趣目标的运动信息。在实际的视频内容分析系统中,一个具有共识的观点是:特征的静态表观信息和运动信息在描述视频特征方面,具有同等重要的地位。为此,本发明提供一种基于线性动态系统的视频动态基元库构建方法。线性动态系统能够同时刻画局部特征的静态表观信息和动态运动信息,因此其区分判别能力优于上述单个方法。由于线性动态系统无法表示为欧式空间中的一个点,为了对线性动态系统进行聚类,本发明在计算线性动态系统两两之间的距离度量构成一个距离度量矩阵之后,直接对上述距离度量矩阵进行聚类,聚类结果作为视频样本集的基元库。所述基元库能显著提高视频检索与识别的性能和准确度。技术实现要素:本发明的目的在于提出一种视频动态基元库的构建方法,获得能够同时刻画视频静态表观信息和动态运动信息的视频动态基元库,该基元库能显著提高视频检索与识别的性能和准确度。本发明提出的一种视频动态基元库的构建方法,包括以下步骤:步骤1:收集视频数据文件构成视频样本集;步骤2:对于视频样本集中的每个视频数据文件,提取三维时空局部特征,构成特征集;步骤3:对于每个三维时空局部特征,使用线性动态系统作为所述三维时空局部特征的描述子;步骤4:计算特征集中三维时空局部特征两两之间的距离度量,构成一个距离度量矩阵;步骤5:对所述距离度量矩阵进行聚类,聚类中心作为所述视频样本集的动态基元库。优选的,所述的三维空间局部特征的大小为N×N×L,其中,N×N是每帧视频图像上以兴趣点为中心的局部像素块大小,L是时间方向上的帧数。优选的,步骤3中计算三维时空局部特征的描述子的方法具体为:步骤31,令三维时空局部特征Y满足线性动态系统模型,线性动态系统模型表示为如下式:xt+1=Axt+vtyt=Cxt+wt]]>其中,Y={y1,…,yi,…,yL},其中yi是第i帧像素块变换得到的列向量;用下标t表示Y中离散的视频帧的时刻,xt表示线性动态系统的状态变量;yt表示线性动态系统的特征变量;vt,wt表示系统的噪音变量;A,C表示线性动态系统的模型参数;步骤32,通过奇异值分解和最小二乘法得到所述线性动态系统模型的参数A、C;首先对于Y进行奇异值分解分解:Y=UΣVT,得到模型参数C和系统状态变量X:C=U;X=ΣVT模型参数A在最小二乘意义下的计算公式如下:其中,表示莫尔-潘鲁斯(Moore-Penrose)广义逆矩阵。优选的,步骤4具体包括以下步骤:步骤41,构建距离度量矩阵D,距离度量矩阵D中元素Dij表示特征集第i个特征和第j个特征之间的距离,两个特征的线性动态系统的模型参数分别是(Ai,Ci)和(Aj,Cj),构造得到的分块矩阵为:A=Ai00Aj,C=CiCj.]]>步骤42,基于所述分块矩阵建立李雅普诺夫方程并求解,得到分块矩阵矩阵的特征根就是子空间夹角θ的平方余弦cos2θ;其中,所述李雅普诺夫方程表示为:Q=ATQA+CTC;步骤43,特征i和特征j之间的距离为:Dij=-logΠk=1ncos2θk.]]>优选的,步骤5中采用能够直接对距离度量矩阵进行聚类的算法进行聚类。优选的,所述能够直接对距离度量矩阵进行聚类的算法为K中心点(K-medoid)或规范切(Normalizedcuts)。优选的,对距离度量矩阵进行聚类的聚类中心的个数区间为[500,4000]。优选的,所述的三维空间局部特征的大小N×N×L的选取上,N选取为32或16,L取值范围为[15,20]。本发明提出的一种视频动态基元库的构建方法,通过线性动态系统能够同时刻画局部特征的静态表观信息和动态运动信息,从一个全新的角度解决了如何同时捕捉视频表观信息和运动信息的难题,其区分判别能力也优于目前已有的方法;本发明提供的线性动态系统的距离度量计算的方法,能够计算非欧空间的描述子之间的距离度量,用来表达线性动态系统之间的相似性;本发明提供的距离度量矩阵的聚类计算的方法,能够处理非欧非向量特征点的聚类问题;本发明可以广泛应用在视频内容检索,敏感视频检测与过滤以及智能视频监控等业务中。附图说明图1为本发明的流程示意图。具体实施方式为了使得本发明的优点、技术方案、发明目的更加明白清楚,下面结合实例和附图,对本发明进行更进一步分详尽说明。其中,此处所用的具体实施实例仅仅用于解释本发明,并不用于限定本发明。本发明提供的一种视频动态基元库的构建方法的流程示意图,如图1所示,包括以下步骤:步骤1:收集视频数据文件构成视频样本集;步骤2:对于视频样本集中的每个视频数据文件,提取三维时空局部特征,构成特征集;所述的三维空间局部特征的大小为N×N×L,其中,N×N是每帧视频图像上以兴趣点为中心的局部像素块大小,L是时间方向上的帧数。所有这样的时空局部特征构成了所述视频数据文件的时空局部特征集,所述兴趣点可以是局部稀疏兴趣点,也可以是根据等间隔采样得到的稠密兴趣点。在所述三维时空局部特征大小的选取上,N一般选取为32或16,过大则表观变化剧烈,过小则不足以刻画局部表观信息;L一般取值范围为[15,20],轨迹过长容易造成跟踪失败,并且可能不满足线性系统条件;轨迹过短则动态特性不明显,同时也造成轨迹过多,计算量急剧增加。步骤3:对于每个三维时空局部特征,使用线性动态系统作为所述三维时空局部特征的描述子;步骤3中计算三维时空局部特征的描述子的方法具体为:步骤31,令三维时空局部特征Y满足线性动态系统模型,线性动态系统模型表示为公式(1):xt+1=Axt+vtyt=Cxt+wt---(1)]]>其中,Y={y1,…,yi,…,yL},其中yi是第i帧像素块变换得到的列向量;用下标t表示Y中离散的视频帧的时刻;xt表示线性动态系统的状态变量,其维数称为线性动态系统的阶数,通常这个阶数远远小于特征变量yt的维度,其取值范围为[3,10];yt表示线性动态系统的特征变量(如t表示Y中离散的视频帧i的时刻,则yt=yi);vt,wt表示系统的噪音变量;A,C表示线性动态系统的模型参数。模型参数A,C可以用来作为时空局部特征Y的描述子。步骤32,通过奇异值分解和最小二乘法得到所述线性动态系统模型的参数A、C。奇异值分解的基本方法为:假设M是一个m×n阶矩阵,则存在一个分解使得M=UΣV*;其中U是m×m阶酉矩阵,Σ是半正定m×n阶对角矩阵,V*是V的共轭转置,且V*为n×n阶酉矩阵。本实施例中为了得到模型参数A,C,首先对于Y进行奇异值分解,如公式(2)所示:Y=UΣVT(2)得到模型参数C和系统状态变量X,分别如公式(3)、(4)所示:C=U(3)X=ΣVT(4)模型参数A在最小二乘意义下的计算公式如公式(5)所示:其中,表示莫尔-潘鲁斯(Moore-Penrose)广义逆矩阵。至此,完成线性动态系统模型参数A,C的求解。步骤4:计算特征集中三维时空局部特征两两之间的距离度量,构成一个距离度量矩阵;所述步骤4进一步包括以下步骤:骤4具体包括以下步骤:步骤41,构建距离度量矩阵D,距离度量矩阵D中元素Dij表示特征集第i个特征和第j个特征之间的距离,两个特征的线性动态系统的模型参数分别是(Ai,Ci)和(Aj,Cj),构造得到的分块矩阵为:A=Ai00Aj]]>C=(CiCj)。步骤42,基于所述分块矩阵建立李雅普诺夫方程并求解,得到分块矩阵矩阵的特征根就是子空间夹角θ的平方余弦cos2θ;其中,所述李雅普诺夫方程表示为公式(6):Q=ATQA+CTC(6)步骤43,特征i和特征j之间的距离为公式(7)所示:Dij=-logΠk=1ncos2θk---(7)]]>按照以上步骤计算所有三维局部特征两两之间的距离度量,构成距离度量矩阵D。步骤5:对所述距离度量矩阵进行聚类,聚类中心作为所述视频样本集的动态基元库。所述步骤5具体为:采用能够直接对距离度量矩阵进行聚类的算法,比如K中心点(K-medoid)算法或者规范切(Normalizedcuts)算法对其进行聚类。聚类中心的个数根据问题的不同,可以选择区间为[500,4000]。这些聚类中心就构成视频样本集的动态基元库。本发明提出的一种视频动态基元库的构建方法,通过线性动态系统能够同时刻画局部特征的静态表观信息和动态运动信息,从一个全新的角度解决了如何同时捕捉视频表观信息和运动信息的难题,其区分判别能力也优于目前已有的方法;本发明提供的线性动态系统的距离度量计算的方法,能够计算非欧空间的描述子之间的距离度量,用来表达线性动态系统之间的相似性;本发明提供的距离度量矩阵的聚类计算的方法,能够处理非欧非向量特征点的聚类问题;本发明可以广泛应用在视频内容检索,敏感视频检测与过滤以及智能视频监控等业务中。以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1