基于ar模型功率谱的动态场景分类方法及装置的制造方法

文档序号:9751260阅读:242来源:国知局
基于ar模型功率谱的动态场景分类方法及装置的制造方法
【技术领域】
[0001] 本发明涉及动态场景分类技术,尤其涉及一种基于AR模型功率谱的动态场景分类 方法及装置。
【背景技术】
[0002] 在视频处理中,动态场景分类在许多领域有着广泛的应用,例如视频监控、基于内 容的检索、事件监控、机器人导航以及目标识别等。但是由于动态场景的拍摄环境差异较 大,在光照、拍摄角度、拍摄方式等方面存在不同,使得动态场景呈现多样性,从而难以对其 进行准确分类。
[0003] 目前,对于动态场景分类的研究主要包括两方面。一方面是根据动态场景的空间 信息进行分类,例如提取纹理、光谱以及梯度方向特征等空间信息,这方面的研究通过对动 态场景外观及空间分布情况进行描述,以此来对动态场景进行分类。另一方面是根据动态 场景的时间信息进行分类,一般采用光流特征对动态场景的速度场进行描述,通过场景中 物体的运动方向和大小变化来对动态场景进行分类。
[0004] 现有的动态场景分类方法大多通过动态场景的时间、动态场景的空间对动态场景 进行分类,或者将动态场景的时间和空间信息相结合,利用时空结合特征来对动态场景进 行分类。然而在一些特殊的动态场景下,例如包含了很多周期运动或准周期运动的动态场 景,现有方法仅仅考虑时间和空间信息,导致对这类包含周期运动的动态场景,其分类准确 率较低。

【发明内容】

[0005] 本发明提供一种基于AR模型功率谱的动态场景分类方法及装置,用于解决现有技 术对包含周期运动的动态场景分类准确率较低的问题。
[0006] 本发明一方面提供一种基于AR模型功率谱的动态场景分类方法,包括:
[0007] 获取多段动态场景视频每段各自的空域特征、时域特征和自回归AR模型功率谱频 域特征;
[0008] 通过词袋模型分别对每个所述空域特征、所述时域特征和所述AR模型功率谱频域 特征进行统计分析,得到对应的空域的词频直方统计图特征、时域的词频直方统计图特征 和AR模型功率谱频域的词频直方统计图特征;
[0009] 将各域的词频直方统计图特征按域映射到核空间中,得到各域的核函数,并采用 多核学习方法得到所述各域的核函数的权重,根据所述权重对所述各域的核函数进行特征 融合,得到分类特征,根据所述分类特征对所述多段动态场景视频进行分类。
[0010] 本发明另一方面提供一种基于AR模型功率谱的动态场景分类装置,包括:
[0011]域特征获取模块,用于获取多段动态场景视频每段各自的空域特征、时域特征和 自回归AR模型功率谱频域特征;
[0012]直方统计图特征获取模块,用于通过词袋模型分别对每个所述空域特征、所述时 域特征和所述AR模型功率谱频域特征进行统计分析,得到对应的空域的词频直方统计图特 征、时域的词频直方统计图特征和AR模型功率谱频域的词频直方统计图特征;
[0013]特征融合模块,用于将各域的词频直方统计图特征按域映射到核空间中,得到各 域的核函数,并采用多核学习方法得到所述各域的核函数的权重,根据所述权重对所述各 域的核函数进行特征融合,得到分类特征,根据所述分类特征对所述多段动态场景视频进 行分类。
[0014] 本发明提供的基于AR模型功率谱的动态场景分类方法及装置,通过将表示运动周 期特性的AR模型功率谱特征与空域特征、时域特征相结合,从时空频三个角度来描述动态 场景,形成对场景的综合特征描述。进一步,针对三种特征之间存在的差异,对各特征进行 加权融合,得到了能够描述动态场景运动周期性的分类特征,提高了具有周期性运动的动 态场景的分类准确率,进一步提高了总的动态场景的分类能力。
【附图说明】
[0015] 为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用 的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领 域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的 附图。
[0016] 图1为本发明基于AR模型功率谱的动态场景分类方法实施例的流程图;
[0017] 图2为本发明实施例获取动态场景视频的时域特征的流程示意图;
[0018] 图3为本发明实施例获取动态场景视频的AR模型功率谱频域特征的流程示意图;
[0019] 图4为本发明基于AR模型功率谱的动态场景分类方法另一实施例的流程图;
[0020] 图5为本发明基于AR模型功率谱的动态场景分类方法再一实施例的流程图;
[0021 ]图6为本发明基于AR模型功率谱的动态场景分类装置实施例的结构示意图。
【具体实施方式】
[0022]为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例 中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是 本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员 在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0023]图1为本发明基于AR模型功率谱的动态场景分类方法实施例一的流程图。本实施 例的执行主体可以为基于AR模型功率谱的动态场景分类的装置,该装置可以通过软件和/ 或硬件实现,该装置还可以嵌入到终端中实现。如图1所示,该分类方法包括:
[0024]步骤101、获取多段动态场景视频每段各自的空域特征、时域特征和自回归AR模型 功率谱频域特征;
[0025] 步骤102、通过词袋模型分别对每个空域特征、时域特征和AR模型功率谱频域特征 进行统计分析,得到空域的词频直方统计图特征、时域的词频直方统计图特征和AR模型功 率谱频域的词频直方统计图特征;
[0026] 步骤103、将各域的词频直方统计图特征按域映射到核空间中,得到各域的核函 数,并采用多核学习方法得到各域的核函数的权重,根据权重对各域的核函数进行特征融 合,得到分类特征,根据分类特征对多段动态场景视频进行分类。
[0027] 本发明实施例中,首先获取多段动态场景视频各自的空域、时域和频域特征,并采 用词袋模型,对每个各域特征自身进行统计分析,得到每段动态场景视频的各域的词频直 方统计图特征,最后,将各域的词频直方统计图特征按域映射到核空间中,生成各域的核函 数,并通过多核学习计算各域核函数的权重,对各域核函数按照权重进行特征融合,得到用 于分类的分类特征,对动态场景视频进行分类。
[0028] 具体实施过程中,可采用支持向量机SVM(Support Vector Machine,简称SVM)分 类器,根据融合得到的分类特征对动态场景进行分类。
[0029] 本发明提供的基于AR模型功率谱的动态场景分类方法及装置,通过将表示运动周 期特性的AR模型功率谱特征与空域特征、时域特征相结合,从时空频三个角度来描述动态 场景,形成对场景的综合特征描述。进一步,针对三种特征之间存在的差异,对各特征进行 加权融合,得到了能够描述动态场景运动周期性的分类特征,提高了具有周期性运动的动 态场景的分类准确率,进一步提高了总的动态场景的分类能力。
[0030] 下面,采用具体的实施例,详细说明本实施例对动态场景进行分类的具体实现方 式。
[0031] 在步骤101中,由于动态场景视频在时间域、空间域以及频域中表现出不同的特 性,因此为了更准确和全面的描述动态场景,需要分别从时间域、空间域以及频域这三方面 对动态场景视频进行描述。
[0032] 在具体实施过程中,空域特征可以为稠密采样的尺度不变特征转换空域特征。
[0033] 尺度不变特征转换(Scale-invariant feature transform,简称SIFT)空域特征 主要对动态场景的空间信息进行描述,包括动态场景的外观以及空间分布信息。SIFT空域 特征是图像中物体上的一些局部特征,与图像中物体的大小和旋转无关,受光线、噪声、微 视角改变的影响亦较小。可选的,动态场景视频的空域特征也可为其他特征,本实施例仅以 SIFT特征为例,并非对本发明的限定。
[0034] 示例性的,SIFT的特征提取可通过下述方
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1