基于ar模型功率谱的动态场景分类方法及装置的制造方法

文档序号：9751260阅读：242来源：国知局

基于ar模型功率谱的动态场景分类方法及装置的制造方法
【技术领域】
[0001] 本发明涉及动态场景分类技术，尤其涉及一种基于AR模型功率谱的动态场景分类方法及装置。
【背景技术】
[0002] 在视频处理中，动态场景分类在许多领域有着广泛的应用，例如视频监控、基于内容的检索、事件监控、机器人导航以及目标识别等。但是由于动态场景的拍摄环境差异较大，在光照、拍摄角度、拍摄方式等方面存在不同，使得动态场景呈现多样性，从而难以对其进行准确分类。
[0003] 目前，对于动态场景分类的研究主要包括两方面。一方面是根据动态场景的空间信息进行分类，例如提取纹理、光谱以及梯度方向特征等空间信息，这方面的研究通过对动态场景外观及空间分布情况进行描述，以此来对动态场景进行分类。另一方面是根据动态场景的时间信息进行分类，一般采用光流特征对动态场景的速度场进行描述，通过场景中物体的运动方向和大小变化来对动态场景进行分类。
[0004] 现有的动态场景分类方法大多通过动态场景的时间、动态场景的空间对动态场景进行分类，或者将动态场景的时间和空间信息相结合，利用时空结合特征来对动态场景进行分类。然而在一些特殊的动态场景下，例如包含了很多周期运动或准周期运动的动态场景，现有方法仅仅考虑时间和空间信息，导致对这类包含周期运动的动态场景，其分类准确率较低。

【发明内容】

[0005] 本发明提供一种基于AR模型功率谱的动态场景分类方法及装置，用于解决现有技术对包含周期运动的动态场景分类准确率较低的问题。
[0006] 本发明一方面提供一种基于AR模型功率谱的动态场景分类方法，包括：
[0007] 获取多段动态场景视频每段各自的空域特征、时域特征和自回归AR模型功率谱频域特征；
[0008] 通过词袋模型分别对每个所述空域特征、所述时域特征和所述AR模型功率谱频域特征进行统计分析，得到对应的空域的词频直方统计图特征、时域的词频直方统计图特征和AR模型功率谱频域的词频直方统计图特征；
[0009] 将各域的词频直方统计图特征按域映射到核空间中，得到各域的核函数，并采用多核学习方法得到所述各域的核函数的权重，根据所述权重对所述各域的核函数进行特征融合，得到分类特征，根据所述分类特征对所述多段动态场景视频进行分类。
[0010] 本发明另一方面提供一种基于AR模型功率谱的动态场景分类装置，包括：
[0011]域特征获取模块，用于获取多段动态场景视频每段各自的空域特征、时域特征和自回归AR模型功率谱频域特征；
[0012]直方统计图特征获取模块，用于通过词袋模型分别对每个所述空域特征、所述时域特征和所述AR模型功率谱频域特征进行统计分析，得到对应的空域的词频直方统计图特征、时域的词频直方统计图特征和AR模型功率谱频域的词频直方统计图特征；
[0013]特征融合模块，用于将各域的词频直方统计图特征按域映射到核空间中，得到各域的核函数，并采用多核学习方法得到所述各域的核函数的权重，根据所述权重对所述各域的核函数进行特征融合，得到分类特征，根据所述分类特征对所述多段动态场景视频进行分类。
[0014] 本发明提供的基于AR模型功率谱的动态场景分类方法及装置，通过将表示运动周期特性的AR模型功率谱特征与空域特征、时域特征相结合，从时空频三个角度来描述动态场景，形成对场景的综合特征描述。进一步，针对三种特征之间存在的差异，对各特征进行加权融合，得到了能够描述动态场景运动周期性的分类特征，提高了具有周期性运动的动态场景的分类准确率，进一步提高了总的动态场景的分类能力。
【附图说明】
[0015] 为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
[0016] 图1为本发明基于AR模型功率谱的动态场景分类方法实施例的流程图；
[0017] 图2为本发明实施例获取动态场景视频的时域特征的流程示意图；
[0018] 图3为本发明实施例获取动态场景视频的AR模型功率谱频域特征的流程示意图；
[0019] 图4为本发明基于AR模型功率谱的动态场景分类方法另一实施例的流程图；
[0020] 图5为本发明基于AR模型功率谱的动态场景分类方法再一实施例的流程图；
[0021 ]图6为本发明基于AR模型功率谱的动态场景分类装置实施例的结构示意图。
【具体实施方式】
[0022]为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0023]图1为本发明基于AR模型功率谱的动态场景分类方法实施例一的流程图。本实施例的执行主体可以为基于AR模型功率谱的动态场景分类的装置，该装置可以通过软件和/ 或硬件实现，该装置还可以嵌入到终端中实现。如图1所示，该分类方法包括：
[0024]步骤101、获取多段动态场景视频每段各自的空域特征、时域特征和自回归AR模型功率谱频域特征；
[0025] 步骤102、通过词袋模型分别对每个空域特征、时域特征和AR模型功率谱频域特征进行统计分析，得到空域的词频直方统计图特征、时域的词频直方统计图特征和AR模型功率谱频域的词频直方统计图特征；
[0026] 步骤103、将各域的词频直方统计图特征按域映射到核空间中，得到各域的核函数，并采用多核学习方法得到各域的核函数的权重，根据权重对各域的核函数进行特征融合，得到分类特征，根据分类特征对多段动态场景视频进行分类。
[0027] 本发明实施例中，首先获取多段动态场景视频各自的空域、时域和频域特征，并采用词袋模型，对每个各域特征自身进行统计分析，得到每段动态场景视频的各域的词频直方统计图特征，最后，将各域的词频直方统计图特征按域映射到核空间中，生成各域的核函数，并通过多核学习计算各域核函数的权重，对各域核函数按照权重进行特征融合，得到用于分类的分类特征，对动态场景视频进行分类。
[0028] 具体实施过程中，可采用支持向量机SVM(Support Vector Machine，简称SVM)分类器，根据融合得到的分类特征对动态场景进行分类。
[0029] 本发明提供的基于AR模型功率谱的动态场景分类方法及装置，通过将表示运动周期特性的AR模型功率谱特征与空域特征、时域特征相结合，从时空频三个角度来描述动态场景，形成对场景的综合特征描述。进一步，针对三种特征之间存在的差异，对各特征进行加权融合，得到了能够描述动态场景运动周期性的分类特征，提高了具有周期性运动的动态场景的分类准确率，进一步提高了总的动态场景的分类能力。
[0030] 下面，采用具体的实施例，详细说明本实施例对动态场景进行分类的具体实现方式。
[0031] 在步骤101中，由于动态场景视频在时间域、空间域以及频域中表现出不同的特性，因此为了更准确和全面的描述动态场景，需要分别从时间域、空间域以及频域这三方面对动态场景视频进行描述。
[0032] 在具体实施过程中，空域特征可以为稠密采样的尺度不变特征转换空域特征。
[0033] 尺度不变特征转换（Scale-invariant feature transform，简称SIFT)空域特征主要对动态场景的空间信息进行描述，包括动态场景的外观以及空间分布信息。SIFT空域特征是图像中物体上的一些局部特征，与图像中物体的大小和旋转无关，受光线、噪声、微视角改变的影响亦较小。可选的，动态场景视频的空域特征也可为其他特征，本实施例仅以 SIFT特征为例，并非对本发明的限定。
[0034] 示例性的，SIFT的特征提取可通过下述方

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曹先彬;黄元骏;蒋小龙;任一存;潘朝凤;
技术所有人：北京航空航天大学;
我是此专利的发明人

上一篇：一种判定人为造成地貌特征变化的方法及系统的制作方法
上一篇：人脸图像处理方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。