视频分类的方法和装置的制造方法

文档序号:8361472阅读:185来源:国知局
视频分类的方法和装置的制造方法
【技术领域】
[0001] 本发明涉及电子信息技术领域,尤其涉及一种视频分类的方法和装置。
【背景技术】
[0002] 随着视频数据的大量增加,用户逐个浏览视频,根据视频中人物的运动信息对视 频进行分类需要耗费大量的时间和精力。虽然现在已经可以针对视频中一些如行走、跑步 等简单的运动对视频进行分类,但是视频中的运动往往比较复杂,如体育活动等,针对简单 运动对视频分类已经不能满足用户的需要了。为了能够针对这些视频中较为复杂且连续的 运动对视频进行分类,现有技术从视频中提取一些局部区域的特征,如HOG(Histogramof OrientedGradients,方向梯度直方图)等特征,根据这些特征进行类聚,形成运动原子,运 动原子是具有某些共性的简单运动模式,之后计算待检测视频与这些运动原子的响应,将 得到的响应组成向量,再根据得到的向量对待检测视频进行分类。
[0003] 但是,视频中总是会出现具有较强时序关系的复杂运动,通过由运动原子得到的 向量对待检测视频进行分类,难以保证分类的精确度。因此,在现有技术采用了另一种方 法,将视频中的较复杂运动按时间分解成一些由简单运动组成的片段,每一个片段都对应 一个时间点,在进行分类时,按照时间顺序将每一个片段与样本分解出的片段进行比对,得 到每一个片段各自的比对得分,将这些比对得分进行加权求和得到最终的比对得分,根据 最终的比对得分对视频进行分类。
[0004] 但是,对于较连续且持续时间较长的复杂运动,现有技术很难将这样的复杂运动 恰当的分解成由简单运动组成的片段,而且当视频中复杂运动的分解时间点设置不同时, 与样本分解出的片段进行比对后得到的比对得分也不同,从而导致视频分类产生多个不同 的结果,难以统一,视频分类的精确度也比较低。

【发明内容】

[0005] 本发明的实施例提供一种视频分类的方法和装置,能够提高视频分类的精确度。
[0006] 为达到上述目的,本发明的实施例采用如下技术方案:
[0007] 第一方面,本发明实施例提供一种视频分类的方法,包括:
[0008] 按照时间顺序对样本视频库中的视频进行分段并得到分段结果,并生成运动原子 集合,所述样本视频库包括至少一个视频,所述运动原子集合中的运动原子是根据所述样 本视频库中的视频生成的;
[0009] 利用所述运动原子集合和所述分段结果,生成对应于所述样本视频库中的视频的 描述向量;
[0010] 利用所述描述向量,确定与所述样本视频库中的视频的类型相同的待检测视频。 [0011] 结合第一方面,在第一种可能的实现方式中,所述利用所述运动原子集合和所述 分段结果,生成对应于所述样本视频库中的视频的描述向量,包括:
[0012] 根据所述运动原子集合和所述分段结果,生成对应于所述样本视频库中的视频的 运动短语集合,所述运动短语集合包括至少二个运动短语,一个运动短语包括了按照一定 的先后顺序在时间点附近发生的运动原子;
[0013] 筛选所述运动短语,并得到筛选结果;
[0014] 根据所述筛选结果,生成与所述样本视频库中的视频对应的描述向量。
[0015] 结合第一方面和第一方面的第一种可能的实现方式,在第二种可能的实现方式 中,所述样本视频库包括至少二个视频,并且所述样本视频库中的视频的类型相同。
[0016] 结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,还包括:
[0017] 获取运动原子单元(A,t,〇),并根据所述运动原子单元获取一个运动短语的
【主权项】
1. 一种视频分类的方法,其特征在于,包括: 按照时间顺序对样本视频库中的视频进行分段并得到分段结果,并生成运动原子集 合,所述样本视频库包括至少一个视频,所述运动原子集合中的运动原子是根据所述样本 视频库中的视频生成的; 利用所述运动原子集合和所述分段结果,生成对应于所述样本视频库中的视频的描述 向量; 利用所述描述向量,确定与所述样本视频库中的视频的类型相同的待检测视频。
2. 根据权利要求1所述的方法,其特征在于,所述利用所述运动原子集合和所述分段 结果,生成对应于所述样本视频库中的视频的描述向量,包括: 根据所述运动原子集合和所述分段结果,生成对应于所述样本视频库中的视频的运动 短语集合,所述运动短语集合包括至少二个运动短语,一个运动短语包括了按照一定的先 后顺序在时间点附近发生的运动原子; 筛选所述运动短语,并得到筛选结果; 根据所述筛选结果,生成与所述样本视频库中的视频对应的描述向量。
3. 根据权利要求1或2所述的方法,其特征在于,所述样本视频库包括至少二个视频, 并且所述样本视频库中的视频的类型相同。
4. 根据权利要求3所述的视频分类的方法,其特征在于,所述运动短语集合中的运动 短语包括一个所述运动原子集合中的运动原子;所述方法还包括: 获取运动原子单元n (A,t,(〇,并根据所述运动原子单元获取一个运动短语的代 表性参数Rep(PpC),
A为运动原子,t为所述样本视频库 中视频中的时间点,σ为高斯分布的标准差,V为所述样本视频库中的视频,Pl为所 述一个运动短语,!"(V1P1)为所述一个运动短语P1对所述样本视频库中的视频的响应,
,ORi 指 计算所述样本视频库中的视频与时间相邻的所述运动原子单元的响应,S(P1>C)表示和所 述一个运动短语响应最大的所述样本视频库中的视频的集合,c为所述样本视频库中的视 频的类型的标识,φ(ν,ν )为所述样本视频库中视频中以t开始的所述分段结果的视 频特征,Sc〇re(〇 (V,t' ),A)是将Φ (V,t')输入到支持向量机SVM分类器得到的得分, N(t' |t,〇 )是指以t为均值,〇为标准差的高斯分布,Ω (t)指以t为中心的一个邻域; 获取所述一个运动短语的覆盖性参数RepSet(r[,c),并根据所述一个运动短语 的覆盖性参数RepSet(r[,c),得到所述一个运动短语对所述覆盖性参数的贡献值 Λ RepSet (P1, c),
Τ。为所述样本视频库中标识 为c的视频分段得到的片段的数量,IT为所述运动短语集合,且所述一个运动短语包含的 所述运动原子所属视频类型的标识为C ; 针对所述运动短语集合中的每一个运动短语,执行上述过程,并得到所述运动短语集 合中的每一个运动短语的代表性参数和贡献值; 所述筛选所述运动短语,得到筛选结果,包括: 根据所述运动短语集合中的每一个运动短语的代表性参数和贡献值,按照 R印(P1, c)+ Λ ItepSeUP1, c)的值由大到小的顺序对所述运动短语集合中的运动短语进行 排序,并将前Hl1个运动短语作为第1筛选结果,Hl 1为大于等于1的正整数; 从所述运动原子集合中提取一个运动原子加入所述第1筛选结果中的运动短语,使得 所述第1筛选结果中的运动短语具有2个运动原子; 重复上述过程,直至得到第η-1筛选结果,再从所述运动原子集合中提取一个运动原 子加入所述第η-1筛选结果中的运动短语,使得所述第η-1筛选结果中的运动短语具有η 个运动原子,再根据所述第η-1筛选结果中的运动短语得到第η筛选结果,所述第η筛选结 果为按照Rep (Pn, c) + Λ RepSet (Pn, c)的值由大到小的顺序排列的前mn个运动短语,mn为 大于等于1的正整数,第η筛选结果中的运动短语具有η个运动原子,η为大于等于1的正 整数; 根据所述第1至第η筛选结果,生成所述描述向量。
5. 根据权利要求4所述的视频分类的方法,其特征在于,所述样本视频库包括至少二 个视频,并且所述样本视频库包括至少二种类型的视频; 所述根据筛选结果,生成与所述样本视频库中的视频对应的描述向量,包括: 根据所述样本视频库中不同类型的视频对应的所述运动短语的筛选结果,得到筛选结 果集合; 根据所述筛选结果集合,生成所述样本视频库中的视频对应的描述向量。
6. 根据权利要求5所述的方法,其特征在于,所述利用所述描述向量,确定与所述样本 视频库中的视频的类型相同的待检测视频,包括: 生成所
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1