基于图像与文本的视频的快速分类方法

文档序号:8339715阅读:562来源:国知局
基于图像与文本的视频的快速分类方法
【技术领域】
[0001] 本发明涉及图像或视频检测领域,特别涉及一种基于图像与文本的视频的快速分 类方法。
【背景技术】
[0002] 随着互联网的快速发展,电影已经成为人们业余生活中不可缺少的一部分。目前 为止、还没有对电影的种类做出统一的规定,电影的类型大体分为:恐怖、爱情、动作、喜剧、 科幻等等。电影网站上都会人工给电影标上类型标签,所以、实现电影的快速分类是很有必 要。
[0003] 电影类型的检测基本上都是基于视频内容本身检测。视频内容的检测包括:镜头 边界的检测、关键帧的检测和音频特征的检测。镜头边界检测的基本假设是相邻两个镜头 的内容存在较大的差异。因此,可以通过测量相邻帧之间的差异程度来确定镜头的边界。 镜头视频关键帧的特征包括:视频关键帧的颜色、对比度、明亮度、纹理等特征。通过提取 这些特征对视频的关键帧进行检测。音频特征主要有:时域特征、频域特征和声学感知特征 等。
[0004] 基于视频内容检测的问题有:需要的数据量大、检测视频较慢、在没有视频内容本 身的情况下显然无法完成检测任务,同时准确率不是很高。

【发明内容】

[0005] 本发明的第一个方面是提供能够对视频进行快速分类的基于图像与文本的视频 的快速分类方法,包括:
[0006] 分别关联多个视频的图像与多个视频类型、以及多个视频的文本与多个视频类 型,从而生成对应视频类型的图像训练集及文本训练集;
[0007] 在每个所述图像训练集上分别提取图像特征信息进行训练从而创建图像预测模 型,以及在每个所述文本训练集上提取文本特征信息进行训练从而创建文本预测模型;
[0008] 分别提取待检测的视频的图像特征信息在所述图像预测模型上和提取待检测的 视频的文本特征信息在所述文本预测模型上进行预测,并对两个预测结果执行或运算作为 检出类型。
[0009] 本发明的有益效果为:
[0010] 本发明基于图像与文本的视频的快速分类方法通过比较图像特征信息和文本特 征信息,并通过或运算检测出视频的类型,能够实现根据少量的图像标引信息及文字标引 信息对视频进行快速分类,而不需要获取视频进行检测,能够提高视频的分类效率。
【附图说明】
[0011] 图1是本发明基于图像与文本的视频的快速分类方法实施例一的流程图;
[0012] 图2是本发明基于图像与文本的视频的快速分类方法实施例一的原理图。
【具体实施方式】
[0013] 图1是本发明基于图像与文本的视频的快速分类方法实施例一的流程图,图2是 本发明基于图像与文本的视频的快速分类方法实施例一的原理图,如图1和图2所示,本发 明基于图像与文本的视频的快速分类方法实施例一,包括:
[0014] SlOl、分别关联多个视频的图像与多个视频类型、以及多个视频的文本与多个视 频类型,从而生成对应视频类型的图像训练集及文本训练集;
[0015] 优选的,所述视频可以是电影,所述图像可以是电影海报,所述文本可以是电影 的内容简介或电影标引文字等,此时只需很少的数据量即可实现检测,且能使后续的检测 速度更快;具体的,在搜集中外视频网站上的电影常见类型时,确定常见的电影类型:恐怖 片、爱情片、喜剧片和动作片;然后搜集尽可能多的这四种类型的电影的海报和剧情介绍, 分别建立电影海报的图像训练集和电影剧情介绍的文本训练集;
[0016] S102、在每个所述图像训练集上分别提取图像特征信息进行训练从而创建图像预 测模型,以及在每个所述文本训练集上提取文本特征信息进行训练从而创建文本预测模 型;优选的,所述图像特征信息可以包括颜色情感特征、颜色和谐度特征、边缘特征、纹理特 征、颜色变化特征和人脸的数量中的任意一个或其组合;优选的,利用得到的每个图像的特 征信息及其对应的图像训练支持向量机得到图像预测模型,同理,利用得到的每个文本特 征信息及其对应的标签训练支持向量机得到文本预测模型;优选的,所述图像特征信息包 括颜色情感特征,所述提取待检测的视频的图像特征信息在所述图像预测模型上进行预测 中的所述图像特征信息的提取包括颜色情感特征的提取,包括:
[0017] S1021、将所述图像特征信息从RGB颜色空间转换到CIELAB颜色空间和CIELCH颜 色空间,根据公式(2)、(3)、和(4)计算活动性activity、热度heat、和重要性weight :
[0018]
【主权项】
1. 一种基于图像与文本的视频的快速分类方法,其特征在于,包括: 分别关联多个视频的图像与多个视频类型、以及多个视频的文本与多个视频类型,从 而生成对应视频类型的图像训练集及文本训练集; 在每个所述图像训练集上分别提取图像特征信息进行训练从而创建图像预测模型,以 及在每个所述文本训练集上提取文本特征信息进行训练从而创建文本预测模型; 分别提取待检测的视频的图像特征信息在所述图像预测模型上和提取待检测的视频 的文本特征信息在所述文本预测模型上进行预测,并对两个预测结果执行或运算作为检出 类型。
2. 根据权利要求1所述的基于图像与文本的视频的快速分类方法,其特征在于,所述 图像特征信息包括颜色情感特征、颜色和谐度特征、边缘特征、纹理特征、颜色变化特征和 人脸的数量中的任意一个或其组合。
3. 根据权利要求2所述的基于图像与文本的视频的快速分类方法,其特征在于,所述 图像特征信息包括颜色情感特征,相应的,所述在每个图像训练集上分别提取图像特征信 息进行训练从而创建图像预测模型、以及提取待检测的视频的图像特征信息在所述图像预 测模型上进行预测中的所述图像特征信息的提取包括颜色情感特征的提取,包括: 将所述图像特征信息从RGB颜色空间转换到CIELAB颜色空间和CIELCH颜色空间,根 据公式(2)、(3)、和(4)计算活动性activity、热度heat、和重要性weight :
weight = -1. 8+0. 45cos (h-ΙΟ。)+0· 04 (100-L*) (2) heat = -0· 5+0. 02 (C*) h ci7Cos (h-50。) (3) 其中,(d),〇Λ a?分别是颜色空间CIELCH和CIELAB的颜色分量; 再根据公式(1)计算颜色情感特征EI (X,y):
4. 根据权利
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1