基于图像与文本的视频的快速分类方法

文档序号：8339715阅读：562来源：国知局

基于图像与文本的视频的快速分类方法
【技术领域】
[0001] 本发明涉及图像或视频检测领域，特别涉及一种基于图像与文本的视频的快速分类方法。
【背景技术】
[0002] 随着互联网的快速发展，电影已经成为人们业余生活中不可缺少的一部分。目前为止、还没有对电影的种类做出统一的规定，电影的类型大体分为：恐怖、爱情、动作、喜剧、科幻等等。电影网站上都会人工给电影标上类型标签，所以、实现电影的快速分类是很有必要。
[0003] 电影类型的检测基本上都是基于视频内容本身检测。视频内容的检测包括：镜头边界的检测、关键帧的检测和音频特征的检测。镜头边界检测的基本假设是相邻两个镜头的内容存在较大的差异。因此，可以通过测量相邻帧之间的差异程度来确定镜头的边界。镜头视频关键帧的特征包括：视频关键帧的颜色、对比度、明亮度、纹理等特征。通过提取这些特征对视频的关键帧进行检测。音频特征主要有：时域特征、频域特征和声学感知特征等。
[0004] 基于视频内容检测的问题有：需要的数据量大、检测视频较慢、在没有视频内容本身的情况下显然无法完成检测任务，同时准确率不是很高。

【发明内容】

[0005] 本发明的第一个方面是提供能够对视频进行快速分类的基于图像与文本的视频的快速分类方法，包括：
[0006] 分别关联多个视频的图像与多个视频类型、以及多个视频的文本与多个视频类型，从而生成对应视频类型的图像训练集及文本训练集；
[0007] 在每个所述图像训练集上分别提取图像特征信息进行训练从而创建图像预测模型，以及在每个所述文本训练集上提取文本特征信息进行训练从而创建文本预测模型；
[0008] 分别提取待检测的视频的图像特征信息在所述图像预测模型上和提取待检测的视频的文本特征信息在所述文本预测模型上进行预测，并对两个预测结果执行或运算作为检出类型。
[0009] 本发明的有益效果为：
[0010] 本发明基于图像与文本的视频的快速分类方法通过比较图像特征信息和文本特征信息，并通过或运算检测出视频的类型，能够实现根据少量的图像标引信息及文字标引信息对视频进行快速分类，而不需要获取视频进行检测，能够提高视频的分类效率。
【附图说明】
[0011] 图1是本发明基于图像与文本的视频的快速分类方法实施例一的流程图；
[0012] 图2是本发明基于图像与文本的视频的快速分类方法实施例一的原理图。
【具体实施方式】
[0013] 图1是本发明基于图像与文本的视频的快速分类方法实施例一的流程图，图2是本发明基于图像与文本的视频的快速分类方法实施例一的原理图，如图1和图2所示，本发明基于图像与文本的视频的快速分类方法实施例一，包括：
[0014] SlOl、分别关联多个视频的图像与多个视频类型、以及多个视频的文本与多个视频类型，从而生成对应视频类型的图像训练集及文本训练集；
[0015] 优选的，所述视频可以是电影，所述图像可以是电影海报，所述文本可以是电影的内容简介或电影标引文字等，此时只需很少的数据量即可实现检测，且能使后续的检测速度更快；具体的，在搜集中外视频网站上的电影常见类型时，确定常见的电影类型：恐怖片、爱情片、喜剧片和动作片；然后搜集尽可能多的这四种类型的电影的海报和剧情介绍，分别建立电影海报的图像训练集和电影剧情介绍的文本训练集；
[0016] S102、在每个所述图像训练集上分别提取图像特征信息进行训练从而创建图像预测模型，以及在每个所述文本训练集上提取文本特征信息进行训练从而创建文本预测模型；优选的，所述图像特征信息可以包括颜色情感特征、颜色和谐度特征、边缘特征、纹理特征、颜色变化特征和人脸的数量中的任意一个或其组合；优选的，利用得到的每个图像的特征信息及其对应的图像训练支持向量机得到图像预测模型，同理，利用得到的每个文本特征信息及其对应的标签训练支持向量机得到文本预测模型；优选的，所述图像特征信息包括颜色情感特征，所述提取待检测的视频的图像特征信息在所述图像预测模型上进行预测中的所述图像特征信息的提取包括颜色情感特征的提取，包括：
[0017] S1021、将所述图像特征信息从RGB颜色空间转换到CIELAB颜色空间和CIELCH颜色空间，根据公式（2)、（3)、和（4)计算活动性activity、热度heat、和重要性weight :
[0018]
【主权项】
1. 一种基于图像与文本的视频的快速分类方法，其特征在于，包括：分别关联多个视频的图像与多个视频类型、以及多个视频的文本与多个视频类型，从而生成对应视频类型的图像训练集及文本训练集；在每个所述图像训练集上分别提取图像特征信息进行训练从而创建图像预测模型，以及在每个所述文本训练集上提取文本特征信息进行训练从而创建文本预测模型；分别提取待检测的视频的图像特征信息在所述图像预测模型上和提取待检测的视频的文本特征信息在所述文本预测模型上进行预测，并对两个预测结果执行或运算作为检出类型。
2. 根据权利要求1所述的基于图像与文本的视频的快速分类方法，其特征在于，所述图像特征信息包括颜色情感特征、颜色和谐度特征、边缘特征、纹理特征、颜色变化特征和人脸的数量中的任意一个或其组合。
3. 根据权利要求2所述的基于图像与文本的视频的快速分类方法，其特征在于，所述图像特征信息包括颜色情感特征，相应的，所述在每个图像训练集上分别提取图像特征信息进行训练从而创建图像预测模型、以及提取待检测的视频的图像特征信息在所述图像预测模型上进行预测中的所述图像特征信息的提取包括颜色情感特征的提取，包括：将所述图像特征信息从RGB颜色空间转换到CIELAB颜色空间和CIELCH颜色空间，根据公式（2)、（3)、和（4)计算活动性activity、热度heat、和重要性weight :
weight = -1. 8+0. 45cos (h-ΙΟ。）+0· 04 (100-L*) (2) heat = -0· 5+0. 02 (C*) h ci7Cos (h-50。）（3) 其中，（d)，〇Λ a?分别是颜色空间CIELCH和CIELAB的颜色分量；再根据公式（1)计算颜色情感特征EI (X，y):
4. 根据权利

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡卫明;付志康;李兵;
技术所有人：中国科学院自动化研究所;
我是此专利的发明人

上一篇：一种自适应动态数据处理方法
上一篇：一种实时内存数据库的带订阅/发布的数据推送框架的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。