云图分布式视频分类方法与流程

文档序号：15932415发布日期：2018-11-14 01:51阅读：404来源：国知局

该方法涉及技术领域为图像模式与识别，声音模式与识别，大数据，等计算机相关领域学科技术。

背景技术

互联网和多媒体技术的不断发展，促使互联网上视频的数量急速增长，如何对极其大量的视频进行分类，按照内容准确、快速、有效的对这些视频进行分类对于视频的存储、管理，提升视频相关行业的市场价值，和未来的大数据挖据都提供了至关重要的技术基础。

现有视频分类技术大致基于编码分类，或者基于视频回复和标题、文字分类等，很难像人类观看视频后在进行分类一样准确，也很难做到真正靠内容进行分类而本技术方法就是有效解决现有视频内容分类并不能真正的基于内容分类的问题所在，实现以类似人类思维的分类方法，真正的通过“观看”视频内容而进行得视频分类，并实现高效、快速、真正的基于视频内容进行的视频分类方法。

技术实现要素：

本发明为一种基于云图分布式的视频分类方法其方法可实现快速高效的视频分类，并做到真正的基于视频内容的分类。

一、基于原理：

该方法受启发于人类进行视频分类的方法进行分类，人类观看到视频，会用眼睛进行图片视频部分的感受，在脑海里存储关键词；根据耳朵对声音部分进行倾听，在脑海里存储关键词，然后通过脑海里存储的关于观看视频的图像关键词和声音关键词进行判断该视频属于哪类视频，并且为真正的基于内容进行视频分类的。并可以根据脑海里存储的关键词进行后期回忆视频的检索，通过说道某些视频中的关键词而在脑海里想起该视频是哪个。

二、具体内容：

本分类方法也将视频视作两部分，为图像视频与声音视频，并以时间轴作为关联轴进行两个数据库基于时间进行分别得识别处理形成两个基于时间抽分布的同轴关键词数据库。

其中对于图像视频进行模糊图像识别，形成模糊识别关键字，由于每一帧的视频图像具有不同的物、景、人、线条、动画等各种元素，所以模糊识别会在每一帧或每几帧形成模糊识别出的名词关键词，并根绝时间轴在视频图像数据库进行排放，同时间的关键字数据进行堆叠排放，不同时间的关键词根据时间轴排放有序存储。形成时间轴上半部的视频图像关键词的时间排放云图。如图1上半部分所示。

其中对于声音视频进行声音识别，识别声音中的每段时间其中的名词作为关键词，并以时间轴为主轴建立数据库，将其中识别出来的关键词在数据库进行有序排放，同时间的关键词数据进行堆叠排放，不同时间的关键词根据时间轴排放。形成时间轴下半部分的声音图像关键词的时间排放云图。如图1下半部份所示。

图像视频关键字数据库云图与声音视频关键词数字云图基于同一条时间线进行排列，并生成关联数据存储。如图1所示。

因其关键词以时间轴为主轴进行存储排列后类似云图，所以该方法命名为云图分布式视频分类方法。

该方法获得的单一视频的分布式云图后可以根据上下两部分云图关键词进行高频词筛选，形成上下两部分高频词的分布式云图(其高频词可参考tf-idf统计算法进行计算)，筛选后的云图关键字为其较为重要的关于视频内容的关键词云图。

该高频分布式云图为该视频后期作为检索需要的最全的关键词群。

获得该分布式云图或高频分布式云图再进行k-means算法对视频集行分类，便可以获想要的视频分类。

对于分布式云图的具体分类可不局限于该算法，只要是文本分类的算法都可行。本发明方法将原本的视频分类，通过分布式云图的视频分类方法将该分类降维到文本分类方法就可以解决。现阶段文本分类方法及其成熟，快速，普遍，方法多样。

三、方法优势

1，解决现阶段没有真正完全基于内容的视频分类算法的空缺。

2，具有较高运算速度，利用降维思路将视频分类进行降维处理，比其他视频处理算法更加快速、高效。

3，一件双雕，该方法在解决视频分类方法的同时解决了关于视频检索关键词准确度的问题，形成真正基于视频内容的检索词库。

4，该方法采用多个交叉学科应用算法，包括模糊识别、音频识别、文本识别算法等，来解决当实际问题。

5，该方法具有可延展性，对于不同硬件需求，成本需求，预期效果需求，均可实现该方法，且为未来发展将会产生海量的大数据视频也能做到很的分类效果。

附图说明

图1，云图分布式视频分类方法流程图

图2，云图分布式视频分类方法流程图

图3，“泰山美景短视频”的云图分布简图

具体实施方式

云图分布式视频分类方法可以通过视频分类系统进行应用实现，该系是将视频按照视频图像与视频音频两部分进行同时处理(也可以不同步处理通过增加处理时长来降低服务器硬件配备要求标准或仅处理视频图像或视频音频来节省运算空间，获得差异性结果只影响获得分类结果的准确性和预算成本)。

对于该视频的视频图像部分处理可采用图像模式与识别中关于模糊识别算法进行视频图像识别。根据每一帧图片进行识别，获得模糊识别的主体名词，如图3中，识别出的人、山、树等等，由其物体颜色，轮廓等特征识别出其模糊范围。根绝视频播放的时间轴进行识别出来的“关键词”进行有序存储。每帧都进行模糊识别，累积获得“关键词”有序排列词群，且序为播放时间轴。这样获得的关键词群具有重复出现次数越多的视频特征元素关键词越多，且提取关键词只提取名词为参考(也可以增加动词提取，局限于模糊识别算法的现有技术，其获得的差异结果只影响分类结果准确性和预算成本)。这样获得的关键词群都为视频图像“在人观看时脑海里存储的元素词”，为视频图像实际视频播放中涉及的视频内容词，其出现频率越高说明越是视频主旨内容分类中重要的关键词。

对于该视频的视频音频部分处理可采用模式识别中关于语音识别的相关算法。语音识别算法在现在已经非常普遍，从讯飞到ibm语音识别出现各种不同算法，受限于应用设备和所需准确度的不同而选择不同的识别方式。我们将对视频语音部分进行整句识别，然后提取其中的名词部分作为“关键词”进行有序存储，其序为播放时间轴。这样获得的关键词群具有重复出现次数越多的视频特征关键词，且提取的词为名词(也可提取语音动词但是并不建议如此做)，这样获得的关键词群都为视频音频的“人在听视频语音时候脑海里存储的内容词”，为视频音频实际播放中语音涉及的内容此，其出现频率越高说明越是视频主旨内容分类中的关键词。

对于视频内容与视频音频的识别并建分别得立关键字群方法原理基本相似只是运用的算法不同，且发明人建议使用时间轴作为共同轴建立关键词群，但只建立两个关键词群存储也可以达到利用云分布进行降维分类的效果，只是对于前者，其做更细化的视频分类效果更好。视频在短短几年就海量徒增，未来视频的生成量将及其庞大，所以现如今的大致视频分类方法，在未来可能过于宽泛，而更加细致的视频分类的类别产生将要基于前者发明者推荐的方法作为基础数据提供。

通过以上方法将会获得该视频的“云图分布”关键词群，该“云图分布”可以作为视频检索的该视频关键字库，也可以经过二次处理后的获得高频词关键字群(可使用高频词筛选tf-idf算法也可以采用其他高频词筛选算法)进行作为检索词库。

通过以上方法将会获得该视频的“云图分布”关键词群，该“云图分布”是将该视频进行基于内容的降维方法。之后可以采用现今的通用文本分类方法对该视频“云图分布”高频词进行分类计算，现在的文本分类算法比较成熟，算法多样，其采用那种算法运算速度都非常快，所以采用何种文本算法将取决于对该系统的成本控制和所需运算结果准确度。

归结方法为：

。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王妃
技术所有人：王妃
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。