一种基于深度学习的体育视频集锦剪辑方法与流程

文档序号：14951858发布日期：2018-07-17 22:44阅读：3648来源：国知局

本发明涉及视频处理领域，具体地，涉及一种基于深度学习的体育视频集锦剪辑方法。

背景技术：

传统的体育比赛视频集锦剪辑大多采用人工的方法，由视频编辑自行判断一场比赛中的精彩部分，并进行剪辑。人工的方法通常要求编辑对所剪辑的体育比赛有一定的了解，知道如何判断一场比赛中的精彩镜头，同时需要看完整场比赛，以保证不会漏掉其中的精彩部分。随着现阶段体育比赛越来越丰富，人工剪辑的方法显得效率低下，不足以满足对大量比赛进行专业化的剪辑的需求。

技术实现要素：

本发明提供了一种基于深度学习的体育视频集锦剪辑方法，解决了现有采用人工视频剪辑方法效率低下的问题，实现了自动对视频进行剪辑，剪辑效率较高的技术效果。

为实现上述发明目的，

本技术：
提供了一种基于深度学习的体育视频集锦剪辑方法，所述方法包括：

将待处理的视频源拆分为一系列视频块，并按顺序对每段视频块标记序号；

针对每一个视频块，基于训练好的深度学习vgg16网络进行打分，该分数为0-1的小数，其中，打分分数的高低与该段视频精彩程度成正比；

打分完成后，以视频块序号为横轴，以视频块分数为纵轴建立坐标系，并将一系列视频块在坐标系中标出，并连接形成曲线；

在坐标系中，获取曲线中所有波峰为1的波段并获取对应的视频块序号，组成视频块序号组；

基于获取的视频块序号组，将视频块序号组中序号对应的视频块组成连续视频，生成视频精彩集锦。

该方法对比赛的剪辑完全使用自动化程序执行，解决了现阶段体育比赛人工剪辑方法效率低下的问题。

进一步的，本方法中的深度学习vgg16网络将准备的训练数据输入网络，观察网络输出的准确率和loss值，在训练过程中不断降低学习率，直到输出的准确率不再上升且loss值不再下降。

进一步的，本方法将待处理的视频源的每一帧彩色图像转换为灰度图，然后按照每24帧分为一个视频块，并按顺序对每段视频块标记序号。

本方法中的深度学习vgg16网络模型训练具体包括：修改vgg16网络，将vgg16网络中data的channel设置为24，修改vgg16网络中fc8层的输出参数num_output为1，最后的loss层改为sigmoidcrossentropyloss层，在caffe环境中训练准备好的训练数据。

进一步的，本方法使用训练好的模型对每个视频块进行预测，将fc8层的输出通过sigmod函数映射到0-1的范围内，该数值即为该段视频的精彩程度分数。

以视频块序号为横轴，以视频块分数为纵轴作一条曲线：视频中的精彩部分的label标记1，该精彩部分起始和结束的序号所对应的label标记0，顺次连接标记点，即可获得每个视频块所对应的label。

依照编号顺序获取分数为1的序号为基准，从序号从大向小的方向，获取分数为0的序号为该段精彩视频序列段的起始序号；从序号从小向大的方向，向后获取分数为0的序号作为该段精彩视频序列段的结束序号，保存区间序列所对应的视频块。

本申请提供的一个或多个技术方案，至少具有如下技术效果或优点：

解决了现有采用人工视频剪辑方法效率低下的问题，实现了自动对视频进行剪辑，剪辑效率较高的技术效果。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解，构成本申请的一部分，并不构成对本发明实施例的限定；

图1是本申请中视频块打分流程示意图；

图2是本申请中视频精彩片段抽取流程示意图；

图3是本申请中vgg16网络示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在相互不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述范围内的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

请参考图1-图3，本申请提供了种基于深度学习技术的体育比赛视频剪辑方法，用于解决体育比赛人工剪辑方法效率低的问题。

将整个待处理的视频按照每24帧分为一系列视频块，并按顺序给每段视频块标记序号；针对每一个视频块，使用事先训练好的vgg16网络进行打分，该分数为0-1的小数，其中越接近0表示该段视频越不精彩，越接近1表示该段视频越精彩；打分结束后，可以获得一条以序号为横轴，以分数为纵轴的曲线；曲线中波峰为1的波所对应的视频段即为精彩视频所在的部分；分别找到波峰为1的波，获取该段波所对应的视频块序号，该段连续视频块即为比赛的一个精彩片段；综合所有的精彩片段即可获得该场比赛的精彩集锦。

训练数据准备：

1.将视频的每一帧彩色图像转换为灰度图，然后按照每24帧分为一个视频块，并编号。通常的视频一秒包含24帧，所以一个视频块所对应的序号对应该视频块在整段视频中的时间。

2.以视频块序号为横轴，该段视频精彩程度为纵轴作一条曲线：视频中的精彩部分的label标记1，该精彩部分起始和结束的序号所对应的label标记0，顺次连接标记点，即可获得每个视频块所对应的label。

模型训练：

1.修改vgg16网络，将data的channel设置为24，修改fc8层的输出参数num_output为1，最后的loss层改为sigmoidcrossentropyloss层。

2.在caffe环境中训练准备好的训练数据。

视频块精彩程度打分：

使用训练好的模型对每个视频块进行预测，将fc8层的输出通过sigmod函数映射到0-1的范围内，该数值即为该段视频的精彩程度分数。

将每个比赛视频输入到执行程序后，程序自动进行视频分块，并对每块视频利用深度学习的方法实现自动评估打分，该分数能够反映该视频块的精彩程度，最后将所有精彩的视频块连接起来即可得到整场比赛的精彩集锦。整个过程全部由程序执行，可以快速准确地实现对比赛视频集锦的剪辑工作。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

技术特征：

技术总结
本发明公开了一种基于深度学习的体育视频集锦剪辑方法，所述方法包括：将待处理的视频源拆分为一系列视频块，并按顺序对每段视频块标记序号；针对每一个视频块，基于训练好的深度学习VGG16网络进行打分，该分数为0‑1的小数，其中，打分分数的高低与该段视频精彩程度成正比；打分完成后，以视频块序号为横轴，以视频块分数为纵轴建立坐标系，并将一系列视频块在坐标系中标出，并连接形成曲线；在坐标系中，获取曲线中所有波峰为1的波段并获取对应的视频块序号，组成视频块序号组；基于获取的视频块序号组，将视频块序号组中序号对应的视频块组成连续视频，生成视频精彩集锦；实现了自动对视频进行剪辑，剪辑效率较高的技术效果。

技术研发人员：周永修
受保护的技术使用者：成都睿码科技有限责任公司;杭州数峰科技有限公司
技术研发日：2018.02.12
技术公布日：2018.07.17

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周永修
技术所有人：成都睿码科技有限责任公司;杭州数峰科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、毕老师：机构动力学与控制
2、袁老师：1.计算机视觉 2.无线网络及物联网
3、王老师：1.计算机网络安全 2.计算机仿真技术
4、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
5、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
如您是高校老师，可以点此联系我们加入专家库。