视频影像重点画面抓取方法、装置、存储介质及电子设备与流程

文档序号：15851339发布日期：2018-11-07 10:00阅读：152来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本申请涉及视频处理领域，具体涉及一种视频影像重点画面抓取方法、装置、存储介质及电子设备。

背景技术

现有技术中的重点画面抓取都是通过对视频的画面进行一帧一帧进行识别，然后才能抓取出其中的重点画面，但是采用这种方法的效率十分低下。

因此，现有技术存在缺陷，急需改进。

技术实现要素：

本申请实施例提供一种视频影像重点画面抓取方法、装置、存储介质及电子设备，可以抓取的效率。

本申请实施例提供一种视频影像重点画面抓取方法，视频影像具有与之同步播放的音频信息，包括以下步骤：

获取所述视频影像的种类信息；

根据所述种类信息设置关键字或者关键词；

对所述视频影像对应的音频信息进行语音识别，以找出所述音频信息中具有所述关键字或者关键词的时间信息；

根据所述时间信息从所述视频影像的多帧画面中筛选出重点画面。

在本申请实施例所述的视频影像重点画面抓取方法中，所述种类信息包括犯罪类、爱情类、科幻类、动作类、现实录像类。

在本申请实施例所述的视频影像重点画面抓取方法中，所述对所述视频影像对应的音频信息进行语音识别，以找出所述音频信息中具有所述关键字或者关键词的时间信息的步骤包括：

对所述视频影像对应的音频信息的音频信息进行语音识别，得到与所述音频数据对应的文字串信息，所述文字串信息包括文字串以及其中每一文字在所述视频影像时间轴上的位置；

对所述文字串中的各个文字进行逐一筛选，以获取关键字或者关键词的时间信息。

在本申请实施例所述的视频影像重点画面抓取方法中，所述对所述视频影像对应的音频信息的音频信息进行语音识别，得到与所述音频数据对应的文字串信息的步骤包括：

对所述视频影像对应的音频信息的音频信息进行语音识别，得到所述音频数据对应的文字串信息，其中，所述文字串信息包括文字串以及其中每一文字在所述视频影像时间轴上的位置；所述文字串包括人物对话文字以及器物声音对应的拟声词信息，该拟声词信息具有拟声词以及对应的器物种类。

在本申请实施例所述的视频影像重点画面抓取方法中，所述根据所述时间信息从所述视频影像的多帧画面中筛选出重点画面的步骤包括：

根据时间信息将关键字或者关键词出现的时间点前后预设时间段内的时间设置为重点时间；

获取所述视频影像在所述重点时间内的各帧画面，并将该各帧画面设定为重点画面。

一种视频影像重点画面抓取装置，视频影像具有与之同步播放的音频信息，该装置包括：

获取模块，用于获取所述视频影像的种类信息；

设置模块，用于根据所述种类信息设置关键字或者关键词；

识别模块，用于对所述视频影像对应的音频信息进行语音识别，以找出所述音频信息中具有所述关键字或者关键词的时间信息；

筛选模块，用于根据所述时间信息从所述视频影像的多帧画面中筛选出重点画面。

在本申请实施例所述的视频影像重点画面抓取装置中，所述识别模块包括：

识别单元，用于对所述视频影像对应的音频信息的音频信息进行语音识别，得到与所述音频数据对应的文字串信息，所述文字串信息包括文字串以及其中每一文字在所述视频影像时间轴上的位置；

第一筛选单元，用于对所述文字串中的各个文字进行逐一筛选，以获取关键字或者关键词的时间信息。

在本申请实施例所述的视频影像重点画面抓取装置中，所述识别单元用于：对所述视频影像对应的音频信息的音频信息进行语音识别，得到所述音频数据对应的文字串信息，其中，所述文字串信息包括文字串以及其中每一文字在所述视频影像时间轴上的位置；所述文字串包括人物对话文字以及器物声音对应的拟声词信息，该拟声词信息具有拟声词以及对应的器物种类。

一种存储介质，所述存储介质中存储有计算机程序，当所述计算机程序在计算机上运行时，使得所述计算机执行上述任一项所述的方法。

一种电子设备，包括处理器和存储器，所述存储器中存储有计算机程序，所述处理器通过调用所述存储器中存储的所述计算机程序，用于执行上述任一项方法。

由上可知，本发明通过获取所述视频影像的种类信息；根据所述种类信息设置关键字或者关键词；对所述视频影像对应的音频信息进行语音识别，以找出所述音频信息中具有所述关键字或者关键词的时间信息；根据所述时间信息从所述视频影像的多帧画面中筛选出重点画面；从而实现对重点画面的抓取，具有提高抓取速度，提高效率的有益效果。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的视频影像重点画面抓取方法的流程示意图。

图2是本申请实施例提供的视频影像重点画面抓取装置的结构示意图。

图3是本申请实施例提供的电子设备的结构示意图。

具体实施方式

下面详细描述本申请的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本申请，而不能理解为对本申请的限制。

在本申请的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本申请和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本申请的限制。此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本申请的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

在本申请的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接或可以相互通讯；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本申请中的具体含义。

在本申请中，除非另有明确的规定和限定，第一特征在第二特征之“上”或之“下”可以包括第一和第二特征直接接触，也可以包括第一和第二特征不是直接接触而是通过它们之间的另外的特征接触。而且，第一特征在第二特征“之上”、“上方”和“上面”包括第一特征在第二特征正上方和斜上方，或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”包括第一特征在第二特征正下方和斜下方，或仅仅表示第一特征水平高度小于第二特征。

下文的公开提供了许多不同的实施方式或例子用来实现本申请的不同结构。为了简化本申请的公开，下文中对特定例子的部件和设置进行描述。当然，它们仅仅为示例，并且目的不在于限制本申请。此外，本申请可以在不同例子中重复参考数字和/或参考字母，这种重复是为了简化和清楚的目的，其本身不指示所讨论各种实施方式和/或设置之间的关系。此外，本申请提供了的各种特定的工艺和材料的例子，但是本领域普通技术人员可以意识到其他工艺的应用和/或其他材料的使用。

本申请的说明书和权利要求书以及上述附图中的术语“第一”、“第二”、“第三”等（如果存在）是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应当理解，这样描述的对象在适当情况下可以互换。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含。例如，包含了一系列步骤的过程、方法或包含了一系列模块或单元的装置、终端、系统不必限于清楚地列出的那些步骤或模块或单元，还可以包括没有清楚地列出的步骤或模块或单元，也可以包括对于这些过程、方法、装置、终端或系统固有的其它步骤或模块或单元。

参考图1，图1为本发明一些实施例中的一种视频影像重点画面抓取方法，该视频影像具有与之同步播放的音频信息。该视频影像重点画面抓取方法包括以下步骤：

s101、获取所述视频影像的种类信息。

其中，可以通过工作人员手动选择的方式来确定该视频影像的种类信息。所述种类信息包括犯罪类、爱情类、科幻类、动作类、现实录像类。对于不同种类的视频影像，需要获取的重点画面是不同的。例如，对于电影或者电视剧，可以获取其中涉黄画面作为重点画面，也可以获取其中的血腥暴力画面作为重点画面。对于现实录像，可以以其中的一些对话或者重点时间的现场作为需要寻找的重点画面，例如，车祸现场，枪击现场等。

s102、根据所述种类信息设置关键字或者关键词。

其中，例如该种类信息为电影其中为动作类，则设定的关键字或者关键词包括“杀”、“碎尸万段”、“放过”、“死”等。

s103、对所述视频影像对应的音频信息进行语音识别，以找出所述音频信息中具有所述关键字或者关键词的时间信息。

其中，该步骤就找出该视频影像中与出现关键字或者关键词对应的时间信息。在一些实施例中，该步骤s103以下子步骤：s1031、对所述视频影像对应的音频信息的音频信息进行语音识别，得到与所述音频数据对应的文字串信息，所述文字串信息包括文字串以及其中每一文字在所述视频影像时间轴上的位置；s1032、对所述文字串中的各个文字进行逐一筛选，以获取关键字或者关键词的时间信息。

其中，该步骤s1031中，对所述视频影像对应的音频信息的音频信息进行语音识别，得到所述音频数据对应的文字串信息，其中，所述文字串信息包括文字串以及其中每一文字在所述视频影像时间轴上的位置；所述文字串包括人物对话文字以及器物声音对应的拟声词信息，该拟声词信息具有拟声词以及对应的器物种类。该数据库中存储有对应器物声音的数据信息，识别时，只需要将对应的器物声音与数据库中的数据信息进行匹配即可。

s104、根据所述时间信息从所述视频影像的多帧画面中筛选出重点画面。

在该步骤中，由于画面的出现与关键字出现的前后画面都有关联，例如，“强奸”对应的画面应该在之后的预设时间段内发生，因此，需要根据时间信息获取出现关键字或者关键词前后预设时间段内的各帧画面。在一些实施例中，该步骤s104包括以下子步骤：s1041、根据时间信息将关键字或者关键词出现的时间点前后预设时间段内的时间设置为重点时间；s1042、获取所述视频影像在所述重点时间内的各帧画面，并将该各帧画面设定为重点画面。从而实现对重点画面的抓取。然后只需要对重点画面进行细致的筛选即可快速得到最终的目标画面。

请参照图2，图2是本发明一实施例中的一种视频影像重点画面抓取装置200，视频影像具有与之同步播放的音频信息，该视频影像重点画面抓取装置200包括：获取模块201、设置模块202、识别模块203、筛选模块204。

其中，该获取模块201用于获取所述视频影像的种类信息。其中，可以通过工作人员手动选择的方式来确定该视频影像的种类信息。所述种类信息包括犯罪类、爱情类、科幻类、动作类、现实录像类。对于不同种类的视频影像，需要获取的重点画面是不同的。例如，对于电影或者电视剧，可以获取其中涉黄画面作为重点画面，也可以获取其中的血腥暴力画面作为重点画面。对于现实录像，可以以其中的一些对话或者重点时间的现场作为需要寻找的重点画面，例如，车祸现场，枪击现场等。

其中，该设置模块202用于根据所述种类信息设置关键字或者关键词。其中，例如该种类信息为电影其中为动作类，则设定的关键字或者关键词包括“杀”、“碎尸万段”、“放过”、“死”等。

其中，该识别模块203用于对所述视频影像对应的音频信息进行语音识别，以找出所述音频信息中具有所述关键字或者关键词的时间信息。在一些实施例中，该识别模块203包括：识别单元，用于对所述视频影像对应的音频信息的音频信息进行语音识别，得到与所述音频数据对应的文字串信息，所述文字串信息包括文字串以及其中每一文字在所述视频影像时间轴上的位置；第一筛选单元，用于对所述文字串中的各个文字进行逐一筛选，以获取关键字或者关键词的时间信息。在本申请实施例所述的视频影像重点画面抓取装置中，所述识别单元用于：对所述视频影像对应的音频信息的音频信息进行语音识别，得到所述音频数据对应的文字串信息，其中，所述文字串信息包括文字串以及其中每一文字在所述视频影像时间轴上的位置；所述文字串包括人物对话文字以及器物声音对应的拟声词信息，该拟声词信息具有拟声词以及对应的器物种类。

其中，该筛选模块204用于根据所述时间信息从所述视频影像的多帧画面中筛选出重点画面。在该步骤中，由于画面的出现与关键字出现的前后画面都有关联，例如，“强奸”对应的画面应该在之后的预设时间段内发生，因此，需要根据时间信息获取出现关键字或者关键词前后预设时间段内的各帧画面。在一些实施例中，该筛选模块204具体用于根据时间信息将关键字或者关键词出现的时间点前后预设时间段内的时间设置为重点时间；并获取所述视频影像在所述重点时间内的各帧画面，并将该各帧画面设定为重点画面。从而实现对重点画面的抓取。然后只需要对重点画面进行细致的筛选即可快速得到最终的目标画面。

请参照图3，本申请实施例还提供一种电子设备300，包括处理器301以及存储器302，存储器302中存储有计算机程序，所述处理器301通过调用所述存储器中存储的所述计算机程序，用于执行上述任一项的方法。

处理器301是终端300的控制中心，利用各种接口和线路连接整个终端的各个部分，通过运行或调用存储在存储器302内的计算机程序，以及调用存储在存储器302内的数据，执行终端的各种功能和处理数据，从而对终端进行整体监控。

在本实施例中，电子设备300中的处理器301会按照如下的步骤，将一个或一个以上的计算机程序的进程对应的指令加载到存储器302中，并由处理器301来运行存储在存储器302中的计算机程序，从而实现各种功能：由上可知，本发明通过获取所述视频影像的种类信息；根据所述种类信息设置关键字或者关键词；对所述视频影像对应的音频信息进行语音识别，以找出所述音频信息中具有所述关键字或者关键词的时间信息；根据所述时间信息从所述视频影像的多帧画面中筛选出重点画面；从而实现对重点画面的抓取，具有提高抓取速度，提高效率的有益效果。

存储器302可用于存储计算机程序和数据。存储器302存储的计算机程序中包含有可在处理器中执行的指令。计算机程序可以组成各种功能模块。处理器301通过调用存储在存储器302的计算机程序，从而执行各种功能应用以及数据处理。

本申请实施例还提供一种存储介质，该存储介质中存储有计算机程序，当该计算机程序在计算机上运行时，该计算机执行上述任一实施例所述的视频影像重点画面抓取方法。

需要说明的是，本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于计算机可读存储介质中，该存储介质可以包括但不限于：只读存储器（rom，readonlymemory）、随机存取存储器（ram，randomaccessmemory）、磁盘或光盘等。

以上对本申请实施例所提供的视频影像重点画面抓取方法、装置、存储介质及电子设备进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：蔡昭权;蔡映雪;胡辉;胡松;陈伽;黄思博;黄翰;梁椅辉;罗伟
技术所有人：惠州学院
我是此专利的发明人

上一篇：一种可去除手汗的塑料乒乓球拍的制作方法
上一篇：一种新型塑料乒乓球拍的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。