一种视频字幕的遮挡方法、装置、存储介质及电子设备与流程

文档序号：19183859发布日期：2019-11-20 01:17阅读：来源：国知局

技术特征：

1.一种视频字幕的遮挡方法，其特征在于，包括：

获取待处理视频和所述待处理视频对应的字幕数据；

获取所述字幕数据中的时间标签，并根据所述时间标签从所述待处理视频中提取目标视频帧；

根据预设的文本检测网络模型，识别所述目标视频帧的字幕文本在所述目标视频帧中的位置；

在所述待处理视频的播放过程中，根据所述字幕文本在所述目标视频帧中的位置对所述时间标签对应的时间段内的字幕进行动态遮挡。

2.如权利要求1所述的视频字幕的遮挡方法，其特征在于，所述获取所述字幕数据中的时间标签，并根据所述时间标签从所述待处理视频中提取目标视频帧，包括：

确定所述字幕数据包含的多个字幕行；

从所述字幕数据中获取每一字幕行的时间标签，其中，所述时间标签包括字幕行的起始时间和持续时长；

根据所述时间标签，从所述待处理视频获取每一字幕行的中间时刻的视频帧，作为目标视频帧。

3.如权利要求1所述的视频字幕的遮挡方法，其特征在于，所述根据预设的文本检测网络模型识别所述目标视频帧的字幕文本在所述目标视频帧中的位置，包括：

根据预设的文本检测网络模型识别所述目标视频帧中的文本，生成多个第一文本框；

根据预设的聚类算法对所述多个第一文本框进行聚类，生成多个文本框类别，并根据聚类结果删除所述多个第一文本框中的异常文本框；

按照预设算法对各文本框类别包含的第一文本框进行聚合，生成多个第二文本框，其中，一个第二文本框对应多个第一文本框；

获取所述目标视频帧中第一文本框对应的第二文本框的位置，将所述位置作为所述目标视频帧对应的字幕文本在所述目标视频帧中的位置。

4.如权利要求1所述的视频字幕的遮挡方法，其特征在于，所述在所述待处理视频的播放过程中，根据所述字幕文本在所述目标视频帧中的位置对所述时间标签对应的时间段内的字幕进行动态遮挡之前，还包括：

根据所述字幕文本在所述目标视频帧中的位置和所述时间标签生成字幕位置文件；

所述在所述待处理视频的播放过程中，根据所述字幕文本在所述目标视频帧中的位置对所述时间标签对应的时间段内的字幕进行动态遮挡，包括：

在所述待处理视频的播放过程中，根据所述字幕位置文件对所述时间标签对应的时间段内的字幕进行动态遮挡。

5.如权利要求4所述的视频字幕的遮挡方法，其特征在于，所述根据所述字幕文本在所述目标视频帧中的位置和所述时间标签生成字幕位置文件，包括：

将字幕行的目标视频帧对应的字幕文本在所述目标视频帧中的位置，作为所述字幕行的字幕文本在所述目标视频帧中的位置；

根据每一字幕行的字幕文本在所述目标视频帧中的位置和时间标签，生成字幕位置文件。

6.如权利要求3至5任一项所述的视频字幕的遮挡方法，其特征在于，所述预设的聚类算法为dbscan聚类算法，所述根据预设的聚类算法对所述多个第一文本框进行聚类，生成多个文本框类别，并根据聚类结果删除所述多个第一文本框中的异常文本框，包括：

确定所述字幕数据中的字幕数量，根据所述字幕数量确定聚类参数；

根据所述聚类参数和预设距离函数，对所述多个第一文本框进行聚类，生成多个文本框类别，并根据聚类结果删除所述多个第一文本框中的异常文本框。

7.如权利要求6所述的视频字幕的遮挡方法，其特征在于，所述距离函数为：

其中，b1、b2分别为两个第一文本框的面积，|b1∩b2|为所述两个第一文本框交集部分的面积。

8.如权利要求4所述的视频字幕的遮挡方法，其特征在于，所述在所述待处理视频的播放过程中，根据所述字幕位置文件对所述时间标签对应的时间段内的字幕进行动态遮挡，包括：

在所述待处理视频的播放过程中，从所述字幕位置文件中获取时间标签和字幕文本在所述目标视频帧中的位置；

当播放至所述时间标签对应的时间段时，对所述字幕文本在所述目标视频帧中的位置处进行高斯模糊处理，以进行字幕遮挡。

9.一种视频字幕的遮挡装置，其特征在于，包括：

数据获取单元，用于获取待处理视频和所述待处理视频对应的字幕数据；

视频帧确定单元，用于获取所述字幕数据中的时间标签，并根据所述时间标签从所述待处理视频中提取目标视频帧；

字幕识别单元，用于根据预设的文本检测网络模型识别所述目标视频帧的字幕文本在所述待处理视频中的位置；

字幕遮挡单元，用于在所述待处理视频的播放过程中，根据所述字幕文本在所述目标视频帧中的位置对所述时间标签对应的时间段内的字幕进行动态遮挡。

10.如权利要求9所述的视频字幕的遮挡装置，其特征在于，所述视频帧确定单元包括：

字幕行确定子单元，用于确定所述字幕数据包含的多个字幕行；

标签获取子单元，用于从所述字幕数据中获取每一字幕行的时间标签，其中，所述时间标签包括字幕行的起始时间和持续时长；

视频帧确定子单元，用于根据所述时间标签，从所述待处理视频获取每一字幕行的中间时刻的视频帧，作为目标视频帧。

11.如权利要求9所述的视频字幕的遮挡装置，其特征在于，所述字幕识别单元包括：

文本识别子单元，用于根据预设的文本检测网络模型识别所述目标视频帧中的文本，生成多个第一文本框；

文本聚类子单元，用于根据预设的聚类算法对所述多个第一文本框进行聚类，生成多个文本框类别，并根据聚类结果删除所述多个第一文本框中的异常文本框；

文本聚合子单元，用于按照预设算法对各文本框类别包含的第一文本框进行聚合，生成多个第二文本框，其中，一个第二文本框对应多个第一文本框；

位置确定子单元，用于获取所述目标视频帧中第一文本框对应的第二文本框的位置，将所述位置作为所述目标视频帧对应的字幕文本在所述目标视频帧中的位置。

12.一种存储介质，其特征在于，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1至8任一项所述的视频字幕的遮挡方法。

13.一种电子设备，其特征在于，包括：存储器、处理器及存储在所述存储器上，并可在所述处理器上运行的视频字幕的遮挡程序，所述视频字幕的遮挡程序被所述处理器执行时实现如权利要求1-8任一项所述的方法。

技术总结
本发明实施例公开了一种视频字幕的遮挡方法、装置、存储介质及电子设备。该方案获取待处理视频和所述待处理视频对应的字幕数据；获取所述字幕数据中的时间标签，并根据所述时间标签从所述待处理视频中提取目标视频帧；根据预设的文本检测网络模型，识别所述目标视频帧的字幕文本在所述目标视频帧中的位置；在所述待处理视频的播放过程中，根据所述字幕文本在目标视频帧中的位置对所述时间标签对应的时间段内的字幕进行动态遮挡，以实现针对出现的时间和位置对视频中的字幕进行动态遮挡。

技术研发人员：杨跃;董治;李深远
受保护的技术使用者：腾讯音乐娱乐科技(深圳)有限公司
技术研发日：2019.07.30
技术公布日：2019.11.19

完整全部详细技术资料下载

当前第2页1 2