基于深度神经网络的网络视频字幕的快速提取方法与流程

文档序号：17697954发布日期：2019-05-17 21:50阅读：来源：国知局

技术特征：

技术总结
本发明一种基于深度神经网络的网络视频字幕的快速提取方法。该方法具体为：将随机选取的背景图片合成含字幕的图片，进行处理得到字幕的图片的标签数据；建立字幕文本检测和文本识别模型，用合成训练数据训练字幕文本检测模型和字幕文本识别模型；将训练好的字幕文本检测模型和字幕文本识别模型组合在一起形成一个端到端的字幕提取算法，并加入多Batch的机制，加速字幕的提取速度。使得网络提取字幕的速度比没有多Batch加速机制时提高了两倍。在加入自动合成样本的数据层和多Batch加速机制后，我们的字幕提取方法的字符级识别准确率基本在0.98以上，行级识别准确率达到了平均达到了0.85，平均提取速度60ms/帧。

技术研发人员：殷绪成;张世学;侯杰波;朱超
受保护的技术使用者：北京科技大学
技术研发日：2018.12.24
技术公布日：2019.05.17

完整全部详细技术资料下载

当前第2页1 2