视频文本信息确定方法、装置及存储介质与流程

文档序号：37099440发布日期：2024-02-22 20:56阅读：16来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本技术涉及图像处理，尤其涉及一种视频文本信息确定方法、装置及存储介质。

背景技术：

1、视频文件中的字幕、弹幕等内容中存在许多敏感字。为了保证数据安全，确定视频文件中的敏感文本成为一个关键问题。

2、目前，通用的视频文本检索方法是对每个视频的所有图像帧进行检索，导致检索效率太低。

技术实现思路

1、本技术提供一种视频文本信息确定方法、装置及存储介质，用于解决通用方法中确定视频中文本信息的效率太低的问题。

2、为达到上述目的，本技术采用如下技术方案：

3、第一方面，提供一种视频文本信息确定方法，包括：获取目标视频中的多个第一图像帧；确定多个第一图像帧中的至少一个第二图像帧；其中，第二图像帧的画面与相邻图像帧的画面的相似度小于第一预设阈值；第二图像帧的相邻图像帧为多个图像帧中与第二图像帧的播放时刻相邻的图像帧；确定至少一个第二图像帧中的第三图像帧；第三图像帧为具有文本信息的图像帧；提取第三图像帧中的文本信息，得到目标视频的文本信息。

4、可选的，提取第三图像帧中的文本信息，得到目标视频的文本信息的方法，包括：确定第三图像帧中的第一文本显示区域；提取第一文本显示区域的文本信息，得到目标视频的文本信息。

5、可选的，在提取第一文本显示区域的文本信息，得到目标视频的文本信息之后，方法还包括：确定待检索关键文本信息；匹配目标视频的文本信息中与待检索关键文本信息相同的目标文本信息；确定目标文本信息所属的第三图像帧的目标播放时刻；基于待检索关键文本信息、目标文本信息、以及目标播放时刻，确定目标视频的关键文本信息检索结果。

6、可选的，确定目标文本信息所属的第三图像帧的目标播放时刻的方法，包括：基于目标文本信息的第一编号确定目标文本信息所属的目标文本显示区域；第一编号为基于第二编号为目标文本信息分配的编号，第二编号为基于第三图像帧的播放时刻为第一文本显示区域分配的编号；基于目标文本显示区域的第二编号确定目标文本显示区域所属的第三图像帧的目标播放时刻。

7、可选的，检索结果还包括以下至少之一：目标视频的文件路径，文件名称，文件大小。

8、可选的，获取目标视频中的多个第一图像帧的方法，包括：对目标视频进行分帧处理，得到多个第四图像帧；第四图像帧中的彩色像素转换为黑白像素，得到多个第一图像帧。

9、可选的，对目标视频进行分帧处理之前，方法还包括：基于第一解码方式对目标视频进行解码；第一解码方式为多种格式的视频通用的解码方式；若基于第一解码方式成功解码目标视频，则对解码后的目标视频进行分帧处理；若基于第一解码方式未成功解码目标视频，则基于第二解码方式解码目标视频，并对解码后的目标视频进行分帧处理，第二解码方式为目标视频的视频格式专用的解码方式。

10、第二方面，提供一种视频文本信息确定装置，包括：通信单元和处理单元；通信单元，用于获取目标视频中的多个第一图像帧；处理单元，用于确定多个第一图像帧中的至少一个第二图像帧；其中，第二图像帧的画面与相邻图像帧的画面的相似度小于第一预设阈值；第二图像帧的相邻图像帧为多个图像帧中与第二图像帧的播放时刻相邻的图像帧；处理单元，还用于确定至少一个第二图像帧中的第三图像帧；第三图像帧为具有文本信息的图像帧；处理单元，还用于提取第三图像帧中的文本信息，得到目标视频的文本信息。

11、可选的，处理单元，具体用于：确定第三图像帧中的第一文本显示区域；提取第一文本显示区域的文本信息，得到目标视频的文本信息。

12、可选的，在提取第一文本显示区域的文本信息，得到目标视频的文本信息之后，处理单元，还用于：确定待检索关键文本信息；匹配目标视频的文本信息中与待检索关键文本信息相同的目标文本信息；确定目标文本信息所属的第三图像帧的目标播放时刻；基于待检索关键文本信息、目标文本信息、以及目标播放时刻，确定目标视频的关键文本信息检索结果。

13、可选的，处理单元，具体用于：基于目标文本信息的第一编号确定目标文本信息所属的目标文本显示区域；第一编号为基于第二编号为目标文本信息分配的编号，第二编号为基于第三图像帧的播放时刻为第一文本显示区域分配的编号；基于目标文本显示区域的第二编号确定目标文本显示区域所属的第三图像帧的目标播放时刻。

14、可选的，检索结果还包括以下至少之一：目标视频的文件路径，文件名称，文件大小。

15、可选的，通信单元，具体用于对目标视频进行分帧处理，得到多个第四图像帧；将第四图像帧中的彩色像素转换为黑白像素，得到多个第一图像帧。

16、可选的，在对目标视频进行分帧处理之前，处理单元，还用于：基于第一解码方式对目标视频进行解码；第一解码方式为多种格式的视频通用的解码方式；若基于第一解码方式成功解码目标视频，则对解码后的目标视频进行分帧处理；若基于第一解码方式未成功解码目标视频，则基于第二解码方式解码目标视频，并对解码后的目标视频进行分帧处理，第二解码方式为目标视频的视频格式专用的解码方式。

17、第三方面，提供一种视频文本信息确定装置，包括存储器和处理器；存储器用于存储计算机执行指令，处理器与存储器通过总线连接；当视频文本信息确定装置运行时，处理器执行存储器存储的计算机执行指令，以使视频文本信息确定装置执行第一方面或其任一实现方式的视频文本信息确定方法。

18、该视频文本信息确定装置可以是网络设备，也可以是网络设备中的一部分装置，例如网络设备中的芯片系统。该芯片系统用于支持网络设备实现第一方面及其任意一种可能的实现方式中所涉及的功能，例如，获取、确定、发送上述视频文本信息确定方法中所涉及的数据和/或信息。该芯片系统包括芯片，也可以包括其他分立器件或电路结构。

19、第四方面，提供一种计算机可读存储介质，计算机可读存储介质包括计算机执行指令，当计算机执行指令在计算机上运行时，使得该计算机执行第一方面的视频文本信息确定方法。

20、第五方面，还提供一种计算机程序产品，该计算机程序产品包括计算机指令，当计算机指令在视频文本信息确定装置上运行时，使得视频文本信息确定装置执行如上述第一方面的视频文本信息确定方法。

21、需要说明的是，上述计算机指令可以全部或者部分存储在计算机可读存储介质上。其中，计算机可读存储介质可以与视频文本信息确定装置的处理器封装在一起的，也可以与视频文本信息确定装置的处理器单独封装，本技术对此不作限定。

22、本技术中第二方面、第三方面、第四方面以及第五方面的描述，可以参考第一方面的详细描述；并且，第二方面、第三方面、第四方面以及第五方面的有益效果，可以参考第一方面的有益效果分析，此处不再赘述。

23、在本技术中，上述视频文本信息确定装置的名字对设备或功能模块本身不构成限定，在实际实现中，这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本技术类似，属于本技术权利要求及其等同技术的范围之内。

24、本技术的这些方面或其他方面在以下的描述中会更加简明易懂。

25、本技术提供的技术方案至少带来以下有益效果：

26、基于上述任一方面，本技术提供了一种视频文本信息确定方法，本技术可以通过对比目标视频中相邻播放时刻的图像帧，确定目标视频中有画面变化的帧，只对有画面变化的帧进行检索，得到具有文本信息的图像帧，再从具有文本信息的图像帧中提取文本信息。本技术不需要对目标视频的所有图像帧进行检索，可以提高确定视频中文本信息的速度和效率。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高枫,夏俊杰,王题,王伟,肖宇,宋畅,韩孟祥,董正浩,邓成明
技术所有人：中国联合网络通信集团有限公司
我是此专利的发明人

上一篇：一种无人机反制器定位装置的制作方法
上一篇：一种多功能的窗结构的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。