视频标签的添加方法及装置、电子设备、计算机可读存储介质与流程

文档序号：22324492发布日期：2020-09-25 17:52阅读：来源：国知局

技术特征：

1.一种视频标签的添加方法，其特征在于，所述方法包括：

获取目标视频中的视频帧；

计算所述视频帧与多个预设图片的相似度，得到相似图片；其中，所述相似图片为所述多个预设图片按照与所述视频帧的相似度从大到小进行排序之后的前预设数量的图片；每个预设图片对应至少一个用于表征所述预设图片的图片内容的文字标签；

将全部或者部分所述相似图片对应的文字标签，确定为所述视频帧的文字标签；

根据所述视频帧的文字标签，对所述目标视频添加文字标签。

2.根据权利要求1所述的方法，其特征在于，不同相似图片对应的文字标签相同或者不同；所述将全部或者部分所述相似图片对应的文字标签，确定为所述视频帧的文字标签的步骤包括：

汇总对应相同文字标签的所述相似图片，得到至少一个图片类；

根据每个所述图片类中的所述相似图片的相似度，计算得到每个所述图片类的可信分数；

将目标图片类包含的相似图片对应的文字标签，确定为所述视频帧的文字标签；其中，所述目标图片类为所述至少一个图片类中的可信分数超过第一阈值的图片类。

3.根据权利要求2所述的方法，其特征在于，所述根据每个所述图片类中的所述相似图片的相似度，计算得到每个所述图片类的可信分数的步骤包括：

针对每个所述图片类，将所述图片类中的所有所述相似图片的相似度相加得到的总和，作为所述图片类的可信分数。

4.根据权利要求2所述的方法，其特征在于，所述根据所述视频帧的文字标签，对所述目标视频添加文字标签的步骤包括：

汇总对应相同文字标签的视频帧，得到至少一个帧类；

根据每个所述帧类中的所述视频帧的可信分数，计算得到每个所述帧类的可信分数；其中，所述视频帧的可信分数为所述视频帧的文字标签对应的所述目标图片类的可信分数；

将目标帧类包含的视频帧的文字标签，添加为所述目标视频的文字标签；其中所述目标帧类为所述至少一个帧类中的可信分数超过第二阈值的帧类。

5.根据权利要求1所述的方法，其特征在于，在所述获取目标视频中的视频帧的步骤之前，所述方法还包括：

对至少一个视频进行分割，得到多个视频片段；

将每一个所述视频片段作为一个所述目标视频。

6.根据权利要求5所述的方法，其特征在于，所述对至少一个视频进行分割，得到多个视频片段的步骤包括：

分别对所述至少一个视频中的每个视频进行镜头检测，将所述每个视频中属于同一镜头的多个连续视频帧切割为一个视频片段，得到多个视频片段。

7.根据权利要求5所述的方法，其特征在于，在所述根据所述视频帧的文字标签，对所述目标视频添加文字标签的步骤之后，所述方法还包括：

接收用户输入的搜索词；

根据所述搜索词，匹配所述目标视频的文字标签；

将与所述搜索词匹配成功的文字标签对应的目标视频反馈至用户。

8.根据权利要求1所述的方法，其特征在于，所述获取目标视频中的视频帧包括：

按照预设间隔，抽取所述目标视频中的多个视频帧。

9.根据权利要求1所述的方法，其特征在于，所述计算所述视频帧与多个预设图片的相似度，得到相似图片的步骤包括：

根据预先训练好的图片特征提取模型，分别计算所述视频帧的特征向量以及每个所述预设图片的特征向量；

根据所述视频帧的特征向量与所述预设图片的特征向量，得到所述视频帧与每个所述预设图片的相似度；

将所述多个预设图片按照与所述视频帧的相似度从大到小进行排序，得到图片序列；

将所述图片序列的前预设数量的元素，确定为所述视频帧的相似图片。

10.一种视频标签的添加装置，其特征在于，所述装置包括：

获取模块，用于获取目标视频中的视频帧；

计算模块，用于计算所述视频帧与多个预设图片的相似度，得到相似图片；其中，所述相似图片为所述多个预设图片按照与所述视频帧的相似度从大到小进行排序之后的前预设数量的图片；每个预设图片对应至少一个用于表征所述预设图片的图片内容的文字标签；

确定模块，用于将全部或者部分所述相似图片对应的文字标签，确定为所述视频帧的文字标签；

添加模块，用于根据所述视频帧的文字标签，对所述目标视频添加文字标签。

11.一种电子设备，其特征在于，包括：处理器、通信接口、存储器和通信总线；其中，处理器、通信接口以及存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现如权利要求1至9中任一项所述的视频标签的添加方法中的步骤。

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如权利要求1至9中任一项所述的视频标签的添加方法的步骤。

技术总结
本发明实施例提供了一种视频标签的添加方法及装置、电子设备、计算机可读存储介质，该方法包括获取目标视频中的视频帧；计算视频帧与多个预设图片的相似度，得到相似图片；相似图片为多个预设图片按照与视频帧的相似度从大到小进行排序之后的前预设数量的图片；每个预设图片对应至少一个表征预设图片的图片内容的文字标签；将全部或者部分相似图片对应的文字标签，确定为视频帧的文字标签；根据视频帧的文字标签，对目标视频添加文字标签。本发明通过图片比对的方式对视频帧添加文字标签，根据视频帧的文字标签，对视频添加文字标签。不仅可以提升视频的文字性描述的准确性，还可以提升视频搜索的准确率。

技术研发人员：余海铭
受保护的技术使用者：北京奇艺世纪科技有限公司
技术研发日：2020.05.19
技术公布日：2020.09.25

完整全部详细技术资料下载

当前第2页1 2