视频处理方法、装置、电子设备及存储介质与流程

文档序号：22506611发布日期：2020-10-13 09:44阅读：来源：国知局

技术特征：

1.一种视频处理方法，其特征在于，包括：

在视频播放过程中，针对按照预定策略确定出的待处理的音频数据，所述音频数据为未播放的音频数据，分别进行以下处理：

从所述音频数据对应的文本内容中提取出符合预定要求的词语，作为所述音频数据的标签；

根据所述标签确定出所述音频数据对应的特效动画；

当所述音频数据开始播放时，将所述特效动画叠加到对应的视频画面上进行展示。

2.根据权利要求1所述的方法，其特征在于，

所述从所述音频数据对应的文本内容中提取出符合预定要求的词语，作为所述音频数据的标签包括：

对所述文本内容进行分词处理；

针对任一分词结果，若确定所述分词结果位于预先生成的热点词语词表中，则确定所述分词结果为热点词语，将所述分词结果作为所述音频数据的标签。

3.根据权利要求1所述的方法，其特征在于，

该方法进一步包括：将所述音频数据输入预先训练得到的场景识别模型，得到识别出的所述音频数据对应的场景，将所述场景作为所述音频数据的标签。

4.根据权利要求3所述的方法，其特征在于，

所述场景识别模型包括：采用深度学习方法训练得到的场景识别模型。

5.根据权利要求3所述的方法，其特征在于，

所述根据所述标签确定出所述音频数据对应的特效动画包括：

若所述标签的数量为一，则获取所述标签对应的特效动画，作为所述音频数据对应的特效动画；

若所述标签的数量大于一，则从中选出一个标签，获取选出的标签对应的特效动画，作为所述音频数据对应的特效动画；

6.根据权利要求5所述的方法，其特征在于，

获取任一标签对应的特效动画包括：

若本地存储有所述标签对应的特效动画，则从本地获取所述标签对应的特效动画；

若本地未存储有所述标签对应的特效动画，则从服务端获取所述标签对应的特效动画，并存储到本地。

7.根据权利要求6所述的方法，其特征在于，

该方法进一步包括：

若任一特效动画在本地的存储时长超过第一预定时长，则将所述特效动画从本地删除；

和/或，若存储在本地的任一特效动画超过第二预定时长未被使用，则将所述特效动画从本地删除。

8.根据权利要求1所述的方法，其特征在于，

所述待处理的音频数据的确定方式包括：

将所述视频按预定时长划分为m个连续的视频片段，m为大于一的正整数；

针对任一视频片段对应的音频数据，分别按照预定策略从中选出一段音频数据，作为所述待处理的音频数据。

9.根据权利要求8所述的方法，其特征在于，

所述按照预定策略从中选出一段音频数据包括：选出语义最为完整的一个语句对应的音频数据。

10.一种视频处理装置，其特征在于，包括：标签生成模块、动画获取模块以及动画展示模块；

所述标签生成模块，用于在视频播放过程中，针对按照预定策略确定出的待处理的音频数据，所述音频数据为未播放的音频数据，分别从所述音频数据对应的文本内容中提取出符合预定要求的词语，作为所述音频数据的标签；

所述动画获取模块，用于根据所述标签确定出所述音频数据对应的特效动画；

所述动画展示模块，用于当所述音频数据开始播放时，将所述特效动画叠加到对应的视频画面上进行展示。

11.根据权利要求10所述的装置，其特征在于，

所述标签生成模块对所述文本内容进行分词处理，针对任一分词结果，若确定所述分词结果位于预先生成的热点词语词表中，则确定所述分词结果为热点词语，将所述分词结果作为所述音频数据的标签。

12.根据权利要求10所述的装置，其特征在于，

所述标签生成模块进一步用于，将所述音频数据输入预先训练得到的场景识别模型，得到识别出的所述音频数据对应的场景，将所述场景作为所述音频数据的标签。

13.根据权利要求12所述的方法，其特征在于，

所述场景识别模型包括：采用深度学习方法训练得到的场景识别模型。

14.根据权利要求12所述的装置，其特征在于，

所述动画获取模块在所述标签的数量为一个时，获取所述标签对应的特效动画，作为所述音频数据对应的特效动画，在所述标签的数量大于一个时，从中选出一个标签，获取选出的标签对应的特效动画，作为所述音频数据对应的特效动画；

15.根据权利要求14所述的装置，其特征在于，

所述动画获取模块在需要获取任一标签对应的特效动画时，若确定本地存储有所述标签对应的特效动画，则从本地获取所述标签对应的特效动画，若确定本地未存储有所述标签对应的特效动画，则从服务端获取所述标签对应的特效动画，并存储到本地。

16.根据权利要求15所述的装置，其特征在于，

所述动画获取模块进一步用于，若确定任一特效动画在本地的存储时长超过第一预定时长，则将所述特效动画从本地删除，和/或，若确定存储在本地的任一特效动画超过第二预定时长未被使用，则将所述特效动画从本地删除。

17.根据权利要求10所述的装置，其特征在于，

所述装置中进一步包括：音频获取模块，用于将所述视频按预定时长划分为m个连续的视频片段，m为大于一的正整数，针对任一视频片段对应的音频数据，分别按照预定策略从中选出一段音频数据，作为所述待处理的音频数据。

18.根据权利要求17所述的装置，其特征在于，

所述音频获取模块选出语义最为完整的一个语句对应的音频数据。

19.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。

20.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的方法。

技术总结
本申请公开了视频处理方法、装置、电子设备及存储介质，涉及视频识别和理解及深度学习领域，其中的方法可包括：在视频播放过程中，针对按照预定策略确定出的待处理的音频数据，该音频数据为未播放的音频数据，分别进行以下处理：从该音频数据对应的文本内容中提取出符合预定要求的词语，作为该音频数据的标签；根据所述标签确定出该音频数据对应的特效动画；当该音频数据开始播放时，将特效动画叠加到对应的视频画面上进行展示。所述方案可提升视频画面的呈现效果等。

技术研发人员：赵德玺
受保护的技术使用者：百度在线网络技术(北京)有限公司
技术研发日：2020.06.05
技术公布日：2020.10.13

完整全部详细技术资料下载

当前第2页1 2