视频处理方法、装置、电子设备及存储介质与流程

文档序号:22506611发布日期:2020-10-13 09:44阅读:来源:国知局

技术特征:

1.一种视频处理方法,其特征在于,包括:

在视频播放过程中,针对按照预定策略确定出的待处理的音频数据,所述音频数据为未播放的音频数据,分别进行以下处理:

从所述音频数据对应的文本内容中提取出符合预定要求的词语,作为所述音频数据的标签;

根据所述标签确定出所述音频数据对应的特效动画;

当所述音频数据开始播放时,将所述特效动画叠加到对应的视频画面上进行展示。

2.根据权利要求1所述的方法,其特征在于,

所述从所述音频数据对应的文本内容中提取出符合预定要求的词语,作为所述音频数据的标签包括:

对所述文本内容进行分词处理;

针对任一分词结果,若确定所述分词结果位于预先生成的热点词语词表中,则确定所述分词结果为热点词语,将所述分词结果作为所述音频数据的标签。

3.根据权利要求1所述的方法,其特征在于,

该方法进一步包括:将所述音频数据输入预先训练得到的场景识别模型,得到识别出的所述音频数据对应的场景,将所述场景作为所述音频数据的标签。

4.根据权利要求3所述的方法,其特征在于,

所述场景识别模型包括:采用深度学习方法训练得到的场景识别模型。

5.根据权利要求3所述的方法,其特征在于,

所述根据所述标签确定出所述音频数据对应的特效动画包括:

若所述标签的数量为一,则获取所述标签对应的特效动画,作为所述音频数据对应的特效动画;

若所述标签的数量大于一,则从中选出一个标签,获取选出的标签对应的特效动画,作为所述音频数据对应的特效动画;

6.根据权利要求5所述的方法,其特征在于,

获取任一标签对应的特效动画包括:

若本地存储有所述标签对应的特效动画,则从本地获取所述标签对应的特效动画;

若本地未存储有所述标签对应的特效动画,则从服务端获取所述标签对应的特效动画,并存储到本地。

7.根据权利要求6所述的方法,其特征在于,

该方法进一步包括:

若任一特效动画在本地的存储时长超过第一预定时长,则将所述特效动画从本地删除;

和/或,若存储在本地的任一特效动画超过第二预定时长未被使用,则将所述特效动画从本地删除。

8.根据权利要求1所述的方法,其特征在于,

所述待处理的音频数据的确定方式包括:

将所述视频按预定时长划分为m个连续的视频片段,m为大于一的正整数;

针对任一视频片段对应的音频数据,分别按照预定策略从中选出一段音频数据,作为所述待处理的音频数据。

9.根据权利要求8所述的方法,其特征在于,

所述按照预定策略从中选出一段音频数据包括:选出语义最为完整的一个语句对应的音频数据。

10.一种视频处理装置,其特征在于,包括:标签生成模块、动画获取模块以及动画展示模块;

所述标签生成模块,用于在视频播放过程中,针对按照预定策略确定出的待处理的音频数据,所述音频数据为未播放的音频数据,分别从所述音频数据对应的文本内容中提取出符合预定要求的词语,作为所述音频数据的标签;

所述动画获取模块,用于根据所述标签确定出所述音频数据对应的特效动画;

所述动画展示模块,用于当所述音频数据开始播放时,将所述特效动画叠加到对应的视频画面上进行展示。

11.根据权利要求10所述的装置,其特征在于,

所述标签生成模块对所述文本内容进行分词处理,针对任一分词结果,若确定所述分词结果位于预先生成的热点词语词表中,则确定所述分词结果为热点词语,将所述分词结果作为所述音频数据的标签。

12.根据权利要求10所述的装置,其特征在于,

所述标签生成模块进一步用于,将所述音频数据输入预先训练得到的场景识别模型,得到识别出的所述音频数据对应的场景,将所述场景作为所述音频数据的标签。

13.根据权利要求12所述的方法,其特征在于,

所述场景识别模型包括:采用深度学习方法训练得到的场景识别模型。

14.根据权利要求12所述的装置,其特征在于,

所述动画获取模块在所述标签的数量为一个时,获取所述标签对应的特效动画,作为所述音频数据对应的特效动画,在所述标签的数量大于一个时,从中选出一个标签,获取选出的标签对应的特效动画,作为所述音频数据对应的特效动画;

15.根据权利要求14所述的装置,其特征在于,

所述动画获取模块在需要获取任一标签对应的特效动画时,若确定本地存储有所述标签对应的特效动画,则从本地获取所述标签对应的特效动画,若确定本地未存储有所述标签对应的特效动画,则从服务端获取所述标签对应的特效动画,并存储到本地。

16.根据权利要求15所述的装置,其特征在于,

所述动画获取模块进一步用于,若确定任一特效动画在本地的存储时长超过第一预定时长,则将所述特效动画从本地删除,和/或,若确定存储在本地的任一特效动画超过第二预定时长未被使用,则将所述特效动画从本地删除。

17.根据权利要求10所述的装置,其特征在于,

所述装置中进一步包括:音频获取模块,用于将所述视频按预定时长划分为m个连续的视频片段,m为大于一的正整数,针对任一视频片段对应的音频数据,分别按照预定策略从中选出一段音频数据,作为所述待处理的音频数据。

18.根据权利要求17所述的装置,其特征在于,

所述音频获取模块选出语义最为完整的一个语句对应的音频数据。

19.一种电子设备,其特征在于,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。

20.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的方法。


技术总结
本申请公开了视频处理方法、装置、电子设备及存储介质,涉及视频识别和理解及深度学习领域,其中的方法可包括:在视频播放过程中,针对按照预定策略确定出的待处理的音频数据,该音频数据为未播放的音频数据,分别进行以下处理:从该音频数据对应的文本内容中提取出符合预定要求的词语,作为该音频数据的标签;根据所述标签确定出该音频数据对应的特效动画;当该音频数据开始播放时,将特效动画叠加到对应的视频画面上进行展示。所述方案可提升视频画面的呈现效果等。

技术研发人员:赵德玺
受保护的技术使用者:百度在线网络技术(北京)有限公司
技术研发日:2020.06.05
技术公布日:2020.10.13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1