视频剪辑方法及装置与流程

文档序号：33713749发布日期：2023-04-01 02:35阅读：来源：国知局

技术特征：
1.一种视频剪辑方法，其特征在于，应用于客户端，包括：获取待剪辑视频，提取所述待剪辑视频中的音频数据和视频数据；对所述音频数据进行语音识别，获得所述音频数据对应的初始音频文本；响应于针对所述初始音频文本的交互指令，对所述初始音频文本进行处理，获得目标音频文本；基于所述目标音频文本对所述视频数据进行剪辑，生成所述待剪辑视频对应的目标视频。2.根据权利要求1所述的方法，其特征在于，所述响应于针对所述初始音频文本的交互指令，对所述初始音频文本进行处理，获得目标音频文本，包括：响应于针对所述初始音频文本的交互指令，确定所述初始音频文本中的待处理文本；基于所述待处理文本对所述初始音频文本进行处理，获得目标音频文本。3.根据权利要求2所述的方法，其特征在于，所述待处理文本包括待处理文字文本；相应地，所述基于所述待处理文本对所述初始音频文本进行处理，获得目标音频文本，包括：解析所述交互指令，确定所述待处理文字文本的文字交互操作；基于所述文字交互操作，对所述待处理文字文本进行处理，获得目标音频文本。4.根据权利要求3所述的方法，其特征在于，所述基于所述文字交互操作，对所述待处理文字文本进行处理，获得目标音频文本，包括：在确定所述文字交互操作为文字删除操作的情况下，删除所述待处理文字文本，获得目标音频文本；在确定所述文字交互操作为文字重排操作的情况下，确定所述待处理文字文本的文本顺序，基于所述文本顺序对所述待处理文字文本进行排序，获得目标音频文本。5.根据权利要求2所述的方法，其特征在于，所述待处理文本包括待处理字符文本；相应地，所述基于所述待处理文本对所述初始音频文本进行处理，获得目标音频文本，包括：解析所述交互指令，确定所述待处理字符文本的字符交互操作；基于所述字符交互操作，对所述待处理字符文本进行处理，获得目标音频文本。6.根据权利要求5所述的方法，其特征在于，所述基于所述字符交互操作，对所述待处理字符文本进行处理，获得目标音频文本，包括：在确定所述字符交互操作为字符删除操作的情况下，删除所述待处理字符文本，获得目标音频文本；在确定所述字符交互操作为字符编辑操作的情况下，获取编辑文本，并基于所述编辑文本，确定目标音频文本。7.根据权利要求1所述的方法，其特征在于，所述响应于针对所述初始音频文本的交互指令，对所述初始音频文本进行处理，获得目标音频文本，包括：响应于针对所述初始音频文本的识别指令，识别所述初始音频文本中的待删除文本，其中，所述待删除文本包括语气词文字和/或静音字符；响应于针对所述待删除文本的删除指令，删除所述待删除文本，获得目标音频文本。8.根据权利要求1-7任意一项所述的方法，其特征在于，所述对所述音频数据进行语音
识别，获得所述音频数据对应的初始音频文本，包括：基于预设语音识别规则，对所述音频数据进行语音识别，获得所述音频数据对应的初始音频文本，其中，所述初始音频文本包括文本内容和所述文本内容对应的初始文本时间戳；或者将所述音频数据发送至服务器，接收所述服务器返回的所述音频数据对应的初始音频文本，其中，所述初始音频文本包括文本内容和所述文本内容对应的初始文本时间戳。9.根据权利要求8所述的方法，其特征在于，所述基于所述目标音频文本对所述视频数据进行剪辑，生成所述待剪辑视频对应的目标视频，包括：在所述初始文本时间戳中，确定所述目标音频文本对应的目标文本时间戳；基于所述目标文本时间戳，对所述视频数据进行剪辑，生成所述待剪辑视频对应的目标视频。10.根据权利要求9所述的方法，其特征在于，所述基于所述目标文本时间戳，对所述视频数据进行剪辑，生成所述待剪辑视频对应的目标视频，包括：在所述视频数据中，选取所述目标文本时间戳对应的待剪辑视频数据，其中，所述待剪辑视频数据中包括视频数据对应的音频数据；基于所述待剪辑视频数据以及所述目标音频文本，生成所述待剪辑视频对应的目标视频。11.根据权利要求10所述的方法，其特征在于，所述基于所述待剪辑视频数据以及所述目标音频文本，生成所述待剪辑视频对应的目标视频，包括：响应于素材排序指令，展示素材排序区域；在所述素材排序区域中，根据素材排序指令中的排序操作对所述待剪辑视频数据以及所述目标音频文本进行排序处理，生成所述待剪辑视频对应的目标视频。12.根据权利要求11所述的方法，其特征在于，所述获取待剪辑视频，提取所述待剪辑视频中的音频数据和视频数据，包括：响应于针对视频处理页面的视频剪辑指令，加载视频剪辑页面；接收针对所述视频剪辑页面触发的素材获取指令，获取至少一个待剪辑视频；基于音频分离技术对每个待剪辑视频进行提取处理，获得所述每个待剪辑视频对应的音频数据和视频数据。13.一种视频剪辑装置，其特征在于，应用于客户端，包括：数据获取模块，被配置为获取待剪辑视频，提取所述待剪辑视频中的音频数据和视频数据；文本识别模块，被配置为对所述音频数据进行语音识别，获得所述音频数据对应的初始音频文本；文本处理模块，被配置为响应于针对所述初始音频文本的交互指令，对所述初始音频文本进行处理，获得目标音频文本；视频剪辑模块，被配置为基于所述目标音频文本对所述视频数据进行剪辑，生成所述待剪辑视频对应的目标视频。14.一种计算设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令，其特征在于，所述处理器执行所述计算机指令时实现权利要求1-12任意一项所述
方法的步骤。15.一种计算机可读存储介质，其存储有计算机指令，其特征在于，该计算机指令被处理器执行时实现权利要求1-12任意一项所述方法的步骤。

技术总结
本申请提供视频剪辑方法及装置，其中所述视频剪辑方法应用于客户端，包括：获取待剪辑视频，提取所述待剪辑视频中的音频数据和视频数据；对所述音频数据进行语音识别，获得所述音频数据对应的初始音频文本；响应于针对所述初始音频文本的交互指令，对所述初始音频文本进行处理，获得目标音频文本；基于所述目标音频文本对所述视频数据进行剪辑，生成所述待剪辑视频对应的目标视频；通过对音频文本的编辑等操作，来实现对视频的粗剪工作，不仅可以降低了对视频剪辑的操作难度，还大大地提高了视频剪辑的效率，提升用户体验。提升用户体验。提升用户体验。

技术研发人员：王少莆李怡欧陈启铭叶伊雯
受保护的技术使用者：上海幻电信息科技有限公司
技术研发日：2022.11.22
技术公布日：2023/3/31

完整全部详细技术资料下载

当前第2页1 2