一种视频合成的方法、装置、电子设备及可读存储介质与流程

文档序号：25878877发布日期：2021-07-16 18:16阅读：来源：国知局

技术特征：
1.一种视频合成的方法，其特征在于，包括：响应于用户针对目标资源的选择操作，确定与所述目标资源相对应的目标图片集合以及参考文本；获取采集的音频文件；若确定所述音频文件的语音识别文本与所述参考文本相匹配，则根据所述音频文件的音频有效时长、所述目标图片集合以及所述参考文本，生成背景视频；将所述音频文件和所述背景视频进行合成，获得合成后的目标视频。2.如权利要求1所述的方法，其特征在于，所述确定与所述目标资源相对应的目标图片集合，包括：确定与所述目标资源相对应的风格标签集合，所述风格标签集合中包含至少一个图片集合对应的风格标签；响应于所述用户的标签选择，从所述风格标签集合中选择出与所述用户的喜好相对应的目标风格标签；将所述目标风格标签对应的图片集合作为所述目标图片集合。3.如权利要求1所述的方法，其特征在于，所述确定所述音频文件的语音识别文本与所述参考文本相匹配，包括：对所述音频文件进行语音识别，获得语音识别文本；将所述语音识别文本与所述参考文本进行匹配；若确定所述语音识别文本和所述参考文本之间的匹配度高于设定阈值，则确定所述音频文件的语音识别文本与所述参考文本相匹配。4.如权利要求1
‑
3任一项所述的方法，其特征在于，所述根据所述音频文件的音频有效时长、所述目标图片集合以及所述参考文本，生成背景视频，包括：将所述参考文本划分为至少一个文本集合；根据一一对应关系，将所述至少一个文本集合与所述目标图片集合中的至少一张目标图片分别合成，获得至少一个合成图片；按照所述至少一个文本集合的先后顺序，将所述至少一个合成图片进行排列，获得合成图片集合；根据所述音频有效时长，设置所述合成图片集合的播放时长；根据所述合成图片集合，以及相应的播放时长，生成背景视频。5.如权利要求4所述的方法，其特征在于，所述根据一一对应关系，将所述至少一个文本集合与所述目标图片集合中的至少一张目标图片分别合成，获得至少一个合成图片，包括：分别针对所述至少一个文本集合中的每一文本集合，执行以下步骤：从所述目标图片集合中，确定一个文本集合匹配的目标图片；采用字幕的形式，将所述一个文本集合与匹配的目标图片合成，获得合成图片，使得所述一个文本集合为所述合成图片的字幕。6.如权利要求4所述的方法，其特征在于，根据所述合成图片集合，以及相应的播放时长，生成背景视频，包括：根据语音识别文本、文本集合以及合成图片三者之间的对应关系，以及所述音频文件，
分别确定每一合成图片的显示时长；根据所述合成图片集合、所述播放时长以及各合成图片的显示时长，生成背景视频。7.如权利要求1
‑
3任一项所述的方法，其特征在于，在获得合成后的目标视频之后，所述方法还包括：根据所述用户的修改指令，对所述目标视频进行修改；其中，所述修改包括以下至少一种：修改字幕的位置；修改字幕的字体大小；修改字幕的字体颜色；修改目标风格标签。8.一种视频合成的装置，其特征在于，包括：确定单元，用于响应于用户针对目标资源的选择操作，确定与所述目标资源相对应的目标图片集合以及参考文本；获取单元，用于获取采集的音频文件；生成单元，用于若确定所述音频文件的语音识别文本与所述参考文本相匹配，则根据所述音频文件的音频有效时长、所述目标图片集合以及所述参考文本，生成背景视频；合成单元，用于将所述音频文件和所述背景视频进行合成，获得合成后的目标视频。9.一种电子设备，其特征在于，包括处理器以及存储器，所述存储器存储有计算机可读取指令，当所述计算机可读取指令由所述处理器执行时，运行如权利要求1
‑
7任一所述方法。10.一种可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时运行如权利要求1
‑
7任一所述方法。

完整全部详细技术资料下载

当前第2页1 2 3