用于移动终端的字幕生成方法、装置、设备以及存储介质与流程

文档序号：24648056发布日期：2021-04-13 16:08阅读：来源：国知局

技术特征：
1.一种用于移动终端的字幕生成方法，包括：获取基于音频数据采集设备采集的输入语音；采用语音识别模型，将所述输入语音转换为输入文字；获取配置于输入视频的时间轴；将所述输入文字添加至用户选择的所述输入视频的时间轴片段。2.根据权利要求1所述的方法，其中，所述输入语音包括用户基于预设的操作方式对所述输入语音的至少一个时间节点所做的断点标识，以及所述采用语音识别模型，将所述输入语音转换为输入文字还包括：基于所述断点标识，对所述输入语音进行截取以获取多条输入文字。3.根据权利要求1所述的方法，还包括：基于用户选择的预设的美术效果，对所述输入文字进行装饰。4.根据权利要求1所述的方法，还包括：将所述输入文字与所述输入视频进行合并处理，生成附带文字的视频数据。5.根据权利要求1
‑
4任一项所述的方法，其中，所述音频数据采集设备为移动终端麦克风设备。6.一种用于移动终端的字幕生成装置，包括：第一获取模块，被配置为获取基于音频数据采集设备采集的输入语音；转换模块，被配置为采用语音识别模型，将所述输入语音转换为输入文字；第二获取模块，被配置为获取配置于输入视频的时间轴；添加模块，被配置为将所述输入文字添加至用户选择的所述输入视频的时间轴片段。7.根据权利要求6所述的装置，其中，所述输入语音包括用户基于预设的操作方式对所述输入语音的至少一个时间节点所做的断点标识，以及所述转换模块进一步被配置成：基于所述断点标识，对所述输入语音进行截取以获取多条输入文字。8.根据权利要求6所述的装置，其中，所述装置还包括：装饰模块，被配置为基于用户选择的预设的美术效果，对所述输入文字进行装饰。9.根据权利要求6所述的装置，其中，所述装置还包括：合并模块，被配置为将所述输入文字与所述输入视频进行合并处理，生成附带文字的视频数据。10.根据权利要求6
‑
9任一项所述的装置，其中，音频数据采集设备为移动终端麦克风设备。11.一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1
‑
5中任一项所述的方法。12.一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行权利要求1
‑
5中任一项所述的方法。13.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1
‑
5中任一项所述的方法。

完整全部详细技术资料下载

当前第2页1 2 3