音频数据处理方法、装置、计算机设备和存储介质与流程

文档序号:35923725发布日期:2023-11-04 11:43阅读:39来源:国知局
音频数据处理方法、装置、计算机设备和存储介质与流程

本申请涉及计算机,特别是涉及一种音频数据处理方法、装置、计算机设备、存储介质和计算机程序产品。


背景技术:

1、随着计算机技术和音频技术的发展,出现了音频编辑技术,通过对音频进行编辑,可以实现剪贴、复制、粘贴、多文件合并和混音等常规音频处理,并实现对音频波形进行“反转”、“静音”、“放大”、“扩音”、“减弱”、“淡入”、“淡出”、“规则化”等常规处理、“混响”、“颤音”、“延迟”等特效、以及与“槽带滤波器”、“带通滤波器”、“高通滤波器”、“低通滤波器”、“高频滤波器”、“低通滤波器”、“fft滤波器”等滤波处理。

2、然而目前的音频数据编辑时,无法在对音频内容灵活编辑的前提下,达到良好的音频编辑效果。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够有效达到良好音频编辑效果的音频数据处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本申请提供了一种音频数据处理方法。所述方法包括:

3、对原始音频数据进行语音识别处理,得到原始音频文本和文本时长信息,所述文本时长信息为所述原始音频文本中各单词的时间节点信息;

4、对所述原始音频文本进行文本修改处理,得到修改目标文本;

5、对比所述原始音频文本和所述修改目标文本,得到文本修改信息;

6、基于所述文本修改信息生成音频编辑任务;

7、通过所述音频编辑任务以及所述文本时长信息对所述原始音频数据进行音频内容编辑处理,得到目标音频数据。

8、第二方面,本申请还提供了一种音频数据处理装置。所述装置包括:

9、语音识别模块,用于对原始音频数据进行语音识别处理,得到原始音频文本和文本时长信息,所述文本时长信息为所述原始音频文本中各单词的时间节点信息;

10、文本修改模块,用于对所述原始音频文本进行文本修改处理,得到修改目标文本;

11、文本对比模块,用于对比所述原始音频文本和所述修改目标文本,得到文本修改信息;

12、任务生成模块,用于基于所述文本修改信息生成音频编辑任务;

13、音频编辑模块,用于通过所述音频编辑任务以及所述文本时长信息对所述原始音频数据进行音频内容编辑处理,得到目标音频数据。

14、第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

15、对原始音频数据进行语音识别处理,得到原始音频文本和文本时长信息,所述文本时长信息为所述原始音频文本中各单词的时间节点信息;

16、对所述原始音频文本进行文本修改处理,得到修改目标文本;

17、对比所述原始音频文本和所述修改目标文本,得到文本修改信息;

18、基于所述文本修改信息生成音频编辑任务;

19、通过所述音频编辑任务以及所述文本时长信息对所述原始音频数据进行音频内容编辑处理,得到目标音频数据。

20、第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

21、对原始音频数据进行语音识别处理,得到原始音频文本和文本时长信息,所述文本时长信息为所述原始音频文本中各单词的时间节点信息;

22、对所述原始音频文本进行文本修改处理,得到修改目标文本;

23、对比所述原始音频文本和所述修改目标文本,得到文本修改信息;

24、基于所述文本修改信息生成音频编辑任务;

25、通过所述音频编辑任务以及所述文本时长信息对所述原始音频数据进行音频内容编辑处理,得到目标音频数据。

26、第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:

27、对原始音频数据进行语音识别处理,得到原始音频文本和文本时长信息,所述文本时长信息为所述原始音频文本中各单词的时间节点信息;

28、对所述原始音频文本进行文本修改处理,得到修改目标文本;

29、对比所述原始音频文本和所述修改目标文本,得到文本修改信息;

30、基于所述文本修改信息生成音频编辑任务;

31、通过所述音频编辑任务以及所述文本时长信息对所述原始音频数据进行音频内容编辑处理,得到目标音频数据。

32、上述音频数据处理方法、装置、计算机设备、存储介质和计算机程序产品,通过先对原始音频数据进行语音识别处理,从音频数据中提取出原始音频文本和文本时长信息,而后直接对原始音频文本进行文本修改处理,得到修改目标文本,先对从音频数据中识别出的文本进行文本修改处理,调整音频文本表述,得到调整后的修改目标,而后通过对比原始音频文本和修改目标文本,确定文本中修改部分的文本修改信息,再基于文本修改信息,生成用于对文本对应音频部分进行音频编辑处理的音频编辑任务;最后通过音频编辑任务以及文本时长信息,来对原始音频数据进行音频内容编辑处理,基于得到基于修改目标文本编辑得到的目标音频数据。本申请通过对原始音频文本进行文本修改的编辑处理,而后基于文本修改处理过程中的文本修改信息来对相应部分的音频数据进行编辑,可以有效实现对音频数据的灵活编辑,达到良好的音频编辑效果。



技术特征:

1.一种音频数据处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对原始音频数据进行语音识别处理,得到原始音频文本和文本时长信息包括:

3.根据权利要求1所述的方法,其特征在于,所述文本修改处理包括文本顺滑化处理,所述对所述原始音频文本进行文本修改处理,得到修改目标文本包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述原始音频文本进行文本正则过滤处理,得到正则文本序列包括:

5.根据权利要求3所述的方法,其特征在于,所述通过文本顺滑化模型对所述正则文本序列进行文本顺滑化处理,得到修改目标文本包括:

6.根据权利要求1所述的方法,其特征在于,所述对所述原始音频文本进行文本修改处理,得到修改目标文本包括:

7.根据权利要求1至6任意一项所述的方法,其特征在于,所述通过所述音频编辑任务以及所述文本时长信息对所述原始音频数据进行音频内容编辑处理,得到目标音频数据包括:

8.根据权利要求7所述的方法,其特征在于,所述基于所述音频编辑任务包含的任务类型与所述以及所述文本时长信息对所述原始音频数据进行音频内容编辑处理,得到目标音频数据包括:

9.根据权利要求7所述的方法,其特征在于,所述基于所述音频编辑任务包含的任务类型与所述以及所述文本时长信息对所述原始音频数据进行音频内容编辑处理,得到目标音频数据包括:

10.根据权利要求9所述的方法,其特征在于,所述基于所述原始音频数据和所述新增文本进行音频合成处理,得到所述修改文本的新增音频数据包括:

11.根据权利要求7所述的方法,其特征在于,所述基于所述音频编辑任务包含的任务类型与所述以及所述文本时长信息对所述原始音频数据进行音频内容编辑处理,得到目标音频数据包括:

12.一种音频数据处理装置,其特征在于,所述装置包括:

13.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述的方法的步骤。

14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。

15.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。


技术总结
本申请涉及一种音频数据处理方法、装置、计算机设备、存储介质和计算机程序产品,涉及语音识别技术。方法包括:对原始音频数据进行语音识别处理,得到原始音频文本和文本时长信息,文本时长信息为原始音频文本中各单词的时间节点信息;对原始音频文本进行文本修改处理,得到修改目标文本;对比原始音频文本和修改目标文本,得到文本修改信息;基于文本修改信息生成音频编辑任务;通过音频编辑任务以及文本时长信息,对原始音频数据进行音频内容编辑处理,得到目标音频数据。本申请可以有效实现对音频数据的灵活编辑,达到良好的音频编辑效果。

技术研发人员:方鹏,刘恺
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1