音频处理方法、装置、终端及存储介质与流程

文档序号：20268280发布日期：2020-04-03 18:40阅读：来源：国知局

技术特征：

1.一种音频处理方法，其特征在于，所述方法包括：

当接收到音频处理指令时，获取待处理的第一音频；

从所述第一音频中提取所述第一音频的第一音色特征，所述第一音色特征至少包括所述第一音频的梅尔频谱；

基于所述第一音频的第一音色特征，从多个备选音频中确定与所述第一音频之间相似度满足筛选条件的目标音频；

基于所述目标音频的目标音色特征，将所述第一音频转换为第二音频，所述第二音频融合所述目标音频的目标音色特征和所述第一音色特征。

2.根据权利要求1所述的方法，其特征在于，所述基于所述目标音频的目标音色特征，将所述第一音频转换为第二音频包括：

获取声音美化度，所述声音美化度用于指示所述第二音频与所述目标音频的相似程度；

将所述声音美化度、所述第一音色特征、所述目标音色特征和所述第一音频输入目标模型，输出所述第二音频，所述目标模型用于将原音频转换为融合有目标音频的目标音色特征的另一音频。

3.根据权利要求2所述的方法，其特征在于，所述获取声音美化度包括以下任一项：

在第一音频采集过程中，获取用户输入的声音美化度，将所述声音美化度作为所述声音美化度；

获取所述用户的历史美化度，将所述历史美化度作为所述声音美化度；

获取系统默认美化度，将所述系统默认美化度作为所述声音美化度。

4.根据权利要求1所述的方法，其特征在于，所述基于所述第一音频的第一音色特征，从多个备选音频中确定与所述第一音频之间相似度满足筛选条件的目标音频包括：

根据所述第一音频的第一音色特征和所述多个备选音频的备选音色特征，从多个备选音频中筛选出与所述第一音频之间的相似度超过目标阈值的多个第三音频；

在目标应用的应用界面上显示所述多个第三音频的音频标识；

基于所述多个第三音频的音频标识中被选中的目标音频标识，确定出所述多个第三音频中的目标音频。

5.根据权利要求1所述的方法，其特征在于，所述第一音色特征还包括所述第一音频的基频、共振峰、谐波、梅尔倒谱系数、能量、过零率中的至少一项。

6.一种音频处理装置，其特征在于，所述装置包括：

获取模块，用于当接收到音频处理指令时，获取待处理的第一音频；

提取模块，用于从所述第一音频中提取所述第一音频的第一音色特征，所述第一音色特征至少包括所述第一音频的梅尔频谱；

确定模块，用于基于所述第一音频的第一音色特征，从多个备选音频中确定与所述第一音频之间相似度满足筛选条件的目标音频；

转化模块，用于基于所述目标音频的目标音色特征，将所述第一音频转换为第二音频，所述第二音频融合所述目标音频的目标音色特征和所述第一音色特征。

7.根据权利要求6所述的装置，其特征在于，

所述转化模块，还用于获取声音美化度，所述声音美化度用于指示所述第二音频与所述目标音频的相似程度；将所述声音美化度、所述第一音色特征、所述目标音色特征和所述第一音频输入目标模型，输出所述第二音频，所述目标模型用于将原音频转换为融合有目标音频的目标音色特征的另一音频。

8.根据权利要求7所述的装置，其特征在于，所述转化模块，还用于以下任一项：

在第一音频采集过程中，获取用户输入的声音美化度，将所述声音美化度作为所述声音美化度；

获取所述用户的历史美化度，将所述历史美化度作为所述声音美化度；

获取系统默认美化度，将所述系统默认美化度作为所述声音美化度。

9.根据权利要求6所述的装置，其特征在于，

所述确定模块，还用于根据所述第一音频的第一音色特征和所述多个备选音频的备选音色特征，从多个备选音频中筛选出与所述第一音频之间的相似度超过目标阈值的多个第三音频；在目标应用的应用界面上显示所述多个第三音频的音频标识；基于所述多个第三音频的音频标识中被选中的目标音频标识，确定出所述多个第三音频中的目标音频。

10.根据权利要求6所述的装置，其特征在于，所述第一音色特征还包括所述第一音频的基频、共振峰、谐波、梅尔倒谱系数、能量、过零率中的至少一项。

11.一种终端，其特征在于，所述终端包括处理器和存储器，所述存储器中存储有至少一条指令，所述指令由所述处理器加载并执行以实现如权利要求1至权利要求5任一项所述的音频处理方法所执行的操作。

12.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令，所述指令由处理器加载并执行以实现如权利要求1至权利要求5任一项所述的音频处理方法所执行的操作。

完整全部详细技术资料下载

当前第2页1 2 3