音频处理方法及装置与流程

文档序号：23472302发布日期：2020-12-29 13:19阅读：277来源：国知局

技术特征：

1.一种音频处理方法，其特征在于，包括：

获取待检测音频文件；

对所述待检测音频文件进行分帧处理获得多个音频帧，并在所述多个音频帧中筛选出满足喷麦检测条件的目标音频帧；

根据所述目标音频帧和所述目标音频帧的下一音频帧生成频率幅度谱，以及根据所述目标音频帧的上一音频帧和上二音频帧生成参考频率幅度谱；

将所述频率幅度谱和所述参考频率幅度谱进行比对，根据比对结果确定所述待检测音频文件的喷麦音频帧。

2.根据权利要求1所述的音频处理方法，其特征在于，所述在所述多个音频帧中筛选出满足喷麦检测条件的目标音频帧，包括：

确定所述多个音频帧分别对应的音量幅度特征，并选择所述音量幅度特征满足预设音量幅度特征条件的音频帧确定为初始音频帧；

基于预设的降采样策略或幅度异常策略对所述初始音频帧进行筛选，获得中间音频帧；

构建所述中间音频帧对应的中间频率幅度谱；

基于所述中间频率幅度谱确定所述中间音频帧满足预设幅度谱分布条件的情况下，将所述中间音频帧作为所述目标音频帧。

3.根据权利要求2所述的音频处理方法，其特征在于，所述确定所述多个音频帧分别对应的音量幅度特征，包括：

获取所述多个音频帧分别对应的时域信号幅度；

根据所述时域信号幅度计算所述多个音频帧分别对应的平均时域信号幅度，作为所述多个音频帧分别对应的音量幅度特征，或者

根据所述时域信号幅度确定所述多个音频帧分别对应的峰值时域信号幅度，作为所述多个音频帧分别对应的音量幅度特征。

4.根据权利要求2所述的音频处理方法，其特征在于，所述基于预设的降采样策略对所述初始音频帧进行筛选，获得中间音频帧，包括：

确定所述初始音频帧对应的第一幅度峰值，并根据所述第一幅度峰值对所述初始音频帧进行降采样处理，获得所述初始音频帧对应的第二幅度峰值；

在所述第二幅度峰值大于第一预设峰值阈值的情况下，基于所述第一幅度峰值和所述第二幅度峰值计算所述初始音频帧对应的目标幅度峰值；

在所述目标幅度峰值大于第二预设峰值阈值的情况下，将所述初始音频帧确定为所述中间音频帧。

5.根据权利要求2所述的音频处理方法，其特征在于，所述基于预设的幅度异常策略对所述初始音频帧进行筛选，获得中间音频帧，包括：

确定所述初始音频帧对应的第一幅度值；

在所述第一幅度值大于第一预设幅度值阈值的情况下，确定所述初始音频帧相邻的相邻音频帧；

确定所述相邻音频帧对应的第二幅度值，并基于所述第一幅度值和所述第二幅度值计算所述初始音频帧对应的目标幅度值；

在所述目标幅度值大于第二预设幅度值阈值的情况下，将所述初始音频帧确定为所述中间音频帧。

6.根据权利要求2所述的音频处理方法，其特征在于，所述构建所述中间音频帧对应的中间频率幅度谱，包括：

确定所述中间音频帧的前一中间音频帧，并对所述中间音频帧和所述前一中间音频帧进行变换；

根据变换结果构建所述中间音频帧对应的所述中间频率幅度谱。

7.根据权利要求6所述的音频处理方法，其特征在于，所述基于所述中间频率幅度谱确定所述中间音频帧满足预设幅度谱分布条件的情况下，将所述中间音频帧作为所述目标音频帧，包括：

在所述中间频率幅度谱的峰值位于低频区域，且所述中间频率幅度谱的峰值大于预设峰值阈值的情况下，将所述中间音频帧作为所述目标音频帧。

8.根据权利要求1所述的音频处理方法，其特征在于，所述根据所述目标音频帧和所述目标音频帧的下一音频帧生成频率幅度谱，包括：

在所述多个音频帧中确定所述目标音频帧的下一音频帧，并对所述目标音频帧和所述目标音频帧的下一音频帧进行变换；

根据变换结果构建所述频率幅度谱。

9.根据权利要求1或8所述的音频处理方法，其特征在于，所述根据所述目标音频帧的上一音频帧和上二音频帧生成参考频率幅度谱，包括：

在所述多个音频帧中确定所述目标音频帧的上一音频帧和上二音频帧；

对所述目标音频帧的上一音频帧和上二音频帧进行变换，根据变化结果构建所述参考频率幅度谱。

10.根据权利要求1所述的音频处理方法，其特征在于，所述将所述频率幅度谱和所述参考频率幅度谱进行比对，根据比对结果确定所述待检测音频文件的喷麦音频帧，包括：

确定所述频率幅度谱的第一低频区间取值，以及所述参考频率幅度谱的第二低频区间取值；

在所述第一低频区间取值大于所述第二低频区间取值的情况下，计算所述第一低频区间取值与所述第二低频区间取值之间差值的平均值；

在所述平均值大于预设低频阈值的情况下，将所述目标音频帧确定为所述待检测音频文件的所述喷麦音频帧。

11.根据权利要求1所述的音频处理方法，其特征在于，所述根据比对结果确定所述待检测音频文件的喷麦音频帧步骤执行之后，还包括：

根据所述喷麦音频帧对所述待检测音频文件进行处理，获得目标音频文件；

将所述目标音频文件进行播放。

12.一种音频处理装置，其特征在于，包括：

获取模块，被配置为获取待检测音频文件；

分帧模块，被配置为对所述待检测音频文件进行分帧处理获得多个音频帧，并在所述多个音频帧中筛选出满足喷麦检测条件的目标音频帧；

生成模块，被配置为根据所述目标音频帧和所述目标音频帧的下一音频帧生成频率幅度谱，以及根据所述目标音频帧的上一音频帧和上二音频帧生成参考频率幅度谱；

确定模块，被配置为将所述频率幅度谱和所述参考频率幅度谱进行比对，根据比对结果确定所述待检测音频文件的喷麦音频帧。

13.一种计算设备，其特征在于，包括：

存储器和处理器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，以实现下述方法：

获取待检测音频文件；

对所述待检测音频文件进行分帧处理获得多个音频帧，并在所述多个音频帧中筛选出满足喷麦检测条件的目标音频帧；

根据所述目标音频帧和所述目标音频帧的下一音频帧生成频率幅度谱，以及根据所述目标音频帧的上一音频帧和上二音频帧生成参考频率幅度谱；

将所述频率幅度谱和所述参考频率幅度谱进行比对，根据比对结果确定所述待检测音频文件的喷麦音频帧。

14.一种计算机可读存储介质，其特征在于，存储有计算机指令，该指令被处理器执行时实现权利要求1至11任意一项所述音频处理方法的步骤。

技术总结
本说明书提供音频处理方法及装置，其中所述音频处理方法包括：获取待检测音频文件；对所述待检测音频文件进行分帧处理获得多个音频帧，并在所述多个音频帧中筛选出满足喷麦检测条件的目标音频帧；根据所述目标音频帧和所述目标音频帧的下一音频帧生成频率幅度谱，以及根据所述目标音频帧的上一音频帧和上二音频帧生成参考频率幅度谱；将所述频率幅度谱和所述参考频率幅度谱进行比对，根据比对结果确定所述待检测音频文件的喷麦音频帧。

技术研发人员：陈佳路;王晓红;刘鲁鹏;元海明;高强;夏龙;郭常圳
受保护的技术使用者：北京猿力未来科技有限公司
技术研发日：2020.09.25
技术公布日：2020.12.29

完整全部详细技术资料下载

当前第2页1 2

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！