音频检测方法及装置与流程

文档序号:23755210发布日期:2021-01-29 16:07阅读:112来源:国知局
技术特征:
1.一种音频检测方法,其特征在于,包括:获取待检测音频文件;将所述待检测音频文件输入至喷麦检测模型进行处理,获得所述待检测音频文件中的喷麦音频区间和所述喷麦音频区间的喷麦概率;根据所述喷麦音频区间和所述喷麦概率确定所述待检测音频文件中的喷麦音频片段。2.根据权利要求1所述的音频检测方法,其特征在于,所述喷麦检测模型通过如下方式训练:获取样本音频文件,并对所述样本音频文件进行格式化处理,获得标准音频文件;将所述标准音频文件切分为多个音频区间,按照所述多个音频区间的属性信息对所述多个音频区间添加喷麦标签或正常语音标签;基于所述多个音频区间和添加标签的多个音频区间组成样本音频区间对,利用所述样本音频区间对初始喷麦检测模型进行训练,获得所述喷麦检测模型。3.根据权利要求1所述的音频检测方法,其特征在于,所述将所述待检测音频文件输入至喷麦检测模型进行处理,获得所述待检测音频文件中的喷麦音频区间和所述喷麦音频区间的喷麦概率,包括:基于预设帧长的处理窗以及预设时间的帧移对所述待检测音频文件进行变换,获得所述待检测音频文件对应的幅度谱;按照所述幅度谱在所述待检测音频文件中提取低频特征输入至所述喷麦检测模型进行处理,获得所述喷麦音频区间和所述喷麦概率。4.根据权利要求1所述的音频检测方法,其特征在于,所述根据所述喷麦音频区间和所述喷麦概率确定所述待检测音频文件中的喷麦音频片段,包括:确定所述喷麦音频区间中的多个喷麦音频子区间,以及根据所述喷麦概率确定所述多个喷麦音频子区间中的喷麦音频子区间对应的子喷麦概率;将所述多个喷麦音频子区间中的喷麦音频子区间对应的子喷麦概率与预设概率阈值进行比较;根据比较结果选择大于等于所述预设概率阈值的喷麦音频子区间组成所述待检测音频文件中的喷麦音频片段。5.根据权利要求1所述的音频检测方法,其特征在于,所述根据所述喷麦音频区间和所述喷麦概率确定所述待检测音频文件中的喷麦音频片段,包括:确定所述喷麦音频区间中的多个喷麦音频子区间,以及根据所述喷麦概率确定所述多个喷麦音频子区间中的喷麦音频子区间对应的子喷麦概率;将所述多个喷麦音频子区间中的喷麦音频子区间对应的子喷麦概率与预设概率阈值进行比较,根据比较结果确定多个目标喷麦音频子区间;在所述待检测音频文件中提取所述多个目标喷麦音频子区间组成持续喷麦音频子区间;基于所述持续喷麦音频子区间确定所述待检测音频文件中的喷麦音频片段。6.根据权利要求5所述的音频检测方法,其特征在于,所述在所述待检测音频文件中提取所述多个目标喷麦音频子区间组成持续喷麦音频子区间,包括:确定所述多个目标喷麦音频子区间在所述待检测音频文件中的音频位置,以及确定所
述多个目标喷麦音频子区间对应的音频时长;根据所述音频位置和所述音频时长,判断所述多个目标喷麦音频子区间在时间维度上是否连续;若是,则将所述多个目标喷麦音频子区间进行整合,获得所述持续喷麦音频子区间。7.根据权利要求6所述的音频检测方法,其特征在于,所述基于所述持续喷麦音频子区间确定所述待检测音频文件中的喷麦音频片段,包括:对所述持续喷麦音频子区间进行分帧处理获得多个目标音频帧;将所述多个目标音频帧分别进行喷麦检测,并将检测结果与喷麦检测阈值进行比较,根据比较结果组成喷麦音频序列;在所述喷麦音频序列的持续时长大于时长阈值的情况下,根据组成所述喷麦音频序列的音频帧确定所述待检测音频文件中的喷麦音频片段。8.根据权利要求7所述的音频检测方法,其特征在于,所述在所述喷麦音频序列的持续时长大于时长阈值的情况下,根据组成所述喷麦音频序列的音频帧确定所述待检测音频文件中的喷麦音频片段,包括:确定所述喷麦音频序列的持续时长;根据预设条件确定所述时长阈值;判断所述喷麦音频序列的持续时长是否大于等于所述时长阈值;若是,执行所述根据组成所述喷麦音频序列的音频帧确定所述待检测音频文件中的喷麦音频片段的步骤。9.根据权利要求8所述的音频检测方法,其特征在于,所述根据组成所述喷麦音频序列的音频帧确定所述待检测音频文件中的喷麦音频片段,包括:对所述喷麦音频序列进行分帧处理,获得按照时间顺序排序的多个音频帧;选择按照时间顺序排序的多个音频帧中首次输出概率大于第一阈值的音频帧确定为初始喷麦音频帧,以及按照时间顺序排序的多个音频帧中所述初始喷麦音频帧后首次输出概率小于第二阈值的音频帧确定为末端喷麦音频帧;确定所述初始喷麦音频帧和所述末端喷麦音频帧之间的中间喷麦音频帧,并基于所述初始喷麦音频帧、所述末端喷麦音频帧和所述中间喷麦音频帧组成所述喷麦音频片段。10.根据权利要求1所述的音频检测方法,其特征在于,所述根据所述喷麦音频区间和所述喷麦概率确定所述待检测音频文件中的喷麦音频片段步骤执行之后,还包括:根据所述喷麦音频片段对所述待检测音频文件进行标准化处理,获得目标音频文件,并将所述目标音频文件进行播放;其中,所述标准化处理包括删除所述喷麦音频片段或降低所述喷麦音频片段的能量。11.根据权利要求1所述的音频检测方法,其特征在于,所述待检测音频文件包括下述至少一项:客户端上传的音频文件、待播放的音频文件、待处理的音频文件。12.一种音频检测装置,其特征在于,包括:获取模块,被配置为获取待检测音频文件;处理模块,被配置为将所述待检测音频文件输入至喷麦检测模型进行处理,获得所述待检测音频文件中的喷麦音频区间和所述喷麦音频区间的喷麦概率;
确定模块,被配置为根据所述喷麦音频区间和所述喷麦概率确定所述待检测音频文件中的喷麦音频片段。13.一种计算设备,其特征在于,包括:存储器和处理器;所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现下述方法:获取待检测音频文件;将所述待检测音频文件输入至喷麦检测模型进行处理,获得所述待检测音频文件中的喷麦音频区间和所述喷麦音频区间的喷麦概率;根据所述喷麦音频区间和所述喷麦概率确定所述待检测音频文件中的喷麦音频片段。14.一种计算机可读存储介质,其特征在于,存储有计算机指令,该指令被处理器执行时实现权利要求1至11任意一项所述音频检测方法的步骤。
当前第2页1 2 3 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!