一种语音分离质量评估方法、装置及计算机存储介质与流程

文档序号:22617863发布日期:2020-10-23 19:20阅读:来源:国知局

技术特征:

1.一种语音分离质量评估方法,其特征在于,所述方法包括:

获取混合语音训练数据;

对所述混合语音训练数据进行预处理,提取出所述混合语音训练数据的mfcc特征以训练生成语音分离模型;

获取混合语音测试数据,所述混合语音测试数据中包括多条语音数据,所述语音数据中包括至少两条纯净语音数据;

提取出所述语音数据的mfcc特征,将所述语音数据的mfcc特征输入语音分离模型,得到分离完成的单人语音数据;

基于混合之前的所述纯净语音数据,计算并整合所述单人语音数据的质量参数,得到经过所述语音分离模型分离后的语音质量评估结果。

2.如权利要求1所述的一种语音分离质量评估方法,其特征在于,计算并整合所述单人语音数据的质量参数的过程具体包括:

分别计算从每条所述语音数据中分离完成的单人语音数据的质量参数;

对所述单人语音数据的质量参数进行评估整合,得到每条所述语音数据的质量评分;

对多条所述语音数据的质量评分进行加和并取平均值,得到经所述语音分离模型分离后的语音质量评估结果。

3.如权利要求2所述的一种语音分离质量评估方法,其特征在于,所述单人语音数据的质量参数包括语音质量失真比sdr、语音质量干扰比sir、语音质量噪声比snr和语音质量伪造比sar。

4.如权利要求3所述的一种语音分离质量评估方法,其特征在于,对所述单人语音数据的质量参数进行评估整合的过程具体包括:

选取整合因子k1、k2、k3、k4,所述各个整合因子的总和等于1;

将所述整合因子k1、k2、k3、k4与所述语音质量失真比sdr、所述语音质量干扰比sir、所述语音质量噪声比snr、所述语音质量伪造比sar分别相乘并加和,得到每条所述语音数据的质量评分。

5.如权利要求1-4中任一项所述的一种语音分离质量评估方法,其特征在于,所述混合语音训练数据或混合语音测试数据可以是通过将目标说话人的纯净语音数据、其他无关说话人的纯净语音数据和噪声的语音数据进行混合得到。

6.一种语音分离质量评估装置,其特征在于,所述装置包括:

语音采集模块,用于采集需要进行分离的混合语音测试数据,所述混合语音测试数据中包括多条语音数据,所述语音数据中包括至少两条纯净语音数据;

特征提取模块,用于对所述混合语音测试数据进行预处理,提取出所述混合语音测试数据中语音数据的mfcc特征;

神经网络模块,所述神经网络模块中预设语音分离模型,所述神经网络模块用于对所述语音数据的mfcc特征进行处理,分离所述混合语音测试数据得到单人语音数据;

质量评估模块,用于计算并整合所述单人语音数据的语音质量参数,得到经过所述语音分离模型分离后的语音质量评估结果。

结果输出模块,用于输出经过所述语音分离模型分离后的语音质量评估结果。

7.如权利要求6所述的一种语音分离质量评估装置,其特征在于,所述质量评估模块还包括:

参数生成模块,用于基于所述纯净语音数据,计算单人语音数据的质量参数;

参数整合模块,用于对所述单人语音数据的质量参数进行评估整合,得到每条所述语音数据的质量评分;

评分生成模块,用于将多条所述语音数据的质量评分加和并取平均值,得到经所述语音分离模型分离后的质量评估结果。

8.如权利要求7所述的一种语音分离质量评估装置,其特征在于,所述语音质量参数包括语音质量失真比sdr、语音质量干扰比sir、语音质量噪声比snr和语音质量伪造比sar。

9.如权利要求8所述的一种语音分离质量评估装置,其特征在于,所述参数整合模块还包括:

整合因子模块,用于设置整合因子k1、k2、k3、k4,其中各个整合因子的总和等于1;

整合评分模块,用于将所述整合因子k1、k2、k3、k4与所述语音质量失真比sdr、所述语音质量干扰比sir、所述语音质量噪声比snr、所述语音质量伪造比sar分别相乘并加和,得到每条所述语音数据的质量评分。

10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-5中任一项所述的方法。


技术总结
本发明提出了一种语音分离质量评估方法、装置及计算机存储介质,所述方法包括:获取混合语音训练数据;对所述混合语音训练数据进行预处理,提取出所述混合语音训练数据的MFCC特征以训练生成语音分离模型;获取混合语音测试数据,所述混合语音测试数据中包括多条语音数据,所述语音数据中包括至少两条纯净语音数据;提取出所述语音数据的MFCC特征,将所述语音数据的MFCC特征输入语音分离模型,得到分离完成的单人语音数据;基于混合之前的所述纯净语音数据,计算并整合所述单人语音数据的质量参数,得到经过所述语音分离模型分离后的语音质量评估结果;通过算法整合计算分离后的语音质量评估结果,实现客观合理地进行分离结果质量评估。

技术研发人员:叶林勇;肖龙源;李稀敏;刘晓葳
受保护的技术使用者:厦门快商通科技股份有限公司
技术研发日:2020.06.17
技术公布日:2020.10.23
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1