技术特征:
技术总结
本申请提供了一种提升远场语音识别的前端处理方法和系统,其中所述方法包括:对房间冲激响应信号进行计算,得到早期混响信号与晚期混响信号的分割时间点,截取直达声信号和早期混响信号;将直达声信号和早期混响信号与语音库中干净语音信号在时域上进行卷积,得到时域目标信号;将时域目标信号和时域混合信号中除时域目标信号以外的其它信号分别进行计算,得到目标信号能量和其它信号能量,通过目标信号能量和其它信号能量得到理想比值掩蔽;将时域混合信号转换成频域混合信号后,将频域混合信号的幅值和理想比值掩蔽相乘,再使用频域混合信号的相位,得到重构信号。本发明通过理想幅值掩蔽从噪声混响条件下的混合语音中分离出目标信号。
技术研发人员:李军锋;高飞;颜永红
受保护的技术使用者:中国科学院声学研究所
技术研发日:2018.12.26
技术公布日:2019.03.26