一种提升远场语音识别的前端处理方法和系统与流程

文档序号：17226492发布日期：2019-03-27 12:43阅读：211来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术>一种提升远场语音识别的前端处理方法和系统与流程

技术特征：

技术总结
本申请提供了一种提升远场语音识别的前端处理方法和系统，其中所述方法包括：对房间冲激响应信号进行计算，得到早期混响信号与晚期混响信号的分割时间点，截取直达声信号和早期混响信号；将直达声信号和早期混响信号与语音库中干净语音信号在时域上进行卷积，得到时域目标信号；将时域目标信号和时域混合信号中除时域目标信号以外的其它信号分别进行计算，得到目标信号能量和其它信号能量，通过目标信号能量和其它信号能量得到理想比值掩蔽；将时域混合信号转换成频域混合信号后，将频域混合信号的幅值和理想比值掩蔽相乘，再使用频域混合信号的相位，得到重构信号。本发明通过理想幅值掩蔽从噪声混响条件下的混合语音中分离出目标信号。

技术研发人员：李军锋;高飞;颜永红
受保护的技术使用者：中国科学院声学研究所
技术研发日：2018.12.26
技术公布日：2019.03.26

完整全部详细技术资料下载

当前第2页1 2

上一篇：一种智能换向阀的制作方法
下一篇：一种编织袋折边机用压边装置的制作方法

相关技术

一种语音识别方法、装置、电子设备及存储介质与流程

语音识别方法与流程

语音识别方法、装置、电子设备、存储介质及程序产品与流程

针对传统语音识别依赖大量标注数据成本高、模型体积大效率低的问题，提出半监督训练方法，利用未标注数据与标注数据联合训练，结合模型剪枝技术缩小模型体积，同时提升识别精度与效率。通过量化损失函数优化...

一种语音识别方法、装置、设备、介质及产品与流程

语音识别方法、装置以及计算机可读存储介质与流程

语音识别方法、装置、设备和存储介质与流程

针对单一语音识别引擎在特定领域识别准确率低的问题，提出通过多引擎协同识别并选择最优结果的解决方案。方法包括将语音数据发送至多个引擎获取结果，根据置信度分值选择目标结果，并通过纠错改写模块优化识...

语音识别方法及装置与流程

针对语音识别过程中因网络波动导致的引擎选择延迟问题，提出一种动态适配方案。通过实时监测网络状态，在用户输入音频前预判并锁定在线/离线引擎，实现识别过程与引擎切换的无缝衔接，显著提升识别实时性。...

用于浏览器的语音识别处理方法和浏览器的制造方法

用于选择性语音识别的方法和装置的制作方法

提出一种基于媒体类型动态选择语音识别引擎的方法，解决了传统系统中语音识别引擎持续运行导致的高功耗问题。通过分析媒体文件的类型特征，智能启用与当前媒体内容匹配的语音识别引擎（如嵌入式或外部引擎）...

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！

相关技术