技术特征:
技术总结
本发明实施例公开一种音频数据处理方法、装置及存储介质,其中,方法包括:获取环境空间中的多路音频数据,并基于多路音频数据得到语音数据集合,并在多个增强方向上分别生成语音数据集合对应的增强语音信息;将增强语音信息中的语音隐藏特征与目标匹配词进行匹配,并将与目标匹配词具有最高匹配度的增强语音信息对应的增强方向,确定为目标音频方向;获取增强语音信息中的语音频谱特征,并在语音频谱特征中获取目标音频方向上的语音频谱特征;基于目标匹配词对目标音频方向上的语音隐藏特征和语音频谱特征进行语音验证,得到目标验证结果。采用本发明,可以在提高语音控制的准确度的同时,有效地降低误识别率。
技术研发人员:高毅
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2018.11.23
技术公布日:2019.04.09