技术特征:
技术总结
本发明公开了一种音频事件检测方法、装置及计算机可读存储介质,该方法包括:利用从分帧处理得到的各时刻的音频数据中分别提取指定特征向量输入训练得到的RNN/BI‑RNN模型中,以实现音频事件的检测。使用训练得到的RNN/BI‑RNN模型对音频事件进行检测,由于RNN模型在进行音频事件检测时除了使用当前时刻的信息,还将使用当前时刻之前时刻的信息,且BI‑RNN模型除了使用当前时刻的信息和当前时刻之前时刻的信息以外,还将使用当前时刻之后时刻的信息,因此,RNN/BI‑RNN模型的学习能力相对于GMM和SVM更强,使用具有更强学习能力的RNN/BI‑RNN模型对音频事件进行检测,具有更优的检测效果。
技术研发人员:刘海波
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2017.09.06
技术公布日:2018.09.07