声音识别方法及装置与流程

文档序号:11834516阅读:来源:国知局

技术特征:

1.一种声音识别方法,其特征在于,包括:

获取待识别的声音以及预存的声音模板;

根据预存的声音模板从所述待识别的声音中识别出目标声音。

2.根据权利要求1所述的方法,其特征在于,所述根据预存的声音模板从所述待识别的声音中确定出目标声音,包括:

将所述待识别的声音转化为模拟信号,对所述模拟信号进行采样处理,转化为数字信号;

对所述数字信号进行加窗处理,将每一个窗口的窗口信号转化为对应的频谱;

当任意一个窗口的频谱中包含与所述声音模板匹配的脉冲时,确定从所述待识别的声音中识别出目标声音。

3.根据权利要求2所述的方法,其特征在于,所述当任意一个窗口的频谱中包含与所述声音模板匹配的脉冲时,确定从所述待识别的声音中识别出目标声音,包括:

获取声音模板中声音的频率;

根据所述频率确定所述声音在所述窗口中对应的坐标;

确定所述坐标对应的坐标幅值是否大于第一预设阈值,并且所述坐标周围预设范围内的坐标对应的坐标幅值是否小于第二预设阈值;

当所述坐标对应的坐标幅值大于第一预设阈值,并且所述坐标周围预设范围内的坐标对应的坐标幅值小于第二预设阈值时,确定从所述待识别的声音中识别出目标声音。

4.根据权利要求3所述的方法,其特征在于,当所述声音模板中包含至少两个声音时,所述确定所述坐标对应的坐标幅值是否大于第一预设阈值,并且所述坐标周围预设范围内的坐标对应的坐标幅值是否小于第二预设阈值,包括:

确定所述声音模板中每一个声音对应的坐标的坐标幅值是否大于第一预设阈值,并且所述坐标周围预设范围内的坐标对应的坐标幅值是否小于第二预设阈值;

所述当所述坐标对应的坐标幅值大于第一预设阈值,并且所述坐标周围预设范围内的坐标对应的坐标幅值小于第二预设阈值时,确定从所述待识别的声音中识别出目标声音,包括:

当所述每一个声音对应的坐标的坐标幅值大于第一预设阈值,并且所述坐标周围预设范围内的坐标对应的坐标幅值小于第二预设阈值时,确定从所述待识别的声音中识别出目标声音。

5.一种声音识别装置,其特征在于,包括:

获取模块,用于获取待识别的声音以及预存的声音模板;

识别模块,用于根据预存的声音模板从所述待识别的声音中识别出目标声音。

6.根据权利要求5所述的装置,其特征在于,所述识别模块,包括:

转化子模块,用于将所述待识别的声音转化为模拟信号,对所述模拟信号进行采样处理,转化为数字信号;

加窗子模块,用于对所述数字信号进行加窗处理,将每一个窗口的窗口信号转化为对应的频谱;

确定子模块,用于当任意一个窗口的频谱中包含与所述声音模板匹配的脉冲时,确定从所述待识别的声音中识别出目标声音。

7.根据权利要求6所述的装置,其特征在于,所述确定子模块还用于:

获取声音模板中声音的频率;

根据所述频率确定所述声音在所述窗口中对应的坐标;

确定所述坐标对应的坐标幅值是否大于第一预设阈值,并且所述坐标周围预设范围内的坐标对应的坐标幅值是否小于第二预设阈值;

当所述坐标对应的坐标幅值大于第一预设阈值,并且所述坐标周围预设范围内的坐标对应的坐标幅值小于第二预设阈值时,确定从所述待识别的声音中识别出目标声音。

8.根据权利要求7所述的装置,其特征在于,当所述声音模板中包含至少两个声音时,所述确定子模块还用于:

确定所述声音模板中每一个声音对应的坐标的坐标幅值是否大于第一预设阈值,并且所述坐标周围预设范围内的坐标对应的坐标幅值是否小于第二预设阈值;

当所述每一个声音对应的坐标的坐标幅值大于第一预设阈值,并且所述坐标周围预设范围内的坐标对应的坐标幅值小于第二预设阈值时,确定从所述待识别的声音中识别出目标声音。

9.一种声音识别装置,其特征在于,包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为:

获取待识别的声音以及预存的声音模板;

根据预存的声音模板从所述待识别的声音中识别出目标声音。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1