语音命令词识别后处理方法、系统、设备及存储介质与流程

文档序号:42651499发布日期:2025-08-05 18:35阅读:74来源:国知局
技术特征:

1.一种语音命令词识别后处理方法,其特征在于,包括:

2.根据权利要求1所述的语音命令词识别后处理方法,其特征在于,所述获取声学模型输出的音素概率矩阵及命令词路径得分的步骤,包括:

3.根据权利要求1所述的语音命令词识别后处理方法,其特征在于,所述基于音素概率矩阵和命令词路径得分初步判断是否存在误识别、混识别或集外词识别的步骤,包括:

4.根据权利要求3所述的语音命令词识别后处理方法,其特征在于,所述预设的结构关系包括严格前缀包含、严格后缀包含、非严格包含、近似包含及对称关系;所述若当前命令与命令词列表中任一词条存在预设的结构关系,初步判断为存在混识别的步骤,包括:

5.根据权利要求1所述的语音命令词识别后处理方法,其特征在于,所述若初步判断存在误识别,基于音素概率矩阵中提取得分向量并统计非目标音素数量进行判断,生成第一确认结果的步骤,包括:

6.根据权利要求1所述的语音命令词识别后处理方法,其特征在于,所述若初步判断存在混识别,根据混识别对应的异常类型从音素概率矩阵中获取后续帧或历史帧的音素序列,基于命令词结构关系进行分析,得到第二确认结果的步骤,包括:

7.根据权利要求1所述的语音命令词识别后处理方法,其特征在于,所述若初步判断存在集外词识别,从音素概率矩阵中提取得分最高的关键音素,查询候选音素库,生成第三确认结果的步骤,包括:

8.一种语音命令词识别后处理系统,其特征在于,包括:

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。


技术总结
本申请涉及语音解码技术领域,特别是涉及到一种语音命令词识别后处理方法、系统、设备及存储介质,其中方法包括:获取声学模型输出的音素概率矩阵及命令词路径得分;基于音素概率矩阵和命令词路径得分初步判断是否存在误识别、混识别或集外词识别;若初步判断存在误识别、混识别或集外词识别,基于误识别、混识别或集外词识别进行二次确认,基于确认结果输出最终识别结果。本申请无需重新训练模型,能够利用后处理机制高效处理三类识别问题,在端侧离线资源受限场景下,能平衡识别灵敏度与误识别率。

技术研发人员:李述奇
受保护的技术使用者:深圳市友杰智新科技有限公司
技术研发日:
技术公布日:2025/8/4
当前第2页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!