基于智慧家庭的语义纠错方法与流程

文档序号:37483154发布日期:2024-04-01 13:52阅读:6来源:国知局
基于智慧家庭的语义纠错方法与流程

本发明涉及语音识别,特别是一种基于智慧家庭的语义纠错方法。


背景技术:

1、语音识别是将声音信号转换为文本信息的过程。随着人工智能技术的发展,语音识别技术已经广泛应用于生活中的各个领域。但是由于个人发音的差异性、语音识别模型训练语料收集的局限、硬件部署的限制,在某些特别的应用场景的正确率会降低。在智慧家庭领域下,使用语音控制智能家居设备是必须的功能,且对其语音识别的精确率要求较高。但是由于在家居环境下,存在个体发音的差异以及其他因素容易导致错误识别,从而导致不能准确控制智能设备。


技术实现思路

1、为解决现有技术中存在的问题,本发明的目的是提供一种基于智慧家庭的语义纠错方法,本发明能够很好的改善在语音识别中的误识别,提高用户体验。

2、为实现上述目的,本发明采用的技术方案是:一种基于智慧家庭的语义纠错方法,包括以下步骤:

3、步骤1、确定所有的智能设备以及智能设备所对应的能力集,对所有的能力集按照控制的指令词进行分类,并按照指令词的类别进行语法组合形成语法规则;

4、步骤2、获得语音识别的文本结果,检测文本结果中的指令词,判断是否为完整语音控制指令,如是,则直接输出进行设备控制,如否,则检索是否存在指令词,如果存在则根据指令词匹配指令规则,并确定可能对应的指令规则;

5、步骤3、统计所有可能对应的指令规则中缺少的类别词,遍历所有缺少的类别词,并与文本结果中所有的未匹配到的词进行相似度估计,当相似度满足阈值要求则匹配成功,将匹配成功的指令词进行替换;若替换后指令语句完整匹配语法规则,则输出进行设备控制。

6、作为本发明的进一步改进,在步骤2中,检索是否存在指令词时,如果不存在指令词则直接退出。

7、作为本发明的进一步改进,在步骤3中,假设未匹配到的词为字符串a,指令词集中进行匹配的词为字符串b,在计算a和b的相似度时,首先计算a和b的最长公共子串s0,如果不存在公共子串则直接退出;如果存在,将a分为{a0_front,s0,a0_back},将b分为{b0_front,s0,b0_back},分别将a0_front、b0_front和a0_back、b0_back分为同理计算最长公共子串si,不断循环直到求解出所有的公共子串;然后利用相似度得分计算公式求出得分,当分数大于阈值threshold则匹配成功,反之则匹配失败。

8、作为本发明的进一步改进,所述相似度得分计算公式具体如下:

9、

10、其中,len()表示字符串的长度。

11、作为本发明的进一步改进,在步骤3还包括:

12、将匹配成功的待匹配词放入对应的语法规则中,如果语法规则齐全且唯一则可以直接输出,如果语法规则不唯一则选择得分score最高的语法,如果没有匹配到对应的语法规则,则匹配失败。

13、本发明的有益效果是:

14、本发明利用家庭环境下的智能设备的用词习惯和语法逻辑,对控制词进行分类和组合,当文本中存在关键控制词且指令不完整时,触发语义纠错;通过评估错误词和缺少的控制词之间的相似性进行纠错,相似性则是利用了字符串之间的公共子串长度来进行判断;本发明能够很好的改善在语音识别中的误识别,提高用户体验。



技术特征:

1.一种基于智慧家庭的语义纠错方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于智慧家庭的语义纠错方法,其特征在于,在步骤2中,检索是否存在指令词时,如果不存在指令词则直接退出。

3.根据权利要求1所述的基于智慧家庭的语义纠错方法,其特征在于,在步骤3中,假设未匹配到的词为字符串a,指令词集中进行匹配的词为字符串b,在计算a和b的相似度时,首先计算a和b的最长公共子串s0,如果不存在公共子串则直接退出;如果存在,将a分为{a0_front,s0,a0_back},将b分为{b0_front,s0,b0_back},分别将a0_front、b0_front和a0_back、b0_back分为同理计算最长公共子串si,不断循环直到求解出所有的公共子串;然后利用相似度得分计算公式求出得分,当分数大于阈值threshold则匹配成功,反之则匹配失败。

4.根据权利要求3所述的基于智慧家庭的语义纠错方法,其特征在于,所述相似度得分计算公式具体如下:

5.根据权利要求4所述的基于智慧家庭的语义纠错方法,其特征在于,在步骤3还包括:


技术总结
本发明公开了一种基于智慧家庭的语义纠错方法,包括:确定所有的智能设备以及智能设备所对应的能力集,对所有的能力集按照控制的指令词进行分类,并按照指令词的类别进行语法组合形成语法规则;获得语音识别的文本结果,检测文本结果中的指令词,判断是否为完整语音控制指令,如否,则检索是否存在指令词;统计所有可能对应的指令规则中缺少的类别词,遍历所有缺少的类别词,并与文本结果中所有的未匹配到的词进行相似度估计,当相似度满足阈值要求则匹配成功,将匹配成功的指令词进行替换;若替换后指令语句完整匹配语法规则,则输出进行设备控制;本发明能够很好的改善在语音识别中的误识别,提高用户体验。

技术研发人员:王阳宣,李俊潇,李阳,李晓冬,彭世伟
受保护的技术使用者:四川启睿克科技有限公司
技术研发日:
技术公布日:2024/3/31
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1