基于智慧家庭的语义纠错方法与流程

文档序号：37483154发布日期：2024-04-01 13:52阅读：6来源：国知局

本发明涉及语音识别，特别是一种基于智慧家庭的语义纠错方法。

背景技术：

1、语音识别是将声音信号转换为文本信息的过程。随着人工智能技术的发展，语音识别技术已经广泛应用于生活中的各个领域。但是由于个人发音的差异性、语音识别模型训练语料收集的局限、硬件部署的限制，在某些特别的应用场景的正确率会降低。在智慧家庭领域下，使用语音控制智能家居设备是必须的功能，且对其语音识别的精确率要求较高。但是由于在家居环境下，存在个体发音的差异以及其他因素容易导致错误识别，从而导致不能准确控制智能设备。

技术实现思路

1、为解决现有技术中存在的问题，本发明的目的是提供一种基于智慧家庭的语义纠错方法，本发明能够很好的改善在语音识别中的误识别，提高用户体验。

2、为实现上述目的，本发明采用的技术方案是：一种基于智慧家庭的语义纠错方法，包括以下步骤：

3、步骤1、确定所有的智能设备以及智能设备所对应的能力集，对所有的能力集按照控制的指令词进行分类，并按照指令词的类别进行语法组合形成语法规则；

4、步骤2、获得语音识别的文本结果，检测文本结果中的指令词，判断是否为完整语音控制指令，如是，则直接输出进行设备控制，如否，则检索是否存在指令词，如果存在则根据指令词匹配指令规则，并确定可能对应的指令规则；

5、步骤3、统计所有可能对应的指令规则中缺少的类别词，遍历所有缺少的类别词，并与文本结果中所有的未匹配到的词进行相似度估计，当相似度满足阈值要求则匹配成功，将匹配成功的指令词进行替换；若替换后指令语句完整匹配语法规则，则输出进行设备控制。

6、作为本发明的进一步改进，在步骤2中，检索是否存在指令词时，如果不存在指令词则直接退出。

7、作为本发明的进一步改进，在步骤3中，假设未匹配到的词为字符串a，指令词集中进行匹配的词为字符串b，在计算a和b的相似度时，首先计算a和b的最长公共子串s0，如果不存在公共子串则直接退出；如果存在，将a分为{a0_front,s0,a0_back}，将b分为{b0_front,s0,b0_back}，分别将a0_front、b0_front和a0_back、b0_back分为同理计算最长公共子串si，不断循环直到求解出所有的公共子串；然后利用相似度得分计算公式求出得分，当分数大于阈值threshold则匹配成功，反之则匹配失败。

8、作为本发明的进一步改进，所述相似度得分计算公式具体如下：

9、

10、其中，len()表示字符串的长度。

11、作为本发明的进一步改进，在步骤3还包括：

12、将匹配成功的待匹配词放入对应的语法规则中，如果语法规则齐全且唯一则可以直接输出，如果语法规则不唯一则选择得分score最高的语法，如果没有匹配到对应的语法规则，则匹配失败。

13、本发明的有益效果是：

14、本发明利用家庭环境下的智能设备的用词习惯和语法逻辑，对控制词进行分类和组合，当文本中存在关键控制词且指令不完整时，触发语义纠错；通过评估错误词和缺少的控制词之间的相似性进行纠错，相似性则是利用了字符串之间的公共子串长度来进行判断；本发明能够很好的改善在语音识别中的误识别，提高用户体验。

技术特征：

1.一种基于智慧家庭的语义纠错方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于智慧家庭的语义纠错方法，其特征在于，在步骤2中，检索是否存在指令词时，如果不存在指令词则直接退出。

3.根据权利要求1所述的基于智慧家庭的语义纠错方法，其特征在于，在步骤3中，假设未匹配到的词为字符串a，指令词集中进行匹配的词为字符串b，在计算a和b的相似度时，首先计算a和b的最长公共子串s0，如果不存在公共子串则直接退出；如果存在，将a分为{a0_front,s0,a0_back}，将b分为{b0_front,s0,b0_back}，分别将a0_front、b0_front和a0_back、b0_back分为同理计算最长公共子串si，不断循环直到求解出所有的公共子串；然后利用相似度得分计算公式求出得分，当分数大于阈值threshold则匹配成功，反之则匹配失败。

4.根据权利要求3所述的基于智慧家庭的语义纠错方法，其特征在于，所述相似度得分计算公式具体如下：

5.根据权利要求4所述的基于智慧家庭的语义纠错方法，其特征在于，在步骤3还包括：

技术总结
本发明公开了一种基于智慧家庭的语义纠错方法，包括：确定所有的智能设备以及智能设备所对应的能力集，对所有的能力集按照控制的指令词进行分类，并按照指令词的类别进行语法组合形成语法规则；获得语音识别的文本结果，检测文本结果中的指令词，判断是否为完整语音控制指令，如否，则检索是否存在指令词；统计所有可能对应的指令规则中缺少的类别词，遍历所有缺少的类别词，并与文本结果中所有的未匹配到的词进行相似度估计，当相似度满足阈值要求则匹配成功，将匹配成功的指令词进行替换；若替换后指令语句完整匹配语法规则，则输出进行设备控制；本发明能够很好的改善在语音识别中的误识别，提高用户体验。

技术研发人员：王阳宣,李俊潇,李阳,李晓冬,彭世伟
受保护的技术使用者：四川启睿克科技有限公司
技术研发日：
技术公布日：2024/3/31

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王阳宣,李俊潇,李阳,李晓冬,彭世伟
技术所有人：四川启睿克科技有限公司
我是此专利的发明人

上一篇：一种桥式卸船机前臂梁小车定位系统的制作方法
上一篇：证本类文书给证装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。