一种适用于多场景的可扩展的指令识别方法和电子设备与流程

文档序号:37335451发布日期:2024-03-18 17:59阅读:13来源:国知局
一种适用于多场景的可扩展的指令识别方法和电子设备与流程

本技术属于通信,具体涉及一种适用于多场景的可扩展的指令识别方法和电子设备。


背景技术:

1、随着软硬件技术不断发展,智能化控制的概念悄悄兴起,用户操作越来越倾向于“傻瓜式操作”,动动手甚至于动动嘴即可控制各种设备。此外,随着软硬件与各个行业的结合,各种可操作设备爆炸式增加,控制终端也随之急速增多。以家庭生活场景为例,有电视、空调、cd机等各种遥控器,时常还有丢失的风险,这与近年来用户所追求的“简单美”、“方便美”相背离。那么就需要一种,既能支持多种方式,比如动动手、动动嘴即可操作各种设备;也能够从多种维度对一个/多个复杂场景,进行指令控制。也就是一种“支持多种输入形式的多设备控制中心”,比如使用一个如手机、音箱的智能助手载体,即可轻松控制任意家庭设备。这样一来,不仅可以简化用户的上手难度,便捷用户的操作,而且可以做统一化管理,简单来说,就是一对多控制以及多元化控制。

2、传统的硬件指令识别是集成于芯片中的,识别出相应的关键词后进行对应的操作。但是由于硬件本身内存等条件的限制,硬件识别指令有指令词和说法较少、识别准确率低、场景较为单一和扩展困难的缺点,硬件设备之间的互联以及互相控制就更加困难。

3、在这一背景下,必须采用一种新的方式来进行设备控制,可采用指令与设备拆分的形式来实现,除了各种设备是指令执行终端,还有一个控制指令的解析终端,比如想以语音指令为主,可以使用一个控制音箱作为指令采集识别以及发出指令的中间设备。那么,这个中间设备是否足够“智能”,对内置其中的指令识别系统的能力就提出了具象化的要求,如何建设一个支持多设备、多场景、多指令准确控制且有很强扩展性的指令识别系统就成了一个亟待解决的问题。


技术实现思路

1、本发明针对现有技术中的不足,提供一种适用于多场景的可扩展的指令识别方法和电子设备,适用多种复杂场景,能高效配置,具有高可用可扩展性,能在大数据集下精准快速识别的智能设备指令。

2、为实现上述目的,本发明采用以下技术方案:

3、一种适用于多场景的可扩展的指令识别方法,包括识别配置和指令识别,所述识别配置包括以下内容:

4、配置业务场景;

5、配置用户输入形式;

6、配置每个业务场景中的子场景、每个子场景的指令话术模版和指令话术模版中涉及的素有实体项和实体信息;

7、配置泛化识别模型;

8、配置规范化算法及输出格式;

9、配置返回值的数据格式;

10、将所有配置与用户信息进行绑定;

11、所述指令识别包括以下步骤:

12、s1、根据用户输入信息查询用户的配置信息,并识别用户输入信息的具体内容,对识别的内容进行预处理得到输入内容;

13、s2、提取输入内容中的实体信息,如果提取出实体信息则替换相应指令话术模版中对应的实体项,选择最匹配的指令话术模版,并进行规范化算法进行规范化处理,得到识别结果进入步骤s401,否则进入步骤s3;

14、s3、根据步骤s1查询到的配置信息,确认是否存在配置泛化识别模型,如果存在则根据该泛化识别模型识别输入内容中的用户意图,如果不存在则则赋予相应的异常码进入步骤s402;

15、如果识别用户意图,则根据用户意图匹配对应的指令话术模版及其所属的所有实体信息,利用泛化识别模型提取输入内容中对应的实体信息,将实体信息替换相应指令话术模版中对应的实体项,并进行规范化处理得到识别结果进入步骤s401;如果未识别用户意图,则赋予相应的异常码进入步骤s402

16、s401、将识别结果按照配置的输出格式返回给用户;

17、s402、根据异常码匹配对应的异常内容按照输出格式返回给用户。

18、作为优选,所述识别配置中配置用户输入形式包括语音输入和文本输入;所述指令话术模版由若干个实体项按顺序组成,实体信息为实体项的具体内容。

19、作为优选,所述步骤s1中用户输入信息包括语音输入信息和文本输入信息,对语音输入信息通过自动语音识别转化为文本信息;所述对识别内容的预处理包括为去除空格、去除标点符号和去除特殊符号。

20、作为优选,所述步骤s2包括准备步骤:

21、根据步骤s1查询到的配置信息和输入信息匹配对应的业务场景,确认该业务场景下所有的指令话术模版及其所述的实体项和实体信息,以及实体信息的同义词。

22、作为优选,所述步骤s2中根据匹配的业务场景中所有的实体信息构建ac自动机,通过构建的ac自动机提取输入内容中的实体信息。

23、作为优选,所述ac自动机构建过程如下:

24、s201、构建字典树,使用实体信息中的词汇构件字典树,每个节点包含了一个子节点字典、一个结束标记、一个失败指针以及一个同义词集合;

25、s202、构件ac自动机,在在字典树的基础上添加失败指针,形成ac自动机。

26、作为优选,所述指令话术模版为:实体项1,实体项2,...,实体项n,n为该指令话术模版实体项的总数;不同的场景中存在相同实体项。

27、作为优选,所述泛化识别模型包括chatgpt。

28、一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序使计算机执行上述任一项所述的一种适用于多场景的可扩展的指令识别方法。

29、一种电子设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行计算机程序时,实现上述任一项所述的一种适用于多场景的可扩展的指令识别方法。

30、本发明的有益效果是:

31、1、本技术的指令识别是模式匹配加上泛化模型的结构,兼顾了速度和泛化性。模式匹配速度极快、拓展性高,配合固定说法(比如在某些场景下,用户的指令组成相对单一,比如在电视节目点播场景,一个{name}可能就可以命中大多数的指令,用户说“西游记”、“红楼梦”,本质上都是一个“name”的指令说法)能命中大部分指令。但是一旦有超出标准实体名称的实体或者用户的话术模式过于复杂,未收入指令话术模板,则会被误判,识别不出正确结果;泛化模型相对模式匹配比较慢,但是具有泛化性,可以对用户指令进行泛化识别,配合实体规范化算法,识别准确率将进一步提高。

32、2、本技术的识别配置是对指令识别功能的进一步强化,使得指令识别不仅可以配置多个场景,还可以对支持的说法和实体进行及时扩充,延长平台的使用周期。不管是面对有若干子场景的单个总场景还是连结了多个设备的多场景情况,一套配置平台,化繁为简。

33、3、利用ac自动机实现了一个实体抽取和话术模式规则匹配器。它首先构建了一个ac自动机来高效地在文本中搜索预定的关键词集。然后,它将找到的关键词与预定义的规则进行匹配,以找出符合规则的关键词。最后,它会根据匹配的规则和关键词生成一个结果列表,并按照得分将结果进行排序。该方法兼具高效性、灵活性和准确性,能够适配大部分用户指令,有很大的优势。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1