一种AI虚拟机器人状态动态设置系统的制作方法

文档序号：23809501发布日期：2021-02-03 12:24阅读：74来源：国知局

一种ai虚拟机器人状态动态设置系统
技术领域
[0001]
本发明涉及智能决策技术领域，具体涉及一种ai虚拟机器人状态动态设置系统。

背景技术：

[0002]
随着ai技术的发展，ai虚拟机器人在生活中的应用越来越广泛，比如智能家居、智能音响或智能手机中，ai虚拟机器人根据用户的语音指令执行相应的操作，例如智能家居，用户对ai虚拟机器人发出“起始空调”的语音指令，ai虚拟机器人会识别到起始空调关键词，从而打开空调为用户降温；
[0003]
但是一旦用户发出的语音指令是“太热了”，ai虚拟机器人将不会识别当前语音指令，并不会起始空调为用户降温，语音指令和应答操作都是预设固定的，脱离预设范围将无法进行应答操作，灵活性相对较差，不能为用户提供更为拟人贴心的服务。

技术实现要素：

[0004]
本发明的目的在于提供一种ai虚拟机器人状态动态设置系统，以解决现有技术中语音指令和应答操作都是预设固定的，脱离预设范围将无法进行应答操作，灵活性相对较差，不能为用户提供更为拟人贴心的服务的技术问题。
[0005]
为解决上述技术问题，本发明具体提供下述技术方案：
[0006]
一种ai虚拟机器人状态动态设置系统，包括指令接收模块、指令分析模块、指令应答模块和状态更改反馈模块；
[0007]
指令接收模块，位于ai虚拟机器人的客户终端，用于接收用户发出的指令信息，并将指令信息传输到指令分析模块；
[0008]
指令分析模块，位于ai虚拟机器人的云服务端，对来自于指令分析模块指令信息进行分析转换为文本信息，对文本信息进行有效识别获得指令意图，并将指令意图传输到指令应答模块；
[0009]
指令应答模块，位于ai虚拟机器人的云服务端，根据来自于指令分析模块的指令意图匹配目标状态标识，将目标状态标识反馈到客户终端的ai虚拟机器人中，ai虚拟机器人根据目标状态标识执行从当前状态转变为目标状态，并向状态更改反馈模块发送状态更改提示信息；
[0010]
状态更改反馈模块，位于虚拟机器人的客户终端，将来自于指令应答模块的状态更改提示信息转变为提示语音反馈回用户，用以提示用户ai虚拟机器人根据用户指令执行达到的目标状态。
[0011]
作为本发明的一种优选方案，所述客户终端为安装有ai虚拟机器人的终端设备，所述终端设备包括智能手机、家居或音响，所述指令接收模块由终端设备上的语音接收器组成，所述指令接收模块接收的指令信息为语音信息，所述状态更改反馈模块由客户终端设备上的语音播放装置组成。
[0012]
作为本发明的一种优选方案，所述ai虚拟机器人的云服务端包括若干服务器和运
算主机，所述若干服务器和运算主机通过系统部署组成具有存储单元和运算单元的分布式系统。
[0013]
作为本发明的一种优选方案，所述指令分析模块将指令信息转换成指令意图的具体步骤为：
[0014]
a1、将指令信息中的语音进行预处理获得有效语音部分；
[0015]
a2、将有效语音部分利用语音转换技术转换成文本部分；
[0016]
a3、对文本部分进行预处理获得有效关键词；
[0017]
a4、对有效关键词利用关键词识别模型获得指令意图。
[0018]
作为本发明的一种优选方案，在所述a1中，将指令信息中的语音进行预处理获得有效语音部分的具体方式为：
[0019]
在指令信息的语音开始和结束处分别设置有起始和结束标识点；
[0020]
对起始和结束标识点之间的语音进行预处理操作获得包含起始和结束标识点的有效语音部分。
[0021]
作为本发明的一种优选方案，在所述a2中，有效语音部分利用语音转换技术转换成的文本部分也包含有起始和结束标识点。
[0022]
作为本发明的一种优选方案，在所述a3中，沿起始标识点到结束标识点的顺序对文本部分进行预处理获得有效关键词。
[0023]
作为本发明的一种优选方案，所述关键词识别模型建立的具体过程：
[0024]
定期更新包含若干条具有意图标识的语义文本集合；
[0025]
定期在神经网络模型基础上对语义文本集合进行模型训练获得输出指令意图的关键词识别模型，具体为：
[0026]
假设语义文本集合标记为s，测试数据集标记为s_test，训练数据集标记为s_train；
[0027]
按固定比例划分，将语义文本集合的20％作为测试数据集，80％作为训练数据集，即s_test＝20％s，s_train＝80％s，20％和80％的比例可以在实际使用中进行调整；
[0028]
将s_train＝80％s和s_train＝80％s，输入到神经网络模型中分别进行训练获得关键词识别模型；
[0029]
对关键词识别模型进行模型意图输出精度评价，根据模型意图输出精度调整关键词识别模型参数，获得最佳的关键词识别模型，具体为：
[0030]
将测试数据集输入关键词识别模型进行准确率计算，调整关键词识别模型中的权值和偏置参数，使准确率达到阈值以上，作为最佳的关键词识别模型投入真实场景进行使用。
[0031]
作为本发明的一种优选方案，所述关键诗词识别模型输入为所述有效关键词，输出为所述指令意图。
[0032]
作为本发明的一种优选方案，所述目标状态标识与指令意图对应形成，所述目标状态标识存储在云服务端的存储单元中。
[0033]
本发明与现有技术相比较具有如下有益效果：
[0034]
(1)本发明利用关键词识别模型对由用户的语音指令中提取出的有效关键词进行指令意图自动识别，获得与指令意图匹配的目标状态标识，ai虚拟机器人根据目标状态标
识控制终端设备执行从当前状态转变为目标状态，替换了固定的指令预设执行方式，提高了对用户指令意图识别的灵活性，为用户提供更为拟人贴心的服务。
[0035]
(2)本发明对关键词识别模型的语义文本集合进行定期更新，从而对关键词识别模型进行按照更新后的语义文本集合进行更新，因此能够实时紧跟时代的步伐，能够对当前时期的新兴词汇进行识别，更加符合贴近用户的生活，使用户获得更好的体验。
附图说明
[0036]
为了更清楚地说明本发明的实施方式或现有技术中的技术方案，下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是示例性的，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图引伸获得其它的实施附图。
[0037]
图1为本发明实施例提供的状态动态设置系统框图。
[0038]
图中的标号分别表示如下：
[0039]
1-指令接收模块；2-指令分析模块；3-指令应答模块；4-状态更改反馈模块。
具体实施方式
[0040]
下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0041]
如图1所示，本发明提供了一种ai虚拟机器人状态动态设置系统，包括指令接收模块1、指令分析模块2、指令应答模块3和状态更改反馈模块4；
[0042]
指令接收模块1，位于ai虚拟机器人的客户终端，用于接收用户发出的指令信息，并将指令信息传输到指令分析模块2；
[0043]
指令分析模块2，位于ai虚拟机器人的云服务端，对来自于指令分析模块2指令信息进行分析转换为文本信息，对文本信息进行有效识别获得指令意图，并将指令意图传输到指令应答模块3；
[0044]
指令应答模块3，位于ai虚拟机器人的云服务端，根据来自于指令分析模块2的指令意图匹配目标状态标识，将目标状态标识反馈到客户终端的ai虚拟机器人中，ai虚拟机器人根据目标状态标识执行从当前状态转变为目标状态，并向状态更改反馈模块4发送状态更改提示信息；
[0045]
状态更改反馈模块4，位于虚拟机器人的客户终端，将来自于指令应答模块3的状态更改提示信息转变为提示语音反馈回用户，用以提示用户ai虚拟机器人根据用户指令执行达到的目标状态。
[0046]
所述客户终端为安装有ai虚拟机器人的终端设备，所述终端设备包括智能手机、家居或音响，所述指令接收模块1由终端设备上的语音接收器组成，所述指令接收模块1接收的指令信息为语音信息，所述状态更改反馈模块4由客户终端设备上的语音播放装置组成。
[0047]
所述ai虚拟机器人的云服务端包括若干服务器和运算主机，所述若干服务器和运
算主机通过系统部署组成具有存储单元和运算单元的分布式系统，其中，运算单元用于对指令信息进行分析转换为文本信息，对文本信息进行有效识别获得指令意图，并将指令意图与目标状态标识相匹配，以及关键词识别模型的建立；存储单元用于存储运算单元产生和需要使用的相关数据，分布式系统运算单元和存储单元的拓展采用在分布式系统中接入运算主机的方式实现。
[0048]
云服务端和客户终端通过网络通信进行数据传输和指令交互。
[0049]
所述指令分析模块2将指令信息转换成指令意图的具体步骤为：
[0050]
a1、将指令信息中的语音进行预处理获得有效语音部分；
[0051]
a2、将有效语音部分利用语音转换技术转换成文本部分；
[0052]
a3、对文本部分进行预处理获得有效关键词；
[0053]
a4、对有效关键词利用关键词识别模型获得指令意图。
[0054]
在所述a1中，将指令信息中的语音进行预处理获得有效语音部分的具体方式为：
[0055]
在指令信息的语音开始和结束处分别设置有起始和结束标识点；
[0056]
设置起始和结束标识点的具体过程为：在语音中去除无音和噪音声纹段落，提取出语音声纹连续变化的段落，并在段落起始端标记起始标识点，在段落结束端标记结束标识点。
[0057]
对起始和结束标识点之间的语音进行预处理操作获得包含起始和结束标识点的有效语音部分。
[0058]
预处理包括预加重、分帧、对帧构建窗函数，预处理操作是语音转换技术的基础，避免无音和噪音部分的无效转换。
[0059]
在所述a2中，有效语音部分利用语音转换技术转换成的文本部分也包含有起始和结束标识点，语音转换技术转换为建立在自动语音识别技术生成的声学模型和语言模型，将语音输入到声学模型和语言模型中输出对应的文本。
[0060]
在所述a3中，沿起始标识点到结束标识点的顺序对文本部分进行预处理获得有效关键词。
[0061]
预处理包括去除无用符号、对文本进行分词、去除停用词，其中去除无用符号是对起始和结束标识点之间的文本进行无用符号去除，比如空格，标点，在实际使用中根据需要选择去除的符号，避免干扰后续关键词提取；文本分词可以利用分词库进行实现，将文本沿从沿起始标识点到结束标识点的顺序句式分割成若干词语，避免出现词序错乱，比如jieba库；去除停用词，用于去除若干词语中无效词语，剩余词语作为有效关键词，可以根据ai虚拟机器人使用场景设定专属的停用词表，比如应用在智能家居应答环境中，停用词表可以为{人称代词，连词，等}。
[0062]
所述关键词识别模型建立的具体过程：
[0063]
定期更新包含若干条具有意图标识的语义文本集合；
[0064]
定期周期可根据需要自行设定，定期更新的作用是不断的跟随时代发展填充新型词汇以适应用户的语言环境，比如网络新词汇，“好嗨哟”指代兴奋开心的情绪。
[0065]
语义文本集合包括情绪意图文本集合、操作意图文本集合，情绪意图文本集合用于使关键词识别模型具有识别用户情绪意图的功能并根据情绪意图进行终端控制进行人文关怀，比如关键词识别模型识别到用户语音中关键词为“好嗨哟”，识别到用户兴奋情绪，
指令意图为想要开启助兴设备，目标状态标识即为播放音乐，控制家居音响开启为用户播放音乐，操作意图文本集合用于使关键词识别模型具有识别用户操作意图的功能，比如关键词识别模型识别到用户语音中关键词为“太热了”，识别到用户体表感受热，指令意图为想要开空调降温，目标状态标识即为开空调，控制家居空调开启进行降温操作。
[0066]
语义文本集合中的分支集合可以根据需要进行调整，对应于情绪意图文本集合、操作意图文本集合会使关键词识别模式包含有若干个独立的模型，即情绪意图文本集合对应于情绪关键词识别模型，操作意图文本集合对应于操作关键词识别模型。
[0067]
在情绪关键词识别模型和操作关键词识别模型识别到的指令意图进行交集处理，在情绪关键词识别模型中识别到的指令意图与操作关键词识别模型识别到的指令意图存在冲突，以操作关键词识别模型识别到的指令意图为准，因为操作意图的关键词更为直白的描述了用户的需求。
[0068]
定期在神经网络模型基础上对语义文本集合进行模型训练获得输出指令意图的关键词识别模型；
[0069]
将语义文本集合分成两个数据集分别为训练数据集和测试数据集：
[0070]
假设语义文本集合标记为s，测试数据集标记为s_test，训练数据集标记为s_train；
[0071]
按固定比例划分，将语义文本集合的20％作为测试数据集，80％作为训练数据集，即s_test＝20％s，s_train＝80％s，20％和80％的比例可以在实际使用中进行调整。
[0072]
将s_train＝80％s和s_train＝80％s，输入到神经网络模型中分别进行训练获得关键词识别模型。
[0073]
将语义文本集合中情绪意图文本集合、操作意图文本集合单独应用进行关键词模型训练，要对情绪意图文本集合、操作意图文本集合进行预处理，具体为：
[0074]
将情绪意图文本集合，标记为s1、操作意图文本集合，标记为s2分成两个数据集分别为训练数据集和测试数据集：
[0075]
假设测试数据集标记为s_test，训练数据集标记为s_train；
[0076]
按固定比例划分，将语义文本集合的20％作为测试数据集，80％作为训练数据集，即s_test＝20％s1，s_train＝80％s1；s_test＝20％s2，s_train＝80％s2，20％和80％的比例可以在实际使用中进行调整；
[0077]
将s_train＝80％s1和s_train＝80％s2，输入到神经网络模型中分别进行训练获得情绪关键词识别模型和操作关键词识别模型。
[0078]
对关键词识别模型进行模型意图输出精度评价，根据模型意图输出精度调整关键词识别模型参数，获得最佳的关键词识别模型。
[0079]
将测试数据集输入关键词识别模型进行准确率计算，调整关键词识别模型中的权值和偏置参数，使准确率达到阈值以上，作为最佳的关键词识别模型投入真实场景进行使用。
[0080]
具体为：将s_test＝20％s1，s_test＝20％s2分别输入情绪关键词识别模型和操作关键词识别模型进行准确率计算，调整情绪关键词识别模型和操作关键词识别模型中的权值和偏置参数，使准确率达到阈值以上，将当前的调整情绪关键词识别模型和操作关键词识别模型作为最佳的关键词识别模型投入真实场景进行使用。
[0081]
同时在语义文本集合更新时，神经网络模型需要根据新的语义文本集合重新进行训练获得情绪关键词识别模型和操作关键词识别模型。
[0082]
所述关键诗词识别模型输入为所述有效关键词，输出为所述指令意图。
[0083]
所述目标状态标识与指令意图对应形成，所述目标状态标识存储在云服务端的存储单元中，其中目标状态标识用于客户终端进行识别。
[0084]
在关键词识别模型识别到用户语音中关键词为“好嗨哟”，识别到用户兴奋情绪，指令意图为想要开启助兴设备，目标状态标识即为播放音乐，控制家居音响开启为用户播放音乐，状态更改反馈模块4即家居音响向用户播放提示语音“开启音乐播放模式”，操作意图文本集合用于使关键词识别模型具有识别用户操作意图的功能，比如关键词识别模型识别到用户语音中关键词为“太热了”，识别到用户体表感受热，指令意图为想要开空调降温，目标状态标识即为开空调，控制家居空调开启进行降温操作，状态更改反馈模块4即家居音响向用户播放提示语音“开启空调降温模式”。
[0085]
本发明利用关键词识别模型对由用户的语音指令中提取出的有效关键词进行指令意图自动识别，获得与指令意图匹配的目标状态标识，ai虚拟机器人根据目标状态标识控制终端设备执行从当前状态转变为目标状态，替换了固定的指令预设执行方式，提高了对用户指令意图识别的灵活性，为用户提供更为拟人贴心的服务；同时对关键词识别模型的语义文本集合进行定期更新，从而对关键词识别模型进行按照更新后的语义文本集合进行更新，因此能够实时紧跟时代的步伐，能够对当前时期的新兴词汇进行识别，更加符合贴近用户的生活，使用户获得更好的体验。
[0086]
以上实施例仅为本申请的示例性实施例，不用于限制本申请，本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内，对本申请做出各种修改或等同替换，这种修改或等同替换也应视为落在本申请的保护范围内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：钟剑荣
技术所有人：广州深卓信息科技有限公司
我是此专利的发明人

上一篇：安全稳固型大电流电连接器的制作方法
上一篇：水库氮素污染的多级源解析可视化系统及方法与流程