智能机器人的个性化交互方法及交互系统与流程

文档序号:12368751阅读:480来源:国知局
智能机器人的个性化交互方法及交互系统与流程

本发明属于智能机器人领域,尤其设计一种智能机器人的个性化交互方法及交互系统。



背景技术:

智能机器人被广泛应用于多模态交互中。例如被用于与用户的对话交互中,智能机器人接收用户的问题,从知识库中搜索与用户的问题匹配的答案,然后将答案反馈给用户。

上述交互过程中存在的主要问题是,对于同一个问题,智能机器人通常会输出相同的答案,因为机器人与用户之间的交互是基于对问题的查询实现的。而实际中在人与人之间进行交互时,往往会根据交互对象的不同,对于同一个问题给出不同的应答。也就是说,现有聊天机器人与用户之间的对话模式并不符合实际中人们的交互习惯。

本发明针对上述问题提出解决方案以提高智能机器人的类人性。



技术实现要素:

本发明所要解决的技术问题之一是需要提供一种提高智能机器人的类人性的解决方案。

为了解决上述技术问题,本申请的实施例首先提供了一种智能机器人的个性化交互方法,包括接收用户输入的对话交互信息,并对所述对话交互信息进行解析;获取用户属性信息、机器人属性信息及环境信息;将对话交互信息的解析结果与所述用户属性信息、机器人属性信息及环境信息输入到对话生成模型中生成应答信息;以多模态形式输出所述应答信息。

优选地,基于用户的历史交互数据进行分析以获取用户属性信息。

优选地,所述用户属性信息包括用户的性格、年龄、性别和情绪;所述机器人属性信息包括机器人的性格和性别;所述环境信息包括时间、地点和温度。

优选地,所述对话生成模型包括对话编码层与应答解码层,所述将对话交互信息的解析结果与所述用户属性信息、机器人属性信息及环境信息输入到对话生成模型中生成应答信息,包括:对话编码层对所述对话交互信息的解析结果与所述用户属性信息、机器人属性信息及环境信息进行语义理解,并基于语义理解生成问题向量;应答解码层根据所述问题向量生成应答信息。

优选地,所述对话编码层与应答解码层均采用递归神经网络。

本申请的实施例还提供了一种智能机器人的个性化交互系统,包括:对话接收与解析模块,其接收用户输入的对话交互信息,并对所述对话交互信息进行解析;外部信息获取模块,其获取用户属性信息、机器人属性信息及环境信息;应答信息生成模块,其将对话交互信息的解析结果与所述用户属性信息、机器人属性信息及环境信息输入到对话生成模型中生成应答信息;应答输出模块,其以多模态形式输出所述应答信息。

优选地,所述外部信息获取模块基于用户的历史交互数据进行分析以获取用户属性信息。

优选地,所述用户属性信息包括用户的性格、年龄、性别和情绪;所述机器人属性信息包括机器人的性格和性别;所述环境信息包括时间、地点和温度。

优选地,所述应答信息生成模块的对话生成模型包括对话编码层与应答解码层,其中,对话编码层对所述对话交互信息的解析结果与所述用户属性信息、机器人属性信息及环境信息进行语义理解,并基于语义理解生成问题向量;应答解码层根据所述问题向量生成应答信息。

优选地,所述对话编码层与应答解码层均采用递归神经网络。

与现有技术相比,上述方案中的一个或多个实施例可以具有如下优点或有益效果:

通过采用递归神经网络建立个性化对话生成模型,并通过获取用户属性信息、机器人属性信息以及环境信息作为共同的输入信息来得到应答交互信息,实现了智能机器人的个性化应答,使得聊天机器人的回复更富有个性化特征,完善了用户体验。

本发明的其他优点、目标,和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书,权利要求书,以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本申请的技术方案或现有技术的进一步理解,并且构成说明书的一部分。其中,表达本申请实施例的附图与本申请的实施例一起用于解释本申请的技术方案,但并不构成对本申请技术方案的限制。

图1为根据本发明一实施例的智能机器人的个性化交互方法的流程示意图;

图2为根据本发明一实施例的个性化对话生成模型的结构示意图;

图3为根据本发明另一实施例的智能机器人的个性化交互系统的结构示意图。

具体实施方式

以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成相应技术效果的实现过程能充分理解并据以实施。本申请实施例以及实施例中的各个特征,在不相冲突前提下可以相互结合,所形成的技术方案均在本发明的保护范围之内。

现在市场上的聊天机器人,其技术主要依赖于基于对知识库的检索进行应答的方式。虽然这种基于检索的方式能够保证了回复具有较高的准确率,但是由于知识库的限制,导致机器人覆盖的知识面太窄,而且更重要的是机器人在面对不同特质的用户时往往表现出一样的反应。并且机器人的属性特征是不能调节的,这意味着用户所购买的机器人产品更像是一个玩具,而不是一个朋友,导致用户体验较差。本发明提出了一种基于智能机器人的交互方法,下面结合实施例详细说明。

图1为根据本发明一实施例的智能机器人的个性化交互方法的流程示意图,如图所示,该个性化交互方法包括以下步骤:

步骤S110、接收用户输入的对话交互信息,并对接收到的对话交互信息进行解析。

步骤S120、获取用户属性信息、机器人属性信息及环境信息。

步骤S130、将对话交互信息的解析结果与用户属性信息、机器人属性信息及环境信息输入到对话生成模型中生成应答信息。

步骤S140、以多模态形式输出应答信息。

具体的,在步骤S110中,用户与智能机器人进行语音交互,智能机器人接收用户输入的对话交互信息,同时启动内部的NLP模块对对话交互信息进行解析,初步获取用户传递给智能机器人的指令或向智能机器人提出的问题。

在步骤S120中,获取用于生成应答的辅助信息。

用户属性信息是表明用户身份特征以及性格特征等的信息。具体可以包括用户的性格、年龄、性别和情绪等。

现有技术中的主要问题是不能针对具有不同特质的用户做出有区别的应答,在本发明实施例中,通过用户属性信息(性别、年龄)可以判断用户是男是女,判断用户处于哪个年龄段,即基本定位用户所属的群体的特征。通过用户属性信息(性格)还可以判断用户的性格特质。进一步通过用户属性信息(情绪)判断用户在与智能机器人交互的当前过程中的情绪,是伤心、愉快、愤怒、恐惧等。

需要注意的是,上述实施例中的用户属性信息只是用于举例说明本发明实施例的实施方式,并不是穷举,只要能够表明用户特质的信息均可以作为用户属性信息被使用。例如用户的职业信息,用户的健康信息,用户的交友信息等都可以作为用户属性信息。

用户属性信息可以是在用户与智能机器人交互的当前过程中直接获取的,例如智能机器人通过接收用户发出的多模态输入信息获取用户属性信息。

另外,智能机器人还可以通过对用户的历史交互数据进行分析来获取用户属性信息。主要是指,智能机器人调用存储在库中的用户交互数据。

当然,容易理解的是,采用的用户属性信息越丰富,智能机器人的交互能力就越强,用户的体验性越好,但会相对增加智能机器人系统的成本,这需要根据实际的需求进行取舍。

机器人属性信息是一种使机器人具有类人性的设定属性。可以包括机器人的性格和性别,这两个属性信息可以参照用户属性信息中用的性别和性格信息,只不过智能机器人属性信息中的性别和性格信息是通过人为设定得到的。

通过给智能机器人设定属性信息,相当于提高了智能机器人拟人化程度,拟人化会使智能机器人更了解用户的特质、习惯等。现有技术中的机器人对用户的问题的应答主要是针对用户的具体问题的,对于用户的了解并不深入且缺乏对应性。

环境信息是表明用户与智能机器人交互时的空间、时间因素的影响的属性信息。环境信息可以包括时间、地点和温度等。如用户属性信息一样,此处并不是对环境信息的穷举,只是用于举例说明本发明实施例的实施方式。

例如时间信息即可以是日期、时分等信息,也可以是节假日、纪念日等信息,甚至可以是近期发生的重要事件信息等。同样的,采用的环境信息越丰富,智能机器人的交互能力就越强,用户的体验性越好,但会相对增加智能机器人系统的成本,需要根据实际的需求进行取舍。

通过引入用户属性信息、机器人属性信息以及外部环境信息等个性化特征,使得智能机器人能够针对特定的人、事、物做出更富有个性化特征的回复,完善了用户体验。

在步骤S130中,在收集到用户问题和一系列属性特征之后,将这些信息作为对话生成模型的模型输入,然后利用对话生成模型生成个性化回复。下面首先介绍对话生成模型。

不同于现有技术中的基于知识库中搜索的应答生成方式,在本发明的实施例中建立了一个对话生成模型。即当用户提问问题时,根据用户的问题基于训练好的对话生成模型生成答案,而不像原来的问答系统是基于知识库匹配的方法返回答案,并且在生成的过程中是基于提问问题根据知识库检索生成答案,其主要解决了当知识库中的问题有限的情况下无答案返回的情况。

对话生成模型接收用户与智能机器人之间的对话交互信息的解析结果,可以是用于指示的指令,也可以是发出的问题,此外,对话生成模型还接收用户属性信息、机器人属性信息以及外部环境信息,并基于这些信息进行综合分析来生成回复。

在本发明的一个实施例中,对话生成模型由对话编码层与应答解码层组成,其中,对话编码层对对话交互信息的解析结果与用户属性信息、机器人属性信息及环境信息进行语义理解,并基于语义理解的结果生成问题向量。该问题向量就是基于用户输入的问题的语义表示。应答解码层根据对话编码层生成的问题向量生成应答信息。

在本发明的一个实施例中,采用递归神经网络(Recursive Neural Network,RNN)构建对话编码层与应答解码层。

递归神经网络的目的主要用来处理序列数据。在传统的神经网络模型中,是从输入层到隐含层再到输出层,层与层之间是全连接的,每层之间的节点是无连接的。但是这种普通的神经网络对于很多问题却无能无力。例如,如果要预测句子的下一个单词是什么,一般需要用到前面的单词,因为一个句子中前后单词并不是独立的。

RNN中一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之间的节点不再无连接而是有连接的,并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。理论上,RNN能够对任何长度的序列数据进行处理。

如图2所示,对话编码层与应答解码层共同构成个性化对话生成模型,其中,对话编码层通过递归神经网络互相连接的节点,对输入的问题Q(a,b,c)和属性特征c进行处理,这部分处理具体由递归神经网络算法完成。

需要注意的是,问题Q(a,b,c)是用户输入的多模态信息经过解析后得到的结果,属性特征c是一个集合信息,包括前述实施例中的用户属性信息、机器人属性信息、环境信息等。

经过对话编码层的处理,生成问题向量v,对话编码层将问题向量v传递给应答解码层。

应答解码层也是具有多个相互连接的节点的递归神经网络,由递归神经网络算法对问题向量v进行处理,生成应答信息d、e、f。

进一步地,本发明实施例的对话生成模型是一种个性化对话生成模型。相比于普通的对话生成模型,个性化对话生成模型主要融入了外部变量(环境信息、用户属性信息、机器人属性信息等),这些外部变量的改变会使得机器人在与不同的使用者交互的时候做出不一样的回应(文字、语音和/或动作),满足用户的个性化需求。

在本发明实施例中,用户每一次与机器人进行语音交互时,该功能启用,基于个性化对话生成模型返回一个个性化回答。

该个性化对话生成模型主要解决聊天机器人的个性化需求,即满足机器人在与不同的使用者进行交互时可以表现出不同的特质。

本发明实施例的个性化对话生成模型在对话生成模型的基础上引入了个性化特征,主要包括外部环境信息、用户属性信息和机器人属性信息,这些特征在对话模型训练时作为外部变量一起输入到模型中,最终使得聊天机器人的回复更富有个性化特征,完善了用户体验。

最后,在步骤S140中,由对话生成模型生成的应答信息被发送至智能机器人的执行机构,智能机器人根据应答信息的具体内容,以多模态的形式输出应答信息的内容。

下面,通过示例对上述个性化交互过程进行说明。

当用户与智能机器人语音交互时,在接收并解析得到用户的问题之后,智能机器人后台基于用户的历史交互数据分析用户属性特征,例如用户的性别,年龄,性格,情绪等。

智能机器人通过配置的传感器检测或查询库信息、查询联网信息等手段获取当前环境信息,例如时间,地点和温度等。再同时读取用户关于智能机器人属性的设定。

需要注意的是,如果已经预先设定了智能机器人的属性信息,则读取设定的智能机器人属性。如果没有预先设定智能机器人的属性信息,则读入智能机器人属性的默认值。

当用户向机器人说“小灵(机器人的名字),我今天好开心呢”,这时机器人基于用户历史交互信息分析出用户的属性特征。设定两个假设的用户,以便于对比分析。

假设一:性别男;年龄:20;性格:开朗;情绪:开心。

假设二:性别女;年龄:15;性格:内向;情绪:高兴。

同时获取当前环境信息,同样设定两种假设的环境以便于对比分析。

假设一:时间:晚上;地点:常驻地;温度:20。

假设二:时间:早上;地点:操场;温度:15。

机器人属性设定,分别设定两种机器人属性。

假设一:幽默系数:0.8,性别:男。

假设二:幽默系数:0.2,性别:女。

个性化对话生成模型会把问题“小灵(机器人的名字),我今天好开心呢”定义为Q,将问题Q和收集到的特征,包括:

用户属性信息:{性别男;年龄:20;性格:开朗;情绪:开心}

环境信息:{时间:晚上;地点:常驻地;温度:20}

机器人属性信息:{幽默系数:0.8,性别:男}

个性化对话生成模型将上述属性信息定义为T1,与问题Q一起作为个性化对话生成模型的输入,然后经过模型的对话编码层编码生成中间向量C1,C1再经过应答解码层的解码依次生成回复,举例如下:

“小明,你是跟女朋友出去浪了么,真羡慕你!”

个性化对话生成模型会把问题“小灵(机器人的名字),我今天好开心呢”定义为Q,将问题Q和收集到的特征,包括:

用户属性信息:{性别女;年龄:15;性格:内向;情绪:高兴}

环境信息:{时间:早上;地点:操场;温度:15}

机器人属性信息:{幽默系数:0.2,性别:女}

个性化对话生成模型将上述属性信息定义为T2,与问题Q一起作为个性化对话生成模型的输入,然后经过模型的对话编码层编码生成中间向量C2,C2再经过应答解码层的解码依次生成回复,举例如下:

“小丽,看来今天早饭很好吃呢,好好上学呀。”

可以看出,针对于同一个用户问题,这些外部变量,例如个性化特征的引入,导致对话生成模型在与用户进行交互时,表现得更丰富,个性化特征更加明显。

本发明实施例能够消除传统聊天机器人的回复单一、乏味、个性化体验差的缺点。

图3为根据本发明另一实施例的智能机器人的个性化交互系统的结构示意图,如图所示,该个性化交互系统包括:

对话接收与解析模块31,其接收用户输入的对话交互信息,并对对话交互信息进行解析。

外部信息获取模块32,其获取用户属性信息、机器人属性信息及环境信息。

应答信息生成模块33,其将对话交互信息的解析结果与用户属性信息、机器人属性信息及环境信息输入到对话生成模型中生成应答信息。

应答输出模块34,其以多模态形式输出应答信息。

进一步地,外部信息获取模块32基于用户的历史交互数据进行分析以获取用户属性信息。

进一步地,应答信息生成模块34的对话生成模型包括对话编码层与应答解码层,其中,

对话编码层对对话交互信息的解析结果与用户属性信息、机器人属性信息及环境信息进行语义理解,并基于语义理解生成问题向量。

应答解码层根据问题向量生成应答信息。

对话编码层与应答解码层均采用递归神经网络。

各功能模块之间的数据传递路线如图3所示。

对话接收与解析模块31接收外部输入到个性化交互系统的问题,对问题进行解析处理后,传递给应答信息生成模块33。

应答信息生成模块33主要由个性化对话生成模型构成,该应答信息生成模块33还要向外部信息获取模块32发出获取信息的请求,在请求得到响应后,应答信息生成模块33从外部信息获取模块32获取用户属性信息、环境信息以及机器人属性信息。

由个性化对话生成模型对接收到的信息进行加工处理,生成对应的应答信息,并将生成的应答信息传递给应答输出模块34。

应答输出模块34会以多模态的方式输出应答信息,例如可以以语音输出、图像输出、文字输出、动作输出,或者以其中几种输出形式相结合的方式进行应答交互。

对话接收与解析模块31与应答输出模块34共同构成智能机器人个性化交互系统的交互层。

本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1