机器人语音交互方法及系统与流程

文档序号:16896375发布日期:2019-02-15 23:43阅读:519来源:国知局
机器人语音交互方法及系统与流程

本申请涉及机器人领域,具体而言,涉及一种机器人语音交互方法以及一种机器人语音交互系统。



背景技术:

随着机器人技术的发展,机器人的使用越来越普及,使用场景越来越多。例如,讲解机器人是一种设置在公共区域(例如展会、博物馆等)用于代替人工进行讲解和引路的机器人,讲解机器人具备与用户语音交互的功能,可以回答用户提出的问题。

现有的讲解机器人回答用户开放性问题的能力有限,现有的讲解机器人只能回答在机器人语料库中事先储存的问题,在实际交互情景中用户的开放性问题中有很多都没有事先录入到机器人语料库中,导致讲解机器人无法回答这些问题,而当用户的提问无法得到讲解机器人的解答时,势必会影响用户的对话体验。

公开于本申请背景技术部分的信息仅仅旨在加深对本申请的一般背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。

申请内容

本申请的主要目的在于提供一种用于提高机器人回答用户开放性问题的能力的机器人语音交互方法。

为了实现上述目的,根据本申请的一个方面,提供了一种机器人语音交互方法,该方法包括:获取机器人接收到的用户提出的问题;判断所述问题是否存在对应的答案;若否,则向讲解员端发送对应所述问题的问题回答请求;当接收到所述讲解员端发送的对应所述问题回答请求的问题回答时,将所述问题回答发送给所述机器人。

进一步的,在所述向讲解员端发送对应所述问题的问题回答请求之后,还包括:若在预设时间内未接收到所述讲解员端发送的对应所述问题回答请求的问题回答,则向所述机器人发送答案获取失败信息。

进一步的,所述当接收到所述讲解员端发送的对应所述问题回答请求的问题回答时,将所述问题回答发送给所述机器人,其中,当所述问题回答为音频数据时,还包括:将所述问题回答转换成文字数据;将所述文字数据发送给所述机器人,以使所述机器人播报所述文字数据。

进一步的,该方法还包括:获取机器人采集到的交互情景的音频数据和/或图像数据;将所述音频数据和/或图像数据发送给讲解员端;响应讲解员端发送的交互接管指令;在接收到所述交互接管指令时,将接收到的所述讲解员端发送的交互内容发送给所述机器人。

进一步的,所述将接收到的所述讲解员端发送的交互内容发送给所述机器人,其中,当所述交互内容为音频数据时,包括:将所述交互内容转化成文字数据;将所述文字数据发送给所述机器人,以使所述机器人播报所述文字数据。

进一步的,所述获取机器人接收到的用户提出的问题,包括:获取机器人接收到的用户提出问题的音频数据;将所述音频数据转化成文字数据。

为了实现上述目的,根据本申请的另一方面,提供了一种机器人语音交互系统,该系统包括:机器人、后台讲解服务器以及讲解员端,所述后台讲解服务器分别与所述机器人和所述讲解员端通信连接,其中,所述后台讲解服务器包括:存储器、处理器以及储存在存储器上的至少一个可执行指令,所述可执行指令使所述处理器执行以下操作:获取机器人接收到的用户提出的问题;判断所述问题是否存在对应的答案;若否,则向讲解员端发送对应所述问题的问题回答请求;当接收到所述讲解员端发送的对应所述问题回答请求的问题回答时,将所述问题回答发送给所述机器人。

进一步的,所述可执行指令进一步使所述处理器执行以下操作:获取机器人采集到的交互情景的音频数据和/或图像数据;将所述音频数据和/或图像数据发送给讲解员端;响应讲解员端发送的交互接管指令;在接收到所述交互接管指令时,将接收到的所述讲解员端发送的交互内容发送给所述机器人。

进一步的,所述可执行指令进一步使所述处理器执行以下操作:在所述向讲解员端发送对应所述问题的问题回答请求之后,若在预设时间内未接收到所述讲解员端发送的对应所述问题回答请求的问题回答,则向所述机器人发送答案获取失败信息。

在本申请的有益效果为:本申请通过在讲解机器人无法回答用户当前的开放性问题时,通过向讲解员端发送问题回答请求,以使讲解员端实时给出问题的答案,并由机器人通过其特有的声音将问题答案播报给用户,提高机器人回答用户开放性问题的能力也提升了用户的交互体验。

附图说明

构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是本申请第一实施例机器人语音交互方法流程示意图;

图2是本申请第二实施例机器人语音交互方法流程示意图;以及

图3是本申请第三实施例机器人语音交互方法流程示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

需要说明的是,本申请的说明书和权利要求书中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

如图1所示,本申请实施例的机器人语音交互方法包括步骤s101至步骤s105。

步骤s101,获取机器人接收到的用户提出的问题。在本申请实施例中,在讲解机器人与用户进行交互时,接收用户提出的问题的音频数据,并将该音频数据发送到智能讲解后台系统,进一步的,在本申请的可选实施例中,智能讲解后台系统可以对该音频数据进行识别并转换成文字数据,以此获取用户提出的问题的文字数据。在本申请的可选实施例中,智能讲解后台系统也可以对该音频数据中的关键词进行识别,识别出用户提出问题的问题关键词。

步骤s102,判断所述问题是否存在对应的答案。在本申请中,智能讲解后台系统中设置有语料库,该语料库用于储存事先准备好的问答对,该问答对包括问题以及该问题对应的答案,在本申请的可选实施例中,每个问答对可以包括一个问题以及与该问题对应的唯一答案,也可以包括多个类似的问题以及这些多个类似的问题对应的唯一答案。在本步骤中,当确定出用户提出的问题的文字数据后,智能讲解后台系统在其语料库中搜索该问题,从而判断出该问题在语料库中是否存在对应问答对,以此来判断该问题是否存在对应的答案。在本申请的可选实施例中,可以通过将该问题与语料库中每个问答对的问题进行相似度匹配,以此来判断出该问题是否存在对应的问答对,在本申请的另一可选实施例中,可以将该问题的问题关键词与语料库中每个问答对的问题进行相似度匹配,以此来判断出该问题是否存在对应的问答对。

步骤s103,当判断所述问题不存在对应的答案时,向讲解员端发送对应所述问题的问题回答请求。在本步骤中,当智能讲解后台系统判断出用户提出的问题在语料库中没有对应的问答对时,向讲解员端发送对应该问题的问题回答请求,该问题回答请求中还包括了该问题以及接收到该问题的机器人的信息。在本申请的实施例中,所述讲解员端包括后台讲解员端服务器以及讲解员,该后台讲解员端服务器可以接收多个讲解机器人交互现场的音频和视频数据,并在需要的时候可以同时为多个讲解机器人提供讲解支持。

步骤s104,当接收到所述讲解员端发送的对应所述问题回答请求的问题回答时,将所述问题回答发送给所述机器人。在本步骤中,当讲解员端接收到智能讲解后台系统发送的问题回答请求时,可以由讲解员对该问题进行回答,并将该问题的问题回答发送到智能讲解后台系统,进而智能讲解后台系统将问题回答发送给机器人,以使机器人将该问题回答反馈给用户。在本申请的可选实施例中,讲解员对该问题进行回答后,将问题回答语音发送到智能讲解后台系统,进而智能讲解后台系统将该问题回答语音转换成文字,并将问题回答的文字发送到讲解机器人,进而讲解机器人用预设音调播放该问题回答文字。在本申请的另一可选实施例中,当讲解员端接收到智能讲解后台系统发送的问题回答请求时,也可以通过智能讲解后台系统实现讲解员端和讲解机器人的语音同步,实时将讲解员的回答语音通过变声处理后传输给讲解机器人,并实时播放给用户。

步骤s105,若在预设时间内未接收到所述讲解员端发送的对应所述问题回答请求的问题回答,则向所述机器人发送答案获取失败信息。在本申请中,在智能讲解后台系统在给讲解员端发送问题回答请求之后,若在一定时间内未收到所述讲解员端发送的对应所述问题回答请求的问题回答,则向机器人发送答案获取失败信息,进而讲解机器人在接收到该答案获取失败信息时,向用户反馈不知道该问题答案。

从以上的描述中,可以看出,本申请通过在讲解机器人无法回答用户当前的开放性问题时,通过向讲解员端发送问题回答请求,以使讲解员端实时给出问题的答案,并由机器人通过其特有的声音将问题答案播报给用户,提高机器人回答用户开放性问题的能力也提升了用户的交互体验。

根据本申请实施例,还提供了另一种机器人语音交互方法,如图2所示,该方法包括步骤s201至步骤s204。

步骤s201,获取机器人采集到的交互情景的音频数据和/或图像数据。在本申请的实施例中,讲解机器人可以采集交互情景的音频和视频数据,并实时将该音频和视频数据发送到智能讲解后台系统。

步骤s202,将所述音频数据和/或图像数据发送给讲解员端。在本步骤中,智能讲解后台系统接收到讲解机器人采集到的交互情景的音频和视频数据后,将该音频和视频数据实时发送给讲解员端。

步骤s203,响应讲解员端发送的交互接管指令。在步骤中,讲解员端在接收到交互情景的音频和视频数据时,可以实时对交互情景的音频和视频数据进行审核,并人工判断出是否需要代替讲解机器人回答用户提出的某一开放性问题,在讲解员判断出需要代替讲解机器人回答用户提出的问题时,例如讲解机器人无法正确识别出用户的问题,或者在语料库中无法找到用户提出问题的答案时,讲解员端向智能讲解后台系统发送语音接管指令,以使讲解员替代讲解机器人回答用户的问题。

步骤s204,在接收到所述交互接管指令时,将接收到的所述讲解员端发送的交互内容发送给所述机器人。在本步骤中,当智能讲解后台系统接收到讲解员端发送的语音交互接管指令时,将讲解员端和讲解机器人的语音进行同步,即将讲解员的语音实时发送给讲解机器人,并实时播放给用户。在本申请的可选实施例中,在将讲解员的语音发送给讲解机器人之前,还要对讲解员的语音进行变声处理,将讲解员的语音调整为机器人的预设音调,再将处理后的语音实时通过讲解机器人播放给用户。

从以上的描述中,可以看出,本申请通过讲解员实时对机器人交互场景进行监控,并人工判断是否需要代替机器人回答某些问题,并在需要时接管讲解机器人的语音交互,进一步提高了讲解机器人回答用户开放性问题的能力。

本申请考虑到,在讲解员替代机器人回答某些问题时,如果直接使用讲解员的语音会显得十分突兀,给用户带来不好的交互体验,因此本申请还会对讲解员的语音进行处理,如图3所示,对讲解员的语音进行处理的方法包括步骤s301至步骤s303。

步骤s301,接收所述讲解员端发送的对应所述问题回答请求的问题回答语音。在本步骤中,当讲解员端接收到智能讲解后台系统发送的问题回答请求时,可以由讲解员对该问题进行回答,并将该问题的问题回答语音发送到智能讲解后台系统。

步骤s302,将所述交互内容转化成文字数据。在本步骤中,在讲解员对该问题进行回答,并将问题回答语音发送到智能讲解后台系统后,智能讲解后台系统将该问题回答语音转换成文字,得到问题回答的文字数据。

步骤s303,将所述文字数据发送给所述机器人,以使所述机器人播报所述文字数据。在本步骤中,智能讲解后台系统将问题回答的文字数据发送到讲解机器人,进而讲解机器人用预设音调播放该问题回答的文字数据,以实现回答用户的开放性问题的目的。

需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

根据本申请实施例,还提供了一种用于实施上述机器人语音交互方法的机器人语音交互系统,该系统包括:至少一个讲解机器人、后台讲解服务器以及讲解员端,所述后台讲解服务器分别与所述至少一个讲解机器人和所述讲解员端通信连接,其中,所述后台讲解服务器包括:存储器、处理器以及储存在存储器上的至少一个可执行指令,所述可执行指令使所述处理器执行以下操作:

获取机器人接收到的用户提出的问题;

判断所述问题是否存在对应的答案;

若否,则向讲解员端发送对应所述问题的问题回答请求;

当接收到所述讲解员端发送的对应所述问题回答请求的问题回答时,将所述问题回答发送给所述机器人。

进一步的,所述可执行指令进一步使所述处理器执行以下操作:

获取机器人采集到的交互情景的音频数据和/或图像数据;

将所述音频数据和/或图像数据发送给讲解员端;

响应讲解员端发送的交互接管指令;

在接收到所述交互接管指令时,将接收到的所述讲解员端发送的交互内容发送给所述机器人。

进一步的,所述可执行指令进一步使所述处理器执行以下操作:

在所述向讲解员端发送对应所述问题的问题回答请求之后,若在预设时间内未接收到所述讲解员端发送的对应所述问题回答请求的问题回答,则向所述机器人发送答案获取失败信息。

显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1