机器人的交互方法及系统与流程

文档序号：11202369阅读：708来源：国知局

本发明实施例涉及机器人技术领域，尤其涉及一种机器人的交互方法及系统。

背景技术：

机器人(robot)是自动执行工作的机器系统。它既可以接受人类指挥，又可以运行预先编排的程序，也可以根据以人工智能技术制定的原则纲领行动，用于协助或取代人类工作。

目前，随着科学技术的快速发展，机器人不仅仅可以应用于商业或工业，还可以作为用户的玩伴，能够实现与人类的正常交互。在现有技术中，由于机器人接收到外界语音后，会对接收到的语音进行解析，再匹配出与该语音相对应的文字作为应答，因此并不能快速的做出应答。

技术实现要素：

本发明实施例提供一种机器人的交互方法及系统，能够改善机器人与人类交互中反应速度慢的现象。

第一方面，本发明实施例提供了一种机器人的交互方法，包括：

采集交互用户的图像信息；

将所述交互用户的图像信息发送至服务器；

接收所述服务器发送的与所述交互用户的图像信息相匹配的关键字符库；

于所述关键字符库中，根据接收的所述交互用户的声音信息确定目标关键字。

进一步的，所述将所述交互用户的图像信息发送至服务器包括：

将所述交互用户的图像信息以图片格式发送至所述服务器；

或者，若所述图像信息为视频信息时，将所述交互用户的图像信息以帧图格式发送至所述服务器。

进一步的，所述交互用户的图像信息包括所述交互用户的面部表情或者动作。

进一步的，还包括：

基于所述服务器中预存的日常图像信息，将所述日常图像信息进行分类并匹配相应的关键字符库。

进一步的，所述将所述日常图像信息进行分类包括；

按照发生情景对所述日常图像信息进行分类；

或者，按照所述交互用户的情绪对所述日常图像信息进行分类。

第二方面，本发明实施例还提供了一种机器人的交互系统，包括：

图像信息采集模块，用以采集交互用户的图像信息；

图像信息发送模块，用以将所述交互用户的图像信息发送至服务器；

关键字符库接收模块，用以接收所述服务器发送的与所述交互用户的图像信息相匹配的关键字符库；

目标关键字确定模块，用以于所述关键字符库中，根据接收的所述交互用户的声音信息确定目标关键字。

进一步的，所述图像信息发送模块具体用以：

将所述交互用户的图像信息以图片格式发送至所述服务器；

或者，若所述图像信息为视频信息时，将所述交互用户的图像信息以帧图格式发送至所述服务器。

进一步的，所述交互用户的图像信息包括所述交互用户的面部表情或者动作。

进一步的，还包括：

分类模块，用以基于所述服务器中预存的日常图像信息，将所述日常图像信息进行分类并匹配相应的关键字符库。

进一步的，所述分类模块具体用以：

按照发生情景对所述日常图像信息进行分类；

或者，按照所述交互用户的情绪对所述日常图像信息进行分类。

本发明实施例提供了一种机器人的交互方法及系统，若采集交互用户的图像信息；将所述交互用户的图像信息发送至服务器；接收所述服务器发送的与所述交互用户的图像信息相匹配的关键字符库；于所述关键字符库中，根据接收的所述交互用户的声音信息确定目标关键字，通过交互用户的图像信息缩小原有关键字符库的范围，在该关键字符库中匹配出目标关键字，能够改善机器人与人类交互中反应速度慢的问题，提高机器人交互中的应答速度。

附图说明

图1是本发明实施例一中的一种机器人的交互方法的流程图；

图2是本发明实施例二中的一种机器人的交互系统的结构图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的一种机器人的交互方法的流程图，本实施例可适用于机器人的交互情况，该方法可以由本发明实施例提供的机器人的交互系统来执行。如图1所示，具体包括：

s110、采集交互用户的图像信息。

其中，交互用户可以是机器人固定服务的专属用户，也可以是任何出现在机器人视觉系统中的任意用户。图像信息可以包括图片信息与视频信息。当光线照射在一个物体上时，物体的表面就会反射光线。反射光进入我们的眼睛，使我们看见东西。同理，机器人能够看见交互用户也是基于这个原理。又由于光的传播速度大于声音的传播速度，因此机器人的视觉系统能够先看见交互用户的图像信息，而后听觉系统才能接收到交互用户的声音信息。

因此，机器人可以先采集交互用户的图像信息，根据该图像信息分析交互用户所在的场景或者情绪，再根据该场景或者情绪缩小机器人回复给交互用户的应答范围。

示例性的，所述交互用户的图像信息包括所述交互用户的面部表情或者动作。

具体的，交互用户的图像信息内容可以包括近距离拍摄的交互用户的面部表情，也可以是远距离拍摄的交互用户的动作行为。例如，机器人的视觉系统若在预设时间阈值内检测到交互用户无明显动作幅度，则可以近距离拍摄交互用户的面部表情；若在预设时间阈值内检测到交互用户具有重复性的动作行为，则也可以近距离拍摄交互用户的动作行为；若在预设时间阈值内检测到交互用户有明显的动作幅度，则可以远距离拍摄交互用户的面部表情。具体例如，若交互用户一直走路或者坐在椅子上不动，则可以近距离拍摄交互用户细微的面部表情；若交互用户走路突然跌倒时，可以远距离拍摄交互用户的动作行为。

s120、将所述交互用户的图像信息发送至服务器。

由于机器人也属于一种智能设备，而智能设备的弊端是存储器内存容量有限以及计算处理效率慢等。因此，大多数智能终端均会与服务器相连，将存储以及计算处理的任务转移至服务器，由服务器进行处理。在本实施例中，当机器人的视觉系统采集到交互用户的图像信息后，也会将该图像信息发送至服务器。

示例性的，所述将所述交互用户的图像信息发送至服务器包括：将所述交互用户的图像信息以图片格式发送至所述服务器；或者，若所述图像信息为视频信息时，将所述交互用户的图像信息以帧图格式发送至所述服务器。

由于机器人的视觉系统检测到交互用户后，采集图像信息可以是以不断拍摄交互用户的方式，以图片格式的图像信息发送至服务器，也可以是以连续拍摄关于交互用户的视频信息的方式，将视频信息拆分成一幅幅帧图像，以帧图格式发送至服务器，或者还可以是直接将拍摄的关于交互用户的视频信息发送至服务器。

s130、接收所述服务器发送的与所述交互用户的图像信息相匹配的关键字符库。

其中，关键字符库为服务器存储的用于机器人语音输出的文字的集合。关键字符库中包含了所有的字、词以及语句，且关键字符库中包含的语言种类不做限定。

具体的，服务器当接收到机器人上传的关于交互用户的图像信息后，将对该图像信息进行处理。例如，服务器可以提取图像信息中含有的交互用户的图像，对交互用户的动作或者面部表情进行分析，从而确定与之相匹配的关键字符库。并将该关键字符库发送至机器人。

通过筛选出与交互用户的图像信息相匹配的关键字符库，避免了机器人在检测到交互用户的声音信息后，在包含全部字、词或语句中的关键字符库中进行匹配，由于缩小了关键字符库的范围，因此机器人的应答速度大幅度提高。

示例性的，还包括：基于所述服务器中预存的日常图像信息，将所述日常图像信息进行分类并匹配相应的关键字符库。

具体的，服务器中可以预存日常图像信息，用于辅助对接收到的交互用户的图像信息进行分析。其中，日常图像信息可以是存入的各种场景的图像，也可以是输入的电视剧或者电影场景。将日常图像信息进行归类并匹配上与该日常图像信息相对应的关键字符库，其中，与该日常图像信息相对应的关键字符库中包含的文字全部适用于该日常图像信息。

示例性的，所述将所述日常图像信息进行分类包括；按照发生情景对所述日常图像信息进行分类；或者，按照所述交互用户的情绪对所述日常图像信息进行分类。

由于交互用户可以在任何情境下跟机器人进行互动，因此，日常图像信息可以根据发生场景进行分类。例如，若交互用户在家里写作业，与之相对应的关键字符库可以包含学习类的文字。又例如，若交互用户在室外打球，与之相对应的关键字符库可以包含球类相关的文字，或者鼓励类的文字。

或者，日常图像信息可以是按照交互用户的情绪进行分类。例如，若交互用户的心情很差，在图像信息的表现方式可以是撅嘴或者流眼泪，这时与之相对应的关键字符库可以包含安慰类的文字。又例如，若用户的心情很好，在图像信息的表现方式可以是笑脸或者欢呼雀跃，这时与之相对应的关键字符库可以包含庆祝类的文字。

s140、于所述关键字符库中，根据接收的所述交互用户的声音信息确定目标关键字。

具体的，机器人在接收到服务器已缩小了范围的关键字符库后，在接收到交互用户的声音信息后，对声音信息进行分析，在范围缩小后的关键字符库中匹配出与声音信息对应的关键字，并将该对应的关键字作为目标关键字进行输出。

需要说明的是，现有技术中的机器人与交互用户之间的交互都是基于检测到交互用户的声音后，将采集的交互用户的语音转化为文字，再对该文字进行识别分析，从而在包含所有字、词与语句的关键字符库中匹配出与声音。本实施例通过预先对拍摄的图像信息处理，能够缩小元还有关键字符库的范围，从而提高机器人的应答效率。

例如，交互用户为小孩，一个小孩在跟机器人玩耍时，不小心摔倒。一般情况下，小孩会想让机器人提供安慰的回应。因此，机器人拍摄到小孩摔倒的图像信息，该图像信息包含小孩摔倒的动作以及小孩的面部表情，那么机器人将该图像信息上传至服务器，接收由服务器匹配出与该图像信息相对应的关键字符库，该关键字符库只包含了安慰类以及摔倒等相关的关键字，排除了开心、兴奋等其他情绪，也排除了写作业、吃饭以及打球等其他情景。随后，机器人在检测到小孩的声音信息后，可以直接在该关键字符库中进行匹配目标关键字并转化为语音进行输出。

本发明实施例提供了一种机器人的交互方法，若采集交互用户的图像信息；将所述交互用户的图像信息发送至服务器；接收所述服务器发送的与所述交互用户的图像信息相匹配的关键字符库；于所述关键字符库中，根据接收的所述交互用户的声音信息确定目标关键字，通过交互用户的图像信息缩小原有关键字符库的范围，在该关键字符库中匹配出目标关键字，能够改善机器人与人类交互中反应速度慢的问题，提高机器人交互中的应答速度。

实施例二

图2为本发明实施例二提供的一种机器人的交互系统的结构示意图，本实施例可适用于各种机器人的交互情况。如图2所示，具体包括：图像信息采集模块21、图像信息发送模块22、关键字符库接收模块23和目标关键字确定模块24。

图像信息采集模块21，用以采集交互用户的图像信息；

图像信息发送模块22，用以将所述交互用户的图像信息发送至服务器；

关键字符库接收模块23，用以接收所述服务器发送的与所述交互用户的图像信息相匹配的关键字符库；

目标关键字确定模块24，用以于所述关键字符库中，根据接收的所述交互用户的声音信息确定目标关键字。

在上述实施例基础上，所述图像信息发送模块22具体用以：将所述交互用户的图像信息以图片格式发送至所述服务器；或者，若所述图像信息为视频信息时，将所述交互用户的图像信息以帧图格式发送至所述服务器。

在上述实施例基础上，所述交互用户的图像信息包括所述交互用户的面部表情或者动作。

在上述实施例基础上，还包括：分类模块25；

分类模块25，用以基于所述服务器中预存的日常图像信息，将所述日常图像信息进行分类并匹配相应的关键字符库。

在上述实施例基础上，所述分类模块25具体用以：按照发生情景对所述日常图像信息进行分类；或者，按照所述交互用户的情绪对所述日常图像信息进行分类。

本实施例所述机器人的交互系统用于执行上述各实施例所述的机器人的交互方法，其技术原理和产生的技术效果类似，这里不再赘述。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李承敏;包振毅;王文斌;叶巧莉
技术所有人：上海与德通讯技术有限公司
我是此专利的发明人

上一篇：一种圆片基体固定装置的制造方法
上一篇：一种方便展示的花卉用吊架的制造方法与工艺