机器人动作方法与系统与流程

文档序号:12539575阅读:993来源:国知局
机器人动作方法与系统与流程

总的而言本发明涉及机器人,特别涉及一种机器人动作方法与系统。



背景技术:

随着科技的不断发展,机器人的发展也越来越快,种类也越来越多了。从工业机器人到家政机器人、娱乐机器人,机器人技术正朝着以下四个方向大步前进:感官功能越来越丰富、制作成本越来越低廉、设计编程越来越简化,以及使用起来越来越安全。机器人技术作为20世纪人类最伟大的发明之一,自60年代初问世以来,经历40年的发展已取得长足的进步。工业机器人在经历了诞生——成长——成熟期后,已成为制造业中不可少的核心装备,世界上有约75万台工业机器人正与工人朋友并肩战斗在各条战线上。特种机器人作为机器人家族的后起之秀,由于其用途广泛而大有后来居上之势,仿人形机器人、农业机器人、服务机器人、水下机器人、医疗机器人、军用机器人、娱乐机器人等各种用途的特种机器人纷纷面世,而且正以飞快的速度向实用化迈进。

目前机器人不能很好的与人沟通,理解语言方面容易出现答非所问等情况,在机器人与人沟通时一般仅仅简单的问答形式,如图1所示,人向机器人1发出提问,机器人1通过麦克接收到语音后,进行语音识别,根据识别的内容做出相应的回答,这一回答通过机器人1上的扬声器播放。然而,在这一过程中机器人1的肢体或面部表情没有任何变化,即机器人1并不输出与对话情景相适应的表情/动作,对话过程呆板、枯燥。



技术实现要素:

针对现有技术的缺陷,本发明提供了一种机器人动作方法和系统。

一种机器人动作方法,包括以下步骤:S110:预存储不同对话场景所对应的动作指令;S120:接收语音输入,根据所述语音输入判断当前对话场景;S130:执行至少一条与当前对话场景向对应的动作指令。

可选的,所述步骤S120具体包括:S121:预存代表不同对话场景的场景词句库;S122:接收对话语音;S123:将所述对话语音转换为对话文本;S124:当判定所述场景词句库中存在与所述对话文本相匹配的词句时,将匹配的场景词句所对应的对话场景设置为当前场景。还包括以下步骤:S210:通过云端服务器预存储不同对话场景所对应的动作指令;S220:接收本地语音输入,将本地语音输入发送至所述云端服务器,根据所述语音判断当前对话场景;S230:获取至少一组与当前对话场景向对应的动作数据;S240:将所述动作数据发送至本地机器人,以执行相应动作。所述步骤S130包括:同时随机执行多条与当前对话场景向对应的动作指令。所述步骤S130包括:获取与所述动作指令相对应的动作数据,根据所述动作数据执行相应动作。

一种机器人动作系统,包括以下单元:存储单元,用于预存储不同对话场景所对应的动作指令;接收单元,用于接收语音输入;处理单元,用于根据所述语音输入判断当前对话场景;动作单元,用于执行至少一条与当前对话场景向对应的动作指令。

可选的,所述存储单元,还用于预存代表不同对话场景的场景词句库;接收单元,还用于接收对话语音;处理单元,还用于将所述对话语音转换为对话文本,当判定所述场景词句库中存在与所述对话文本相匹配的词句时,将匹配的场景词句所对应的对话场景设置为当前场景。还包括云端服务器:通过所述云端服务器预存储不同对话场景所对应的动作指令;接收本地语音输入,将本地语音输入发送至所述云端服务器,根据所述语音判断当前对话场景;获取至少一组与当前对话场景向对应的动作数据;将所述动作数据发送至本地机器人,以执行相应动作。

本发明的有益效果是:通过建立不同动作指令与对话场景间的对应关系,在获取到语音输入后,根据场景词库判断当前对话场景,从而可以根据对应关系做出与对话场景相适应的动作。使得人与机器人之间的对话过程变的富有娱乐性,使得机器人变得更加拟人化;通过云端服务器进行数据的处理与存储有利于机器人的小型化。

附图说明

图1为本背景技术示意图;

图2为本发明机器人的外观图;

图3为本发明动作系统的结构示意图;

图4为本发明实施例1的流程图;

图5为步骤S120的流程图;

图6为机器人第一动作示意图;

图7为机器人第二动作示意图;

图8为本发明实施例2的流程图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明,使本发明的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按比例绘制附图,重点在于示出本发明的主旨。

请参阅图2和图3,首先对本发明的系统结构做一概括介绍。本发明中的机器人可以是如图2所示的类人形机器人,其具有可活动的四肢和头部,当然还可以具有显示屏、语音输入/输出装置等等。在图3中,机器人包括有处理单元以及与处理单元相连的接收单元、通信单元、语音单元、动作单元和存储单元,接收单元可以是麦克,其用于接收语音输入;通信单元用于与后续所述的云端服务器进行通信;语音单元可以是扬声器,其用于输入应答语音;动作单元用于接收处理单元的动作数据,根据动作数据驱动机器人上的电机等致动器,从而使得机器人做出相应的动作;存储单元用于存储各类数据。系统也可以进一步包括云端服务器,在后续详细说明中可以明了,云端服务器并非本发明必不可少之部分。机器人可以通过通信单元与云端服务器进行双向通信,通信可以采用有线或无线连接,例如可以采用wifi、3G/4G等,对于通信的具体形式本发明不做限定。

实施例1

本实施例公开了一种机器人动作方法。如图4所示,该方法通过对接收到的语音进行识别,根据识别结果在存储单元中查找与对话场景相适应的动作数据,机器人根据该动作数据在发出语音应答的同时做出相应的动作。

S110:预存储不同对话场景所对应的动作指令。

在本发明中,存储单元中预存储有不同对话场景所对应的动作指令。对话场景可以是例如见面相互问候、欢乐、悲伤、疑问、拒绝等等,针对每一对话场景可以设置不同的动作,与这些动作相对应的指令称为动作指令,其与对话场景共同存储于存储单元内,如表1所示。

表1

在表1中列出了不同对话场景所对应的动作指令,在后续阐述中可以发现机器人会根据这些对话场景所对应的动作指令来做出相应的动作。需要说明的是,每一对话场景可以对应多条动作指令,如表1中“见面”这一对话场景便与“伸出右手”、“微笑”、“向前移动”、“抬起右手”这4条动作指令相对应。

S120:接收语音输入,根据所述语音判断当前对话场景。

参阅图5,在开始人与机器人对话后,机器人通过其上的接收单元接收人的语音输入,获取语音信号(S122),之后处理单元对接收到的语音信号进行语音识别,将其转换为文本格式,即对话文本(S123),根据对话文本内容判断当前对话场景。语音识别技术是一种较为成熟的技术,语音识别的具体方法可以参考相关技术,本发明对其不再赘述。下面重点介绍,如何根据获取到的对话文本判断当前对话场景。

预存代表不同对话场景的场景词句,即建立场景词句库(S121)。所谓场景词句是指一些可以表示当前对话主要内容的词或句子。返回表1,例如对于“见面”这一场景,其表达见面相互问候的词句可以是:“你好”、“hello”、“hi”、“很高见到你”等等。这些场景词句与相应的场景由存储单元进行存储。在获取到对话文本之后,处理单元查询该对话文本中是否存在与场景词句相匹配的词句,当判定存在与场景词句相匹配的词句时,将匹配的场景词句所对应的对话场景设置为当前场景(S124),由此便可以根据所述语音判断当前对话场景。

例如,某人在开始与机器人进行对话时其发出的语音为:你好机器人阿呆!,机器人(阿呆)通过麦克接收到这一语音,处理单元对接收到的语音信号进行语音识别,将其转换为文本:“你好机器人阿呆”。之后,处理单元查询场景词句库中是否存在与“你好机器人阿呆”这一对话文本相匹配的项,通过查询其获取到场景词句库中匹配项为:你好,这一匹配的场景词句“你好”所对应的对话场景为“见面”,则处理单元判定当前对话场景为:见面。

由此可见,步骤S120是通过以下顺序执行的步骤来实现的:S121:预存代表不同对话场景的场景词句库;S122:接收对话语音;S123:将所述对话语音转换为对话文本;S124:当判定所述场景词句库中存在与所述对话文本相匹配的词句时,将匹配的场景词句所对应的对话场景设置为当前场景。

S130:执行至少一条与当前对话场景向对应的动作指令。

在判定出当前场景后,处理单元进一步的获取至少一条与该对话场景相对应的动作指令。接上例,当判定当前对话场景为:“见面”后,处理单元随机在与“见面”这一场景相对应的四条动作指令中选取至少一条来执行动作。例如其选中的动作指令为“抬起右手”,则机器人查询存储单元中的本地数据库,获取与“抬起右手”这一动作相匹配的动作数据。动作数据可以是数组,其包含控制的位置,持续的时间,转动的速率等。控制单元将动作数据发送给动作单元,动作单元根据动作数据控制机器人的马达等致动器来使机器人做出相应动作。如图6中机器人所示,在执行完动作数据后,机器人会抬起右手。在机器人抬起右手的同时语音单元会根据对话文本做出语音回应,例如发出:你好!这一语音。机器人如何根据对话文本做出语音回应其并非本发明的核心所在,在此不再详述。

当然上述过程中机器人仅仅执行了一条动作指令,完成了一个动作。更为优选的是,处理单元可以随机选取多条动作指令,使得机器人同时做出多个动作。例如,当判定当前对话场景为:“见面”后,处理单元随机在与“见面”这一场景相对应的四条动作指令中选取三条:微笑、抬起右手、向前移动。如图7中机器人所示,在执行完动作数据后,机器人会同时抬起右手、微笑并向前移动。

通过以上步骤S110-S130的描述可以看出,本发明通过建立不同动作指令与对话场景间的对应关系,在获取到语音输入后,根据场景词库判断当前对话场景,从而可以根据对应关系做出与对话场景相适应的动作。使得人与机器人之间的对话过程变的富有娱乐性,使得机器人变得更加拟人化。

实施例2

该实施例重点介绍与实施例1的不同之处,相同之处不再赘述。在实施例1中机器人要完成语音识别、场景词库存储、和动作执行等,这需要为机器人设置大容量的存储设备和高效率的处理器,这不利于机器人的小型化。

返回参阅图3,在该实施例中通过云端服务器完成语音识别、场景词句库的存储、动作数据的计算/存储等。机器人中的存储单元仅保存一些机器人运行中的必要基础参数,如电机参数等,而处理单元则主要负责完成与云端服务器间的通信,这样可以降低对于存储单元和处理单元的性能要求,有利于小型化。机器通过麦克风监听语音输入,通过处理音频数据,服务器把解析的结果,文本,场景等内容保存为json数据返回给机器人,机器人通过解析json,获取到场景、回答内容等数据。机器人查询本地数据库,匹配与场景相符合的数据,通过随机算法,提取其中一种动作数据。动作数据是数组,包含控制的位置,持续的时间,转动的速率等,遍历数组,控制机器人马达,按既定的流程执行动作,实现机器人对话聊天时的随机动作的实现。即如图8所示,本实施例包括以下步骤:

S210:通过云端服务器预存储不同对话场景所对应的动作指令;

S220:接收本地语音输入,将本地语音输入发送至所述云端服务器,根据所述语音判断当前对话场景。

S230:获取至少一组与当前对话场景向对应的动作数据;

S240:将所述动作数据发送至本地机器人,以执行相应动作。

实施例3

相应的,本发明还提供了一种机器人动作系统,包括以下单元:存储单元,用于预存储不同对话场景所对应的动作指令;接收单元,用于接收语音输入;处理单元,用于根据所述语音输入判断当前对话场景;动作单元,用于执行至少一条与当前对话场景向对应的动作指令。

其中,所述存储单元,还用于预存代表不同对话场景的场景词句库;接收单元,还用于接收对话语音;处理单元,还用于将所述对话语音转换为对话文本,当判定所述场景词句库中存在与所述对话文本相匹配的词句时,将匹配的场景词句所对应的对话场景设置为当前场景。还包括云端服务器:通过所述云端服务器预存储不同对话场景所对应的动作指令;接收本地语音输入,将本地语音输入发送至所述云端服务器,根据所述语音判断当前对话场景;获取至少一组与当前对话场景向对应的动作数据;将所述动作数据发送至本地机器人,以执行相应动作。所述动作单元,用于同时随机执行多条与当前对话场景向对应的动作指令。获取与所述动作指令相对应的动作数据,根据所述动作数据执行相应动作。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同或相似的部分互相参见即可。对于本申请的方法实施例而言,由于其与装置实施例基本相似,所以描述的比较简单,相关之处参见装置实施例的部分说明即可。

在以上的描述中阐述了很多具体细节以便于充分理解本发明。但是以上描述仅是本发明的较佳实施例而已,本发明能够以很多不同于在此描述的其它方式来实施,因此本发明不受上面公开的具体实施的限制。同时任何熟悉本领域技术人员在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1