机械学习装置及方法、机器人控制装置、机器人系统与流程

文档序号:11119832阅读:来源:国知局

技术特征:

1.一种人与机器人协作来进行作业的机器人的机械学习装置,其特征在于,具备:

状态观测部,其在上述人与上述机器人协作来进行作业的期间,观测表示上述机器人的状态的状态变量;

判定数据取得部,其取得与上述人的负担度以及作业效率中的至少一方相关的判定数据;以及

学习部,其根据上述状态变量以及上述判定数据,学习用于设定上述机器人的行为的训练数据集。

2.根据权利要求1所述的机械学习装置,其特征在于,

上述状态变量包括上述机器人的位置、姿势、速度以及加速度中的至少一个。

3.根据权利要求1或2所述的机械学习装置,其特征在于,

上述判定数据包括上述机器人感知的负荷的大小或方向、上述机器人的周围感知的负荷的大小或方向、上述机器人的周围的负担度以及上述机器人的移动时间中的至少一个。

4.根据权利要求1至3中任一项所述的机械学习装置,其特征在于,

上述训练数据集包括针对上述机器人的每个状态以及上述机器人的每个行为设定的表示上述机器人的行为的价值的行为价值变量,

上述学习部包括:

回报计算部,其根据上述判定数据以及上述状态变量设定回报;以及

函数更新部,其根据上述回报以及上述状态变量,更新上述行为价值变量。

5.根据权利要求4所述的机械学习装置,其特征在于,

上述机器人的加速度的绝对值越小,上述回报计算部设定越大的回报,上述机器人的移动时间越短,上述回报计算部设定越大的回报。

6.根据权利要求1至3中任一项所述的机械学习装置,其特征在于,

上述训练数据集包括针对上述机器人的每个状态以及上述机器人的每个行为设定的上述机器人的学习模型,

上述学习部包括:

误差计算部,其根据上述判定数据、上述状态变量以及所输入的教师数据,计算上述学习模型的误差;以及

学习模型更新部,其根据上述误差以及上述状态变量,更新上述学习模型。

7.根据权利要求1至6中任一项所述的机械学习装置,其特征在于,

该机械学习装置还具备:人判别部,其判别与上述机器人协作来进行作业的人,

针对每个人生成上述训练数据集,

上述学习部学习所判别出的人的上述训练数据集。

8.根据权利要求1至7中任一项所述的机械学习装置,其特征在于,

上述机械学习装置具备神经网络。

9.根据权利要求1至8中任一项所述的机械学习装置,其特征在于,

上述机器人为工业机器人、场地机器人或服务机器人。

10.一种机器人控制装置,其特征在于,具备:权利要求1至9中任一项所述的机械学习装置;以及

行为控制部,其控制上述机器人的行为,

上述机械学习装置包括:意图决定部,其根据上述训练数据集设定上述机器人的行为,

上述行为控制部根据来自上述意图决定部的指令控制上述机器人的行为。

11.一种机器人系统,其特征在于,具备:

权利要求10所述的机器人控制装置;

辅助人的作业的机器人;以及

安装在上述机器人上的末端执行器。

12.根据权利要求11所述的机器人系统,其特征在于,

上述机器人包括:

力检测器,其输出与来自上述人的力对应的信号;以及

状态检测器,其检测上述机器人的位置以及姿势,

上述判定数据取得部根据上述力检测器的输出取得上述判定数据,

上述状态观测部根据上述状态检测器的输出取得上述状态变量。

13.根据权利要求12所述的机器人系统,其特征在于,

上述状态检测器包括人感传感器、压力传感器、电动机的转矩传感器以及接触传感器中的至少一个。

14.根据权利要求12或13所述的机器人系统,其特征在于,

该机器人系统具备:

多个机器人;

多个机器人控制装置;以及

相互连接多个上述机器人控制装置的通信线,

多个上述机器人控制装置中的各个机器人控制装置个别地学习进行控制的机器人的上述训练数据集,经由通信线发送所学习到的信息来共享该信息。

15.一种人与机器人协作来进行作业的机器人的机械学习方法,其特征在于,包括如下步骤:

在上述人与上述机器人协作来进行作业的期间,观测表示上述机器人的状态的状态变量的步骤;

取得与上述人的负担度以及作业效率中的至少一方相关的判定数据的步骤;以及

根据上述状态变量以及上述判定数据,学习用于设定上述机器人的行为的训练数据集的步骤。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1