一种基于高斯过程的机器人模仿学习方法与流程

文档序号:12459328阅读:753来源:国知局

本发明涉及一种机器人模仿学习方法,具体涉及一种基于高斯过程的机器人模仿学习方法,属于智能产品技术领域。



背景技术:

人类和其他生物能够通过观察和模仿同伴的行为,有效地获得同伴行为的运动方式,并理解这些行为的涵义,赋予机器人像人类一样模仿学习的能力,能够有效地解决机器人运动技能获取的问题,提高机器人的学习效率和自适应能力,是机器人仿生研究的一个重要研究方向;模仿学习的一般学习形式为动作复制,动作复制主要是基于示教者的动作轨迹,通过解决从示教者轨迹到执行动作的回归问题,以决定控制策略,模仿者执行控制策略进行行为再现,实现模仿学习,在模仿学习算法中大多采用逆强化学习算法寻求控制策略,逆强化学习的方法主要是基于模仿者对示教行为进行模仿学习的代价函数,寻求使代价函数最小的控制策略.然而,逆强化学习的方法对代价函数要求较高,不适用于代价函数难以获取的模仿学习任务。



技术实现要素:

(一)要解决的技术问题

为解决上述问题,本发明提出了一种基于高斯过程的机器人模仿学习方法,将高斯过程应用于机器人模仿学习控制策略算法的研究,通过采集示教机器人的示教行为样本点,利用高斯过程算法进行样本点训练,学习示教机器人的感知和行为之间的映射关系,并将此映射关系应用于模仿机器人模仿学习控制策略并加以执行。

(二)技术方案

本发明的基于高斯过程的机器人模仿学习方法,包括以下步骤:

第一步:示教机器人采用Braitenberg车的非交叉连接方式,光传感器输出值与对应的电机输出值成反比例关系,光源位置任意设定,模仿机器人同样采用Braitenberg车的非交叉连接方式,光传感器输出值与对应的电机输出值之间的关系未知,需要通过模仿学习策略给出;

第二步:示教机器人进行动作示范,完成趋光动作,同时随机选取样本点,构成样本点集合,每个样本点包含两个参数;

第三步:用高斯过程的方法对样本点集合进行训练,建立并求解其高斯过程模型,得到示教机器人传感器与电机之间的映射关系;

第四步:模仿机器人将此映射关系应用于自身控制策略,进行模仿示教机器人行为的模仿学习;

第五步:模仿行为分析。

进一步地,所述第二步中的两个参数为光传感器输出值和对应的电机输出值。

(三)有益效果

与现有技术相比,本发明的基于高斯过程的机器人模仿学习方法,将高斯过程应用于机器人模仿学习控制策略算法的研究,通过采集示教机器人的示教行为样本点,利用高斯过程算法进行样本点训练,学习示教机器人的感知和行为之间的映射关系,并将此映射关系应用于模仿机器人模仿学习控制策略并加以执行。

具体实施方式

一种基于高斯过程的机器人模仿学习方法,包括以下步骤:

第一步:示教机器人采用Braitenberg车的非交叉连接方式,光传感器输出值与对应的电机输出值成反比例关系,光源位置任意设定,模仿机器人同样采用Braitenberg车的非交叉连接方式,光传感器输出值与对应的电机输出值之间的关系未知,需要通过模仿学习策略给出;

第二步:示教机器人进行动作示范,完成趋光动作,同时随机选取样本点,构成样本点集合,每个样本点包含两个参数;

第三步:用高斯过程的方法对样本点集合进行训练,建立并求解其高斯过程模型,得到示教机器人传感器与电机之间的映射关系;

第四步:模仿机器人将此映射关系应用于自身控制策略,进行模仿示教机器人行为的模仿学习;

第五步:模仿行为分析。

其中,所述第二步中的两个参数为光传感器输出值和对应的电机输出值。

上面所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的构思和范围进行限定。在不脱离本发明设计构思的前提下,本领域普通人员对本发明的技术方案做出的各种变型和改进,均应落入到本发明的保护范围,本发明请求保护的技术内容,已经全部记载在权利要求书中。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1