一种基于自适应最优化方法的机器人导纳控制系统与流程

文档序号:14834702发布日期:2018-06-30 11:54阅读:1013来源:国知局
一种基于自适应最优化方法的机器人导纳控制系统与流程

本发明涉及机器人与未知环境交互控制领域,尤其涉及一种基于自适应最优化方法的机器人导纳控制系统。



背景技术:

在人工智能的大环境下,机器人技术的发展对科技的进步有重要的影响。在人工智能的相关产业,如工业生产、军事、医疗、娱乐等行业,对机器人在更广泛、复杂的工作场景中的应用提出了更高的要求。机器人在完成任务过程中需要与外部环境进行交互,随着机器人技术的发展和对自主性要求的不断提高,机器人在未知环境下的交互控制得到了更多的关注。

目前,针对机器人与外部环境交互控制的研究主要有以下方法:(1) 基于阻抗控制的方法,利用机器人阻抗模型,建立外力与机器人位置的关系,设计控制器调节机械阻抗。 (2)基于导纳控制的方法,利用机械人的导纳模型,建立外力与机器人位置的关系,根据机器人受到的外力,不断调节机器人的参考轨迹,使机器人尽管在外力的作用下也能达到良好的交互效果。



技术实现要素:

为了克服现有技术存在的缺点与不足,本发明提供一种基于自适应最优化方法的机器人导纳控制系统。利用状态空间观测器得到外部施加在机械臂末端力矩的估计值,利用自适应最优控制方法得到最优导纳模型,将外力的估计值输入到导纳模型中得到一条适应于外部力矩的修正参考轨迹,最后通过自适应神经网络控制器达到满意的控制效果。

为解决上述技术问题,本发明提供如下技术方案:基于自适应最优化方法的机器人导纳控制系统,包括如下步骤:

S1、根据广义动量方法和机械臂动态方程,构建状态空间力观测器;

S2、利用自适应最优控制方法,得到适应于外部力矩的最优导纳模型并将观测到力矩的数值输入到导纳模型中,得到适应于外力矩的修正后参考轨迹;

S3、设计自适应神经网络控制器使机械臂实际运动轨迹可以很好地跟踪修正后的参考轨迹;

进一步地,所述步骤S1中n连杆机械臂的动力学方程为

其中,,系统的惯性矩阵、科氏力矩阵和重力项。、 分别表示加速度、速度和关节角向量。,。

进一步地,机械臂的广义动量表示为

进一步地,动量的一阶微分方程为

进一步地,定义外部力矩的模型

其中,

进一步地,构建状态空间观测器

=

y=

其中.

进一步地,所述步骤S2具体为:

S21、一般情况下,可以将外部环境看作一个一阶或者二阶弹簧-阻尼系统;

S22、在关节空间中,机械臂的导纳模型为

S23、考虑一个连续线性系统表示为

定义:

其中,A和B未知。

S24、利用自适应最优控制算法,在A,B未知的情况下得到最优输入;首先假设一个可以使系统稳定的增益方程得到一个正定矩阵,循环计算K+1→K,当可以得到反馈增益矩阵。

进一步地,所述步骤S3具体为:

S31、神经网络的函数模型的表达式如下:

+b

其中,输入数据的特征向量,是权重列向量,是偏置向量,基是函数;

S32、定义跟踪误差:

其中,q-,

S33、基于神经网络的自适应控制器为

采用上述技术方案后,本发明至少具有如下有益效果:

(1)、本发明方法基于状态空间观测器与自适应最优控制的方法相融合,能够克服在实际控制系统中由于添加力传感器带来的不便;通过自适应最优控制的方法可以获得机械臂最优的导纳模型,进而通过修正机械臂运动轨迹来满足机械臂与未知环境交互控制的要求。

(2)、本发明基于自适应神经网络控制,利用径向基函数(RBF)神经网络的逼近能力来估计控制系统中的未知项,提升了由于控制系统中由于模型不确定性带来的控制精度丢失的问题;同时使得控制器满足实时性的要求。

附图说明

图1是本发明基于状态空间力观测器的示意图;

图2是本发明基于自适应最优控制的算法步骤流程图;

图3是本发明基于自适应最优化方法的机器人导纳控制系统的系统结构图;

具体实施方式

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图对本申请作进一步详细说明。

步骤S1如图1所示,为本实例基于状态空间观测器的示意图,基于广义动量的方法,利用线性系统的理论构建状态空间方程,具体过程如下:

S11、在关节空间中,n连杆机械臂的动态方程为:

其中,,系统的惯性矩阵、科氏力矩阵和重力项。、 分别表示加速度、速度和关节角向量。,。

S12、在关节空间下,机械臂的动量可以定义为

S13、施加于机械臂末端外部力矩模型为

=+

S14、将上式写成状态方程形式

S15、由于是一个可观测的向量,可设计一个带观测器的系统,定义状态变量,则系统的状态空间方程为

=

y=

其中.

步骤S2 自适应最优控制算法,根据系统组输入机械臂与外界环境的交互力和由在线学习的方法得出的最优导纳模型,可以得出修正后的参考轨迹作为系统的内环输入,具体步骤如下

S21、机械臂的参考轨迹可以由操作者根据具体任务的需要设定,在不失一般性的情况下,外界环境的模型可以定义为;

其中,和。

S22、其次,在关节空间上,机械臂的导纳模型为

=-

当观测到机械臂与外界交互力时,系统的内环输入当为非零向量的时候,内环输入将会是修正后的轨迹。

S23、将环境模型写成状态空间的形式;

并定义

其中

,B=。在该算法中A与B均未知。

S25、将作为系统的输入,利用在线学习的方法,得到状态空间的最优输入;

其中是利用在线学习的方法得到的系统最优增益,,此输入可以减少代价函数

V=

其中代价函数是整个交互控制的目标,它的定义是为了衡量控制系统的交互控制效果,代价函数越小,表明交互控制的效果最好;Q和R是权重矩阵。

S26、定义系统的初始输入为

其中,为初始增益,是噪声。定义

其中是积分数,,通过计算

=

通过求解齐次方程得到,

定义

其中。

最后,K+1→K,重复上述步骤,直到,得到

步骤S3、设计基于神经网络的自适应控制器,主要是为了确保一个很好的轨迹跟踪效果;

S31、首先为了减少由于模型不确定给控制器带来的负面影响,引入神经网络来估计未知模型,表达式如下:

+b

其中,输入数据的特征向量,是权重列向量,是偏置向量,是基函数。本实例中我们引入RBF(径向基函数)神经网络,原因是RBFNN的结构简单,训练速度快,可以很好的满足实时控制的需要。

S32、定义跟踪误差函数变量:

其中,q-,

S33、设计带补偿项的神经网络控制输入

其中,估计项

+

+

+

如图3所示,为本实例一种无需力传感器的机器人最优交互控制方法整体系统的示意图。本发明基于力观测器,通过自适应最优控制得出的导纳模型。首先力观测器估计出机械臂受到来自环境的外力,通过自适应最优控制得到一个最优的导纳模型,再由此导纳模型产生出一条可以很好适应于外力的修成参考轨迹,最后通过自适应神经网络控制器来使得机械臂可以很好的跟踪系统内环输入,通过这种控制方法使代价函数达到一个最小值,最终达到良好的交互效果。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解的是,在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种等效的变化、修改、替换和变型,本发明的范围由所附权利要求及其等同范围限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1