带有自适应摩擦补偿的倒立摆系统神经网络跟踪控制方法与流程

文档序号:19744065发布日期:2020-01-21 18:00阅读:450来源:国知局
带有自适应摩擦补偿的倒立摆系统神经网络跟踪控制方法与流程

本发明涉及非线性系统控制领域,尤其涉及一种带有自适应摩擦补偿的倒立摆系统神经网络跟踪控制方法。



背景技术:

近几十年来,非线性输出调节理论得到了控制界的广泛关注,其显著的优点在于能够实现轨迹跟踪、干扰抑制和鲁棒性等多种控制目标。常用的控制策略包括前馈控制和内模控制。倒立摆系统是一个非线性、强耦合、多变量和自然不稳定的系统,已经成为检验各种先进控制理论的基准系统,其位置跟踪控制问题可以被描述成一个离散时间非线性伺服控制问题。尽管一些文献采用多项式逼近方法和神经网络逼近方法解决了倒立摆系统的位置跟踪控制问题,但摩擦模型只包含黏性摩擦,并且只提供了仿真结果,这在实际应用中会受到很大的限制。

另一方面,摩擦力在机械系统中普遍存在,对于要求高精度跟踪性能的控制系统是不可忽视的。在没有正确的补偿作用下摩擦力可能会造成明显的跟踪误差。因此摩擦补偿是运动控制中一个重要的目标。常用的方法是使用额外的控制力来抵消摩擦力的影响。由于摩擦力的复杂性,常常表现出不可预测的特性,因此摩擦力估计是一项具有挑战性的问题。



技术实现要素:

基于背景技术存在的技术问题,本发明提出了一种带有自适应摩擦补偿的倒立摆系统神经网络跟踪控制方法。针对倒立摆系统,首先在不考虑摩擦的情况下,基于离散时间非线性输出调节理论设计神经网络控制器实现位置跟踪;然后设计自适应摩擦补偿器克服摩擦力对跟踪性能的影响。

本发明采用的技术方案是:

带有自适应摩擦补偿的倒立摆系统神经网络跟踪控制方法,其特征在于,包括以下步骤:

步骤1,建立倒立摆系统的离散时间模型;

步骤2,将倒立摆系统的位置跟踪控制问题描述为一个离散时间非线性伺服控制问题;

步骤3,在不考虑摩擦的情况下,基于离散时间非线性输出调节理论,设计神经网络控制器;

步骤4,设计自适应摩擦补偿器;

步骤5,将神经网络控制器和自适应摩擦补偿器结合即为最终的控制器。

进一步地,所述的带有自适应摩擦补偿的倒立摆系统神经网络跟踪控制方法,其特征在于,步骤1中,所述倒立摆系统的离散时间模型描述如下:

x1(k+1)=x1(k)+tx2(k+1)

x3(k+1)=x3(k)+tx4(k)

y(k)=x1(k)

(1)

其中,表示小车的位置和速度,mc表示小车的质量,表示摆杆与垂线之间的角度以及其角速度,u表示控制力,lr表示从质心到摆杆底部的长度,mr表示均匀摆杆的质量,ir表示摆杆的转动惯量,y表示系统的输出。

进一步地,所述的带有自适应摩擦补偿的倒立摆系统神经网络跟踪控制方法,其特征在于,步骤2中,将倒立摆系统的位置跟踪控制问题描述为一个离散时间非线性伺服控制问题,其过程如下:

2.1,假设倒立摆系统的位置参考轨迹为一个正弦信号yd(k)=asinωkt,此位置参考轨迹可由如下形式的外部系统产生:

其输出为yd(k)=v1(k);

2.2,定义跟踪误差为

e(k)=x1(k)-v1(k)(3)

2.3,倒立摆系统(1)和外部系统(2)可以被写为如系统(4)的紧凑形式。此时倒立摆系统的位置跟踪控制问题已被描述为一个离散时间非线性伺服控制问题,其控制目标是在保证闭环系统稳定的前提下使得稳态跟踪误差足够小;

其中,x(k)=(x1(k),x2(k),x3(k),x4(k))·,h(x(k),u(k),v(k))=x1(k)-v1(k),

进一步地,所述的带有自适应摩擦补偿的倒立摆系统神经网络跟踪控制方法,其特征在于,步骤3,在不考虑摩擦的情况下,基于离散时间非线性输出调节理论,设计神经网络控制器,过程如下:

3.1,求系统的雅克比矩阵如下:

可以证明是可镇定的,并且存在矩阵k,使得的特征值都在单位圆内;

3.2,求解离散调节器方程,过程如下:

离散调节器方程具有如下形式:

通过计算可以得到离散调节器方程的部分解如下:

其中e是单位矩阵。令χ(v)=col(x3(v),x4(v))。则χ(v)满足如下方程:

其中

χ=col(x3,x4)

3.3,用前馈神经网络函数求χ(v)的近似解,过程如下:

由于χ(v)的精确解不可得,所以通过以下的前馈神经网络函数可以找到χ(v)的近似解

其中,ψ(λ)=(1-e)/(1+e),权值向量w是由实数组成,其中n=1,…,n,m=1,2;

令χ(w,v)=col(x3(w,v),x4(w,v))。根据通用近似定理,给定ε>0和包含原点的紧集由于χ(v)是充分光滑的,存在n,w满足

下面通过参数优化方法寻找一组合适的权值向量w;令

j(w,v)=0.5f12(w,v)+0.5f22(w,v)(11)

为了使足够小,构造了一个新目标函数:

其中为γ中的一个稠密有限集;合适的权值向量可以通过下面的权值更新律得到

其中,ρj为训练步长,初始权值w0为一组随机生成的向量;根据离线训练所得的权值,可以计算出x3(v),x4(v)的近似值;

3.4,设计神经网络控制器如下:

其中

进一步地,所述的带有自适应摩擦补偿的倒立摆系统神经网络跟踪控制方法,其特征在于,步骤4中,设计自适应摩擦补偿器,具体为:

4.1,以上的设计考虑的仅仅是在理想情况下即无摩擦力影响,

实际中小车常常受到摩擦力的影响,通常包括静摩擦、库伦摩擦和黏性摩擦,模型如下:

ff(k)=fc(k)sign(vc(k))+bvc(k)(15)

其中fc(k)≥0是时变的摩擦参数,表示静摩擦和库伦摩擦总和的大小,b≥0为黏性摩擦力参数,vc=x2为速度;

4.2,为了消除摩擦力的影响,补偿器的形式定义如下:

其中是fc(k)的估计量,是b的估计量;

4.3,设计更新律:为了确定采用如下的更新律:

其中p1,p2,λ∈r+为用户定义的可调的参数。

进一步地,所述的带有自适应摩擦补偿的倒立摆系统神经网络跟踪控制方法,其特征在于,步骤5所述最终的控制器为:

本发明的优点是:

本发明提出的带自适应摩擦补偿的神经网络跟踪控制方法,解决了实际控制中摩擦力严重影响跟踪性能的问题,具有较高精度的位置跟踪性能。此外,本发明提出的自适应摩擦补偿器无需对设备的摩擦力进行离线辨识,易于实现。

附图说明

图1为带有自适应摩擦补偿的神经网络控制方法框图。

图2为实验装置控制原理图。

图3为位置信号跟踪效果图。

图4位置信号跟踪误差图。

图5为控制器输出图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。

实施例。

带有自适应摩擦补偿的倒立摆系统神经网络跟踪控制方法,包含以下步骤:

步骤1,建立倒立摆系统的离散时间模型,所述倒立摆系统的离散时间模型描述如下:

x1(k+1)=x1(k)+tx2(k+1)

x3(k+1)=x3(k)+tx4(k)

y(k)=x1(k)

(1)

其中,表示小车的位置和速度,mc表示小车的质量,表示摆杆与垂线之间的角度以及其角速度,u表示控制力,lr表示从质心到摆杆底部的长度,mr表示均匀摆杆的质量,ir表示摆杆的转动惯量,y表示系统的输出。

步骤2,将倒立摆系统的位置跟踪控制问题描述为一个离散时间非线性伺服控制问题,过程如下:

2.1,假设倒立摆系统的位置参考轨迹为一个正弦信号yd(k)=asinωkt,此位置参考轨迹可由如下形式的外部系统产生:

其输出为yd(k)=v1(k)。

2.2,定义跟踪误差为

e(k)=x1(k)-v1(k)(3)

2.3,倒立摆系统(1)和外部系统(2)可以被写为如系统(4)的紧凑形式。此时倒立摆系统的位置跟踪控制问题已被描述为一个离散时间非线性伺服控制问题,其控制目标是在保证闭环系统稳定的前提下使得稳态跟踪误差足够小;

其中,x(k)=(x1(k),x2(k),x3(k),x4(k))·,h(x(k),u(k),v(k))=x1(k)-v1(k),

步骤3,在不考虑摩擦的情况下,基于离散时间非线性输出调节理论,设计神经网络控制器,过程如下:

3.1,求系统的雅克比矩阵如下:

可以证明是可镇定的,并且存在矩阵k,使得的特征值都在单位圆内。

3.2,求解离散调节器方程,过程如下:

离散调节器方程具有如下形式:

通过计算可以得到离散调节器方程的部分解如下:

其中e是单位矩阵。令χ(v)=col(x3(v),x4(v))。则χ(v)满足如下方程:

其中

χ=col(x3,x4)

3.3,用前馈神经网络函数求χ(v)的近似解,过程如下:

由于χ(v)的精确解不可得,所以通过以下的前馈神经网络函数可以找到χ(v)的近似解

其中,ψ(λ)=(1-e)/(1+e),权值向量w是由实数组成,其中n=1,…,n,m=1,2。

令χ(w,v)=col(x3(w,v),x4(w,v))。根据通用近似定理,给定ε>0和包含原点的紧集由于χ(v)是充分光滑的,存在n,w满足

下面通过参数优化方法寻找一组合适的权值向量w。令

j(w,v)=0.5f12(w,v)+0.5f22(w,v)(11)

为了使足够小,构造了一个新目标函数:

其中为γ中的一个稠密有限集。合适的权值向量可以通过下面的权值更新律得到

其中,ρj为训练步长,初始权值w0为一组随机生成的向量。根据离线训练所得的权值,可以计算出x3(v),x4(v)的近似值。

3.4,设计神经网络控制器如下:

其中

步骤4,设计自适应摩擦补偿器:

4.1,以上的设计考虑的仅仅是在理想情况下即无摩擦力影响。

实际中小车常常受到摩擦力的影响,通常包括静摩擦、库伦摩擦和黏性摩擦,模型如下:

ff(k)=fc(k)sign(vc(k))+bvc(k)(15)

其中fc(k)≥0是时变的摩擦参数,表示静摩擦和库伦摩擦总和的大小,b≥0为黏性摩擦力参数,vc=x2为速度。

4.2,为了消除摩擦力的影响,补偿器的形式定义如下:

其中是fc(k)的估计量,是b的估计量。

4.3,设计更新律。为了确定采用如下的更新律:

其中p1,p2,λ∈r+为用户定义的可调的参数。

步骤5,将神经网络控制器和自适应摩擦补偿器结合即为最终的控制器:

图1为带有自适应摩擦补偿的神经网络控制方法的原理框图。为了验证所提方法的有效性,本发明对带有自适应摩擦补偿的神经网络控制器(19)的控制效果进行实验验证。实验设备的硬件原理图如图2所示。实验设备的具体参数如下:

小车质量mc=1.29kg,摆杆质量mr=0.075kg,1/2摆杆长度lr=0.175kg,转动惯量采样时间t=0.005s。

控制器参数设置为:

k=[38.921726.188587.211413.3724],λ=10,p1=5,p2=10,

通过计算机训练所得,训练的参数设置为:

n=25,γ={v∈r2|||v||≤0.12},ω=2.5π,

本实施例跟踪轨迹为0.06sin(2.5πkt)m的正弦参考信号。图3是倒立摆系统的位置跟踪实验效果图,图4是位置跟踪误差图,图5为控制器(19)输出图。从图3-图4的实验结果可以看出:在带自适应摩擦补偿的神经网络控制器的作用下,能够有效的抑制摩擦力的干扰,并快速地跟踪位置参考信号。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1