一种基于误差训练的神经网络反步控制方法

文档序号:29631915发布日期:2022-04-13 16:09阅读:280来源:国知局
一种基于误差训练的神经网络反步控制方法

1.本发明属于非线性系统的神经网络反步控制方法领域。


背景技术:

2.神经网络反步控制是非线性系统控制中的一种方法,其基本原理是利用神经网络可以以一定误差逼近任意未知函数的特点来估计系统中的未建模动态,在反步法的设计过程中将神经网络的估计值通过负反馈给非线性系统从而减少未建模动态对系统产生的扰动。目前大部分神将网路反步控制采用最终一致有界性以及基于σ调整的神经网络权重更新策略。最终一致有界性是一种定义在无限时间上的稳定性,采用此方法设计的系统收敛速度一般较慢,在一些对于系统状态收敛时间较为严格的控制系统中并不适用。此外,基于σ调整的方法的作用是减少李雅普诺夫函数,而非直接减少神经网络的近似误差,因此其对未建模动态量的补偿能力比较有限。


技术实现要素:

3.针对现有神经网络反步控制方法收敛速度慢以及神经网络不能准确估计未建模动态进而导致系统跟踪误差较大的问题,本发明提供一种基于误差训练的神经网络反步控制方法。
4.本发明的一种基于误差训练的神经网络反步控制方法,所述方法包括:
5.s1、建立含有未建模动态的非线性n阶系统状态空间模型,其中给定的目标信号为yd,状态变量为[x1,...,xn]
t

[0006]
s2、确定误差变量z1和zi,z1=x
1-yd,zi=x
i-α
i-1
,其中,α
i-1
表示虚拟控制函数;
[0007][0008][0009]
其中,i=1,

,n,表示中间变量,gi为非线性n阶系统固有参数,g0=z0=0,μ
i1
、μ
i2
、εi均为常数,且为正数,w
it
si(xi)表示径向基神经网络,wi=[w
i1
,...,w
in
]
t
为神经网络的权重矩阵,si(xi)表示神经网络基函数向量,si(xi)中的每一个基函数都是具有相同的中心和固定的宽度的高斯函数,xi=[x1,...,xi]为神经网络的输入向量,n为神经网络节点的个数;
[0010]
s3、建立误差zi的微分估计器,微分估计器的输入为zi,输出为为的估计;
[0011]
s4、利用s3得到的计算当前径向基神经网络的估计误差,基于估计误差对神经网络的权重进行梯度下降训练,得到
[0012]
s5、根据αn、计算非线性系统的控制输入信号。
[0013]
作为优选,所述s3中,微分估计器为:
[0014][0015]
其中,ψ(y)=(1-e-by
)/(1+e-by
),λ、η、b均为常数,且为正数,ωi为微分估计器的状态量,ψ(y)用来估计符号函数sgn(y),为zi的一阶导数,为ωi的一阶导数,ξ表示微分估计器的估计误差,为ξ的上限。
[0016]
作为优选,s5中,非线性系统的控制输入信号u:
[0017][0018][0019]
作为优选,s1中,含有未建模动态的非线性n阶系统状态空间模型为:
[0020][0021]
其中,fi(
·
)为未知非线性连续函数,代表系统未建模动态,u表示非线性系统的控制输入信号,y表示非线性系统的输出;
[0022]
作为优选,s2中,虚拟控制函数的获取方法包括:
[0023]
利用得到的误差zi设计李雅普诺夫函数v:
[0024][0025]
其导数值为:
[0026][0027]
根据李雅普诺夫函数的导数,选取虚拟控制函数。
[0028]
作为优选,s1中,所述si(xi)的第k个元素sk(xi)表示:
[0029][0030]
其中,exp代表指数函数,bk表示神经网络第k个基函数宽度,ck为神经网络第k个基函数中心向量,ck=[c
1,k
,...,c
n,k
]
t
,其中,c
i,k
为常数。
[0031]
作为优选,所述s4中,利用s3中得到的计算当前径向基神经网络的估计误差,基于估计误差对神经网络的权重进行梯度下降训练,权重wi更新率具体表示为:
[0032][0033]
wn更新率具体表示为:
[0034][0035]
其中,表示权重wi的一阶导数,r为学习率,r》0;与分别为与的估计。
[0036]
作为优选,所述非线性n阶系统为电机转角系统。
[0037]
本发明的有益效果,本发明利用固定时间有界稳定性理论以及基于误差训练神经网络权重的更新策略,相较于传统的自适应神经网络控制方法,使系统具有更短的收敛时间以及更小的跟踪误差。
附图说明
[0038]
图1为本发明方法流程图;
[0039]
图2为本发明方法下,电机转角响应曲线图,横坐标为时间;
[0040]
图3为本发明方法下,神经网络估计与系统未建模动态曲线图,纵坐标为神经网络的估计值,横坐标为时间;
[0041]
图4为本发明方法下,神经网络权重曲线图,纵坐标为神经网络权重,横坐标为时间;
[0042]
图5为本发明方法下,神经网络估计误差曲线图,纵坐标为神经网络估计误差,横坐标为时间;
[0043]
图6为本发明方法下,电机输入转矩信号曲线图,纵坐标为电机输入转矩,横坐标为时间。
具体实施方式
[0044]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0045]
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
[0046]
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
[0047]
本实施方式的基于误差训练的神经网络反步控制方法,包括:
[0048]
步骤一、建立含有未建模动态的非线性n阶系统状态空间模型为:
[0049][0050]
其中,fi(
·
)为未知非线性连续函数,代表系统未建模动态,u表示非线性系统的控制输入信号,y表示非线性系统的输出;给定的目标信号为yd,状态变量为[x1,...,xn]
t

[0051]
步骤二、确定误差变量z1和zi,z1=x
1-yd,zi=x
i-α
i-1
,其中,α
i-1
表示虚拟控制函数;
[0052]
本实施方式的虚拟控制函数是根据固定时间有界稳定性理论设计的,本实施方式
中设计的虚拟控制函数为:
[0053][0054]
其中,i=1,

,n,表示中间变量,gi为非线性n阶系统固有参数,g0=z0=0,μ
i1
、μ
i2
、εi均为常数,且为正数,w
it
si(xi)表示径向基神经网络,wi=[w
i1
,...,w
in
]
t
为神经网络的权重矩阵,si(xi)表示神经网络基函数向量,si(xi)中的每一个基函数都是具有相同的中心和固定的宽度的高斯函数,xi=[x1,...,xi]为神经网络的输入向量,n为神经网络节点的个数;
[0055]
本实施方式中,设计虚拟控制函数的过程为:利用误差变量设计李雅普诺夫函数v;对李雅普诺夫函数对时间求一阶导数根据李雅普诺夫函数的一阶导数,选取虚拟控制函数。
[0056]
本步骤中李雅普诺夫函数v:
[0057]
其导数值为:
[0058]
步骤三中、建立误差zi的微分估计器,微分估计器的输入为zi,输出为为的估计;
[0059]
步骤四、利用步骤三中得到的计算当前径向基神经网络的估计误差,基于估计误差对神经网络的权重进行梯度下降训练,得到
[0060]
步骤五、根据αn、确定固定时间神经网络反步控制器计算非线性系统的控制输入信号。
[0061]
本实施方式固定时间神经网络反步控制器为:
[0062][0063]
其中,u为非线性系统的控制输入信号;μ
n1
,μ
n2
,εn为常数,且为正数,wn=[w
n1
,...,w
nn
]
t
为神经网络的权重矩阵,sn(xn)表示神经网络基函数向量,sn(xn)中的每一个基函数都是具有相同的中心和固定的宽度的高斯函数,xn=[x1,...,xn]为神经网络的输入向量,n为神经网络节点的个数。
[0064]
本实施方式中神经网络基函数向量选取高斯函数,si(xi)的第k个元素sk(xi)表示:
[0065][0066]
其中,exp代表指数函数,bk表示神经网络第k个基函数宽度,ck为神经网络第k个基函数中心向量,ck=[c
1,k
,...,c
n,k
]
t
,其中,c
i,k
,i=1,...,n为常数。
[0067]
本实施方式的步骤我中,利用步骤三中得到的计算当前径向基神经网络的估计误差,基于估计误差对神经网络的权重进行梯度下降训练,权重wi更新率具体表示为:
[0068][0069]
wn更新率具体表示为:
[0070][0071]
其中,表示权重wi的一阶导数,r为学习率,r》0;与分别为与的估计。
[0072]
本实施方式的步骤三中的微分估计器为固定时间收敛的微分估计器,具体为:
[0073][0074]
其中,ψ(y)=(1-e-by
)/(1+e-by
),λ、η、b均为常数,且为正数,ωi为微分估计器的状态量,ψ(y)用来估计符号函数sgn(y),为zi的一阶导数,为ωi的一阶导数,ξ表示微分估计器的估计误差,为ξ的上限。
[0075]
对本实施方式的固定时间有界稳定性证明:
[0076]
将(2)、(3)代入坐标变换,有:
[0077][0078][0079]
其中为0。由(8)(9),神经网络的估计误差可写为
[0080][0081][0082]
对于任意连续函数f(x),存在理想的网络权重w
*
使得假设f为神经网络的待估计函数,如果神经网络权重按
梯度下降算法更新则有因此当我们按照(5)、(6)对网络权重进行更新时,可以得到:
[0083][0084][0085]
将(2)、(3)、(12)、(13)代入得
[0086][0087]
对于任意常数x都存在一个常数ε>0,使得因此有:
[0088][0089]
由均值不等式,有
[0090][0091]
对于xi∈r,i=1,...,n,ι∈[0,1],有(|x1|+...+|xn|)i≤(|x1|)i+...+(|xn|)i以及(|x1|+...+|xn|)2≤[(|x1|)2+...+(|xn|)2]/n,根据(14)(15)(16),有
[0092][0093]
其中μ1=min{μ
11
,...,μ
n1
},μ2=min{μ
12
,...,μ
n2
}/n,根据固定时间有界稳定性理论,此时系统满足
[0094][0095]
其中是一个常数,系统的跟踪误差会在一个固定时间ts收敛到原点附近的小邻域内,ts的值为:
[0096][0097]
证毕。
[0098]
实施例1:
[0099]
考虑如下电机转角系统:
[0100][0101]
其中,x1(单位rad)为电机转角系统的输出转角,x2(单位rad/s)为电机转角角速度。j(单位n
·
m2)为系统转动惯量,系统输入u(单位n
·
m)为输入转矩。
[0102]
取系统的初始值为x1(0)=0,x2(0)=0,常数j=20。为了演示仿真,假设系统未建模动态为该函数不能直接用于设计系统控制输入u。系统目标信号设为yd(t)=0.1。
[0103]
虚拟控制函数(4)与系统控制输入函数(5)中的参数取为μ
11
=15,μ
12
=20,ε1=0.4,μ
21
=150,μ
22
=3,ε2=0.01。(6)中神经网络含有12个节点,基函数中心向量元素都为0,宽度都为0.5,权重初始值都为0。微分估计器(7),(8)中参数取为λ=10,η=10,b=1。基于误差训练的更新策略(11)中的参数取为r=0.0002。系统采样间隔时间为0.001秒。
[0104]
采用图1的方式进行控制,图2给出了在本发明方法作用下电机转角响应曲线;图3为本发明方法下,神经网络的估计值曲线图;图4为本发明方法下,神经网络权重更新曲线图;图5为本发明方法下,神经网络估计误差曲线图;图6为本发明方法下,电机输入转矩曲线图。
[0105]
结论一:从图2可以得出本发明方法下系统的收敛速度较快且系统的跟踪误差较小。
[0106]
结论二:从图3-5可以看出,在本发明方法下神经网络可以较好地根据误差来调整网络权重,从而较为准确地估计系统中的未建模动态,使得系统具有较小的跟踪误差。
[0107]
虽然在本文中参照了特定的实施方式来描述本发明,但是应该理解的是,这些实施例仅仅是本发明的原理和应用的示例。因此应该理解的是,可以对示例性的实施例进行许多修改,并且可以设计出其他的布置,只要不偏离所附权利要求所限定的本发明的精神和范围。应该理解的是,可以通过不同于原始权利要求所描述的方式来结合不同的从属权利要求和本文中所述的特征。还可以理解的是,结合单独实施例所描述的特征可以使用在其他所述实施例中。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1