一种三轴云台伺服电机的神经网络与自抗扰的复合控制方法与流程

文档序号:17428297发布日期:2019-04-17 03:09阅读:344来源:国知局
一种三轴云台伺服电机的神经网络与自抗扰的复合控制方法与流程

本发明涉及三轴云台伺服电机控制技术领域,具体涉及一种将rbf神经网络与自抗扰控制器(activedisturbancerejectioncontrol,简称adrc)相结合,构成rbf神经网络自抗扰监督控制的方法,尤其是一种三轴云台伺服电机的神经网络与自抗扰的复合控制方法。



背景技术:

对于三轴云台,如何设计良好的稳定控制方法来抵消外界晃动,从而有效克服因镜头晃动而造成的图像模糊问题,对获取高质量的影像具有重要的意义。三轴云台在空间结构上主要由外框、中框、内框组成结构,而且外框、中框、内框互相独立、互相垂直,具有三个方向的自由度。假设机载云台是刚体,忽略离心力和科氏力,三轴云台整体可视为一个三轴伺服系统,且三个轴的工作原理基本相同。由于伺服系统中的摩擦现象是客观存在的,云台伺服电机在低速运行时会有较强的摩擦现象,这时的被控对象就具有非线性特性,传统的pid控制难以达到高精度控制效果。



技术实现要素:

本发明的目的是针对现有技术的不足,而提供一种三轴云台伺服电机的神经网络与自抗扰的复合控制方法。这种方法能在非线性系统上实现更好响应速度和控制精度,不仅可以确保控制系统的稳定性和鲁棒性,神经网络的引入能提高系统的自适应能力,在满足控制性能的要求下,该方法能适应的被控对象范围更大。

实现本发明目的的技术方案是:

一种三轴云台伺服电机的神经网络与自抗扰的复合控制方法,与现有技术不同处在于,包括如下步骤:

1)建立含stribeck摩擦模型的三轴云台内框伺服系统动力学方程:

忽略电枢电感,所述动力学方程如公式(1)所示:

令x1(t)=θ(t),可将上式转换为如公式(2)的状态方程:

公式(1)、公式(2)中,u(t)为控制输入,ku为pwm功率放大器放大系数,r为电枢电阻,km为电机力矩系数,ce为电压反馈系数,j为等效到伺服电机转轴上的总的转动惯量,θ(t)为转角,为转速,为角加速度,ff(t)为典型的stribeck摩擦模型,stribeck摩擦模型表明在不同的摩擦阶段,摩擦力矩与速度之间的关系,表述如下:

时,ff(t)为公式(3):

时,ff(t)为公式(4):

因此,计算公式(2)式时,根据条件分别采用公式(3)式或公式(4)式进行计算,其中,公式(3)、公式(4)中fm为最大静摩擦力,fc为库仑摩擦力,kv为黏性摩擦力矩比例系数,α和α1是正值常数,f(t)为驱动力,即u(t);2)针对步骤1)所建立的动力学方程设计自抗扰控制器:其过包括:

(1)二阶离散形式的跟踪-微分器方程设计:

跟踪-微分器即td的二阶离散形式如公式(5)所示:

fhan(·)是公式(5)的最速控制综合函数,具体算法如公式(6)所示:

其中,θd(k)是第k时刻的指令信号,x1=θ′d是指令的跟踪值,是指令的近似微分,h为采样周期,r为决定跟踪快慢的速度因子,d、d0、y、a0、a均为中间变量;

(2)三阶离散扩张状态观测器的方程设计:

扩张状态观测器即eso的三阶离散形式如公式(7)所示:

其中z1是输出信号的估计,z2是输出信号微分的估计,z3是总扰动的估计,θ(k)是第k时刻的输出信号,up是自抗扰控制器的输出信号,α1取0.5,α2取0.25,σ1取0.0025,β01、β02、β03是eso需要整定的参数,在设计过程中根据公式(1)式将视为已建模的确知部分并放入扩张观测器中,能够减轻获观测器负担,起到模型辅助的作用,这样能够使eso获得更好的观测效果,其中fal(·)为公式(8)所示:

(3)非线性状态误差反馈控制律设计:

非线性状态误差反馈控制律即nlsef设计如公式(9)所示:

经过扰动补偿和模型补偿得到自抗扰控制器的输出信号up如公式(10)所示:

其中,α3、α4的取值为0<α3<1<α4,δ2可取5h≤δ2≤10h,β1和β2是非线性状态误差反馈控制律需要整定的两个控制参数,类似于pd控制中的kp、kd;

3)设计rbf神经网络与自抗扰控制器相结合,构成rbf神经网络自抗扰监督控制器:在rbf网络结构设计中,取x=[x1,x2]t为网络的输入,设rbf网络的高斯基函数的宽度向量为b=[b1,b2,…,bj,…bm]t,径向基向量为h=[h1,h2,…,hj,…,hm]t,其中hj为隐含层第j个神经元的输出,即如公式(11)所示:

公式(11)中,bj为隐含层节点j的基宽参数且bj>0,cj为隐含层的的第j个节点的中心向量,网络输出层的权向量为公式(12):

w=[w1,w2,…,wj,…,wm]t(j=1,2,…,m)(12),

rbf网络的输出为公式(13):

un(k)=w1h1+w2h2+…+wjhj…+wmhm(13),

以上各公式中,m为rbf网络隐含层的神经元个数,设计控制律为公式(14)所示:

u(k)=up(k)+un(k)(14),

公式(14)中,up(k)是自抗扰控制器在第k时刻的输出信号,设神经网络的性能指标函数为公式(15):

采用梯度下降法调整网络的权值为公式(16):

神经网络的权值调整过程如公式(17):

wj(k)=wj(k-1)+δwj(k)+α(wj(k-1)-wj(k-2))(17),

公式(16)、(17)式中,η为学习速率,α是动量因子。

本技术方案与现有技术相比具有以下优点:

adrc具有如下特征:adrc可以不依赖于系统的精确模型,将内扰和外扰都视为总扰动,通过扩张观测器对总扰动进行实时估计和补偿,将模型不确定因素观测出来,从而补偿摩擦环节等产生的干扰,克服了非线性特性对控制精度的影响,提高了控制精度;由于adrc在td里事先安排了过渡过程,在提高系统响应快速性下还能同时保证具有较小的超调量;误差反馈的非线性组合具有比pid线性反馈更高的效率,能在非线性系统上实现更好响应速度和控制精度。

rbf神经网络在本质上是非线性系统,可以实现任意逼近精度的非线性映射,利用rbf神经网络对adrc的特征进行学习,调整网络输出,使adrc的输出up趋于零,从而取代adrc的控制地位。一旦出现扰动,自抗控制器又将重新起作用。在自抗扰控制器完全被rbf神经网络取代时,神经网络建立的是被控对象的逆模型,起到前馈控制的作用,故这种前馈加反馈的监督控制方法,不仅可以确保控制系统的稳定性和鲁棒性,而且可以有效的提高系统的精度和自适应能力。

假定系统采用直流电机作为机执行机构,在忽略电枢电感情况下,设计电流环和速度环为开环,将位置环设计为闭环,由于引入了自抗扰控制可以对摩擦环节和不确定因素进行观测补偿,相对于传统pid控制方法,本技术方案方法能取得较好的控制效果,在满足控制性能的要求下,神经网络的引入能提高系统系统的自适应能力,故本技术方案方法能适应的被控对象范围更大。

附图说明

图1为实施例中的三轴云台控制策略原理框图;

图2为实施例中的rbf神经网络自抗扰监督控制器结构示意图;

图3为实施例中的rbf神经网络结构示意图;

图4为实施例中pid控制带摩擦时伺服系统位置跟踪信号仿真波形示意图;

图5为实施例中控制带摩擦时伺服系统位置跟踪信号仿真波形示意图;

图6为实施例中rbf神经网络、adrc、总控制器输出仿真波形示意图;

图7为实施例中和pid控制带摩擦时伺服系统单位阶跃响应对比仿真波形示意图。

具体实施方式

下面结合附图和实施例对本发明内容作进一步的阐述,但不是对本发明的的限定。

实施例:

本实施例中的三轴云台控制策略原理框图如图1所示,偏航轴、翻滚轴和俯仰轴的伺服电机采用直流电机作为机执行构,电机输出轴直接与框架相连,其中俯仰轴与内框相连,翻滚轴与中框相连,偏航轴与外框相连。内框的稳定性对成像质量的影响最大,本实施例中以内框控制为例,各轴和框架均采用本实施例方法控制。

一种三轴云台伺服电机的神经网络与自抗扰的复合控制方法,包括如下步骤:

1)建立含stribeck摩擦模型的三轴云台内框伺服系统动力学方程:

设此时的θ代表俯仰角,忽略电枢电感,所述动力学方程如公式(1)所示:

令x1(t)=θ(t),可将上式转换为如公式(2)的状态方程:

公式(1)、公式(2)中,u(t)为控制输入,ku为pwm功率放大器放大系数,r为电枢电阻,km为电机力矩系数,ce为电压反馈系数,j为等效到伺服电机转轴上的总的转动惯量,θ(t)为转角,为转速,为角加速度,ff(t)为典型的stribeck摩擦模型,stribeck摩擦模型表明在不同的摩擦阶段,摩擦力矩与速度之间的关系,表述如下:

时,ff(t)为公式(,3):

时,ff(t)为公式(4):

因此,计算公式(2)式时,根据条件分别采用公式(3)式或公式(4)式进行计算,其中,公式(3)、公式(4)中fm为最大静摩擦力,fc为库仑摩擦力,kv为黏性摩擦力矩比例系数,α和α1是正值常数,f(t)为驱动力,即u(t);2)针对步骤1)所建立的动力学方程设计自抗扰控制器:本例中,自抗扰控制器主要由跟踪-微分器、扩张状态观测器、非线性状态误差反馈组成,其基本结构如图2虚线框部分,各部分连接关系为:位置指令θd经跟踪-微分器后,得到θd的跟踪信号θ′d即过渡位置信号和近似微分信号将θd和θ′d与扩张状态观测器的两个观测信号z1和z2形成误差信号θe=θ′d-z1和经过非线性状态误差反馈得到初级输出信号u0,再经过扰动补偿和模型补偿得到自抗扰控制器的输出信号up,同时将up作为rbf神经网络自学习所需要的信息,其过程包括:

(1)二阶离散形式的跟踪-微分器方程设计:

跟踪-微分器即td的二阶离散形式如公式(5)所示:

fhan(·)是公式(5)的最速控制综合函数,具体算法如公式(6)所示:

其中,θd(k)是第k时刻的指令信号,x1=θ′d是指令的跟踪值,是指令的近似微分,h为采样周期,r为决定跟踪快慢的速度因子,d、d0、y、a0、a均为中间变量;

(2)三阶离散扩张状态观测器的方程设计:

扩张状态观测器即eso的三阶离散形式如公式(7)所示:

其中z1是输出信号的估计,z2是输出信号微分的估计,z3是总扰动的估计,θ(k)是第k时刻的输出信号,up是自抗扰控制器的输出信号,α1取0.5,α2取0.25,σ1取0.0025,β01、β02、β03是eso需要整定的参数,在设计过程中根据公式(1)式将视为已建模的确知部分并放入扩张观测器中,能够减轻获观测器负担,起到模型辅助的作用,这样能够使eso获得更好的观测效果,其中fal(·)为公式(8)所示:

(3)非线性状态误差反馈控制律设计:

非线性状态误差反馈控制律即nlsef设计如公式(9)所示:

经过扰动补偿和模型补偿得到自抗扰控制器的输出信号up如公式(10)所示:

其中,α3、α4的取值为0<α3<1<α4,δ2可取5h≤δ2≤10h,β1和β2是非线性状态误差反馈控制律需要整定的两个控制参数,类似于pd控制中的kp、kd;

3)设计rbf神经网络与自抗扰控制器相结合,构成rbf神经网络自抗扰监督控制器:本例中,rbf神经网络的基本结构如图3所示,各部分连接关系为:将位置指令θd和输出信号θ作为网络的输入,经过高斯基变换、加权求和得到网络的输出信号un,自抗扰控制器的输出信号up和rbf神经网络的输出信号un之和u做为总控制器输出,最后将u作为pwm功率放大器的控制信号,由pwm功率放大器驱动伺服电机转动。

在rbf网络结构设计中,取x=[x1,x2]t为网络的输入,设rbf网络的高斯基函数的宽度向量为b=[b1,b2,…,bj,…bm]t,径向基向量为h=[h1,h2,…,hj,…,hm]t,其中hj为隐含层第j个神经元的输出,即如公式(11)所示:

公式(11)中,bj为隐含层节点j的基宽参数且bj>0,cj为隐含层的的第j个节点的中心向量,网络输出层的权向量为公式(12):

w=[w1,w2,…,wj,…,wm]t(j=1,2,…,m)(12),

rbf网络的输出为公式(13):

un(k)=w1h1+w2h2+…+wjhj…+wmhm(13),

以上各公式中,m为rbf网络隐含层的神经元个数,设计控制律为公式(14)所示:

u(k)=up(k)+un(k)(14),

公式(14)中,up(k)是自抗扰控制器在第k时刻的输出信号,设神经网络的性能指标函数为公式(15):

采用梯度下降法调整网络的权值为公式(16):

神经网络的权值调整过程如公式(17):

wj(k)=wj(k-1)+δwj(k)+α(wj(k-1)-wj(k-2))(17),

公式(16)、(17)式中,η为学习速率,α是动量因子。

优选的,给定正弦位置跟踪信号θd=0.10sin(2πt)作为俯仰角的指令信号,带摩擦时,pid控制仿真结果如图4所示,而本实施例控制方法如图5所示,两者对比明显可见:采用pid控制跟踪误差大,不能达到高精度控制,而本实施例方法的跟踪误差要小于pid控制,满足高精度控制要求,图6为实施例方法在跟踪正弦位置信号时rbf神经网络输出un、adrc输出up、总控制器输出u仿真波形示意图,给定单位阶跃信号作为俯仰角的指令信号,pid控制和发明控制方法仿真结果如图7所示,两者对比明显可见:采用pid控制存在提高快速性的同时会带来超调量变大的缺陷;本实施例方法,由于adrc事先安排了过渡过程,在提高系统响应快速性下还能同时保证具有较小的超调量。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1