直流电机驱动单杆系统的变长度PD型迭代学习控制方法

文档序号:32471199发布日期:2022-12-07 07:30阅读:49来源:国知局
直流电机驱动单杆系统的变长度PD型迭代学习控制方法
直流电机驱动单杆系统的变长度pd型迭代学习控制方法
技术领域
1.本发明涉及迭代学习控制领域,尤其是直流电机驱动单杆系统的变长度pd型迭代学习控制方法。


背景技术:

2.直流电机是指能将直流电能转换成机械能的旋转电机,通过改变电枢供电电压以调节电机的稳定转速。因其转速可以平滑无极调节,调速方便,过载能力大等特性被广泛应用于轻工、机械制造和冶金等多种现代工业部门。
3.对于此类具有重复运行性质的系统,迭代学习控制(iterative learning control,ilc)是一种能够有效提高轨迹跟踪精度的控制策略。ilc的核心思想在于通过利用先前的轨迹跟踪误差和控制输入信息来产生当前批次的控制输入,使输出实现对期望轨迹的跟踪,控制系统具有自我学习和自我完善的能力。该策略将系统重复任务的每一次执行定义为一个迭代批次,随着迭代批次的上升,系统的实际输出轨迹应渐进收敛于期望轨迹。在传统的迭代学习控制中,要求运行期间每个批次的运行长度都要与期望的运行长度相同,以此来保证系统在整个期望时间内的学习效率和跟踪效果。然而,在直流电机的一些实际应用场景中,该要求并不一定能被满足。因此,需要考虑批次长度会发生变化的情况。这便构成了直流电机驱动单杆系统中的变批次长度问题,设计合适的控制策略,充分利用各种不同批次长度下系统所产生的有效输出进行学习,对迭代学习控制的输入信号进行修正,以实现系统对期望轨迹的精准跟踪,是解决该问题的关键所在。
4.在变批次迭代学习控制中,对系统的批次运行长度通常有一个期望值,称之为期望长度。当系统的批次运行长度产生变化时,若系统运行未能达到期望长度,则实际批次长度小于期望长度的部分便会出现信息缺失问题。目前,通过共享通信网络交换控制器、执行器、传感器之间信息的网络化控制系统已经成为国际自动控制领域的一个热点研究课题。而随着计算机与通信技术的发展,使在直流电机驱动单杆控制中采用网络控制系统方案成为可能。然而在网络传输中,受硬件设备等物理条件约束,往往会存在时滞问题。


技术实现要素:

5.本发明人针对上述问题及技术需求,提出了直流电机驱动单杆系统的变长度pd型迭代学习控制方法,针对变批次长度造成的跟踪误差信息缺失问题,选择使用零补偿方法进行修正,从而得到修正跟踪误差并将其用于控制律;针对网络传输造成的输入时滞问题,以给定超前法消除其对控制律更新的影响。
6.本发明的技术方案如下:
7.一种直流电机驱动单杆系统的变长度pd型迭代学习控制方法,包括如下步骤:
8.第一步、建立直流电机驱动单杆系统的动态模型,包括:
9.该系统为网络环境下直流电机通过齿轮驱动单个刚性连杆,直流电机由一台带功率放大器的计算机控制,在连杆一侧安装了一个光电编码器来测量连杆的角度位置。系统
的动态模型(即动力学方程)由下述二阶微分方程式表示:
[0010][0011]
其中,各参数的实际物理意义分别为:jm、bm、θm分别表示直流电机的惯性系数、阻尼系数和角度,j
l
、b
l
、θ
l
分别表示刚性连杆的惯性系数、阻尼系数和角度;n表示齿轮齿数比,u表示力矩,m表示刚性连杆质量,g为重力加速度,l表示质量中心到转动轴的长度。
[0012]
第二步、建立直流电机驱动单杆系统的离散状态空间方程,包括:
[0013]
通过欧拉近似法,以运行周期为t=3s,时间间隔h=0.05s对连续系统(即式(1))进行离散采样,电机角度及其微分为状态刚性连杆角度及其微分为输出力矩为输入u(t)。由此,可将式(1)转换为状态方程形式:
[0014][0015]
其中:
[0016][0017][0018]
k为迭代次数,k=0,1,

;t为离散采样时间,t∈{0,1,

,nm,

,nd},nm为最短迭代时长,nd为期望迭代时长;θ为已知输入时滞,0《θ《nm;uk(t)∈rr、xk(t)∈r
p
、yk(t)∈rq分别为系统第k次迭代时的输入、状态、输出。
[0019]
定义yd(t),t∈{0,1,

,nd}为期望输出轨迹,ek(t)=yd(t)-yk(t)为输出跟踪误差,xd(t)为期望状态。假设期望系统动态是可实现的,即对于任意给定的已知有界yd(t),在有界约束下,存在唯一的期望输入ud(t),当uk(t)=ud(t)时,系统存在唯一的有界期望状态xd(t),使得:
[0020][0021]
对于该系统,存在以下两条假设:
[0022]
假设一、系统满足全局lipschitz条件,即对于x2∈r
p
,都有:
[0023]
||f(x1)-f(x2)||≤kf||x
1-x2||
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0024]
其中kf》0为lipschitz常数;
[0025]
假设二、存在有界的初始状态偏差,即||xd(0)-xk(0)||≤κ,κ》0,
[0026]
第三步、针对变批次长度问题设计修正跟踪误差,包括:
[0027]
直流电机驱动单杆系统在运行中批次长度会出现变化,设第k次迭代的运行时长
(即批次长度)为nk。因此,需要考虑两种情况,即nk《nd和nk≥nd。对于后一种情况,注意到只有时刻nd的数据可用于输入更新,时刻nd之后得出的数据为冗余信息,直接忽略,因此在不失一般性的情况下,可将后一种情况统一视为nk=nd,在后续的分析中将nk的取值视为不大于nd。对于前一种情况,在时刻nk+1,

,nd有信息缺失,这部分也无法进行控制律更新,只能对时刻nk及之前的时刻进行更新。
[0028]
最小迭代长度由nm表示,则第k批次运行时长在离散整数集合{nm,

,nd}之间随机变化。为了描述批次长度的变化,用p(t)表示系统在时刻t有输出的概率。由上述内容可知,当0≤t≤nm时,p(t)=1;当nm+1≤t≤nd时,0《p(t)《1。此外,在某次迭代中,若在时刻t0处存在输出,则在0≤t《t0中的任意时刻一定存在输出,由此可知p(nm)》p(nm+1)》

》p(nd)。
[0029]
使用nk表示第k次迭代的批次长度,nk在{nm,

,nd}之间随机取值,系统在时间0≤t≤nk内有输出,在时间nk+1≤t≤nd内无输出或输出丢失。将nk的取值定义为一个事件因此,第k批次迭代长度为nk的概率计算式为且
[0030]
若nk《nd,则控制信号在nk《t≤nd内有信息缺失,只能暂停更新,或先对这段时间内缺失的信息采取零补偿方法进行补偿后再更新,即将信息缺失部分的跟踪误差设置为0,对这段时间内的输入信号不进行更新,将跟踪误差表示为如下形式:
[0031][0032]
其中称为修正跟踪误差。
[0033]
为使表达更加简洁,本技术引入了一个指标函数1(t≤nk),从而将式(5)改写为:
[0034][0035]
对于给定的t,若t≤nm,则事件{t≤nk}发生的概率为1;若t》nm,则事件{t≤nk}是事件{nk=t},{nk=t+1},

,{nk=nd}所有情况的总集。因此,事件{1(t≤nk)=1}的概率计算为结合这两种情形,得到:
[0036]
p{1(t≤nk)=1}=p(t),e(1(t≤nk))=p(1(t≤nk)=1)
×
1+p(1(t≤nk)=0)
×
0=p(t)。
[0037]
第四步、设计针对已知输入时滞问题的pd型迭代学习控制算法,包括:
[0038]
在直流电机驱动单杆系统的迭代学习控制器给出控制信号到执行器的过程中,存在网络传输造成的输入时滞问题,设该输入时滞为θ,θ已知。给定超前法能够将各个迭代批次的误差信息提前利用,有效减少输入时滞对控制律更新和跟踪控制效果造成的影响,因此使用该方法消除θ对控制律更新造成的影响。结合第三步中的修正跟踪误差,设计pd型迭代学习控制律:
[0039][0040]
其中,t∈{-θ,-θ+1,

,n
d-θ},p为比例学习增益,d为微分学习增益。将该算法应用到系统(即式(2))中,得到如下定理:考虑带有输入时滞的非线性离散系统(2)和pd型迭代学习控制律(7),假定系统满足假设一和二。若学习增益矩阵p、d能满足0《(p+d)cb《i,0《
pcb《i,0《dcb《i,则跟踪误差将随着迭代次数k趋于无穷时,期望收敛于一个与初始状态误差的界κ成比例的区域,即其中γ为一个合适的常量,该常量的范围将在第五步证明过程的最后给出。
[0041]
第五步、分析变批次长度下pd型迭代学习控制算法的收敛性,包括:
[0042]
上述定理的收敛性分析证明过程如下:
[0043]
根据迭代学习控制律(7)得到:
[0044][0045]
其中δuk(t)=ud(t)-uk(t)为输入误差。
[0046]
根据式(2)和式(3),得到:
[0047][0048][0049]
其中,δxk(t+θ+1)为状态误差。
[0050]
由此得到:
[0051][0052]
对式(11)两边同时取欧氏范数,根据假设一得到:
[0053][0054]
注意到在式(12)中,1(t≤nk)独立于δuk(t)和δxk(t+θ),因此对式(12)两边同时取期望,得到:
[0055][0056]
其中0《(p+d)cb《i。
[0057]
对式(10)两边同时取欧氏范数,得到:
[0058][0059]
为了公式简洁,将矩阵b的欧氏范数作为一个常数看待,即令||b||≤kb,再对式(14)两边同时取数学期望,得到:
[0060]
e||δxk(t+θ+1)||≤kfe||δxk(t+θ)||+kb||δuk(t)||
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(15)
[0061]
对式(15)两边的t同时减1,有:
[0062]
e||δxk(t+θ)||≤kfe||δxk(t+θ-1)||+kb||δuk(t-1)||
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(16)
[0063]
将式(16)代入式(15),得到:
[0064][0065]
由此递推关系,得到:
[0066][0067]
将式(18)化为:
[0068][0069]
根据假设二可知e||δxk(0)||≤κ,由此可从式(19)得到:
[0070][0071][0072]
将式(20)和式(21)代入式(13),得到:
[0073][0074]
定义一个修正λ范数:||z(t)||
λ
表示向量z(t)的修正λ范数,其中λ》0,α》1,ω是t的有限离散集。应用该λ范数,在式(22)两边同时乘以α-λt
(α》1,λ》0),并根据t的所有范围取上确界,得到:
[0075][0076]
令令由于t的有限性,故存在一个常数θ使得因此将式(23)化为:
[0077][0078]
其中,令α》kf,则有:
[0079][0080]
同理,有:
[0081][0082]
因此将式(24)改写为:
[0083][0084]
由于t《0时,u(t)=0,因此||δuk(t-1)||
λ
≤||δuk(t)||
λ
,将式(27)化为:
[0085][0086]
其中:
[0087][0088][0089]
对式(28)两边同时令k

∞,再根据修正λ范数,得到:
[0090][0091]
结合式(20),得到:
[0092][0093]
已知e||δxk(t)||与κ成比例有界,又因为ek(t)=cδxk(t),所以有:
[0094]
[0095]
令则存在一个合适的常数γ使跟踪误差期望收敛于一个与初始状态误差的界κ成比例的小区域,即:
[0096][0097]
证毕。
[0098]
第六步、实现网络环境下变批次长度直流电机驱动单杆系统的轨迹跟踪,包括:
[0099]
根据所设计的pd型迭代学习控制算法,计算系统每一次迭代过程中每一时刻所需要的输入信号,将该信号作用到直流电机驱动单杆系统进行控制,以光电编码器测量刚性连杆的角度位置来获取响应输出,使得系统中刚性连杆运动时的角速度变化曲线能够追踪系统预先设定的期望轨迹,实现精确的轨迹跟踪控制。
[0100]
本发明的有益技术效果是:
[0101]
本技术公开了针对直流电机驱动单杆系统此类具有重复运动特征的输入时滞非线性系统,将直流电机驱动单杆系统作为被控对象,针对被控对象在实际应用中可能出现的变批次长度问题,使用零补偿方法对缺失的跟踪误差信息进行补偿;对于网络传输中的输入时滞问题,使用给定超前法进行修正,设计了pd型迭代学习控制算法。基于数学期望与λ范数,对所提算法进行收敛性分析,保证了系统跟踪误差期望意义下的收敛性。
附图说明
[0102]
图1是本技术公开的网络环境下直流电机驱动单杆系统的ilc模型框图。
[0103]
图2是本技术公开的直流电机驱动单杆系统的机械结构图。
[0104]
图3是本技术公开的网络环境下直流电机驱动单杆系统的不同批次沿时间轴的输出曲线图。
[0105]
图4是本技术公开的网络环境下直流电机驱动单杆系统的不同批次沿时间轴的误差曲线图。
[0106]
图5是本技术公开的网络环境下直流电机驱动单杆系统的初始状态变化范围不同时的最大跟踪误差曲线图。
具体实施方式
[0107]
下面结合附图对本发明的具体实施方式做进一步说明。
[0108]
请参考图1,其展示了本技术公开的网络环境下直流电机驱动单杆系统的ilc模型框图。在第k批次中设计的pd型迭代学习控制器的输出信号为uk(t),通过网络传输到执行器(比如计算机)。由于存在已知输入时滞θ,因此执行器接收到的信号为uk(t-θ)。将该输入信号作用于直线电机驱动单杆系统,由连杆一侧的光电编码器测量角度位置,得到角度关于时间变化的曲线,作为输出yk(t)。由传感器通过网络将yk(t)传输到迭代学习控制器,将其与期望轨迹存储器的设定期望值yd(t)进行比较得到跟踪误差ek(t)。在迭代学习控制器中,将跟踪误差转化为修正跟踪误差然后根据迭代学习控制律进行计算,得出第k+1批次的输入信号u
k+1
(t),如此循环运行直至系统实际输出与期望值之间的误差达到精度要
求,则停止运行,此时的控制器输入即为最优控制输入。
[0109]
图2为直流电机驱动单杆系统的机械结构图,直流电机1运作时通过齿轮2驱动刚性连杆3。图中各符号的物理意义为:jm、bm、θm分别表示直流电机的惯性系数、阻尼系数和角度,j
l
、b
l
、θ
l
分别表示刚性连杆的惯性系数、阻尼系数和角度;m为刚性连杆质量,l为刚性连杆质量中心到转动轴的长度。将直流电机驱动单杆系统中的各项参数分别设为:jm=0.3m-1
,j
l
=0.44m-1
,bm=0.3n
·
s/m,b
l
=0.25n
·
s/m,m=0.5kg,g=9.8m/s2,l=0.1m;此外,还有齿轮齿数比n=1.6,刚性连杆角度θ
l
=θm/n,系统运行周期为t=3s,采样时间间隔h=0.05s。因此,系统运行的期望迭代长度nd为60。将最小运行时长nm设置为45,每批次的迭代长度nk在45~60内随机取值,且满足离散均匀分布条件,即p(nk=z)=1/16,z∈z。
[0110]
本实施例中设定刚性连杆的期望轨迹为
[0111]
取比例学习增益p=0.4,微分学习增益d=0.3,将其代入所提定理中,则(p+d)cb=0.046,pcb=0.0265,dcb=0.0198,满足收敛性条件。设置已知输入时滞θ=5,迭代次数n=100,有界变化的初始状态xk(0)的界κ=0.05,假设每批次的初始状态在[-κ,κ]中服从均匀分布。不失一般性,将初始输入设置为0,即u1(t)=0,0≤t≤nd。
[0112]
图3为网络环境下直流电机驱动单杆系统的不同批次沿时间轴的输出曲线图,图中为期望曲线与第10和第100批次的输出响应曲线。可看出第10批次时系统的输出响应曲线已经很接近期望曲线,到第100批次时输出响应曲线与期望曲线几乎重合,基本实现完全跟踪。
[0113]
图4为网络环境下直流电机驱动单杆系统的不同批次沿时间轴的误差曲线图,本例选取了第10、25、50和100批次的跟踪误差曲线,可以看出随着迭代次数k的增加,系统的跟踪误差明显减少。到第50批次时,误差已经很小,到100批次时,误差几乎为0,基本实现完全跟踪。另外,注意到在第50批次的跟踪误差曲线中,最后几个时刻的误差较大,这是由于每批次的迭代长度不等,后几个时刻获得的跟踪误差信息相对较少,无法对控制律进行充分校正所导致。
[0114]
图5为网络环境下直流电机驱动单杆系统的初始状态变化范围不同时的最大跟踪误差曲线图。为了验证系统在初始状态范围不同情况下的收敛情况,设定不同尺度的κ分别为0.005、0.01和0.05,最大跟踪误差曲线如图所示。可见,初始状态变化的界越大,收敛效果也会下降,但采用本技术所提出的控制方法仍可使跟踪误差较好地收敛。此外可以发现初始状态偏差越小,最大跟踪误差的收敛范围也越小。
[0115]
以上所述的仅是本技术的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1