一种单机械臂的量化迭代学习控制方法

文档序号:31673584发布日期:2022-09-28 01:30阅读:187来源:国知局
一种单机械臂的量化迭代学习控制方法

1.本发明涉及迭代学习控制技术领域,尤其是一种单机械臂的量化迭代学习控制方法。


背景技术:

2.机械臂是一种能模仿人手臂的某些动作功能,以按固定程序搬运、抓取物件或操作工具的自动操作装置。它可代替人的繁重劳动以实现生产的自动化和机械化,能在危险环境下操作以保护人身安全,因而广泛应用于机械制造、轻工、电子和冶金等部门。
3.许多工业生产中,单机械臂控制系统需要在有限的时间区间内重复地执行给定的任务,针对这一特征,迭代学习控制算法具备很强的适用性。迭代学习控制可以通过对已完成批次的历史信息进行学习,不断修正当前批次的输入信号,使单机械臂的输出随着运行批次的增加得到改善,提高其操作精度。
4.随着通信技术的发展,使得控制器与单机械臂之间通过网络完成信息的交互成为一个重要的应用方向,一方面可以充分利用网络提供便捷的软硬件条件,减少现场布线并提高资源的调配,另一方面,在使操作人员从有害的操作环境中脱身的同时,网络化信息传输使得控制器与被控系统之间依然能具备良好的交互性,从而实现对单机械臂的远程控制,适应日益复杂的应用环境。相比于传统的本地有线传输方式,网络化信息传输在当前技术条件下的传输带宽相对较低,与此同时,为保证通信的及时性与可靠性,网络数据传输的期望负载不宜过高,因而需要对信号进行量化以减少信息传输量,降低传输负担。但量化在减少传输数据量的同时也牺牲了数据精度,因此需要设计相应的机制以消除量化对机械臂输出所造成的影响。
5.因此,针对使用网络通信方案且执行重复性任务的单机械臂,完成在信号量化场景中迭代学习控制算法的设计是一项具有实用意义的研究。


技术实现要素:

6.本发明人针对上述问题及技术需求,提出了一种单机械臂的量化迭代学习控制方法,本发明的技术方案如下:
7.一种单机械臂的量化迭代学习控制方法,包括如下步骤:
8.第一步、建立单机械臂控制系统的动态模型:
9.动态模型采用动力学方程表示,描述了关节角度和电气参数之间的转化关系;先建立单机械臂中关节角度与输入力矩的等式,再建立输入力矩与电气参数的关系,从而通过输入电压实现单机械臂运动;根据单机械臂关节角度和电气参数的关系,建立如式(1)所示的实际物理模型:
10.11.其中,n
l
=m1gl+m2gl,式(1)中各参数的实际物理意义分别为:l表示连杆长度,m1表示负载质量,m2表示连杆质量,g表示重力加速度,ξ表示执行器转动惯量,dc表示负载系数,θ表示连杆角度,bc表示轴承粘滞摩擦系数,k
t
表示扭矩,i表示电流,x表示电抗,rr表示电阻,kb表示反电动势系数,u表示电机控制电压;
12.第二步、构建单机械臂控制系统的离散状态空间方程:
13.将单机械臂控制系统的关节角度、关节角度导数和电流定义为状态变量:定义输入变量为电机控制电压u,输出为关节角度θ,则式(1)所示的单机械臂控制系统描述为:
[0014][0015]
对连续系统模型式(2)进行离散化,基于香农采样定理选取采样周期ts,得到单机械臂控制系统的离散状态空间模型如下:
[0016][0017]
其中,分别表示第k批次时系统的输出信号、输入信号和状态变量;t∈[0,n]表示一个批次时间t内的采样时刻;k为迭代批次;a,b,c分别表示相应维数的参数矩阵,cb≠0以保证系统输出可控;xk(0)表示第k批次运行时系统的初始状态值,假设初始状态值在不同批次中保持一致,即令x0=0;
[0018]
第三步、建立轨迹跟踪模型:
[0019]
针对式(3)形式的线性离散系统,利用提升技术将其状态空间表达式转换为迭代轴上矩阵模型:
[0020]
yk=gukꢀꢀ
(4)
[0021]
其中g表示系统输入信号到输出信号的变换矩阵,表达式为:
[0022][0023]
此外,输入信号与输出信号分别为:
[0024]
uk=[uk(0),uk(1),...,uk(n-1)]
t
ꢀꢀ
(6)
[0025]
yk=[yk(1),yk(2),...,yk(n)]
t
ꢀꢀ
(7)
[0026]
第四步、设计均匀量化的编码解码器:
[0027]
单机械臂与控制器在网络环境中的信息交互需要预先通过编码与解码器进行量化处理;基于有限均匀量化器设计输入端编码解码器如下:
[0028][0029][0030]
其中,和uk(t)分别表示编码器e1的内部状态,输出和输入;表示解码器d1的输出,为控制器生成输入uk(t)的估计值;bk=τk表示调整序列,用于调整系统输入或输出与编码器状态之间差的大小;q(
·
)是由式(10)定义的有限均匀量化器:
[0031][0032]
其中,i=1,2,

,z
0-1,z0表示量化级数;v表示有限均匀量化器的输入,当有限均匀量化器的输入满足v≤2z
0-1时,存在如下关系:
[0033]
η=q(v)-v
ꢀꢀ
(11)
[0034]
其中,η表示均匀量化误差,满足|η|≤1;
[0035]
同样基于有限均匀量化器式(10)设计输出端编码解码器如下:
[0036][0037][0038]
其中,和yk(t)分别表示编码器e2的内部状态,输出和输入;表示解码器d2的输出,为单机械臂输出yk(t)的估计值;b
k+1
=τ
k+1
表示调整序列;
[0039]
第五步、建立编解码前后的信号关系表达式:
[0040]
解码器d1的输出是编码器e1的输入uk(t)的估计值,在系统输入端的编码过程中有:
[0041][0042]
根据输入端编码解码器的定义与式(14),得到:
[0043][0044]
根据数学归纳法可知成立,得到输入端在编解码前后的信号u
k+1
(t)与存在如下关系式:
[0045][0046]
将式(15)提升为向量形式,得到与u
k+1
的向量关系式为:
[0047][0048]
其中
[0049]
根据输出端编码解码器的定义得到与yk的向量关系式为:
[0050][0051]
其中
[0052]
使用实际跟踪误差ek=y
d-yk体现系统跟踪性能,而在控制器中使用辅助校正误差修正当前批次输入信号,根据得到:
[0053][0054]
第六步、设计量化迭代学习控制轨迹跟踪算法:
[0055]
考虑范数优化迭代学习控制框架,每批次的控制输入通过优化一个性能指标函数得到,性能指标函数的一般形式为:
[0056][0057]
性能指标函数包括系统第k+1批次的实际跟踪误差e
k+1
,与输入的批次变化值控制器不能直接获取实际系统输入根据数学归纳法可知而ζk是编码器e1的内部状态值,因此间接得到加权系数q》0及r》0表示在优化过程中输入的批次变化值与实际跟踪误差的优先级,并定义诱导范数为如下形式:
[0058][0059]
利用ek与的向量形式的关系式得到第k+1批次系统实际跟踪误差为:
[0060][0061]
利用与u
k+1
的向量形式关系式将输入的批次变化值转化为:
[0062][0063]
将式(22)与式(23)代入原性能指标函数(20),并根据诱导范数的定义展开得到:
[0064][0065]
接下来对原性能指标函数进行放缩处理得到:
[0066][0067]
令q1=3q,r1=2r,然后利用与的有界性对式(25)的后半部分进行变换得到:
[0068][0069]
因此,得到新的性能指标函数j1如下:
[0070][0071]
用表示最优解,将性能指标函数j1对u
k+1
求微分并令得到:
[0072][0073]
合并同类项整理得到:
[0074][0075]
由于q1=3q》0,r1=2r》0,则(q1g
t
g+r1i)为可逆矩阵,将式(29)改写得到的量化迭代学习控制算法如下:
[0076][0077]
其中,ke=q1(q1g
t
g+r1i)-1gt
;采用上述量化迭代学习控制算法,当加权系数q,r以及有限均匀量化器饱和量化值的选择满足一定条件时,单机械臂的输出能够完成对参考轨迹的跟踪;
[0078]
第七步、分析量化迭代学习控制轨迹跟踪算法的收敛性:
[0079]
对于第k+1批次的实际跟踪误差e
k+1
,利用量化迭代学习控制算法得到:
[0080][0081]
根据ek与的向量形式的关系式,进一步得到:
[0082][0083]
对式(32)两边取范数得到:
[0084][0085]
当性能指标函数中选择的加权系数q,r使得条件||i-gke||≤ρ《1成立,在调节序列取bk=τk,ρ《τ《1成立,则:
[0086]
||e
k+1
||≤ρ||ek||+cbkꢀꢀ
(34)
[0087]
其中系统经过k次迭代后得到实际跟踪误差的递推式:
[0088][0089]
由于与进一步得到:
[0090][0091]
表明量化迭代学习控制算法能够使系统跟踪误差的范数收敛到0,即单机械臂控制系统使用该算法能够实现精准的轨迹跟踪;
[0092]
第八步、给出量化级数z0的取值方案:
[0093]
在输入端,有限均匀量化器的输入信号为根据范数的性质得到:
[0094][0095]
由于利用量化迭代学习控制算法得到:
[0096][0097]
基于实际跟踪误差的递推式可知:
[0098][0099]
当初始批次的输入选择u0=0,则式(39)中e0=yd;因此,在输入端的有限均匀量化器的量化级数z0的取值满足:
[0100][0101]
在输出端,有限均匀量化器的输入信号为根据范数的性质得到:
[0102][0103]
由于利用式(41)得到:
[0104][0105]
由于bk=τk且进一步得到:
[0106][0107]
基于实际跟踪误差的递推式可知:
[0108][0109]
当初始批次的输入选择u0=0,则式(44)中e0=yd;因此,在输出端的有限均匀量化器的量化级数z0的取值满足:
[0110][0111]
综合输入输出端中有限均匀量化器的量化级数取值方案,即式(40)与式(45),得到量化级数z0满足:
[0112]
[0113]
第九步、利用量化迭代学习控制算法实现单机械臂的轨迹跟踪:
[0114]
根据量化迭代学习控制算法确定单机械臂控制系统每一迭代批次的控制器生成输入向量,经均匀量化的编码解码器作用得到实际输入向量,以实际输入向量对单机械臂进行控制,单机械臂在实际输入向量的控制下实现对参考轨迹的跟踪。
[0115]
本发明的有益技术效果是:
[0116]
本技术公开了一种适用于单机械臂此类执行重复运动系统的量化迭代学习控制方法,以单机械臂为被控对象,利用提升技术将执行重复性任务的单机械臂转换为迭代轴上的矩阵模型;基于有限均匀量化器设计了编码解码器,以完成通信带宽受限条件下单机械臂与控制器的信息交互;在范数优化迭代学习框架下,通过放缩法设计性能指标函数,并进一步得到了量化迭代学习控制算法;基于压缩映射法,证明了所提出的量化迭代学习控制律可以解决网络通信带宽有限单机械臂的跟踪控制问题,并给出有限均匀量化器中量化级数的选取方案,保证了单机械臂输出对参考轨迹的跟踪。
附图说明
[0117]
图1是本技术提供的单机械臂控制系统的模型框图。
[0118]
图2是本技术提供的单机械臂控制系统的实际输出轨迹图。
[0119]
图3是本技术提供的单机械臂控制系统的实际输入信号图。
[0120]
图4是本技术提供的系统实际跟踪误差范数收敛图。
[0121]
图5是本技术提供的放缩前后性能指标函数比较曲线图。
具体实施方式
[0122]
下面结合附图对本发明的具体实施方式做进一步说明。
[0123]
请参考图1,其示出了本技术公开的单机械臂控制系统的模型框图。第k批次的控制器输出为uk,经编码器e1编码后通过网络传输,由解码器d1接收并解码得到实际控制向量作用于单机械臂可以得到系统第k批次的实际输出yk,实际输出yk与储存在期望轨迹存储器的设定期望值yd进行比较得到实际跟踪误差ek。将实际跟踪误差精度与设定的精度值做比较,若误差精度没有达到所设定的精度,则将实际输出yk经编码器e2编码后通过网络传输,由解码器d2接收并解码得到估计的输出值其与储存在期望轨迹存储器的设定期望值yd进行比较得到辅助校正误差将辅助校正误差当前控制器输入uk与编码器e1的内部状态量传递到量化迭代学习控制器生成下一批次的控制器输出u
k+1
,如此循环运行直至系统实际输出与期望值之间的误差达到精度要求,则停止迭代,此时的系统实际输入即为使单机械臂输出跟踪上参考轨迹的最优控制输入。
[0124]
针对式(1)所示的单机械臂实际物理模型,变量参数分别设定为:
[0125]kt
=1n
·
m,kb=0.085v
·
s/rad,
[0126]rr
=0.075ω,bc=0.015kg
·
m2/s,dc=0.05,
[0127]
l=0.6m,m1=0.05kg,m2=0.01kg,
[0128]
ξ=0.05kg
·
m2,x=0.0008ω,g=9.8m/s2。
[0129]
运行周期t=2s,设置采样周期为ts=0.1s,则单机械臂控制系统的离散状态空间
表达式的参数矩阵分别为:
[0130][0131]
c=[1 0 0]
[0132]
本实施方式给定单机械臂的参考轨迹为:
[0133]
yd(t)=10(sin(2πt)+sin(πt))
[0134]
选择加权系数q=1与r=0.02,则有q1=3与r1=0.04,也就是量化迭代学习控制算法中的ke可随之确定,此时ρ=||i-gke||=0.5374《1;本实施方式中基于有限均匀量化器设计了编码解码器,以完成通信带宽受限条件下单机械臂与控制器的信息交互,令编码解码器中τ=0.56》ρ,进一步可得有限均匀量化器的量化级数应满足z0≥max{822,1937}。
[0135]
本技术的上述量化迭代学习控制器基于数字信号运动控制器实现,运动控制器的输入包括上一批次的实际控制输入与辅助跟踪误差根据所设计的量化迭代学习控制算法计算得到控制器生成信号u
k+1
,经输入端的编码器e1编码后经过网络传输,再由解码器d1接收并解码得到实际输入信号实际输入信号作用于单机械臂,使输出轨迹逐渐跟踪上参考轨迹。
[0136]
单机械臂的动态模型(1)运行时,请参考图2和图3,分别示出了单机械臂控制系统应用量化迭代学习控制律(30)的实际输入与输出轨迹。从图中观察到第20批次时的输出轨迹与参考轨迹几乎重合,这意味着所提的量化迭代学习控制算法能够完成对参考轨迹的跟踪任务。图4绘制了跟踪误差曲线,该曲线体现出单机械臂的跟踪精度随着迭代批次增加而逐渐上升。图5中给出了原性能指标函数j与放缩后新的性能指标函数j1的比较曲线,反映了通过优化j1而对输入信号的更新,使原性能指标函数也逐渐减小。
[0137]
以上所述的仅是本技术的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1