一种基于复合学习的受限机械臂有限时间控制方法

文档序号:33641131发布日期:2023-03-29 02:06阅读:81来源:国知局
一种基于复合学习的受限机械臂有限时间控制方法

1.本公开涉及机器人控制技术领域,尤其涉及一种基于复合学习的受限机械臂有限时间控制方法。


背景技术:

2.机械臂是机器人技术领域中应用最为广泛的自动化机械装置,涉及工业制造、医疗、军事以及太空探索等诸多领域。要实现对机械臂的精准操控,需准确获取机械臂各项物理参数来构建其精确的动态模型,然而机械臂通常包含多个自由度,是典型的非线性、强耦合系统,当机械臂执行不同任务时,其动态模型中多项物理参数也会随之改变,这就导致其模型难以精确获得。因此,如何提高机械臂的参数辨识和同步控制性能是现有工业控制的研究热点。
3.当被控系统具有多项未知参数或不可测量参数时,复合自适应控制因其能同时保证跟踪误差和参数估计误差的收敛性而被认为是一种十分有效的控制策略。然而为确保控制性能,传统的自适应控制方法要求系统必须满足持续激励条件,这在实际上很难实现;在此背景下,复合学习控制方法应运而生。与传统自适应控制方法不同,复合学习控制运用当前实测数据和历史数据构建参数自适应估计策略,并将持续激励条件弱化为较易实现的区间激励条件。尽管复合学习自适应控制方法提升了系统的控制性能,但其仍存在一系列缺陷:目前该方法只能保证跟踪误差及参数估计误差指数收敛至0,并不能使系统在有限时间内稳定;另外,该方法未考虑机械臂关节角度受限问题,不能保证系统运行过程的可靠性和安全性。


技术实现要素:

4.为克服当前机械臂复合学习自适应控制方法的不足,本发明提出一种考虑机械臂关节角度受限、满足机械臂系统有限时间稳定的复合学习控制方法。该方法在现有复合学习控制理论基础上,通过构建通用时变非对称障碍函数实现对机械臂关节角度的直接约束,同时设计了基于改进非奇异终端滑模的有限时间控制方法,使系统跟踪误差和参数估计误差均能在有限时间收敛至0,并且不会出现奇异问题,大大提升了系统的控制性能。
5.为了解决上述技术问题,本发明的技术方案如下。
6.一方面,本发明提供一种基于复合学习的受限机械臂有限时间控制方法,所述方法包括下述步骤:
7.s100、获取当前时间机械臂关节位置、速度,计算复合学习参数更新律;
8.s200、基于复合学习参数更新律更新参数估计值,进而计算有限时间的控制力矩,通过控制力矩控制机械臂按期望轨迹运动,且机械臂关节在设定区域内活动;
9.s300、若设定的时间未结束,获取下一时间为当前时间,返回步骤s100;
10.所述复合学习参数更新律如下:
11.[0012][0013]
其中:为参数更新律,p为投影算子,均为自适应增益矩阵,为控制参数且满足0<γ<1,为的范数;为未知参数向量θ的估计值,将未知参数向量的界设定为半径为c
θ
的球形范围ε为参数预测误差,为受限机械臂对应的动态回归矩阵;s为非奇异终端滑模面,为改进的激励矩阵:
[0014][0015]
t为时间,te为区间激励条件的上边界,θ(t)为激励矩阵。
[0016]
在上述技术方案中,通过本发明提出的复合学习更新律,实现对机械臂模型未知参数的在线辨识,进而用于机械臂有限时间控制器的计算,实现对机械臂轨迹跟踪的同步控制。通过改进的激励矩阵弱化激励条件,使得参数估计误差和轨迹跟踪误差均能在较弱的区间激励条件下能够有限时间收敛至0,而不会出现奇异问题,从而使机械臂在较弱的区间激励条件下更快、更准确得获取模型参数真值,进而精准得控制机械臂运动状态。
[0017]
在上述技术方案中,所述有限时间的控制力矩采用下式计算:
[0018][0019]
式中:控制器增益矩阵,n为关节总数,η
1i
为对通用时变非对称障碍函数求导后的系数,为qi的导数,qi为机械臂第i个关节的位置;
[0020]
将通用时变非对称障碍函数记作ζi,则:
[0021][0022]
式中:f
1i
和f
2i
为时变障碍函数;f
1i
和f
2i
分别根据时变障碍函数f
1i
和f
2i
确定的非零常数,满足式qi=qi(t),ωi(t)为机械臂第i个关节位置的限定范围,且满足qi(0)∈ωi(0)。该通用时变非对称障碍函数,给出了机械臂关节角度受限下的n自由度动力学模型。与传统障碍李雅普诺夫函数法的间接约束相比,该障碍函数能直接约束机械臂关节角度,同时能在不改变系统控制结构的前提下满足机械臂关节角度受限和不受限两种情况的需求,保证了控制系统的安全性和可靠性。
[0023]
在上述技术方案中,所述非奇异终端滑模面通过下述步骤获取:
[0024]
根据受限机械臂动力学模型,获取计算机械臂关节位置受限条件下的跟踪误差e
ζ

[0025]eζ
=ζ-ζd[0026]
式中:ζd为受限机械臂期望轨迹,ζ为受限机械臂实际轨迹;
[0027]
构建非奇异终端滑模面s如下:
[0028]
[0029][0030]
式中:λ、γs、均为设定的控制参数,1/2<γs<1,当s到达0时e
ζ
>u。当机械臂中有限时间控制器基于该非奇异终端滑模面计算时,可使机械臂跟踪误差及参数估计误差均能在有限时间收敛至0,并且不会出现奇异问题,大大提升了系统的收敛速度和控制精度。
[0031]
在上述技术方案中,所述参数预测误差基于机械臂当前实测数据和历史数据构建,进而根据预测误差和参数估计误差设计改进的激励矩阵,改进的激励矩阵具有弱化的区间激励条件,从而使有限时间控制器能够在在较弱的区间激励条件下更快、更准确得获取模型参数真值,进而精准得控制机械臂运动状态。参数预测误差和改进的激励函数均具有积分项θ(t),使得复合学习参数更新律计算不仅用到了系统当前实测数据,还用到了因积分项而生成的历史数据,进而使未知参数的估计值在有限时间控制器作用下,能够在较弱的区间激励条件下有限时间收敛至参数真值。
[0032]
在上述技术方案中,所述参数预测误差与改进的激励矩阵的关系为:
[0033][0034]
式中:ε为参数预测误差,为参数估计误差,
[0035]
在上述技术方案中,所述激励矩阵基于滤波回归矩阵获得,所述滤波回归矩阵通过对动力学模型回归矩阵进行滤波处理获得;所述动力学模型回归矩阵通过对动力学模型进行线性参数化处理获得。
[0036]
在上述技术方案中,所述受限机械臂动力学模型通过下述步骤建立:
[0037]
建立机械臂动力学模型:
[0038][0039]
式中:为正定惯性矩阵,为离心力和哥氏力矩阵,为粘滞摩擦力矩,为重力力矩,为控制力矩,分别为机械臂的关节位置、速度和加速度;
[0040]
设置机械臂关节角度的限定范围:
[0041][0042]
式中:qi(t)为机械臂第i个关节的位置,ωi(t)为机械臂第i个关节位置的限定范围,且满足qi(0)∈ωi(0);f
1i
和f
2i
为两个k阶可导的时变障碍函数;
[0043]
构建通用时变非对称障碍函数的分量ζi:
[0044][0045]
式中:f
1i
和f
2i
为非零常数,且满足式
[0046]
对通用时变非对称障碍函数求导得:
[0047][0048]
其中:为ζ的导数;
[0049][0050]
得到受限机械臂动力学模型为:
[0051][0052]
其中:
[0053][0054]
为使动力学模型等式成立的任意辅助向量,为ξ的导数,为机械臂关节位置受限后对应的动态回归矩阵,为的转置。
[0055]
在上述技术方案中,所述受限机械臂的控制模式包括定点控制模式和跟踪控制模式。
[0056]
第二方面,本发明提出一种基于复合学习的受限机械臂有限时间控制装置,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行上述任一种方法的计算机程序。
[0057]
第三方面,本发明提出一种计算机可读存储介质,存储有能够被处理器加载并执行上述任一种方法的计算机程序。
附图说明
[0058]
为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0059]
图1、为一种实施方式中的方法流程示意图;
[0060]
图2、为一种实施方式中的常规2自由度机械臂简化示意图;
[0061]
图3(a)、为一种实施方式中在定点控制模式下的机械臂关节1轨迹跟踪效果图;
[0062]
图3(b)、为一种实施方式中在定点控制模式下的机械臂关节2轨迹跟踪效果图;
[0063]
图4、为一种实施方式中定点控制模式下的机械臂参数估计效果示意图;
[0064]
图5(a)、为一种实施方式中在跟踪控制模式下的机械臂关节1轨迹跟踪效果图;
[0065]
图5(b)、为一种实施方式中在跟踪控制模式下的机械臂关节2轨迹跟踪效果图;
[0066]
图6、为一种实施方式中跟踪控制模式下的机械臂参数估计效果示意图。
具体实施方式
[0067]
下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。
[0068]
在本发明中,为实数,为n维实向量,为n
×
n阶实矩阵,为m
×
n阶实矩阵,为m维实向量,为正实数。
[0069]
参见图1,在一种实施方式中,基于复合学习的受限机械臂有限时间控制方法,如下详述。
[0070]
s100、获取的机械臂关节位置、速度数据,并基于获取的机械臂关节位置、速度数据,计算复合学习参数更新律、有限时间控制器;
[0071]
【步骤1】:构建考虑关节位置受限的机械臂动力学模型。
[0072]
(1.1)建立如式(1)所示的n自由度机械臂动力学模型:
[0073][0074]
式(1)中:为正定惯性矩阵,为离心力和哥氏力矩阵,为粘滞摩擦力矩,为重力力矩,为控制力矩,分别为机械臂的关节位置、速度和加速度。
[0075]
上述机械臂动力学模型为未受限机械臂模型,其具备如下性质:
[0076]
性质1:m(q)为正定对称矩阵,满足为任意向量,||ξ||为ξ的范数,m和为正常数。
[0077]
性质2:是斜对称矩阵。
[0078]
性质3:(1)式左侧可以写成如下形式:
[0079][0080]
式(2)中:为包含关节速度项且满足(2)式成立的辅助向量,为ξ的导数,为动态回归矩阵,为的转置,为由机械臂未知参数所构成的向量。
[0081]
通过式(2)将机械臂动力学模型公式的左侧进行线性参数化处理,写成回归矩阵的转置与未知参数向量θ相乘的形式,其中回归矩阵中的各个参数均可测,只有θ中的各参数向量未知。
[0082]
(1.2)构建通用时变非对称障碍函数
[0083]
机械臂关节角度的限定范围为:
[0084][0085]
式(3)中:qi(t)为机械臂第个关节的位置,ωi(t)为机械臂第i个关节位置的限定范围,且满足qi(0)∈ωi(0);f
1i
和f
2i
为两个k阶可导的时变障碍函数,且满足k≥2。
[0086]
构建通用时变非对称障碍函数:
[0087][0088]
式(4)中:f
1i
和f
2i
为非零常数,且满足式即:当障碍函数f
1i
和f
2i
选定后,即可确定f
1i
和f
2i
的值;qi为式(3)中的qi(t)。
[0089]
从式(4)可以看出,当且仅当qi→‑f1i
或qi→f2i
时,ζi→
∞,因此只要保证ζi有界,即可满足qi∈ωi。若f
1i
和f
2i
取无穷大,则有:
[0090][0091]
该结果表明构建的通用时变非对称障碍函数ζi等价于机械臂未受限时的qi,因此,无需改变系统控制结构,即可满足机械臂关节角度受限和不受限两种情况的需求。
[0092]
(1.3)给出考虑机械臂关节角度受限的动力学模型
[0093]
对障碍函数(4)求导可得:
[0094][0095]
其中:
[0096][0097]
将式(6)写成紧凑形式为:
[0098][0099]
其中:
[0100][0101]
将式(8)代入式(1)得:
[0102][0103]
将(10)式两端同时乘以得到考虑关节位置受限的机械臂动力学模型为:
[0104][0105]
其中:
[0106][0107]
根据性质1-3可推导出式(11)具有如下性质,即受限机械臂模型所具备的性质:
[0108]
性质4:h(q,η1)为正定对称矩阵,满足)为正定对称矩阵,满足为任意向量,h和为正常数,其中qi(t)∈ωi(t),i=1,2,

,n;
[0109]
性质5:是斜对称矩阵;
[0110]
性质6:(11)式左侧可以写成如下形式:
[0111][0112]
式(13)中,为机械臂关节位置受限后对应的动态回归矩阵,为转置。
[0113]
【步骤2】基于系统当前实测数据和历史数据构建模型参数预测误差并设计改进的激励矩阵。
[0114]
(2.1)对机械臂动力学模型中的力矩及回归矩阵进行线性滤波处理。
[0115]
当时,代入式(2)可得:
[0116][0117]
将(14)式代入(1)式得到:
[0118][0119]
上式中包含的关节角度加速度项通常无法直接测量,因此,需首先对上述动力学模型中的力矩及回归矩阵进行滤波处理,解决加速度不可测的技术问题:
[0120][0121]
得到:
[0122][0123]
其中:
[0124]
为滤波系数,为用户自定义值,τf(t)为τ(t)的滤波后结果,为的滤波后结果。
[0125]
2.2定义激励矩阵:
[0126]
将(17)式等式两端同时乘以并在区间上积分可得:
[0127][0128]
将(18)式等式两端同时乘以固定的未知参数向量θ并代入公式(17)可得激励矩阵θ(t):
[0129][0130]
2.3设计模型参数预测误差:
[0131]
区间激励条件:当t∈[t
e-t1,te]时,若存在正常数te,t1,σ,使得成立,则称矩阵满足区间激励条件,其中i为单位矩阵。
[0132]
持续激励条件:任取t>0,若存在正常数t1,σ,使得成立,则称矩阵满足持续激励条件。
[0133]
在传统复合自适应控制方法中,往往需要机械臂滤后矩阵满足持续激励条件才能保证参数估计误差收敛至0,而这在现实中很难实现,为将持续激励条件弱化为可行的区间激励条件,构建如下包括实测数据和历史数据在内的参数预测误差:
[0134][0135]
式(20):ε(t)为参数预测误差,为未知参数向量θ的估计值,定义参数估计误差
参数估计值是对未知参数向量的估计,通过设计复合学习参数更新律,实现对参数估计值的不断更新,最终使参数估计值等于参数真值,即保证参数估计误差收敛至0。
[0136]
2.4获取改进的激励矩阵
[0137]
改进的激励矩阵为如下分段函数形式:
[0138][0139]
当系统满足区间激励条件,即存在正常数te,σ,使成立时,相比于激励矩阵,激励条件得以弱化,提升了复合学习参数更新律对实现准确参数估计的可行性。
[0140]
由式(20)和式(21),易得到参数预测误差与改进的激励矩阵的关系为:
[0141][0142]
【步骤3】设计复合学习参数更新律和基于改进非奇异终端滑模的机械臂有限时间控制器。
[0143]
(3.1)根据受限机械臂动力学模型,定义机械臂关节位置受限条件下的跟踪误差e
ζ

[0144]eζ
=ζ-ζdꢀꢀꢀꢀ
(23)
[0145]
式(23)中:ζd为受限机械臂期望轨迹,其中:
[0146][0147]
(3.2)获取非奇异终端滑模面
[0148][0149][0150][0151]
式(25)-(27)中:φ(e
ζ
)为关于非奇异终端滑模面的分段函数,λ、γs、均为控制参数,用于控制系统收敛速度,为用户自定义值。1/2<γs<1,μ为根据经验所取的较小正数,满足当s到达0时e
ζ
>u。
[0152]
3.3运用跟踪误差、改进的激励矩阵及参数预测误差设计复合学习参数更新律
[0153]
定义如下辅助变量
[0154][0155]
对s求导,并将等式两侧同时乘以h(q,η1),将所得结果代入公式(11)并运用公式(28)及性质6可得:
[0156][0157]
式(29)中:为引入辅助变量后相应的受限机械臂动态回归矩阵,
[0158]
至此,可得复合学习参数更新律
[0159][0160][0161]
式中:p为投影算子,均为自适应增益矩阵,通常取正定对角矩阵,为辅助变量的导数,为控制参数且满足0<γ<1,为的范数,位置参数向量的界由用户根据预先获取的机械臂模型参数粗略信息自行进行设定,如机械臂杆质量不会超过a1,机械臂杆长不会超过a2等,根据此信息经运算后可将未知参数向量的界设定为半径为c
θ
的球形范围即:
[0162]
3.4设计基于改进非奇异终端滑模的机械臂有限时间控制器:
[0163][0164]
式(32)中:控制器增益矩阵,一般设定为正定对角阵。
[0165]
相比于传统控制器(如pid控制器),有限时间控制器能够提升系统稳定速度。通过有限时间控制器实时控制机械臂运动,使机械臂实际运动轨迹能在有限时间内准确追踪到预定轨迹,同时结合参数更新律,使未知参数估计值能在有限时间内收敛至其真值。
[0166]
s200、基于复合学习参数更新律更新参数估计值,进而计算有限时间的控制力矩,通过控制力矩控制机械臂按期望轨迹运动,且机械臂关节在设定区域内活动;
[0167]
参数更新律相当于未知参数向量的变化率,可用下式计算:
[0168][0169]
为根据式(30)实时计算的经过c-1个时间步长后的参数更新律,为初始给定值,为经c个时间步长后更新得到的未知参数估计值,为其上一时刻的未知参数估计值,c=1,2,...,o,o为正整数,δtb为用户自定义时间步长,下面实验中取1ms。
[0170]
s300、若设定的时间未结束,获取下一时间为当前时间,返回步骤s100。
[0171]
本发明中的有限时间控制包括两方面内容,一是控制受限机械臂在有限时间内实现对预定轨迹的准确跟踪,二是在有限时间内结合复合学习参数更新律实现对机械臂模型未知参数的准确估计/辨识。
[0172]
上述系统的有限时间稳定性,通过李雅普诺夫函数分析可以得到验证,即:机械臂系统在所设计的有限时间控制器τ及复合学习参数更新律的作用下,若满足初始条件qi(0)∈ωi(0),且存在te>0使区间激励条件成立,则机械臂模型参数估计误差和轨迹跟踪误差均能在较弱的区间激励条件下有限时间收敛至0,并且不会出现奇异问题;同时,机械臂
各关节将一直在所限定的范围内活动。
[0173]
对下式中的v1对时间t求导并通过稳定性分析可得:s和均在有限时间收敛至0:
[0174][0175]
当s=0时,结合式(25)和(26)可得:
[0176][0177]
对下式中的v2对时间t求导并通过稳定性分析可得:e
ζ
在有限时间收敛至0,进而得到e也在有限时间收敛至0。
[0178][0179]
为验证所提方法的有效性,进行了如下实验:
[0180]
实验选择2自由度机械臂,其结构如图2所示,两关节电机的齿轮齿数比分别为160∶1和120∶1,角坐标分辨率分别为3
×
10-7
和4
×
10-7
rad,用户在matlab/simulink中运行所设计控制算法,实时计算机械臂关节控制力矩,进而控制机械臂运动,控制器的采样时间设置为1ms。对二自由度机械臂,取机械臂模型未知参数向量为θ=[θ1,θ2,...,θ7],其中:θ3=m2l1l
e2
,θ4=m1l
c1
+m2l1,θ5=m2l
c2
,θ6=k
v1
,θ7=k
v2
;未知参数向量公式中:i1和i2为机械臂两杆转动惯量,m1和m2为机械臂两杆质量,l1和l2为机械臂两杆长度,l
c1
和l
c2
为机械臂两杆质心到轴端的距离,k
v1
和k
v2
为粘滞摩擦系数。
[0181]
为保证结果的充分性,进行定点控制模式和跟踪控制模式两种情况的实验。
[0182]
1、定点控制模式:
[0183]
设置期望轨迹为:
[0184][0185]
其中:取i=1,2;为用户自定义向量,当t∈[1,3)s时,取(q
c1
,q
c2
)=(-π/4,-π/3),当t∈[3,5)s时,取(q
c1
,q
c2
)=(π/4,π/3),当t取其它值时,取(q
c1
,q
c2
)=(0,0);qd(0)=[π/12,-π/4],机械臂两关节位置限制区域为:ω1={q1(t):-0.65-0.02sin(2t)<q1(t)<0.65-0.02cos(2t)},ω2={q2(t):-0.9-0.02sin(2t)<q2(t)<-0.3-0.02cos(2t)},q(0)=[0,-π/6]
t
,f
11
=-0.1,f
21
=-0.1,f
12
=-0.05,f
22
=-0.05;控制器参数选取如下:k1=200i,γ=0.01i,k2=0.3i,γ=γs=0.6,λ=0.6,μ=0.01,t1=4,α=5,τf(0)=[0,0]
t

[0186]
当t>8s时,激励强度趋近于0,表明不存在持续激励情况。图3和图4分别为机械臂轨迹跟踪效果图和参数估计效果图。由图可以看出,所设计的控制器能控制机械臂关节位置轨迹q准确地追踪到期望轨迹qd,也能使参数估计值收敛至参数真值θ。与此同时,机械臂关节位置q能一直在限定区域内活动,证明了通用时变非对称障碍函数的有效性。
[0187]
2、跟踪控制模式:
[0188]
根据反动力学模型设置期望轨迹:
[0189][0190]
其中:x
d1
=0.5+0.2cos(πt),x
d2
=0.5+0.2sin(πt),机械臂关节角度限制区域如下:ω1={q1(t):-0.7-0.02sin(2t)<q1(t)<0.7-0.02cos(2t)},ω2={q2(t):0.2-0.02sin(2t)<q2(t)<1.1-0.02cos(2t)};取q(0)=[3π/20,π/8]
t
,f
11
=-0.1,f
21
=-0.1,f
12
=-0.05,f
22
=-0.05,控制器参数选取如下:k1=500i,γ=0.1i,k2=0.1i,γ=γs=0.6,λ=0.6,μ=0.01,t1=4,α=5,τf(0)=[0,0]
t
,,
[0191]
图5(a)、图5(b)分别为机械臂关节1和关节2的轨迹跟踪效果图,图6为参数估计效果图,结果表明,该控制方法在跟踪控制模式下也具有良好的控制性能,在满足受限条件的情况下,保证了关节位置误差和参数估计误差的收敛性。
[0192]
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本公开可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用cpu、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本公开而言更多情况下,软件程序实现是更佳的实施方式。
[0193]
尽管以上结合附图对本发明的实施方案进行了描述,但本发明并不局限于上述的具体实施方案和应用领域,上述的具体实施方案仅仅是示意性的、指导性的,而不是限制性的。本领域的普通技术人员在本说明书的启示下和在不脱离本发明权利要求所保护的范围的情况下,还可以做出很多种的形式,这些均属于本发明保护之列。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1