本发明涉及护航任务的协同控制技术领域,尤其涉及一种基于障碍环境和有界输入的护航任务协同控制方法及系统。
背景技术:
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
在过去的几十年中,多欧拉拉格朗日系统的协调控制问题引起了广泛的关注。移动机器人,水下航行器,水面船只,航天器,机械臂等都属于欧拉拉格朗日系统。由于测量噪声,建模误差,外部干扰和建模简化以及实际系统中经常存在未建模的动态,这些都可能会严重降低系统性能并导致控制系统不稳定。此外,忽略处理一些实际问题,例如输入饱和,障碍物和碰撞,都可能会造成灾难性的后果。因此,对这些领域进行研究至关重要并且很有意义。
迄今为止,与多欧拉拉格朗日系统有关的一些常见应用分别是分布共识,同步,包含控制,编队控制以及诱捕或护航。护航任务是一组机器人在未知环境中围绕并跟踪移动目标。机器人和目标之间保持指定的距离,并且机器人在目标周围均匀分布。护航任务在民用和军事领域的实用价值吸引了许多研究者的兴趣。许多方法用来实现这一任务,例如循环追踪策略,基于行为的方法,集群空间控制方法等等。
基于行为的方法属于一种典型的编队控制方法,它具有灵活性,易于实现和更新的优点,但是该方法的主要问题是如何对其进行数学上形式化。与其他行为方法相比,基于空空间的行为(nsb)控制具有清晰的数学表达这个明显的特征。nsb控制可应用于p维空间(其中p≥2是一个正整数)实现多个欧拉拉格朗日系统执行护航任务,同时避免障碍。但是,nsb控制仍然存在一些未解决的问题,例如,如何在这种行为控制架构下实现更精确的非线性动态控制。
滑模控制(smc)具有对外部干扰和系统不确定的鲁棒性能,并该控制已广泛应用在多欧拉拉格朗日系统。但是,它需要系统参数的一定先验知识,而这在许多实际应用中很难获得。比例微分(pd)控制方法是线性且无模型的,易于实现,可以用来替代smc的等效控制部分。现有技术介绍了如何将pd控制器与smc结合使用以及基于pd控制器和smc的线性机器人系统的控制方法。在上述方法中,对控制器参数进行选择都需要知道不确定性的上限,而这在某些情况下很难实现。
近年来,越来越多的基于学习的方法被用于识别模型并增强传统控制方法的鲁棒性。神经网络(nn)由于其良好的逼近能力,可用作建模非线性函数的工具。现有技术引入了径向基函数网络(rbfn)来近似scara型机器臂的非线性动力学。rbfnns可以用于估计未知的所需控制量,从而可以实现零稳态误差跟踪。现有技术公开了一种分层控制策略结合了集成滑模控制(intsmc)的优势和rbfnns的任意函数逼近优势,可以保证在短时间内将状态变量更快速地收敛到期望值并补偿干扰和不确定性。但是,上述方法主要应用于单一被控对象,如一个机械臂或一个四旋翼飞行器,上述方法还未应用于多被控对象。另外,上述方法都未考虑输入有界的问题,认为执行器能产生任意力矩,这与实际中执行器所提供的力矩是有界而矛盾的。因此,现有的技术在实际应用中或者需要采用庞大的驱动机构产生大的力矩或者根本无法得到实际应用。
技术实现要素:
为了解决上述问题,本发明提出了一种基于障碍环境和有界输入的护航任务协同控制方法及系统,考虑到护航任务和避障任务,在外环设计中采用了nsb控制,所产生速度矢量作为内环的参考值。在内环中,提出了基于反正切函数和自适应rbfnns的irpd-smc技术,确保机器人遵循参考轨迹并实现零稳态误差。
在一些实施方式中,采用如下技术方案:
基于障碍环境和有界输入的护航任务协同控制方法,包括:
采用多欧拉-拉格朗日系统描述护航任务的物理模型;
采用内外环控制结构,外环采用基于空空间的行为控制方法,产生内环物理模型所需要的期望速度和期望运动轨迹;内环基于改进的自适应径向基函数神经网络的比例导数滑模控制(irpd-smc)方法,使得在存在干扰和参数不确定的情况下,每个物理模型都能够跟踪期望速度和期望运动轨迹,实现零稳态误差和有界输入。
内环基于改进的自适应径向基函数神经网络的比例导数滑模控制方法,其控制律为:
其中,kαi是位置误差相关的增益,用于消除位置误差;kβi是差分相关的增益,用于预测整体响应趋势并防止系统动作过于剧烈;λ是近似比例增益;ki是鲁棒项增益,κ为常数;
在另一些实施方式中,采用如下技术方案:
基于障碍环境和有界输入的护航任务协同控制系统,包括:控制器,所述控制器采用内外环控制结构,外环采用基于空空间的行为控制方法,产生内环物理模型所需要的期望速度和期望运动轨迹;内环基于改进的自适应径向基函数神经网络的比例导数滑模控制方法,使得在存在干扰和参数不确定的情况下,每个物理模型都能够跟踪期望速度和期望运动轨迹,实现零稳态误差和有界输入。
在另一些实施方式中,采用如下技术方案:
一种终端设备,其包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行上述的基于障碍环境和有界输入的护航任务协同控制方法。
在另一些实施方式中,采用如下技术方案:
一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行上述的基于障碍环境和有界输入的护航任务协同控制方法。
与现有技术相比,本发明的有益效果是:
在存在模型不确定性、干扰和障碍的情况下,本文研究了多欧拉拉格朗日系统在有界输入下护航任务的协调控制问题;设计了由nsb和irpd-smc组成的鲁棒分层控制结构;为了避免障碍和完成护航任务,在外环设计中采用了nsb控制并产生内环所需的速度和轨迹;内环设计中提出了irpd-smc来跟踪期望的轨迹和速度。这样,控制器很好地补偿了未知干扰和参数不确定性,确保了控制输入有界,实现了快速收敛、鲁棒和零稳态误差。最终,在p维空间下所有的机器人都能够实现在目标周围均匀分布且在指定距离下鲁棒地护送目标同时避免障碍(这里p≥2是一个正整数)。
在实际中,执行器的能力是有限的,很多情况下它们可能无法产生所期望的足够大力矩,从而会导致控制系统的性能下降。因此考虑控制输入有界这个实际问题,确保输入是有限幅值的,可以保证控制系统性能稳定,保证控制系统在实际中可以得到真正地应用。
控制器设计中所采用的自适应径向基函数神经网络所具备的强大的学习能力和鲁棒性,很好地补偿了干扰且最终实现了零稳态误差。
本发明所提出的控制器具有简单、无模型和能提供连续的控制信号,使得该控制器在实际中易于实现。
附图说明
图1为本发明实施例一中基于障碍环境和有界输入的护航任务协同控制框图;
图2为本发明实施例一中双曲正切函数和反正切函数示意图;
图3为本发明实施例一中5.5*arctan(0.2*x)和arctan(0.2*x)的函数曲线;
图4为本发明实施例一中在情况1中采用irpd-smc时目标和机器人的轨迹;
图5(a)-(d)为本发明实施例一中情况1中采用irpd-smc时的控制结果;
图6(a)-(d)为本发明实施例一中情况1中采用pd-smc时的控制结果;
图7(a)-(d)为本发明实施例一中情况1中采用apd-smc时的控制结果;
图8(a)-(d)为本发明实施例一中情况1中采用asmc时的控制结果;
图9为本发明实施例一中情况1中采用irpd-smc时的控制输入;
图10为本发明实施例一中情况2中采用irpd-smc时机器人和目标的轨迹;
图11(a)-(d)为本发明实施例一中情况2中采用irpd-smc时的控制结果;
图12(a)-(d)为本发明实施例一中情况2中采用apd-smc时的控制结果;
图13(a)-(d)为本发明实施例一中情况2中采用asmc时的控制结果;
图14为本发明实施例一中情况3中采用irpd-smc时机器人和目标的轨迹;
图15为本发明实施例一中情况3中采用irpd-smc时机器人与障碍之间的距离;
图16(a)-(d)为本发明实施例一中情况3中采用irpd-smc时的控制结果;
图17(a)-(d)为本发明实施例一中情况3中采用apd-smc时的控制结果;
图18(a)-(d)为本发明实施例一中情况3中采用asmc时的控制结果。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本发明使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一
在一个或多个实施例中,公开了一种基于障碍环境和有界输入的护航任务协同控制方法,参照图1,包括:
采用多欧拉-拉格朗日系统描述护航任务的物理模型;
采用内外环控制结构,外环采用基于空空间的行为控制方法,产生内环物理模型所需要的期望速度和期望运动轨迹;内环基于改进的自适应径向基函数神经网络的比例导数滑模控制方法,使得在存在干扰和参数不确定的情况下,每个物理模型都能够跟踪期望速度和期望运动轨迹,实现零稳态误差和有界输入。
本实施例为了避免障碍物且形成护航队形,在外环控制器设计中采用了基于空空间的行为(nsb)控制,生成了内环所需的速度。在内环的设计中基于改进的自适应径向基函数神经网络(rbfnns)的比例导数滑模控制(irpd-smc)方法,在存在干扰和参数不确定的情况下该系统具有跟踪的鲁棒性,并实现了零稳态误差和有界输入。最终,在p维空间下所有的机器人都能够实现在目标周围均匀分布且在指定距离下鲁棒地护送目标同时避免障碍(这里p≥2是一个正整数)。
使用李亚普诺夫稳定性理论严格证明了该系统的稳定性和收敛性,并在二维和三维空间中通过与pd-smc,apd-smc以及asmc仿真实验进行比较,验证了所提出的控制策略的有效性。
下面对本实施例方法进行详细地说明。
考虑一组n个移动机器人,其动力学可以描述为欧拉-拉格朗日系统,表示为:
其中,mi(qi)∈rp×p是正定惯性矩阵,qi∈rp是广义坐标向量,
假设欧拉-拉格朗日系统具有以下性质:
性质1有界性:对于任何一个i,存在正常数
性质2斜对称性:
性质3动态参数线性化:对于所有的向量
性质4:假设扰动力
1、外环控制器设计
在外环中使用nsb控制来合并三个不同的任务,定义机器人的最终运动并生成所需的速度。所提出的irpd-smc用于多欧拉拉格朗日系统的内环中,以补偿未知干扰、参数不确定性并保证输入有界等。整个控制系统图如图1所示。
将带有避障要求的护航任务分解成三种不同子任务,分别是避障子任务,机器人均匀分布在目标周围的子任务和机器人维持在以目标为中心的球体或者超球体表面的子任务,后面两个子任务属于护航任务。
带有避障要求的护航任务的期望速度设计为
其中,
在避障子任务中,每个机器人被虚拟空间
避障任务函数和任务误差函数分别表示为:
在机器人均匀分布在目标周围的子任务中,以平面情况为例,理想队形就是正n多边形并且所有机器人最终分布在正多边形的顶点。
该任务函数,期望的任务函数和任务函数误差分别为:
这里,
kj是标识机器人沿着圆圈在第j个位置的索引,而不一定是第j个机器人。该任务的期望速度是
在机器人维持在以目标为中心的球体或者超球体表面的子任务中,任务函数,期望任务函数和任务函数误差分别为:
该任务的期望速度是:
对应的雅可比矩阵是:
其伪逆是:
备注1.1.在三维空间和p维(p>3)空间下,如何在球体和超球体上分布点的问题被视为一个汤姆逊问题。许多学者研究过这个问题,得出一定确存在合适距离的结论。
备注1.2.一旦任何机器人失控并进入另一个机器人的虚拟区域βi,o,该机器人将被视为障碍,其余的机器人必须避开它。如果同时考虑两个或者多个障碍物,将首先处理最近的障碍物。
2、内环控制器设计
为了解决模型的不确定性、外部干扰等问题并实现零稳态误差跟踪和有界输入,在内环中提出了irpd-smc。改进的pd控制器用于稳定等效部分并提供有界的输入,smc部分用于补偿外部扰动和系统不确定性部分,rbfnns用于估计系统未知的参数。
(1)irpd-smc
控制的部分涉及设计控制器并使每个机器人跟踪目标轨迹
这里,
γi=diag(γi,1,γi,2...γi,p)是正对角矩阵,定义为滑模常数,滑模面定义为:
其中,
基于性质3,参考力矩描述如下:
可以看出,
自适应rbfnns可以写成
xi=[xi,1,xi,2...xi,m]t是输入,
ci,j是神经元的中心,σi,j是高斯函数的宽度。
权值更新率设计如下:
μi是正定对角增益矩阵。
存在一个最优的rbfnns来学习参考力矩ρi使得
通过公式(6)和(9),可以得到
其中,
为了解决输入有界的问题,需要对rpd-smc控制律进行改进。目前,两种典型的饱和函数可用于确保控制输入有界,分别是双曲正切函数和反正切函数。两种函数的曲线如图2所示。
如图2所示,相比于比双曲正切函数tanh(κx)的值域范围(-1,1),反正切函数arctan(κx)的范围
通过上述分析,在充分考虑执行器饱和的情况下,设计了反正切函数来改善控制律的pd部分,于是提出了irpd-smc控制律。
其中,kαi是位置误差相关的增益,用于消除位置误差;kβi是差分相关的增益,用于预测整体响应趋势并防止系统动作过于剧烈;λ是近似比例增益;ki是鲁棒项增益。所有的增益都为正定的。
备注2.1.本实施例不考虑执行器的饱和行为,相反,提出了一种可以产生有限幅值的有界输入。在实际应用中,通过适当地调节控制器参数,可以成功地防止执行器饱和。
备注2.2.可以看出,所提出的irpd-smc算法仅与期望轨迹信号
3、稳定性分析
由等式(4),可以得到
根据等式(1)、(5)和(12),可以得到下列等式:
定理3.1.考虑等式(1)中的欧拉拉格朗日系统,等式(11)所设计的irpd-smc控制律和等式(8)的权值更新率。在假设性质1-4成立的条件下,只要控制增益满足ki>εi,max,不管干扰和系统的不确定性如何,都可以得到如下的结论。
1.如果三个任务之间没有冲突,那么三个任务可以同时完成,整个系统是全局渐进稳定,并且跟踪误差
2.如果避障任务激活且与护航任务冲突,同时增益设置为
证明:选择如下的李雅普诺夫函数v
v=v1+v2
其中,η1,η2和η3是正定的设计参数,且
将v1对时间取微分,同时将等式(4)、(8)和(15)带入,得到:
如果ki>εi,max,也就是
备注3.1.为了消除震颤,引入双曲正切函数tanh(·)来替代不连续的sign(·)函数,等式(11)可以修改成:
其中,
将v2对时间取微分,得到:
下面分别讨论两种情况:冲突任务和非冲突任务;
假设每两个任务之间都没有冲突,即
可以得出,如果每对任务之间没有冲突,那么外环子系统是全局渐进稳定的,且跟踪误差ei和
其中,
p11=η1α1,
对于任意的
其中,pij,m和pij,m分别表示p的诱导子块的上限和下限。
综上所述,定理3.1的结论证明成立。这意味着避障任务具有较高优先级,且当它与护航任务冲突时首先执行。其次,当没有冲突存在时,护航任务再执行。由于nsb是一种通过期望速度而不是期望位置起作用的运动学,需要合理设置αi,1使得速度误差主导位置误差。
通过将等式(2)带入等式(4)并考虑每两个任务互相冲突,那么
不等式(22)作为一个等式且两边取范数,可以得到:
通过选择
备注3.2.如果只是护航任务的两个子任务发生冲突,那么机器人只要完成前两个较高级别的任务。冲突也不会发生,此时
4、仿真
本实施例中,与apd-smc、asmc以及pd-smc进行对比试验,体现出所提控制器的优越性。
机器人的动力学方程设为:
在二维空间的实验考虑五个机器人,在三维空间中的实验采用六个机器人,系统参数设定为mi=1和ci=0。二维和三维空间中的外环参数分别如表1和2所示,asmc、pd-smc、apd-smc和所提出的irpd-smc的控制器参数经过反复试验调整,最终选择的参数值如表3所示。
表1
二维空间外环参数值
表2
三维空间外环参数值
表3
不同控制器的控制参数
情况1.在二维空间,五个机器人的最初位置分别为q1(0)=[5,10]t,q2(0)=[-5,5]t,q3(0)=[-5,-5]t,q4(0)=[5,-10]t,和q5(0)=[5,0]t。目标的轨迹设定为c=[3+0.1t,0]t,外部干扰参数为
在二维空间中五个机器人和目标的轨迹如图4所示。在不同控制器的作用下,机器人和目标之间的距离、两个相邻机器人之间的距离、位置跟踪误差和速度跟踪误差分别如图5(a)-8(d)所示。可以清楚地看出,当干扰出现时这些控制器的性能具有明显的差别。采用本文所提出的控制器,其控制特性能明显优于别的控制器,如图5(a)-(d)所示,图5(a)为机器人和目标之间的距离、图5(b)为两个相邻机器人之间的距离、图5(c)为位置跟踪误差、图5(d)为速度跟踪误差,由于rbfnns的学习能力和强大的鲁棒性,干扰得到了很好地补偿且最终实现了零稳态误差。
相反,如图6(a)-(d)所示,pd-smc控制器无法实现零稳态误差,也可以看出pd-smc在补偿干扰方面是受限的。当t=40s引入时不变的持续扰动
最后,irpd-smc的控制输入如图9所示,图9表示的是采用irpd-smc时5个机器人的控制输入,可以看出控制输入很小且不超过4n。同样地,通过tanh(·)函数替代sign(·)函数,解决了震颤问题且控制信号是连续且物理可实现的。
情况2.为了验证所提出的控制器的抗扰性和鲁棒性,我们进行了如下的仿真实验并对结果进行了分析。在二维空间中,五个机器人的初始位置和外内环参数的设置值与情况1相同。目标的轨迹为c=[3+0.1t,sin0.1t]t,考虑噪声并通过高斯函数进行模拟,其均值为0,标准差为0.2。干扰值定义为
图10表示的是在二维空间中针对情况2使用irpd-smc技术时五个机器人和目标的轨迹。图11(a)-13(d)显示了在存在干扰和高斯噪声情况下不同控制器的仿真实验结果。与图12(a)-13(d)的控制器相比,所提出的控制器irpd-smc可以有效地抑制噪声,并确保位置和速度跟踪误差分别明显地小于0.02m和0.06m/s。
情况3.在存在高斯噪声和干扰的情况下且避障活动处于激活状态时,验证在三维空间中所提出的控制律的有效性。在三维空间中,六个机器人的初始位置设置为q1(0)=[-10,1,0]t,q2(0)=[-1,-10,0.3]t,q3(0)=[10,0,1]t,q4(0)=[0,0.5,10]t,q5(0)=[0,10,0.3]t,和q6(0)=[0,0,-10]t。目标的轨迹为c=[0.1t,3+0.1t,sin0.1t]t,障碍物的位置为q0=[15,3,-4.5]t。干扰值设置为
所提出的irpd-smc算法的仿真结果如图14-16(d)所示。很显然,所提出的控制策略能够使机器人在发生避障任务时,改变自身位置避开障碍物和碰撞。此外,从图17(a)-18(d)可以清楚地看出,与irpd-smc相比,apd-smc和asmc控制精度较低。
综上所述,以上仿真结果验证了无论避障任务是否处于激活状态,本实施例所提出的控制方法的控制效果明显优于pd-smc、apd-smc和asmc。由于rbfnns的学习能力和smc的强大鲁棒性,irpd-smc对各种干扰和噪声都具有强大的鲁棒性。此外,irpd-smc可以提供有限的控制输入来防止执行器饱和。
实施例二
在一个或多个实施方式中,公开了一种基于障碍环境和有界输入的护航任务协同控制系统,包括:控制器,所述控制器采用内外环控制结构,外环采用基于空空间的行为控制方法,产生内环物理模型所需要的期望速度和期望运动轨迹;内环基于改进的自适应径向基函数神经网络的比例导数滑模控制方法,使得在存在干扰和参数不确定的情况下,每个物理模型都能够跟踪期望速度和期望运动轨迹,实现零稳态误差和有界输入。
上述控制器的具体实现方法参照实施例一中公开的方法。
实施例三
在一个或多个实施方式中,公开了一种终端设备,其包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行实施例一中的基于障碍环境和有界输入的护航任务协同控制方法。
在另一个或多个实施方式中,公开了一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行实施例一中的基于障碍环境和有界输入的护航任务协同控制方法。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。