一种针对仿生扑翼飞行机器人的控制方法与流程

文档序号:12062597阅读:344来源:国知局
一种针对仿生扑翼飞行机器人的控制方法与流程

本发明涉及自动控制技术领域,特别是指一种针对仿生扑翼飞行机器人的控制方法。



背景技术:

近年来,随着人们对无人机技术需求的持续增加,以及先进制造技术、新材料技术和新能源技术的飞速发展,使仿生扑翼飞行机器人的研究成为技术热点。科学家们受到飞行昆虫和蜂鸟的启发,提出了仿生扑翼飞行机器人的概念,并制造出多种仿生扑翼飞行机器人。仿生扑翼飞行机器人的优点是体积小,擅长低空飞行,并具有优秀的悬停能力和盘旋能力。这些突出的优点对目标在特定环境下的搜寻,救援以及军事侦察提供了可能。

六自由度仿生扑翼飞行机器人系统的动态模型是很复杂的。虽然对动态模型进行了简化,但还是有很多模型参数需要获取。然而,有些模型参数不能被测量。即使可以测得,也需要大量的传感器,付出很高的代价,并影响控制精度。因此,需要使用可减小仿生扑翼飞行机器人对动态模型参数需求的控制方法来设计控制器。由于神经网络能很好地近似许多种类的非线性参数,可以使用神经网络控制方法控制仿生扑翼飞行机器人。

目前,有关仿生扑翼飞行机器人的专利寥寥无几,基于仿生扑翼飞行机器人模型设计的控制算法更是少之又少。



技术实现要素:

本发明要解决的技术问题是提供一种针对仿生扑翼飞行机器人的控制方法,能够填补仿生扑翼飞行机器人控制算法的空白。

为解决上述技术问题,本发明实施例提供一种针对仿生扑翼飞行机器人的控制方法,包括:

对所述仿生扑翼飞行机器人进行运动学和动力学分析,建立拉格朗日型模型;

基于所述拉格朗日型模型,设计带有扰动观测器的基于模型的姿态控制器;

基于设计的带有扰动观测器的基于模型的姿态控制器,设计带有扰动观测器的神经网络全状态反馈姿态控制器;

基于所述仿生扑翼飞行机器人的位置控制模型,设计带有扰动观测器的基于模型的位置控制器;

根据设计的带有扰动观测器的基于模型的姿态控制器、神经网络全状态反馈姿态控制器及基于模型的位置控制器,对所述仿生扑翼飞行机器人的姿态和位置进行轨迹跟踪控制。

进一步地,所述拉格朗日型模型表示为:

其中,Dr(qr)、表示矩阵,Dr(qr)=IpT,Ip表示转动惯量矩阵,T表示由身体坐标系到惯性坐标系的坐标转换矩阵,表示T对时间t的一阶导数,L(t)表示一个使等式成立的矩阵,qr是qr(t)的简写形式,qr(t)表示系统姿态状态矩阵,是的简写形式,表示qr(t)对时间t的一阶导数,表示qr(t)对时间t的二阶导数,τr是τr(t)的简写形式,τr(t)表示仿生扑翼飞行机器人姿态控制输入。

进一步地,所述带有扰动观测器的基于模型的姿态控制器表示为:

er1=xr1-xr1d

er2=xr2r1

er3=dr(t)-Φ(er2)

其中,τr1表示姿态控制器,xr1=qr,xr1表示姿态状态矩阵qr(t),xr2表示表示qr(t)对时间t的一阶导数,xr1d是xr1d(t)的简写形式,xr1d(t)=[θ1d(t),θ2d(t),θ3d(t)]T,θ1d(t),θ2d(t),θ3d(t)分别是身体坐标系中的三个欧拉角要跟踪的期望角度,Kr2表示控制增益,er1、er2表示状态偏差,表示系统扰动dr(t)的估计值,表示虚拟速度跟踪轨迹αr1对时间t的一阶导数,er3为辅助函数,为er3的估计值,Φ(er2)关于er2的函数,为关于时间t的一阶导数,K(er2)为Φ(er2)关于er2的导数,表示Dr(xr1)的逆矩阵。

进一步地,所述带有扰动观测器的神经网络全状态反馈姿态控制器表示为:

er1=xr1-xr1d

er2=xr2r1

er3=dr(t)-Φ(er2)

其中,τr2表示神经网络全状态反馈姿态控制器,xr1=qr,xr1表示姿态状态矩阵,xr2表示表示姿态状态矩阵对时间t的一阶导数,xr1d是xr1d(t)的简写形式,xr1d(t)=[θ1d(t),θ2d(t),θ3d(t)]T,θ1d(t),θ2d(t),θ3d(t)分别是身体坐标系中的三个欧拉角要跟踪的期望角度,Kr2表示控制增益,er1、er2表示状态偏差,表示系统扰动dr(t)的估计值,C0(xr1,xr2)表示Cr(xr1,xr2)的虚拟部分,αr1表示虚拟速度跟踪轨迹,表示神经网络的权重估计值,表示的转置,S(Z)表示神经网络基函数,Z表示神经网络的输入,er3为辅助函数,为er3的估计值,Φ(er2)关于er2的函数,为关于时间t的一阶导数,K(er2)为Φ(er2)关于er2的导数,表示Dr(xr1)的逆矩阵,为表示Dr(xr1)虚拟部分的逆矩阵。

进一步地,所述位置控制模型表示为:

其中,Dt、Gt表示矩阵,RIB(qr(t))表示坐标系变换阵,qr(t)表示系统姿态状态矩阵,是的简写形式,表示qr(t)对时间t的二阶导数,τt(t)表示位置控制器,dt(t)表示系统扰动。

进一步地,所述带有扰动观测器的基于模型的位置控制器表示为:

et1=xt1-xt1d

et2=xt2t1

其中,τt为τt(t)的简写形式,τt表示位置控制器,qr是qr(t)的简写形式,(RIB(qr))-1表示RIB(qr(t))的逆矩阵,xt1=qt,xt1、qt表示位置变换状态矩阵,xt2、表示位置变换状态矩阵qt对时间t的一阶导数,xt1d(t)=[xd(t),yd(t),zd(t)]T,xd(t),yd(t),zd(t)分别表示大地坐标系x、y、z方向上要跟踪的期望位置轨迹,et1、et2表示位置偏差,Kd、Kt4表示控制增益,表示系统扰动dt(t)的估计值,表示虚拟速度跟踪轨迹αt1对时间t的一阶导数。

进一步地,所述方法还包括:

采用李雅普诺夫直接法,分析加入所述带有扰动观测器的基于模型的姿态控制器后闭环系统的稳定性以及系统状态的有界性,构造的李雅普诺夫函数表示为:

其中,V1表示构造的李雅普诺夫函数,表示与dr(t)之间的误差,分别表示er1、er2、的转置。

进一步地,所述方法还包括:

若er1、er2、都有界,则加入所述带有扰动观测器的基于模型的姿态控制器后闭环系统的系统状态满足有界性。

进一步地,所述方法还包括:

采用李雅普诺夫直接法,分析加入所述带有扰动观测器的神经网络全状态反馈姿态控制器后闭环系统的稳定性以及系统状态的有界性,构造的李雅普诺夫函数表示为:

其中,V2表示构造的李雅普诺夫函数,D0(xr1)表示Dr(xr1)的虚拟部分,表示与dr(t)之间的误差,表示神经网络的权重误差,表示的转置,表示预设的常数矩阵的逆矩阵,i=1,2,3,n表示矩阵中元素的数目,分别表示er1、er2、的转置。

进一步地,所述方法还包括:

采用李雅普诺夫直接法,分析加入所述带有扰动观测器的基于模型的位置控制器后闭环系统的稳定性以及系统状态的有界性,构造的李雅普诺夫函数表示为:

其中,V3表示构造的李雅普诺夫函数,表示与dt(t)之间的误差,分别表示et1、et2、的转置。

本发明的上述技术方案的有益效果如下:

上述方案中,通过对所述仿生扑翼飞行机器人进行运动学和动力学分析,得到处理具有大量未知系统参数的拉格朗日型模型;基于所述拉格朗日型模型,设计带有扰动观测器的基于模型的姿态控制器;基于设计的带有扰动观测器的基于模型的姿态控制器,设计带有扰动观测器的神经网络全状态反馈姿态控制器;基于所述仿生扑翼飞行机器人的位置控制模型,设计带有扰动观测器的基于模型的位置控制器;根据设计的带有扰动观测器的基于模型的姿态控制器、神经网络全状态反馈姿态控制器及基于模型的位置控制器,只需要较少的传感器和执行器,就能有效地对仿生扑翼飞行机器人的姿态和位置进行轨迹跟踪控制。

附图说明

图1为本发明实施例提供的针对仿生扑翼飞行机器人的控制方法的流程示意图;

图2为本发明实施例提供的仿生扑翼飞行机器人的结构示意图;

图3为本发明实施例提供的系统在带有扰动观测器的基于模型的姿态控制器控制下的仿真效果图;

图4为本发明实施例提供的带有扰动观测器的姿态控制输入;

图5为本发明实施例提供的系统在带有扰动观测器的基于模型的位置控制器控制下的仿真效果图;

图6为本发明实施例提供的带有扰动观测器的基于模型的位置控制输入示意图;

图7为本发明实施例提供的系统在带有扰动观测器的神经网络全状态反馈姿态控制器控制下的仿真效果图;

图8为本发明实施例提供的带有扰动观测器的神经网络全状态反馈姿态控制输入;

图9为本发明实施例提供的系统在带有扰动观测器的基于模型的位置控制器控制下的仿真效果图;

图10为本发明实施例提供的带有扰动观测器的基于模型的位置控制输入示意图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。

为了更好地理解本实施例,先对本文中的一些简写进行举例说明,例如,qr是qr(t)的简写形式,是的简写形式,是的简写形式,τr是τr(t)的简写形式,τt为τt(t)的简写形式,xr1d是xr1d(t)的简写形式,其他类似的简写不再一一说明。

本文中,形式为表示一阶导数,表示二阶导数,在没有特殊说明的情况下,都是对时间t进行求导,例如,为w对时间t的一阶导数。

参看图1所示,本发明实施例提供的针对仿生扑翼飞行机器人的控制方法,包括:

S101,对所述仿生扑翼飞行机器人进行运动学和动力学分析,建立拉格朗日型模型;

S102,基于所述拉格朗日型模型,设计带有扰动观测器的基于模型的姿态控制器;

S103,基于设计的带有扰动观测器的基于模型的姿态控制器,设计带有扰动观测器的神经网络全状态反馈姿态控制器;

S104,基于所述仿生扑翼飞行机器人的位置控制模型,设计带有扰动观测器的基于模型的位置控制器;

S105,根据设计的带有扰动观测器的基于模型的姿态控制器、神经网络全状态反馈姿态控制器及基于模型的位置控制器,对所述仿生扑翼飞行机器人的姿态和位置进行轨迹跟踪控制。

本发明实施例所述的针对仿生扑翼飞行机器人的控制方法,通过对所述仿生扑翼飞行机器人进行运动学和动力学分析,得到处理具有大量未知系统参数的拉格朗日型模型;基于所述拉格朗日型模型,设计带有扰动观测器的基于模型的姿态控制器;基于设计的带有扰动观测器的基于模型的姿态控制器,设计带有扰动观测器的神经网络全状态反馈姿态控制器;基于所述仿生扑翼飞行机器人的位置控制模型,设计带有扰动观测器的基于模型的位置控制器;根据设计的带有扰动观测器的基于模型的姿态控制器、神经网络全状态反馈姿态控制器及基于模型的位置控制器,只需要较少的传感器和执行器,就能有效地对仿生扑翼飞行机器人的姿态和位置进行轨迹跟踪控制。

本实施例提供的针对仿生扑翼飞行机器人的控制方法具体步骤可以包括:

步骤1,如图2所示为仿生扑翼飞行机器人的结构示意图,所述仿生扑翼飞行机器人可以是六自由度仿生扑翼飞行机器人,通过对所述六自由度仿生扑翼飞行机器人进行运动学和动力学分析,得到:

其中,Ip为转动惯量矩阵,w为由身体坐标系的三个欧拉角经坐标转换到惯性坐标系的角速,qr(t)表示系统姿态状态矩阵,T是由身体坐标系到惯性坐标系的坐标转换矩阵。

令其中,L(t)是一个使等式成立的矩阵,无实际意义,得到拉格朗日型模型:

式(2)中,矩阵Dr(qr)=IpT,和Dr(qr)无实际意义,用于简化拉格朗日型模型的表达形式;系统姿态状态矩阵qr(t)=[θ1 θ2 θ3]T,θ1、θ2、θ3是身体坐标系中的三个欧拉角,分别是俯仰角、扭转角、偏航角;表示系统姿态状态矩阵qr(t)对时间t的二阶导数,τr表示扑翼飞行器姿态控制输入,由身体坐标系到惯性坐标系的坐标转换矩阵T表示为:

令xr1=qr=[θ123]T以及于是得到:

其中,dr(t)为系统扰动,是Dr(xr1)的逆矩阵,是xr1对时间t的一阶导数,是xr2对t的一阶导数。

设计带有扰动观测器的基于模型的姿态控制器时,xr1和xr2是已知状态变量,设xr1d(t)=[θ1d(t),θ2d(t),θ3d(t)]T,其中,θ1d(t),θ2d(t),θ3d(t)分别是身体坐标系中的三个欧拉角(俯仰角,扭转角,偏航角)要跟踪的期望角度,则跟踪的状态偏差分别为:

式(4)中,er1、er2表示状态偏差,虚拟速度跟踪轨迹其中,Ar1=Kr1er1,Kr1≥0为控制增益。

根据式(3),对式(4)两边求关于时间t的导数得:

基于式(6)拉格朗日型模型,设计扰动观测器,对控制器进行优化处理,设辅助函数为:

er3=dr(t)-Φ(er2) (7)

其中,Φ(er2)为关于er2的函数

对式(8)两边求关于时间t的导数得

其中,Φ(er2)关于er2的导数为

令的估计值为

又有扰动变量的估计值为

得到er3的误差

所以可得干扰的误差关于时间t的导数

为了证明加入姿态控制器后系统的稳定性和一直有界性,构造李雅普诺夫函数如下

对式(12)两边求关于时间t的导数得

Kr1≥0为控制增益,设Dr(xr1)和Cr(xr1,xr2)是已知的,设计带有扰动观测器的基于拉格朗日型模型的姿态控制器为:

其中,τr1为基于拉格朗日型模型的姿态控制器,Kr2≥0为控制增益;

令其中,γ为大于零的常数,得系统是稳定的以及状态是有界的

其中,式(16)中ε1,C1为大于0的常数

其中,γ为大于零的常数,为了保证ε1>0,系统参数需满足

λmin(Kr1)>0

其中,I表示单位矩阵,λmin(·)和λmax(·)为矩阵·的最小特征值和最大特征值。

对式(18)两边同时乘以得

对式(20)两边积分得

因此,状态偏差er1有界,同理可得er2,有界,因此,加入所述带有扰动观测器的基于模型的姿态控制器后闭环系统的系统状态满足有界性。

步骤2,基于设计的带有扰动观测器的基于模型的姿态控制器,设计带有扰动观测器的神经网络全状态反馈姿态控制器,采用李雅普诺夫直接法来分析加入神经网络全状态反馈姿态控制器后闭环系统的稳定性以及系统状态的有界性。

针对扑翼飞行机器人设计神经网络全状态反馈控制器,把Dr(xr1)和Cr(xr1,xr2)分成俩部分,虚拟部分设一个已知的D0(xr1),则不确定的部分为ΔDr(xr1)=Dr(xr1)-D0(xr1)。同理,设虚拟部分为C0(xr1,xr2),C0(xr1,xr2)是反对称矩阵以及不确定部分为ΔCr(xr1,xr2)=Cr(xr1,xr2)-C0(xr1,xr2)。

设计带有扰动观测器的神经网络全状态反馈控制器为:

其中,τr2为神经网络全状态反馈控制器,用于估计神经网络W*TS(Z),其中,和W*为神经网络的权重误差,估计值和真实值,S(Z)为神经网络基函数。

其中,是神经网络的输入,∈(Z)是神经网络的近似偏差。

神经网络的自适应律为

其中,常数Γi,i=1,2,3为控制增益矩阵,小的正数σi>0,i=1,2,3。

根据式(21),重新定义式(5)为

扰动观测器辅助函数与基于拉格朗日型模型控制时一样,同理可得

设辅助函数的估计值为

同理可得

因此

设计李雅普诺夫方程为

n表示矩阵中元素的数目,对式(28)两边求关于时间t的导得

代入式(20),(21),(282),(297)于(30)中得

化简得

由于S(Z)<s,其中S(Z)为RBF神经网络基函数,s为正数。最终得

其中,C2为常数;

为了保证常数ε2>0,系统参数需满足

λmin(Kr1)>0,λmin(Kr2-I)>0,

λmin[K(er2)D0(xr1)-1-(||K(er2)D0(xr1)-1||2+1)I]>0

和设计的带有扰动观测器的基于模型的姿态控制器一样,有er1,er2,有界,即:加入所述带有扰动观测器的神经网络全状态反馈姿态控制器后闭环系统的系统状态满足有界性。

步骤3,基于所述仿生扑翼飞行机器人的位置控制模型,设计带有扰动观测器的基于模型的位置控制器,采用李雅普诺夫直接法来分析加入位置控制器后闭环系统的稳定性以及系统状态的有界性:

六自由度仿生扑翼飞行机器人的位置控制模型为

其中,以及坐标系变换阵而且RIB(qr(t))=(RBI(qr(t)))-1;其中,Dt、Gt均无实际意义,只是用来简化公式,m是仿生扑翼飞行机器人总质量,g表示重力系数,mg是仿生扑翼飞行机器人的重力,τt为τt(t)的简写形式,τt(t)表示位置控制器,dt(t)为系统扰动。

令xt1=qt=[x,y,z]T和得

其中,qt=[x,y,z]T为位置变换状态矩阵

在设计基于模型的控制器时,认为xt1和xt2已知,xt1d(t)=[xd(t),yd(t),zd(t)]T,其中,xd(t),yd(t),zd(t)分别是大地坐标系x、y、z方向上要跟踪的期望位置轨迹,则跟踪位置偏差为

式(37)中,et1、et2表示位置状态偏差,虚拟速度跟踪轨迹At1=Kt3et1,Kt3≥0为控制增益。

把式(36)代入式(37)中得

为设计扰动观测器,设辅助函数为

et3=dt(t)-Kdet2 (35)

其中,Kd>0为扰动观测器控制增益。

对辅助函数两边求关于时间t的导数得

令辅助函数的估计值为

因此

设李雅普诺夫函数为

对李雅普诺夫函数两边求关于时间t的导数得

设计带有扰动观测器基于所述仿生扑翼飞行机器人的位置控制模型的位置控制器为

其中,Kt4≥0为控制增益。

最后得到

其中,

其中,C3为常数;

为了保证常数ε3>0,系统参数需满足

和设计的带有扰动观测器的基于模型的姿态控制器一样,有et1,et2,有界,即:加入所述带有扰动观测器的基于模型的位置控制器后闭环系统的系统状态满足有界性。

步骤4:根据设计的带有扰动观测器的基于模型的姿态控制器、神经网络全状态反馈姿态控制器及基于模型的位置控制器,对所述仿生扑翼飞行机器人的姿态和位置进行轨迹跟踪控制:

本实施例中,将基于MATLAB平台进行数值仿真,验证针对仿生扑翼飞行机器人姿态和位置控制设计的带有扰动观测器的基于模型的姿态控制器、神经网络全状态反馈姿态控制器及基于模型的位置控制器的控制效果,系统参数选取如下表1:

表1仿生扑翼飞行机器人参数表

对仿生扑翼飞行机器人的姿态和位置进行轨迹跟踪控制,姿态追踪轨迹选为位置追踪轨迹为又假设姿态控制以及位置控制的干扰均为状态变量初值:xr1(0)=[0.01,0.01,0.01]T,xr2(0)=[0.01,0.01,0.01]T,xt1(0)=[0.01,0.01,0.01]T,xt2(0)=[0.01,0.01,0.01]T

在设计基于模型的控制器时,控制增益选为:Kr1=500,Kr2=500,K(er2)=30,Kt3=600,Kt4=600,Kd=5。

则由图3和图5可知,本文设计的带有扰动观测器的基于模型的姿态控制器和位置控制器能够有效的对仿生扑翼飞行机器人的姿态和位置进行轨迹跟踪控制,由图4和图6可知,姿态控制器和位置控制器可以实现。

再根据设计的带有扰动观测器的基于模型的姿态控制器,设计带有扰动观测器的神经网络全状态反馈姿态控制器时,控制增益设定为:Kr1=300,Kr2=300,K(er2)=50,Kt3=500,Kt4=500,Kd=10,σ1=0.02,σ2=0.02,σ3=0.02,Γ1=100I,Γ2=100I,Γ3=100I。

则由图7和图9可知,本文设计的带有扰动观测器的神经网络全状态反馈姿态控制器和带有扰动观测器的基于模型的位置控制器能够有效的对仿生扑翼飞行机器人的姿态和位置进行轨迹跟踪控制。由图8和图10可知,神经网络全状态反馈姿态控制器及基于模型的位置控制器可以实现。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1