一种针对仿生扑翼飞行机器人的控制方法与流程

文档序号：12062597阅读：344来源：国知局

本发明涉及自动控制技术领域，特别是指一种针对仿生扑翼飞行机器人的控制方法。

背景技术：

近年来，随着人们对无人机技术需求的持续增加，以及先进制造技术、新材料技术和新能源技术的飞速发展，使仿生扑翼飞行机器人的研究成为技术热点。科学家们受到飞行昆虫和蜂鸟的启发，提出了仿生扑翼飞行机器人的概念，并制造出多种仿生扑翼飞行机器人。仿生扑翼飞行机器人的优点是体积小，擅长低空飞行，并具有优秀的悬停能力和盘旋能力。这些突出的优点对目标在特定环境下的搜寻，救援以及军事侦察提供了可能。

六自由度仿生扑翼飞行机器人系统的动态模型是很复杂的。虽然对动态模型进行了简化，但还是有很多模型参数需要获取。然而，有些模型参数不能被测量。即使可以测得，也需要大量的传感器，付出很高的代价，并影响控制精度。因此，需要使用可减小仿生扑翼飞行机器人对动态模型参数需求的控制方法来设计控制器。由于神经网络能很好地近似许多种类的非线性参数，可以使用神经网络控制方法控制仿生扑翼飞行机器人。

目前，有关仿生扑翼飞行机器人的专利寥寥无几，基于仿生扑翼飞行机器人模型设计的控制算法更是少之又少。

技术实现要素：

本发明要解决的技术问题是提供一种针对仿生扑翼飞行机器人的控制方法，能够填补仿生扑翼飞行机器人控制算法的空白。

为解决上述技术问题，本发明实施例提供一种针对仿生扑翼飞行机器人的控制方法，包括：

对所述仿生扑翼飞行机器人进行运动学和动力学分析，建立拉格朗日型模型；

基于所述拉格朗日型模型，设计带有扰动观测器的基于模型的姿态控制器；

基于设计的带有扰动观测器的基于模型的姿态控制器，设计带有扰动观测器的神经网络全状态反馈姿态控制器；

基于所述仿生扑翼飞行机器人的位置控制模型，设计带有扰动观测器的基于模型的位置控制器；

根据设计的带有扰动观测器的基于模型的姿态控制器、神经网络全状态反馈姿态控制器及基于模型的位置控制器，对所述仿生扑翼飞行机器人的姿态和位置进行轨迹跟踪控制。

进一步地，所述拉格朗日型模型表示为：

其中，D_r(q_r)、表示矩阵，D_r(q_r)＝I_pT，I_p表示转动惯量矩阵，T表示由身体坐标系到惯性坐标系的坐标转换矩阵，表示T对时间t的一阶导数，L(t)表示一个使等式成立的矩阵，q_r是q_r(t)的简写形式，q_r(t)表示系统姿态状态矩阵，是的简写形式，表示q_r(t)对时间t的一阶导数，表示q_r(t)对时间t的二阶导数，τ_r是τ_r(t)的简写形式，τ_r(t)表示仿生扑翼飞行机器人姿态控制输入。

进一步地，所述带有扰动观测器的基于模型的姿态控制器表示为：

e_r1＝x_r1-x_r1d

e_r2＝x_r2-α_r1

e_r3＝d_r(t)-Φ(e_r2)

其中，τ_r1表示姿态控制器，x_r1＝q_r，x_r1表示姿态状态矩阵q_r(t)，x_r2表示表示q_r(t)对时间t的一阶导数，x_r1d是x_r1d(t)的简写形式，x_r1d(t)＝[θ_1d(t),θ_2d(t),θ_3d(t)]^T，θ_1d(t),θ_2d(t),θ_3d(t)分别是身体坐标系中的三个欧拉角要跟踪的期望角度，K_r2表示控制增益，e_r1、e_r2表示状态偏差，表示系统扰动d_r(t)的估计值，表示虚拟速度跟踪轨迹α_r1对时间t的一阶导数，e_r3为辅助函数，为e_r3的估计值，Φ(e_r2)关于e_r2的函数，为关于时间t的一阶导数，K(e_r2)为Φ(e_r2)关于e_r2的导数，表示D_r(x_r1)的逆矩阵。

进一步地，所述带有扰动观测器的神经网络全状态反馈姿态控制器表示为：

e_r1＝x_r1-x_r1d

e_r2＝x_r2-α_r1

e_r3＝d_r(t)-Φ(e_r2)

其中，τ_r2表示神经网络全状态反馈姿态控制器，x_r1＝q_r，x_r1表示姿态状态矩阵，x_r2表示表示姿态状态矩阵对时间t的一阶导数，x_r1d是x_r1d(t)的简写形式，x_r1d(t)＝[θ_1d(t),θ_2d(t),θ_3d(t)]^T，θ_1d(t),θ_2d(t),θ_3d(t)分别是身体坐标系中的三个欧拉角要跟踪的期望角度，K_r2表示控制增益，e_r1、e_r2表示状态偏差，表示系统扰动d_r(t)的估计值，C₀(x_r1,x_r2)表示C_r(x_r1,x_r2)的虚拟部分，α_r1表示虚拟速度跟踪轨迹，表示神经网络的权重估计值，表示的转置，S(Z)表示神经网络基函数，Z表示神经网络的输入，e_r3为辅助函数，为e_r3的估计值，Φ(e_r2)关于e_r2的函数，为关于时间t的一阶导数，K(e_r2)为Φ(e_r2)关于e_r2的导数，表示D_r(x_r1)的逆矩阵，为表示D_r(x_r1)虚拟部分的逆矩阵。

进一步地，所述位置控制模型表示为：

其中，D_t、G_t表示矩阵，R^IB(q_r(t))表示坐标系变换阵，q_r(t)表示系统姿态状态矩阵，是的简写形式，表示q_r(t)对时间t的二阶导数，τ_t(t)表示位置控制器，d_t(t)表示系统扰动。

进一步地，所述带有扰动观测器的基于模型的位置控制器表示为：

e_t1＝x_t1-x_t1d

e_t2＝x_t2-α_t1

其中，τ_t为τ_t(t)的简写形式，τ_t表示位置控制器，q_r是q_r(t)的简写形式，(R^IB(q_r))^-1表示R^IB(q_r(t))的逆矩阵，x_t1＝q_t，x_t1、q_t表示位置变换状态矩阵，x_t2、表示位置变换状态矩阵q_t对时间t的一阶导数，x_t1d(t)＝[x_d(t),y_d(t),z_d(t)]^T，x_d(t),y_d(t),z_d(t)分别表示大地坐标系x、y、z方向上要跟踪的期望位置轨迹，e_t1、e_t2表示位置偏差，K_d、K_t4表示控制增益，表示系统扰动d_t(t)的估计值，表示虚拟速度跟踪轨迹α_t1对时间t的一阶导数。

进一步地，所述方法还包括：

采用李雅普诺夫直接法，分析加入所述带有扰动观测器的基于模型的姿态控制器后闭环系统的稳定性以及系统状态的有界性，构造的李雅普诺夫函数表示为：

其中，V₁表示构造的李雅普诺夫函数，表示与d_r(t)之间的误差，分别表示e_r1、e_r2、的转置。

进一步地，所述方法还包括：

若e_r1、e_r2、都有界，则加入所述带有扰动观测器的基于模型的姿态控制器后闭环系统的系统状态满足有界性。

进一步地，所述方法还包括：

采用李雅普诺夫直接法，分析加入所述带有扰动观测器的神经网络全状态反馈姿态控制器后闭环系统的稳定性以及系统状态的有界性，构造的李雅普诺夫函数表示为：

其中，V₂表示构造的李雅普诺夫函数，D₀(x_r1)表示D_r(x_r1)的虚拟部分，表示与d_r(t)之间的误差，表示神经网络的权重误差，表示的转置，表示预设的常数矩阵的逆矩阵，i＝1,2,3，n表示矩阵中元素的数目，分别表示e_r1、e_r2、的转置。

进一步地，所述方法还包括：

采用李雅普诺夫直接法，分析加入所述带有扰动观测器的基于模型的位置控制器后闭环系统的稳定性以及系统状态的有界性，构造的李雅普诺夫函数表示为：

其中，V₃表示构造的李雅普诺夫函数，表示与d_t(t)之间的误差，分别表示e_t1、e_t2、的转置。

本发明的上述技术方案的有益效果如下：

上述方案中，通过对所述仿生扑翼飞行机器人进行运动学和动力学分析，得到处理具有大量未知系统参数的拉格朗日型模型；基于所述拉格朗日型模型，设计带有扰动观测器的基于模型的姿态控制器；基于设计的带有扰动观测器的基于模型的姿态控制器，设计带有扰动观测器的神经网络全状态反馈姿态控制器；基于所述仿生扑翼飞行机器人的位置控制模型，设计带有扰动观测器的基于模型的位置控制器；根据设计的带有扰动观测器的基于模型的姿态控制器、神经网络全状态反馈姿态控制器及基于模型的位置控制器，只需要较少的传感器和执行器，就能有效地对仿生扑翼飞行机器人的姿态和位置进行轨迹跟踪控制。

附图说明

图1为本发明实施例提供的针对仿生扑翼飞行机器人的控制方法的流程示意图；

图2为本发明实施例提供的仿生扑翼飞行机器人的结构示意图；

图3为本发明实施例提供的系统在带有扰动观测器的基于模型的姿态控制器控制下的仿真效果图；

图4为本发明实施例提供的带有扰动观测器的姿态控制输入；

图5为本发明实施例提供的系统在带有扰动观测器的基于模型的位置控制器控制下的仿真效果图；

图6为本发明实施例提供的带有扰动观测器的基于模型的位置控制输入示意图；

图7为本发明实施例提供的系统在带有扰动观测器的神经网络全状态反馈姿态控制器控制下的仿真效果图；

图8为本发明实施例提供的带有扰动观测器的神经网络全状态反馈姿态控制输入；

图9为本发明实施例提供的系统在带有扰动观测器的基于模型的位置控制器控制下的仿真效果图；

图10为本发明实施例提供的带有扰动观测器的基于模型的位置控制输入示意图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。

为了更好地理解本实施例，先对本文中的一些简写进行举例说明，例如，q_r是q_r(t)的简写形式，是的简写形式，是的简写形式，τ_r是τ_r(t)的简写形式，τ_t为τ_t(t)的简写形式，x_r1d是x_r1d(t)的简写形式，其他类似的简写不再一一说明。

本文中，形式为表示一阶导数，表示二阶导数，在没有特殊说明的情况下，都是对时间t进行求导，例如，为w对时间t的一阶导数。

参看图1所示，本发明实施例提供的针对仿生扑翼飞行机器人的控制方法，包括：

S101，对所述仿生扑翼飞行机器人进行运动学和动力学分析，建立拉格朗日型模型；

S102，基于所述拉格朗日型模型，设计带有扰动观测器的基于模型的姿态控制器；

S103，基于设计的带有扰动观测器的基于模型的姿态控制器，设计带有扰动观测器的神经网络全状态反馈姿态控制器；

S104，基于所述仿生扑翼飞行机器人的位置控制模型，设计带有扰动观测器的基于模型的位置控制器；

S105，根据设计的带有扰动观测器的基于模型的姿态控制器、神经网络全状态反馈姿态控制器及基于模型的位置控制器，对所述仿生扑翼飞行机器人的姿态和位置进行轨迹跟踪控制。

本发明实施例所述的针对仿生扑翼飞行机器人的控制方法，通过对所述仿生扑翼飞行机器人进行运动学和动力学分析，得到处理具有大量未知系统参数的拉格朗日型模型；基于所述拉格朗日型模型，设计带有扰动观测器的基于模型的姿态控制器；基于设计的带有扰动观测器的基于模型的姿态控制器，设计带有扰动观测器的神经网络全状态反馈姿态控制器；基于所述仿生扑翼飞行机器人的位置控制模型，设计带有扰动观测器的基于模型的位置控制器；根据设计的带有扰动观测器的基于模型的姿态控制器、神经网络全状态反馈姿态控制器及基于模型的位置控制器，只需要较少的传感器和执行器，就能有效地对仿生扑翼飞行机器人的姿态和位置进行轨迹跟踪控制。

本实施例提供的针对仿生扑翼飞行机器人的控制方法具体步骤可以包括：

步骤1，如图2所示为仿生扑翼飞行机器人的结构示意图，所述仿生扑翼飞行机器人可以是六自由度仿生扑翼飞行机器人，通过对所述六自由度仿生扑翼飞行机器人进行运动学和动力学分析，得到：

其中，I_p为转动惯量矩阵，w为由身体坐标系的三个欧拉角经坐标转换到惯性坐标系的角速，q_r(t)表示系统姿态状态矩阵，T是由身体坐标系到惯性坐标系的坐标转换矩阵。

令其中，L(t)是一个使等式成立的矩阵，无实际意义，得到拉格朗日型模型：

式(2)中，矩阵D_r(q_r)＝I_pT，和D_r(q_r)无实际意义，用于简化拉格朗日型模型的表达形式；系统姿态状态矩阵q_r(t)＝[θ₁ θ₂ θ₃]^T，θ₁、θ₂、θ₃是身体坐标系中的三个欧拉角，分别是俯仰角、扭转角、偏航角；表示系统姿态状态矩阵q_r(t)对时间t的二阶导数，τ_r表示扑翼飞行器姿态控制输入，由身体坐标系到惯性坐标系的坐标转换矩阵T表示为：

令x_r1＝q_r＝[θ₁,θ₂,θ₃]^T以及于是得到：

其中，d_r(t)为系统扰动，是D_r(x_r1)的逆矩阵，是x_r1对时间t的一阶导数，是x_r2对t的一阶导数。

设计带有扰动观测器的基于模型的姿态控制器时，x_r1和x_r2是已知状态变量，设x_r1d(t)＝[θ_1d(t),θ_2d(t),θ_3d(t)]^T，其中，θ_1d(t),θ_2d(t),θ_3d(t)分别是身体坐标系中的三个欧拉角(俯仰角，扭转角，偏航角)要跟踪的期望角度，则跟踪的状态偏差分别为：

式(4)中，e_r1、e_r2表示状态偏差，虚拟速度跟踪轨迹其中，A_r1＝K_r1e_r1，K_r1≥0为控制增益。

根据式(3)，对式(4)两边求关于时间t的导数得：

基于式(6)拉格朗日型模型，设计扰动观测器，对控制器进行优化处理，设辅助函数为：

e_r3＝d_r(t)-Φ(e_r2) (7)

其中，Φ(e_r2)为关于e_r2的函数

对式(8)两边求关于时间t的导数得

其中，Φ(e_r2)关于e_r2的导数为

令的估计值为

又有扰动变量的估计值为

得到e_r3的误差

所以可得干扰的误差关于时间t的导数

为了证明加入姿态控制器后系统的稳定性和一直有界性，构造李雅普诺夫函数如下

对式(12)两边求关于时间t的导数得

K_r1≥0为控制增益，设D_r(x_r1)和C_r(x_r1,x_r2)是已知的，设计带有扰动观测器的基于拉格朗日型模型的姿态控制器为：

其中，τ_r1为基于拉格朗日型模型的姿态控制器，K_r2≥0为控制增益；

令其中，γ为大于零的常数，得系统是稳定的以及状态是有界的

其中，式(16)中ε₁，C₁为大于0的常数

其中，γ为大于零的常数，为了保证ε₁>0，系统参数需满足

λ_min(K_r1)>0

其中，I表示单位矩阵，λ_min(·)和λ_max(·)为矩阵·的最小特征值和最大特征值。

对式(18)两边同时乘以得

对式(20)两边积分得

因此，状态偏差e_r1有界，同理可得e_r2，有界，因此，加入所述带有扰动观测器的基于模型的姿态控制器后闭环系统的系统状态满足有界性。

步骤2，基于设计的带有扰动观测器的基于模型的姿态控制器，设计带有扰动观测器的神经网络全状态反馈姿态控制器，采用李雅普诺夫直接法来分析加入神经网络全状态反馈姿态控制器后闭环系统的稳定性以及系统状态的有界性。

针对扑翼飞行机器人设计神经网络全状态反馈控制器，把D_r(x_r1)和C_r(x_r1,x_r2)分成俩部分，虚拟部分设一个已知的D₀(x_r1)，则不确定的部分为ΔD_r(x_r1)＝D_r(x_r1)-D₀(x_r1)。同理，设虚拟部分为C₀(x_r1,x_r2)，C₀(x_r1,x_r2)是反对称矩阵以及不确定部分为ΔC_r(x_r1,x_r2)＝C_r(x_r1,x_r2)-C₀(x_r1,x_r2)。

设计带有扰动观测器的神经网络全状态反馈控制器为：

其中，τ_r2为神经网络全状态反馈控制器，用于估计神经网络W^*TS(Z)，其中，和W^*为神经网络的权重误差，估计值和真实值，S(Z)为神经网络基函数。

其中，是神经网络的输入，∈(Z)是神经网络的近似偏差。

神经网络的自适应律为

其中，常数Γ_i,i＝1,2,3为控制增益矩阵，小的正数σ_i>0,i＝1,2,3。

根据式(21)，重新定义式(5)为

扰动观测器辅助函数与基于拉格朗日型模型控制时一样，同理可得

设辅助函数的估计值为

同理可得

因此

设计李雅普诺夫方程为

n表示矩阵中元素的数目，对式(28)两边求关于时间t的导得

代入式(20)，(21)，(282)，(297)于(30)中得

化简得

由于S(Z)<s，其中S(Z)为RBF神经网络基函数，s为正数。最终得

其中，C₂为常数；

为了保证常数ε₂>0，系统参数需满足

λ_min(K_r1)>0,λ_min(K_r2-I)>0,

λ_min[K(e_r2)D₀(x_r1)^-1-(||K(e_r2)D₀(x_r1)^-1||²+1)I]>0

和设计的带有扰动观测器的基于模型的姿态控制器一样，有e_r1，e_r2，有界，即：加入所述带有扰动观测器的神经网络全状态反馈姿态控制器后闭环系统的系统状态满足有界性。

步骤3，基于所述仿生扑翼飞行机器人的位置控制模型，设计带有扰动观测器的基于模型的位置控制器，采用李雅普诺夫直接法来分析加入位置控制器后闭环系统的稳定性以及系统状态的有界性：

六自由度仿生扑翼飞行机器人的位置控制模型为

其中，以及坐标系变换阵而且R^IB(q_r(t))＝(R^BI(q_r(t)))^-1；其中，D_t、G_t均无实际意义，只是用来简化公式，m是仿生扑翼飞行机器人总质量，g表示重力系数，mg是仿生扑翼飞行机器人的重力，τ_t为τ_t(t)的简写形式，τ_t(t)表示位置控制器，d_t(t)为系统扰动。

令x_t1＝q_t＝[x,y,z]^T和得

其中，q_t＝[x,y,z]^T为位置变换状态矩阵

在设计基于模型的控制器时，认为x_t1和x_t2已知，x_t1d(t)＝[x_d(t),y_d(t),z_d(t)]^T，其中，x_d(t),y_d(t),z_d(t)分别是大地坐标系x、y、z方向上要跟踪的期望位置轨迹，则跟踪位置偏差为

式(37)中，e_t1、e_t2表示位置状态偏差，虚拟速度跟踪轨迹A_t1＝K_t3e_t1，K_t3≥0为控制增益。

把式(36)代入式(37)中得

为设计扰动观测器，设辅助函数为

e_t3＝d_t(t)-K_de_t2 (35)

其中，K_d>0为扰动观测器控制增益。

对辅助函数两边求关于时间t的导数得

令辅助函数的估计值为

因此

得

设李雅普诺夫函数为

对李雅普诺夫函数两边求关于时间t的导数得

设计带有扰动观测器基于所述仿生扑翼飞行机器人的位置控制模型的位置控制器为

其中，K_t4≥0为控制增益。

最后得到

其中，

其中，C₃为常数；

为了保证常数ε₃>0，系统参数需满足

和设计的带有扰动观测器的基于模型的姿态控制器一样，有e_t1，e_t2，有界，即：加入所述带有扰动观测器的基于模型的位置控制器后闭环系统的系统状态满足有界性。

步骤4：根据设计的带有扰动观测器的基于模型的姿态控制器、神经网络全状态反馈姿态控制器及基于模型的位置控制器，对所述仿生扑翼飞行机器人的姿态和位置进行轨迹跟踪控制：

本实施例中，将基于MATLAB平台进行数值仿真，验证针对仿生扑翼飞行机器人姿态和位置控制设计的带有扰动观测器的基于模型的姿态控制器、神经网络全状态反馈姿态控制器及基于模型的位置控制器的控制效果，系统参数选取如下表1：

表1仿生扑翼飞行机器人参数表

对仿生扑翼飞行机器人的姿态和位置进行轨迹跟踪控制，姿态追踪轨迹选为位置追踪轨迹为又假设姿态控制以及位置控制的干扰均为状态变量初值：x_r1(0)＝[0.01,0.01,0.01]^T，x_r2(0)＝[0.01,0.01,0.01]^T，x_t1(0)＝[0.01,0.01,0.01]^T，x_t2(0)＝[0.01,0.01,0.01]^T。

在设计基于模型的控制器时，控制增益选为：K_r1＝500，K_r2＝500，K(e_r2)＝30，K_t3＝600，K_t4＝600，K_d＝5。

则由图3和图5可知，本文设计的带有扰动观测器的基于模型的姿态控制器和位置控制器能够有效的对仿生扑翼飞行机器人的姿态和位置进行轨迹跟踪控制，由图4和图6可知，姿态控制器和位置控制器可以实现。

再根据设计的带有扰动观测器的基于模型的姿态控制器，设计带有扰动观测器的神经网络全状态反馈姿态控制器时，控制增益设定为：K_r1＝300，K_r2＝300，K(e_r2)＝50，K_t3＝500，K_t4＝500，K_d＝10，σ₁＝0.02，σ₂＝0.02，σ₃＝0.02，Γ₁＝100I，Γ₂＝100I，Γ₃＝100I。

则由图7和图9可知，本文设计的带有扰动观测器的神经网络全状态反馈姿态控制器和带有扰动观测器的基于模型的位置控制器能够有效的对仿生扑翼飞行机器人的姿态和位置进行轨迹跟踪控制。由图8和图10可知，神经网络全状态反馈姿态控制器及基于模型的位置控制器可以实现。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：贺威;闫子晨;孙长银;李鸿一
技术所有人：北京科技大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、唐老师：1.高效节能装备 2.流动稳定性 3.汽车流场分析和淀粉糖工艺技术。
2、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
3、王老师：电子信息处理、先进检测方法和智能化仪表
4、周老师：1.智能电网 2.新能源利用 3.泛在电力物联网
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。