一种用于航天器姿态控制的无模型数据驱动控制方法与流程

文档序号:15929084发布日期:2018-11-14 01:26阅读:402来源:国知局

本发明属于空间操控研究领域,具体涉及一种用于操控对象质量和惯量特性未知的空间航天器控制方法。

背景技术

近年来,航天器在轨服务技术取得了巨大的发展与进步,对于合作目标的在轨服务技术已经趋于成熟。在此基础上,对于空间非合作目标的接管与操控成为了研究的热点。由于非合作目标的质量和惯量特性未知,因此执行空间操控时服务航天器和目标航天器组成的附着质量航天器的质量和惯量特性也未知。对于此类航天器的控制问题,目前,通常采用的办法是通过参数辨识技术尽可能地建立受控系统的非常精确的数学模型,然后在此基础上进行控制系统设计。而对于大部分的质量附着航天器,由于可以得到的系统信息非常有限,而位置参数又很多,现有的参数辨识技术能获得的系统参数有限,难以满足建立系统精确数学模型的要求,导致难以设计相应的控制器,或者即使设计出具有鲁棒性的控制器,其控制效果也不理想。针对此问题,本发明将无模型控制方法引入到航天器姿态控制领域并加以完善,提出一种用于质量参数未知航天器的数据驱动控制方法。



技术实现要素:

本发明的目的在于解决航天器在轨服务任务过程中,因为非合作目标的质量特性未知导致无法建立被控对象的精确动力学模型,从而无法设计控制器的情况,将无模型控制方法引入到航天器姿态控制中并加以完善。

为了达到以上目的,本发明通过以下技术方案实现:

提供一种用于航天器姿态控制的无模型数据驱动控制方法,包括以下步骤:

步骤1:对服务航天器捕获非合作目标之后形成的空间组合体航天器,通过服务航天器上搭载的执行机构多次施加典型激励uk(k=1,…n);

步骤2:通过服务航天器上搭载的敏感器收集组合体航天器的响应信息yk(k=1,…n);

步骤3:建立组合体航天器激励uk与响应yk之间的映射关系;

步骤4:然后通过对离散数据动态线性化,设计组合体航天器控制器;

当所述无模型控制器待整定参数中μ>0表示权重因子,η,伪偏导数的时变参量φc(k)

步骤5:之后根据航天器经典动力学模型,对所述步骤4设计的控制器进行拟合;

x,y,z三个方向上的力矩-角加速度对应关系;

其中,u表示航天器的控制输入;表示航天器的角加速度输出(响应);ω表示航天器的姿态角速度;

进一步得到φ(k)

其中i=1,2,3;

将式(16)与式(7)求平均值,得到应用于动力学模型未知的航天器控制器设计的伪偏导数值

将式(17)带入下面式得到下一时刻的控制u(k)

其中λ>0表示权重因子,ρ∈(0,1]表示步长因子,y*(k+1)为期望的组合体航天器响应信号。

优选地,所述步骤3的组合体航天器激励与响应之间离散时间非线性系统

y(k+1)=f(y(k),…,y(k-ny),u(k),…,u(k-nu))(1)

其中,y(k)表示组合体航天器在k时刻的响应,u(k)表示组合体航天器在k时刻的激励,ny,nu表示两个任意的正整数,f(…)表示一个未知的非线性函数;

所述步骤4的组合体航天器控制系统,具体计算公式如下:

条件1:除有限时间点之外,f(…)关于第(ny+2)个变量的偏导数是连续的;

条件2:除有限时间点之外,组合体航天器激励响应离散时间非线性系统满足广义lipschitz条件,即对任意的k1≠k2,k1,k2≥0和u(k1)≠u(k2)有

|y(k1+1)-y(k2+1)|≤b|u(k1)-u(k2)|(2)

其中,b>0是一个常数;

对于满足条件1和条件2的非线性系统,当|δu(k)|≠0时,一定存在一个被称为伪偏导数的时变参量φc(k)∈r,使得非线性系统可以转化为数据模型。

优选地,所述转化的数据模型如下

δy(k+1)=φc(k)δu(k)(3)

其中,φc(k)对于任意的时刻k有界;

对于离散时间非线性系统,考虑如下的控制输入准则函数:

j(u(k))=|y*(k+1)-y(k+1)|2+λ|u(k)-u(k-1)|2(4)

其中,λ>0表示权重因子,用来限制控制输入量的变化;

对u(k)求导数,并且令其等于零,可以得到如下的控制算法

其中,ρ∈(0,1]是步长因子,它的加入是使控制算法更具有一般性;

对于离散时间非线性系统,考虑如下的伪偏导数估计准则函数

其中,μ>0是权重因子;

对上式关于φc(k)求极值,可以得到伪导数的估计算法为:

优选地,所述步骤5的航天器经典动力学模型,具体计算公式如下:

对于航天器姿态,目前经典的姿态动力学方程为

其中,u表示航天器的控制输入;表示航天器的角加速度输出(响应);j表示航天器的转动惯量,由于目标非合作,所以j的值未知;ω表示航天器的姿态角速度;

将式(8)改写为式(3)的形式为

其中,u表示组合体航天器的激励,表示组合体航天器的响应,j-1表示组合体航天器的逆矩阵,g(ω2)和g*2)表示与组合体航天器角速度平方相关的两个函数;

将式(9)关于时间离散化,得到:

式(10)与式(3)比较可以得到:

由于ω表示航天器的姿态角速度,是一个时变量,因此φc(k)也是一个时变量。通过计算j-1-g*2)的值,可以得到φc(k)的值。但是函数g*2)是一个本发明假设的函数,其具体的解析公式无法求解得到,但是我们可以通过如下方法得到j-1-g*2)的估计值:

当ω→0时,对方程式(9)进行泰勒展开,可略去非线性部分,得到:

其中

f'1=[j312j32j33-j21-j22-2j23]

f'2=[j11j122j13-2j21-j32-j33]

f'3=[2j21j22j23-j11-2j12-j13]

这里可以得到三组映射关系,分别描述x,y,z三个方向上的力矩-角加速度对应关系;

利用最小二乘法,多次施加力矩,测量对应的角加速度,就可以求得映射关系

利用上述形势,计算三组,分别求出之后,就可以利用需求的角加速度和测量的当前角速度ωr来反推出所需求的伪偏导数:

将式(16)与式(7)求平均值,得到应用于动力学模型未知的航天器控制器设计的伪偏导数值为:

将式(17)带入式(5)得到下一时刻的控制量。

本发明的优点为:1)与传统的控制策略相比,本发明不依赖于航天器的精确动力学模型,通过航天器的输入输出数据及敏感器测量数据就可以得到控制器的设计方法;2)在传统的紧格式离散数据动态线性化无模型自适应控制的基础上,引入航天器的激励响应特征,得到用于航天器的无模型自适应控制方法,控制收敛时间更短。

附图说明

图1为本发明步骤的流程图。

具体实施方式

对于服务航天器捕获非合作目标之后,两者之间形成稳定的固连,形成一个质量特性未知的组合体航天器。服务航天器上搭载安装的执行机构(动量轮、喷气等)对组合体航天器施加不同大小、不同方向的激励,采集组合体航天器的响应数据,利用敏感器采集组合体航天器姿态数据,采用发明内容中所阐述的控制器设计方法,实现对组合体航天器的姿态控制。

下面结合具体实施例对本发明进一步说明。

一种不依赖于航天器动力学模型的数据驱动控制方法,对服务航天器捕获非合作目标之后形成的空间组合体航天器,通过服务航天器上搭载的执行机构(动量轮、喷气等)多次施加典型激励uk(k=1,…n),通过服务航天器上搭载的敏感器收集组合体航天器的响应信息yk(k=1,…n),建立组合体航天器激励uk与响应yk之间的映射关系,然后通过对离散数据动态线性化,设计组合体航天器控制器,之后根据航天器经典动力学模型,对上述设计的控制器进行拟合。具体步骤如下:

考虑组合体航天器激励响应离散时间非线性系统

y(k+1)=f(y(k),…,y(k-ny),u(k),…,u(k-nu))(1)

其中,y(k)表示组合体航天器在k时刻的响应,u(k)表示组合体航天器在k时刻的激励,ny,nu表示两个任意的正整数,f(…)表示一个未知的非线性函数。

假设1除有限时间点之外,f(…)关于第(ny+2)个变量的偏导数是连续的。

假设2除有限时间点之外,组合体航天器激励响应离散时间非线性系统满足广义lipschitz条件,即对任意的k1≠k2,k1,k2≥0和u(k1)≠u(k2)有

|y(k1+1)-y(k2+1)|≤b|u(k1)-u(k2)|(2)

其中,b>0是一个常数。

对于满足假设1和假设2的非线性系统,当|δu(k)|≠0时,一定存在一个被称为伪偏导数的时变参量φc(k)∈r,使得非线性系统可以转化为如下的数据模型

δy(k+1)=φc(k)δu(k)(3)

其中,φc(k)对于任意的时刻k有界。

对于离散时间非线性系统,考虑如下的控制输入准则函数:

j(u(k))=|y*(k+1)-y(k+1)|2+λ|u(k)-u(k-1)|2(4)

其中,λ>0表示权重因子,用来限制控制输入量的变化,y*(k+1)为期望的组合体航天器响应信号。

对u(k)求导数,并且令其等于零,可以得到如下的控制算法

其中,ρ∈(0,1]是步长因子,它的加入是使控制算法更具有一般性。

对于离散时间非线性系统,考虑如下的伪偏导数估计准则函数

其中,μ>0是权重因子。

对上式关于φc(k)求极值,可以得到伪导数的估计算法为:

上述阐述的过程是利用紧格式动态线性化无模型自适应控制的解决一般问题的方法。本发明在此基础上根据组合体的经典动力学特性,对上述方法进行完善,具体步骤如下:

对于航天器姿态,目前经典的姿态动力学方程为

其中,u表示航天器的控制输入(激励);表示航天器的角加速度输出(响应);j表示航天器的转动惯量,由于目标非合作,所以j的值未知;ω表示航天器的姿态角速度,可以通过航天器上搭载的敏感器测得。

将式(8)改写为式(3)的形式为

其中,u表示组合体航天器的激励,表示组合体航天器的响应,j-1表示组合体航天器的逆矩阵,g(ω2)和g*2)表示与组合体航天器角速度平方相关的两个函数。

将式(9)关于时间离散化,得到:

式(10)与式(3)比较可以得到:

由于ω表示航天器的姿态角速度,是一个时变量,因此φc(k)也是一个时变量。通过计算j-1-g*2)的值,可以得到φc(k)的值。但是函数g*2)是一个本发明假设的函数,其具体的解析公式无法求解得到,但是我们可以通过如下方法得到j-1-g*2)的估计值:

在轨运行的航天器,其自旋角速度一般比较小,通常ω≤0.01rad/s,当ω→0时,对方程式(9)进行泰勒展开,可略去非线性部分,得到:

其中

f'1=[j312j32j33-j21-j22-2j23]

f'2=[j11j122j13-2j21-j32-j33]

f'3=[2j21j22j23-j11-2j12-j13]

这里可以得到三组映射关系,分别描述x,y,z三个方向上的力矩-角加速度对应关系。

通过分析可知,线性部分的数值将直接等于组合体的转动惯量。而非线性部分的方程f的值将不等于任何转动惯量中的值,而是随着角速度的变化而改变。利用最小二乘法,多次施加力矩,测量对应的角加速度,就可以求得映射关系

利用上述形势,计算三组,分别求出之后,就可以利用需求的角加速度和测量的当前角速度ωr来反推出所需求的伪偏导数:

将式(16)与式(7)求平均值,得到应用于动力学模型未知的航天器控制器设计的伪偏导数值为:

将式(17)带入式(5)得到下一时刻的控制量。

尽管本发明的内容已经通过上述优选实例作了详细介绍,但应当认识到上述的描述不应被认为是本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1