基于数据驱动学习的滚动优化控制方法与流程

文档序号:22844050发布日期:2020-11-06 16:47阅读:132来源:国知局

本发明属于自动化技术领域,具体涉及一种面向信号源检测与定位的基于数据驱动学习的滚动优化控制方法。



背景技术:

信号源检测与定位对人类安全有着非常重要的意义,如环境监测、传感器定位、遇险者营救等等。针对上述问题,通常采用四旋翼无人机完成信号源的检测与定位。传统的信号源检测与定位方法,通常根据信号强度和方向信息,采用径向基函数网络、kalman滤波器或者粒子滤波器等方法完成简单环境中信号源的位置评估,但这些方法难以完成复杂环境多信号源位置的同时评估。此外,由于复杂环境中不确定事件可能发生,会对传统的控制方法产生较大的干扰,从而使四旋翼无人机飞行定位产生较大影响,在这一背景下,本发明弥补了现有技术的不足。



技术实现要素:

针对现有技术的不足之处,本发明提出基于数据驱动学习的滚动优化控制方法,可以控制四旋翼无人机同时对复杂环境中多个信号源的位置进行评估,在保证信号源检测和定位精度的前提下,可以有效得管理不确定事件,提高抗干扰能力。

为实现上述发明目的,本发明的技术方案如下:

第一步:建立四旋翼无人机动力学模型,具体步骤如下:

a.四旋翼无人机动力学模型如公式(1)所示;

x、y、z分别表示在惯性坐标系下四旋翼无人机的位置;φ、θ、ψ分别表示在惯性坐标系下四旋翼无人机的横滚角,俯仰角和偏航角;分别为x、y、z的二阶导数;g是重力加速度;m是四旋翼无人机的机体质量;表示四旋翼无人机的总推力;代表四个电机的速度;kf表示转子推力系数;sin(·)和cos(·)分别为正弦函数和余弦函数;

b.四旋翼无人机惯性坐标系下姿态动力学模型如(2)所示:

其中:ix,iy,和iz表示三个轴上的惯性矩;分别为φ、θ、ψ的一阶导数;分别为φ、θ、ψ的二阶导数;表示四旋翼的扭矩;l表示从转子到四旋翼无人机质量中心的距离;km表示转子转矩系数;

第二步:基于收集到的信号强度数据,采用高斯过程回归预测出环境内信号源的位置,具体步骤如下:

a.在四旋翼无人机位置数据集ω上定义理想的信号强度值f(x),对位置数据x1,x2,…,xn∈ω,n是样本数据的个数,f(x)满足条件(3);

f(x)~gp(m(x),k(x,x))(3)

其中:f(x)=[f(x1),f(x2),...,f(xn)]t表示由信号强度组成的向量;m(x)=[m(x1),m(x2),...,m(xn)]t表示由均值函数定义的位置向量;gp(·,·)表示高斯过程回归模型,k(x,x)表示协方差矩阵,如公式(4)所示;

其中:

其中:xi和xj是四旋翼无人机的位置,i,j=1,…,n;ζ,σf,和σy是三个调节参数;是克罗内克函数,如果xi=xj,则为1,否则为0;exp(·)是指数函数;||·||2表示2范数;

b.给定一个样本数据集xi和yi分别表示已经收集到的四旋翼无人机的位置和信号强度;m是样本数据的数量;r是实数集;样本数据集中的信号强度满足公式(6);

其中:ε表示独立噪声;n表示正态分布;

为超参数集,根据样本数据,采用公式(7)计算;

其中:θ(θ)=-logp(y|d,θ)表示样本条件概率的负对数似然函数;y=[y1,...,ym]t;函数argminθθ(θ)表示在θ(θ)取最小值时,θ的取值;

d.给定预测集m*是预测样本的数量;x*和f(x*)分别表示待预测的四旋翼无人机的位置和信号强度,后验概率如公式(8)所示:

其中:

其中:cov(·)为方差;i是单位矩阵。

e.使用公式(8),可以获得环境内每一位置信号强度的概率分布,即建立信号强度分布地图,进一步把信号强度均值最大的位置确定为信号源的可能位置;

第三步:根据信号源的可能位置,对四旋翼无人机路径进行滚动优化,步骤如下:

a.成本函数设计如公式(11)所示:

其中:jk是成本函数;nc是预测长度;xk+n|k表示第k时刻预测的第k+nc步的位置变量;xk+i|k是在第k时刻预测的第k+i步的位置变量;uk+i|k是在第k时刻预测的第k+i步控制变量;xd是信号源的可能位置;α,β,γ表示非负加权因子;

b.采用滚动优化控制方法产生四旋翼无人机最优控制序列,如公式(12)所示:

其中:min表示取最小值;表示最优控制序列s.t.表示约束条件;ω和u是位置变量x和控制变量u的可行区域;因此,通过求解优化问题(12)获得了最优控制序列

c.根据最优控制序列,获得最优轨迹并将第一个位置输入到控制器中;

第四步:如果信号源没有定位,则直接返回第二步;如果信号源已经定位,则先标记该信号源,然后返回第二步,检测其它信号源;如果给定的最大搜索时间已经达到,则无人机停止运行,并输出环境内所有信号源的位置。

本发明具有以下有益效果:本发明采用高斯过程回归,能够同时评估复杂环境中多个信号源的位置。此外,运用的滚动优化方法可以有效管理不确定事件的发生,提高信号源检测和定位精度,以及抗干扰能力更强。

具体实施方式

以下结合一个实施例对本发明的技术方案作进一步的阐述说明。

以无线传感器网络为例,设定需监测的环境范围长为10米,宽为10米,建立坐标系统,将该监测环境分为50×50的小区域。其中,每个传感器节点在短时间内发送信号序列,并假定两个发送间隔5秒。具体实施步骤如下:

第一步:建立四旋翼无人机动力学模型,具体步骤如下:

a.四旋翼无人机动力学模型如公式(13)所示。

其中:x、y、z分别表示在惯性坐标系下四旋翼无人机的位置。φ、θ、ψ分别表示在惯性坐标系下四旋翼无人机的横滚角,俯仰角和偏航角;分别为x、y、z的二阶导数;g为9.8m/s2,是重力加速度;m为1.2kg,是四旋翼无人机的机体质量;表示四旋翼无人机的总推力;代表四个电机的速度;kf为10-4ns2,表示转子推力系数;sin(·)和cos(·)分别为正弦函数和余弦函数。

b.四旋翼无人机惯性坐标系下姿态动力学模型如公式(14)所示:

其中:ix、iy和iz表示三个轴上的惯性矩,取值分别为0.05kgm2、0.05kgm2和0.1kgm2分别为φ、θ、ψ的一阶导数;分别为φ、θ、ψ的二阶导数;表示四旋翼的扭矩;l为0.2m,表示从转子到四旋翼无人机质量中心的距离;km为0.1nms2,表示转子转矩系数。

第二步:基于收集到的信号强度数据,采用高斯过程回归预测出环境内传感器的位置,具体步骤如下:

a.在四旋翼无人机位置数据集ω上定义理想的信号强度值f(x),对位置数据x1,x2,…,xn∈ω,n是样本数据的个数,f(x)满足公式(15)。

f(x)~gp(m(x),k(x,x))(15)

其中:f(x)=[f(x1),f(x2),...,f(xn)]t表示由信号强度组成的向量;m(x)=[m(x1),m(x2),...,m(xn)]t由均值函数定义的位置向量;gp(·,·)表示高斯过程回归模型,k(x,x)表示协方差矩阵,如(4)所示。

其中:

其中:xi和xj是四旋翼无人机的位置(i,j=1,…,n);ζ,σf,和σy是三个调节参数;是克罗内克函数,如果xi=xj,则为1,否则为0;exp(·)是指数函数;||·||2表示2范数。

b.给定一个样本数据集xi和yi分别表示已经收集到的四旋翼无人机的位置和信号强度。m是样本数据的数量;r是实数集。样本数据集中的信号强度满足(18)。

其中:ε表示独立噪声;σy是噪声方差;n表示正态分布;

为超参数集,采用公式(19)计算。

θ=argminθθ(θ)(19)

其中:θ(θ)=-logp(y|d,θ)表示样本条件概率的负对数似然函数;y=[y1,...,ym]t;函数argminθθ(θ)表示在θ(θ)取最小值时,θ的取值。

d.给定预测集m*是预测位置的数量;x*和f(x*)分别表示待预测的四旋翼无人机的位置和信号强度,后验概率如公式(20)所示:

其中:

其中:cov(·)为方差;i是单位矩阵。

e.使用公式(20),可以获得环境内每一位置信号强度的概率分布,即建立信号强度分布地图,进一步把信号强度均值最大的位置确定为传感器节点的可能位置。

第三步:根据传感器节点的可能位置,对四旋翼无人机路径进行滚动优化,步骤如下:

a.成本函数设计如公式(23)所示:

其中:jk是成本函数;nc是预测长度;表示第k时刻预测的第k+nc步的位置变量;xk+i|k是在第k时刻预测的第k+i步的位置变量;uk+i|k是在第k时刻预测的第k+i步控制变量;xd是传感器节点的可能位置;α为1、β为0.01、γ为1。

b.采用滚动优化控制方法产生四旋翼无人机最优控制序列,如公式(24)所示:

其中:min表示取最小值;表示最优控制序列s.t.表示约束条件;ω和u是位置变量x和控制变量u的可行区域。因此,通过求解优化问题(24)获得了最优控制序列

c.根据最优控制序列,获得最优轨迹并将第一个位置输入到控制器中。

第四步:如果信号源没有定位,则直接返回第二步;如果信号源已经定位,则先标记该信号源,然后返回第二步,检测其它信号源;如果给定的最大搜索时间已经达到,则无人机停止运行,并输出环境内所有信号源的位置。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1