一种考虑干扰的无人集群分布式时变优化控制方法及系统

文档序号:31066785发布日期:2022-08-09 20:32阅读:159来源:国知局
一种考虑干扰的无人集群分布式时变优化控制方法及系统

1.本发明涉及无人飞行控制技术领域,特别是涉及一种考虑干扰的无人集群分布式时变优化控制方法及系统。


背景技术:

2.目前,针对无人集群系统协同控制领域的研究已经成为一大热点,包括一致性控制、编队控制和合围控制等。根据有无领导者,无人集群的编队控制通常可以划分为无领导者控制和领导-跟踪控制两大类。在领导-跟踪控制中,编队参考信息往往由领导者产生(真实存在的领导者或虚拟未知的领导者)。但是在实际的工程应用中,无人集群系统往往需要跟踪一条最优轨迹,以满足能量最优或时间最短等性能指标。例如,对于无人飞机集群从不同的位置起飞,需要完成最优阵位的集结,使得此次集结集群所消耗的能量之和最少。此时集群系统中的个体需要跟踪的轨迹并不是由领导者产生,而是满足最优条件的一条轨迹。
3.无人集群分布式优化控制因其在传感器网络、分布式参数估计、强化学习和电力系统等方面潜在的应用价值,近年来受到国内外的广泛关注与重视。无人集群系统分布式协调控制的研究,不仅能够揭示自然界中许多现象的内在规律,同时也能为人们的工作、生活和生产等实践活动提供指导。随着微电子、通信和传感器等技术的快速发展,大型网络无处不在,这极大地拓展了分布式优化算法的应用范围。
4.分布式优化控制问题通常涉及到寻找团队目标函数的最优解(在成本、损失或误差方面)。换句话说,在无人集群网络系统的分布式优化问题中,每个智能体都有一个局部成本函数,其任务目标是合作地最小化由这些目标函数的和构成的全局目标函数。智能体通过执行分布式算法优化自身的目标函数,并与自身的邻居进行局部信息交互,最终使自身状态收敛到全局目标函数的一个最优解。经典的分布式优化问题大多集中于离散系统,并采用智能优化方法进行求解。但是很多无人集群系统,包括无人飞机、机械臂和机器人等往往由连续系统来进行表征。因此针对连续系统的分布式优化问题的研究同样也十分有意义和应用价值。此外,现有的针对无人集群系统的分布式优化问题,大多假设个体具有的性能函数是时不变的,那么全局的性能函数也是时不变的,此时满足最优条件的往往是一个固定的点。但是,很多性能函数不仅仅与个体的状态有关,还与时间相关。此外,在无人机集群协同作战的过程中,受战场环境的影响,无人机不可避免地会受到风浪等未知干扰的影响,同时无人机个体所接收到的信息还会含有噪声等干扰,此时无人机的控制性能受到严重威胁。


技术实现要素:

5.有鉴于此,本发明提供了一种考虑干扰的无人集群分布式时变优化控制方法及系统,减少干扰信息产生的影响,设计分布式时变优化控制器,能够实现无人集群系统对最优轨迹的零误差跟踪,在达到一致的同时满足全局性能指标最优。
6.为实现上述目的,本发明提供了如下方案:
7.一种考虑干扰的无人集群分布式时变优化控制方法,包括:
8.获取无人集群中每个智能体的动力学模型和代价函数;所述动力学模型包括位置、速度、控制输入和干扰量;
9.基于每个智能体的动力学模型构建无人集群的作用拓扑模型;
10.基于每个智能体的动力学模型、代价函数和无人集群的作用拓扑模型得到每个智能体的第一性能常数、第二性能常数和第三性能常数;
11.基于每个智能体的动力学模型、第一性能常数、第二性能常数和第三性能常数构建每个智能体的时变控制器。
12.优选地,所述基于每个智能体的动力学模型、代价函数和无人集群的作用拓扑模型得到每个智能体的第一性能常数、第二性能常数和第三性能常数,包括:
13.基于每个智能体的动力学模型和代价函数得到每个智能体的第一常数值和第二常数值;
14.基于每个智能体的第一常数值、第二常数值和作用拓扑模型的拉普拉斯矩阵得到每个智能体的第一性能常数、第二性能常数和第三性能常数。
15.优选地,所述时变控制器如下式:
[0016][0017]
式中:i∈n,n为无人集群中智能体的总数量,ui(t)为t时刻第i个智能体的时变控制器,αi(t)为t时刻第i个智能体的第一性能常数,
·
表示求导,qi(t)为t时刻第i个智能体的位置,qj(t)表示t时刻第j个智能体的位置,βi(t)为t时刻第i个智能体的第二性能常数,γi(t)为t时刻第i个智能体的第三性能常数,ni为与第i个智能体相邻的智能体的数量,sgn为符号函数,函数,fi(qi(t),t)为t时刻第i个智能体的代价函数,为fi(qi(t),t)的梯度信息矩阵,hi(qi(t),t)为fi(qi(t),t)的hessian矩阵,代表梯度信息矩阵对于时间t的偏导数。
[0018]
优选地,所述干扰量基于所述速度、所述控制输入、干扰系统的位置矩阵和速度矩阵进行计算得到。
[0019]
本发明还提供了一种考虑干扰的无人集群分布式时变优化控制系统,包括:
[0020]
数据获取模块,用于获取无人集群中每个智能体的动力学模型和代价函数;所述动力学模型包括位置、速度、控制输入和干扰量;
[0021]
拓扑模块,用于基于每个智能体的动力学模型构建无人集群的作用拓扑模型;
[0022]
常数模块,用于基于每个智能体的动力学模型、代价函数和无人集群的作用拓扑模型得到每个智能体的第一性能常数、第二性能常数和第三性能常数;
[0023]
控制模块,用于基于每个智能体的动力学模型、第一性能常数、第二性能常数和第三性能常数构建每个智能体的时变控制器。
[0024]
优选地,所述常数模块包括:
[0025]
第一常数单元,用于基于每个智能体的动力学模型和代价函数得到每个智能体的第一常数值和第二常数值;
[0026]
第二常数单元,用于基于每个智能体的第一常数值、第二常数值和作用拓扑模型的拉普拉斯矩阵得到每个智能体的第一性能常数、第二性能常数和第三性能常数。
[0027]
优选地,所述时变控制器如下式:
[0028][0029]
式中:i∈n,n为无人集群中智能体的总数量,ui(t)为t时刻第i个智能体的时变控制器,αi(t)为t时刻第i个智能体的第一性能常数,
·
表示求导,qi(t)为t时刻第i个智能体的位置,qj(t)表示t时刻第j个智能体的位置,βi(t)为t时刻第i个智能体的第二性能常数,γi(t)为t时刻第i个智能体的第三性能常数,ni为与第i个智能体相邻的智能体的数量,sgn为符号函数,为符号函数,fi(qi(t),t)为t时刻第i个智能体的代价函数,为fi(qi(t),t)的梯度信息矩阵,hi(qi(t),t)为fi(qi(t),t)的hessian矩阵,代表梯度信息矩阵对于时间t的偏导数。
[0030]
优选地,所述干扰量基于所述速度、所述控制输入、干扰系统的位置矩阵和速度矩阵进行计算得到。
[0031]
根据本发明提供的具体实施例,本发明公开了以下技术效果:
[0032]
本发明涉及无人飞行控制技术领域,特别是涉及一种考虑干扰的无人集群分布式时变优化控制方法及系统,方法包括:获取无人集群中每个智能体的动力学模型和代价函数;基于每个智能体的动力学模型构建无人集群的作用拓扑模型;基于每个智能体的动力学模型、代价函数和无人集群的作用拓扑模型得到每个智能体的第一性能常数、第二性能常数和第三性能常数;基于每个智能体的动力学模型、第一性能常数、第二性能常数和第三性能常数构建每个智能体的时变控制器。本发明减少干扰信息产生的影响,设计分布式时变优化控制器,能够实现无人集群系统对最优轨迹的零误差跟踪,在达到一致的同时满足全局性能指标最优。
附图说明
[0033]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施
例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0034]
图1为本发明考虑干扰的无人集群分布式时变优化控制方法流程图;
[0035]
图2为本发明作用拓扑模型示意图;
[0036]
图3为本发明每个智能体的干扰量的x轴分量的估计值和实际值示意图;
[0037]
图4为本发明每个智能体的干扰量的y轴分量的估计值和实际值示意图;
[0038]
图5为本发明各智能体的位置的x坐标的控制轨迹图;
[0039]
图6为本发明各智能体的位置的y坐标的控制轨迹图;
[0040]
图7为本发明结合第1个智能体的代价函数和第2个智能体的代价函数的梯度变化示意图。
[0041]
图8为本发明考虑干扰的无人集群分布式时变优化控制系统结构图。
[0042]
符号说明:1、数据获取模块;2、拓扑模块;3、常数模块;4、控制模块。
具体实施方式
[0043]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0044]
本发明的目的是提供一种考虑干扰的无人集群分布式时变优化控制方法及系统,减少干扰信息产生的影响,设计分布式时变优化控制器,能够实现无人集群系统对最优轨迹的零误差跟踪,在达到一致的同时满足全局性能指标最优。
[0045]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
[0046]
图1为本发明考虑干扰的无人集群分布式时变优化控制方法流程图。如图1所示,本发明提供了一种考虑干扰的无人集群分布式时变优化控制方法,包括:
[0047]
步骤s1,获取无人集群中每个智能体的动力学模型和代价函数;所述动力学模型包括位置、速度、控制输入和干扰量。
[0048]
所述动力学模型如下式:
[0049][0050]
式中:i∈n,n为无人集群中智能体的总数量,qi(t)为t时刻第i个智能体的位置,ui(t)为t时刻第i个智能体的控制输入,vi(t)为t时刻第i个智能体的速度,
·
表示求导,为t时刻第i个智能体的干扰量的估计值,为t时刻第i个智能体的干扰量的估计值,vi(t)表示t时刻对第i个智能体产生干扰的干扰系统的速度矩阵,si(t)表示t时刻对第i个智能体产生干扰的干扰系统的位置矩阵,ki(t)表示t时刻对第i个智能体产生干扰的干扰系统的增益矩阵,ki(t)满足wi(t)=(si(t)+ki(t)vi(t)),wi(t)为赫尔维茨矩阵。
[0051]
步骤s2,基于每个智能体的动力学模型构建无人集群的作用拓扑模型。
[0052]
本实施例中,所述作用拓扑模型用节点和边所组成的拓扑图g={z,e,c}来描述集群系统中各个智能体之间的通讯关系。其中a={z1,z2,

,zn}表示节点集合,节点为智能体的序号,表示边集合,c=[c
ij
]∈ln×n表示具有非负权重c
ij
的邻接矩阵。将图g的入度矩阵定义为d=diag{deg
in
(z1),

,deg
in
(zn)},其中,表示节点zi的入度。定义图g的拉普拉斯矩阵为l=d-c。所建立的拓扑图是无向图。
[0053]
步骤s3,基于每个智能体的动力学模型、代价函数和无人集群的作用拓扑模型得到每个智能体的第一性能常数、第二性能常数和第三性能常数。
[0054]
具体地,所述步骤s3包括:
[0055]
步骤s31,基于每个智能体的动力学模型和代价函数得到每个智能体的第一常数值和第二常数值。
[0056]
计算公式如下:
[0057][0058]
式中:为t时刻第i个智能体的第一常数值,为t时刻第i个智能体的第二常数值,二常数值,fi(qi(t),t)为t时刻第i个智能体的代价函数,为fi(qi(t),t)的梯度信息矩阵,hi(qi(t),t)为fi(qi(t),t)的hessian矩阵,代表梯度信息矩阵对于时间t的偏导数,qj(t)为t时刻第j个智能体的位置,j∈n,γj(t)计算公式同γi(t)。
[0059]
步骤s32,基于每个智能体的第一常数值、第二常数值和作用拓扑模型的拉普拉斯矩阵得到每个智能体的第一性能常数、第二性能常数和第三性能常数。
[0060]
首先计算作用拓扑模型的常数值,计算公式如下:
[0061][0062]
式中,k1为作用拓扑模型的常数值,ε为作用拓扑模型的边的总数,n为智能体的位置的维度,λn(l)为作用拓扑模型的拉普拉斯矩阵中的最大特征值。
[0063]
再计算t时刻每个智能体的常数均值,计算公式如下:
[0064][0065]
式中:ki(t)为t时刻第i个智能体的常数均值。
[0066]
[0067][0068][0069]
式中:λ2(l)为作用拓扑模型的拉普拉斯矩阵中的最小特征值,最小特征值非0。
[0070]
步骤s4,基于每个智能体的动力学模型、第一性能常数、第二性能常数和第三性能常数构建每个智能体的时变控制器。
[0071]
所述时变控制器如下式:
[0072][0073]
式中:ui(t)为t时刻第i个智能体的时变控制器,ni为与第i个智能体相邻的智能体的数量,sgn为符号函数。
[0074]
图8为本发明考虑干扰的无人集群分布式时变优化控制系统结构图。如图8所示,本发明提供了一种考虑干扰的无人集群分布式时变优化控制系统,包括:数据获取模块1、拓扑模块2、常数模块3和控制模块4。
[0075]
所述数据获取模块1用于获取无人集群中每个智能体的动力学模型和代价函数;所述动力学模型包括位置、速度、控制输入和干扰量。
[0076]
所述拓扑模块2用于基于每个智能体的动力学模型构建无人集群的作用拓扑模型。
[0077]
所述常数模块3用于基于每个智能体的动力学模型、代价函数和无人集群的作用拓扑模型得到每个智能体的第一性能常数、第二性能常数和第三性能常数。
[0078]
所述控制模块4用于基于每个智能体的动力学模型、第一性能常数、第二性能常数和第三性能常数构建每个智能体的时变控制器。
[0079]
可选地,所述所述常数模块3包括:第一常数单元和第二常数单元。
[0080]
所述第一常数单元用于基于每个智能体的动力学模型和代价函数得到每个智能体的第一常数值和第二常数值。
[0081]
所述第二常数单元用于基于每个智能体的第一常数值、第二常数值和作用拓扑模型的拉普拉斯矩阵得到每个智能体的第一性能常数、第二性能常数和第三性能常数。
[0082]
可选地,所述时变控制器如下式:
[0083][0084]
式中:i∈n,n为无人集群中智能体的总数量,ui(t)为t时刻第i个智能体的时变控制器,αi(t)为t时刻第i个智能体的第一性能常数,
·
表示求导,qi(t)为t时刻第i个智能体的位置,qj(t)表示t时刻第j个智能体的位置,βi(t)为t时刻第i个智能体的第二性能常数,γi(t)为t时刻第i个智能体的第三性能常数,ni为与第i个智能体相邻的智能体的数量,sgn
为符号函数,
[0085]fi
(qi(t),t)为t时刻第i个智能体的代价函数,为fi(qi(t),t)的梯度信息矩阵,hi(qi(t),t)为fi(qi(t),t)的hessian矩阵,代表梯度信息矩阵对于时间t的偏导数。
[0086]
可选地,所述干扰量基于所述速度、所述控制输入、干扰系统的位置矩阵和速度矩阵进行计算得到。
[0087]
以某个包括6个智能体的无人集群为例,其作用拓扑模型如图2所示,每个智能体的位置和速度的初始值在[-6,6]中随机取值,和ηi(t)的初始值设为0,αi(t)取350,βi(t)取200,γi(t)取1500。
[0088]
其中,每个智能体的干扰量的x轴分量的实际值和估计值如图3所示,每个智能体的干扰量的y轴分量的实际值和估计值如图4所示,图3和图4中,实线代表每个智能体的实际值,虚线代表每个智能体的估计值,从图3和图4中可以看出,本发明中的方法可以很好的得到干扰量的估计值。
[0089]
每个智能体的位置通过x坐标和y坐标进行体现,图5给出了6个智能体的x坐标轨迹,图6给出了6个智能体的y坐标轨迹,图5中,q
11
为第1个智能体的x坐标轨迹,q
21
为第2个智能体的x坐标轨迹,q
31
为第3个智能体的x坐标轨迹,q
41
为第4个智能体的x坐标轨迹,q
51
为第5个智能体的x坐标轨迹,q
61
为第6个智能体的x坐标轨迹;图6中,q
12
为第1个智能体的y坐标轨迹,q
22
为第2个智能体的y坐标轨迹,q
32
为第3个智能体的y坐标轨迹,q
42
为第4个智能体的y坐标轨迹,q
52
为第5个智能体的y坐标轨迹,q
62
为第6个智能体的y坐标轨迹;从图5和图6可以看出,无人集群中6个智能体的位置最终得到了一致。图7中,将第1个智能体的代价函数和第2个智能体的代价函数进行相加作为全局代价函数,图7为全局代价函数的梯度值,从图7可以看出,全局代价函数的梯度最终逐渐变为0,根据强凸函数最优条件可以得知,无人集群可以跟踪最优轨迹。
[0090]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0091]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1