一种基于势博弈的多无人机协同搜索方法

文档序号:9921647阅读:1049来源:国知局
一种基于势博弈的多无人机协同搜索方法
【专利说明】一种基于势博弈的多无人机协同搜索方法 【技术领域】
[0001] 本发明是一种基于势博弈的多无人机协同搜索方法,属于无人机自主控制技术领 域。 【【背景技术】】
[0002] 在无人机所承担的各种任务中,侦察和搜索(Reconnaissance and Search)是目 前无人机系统的首要任务,执行这类任务的无人机通常称为无人侦察机,典型的包括美军 的"全球鹰(Global Hawk)"、"捕食者(Predator)"、"扫描鹰(Scan Eagle)"等无人机,其主 要功能为情报侦察、目标搜索、目标指示与定位、动态目标跟踪以及战场监视等等。与侦察 卫星相比,无人机的成本低,活动区域不受卫星轨道的限制,控制更加灵活,在针对动态时 间敏感目标时,可以在更短时间内获得更高分辨率的实时目标图像;与有人侦察机相比,无 人机能够昼夜持续侦察,不必考虑飞行员的疲劳和伤亡,特别在对敌方严密设防的重要地 域执行任务时,使用无人机更能体现出其优越性。因此,采用无人机对作战区域进行目标搜 索和情报侦察已经成为当前战场信息获取的重要手段。
[0003] 在无人机执行任务过程中,搜索并且发现任务区域内的目标是后续进行情报搜 集、目标定位乃至打击等一系列作战活动的基础和前提。然而,在复杂的战场条件下,由于 作战任务区域的环境复杂性、目标的不确定性、传感器设备的不确定性和任务的时间紧迫 性等因素,使得目标搜索问题十分复杂,具体表现为:任务区域范围大、环境复杂;目标的类 型和运动特性复杂;目标侦察搜索设备的性能有限;目标搜索需要满足任务时间要求等。
[0004] 对于目标搜索任务来说,单架无人机所挂载的传感器性能有限,通常只能获取有 限范围内的目标信息,无法满足对大量目标的搜索和侦察需求;另一方面,由于无人机通常 是在高危环境下执行任务,使得其故障率和毁伤率大大增加,此时,多无人机协同执行任务 将具备如下的优势:可以通过相互之间的配合提高任务完成的质量;可以通过资源和信息 的共孚扩展执彳丁任务的能力;可以通过任务的并彳丁执彳丁缩短任务完成的时间、提尚任务执 行的效率;当出现平台损毁时,可以通过任务重分配增加任务成功的概率。由此可见,组织 多架无人机协同执行任务是未来网络化战场上的一种重要作战方式,而如何有效控制多架 无人机在复杂环境中协同执行搜索任务也逐渐成为近年来协同控制领域的重要内容。
[0005] 多无人机协同搜索要求在满足特定任务要求和约束条件下,对多架无人机实施有 效的控制,从而以最小的代价高质量的完成对目标的搜索,发现尽可能多的未知目标。显 然,协同搜索能够带来更好的作战效能、实现更优的资源利用。目前,多无人机协同控制的 结构主要可分为集中式结构和分布式结构。在集中式结构下,多架无人机通常在地面任务 控制站(或空中任务控制单元)的统一指挥和控制下执行任务,作为中心的任务控制单元能 够进行慎思的规划,具有良好的全局控制与决策能力,但是在未来多无人机网络化作战条 件下,集中式控制方式将面临通信等诸多方面的问题。
[0006] 随着技术的不断发展,无人机系统的性能不断提升,无人机的自主能力也不断增 强,分布式方式逐渐成为多无人机协同控制的研究热点。在分布式控制方式下,每架无人机 具有相对独立的控制器,多无人机之间通常采取协作的方式来解决全局控制问题,系统具 有较好的鲁棒性和容错性,并且大量的计算和决策能够在无人机本地进行,从而实现信息 的分散化、控制的分散化,使得控制的可靠性和灵活性大大改善。在上述分布式方式下,无 人机平台之间的控制、决策以及信息都是高度分散的,多无人机之间的协同行为依赖于平 台之间的信息交互。此时,多无人机协同控制将面临如下挑战:通信的复杂性、计算的实时 性、环境的不确定性、信息的不一致性等问题。 【
【发明内容】

[0007] 1、发明目的:
[0008] 本发明提出了一种基于势博弈的多无人机协同搜索方法,其目的是提供一种协同 控制方法,使得无人机在执行搜索任务时能够分布式地工作,独立地针对自身所处的环境 做决策,从而达到整体效能的最优,同时能够应对通信的复杂性、计算的实时性、信息的不 一致性等问题。
[0009] 2、技术方案:
[0010] 本发明针对多无人机协同搜索的任务需求,开发了一种鲁棒性强、实时性好的基 于势博弈的多无人机协同搜索方法,该方法的步骤如下:
[0011] 步骤一:多无人机协同搜索问题建模
[0012] 考虑用η架无人机(记为V= {vi,V2,…,Vn})对一个连续的任务区域〇eIR2(K表 示实数域)进行搜索,每架无人机作为独立的决策者采用分布式策略对任务区域进行探索, 见附图1。为了表示方便,将连续的任务区域DelR 2平均分配为M=LxXLy个单元(Lx,Ly表示 任务区域横向、纵向分配的份数,Μ表示划分的单元的个数),每个单元用其中心位置g=[x, y]T(x,y表示横、纵坐标的位置,T为数学符号转置)等价代替。无人机^在时刻t对其覆盖范 围C,v内的基本单元进行一次独立的测量,测量结果为Z , , g , t,其中 = {g I |g -//Λ?| < ,y1>t表示无人机w在时刻t的位置,RS1表示无人机传感器的探测 范围。若其中心位置位于C,v之内,则某一单元g内的信息可被无人机Vl检测到。在时刻t,无 人机Vl执行一次测量,观测结果表示如下,
[0014] 此外,考虑机载传感器的内在特性,将其正确率和误警率分别定义为P(Zi,g,t=l Qg= 1) =pc和P(Zi,g,t= 1 | 9g = 0) =pf,并假设这两个参数已知,且在整个任务执行过程中保 持不变,其中0g表示目标存在于单元g中的概率。
[0015] 对于多无人机网络的通信拓扑,将其建模为一个动态图Gt=(et,Vt),该动态图中 vt为顶点集合,表示为vt = {1,2,…,N},et为连接边集合,表示为et = {{i,j} : i,j ev; | I I < Rci},其中yi,t和yj,t表示两个不同无人机vi和vj在时刻t的位置,Rci为无人机的 通信范围。无人机Vi在时刻t的邻居集合表示为Ni,t={jev| {i, j}eet} U {i},为表征方便, 设该无人机本身属于其邻居集合。无人机Vi在时刻t的度记为di,t= |Ni,t|,表示它将自身位 置信息和传感器信息传递给邻居个体的能力。
[0016] 步骤二:多无人机协调运动的势博弈建模和双对数-线性学习法势博弈求解
[0017] (1)多无人机协调运动的势博弈建模
[0018] 将多无人机协调运动建模成势博弈的过程中,包括三方面的要素:博弈参与者、参 与者行动集、效用函数。博弈参与者即为参与搜索过程的η架无人机,需要考虑的为行动集 和效用函数的设计。
[0019] 博弈参与者行动集Ai的设计:它定义了博弈参与者可选择的全部行为,其中的元 素被称为行动,是参与者在博弈过程中的决策变量。无人机的搜索效率取决于其传感器性 能以及其所在的位置,而特定无人机的传感器性能在执行任务过程中保持不变,所以它的 搜索效率由其位置决定。因此,将某一博弈者的行动集定义为在任务区域内它所能选择的 位置,Ai={g|ge Ω },Vv; e F。无人机vi的行动表示为aiEAi,整个无人机群体的集体行动 表示为3=(31,32,一,31〇,称作行动组合。设3(1:-1)为无人机¥:1在时刻1:-1的行动组合,则根 据无人机运动特性以及障碍物等行动约束,将时刻t行动集简化为上一时刻行动集的函数, 受限的行动集,记为? (彳;〇 - ,见附图2。按惯例规定,对于博弈者任一行动&1已&, 有&16(:1(&1),即无人机被允许停留在上一时刻的位置。
[0020] 在无人机被布置到任务器搜集信息时,密度函数/7: Ω^]1+(Κ+表示正的实数 集)用来记录无人机对任务区域内目标时间发生概率的了解程度。由于信号衰减,传感器性 能随着目标单元与无人机位置之间的几何距离增大而降低,因此用非减可微函数 /(|f-- >通+对传感器的信号强度进行量化分析,Ω为任务区域中单元格的 位置,Pl为无人机^的位置。无人机的性能用概率密度函数和信号衰减综合表示如下:
[0024] 式中n(q)为密度函数,RSi为无人机Vi的传感距离。
[0025] 博弈参与者效用函数Udai 的设计:在效用函数的设计过程中,需考虑所设计 博弈的可扩展性、灵活性、信息的局部性、以及效用函数的可求解性等因素。无人机^的效 用函数设计为问题整体效用的边际贡献值,记做
[0027]根据势函数的定义,按照式(3)设计效用函数,构成的博弈为势博弈,满足势博弈 的相关性质,能利用各种学习算法保证其最优性和收敛性。
[0028] (2)双对数-线性学习法的势博弈求解
[0029] 采用双对数-线性学习法对问题进行求解,减少无人机计算资源的负担,有利于多 无人机的实时运动控制。在双对数-线性学习法中,首先按异步时间模型以相同的概率随机 选择一架无人改变其位置。与此同时,其他无人机保持之前的行动不变a-dt) (t-1)。选择出的无人机从其受限行动集Cjadt-l))中选出尝试动作:?以改变其位置
[0032]其中Zl表示无人机Vl在受限行动集中行动的最大个数,表示为
[0033]无人机Vl在选择出尝试动作表后,在时刻t按照策略?1(〇[ Δ (AO来更新其动作, 博弈
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1