一种基于角色的有人/无人协同指挥控制系统及其方法

文档序号:10726004阅读:618来源:国知局
一种基于角色的有人/无人协同指挥控制系统及其方法
【专利摘要】本发明提供了一种基于角色的有人/无人协同指挥控制系统及其方法,该系统在每个团队成员中均设置基于行为的控制层、面向角色的决策层以及任务计划层。控制层提供自动巡航和需要连续传感器反馈的行为。任务计划层产生任务报文。面向角色的决策层包括团队角色表,任务管理器以及态势感知器。团队角色表存储角色信息。任务管理器包括任务列表和任务分配机,任务列表保存初始任务以及在任务执行过程中产生的新任务,任务分配机根据团队角色表以及任务优先级进行任务分配。态势感知器根据传感器信息完成态势感知并进行环境态势、自身状态以及任务代价的事件评估,团队角色表和态势感知器的事件评估结果在团队中实时更新和共享。
【专利说明】
一种基于角色的有人/无人协同指挥控制系统及其方法
技术领域
[0001] 本发明属于多智能体控制技术领域,具体涉及一种基于角色的有人/无人协同指 挥控制系统及其方法。
【背景技术】
[0002] 信息化战争中,各种无人作战平台在战场上得到越来越广泛的应用,从陆上无人 车到水下无人潜艇,再到空中无人机,无人作战平台能够充分利用其机动性强、成本低、行 动隐蔽性能好等优势,执行枯燥、恶劣和危险的任务,达到"非接触、零伤亡"的作战目标。由 于作战环境的高度动态、不确定性及作战任务的复杂性,基于程序化指挥和控制的无人作 战平台对战场态势的全局判断和应急反应能力无法达到有人作战平台相应的水平。因此将 无人平台融入有人平台的任务环境,二者协同指挥共同执行作战任务无疑将成为未来战争 中一种新颖的指挥控制模式,该方向研究也得到越来越多国内外学者的关注。
[0003] 针对传统多智能体协同指挥模式,现有的解决方案主要有以下几种:
[0004] 方案 1:文献(B Gerkey,M Mataric · A Framework for studying multi-robot task allocation[C].Proceedings of the 2003International Workshop on Multi-Robot Systems.Washington DC,USA,2003:15-26.)和文献(Atay N,Bayazit B.Mixed-integer linear programming solution to multi-robot task allocation problem [J] .Washington Univ,2006.)提出了线性规划方法,用于解决多智能体任务分配问题。但 其运算量随系统规模呈指数级增长,需要全局信息和集中管理,因而扩展性差,效率低。
[0005] 方案2:文献(Dias M B,Zlot R,Kalra N,et al .Market-based Multi-robot Coordination:A Survey and Analysis[J].Proceedings of the IEEE,2006,94(7): 1257-1270.)和文献(Zlot R,Stentz A.Market-based Multi-robot Coordination for Complex tasks[J]. International Journal of Robotics Research,2007,25(1):578-589.)提出了一种基于自由市场架构的决策控制方法,智能体通过竞拍和协商执行多个子 任务。由于在不确定环境信息和分布式任务分配问题中的优良性能,该方法被广泛应用于 多机器人分布式目标分配中,能够在规定的时间约束下得到满意的多机协同目标分配方 案。但是该方法资源消耗多,对通信依赖性高。在资源有限、通信不可靠的环境中难以发挥 预期的效果。
[0006] 方案3:文献(Satterfield B,Choxi H,Housten D.Role Based 0perations[M] .Springer Netherlands,2004.)和文南犬(B.Satterf ield,S·Jameson,H·Choxi,and J.Franke,〃A Role-Based Approach to Unmanned Team Operations,〃in Association for Unmanned Vehicle Systems International conference ,Baltimore,MD, June 2005.)提出一种基于角色的无人团队指挥方式J亥方式受社会学与商业管理学研究启发, 使用人类团队概念,定义责任领域和成员内在关系,适应人类团队中的任务计划和执行的 协作方式,使无人平台自然融入到存在人类的团队当中。但由于其依赖固有的原始作战方 案,缺少完善的态势感知单元,以及缺乏事件处理规则的更新过程,因而难以适应动态、不 确定的复杂作战环境。

【发明内容】

[0007] 有鉴于此,本发明提供了一种基于角色的有人/无人协同指挥控制系统及其方法, 使用该系统及其方法的有人/无人平台组成的多智能体系统,其处理事件、分配任务和完成 任务的过程更加灵活,且更加可靠。
[0008] 为了达到上述目的,本发明的技术方案为:一种基于角色的有人/无人协同指挥控 制系统,该系统针对由有人平台和无人平台作为团队成员而组成的团队进行协同指挥控 制,该系统在每个团队成员中均设置基于行为的控制层、面向角色的决策层以及任务计划 层。
[0009] 基于行为的控制层提供自动巡航和需要连续传感器反馈的行为。
[0010] 任务计划层产生任务报文,任务报文包括任务目标、交战规则以及明确不同团队 成员责任需要的息。
[0011]面向角色的决策层包括团队角色表,任务管理器以及态势感知器。
[0012] 团队角色表用于存储角色信息,角色信息中包括每个角色对应的团队成员以及每 个团队成员的状态,其中一个角色对应多个团队成员,一个团队成员也对应多种角色,团队 成员在执行不同任务时角色不同;在通信无效的状态下,依据团队角色表预测团队成员的 行为。
[0013] 任务管理器包括任务列表和任务分配机,任务列表保存初始任务以及在任务执行 过程中产生的新任务,任务分配机根据团队角色表以及任务优先级进行任务分配。
[0014] 态势感知器根据传感器信息完成态势感知并进行环境态势、自身状态以及任务代 价的事件评估,团队角色表和态势感知器的事件评估结果在团队中实时更新和共享。
[0015] 进一步地,包含以下步骤:
[0016] 步骤一、在任务开始前,有人平台中的任务计划层依据各团队成员的能力特点,赋 予各自角色,基于角色进行初始任务分配,并向团队成员发布任务报文。
[0017] 步骤二、各团队成员将接收到的任务报文存储在任务列表中,并按照优先级原则 选取优先级较高的任务作为将要执行的任务;该团队成员中面向角色的决策层根据该任务 类型初始化该团队成员的角色,生成团队角色表。
[0018] 步骤二、有人平台下达开始指令,各团队成员开始执行将要执行的任务;其中任务 中涉及自动巡航或者需要连续传感器反馈的行为由基于行为的控制层执行。
[0019] 步骤三、团队成员在任务执行过程中,决策层中的态势感知器采集传感器反馈信 息,采用ΒΡ神经网络对环境态势、自身状态以及任务代价进行事件评估。
[0020] 进一步地,ΒΡ神经网络为ΒΡ网络结构,激活函数为s i gmo i d函数,该ΒΡ神经网络以 传感器的反馈值作为输入层神经元,其数量为η,以评估值作为输出层神经元,其数量为m;
[0023]节点权值的训练方法采用学习算法为梯度下降法。有人平台和无人平台中预先设 置事件处理规则库,用于存储各类事件的处理规则,有人平台和无人平台依据态势感知器 共享的事件评估结果与事件处理规则库对比,采取相应处理规则,若一个团队成员的事件 评估结果超出事件处理规则库的范围,有人平台协助该团队成员完成事件处理。
[0024]若一团队成员在任务执行中产生新任务,任务分配机根据团队角色表以及任务优 先级将该新任务发送给其他团队成员或自身。
[0025] 事件处理规则库中一个事件评估结果对应多种处理规则,且每种处理规则具有一 个采用指数,采用指数最高的处理规则为该事件评估结果优先采取的处理规则;采用指数 采用适应度函数进行计算,当采用指数低于设定阈值时,对其进行更新。进一步地,当采用 指数低于设定阈值时,对其进行更新的过程具体为:
[0026] i、在事件处理规则库中随机选取两个处理规则作为父体,每个处理规则被选取的 概率是其采用指数的增函数。
[0027] ii、对于选中的父体,按照预设的交换概率P。进行交换,交换后产生两个交换后的 后代。
[0028] iii、对于产生的两个交换后的后代,分别在每个位置上按照变异概率Pm发生变 异,产生两个变异后的后代。
[0029] iv、若变异后的后代高于阈值时,则采用该变异后的后代替换一个低于设定阈值 的采用指数集,否则转向步骤i。
[0030] 有益效果:
[0031] 1、该方法利用角色概念,适应人类团队的协作方式,使无人平台自然融入到有人 团队当中。传统指挥模式中,有人/无人平台之间的协作往往依赖于高度集中和精确的控制 (如【背景技术】中方案1、2中所示),难以发挥无人平台的自主性,从而影响指挥效率。基于角 色的指挥模式利用角色这一传统团队概念(如【背景技术】中方案3中所示),使无人平台适应 人类团队中的任务计划和执行的协作方式,发挥无人平台自主性,同时人类可通过角色概 念,准确理解无人平台的行为,提高指挥效率。
[0032] 2、该方法基于角色划定成员责任范围,使无人平台在不可预知的复杂环境中做出 合理响应。传统指挥模式依赖固化的原始作战方案(如【背景技术】中方案3中所示),难以对未 知事件做出正确响应。基于角色的指挥模式划定成员责任范围,通过态势感知和规则集的 动态更新,使无人平台适应复杂环境,对未知事件做出合理响应,提高指挥的灵活性。
[0033] 3、该方法建立分级感知评估框架,通过态势感知网络评估环境态势、自身状态、任 务代价等进行评估,作为事件处理、任务分配和角色跳转的依据,以提高多智能体系统的灵 活性。该方法建立事件处理规则库更新机制,通过选择、交叉和变异等手段创造出新的响应 规则,以维持团队对动态变化环境的适应能力,提高多智能体系统可靠性。
[0034] 4、该方法基于角色的隐协作控制方式,可在动态、快节奏和通信不可靠的环境中 完成指挥协作。传统指挥模式通常对通信具有较强依赖性,但复杂战场环境往往难以保证 可靠的通信,因此导致协调指挥和任务分配的崩溃。隐协作控制方式在通信失效情况下,基 于角色预测团队成员行为,根据预测对响应做出调整,因而可在复杂环境中完成指挥协作, 提尚指挥鲁棒性。
【附图说明】
[0035] 图1 一基于角色的有人/无人协同指挥模式分层结构;
[0036] 图2-基于角色的任务分配和事件响应示意图;
[0037]图3-角色转变流程图;
[0038]图4 一态势感知网络输入。
【具体实施方式】
[0039]下面结合附图并举实施例,对本发明进行详细描述。
[0040] 实施例1、角色(Role)的概念是根据具体成员不同的技能特性,对成员责任范围的 描述。具体的,一个角色包括能够符合角色的能力,角色可胜任的任务类型以及对情况或事 件的特定行为或反应。角色描述有人平台、无人平台的能力以及团队对个体成员的预期。无 论通信状况如何,依据这些预期可预测各个成员在团队中的行为。定义两种类型的角色,任 务角色和团队角色。任务角色联系任务的执行,例如侦察平台和武器平台。团队角色联系团 队管理和凝聚,例如协调和团队维护。
[0041] 本发明提供的一种基于角色的有人/无人协同指挥控制系统,如图1所示,该系统 针对由有人平台和无人平台作为团队成员而组成的团队进行协同指挥控制,该系统在每个 团队成员中均设置基于行为的控制层、面向角色的决策层以及任务计划层。
[0042] 基于行为的控制层提供自动巡航和需要连续传感器反馈的行为。
[0043] 任务计划层产生任务报文,任务报文包括任务目标、交战规则以及明确不同团队 成员责任需要的息。
[0044] 面向角色的决策层包括团队角色表,任务管理器以及态势感知器。
[0045] 团队角色表用于存储角色信息,角色信息中包括每个角色对应的团队成员以及每 个团队成员的状态,其中一个角色对应多个团队成员,一个团队成员也对应多种角色,团队 成员在执行不同任务时角色不同;在通信无效的状态下,依据团队角色表预测团队成员的 行为。
[0046] 任务管理器包括任务列表和任务分配机,任务列表保存初始任务以及在任务执行 过程中产生的新任务,任务分配机根据团队角色表以及任务优先级进行任务分配。
[0047] 态势感知器根据传感器信息完成态势感知并进行环境态势、自身状态以及任务代 价的事件评估,团队角色表和态势感知器的事件评估结果在团队中实时更新和共享。
[0048]图2显示基于角色的任务分配流程。团队角色表根据各成员能力水平分配各成员 可胜任的角色。任务管理器访问团队角色表和任务角色表,确定执行任务的最优个体,通过 全局优化得到最优分配方案。
[0049] 图3显示个体成员角色转变流程。开始时个体从任务列表中选取优先级较高的任 务开始执行。由于角色代表了个体的职责,每种角色对应一种任务,因此当个体决定执行一 种任务时,实际上选择自己转变为对应的角色,履行相应的职责。确定角色后,个体按照该 角色进行任务执行和事件响应。最后更新团队角色表中自身状态。当接收到主机或其他分 机的任务时,将其加入任务列表。
[0050] 实施例2、在上述基于角色的有人/无人协同指挥控制系统的基础上,本发明提供 了 一种控制方法,包含以下步骤:
[0051] 步骤一、在任务开始前,有人平台中的任务计划层依据各团队成员的能力特点,赋 予各自角色,基于角色进行初始任务分配,并向团队成员发布任务报文。
[0052] 步骤二、各团队成员将接受到的任务报文存储在任务列表中,并按照优先级原则 选取优先级较高的任务作为将要执行的任务;该团队成员中面向角色的决策层根据该任务 类型初始化该团队成员的角色,生成团队角色表。
[0053] 步骤二、有人平台下达开始指令,各团队成员开始执行将要执行的任务。其中任务 中涉及自动巡航或者需要连续传感器反馈的行为由基于行为的控制层执行。
[0054]步骤三、团队成员在任务执行过程中,决策层中的态势感知器采集传感器反馈信 息,采用BP神经网络对环境态势、自身状态以及任务代价进行事件评估。
[0055] BP神经网络为BP网络结构,激活函数为sigmoid函数,该BP神经网络以传感器的反 馈值作为输入层神经元,其数量为η,以评估值作为输出层神经元,其数量为m;
[0058]节点权值的训练方法采用学习算法为梯度下降法。
[0059]本实施例中其中,考虑到战场环境的复杂性,评估的过程利用BP神经网络实现,通 过专家经验训练好的网络来进行评估层面的工作。以下以威胁度评估为例进行神经网络的 设计:
[0060] (1)设计网络的输入输出
[0061 ]以传感器的反馈值作为输入;评估值作为输出
[0062] 针对具体情境,说明该感知框架的应用,战场环境为侦察车和坦克混合编队执行 侦查区域任务。
[0063] 对于没有打击能力的侦察车,可从传感器中得到数据信息如图4(a)作为态势感知 神经网络的输入。可根据这些量对当前的态势进行评估,获取当前的态势评估,网络输出及 对应的评估结果如表(输出范围0~5):
[0065] (2)坦克车
[0066] 同样,考虑坦克车的因素如图4(b)所示,其中包括监控得到的自身信息以及输入 的环境信息。可根据这些量对当前的态势进行评估,获取当前的态势评估,网络输出及对应 的评估结果如表:

[0068]为了得到一个能客观体现目标威胁度的BP神经网络,对训练网络的样本采集要求 很高。需要通过按照式(1)归一化来提高训练效果:
[0070] u为输入(传感器的输出数据),min和max为该传感器的测量范围。
[0071] (2)建立神经网络
[0072]采用BP网络结构,激活函数为sigmoid函数形式为式(2)
[0076]其中1为隐层神经元个数,η为输入层神经元数,m为输出层神经元数,p为样本总数 (训练样本)。
[0077]设计学习算法,节点权值的训练方法采用学习算法为梯度下降法,其调节方式为 式⑷
[0079]匕神经网络输出值与样本期望输出值之差的绝对值;节点权值,η学习率,预设 的常数值;
[0080] (3)设计训练样本:
[0081] 利用10折交叉确认法,即将100组样本数据平均分成10个部分,每一份用作测试, 剩余的进行样本训练。这个过程一共重复10次,最终每一部分样本都有机会进行测试。 [0082]有人平台和无人平台中预先设置事件处理规则库,用于存储各类事件的处理规 贝1J,有人平台和无人平台依据态势感知器共享的事件评估结果与事件处理规则库对比,采 取相应处理规则,若一个团队成员的事件评估结果超出事件处理规则库的范围,有人平台 协助该团队成员完成事件处理。
[0083]若一团队成员在任务执行中产生新任务,任务分配机根据团队角色表以及任务优 先级将该新任务发送给其他团队成员或自身;
[0084] 事件处理规则库中一个事件评估结果对应多种处理规则,且每种处理规则具有一 个采用指数,采用指数最高的处理规则为该事件评估结果优先采取的处理规则;采用指数 采用适应度函数进行计算,当采用指数低于设定阈值时,对其进行更新,过程具体为:
[0085] i、在事件处理规则库中随机选取两个处理规则作为父体,每个处理规则被选取的 概率是其采用指数的增函数;
[0086] ii、对于选中的父体,按照预设的交换概率P。进行交换,交换后产生两个交换后的 后代;
[0087] iii、对于产生的两个交换后的后代,分别在每个位置上按照变异概率Pm发生变 异,产生两个变异后的后代;
[0088] iv、若变异后的后代高于阈值时,则采用该变异后的后代替换一个地狱设定阈值 的采用指数集,否则转向步骤i。
[0089]综上,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在 本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护 范围之内。
【主权项】
1. 一种基于角色的有人/无人协同指挥控制系统,其特征在于,该系统针对由有人平台 和无人平台作为团队成员而组成的团队进行协同指挥控制,该系统在每个团队成员中均设 置基于行为的控制层、面向角色的决策层W及任务计划层; 所述基于行为的控制层提供自动巡航和需要连续传感器反馈的行为; 所述任务计划层产生任务报文,所述任务报文包括任务目标、交战规则W及明确不同 团队成员责任需要的信息; 所述面向角色的决策层包括团队角色表,任务管理器W及态势感知器; 所述团队角色表用于存储角色信息,角色信息中包括每个角色对应的团队成员W及每 个团队成员的状态,其中一个角色对应多个团队成员,一个团队成员也对应多种角色,团队 成员在执行不同任务时角色不同;在通信无效的状态下,依据团队角色表预测团队成员的 行为; 所述任务管理器包括任务列表和任务分配机,任务列表保存初始任务W及在任务执行 过程中产生的新任务,任务分配机根据团队角色表W及任务优先级进行任务分配; 所述态势感知器根据传感器信息完成态势感知并进行环境态势、自身状态W及任务代 价的事件评估,团队角色表和态势感知器的事件评估结果在团队中实时更新和共享。2. -种如权利要求1所述的基于角色的有人/无人协同指挥控制系统的控制方法,其特 征在于,包含W下步骤: 步骤一、在任务开始前,有人平台中的任务计划层依据各团队成员的能力特点,赋予各 自角色,基于角色进行初始任务分配,并向团队成员发布任务报文; 步骤二、各团队成员将接收到的任务报文存储在任务列表中,并按照优先级原则选取 优先级较高的任务作为将要执行的任务;该团队成员中面向角色的决策层根据该任务类型 初始化该团队成员的角色,生成团队角色表; 步骤二、有人平台下达开始指令,各团队成员开始执行所述将要执行的任务;其中任务 中设及自动巡航或者需要连续传感器反馈的行为由所述基于行为的控制层执行; 步骤Ξ、团队成员在任务执行过程中,决策层中的态势感知器采集传感器反馈信息,采 用BP神经网络对环境态势、自身状态W及任务代价进行事件评估; 有人平台和无人平台中预先设置事件处理规则库,用于存储各类事件的处理规则,有 人平台和无人平台依据态势感知器共享的事件评估结果与事件处理规则库对比,采取相应 处理规则,若一个团队成员的事件评估结果超出事件处理规则库的范围,有人平台协助该 团队成员完成事件处理; 若一团队成员在任务执行中产生新任务,任务分配机根据团队角色表W及任务优先级 将该新任务发送给其他团队成员或自身; 所述事件处理规则库中一个事件评估结果对应多种处理规则,且每种处理规则具有一 个采用指数,采用指数最高的处理规则为该事件评估结果优先采取的处理规则;所述采用 指数采用适应度函数进行计算,当采用指数低于设定阔值时,对其进行更新。3. 如权利要求2所述的基于角色的有人/无人协同指挥控制系统的控制方法,其特征在 于,所述BP神经网络为BP网络结构,激活函数为sigmoid函数,该BP神经网络W传感器的反 馈值作为输入层神经元,其数量为η,W评估值作为输出层神经元,其数量为m; 节点数量/ = V"十。!; 训练样本数i节点权值的训练方法采用学习算法为梯度下降法。4.如权利要求2所述的基于角色的有人/无人协同指挥控制系统的控制方法,其特征在 于,所述当采用指数低于设定阔值时,对其进行更新的过程具体为: i、 在事件处理规则库中随机选取两个处理规则作为父体,每个处理规则被选取的概率 是其采用指数的增函数; ii、 对于选中的父体,按照预设的交换概率P。进行交换,交换后产生两个交换后的后代; iii、 对于产生的两个交换后的后代,分别在每个位置上按照变异概率P"发生变异,产生 两个变异后的后代; iv、 若变异后的后代高于阔值时,则采用该变异后的后代替换一个低于设定阔值的采 用指数集,否则转向步骤i。
【文档编号】G06Q10/10GK106096911SQ201610391084
【公开日】2016年11月9日
【申请日】2016年6月3日 公开号201610391084.5, CN 106096911 A, CN 106096911A, CN 201610391084, CN-A-106096911, CN106096911 A, CN106096911A, CN201610391084, CN201610391084.5
【发明人】方浩, 陈杰, 张 浩
【申请人】北京理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1