采用滚动时域框架的舰队防空决策与自动化调度系统与方法与流程

文档序号:14949998发布日期:2018-07-17 22:20阅读:376来源:国知局

本发明涉及水面舰艇编队多平台协同防空指挥和调度领域,尤其涉及一种采用滚动时域框架的舰队防空决策与自动化调度系统与方法。



背景技术:

水面舰艇编队防空决策与自动化调度控制问题通常被归结于wta(weapontargetassignment)问题,主要考虑武器与目标的优化匹配,这种处理的合理性在于防空系统中武器通道不可重组。在水面舰艇编队多平台协同防空信息系统(简称mce)支持下,编队可统一组织调度防空作战资源,针对来袭目标跨平台构建多个涵盖探测、决策、目指、跟踪、发射、制导全过程的武器信息通道对来自空中目标实施抗击,如何优化组织防空作战资源,提高编队协同区域防空能力,成为迫切需要解决的问题。mce条件下编队协同区域防空需要解决防空通道的组织,以及武器通道与目标的匹配。现有技术中,通过先实现武器与目标的匹配,再围绕武器为其组织信息通道来解决此问题,但基于这种分步优化的策略难以保障决策通道组织与火力分配方案的整体优化。

动态调度策略有三种模式,分别是反应式(completelyreactivescheduling)、规划-重调度(predictive-reactivescheduling)及鲁棒性调度(robustpro-reactivescheduling)。协同区域防空资源调度的特点是集中规划、分散实施,考虑到通道组织需要有一定的时间,因此反应式调度虽然具有实时性好的优势,却容易造成“顾此失彼”;防空作战的特点是不确定性和准实时性,与生产过程调度中的不确定性相比,防空作战过程中的不确定性部分源于对抗性;鲁棒性调度适于处理那些能够采用随机变量描述的不确定性因素,如适用于处理方案执行偏差的不确定性,但无法从整体上来解决防空资源的动态调度。

综上所述,目前我国在水面舰艇编队多平台协同防空指挥和自动化调度控制方面急需构建统一的动态调度框架,以应对新形势下军事指挥信息化和现代化发展。



技术实现要素:

本申请提供了一种采用滚动时域框架的舰队防空决策与自动化调度系统与方法,通过合理设计控制变量的取值,通过精确调整系统状态演化进程来搜索优化任务集,从而实现滚动时域框架的舰队防空决策与自动化调度。

第一方面,本申请提供了一种采用滚动时域框架的舰队防空决策与自动化调度方法,包括以下步骤:

(1)场景预测步骤,根据当前状态参数对一段时间内的系统状态进行预测;

(2)子过程建模步骤,建立基于状态演化的有限状态机(fsm)模型,并对所述有限状态机模型求解以获得任务集,然后根据所述任务集控制制导资源和发射资源执行防空任务,其中,所述制导资源是用于探测和跟踪目标的资源,所述发射资源是用于实施攻击的资源;

(3)重调度决策步骤,通过实时监控并评估任务执行过程中扰动类型及强度,根据扰动类型及强度确定是否需要启动重调度;若确定需要启动重调度,则重新执行步骤(1)-(2)。

其中,所述任务集中包括多个打击任务,所述打击任务是发射资源与制导资源组合起来在指定时间利用指定数量弹药对特定目标实施的打击行为。

优选地,基于以下方程建立所述有限状态机(fsm)模型:

其中上述方程满足以下约束条件:

以及

在t时刻g同时执行跟踪制导任务的数量不能超过在t时刻制导资源g的最大容量,在t时刻f同时执行打击任务的数量不能超过在t时刻发射资源f的最大容量,某个发射资源计划期内所有任务所耗费的弹药量不能超过其计划期开始时的总载弹量;

其中,g为制导资源,f为发射资源,e为目标,a为弹药资源,sijgfet表示子系统(g,f,e)在时刻t处于si.j状态,mgfaet表示任务集中在时刻t的一个任务;|g|、|f|、|a|分别表示计划期内跟踪资源、发射资源、导弹资源的规模,gelge表示由(g,e)参与的制导资源与目标的关联关系g-e关联准备任务的执行时间,gflgf表示由(g,f)参与的制导资源与发射资源的关联关系g-f关联准备任务的执行时间,gelge和gflgf均为整数值;ψgfet表示在t时刻是否产生一个close-ge(g,f,e,t)事件,表示在t时刻是否产生一个close-gf(g,f,e,t)事件,φgfet表示在t时刻是否产生一个close-all(g,f,e,t)事件,其中,close-ge(g,f,e,t)事件表示在t时刻仅关闭子系统(g,f,e)的g-e关联,close-gf(g,f,e,t)事件表示在t时刻仅关闭子系统(g,f,e)的g-f关联,close-all(g,f,e,t)事件表示在t时刻关闭子系统(g,f,e)的所有关联,ψgfet、φgfet、的取值均为0或1;dmax为所有lgfe、gelge、gflgf中的最大值,其中lgfe为执行目标打击任务的时长。

优选地,对所述有限状态机(fsm)模型求解以获得任务集具体为:通过非线性逻辑函数与线性逻辑不等式组合的等价转换方式将所述有限状态机(fsm)模型线性化之后进行再进行求解。

优选地,所述扰动类型包括执行时间扰动、目标状态扰动和资源状态扰动;其中,所述目标状态扰动包括目标生存状态变化、目标威胁等级变化以及新增目标;所述资源状态扰动包括资源短暂故障及资源长期故障。

第二方面,本申请还提供了一种采用滚动时域框架的舰队防空决策与自动化调度系统,包括以下模块:

场景预测模块,用于根据当前状态参数对一段时间内的系统状态进行预测;

子过程建模模块,用于建立基于状态演化的有限状态机(fsm)模型,并对所述有限状态机模型求解以获得任务集,根据所述任务集控制制导资源和发射资源执行防空任务,其中所述制导资源是用于探测和跟踪目标的资源,所述发射资源是用于实施攻击的资源,;

重调度决策模块,通过实时监控并评估任务执行过程中扰动类型及强度,根据扰动类型及强度确定是否需要启动重调度;若确定需要启动重调度,则调用所述场景预测模块和子过程建模模块以重新执行场景预测及子过程建模。

附图说明

图1是任务执行过程的总体时序图;

图2是给定任务m的执行过程示意图;

图3是任务执行过程中的关联状态演化路径示意图;

图4是由给定三元组(g,f,e)定义的子系统在t时刻状态演化fsm模型示意图;

图5是简化的状态演化fsm模型示意图;

图6是面向可行调度方案的0-1差分fsm模型示意图

具体实施方式

现在将参照附图详细说明本发明构思的特定实施例。

首先,针对本发明中使用的术语的含义定义如下:

资源:指的是参与到防空任务过程中的各类设备实体,包括三个类别:用于探测和跟踪目标的资源,例如监测雷达、制导雷达等,由于协同防空主要针对舰空导弹的打击形式,因此本方案中将这类资源称为“制导资源”;用于实施攻击的资源,主要是舰空导弹,因此本方案中将这类资源称为“发射资源”;作为打击目标的资源主要是敌方飞行器,在本方案中称为“目标资源”,或者在不发生歧义的情况下简称“目标”。

任务:一个协同防空任务指的是针对目标资源所制定的具有相对独立性的一次完整打击过程,其中包括了对监测、定位、制导、武器发射、观效等过程的执行时间、协同方式、打击强度、评判准则等参数的给定。

通道:基于任务中给定的具体参数值,可以针对特定目标在制导资源、发射资源打击强度3者上形成一个控制逻辑或者通讯上的联合体,这个联合体称为一个“通道”,是发起防空打击的抽象主体,也是本方案调度模型中最小粒度的优化单元。

动态调度:动态调度指的是在给定防空时段内,基于对舰艇编队形式、资源工作状态、目标运行状态的动态演化和不确定扰动的预测,通过优化计算形成迭代式的协同防空任务序列和调整策略的过程。

本发明采用的滚动时域的决策和自动化调度控制框架具有很强的适用性和可操作性,且能兼顾动态调整和区段优化两方面的优势。滚动时域的决策和自动化调度控制框架的步骤包括:场景预测、子过程建模和重调度决策。

场景预测是指根据当前状态参数对一段时间内的系统状态进行预测。

子过程建模是指将防空任务执行的全过程分割成多个子过程,每一个子过程对应一个短时间,针对每一个短时间的静态调度进行建模。因为对子过程的建模是优化计算的最终载体,因此,子过程建模是决定滚动时域调度质量的关键因素。为了让滚动的短时段静态调度能够拼接成一个长期的动态优化策略,需要从两方面来考虑,一是在静态模型中考虑波动抑制问题,也就是考虑短时段静态模型在这个短时段内稳定的问题,如果子过程优化解在运用过程中被频繁调整,也就没有“滚动时域”的意义了,但在动态环境下,所谓的“短时段”也是动态的,所以子过程优化类似于鲁棒优化;另一方面是子过程终端目标的设置,这是滚动时域中的一个重要概念,指的是子过程建模不能直接以全过程优化目标为目标,而应考虑时域滚动的衔接问题,子过程的优化除了过程内的状态优化外,还要考虑将下一个过程开始时其实状态调配到一个比较好情况,这通常通过将下一个子过程开始状态设置为优化目标来实现。

重调度决策是指当子过程优化模型不能实现优化效果时,启动重调度并进行时域滚动。因此,重调度决策和子过程建模是紧密关联的,子过程模型的质量和有效性直接影响重调度决策的效果,如果子过程模型的稳定性强,那么可以采取简单的“到期滚动”策略,也就是等待子过程自然结束到期,再启动下一阶段,但是在动态性较强的环境下,更多的是“事件触发”策略,也就是对场景变化进行评价,当变化幅度超过子过程模型的处理能力就启动重调度,因此触发的频度受到场景自然的动态性和子过程模型的鲁棒性两方面影响,考虑到联合调度的对抗性较强,而场景变化主要受编队动作所影响,所以我们认为子过程模型的鲁棒性在其中发挥更大的作用。

一、子过程建模的基础

由于真实的对抗过程具有高度的动态性和不确定性,而且涉及到各种博弈行为,进行精确建模相当困难,但在滚动时域框架下,由于子过程计划期较短,且存在重调度机制,因此可以对子过程的工作状态进行适当简化:

(1)不考虑平台空间位置所形成的打击盲区和其他限制区域。本模型不考虑空间因素对打击过程的影响,在当前的技术条件下这一假设是合理的。

(2)在子过程开始前所有目标均已被发现,不考虑在子过程进行中新目标的进入问题,也不考虑子过程进行中已发现目标的监控中断问题。

(3)不考虑子过程进行中的新增各类资源或者各类资源突发故障问题,但是在子过程开始是正在发生故障的资源状态是需要考虑的。假设条件(2)、(3)在滚动时域调度框架下是非常合理的,因为可以将新目标进入和资源的突发故障设置为重调度触发条件,从而保证在任何子过程中都满足上述假设条件。

(4)不考虑打击过程中目标行为的机动性,即目标在整个子过程计划期内的航迹仅依赖于子过程开始时的初始信息,且是完全可预测的。严格的说,在具备监控和跟踪能力的编队打击过程中,目标的机动性并不会对计划任务的有效性产生根本性的影响,但会影响实际打击效果,假定子过程计划时段的时长选择可以将这种影响限制在比较轻微的程度下,如果实际打击效果与计划打击效果产生较大偏离,可以启动重调度过程。

(5)任务是不可中断的,任务的打击效果只考虑击毁目标和打击失败两种,其中打击失败是指未击中目标,不考虑目标部分受损的情况。

(6)在任务执行过程中制导资源与发射资源都与目标形成一一对应的关系,即不存在同一时间多个制导资源对同一目标实施制导,或者同一时间多个发射资源向同一目标发射火力的情况。

(7)在任务执行过程中相关组合资源的工作过程是同步进行的,在编队中不同平台联合打击目标的过程中涉及到制导资源对目标的跟踪制导和武器资源对目标的发射攻击。严格的说,按照“发射-观效”策略,在共同执行打击任务的过程中这两类资源的工作过程是异步的,制导资源应该先工作,达到发射条件后通知武器资源启动并发射,然后制导资源还要进行打击观效,而武器资源在发射完毕后原则上应能再次承担其他任务。虽然对这种异步行为进行精细建模可以提升调度计划的执行效率,但极大增加了模型的复杂度,考虑在高度动态的环境下更关心调度计划的指导意义,在对执行效率影响不剧烈的情况下以提高模型可解性为目标的简化是合理的。

二、任务集的定义

基于上述假设,在子过程的计划期内可以不考虑监控资源的任务安排,从而将一个打击任务视为发射资源与制导资源组合起来对特定目标实施的行为。整个调度计划可以视为一个任务集m={m},对于一个给定任务m,需要确定其在资源属性和时间属性上的具体安排,可以给出任务的向量表示如下:

m=(gm,fm,am,em,gt1m,gt2m,ft1m,ft2m),

gm∈g,fm∈f,am∈z+,em∈e,gt1m,gt2m,ft1m,ft2m∈r+.

其中:g、f和e分别表示制导资源集合、发射资源集合和目标集合,根据假设条件(2)-(3),这些集合在整个计划期内都是恒定不变的。gm和fm分别表示执行任务m的制导资源和发射资源,am表示执行任务m时发射的弹药数量,em表示任务m打击的目标,gt1m和gt2m分别表示任务m中制导资源工作的开始时间和结束时间,ft1m和ft2m分别表示任务m中发射资源工作的开始时间和结束时间。

但基于前述假设条件(7),资源工作过程同步进行的,也就是gt1m=ft1m,gt2m=ft2m,因此gt1m-gt2m=ft1m-ft2m,称其为任务执行时间(打击时长)。而根据前述假设条件(2-4),任务执行时间可以表达为基于任务属性值的函数,且函数的形式可以在计划期开始时确定。因此任务的时间属性可以进一步简化为一个实数变量tm,表示任务开始时间(即制导资源和发射资源开始工作的时间),任务m的向量表示可以简化为:

m=(gm,fm,am,em,tm).

本质上说,计划任务集m是对尚未开始的战斗过程的预编排,而实际发生的战斗过程是动态的,真正关心的是在实际发生的战斗中各类资源和目标的状态演化及其所产生的效果。为了描述子过程计划的概念模型,假定在计划期内所发生的实际战斗中,在启动重调度之前,所有的攻击任务均严格按照计划执行,除非目标提前被消灭,那么在给定初始条件下,资源和目标的状态演化过程将完全由任务集所控制。图1表示了基于在假设条件(1)-(7)下,给定任务执行过程的总体时序概念模型,其中任务打击在时间上分为两个部分“重新跟踪制导”和“目标打击”,但是如果承担任务的制导资源在任务开始前已经实施过指定目标的制导过程,并一直保留着制导信息,则无需实施“重新跟踪制导”过程。对某个目标的打击任务完成后制导资源一般仍然会持续监测该目标,但在特殊情况下会中断这一过程,从而造成制导信息的丢失,主要原因有两个:1)资源发生故障;2)由于同时制导的目标数量限制,需要清空已完成任务的制导信息,以便为新的任务提供制导。由于不考虑计划期内的资源故障,因此实施“重新跟踪制导”的原因主要是第2点。

三、系统状态演化分析以实现子过程建模

为了对每个子过程建模,需首先明确整个防空系统在任务执行过程中的状态演化。从系统状态转换的角度来看,制导资源的状态是其空闲制导能力的数量,发射资源的状态是其空闲攻击能力的数量及其弹药数量,目标的状态是“生存”和“死亡”,其中制导能力和攻击能力是可回收的,而弹药是不可回收的,如果目标被击毁,则无需执行其后所有针对该目标的任务。那么根据假设条件(6),计划期的打击过程在特定目标的视角下是串行的,在特定资源的视角下是并行的且循环使用的,因此可以如图2所示的petri网形式表达给定任务m的执行过程。

经过对目标状态演化的分析给出了提高全局打击效果的三个定性化的策略:(1)尽早完成打击任务;(2)尽量增加近期任务的毁伤概率;(3)尽量减小耗弹量。在滚动时域过程中,每个子过程是依次拼接的,因此以上述策略作为子过程基本优化目标可以提高全局过程的打击效果。

从系统动力学的角度来看,在整个打击过程中,由制导资源、发射资源和目标共同组成作战系统的状态演化依赖于打击任务安排和目标状态演化。

在特定时刻,作战系统的状态可以用各类对象之间的关联关系来表达,其中制导资源与目标的关联关系(简称g-e关联)表示了对目标的跟踪制导,制导资源与发射资源的关联关系(简称g-f关联)表示了打击通道的建立,而发射资源与目标之间的关联关系(简称f-e关联)表示了对目标实施的打击,根据实际的作战动作要求,每种关联都具有3种状态:连接未建立(none)、连接准备中(prepare)和连接已建立(ready);另一方面,每个对象具有两种状态:可用(对于目标来说就是生存状态)、不可用(对于目标来说就是死亡状态)。在此基础上,系统的状态演化可以转化为上图中各类对象和关联的状态演化,而这一演化过程是由系统的固有规则和任务安排共同决定的,前述已经分析过目标状态演化问题,并且由于不考虑计划期内作战资源的突发故障,因此,主要对关联关系的状态演化特征进行分析:

(1)给定打击任务所对应的完全演化路径。当给定某个任务m后,就建立了制导资源gm、发射资源fm和目标em之间的耦合关联,称之为“子系统m”。完全演化路径考虑的是在所有可能情况下,子系统m的状态演化全过程,从时间上可将其分为初始状态、通道准备、通道建立、实施打击和打击结束5个阶段,分别用s1~s5来表示,其中s1和s2状态又可以细分为3种情况,分别用s1.1~s1.3和s2.1~s2.3来表示,其演化路径在图3中。图3中虚线箭头线表示状态转换可以瞬时发生,而实线箭头线表示状态转换需要消耗一定的工作时间。

(2)基于完全演化路径的打击过程分析。只有s4状态才是真正的打击任务执行状态,而s5状态与s3状态在表现形式上是一致的,在状态空间中两者是重合的,但从演化过程的时间序列来看,两者表达的是不同的工作阶段。考虑连续打击过程,根据图3所示,当任务开始时子系统m可能处于s1或者s5状态下,在不同的初始状态下执行任务所需的时间是不同的,令lm表示从s4到s5的转换时间,rglm表示制导资源对目标的重新跟踪定位时间(即图中s2.3到s3的状态转换时间),gflm表示制导资源与发射资源之间建立通道所需的时间(即图中s2.2到s3的状态转换时间),如果重新跟踪定位和建立通道两个过程可以并行执行,那么图中s2.1到s3的状态转换时间应为max{rglm,gflm},因此一个任务的完整执行时间有三种情况:lm、lm+rglm和lm+gflm。另一方面,子系统m进入s5状态后打击任务已经执行完毕,此后的状态变迁反映了作战系统对目标信息和通道信息的保存策略,显然上图表明尽量保持目标的跟踪信息和资源的通道关联信息有助于降低任务执行时间,但信息保存收到资源存储能力的限制,假定在满足存储能力的前提下,作战系统将尽可能保持各种关联信息,即上图中如果不违反存储能力,s5状态会一直保持下去,直至全系统状态在某个时刻转换到使某个关联对应的资源能力达到限制容量,然后s5会相应的转化为s1状态的各种情况。

四、建立状态演化的有限状态机fsm模型

为了让滚动的短时段静态调度能够拼接成一个长期的动态优化策略,需要对滚动时域中的每个子过程建立模型,只有建立适当的模型,才可能通过对模型求解获得整个防空任务的可执行任务集。本发明在系统状态演化分析的基础上,通过时间离散化将微分方程形式的系统状态演化数学模型转换为差分及0-1整数状态变量形式的数学模型,从而实现对子过程的建模。

图3反映出由制导资源、发射资源和目标组成的三元组(g,f,e)及其对象之间的关联构成了系统状态演化的基本单元,利用fsm模型可以在更精细的层面刻画三元组在s1~s5状态之间的演化过程。促使状态发生转化的事件有三类:任务安排、工作完毕、容量超限;其中从初始状态s1.x或者s5转换至s2.x或者s3的触发条件是出现一个与该三元组对象相一致的任务,用attack(g,f,e,t)表示t时刻利用制导资源g和发射资源f打击目标e的任务安排,由于任务本身是一个五元组(g,f,a,e,t),attack(g,f,e,t)实际上对应于任意弹药量(a分量的取值)情况下的(g,f,a,e,t);从s2.x或者s4转换至s3或者s5的触发条件是相应的通道准备工作或者目标打击工作执行完毕,定义finish-ge(g,t)、finish-gf(f,t)、finish-fe(e,t)分别表示在t时刻与制导资源g、发射资源f和目标e相关的g-e关联、g-f关联和f-e关联工作任务执行完毕的事件;任务完成后关联状态倾向于保持不变,即s5转换到s3,而此时如果出现制导资源或者发射资源的任务容量超限,则会由s5转换到s1.x。实际上容量超限事件并不仅仅作用于s5状态的转换,作为一种硬约束,在任意时刻如果发生容量超限事件,子系统m的状态都会调整到相应的初始状态并退出任务执行过程。在t时刻,定义lmt-ge(g,t)表示由制导资源g所产生的“制导资源-目标”关联中发生了容量超限事件,其具体含义是,制导资源g在t时刻同时跟踪的目标总数超过g的容量限制,而同时跟踪的目标总数等价于t时刻全系统内由g所产生的“制导资源-目标”关联中处于prepare或者ready状态的关联个数。同理,定义lmt-gf(f,t)表示t时刻由发射资源f产生的“制导资源-发射资源”关联中发生了容量超限事件,其具体含义是,发射资源f在t时刻同时攻击的目标总数超过e的容量限制,其中同时攻击的目标总数等价于t时刻全系统内由f所产生的“制导资源-发射资源”关联中处于prepare或者ready状态的关联个数。基于上述分析,图4表示了由给定三元组(g,f,e)定义的子系统在t时刻状态演化fsm模型:

图4中从s3到s4的状态转换不需要触发条件,如果将s3与s4合并,并不影响fsm模型的表达结果,但简化了状态空间,因此图5显示了一种简化的fsm模型,图5中的模型取消了s3状态,将其合并入s4。

通过分析状态演化的三种触发事件可以看出,在联合打击任务调度的背景下,“工作完毕”和“容量超限”两类事件与系统的内生状态相关,是随着系统状态演化而自发产生的事件,而“任务安排”来自于系统的外生状态,即系统控制者的主动调度行为,因此如果从系统控制的角度来看,“任务安排”是系统状态演化的控制变量,这是求解调度计划编制的基础。

求解子过程计划编制问题就是在指定目标下求解系统状态演化的控制变量,而控制变量应等价于联合打击任务。系统状态演化的数学模型本质上应该是微分方程形式,但为了便于计算机求解,需求将其转化为差分形式,并在此基础上构建离散时间变量支持下的数学规划模型。

差分变换的关键是时间变量的离散化,减少差分误差的途径主要有两条:(1)减小离散化间隔的时间步长;(2)合理设计离散化时间点,尽可能使所有可能发生的状态转换均发生在离散化时间点所在的时刻。第(1)种方案具有通用性,但会显著增加模型变量的规模,第2)种方案具有特殊性,如果所有状态的演化时长在一个有限可数的非时变实数集内取值,那么就有可能找到合理的时间步长满足第(2)种方案的要求。本发明采用上述第(2)种差分方案,其差分时间间隔取值要求使得在所有情况下的工作执行时间都是间隔时长的整数倍。

联合打击任务调度问题是一个典型的组合优化问题,且根据fsm模型,状态演化的触发事件主要是逻辑运算操作形式,因此本发明采用0-1整数形式表达状态变量。

在离散时间条件下,状态仅与三元组(g,f,e)和时间点t相关,所以状态变量的基本形式应为sgfet∈{0,1},当取值为1时表示(g,f,e)在t时刻处于s状态。为了使所有转换变迁都符合markov条件,在离散时间条件下,将s2.x状态和s4状态拓展为(s2.x,τ)和(s4,τ)的形式,其中1≤τ≤dmax,表示状态对应工作的剩余执行时间跨度,dmax表示所有的工作执行时间参量中的最大值,通常dmax<|t|,这一拓展过程实际上增加了状态变量数目。因此,模型中的状态变量及其意义见下表1:

表1模型状态变量表

在差分及0-1整数状态变量形式下,系统状态的形式和演化过程均发生了变化,基于所述简化fsm模型,建立差分形式下基于0-1状态变量的fsm模型(以下称为“0-1差分fsm模型”),该模型用于求解优化调度方案。从fsm模型的角度来看,一个“可行”的调度计划方案指的是通过合理的状态控制使得在任意时刻系统都不触发容量超限时间,在可行方案的背景下,fsm模型中所有由容量超限事件的引发的状态变迁都可以忽略。观察前述简化fsm模型可以看出,一部分容量超限事件引发的状态变迁出现在s2.x至s1.x变迁以及s4至s5变迁上,这两类变迁属于任务执行中断,一个可行的任务集方案应避免出现这类情况,可行任务集控制下的状态演化过程在任务执行过程中不会触发容量超限事件,但这并不能避免从s5至s1.x之间的容量超限事件,因此为了完全规避这类事件造成的状态变迁,需要将s5至s1.x之间的状态变迁条件设计为新的控制事件从而取代容量超限的判断,定义close-ge(g,f,e,t)事件表示在t时刻仅关闭子系统(g,f,e)的g-e关联,close-gf(g,f,e,t)事件表示在t时刻仅关闭子系统(g,f,e)的g-f关联,close-all(g,f,e,t)事件表示在t时刻关闭子系统(g,f,e)的所有关联。规避容量超限事件能使子系统演化的fsm各种参量限制在子系统内部,而无需考虑全系统状态,大大降低状态转移方程的复杂度。

“时间变量的离散化”部分中假设各类任务的执行时间属于计划编制前已知的非时变参数,且仅与执行任务的资源编号和目标编号相关,为此引入参量lgfe表示由(g,f,e)参与的打击任务的执行时间,参量gelge表示由(g,e)参与的g-e关联准备任务的执行时间,参量gflgf表示由(g,f)参与的g-f关联准备任务的执行时间,在差分形式下上述时间参量都是整数值,表示时间跨度所包含的差分时间间隔数,在实际情况中一般认为gelge>gflgf。

另外,从连续时间演化的角度来看,差分化后的任何状态变迁都潜在包含了至少一个时间间隔的原状态持续过程,瞬时状态变迁实际上是不存在的,因此对于原fsm模型中各种瞬时状态变迁需要进行提前量的修正,主要针对s5至s1.x的状态变迁过程。

基于上述分析和相关参量设计,图6给出面向可行调度方案的0-1差分fsm模型,根据瞬时状态变迁的提前量修正要求,为了任务执行完毕后瞬时切断g-e或者g-f关联的状态变迁过程,在(s4,1)状态后也添加至s1.x的状态变迁。另外,s1.x和s5属于非任务执行状态,在这类状态下,系统具有保持关联信息的倾向,即在无事件输入的情况下将进行自返式变迁。

根据0-1差分fsm模型,控制变量包括两类,分别对应于任务安排事件和关闭关联事件,也应采用0-1整数形式。

根据前文分析,打击任务由五元组表达:m=(gm,fm,am,em,tm)

在时间离散化处理后,上述五元组中的所有元素都在有限可数整数集内取值,因此与任务安排事件对应的0-1整数控制变量集为:

{mgfaet=0,1|1≤g≤|g|,1≤f≤|f|,1≤a≤|a|,1≤e≤|e|,1≤t≤|t|}

其中|g|、|f|、|a|、|e|、|t|分别表示计划期内各类资源、目标和离散时间点集的规模,mgfaet值为1表示任务集中存在一个任务(g,f,a,e,t),而无论下标a为何值都表示触发一个attack(g,f,e,t)事件,显然每个打击任务只能在可选的弹药发射量方案中选择一种,因此σ(1≤a≤|a|)mgfaet≤1,所以可以用σ(1≤a≤|a|)mgfaet表达attack(g,f,e,t)事件的发生。

而与close-ge(g,f,e,t)、close-gf(g,f,e,t)、close-all(g,f,e,t)事件对应的控制变量可以表示为0-1整数变量集:

{ψgfet=0,1|1≤g≤|g|,1≤f≤|f|,1≤e≤|e|,1≤t≤|t|};

{φgfet=0,1|1≤g≤|g|,1≤f≤|f|,1≤e≤|e|,1≤t≤|t|};

其中ψgfet=1表示在t时刻产生一个close-ge(g,f,e,t)事件,表示在t时刻产生一个close-gf(g,f,e,t)事件,φgfet=1表示在t时刻产生一个close-all(g,f,e,t)事件。

基于表1的状态变量表达形式,给定三元组(g,f,e)在t时刻的状态实际上是由所有下标包括(g,f,e,t)的状态变量构成的向量,其状态转移方程是由向量中每一个分量对应的状态转移差分方程所构成的方程组,该方程组完全依赖于0-1差分fsm模型,根据该模型可以得到如下形式:

上面的式子可以看作0-1差分fsm模型的等价代数模型,但该模型并不能计算计划期起始时刻(即t=1)的子系统状态,因为根据状态演化规律,计划期起始时刻的状态与计划期前的状态相关,称之为“初始状态”,由于初始状态在计划期开始前已经确定,因此与之对应的代数量应称为“初始状态参量”,为了表达形式的一致性,将状态变量的t下标扩展至0,并令t=0时的状态量表示初始状态参量,那么在0≤t<|t|的意义下上面的式子可以表达计划期内所有的状态变迁。

约束条件描述了数学规划模型中各类变量和参量之间的约束关系,上述状态方程(1)是状态变量之间的基本约束,但为了使调度方案可行,还需添加其他的约束条件,可以分为两部分:(1)控制变量和状态变量的互斥性约束;(2)资源容量限制性约束。其中控制变量和状态变量的互斥性约束分为三个层面:

(1)子系统(g,f,e)控制的非歧义性:子系统在任意时刻接收的控制变量应该不多于一个,否则状态转换就出现了歧义性:

(2)子系统(g,f,e)状态互斥性:任意时刻任意子系统有且仅有一种状态,在0-1整数型状态变量条件下,状态唯一性约束可以表达为:

(3)目标打击状态互斥性:根据编队打击的执行规则,不能在同一时刻对同一目标执行两个不同的打击任务,从状态演化的角度来说,就是在任意时刻针对同一目标的所有子系统中处于目标打击状态的子系统不多于一个,在0-1差分fsm模型中将(s2.x,*)和(s4,*)状态集称为目标打击状态集,其互斥性约束可以由下式表达:

系统中各类资源的容量限制形成的约束是任务执行的实际物理限制,也是在0-1差分fsm模型中规避容量超限事件的理论基础,主要包括制导资源同时跟踪目标数量限制、发射资源同时打击目标数量限制以及发射资源载弹量限制三类约束。但是所有这些限制条件都以目标打击任务的执行为基础,如果目标被击毁,那么后续计划中的任务将不被执行,然而在计划编制时对于目标的生存状态只能进行概率估算,所以本质上说,对于计划任务资源使用状况的一切计算都只有概率意义,针对这一特征,对每一类约束都给出3种形式:保守形式、平均形式和概率形式。

“保守形式”指的是在所有目标都生存的情况下任务集需符合的约束,这是在任意概率情况下都能保证任务集可行的约束;“平均形式”是指按照毁伤概率的期望值约束平均意义下的任务集可行性,由于各个任务是独立执行,因此多个任务执行状态的总体期望值应等于独立期望值之和,而任务独立执行的期望值由目标的毁伤概率决定;而“概率形式”是基于各个时段内任务总体执行状态概率分布测算的精细化约束,通常先预定义违反约束状态的概率上限θ,然后依次考察各个时段,使每个时段内的总体执行状态违反约束的概率小于θ,这其中涉及到独立但不同分布组合随机过程的概率计算,往往非常复杂,但能更精确反映任务集的可行程度。

值得注意的是,“保守形式”可以保证任务集在任意条件下可行,但在存在高毁伤概率任务的情况下,资源利用效率会比较低,且目标状态空间的演化与预测情况会产生较大偏离;而满足上述“平均形式”或者“概率形式”的任务集在实际执行中可能会出现资源冲突的情况,需要进行临时的冲突消解操作,从而使得资源状态空间的演化与预测情况产生偏离;可以利用这些偏移来定义重调度触发条件。

(1)制导资源同时跟踪目标数量限制。根据子系统状态的定义,当与给定制导资源g相关的任意一个子系统(g,f,e)处于除s1.1和s1.3状态之外的任一状态下,都表示g在执行某个跟踪制导任务,而在t时刻g同时执行跟踪制导任务的数量不能超过mggt,因此:

i.保守形式:

ii.平均形式:

其中y(e,t)表示目标e在t时刻的生存概率,因为假设目标的生存概率仅在打击任务结束时(也就是s4gfet1=1的状态下)发生变化,但打击通道的信息是在任务开始时(mgfaet=1的事件下)获取的,所以y(e,t)的计算比较复杂,定义c(g,f,a,e,τ,t)∈{0,1}表示是否在τ时刻开始执行了一个(g,f,a,e,τ)任务并在t时刻前结束,可按下式计算:

则y(e,t)可由下式计算:

iii.概率形式:

(2)发射资源同时跟踪目标数量限制。根据子系统状态的定义,当与给定发射资源f相关的任意一个子系统(g,f,e)处于除s1.1和s1.2状态之外的任一状态下,都表示f在执行某个攻击任务,而在t时刻f同时执行打击任务的数量不能超过mfft,因此:

i.保守形式:

ii.平均形式:

iii.概率形式:

(3)弹药限制:对某个发射资源而言,其计划期内所有任务所耗费的弹药量不能超过其计划期开始时的总载弹量,由于发射弹药仅与执行任务一一对应,因此可以不使用状态变量而仅利用控制变量mgfaet进行简化表达。

i.保守形式:

ii.平均形式:

iii.概率形式:

根据分析,主要从三个方面来评价任务集的打击效果;末端威胁等级、末端抗击损耗和总耗弹量,由于前两项指标本身就是基于目标毁伤概率来构建的因此不存在如约束条件所述的形式差别,最后一项耗弹量目标需要进行概率运算,作为整体目标,仅考虑其保守形式和平均形式。因此三个优化指标如下:

(1)末端威胁等级最小化

(2)末端抗击损耗最小化

(3)总耗弹量最小化

i.保守形式:

ii.平均形式:

综上,表3示出“保守形式”、“平均形式”和“概率形式”下的0-1整数规划模型,其中各种形式下模型的决策变量都是一致的,包括控制变量mgfaet∈{0,1}、ψgfet∈{0,1}、φgfet∈{0,1}、和所有的状态变量。

此外,由于控制变量仅在某些特定的状态下起作用,为了简化模型的解空间,根据0-1差分fsm模型对上述控制变量设置如下约束:

表3三种形式下的0-1整数规划模型

五、对fsm模型求解以获得最优任务集

在已经建立有限状态机模型fsm的基础上,需要通过对该模型进行求解以获得最优的任务集,然而该模型中的约束条件和目标函数大部分是非线性关系式,这给模型有效求解带来困难,因此,本发明通过非线性逻辑函数(自变量和因变量都是布尔值)与线性逻辑不等式组合的等价转换的方式将所述fsm模型线性化之后进行再进行求解。

有前面的分析可知,保守形式下子过程计划编制的0-1整数规划模型具有如下特征:1)保守形式下与状态变迁过程完全对应,利于展开深层次的理论分析;2)保守形式下得到的计划方案具有最高的可靠性,并能反映出调度优化效果的下限,利于建立统一的优化策略评价参考准则;3)保守形式下的模型更利于进行线性化处理。因此,本发明优选通过对保守形式下子过程计划编制的0-1整数规划模型进行线性化并求解从而得到最优的任务集。

保守形式下0-1规划模型的约束条件中,差分状态转移方程((1),其中0≤t<|t|)及辅助函数y(e,t)中包含非线性的运算操作,因此,本发明通过对所述差分状态转移方程及辅助函数y(e,t)进行线性化并求解从而得到最优的任务集,然后根据所述任务集控制制导资源和发射资源执行防空任务。在启动重调度之前,所有的攻击任务均严格按照任务集的计划执行,除非目标提前被消灭。

六、重调度决策

通过对所述fsm模型求解仅可实现对规模较大的静态调度子过程进行精确求解,然而调度计划的根本目的是指导实战抗击过程,无论静态计划如何精确,在实战中永远无法避免随机扰动而带来的状态不确定性,由此而产生的执行误差会使实际工作状态逐步偏离计划状态,计划调整是不可避免的,本发明通过实时监控并评估任务执行过程中扰动类型及强度并据此在原有计划基础上展开任务重调度。本发明主要考虑以下三类扰动类型:

a)执行时间扰动:静态计划的基本前提之一是任务执行时间的非时变性,但这在实战中往往是无法保证的,各种随机扰动都会影响任务的实际执行时间,是任务早于或晚于计划时间结束,在资源容量限制和任务互斥性的约束下,执行时间扰动会影响后续任务的启动时间。

b)目标状态扰动:目标状态有多种表现形式,但在任务调度的情景中,我们仅考虑三种情况:目标生存状态变化、目标威胁等级变化及新增目标。其中目标生存状态变化是常态化的,由于在静态优化中我们采用“毁伤概率”来描述打击效果,但目标遭受打击后的实际结果又仅有“生存”和“击毁”两种情况,因此目标生存状态将成为调度计划执行中一个始终存在的持续扰动;目标威胁等级变化来源于目标运行过程产生的空间态势变化,反映在调度中体现为末端生存概率上限的变化,这一变化将影响任务计划的有效性;新增目标指的是防空雷达监测到进入打击范围的新目标,它将从根本上影响原计划的完整性。

c)资源状态扰动:资源状态扰动主要包括资源故障导致任务无法执行的情况,短暂的故障导致任务执行时间发生延误,可以归入“执行时间扰动”部分,因此我们主要考虑长期故障,即在整个计划期相关资源都无法执行任务,导致与之相关的任务计划完全失效。

每一次重调度相当于针对当前所有目标及可用资源的初始状态,按照子过程优化调度的建模和求解方法获得优化的任务集。

本发明利用差分状态转移方程可以精确计算每个时间段内的系统状态,通过合理设计控制变量的取值,可以通过精确调整系统状态演化进程来搜索优化任务集,从而实现滚动时域框架的舰队防空决策与自动化调度。

本发明还提供了一种利用上述差分状态转移方程实现的滚动时域框架下舰队防空决策与自动化调度系统,包括以下模块:

场景预测模块;

子过程建模模块,用于建立基于状态演化的有限状态机(fsm)模型,并对所述有限状态机模型求解以获得任务集,根据所述任务集控制制导资源和发射资源执行防空任务,其中所述制导资源是用于探测和跟踪目标的资源,所述发射资源是用于实施攻击的资源,;

重调度决策模块,通过实时监控并评估任务执行过程中扰动类型及强度,根据扰动类型及强度确定是否需要启动重调度;若确定需要启动重调度,则调用所述场景预测模块和子过程建模模块以重新执行场景预测及子过程建模。

以上实施例仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1