一种基于状态转换代价值的启发式航天器任务规划方法与流程

文档序号:16895292发布日期:2019-02-15 23:33阅读:108来源:国知局
一种基于状态转换代价值的启发式航天器任务规划方法与流程
本发明涉及一种航天器任务规划方法,特别是实现基于状态转换代价值的启发式航天器任务规划方法,属于航空航天
技术领域

背景技术
:航天领域是二十一世纪世界技术发展的主要领域之一。由于航天任务中航天器一般距离地球远、飞行时间长、所处环境不确知等特点,导致航天器的操作和控制存在极大的挑战,例如通信的长时延问题、长期可靠性问题、实时操作问题等。航天器在轨运行过程中,需要具备能够对一系列科学目标进行规划的能力,即根据空间环境的感知及探测器本身的能力和状态,运用自主规划技术在约束和资源模型的基础上进行推理,生成一组有序的活动序列。当航天器面临执行长期任务的挑战时,复杂的外部环境会成为实现任务目标的阻碍。这些都需要可靠的自主任务规划方法,以避免在缺乏对环境充分认知的情况下做出导致任务失败的决策。深空1号采用基于启发式调度测试系统(hsts),它将状态变量描述为时间线的形式,能够对明确的时间概念进行描述,并且算法使用基于约束的规划范式对问题进行求解。深空一号中核心搜索算法采用深度优先的搜索方式,缺少合适的搜索引导策略,会引发冗余的规划操作,大大增加搜索规划的时间,影响规划求解的效率。罗塞塔任务使用科学规划(masterscienceplan)软件制定观测方案,保证在动态环境中成功实现任务目标。msp的局限性在于它的设计目的注重制定灵活的策略保障航天器的安全性,缺少对于搜索技术的深入研究,会增加任务时间,降低规划效率。技术实现要素:本发明的目的是为了提供一种基于状态转换代价值的启发式航天器任务规划方法要解决的技术问题是,该方法能够提高航天器任务规划中问题搜索和求解速度,在更短的时间内获取合理的规划解,解决规划操作引发的规划效率低下的问题。本发明的目的是通过下述技术方案实现的:本发明公开的一种基于状态转换代价值的启发式航天器任务规划方法,根据子系统内部约束特点,综合考虑航天器结构、任务需求、设备状态和航天器能力四项因素,对航天器的构成、资源、分系统功能以及需要满足的各种约束条件进行描述。针对航天器系统约束复杂和系统状态信息互相耦合特点,利用时间线刻画航天器的多个并行子系统,建立子系统内部状态转换图。同时,根据状态之间的约束关系及状态转换代价值构建启发式信息,根据启发式排序结果引导规划搜索方向,输出最终的基于状态转换代价值的启发式任务规划求解结果,即完成航天器任务规划,缩减搜索空间,提高任务规划效率。所述的子系统内部状态转换图指将模型中该子系统内部的状态转换通过图的形式进行表示。状态转换图是带有权值的有向图,节点表示该子系统内部的状态,边连接两个节点a,b,表示状态的转换,即从状态a转换到箭头指向的状态b,边的权值代表转换的代价。所述的各种约束条件根据实际航天器系统而定,包括因果约束、时间约束和资源约束。本发明公开的一种基于状态转换代价值的启发式航天器任务规划方法,包括如下步骤:步骤一:综合考虑航天器结构、任务需求、设备状态和航天器能力四项因素,对航天器的构成、资源、分系统功能以及需要满足的约束条件进行描述。所述的约束条件根据实际航天器系统而定,所述的约束条件包括因果约束、时间约束和资源约束。针对航天器系统功能复杂和系统约束耦合的特点,利用时间线刻画航天器的多个并行子系统,通过时间线结构及耦合状态信息描述系统的复杂约束及系统间依赖关系,形成时间线描述模型,对各并行子系统的行为随时间的演化进行描述。步骤二:针对各并行子系统,建立子系统内部状态转换图,状态转换图用于描述各并行子系统内部状态转换规则、搜索各并行子系统内部状态转换路径以及计算各并行子系统内部状态转换的代价值。各并行子系统分别由一个状态变量进行表示,每个状态变量都由时间线的形式进行描述,各并行子系统对应的状态变量为状态变量a1、状态变量a2、状态变量a3……状态变量an。每个状态变量都存在一个值域,任一状态变量在值域内的任一取值称为状态。所述的各并行子系统内部状态转换图指将模型中该子系统内部的状态转换通过图的形式进行表示。状态转换图是带有权值的有向图,节点表示该子系统内部的状态,边连接两个节点a,b,表示状态的转换,即从状态sa转换到箭头指向的状态sb,边的权值代表转换的代价值。通过建立子系统状态转换图,搜索各并行子系统内部状态转换路径,计算各并行子系统内部状态转换的代价值。所述的建立各并行子系统状态转换图具体是指将各状态变量的值域中所有取值状态sn1,状态sn2……状态snn作为对应的子系统状态转换图的节点,用有向边箭头的指向表示状态的转换,通过边的权值表示转换的代价值。所述的子系统内部状态s1到状态s2转换代价值的计算方法为:根据状态转换图,搜索图中所有状态s1到状态s2的路径,然后将转换路径涉及的所有边上的权值求和计算出每条路径的转换代价值,并选取其中最小的代价值作为从状态s1转换到状态s2的代价值cost(s1,s2)。所述的转换边上的权值信息的计算方法为:根据状态转换图,选取两相邻状态sa和状态sb,状态sa到状态sb的转换条件为状态sd,其中状态sa和状态sb属于时间线tl1,状态sd属于时间线tl2,且时间线tl2上存在时间上位于状态sd之前的状态sc。实现转换条件状态sd的代价为时间线tl2上状态sc到状态sd的转换代价值。则连接状态sa节点到状态sb节点的边的权值为实现转换条件状态sd的代价。步骤三:选用规划空间搜索作为基本的搜索策略,根据步骤一的约束条件及步骤二得到的状态转换代价值构建启发式信息,根据启发式排序结果引导规划搜索方向,输出最终的基于状态转换代价值的启发式任务规划求解结果,即完成航天器任务规划,缩减搜索空间,提高任务规划效率。步骤3.1:选取任务目标状态集合中一个目标状态sg1,根据目标状态自身约束及目标状态之间耦合约束关系,对目标状态sg1的所有候选约束状态集合的启发式值进行计算。所述启发式值的计算方法为:目标状态sg1其中的一个候选约束状态集合中所有状态表示为sg11,sg12……sg1n;每个状态都对应自己的时间线,所述状态的时间线可能相同,也可能不同(也就是每个状态对应一个时间线,或者两个以上的状态对应同一个时间线);每个状态在自己的时间线上都能够找到上个时刻的状态sg11a,sg12a……sg1na;状态sg11a,sg12a……sg1na到状态sg11,sg12……sg1n的转换代价值为cost(sg11a,sg11),cost(sg12a,sg12)……cost(sg1na,sg1n),则目标状态sg1该候选约束集合的启发式值hc1(sg1)为,hc1(sg1)=cost(sg11a,sg11)+cost(sg12a,sg12)+…+cost(sg1na,sg1n);步骤3.2:选取步骤3.1的目标状态sg1启发式值最小的候选约束状态集合cj,将集合cj中所有状态加入任务目标状态集合。步骤3.3:将目标状态sg1添加到其所属时间线上,并在目标状态集合中删除状态sg1。步骤3.4:迭代处理步骤3.1-步骤3.3,进行规划搜索,直到目标状态集合为空,输出最终的启发式任务规划求解结果,即完成航天器任务规划,缩减搜索空间,提高任务规划效率。有益效果:1、针对航天器系统功能复杂和约束耦合的特点,本发明公开的一种基于状态转换代价值的启发式航天器任务规划方法,利用时间线结构描述航天器的多个并行子系统,并根据其内部状态转换规则,建立子系统内部状态转换图,计算子系统内部状态转换的代价值,确定状态转换路径,减少无效的规划节点,提高任务规划求解效率。2、本发明公开的一种基于状态转换代价值的启发式航天器任务规划方法,根据状态之间的约束关系及状态转换代价值构建启发式信息,根据启发式排序结果引导规划搜索方向,缩减搜索空间,提高算法的效率。原有航天器任务规划方法虽然能够进行问题求解,但是带有大量冗余操作和不必要的节点回溯,通过启发式信息,使得航天器任务规划方法能够在更短时间内获取合理的规划解,提高任务规划求解效率。附图说明:图1是本发明公开的一种基于状态转换代价值的启发式航天器任务规划方法流程图;图2是基本规划算法和启发式任务规划算法中不同规划任务的求解时间情况。图中:实线表示基本规划算法不同规划任务规划求解时间变化曲线,虚线表示启发式规划算法在不同规划任务规划求解时间变化曲线。具体实施方式为了更好地说明本发明的目的和优点,下面通过对航天器系统进行建模,并给定测试任务为任务e,如图2所示,针对模型对改进的基于状态转换代价值的启发式航天器任务规划方法进行实际应用,对本发明做出详细解释。实施例1:如图1所示,本实施例公开的一种基于状态转换代价值的启发式航天器任务规划方法,具体实现步骤如下:步骤一:综合考虑航天器结构、任务需求、设备状态和航天器能力四项因素,对航天器的构成、资源、分系统功能以及需要满足的约束条件(因果约束、时间约束和资源约束)。针对航天器系统功能复杂和系统约束耦合的特点,利用时间线刻画航天器的多个并行子系统,通过时间线结构及耦合状态信息描述系统的复杂约束及系统间依赖关系,形成时间线描述模型,对各并行子系统的行为随时间的演化进行描述。本实施例具体选取的子系统如下表所示。表1各子系统名称及对应状态数量子系统名称状态变量数量状态数量数据存储13相机15着陆器通讯14健康管理14电源管理13采样设备14导航12采样实验15步骤二:针对各并行子系统,建立子系统内部状态转换图,状态转换图用于描述各并行子系统内部状态转换规则、搜索各并行子系统内部状态转换路径以及计算各并行子系统内部状态转换的代价值。各并行子系统分别由一个状态变量进行表示,每个状态变量都由时间线的形式进行描述,各并行子系统对应的状态变量为状态变量a1、状态变量a2、状态变量a3……状态变量an。每个状态变量都存在一个值域,任一状态变量在值域内的任一取值称为状态;例如采样设备子系统由一个状态变量a采样表示,状态变量a采样的值域包含四个状态,分别为卸载状态s卸、装填状态s装、采样状态s采和空闲状态s空。所述的各并行子系统内部状态转换图指将模型中该子系统内部的状态转换通过图的形式进行表示。状态转换图是带有权值的有向图,本实施例根据采样设备子系统内部状态转换,建立采样设备子系统的状态转换图:卸载状态s卸、装填状态s装、采样状态s采和空闲状态s空为状态转换图的四个节点。卸载状态s卸到采样状态s采的转换、采样状态s采到装填状态s装的转换、装填状态s装到空闲状态s空的转换和空闲状态s空到卸载状态s卸的转换为状态转换图的四条边,边的权值代表转换的代价值。通过建立采样设备子系统状态转换图,搜索采样子系统内部状态转换路径,计算采样设备子系统内部状态转换的代价值。所述的采样设备子系统内部卸载状态s卸到空闲状态s空转换代价值的计算方法为:根据状态转换图,搜索图中所有卸载状态s卸到空闲状态s空的路径,然后将转换路径涉及的所有边上的权值求和计算出每条路径的转换代价值,并选取其中最小的代价值作为从卸载状态s卸到空闲状态s空的代价值cost(s卸,s空)。采样设备子系统其他任意两状态之间状态转换代价值的计算方法与卸载状态s卸到空闲状态s空的计算方法相同。所述的转换边上的权值信息的计算方法为:根据采样设备子系统状态转换图,选取两相邻状态卸载状态s卸和采样状态s采,卸载状态s卸和采样状态s采的转换条件为拍照状态s照,其中卸载状态s卸和采样状态s采属于采样设备时间线tl采样,拍照状态s照属于相机时间线tl相机,且相机时间线tl相机上存在关机状态s关机位于拍照状态s照之前。实现转换条件拍照状态s照的代价为相机时间线tl相机上关机状态s关机到拍照状态s照的转换代价值cost(s关机,s照)=4。则连接卸载状态s卸节点到采样状态s采节点的边的权值为4。采样设备子系统其他各边的权值的计算方法与卸载状态s卸到采样状态s采的转换边的权值计算方法相同,得到其他各边的权值分别为:采样状态s采到装填状态s装的转换边权值为2、装填状态s装到空闲状态s空的转换边权值为1以及空闲状态s空到卸载状态s卸的转换边权值为2。则采样设备子系统各状态转换代价值如表2所示。表2采样设备子系统各状态转换代价值状态名称卸载状态s卸采样状态s采装填状态s装空闲状态s空卸载状态s卸cost(s卸,s卸)=0cost(s卸,s采)=4cost(s卸,s装)=6cost(s卸,s空)=7采样状态s采cost(s采,s卸)=5cost(s采,s采)=0cost(s采,s装)=2cost(s采,s空)=3装填状态s装cost(s装,s卸)=3cost(s装,s采)=7cost(s装,s装)=0cost(s装,s空)=1空闲状态s空cost(s空,s卸)=2cost(s空,s采)=6cost(s空,s装)=8cost(s空,s空)=0步骤三:选用规划空间搜索作为基本的搜索策略,根据步骤一的约束条件及步骤二得到的状态转换代价值构建启发式信息,根据启发式排序结果引导规划搜索方向,输出最终的基于状态转换代价值的启发式任务规划求解结果,即完成航天器任务规划,缩减搜索空间,提高任务规划效率。步骤3.1:选取任务目标状态集合中一个目标状态——加热状态s热,根据加热状态s热自身约束及目标状态之间耦合约束关系,对加热状态s热的所有候选约束状态集合c1和c2的启发式值进行计算。集合c1包含采样状态s采,集合c2包含卸载状态s卸。所述启发式值的计算方法为:加热状态s热其中一个候选约束状态集合c1中的状态为采样状态s采;采样状态s采对应的时间线为采样设备时间线;在采样设备时间线上,采样状态s采上个时刻的状态为空闲状态s空;空闲状态s空到采样状态s采的转换代价值为cost(s空,s采),则加热状态s热该候选约束集合的启发式值hc1(s热)为,hc1(s热)=cost(s空,s采)=6;候选约束状态集合c2的启发式值计算方法与候选约束状态集合c1相同,则候选约束集合c2的启发式值为hc2(s热)=2。步骤3.2:选取步骤3.1的加热状态s热启发式值最小的候选约束状态集合,根据步骤3.1计算可得hc1(s热)=6>hc2(s热)=2故选取候选约束集合c2,将卸载状态s卸加入目标状态集合。步骤3.3:将加热状态s热添加到其所属采样实验时间线上,并在目标状态集合中删除加热状态s热。步骤3.4:迭代处理步骤3.1-步骤3.3,进行规划搜索,直到目标状态集合为空,输出最终的启发式任务规划求解结果,这里得到的采样设备时间线的状态序列如表3所示,其他七个子系统与采样设备子系统相同,能够通过规划得到相应时间线的状态序列,即完成航天器任务规划,缩减搜索空间,提高任务规划效率。表3采样设备时间线状态序列状态名称时间区间(min)卸载状态s卸[20,30]、[105,115]、[185,195]采样状态s采[30,55]、[115,145]、[195,225]装填状态s装[55,65]、[145,155]、[225,235]空闲状态s空[0,20]、[65,105]、[155,185]、[235,240]通过上述步骤,使用基于状态转换代价值的启发式航天器任务规划方法得到规划结果的时间为16009ms,使用基本的航天器任务规划方法得到规划结果的时间为37397ms。通过比较可以看出,子系统内部状态转换代价值的计算,能够引导状态转换路径,减少无效的规划节点,削减问题搜索空间,并且设计的基于状态转换代价值的启发式有效的避免了冗余的规划步骤,提高了规划的效率,所以使用基于状态转换代价值的启发式航天器任务规划方法得到规划结果的时间要少于使用基本的航天器任务规划方法得到规划结果的时间。所述的结果均是在给定测试任务e的情况下得到的。在其他测试任务下使用基于状态转换代价值的启发式航天器任务规划方法得到规划结果的时间和使用基本的航天器任务规划方法得到规划结果的时间对比如图2所示。所述的基本的航天器任务规划方法为不建立状态转换图,也不使用基于状态转换代价值的启发式的航天器任务规划方法。以上所述的具体描述,对发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例,用于解释本发明,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1