一种基于神经网络的深空探测器自主任务规划方法

文档序号:6639837阅读:406来源:国知局
一种基于神经网络的深空探测器自主任务规划方法
【专利摘要】本发明涉及一种基于神经网络的深空探测器自主任务规划方法,属于深空探测【技术领域】。本发明方法通过建立深空探测器系统模型,定义深空探测器系统自主任务规划问题,确定自主任务规划系统的输入输出,建立神经网络模型,利用深空探测器仿真系统产生的仿真数据对神经网络进行训练,训练后的神经网络能够在给定一组输入后,得到理想的输出。本发明能在多个子系统需要协调的情况下、满足探测器实时性要求;能够快速得到规划解,弥补采用地面站控制的通讯延迟的缺点,有助于大大提高深空探测器自主任务规划的效率,满足探测器实时性要求,规划时间短、效率高,更加适合实时性要求高的深空探测器。
【专利说明】-种基于神经网络的深空探测器自主任务规划方法

【技术领域】
[0001] 本发明设及一种基于神经网络的深空探测器自主任务规划方法,属于深空探测技 术领域。

【背景技术】
[0002] 在深空环境下,深空探测器根据空间环境的感知和认识及深空探测器本身的能力 和状态,利用计算机软件技术、人工智能技术等,依据一段时间内的任务目标,对若干可供 选择的动作及所提供的资源约束施行推理,自动地生成一组时间有序动作序列,称一个"规 划"(plan),该规划一旦执行,便可W将探测器的状态成功转移到期望的目标状态。
[0003] 对于自主任务规划问题,能够在动态变化环境下快速规划是智能行为的一大能 力。并且深空探测器与目标距离远、飞行时间长、所处环境动态多变,传统地面站-航天器 该样的控制方法已经无法满足操作费用、实时性、通讯网络等各项要求。为达到较高的实时 性要求,当前使用的方法是基于启发式的规划方法,将规划问题看作捜索问题,利用启发式 函数引导捜索,从而实现快速规划的目的。目前,已有相关规划技术应用到了探索太空的项 目中,如深空一号中自治远程代理系统、哈勃天文望远镜长期任务调度软件SPIKE等。随着 任务量的增加,利用启发式的任务规划方法显得有所欠缺,比如在编码之前需要清楚知道 系统及环境特点,采用合适的算法W及启发式函数,但是合适的启发式函数并不容易找到。 此外随着任务复杂度的增加,捜索空间增大,规划速度减慢等。
[0004] 神经网络作为除符号式人工智能之外另一条实现人工智能的主要途径,因具有计 算并行性、学习能力强、解决复杂问题的特点受到各个领域的欢迎。目前神经网络在规划 领域主要应用于机器人的路径规划。例如,Baomin化ng提出了神经网络模型用于空间机 器人的鲁椿控制,而提出的ANN利用RBF处理各种不确定性。化usse巧assil利用多层感 知器进行探测器的路径规划,对探测器进行导航,从而避开路面的障碍顺利达到目标。Roy Glasius等人曾利用化pfield神经网络在静态和动态环境中为机器人选出一条合适的路 径,使机器计算能力加快。


【发明内容】

[0005] 本发明针对深空探测器自主任务规划问题,为克服现有的基于启发式的规划方 法中设计启发式困难、捜索空间大、规划速度减慢等缺点,提出一种基于神经网络的深空探 测器自主任务规划方法,能在多个子系统需要协调的情况下、满足探测器实时性要求。
[0006] 本发明通过设计神经网络模型实现,具体实现步骤如下:
[0007] 步骤1,建立深空探测器系统模型。
[000引深空探测器系统SYS具有m个子系统:
[0009] SYS = {sys。sys2, . . . , sys。. . .,sySiJ, (1《i《m)
[0010] 其中sySi表示第i个子系统。
[0011] 深空探测器系统活动状态指m个子系统可能处于的状态集合,设第i个子系统的 状态集合为S =W,s;,...,",s;,如...X表示第i个子系统的n-1个可能的状态,则整个探测器 系统的状态集合为S =怯。S2,. . .,S。. . .,S。}。
[0012] 对于给定的一个任务Gk,与之对应的目标状态为gk,即在完成任务Gk后探测器处 于的状态,且其中gkE S。
[0013] 为了完成任务,达到目标状态,各个子系统需要采取相应的动作,那么第i个子系 统能供选择的动作集合为4 = ,其中X为该子系统总共能够执行的动作数,每个 子系统X的值不同;。(表示第i个子系统可执行的第1个任务,a;表示第i个子系统可执行 的第2个任务,<表示第i个子系统可执行的第X个任务。那么整个探测器动作集合为A (Ai, A2,. . . , Ai,. . . , Ami。
[0014] 给定任务目标Gk后,深空探测器系统将当前所处状态作为初始状态s。(当前所处 状态为S中的一个元素)。在自主规划过程中,每个子系统在一时间点上只执行一个动作, 各个子系统间动作具有并行性,且有充足的时间执行完本子系统动作。
[0015] 步骤2,根据步骤1中建立的深空探测器系统模型,定义深空探测器系统自主任务 规划问题,确定自主任务规划系统的输入输出。
[0016] 在对规划问题进行描述时,需要包括深空探测器的状态、可W执行的动作、状态之 间的转换关系、需要完成的任务。采用经典规划理论对深空探测器自主任务规划问题进行 定义。自主任务规划系统的输入是:初始状态、任务目标、领域知识。输出是;一个最佳规划 解,即开始于初始状态、满足于星上的各种约束条件并能在成功执行后将深空探测器状态 转移到目标状态的一个动作序列。
[0017] 将深空探测器上状态转移问题2用一个S元组进行表示:
[001 引 Z = ^A,Y)
[0019] 其中,S表示整个探测器系统的状态集合,A表示探测器动作集合,丫为状态转移 函数,用于描述状态之间的转换关系。
[0020] 那么,深空探测器上的自主任务规划问题用一个S元组表示:
[0021] P=(2,s〇,gk)
[0022] 深空探测器上任务规划问题P的解是由多个深空探测器可执行的活动组成的规 划序列,表示为
[002引 n = < JT。JT 2, . . . 31 非...JT h>
[0024] 31 j.为探测器系统执行的第j个动作序列,h指探测器系统一共需要执行h个动作 序列;且气"7 >,其中。;e人表示第i个子系统在第j个动作序列应该执行 的活动。状态转移函数如下式所示:
[0025]

【权利要求】
1. 一种基于神经网络的深空探测器自主任务规划方法,其特征在于:具体包括如下步 骤: 步骤1,建立深空探测器系统模型; 深空探测器系统SYS具有m个子系统: SYS=Isys1,sys2, . . . ,Sysi, . . . ,sysj,I^i^m其中Sysi表示第i个子系统; 深空探测器系统活动状态指m个子系统可能处于的状态集合,设第i个子系统的状态 集合为&=?;,...X}X表示第i个子系统的n-1个可能的状态,则整个探测器系统 的状态集合为S= (S1,S2,…,Si,…,SJ; 对于给定的一个任务Gk,与之对应的目标状态为gk,即在完成任务Gk后探测器处于的 状态,且其中gkGS; 第i个子系统能供选择的动作集合为4 =〖?,…X】,其中X为该子系统总共能够执行 的动作数,每个子系统X的值不同;a;表示第i个子系统可执行的第1个任务,<表示第i 个子系统可执行的第2个任务,<表示第i个子系统可执行的第X个任务;那么整个探测器 动作集合为A=U1,A2,…,Ai,…,AJ; 给定任务目标Gk后,深空探测器系统将当前所处状态作为初始状态sM在自主规划过 程中,每个子系统在一时间点上只执行一个动作,各个子系统间动作具有并行性,且有充足 的时间执行完本子系统动作; 步骤2,根据步骤1中建立的深空探测器系统模型,定义深空探测器系统自主任务规划 问题,确定自主任务规划系统的输入输出; 将深空探测器上状态转移问题2用一个三元组进行表示: 2 = (S,A,y) 其中,y为状态转移函数; 深空探测器上的自主任务规划问题用一个三元组表示: P= (2 ,s〇,gk) 深空探测器上任务规划问题P的解是由多个深空探测器可执行的活动组成的规划序 列,表示为 n--〈2,? --冗j,? --冗h〉 」为探测器系统执行的第j个动作序列,h指探测器系统一共需要执行h个动作序列; 且?=<?),《),--<_<>,其中e'表示第i个子系统在第j个动作序列应该执行的活动; 状态转移函数如下式所示:
当规划序列的解为空时,状态不转移,仍为Stl;当规划序列的解非空,且第一个动作JT:对当前状态Stl可执行,则相继执行动作序列,直到最后的状态; 步骤3,建立神经网络模型,利用深空探测器仿真系统产生的仿真数据对神经网络进行 训练,训练后的神经网络能够在给定一组输入后,得到理想的输出;步骤2中定义的任务规 划问题P和动作序列、分别为神经网络的输入和输出; 步骤4,步骤3中建立的神经网络模型加入自主任务规划系统,用于动作选取;将深空 探测器当前状态Smw和任务目标Gk作为神经网络的输入,经神经网络的选择,输出下一步要 执行的动作; 进行第一次动作选取时,输入为深空探测器当前状态Smw=s^ 步骤5,对步骤4中神经网络选取的动作进行可执行判断,判断条件为选取的动作是否 与上一步选取的动作相同,若相同则不可执行;若可执行,则直接得到下一步的状态,若不 能执行,则要经过恢复原始状态的处理后得到新的动作,然后重新输入神经网络得到下一 个新状态; 步骤6,对得到的新状态进行判断,是否达到了目标状态,若达到,则可直接输出动作序 列,若没有达到,则将新状态作为神经网络输入,重复步骤4-6,直至找到合适的动作序列为 止。
2.根据权利要求1所述的一种基于神经网络的深空探测器自主任务规划方法,其特征 在于:所述神经网络采用三层感知器模型,并利用学习率可变的动量误差反向传播算法进 行训练;神经网络的输入为当前需要解决的规划问题Pntw= [SnOT,Gk],其中Smw表示当前探 测器各个子系统的状态集合,且表示第i个子系统当前所处 的状态; 神经网络在任务规划系统中主要根据探测器当前状态选取深空探测器下一步可执行 的动作,因此神经网络的输出层输出为每个系统需执行的动作集合 Output=Tt) = [O1j,a),…,a'),…,a";' 组织具有代表性的数据进行神经网络训练,训练数据由深空探测仿真得到;当神经网 络经过训练达到误差限定时,再用于自主任务规划系统。
【文档编号】G06Q10/06GK104504520SQ201410812327
【公开日】2015年4月8日 申请日期:2014年12月23日 优先权日:2014年12月23日
【发明者】徐瑞, 李朝玉, 崔平远, 朱圣英, 尚海滨 申请人:北京理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1