一种分布式高算力星载计算平台系统设计方法与流程

文档序号:37021909发布日期:2024-02-09 13:15阅读:17来源:国知局
一种分布式高算力星载计算平台系统设计方法与流程

本发明涉及一种分布式高算力星载计算平台系统设计方法,属于星上在轨智能处理。


背景技术:

1、随着成像技术的迅速发展,遥感图像呈现出空间分辨率、时间分辨率和光谱分辨率不断提高的特点,几何级数增长的数据量与平台传输和存储的有限资源产生了巨大矛盾。几十gbps乃至上百gbps的原始数据量不仅对传统的数据处理传输链路产生巨大的压力,而且通过原始数据下传到地面来获取海量的探测数据,在海量数据中由人工发现、确认高价值信息也会耗时巨大。高价值信息蕴含在海量探测原始数据中,并且有效的数据量非常小,从而导致所下传的大量数据基本为无效的冗余数据。目前传统的数据处理通过提高下传遥感图像的压缩比来节省链路带宽,然而遥感图像压缩技术已多年未有突破,通过压缩方式降低传输数据量已遭遇瓶颈。我国在世界范围内地面数据接收站较少,中继传输能力较弱,面临的数据快速下传压力较大。星上获得的遥感数据,传输到地面进行处理并供给用户去提取有用信息,卫星数据出现了“既多又少”的矛盾局面。一方面,地面系统每天获得海量的对地观测数据;另一方面,海量数据难以及时处理,造成极大的浪费。传统信息获取模式为卫星获取数据、下传地面站、再到处理中心生成图像产品、最后逐级分发到终端用户,链路长、延时大,时效性差。因此,通过在轨智能处理技术,在星上直接生成信息产品,由分发通道直接面向各级终端用户分发不同层级的应用产品,可提供时效性更强的信息服务。通过在轨智能处理技术,在海量遥感原始数据中快速提取高价值的时敏信息,可将遥感数据量减少几百倍,不仅节省卫星数据存储、传输资源,还可显著提高卫星数传系统的应用效能。

2、对于星上智能处理而言,其在轨处理的实时性非常重要,需要采用高性能的在轨计算处理平台。不同处理算法需要相应的模板、参数进行配合,为了持续提升在轨处理的应用效能,平台的处理算法还需具备可演进升级的能力。然而受限于宇航应用处理芯片的性能及真空条件下的高低温环境,可选用的处理芯片种类非常少;并且单个处理芯片的算力有限,需要考虑在宇宙辐照环境条件下长期工作时的可靠性。尤其是针对高达几十gbps乃至上百gbps原始载荷数据的在轨快速处理需求,需要采取多台设备进行并行处理来实现算力的提升。而多台设备之间并行处理,涉及到载荷数据的分路、时钟同步、状态监测、健康管理、分布式计算异常自主切换等问题,流程及操作非常复杂。


技术实现思路

1、本发明解决的技术问题是:克服现有技术的不足,提出了一种分布式高算力星载计算平台系统设计方法,通过采用交叉冷备份与交叉贮备的平台拓扑结构,满足了平台的高算力需求。

2、本发明的技术解决方案是:

3、一种分布式高算力星载计算平台系统,包括两个互为冷备的控制单元、两个互为冷备的路由单元、多个交叉贮备的计算单元、电源单元、底板单元;

4、所述路由单元接收多源载荷数据,将载荷数据分块处理后分发至控制单元指定的各所述计算单元,并将自身的健康状态信息传送至控制单元;

5、所述电源单元包括若干个电源模块,每个电源模块具备独立控制路由单元或计算单元的加断电;

6、所述控制单元接收星务总线发送的间接指令及姿轨控信息、秒脉冲信号后进行时间基准同步,以广播形式转发至路由单元和计算单元,并监测处于工作状态的路由单元、计算单元电流、电压信息,再结合接收的路由单元、计算单元健康状态信息判断相应路由单元、计算单元的健康状态,对状态异常的路由单元、计算单元进行自主替换处理;

7、所述计算单元接收载荷数据、广播信息后进行分布式并行处理,并将自身的健康状态信息传送至控制单元;

8、所述底板单元设置多个数据通道,包括全双工gth或gtx接口、点对点lvds遥控遥测接口、点对点lvds上注重构接口、二次电源供电接口,实现路由单元、计算单元、控制单元之间的信息流、控制流、能源流的互联互通。

9、优选的,对状态异常的计算单元进行分级处理,包括:

10、若电压、电流、温度中的任意一个超过门限范围,控制单元对相应的计算单元进行立即断电处置,再从交叉贮备份的计算单元中选择一个计算单元作为替换并进行加电,向选择的替换计算单元发送姿轨控信息及时间基准信号,同时路由单元将原本发送给异常计算单元的载荷数据路由至加电替换的计算单元;所述计算单元根据接收到载荷数据及姿轨控信息、时间基准信号,搜索并提取载荷数据的帧头信号,在载荷数据发送的空闲状态时同步到其他已加电计算单元的处理进程,所有加电的计算单元重新处于并行同步的计算处理状态;

11、若监测到指令计数、指令正确计数均异常,控制单元对相应的计算单元通过遥测上报预警信息,由上级设备进行综合判读后再进行处置;

12、若计算单元处理进程及输出结果异常,对功能异常的计算单元进行预警上报。

13、优选的,对状态异常的路由单元进行处理,包括:若控制单元监测到当前工作中的路由单元主份的健康状态信息、电流、电压异常,自主对所述路由单元执行断电操作,再对处于备份状态的路由单元进行加电,同时将对路由单元主份的异常状态及路由主备切换信息通过一级总线进行上报,并同时监测路由单元备份的健康状态信息;若路由单元备份同样出现异常,则控制单元不再执行自主切换到主份的操作,将异常状态向一级总线进行上报,由一级总线进行仲裁处置。

14、优选的,所述路由单元具备tlk2711/cxp/光纤高速接口、lvds中速接口、rs422低速接口的载荷数据接收能力,具有fpga处理芯片;fpga处理芯片将多源载荷数据均分为若干块后按照约定的协议格式通过底板单元的多路全双工gth/gtx接口路由至各计算单元,接收来自于控制单元的lvds遥控信号、各计算单元的处理结果,并将处理结果合路后输出;

15、所述路由单元设有反熔丝fpga及外挂的nor flash,用于对本单元的配置程序及处理参数的集中存放管理及定时刷新、自主修复,并接收来自控制单元的lvds上注通道数据,实现路由单元的上注重构管理。

16、优选的,所述计算单元采用高性能混合异构、可扩展、可重构在轨处理架构,由fpga芯片与dsp、gpu、cpu三种中任一种结合构成处理核心;fpga具备通过底板单元的gth或gtx接口与路由单元主备进行互连实现数据流的交互,具备通过底板单元的点对点lvds接口与控制单元主备进行遥控遥测及上注通道的通信;

17、计算单元设有反熔丝fpga及外挂nor flash芯片、nand flash存储芯片;反熔丝fpga及外挂nor flash芯片用于对fpga、cpu、gpu程序的edac管理维护和自主修复,存放处理算法应用程序;计算单元fpga接收来自控制单元的lvds串行信号,实现计算单元遥控管理;反熔丝fpga接收来自控制单元的lvds上注通道数据,实现计算单元的上注重构管理;nand flash存储芯片用于存储在轨处理算法运行的关键过程及处理结果数据。

18、优选的,所述控制单元为fpga或者fpga+cpu架构,采用最小系统设计方法,fpga或cpu均采取异构备份方式进行配置程序的存放管理,配置程序的异构备份方式为同时prom落焊存储位流和可上注更新的nor flash存储位流;

19、所述控制单元为两级总线拓扑方式,一级总线与外部设备进行通信,二级总线与系统内部各单元之间进行通信;所述控制单元通过点对点lvds接口与路由单元主备、各计算单元之间进行控制流通信,向电源单元发送使能信号实现对计算单元或者路由单元相应电源模块的加断电控制,通过ad采集路由单元主备或计算单元的电压和电流。

20、一种分布式高算力星载计算方法,包括:

21、控制单元加电工作后,按照星务总线的指令信息,默认选择路由单元主份及对应的k个计算单元进行加电;

22、k个计算单元加电后,分别加载运行各自的反熔丝fpga外挂nor flash芯片中存放的处理算法应用程序、处理算法的模板参数信息;

23、路由单元接收外部多源载荷,将多源载荷划分为k份后分发至相应k个加电的计算单元;

24、计算单元根据处理算法进行计算,将自身的遥控指令计数、遥测返回计数、温度遥测、处理进程、运行状态发送至控制单元;

25、控制单元对各计算单元的工作电流、电压信息进行实时监测,根据实时监测信息及各计算单元发送的健康状态信息,判决各计算单元的状态,对判决为异常的计算单元进行分级处理,并且向一级总线进行上报。

26、优选的,根据实时监测信息及各计算单元发送的健康状态信息,判决各计算单元的状态,对判决为异常的计算单元进行分级处理,分级处理的方法为:

27、若电压、电流、温度中的任意一个超过门限范围,控制单元对相应的计算单元进行立即断电处置,再从交叉贮备的计算单元中选择另一个计算单元作为替换并进行加电,向选择的计算单元发送姿轨控及时间基准信号;所述计算单元根据接收到载荷数据及姿轨控信息、时间基准信号,搜索并提取载荷数据的帧头信号,在载荷数据发送的空闲状态时同步到其他已加电计算单元的处理进程,所有加电的计算单元重新处于并行同步的计算处理状态;

28、若监测到遥控指令计数、指令执行正确计数均异常,控制单元对相应的计算单元通过遥测上报预警信息,由上级设备进行综合判读后再进行处置;

29、若计算单元处理进程及输出结果异常,对功能异常的计算单元进行预警上报。

30、优选的,若控制单元监测到路由单元主份的健康状态信息异常,自主对路由单元的主份执行断电操作,再对路由单元的备份进行加电,同时将对路由主份的异常状态及路由主备切换信息通过一级总线进行上报,并同时监测路由单元备份的健康状态信息;若路由单元备份同样出现异常,则控制单元不再执行自主切换到主份的操作,只将异常状态向一级总线进行上报,由一级总线进行仲裁处置。

31、优选的,计算单元的健康状态信息包括配置程序加载状态、核心处理芯片的温度、接收到控制单元的指令计数及指令执行正确计数;路由单元的健康状态信息包括核心处理芯片的温度、路由单元接收到控制单元的指令计数及指令执行正确计数、路由单元接收到各计算单元的处理进程及输出结果。

32、本发明与现有技术相比的优点在于:

33、(1)本发明提出一种路由单元、控制单元交叉冷备份与计算单元交叉贮备的分布式高性能星载计算平台拓扑架构,通过交叉贮备的并行计算来满足了平台的高算力需求,并实现了平台内数据流、控制流、能源流的灵活控制切换以及自主健康管理。

34、(2)本发明设计了两级总线来实现控制流的管理,提出了一种控制单元与路由及计算单元之间的点对点lvds遥控遥测及上注重构通道进行互联,可在常规处理业务运行时实现处理程序、模板、参数的快速上注更新。

35、(3)本发明设计了一片专用的反熔丝fpga外挂nor flash芯片来实现本单元fpga/cpu/gpu程序的edac管理维护和自主修复,具备存放多份处理算法应用程序的能力,还可具备维护多份相应处理算法所需的模板、参数、系数等信息。

36、(4)本发明基于路由或计算单元的加断电及健康状态,设计了一种健康管理策略,实现了对监测到的异常进行自主恢复及自主切换处理。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1