一种下位机故障监测及处理方法

文档序号:9707759阅读:828来源:国知局
一种下位机故障监测及处理方法
【技术领域】
[0001]本发明涉及一种用于航天器电子产品所需要的故障监测及处理方法,属于故障监测技术领域。
【背景技术】
[0002]航天技术作为衡量一个国家现代综合技术水平的重要标志,对于发展科技、国民经济和国防军事具有重要作用,是一项综合了多学科的庞大系统工程。航天器作为一类大型复杂系统,综合了多学科(机械、控制、材料、电子、通讯、能源和计算机等)的最新尖端成果,在通讯、国防、深空探测等领域具有不可替代性。然而,由于空间环境特殊、航天器结构复杂,很难保证在轨航天器不出现异常,一旦发生故障将有可能造成巨大的经济损失、甚至人员伤亡。
[0003]卫星作为一类重要的航天器,由供配电、控制、热控、推进等各分系统所组成。其造价昂贵,若在轨发生故障,损失较大。随着我国卫星的先进性逐年提高,卫星系统规模越来越大,智能化系统负载领域也随之增长,星载计算机用于处理的数据信息逐渐扩大,占用星上资源的比例变大,其计算处理的实时性和可靠性遭受到很大程度的挑战。而下位机作为子系统,执行的数据处理功能较少,资源利用率低于星载计算机,依据此背景提出本技术发明,合理利用资源,提高下位机信息处理能力。降低卫星系统的信息处理负担,提高卫星系统工作的可靠性,减少经济损失。
[0004]如何减低卫星系统的负担,是本领域亟待解决的技术问题。

【发明内容】

[0005]本发明的目的在于克服现有技术的不足,提供一种下位机工作状态监测方式,在不改变系统硬件状态的前提下,优化卫星对下位机的故障监测,充分利用下位机自身监测功能,减低对星上资源的占用。
[0006]本发明目的通过如下技术方案予以实现:
[0007]提供一种下位机故障监测及处理方法,该方法具体包括以下步骤:
[0008](1)下位机发现自身存在故障;下位机根据故障反馈信息将故障分类,包括:硬件接口故障,添加第一标识01;总线通信接口故障,添加第一标识10 ;程序故障,添加第一标识11;
[0009](2)判断故障为瞬态故障或永久故障;当为硬件接口故障时,判断为永久故障;当为总线通信接口故障时,重复发送三次应答指令,如果三次均无应答或者应答错误则判断为永久故障,如果三次中至少有一次为应答正确,则判断为瞬态故障;当为程序故障时,重复执行三次该程序对应的功能函数,如果三次执行中程序故障状态均未改变则判断为永久故障,如果三次中有一次为执行正确状态,判断为瞬态故障;
[0010](3)对于瞬态故障,添加第二标识01,对于永久故障添加第二标识10;
[0011 ] (4)对于故障信息进行动态组帧,每帧包括第一标识和第二标识,对每帧数据存储并上传至上位机。
[0012]优选的,总线通信接口故障包括总线应答超时或异常应答、通信校验错误、通信帧头错误、通信命令字错误、通信有效数据错误、通信子地址错误、通信数据字计数错误、总线B指令码有误、总线遥测数据校验错误;硬件接口故障包括AD采集故障、RAM故障、处理器故障;程序故障包括模拟量采集超时、数据校验错误、程序跑飞、数据存储区空间校验错误。
[0013]优选的,步骤(4)中对每帧数据存储的具体方法为:对多个故障根据故障发生的时间进行顺次队列组帧。
[0014]优选的,应答错误包括应答超时和应答内容错误。
[0015]优选的,应答超时为应答超过40ms。
[0016]本发明与现有技术相比具有如下优点:
[0017](1)本发明将故障分为瞬态故障或永久故障,利用下位机自身资源实现故障类型划分确认,提升故障响应时间,减少和降低了星上资源(上位机)的占用。
[0018](2)本发明在下位机发现故障后及时由下位机处理,提高了故障处理的实时性,降低了故障响应时间,有利于故障复现和准确定位。
[0019](3)本发明首先对硬件接口故障、总线通信接口故障、程序故障进行了区分,对于不同类型的故障采用不同的判定方法,添加不同的标识,便于上位机识别处理;
[0020](4)本发明通过三次发送指令的响应结果来确定为瞬态故障或者永久故障,充分考虑了时间效率和故障判定准确性,提高了工作状态监测和故障处理的实时性。
[0021](5)本发明采用动态组帧的方式,对于某个故障,在不覆盖上次发送故障信息的情况下,根据故障发生的时间进行顺次队列组帧,便于对此故障信息进行查看和故障追溯。
[0022](6)本发明的故障处理机制,有利于星上系统尽快做出反应策略,在星上载荷系统中具有良好的应用前景。
[0023](7)使用本发明的故障处理机制,可提高应用系统故障诊断的可靠性。
【附图说明】
[0024]图1为本发明故障监测及处理示意图;
[0025]图2为本发明故障监测及处理软件运行流程图。
【具体实施方式】
[0026]下面结合附图对本发明作进一步详细说明。
[0027]如图1和2所示,执行步骤如下:
[0028]1)下位机实时监测工作状态,统筹发生的故障信息,并将故障类型定为三类,分别是硬件接口故障、总线通信接口故障和程序故障。按照数据格式方式对故障数据进行分别存储,故障位大小为2bit,其中“00”表示正常,“01”、“10”、“11”分别作为三种故障类型的标识。
[0029]实时采集各遥测参数,依据定义的不同遥测采集通道,按照“故障信息+标志位”的格式,将故障数据存储在临时存储区。
[0030]2)根据故障标识和具体故障的状态信息,进行故障识别与处理,将其分为永久故障和瞬态故障,在故障标识前添加故障种类标识,大小为2bit,其中标识“01”表示当前故障为瞬态故障;标识“10”表示当前故障为永久故障,标识“00”表示当前无故障。
[0031]3)采用一种动态计数的方法来对故障信息进行判断,按照“故障种类标识+故障类型标识+具体故障信息”的格式动态上传。具体故障特性说明如下:
[0032]瞬态故障识别及处理:
[0033]瞬态故障是指系统有指标出现瞬时功能下降,但过后仍能够恢复正常工作状态。对于如总线应答超时或异常应答、通信校验错误、通信帧头错误、通信命令字错误、通信有效数据错误、通信子地址错误、通信数据字计数错误、总线B指令码有误、总线遥测数据校验错误,会出现瞬时错误的情况。
[0034]根据瞬时故障的特点,开展如下处理措施:
[0035]a.总线超时无响应:当发送命令应答超时,即超过40ms时(依据通信协议),则重新发送该命令。当应答超时达到3次,则判定当前总线故障,总线超时无响应故障标志置位。
[0036]b.异常应答:当收到异常应答时,根据应答内容进行操作,如接收到帧头错误、命令码有误、有效数据有误、奇偶或异或校验有误标志时,重新发送命令3次。
[0037]c.指令字节判断:根据总线数据格式顺序提取一或多条指令数据,最多不超过15个,指令数据字计数1,每条指令码高低字节相同,若不同则不予执行,重复3次后,置故障标识位,同时将错误信息上传。
[0038]永久故障识别及处理:
[0039]永久故障指某些重要系统指标出现了失效情况,系统不能维持正常工作,对于每次调用时都会出现错误,可看成永久型故障来进行处理。处理措施如下:
[0040]a.AD采集等硬件接口类发生错误:判定出现故障,置故障标识位,设置合理的超时退出机制。
[0041 ] b.合法性检验:对子地址、数据字计数、指令码等进行合法性检验,若不合法则放弃执行,同时将错误状态信息通过总线数据信道上传。
[0042]故障信息动态组帧计数:
[0043]通常采用的故障计数方式为数据覆盖的形式,当新的故障触发时在同一位置上覆盖即可。本方法采用数据重复累加的形式,当新的故障触发时按纵向顺序排列在当前队列末尾,动态地实现故障类型的计数。
[0044]本发明成功应用于某卫星子系统智能配电单机,清楚明了地对故障信息进行判断,提高故障识别能力,降低故障的响应时间。能够最大限度地合理利用下位机的资源实时监控自身工作状态并进行故障处理,使该问题得到一定程度的缓解。
[0045]以上所述,仅为本发明最佳的【具体实施方式】,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
[0046]本发明说明书中未作详细描述的内容属于本领域专业技术人员的公知技术。
【主权项】
1.一种下位机故障监测及处理方法,其特征在于:该方法具体包括以下步骤: (1)下位机发现自身存在故障;下位机根据故障反馈信息将故障分类,包括:硬件接口故障,添加第一标识01;总线通信接口故障,添加第一标识10;程序故障,添加第一标识11; (2)判断故障为瞬态故障或永久故障;当为硬件接口故障时,判断为永久故障;当为总线通信接口故障时,重复发送三次应答指令,如果三次均无应答或者应答错误则判断为永久故障,如果三次中至少有一次为应答正确,则判断为瞬态故障;当为程序故障时,重复执行三次该程序对应的功能函数,如果三次执行中程序故障状态均未改变则判断为永久故障,如果三次中有一次为执行正确状态,判断为瞬态故障; (3)对于瞬态故障,添加第二标识01,对于永久故障添加第二标识10; (4)对于故障信息进行动态组帧,每帧包括第一标识和第二标识,对每帧数据存储并上传至上位机。2.根据权利要求1所述的方法,其特征在于:总线通信接口故障包括总线应答超时或异常应答、通信校验错误、通信帧头错误、通信命令字错误、通信有效数据错误、通信子地址错误、通信数据字计数错误、总线B指令码有误、总线遥测数据校验错误;硬件接口故障包括AD采集故障、RAM故障、处理器故障;程序故障包括模拟量采集超时、数据校验错误、程序跑飞、数据存储区空间校验错误。3.根据权利要求1所述的方法,其特征在于:步骤(4)中对每帧数据存储的具体方法为:对多个故障根据故障发生的时间进行顺次队列组帧。4.根据权利要求1所述的方法,其特征在于:应答错误包括应答超时和应答内容错误。5.根据权利要求1所述的方法,其特征在于:应答超时为应答超过40ms。
【专利摘要】本发明涉及一种下位机故障监测及处理方法,包括步骤如下:下位机发现自身存在故障;下位机根据故障反馈信息将故障分类;判断故障为瞬态故障或永久故障;对于瞬态故障,添加第二标识01,对于永久故障添加第二标识10;对于故障信息进行动态组帧,每帧包括第一标识和第二标识,对每帧数据存储并上传至上位机。本发明在不改变系统硬件状态的前提下,优化卫星对下位机的故障监测,充分利用下位机自身监测功能,减低对星上资源的占用。
【IPC分类】G05B23/02
【公开号】CN105467973
【申请号】CN201510981624
【发明人】吴闯, 司雪圆, 郭坤, 李辉耀, 任亮, 陈永刚
【申请人】北京卫星制造厂
【公开日】2016年4月6日
【申请日】2015年12月23日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1