一种故障信息管理方法及系统的制作方法

文档序号:6634030阅读:436来源:国知局
一种故障信息管理方法及系统的制作方法
【专利摘要】本发明提供一种故障信息管理方法及系统,上述方法包括以下步骤:可编程设备获取各种类型工作信号并将分析出的异常信号发送至控制设备;所述控制设备通过显示设备将所述异常信号进行显示并将所述异常信号存储至安全数码设备;本发明实现了故障信息的有效管理,对于后续快速定位硬件故障问题尤其是时序问题和电源问题,创造了有利条件。
【专利说明】一种故障信息管理方法及系统

【技术领域】
[0001] 本发明属于故障定位领域,尤其涉及一种故障信息管理方法及系统。

【背景技术】
[0002] 飞速发展的业务需求带动了服务器行业巨大的技术变革,当服务器出现故障不能 正常运行时,快速定位问题是快速解决问题的基本条件。
[0003] 传统的问题定位方法主要是通过光路诊断、系统日志等方法来定位故障产生的原 因,但是传统方法都有些弊端:例如,光路诊断在断电后会丢失故障信息,而系统日志更多 是定位软件故障,对于硬件问题定位尤其是时序问题和电源问题没有一种有效的故障信息 管理方法,这对于后续的故障准确定位造成了一定的困难。


【发明内容】

[0004] 本发明提供一种故障信息管理方法及系统,以解决上述问题。
[0005] 本发明提供一种故障信息管理方法,上述方法包括以下步骤:
[0006] 可编程设备获取各种类型工作信号并将分析出的异常信号发送至控制设备;
[0007] 所述控制设备通过显示设备将所述异常信号进行显示并将所述异常信号存储至 安全数码设备。
[0008] 本发明还提供了一种故障信息管理系统,包括可编程设备、控制设备、显示设备、 安全数码设备;其中,所述可编程设备通过所述控制设备分别与所述显示设备、所述安全数 码设备相连;
[0009] 所述可编程设备,用于获取各种类型工作信号并将分析出的异常信号发送至所述 控制设备;
[0010] 所述控制设备,用于通过所述显示设备将所述异常信号进行显示并将所述异常信 号存储至所述安全数码设备;
[0011] 所述显示设备,用于显示所述控制设备发送的所述异常信号;
[0012] 所述安全数码设备,用于存储所述控制设备发送的所述异常信号。
[0013] 相较于先前技术,根据本发明提供的一种故障信息管理方法及系统,实现了故障 信息的有效管理,对于后续快速定位硬件故障问题尤其是时序问题和电源问题,创造了有 利条件。

【专利附图】

【附图说明】
[0014] 此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发 明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0015] 图1所示为本发明实施例1的故障信息管理方法流程图;
[0016] 图2所示为本发明实施例2的故障信息管理系统结构图。

【具体实施方式】
[0017] 下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的 情况下,本申请中的实施例及实施例中的特征可以相互组合。
[0018] 图1所示为本发明实施例1的故障信息管理方法流程图,包括以下步骤:
[0019] 步骤101 :可编程设备获取各种类型工作信号并将分析出的异常信号发送至控制 设备;
[0020] 所述可编程设备是指现场可编程门阵列设备FPGA(Field - Programmable Gate Array);所述控制设备是指主板管理控制器BMC(Baseboard Management Controller)。
[0021] 工作信号类型包括:直流电信号、时序信号、电源信号即power good信号、复位信 号即reset信号、极限温度信号即thermal trip信号。
[0022] 可编程设备获取各种类型工作信号后,实时监控获取的所述各种类型工作信号是 否处于正常工作状态,并对分析出的异常信号进行记录;
[0023] 所述可编程设备将记录的异常信号发送至控制设备。
[0024] 例如:当电源接通之后.如果输入交流电压在额定工作范围之内.且各路直流输 出电压也已达到它们的最低检测电平(+5V输出为4. 75V以上).那么经过IOOrns?500m 的延时.Power Good电路发出"电源正常"的信号(Power Good为高电平);当电源输入交 流电压降至安全工作范围以下或+5电压低于4. 75V时.电源送出"电源故障信号"(Power Fall,低电平)。
[0025] 步骤102 :所述控制设备通过显示设备将所述异常信号进行显示并将所述异常信 号存储至安全数码设备。
[0026] 所述显示设备是指液晶显示器LCD (Liquid Crystal Display);所述安全数码设 备是指安全数码卡 SD CARD (Secure Digital Memory Card)。
[0027] 例如:主板管理控制器通过显示设备将所述异常信号进行显示并将所述异常信号 存储至安全数码卡SD CARD。
[0028] 下面进行具体说明:
[0029] 1.系统开机时,直流电信号、时序信号、电源信号即power good信号、复位信号即 reset信号、极限温度信号即thermal trip信号是按照时序逻辑的,当FPGA设备发现某个 信号处于正常工作状态,然后对应的下一个信号却始终不能处于正常工作状态,那么FPGA 设备会将不能处于正常工作状态的信号记录下来作为异常信号,发送给主板管理控制器 BMC并将该异常信号存储到SD卡中,同时也会在LCD显示屏上显示,从而通知用户或者研发 人员问题产生的信号。
[0030] 2.系统处于正常工作状态时突然重启或者关机时,FPGA设备可以发现某个信号 最先处于不正常的工作状态并作为异常信号,发送给主板管理控制器BMC并将该异常信号 存储到SD卡中,同时也会在IXD显示屏上显示,从而让用户和研发人员知道产生问题的信 号。
[0031] 所述控制设备定时统计预设时段内同一类型异常信号发生次数,根据异常信号发 生次数范围与报警信息对照表,发送对应的报警信息至终端。
[0032] 其中,所述控制设备预先存储异常信号发生次数范围与报警信息对照表或者从第 三方实体中获取异常信号发生次数范围与报警信息对照表。
[0033] 其中,所述终端是指管理员终端。
[0034] 定时时间、预设时段可以根据实际情况进行灵活设置,在此不限定本发明的保护 范围。
[0035] 异常信号发生次数与报警信息对照表
[0036]

【权利要求】
1. 一种故障信息管理方法,其特征在于,包括w下步骤: 可编程设备获取各种类型工作信号并将分析出的异常信号发送至控制设备; 所述控制设备通过显示设备将所述异常信号进行显示并将所述异常信号存储至安全 数码设备。
2. 根据权利要求1所述的方法,其特征在于:所述可编程设备是指现场可编程口阵列 设备FPGA ;所述控制设备是指主板管理控制器BMC ;所述显示设备是指液晶显示器LCD ;所 述安全数码设备是指安全数码卡SD CARD。
3. 根据权利要求1所述的方法,其特征在于,工作信号类型包括;直流电信号、时序信 号、电源信号、复位信号、极限温度信号。
4. 根据权利要求1所述的方法,其特征在于: 可编程设备获取各种类型工作信号后,实时监控获取的所述各种类型工作信号是否处 于正常工作状态,并对分析出的异常信号进行记录; 所述可编程设备将记录的异常信号发送至控制设备。
5. 根据权利要求1所述的方法,其特征在于:所述控制设备定时统计预设时段内同一 类型异常信号发生次数,根据异常信号发生次数范围与报警信息对照表,发送对应的报警 信息至终端。
6. 根据权利要求5所述的方法,其特征在于:所述控制设备预先存储异常信号发生次 数范围与报警信息对照表或者从第H方实体中获取异常信号发生次数范围与报警信息对 照表。
7. 根据权利要求6所述的方法,其特征在于,所述终端是指管理员终端。
8. -种故障信息管理系统,其特征在于,包括可编程设备、控制设备、显示设备、安全数 码设备;其中,所述可编程设备通过所述控制设备分别与所述显示设备、所述安全数码设备 相连; 所述可编程设备,用于获取各种类型工作信号并将分析出的异常信号发送至所述控制 设备; 所述控制设备,用于通过所述显示设备将所述异常信号进行显示并将所述异常信号存 储至所述安全数码设备; 所述显示设备,用于显示所述控制设备发送的所述异常信号; 所述安全数码设备,用于存储所述控制设备发送的所述异常信号。
【文档编号】G06F11/26GK104461809SQ201410641066
【公开日】2015年3月25日 申请日期:2014年11月13日 优先权日:2014年11月13日
【发明者】王永欢, 薛广营 申请人:浪潮(北京)电子信息产业有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1