一种故障信息处理方法与相关装置的制造方法

文档序号:8225878阅读:214来源:国知局
一种故障信息处理方法与相关装置的制造方法
【技术领域】
[0001]本发明涉及信息领域,尤其涉及一种故障信息处理方法与相关装置。
【背景技术】
[0002]数据中心是一整套复杂的设施,不仅包括计算机系统和其他与之配套的设备,还包括数据通信连接,环境控制设备,监控设备以及各种安全装置。随着数据中心相关技术的成熟,越来越多的企业开始构建自己的数据中心并将业务迀移到数据中心平台上。
[0003]实际的数据中心具有复杂的IT系统环境,当数据中心发生故障时,需要根据数据中心海量的状态管理信息人工进行故障定位,这些状态管理信息用于表示数据中心的运行状态,包括数据中心的系统配置信息、和/或告警信息、和/或性能监控信息、和/或日志信息、和/或投诉保障信息、和/或配置变更信息、和/或工单信息。
[0004]但是数据中心发生故障时,首要的任务是恢复业务,而业务恢复后,数据中心的状态管理信息与故障时刻相比已经发生了变化,需要人工投入大量时间查找历史状态管理信息,然后分析故障的发生位置。即便如此,故障时刻的很多状态管理信息也已经不可查询,导致无法实现精准的故障定位。因此,现有技术的故障信息处理方法耗时长,操作复杂,且可靠性不高。

【发明内容】

[0005]本发明实施例提供了一种故障信息处理方法,用于优化故障定位。
[0006]本发明实施例的第一方面提供了一种故障信息处理方法,适用于数据中心,所述数据中心包括被管理对象,所述方法包括:
[0007]在多个时刻点,获取所述数据中心的状态管理信息,所述状态管理信息用于描述所述数据中心的运行状态;
[0008]根据所述状态管理信息,确定所述数据中心的N个被管理对象的状态信息,所述状态信息用于表示所述被管理对象的工作状态;
[0009]记录所述多个时刻点以及每个所述时刻点对应的N个被管理对象的状态信息。
[0010]结合本发明实施例的第一方面,本发明实施例的第一方面的第一种实现方式中,所述记录所述多个时刻点以及每个所述时刻点对应的N个被管理对象的状态信息之前还包括:
[0011]确定所述N个被管理对象之间的关联关系;
[0012]所述记录所述多个时刻点以及每个所述时刻点对应的N个被管理对象的状态信息包括:
[0013]记录所述多个时刻点、每个所述时刻点对应的N个被管理对象的状态信息、以及每个所述时刻点对应的N个被管理对象之间的关联关系。
[0014]结合本发明实施例的第一方面的第一种实现方式,本发明实施例的第一方面的第二种实现方式中,所述数据中心的状态管理信息包括:
[0015]系统配置信息、和/或告警信息、和/或性能监控信息、和/或日志信息、和/或投诉保障信息、和/或配置变更信息、和/或工单信息。
[0016]结合本发明实施例的第一方面的第一种或第二种实现方式,本发明实施例的第一方面的第三种实现方式中,所述根据所述状态管理信息,确定所述数据中心的N个被管理对象的状态信息包括:
[0017]根据所述数据中心的N个被管理对象的属性,将所述状态管理信息划分为所述N个被管理对象的状态信息,所述被管理对象的属性包括:被管理对象的设备名称、和/或被管理对象的IP地址、和/或被管理对象的设备编码、和/或被管理对象的用户名。
[0018]结合本发明实施例的第一方面的第一种或第二种实现方式,本发明实施例的第一方面的第四种实现方式中,所述方法还包括:
[0019]接收客户端发送的故障查找指令,所述故障查找指令包括故障发生时刻;
[0020]从记录的所述多个时刻点、每个所述时刻点对应的N个被管理对象的状态信息、以及每个所述时刻点对应的N个被管理对象之间的关联关系中,查找所述故障发生时刻对应的N个被管理对象的状态信息与N个被管理对象之间的关联关系;
[0021 ] 将所述故障发生时刻对应的N个被管理对象的状态信息与N个被管理对象之间的关联关系反馈给所述客户端。
[0022]本发明实施例的第二方面提供了一种故障信息处理装置,适用于数据中心,所述数据中心包括被管理对象,所述装置包括:
[0023]信息获取模块,用于在多个时刻点,获取所述数据中心的状态管理信息,所述状态管理信息用于描述所述数据中心的运行状态;
[0024]安全确定模块,用于根据所述状态管理信息,确定所述数据中心的N个被管理对象的状态信息,所述状态信息用于表示所述被管理对象的工作状态;
[0025]信息记录模块,用于记录所述多个时刻点以及每个所述时刻点对应的N个被管理对象的状态信息。
[0026]结合本发明实施例的第二方面,本发明实施例的第二方面的第一种实现方式还包括:
[0027]关联确定模块,用于在所述信息记录模块记录所述多个时刻点以及每个所述时刻点对应的N个被管理对象的状态信息之前,确定所述N个被管理对象之间的关联关系;
[0028]所述信息记录模块具体用于:
[0029]记录所述多个时刻点、每个所述时刻点对应的N个被管理对象的状态信息、以及每个所述时刻点对应的N个被管理对象之间的关联关系;
[0030]结合本发明实施例的第二方面的第一种实现方式,本发明实施例的第二方面的第二种实现方式中,所述数据中心的状态管理信息包括:
[0031]系统配置信息、和/或告警信息、和/或性能监控信息、和/或日志信息、和/或投诉保障信息、和/或配置变更信息、和/或工单信息。
[0032]结合本发明实施例的第二方面的第一种或第二种实现方式,本发明实施例的第二方面的第三种实现方式中,所述安全确定模块具体用于:
[0033]根据所述数据中心的N个被管理对象的属性,将所述状态管理信息划分为所述N个被管理对象的状态信息,所述被管理对象的属性包括:被管理对象的设备名称、和/或被管理对象的IP地址、和/或被管理对象的设备编码、和/或被管理对象的用户名。
[0034]结合本发明实施例的第二方面的第一种或第二种实现方式,本发明实施例的第二方面的第四种实现方式还包括:
[0035]指令接收模块,用于接收客户端发送的故障查找指令,所述故障查找指令包括故障发生时刻;
[0036]故障查找模块,用于从记录的所述多个时刻点以及每个所述时刻点对应的N个被管理对象的状态信息中,查找所述故障发生时刻对应的N个被管理对象的状态信息;
[0037]故障反馈模块,用于将所述故障发生时刻对应的N个被管理对象的状态信息反馈给所述客户端。
[0038]本发明实施例提供的方法中,在多个时刻点,获取数据中心的状态管理信息;根据状态管理信息,确定数据中心的N个被管理对象的状态信息,该状态信息用于表示被管理对象的安全状态;记录多个时刻点以及每个时刻点对应的N个被管理对象的状态信息。本发明实施例提供的方法将数据中心的状态管理信息按照被管理对象进行分类保存,这样在进行故障定位的时候,用户可以根据保存的信息,直接定位到故障发生时刻,根据该时刻每个被管理对象的安全状态进行准确的故障定位,无需人工查找海量的状态管理信息,也无需人工对状态管理信息进行分析。因此,本发明实施例提供的方法能够减少故障定位的时长,简化故障定位的操作,提高故障定位的可靠性。
【附图说明】
[0039]图1为本发明实施例中故障信息处理方法一个实施例流程图;
[0040]图2为本发明实施例中故障信息处理方法另一个实施例流程图;
[0041]图3为本发明实施例中故障信息处理装置一个实施例流程图;
[0042]图4为本发明实施例中故障信息处理装置另一个实施例流程图;
[0043]图5为本发明实施例中故障信息处理装置另一个实施例流程图;
[0044]图6为本发明实施例中故障信息处理装置另一个实施例流程图。
【具体实施方式】
[0045]本发明实施例提供了一种故障信息处理方法,用于减少故障定位的时长,简化故障定位的操作,提高故障定位的可靠性。本发明实施例还提供了相关的故障信息处理装置,以下将分别进行说明。
[0046]本发明实施例提供的故障信息处理方法的基本流程请参阅图1,主要包括:
[0047]101、在多个时刻点,获取数据中心的状态管理信息;
[0048]故障信息处理装置在多个时刻点,获取数据中心的状态管理信息,该状态管理信息用于描述数据中心的运行状态。
[0049]其中,多个时刻点可以为人为设定,也可以为故障信息处理装置默认设定,如故障信息处理装置默认每隔15min设置一个时刻点。该多个时刻点也可以通过其他方式确定,此处不做限定。
[0050]故障信息处理装置获取数据中心的状态管理信息的方法有很多,将在后面的实施例中详述,此处不做限定。
[0051]102、根据状态管理信息,确定数据中心的N个被管理对象的状态信息;
[0052]数据中心包括不少于一个的被管理对象,数据中心对这些被管理对象进行管理。其中,被管理对象可以为物理设备等实体对象,也可以为操作系统、数据库、中间件等软件对象,本实施例中不做限定。
[0053]故障信息处理装置根据状态管理信息,确定数据中心的N个被管理对象的状态信息。其中,状态信息用于表示被管理对象的工作状态。
[0054]103、记录
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1