一种信息系统故障自动恢复的方法及系统的制作方法

文档序号:9787308阅读:1285来源:国知局
一种信息系统故障自动恢复的方法及系统的制作方法
【技术领域】
[0001] 本发明涉及数据处理领域,特别涉及一种信息系统故障自动恢复的方法及系统。
【背景技术】
[0002] 随着信息技术在各行各业的普遍应用,出现了大量的信息系统,有服务全球的大 型电子商务网站、社交媒体,有公共事业的电力、交通、天气等领域的调度监控指挥系统,有 企业的营销、财务、人力资源等管理系信息系统。这些信息系统将各类生产经营和管理业务 信息化、数据化和网络化的同时,数据中心不断投入新增的设备以承载大量的信息系统。为 保证用户对信息系统访问的需要,普遍要求信息系统7X24小时不间断地稳定运行,系统出 现个别软硬件的故障和问题,能够快速处理和恢复,不影响用户的使用,这对系统的容错能 力和鲁棒性提出了更高的要求。
[0003] 目前,信息系统普遍采用集群架构,在信息系统的硬件和软件方面提供冗余配置, 当单个节点出现问题或故障,尽量不影响系统整体运行或用户体验。用户和系统运维人员 都希望系统的问题和故障可以快速解决和恢复,以不影响系统的处理能力、性能以及用户 的使用。
[0004] 大型数据中心部署几十甚至几百套信息系统,几万到十几万台服务器设备,人工 的问题和故障处理已经不能满足系统运行和业务使用的要求,需要信息系统故障和问题自 动恢复的技术方法,减少人工干预,提高信息系统整体的可靠性和问题故障自愈能力,提高 运维工作的自动化和智能化水平。

【发明内容】

[0005] 本发明的目的是提供一种信息系统故障自动恢复的方法及系统,该方法能够自动 恢复信息系统故障和问题,减少人工干预,提高信息系统整体的可靠性和问题故障自愈能 力,提高运维工作的自动化和智能化水平。
[0006] 为解决上述技术问题,本发明提供一种信息系统故障自动恢复的方法,包括:
[0007] 获取信息系统的监控状态指标的数值;
[0008] 将各个所述监控状态指标的数值与对应的预定状态指标范围进行比较,并根据比 较结果确定告警信息;
[0009] 根据所述告警信息,选择对应的BP神经网络状态分析程序对所述告警信息进行状 态评估;
[0010] 根据状态评估结果,调取相应的匹配脚本,并根据所述匹配脚本执行恢复命令。
[0011] 其中,所述根据所述告警信息,选择对应的BP神经网络状态分析程序对所述告警 信息进行状态评估,包括:
[0012] 根据所述告警信息,判断所述告警信息是否属于知识库范围;
[0013] 若属于,则选择与所述告警信息对应的BP神经网络状态分析程序对所述告警信息 进tx状态评估。
[0014] 其中,所述根据状态评估结果,调取相应的匹配脚本,并根据所述匹配脚本执行恢 复命令,包括:
[0015] S3、根据状态评估结果,调取相应的匹配脚本;
[0016] S31、判断所述告警信息的连续处理次数是否超过对应的阈值;
[0017] S32、若未超过,则根据所述匹配脚本执行恢复命令,并验证所述告警信息是否恢 复;
[0018] S33、若恢复,则结束;
[0019] S34、若未恢复,则根据所述告警信息,选择对应的BP神经网络状态分析程序对所 述告警信息进行状态评估,并进入S3。
[0020] 其中,还包括:
[0021 ]记录所述信息系统的故障自动恢复过程日志。
[0022] 其中,还包括:
[0023] 定期根据信息系统故障自动恢复系统的日志,对BP神经网络状态分析程序及匹配 脚本进行维护。
[0024] 本发明提供一种信息系统故障自动恢复的系统,包括:
[0025] 获取模块,用于获取信息系统的监控状态指标的数值;
[0026] 告警信息模块,用于将各个所述监控状态指标的数值与对应的预定状态指标范围 进行比较,并根据比较结果确定告警信息;
[0027]状态评估模块,用于根据所述告警信息,选择对应的BP神经网络状态分析程序对 所述告警信息进行状态评估;
[0028]恢复模块,用于根据状态评估结果,调取相应的匹配脚本,并根据所述匹配脚本执 行恢复命令。
[0029]其中,所述状态评估模块包括:
[0030] 范围判断单元,用于根据所述告警信息,判断所述告警信息是否属于知识库范围;
[0031] 状态评估单元,用于若属于,则选择与所述告警信息对应的BP神经网络状态分析 程序对所述告警信息进行状态评估。
[0032]其中,所述恢复模块包括:
[0033]调取单元,用于根据状态评估结果,调取相应的匹配脚本;
[0034]第一判断单元,用于判断所述告警信息的连续处理次数是否超过对应的阈值; [0035]执行单元,用于若未超过,则根据所述匹配脚本执行恢复命令;
[0036]验证单元,用于验证所述告警信息是否恢复;
[0037]若未恢复,则触发所述状态评估模块根据所述告警信息,选择对应的BP神经网络 状态分析程序对所述告警信息进行状态评估。
[0038] 其中,还包括:
[0039] 日志模块,用于记录所述信息系统的故障自动恢复过程日志。
[0040] 其中,还包括:
[0041 ]维护模块,用于定期根据信息系统故障自动恢复系统的日志,对BP神经网络状态 分析程序及匹配脚本进行维护。
[0042]本发明所提供的信息系统故障自动恢复的方法及系统,包括:获取信息系统的监 控状态指标的数值;将各个所述监控状态指标的数值与对应的预定状态指标范围进行比 较,并根据比较结果确定告警信息;根据所述告警信息,选择对应的BP神经网络状态分析程 序对所述告警信息进行状态评估;根据状态评估结果,调取相应的匹配脚本,并根据所述匹 配脚本执行恢复命令;该方法能够自动恢复信息系统的故障和问题,减少人工干预,提高信 息系统整体的可靠性和问题故障自愈能力,提高运维工作的自动化和智能化水平。
【附图说明】
[0043] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据 提供的附图获得其他的附图。
[0044] 图1为本发明实施例所提供的信息系统故障自动恢复的方法的流程图;
[0045] 图2为本发明实施例所提供的典型信息系统架构示意图;
[0046] 图3为本发明实施例所提供的信息系统故障自动恢复的处理机制的示意图;
[0047] 图4为本发明实施例所提供的信息系统故障自动恢复的方法的示意图;
[0048]图5为本发明实施例所提供的系统集成的认证系统的结构框图。
【具体实施方式】
[0049] 本发明的核心是提供一种信息系统故障自动恢复的方法及系统,该方法能够自动 恢复信息系统故障和问题,减少人工干预,提高信息系统整体的可靠性和问题故障自愈能 力,提高运维工作的自动化和智能化水平。
[0050] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例 中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是 本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员 在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1