一种信息系统故障自动恢复的方法及系统的制作方法_4

文档序号:9787308阅读:来源:国知局
lG数据库。信息系统故障自动 处理系统可以部署在1台Windows服务器上。
[0141] 测试内容主要包括表空间不足告警处置、Http服务不可用、Linux服务器日志空间 不足告警处置和服务器硬件设备故障4个典型故障场景。每个场景进行了 5次测试,均成功 执行。执行结果可以参照表4,从执行时间测试结果来看,本文提出的信息系统故障恢复方 法可以满足实际工作需要,提高了故障和问题的处理响应时间,可以快速恢复业务正常使 用,整体提高了系统运行的可靠性,提高了运维工作的效率。
[0142 ]表5问题自动恢复测试情况 [0143]
[0144] 本系统监测可以采用每5分钟定时采集系统状态的策略,根据测试情况,由于问题 处理时间较短,问题恢复时间与系统监测采样的周期成正比。可以根据运行实际需要或问 题的特点,动态调整采样周期和策略,以满足实际信息系统运行的需要。
[0145] 自动问题恢复处理存在系统状态判断不准确或脚本执行失败的情况出现,在日常 使用过程中心,要定期对自动问题恢复日志情况进行分析,纠正自动化问题处理过程中存 在的错误或缺陷。要深入分析信息系统运行和使用中出现的问题,从技术上彻底解决问题, 避免问题频繁出现。
[0146] 基于上述技术方案,基于信息系统故障自动恢复技术相关技术,分析了典型的信 息系统故障类型,通过BP神经网络对系统运行状态和容量进行评估,利用运维知识库管理 系统运行状态与恢复操作规则,建立典型自动化操作脚本,实现了常见故障和问题的自动 化恢复,整体提高了数据中心信息系统运行可靠性和运维工作效率。该系统克服了单一阈 值进行故障和问题处理的局限性。进一步,通过开展更加广泛的测试和应用,形成更加丰富 的知识库和脚本集,完善平台功能,优化状态数据分析方法和模型,不断提高数据中心运维 智能化、自动化程度。
[0147] 说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实 施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而 言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明 即可。
[0148] 专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元 及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和 软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些 功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业 技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应 认为超出本发明的范围。
[0149] 结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执 行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存 储器(R0M)、电可编程R0M、电可擦除可编程R0M、寄存器、硬盘、可移动磁盘、CD-ROM、或技术 领域内所公知的任意其它形式的存储介质中。
[0150] 以上对本发明所提供的系统集成的认证方法及系统进行了详细介绍。本文中应用 了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解 本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本 发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明 权利要求的保护范围内。
【主权项】
1. 一种信息系统故障自动恢复的方法,其特征在于,包括: 获取信息系统的监控状态指标的数值; 将各个所述监控状态指标的数值与对应的预定状态指标范围进行比较,并根据比较结 果确定告警信息; 根据所述告警信息,选择对应的BP神经网络状态分析程序对所述告警信息进行状态评 估; 根据状态评估结果,调取相应的匹配脚本,并根据所述匹配脚本执行恢复命令。2. 如权利要求1所述的方法,其特征在于,所述根据所述告警信息,选择对应的BP神经 网络状态分析程序对所述告警信息进行状态评估,包括: 根据所述告警信息,判断所述告警信息是否属于知识库范围; 若属于,则选择与所述告警信息对应的BP神经网络状态分析程序对所述告警信息进行 状态评估。3. 如权利要求2所述的方法,其特征在于,所述根据状态评估结果,调取相应的匹配脚 本,并根据所述匹配脚本执行恢复命令,包括: S3、根据状态评估结果,调取相应的匹配脚本; 531、 判断所述告警信息的连续处理次数是否超过对应的阈值; 532、 若未超过,则根据所述匹配脚本执行恢复命令,并验证所述告警信息是否恢复; 533、 若恢复,则结束; 534、 若未恢复,则根据所述告警信息,选择对应的BP神经网络状态分析程序对所述告 警信息进行状态评估,并进入S3。4. 如权利要求1至3任一项所述的方法,其特征在于,还包括: 记录所述信息系统的故障自动恢复过程日志。5. 如权利要求4所述的方法,其特征在于,还包括: 定期根据信息系统故障自动恢复系统的日志,对BP神经网络状态分析程序及匹配脚本 进行维护。6. -种信息系统故障自动恢复的系统,其特征在于,包括: 获取模块,用于获取信息系统的监控状态指标的数值; 告警信息模块,用于将各个所述监控状态指标的数值与对应的预定状态指标范围进行 比较,并根据比较结果确定告警信息; 状态评估模块,用于根据所述告警信息,选择对应的BP神经网络状态分析程序对所述 告警信息进行状态评估; 恢复模块,用于根据状态评估结果,调取相应的匹配脚本,并根据所述匹配脚本执行恢 复命令。7. 如权利要求6所述的系统,其特征在于,所述状态评估模块包括: 范围判断单元,用于根据所述告警信息,判断所述告警信息是否属于知识库范围; 状态评估单元,用于若属于,则选择与所述告警信息对应的BP神经网络状态分析程序 对所述告警信息进行状态评估。8. 如权利要求7所述的系统,其特征在于,所述恢复模块包括: 调取单元,用于根据状态评估结果,调取相应的匹配脚本; 第一判断单元,用于判断所述告警信息的连续处理次数是否超过对应的阈值; 执行单元,用于若未超过,则根据所述匹配脚本执行恢复命令; 验证单元,用于验证所述告警信息是否恢复; 若未恢复,则触发所述状态评估模块根据所述告警信息,选择对应的BP神经网络状态 分析程序对所述告警信息进行状态评估。9. 如权利要求6至8任一项所述的系统,其特征在于,还包括: 日志模块,用于记录所述信息系统的故障自动恢复过程日志。10. 如权利要求9所述的系统,其特征在于,还包括: 维护模块,用于定期根据信息系统故障自动恢复系统的日志,对BP神经网络状态分析 程序及匹配脚本进行维护。
【专利摘要】本发明公开了一种信息系统故障自动恢复的方法,包括:获取信息系统的监控状态指标的数值;将各个所述监控状态指标的数值与对应的预定状态指标范围进行比较,并根据比较结果确定告警信息;根据所述告警信息,选择对应的BP神经网络状态分析程序对所述告警信息进行状态评估;根据状态评估结果,调取相应的匹配脚本,并根据所述匹配脚本执行恢复命令;该方法实现了对信息系统的告警信息的自动恢复;本发明还公开了一种信息系统故障自动恢复的系统。
【IPC分类】G06F11/34, G06F11/14
【公开号】CN105550100
【申请号】CN201510920960
【发明人】闫龙川, 张晓亮, 崔硕, 杨猛, 毛一凡, 刘冬梅
【申请人】国家电网公司, 国家电网公司信息通信分公司
【公开日】2016年5月4日
【申请日】2015年12月11日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1