一种服务故障的修复方法、装置和存储介质与流程

文档序号:15888466发布日期:2018-11-09 19:48阅读:345来源:国知局
一种服务故障的修复方法、装置和存储介质与流程

本发明涉及计算机技术技术,尤指一种服务故障的修复方法、装置和存储介质。

背景技术

在信息时代,对应用服务的监控变得越来越重要,应用服务的正常运行对公司产生巨大的经济效益。应用程序运行过程中难免会发生故障,应用程序故障后的解决方案多为人为手动处理,耗费人力,处理效率相对低,从发现问题到处理完毕需要一段时间,影响应用程序的正常使用,对公司的经济效率产生较大的影响。



技术实现要素:

为了解决上述技术问题,本发明提供了一种服务故障的修复方法、装置和存储介质,能够智能修复服务故障。

为了达到本发明目的,本发明提供了一种服务故障的修复方法,所述方法包括:

实时监控的服务运行,当所述服务出现故障状态时,判断所述故障是否已存在故障知识库中,当断出所述故障知识库中不存在所述故障时,根据预设的策略恢复所述故障。

进一步地,所述方法还包括:

当判断出所述故障知识库中存在所述故障时,根据所述故障知识库中记载的解决方案恢复所述故障。

进一步地,所述方法还包括:记录所述服务的运行日志信息;

所述根据预设的策略恢复所述故障包括:

获取所述服务的运行日志信息;

根据所述日志信息获取所述故障的原因;

根据所述故障的原因在预设的程序中查询解决方案;

根据所述解决方案恢复所述故障。

进一步地,所述根据预设的策略恢复所述故障之后,还包括:

获取对所述故障恢复处理的评价结果,当所述评价结果为正确时,将所述故障的故障原因和解决方案存入所述故障知识库中。

进一步地,当所述服务出现故障状态时,开启预设的计时器开始计时;

当所述计时器计时达到预设的时间时,故障仍未解除,发出故障人为处理告警;

根据输入的指令恢复故障。

为了达到本发明目的,本发明还提供了一种服务故障的修复装置,所述装置包括:监控模块、恢复模块,其中:

所述监控模块,用于实时监控的服务运行;

所述恢复模块,用于当所述服务出现故障状态时,判断所述故障是否已存在故障知识库中,当断出所述故障知识库中不存在所述故障时,根据预设的策略恢复所述故障。

进一步地,所述装置还包括:

当所述恢复模块判断出所述故障知识库中存在所述故障时,根据所述故障知识库中记载的解决方案恢复所述故障。

进一步地,所述装置还包括:记录模块,所述记录模块用于记录所述服务的运行日志信息;

所述恢复模块根据预设的策略恢复所述故障包括:

所述恢复模块获取所述服务的运行日志信息;

所述恢复模块根据所述日志信息获取所述故障的原因;

所述恢复模块根据所述故障的原因在预设的程序中查询解决方案;

所述恢复模块根据所述解决方案恢复所述故障。

进一步地,所述根据预设的策略恢复所述故障之后,还包括存入模块:

存入模块获取对所述故障恢复处理的评价结果,当所述评价结果为正确时,将所述故障的故障原因和解决方案存入所述故障知识库中。

为了达到本发明目的,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。

与现有技术相比,本发明包括实时监控的服务运行,当所述服务出现故障状态时,判断所述故障是否已存在故障知识库中,当断出所述故障知识库中不存在所述故障时,根据预设的策略恢复所述故障。实时监控与智能修复过程,使服务发生故障时能自动修复。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。

图1为本发明实施例一服务故障的修复方法的流程图;

图2为本发明实施例二服务故障的修复方法的另一种流程图;

图3为本发明实施例三服务故障的修复装置的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。

在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

实施例一

本发明提供了一种服务故障的修复方法,如图1所示,该所述方法包括s11-s12:

s11、实时监控的服务运行;

s12、当服务出现故障状态时,判断故障是否已存在故障知识库中,当断出故障知识库中不存在故障时,根据预设的策略恢复故障。

本发明实施例中,当服务出现故障状态时,根据预设的策略恢复故障。相比常规的人为手动处理,能够智能修复服务故障。

所述服务出现故障状态时,所述方法还包括:发出故障告警。

在本实施例中,还包括:

当判断出故障知识库中存在故障时,根据故障知识库中记载的解决方案恢复故障。

根据故障知识库中记载的解决方案恢复故障,包括:获取出现故障服务的故障原因,根据服务故障原因在故障知识库中找到相应的解决方案,获取与服务器状态匹配的修复程序,自动进行修复。

在本实施例中,还包括:记录服务的运行日志信息;

所述根据预设的策略恢复故障包括:

获取服务的运行日志信息;

根据日志信息获取故障的原因;

根据故障的原因在预设的程序中查询解决方案;

根据解决方案恢复故障。

在程序中预设故障的原因及故障原因的解决方案,根据日志中获取关键字信息,分析出故障类型和故障原因,根据故障原因匹配到解决方案,根据故障解决方案自动进行修复。

可选地,所述根据预设的策略恢复故障之后,还包括:

获取对故障恢复处理的评价结果,当评价结果为正确时,将故障的故障原因和解决方案存入故障知识库中。

在一个可选实施例中,当服务出现故障状态时,开启预设的计时器开始计时;

当计时器计时达到预设的时间时,故障仍未解除,发出故障人为处理告警;

根据输入的指令恢复故障。

可选地,所述服务为web服务。

本发明实施例中,实时监控的服务运行,当所述服务出现故障状态时,判断所述故障是否已存在故障知识库中,当断出所述故障知识库中不存在所述故障时,根据预设的策略恢复所述故障,相比常规的人为手动处理,能够实时的对服务进行告警,并诊断出服务故障的原因,对故障原因进行分析,自动修复故障以使服务恢复正常运行,及时有效的解决服务的故障,降低故障造成的影响。

实施例二

本实施例对上述实施例的方法进行具体描述。

首先,监控模块实时监控服务的状态信息,当服务出现故障时发出告警并根据服务状态及日志信息等分析故障原因,定位到故障发生的原因及解决方案后自动的进行故障的修复,使服务正常运行。故障处理过程中会将故障原因、分析结果,解决方案等信息进行保存,用户可以对故障处理结果进行评价,当处理方式正确时,下次出现此类的故障时,此程序可以采用和此次相同的处理方式,进一步缩短故障处理时间。

如图2所示,web服务的监控与智能修复方法实现时主要包括以下几个步骤:

(1)实时监控web服务的状态信息;

(2)当服务发生故障时,实时发出故障告警,实时通知用户的同时自动进行下一步故障分析处理;

(3)分析服务故障原因。根据服务的状态信息,运行日志等信息分析故障造成的原因。如果故障知识库里有相同的故障,直接进行故障修复;如果新增故障,将该故障记录到故障知识库中;

(4)定位故障原因并确定解决方案,对应用服务的故障进行处理,根据分析的日志故障的原因,针对性的修复故障,使服务恢复正常运行。

(5)用户可对故障处理情况进行评价,如故障原因及故障修复方法正确,以后发生相同故障时直接按照故障知识库处理方式进行处理。

本发明可采用java方式实现,监控模块实时收集服务的状态信息,根据服务的状态信息判断服务是否正常运行,当服务出现故障时,发出告警通知用户并进行故障智能分析,分析模块根据服务状态及运行日志等信息分析故障原因,找到故障原因及解决方案,并可以将分析的故障及解决方案留档,当下次发生相同的故障时可以直接进行故障的处理,定位到服务的故障原因及方案后,自动根据故障的原因进行故障的修复。

例如当监测到服务停止运行后,可以将服务启动;当监测到服务的配置文件存在错误时,可以自动修复配置文件的错误并将服务启动,使服务正常运行。故障处理过程中会将故障原因、分析结果,解决方案等信息进行保存,用户可以对故障处理结果进行评价,当处理方式正确时,下次出现此类的故障时,此程序可以采用和此次相同的处理方式,进一步缩短故障处理时间。

实施例三

为了达到本发明目的,本发明还提供了一种服务故障的修复装置,图3所示,该装置包括:监控模块31、恢复模块32,其中:

监控模块31,用于实时监控的服务运行;

恢复模块32,用于当服务出现故障状态时,判断故障是否已存在故障知识库中,当断出故障知识库中不存在故障时,根据预设的策略恢复故障。

在本实施例中,该装置还包括:

当恢复模块32判断出故障知识库中存在故障时,根据故障知识库中记载的解决方案恢复故障。

在本实施例中,该装置还包括:记录模块33,记录模块33用于记录服务的运行日志信息;

恢复模块32根据预设的策略恢复故障包括:

恢复模块32获取服务的运行日志信息;

恢复模块32根据日志信息获取故障的原因;

恢复模块32根据故障的原因在预设的程序中查询解决方案;

恢复模块32根据解决方案恢复故障。

可选地,所述根据预设的策略恢复故障之后,还包括存入模块34:

存入模块34获取对故障恢复处理的评价结果,当评价结果为正确时,存入模块34将故障的故障原因和解决方案存入故障知识库中。

本发明实施例还提供一种计算机存储介质,所述计算机存储介质存储有计算机程序;所述计算机程序被执行后,能够实现前述实施例提供的攻击取证方法,例如,执行如图1所示方法中。

虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1