一种故障处理的方法及装置与流程

文档序号:12037677阅读:333来源:国知局
一种故障处理的方法及装置与流程

本发明实施例涉及云计算数据中心技术领域,特别是涉及一种故障处理的方法及装置。



背景技术:

随着云计算技术的普及,多种基于云计算平台的数据中心应运而生,其聚合了大量硬件资源和软件资源。为了保证云数据中心的正常运转,必须对整个云数据中心实施全方位监控。云数据中心中大量的软硬件资源,给对其的监控及管理带来了巨大的挑战,对这些资源的状态进行实时准确的监控显得尤为重要。

目前,通常采用基于nagios或shinken等开源监控系统构建云数据中心监控系统,并通过该监控系统对各个资源进行实时监控,可以得到各资源的运行状态与健康状况。

现有技术中,当监控系统监测出某个资源出现故障时,监控系统会发送通知至运维人员,运维人员根据故障报告的详细信息进行故障定位与排除操作。由于数据中心的资源数量巨大,资源种类较多,各个资源出现故障的情况也千差万别,所以为解决处理故障,运维人员需要掌握大量的故障处理解决方案,增加了运维人员在日常的排查解决故障的难度,并且当出现故障时,故障不能及时被处理,在一定程度上降低了工作效率。

因此,如何提供一种解决上述技术问题的故障处理的方法及装置成为本领域的技术人员目前需要解决的问题。



技术实现要素:

本发明实施例的目的是提供一种故障处理的方法及装置,在使用过程中降低了工作人员的工作量,保障了故障处理的及时性,提高了工作效率。

为解决上述技术问题,本发明实施例提供了一种故障处理的方法,包括:

获取监控系统发送的故障信息;所述故障信息包括故障日志及资源类型;

依据所述故障信息从预先建立的运维数据库中找到故障预处理方案;

将所述故障预处理方案发送至用户终端,以便用户依据所述故障预处理方案确定出最终故障处理方案,并对故障进行处理。

可选的,所述依据所述故障信息从预先建立的运维数据库中找到故障预处理方案的过程为:

依据所述故障信息从预先建立的运维数据库中存储的各个故障处理方案中筛选出与所述故障信息对应的各个故障处理方案;

依据预设规则从与所述故障信息对应的各个所述故障处理方案中确定出故障预处理方案。

可选的,所述依据预设规则从与所述故障信息对应的各个所述故障处理方案中确定出故障预处理方案的过程为:

分别计算与所述故障信息对应的各个所述故障处理方案与所述故障信息的匹配度;

依据大小关系将各个所述匹配度进行排序;

获取最高匹配度,并将最高匹配度对应的故障处理方案作为故障预处理方案。

可选的,所述依据预设规则从与所述故障信息对应的各个所述故障处理方案中确定出故障预处理方案的过程为:

获取用户预先输入的、与所述故障信息对应的各个所述故障处理方案的评分值;

将各个评分值从大至小进行排序;

获取最高评分值,并将所述最高评分值对应的故障处理方案作为故障预处理方案。

可选的,还包括:

获取用户输入的与所述故障信息对应的所述最终故障处理方案;

将所述最终故障处理方案发送至所述运维数据库中进行存储。

为解决上述技术问题,本发明实施例提供了一种故障处理的装置,包括:

获取模块,用于获取监控系统发送的故障信息;所述故障信息包括故障日志及资源类型;

查找模块,用于依据所述故障信息从预先建立的运维数据库中找到故障预处理方案;

发送模块,用于将所述故障预处理方案发送至用户终端,以便用户依据所述故障预处理方案确定出最终故障处理方案,并对故障进行处理。

可选的,所述查找模块包括:

筛选单元,用于依据所述故障信息从预先建立的运维数据库中存储的各个故障处理方案中筛选出与所述故障信息对应的各个故障处理方案;

确定单元,用于依据预设规则从与所述故障信息对应的各个所述故障处理方案中确定出故障预处理方案。

可选的,所述的故障处理的装置,所述获取模块,还用于获取用户输入的与所述故障信息对应的所述最终故障处理方案;

所述发送模块,还用于将所述最终故障处理方案发送至所述运维数据库中进行存储。

本发明实施例提供了一种故障处理的方法及装置,包括获取监控系统发送的故障信息;故障信息包括故障日志及资源类型;依据故障信息从预先建立的运维数据库中找到故障预处理方案;将故障预处理方案发送至用户终端,以便用户依据故障预处理方案确定出最终故障处理方案,并对故障进行处理。

可见,本发明实施例可以通过监控系统发送的故障信息从运维数据库中自动找出与该故障信息相对应的故障预处理方案,并将该故障预处理方案推送至用户终端,用户可以将该故障预处理方案作为参考依据,从而得出用于处理相应故障的最终故障处理方案,并对故障进行处理。本发明实施例在使用过程中降低了工作人员的工作量,保障了故障处理的及时性,提高了工作效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种故障处理的方法的流程示意图;

图2为本发明实施例提供的一种故障处理的装置的结构示意图。

具体实施方式

本发明实施例提供了一种故障处理的方法及装置,在使用过程中降低了工作人员的工作量,保障了故障处理的及时性,提高了工作效率。

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参照图1,图1为本发明实施例提供的一种故障处理的方法的流程示意图。

该方法包括:

s11:获取监控系统发送的故障信息;故障信息包括故障日志及资源类型;

s12:依据故障信息从预先建立的运维数据库中找到故障预处理方案;

s13:将故障预处理方案发送至用户终端,以便用户依据故障预处理方案确定出最终故障处理方案,并对故障进行处理。

需要说明的是,可以通过全文搜索引擎elasticsearch建立运维数据库,具体可以通过将日常解决故障的方法整理归纳后存储至运维数据库中,即将故障的详细信息、故障对应的资源类型等元数据信息及相应的故障处理方案相对应的存储至运维数据库中,并且该运维数据库可以与监控系统进关联。

监控系统实时对各个资源的运行状态进行监控,当某个资源出现故障时,则监控系统得到该资源的故障信息,包括资源发生故障的故障日志和资源类型,故障日志包括故障时间、问题等信息。依据故障信息中的故障日志及资源类型可以自动关联至运维数据库中,与运维数据库中的各个故障处理方案进行匹配,进一步可以得到与当前故障信息对应的故障预处理方案,该故障预处理方案可以为用户(及运维人员)处理该故障提供依据。运维人员可以根据系统提供的故障预处理方案、故障信息对中的故障日志及资源类型得出准确的故障处理方案,该故障处理方案即为最终故障处理方案,并进一步根据最终故障处理方案对该故障进行处理。

本发明实施例提供了一种故障处理的方法,包括获取监控系统发送的故障信息;故障信息包括故障日志及资源类型;依据故障信息从预先建立的运维数据库中找到故障预处理方案;将故障预处理方案发送至用户终端,以便用户依据故障预处理方案确定出最终故障处理方案,并对故障进行处理。

可见,本发明实施例可以通过监控系统发送的故障信息从运维数据库中自动找出与该故障信息相对应的故障预处理方案,并将该故障预处理方案推送至用户终端,用户可以将该故障预处理方案作为参考依据,从而得出用于处理相应故障的最终故障处理方案,并对故障进行处理。本发明实施例在使用过程中降低了工作人员的工作量,保障了故障处理的及时性,提高了工作效率。

本发明实施例公开了一种故障处理的方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:

进一步的,在上述实施例中的s12中依据故障信息从预先建立的运维数据库中找到故障预处理方案的过程为:

s121:依据故障信息从预先建立的运维数据库中存储的各个故障处理方案中筛选出与故障信息对应的各个故障处理方案;

s122:依据预设规则从与故障信息对应的各个故障处理方案中确定出故障预处理方案。

可以理解的是,依据故障信息中的故障日志及资源类型与运维数据库中的各个故障处理方案进行匹配后可能会得到多个与该故障信息对应的故障处理方案,但是,这多个故障处理方案的参考价值可能不同,所以可以按照预设规则从筛选出的这些故障处理方案中确定出最具有参考价值的故障处理方案,并将该故障处理方案作为故障预处理方案发送至用户端,以便为用户提供出参考依据。

更进一步的,上述s122中依据预设规则从与故障信息对应的各个故障处理方案中确定出故障预处理方案的过程,具体可以为:

分别计算与故障信息对应的各个故障处理方案与故障信息的匹配度;

依据大小关系将各个匹配度进行排序;

获取最高匹配度,并将最高匹配度对应的故障处理方案作为故障预处理方案。

具体的,可以分别计算出该故障信息与筛选出的各个故障处理方案的匹配度,根据匹配度的大小可以判断该故障处理方案相对于本次需要处理的故障的参考价值的大小,匹配度越大,则参考价值就越大,匹配度越小,参考价值就越小。得到各个匹配度后可以按照大小进行排序从而找出匹配度最高的故障处理方案,该故障处理方案即为故障预处理方案,进一步将该故障预处理方案发送至用户端,以供用户参考。

可选的,上述s122中依据预设规则从与故障信息对应的各个故障处理方案中确定出故障预处理方案的过程,具体还可以为:

获取用户预先输入的、与故障信息对应的各个故障处理方案的评分值;

将各个评分值从大至小进行排序;

获取最高评分值,并将最高评分值对应的故障处理方案作为故障预处理方案。

需要说明的是,用户可以对每次推送的故障预处理方案进行评分,并且评分值与相应的故障预处理方案对应的保存至运维数据库中,针对于每次出现的故障系统均会为该故障推送一个故障预处理方案,运维人员依据该故障预处理方案对故障进行运维处理,并且可以根据该故障预处理方案所实现的参考价值的大小对该故障预处理方案进行评分,评分越高,则越说明该故障预处理方案对本次待处理的故障的参考价值就越大,当下一次出现类似故障时被推送的几率越高。

因此,本发明实施例中不仅可以通过匹配度确定故障预处理方案,还可以通过与各个故障处理方案对应的评分值判断哪个故障处理方案对本次待处理的故障的参考价值较大。

当然,本发明实施例中不仅限于采用匹配度或评分值的方式确定故障预处理方案,也可以通过其他的方式确定出与当前故障对应的故障预处理方案,具体采用哪种方式,本发明实施例对此不做特殊的限定,能实现本发明实施例的目的即可。

可选的,该方法还包括:

s14:获取用户输入的与故障信息对应的最终故障处理方案;

s15:将最终故障处理方案发送至运维数据库中进行存储。

可以理解的是,为了使运维数据库中存储的故障处理方案更加完善,以便出现故障时可以推送出更加精确的故障预处理方案,所以本发明实施例中还可以将用户确定的与本次故障对应的最终故障解决方案存储至运维数据库中,存储格式为故障信息、资源类型及解决方案等信息。

还需要说明的是,本发明实施例可以实现智能推送,通过智能推送故障处理方案可以快速的定位与解决问题,在一定程度上有效的减轻了工作人员的负担,提高了运维数据库的实用性,保证了设备故障处理的准确性和及时性。

另外,本发明实施例中的运维数据库可以随着时间的推移,运维数据库中所存到的故障处理方案越来越完善,所解决的故障也越来越多,从而当故障出现时,所推荐的故障处理方案的准确度也会越来越高,其价值也会越来越大。

相应的本发明实施例还公开了一种故障处理的装置,具体请参照图2,图2为本发明实施例提供的一种故障处理的装置的结构示意图。在上述实施例的基础上:

该装置包括:

获取模块1,用于获取监控系统发送的故障信息;故障信息包括故障日志及资源类型;

查找模块2,用于依据故障信息从预先建立的运维数据库中找到故障预处理方案;

发送模块3,用于将故障预处理方案发送至用户终端,以便用户依据故障预处理方案确定出最终故障处理方案,并对故障进行处理。

可选的,查找模块2包括:

筛选单元,用于依据故障信息从预先建立的运维数据库中存储的各个故障处理方案中筛选出与故障信息对应的各个故障处理方案;

确定单元,用于依据预设规则从与故障信息对应的各个故障处理方案中确定出故障预处理方案。

可选的,的故障处理的装置,获取模块1,还用于获取用户输入的与故障信息对应的最终故障处理方案;

发送模块3,还用于将最终故障处理方案发送至运维数据库中进行存储。

需要说明的是,本发明实施例提供了一种故障处理的装置,可以通过监控系统发送的故障信息从运维数据库中自动找出与该故障信息相对应的故障预处理方案,并将该故障预处理方案推送至用户终端,用户可以将该故障预处理方案作为参考依据,从而得出用于处理相应故障的最终故障处理方案,并对故障进行处理。本发明实施例在使用过程中降低了工作人员的工作量,保障了故障处理的及时性,提高了工作效率。

另外,对于本发明实施例中所涉及到的故障处理方法的具体介绍,请参照上述方法实施例,本申请在此不再赘述。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

还需要说明的是,在本说明书中,诸如术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1