一种服务器集群故障自动处理系统的制作方法

文档序号:8945608阅读:235来源:国知局
一种服务器集群故障自动处理系统的制作方法
【技术领域】
[0001]本发明公开一种服务器集群故障自动处理系统,属于服务器集群管理技术领域。
【背景技术】
[0002]随着云计算的发展和应用,服务器设备的需求也从最初的单台或者少量的需求方式发展到至今的大规模大批量的需求方式。服务器集群就是指将很多服务器集中起来一起进行同一种服务,在客户端看来就像是只有一个服务器。集群可以利用多个计算机进行并行计算从而获得很高的计算速度,但是集群中的应用只在一台服务器上运行,如果这个应用出现故障,其它的某台服务器如果重新启动这个应用,接管位于共享磁盘柜上的数据区,进而使应用重新正常运转需要侦测并确认故障、后备服务器重新启动该应用、接管共享的数据区,其切换的过程需要花费时间,而且越大的应用切换的时间越长。面对大规模的服务器集群,各种处理难易程度不等的大量故障,给维护人员带来庞大的工作量,也导致资源的浪费。
[0003]本发明提供一种服务器集群故障自动处理系统,采用服务器集中管理模块、故障分析模块、故障智慧库模块、故障处理模块,服务器集中管理模块监控到服务器故障后,由故障分析模块整理分析故障告警,并在故障智慧库模块中查询相关处理策略,将故障信息和故障处理策略发送到故障处理模块,完成故障自动处理,使该系统根据自带故障处理策略和用户自定义故障处理策略,实现自动处理服务器故障,很大程度上减轻了机房维护人员的负担,避免资源浪费。

【发明内容】

[0004]本发明针对大规模的服务器集群,各种处理难易程度不等的大量故障,给维护人员带来庞大的工作量,也导致资源的浪费的问题,提供一种服务器集群故障自动处理系统,通过系统自带的故障处理策略以及用户自定义的故障处理策略,可以灵活自动处理各种类型,多种难度的服务器故障。极大的减轻了维护人员的工作量,避免人力物力资源的浪费,具有很高的应用价值。
[0005]本发明提出的具体方案是:
一种服务器集群故障自动处理系统,包括服务器集中管理模块、故障分析模块、故障智慧库模块、故障处理模块;
服务器集中管理模块负责对服务器集群进行故障监控和故障,调用故障分析模块进行故障分析;
故障分析模块负责进行整理分析,并调用故障智慧库模块中的故障智慧库查询相关解决策略,并将故障处理分析结论、处理策略通知故障处理模块进行故障处理;
故障智慧库模块负责存储服务器故障处理策略,为服务器故障正确的自动处理提供可靠保障;
故障处理模块负责根据故障分析模块提供的故障信息和处理策略,自动完成服务器故障的处理和修复。其中服务器集中管理模块同时可获取和存储故障告警信息。
[0006]所述故障智慧库模块中智慧库的故障处理策略来源分为系统自带的处理策略和用户自定义的处理策略;系统自带的处理策略为系统原有存储的处理策略,用户自定义的处理策略为用户根据以往处理的故障类型,制定的并存储在系统中的处理策略。
[0007]所述故障智慧库模块设置故障处理模板,实例化故障处理模板为处理策略,对监控中发生的故障进行数据化处理,根据处理策略对数据化的故障进行处理。
[0008]所述故障处理模板分为系统处理模板和用户自定义处理模板,系统处理模板为系统原有存储的故障处理模板,用户自定义处理模板为用户根据以往处理的故障类型,制定的并存储在系统中的故障处理模板。
[0009]—种服务器集群故障自动处理方法,利用所述的系统,使用服务器集中管理模块对服务器集群进行故障监控和故障,调用故障分析模块进行故障分析;
故障分析模块进行整理分析,并调用故障智慧库模块中的故障智慧库查询相关解决策略,并将故障处理分析结论、处理策略通知故障处理模块进行故障处理;
故障智慧库模块存储服务器故障处理策略,为服务器故障正确的自动处理提供可靠保障;
故障处理模块根据故障分析模块提供的故障信息和处理策略,自动完成服务器故障的处理和修复。
[0010]所述故障智慧库模块中智慧库的故障处理策略来源分为系统自带的处理策略和用户自定义的处理策略;系统自带的处理策略为系统原有存储的处理策略,用户自定义的处理策略为用户根据以往处理的故障类型,制定的并存储在系统中的处理策略。
[0011]所述故障智慧库模块设置故障处理模板,实例化故障处理模板为处理策略,对监控中发生的故障进行数据化处理,根据处理策略对数据化的故障进行处理。
[0012]所述故障处理模板分为系统处理模板和用户自定义处理模板,系统处理模板为系统原有存储的故障处理模板,用户自定义处理模板为用户根据以往处理的故障类型,制定的并存储在系统中的故障处理模板。
[0013]本发明的有益之处是:本发明包括服务器集中管理模块、故障分析模块、故障智慧库模块、故障处理模块;服务器集中管理模块负责对服务器集群进行故障监控和故障,调用故障分析模块进行故障分析;故障分析模块负责进行整理分析,并调用故障智慧库模块中的故障智慧库查询相关解决策略,并将故障处理分析结论、处理策略通知故障处理模块进行故障处理;故障智慧库模块负责存储服务器故障处理策略,为服务器故障正确的自动处理提供可靠保障;故障处理模块负责根据故障分析模块提供的故障信息和处理策略,自动完成服务器故障的处理和修复。使该系统根据自带故障处理策略和用户自定义故障处理策略,实现自动处理服务器故障,而且灵活自动处理各种类型,多种难度的服务器故障,很大程度上减轻了机房维护人员的负担,避免资源浪费,具有很高的应用价值。
【附图说明】
[0014]图1本发明服务器故障处理系统示意图。
【具体实施方式】
[0015]—种服务器集群故障自动处理系统,包括服务器集中管理模块、故障分析模块、故障智慧库模块、故障处理模块;
服务器集中管理模块负责对服务器集群进行故障监控和故障,调用故障分析模块进行故障分析;
故障分析模块负责进行整理分析,并调用故障智慧库模块中的故障智慧库查询相关解决策略,并将故障处理分析结论、处理策略通知故障处理模块进行故障处理;
故障智慧库模块负责存储服务器故障处理策略,为服务器故障正确的自动处理提供可靠保障;
故障处理模块负责根据故障分析模块提供的故障信息和处理策略,自动完成服务器故障的处理和修复。
[0016]根据上述系统,结合附图对本发明做进一步说明。
[0017]其中上述系统中服务器集中管
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1