一种故障自动处理系统的制作方法

文档序号:18950941发布日期:2019-10-23 02:12阅读:234来源:国知局
一种故障自动处理系统的制作方法

本发明涉及告警处理技术领域,尤其涉及一种故障自动处理系统。



背景技术:

目前通常需要专操作人员对监控端的告警信息的进行人工的收集和处理;因此在监控端出现告警信息时,需要划分大量的时间来定位问题,从而影响了监控端的可用性,并且增加告警信息的收集时间,进而增加操作人员的维护时间;在操作人员完成对告警信息的定位后,需要对所有的告警信息进行故障处理,而有一些一般性故障的告警信息也会通知给操作人员,会给操作人员造成不必要的负担;因此现有技术中对告警信息的收集和处理的效率较低,用户体验较差。



技术实现要素:

针对现有技术中存在的上述问题,现提供一种旨在实现多等级、差异化的监控数据的精确收集和告警数据的故障处理,从而提高处理效率的故障自动处理系统。

具体技术方案如下:

一种故障自动处理系统,其中,故障自动处理系统连接多个监控端,并包括:

收集模块,用于根据预设的监控指标从监控端实时收集对应的监控数据;

第一存储模块,连接收集模块,用于存储监控数据;

告警模块,连接第一存储模块,用于根据监控数据触发对应的告警数据;

分类模块,连接告警模块,用于根据一等级分类条件对告警数据进行等级分类,并根据一优先级分类条件对等级分类后的每个等级的每类告警数据进行优先级分类,随后得到每类告警数据的分类属性,分类属性中包括对应于每类告警数据的告警状态;

第二存储模块,连接分类模块,用于存储所有告警数据和与告警数据相关联的分类属性;

排序模块,连接第二存储模块,用于根据分类属性将所有告警数据依次保存到一消息队列中;

处理模块,分别与第二存储模块和排序模块连接,并根据消息队列中的告警数据依次对监控端进行故障自动处理,并根据处理结果对第二存储模块中对应的告警数据的告警状态进行更新。

优选的,故障自动处理系统,其中,还包括:

告警报表模块,与存储模块连接,用于根据分类属性将所有告警数据生成一告警报表并输出,以供操作人员参考。

优选的,故障自动处理系统,其中,监控端包括多类监控对象,每类监控对象具有多类告警对象,每类告警对象中依据预设的监控指标被采集得到多类告警数据;

告警报表模块包括:

评分单元,用于根据一评分规则对监控端的每类监控对象的每类告警数据分别进行评分,并叠加所有告警数据的评分得到每类监控对象的总评分;

判断单元,与评分单元连接,用于判断监控对象的对象类型,并输出判断结果;

通知单元,连接判断单元,用于根据判断结果:

当监控对象为系统类对象时,并且当系统类对象的总评分超出一预设的第一处理阈值时,将相应的第一告警信息发送给操作人员,操作人员根据第一告警信息对系统进行重做处理;以及

当监控对象为应用类对象时,并且当应用类对象的总评分超出一预设的第二处理阈值时,将相应的第二告警信息发送给操作人员,操作人员根据第二告警信息对应用类对象进行故障处理。

优选的,故障自动处理系统,其中,

分类属性包括每类告警数据对应的告警状态;

告警报表模块包括:

告警报表生成单元,用于根据分类属性将所有告警数据生成一告警报表;

第一统计单元,与告警报表生成单元连接,用于根据告警报表统计每类监控对象的每类告警对象的所有告警数据的告警数量,并标注告警数量最多的前n类告警数据,以得到第一统计文件,并将第一统计文件发送给操作人员,以供操作人员对被标注的告警数据进行处理;

第二统计单元,与告警报表生成单元连接,用于根据告警报表统计预设统计时间内的更新的告警状态为失败状态的告警数据的失败数量,并标注失败数量最多的前m类告警数据,以得到第二统计文件,并将第二统计文件发送给操作人员,以供操作人员对被标注的告警数据进行处理。

优选的,故障自动处理系统,其中,告警模块包括:

接收单元,用于接收监控数据;

告警单元,与接收单元连接,用于根据监控数据依照一告警触发标准触发对应的告警数据。

优选的,故障自动处理系统,其中,分类属性中包括每类告警数据的告警等级;

告警等级由高至低被划分为三个等级。

优选的,故障自动处理系统,其中,分类属性中包括每类告警数据的告警优先级;

告警优先级隶属于对应的告警等级下,告警优先级由高至低被划分为三级优先级。

上述技术方案具有如下优点或有益效果:通过收集模块及时地根据预设的监控指标从监控端实时收集对应的监控数据,并且将收集到的监控数据上传到第一存储模块中,以方便告警模块根据监控数据触发告警数据,并且通过分类模块对每类告警数据进行分类,最后使得处理模块进行对应的故障处理。从而实现多等级、差异化的监控数据的精确收集和告警数据的故障处理,进而提高了对告警数据的处理效率。

附图说明

参考所附附图,以更加充分的描述本发明的实施例。然而,所附附图仅用于说明和阐述,并不构成对本发明范围的限制。

图1为本发明故障自动处理系统实施例的结构示意图;

图2为本发明故障自动处理系统实施例的告警报表模块的结构示意图;

图3为本发明故障自动处理系统实施例的告警模块的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。

本发明包括一种故障自动处理系统,其中,故障自动处理系统连接多个监控端,如图1所示,故障自动处理系统包括:

收集模块1,用于根据预设的监控指标从监控端实时收集对应的监控数据;

第一存储模块2,连接收集模块1,用于存储监控数据;

告警模块3,连接第一存储模块2,用于根据监控数据触发对应的告警数据;

分类模块4,连接告警模块3,用于根据一等级分类条件对告警数据进行等级分类,并根据一优先级分类条件对等级分类后的每个等级的每类告警数据进行优先级分类,随后得到每类告警数据的分类属性,分类属性中包括对应于每类告警数据的告警状态;

第二存储模块5,连接分类模块4,用于存储所有告警数据和与告警数据相关联的分类属性;

排序模块6,连接第二存储模块5,用于根据分类属性将所有告警数据依次保存到一消息队列中;

处理模块7,分别与第二存储模块5和排序模块6连接,并根据消息队列中的告警数据依次对监控端进行故障自动处理,并根据处理结果对第二存储模块5中对应的告警数据的告警状态进行更新。

在上述实施例中,通过收集模块1及时地根据预设的监控指标从监控端实时收集对应的监控数据,并且将收集到的监控数据上传到第一存储模块2中,以方便告警模块3根据监控数据触发告警数据,并且通过分类模块4对每类告警数据进行分类,最后使得处理模块7分别对不同分类属性的告警数据进行对应的故障处理。从而实现多等级、差异化的精准的故障处理,进而提高了对告警数据的处理效率。

进一步地,作为优选的实施方式,预设的监控指标可以为操作人员根据监控需要进行配置;例如,收集模块1可以通过监控指标实时收集监控数据,并按照预设的收集时间周期将上述监控数据上传至第一存储模块2。

其中,预设的收集时间周期可以根据操作人员的需求自定义设置,例如收集时间周期可以为几秒钟或几分钟。

进一步地,作为优选的实施方式,通过根据等级分类条件对每类告警数据进行两级分类,以通过每类告警数据对应的分类属性来对每类告警数据进行不同的故障处理,从而实现多等级和差异化的精准故障处理。

其中,告警状态可以划分为未处理状态、处理中状态、抑制状态、成功状态、失败状态五种情况。

进一步地,在上述实施例中,还包括:

告警报表模块8,与第二存储模块5连接,用于根据分类属性将所有告警数据生成一告警报表并输出,以供操作人员参考,使得操作人员可以根据该告警列表预先发现异常,从而有助于及时处理预防故障,进而大大减少了告警数据的出现。

进一步地,作为优选的实施方式,告警报表可以为电子报表,例如告警报表可以为excel表格。

进一步地,在上述实施例中,监控端包括多类监控对象,每类监控对象具有多类告警对象,每类告警对象中依据预设的监控指标被采集得到多类告警数据;

进一步地,在上述实施例中,通过对监控端的不同监控对象的不同告警对象设定不同的监控指标,从而实现针对性的监控数据的收集,以方便对监控数据进行有效处理。

如图2所述,告警报表模块8包括:

评分单元81,用于根据一评分规则对监控端的每类监控对象的每类告警数据分别进行评分,并叠加所有告警数据的评分得到每类监控对象的总评分;

判断单元82,与评分单元81连接,用于判断监控对象的对象类型,并输出判断结果;

通知单元83,连接判断单元82,用于根据判断结果:

当监控对象为系统类对象时,并且当系统类对象的总评分超出一预设的第一处理阈值时,将相应的第一告警信息发送给操作人员,操作人员根据第一告警信息对系统进行重做处理;以及

当监控对象为应用类对象时,并且当应用类对象的总评分超出一预设的第二处理阈值时,将相应的第二告警信息发送给操作人员,操作人员根据第二告警信息对应用类对象进行故障处理。

进一步地,在上述实施例中,通过对监控端的不同的监控对象,预先设置不同的故障处理方式,从而提高了故障处理的效率和准确性。

进一步地,作为优选的实施方式,评分规则可以使根据每类告警数据的分类属性来进行设置,例如,可以根据分类属性中的每个等级设置对应的评分,也可以根据分类属性中的优先级设置对应的评分,还可以同时根据每个等级和优先级设置对应的评分,并且根据监控对象的总评分进行处理,从而排除了系统对极小的告警数据进行自动处理,进而降低处理成本。

进一步地,作为优选的实施方式,上述第一告警信息可以为系统类对象的每类告警对象的每类告警数据和与其对应的评分;上述第一告警信息可以为应用类对象的每类告警对象的每类告警数据和与其对应的评分。

第一处理阈值和第二处理阈值均可以通过操作人员可以需求自定义设置,其中,第一处理阈值和第二处理阈值均可以为大于或等于6分,而评分满分10分;

例如当评分规则根据分类属性中的每个等级设置对应的评分时,其中告警等级由高至低被划分为红色、橙色、黄色三个等级,告警等级为红色等级的评分为负的2-5分,告警等级为橙色等级的评分为负的1-2分,告警等级为黄色等级的评分为负的0-1分。

如图2所示,告警报表模块8包括:

告警报表生成单元84,用于根据分类属性将所有告警数据生成一告警报表;

第一统计单元85,与告警报表生成单元84连接,用于根据告警报表统计每类监控对象的每类告警对象的所有告警数据的告警数量,并标注告警数量最多的前n类告警数据,以得到第一统计文件,并将第一统计文件发送给操作人员,以供操作人员对被标注的告警数据进行处理;

进一步地,作为优选的实施方式,当n为3时,以及当a、b、c类告警数据为被标注的告警数据时,操作人员分别对被标注的告警数据进行对应的处理,减少后续a类告警数据的出现。例如,a类告警数据可以为“内存不足”,操作人员可以进行扩大内存操作,从而使得减少“内存不足”类的告警数据的出现。

第二统计单元86,与告警报表生成单元84连接,用于根据告警报表统计预设统计时间内的更新的告警状态为失败状态的告警数据的失败数量,并标注失败数量最多的前m类告警数据,以得到第二统计文件,并将第二统计文件发送给操作人员,以供操作人员对被标注的告警数据进行处理。

在上述实施例中,通过对告警数据和对告警数据的处理后的失败状态进行自动统计,并在统计结果超出对应的阈值时将统计文件发送给操作人员,使得操作人员可以人工对告警状态进行预防处理,从而提高故障处理的精确度。

进一步地,在上述实施例中,如图3所示,告警模块3包括:

接收单元31,用于接收监控数据;

告警单元32,与接收单元31连接,用于根据监控数据依照一告警触发标准触发对应的告警数据。

进一步地,在上述实施例中,每类告警数据的告警触发标准可以不同,即可以实现根据不同的告警触发标准来触发不同类别的告警数据,从而提高告警数据的有效性,避免极小的告警数据占用故障处理时间。

进一步地,在上述实施例中,分类属性中包括每类告警数据的告警等级;

告警等级由高至低被划分为三个等级。

例如,告警等级由高至低被划分为黄、橙、红三个等级。

进一步地,在上述实施例中,分类属性中包括每类告警数据的告警优先级;

告警优先级隶属于对应的告警等级下,告警优先级由高至低被划分为三级优先级。

例如,告警优先级由高至低可以被划分为高、中、低三个等级。

以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1