一种报警信息管理方法、装置、设备及存储介质与流程

文档序号:15979142发布日期:2018-11-17 00:07阅读:215来源:国知局

本发明涉及监控平台技术领域,尤其涉及一种报警信息管理方法、装置、设备及存储介质。

背景技术

现有的监控平台(balant)所有的报警操作均需要人工确认,如报警事件有效性的确认、事件的上报、报警事件的升级等,对报警信息的处理效率十分低下。此外,监控平台需要对大量的报警信息进行处理,现有监控平台无法自动对重要报警信息进行筛选、上报,非常容易出现重要报警信息漏报、延时上报的情况,很可能给企业造成重大损失。



技术实现要素:

鉴于现有技术的上述缺陷或不足,期望提供一种报警信息管理方法、装置、设备及存储介质,以解决上述技术问题。

为实现上述目的,本申请一方面,提供一种报警信息管理方法,包括:

获取所述监控平台的监控数据;

基于监控的产品类别分设业务组;

根据所述业务组设置过滤规则,将无需通知负责人的监控数据过滤出去,得到报警信息;

根据所述业务组类型设置升级机制,并将所述报警信息按所述升级机制进行升级处理;

获取所述报警信息对应的责任人信息;

根据报警信息的等级和所述责任人信息将所述报警信息发送至相应等级责任人。

进一步的,所述根据所述业务组类型设置升级机制并将所述报警信息按所述升级机制进行升级处理,包括:

根据所述业务组类别设定报警持续时间阈值;

检验所述报警信息持续时间是否达到所述报警持续时间阈值,

若是,则将所述报警信息升至与所述报警持续时间阈值对应的等级。

进一步的,所述获取所述报警信息对应的责任人信息,包括:

对接配置管理数据库和it系统基础信息管理数据库;

从所述配置管理数据库和it系统基础信息管理数据库和本地的责任矩阵(责任矩阵是项目管理中最重要的一环,将每项任务责任到人。一般矩阵纵列列出项目中的各项细节任务,横排写出项目相关人员名称,在其交叉格内标明每个人员的角色)中获取与所述报警信息对应的责任人信息。

进一步的,所述根据报警信息的等级和所述责任人信息将所述报警信息通知相应等级的责任人,包括:

对接通知管理平台和语音呼叫平台;

根据所述报警信息选取相应的通讯方式通知相应等级的责任人。

进一步的,所述方法还包括:

定期清理过滤掉的与所述业务组不相关的监控数据和已解除故障的报警信息。

进一步的,所述方法还包括:

对接it服务管理;

预设创建事件级别;

检测所述报警信息等级是否达到创建事件级别,

若是,则触发it服务管理创建事件工单,由所述it服务管理跟进所述报警信息的处理过程。

进一步的,所述方法还包括:

将所述报警信息推送至显示单元;

记录查看所述报警信息的id并生成查看记录。

为实现上述目的,本申请另一方面,提供一种报警信息管理装置,包括:

信息获取单元,配置用于获取所述监控平台的监控数据;

预设分组单元,配置用于基于监控的产品类别分设业务组;

信息过滤单元,配置用于根据所述业务组设置过滤规则,将无需通知负责人的监控数据过滤出去,得到报警信息;

报警升级单元,配置用于根据所述业务组类型设置升级机制,并将所述报警信息按所述升级机制进行升级处理;

通讯获取单元,配置用于获取所述报警信息对应的责任人信息;

报警通知单元,配置用于根据报警信息的等级和所述责任人信息将所述报警信息发送至相应等级的责任人。

进一步的,所述信息过滤单元包括:

阈值预设子单元,配置用于根据所述业务组类别设定报警持续时间阈值;

时间检验子单元,配置用于检验所述报警信息持续时间是否达到所述报警持续时间阈值;

报警升级子单元,配置用于将所述报警信息升至与所述报警持续时间阈值对应的等级。

进一步的,所述通讯获取单元包括:

数据对接子单元,配置用于对接配置管理数据库和it系统基础信息管理数据库;

数据获取子单元,配置用于从所述配置管理数据库和it系统基础信息管理数据库和本地的责任矩阵中获取与所述报警信息对应的责任人信息。

进一步的,所述报警通知单元包括:

对接子单元,配置用于对接通知管理平台和语音呼叫平台;

通知子单元,配置用于根据所述报警信息选取相应的通讯方式通知相应等级的责任人。

进一步的,所述装置还包括:

数据清理单元,配置用于定期清理过滤掉的与所述业务组不相关的监控数据和已解除故障的报警信息。

进一步的,所述装置还包括:

接口扩展单元,配置用于对接it服务管理;

级别预设单元,配置用于预设创建事件级别;

等级检测单元,配置用于检测所述报警信息等级是否达到创建事件级别;

处理跟进单元,配置用于触发it服务管理创建事件工单,由所述it服务管理跟进所述报警信息的处理过程。

进一步的,所述装置还包括:

推送单元,配置用于将所述报警信息推送至显示单元;

记录单元,配置用于记录查看所述报警信息的id并生成查看记录。

本申请另一方面,提供一种设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如上述任一项所述的方法。

本申请另一方面提供一种存储有计算机程序的计算机可读存储介质,其特征在于,该程序被处理器执行时实现如上述任一项所述的方法。

与现有技术相比,本申请的有益效果为:

1、本发明提供的报警信息管理方法,通过过滤冗余信息并建立报警信息升级机制,自动对重要的报警信息进行筛选和升级,减少人工操作步骤,大大提升效率。将重要事件的报警信息等级变更情况及时通知相关负责人,报警信息的上报及时性得到提升,避免出现漏报、延时上报的情况。

2、本发明提供的报警信息管理装置,通过过滤冗余信息并建立报警信息升级机制,自动对重要的报警信息进行筛选和升级,减少人工操作步骤,大大提升效率。将重要事件的报警信息等级变更情况及时通知相关负责人,报警信息的上报及时性得到提升,避免出现漏报、延时上报的情况。

3、本申请提供的设备,可以执行本发明提供的报警信息管理方法。可以自动对重要的报警信息进行筛选和升级,减少人工操作步骤,大大提升效率。将重要事件的报警信息等级变更情况及时通知相关负责人,报警信息的上报及时性得到提升,避免出现漏报、延时上报的情况。

4、本申请提供的计算机可读存储介质可以执行本发明提供的报警信息管理方法。可以自动对重要的报警信息进行筛选和升级,减少人工操作步骤,大大提升效率。将重要事件的报警信息等级变更情况及时通知相关负责人,报警信息的上报及时性得到提升,避免出现漏报、延时上报的情况。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1为示出了根据本申请实施例的报警信息管理方法的示例性流程图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

本申请实施例提供一种报警信息管理方法,包括:

获取监控平台的监控数据;

基于监控的产品类别分设业务组;

根据业务组设置过滤规则,将无需通知负责人的监控数据过滤出去,得到报警信息;

根据业务组类型设置升级机制,并将报警信息按升级机制进行升级处理;

获取报警信息对应的责任人信息;

根据报警信息的等级和责任人信息将报警信息发送至相应等级的责任人。

在本实施例中,根据业务组类型设置升级机制,并将报警信息按升级机制进行升级处理,包括:

根据业务组类别设定报警持续时间阈值;

检验报警信息持续时间是否达到报警持续时间阈值,

若是,则将报警信息升至与报警持续时间阈值对应的等级。

在本实施例中,获取报警信息对应的责任人信息,包括:

对接配置管理数据库和it系统基础信息管理数据库;

从配置管理数据库和it系统基础信息管理数据库和本地的责任矩阵中获取与报警信息对应的责任人信息。

在本实施例中,根据报警信息的等级和责任人信息将报警信息通知相应等级的责任人包括:

对接通知管理平台和语音呼叫平台;

根据报警信息选取相应的通讯方式通知相应等级的责任人。

在本实施例中,报警信息管理方法还包括:

定期清理过滤掉的与业务组不相关的监控数据和已解除故障的报警信息。

在本实施例中,报警信息管理方法还包括:

对接it服务管理;

预设创建事件级别;

检测报警信息等级是否达到创建事件级别,

若是,则触发it服务管理创建事件工单,由所述it服务管理跟进报警信息的处理过程。

在本实施例中,报警信息管理方法还包括:

将报警信息推送至显示单元;

记录查看报警信息的id并生成查看记录。

为了便于对本发明的理解,下面以本发明管理报警信息的原理,结合实施例中对报警信息进行管理的过程,对本发明提供的报警信息管理方法做进一步的描述。

本实施例提供一种报警信息管理方法,方法步骤如下:

s1、开发对接balant(监控平台)报警接口,该监控平台定时从balant接口获取当前监控数据。

s2、监控部门把需要监控的所有系统按产品类别(如主机、中间件、基础应用、商业、公共服务等)分成不同的业务组。

s3、根据业务组设定过滤规则,过滤监控数据。如“基础应用”业务组的“错误”报警,持续5分钟将自动通知相应的系统运维人员,持续达15分钟未解决,将通知升级到运维人员的直属上级。以上持续时间都可以根据不同业务组的要求进行灵活设置。

并自动过滤无需通知负责人的监控数据。比如kafka和informatica类别的监控数据将自动过滤,其它类别的按预先设定的规则升级预警。

s4、根据业务组的重要程度设置相应的报警持续时间阈值。平台后台自动检测当前的报警信息是否达到设定的报警持续时间阈值,若达到阈值,则自动将报警信息升至与阈值对应的等级。报警信息按全生命周期(全生命周期指报警的全生命指从报警产生到通知路由、升级机制、触发itsm事件/故障单,直到报警消失等一系列全周期的管理。)进行管理,报警事件根据时间轴划为l1、l2、l3三个级别,按预先设定的策略升级机制进行处理。此外,也可以按照报警信息所属的业务组、报警严重级别和产品类型等设定报警持续时间阈值,作为报警信息升级机制。比如某关键级别的报警属于商业业务组,而且持续了15分钟,则通知到对应的主、备运维人员,持续超过30分钟,通知到对应的上级主管。本系统的功能弥补了以前靠人工处理通知路由、升级、创建事件工单等功能空白,实现自动化处理这一系列工作。

下表为按时间维度的升级处理方式,对于报警级别及不同业务组的升级处理方式是固化在代码中,详见jobserviceimpl.java中的函数checktimeoutalerts、alerttimeoutevent及关联调用的函数:

s4、平台通过对接cmdb(配置管理数据库)、asov(it系统基础信息管理数据库),结合自己的责任矩阵责任矩阵是项目管理中最重要的一环,将每项任务责任到人。一般矩阵纵列列出项目中的各项细节任务,横排写出项目相关人员名称,在其交叉格内标明每个人员的角色(raci))配置功能,获取对应报警事件的责任人及相关人员信息。

s5、平台对接itsm。预先根据业务组设定触发等级,当业务组下的报警信息的等级达到该业务组对应的触发等级时,立即触发itsm创建事件工单。一旦该事件的报警信息达到创建事件工单的条件,直接创建事件处理流程,itsm将负责报警信息的处理跟进。比如设定商业业务组的触发等级为2级,当商业业务组的报警信息持续时间达到30min(2级)时,即可触发itsm创建事件工单。

s6、平台对接通知管理平台和语音呼叫平台,实现报警信息每次升级自动通过邮件、电话等方式实时通知到相关运维人员及其直属领导。根据需要设定通知方式,若不是特别重要的业务组的报警信息等级较低时,只用邮件通知负责人;报警信息升级后,同时采用邮件和电话通知上层负责人。或者比较重要的业务组的报警信息,每次升级都采用邮件和电话同时通知相应负责人。

s7、平台可发送公告信息,公告信息是文本描述信息,主要用于监控人员(非系统管理人员)交班或备忘提醒用,将公告推送到平台操作人员,用于实现监控工作内容的交接。监控平台24小时有人值守,公告一般用于不同班次的值守人员消息传递的渠道。如交班注意信息、哪些系统正在变更需要暂时忽略报警、备忘提醒等,后台能记录哪些人员已经查看了公告消息。

s8、后台自动定时运行自维护作业,清理过滤掉的监控数据和已解除故障的报警信息。

本实施例还提供一种报警信息管理装置,包括:信息获取单元,配置用于获取所述监控平台的报警信息;预设分组单元,配置用于基于监控的产品类别分设业务组;信息过滤单元,配置用于根据所述业务组设置过滤规则,将无需通知负责人的监控数据过滤出去,得到报警信息;报警升级单元,配置用于根据所述业务组类型设置升级机制,并将所述报警信息按所述升级机制进行升级处理;通讯获取单元,配置用于获取所述报警信息对应的责任人信息;报警通知单元,配置用于根据报警信息的等级和所述责任人信息将所述报警信息发送至相应等级的责任人。

其中,信息过滤单元包括:阈值预设子单元,配置用于根据所述业务组类别设定报警持续时间阈值;时间检验子单元,配置用于检验所述报警信息持续时间是否达到所述报警持续时间阈值;报警升级子单元,配置用于将所述报警信息升至与所述报警持续时间阈值对应的等级。

通讯获取单元包括:数据对接子单元,配置用于对接配置管理数据库和it系统基础信息管理数据库;数据获取子单元,配置用于从所述配置管理数据库和it系统基础信息管理数据库和本地的责任矩阵中获取与所述报警信息对应的责任人信息。

报警通知单元包括:对接子单元,配置用于对接通知管理平台和语音呼叫平台;通知子单元,配置用于根据所述报警信息选取相应的通讯方式通知相应等级的责任人。

在本实施例中,报警信息管理装置还包括:数据清理单元,配置用于定期清理过滤掉的与所述业务组不相关的监控数据和已解除故障的报警信息。

在本实施例中,报警信息管理装置还包括:接口扩展单元,配置用于对接it服务管理;级别预设单元,配置用于预设创建事件级别;等级检测单元,配置用于检测所述报警信息等级是否达到创建事件级别;处理跟进单元,配置用于触发it服务管理创建事件工单,由所述it服务管理跟进所述报警信息的处理过程。

在本实施例中,报警信息管理装置还包括:推送单元,配置用于将所述报警信息推送至显示单元;记录单元,配置用于记录查看所述报警信息的id并生成查看记录。

本实施例还提供一种设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如本申请实施例提供的报警信息管理的方法。

本实施例还提供一种存储有计算机程序的计算机可读存储介质,其特征在于,该程序被处理器执行时实现如如本申请实施例提供的报警信息管理的方法。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1