一种告警信息的处理方法及装置制造方法

文档序号:8000474阅读:173来源:国知局
一种告警信息的处理方法及装置制造方法
【专利摘要】本发明公开了一种告警信息的处理方法及装置,所述方法包括:预设各告警信息的告警等级和初始权值;接收告警信息;根据所述告警信息的告警等级和初始权值,通过记忆模型计算所述告警信息的发送时间间隔;根据所述时间间隔发送所述告警信息。本发明能够根据系统中各类告警信息的级别动态调整其在告警时出现的频率,更适合工作人员对系统进行维护。
【专利说明】一种告警信息的处理方法及装置

【技术领域】
[0001] 本发明涉及业务支撑【技术领域】,尤其涉及一种告警信息的处理方法及装置。

【背景技术】
[0002] 在大型企业中,系统的运维管理涉及到大量的主机、数据库和中间件等的性能监 控,目前普遍采用的是由一整套完善的监控告警系统来收集机房内通信设备的各种参数, 如主机的CPU利用率、内存使用率、文件系统使用率等,将达到一定级别的信息及时通过短 信或邮件等形式通知到相应责任人,从而在一定程度上反映着硬件设备的运行信息及健康 状态。
[0003] 现有的监控告警系统的处理流程如图1所示。所有主动或被动接收到的事件信息 都首先进入原始事件,原始事件经过标准化和分类后成为事件。事件已经成为一个带有告 警级别的对象,但在生成当前告警之前,还会进行过滤、合并等处理工序。统故障的表象,可 能需要用户进行网络的检查和恢复操作,当前告警产生时,系统会自动将告警级别以不同 颜色的形式传递到拓扑上,并且会匹配规则启动短信、Email等方式进行通知,甚至进入工 单处理系统,当告警超过定制的时限还没有进行处理,将根据定义的规则自动进行告警升 级。所有当前告警经过处理和清除之后,将从当前告警转移到历史告警中,供以后的统计分 析、知识库的形成、告警预测等方面使用。
[0004] 现有的告警通知流程如图2所示,在现有告警通知流程中对于告警信息的产生阶 段做了相应的对象匹配,然后直接将其通知给被管对象,而未对告警区分处理优先级,也缺 乏对告警信息的筛选和回顾,此时当大量告警信息涌来的时候就容易加大维护人员的维护 难度,难以充分发挥告警系统的实用程度。
[0005] 由上述可知,现有的监控告警系统中存在着如下的缺陷:
[0006] 1.在告警通知阶段中,由于每台服务器需要监控多种属性,造成了告警信息繁杂, 这样对于维护人员来说如何从繁多的告警中找到急需处理的告警在极大程度上影响着系 统的运维工作,当前的告警监控系统中只是简单的对告警区分级别,然而在实际维护中每 个告警信息需要处理的紧急程度都是不同的。
[0007] 2.有很多告警信息由于业务的特性,可能其数值是习惯性波动的,如某一时间段 主机的CPU利用率高可能的原因是这个时间段业务量大,这个时候实际上只需要人为关注 该主机的信息并不需要处理,当业务量降低的时候告警会自动解除,即这种告警信息只有 达到一定的阀值时才需要进行处理。大量的这种不需立即处理的信息频繁发出告警使得维 护人员对告警信息产生了麻痹情绪,很可能会因此错过了重要的告警,缺乏一种有效的手 段来根据告警严重程度动态调整告警频率来帮助维护人员很快的定位出不同告警的紧急 程度。
[0008] 3.当前的告警系统中没有一个智能的告警信息优化方法,当某些告警信息的存在 是不合理的时候,大多数情况下是由维护人员主动提出针对这一部分的告警做相应处理, 如进行告警阀值的调整。或者就是告警系统的管理员人为进行告警的回顾与处理,从而优 化当前系统中存在的告警信息。不存在一种智能的告警通知,可以根据不同告警的处理状 态及系统的健康情况主动对告警的调整做出相应推荐。


【发明内容】

[0009] 为了解决现有技术中的技术问题,本发明提出一种告警信息的处理方法及装置, 能够根据系统中各类告警信息的级别动态调整其在告警时出现的频率,更适合工作人员对 系统进行维护。
[0010] 本发明的一个方面,提出了一种告警信息的处理方法,包括:预设各告警信息的告 警等级和初始权值;接收告警信息;根据所述告警信息的告警等级和初始权值,通过记忆 模型计算所述告警信息的发送时间间隔;根据所述时间间隔发送所述告警信息。
[0011] 本发明的另一个方面,还提出了一种告警信息的处理装置,包括告警信息预设模 块、告警信息接收模块、发送时间间隔计算模块和告警信息发送模块,其中:所述告警信息 预设模块,用于预设各告警信息的告警等级和初始权值;所述告警信息接收模块,用于接收 告警信息;所述发送时间间隔计算模块,用于根据所述告警信息的告警等级和初始权值,通 过记忆模型计算所述告警信息的发送时间间隔;所述告警信息发送模块,用于根据所述时 间间隔发送所述告警信息。
[0012] 本发明的告警信息的处理方法及装置,通过预设告警信息的告警等级和初始权 值,利用记忆模型计算告警信息的发送时间间隔,并按照得到的时间间隔发送各告警信息, 从而使不同的告警信息在告警时出现的频率不一样,越是紧急的告警出现的频率越高,发 送的时间间隔也应越短。而不严重的告警可以相应的将告警频率进行动态调整,使其告警 时间间隔变大,从而避免过于频繁的出现造成维护人员对告警短信的忽视。

【专利附图】

【附图说明】
[0013] 图1是现有的监控告警系统告警信息的处理流程示意图;
[0014] 图2是现有的告警通知流程图;
[0015] 图3是本发明实施例中一种告警信息的处理方法的流程图;
[0016] 图4为本发明实施例中一种告警信息处理方法的优选实施例的流程图;
[0017] 图5是本发明实施例中一种告警信息的处理装置的结构示意图;
[0018] 图6是本发明实施例中优选的告警信息处理装置的结构示意图。

【具体实施方式】
[0019] 在企业系统运维中对系统运行情况进行预告警是非常重要的一种维护手段,然而 众多的告警信息又增加了维护人员不必要的工作量,甚至在一定程度上影响着系统的紧急 故障处理。尤其是当很多告警信息由于业务承载等关系只是短暂的现象,此时只需要对其 关注无需立即处理。另外,大量告警信息的存在使得维护人员很难从繁杂的系统告警信息 中很快分辨出主要告警和次要告警,甚至会产生麻痹情绪,影响系统维护工作的进行,这就 需要一种智能的告警系统可以动态的调整告警信息的发送频率,从而有效的区分严重告警 和预告警,同时也需具备定期进行告警信息优化的效果。
[0020] 本发明实施例中将系统的告警信息进行了分级,对于每个等级的告警信息又设置 了不同的默认优先处理级别,并在告警产生过程中根据记忆模型不断对其进行调整,据此 可以由系统自动判断告警信息的发送频率,从而实现自适应的减少预告警发送频率,更加 凸显急需处理的严重告警信息。当告警信息的发送频率达到一定阀值的时候对其进行优化 推荐。
[0021] 图3是本发明实施例中一种告警信息的处理方法的流程图。如图3所示,包括以 下步骤:
[0022] 步骤300、预设各告警信息的告警等级和初始权值;
[0023] 步骤302、接收告警信息;
[0024] 步骤304、根据所述告警信息的告警等级和初始权值,通过记忆模型计算所述告警 信息的发送时间间隔;
[0025] 步骤306、根据所述时间间隔发送所述告警信息。
[0026] 在步骤300中,对不同程度的告警进行等级分类,如:严重告警、主要告警、警告告 警。实际应用中要分为几类需根据需要进行初始设定,如下述表格1所示。
[0027]

【权利要求】
1. 一种告警信息的处理方法,其特征在于,包括: 预设各告警信息的告警等级和初始权值; 接收告警信息; 根据所述告警信息的告警等级和初始权值,通过记忆模型计算所述告警信息的发送时 间间隔; 根据所述时间间隔发送所述告警信息。
2. 根据权利要求1所述的方法,其特征在于,所述接收告警信息之前还包括: 预设告警信息库,所述告警信息库中存储各告警信息的当前权值和上次告警发送时 间; 所述接收告警信息和根据所述告警信息的告警等级和初始权值计算所述告警信息的 发送时间间隔之间还包括: 判断所述告警信息是否在所述告警信息库中; 如果所述告警信息在所述告警信息库中,则获取所述告警信息的当前权值及上次告警 信息发送时间,根据记忆模型计算得到所述告警信息发送的时间间隔。
3. 根据权利要求2所述的方法,其特征在于,所述根据所述时间间隔发送所述告警信 息的步骤之后还包括: 根据发送所述告警信息的时间和通过记忆模型计算得到的所述告警信息记忆衰减后 的权值更新所述告警信息库。
4. 根据权利要求1至3任一所述的方法,其特征在于,所述根据所述时间间隔发送所述 告警信息进一步包括: 判断所述时间间隔是否达到预设阈值; 如果所述时间间隔达到预设阈值,则按照所述预设阈值为间隔发送所述告警信息; 如果所述时间间隔未达到预设阈值,则按照所述时间间隔发送所述告警信息。
5. 根据权利要求4所述的方法,其特征在于,所述如果所述时间间隔达到预设阈值,则 按照所述预设阈值为间隔发送所述告警信息的步骤还包括: 输出所述告警信息处理的提示推荐信息,对告警信息的告警阈值进行调整。
6. -种告警信息的处理装置,其特征在于,包括告警信息预设模块、告警信息接收模 块、发送时间间隔计算模块和告警信息发送模块,其中: 所述告警信息预设模块,用于预设各告警信息的告警等级和初始权值; 所述告警信息接收模块,用于接收告警信息; 所述发送时间间隔计算模块,用于根据所述告警信息的告警等级和初始权值,通过记 忆模型计算所述告警信息的发送时间间隔; 所述告警信息发送模块,用于根据所述时间间隔发送所述告警信息。
7. 根据权利要求6所述的装置,其特征在于,还包括告警信息库设置模块,用于预设告 警信息库,所述告警信息库中存储各告警信息的当前权值和上次告警发送时间; 所述发送时间间隔计算模块还包括第一判断单元和计算单元,其中: 所述第一判断单元,用于判断所述告警信息是否在所述告警信息库中; 如果所述告警信息在所述告警信息库中,则所述计算单元,用于获取所述告警信息的 当前权值及上次告警信息发送时间,根据记忆模型计算得到所述告警信息发送的时间间 隔。
8. 根据权利要求7所述的装置,其特征在于,还包括告警信息库更新模块,用于根据发 送所述告警信息的时间和通过记忆模型计算得到的所述告警信息记忆衰减后的权值更新 所述告警信息库。
9. 根据权利要求6至8任一所述的装置,其特征在于,所述告警信息发送模块进一步包 括第二判断单元和发送单元,其中: 所述第二判断单元,用于判断所述时间间隔是否达到预设阈值; 如果所述时间间隔达到预设阈值,则所述发送单元,用于按照所述预设阈值为间隔发 送所述告警信息; 如果所述时间间隔未达到预设阈值,则所述发送单元,用于按照所述时间间隔发送所 述告警信息。
10. 根据权利要求9所述的装置,其特征在于,还包括推荐信息提示模块,用于输出所 述告警信息处理的提示推荐信息,对告警信息的告警阈值进行调整。
【文档编号】H04L12/24GK104243184SQ201310222301
【公开日】2014年12月24日 申请日期:2013年6月6日 优先权日:2013年6月6日
【发明者】刘岩 申请人:中国移动通信集团河北有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1