一种告警方法及装置与流程

文档序号:12477584阅读:207来源:国知局
一种告警方法及装置与流程

本发明涉及计算机技术领域,具体涉及一种告警方法及装置。



背景技术:

目前,企业通常采用短信、邮件等通知方式来处理IT基础设备运维时所产生的告警。例如短信方式,可以采用运营商提供的硬件设备(短信猫或者上网卡)发送告警短信以及通过与运营商合作自研的短信通道发送告警短信。又如邮件通知方式,可以采用公司的邮件服务器发送告警邮件以及通过云平台提供的企业邮箱账号发送告警邮件。

然而,在实际应用中,利用运营商提供的硬件设备发送短信时,一方面硬件故障率较高,另一方面还存在未及时付费导致报警设备停用的问题,使告警送达到相关负责人的准确率小于90%;通过短信发送通道的告警正常送达准确率通常小于92%。在安全环境相当严格的环境中无法满足企业对安全准确度的要求。



技术实现要素:

针对现有技术中的缺陷,本发明提供一种告警方法及装置,可以解决现有技术中告警正常送达准确率较低的技术问题。

第一方面,本发明提供了一种告警方法,包括:

获取告警消息并向主告警消息通道发送受理请求;

若所述主告警消息通道返回受理消息,则向所述主告警消息通道发送所述告警消息以使所述主告警消息通道发送到指定对象;

若所述主告警消息通道返回未受理消息,则向至少一个备用告警消息通道发送受理请求;

若所述至少一个备用告警消息通道返回受理消息,则向所述至少一个备用告警消息通道发送所述告警消息以使所述至少一个备用告警消息通道发送到指定对象。

可选地,获取告警消息包括:

获取第一预设时间段内所有告警事件;

比较所有告警事件的关键字,当任意两个告警事件的所有关键字都相同时为相同告警事件;当任意两个告警事件的相同的关键字数量超过第一预设值时为相似告警事件;剩余告警事件为不同事件;

合并所述相同告警事件与所述相似告警事件得到告警消息。

可选地,在第二预设时间段内,向所述主告警消息通道或者所述至少一个备用告警消息通道发送的告警消息超过第二预设值时,采用风暴处理法处理告警消息包括:

按照预设算法降低发送告警消息的频率,以使在所述第二预设时间段内向所述主告警消息通道或者所述至少一个备用告警消息通道发送的告警消息不超过第二预设值。

可选地,当所述主告警消息通道或者所述至少一个备用告警消息通道发送所述告警消息至指定对象后,按照预设升级策略检测响应信息包括:

若在第一响应时间内未接收所述指定对象的返回信息,则所述主告警消息通道或者所述至少一个备用告警消息通道按照预设升级策略表将所述告警消息发送给下一级的指定对象,直至任意一级指定对象返回信息为止。

可选地,所述升级策略表包括多名按照优先级顺序排列的指定对象。

第二方面,本发明还提供了一种告警装置,所述装置包括:

第一受理请求发送模块,用于获取告警消息并向主告警消息通道发送受理请求;

主通道告警消息发送模块,用于在所述主告警消息通道返回受理消息时,向所述主告警消息通道发送所述告警消息以使所述主告警消息通道发送到指定对象;

第二受理请求发送模块,用于在所述主告警消息通道返回未受理消息,则向至少一个备用告警消息通道发送受理请求;

备用通道告警消息发送模块,用于在所述至少一个备用告警消息通道返回受理消息时,向所述至少一个备用告警消息通道发送所述告警消息以使所述至少一个备用告警消息通道发送到指定对象。

可选地,所述第一受理请求发送模块通过以下步骤获取告警消息包括:

获取第一预设时间段内所有告警事件;

比较所有告警事件的关键字,当任意两个告警事件的所有关键字都相同时为相同告警事件;当任意两个告警事件的相同的关键字数量超过第一预设值时为相似告警事件;剩余告警事件为不同事件;

合并所述相同告警事件与所述相似告警事件得到告警消息。

可选地,所述装置还包括风暴处理模块;所述风暴处理模块用于在第二预设时间段内,向所述主告警消息通道或者所述至少一个备用告警消息通道发送的告警消息超过第二预设值时,执行以下步骤包括:

按照预设算法降低发送告警消息的频率,以使在所述第二预设时间段内向所述主告警消息通道或者所述至少一个备用告警消息通道发送的告警消息不超过第二预设值。

可选地,所述装置还包括分级轮询模块;所述分级轮询模块用于在所述主告警消息通道或者所述至少一个备用告警消息通道发送所述告警消息至指定对象后,按照预设升级策略检测响应信息包括:

若在第一响应时间内未接收所述指定对象的返回信息,则所述主告警消息通道或者所述至少一个备用告警消息通道按照预设升级策略表将所述告警消息发送给下一级的指定对象,直至任意一级指定对象返回信息为止。

由上述技术方案可知,本发明通过设置主告警消息通道以及至少一个备用告警消息通道,当主告警消息通道响应受理请求信息时,向主告警消息通道发送告警消息;在主告警消息通道未对受理请求进行响应时,向至少一个备用告警消息通道发送受理请求,并在该至少一个备用告警消息通道发送受理请求时向其发送告警消息。本发明通过设置多个告警消息通道,可以保证告警消息的发送成功率。本发明还通过分级轮询方式可以将告警消息发送到不同的指定对象直至有指定对象响应为止,进一步提高了告警消息的发送成功率。本发明还采用风暴处理方式对告警事件进行合并,减少告警消息的发送数量以及频率,降低告警设备的数据传输量,更进一步地提高了告警消息的发送成功率。

附图说明

通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:

图1是本发明实施例提供的一种告警方法流程示意图;

图2是本发明实施例提供的一种告警方法具体流程示意图;

图3是本发明实施例提供的分级轮询示意图;

图4是本发明实施例提供的一种告警装置框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在企业IT基础设备中通常设置有监控设备,本发明实施例以监控设备为例说明上述告警方法。

第一方面,本发明提供了一种告警方法,如图1与图2所示,该告警方法包括:

S1、获取告警消息并向主告警消息通道发送受理请求。

需要说明的是,告警消息通道是指,用到的短信、电话、邮件、即时信息软件等沟通方式。例如,采用短信时,在监控设备侧设置短信发送装置,然后指定对象具有短信接收装置,在短信发送装置与短信接收装置之间的通信链路即为告警消息通道;该告警消息通道采用现有运营商的通信网络实现。例如,采用邮件时可以采用不同邮件提供商提供的邮件通道。其它告警消息通道与短信以及邮件的情况类似,在此不再赘述。

主告警消息通道是指,设置多个告警消息通道时,需要发送告警消息时第一个使用的告警消息通道。其他的告警消息通道设置有备用消息通道,在主告警消息通道忙或者损坏时启用备用告警消息通道。

监控设备首先检测所有IT基础设备的告警事件并处理得到告警消息。实际应用中,监控设备可以将一个告警事件作为一个告警消息进行处理。但是随着告警事件的增多,可能会存在相同或者相似的告警事件,为减少告警事件的处理量以及降低告警消息的大小,本发明实施例中还对获取的告警事件进行合并处理,包括:

S11、获取第一预设时间段内所有告警事件。

需要说明的是,上文中第一预设时间段是指,表示从一个时刻到另一个时刻之间的时间长度。其中一个时刻是监控设备开始获取告警事件的时刻,另一个时刻是监控设备结束本次采集告警事件的时刻。该预设时间段可以是10ms、100ms或者1s,甚至更长时间,本领域技术人员可以根据具体使用场景进行设定,本发明实施例不作限定。

监控设备收拾该第一预计时间段所有IT基础设备产生的告警事件并获取每个告警事件的关键字。获取关键字的方法可以采用现有技术中的切词与分词方法实现,在此不再介绍。

S12、比较所有告警事件的关键字,当任意两个告警事件的所有关键字都相同时为相同告警事件;当任意两个告警事件的相同的关键字数量超过第一预设值时为相似告警事件;剩余告警事件为不同事件。

监控设备获取一个告警事件后得到其关键词,然后将该关键词与其他告警事件的关键词依次比较。当该告警事件与任意一个告警事件的所有关键词都相同时,这两个告警事件属于相同告警事件。若该告警事件与任意一个告警事件的部分关键词相同时,属于相似告警事件。其他的告警事件为不同告警事件。

所有的告警事件按照上述判断方法进行判断,从而得到所有告警事件的相同告警事件、相似告警事件以及不同告警事件。

需要说明的是,上述相似事件的判断过程中,第一预设值可以设置,例如80%、85%或者90%等,本领域技术人员可以根据具体使用场景进行设置,本发明不作限定。

S13、合并所述相同告警事件与所述相似告警事件得到告警消息。

监控设备将步骤S12中判断的相同告警事件与相似告警事件合并为一个告警事件,从而减少告警事件的数量。

监控设备将所有告警事件合并后得到告警事件就是告警消息。

S2、若所述主告警消息通道返回受理消息,则向所述主告警消息通道发送所述告警消息以使所述主告警消息通道发送到指定对象。

监控设备向主告警消息通道发送受理请求后,还需要检测该主告警消息通道是否返回受理消息。

当检测到主告警消息通道返回的受理消息后,监控设备将步骤S1获取的告警消息发送到该主告警消息通道,然后由该主告警消息通道发送给指定对象。

实际应用中,告警事件的数量急剧增大,从而使监控设备向主告警消息通道发送的告警消息急剧增多,造成指定对象无法正常阅读。换言之,在第二预设时间段内,监控设备向主告警消息通道发送的告警消息超过第二预设值时,本发明实施例中监控设备还采用风暴处理法处理告警消息。该风暴处理法包括:

按照预设算法降低发送告警消息的频率,以使在所述第二预设时间段内向所述主告警消息通道或者所述至少一个备用告警消息通道发送的告警消息不超过第二预设值。

需要说明的是,上述预设算法可以采用延时发送、间隔发送以及按照优先级发送的方式进行。其中延时发送是指,按照告警消息的现有顺序,每隔预设时间发送一个告警消息,使第二预设时间段内的告警消息的数量小于第二预设值。间隔发送是指,将现有的告警消息按照现有顺序间隔的选取告警消息发送,例如第一次发送编号为1的告警消息,第二次发送编号为5个告警消息,第三次发送编号为9的告警消息,第四次发送编号为13的告警消息,以此类推,这样可以每5个告警消息发送1个,使原来的告警消息降为原来的五分之一,极大的降低了告警消息的数量。当然还可以继续设置间隔的比例,降到原来的十分之一,甚至更多。按照优先级发送是指,将所有告警消息按照优先级顺序重新排序,按照第二预设值优先发送级别高的告警消息。本发明实施例仅列举了几种预设算法,当然本领域技术人员还可以根据具体场景选择其他方法,同样可以实现本发明的技术方案,本发明不作限定。

需要说明的是,第二预设时间段是指,表示从一个时刻到另一个时刻之间的时间长度。其中一个时刻是监控设备开始获取告警事件的时刻,另一个时刻是监控设备结束本次采集告警事件的时刻。该预设时间段可以是10ms、100ms或者1s,甚至更长时间,本领域技术人员可以根据具体使用场景进行设定,本发明实施例不作限定。

第二预设值是指,指定对象能够正常阅读告警消息的字数。例如,一个操作人员正常阅读处理速度为600-900字/分钟,此时可以将第二预设值设置第二预设值为700字/分钟。当然,本领域技术人员可以根据具体情况进行设置,例如,采用微信时该第二预设值设置相对大一些如800字/分钟。采用短信方式时设置小一些如600字/分钟,同样可以实现本发明的技术方案,本发明不作限定。

S3、若所述主告警消息通道返回未受理消息,则向至少一个备用告警消息通道发送受理请求。

监控设备在预设时间段内未检测到主告警消息通道返回的受理消息时,说明主告警消息通道正在处理其他事件或者损坏,此时监控设备向至少一个备用告警消息通道发送受理请求。

需要说明的是,该至少一个备用告警消息通道与主告警消息通道具有相同的功能,区别仅在于优先级不同。即由主告警消息通道优先处理告警消息,在其无法处理的情况下,由备用告警消息通道进行处理告警消息。当然,主备告警消息通道之间可以互换,在此不再介绍。

本发明通过设置主备告警消息通道,可以使100%的保证告警消息发送到指定对象。

S4、若所述至少一个备用告警消息通道返回受理消息,则向所述至少一个备用告警消息通道发送所述告警消息以使所述至少一个备用告警消息通道发送到指定对象。

当在预设时间段内没有检测到至少一个备用告警消息通道返回的受理消息后,监控设备将步骤S1获取的告警消息发送到该备用告警消息通道,然后由该备用告警消息通道发送给指定对象。

同样,在告警消息急剧增多时,监控设备采用风暴处理法按照预设算法降低发送告警消息的频率,以使在所述第二预设时间段内向所述主告警消息通道或者所述至少一个备用告警消息通道发送的告警消息不超过第二预设值。具体内容请参见步骤S2,在此不再赘述。

实际应用中,当主告警消息通道或者至少一个告警消息通道(以下简称主备告警消息通道)将告警消息发送给指定对象后,该指定对象会返回信息以表明接收到告警信息。

由于指定对象因为各种原因未及时回复时,容易造成告警消息得不到及时处理使IT基础设备无法正常工作,进而影响企业的正常运转。为解决上述技术问题,本发明实施例还采用分级轮询方法即按照预设升级策略检测响应信息包括:

当主备告警消息通道向指定对象发送告警消息后,在第一响应时间内没有接收到该指定对象的返回信息,则按照预设升级策略表向下一级的指定对象发送同一个告警消息,若接收到返回信息则说明告警信号成功送达指定对象,若在第一响应时间内没有接收到返回信息,则继续发送给下一级的指定对象(如图3中第二指定对象),当预设升级策略表中的指定对象为最后一个(如图3中第三指定对象)时,主备告警消息通道将同一个消息发送给第一个指定对象,以此循环,直至有指定对象返回信息为止。这样可以保证每个告警消息100%送达指定对象并得到其反馈。

需要说明的是,本发明实施例中升级策略表是指,按照优先级序排列的多名指定对象。该升级策略表可以根据指定对象接收到的告警消息的数量进行调整,也可以由人工确定,本发明不作限定。

第二方面,本发明实施例还提供了一种告警装置,如图4所示,包括:

第一受理请求发送模块M1,用于获取告警消息并向主告警消息通道发送受理请求;

主通道告警消息发送模块M2,用于在所述主告警消息通道返回受理消息时,向所述主告警消息通道发送所述告警消息以使所述主告警消息通道发送到指定对象;

第二受理请求发送模块M3,用于在所述主告警消息通道返回未受理消息,则向至少一个备用告警消息通道发送受理请求;

备用通道告警消息发送模块M4,用于在所述至少一个备用告警消息通道返回受理消息时,向所述至少一个备用告警消息通道发送所述告警消息以使所述至少一个备用告警消息通道发送到指定对象。

可选地,第一受理请求发送模块M1通过以下步骤获取告警消息包括:

获取第一预设时间段内所有告警事件;

比较所有告警事件的关键字,当任意两个告警事件的所有关键字都相同时为相同告警事件;当任意两个告警事件的相同的关键字数量超过第一预设值时为相似告警事件;剩余告警事件为不同事件;

合并所述相同告警事件与所述相似告警事件得到告警消息。

所述装置还包括风暴处理模块;所述风暴处理模块用于在第二预设时间段内,向所述主告警消息通道或者所述至少一个备用告警消息通道发送的告警消息超过第二预设值时,执行以下步骤包括:

按照预设算法降低发送告警消息的频率,以使在所述第二预设时间段内向所述主告警消息通道或者所述至少一个备用告警消息通道发送的告警消息不超过第二预设值。

可选地,所述装置还包括分级轮询模块;所述分级轮询模块用于在所述主告警消息通道或者所述至少一个备用告警消息通道发送所述告警消息至指定对象后,按照预设升级策略检测响应信息包括:

若在第一响应时间内未接收所述指定对象的返回信息,则所述主告警消息通道或者所述至少一个备用告警消息通道按照预设升级策略表将所述告警消息发送给下一级的指定对象,直至任意一级指定对象返回信息为止。

由上可以看出,本发明实施例提供的告警装置基于上文所述的告警方法实现,因而可以解决同样的技术问题,并取得相同的技术效果,在此不再一一赘述。

综上所述,本发明提供的告警方法及装置,通过设置主告警消息通道以及至少一个备用告警消息通道,当主告警消息通道响应受理请求信息时,向主告警消息通道发送告警消息;在主告警消息通道未对受理请求进行响应时,向至少一个备用告警消息通道发送受理请求,并在该至少一个备用告警消息通道发送受理请求时向其发送告警消息。本发明通过设置多个告警消息通道,可以保证告警消息的发送成功率。本发明还通过分级轮询方式可以将告警消息发送到不同的指定对象直至有指定对象响应为止,进一步提高了告警消息的发送成功率。本发明还采用风暴处理方式对告警事件进行合并,减少告警消息的发送数量以及频率,降低告警设备的数据传输量,更进一步地提高了告警消息的发送成功率。

在本发明中,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。术语“多个”指两个或两个以上,除非另有明确的限定。

虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1