一种告警事件信息处理方法及装置制造方法

文档序号:7986898阅读:182来源:国知局
一种告警事件信息处理方法及装置制造方法
【专利摘要】本发明公开了一种告警事件信息处理方法及装置,主要内容包括:采集告警事件信息,确定告警事件信息中的告警时间和告警值,根据确定的预测模型参数和设定的预测模型对告警事件信息中包括的告警时间和告警值进行处理,获得与网元对应的预测时长,所述预测时长是网元的告警事件类型所表示的告警事件由告警值变化为设定告警值需要的时间长度的估计值;根据告警值确定网元对应的告警级别;在告警级别达到设定级别时,输出包含预测时长的告警信息。由于本发明实施例的方案对由告警值变化为设定告警值需要的时间长度的进行了估计并在告警消息中进行输出,因此,使得告警维护人员可以准确获知网元的告警值的动态变化趋势,提高了告警信息输出的有效性。
【专利说明】一种告警事件信息处理方法及装置
【技术领域】
[0001]本发明涉及网络管理【技术领域】,尤其涉及一种告警事件信息处理方法及装置。
【背景技术】
[0002]通信网络由多个通信设备构成,为了实现整个网络的正常运行,需要对各个通信设备进行网络监控。网络监控技术就是对被监控设备的软件及硬件的运行情况、任务执行情况等进行记录或远程查看,以了解其各项指标是否正常,被监控设备的某个物理设备或逻辑模块出现异常时,会发送用于传递故障信息的事件报告,这种事件报告称为告警信息。
[0003]具体实现上述功能的告警系统如图1所示,该告警系统包括:被监控网元侧的告警代理服务器(Agent) 11和告警监控设备12,该系统的工作流程包括以下步骤:
[0004]第一步:被管网元侧的告警代理服务器根据告警监控设备既定的规则进行告警指标的轮询检测。
[0005]第二步:当指标的检测值超出某一个既定的阈值后,被管网元侧的告警代理服务器以事件的形式向告警监控设备上报告警事件信息,该告警事件信息包含告警网元信息、告警指标、告警值。
[0006]第三步:告警监控设备接收到告警事件信息后,确定告警级别,参照既定处理规则触发告警信息,该告警信息包括告警网元信息、告警指标、告警值和告警等级。
[0007]告警监控设备中对告警级别的定义一般分为一般告警、中等告警、严重告警和重大告警等几个级别。不同告警指标的阀值取值可以不同,比较传统的阀值定义为一般告警(告警指标全量的80%)、中等告警(告警指标全量的85%)、严重告警(告警指标全量的90%)、重大告警(告警指标全量的95%)。
[0008]第四步:根据告警等级的不同,告警系统将告警消息通过不同的通信形式通知给告警维护人员。
[0009]举例来说:对于主机的文件系统告警,告警阀值定义一般如下占用率超过85%后触发中等告警;超过90%触发严重告警;超过95%触发重大告警;当告警系统检测到文件系统超过85% (中等告警)和90% (严重告警)时,触发短信提醒;当达到95% (重大告警)时,触发值班平台进行电话告警通知。
[0010]然而,上述告警系统使用的基于事件触发的固定阈值告警模式,由于I)使用统一的固定阀值,会产生大量的垃圾告警信息(一般告警和中等告警),但如果直接过滤掉这些低级别告警,也有可能一些潜在的告警会被忽略;2)同一监控指标,其变化率具有一定的随机性和突发性。对某些异常情况,所产生一般告警、中等告警时并未引起足够的重视,而从一般/中等告警发展到严重告警的实际时长比往常正常情况要短许多,达到严重告警时再处理很可能来不及;3)告警内容往往只是某个时间点的告警值,给出的信息量不足以协助管理员进行更进一步的判断;因此存在告警信息输出的有效性不高的问题。

【发明内容】
[0011]本发明实施例提供了一种告警事件信息处理方法及装置,用以解决现有的技术中输出的告警信息的有效性不高的问题。
[0012]本发明实施例提供的具体技术方案如下:
[0013]一种告警事件信息处理方法,所述方法包括:
[0014]告警事件信息处理装置采集告警事件信息,确定告警事件信息中的告警时间和告警值,所述告警事件信息中包含网元标识ID、该网元ID所表示的网元的告警事件类型、告警时间和该告警事件类型所表示的告警事件的告警值;
[0015]告警事件信息处理装置根据确定的预测模型参数和设定的预测模型对确定的告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的预测时长,所述预测时长是所述网元的告警事件类型所表示的告警事件由所述告警值变化为设定告警值需要的时间长度的估计值,所述设定的预测模型确定了告警时间和告警值之间的函数关系,所述预测模型参数是根据之前保存的告警事件信息中的告警时间和告警值确定的;
[0016]告警事件信息处理装置根据告警值确定所述网元ID所表示的网元对应的告警级别;
[0017]告警事件信息处理装置在告警级别达到设定级别时,输出告警信息,所述告警信息中包含网元ID、告警事件类型、告警时间、告警值和预测时长。
[0018]一种告警事件信息处理装置,所述装置包括:
[0019]采集模块,用于采集告警事件信息,确定告警事件信息中的告警时间和告警值,所述告警事件信息中包含网元标识ID、该网元ID所表示的网元的告警事件类型、告警时间和该告警事件类型所表示的告警事件的告警值;
[0020]预测时长确定模块,用于根据确定的预测模型参数和设定的预测模型对确定的告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的预测时长,所述预测时长是所述网元的告警事件类型所表示的告警事件由所述告警值变化为设定告警值需要的时间长度的估计值,所述设定的预测模型确定了告警时间和告警值之间的函数关系,所述预测模型参数是根据之前保存的告警事件信息中的告警时间和告警值确定的;
[0021]告警级别确定模块,用于根据确定的所述告警值确定所述网元ID所表示的网元对应的告警级别;
[0022]告警信息输出模块,用于在告警级别达到设定级别时,输出告警信息,所述告警信息中包含网元ID、告警事件类型、告警时间、告警值和预测时长。
[0023]本发明通过根据确定的预测模型参数和设定的预测模型对确定的告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的预测时长,并在告警达到设定级别时,输出包含用于表示告警事件由告警值变化为设定告警值需要的时间长度的估计值的预测时长,使得维护人员可以根据该预测时长来准确的确定告警事件的紧急程度,进而对该告警事件进行处理,也就是说,提高了告警信息输出的有效性。
【专利附图】

【附图说明】
[0024]图1为【背景技术】中的告警系统结构示意图;
[0025]图2为本发明实施例一中的告警信息处理方法流程示意图;
[0026]图3为本发明实施例一中告警状态机模型示意图;[0027]图4为本发明实施例三中的告警事件信息处理装置结构示意图。
【具体实施方式】
[0028]下面结合说明书附图,对本发明实施例提供的告警信息处理方法及装置的【具体实施方式】进行说明。
[0029]实施例一
[0030]如图2所示,为本发明实施例一的告警信息处理方法流程图,所述方法包括以下步骤:
[0031]步骤101:告警事件信息处理装置采集告警事件信息,确定告警事件信息中的告警时间和告警值。
[0032]所述告警事件信息中包含网元标识ID、该网元ID所表示的网元的告警事件类型、告警时间和该告警事件类型所表示的告警事件的告警值。
[0033]所述告警事件信息可以是从告警监控设备中采集的,告警监控设备可以对网元的状况进行监控,在大于设定的告警阈值时,输出告警事件信息。
[0034]步骤102:告警事件信息处理装置根据确定的预测模型参数和设定的预测模型对确定的所述告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的预测时长;
[0035]所述设定的预测模型确定了告警时间和告警值之间的函数关系,所述预测模型参数是根据之前保存的告警事件信息中的告警时间和告警值确定的;
[0036]所述预测时长是所述网元的告警事件类型所表示的告警事件由告警值变化为设定告警值需要的时间长度的估计值。
[0037]所述设定告警值可以根据实际需求进行设定,例如设置为被监控网元所能达到的
最大告警值。
[0038]本步骤102中在需要监控的网元或网元的告警事件类型较多时,可以设置一用于定义需管理和监控的告警事件信息的历史告警事件信息的数据库,建立历史告警事件信息库,在该历史告警事件信息库中定义某次产生的告警事件信息,可以包括网元ID、告警事件类型、告警采集时间、告警值。其中,告警采集时间也即为告警时间。
[0039]以某一文件系统的告警事件信息为例,其历史告警事件信息可以如表(1)所示:
[0040]
【权利要求】
1.一种告警事件信息处理方法,其特征在于,所述方法包括: 告警事件信息处理装置采集告警事件信息,确定告警事件信息中的告警时间和告警值,所述告警事件信息中包含网元标识ID、该网元ID所表示的网元的告警事件类型、告警时间和该告警事件类型所表示的告警事件的告警值; 告警事件信息处理装置根据确定的预测模型参数和设定的预测模型对确定的告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的预测时长,所述预测时长是所述告警事件类型所表示的告警事件由所述告警值变化为设定告警值需要的时间长度的估计值,所述设定的预测模型确定了告警时间和告警值之间的函数关系,所述预测模型参数是根据之前保存的告警事件信息中的告警时间和告警值确定的; 告警事件信息处理装置根据确定的所述告警值确定所述网元ID所表示的网元对应的告警级别; 告警事件信息处理装置在告警级别达到设定级别时,输出告警信息,所述告警信息中包含网元ID、告警事件类型、告警时间、告警值和预测时长。
2.如权利要求1所述的方法,其特征在于,所述预测时长包括第一预测时长和第二预测时长,所述第一预测时长是所述告警事件由所述告警值以正常的变化速度变化为设定告警值需要的时间长度的估计值;所述第二预测时长是所述告警事件由所述告警值以最快的变化速度变化为设定告警值需要的时间长度的估计值。
3.如权利要求2所述的方法,其特征在于,所述方法还包括: 告警事件信息处理装置在告警级别未达到设定级别但第二预测时长小于设定时长时,输出告警信息。
4.如权利要求3所述的方法,其特征在于,所述方法还包括: 告警事件信息处理装置在告警级别未达到设定级别且第二预测时长不小于设定时长时,执行以下操作: 告警事件信息处理装置根据第二预测时长确定告警轮询的采集步长; 告警事件信息处理装置以所述采集步长为采集时间间隔采集告警事件信息设定次数; 告警事件信息处理装置利用采集的告警事件信息对所述预测模型参数进行更新; 告警事件信息处理装置将更新后的预测模型参数作为确定的预测模型参数,将最近一次采集的告警事件信息中包含的告警时间和告警值作为确定的告警时间和告警值,并执行所述告警事件信息处理装置根据确定的预测模型参数和设定的预测模型对确定的告警时间和告警值进行处理的步骤。
5.如权利要求2所述的方法,其特征在于,所述设定的模型包括线性拟合预测模型和最劣情况预测模型,告警事件信息处理装置根据确定的线性拟合模型参数和设定的线性拟合模型对所述告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的第一预测时长;告警事件信息处理装置根据确定的最劣情况预测模型参数和最劣情况预测模型对所述告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的第二预测时长。
6.如权利要求5所述的方法,其特征在于, 所述线性拟合预测模型为K = A+pXT ; 所述最劣情况预测模型为K=B+p’ XT ;其中:T为告警时间,K为告警值、P为线性拟合增长率,通过公式
7.如权利要求4所述的方法,其特征在于,所述根据第二预测时长确定告警轮询的采集步长,具体为:
8.一种告警事件信息处理装置,其特征在于,所述装置包括: 采集模块,用于采集告警事件信息,确定告警事件信息中的告警时间和告警值,所述告警事件信息中包含网元标识ID、该网元ID所表示的网元的告警事件类型、告警时间和该告警事件类型所表示的告警事件的告警值; 预测时长确定模块,用于根据确定的预测模型参数和设定的预测模型对确定的告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的预测时长,所述预测时长是所述网元的告警事件类型所表示的告警事件由所述告警值变化为设定告警值需要的时间长度的估计值,所述设定的预测模型确定了告警时间和告警值之间的函数关系,所述预测模型参数是根据之前保存的告警事件信息中的告警时间和告警值确定的; 告警级别确定模块,用于根据确定的所述告警值确定所述网元ID所表示的网元对应的告警级别; 告警信息输出模块,用于在告警级别达到设定级别时,输出告警信息,所述告警信息中包含网元ID、告警事件类型、告警时间、告警值和预测时长。
9.如权利要求8所述的装置,其特征在于,所述预测时长包括第一预测时长和第二预测时长,所述第一预测时长是所述告警事件由所述告警值以正常的变化速度变化为设定告警值需要的时间长度的估计值;所述第二预测时长是所述告警事件由所述告警值以最快的变化速度变化为设定告警值需要的时间长度的估计值。
10.如权利要求9所述的装置,其特征在于, 所述告警信息输出模块,还用于在告警级别未达到设定级别但第二预测时长小于设定时长时,输出告警信息。
11.如权利要求10所述的装置,其特征在于, 所述告警信息输出模块,还用于在告警级别未达到设定级别且第二预测时长不小于设定时长时,执行以下操作:根据第二预测时长确定告警轮询的采集步长,以所述采集步长为采集时间间隔采集告警事件信息设定次数,利用采集的告警事件信息对所述预测模型参数进行更新,将更新后的预测模型参数作为确定的预测模型参数,将最近一次采集的告警事件信息中包含的告警时间和告警值作为确定的告警时间和告警值,并触发预测时长确定模块。·
【文档编号】H04L12/24GK103856344SQ201210518655
【公开日】2014年6月11日 申请日期:2012年12月5日 优先权日:2012年12月5日
【发明者】方梅晶, 赵贺, 王春艳, 丁健, 杨海威, 姜宏岩 申请人:中国移动通信集团北京有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1