一种基于日志分析的网络品质工单故障预警方法与流程

文档序号:29568215发布日期:2022-04-09 03:07阅读:219来源:国知局
一种基于日志分析的网络品质工单故障预警方法与流程

1.本发明属于计算机网络技术领域,具体涉及一种基于日志分析的网络品质工单故障预警方法。


背景技术:

2.随着信息产业的飞速发展,广域网上承载的业务种类和业务量在不断增大,规模也不断在扩大,大量的终端接入设备被广泛应用。与此同时,网络系统也变得越来越大和复杂,它们通常包含部署在不同城市地域的数千台甚至数万台网络设备,为了保障网络系统在各城市地域的相关网络服务的顺利进行,有必要对各网络设备的网络品质进行监测,并在发生网络故障时及时进行处理。然而,目前对于网络设备的运维是一种被动运维,即在发生故障后,通过工单故障反映到相关部门,再由相关部门指派技术人员进行故障排查和恢复,从故障产生到恢复往往需要花费很长的时间。如果能够对网络系统在不同城市地域的不同时段内的工单故障进行预警,使相关人员在工单故障发生前提高监测力度,从而快速发现问题以解决可能产生的故障,无疑会极大地提高网络系统的服务效率。


技术实现要素:

3.本发明针对现有技术中的不足,提供一种基于日志分析的网络品质工单故障预警方法,采用的技术方案如下:
4.一种基于日志分析的网络品质工单故障预警方法,包括以下步骤:
5.步骤1:构建日志服务器,用于接收各区域中若干网络设备的网络品质指标监测值;
6.步骤2:为每个网络设备设定指标阈值,若每个网络设备的网络品质指标监测值大于其指标阈值,则将该网络品质指标监测值称为指标异常值;
7.步骤3:对日志服务器中的网络品质指标监测值进行分区域、分时段分析,分别统计每天各区域中每个时段内每个网络设备的指标异常值发生次数,并记录对应区域的对应时段内是否产生故障工单;
8.步骤4:构建统计数据库,用于存储步骤3中的统计信息;统计数据库中包含每个区域中每个时段内每个网络设备指标异常值的发生次数及有无故障工单产生;
9.步骤5:根据统计数据库中的统计信息,计算工单故障的统计模型参数,包括各区域中每个时段的工单故障产生概率、各区域中每个时段产生工单故障时各网络设备的指标异常值发生次数的均值、各区域中每个时段各网络设备的故障贡献率;
10.步骤6:结合步骤5中获取到的统计模型参数,根据统计数据库中第n天的统计信息,计算第n+1天各区域各时段工单故障的产生概率;
11.步骤7:根据第n+1天各区域各时段工单故障的产生概率,通过设定不同预警阈值划分预警等级。
12.进一步地,步骤5中,各区域中每个时段的工单故障产生概率的计算公式为:
[0013][0014]
其中,p
故障
(ai,tj)表示ai区域tj时段的工单故障产生概率,m表示统计天数,每天每时段统计一次,m(ai,tj)表示ai区域tj时段产生工单故障的次数。
[0015]
进一步地,步骤5中,将各区域中每个时段产生工单故障时各网络设备的指标异常值发生次数的均值,记为指标异常次数均值,其计算公式为:
[0016][0017]
其中,表示ai区域tj时段产生工单故障时第v个网络设备的指标异常次数均值,表示ai区域tj时段统计到的第u个工单故障时第v个网络设备的指标异常次数,假设m天共统计到u个工单故障。
[0018]
进一步地,步骤5中,各区域中每个时段各网络设备的故障贡献率的计算公式为:
[0019][0020]
其中,α(ai,tj,v)表示ai区域tj时段第v个网络设备的故障贡献率,表示ai区域tj时段第v个网络设备的指标异常次数均值,假设ai区域中共有v个网络设备。
[0021]
进一步地,步骤6中,第n+1天ai区域tj时段工单故障的产生概率的计算方法为:
[0022]
首先,分别计算ai区域tj时段每个网络设备的故障概率:
[0023][0024]
然后,计算第n+1天ai区域tj时段工单故障的产生概率p
n+1
(ai,tj),
[0025][0026]
其中,p(ai,tj,v)表示ai区域tj时段第v个网络设备的故障概率,dn(ai,tj,v)表示第n天统计到的ai区域tj时段第v个网络设备的指标异常次数。
[0027]
进一步地,步骤7中,若p
n+1
(ai,tj)>β1,则进行轻度预警;若p
n+1
(ai,tj)>β2,则进行中度预警;若p
n+1
(ai,tj)>β3,则进行重度预警;β1、β1、β1为不同的预警阈值,且β1<β2<β3。
[0028]
本发明的有益效果是:相比于现有技术,本发明通过日志分析,利用网络系统在不同地域不同时段内各网络设备的历史指标监测值和历史工单故障信息建立统计模型,能够对各地域不同时段的网络品质故障工单进行预警,有助于提高网络系统的运维效率,进而提高网络系统的整体服务效率。
附图说明
[0029]
图1为本发明方法的流程示意图。
具体实施方式
[0030]
现在结合附图对本发明作进一步详细的说明。
[0031]
如图1所示,本发明主要包括以下步骤:
[0032]
(1)构建日志服务器,用于接收各区域中若干网络设备每天的网络品质指标监测值,如网络延迟等。
[0033]
(2)为每个网络设备设定指标阈值,若每个网络设备的网络品质指标监测值大于其指标阈值,则将该网络品质指标监测值称为指标异常值。
[0034]
(3)对日志服务器中的网络品质指标监测值进行分区域、分时段分析,分别统计每天各区域中每个时段内每个网络设备的指标异常值发生次数,并记录对应区域的对应时段内是否产生故障工单。
[0035]
(4)构建统计数据库,用于存储步骤(3)中的统计信息;统计数据库中包含每个区域中每个时段内每个网络设备指标异常值的发生次数及有无故障工单产生。
[0036]
(5)根据统计数据库中的统计信息,计算工单故障的统计模型参数。
[0037]
计算各区域中每个时段的工单故障产生概率:
[0038][0039]
其中,p
故障
(ai,tj)表示ai区域tj时段的工单故障产生概率,m表示统计天数,每天每时段统计一次,m(ai,tj)表示ai区域tj时段产生工单故障的次数。
[0040]
将各区域中每个时段产生工单故障时各网络设备的指标异常值发生次数的均值,记为指标异常次数均值,其计算公式为:
[0041][0042]
其中,表示ai区域tj时段产生工单故障时第v个网络设备的指标异常次数均值,表示ai区域tj时段统计到的第u个工单故障时第v个网络设备的指标异常次数,假设m天共统计到u个工单故障。
[0043]
计算各区域中每个时段各网络设备的故障贡献率:
[0044][0045]
其中,α(ai,tj,v)表示ai区域tj时段第v个网络设备的故障贡献率,表示ai区域tj时段第v个网络设备的指标异常次数均值,假设ai区域中共有v个网络设备。
[0046]
(6)结合步骤5中获取到的概率模型参数,根据统计数据库中第n天的统计信息,计算第n+1天ai区域tj时段工单故障的产生概率:
[0047]
首先,分别计算ai区域tj时段每个网络设备的故障概率:
[0048][0049]
然后,计算第n+1天ai区域tj时段工单故障的产生概率p
n+1
(ai,tj),
[0050][0051]
其中,p(ai,tj,v)表示ai区域tj时段第v个网络设备的故障概率,dn(ai,tj,v)表示第n天统计到的ai区域tj时段第v个网络设备的指标异常次数。
[0052]
(7)根据第n+1天各区域各时段工单故障的产生概率,通过设定不同预警阈值划分预警等级:
[0053]
若p
n+1
(ai,tj)>β1,则进行轻度预警;
[0054]
若p
n+1
(ai,tj)>β2,则进行中度预警;
[0055]
若p
n+1
(ai,tj)>β3,则进行重度预警;
[0056]
其中,β1、β1、β1为不同的预警阈值,且β1<β2<β3。
[0057]
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1