本发明涉及网络监控,尤指一种网络监控方法及装置。
背景技术:
1、本部分旨在为本文中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
2、随着5g、软件定义接入网以及核心网技术的发展,大型企业的网络设备越来越多,种类越来越繁杂,对于网络基础环境的监控愈加重要。在网络监控领域,现有技术的网络监控方法应用于大型企业、数据中心等,经常出现问题发现慢、故障定位不及时等问题。在网络监控运维领域,运维人员习惯于关注单台设备的运行情况,但在实际生产运行中往往出现业务层影响已发生却无法快速定位到具体网络设备的情况。现有技术中的网络监控系统对网络数据的监控和预警,一般应用设置静态基准门限的方法,对网络中出现的异常情况进行分析,即对网络数据设置固定门限值,若当前网络指标数据超出门限值则产生告警,如果没有超出上述门限值,则视为网络正常。但由于门限值一般是该专业的人员根据经验人工设置的,所以存在很大的误差,不准确。且采用静态门限方法,对于具有波动特性的数据,并不能及时地、准确地反映出网络的异常状况。且无法直观的展示整体网络环境运行情况,无法提供更高效的故障排查手段。
技术实现思路
1、为解决现有技术存在的问题,本发明提出了一种网络监控方法及装置。本发明能够提升网络监控的故障发现及定位效率,提高监控告警准确率。
2、本发明实施例提供一种网络监控方法,包括:
3、获取网络监控系统采集的设备性能指标数据;所述设备性能指标数据的类别为对历史设备性能数据是否反映网络质量进行分析确定的;
4、判断设备性能指标数据是否超出告警阈值,若是,生成告警信息;所述告警阈值为利用历史设备性能指标数据对预设机器学习模型进行训练得到的;
5、接收对展示维度进行选择的指令;展示维度包括设备部署地、设备所属网络区域、设备类型、设备运维组别及自定义维度的其中一种或任意组合;
6、按照预设时间频率,利用flink流式计算组件计算选择的展示维度对应的设备数量、设备端口数量、流量峰值、错包峰值、丢包峰值、温度峰值、风扇异常数量、告警数量,根据展示维度进行展示;
7、根据预先配置的故障数据库对告警信息进行故障识别;所述故障数据库包括异常设备性能指标数据与故障的对应关系;
8、确定设备的故障数量;
9、在接收到对故障的查询请求后,根据设备的故障数量对设备进行排序。
10、本发明实施例还提供一种网络监控装置,包括:
11、获取模块,用于获取网络监控系统采集的设备性能指标数据;所述设备性能指标数据的类别为对历史设备性能数据是否反映网络质量进行分析确定的;
12、告警信息生成模块,用于判断设备性能指标数据是否超出告警阈值,若是,生成告警信息;所述告警阈值为利用历史设备性能指标数据对预设机器学习模型进行训练得到的;
13、接收模块,接收对展示维度进行选择的指令;展示维度包括设备部署地、设备所属网络区域、设备类型、设备运维组别及自定义维度的其中一种或任意组合;
14、展示模块,用于按照预设时间频率,利用flink流式计算组件计算选择的展示维度对应的设备数量、设备端口数量、流量峰值、错包峰值、丢包峰值、温度峰值、风扇异常数量、告警数量,根据展示维度进行展示;
15、故障识别模块,用于根据预先配置的故障数据库对告警信息进行故障识别;所述故障数据库包括异常设备性能指标数据与故障的对应关系;
16、故障数量确定模块,用于确定设备的故障数量;
17、排序模块,用于在接收到对故障的查询请求后,根据设备的故障数量对设备进行排序。
18、本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现网络监控方法。
19、本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现网络监控方法。
20、本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现网络监控方法。
21、本发明实施例与现有技术中应用静态基准门限进行网络监控的方案相比,通过获取网络监控系统采集的设备性能指标数据;所述设备性能指标数据的类别为对历史设备性能数据是否反映网络质量进行分析确定的;判断设备性能指标数据是否超出告警阈值,若是,生成告警信息;所述告警阈值为利用历史设备性能指标数据对预设机器学习模型进行训练得到的;接收对展示维度进行选择的指令;展示维度包括设备部署地、设备所属网络区域、设备类型、设备运维组别及自定义维度的其中一种或任意组合;按照预设时间频率,利用flink流式计算组件计算选择的展示维度对应的设备数量、设备端口数量、流量峰值、错包峰值、丢包峰值、温度峰值、风扇异常数量、告警数量,根据展示维度进行展示;根据预先配置的故障数据库对告警信息进行故障识别;所述故障数据库包括异常设备性能指标数据与故障的对应关系;确定设备的故障数量;在接收到对故障的查询请求后,根据设备的故障数量对设备进行排序,能够提升网络监控的故障发现及定位效率,提高监控告警准确率。
1.一种网络监控方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,还包括:
3.如权利要求1所述的方法,其特征在于,还包括:
4.如权利要求1所述的方法,其特征在于,所述设备性能指标数据包括:设备数量、设备端口数量、流量峰值和总和、错包峰值、丢包峰值、温度峰值、风扇异常数量的其中一种或任意组合。
5.如权利要求1所述的方法,其特征在于,所述设备性能指标数据是由网络监控系统通过性能采集协议实时采集的;所述性能采集协议包括:snmp、ping、rping、telemetry其中之一或任意组合。
6.如权利要求1所述的方法,其特征在于,还包括:
7.一种网络监控装置,其特征在于,包括:
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一所述方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至6任一所述方法。
10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至6任一所述方法。