快速确定网络合理告警阈值的系统和方法

文档序号:8945604阅读:1190来源:国知局
快速确定网络合理告警阈值的系统和方法
【技术领域】
[0001]本发明属于网络监控领域,具体为一种快速确定网络合理告警阈值的系统和方法。
【背景技术】
[0002]随着社会科技的发展,网络已成为企业,尤其是金融企业不可或缺的核心组成部分。如今企业的业务量呈几何倍数的增长,企业网络的规模也经历了爆炸性的拓展。其主要特点是:网络拓扑结构复杂;网络设备分布广泛;业务类型种类繁多。诸如银行、证券公司、交易所等企业对于数据传输的响应时间和信息的准确性及保密性有着严苛的要求。
[0003]当现实网络出现问题之后,需要网络管理系统迅速并准确地呈现告警情况以供运维人员进行故障定位并采取措施恢复网络,因此在网络管理中告警管理成为了最重要的基本功能之一。然而,在实际操作中如何确定网络管理系统中的告警阈值却成为了网络管理者最为头痛的问题。其主要原因是:网络拓扑中通过各个网络节点的数据流量不尽相同,有的差距悬殊,因此不能用统一的标准来判断所有的网络设备上的流量是否异常。
[0004]现在一般确定各个节点告警阈值的方法是:需要网络管理者在现实业务中通过一段时间的观察后(为了尽可能得到可靠、准确的数据信息,时间会很长),统计数据信息列表并制作图表,经过复杂的比较、统计得出一个初始值,最终根据个人对于网络或者业务的运维经验来判断该节点的告警阈值是否合理。
[0005]这样的方法既浪费了大量的人力和时间,还需要实际操作者有很强的运维业务能力和经验。

【发明内容】

[0006]针对现有技术中的缺陷,本发明的目的是提供一种快速确定网络合理告警阈值的系统和方法。本发明要解决的技术问题体现在以下几点:
[0007]I)如何根据业务不同的特征进行告警模拟;
[0008]2)如何加速告警模拟过程;
[0009]3)如何为用户合理确定的告警阈值范围以及准确计算告警数提供可视化、实时、便捷的统计数据。
[0010]根据本发明提供的一种快速确定网络合理告警阈值的系统,包括如下装置:
[0011]Web呈现组件,用于设置告警模拟模板的模板类型和模板参数;
[0012]工作组件,用于根据告警模拟模板,生成告警模拟任务;
[0013]任务组件,用于执行告警模拟任务产生数据结果集;
[0014]存储组件,用于存储并向呈现组件提供数据结果集。
[0015]优选地,所述模板类型,包括如下任一种或任多种类型:
[0016]-网络比特率;
[0017]-网络字节率;
[0018]-网络流量;-带宽利用率;
[0019]-数据包数;
[0020]-数据包率;
[0021]-平均包长;
[0022]-包长分布;
[0023]-TCP 会话;
[0024]-并发连接数;
[0025]-零窗口数;
[0026]-并发客户端数;
[0027]-包中继数;
[0028]-建联成功率;
[0029]-丢包数;
[0030]-数据包重传率;
[0031]-TCP SYN 包数;
[0032]-TCP FIN 包数;
[0033]-TCP RST 包数;
[0034]-TCP重传包数;
[0035]-TCP零窗口包数;
[0036]-TCP服务器响应时间;
[0037]-TCP客户端等待时间;
[0038]-TCP服务器数据传输时间;
[0039]-TCP客户端数据传输时间;
[0040]-TCP到客户端的网络时延;
[0041]-TCP到服务器的网络时延;
[0042]-TCP长连接超时数;
[0043]-交易量;
[0044]-交易响应率;
[0045]-交易成功率;
[0046]-交易响应时间;所述模板参数,包括如下任一种或任多种参数:
[0047]-历史数据源;
[0048]-告警类型;
[0049]-触发条件;
[0050]-持续时间;
[0051]-排期;
[0052]-告警模拟时间范围;
[0053]-时间颗粒度。
[0054]优选地,所述任务组件,包括如下装置:
[0055]第一处理装置,用于根据告警模拟任务对应的模板类型,从存储组件获取第一时间段的历史数据信息;
[0056]第二处理装置,用于将第一时间段的历史数据信息按照时间划分成多个第二时间段的历史数据信息,其中,第二时间段是第一时间段的子时间段;
[0057]第三处理装置,用于对所述多个第二时间段的历史数据信息并行统计,得到多个子统计结果;
[0058]第四处理装置,用于将所述多个子统计结果按照时间聚合成聚合统计结果;
[0059]第五处理装置,用于将聚合统计结果与阈值区间进行比较,得到告警数。
[0060]优选地,所述第五处理装置包括如下装置:
[0061]第六处理装置,用于根据模板参数中的时间颗粒度参数从所述聚合统计结果中采集出多个数据点;
[0062]第七处理装置,用于对所述数据点进行曲线拟合,得到数据曲线;
[0063]第八处理装置,用于统计数据曲线超出阈值区间的各个连续线段所对应的时间T ;将所对应的时间T大于模板参数中的持续时间参数的连续线段的数量作为告警数。
[0064]优选地,所述第七处理装置根据第六处理装置已采集到的数据点,实时得到数据曲线;
[0065]所述第八处理装置根据第七处理装置已拟合得到的数据曲线,实时得到告警数。
[0066]优选地,所述数据曲线通过拟合的每一个数据点。
[0067]优选地,所述呈现组件,还用于:
[0068]-派发告警模拟模板给工作组件并提出告警模拟任务请求;
[0069]-异步轮询工作组件告警模拟任务状态;如果得到告警模拟任务状态是已完成任务,则通过工作组件号来调取存储组件中相应的数据结果集。
[0070]其中,呈现组件提出告警模拟任务请求,具体执行的步骤包括:
[0071]步骤Al:根据用户通过页面设置的模板类型及模板参数生成相对应的数据表单;
[0072]步骤A2:根据数据表单与对应的数据源端口进行匹配;
[0073]步骤A3:如果匹配成功,则派发数据表单到工作组件缓存区域;如果匹配失败,则返回失败信息给呈现组件;
[0074]步骤A4:根据匹配结果生成若干工作组并调取缓存区域中的数据表单,其中,当工作组的数量为多个时,多个工作组并发处理任务;
[0075]其中,呈现组件异步轮询工作组件告警模拟任务状态,具体执行的步骤包括:
[0076]步骤B1:呈现组件根据预设的时间间隔不停地产生工作组件状态查询请求任务;
[0077]步骤B2:若同时有多个工作组件在工作,则根据负载均衡算法选择出最合适的工作组件;
[0078]步骤B3:每次的工作组件状态查询请求任务根据工作组号作为标示来区分,派发工作组号信息给已选择的工作组件;其中,工作组件保持和呈现组件轮询相同的频率返回模拟告警任务状态给呈现组件;其中,所述模拟告警任务状态,包括:已接受任务但未处理、正在处理任务、已完成任务。
[0079]优选地,所述工作组件,还用于:
[0080]-根据呈现组件的告警模拟任务请求的模板类型生成相应的任务类型传递给任务组件;
[0081]-不断读取存储组件中的数据结果集来确定模拟告警任务状态;
[0082]-将模拟告警任务状态返回给呈现组件;
[0083]其中,工作组件生成相应的任务类型,具体执行的步骤包括:
[0084]步骤Cl:根据呈现组件生成的告警模拟任务请求的任务类型接收对应的数据表单;
[0085]步骤C2:根据数据表单内容生成对应的任务信息;
[0086]步骤C3:提交任务信息并生成预处理任务到任务队列中,供任务组件调度任务队列中的预处理任务;
[0087]其中,工作组件读取存储组件中的数据结果集,具体执行的步骤包括:
[0088]步骤Dl:根据工作组号匹配数据库中对应的数据结果集并查询结果;
[0089]步骤D2:存储组件把即时的数据结果
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1