本发明涉及网络通信技术领域,具体涉及一种通信网络故障定位方法及故障监测装置。
背景技术:
通信网络故障是指由于硬件的问题、软件的漏洞、病毒的侵入等引起网络无法提供正常服务或降低服务质量的状态。当通信网络发生故障时,将故障现象作为异常信号向网络管理系统上报,并记录在报表中。网络维护人员根据报表中所记录的异常信号及其自身经验评价故障成因、等级并进行定位。
一般情况下,大规模通信网络的管理系统接收故障信息较为频繁,因此耗费了大量专业的人力资源予以分析,不仅效率较低,而且人工的分析工作可能存在错误。此外,由于上报的信息是基于软件自动抓取得到的,并未根据故障类别、层级加以区分,因此相互之间存在着重复、冗余、掩盖等问题,造成网络故障的真实成因难以得到定位。针对此类问题,现有技术的研究者尝试围绕通信网络故障开发自动的定位方法,例如,通过软件工具对异常数据进行统计,根据错误类别、发生时间、ip位点等信息将错误数据进行分类汇总,筛除因通信延时而造成的重复上报行为,从而将大量冗余错误信息汇总形成关键错误进行,因而避免了重复性劳动。再例如,实时监测连接到通信网络的各终端系统日志,以便分别监测单位时间内访问行为发生频率,根据设定的阈值确定其异常程度,从而向工作人员给出可量化的故障指标,为后续的人工分析提供参考。
尽管上述方法在一定程度上降低了故障分析的工作量,但根本上仍需要人员根据异常特征进行故障定位,在这种情况下,如果能基于软件工具实现故障的自动定位,则有望提高故障排查效率,提高通信网络安全性。
技术实现要素:
本发明旨在针对现有技术的技术缺陷,提供一种通信网络故障定位方法及故障监测装置,以解决现有技术难以根据异常特征对网络故障实现自动定位的技术问题。
本发明要解决的另一技术问题是现有技术中缺乏一种能对通信网络故障实现自动定位的监测装置。
为实现以上技术目的,本发明采用以下技术方案:
本发明首先提供了一种通信网络故障定位方法,包括:
与通信网络管理系统连接,抓取错误数据报表信息,并根据上报时间对各错误数据赋值;
计算同类错误数据首次至末次发生时间段内访问量数据;
确定所述访问量最小峰值以及同类错误上报量最大峰值同时发生的时间点,获取该时间点网络参数;
将发生所述同类错误的步骤过程拆分为若干访问行为;
在模拟终端中以所述网络参数重复执行所述访问行为,收集发生同类错误的访问行为及其频次。
作为优选,还包括:在数据库中写入阈值,将在模拟终端所收集到的错误数据写入数据库并与所述阈值比较,当不满足阈值条件时,再次在模拟终端中以所述网络参数重复执行所述访问行为,收集发生同类错误的访问行为及其频次。
作为优选,还包括:将所述发生同类错误的访问行为的频次排序,将占总错误数量超过40%的访问行为上报所述通信网络管理系统。
作为优选,还包括:根据上报错误数据的ip地址,对各错误数据赋值;在计算同类错误上报量时,将相同ip的同类错误发生次数归一。
作为优选,所述确定所述访问量最小峰值以及同类错误上报量最大峰值同时发生的时间点,是计算任一时间点的同类错误上报量与访问量的差值,确定该差值最大的时间点。
在此基础上,本发明进一步提供了一种通信网络故障监测装置,包括:
错误数据获取单元:用于与通信网络管理系统连接,抓取错误数据报表信息,并根据上报时间对各错误数据赋值;
访问量获取单元:用于计算同类错误数据首次至末次发生时间段内访问量数据;
网络环境确定单元:用于确定所述访问量最小峰值以及同类错误上报量最大峰值同时发生的时间点,获取该时间点网络参数;
分步模拟单元:用于将发生所述同类错误的步骤过程拆分为若干访问行为;
环回测试单元:在模拟终端中以所述网络参数重复执行所述访问行为,收集发生同类错误的访问行为及其频次。
作为优选,还包括测试校正单元,用于在数据库中写入阈值,将在模拟终端所收集到的错误数据写入数据库并与所述阈值比较,当不满足阈值条件时,再次在模拟终端中以所述网络参数重复执行所述访问行为,收集发生同类错误的访问行为及其频次。
作为优选,还包括结论上报单元:用于将所述发生同类错误的访问行为的频次排序,将占总错误数量超过40%的访问行为上报所述通信网络管理系统。
作为优选,还包括数据清洗单元:用于根据上报错误数据的ip地址,对各错误数据赋值;在计算同类错误上报量时,将相同ip的同类错误发生次数归一。
作为优选,所述确定所述访问量最小峰值以及同类错误上报量最大峰值同时发生的时间点,是计算任一时间点的同类错误上报量与访问量的差值,确定该差值最大的时间点。
本发明提供了一种通信网络故障定位方法及故障监测装置。该技术方案首先从通信网络管理系统的错误日志中抓取数据,并将上报时间同错误类别进行关联,同时,以此类错误发生的峰值为时间区间,获取各时间点的网络访问量,将该访问量与错误发生率进行比较,从而得到关键时间节点,该时间节点内的网络环境对发生此类错误具有更大潜在影响。在此基础上,本发明将发生同类错误的步骤过程拆分为若干访问行为,并利用终端设备在上述网络环境下对各访问行为进行重复测试,收集发生同类错误的访问行为及其频次,从而确定故障位置。本发明通过试错的方式确定通信网络故障,并充分还原了网络环境,对故障定位更加准确。应用本发明,可对通信网络故障实现有效的监测和定位,具良好的使用效果。
附图说明
图1是本发明的方法流程图;
图2是本发明装置的系统结构图。
具体实施方式
以下将对本发明的具体实施方式进行详细描述。为了避免过多不必要的细节,在以下实施例中对属于公知的结构或功能将不进行详细描述。以下实施例中所使用的近似性语言可用于定量表述,表明在不改变基本功能的情况下可允许数量有一定的变动。除有定义外,以下实施例中所用的技术和科学术语具有与本发明所属领域技术人员普遍理解的相同含义。
实施例1
通信网络故障定位方法,包括:
与通信网络管理系统连接,抓取错误数据报表信息,并根据上报时间对各错误数据赋值;
计算同类错误数据首次至末次发生时间段内访问量数据;
确定所述访问量最小峰值以及同类错误上报量最大峰值同时发生的时间点,获取该时间点网络参数;
将发生所述同类错误的步骤过程拆分为若干访问行为;
在模拟终端中以所述网络参数重复执行所述访问行为,收集发生同类错误的访问行为及其频次。
在此基础上,还包括:在数据库中写入阈值,将在模拟终端所收集到的错误数据写入数据库并与所述阈值比较,当不满足阈值条件时,再次在模拟终端中以所述网络参数重复执行所述访问行为,收集发生同类错误的访问行为及其频次。
还包括:将所述发生同类错误的访问行为的频次排序,将占总错误数量超过40%的访问行为上报所述通信网络管理系统。
还包括:根据上报错误数据的ip地址,对各错误数据赋值;在计算同类错误上报量时,将相同ip的同类错误发生次数归一。
所述确定所述访问量最小峰值以及同类错误上报量最大峰值同时发生的时间点,是计算任一时间点的同类错误上报量与访问量的差值,确定该差值最大的时间点。
一种通信网络故障监测装置,包括:
错误数据获取单元:用于与通信网络管理系统连接,抓取错误数据报表信息,并根据上报时间对各错误数据赋值;
访问量获取单元:用于计算同类错误数据首次至末次发生时间段内访问量数据;
网络环境确定单元:用于确定所述访问量最小峰值以及同类错误上报量最大峰值同时发生的时间点,获取该时间点网络参数;
分步模拟单元:用于将发生所述同类错误的步骤过程拆分为若干访问行为;
环回测试单元:在模拟终端中以所述网络参数重复执行所述访问行为,收集发生同类错误的访问行为及其频次。
其中,还包括测试校正单元,用于在数据库中写入阈值,将在模拟终端所收集到的错误数据写入数据库并与所述阈值比较,当不满足阈值条件时,再次在模拟终端中以所述网络参数重复执行所述访问行为,收集发生同类错误的访问行为及其频次。还包括结论上报单元:用于将所述发生同类错误的访问行为的频次排序,将占总错误数量超过40%的访问行为上报所述通信网络管理系统。还包括数据清洗单元:用于根据上报错误数据的ip地址,对各错误数据赋值;在计算同类错误上报量时,将相同ip的同类错误发生次数归一。所述确定所述访问量最小峰值以及同类错误上报量最大峰值同时发生的时间点,是计算任一时间点的同类错误上报量与访问量的差值,确定该差值最大的时间点。
实施例2
通信网络故障定位方法,如图1所示,包括:
s110:与通信网络管理系统连接,抓取错误数据报表信息,并根据上报时间对各错误数据赋值;
s120:计算同类错误数据首次至末次发生时间段内访问量数据;
s130:确定所述访问量最小峰值以及同类错误上报量最大峰值同时发生的时间点,获取该时间点网络参数;
s140:将发生所述同类错误的步骤过程拆分为若干访问行为;
s150:在模拟终端中以所述网络参数重复执行所述访问行为,收集发生同类错误的访问行为及其频次。
一种通信网络故障监测装置,如图2所示,包括:
110:错误数据获取单元:用于与通信网络管理系统连接,抓取错误数据报表信息,并根据上报时间对各错误数据赋值;
120:访问量获取单元:用于计算同类错误数据首次至末次发生时间段内访问量数据;
130:网络环境确定单元:用于确定所述访问量最小峰值以及同类错误上报量最大峰值同时发生的时间点,获取该时间点网络参数;
140:分步模拟单元:用于将发生所述同类错误的步骤过程拆分为若干访问行为;
150:环回测试单元:在模拟终端中以所述网络参数重复执行所述访问行为,收集发生同类错误的访问行为及其频次。
以上对本发明的实施例进行了详细说明,但所述内容仅为本发明的较佳实施例,并不用以限制本发明。凡在本发明的申请范围内所做的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。