一种基于网络管理系统的网络可用性分析方法与流程

文档序号:17048782发布日期:2019-03-05 19:49阅读:284来源:国知局
一种基于网络管理系统的网络可用性分析方法与流程

本发明涉及通信技术领域,具体涉及一种基于网络管理系统的网络可用性分析方法。



背景技术:

网络可用性是对于由若干条起始端到终端的网络链路组成的全网络而言的。网络可用性的优劣与这些网络链路中的设备间的通信是否良好有关,设备包括外调光发、野外型接收机,楼栋型接收机或光纤到户接收机等通信设备。网络可用性是指,全网能提供无中断服务的时间与全部运行时间之比,计算公式为:网络可用性a=(统计时间段内总时间t-网络服务中断的平均时间ti)/统计时间段内总时间t。网络服务中断的平均时间ti=每个终端用户的服务中断时间累加(t1+t2+……+tn)/用户总数m,n为网络中断次数,m为受到当前网络的用户总数。计算网络可用性需要获取的数据就是每个终端用户的服务中断时间t1、t2……tn和用户总数m,而因为网络可用性涉及的设备不同,用户总数就不同,所以设备的类型会影响可用性分析的结果。

广电网络运营对网络可用性的要求是要达到99.99%,这是衡量网络运营质量的最重要的指标,运维工作人员和管理层都需要关注这一指标。一般来说,网络可用性通过运维人员手动记录网络中断情况,然后进行汇总计算,但这样一般不够准确,记录的情况也不够完整,在回溯和总结时可能没有足够的信息支撑。

综上所述,提供一种新的可用性分析方法,提高网络运营的质量是亟需解决的问题。



技术实现要素:

本发明提供了一种基于网络管理系统的网络可用性分析方法,以提高网络运营的质量是亟需解决的问题。

第一方面,本发明提供了一种基于网络管理系统的网络可用性分析方法,应用于网络管理系统,包括以下步骤:

确定可用性分析涉及的设备,将所述设备录入网络管理系统中,并生成所述设备的编号;

根据所述设备的实际连接关系,绘制网络链路的拓扑图,所述每条网络链路上均至少包括一个设备;

确定每条网络链路上的最末端设备,最末端设备是指网络链路的最后一台,且输出端未连接任何设备的设备;

获取所有末端设备的用户数和告警门限值,所述告警门限值均包括高门限值和低门限值;

接收设备端发送的告警信息和告警解除信息;

确定网络范围和时间范围,根据告警信息和告警解除信息得到所选网络在所选时间内的网络服务中断时间和用户数,计算网络可用性。

第二方面本发明提供了一种基于网络管理系统的网络可用性分析方法,应用于设备端,包括以下步骤:

获取所有末端设备的用户数、编号和告警门限值,所述告警门限值均包括高门限值和低门限值;

判断实时输出参数值是否高于高门限值,或低于所述低门限;如果是,则生成第一告警信息,且向网络管理服务器发送trap信息,所述trap信息携带有所述实时时刻信息和设备编号信息;

判断实时输出参数值是否高于高门限值,或低于所述低门限,如果否,则生成第一告警解除信息并发送至网络管理服务器,所述第一告警解除信息携带有实时时刻信息和设备编号信息。

结合第一方面,本发明提供的一种基于网络管理系统的网络可用性分析方法,还包括以下步骤:

通过网络管理系统的snmp轮询机制实时获取所有末端设备的输出参数值;

判断所述输出参数值是否低于所述高门限值,且高于所述低门限;如果是,则生成第二告警信息,所述第二告警信息携带有实时时刻信息和设备编号信息;

判断所述实时输出参数值是否高于高门限值,或低于所述低门限,如果否,则生成第二告警解除信息并发送至网络管理服务器,所述第二告警解除信息携带有实时时刻信息和设备编号信息。

可见,本发明提供的可用性分析方法,利用网络管理系统,实现设备和链路的全网络管理,以最末端设备的参数变化作为网络中断的标志,并能获得准确的中断时间数据。运营人员利用本发明提供的方法,能够实时监控网络状态,计算得到网络可用性,帮助运维工作人员和管理层方便、快捷、准确地获取网络状态信息。并能有序将记录网络中断原因和排障方式,获得完整的运营数据,以便不断提升运营服务能力。

附图说明

为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用的附图作简单地介绍。

图1为本发明提供的基于网络管理系统的网络可用性分析方法的实施例的网络链路结构图;

图2为本发明提供的基于网络管理系统的网络可用性分析方法的实施流程示意图。

具体实施方式

本发明提供了一种基于网络管理系统的网络可用性分析方法,以下将结合附图,以实施例的方式具体说明。

本实施例利用本发明提供的可用性分析方法,计算可用性。本实施例的网络链路的结构图如图1所示,涉及到的设备有外调光发、edfa(掺饵光纤放大器)和光接收机。因为通过snmp网络管理系统,我们可以监控到网络中所有设备的参数、异常状态和时间信息,但在不能实现整个网络管理,即不能管理设备所在的网络,所以并不能完全准确的判断出服务中断的情况。但是,在网络管理系统上通过设备参数变化可以对服务中断进行预判,再让运维人员根据实际情况进行确认,就可以知道哪些情况是服务中断,而且,网络管理系统上本身可以记录发生服务中断的起始时间和结束时间的,那么就有了服务中断时间的数据。而用户数属于网络运营的基础资料。可见,基于网络管理系统对于设备的管理,需要建立设备参数变化和网络中断之间的关系。在网络可用性分析中,我们最需要关注的是每一条链路最末端设备的变化情况。当最末端设备的输出异常告警时,这时极有可能引起了服务中断。

以图1中的网络链路为可用性分析涉及的网络区域,请参考图2中的实施流程图,本实施例基于网络管理系统的网络可用性分析方法,包括以下步骤:

步骤s1,网络管理服务器确定可用性分析涉及的设备,将所述设备录入网络管理系统中,并生成所述设备的编号。编号是网络管理系统自动生成的,一个设备对应唯一一个编号。例如将光接收机编号为1#。

并根据所述设备的实际连接关系,绘制网络链路的拓扑图,每条网络链路上均至少包括一个设备。拓扑图可以包括n条网络链路。本实施例中将图1中涉及的设备录入到网络管理系统中,形成如图1所示的一条网络链路,即从外调光发到光接收机,可用性的分析对象此此条网络链路中的服务中断情况。将图1中的设备一一编号,该编号用于在计算该网络联络的可用性时,作为选定网络链路的一种方法,即通过选定设备的编号选定网络链路。

步骤s2,网络管理服务器确定每条网络链路上的最末端设备,最末端设备是指网络链路的最后一台,且输出端未连接任何设备的设备。可见,图1中的最末端设备就是光接收机。

步骤s3,网络管理服务器获取所有末端设备的用户数和告警门限值,所述告警门限值均包括高门限值和低门限值。有运营资料可知,1#为楼栋型接收机,默认用户数为50户,登记1#设备所覆盖的用户数为50。

步骤s4中,网络链路中的所有最末端设备端自行判断其实时输出参数值是否在告警门限内,告警门限值均包括高门限值和低门限值。高于高门限值,或低于所述低门限即为不在门限内,代表最末端设备输出异常。如果是,则在步骤s5中,生成第一告警信息,且向网络管理服务器发送trap信息,trap信息携带有所述实时时刻信息和设备编号信息。

本实施例中设置1#设备光接收机的告警门限,网络可用性计算中需要用到的是光接收机的输出电平值,假设光接收机的正常输出电平是105dbuv,我们将四级告警门限设置为120dbuv、115dbuv、95dbuv、90dbuv。如果实时输出电平高于高门限值120dbuv或115dbuv,或低于低门限95dbuv或90dbuv,代表最末端设备输出异常,该光接收机向网络管理系统发送trap信息,即主动上报。最末端设备发送的参数信息性能规格为小于1分钟,典型值为小于10s,即从网络中实际发生服务中断到网络管理系统中收到反馈信息的时延一般为10s内,最大60s,对可用性结果分析的影响非常小。trap上报一般是在10s内。

继续发出trap上报后,在步骤s6中,网络链路中的所有最末端设备端自行判断其实时输出参数值是否在告警门限内,在如果否,则在步骤s7中,生成第一告警解除信息,所述第一告警解除信息携带有实时时刻信息和设备编号信息。从告警产生到告警恢复是一条完整的告警记录。

网络管理系统中设备参数变化仅为网络中断的标志,还需运维人员根据实际情况判断是否确实是服务中断了,即对第一告警信息进行判断。如果运营人员未干涉,即默认引起了网络中断。这样就可以利用第一告警信息和第一告警解除信息其中携带的实时时刻信息确定网络服务中断时间,形成服务中断时间的数据。以及利用设备编号信息,获取网络链路归属和对应的用户数。运营人员可以在每次发生服务中断后,将此次中断的原因和解决的方式都记录在网络管理系统中,和告警设备、影响到的用户数和持续时间信息形成完整的网络中断记录,该记录可以帮助运维人员发现问题,改进运维工作,不断提升网络可用性。

步骤s8中,确定网络范围和时间范围,根据告警信息和告警解除信息得到所选网络在所选时间内的网络服务中断时间和用户数,计算网络可用性。确定网络范围是选择网络链路,可以有两种方式来实现。一是可以在网络链路拓扑图上点击链路两端选中,可多选;二是通过下拉框,单选或多选每一条网络链路的名称或编号。在此实施例中,我们选择的网络链路为单条链路,用户数等于光接收机1#覆盖的用户数。若选择的网络范围包括多条网络链路,统计总用户数由该网络范围内所有末端设备的覆盖用户数累加所得。

本实施例中,统计的是图1所示的1#光接收机这条网络链路的可用性、选择的时间范围是近一年。假如这一年中,光接收机的输出电平值发生了两次告警,这两次告警都引起了网络中断,告警持续时间可以在网络管理系统中查到,分别是5分钟和10分钟。那么计算这条网络链路的可用性过程如下:

统计时间段内总时间t=60*24*365=525600分钟,第一次服务中断时间t1=5分钟,此次服务中断涉及的用户数为50,第二次服务中断时间t1=10分钟,此次服务中断涉及的用户数为50,用户总数m=50。

网络服务中断的平均时间ti=每个终端用户的服务中断时间累加(t1+t2+……+tn)/用户总数m=(t1*50+t2*50)/50=15分钟

网络可用性a=(统计时间段内总时间t-网络服务中断的平均时间ti)/统计时间段内总时间t=(525600-15)/525600=99.997%。

在实际中,网络链路上的设备,并非全部都具有trap功能,对于这些设备,利用本发明提供的方法,基于网络管理系统进行可用性的实施流程与上述技术方案不同,在上述步骤s1-s3后,

在步骤sa中,通过轮询获得告警信息,即依次查询设备实时参数信息,然后判断所述输出参数值是否低于所述高门限值,且高于所述低门限;

如果否,则在步骤sb中,生成第二告警信息,所述第二告警信息携带有实时时刻信息和设备编号信息。

然后,在步骤sc中,判断所述实时输出参数值是否高于高门限值,或低于所述低门限,如果否,则在步骤sd中,生成第二告警解除信息并发送至网络管理服务器,所述第二告警解除信息携带有实时时刻信息和设备编号信息。

然后,运维人员根据实际情况判断是否确实是服务中断了,即对第二告警信息进行判断。如果运营人员未干涉,即默认引起了网络中断。这样就可以利用第二告警信息和第二告警解除信息其中携带的实时时刻信息确定网络服务中断时间,形成服务中断时间的数据。

通过轮询机制,得到的网络中断的起始时刻与trap自动上报不同,但是对可用性结果分析的影响非常小。

另外,对于具有trap功能的设备而言,trap信息送达网络管理系统时,可能会发生丢失,虽然丢失的概率较小,但是一旦丢失,因为得到的网络中断时间数据就不准确了,所以对于网络可用性的结果却影响较大。为了保证利用网络管理系统得到的精确的可用性结果,对于具有trap功能的设备而言,本发明提供的方法,可以是trap上报和轮询机制同时进行,即步骤s1-s8进行的同时,s1-s2-s3-sa-sb-sc-sd也同时进行。

可见,本发明提供的可用性分析方法,利用网络管理系统,可实时监控并记录网络状态,计算得到网络可用性,帮助运维工作人员和管理层方便、快捷、准确地获取网络状态信息。

以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1