一种网络业务故障监控方法

文档序号:7957253阅读:235来源:国知局
专利名称:一种网络业务故障监控方法
技术领域
本发明涉及网络管理技术,尤其涉及一种网络业务故障监控方法。
背景技术
现有的网元管理系统(EMS)和网络管理系统(NMS),都是从设备和网络维护的角度出发,来实现对业务的监控和维护。当业务(不论是大客户业务还是普通业务)出现问题,一般都是通过运营商内部的故障单方式驱动网络故障的解决,即由客服中心接到大客户投诉,然后派单给网络维护部门,网络维护部门再对电路进行逐条的排查,这个排查还包括下故障单到省级、本地网的工作。对于网络维护部门来说,大客户电路和普通客户电路是混在一起的,它们是一样优先级的。这种情况下,大客户业务和普通业务的差异性难以体现出来。另一方面,供应商的故障发现是从网络管理系统/网元管理系统警去定位受影响的大客户业务,或者是通过客户的投诉来驱动问题的解决,既不直观,又难以实现自动化的监控和处理,效率很低。这种情况通常已经严重影响了大客户的设备的正常运行,浪费了网络故障定位的最佳时间。最后,目前的技术方案通常都要在网络管理系统/网元管理系统上对网络告警进行仔细的分析,才能确定是否是运营商的承载网络的故障,这对故障的及时解决也是一个考验。
由上述可见,现有技术中故障单驱动解决故障较为被动、周期较长,难以实现对大客户业务的重点监控,达到快速响应大客户的要求;在故障发现这个步骤难以实现自动化的监控和处理;由于没有有效的故障定位方法,故障定位也不够准确,费时费力。

发明内容
本发明所要解决的技术问题是解决现有技术客户租用业务管理中故障单驱动解决故障较为被动、周期长,不能快速响应客户要求、自动化的监控和处理故障,故障定位不准确的问题,提供一种网络业务故障监控方法,以实现自动化的故障状态判定和定位,缩短故障解决的周期。
本发明为解决上述技术问题所采用的技术方案为提供一种网络业务故障监控方法,其包括以下步骤在网络级网管或子网级网管的电路上设置告警监控点,并根据告警监控点将电路划分成多个监控电路区段;网元级网管收到告警后,通过网络级网管或子网级网管上报业务级网管,业务级网管根据所述告警监控点的情况确定出现故障的监控电路区段,并对告警进行过滤,产生客户租用业务告警。
如上所述的网络业务故障监控方法,对告警进行过滤时,可结合告警衍生关系、业务拓扑和业务流向排除非根源性的告警,确定出业务的故障点在监控区段内部还是在监控区段之间,从而确定告警来源所在的网络级网管或子网级网管。
如上所述的网络业务故障监控方法,可进一步针对每个监控电路区段的告警,结合网络级网管或子网级网管、网元级网管上的业务流向和告警衍生关系进行分析,过滤掉衍生告警,找出根源性的告警,确定告警产生的网元。
如上所述的网络业务故障监控方法,所述的告警监控点可包括以下接入点客户租用业务的流入点、客户租用业务的流出点、或数字配线架对接点;或所述接入点的服务层。
如上所述的网络业务故障监控方法,若所述接入点采用同步数字系统接入,所述的告警监控点还包括所述接入点在单站交叉另一个方向上的业务邻接点。
如上所述的网络业务故障监控方法,当所述流入点或流出点发生告警,或者任何一个数字配线架对接点发生告警,或者所述流入点或者流出点的任何一个业务邻接点或所有业务邻接点发生告警,或者所述接入点的服务层产生告警时,产生客户租用业务告警。
如上所述的网络业务故障监控方法,检测每个监控电路区段的告警情况,若在一个监控电路区段内,检测到所述流入点产生告警且所述流出点未产生告警,则故障点在业务来源方向。
如上所述的网络业务故障监控方法,检测每个监控电路区段的告警情况,若在一个监控电路区段内,检测到所述流入点未产生告警且所述流出点产生告警,则故障点在该监控电路区段内部。
如上所述的网络业务故障监控方法,检测每个监控电路区段的告警情况,若在一个监控电路区段内,检测到所述流入点和流出点都产生告警,则分析所述流出点的告警是否是所述流入点告警的衍生告警;若不是衍生告警,则判断这个监控电路区段内有故障点。
本发明的有益效果为本发明通过端到端的告警监控和与NMS的配合,可以直接将告警定位到客户的租用业务上,从而很方便地实现对大客户业务的更为快速、准确的响应;通过对客户租用业务相关告警的分析,可以快速定位出相关的网络管理系统的告警,在网络级网管或子网级网管、网元级网管的帮助下,可以具体定位到引起告警的网元,主动发现并排除故障,从而提高网络故障的解决效率,增加运营商的客户满意度。


图1为客户租用业务的第一种组网形式示意图;图2为客户租用业务的第二种组网形式示意图;图3为SDH模型的一条NMS的展开电路图;图4为本发明划分监控区段电路的实例示意图;
图5为本发明客户租用业务的产生流程图;图6为本发明判断LCS根源的流程图。
具体实施例方式
下面根据附图和实施例对本发明作进一步详细说明传输网管的架构模型分为5层网元层(NEL)、网元管理层(EML)、网络管理层(NML)、业务管理层(SML)和事务管理层(BML)。网络管理层主要是从电路段的角度实施网络的管理,它的实例称作网络级网管。另一方面,子网级网管具有网元管理系统和部分的网络管理系统的功能,是介于纯粹的网元管理系统和网络管理系统之间的一种网管。如非特别说明,后面提及的网络级网管(NMS)包括了子网级网管。
业务管理层是处于网络管理层之上的网管,它关注的不是网络管理层的一段一段的电路段,也不是网元管理层的网元,而是提供给客户的端到端的电路,监控它的告警、性能,甚至可以让用户自己进行业务的自助服务。它的管理对象是从客户的端口出来然后到达客户的另一个端口的这么全程的电路。对此,本文约定,对于能实现端到端客户租用业务管理的软件,因为定位于端到端的业务管理,称作业务级网管。
业务级网管对告警的监控与从网络维护角度着眼的告警监控不同。从网络维护角度着眼的告警监控,监控的是网络级网管或网元级网管内部的告警,该告警表现为一个网元、一个电路段的告警,这个告警不一定真的会引起客户租用业务的中断。而业务级网管,则是着眼于从客户设备开始到另一端的客户设备这样的一条端到端的电路的告警情况,关注于客户的租用业务的告警监控。
从网络管理软件的分层角度考虑,为实现客户租用业务的告警监控,需监控网络层路径的源宿点信息。具体分析如下请参阅图1和图2,是客户租用业务的常见的组网形式。如图1所示,网络管理系统之间的连接采用的是光纤直接连接的方式。对于这种形式,因为可以在客户租用业务的源宿检测告警,所以不需要监控两个网络相连接的点的告警情况。图2则是将业务下到准同步数字系统(PDH)端口后通过DDF(数字配线架)跳接然后通过另一个PDH进入另一个网络管理系统。对于这种形式,因为在将同步数字系统(SDH)中传递的准同步数字信号解出来的时候,同步数字系统的帧开销字节(多数告警都是由这些字节产生的)也同时被处理掉了,所以经过数字配线架DDF后再上到SDH传输的时候,并不知道之前的SDH传输时有什么告警,也就是说数字配线架DDF的对接会将业务是否正常的告警信息屏蔽,所以在接入数字配线架DDF的两个点都需要监控告警。
同时,从接口的形式来看,客户设备可通过光纤或电缆的方式接入到运营商的网络中。在现在以太网业务蓬勃发展的背景下,客户业务也可选择通过10M、100M的专线业务接入。对于同步数字系统SDH模型,发光口的故障不会在发送的设备上引起告警,而是在接收的设备上引起告警;这点和准同步数字系统PDH是不太相同的。因此,对于同步数字系统SDH的检测不能仅局限于业务接入端点(该端点是指客户的业务接入到运营商网络的那个端口),还需要考虑通过一种方式来监控接入点另一侧的情况。
请参阅图3,是准同步数字系统SDH模型的一条网络级网管NMS电路的展开示意图,客户的业务从业务流入点A点经过接入网元的交叉走到第一接入网元点B点,经过中间网络到达接收端的第二接入网元C点,随后经过交叉到达业务流出点Z点。由于双向业务可以看成两条单向业务的叠加,这里仅考虑从业务流入点A到业务流出点Z的单向业务。业务流出点Z点通过光纤与客户设备对接。由于同步数字系统SDH是在收端检测告警的,发端基本没有什么告警产生,此时业务流出点Z点并不能检测流出的信号是否正常。因此,需要考虑通过监控业务流出点Z点对应的单站交叉的源头第二接入网元点C点的告警和业务流出点Z点所在单板的告警来近似代替业务流出点Z点的告警监控。
另外,很多设备支持了单板内告警抑制,以此来减少需要上报的告警。这是因为单板本身产生的一些告警,会导致该单板的所有业务都受到影响,产生告警,这时的告警数量可能很大。单板内告警抑制的作用就是要在这种情况下只上报根源性的告警。如果仅监控该单板业务级的告警,可能因为单板硬件故障导致业务级告警被抑制掉了。这样,为了监控业务级别的告警,需要通过监控服务级别告警来实现。针对这样的情况,在监控告警的时候,不仅要监控业务级别上的告警,还要监控服务级别的告警。通讯方面的模型都是分层的模型。下层为上层提供服务,所以叫服务层。例如对于一条VC12的业务,就会有VC4级别、光口级别和单板级别,VC4通道(高阶通道)为VC12通道提供服务。那么对于VC12的电路,不仅要监控低阶通道(VC12)的告警,还要监控高阶通道的告警和物理接口(SPI)的告警。
由上述分析可以得出结论在监控客户租用业务告警(LCS告警)时,需要监控NMS的电路的这样的一些接入点客户租用业务流入点A点、业务流出点Z点;数字配线架DDF架对接点;对于接入点为同步数字系统SDH的情况,还需要监控接入点在单站交叉另一个方向上的业务邻接点;以及上述接入点的服务层(包括高阶通道、物理接口和所在的单板)。
本发明在网络管理系统的电路上设置告警监控点,根据告警监控点将电路划分成多个监控电路区段;网元级网管收到告警后,通过网络级网管上报业务级网管,业务级网管根据网络管理系统告警判定故障状态,产生客户租用业务(LCS)告警;根据告警监控点及各个监控电路区段的划分定位故障找出LCS告警来源于哪个网络级网管,并计算出LCS告警的根源。
本发明在计算告警监控点时,以网络管理系统NMS的电路进行计算,并对监控点打上了属于哪条电路的标记,所以只要知道是哪个监控点上报的告警,就可以知道对应于哪条电路,上报的告警很容易映射到电路上。同时,根据告警监控点将电路划分成多个监控电路区段,具体实例参阅图4。通过判断业务流进每个监控电路区段和流出监控电路区段时告警的情况,可判断出每段监控电路区段是否有故障。
在网络管理系统NMS的电路上设置告警监控点,根据告警监控点将电路划分成多个监控电路区段之后,业务级网管就可以判断故障状态,即产生客户租用业务的告警,其流程图见图5。
首先,当网元级网管收到告警后,通过网络级网管以通知方式告知业务级网管。值得注意的是,要监控告警,业务级网管需要和网络级网管建立连接。这样才可以使网元的告警上报到业务级网管。
然后,业务级网管根据自己需要监控的点的情况,过滤掉不需要的告警。过滤不需要的告警的原因是,对于告警的监控,根据不同的情况是有选择性的。和监控的客户租用业务无关的告警,业务级网管无需关心。
最后,业务级网管根据各个监控点的告警情况产生客户租用业务(LCS)告警。产生相应的客户租用业务告警,至少需满足如下条件之一(a)客户租用业务流入点A点或者业务流出点Z点发生告警;(b)方式一客户租用业务流入点A点或者业务流出点Z点的所有业务邻接点发生告警(只有当A/Z是线路时,才需要监控其业务邻接点);方式二客户租用业务A端或者Z端的任何一个业务邻接点发生告警(只有当A/Z是线路时,才需要监控其业务邻接点);(c)任何一个数字配线架DDF对接点发生告警;(d)接入点的服务层产生告警。
请参阅图6,是判断LCS告警根源的流程图1、首先,针对每个监控电路区段检查告警情况。即针对LCS中的各个监控电路区段,逐个检查每个监控电路区段的告警情况。
如果进入监控电路区段时,就发现业务已经有告警,这说明业务在进入这个区段时就有问题,检测到流入点产生告警且流出点未产生告警,则故障点在业务来源方向。如果在客户租用业务接入LCS A端时就有故障,这个故障出现在接入设备之前直到客户设备。
如果在一个监控区段内,流入点没有检查到告警,而流出的点检查到了告警,这表明故障点在这个监控区段内部。
如果在一个监控区段内,流入点和流出点都有告警,则要分析流出点的告警是否是流入点告警的衍生告警。如果不是衍生告警,则这个区段内也有故障点。
2、然后判断LCS告警的来源。
在上述步骤的基础上,结合告警衍生关系、业务拓扑和业务流向,可以排除掉非根源性的告警。最终,确定出业务的故障点在监控区段内部还是在监控区段之间,从而可以确定LCS告警来源于哪个(哪些)NMS。
3、最后计算LCS告警的根源。
为更准确地确定告警产生的网元,需要结合NMS/EMS的根源告警分析来完成。针对每个监控电路区段的告警,按业务流向和告警衍生关系进行分析,保留根源性的告警,过滤掉衍生告警,找出告警的根源。例如,在NMS上,如果有A->B->C->Z这样的电路(其中A、B、C、Z都代表一个网元),现在B出问题了,告警来源的判定根据A点和Z点的告警情况定位到A->Z之间出问题了,根源分析则会根据A、B、C、Z的告警情况定位出B点出问题了。
在网络规模不大和效率允许的情况下,本发明还可以通过获取客户租用业务经过的网络拓扑和网元配置,在此基础上结合组网保护,实现对LCS告警更精确的监控。
由上述本发明网络业务故障判定方法可见,本发明通过端到端的告警监控和与NMS的配合,可以直接将告警定位到客户的租用业务上,从而很方便地实现对于客户业务的更为快速、准确的响应;通过对LCS相关告警的分析,可以快速定位出相关的NMS/EMS的告警,在NMS/EMS的帮助下,可以具体定位到引起告警的网元,主动发现并排除故障,从而提高网络故障的解决效率,增加运营商的客户满意度。
本领域技术人员不脱离本发明的实质和精神,可以有多种变形方案实现本发明,以上所述仅为本发明较佳可行的实施例而已,并非因此局限本发明的权利范围,凡运用本发明说明书及附图内容所作的等效变化,均包含于本发明的权利范围之内。
权利要求
1.一种网络业务故障监控方法,其包括以下步骤在网络级网管或子网级网管的电路上设置告警监控点,并根据告警监控点将电路划分成多个监控电路区段;网元级网管收到告警后,通过网络级网管或子网级网管上报业务级网管,业务级网管根据所述告警监控点的情况确定出现故障的监控电路区段,并对告警进行过滤,产生客户租用业务告警。
2.根据权利要求1所述的网络业务故障监控方法,其特征在于对告警进行过滤时,结合告警衍生关系、业务拓扑和业务流向排除非根源性的告警,确定出业务的故障点在监控区段内部还是在监控区段之间,从而确定告警来源所在的网络级网管或子网级网管。
3.根据权利要求2所述的网络业务故障监控方法,其特征在于进一步针对每个监控电路区段的告警,结合网络级网管或子网级网管、网元级网管上的业务流向和告警衍生关系进行分析,过滤掉衍生告警,找出根源性的告警,确定告警产生的网元。
4.根据权利要求1所述的网络业务故障监控方法,其特征在于所述的告警监控点包括以下接入点客户租用业务的流入点、客户租用业务的流出点、或数字配线架对接点;或所述接入点的服务层。
5.根据权利要求4所述的网络业务故障监控方法,其特征在于若所述接入点采用同步数字系统接入,所述的告警监控点还包括所述接入点在单站交叉另一个方向上的业务邻接点。
6.根据权利要求5所述的网络业务故障监控方法,其特征在于当所述流入点或流出点发生告警,或者任何一个数字配线架对接点发生告警,或者所述流入点或者流出点的任何一个业务邻接点或所有业务邻接点发生告警,或者所述接入点的服务层产生告警时,产生客户租用业务告警。
7.根据权利要求4所述的网络业务故障监控方法,其特征在于检测每个监控电路区段的告警情况,若在一个监控电路区段内,检测到所述流入点产生告警且所述流出点未产生告警,则故障点在业务来源方向。
8.根据权利要求4所述的网络业务故障监控方法,其特征在于检测每个监控电路区段的告警情况,若在一个监控电路区段内,检测到所述流入点未产生告警且所述流出点产生告警,则故障点在该监控电路区段内部。
9.根据权利要求4所述的网络业务故障监控方法,其特征在于检测每个监控电路区段的告警情况,若在一个监控电路区段内,检测到所述流入点和流出点都产生告警,则分析所述流出点的告警是否是所述流入点告警的衍生告警;若不是衍生告警,则判断这个监控电路区段内有故障点。
全文摘要
本发明提供一种网络业务故障监控方法,在网络级网管的电路上设置告警监控点,并根据告警监控点将电路划分成多个监控电路区段;网元级网管收到告警后,通过网络级网管上报业务级网管,业务级网管根据所述告警监控点的情况确定出现故障的监控电路区段,并对告警进行过滤,产生客户租用业务告警。本发明可直接将告警定位到客户的租用业务上,方便地实现对于客户业务快速、准确的响应,可快速定位出相关网络管理系统的告警,定位到引起告警的网元,提高网络故障的解决效率,增加运营商的客户满意度。
文档编号H04L12/24GK1983984SQ20061006115
公开日2007年6月20日 申请日期2006年6月13日 优先权日2006年6月13日
发明者傅文胜, 高胜强, 蒋剑 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1