一种定位嵌入控制通路故障的方法

文档序号:7687880阅读:169来源:国知局
专利名称:一种定位嵌入控制通路故障的方法
技术领域
本发明涉及一种SDH网络(同步数字系列,Synchronous Digital Hierarchy)的故障定位方法,尤其涉及的是一种ECC(Embedded Control Channel嵌入控制通路)故障的定位方法,特别适用于采用星型结构,是一 种主控板和连接板(光板或支路板)通过ECC总线实现硬件转发、完成ECC 路由功能的SDH网络的故障定位方法。
背景技术
SDH强大而灵活多变的組网能力,必然带来复杂的网络结构,作为网 管信息通道的DCC ( Digital Control Channel,数字控制信道)/ECC协议转 发技术自然成为SDH网管系统中最复杂也是最核心的技术。在现有的各种 DCC/ECC转发技术中,采用星型结构,主控板和连接板(光板或支路板) 通过ECC总线实现硬件转发的方式是优点较为突出的 一种。这种方案是所有的连接板将接收的DCC字节,经过HDLC (High level Data Link Control,高级数据链路控制)转发到统一的ECC总线上,由主控 板对ECC总线数据进行处理,完成ECC的路由功能。在这个数据处理和转 发过程中,涉及到不同连接板与主控板的多次收发数据包以及在同 一条总 线上的双向传送,中间有着较为复杂的冲突检测以及协商机制,导致ECC 出现故障的因素很多,且出现的情况也不一致,出现问题后不容易直接进 行分析定位。在测试过程中,最常见且会直接影响工程应用的ECC故障就是丢包率 高,造成网元管理时通时断,下发网管命令不成功,或者远程文件传送失败等,要直接分析定位其原因较为困难, 一般需要先通过反复变换网络连 接环境进行充分的丢包率测试,从宏观上判断出可能的故障环境特点,再 根据该特点去分析发现隐藏的缺陷。在ECC故障的定位过程中,'最困难的就是确定触发故障的特定环境和 应用方式,尤其是在一个网元内部各单板之间的配合存在问题时,更难发 现究竟是哪一部分存在缺陷。虽然单板软件和逻辑在实现过程中可以通过 诸如设置变量和监控相关寄存器等手段辅助判断,但是在有些资源紧张及 条件复杂的情况下,并不能得到足够多的控制点和监控点以精确定位。在一个采取星型总线的系统中,对于ECC这种涉及到需要很多部分配 合工作的功能,在出现问题时,因为相关各部分由不同的开发人员负责, 如果找不到有效的测试方法进行辅助定位,而由开发人员各自查找自己负 责的那一部分,将很难发现问题的原因所在,这将对产品的开发进度产生 极大的影响。因此,现有技术还有待于改进和发展。发明内容本发明的目的在于提供一种定位嵌入控制通路故障的方法,通过简单易 行的辅助定位测试方法,提高ECC故障定位的效率,加快故障定位进度, 缩短产品研发周期。本发明的技术方案包括一种定位嵌入控制通路故障的方法,其包括以下步骤A、 从大量网元中确定丟包率最高的部分进行剥离,并在每两个网元之 间的线缆上加入分路器,连接到一确定无故障的参考网元的接收口,记录 该链路中各网元及参考网元的主控板收发包计数器对应各条数据通路的收 发包数值,作为原始凄t值;B、 在链路的两端连接带收发包功能的数据仪表,进行双向收发包;记录经过一段时间收发包后,该链路各网元和参考网元主控板记录到的各条数据通路收发包数值,并与其对应的原始数值进行比较; C、根据比较结果判断所述嵌入控制通路的故障所在。 所述的方法,其中,所述步骤C还包括Cl、确认各个网元主控板的緩存是否足够大,在緩存足够大的情况下 默认收方向正常。所述的方法,其中,所述步骤C1还包括如某一参考网元的主控板记录收到的数据包数与同一分路器连接的网 元主控板记录收到的数据包数大致相当,且两者均明显少于上一网元主控 板记录的该通道发出数据包数,则判断为上一网元连接板丢失部分主控板 发出的数据包或者已收到但没全部从连接口发出。所述的方法,其中,所述步骤C1还包括如某一参考网元的主控板记录收到的数据包数与上一 网元主控板记录 的发出数据包数相当,且明显多于与参考网元连在同 一分路器上的网元主 控板收到的数据包数,则判断为该网元连接板丢失部分数据包,或者其没 将全部数据包发送给主控板。所述的方法,其中,所述步骤C1还包括如中间网元记录的同 一数据流方向上,从一条数据通道收到的包数与上 一网元发送的包数相当,同时从另 一数据通道发出给下一 网元的数据包明 显减少,则该中间网元主控板转发给对应连接口故障。所述的方法,其中,所述翁:据仪表为数据网络测试平台仪表。 所述的方法,其中,所述步骤A中同时设置多个分路器分别连接各数 据通路。本发明所提供的一种定位嵌入控制通路故障的方法,由于采用由主控 板记录收发包过程中产生的数据包数量,通过分路器连接参考方向,比照 ^"方向的lt据包数量,通过对数值结果进行分析,可定位出ECC故障的缺陷所在环节,尤其是对于单板配合缺陷导致的缺陷,该测试方法能大大提高了 ECC故障定位效率。


图l是本发明方法的仪表和网元连接示意图; 图2是本发明方法的数据包流向示意图; 图3是本发明方法的执行步骤流程示意图。
具体实施方式
'以下结合附图,将对本发明各较佳实施例进^f亍更为详细的说明。 本发明定位嵌入控制通路故障的方法是基于带收发包功能的数据仪表 (如数据网络测试平台Smartbits)收发包、主控板记录与连接板间收发数据包数量的方式,获取故障网元间的收发包数,以及通过分路器接入的另一独立参考网元收到的数据包数,通过比照参考网元测量数据,进行ECC故障的定位。如图3所示,本发明方法的基本步骤包括步骤l,首先从大量网元中将丟包率最高的部分从网络中剥离出来,可 选择链型连接的三个重点网元,在连接每两个网元的线缆连接中加入分路 器,连接到另一独立参考网元的对应正常连接口 (光口或电口)接收,可 同时使用多个分路器连接,如分路器资源紧张也可以根据情况分次进行测 量;另外将带收发包功能的数据仪表(如Smartbits)连接在链路的两端, 以便进^f亍双向收发包;步骤2,记录各个网元和对应参考网元主控板收发包计数器对应各条数 据通路的收发包数值,作为各原始数值NO;步骤3,利用带收发包功能的数据仪表(如Smartbits )开始进行双向收 发包,两方向发包数量达到一定值后,发包数量需足够大以便于结果分析和判断,停止发包;步骤4,记录经过一段时间收发包后,各网元和参考网元主控板记录的 各条数据通路的收发包数值Nl,'正常情况下,该收发包过程中产生的数据 包计数N1与对应的原始数值NO的值应该相差不大;步骤5,根据步骤2和步骤4记录的结果,两者之差为两次记录中间过 程发生的数据包数。首先确认各个部分的緩存是否足够大,在緩存足够大的情况下默认收方 向正常,则问题多出在各个发方向,大致会出现以下三种结果如某一参考方向主控板记录收到的数据包数与同一分路器连接的测试 网元主控板记录到的收到数据包数大致相当,且两者均明显少于上一网元 主控板记录的该通道发出数据包i史,则可能是上一网元连接板丟了部分主 控板发出的数据包,或者收到了而没能顺利全部从连接口发出,在确认缓 存足够大的情况下,可认为上一网元的连接板发到连接口时丢了部分数据 包,可能是其在竟争过程中没有竟争到总线等原因造成。如果参考方向主控板记录收到的数据包数与上一网元主控板记录的发 出数据包数相当,且明显多于与参考方向连在同一分if各器上的测试网元主 控板收到的数据包数,则可能是连接板丟了部分数据包,或者其没能将全 部数据包发送给主控板,在确认缓存足够大的情况下可认为该测试网元的 连接板收到包后转发给主控板时丢了部分数据包,也可能是其没竟争到总 线等原因造成。如果中间网元记录的同 一数据流方向上,从一条数据通道收到的包数同 上一 网元发送的包数相当,但是从另 一数据通道发出给下一 网元的数据包 明显减少,则也可能是主控板转发给连接口时没竟争到总线。在上述过程中,本发明方法的主控板各数据通道收发方向的数据包数值 由主控板软件提供的查询命令查询得到,参考方向为已验证正常无ECC故 障的网元或单板。由上述本发明方法过程的测量记录以及分析判断,同时接多个分路器和 参考通道,或者依次将分路器和参考通道接入到不同的连接处,对测试结 果加以简单计算,可以直接定位到产生故障的缺陷所在的环节。本发明方法主要包括以下特征1、主控板软件负责提供收发数据包数 量的记录;2、参考网元在各线缆(光纤或电缆)连接处由分路器连接,不 对原有数据传送路径造成影响,且参考网元上所用单板为已经验证无ECC 故障的;3、收发包仪表传送一定数量的数据包后,通过分析比对收发包前 后主控板记录发生的数据包数量,定位缺陷环节。其中,第1、 2项是实现 第3项的前提条件。如图1所示是本发明方法的仪表和网元连接示意图,在故障发生后,首 先通过分区段测试,宏观定位问题突出的重点连接段,下面假设网元B为 重点故障网元,以A、 B、 C三个网元链型故障为例进4亍详细说明。A、 B、 C为链型连4矣的三个测试网元,Rl、 R2、 R3、 R4分别为四个 独立的已验证无故障的参考网元,分别通过分路器接入到原有线路中,如 果采用光连接,光分路器的分光比选择需保证各网元收到的光强度不低于 光板灵敏度;如果为电缆连接则不存在此问题;测试网元间为普通的双向 连接,参考网元只需要一个收口接分路器即可;带收发包功能的数据仪表 如数据网络测试平台Smartbits可进行双向收发包,分别与两端的A、 C网 元通过交叉网线相连。如图2所示是本发明方法数据包的流向示意图,指示出了各个测试网元 以及参考网元的主控板和连接板之间收发数据包的流向;N(TA)、 N(Ra)分 别为A网元主控板记录的发出给连接板和从连接板收到的数据包数量, N(TB1)、 N(R^分别为B网元主控板发出给连接板1或从连接板1收到的数 据包数量,N(TB2)、 N(Re2)分别为B网元主控板发出给连接板2或从连接板 2收到的数据包数量,N(Tc)、 N(Rc)分别为C网元主控板发出给连接板和从 连接板收到的数据包数量,N(RR1)、 N(RR2)、 N(RR3)、 N(R^)分别为参考网元R1、 R2、 R3、 R4四个网元主控板从连接板接收到的数据包数量。按照图1所示连接好仪表及测试网元、参考网元后,记录下主控板上查 到的原始收发数据包数值N(TA)o、N(Ra)。、N(TB1)o、N(RB1)Q、N(TB2)o、N(RB2)0、 N(TcV N(Rc)o、 N(RR1)0、 N(Rr^、 N(RR3)o、 N(RR4)0;收发包设备根据网 元ECC的通信能力,纟会照一定流量进行一段时间的双向收发包,包数需达 到一定数量,以便于判断得出结论;停止收发包后,再一次记录主控板上 查到的收发数据包数值N(TA)" N(Ra)!、 N(Tb^、 N(Rb,)!、 N(TB2),、 N(Rb2)!、 N(Tc;h、 N(Roh、 N(Rr^、 N(R"、 N(Rr3),、 N(RR4)"通过上述数据读取,最后可判断得出结论 .以参考网元R1接入处为例,其它参考网元R2、 R3、 R4均与之类似。若N(Ta、 - N(Ta)q N(RB2;h - N(RB2)Q N(Rr山-N(RR1)Q,则该连接处 网元A到网元B的主控板收正常;若N(TA:h - N(Ta)o》N(Rb2;h - N(RB2)0 N(RR1), - N(RR1)0,则认为A网 元连接B网元的连接板发方向有缺陷,首先确认其接收来自A主控板的緩 存是否足够,若足够则可能是连接板在竟争总线方面受压制,而无法成功 将所有收到来自主控板的数据发往连接口 ;若N(TA;h - N(TA)0 N(Rr山-N(RROo》N(RB2;h - N(RB2)0,则认为B网 元连接板2收方向有缺陷,首先确认其接收来自连接口的数据緩存是否足 够,若足够则可能是连接板在竟争总线方面受压制,而无法成功将所有收 到来自连接口的数据发往B主控板;网元A、 B之间,B、 C之间双方向的四个过程都可由上述方式作出判 断,另外网元B还存在一种可能性若N(TbO! - N(TB1)0<< N(RbA - N(RB2)0,即B网元主控板在A到C方 向收到的数据包多,发出的少,则可能B网元主控板在竟争总线过程中受 压制;C到A方向的数据包传送类似可判断。 '综上,本发明方法通过由主控板记录收发包过程中产生的数据包数量,通过分路器连接参考方向,比照各方向的数据包数量,通过对数值结果进行分析,可定位出ECC故障的缺陷所在环节,尤其是对于单板配合缺陷所 述导致的缺陷,本发明测试方法能大大提高ECC故障定位效率。.本发明方法所需硬件简单,测试设备带收发包功能的数据仪表(如 Smartbits)为常用仪表,分路器为普通常用器件,使用分路器的个数可根据 资源灵活选择同时接入或分次接入依次测量,主控板记录收发包数只需筒 单修改单板软件即可。本发明测试方法耗费资源和测试时间都很少,简单 易行,作为辅助定位的测试方法,解决了网元内部配合缺陷难以发现的问 题,能帮助定位疑难的ECC故障,有效提高产品开发进度。应当理解的是,上述针对本发明较佳实施例的描述较为具体和详细,但 不能因此而认为是对本发明专利保护范围的限制,本发明的专利保护范围 应.以所附权利要求为准。.
权利要求
1、一种定位嵌入控制通路故障的方法,其包括以下步骤A、从大量网元中确定丢包率最高的部分进行剥离,并在每两个网元之间的线缆上加入分路器,连接到一确定无故障的参考网元的接收口,记录该链路中各网元及参考网元的主控板收发包计数器对应各条数据通路的收发包数值,作为原始数值;B、在链路的两端连接带收发包功能的数据仪表,进行双向收发包;记录经过一段时间收发包后,该链路各网元和参考网元主控板记录到的各条数据通路收发包数值,并与其对应的原始数值进行比较;C、根据比较结果判断所述嵌入控制通路的故障所在。
2、 根据权利要求1所述的方法,其特征在于,所述步骤C还包括 Cl、确认各个网元主控板的緩存是否足够大,在緩存足够大的情况下默认收方向正常。
3、 根据权利要求2所述的方法,其特征在于,所述步骤C1还包括 如某一参考网元的主控板记录收到的数据包数与同一分路器连接的网元主控板记录收到的数据包数大致相当,且两者均明显少于上一网元主控 板记录的该通道发出数据包数,则判断为上一网元连接板丢失部分主控板 发出的数据包或者已收到^f旦没全部从连接口发出。
4、 根据权利要求2所述的方法,其特征在于,所述步骤C1还包括 如某一参考网元的主控板记录收到的数据包数与上一 网元主控板记录的发出数据包数相当,且明显多于与参考网元连在同一分路器上的网元主 控板收到的数据包数,则判断为该网元连接板丟失部分数据包,或者其没将全部数据包发送给主控板。
5、 根据权利要求2所述的方法,其特征在于,所述步骤C1还包括 如中间网元记录的同 一数据流方向上,从一条数据通道收到的包数与上一网元发送的包数相当,同时从另 一数据通道发出给下一 网元的数据包明 显减少,则该中间网元主控板转发给对应连接口故障。
6、 根据权利要求3、 4或5所述的方法,其特征在于,所述数据仪表为 数据网络测试平台仪表。
7、 根据权利要求6所述的方法,其特征在于,所述步骤A中同时设置 多个分路器分别连接各数据通路。
全文摘要
本发明公开了一种定位嵌入控制通路故障的方法,其包括以下步骤确定丢包率最高的部分并在每两个网元之间的线缆上加入分路器,连接到一确定无故障的参考网元的接收口,记录该链路中各网元及参考网元的主控板收发包计数器对应各条数据通路的收发包数值,作为原始数值;在链路的两端连接带收发包功能的数据仪表,进行双向收发包;记录经过一段时间收发包后,该链路各网元和参考网元主控板记录到的各条数据通路收发包数值,并与其对应的原始数值进行比较;根据比较结果判断所述嵌入控制通路的故障所在。本发明方法由于采用由主控板记录收发包过程中产生的数据包数量,通过分路器连接参考方向,比照各方向的数据包数量,提高了ECC故障定位效率。
文档编号H04L12/26GK101232343SQ20081006563
公开日2008年7月30日 申请日期2008年1月21日 优先权日2008年1月21日
发明者炜 双, 邹开璞 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1