定位ip承载网故障的方法、设备和系统的制作方法

文档序号:7925953阅读:254来源:国知局
专利名称:定位ip承载网故障的方法、设备和系统的制作方法
技术领域
本发明涉及网络通信领域,尤其涉及一种定位IP承载网故障的方法、设 备和系统。
背景技术
IP (Internet Protocol,网际协议)网络是由通过路由设备互连起来的IP 子网构成的,这些路由设备负责在IP子网间寻找路由,并将IP分组转发到下 一个IP子网;路由设备通过运行动态路由协议,完成路由信息的动态更新, 从而使得IP网络具有很强的灵活性、扩展性和生存能力。MPLS TE( Multiprotocol Label Switching Traffic Engineering,基于多协议标签交换的流量工 程)、PW ( Pseudowire ,伪线)、L2/L3 VPN ( Level 2/Level 3 Virtual Private Network, 2层/3层虚拟专用网)等技术的出现,又使得IP网络在实施 流量工程、多业务承载以及业务隔离等方面可以提供更多的手段。
随着IP技术的不断发展、成熟,IP技术以其开放性和低成本而被广泛采 用,电信网络的ALL-IP化逐渐成为一种潮流和趋势;越来越多的业务,不管 是固网还是移动,如NGN (Next Generation Network,下一代网路)、 2G/3G (2代/3代移动通信)、IPTV (Internet Protocol Television,基于IP的 电视)等,都逐渐通过IP网络来承载。由此可见,IP网络的重要性显得越来 越突出。
但由于IP技术的最初定位不是满足电信网络的需求,在满足电信网的 QoS(Quality of Service,服务质量)、安全、高可靠性等方面还没有形成体 系,尤其是在可靠性方面还很不完善,对于网络故障的定位、网络性能检测、网络性能测量都没有^艮好的办法。所以,如何提高IP网络的可靠性、如 何提高IP网络的可控可管能力成为IP网络不得不面对的主要问题。
现有技术对于故障的定位,目前常用的有Ping(路径检测)和Traceroute (跟踪路径)方案。Ping是典型的网络故障检测技术方案,Ping可以用来辨 别网络的通断状态。Traceroute是用来返回从某一特定源到某一个(某组)目的 地址所经过路径的技术方案。通过Traceroute返回的路径信息结合网络拓朴 以及Ping检测的结果可以实现对网络故障的定位。但是,不管是Ping方案还 是Traceroute方案都是一种在故障发生后通过人工分析定位故障的方案,自 动化程度比较低,很难作为一种通用、高效的IP网络故障定位方案。利用 Ping和Traceroute来实现网络故障定位时,对网络管理人员的要求非常高, 需要相关人员对故障网络非常熟悉,对故障发生前的网络拓朴结构也要非常 了解才能很好的实现故障定位。同时由于IP网络的无连接特性、ECMP (Equal Cost Multiple Path,等价多路由)的存在、路由的动态收敛前后不 一致性还会进一步导致通过Ping和Tracemute来实现故障定位非常困难。

发明内容
本发明实施例的目的是提供一种定位IP承载网故障的方法和系统,从而 可以解决现有技术方案中故障定位困难的问题。
本发明实施例的目的是通过以下技术方案实现的
一种定位IP承载网故障的方法,包括
对自身所在网络设备和/或邻居设备进行检测,收集用于定位故障的信

'&,
利用内部网关协议(IGP)的洪泛机制将所述用于定位故障的信息在指 定网络范围内通告以使故障分析设备根据所述用于定位故障的信息进行故障 定位。一种4全测设备,包括
信息收集模块,用于对自身所在网络设备和/或邻居设备进行检测,收集
用于定位故障的信息;
信息通告模块,用于在指定网络范围内利用IGP协议的洪泛机制通告所 述用于定位故障的信息。
一种定位IP承载网故障的系统,包括
检测设备,用于对自身所在网络设备和/或邻居设备进行检测,收集用于 定位故障的信息,并在指定网络范围内利用IGP协议的洪泛机制通告所述用 于定位故障的信息;
故障分析设备,用于对所述用于定位故障的信息呈现或告警或进行分析 并通告分析结果。
本发明实施例通过各个网络设备定期对自身所在网络设备和/或邻居设备 进行检测,获取设备的相关信息,并采用IGP协议的洪泛机制在特定网络范 围内中发布所述信息,使故障分析设备能够及时充分获取所述信息,并利用 所述信息进行故障定位,克服了故障定位困难的问题,提高网络故障的定位 能力。


图1为本发明实施例所述定位I P承载网故障的方法流程图。 图2为本发明实施例所述检测设备的结构示意框图。 图3为本发明实施例所述定位IP承载网故障的系统框图。 图4为本发明实施例所述定位IP承载网故障的另 一 系统框图。
具体实施例方式
以下结合图1提供本发明的 一种定位I P承载网故障的方法流程图,该方法
8适用于使用OSPF (Open Short Path First,最短路径优先协议)或ISIS (Intermediate System-to-intermediate System ,中间系统到中间系统协 议)等IGP (Interior Gateway Protocol,内部网关协议)协议的网络中,用 来提供IP承载网故障的定位。该方法包括
101、 对自身所在网络设备进行检测,收集用于定位故障的信息;
其中,用于定位故障的信息包括故障信息和位置信息,还可以包括故障 类型信息、状态信息和性能信息中的一种或多种;
102、 只十^卩居i殳备进4亍斥企测,可以通过BFD (Bidirectional Forwarding Detection,双向转发检测)对邻居设备进行故障检测,收集相邻设备的故障 信息、位置信息;为了提高网络的可扩展性,这里使用一种分布式的BFD检 测方案来实现对于故障设备进行检测,即只在两两设备间启动BFD进行故障 检测(这里的BFD可以基于端口来启动);
需要指出的是,在本发明实施例中,步骤101和102可以同时存在,也可 以单独存在。
103、 封装用于定位故障的信息,在OSPF中对现有的LSA (Link Status Advertisement,链路状态通告)或新定义的LSA,或在ISIS中对现有的LSP
(Link Status Packet,链路状态数据包)或新定义的LSP封装入包含所述用 于定位故障的信息的TLV (Type Length Value,类型-长度-值组合)或者 Sub-TLV (子TLV),使LSA或LSP携带所述用于定位故障的信息,对其他IGP 协议类型可以用类似方法进行封装;
104、 洪泛用于定位故障的信息,利用内部网关协议(IGP)的洪泛机制 在指定网络范围内洪泛用于定位故障的信息,指定网络范围可以是一个Area
(路由区域)也可以是在一个AS (自治系统);这些携带了用于定位故障的 信息的LSA或LSP可以由Instance (实例)通过普通链路状态路来通告;或 者,为了减少这类故障、位置、故障类型、状态、性能信息对普通链路状态路由lnstance的影响(影响收敛速度),则可以通过单独的lnstance来实现对
这类故障信息、位置信息、故障类型信息、状态信息或性能信息的洪泛通 告.
105、 判断是否计算网络拓朴和性能变化,如果不计算网络拓朴和性能 变化则执行步骤1051,否则执行步骤1052;
1051、 呈现或告警,根据所述用于定位故障的信息中包含的位置信息和/ 或故障类型信息对网络相关状态进行呈现或告警;
1052、 计算后通告,根据指定时间内历史拓朴记录和所述用于定位故障 的信息定位出故障位置,确定网络拓朴和性能变化,并向网管人员通告网络 拓朴和性能变化;
106、 判断是否按需通告给业务层设备,当网络中存在业务层设备时, 可以计算所述网络拓朴和性能变化对业务的影响并通告业务层设备,此时可
以判断是否按需通告,如果不按需通告则执行步骤1061,否则执行步骤 1062;
1061、 主动通告,在发现网络变化时,计算所述拓朴变化、性能变化对 业务造成的影响,通告给所述业务层设备;
1062、 按需通告,则在满足所述业务层设备注册的拓朴变化、性能变化 的需求时,计算所述拓朴变化、性能变化对业务造成的影响,通告给所述业 务层设备。
以下结合图2说明本发明的一种检测设备的实施例,该设备适用于使用 OSPF或ISIS等IGP协议的网络中,用来提供IP承载网故障的定位。该设备包 括
信息收集模块11,用于对自身所在网络设备和/或邻居设备进行检测,收 集用于定位故障的信息,所述用于定位故障的包括故障信息和位置信息,还可以收集故障类型信息、状态信息和性能信息中的一种或多种,信息收集模
块11包括自检模块111和邻检模块112,其中
自检模块111,用于通过检测收集自身所在网络设备的用于定位故障的
化息 ,
邻检模块112,用于通过BFD收集邻居设备用于定位故障的信息。为了 提高网络的可扩展性,这里使用一种分布式的BFD检测方案来实现对于故障 设备进行检测,即只在两两设备间启动BFD进行故障检测(这里的BFD可以 基于端口来启动)。
信息通告模块12,用于在网络中扩散信息收集模块11收集的用于定位故 障的信息,使网管人员能在任意网络设备得到故障信息、位置信息、故障类 型信息、状态信息或性能信息。信息通告模块12包括信息封装模块121和 信息扩散模块122,其中
信息封装模块121,用于将信息收集模块收集的用于定位故障的信息进 行封装,所述封装包括将网络故障信息、位置信息、故障类型信息、状态 信息或性能信息写到新的TLV或者Sub-TLV中;在OSPF中,将所述TLV或 Sub-TLV封装入现有的LSA或新定义的Opaque LSA (不透明LSA)中;在
IGP协议类型可以用类似方法进行封装。
信息扩散模块122,用于将携带网络故障信息、位置信息、故障类型信 息、状态信息或性能信息的LSA或LSP利用IGP的洪泛机制在指定网络范围内 通告,即可以控制相关用于定位故障的信息在一个Area还是在一个AS内通 告。这些携带了故障信息、位置信息、故障类型信息、状态信息或性能信息 的LSA或LSP可以由lnstance通过普通链路状态路来通告;或者,为了减少这 类故障、位置、故障类型、状态、性能信息对普通链路状态路由lnstance的 影响(影响收敛速度),则可以通过单独的lnstance来实现对这类故障信息、位置信息、故障类型信息、状态信息或性能信息的洪泛通告。
本实施例检测设备通过收集和在指定网络范围内洪泛用于定位故障信 息,使需要了解这些信息的技术人员可以在任何一 台指定网络范围内的网络 设备上查看用于定位故障的信息,从而定位网络故障。
以下结合图3说明本发明的 一种定位IP承载网故障的系统的实施例,该系
统适用于使用OSPF或ISIS等IGP协议的网络中,用来提供IP承载网故障的定 位。该系统包括检测设备1和故障分析设备2。其中
检测设备1用于收集用于定位故障的信息,所述用于定位故障的信息包 括故障信息和位置信息,还可以包括故障类型信息、状态信息和性能信息中 的一种或多种,并在指定网络范围内利用IGP协议的洪泛机制通告所述用于 定位故障的信息。检测设备1包括信息收集模块11和信息通告模块12;
故障分析设备2,用于对所述用于定位故障的信息呈现或告警或进行分 析后通告,包括信息接收模块21和信息分析模块22。
信息收集模块11 ,用于对自身所在网络设备和/或邻居设备进行检测,收 集用于定位故障的信息,所述用于定位故障的包括故障信息和位置信息,还 可以收集故障类型信息、状态信息和性能信息中的一种或多种,信息收集模 块11包括自检模块111和邻检模块112,其中-.
自检模块111 ,用于通过检测收集自身所在网络设备的用于定位故障的
信息;
邻检模块112,用于通过BFD收集邻居设备的用于定位故障的信息。为 了提高网络的可扩展性,这里使用 一种分布式的BFD检测方案来实现对于故 障设备进行检测,即只在两两设备间启动BFD进行故障检测(这里的BFD可 以基于端口来启动)。
信息通告模块12用于在网络中扩散信息收集模块11收集的用于定位故障
12的信息,使网管人员能在任意网络设备得到故障信息、位置信息、故障类型
信息、状态信息或性能信息。信息通告模块12,包括信息封装模块121和 信息扩散模块122,其中
信息封装模块121 ,用于将信息收集模块收集的用于定位故障的信息进 行封装,所述封装包括将网络故障信息、位置信息、故障类型信息、状态 信息或性能信息写到新的TLV或者Sub-TLV中;在OSPF中,将所述TLV或 Sub-TLV封装入现有的LSA或新定义的Opaque LSA中;在ISIS中,将所述 TLV或Sub-TLV封装入现有的LSP或新定义的LSP中。对其他IGP协议类型可 以用类似方法进行封装。
信息扩散模块122,用于将携带网络故障信息、位置信息、故障类型信 息、状态信息或性能信息的LSA或LSP利用IGP的洪泛机制在指定网络范围内 通告,即可以控制相关用于定位故障的信息在一个Area还是在一个AS内通 告。这些携带了故障信息、位置信息、故障类型信息、状态信息或性能信息 的LSA或LSP可以由lnstance通过普通链路状态路来通告;或者,为了减少这 类故障、位置、故障类型、状态、性能信息对普通链路状态路由lnstance的 影响(影响收敛速度),则可以通过单独的lnstance来实现对这类故障信 息、位置信息、故障类型信息、状态信息或性能信息的洪泛通告。
信息接收模块21用于将所述用于定位故障信息从接收自信息扩散模块 122的LS A或LS P中提取出来。
信息分析模块22用于分析信息接收模块21提取出来的故障信息、位置信 息、故障类型信息、状态信息或性能信息,因为故障、位置、故障类型、状 态、性能等信息中包含了故障位置、故障类型等信息,可以通过信息分析模 块22直接对网络相关状态进行呈现和告警。信息分析模块22还可以保存一段 时间内(可以根据需要配置时间长短)历史拓朴记录,即网络相关变化,结合 收到故障信息、位置信息、故障类型信息、状态信息和性能信息中的一种或多种则可准确的定位出故障位置,确定网络的物理、逻辑、业务等拓朴的变 化以及网络性能的变化。需要了解这些信息的技术人员可以直接查询信息分 析模块22了解故障位置、性能变化等信息。
以下结合图4提供本发明的 一种定位I P承载网故障的另 一 系统的实施例, 该系统在图3的基础上增加了业务层设备3,用于向故障分析设备注册,以在 网络发生拓朴变化、性能变化对业务造成的影响时从故障分析设备接收分析 结果。
所述故障分析设备2还包括网络性能报告模块23。
网络性能报告模块23用于与业务层设备3之间通过UNI (User Network Interface,用户-网络接口 )接口或者其他的私有接口进行交互。交互方法包 括主动通告,网络性能报告模块23可以根据信息分析模块22发现的网络变 化(故障、性能变化),计算出对业务造成的影响,通告给业务层设备3; 按需通告,业务层设备3也可以通过UNI接口或者私有接口向故障分析设备2 注册对某些拓朴变化(可以通过一个或者一组IP Prefix-路由前缀来表示)、性 能变化的需求,网络性能报告模块23发现信息分析模块22的分析结果满足这 些拓朴、性能发生变化后,才计算出对业务造成的影响,将相关变化信息告 知业务层设备3。
在本发明实施例实际应用的场景中,信息接收模块21和信息分析模块22 可以设置在网管设备或业务边缘路由器中,网管设备或业务边缘路由器可以 直接向网管人员通告网络性能信息,也可以进一步与业务层设备联动,计算 出相关故障、性能变化会对哪些业务造成影响,从而达到对网络的可观、可 管、可控。
综上所述,应用本发明实施例所述方法系统后,能及时收集网络的故 障、性能、状态等信息,而且提高了这些信息的传递的可靠性,提高网络故 障的定位能力、网络性能的监控能力。本发明实施例通过IGP洪泛的机制,网络中需要网络故障、性能、状态信息的设备可以灵活部署在网络中的任意 位置,简化了网络部署,可以解决单点网管的问题,网管设备可以按需部署 在网络中的任意位置,同时可以部署多台网管设备,进行负载分担,大大提 高网络的可扩展性。
以上所述,仅为本发明较佳的具体实施方式
,但本发明的保护范围并不 局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可 轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明 的保护范围应该以权利要求的保护范围为准。
权利要求
1、一种定位IP承载网故障的方法,其特征在于,包括对自身所在网络设备和/或邻居设备进行检测,收集用于定位故障的信息;利用内部网关协议(IGP)的洪泛机制将所述用于定位故障的信息在指定网络范围内通告以使故障分析设备根据所述用于定位故障的信息进行故障定位。
2、 根据权利要求1所述定位IP承载网故障的方法,其特征在于,所述用 于定位故障的信息包括故障信息和位置信息,还可以包括故障类型信息、状 态信息和性能信息中的 一种或多种。
3、 根据权利要求1所述定位IP承载网故障的方法,其特征在于,对所述 邻居设备进行检测具体包括,通过双向转发检测BFD对邻居设备进行故障检测。
4、 根据权利要求1所述定位IP承载网故障的方法,其特征在于,所述指 定范围具体包括IGP协议指定的一个路由区域Area或一个自治系统AS。
5、 根据权利要求1所述定位IP承载网故障的方法,其特征在于,所述 IGP协议具体包括最短路径优先协议OSPF或中间系统到中间系统协议ISIS。
6、 根据权利要求5所述定位IP承载网故障的方法,其特征在于,所述利 用内部网关协议IGP的洪泛机制将所述用于定位故障的信息在指定网络范围 内通告包括在OSPF中对链路状态通告LSA或在ISIS中对链路状态数据包LSP加入包 含所述用于定位故障的信息的类型-长度-值组合TLV,使LSA或LSP携带所述用 于定位故障的信息,并利用OSPF或ISIS的洪泛机制通告所述用于定位故障的信息。
7、 根据权利要求6所述定位IP承载网故障的方法,其特征在于,所述 LSA或LSP的通告包括通过普通链3各状态路由实例lnstance来通告,或通过单独的lnstance通告。
8、 根据权利要求2所述定位IP承载网故障的方法,其特征在于,收到所 述用于定位故障的信息的设备根据所述信息进行故障定位的步骤包括根据所述用于定位故障的信息中包含的位置信息和/或故障类型信息对网 络相关状态进行呈现或告警;或根据指定时间内历史拓朴记录和所述用于定位故障的信息定位出故障位 置,确定网络拓朴的变化和/或网络性能的变化;或当存在业务层设备时,主动或按需计算出相关故障、性能变化对业务造 成的影响,通告给所述业务层设备。
9、 根据权利要求8所述定位IP承载网故障的方法,其特征在于,所述主 动计算具体包括发现网络变化时,计算所述拓朴变化、性能变化对业务造成的影响,通 告给所述业务层设备。
10、 根据权利要求8所述定位IP承载网故障的方法,其特征在于,所述 按需计算具体包括在满足所述业务层设备注册的拓朴变化、性能变化的需求时,计算所述拓朴变化、性能变化对业务造成的影响,通告给所述业务层设备。
11、 一种检测设备,其特征在于,包括信息收集模块,用于对自身所在网络设备和/或邻居设备进行检测,收集 用于定位故障的信息;信息通告模块,用于在指定网络范围内利用IGP协议的洪泛机制通告所 述用于定位故障的信息。
12、 根据权利要求11所述IP承载网自检设备,其特征在于,所述用于定 位故障的信息包括故障信息和位置信息,还可以包括故障类型信息、状态信 息和性能信息中的一种或多种。
13、 一种定位IP承载网故障的系统,其特征在于,包括检测设备,用于对自身所在网络设备和/或邻居设备进行检测,收集用于 定位故障的信息,并在指定网络范围内利用IGP协议的洪泛机制通告所述用 于定位故障的信息;故障分析设备,用于对所述用于定位故障的信息呈现或告警或进行分析 并通告分析结果。
14、 根据权利要求13所述定位IP承载网故障的系统,其特征在于,所述 用于定位故障的信息包括故障信息和位置信息,还可以包括故障类型信息、 状态信息和性能信息中的 一种或多种。
15、 根据权利要求14所述定位IP承载网故障的系统,其特征在于,所述 故障分析设备包括信息接收模块,用于接收所述检测设备通告的所述用于定位故障的信自 信息分析模块,用于根据所述用于定位故障的信息中包含的位置信息和/或故障类型信息对网络相关状态进行呈现或告警;或者,根据保存的指定时 间内历史拓朴记录和所述信息接收模块接收的所述用于定位故障的信息分析 网络拓朴的变化和/或网络性能的变化。
16、 根据权利要求15所述定位IP承载网故障的系统,其特征在于,当存 在业务层设备时,所述故障分析设备还包括网络性能报告模块,用于根据所述信息分析模块的分析结果计算出对业 务造成的影响通告给所述业务层设备。
17、 根据权利要求16所述定位IP承载网故障的系统,其特征在于,所述 网络性能报告模块根据所述信息分析模块的分析结果计算出对业务造成的影 响通告给所述业务层设备的模式包括主动通告,通告计算的所述对业务造成的影响给所述业务层设备;按需通告,在满足所述业务层设备向所述故障分析设备注册的拓朴变 化、性能变化的需求时,通告计算的所述对业务造成的影响给所述业务层设 备。
全文摘要
本发明涉及网络通信领域,尤其涉及一种定位IP承载网故障的方法、设备和系统。该方法主要包括对自身所在网络设备和/或邻居设备进行检测,收集用于定位故障的信息;利用内部网关协议(IGP)的洪泛机制将所述用于定位故障的信息在指定网络范围内通告以使故障分析设备根据所述用于定位故障的信息进行故障定位。该设备主要包括信息收集模块;信息通告模块。该系统主要包括检测设备;故障分析设备。
文档编号H04L12/24GK101431448SQ200810216949
公开日2009年5月13日 申请日期2008年10月22日 优先权日2008年10月22日
发明者李国平, 陈国义 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1