以太网远端故障的处理方法及装置的制作方法

文档序号:7696930阅读:211来源:国知局
专利名称:以太网远端故障的处理方法及装置的制作方法
技术领域
本发明涉及通信领域,具体而言,涉及一种以太网远端故障的处理方法及装置。
背景技术
以太网技术由于具有简单易用、价格低廉的优点,其在局域网、城域网、广域网范围内都已经得到大规模的应用。但是由于以太网最初为局域网设计,并未建立管理维护的机制,随着以太网应用范围的逐渐扩大,在以太网上实现操作、管理和维护(Operation, Administration, Maintenance,简称为0AM)机制成为必然的发展趋势,由此,ΕΤΗ_0ΑΜ(以太网0ΑΜ)协议应运而生,它可以有效提高对以太网的管理和维护能力,保障网络的稳定运行。以太网OAM机制主要包括链路层OAM机制和服务层OAM机制(CFM,连通性故障管理)。ETH-OAM是针对直连链路的OAM机制,主要用于本地链路的管理和维护,可以提供远端发现、远端环回、远端故障指示及链路监控等功能。连接故障管理(Connectivity Fault Management,简称为CFM)主要是针对运营商网络,采用多域的网络模型。CFM能够实现端到端的故障管理,网络管理者基于管理和维护的目的,将网络划分为若干个可嵌套的维护域, 通过在维护域上定义一系列的维护点(MP)来实现网络的管理和维护。通过CFM,网络管理者可以有效地对虚拟桥局域网进行检查、隔离及连通性故障报告,CFM的主要功能有连通性检查,环回检测、链路跟踪及告警等。单个CFM维护域如图1所示,图中的维护域在边缘设备和内部设备上定义了一系列的维护点,其中,W点表示维护域端点(Maintenance End Point,简称为MEP),N点表示维护域中间点(Maintenance Intermediate Point,简称为 MIP),基于服务的以太网OAM就是通过MEP和MIP来实现管理维护功能的。目前,以太网OAM机制可以对管理域范围内的故障做出诊断,并借助其他机制(如 STP, EAPS等),采取相应的倒换措施,保障网络的可靠性,但是缺少对上、下行接入链路的故障检测和联动机制。比如,在运营商网络中的一些特殊的应用场景下,当上行链路出现故障后,下行链路也变得不可用,但是由于上、下行链路不属于同一个网络管理者,无法将上行链路的故障通知到下行链路,导致下行链路无法及时地对故障做出反应。如图2所示,E, F之间的网络(包括E、F)为运营商网络,A为服务器,B为使用A的服务的用户,如果A、E 之间的链路出现故障,A-E-F-B这条链路则不能正常通信,B也无法继续使用A的服务,但是由于B无法感知A、E之间的链路故障,即使用户B使用了高可用性(High Availability, 简称为HA)机制,也无法切换到备用链路,导致大量的数据丢失,网络管理员也不能及时发现故障并采取相应的处理措施。

发明内容
本发明的主要目的在于提供一种以太网远端故障的处理方法及装置,以至少解决上述问题。根据本发明的一个方面,提供了一种以太网远端故障的处理方法,包括接入链路一端的第二边缘设备接收接入链路另一端的第一边缘设备发送的第一消息,其中,第一消息是第一边缘设备在检测到其关联的第一关联端口发生故障时发送的,且第一消息中携带有第一关联端口的故障信息;第二边缘设备根据第一关联端口的故障信息及与第二边缘设备关联的第二关联端口的物理状态,关闭第二关联端口。在第二边缘设备接收第一边缘设备发送的消息之前,该方法还包括第一边缘设备检测到与其关联的第一关联端口发生故障,向第二边缘设备发送第一消息。在第二边缘设备关闭第二关联端口之后,该方法还包括第二边缘设备将第二关联端口的物理状态更新为关闭状态。在第二边缘设备接收第一边缘设备发送的第一消息之后,包括第二边缘设备产生故障告警信息。在第二边缘设备关闭第二关联端口之后,该方法还包括第二边缘设备接收第一边缘设备发送的第二消息,其中,第二消息是第一边缘设备在检测到第一关联端口的故障恢复时发送的,且第二消息中携带有第一关联端口的故障恢复信息;第二边缘设备根据第一关联端口的故障恢复信息及与第二关联端口的当前物理状态,打开第二关联端口。在第二边缘设备打开第二关联端口之后,该方法还包括第二边缘设备将第二关联端口的物理状态更新为打开状态。在第二边缘设备接收第一边缘设备发送的第二消息之后,该方法还包括第二边缘设备产生故障恢复告警信息。根据本发明的另一方面,提供了一种以太网远端故障的处理装置,包括接收模块,用于接收接入链路另一端的第一边缘设备发送的第一消息,其中,第一消息是第一边缘设备在检测到其关联的第一关联端口发生故障时发送的,且第一消息中携带有第一关联端口的故障信息;执行模块,用于根据第一关联端口的故障信息及与第二边缘设备关联的第二关联端口的物理状态,关闭第二关联端口。上述接收模块还用于接收第一边缘设备发送的第二消息,其中,第二消息是第一边缘设备在检测到第一关联端口的故障恢复时发送的,且第二消息中携带有第一关联端口的故障恢复信息;执行模块还用于根据第一关联端口的故障恢复信息及与第二边缘设备关联的第二关联端口的物理状态,打开第二关联端口。上述装置还包括更新模块,用于根据执行模块对第二关联端口执行的操作,更新第二关联端口的物理状态。上述装置还包括告警模块,用于根据接收模块接收到的消息中携带的信息,产生相应的告警信息。通过本发明,采用以太网远端故障的处理方法及装置,解决了现有技术中上行链路或下行链路发生故障后,由于上行链路和下行链路不属于同一个网络管理者而导致通信中断的问题,进而达到了能够及时发现故障并采取相应的隔离或者恢复机制,避免了大量的数据丢失的效果。


此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中图1是根据相关技术的单个CFM维护域的示意图2是根据相关技术的链路发生故障时的应用实例的示意图;图3是根据本发明实施例的以太网远端故障的处理方法的流程图;图4是根据本发明优选实施例的一对多指定的示意图;图5是根据本发明优选实施例的环网指定的示意图;图6是根据本发明优选实施例的连通性检测消息(CCM帧)的hterface Status TLV字段的格式;图7是根据本发明优选实施例的连通性检测消息(CCM帧)的hterface Status TLV字段的取值;图8是根据本发明优选实施例的端口状态变化消息的处理流程图;图9是根据本发明优选实施例的连通性检测消息(CCM帧)的处理流程图;图10是根据本发明优选实施例的端口状态迁移图;图11是根据本发明实施例的以太网远端故障的处理装置的结构示意图;图12是根据本发明优选实施例的以太网远端故障的处理装置的结构示意图;图13是根据本发明优选实施例的一个优选装置的结构示意图。
具体实施例方式下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。图3是根据本发明实施例的以太网远端故障的处理方法的流程图,如图3所示,该方法主要包括以下步骤(步骤S302-步骤S304)步骤S302,接入链路一端的第二边缘设备接收接入链路另一端的第一边缘设备发送的第一消息,其中,第一消息是第一边缘设备在检测到其关联的第一关联端口发生故障时发送的,且第一消息中携带有第一关联端口的故障信息;在本发明实施例中,在第二边缘设备接收第一边缘设备发送的消息之前,可以预先在第一边缘设备和第二边缘设备(其中,第一边缘设备相对于第二边缘设备是远端,同样,第二边缘设备相对于第一边缘设备是远端)上配置故障检测和隔离功能,例如,在图2 中,可以在边缘设备E上配置故障检测功能,将配置后的故障检测功能与端口 l(port 1)进行关联,在边缘设备F上配置隔离功能,并将故障隔离功能与端口 2 (port 2)进行关联,当边缘设备E检测到与其关联的关联端口(即portl)发生故障时,则向边缘设备F发送消息 (该消息中携带有Portl的故障信息)。优选地,在本发明优选实施例中,当第二边缘设备接收第一边缘设备发送的故障信息之后,第二边缘设备还可以产生故障告警信息。例如,在图2中,可以在两端的边缘设备E(即上述第一边缘设备)、F(即上述第二边缘设备)上分别监控关联端口 portl和port3的物理状态,为了方便,可以将网络中接入链路发生故障的一端称为指定端(即图2的边缘设备E),需要做故障隔离的一端(对端) 称为被指定端(图2的边缘设备F)。指定的方法不受限制,可以为单向指定,也可以为双向指定,当然条件允许的条件下,也可以为多向指定。在本发明实施例中,指定方式包括但不限于以下几种形式(1)单向指定
在图2中,如果只要求portl down后,要将port3关闭,反之port3 down后不需要将portl关闭,这种情况就属于单向指定,对于单向指定,指定端和被指定端是固定的不变的,所以,故障检测只能在指定端进行,故障隔离和恢复只能在被指定端进行。(2)双向指定在图2中,如果要求portl down后,要将port3关闭,port3 down后也需要将 portl关闭,这种情况就属于双向指定,对于双向指定,两端都可以同时作为指定端和被指定端,只要有一端检测到故障,都需要在另一端做隔离操作。(3) 一对多指定如图4所示,在图4所示的实施例中,如果要求portl down后,要将port2、port3、 port4同时关闭,这种情况就属于一对多指定。(4)联动指定如图4所示,在图4所示的实施例中,如果要求port2 down后,要将portl关闭, 继而由于portl down,要将port3、port4同时关闭,这种情况就属于联动指定。(5)在环网上的指定图5是根据本发明优选实施例的一个优选实施方式的环网应用示意图,在图5所示的环网实例中,当portl down后,可以将port2、port3、port4中的一个或多个关闭。在此,需要说明的是,上述五种实施例可以组合使用。其中,对于双向指定(即,两端都需要对对端的故障做出反应)而言,指定端和被指定端是相对的,发生故障之后才会确定指定的角色和被指定的角色。当某一关联端口物理状态发生改变时,可以将该端(第一边缘设备)视为指定端,而该端的对端可以视为被指定端(第二边缘设备),当指定端监控到与其关联的端口 1 (port 1)状态发生变化后,则向对端(被指定端)发送携带有故障信息的消息(例如,在本发明实施例中,该消息为协议帧),以达到将端口 1的故障通知给被指定端。并且,被指定端在接收到指定端发送的携带有故障信息的消息后,还可以产生故障告警信息。 步骤S304,第二边缘设备根据第一关联端口的故障信息及与第二边缘设备关联的第二关联端口的物理状态,关闭第二关联端口。在本发明实施中,当第二边缘设备(被指定端)收到来自第一边缘设备(指定端) 的携带有故障信息的消息后,根据第一关联端口(例如,指定端关联的端口 portl)的故障信息和第二关联端口(例如,被指定端关联的端口 port 2)的物理状态关闭第二关联端口 (例如,port2)以达到故障隔离的目的。并且,在第二边缘设备关闭第二关联端口之后,第二边缘设备还可以将第二关联端口的物理状态更新为关闭状态,例如,在图2中,可以更新 (也可以称为迁移)端口 2(port 2)的物理状态为关闭状态。优选地,在本发明实施例的一个优选实施方式中,在第二边缘设备关闭第二关联端口之后,如果第一边缘设备检测到其关联的第一关联端口的故障恢复,则第一边缘设备可以向第二边缘设备发送携带第一关联端口的故障恢复信息的第二消息,第二边缘设备接收第一边缘设备发送的第二消息,然后第二边缘设备根据第一关联端口的故障恢复信息及与第二关联端口的当前物理状态,打开第二关联端口。其中,在第二边缘设备接收第一边缘设备发送的第二消息(携带有故障恢复信息)之后,第二边缘设备还可以产生故障恢复告警信息,优选地,第二边缘设备还可以将第二关联端口的物理状态更新为打开状态。例如,在图2中,可以更新(也可以称为迁移)端口 2(port 2)的物理状态为关闭状态。下面以图2中的链路发生故障时的应用实例的为例,对本发明实施的一个优选实施进行具体描述主要包括以下三个步骤步骤1,在图2中的边缘设备E、F上配置基本的CFM功能,并分别配置一个UP型 MEP,将它们与需要检测的边缘端口 portl和port3关联,此时为了检查E、F之间的连通性, 会周期性的往对端发送连通性检查消息(CCM帧,其中,CCM帧包括有hterface Status TLV字段,Interface Status TLV字段的格式如图6所示),当对远端配置故障检测和隔离功能后,CCM帧中的Interface Status TLV字段会携带关联端口的状态;步骤2,对于双向指定,两端分别监控关联端口的物理状态,当某一端的端口物理状态发生改变时,这一端即为指定端,本端的MEP监控到端口状态的变化后,设置CCM帧 WhterfaceMatus TLV字段为相应的值(其中,Interface Status TLV字段的取值如图7所示),通告给被指定端;对于单向指定,只需要在指定端监控关联端口的状态即可, 在本发明的优选实施方式中,hterface Status TLV字段使用了其中的isUp、isDown和 isDormant三个取值,分别代表三种端口状态端口物理状态为up、端口物理状态为down和端口因为需要隔离远端故障而被人为关闭,其中,本端的MEP对端口状态变化消息的处理流程如图8所示,该流程包括以下步骤S801,收到接口管理模块的消息;S802,判断消息的类型,如果是shutdown命令,则转至S803,如果是物理up,则转至S804,如果是物理down,则转至S805 ;S803,判断本地端口状态是否为isDormant,如果是,则转至S806,否则,结束流程;S804,判断本地端口状态是否为isUp,如果是,则转至S807,否则,结束流程;S805,判断本地端口状态是否为isDown,如果是,则转至S808,否则,结束流程;S806,本地端口状态迁移至isDown,结束流程;S807,本地端口状态迁移至isUp,结束流程;S808,本地端口状态迁移至isDown,结束流程;步骤3,被指定端的边缘设备在收到CCM帧后,可以首先检查其携带的Interface Status TLV字段信息,并根据hterface Status TLV字段的值和本端的关联端口的物理状态做出关闭或打开关联端口的动作以实现故障隔离或故障恢复,并产生相应的告警,还可以迁移(更新)本端关联端口的状态,其中,对CCM帧的处理流程如图9所示,该流程包括以下步骤S901,被指定端接收CCM报文;S902,判断接收到的CCM报文是否携带hterface Status TLV字段,如果是,则转至S903,否则,转至S904 ;S903,判断CCM报文携Shterface Status TLV字段的状态,如果为isUp,则转至 S904,如果为isDown,则转至S905,如果是isDormant,则结束流程;S904,判断本地端口状态是否为isDormant,如果是,则转至S906,否则,结束流程;S905,判断本地端口状态是否为isUp,如果是,则转至S907,否则,结束流程;S906,将本地端口状态迁移至isUp,并从物理上使端口 up起来;S907,将本地端口状态迁移至isDormant,并从物理上down掉端口。如图10所示,图10是根据本发明优选实施例的端口状态迁移图,其中,导致端口状态迁移的事件及其含义如下el 接收到携带端口状态为isDown的CCM帧;e2 接收到携带端口状态为isUp的CCM帧,或者由于某种原因导致CFM功能失效, 或者CCM连续性丢失;e3 为关联端口配置shutdown命令;e4 关联端口物理down (包括shutdown命令导致的);e5 关联端口物理up (包括no shutdown命令导致的)。端口状态迁移时的响应如下rl 设置关联端口状态为isDormant,从物理上down掉关联端口 ;r2 设置关联端口状态为isUp,从物理上使关联端口 up起来;r3 设置端口状态为i sDown ;r4 设置关联端口状态为i sUp。其中,除el_e5之外的事件不做出任何响应。使用上述实施例提供的以太网远端故障的处理方法,可以对远端故障做出检测, 并在本端对故障做出隔离操作,在远端故障消除后,本端可以对故障执行恢复操作,可以及时通知管理员采取相应的处理措施,特别是在本端有备份链路的情况下,可以快速地做倒换处理,尽量减少由于远端故障导致的数据丢失。图11是根据本发明实施例的以太网远端故障的处理装置的结构示意图,该装置位于第一边缘设备,如图11所示,该装置包括接收模块10和执行模块20。其中,接收模块10,用于接收接入链路另一端的第一边缘设备发送的第一消息,其中,第一消息是第一边缘设备在检测到其关联的第一关联端口发生故障时发送的,且第一消息中携带有第一关联端口的故障信息;执行模块20,连接至接收模块10,用于根据第一关联端口的故障信息及与第二边缘设备关联的第二关联端口的物理状态,关闭第二关联端口。其中,接收模块10还可以用于接收第一边缘设备发送的第二消息,其中,第二消息是第一边缘设备在检测到第一关联端口的故障恢复时发送的,且第二消息中携带有第一关联端口的故障恢复信息;执行模块20还可以用于根据第一关联端口的故障恢复信息及与第二边缘设备关联的第二关联端口的物理状态,打开第二关联端口。图12是根据本发明优选实施例的以太网远端故障的处理装置的结构示意图,该装置用于实现上述实施例提供的以太网远端故障的处理方法,如图12所示,该装置还可以包括告警模块30和更新模块40。其中,告警模块30,用于根据接收模块接收到的消息中携带的信息,产生相应的告警信息;更新模块40,用于根据执行模块对第二关联端口执行的操作,更新第二关联端口的物理状态。图13是根据本发明优选实施例的一个优选装置的结构示意图,如图13所示,该优选装置包括CFM单元131、驱动单元132、收发包单元133、接口管理单元134、告警单元135以及操作维护单元136。其中,CFM单元131,用于协议的运行、维护一个端口状态状态机,能够通告本端故障,也可以对远端故障做出检测,并通知驱动单元132做出故障隔离和故障恢复操作;驱动单元132,用于关闭或者打开端口,以实现故障隔离和故障恢复;收发包单元133,用于故障通告报文的发送和接收;接口管理单元134,用于定时轮询关联端口状态, 并将关联端口状态的变化信息通知给CFM单元131 ;告警单元135,用于检测到远端故障或者远端故障恢复时产生告警,并通知网络管理员;操作维护单元136,用于接收用户的配置命令并下发给相关单元。使用上述实施例提供的以太网远端故障的处理装置,可以对远端故障做出检测, 并在本端对故障做出隔离操作,在远端故障消除后,本端可以对故障执行恢复操作,可以及时通知管理员采取相应的处理措施,特别是在本端有备份链路的情况下,可以快速地做倒换处理,尽量减少由于远端故障导致的数据丢失。从以上的描述中,可以看出,本发明实现了如下技术效果采用以太网远端故障的处理方法及装置,解决了现有技术中上行链路或下行链路发生故障后,由于上行链路和下行链路不属于同一个网络管理者而导致通信中断的问题,避免了大量的数据丢失的效果。 网络中的边缘设备能够定时检测链路故障,并在检测到故障之后及时通知对端的边缘设备,从而使对端的边缘设备根据故障信息关闭与其关联的端口,并在链路故障恢复之后,打开其端口从而重新传输数据。显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种以太网远端故障的处理方法,其特征在于,包括接入链路一端的第二边缘设备接收所述接入链路另一端的第一边缘设备发送的第一消息,其中,所述第一消息是所述第一边缘设备在检测到其关联的第一关联端口发生故障时发送的,且所述第一消息中携带有所述第一关联端口的故障信息;所述第二边缘设备根据所述第一关联端口的故障信息及与所述第二边缘设备关联的第二关联端口的物理状态,关闭所述第二关联端口。
2.根据权利要求1所述的方法,其特征在于,在所述第二边缘设备接收第一边缘设备发送的消息之前,所述方法还包括所述第一边缘设备检测到与其关联的所述第一关联端口发生故障,向所述第二边缘设备发送所述第一消息。
3.根据权利要求1所述的方法,其特征在于,在所述第二边缘设备关闭所述第二关联端口之后,所述方法还包括所述第二边缘设备将所述第二关联端口的物理状态更新为关闭状态。
4.根据权利要求1所述的方法,其特征在于,第二边缘设备接收第一边缘设备发送的所述第一消息之后,包括所述第二边缘设备产生故障告警信息。
5.根据权利要求1至4中任一项所述的方法,其特征在于,在所述第二边缘设备关闭所述第二关联端口之后,所述方法还包括所述第二边缘设备接收所述第一边缘设备发送的第二消息,其中,所述第二消息是所述第一边缘设备在检测到所述第一关联端口的故障恢复时发送的,且所述第二消息中携带有所述第一关联端口的故障恢复信息;所述第二边缘设备根据所述第一关联端口的故障恢复信息及与所述第二关联端口的当前物理状态,打开所述第二关联端口。
6.根据权利要求5所述的方法,其特征在于,在所述第二边缘设备打开所述第二关联端口之后,所述方法还包括所述第二边缘设备将所述第二关联端口的物理状态更新为打开状态。
7.根据权利要求5所述的方法,其特征在于,所述第二边缘设备接收所述第一边缘设备发送的所述第二消息之后,所述方法还包括所述第二边缘设备产生故障恢复告警信息。
8.一种以太网远端故障的处理装置,位于接入链路一端的第二边缘设备,其特征在于, 包括接收模块,用于接收所述接入链路另一端的第一边缘设备发送的第一消息,其中,所述第一消息是所述第一边缘设备在检测到其关联的第一关联端口发生故障时发送的,且所述第一消息中携带有所述第一关联端口的故障信息;执行模块,用于根据所述第一关联端口的故障信息及与所述第二边缘设备关联的第二关联端口的物理状态,关闭所述第二关联端口。
9.根据权利要求8所述的装置,其特征在于,所述接收模块还用于接收所述第一边缘设备发送的第二消息,其中,所述第二消息是所述第一边缘设备在检测到所述第一关联端口的故障恢复时发送的,且所述第二消息中携带有所述第一关联端口的故障恢复信息;所述执行模块还用于根据所述第一关联端口的故障恢复信息及与所述第二边缘设备关联的第二关联端口的物理状态,打开所述第二关联端口。
10.根据权利要求8或9所述的装置,其特征在于,所述装置还包括更新模块,用于根据所述执行模块对所述第二关联端口执行的操作,更新所述第二关联端口的物理状态。
11.根据权利要求8或9所述的装置,其特征在于,所述装置还包括告警模块,用于根据所述接收模块接收到的消息中携带的信息,产生相应的告警信息。
全文摘要
本发明公开了一种以太网远端故障的处理方法及装置,其中,该方法包括接入链路一端的第二边缘设备接收接入链路另一端的第一边缘设备发送的第一消息,其中,第一消息是第一边缘设备在检测到其关联的第一关联端口发生故障时发送的,且第一消息中携带有第一关联端口的故障信息;第二边缘设备根据第一关联端口的故障信息及与第二边缘设备关联的第二关联端口的物理状态,关闭第二关联端口。通过本发明,网络中的边缘设备能够定时检测链路故障,并在检测到故障之后及时通知对端的边缘设备,从而使对端的边缘设备根据故障信息关闭与其关联的端口,并在链路故障恢复之后,打开其端口从而重新传输数据。
文档编号H04L12/24GK102231674SQ20111016380
公开日2011年11月2日 申请日期2011年6月17日 优先权日2011年6月17日
发明者张付友 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1