用于网络中的故障处理的方法和配置的制作方法

文档序号:7950899阅读:280来源:国知局

专利名称::用于网络中的故障处理的方法和配置的制作方法
技术领域
:本发明涉及树形结构网络中的故障处理。
背景技术
:用于交换信息的网络,诸如以太网,包括通过链路互联的节点。在网络中的一对端节点之间建立的连接可能会突然发生故障。已开发出这样的方法,即首先检测发生故障的连接,然后恢复所述连接。"生成树协议"(STP)是第一种用于以太网的恢复方法,其主要被开发用来避免环路,从而避免广播消息的循环。通过激活未使用链路,STP还提供路径冗余。在链路故障的情况下,则激活先前的备用链路,以联系分开的网络段。生成树的构建以从众多网桥中选择根网桥开始。剩余的网桥计算到根网桥的最短距离。提供这种到根网桥的最短路径的端口便为根端口。网桥通过桥协议数据单元(BPDU)消息交换生成树控制信息。STP主要的缺点是其较慢的收敛性。其故障恢复时间(failovertime)为十秒级别,一般约为30秒到60秒,并取决于网络设备的数量。STP的另一缺点在于很难对其进行控制。这就是说,可以配置第一棵树,但是故障后形成的树是不可预测的。"快速生成树协议"(RSTP)是以太网恢复协议(Ethernetresiliencyprotocol)发展的下一阶段。它保留了与STP相同的术语和大部分的参数。与STP的最重要差异在于,在这种协议中,端口可能的运行状态的数量从五个状态减少到三个状态。此外,端口中的消息处理并不取决于其在生成树中所承担的任务。BPDU保持相同的格式,在其中只引入很少的变化,即使用了标志字节的所有比特。STP的缺点之一就是,非根网桥只有在BPDU到达它们的根端口时才产生BPDU。与此相反,在RSTP中,每个网桥在预定的时间间隔(例如每隔2秒)内产生所谓的问候BPDU(helloBPDU)。此外,还将更快的老化应用于协议信息,即如果在三个连续的问候周期内未接收到问候,则协议信息立即失效。从而,将BPDU用作网桥之间的保持有效机制(keep-alivemechanism),这使得恢复更为快速。RSTP的收症夂时间被减少到秒级,因此还不能将其应用于电信级网络。EtheReal也是一种旨在提供生成树快速重构和故障检测的协议。EtheReal的故障检测机制使用相邻节点之间的周期性问候消息,以指示消息源是有效的。如果连续几个问候消息未到达,则假定连接已断开,并开始构建新的生成树。在EtheReal中,所有通过发生故障的链路的连接被终止,并在重建新的生成树后被重新建立。EtheReal的主要缺点在于,标准的以太网交换机并不支持该协议,而为了正常运行,所有的网络节点均必须通晓EtheReal。此外,它也不如使用预先计算的生成树的结构快速。故障检测也能够基于新近开发的"双向转发检测"(BFD)协议。最初,BFD被开发用于检查相邻节点之间的连通性,然后,它被扩展为"用于多跳路径的BFD"协议。然而,BFD还未被开发用于以太网。此外,需要在网络的各边缘节点之间运行点对点BFD来检测所有可能的链路故障,这会使得网络过度负载。随着虚拟局域网(VLAN)的越来越广泛的使用,现有的标准存在不足这一点变得日益明显,因为同一STP实例不适用于所有VLAN。因此,IEEE开发了"多生成树协议(MultipleSpanningTreeProtocol)"(MSTP)。MSTP融合了RSTP和VLAN的最佳特征。由MSTP引入的主要改进在于,可以将若干VLAN指定给单个生成树实例。如果存在多于一个实例,则这些实例相互独立。生成树实例的最大数目取决于以太网交换机其甚至可以达到上千个实例。因此,MSTP减少了支持大量VLAN所需的生成树实例数目。此外,通过提供多条路径,还能由MSTP实现负载均衡。除此之外,还可以将以太网划分为各个区域,这就使得,通过减小生成树的大小,大网络变得更易于处理。因此,相比于其先辈,MSTP在扩充性方面更佳,但是其收敛性却并不比RSTP更好。MSTP的特性启发了有关基于MSTP的容错方法的思路。也可将该思路应用于Viking系统中,其中,构建生成树,使得对两棵不同生成树中的任何端节点对而言,都存在至少两条不共享中间链路或节点的交换路径。每个生成树实例对应于特定的VLAN,因此,对VLAN的显式选择(explicitselection)将导致生成树的隐式选择(implicitselection)。在故障的情况下,端节点必须改变VLAN来选择替代路径。故障检测基于由网络交换机提供的支持。网络中的每个交换机均被配置为在故障情况下将SNMP自陷(SNMPtrap)发送到中央管理器。尽管这种方法基于标准以太网交换机,但它仍需要故障管理中心,这导致其成本效率不高,并会减慢故障恢复过程。中央管理器是中央服务器,其负责包括故障处理的网络的全局运行,其中包括故障处理。在故障通知后,该中央服务器查明哪些VLAN受到了影响,并将必要的重新配置通知端节点,以使用备用的VLAN。每个端节点都必须运行客户模块,该客户模块负责在运行期间选择VLAN。客户端也发起负载测量,且这些测量的结果被周期性地发送到中央管理器。因此,存在使用构建好的生成树的中央协调的流量管理。由该系统提供的故障恢复时间略少于一秒。
发明内容网络故障处理领域的上述技术存在的主要问题在于,它们的速度都太慢。这些方法都具有秒级或更长Sj故障检测时间,这在实时应用中是不能接受的。另一个问题是,很多上述方法会导致网络中的巨大流量负载。还有一个问题是,某些方法不符杏标准(例如以太网交换机)。又一个问题在于,一些方法不够健壮,例如,在某些系统中,故障处理是由中央单元执行的。另外,还有一个问题是,一些故障拾测系统只能应用于点到点连接,而不能应用于生成树。简言之,按以下方式解决了这些问题。在具有多个节点的网络中,配置了虚拟局域网VLAN,每个VLAN连接节点中的预定节点。以有规则的时间间隔发送广播有效消息,以检查VLAN是否有效。这些节点记录是否有效消息到达,并且在丢失预期消息时,广播通知便会被发送到所述节点中的其它节点。在该通知之后,这些节点将得知哪些VLAN在此刻是不能使用的。更具体地说,按如下方式解决了这些问题。使用了多个VLAN,并且配置这些VLAN的拓朴结构,使得至少一个VLA1SM皮保留,在网络中出现任何单一故障的情况下,该VLAN提供连通性。多个网络节点为边缘节点,且某些边缘节点专甩于有规律地在VLAN上广播有效消息。边缘节点监听不同VLAN上的这些消息。如果其中一个监听节点丟失了所述VLAN之一上的一个预期有效消息,则该节点通过将通知消息广播给所述VLAN.上的其他边缘节点来指示所述实际的VLAN在此刻不可用。本发明的一个目的在于在网络中提供快速的故障处理。另一个目的是所述处理仅略孩史地增加网络中的流量负载。另一个目的是使所述处理能遵循当前的标准。还有一个目的在于使所述处理在运行方面变得健壮和简便。另外,还有一个目的在于使所述处理能被应用于具有生成树的网络中。本发明的故障处理的主要优点是它巧速度很快。另一个优点是,本发明的故障处理较为简单,且仅会略微增加网络中的流量负载。另一个优点是,本发明的故障处理能遵循当前标准,并能与标准的内部节点相适应。又一个优点是,本发明的故障处理分布在网络中,这使得它较为健壮和可靠。另一个优点是,本发明的故障处理能够被应用于网络中的生成树。本发明的故障处理的优点还在于,它只使用4艮少的消息,并且这些消息的类型也较少。现在,将借助于实施例和附图更详细地介绍本发明。图la示出了具有一组故障处理消息的网络的;f既况;图lb示出了具有另一组故障处理消息的网络图2a、b、c和d示出了网络中的一种故障处理的时间图3a,b,c和d示出了网络中的另一种故障处理的时间图4、5和6各示出了网络中的故障处理的流程图图7和图7b各自示出了网络中的发送器节点的框图8a和图8b各自示出了网络中的通知器节点的框图;以及图9a和图9b各自示出了网络中的非特殊角色的节点的框图。具体实施例方式在图la中,示出了简单的以太网NW1的示例,将结合该示例介绍本发明的故障处理。在网络中,示出了四个交换机节点SW1,SW2,SW3和SW4,另外,也示出了四个边缘节点ENl,EN2,EN3和EN4。这些节点都由链路连接,只示出了这些链路中的一个链路Ll,以使图较为简单。图la中示出的网络NWl仅仅是用于说明的简化网络。自然,本发明能被应用于具有若干内部节点和边缘节点的宽广网络。网络NW1还具有未被图示出的节点,且该网络的另一部分仅由轮廓点划线和链路Cl来暗示。'在示例网络NW1中定义了三棵生成树,第一生成树ST1以节点之间的实线表示,第二生成树ST2以短划线表示,第三生成树ST3以虚线表示。虚拟局域网VLAN1,VLAN2和VLAN3被分别指定给各生成树ST1,ST2,ST3。网络NW1具有传送帧的任务,所述帧由流量消息M1的帧来示例。在图lb中也示出了网络NW1。图la和lb不同之处在于,它们的故障出现在不同的地方,这将在后面做详细介绍。在网络NW1和类似的网络中,可能会发生阻止流量消息Ml的帧到达它们的目的地的故障。所述故障可以是任何类型的故障,如交换机故障或连接失效。为使网络实现其功能,有必要检测故障,以使得受到影响的节点能够得到通知,并停止让这些节点发送消息。另外,在故障修复时,需要通知这些节点以再次开始发送。如上所述,存在若干能用于这类故障处理的方法。它们都具有不同的缺点,例如,速度较慢,会产生较重的流量负载,不符合标准或不够健壮。结合图la和lb,将会说明故障处理的实施例,该实施例能够克服以上的缺点。该故障处理是一种用于应用了基于树的转发的以太网架构或其他分组交换网的分布式故障处理机制,并通过事先计算多个生成树ST1、ST2和ST3提供了弹性。所有生成树连接网络节点EN1至EN4和SW1至SW4中的每个节点,如图所示,这些树的区别之处仅在于它们包含的链路不同。该架构包括可/人市场购买的标准以太网交换机SW1至SW4。在以太网NW1的边缘节点EN1至EN4中实施了提供故障检测和弹性所需的额外功能。在当前的实施例中,这些边缘节点是IP路由器。多个生成树ST1,ST2和ST3并用于提供保护交换,并且借助于VLAN或协议MSTP来实施树。这些生成树是静态的,并且在所述网络中被构造成,当任何网络元件中发生单一故障时,存在至少一棵完整的生成树。如上所述,虚拟局域网VLAN1,VLAN2和VLAN3之一被指定给这些生成树中的相应一棵。在边缘节点EN1到EN4中,借助于VLAN的ID号,可以控制转发到相应生成树的流量。也就是说,在本实施例中,保护交换在网络NW1中变成了VLAN交换。在本说明中,在VLAN和生成树之间存在——对应关系。在图la和lb所示的示例网络NW1中,需要所有三棵生成树ST1,ST2,ST3,以便能处理网络中可能出现的任何单一故障。在故障情况下,边缘节点EN1至EN4中的每个节点都需要停止向受影响的生成树转发帧(如流量消息Ml的帧)。因此,需要用于故障检测和用于通知所有边缘节点有关受特定故障影响的VLAN的身份的协议。下面将说明一种故障处理方法。首先,将更为宽广地描述故障处理的一个实施例,然后再结合图la,lb中的网络NWl、图2和图3给出详细的例子。提出了一种用于处理网络中的故障的新方法。在该实施例中,借助于网络中的生成树(如网络NW1中的生成树ST1至ST3)来处理故障。更一般地,上述网络是指其中使用树形拓朴来进行流量转发的分组交换网络(如以太网)。在这种新方法中,利用广播消息来检查所述生成树之一是否有效,以尽可能地减少流量和处理负载。因此,一些边缘节点被配置成有规律地在各VLAN中发送广播消息。所有其它节点记录这些消息的到达,且一些节点专用于即时地发送有关不可用的VLAN的广播通知(如果需要,在全部VLAN中广播)。在广播通知后,每个边缘节点均可得知哪些VLAN是不可用的。以下将描述故障检测的详细运作过程。在本实施例中,使用三种类型的消息-有效消息根据预定的保持有效周期KAP,这些消息在各VLAN中周期性广播。-故障消息在检测到故障时,这些消息在各个未受影响的VLAN中广播,并包含断开的VLAN的ID号。-修复消息为了通知故障的修复,这些消息在至少一个故障VLAN中(也可能是在每个VLAN中)广播。边缘节点扮演以下角色之一-发送器周期性地广播有效消息的边缘节点。-通知器在检测到故障时,即时地广播故障消息的边缘节点,并且在检测到故障修复时,广播修复消息。在另一种情况下,某些边缘节点是上面提到的快通知器节点,它们即时地广播故障消息。另一部分边缘节点也是通知器节点,但要稍慢一些,它们并不即时地广播故障消息,而是在其检测到故障的同一保持有效周期内广播所述消息。-非特殊角色节点一种边缘节点,如果它在一个保持有效周期内检测到故障,然后在下一个有效保持周期内检测到该故障消息消失,便广播故障消息。它既非发送器节点,也非通知器节点。在网络中至少存在两个发送器边缘节点,在每个VLAN中,它们根据保持有效周期周期性地广播有效消息。短时间内,几乎在同一时间,在一个接一个的VLAN中发送这些消息。从而,有效消息必须在被称为^r测时间间隔的短的和取决于拓朴的时间间隔内到达所有VLAN中的每个边缘节点。边缘节点必须监;f见消息的到达,例如,它们保存其中标记了有效消息的到达的表。在第一个消息到达时,启动定时器。如果没有在所述检测时间间隔内在所述表中标记一个或多个有效消息的到达,则认为相应的VLAN出现了故障。注意,各VLAN中所预期的有效消息的数、貝和网络中发送器节点的数目相同。所有边缘节点均监视有效消息的到达。存在一些通知器边缘节点,它们在检测到各VLAN中的故障后便广播故障消息,所述故障消息包含一个或多个断开的VLAN的ID。各边缘节点均接收故障消息,从而它们均会被告知该故障。限制了广播通知消息的节点的数目,以避免故障后过大的流量负载。然而,网络也需要对通知节点不能将有关故障告知其它节点这种情况做好准备。因此,如果当既非通知器亦非发送器的边缘节点根据有效消息的未能到达而检测到故障,且该节点在下一个检测时间间隔结束前未接收到预期的故障通知,则该节点也广播故障消息。发送器节点总是在所有VLAN中广播有效消息,即使之前检测到故障也是如此。如果故障得到了修复,那么检测到故障的边缘节点也会检测到该修复,因为它再一次接收到了之前丢失的有效消息。从而,通过将包含被修复的VLAN的ID的修复消息广播给其他节点,该边缘节点可以向其他节点通知该修复,这样,便可以再次将流量发送到该被修复的VLAN。发送修复消息的该边缘节点可以是通知器节点或其它检测到该故障的边缘节点。避免故障后的高流量负载的另一可能性是,如上所述,网络具有发送器节点和快通知器节点,^f旦是其它边缘节点是慢通知器节点。相比非特殊角色的节点,它们r播故障消息更快,但不能像快通知器节点那样即时地进4于广才番。对于网络NW1,现在将结合附图详细描述网络故障处理的以上得到笼统描述的实施例。在该示例中,节点EN3是其中一个发送器,节点EN2是其中一个通知器,节点EN1和EN4是其它类型的非特殊角色节点。图2示出了当通知器EN2注意到故障并发送故障消息时的情况。在该示例中,所述故障是节点EN3和SW3之间的对应于生成树ST2的连接发生故障。在图la中用X标记了该故障,且其附图标记为CD1。图2a,b,c,d是时间附图标记为T的时间图。图2a示出,发送器节点EN3为VLAN1,VLAN2和VLAN3上的生成树ST1,ST2和ST3分别传送有效消息Al,A2和A3。这些消息也在图la中标示了出来。这些有效消息在4艮短的周期时间TI内(几乎是同一时间)被广播,并且在记为KAP的各保持有效周期开始时被周期性地重复。在这些有效消息的最上部,用数字1,2和3表示在哪个VLAN上广播消息。在这些消息的中部表示了消息类型,在图2a中为有效消息,而下部则表示该消息与哪个VLAN有关。应当注意的是,时间间隔TI远小于检测时间间隔DI,并远小于图2a所示的情形。图2b示出,通知器节点EN2在检测时间间隔DI内接收了有效消息A1,A2,A3。由于信号在网络中的传播时间,接收被偏移了少量时间AT1。在前两个检测时间间隔DI中,所有的有效消息都被接收,但是在第三个检测时间间隔中,由于故障CD1的缘故,只接收了有效消息A1和A3。现在,通知器节点EN2通过VLAN2通知,生成树ST2中存在故障。图2c示出,在第三个4企测时间间隔之后,通知器节点EN2立刻发送故障消息Fl和F3。在这些消息的最上部用数字1至3表明了该消息到达所在的VLAN的身份。在该类消息的中部,表明了消息类型故障。在该类消息的下部表明了该消息与哪个(些)VLAN(在本示例中为VLAN2)有关。从图2b可知,故障被立刻修复,且通知器节点EN2在第四个4企测时间间隔DI内A收了所有的有效消息Al,A2,A3。因此,通知器节点EN2在VLAN(VLAN1,VLAN2和VLAN3)上发送修复消息Rl,R2和R3。在本示例中,修复消息在故障消息后的一个保持有效周期中被发送,以通知VLAN2重新开始工作,并且生成树ST2也如常运作。在另一种情况下,通知器节点EN2仅在修复的VLAN(VLAN2)上发送修复消息R2。在图中未示出这种情形。该实施例的优点在于,由故障处理引起的流量负载较低。图2d示出了其它节点EN1和EN4接收的消息。在前两个检测时间间隔中,上述节点接收到了有效消息Al,A2,A3。同样,接收被偏移了少量时间AT2。在第三个检测时间间隔中,这些节点仅接收了有效消息Al和A3,并且在同一保持有效周期KAP内4^收了故障消息Fl和F3。在接下来的保持有效周期中,节点EN1和EN4接收到了所有有效消息A1,A2,A3和修复消息R1,R2和R3。以这种方式,当在生成树SP1,SP2或SP3之一中出现故障时,以及当故障得到《务复从而所有生成树如常工作时,可以通过VLAN(VLANl,VLAN2和VLAN3)向其他节点告知这些情况。图3示出了当网络NW1中的非特殊角色节点之一EN4注意到故障并发送故障消息的情形。在该示例中,故障是节点SW1和SW3之间的对应于生成树ST2的连接发生故障。该故障在图lb中用X标记,其附图标记为CD2。需要强调的是,图la和lb示出的是相同的网络NW1。图3a,b,c,d是时间附图标记为T的时间图。在对于不同节点的图中,时间分别被偏移时段AT3和AT4。图3a示出,发送节点EN3为生成树STl,ST2和ST3分别在VLAN1,VLAN2,VLAN3上传送有效消息Al,A2和A3。在图lb中也示出了这些有效消息。消息如图2a中所示的一样被发送,并且消息的内容如同该图所示。图3b示出,节点EN4在第一个检测时间间隔DI内接收了所有的有效消息A1,A2,A3。在第二个保持有效周期KAP的第二个抬r测时间间隔内,由于故障CD2的缘故,只接收了有效消息Al和A3。在第二个保持有效周期KAP内未接收故障消息。在第三个检测时间间隔内,仍未接收消息A2,并且在该第三个^r测时间间隔结束之前未接收到故障消息。注意,故障CD2并未阻止通知器节点EN2接收到所有的有效消息A1,A2和A3,这可以通过图1理解。图3c示出了节点EN2的行为。当该节点在第二个检测时间间隔中只接收到有效消息Al和A3时,便等待故障消息Fl和F3,如图2d所示。如图3b所示,没有故障消息到达。因此,在第三个保持有效周期KAP内,节点EN4在VLAN(VLAN1和VLAN3)上广播故障消息F1和F3。从图3b可知,故障CD2在第三个保持有效周期KAP结束期间被修复,并且在第四个检测时间间隔中节点EN4接收到了所有的有效消息A1,A2,A3。在它在笫五个检测时间间隔内仍接收到所有的有效消息时,节点EN4便在第五个保持有效周期内广播修复消息Rl,R2,R3,如图3c所示。图3d示出了通知器节点EN2中的情形。在前两个检测时间间隔DI中,EN2接收了有效消息Al,A2,A3。在第三个^f全测时间间隔DI中,它仍接收到了所有的有效消息,但是在第三个保持有效周期KAP内,它还接收了故障消息Fl和F3。然后,该节点停止向VLAN(VLAN2)传送消息帧(例如流量消息Ml的消息帧)。在第四个检测时间间隔内,节点EN2仍接收了所有有效消息,第五检测间隔也是如此。在第五个保持有效周期中,'通知器节点EN2接收了修复消息Rl,R2,R3,并开始重新向VLAN(VLAN2)传送流量消息Ml的消息帧。网络NW1的剩余的边缘节点接收到故障消息Fl,F3时,便停止在报告存在故障的VLAN(在示例中为VLAN2)上传送消息帧(诸如流量消息Ml的帧)。在修复消息到达时,这些节点重新开始传送流量消息Ml的帧。然而,应当注意,发送器节点总是在所有VLAN中广播有效消息A1,A2,A3,即使它们之前已经接收到了故障消息也是如此。在图3中,简要地示出了另一实施例。在该实施例中,网络NW1具有作为发送器节点之一的节点EN3和作为发送器节点之一的节点EN2,这与以上所述的一样。不同之处在于,节点EN1和EN4现在具有上述的慢通知器节点的角色,而非不具有特殊角色的节点。'隻通知器节点具有比快通知器节点更大的4企测时间间隔,该时间间隔最多可以和保持有效周期KAP—样长。从而,可以在一个保持有效周期内完成故障检测。慢通知器节点EN4在第一个保持有效周期内接收到了所有的有效消息Al,A2和A3,但是在第二个保持有效周期内只接收到了两个有效消息Al和A3,如图3b所示。在图3c中,以短划线简要地示出,慢通知器节点EN4在第二个保持有效周期内广播故障消息F1和F3。这些故障消息没有被即时地发送,而是在第二个保持有效周期结束时浮皮发送。这比图2c中的普通通知器节点EN2要慢,但是比非特殊角色的节点要快。当所有有效消息再次出现时,从慢通知器节点发送修复消息,图中未示出这种情形。小部分边缘节点是快通知器节点且其它边缘节点(除发送器节点之夕卜)是慢通知节点的网络具有如下优点对于所有故障,检测都相当快速,而且由故障检测引起的流量负载相当低(在可接受范围内)。如上所述,网络的所有发送器节点为所有VLAN传送有效消息。所有这些有效消息都期望能到达通知器节点和其他非特殊角色节点。然而,在图2和3仅示出了从发送器节点EN3广播的有效消息和故障CD1、CD2对不同消息的影响。结合图2和图3,才是及了故障CD1和CD2。也提及了,故障涉及连接而非线路本身。所述的故障;险测方法自然也能检测到线路上的故障,但是这样以来用于修复的时间就要比图2和3示出的更长。边缘节点必须监视和记录故障检测消息的到达。为此,一种可能的实施方式是维持一些表来跟踪消息的到达。这些表是故障处理消息的基础,也就是说,根据这些表来决定是否必须要广播新消息。发送器节点不需要维持任何表。通知器节点维持用于记录有效消息巧表。表l示出了当故障CD1发生时,通知器节点EN2中的有效消息i。<table>complextableseeoriginaldocumentpage20</column></row><table>表1有效消息记录表非特殊角色的边缘节点必须记录有效消息的到达及故障消息的到达。表2示出了在故障CD1发生时节点'EN4中维持的故障消息表。如图2d中所示,该节点接收故障消息Fl和F3。<table>complextableseeoriginaldocumentpage20</column></row><table><table>complextableseeoriginaldocumentpage21</column></row><table>表2故障消息记录表然而,当故障CD2发生时,节点EN4中的表2是空的,故障CD2引发节点EN4广播如图3c中的指示VLAN(VLAN2)的故障的故障消息。在图7,8和9中给出了实施边缘节点的示例。图7示出了发送器节点EN3的框图。在图7a中,上述节点具有上层流量的接口71和下层流量的接口72。流量消息模块73通过接口71和72连接到网络。故障控制模块74连接到时钟75,广播模块76和消息选择模块77。后者在通过路径Nl中将流量消息Ml发送到流量消息模块73,并通过路径Ylt将故障协议消息(诸如Fl和Rl),发送到故障控制模块74。发送器边缘节点的主要任务是周期性地从广播模块76广播有效消息Al,A2和A3。而这是由故障控制模块74根据时钟75来调度的。当消息选择模块77向模块73发送流量消息时,用户流量未受到故障检测协议的影响。除了其在故障检测协议中扮演的角色外,故障控制模块74具有另一重要任务它控制VLAN交换,即它管理故障的处理和^f爹复。在图7b中示出了另一种方案,该方案仅描述了发送器节点中的故障处理部分。上述节点不具有流量消息模块73,并具有上层和下层数据单元的接口71b和72b。其它模块如图7a中所示。图8示出了通知器节点EN2的框图。图8a示出,与发送器节点相同,节点EN2具有上层流量接口81和下层流量接口82。流量消息模块83通过接口81和82连接到网、各。故障控制模块84连接到时钟85,广播模块86和消息选择模块87。后者通ii^径N2向流量消息模块83发送流量消息Ml,并通过路径Y2向故障控制模块84发送故障协议消息(诸如Fl和Rl)。通知器节点EN2也具有记录模块88,该模块包含上述的表1。通知器让常规流量保持不变。该通知器节点并不广播有效消息Al,A2和夺3,但是会借助表l(如上所述)而跟踪这些消息的到达。然而,如果出现故障或故障消失,该通知器节点会相应地从广播才莫块86广播故障消息Fl,F3或修复消息Rl,R2,R3。与发送器节点EN3—样,通知器节点EN2中的故障控制模块84控制VLAN交换。在图8b中,示出了另一种方案,该方案仅描述了通知器节点中的故障处理部分。该节点不具有流量消息模块83,并具有上层和下层数据单元的接口81b和82b。其它模块和图8a中相同。图9示出了非特殊角色节点EN4的框图。当通知器节点在故障处理中未履行它们的职责时,该节点就采取行动。在图9a中示出,和通知器节点一样,节点EN4具有上层流量接口91和下层流量《^口92。流量消息模块93通过接口91和92连接到网络。故障控制模块94连接到时钟95,广播模块96,记录模块98和消息选择模块97。后者通过路径N3而向流量消息才莫块93发送流量消息Ml,并通过^各径Y3而向故障控制模块94发送故障协议消息(诸如Fl和Rl)。节点EN4也具有记录模块98,该模块包含上述两个表表1和表2。节点EN4让常规流量保持不变,并且不广播有效消息Al,A2和A3。它借助表(表1和表2)(如上所述)来跟踪这些消息的到达。然而,当通知器节点未履行它们的职责时,非特殊角色节点就在故障出现或故障消失时相应地从广播才莫块96广播故障消息Fl,F3或修复消息Rl,R2,R3。如同发送器节点EN3—样,节点EN4中的故障控制模块94控制VLAN交换。在图9b中示出了另一种方案,该方案仅描述了非特殊角色节点中的故障处理部分。该节点不具有流量消息模块93,并具有上层和下层数据单元的接口91b和92b。其它模块和图9a中相同。在图4中示出了结合图1,2和3而介绍的故障处理方法的第一部分的流程图。该方法以步骤41开始,在该步骤中,指出发送器节点,如分组网络NW1中的节点EN3。在步骤42中,指出通知节点。在步骤43中,在节点之间定义了VLAN(VLAN1至VLAN3),可以借助上述的生成树和协议MSTP来完成这一过程。在步骤44中确定了连续的保持有效周期KAP,并在步骤45中确定了这些保持有效周、期内的检测时间间隔DI。在步骤46中,不论是否报告上述VLAN中的任一个发生故障,在这些VLAN上,重复广l番这些有效消息Al,A2,A3。在图5中,示出了本故障处理方法的第二个和主要的部分。在步骤46中,有效消息被重复地广播,如上所述。在步骤501中,边缘节点检查有效消息Al,A2,A3的到达。在下一步骤502中,节点检查是否所有有效消息都已于一个检测时间间隔DI内到达。如果是这样,则在分路Y1中,节点检查下一组有效消息。如果存在任何有效消息未能到达,则在分路N1中,可能会发生两种情况。在第一种情况下,如果是通知器节点记录了发生故障的有效消息A2,则该通知器节点在步骤503中广l番故障消息Fl和F3。在步骤504中,该通知器节点4全查有效消息6§到达,并且在步骤505中,该通知器节点检查是否所有的有效消息都在一个检测间隔DI内到达。如果不是这样,在分路N2中,该通知器节点在步骤504中继续检查有效消息的到达。在步骤505中,该通知器节点检查是否所有有效消息均在其中一个检测间隔DI内到达。如果不是这样,在分路N2中,在步骤504中,该节点再一次;险查有效消息的到达。如果所有有效消息已经到达,在分路Y2中,通知器节点在步骤506中广播修复消息Rl,R2和R3。然后,该通知器节点返回步骤501,并检查有效消息A1,A2,A3的到达。在第二种情况下,如果节点既不是发送器又不是通知器,则它在步骤507中检查故障消息Fl,F3的到达。在检测到有效消息丟失的保持有效周期的下一个保持有效周期中进行这种4企查。在步骤508中,在分路Y3中,故障消息已经到达,并且该节点返回步骤501,并检查有效消息A1,A2,A3的到达。在步骤508中,在分路N3中,故障消息还没有到达,且该边缘节点在步骤509中广播故障消息Fl,F3。在步骤510中,该节点检查有效消息的到达,且在步骤511中,该节点检查是否所有的有效消息在一个检测时间间隔DI内到达。如果不是这样,在分路N4冲,节点返回步骤510,检查有效消息的到达。如果所有有效消息已经到达,则在分'路Y4中,该节点在步骤512中广播修复消息Rl,R2和R3。然后,节点返回步骤501,检查有效消息的到达。图6中示出了本故障处理方法的第三部分的流程图。节点在步骤61中接收故障消息,这发生在步骤503或步骤509之后。在步骤62中,节点停止在发生故障的VLAN(VLAN2)上传送流量消息(例如,消息M1)。在步骤506或步骤512之后,上述VLAN上的节点在步骤63中接收4务复消息,并在步骤64中重新开始传送流量消息。对本发明实施例的上述描述涉及了一些并非绝对必要的步骤。本发明的更一般实施例涉及下列步骤在步骤41中指出发送节点,在步骤43中不借助生成树协议而定义VLAN,在步骤45中确定检测时间间隔,在步骤46中广播有效消息《在步骤501中监听有效消息,在步骤502中的在某节点中指示发生故障的有效消息,在步骤503或步骤509中从上述指示节点广播故障消息。在上述过程中引入其它步骤是有原因的。将某些节点指定为通知节点并不是必需的,但这可以使故障处理变得简单迅速。同样,确定的保持有效周期也使得处理变得更快。在使用通知器节点时,如果在通知器节点错过故障的情况下其它节点也能广播故障消息,则故障处理便会变得更为健壮。有利地,在广播故障消息后,可以以方法步骤504至506或步骤510至512完成故障处理,这样,便能首先停止流量消息Ml,然后在故障修复后,在步骤62至64中重新传送上述流量消息。在图la和lb中,示出了具有四个交换机节点和四个边缘节点的网络NW1,同时也暗示更大的网络是可能的。在实际中,网络常常要大的多,具有几百或者更多节点。需要注意,并非这些节点中的每个节点均被包括在VLAN中。一些节点可能不是很重要,因此可以忽略它们,以简化对剩余节点的故障处理。在图la到3d的实施例中,配置生成树STl,ST2和ST3,然后将VLAN指定给这些生成树。生成树协议MSTP提供了众所周知的方法,但它对于配置VLAN而言并非是必须的。比如,对于更小的网络,可以根据各种情况来配置VLAN,同时注意,对于任何单一故障而言,至少一个VLAN必须是完整的,连接着网络中所有被关注的节点。上述网络具有树形结构,本方法不限于树形结构,而是可以应用于任何这类网络。权利要求1.一种树形结构分组网络(NW1)中的故障处理方法,所述网络包括具有互联线路(L1)的多个边缘节点(EN1至EN4)和交换机节点(SW1至SW4),所述方法包括在所述网络中定义(43)至少两个不同的VLAN(VLAN1至VLAN3),所述VLAN各自连接所述节点的预定义集合其特征在于,所述方法还包括下列步骤将所述VLAN的所述边缘节点的第一部分(E3)定义(41)为发送器节点;在受限的时间间隔(TI)内,在所述不周VLAN上,从所述发送器节点广播(46)有效消息(A1,A2,A3),所述广播被周期性地重复;在所述VLAN的所述边缘节点中监听(501)所述有效消息(A1至A3);在所述监听的边缘节点(EN2,EN4)之一中指示(502,N1),至少一个所述有效消息(A2)未能在至少一个周期性重复的检测时间间隔(DI)内到达;在所述VLAN上,从所述指示节点(EN2,EN4)为对应于所述至少一个发生故障的有效消息(A2)的所述发生故障的VLAN(VLAN2)广播(503;509)故障消息(F1,F3)。2.根据权利要求1所述的故障处理方法,其特征在于,该方法包括定义(44)连续的保持有效周期(KAP),'所述保持有效周期各自包括一个所述的4企测时间间隔(DI);将所述边缘节点(EN1至EN4)的第二部分定义(42)为快通知器节点(EN2);在所述保持有效周期(KAP)开始时,广播(46)所述有效消息(A1至A3);在所述保持有效周期(KAP)之一中,.从至少一个所述通知器节点(EN2)广播(503)所述故障消息(F1,F3),其中,在所述的那个保持有效周期中,所述通知器节点(EN2)在相应的检测时间间隔(DI)内指示(502,N1)所述至少一个所述有效消息(A2)未能到达。3.根据权利要求2所述的故障处理方法,其特征在于,指示(502,Nl)所述发生故障的有效消息(A2)的所述通知器节点(EN2)是快通知器节点,它在所述故障被指示的所述保持有效周期中即时地广播所述故障(Fl,F3)消息。4.根据权利要求2所述的故障处理方法,其特征在于,不属于所述发送器或快通知器节点的所述边缘节点(EN1,EN4)是慢通知器节点,在这些慢通知器节点中的已于所述保持有效周期之一内指示所述发生故障的有效消息(A2)的一个节点在所述的那个保持有效周期结束时广播所述故障消息(F1,F3)。'5.根据权利要求1所述的故障处理方法,其特征在于,该方法包括定义(44)连续的保持有效周期(KAP),所述保持有效周期各自包括一个所述的才全测时间间隔(DI);将所述边缘节点(EN1至EN4)的第二部分定义(42)为通知器节点(EN2);在所述保持有效周期(KAP)开始时,广播(46)所述有效消息(A1至A3);指示(502,N1)所述至少一个有效消息(A2)未能在第一个所述保持有效周期(KAP)的所述检测时间间隔(DI)内到达,所述指示由不属于所述发送器节点或快通知器节点的另一个边缘节点(EN4)来执行;在所述另一个节点(EN4)中,指示(507,508,N3)所述故障消息(Fl,F3)未能在第二个连续的所述保持有效周期(KAP)的检测间隔(DI)内到达;在所述第二个保持有效周期(KAP)内,从所述另一个边缘节点(EN4)广播(509)所述故障消息(F1,F3)。6.根据权利要求1至5中任一项所述的故障处理方法,其特征在于,该方法包括在所述边缘节点(EN1至EN4)中,接收(61)所述至少一个故障消息(F1,F3);在所述边缘节点中,停止(62)在所述发生故障的VLAN(VLAN2)上传送流量消息(M1)。7.根据权利要求1至5中任一项所迷的故障处理方法,其特征在于,该方法包括如下步骤在广播了所述故障消息(F1,F3)的所述边缘节点中记录(504,505,Y2;510,511,Y4),所述发生故障的VLAN(VLAN2)上的所述有效消息(A2)再次出现;在至少所述发生故障的VLAN(VLAN2)上,从所述广播故障的边缘节点(EN2,EN4)广播(506:512)修复消息(R1,R2,R3),所述修复消息指示所述VLAN已被修复。8.根据权利要求6所述的故障处理方法,其特征在于,该方法包括如下步骤在所述边缘节点(EN1至EN4)中,记录(63)至少所迷发生故障的VLAN(VLAN2)上的指示所述VLAN(VLAN2)已被修复的修复消息(R1,R2,R3);在所述被修复的VLAN(VLAN2)上传送(64)流量消息(M1)。9.一种树形结构分組网络(NW1)中的用于故障处理的配置,所述网络包括具有互联线路(L1)的多个边缘节点(EN1至EN4)和交换机节点(SW1至SW4),所述网络具有至少两个不同的VLAN(VLAN1至VLAN3),所述VLAN各自连接所述-节点的预定义集合,其特征在于,所述VLAN的所述边缘节点的第一部分(E3)是发送器节点,这些发送器节点具有广播4莫块(76),用于在受限的时间间隔(T1)内,在所述不同的VLAN上广播(46)有效消息(A1,A2,A3),所述广播被周期性地重复;所述VLAN的除所述发送器节点之外的边缘节点具有附带第一表(表1)的记录模块(88,98),在所述第一表中,记录了所述有效消息(A1至A3),且这些边缘节点(EN2,EN4)被设置成指示是否至少一个所述有效消息(A2)未能在至少一个周期性重复的检测时间间隔(DI)内到达所述第一表;所述指示节点(EN2,EN4)具有用于在所述VLAN上为对应于所述至少一个发生故障的有效消息(A2)的所述发生故障的VLAN(VLAN2)广播(503;509)故障消息(F1,F3)的广播模块(86,%)。10.根据权利要求9所述的故障处理配置,其特征在于,所述边缘节点(EN1至EN4)被设置为记录连续的保持有效周期(KAP),所述保持有效周期各自包括一个所述的检测时间间隔(DI);所述发送器节点(EN3)被设置为在所述保持有效周期(KAP)开始时,从所述广播模块(76)广播(46)所述有ii消息(Al至A3);所述边缘节点(EN1至EN4)的第二部分是通知器节点(EN2),在这些通知器节点中,至少一个节点被设置为在所述保持有效周期(KAP)之一中从所述广播模块(86)广播(503)所述故障消息(F1,F3),其中,在所述的那个保持有效周期内,所述通知器节点(EN2)在相应的检测时间间隔(DI)中指示(502,Nl),所述至少一个有效消息(A2)未能到达所述第一表(表l)。11.根据权利要求9所述的故障处理配置,其特征在于所述边缘节点(EN1至EN4)被设置为记录连续的保持有效时间周期(KAP),所述保持有效周期各自包括一个所述检测时间间隔(DI);所述边缘节点(EN1至EN4)的第二部分是通知器节点(EN2);所述发送器节点(EN3)被设置为在所述保持有效周期(KAP)开始时,从所述广播模块(76)广播(46)所述有效消息(A1至A3);不属于所述发送器节点或通知器节点的至少另一个所述边缘节点(EN4)被设置为在所述第一表(表1)中指示(502,Nl),所述至少一个有效消息(A2)未能在第一个所述保持有效周期(KAP)的所述^r测时间间隔(DI)内到达;所述另一个边缘节点(EN4)在所述记录模块(98)中具有第二表(表2),并被设置为在第二表中指示(507,508,N3),所述故障消息(Fl,F3)未能在第二个连续的所述保持有效周期(KAP)的所述4企测间隔(DI)内到达;所述另一个边缘节点(EN4)被设置为在所述第二个保持有效周期(KAP)内从所述广播模块(96)广播(509)所述故障消息(F1,F3)。12.根据权利要求9,10或11中任一项所述的故障处理配置,其特征在于,并非属于所述发送器节点之一的边缘节点(EN1至EN4)被设置为接收所述至少一个故障消息(F1,F3);所述边缘节点具有控制模块(84,94),所述控制模块被设置为停止所述流量消息(M1)在所述发生故障的VLAN(VLAN2)上的传送。13.根据权利要求9,10或11中货、一项所述的故障处理配置,其特征在于,广播了所述故障消息(F1,F3)的所述边缘节点(EN2,EN4)被设置为在所述第一表(表l)中记录所述发生故障的VIAN(VLAN2)上的所迷有效消息(A2)再次出现;所述广播故障的边缘节点(EN2,EN4)被设置为在至少所述发生故障的VLAN(VLAN2)上广播修复消息(R1,R2,R3),所述修复消息指示所述VLAN已被修复。14.根据权利要求12所述的故障处理配置,其特征在于,所述边缘节点(EN1至EN4)被设置为记录(63)至少所述发生故障的VLAN(VLAN2)上的修复消息(R1,R2,R3),所述修复消息指示所述VLAN已净皮修复;所述边缘节点(EN1至EN4)^皮3殳置为在所述纟皮修复的VLAN(VLAN2)上传送(63)流量消息(M1)。全文摘要本发明涉及树形网络(NW1)中的故障处理,该网络(NW1)具有由线路(L1)互联的边缘节点(EN1至EN4)和交换机节点(SW1至SW4)。建立VLAN(VLAN1-VLAN3),使得至少一个VLAN在网络中出现任何单一故障的情况下提供连通性。可通过使用生成树(ST1,ST2,ST3)而建立VLAN。在边缘节点中,发送器(EN3)有规律地在VLAN上广播有效消息(A1,A2,A3),通知器(EN2)记录这些有效消息。丢失的有效消息指示VLAN(VLAN2)上的故障(CD1),并且通知器(EN2)在VLAN上广播相应的故障消息(F1,F2,F3)。在所有有效消息(A1,A2,A3)重新出现时,通知器(EN2)广播相应的修复消息(R1,R2,R3)。如果通知器没有记录故障,非特殊角色节点(EN1,EN4)就以略慢的速度执行与通知器(EN2)相同的功能。该故障处理快速、健壮,使用的消息很少,仅略微增加了网络(NW1)中的流量负载,并遵循当前的标准。文档编号H04L12/46GK101199165SQ200580050107公开日2008年6月11日申请日期2005年6月14日优先权日2005年6月14日发明者C·安塔尔,J·法卡斯,L·韦斯特伯格申请人:艾利森电话股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1