用于虚拟网络架构链路故障恢复的系统和方法

文档序号:7792204阅读:180来源:国知局
用于虚拟网络架构链路故障恢复的系统和方法
【专利摘要】聚合交换机通过多机箱链路聚合组连接至边缘节点,虚拟光纤节点提供连接,连接用于在聚合交换机之间交换关于MAC寻址的信息,以同步聚合交换机的MAC地址表。当检测到虚拟光纤故障时,将多机箱链路聚合组重新配置为两个或多个链路聚合,每个链路聚合将边缘节点连接至所述聚合交换机中的一个上。在链路聚合上启用生成树协议以防止在网络中出现回路。MAC地址表被清空,并通过两个或多个链路聚合重新学习。
【专利说明】用于虚拟网络架构链路故障恢复的系统和方法 【背景技术】 【技术领域】
[0001] 本发明大体上设计数据网络,特别涉及用于在一个或多个数据网络的节点之间提 供拓扑冗余和弹性的系统和方法。
[0002] 相关领域描沭
[0003] 数据网络运行多种不同计算设备,例如,个人计算机,IP电话装置或服务器互相通 信和/或与各种其它网元或连接至网络的远程服务器进行通信。作为示例而非限制,数据 网络可以包括支持多种应用,包括-例如-IP电话(VoIP),数据应用和音频应用的城域以太 网或企业以太网。这种网络通常包括许多互连的节点,俗称交换机或路由器,用于通过网络 对流量进行路由。
[0004] 通常基于各个节点在网络区域中的位置来对它们进行区分,取决于网络规模,网 络通常包括两个或三个"层"。通常,三层式网络由边缘层,汇聚层和核心层组成(两层式网 络仅由边缘层和核心层组成)。数据网络的边缘层包括边缘(也称为"接入")网,边缘网 通常提供企业网或家庭网(例如,局域网)与城域网或核心网的连通性。边缘/接入层是 网络-即,用户网络名义上所连接到的网络的进入点,位于边缘层的交换机被称为边缘节 点。不同类型的边缘网包括数字用户线路,光纤(fiber)同轴混合网(HFC)和到户光纤。举 例来说,边缘节点可以为连接的设备执行L2交换功能。边缘节点通常连接至汇聚层,汇聚 层终止来自多个边缘节点的接入链接。位于汇聚层的交换机被称为聚合(aggregation)交 换机。举例来说,聚合交换机可以对通过聚合链路从边缘节点接收到的流量执行L2交换和 L3路由。汇聚层连接至城域网或核心网,城域网或核心网对从(三层式网络中的)聚合交 换机或从(两层式网络中的)边缘节点接收到的流量进行L3/IP路由。可以理解,每个增 加的网络层中的节点通常具有更大的容量和更快的吞吐量。
[0005] 数据网络所面临的一个关键挑战是需要网络弹性,即在出现周期性组件故障,链 路故障等故障的情况下依然维持高可用性的能力,这对提供令人满意的网络性能而言至关 重要。网络弹性可以部分地通过拓扑冗余,即通过提供冗余节点(及节点中的冗余组件) 和节点之间的多个物理路径以防止单点故障来实现,部分地通过L2/L3协议实现,L2/L3协 议在出现故障时利用冗余来汇聚替代路径,以在网络中路由流量。可以理解,检测时间和收 敛时间必须快速发生(优选地,少于一秒),以无缝转换到替代路径。
[0006] 以太网协议是一种传输技术,广泛应用于局域网(LAN),例如家庭网和企业网中以 在计算机和网络之间通信。但是,以太网协议技术在接入网和汇聚网,以及城域网中的使用 持续提升和革新边缘网,就如同在企业网中所作的那样。作为一种接入技术,以太网相比其 他计入技术具有巨大优势,例如:(i)用于数据,视频和语音应用传输,不会过时;(ii)对于 数据业务而言,基础设施成本效益高;以及(iii)简单,国际认可的标准,确保互通性。
[0007] 为了使以太网技术适用于边缘和会聚层网络中的电信级业务环境,任然需要解决 诸多问题,其中包括对故障弹性。在一个已知的方案中,通常使用生成树协议(STP)来检测 故障并在以太网中发生故障时将流量转移到替代路径。一般而言,STP依赖于交换机之间 的多个物理路径,但是在任何时候只有一个路径是活动的可用于特定数据包流,而其它路 径保持为阻止模式(限定"主动/被动"范例)。当发生故障时,替代路径退出阻止模式进 入活动状态,以再次建立连接。
[0008] 但是,在一些网络拓扑中,STP会产生不可接受的收敛时间(例如,高达数秒),包 括但不限于数据网络中边缘节点和聚合交换机之间的收敛时间。此外,STP仅提供主动/被 动操作范例,不是所有的链路都同时积极对流量进行转发。
[0009] 因此,需要用于在一个或多个物理的节点之间,作为示例而非限制,以太网的边缘 节点和聚合交换机之间提供弹性的系统和方法。需要用于提供通信控制协议的系统和方 法,该通信控制协议是弹性的,且适用于多种类型的网络节点。需要用于在这种网络中的一 个或多个链路出现故障时提供恢复的系统和方法。 【专利附图】

【附图说明】
[0010] 图1显示了根据本发明的网络架构的实施方式的框图;
[0011] 图2显示了根据本发明的多机箱(chassis)系统的实施方式的框图;
[0012] 图3显示了根据本发明的多机箱系统中聚合交换机的实施方式的框图;
[0013] 图4显示了根据本发明的多机箱系统中聚合交换机的网络接口模块的实施方式 的框图;
[0014] 图5显示了根据本发明的多机箱系统中聚合交换机中通过的数据包流的实施方 式的框图;
[0015] 图6显示了根据本发明的多机箱系统中源地址学习的实施方式的框图;
[0016] 图7显示了根据本发明的多机箱系统中的数据包的前置报头的实施方式的框图; 图8显示了根据本发明的聚合交换机的管理控制模块的实施方式的框图;
[0017] 图9显示了根据本发明的多机箱系统中的链路状态的实施方式的框图,此时虚拟 光纤链路可运行;
[0018] 图10显示了根据本发明的多机箱系统中的链路状态的实施方式的框图,此时虚 拟光纤链路出现连接故障;
[0019] 图11显示了根据本发明,当虚拟光纤链路出现连接故障时进行恢复的实施方式 的框图;
[0020] 图12显示了根据本发明,当虚拟光纤链路出现连接故障时进行恢复的实施方式 的框图;
[0021] 图13显示了根据本发明,用于对聚合交换机上的多机箱链路聚合进行重配置的 方法的实施方式的逻辑流程图。
[0022] 图14显示了根据本发明,用于通过聚合交换机启用生成树协议(STP)的方法的实 施方式的逻辑流程图。
[0023] 图15显示了根据本发明,用于在VFL可运行时通过聚合交换机返回多机箱模式的 方法的实施方式的逻辑流程图。
[0024] 图16显示了根据本发明,用于通过聚合交换机以独立模式运行的方法的实施方 式的逻辑流程图。
[0025] 图17显示了根据本发明,用于通过聚合交换机以多机箱模式运行的方法的实施 方式的逻辑流程图。 【具体实施方式】
[0026] 图1显示了具有多机箱链路聚合的弹性网络100的实施方式,弹性网络100提供 主动/主动范例(即,所有链路都同时积极对流量进行转发),该主动/主动范例对网络节 点的能力进行更加充分的利用。本文中使用以下缩略语:
[0027] CMM机箱管理模块
[0028] LAG链路聚合
[0029] L2网络0SI模式的第二层("数据链路层")
[0030] L3网络0SI模型的第三层("网络层")
[0031] MAC媒体存取控制协议
[0032] MC-LAG多机箱链路聚合组
[0033] MC-VFA多机箱虚拟网络架构(fabric)聚合
[0034] MIM网络接口模块
[0035] STP生成树协议
[0036] VLAN虚拟局域网
[0037] ASIC特殊应用集成电路
[0038] 本申请参考了以下标准,并通过引用结合至本申请:1)链路聚合控制协议 (LACP),它是之前的IEEE 802. 3第43款,由IEEE 802. 3ad工作组于2000年3月增加,目前 于2008年11月3日合并到IEEE802. 1AX-2008中;2) IEEE标准802. 1Q,虚拟桥接局域网, 2005版;3) IEEE 802,针对局域网和城域网的ID标准:媒体存取控制(MAC)桥,2004版。
[0039] 链路聚合控制协议(LACP)提供了一种对两个对等节点之间称作链路聚合组 (LAG)的多个物理链路的捆绑进行控制,以在两个对等节点之间形成单个逻辑通道的方法。 对等节点通过交换LACP数据包协商将物理链路捆绑到LAG中,或者可以手动配置LAG。链 路聚合提供了一种廉价的方法,它传输的数据比任何单个端口或链路能够传输的数据更 多。在一个实施方式中,LAG的端口包括相同的物理类型,例如所有的铜制接口(CAT-5E/ CAT-6),所有的多模光纤接口(SX),或所有的单模光纤接口(LX)。在另一个实施方式中, LAG的端口具有不同的物理类型。
[0040] 为了提供增加的弹性并消除单点故障,如图1所示,LAG跨越两个设备,在这里称 为多机箱链路聚合组(MC-LAG)102。举例来说,在图1中,MC-LAG 102a源自边缘节点104, 分为两个子集,连接至两个聚合交换机106a和106b,每个子集中包括MC-LAG102a的一个 或多个物理链路。在一个实施方式中,边缘节点104可以使用负载均衡技术将流量分配到 在MC-LAG102a的所有可用链路上。对于每个在MC-LAG102a上传输的数据包,基于负载均 衡算法(通常包括哈希函数,其运算源和目的互联网协议(IP)或媒体存取控制(MAC)地址 信息)选择物理链路中的一个。在MC-LAG 102物理链路上的负载均衡使带宽得到更加有 效的使用。
[0041] 如图1所示,边缘节点104通过接入网122连接至LAN中运行的企业网设备110, 例如,网桥,交换机,路由器等,和/或也可以连接至家庭网设备112,例如DSL调制解调器, 机顶盒,光端机等。边缘节点104是交换机或服务器,就功能而言,可以包括数字用户线路 接取复用器(DSLAM),缆线数据机终端系统(CMTS),光线路终端(OLT)等,在一个实施方式 中可以包括其它类型的设备。
[0042] 在一个实施方式中,聚合交换机106连接至虚拟网络架构链路(VFL) 124。VFL 124 提供一个连接,该连接用于在聚合交换机106之间交换信息,信息关于流量转发,MAC寻址, 组播流,地址解析协议(ARP)表,L2控制协议(例如,生成树,以太网环保护,逻辑连接检测 协议),路由协议(例如,RIP,OSFP,BGP)和连接到它上面的MC-LAG102的状态。聚合交换 机106的运行对于边缘节点104是透明的,并被边缘节点104视作为单个逻辑设备。在一 个实施方式中,边缘节点104能够主动转发MC-LAG102a上的流量,而聚合交换机106之间 MAC地址表和其它转发信息的同步则由VFL 124上的层2 (L2)数据包流驱动,控制消息的数 量减少。该功能使边缘节点104成为这对聚合交换机106的双重归属,并提供L2多路径内 部结构(intra-structure)和 L3 接入基础结构(infra-structure)。
[0043] 此外,在一个实施方式中,该多机箱虚拟网络架构聚合(MC-VFA)功能在不需要边 缘节点104和聚合交换机106之间具有L2冗余协议(例如,生成树),的情况下提供该功 能,同时依然实现对边缘链路故障和聚合/核心交换机故障的电信级检测和收敛时间。目 前许多网络设计,特别是针对数据中心的网络设计要求在边缘节点和聚合交换机之间具有 越来越多的L2邻接。这个趋势推动了生成树协议的极限,例如,回路(loop)检测功能和收 敛时间。在当前网络拓扑中,生成树收敛时间可以高达数秒。一个实施方式中的多机箱架 构在边缘节点104和聚合交换机106之间提供了一种双归属的L2多路径连接,优选不需要 进行生成树协议操作以实现回路预防,同时弹性依然足够允许生成树协议操作和网络拓扑 的一些部分中的多机箱功能(即,在聚合交换机之间的VFL 124上,或将聚合交换机连接至 核心网节点116或其它交换机/路由器的链路上)。
[0044] MC-VFA架构的一个优点是边缘节点104的主动/主动转发模式,由此到聚合交换 机106a和聚合交换机106b的两组MC-LAG上行链路都对流量进行处理,以提高MC-LAG链 路的带宽的效率。在一个实施方式中,该功能还促进针对接入上行链路故障和节点故障的 快速故障检测和收敛时间。此外,还在此描述了一种在VFL 124出现故障时进行恢复的机 制。
[0045] 如图1所示,在一个实施方式中,利用在此描述的MC-LAG功能(MC-VFA架构的一 部分),聚合交换机106还连接至城域网或核心网120,城域网或核心网120包括一个或多 个网络节点116,例如,网络交换机和/或路由器。例如,聚合交换机106b通过MC-LAG 102b 连接至网络节点116b和116c,其中为了节点116b和116c同样通过VFL交换状态信息。 MC-LAG 102b架构在聚合交换机106b和网络节点116b之间提供一种双重归属的L2多路径 连接。在一个实施方式中,如图所示,还可以使用MC-LAG功能将网络节点116与MC-LAG和 VFL 124连接。聚合交换机106还可以使用标准LAG,例如LAG118,或其它主干(trunk)或 链路连接至网络节点116。
[0046] 现在参考图2对MC-LAG架构进行更详细的描述。边缘节点104a通过第一MC-LAG1 102a连接至聚合交换机106a和106b,而边缘节点104b通过第二MC-LAG2 102b连接至聚 合交换机104a和104b。每个MC-LAG102a和102b包括多个网络链路,多个网络链路划分为 至少两个子集,其中每个子集包括至少一个物理链路。如图2所示,第一组MC-LAG102a物 理链路终止于第一聚合交换机106a,而第二组MC-LAG102b物理链路终止于第一聚合交换 机106b。MC-LAG1形成了双重归属的L2多路径。MC-LAG成员端口是外部的用户端口,它们 是MC-LAG的成员。VFL 124是链路聚合(LAG),在一个实施方式中,LAG跨越每个聚合交换 机106上的多个网络接口模块以获得弹性,并提供机箱间流量和控制/状态数据传输。多机 箱系统140包括聚合交换机106,虚拟网络架构链路124,MC-LAG 102a和102b中的至少一 个以及它们各自的连接至相应下游边缘节点104的MC-LAG成员端口。聚合交换机106a和 106b可以位于箱体的地理区域,例如,中心局或数据中心,或位于分开的地理位置,例如,位 于不同的建筑或城市以提供地理多样性。
[0047] 边缘节点104作为连接至聚合交换机106的MC-LAG客户端,能够使用不同的方法 来将流量分配给MC-LAG的链路,只要对于给定的数据包流而言链路的选择保持不变。这确 保了流量在任何一对通信终端之间依次传输。在一个实施方式中,优选将从边缘设备到每 个LC-LAG聚合交换机的上行链路端口的数量被配置为相同。也就是说,如果为边缘节点和 一个聚合交换机之间的MC-LAG配置了两个上行链路,则同样为边缘节点和其它聚合交换 机之间的MC-LAG配置两个上行链路。尽管是非强制性的,该被配置为聚合交换机和边缘节 点之间的流量提供了 一种更加均匀的流量分配。
[0048] 现在参考图3对聚合交换机106之间的虚拟网络架构链路(VFL) 124进行更 详细的描述。在一个实施方式中,每个聚合交换机106包括至少一个控制管理模块 (CMM) 105a (主),优选还包括第二CMM模块150b (备),以及多个网络接口模块(NM) 152, 例如线路卡或端口模块。VFL124是连接至第一和第二聚合交换机106中的一个或多个NM 152的VFL成员端口的集合。例如,VFL包括聚合交换机106a的NM 152a和聚合交换机 106b的NM 152b之间的物理链路的第一子集A,以及聚合交换机106a和106b的ΝΜ 152η 之间的物理链路的第二子集Β。在一个实施方式中,VFL链路连接在聚合交换机106的ΝΜ 中的交换ASIC 210之间。每个NM 152还包括排队ASIC 210,下面将会进一步描述。交换 网络架构集成电路(1C) 214在聚合交换机106中的不同NM 152之间提供互连。
[0049] 对多机箱系统中的每个聚合交换机106分配一个唯一机箱标识符。每个聚合交换 机106的机箱ID是唯一的,并且是全局性的,例如,每个聚合交换机知道它的对等聚合交换 机的机箱ID。还为每个聚合交换机106中不同组件,例如IC,NM,CMM生成唯一硬件设备 标识符(MID),以对本地和远程目的进行管理。在一个实施方式中,交换ASIC 210的硬件设 备标识符在多机箱系统中具有全局意义,而其它组件,例如排队ASIC212的MID可能仅具有 本地意义。例如,两个聚合交换机106都知道分配给交换ASIC 210的硬件设备标识符,而 其它设备的硬件设备标识符限制为仅被本地聚合交换机知道,对远程聚合交换机没有任何 意义。
[0050] 在一个实施方式中,交换ASIC 210分配有全局性的唯一硬件设备标识符(MID), 所述唯一硬件设备标识符位于分配给其聚合交换机的范围中,例如:
[0051] 聚合交换机106a :机箱ID = 1,MID的值为0至31
[0052] 聚合交换机106b :机箱ID = 2, MID的值为32至63
[0053] 图3显示了分配给交换ASIC 210的示例性MID。通过知道所分配的范围,模块能 够根据交换ASIC的MID确定它的位置是位于聚合交换机106a还是聚合交换机106b中。
[0054] 在一个实施方式中,交换ASIC 210以前置报头模式运行,以在聚合交换机106之 间交换数据和控制数据包。图4更详细地显示了网络接口模块(NIM) 152的一个实施方式的 框图。交换ASIC 210包括连接至外部节点,例如边缘节点104a和104b的多个外部端口接 口 240。外部端口节点240中的一个或多个可以包括用于MC-LAG,LAG或其它主干组,固定 链路等的成员端口。外部端口 240可以具有相同的物理接口类型,例如铜制端口(CAT-5E/ CAT-6),多模光纤接口(SX)和单模光纤接口(LX)。在另一个实施方式中,外部端口 240可 以具有一种或多种不同的物理接口类型。
[0055] 外部端口 240分配有与交换ASIC 210相关的外部端口接口标识符(端口 ID),例 如,设备端口值,例如gport值或dport值。在一个实施方式中,交换ASIC 210的MID和交 换ASIC 210上的外端端口 240的外部端口接口标识符被用于唯一地识别多机箱系统140 中的本地或远程聚合交换机106上的交换ASIC 210的物理外部端口接口 240。在另一个实 施方式中,包括转换模块或其它实体的端口管理器(Port Manger)可以将交换ASIC210的 MID和外部端口标识符转换为单个整数值,以生成全局性端口值(GPV),例如,MID4,外部端 口标识符(dport)5转换为GPV20。在两个实施例的任意一个中,在本地聚合交换机和远程 聚合交换机中为NM152的外部端口生成外部端口标识符。唯一端口标识符还可以分配至 交换ASIC 210的内部端口,例如,从交换ASIC 210到NM 152上的处理模块的内部接口。 这些内部端口还通过端口标识符和交换ASIC的MID被唯一地识别。
[0056] 交换ASIC 210还包括数据包管理单元(PMU) 242,其确定输入的数据包的目的地 址。数据包可以被交换至交换ASIC10的另一个外部端口接口 240,或交换至排队ASIC 212 以传输至本地或远程聚合交换机上的另一个NM 152,或交换至处理器接口(PI) 244以传 输至NM 152的处理模块266,处理模块266位于交换ASIC 210之内或之外。
[0057] 当数据包传输至本地或远程聚合交换机上的另一个NM 152时,在一个实施方式 中,交换ASIC 210将数据包传输给前置报头接口(PPHI),前置报头接口对数据包报头进行 修改或添加以使其包括硬件设备信息(HDI)。HDI包括与数据包的源和/或目的相关的硬 件装置的标识符。在一个实施方式中,前置报头可以包括其它信息,例如数据包优先级和 负载均衡标识符。未获得HDI信息,PPHI对MAC/HDI转发表250执行查找程序。存储于地 址表存储器248中的MAC/HDI转发表250包括MAC地址项(entry)列表,例如,用于外部设 备,节点,模块,软件或连接至聚合交换机106的硬件的MAC地址。MAC地址项包括相关的硬 件设备信息,硬件设备信息用于对数据包进行桥接或路由使其到达具有相关MAC地址的设 备。举例来说,目的硬件设备信息包括本地或对等聚合交换机的与目的MAC地址相关的交 换ASIC 210的端口标识符和MID (例如,MID = 24,端口 ID = 5,或者MID = 54,设备端口 =12)。在另一个实施方式中,目的硬件设备信息可以包括与目的MAC地址相关的外部端口 接口的全局端口值(GPV)。MAC/HDI转发表250可以包括一个或多个表,例如源主干表,主 干位图表,VLAN映射表等。在一个实施方式中,MAC/HDI转发表250或者它的一部分可以位 于MIN152的排队ASIC中。
[0058] 在一个实施方式中,当交换ASIC 210包括具有到远程聚合交换机的链路的活动 VFL成员端口时,MAC/HDI转发表250可以包括附加 HDI信息,例如,将gport值关联到交换 ASIC MID值和设备端口值中的表和/或具有对外部端口接口的逻辑聚合组标识符映射的 表。
[0059] 在一个实施方式中,前置报头包括与源端口(例如,外部或内部端口接口)相关的 硬件设备信息HDI,包括交换ASIC的硬件设备标识符MID和源端口的设备端口标识符。
[0060] 在另一个实施方式中,前置报头包括与连接至VFL端口 124的交换ASIC 210相关 的HDI。连接至VFL端口 124的交换ASIC 210接下来在通过VFL传输数据包之前转化或转 换前置报头中的HDI。
[0061] 在一个实施方式中,PPHI246还添加与源端口,例如,第一个接收到数据包的外部 端口接口 240相关的源硬件设备信息。源硬件设备信息可以包括交换ASIC 210的MID和 外部端口接口 240的端口标识符(例如,设备端口)和/或全局端口值(GPV)。在一个实 施方式中,附加信息,例如目的硬件设备标识符或MID,目的设备端口,VLAN ID,数据包类型 (组播,单播,广播),数据包优先级和负载均衡标识符也被添加至前置报头。在一个实施方 式中,从地址表248,例如MAC/HDI转发表250检索目的HDI。
[0062] 具有前置报头的数据包接下来被传输至排队ASIC 212,以通过网络架构1C 214 上路由。排队ASIC 212包括数据包缓冲器260,提供流量和缓冲管理的排队管理器262,以 及全局HDI地址表264。全局HDI地址表264将目的HDI映射至其它NIM 152的一个或多 个中的排队ASIC 212中的合适队列。例如,映射基于前置报头中的硬件设备信息提供信 息,该信息用于将数据包交换到聚合交换机106中的其它排队/交换ASIC中的外部端口接 口中的一个或多个的合适出口队列在另一个实施例中,当目的HDI指示目的为远程聚合交 换机时(即,目的设备标识符属于远程/对等交换机范围),排队ASIC 212将数据包交换到 本地聚合交换机106中的VFL端口中的一个或多个的合适出口队列中,以通过VFL 124传 输至远程聚合交换机,例如,全局HDI地址表264指示相关的硬件设备位于远程聚合交换机 上。
[0063] 在一个实施方式中,基于前置报头中包括的之前由交换ASIC 210插入的负载均 衡标识符来确定与特定VFL端口接口对应的出口队列。尽管交换ASIC 210和排队ASIC 212显示为独立的集成电路或模块,但是ASIC的一个或多个功能或组件可以包括在另一个 ASIC中,或者结合到另一个ASIC中,或者在一个或多个集成电路中实现。
[0064] 图5显示了通过聚合交换机106a到达VFL 124的数据包流的实施方式的框图。 在该实施例中,具有源MAC地址的设备300,例如,企业设备110或家庭网络设备112将数 据包通过-例如,边缘节点104-传输至聚合交换机160a,聚合交换机106a具有能够通过 远程聚合交换机l〇6b的外部端口接口被访问的设备的目的MAC地址。ΝΜ 152η中的交换 ASIC 210η (举例来说,如图5所示,其MID = 5)接收外部端口接口 240 (举例来说,其端口 ID = 2)上的数据包。交换ASIC 210η提取目的MAC地址并制定地址表查找以确定与来自 MAC/HDI转发表250的目的MAC地址相关的硬件设备信息(HDI)。举例来说,目的HDI可以 包括位于到具有MAC地址的目的设备的路径中的一个或多个硬件组件的设备模块标识符 (MID),例如,具有MAC地址的目的设备为本地聚合交换机106a或远程聚合交换机106b的 NM 152,排队ASIC 212,交换ASIC 210,外部端口标识符240, VFL240的成员端口。在一 个实施方式中,目的HDI可以包括交换ASIC 210的MID和外部端口接口的端口标识符(例 如,设备端口),该外部端口接口提供对目的设备的接入。此外,在一个实施方式中,前置报 头包括基于从原始数据包检索的参数(源MAC地址,目的MAC地址,源IP地址,目的IP地 址)而确定的数据包优先级和负载均衡标识符。在另一个实施例中,HDI包括外部端口接口 240的全局端口值(GPV)或NM 152的MID,NM 152提供对目的设备的接入。在另一个实 施方式中,当目的MAC地址与远程聚合交换机相关时,HDI包括连接至VFL 124的NM 152a 或交换ASIC 210的硬件设备标识符MID (例如,MID = 5)。目的HDI被添加至前置报头,前 置报头将信息天戒指原始数据包报头(例如,L2,以太网数据包报头类型)。
[0065] 交换ASIC 210η还包括与起始外部端口接口(例如,端口 ID = 2)相关的一个或 多个设备的源硬件设备信息(HDI)。源HDI包括一个或多个硬件设备标识符,例如,起始交 换ASIC 210的MID,源端口识别符(例如,设备端口),全局端口值,NM 152的MID,机箱ID 等。
[0066] 具有前置报头的数据包被传输至排队ASIC 212η,排队ASIC 212η接下来基于目 的HDI确定通过本地聚合交换机上的ΝΜ 152来传输数据包。当目的HDI (例如,基于前置 报头中包含的目的MID)指示聚合交换机106a上的本地外部端口接口时,排队ASIC 212η 将数据包放到出口队列中以传输至本地外部端口接口的相应ΝΙΜ 152。在图5所示的另一 个实施例中,排队ASIC 212η确定目的HDI指示远程聚合交换机上的目的硬件设备,S卩,HDI 指示远程聚合交换机上的MID = 45的交换ASIC。为到达远程聚合交换机上,数据包被传输 至连接到VFL 124的NM 152。在该实施例中,排队ASIC 212η通过网络架构1C 214将具 有前置报头的数据包传输至连接到VFL 124的NM 152a。基于前置报头上承载的负载均衡 标识符来选择VFL成员端口。NM 152a中的排队ASIC 212η接收具有前置报头的数据包, 并对数据包排队以通过VFL 124传输。交换ASIC 210a接下来将具有前置报头的数据包通 过VFL 124传输至远程聚合交换机,具有前置报头的数据包包括源和/目的HDI。
[0067] 在一个实施方式中,交换ASIC 210a可以在通过VFL 124传输之前修改前置报头。 举例来说,交换ASIC 210a可以将具有本地意义(例如,gport值或本地元件设备标识符 MID)的目的HDI转换为具有全局意义的HDI。交换ASIC 210a接下来将具有前置报头的数 据包通过VFL 124传输至远程聚合交换机,具有前置报头的数据包包括源和/目的HDI。
[0068] 在一个实施方式中,当聚合交换机106的多个交换ASIC 210连接至VFL 124时 (例如,如图3所示),将要通过VFL 124传输的流量可以分配至MID = 0和MID = 31的交 换ASIC。例如,排队ASIC 212的全局HDI地址表264中的负载均衡标识符映射表可以指示 进行如下分配:
[0069]
【权利要求】
1. 一种多机箱系统中的聚合交换机,该聚合交换机包括: 所述聚合交换机的第一组成员端口接口,所述第一组成员端口接口与远程聚合交换 机的一个或多个成员端口接口分为一组,所述第一组成员端口接口被配置为形成多机箱链 路聚合,其中所述多机箱链路聚合将所述聚合交换机和所述远程聚合交换机耦合至边缘节 占. 第二组端口接口,被配置为形成用于将所述聚合交换机连接至所述远程聚合交换机的 虚拟光纤链路; 处理模块,能操作用于: 确定所述虚拟光纤链路和所述远程聚合交换机之间的连接故障; 将所述第一组端口接口中的一个或多个端口接口重新配置为耦合至所述边缘节点的 链路聚合;以及 在所述第一组端口接口中的一个或多个端口接口中启动生成树协议。
2. 如权利要求1所述的聚合交换机,其中所述处理模块能操作用于通过以下方式将所 述第一组端口接口重新配置为所述链路聚合: 将指定所述第一组端口为多机箱链路聚合的链路参数重新分配为指定所述第一组端 口为链路聚合的链路参数。
3. 如权利要求2所述的聚合交换机,其中所述第一组端口中的每一个能操作用于: 检测链路聚合的链路参数变化; 清空MAC表项;以及 将MAC表项重新填充为所述链路聚合的一部分。
4. 如权利要求1所述的聚合交换机,其中所述处理模块能操作用于通过以下方式在所 述第一组端口接口中启动生成树协议: 启用所述第一组端口接口上的生成树协议; 通过属于虚拟局域网的数据包的聚合交换机来识别回路; 阻止属于所述虚拟局域网的数据包在所述聚合交换机的一个或多个端口接口上的转 发,以防止所识别的回路。
5. 如权利要求1所述的聚合交换机,其中所述第一组端口接口能操作用于: 接收输入的数据包,其中所述数据包包括目的地址; 基于所述输入的数据包的所述目的地址来确定目的硬件设备信息,所述目的硬件设备 信息对应于所述远程聚合交换机上的硬件设备; 根据所述输入的数据包生成带有前置报头的数据包,其中所述前置报头包括所述目的 硬件设备信息;以及 将所述带有前置报头的数据包发送至所述第二组端口接口,由此通过所述虚拟光纤链 路传输至所述远程聚合交换机。
6. 如权利要求5所述的聚合交换机,其中所述第二组端口接口能操作用于: 确定所述虚拟光纤链路的故障;以及 阻止在所述虚拟光纤链路上转发数据包。
7. -种在交换机中进行的方法,该方法包括: 以多机箱模式运行,其中以多机箱模式运行包括: 通过所述交换机中的第一组端口接口与末端节点通信,其中所述第一组端口接口被配 置为与连接至所述末端节点的远程交换机的一个或多个端口接口形成多机箱链路聚合; 通过所述交换机中的第二组端口接口与所述远程交换机通信,所述第二组端口接口被 配置为形成虚拟光纤链路; 接收以独立模式运行的命令; 响应于所述命令,将所述第一组端口接口中的多个端口接口重新配置为链路聚合,并 在所述第一组端口接口中的多个端口接口中启动生成树协议。
8. 如权利要求7所述的方法,该方法还包括: 根据预定表确定用于以所述独立模式运行的链路参数,其中所述用于以所述独立模式 运行的链路参数包括用于所述链路聚合的链路参数和系统标识符,所述系统标识符与所述 远程聚合交换机的系统标识符不同。
9. 如权利要求7所述的方法,该方法还包括: 利用用于所述链路聚合的链路参数对所述第一组端口中的多个端口进行重新配置; 检测所述第一组端口接口中的多个端口接口到所述链路聚合的重新配置; 通过与所述多机箱链路聚合相关的第一组端口接口来清空MAC表项;以及 为所述链路聚合重新填充所述MAC表项。
10. 如权利要求7所述的方法,其中在所述第一组端口接口中的多个端口接口中启动 生成树协议包括: 启用所述第一组端口接口上的生成树协议; 识别用于通过所述交换机的数据包流的活动路径;以及 阻止所述数据包流中的数据包在用于一个或多个其它路径的交换机的一个或多个端 口接口上转发。
【文档编号】H04L12/24GK104221336SQ201380016895
【公开日】2014年12月17日 申请日期:2013年3月15日 优先权日:2012年3月27日
【发明者】A·维纳亚加姆, R·H·雅各布达席尔瓦 申请人:阿尔卡特朗讯公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1