用于路由以太数据包的以太交换机和方法

文档序号:7850769阅读:147来源:国知局
专利名称:用于路由以太数据包的以太交换机和方法
技术领域
本发明涉及数据交换网络以及尤其是以太交换网络中的链路组合。描述了一种管理链路组合中的大量链接的技术。
背景技术
数据交换网络用于在设备之间,如数据中心中的处理器之间路由数据。以太是主要应用于局域网(LANs)的基于帧网络技术。一个典型的以太交换网络包括一个或多个以太网桥,容纳可在多个数据入口端以及多个数据出口端之间路由数据的交换元件。链路组合(LAG)物理网络连接集结在一起的集合从而提供高带宽的单个逻辑通道。链路组合控制协议(LACP)是IEEE标准802. 3ad的一部分。图1描述了一种典型的以·太LAG。第一和第二网桥2和4通过以太链接10连接。所述第一网桥具有多个数据输入/输出端口 6,以及第二网桥4具有多个数据输入/输出端口 8。在这个简化实施例中,所述LAG具有连接所述两个以太网桥2和4的四个链接10,提供4倍于单个链接的带宽。所述LACP允许连接于网桥的输入/输出端口的网络设备借助于向同伴发送LACP管理帧通过自动集束链接。LACP通过向使得所述协议运作的所有链接发送帧(LACPDUs)生效。如果当前处于也运行LACP所述链接的另一端,也可以沿着相同链接独立发送帧,使得所述两个单元探测多个链接在它们自身之间以及随后将它们结合为一个单独逻辑链接。LACP可被配置为两种模式之一主动或被动。在主动模式中通常沿着配置链接发送帧。在被动模式中,其表现为“问时才说”,以及因此可依照控制偶然循环的方式使用(只要其他设备处于主动模式)。对于基于以太的通信链接聚合表现出大量问题。以太网络利用一个定义协议确定所述网络的展开树以及无效任何提供通向目标可变路径的链接。这确保仅有一条从源到目标的路由。另外,对利用以太LAG网络流量,仅有一个从源到目标的连接。这意味着特定源到目标的连接通常在所述LAG中使用相同的链接。LAG使用基于所连接设备源和/或目标的网络地址的分布算法以定义形成在形成LAG的单独以太链接上的所述连接。网络管理员需选择所述算法,给出穿过依赖于大量预先给定的位置特定参数的LAG的网络流量的最平均分布。所述分布算法通常基于所述源或目标MAC地址或所述源和目标MAC地址的结合中的任一个,以给所述以太帧在其上传递的所述LAG中选择以太链接。其他分布算法可使用IP地址和部分数量的3协议层。为了顺应争议数量简化的进行,对数据包具有一个单个路由或路径。以太数据包应按顺序传递。从源到目标具有单个路由保证一个数据包不会超过另一个。这极大的改进了较高层协议的性能。对于TCP/IP和UDP/IP,以太网一般是数据链接层。不同于它们被发送的所述顺序,TCP能以不同顺序接收IP数据包,但是在接收节点处需要显著的进程和缓冲系统开销。然而,单个路由的简化还意味着所述LAG上的所述数据负载会非常失衡。所述LAG的全面应用需要全部链接传输数据。相应地这需要在路由的同时出现大量通信,其沿着LAG的不同链接发送所述数据。随着通过LAG延迟的不同转换数量的增加,更好应用的概率增力口。所述LAG中的链接数量越大,那么必须保持所述LAG的全部链接有效的转换数量越大。分布算法需要执行LAG,需要选择用于越过所述LAG传输数据包的链接,必须在访问MAC表格从而执行MAC寻址目标端口翻译的同时执行。这通常限制了所述LAG的宽度至以太交换芯片上的链接的一部分(不超过一半)。以太交换的物理执行通常在这个数量上设定一个上限。图2给出了多交换机LAG的一个实施例,具有第一和第二以太网桥12和14,每个具有两层内部交换机,各由多个交换机16和18提供,各自通过内部链接20和22互连在一起。为了被交换机16和18路由,每个网桥12、14具有数据通过的多个入口 /出口端口 24,26。所述网桥12、14通过多个其上通过数据的以太链接28与另一个网桥连接。这些以太链接设置在LAG30中,提供网桥12和14之间带宽的有效增加。该实施例描述了每个以太网桥具有两层交换机,然而,依靠更多层交换机以及还较之图中示出的每个交换机8个端口具有每个交换机更多端口的交换芯片,所述方法通常执行效果更好。图2中使用的内部拓扑也是示例性的且具有其他拓扑的所述方法执行的效 果一样好。在图2的实施例中,紧邻所述LAG的所述交换机16、18的全部所述以太链接28用于所述LAG中,这是一种可运转的结构但是其限制网络管理员影响这种结构,由于以下多种原因1、电缆的物理位置不便抵达这些端口或位于所述LAG端口正常范围内的一个或多个端口中需要一个非LAG以太链接。IOGbps以太铜电缆具有相对短的抵达以及能施加附加物理限制。2、所述LAG的需求可随时间改变且必须添加或删除附加端口。3、所述LAG的单独链接会失效且必须添加附加链接以覆盖多余负载或必须改变其他链接上的流量分布以覆盖使用所述无效链接的流量。如图3给出了与图2所示实施例类似的多交换机LAG的一个实施例。然而,在图3的实施例中,在LAG30范围内的所述链接34的一些与LAG30范围外的正常以太网桥链接进行同样配置。以太LAGs通常被少量的以太链接,或许是4或8限定,LAG中最大可获取IOGbe链接的写倍数是16。

发明内容
根据本发明的一方面,提供一种用于路由以太数据包的以太交换机,所述交换机包括数据入口端口,多个数据出口端口,连接所述数据入口端口与所述数据出口端口的网络结构,以及包括多个互连交换元件,为了接收来自所述入口端口的进入数据的连接封装,且可操作的产生包括报头部分和载荷部分的内部数据包,所述报头部分包括与通过所述互连交换元件的路由相关的路由信息,以及来自进入数据包的路由信息,且所述载荷部分包括那个进入数据包,其中所述封装还是可操作的,以确定所述进入数据包的所述路由信息是否与具有多链接的与之相关的LAG相关,以及如果这样,产生包括在所述内部数据包的所述报头中的LAG信息,以及其中所述LAG信息包括分布值为了路由相关数据包,用于确定从与所述LAG相关的多个链接中选择一个。
根据本发明的另一方面,提供一种在以太交换机中路由以太数据包的方法,该以太交换机具有数据入口端口、多个数据出口端口、连接所述数据入口端口与所述数据出口端口的网络结构,以及包括多个互连交换元件,所述方法包括接收进入数据包的步骤,产生包括报头部分和载荷部分的内部数据包,所述报头部分包括与通过所述互连交换元件的路由相关的路由信息,以及来自进入数据包的路由信息,且所述载荷部分包括那个进入数据包,确定所述进入数据包的所述路由信息是否与具有多链接的与之相关的LAG相关,以及如果这样,产生包括在所述内部数据包的所述报头中的LAG信息,其中为了路由相关数据包所述LAG信息包括分布值,用于确定从与所述LAG相关的多个链接中选择一个,利用所述路由信息路由所述内部数据包通过所述网络结构,以及路由所述进入数据包至由所述LAG信息确定的所述出口端口。该技术能够越过大型网络结构管理LAG。在一个实施例中,对于一个进入数据包,在进入所述交换机之前,仅产生一次LAG信息,这减少了路由所述内部数据包通过所述交换机结构所需的处理时间量。在另一个实施例中,所述封装是可操作的以从进入数据包的所述路由信息确定 LAG算法,以及利用确定的该LAG算法为相关数据包产生所述分布值。这允许不同的分布算法用于对不同数据包,以及因此对LAG的数据包的最适当分布对相关类型数据包能够被使用。所述网络结构的每个交换元件可包括可操作存储设备,从而存储来自相关交换元件的输出路由的指示信息,所述交换元件可操作,从而独立于所接收的LAG信息访问存储输出信息。所述封装是可操作的,从而从所述进入数据包的所述路由信息确定LAG宽度值,所述宽度值是用于访问存储输出信息的LAG信息指示。每个交换元件还可以包括可操作的加权分布逻辑,从而独立于检索输出信息减少输出端口选择信号。在一个实施例中,每个交换元件包括可操作的数据包过滤,从而独立于与之相关的所述分布值释放数据包。本发明的实施例用于提供允许将以太链接聚合为任何宽度的技术。根据本发明的另一方面,提供一种用于路由以太数据包的以太交换机,所述交换机包括数据入口端口,各自具有输出链接的多个数据出口端口,以及连接所述数据入口端口与所述数据出口端口的网络结构,以及包括多个互连交换元件,所述入口端口通过多个交换元件与每个所述输出端口连接,其中多个所述交换元件中的每个包括为了接收进入数据包而连接的一个数据包处理器,以及可操作的以确定所述进入数据包的所述路由信息是否与具有多链接的与之相关的LAG相关,以及如果这样,向与LAG相关的所述输出链接之一路由所述数据包。每个交换元件可包括为了接收进入数据包而连接的数据包处理器,以及可操作的以确定所述进入数据包的所述路由信息是否与具有多链接的与之相关的LAG相关,以及如果这样,向与LAG相关的所述输出链接之一路由所述数据包。根据本发明的另一方面,提供一种在以太交换机中路由以太数据包的方法,所述交换机包括数据入口端口,各自具有输出链接的多个数据出口端口,以及连接所述数据入口端口与所述数据出口端口的网络结构,以及包括多个互连交换元件,所述入口端口通过多个交换元件与每个所述输出端口连接,所述方法包括以下步骤,其中多个所述交换元件中的每个,接收进入数据包,确定包含在所述进入数据包的所述路由信息是否与具有多出口端口的与之相关的LAG相关,以及如果这样,向与LAG相关的所述输出链接之一路由所述数据包。该方法包括所述步骤,在多个所述交换元件中的每个中,接收进入数据包,确定包含在所述进入数据包的所述路由信息是否与具有多出口端口的与之相关的LAG相关,以及如果这样,向与LAG相关的所述输出链接之一路由所述数据包。因此本发明的该特征实施例能够对未封装数据包应用所述第一和第二特征的所述技术。


图1描述了以太数据交换网络中的LAG ;
图2和3各自描述了以太数据交换网络;
图4描述了数据交换拓扑;
图5-8描述了实施本发明特征的数据交换机。
具体实施例方式图4描述了一个“Fat Tree”网络实施例,有时称为“Clos”网络。该网络适用为所述图2和图3中的以太网桥12和14的内部网络。图4的所述“Fat Tree”网络用于描述实施本发明的宽LAG机制的运转。然而,任何网络拓扑可用于执行这种机制以及所述FatTree作为一方便实施例仅用于本文中。图4的所述内部网络包括通过多个链接41互连的多个交换元件40。所述交换元件布置于三个等级43、44、45。第一等级43中的交换元件为所述内部网络提供数据入口和出口端口 42。在图4实施例中,第一和第二等级43、44中的所述交换元件40分为三组,以及在每组中,所述第一等级43中的每个所述交换元件40与所述第二等级中的每个所述交换元件40连接。第三等级中的所述交换元件40的每个与一个交换元件连接,该交换元件来自所述第三等级44中的所述三组的每个。这种拓扑维持全截面带宽以及提供从每个入口端口到每个出口端口的多个路由。Fat Tree通信执行通过将树从所述入口端口 42中的一个提升至所述内部网络中足够高的一个点,从而实现所需入口端口的可视化。如果所述通信是交换元件上的相邻端口,不必使用任何附加交换元件形成所述连接。对稍多的间隔端口,在返回以通过最终出口端口 42访问所述交换元件之前,所述数据包可向所述网络的一个等级上路由。在这种情形中,所述数据包会横过3个交换元件40。对间隔端口,在朝向所需出口端口 42返回所述网络之前所述内部数据包只能放弃通过大量交换元件。Fat Tree网络具有在下行所述内部网络的方式上仅需要一个绝对路由路径的特性。可使用任何上行路由以及相同下行路由在正确的出口端口终止。这在网络中是有用的,采用自适应路由,因为自适应选择是非常普遍的且对特定出口端口是不必特定的。自适应路由可响应于当前网络负载以及可将流量从拥塞链接中导出。以太LAGs还必须正确的支持泛洪、广播和多址通信。以太网泛洪是用于路由数据包到正确目标,当至所述目标的所述路由还未被所述MAC地址译成表格时。当以太网帧溢出时,其被导向所述网桥的全部出口端口,除了其已经抵达的端口。这种处理会在任何顺序的与网桥连接的以太网桥上重复。最终,如果所述目标MAC地址有效以及与以太网连接,所述数据包应抵达正确的最终目标。所述数据包抵达的任何其他目标是无效的,会仅仅释放所述数据包。具有特定MAC地址值的广播指示所述数据包应发送至全部目标。广播还将所述数据包导向全部网桥出口端口,除了与所述数据包抵达的入口端口相关的一个。多址通信数据包发送至全部出口端口的子组(再次被所述入口端口排除)。泛洪、广播、多址通信必须全部借助于LAG实现。LAG是单逻辑链接以及因此对泛洪、广播和多址通信,应仅一个数据包出现在所述LAG的所述链接之一上。对泛洪,所述数据包应出现在相同链接上,如果所述数据包未溢出,其应出现。这需要保证数据包流的顺序,因为第一数据包可能泛洪,但是如果在所述两个数据包之间已经得知所述目标,第二数据包可能变成单点传送数据包。每个交换元件40为包括封装的所述内部网络提供入口端口 42。所述封装是可操作的从而将传入以太网帧封装进内部数据包,当它们在所述入口端口被接收时。具有报头、本体的每个内部数据包包括不变以太网帧以及校验和值从而测试所述以太网帧的完整性。 翻译所述传入以太网帧的所述目标MAC地址,以及确定网络宽-以太LAG出口端口是否用于所述数据包从所述内部网络的路由,以及因此从所述以太网桥的路由。所述翻译返回网络路由值识别宽LAG以及其被添加到所述内部数据包的所述报头。通过封装确定LAG分布值,以及添加到所述内部数据包报头。一旦输入到所述以太网桥内部网络上执行所述传入数据包的所述封装以及所述报头信息的所述确定。所述传入数据包目标MAC地址的所述翻译还可以返回LAG算法值以及其被用于识别用于产生所述LAG分布值的功能。可能的LAG算法可使用源MAC地址,目标MAC地址,所述源和目标MAC地址的结合或任何作为以太网帧报头一部分被包括的其他值。这些可包括来自3层IP报头的值,如果其存在的话。如果IP报头可用,那么所述源、目标IP号码的结合以及甚至所述IP端口地址对于产生LAG分布值是全部好的可用的。一个好的LAG分布值应具有全部可能值的一个平均分布,为输入值范围大致给出每个输出值相同的号码。特定地,不应偏向或紧绕所述分布值的全部范围内的任意位置的任何数值。循环冗余码校验(CRC)功能对形成所述分布值是潜在的优化机制以及详细描述了利用CRC-16-CCITT码的执行实施例。所述传入数据包目标MAC地址的翻译还可以返回LAG大小值。该值可用于改进较宽LAGs的分辨率或分布。下面会更详细描述。一旦所述内部数据包报头完整形成,所述封装以太网帧路由进入所述内部网络作为内部网络数据包。所述网络路由值识别使用宽LAG被路由的数据包。所述LAG分布值用作分隔路由值。在一个实施例中,所述LAG分布值范围在所有用于形成所述LAG的全部出口端口之间等分。例如,在16字节分布中范围从0-65535,如果97个端口用于形成所述宽LAG,那么LAG值配置于所述LAG中的每个端口的数量是65536/97=675. 63。事实上,一些端口是可编程的,从而当其他采取676时,所述LAG分布值采取675。因此在这个实施例中,所述LAG的端口 O会采取所有具有0-675范围内的LAG分布值的数据包,端口 I会采取所有具有676-1351范围内的LAG分布值的数据包,端口 2会采取所有具有1352-2026范围内的LAG分布值的数据包以及因此直到端口 96采取64861-65535范围内的值。对该实施例,描述了所述LAG分布值最大可能的分辨率。这需要使用所述LAG分布的全部字节从而将所述数据包导向所述LAG的适当出口端口。对于中等大小的LAGs,这种非常详细的分辨率通常是不必要的。所述内部数据包穿过所述内部网络以及在所述网络的每级中所述数据包的路由值用作可在每个交换元件40上获取的表格50的指数52(图5)。图5描述了所述表格50,可作为一个RAM执行,但是可代替使用其他存储机制。从所述表格50返回的值60描述所述LAG分布值54应怎样被所述网络的本级解释。一个典型的执行可使用具有大概72字节的状态或一些类似宽度,尽管可使用任何宽度,以及提供不同组的交换。很可能使用多种格式,选择使用一个典型的字段,以及这会提供对不同交换元件结构更灵活的操控。对于将所述数据包导向适当交换输出,72字节是信息限制量。LAG宽度值58,返回所述MAC地址翻译上,可用于增加来自RAM的可获取信息。所述LAG宽度值可用于选择一些包括在从所述报头路由值52形成的所述表格指数中的所述LAG分布值54的字节。在这种方式中,单个较宽LAG需要来自所述LAG分布值的详细分辨率,通过表格输入表现出来。例如,较宽LAG可采用7字节所述LAG分布值54以及在所述表格50中使用128输入。这会给出128X72=9216·字节的状态以及提供所述LAG值54从所述LAG中的一个出口端口到LAG下个出口端口的边界的详细描述。图5示出了怎样形成全表格指数,以及描述所述LAG宽度值58如何用于选择所述LAG分布值54的一部分以及形成所述表格指数的基础的所述路由值52如何被所述LAG分布值54的选择部分54a调整。在该实施例中,对所述路由值52的附加56用于形成全RAM地址,但是任何使用所述路由值52提供单独RAM地址的其他功能和所述LAG分布值54的所述选择部分54a会同样有效。较宽LAGs会使用全部网络资源的大部分以及同样地所述LAG表格的大部分用于描述所述LAG分布值的详细划分是合理的。窄LAG会使用全部网络资源的较少部分以及因此所述LAG表格的一定比例量用于描述所述LAG路由。作为窄LAG还意味着对于在整体LAG链接范围内给出合理的数据包分布,较少量的表格是必须的。已经形成全RAM/表格地址,值60读取以及用于解释从图5所示出的所述LAG宽度值58中识别的所述LAG分布值的其他部分54b。该其他部分54b传到加权分布逻辑61,如图6所示。该加权分布逻辑产生选择信号74用于识别交换元件出口端口,所述内部数据包应流向内部网络的下一级。在图6的逻辑实施例中,从72字节表格输出67的12X6字节字段中产生13条选择链路74。在该实施例中,所述LAG分布值54的6字节54b用于解释来自所述表格50的72字节号码。 图7描述了加权分布逻辑的其他可能结构。在该实施例中,所述LAG分布值54的8字节54b与表现出产生10个出口端口选择链路88所述72字节的9字段相比。图6和图7各自具有表格输入值的可能实施例。每个实施例具有左和右选择信号,如同图6的11个端口选择信号74,以及图7的8个端口选择信号88。所述左和右值是对于类似于所述FatTree网络的应用优化,这些值自适应配置到路由上,但是它们可用于为了抵达出口端口需要多个跳行的任何网络拓扑。然而,所述左和右值通常可选择相同输出端口以及不需要产生一个自适应路由。所述表格返回的读取数据包被划分为字段号码。这些字段在所述LAG分布值54的部分之间标记界限。当所述LAG分布值54大于或等于右边值以及小于左边值时,每个选择信号74 ;88具有允许断言所述信号的2个比较功能70,72 ;84,86。对于所述右边,从所述表格中读取的值60中的每个字段应大于或等于所述字段值。在这种方式中,对输入该逻辑的任何给定LAG值,仅可断言一个选择信号。图6描述了一个实施例,其中全部字段值与每个其他值不同。在这个实施例中,OX28的LAG分布值54会选择链路I以及0X05会选择Right Up链路。图7描述了一个不同实施例。在这个情形中,每个来自所述表格的所述9个字段为8字节宽。一些所述字段可利用相同值编程。对于来自所述LAG分布值的任何值,这防止出现在相同值之间的所述选择信号被断言。允许出现在连续宽LAG的范围内的链路从LAG的部分中移出。所述机制所描述的允许混合LAG分布值54范围的任何所述选择信号。对LAG值54的全部值,存在全部LAG流量应被导向单个端口的时刻。在该情形中,当从最右边字段到最左边字段移动时,可使用其他特定编码值破坏通常具有较大或相同值的所述字段正常规贝U。一个可能编码是采用最大值在右边字段小于字段中的最大值最右边字段左侧。如果探测到这种情形,那么可使用其他字段值识别全部数据包所导向的单个输出端口。
其他特定情形中,每个选择值需要应付的是输出仅选择从LAG分布值54提供的最大值。对该特定情形,如果零字段右边的所述值不是零,零值输入较大者,比较器应解释为大于所述最大值的I。然后对该选择信号断言输出信号,如果所述加权逻辑中的所述LAG分布值54具有最大值。在所述内部网络的每个交换元件40中使用该加权路由机制。对Fat Tree实施例,内部网络的初始状态通常配置为产生单个上升值,除非一些LAG端口出现在第一网络元件上。图8给出了具有映射到一些端口的示例LAG的Fat Tree网络实施例。图8的所述网络结构类似于图4,以及包括通过内部网络链接92互连的交换元件90的三个等级98,99,100o在图8中,所述LAG端口出现在交换元件A、C、F、G、H和J上。该实施例示出了抵达交换元件A的一个端口的传入数据包。作为直接与真实以太链接连接的数据包,所述帧封装进内部数据包中。所述目标MAC地址所述传入数据包翻译为,对这个数据包,返回示例宽LAG的路由。根据用于返回所述翻译的算法类型产生所述LAG分布值。所述路由值52以及所述LAG分布值54放入结果内部数据包的报头中,随后被路由传递。在该实施例中,LAG具有11个端口。这意味着所述LAG分布间隔必须大致划分为11个相同部分,从而对LAG中的全部链接提供数据包的平均分布。在交换元件A中,LAG数据包值的1/11应导向局域链接,其他10/11的值应向上发送。由于Fat Tree在该实施例中,所述向上路由可以是向上链接中的任一个以及所述10/11值的选择可特定一个所述向上链接的任何自适应选择。在图8中,所述选择是将所述数据包导向交换元件B3的链接,但是可以使用交换元件BI或B2。当内部数据包的抵达交换元件B3时,需要其他表格查找。然而,需要对分布值的非MAC地址翻译,由于这已经在所述内部数据报的报头中获得。在该交换机中,8/11的值应向上发送,2/11的值应向交换元件C发送以及1/11的值向交换元件A发送。准确使用使得所述数据包导向交换元件A上的局域链接的所述LAG分布器的相同值,将所述1/11值导向交换元件A。这意味着没有数据包折回已经使用的路径,因为导致所述数据包在一个方向上采用该链接的所述LAG分布器的值不应包括在其他方向上沿着相同链接返回路由的值。还意味着对特定交换元件的全部端口可使用相同表格。对图8中的实施例,B1,B2和B3中的所述表格加载相同值,因为它们以相同方式响应于抵达它们端口的LAG数据包。如果所述LAG分布值指示所述数据包应在所述网络上移动,那么再次形成允许所述数据包抵达顶部交换元件Dl到D9中的任何一个的自适应选择。所述数据包遵循相同规则,直到其出现在如所述LAG分布值所描述的正确LAG端口。借助该机制以及任何给出的路由值以及LAG分布值,所述数据包会从整个网络中的任何位置路由到正确的LAG端口。泛洪、广播以及多址通信也必须正确路由到所述LAG的仅一个端口。每个交换元件输出给出一个LAG分布值过滤。所述交换元件输出为链接上的传输准备数据。同时对内部链接和以太网桥出口端口这样做。连接到外部网络的所述以太网桥出口端口还执行删除已被以太网入口端口添加的报头的未封装功能。所述LAG分布值过滤器由维持可由该输出端口发送的接收LAG分布值的上限和下限的两个寄存器组成。如果LAG分布值小于所述下限或高于所述上限,那么所述内部数据包必须抛弃。如果所述链接不是以太网桥的出口端口,包括通过设置较低值为O以及较高值为最大值的全部数据包的设置是正常设置。如果 所述出口端口是所述网桥的出口端口以及已经配置了在宽LAG中的一个链接,那么所述过滤器设置为可正常将数据包导向该链接的所述LAG分布值的最小和最大值。具有LAG分布值的错误值的抵达这个链接的任何内部数据包被抛弃。这意味着广播和多址通信可向LAG中的全部端口发送它们的数据包以及以太帧仅在正确的出口端口上传输。这给出了正确功能但是其是无效的,因为在内部链接上传输的数据包仅在所述输出出口端被抛弃。如果全部以太出口端口内部网络下的是相同LAG的一部分,那么用于内部输出链接的所述LAG过滤器可被设置为包括全部那些LAG端口包含的范围。图8中所述从E到G的链接是这种情况的实施例。在该情形中,连接到G的El到E3上的所述输出端口可设置它们的输出过滤以仅允许传输对连接到交换元件G的LAG链接具有有效LAG分布值的广播和多址通信数据包。泛洪数据包是不同的,因为仅当对目标MAC地址的MAC翻译未在所述MAC翻译表格中得知时,产生它们。这形成问题,因为返回翻译的部分包括用于产生所述LAG分布值的方法。解决方案是对内部封装利用报头中的字节标记泛洪数据包以及阻止任何LAG过滤直到终点以太出口端口接收到所述数据包。这些端口“知道”应采用的正确分布算法以及利用相关被传输的以太帧中的值再次计算。必要时,分离过滤器会抛弃数据包。LAG的结构不可能频繁改变,但是偶尔所述LAG中的链接会破坏或修复以及偶尔重配置所述LAG以匹配新带宽要求。在不损坏出现在网桥中的其他链接上的其他通信情况下,有可能改变所述LAG。如果所述网桥具有大量端口,这是相当重要的。有可能连续使用所述LAG,甚至在重配置期间。所述重配置需要重设定所述LAG中的每个端口期望接收的LAG分布值的范围。在大型分配系统中,或许上千个分离交换元件,有可能自动或同时升级宽LAG的全部状态。全部状态的升级可花费数秒,以及每个链接可典型地传输每秒多达8000万个数据包。为了允许升级,旧配置和新配置的获得必须在同时发生。这意味着在所述新配置转换发生之前越过整个交换网络装配所述新状态。内部数据包报头可包括为多址通信设置的其他字节。所述字节在设值定义必要的LAG数据包过滤的所述“A”和“B”寄存器之间选择。提供配置字节在每个以太入口端口中被设置为A或B中的任一个。当全部LAG寄存器以新配置升级设置时,那么可改变全部的A或B配置选择字节从而使得所述多址通信、泛洪和广播操作会使用新设置。全部LAG路由表格可加载一组不打乱旧值的新LAG加权分布值。因此会发生对LAG数据包的新LAG配置的交换,当利用对LAG的新路由值升级MAC地址翻译表格时。一旦新设置具有足够时间以完全生效,对其他新LAG输入可再使用旧路由值表格。 经描述利用封装数据包(内部数据包)的本发明实施例。然而,可容易预测到对未封装数据包可使用该技术,其中每个交换元件包括检查每个数据包中的路由信息的处理功能,以及然后使用那个信息向LAG相关端口路由所述数据包。
权利要求
1.用于路由以太数据包的以太交换机,所述交换机包括数据入口端口;多个数据出口端口;连接所述数据入口端口与所述数据出口端口的网络结构,以及包括多个互连交换元件;为了接收来自所述入口端口的进入数据的连接封装,且可操作的产生包括报头部分和载荷部分的内部数据包,所述报头部分包括与通过所述互连交换元件的路由相关的路由信息,以及来自进入数据包的路由信息,且所述载荷部分包括进入数据包,其中所述封装还是可操作的,以确定所述进入数据包的所述路由信息是否与具有多链接的与之相关的链接聚合组相关,以及如果相关,产生包括在所述内部数据包的所述报头中的链接聚合组信息,以及其中所述链接聚合组信息包括分布值,为了路由相关数据包,用于确定从与所述链接聚合组相关的多个链接中选择一个。
2.权利要求1所述的以太交换机,其中对于一个进入数据包,在进入所述交换机之前, 仅产生一次该链接聚合组信息。
3.权利要求1或2所述的以太交换机,其中所述封装是可操作的,从而从传入数据包的所述路由信息确定链接聚合组算法,以及利用该确定的链接聚合组算法为相关数据包产生所述分布值。
4.权利要求1、2或3所述的以太交换机,其中所述网络结构的每个交换元件可以包括可操作存储设备从而存储来自相关交换元件的输出路由的指示信息,所述交换元件可操作从而独立于所接收的链接聚合组信息访问存储输出信息。
5.权利要求4所述的以太交换机,其中所述封装是可操作的,从而从所述进入数据包的所述路由信息确定链接聚合组宽度值,所述宽度值是用于访问存储输出信息的链接聚合组信息指示。
6.权利要求5所述的以太交换机,其中每个交换元件包括可操作的加权分布逻辑,从而独立于检索输出信息减少输出端口选择信号。
7.权利要求4或5或6所述的以太交换机,其中每个交换元件包括可操作的数据包过滤,从而独立于与之相关的所述分布值抛弃数据包。
8.一种在以太交换机中路由以太数据包的方法,该以太交换机具有数据入口端口、多个数据出口端口、以及连接所述数据入口端口与所述数据出口端口的网络结构,以及包括多个互连交换元件,所述方法包括步骤接收进入数据包;产生包括报头部分和载荷部分的内部数据包,所述报头部分包括与通过所述互连交换元件的路由相关的路由信息,以及来自进入数据包的路由信息,且所述载荷部分包括进入数据包,确定所述进入数据包的所述路由信息是否与具有多链接的与之相关的链接聚合组相关,以及如果相关,产生包括在所述内部数据包的所述报头中的链接聚合组信息,其中为了路由相关数据包所述链接聚合组信息包括分布值,用于确定从与所述链接聚合组相关的多个链接中选择一个,利用所述路由信息路由所述内部数据包通过所述网络结构,以及路由所述进入数据包至由所述链接聚合组信息确定的所述出口端口。
9.权利要求8所述的方法,其中对于一个特定进入数据包,在进入所述交换机之前,仅产生一次该链接聚合组信息。
10.权利要求8或9所述的方法,其中从传入数据包的所述路由信息确定链接聚合组算法,以及利用该确定的链接聚合组算法为相关数据包产生所述分布值。
11.权利要求8、9或10所述的方法其中所述网络结构的每个交换元件包括可操作存储设备从而存储来自相关交换元件的输出路由的输出指示信息,以及其中所述方法进一步包括独立于所接收的链接聚合组信息访问存储输出信息。
12.权利要求11所述的方法,进一步包括从所述进入数据包的所述路由信息确定链接聚合组宽度值,所述宽度值是用于访问存储输出信息的链接聚合组信息量的指示。
13.权利要求12所述的方法,进一步包括独立于检索输出信息减少输出端口选择信号。
14.权利要求11、12或13所述的方法,进一步包括独立于与之相关的所述分布值抛弃数据包。
15.一种用于路由以太数据包的以太交换机,所述交换机包括数据入口端口;各自具有输出链接的多个数据出口端口,以及连接所述数据入口端口与所述数据出口端口的网络结构,以及包括多个互连交换元件,所述入口端口通过多个交换元件与每个所述输出端口连接,其中多个所述交换元件中的每一个包括为了接收进入数据包而连接的一个数据包处理器,以及可操作的以确定所述进入数据包的所述路由信息是否与具有多输出链接的与之相关的链接聚合组相关,以及如果相关,向与所述链接聚合组相关的所述输出链接之一路由所述数据包。
16.权利要求15所述的以太交换机,其中每个交换元件可包括为了接收进入数据包而连接的数据包处理器,以及可操作的以确定所述进入数据包的所述路由信息是否与具有多输出链接的与之相关的链接聚合组相关,以及如果相关,向与所述链接聚合组相关的所述输出链接之一路由所述数据包。
17.一种在以太交换机中路由以太数据包的方法,所述交换机包括数据入口端口,各自具有输出链接的多个数据出口端口,以及连接所述数据入口端口与所述数据出口端口的网络结构,以及包括多个互连交换元件,所述入口端口通过多个交换元件与每个所述数据出口端口连接,在多个所述交换元件中的每一个中,所述方法包括以下步骤接收进入数据包,确定包含在所述进入数据包的所述路由信息是否与具有多出口端口的与之相关的链接聚合组相关,以及如果相关,向与链接聚合组相关的所述输出链接之一路由所述数据包。
18.权利要求17所述的方法,包括以下步骤,在多个所述交换元件中的每一个中接收进入数据包;确定包含在所述进入数据包的所述路由信息是否与具有多出口端口的与之相关的链接聚合组相关,以及如果相关,向与链接聚合组相关的所述输出链接之一路由所述数据包。
全文摘要
本发明涉及数据交换网络以及尤其是以太交换网络中的链路组合,描述了一种管理链路组合中的大量链接的技术。
文档编号H04L12/721GK103026666SQ201180035105
公开日2013年4月3日 申请日期2011年7月15日 优先权日2010年7月19日
发明者乔恩·比克罗夫特, 大卫·查尔斯·休森 申请人:格诺多有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1