虚拟第2层及使其可扩展的机制的制作方法

文档序号:7847437阅读:142来源:国知局
专利名称:虚拟第2层及使其可扩展的机制的制作方法
技术领域

背景技术
现代通信与数据网络中包括一些节点,这些节点在网络中传送数据。这些节点可包含路由器、交换器、桥接器或其组合,其在网络中传送各个数据包或帧。有些网络可提供数据服务,将数据帧穿过网络从一个节点转发到另一个节点,无需使用中间节点上经预先配置的路线。另外一些网络可沿着预先配置或预先建立的路径将数据帧穿过网络从一个节点转发到另一个节点。

发明内容
在一个实施例中,本发明包含一种设备,此设备包括服务网络及在经由第2层网络上的多个边缘节点耦合到服务网络的位于多个不同物理位置上的多个第2层,其中所述边缘节点用于维护第2层网络上的多个主机的多个因特网协议(IP)地址,且其中每个第2 层网络中的主机的IP地址由其它第2层网络映射到主机的相同第2层网络中的每个边缘节点的媒体接入控制(MAC)地址。在另一实施例中,本发明包含一种网络组件,此网络组件包括接收器,其用于接收位于多个物理位置且经由服务互连的多个外部第2层网络中的多个主机的多个IP地址; 逻辑电路,其用于将外部第2层网络中的主机的IP地址映射到相同外部第2层网络中的多个对应网关的多个MAC地址;及发射器,其经配置以将经由服务耦合到外部第2层网络的本地第2层网络中的多个本地主机的多个IP地址发送到外部第2层网络。在又一实施例中,本发明包含一种方法,包括从第一数据中心(DC)位置上的第一主机接收准备送往第二 DC位置上的第二主机的帧;将帧中的第二主机的目的地地址 (DA)映射到第二 DC位置上的第2层网关(L2GW)的MAC地址;添加一个支持电子电气工程师协会(IEEE)MAC-in-MAC的802. Iah标准的外部MAC标头以获得指示L2GW的MAC地址的内部帧;及将此内部帧经由耦合到第二 DC位置的服务实例发送到第二 DC位置。通过下文配合附图及权利要求进行的详细说明,将更清楚地了解这些及其它特征。


为了更透彻地了解本发明,现在配合附图及详细说明参照以下简要说明,图中相同元件符号指代相同部件。图1是虚拟私用局域网(LAN)服务(VPLS)互连LAN的实施例的示意图。图2是虚拟第2层网络的实施例的示意图。图3是边界控制机制的实施例的示意图。图4是数据帧转发方案的实施例的示意图。图5是数据帧转发方案的另一个实施例的示意图。图6是数据帧转发方案的另一个实施例的示意图。图7是互连第2层域的实施例的示意图。图8是在多个地址域上的第2层扩展的实施例的示意图。图9是在多个地址域上的伪第2层网络的实施例的示意图。图10是域地址限制机制的实施例的示意图。图11是数据帧转发方案的另一个实施例的示意图。图12是数据帧转发方案的另一个实施例的示意图。图13是数据帧转发方案的另一个实施例的示意图。图14是数据帧转发方案的另一个实施例的示意图。图15是广播方案的实施例的示意图。图16是广播方案的另一个实施例的示意图。图17是互连网络区域的实施例的示意图。图18是互连网络区域的另一个实施例的示意图。图19是ARP代理方案的实施例的示意图。图20是数据帧转发方案的另一个实施例的示意图。图21是ARP代理方案的另一个实施例的示意图。图22是物理服务器的实施例的示意图。图23是故障解决方案的实施例的示意图。图M是不对称网络地址封装方案的实施例的示意图。
图25是ARP处理方案的实施例的示意图。图沈是扩展ARP有效负载的实施例的示意图。图27是另一个数据帧转发方案的实施例的示意图。图28是增强型ARP处理方法的实施例的协议图。图四是扩展地址解析方法的实施例的协议图。图30是网络组件单元的实施例的示意图。图31是通用计算机系统的实施例的示意图。
具体实施例方式首先应了解,虽然下文会提供一个或一个以上实施例的说明性实施方案,但是本发明揭示的系统及/或方法可使用许多种技术来实施,无论这些技术是不是已知或现有的。本发明绝不应限于下文说明的说明性实施方案、图及技术,包含本文中说明及描述的示范性设计及实施方案,可在所附权利要求书以及其完整的等效范围内修改本发明。现代的数据网络可包含云服务及支持数据链路层,也称为第2层上的应用的VM, 这些VM可能需要跨越多个位置。这类网络可包括例如在DC中的服务器群集(或VM),其必须跨越多个位置,并在第2层级别上通信,支持已经部署的应用,因此能节约成本,例如能节约数百万美元。服务器群集之间的第2层通信包含负载平衡、数据库群集、虚拟服务器故障恢复、网络层(第3层)下方的透明操作,在多个位置上散布子网,以及冗余。第2层通信还包含应用之间的保活机制。有些应用需要相同的IP地址在多个位置上通信,其中一个服务器可为在活动,另一个服务器可以在备用。存活服务器与备用服务器(在不同位置) 可互相交换保活消息,这可能需要第2层保活机制。图1图解说明VPLS互连局域网(LAN) 100的实施例。VPLS互连LAN 100是一种针对在多个DC位置,例如物理位置上连接第2层网络以便建立统一或平面第2层网络而提出的可扩展机制。VPLS互连LAN 100可包括VPLS 110及多个LAN 120,其可经由多个边缘节点112,例如边缘路由器,耦合到VPLS 110。每个LAN 120可包括多个第2层交换器122,其耦合到对应的边缘节点112,多个接入交换器124,其耦合到对应的第2层交换器,多个VM 126,其耦合到对应的接入交换器124。VPLS互连LAN 100的组件的设置可如图1所示。VPLS 110可为任何用于在多个位置或DC上连接LAN 120的网络。举例来说,VPLS 110可包括第3层网络,用于在不同DC上互连LAN 120。第2层交换器122可用于在开放系统互连(OSI)模式数据链路层上通信。数据链路协议的实例包含LAN的以太网、点对点协议 (PPP)、高级别数据链路控制(HDLC)及用于点对点连接的高级数据通信控制协议(ADCCP)。 接入交换器1 可用于在第2层交换器122与VM 1 之间转发数据。VM 1 可包括系统虚拟机,能提供系统平台,例如操作系统(OS),且/或包括处理程序虚拟机,能运行程序或应用程序。每个LAN 120中的VM 1 可分布在多个处理器、中央处理器单元(CPU)或计算机系统上。LAN 120中的多个VM 1 还可共享相同的系统资源,例如磁盘空间、存储器、处理器及/或其它计算资源。VM 1 可设置在机箱上,例如经由接入交换器IM耦合到对应的 LAN 120。VPLS互连LAN 100的一些方面可能会出现不太现实或者不太理想的实施方面的问题。在一个方面中,VPLS 110可能需要实施支持多标签协议标签交换(MPLS)的广域网络(WAN)。但是,有些运营商,比如中国电信,不支持WAN上的MPLS,因此可能难以实施VPLS 互连LAN 100。此外,为了解析例如LAN120上的VM 1 的主机链路层地址,可能需要使用 ARP,例如以引用方式并入本文中的因特网工程任务小组(IETF)的请求注解(RFC826)中描述的ARP,其以引用方式并入本文中。ARP可向所有互连LAN 120扩散请求,因此用完了大量系统资源(例如,带宽)。随着LAN 120及/或VM 1 数目增加,此ARP扩散机制可能会遇到可扩展问题。VPLS互连LAN 100还可设置网状伪线(PW)连接到LAN 120,这可能需要对隧道进行配置及状态维护。在有些情形中,VPLS110可能使用边界网关协议(BGP)来发现LAN 120,并为每个LAN 120建立网状PW。光传送虚拟化(OTV)是另一种可扩展机制,提出这种机制是为了跨多个位置或DC 连接第2层网络,从而建立平面第2层网络。OTV是思科提出的一种方法,这种方法取决于对第2层通信的IP封装。OTV可使用中间系统到中间系统(IS-IS)路由协议以向其它位置分配每个位置(例如DC)内的MAC可达性。OTV方案可能也会有一些不切实际或不太理想的方面。一个方面,OTV可能需要由运营商核心IP网络维护相对多个组播群组。由于每个LAN可能有单独的叠加拓扑,所以服务提供商IP网络可能要维护相对大量的叠加拓扑, 这样可能会给核心网络造成负担。OTV还可要求边缘节点使用因特网群组管理协议(IGMP) 来加入IP域中的不同组播群组。如果每个边缘节点耦合到多个虚拟LAN(VLAN),则边缘节点可能需要参与多个IGMP群组。在OTV中,边缘装置,例如每个位置上的网关,可以是彼此相距一个跃距的IP主机,这样可能就不需要在边缘装置之间实施链路状态协议以交换可达性信息。但是,也可使用链路状态来鉴定对等体,如果对等体通过发送第3版IGMP (IGMPv3)报告加入VLAN,则可能需要在OTV中进行此鉴定。或者,OTV可使用BGP鉴定法。但是,BGP鉴定时序可能与 IS-IS鉴定时序不同。举例来说,可针对秒性能调谐BGP,可针对亚秒性能调谐IS-IS。此外,IS-IS协议可能不适合于在OTV系统中的每个位置上处理大量主机及VM,例如好儿个万个主机及VM。OTV可能也不适合于支持好儿万个封闭用户群组。本文中揭示用于提供可扩展机制,连接多个不同位置上的多个第2层网络,从而获得平面或单个第2层网络的系统及方法。这种可扩展机制可解决获得跨越多个位置的平面第2层网络时的一些方面或难题。可扩展机制可支持对于应用的可扩展地址解析,允许网络交换器维护与多个位置上的所有或多个主机相关联的多个地址,这样可有助于发现拓扑。可扩展机制还可有助于跨不同位置转发业务及例如对于未知的主机地址广播业务,且支持组播群组。这些方法包含边界控制机制从而扩展出跨越多个位置的相对较大的平面第2层。 如此,应用、服务器及/或VM可能知道虚拟第2层网络,其包括通过另一网络互连的多个第 2层网络,所述另一网络例如是第3层、第2. 5层或第2层网络。第2层网络可位于不同或分开的物理位置上。也可使用协议无关地址解析机制,这种机制可能适合于处理相对较大的虚拟第2层网络及/或多个位置上的大量第2层网络。图2图解说明不同DC或物理位置上的虚拟第2层网络200的实施例。虚拟第2 层网络200可为一种用于在多个位置,例如地理位置或DC上连接第2层网络以建立统一或平面第2层网络的可扩展机制。虚拟第2层网络200可包括服务网络210及多个第2层网络220,第2层网络220可经由多个边缘节点212,例如边缘路由器,耦合到服务网络210。每个第2层网络220可包括多个L2GW 222,耦合到对应边缘节点212,还包括多个中间交换器224,可耦合到L2GW 222。虚拟第2层网络200的组件的设置可如图2所示。中间交换器2M还可耦合到多个主机及/或VM(未图示)。服务网络210可为任何建立后用来互连第2层网络220的网络,比如服务提供商网络。举例来说,服务网络210可为第2层、第2. 5层或第3层网络,例如虚拟私用网络 (VPN)。服务网络210可能知道所有地址,例如L2GW 222的MAC地址。L2GW 222可以是每个DC位置上的边界节点,具有第2层接口,用于在DC位置上内部通信。L2GW 222可使用其对应MAC地址例如经由中间交换器224与L2GW 222相同的第2层网络220内的相同位置及其它第2层网络220上的主机及/或VM通信。但是,L2GW 222及中间交换器2 可能并不知道其它第2层网络220中的主机/VM的MAC地址。实际上,如下所述,例如使用网络地址翻译(NAT)表或MAC地址翻译(MAT)表,可在其它第2层网络220中的L2GW 222上翻译主机/VM的MAC地址。在一个实施例中,每个L2GW 222可在本地IP地址信息表(Local-IPAddrliable) 中维护与L2GW 222位于相同第2层网络220内的所有主机/VM的地址。如下所述,L2GW 222还可用于实施代理ARP功能。此外,L2GW222可维护MAC转发表,此表中可包括非IP应用的MAC地址。MAC地址可包括相同位置,例如相同第2层网络220中的主机/VM及中间交换器224的MAC地址。L2GW 222可通知其在其它位置(例如,其它第2层网络220)上的对等体(例如, 其它L2GW 222)在其位置上的本地主机的所有IP地址,而不是本地维护的MAC地址(针对非IP应用)。因此,不同位置上的L2GW 222可获得所有其它位置的主机IP地址。因此,每个L2GW 222可将属于一个位置的每个群组的IP地址映射成属于同一位置的对应L2GW 222 的MAC地址。当L2GW 222的Local-IPAddrTable中有变化时,L2GW 222还可向对等体重发地址信息,从而更新其它对等体中的信息。这样做可以用递增方式更新每个L2GW 222中的地址信息及映射。图3图解说明边界控制机制300的实施例。边界控制机制300可为用于跨越多个位置或DC建立平面或虚拟第2层网络的可扩展机制。虚拟第2层网络可包括服务网络310 及多个第2层网络320,第2层网络320可经由多个边缘节点312,例如边缘路由器,耦合到服务网络310。每个第2层网络220可包括多个L2GW322,耦合到对应边缘节点312,还包括多个中间交换器324,可耦合到L2GW 322。中间交换器3M还可耦合到主机326,例如VM。 虚拟第2层网络的组件可用图2所示的方式设置,并且类似于虚拟第2层网络200的对应组件。每个L2GW 322可基于边界控制机制300维护所有位置,例如第2层网络320中的主机的IP地址。IP地址也可属于不同域中的主机,例如可跨越多个物理地址且可通过IP/ MPLS网络耦合的第2层域。每个L2GW 322还可知道其它位置上的对等L2GW 322的MAC地址。但是,L2GW 322可能并不维护其它位置上的主机的MAC地址,这样可实质性减小L2GW 322之间交换(及存储)的数据的大小。可将在L2GW 322上维护的IP地址映射成相同位置的对应L2GW322的MAC地址。具体来说,可将属于每个位置或第2层网络300的每一组主机IP地址映射成此位置上的L2GW 322的MAC地址。但是,L2GW 322可跨越不同位置交换运行非IP应用的节点的多个MAC地址。
要支持跨虚拟第2层网络的不同位置的地址解析,可从第一主机326(主机A)向第一位置或第2层网络320中的对应本地L2GW 322发送ARP请求。主机A可发送ARP请求以便获得第二位置或第2层网络320中的第二主机326(主机B)的MAC地址。如果本地 L2GW 322中有主机B的条目,例如主机B的IP地址,则本地L2GW 322可对ARP请求作出响应,将其自身的MAC地址发送给主机A。如果本地L2GW 322未维护或存储主机B的条目,则本地L2GW 322可假设主机B不存在。举例来说,L2GW 322可在有规律或周期性的基础上用其本地主机IP地址对其对等体进行更新。在这种情况下,有些L2GW 322可能尚未接收到其它位置上的新配置的主机的IP地址的更新。表1说明根据边界控制机制300将主机地址映射成对应L2GW的MAC地址的实例。可将多个L2GW MAC地址(例如,L2GW1MAC及L2GW2MAC)映射成多个对应主机地址。 可将每个L2GW MAC地址映射成可能与相同位置或DC相关联的多个VLAN(例如,VLAN#、 VLAN-x,……)中的多个主机IP (或MAC)地址。每个VLAN还可包括主机的多个虚拟私用群组(VPG)(或封闭用户群组)。VPG可为属于第2层域的主机及/或VM群集,可经由第2 层彼此通信。VPG中的主机还可在其之间建立组播群组。VPG内的主机/VM可跨越多个物理位置。举例来说,VLAN#可包括包含G-xl、G_x2、……在内的多个VPG中的多个主机。同样,VLAN-x可包括多个VPG (包含G-xj……)中的多个主机,VLAN-xl可包括多个VPG (包含 G-jl、G-j2、……)中的多个主机。对于IP应用,可将每个VLAN的每个VPG中的主机IP 地址映射成相同位置上的对应L2GW MAC地址,例如在VLAN#及VLAN-χ……的情况下。对于非IP应用,可将每个VLAN的每个VPG中的主机MAC地址映射成相同位置上的对应L2GW MAC地址,例如在VLAN-xl的情况下。表1 边界控制机制
权利要求
1.一种设备,其包括服务网络;及位于多个不同物理位置上的经由第2层网络上的多个边缘节点耦合到所述服务网络的多个第2层网络;其中所述边缘节点用于维护所述第2层网络上的多个主机的多个因特网协议(IP)地址;且其中每个所述第2层网络中的主机的IP地址由其它第2层网络映射成所述主机的相同第2层网络中的每个边缘节点的媒体接入控制(MAC)地址。
2.根据权利要求1所述的设备,其中所述边缘节点并不知道具有IP地址的主机的MAC 地址。
3.根据权利要求1所述的设备,其中所述边缘节点还用于维护多个非IP应用的多个 MAC地址。
4.根据权利要求1所述的设备,其中所述服务网络是第3层网络、第2.5层网络及第2层网络之一。
5.根据权利要求1所述的设备,其中所述边缘节点是第2层网关,其中所述主机包括多个应用、服务器和/或虚拟机,且其中所述第2层网络可位于不同数据中心(DC)上。
6.根据权利要求1所述的设备,其中所述第2层网络中的主机不知道其它第2层网络中的主机的MAC地址。
7.根据权利要求1所述的设备,其中所述边缘节点包括多个本地IP地址信息表,所述信息表包括所有第2层网络中的主机的IP地址,还包括多个MAC地址转发表,所述转发表包括与所述边缘节点位于相同第2层网络中的本地主机的多个MAC地址、第2层网络中的多个非IP应用的多个MAC地址,或以上两者的MAC地址。
8.根据权利要求1所述的设备,其中所述第2层网络中的多个交换器用作所述边缘节点的代表,且其中所述交换器接收并维护来自对应边缘节点的不同的多个IP地址子组。
9.根据权利要求1所述的设备,其中所述第2层网络中的多个交换器用作地址解析协议(ARP)代理,且其中所述ARP代理与跟所述交换器位于相同的第2层网络中的主机交换多个ARP请求及响应。
10.一种网络组件,其包括接收器,用于接收位于多个物理位置且经由服务互连的多个外部第2层网络中的多个主机的多个因特网协议(IP)地址;逻辑电路,用于将所述外部第2层网络中的主机的IP地址映射成相同外部第2层网络中的多个对应网关的多个媒体接入控制(MAC)地址;及发射器,用于将经由服务耦合到所述外部第2层网络的本地第2层网络中的多个本地主机的多个IP地址发送到所述外部第2层网络。
11.根据权利要求10所述的网络组件,其中将单个数据中心(DC)位置上的多个虚拟局域网(VLAN)中的主机的IP地址映射成外部网关的MAC地址中的相同一个MAC地址。
12.根据权利要求11所述的网络组件,其中所述主机与DC位置上的VLAN之一的多个虚拟私用群组(VPG)或封闭用户群组相关联。
13.根据权利要求10所述的网络组件,其中周期性地或在本地主机或本地主机的IP地址发生变化时发送本地主机的多个IP地址,从而更新所述外部第2层网络中的地址信息。
14.一种方法,其包括从第一数据中心(DC)位置上的第一主机接收准备送往第二 DC位置上的第二主机的帧;将所述帧中的第二主机的目的地地址(DA)映射成所述第二 DC位置上的第2层网关 (L2GW)的媒体接入控制(MAC)地址;添加支持电气电子工程师协会(IEEE)对于MAC-in-MAC的802. Iah标准的外部MAC标头,从而获得指示所述L2GW的MAC地址的内部帧;及经由耦合到第二 DC位置的服务实例将所述内部帧发送到所述第二 DC位置。
15.根据权利要求14所述的方法,其中所述帧包括所述第一DC位置上的本地L2GW的 MAC DA,所述第一主机的MAC源地址(SA)、所述第二主机的因特网协议(IP)DA,及所述第一主机的IP SA,其中所述外部MAC标头包括所述L2GW的MAC DA、本地L2GW的MAC SA,及指示内部帧需要MAC地址翻译的以太网类型,且其中所述内部帧包括外部MAC帧、本地L2GW 的MACDA,及第一主机的MAC SA。
16.根据权利要求14所述的方法,其中第二主机是非因特网协议(IP)应用,其中所述帧包括第一 DC位置上的本地L2GW的MAC DA,第一主机的MAC源地址(SA),其中所述外部 MAC标头包括L2GW的MAC DA、本地L2GW的MAC SA,及指示内部帧是用于MAC-in-MAC的以太网类型,且其中所述内部帧包括外部MAC帧、第二主机的MAC DA,及第一主机的MAC SA。
17.根据权利要求14所述的方法,其中所述第二主机从前一DC位置移动到所述第二 DC位置,其中所述帧包括第一 DC位置上的本地L2GW的MAC DA,所述第一主机的MAC源地址(SA)、所述第二主机的因特网协议(IP) DA,及所述第一主机的IP SA,其中所述外部MAC 标头包括所述L2GW的MAC DA、所述本地L2GW的MAC SA,及指示内部帧需要MAC地址翻译的以太网类型,且其中所述内部帧包括外部MAC帧、从前一 DC位置学习的所述第二主机的 MAC DA,及所述第一主机的MAC SA。
18.根据权利要求14所述的方法,其进一步包括从所述第一 DC位置上的本地主机接收地址解析协议(ARP)请求,从而获得另一 DC位置上的外部主机的MAC地址;及如果在所述本地L2GW的IP地址信息表中检测到所述外部主机的因特网协议(IP)地址,则向所述本地主机返回ARP回复,所述回复指示代表所述外部主机的所述第一 DC位置上的本地L2GW的MAC。
19.根据权利要求18所述的方法,其进一步包括将地址解析协议(ARP)消息发送到主机,从而获得来自所述主机的更新;及如果从所述主机接收到ARP回复,则更新IP地址信息表中的主机的条目。
20.根据权利要求14所述的方法,其进一步包括将来自IP地址信息表的多个主机的多个因特网协议(IP)地址推送到用作地址解析协议(ARP)代理的多个代表交换器;及从所述代表交换器接收所述主机的更新后的IP地址的合并列表。
全文摘要
本发明包含一种设备,此设备包括服务网络及在经由第2层网络上的多个边缘节点耦合到服务网络的位于多个不同物理位置上的多个第2层,其中所述边缘节点用于维护第2层网络上的多个主机的多个因特网协议(IP)地址,且其中每个第2层网络中的主机的IP地址由其它第2层网络映射成主机的相同第2层网络中的每个边缘节点的媒体接入控制(MAC)地址。
文档编号H04L12/46GK102577331SQ201180004288
公开日2012年7月11日 申请日期2011年5月27日 优先权日2010年5月28日
发明者尹国理, 彼得·艾斯伍德斯密斯, 本杰明·T·麦克格林, 琳达·邓巴, 罗伯特·苏丹, 苏珊·赫尔斯 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1