管理控制器在数据中心环境中学习控制平面层次的机制的制作方法

文档序号:9690896阅读:201来源:国知局
管理控制器在数据中心环境中学习控制平面层次的机制的制作方法
【专利说明】
【背景技术】
[0001]近年来,“基于云”的服务的实现、高性能计算(HPC)以及采用数据中心的其他活动等已经被广泛采用。根据典型的数据中心安装,在服务器机箱(chassis)和服务器机架(rack)中安装的大量服务器使用网络链接(例如,以太网)和各种交换机制(诸如,交换机刀片/模块和“机顶”(“t0p-0f-rack”,T0R)交换机)来通信地互联。在一些安装中,诸如无限带宽(InfiniBand)或者光纤信道(Fibre Channel)之类的另外的链接可以用于存储和其他目的。
[0002]数据中心通常采用计算、网络和存储共享资源的物理层次(hierarchy),以支持对工作量需求的扩展。管理这样的计算、联网和存储共享资源的实际上的控制平面(controlplane)是以太网,而针对可管理性的网络协议是基于TCP/IP的。每个共享资源典型地具有管理控制器,其用于提供可管理性接入点并且经由IPv4或者IPv6地址来寻址。通常,数据中心实现VLAN(虚拟局域网)以将控制平面业务与数据平面业务分离。
[0003]需要有针对控制平面中的控制器的层次架构,以用于防止多个管理代理向管理控制器提供有冲突的命令。例如,应用性能管理器想要托架(Sled)控制器增强节点功率,但托盘(Tray)级功率管理器想要将托盘级功耗限制在当前水平。
[0004]当前,不存在可用的发现管理控制器层次的自动化机制,即使在物理容纳层次已被明确定义时也是如此。非常期望的是,在控制器层次中的每个管理控制器自动地“学习”其命令链中处于更高级和可选地更低级二者的所有控制器。这是协调可管理性动作的基础需求。
[0005]能够使用分离的物理连接在有限的物理范围内建立控制器层次。这样的方法施加了硬件需求,并且不可扩展以支持当今数据中心的密集形态需求。
【附图说明】
[0006]结合附图参考下面的【具体实施方式】,本发明的上述方面及许多相应的优点将得到更好地理解,同样将更容易领会,其中,除非另外规定,遍及各个视图的相同的附图标记指的是相同的部分:
[0007]图1是示出了包括模块化数据中心(pod)、机架、托盘、和托架的数据中心物理层次的示意框图;
[0008]图2是示出了在图1的数据中心物理层次中实现的控制平面层次的图;
[0009]图3是示出了将可管理性控制器IP地址插入DHCP应答中的消息流图,该插入用于自动知道在托架可管理型控制器处于其最低级别的数据中心中的控制平面层次;
[0010]图3a是示出了将可管理性控制器IP地址插入DHCP应答中的消息流图,该插入用于自动知道在托盘可管理型控制器处于其最低级别的数据中心中的控制平面层次;
[0011]图4a是示出了由交换机和相关联的可管理性控制器所执行的用于实现图3的消息流图的操作和逻辑的流程图;
[0012]图4b是示出了由层次中的最低的可管理性控制器所执行的用于分发经由DHCP响应所收集的管理控制器层次信息的操作的流程图;以及
[0013]图5是根据一个实施例的包括用于图3的消息流图的已实现方面的增强DHCP软件的交换机的示意框图。
【具体实施方式】
[0014]本文描述了使管理控制器能够学习数据中心环境中的控制平面层次的机制的实施例。在下面的说明书中,阐述了大量具体细节以提供对本文所公开和示出的实施例的透彻理解。然而,相关领域的技术人员将会认识到,能够在没有所述具体细节的一个或多个的情况下或者利用其他方法、组件、材料等来实施本发明。在其他实例中,没有示出或者详细描述公知的结构、材料或操作,以避免使本发明的方面难以理解。
[0015]为了清楚起见,本文附图中的各个组件也可以由其在附图中的标签而不是由特定附图标记来指示。另外,指示特定类型的组件(相对于特定组件)的附图标记可以示出为附图标记后有“(typ)”,其意思是“典型的(typical)”。将会理解的是,这些组件的配置会是可能存在但是为了简洁和清楚而没有在附图中示出的类似组件、或者另外的没有使用单独的附图标记来标注的类似组件的典型。相反地,“ (typ) ”不应解释为是指该组件、元件等典型地用于其公开的功能、实现、目的等。
[0016]根据本文所描述的实施例的方面,提供了便于自动学习在数据中心等中的控制平面层次的基于软件的机制。常规的DHCP (动态主机控制协议)技术用于将IP (互联网协议)地址分配到数据中心中的DHCP客户端(包括管理控制器以及计算和存储节点),本文提供的机制利用了常规的DHCP技术,将管理控制器层次信息插入从DHCP服务器发出的DHCP应答中。此外,该机制是以对计算和存储节点透明的方式实现的。
[0017]如上文所讨论的,数据中心通常采用计算、网络和存储共享资源的物理层次,以支持对工作量需求的扩展。图1示出数据中心100的一部分,数据中心100中的示例性物理层次包括数量为L的模块化数据中心102、数量为Μ的机架104,机架104中的每个均包括用于数量为Ν的托盘106的槽。每个托盘106又可以包括多个托架108。为了便于解释,模块化数据中心102、机架104和托盘106中的每个均被标注有对应的标识符,诸如模块化数据中心1、机架2、托盘1Β等。
[0018]在每个机架104的顶部处绘出了各自的TOR交换机110,其也被标注有TOR交换机号。通常,TOR交换机110代表着支持在机架104之间的交换的TOR交换机和任何其他交换设施二者。常规实践是将这些交换机称作TOR交换机,而不管其是否在物理上位于机架的顶部(尽管其通常是这样)。
[0019]每个模块化数据中心102还包括模块化数据中心交换机112,该模块化数据中心中的T0R交换机110耦合到该模块化数据中心交换机112。模块化数据中心交换机112又耦合到数据中心(DC)交换机114。数据中心交换机可以位于数据中心交换机层次的顶部,或者可能有未示出的一个或多个的另外的级别。为了易于解释,本文所描述的层次是使用物理LAN的物理层次。在实践中,通常使用底层物理LAN交换设施来部署虚拟LAN。
[0020]数据中心100还包括DHCP(动态主机控制协议)服务器116,其被配置为分配和管理IP地址。为了简洁起见,模块化数据中心1描绘了直接连接到DC交换机114的DHCP服务器116。通常,DHCP服务器可以由独立服务器托管,或者可以托管在通过层次中的一个或多个的交换机层连接到DC交换机的模块化数据中心中的一个中的计算节点中的一个上。根据其他配置,单独的DHCP服务器可以为每个模块化数据中心或者一组模块化数据中心提供DHCP功能。作为另一选项,多个DHCP服务器可以以分布式的方式操作,以实现针对跨多个模块化数据中心的域或者子域的DHCP操作。
[0021]为了与数据中心中的其他计算节点和资源宿主通信,每个计算或者存储宿主(本文统称为计算节点和存储节点)需要具有根据用于数据中心网络的通信协议的唯一地址(注意,数据中心的不同部分可以采用不同的网络协议)。在本文的实施例中,网络协议是以太网,而所使用的网络层协议是IP (互联网协议)。如上文所讨论的,数据中心的IP业务典型地在传输层采用传输控制协议(TCP),以使用广泛使用的TCP/IP协议来确认所传输的数据的交付。
[0022]DHCP是IP网络所使用的用于动态分配网络配置参数(诸如IP地址)的标准化联网协议。根据DHCP,DHCP客户端(诸如企业LAN上的计算机和数据中心中的计算节点)自动地从DHCP服务器请求IP地址和联网参数,减少了网络管理员或者用户手动配置这些设置的需要。
[0023]DHCP非常常见,并且被用在多种多样的网络上,网络的尺寸范围从家庭网络到大型园区网络和区域性的互联网服务提供商网络以及数据中心。大多数住宅网络路由器接收提供商网络内的全局唯一的IP地址。在本地网络内,DHCP向连接到本地网络的设备分配本地IP地址。当计算机或者其他网络设备连接到网络时,其DHCP客户端软件(例如,在主机操作系统中)发送广播查询来请求必要的信息。通常,网络中的任何DHCP服务器都可以服务该请求。DHCP服务器管理IP地址池以及诸如默认网关、域名、名称服务器和时间服务器之类的关于客户端配置参数的信息。在接收到请求之后,服务器可以使用先前由管理员所配置的针对每个客户端的特定信息来作出响应,或者使用对于整个网络有效的特定地址和任何其他信息以及该分配(租约)有效的时间段来作出响应。主机典型地在引导之后立即查询该信息,其后周期性地在信息期满之前查询该信息。当DHCP客户端更新分配时,其最初请求相同的参数值,但基于管理员所设定的分配策略,可以从服务器分配新的地址。
[0024]通常,给定的IP域可以采用或者IPv4 (互联网协议版本4)地址或者IPv6 (互联网协议版本6)地址。IPv4使用4个八位字节的地址,而IPv6使用6个八位字节的地址。很多环境使用DHCP分配的与预分配的IPv4或者IPv6地址的混合。就数据中心来说,许多数据中心可以在一天的部分期间(例如,夜晚)处于待机或者完全关闭。“休眠”节点可以保留DHCP分配的地址,而关闭节点当重新启动时必须要求新的DHCP地址。
[0025]分配DHCP地址的最常见情形是:1)每当计算或者存储节点被恢复并要求新的IP地址(在被关闭之后或者在休眠状态下其DHCP租约被明确释放或期满)时;2)当托架被安装在托盘中时;以及3)当安装托盘时。如下文将进一步详细讨论的那样,根据某种架构,托架可以具有跨作为单个计算节点操作(从网络的角度来看)的多个计算单元的共享的单个网络接口(和对应的IP地址)。此外,一些托架可以支持多个计算节点,其具有各自的网络接口并因此要求每个计算节点有各自的IP地址。
[0026]图1描绘了托架108a被安装在托盘2N中的空托架槽120中。还描绘了托盘MB被安装到空托盘槽122中。图1还以交叉影线示出了托盘1A中的托架,表示其当前是离线的。当托架108a被安装到空托架槽120中时,其被初始化,这包括从DHCP服务器116获得IP地址。类似地,当托盘MB被安装在空托盘槽122中时,托盘自身和它的每一个托架二者均被初始化,其结果是从DHCP服务器请求针对托盘MB及其每个托架的IP地址。当托盘1A中的每个托架中恢复在线时,也将从DHCP服务器116请求IP地址。
[0027]图2示出了用于管理数据中心100中的各种资源的示例性管理层次200。在管理层次200的顶部是模块化数据中心可管理性控制器(PMC) 202,随后是机架可管理性控制器(RMC) 204、托盘可管理性控制器(TMC) 206、以及托架可管理控制器(SMC)208。PMC 202、RMC204、TMC 206和SMC 208以及共享资源210中的每个耦合到以太网网络212。
[0028]如图2进一步所示,每个模块化数据中心102具有一个PMC 202,其用于执行与该模块化数据中心的操作有关的可管理性方面。类似地,每个机架204包括用于执行与该机架的操作有关的可管理性方面的RMC 204,每个托盘106包括用于
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1