共享服务器组供电单元的监测的制作方法

文档序号:12071137阅读:216来源:国知局
共享服务器组供电单元的监测的制作方法与工艺

各种各样的服务通过网络而被提供。例如,云计算完全基于通过网络提供服务的概念,并且通常来自远程位置。术语“云”用于表示无论最终用户在哪里、无论用户具有什么设备,他们都可以通过网络获得服务。对于用户,目标是使得看起来服务就是来自云,永远存在。

当然,虽然那些服务可能具有从最终用户的角度看从“云”被提供的表象,但实际上存在用于提供服务的物理硬件。术语“云计算”中的修饰语“云”意味着服务的高可用性。在抽象的用户体验感觉中,好像用户可以简单地到达现有的云以提取期望的服务。因此,云服务预期具有高水平的可用性。充满数以千计的服务器的整个数据中心可以为通过网络提供的云服务提供物理基础设施。为了提供期望的云服务的高可用性,因此重要的是服务器不会在他们的工作中被中断向最终用户提供服务。

为了确保电力可靠地被供应给给定的服务器组,通常向服务器组提供冗余的服务器组电力馈送。例如,数据中心可以特别地接收冗余数据中心交流(AC)电力馈送,使得冗余服务器组电力馈送可以被提供给服务器组。在服务器组内,服务器组电力馈送之一将向一个供电单元组提供电力,而另一服务器组电力馈送将向另一供电单元组提供电力。因此,如果服务器组电力馈送中的一个下降,则另一服务器组电力馈送可以继续供电,从而提高服务器组的可用性。

本文所要求保护的主题不限于克服任何缺点或仅在诸如所描述的环境中操作的实施例。相反,

背景技术:
仅提供用于说明可以实践本文所描述的一些实施例的一个示例性技术领域。



技术实现要素:

本文所描述的至少一些实施例涉及服务器组中的电力监测,服务器组具有共享供电系统,共享供电系统向服务器组中的一个或多个服务器提供电力。服务器组被托管在数据中心中,数据中心接收冗余数据中心交流(AC)电力馈送,每个冗余数据中心交流(AC)电力馈送映射到对应的服务器组电力馈送。每个服务器组电力馈送向服务于服务器组的对应供电单元组提供电力。

根据本文所描述的一些实施例,控制器监测服务器组的电力使用,并且针对聚合的供电单元馈送的供电能力,评估所监测的电力使用。基于该评估,控制器可以检测特定供电单元组何时不再能够单独提供服务器组正在消耗或预期消耗的所有电力。

根据本文所描述的其他实施例,控制器检测特定供电单元组何时不再能够单独提供服务器组正在消耗或预期消耗的所有电力。控制器还标识将降低服务器组的电力消耗的一个或多个动作,使得如果除了特定服务器组电力馈送之外所有多个服务器组的电力馈送将被丢失,则服务器组的电力消耗能够由特定服务器组电力馈送满足。此外,响应于检测到特定服务器组电力馈送不再能够单独向服务器组提供电力,控制器执行所标识的一个或多个动作。

提供本发明内容来以简化形式介绍将在以下详细描述中进一步描述的一些概念。本发明内容无意标识所要求保护的主题的关键特征或必要特征,也无意被用于帮助确定所要求保护的主题的范围。

附图说明

为了描述可以获得本发明的上述和其他优点和特征的方式,将通过参考在附图中示出的本文具体实施例来呈现上面简要描述的本发明的更具体的描述。应当理解,这些附图仅描绘了本发明的典型实施例,因此不应被认为是对其范围的限制,将通过使用附图利用附加特征和细节来描述和解释本发明,其中:

图1图示了其中可以采用本文描述的原理并且包括多个服务器组的数据中心;

图2图示了作为图1的服务器组中的任一个的示例的服务器组外壳的示例;

图3图示了用于提高一个或多个服务器的服务器组的可靠性的方法的流程图;以及

图4图示了其中可以采用本文所描述的原理的示例计算系统。

具体实施方式

本文描述的至少一些实施例涉及服务器组中的电力监测,服务器组具有共享供电系统,共享供电系统向服务器组中的一个或多个服务器提供电力。服务器组被托管在其中的数据中心接收冗余数据中心交流(AC)电力馈送,每个冗余数据中心交流(AC)电力馈送映射到对应的服务器组电力馈送。每个服务器组电力馈送向服务于该服务器组的对应供电单元组提供电力。

根据本文所述的一些实施例,控制器监测服务器组的电力使用,并且针对聚合的供电单元馈送的供电能力来评估所监测的电力使用。基于该评估,控制器可以检测特定供电单元组(其被映射到数据中心馈送之一)何时不再能够单独提供服务器组正在消耗或预期消耗的所有电力。

根据本文所述的其他实施例,控制器检测特定供电单元组何时不再能够单独提供服务器组正在消耗或预期消耗的所有电力。控制器还标识将降低服务器组的电力消耗的一个或多个动作,使得如果除了特定服务器组电力馈送之外,所有多个服务器组的电力馈送将被丢失,则服务器组的电力消耗可以由特定的供电馈送满足。此外,响应于检测到特定服务器组电力馈送不再能够单独地向服务器组提供电力,控制器执行所标识的一个或多个动作。

图1图示了其中可以采用本文所描述的原理的数据中心100。数据中心100包括多个服务器组101、102和103。服务器组可以各自包括任何数目的服务器。例如,如果服务器组是服务器机架(server rack),在给定服务器组内可能存在大量服务器。在较小的规模上,服务器组可以是包含多个服务器的服务器机箱(server chassis)。在这种情况下,服务器可以采取刀片服务器(server blade)的形式,但不是必需的。服务器组甚至可以是比服务器机架更高的规模,例如,构成多个服务器机架的整个服务器容器。在任何情况下,无论规模如何,每个服务器组101、102和103构成一个或多个服务器的组。

虽然在图1中仅示出了三个服务器组101、102和103,但是这仅仅是为了简单和清楚的目的。椭圆104表示在数据中心100内可以存在任何数量的服务器组。例如,数据中心可以在其中具有数千甚至数百万个服务器。因此,图1应当仅被视为数据中心100的简单示例和抽象表示。

数据中心100被图示为包括配电单元111和配电单元112。配电单元111和112可以是用于获取电力的任何装置,例如外部公用事业公司、现场发电(例如,发电机、太阳能板和/或燃料电池)、不间断电源(UPS)和/或电池,或访问电力的任何其他机构。椭圆113表示在数据中心内潜在地可以存在多于两个的配电单元。

每个配电单元111向服务器组101、102和103中的每一个提供供电单元馈送。例如,配电单元111分别向服务器组101、102和103提供供电单元馈送121A、121B和121C。类似地,配电单元112分别向服务器组101、102和103提供供电单元馈送122A、122B和122C。作为示例,供电单元馈送121A和122A可以是或可以被用于向服务器组101提供对应的服务器组电力馈送。供电单元馈送121B和122B可以是或可以被用于向服务器组102提供对应的服务器组电力馈送。此外,供电单元馈送121C和122C可以是或可以被用于向服务器组103提供对应的服务器组电力馈送。如果存在附加的配电单元(由椭圆113表示),则这些一个或多个附加配电单元可以同样地向服务器组提供供电单元馈送,以提供甚至进一步的电力冗余。

因此,数据中心100具有共享电源(由配电单元111、112和潜在的113表示),该共享电源允许数据中心100向服务器组中的每一个提供冗余服务器组电力馈送。这在服务器组电力馈送之一故障的情况下提供冗余,从而提高数据中心100的可靠性。

图2图示了作为图1的服务器组101、102或103中的任一个的示例的服务器组外壳200的示例。在该示例中,服务器组外壳包围16个服务器201至216。在该具体示例中,每个服务器201至216是刀片服务器,使得服务器组外壳200是刀片外壳。服务器组外壳200具有六个供电单元221至226。服务器组电力馈送231被图示为向包括三个供电单元221至223的第一供电单元组提供电力,并且服务器组电力馈送232被图示出为向包括供电单元(224至226)的第二供电单元组提供电力。供电单元221至226调节由服务器201至216消耗的电力。每个服务器可以如下针对图4的计算系统400所描述的那样操作。供电单元221至226各自贡献服务器210至216的聚合电力需求。

如果服务器组外壳200是图1的服务器组101,则图2的服务器组电力馈送231可以是图1的供电单元馈送121A或者可以来源于图1的供电单元馈送121A,并且图2的服务器组电力馈送232可以是图1的供电单元馈送122A或者可以来源于图1的供电单元馈送122A。如果服务器组外壳200是图1的服务器组102,则图2的服务器组电力馈送231可以是图1的供电单元馈送121B或者可以来源于图1的供电单元馈送121B,并且图2的服务器组电力馈送232可以是图1的供电单元馈送122B或者可以来源于图1的供电单元馈送122B。如果服务器组外壳200是图1的服务器组103,则图2的服务器组电力馈送231可以是图1的供电单元馈送121C或可以来源于图1的供电单元馈送121C,并且图2的服务器组电力馈送232可以是图1的供电单元馈送122C或可以来源于图1的供电单元馈送122C。

为了提供冗余供电,应当提供以下冗余条件:1)服务器组电力馈送231(例如,更直接地说,第一供电单元组221至223)应当提供足够的电力以进行服务器201至216的操作,而无论服务器组电力馈送232(例如,更直接地说,第二供电单元组224至226)是否丢失电力,以及2)服务器组电力馈送232(例如,更直接地说,第二供电单元组224至226)应当提供足够的电力以进行服务器301至316的操作,而无论服务器组电力馈送231(例如,更直接地说,第一供电单元组221至223)是否丢失电力。

图3图示了用于提高一个或多个服务器的服务器组的可靠性的方法300的流程图。参考图1,方法300可以由电源控制器130执行。例如,电源控制器130可以响应于执行计算机可执行指令来执行方法300,这些计算机可执行指令被构造为使得当由控制器执行时,使控制器执行方法300。电源控制器130可以被实现在服务器组内的服务器上,或者可以被实现在服务器组外部。可能存在专用于每个服务器组的电源控制器130,但是单个控制器130可以类似地对多个服务器组执行方法300,或者甚至可能针对整个数据中心100中的所有服务器组执行方法300。

对于给定的服务器组,电源控制器监测(动作301)服务器组的电力使用。例如,在图2的服务器组的上下文中,电源控制器可以监测服务器201至216的聚合电力使用。例如,电源控制器可以追踪历史电力使用以验证电力使用中的任何趋势,例如增加、稳定或减小。

电源控制器针对每个供电单元组的供电能力来评估(动作302)所监测的服务器组的电力使用。如果评估的结果不是检测到任何供电单元组将不再能够单独提供服务器组正在消耗或预期消耗的所有电力(在判定框303中为“否”),则重复监测(动作301)和评估(动作302)。该监测(动作301)和评估(动作302)可以被周期性地执行或甚至连续地执行。

在某种情况下,电源控制器可以检测特定供电单元组不再能够单独提供服务器组正在消耗或预期消耗的所有电力(在判定框303中为“是”)。关于图2,电源控制器可以检测如果服务器组电源电力馈送232丢失电力,由服务器组电力馈送231供电的第一供电单元组221、222和223不足以提供服务器201至216正在消耗或预期消耗的所有电力。备选地或附加地,电源控制器可以检测如果服务器组电力馈送232丢失电力,由服务器组供电馈送232供电的第二供电单元组224、224和226将不足以提供服务器201至216正在消耗或预期消耗的所有电力。

将该原理应用于图1,电源控制器130可以检测如果服务器组电力馈送122A丢失电力,服务器组电力馈送121A(经由对应的供电单元组)将不足以提供服务器组101正在消耗或预期消耗的所有电力。备选地或附加地,电源控制器130可以检测如果服务器组电力馈送121A丢失电力,服务器组电力馈送122A(经由对应的供电单元组)将不足以提供服务器组101正在消耗或预期消耗的所有电力。类似地,电源控制器130可以检测在服务器组电力馈送122B丢失的情况下服务器组电力馈送121B(经由对应的供电单元组)是否变得不足以单独为服务器组102供电,或者可以检测在供电馈送122A丢失的情况下服务器组电力馈送122B(经由对应的供电单元组)变得不足以单独为服务器组102供电。同样关于图1,电源控制器130可以检测在服务器组电力馈送122C丢失的情况下服务器组电力馈送121C(经由对应的供电单元组)是否变得不足以单独为服务器组103供电,或者可以检测在服务器组电力馈送121C丢失的情况下服务器组电力馈送122C(经由对应的供电单元组)变得不足以单独为服务器组103供电。

在一个实施例中,特定供电单元组的所预期的能力的缺失是由于从特定服务器组电力馈送接收电力的至少一个供电单元的所丢失的能力。例如,在图2中,假设供电单元223丢失功能并且不再能够从服务器组电力馈送231向服务器201至216中的任一个提供电力。单个供电单元223中的这种丢失可能足以使得在服务器组电力馈送232丢失的情况下供电组221-223不再能够为服务器201至216充分供电。备选原因可能简单地因为供电单元由于老化而随时间失去效率。备选地或附加地,供电单元可能来自不良批次,并且被标记以供电源控制器130的更密切的监测。例如,电源控制器130可以访问对应于已知不良批次的特定序列号,或者否则供电单元可以被标记,使得电源控制器130可以预期供电单元很快故障。

在其他情况下,特定供电单元组的所预期的能力的缺失是由于服务器组的消耗活动增加超过预定消耗水平。例如,即使在用于特定供电单元组的任何供电单元的故障不存在的情况下,也许服务器组的使用已经被增加到以下程度,即给定该服务器组的电力使用的增加趋势,供电单元组将存在很快就不能够为服务器组供电的危险。

电源控制器标识(动作304)将降低服务器组的电力消耗的一个或多个动作,使得如果除了特定供电单元组之外所有供电单元组将被丢失,则服务器组的电力消耗可以由特定供电单元组满足。换言之,可以制定动作计划来减少电力使用,以再次返回到提供完全冗余的状态。该动作304与动作301、302和303被并行地示出,以说明在这些动作被标识的时间与动作301和302的监测和评估操作之间不存在时间依赖性。

一旦供电单元组中的一个被检测为不足(在判定框303中为“是”),并且减少电力消耗的适当动作被标识(动作304),则所标识的一个或多个动作被执行(动作305)。例如,仅作为示例,降低电力消耗的动作可以是从服务器组迁移至少一个、一些或甚至全部工作负载。其他类型的动作包括降低风扇速度、处理器利用率、磁盘驱动器旋转速度或磁盘驱动器电力消耗;或略微增加所接受的操作温度。

因此,本文描述的原理允许服务器组在真实世界条件存在的情况下保持供电单元组中的完全冗余。例如,如果预期给定的供电单元组不再能够提供服务器组的所有电力需求(由于所丢失的将电力传送到服务器组的能力,和/或由于服务器组中增加的电力使用),可以快速采取动作以减少服务器组的电力使用。因此,保持了供电馈送冗余,并且维持了服务质量。

虽然不是必需的,但是本文所描述的许多组件和操作可以由计算系统执行。例如,服务器201至216中的每一个可以表示计算系统。此外,电源控制器130的操作可以经由使用计算系统来实现。因此,现在将关于图4描述计算系统。

尽管已经用对结构特征和/或方法动作专用的语言描述了主题,但是应当理解,所附权利要求中限定的主题不一定限于上述的特征或动作、或上述动作的顺序。相反,所描述的特征和动作作为实现权利要求的示例形式被公开。

计算系统现在越来越多地采取各种各样的形式。计算系统可以例如是手持设备、家用电器、膝上型计算机、台式计算机、大型机、分布式计算系统、或甚至通常不被认为是计算系统的设备。在本说明书和权利要求书中,术语“计算系统”被广义地定义为包括任何设备或系统(或其组合)(其包括至少一个物理和有形处理器、以及能够具有在其上的可以由处理器执行的计算机可执行指令的物理和有形存储器)。计算系统可以被分布在网络环境上并且可以包括多个组成计算系统。

如图4所示,在其最基本的配置中,计算系统400通常包括至少一个处理单元402和存储器404。存储器404可以是物理系统存储器,该物理系统存储器可以是易失性、非易失性或二者的某个组合。术语“存储器”在本文也可以用于指非易失性大容量存储装置(例如,物理存储介质)。如果计算系统是分布式的,则处理能力、存储器能力和/或存储装置能力也可以分布式的。

如本文所使用的,术语“可执行模块”或“可执行组件”可以指可以在计算系统上被执行的软件对象、路由或方法。本文描述的不同组件、模块、引擎和服务可以被实现为在计算系统上被执行的对象或过程(例如,作为单线程)。

在下文描述中,参考由一个或多个计算系统执行的动作来描述实施例。如果这样的动作以软件实现,则执行动作的相关联的计算系统的一个或多个处理器响应于已执行了计算机可执行指令来引导计算系统的操作。例如,这样的计算机可执行指令可以被体现在形成计算机程序产品的一个或多个计算机可读介质上。这种操作的一个示例涉及数据的操纵。计算机可执行指令(和被操纵的数据)可以被存储在计算系统400的存储器404中。计算系统400还可以包含通信信道408,通信信道408允许计算系统400例如通过网络410与其他消息处理器通信。

如以下更详细讨论的,本文描述的实施例可以包括或利用包含计算机硬件(例如,一个或多个处理器和系统存储器)的专用或通用计算机系统。系统存储器可以被包括在总存储器404内。系统存储器还可以被称为“主存储器”,并且包括由至少一个处理单元402通过存储器总线可寻址的存储器位置,在这种情况下,寻址位置在存储器总线本身上被断言。系统存储器已经是传统易失性的,但是本文描述的原理也适用于系统存储器部分地或甚至完全地是非易失性的情况。

本发明范围内的实施例还包括用于承载或存储计算机可执行指令和/或数据结构的物理和其他计算机可读介质。这样的计算机可读介质可以是由通用或专用计算机系统能够访问的任何可用介质。存储计算机可执行指令和/或数据结构的计算机可读介质是计算机存储介质。承载计算机可执行指令和/或数据结构的计算机可读介质是传输介质。因此,通过示例而非限制性的方式,本发明的实施例可以包括至少两个完全不同类型的计算机可读介质:计算机存储介质和传输介质。

计算机存储介质是存储计算机可执行指令和/或数据结构的物理硬件存储介质。物理硬件存储介质包括计算机硬件,例如RAM、ROM、EEPROM、固态驱动器(“SSD”)、闪存、相变存储器(“PCM”)、光盘存储器、磁盘存储器或其他磁存储设备、或者可用于以计算机可执行指令或数据结构的形式存储程序代码的任何其他硬件存储设备,该程序代码其可由通用或专用计算机系统访问和执行以实现本发明的公开的功能。

传输介质可以包括网络和/或数据链路,网络和/或数据链路可以用于承载计算机可执行指令或数据结构形式的程序代码,并且可以由通用或专用计算机系统访问。“网络”被定义为使能在计算机系统和/或模块和/或其他电子设备之间传输电子数据的一个或多个数据链路。当通过网络或另一通信连接(硬连线、无线或硬连线或无线的组合)向计算机系统传送或提供信息时,计算机系统可以将该连接视为传输介质。上述的组合也应当包括在计算机可读介质的范围内。

此外,当到达各种计算机系统组件时,计算机可执行指令/数据结构形式的程序代码可以从传输介质自动被传递到计算机存储介质(反之亦然)。例如,通过网络或数据链路接收到的计算机可执行指令或数据结构可以被缓冲在网络接口模块(例如,“NIC”)内的RAM中,然后最终被传递给计算机系统RAM和/或计算机系统处的较不易失的计算机存储介质。因此,应当理解,计算机存储介质可以被包括在也(或甚至主要地)利用传输介质的计算机系统组件中。

计算机可执行指令包括例如以下的指令和数据,这些指令和数据在一个或多个处理器处被执行时,使得通用计算机系统、专用计算机系统、或专用处理设备执行某个功能或某组功能。计算机可执行指令可以是例如诸如汇编语言的二进制、中间格式指令,或甚至是源代码。

本领域技术人员将理解,本文描述的原理可以在具有许多类型的计算机系统配置的网络计算环境中实践,这样的网络计算环境包括个人计算机、台式计算机、膝上型计算机、消息处理器、手持设备、多处理器系统、基于微处理器的消耗电子产品或可编程消耗电子产品、网络PC、小型计算机、大型计算机、移动电话、PDA、平板计算机、寻呼机、路由器、交换机,等等。本发明还可以被实践在分布式系统环境中,其中通过网络链接(通过硬连线数据链路、无线数据链路、或通过硬连线和无线数据链路的组合)的本地和远程计算机系统均执行任务。因此,在分布式系统环境中,计算机系统可以包括多个组成计算机系统。在分布式系统环境中,程序模块可以位于本地存储器存储设备和远程存储器存储设备中。

本领域技术人员还将理解,本发明可以被实践在云计算环境中。云计算环境可以是分布式的,但这不是必需的。当为分布式时,云计算环境可以在组织内国际性地分布和/或具有跨越多个组织拥有的组件。在本说明书和所附权利要求中,“云计算”被定义为用于实现对可配置计算资源(例如,网络、服务器、存储、应用和服务)的共享池的按需网络访问的模型。“云计算”的定义不限于在被恰当部署时能够从这种模型获得的任何其他众多优点。

在不脱离本发明的精神或主要特征的情况下,本发明可以以其他具体形式实现。所描述的实施例在所有方面都被认为仅是示例性的而非限制性的。因此,本发明的范围由所附权利要求书来指示、而不是由前述描述来指示。在权利要求的等同的含义和范围内的所有改变将被包括在权利要求的范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1