在数据中心动态分配功率的方法和设备的制作方法

文档序号:6339792阅读:208来源:国知局
专利名称:在数据中心动态分配功率的方法和设备的制作方法
技术领域
一般来说,本 发明的实施例涉及计算机系统的功率管理领域,更具体来说,涉及用 于为服务器机架中的服务器动态分配功率封顶极限(capping limit)的方法和设备。
背景技术
服务器机架是为特定功率消耗包络而设计的,包络取决于多种因素,例如服务器 机架中的服务器的数量、服务器机架中的服务器的类型(例如,具有低功率CPU或高功率 CPU的服务器)、放置服务器机架的房间的冷却系统、服务器机架中服务器的供电配电网络 等。诸如服务器机架的计算机系统中的服务器执行多个应用,并且可具有多种多样的工作 负荷。多种多样的工作负荷意味着,在给定时间,在相同机架中,由于不同工作负荷需要不 同的处理器使用率,所以计算机系统中的一个服务器可能消耗与另一个服务器不同量的功 率。服务器中的充分使用的处理器意味着没有浪费处理器的任何处理循环。但是,由于服务器机架的总功率容量对服务器设置了功率极限,所以可能不能充 分使用服务器。由服务器机架中的功率限制引起的这些未充分使用的服务器可表现出性 能损失。性能损失定义为在没有任何功率消耗极限的情况下允许处理器处理时出现的处 理器使用率。对服务器设置的功率极限还可源自由服务器本身对该服务器设置的内部功 率极限。例如,服务器中的功率控制器单元可将服务器功率容量设置为基于处理器可靠性 和寿命基准的保守极限。如果处理器(或容纳处理器的服务器)倾向于消耗超过保守极 限的功率(一般经由处理器之中、之上或周围的热传感器进行监视),则处理器进行节流 (throttle)。节流意味着,减小处理器工作频率和/或电源电平以降低所消耗的功率以及 由处理器生成的热量。一种增加服务器的计算能力、同时减小服务器机架中的服务器的性能损失的方法 是向服务器机架提供更好的温度冷却设施以及提升由每个服务器的功率控制器单元设置 的功率极限。但是,这种减小性能损失的方法没有基于各个服务器的工作负荷考虑它们的 功率消耗。这种方法还需要诸如更好的温度冷却设施的物理基础设施改变以及服务器机架 内的服务器中的配电网络的重新设计。此外,确定服务器机架中的各个服务器的功率预算 的探索性方法利用特定的功率指定方法,这些方法没有鉴于服务器的性能损失考虑服务器 的可预见到的功率需求。

发明内容
本发明涉及一种方法,包括测量具有一个或多个服务器的计算机系统的功率消耗;估计所述一个或多个服务器中的每个服务器的功率需求的概率分布,所述估计基 于所述测量的功率消耗;经由所述估计的概率分布估计性能损失;计算所述一个或多个服务器中的每个服务器的功率封顶极限,所述计算基于所述估计的概率分布和所述性能损失;以及通过修改所述一个或多个服务器中的每个服务器的之前的功率封顶极限来为所述一个或多个服务器中的每个服务器动态地分配功率封顶极限。本发明涉及一种其上存储有计算机可执行指令的计算机可读存储介质,所述指令 在执行时使计算机执行一种方法,所述方法包括测量具有一个或多个服务器的计算机系统的功率消耗;估计所述一个或多个服务器中的每个服务器的功率需求的概率分布,所述估计基 于所述测量的功率消耗;经由所述估计的概率分布估计性能损失;计算所述一个或多个服务器中的每个服务器的功率封顶极限,所述计算基于所述 估计的概率分布和所述性能损失;以及为所述一个或多个服务器中的每个服务器动态地分配所述功率封顶极限。本发明涉及一种设备,包括具有一个或多个服务器的服务器机架;经由网络接口与所述服务器机架耦合的处理器,所述处理器具有用于执行包括以 下步骤的方法的逻辑测量所述服务器机架的功率消耗;估计所述一个或多个服务器中的每个服务器的功率需求的概率分布,所述估计基 于所述测量的功率消耗;经由所述估计的概率分布估计性能损失;计算所述一个或多个服务器中的每个服务器的功率封顶极限,所述计算基于所述 估计的概率分布和所述性能损失;以及为所述服务器机架的所述一个或多个服务器中的每个服务器动态分配所述功率 封顶极限。


根据以下给出的详细描述以及本发明的各种实施例的附图,将能更全面地了解本 发明的实施例,但是,这些附图不应视为是将本发明局限于特定实施例,而是它们只是为了 说明和理解的目的。图1是根据本发明一个实施例通过计算功率需求的概率分布来计算功率封顶极 限的流程图。图2A是示出在对服务器机架中的服务器运用从动态分配器动态分配的功率封顶 极限之前服务器的功率需求的方框图。图2B是示出根据本发明一个实施例在对服务器机架中的服务器运用从动态分配 器动态分配的功率封顶极限之后服务器的功率需求的方框图。图3是示出根据本发明一个实施例经由动态功率分配器的性能损失的相对减小 的表格。图4示出根据本发明一个实施例具有与动态功率分配器耦合的服务器机架的设备。
图5示出根据本发明一个实施例用于为服务器动态分配功率封顶极限的设备。
具体实施例方式本发明的实施例涉及用于为服务器机架中的服务器动态分配功率封顶极限的方 法和设备。在一个实施例中,按有规律的间隔监视服务器机架中的每个服务器的实际功率 消耗,并基于计算服务器机架中的每个服务器的功率需求的概率分布和所估计的性能损失 来估计功率需求。在一个实施例中,迭代地估计服务器机架中的每个服务器的新的功率封 顶极限,并将新的功率封顶极限动态地分配给服务器以实现服务器性能损失的减小。本说明书中提到“实施例”、“ 一个实施例”、“ 一些实施例,,或“其它实施例,,时表 示,结合这些实施例描述的特定特征、结构或特性包含在至少一些实施例中,但不一定包含 在所有实施例中。各个地方出现“实施例”、“一个实施例”或“一些实施例”时不一定都指 相同的实施例。如果本说明书陈述“可能(may/might)”或“可(could) ”包含某个组件、特 征、结构或特性,则不是必需包含该特定组件、特征、结构或特性。如果本说明书或权利要求 书提到“一或一个(a/an)”要素,则这不表示只有一个这样的要素。如果本说明书或权利要 求书提到“另外”要素,则这不排除有多于一个这样的另外要素。图1示出根据本发明一个实施例通过计算计算机系统中的服务器的功率需求的 概率分布来计算功率封顶极限的流程图100。在方框101,确定计算机系统的总功率极限。 在一个实施例中,计算机系统是服务器机架,在该机架中贮存有一个或多个服务器。在一个 实施例中,计算机系统的总功率极限基于对于特定配电网络的计算机系统的总功率容量和 该计算机系统的温度冷却系统。在方框102,测量计算机系统的功率消耗。在一个实施例中,经由每个服务器中的 功率控制器执行测量。在一个实施例中,功率控制器基于在给定电源电压电平提供给服务 器中的处理器(或多个处理器)的电流量来提供服务器的当前功率消耗。在一个实施例中, 功率控制器还将新的功率封顶极限传送给服务器中的处理器(或多个处理器)。在一个实 施例中,服务器上的功率控制器直接从服务器的电源部件读取功率消耗,然后,如果越过功 率消耗和/或温度阈值,则利用反馈控制回路对CPU进行节流。在该实施例中,功率控制器 不需要知道CPU的功率消耗便可监视和控制服务器的功率消耗。在一个实施例中,将所测量的计算机系统中的每个服务器的功率消耗(广广,...,/ ^) 和所确定的计算机系统的功率极限提供给动态功率分配器。在一个实施例中,动态功率分 配器位于远程位置,并且配置成基于计算每个服务器的功率需求的概率分布和所估计的性 能损失来计算每个服务器的功率封顶极限。在方框103,估计所有服务器(一个或多个)的功率需求的概率分布。概率分布将 计算机系统中的每个服务器在每个时间步长t的功率需求的行为建模。在一个实施例中, 时间步长t可由用户或另一个计算机器来配置。在一个实施例中,时间步长t为30秒。在 一个实施例中,服务器的功率需求是在没有功率封顶的情况下维持服务器工作负荷的功率 消耗。本文论述的数学表达式是出于说明的目的。本发明的实施例不限于这些数学表达 式。在方框104,估计计算机系统中的每个服务器的性能损失。性能损失定义为在没有任何功率封顶极限的情况下允许处理器处理时出现的处理器使用率。在一个实施例中, 配置成在功率封顶极限之下操作的服务器的性能损失同功率需求与功率封顶极限之间的 差距正相关。服务器的功率封顶极限是服务器的功率消耗的上限,服务器处理器在功率封 顶极限附近或者在功率封顶极限进行节流。在一个实施例中,对服务器(包括服务器中的 CPU)进行节流的瞬间是服务器的功率封顶极限。在一个实施例中,计算机系统中的所有服务器在时间步长t时的功率需求的概率 分布表示为
权利要求
1.一种方法,包括测量具有一个或多个服务器的计算机系统的功率消耗;估计所述一个或多个服务器中的每个服务器的功率需求的概率分布,所述估计基于所 述测量的功率消耗;经由所述估计的概率分布估计性能损失;计算所述一个或多个服务器中的每个服务器的功率封顶极限,所述计算基于所述估计 的概率分布和所述性能损失;以及通过修改所述一个或多个服务器中的每个服务器的之前的功率封顶极限来为所述一 个或多个服务器中的每个服务器动态地分配功率封顶极限。
2.如权利要求1所述的方法,还包括确定所述计算机系统的总功率极限,其中为所述一个或多个服务器中的每个服务器动 态分配的功率封顶极限之和不大于所述总功率极限。
3.如权利要求1所述的方法,其中基于贝叶斯定理估计所述功率需求的概率分布。
4.如权利要求3所述的方法,其中基于所述贝叶斯定理估计所述性能损失。
5.如权利要求4所述的方法,其中所述贝叶斯定理基于需求二元模型和功率封顶模型。
6.如权利要求1所述的方法,其中所述估计的性能损失基于所述一个或多个服务器中的每个服务器的之前的功率需求;以及当所述服务器中的任一服务器执行节流时所述一个或多个服务器中的每个服务器的 功率消耗。
7.如权利要求6所述的方法,其中当所述一个或多个服务器中的任一服务器的功率需 求超过预定功率电平阈值时执行所述节流。
8.如权利要求7所述的方法,其中所述预定功率电平阈值是可配置的。
9.如权利要求1所述的方法,其中计算所述功率封顶极限基于爬山法。
10.如权利要求1所述的方法,其中测量所述功率消耗由所述一个或多个服务器中的 每个服务器的功率控制器来执行。
11.如权利要求1所述的方法,其中修改所述一个或多个服务器中的每个服务器的之 前的功率封顶极限经由所述服务器的功率控制器单元来执行。
12.如权利要求1所述的方法,其中所述测量、所述概率分布和性能损失的所述估计、 所述计算和所述动态分配在出现可配置时间步长时执行。
13.一种其上存储有计算机可执行指令的计算机可读存储介质,所述指令在执行时使 计算机执行一种方法,所述方法包括测量具有一个或多个服务器的计算机系统的功率消耗;估计所述一个或多个服务器中的每个服务器的功率需求的概率分布,所述估计基于所 述测量的功率消耗;经由所述估计的概率分布估计性能损失;计算所述一个或多个服务器中的每个服务器的功率封顶极限,所述计算基于所述估计 的概率分布和所述性能损失;以及为所述一个或多个服务器中的每个服务器动态地分配所述功率封顶极限。
14.如权利要求13所述的计算机可读存储介质,其上还存储有其它计算机可执行指 令,所述其它指令在执行时使所述计算机执行另一种方法,所述方法包括确定所述计算机系统的总功率极限,其中为所述一个或多个服务器中的每个服务器动 态分配的功率封顶极限之和不大于所述总功率极限。
15.如权利要求13所述的计算机可读存储介质,其中基于贝叶斯定理估计所述功率需 求的概率分布。
16.如权利要求15所述的计算机可读存储介质,其中基于所述贝叶斯定理估计所述性 能损失。
17.如权利要求16所述的计算机可读存储介质,其中所述贝叶斯定理基于需求二元模 型和功率封顶模型。
18.如权利要求13所述的计算机可读存储介质,其中所述估计的性能损失基于 所述一个或多个服务器中的每个服务器的之前的功率需求;以及当所述服务器中的任一服务器执行节流时所述一个或多个服务器中的每个服务器的 功率消耗。
19.如权利要求18所述的计算机可读存储介质,其中当所述一个或多个服务器中的任 一服务器的功率需求超过预定功率电平阈值时执行所述节流。
20.如权利要求19所述的计算机可读存储介质,其中所述预定功率电平阈值是可配置的。
21.如权利要求13所述的计算机可读存储介质,其中计算所述功率封顶极限基于爬山法。
22.如权利要求13所述的计算机可读存储介质,其中测量所述功率消耗由所述一个或 多个服务器中的每个服务器的功率控制器来执行。
23.如权利要求13所述的计算机可读存储介质,其中为所述一个或多个服务器中的每 个服务器动态分配所述功率封顶极限包括经由所述服务器的功率控制器单元修改所述一个或多个服务器中的每个服务器的之 前的功率封顶极限。
24.如权利要求13所述的计算机可读存储介质,其中所述测量、所述概率分布和性能 损失的所述估计、所述计算和所述动态分配在出现可配置时间步长时执行。
25.一种设备,包括具有一个或多个服务器的服务器机架;经由网络接口与所述服务器机架耦合的处理器,所述处理器具有用于执行包括以下步 骤的方法的逻辑测量所述服务器机架的功率消耗;估计所述一个或多个服务器中的每个服务器的功率需求的概率分布,所述估计基于所 述测量的功率消耗;经由所述估计的概率分布估计性能损失;计算所述一个或多个服务器中的每个服务器的功率封顶极限,所述计算基于所述估计 的概率分布和所述性能损失;以及为所述服务器机架的所述一个或多个服务器中的每个服务器动态分配所述功率封顶极限。
26.如权利要求25所述的设备,其中所述处理器的所述逻辑还执行包括以下步骤的方法确定所述计算机系统的总功率极限,其中为所述一个或多个服务器中的每个服务器动 态分配的功率封顶极限之和不大于所述总功率极限。
27.如权利要求25所述的设备,其中基于贝叶斯定理估计所述功率需求的概率分布。
28.如权利要求27所述的设备,其中所述贝叶斯定理基于需求二元模型和功率封顶模型。
29.如权利要求25所述的设备,其中所述估计的性能损失基于 所述一个或多个服务器中的每个服务器的之前的功率需求;以及当所述服务器中的任一服务器执行节流时所述一个或多个服务器中的每个服务器的 功率消耗,其中当所述一个或多个服务器中的任一服务器的功率需求超过预定功率电平阈 值时执行所述节流。
30.如权利要求25所述的设备,其中计算所述功率封顶极限基于爬山法,测量所述功 率消耗由所述一个或多个服务器中的每个服务器的功率控制器来执行,并且为所述一个或 多个服务器中的每个服务器动态分配所述功率封顶极限包括经由所述服务器的功率控制 器单元修改所述一个或多个服务器中的每个服务器的之前的功率封顶极限。
全文摘要
一般来说,本发明的实施例涉及计算机系统的功率管理领域,更具体来说,涉及用于为服务器机架中的服务器动态分配功率的方法和设备。该方法包括测量具有一个或多个服务器的计算机系统的功率消耗;估计这一个或多个服务器中的每个服务器的功率需求的概率分布,该估计基于所测量的功率消耗;经由所估计的概率分布估计性能损失;计算这一个或多个服务器中的每个服务器的功率封顶极限,该计算基于所估计的概率分布和性能损失;以及通过修改这一个或多个服务器中的每个服务器的之前的功率封顶极限来为这一个或多个服务器中的每个服务器动态分配功率封顶极限。
文档编号G06F1/32GK102096460SQ20101060421
公开日2011年6月15日 申请日期2010年12月14日 优先权日2009年12月14日
发明者C·李, H·H·高, R·简 申请人:英特尔公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1