机箱内的刀片服务器之间的动态功率平衡的制作方法

文档序号:8192079阅读:294来源:国知局
专利名称:机箱内的刀片服务器之间的动态功率平衡的制作方法
技术领域
本发明涉及机箱中的刀片服务器之间的数据中心功率分配和功率平衡。
背景技术
计算机服务器或所谓的“刀片”服务器可以被用在数据中心中以优化空间和能量消耗。多个刀片服务器可以被置于机箱单元中。例如,机箱单元可以通过提供服务器的功率、冷却、联网和其它管理来管理多个刀片服务器。传统上,数据中心或机箱单元不对刀片服务器可以消耗的功率量施加限制。结果,刀片服务器常常被分配有比它们实际使用的功率更多的功率。为了避免对刀片服务器的不必要的功率分配,功率封顶可被使用以通过施加功率消耗限制来减少服务器在给定时间可以消耗的电或功率量。最终,这可以减少运行刀片服务器的用电成本。然而,当功率封顶被使用时,服务器可能没有足够的功率来以它们的峰值性能水平运行,并且因此功率封顶可能导致性能下降。


图1示出了用于多个机箱单元的功率管理的网络环境的示例,每个机箱单元包括机箱管理控制器,该机箱管理控制器被配置为存储从管理服务器接收到的策略信息并且基于策略信息向每个机箱单元中的多个刀片服务器分配功率。图2是机箱管理控制器装置的框图的示例,所述机箱管理控制器装置被配置有刀片服务器功率重新分配处理逻辑以基于刀片服务器的相对优先级和刀片服务器的功率消耗向多个刀片服务器分 配功率。图3A是描述在机箱管理控制器装置中执行的功率重新分配逻辑的操作的流程图的示例。图3B是描述刀片服务器的实际功率消耗和刀片服务器的状态的确定的流程图的示例。图3C是描述基于刀片服务器的实际功率消耗和状态向刀片服务器重新分配功率的流程图的示例。图4是显示在不同的刀片服务器优先级类别中的刀片服务器之间的功率重新分配的图的示例。图5是具有相应的中央处理单元(CPU)和相应的刀片管理控制器以调整刀片服务器的功率使用的机箱单元中的多个刀片服务器的框图的示例。图6是描述每个刀片服务器的CPU温度和功率使用如何被用于管理刀片服务器的功率使用的流程图的示例。
具体实施例摄览
本发明提供了向机箱单元中的多个刀片服务器重新分配和重新平衡功率的技术。在包括多个刀片服务器的机箱单元中的机箱管理控制器设备处,策略信息被存储用于所述机箱单元。策略信息包括功率限额信息和刀片服务器优先级信息,所述功率限额信息指示针对机箱单元的功率预算,所述刀片服务器优先级信息指示机箱单元中的多个刀片服务器中的每个刀片服务器获取功率的优先级。功率基于多个刀片服务器中的每个刀片服务器的刀片服务器优先级信息以及用于机箱单元的功率限额信息被分配给多个刀片服务器。多个刀片服务器中的每个刀片服务器的实际功率消耗被确定,并且功率基于实际功率消耗和策略信息被重新分配给多个刀片服务器。示例实施例首先参考图1,一种用于管理和分配用于机箱单兀的功率的系统用标号100来表不。系统100包括用标号110表不的管理服务器和用标号120 (a)-120(d)表不的多个机箱单元。多个机箱单元中的每个机箱单元容纳用标号122 (a)-122(d)表示的多个刀片服务器和用标号200表示的机箱管理控制器设备。因而,标号122(a)标识机箱120(a)中的多个刀片服务器,标号122(b)标识机箱120(b)中的多个刀片服务器,依此类推。机箱管理控制器设备200可以被配置为例如执行刀片服务器功率重新分配以向每个相应的机箱单元中的多个刀片服务器分配功率,如下文中所描述的。管理服务器110通过网络130与多个机箱单元120 (a)-120(d)通信。例如,管理服务器110可以向机箱单元120 (a)-120 (d)发送包括针对机箱单元120 (a)-120(d)中的每个机箱单元的功率预算和刀片服务器优先级信息的策略信息。图1还示出了用标号140 (a)-140 (C)表示的多个功率源单元,这些功率源单元被配置为向相应的机箱单元120 (a)-120(d)提供功率。通常,功率通过单独的功率源单元被独立地提供给每个机箱单元。然而,诸如功率源单元140(c)之类的功率源单元可以向构成机箱组的一个或多个机箱单元提供功率。这个示例在图1中被示出,其中功率源140(c)向机箱组150提供功率,并且该机箱组包括多个机箱单元,例如机箱单元120 (c)和120 (d)。最后,图1示出了多个用户终端设备160(a)-160(c),这些用户终端设备被配置为与网络130上的多个机箱单元中的多个刀片服务器122 (a)-122(d)中的任一个或多个刀片服务器通信。转向图2,机箱管理控制器设备200的示例被示出。机箱管理控制器设备200包括网络接口设备210、功率源接口设备220、刀片接口设备230、处理器240和存储器250。网络接口设备210被配置为实现网络130上的通信以从管理服务器110接收策略信息等等。如下文中所描述的,机箱管理控制器设备200接收包含功率限额信息的策略信息,所述功率限额信息例如指示针对机箱管理控制器设备200所服务的机箱单元中的多个刀片服务器中的每个刀片服务器的功率预算。策略信息还可以包含诸如刀片服务器优先级信息之类的信息,所述刀片服务器优先级信息例如指示每个机箱单元中的刀片服务器获取功率的优先级。功率源接口 220被配置为从例如功率源140(a)_140(c)之一的功率源接收功率。这个功率最终在机箱管理控制器设备200的控制下被提供并分配给多个机箱单元120 (a)-120(d)中的多个刀片服务器122 (a)-122(d)。刀片服务器接口 230允许机箱管理控制器设备200与每个机箱单元内的多个刀片服务器通信,以例如监控刀片服务器功率消耗,确定刀片服务器优先级信息以及向刀片服务器分配功率。按另一种形式,机箱管理控制器200可以通过网络130与其机箱单元中的多个刀片服务器通信。处理器240被耦接到网络接口设备210、功率源接口设备220、刀片服务器接口 230和存储器250。处理器240例如是被配置为执行用于实施这里描述的各种操作和任务的程序逻辑指令(即软件)的微处理器或微控制器。例如,处理器240被配置为执行被存储在存储器250中的刀片服务器功率重新分配逻辑300,以基于刀片服务器优先级和状态信息向多个刀片服务器分配功率。存储器250可以包括只读存储器(ROM)、随机访问存储器(RAM)、磁盘存储介质设备、光存储介质设备、闪存设备、电、光、声或其它物理/有形存储器存储设备。处理器240的功能可以用被编码在一个或多个有形计算机可读介质中的逻辑来实现(例如诸如专用集成电路之类的嵌入式逻辑、数字信号处理器指令、由处理器执行的软件等),其中存储器250存储用于这里所描述的操作的数据并且存储被执行以实施这里所描述的操作的软件或处理器可执行指令。刀片服务器功率重新分配过程逻辑300可以采用各种形式以被编码到一个或多个有形计算机可读存储器介质或存储设备中以供执行,例如固定逻辑或者可编程逻辑(例如由处理器执行的软件/计算机指令),并且处理器240可以是包括固定数字逻辑的专用集成电路(ASIC)或者它们的组合。例如,处理器240可以用固定或可编程数字逻辑集成电路中的数字逻辑门来体现,所述数字逻辑门被配置为执行刀片服务器功率重新分配逻辑300。总之,刀片服务器功率重新分配逻辑300可以被体现在被编码有软件的一个或多个有形计算机可读存储介质中,所述软件包括计算机可执行指令并且当所述软件被执行时,所述刀片服务器功率重新分配逻辑可操作用于执行这里针对逻辑300所描述的操作。存储在存储器250中的还有机箱管理控制器200从管理服务器110接收到的策略信息305。一般来说,策略信 息305可以被机箱管理控制器设备200用来对每个机箱单元的刀片服务器施加功率限额。如这里所详细描述的,策略信息可以包括指示针对每个机箱单元的功率预算的功率限额信息和指示每个机箱单元中的多个刀片服务器中的每个刀片服务获取功率的优先级的刀片优先级信息。存储器250还可以存储基于每个机箱单元中的多个刀片服务器中的每个刀片服务器的实际功率消耗的关于每个刀片服务器的状态的信息。策略信息、状态和功率消耗信息例如被处理器240用来执行刀片服务器功率重新分配逻辑300,该逻辑300的技术在这里被描述。一般来说,机箱管理控制器200为机箱单元中的多个刀片服务器提供管理服务。机箱管理控制器200基于刀片的优先级向机箱中的刀片服务器分配功率。例如,具有较高优先级类别的刀片将比具有较低优先级类别的刀片接收到更多的功率。此外,在另一示例中,“繁忙”刀片服务器(即消耗其被分配的功率中的大量功率的刀片服务器)将比“不繁忙”刀片服务器(即消耗其被分配的功率中的很少量的功率的刀片服务器)被分配更多的功率。刀片服务器功率重新分配处理逻辑300的操作在下文中结合图3A、3B和3C的流程图并且继续参考图1和图2被描述。现在参考图3A描述刀片服务器功率重新分配处理逻辑300。刀片服务器功率重新分配处理逻辑300被用于执行基于刀片服务器优先级和状态信息对多个刀片服务器的功率分配和重新分配。在310处,机箱管理控制器200在存储器250中存储针对机箱管理控制器200位于其中的机箱单元的从管理服务器110接收到的策略信息。策略信息(在图2中用205表示)包括指示针对该机箱单元的功率预算的功率限额信息和指示该机箱单元中的多个刀片服务器中的每个刀片服务获取功率的优先级的刀片服务器优先级信息。例如,策略信息可以基于每个机箱单元中的刀片服务器的总数目、机箱单元内的刀片服务器的优先级和每个机箱单元中的刀片服务器插槽的数目等标准为不同的机箱单元指定不同的功率预算。同样,策略信息可以将每个机箱单元内的不同刀片服务器指定为用于获取功率的多个优先级类别中的一个优先级类别。例如,机箱单元内的一些刀片服务器可以被指定为高优先级类别,而其它刀片服务器被指定为中等优先级类别或低优先级类别。因而,在该示例中,具有较多较高刀片服务器优先级类别的刀片服务器的机箱单元相对于具有较少较高刀片服务器优先级类别的刀片服务器的其它机箱单元而言可以被分配更多的功率。用于每个机箱单·元120(a)_120(d)的机箱管理控制器200可以从位于每个机箱单元120 (a)-120(d)的远处的管理服务器110接收策略信息。在另一示例中,管理服务器110可以定义包括机箱单元120 (a)-120(d)中的两个或更多个机箱单元的机箱组(例如,图1中所示的机箱组150包括机箱单元120(c)和120(d))并且可以通过设置针对机箱组的每个机箱单元的功率限额和设置针对机箱组的机箱单元内的每个刀片服务器的刀片服务器优先级来定义针对机箱组的策略信息。或者,用于每个机箱单元120 (a)-120(d)的机箱管理控制器200可以从位于每个机箱单元的远处的用户那里接收包含上述信息的策略信息。例如,用户可以定义针对机箱单元或者一组机箱单元的功率限额等并且可以定义每个机箱单元中的每个刀片服务器的优先级。一旦接收到针对机箱单元的功率预算信息,机箱管理控制器200可以从功率预算中预留预定量的功率以用于机箱冷却和功率的目的。机箱管理控制器随后可以按照本文所述将功率预算中余下的功率分配给多个刀片服务器。在一个示例中,机箱管理控制器200利用以下公式来计算功率预算中余下的功率(在预留了用于冷却的预定量的功率之后):
权利要求
1.一种方法,包括: 在包括多个刀片服务器的机箱单元中的机箱管理控制器设备处,存储用于所述机箱单元的策略信息,其中所述策略信息包括功率限额信息和刀片服务器优先级信息,所述功率限额信息指示针对所述机箱单元的功率预算,所述刀片服务器优先级信息指示所述机箱单元中的所述多个刀片服务器中的每个刀片服务器获取功率的优先级; 在所述机箱管理控制器设备处,基于所述多个刀片服务器中的每个刀片服务器的所述刀片服务器优先级信息以及用于所述机箱单元的所述功率限额信息向所述多个刀片服务器分配功率; 在所述机箱管理控制器设备处,确定所述多个刀片服务器中的每个刀片服务器的实际功率消耗;以及 在所述机箱管理控制器设备处,基于所述实际功率消耗和所述策略信息向所述多个刀片服务器重新分配功率。
2.根据权利要求1所述的方法,还包括: 在所述机箱管理控制器设备处存储数据,所述数据将所述机箱单元的所述刀片服务器中的每个刀片服务器指定到多个刀片服务器优先级类别中的一个刀片服务器优先级类别,其中每个优先级类别具有相对优先级;并且 其中分配包括基于刀片服务器优先级类别向所述多个刀片服务器中的每个刀片服务器分配功率。
3.根据权利要求2所述的方法,其中分配包括向所述刀片服务器分配功率以使得相同刀片服务器优先级类别中的刀片服务器接收到等量的功率。
4.根据权利要求2所述的方法,其中分配包括基于所述刀片服务器中的每个刀片服务器所占用的所述机箱单元中的刀片插槽的数目向所述刀片服务器分配功率以使得占用多个刀片插槽的刀片服务器比占用单个刀片插槽的刀片服务器接收到更多功率。
5.根据权利要求2所述的方法,还包括监控所述刀片服务器中的每个刀片服务器的活动并基于所述监控将所述刀片服务器分类为不繁忙刀片服务器或繁忙刀片服务器,并且其中重新分配包括: 将分配给不繁忙刀片服务器的功率减小预定的量;并且 将分配给繁忙刀片服务器的功率增加预定的量。
6.根据权利要求5所述的方法,其中重新分配包括将功率从与一个或多个繁忙刀片服务器同一刀片服务器优先级类别内的不繁忙刀片服务器重新分配到所述一个或多个繁忙刀片服务器。
7.根据权利要求1所述的方法,其中分配包括向所述机箱单元中的所述刀片服务器分配功率以使得所述机箱单元内具有较高的相对优先级的刀片服务器比具有较低的相对优先级的刀片服务器从所述机箱管理控制器设备接收到更多功率。
8.根据权利要求1所述的方法,还包括在向所述多个刀片服务器分配功率之前从功率预算中预留预定量的功率用于冷却所述机箱单元,并且其中分配包括基于在预留所述预定量的功率之后所述功率预算中余下的功率量向所述多个刀片服务器分配功率。
9.根据权利要求1所述的方法,还包括从管理服务器接收所述策略信息。
10.根据权利要求9所述的方法,还包括:在所述管理服务器处,定义包括两个或更多个机箱单元的机箱组; 为所述机箱组的所述机箱单元中的每个机箱单元设置功率限额; 为所述机箱组的所述机箱单元内的所述刀片服务器中的每个刀片服务器设置刀片服务器优先级;以及 将所述策略信息发送给所述机箱组中的所述机箱单元中的每个机箱单元的机箱管理控制器设备。
11.根据权利要求10所述的方法,其中设置包括基于所述刀片服务器优先级为所述机箱组的每个机箱单元设置所述功率限额以使得具有较多的在较高刀片服务器优先级类别中的刀片服务器的机箱单元相对于具有较少的在所述较高刀片服务器优先级类别中的刀片服务器的机箱管理控制器设备被分配更多的功率。
12.根据权利要求1所述的方法,其中重新分配功率包括: 监控刀片服务器的计算机处理单元CPU的功率使用; 将所述CPU的被监控的功率使用与针对所述CPU的功率预算进行比较;并且基于所述比较更新与所述CPU相关联的性能状态值并且基于所述性能状态值向所述CPU分配功率。
13.根据权利要求12所述的方法,还包括如果所述CPU的所述被监控的功率使用大于所述CPU的所述功率预算,则减少用于所述CPU的功率。
14.根据权利要求12所述的方法,还包括如果所述CPU的所述被监控的功率使用小于所述CPU的所述功率预算,则增加用于所述CPU的功率。
15.一个或多个被编码有软件的计算机可读存储介质,所述软件包括计算机可执行指令并且当所述软件被执行时可操作用于: 在包括多个刀片服务器的机箱单元中的机箱管理控制器设备处存储策略信息,其中所述策略信息包括功率限额信息和刀片服务器优先级信息,所述功率限额信息指示针对所述机箱单元的功率预算,所述刀片服务器优先级信息指示所述机箱单元中的所述多个刀片服务器中的每个刀片服务器获取功率的优先级; 基于所述多个刀片服务器中的每个刀片服务器的所述刀片服务器优先级信息以及用于所述机箱单元的所述功率限额信息向所述多个刀片服务器分配功率; 确定所述多个刀片服务器中的每个刀片服务器的实际功率消耗;以及 基于所述实际功率消耗和所述策略信息向所述多个刀片服务器重新分配功率。
16.根据权利要求15所述的计算可读存储介质,还包括可操作用于执行以下操作的计算机可执行指令: 存储数据,所述数据将所述机箱单元的所述刀片服务器中的每个刀片服务器指定到多个刀片服务器优先级类别中的一个刀片服务器优先级类别,其中每个优先级类别具有相对优先级;并且 其中可操作用于向所述多个刀片服务器分配功率的指令包括可操作用于基于刀片服务器优先级类别向所述多个刀片服务器中的每个刀片服务器分配功率的指令。
17.根据权利要求16所述的计算机可读存储介质,其中可操作用于分配功率的指令包括可操作用于以下操作的指令,所述操作即向所述刀片服务器分配功率以使得相同刀片服务器优先级类别中的刀片服务器接收到等量的功率。
18.根据权利要求16所述的计算机可读介质,其中可操作用于分配功率的指令包括可操作用于以下操作的指令,所述操作即基于所述刀片服务器中的每个刀片服务器所占用的所述机箱单元中的刀片插槽的数目向所述刀片服务器分配功率以使得占用多个刀片插槽的刀片服务器比占用单个刀片插槽的刀片服务器接收到更多功率。
19.根据权利要求16所述的计算机可读存储介质,还包括可操作用于以下操作的计算机可执行指令,所述操作即监控所述刀片服务器中的每个刀片服务器的活动并基于所述监控将所述刀片服务器分类为不繁忙刀片服务器或繁忙刀片服务器,并且其中可操作用于向所述多个刀片服务器重新分配功率的指令包括可操作用于以下操作的指令,所述操作即: 将分配给不繁忙刀片服务器的功率减小预定的量;并且 将分配给繁忙刀片服务器的功率增加预定的量。
20.根据权利要求15所述的计算机可读存储介质,其中可操作用于分配功率的指令包括可操作用于以下操作的指令,所述操作即向所述机箱单元的所述刀片服务器分配功率以使得所述机箱单元内具有较高的相对优先级的刀片服务器比具有较低的相对优先级的刀片服务器接收到更多功率。
21.一种装置,包括: 被配置用于通过网络与管理服务器通信的网络接口设备; 被配置为从功率源设备接收功率的功率源接口设备; 被配置用于与机箱单元中的多个刀片服务器的通信的刀片接口设备; 存储器;以及 被配置为被耦接到所述网络接口 设备、所述功率源接口设备和所述刀片接口设备的处理器,其中所述处理器被配置为: 在所述存储器中存储用于机箱单元的从所述管理服务器接收到的策略信息,其中所述策略信息包括功率限额信息和刀片服务器优先级信息,所述功率限额信息指示针对所述机箱单元的功率预算,所述刀片服务器优先级信息指示所述机箱单元中的所述多个刀片服务器中的每个刀片服务器获取功率的优先级; 基于所述多个刀片服务器中的每个刀片服务器的所述刀片服务器优先级信息以及用于所述机箱单元的所述功率限额信息向所述多个刀片服务器分配来自所述功率源的功率; 确定所述多个刀片服务器中的每个刀片服务器的实际功率消耗;以及 基于所述实际功率消耗和所述策略信息向所述多个刀片服务器重新分配功率。
22.根据权利要求21所述的装置,其中所述处理器还被配置为: 在所述存储器中存储数据,所述数据将所述机箱单元的所述刀片服务器中的每个刀片服务器指定到多个刀片服务器优先级类别中的一个刀片服务器优先级类别,其中每个优先级类别具有相对优先级;并且 基于刀片服务器优先级类别向所述机箱单元的所述多个刀片服务器中的每个刀片服务器分配功率。
23.根据权利要求21所述的装置,其中所述处理器还被配置为: 监控所述刀片服务器中的每个刀片服务器的活动; 基于所述监控将所述刀片服务器分类为不繁忙刀片服务器或繁忙刀片服务器;将分配给不繁忙刀片服务器的功率减小预定的量;并且 将分配给繁忙刀片服务器的功率增加预定的量。
24.根据权利要求23所述的装置,其中所述处理器还被配置为将功率从与一个或多个繁忙刀片服务器同一刀片服务器优先级类别内的不繁忙刀片服务器重新分配到所述一个或多个繁忙刀片 服务器。
全文摘要
本发明提供了向多个刀片服务器与机箱单元重新分配和重新平衡功率的技术。在包括多个刀片服务器设备的机箱单元中的机箱管理控制器设备处,策略信息被存储用于所述机箱单元。策略信息包括功率限额信息和刀片服务器优先级信息,所述功率限额信息指示针对机箱单元的功率预算,所述刀片服务器优先级信息指示机箱单元中的多个刀片服务器中的每个刀片服务器获取功率的优先级。功率基于多个刀片服务器中的每个刀片服务器的刀片服务器优先级信息以及用于机箱单元的功率限额信息被分配给多个刀片服务器。多个刀片服务器中的每个刀片服务器的实际功率消耗被确定,并且功率基于实际功率消耗和策略信息被重新分配给多个刀片服务器。
文档编号H05K5/02GK103229125SQ201180057216
公开日2013年7月31日 申请日期2011年4月11日 优先权日2010年11月29日
发明者查克拉瓦锡·纳鲁尔, 阿米塔瓦·古哈, 克里希那·莫罕 申请人:思科技术公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1