功耗封顶的控制方法、设备和系统的制作方法

文档序号:7890399阅读:331来源:国知局
专利名称:功耗封顶的控制方法、设备和系统的制作方法
技术领域
本发明涉及通信技术,尤其涉及一种功耗封顶的控制方法、设备和系统。
背景技术
随着互联网数据的爆炸式增长和云计算时代的到来,IT领域对服务器设备的需求不断增长,数据中心机房的IT设备的快速扩容,给数据中心的供电、散热、空间容量等带来巨大挑战。一方面是数据中心供电与资源的紧缺,另一方面是机房设备的用电效率低、机柜密度低,因此在很大程度上存在资源浪费。目前互联网数据中心(Internet Data Center ;以下简称IDC)机房的机柜配电都有限额,机柜耗电超过额定值时会导致空开跳闸,在部署服务器时需要非常谨慎,服务器数量的配置要按照额定最大功耗来计算,而在实际使用中服务器运行时的功耗出现接近额定最大功耗的概率极小。图I为现有技术中资源使用情况的曲线示意图,如图I所示,通过对现网5000台服务器的资源使用情况进行分析,服务器资源的空闲率达到50%以上,若再考虑按照额定最大功耗配电所导致的50%资源空闲,则整个机柜配电的空闲率达到75%以上。而功耗封顶技术可以解决目前存在的上述问题。现有技术中的功耗封顶方案包括三个主要部分设置封顶值、监视运行功耗、执行封顶动作。即先根据机柜配电要求、服务器正常运行的实际功耗、业务压力需求等设置各台机架服务器的功耗封顶值,然后将该封顶值写入带外管理系统作为服务器运行的上限功耗,该功耗封顶值为一个固定值。在服务器运行过程中,带外管理系统监测整机功耗,如果发现功耗超过封顶值,则执行封顶动作。然而,现有技术中服务器之间的资源分配和使用是相互独立的,封顶功能不灵活,不能最大化地合理使用资源。

发明内容
本发明实施例提供一种功耗封顶的控制方法、设备和系统,用于解决现有技术存在着的封顶功能不灵活,不能最大化地合理使用资源的问题。本发明实施例的一个方面是提供一种功耗封顶的控制方法,包括对整框功耗进行监控,获取整框监控结果,所述整框监控结果为资源池溢出或者资源池不溢出,所述资源池为插在同一机框上的多个服务器所共享的供电资源;当所述整框监控结果为资源池不溢出时,不对各服务器进行功耗封顶;当所述整框监控结果为资源池溢出时,向各服务器发送功耗封顶控制指令,以使所述各服务器收到所述功耗封顶控制指令后进行功耗封顶控制。本发明实施例的又一个方面是提供一种功耗封顶的控制设备,包括监控模块,用于对整框功耗进行监控,获取整框监控结果,所述整框监控结果为资源池溢出或者资源池不溢出,所述资源池为插在同一机框上的多个服务器所共享的供电资源;第一封顶控制模块,用于当所述整框监控结果为资源池不溢出时,不对各服务器进行功耗封顶;当所述整框监控结果为资源池溢出时,向各服务器发送功耗封顶控制指令,以使所述各服务器收到所述功耗封顶控制指令后进行功耗封顶控制。本发明实施例的又一个方面是提供一种功耗封顶的控制系统,包括管理板、供电单元和多个刀片服务器,所述管理板包括上述功耗封顶的控制设备,所述刀片服务器包括单板管理控制单元、基本输入输出系统BIOS和中央处理器CPU。
本发明实施例的技术效果是通过对整框功耗进行监控,当获取到的整框监控结果为资源池未溢出时,不对各服务器进行功耗封顶操作,当获取到的整框监控结果为资源池溢出时,向各服务器发送功耗封顶控制指令,以使所述各服务器收到所述功耗封顶控制指令后进行功耗封顶控制。本实施例实现了更加灵活的封顶功能,最大化地合理使用资源,大大降低了资源的浪费。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图I为现有技术中资源使用情况的曲线示意图;图2为本发明功耗封顶的控制方法实施例一的流程图;图3为本发明功耗封顶的控制方法实施例二的流程图;图4为本发明功耗封顶的控制方法实施例二中的系统架构示意图;图5为本发明功耗封顶的控制方法实施例二中的服务器功耗变化示意图;图6为本发明功耗封顶的控制方法实施例二中的整框功耗变化示意图;图7为本发明功耗封顶的控制设备实施例一的结构示意图;图8为本发明功耗封顶的控制设备实施例二的结构示意图。
具体实施例方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。图2为本发明功耗封顶的控制方法实施例一的流程图,如图2所示,本实施例提供了一种功耗封顶的控制方法,本实施例从管理板一侧对本发明的技术方案进行说明,本实施例可以具体执行如下步骤步骤201,对整框功耗进行监控,获取整框监控结果。本实施例提供的功耗封顶的控制方法主要针对刀片服务器或者具有管理板的多节点服务器的功耗封顶过程,即本实施例中的服务器可以具体为刀片服务器或具有管理板的多节点服务器,由管理板对各服务器和机框提供管理功能,担负机框的功耗封顶一级开关。当管理板开始执行功耗封顶控制,即启动功耗封顶一级开关时,管理板对整框功耗进行周期性的监控,并实时获取整框监控结果。此处管理板监控的整框功耗为整个机框上处于运行状态的所有服务器和部件的功耗,其随着服务器的运行情况以及外部环境的不断变化,整框功耗也是不断变化的,因此本实施例通过监控可以实时获取到当前的整框功耗的值。在本实施例中,整框监控结果可以为资源池的利用情况,如资源池是否溢出,即获取到的整框监控结果可以为资源池溢出或者资源池不溢出。此处的资源池为插在同一机框上的多个服务器所共享的供电资源,在本实施例中,插在同一机框上的多个服务器共享一个资源池,即多个服务器共享电源模块提供的供电资源。
步骤202,当整框监控结果为资源池不溢出时,不对各服务器进行功耗封顶。在本实施例中,通过上述步骤的监控过程,当获取到的整框监控结果为资源池不溢出时,管理板不会对各服务器进行功耗封顶操作,而是继续执行上述整框功耗的监控操作。在本实施例中,在各服务器共享的资源池不溢出的前提下,不执行服务器的功耗封顶操作,允许服务器无限制运行,即使部分服务器的功耗远超过设定的服务器功耗封顶值也不对该服务器进行控制,这样在不影响其他服务器的情况下,可以大大提高部分服务器的运行速度。步骤203,当整框监控结果为资源池溢出时,向各服务器发送功耗封顶控制指令,以使各服务器收到该功耗封顶控制指令后进行功耗封顶控制。当获取到的整框监控结果为资源池溢出时,管理板向各服务器发送功耗封顶控制指令,各服务器在收到功耗封顶控制指令后进行功耗封顶控制,相当于开启各服务器的二级封顶开关,使得功耗封顶后各服务器的服务器功耗不超过服务器功耗封顶值。由此可见,本实施例中的功耗封顶控制是结合实时监控得到的整个机框的整框功耗和各服务器的服务器功耗来进行的,各服务器共享资源池,它们之间的资源分配和使用不是相互独立的,因此,本实施例相对于现有技术的封顶功能更加灵活,能够对资源进行最大化的合理利用。本实施例提供了一种功耗封顶的控制方法,通过对整框功耗进行监控,当获取到的整框监控结果为资源池未溢出时,不对各服务器进行功耗封顶操作,当获取到的整框监控结果为资源池溢出时,向各服务器发送功耗封顶控制指令,以使所述各服务器收到所述功耗封顶控制指令后进行功耗封顶控制。本实施例实现了更加灵活的封顶功能,最大化地合理使用资源,大大降低了资源的浪费。在本实施例中,在每个服务器上分别设置一个封顶开关,当管理板通过监控整框功耗获取到资源池溢出时,开启各服务器的封顶开关,此处的封顶开关具体为功耗封顶二级开关。对于每一个服务器来说,当服务器的封顶开关被开启后,服务器中的单板管理控制(Board Management Controller ;以下简称BMC)单兀对服务器的服务器功耗进行周期性的监控,以实时获取到服务器当前的服务器功耗。在本实施例中,服务器中的BMC单元为服务器的功耗封顶二级开关,开启功耗封顶二级开关即启动BMC单元进行功耗封顶控制。在BMC单元对服务器的功耗进行监控的过程中,BMC单元根据监控得到的服务器功耗和服务器功耗封顶值进行功耗封顶控制。其中,本步骤中的服务器功耗封顶值为管理板根据监控得到的整框功耗实时更新得到的,具体为在管理板对整框功耗进行监控的过程中,管理板根据监控得到的整框功耗实时更新服务器功耗封顶值。在本步骤中,服务器中的BMC单元在进行功耗封顶控制时,结合实时监控得到的服务器功耗和实时更新得到的服务器功耗封顶值,因此,本实施例的功耗封顶控制过程是灵活的,能够对资源进行最大化的合理利用。
图3为本发明 功耗封顶的控制方法实施例二的流程图,如图3所示,本实施例提供了一种功耗封顶的控制方法,可以具体包括如下步骤步骤301,管理板根据机柜配电和业务负载情况设置整框功耗封顶值。图4为本发明功耗封顶的控制方法实施例二中的系统架构示意图,如图4所示,假设本实施例中的机框上插设有N个刀片服务器,即刀片服务器I、刀片服务器2、…刀片服务器N。图中的管理板为刀片服务器的机框管理板,用于提供刀片服务器和机框的管理功能,相当于包含所有刀片服务器在内的整个机框的功耗封顶一级开关,本实施例中开启功耗封顶一级开关相当于启动管理板,由管理板开始执行本实施例中的功耗封顶的控制过程。从图5中可以看出,管理板通过供电单元(Power Supply Unit ;以下简称PSU)实时获取机框的整框功耗,此处的整框功耗是指插设在机框上的所有刀片服务器和部件在运行过程中的功耗总和;管理板还通过“管理通信”通道与各个刀片服务器进行通信,从而实时下发各刀片服务器的服务器功耗封顶值。PSU用于为各刀片服务器供电,并通过“管理信号线”实时向管理板上报整框功耗。每个刀片服务器可以主要由BMC单元、BIOS、功耗检测单元和CPU构成,BMC单元为刀片服务器的带外管理单元,其与刀片服务器的BIOS配合实现功耗封顶,是本实施例中的功耗封顶二级开关。BIOS用于接收BMC单元的控制命令,从而对CPU的工作频率状态(Performance state ;以下简称P-state)和时钟占空比状态(Throttle state ;以下简称T-state)、内存的P-state和T-state以及其他部件的工作状态进行调整,实现刀片服务器的封顶动作的执行。功耗检测单元用于检测整个刀片服务器的服务器功耗,将检测数据实时上报给BMC单元。本步骤为在启动管理板进行功耗封顶控制之前,管理板先根据机柜配电和业务负载情况设置整框功耗封顶值,管理板可以具体根据机柜配电要求、刀片服务器正常运行的实际功耗、业务压力需求等几个方面来配置整框功耗封顶值,即以机柜配电要求为条件,参考刀片服务器正常运行的实际功耗的最大值、平均值等,还可以结合业务负载情况等业务压力需求,来配置整框功耗封顶值,具体的配置方法可以采用现有技术中本领域技术人员熟知的方法,此处不再赘述。此处假设配置的整框功耗封顶值为Ptl,即Ptl为整框功耗封顶值的一个初始值。步骤302,管理板根据整框功耗封顶值计算各刀片服务器的服务器功耗封顶值。管理板在对整框功耗封顶值进行设置之后,可以根据该整框功耗封顶值来具体计算分发到各刀片服务器的服务器功耗封顶值,此处假设服务器功耗封顶值为Pm。本实施例中的服务器功耗封顶值的计算方法为用整框功耗封顶值Po减去机框上除刀片服务器之外的其他部件的功耗值P得到一个差值,再将该差值按照各刀片服务器的在位状态均分到各在位的刀片服务器上。其中,机框上除刀片服务器之外的其他部件例如可以包括机框风扇、电源、管理板、交换板等等。在管理板计算得到刀片服务器的服务器功耗封顶值Pm之后,管理板通过“管理通信”通道将Pm下发到各在位的刀片服务器。例如,假设N个刀片服务器均在位,其他部件的功耗为P,则可以采用下述公式(I)来计算得到的服务器功耗封顶值Pm:(1)其中,Pm为服务器功耗封顶值,P0为整框功耗封顶值,P为其他部件的功耗值,N为服务器的个数。此处计算得到的服务器功耗封顶值Pm也是服务器功耗封顶值的初始值,后续根据服务器的运行状况来更行该服务器功耗封顶值。或者,在本实施例中,也可以根据业务负载情况,通过手动方式来设置部分或者全部刀片服务器的服务器功耗封顶值。步骤303,管理板按照预设的整框监控周期对整框功耗进行监控,并根据监控得到的整框功耗更新各服务器的服务器功耗封顶值。
在完成整框功耗封顶值和服务器功耗封顶值的设置之后,可以启动管理板进行功耗封顶的控制过程。在启动管理板进行功耗封顶的控制过程后,管理板按照预设的整框监控周期对整框功耗进行监控,此处可以假设整框功耗为P1,该整框监控周期可以根据实际情况来具体设定,例如可以设定为每秒对整框功耗监控10次。同时,管理板根据监控得到的整框功耗更新各服务器的服务器功耗封顶值,具体地,管理板可以根据机框当前的整框功耗实时刷新各刀片服务器的服务器功耗封顶值。根据预设时间段内监控得到的多个整框功耗的值和服务器总功耗的值计算所述整框功耗的平均值和所述服务器总功耗的平均值,例如,管理板可以每秒刷新一次服务器功耗封顶值,即预设时间段为I秒,I秒内可以分别监控得到10个整框功耗的值和10个服务器总功耗的值;分别实时获取整框功耗和服务器总功耗在一秒内的平均值,将两个平均值相减得到除刀片服务器之外的所有部件的总功耗P.other ;再用整框功耗封顶值Ptl减去P_other得到一个差值,再将该差值均分到各在位的刀片服务器上,即得到更新后的服务器功耗封顶值Pm。具体可以采用下述工公式(2)来更新服务器功耗封顶值Pm:
权利要求
1.一种功耗封顶的控制方法,其特征在于,包括 对整框功耗进行监控,获取整框监控结果,所述整框监控结果为资源池溢出或者资源池不溢出,所述资源池为插在同一机框上的多个服务器所共享的供电资源; 当所述整框监控结果为资源池不溢出时,不对各服务器进行功耗封顶; 当所述整框监控结果为资源池溢出时,向各服务器发送功耗封顶控制指令,以使所述各服务器收到所述功耗封顶控制指令后进行功耗封顶控制。
2.根据权利要求I所述的方法,其特征在于,所述对整框功耗进行监控,获取整框监控结果包括 按照预设的整框监控周期对整框功耗进行监控; 当监控得到的整框功耗小于预设的区间上限系数与所述整框功耗封顶值之积时,获取整框监控结果为资源池未溢出; 当监控得到的整框功耗大于或等于预设的区间上限系数与所述整框功耗封顶值之积时,获取整框监控结果为资源池溢出。
3.根据权利要求2所述的方法,其特征在于,在所述向各服务器发送功耗封顶控制指令之后,还包括 当所述监控得到的整框功耗小于或等于预设的区间下限系数与所述整框功耗封顶值之积时,向所述各服务器发送功耗封顶停止指令,以使所述各服务器收到所述功耗封顶停止指令后停止进行功耗封顶控制; 其中,所述区间上限系数大于所述区间下限系数。
4.根据权利要求I所述的方法,其特征在于,所述收到所述功耗封顶控制指令后进行功耗封顶控制包括 收到所述功耗封顶控制指令后,当监控得到的服务器功耗大于或等于服务器功耗封顶值时,根据所述服务器功耗与所述服务器功耗封顶值之差向所述服务器的基本输入输出系统BIOS发送封顶执行通知,以使所述BIOS根据所述封顶执行通知调整所述服务器的中央处理器CPU的工作频率状态和时钟占空比状态以及内存的工作频率状态和时钟占空比状态。
5.根据权利要求4所述的方法,其特征在于,所述收到所述功耗封顶控制指令后进行功耗封顶控制还包括 当监控得到的服务器功耗小于服务器功耗封顶值时,向所述服务器的BIOS发送封顶执行停止通知,以使所述BIOS根据所述封顶执行停止通知停止功耗封顶的执行操作。
6.根据权利要求I所述的方法,其特征在于,还包括 根据预设时间段内监控得到的多个整框功耗的值和服务器总功耗的值计算所述整框功耗的平均值和所述服务器总功耗的平均值; 根据所述整框功耗的平均值、所述服务器总功耗的平均值和整框功耗封顶值,采用下述公式更新各服务器的服务器功耗封顶值A=^^,_ 其中,Pffl为所述服务器功耗封顶值,Po为所述整框功耗封顶值,巧为所述整框功耗的平均值,巧为所述服务器总功耗的平均值,N为服务器的个数;以所述预设时间段为单位,采用上述公式对所述各服务器的服务器功耗封顶值进行更新。
7.根据权利要求I所述的方法,其特征在于,在所述对整框功耗进行监控之前,还包括 根据机柜配电和业务负载情况设置所述整框功耗封顶值; 根据所述整框功耗封顶值和机框上除所述各服务器之外的其他部件的功耗值,采用下述公式计算所述各服务器的服务器功耗封顶值 p _P0~P . m N , 其中,Pffl为所述服务器功耗封顶值,Po为所述整框功耗封顶值,P为所述其他部件的功耗值,N为服务器的个数。
8.—种功耗封顶的控制设备,其特征在于,包括监控模块,用于对整框功耗进行监控,获取整框监控结果,所述整框监控结果为资源池溢出或者资源池不溢出,所述资源池为插在同一机框上的多个服务器所共享的供电资源;第一封顶控制模块,用于当所述整框监控结果为资源池不溢出时,不对各服务器进行功耗封顶;当所述整框监控结果为资源池溢出时,向各服务器发送功耗封顶控制指令,以使所述各服务器收到所述功耗封顶控制指令后进行功耗封顶控制。
9.根据权利要求8所述的设备,其特征在于,所述监控模块包括 监控单元,用于按照预设的整框监控周期对整框功耗进行监控; 第一获取单元,用于当监控得到的整框功耗小于预设的区间上限系数与所述整框功耗封顶值之积时,获取整框监控结果为资源池未溢出; 第二获取单元,用于当监控得到的整框功耗大于或等于预设的区间上限系数与所述整框功耗封顶值之积时,获取整框监控结果为资源池溢出。
10.根据权利要求9所述的设备,其特征在于,还包括 第二封顶控制模块,用于在所述向各服务器发送功耗封顶控制指令之后,当所述监控得到的整框功耗小于或等于预设的区间下限系数与所述整框功耗封顶值之积时,向所述各服务器发送功耗封顶停止指令,以使所述各服务器收到所述功耗封顶停止指令后停止进行功耗封顶控制,其中,所述区间上限指数大于所述区间下限指数。
11.根据权利要求8所述的设备,其特征在于,还包括 第一计算模块,用于根据预设时间段内监控得到的多个整框功耗的值和服务器总功耗的值计算所述整框功耗的平均值和所述服务器总功耗的平均值; 更新模块,用于根据所述整框功耗的平均值、所述服务器总功耗的平均值和整框功耗封顶值,采用下述公式更新各服务器的服务器功耗封顶值 p [P0-(P1-Pn)]. mN , 其中,Pffl为所述服务器功耗封顶值,Po为所述整框功耗封顶值,巧为所述整框功耗的平均值,巧为所述服务器总功耗的平均值,N为服务器的个数;以所述预设时间段为单位,采用上述公式对所述各服务器的服务器功耗封顶值进行更新。
12.根据权利要求8所述的设备,其特征在于,还包括设置模块,用于在所述对整框功耗进行监控之前,根据机柜配电和业务负载情况设置所述整框功耗封顶值; 第二计算模块,用于根据所述整框功耗封顶值和机框上除所述各服务器之外的其他部件的功耗值,采用下述公式计算所述各服务器的服务器功耗封顶值 P pO —P . m N , 其中,Pffl为所述服务器功耗 封顶值,Po为所述整框功耗封顶值,P为所述其他部件的功耗值,N为服务器的个数。
13.—种功耗封顶的控制系统,其特征在于,包括管理板、供电单元和多个刀片服务器,所述管理板包括权利要求8-13中任一项所述的功耗封顶的控制设备,所述刀片服务器包括单板管理控制单元、基本输入输出系统BIOS和中央处理器CPU。
全文摘要
本发明实施例提供一种功耗封顶的控制方法、设备和系统,方法包括对整框功耗进行监控,获取整框监控结果,所述整框监控结果为资源池溢出或者资源池不溢出,所述资源池为插在同一机框上的多个服务器所共享的供电资源;当所述整框监控结果为资源池不溢出时,不对各服务器进行功耗封顶;当所述整框监控结果为资源池溢出时,向各服务器发送功耗封顶控制指令,以使所述各服务器收到所述功耗封顶控制指令后进行功耗封顶控制。本发明实施例还提供一种功耗封顶的控制设备和系统。本发明实施例实现了更加灵活的封顶功能,最大化地合理使用资源,大大降低了资源的浪费。
文档编号H04L12/24GK102624546SQ20121004801
公开日2012年8月1日 申请日期2012年2月28日 优先权日2012年2月28日
发明者李延松, 梁伟宁, 王江涛 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1