机架式服务器系统的机柜、机架式服务器系统及其管理方法

文档序号:6520041阅读:135来源:国知局
机架式服务器系统的机柜、机架式服务器系统及其管理方法
【专利摘要】本发明公开了一种机架式服务器系统的机柜、机架式服务器系统及其管理方法,其中,该机柜内配置有多个机架式服务器,且进一步包括:至少一供电单元,用于为多个机架式服务器的部分或全部进行供电;至少一散热单元,用于为多个机架式服务器的部分或全部进行散热;至少一管理单元,被配置为与至少一供电单元、至少一散热单元、以及多个机架式服务器电通信,至少一管理单元用于根据从多个机架式服务器采集的运行信息管理至少一供电单元和至少一散热单元。本发明通过管理单元采集机柜内的多个机架式服务器的运行信息,从而对多个机架式服务器的供电和散热进行集成化管理,能够实现对机架式服务器的供电和散热进行集中调控,进而合理地利用系统资源,降低系统能耗与成本。
【专利说明】机架式服务器系统的机柜、机架式服务器系统及其管理方法
【技术领域】
[0001]本发明涉及服务器集成领域,具体来说,涉及一种机架式服务器系统的机柜、机架式服务器系统及其管理方法。
【背景技术】
[0002]随着云计算时代的来临,数据中心、云计算中心建设呈风起云涌之势,其规模也是以呈倍数增长。新一代数据中心、云计算中心建设的核心就是构建数据中心的服务器系统。
[0003]对于信息服务企业而言,选择服务器时首先要考虑服务器的体积、功耗、发热量等物理参数,由于信息服务企业通常使用大型专用机房对大量的服务器资源进行统一部署和管理,专用机房通常设有严密的保安措施、良好的冷却系统、多重备份的供电系统等,因此,专用机房造价昂贵。为了在有限的空间内部署更多的服务器有利于企业降低服务成本,因此通常选用机械尺寸符合19英寸工业标准的机架式服务器。机架式服务器也有多种规格,例如1U、2U、4U、6U、8U等。其中,IU为1.75英寸,约合4.45厘米。通常,IU的机架式服务器最节省空间,但其性能和可扩展性较差,适合一些业务相对固定的使用领域。4U以上的机架式服务器产品性能较高,可扩展性好,可支持4个以上的高性能处理器和大量的标准热插拔部件,管理也较为方便。
[0004]一般来说机架式服务器规格符合19英寸工业标准、对机柜的空间利用率较高,但相应地,由于空间紧凑,散热较困难。现有技术中,机架式服务器采用独立供电、独立散热的方式,不能有效合理利用供电和散热资源;另一方面,需要通过远程管理网口实现对机架式服务器管理,会增加主板的成本,另外还需要配专用的管理交换机,提高了机架式服务器的管理成本,以及额外用于交换机供电、散热、占用空间等问题。
[0005]针对相关技术中机架式服务器系统采用独立供电和散热的方式,导致系统资源利用率低下的问题,目前尚未提出有效的解决方案。

【发明内容】

[0006]针对相关技术中机架式服务器系统采用独立供电和散热的方式,导致系统资源利用率低下的问题,本发明提出一种机架式服务器系统的机柜、机架式服务器系统及其管理方法,能够通过管理单元对机架式服务器的供电和散热进行集中调控,从而合理地利用系统资源,降低系统能耗与成本。
[0007]本发明的技术方案是这样实现的:
[0008]根据本发明的一个方面,提供了一种机架式服务器系统的机柜,机柜内配置有多个机架式服务器。
[0009]另外,上述机柜还包括:
[0010]至少一供电单元,用于为多个机架式服务器的部分或全部进行供电;
[0011]至少一散热单元,用于为多个机架式服务器的部分或全部进行散热;[0012]至少一管理单元,被配置为与至少一供电单元、至少一散热单元、以及多个机架式服务器电通信,至少一管理单元用于根据从多个机架式服务器采集的运行信息管理至少一供电单元和至少一散热单元。
[0013]其中,对于每个管理单元,该管理单元包括:
[0014]采集模块,用于采集多个机架式服务器的运行信息;
[0015]确定模块,用于根据采集的运行信息确定该运行信息对应的机架式服务器的供电和/或散热管理策略;
[0016]策略执行模块,用于根据供电和/或散热管理策略管理至少一供电单兀和至少一散热单元。
[0017]其中,至少一管理单元通过管理单元背板和供电单元背板管理至少一供电单元;至少一管理单元通过管理单元背板和分区背板管理至少一散热单元。
[0018]并且,至少一管理单元用于开启至少一供电单元、关闭至少一供电单元、和/或管理至少一供电单元的供电强度;至少一管理单元用于开启至少一散热单元、关闭至少一散热单元、和/或管理至少一散热单元的散热强度。
[0019]进一步地,每个散热单元包括至少一风扇,至少一管理单元进一步用于通过风扇控制板开启至少一风扇、关闭至少一风扇和/或管理至少一风扇的转速。
[0020]优选地,机柜内包括多个管理单元,多个管理单元通过管理单元背板电通信,并进一步互为冗余。
[0021]此外,至少一管理单元全部故障,至少一供电单元和至少一散热单元全部开启,并且至少一供电单元的供电强度为最大、并至少一散热单元的的散热强度为最大。
[0022]上述至少一管理单元、至少一供电单元、至少一散热单元、以及多个机架式服务器之间通过智能平台管理总线电通信。
[0023]根据本发明的另一个方面,提供了 一种机架式服务器系统。
[0024]其中,上述机架式服务器系统包括:
[0025]智能平台管理总线接口,用于与至少一管理单元电通信。
[0026]根据本发明的另一个方面,提供了一种机架式服务器系统的管理方法。
[0027]其中,上述机架式服务器系统的管理方法包括:
[0028]采集多个机架式服务器的运行信息;
[0029]根据采集的运行信息确定该运行信息对应的机架式服务器的供电和/或散热管理策略;
[0030]根据供电和/或散热管理策略管理至少一供电单元和至少一散热单元;
[0031]优选地,通过智能平台管理接口协议采集多个机架式服务器的运行信息。
[0032]本发明通过管理单元采集机柜内的多个机架式服务器的运行信息,从而对多个机架式服务器的供电和散热进行集成化管理,能够实现对机架式服务器的供电和散热进行集中调控,进而合理地利用系统资源,降低系统能耗与成本。
【专利附图】

【附图说明】
[0033]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0034]图1是根据本发明实施例的机架式服务器系统的机柜的框图;
[0035]图2是根据本发明实施例的机架式服务器系统的框图;
[0036]图3是根据本发明实施例的机架式服务器系统的管理方法的流程图;
[0037]图4是根据本发明的一个实施例的机柜的内部装置的示意图。
【具体实施方式】
[0038]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
[0039]根据本发明的实施例,提供了 一种机架式服务器系统的机柜。
[0040]如图1所示,根据本发明实施例的机柜内除配置有多个机架式服务器10外,还包括:
[0041]至少一供电单元11 (对应于本文提及的PSU,Power Supply Unit,即,电源供电单元),用于为多个机架式服务器10的部分或全部进行供电,可以对机柜内的多个机架式服务器采用集中供电,提高供电效率;
[0042]至少一散热单元12 (即对应文中的散热区),用于为多个机架式服务器10的部分或全部进行散热,可以对机柜内的多个机架式服务器采用集中散热,避免由于单独散热造成能量浪费,并且,可以根据客户需求仅配置供电单元,或者仅配置散热单元;
[0043]至少一管理单元13 (对应于本文提及的RMC, Rack Management Center,即,机柜管理单元),被配置为与至少一供电单元11、至少一散热单元12、以及多个机架式服务器10电通信,至少一管理单元13用于根据从多个机架式服务器10采集的运行信息管理至少一供电单元11和至少一散热单元12。通过管理单元采集机柜内的多个机架式服务器的运行信息,从而对多个机架式服务器的供电和散热进行集成化管理,能够实现对机架式服务器的供电和散热进行集中调控,进而合理地利用系统资源,降低系统能耗与成本。
[0044]其中,对于至少一管理单元13中的每个管理单元,该管理单元包括:
[0045]采集模块(未示出),用于采集多个机架式服务器10的运行信息,即,管理单元13可以周期性地或实时从多个机架式服务器中采集运行信息(包括功耗、供电、发热信息等);
[0046]确定模块(未示出),用于根据采集模块采集的机架式服务器10的运行信息确定该运行信息对应的机架式服务器10的供电和/或散热管理策略,可以通过管理单元中预先配置的运行信息与管理策略的对应关系来确定对每个机架式服务器的供电和/或散热管理策略,或者可以对多个机架式服务器进行划组(可以依据每个机架式服务器的性能、其处理的任务类别或其它方式进行划组),对同一组的机架式服务器实行同样的管理策略,从而提高管理单元的运行效率;
[0047]策略执行模块(未示出),用于根据确定模块所确定的供电和/或散热管理策略管理至少一供电单元12和至少一散热单元13对多个机架式服务器进行供电和/或散热。
[0048]对于一个机柜而言,至少存在一管理单元13,其通过管理单元背板(对应于文中所说的MBP,Management Back Plane,即,管理模块背板)和供电单元背板(对应于文中所说的PBP, Power Back Plane,即,电源背板)管理至少一供电单元11 ;也至少存在另一管理单元13,通过管理单元背板和分区背板(对应于文中所说的ZBP,Zone Back Plane,即,分区背板)管理至少一散热单元12。可以认为,供电单元11控制供电,散热单元12控制散热,在一个机柜中,一定有对散热与供电分别进行控制的管理单元13存在,不会出现机柜的管理单元13对供电或散热实行零控制的情况。
[0049]并且,至少一管理单元13用于开启至少一供电单元11、关闭至少一供电单元11、和/或管理至少一供电单元11的供电强度;至少一管理单元13用于开启至少一散热单元12、关闭至少一散热单元12、和/或管理至少一散热单元12的散热强度。这说明。对于一个机柜而言,管理单元13对散热与供电分别进行控制的手段为分别控制每个供电单元11和/或散热单元12的工作状态,工作状态可以是开启、关闭或者改变工作强度,管理单元13依此实现对整机柜的集中调控。
[0050]并且,每个散热单元12包括至少一风扇Fan (未示出),至少一管理单元13进一步用于通过风扇控制板(FCB, Fan Control Board)开启至少一风扇、关闭至少一风扇和/或管理至少一风扇的转速。即,对于散热单元12而言,调整其工作状态包括调整其风扇的工作状态:开启一散热单元12包括开启至少一风扇;关闭一散热单元12包括关闭至少一风扇;管理一散热单元12的散热强度包括管理至少一风扇的转速。管理单元13可以用过控制散热单元12调整其对应的少一风扇的工作状态。
[0051]机柜内包括多个管理单元13 (优选地,机柜内包括两个管理单元),多个管理单元13通过管理单元背板(未示出)电通信,并进一步互为冗余。多个管理单元13冗余性共存的意义在于,当其中一管理单元13出现故障时,其工作负载可以通过管理单元背板(未示出)移交给其它冗余的管理单元13而不影响机柜的正常散热与供电控制。
[0052]当至少一管理单元13全部故障时,至少一供电单元11和至少一散热单元12全部开启,并且至少一供电单元11的供电强度为最大、并至少一散热单元12的散热强度为最大。由此可知,当所有管理单元出现故障时,管理单元无法控制管理整机柜的供电与散热。为了确保整机柜内多个机架式服务器10供电与散热的运转正常,供电单元与散热单元会开启并提升到最大的工作强度,以应对可能存在的高负载情况,从最大程度上保证了整机柜能提供足够强度的供电与散热,维持多个机架式服务器10的正常运行。
[0053]上述至少一管理单元13、至少一供电单元11、至少一散热单元12、以及多个机架式服务器10之间通过智能平台管理总线IPMB (intelligent platform management bus)电通信。智能平台管理总线为以上各单元模块间通信使用的有线信道,方便调节,节省成本。
[0054]根据本发明的一个实施例,提供了一种机架式服务器系统的管理方法。
[0055]如图2所示,根据本发明实施例的管理方法包括:
[0056]步骤S201,采集多个机架式服务器的运行信息;
[0057]步骤S203,根据采集的运行信息确定该运行信息对应的机架式服务器的供电和/或散热管理策略;
[0058]步骤S205,根据供电和/或散热管理策略管理至少一供电单元和至少一散热单元;[0059]其中,通过智能平台管理接口协议采集多个机架式服务器的运行信息。
[0060]根据本发明的一个实施例,提供了 一种机架式服务器系统。
[0061]如图3所示,根据本发明实施例的机架式服务器系统包括:
[0062]智能平台管理总线接口 31,用于与至少一管理单元13电通信。
[0063]如图3所示的机架式服务器系统可以应用在图1所示的机柜内,在图3所示的机架式服务器用于图1所示机柜的情况下,每个机架式服务器的智能平台管理总线接口 31联接至少一管理单元13与至少一机架式服务器(也可以称为计算节点)。管理单元13采用智能平台管理接口协议连接智能平台管理总线接口 31,通过对其发送指令以监控机架式服务器。
[0064]根据本发明的一个实施例,提供了一种机架式服务器系统(也称为计算节点)的机柜,如图4所示,为该机柜内部装置分布与连接的示意图。图4中包括供电控制信号的传输线、散热控制信号的传输线、计算节点控制信号的传输线,其中,箭头方向表示管理单元信号的传输方向。根据本发明实施例的机柜内主要包括供电部分、散热部分、计算节点部分和管理部分,以下具体说明各个部分:
[0065]供电部分:包括3个电源背板PBP和12个电源供电单元PSU (12个PSU占3U空间),其中,4个供电单元共用一个电源背板,机柜管理单元RMC通过管理模块背板MBP与电源背板PBP实现互连通信,通过I2C总线(Inter-1ntegrated Circuit,两线式串行通讯总线)及其他控制信号对电源供电单元PSU进行监控和管理;
[0066]散热部分:共包括10个相对独立的散热区,每个区对应3个风扇,可以给4个IU计算节点散热,共计30个风扇,因此,一共可负载10个IU计算节点,并且,在一个散热区(即对应文中的一个散热单元)内,风扇控制板FCB提供3个热插拔风扇接口,并通过ZBP、MBP与RMC互连通信,其中,每个计算节点包括一个CONSOLE端口(控制端口)和一个远程管理网口,计算节点通过节点信号接口与对应的ZBP进行电通信,机柜管理单元RMC可以智能调节风扇(Fan)的转速从而根据系统内计算机点的散热量控制散热效率,以合理地供系统内的计算节点进行散热;
[0067]计算节点部分:整机柜共有40个IU的计算节点,每个计算节点通过对应的智能平台管理总线接口、分区背板ZBP、管理模块背板MBP与机柜管理单元RMC相连接,并接受机柜
管理单元的监控与管理。
[0068]管理部分:包括2个冗余的管理单元,二者通过管理模块背板MBP相连接并可以进行通信;当两个管理单元都失效时,自动开启所有风扇,并调节为最大功率,并开启全部电源供电单元PSU并且调节为最大,以保证整机柜的正常供电与散热。
[0069]根据本发明实施例的整机柜采用集中供电、集中散热、集中管理的方式,有效合理利用系统供电和散热资源,降低系统能耗,降低系统运营成本;并且计算节点采用独立IPMB信道进行管理,而不是采用远程管理网口进行管理,降低了主板成本,省去了管理交换机成本;此外,还具有安全的管理功效,通过RMC单元冗余设计,并且设计RMC全部失效后系统安全防范措施,使系统安全、可靠、稳定运行。
[0070]综上所述,借助于本发明的上述技术方案,通过管理单元控制供电单元、散热单元与计算节点,对机柜内的多个机架式服务器的供电、散热与运行的管理集成化,同时对供电单元、散热单元与机架式服务器实行集中调控,集中供电、集中散热、集中管理,合理利用与分配系统供电和/或散热资源,降低系统能耗与成本;同时,采用独立的智能平台管理总线连接智能平台管理总线接口,而不是远程管理网口管理计算节点,调高了调控的便利程度,且降低了硬件成本;另一方面,管理单元的冗余设计,与去冗余后系统的安全防范措施,提高了系统的安全性与稳定性。本发明技术方案提供的整机柜服务器管理系统能实现对机柜内计算节点、供电模块、散热模块等进行全局监控、管理、报警和故障诊断,并且,由于一款整机柜共享供电、散热、管理等基础设备,实现整机柜的快速交付。
[0071]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种机架式服务器系统的机柜,所述机柜内配置有多个机架式服务器,其特征在于,所述机柜内进一步包括: 至少一供电单元,用于为所述多个机架式服务器的部分或全部进行供电; 至少一散热单元,用于为所述多个机架式服务器的部分或全部进行散热; 至少一管理单元,被配置为与所述至少一供电单元、所述至少一散热单元、以及所述多个机架式服务器电通信,所述至少一管理单元用于根据从所述多个机架式服务器采集的运行信息管理所述至少一供电单元和所述至少一散热单元。
2.根据权利要求1所述的机柜,其特征在于,对于每个管理单元,该管理单元包括: 采集模块,用于采集所述多个机架式服务器的运行信息; 确定模块,用于根据采集的运行信息确定该运行信息对应的机架式服务器的供电和/或散热管理策略; 策略执行模块,用于根据所述供电和/或散热管理策略管理所述至少一供电单元和所述至少一散热单元。
3.根据权利要求1所述的机柜,其特征在于,所述至少一管理单元通过管理单元背板和供电单元背板管理所述至少一供电单元; 所述至少一管理单元通过管理单元背板和分区背板管理所述至少一散热单元。
4.根据权利要求3所述的机柜,其特征在于,所述至少一管理单元用于开启所述至少一供电单元、关闭所述至少一供电单元、和/或管理所述至少一供电单元的供电强度; 所述至少一管理单元用于开启所述至少一散热单元、关闭所述至少一散热单元、和/或管理所述至少一散热单元的散热强度。
5.根据权利要求4所述的机柜,其特征在于,每个散热单元包括至少一风扇,所述至少一管理单元进一步用于通过风扇控制板开启所述至少一风扇、关闭所述至少一风扇和/或管理所述至少一风扇的转速。
6.根据权利要求1所述的机柜,其特征在于,所述机柜内包括多个管理单元,所述多个管理单元通过管理单元背板电通信,并进一步互为冗余。
7.根据权利要求1所述的机柜,其特征在于,所述至少一管理单元全部故障,所述至少一供电单元和所述至少一散热单元全部开启,并且所述至少一供电单元的供电强度为最大、并所述至少一散热单元的的散热强度为最大。
8.根据权利要求1至7中任一项所述的机柜,其特征在于,所述至少一管理单元、所述至少一供电单元、所述至少一散热单元、以及所述多个机架式服务器之间通过智能平台管理总线电通信。
9.一种与权利要求1至8中任一项所述的机柜相匹配的机架式服务器系统,其特征在于,所述机架式服务器系统包括: 智能平台管理总线接口,用于与至少一管理单元电通信。
10.一种机架式服务器系统的管理方法,其特征在于,包括: 采集所述多个机架式服务器的运行信息; 根据采集的运行信息确定该运行信息对应的机架式服务器的供电和/或散热管理策略; 根据所述供电和/或散热管理策略管理所述至少一供电单元和所述至少一散热单元;其中,通过智 能平台管 理接口协议采集所述多个机架式服务器的运行信息。
【文档编号】G06F1/20GK103605413SQ201310590989
【公开日】2014年2月26日 申请日期:2013年11月20日 优先权日:2013年11月20日
【发明者】王英, 孙瑛琪, 邵宗有, 沙超群, 郑臣明, 王晖, 柳胜杰, 魏廷, 姚文浩, 袁海滨, 张克功 申请人:曙光信息产业(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1