一种刀片服务器系统热插拔状态的顺序上下电系统和方法

文档序号:6562624阅读:254来源:国知局
专利名称:一种刀片服务器系统热插拔状态的顺序上下电系统和方法
技术领域
本发明涉及一种机群系统的上下电方法,具体是计算刀片服务器系统的上下电策略。
背景技术
现今的刀片服务器系统为一种高密度系统,通常可容纳好几片至十几、二十片刀片服务器,电源作为刀片系统的动力来源,其安全可靠性直接关系着整个系统的性能。由于系统是一个庞大的耗电系统,对刀片系统的上下电方案的设计显得尤为重要,刀片系统运行过程中,需要随时监测其各个模块的健康状态和运行状态,管理员能够及时了解系统的运行状况,及时发现运行过程中出现的异常情况,并进行相应处理,保证刀片系统的正常运行。系统的多台刀片需要上电、下电时,由于每个刀片在上电瞬间存在一个尖峰电流问题,如果多台刀片同时上电、下电,也会存在一个瞬间电流过大的问题。整个刀片系统是一个庞大的耗电系统,如果同时上电和下电,对供电系统电网也会造成冲击。
因此,需要设计一种计算刀片服务器上下电的系统和方法,它使刀片服务器系统能够安全稳定的上电和下电,并且能够支持热插拔操作。消除上下电过程中对电源系统和外界电网的冲击,以解决现有的一系列安全问题。

发明内容
本发明的目的之一是提供一种计算刀片服务器上下电的系统和方法,它使刀片服务器系统在初始状态下能够安全稳定的上电和下电。
本发明的又一目的是提供一种计算刀片服务器上下电的方法,它使刀片服务器系统在运行状态下能够安全稳定的上电和下电,即支持模块进行热插拔操作。
为实现上述发明目的,本发明所提供的技术方案的基本构思如下本发明提供一种刀片服务器系统的顺序上下电系统,包括风扇、刀片、交换机、IOE扩展模块,其特殊之处在于还包括,管理模块,采用“中央集权”式连接并控制电源系统、IOE扩展模块、交换机、刀片、风扇;电源系统,用于上下电顺序控制、电源功率分配和回收、电源冗余控制、故障分析和报警,分为电源管理域和任务域;其中,所述的电源管理域为初始模式管理子系统供电,电源任务域为各模块处于正常工作模式下供电。
所述管理模块对电源任务域上电请求采用“申请-审批”的模式,下电请求采用“通知-确认”。
所述管理模块和刀片的连接采用RS485总线,和电源系统、IOE扩展模块、交换机、风扇的连接采用I2C总线。
其中,所述上下电系统能够支持热插拔操作,对于不支持热插拔的部件,管理模块立刻对整个系统进行系统下电处理。
所述支持热插拔的部件为刀片、管理模块、千兆交换机、Infiniband交换机、带冗余的电源模块。
一种刀片服务器系统的顺序上下电方法,包括步骤系统从静止状态(初始状态)上电aAC输入接入,电源模块输出12v Standby,管理模块和在线其它模块的管理子系统开始工作,进行整体系统初始化操作;b管理模块与电源模块进行通讯,判断在线电源模块功率额度、状态和数量,管理模块计算出电源模块能够提供的整体有效功率输出;c电源模块工作是否正常c1工作正常时,等待系统上电请求,c2工作不正常时,立刻终止上电过程并报告相应系统错误;
d有系统上电请求,首先检测是否有刀片在线d1有刀片在线,执行上电请求,d2没有刀片在线,终止上电请求,同时发送警报;e启动风扇模块是否满足启动的最低配置要求e1满足,全速运行风扇,e2不满足,立刻终止上电过程并报告相应系统错误;f检查风扇运行是否正常f1运行正常,检测所有在线模块,f2运行不正常,立刻终止上电过程并报告相应系统错误;g检测刀片是否在线或者请求上电g1有在线或者上电请求,判断交换机是否在线,g2没有刀片在线或者请求上电,降低风扇转速等待刀片上电;h检测交换机是否在线h1在线,判断IOE模块是否在线,h2不在线,不对交换机进行初始化上电过程;i判断IOE模块是否在线i1在线,给未上电中槽位代码最低的刀片服务器上电,同时给IOE相应插槽上电,i2不在线,给未上电中槽位代码最低的刀片服务器上电;j检测还有无刀片请求上电j1有,继续执行一下操作,j2无,跳到l步;k每上完一个刀片,根据当前功率分配实际的分配情况来判断是否可以允许下一个刀片上电k1允许,跳到i步,继续为下一个槽位刀片上电,k2不允许,报错终止上电操作;l根据系统运行状况调整风扇转速,系统整体初始化上电完毕。
系统从运行状态(初始状态)下电m刀片系统处于运行态;n接收到系统下电请求;o判断是否有IOE模块在线o1有,管理模块向刀片服务器和IOE模块相应PCI-E插槽广播下电要求,o2没有,管理模块向刀片服务器广播下电要求;p等待所有刀片和IOE相应槽位下电确认;q通知交换机下电;r等待交换机下电确认;s通知风扇下电;t等待风扇下电确认;u通知电源模块停止12v输出,下电过程完成。
在运行态(热插拔)的模块上电顺序运行的刀片系统中插入HPPM;计算功率分配余额,是否允许HPPM上电,是,判断是否刀片在线,否,给出系统警告,同时停止系统上电;判断是否刀片在线,是,判断是否含有IOE模块,否,给交换机模块上电;是否含有IOE模块,是,给发出上电请求的刀片服务器上电,同时IOE相应插槽上电,否,给发出上电请求的刀片服务器上电;HPPM上电完毕;根据系统最终运行情况调整各风扇转速。
在运行态(热插拔)的模块下电顺序下电模块提出申请;管理模块批准;模块下电并发出确认消息;管理模块进行功率回收;模块下电完成。
所述的系统初始状态顺序上下电方法,其中,所述的上电前电源功率预分配的步骤分两步功能模块把自身在固定Flash中的存储的最大满配情况的功率需求发送给管理模块进行审批;等刀片完成了BIOS自检之后还要进行电源功率实际分配的申请给管理模块。
与现有的技术相比,本发明具有以下优点及有益效果1、采用初始状态上下电策略和运行状态上下电策略使整个刀片系统能够安全可靠的运行;2、PTD各个模块处于正常工作模式下,由管理模块进行“中央集权式”控制模式,上电采用“申请-审批”模式,下电采用“通知-确认”模式,即支持热插拔操作;3、系统初始状态顺序上下电方法中,上电前电源功率预分配的步骤分两步,这两步电源分配的策略一方面可以保证刀片不会误上电,另外一方面可以保证有功耗使用的精确性,使功耗分配更加合理;4、对于上电权限的获取,采用一次上电一次权限获取的机制,这样可以保证不会导致刀片误上电操作,因为每次上电都需要一次新的申请;一旦申请成功,在不下电的情况下(即使重启),因为没有改变电源功率分配,也不用再次申请,减少通讯次数;本发明采用上述刀片服务器顺序上下电策略,解决了上电、下电时,由于每个刀片在上电瞬间存在一个尖峰电流问题,和存在一个瞬间电流过大的问题,且消除上下电过程中对电源系统和外界电网的冲击,以解决现有的一系列安全问题;本发明可广泛应用于具有多个至二十个刀片的服务器系统中。


图1是本发明的管理系统通讯总线结构示意图;图2是本发明的电源电压分布示意图;图3是本发明的系统初始状态上电顺序示意图;图4是本发明的系统初始状态下电顺序示意图;图5是本发明的系统运行状态上电顺序示意图;图6是本发明的系统运行状态下电顺序示意图。
具体实施例方式
下面结合附图,对本发明作进一步说明。
参见图1至图6电源系统负责给整个刀片系统中各个模块和机箱提供电源,进行上电顺序控制和电源功率分配;下电顺序控制和功率回收;电源冗余控制,电源模块故障分析、报警。电源系统采用两种电压的工作模式把电源系统整体分为两个工作域电源管理域(Power Management Doma inPMD)和电源任务域(PowerTask DomainPTD)。
本发明一种刀片式服务器系统的顺序上下电系统,包括风扇(FAN)、刀片(Blade)、交换机(SW)、IOE扩展模块,其特殊之处在于还包括管理模块(MM),采用“中央集权”式连接并控制电源系统、IOE扩展模块、交换机、刀片、风扇;电源系统(PS),用于上下电顺序控制、电源功率分配和回收、电源冗余控制、故障分析和报警,分为电源管理域和任务域;其中,所述的电源管理域为初始模式管理子系统供电,采用电源模块的12v Standby电源部分,只要电源模块存在AC输入,整个PMD就有功率输出,相应管理子系统就能正常工作,这里的上电并不受管理模块控制;电源任务域为各模块处于正常工作模式下供电,例如刀片服务器的CPU、内存、硬盘等部件就采用PTD电源供电,这些系统统一来自于电源模块的12v,同时上下电受到PMD中的管理子系统控制和管理。对于PTD部分电源系统是由管理模块进行“中央集权式”的控制模式。
所述管理模块对电源任务域上电请求采用“申请-审批”的模式,下电请求采用“通知-确认”,其它模块如果要做出对PTD状态的改变,特别是对于上电的请求,必须首先向管理模块提出申请,经过管理模块审批之后,采取相应操作,上电采用的是“申请-审批”模式,而对于下电控制,由于下电并不需要新的功率资源,所以采用的是“通知-确认”模式,含义就是一方面管理模块可以通知刀片和其它各个模块需要进行下电控制,另外也可以发过来刀片和其它各个模块发送下电通知给管理模块,并自行决定下电不等管理模块的确认,比如在散热中非常紧急的情况,刀片服务器可以自行决定下电操作。
所述管理模块和刀片的连接采用RS485总线,和电源系统、IOE扩展模块、交换机、风扇的连接采用I2C总线,电源系统管理是通过各种电源管理命令来实现的,而电源管理命令以数据帧的格式在管理系统各种总线上传递,系统管理总线体现集中控制的思想,即各种设备都通过工业总线和管理模块进行连接,彼此之间并没有连接。
所述上下电系统能够支持热插拔操作,对于不支持热插拔的部件,管理模块立刻对整个系统进行系统下电处理。
所述支持热插拔的部件为刀片、管理模块、千兆交换机、Infiniband交换机、带冗余的电源模块,除此之外,不再有任何热插拔部件,对于热插拔的部件,有管理模块按照正常上下电顺序进行控制,对于不支持热插拔的部件一旦被拔除,管理模块立刻对整个系统进行下电处理,即当IOE模块,或拔除过多不再冗余的电源模块就立刻又管理模块进行系统下电处理。
根据刀片系统状态的划分,上电顺序分为两种第一种,从静止态开始的整个刀片系统的上电顺序;第二种,在运行态的单个可以热插拔模块上电顺序。刀片系统上电按钮功能定义如下系统总上电按钮功能由管理模块软件配置,缺省情况下仅上电机箱、风扇等;刀片上电按钮仅仅为指定刀片上电,总按钮没有操作,无法上电。整个刀片系统的上电顺序是系统安全能够安全可靠运行的重要保证,也是系统从静止态到运行态转换的过程。刀片系统上电的初始必要条件是至少有一个电源模块存在于刀片系统中;至少有一个管理模块存在于刀片系统中需要至少一个刀片服务器模块在线。初始条件是指到刀片系统在没有接入AC输入的情况为初始条件,在这种情况下插入任意组合的模块的上电顺序。状态输入系统上电请求,可以来自系统上电请求按钮,也可以来自管理模块提供的管理界面的上电请求。上电的基本思想是管理模块上电—风扇上电—交换机上电—刀片和IOE同时上电。
一种刀片服务器系统的顺序上下电方法,具体步骤系统从静止状态(初始状态)上电aAC输入接入,电源模块输出12V Standby,管理模块和在线其它模块的管理子系统开始工作,进行整体系统初始化操作;b管理模块与电源模块进行通讯,判断在线电源模块功率额度、状态和数量,管理模块计算出电源模块能够提供的整体有效功率输出;c电源模块工作是否正常c1工作正常时,等待系统上电请求,c2工作不正常时,立刻终止上电过程并报告相应系统错误;d有系统上电请求,首先检测是否有刀片在线d1有刀片在线,执行上电请求,d2没有刀片在线,终止上电请求,同时发送警报;e启动风扇模块是否满足启动的最低配置要求(最低配置要求可以根据刀片的Present-Detect引脚来确定风道,从而确定风扇最低配置)e1满足,全速运行风扇,e2不满足,立刻终止上电过程并报告相应系统错误;
f检查风扇运行是否正常f1运行正常,检测所有在线模块,f2运行不正常,立刻终止上电过程并报告相应系统错误;g检测刀片是否在线或者请求上电g1有在线或者上电请求,判断交换机是否在线,g2没有刀片在线或者请求上电,降低风扇转速等待刀片上电;h检测交换机是否在线h1在线,判断IOE模块是否在线,h2不在线,不对交换机进行初始化上电过程;i判断IOE模块是否在线i1在线,给未上电中槽位代码最低的刀片服务器上电,同时给IOE相应插槽上电(保证主机和PCI-E接口上电同步),i2不在线,给未上电中槽位代码最低的刀片服务器上电;j检测还有无刀片请求上电j1有,继续执行一下操作,j2无,跳到l步;k每上完一个刀片(如果有IOE,那么就包括相应PCI-E插槽),根据当前功率分配实际的分配情况来判断是否可以允许下一个刀片上电k1允许,跳到i步,继续为下一个槽位刀片上电,k2不允许,报错终止上电操作;l根据系统运行状况调整风扇转速,系统整体初始化上电完毕。
在对于第一个刀片上电的时候,并没有做出功率计算,是建立在一个电源模块能够支持至少一个刀片服务器和所有其他辅助模块的假设前提下,如果这个假设不成立则需要在第一个刀片上电前进行计算,对于功率分配计算分为两步,第一步是上电前的电源功率预分配,在这一步功能模块是把自身在固定Flash中的存储的最大满配情况的功率需求发送给管理模块进行审批,这里说明的是满配并不代表实际配置。所以等刀片完成了BIOS自检之后还要进行电源功率实际分配的申请给管理模块,这是第二步电源分配结果。比如根据不同的配置,刀片中可以插入8条内存、4条内存、2条内存或者两块或者一块硬盘,甚至将来的单双CPU不同,对于功耗还是有明显差异的。这种两步电源分配的策略一方面可以保证刀片不会误上电(最大满配功耗),另外一方面可以保证有功耗使用的精确性,是功耗分配更加合理。
下电过程与上电过程相对,也分两种第一种,从运行态开始的整个刀片系统的下电顺序,第二种,在运行态的单个模块下电顺序。
刀片系统整体初始下电顺序,初始条件是指当刀片系统在运行的情况为初始条件(至少有一个刀片在运行),状态输入系统下电请求,可以来自系统电源按钮请求下电,也可以来自管理模块提供的管理界面的上电请求,下电的基本思想是刀片和IOE同时下电-交换机下电-风扇下电-电源模块停止输出12v电压回到静止态。
系统从运行状态(初始状态)下电具体步骤m刀片系统处于运行态;n接收到系统下电请求;o判断是否有IOE模块在线o1有,管理模块向刀片服务器和IOE模块相应PCI-E插槽广播下电要求,o2没有,管理模块向刀片服务器广播下电要求;p等待所有刀片和IOE相应槽位下电确认;q通知交换机下电;r等待交换机下电确认;s通知风扇下电;t等待风扇下电确认;u通知电源模块停止12v输出,下电过程完成。
当刀片服务器处于运行态时,单独的模块可以进行热插拔操作,所以也存在一定的上电时序问题。能够热插拔的模块有刀片、交换机、管理模块,对于冗余电源单独考虑。对于刀片和交换机由于都工作在PTD中,可以采用相同的策略上电,这里统一采用HPPM(Hot Plug&Play Module)表示。而管理模块由于工作在PMD中,所以在设计PMD输出功率大于两个管理模块时的情况,就可以直接上电了。
在运行态(热插拔)的模块上电顺序运行的刀片系统中插入HPPM;计算功率分配余额,是否允许HPPM上电,是,判断是否刀片在线,否,给出系统警告,同时停止系统上电;判断是否刀片在线,是,判断是否含有IOE模块,否,给交换机模块上电;是否含有IOE模块,是,给发出上电请求的刀片服务器上电,同时IOE相应插槽上电,否,给发出上电请求的刀片服务器上电;HPPM上电完毕;根据系统最终运行情况调整各风扇转速。
上电策略采用“申请-审批”的模式,各个模块首先提供自身需求的功率数目给管理模块,管理模块在根据目前功率余额进行审批,如果功率余额不够,则不进行上电审批,否则给予上电批准。对于上电权限的获取,采用一次上电一次权限获取的机制。这样的做法可以保证第一、不会导致刀片误上电操作,因为每次上电都需要一次新的申请。第二、一旦申请成功,在不下电的情况下(即使重启),因为没有改变电源功率分配,也不用再次申请,减少通讯次数。
在运行态的模块下电的基本思想是下电模块提出申请-管理模块批准-模块下电,并发出确认消息-管理模块进行功率回收,模块下电完成。这里需要注意的是,当没有一个管理模块在线时,也要支持下电操作,即如果下电模块连续三次发送请求不能得到批准,就认为管理模块不在线(考虑是否要增加管理模块在线位),就立即由本地管理系统进行下电操作。当下电模块是最后一个刀片服务器时,进行系统下电步骤,关闭整个系统。下电策略中主要采用的是“通知-确认”模式,不同于上电策略,主要是计算功率回收问题。对于电源模块由于采用全定制的电源模块设计方案,为此需要指定相关电源功能,电源接口和相关通讯协议部件。电源功能定义最大输出功率4800W;支持N+1电源冗余模式,除非仅有一个电源,否则一定有一个电源模块为冗余配置,并且能够在电源出现故障时,自动完成冗余切换;能够提供相关状态信息,包括输出电压值、电源模块温度值、电源模块最大输出功率、电源模块功率使用情况、电源模块健康信息,即冗余情况;电源接口总线I2C总线;电源通讯协议TBD。
在运行态(热插拔)的模块下电顺序下电模块提出申请;管理模块批准;模块下电并发出确认消息;管理模块进行功率回收;模块下电完成。
最后应当说明的是以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解依然可以对本发明的具体实施方式
进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。
权利要求
1.一种刀片服务器系统热插拔状态的顺序上下电系统,包括风扇、刀片、交换机、IOE扩展模块,其特征在于还包括,管理模块,采用“中央集权”式连接并控制电源系统、IOE扩展模块、交换机、刀片、风扇;电源系统,用于上下电顺序控制、电源功率分配和回收、电源冗余控制、故障分析和报警,分为电源管理域和任务域;其中,所述的电源管理域为初始模式管理子系统供电,电源任务域为各模块处于正常工作模式下供电。
2.如权利要求1所述的系统,其中,所述管理模块对电源任务域上电请求采用“申请-审批”的模式,下电请求采用“通知-确认”。
3.如权利要求1所述的系统,其中,所述管理模块和刀片的连接采用RS485总线,和电源系统、IOE扩展模块、交换机、风扇的连接采用I2C总线。
4.如权利要求1所述的系统,其中,所述上下电系统能够支持热插拔操作,对于不支持热插拔的部件,管理模块立刻对整个系统进行系统下电处理。
5.如权利要求4所述的系统,其中,所述支持热插拔的部件为刀片、管理模块、千兆交换机、Infiniband交换机、带冗余的电源模块。
6.一种刀片服务器系统热插拔状态的顺序上下电方法,包括步骤在运行态的模块上电顺序运行的刀片系统中插入HPPM;计算功率分配余额,是否允许HPPM上电,是,判断是否刀片在线,否,给出系统警告,同时停止系统上电;判断是否刀片在线,是,判断是否含有IOE模块,否,给交换机模块上电;是否含有IOE模块,是,给发出上电请求的刀片服务器上电,同时IOE相应插槽上电,否,给发出上电请求的刀片服务器上电;HPPM上电完毕;根据系统最终运行情况调整各风扇转速;在运行态的模块下电顺序下电模块提出申请;管理模块批准;模块下电并发出确认消息;管理模块进行功率回收;模块下电完成。
7.如权利要求6所述的系统顺序上下电方法,其中,所述的上电前电源功率预分配的步骤分两步功能模块把自身在固定Flash中的存储的最大满配情况的功率需求发送给管理模块进行审批;等刀片完成了BIOS自检之后还要进行电源功率实际分配的申请给管理模块。
全文摘要
一种刀片服务器系统热插拔状态的顺序上下电系统和方法,包括风扇、刀片、交换机、IOE扩展模块、管理模块、电源系统,电源系统分为为初始模式管理子系统供电的电源管理域和为各模块处于正常工作模式下供电的电源任务域;系统在初始状态下和运行状态下(即支持模块进行热插拔操作)能够安全稳定的上电和下电;采用本发明的方法解决了上电、下电时,由于每个刀片在上电瞬间存在一个尖峰电流问题,和存在一个瞬间电流过大的问题,且消除上下电过程中对电源系统和外界电网的冲击,以解决现有的一系列安全问题。
文档编号G06F1/26GK1987733SQ20061014413
公开日2007年6月27日 申请日期2006年11月28日 优先权日2006年11月28日
发明者沙超群, 曾宇, 李华 申请人:曙光信息产业(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1