一种服务器CPU冗余电源的供电方法及供电系统与流程

文档序号:14713720发布日期:2018-06-16 00:55阅读:268来源:国知局
一种服务器CPU冗余电源的供电方法及供电系统与流程

本发明涉及一种服务器CPU冗余电源,更具体地说是一种服务器CPU冗余电源的供电方法及供电系统。



背景技术:

随着我国服务器市场飞速发展,对于服务器产品的可靠性提出了更高的要求,目前服务器产品普遍都使用上了CRPS冗余电源,这增强了外部电源供电的可靠性,但是针对服务器主板的CPU电源,目前市场上还没有对其进行冗余的设计,而在服务器主板设计中,CPU电源设计无疑是最为关键的部分,CPU电源品质的稳定可靠直接决定了CPU的工作性能和使用寿命。



技术实现要素:

本发明的目的在于克服现有技术的不足,提供一种服务器CPU冗余电源的供电方法及供电系统,为服务器主板的可靠运行带来了更高的保障,有效的减少因服务器CPU电源的故障所带来的巨大的维护成本。

为实现上述目的,本发明采用以下技术方案:一种服务器CPU冗余电源的供电方法,所述方法包括:

建立CPU与供电单元之间的通讯关系;

供电单元作为供电端为CPU供电。

其进一步技术方案为:所述供电单元包括两个采用相同主芯片的冗余模块,分别是第一冗余模块和第二冗余模块。

其进一步技术方案为:所述的建立CPU与供电单元之间的通讯关系步骤,包括以下具体步骤:

通过MCU接收CPU发送的SVID信息;

MCU对接收到SVID信息进行处理;

将处理后的信息同时发送给第一冗余模块、第二冗余模块。

其进一步技术方案为:所述的MCU对接收到SVID信息进行处理步骤,包括以下具体步骤:

MCU对Vendor ID,Product ID,Product Revision,Product date code,Lot Code,Protocol ID信息进行处理;

MCU对Iccmax,Vboot信息进行处理;

MCU对Vout,Temperature信息进行处理;

MCU对Iout,Pout信息进行处理。

其进一步技术方案为:所述的MCU对Vendor ID,Product ID,Product Revision,Product date code,Lot Code,Protocol ID信息进行处理步骤,包括以下具体步骤:

第一冗余模块和第二冗余模块通过硬件设置不同的地址;

MCU对CPU发送的地址信息进行翻译;

MCU将翻译之后的信息同时发送给第一冗余模块和第二冗余模块。

其进一步技术方案为:所述的MCU对Vout,Temperature信息进行处理的步骤,包括以下具体步骤:

通过MCU对第一冗余模块和第二冗余模块的Vout,Temperature的数据信息分别进行运算;

将分别进行运算的结果取平均值,并反馈给CPU。

其进一步技术方案为:所述的MCU对Iout,Pout信息进行处理步骤,包括以下具体步骤:

MCU接收第一冗余模块和第二冗余模块发送的Iout,Pout数据;

MCU对接收到的Iout,Pout数据进行叠加运算;

将叠加运算之后的数据发送给CPU;

CPU收到叠加之后的数据,并对其工作状态进行实时调整。

其进一步技术方案为:所述的供电单元作为供电端为CPU供电的步骤,包括以下具体步骤:

MCU通过SVID总线实时获取到第一冗余模块和第二冗余模块反馈给CPU的电流信息;

MCU将获取到的电流信息做平均值运算,并将运算的结果通过均流控制总线发送给第一冗余模块和第二冗余模块;

当第一冗余模块和第二冗余模块接收到做平均值运算后的电流信息与自身实时侦测到的电流信息进行比较,若实时侦测的电流偏小时,则第一冗余模块和第二冗余模块将该结果反馈给CPU,CPU将向第一冗余模块和第二冗余模块发送调高输出电压的控制指令,以增大输出电流;若实时侦测的电流偏大时,则第一冗余模块和第二冗余模块将该结果反馈给CPU,CPU将向第一冗余模块和第二冗余模块发送调低输出电压的控制指令,以减小输出电流。

一种服务器CPU冗余电源的供电系统,包括第一冗余模块,第二冗余模块,MCU,CPU,其中,

第一冗余模块、第二冗余模块,用于为CPU供电;

CPU,用于对第一冗余模块和第二冗余模块进行控制和管理;

MCU,用于CPU与第一冗余模块、第二冗余模块之间通讯数据信息的处理。

其进一步技术方案为:所述第一冗余模块和第二冗余模块均包括电源转换模块、开关切换模块、健康状态指示模块、电流控制模块,其中,

所述电源转换模块,用于第一冗余模块和第二冗余模块与CPU进行通信,并响应CPU发送的指令;

所述开关切换模块,当第一冗余模块和第二冗余模块其中一个冗余模块发生故障时,用于切断该冗余模块与CPU之间的联系;

所述健康状态指示模块,用于指示第一冗余模块和第二冗余模块的工作状态;

所述电流控制模块,用于控制第一冗余模块和第二冗余模块的负载均衡。

本发明与现有技术相比的有益效果是:本发明提供了一种服务器CPU冗余电源的供电方法,通过建立CPU与第一冗余模块和第二冗余模块的通讯关系,从而保证供电单元为CPU稳定、可靠的供电,在通讯过程中采用了MCU对CPU与第一冗余模块和第二冗余模块之间通讯数据信息的处理,从而解决了不同的冗余模块与CPU通信过程中的地址冲突问题;又由于采用了两个相同的冗余模块作为CPU的供电端,但其中一个冗余模块出现故障时,另外一个冗余模块还能正常的为CPU供电,避免了出现故障的冗余模块对服务器造成影响;另外,本发明还提供了一种服务器CPU冗余电源的供电系统,在系统中,第一冗余模块和第二冗余模块均通过设有的电流控制模块,保证了各冗余模块之间的负载均衡,使服务器能够正常、稳定的运行。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明技术手段,可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征及优点能够更明显易懂,以下特举较佳实施例,详细说明如下。

附图说明

图1为本发明一种服务器CPU冗余电源的供电方法具体实施例的流程图;

图2为本发明一种服务器CPU冗余电源的供电方法具体实施例中CPU与供电单元之间的通讯关系的流程图;

图3为本发明一种服务器CPU冗余电源的供电方法具体实施例中MCU对接收到SVID信息进行处理的流程图;

图4为本发明一种服务器CPU冗余电源的供电方法具体实施例中MCU对SVID中的地址信息进行处理的流程图;

图5为本发明一种服务器CPU冗余电源的供电方法具体实施例中MCU对Vout,Temperature信息进行处理的流程图;

图6为本发明一种服务器CPU冗余电源的供电方法具体实施例中MCU对Iout,Pout信息进行处理流程图;

图7为本发明一种服务器CPU冗余电源的供电方法具体实施例中供电单元作为供电端为CPU供电的流程图;

图8为本发明一种服务器CPU冗余电源的供电系统具体实施例的结构图;

图9为本发明一种服务器CPU冗余电源的供电系统具体实施例中第一冗余模块和第二冗余模块的结构图。

附图标记

1、第一冗余模块;11、电源转换模块;12、开关切换模块;13、健康状态指示模块;14、电流控制模块;2、第二冗余模块;3、MCU;4、CPU

具体实施方式

为了更充分理解本发明的技术内容,下面结合具体实施例对本发明的技术方案进一步介绍和说明,但不局限于此。

请参阅图1-图7,本发明提供了一种服务器CPU冗余电源的供电方法,该方法包括:

S10、建立CPU与供电单元之间的通讯关系;

S20、供电单元作为供电端为CPU供电。

具体的,供电单元包括两个采用相同主芯片的冗余模块,分别是第一冗余模块和第二冗余模块。

在某些实施例中,步骤S10包括以下具体步骤:

S101、通过MCU接收CPU发送的SVID信息;

S102、MCU对接收到SVID信息进行处理;

S103、将处理后的信息同时发送给第一冗余模块、第二冗余模块。

在某些实施例中,步骤S102包括以下具体步骤:

S1021、MCU对Vendor ID,Product ID,Product Revision,Product date code,Lot Code,Protocol ID信息进行处理;

S1022、MCU对Iccmax,Vboot信息进行处理;

S1023、MCU对Vout,Temperature信息进行处理;

S1024、MCU对Iout,Pout信息进行处理。

对于步骤S1021-S1024,由于第一冗余模块和第二冗余模块采用了相同的主芯片,这也决定了第一冗余模块和第二冗余模块在SVID的通讯中的Vendor ID,Product ID,Product Revision,Product date code,Lot Code,Protocol ID信息完全一致。当MCU接收到CPU发送的SVID的信息之后,会将其翻译成MCU可识别可处理的信息。

在某些实施例中,步骤S1021包括以下具体步骤:

S10211、第一冗余模块和第二冗余模块通过硬件设置不同的地址;

S10212、MCU对CPU发送的地址信息进行翻译;

S10213、MCU将翻译之后的信息同时发送给第一冗余模块和第二冗余模块。

对于步骤S10211-S10213,由于MCU只会响应地址为0000的SVID信息,因SVID地址为0000默认的是CPU的电源转换芯片的地址,而现在当存在2个相同的CPU电源转换芯片时,第一冗余模块电源转换芯片和第二冗余模块的电源转换芯片需要分别通过硬件来设置不同的地址,然后MCU将翻译之后的信息同时分发给2个地址设置不同的第一冗余模块和第二冗余模块,这样就实现了第一冗余模块和第二冗余模块具备同时接收CPU发送的SVID信息。

在步骤S1022中,Iccmax,Vboot信息通过外围硬件设置成相同配置,这样MCU可以将第一冗余模块和第二冗余模块反馈的Vboot和Iccmax信息直接发送给CPU。

在某些实施例中,步骤S1023包括以下具体步骤:

S10231、通过MCU对第一冗余模块和第二冗余模块的Vout,Temperature的数据信息分别进行运算;

S10232、将分别进行运算的结果取平均值,并反馈给CPU。

在某些实施例中,步骤S1024包括以下具体步骤:

S10241、MCU接收第一冗余模块和第二冗余模块发送的Iout,Pout数据;

S10242、MCU对接收到的Iout,Pout数据进行叠加运算;

S10243、将叠加运算之后的数据发送给CPU;

S10244、CPU收到叠加之后的数据,并对其工作状态进行实时调整。

在某些实施例中,步骤S20包括以下具体步骤:

S201、MCU通过SVID总线实时获取到第一冗余模块和第二冗余模块反馈给CPU的电流信息;

S202、MCU将获取到的电流信息做平均值运算,并将运算的结果通过均流控制总线发送给第一冗余模块和第二冗余模块;

S203、当第一冗余模块和第二冗余模块接收到做平均值运算后的电流信息与自身实时侦测到的电流信息进行比较,若实时侦测的电流偏小时,则第一冗余模块和第二冗余模块将该结果反馈给CPU,CPU将向第一冗余模块和第二冗余模块发送调高输出电压的控制指令,以增大输出电流;若实时侦测的电流偏大时,则第一冗余模块和第二冗余模块将该结果反馈给CPU,CPU将向第一冗余模块和第二冗余模块发送调低输出电压的控制指令,以减小输出电流。

另外,为了确保服务器管理人员维护工作的便利性,同时保证服务器系统稳定的运行而不至于中断,第一冗余模块和第二冗余模块均做了支持热插拔的设计,下面以第一冗余模块为例来具体说明,第一冗余模块的冗余板2x10金手指连接器的PIN脚设计分为电源部分和信号部分,电源部分主要是由GND,VIN,VOUT组成,而信号部分主要由PWRGD,EN,ACT,VR_HOT#,SVID_CLK,SVID_ALET,SVID_DATA,VCCSENSE,VSSSENSE,CTL_VIN,CTL_VOUT,GND,DTC_VCC组成。冗余板2x10金手指连接器的所有PIN脚均采用镀金工艺,这样能增强其表面抗氧化能力和耐磨损能力,可以有效增强连接器热插拔连接的可靠性,同时也能增强其表面的通流能力,电源部分设计电流值为VIN 40A,VOUT 200A,电源部分的VIN和VOUT之间的间隙宽度为2mm,而信号部分的设计满足PIN之间的间隙宽度为1.2mm,且信号线的阻抗满足50ohm的要求,整个冗余板2x10金手指连接器的厚度在1.6mm,在PIN A2和A3之间做了缺口设计,缺口设计的宽度为2mm,一方面是为了避免信号和电源之间的相互干扰,另一方面是为了做防呆设计,放止冗余板2x10金手指连接器与服务器主板2x32插槽连接器插反。电源PIN脚镀金的长度对比信号PIN脚会更长,这样能保证冗余板插入的时候,电源的PIN脚优先与主板连接器接触,而当冗余板移除时,信号PIN脚优先与主板连接器分离,保证了热插拔信号的可靠性。

服务器主板2x32插槽连接器的PIN脚设计也分为电源部分和信号部分,电源部分由GND,VIN,VOUT组成,信号部分主要由PWRGD_A,EN_A,ACT_A,VR_HOT#,SVID_CLK_A,SVID_ALET_A,SVID_DATA_A,VCCSENSE_A,VSSSENSE_A,CTL_VIN_A,CTL_VOUT_A,GND,TS_A组成。服务器主板2x32插槽连接器的每个PIN脚均做弹片设计,当冗余板2x10金手指连接器插入到服务器主板2x32插槽连接器时,弹片的接触点位会处于冗余板2x10金手指连接器的最中间,确保连接的可靠性。服务器主板2x32插槽连接器的电源部分的PIN脚通流设计满足每个PIN流8A,电源部分PIN之间的间隙宽度为2mm,而信号部分的设计满足PIN之间的间隙宽度为1.2mm,且信号线的阻抗满足50ohm的要求,整个服务器主板2x32插槽连接器的宽度为1.8mm,在PIN A24和A25之间做了隔栏设计,隔栏的宽度为1.6mm。主板2x32插槽连接器的信号部分均有做ESD防护设计。

热插拔的工作原理:第一冗余模块的电源VIN和VOUT均与服务器主板通过MOS管做了隔离设计,而其余信号的处理仅与MCU连接,这样的设计保证了当第一冗余模块插入的时候,连接器除了VIN电源之外,其余信号均处于高阻状态。当第一冗余模块插到服务器主板上时,服务器主板2x32插槽连接器的PIN B32(TS_A)会被拉低,MCU侦测到该信号被拉低之后,将发送CTL_VIN_A信号给到第一冗余模板,并控制VIN的MOS开启,之后VIN电源会通过一个LDO芯片,转化出为VR01供电的VCC电源,当MCU通过PIN DTC_VCC_A侦测到VCC电压有效之后,会将EN_A的高信号发送给冗余板,此时冗余板VR01可以正常工作,此时输出电压会达到Vboot电压值,且VR01的PWRGD信号会变高,MCU收到PWRGD_A信号后,将激活SVID信号,VR_HOT#信号,远端反馈的VCCSENSE,VSSSENSE信号发送给冗余板,待冗余板输出电压调整到CPU所要求的电压之后,MCU会发送CTL_VOUT_A去控制输出的MOS开启,并且同时发送ACT_A信号控制冗余板的健康指示灯,其指示灯会变为绿色,显示第一冗余模块工作正常。而当第一冗余板拔除时,MCU会侦测TS_A被拉高,MCU会将对应的服务器主板2x32插槽连接器上的信号全部设置为高阻状态。整个热插拔过程的均受MCU的控制,这样确保了系统的稳定运行。

请参阅图8、9,本发明还提供了一种服务器CPU冗余电源的供电系统,包括第一冗余模块1,第二冗余模块2,MCU3,CPU4,其中,

第一冗余模块1、第二冗余模块2,用于为CPU4供电;

CPU4,用于对第一冗余模块1和第二冗余模2块进行控制和管理;

MCU3,用于CPU4与第一冗余模块1、第二冗余模块2之间通讯数据信息的处理。

进一步的,第一冗余模块1和第二冗余模块2均包括电源转换模块11、开关切换模块12、健康状态指示模块13、电流控制模块14,其中,

电源转换模块11,用于第一冗余模块1和第二冗余模块2与CPU4进行通信,并响应CPU4发送的指令;

开关切换模块12,当第一冗余模1块和第二冗余模块2其中一个冗余模块发生故障时,用于切断该冗余模块与CPU4之间的联系;

健康状态指示模块13,用于指示第一冗余模块1和第二冗余模块2的工作状态;

电流控制模块14,用于控制第一冗余模块1和第二冗余模块2的负载均衡。

具体的,电源转换模块11主要由电源转换芯片VR01以及外围线路,输入电容,功率MOS,输出电感,输出电容等组成,其主要功能是与CPU正常通讯,并实时响应CPU发送的指令,产生CPU需求的稳定的电源。该模块拥有的保护功能包括UVP(低压保护),OVP(过压保护),OCP(过流保护),OTP(过温保护),UVLO(欠压保护),SCP(短路保护)。此外,电源转换芯片VR01与外围连接的信号包含:电源状态指示信号PWRGD,电源使能信号EN,温度报警信号VR_HOT#,输出反馈信号VCCSENSE,VSSSENSE,SVID信号(SVID_DAT,SVI_CLK,SVID_ALET)。当输入电压VIN进入到两个冗余模块时,会先通过一个LDO芯片生成VCC电压,等待芯片使能信号EN高有效时,VR01开始工作,其输出电压会先达到Vboot电压值,当CPU发送电压调节的指令时,VR01会实时响应并调整到CPU所需求的电压值。整个电源转换模块11的稳定运行,是CPU电源品质的重要保障。

开关切换模块12是位于电源转换模块11和CPU之间,主要起隔离作用,能保证电源转换模块11在发生故障时,可以快速切断其与服务器主板之间的联系。开关切换模块12由两部分组成,VIN的开关切换模块和VOUT的开关切换模块,它们均有MOS管以及控制线路组成。当两个冗余模块插入到主板时,正常连接之后,主板上的侦测信号TS被拉低,之后MCU会发送CTL_VIN信号使得控制VIN的MOS管导通,VIN电源进入冗余板;然后当电源转换模块输出电压稳定之后,MCU侦测到电源状态指示信号PWRGD变高之后,然后将发送CTL_VOUT信号使得控制VOUT的MOS管导通。为了避免控制VIN/VOUT的MOS管开启时形成的INRUSH CURRENT冲击,控制线路中加入了SOFT START的设计,保证VIN/VOUT电源的平稳切换。同时当MCU侦测到电源转换模块12发生异常时,会将CTL_VIN,CTL_VOUT信号拉低,使得控制VIN/VOUT的MOS快速关断,从而使得两个与服务器主板完全隔离,保证冗余电源发生故障时,不会对系统造成影响。

健康状态指示模块13主要是指示两个冗余模块的工作状态,方便服务器管理人员维修,并可以及时更换有故障的冗余模块。其状态指示灯采用双色灯,当冗余模块正常工作时,指示灯显示为绿色,当冗余模块工作异常时,指示灯显示为黄色。工作人员可以根据特定位置的指示灯来判断冗余模块的工作状态。

电流控制模块14主要是为了保证各个冗余模块之间负载均衡。第一冗余模块和第二冗余模块与MCU之间有一根均流控制总线,其主要作用是作为电流控制模块的电流参考。MCU会实时读到电源转换芯片VR01和电源转换芯片VR02所反馈给CPU的电流信息,然后将2个电流值做平均值运算,再然后将运算的结果通过均流控制总线发送给各个电流控制模块14,而当电流控制模块14收到该电流信息之后会将其与实时侦测的电流信息进行比较,若实时侦测的电流偏小时,电流控制模块会反馈给芯片端,从而通过调高输出电压,来实现输出电流的增大。反之若实时侦测的电流偏大时,通过电流控制模块反馈给芯片,将输出电压调低,来到达减少输出电流的目的。从而来达到冗余模块的负载均衡设计。

另外,为了确保服务器管理人员维护工作的便利性,同时保证服务器系统稳定的运行而不至于中断,第一冗余模块1和第二冗余模块2均做了支持热插拔的设计,下面以第一冗余模块1为例来具体说明,第一冗余模块的冗余板2x10金手指连接器的PIN脚设计分为电源部分和信号部分,电源部分主要是由GND,VIN,VOUT组成,而信号部分主要由PWRGD,EN,ACT,VR_HOT#,SVID_CLK,SVID_ALET,SVID_DATA,VCCSENSE,VSSSENSE,CTL_VIN,CTL_VOUT,GND,DTC_VCC组成。冗余板2x10金手指连接器的所有PIN脚均采用镀金工艺,这样能增强其表面抗氧化能力和耐磨损能力,可以有效增强连接器热插拔连接的可靠性,同时也能增强其表面的通流能力,电源部分设计电流值为VIN 40A,VOUT 200A,电源部分的VIN和VOUT之间的间隙宽度为2mm,而信号部分的设计满足PIN之间的间隙宽度为1.2mm,且信号线的阻抗满足50ohm的要求,整个冗余板2x10金手指连接器的厚度在1.6mm,在PIN A2和A3之间做了缺口设计,缺口设计的宽度为2mm,一方面是为了避免信号和电源之间的相互干扰,另一方面是为了做防呆设计,放止冗余板2x10金手指连接器与服务器主板2x32插槽连接器插反。电源PIN脚镀金的长度对比信号PIN脚会更长,这样能保证冗余板插入的时候,电源的PIN脚优先与主板连接器接触,而当冗余板移除时,信号PIN脚优先与主板连接器分离,保证了热插拔信号的可靠性。

服务器主板2x32插槽连接器的PIN脚设计也分为电源部分和信号部分,电源部分由GND,VIN,VOUT组成,信号部分主要由PWRGD_A,EN_A,ACT_A,VR_HOT#,SVID_CLK_A,SVID_ALET_A,SVID_DATA_A,VCCSENSE_A,VSSSENSE_A,CTL_VIN_A,CTL_VOUT_A,GND,TS_A组成。服务器主板2x32插槽连接器的每个PIN脚均做弹片设计,当冗余板2x10金手指连接器插入到服务器主板2x32插槽连接器时,弹片的接触点位会处于冗余板2x10金手指连接器的最中间,确保连接的可靠性。服务器主板2x32插槽连接器的电源部分的PIN脚通流设计满足每个PIN流8A,电源部分PIN之间的间隙宽度为2mm,而信号部分的设计满足PIN之间的间隙宽度为1.2mm,且信号线的阻抗满足50ohm的要求,整个服务器主板2x32插槽连接器的宽度为1.8mm,在PIN A24和A25之间做了隔栏设计,隔栏的宽度为1.6mm。主板2x32插槽连接器的信号部分均有做ESD防护设计。

热插拔的工作原理:第一冗余模块1的电源VIN和VOUT均与服务器主板通过MOS管做了隔离设计,而其余信号的处理仅与MCU连接,这样的设计保证了当第一冗余模块1插入的时候,连接器除了VIN电源之外,其余信号均处于高阻状态。当第一冗余模块1插到服务器主板上时,服务器主板2x32插槽连接器的PIN B32(TS_A)会被拉低,MCU侦测到该信号被拉低之后,将发送CTL_VIN_A信号给到第一冗余模板1,并控制VIN的MOS开启,之后VIN电源会通过一个LDO芯片,转化出为VR01供电的VCC电源,当MCU通过PIN DTC_VCC_A侦测到VCC电压有效之后,会将EN_A的高信号发送给冗余板,此时冗余板VR01可以正常工作,此时输出电压会达到Vboot电压值,且VR01的PWRGD信号会变高,MCU收到PWRGD_A信号后,将激活SVID信号,VR_HOT#信号,远端反馈的VCCSENSE,VSSSENSE信号发送给冗余板,待冗余板输出电压调整到CPU所要求的电压之后,MCU会发送CTL_VOUT_A去控制输出的MOS开启,并且同时发送ACT_A信号控制冗余板的健康指示灯,其指示灯会变为绿色,显示第一冗余模块工作正常。而当第一冗余板1拔除时,MCU会侦测TS_A被拉高,MCU会将对应的服务器主板2x32插槽连接器上的信号全部设置为高阻状态。整个热插拔过程的均受MCU的控制,这样确保了系统的稳定运行。

上述仅以实施例来进一步说明本发明的技术内容,以便于读者更容易理解,但不代表本发明的实施方式仅限于此,任何依本发明所做的技术延伸或再创造,均受本发明的保护。本发明的保护范围以权利要求书为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1