一种实现服务器系统过热保护的设计方法与流程

文档序号:17656805发布日期:2019-05-15 22:05阅读:536来源:国知局
本发明涉及通用服务器领域,具体地说是一种实现服务器系统过热保护的设计方法。
背景技术
:目前服务器CPU已经整体系统性能在不断提升,功耗越来越大,使CPU得温度不断攀升,这不但影响产品的性能的正常发挥,甚至由于故障率增加,影响电子系统的固有可靠性,因此系统的过热保护已成为当前硬件系统设计的热点问题。而在IntelPurley平台的规划中,没有集成FPGA的最大功耗达到了165W,而集成FPGA的CPU最大功耗达到了255W,普通的双路服务器整机功耗直逼800W。这对系统散热是个挑战,同时也存在很大的安全隐患。如果不能有效的给系统散热,且没有保护的话,系统很容易死机。在严重的情况下,甚至可能出现塑胶件融化甚至起火的现象。本发明提出的方法,可解决在系统温度整体监测及风扇全速情况下,仍无法有效地为CPU降温的保护的问题。技术实现要素:本发明的技术任务是提供一种实现服务器系统过热保护的设计方法。本发明的技术任务是按以下方式实现的,一种实现服务器系统过热保护的设计方法,具体方法步骤如下:S1、包括四大模块,温度监测实现模块、风扇控制模块、系统降频实现模块及系统关机实现模块;S2、温度监测模块中包括BMC基板管理控制器,BMC基板管理控制器获取温度数据;S3、BMC基板管理控制器获取数据后,通过风扇控制模块调整风扇转速;S4、BMC基板管理控制器获取数据后,通过系统降频实现模块进行CPU降频;所述的系统降频实现模块的工作方法如下:S41、当系统温度达到BMC基板管理控制器设定的降频温度点时,BMC通过GPIO通知CPLD复杂可编程逻辑器件;S42、由CPLD复杂可编程逻辑器件将CPU的MEM_HOT_C{012/345}和PROCHOT_N拉低,从而实现降频的目的;S43、CPU供电模块IC配置有VRHOT_N引脚,当系统功耗超过设定的功耗值,触发VRHOT_N这个信号;S44、由CPLD复杂可编程逻辑器件将MEM_HOT_C{012/345}和PROCHOT_N拉低,实现降频的目的;S5、BMC基板管理控制器获取数据后,通过系统关机实现模块进行系统关机。进一步的,优选的方法为,所述的温度检测模块的工作方法如下:S1、PCH南桥内嵌ME模块通过PECI总线获取CPU温度信息;S2、BMC基板管理控制器通过LPC总线从PCH南桥ME模块中获取CPU温度;S3、在温度监控点设置温度传感器,以实现BMC基板管理控制器通过温度传感器监控温度监控点。进一步的,优选的方法为,所述的BMC基板管理控制器的工作方法如下:当获取的温度数据小于制定的降频温度点时,BMC基板管理控制器可以控制调整风扇的转速,从而实现为系统散热;当获取的温度数据等于制定的降频温度点时,BMC基板管理控制器可以控制CPU降频,从而实现为系统散热;当获取的温度数据等于制定的关机温度点时,BMC基板管理控制器可以控制系统关机,从而保护整个系统。进一步的,优选的方法为,所述的系统关机实现模块,包括关机指令发出模块、关机指令搜集及执行模块和关机模块;关机指令发出模块:设定一临界温度值,当CPU温度上升到这个温度点的时候,就会触发THRMTRIP_N信号;关机指令搜集及执行模块:这个模块由CPLD和BMC构成,是两个单独的控制系统,冗余设计是确保系统可以关机,避免过热造成的不可预知后果;当搜集到CPU发出的关机指令后,CPLD和BMC分别会触发THRMTIP_N给PCH;关机模块:这个模块即PCH模块,当接收到THRMTRIP_N信号后,PCH会立即执行,将时序信号中的SLP_S3#/S4#/S5#信号拉低,从而实现系统关机。一种服务器过热保护系统,包括温度监测实现模块、控制系统及输入输出系统,用于获取计算机系统温度的温度监测实现模块;用于传送过热信号至输入输出系统的的控制系统;所述的温度检测实现模块与控制系统相连;还包括用于执行过热保护动作的输入输出系统;进一步的,优选的结构为,温度监测实现模块中包括基板管理控制器、PCH南桥内嵌ME模块和温度传感器。进一步的,优选的结构为,所述的控制系统,包括GPIO通知CPLD复杂可编程逻辑器件、CPU供电模块IC。进一步的,优选的结构为,所述的输入输出系统包括风扇。进一步的,优选的结构为,所述的CPLD复杂可编程逻辑器件采用MAXⅡ系列的EPM570芯片。本发明的一种实现服务器系统过热保护的设计方法和现有技术相比,有益效果如下:1、系统BMC整体监测各部件温度,实时调控风扇转速;2、具备多路保障措施,单路出故障,另外一路仍然可以实现保护系统的目的;3、当系统过热时,先进行系统降频处理,降低CPU性能,从而达到降温的目的;4、当CPU降频无效的情况下,如果仍然达到了CPU出厂设定的关机温度点时,由该方法中的CPLD或者BMC来给PCH下达关机指令,让系统直接关机;可以系统、有效地散热及过热保护,可防止系统温度持续升高带来的不良后果。附图说明附图1为温度监测模块示意图的结构示意图;附图2为系统降频实现模块的结构示意图;附图3为服务器板卡分布示意图。具体实施方式BMC(BaseboardManagementController,基板管理控制器)Server管理芯片CPLD:ComplexProgrammableLogicDevice复杂可编程逻辑器件,CPLD是系统的核心部件;PCH:Platformcontrollerhub,及Intel传统意义上的南桥;FPGA:(Field-ProgrammableGateArray),即现场可编程门阵列;PECI总线:PECI是PlatformEnvironmentControlInterface的英文缩写,即平台环境式控制接口;温度Sensor:温度传感器;CPU:中央处理器;ME:Intel管理引擎,集成在PCH中;FAN:风扇;GPIO:通用输入输出口;VRHOT_N:电源转化芯片过热指示信号;VR:电源转换芯片;MEM_HOT_C:内存过热指示信号;PROCHOT_N:CPU过热指示信号;THRMTRIP_N:系统关机信号,该信号触发后会强制系统关机;LP_S3#/S4#/S5#:PCH发出的时序信号,用来控制系统进入不同状态。实施例1:本发明提出一种服务器系统过热保护的实现方法。该服务器可以分为四大模块,包括:温度检测实现模块、系统降频实现模块、系统关机实现模块和风扇控制模块。其中,温度监测模块中包括BMC基板管理控制器,BMC基板管理控制器获取温度数据;BMC基板管理控制器获取数据后,通过风扇控制模块调整风扇转速;BMC基板管理控制器获取数据后,通过系统降频实现模块进行CPU降频;BMC基板管理控制器获取数据后,通过系统关机实现模块进行系统关机。如附图1所示,为温度监测模块。在温度监测模块中,BMC基板管理控制器是整个监测策略的核心。PCH内嵌ME模块可以通过PECI总线获取CPU温度信息,BMC基板管理控制器通过LPC总线从PCHME模块中获取各CPU温度;BMC基板管理控制器还可以外置的温度Sensor来监控各个设置温度监控点。在BMC基板管理控制器获取这些数据以后,BMC基板管理控制器就可以其风扇控制模块来调整风扇转速,从而达到将各个温度监测点及CPU温度限制在可接受范围内的目的。在BMC基板管理控制器内部需要建立如下一张表:各温度点对应散热策略如下:温度点散热策略小于降频温度点调整风扇转速,为系统散热降频温度点CPU降频关机温度点系统关机其中,当获取的温度数据小于制定的降频温度点时,BMC基板管理控制器可以控制调整风扇的转速,从而实现为系统散热;当获取的温度数据等于制定的降频温度点时,BMC基板管理控制器可以控制CPU降频,从而实现为系统散热;当获取的温度数据等于制定的关机温度点时,BMC基板管理控制器可以控制系统关机,从而保护整个系统。所述的温度检测模块,包括两部分,PCH南桥内嵌ME模块通过PECI总线获取CPU温度信息;BMC基板管理控制器通过LPC总线从PCH南桥的ME模块中获取CPU温度,具体实施方式为,在温度监控点设置温度传感器,以实现BMC基板管理控制器通过温度传感器监控温度监控点。系统降频实现模块:如附图2所示,为系统降频实现模块。当系统温度达到BMC基板管理控制器设定的降频温度点时,BMC基板管理控制器通过GPIO通用输入输出口通知CPLD复杂可编程逻辑器件,由CPLD复杂可编程逻辑器件将CPU的MEM_HOT_C{012/345}和PROCHOT_N拉低,从而实现降频的目的。同时,CPU供电模块(VR)IC有VRHOT_N引脚,当系统功耗超过设定的功耗值以后触发VRHOT_N这个信号,同样将MEM_HOT_C{012/345}和PROCHOT_N拉低,实现降频的目的。如附图3所示,为系统关机实现模块图。在该模块中,有如下3个部分构成:关机指令发出模块:CPU,设定一临界温度值,当CPU温度上升到这个温度点的时候,就会触发THRMTRIP_N信号。关机指令搜集及执行模块:这个模块由CPLD和BMC构成,是两个单独的控制系统,冗余设计是确保系统可以关机,避免过热照成的不可预知后果;当搜集到CPU发出的关机指令后,CPLD和BMC分别会触发THRMTIP_N给PCH。关机模块:这个模块即PCH模块,当接收到THRMTRIP_N信号后,PCH会立即执行,将时序信号中的SLP_S3#/S4#/S5#信号拉低,从而实现系统关机。一种实现服务器系统过热保护的设计方法,具体方法步骤如下:S1、包括四大模块,温度监测实现模块、风扇控制模块、系统降频实现模块及系统关机实现模块;S2、温度监测模块中包括BMC基板管理控制器,BMC基板管理控制器获取温度数据;S3、BMC基板管理控制器获取数据后,通过风扇控制模块调整风扇转速;S4、BMC基板管理控制器获取数据后,通过系统降频实现模块进行CPU降频;S5、BMC基板管理控制器获取数据后,通过系统关机实现模块进行系统关机。温度检测模块的工作方法如下:S1、PCH南桥内嵌ME模块通过PECI总线获取CPU温度信息;S2、BMC基板管理控制器通过LPC总线从PCH南桥ME模块中获取CPU温度;S3、在温度监控点设置温度传感器,以实现BMC基板管理控制器通过温度传感器监控温度监控点。BMC基板管理控制器的工作方法如下:当获取的温度数据小于制定的降频温度点时,BMC基板管理控制器可以控制调整风扇的转速,从而实现为系统散热;当获取的温度数据等于制定的降频温度点时,BMC基板管理控制器可以控制CPU降频,从而实现为系统散热;当获取的温度数据等于制定的关机温度点时,BMC基板管理控制器可以控制系统关机,从而保护整个系统。系统降频实现模块的工作方法如下:S1、当系统温度达到BMC基板管理控制器设定的降频温度点时,BMC通过GPIO通知CPLD复杂可编程逻辑器件;S2、由CPLD复杂可编程逻辑器件将CPU的MEM_HOT_C{012/345}和PROCHOT_N拉低,从而实现降频的目的;S3、CPU供电模块IC配置有VRHOT_N引脚,当系统功耗超过设定的功耗值,触发VRHOT_N这个信号;S4、由CPLD复杂可编程逻辑器件将MEM_HOT_C{012/345}和PROCHOT_N拉低,实现降频的目的。系统关机实现模块,包括关机指令发出模块、关机指令搜集及执行模块和关机模块;关机指令发出模块:设定一临界温度值,当CPU温度上升到这个温度点的时候,就会触发THRMTRIP_N信号;关机指令搜集及执行模块:这个模块由CPLD和BMC构成,是两个单独的控制系统,冗余设计是确保系统可以关机,避免过热照成的不可预知后果;当搜集到CPU发出的关机指令后,CPLD和BMC分别会触发THRMTIP_N给PCH;关机模块:这个模块即PCH模块,当接收到THRMTRIP_N信号后,PCH会立即执行,将时序信号中的SLP_S3#/S4#/S5#信号拉低,从而实现系统关机。一种服务器过热保护系统,包括温度监测实现模块、控制系统及输入输出系统,用于获取计算机系统温度的温度监测实现模块;用于传送过热信号至输入输出系统的的控制系统;所述的温度检测实现模块与控制系统相连;还包括用于执行过热保护动作的输入输出系统;温度监测实现模块中包括基板管理控制器、PCH南桥内嵌ME模块和温度传感器。所述的控制系统,包括GPIO通知CPLD复杂可编程逻辑器件、CPU供电模块IC。所述的输入输出系统包括风扇。所述的CPLD复杂可编程逻辑器件采用MAXⅡ系列的EPM570芯片。本发明提出一种服务器过热保护的实现方法,是系统BMC整体监测各部件温度,实时调控风扇转速;该方法具备多路保障措施,单路出故障,另外一路仍然可以实现保护系统的目的;当系统过热时,先进行系统降频处理,降低CPU性能,从而达到降温的目的;当CPU降频无效的情况下,如果仍然达到了CPU出厂设定的关机温度点时,由该方法中的CPLD或者BMC来给PCH下达关机指令,让系统直接关机;从而可以做到系统有效的散热及过热保护。通过上面具体实施方式,所述
技术领域
的技术人员可容易的实现本发明。但是应当理解,本发明并不限于上述的几种具体实施方式。在公开的实施方式的基础上,所述
技术领域
的技术人员可任意组合不同的技术特征,从而实现不同的技术方案。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1