一种根据设备功耗智能调节风扇转速的散热方法与流程

文档序号:16780039发布日期:2019-02-01 19:03阅读:448来源:国知局
一种根据设备功耗智能调节风扇转速的散热方法与流程

本发明实施例涉及云服务器架构技术领域,具体涉及一种根据设备功耗智能调节风扇转速的散热方法。



背景技术:

随着人工智能的大力发展,服务器中不断出现新的产品形态。ai服务器单机中包含多个gpu或者大功耗的fpga卡,随着设备功耗的增加,单张pcie卡或者其他形式的设备早已超过pcie规范规定的75w,这些设备或卡大多采用外部供电以支持大功率的设备。设备功耗的增大势必伴随着发热量越来越大,服务器中支持高功耗卡的密度也越来越高,整机提供的散热瓶颈逐渐从cpu转移到这些高功耗设备上。

现有的整机散热策略一般通过参考高功耗散热设备的温度来调节风扇转速。参照图一所示,其具体调节过程为:服务器通过bmc连接i2c到风扇板,风扇板通过cpld控制风扇转速,同时bmc通过i2c与高功耗设备连接,部分高功耗设备支持i2c读取温度,bmc根据读取的高功耗设备的温度来调节风扇转速,即当高功耗设备的温度升高时,bmc通过相应的提高风扇转速来改善设备的散热。该技术的不足之处在于:一方面,bmc与高功耗设备的通路为i2c,如果有i2c通路出现错误,bmc会因获取不到设备温度而无法调节风扇转速,设备会持续过热导致系统崩溃或者烧毁;另一方面,目前有一些设备,如nvidia1080ti显卡、某些高功耗加密卡等,不支持通过i2c直接读取温度,导致bmc无法通过设备温度来智能调整风扇转速,此种情况下,需要设定风扇为较高的固定转速来保障高功耗设备的散热,这样会将大大增加整机的功耗并造成噪音污染。

基于上述现有技术存在的问题,本发明提出一种根据设备功耗智能调节风扇转速的散热方法,根据设备功耗实现风扇的智能调速,减少系统在低负载时的整机功耗。



技术实现要素:

本发明实施例提供一种根据设备功耗智能调节风扇转速的散热方法,解决服务器中的部分高功耗设备因无法通过i2c直接获取温度而导致整机无法智能调速的问题。

为解决上述技术问题,本发明公开了如下技术方案:

本发明提供的一种根据设备功耗智能调节风扇转速的散热方法,所述方法包括以下步骤:

在高功耗设备的供电路径上设置热插拔电路;

将热插拔电路中的热插拔芯片与bmc连接,热插拔芯片实时监控高功耗设备的功耗信息,并将获取的功耗信息传送至bmc;

bmc根据设备的功耗信息,拟合计算当前设备在不同功耗下保持设备温度低于设定温度点时需要的风扇转速;

根据计算所得的风扇转速数据,bmc进行风扇转速的智能调节。

基于上述方案,本方法做如下优化:

进一步的,所述bmc根据设备功耗信息拟合计算当前设备在不同功耗下的风扇转速,具体包括下述步骤:

通过负载软件给予当前设备不同百分比的负载,并在不同负载下根据环境温度测试不同风扇占空比下对应设备的热阻;

对设备在不同环境温度下的风扇占空比与热阻进行二次多项式拟合,并采用设备同占空比下的最大热阻进行拟合校正;

根据设备的热阻曲线及最大热阻曲线,进行风扇pwm与设备功耗之间的线性拟合。

进一步的,所述对设备在不同环境温度下的风扇占空比与热阻进行二次多项式拟合,环境温度分别设置为15℃以下、15~25℃、25~35℃以及35℃以上,并且

当环境温度在15℃以下时,根据20℃的热阻曲线及最大热阻曲线进行风扇pwm与设备功耗之间线性拟合;

当环境温度为15~25℃时,根据25℃的热阻曲线及最大热阻曲线进行风扇pwm与设备功耗之间的线性拟合;

当环境温度为25~35℃时,根据35℃的热阻曲线及最大热阻曲线进行风扇pwm与设备功耗之间的线性拟合;

当环境温度大于35℃时,风扇保持pwm=255,并发出报警。

如上所述的一种根据设备功耗智能调节风扇转速的散热方法,热插拔芯片与bmc通过i2c连接,热插拔芯片实时监控高功耗设备的功耗信息,并通过i2c将获取的功耗信息传送至bmc。

本申请的实施例提供的技术方案包括以下有益效果:

本申请实施例提供的根据设备功耗智能调节风扇转速的散热方法,包括在高功耗设备的供电路径上设置热插拔电路;热插拔芯片实时监控高功耗设备的功耗信息并传送至bmc;bmc根据设备的功耗信息拟合计算当前设备在不同功耗下需要的风扇转速,并根据所得风扇转速数据进行智能调节。本申请实施例的根据设备功耗智能调节风扇转速的散热方法,对于服务器中无法通过i2c直接获取温度的部分高功耗设备来说,实现了通过功耗智能调节风扇转速的功能,减少了系统在低负载时的整机功耗,并在某些条件下可通过bmc限制设备的功耗,达到负载均衡及节能的效果。

附图说明

此处的附图被并入说明书中并构成说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

图1为现有技术中bmc通过读取设备温度调节风扇转速的拓扑示意图;

图2为本申请实施例提供的一种根据设备功耗智能调节风扇转速的散热方法的拓扑示意图;

图3为本申请实施例提供的一种根据设备功耗智能调节风扇转速的散热方法的流程示意图;

图4为实施例中gpu最大热阻值随风扇占空比的变化拟合曲线图;

图5为实施例在20℃环境温度时gpu热阻值随风扇占空比的变化拟合曲线图;

图6为实施例在20℃环境温度时风扇pwm与设备功耗之间线性拟合图;

图7为实施例在25℃环境温度时gpu热阻值随风扇占空比的变化拟合曲线图;

图8为实施例在25℃环境温度时风扇pwm与设备功耗之间线性拟合图;

图9为实施例在30℃环境温度时gpu热阻值随风扇占空比的变化拟合曲线图;

图10为实施例在30℃环境温度时风扇pwm与设备功耗之间线性拟合图。

具体实施方式

为使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

图2、图3分别为本申请提供的一种根据设备功耗智能调节风扇转速的散热方法的拓扑示意图及流程示意图,由图2、图3可知,本申请的根据设备功耗智能调节风扇转速的散热方法包括以下步骤:

s1、在高功耗设备的供电路径上设置热插拔电路;

s2、将热插拔电路中的热插拔芯片与bmc连接,热插拔芯片实时监控高功耗设备的功耗信息,并将获取的功耗信息传送至bmc;

s3、bmc根据设备的功耗信息,拟合计算当前设备在不同功耗下保持设备温度低于设定温度点时需要的风扇转速;

s4、根据计算所得的风扇转速数据,bmc进行风扇转速的智能调节。

下面,具体以nvidia1080tigpu为例,完成根据其功耗来实现智能风扇转速的调整。

1)、在gpu供电的12v路径上增加热插拔电路;

2)、将热插拔电路中的热插拔芯片与bmc连接,热插拔芯片实时监控gpu的功耗信息,并将获取的功耗信息传送至bmc;

3)、通过负载软件给予gpu不同百分比的负载,并在不同负载下根据环境温度测试不同风扇占空比下对应设备的热阻,得到风扇占空比与gpu热阻的对应关系如下表一所示:

表一

4)、根据表一中的测试数据,对gpu在不同环境温度下的风扇占空比与热阻进行二次多项式拟合,在本实施例中,环境温度分别设置为15℃以下、15~25℃、25~35℃、及35℃以上几种情况。针对每种具体工况,采用同fanduty下的最大热阻进行拟合校正,最大热阻值随风扇占空比的变化拟合曲线如图4所示。

当环境温度在15℃以下时,根据20℃的热阻曲线及最大热阻曲线进行拟合,20℃环境温度下的gpu热阻曲线如图5所示,取最大值进行风扇pwm与设备功耗之间线性拟合,得到线性调速规律pwm=0.6375*p+31.875,其中p代表gpu的功耗,具体线性调速曲线如图6所示。进而得到在环境温度为15℃以下时,按照20℃测试状况进行调控的相应数据如表二所示:

表二

当环境温度在15~25℃时,根据25℃的热阻曲线及最大热阻曲线进行拟合,25℃环境温度下的gpu热阻曲线如图7所示,取最大值进行风扇pwm与设备功耗之间线性拟合,得到线性调速规律pwm=0.6219*p+47.497,其中p代表gpu的功耗,具体线性调速曲线如图8所示。进而得到在环境温度为15~25℃时,按照25℃测试状况进行调控的相应数据如表三所示:

表三

当环境温度在25~35℃时,根据30℃的热阻曲线及最大热阻曲线进行拟合,30℃环境温度下的gpu热阻曲线如图9所示,取最大值进行风扇pwm与设备功耗之间线性拟合,得到线性调速规律pwm=0.7044*p+53.763,其中p代表gpu的功耗,具体线性调速曲线如图10所示。进而得到在环境温度为25~35℃时,按照30℃测试状况进行调控的相应数据如表四所示:

表四

当环境温度大于35℃时,风扇保持pwm=255,并发出报警。

5)、根据上述计算所得的风扇调速数据,bmc做相应风扇调速策略,实现智能风扇调速功能。

以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1