数据中心的散热方法和装置与流程

文档序号:25540376发布日期:2021-06-18 20:36
数据中心的散热方法和装置与流程

本申请涉及数据中心散热技术领域,尤其涉及一种数据中心的散热方法和装置。



背景技术:

数据中心是全球协作的特定设备网络,用来在因特网络基础设施上传递、加速、展示、计算、存储数据信息。

随着数据中心行业在全球的蓬勃发展,随着社会经济的快速增长,数据中心的发展建设将处于高速时期,而数据中心建设的高速增长导致机房内部各种设备越来越多,例如冷却系统、配电系统、电源和发电机等,为了维护数据中心的正常运行,数据中心的散热便成为了一个重要的部分,现有技术中多基于数据中心的室内温度等信息,制定数据中心的散热策略,因此不能全面准确地估计数据中心的发热量,导致散热策略的效率较低。



技术实现要素:

本申请提供了一种数据中心的散热方法和装置,可以得到提高数据中心发热量估计的全面性和准确性,从而提高散热效率的技术效果。

一方面,本申请提供了一种数据中心的散热方法,所述方法包括:

基于预设的第一发热检测模型,检测数据中心中服务器对应的服务器发热数据;

在所述数据中心中服务器上未运行虚拟机时,所述服务器发热数据对应的公式为:

在所述数据中心中服务器上运行虚拟机时,所述服务器发热数据对应的公式为:

其中,t表示服务器的运行时间,表示第一物理机发热数据,表示服务器的第一输出功率,表示服务器的第二输出功率,u表示服务器的处理器占用率,表示硅晶片发热数据,为经过实验得到的拟合常数,为硅晶片温度数据,表示液冷组件对应的发热数据,表示液体流量,表示液体的定压比热容,表示液体的密度,表示出液管道的温度,表示进液管道的温度,表示虚拟机发热数据,为虚拟机的运行结束时间,为虚拟机的运行开始时间;

基于配电设备的功率和所述配电设备的运行时间,获取所述配电设备对应的配电设备发热数据;

基于照明设备的功率和所述照明设备的运行时间,获取所述照明设备对应的照明设备发热数据;

根据所述配电设备发热数据和所述服务器发热数据,确定电源发热数据;

获取所述数据中心的变压器发热数据和所述数据中心的线路损耗发热数据;

根据所述服务器发热数据、所述电源发热数据、所述配电设备发热数据、所述照明设备发热数据、所述变压器发热数据和所述线路损耗发热数据,确定所述数据中心对应的第二发热检测模型;

基于所述第二发热检测模型,对所述数据中心的发热量进行实时检测;

根据检测得到的发热量,确定目标散热方式;

通过目标散热方式对所述数据中心进行散热;

在检测到所述数据中心的发热量大于或等于数据中心热量阈值时,发送发热预警信息。

另一方面提供了一种数据中心的散热装置,所述装置包括:第一发热数据检测模块、配电设备发热数据获取模块、照明设备发热数据获取模块、电源发热数据获取模块、设备发热数据获取模块、第二发热检测模型生成模块、数据中心发热量检测模块、目标散热方式确定模块、散热模块和预警模块;

所述第一发热数据检测模块用于基于预设的第一发热检测模型,检测数据中心中服务器对应的服务器发热数据;

在所述数据中心中服务器上未运行虚拟机时,所述服务器发热数据对应的公式为:

在所述数据中心中服务器上运行虚拟机时,所述服务器发热数据对应的公式为:

其中,t表示服务器的运行时间,表示第一物理机发热数据,表示服务器的第一输出功率,表示服务器的第二输出功率,u表示服务器的处理器占用率,表示硅晶片发热数据,为经过实验得到的拟合常数,为硅晶片温度数据,表示液冷组件对应的发热数据,表示液体流量,表示液体的定压比热容,表示液体的密度,表示出液管道的温度,表示进液管道的温度,表示虚拟机发热数据,为虚拟机的运行结束时间,为虚拟机的运行开始时间;

所述配电设备发热数据获取模块用于基于配电设备的功率和所述配电设备的运行时间,获取所述配电设备对应的配电设备发热数据;

所述照明设备发热数据获取模块用于基于照明设备的功率和所述照明设备的运行时间,获取所述照明设备对应的照明设备发热数据;

所述电源发热数据获取模块用于根据所述配电设备发热数据和所述服务器发热数据,确定电源发热数据;

所述设备发热数据获取模块用于获取所述数据中心的变压器发热数据和所述数据中心的线路损耗发热数据;

所述第二发热检测模型生成模块用于根据所述服务器发热数据、所述电源发热数据、所述配电设备发热数据、所述照明设备发热数据、所述变压器发热数据和所述线路损耗发热数据,确定所述数据中心对应的第二发热检测模型;

所述数据中心发热量检测模块用于基于所述第二发热检测模型,对所述数据中心的发热量进行实时检测;

所述目标散热方式确定模块用于根据检测得到的发热量,确定目标散热方式;

所述散热模块用于通过目标散热方式对所述数据中心进行散热;

所述预警模块用于在检测到所述数据中心的发热量大于或等于数据中心热量阈值时,发送发热预警信息。

另一方面提供了一种计算机可读存储介质,用于存储程序,所述程序被执行时实现所述的一种数据中心的散热方法。

另一方面提供了一种电子设备,所述终端设备包括处理器,所述处理器用于执行上述的一种数据中心的散热方法。

本申请提供的一种数据中心的散热方法和装置,所述方法可以基于预设的第一发热检测模型,检测数据中心中服务器对应的服务器发热数据,根据服务器发热数据、电源发热数据、配电设备发热数据、照明设备发热数据、变压器发热数据和线路损耗发热数据,确定数据中心对应的第二发热检测模型,并基于第二发热检测模型,对数据中心的发热量进行实时检测,根据检测得到的结果,制定对应的散热策略。该方法可以基于多个发热数据建立数据中心的发热检测模型,提高数据中心的发热数据检测的全面性和准确性,从而提高散热效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种数据中心的散热方法的流程图。

图2为本申请实施例提供的一种数据中心的散热方法中服务器未运行虚拟机时计算服务器发热数据的流程图。

图3为本申请实施例提供的一种数据中心的散热方法中服务器运行虚拟机时计算服务器发热数据的流程图。

图4为本申请实施例提供的一种数据中心的散热方法中确定配电设备发热数据的流程图。

图5为本申请实施例提供的一种数据中心的散热方法中确定电源发热数据的流程图。

图6为本申请实施例提供的一种数据中心的散热方法中确定人员发热数据的流程图。

图7为本申请实施例提供的一种数据中心的散热方法中基于目标散热方式对数据中心进行散热的流程图。

图8为本申请实施例提供的一种数据中心的散热方法中检测每个服务器的发热量的流程图。

图9为本申请实施例提供的一种数据中心的散热方法中检测每个区域的服务器发热量的流程图。

图10为本申请实施例提供的一种数据中心的散热装置的结构示意图。

图11为本申请实施例提供的一种用于实现本申请实施例所提供的方法的设备的硬件结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

在本申请的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。而且,术语“第一”、“第二”等适用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。

请参见图1,其显示了一种数据中心的散热方法,可应用于服务器侧,该方法包括:

s101.基于预设的第一发热检测模型,检测数据中心中服务器对应的服务器发热数据和服务器中液冷组件对应的液冷组件发热数据;

进一步地,请参见图2,生成服务器散热模型的方法还包括:

s201.获取数据中心中服务器的数目;

s202.分别获取每个服务器的第一输出功率和第二输出功率,第一输出功率为每个服务器上的处理器占用率为100%时的输出功率,第二输出功率为每个服务器上的处理器占用率为0%时的输出功率;

s203.获取每个服务器中的硅晶片温度数据;

s204.获取每个服务器的服务器运行时间;

s205.根据硅晶片温度数据和服务器运行时间,确定每个服务器的硅晶片发热数据;

s206.在服务器上未运行虚拟机的情况下,根据服务器运行时间、第一输出功率、第二输出功率和每个服务器的处理器占用率,获取每个服务器的第一物理机发热数据;

s207.获取每个服务器中液冷组件的进液管道与出液管道间的温度差;

s208.根据液冷组件中液体的定压比热容、液体的液体密度、液体的流量和温度差,获取每个服务器中液冷组件对应的发热数据;

s209.根据每个服务器的硅晶片发热数据、每个服务器中液冷组件对应的发热数据和每个服务器的第一物理机发热数据,确定每个服务器的发热模型;

s210.根据每个服务器的发热模型和服务器的数目,确定第一发热检测模型。

进一步地,每个服务器都具有对应的液冷组件,该液冷组件包括进液管道和出液管道,其中进液管道中流动的液体为经过冷却降温后的液体,出液管道中流动的液体为与服务器的组件进行过热交换后的液体,服务器散热模型为数据中心中多个服务器的散热模型组合得到的,每个服务的散热模型包括每个服务器的发热数据和每个冷却组件的发热数据。

在服务器上未运行虚拟机时,服务器的发热数据包括第一物理发热数据、硅晶片发热数据和液冷组件对应的发热数据。第一物理发热数据表征未运行虚拟机的服务器中物理机的发热数据。

获取每个服务器的服务器运行时间,该服务器运行时间可以为预设的运行周期,例如24小时,则可以计算得到24小时内服务器的发热数据。根据服务器运行时间、第一输出功率、第二输出功率和每个服务器的处理器占用率,获取每个服务器的第一物理机发热数据,其中第一输出功率为服务器负载最大时的输出功率,即服务器上的处理器占用率为100%时的输出功率,第二输出功率为服务器空载时的输出功率,即服务器上的处理器占用率为0%时的输出功率。每个服务器的处理器占用率可以为在运行时间内服务器的平均处理器占用率。计算得到第一物理机发热数据的公式可以为:

其中,表示第一物理机发热数据,表示第一输出功率,表示第二输出功率,u表示服务器的处理器占用率,t表示服务器的运行时间。

硅晶片发热数据可以根据每个服务器的硅晶片温度数据和每个服务器运行时间计算得到。其中,每个服务器的硅晶片温度数据可以为每个服务器在运行时间内的硅晶片的平均温度数据,硅晶片发热数据的计算公式为:

其中,t表示服务器的运行时间,表示硅晶片发热数据,为经过实验得到的拟合常数,为硅晶片温度数据。

液冷组件对应的发热数据可以根据液冷组件中进液管道中流动的液体的温度和出液管道中流动的液体的温度间的温度差值,以及液体的属性信息计算得到。液体的属性信息可以包括液体的定压比热容、液体密度和液体流量。液冷组件对应的发热数据的计算公式为:

其中,t表示服务器的运行时间,表示液冷组件对应的发热数据,表示液体流量,表示液体的定压比热容,表示液体的密度,表示出液管道的温度,表示进液管道的温度。其中液体流量的计算公式为:

其中,v表示液体流速,s表示进液管道和出液管道的管道横截面积。

在服务器上未运行虚拟机时,服务器的发热数据为:

其中,表示液冷组件对应的发热数据,表示硅晶片发热数据,表示第一物理机发热数据。

在一个具体的实施例中,若服务器机柜的数目为n,每个服务器机柜中服务器的数目为n,则服务器的数目m=n*n,则第一发热检测模型为:

其中,表示第一发热检测模型,第一发热检测模型为每个服务器的发热模型的中发热量的和值。

根据服务器的发热数据,可以生成服务器的发热模型,服务器的发热模型随运行时间、处理器占用率和温度差值的变化而变化,在运行时间增加或处理器占用率增加或温度差值增大的情况下,服务器的发热数据增加。在运行时间减少或处理器占用率减少或温度差值减小的情况下,服务器的发热数据减少。

数据中心中具有多个服务器,根据每个服务器的发热模型和服务器的数目,可以确定第一发热检测模型。

根据服务器的处理器占用率和硅晶片温度数据,确定第一发热检测模型,可以提高对服务器发热量估计的准确度。

进一步地,请参见图3,在服务器上运行有虚拟机时,生成服务器的散热模型的方法还包括:

s301.将运行有虚拟机的服务器作为目标服务器;

s302.分别获取目标服务器的第一输出功率和第二输出功率;

s303.获取目标服务器中的硅晶片温度数据;

s304.获取目标服务器上虚拟机对应的第一处理器内存数据、目标服务器上物理机对应的第二处理器内存数据和目标服务器的虚拟机运行时间;

s305.根据目标服务器的虚拟机运行时间、目标服务器的第一输出功率、目标服务器的第二输出功率、第一处理器内存数据和第二处理器内存数据,确定目标服务器的虚拟机发热数据;

s306.根据第一输出功率、第二输出功率、第二处理器占用率和目标服务器的服务器运行时间,确定目标服务器的第二物理机发热数据;

s307.获取目标服务器中液冷组件的进液管道与出液管道间的温度差;

s308.根据液冷组件中液体的定压比热容、液体的液体密度、液体的流量和温度差,获取目标服务器中液冷组件对应的发热数据;

s309.根据目标服务器的硅晶片发热数据、目标服务器中液冷组件对应的发热数据、虚拟机发热数据和第二物理机发热数据,确定目标服务器的发热模型。

进一步地,在服务器上运行虚拟机时,将该服务器作为目标服务器,基于目标服务器上运行的虚拟机,对目标服务器的发热模型进行调整。

在服务器上增加虚拟机后,虚拟机会占用处理器,因此处理器占用率会增加,根据增加虚拟机前物理机对应的处理器内存数据,以及增加虚拟机后虚拟机对应的处理器内存数据,可以确定在增加虚拟机后,处理器增加的占用率。服务器中增加的处理器占用率的计算公式为:

其中,表示服务器中增加的处理器占用率,表示虚拟机对应的处理器的内存数据,表示物理机对应的处理器的内存数据。

目标服务器上可能在物理机的运行时间内均同时运行虚拟机,也可能在部分物理机的运行时间内运行虚拟机,因此需要获取目标服务器的虚拟机运行时间,例如虚拟机在目标服务器上的运行时间为12:00-16:00,则虚拟机运行时间为4个小时。

根据虚拟机运行时间、目标服务器的第一输出功率、目标服务器的第二输出功率、第一处理器内存数据和第二处理器内存数据,可以确定目标服务器的虚拟机发热数据。计算虚拟机发热数据的公式如下:

其中,表示虚拟机发热数据,为虚拟机的运行结束时间,为虚拟机的运行开始时间,为目标服务器的第一输出功率,为目标服务器的第二输出功率。

根据第一输出功率、第二输出功率、第二处理器占用率和目标服务器的服务器运行时间,可以确定目标服务器的第二物理机发热数据,第二物理机发热数据表征运行虚拟机的目标服务器中物理机的发热数据。

则在服务器上运行虚拟机时,服务器的发热数据为:

其中,表示液冷组件对应的发热数据,表示硅晶片发热数据,表示第二物理机发热数据,表示虚拟机发热数据。

在一个具体的实施例中,若服务器机柜的数目为n,每个服务器机柜中服务器的数目为n,则服务器的数目m=n*n,则第一发热检测模型为:

其中,表示第一发热检测模型,第一发热检测模型为每个服务器的发热模型的中发热量的和值。

在一个具体的实施例中,在数据中心中的部分服务器上需要运行虚拟机时,根据虚拟机的运行时间和处理器利用率的变化情况,确定运行虚拟机造成的虚拟机发热数据,将虚拟机发热数据增加到服务器的发热模型中,可以得到在运行虚拟机时的服务器的发热模型。例如在数据中心中存在100个服务器,其中有50台服务器上需要运行虚拟机,则在确定第一发热检测模型时,根据每个不需要运行虚拟机的服务器的硅晶片发热数据、液冷组件对应的发热数据和第一物理机发热数据,确定不需要运行虚拟机的50台服务器对应的发热模型。

将运行虚拟机的50台服务器作为目标服务器,根据每个目标服务器的硅晶片发热数据、液冷组件对应的发热数据、虚拟机发热数据和第二物理机发热数据,确定每个目标服务器的发热模型,从而根据每个目标服务器的发热模型和每个不需要运行虚拟机的服务器的发热模型,得到第一发热检测模型。

当服务器上运行虚拟机时,根据服务器中物理机和虚拟机处理器占用率和硅晶片温度数据,确定第一发热检测模型,可以提高对服务器发热量估计的准确度。

s102.基于配电设备的功率和配电设备的运行时间,获取配电设备对应的配电设备发热数据;

进一步地,请参见图4,基于配电设备的功率和配电设备的运行时间,获取配电设备对应的配电设备发热数据包括:

s401.获取配电设备中配电线路的电压和配电线路的电阻;

s402.根据配电线路的电压、配电线路的电阻和预设的配电线路的功率因数,得到配电设备的功率;

s403.根据配电设备的功率和配电设备的运行时间,确定配电设备发热数据。

进一步地,配电设备可以为电源分配单元(powerdistributionunit,pdu),也就是机柜用电源分配插座。在数据中心中可以有多个服务器机柜,服务器机柜的数目与配电设备的数目相同,即每个服务器机柜对应一个电源分配单元。配电设备的发热数据的计算公式为:

其中,p为线路有功功率,u为配电线路的电压,r为配电线路的电阻,为配电线路输送负荷的功率因数,i为线电流。在确定线电流和配电线路的电阻的情况下,可以计算得到配电设备的发热数据。或者确定线路有功功率、配电线路的电压、配电线路的电阻、配电线路的功率因数的情况下,可以计算得到配电设备的发热数据。

在一个具体的实施例中,若服务器机柜的数目为n,则配电设备的发热数据为:

配电设备的发热数据可以包括每个服务机柜对应的配电设备的发热数据。

基于功率因数和有功功率确定配电设备的发热数据,可以提高对配电设备发热量估计的准确度。

s103.基于照明设备的功率和照明设备的运行时间,获取照明设备对应的照明设备发热数据;

进一步地,基于照明设备的功率和照明设备的运行时间,获取照明设备对应的照明设备发热数据包括:

获取照明设备的数目;

根据照明设备的数目、照明设备的功率和照明设备的使用系数,确定照明设备发热数据。

进一步地,照明设备可以包括数据中心内的灯具,获取每个照明设备的额定功率和照明设备的使用系数,计算每个照明设备的额定功率相加得到的和值,再将该和值与照明设备的使用系数相乘,可以得到照明设备发热数据。照明设备的计算公式如下:

其中,为照明设备的使用率,可以对照明设备的实际使用过程进行统计得到该使用率。为每个照明设备的额定功率,x为照明设备的数目。

s104.根据配电设备发热数据和服务器发热数据,确定电源发热数据;

进一步地,请参见图5,根据配电设备发热数据和服务器发热数据,确定电源发热数据包括:

s501.基于预设的第一参数、预设的第二参数、配电设备发热数据和服务器发热数据,确定电源空载发热数据;

s502.根据第二参数和配电设备发热数据,确定电源负载发热数据;

s503.根据电源空载发热数据和电源负载发热数据,确定电源发热数据。

进一步地,数据中心中为服务器提供电力的电源设备可以为不间断电源(uninterruptiblepowersupply,ups),是一种含有储能装置的不间断电源。可以对服务器提供不间断的电源。电源发热数据包括电源空载发热数据和电源负载发热数据。预设的第一参数为电源空载发热数据与电源发热数据间的关系,预设的第二参数为电源负载发热数据与配电设备发热数据间的关系。第一参数和第二参数可以根据数据中心的规模以及数据中心配置的电源的性能确定。

第一参数和电源发热数据的乘积可以表示为服务器发热数据与配电发热数据的和值与第一参数以及第二参数的乘积,由此可以确定电源空载发热数据。根据第二参数和配电设备发热数据的乘积,可以确定电源负载发热数据。计算公式如下:

其中,表征电源发热数据,表征电源空载时的发热数据,c为第一参数,第一参数可以设置为1%,b为第二参数,第二参数可以设置4%。

基于配电设备发热数据和服务器发热数据,确定电源发热数据,可以根据实际工况确定电源的发热数据,从而提高电源发热数据的准确性。

s105.获取数据中心的变压器发热数据和数据中心的线路损耗发热数据;

s106.根据服务器发热数据、冷却组件发热数据、电源发热数据、配电设备发热数据、照明设备发热数据、变压器发热数据和线路损耗发热数据,确定数据中心对应的第二发热检测模型;

进一步地,获取变压器发热数据和线路损耗发热数据,根据服务器发热数据、电源发热数据、配电设备发热数据、照明设备发热数据、变压器发热数据和线路损耗发热数据,可以得到数据中心对应的第二发热检测模型。计算公式为:

其中,为服务器发热数据,为照明设备发热数据,为配电设备发热数据,为电源发热数据,为变压器发热数据,为线路损耗发热数据。

根据多个发热数据,构建第二发热检测模型,可以提高对数据中心的发热数据检测的全面性和准确性。

进一步地,请参见图6,该方法还包括:

s601.在数据中心的预设范围内存在工作人员的情况下,获取工作人员数目;

s602.根据预设的个人发热量、工作人员数目和每个工作人员的工作时间,确定人员发热数据;

s603.根据服务器发热数据、电源发热数据、配电设备发热数据、照明设备发热数据、变压器发热数据、线路损耗发热数据和人员发热数据,确定数据中心对应的第二发热检测模型。

进一步地,数据中心的预设范围内可能存在工作人员,工作人员在工作时间内可能会散发热量,因此可以将工作人员的人员发热数据考虑到第二检测模型中。人员发热数据可以根据预设的个人发热量、工作人员数目以及每个工作人员的工作时间确定,计算公式如下:

其中,为预设的个人发热量,为人员发热数据,为不同的工作人员对应的工作时间。

在一个具体的实施例中,根据服务器发热数据、电源发热数据、配电设备发热数据、照明设备发热数据、变压器发热数据、线路损耗发热数据和人员发热数据,可以确定数据中心对应的第二发热检测模型。计算公式为:

其中,为服务器发热数据,为照明设备发热数据,为配电设备发热数据,为电源发热数据,为变压器发热数据,为线路损耗发热数据,为人员发热数据。

增加数据中心预设范围内的人员发热数据,可以提高对数据中心的发热数据检测的全面性和准确性,提高散热效率。

s107.基于第二发热检测模型,对数据中心的发热量进行实时检测;

s108.根据检测得到的发热量,确定目标散热方式;

s109.通过目标散热方式对数据中心进行散热;

进一步地,请参见图7,目标散热方式包括水循环散热方式,该方法还包括:

s701.基于第二发热检测模型,对数据中心的发热量进行实时检测;

s702.在检测到数据中心的发热量小于第一预设阈值时,通过水循环散热的方式对数据中心进行散热。

进一步地,液冷设备包括冷水机组、冷却塔和循环水路。根据室外温度的不同,可以采用冷水机组对循环水进行冷却的方式进行制冷,也可以不开启冷水机组,仅靠水循环过程中的温差进行自然冷却。在检测到数据中心的发热量小于第一预设阈值时,液冷设备的目标散热方式为水循环散热方式,关闭液冷设备中冷水机组的阀门,仅通过循环水路中水流循环导致的温差进行制冷。该循环水路可以为网状水路。

进一步地,请参见图7,目标散热方式包括制冷方式,方法还包括:

s703.在检测到数据中心的发热量大于或等于第一预设阈值,且数据中心的发热量小于或等于第二预设阈值时,通过部分制冷与水循环散热混合的方式对数据中心进行散热。

进一步地,在检测到数据中心的发热量大于或等于第一预设阈值,且数据中心的发热量小于或等于第二预设阈值时,液冷设备的目标散热方式可以为部分制冷与水循环散热混合的方式,根据液冷设备的实际运行工况,确定液冷设备中冷水机组的阀门开启时间,在预设的时间开启冷水机组的阀门,对数据中心进行散热。

根据不同的发热量,采用不同的目标散热方式进行散热,可以提高数据中心散热的灵活性,从而减少资源浪费,提高散热效率。

s704.在检测到数据中心的发热量大于第二预设阈值时,通过制冷的方式对数据中心进行散热,冷水机组的启动数目随数据中心的发热量的增加而增加。

进一步地,在检测到数据中心的发热量大于第二预设阈值时,液冷设备的目标散热方式为制冷方式,开启液冷设备中冷水机组的阀门,通过冷水机组对循环水路中流动的液体进行降温,以对数据中心进行散热。

在启动冷水机组时,可以先启动停机时间最长,累计运行时间最少的冷水机组。在当前运行的冷水机组负荷达到第一限值,且数据中心的降温率小于预设降温速率时,按照累计运行时间的大小,由小到大顺序开启其他冷水机组。在冷水机组的平均负载小于第二限值时,按照累计运行时间的大小,由大到小顺序关闭冷水机组。其中第一限值可以为最大负载率的90%,第二限值可以为最大负载率的45%,预设降温速率可以为2.8℃/min。

在一个具体的实施例中,可以通过划分发热量区间的方式,确定第一预设阈值和第二预设阈值。根据数据中心中发热量的历史数据,预设多个发热量区间,检测每个发热量区间的端点的发热量对应的目标散热方式,可以确定第一预设阈值和第二预设阈值,在当前的发热量达到第一预设阈值对应的发热量之前,采用水循环散热方式对数据中心进行散热,在当前的发热量在第一预设阈值对应的发热量和第二预设阈值对应的发热量之间时,采用水循环散热方式和冷水机组混合散热的方式对数据中心进行散热,在当前的发热量大于第二预设阈值对应的发热量时,采用冷水机组的方式对数据中心进行散热。根据实时采集到的数据中心的发热量,可以对第一预设阈值和第二预设阈值进行实时更新。

在一个具体的实施例中,在当前的发热量大于第二预设阈值对应的发热量后,采用冷水机组的方式对数据中心进行散热时,可以根据多个发热量数值,控制冷水机组的开启。在当前的发热量大于第二预设阈值对应的发热量,且小于第一发热量数值时,开启一个冷水机组。在当前的发热量大于第一发热量数值,且小于第二发热量阈值时,开启第二个冷水机组。在当前的发热量大于第二发热量数值且小于第三发热量阈值时,开启第三个冷水机组。发热量阈值的数目可以根据冷水机组的数目进行设置。通过设置发热量区间的方式,可以确定每个发热量数值。根据数据中心中发热量的历史数据,预设多个发热量区间,检测每个发热量区间的端点的发热量对应的冷水机组数目,可以确定每个发热量数值。

根据不同的发热量,采用不同的目标散热方式进行散热,可以提高数据中心散热的灵活性,从而减少资源浪费,提高散热效率。

进一步地,液冷设备还可以包括蓄冷罐,蓄冷罐可以在数据中心突然断电时在备用电源启动前对数据中心进行散热。蓄冷罐的蓄冷量与蓄冷时间和制冷量有关,蓄冷罐的蓄冷量计算公式为:

其中h为蓄冷时间,为制冷量,单位是kw。

蓄冷罐的蓄冷量与蓄冷罐中冷却液体的体积有关,蓄冷罐中冷却液体的体积越大,则蓄冷罐的蓄冷量越大,蓄冷罐中冷却液体的体积为:

其中,为进水与出水的温度的温差,为密度,为比热容,s为蓄冷水槽的完善度,该完善度可以取94%,为体积利用率,该体积利用率可以取95%。

在一个具体的实施例中,蓄冷罐的蓄冷模式分为闭式承压蓄冷罐蓄冷模式、开式蓄冷罐蓄冷模式和并联地下水池蓄冷模式。在一个具体的实施例中,蓄冷罐的结构可以采用瘦高型水槽结构。

在液冷设备中增加蓄冷罐结构,可以保证数据中心在断电时的散热,提高数据中心的运行稳定性。瘦高型水槽结构则可以增加蓄冷罐的完善度,提高蓄冷罐蓄冷的有效性。

s110.在检测到数据中心的发热量大于或等于数据中心热量阈值时,发送发热预警信息。

进一步地,在检测到数据中心的发热量大于或等于数据中心热量阈值时,若冷水机组已经满负荷运行,数据中心已经不能拓展散热方式时,则可以向工作人员发送发热预警信息。

在检测到数据中心的发热量大于或等于数据中心热量阈值时,也可以基于服务器的发热检测模型,对服务器的发热量进行检测,定位具有散热问题的服务器,对该服务器进行相应的处理。

进一步地,请参见图8,该方法还包括:

s801.基于每个服务器的发热检测模型,对每个服务器的发热量进行检测;

s802.将检测到的发热量大于或等于预设的服务器热量阈值的服务器确定为待处理服务器;

s803.调整待处理服务器的负载。

进一步地,基于每个服务器的发热检测模型,可以对每个服务器的发热量进行检测,构建基于每个服务器的温度预警系统。在检测到服务器的发热量大于或等于预设的服务器热量阈值时,将该服务器确定为待处理服务器,将待处理服务器上运行的业务数据转移到其他服务器上,可以降低待处理服务器上的负载。

持续对待处理服务器进行检测,若待处理服务器的发热量降低到服务器热量阈值以下,则维持该待处理服务器上的业务数据,不进行进一步地调整。若待处理服务器的发热量未降低到服务器热量阈值以下,则继续将待处理服务器上运行的业务数据转移到其他服务器上,可以降低待处理服务器上的负载。若在调整时间大于预设的时间阈值时,待处理服务器的发热量仍未降低到服务器热量阈值以下,则将待处理服务器上运行的业务数据全部转移到其他服务器上,对该待处理服务器进行断电处理,并反馈该待处理服务器的故障信息。

在一个具体的实施例中,根据服务器发热量的历史数据,预设多个发热量区间,检测每个发热量区间的端点的发热量对应的服务器工作状态信息,可以确定服务器热量阈值。根据实时采集到的服务器的发热量,可以对服务器热量阈值进行实时更新。

对每个服务器的发热量进行检测,可以定位到出现散热问题的服务器,从而维持数据中心的运行稳定性。

进一步地,请参见图9,该方法还包括:

s901.获取数据中心中服务器的分布情况;

s902.根据分布情况,确定温度均衡区域;

s903.基于温度均衡区域中每个服务器的发热检测模型,对温度均衡区域的发热量进行检测;

s904.将检测到发热量大于或等于预设的区域热量阈值的温度均衡区域确定为待处理温度均衡区域;

s905.调整待处理目标发热均衡区域中服务器的负载。

进一步地,获取数据中心中服务器的分布情况,服务器的分布情况可以为每一列服务器机柜的位置和服务器机柜中服务器的数目。根据分布情况,可以对服务器划分温度均衡区域,将一定范围内的服务器划分为同一个温度均衡区域,例如将每一列服务器机柜作为一个温度均衡区域。基于温度均衡区域中每个服务器的发热检测模型,可以确定温度均衡区域的第三发热检测模型。基于第三发热检测模型,对温度均衡区域的发热量进行检测。

在检测到温度均衡区域的发热量大于或等于预设的区域热量阈值时,将该温度均衡区域确定为待处理温度均衡区域,基于服务器热量阈值,检测待处理温度均衡区域中的服务器的发热量,确定导致待处理温度均衡区域中发热量过高的待处理服务器。

基于对发热量大于服务器热量阈值的待处理服务器的处理方法,对待处理温度均衡区域中的服务器进行处理。

在一个具体的实施例中,根据温度均衡区域中每个服务器发热量的历史数据,预设多个发热量区间,检测每个发热量区间的端点的发热量对应的区域工作状态信息,可以区域热量阈值。根据实时采集到的温度均衡区域中每个服务器发热量,可以对区域热量阈值进行实时更新。

对每个区域的发热量进行检测,再通过每个区域确定故障服务器,可以快速定位到出现散热问题的服务器,可以提高稳定预警的效率。

本申请实施例提供了一种数据中心的散热方法,该方法包括:基于预设的第一发热检测模型,检测数据中心中服务器对应的服务器发热数据,根据服务器发热数据、电源发热数据、配电设备发热数据、照明设备发热数据、变压器发热数据和线路损耗发热数据,确定数据中心对应的第二发热检测模型,并基于第二发热检测模型,对数据中心的发热量进行实时检测,根据检测得到的结果,制定对应的散热策略。该方法可以基于多个发热数据建立数据中心的发热检测模型,提高数据中心的发热数据检测的全面性和准确性,从而提高散热效率。同时该方法还可以通过温度预警方式,维持数据中心的运行稳定性,并根据分区域稳定预警的方式,提高温度预警的效率。

本申请实施例还提供了一种数据中心的散热装置,请参见图10,该装置包括:第一发热数据检测模块1001、配电设备发热数据获取模块1002、照明设备发热数据获取模块1003、电源发热数据获取模块1004、设备发热数据获取模块1005、第二发热检测模型生成模块1006、数据中心发热量检测模块1007、目标散热方式确定模块1008、散热模块1009和预警模块1010;

第一发热数据检测模块1001用于基于预设的第一发热检测模型,检测数据中心中服务器对应的服务器发热数据;

配电设备发热数据获取模块1002用于基于配电设备的功率和配电设备的运行时间,获取配电设备对应的配电设备发热数据;

照明设备发热数据获取模块1003用于基于照明设备的功率和照明设备的运行时间,获取照明设备对应的照明设备发热数据;

电源发热数据获取模块1004用于根据配电设备发热数据和服务器发热数据,确定电源发热数据;

设备发热数据获取模块1005用于获取数据中心的变压器发热数据和数据中心的线路损耗发热数据;

第二发热检测模型生成模块1006用于根据服务器发热数据、电源发热数据、配电设备发热数据、照明设备发热数据、变压器发热数据和线路损耗发热数据,确定数据中心对应的第二发热检测模型;

数据中心发热量检测模块1007用于基于第二发热检测模型,对数据中心的发热量进行实时检测;

目标散热方式确定模块1008用于根据检测得到的发热量,确定目标散热方式;

散热模块1009用于通过目标散热方式对数据中心进行散热;

预警模块1010用于在检测到数据中心的发热量大于或等于数据中心热量阈值时,发送发热预警信息。

进一步地,该装置还包括:

服务器数目获取模块,用于获取数据中心中服务器的数目;

服务器输出功率获取模块,用于分别获取每个服务器的第一输出功率和第二输出功率,第一输出功率为每个服务器上的处理器占用率为100%时的输出功率,第二输出功率为每个服务器上的处理器占用率为0%时的输出功率;

硅晶片温度数据获取模块,用于获取每个服务器中的硅晶片温度数据;

服务器运行时间获取模块,用于获取每个服务器的服务器运行时间;

硅晶片发热数据获取模块,用于根据硅晶片温度数据和服务器运行时间,确定每个服务器的硅晶片发热数据;

第一物理机发热数据获取模块,用于在服务器上未运行虚拟机的情况下,根据服务器运行时间、第一输出功率、第二输出功率和每个服务器的处理器占用率,获取每个服务器的第一物理机发热数据;

第一温度差获取模块,用于获取每个服务器中液冷组件的进液管道与出液管道间的温度差;

液冷组件发热数据获取模块,用于根据液冷组件中液体的定压比热容、液体的液体密度、液体的流量和温度差,获取每个服务器中液冷组件对应的发热数据;

服务器发热检测模块确定模块,用于根据每个服务器的硅晶片发热数据、每个服务器中液冷组件对应的发热数据和每个服务器的第一物理机发热数据,确定每个服务器的发热检测模型;

第一发热检测模型,用于根据每个服务器的发热检测模型和服务器的数目,确定第一发热检测模型。

进一步地,该装置还包括:

目标服务器确定模块,用于将运行有虚拟机的服务器作为目标服务器;

虚拟机参数确定模块,用于获取目标服务器上虚拟机对应的第一处理器内存数据、目标服务器上物理机对应的第二处理器内存数据和目标服务器的虚拟机运行时间;

虚拟机发热数据确定模块,用于根据虚拟机运行时间、目标服务器的第一输出功率、目标服务器的第二输出功率、第一处理器内存数据和第二处理器内存数据,确定目标服务器的虚拟机发热数据;

第二物理机发热数据确定模块,用于根据目标服务器的第一输出功率、目标服务器的第二输出功率、第二处理器占用率和服务器运行时间,确定目标服务器的第二物理机发热数据;

第二温度差确定模块,用于获取目标服务器中液冷组件的进液管道与出液管道间的温度差;

第二液冷组件发热数据确定模块,用于根据液冷组件中液体的定压比热容、液体的液体密度、液体的流量和温度差,获取目标服务器中液冷组件对应的发热数据;

目标服务器发热检测模型确定模块,用于根据目标服务器的硅晶片发热数据、目标服务器中液冷组件对应的发热数据、虚拟机发热数据和第二物理机发热数据,确定目标服务器的发热检测模型。

进一步地,目标散热方式包括水循环散热方式,该装置包括:

第一散热模块,用于在检测到数据中心的发热量小于第一预设阈值时,通过水循环散热的方式对数据中心进行散热。

进一步地,目标散热方式包括制冷方式,该装置还包括:

第二散热模块,用于在检测到数据中心的发热量大于第二预设阈值时,通过制冷的方式对数据中心进行散热,冷水机组的启动数目随数据中心的发热量的增加而增加。

进一步地,配电设备发热数据获取模块包括:

配电参数获取单元,用于获取配电设备中配电线路的电压和配电线路的电阻;

配电功率确定单元,用于根据配电线路的电压、配电线路的电阻和预设的配电线路的功率因数,得到配电设备的功率;

配电设备发热数据获取单元,用于根据配电设备的功率和配电设备的运行时间,确定配电设备发热数据。

进一步地,电源发热数据确定模块包括:

空载发热数据确定单元,用于基于预设的第一参数、预设的第二参数、配电设备发热数据和服务器发热数据,确定电源空载发热数据;

负载发热数据确定单元,用于根据第二参数和配电设备发热数据,确定电源负载发热数据;

电源发热数据确定单元,用于根据电源空载发热数据和电源负载发热数据,确定电源发热数据。

进一步地,该装置还包括:

服务器发热检测模块,用于基于每个服务器的发热检测模型,对每个服务器的发热量进行检测;

待处理服务器确定模块,用于将检测到的发热量大于或等于预设的服务器热量阈值的服务器确定为待处理服务器;

负载调整模块,用于调整待处理服务器的负载。

进一步地,该装置还包括:

分布情况获取模块,用于获取数据中心中服务器的分布情况;

区域划分模块,用于根据分布情况,确定温度均衡区域;

区域温度检测模块,用于基于温度均衡区域中每个服务器的发热检测模型,对温度均衡区域的发热量进行检测;

待处理区域确定模块,用于将检测到的发热量大于或等于预设的区域热量阈值的温度均衡区域确定为待处理温度均衡区域;

区域负载调整模块,用于调整待处理目标发热均衡区域中服务器的负载。

上述实施例中提供的装置可执行本申请任意实施例所提供方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本申请任意实施例所提供的一种数据中心的散热方法。

本实施例还提供了一种计算机可读存储介质,存储介质中存储有计算机可执行指令,计算机可执行指令由处理器加载并执行本实施例上述的一种数据中心的散热方法。

本实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述数据中心的散热的各种可选实现方式中提供的方法。

本实施例还提供了一种电子设备,该电子设备包括处理器和存储器,其中,存储器存储有计算机程序,计算机程序适于由处理器加载并执行本实施例上述的一种数据中心的散热方法。

设备可以为计算机终端、移动终端或服务器,设备还可以参与构成本申请实施例所提供的装置或系统。如图11所示,服务器11可以包括一个或多个处理器(图中采用第a处理器1102a、第b处理器1102b,……,第n处理器1102n来示出)(处理器可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器1104、以及用于通信功能的传输装置1106。除此以外,还可以包括:输入/输出接口(i/o接口)、网络接口、电源等。本领域普通技术人员可以理解,图11所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,服务器11还可包括比图11中所示更多或者更少的组件,或者具有与图11所示不同的配置。

应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到服务器11中的其他元件中的任意一个内。

存储器1104可用于存储应用软件的软件程序以及模块,如本申请实施例中的方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器1104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的一种基于自注意力网络的时序行为捕捉框生成方法。存储器1104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1104可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至服务器11。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置1106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器11的通信供应商提供的无线网络。在一个实例中,传输装置1106包括一个网络适配器(networkinterfacecontroller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置1106可以为射频(radiofrequency,rf)模块,其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(lcd),该液晶显示器可使得用户能够与服务器11的用户界面进行交互。

本说明书提供了如实施例或流程图的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤和顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或中断产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。

本实施例中所示出的结构,仅仅是与本申请方案相关的部分结构,并不构成对本申请方案所应用于其上的设备的限定,具体的设备可以包括比示出的更多或更少的部件,或者组合某些部件,或者具有不同的部件的布置。应当理解到,本实施例中所揭露的方法、装置等,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分仅仅为一种逻辑功能的划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元模块的间接耦合或通信连接。

基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域技术人员还可以进一步意识到,结合本说明书所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但这种实现不应认为超出本申请的范围。

以上,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

再多了解一些
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1