冷却控制方法、控制器以及服务器与流程

文档序号:33343369发布日期:2023-03-04 03:01阅读:44来源:国知局
冷却控制方法、控制器以及服务器与流程

1.本技术属于服务器技术领域,尤其涉及冷却控制方法、控制器以及服务器。


背景技术:

2.为了保证服务器硬件的运行安全,服务器的冷却系统需要对服务器硬件的运行温度进行实时监测并及时进行冷却处理,避免由于服务器硬件温度过高出现运行故障。
3.为了提高冷却效率,越来越多的服务器采用冷却效率更高的浸没式液冷系统。现有技术中,为了降低配置浸没式液冷系统的成本,通常在现有的风冷系统基础上,在基板管理控制器(baseboard management contro l l er,bmc)中增加适配液冷功能的固件,在提供了风冷冷却功能的基础上,扩展了服务器冷却系统的浸没式液冷功能。
4.然而,在服务器的冷却系统由风冷散热切换至液冷降温的过程中,由于需要手动烧录不同的固件,导致服务器的冷却系统的切换过程存在操作复杂等问题,影响了切换服务器的冷却系统的工作效率。


技术实现要素:

5.本技术实施例提供了冷却控制方法、控制器以及服务器,通过根据传感器识别服务器的冷却环境,实现了自动切换服务器冷却系统类型的目的,提高了切换服务器的冷却系统的工作效率。
6.第一方面,本技术实施例提供了一种冷却控制方法,应用于服务器的基板管理控制器,所述服务器上安装有传感器,所述方法包括:
7.获取所述传感器的第一信号;
8.根据所述第一信号确定所述服务器所处的冷却环境;
9.根据所述服务器所处的冷却环境选择用于冷却所述服务器的目标进程;
10.根据所述目标进程冷却所述服务器。
11.在第一方面的一种可能的实现方式中,所述根据所述服务器所处的冷却环境选择用于冷却所述服务器的目标进程,包括:
12.若所述服务器处于液冷环境,则所述目标进程为第一进程,所述第一进程用于对所述服务器进行液冷冷却;
13.若所述服务器处于风冷环境,则所述目标进程为第二进程,所述第二进程用于对所述服务器进行风冷冷却。
14.应理解,在服务器的基板管理控制器实现的硬件管理程序中,预存了用于对服务器进行冷却的第一进程以及第二进程。其中,第一进程的程序用于对服务器进行液冷冷却,第二进程的程序用于对服务器进行风冷冷却。
15.在第一方面的一种可能的实现方式中,所述根据所述目标进程冷却所述服务器,包括:
16.当所述目标进程为所述第一进程,获取所述服务器的实时温度数据;
17.根据预设温度阈值确定所述实时温度数据对应的告警信息,并将所述告警信息发送至液冷控制器,以使所述液冷控制器根据所述告警信息进行液冷冷却。
18.应理解,液冷控制器为服务器的液冷系统的控制单元,服务器的基板管理控制器根据第一进程设定的处理流程,将实时温度数据发送至液冷控制器,由液冷控制器控制液冷系统对服务器进行液冷冷却。
19.在第一方面的一种可能的实现方式中,所述服务器的实时温度数据包括所述服务器的多个硬件器件各自对应的实时温度值,所述预设温度阈值包含多个硬件器件各自对应的温度参数,其中,每个硬件器件对应的温度参数包含多个温度区间,每个硬件器件的温度区间分别对应一个告警等级;
20.相应地,所述根据预设温度阈值确定所述实时温度数据对应的告警信息,包括:
21.根据每个硬件器件各自对应的实时温度值、以及各自对应的多个温度区间,确定每个硬件器件对应的告警等级;
22.根据所有硬件器件的告警等级确定所述告警信息;
23.所述将所述告警信息发送至液冷控制器,以使所述液冷控制器根据所述告警信息进行液冷冷却,包括:
24.将所述告警信息发送至所述液冷控制器,以使所述液冷控制器确定冷却液机柜的冷却液进口处温度与冷却液出口处温度的温度差值,并根据所述告警信息以及所述温度差值确定冷却液流速值,以及根据所述冷却液流速值调整冷却液流速,以对所述服务器进行液冷冷却。
25.应理解,不同硬件器件对应的适宜工作温度不一样,因此,每个硬件器件对应的温度参数均不同。需要进一步理解的是,在确定所有硬件器件的告警等级之后,根据所有硬件器件的告警等级中最高的告警等级生成告警信息,使得液冷控制器根据服务器硬件器件的降温需求调整冷却液流速,可满足服务器的降温需求。
26.在第一方面的一种可能的实现方式中,所述根据所述目标进程冷却所述服务器,包括:
27.当所述目标进程为所述第一进程,根据关闭指令关闭风冷系统。
28.在第一方面的一种可能的实现方式中,所述根据所述目标进程冷却所述服务器,包括:
29.当所述目标进程为所述第二进程,获取所述服务器的实时温度数据;
30.根据所述实时温度数据控制风冷系统进行风冷冷却。
31.在第一方面的一种可能的实现方式中,所述根据所述第一信号确定所述服务器所处的冷却环境,包括:
32.若所述第一信号为高电平信号,则判定所述服务器所处的冷却环境为液冷环境;
33.若所述第一信号为低电平信号,则判定所述服务器所处的冷却环境为风冷环境。
34.应理解,传感器为压力传感器,压力传感器将采集的压力信号转换为基板管理控制器的输入输出端口能够识别的高电平信号或者低电平信号。
35.第二方面,本技术实施例提供了一种冷却控制装置,包括获取模块、确定模块、选择模块以及冷却模块:
36.所述获取模块,用于获取所述传感器的第一信号;
37.所述确定模块,用于根据所述第一信号确定所述服务器所处的冷却环境;
38.所述选择模块,用于根据所述服务器所处的冷却环境选择用于冷却所述服务器的目标进程;
39.所述冷却模块,用于根据所述目标进程冷却所述服务器。
40.第三方面,本技术实施例提供了一种控制器,包含存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面的任一项所述的冷却控制方法。
41.第四方面,本技术实施例提供了一种服务器,包含传感器以及如第三方面所述的控制器;
42.所述传感器安装于所述服务器的主板上,用于识别所述服务器的冷却环境。
43.可以理解的是,上述第二方面至第四方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
44.本技术实施例与现有技术相比存在的有益效果是:通过在服务器主板中安装能够识别服务器冷却环境的传感器,使得基板管理控制器根据传感器检测的第一信号确定服务器的冷却环境,并执行冷却环境对应的目标进程,实现了液冷冷却与风冷冷却之间的自动切换,提高了服务器冷却系统的切换效率。
附图说明
45.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
46.图1是本技术实施例提供的服务器结构示意图;
47.图2是本技术实施例提供的冷却控制方法的流程示意图一;
48.图3是本技术实施例提供的冷却控制方法的流程示意图二;
49.图4是本技术实施例提供的冷却控制方法的流程示意图三;
50.图5是本技术实施例提供的冷却控制装置的结构框图;
51.图6是本技术实施例提供的控制器的结构示意图。
具体实施方式
52.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
53.应当理解,当在本技术说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
54.还应当理解,在本技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
55.如在本技术说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0056]
另外,在本技术说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0057]
在本技术说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本技术的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。
[0058]
参见图1,是本技术实施例提供的服务器结构示意图。如图1所示,本技术提供的服务器10包括基板管理控制器101、传感器102、液冷系统103以及风冷系统104,其中液冷系统103中包含液冷控制器1031。其中,传感器102安装在服务器10的主板上,用于识别服务器的冷却环境。具体的,传感器102将测量的数据转换为基板管理控制器101的输入输出端口能够识别的高电平信号或者低电平信号,使得基板管理控制器101根据高电平信号或者低电平信号识别服务器的冷却环境。
[0059]
在本技术中,基板管理控制器101根据高电平信号或者低电平信号识别服务器的冷却环境选择,根据冷却环境选择对应的冷却进程,并控制对应的冷却系统对服务器进行冷却。具体的,基板管理控制器101控制液冷系统103的液冷控制器1031执行风冷冷却过程,或者,基板管理控制器101控制风冷系统的风扇进行风冷冷却过程。
[0060]
图2是本技术实施例提供的冷却控制方法的流程示意图一。作为示例而非限定,本实施例的执行主体为图1中的基板管理控制器,本实施例此处不做特别限制。
[0061]
s201:获取传感器的第一信号。
[0062]
具体的,传感器可以为压力传感器等可用于判断液体环境的传感器,在此不做限定;例如压力传感器可用于测量服务器主板受到的压力值,并将压力值转换为第一信号。具体的,第一信号为基板管理控制器101的输入输出端口能够识别的高电平信号或者低电平信号。压力传感器可以为液压传感器。
[0063]
需要说明的是,在服务器的上电过程中,启动加载程序通过输入输出端口获取传感器的第一信号,并将第一信号传递至基板管理控制器。
[0064]
s202:根据第一信号确定服务器所处的冷却环境。
[0065]
示例性的,本技术的传感器为压力传感器。需要说明的是,当服务器处于液冷环境中时,压力传感器测量的服务器主板受到的压力值不为零,生成的第一信号为高电平信号;当服务器处于风冷环境中时,压力传感器测量的服务器主板受到的压力值为零,生成的第一信号为低电平信号。
[0066]
在本技术实施例中,若第一信号为高电平信号,则判定服务器所处的冷却环境为液冷环境;若第一信号为低电平信号,则判定服务器所处的冷却环境为风冷环境。
[0067]
s203:根据服务器所处的冷却环境选择用于冷却服务器的目标进程。
[0068]
需要说明的是,在服务器的基板管理控制器实现的硬件管理程序中,预存了用于
对服务器进行冷却的第一进程以及第二进程。具体的,第一进程用于对服务器进行液冷冷却,第二进程用于对服务器进行风冷冷却。根据服务器所处的冷却环境,选择用于冷却服务器的目标进程。在本技术实施例中,若服务器处于液冷环境,则目标进程为第一进程,第一进程用于对服务器进行液冷冷却;若服务器处于风冷环境,则目标进程为第二进程,第二进程用于对服务器进行风冷冷却。
[0069]
s204:根据目标进程冷却服务器。
[0070]
在本技术实施例中,当目标进程为第一进程时,根据第一进程中设定的流程,控制液冷系统对服务器进行液冷冷却;当目标进程为第二进程时,根据第二进程中设定的流程,控制风冷系统对服务器进行风冷冷却。
[0071]
本实施例提供的冷却控制方法,通过在服务器主板中安装能够识别服务器冷却环境的传感器,使得基板管理控制器根据传感器检测的第一信号确定服务器的冷却环境,并执行冷却环境对应的目标进程,实现了液冷冷却与风冷冷却之间的自动切换,提高了服务器冷却系统的切换效率。
[0072]
图3是本技术实施例提供的冷却控制方法的流程示意图二。在图2实施例提供的冷却控制方法的基础上,如图3所示,在s204根据目标进程冷却服务器的具体过程如下:
[0073]
s301:当目标进程为第一进程,获取服务器的实时温度数据。
[0074]
示例性的,当目标进程为第一进程时,根据第一进程中设定的处理流程,控制液冷系统对服务器进行冷却。需要说明的是,为了保证服务器的冷却效果,获取服务器的实时温度数据,根据服务器当前的实时温度调整冷却液的流速。具体的,服务器的实时温度数据包括服务器的多个硬件器件各自对应的实时温度值。例如,获取中央处理器、内存模块、芯片以及图形处理器等与服务器的运行相关的硬件器件的实时温度。
[0075]
s302:根据预设温度阈值确定实时温度数据对应的告警信息,并将告警信息发送至液冷控制器,以使液冷控制器根据告警信息进行液冷冷却。
[0076]
在本技术实施例中,预设温度阈值包含多个硬件器件各自对应的温度参数。具体的,设定每个硬件器件对应的温度参数包含多个温度区间以及不同温度区间分别对应一个告警等级,即每个硬件器件的实时温度数据分别对应一个告警等级。示例性的,每个硬件器件对应的温度区间包含正常温度区间、轻微告警温度区间、严重告警温度区间以及致命告警温度区间。例如,正常温度区间、轻微告警温度区间、严重告警温度区间以及致命告警温度区间对应的告警等级分别为正常、轻微、严重以及致命。对告警等级的紧急程度进行排序,告警等级的紧急程度从低到高为正常、轻微、严重以及致命。需要说明的是,由于不同硬件器件的运行机制不同,不同硬件器件对应的最佳运行温度不同。示例性的,中央处理器、内存模块、芯片以及图形处理器对应的温度区间以及告警等级的具体参数,如表1所示:
[0077]
表1
[0078][0079]
在本技术实施例中,根据预设温度阈值确定实时温度数据对应的告警信息的具体步骤为:根据每个硬件器件各自对应的实时温度值、以及各自对应的多个温度区间,确定每个硬件器件对应的告警等级。具体的,将中央处理器、内存模块、芯片以及图形处理器的实时温度数据与各自对应的温度区间进行匹配,确定各个硬件器件对应的告警等级。
[0080]
在本技术实施例中,在确定每个硬件器件对应的告警等级之后,根据所有硬件器件的告警等级确定告警信息。具体的,将所有硬件器件对应的告警等级中紧急程度最高的告警等级以及对应的硬件器件确定告警信息。示例性的,中央处理器、内存模块、芯片以及图形处理器对应的告警等级分别为正常、正常、轻微以及严重,则确定的告警信息中包含的告警等级为严重,需要进行冷却的硬件器件为图形处理器。示例性的,中央处理器、内存模块、芯片以及图形处理器对应的告警等级分别为正常、正常、严重以及严重,则确定的告警信息中包含的告警等级为严重,需要进行冷却的硬件器件包含芯片以及图形处理器。
[0081]
示例性的,控制液冷系统对服务器进行液冷的具体过程包括:将告警信息发送至液冷控制器,以使液冷控制器确定冷却液机柜的冷却液进口处温度与冷却液出口处温度的温度差值,并根据所述告警信息以及所述温度差值确定冷却液流速值,并根据所述冷却液流速值调整冷却液流速,对所述服务器进行液冷冷却。具体的,液冷控制器根据冷却液机柜的冷却液进口处温度传感器检测的温度以及冷却液出口处温度传感器检测的温度确定温度差值。液冷控制器根据温度差值以及告警信息对应的冷却需求,采用冷却液流速控制逻辑调整冷却液流速,对告警信息中对应的硬件器件进行液冷冷却。需要说明的是,冷却液流速控制逻辑为成熟的现有技术,在此不再赘述。
[0082]
本实施例提供的冷却控制方法,通过对不同硬件器件进行告警等级的判定,使得液冷系统的控制器能够根据告警等级进行液冷冷却,满足了服务器关键器件的冷却需求,避免由于服务器硬件温度过高出现运行故障,保证了服务器的运行安全。
[0083]
图4是本技术实施例提供的冷却控制方法的流程示意图。在图2以及图3实施例提供的冷却控制方法的基础上,如图4所示,服务器冷却过程如下:
[0084]
s401:获取传感器的第一信号。
[0085]
s4021:若第一信号为高电平信号,则判定服务器所处的冷却环境为液冷环境。
[0086]
s4031:若服务器处于液冷环境,则目标进程为第一进程,获取服务器的实时温度数据。
[0087]
s4041:根据预设温度阈值确定实时温度数据对应的告警信息,并将告警信息发送至液冷控制器,以使液冷控制器根据告警信息进行液冷冷却。
[0088]
s4051:当目标进程为第一进程,根据关闭指令关闭风冷系统。
[0089]
在本技术实施例中,s401至s4041步骤与图2实施例以及图3实施例中描述的方法以及实现的效果一致,在此不再赘述。
[0090]
s4022:若第一信号为低电平信号,则判定服务器所处的冷却环境为风冷环境。
[0091]
s4032:若服务器处于风冷环境,则目标进程为第二进程,获取服务器的实时温度数据。
[0092]
s4042:根据实时温度数据控制风冷系统进行风冷冷却。
[0093]
在本技术实施例中,基板管理控制器可以根据检测到的实时温度数据直接调整风扇的转速,控制风冷系统对服务器进行风冷冷却。
[0094]
需要说明的是,在确定服务器进行液冷冷却之后,为了避免风冷系统中的功能检测装置出现误报的情况,可进行关闭风冷系统的流程。示例性的,根据预存的关闭指令关闭风冷系统中的风扇手动、自动模式控制功能,关闭风扇所有告警功能的标志,以及关闭风扇的速度控制功能以及风扇的所有故障告警功能,避免出现误报的情况出现。
[0095]
本实施例提供的冷却控制方法,不仅通过传感器识别服务器的冷却环境,实现了自动切换服务器冷却系统类型的目的,并通过对不同硬件器件进行告警等级的判定,使得液冷系统能够根据告警等级进行液冷冷却,满足了服务器关键器件的冷却需求,以及在液冷系统对服务器进行冷却的过程中,及时关闭风冷系统功能,避免由于风冷系统的故障误判影响服务器的正常运行,保证了服务器的冷却效果。
[0096]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
[0097]
对应于上文实施例所述的冷却控制方法,图5是本技术实施例提供的冷却控制装置的结构框图,为了便于说明,仅示出了与本技术实施例相关的部分。
[0098]
参照图5,该冷却控制装置包括:获取模块501、确定模块502、选择模块503以及冷却模块504。
[0099]
所述获取模块501,用于获取所述传感器的第一信号;
[0100]
所述确定模块502,用于根据所述第一信号确定所述服务器所处的冷却环境;
[0101]
所述选择模块503,用于根据所述服务器所处的冷却环境选择用于冷却所述服务器的目标进程;
[0102]
所述冷却模块504,用于根据所述目标进程冷却所述服务器。
[0103]
需要说明的是,上述模块/单元之间的信息交互、执行过程等内容,由于与本技术方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
[0104]
另外,图5所示的冷却控制装置可以是内置于现有的终端设备内的软件单元、硬件单元、或软硬结合的单元,也可以作为独立的挂件集成到所述终端设备中,还可以作为独立的终端设备存在。
[0105]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功
memory)、电载波信号、电信信号以及软件分发介质。例如u盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
[0112]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0113]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0114]
在本技术所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0115]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0116]
以上所述实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1