一种服务器散热控制方法、装置、电子设备及存储介质与流程

文档序号:28265803发布日期:2021-12-31 18:24阅读:93来源:国知局
一种服务器散热控制方法、装置、电子设备及存储介质与流程

1.本技术涉及服务器管理技术领域,尤其涉及一种服务器散热控制方法、装置、电子设备及存储介质。


背景技术:

2.随着计算机技术的快速发展,服务器中不断出现新的产品形态,服务器功能不断增多的同时,服务器的设备功耗明显增加,设备功耗的增大势必伴随着发热量越来越大,散热成为了影响服务器性能的关键因素,不良散热条件可能会导致网卡降速、cpu降频甚至服务器宕机等各种故障。
3.在现有技术中,通常是利用基本输入输出系统(basic input output system,简称:bios)来获取服务器中各设备的信息,并传递给基板管理控制器(baseboard manager controller,简称:bmc),由bmc确定相应的散热策略。
4.但是,由于目前的服务器一般具备扩展接口,在基于其扩展接口修改服务器的配置后,若继续采用现有技术对其进行散热控制,则需要对bios和bmc进行相应的升级和兼容性调整,增加了服务器的维护成本。


技术实现要素:

5.本技术提供一种服务器散热控制方法、装置、电子设备及存储介质,以解决现有技术增加了服务器的维护成本等缺陷。
6.本技术第一个方面提供一种服务器散热控制方法,包括:
7.获取服务器的当前配置信息和当前部件温度信息;
8.根据所述当前配置信息,建立所述服务器的数字孪生模型;
9.基于所述数字孪生模型,根据所述当前部件温度信息,确定所述服务器的散热控制策略;
10.按照所述散热控制策略,向所述服务器发送散热控制指令。
11.可选的,所述基于所述数字孪生模型,根据所述当前部件温度信息,确定所述服务器的散热控制策略,包括:
12.基于所述数字孪生模型,确定所述服务器中每个部件的类型和位置;
13.根据所述当前部件温度信息和各所述部件的类型所对应的温度阈值,确定待降温部件;
14.根据所述待降温部件的位置和所述服务器的散热设备的状态信息,确定所述服务器的散热控制策略。
15.可选的,所述散热设备包括多个散热风扇,所述根据所述待降温部件的位置和所述服务器的散热设备的状态信息,确定所述服务器的散热控制策略,包括:
16.根据所述待降温部件的位置和各所述散热风扇的位置信息,从所述多个散热风扇中筛选目标散热风扇;
17.根据各所述散热风扇的当前转速和目标散热风扇,确定散热风扇转速控制策略。
18.可选的,所述根据各所述散热风扇的当前转速和目标散热风扇,确定散热风扇转速控制策略,包括:
19.确定所述目标散热风扇的转速增量;
20.根据所述各所述散热风扇的当前转速和目标散热风扇的转速增量,确定各所述散热风扇的目标转速。
21.可选的,所述按照所述散热控制策略,向所述服务器发送散热控制指令,包括:
22.生成所述散热风扇转速控制策略对应的pwm调控值;
23.将所述pwm调控值发送到服务器bmc,以利用所述服务器bmc将所述pwm调控值转发到散热设备。
24.可选的,所述数字孪生模型包括所述服务器的接口配置信息,所述方法还包括:
25.根据所述接口配置信息,对所述数字孪生模型进行配置调整。
26.可选的,所述接口配置信息包括接口类型、各类型接口的数量和接口使用状态。
27.本技术第二个方面提供一种服务器散热控制装置,包括:
28.获取模块,用于获取服务器的当前配置信息和当前部件温度信息;
29.模型建立模块,用于根据所述当前配置信息,建立所述服务器的数字孪生模型;
30.确定模块,用于基于所述数字孪生模型,根据所述当前部件温度信息,确定所述服务器的散热控制策略;
31.控制模块,用于按照所述散热控制策略,向所述服务器发送散热控制指令。
32.可选的,所述确定模块,具体用于:
33.基于所述数字孪生模型,确定所述服务器中每个部件的类型和位置;
34.根据所述当前部件温度信息和各所述部件的类型所对应的温度阈值,确定待降温部件;
35.根据所述待降温部件的位置和所述服务器的散热设备的状态信息,确定所述服务器的散热控制策略。
36.可选的,所述散热设备包括多个散热风扇,所述确定模块,具体用于:
37.根据所述待降温部件的位置和各所述散热风扇的位置信息,从所述多个散热风扇中筛选目标散热风扇;
38.根据各所述散热风扇的当前转速和目标散热风扇,确定散热风扇转速控制策略。
39.可选的,所述确定模块,具体用于:
40.确定所述目标散热风扇的转速增量;
41.根据所述各所述散热风扇的当前转速和目标散热风扇的转速增量,确定各所述散热风扇的目标转速。
42.可选的,所述控制模块,具体用于:
43.生成所述散热风扇转速控制策略对应的pwm调控值;
44.将所述pwm调控值发送到服务器bmc,以利用所述服务器bmc将所述pwm调控值转发到散热设备。
45.可选的,所述数字孪生模型包括所述服务器的接口配置信息,所述装置还包括:
46.配置模块,用于根据所述接口配置信息,对所述数字孪生模型进行配置调整。
47.可选的,所述接口配置信息包括接口类型、各类型接口的数量和接口使用状态。
48.本技术第三个方面提供一种电子设备,包括:至少一个处理器和存储器;
49.所述存储器存储计算机执行指令;
50.所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一个方面以及第一个方面各种可能的设计所述的方法。
51.本技术第四个方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一个方面以及第一个方面各种可能的设计所述的方法。
52.本技术技术方案,具有如下优点:
53.本技术提供一种服务器散热控制方法、装置、电子设备及存储介质,该方法包括:获取服务器的当前配置信息和当前部件温度信息;根据当前配置信息,建立服务器的数字孪生模型;基于数字孪生模型,根据当前部件温度信息,确定服务器的散热控制策略;按照散热控制策略,向服务器发送散热控制指令。上述方案提供的方法,通过将散热控制策略确定任务迁移到服务器外部的数字孪生模型来处理,孪生数字模型与服务器的实际配置保持一致,可以直接得到适合服务器的散热控制策略,无需再根据服务器的配置情况对服务器散热控制设备进行升级和兼容性调整,节省了服务器的维护成本。
附图说明
54.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
55.图1为本技术实施例基于的服务器散热控制系统的结构示意图;
56.图2为本技术实施例提供的服务器散热控制方法的流程示意图;
57.图3为本技术实施例提供的示例性的服务器结构示意图;
58.图4为本技术实施例提供的示例性的多配置服务器的结构示意图;
59.图5为本技术实施例提供的示例性的服务器散热控制系统的结构示意图;
60.图6为本技术实施例提供的服务器散热控制方法的整体流程示意图;
61.图7为本技术实施例提供的服务器散热控制装置的结构示意图;
62.图8为本技术实施例提供的电子设备的结构示意图。
63.通过上述附图,已示出本技术明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本技术的概念。
具体实施方式
64.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
65.此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要
性或者隐含指明所指示的技术特征的数量。在以下各实施例的描述中,“多个”的含义是两个以上,除非另有明确具体的限定。
66.在现有技术中,通常是利用基本输入输出系统(basic input output system,简称:bios)来获取服务器中各设备的信息,并传递给基板管理控制器(baseboard manager controller,简称:bmc),由bmc确定相应的散热策略。但是,由于目前的服务器一般具备扩展接口,在基于其扩展接口修改服务器的配置后,若继续采用现有技术对其进行散热控制,则需要对bios和bmc进行相应的升级和兼容性调整,增加了服务器的维护成本。
67.针对上述问题,本技术实施例提供的服务器散热控制方法、装置、电子设备及存储介质,通过获取服务器的当前配置信息和当前部件温度信息;根据当前配置信息,建立服务器的数字孪生模型;基于数字孪生模型,根据当前部件温度信息,确定服务器的散热控制策略;按照散热控制策略,向服务器发送散热控制指令。即通过将散热控制策略确定任务迁移到服务器外部的数字孪生模型来处理,孪生数字模型与服务器的实际配置保持一致,可以直接得到适合服务器的散热控制策略,无需再根据服务器的配置情况对服务器散热控制设备进行升级和兼容性调整,节省了服务器的维护成本。
68.下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明实施例进行描述。
69.首先,对本技术所基于的服务器散热控制系统的结构进行说明:
70.本技术实施例提供的服务器散热控制方法、装置、电子设备及存储介质,适用于对服务器的散热情况进行控制。如图1所示,为本技术实施例基于的服务器散热控制系统的结构示意图,主要包括服务器、数据采集装置和服务器散热控制装置。具体地,由数据采集装置采集服务器的当前配置信息和当前部件温度信息,并将采集到的数据发送到服务器散热控制装置,该装置根据得到的数据,向该服务器发送散热控制指令,以对该服务器进行相应的散热控制。
71.本技术实施例提供了一种服务器散热控制方法,用于对服务器的进行散热控制。本技术实施例的执行主体为电子设备,比如服务器、台式电脑、笔记本电脑、平板电脑及其他可用于控制服务器的电子设备。
72.如图2所示,为本技术实施例提供的服务器散热控制方法的流程示意图,该方法包括:
73.步骤201,获取服务器的当前配置信息和当前部件温度信息。
74.具体地,在对服务器进行散热控制之前,可以与服务器的bmc建立网络连接,由bmc基于系统管理总线(system management bus,简称:smbus)获取各部件温度信息。服务器的当前配置信息可以是相关技术人员手动输入的数据,主要包括该服务器部署的硬件信息,如硬件的部署接口、硬件类型、硬件型号和硬件厂商等信息。
75.步骤202,根据当前配置信息,建立服务器的数字孪生模型。
76.具体地,可以基于数字孪生技术,根据该服务器的当前配置信息,生成与该服务器当前配置相一致的数字孪生模型。
77.步骤203,基于数字孪生模型,根据当前部件温度信息,确定服务器的散热控制策略。
78.需要说明的是,由于该数字孪生模型与该服务器在物理环境下的配置情况是一样
的,因此在确定该服务器的散热控制策略时,可知直接基于该数字孪生模型,根据当前部件温度信息来确定,即在本技术实施例中,散热控制策略的确定过程是在服务器外部实现的,具体可以在云端实现,服务器bmc(服务器散热控制设备)不需要参与散热策略确定工作,也就不需要根据服务器的配置情况进行升级和兼容性调整。
79.具体地,可以基于数字孪生模型所反映的服务器配置情况,确定服务器中各部件的位置和类型等信息,然后结合服务器的当前部件温度信息,确定服务器的散热控制策略。
80.其中,散热控制策略、部件温度信息和服务器配置情况三者之间的对应关系,具体可以根据实际情况设定,本技术实施例对散热控制策略的具体制定原理不做限定。
81.步骤204,按照散热控制策略,向服务器发送散热控制指令。
82.具体地,可以按照当前得到的散热控制策略,向服务器bmc发送散热控制指令,以利用服务器bmc对服务器的散热设备进行控制,进而利用该散热设备对服务器的部件进行降温。
83.在上述实施例的基础上,由于目前的多配置服务器通常配置多大量的部件,为了实现针对性的降温控制,在提高部件降温效率的同时,节省降温操作对服务器带来的功耗,作为一种可实施的方式,在一实施例中,基于数字孪生模型,根据当前部件温度信息,确定服务器的散热控制策略,包括:
84.步骤2031,基于数字孪生模型,确定服务器中每个部件的类型和位置;
85.步骤2032,根据当前部件温度信息和各部件的类型所对应的温度阈值,确定待降温部件;
86.步骤2033,根据待降温部件的位置和服务器的散热设备的状态信息,确定服务器的散热控制策略。
87.具体地,可以根据服务器中各部件的类型、型号和厂商等信息,确定各部件的温度阈值,然后判断各部件的当前温度是否超出了其对应的温度阈值,若是,则将该部件确定为待降温部件。
88.相应地,若根据当前部件温度信息和各部件的类型所对应的温度阈值,确定当前不存在待降温部件,即当前各部件的当前温度均不超出其对应的温度阈值,则按照预设的控制周期(如5分钟),重新获取服务器的部件温度信息。
89.其中,散热设备具体可以指服务器中的散热风扇组,散热设备的状态信息具体指其包括的各散热风扇的位置和当前转速。
90.具体地,在一实施例中,散热设备包括多个散热风扇,可以根据待降温部件的位置和各散热风扇的位置信息,从多个散热风扇中筛选目标散热风扇;根据各散热风扇的当前转速和目标散热风扇,确定散热风扇转速控制策略。
91.具体地,在确定待降温部件的位置和散热设备中各散热风扇的位置的情况下,可以将离待降温部件最近的散热风扇,也就是对待降温部件影响最大的散热风扇,确定为当前的目标散热风扇,进而利用该目标散热风扇对待降温部件进行散热处理。
92.具体地,在一实施例中,可以确定目标散热风扇的转速增量;根据各散热风扇的当前转速和目标散热风扇的转速增量,确定各散热风扇的目标转速。
93.需要说明的是,散热风扇的转速增量可以根据待降温部件的当前温度与温度阈值之间的差值大小来确定,也可以固定设置,如每次增加10r/s等。
94.具体地,可以根据各散热风扇的当前转速和目标散热风扇的转速增量,估计所有散热风扇将达到的转速,主要是对目标散热风扇的转速进行增加。但是散热设备中散热风扇之间的距离并不大,即散热风扇之间的影响范围存在交集。当目标散热风扇的转速发生增加时,与其相邻的其他散热风扇可以适量减小转速,这样可以在实现对待降温部件降温的同时,保证散热设备的整体功耗变化不大。
95.其中,对于除目标散热风扇以外的散热风扇的目标转速具体如何确定,即与目标散热风扇相邻的散热风扇的转速具体减小多少,可以自主设定,例如当目标散热风扇的转速增量为10r/s时,可以控制与其相邻的散热风扇的转速减小5r/s,对于其他不相关的散热风扇可以令其保持当前转速不变。
96.在上述实施例的基础上,由于本技术实施例提供的服务器散热控制方法是可以基于云服务实现的,所生成的散热控制指令可以为数字指令,为了避免当前应用的服务器无法读取该数字类型的散热控制指令,作为一种可实施的方式,在一实施例中,按照散热控制策略,向服务器发送散热控制指令,包括:
97.步骤2041,生成散热风扇转速控制策略对应的pwm调控值;
98.步骤2042,将pwm调控值发送到服务器bmc,以利用服务器bmc将pwm调控值转发到散热设备。
99.其中,如图3所示,为本技术实施例提供的示例性的服务器结构示意图。服务器中配置有网络通信模块,用于接收pwm调控值(散热控制指令),然后将得到的pwm调控值发送到服务器bmc,由服务器bmc发送到散热设备(fan),以对散热设备进行控制。其中,本技术实施例用到的各散热风扇的当前转速具体可以基于服务器bmc通过tach信号监控服务器风扇转速信息来确定,并且,图3中的服务器bmc还通过smbus获取各部件(nvme bp/aic/ocp)的温度。
100.具体地,在一实施例中,为了可以保证数字孪生模型可以时刻与物理服务器的配置保持一致,数字孪生模型包括服务器的接口配置信息,根据接口配置信息,对数字孪生模型进行配置调整。
101.其中,接口配置信息包括接口类型、各类型接口的数量和接口使用状态。
102.需要说明的是,本技术实施例提供的服务器散热控制方法尤其适用于对如图4所示的多配置服务器进行散热控制,图4为本技术实施例提供的示例性的多配置服务器的结构示意图。该服务器的前后窗可以设计ocp网卡接口、aic卡接口和硬盘接口,并对每个接口的位置用p0

p10进行编码,可实现多种配置服务器,图中的psu0和psu1表示电源装置组件,nvme bp、aic和ocp分别表示不同的接口类型,用于承接不同的组件。
103.示例性的,若如图4所示,当前服务器包括11个接口,分别为p0

p10,若接口的使用状态为“已用”时用“1”表示,使用状态为“未用”时用“0”表示,则其当前的接口使用状态可以用编码“00011010010”表示,此时可以根据其当前的接口使用状态,为服务器制定配置增设方案,并在实际增设配置的同时,对数字孪生模型的配置进行相应的调整。
104.其中,如图5所示,为本技术实施例提供的示例性的服务器散热控制系统的结构示意图,数据处理中心可以理解为本技术实施例提供的服务器散热控制方法的执行主体,利用网络通信模块与多个服务器建立数据连接,这些服务器的配置可以不同,然后数据处理中心建立各个服务器对应的数字孪生模型,状态监控模块主要监控每个服务器的部件温度
信息,工作台为该系统提供的可视化端口,相关技术人员可以基于工作台,根据接口配置信息,调整数字孪生模型的配置。
105.示例性的,如图6所示,为本技术实施例提供的服务器散热控制方法的整体流程示意图,其中,pwm控制值没有调整代表当前散热设备中的散热风扇的转速无需调整,也就是当前没有待降温组件。如图6所示的方法是如图2所示的方法的一种示例性的实现方式,二者原理相同,在此不再赘述。
106.本技术实施例提供的服务器散热控制方法,通过获取服务器的当前配置信息和当前部件温度信息;根据当前配置信息,建立服务器的数字孪生模型;基于数字孪生模型,根据当前部件温度信息,确定服务器的散热控制策略;按照散热控制策略,向服务器发送散热控制指令。即通过将散热控制策略确定任务迁移到服务器外部的数字孪生模型来处理,孪生数字模型与服务器的实际配置保持一致,可以直接得到适合服务器的散热控制策略,无需再根据服务器的配置情况对服务器散热控制设备进行升级和兼容性调整,节省了服务器的维护成本。并且,通过按照有增有减的方式对散热设备中各散热风扇进行转速调节,实现对待降温部件降温的同时,保证散热设备的整体功耗变化不大。
107.本技术实施例提供了一种服务器散热控制装置,用于执行上述实施例提供的服务器散热控制方法。
108.如图7所示,为本技术实施例提供的服务器散热控制装置的结构示意图。该服务器散热控制装置70包括获取模块701、模型建立模块702、确定模块703和控制模块704。
109.其中,获取模块,用于获取服务器的当前配置信息和当前部件温度信息;模型建立模块,用于根据当前配置信息,建立服务器的数字孪生模型;确定模块,用于基于数字孪生模型,根据当前部件温度信息,确定服务器的散热控制策略;控制模块,用于按照散热控制策略,向服务器发送散热控制指令。
110.具体地,在一实施例中,确定模块,具体用于:
111.基于数字孪生模型,确定服务器中每个部件的类型和位置;
112.根据当前部件温度信息和各部件的类型所对应的温度阈值,确定待降温部件;
113.根据待降温部件的位置和服务器的散热设备的状态信息,确定服务器的散热控制策略。
114.具体地,在一实施例中,散热设备包括多个散热风扇,确定模块,具体用于:
115.根据待降温部件的位置和各散热风扇的位置信息,从多个散热风扇中筛选目标散热风扇;
116.根据各散热风扇的当前转速和目标散热风扇,确定散热风扇转速控制策略。
117.具体地,在一实施例中,确定模块,具体用于:
118.确定目标散热风扇的转速增量;
119.根据各散热风扇的当前转速和目标散热风扇的转速增量,确定各散热风扇的目标转速。
120.具体地,在一实施例中,控制模块,具体用于:
121.生成散热风扇转速控制策略对应的pwm调控值;
122.将pwm调控值发送到服务器bmc,以利用服务器bmc将pwm调控值转发到散热设备。
123.具体地,在一实施例中,数字孪生模型包括服务器的接口配置信息,该装置还包
括:
124.配置模块,用于根据接口配置信息,对数字孪生模型进行配置调整。
125.具体地,在一实施例中,接口配置信息包括接口类型、各类型接口的数量和接口使用状态。
126.关于本实施例中的服务器散热控制装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
127.本技术实施例提供的服务器散热控制装置,用于执行上述实施例提供的服务器散热控制方法,其实现方式与原理相同,不再赘述。
128.本技术实施例提供了一种电子设备,用于执行上述实施例提供的服务器散热控制方法。
129.如图8所示,为本技术实施例提供的电子设备的结构示意图。该电子设备80包括:至少一个处理器81和存储器82;
130.存储器存储计算机执行指令;至少一个处理器执行存储器存储的计算机执行指令,使得至少一个处理器执行如上实施例提供的服务器散热控制方法。
131.本技术实施例提供的一种电子设备,用于执行上述实施例提供的服务器散热控制方法,其实现方式与原理相同,不再赘述。
132.本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上任一实施例提供的服务器散热控制方法。
133.本技术实施例的包含计算机可执行指令的存储介质,可用于存储前述实施例中提供的服务器散热控制方法的计算机执行指令,其实现方式与原理相同,不再赘述。
134.在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
135.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
136.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
137.上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本技术各个实施例所述方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read

only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种
可以存储程序代码的介质。
138.本领域技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
139.最后应说明的是:以上各实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述各实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1