一种监控服务器主板虹吸散热器工作状态的方法、系统与流程

文档序号:31630828发布日期:2022-09-24 01:55阅读:53来源:国知局
一种监控服务器主板虹吸散热器工作状态的方法、系统与流程

1.本发明涉及服务器散热技术领域,具体涉及一种监控服务器主板虹吸散热器工作状态的方法、系统。


背景技术:

2.随着服务器性能的提升,整机功耗也越来越高,为解决功耗不断攀升带来的高温现象,服务器通常会选择转速更高的风扇和散热性能更好的散热器。其中,在主板上使用虹吸散热器替代传统的散热器就是其中一种提升散热效率的解决方案。
3.虹吸散热器主要是由蒸发器、冷凝器两部分组成,安装在主板上,其中蒸发器安装在cpu上,冷凝器安装在风扇附近。cpu工作时产生的热量将蒸发器内的工质加热,在达到工质的沸点后,工质沸腾变为气体,气体因密度和压力流到冷凝器一端,在冷凝器因较低温度凝结成液体,凝结液沿散热器内壁回流至蒸发器,完成一个热能交换过程。通过不断地进行该过程,热量通过工质的不断循环相变由cpu位置的蒸发器传递到风扇位置的冷凝器,达到给cpu降温、散热的目的。虹吸散热器内部的热能交换,凝结液沿内壁回流与蒸汽交换的过程,依赖于虹吸散热器的冷凝器与蒸发器的水平高度差(重力势能),当冷凝器与蒸发器相对水平或者略高于蒸发器时,该循环过程方可进行;当冷凝器的水平位置低于蒸发器时,凝结液无法顺利回流到蒸发器,导致虹吸散热器散热效率下降,甚至无法工作,进而导致cpu高温、服务器宕机等故障。
4.当前服务器的上架实施、运维搬迁等过程中,虹吸散热器的水平调整通常依赖于现场实施人员逐台对机柜进行水平测定、调整,效率低。在数据中心的日常运维过程中时,机柜的水平度发生了非预期变化时,机房运维人员也很难及时发现。通常要在在服务器出现一些故障表现(如高温报警、性能下降、宕机等),进行故障排查时才有可能发现,严重影响业务的稳定性。


技术实现要素:

5.虹吸散热器内部的热能交换,凝结液沿内壁回流与蒸汽交换的过程,依赖于虹吸散热器的冷凝器与蒸发器的水平高度差(重力势能),当冷凝器与蒸发器相对水平或者略高于蒸发器时,该循环过程方可进行;当冷凝器的水平位置低于蒸发器时,凝结液无法顺利回流到蒸发器,导致虹吸散热器散热效率下降,甚至无法工作,进而导致cpu高温、服务器宕机等故障。当前服务器的上架实施、运维搬迁等过程中,虹吸散热器的水平调整通常依赖于现场实施人员逐台对机柜进行水平测定、调整,效率低。在数据中心的日常运维过程中时,机柜的水平度发生了非预期变化时,机房运维人员也很难及时发现。通常要在在服务器出现一些故障表现(如高温报警、性能下降、宕机等),进行故障排查时才有可能发现,严重影响业务的稳定性的问题,本发明提供一种监控服务器主板虹吸散热器工作状态的方法、系统。
6.本发明的技术方案是:
7.第一方面,本发明技术方案提供一种监控服务器主板虹吸散热器工作状态的方
法,包括如下步骤:
8.虹吸散热器的冷凝器的侧壁设置侦测传感器并设置液位侦测点;
9.侦测传感器对冷凝器内的冷凝液深度进行实时侦测;
10.将侦测到的冷凝液深度与液位侦测点的高度进行比较,将比较结果转换成数字信号进行存储;
11.对存储的数字信号进行采样;
12.若连续设定阈值次数的采样信号显示冷凝液深度大于液位侦测点的高度时,同时冷凝液深度大于液位侦测点的高度的情况进行计时,读取服务器位置信息;服务器的位置信息包括机柜坐标和节点坐标;
13.将服务器位置信息以及异常提醒显示在bmc web页面。
14.优选地,虹吸散热器的冷凝器的侧壁设置侦测传感器的步骤中,侦测传感器数量为两个,分别设置在虹吸散热器的冷凝器的侧壁。
15.优选地,侦测传感器对冷凝器内的冷凝液深度进行实时侦测的步骤之前包括:
16.创建侦测信号存储列表。
17.优选地,将侦测到的冷凝液深度与液位侦测点的高度进行比较,将比较结果转换成数字信号进行存储的步骤包括:
18.将侦测到的冷凝液深度与液位侦测点的高度进行比较;
19.当冷凝液深度大于或等于液位侦测点的高度时,按照侦测时间将1写入侦测信号存储列表;
20.当冷凝液深度小于液位侦测点的高度时,按照侦测时间将0写入侦测信号存储列表。
21.优选地,该方法还包括:
22.若不存在连续设定阈值次数的采样信号显示冷凝液深度大于液位侦测点的高度时,输出虹吸散热器可正常工作的信息到bmc web页面。
23.优选地,将服务器的位置信息以及异常提醒显示在bmc web页面的步骤之后还包括:
24.判断是否是现场实施场景,若是,获取现场实施人员预留邮箱主动触发邮件将服务器位置信息以及异常提醒发送给现场实施人员;
25.若否,获取运维人员预留邮箱主动触发邮件将服务器位置信息以及异常提醒发送给运维人员。
26.优选地,该方法还包括:
27.现场实施人员或运维人员根据显示告警的服务器位置信息,进行人工干预,调整机柜的水平度,或者服务器节点安装的水平度,消除故障。
28.第二方面,本发明技术方案提供一种监控服务器主板虹吸散热器工作状态的系统,包括安装在服务器主板上的虹吸散热器,虹吸散热器包括蒸发器和与蒸发器连通的冷凝器;
29.虹吸散热器的冷凝器的侧壁设置有侦测传感器;
30.侦测传感器,用于对冷凝器内的冷凝液深度进行实时侦测;将侦测到的冷凝液深度与液位侦测点的高度进行比较,将比较结果转换成数字信号进行存储;
31.所述系统还包括取样单元、判断处理单元和显示单元;
32.取样单元,用于对存储的数字信号进行采样;
33.判断处理单元,用于判断若连续设定阈值次数的采样信号显示冷凝液深度大于液位侦测点的高度时,同时冷凝液深度大于液位侦测点的高度的情况进行计时,读取服务器位置信息;服务器的位置信息包括机柜坐标和节点坐标;
34.显示单元,用于将服务器位置信息、计时时间以及异常提醒显示在bmc web页面。
35.优选地,侦测传感器数量为两个,分别设置在虹吸散热器的冷凝器的侧壁。
36.优选地,所述系统还包括异常告警单元,用于判断是否是现场实施场景,若是,获取现场实施人员预留邮箱主动触发邮件将服务器位置信息以及异常提醒发送给现场实施人员;若否,获取运维人员预留邮箱主动触发邮件将服务器位置信息以及异常提醒发送给运维人员。
37.从以上技术方案可以看出,本发明具有以下优点:从机房内人工逐台测定、调整机柜的水平度,变更为通过bmc批量监控机房内服务器节点水平度,并提供需要调整的服务器节点的坐标位置、连续告警时长,也就是计时时间,较大的提升现场实施人员的工作效率、便利性。
38.此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
39.由此可见,本发明与现有技术相比,具有突出的实质性特点和显著地进步,其实施的有益效果也是显而易见的。
附图说明
40.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
41.图1是本发明一个实施例的方法的示意性流程图。
42.图2是本发明一个实施例的系统的示意性框图。
具体实施方式
43.虹吸散热器主要是由蒸发器、冷凝器两部分组成,安装在主板上,其中蒸发器安装在cpu上,冷凝器安装在风扇附近。cpu工作时产生的热量将蒸发器内的工质加热,在达到工质的沸点后,工质沸腾变为气体,气体因密度和压力流到冷凝器一端,在冷凝器因较低温度凝结成液体,凝结液沿散热器内壁回流至蒸发器,完成一个热能交换过程。通过不断地进行该过程,热量通过工质的不断循环相变由cpu位置的蒸发器传递到风扇位置的冷凝器,达到给cpu降温、散热的目的。虹吸散热器内部的热能交换,凝结液沿内壁回流与蒸汽交换的过程,依赖于虹吸散热器的冷凝器与蒸发器的水平高度差(重力势能),当冷凝器与蒸发器相对水平或者略高于蒸发器时,该循环过程方可进行;当冷凝器的水平位置低于蒸发器时,凝结液无法顺利回流到蒸发器,导致虹吸散热器散热效率下降,甚至无法工作,进而导致cpu高温、服务器宕机等故障。
44.当前服务器的上架实施、运维搬迁等过程中,虹吸散热器的水平调整通常依赖于现场实施人员逐台对机柜进行水平测定、调整,效率低。在数据中心的日常运维过程中时,
机柜的水平度发生了非预期变化时,机房运维人员也很难及时发现。通常要在在服务器出现一些故障表现(如高温报警、性能下降、宕机等),进行故障排查时才有可能发现,严重影响业务的稳定性。本发明提出一种实时监控服务器节点虹吸散热器内的冷凝液是否可顺利回流的解决方案,从机房内人工逐台测定、调整机柜的水平度,变更为通过bmc批量监控机房内服务器节点水平度,并提供需要调整的服务器节点的坐标位置、连续告警时长,较大的提升现场实施人员的工作效率、便利性。为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
45.如图1所示,本发明实施例提供一种监控服务器主板虹吸散热器工作状态的方法,包括如下步骤:
46.步骤1:虹吸散热器的冷凝器的侧壁设置侦测传感器并设置液位侦测点;
47.步骤2:侦测传感器对冷凝器内的冷凝液深度进行实时侦测;
48.步骤3:将侦测到的冷凝液深度与液位侦测点的高度进行比较,将比较结果转换成数字信号进行存储;
49.步骤4:对存储的数字信号进行采样;
50.步骤5:若连续设定阈值次数的采样信号显示冷凝液深度大于液位侦测点的高度时,同时冷凝液深度大于液位侦测点的高度的情况进行计时,读取服务器位置信息;服务器的位置信息包括机柜坐标和节点坐标;
51.步骤6:将服务器位置信息、计时时间以及异常提醒显示在bmc web页面。
52.需要说明的是,为了保证信号侦测的准确性,虹吸散热器的冷凝器的侧壁设置侦测传感器的步骤中,侦测传感器数量为两个,分别设置在虹吸散热器的冷凝器的侧壁。
53.将侦测到的冷凝液深度与液位侦测点的高度进行比较;
54.当冷凝液深度大于或等于液位侦测点的高度时,侦测信号记为1;
55.当冷凝液深度小于液位侦测点的高度时,侦测信号记为0。
56.当对冷凝液深度的连续10次取样信号都是1时,判断为冷凝器内积液深度过高,同时对积液深度过高的情况计时,读取服务器节点的位置信息,作为后续调整、运维的参考;反之,则判断正常。
57.对虹吸散热器的冷凝器的冷凝液深度,显示在bmc web页面。无异常信息时显示概览状况“服务器节点水平度正常,虹吸散热器可正常工作”。
58.积液深度过高时显示为“以下坐标服务器节点水平度异常,需立即调整”,并以有优先级方式通知到相关人员(如服务器实施场景,通知到现场实施人员预留的邮箱;正常工作场景,通知到数据中心运维人员的邮箱);反之,则显示所有机柜、所有节点的总体水平状况。
59.在虹吸散热器的冷凝器部分增加一个液位侦测点,将侦测结果作为bmc监控信号之一,当冷凝器的液位连续10次取样结果,都显示冷凝液已超出此侦测点高度时,则代表冷凝器内积液过多,无法顺利回流到蒸发器,进而说明虹吸散热器无法正常工作,服务器节点或者整机柜发生了非预期的水平度偏差,或者虹吸散热器故障,需引入人工故障排查。
60.具体过程如下:
61.(1)在服务器上架实施完成后,服务器上电开机后,进行上线前的压力测试前,此时服务器在idle状态下仅会产生少量热度,虹吸散热器内的工质处在液体状态。现场实施人员对机房上架的所有服务器节点进行统一的检查、调整;
62.(2)虹吸散热器冷凝器的侧壁分别集成2个用于侦测液体深度的侦测传感器,对冷凝器内的冷凝液深度进行实时侦测(1次/秒),当冷凝液浸过侦测传感器时,检测信号为1;冷凝液未浸过侦测传感器时,信号为0;
63.(3)当对冷凝液深度的连续10次取样信号都是1时,判断为冷凝器内积液深度过高,同时对积液深度过高的情况计时,读取服务器节点的位置信息,作为后续调整、运维的参考;反之,则判断正常;
64.(4)将虹吸散热器的冷凝器的冷凝液深度,显示在bmc web页面。无异常信息时显示概览状况“服务器节点水平度正常,虹吸散热器可正常工作”;
65.(5)积液深度过高时,也就是需要输出告警时,告警信息如表1所示,显示为“以下坐标服务器节点水平度异常,需立即调整”,并以有优先级方式通知到相关人员(如服务器实施场景,通知到现场实施人员预留的邮箱;正常工作场景,通知到数据中心运维人员的邮箱);反之,则显示所有机柜、所有节点的总体水平状况。
66.表1
67.机柜坐标节点坐标连续告警时长010120s010320s02015mins
………………ꢀꢀꢀ
68.(6)现场实施人员(或者日常工作场景下的运维人员)根据显示告警的服务器节点的坐标位置(xx机柜xx节点),进行人工干预,调整机柜的水平度,或者服务器节点安装的水平度,消除故障。
69.本发明实施例提供一种监控服务器主板虹吸散热器工作状态的方法,包括如下步骤:
70.步骤1:虹吸散热器的冷凝器的侧壁设置侦测传感器并设置液位侦测点;
71.步骤2:侦测传感器对冷凝器内的冷凝液深度进行实时侦测;
72.步骤3:将侦测到的冷凝液深度与液位侦测点的高度进行比较,将比较结果转换成数字信号进行存储;
73.步骤4:对存储的数字信号进行采样;
74.步骤5:若连续设定阈值次数的采样信号显示冷凝液深度大于液位侦测点的高度时,同时冷凝液深度大于液位侦测点的高度的情况进行计时,读取服务器位置信息;服务器的位置信息包括机柜坐标和节点坐标;
75.步骤6:将服务器位置信息、计时时间以及异常提醒显示在bmc web页面。
76.步骤7:判断是否是现场实施场景,若是,获取现场实施人员预留邮箱主动触发邮件将服务器位置信息、计时时间以及异常提醒发送给现场实施人员;若否,获取运维人员预
留邮箱主动触发邮件将服务器位置信息、计时时间以及异常提醒发送给运维人员;
77.步骤8:现场实施人员或运维人员根据显示告警的服务器位置信息,进行人工干预,调整机柜的水平度,或者服务器节点安装的水平度,消除故障。
78.需要说明的是,为了保证信号侦测的准确性,虹吸散热器的冷凝器的侧壁设置侦测传感器的步骤中,侦测传感器数量为两个,分别设置在虹吸散热器的冷凝器的侧壁。
79.侦测传感器对冷凝器内的冷凝液深度进行实时侦测的步骤之前包括:
80.创建侦测信号存储列表。
81.相应的,将侦测到的冷凝液深度与液位侦测点的高度进行比较,将比较结果转换成数字信号进行存储的步骤包括:将侦测到的冷凝液深度与液位侦测点的高度进行比较;当冷凝液深度大于或等于液位侦测点的高度时,按照侦测时间将1写入侦测信号存储列表;当冷凝液深度小于液位侦测点的高度时,按照侦测时间将0写入侦测信号存储列表。
82.相应的,该方法还包括:
83.若不存在连续设定阈值次数的采样信号显示冷凝液深度大于液位侦测点的高度时,输出虹吸散热器可正常工作的信息到bmc web页面。
84.如图2所示,本发明实施例提供一种监控服务器主板虹吸散热器工作状态的系统,包括安装在服务器主板上的虹吸散热器,虹吸散热器包括蒸发器和与蒸发器连通的冷凝器;
85.虹吸散热器的冷凝器的侧壁设置有侦测传感器;
86.侦测传感器,用于对冷凝器内的冷凝液深度进行实时侦测;将侦测到的冷凝液深度与液位侦测点的高度进行比较,将比较结果转换成数字信号进行存储;
87.所述系统还包括取样单元、判断处理单元和显示单元;
88.取样单元,用于对存储的数字信号进行采样;
89.判断处理单元,用于判断若连续设定阈值次数的采样信号显示冷凝液深度大于液位侦测点的高度时,同时冷凝液深度大于液位侦测点的高度的情况进行计时,读取服务器位置信息;服务器的位置信息包括机柜坐标和节点坐标;
90.显示单元,用于将服务器位置信息以及异常提醒显示在bmc web页面。
91.在有些实施例中,侦测传感器数量为两个,分别设置在虹吸散热器的冷凝器的侧壁。
92.在有些实施例中,所述系统还包括异常告警单元,用于判断是否是现场实施场景,若是,获取现场实施人员预留邮箱主动触发邮件将服务器位置信息以及异常提醒发送给现场实施人员;若否,获取运维人员预留邮箱主动触发邮件将服务器位置信息以及异常提醒发送给运维人员。
93.尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1