刀片服务器的散热控制系统和方法与流程

文档序号:12464011阅读:241来源:国知局
刀片服务器的散热控制系统和方法与流程

本发明涉及散热控制系统和方法,尤其涉及刀片服务器的散热控制系统和方法。



背景技术:

互联网技术正在飞速发展,作为网络的核心组成部分,服务器的性能是网络服务质量的重要指标。刀片服务器正是适应目前互联网的发展而出现的,刀片服务器所有的主板可以连接起来提供高速的网络环境,共享资源。同时,每个刀片都可内置监视器和管理工具软件,配置一台高密度服务器就可以解决一台到一百台服务器的管理问题,如果需要增加或者删除集群中的服务器,只要插入或拔出一块板即可,将维护时间减少到最小。

所谓刀片服务器是指在标准高度的机架式机箱内可插装多个卡式的服务器单元,实现高可用和高密度。每一块“刀片”实际上就是一块系统主板。它们可以通过“板载”硬盘启动自己的操作系统,类似于一个个独立的服务器,在这种模式下,每一块母板运行自己的系统,服务于指定的不同用户群,相互之间没有关联。不过,管理员可以使用系统软件将这些母板集合成一个服务器集群。在集群模式下,所有的母板可以连接起来提供高速的网络环境,并同时共享资源,为相同的用户群服务。在集群中插入新的“刀片”,就可以提高整体性能。不过,由于每块“刀片”都是热插拔的,因而系统可以轻松地进行替换,并且将维护时间减少到最小。

如前所述,由于其结构所限,刀片服务器的散热一直是个较为严重的问题。虽然始终在采取不同的手段来解决这个问题,例如在设计中采用低功耗的处理器等,但是还有待进一步优化散热效果,工程技术人员仍需探索新的散热控制手段,以获得更优良的散热效果。



技术实现要素:

本发明目的之一是提供一种刀片服务器的散热控制方法,以获得更优良的散热效果,包括对风扇系统进行精准调节,以及能够在风扇出现故障时重新调整风扇系统的有效输出。

本发明之另一目的是提供一种刀片服务器的散热控制系统,以获得更优良的散热效果,包括能够对风扇系统精准调节,以及能够在风扇出现故障时重新调整风扇系统的有效输出。

由此,本发明提供一种刀片服务器的散热控制方法,其中,所述刀片服务器包括多个计算节点、管理节点和风扇系统,所述风扇系统包含多个风扇,所述管理节点与所述计算节点以及所述管理节点所述风扇系统之间均通过管理总线相连,所述方法包括如下步骤:(a)所述管理节点根据风扇的型号绘制每个风扇的风压风量的特性曲线;(b)针对每个计算节点,所述管理节点依据该计算节点的物理位置、风扇的物理位置和风扇的特性曲线,计算出每个风扇对该计算节点的散热贡献值;(c)当某个计算节点的负载增大导致其温度升高时,所述管理节点通过所述管理总线就会得到该计算节点的负载和温度变化的信息,之后,所述管理节点依据各风扇对该计算节点的散热贡献值来按比例调节各个风扇的转速,使相关的风扇共同作用形成散热的合力,以实现相关风扇的精准调节,从而加大用于所述计算节点的风量,并且单个风扇的调节量相对地变小;以及,(d)当某个计算节点的负载减少时,所述管理节点会依据各风扇对该计算节点的散热贡献值来采取与步骤(c)相反的操作,从而减小用于所述计算节点的风量,并且单个风扇的调节量相对地变小。

作为优选方式,所述刀片服务器的散热控制方法,还包括如下步骤:当某一个风扇发生故障并得到所述管理节点的确定后,所述管理节点将重复步骤(a)和步骤(b),得到新的每个风扇对计算节点的散热贡献值,并依此进行风扇的调节控制。

作为优选方式,所述刀片服务器的散热控制方法还包括如下步骤:所述管理节点的网络传输模块将所述管理节点所获得的数据以无线传输的方式传递至操作人员的手机。

作为优选方式,所述刀片服务器的散热控制方法还包括如下步骤:当出现风扇故障,或者在散热达到散热危险阈值前,所述管理节点的报警器能够以声音和/或光的形式发出警报,以提醒操作人员及时进行处理。

本发明还提供一种刀片服务器的散热控制系统,包括:多个计算节点,所述计算节点是所述刀片服务器中的监测点;管理节点,所述管理节点是散热控制系统的控制器;以及风扇系统,所述风扇系统包含多个风扇,其中,所述管理节点与所述计算节点以及所述管理节点所述风扇系统之间均通过管理总线相连,所述管理节点通过所述管理总线从所述计算节点读取所述计算节点当前的计算负载和环境温度,也能够发送指令至所述计算节点来调节所述计算节点的负载量以控制所述计算节点的功耗,进一步控制其散热量,并且所述管理节点通过所述管理总线可以获取每个风扇的转速信息,也能够发送指令至每个风扇来调节其转速;并且,所述管理节点根据风扇的型号绘制每个风扇的风压风量的特性曲线,针对每个计算节点,所述管理节点依据该计算节点的物理位置、风扇的物理位置和风扇的特性曲线,计算出每个风扇对该计算节点的散热贡献值,并且,当某个计算节点的负载变化而导致其温度变化时,所述管理节点通过所述管理总线就会得到该计算节点的负载和温度变化的信息,之后,所述管理节点依据各风扇对该计算节点的散热贡献值来按比例调节各个风扇的转速,使相关的风扇共同作用形成散热的合力,以实现相关风扇的精准调节,从而改变用于所述计算节点的风量,并且单个风扇的调节量相对地变小。

作为优选方式,所述管理节点能够确定某一个风扇是否发生故障,如确定某一个风扇是否发生故障,则所述管理节点将重复根据风扇的型号绘制每个风扇的风压风量的特性曲线,针对每个计算节点,所述管理节点依据该计算节点的物理位置、风扇的物理位置和风扇的特性曲线,计算出每个风扇对该计算节点的散热贡献值,得到新的每个风扇对计算节点的散热贡献值,并依据各风扇对该计算节点的新的散热贡献值来按比例调节各个风扇的转速,使相关的风扇共同作用形成散热的合力,以实现相关风扇的精准调节。

作为优选方式,所述管理节点包括网络传输模块,用于将所述管理节点所获得的数据以无线传输的方式传递至操作人员的手机。

作为优选方式,所述管理节点包括报警器,当出现风扇故障,或者在散热达到散热危险阈值前,所述报警器能够以声音和/或光的形式发出警报,以提醒操作人员及时进行处理。

在刀片服务器中,每个计算节点的计算任务具有独立性,其功耗情况和发热量也具有相对的独立性,因而需要准确的散热控制方法对每个计算节点实现精确的调节,以便在提供需要的散热风量的同时减少多余的风扇功耗。

另外,刀片式服务器的密度越来越大,相同体积的设备内包含的计算节点越来越多,而与此同时,散热系统所包含的风扇个数并不是按此规律同步增加,单风扇与单计算节点之间并不存在一一对应的关系。

相比于现有技术,本发明所提供的应用于刀片服务器的散热控制系统和方法具有如下优点:

(1)当刀片服务器系统内的某个计算节点因负载变动导致温度变化时,管理节点依据相关的风扇对该计算节点的散热贡献值按比例来调节各个风扇的转速,使相关的风扇共同作用形成散热的合力,以实现对相关风扇的精准调节,避免仅仅调节单个风扇所带来的单风扇转速的过大波动;

(2)当某个风扇发生故障时,管理节点针对计算节点的散热需要,只需根据新的散热贡献值来按比例调节相关的风扇,从而能够消除因该风扇故障所带来的危险,并且能够增大了对风扇的故障容错能力。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅用于解释本实发明的构思。

图1是本发明的刀片服务器的散热控制方法的流程示意图。

图2是本发明的刀片服务器散热系统的示意图。

图3是本发明的系统正常情况下各风扇散热贡献曲线的示意图。

图4是本发明的风扇出现故障时的风扇散热贡献曲线的示意图。

具体实施方式

在下文中,将参照附图描述本发明的刀片服务器的散热控制系统和方法的实施方式。

在此记载的实施方式为本发明的特定的具体实施方式,用于说明本发明的构思,均是解释性和示例性的,不应解释为对本发明实施方式及本实用新型范围的限制。除在此记载的实施方式外,本领域技术人员还能够基于本申请权利要求书和说明书所公开的内容采用显而易见的其它技术方案,这些技术方案包括采用对在此记载的实施方式的做出任何显而易见的替换和修改的技术方案。

本说明书的附图为示意图,辅助说明本发明的构思,示意性地表示各部分的形状及其相互关系。

图1为本发明的应用于刀片服务器的散热控制方法的流程示意图,如图所示,本发明的散热控制方法包括:

管理节点通过管理总线读取数据信息;

管理节点依据所述数据信息绘制散热贡献曲线;

管理节点依据每个散热贡献曲线上各个计算节点对应的散热贡献值,按比例调节每个风扇的转速,以实现对风扇的精准调节。

图2为本发明的刀片服务器散热系统的示意图,如图2所示,刀片服务器包括管理节点、多个计算节点、以及多个风扇。所述计算节点是所述刀片服务器中的监测点,所述监测点例如是刀片服务器中的刀片,每个计算节点可以是一个刀片,也可以是两个刀片。所述管理节点是散热控制系统的控制器,该控制器包括中央处理器(CPU)。所述风扇系统包含多个风扇,用于对刀片施加冷却空气。

管理节点与计算节点之间通过管理总线相连,管理节点通过管理总线从计算节点读取其当前的计算负载和环境温度,也可发送指令至计算节点来调节其负载量以控制计算节点的功耗,进一步控制其散热量。管理节点与风扇系统的每个风扇均通过管理总线相连,管理节点通过管理总线可以获取每个风扇的转速信息,也可以发送指令至每个风扇来调节其转速。

现以12刀5风扇的刀片服务器为例,进一步说明本发明所提供的一种应用于刀片服务器的散热控制系统和方法。管理节点根据风扇的型号得到每个风扇的风压风量的特性曲线,并依据计算节点的物理位置、风扇的物理位置和风扇的风压风量特性曲线,绘制出所有风扇的散热贡献曲线如图2所示。以计算节点5为例,根据绘制的散热贡献曲线,计算出每个风扇对该计算节点的散热贡献值。

当某计算节点的负载增大导致其温度升高时,系统的管理节点通过管理总线就会得到其负载和温度变化的信息,之后管理节点依据相关的风扇对该计算节点的散热贡献值按比例来调节各个风扇的转速,使相关的风扇共同作用形成散热的合力,以实现对相关风扇的精准调节,同时单个风扇的调节量相对的变小。

当某计算节点的负载减少时,系统的管理节点依据相关的风扇对该计算节点的散热贡献值按比例来调节各个风扇的转速,使针对该计算节点的总风量减少。

管理节点通过管理总线获取并确认某一个风扇(比如风扇3)发生故障时,管理节点将会重新调整系统的散热贡献曲线,调整后的散热贡献曲线如图3所示。

仍以计算节点5为例,根据新的散热贡献曲线,计算出每个风扇对该计算节点的散热贡献值。当该计算节点的负载变动导致其温度变化时,系统的管理节点通过管理总线就会得到其负载和温度变化的信息,之后管理节点依据相关的风扇对该计算节点的散热贡献值按比例来调节各个风扇的转速,使相关的风扇共同作用形成散热的合力,以实现对风扇的故障容错和精准调节,同时单个风扇的调节量相对的变小。

此外,本发明的刀片服务器的散热控制系统的管理节点还可以包括网络传输模块以及报警器,该网络传输模块能够将管理节点所获得的数据以无线传输的方式传递到便携式操作器,例如手机,使操作人员能够更方便地操作和监控散热控制系统。

另外,当出现风扇故障,或者在达到散热危险阈值前,报警器能够以声音和/或光的形式发出警报,以提醒操作人员及时进行处理。

本发明的刀片服务器的散热控制系统和方法良好地满足刀片服务器的散热要求。在刀片服务器中,每个计算节点的计算任务具有独立性,其功耗情况和发热量也具有相对的独立性,因而需要准确的散热控制方法对每个计算节点实现精确的调节,以便在提供需要的散热风量的同时减少多余的风扇功耗。

另外,本发明的刀片服务器的散热控制系统和方法尤其适合于大密度的刀片式服务器。目前,刀片式服务器的密度越来越大,相同体积的设备内包含的计算节点越来越多,因而,散热控制问题越来越突出,本发明正以特有的方案解决了此问题。与此同时,在大密度的刀片式服务器中,散热系统所包含的风扇个数并不是按刀片的数量同步增加,单风扇与单计算节点之间并不存在一一对应的关系,即单个计算节点能被多个风扇进行散热、单个风扇能对多个计算节点进行散热,本发明的刀片服务器的散热控制系统和方法可以实现风扇的精准调节和风扇散热的故障处理。

以上对本发明的实施方式进行了说明,其目的在于解释本发明之精神。请注意,本领域技术人员可以在不脱离本发明的精神的情况下对上述各实施方式的特征进行修改和组合,因此,本发明并不限于上述各实施方式。对于本发明的刀片服务器的散热控制系统的具体特征如形状、尺寸和位置可以上述披露的特征的作用进行具体设计,这些设计均是本领域技术人员能够实现的。而且,上述披露的各技术特征并不限于已披露的与其它特征的组合,本领域技术人员还可根据发明之目的进行各技术特征之间的其它组合,以实现本发明之目的为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1