用于减少热效应的方法和管理模块的制作方法

文档序号:85912阅读:338来源:国知局
专利名称:用于减少热效应的方法和管理模块的制作方法
技术领域
本公开内容总体上涉及电子系统,并且尤其涉及用于控制计算机系统中的设备阵列内的可调节(throttlable)设备的系统和方法。
背景技术
许多类型的电子设备以阵列形式组合。例如,单个刀片(blade)中心可能包括几个一个接着另一个排列的刀片服务器。电子设备操作的副产品是热量,而且因为电子设备阵列通常位于封闭区域内,所以由单个电子设备生成的热量会影响相邻的电子设备,且反之亦然。然而,许多电子设备对热量敏感,因此许多电子设备包括一个或多个风扇用来冷却这些设备。
当这些电子设备之一过热时,出现与这些设备阵列相关联的问题。过热可能是由于许多原因而导致的,但是一个设备过热的典型原因是冷却该特定设备的一个或者多个风扇出故障了。如果过热的设备是单独的,则过热可能不是严重的问题。然而,因为过热的设备处于其它发热设备阵列当中,所以过热问题加重了。一旦设备的温度升高到某一级别,则该设备可能出故障,或者在该设备内的防故障措施可能导致该设备停机。
虽然在设备阵列当中的特定设备的停机可能不是严重的问题,但是在其它情况下,如果设备正执行关键性的功能,则设备的故障(或者停机)是要避免的事件。因此,需要用于减少设备阵列中的相邻设备对特定过热设备的热效应的系统和方法。

发明内容本发明的实施例解决了与电子系统有关的技术中的缺陷,并且提供了用于减少电子设备阵列中的相邻设备对过热设备的热效应的、新颖且非显而易见的方法和系统。电子设备阵列包括设备阵列中的至少一个可调节设备,以及连接到该至少一个可调节设备的管理模块。管理模块被配置为检测过热设备的过热,检测至少一个与该过热设备相邻并且在设备阵列中的可调节设备,并且调节该至少一个可调节设备。设备阵列是刀片中心内的刀片服务器阵列,而且管理模块与所述至少一个可调节设备相分离。
在某些方面中,该至少一个可调节设备具有不同的调节等级,而且管理模块被配置为部分调节该至少一个可调节设备。该管理模块还被配置为使用增加了的调节等级重复该至少一个可调节设备的调节。管理模块还被配置为在该至少一个可调节设备已经达到最大调节之后,检测在该设备阵列中的至少一个另外的可调节设备。
将在下面的描述中阐述本发明的另外方面,而且这些方面中的某些部分将通过描述而变得明显,或者可以从本发明的实践中获知。将借助于在附加权利要求
中特别指出的单元和组合,实现和获得本发明的这些方面。应当理解上述一般说明以及下面的详细说明仅仅为示范和说明性的,而且不是对所要求保护的本发明的限制。
并入并且构成这个说明书一部分的附图举例说明了本发明的实施例,而且它连同该描述一起用来说明本发明的原理。此处说明的实施例目前是优选的,然而应当理解,本发明不局限于所示出的精确配置和手段,其中图1是根据本发明的配置的计算机系统的框图;以及图2是根据本发明的配置、说明用于减少从相邻设备到过热设备的热量的方法的流程图。
具体实施方式图1说明了电子设备12A-12E的阵列10,这些电子设备被配置为当电子设备12之一开始过热时、减少由阵列10生成的热量。通过调节没有过热的其它设备12中的至少一个来实现减少热量产生。
电子设备12不局限于特定类型。此外,电子设备12可以每个都是不同类型的设备。然而,在阵列10的某些方面中,每个电子设备12是附着于刀片中心的中平面(midplane)14的刀片服务器(在下文中,这些电子设备被称为服务器12),其中至少一个服务器12是可调节的。
在可以调节服务器12(即,减少功耗)的方式方面,可调节服务器12不受限制。例如,可以关闭服务器12中的某些部分,可以通过时钟调节将服务器12的计算部分置于低功率状态,和/或可以在服务器12可从电源中获得的电能数量方面对服务器12进行限制。
服务器12的阵列10可以包括管理模块16。管理模块16可以与服务器12相分离(如图所示),和/或管理模块16的一部分可以并入每个服务器12内。如果提供了多个管理模块16,则这些管理模块16可以相互之间进行通信,或者管理模块16可以独立地进行操作。
管理模块16进行特定服务器12B正变得过热并且需要降低温度的确定。已知有许多不同的确定特定服务器温度的方式,而且管理模块16不局限于任何可行的方式。例如,管理模块16可以采用传感器来确定在相对于服务器12的特定位置处的温度。其它示例包括读取服务器12内的CPU的温度和/或确定服务器12内的电源的温度。
一旦管理模块16做出了特定服务器12B正变得过热并且需要降低温度的确定,则管理模块16控制邻近该过热服务器12B的调节服务器12的处理。通过调节邻近该过热服务器12B的服务器12,可以减少在该过热服务器12B附近生成的热量,这可以停止或者减少在该过热服务器12B上的过热效应。
为了更显著地强调这个说明书中描述的某些功能单元的实现独立性,将这些功能单元标记为模块。例如,模块可以被实现为包含定制电路或者门阵列、诸如逻辑芯片之类的成品半导体、晶体管、或者其它分立元件的硬件电路。模块还可以用诸如现场可编程门阵列、可编程阵列逻辑、可编程逻辑设备等之类的可编程硬件设备实现。
模块还可以用由各种类型处理器执行的软件的形式实现。例如,可执行代码的标识模块可包含一个或多个计算机指令的物理或者逻辑块,它们例如可以被组织成对象、过程、或函数。虽然如此,但标识模块的可执行代码不必物理地位于一起,而是可以包含存储在不同位置中的不同指令,当这些指令逻辑地连接在一起时,就组成了模块并且实现该模块的规定目的。
可执行代码模块可以是单条指令、或者许多指令,而且甚至可以分布在几个不同代码段上、分布在不同的程序当中、并且跨越几个存储设备分布。类似地,操作数据可在模块内标识和说明,并且可以用任何适当的形式实现并且被组织在任何适当类型的数据结构内。该操作数据可以被集中为单个数据集,或者可以在包括遍及不同存储设备在内的不同位置上分布,而且可以至少部分地仅仅作为系统或者网络上的电子信号而存在。
图2说明了一个示范性处理,该处理用于减少在设备12的阵列10中相邻设备对过热设备的热效应。在某些情况下,在步骤110,该处理开始,并且在过热服务器12B已经用尽了任何可被执行用以减少由服务器12B生成的热量的自我调整动作之后,继续到步骤120。例如,如果服务器12B是可调节的,则服务器12B可以向下调节,和/或可以使服务器12B中的某些部分停机,以减少由过热服务器12B本身生成的热量。
然而,可能有这样的情况,其中可以由过热服务器12B采取的动作未能在该处理继续到步骤120之前采取。例如,虽然过热服务器12B也许能调节和/或关闭服务器12B中的某些部分,但是不期望采取这些动作,因为这样做将会损害服务器12B的关键功能。在这种情况下,例如,所期望的是其它服务器12、而不是过热服务器12B采取动作来减少所生成的热量。
在其它情况下,服务器12B本身不能采取措施来减少由过热服务器12B生成的热量,这是因为服务器12B是不可调节的。在这些情况下,该处理继续到步骤120。
在步骤130,进行是否需要采取另外的动作以减少服务器12的阵列10中相邻设备对过热服务器12B的热效应的确定。进行这个确定的方式不局限于特定的措施和/或情况。例如,可以在规定时间长度之后过热服务器已经高于特定温度后进行该确定。在某些方面中,在过热服务器12B的温度已经升高到超过规定温度之后进行这个确定。
在步骤140,在做出了需要采取另外的行动的确定之后,做出有关是否有任何相邻的可调节服务器12的确定,并且本方法在做出这个确定的方式方面不受限制。例如,可以由服务器12与过热服务器12B的相对物理邻近来定义该相邻服务器12。
另外,该确定可以考虑热量如何从一个服务器12传递到过热服务器12B。例如,在过热服务器12B周围的气流模式可以规定即使与在过热服务器12B下游的下游服务器12相比、在过热服务器12B上游的上游服务器12在物理上更加远离过热服务器12B,在过热服务器12B上游的上游服务器也被认为是“相邻”的,而在过热服务器12B下游的下游服务器12可以被认为是不相邻的。不同类型的传热示例包括产生气流(即,强制对流)和热空气上升(即,自由对流)的风扇。
如先前所述,存在许多类型的可调节服务器12,而且该方法不局限于特定类型的可调节服务器12。然而,该方法可能考虑可调节服务器12在这个特定时间上是否是可调节的。例如,服务器12在大多数情况下可能是可调节的,但是在某些情况下,相同的服务器12可能不被认为是可调节的,这是因为特定服务器12当前正执行关键的功能,而且不能在不妨碍服务器12执行关键功能的性能的情况下被调节。
使用图1所示的示例配置,服务器12A和12C可以被认为是与过热服务器12B相邻。然而,因为服务器12C不是可调节的,所以仅仅服务器12A被认为是相邻和可调节的。
在步骤150,一旦识别了一个或多个相邻的可调节服务器12A,则调节这些服务器12A,而且调节服务器12A的方式不受限制。例如,某些可调节的服务器12A可以具有不同的调节级别,而且可以存在一个以上的相邻的可调节服务器12。因此,管理模块16可以按优先次序列出调节哪个特定的相邻可调节服务器12和/或将可调节服务器12调节到什么级别。例如,这个优先级次序可以基于一个服务器12对于下一个服务器的相对重要性,和/或基于可从一个或者多个可调节服务器12A获得的各种调节级别中的预计成本(在性能方面)与益处(在热减少方面)的比率。然而,如果仅仅可从单个可调节服务器12A获得单个调节级别,则可以调节该可调节服务器12A而不需要任何另外的确定,而且该方法可以继续到步骤160。
在步骤160,进行是否需要另外的调节的确定,并且如果需要另外的确定,则在步骤170,进行有关是否可以由相邻的可调节服务器12A执行另外的调节的确定。如果可以执行另外的调节,则该处理返回到步骤150。进行是否需要另外的调节的确定的方式不受限制。然而,在某些方面中,如果设备温度在预定时间段之后继续上升,则进行需要另外调节的确定。
在步骤170,如果做出了相邻服务器12A已经达到最大调节的确定,则进行是否存在其它另外的可调节服务器12的确定。使用图1所示的示例配置,服务器12D和12E可以被认为是另外的可调节服务器。然后,可以在与步骤150相当的步骤190中调节这些服务器12D、12E。然而,如果不存在另外的可调节服务器12,则该处理在步骤200结束。
图2所述的处理描述了当过热服务器12B的温度不停止上升时的方法。然而,该方法不局限于这种方式。当确定了过热服务器12B的温度已经停止上升和/或开始下降时,可以反向执行调节处理,以便使已经被向下调节的那些服务器12可以恢复到它们的正常操作状态。
硬件和软件的典型组合可以是具有计算机程序的通用计算机系统,当该计算机程序被加载和执行序时,其控制计算机系统以便使该系统执行此处所述的方法。本发明还可以被嵌入到计算机程序产品中,该产品包含允许实现此处所述方法的全部特征,并且当其被加载到计算机系统中时能够执行这些方法。
在当前上下文中的计算机程序或者应用是指以任何语言、代码或者符号形式的、指令集的任何表示,该指令集用于使具有信息处理性能的系统要么直接地要么在以下两个处理二者或者任一个之后执行特定的功能,这两个处理为a)转换为另一种语言、代码或者符号;b)以不同的材料形式再现。值得注意的是,这个发明可以用其它特定形式实现而没有背离其精神或者本质属性,因此,在表明本发明的范围时,应当参考所附的权利要求
书而不是上述的说明书。
权利要求
1.一种用于减少电子设备阵列中相邻设备对过热设备的热效应的管理模块,包含与该设备阵列中的至少一个可调节设备的连接,其中该管理模块被配置为检测过热设备的过热;检测与该过热设备相邻并且在该设备阵列中的至少一个可调节设备;以及调节该至少一个可调节设备。
2.如权利要求
1所述的管理模块,其中,该至少一个可调节设备具有不同的调节等级,而且该管理模块被配置为部分地调节该至少一个可调节设备。
3.如权利要求
2所述的管理模块,其中,该管理模块被配置为使用增加了的调节等级重复对该至少一个可调节设备进行调节。
4.如权利要求
1所述的管理模块,其中,该管理模块被配置为检测在该设备阵列中的至少一个另外的可调节设备。
5.如权利要求
4所述的管理模块,该管理模块被配置为,在该至少一个可调节设备已经达到最大调节之后,检测至少一个另外的可调节设备。
6.如权利要求
1所述的管理模块,其中,该设备阵列是刀片中心内的刀片服务器阵列。
7.如权利要求
1所述的管理模块,其中,该管理模块与该至少一个可调节设备相分离。
8.一种电子设备阵列,包含在该设备阵列中的至少一个可调节设备;以及管理模块,连接到该至少一个可调节设备,用于减少该电子设备阵列中相邻设备对过热设备的热效应,其中,该管理模块被配置为检测该过热设备的过热;检测与该过热设备相邻并且在该设备阵列中的至少一个可调节设备;以及调节该至少一个可调节设备。
9.如权利要求
8所述的阵列,其中,该至少一个可调节设备具有不同的调节等级,而且该管理模块被配置为部分地调节该至少一个可调节设备。
10.如权利要求
9所述的阵列,其中,该管理模块被配置为使用增加了的调节等级重复对该至少一个可调节设备进行调节。
11.如权利要求
8所述的阵列,其中,该管理模块被配置为检测在该设备阵列中的至少一个另外的可调节设备。
12.如权利要求
11所述的阵列,该管理模块被配置为,在该至少一个可调节设备已经达到最大调节之后,检测至少一个另外的可调节设备。
13.如权利要求
8所述的阵列,其中,该设备阵列是刀片中心内的刀片服务器阵列。
14.如权利要求
8所述的阵列,其中,该管理模块与该至少一个可调节设备相分离。
15.一种用于减少电子设备阵列中相邻设备对过热设备的热效应的方法,包含步骤检测在该设备阵列中的过热设备的过热;检测与该过热设备相邻并且在该设备阵列中的至少一个可调节设备;以及调节该至少一个可调节设备。
16.如权利要求
15所述的方法,其中,该至少一个可调节设备具有不同的调节等级;以及所述调节步骤部分地调节该至少一个可调节设备。
17.如权利要求
16所述的方法,还包含步骤使用增加了的调节等级重复所述调节步骤。
18.如权利要求
15所述的方法,还包含步骤检测在该设备阵列中的至少一个另外的可调节设备。
19.如权利要求
18所述的方法,其中,在该至少一个可调节设备已经达到最大调节之后,进行对至少一个另外的可调节设备的检测。
20.如权利要求
16所述的方法,其中,该设备阵列是刀片中心内的刀片服务器阵列。
专利摘要
一种电子设备阵列,包括在该设备阵列中的至少一个可调节设备以及连接到该至少一个可调节设备的管理模块,该管理模块用于减少该电子设备阵列中相邻设备对过热设备的热效应。该管理模块被配置为检测过热设备的过热,检测与该过热设备相邻并且在该设备阵列中的至少一个可调节设备,并且调节该至少一个可调节设备。该设备阵列是刀片中心内的刀片服务器阵列,而且管理模块与所述至少一个可调节设备相分离。
文档编号H05K7/20GK1991679SQ200610132178
公开日2007年7月4日 申请日期2006年10月12日
发明者基思·M.·坎贝尔, 唐纳德·E.·约翰逊, 杰弗瑞·M.·弗兰克, 布鲁克斯·约翰斯顿 申请人:国际商业机器公司导出引文BiBTeX, EndNote, RefMan
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1