改变数据处理设备的功率状态以满足冗余准则的制作方法

文档序号:6479627阅读:156来源:国知局
专利名称:改变数据处理设备的功率状态以满足冗余准则的制作方法
改变数据处理设备的功率状态以满足冗余准则
背景技术
任务关键和高可用性计算机应用(例如万维网上的政府和商业站点)经常需要高 冗余水平以便最小化由于装置故障而引起的停机时间。这不仅适用于数据处理元件(例如 处理器)、介质(包括盘和固态存储器)和通信设备(包括输入/输出设备和网络接口设 备),而且适用于诸如电源(其将电能带入计算机中)之类的能量传递设备以及诸如风扇 (其从计算机中移除热能)之类的冷却设备。例如,系统可以提供比所需更多的电源,以便 在一个发生故障的情况下,系统能够不中断地继续工作。
最小冗余仅仅解决了单个故障点。在上面的示例中,如果第二电源在第一电源被 修理或更换之前发生故障,那么整个计算机可能发生故障。在许多情况下,该中断可能罕见 得足以容忍,在其他情况下,它可能不可接受。在后一情况下,附加电源可以用来提供更多 的冗余,但是在某个时候,成本(经济和体积)超过益处。所需要的是对于给定初始冗余水 平增强正常运行时间的方式。在这里,描述了有利于理解本发明的相关技术。标记为“现有技术”的相关技术是 公认的现有技术;没有标记为“现有技术”的相关技术不是公认的现有技术。


附图描绘了本发明的实现方式/实施例,而不是本发明本身。图1为依照本发明实施例的、包括结合了冗余的计算机系统的框图和提供所述控 制的方法的流程图的组合示图。
具体实施例方式本发明提供了改变数据处理设备(DHD)的功率状态以便满足能量传递设备(ETD) 的冗余准则。例如,当由于三个或更多电源之一发生故障而损失冗余时,可以降低处理器和 其他DHD的功率状态以便即使在第二电源发生故障的情况下也可以满足功率要求。类似 地,如果环境温度增大到当前的风扇组不再冗余的程度,那么可以降低DHD功率状态以便 恢复冗余。另一方面,如果环境温度下降,那么本发明可以提供增大功率状态以交换降低的 过量冗余。计算机系统APl包括基本上相似的服务器11和12,如图1中所示。服务器11包 括数据处理部件13,所述数据处理部件包括1)处理器15,其用于依照指令程序来操纵数 据;2)计算机可读介质17,其包括主存储器、其他固态介质以及基于盘的介质,用于存储所 述程序和数据;以及3)通信设备19,其包括输入/输出设备和其他通信设备,例如网络接 口卡。此外,服务器APl包括能量传递设备20,所述能量传递设备20包括电源21和例如风 扇的冷却设备23。电源监视器25、电源控制器27和功率传感器29与电源21关联。风扇 控制器31、风扇监视器33和热传感器35与风扇23关联。电源功率状态控制器37例如依 照ACPI标准来控制数据处理部件的功率状态。功率状态控制器37响应于热和功率调节逻辑40,该逻辑分别通过电源控制器27和风扇控制器31控制电源21和风扇23的操作。逻辑40包括冗余评估器41,其依照冗余 策略43 (其是为服务器APl实施的若干管理定义策略之一)评估电源21和风扇23的冗余 水平。服务器APl包括六个电源23,但是该数量在实施例之间有所变化。电源控制器27 可以在活动状态和备用状态之间切换每个起作用的电源。通常,四个电源可以为服务器11 提供足够的功率;在这种情况下,五个可以是活动的而使一个不活动处于备用。如果一个发 生故障,那么另外四个足以继续工作,同时激活备用电源。系统操作未被中断,但是损失了 冗余。如果另一电源发生故障,那么系统操作将被中断。本发明通过降低功率状态,使得三 个电源能够提供系统的继续操作来避免该中断。电源监视器25监视电源21的“健康状况”,并且检测电源何时发生故障。功率传 感器29跟踪电源21输出的功率。功率传感器数据可以用来检测高要求情形,其中冗余可 能由于电源21上的负载的增大而损失。服务器11包括六个风扇23。风扇控制器31可以单独地接通和断开风扇,并且对 于那些接通的风扇控制风扇速度。风扇监视器33监视风扇23的健康状况以便检测故障或 受损操作。热传感器35或“温度计”跟踪内部和环境温度以用于调节风扇23的速度。热和功率调节逻辑40接收来自热传感器35的输入以用于调节风扇速度。它也从 功率传感器29接收指示服务器11的实际功耗的数据。服务器11的冗余状态的评估由逻 辑40的冗余评估器41做出。冗余评估器41负责实现冗余策略43。冗余策略43典型地由系统管理员设置。该 策略43规定希望的冗余水平以及为实现这些水平而可以采取的动作。冗余评估器41耦合 到电源监视器25和风扇监视器33以便它被告知活动的、不活动的以及发生故障的电源和 风扇的数量。此外,冗余评估器41耦合到服务器12以便实现考虑外部服务器的状态的策 略。(例如,相比于服务器12具有低冗余的情况,在服务器12具有高冗余的情况下,对于服 务器11可能需要更低的局部冗余。)一些简单的冗余策略忽略了外部服务器并且独立地处理功率和冷却。一种功率策 略是在电源发生故障的情况下降低数据处理部件的功率状态以便恢复冗余。相当的冷却策 略会是在风扇发生故障的情况下降低功率状态以便恢复冗余。更复杂的策略可以考虑诸如 其他服务器(例如服务器12)中可用的冗余和性能要求之类的因素。例如,当要求高性能 时,策略可能接受有限持续时间的低于标准的冗余。其他策略在电源冗余高时接受更低的冷却系统冗余,并且反之亦然。理由将是,故 障的特定总似然率可能是可容忍的。例如,当风扇23的冗余高时,策略可能容忍电源21的 单个故障点,因为故障的总似然率足够低,而如果电源和风扇都缺乏冗余,那么故障的变化 将会太高并且冗余将不得不恢复到这些子系统中的至少一个。另一种策略在另一个子系统 中的冗余低时放弃一个子系统中的冗余,所基于的理论是第一子系统的低冗余不是故障的 最可能原因。像这些示例所表明的,本发明提供了大范围的冗余策略。图1的下部给出了本发明的方法MEl的流程图。在方法部分MSl处,设置或选择 冗余_性能准则。该准则由冗余策略43规定。在方法部分MS2处,持续地监视风扇23和 电源21,该方法部分可以与方法MEl中的所有其他方法部分重叠。在方法部分MS3处,检测 影响冗余的某种变化。该变化可以是电源或风扇的故障。逻辑40可以通过促使功率状态控制器37实现处理器15和/或介质17和通信设备19的更低功率状态而进行响应。方法部分MS3可以涉及检测温度的变化。例如,环境温度的增加影响风扇21的冷 却功率。当由于用于冷却的空气的温度升高,视为冗余的风扇变为需要用来实现充分的冷 却以使操作继续时,可能损失冗余。在这种情况下,逻辑40可以要求降低功率状态以便恢 复冗余。类似地,环境温度的降低可以增大风扇的冷却效率,从而增大冗余。冗余策略可以 规定过量冗余水平,其当被检测时可以导致功率状态的增大以便实现更高的性能。在这个 意义上,冗余准则可以规定最大以及最小冗余水平;最大冗余水平指示何时可以通过增大 数据处理设备的功率状态水平来降低冗余。一旦在方法部分MS3处检测到影响冗余的变化,就对照在方法部分MSl建立的冗 余准则来评估得到的冗余。如果变化的条件并不满足该准则,那么可以在方法部分MS5处 改变功率状态以便满足该准则。在一种情形中,电源发生故障。系统操作不被中断,但是损失了冗余。数据处理设 备的功率状态不能足够快速地降低以便防止操作被中断。因此,在任何故障之前,功率状态 例如从PO降低到P3以便恢复冗余。如果第二故障发生,那么系统可以不被中断地继续。当 更换发生故障的电源(物理上或者通过激活备用电源)时,数据处理设备的功率状态可以 例如从P3再次升高到P0。高级配置和电源接口(ACPI)规范是1996年12月第一次发布的由HP、Intel、 Microsoft,Phoenix和Toshiba开发的开放工业标准,其定义用于硬件识别、主板以及设备 配置和功率管理的公共接口。ACPI将先前仅可用于便携式计算机的功率管理特征引入到台 式计算机和服务器。例如,可以将系统置于极低的消耗状态下;在这种状态下,诸如实时时 钟、键盘或调制解调器之类的设备可以触发“通用事件”(GPE,类似于中断)以便快速地唤 醒系统。本发明可以应用于具有足以处理至少两个与能量传递设备有关的故障的资源的 系统。典型地,三个或更多的电源以及三个或更多的风扇将是可用的,但是一些实施例需要 更少的这类部件。多计算机系统可以具有在计算机之间相互作用以使得在设置一个计算机 的冗余时可以考虑另一个计算机的冗余的策略。可以采用不同数量的风扇以及不同类型的 冷却设备(例如液体热交换器)。所公开实施例的这些和其他修改和变型由本发明提供,本 发明的范围由所附的权利要求书限定。
权利要求
一种方法,包括选择用于安装在计算机系统中的能量传递设备的冗余准则;监视所述能量传递设备以便跟踪与所述能量传递设备关联的冗余水平;检测所述能量传递设备何时未能满足所述冗余准则;以及改变所述计算机系统的一个或多个数据处理设备的一种或多种功率状态,以便满足所述准则。
2.如权利要求1所述的方法,其中所述能量传递设备包括电源和风扇。
3.如权利要求1所述的方法,其中所述检测响应于能量传递设备的故障。
4.如权利要求1所述的方法,其中所述检测涉及检测温度的变化。
5.如权利要求2所述的方法,其中所述准则独立地处理所述电源和所述风扇。
6.如权利要求1所述的方法,其中所述改变功率状态涉及降低处理器的功率状态。
7.如权利要求1所述的方法,其中所述改变功率状态涉及增大处理器的功率状态。
8.如权利要求1所述的方法,其中所述准则部分地为另一计算机系统的冗余状态的函数。
9.如权利要求1所述的方法,其中所述准则部分地为对所述处理器的要求的函数。
10.如权利要求1所述的方法,其中所述准则部分地为电源提供的实际功率的函数。
11.一种计算机系统,包括一个或多个具有能够选择的功率状态的数据处理设备; 用于选择所述数据处理设备的功率状态的功率状态控制器; 包括电源和热移除设备的能量传递设备;一个或多个用于检测所述能量传递设备何时未能满足冗余准则的监视器;以及 冗余控制逻辑,其耦合到所述监视器装置和所述处理器控制器,以用于改变所述处理 器的功率状态以便满足所述冗余准则。
12.如权利要求11所述的系统,其中所述冗余控制逻辑降低所述功率状态以便恢复冗ο
13.如权利要求11所述的系统,其中所述冗余控制逻辑增大所述功率状态以便移除过量冗余。
14.如权利要求11所述的系统,其中所述一个或多个监视器检测能量传递设备的故障。
15.如权利要求11所述的系统,其中所述监视器包括用于检测所述能量传递设备何时 由于温度升高而损失冗余的传感器。
16.如权利要求11所述的系统,其中所述数据处理设备包括用于依照指令程序操纵数 据的数据处理器。
17.如权利要求11所述的系统,其中所述准则包括用于电源和用于风扇的独立子准则。
18.如权利要求11所述的系统,其中所述准则包括用于电源和风扇的相互作用的子准则。
19.如权利要求11所述的系统,其中所述准则部分地为另一计算机系统的状态的函
20.如权利要求11所述的系统,其中所述功率状态符合ACPI标准。
全文摘要
一种计算机系统提供了响应于与能量传递设备关联的冗余的变化的检测而改变数据处理设备的功率状态。
文档编号G06F1/26GK101946224SQ200880126784
公开日2011年1月12日 申请日期2008年2月15日 优先权日2008年2月15日
发明者D·切普利斯, P·汉森 申请人:惠普开发有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1