改变数据处理设备的功率状态以满足冗余准则的制作方法

文档序号:8456989阅读:550来源:国知局
改变数据处理设备的功率状态以满足冗余准则的制作方法
【专利说明】改变数据处理设备的功率状态以满足冗余准则
[0001]本申请是分案申请,其母案申请的国际申请号是:PCT/US2008/054164,国际公开号是:W02009/102337 ;国际申请号是:200880126784.5,其母案申请的申请日是:2008年2月15日;其母申请的发明名称是改变数据处理设备的功率状态以满足冗余准则”。
【背景技术】
[0002]任务关键和高可用性计算机应用(例如万维网上的政府和商业站点)经常需要高冗余水平以便最小化由于装置故障而引起的停机时间。这不仅适用于数据处理元件(例如处理器)、介质(包括盘和固态存储器)和通信设备(包括输入/输出设备和网络接口设备),而且适用于诸如电源(其将电能带入计算机中)之类的能量传递设备以及诸如风扇(其从计算机中移除热能)之类的冷却设备。例如,系统可以提供比所需更多的电源,以便在一个发生故障的情况下,系统能够不中断地继续工作。
[0003]最小冗余仅仅解决了单个故障点。在上面的示例中,如果第二电源在第一电源被修理或更换之前发生故障,那么整个计算机可能发生故障。在许多情况下,该中断可能罕见得足以容忍,在其他情况下,它可能不可接受。在后一情况下,附加电源可以用来提供更多的冗余,但是在某个时候,成本(经济和体积)超过益处。所需要的是对于给定初始冗余水平增强正常运行时间的方式。
[0004]在这里,描述了有利于理解本发明的相关技术。标记为“现有技术”的相关技术是公认的现有技术;没有标记为“现有技术”的相关技术不是公认的现有技术。
【附图说明】
[0005]附图描绘了本发明的实现方式/实施例,而不是本发明本身。
[0006]图1为依照本发明实施例的、包括结合了冗余的计算机系统的框图和提供所述控制的方法的流程图的组合示图。
【具体实施方式】
[0007]本发明提供了改变数据处理设备(DHD)的功率状态以便满足能量传递设备(ETD)的冗余准则。例如,当由于三个或更多电源之一发生故障而损失冗余时,可以降低处理器和其他DHD的功率状态以便即使在第二电源发生故障的情况下也可以满足功率要求。类似地,如果环境温度增大到当前的风扇组不再冗余的程度,那么可以降低DHD功率状态以便恢复冗余。另一方面,如果环境温度下降,那么本发明可以提供增大功率状态以交换降低的过量冗余。
[0008]计算机系统APl包括基本上相似的服务器11和12,如图1中所示。服务器11包括数据处理部件13,所述数据处理部件包括:1)处理器15,其用于依照指令程序来操纵数据;2)计算机可读介质17,其包括主存储器、其他固态介质以及基于盘的介质,用于存储所述程序和数据;以及3)通信设备19,其包括输入/输出设备和其他通信设备,例如网络接口卡。此外,服务器APl包括能量传递设备20,所述能量传递设备20包括电源21和例如风扇的冷却设备23。电源监视器25、电源控制器27和功率传感器29与电源21关联。风扇控制器31、风扇监视器33和热传感器35与风扇23关联。电源功率状态控制器37例如依照ACPI标准来控制数据处理部件的功率状态。
[0009]功率状态控制器37响应于热和功率调节逻辑40,该逻辑分别通过电源控制器27和风扇控制器31控制电源21和风扇23的操作。逻辑40包括冗余评估器41,其依照冗余策略43 (其是为服务器APl实施的若干管理定义策略之一)评估电源21和风扇23的冗余水平。
[0010]服务器APl包括六个电源23,但是该数量在实施例之间有所变化。电源控制器27可以在活动状态和备用状态之间切换每个起作用的电源。通常,四个电源可以为服务器11提供足够的功率;在这种情况下,五个可以是活动的而使一个不活动处于备用。如果一个发生故障,那么另外四个足以继续工作,同时激活备用电源。系统操作未被中断,但是损失了冗余。如果另一电源发生故障,那么系统操作将被中断。本发明通过降低功率状态,使得三个电源能够提供系统的继续操作来避免该中断。
[0011]电源监视器25监视电源21的“健康状况”,并且检测电源何时发生故障。功率传感器29跟踪电源21输出的功率。功率传感器数据可以用来检测高要求情形,其中冗余可能由于电源21上的负载的增大而损失。
[0012]服务器11包括六个风扇23。风扇控制器31可以单独地接通和断开风扇,并且对于那些接通的风扇控制风扇速度。风扇监视器33监视风扇23的健康状况以便检测故障或受损操作。热传感器35或“温度计”跟踪内部和环境温度以用于调节风扇23的速度。
[0013]热和功率调节逻辑40接收来自热传感器35的输入以用于调节风扇速度。它也从功率传感器29接收指示服务器11的实际功耗的数据。服务器11的冗余状态的评估由逻辑40的冗余评估器41做出。
[0014]冗余评估器41负责实现冗余策略43。冗余策略43典型地由系统管理员设置。该策略43规定希望的冗余水平以及为实现这些水平而可以采取的动作。冗余评估器41耦合到电源监视器25和风扇监视器33以便它被告知活动的、不活动的以及发生故障的电源和风扇的数量。此外,冗余评估器41耦合到服务器12以便实现考虑外部服务器的状态的策略。(例如,相比于服务器12具有低冗余的情况,在服务器12具有高冗余的情况下,对于服务器11可能需要更低的局部冗余。)
一些简单的冗余策略忽略了外部服务器并且独立地处理功率和冷却。一种功率策略是在电源发生故障的情况下降低数据处理部件的功率状态以便恢复冗余。相当的冷却策略会是在风扇发生故障的情况下降低功率状态以便恢复冗余。更复杂的策略可以考虑诸如其他服务器(例如服务器12)中可用的冗余和性能要求之类的因素。例如,当要求高性能时,策略可能接受有限持续时间的低于标准的冗余。
[0015]其他策略在电源冗余高时接受更低的冷却系统冗余,并且反之亦然。理由将是,故障的特定总似然率可能是可容忍的。例如,当风扇23的冗余高时,策略可能容忍电源21的单个故障点,因为故障的总似然率足够低,而如果电源和风扇都缺乏冗余,那么故障的变化将会太高并且冗余将不得不恢复到这些子系统中的至少一个。另一种策略在另一个子系统中的冗余低时放弃一个子系统中的冗余,所基于的理论是第一子系统的低冗余不是故障的最可能原因。像这些示例所表明的,本发明提供了大范围的冗余策略。
[0016]图1的下部给出了本发明的方法MEl的流程图。在方法部分MSl处,设置或选择冗余-性能准则。该准则由冗余策略43规定。在方法部分MS2处,持续地监视
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1