数据中心的电效率测量的制作方法

文档序号:6479137阅读:285来源:国知局
专利名称:数据中心的电效率测量的制作方法
数据中心的电效率测量
背景技术
这份揭示一般地涉及用来提高数据中心的电效率的方法和系统。虽然数据中心的某些方面已被很好地规划,但是数据中心的电效率很少被规划或 管理。令人遗憾的结果是大多数数据中心浪费可观的电力。所以,通过规划、测量和仿制数 据中心效率提高数据中心的电效率是令人想要的。除了减少耗电之外,提高效率能使用户 得到更高的IT能量密度和在给定的成套装备中安装更多的IT设备的能力。

发明内容
这份揭示的至少一些实施方案指向测量、评估和提高数据中心效率。这份揭示的至少一个方面指向管理数据中心的能源效率的方法。在一个实施方案 中,该方法包括在数据中心的众多位置进行初始能量测量;以初始能量测量为基础建立 数据中心的效率模型;使用该效率模型建立基点性能水平;进行后续能量测量;以及将后 续能量测量的结果和基点性能水平进行比较。在该方法中,进行后续能量测量可能包括连同测量设备一起使用基于处理器的数 据中心管理系统。该方法可能进一步包括在后续能量测量的结果不同于基点性能水平而且 相差大于指定数量的时候提供报警。建立效率模型可能包括使用涉及与数据中心位置相关 联的气候的数据建立效率模型。在另一个实施方案中,建立效率模块可能包括识别在数据 中心使用的汲取能量的装置,为每个装置,选择适合该装置的能量输入的额定能量和可用 能量之一,以及为每个装置,确定该装置究竟促成固定损失、比例损失、平方律损失还是其 组合。在较进一步的实施方案中,建立效率模块可能进一步包括累计各个装置的能量损失 以获得子系统损失,和/或累计各个子系统的能量损失以获得数据中心损失。这份揭示的另一个方面指向用来管理数据中心能源效率的数据中心管理系统,该 管理系统包括有至少一个处理器为完成下列各项任务编程的数据中心管理器接受涉及在 数据中心众多位置的初始能量测量的数据;以涉及初始能量测量的数据为基础建立数据中 心的效率模型;使用该效率模型建立基点性能水平;接受涉及后续能量测量的数据;以及 将后续能量测量的结果和基点性能水平进行比较。在该系统中,进行后续能量测量包括在至少一个网络上与能量测量装置通信。在 一个实施方案中,至少一个处理器是为在后续能量测量的结果不同于基点性能水平而且相 差大于指定数量时提供报警而编程的。建立效率模型可能包括使用涉及与数据中心位置相 关联的气候的数据建立效率模型。这份揭示的进一步的方面指向建立数据中心能源效率模型的方法,该方法包括 测量进入数据中心的能量输入;测量数据中心的能量负荷;以及测量数据中心的冷却负 荷。在该方法中,在一个实施方案中,测量能量负荷包括测量UPS和PDU的负荷。在另 一个实施方案中,测量数据中心的冷却负荷包括测量至少由CRAH、CRAC、风扇、冷却单元、通 风单元、冷却塔和泵之一产生的负荷。该方法可能包括测量数据中心的环境条件。
另外一个方面指向建立数据中心能源效率的方法,该方法包括识别在数据中心 使用的汲取能量的装置;为每个装置,选择适合该装置的能量输入的额定能量和可用能量 之一;以及为每个装置,确定该装置究竟促成固定损失、比例损失、平方律损失还是其组合。 该方法的实施方案可能进一步包括累计各个装置的能量损失以获得子系统损失,和/或累 计各个子系统的损失能量以获得数据中心损失。那些装置可能被视为与动力有关的装置和 与冷却有关的装置。该方法可能进一步包括识别除了装置之外造成损失的原因,以及依据 统计数据预测损失的数量。在特定的实施方案中,该方法可能进一步包括提供将大多数数 据中心配置包括在内的数据中心目录,该数据中心目录有可仿效动力配置的动力目录和可 仿效冷却配置的冷却目录,以及把动力目录和冷却目录结合起来产生数据中心配置。该方 法可能进一步包括简化用于该模型的循环依从关系的计算。另一个方面指向用来建立数据中心效率模型的数据中心管理系统,该系统包括数 据中心管理器,该数据中心管理器有至少一个为完成下列各项任务而编程的处理器识别 在数据中心使用的汲取能量的装置;为每个装置,选择适合该装置的能量输入的额定能量 和可用能量之一;以及为每个装置,确定该装置究竟促成固定损失、比例损失、平方律损失 还是其组合。在该系统中,那至少一个处理器是为累计各个装置的能量损失获得子系统损失而 编程的,和/或是为累计各个子系统的能量损失获得数据中心损失而编程的。这份揭示的又一方面指向上面存有指令序列的计算机易读的媒体,该指令序列 包括将导致处理器完成下列任务的指令识别用于数据中心的汲取能量的装置;为每个装 置,选择适合该装置的能量输入的额定能量和可用能量之一;以及为每个装置,确定该装置 究竟促成固定损失、比例损失、平方律损失还是其组合。


附图不打算依比例绘制。在这些附图中,在各种不同的附图中列举的每个同一的 或几乎同一的组成部分是用相似数字表示的。为了清楚,并非每个组成部分都被标注在每 幅附图中。在这些附图中图1是展示典型的数据中心的能量流的图表;图2是展示数据中心效率随IT负荷改变的曲线图;图3是展示数据中心效率随IT负荷改变的曲线图,比较模块式和非模块式设计;图4是展示数据中心效率随户外温度变化的曲线图;图5是展示数据中心效率随一周之中的每一天改变的曲线图;图6是展示数据中心效率识别两个不同的数据中心的IT负荷的曲线图;图7A是展示负荷和损失的能量流动的数据中心效率模型图;图7B是范例数据中心电效率评估的屏显;图8是供应IT负荷的数据中心的范例能量分配系统图;图9是可仿效的数据中心设计的构架图;图10是已知数据中心的动力目录条目图;图11是已知数据中心的冷却目录条目图;图12A是用于数据中心的动力系统单线能量流图,其中目录条目为“动力1A”;
图12B是用于数据中心的冷却系统单线能量流图,其中目录条目为“冷却2B”;图13是用于数据中心的采样模型评估流程图,其中目录条目为“动力1A,冷却 2B”;图14是图13所示图表的一部分,其中突出环形能量流;图15A和15B是展示两种不同类型的装置的能量流和模型评估流程之间的关系的 图表;图16展示可以在其上实践本发明的各种不同的实施方案的通用计算机系统;图17举例说明通用计算机系统的存储装置;而图18描绘通用计算机系统网络。
具体实施例方式这份揭示的实施方案不局限于在下面的描述中陈述的或在附图中列举的构架细 节和组成部分安排。这份揭示的实施方案能够以各种不同的方式实践或实施。另外,在此 使用的措辞和术语是为了描述,不应该被视为限制。IMW高实用性的数据中心能在其使用期限范围内消耗价值$20,000,000的电力。 已经提出对于某些客户,电力费用大于IT硬件费用。另外,许多公司正在开始考虑他们的 后续操作的碳消费。效率对于类似的数据中心大幅度改变,而且大多数装备的实际效率在 实际可实现的最佳类别(best-in-class)数值以下。大多数数据中心的设计和构造没有考虑到数据中心的电效率。没有关于特定设施 的性能的数据难以控制电效率低下的问题。除此之外,即使数据是可得的,也没有技术去评 估数据。数据中心的设计者和管理者不知道如何比较或判断特定设施的性能与其它类似设 施的性能的差别。这样的设计者和经理不可以使用使他们能够将实际数据与他们对他们的 设施期望的设计值进行比较的信息。除此之外,客户没有效率数据,而且即使他们有,这样的客户也不知道该如何处理 它。为了解决这个问题,这份揭示的实施方案将实现下列各项开发用来描述数据中心效率 的标准语言;开发用来测定数据中心效率的标准方法;开发用来详细说明数据中心效率的 标准方法;开发用来分析数据中心效率和确定无效率起因的标准方法;依照指定标准检测 与效率有关的数据;以及开发效率建模工具评估推荐的改进或更换设计。一些不同的用于数据中心效率的相关衡量标准已被提出和讨论,包括数据中心基 础设施效率(DCiE)、能量利用效率(PUE)和站点能量架空乘法器(Site-Power Overhead Multiplier(站点-POM))。数据中心基础设施效率(DCiE)在此主要被用作确定数据中心 效率的衡量标准。数据中心的电效率被表示成供应给数据中心被最后递送到信息技术装置 的总电能量的分数。在这种情况下,效率的数值落在0和1之间,而且可以用下式表示DCiE = IT负荷能量/总的数据中心输入能量 (1)总的耗电量可能依照下式受数据中心的电效率和IT负荷的大小控制能量消耗=IT负荷能量/DCiE (2)给定IT负荷,为了实现将耗电量减到最少的目的,数据中心基础设施效率必须达 到最大值。如果数据中心有100%效率,那么供应给数据中心的全部能量都将到达IT负荷。
6这是理想的情况。在实际的数据中心,可能有电能被IT负荷以外的装置消耗的一些途径, 包括但不限于变压器、UPS、动力配线、风扇、空调、泵、增湿器和照明。一些装置(例如,UPS 和变压器)与IT负荷是串联的,而另一些(例如,照明和风扇)与IT负荷是并联的。无论 如何,事实上所有馈送给数据中心的电力最后都变成废热。展示在可仿效的数据中心中电 能量流程和热能量流程的图表展示在图1中。按图1建模的数据中心是典型的高实用性的双重供电路径数据中心,有N+1个 CRAC单元,以设计能力的30%的典型数值操作。请注意在这个范例中实际上不足一半的馈 送给数据中心的电能量被递送到IT负荷。数据中心在这个范例中可以被视为有30%效率。数据中心的动力和冷却设备就它们的损失而言是由为每个装置提供与电效率有 关的数据的制造商描述特征的。在动力设备的情况下,效率通常是用百分比表达的。在冷 却设备的情况下,效率可能被表示成性能系数,该系数是被空调除去的热能量与输入电能 量之比。照明能量可以表示成简单的恒定损失。举例来说,60瓦特的灯泡在数据中心效率 为0%,因为它产生60瓦特的热量而且没有能量提供给IT负荷。数据中心效率性能通常不能用数字描述。在任何给定的瞬间,数据中心都有用于 它的当前效率测量的单一数字。这个数字是供电、冷却和照明系统的固有耗电量特性和在 那个时间点IT负荷数值的结果。然而,在数据中心,效率将实时地改变,因为IT负荷实时 地改变,户外条件实时地改变,数据中心的冷却模态也能实时地改变。这些因素全都影响数 据中心效率,而且结果是数据中心效率不变地变化。数据中心效率的任何特定的一次性测 量只是“快照”,不能用来预测将来的性能。数据中心效率的单个测量结果本来就不准确,而 且难以或不可能用作基准测试或效率管理的基础。数据中心效率的变化可以用随着IT负荷、户外条件和冷却操作模式改变的效率 曲线图更好地了解和描述。图2展示典型的数据中心的效率怎样随着IT负荷改变的曲线 图。固定地安装在数据中心中的动力和冷却设备有图2所示形式的效率曲线,在较轻的负 荷下效率下降,而且当IT负荷为零的时候效率是零。在图2中识别的这条曲线举例说明提 高数据中心效率的基本原则。明确地说,如图所示,有两种提高数据中心效率的基本方法。 一种方法是升高数据中心效率曲线。另一种方法是把工作点移动到该效率曲线中效率较高 的部份。升高图2的IT负荷将沿着有利的方向移动工作点。另外,降低动力和冷却能力 (通过裁减冗余或可伸缩的体系结构)有相同的效果。裁减冗余设施的利益展示在图3中, 图3是动力和冷却能力随着负荷逐渐增加按增量递增的数据中心的效率曲线。在两种情况 下动力和冷却设备的效率是同一的。在图3中,典型的数据中心效率曲线与由五个同一的 模块组成的数据中心的效率曲线相似,其中模块只是在需要它们的能力时候才被添加进去 和接通。在满负荷下,图3展示模块系统没有效率优势。然而,在较轻的负荷下,已安装的 模块以其额定负荷较高的分数操作,在效率方面有显著的增益。我们能从这条曲线了解 为什么模块是可伸缩的动力和冷却体系结构是提高把它们的大部分工作寿命花费在低于 (有时是适当地低于)它们的最终设计值的负荷的数据中心的效率的最有效的方法之一。数据中心的户外情况是随着时间改变并且影响数据中心效率的深层因素。图4展 示典型的数据中心的效率怎样随户外空气温度改变。(请注意X轴的适当选择可能是所谓的“湿球”温度或“露点温度”,而不是环境温度,取决于所用散热系统的类型。)随着温度 逐渐增加,典型的数据中心的效率下降,因为在处理数据中心热能的时候散热系统消耗较 多的能量。除此之外,由于户外的热量渗透到数据中心之中变成必须处理的附加热负荷,效 率也有所下降。图4的虚曲线代表如果冷却系统有“节能装置”操作模式,该怎样改善较低 温度下的效率。显然,效率随着户外温度改变,尤其是在数据中心配备了节能装置冷却模式 的时候。在实际的数据中心中,效率随着IT负荷和温度改变而改变。图5展示数据中心的 效率在一周期间可能由于三种不同的效应(IT负荷和户外温度的日常波动引起的日常变 化;由天气引起的逐日变化;以及IT负荷在周末减少)怎样改变。当逐日变化不明显的时候,这种变化可能严重地降低特定的一次测量的有效性。 即使特定的效率测量是极端准确的,它的准确性在预测耗电量、度量提高效率活动的效果 和完成倾向性分析方面也可能是不足的,因为预期的效率逐日变化。数据中心效率随着负荷改变对如何解释效率数据有另一种重要的影响。考虑将在 图6中进行比较的两个数据中心的范例。关于第一数据中心,获得47%的效率测量结果。 关于第二数据中心,获得50%的效率测量结果。第二数据中心有较好的效率测量结果,所 以,假定它是设计基本上较好的“比较绿色的”的数据中心似乎合理的。然而,考虑这两个 数据中心的较详细的视图。明确地说,图6表明第一数据中心,即使它有较低的实测效率, 它也有高得多的效率曲线。从规范立场看,第一数据中心或许使用效率非常高的动力和冷 却设备和优化的气流设计。然而,因为第一数据中心的IT负荷百分比低于第二数据中心, 所以第一数据中心在该效率曲线的低效率部份上工作。因此,起初,难以确定图6中的哪个设计比较好。工程师可以确定第一数据中心固 有的设计效率是上好的。然而,商人可能确定数据中心的参数选择(sizing)是消除所有技 术上的效率增益的拙劣计划。关于哪个“设计”比较好的决定取决于适当的参数选择是否 被视为设计的一部份。(请注意如同先前在图3中描述的那样,如果模块式可伸缩的落实 已被采用,第一数据中心上好的技术性能可能在这种情况下已被实现。)在一些实施方案中,使用一个数字表示数据中心效率(例如,用数据中心的单一 测量获得的效率额定值)的概念可能是基本上无效的,因为它不能实现前面概略说明的目 的。这样的表达对于基准测试可能不是有效的,对于通向和提供对提高效率的时机的有作 为的洞察力可能也不是有效的。至少一个实施方案使用测量结果至少实现一些目的。如同下面将更为详细地描述 的那样,准确地表达特定数据中心的工作状态并且接受IT负荷、户外天气统计数据、计时 电费(time-of-dayelectric rate)等等作为输入的模型可能被有效地用于数据中心能量 管理计划。不同于实际上正在工作的数据中心的测量,只提供适合测量条件的数据,模型能 提供适合馈送给它的任何输入条件的数据。举例来说,模型可以提供数据中心在满负荷时 的效率预期值,即使当那IT负荷是额定负荷的一小部分的时候也如此。两个不同的数据中 心的模型能得到同样的输入条件,这允许意义深长的比较。此外,模型甚至能在建造数据中 心之前产生,从而允许预先预测性能。下列各项是模型提供的不能通过测量和记录数据中心效率获得的一些利益预先 准确地预测推荐的数据中心设计的效率性能的能力;高精度地针对不实际的测量条件(例如,针对不同的IT负荷)评估正在运行的数据中心的效率性能的能力;高精度地针对只有 部分信息的情况(在这种情况下测量所有线路的耗电量是不实际的)评估数据中心的效率 性能的能力;高精度地针对各种不同的户外条件评估数据中心的效率并且允许随着时间流 逝估计效率平均值的能力;识别和量化在数据中心的动力、冷却和照明系统中使数据中心 效率低下的特定装置的贡献的能力;识别正在其预期的效率参数以外运行的数据中心子系 统的能力;以及按指定标准检测和比较不同的数据中心模型的能力。虽然数据中心效率在操作点的单一测量结果能提供某种信息,但是没有上面列出 的能力它可能是无所作为的。由于这个理由,该模型可能被用来产生用于效率管理的程序 和系统。正是该模型允许理解效率地下的原因;所以,数据中心效率测量的目的是建立该模 型的参数。因此,数据中心效率测量的目的可能是获得对适合那个数据中心的准确模型的产 生有贡献的信息。正是该模型提供关于数据中心效率的有作为的信息,而不是测量。虽然建立数据中心效率模型是有价值的,但是留下一个疑问,即为特定的数据中 心开发和运行数据中心效率模型是否是可行的和实际的。这个疑问的答案取决于该模型需 要的准确程度。这份揭示的实施方案可能用来产生和运行足够准确的模型以达到上面概 略说明的效率管理的目的,而且这样的模型可以被建造成用来管理数据中心的标准软件工 具。用于实际的数据中心效率模型的能量流图展示在图7A中,该图描绘数据中心基 础设施耗电量(损失)是怎样由IT负荷和户外条件确定的,从而引起能量在动力、冷却和 照明系统内流动。在数据中心中每个装置类别(UPS、CRAH,等等)依照装置配置和固有的 效率特性接受负荷作为输入并且产生功耗(损失)。如果动力、冷却和照明装置的设计和特性是已知的,用于数据中心的效率模型能 针对现有的数据中心产生,或者甚至能在数据中心建成之前产生。如果模型能准确地表现 设计,那么它提供的数据将同样准确。虽然某些类型的装置(例如,照明、UPS和变压器)的 电性能是非常一致的和可预期的,但是有许多与装置(例如,导致模型失去准确性的泵和 空调机)的最终性能有关的不确定性。这是测量能提供帮助的地方。前面的讨论解释定期测量数据中心效率的用处有限,由于重复性差和缺乏指导。 相反的,管理效率可能是在实施方案中使用两种不同目的的两种测量完成的初始测量,标定数据中心效率模型、建立现有的和该有的性能和识别潜在的提高 效率的时机。初始测量除了测量总效率之外通常需要对个别的动力和冷却子系统进行测 量。后续测量,对照模型进行比较以便提供对意料之外的效率低下的警觉和量化进 步。后续测量可能是通过定期抽样或用连续测量仪器进行的。对于初始测量和后续测量的建议将在下面描述。首次测量数据中心的效率,它应该是专家所作的总效率评估的一部份。除了进行 效率测量之外,数据中心效率评估通常提供在建配置分析和关于提高效率的建议。理想地, 评估应该提供数据中心模型作为其交付物之一。图7B举例说明数据中心效率评估的工作 报告范例。在效率评估期间收集的数据应该包括足够多的子系统测量结果,以便允许标定 效率数学模型。
一旦使用初始效率测量结果完成数据中心模型的标定,该模型就可以立刻用来建 立基点性能(例如,预期的年平均效率)或确定在其它的参考IT负荷和户外条件下的效 率,例如,针对可比的行业基点建立的那些。在数据中心效率已被测量出来而且效率模型已被标定之后,后续测量应该进行以 便量化任何效率改善和提请注意任何不受欢迎的效率损失。当发现效率的实测值偏离最初 的实测值的时候,我们已经说明这可能是由于IT负荷或天气变化造成的。该模型能校正IT 负荷和气候的影响和揭示所发现的任何效率变化是否是由这些影响造成的或者是由潜在 的数据中心基础设施的实际变化引起的。效率的后续测量能被定期地完成,例如,每年两次(间隔六个月,例如,夏天一次 和冬天一次),或者安装连续的实时测量系统。为了在特定的操作点测量数据中心效率,测量数据中心的总输入能量和总IT负 荷。如果设施是专用的数据中心,那么输入能量能在公用输电干线与建筑物的连接处测量。 如果负荷是一个大型的IT负荷装置,那么IT负荷能量是在该装置电连接处的能量测量结 果。在这种情况下只需要两个测量结果。不幸的是,这种理想状况从未实现过。大多数数 据中心是除了数据中心以外有其它负荷的多用途建筑物的一部份。典型的数据中心由IT 装置(可能有数千个,许多有独立的电路)的集合组成。为了保证准确的或近乎准确的测量,所有从输电干线汲取能量组成总的数据中心 负荷的装置与其它的非数据中心负荷分开配备仪器并且计算它们的输入能量之和。此外, 为了获得总的IT负荷,所有的IT装置被单独配备仪器并且计算它们的输入能量之和。举 例来说,在IMw数据中心中,这可能需要数千次同时的能量测量,这可能是技术上的和实际 的挑战。由于这个理由,一些数据中心的操作员已经得出结论效率测量是不实用的。幸运 的是,复杂的仪器应用和耗时的测量是不必要的,因为能证明连同系统模型使用少数统一 测量点的组合能提供足够准确的效率测量。作为使用模型能如何引人注目地简化实际的测量的范例,考虑测量IT负荷的情 况。图8展示大量的IT负荷利用UPS供电的能量分配单元(PDU)提供能量的典型情况。为了获得实际的IT负荷,所有的给每个IT负荷供电的分支线路都应该被测量和 计算总和,这可能是数以千计的测量。如果改为在UPS的输出端测量能量,问题被戏剧性地 简化到单一的测量。然而,由于测量的是IT负荷加上PDU消耗的能量(PDU损失)之和,所 以将引进误差。这个误差可能在2%到20%的范围内,取决于数据中心,这是相当重要的。 然而,PDU能在模型中被非常准确地描述特性,而且该模型能非常准确地计算PDU损失提供 UPS输出能量。该模型能把PDU损失从UPS输出能量中减去,获得IT负荷,没有重要的误 差。这样,该模型允许我们把可能数以千计的测量减少到单一测量。使用模型从为数不多的测量得到大量信息的技术能用于一次性测量,而且它也能 作为连续的永久性效率监控系统的一部份使用,借此显著地减少连续的效率监控的费用。用于后续效率测量的能量测量点的数目通常少于用于初始测量的点。后续测量需 要集中在最有可能随着时间逝去改变的和对功耗贡献最大的线路。举例来说,有一些装置 (例如,变压器),最初测量每个变压器将是有价值的,但是其后续的动力贡献能借助模型 非常准确地计算出来。一般地说,后续测量需要一半的初始测量点。这暗示一种仪器使用 策略,即后续测量点是用固定安装的能量表监控的,而另外一些需要初始测量的点是使用手提式仪器测量的。决定哪些线路应该进行初始测量,哪些线路应该进行后续测量可能是数据中心效 率专业评估的重要组成部分。数据中心效率可能是基于能量测量结果计算的数字。能量测量结果可能是利用 下列类型的设备获得的(1)手提式能量测量设备(例如,来自Fluke Corporation of Everett, Washington的Fluke435型三相能量质量分析仪);(2)永久安装的能量测量设备 (例如,来自 Schneider Electric-Power Management Operation ofLaVergne, Tennessee 的Power Logic PM700能量表);和(3)永久地安装在冷却和动力设备中的内置能量测量功 能(例如,来自West Kingston,Rhode Island的美国能量变换公司的APCSymmetra UPS)。数据中心可能配备测量效率的永久性仪表,或者可能使用手提式仪器定期地核查 效率。在任一情况下,首先要依照先前的段落描述识别待测量的供电线路。没有必要测量 数据中心的所有的数以千计的线路的能量流。通过测量供电线路的小子集的能量流能非常 准确地计算效率。效率测量策略由下列元素组成决定永久性测量与周期性/手提式测量 的关系;识别适当的测量点;以及建立用来报告效率数据的系统。效率测量仪器可能被永久地安装,或者测量可能是由合格的服务人员用手提式仪 器定期地完成的。优选的解决方案取决于多种因素,而且每种方法都有一些利益。对比不 同的方法的范例用表1概述表1 比较用于数据中心效率测量的永久性仪器和的特征和利益 表中的$/瓦成本是用于IMW数据中心的近似成本。成本通常随着数据中心的规 模改变永久性仪器提供连续的实时效率数据,这提供重大优势。永久性仪器与定期核查 相比较的一个优势是没有人尝试用手提式仪器在带电的供电线路上进行测量;任何时候人 尝试在带电线路上进行测量都有出错和停机的危险。永久性仪器的缺点是原始成本比较 大,尤其是翻新仪器设备成本比较大。所以,使用手提式仪器完成定期核查费用比较低,尤 其是对于使用期即将结束的现有的数据中心。一些动力和冷却装置(例如,UPS)可能已经有内置的能量测量能力。如果这种内 置能力的准确性是充份的,那么这将节省在受影响的线路上使用任何附加的测量仪器的需要。无论仪器是永久性的还是手提式的,都必须选定适当的能量测量点。没有必要对 数据中心中所有的数以千计的线路进行测量。目的是测量最少的线路提供以必备的准确性 构建模型必不可少的数据。对于现有的数据中心,这个问题可能是通过与建筑物如何配线 有关的实际事务解决的。此外,一些线路或装置(例如,冷却塔)可能有意地与数据中心外 面待测量的负荷共享,从而使直接测量与数据中心有关的消耗变成不可能的。所以,仪器测 量点选择可能需要针对特定的装置根据客户需要修改。依照讨论,电效率不是用仪器直接测量的,而且附加的计算可能是需要的。此外, 提供数据中心的效率曲线需要将测量结果连同数据中心的效率模型一起使用。就定期核查而言,数据中心的效率曲线可能是使用在此描述的原则计算的。对于 永久性仪器,效率的实时计算可能是可能的和优选的。这个功能应该由动力和冷却能力管 理系统提供,该系统已经包含用于数据中心的模型。当被适当地实现的时候,能报告电效率趋势,而且能根据不得超越的条件产生警报。此外,有效的系统将提供诊断效率地下的来源 的能力和建议纠正的行动。如所示,测量在与模型一起使用的时候是最有用的。由于这个理由,建立模型是效 率管理的关键方面,而模型的数据需求确定对数据中心内的能量流的测量的要求。为了管理数据中心效率,初始能量测量是为建立模型和基线条件而进行的,而且 能量流是以后续方式定期地或连续地监控的,以便提供关于效率变化趋势、效率低下条件 和改善时机的信息。在典型的数据中心内有数以千计的能量流。分析表明没有必要为了测量和管理效 率测量所有这些流动。当把适当的模型与关于动力和冷却装置的信息结合起来的时候,只 用为数不多的测量结果建立高精度的效率管理系统是可能的。为了管理效率,使用者有永久地用仪器装备数据中心内适当的能量流实时计量效 率的选项,或他们能使用手提式仪器完成能量流的定期核查。对于新的数据中心,使用永久 性仪器是适当的。对于现有的数据中心,建议将有限的永久性仪器与定期核查结合起来。在特定的实施方案中,描述数据中心能量管理系统的模型。最简单的能源管理概 念以能量测量和数据分析(例如,趋势)为基础。虽然测量肯定是能量管理的重要元素,但 是能量管理系统的大部份有用的利益必须由模型提供。测量不能用来预测未来条件下的性 能,而且不能提供关于改进时机的指导。虽然不使用模型用直接测量法测量数据中心基础设施效率(DCiE)可能是可能 的,但是在测量的时候确定除数据中心条件以外的任何条件下的DCiE是不可能的。模型可 以把背景和意义提供给测量结果,而且可能允许把该数据中心及其子系统的性能与其它的 数据中心进行比较。模型可以用来在几秒之内非常准确地预测年度DCiE,一项通常将进行 一年数据收集的工作。举例来说,能准确地预测下一年的DCiE起因于实际变化或假想变化 的变化。没有模型,这是不可能的。模型甚至可以非常准确地估计数据中心内由于实际限 制实际上不能测量的点的能量流。一般地说,该系统的大部份功能和价值应归于模型。在一个实施方案中,模型是数据中心能耗的计算机模拟。该模型包括所有的能量 流依从关系和相互联系和用于各种不同的动力和冷却装置的模型。使用模型的模拟获得输 入(例如,户外温度、IT负荷和操作员设定)而且能确定数据中心中所有线路的所有的能 量流。模型被配置成处理可能呈电流形式通过电线的或可能呈热流形式通过水管或空 气的能量流。这些全部是在模型中可以考虑到的能量流。能量可能被保存在数据中心所有 的过程中。像IT负荷这样的一些装置消耗电能并且发热。像变压器和UPS这样的一些装 置完成电能变换并且作为不受欢迎的副产物产生一些热量(损失)。像空调器这样的一些 装置消耗电能并且泵送热量。数据中心作为完整的系统(包括IT负荷)消耗电能并且把 热量排放到户外。几乎每个数据中心都是不同的,在不同的配置中使用不同数量的不同装置。这些 装置它们自己通常有不一致的和不完全的性能规格。所以,似乎每个数据中心有不同的模 型。为特定的数据中心创建模型结果将似乎是非常复杂的挑战,涉及相当多的研究和定制 程序。然而,使用系统化方法,可以开发易于为任何数据中心创造模型的简单架构。在一个实施方案中,模型可能是分级结构,包括下列三个模型水平(1)数据中心水平;(2)子系统水平;和(3)装置水平。数据中心水平可能是将整个数据中心作为单一实 体创建的。IT负荷可以作为IT负荷能力和损失的函数呈现。另外,DCiE可以被表示呈负 荷的函数。子系统水平可能代表组成整个数据中心系统的许多子系统,例如,UPS,空气处理 器、照明、冷却器,等等,其中每个子系统呈现特性动力和特性损失参数。装置水平可以代表 组成每个子系统的一个或多个同类装置,例如,组成空气处理子系统的一群独立的空气处 理装置。因为模型是分级结构,建模方法的一个方面是装置怎样聚集成子系统和子系统怎 样聚集成最后的数据中心模型。这个聚集方法将在下面更详细地描述。为了描述模型、它的方法和它的规则,模型可以分解成下列元素装置特性的模 型;装置聚集成标准化的子系统的方法;以及子系统聚集成完整的数据中心的方法。这些 元素每个都将被依次考虑,然后将描述整合模型。在数据中心中每个处理能量的装置都可以用模型表示。对于在此描述的模型的实 施方案,每个装置可以用模型来表示,该模型简化全面模拟所需的计算而且能避免或者戏 剧性地简化模型中关于循环依从关系的计算。基本的装置模型可能包括代表数据中心内使 用能量的组成部分(例如,UPS、PDU、空调,等等)的能量使用的模型。每个装置可能被视 为有叫做“负荷”以瓦特表达的初级输入而且可能有五个模型参数组成部分能力可能使用 两个参数建模的铭牌负荷能力额定值和基于系统设计限制的可使用能力额定值。组成部 分耗电量可能使用三个损失参数建模固定损失、与负荷成比例的损失和与负荷的平方成 比例的损失。这些参数可能是以铭牌能力额定值的百分比表达的。装置模型是以负荷(瓦 特)作为输入提供的而且产生能耗率作为输出。对于许多装置,可用能力将不等于铭牌能力。这可能是由于装置操作条件、工程实 践或用户政策造成的。举例来说,因为装置在高海拔高度或高户外温度下工作,可用能力可 能小于铭牌能力。在大多数情况下,可用能力将小于铭牌能力。此外,装置的可用能力受特 定的数据中心的设计和政策影响,然而装置的铭牌能力是固定的,与安装无关。所以,装置 的可用能力必须针对特定的数据中心计算,而另外的四个装置模型参数可以由装置制造商 提供。可能影响可用能量的因素摘要在表2中提供。表2 装置铭牌能力与装置可用能力不同的原因 依照讨论,在装置的铭牌能力和可用能力之间可能有相当大的差别。举例来说,冷 却塔在特定的户外和流动条件下或许有IMW的铭牌额定值,但是因为预期最坏情况的高温 条件可能需要被减额到只有600KW,由于数据中心特定的泵和管道工程设计的限制可能被 进一步减额到500KW。该额定值可能进一步受制于80%负荷额定值政策,以致于这个IMW 冷却塔的最终可用负荷额定值只有400KW。一些装置可能在数据中心中是按冗余安排配置的。这种配置可能限制可用的数据 中心能力,但是这种配置是该系统设计的特征而不是装置的特征。在这个模型中,冗余度对 数据中心能力的影响可以按模型层次的子系统水平而不是装置水平获取。所以,由于冗余 装置配置造成的能力损失在装置可用能力的计算中可能不予以考虑。冗余度对可用能量的 影响将在下面讨论装置集合期间进行讨论。在该模型的一个实施方案中,装置的耗电量可能以它与铭牌能力有关的负荷为基 础,而且对于给定瓦数的负荷,损失可能不受可用能力影响。所以,为了对于给定的负荷确 定装置、子系统、甚至数据中心的效率,铭牌容量额定值是需要的,而未必需要可用能量参 数。然而,装置的可用能力确实直接确定子系统的可用能力,并因此它影响数据中心的可用 能力。当进行能力分析的时候,或者当效率被报告为数据中心能力的函数的时候,可用能量 数据变成必不可少的。一些装置可能有随着操作员设定、自动模态或户外条件的变化而改变的功耗因 素。在这些情况下,损失系数可能被表示成取决于这些条件的公式。举例来说,冷却器的比 例功耗因素可能与户外温度有关地改变,或者冷却塔风扇的固定损失可能以自动化的分段 控制器为基础有阶梯式增加。这些例外的情况只影响该模型的少数参数。然而,完整的模 型应该将这些情况合并,下面将解释用推荐的模型处理这些情况的方法。一些装置(例如,空调机)可能有多种操作模式,与每种操作模式相关联的效率是 不同的。举例来说,一些空调系统有户外温度低的时候使用的“节约”模式,在这种情况下, 系统效率被大大增加。这样的装置不能以在此描述的简单的三参数损失模型(固定损失、 比例损失和平方率损失)为基础使用效率曲线建模。为了建立适合多模式装置的效率模 型,可能使用不同的技术。在不同的操作模式之间切换的装置的性能可以使用叫做“状态-空间平均”的技 术在延长的周期里预测。这项技术可能是通过先预测在各种不同的模式中花费的相对时间 然后产生系统输出的加权平均值实现的。这项技术很容易适用于效率和损失计算。为了使用在此描述的装置有多种操作模式的效率模型,固定损失、比例损失和平 方律损失必须首先针对每种操作模式确定下来。然后,通过将每种模式的损失乘以预期花 费在那个模式的时间的分数计算在延长的时间周期里的全部损失贡献。举例来说,和两种 模式的系统的完整描述将需要三条效率曲线模式1的效率曲线、模式2的效率曲线和预期 的总效率曲线,给定花费在每种模式的时间量的既定假设。损失特性取决于其它变量的装置可以被进一步预测。作为负荷的函数的损失模型假定负荷和系统设计是影响装置耗电量的唯一输入。系统设计能影响损失系数和安装好的 装置能力,而负荷借助三个损失参数(固定损失参数、比例损失参数和平方律损失参数)与 损失相关。这种损失负荷计算对于一些装置类型(例如,UPS)是现实的假定。然而,对于 其它的装置(例如,冷却器)耗电量可能受其它操作条件(例如,户外温度)影响。就数据中心而言,可能要识别除了负荷之外能影响装置的电力消耗的下列关键输 入户外温度、户外湿度、操作员设定(例如,冷却水设定点、阀门设定,等等)和降级的情况 (例如,过滤器阻塞)。这些因素可能通过允许它们影响装置损失参数被并入模型。举例来 说,冷却器的比例损失可能随着因户外温度改变,或者泵的固定损失可能因水过滤器堵塞 而改变。在每种情况下,损失系数可能都被表示成包括来自上述目录的一个或多个变量的 公式。这种方法还允许使用统计的输入建立数据中心的参数模型。举例来说,户外温度 可能是针对给定的位置以某种统计形式(例如,每天多少度的间隔)提供的。这个统计数 据能适用于该模型预测某个位置未来的长期性能。作为模型能力的范例,考虑建议改进现 有的数据中心的冷却器的情况。通过提供推荐的冷却器的参数数据,模型能用来预测在即 将来临的一年内年度节约,考虑季节天气变化的影响。事实上,数据中心的年度效率(包括 某个位置的天气影响)甚至能在在数据中心建成之前非常准确地预测。对于这些受其它变量影响的装置,在此描述的五参数模型可以通过增加附加的参 数被扩展。请注意只有一些装置有对模型有重大影响的附加参数。下表是一系列已知的追 加参数表3 需要用于特定装置类型的已知附加参数 除了建立装置模型的参数之外,装置可能有对模型来说重要的其它属性。属性不同于参数而且用来将装置分类和组织到完整的数据中心模型中。下列各项是装置除了它们 的数学参数之外具有的属性装置类型。每个装置可能被确认为属于来自预先定义的类型目录的标准类型。举 例来说,装置类型可能被确认为增湿器、泵、UPS、断路器板、电线,等等。这个确认可能用来 促进标准模型的发展和允许不同的数据中心降到装置水平进行比较。装置子系统成员资格。每个装置可能被分配给来自预先定义的目录的子系统。这 将有利于标准分层模型和子系统的基准测试。装置负荷分配。每个装置的耗电量可能被分配给三个类别之一 IT负荷动力、基 础设施动力或不包括在内的。这些分类应该以预先定义的规则为基础而且应该在计算数据 中心效率时使用。数据中心效率的计算可能对装置负荷分配是敏感的,而且许多公开报告的数据中 心效率数字可能不以一致的装置负荷分配为基础。举例来说,为了计算效率,网络操作中心 的耗电量有时被归类为IT负荷,有时被归类为基础设施,有时它不包括在计算之中。这些 分配将在效率计算结果方面产生实质性变化。所以,装置负荷分配应该是统一的,以允许行 业基准测试。对于一些装置类型,所有的参数都不是有针对性的,但是标准的五参数装置模型 仍然能适用。举例来说,在照明的情况下,在照明和IT负荷之间没有明确的关系。这个装 置类型通过将比例损失和平方律损失设定为零、将能力设定为无限大和计算等于照明负荷 除以整个系统IT额定负荷的固定损失参数像任何其它的动力或冷却装置那样处理它仍然 能适应。在特定的实施方案中,数据中心可能由子系统组成,而且这些子系统可能由装置 组成。整个数据中心的特性起源于数据中心内包括的装置的特性。所以,为了建立整个数 据中心的模型,组成数据中心的装置的特性必须被聚集起来。依照讨论,用于子系统和整个 数据中心系统的模型可以依照下列原则借助个别组成部分的模型的数学合并产生。明确地 说,装置可能集合成子系统,子系统可能集合成完整的数据中心。数据中心的总损失是子系 统损失之和,而子系统损失依次是组成每个子系统的装置的损失之和。装置和与它们相关 联的子系统的损失可以通过首先将每个装置的实际负荷确认为其额定负荷的分数来计算。 接下来,计算起因于每个负荷的固定损失、比例损失和平方律损失,然后相加在一起。固定 损失不随负荷改变,比例损失随负荷改变,平方律损失随负荷的平方改变。当两个相同的装置(例如,UPS)合并成负荷被各个装置平等地分享的子系统的时 候,合并子系统的子系统(固定、比例和平方律)损失参数与原装置相同。当两个相同的装 置(例如,UPS)合并成负荷在装置之间不被平等地分享的子系统的时候,子系统损失参数 中的两个参数(合并子系统的固定损失参数和比例损失参数)仍然与原装置相同。合并子 系统的第三个损失参数(即,平方律损失参数)将不同于原装置的参数,相差与装置之间负 荷的变化有关的数量。然而,能指出原装置的平方律损失参数可以用于几乎所有实际的情 况,而且误差非常小。这个特性允许在没有关于多个装置(例如,UPS或空气处理器)之间 负荷平衡的详细信息的情况下将模型合并。在特定子系统上的负荷可以用数据中心的能量流模型确定。它时常不与IT负荷 相同。举例来说,空气处理器的负荷通常将由IT负荷加上产生热量的其它负荷(例如,UPS、增湿器和照明)组成。确定加在不同的子系统上的负荷的能量流模型在不同的数据中心设计之间可能 改变。举例来说,在一些数据中心,UPS可能除了 IT负荷以外还把动力提供给空气处理器, 而在其它的数据中心,UPS可能只给IT负荷供电。在另一个范例中,在一个数据中心,开关 设备可能在室内,它的热量形成空调机负荷,在另一个数据中心,开关设备可能在户外。依照讨论,数据中心由各种装置构成,将子系统作为中间概念引进分层结构可能 是不必要的。然而,考虑到子系统可能是非常有用的而且可能被包括在推荐的模型之中。 具体地说,子系统的内涵可能提供两种利益第一,考虑到子系统将装置组织成标准化的群 体,该群体允许就不同的数据中心子系统跨数据中心进行基准测试。第二,它是便于将来自 相关类型的装置的数据合并的点。这在可能有数以百计的动力和冷却装置的大型数据中心 可能是特别有用的。如果子系统的名字和定义对于所有的数据中心是标准化的,那么子系统的概念可 能是最有用的。虽然一些子系统类型通常是业内认可的,但是边界是含糊的而且没有用任 何标准明确地定义。为了实现统一的定义或者语言,可能要建立子系统定义;如果形成行业 标准要理解那些定义将来可能需要被再次映射。可仿效的定义列在表4中表4各种不同的数据中心子系统
冷水泵在冷水冷却系统中致使冷水循环的泵。包括主泵 和辅助泵。散热泵致使乙二醇溶液和冷凝水向冷却塔或干冷却器 循环的泵。在带气冷冷却器的系统中或在带远程 冷凝单元或远程冷凝器单元的DX气冷系统中 不存在。如果定义,举例来说,叫做“空调”子系统而不是定义各种不同的子系统(例如, 泵、冷却塔,等等),那么该定义目录可能被大大简化,为装置定义分开的子系统至少有两个 好处。第一个好处是来自实际装备的数据表明可能有重要的因各种不同的冷却装置类型而 非常易变的低效率量,而通过针对装置创建独立的子系统类型考虑到这些子系统工业基准 测试以便使用者能够较好地理解他们的冷却系统的诸元素与工业基准相比较表现如何。第 二个好处是在许多系统中像冷却塔和泵这样的一些冷却装置是与其它非数据中心的负荷 分享的而且把它们空气处理器与分开允许更有效地给分享子系统建模。该模型聚集进入单一对象(以下称之为子系统)的相关类型的装置。换句话说, 模型考虑将由一个UPS子系统、一个发电机子系统、一个CRAC子系统,等等组成的系统。然 而,在实际的数据中心中,每个子系统可能由多个装置组成。举例来说,IMW的数据中心可能 有三个安装好的并联的500kW UPS,而且可能有十五个安装好的90kW CRAC单元。就能量管 理和基准测试的目的而言,我们的能量管理系统把每个子系统视为一个实体。因此,可能需 要聚集实际装置的方法。在特定的实施方案中,将一些装置聚集到模型的子系统之中可能是使用下列方法 完成的(1)合计的子系统铭牌额定值按千瓦计是装置铭牌能量额定值的总和;(2)合计的 子系统可用能量额定值按千瓦计是装置可用能量额定值的总和,在子系统内可针对装置冗 余进行调整;(3)如果装置是相同的,那么子系统的合计的空载比例和平方律功耗因素与 个别装置的对应的功耗因素相同。当考虑合计的子系统能量额定值的时候,如果装置配置在双路径系统中,那么子 系统可用容量只有装置可用容量之和的一半。如果装置配置在N+1配置中,那么子系统可 用容量是N/(N+1)乘以装置可用容量之和。如果子系统是为N+1和双路径冗余两者配置的, 那么子系统可用容量是N/(N+1)乘以装置可用容量之和的一半。其它专业的冗余选项(例 如,“环”或“捕捉者”设计)可能有通过检验推论的子系统可用容量。如果聚集在一起的装 置不是相同的,那么合计的功耗因素是用每个装置表现的总可用容量的分数加权的装置功 耗因素的加权平均值。为了确定加权平均值,在平均值计算中每个功耗因素都依照呈现那个因素的装置 表现的总PU的分数加权。对于大多数数据中心,在子系统内只使用一种类型的装置,所以 不需要加权平均。举例来说,事实上在所有的情况下,并联的一群UPS是同一产品型号。加 权平均方法只在子系统里面的装置混杂的情况下才是需要的。冗余度配置可以针对每个子系统分开进行处理,而且不在数据中心水平。实际的数据中心可能把冗余度非常不同地应用于不同的装置类型。举例来说,数据中心可能有2N 个UPS、N+1个泵、和非多余的冷却塔。许多其它的冗余度组合可能在实际的数据中心被观 察到。通过针对每种装置类型分开处理冗余度,模型可能是简单的但非常灵活。通过在子 系统里面处理冗余度,在考虑数据中心子系统互连的时候,冗余度作为变量可以除去,借此 允许在将子系统结合成数据中心的时候减少配置选项的数目。模型在每个子系统允许的冗 余类型是N、N+1、N+2、2N和2N+1。人们应该注意到冗余度数值只可能对于承受负荷的装 置类型是有意义的,所以不适用于照明或辅助设备之类的子系统。对于UPS之外的其它装置(例如,空调),在可用容量和铭牌容量之间可能有较大 的差异。这些容量考虑被包含在五参数装置模型中。然而,当装置结合成数据中心系统的 时候,必须小心地描述容量和负荷额定值。当定义数据中心负荷容量额定值的时候,可能使 用其它等同的术语,例如,“数据中心能量额定值”、“数据中心负荷额定值”或“数据中心千 瓦容量”。有一个实施方案,这个容量额定值可能被定义为设计和建造数据中心时支持的IT 负荷最大值。当定义数据中心负荷容量的时候,应该提出一些问题。举例来说,数据中心可 能有2MW的IT负荷能量容量但是只有IMW的冷却能力。从不同的角度看,人们可能把这个 视为2MW或IMW数据中心。然而,就这个实施方案的目的而言,子系统限于建立数据中心负 荷额定值的IT负荷。在这个范例中,数据中心额定值将是1MW。另一个范例是可能从输电干线汲取的2丽能量的数据中心。从某些观点看,这可 能被视为2MW的数据中心。然而,数据中心额定值可能是从IT负荷容量的观点定义的,而 且汲取2MW输电干线能量的数据中心通常只提供不足1丽的IT负荷。另外,输在特定点输 电干线的及时汲取不揭示任何关于数据中心终极容量的事情。另外一个范例是可能有IMW的额定电能量容量和远远超过IMW的冷却能力的数据 中心。然而,该系统设计或政策可能规定15%安全裕度。所以,该数据中心只是为IMW的 85%即850KW的可用能力设计的。所以,该数据中心的负荷容量额定值是850KW。进一步的范例是为5MW但不安装所有的设备而设计的数据中心。只有一个IMW的 UPS已安装好,而其它4个1丽的UPS的安装可能被延期。在这种情况下,当今建好的数据 中心只有IMW的额定能量,因此,用于效率分析目的的额定负荷是1MW。该数据中心很容易 升级到5MW,但不是5MW的数据中心。可能用于数据中心模型的概念可能是将动力和负荷表达为额定IT负荷的百分 比。这样,模型可以被“标准化”,而且各种不同的计算将被简化和不受千瓦容量的制约。数 据中心的额定IT负荷可能被定义为等于100%相等或“1标么值(Per-unit) ”而且以标么 值为额定值单位表达负荷和容量。举例来说,有安装好的2丽铭牌额定值UPS的1丽额定 负荷数据中心将被说成有2. 0标么值UPS额定值。可能出现合计能量额定值对于每个子系统都与是IT负荷相同的情况。换句话说, 看来额定1丽的数据中心应该有1丽的UPSUMW的PDUUMW的CRAC、mW的冷却器,等等。 然而,在大多数应用中,这是不实际的。事实上,子系统能量额定值可能被发现在许多情况 下远远超过IT负荷。这是能用实际范例清楚地举例说明的概念。表5展示典型的数据中 心子系统及其PU额定值的通常范围。表5各种不同的数据中心子系统及其典型的额定PU范围 如表5所示,许多子系统的铭牌选择参数可能比数据中心的IT负荷额定值大得 多。因为许多数据中心在只有额定负荷几分之一的实际负荷下操作,所以实际数据中心的 数据中心子系统可能在只有其铭牌额定值的极小分数下操作。举例来说,如果IMW额定值 的数据中心有安装好的5丽PDU但是只有300kW即其额定负荷的30 %正在运行,那么该PDU 子系统只以其铭牌额定值的0. 2X0. 3即6%在运行。这个一般的发现(即装置可能在其铭 牌能量以下运行)意味着固定损失在许多实际的数据中心可能变成对数据中心损失的占 优势的贡献。在此描述的累计方法在子系统类型内所有的装置等同地分享负荷的条件下数学 上是准确的。虽然对于一些装置类型(例如,UPS)这个条件可能通常得到满足,但是对于 其它的装置类型(例如,PDU)这个条件可能得不到满足,因为在相同的数据中心中通过不 同的PDU单元的能量流变化相当可观。所以,累计模型只有当能量流在该子系统的各个装 置之间平衡的时候才能准确地表达组合装置。然而,人们可能看到该模型对于与固定损失 和比例损失相关联的损失总是准确的,即使能量流不平衡的时候也是如此。所有的误差都 包含在平方律损失项之中。几乎对于所有的实际数据中心系统,累计的平方律项引起的误 差非常小。如果能量流在该子系统类型范围内的各个装置之间平衡,那么该误差是零。如 果平方律损失项与其它损失项相比很小,那么该误差也非常小。如果负荷与PU系统额定值 相比很小,那么该误差非常小,因为平方律损失随着负荷的平方下降。所以,该累计模型与包括每个单一装置的模型相比贡献非常小的误差,在DCiE方面通常比0. 5 %小得多。所以, 在此揭示的能量管理系统可以用于每个子系统的累计模型,但是必须考虑量化累计引起的
潜在误差。一旦确定标准化子系统的参数,就可以将各个子系统组合起来获得用于完整的数 据中心的模型。完整的数据中心模型可以用来确定为了建立子系统操作条件将把什么热负 荷或电负荷施于各种不同的子系统。然后,该模型可能将以与待建模的数据中心匹配的方 式把各个子系统的电能消耗合并。事实上所有的数据中心可能都遵循与子系统如何互连有关的基本的标准体系结 构,只有较小的变化。举例来说,IT负荷可能由PDU供电,PUS由UPS供电,UPS由开关设备 供电,等等。数据中心之间的大多数差异(例如,如何和在哪里存在冗余)与子系统如何由 装置组成有关而不是与子系统如何互连有关。给定一系列标准子系统,理想的目标将是形 成所有替代数据中心配置的详尽目录。这样,适合每种类型的数据中心的独立模型就可以 被预先构成和测试。在一个实施方案中,描述独立数据中心设计的架构通常是以图9中的数字100指 出的。如图所示,两条主电力总线102、104和流体主热流总线106、108被标识出来。主电 力总线102可能是开关设备和配电盘电源,而关键动力总线104可能是UPS输出。该模型 的标准子系统是由这两条总线之一供电的。室内热总线106包括在室内排放的所有的热, 而户外热总线108表示热量从哪里排放到户外。每个装置产生必定在热总线之一上传输的 热。数据中心系统可以被分成两个主要的子系统群体,动力系统110和冷却系统112。如图 所示,动力系统112把能量供应给IT负荷114。由此,可能产生两个目录动力系统目录和 冷却系统目录。将描述分成分别用于动力系统和冷却系统的分开的入口,而不是有单一的 数据中心目录,可以将目录条目数减少大约五分之四。此外,提供两个目录可以减少处理各 种不同动力和冷却组合的交互作用的复杂性和简化增添将来的数据中心动力和冷却配置。用于数据中心的可仿效的标准动力目录通常以图10中的数字120指出。目录120 表示在数据中心动力目录中只有六个不同的目录条目。图表中的每个列是目录条目。标准 的动力子系统被列在行中。就目录条目而言,每个动力子系统可能被接到实用动力、主要动 力、关键动力或它可能不存在。上述目录120代表已知的数据中心。冗余度可以在子系统 模型内处理而且在模型的这个水平不显示。用于数据中心的可仿效的标准冷却目录通常以图11中的数字130指出。该目录 130表示在数据中心的冷却目录中有二十三个不同的目录条目。当与来自动力目录的六个 条目组合的时候,获得描述任何数据中心的二十九个目录条目。如果引进新的子系统类型 或拓扑,这些目录是容易扩充的。为了描述使用目录的数据中心,指定动力系统和冷却系统的条目是唯一必不可少 的。举例来说,当使用来自图10和图11的表格考虑被描述为“动力系统类型1A、冷却系统 类型2B”的可仿效的数据中心的时候,用于这个数据中心的单线能量流图用图12A和12B举 例说明。图12A举例说明动力系统单线能量流,通常以140指出。图12B举例说明冷却系 统单线能量流,通常以150指出。在图12A的范例图表中能量流的数值以IT负荷要求和户 外条件开始引起最后造成对实用输电干线的电力需求和传输到户外的热流的能量流经过 那些数据中心子系统的复杂程序。能量的这种流动(即以需求开始而后做功再回到补给)起先似乎从能量从交流电源流过数据中心的一般概念后退。虽然能量由电力公司(mains utility)供应,但是所用能量的数量不由该公司确定,它是依据需求确定的。在数据中心的 情况下,需求始于IT负荷,IT负荷引起对电源和冷却装置的需求,后者依次引起那些装置 的电需求,而且这些电需求级联并且最后相加在一起确定数据中心所用能量的数量。如图12B所示,该图表将户内贡献热量的区段举例说明为“渗透”。这个区段不是 数据中心子系统,但是表示在数据中心的室内和户外之间的热漏失并且存在于所有的数据 中心。渗透是作为受室内和户外之间的温差驱动的热流建模的而且被加到空调系统的热负 荷中或从在空调系统的热负荷中减去。一些数据中心没有统一的或单一的设计,但是可能有按区域改变的基本设计。举 例来说,数据中心可能配置成有由房间冷却供应的区域和由排冷却供应的另一个区域。另 一个范例可能这样配置数据中心,以便用冷水和DX冷却单元混合冷却。为了报告的目的, 举例来说,比较不同区域的效率性能,把这些区域分开可能是令人想要的。在这种情况下, 那些区域可能依据能量管理系统远景像分开的数据中心那样处理,然后将数据累计获得完 整的数值。能量管理系统软件可能是为支持多种设计而设计的,或可能先运行分开的软件 例证,然后可能使用集合函数来组合数据。对于某些数据中心,把区域分开是不实际或不可行的,举例来说,两种类型的冷却 应用程序被用于同一数据中心。技术的混合可能是通过把数据中心的不止一个目录设计包 括在内并在它们之间区分热负荷建模的。热负荷可能是通过将固定的瓦数值分配给特定的 冷却系统,通过把负荷的特定百分比分数分配给每个冷却系统,或通过测量不同冷却系统 中的实际热流分配的。对于分享标准目录条目的冷却系统的组合(例如,使用共同的冷却 器设备的行内和房间冷却的混合),单一目录模型可能被使用和行和房间冷却的组合是在 子系统模型中完成的。用于在此描述的数据中心的能量流单线图表可能把所显示的各种不同的子系统 的瞬时能量流和容量利用呈现给使用者。理论上,所有的这些信息可能是直接测量的并且 显示在实际数据中心的能量监控系统中。在这种情况下,不需要计算。然而,这种方法不能 用来研究尚未建造的数据中心的性能,或在不同于测量时实际数据中心的条件的运行条件 下运行的数据中心的性能。该模型对于这个目的是必需的。另外,在大多数数据中心中,实 际上用仪器测量所有的能量流和装置动力汲取是不可能的,而模型能用来准确地估计遗漏 的数据。所以,使用模型计算能量流单线图中的能量流和热流的方法是需要的。假定子系统模型是从装置模型累计而成的,为了获得动力流和热流可能需要计算 的连接和顺序。如所述,计算可能以IT负荷作为输入开始,并且以实用输电干线动力汲取 和排放到户外的热量作为输出结束。计算的流程是用图13的模型评估流程图描述的,该图 展示用于上述的数据中心类型“动力1A,冷却2B”的样品模型评估流程图表。为了使用该图表评估该模型,流程从左边的IT负荷和户外温度着手。每个子系统 模型可能是在它的负荷输入变成可用的时候评估的。一些装置能被立刻评估,例如,没有负 荷输入的子系统(例如,发电机)和立刻提供负荷的子系统(例如,配电子系统)。UPS子 系统在对所有馈送其负荷输入的装置(关键总线)被评估之前不能被评估。与冷却相关的 子系统在通过将它的输入相加完成对整个室内热总线的评估之前不能被评估。冷却系统是 用以CRAC单元开始然后完成用于冷水泵的负荷输入的子系统评估的。当完成对所有的子系统的评估的时候,计算总的户外热和总的输电干线需求。图14举例说明的模型是有环形能量流的数据中心范例。如图所示,关键总线到 UPS的输入。接下来,UPS的输出热量到室内的热总线。接下来,室内的热总线到CRAH。最 后,CRAH的电负荷到关键总线,然后回到环路起点。如果CRAH在主总线上,那么这个环不 存在。该范例的环形能量流在图14中被加亮。环形能量流的另一个范例是开关设备损失 对建筑物来说是内部的并且用CRAH处理的情况。模型中的环形能量流可以用数学方法求解,例如,求解微分方程或使用收敛解法。 在大多数例证中,人们发现对于所有现实的情况这将引起可忽略的误差。因此,环形能量流 可以通过估计每单位额定系统负荷的装置负荷被除去,这可以用来估计装置损失。通过使 用估计值而非实际值,计算没有循环公式引用。这大大简化了计算,因为使用估计值所产生 的误差是二阶的并且非常小。另外,在它是因子的情况下只有几种类型的循环计算,所以只 有几个装置需要评估。环形能量流是选自目录的动力和冷却系统的性质。对于有环形能量流的每个目录 模型,破坏循环的方法必须作为修正被定义和建成模型。对于有环形能量流的每个目录数 据中心模型,这个问题能被明确地解决。能量流图和模型评估流程图可能相关但不匹配。能量流图清楚地表示数据中心中 子系统的物理互连。评估流程图表现用来评估数据中心模型的计算流程。这些图表的对 比举例说明对于像照明和空调那样的许多子系统能量流图与模型评估流程图相匹配。然 而,对于转换电力的装置,能量流图和单线图不匹配,如举例说明对于两种不同类型的装置 170、180能量流图和模型评估流程图之间的关系的图15A和15B所示。图15A所示的简单装置模型接受负荷并且计算装置170的用电。这个模型为有单 一电力连接的装置(例如,空调器、泵和灯)工作。图15B的模型代表用于像UPS、PDU、配线和变压器那样处理电力的装置(例如,装 置180)的能量流模型。在这张图中较小的内框中的装置模型获得负荷输入并且计算用电 量(electricaluse)。然而,这种类型的装置的用电量不出现在任何物理电连接中。给这 些类型的装置的物理输入能量连接是用电量和负荷之和。举例来说,有1丽负荷的1丽变 压器可能有2%即20千瓦的耗电量(损失)。在这种情况下给变压器的实际输入能量将是 1.02MW而输出将是1MW。没有关于可以直接测量到20千瓦损失的变压器的连接。为了得 到能量用途,必须测量实际测量的输入能量和输出能量之间的差异。在能量管理系统中,每个子系统类型的能量用途和热输出是可以测量的。在一些 情况下,例如,在此描述的类型的装置,能量计量装置可能被安装在能获得那个装置的能量 用途的线路上。然而,对于转换电力的装置,没有能为了获得能量用途被测量的线路,而改 为为了获得该装置能量用途必须获得两种物理测量之间的差异。因为这个理由,在实际的 数据中心中安装的物理测试设备不可能完全对应于预期的数据,而且一些计算或者物理仪 器使用点对数据中心模型的映射是必不可少的。人们应该观察到用来建立数据中心的能量使用模型的系统方法是在此描述的。该 模型从个别装置的性质开始,然后提供先把它们组合成标准化的子系统而后把这些子系统 组合成整个数据中心的程序。在此揭示的方法和系统可以用来识别为什么数据中心没有实现设计要求、规划数
26据中心未来的性能和为了帮助数据中心的操作员减少能源消费规划替代条件下的性能。依照这份揭示的实施方案,前面定义的方法可以在一个或多个通用计算机系统上 实现。举例来说,这份揭示各种不同的方面可以作为在通用计算机系统400(例如,图16所 示的系统)上运行的专用软件被实现。计算机系统400可能包括一个或多个输出装置401、 一个或多个输入装置402、通过互连机制405与一个或多个存储器装置404连接的处理器 403和一个或多个与互连机制405连接的储存装置406。输出装置401通常提供对外表达 的信息,范例包括监视器和打印机。输入装置402通常接受来自外部来源的信息,范例包 括键盘和鼠标。处理器403通常完成一系列导致数据操作的指令。处理器403通常是市 场上购买的处理器,例如,Intel Pentium、Motorola PowerPC、SGIMIPS、SunUltraSPARC 或 Hewlett-Packard PA-RISC处理器,而且可能是任何类型的处理器。存储器装置404 (例如, 磁盘机、存储器或用来储存数据的其它装置)通常用于在计算机系统400的操作期间储存 程序和数据。计算机系统400中的装置可能用至少一个互连机制405耦合在一起,该互连 机制可能包括,举例来说,在系统400内传送数据的一个或多个通信元素(例如,总线)。在图17中更为详细地展示的储存装置406通常包括一种计算机易读写的非易失 性的记录媒体911,在该媒体上储存一些信号,这些信号定义处理器要执行的程序或该程序 要处理的储存在媒体911之上或之中的信息。媒体可能是,举例来说,磁盘或闪速存储器。 通常,在运行时,处理器将数据从非易失性记录媒体911读到另一个存储器912之中,后者 考虑到与媒体911相比处理器将更快速地存取信息。这个存储器912通常是易失性的随机 存取存储器,例如,动态随机存取存储器(DRAM)、静态存储器(SRAM)。存储器912可能位于 储存装置406之中(如图所示)或位于存储器装置404之中。处理器403通常操纵存储器 404、912里面的数据,并且在完成处理之后将数据复制到媒体911上。多种用来管理数据在 媒体911和存储器404、912之间运动的机制是已知的,而这份揭示对此没有限制。这份揭 示不局限于特定的存储器装置404或储存装置406。计算机系统400可能是使用专门编程的专用硬件实现的,或可能是可使用高级计 算程序设计语言编程的通用计算机系统。举例来说,计算机系统400可能包括移动电话和 个人数字助理。计算机系统400通常运行操作系统,该操作系统可能是,举例来说,可从微 软公司购买的 Windows 95、Windows 98、Windows NT、Windows 2000、Windows ME、Windows XP> Windows Vista或其它操作系统;可从Apple Computer购买的MAC OS系统X ;可Sun Microsystems购买的Solaris操作系统、或可从各种不同的来源得到的UNIX操作系统(例 如,Linux)。许多其它的操作系统可能被使用,而且这份揭示不局限于任何特定的落实。举 例来说,本揭示的实施方案可能通知数据中心资源供应商限制对使用有运行Solaris操作 系统的Sim UltraSPARC处理器的通用计算机系统访问网络装置。虽然计算机系统400是作为一种可以在其上实践这份揭示的各种不同的方面的 计算机系统类型的范例展示的,但是人们应该领会到这份揭示不局限于在图16所示的计 算机系统上实现。这份揭示的各种不同的方面可以在与图16所示的相比有不同的体系结 构或组成部分的一台或多台计算机上实践。为了举例说明,本揭示的一个实施方案可能接 受使用若干以Motorola PowerPC处理器运行MAC OS系统X的通用计算机系统和若干运行 专利硬件和操作系统的专用计算机系统提供请求的网络装置。如图18描绘的那样,该系统的一个或多个部分可能被分配到与通信网络108耦合的一个或多个计算机(例如,系统109-111)上。用于通信网络108的物理媒体可能包 括任何技术上已知的,举例来说,实际的架设电缆和/或无线技术(例如射频、红外线,等 等)。此外,每种物理媒体可能遵从各种不同的标准,举例来说,CAT 5架设电缆标准或IEEE 802. 11、蓝牙和Zigbee无线电标准。计算机系统109-111也可能是通用计算机系统。举例 来说,这份揭示的各种不同的方面可能被分配到一个或多个计算机系统之中,这些计算机 系统被配置成为一台或多台客户计算机提供服务(例如,服务器)或作为某分布系统的一 部分完成全部的工作。更具体地说,这份揭示的各种不同的方面可能是在包括分布在依照 这份揭示的各种不同的实施方案实现各种不同的功能的一个或多个服务器系统之中的组 成部分的客户机-服务器系统上实现的。这些组成部分可能是在通信网络(例如,英特网) 上使用通信协议(例如,TP/IP)传送的可执行代码、中间代码(例如,IL)或翻译代码(例 如,Java)。为了举例说明,一个实施方案可能显示提供请求状态信息的网络装置,虽然解释 HTML的浏览器形成并且可能使用在独立的服务器上运行的数据翻译服务取回数据中心资 源供应商信息。本揭示的各种不同的实施方案可能是使用面向对象的程序设计语言(例如, SmallTalk、Java、C++、Ada或C#(C-Sharp))编程的。也可能使用其它面向对象的编程语 言。作为替代,可能使用功能的、手写的和/或逻辑的编程语言。这份揭示的各种不同的方 面可以在非编程的环境中实现(例如,按HTML、XML或其它的格式创造的文件,该文件在浏 览器程序的窗口中查看时提供图形用户界面(GUI)的诸方面或者实现其它的功能)。这份 揭示的各种不同的方面可以作为编程的或非编程的元素或其任何组合被实现。举例来说, 提供政策用户界面可能是使用Microsoft Word文件实现的,而为管理提供请求而设计的应 用程序可能是用C++编写的。人们应该领会到通用计算机系统与这份揭示一致可以实现这 份揭示范围之外的功能。举例来说,该系统的诸方面可能是使用现有商品实现的,举例来 说,数据库管理系统,例如,可从Seattle WA的Microfoft购买的SQL Server)、来自加州 RedwoodShores 的 Oracle 的 Oracle 数据库、来自瑞典 UPPPSALA 的 MySQLAB 的 MySQL· 和来 自纽约Armonk的IBM的WebSphere中间设备。如果SQL服务器被安装在通用计算机系统 上实现本揭示的实施方案,那么同一通用计算机系统可能能够支持用于各式各样的应用程 序的数据库。基于上述的揭示,这份揭示不局限于特定的计算机系统平台、处理器、操作系统、 网络或通信协议对于熟悉这项技术的人应该是明显的。另外,本揭示不局限于特定的体系 结构或程序设计语言也应该是明显的。至此已经描述了这份揭示的至少一个说明性的实施方案,各种不同的变更、修正 和改进对于熟悉这项技术的人将很容易发生。这样的变更、修正和改进预计在这份揭示的 范围和精神之内。因此,前面的描述仅仅作为范例而且不倾向于作为限制。这份揭示的界 限只是在权利要求书及其等价文件中限定。
权利要求
一种管理数据中心能源效率的方法,该方法包括在数据中心的众多位置进行初始能量测量;以初始能量测量结果为基础建立数据中心的效率模型;使用该效率模型建立基点性能水平;进行后续能量测量;以及将后续能量测量的结果与基点性能水平进行比较。
2.根据权利要求1的方法,其中进行后续能量测量包括连同测量设备使用基于处理器 的数据中心管理系统。
3.根据权利要求2的方法,进一步包括如果后续能量测量的结果不同于基点性能水平 而且相差大于指定的数量则提供报警。
4.根据权利要求1的方法,其中建立效率模型包括使用涉及与数据中心位置相关联的 气候的数据建立效率模型。
5.根据权利要求1的方法,其中建立效率模块包括 识别在数据中心使用的汲取能量的装置,为每个装置,选择适合该装置的能量输入的额定能量和可用能量之一,以及 为每个装置,确定该装置是否促成固定损失、比例损失、平方律损失还是其组合。
6.根据权利要求5的方法,其中建立效率模块进一步包括累计各个装置的能量损失以 获得子系统损失。
7.根据权利要求6的方法,其中建立效率模块进一步包括累计各个子系统的能量损失 以获得数据中心损失。
8.一种用来管理数据中心的能源效率的数据中心管理系统,其中包括 有为完成下列各项任务而编程的至少一个处理器的数据中央管理器 接受与在数据中心的众多位置的初始能量测量有关的数据;以与初始能量测量有关的数据为基础建立数据中心的效率模型; 使用该效率模型建立基点性能水平; 接受与后续能量测量有关的数据;以及 将后续能量测量的结果和基点性能水平进行比较。
9.根据权利要求8的数据中心管理系统,其中进行后续能量测量包括在至少一个网络 上与能量测量装置通信。
10.根据权利要求8的数据中心管理系统,其中至少一个处理器是为在后续能量测量 的结果不同于基点性能水平而且相差大于指定数量的时候提供报警而编程的。
11.根据权利要求8的数据中心管理系统,其中建立效率模型包括使用涉及与数据中 心位置相关联的气候的数据建立效率模型。
12.一种建立数据中心能源效率模型的方法,该方法包括 测量进入数据中心的输入能量;测量数据中心的能量负荷;以及 测量数据中心的冷却负荷。
13.根据权利要求12的方法,其中测量能量负荷包括测量UPS和PDU的负荷。
14.根据权利要求12的方法,其中测量数据中心的冷却负荷包括测量至少由CRAH、CRAC、风扇、冷却单元、通风单元、冷却塔和泵之一产生的负荷。
15.根据权利要求12的方法,进一步包括测量数据中心的环境条件。
16.一种建立数据中心能源效率模型的方法,该方法包括 识别在数据中心使用的汲取能量的装置;为每个装置,选择适合该装置的能量输入的额定功和可用能量率之一;以及 为每个装置,确定该装置是否促成固定损失、比例损失、平方律损失还是其组合。
17.根据权利要求16的方法,进一步包括累计各个装置的能量损失以获得子系统损失。
18.根据权利要求17的方法,进一步包括累计子系统的能量损失以获得数据中心损失。
19.根据权利要求16的方法,其中装置被视为涉及动力的装置和涉及冷却的装置。
20.根据权利要求16的方法,进一步包括识别除了装置之外造成损失的原因,以及依 据统计数据预测损失数量。
21.根据权利要求16的方法,进一步包括提供将大部分数据中心配置包括在内的数据中心目录,该数据中心目录有可仿效动力配置的动力目录和可仿效冷却配置的冷却目录,以及 将该动力目录和该冷却目录结合起来产生数据中心配置。
22.根据权利要求16的方法进一步包括在模型中为圆形从属物单一化计算。
23.一种用来建立数据中心能源效率模型的数据中心管理系统,该系统包括 有为完成下列各项任务编程的至少一个处理器的数据中心管理器识别在数据中心使用的汲取能量的装置;为每个装置,选择适合该装置的能量输入的额定能量和可用能量之一;以及 为每个装置,确定该装置是否促成固定损失、比例损失、平方律损失还是其组合。
24.根据权利要求23的数据中心管理系统,其中那至少一个处理器是为累计各个装置 的能量损失获得子系统损失而编程的。
25.根据权利要求24的数据中心管理系统,其中那至少一个处理器是为累计子系统的 能量损失获得数据中心损失而编程的。
26.—种上面存有指令序列的计算机易读的媒体,该指令序列包括将导致处理器完成 下列任务的指令识别数据中心使用的汲取能量的装置;为每个装置,选择适合该装置的能量输入的额定能量和可用能量之一;以及 为每个装置,确定该装置是否促成有助于如固定损失、比例损失、平方律损失还是其组
全文摘要
一种管理数据中心能源效率的方法,其包括在数据中心众多位置进行初始能量测量,以初始测量能量结果为基础建立数据中心的效率模型,使用该效率模型建立基点性能水平,进行后续能量测量,以及将后续能量测量的结果与基点性能水平进行比较。进一步公开关于管理能源效率和对能源效率进行建模的其他方法和系统。
文档编号G06F17/50GK101933019SQ200880120224
公开日2010年12月29日 申请日期2008年10月29日 优先权日2007年10月29日
发明者尼尔·罗斯莫森 申请人:美国能量变换公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1