主机代管电气架构的制作方法

文档序号:16168525发布日期:2018-12-07 21:46阅读:411来源:国知局
主机代管电气架构的制作方法

发明领域

根据本发明的至少一个实施例主要涉及用于设计、监测、和操作包括数据中心的关键的主机代管电气建筑系统,并特别地涉及用于优化主机代管中心设计的系统和方法。

相关技术讨论

由于复杂性和规模经济,各个公司通常将本地数据中心的管理外包给主机代管(或主机托管(colocation))中心。主机代管中心为其他公司的服务器,存储器,和网络设备提供空间,电源,冷却和物理安全。主机代管中心也可以最低的开销和复杂程度提供各种电信和网络服务。外包给主机代管中心可带来显著的好处,例如,冗余系统带来的更高可靠性,全天候监测及安全保障,较低的网络延时,和以较低成本获取更高的带宽。进一步地,外包给主机代管中心可允许各公司通过将IT人员转移到其他任务而在信息技术(IT)支持方面节约成本。主机代管中心的普及已经促使各主机代管公司持续扩大主机代管建筑和中心。随着进一步的扩大,主机代管运营商们已将眼光聚集到提供可靠及低成本的系统,其使用可被准确地划分给客户并对客户进行计费。

概要

本发明的第一个方面涉及一种管理设施内配电系统的方法。该方法包括在计算机系统中从监测系统接收与配电系统各组件实际能量使用相关的数据,在计算机系统中接收更改所述配电系统的请求,利用计算机系统,使用用于配电系统的系统优化功能并基于所述请求和与实际能量使用相关的数据提供一种修正后的配电系统设计,根据修正后的配电系统设计更改配电系统以提供更改后的设施内的配电系统;以及在计算机系统中从监测系统接收与更改后的配电系统各组件的实际能量使用相关的数据。

该方法可进一步包括利用计算机系统利用与更改后的配电系统各组件的实际能量使用相关数据来验证更改后的配电系统。在该方法中,利用系统优化功能可包括迭代地确定系统参数以获得优化解决方案。

在该方法中,迭代地确定系统参数可包括确定与系统的可靠性、效率、风险、和冗余度中的至少一项相关的参数。在该方法中,迭代地确定系统参数也可包括基于配电系统的冗余级别和配电系统所处地理位置的室外气候中的至少一项计算用于所述配电系统的效率度量。迭代地确定系统参数可进一步地包括,基于在所述配电系统的多个测量点对于电能质量的测量,计算用于所述配电系统的当前系统可靠性度量。

在该方法中,迭代地确定系统参数可包括:分析所述监测系统数据,以确定所述配电系统的空闲容量,比较所述空闲容量与使用需求,基于所述空闲容量为所述配电系统各组件使用的变化提供建议。迭代地确定系统参数也可包括:确定和更新至少一个用于所述配电系统的实时冗余值。

本发明的另一个方面涉及一种管理配电系统的系统。该系统包括监测系统,其具有多个与配电系统各组件连接的电气监测器;和控制器,其与所述监测系统连接并被配置为:从监测系统接收与所述配电系统各组件的实际能量使用相关的数据,接收更改所述配电系统的请求,利用用于配电系统的系统优化功能并基于所述请求和与实际能量使用相关的数据产生修正后的配电系统设计,并从所述监测系统接收与更改后的配电系统各组件的实际能量使用相关的数据。

在该系统中,控制器可被配置为利用与更改后的配电系统各组件实际能量使用相关的数据来验证更改后的配电系统。另外,利用系统优化功能可包括:迭代地确定系统参数以获得优化解决方案。

在该系统中,迭代地确定系统参数包括:确定与系统的可靠性、效率、风险、和冗余度中的至少一项相关的参数。迭代地确定系统参数也可包括:基于配电系统的冗余级别和配电系统所处地理位置的室外气候中的至少一项计算用于所述配电系统的效率度量。迭代地确定系统参数可进一步包括:基于在所述配电系统中的多个测量点对于电能质量的测量,计算用于配电系统的当前系统可靠性度量。

在该系统中,迭代地确定系统参数可包括:分析监测系统数据,以确定配电系统的空闲容量,比较所述空闲容量与使用需求,并基于所述空闲容量为所述配电系统各组件使用的变化提供建议。迭代地确定系统参数也可包括:确定和更新至少一个用于所述配电系统的实时冗余值。

本发明的另一方面涉及一种计算机可读介质,其上储存指令序列。所述指令序列可包括将使处理器进行下列操作的指令:从所述监测系统接收与配电系统各组件的实际能量使用相关的数据,接收更改所述配电系统的请求,利用用于配电系统的系统优化功能并基于所述请求和与实际能量使用相关的数据产生修正后的配电系统设计;和从监测系统接收与更改后的配电系统各组件的实际能量使用相关的数据。

在计算机可读介质中,所述指令序列可进一步包括将使处理器利用与更改后的配电系统各组件的实际能量使用相关的数据来验证更改后的配电系统的指令序列。在该计算机可读介质中,所述指令序列可进一步包括将使处理器利用所述系统优化功能迭代地确定系统参数以获得优化解决方案的指令序列。在该计算机可读介质中,迭代地确定系统参数可进一步包括确定与系统的可靠性、效率、风险、和冗余度中的至少一项相关的参数。

本发明的另一方面涉及一种管理设施内配电系统的方法。该方法可包括:在计算机系统中从监测系统接收与配电系统各组件的实际能量使用相关的数据,利用计算机系统确定配电系统的效率度量,在计算机系统中接收与电子计算机系统的冗余级别和设施所处的地理位置的气候数据中的至少一项相关的数据,基于效率度量及所述与配电系统的冗余级别和设施的地理位置的气候数据中的至少一项相关的数据,确定更改后的效率度量,和在图形用户界面上向用户显示更改后的效率度量的表示。

该方法可进一步包括:在计算机系统中接收更改配电系统的请求,利用计算机系统,基于所述请求和更改后的效率度量提供修正后的配电系统设计,和根据修正后的配电系统设计更改配电系统以提供更改后的设施内的配电系统。另外,该方法可进一步包括:确定和显示用于更改后的配电设施的更改后的效率度量的表示。

在该方法中,计算机系统可被进一步配置为确定配电系统内至少一组冗余设备的当前冗余级别;并被配置为基于所述当前冗余级别确定更改后的效率度量。所述计算机系统可被进一步配置为确定至少一组冗余设备的可选冗余级别,并基于所述可选冗余级别确定更改后的效率度量。

在该方法中,所述计算机系统被配置为接收配电系统内对于第一天气概况和第二天气概况与HVAC能耗相关的数据,并基于第一天气概况确定更改后的效率度量的第一个值,及基于第二天气概况确定更改后的效率度量的第二个值。

在该方法中,计算机系统可被配置为接收配电系统内对于设施的第一温度设置点和设施内的第二温度设置点与HVAC能耗相关的数据,并可被配置为基于第一温度设置点确定更改后的效率度量的第一个值,及基于第二温度设置点确定更改后的效率度量的第二个值。

本发明的另一方面涉及管理配电系统的系统。该系统包括:监测系统,其具有多个与配电系统各组件连接的电气监测器,和控制器,其与监测系统连接并被配置为从所述监测系统接收与所述配电系统各组件的实际能量使用相关的数据,确定配电系统的效率度量,接收与电子计算机系统冗余级别和设施的地理位置的气候数据中的至少一项相关的数据,基于所述效率度量,及所述与配电系统冗余级别和设施的地理位置的气候数据中的至少一项相关的数据,确定更改后的效率度量,和向图形用户界面提供更改后的效率度量的表示。

在该系统中,控制器可进一步被配置为:接收更改配电系统的请求,基于所述请求和所述更改后的效率度量提供修正的配电系统设计,以及根据修正后的配电系统设计更改配电系统以提供更改后的设施内的配电系统。

该系统可进一步包括和控制器连接的显示器,其中,所述控制器被进一步配置为确定更改后的配电设施的更改后的效率度量的表示并输出给所述显示器。

在该系统中,所述控制器可进一步被配置为确定配电系统内至少一组冗余设备的当前冗余级别,并被配置为基于当前冗余级别确定更改后的效率度量。在该系统中,控制器可进一步被配置为确定至少一组冗余设备的可选冗余级别,并基于所述可选冗余级别确定更改后的效率度量。在该系统中,控制器可被配置为接收所述配电系统内对于第一天气概况和第二天气概况与HVAC能耗相关的数据,并可被配置为基于第一天气概况确定更改后的效率度量的第一个值,及基于第二天气概况确定更改后的效率度量的第二个值。

在该系统中,控制器可进一步被配置为接收配电系统内对于设施的第一温度设置点和设施内的第二温度设置点与HVAC能耗相关的数据,并可被配置为基于第一温度设置点确定更改后的效率度量的第一个值,及基于第二温度设置点确定更改后的效率度量的第二个值。

本发明的另一方面涉及一种计算机可读介质,其上储存指令序列,包括将使处理器进行下列操作的指令:从监测系统接收与设施内配电系统各组件的实际能量使用相关的数据,确定配电系统的效率度量,接收与配电系统冗余级别和设施的地理位置的气候数据的至少一项相关的数据,基于效率度量和与电子计算机系统的冗余级别与设施的地理位置的气候数据中的至少一项,确定更改后的效率度量,以及为图形用户界面提供更改后的效率度量的表示。

该计算机可读介质,进一步包括指令序列,其指令使处理器:接收更改配电系统的请求,以及基于所述请求和所述更改后的效率度量提供修正的配电系统设计。该计算机可读介质,进一步包括指令序列,其指令使处理器:确定并提供给显示器更改后配电设施的更改后的效率度量的表示。

另外,该计算机可读介质,进一步可包括指令序列,该指令序列中的指令将使处理器执行以下操作:确定所述配电系统内至少一组冗余设备的当前冗余级别,并基于所述当前冗余级别确定更改后的效率度量。所述指令序列可包括使处理器执行以下操作的指令:确定至少一组冗余设备的可选冗余级别,并基于所述可选冗余级别确定更改后的效率度量。

在该计算机可读介质中,所述指令序列可进一步包括将使处理器执行以下操作的指令的指令序列:接收所述配电系统内对于第一天气概况和第二天气概况与HVAC能耗相关的数据,并基于第一天气概况确定更改后的效率度量的第一个值,及基于第二天气概况确定更改后的效率度量的第二个值。

本发明的另一方面涉及一种管理设施内配电系统的方法。该方法可包括:在计算机系统中从监测系统接收与配电系统各组件的实际能量使用相关的数据,利用计算机系统,识别配电系统的当前冗余级别,比较当前冗余级别和所需冗余级别,得出比较结果,并在计算机系统显示器上显示所述比较结果。

该方法可进一步包括:在计算机系统中接收更改配电系统的请求,利用计算机系统,基于所述请求和与配电系统的实际能量使用相关的数据,提供修正的配电系统设计,和对所述修正的配电系统设计进行冗余检查。该方法可进一步包括:通过计算机系统计算修正的配电系统设计的至少一处冗余故障情况。在该方法中,识别当前冗余级别可包括利用计算机系统确定冗余级别。

该方法可进一步包括利用计算机系统识别配电系统内易出现可能导致当前冗余级别发生变化的故障的薄弱点。该方法可进一步包括在显示器上显示更改薄弱点以减少出现故障的建议。该方法可进一步包括探测配电系统内的组件故障,并据此对当前冗余级别进行更新。该方法可进一步包括响应于探测故障,在显示器上显示更改配电系统的建议。

在该方法中,识别当前冗余级别可包括:制备配电系统内的功率流的层次化表示,并由最低的层级节点开始,确定在所述层次化表示中被识别的多个层级节点中的每一个的冗余度。

本发明的另一方面涉及用于管理设施内配电系统的系统。该系统包括:显示器;监测系统,其具有多个与所述配电系统各组件连接的电气监测器;和控制器,其与监测系统和显示器连接,并被配置为:从所述监测系统接收与所述配电系统各组件的实际能量使用相关的数据,识别配电系统的当前冗余级别,比较当前冗余级别和所需冗余级别,得出比较结果,并在显示器上显示比较结果。

在该系统中,所述控制器可被配置为:识别当前冗余级别;并可进一步被配置为基于由控制器获得的系统信息确定冗余级别。在该系统中,所述控制器可被配置为识别配电系统内易出现可导致当前冗余级别发生变化的故障的薄弱点。在该系统中,所述控制器可进一步被配置为在显示器上显示更改薄弱点以减少出现故障的建议。

在该系统中,所述控制器可进一步被配置为探测配电系统内的组件故障,并据此对当前冗余级别进行更新。所述控制器可进一步被配置为响应于探测故障,在显示器上显示更改配电系统的建议。在该系统中,识别当前冗余级别可进一步包括:制备配电系统内的功率流的层次化表示,并由最低的层级节点开始,确定在所述层次化表示中被识别的多个层级节点中的每一个的冗余度。

本发明的另一方面涉及一种计算机可读介质,其上储存指令序列,所述指令序列包括将使处理器进行下列操作的指令:从监测系统接收与设施内配电系统各组件的实际能量使用相关的数据,识别配电系统的当前冗余级别,比较当前冗余级别和所需冗余级别,得出比较结果,和产生比较结果的输出用于显示器单元。

在该计算机可读介质中,所述指令序列包括识别当前冗余级别的指令,所述识别当前冗余级别的指令包括将使处理器接收用于配电系统的布局信息,并基于所述布局信息确定冗余级别的指令。

在该计算机可读介质中,所述指令序列包括将使处理器识别配电系统内易出现可导致当前冗余级别发生变化的故障的薄弱点,并为显示器产生显示更改薄弱点以减少出现故障的建议的指令。

在该计算机可读介质中,所述指令序列包括将使处理器探测配电系统内的组件故障,并据此对当前冗余级别进行更新的指令。在该计算机可读介质中,所述指令序列包括将使处理器响应于探测故障,产生用于显示器显示更改配电系统的建议的指令。

在该计算机可读介质中,所述指令序列包括识别当前冗余级别的指令,并进一步包括将使处理器制备配电系统内的功率流的层次化表示,和由最低的层级节点开始,确定在多个所述层次化表示中可识别的层级节点中的每一个的冗余度的指令。

本发明的另一方面涉及用于管理设施内配电系统的方法。该方法可进一步包括:在计算机系统中接收给所述配电系统添加电气负载的请求;利用计算机系统,确定电气负载的添加会导致配电系统的安全容量水平被超越;在计算机系统中从连接于配电系统的监测系统接收与配电系统各组件的实际能量使用相关的数据;基于与实际能量使用相关的数据,利用计算机系统,产生更新的安全容量水平;利用计算机系统,确定电气负载的添加是否会导致所述更新的安全容量水平被超越;如果电气负载的添加不会导致所述更新的安全容量水平被超越,则为配电系统添加电气负载。

该方法可进一步包括:如果电气负载的添加会导致所述更新的安全容量水平被超越,则更改配电系统以创造附加的空闲容量。该方法可进一步包括:为配电系统添加电气负载。

该方法可进一步包括:利用计算机系统,基于所述与实际能量使用和安全容量水平相关的数据确定配电系统的空闲容量。另外,该方法可进一步包括:在计算机系统中周期性地接收配电系统各组件更新的实际能量使用;和基于所述配电系统各组件更新的实际能量使用,周期性地更新配电系统的空闲容量。

该方法可进一步包括:利用通信网络将计算机系统连接到监测系统,以及在计算机系统中,从嵌入配电系统组件内的监测设备接收能量使用数据。另外,该方法可进一步包括:在计算机系统的显示器上显示配电系统的图形表示,连同显示配电系统的至少一个组件的实际能量使用指示,并从计算机系统的用户接收与配电系统空闲容量相关的数据。

本发明的另一方面涉及一种管理设施内配电系统的系统。该系统可包括:显示器;监测系统,其具有多个与配电系统各组件连接的电气监测器;和控制器,其与监测系统和显示器连接。所述控制器可被配置为:接收给所述配电系统添加电气负载的请求;确定电气负载的添加会导致配电系统的安全容量水平被超越;从监测系统接收与配电系统各组件的实际能量使用相关的数据;基于所述与实际能量使用相关的数据,产生更新的安全容量水平;确定电气负载的添加是否会导致所述更新的安全容量水平被超越;以及,如果电气负载的添加不会导致所述更新的安全容量水平被超越,则提供将为配电系统添加电气负载的指令,用于在显示器上输出。

在该系统中,所述控制器可进一步被配置为:如果电气负载的添加会导致所述更新的安全容量水平被超越,则提供将更改配电系统以创造附加的空闲容量的指令,用于在显示器上输出。所述控制器可进一步被配置为:基于与实际能量使用相关的数据和所述安全容量水平确定配电系统的空闲容量。

在该系统中,所述控制器可进一步被配置为:周期性地接收配电系统各组件更新的实际能量使用;以及基于所述配电系统各组件更新的实际能量使用,周期性地更新配电系统的空闲容量。该系统可进一步包括:连接配电系统和电力监测系统的通信网络。

在该系统中,所述监测系统可包括嵌入配电系统组件内并和通信网络连接的监测设备。在该系统中,所述控制器可被配置为:提供指令给显示器以显示配电系统的图形表示,连同显示配电系统的至少一个组件的实际能量使用指示;以及从系统用户接收与配电系统空闲容量相关的数据。

本发明的另一方面涉及一种计算机可读介质,其上储存指令序列,所述指令序列包括将使处理器进行下列操作的指令:接收给所述配电系统添加电气负载的请求;确定电气负载的添加会导致配电系统的安全容量水平被超越;从监测系统接收与配电系统各组件实际能量使用相关的数据;基于所述与实际能量使用相关的数据,产生更新的安全容量水平;确定电气负载的添加是否会导致所述更新的安全容量水平被超越;以及如果电气负载的添加不会导致所述更新的安全容量水平被超越,则提供将为配电系统添加电气负载的指令,用于在显示器上输出。

在该计算机可读介质中,所述指令序列可包括将使处理器进行以下操作的指令:如果电气负载的添加会导致所述更新的安全容量水平被超越,则产生更改配电系统以创造附加的空闲容量的指令,用于在显示器上输出。

在该计算机可读介质中,所述指令序列可包括将使处理器进行以下操作的指令:基于与实际能量使用相关的数据和所述安全容量水平,确定配电系统的空闲容量。另外,所述指令序列可包括将使处理器进行以下操作的指令:周期性地接收配电系统各组件更新的实际能量使用,以及基于所述配电系统各组件更新的实际能量使用,周期性地更新配电系统的空闲容量。

在该计算机可读介质中,所述指令序列可包括将使处理器进行以下操作的指令:提供指令给显示器以显示配电系统的图形表示,连同显示配电系统的至少一个组件的实际能量使用指示;以及从系统用户接收与配电系统空闲容量相关的数据。

本发明的另一方面涉及一种管理设施内配电系统的方法。该方法可包括:利用计算机系统,在配电系统内的多个节点用电力监测系统进行电能质量相关测量;在计算机系统中,从电力监测系统接收与配电系统内多个节点的电能质量相关的数据;以及基于与电能质量相关的数据,利用计算机系统,产生配电系统的当前网络可靠性状态。

该方法可进一步包括:将电力监测系统与计算机系统之间用通信网络连接,并通过通信网络传送与电能质量相关的数据。该方法可进一步包括:利用计算机系统,基于所进行的测量和配电系统内至少一个组件的电能质量传送功能,对配电系统内不同于多个节点的节点的电能质量进行估测。

方法可进一步包括:周期性地更新所述至少一个组件的电能质量传送功能。另外,该方法可进一步包括:利用计算机系统,基于与电能质量相关的测量和电能质量的估测,为配电系统内至少一个组件的停电提供预测。进一步地,该方法可进一步包括:利用计算机系统,基于与电能质量相关的测量和电能质量的估测,为配电系统内至少一个组件制定维护计划。该方法可进一步包括:基于在多个节点更新的电能质量的测量,周期性地更新当前网络可靠性状态。

本发明的另一方面涉及一种管理设施内配电系统的系统。该系统可包括:显示器;电力监测系统,其具有多个与配电系统连接的电气监测器;和控制器,其与电力监测系统和显示器连接。所述控制器可被配置为:从电力监测系统接收与配电系统内多个节点的电能质量相关的数据;并基于与电能质量相关的数据,产生配电系统的当前网络可靠性状态,并将所述状态输出给显示器。

该系统可进一步包括:连接电力监测系统和配电系统的通信网络。在该系统中,所述控制器可进一步被配置为:基于所进行的测量和配电系统内至少一个组件的电能质量传送功能,对配电系统内不同于多个节点的节点的电能质量进行估测。

在该系统中,所述控制器可进一步被配置为:周期性地更新所述至少一个组件的电能质量传送功能。在该系统中,所述控制器可进一步被配置为:基于与电能质量相关的测量和所述电能质量的估测,为配电系统内至少一个组件的停电提供预测。所述控制器可进一步被配置为:基于与电能质量相关的测量和所述电能质量的估测,为配电系统内至少一个组件制定维护计划。在该系统中,所述控制器可进一步被配置为:基于在多个节点的更新的电能质量的测量,更新当前网络可靠性状态。

本发明的另一方面涉及一种计算机可读介质,其上储存指令序列,所述指令序列包括使处理器进行下列操作的指令:从电力监测系统接收与配电系统内多个节点的电能质量相关的数据;和基于与电能质量相关的数据,产生关于配电系统的当前网络可靠性状态,并将所述状态输出给显示器。

在该计算机可读介质中,指令序列可包括使处理器执行以下操作的指令:基于测量数据和配电系统内至少一个组件的电能质量传送功能,对配电系统内不同于多个节点的节点的电能质量进行估测。在该计算机可读介质中,指令序列可包括使处理器周期性地更新至少一个组件的电能质量传送功能的指令。

在该计算机可读介质中,指令序列可包括使处理器执行以下操作的指令:基于与电能质量相关的测量和电能质量的估测,为配电系统内至少一个组件的停电提供预测。在该计算机可读介质中,指令序列可包括使处理器基于与电能质量相关的测量和电能质量的估测,为配电系统内至少一个组件制定维护计划的指令。在该计算机可读介质中,指令序列可包括使处理器基于在多个节点的更新的电能质量的测量,更新当前网络可靠性状态的指令。

附图简述

附图不旨在按比例绘制。在附图中,各图中所示的每个相同或几乎相同的组件由同样的标号来表示。为清楚起见,可能并非在每个附图中标记了每个组件。在附图中:

图1为计算机系统的一个实例的框图,本发明的各个方面可通过该系统被实现;

图2为包括数据中心管理系统的分布式系统的一个实例示意图;

图3为根据一实施例的优化系统的一个实例的框图;

图4为根据一实施例的包括监测和控制系统的主机代管电气结构的框图;

图5为根据一实施例的电网系统的框图;

图6为根据一实施例的优化系统的框图;

图7为根据一实施例的优化电网系统的方法的流程图;

图8A为根据一实施例的图形接口图;

图8B为根据一实施例的成本分析报告图;

图9为根据一实施例的图形接口图;

图10为根据一实施例的电网的框图;

图11为根据一实施例的用于展示冗余网络的电气系统的框图;

图12为根据一实施例的UPS效率曲线图;

图13为根据一实施例计算调整的和未调整的PUE度量的方法的流程图;

图14为根据一实施例确定调整的和未调整的能量效率度量的方法的流程图;

图15为根据一实施例的电气系统的层级的框图;

图16为根据一实施例的用于关键建筑的冗余电网的框图;

图17为根据一实施例的确定RTRD度量的方法的流程图;

图18为根据一实施例的进行冗余检查的方法的流程图;

图19A为根据一实施例的N型冗余的框图;

图19B为根据另一实施例的N型冗余的框图;

图19C为根据另一实施例的N型冗余的框图;

图20为根据另一实施例的冗余及容量报告图;

图21A为根据一实施例的显示UPS冗余检查状态报告的框图;

图21B为根据一实施例的显示冗余架构的图形表示报告的框图;

图22A为根据一实施例的显示负载曲线图和相应数据表格的报告的框图;

图22B为根据一实施例的显示负载示图和相应数据表格的报告的框图;

图22C为根据一实施例的显示负载示图和相应数据表格的报告的框图;

图23为根据一实施例的电网的安全缓冲示图;

图24为根据一实施例的空闲容量示图;

图25为根据一实施例的利用率曲线图;

图26为根据一实施例的利用率曲线的另一实例图;

图27为根据一实施例的确定STA的方法的流程图;

图28为根据一实施例的产生空闲容量的方法的流程图;

图29为根据一实施例的基于IT的可视化的框图;

图30为根据一实施例的基于设施的可视化的框图;

图31为根据一实施例的基于冷却的可视化的框图;

图32为根据一实施例的确定期望值最大化的方法的流程图;

图33为根据一实施例的变压器示意图;

图34为根据一实施例的用于显示PRI度量分析的模拟网络示意图;

图35为根据一实施例的显示在每个未观察节点的电能质量的对数似然示意图;以及

图36为根据一实施例的包括最大似然参数的电能质量对数似然示意图。

详细描述

为提供一种有效的解决方案,关键的主机代管设施的运营商,例如数据中心,需要平衡相关设施的多个变量,如运营商或用户的风险,可靠性和成本。服务提供商在现有的代管设施通常缺乏一种准确的方法来对客户收取客户的实际能量和资源使用的费用。然而总运营成本可能是确定的,当提供不同级别的服务(即冗余)的时候,这些总成本对于单个客户的分摊可能很难确定。通常,主机代管中心的提供商估计成本的误差范围约为5%至10%。如果没有一种方法来基于实际资源使用情况提供准确的价格,代管服务提供商则缺乏一种可靠的方法来降低成本,同时还需保证代管服务的可靠性和满足用户的需求。

本发明描述的至少一些实施例提供一种系统和/或方法,其允许主机代管中心的用户或设施管理者利用功率可靠性、电力使用效率、冗余度和成本估算能力的度量,在实时的基础上,以平衡最终用户的风险、可靠性和成本的变量,为客户提供可以适当定价的个性化解决方案。本发明中所描述的用以评价主机代管中心的在至少一些系统中使用的度量可被调整,以适应特定的天气,特定国家的环境,以及其他位置等具体情况。

本发明所描述的至少一些系统和方法将可靠性集中分析工具与节省成本分析工具和数据中心管理工具相结合以提供实时基础上的准确度量。此外,该系统和方法可以提供主机代管架构管理报告,以及对屏幕开发和更新的基础设施组件的最佳实践指南。进一步地,该系统和方法可以提供,特别集中的主机代管架构,对于电源事故通知(即事件通知)的子解决方案,备用发电机测试和带时间标记的地理数据记录,用以准确地确定电力事故根本原因。

本发明所提供的主机代管架构的系统和方法的运营商和用户可得到节约成本和可靠性的益处。首先,本发明所提供的主机代管架构管理系统和方法可为数据中心提供电源效率分析。电源效率分析可用于识别和跟踪分配和设备损耗,谐波损耗(总损耗及设备损耗)和数据中心总负载对于IT负载的电力输送比。这些度量可以帮助客户降低每个IT机架的能量成本从而改善其成本底线。

第二,本发明所提供的主机代管架构管理系统和方法可以接收来自多个用户的输入,并且可以提供有针对性的输出到负责运行和维护配电基础设施的用户。这些用户可包括现场操作人员,电气工程技术人员,以及设施或数据中心管理人员。通常,在现有的系统中,如果一个IT管理人员请求电气系统的改变,例如由于所增加的用户使用量添加新的服务器机架,该建筑操作人员检查电气系统的改变是否可行。这通常是一个复杂的问题,需要运营商的专业知识来审查所需的额外功率,并将其与系统的可用功率进行比较。任何这样的变化影响建筑物的可靠性能力,冗余能力,也可能导致成本的增加,例如,由于电气系统消耗的以美元计的每千瓦小时的成本计量。相反,本发明所述的主机代管架构管理系统和方法能够同时接受来自IT管理人员及建筑管理人员的输入,并计算可靠性,风险和成本变量,以便输出到相应的当事人员。当事人员可依据所提供的输出,提出关于系统改变的基础决定。

进一步地,本发明所述的主机代管架构管理系统和方法还提供电力可靠性分析,其允许用于鉴别被分配给IT和支持负载的电力的质量和可用性问题。此外,该系统和方法可提供电力事件管理,用于识别、反应、并分析电力事故,以及提供电力容量管理,用于识别危及受损配电线路和关键设备过载和/或冗余。

根据本发明这里所揭示的各个方面,并不限于其只应用于在下面描述中阐述的或在附图中示出的构造细节和组件布置。这些方面能够承担其它实施例,并能以各种方式被实践或实施。这里提供的具体实施例仅用于说明的目的,并不旨在进行限制。特别地,在任何一个或多个实施例中所讨论的作用、元件和特征并不旨在被排除在任何其他实施例里类似角色之外。

例如,根据本发明的一个实施例中,计算机系统被配置为执行任何本文所描述的功能,包括但不只限于配置、建模和显示关于特定数据中心配置的信息。进一步地,实施例中的计算机系统可被用来自动地测量数据中心以及控制设备(如冷冻机或冷却器)的环境参数,来优化性能。此外,本文所描述的系统可被配置为包括或排除任何本文所描述的功能。因此,本发明并不限于特定的功能或功能组。同样,本文所使用的措辞和术语是出于描述的目的,而不应被视为限制。本文使用的“包括(including)”,“包含(comprising)”,“具有(having)”,“含有(containing)”,“涉及(involving)”及其变型是指包括其后列出的项及其等效以及其他额外项。

计算机系统

根据本发明本文所描述的各个方面和功能可在一个或多个计算机系统上实现为硬件或软件。目前在使用的计算机系统的例子很多。这些例子包括,除其他外,网络应用,个人电脑,工作站,主机,网络客户端,服务器,多媒体服务器,应用服务器,数据库服务器和Web服务器。计算机系统的其他例子可以包括移动计算设备,如蜂窝电话和个人数字助理,以及网络设备,如负载平衡器,路由器和交换机。此外,根据本发明的各方面可以位于单独的计算机系统,或者可以分布于多个连接一个或多个通信网络的计算机系统。

例如,各个方面和功能可分布于一个或多个计算机系统,其被配置为给一个或多个客户端计算机提供服务,或作为分布式系统的一部分执行整体任务。此外,(根据本发明的)各方面可以在客户端-服务器或多层系统上运行,客户端-服务器或多层系统包括执行各种功能的分布于一个或多个服务器系统的组件。因此,本发明并不限定于执行任何特定的系统或系统组。此外,(根据本发明的)各方面可以以软件,硬件或固件或其任何组合来实现。因此,根据本发明的各方面可以利用各种硬件和软件配置,在方法、作用、系统、系统元件和组件内来实现,并且本发明并不局限于任何特定的分布式架构、网络或通信协议。

图1所示为分布式计算机系统100的框图,其中,根据本发明的各个方面和功能可在该系统100中实施。分布式计算机系统100可包括一个或多个计算机系统。例如,如图所示,分布式计算机系统100包括计算机系统102,104和106。如图所示,计算机系统102,104和106是由通信网络108相互连接的,并且可以通过通信网络108交换数据。网络108可包括任何通过其计算机系统可以交换数据的通信网络。为利用网络108交换数据,计算机系统102,104和106以及网络108可使用各种方法、协议和标准,其中,除其他外,包括令牌环,以太网,无线以太网,蓝牙,TCP/IP,UDP,Http,FTP,SNMP,SMS,MMS,SS7,Json,Soap和Corba。为确保数据传输的安全性,计算机系统102,104和106可以利用多种安全措施包括其他安全技术中的TSL,SSL或VPN经由网络108传输数据。而分布式计算机系统100示出了三个联网的计算机系统,分布式计算机系统100可包括任意数量的计算机系统和计算设备,并使用任何介质和通信协议联网。

根据本发明的各个方面和功能可以在多个不同类型的服务器中执行。例如,服务器可以是物理服务器、专用服务器或虚拟服务器(或云计算服务器)。物理服务器一般包括操作系统在其中运行的硬件。专用服务器通常包括在物理服务器上运行的服务应用程序。例如,专用服务器可包括在操作系统上运行web服务或文件传输协议(FTP)服务,其中,服务应用程序能够结合到所述物理服务器。虚拟服务器可包括独立于物理服务器硬件之外的服务。例如,虚拟服务器可包括一个物理服务器被划分为多个服务器,每个所体现的表现和功能,犹如其在自己的专用服务器上运行一样。在一个实施例中,每个物理服务器可以有一个专用服务器操作系统,以及每个物理服务器可以有多个虚拟服务器。虚拟服务器可以和专用服务器(例如,在其顶部)同时运行。

根据本发明的各个方面和功能可以以在一个或多个计算机系统中运行的专用硬件或软件的形式被实现,所述计算机系统包括图1所示的计算机系统102。如图所示,计算机系统102包括处理器110,存储器112,总线114,接口116和存储装置118。处理器110可以执行一系列导致处理数据的指令。处理器110可以是市售的处理器如Intel奔腾处理器,摩托罗拉PowerPC,SGIMIPS,Sun的UltraSPARC,或惠普PA-RISC处理器,但也可以是任何类型的处理器或控制器,如许多其他可用的处理器和控制器。处理器110通过总线114连接到其他系统元件,包括一个或多个存储器设备112。

存储器112可用于在计算机系统102的操作期间存储程序和数据。因此,存储器112可以是一个相对高性能的易失性随机存取存储器,如动态随机存取存储器(DRAM)或静态存储器(SRAM)。然而,存储器112可以包括任何用于存储数据的设备,如磁盘驱动器或其它非易失性存储设备。根据本发明的各种实施例可组织存储器112到特定性的并在某些情况下唯一的结构,以执行本文中所揭示的各种情况和功能。

计算机系统102的组件可以通过互连元件,如总线114连接。总线114可包括一个或多个物理总线,例如,集成在一个相同的机器内的组件之间的总线,但也可包括系统元件之间的任何通信连接,其包括专门的或标准的计算总线技术,如IDE,SCSI,PCI和InfiniBand。因此,总线114能够使得如数据和指令的通信在计算机系统102的系统组件之间进行交换。

计算机系统102还包括一个或多个接口装置116,例如输入设备,输出设备和输入/输出设备组合。接口设备可以接收输入或提供输出。更具体地,输出设备可以提供信息的外部呈现。输入设备可以从外部资源接受信息。接口设备的例子包括键盘,鼠标设备,轨迹球,麦克风,触摸屏,打印设备,显示屏,扬声器,网络接口卡等。接口设备允许计算机系统102与外部实体(如用户和其他系统)交换信息和通信。

存储系统118可包括计算机可读可写的非易失性存储介质,其中指令被存储为定义由所述处理器执行的程序。存储系统118还可包括被记录在介质上或介质内的信息,并且该信息可以由程序进行处理。更具体地,该信息可被存储在专门配置以节省存储空间或提高数据交换性能的一个或多个数据结构内。该指令可被永久地存储为编码信号,并且该指令可使处理器执行任何本发明所描述的功能。该介质可以是,例如,光盘,磁盘或闪存,等等。在操作中,处理器或某些其他控制器可以使数据从非易失性记录介质读入到另一存储器,例如存储器112,其比存储系统118中的存储介质允许更快地访问由处理器处理的信息。该存储器可位于存储系统118或存储器112中,但是,处理器110可以在存储器112中处理数据,处理完成后,将数据拷贝到与存储系统118相关的介质中。各种组件可以在介质和集成电路存储元件之间管理数据的移动,并且本发明并不限于此。进一步,本发明并不限于特定的存储器系统或存储系统。

尽管计算机系统102以示例方式作为一种类型的计算机系统被描述,且根据本发明的各个方面和功能可依于此系统进行实践,本发明的各个方面却并不限于在图1所示的计算机系统上被实现。根据本发明的各个方面和功能可以在和图1所示相比具有不同架构或组件的一个或多个计算机上进行实践。例如,计算机系统102可以包括专门编程的专用硬件,例如,定制的以执行本文中所公开的特定操作的专用集成电路(ASIC)。而另一个实施例可利用运行MACOSX系统的几个通用计算设备与摩托罗拉的PowerPC处理器,以及几个运行专有硬件与操作系统的专用计算设备,来实现相同的功能。

计算机系统102可以是一种计算机系统,其包括用于管理包括在计算机系统102中的至少一部分硬件元件的操作系统。通常,处理器或控制器,如处理器110,执行一个操作系统,该操作系统可以是,例如,源于微软公司的基于Windows的操作系统,如Windows NT、Windows2000(Windows Me)、Windows XP或Windows Vista操作系统,源于苹果电脑的MAC OS系统X操作系统,许多基于Linux的操作系统发行版之一,例如,源于Red Hat公司的Enterprise Linux操作系统,源于Sun微系统的Solaris操作系统,或来自各种资源的UNIX操作系统。许多其他的操作系统也可被使用,并且实施例不限于任何特定实施。

处理器和操作系统共同定义计算机平台,可用高级编程语言为该计算机平台编写应用程序。这些组件的应用程序可以是可执行文件、过渡文件,例如,C型字节码或解释码,其可通过通信网络进行通信,例如,因特网,其使用通信协议,例如,TCP/IP。同样的,根据本发明的各个方面可以使用面向对象的编程语言,如.Net、Smalltalk、Java、C++、Ada、或C#(C-Sharp)来实现。其他面向对象的编程语言也可以被使用。或者,也可以使用功能性、脚本、或逻辑编程语言。

此外,根据本发明的各个方面和功能可以在非编程环境中实现,例如,当通过浏览器程序的窗口查看时,以HTML、XML或其它格式创建的文档提供图形用户界面或执行其他功能的各个方面。另外,根据本发明的各种实施例可以被实现为编程或非编程的元件,或者它们的任意组合。例如,一个网页可以用HTML实现,而从网页中调用的数据对象可以用C++编写。因此,本发明不局限于特定的编程语言,任何适当的编程语言也可被使用。进一步地,在至少一个实施例中,该工具可用VBA Excel实施。

一实施例中包括的计算机系统,可以执行在本发明的范围之外的附加功能。例如,该系统的各方面可以使用现有的市售产品来实现,例如,可源自西雅图WA的微软的数据库管理系统如SQL Server,源自加州红木海岸Oracle的Oracle数据库,和源自瑞典乌普萨拉MySQL AB公司的MySQL,或集成软件,如源自纽约Armonk的IBM公司的Web Sphere中间件。然而,计算机系统的运行,例如,SQL Server可能能够同时支持根据本发明的各个方面和用于不在本发明的范围之内的各种应用程序的数据库。

示例系统架构

图2显示包括分布式系统200的物理和逻辑元件的上下文关系图。如图所示,分布式系统200根据本发明被特别配置。关于图2的系统结构和内容叙述仅用于示例的目的,并不旨在将本发明限制于图2中所示的具体结构。许多变型的系统结构可以在不脱离本发明范围的情况下被构建,这对于本技术领域普通技术人员将是显而易见的。图2所示的特定布置被选来以促进说明清楚性。

信息可以使用任何技术在图2所示的元件、部件和子系统之间流动。这样的技术包括,例如,通过TCP/IP在网络上传送信息,在存储器的模块之间传送信息,以及通过写入文件、数据库、或其他一些非易失性存储装置传送信息。其他技术和协议在不脱离本发明范围之内也可被使用。

参照图2,系统200包括用户202,设计接口204,数据中心设计和管理系统206,通信网络208以及数据中心数据库210。系统200可以允许用户202,例如数据中心的建筑师或其他数据中心人员,与接口204交互以创建或修改一个或多个数据中心配置的模型。根据一个实施例,接口204可包括地板编辑器和机架编辑器的各方面,如专利合作条约申请PCT/US08/63675中所公开的,该专利申请名为“用于管理设施电源和冷却的方法和系统(METHODS AND SYSTEMS FOR MANAGING FACILITY POWER AND COOLING)”,递交于2008年5月15日,在此引用该申请全部并且并入本文,在下文中简称为PCT/US08/63675。在其它实施例中,该设计接口204可用专门的工具来实现,使用户202以拖放的方式设计模型,该模型包括数据中心或其任意子集的物理布局的表示。这种布局可包括数据中心结构组件的表示以及数据中心设备。设计接口204的特征可在根据本发明的各实施例中找到,下文将进一步讨论。在至少一个实施例中,关于数据中心的信息通过该接口被输入到系统200,并且对于数据中心的评估和建议会提供给用户。进一步地,在至少一个实施例中,可执行优化过程以优化冷却性能和数据中心的能量使用。

如图2所示,数据中心设计和管理系统206将设计接口204显示给用户202。根据一个实施例,数据中心设计和管理系统206可包括如PCT/US08/63675中所公开的数据中心设计和管理系统。在本实施例中,设计接口204可融入PCT/US08/63675中所包括的输入模块、显示模块、和构建模块的功能,并且可以使用数据库模块来存储和恢复数据。

如图所示,数据中心设计和管理系统206可通过网络208与数据中心数据库210交换信息。这些信息可包括支持数据中心设计和管理系统206的特性和功能所需要的任何信息。例如在一个实施例中,数据中心数据库210可包括存储在如PCT/US08/63675中描述的数据中心设备数据库中的至少一部分数据。在另一个实施例中,该信息可包括支持设计接口204所需的任何信息,如,在其他数据中,一个或多个数据中心模型配置的物理布局,包括在模型配置中的冷却(设备)提供商的生产和分配特征,模型配置中的冷却(设备)消费者的消耗特点,以及一系列集群中设备机架和冷却提供商。

数据中心数据库210可采取能够将信息存储在计算机可读介质中的任何逻辑结构的形式,包括,在其他结构中,平面文件,索引文件,分层数据库,关系数据库或面向对象的数据库的形式。数据可使用独特的外键关系和索引进行建模。独特外键关系和索引可在各个领域和各个表之间建立,确保了数据的完整性和数据交换性能。

如图2所示的计算机系统,其包括数据中心设计和管理系统206、网络208以及数据中心设备数据库210,每个可包括一个或多个计算机系统。如上关于图1的讨论,计算机系统可以具有一个或多个处理器或控制器、存储器和接口设备。图2所示的系统200的特定配置,仅用于说明的目的,本发明的实施例可以在其它环境中来实践。因此,本发明的实施例不限于特定数目的用户或系统。

主机代管架构

如上所述,关键建筑物,诸如数据中心,其运营商需要平衡多个变量,如可靠性,性能,风险和成本。在本发明提供的系统和方法中,这些变量可以作为一个度量或性能指标被测量并被显示,并可独立地被改变。然而,一个变量的变化可能对其余变量产生影响。例如,三个变量中的每个可能对关键建筑物的运营商或所有者很重要。通过提供运行时间的高可靠性,关键建筑物的所有者可能需要更多的资本设备,以支持增加的运行时间,这又导致将增加的成本加诸给用户。这种成本的计量和管理对于所有者来说是非常重要的,因为这可以让所有者能够准确地收取关键建筑的用户对于设备使用的费用。

另一个需要考虑的重要变量是建筑运营商的风险概况。该风险概况是建筑运营商在改变其余变量进行决策的无形价值。在一个示例中,风险概况告知运营商风险的多少,运营商可以降低终端客户费用的代价来进行降低可靠性。风险概况可以基于用户或客户的知识架构,使得操作者关于可靠性和成本来进行决策的过程。在一个示例中,主机代管设施的停机事件可以对业务营运及潜在的收入损失造成严重影响。例如,一个在能源和电信业的客户公司,由于停机而造成的结果,可能每小时损失200万美元,并可能由于公司的声誉或品牌受损而遭受更多损失。因此,在这个例子中,几乎任何停机对于客户来说是不可接受的,对于拥有这样的公司作为客户的建筑物(或建筑物的选定部分)的风险概况是低的。

此外,本文所提供的主机代管架构管理系统和方法的用户可能具有不同作用,并可根据个人需求以不同的方式改变变量。例如,具有IT管理角色的用户可以要求添加额外的容量到关键建筑,以维持对服务的当前需求。依次地,具有建筑管理角色的用户可以管理设备的物理增加以满足额外的容量。在此例中,两类用户以不同的方式影响可靠性和成本,并且二者都可管理和监测在可靠性、性能、风险和成本等变量上的影响。

图3示出主机代管架构的优化系统300的一个示例的框图,其可根据本发明的各个方面和功能来实施。优化系统包括:输入模块302,优化模块306,输出模块308和稳态监测模块310。

输入模块302允许用户输入对于关键建筑的风险概况、可靠性需求、和成本预算,以及描述该设施的物理布局和电气及冷却系统的数据。优化模块306可接收来自用户的请求以执行输入变量的分析。输入模块302提供用户输入到优化模块306。

在一个示例中,优化模块306可计算电力可靠性指标(PRI)度量,电力使用效率(PUE)度量,实时冗余(RTRD)度量,冻结资产(STA)度量和成本分析报告。PRI度量提供给数据中心运营商实时度量,总结其电力系统可靠性整体风险或性能。计算一个新的PRI度量的方法,下面将参考图32-36做进一步描述。在一个实施例中,新的PRI度量是对瞬时功率可靠性的一个测量,以电能质量值向量为基础来确定。在另一个实施例中,优化模块306利用电能质量值向量通过将电能质量值与其他信息(例如电网的冗余和电能质量恶化的严重程度)相结合,来确定PRI概括值。在一个替代实施例中,PRI度量可以使用预测在一个或多个关键负载处的总电力故障时数的现有方法来确定。在又一实施例中,电能质量值可用于通过提供额外洞察潜在故障的原因来补充现有的PRI度量。

RTRD度量集中用于确定可靠性,并分析电气系统的实时变化,以确保冗余不会受到影响。RTRD度量利用下面参考图15-22C进一步描述的方法来确定。PUE是根据业界采纳的建议用来衡量数据中心的能量效率的测量措施。修改后的PUE度量还可提供考虑到数据中心之间的冗余架构和天气概括的差异调整后的值。PUE度量利用下面参考图10-14进一步描述的方法来确定。STA度量提供了一种可靠性和成本/能量节约的测量措施给终端用户。STA度量利用下面参考图23-31进一步描述的方法来确定。如下面进一步的描述,STA、PRI、PUE的度量被配置为共同工作,以全面优化电力系统,并为用户的电力需求提供给其最佳解决方案,达到可靠性和成本的平衡。

优化模块306利用STA、PRI、PUE和RTRD度量来分析电气系统中由用户提供的变化,并确定变化对电网的影响。在一个示例中,电网的影响可以显示给用户,并且用户可以被提示进一步的输入。此外,优化模块306可以基于所述STA、PUE、PRI和RTRD的最佳测量值优化电网,并提供一个更新的电气系统给用户。

位置分析304,可调节由优化模块306提供的分析,以适应特定的天气概况,特定国家的环境,以及其他位置的具体情况。例如,如下面进一步描述的那样,PUE度量可根据处于不同位置的数据中心的天气概况的差异进行调整。在一个示例中,在温暖或寒冷的环境中不同的天气概况可成为导致不同的HVAC设备能耗值的因素。

在一个示例中,电网以及更新后的电网的影响可以通过输出模块308被提供给一个或多个外部各方。外部各方能够检查和实施优化模块306所建议的任何变更。在至少一个示例中,在一个或多个变更能够被实现之前,一个或多个外部实体可以被提示进行输入,比如授权。在一个示例中,某些实施或授权功能可自动实现,不再需要从用户或外部实体进行输入,例如,通过预先设定的逻辑或设置点。

稳态监测模块310可以在稳定状态监测电气系统。如果任何变量低于和/或高于阈值,稳态监测模块310可以接收一个或多个来自于电气系统的警报。稳态监测模块可连续监测电气系统的变化和这些变化对度量STA、PRI、PUE中的每一个的影响,以确保所述度量符合用户的要求。在一个示例中,如果稳态监测模块310报告出错,用户和/或外部各方则被发出警报,以便采取适当的行动。

在一个示例中,主机代管架构优化系统300使用迭代反馈回路进行操作。例如,优化模块可以计算需要在电气系统中实施的变化。稳态监测模块310监测这些变化的影响,并提供反馈给优化模块306或者以警报或警告的形式给用户发出通知(如维修人员,第三方服务人员,产品制造商,客户,等)。根据收到的通知,用户可以提供新的或附加的输入到优化模块或请求干预以使电气系统进行变更。

图4示出分布式主机代管架构400的一个实例。分布式主机代管架构可以包括通信网络402,电网404,一个或多个监测和控制系统,其包括电源管理系统406,建筑管理系统(BMS)408和IT管理系统409。电网404可以由其中一个监测和控制系统进行监测,如电源管理系统406,其可以使用户能够监测和存储来自于分布点和资产的数据/信息。主机代管架构优化系统300,如下面更详细描述的,可以结合到一个或多个监测和控制系统。可替代地,优化系统300可以是一个单机系统,并可产生一个或多个输出到电源管理系统406,其被提供到建筑物管理系统408和/或IT管理系统409和/或在显示模块430进行显示。

用户通过监测和控制系统中的一个,也可以控制和管理各种资产,使用收到的信息运行报告,设置警报,以及执行其他功能。监测和控制系统,如建筑管理系统(BMS)408可以为IT地板,如制冷,照明,电源系统,消防系统和安全系统控制和监视机械设备和电气设备。监测和控制系统可以是一个封闭的建筑系统,或者连接到互联网进行远程访问。电网404,建筑管理系统408,IT管理系统409和电源管理系统406可以经由通信网络402进行通信。另外,通信网络402可被配置为传输任何数据、信息、指令、警报或主机代管建筑架构内的任何其他形式的用户、组件和设备之间的通信。

图5示出了用于主机代管关键建筑(如数据中心)的电网404的一个示例。电网404连接到实体410,其通过中压(MV)网络环路为数据中心的所有关键组件和非关键组件提供电力。电网404包括各种不同类型的电子设备,其中包括一个或多个不间断电源(UPS)系统412和414、及关键机械负载416、电气配电盘418、暖气、通风、和空调(HVAC)系统、照明和建筑负载420、远程电源板(RPP)422及其相关的IT负载424和电源分配单元(PDU)426,以及遍及各处分布的监测点428。此外,电气空间配备了机械设备,以保持最佳的工作环境条件。数据中心的系统和元件在不影响效率前提下被集成以提供高级别的可用性。

UPS412可为关键机械负载416提供支持。可用于电网的UPS的一个例子是MGE Galaxy5000UPS,由施耐德电气(Schneider Electric)制造。UPS412可提供可靠和有条件的电力至下游的PDU426。PDU426可供电给RPP422以及相关IT负载424。可用于电网的PDU426的一个例子是APC InfraStruXure PDU,由施耐德电气(Schneider Electric)制造。一个单独的UPS可以允许资产和设备,如冷却水泵,具有用于冷却系统的扩展穿越时间。配电盘418可将从实体410至配电盘418的主电流分成较小的电流,用于进一步分配到数据中心,并为这些不同的电流提供交换、当前保护和计量。

智能设备和电力仪表的网络,如图5所示,监测点428,也可包括于整个电网404,其可以通过通信网络402连接在一起。整个电网404可通过监测点428由监测和控制系统中的一个来监测。在一个实施例中,监测和控制系统包括:软件程序,通信网关,计量装置,和数字保护装置,并且还能与外部监视装置互连。此外,监测和控制系统可直接从带有嵌入式计量装置的设备接收数据或信息,如UPS模块,发电机控制器,PDU,机架式PDU以及其他设备。其他管理系统,如建筑管理系统或IT管理系统,可以使用各种方法连接到监测和控制系统。在一个实例中,管理系统通过经由通信网络402接收到的监测点428具有直接数据存取接入。在另一个实例中,管理系统包括嵌入的网页,其被包括入其他监测或管理系统,如电源管理系统406。监测和控制系统可以包括软件和硬件的组合。数据中心还能有冗余的实体储备(feeds),以及一组专用的冗余发电机和相关自动转换开关。

监测和控制系统可监测实体储备,包括电涌保护器、跳闸单元和变压器并且可以检测到接地故障、电压暂降、电压骤升、瞬时中断和振荡暂态、以及风扇故障、温度、和谐波畸变输出。该监测和控制系统还可以监测发电机,包括输出、保护继电器、电池充电器、以及传感器(例如,水和燃料传感器)。该监测和控制系统可以进一步检测发电机状态包括反向功率、温度、过电压状态和以及欠压状态、过速、周围环境温度。该监测和控制系统还可进一步监测转换开关(TS)包括并行开关装置和静态转换开关(STS)并可检测TS的状态变化,以及可控硅整流器(SCR)的状态,汇总报警,报警条件和测试位置,以及其他信息。

此外,监测和控制系统可以监测UPS单元,和电池并可检测周围环境温度,输出电压和电流,以及可以进一步检测各种报警信息,如那些涉及到电池的报警、旁路报警、汇总报警、在线报警、偶次谐波输入报警、总谐波失真(THD)输出报警、电压骤降和电压骤升报警、以及其他报警。进一步地,监测和控制系统可以监测冷却系统如各种冷却装置,HVAC和冷却系统,并且可以判断状态、输入功率、输入THD、和温度,以及其他信息。该监测和控制系统还可以监测PDU并可确定变压器的超温、紧急断电条件、输入功率、输入THD、电路负载和过载限值。最后,监测和控制系统能够监测设施和设备机架及可实时确定成本分析指标,如瓦/平方英尺、基准性能、和每电路千瓦(kW)/千瓦时(千瓦时)计费。

该监测和控制系统,通过输入模块432,可以接受来自具有不同角色的不同用户的输入。例如,IT管理人员可请求对系统的更改,像额外的负载或容量加给系统,而建筑运营商或设备管理人员可以负责实施这些更改,并对如可靠性或成本有额外的要求。该监测和控制系统接受来自建筑运营商和IT管理人员的输入,通过电源管理系统406或相应的其他管理系统,如建筑管理系统408,或者IT管理系统409反映所需要的对电气系统的更改。

该监测和控制系统,通过显示模块430,可以将各种关于电网404的显示画面显示给用户。在一个实例中,显示屏幕可包括仪表板显示、电力单线显示、功率流显示、设备明细显示、和报警汇总显示。该监测和控制系统还可以生成各种报告,可以通过显示屏向其用户显示。例如,报告可以包括电力容量、电力事件、电能质量(PQ)事件、以及各种趋势的统计信息。

如上所述,主机代管架构优化系统300可以被结合到监测和控制系统。图6更详细地示出主机代管架构优化系统300。除所述输入模块304、优化模块306、输出模块308和稳态监测模块310,优化系统300还可包括PUE组件602、PRI组件604、RTRD组件606、STA组件608和成本分析组件610。

图7所示为应用例如优化系统300和/或监测和控制系统的主机代管架构优化方法的一个实施例。在步骤704中,用户可以请求更改电网404。用户可以通过任何监测和控制系统提出该请求,如电源管理系统406,建筑物管理系统408或IT管理系统409,经由输入模块432或输入模块302。对电网404的更改可以基于用户改变的需求,如附加的性能或能量需求。例如,用户可以请求增加机架以增加容量。图8A所示为将PRI、PUE和RTRD的分析显示给用户的一个示例。任何由用户请求的更改,能够实时进行模拟并在其中一台显示器上显示给用户。如果对于建筑运营商来说有任何关键变量(PRI,PUE,$/千瓦时)的改变超出报警设置点时,输出模块可以做出出错的警告,相应的各方(运营商、用户、外部各方等)可以采取纠正行动。

在步骤706中,主机代管架构优化系统300中的优化模块306对所请求的变更和电网404进行分析以提供优化分析和实施所请求的对电网404的更改。优化分析可包括一些如下进一步描述的步骤。作为优化分析的结果是生成更新的电网404。

所述分析的可视化表示可以由优化系统306生成并通过显示器430提供给用户。例如,优化模块306确定电网404内的一个位置,在其中可安全地添加附加的负载。优化模块306,通过显示器430,可在电网的可视化表示中向用户显示额外负载的可视化表示。此外,优化模块306可模拟出更新的电网的容量与附加的负载,并通过显示器提供给用户更新的度量。

优化模块306可以执行关于一个或多个组件的一个或多个步骤,包括PUE组件602、PRI组件604、RTRD组件606和STA组件608。在一个实例中,优化模块306基于用户的变更请求以及该请求对电网404的相关影响调用一个或多个组件。在一个例子中,用户可以请求或模拟对电网的变更以及优化模块306可以调用实时PUE组件602。实时PUE组件602可确定至优化模块306或用户的更新的调整了的可靠性的PUE值。优化模块和/或用户可以确定调整了的可靠性的PUE度量是否超过了预定的设置点。PUE组件602和相关计算将参照图10-14在下面进行更详细的描述。

在另一个示例中,用户可以请求或模拟对电网404的变更,优化模块能够调用RTRD组件606。RTRD组件606可确定关于电网404的更新的冗余值。更新的冗余值与电网的冗余限制设置进行比较。冗余组件能够将关于更新的系统是否在电网设置的冗余限制范围内的输出提供给优化模块和/或用户。该RTRD组件606和相关计算将参照图15-22C在下面进行更详细的描述。

在另一个例子中,用户请求或模拟对电网404的变更,优化模块能够调用STA组件608。如果所请求的对电网404的变更被发现超过设计能力,STA组件608可被调用。在此例中,STA组件608提供对系统的分析,并向用户建议电网中的位置,在该位置增加的容量能够被添加,而不超过设计容量或系统的安全容量。STA组件608和相关计算将参照图23-31在下面进行更详细的描述。

在另一个示例中,用户可请求或模拟对电网404的变更,优化模块306可调用PRI组件604。PRI组件604可提供给优化模块和/或用户一个实时度量,其概括用户电力系统可靠性的整体风险或性能。PRI组件604和相关计算,将参照图32-36在下面进行更详细的描述。如上所述,在一个实施例中,PRI组件604确定一个新的PRI度量,其中包括根据电能质量事件确定和估计的电能质量值的向量,并且还提供了瞬时电能可靠性的度量。在另一个实施例中,PRI组件604使用由下面描述的方法所确定的电能质量值的向量,以通过结合电能质量值与其他信息,例如电网的冗余和电能质量恶化的严重程度,来确定一个PRI汇总值。该PRI汇总值可以是特定于电网架构的特定组件、和/或电网中所需的冗余级别。可选地,PRI度量可以利用以下方法来确定:平均无故障时间(MTBF)、平均维护时间(MTM)、平均修复时间(MTR)、和固有有效性(AI)。这些平均度量可用于确定现有PRI度量,其基于在一个或多个关键负载的总电源故障时数的预测。

每个组件(PUE组件602、PRI组件604、RTRD组件606和STA组件608)可以组件相互间交互,并组件间分别相互作用,而不管用户如何选择测量系统变更的影响。例如,由STA组件608和相关系统变化做出的设计变更可触发PRI组件604和/或实时PUE组件602来计算更新的PRI度量和更新的PUE度量。

在另一例子中,RTRD组件606和PRI组件604可以协同操作。例如,如果PRI度量在已定义的阈值范围内,但冗余度量不在已定义的阈值范围内,优化模块306能够指示或输出错误并重新配置电网404,使得PRI度量和冗余度量满足设置点。在每种情况下,如果PRI或PUE度量高于设置点时,信息则反馈给STA组件,并创建一个新的设计。

在另一实例中,成本分析组件610也为用户产生成本分析报告。可以理解的是存在与用户更改电网做出的决定相关的成本权衡。例如,当用户添加设备资产(如UPS单元或PDU)时,数据中心的效率可能会降低,但可靠性和冗余度可能增加。成本分析组件610可生成成本报告,其可提供给用户用于对设备资产或电网进行物理变更的实际方法。成本报告可以帮助用户确定要进行的支出的类型,例如资本支出,固定成本费用,或者一次性维护变化。为了提供报告,成本分析组件610可以模拟系统变化的输入,并通过优化模块306完成优化计算,然后基于输入的系统变化显示成本变化。对于一个指定数据中心配置的成本分析报告的一个实例示于图8B。报告显示IT负载成本,非IT负载成本和整个数据中心的负载成本。在该例中,显示为成本以每小时的美元来计。

例如,具有1MW设计容量及具有2N冗余设计的数据中心可需要每1MW两个UPS单元以提供足够的电力给数据中心。在此例中,如果一个UPS发生故障,其它的UPS接管,保持数据中心的运行。另一种可替换的设计可包括每0.5MW三个UPS单元。与上述类似,如果一台UPS发生故障,另外两个UPS单元仍然正常运行,并能够支持数据中心的1MW负载。成本分析组件610可为用户提供报告,允许用户考虑对于上述两种设计相关的成本和其他相关维护费用变化。成本分析也可解释现实生活对于电网的影响(断路器的变化、维护成本降低、环境设置点的改变,等等)上。在一些实例中,可存在保持现有电气系统所需冗余级别的维护成本超过根据另一种设计更改系统并继续使用相同的冗余级别的资本成本的情况。

在步骤708中,验证更新的电网404。在一个例子中,更新的电网404通过使用一个或多个设置点被自动验证。在另一例子中,更新的电网404由用户或外部各方手动验证。在验证步骤708期间,优化模块306可对更新的主机代管架构提供一些保障或错误检查。例如,对比检查,如“是否超过设置点?”检查,如果用户选择的值超过预定义的阈值,可向用户发出警告或阻止用户进行更改。优化模块306还提供反馈回路,其提示用户进行对多个值的选择,直到主机代管架构根据用户的需要进行了全面的优化。在一个例子中,设置点检查可通过具有事先设定的限制和其他逻辑任务的检查自动完成。设置点检查的自动化可消除与用户交互的需要。

在一个实施例中,验证步骤708可需要来自一个或多个外部各方的输入。优化模块306可通过输出模块308提供输出到外部各方。在一个例子中,输出可以是以一个或多个组件的可视化显示的形式,所述组件包括PUE组件602、PRI组件604、RTRD组件606和STA组件608。

在另一个示例中,输出可以是以一个或多个请求选择实施变更决定的提示的形式。外部各方可与优化模块306或与监测和控制系统通过自动化的步骤或手动进行交互。例如,为了确保可靠性,STA组件608可确定更大的负载需要被置于UPS以增加电网的容量。外部一方,如维修人员,可能需要授权这种增加,因为增加的容量可能会导致增加UPS的测试和维护。在一个示例中,授权可以由用户手动进行。在另一个示例中,授权可以通过执行针对预先设定的授权设置点的检查自动进行。由于批准增加的容量和相关增加的维护需求,有可能需要考虑附加的运营成本。

在另一实例中,为补偿增加的容量,优化模块306可建议升级断路器以修改一个或多个设置点(使更宽或更窄)。外部一方,如维修人员或原厂商服务团队,在计划和执行之前可能需要授权升级。在又一实例中,增加的容量可能会影响终端用户客户。例如,对电网404的更改,可能会导致电源关闭。外部一方,如终端用户客户,可能需要确认服务的计划中断时间是可以接受的。

在步骤710中,更新的电网设计是通过用户请求的变更连同优化模块306执行的优化分析一起来实施的。更新的电网设计的实施可以由建筑运营商和/或其它当事人来执行。所述实施可包括对于电网的物理更改,例如安装额外的设备。电网404被监测,以确保实际性能符合所估计的优化分析。

在步骤712中,电网的稳定状态和系统性能利用稳态监测组件310来进行监测。可以理解的是,电气系统的变更可以进行模拟和生效,一旦做出物理变更,电网可被实时监测,以确保其维持可靠性和成本所要求的水平。例如,优化模块306可输出在实际PRI度量范围内的模拟PRI度量,在实际应用中,设备的操作条件可能会导致PRI度量偏离模拟值。操作条件可能会导致电网中的设备以低于标准水平或不根据制造商的规范进行操作。此外,外部因素可能不会在模拟模型中被考虑。外部因素的一个例子可能是电网上的未计入的额外负载,如个人便携式加热器或冷却器。

在一个例子中,稳定状态监测组件310可持续监测电网404,以确保PRI度量和PUE度量维持可靠性和成本要求的水平。在这个例子中,PRI组件604执行“安全备份”的功能,而STA组件608和PUE组件602则被分析。PRI度量可以使用虚拟系统来模拟。该系统进行该操作可以通过被添加到机架上并运行虚拟系统,允许用户在将新负载加载到物理数据中心之前在这些新负载的建筑物中测试新负载的实施。在实际应用中,该PRI度量的估计值和实际值可以是用户的故障安全计算的一部分,以确保系统的稳定状态在安全容量和设计容量所需界限范围内。

图9所示为比较电网在优化模块306进行关于用户请求的变更优化之前和之后的一个显示。所请求的变更可以是以一个额外服务器或机架的形式存在的负载。在进行优化之前,机架从A侧取出导致A侧超过可接受的可靠性和成本的水平。进行优化之后,电网被重新布置,使B侧接收部分来自服务器机架上的负载。因此,A侧和B侧均在可接受的可靠性和成本的水平范围内。

确定电力使用效率(PUE)

能量效率的典型测量,如电力使用效率(PUE)度量和数据中心基础设施效率(DCIE),是用于计算数据中心能量效率的工业适用性性能指标。这些典型的度量受到一些如下所述缺陷。本文所述实施例提供了调整的PUE度量和能量模型,其中考虑到电力系统的不同配置、电力系统冗余度的不同以及位于不同位置的数据中心之间的天气概况的差异。计算能量效率度量的能量模型,如PUE度量,可允许用户准确地比较各种具有不同电气配置的数据中心的能量效率,并准确地检测能量度量参数随时间的变化。

在一个实施例中,PUE组件602通过以下方式同时产生调整的和预测的能量效率度量值:从电网中不同的点收集能量使用;把在各种条件下如配置、冗余和天气概况的因素考虑进去;产生能量模型来预测能量使用;以及监测系统不断调整能量模型以适于实时运行状况并允许用户比较所预测的和当前的能量使用情况。

在一个例子中,PUE组件602可跟踪数据中心内UPS单元的运行,建立描述在N+1和N冗余架构配置内能量使用总量的模型。即使数据中心可以在N+1冗余级别正常运行,PUE组件602仍可使用该模型来产生用于在N冗余级别运行的调整的能量效率度量。在另一个例子中,PUE组件602可以创建在室外和服务器机房温度下的HVAC能量使用总量模型。操作人员可以比较能量效率度量的模型预测与实际测量来更精确地追踪数据中心的性能。

图10所示为数据中心中有2N冗余级别的电气系统的主要组件概述。具有这种冗余级别,能源和电气设备在电气系统的两个镜像侧(A侧和B侧)提供电力给一台设备,如服务器机架,任何一侧都能够提供机架所需的所有电力。各种数据中心的冗余架构都可被使用。

图10所示的电气系统1000包括主要能量源(实体1020、1025),二级能量源(发电机1010、1015),配电和提供冗余的备份设备(UPS单元1030、1035;PDU1040、1045;和远程电源板(RPP)1050、1055)和服务器机架1060。能量源实体1020、1025和发电机1010、1015用断路器相互连接,使得这些能量源中的任何一个可以连接到电气系统1000的A侧或B侧上的设备和负载。任何一个电气能量源按规模来负担数据中心的全部IT负载,并且断路器可用于连接有效能量源,和断开故障能量源。除了电气系统1000中所示的设备之外,各种加热、通风和空调(HVAC)单元可被安装在数据中心,来为数据中心内的IT负载和空间提供加热和冷却。其他类型的能源可用于数据中心,包括天然气、蒸汽、冷冻水、太阳能和风能。来自于其他能量源的能源可被转化为电能,并用于连接到电气系统1000的电力负载,或者可被直接使用,提供非电能的能源给设备,如HVAC单元。

能量监测设备可以按照由绿色网格组织发表的“用于测量和报告数据中心整体效率的建议(Recommendations for Measuring and Reporting Overall Data Center Efficiency)”报告中的准则部署在电气系统1000的各点。该建议指出非电能能量应被包括于能量效率度量内,能量监测设备也部署到非电能源。该建议定义了PUE度量,具体如下:

等式(1)

该建议为IT设备、数据中心内配套支持基础设施、和数据中心的物理边界提供正式定义,被纳入能量使用的测量。该建议还定义了四个在如下(a)和(b)中各不相同的PUE测量类别:(a)使用的电能测量的类型;和(b)进行测量的数据中心能量系统所处的位置。举一个例子,PUE类别1指出,根据公式(1)的IT能耗元件是在UPS系统输出(即所有UPS单元的输出之和)测得的12个月的总千瓦时消耗。数据中心的总能耗是12个月的总千瓦时消耗,并且必须包括对进入数据中心边界的所有能量类型。

为了确定在图10中所示的数据中心电气系统的PUE类别1,在一个例子中,IT能耗被测量以作为UPS单元1030和UPS单元1035的累计输出。总数据中心电力消耗可被测量以作为来自实体1020和1025的累计输入。由发电机1010和1015所消耗的燃料可由一个或多个能量监测设备进行测量,并在转换为千瓦时单位和应用绿色网格建议中所述的加权因子后,被包括在数据中心总能耗图中。在一个例子中,如果冷冻水冷却提供装置被包括在数据中心内以提供冷却能量给HVAC单元,该能量可以由一个或多个能量监测设备进行测量并在转换为千瓦时单位后被包括在数据中心的总能耗图中。

绿色网格建议的目的是提供为数据中心运营商一种通用的方法来计算和报告其数据中心的能量效率,可能是为了方便不同数据中心之间的比较。然而,如上所述的建议中描述的方法在几个方面达不到这个目标。首先,建议并未考虑到能量效率和其他所需的数据中心的目标之间的平衡,如冗余度和可靠性。例如,一个采用具有更大冗余的电气系统架构的数据中心,通常并没有比一个没采用这种电气系统的数据中心在能量使用上更有效率,但这个更大的冗余并没有反映在PUE度量中。

其次,由数据中心的HVAC设备消耗的能量不仅取决于设备本身的效率,而且还取决于数据中心所处位置的天气概况。数据中心HVAC系统通常被配置为保持IT设备周围的恒定温度,但这样做所需的能量取决于天气概况因素,如室外温度。数据中心所处位置的天气概况的影响也没有反映在建议中所述的PUE度量中。

最后,绿色网格建议并未进一步达到他们的目标,因为在较短的时间范围内不能测量能耗。对于标准PUE度量的计算的时间范围为12个月。然而,这个时间范围对于想要监测和管理预定目标内的PUE水平的数据中心运营商来说是过长的。

关于冗余架构被调整的PUE度量

图11所示为电气系统1100的一个实例,用来显示对能量效率和冗余级别之间进行平衡的调整的PUE度量。电气系统1100包括UPS单元1100、1120和1130,提供服务器机架1150所需的的能量。传送给UPS单元1100、1120和1130的电量影响这种可提供给服务器机架1150的UPS单元排列的冗余。例如,服务器机架1150具有200千瓦的能量需求,每个UPS单元1100、1120和1130传送100千瓦。在此例中,只需要三个UPS单元中的两个,就可满足服务器机架1150的能量需求。因此,这种电气系统提供N+1冗余。在另一个实例中,服务器机架1150具有300千瓦的电力需求。在此例中,所有三个UPS单元1100、1120和1130均需要运行,以满足服务器机架1150的要求。因此,该电气系统提供N冗余。

可以理解的是,不同的冗余架构推动UPS单元在不同的操作效率区运行,影响UPS单元对于数据中心能量效率的贡献。UPS运行效率可被描述为UPS效率曲线,显示效率的百分比与UPS负载的百分比。图12所示为UPS效率曲线的一个例子。从图12很容易看到,UPS在低功耗下运行造成更低的效率且较高的UPS能量损耗和运营成本。

再次参照图11的例子,假设服务器机架1150具有300千瓦的电力需求,每个UPS单元1110、1120和1130传送最大300千瓦。图11中的UPS和服务器机架的排列提供N+2冗余级别,因为,这个例子中,三个UPS单元中只需要一个投入运营,就满足机架1150的电力需求。当所有三个UPS设备都在运行,每一个提供服务器机架1150所需功率的三分之一(300千瓦/3=100千瓦)。每个UPS单元工作在其额定输出功率(100千瓦/300千瓦=30%)的30%,这不是其效率曲线的最佳点。如果只有UPS单元210和220在运行,那么每个提供服务器机架250所需功率的一半,并以其额定输出功率的50%(150千瓦/300千瓦=50%)进行工作。这对于每个UPS单元的效率曲线来说处于更佳点,但冗余级别下降到N+1。

当计算数据中心能量效率度量时,为更准确地解释说明冗余架构,该度量可通过说明冗余设备的不同冗余级别之间的能量损失差进行调整,如以下等式(2)所示。当考虑到冗余级别比当前数据中心架构的冗余级别低时,对于冗余设备能量损失的这种调整可以是负的,而当考虑到冗余级别比当前数据中心架构的冗余级别高时,这种调整可以是正的。换种方式说,当考虑具有更少冗余的架构时,数据中心总能耗可被减少,当考虑具有更多冗余的架构时,数据中心总能耗可被提高。

等式(2)

能量损失计算中所包括到的冗余设备可依赖于其在电气系统中的点,在该点IT能耗被测量。例如,PUE类别1,指定IT能耗可在UPS单元的输出处进行测量。对于图10所示的电气系统,冗余设备能量损失可包括那些UPS单元1030、1035,以及UPS单元1030、1035之间的设备,和能量源1010、1015、1020、1025。另一方面,PUE类别3,指定IT能耗可在IT设备的输入进行测量。如图10所示的电气系统的冗余设备能量损失,包括那些RPP1050、1055、PDU1040、1045;UPS单元1030、1035以及UPS单元1030、1035之间的设备和能量源1010、1015、1020、1025。在一个例子中,当考虑冗余架构之间的能量损耗差异时,某些设备(如UPS单元)可能是造成大部分能量损失的原因,冗余设备能量损耗的计算可能只集中于该设备。

图13所示为计算调整的和未调整的PUE度量的方法1300的流程图,其中调整的PUE度量可适应冗余架构中的差异。在步骤1310中,PUE组件602分配属性给冗余设备以在能量效率计算中使用。例如,一个这样的属性可以是设备的额定功率输出。

在步骤1320中,PUE组件602将冗余设备和IT设备与一个或多个冗余级别关联起来。PUE组件602使用这些关联在计算调整的能量效率度量时确定包括哪部分设备以用于可替代冗余级别。例如,图11所示的UPS单元其规模可在N+2冗余级别进行操作,并且所有三个UPS单元主动运行的操作可以与这个冗余级别相关联。可替代的N+1冗余级别可被定义作为三个UPS单元的任何两个的主动运行操作。

在步骤1330中,PUE组件602测量包括在进行调整的能量效率度量的计算中和与已定义的冗余级别关联的的所有冗余设备的输出。对于度量,如PUE和DCIE,输出是以能耗的单位(如千瓦时)进行测量的。PUE组件602还测量与已定义的冗余级别相关联的IT设备的能量输入(在后面的步骤中使用)。

在步骤1340中,PUE组件602检测被包括在进行调整的能量效率度量计算中的所有冗余设备的运行状态。该检测被执行以确定一组已定义的设备的当前操作的冗余级别。该检测可以通过读取状态联络或通过通信询问设备来执行,或者可以简单地通过评估当前设备输出(例如低于0附近的某些阈值的输出电平可指示设备处于脱机状态)来确定。

在步骤1350中,PUE组件602可使用一个工业标准方法来计算数据中心的能量效率度量,如以上参考绿色网格建议所述。举个例子,效率度量可以是PUE类别1,PUE组件602可以通过使用如等式(1)所描述的测量值来计算该度量。该度量值与冗余的主动级别相关,其在正常操作下将是数据中心指定冗余级别。

在步骤1360中,PUE组件602可计算对于一个或多个可替代冗余级别的调整的能量效率度量,如等式(2)所示。要计算该度量,PUE组件602为每个可替代冗余级别可以先计算出调整的冗余设备能量损耗期。这可以通过以下方式来实现:假定冗余设备在一个可替代冗余级别的运行情况下;划分所测量的IT设备能量输入与正在使用的冗余设备;以及使用冗余设备的能量效率曲线估计调整后的冗余设备的能量损耗。或者,PUE组件602可直接测量能量输入和冗余设备的输出,以确定调整后的冗余设备的能量损失。当电气系统以一个或多个可替代冗余级别操作时,PUE组件602还可以采用测量和记录的过去的冗余设备的输入和输出能量值。当IT设备在预期操作范围内运行以及有足够的测量数据被获取用于冗余设备效率的统计上的重要决策时,PUE组件602可以利用测量值来选择可替代冗余级别。

PUE组件602可使用在步骤1340中所述的检测结果,以确定冗余设备是否以数据中心所预期的冗余级别在运行,或者是否以其中一个可替代冗余级别在运行。在一个例子中,如果设备以所定义的可替代冗余级别在运行,则PUE组件602不计算当前时间间隔的调整的能量效率度量值。在此例中,因为可替代冗余级别已成为数据中心的主动冗余级别,对于当前时间间隔来说未调整的能量效率度量值是正确的值。

关于调整的PUE度量的一个例子,是参照图11所示的示例性UPS单元排列布置和服务器机架进行说明的。假设UPS单元1110、1120、和1130,在此例中,其规模设置成在N+2冗余级别运行,每一个都具有300千瓦的额定输出,并且服务器机架250以稳定的速率牵引300千瓦。每个UPS单元可具有相同的特性效率曲线,在30%的额定输出上取得85%的效率以及在92%的额定输出上取得50%的效率。N+1冗余级别的冗余设备能量损失是通过先划分两个UPS单元之间的IT能耗(300千瓦稳定速率),使得对于每个单元以稳定速率150千瓦获得增加的能量输出来进行计算。在正常运行中,所有三个UPS单元在其额定输出的30%(100千瓦/300千瓦=30%)运行。在可替代的N+1冗余级别,其中两个UPS单元将在其额定输出的50%(150千瓦/300千瓦=50%)运行。

在此例中,PUE组件602采用以稳定速率300千瓦的IT设备能耗当前值,通过确定由沿效率曲线从额定输出的30%(效率85%)到额定输出的50%(效率92%)移动造成的能量损失的差异来计算所述冗余设备的能量损失。然后,PUE组件602应用等式(2)计算出的冗余设备能量损失值来确定对于N+1冗余级别的调整的PUE值。在此例中,由于UPS单元将在其效率曲线上更有效率的点运行,冗余设备的能量损失期限具有负值,而调整的PUE度量值会比未调整的PUE度量值低。

再次参考图13,在步骤1360中概述的过程可重复用于已被定义的每个可替代冗余级别。在计算每个可替代冗余级别的调整的能量效率度量之后,PUE组件602可返回到步骤1330收集额外的能量测量。步骤1330、1340、1350、和1360可被重复进行,以随着时间推移产生一系列调整的和未调整的能量效率度量值。

在一个实施例中,这些步骤是在一个与能量效率度量值(如每天,每周,每月)所需要的最精细的时间间隔相匹配的时间间隔执行,并且PUE组件602积累能量效率度量计算间隔之间所需要的能量测量。在一个可替代实施例中,PUE组件602收集并存储在时间间隔内的间隔能量测量,该时间间隔是能量效率的时间间隔的一个特定的整数倍,并对这些间隔的能量测量值求和,以计算所需的调整的和未调整的能量效率度量值。

当PUE组件602报告调整的能量效率度量值时,可提供指示。作为一个例子,PUE组件602可包括度量名称旁边的下标或使用一个简单的脚注引用为读者指向包含适当细节的说明。

关于天气概况被调整的PUE度量

如上所指出的,典型的能量效率度量,如PUE或DCIE受到HVAC设备所消耗的能量的影响。然而,目前这些度量没有考虑到不同的数据中心所处位置的天气概况的差异。数据中心内的HVAC系统通常被配置以保持IT设备周围的恒定温度,但这样做所需的能量将依赖于天气概况的因素,例如温度和隔热。数据中心通常被配置为保持IT设备附近的不同的恒定温度(如70华氏度与80华氏度的服务器入口温度),而这也将影响数据中心之间的HVAC设备的能耗。

为了更准确地考虑天气概况的这些差异,HVAC设备的能耗可以根据天气概况参数(如室外温度)建模。能耗模型可用于预测HVAC设备关于一个或多个可替代天气概况的能耗。HVAC能耗模型也可被设计为考虑到在IT设备空间温度设置点的差异。然后,数据中心能量效率度量可以进行调整,以使用关于一个或多个天气概况的被调整的HVAC设备能耗。调整的PUE由等式(3)描述为:

等式(3)

图14是用来说明确定调整的和未调整的能量效率度量的方法1400的流程图,其中调整的能量效率度量是关于HVAC能耗差异进行调整的。在步骤1410中,能量PUE组件602收集所有HVAC设备的能耗数据以及影响(或驱动)HVAC设备能耗的所选天气概况参数(诸如室外温度)的数据。这种基准数据集获取尽可能多的HVAC设备运行的全部范围数据(如HVAC设备的能耗数据和温暖季节及凉爽季节的室外温度数据)。某些数据中心能量效率度量(如典型PUE)指定能耗包括电气和非电气能量类型,以及由能量效率度量所定义的应包括在HVAC设备总能耗中的所有能量类型。

在步骤1420中,PUE组件602使用基准数据集创建HVAC设备能耗与所选择的天气概况参数的模型。美国专利申请2011/0066299,标题为“建模和监测能量负载的系统和方法(System and Method of Modeling and Monitoring an Energy Load)”,于2011年3月17日公开,在此该申请通过引用整个地并入全文,并以下简称'299申请,其提供了一个用于建立能量模型的示例方法。在'299申请中,除了描述包括因变量和自变量(分别如能耗和室外温度)的模型的创建,'299申请还描述了使用分区变量,它代表因变量的离散的操作条件。在一个例子中,包括天气概况参数的能量模型,如等式(3)所述,可排除这个分区变量,并将能耗用作因变量,以及将天气概况参数用作自变量。可替代地,在等式(3)中描述的能量模型可以结合表示不同HVAC设备操作条件的离散变量作为分区变量,例如,IT设备空间温度设置点。

在步骤1430中,PUE组件602获取重合HVAC设备能量和所选择的可替代天气概况参数的测量。如果能量模型已被配置为使用分区变量,PUE组件602还获得可替代的分区变量值。在步骤1440中,PUE组件602使用工业标准方法来计算数据中心的能量效率度量,如上所述。在一个例子中,效率度量可以是PUE类别1,并且PUE组件602利用等式(1)所描述的测量值来计算PUE度量。

在步骤1450中,PUE组件602计算关于一个或多个可替代天气概况的调整的能量效率度量,如等式(3)所示。为计算该度量,PUE组件602可以首先计算关于每个可替代天气概况的调整的HVAC设备能耗期限。这是通过将从所选择的可替代天气概况参数(如室外温度)的一个值提交给能量模型,并计算关于该选择的可替代天气概况参数所产生的调整HVAC设备能耗值来实现的。如果该模型将HVAC设备操作条件为分区变量,则该分区变量的一个或多个值被提交给能量模型以计算一个或多个调整的HVAC设备能耗值。PUE组件602然后使用等式(3)中的一个或多个调整的HVAC设备能耗值来计算一个或多个调整的PUE值。

在一个例子中,如果一个数据中心位于温暖的气候中,用户可产生调整后的PUE度量,以便和数据中心被重新定位到选定的更凉爽气候中比较数据中心的效率。PUE组件602可以选择日平均温度作为天气概况参数,并选择IT设备空间温度设设置点作为分区变量(以反映一个事实,即IT设备空间温度设置点可从70华氏度切换到80华氏度)。HVAC设备每日能耗的基准测量,日平均室外温度和分区变量值,可基于一年的时间进行获取。这些测量可以获取对应于室外温度和IT设备空间温度设置点配置的HVAC设备运行的全部范围数据。

在一个例子中,此基准数据集用于创建对应于平均室外温度的HVAC设备能耗模型,并可以结合IT设备空间温度设置点的配置。PUE组件602则可以获取需用来计算未调整的数据的能量效率度量的所有测量,包括HVAC设备的能耗。PUE组件602还可获得对于更凉爽气候的日平均室外温度,并改变IT设备空间温度设置点分区变量,以产生两个调整的HVAC设备能耗值:一个是对于70华氏度的IT设备空间温度的,一个是对于80华氏度的IT设备空间温度的。PUE组件602则能够将这两个调整的HVAC设备能耗的计算值应用到等式(3),来确定更凉爽气候下的调整的PUE的两个值。在一个例子中,一个调整的PUE值是对于70华氏度的IT设备空间温度,另一个调整的PUE值是对于80华氏度的IT设备空间温度。

在已经对于每个可替代天气概况的调整的能量效率度量进行计算后,PUE组件602可返回到步骤1430来收集更多的能量,驱动程序参数和(可选地)分区变量的测量。步骤1430、1440、和1450被重复,以产生一系列随时间变化调整的和未调整的能量效率度量值。在一个实施例中,这些步骤是在一个与能量效率度量值所需要的最精细的时间间隔(如每天,每周,每月)相匹配的时间间隔执行,并且PUE组件602累积能量效率度量计算间隔之间所需要的能量、驱动程序和分区变量的测量。在一个可替代实施例中,能量监测和控制系统收集和存储时间间隔的能量、驱动程序,和分区变量的测量PUE组件602在能量效率时间间隔的特定的整数倍的时间间隔收集并存储间隔能量、驱动程序和分区变量的测量,并对这些间隔的能量测量值求和,以计算所需的调整的和未调整的能量效率度量值。如果情况发生变化而影响建立在能量模型上的假设,PUE组件602可直接跳回到步骤410,建立新的能量模型。

除了计算调整的能量效率度量作为新的能耗和驱动程序测量被接收,PUE组件602还可以通过能量模型提交一组所存储的测量以生成一组调整的能量效率度量值。举例说明,PUE组件602可以有一组基于多个城市一年期间的日平均室外温度,并可通过能量模型运行这些数据来为每个城市生成一组调整的能量效率度量值。

当PUE组件602报告调整的能量效率度量值时,可提供指示。举例说明,PUE组件602可包括度量名称旁边的下标或使用一个简单的脚注引用为读者指向包含适当细节的说明。

管理数据中心能量效率的例子

上述调整的能量效率度量可用于将具有不同冗余架构和天气概况的数据中心进行准确地比较。调整的能量效率度量,如下文做进一步描述,可用来检测单个数据中心的实时发生的意想不到的变化,并在定义的目标范围内采取措施管理能量效率。

典型的业界数据中心的能量效率度量,如PUE和DCIE,通常指定用于计算度量的能量测量的一个很长的测量期间。例如,PUE度量的所有类别,指定一个12个月期间的能耗值。然而,这么长的一段时间,让人难以管理数据中心的能量效率。因此,PUE组件602提供通过更频繁的计算得出的更新的值,以提供给数据中心的工作人员所需要的管理能量效率的信息。

除了更频繁的更新,PUE组件602还能够通过使用基于基准的调整的PUE协助检测能量效率的意外变化。根据一些实施例,用于计算如上所述的调整的能量效率度量的方法可用于形成关于数据中心能量效率如何随着数据中心运行的测量情况而变化的理解。任何随后进行的能量效率测量可以和对该基准的认识进行比较,以强调意外的变化。在一个实施例中,能量的监测和控制系统跟踪关于所定义的冗余级别随时间变化测量的调整的冗余设备的损失,并强调预定范围之外的变化。在另一个实施例中,能量监测和控制系统可使用能量模型对当前未调整的能量效率度量值和由模型预测的能量效率度量值进行比较,并强调预定范围之外的变化。

例如,如上所述,考虑一个数据中心,其能量监测和控制系统已实施HVAC设备的能耗关于日平均室外温度的能量模型。给定数据中心外的日平均室外温度某个特定值,能量模型和根据等式(3)的测量可用于计算该温度下的预期的每日能量效率度量值。使用这种方法,能量监测和控制系统可以被配置来比较计算出的未调整的能量效率度量值与模型预测的能量效率度量值,并强调相比于这个预期值的任何变化。

确定实时冗余(RTRD)

根据本文所述的实施例中,实时冗余(RTRD)度量注重于可靠性和实时分析电气系统的变化,以确保冗余将不会受到影响。在该方法中,RTRD组件606分析在电气系统中的意外的或模拟的变化,并为用户产生关于可能已经发生在电网或系统可靠性上的变化的影响的报告。这里所描述的实时冗余功能通过允许系统和用户识别其数据中心内可支持额外功率负载且不会影响该系统的冗余的区域,来扩展当前冗余分析。

在某些实施例中,由RTRD组件606所执行的RTRD分析检查电网404的每一级,并建议附加负载可以被安全地添加到系统中的区域。该RTRD分析允许数据中心管理人员最大限度地发挥现有资产的电力系统利用率。用户可以通过两种方式利用输出功能。首先,管理员可以在其系统上运行报告来查看每个组件的容量。该报告所提供的不仅是容量的一个声明而是更多内容。进一步地,报告显示给设施组在电网的每一个点的可用电力容量,而且不影响设施内的任何冗余级别。

根据本文所述的实施例中,当电气系统的冗余有风险时,RTRD组件606自动实时检测。给定的断路器额定值和该系统中每个点的实时负载,如果一个特定设备发生故障并且冗余电路被强制接起额外的负载,实时电力系统冗余模型使得该系统的冗余是足够保持数据中心运行的。在一个典型的主机代管中心内有五个级别的电气层次。实时冗余功能,通过允许系统和用户识别其数据中心内可支持额外功率负载且不会影响该系统的冗余的区域,来手动完成扩展冗余分析。此分析检查每个级别中的配电系统,并建议附加负载可以被安全地添加到系统中的区域。通过使用这种分析使数据中心管理人员最大限度地发挥现有资产的电力系统利用率。

“N”冗余是确保在发生电力故障的情况下资产可用性的备份类型。有几种类型的电气系统架构:N、N+1、N+2、2N、2(N+1)和2(N+2)。对于所有系统来说,组件(N)表示具有备份组件(+1)。“N”冗余系统配置的各种例子可以包括一个或多个UPS模块,或一组或多组的UPS模块,其一起工作以将电力提供给IT负载。冗余系统配置的其他例子可包括“2N”系统配置,以使得两组或三组UPS模块供电给每个IT负载的两个不同的电源供应器。“2N”冗余允许一个整组UPS模块发生故障或关机,但是IT设备仍然可以被供电。最后,“2(N+1)”的系统配置提供了两组或三组UPS模块以供电给每个IT负载的两个不同的电源供应器。“2(N+1)”冗余允许一个整组UPS模块加上剩余组中的一个多余模块发生故障或关机,而IT设备仍然可以被供电。

在一个例子中,在冗余电气架构设计中存在资产的电气层次结构。层次结构包括一个或多个以由上向下的方式组合在一起的电气资产设施,以涵盖一个或多个储备,并提供冗余。图15所示为电气系统的层次级别,包括实体储备级别节点1502,其包括根级别节点1504,接着是UPS级别节点1506,随后是PDU级别节点1508,然后RPP级别节点1510,最后是机架级别节点1512。RTRD组件606可被配置为持续分析电力系统和当检测到一个潜在的冗余问题时发出报警。

图16所示为由用户通过使用监测和控制系统或电源管理系统监测的关键建筑物的冗余电网的一个例子。电源管理系统,让用户能够监测和存储来自于分布点和资产的数据/信息,允许用户控制资产,运行信息报告,并设置警报。

参照图16,其中所示为类似于上述参照图4和5的电气系统架构的电气系统架构,并且可以由用户通过监测和控制系统1602进行监测。监测和控制系统可以通过通信网络连接到监测点1604和相关资产。监测点1604可以位于用特定的监测设备测量功率和能量使用的关键分布点,或嵌入在系统的各种资产内。在一个例子中,监测可以通过智能电子设备(IED)来完成,比如PowerLogic ION系列仪表或Sepam保护继电器,均由施耐德电气制造。监测也可由设在电网内的资产来完成,通过嵌入到资产内的各种测量组件诸如智能断路器或UPS单元进行。

如上所述,不同系统的用户,对于电气系统来说可具有不同需求和职责。例如,一些用户(如IT管理)可能需要冗余进行约定的运行,其他用户(如建筑管理)可能需要管理约定的冗余。该监测和控制系统为这两种类型的用户显示改变电网(添加更多机架,进行设备维护等)的最终影响的决定。

图17所示为确定RTRD度量的方法1700的流程图。在步骤1702中,电网运行在“稳定状态”。在一个例子中,处于稳定状态下运行的电气系统,如设计的,持续地提供能量给资产。在稳定状态下运行的这个例子中,监测和控制系统监测、检索和存储所有相关的电气数据(千瓦时、电压、电流、谐波等,或任何其他电能质量或电力可靠性数据)。在步骤1704中,电网的变化被识别。该变化可以是所检测的实时变化或被模拟的变化。例如,用户可以模拟改变资产的负载。

电网的变化可以来自几个来源。变化的一个例子是业务活动的改变,如在断路器的设置或设置点的改变。断路器可能是由于维护而发生的(如新的走向曲线设置或重置为出厂设置)。系统中的这种改变能够修改网络的协调设置并引起部分或整个网络当遇到不同负载以及进入网络的巅峰或低谷时而关机。

另一个例子涉及租用活动的变化。在此例中,租户服务器的数据需求中的巅峰能够伴随CPU处理过程的巅峰。CPU处理过程的巅峰能够转化为服务器和机架上更多的热量和负载,并能导致某些机架达到其最大负载。例如,在一个峰值数据传输时段可能会出现巅峰,如预期产品的新版本,对于新的托管公司的重大新闻事件,有关假期网购秒杀。另一个例子涉及到IT租户的变化。在此例中,由于IT租户在没有得到建筑物的授权下给予新服务器或机架上电,负载的增加可能会发生。

又一个例子涉及由维护而产生的变化。在此例中,设施管理人员可以通过执行定期或不定期的维护使系统发生改变。这样对系统的维护,可能由于维修或更换导致UPS关机。

进一步地,维护的变化能够由电气系统的冗余测试而引起。在一个例子中,当是由于政府法规需要或是由于设施测试需要进行测试设备时,冗余的测试可以进行。该测试可无需实体储备,允许设施100%地运行关闭发电机。系统中的这种变化可以允许设施管理人员在受控环境中检测冗余度,而不是在现实生活的停电状态中。在该维护测试不符合测试参数的情况下,设施可以转移非关键客户到另一数据中心。同样,维护可以对数据中心的一部分来执行,例如关闭一个支线做维护。可选择的关机可物理地执行,或者可以被模拟。在物理关机或模拟关机情况下,监测和控制系统可以进行冗余计算来测量变化的影响。

另外,维护的变化能够通过根据即将进行的维护方案试验而引起。例如,维修人员可出于维护目的需要关闭一个支线。在物理关机发生之前用户可以模拟设备的关机。另一种维护的变化可以是定期设备维护的变化,这可能需要每周或每月定期测试。例如,某些电气资产,如发电机,可能需要定期维护,以保持传输时间的水平降至最低。扩展这样的测试,以使测试之间具有较长的时间,这可能会导致意想不到的发电机的启动延迟,这也将影响系统的冗余。

在步骤1706中,RTRD组件606进行单线图(SLD)的分析(也称为一线图)。单线图的分析是电网的简化表示,允许用户执行一个功率流(PF)的分析。功率流分析评估整个电网并确定该网络是否符合设计标准。功率流分析还可以允许用户看到有功功率损耗和无功功率损耗,以及进行组件测试,以确保资产及其负载在其额定范围内执行,无论是在稳定状态,还是在紧急情况下。

根据一个实施例,利用四个数据集进行功率流分析。第一个数据集可能包含铭牌或历史数据。铭牌或历史数据为用于功率流分析的工业标准数据集。第二数据集可基于资产的设计容量。第三数据集可以是来自于电网的统计学显著真实数据集。第三数据集可以是根据在一段时间内从监测点获得的测量值确定的统计学显著数据集。测量值可允许电源管理系统产生关于资产的平均数据集(电压、电流、谐波,等等),其可用于进行具有置信度的分析。在一个实例中,对记录值的分析可允许IT用户消除异常,如仅被通电用于一小段测试时间的未经授权的负载(如加热器,或新的服务器)。在这个例子中,电路的负载使用中的“峰值”或“尖峰信号”可以从整个功率流分析中删除。第四类数据集可以是真实负载的最大值,其可以根据从监测点测量的值以及基于在预定时间段内测量的最大负载来确定。

第三和第四数据集可以基于通过上述通信网络由监测点1604和相关资产获得的测量值。在本文所述的实施例中,功率流分析可以通过确保测量设备具有高精度测量而被最大化。例如,高精度可包括确保测量设备具有高达至少1%的精度,或甚至高达0.1%的精度。因为许多系统中所使用的资产可能在制造规格方面具有很大的边际误差,为了进一步提高精度,高精度监测可以被添加到各个资产。这种很大的边际误差可阻止典型系统进行精确计算RTRD。例如,典型的PDU制造规格,可描述为PDU是5%的精确。考虑到这一5%的边际,用户只能加载达95%的容量到PDU,以确保PDU保持其安全缓冲。

在步骤1708,基于单线图分析,RTRD组件606分析电网和计算N型冗余。在一个例子中,冗余可以通过让层次结构的每个节点标上标记,如UPS1、UPS2、和PDU1.1、PDU1.2,来进行计算。电源管理系统可存储与资产相关联的标记以及哪些资产是彼此的上游和下游。这个标记惯例,结合资产负载和容量,可以用来确定系统或系统的子部分的冗余级别。在另一个例子中,随着系统N型设计将被用户所熟知,N型冗余也可以由用户输入。N型冗余很少发生变化。因此,一旦被计算出或被输入,N型冗余可被存储在电源管理系统。

在步骤1710-1714中,RTRD组件606计算所有资产的故障情形(步骤1710),并,通过功率流分析(步骤1714),运行每一故障情形(步骤1712),以看到对电气系统的影响。资产故障情形的自动计算可允许用户对成千上万的故障情形进行有效的和实时的计算。在一个例子中,监测和控制系统通过使用逻辑规则对所有故障情形进行编译和分析。

在一个例子中,可能存在两种类型的故障情形:系统故障情形和组件故障情形。系统故障情形可影响被认为是在N型冗余分类的每个方面,如发电机、UPS、实体。可能需要特别考虑2(N+2)冗余系统,以确定故障模式的可能排列。组件故障情形可包括并非构成N型考虑的因素的组件故障,如PDU和RPPS组件故障。这些组件通常是冗余的,但可能不总是匹配N型分类。在一个实施例中,对于每个组件有两种故障情况:A侧故障或B侧故障。因此,所产生的冗余计算可局部化,如果一侧已经发生故障,确定另一侧是否能够处理负载。

在步骤1716,冗余检测在电网上进行。冗余检测首先在层次结构的最低层进行,例如,在机架级节点。随后在层次结构的每一个后续级别进行检测,以确认该系统的一个较大部分的冗余。该冗余检测对于电源管理系统的用户非常有用,因为该检测提供给用户指示,指示电网中哪些资产为冗余设计中的薄弱点。

图18所示为执行冗余检测的方法1800的一个实例。该检测是通过以下方式来进行的,即当冗余系统的所有故障模式被考虑时首先确定在最低层级上的资产的负载是否小于计算出的界限(步骤1802)。在步骤1804,界限检测是在同一层级的资产上进行的。在步骤1806中,对于较高层级上的资产重复进行界限检测。在步骤1808中,该检测确认在一个层级的资产组符合冗余级别,和上游资产及以上级别达到冗余级别,并提供“通过”或“失败”的报告。

图19A-19C所示为检测如何能在不同的N型冗余自动执行的例子。在图19A,机架1A.1是由两个UPS单元,UPS1A和UPS1B供电。对于该系统,为确认或测试2N冗余级别的存在,下面的逻辑被应用:

如果机架1A.1的负载≤(UPS1A的容量)和≤(UPS1B的容量),则存在2N冗余;而,

如果机架1A.1的负载≤(UPS1A容量+UPS1B容量),则只有N冗余存在。

例如,如果UPS1A和UPS1B的容量值超过2N冗余级别,则该容量值也超过N冗余级别。

在图19B,机架1A.1由四个UPS单元,UPS1A、UPS1B、UPS1C和UPS1D供电。对于此2N+1系统,为确认或测试冗余级别存在,或者它实际上是否是比预期更低的冗余级别,下面的测试逻辑被应用:

如果机架1A.1的负载≤((UPS1A+UPS1B)/2)且≤((UPS1C+UPS1D)/2)),则存在2N+1冗余;而,

如果机架1A.1的负载≤(SUM(UPS1A,UPS1B)且SUM(UPS1C,UPS1D),则只有2N冗余存在;而,

如果机架1A.1的负载≤(SUM(UPS1A,UPS1B,UPS1C,UPS1D),则只有N冗余存在。

在图19C,机架1A.1由三个UPS单元,UPS1A、UPS1B和UPS1C供电。对于此N+1系统,为确认或测试冗余级别存在,或者它实际上是否是比预期更低的冗余级别,下面的测试逻辑被应用:

如果机架1A.1的负载≤(sum(UPS1A、UPS1B、和UPS1C中的任意两个),则N+1冗余存在;而,

如果机架1A.1的负载≤sum(UPS1A,UPS1B,UPS1C),则只有N冗余存在。

可以理解的是,当其中一个资产过载时,只有某些冗余方案可以“默认”为某些更低的冗余方案,例如从N+1到N,或从2N到N,或从2N+1到2N。例如,在没有电气系统在布线方面的物理变化时,从2N+1级别到N+1级别是不可能的。

再次参考图17,在步骤1718,由于分析,该监测和控制系统产生一份报告,例如冗余和容量报告,并将报告可视化地呈现给用户。该报告可能显示“通过”(步骤1722)或“失败”(步骤1720)。在一个例子中,“失败”的报告可以允许系统自动启动所建议的电网的更改,或者用户手动更改电网,以使其达到一致(步骤1720)。然后该方法返回到步骤1710。

该报告可进一步表明系统在不同的冗余级别(例如,从2N到N)是否会“通过”或“失败”。此外,如果报告中指出一个故障,该报告可能会突显哪个资产或哪些资产是单线图中的故障点,并在什么层级,或在资产层次结构中哪个集群发生故障。

在另一个例子中,RTRD组件606可确定并建议对电网的更改,并提供建议给用户。该建议是通过识别系统中的薄弱资产(从容量视图)在哪里,如上所述,并模拟负载从一个资产到一个不同的资产的转移,以更好地平衡负载。例如,在一个电网,UPS A可以具有一个与其相连的冗余机架,但是位于网络中的其他地方的UPS B可以具有与其连接的三个机架。该RTRD组件606可在一个特定的层级上识别这个不平衡,该RTRD组件606能够提供建议,从而找出优化负载的方法。

图20-23示出提供给用户的报告的不同的实例。图20示出一个冗余和容量报告的例子,其是对可用容量与系统冗余级别进行比较的图例。如图20所示,随时间推移的实际容量显示,该设施是在2N+1下运行,并具有容量上的峰值,这将系统从2N+1改至N+1的冗余系统。2N冗余级别的“取消选择”表示该系统在不发生资产或系统中布线的物理变化下,不能被降低到这样的水平。而图20所示的响应是不具体到一个层级,可产生关于电气层次结构的任何部分(即,系统节点级别、模块节点级别,等)或整个电气系统的冗余和容量报告。

图.21A和21B所示为显示UPS冗余检测状态的报告的例子。如图21A所示,报告可显示各种资产的名称、其分层位置,如UPS系统,组和模块,以及相关容量,如超额预定的,或可用容量和冗余检测的结果。图21B所示为显示冗余架构的图形表示的报告的一个实例。

图22A所示为显示UPS系统1的负载图及相对应数据表格的报告的一个实例。UPS系统1包括冗余配置2(N+1)中的UPS组1A和UPS组1B。负载曲线图以千瓦与时间(所示为一月至五月)绘制功率。条状部分2202-2208表示系统中以千瓦计的可用功率容量。条状部分2210-2218年表示系统中以千瓦计的峰值负载。线2220表示系统中以千瓦计的非冗余功率容量。线2222表示系统中以千瓦计的冗余设计界限,表示一阈值,在该阈值之后,UPS系统设计冗余可能会丢失。如图22A所示,该系统五月的峰值负载功率超过冗余安全阈值。因此,该系统冗余可能会受影响。在所示例子中,设计冗余可表明UPS群组(UPS A1或B1的UPS)的全部损耗加上群组中保持在线的+1UPS模块的损耗。因此,两个UPS模块需要能够在必要时承担整个IT负载。

图22B所示为显示UPS1A组的负载图及相对应数据表格的报告的一个实例。UPS1A组包括UPS模块1A.1、UPS模块1A.2和UPS模块1A.3。类似上述的负载图,线2220表示UPS1A组非冗余功率容量,线2222表示UPS1A组的冗余设计界限。条状部分2202-2208表示UPS1A组的可用功率容量,条状部分2210-2218表示与UPS1A组的系统峰值负载一致的负载。在此例中,由于单股线IT负载仅被加载到A侧,UPS A1组负载比UPS B1组多。

图22C所示为显示UPS模块1A.1的负载图及相对应数据表格的报告的一个实例。UPS模块的额定值是500kVA。类似上述的负载图,线2220表示UPS模块1A.1的非冗余功率容量,线2222表示UPS模块1A.1的冗余设计界限。条状部分2202、2204和2206表示UPS模块1A.1的可用功率容量,条状部分2210至2218表示与UPS模块1A.1的系统峰值负载一致的负载。

确定冻结资产(STA)

以下进一步描述的STA分析给予用户可靠性和节约成本/能量的组合(分析)。STA分析利用现有的安全缓冲,其为冻结(sweated)容量和安全容量(或空闲容量)之间的差值,允许用户缩小安全缓冲规模,同时仍在数据中心内提供安全可靠的电力。根据本文所述的实施例,空闲容量通过结合准确计量、用户对于负载位置的了解和智能容量管理来确定。在某些实例中,STA分析能够在可安全使用的数据中心内为用户提供约4%-10%以上的功率,减少了增加新的资本设备来管理电力的需求。

在现有系统中,当主机代管数据中心接近容量,用户可能需要做出有关资源分配的实时决策。在这些现有系统中,没有确切的电量使用数字,数据中心运营商估计电量使用量,精确度在5-10%范围内。因此,在一个特定位置的负载通常可在90%至95%的负载的额定容量“被透支”。此外,没有准确的用电量,数据中心运营商不能总是监视添加到系统的新负载的直接影响。相反,运营商通常会添加新负载到任何物理可用电路,这可能是或可能不是给新设备上电的最佳场所。

可以理解的是,管理额外的电力需求,如当构建新的数据中心或增加新的资本设备,是非常昂贵的。在用户承担如此高额成本之前,对于用户来说是期望确保当前位于数据中心内的设备被利用到最大潜力。利用数据中心至其最大潜力的一个实例包括在增加新设备之前利用所有PDU、机架、断路器至其容量。此外,当负责增加新容量的用户,例如IT人员,不是操作设施和管理电力系统需求的用户时,利用数据中心至其最大潜力可能会产生问题。

根据各种实施例,设计容量和安全容量之间具有安全缓冲,在本文中称为空闲容量。在至少某些实施例中,通过利用该空闲容量和通过最小化安全缓冲的大小,同时仍然在数据中心内提供安全可靠的电力,用户能够最大化在数据中心内的资产容量。在某些实例中,通过使用本文描述的方法,用户能够将资产最大化高达至少99%的可用容量。在其他实例中,更高水平的容量可以被实现。

在至少一个实例中,这可通过设备与资产的提高的测量精度来实现。例如,精确测量高达1%,或甚至下降到0.1%,都可以实现。在一些实例中,精确测量是通过结合精确计量,用户对于负载位置的了解以及智能容量管理来实现的。这三个方面加在一起能够提供额外的4-9%的缓冲,以安全地使用更多的电量,从而避免需要增加新的资本设备来管理电力。在一些实例中,通过往资产设备本身(即,PDU,断路器等)添加高精度的计量仪器,该系统可以进一步增加安全缓冲。

在一个实例中,为企业客户使用STA计算包括发现薄弱环节,如容量小的位置,并在该位置最大化空闲容量。企业客户则可以投资资本经费为薄弱环节位置增加容量,转移薄弱环节至其他地方。STA分析可以帮助数据中心运营商做出关于何时在数据中心进行投资资本经费的决策。

STA分析可以用作能量计费解决方案的一部分。例如,现有的主机代管供应商希望通过机架来为其客户计费,但是这种做法却因为容量计算的低精度被阻碍。使用下述的STA分析,高精度监测可允许主机代管供应商利用空闲容量,提供这样的服务。此外,STA分析能够使数据中心进行更快和更有效的调试。进一步地,STA分析可以在维护期间或者当电网的一部分需要被关闭以进行维护时用于模拟转移或移动负载。该STA的分析也可以用于培训新员工或模拟故障,以确保风险管理目标的实现。

如下所述的STA分析方法,以在数据中心架构的背景下进行描述,这是参照上面图16所做的描述。但是,可理解的是,STA分析可用于任何关键建筑物,并利用其他数据中心架构设计。参照图16,数据中心架构提供电气、机械和其他资产的例子,提供对目标可用性的路径,同时在数据中心设计中保持建议的最佳实践。这个数据中心架构被设计为服务对于每个类型架构都是不变的四种需求:符合国际标准,维持系统的正常运行时间,适应不同部门的每个临界水平,并在允许维护操作的同时不间断地运行数据中心。

图23-26说明了用于商业实践中的STA度量测量的一些例子。在实践中,由于未知负载造成的电力故障的潜在后果,因此不推荐运行数据中心至接近其最大容量。图23所示为存在于电网的额定容量和安全容量之间的安全缓冲的一个示例图。额定容量及安全容量显示为随时间变化的容量(以安培计)。线2302表示安全容量,线2304为标称容量,线2306表示系统的设计容量。在一个实例中,标称容量为制造商所提供的电气设备的容量。设计容量或额定容量是由地方或国家的建筑规范规定的运行容量,通常是标称容量的80%。例如,如果断路器的标称容量为60安培,其设计容量则为大约50安培。安全容量,在一个例子中,是建筑运营商考虑到所安装的设备可进行设备操作的实际容量。安全容量和设计容量之间的差值是安全缓冲。最大容量可通过利用安全缓冲,减少其规模来实现,同时仍在数据中心内提供安全可靠的电力。

图24所示为显示空闲容量的一个示例图。在一个例子中,空闲容量是冻结容量和安全容量之间的差值。在一个例子中,空闲容量是通过使用一个监测和控制系统在整个电网的监测点进行测量。监测和控制系统则可以识别,用户是否可以安全地从设备中获得更多的容量。

精确测量空闲容量是准确“冻结资产”的关键。空闲容量的测量能够允许用户来计算资本支出升级可被延迟多久。图25所示为利用率曲线的一个示例图。利用率曲线相交于安全容量的点与冻结容量的点之间的时间差表示资本支出升级可被延迟的时间。通过确定资本支出延迟,在一个示例中,用户可通过大量客户扩大初始资本开销。

可以理解的是,可能存在重大的资本支出风险,因为具有新增容量的资产可能不被使用。冻结资产,可以最小化这种风险,因为用户能够看到利用率与容量的比较,并确保升级在提供资金以及电气系统进行资本支出升级的那部分之前是必要的。图26所示为利用率曲线2602的一个示例图。如图26所示,在一些实施例中,利用率曲线可能达不到设计容量。

如上所述,参照图4,监测和控制系统可能包括建筑管理系统、电源管理系统和IT管理系统。建筑管理系统允许设施来管理基础设施建设,例如,冷却设备、热泵、HVAC系统以及其他资产。电源管理系统通常监视和控制电力基础设施,而IT系统通常监视和控制计算机和网络系统。在STA组件608不同的实施例中,建筑管理和电源管理系统可用于监测和控制设施,给予运营商关于数据中心基础设施相关的监测信息,检测任何报警并作出正确的决定,以减轻任何风险,并报告现场事件和能耗。监测和控制系统的一个实例是ION Enterprise,由施耐德电气制造。在一个例子中,电源管理系统使用户能够监测和存储来自于分布点和资产的数据/信息,并允许用户控制资产,运行信息报告,设置报警,以及执行其他管理和报告功能。

在本文中所描述的实施例中,监测和控制系统可以用来分析数据中心能量数据,以产生图23-26所描述的报告,提供关于安全容量、标称容量、设计容量,空闲容量、冻结容量和实际使用的用户信息。在一些例子中,监测和控制系统是在一个开放的互联网系统(具有或不具有安全性)或在一个封闭的网络系统进行联网的。

再次参考图如图16所示,监测点可位于具有特定监测设备的关键分布点,或嵌入系统中的各种资产内。在一个例子中,监测可以通过智能电子设备(IED)来完成,如PowerLogic ION系列计量仪器或Sepam保护继电器,这两者都是由施耐德电气制造。监测也可以由位于电网内的资产通过嵌入到该资产(诸如智能断路器或UPS单元)的各种测量组件来完成。监测点可以使用通信网络连接在一起,并且可以通过监测和控制系统来监测。

在本文所述的实施例中,空闲容量可以通过确保IED具有高精确度而被最大化。例如,高精确度可包括确保测量高达至少1%的精确度,或甚至高达0.1%的精确度。对个别资产增加高精确度监测可能是需要的,因为许多系统中使用的资产可能在制造规格上具有很大的边际误差。这种很大的边际误差幅度可能阻碍一个典型的系统进行准确计算空闲容量。例如,典型的PDU的制造规格可能说明该PDU是5%准确。通过考虑这一5%的边际,用户只能加载PDU顶多至95%的容量,以确保PDU保持其安全缓冲。

由于没有精确度的行业标准,在典型的系统中,设施管理者们使用一个经验法则,即可以是5%或10%精确度作为精确度的安全评估。在现有的系统中的一些例子中,对于设施管理者来说,精确度可以是相关于设备铭牌额定值或各种设备的制造规格,这将会是广泛的,且考虑到所有因素,如温度、湿度、安装环境、负载类型、电能质量以及其他因素。

对于STA分析的准确性没有预先设定的规则。在STA分析的一些例子中,1%的精确度是可以实现的,而在其它的例子中更高的精确度,例如0.1%,也是可以实现。然而,随着系统的精确度的提高,系统的运行则更加接近实际安全极限。因此,“实时”监测安全极限提供了最精确的计算。

如本文所使用的,在某些实施例中,实时监测是指在几秒钟甚至更少时间完成的过程,而不是由于使用更复杂的计算而可能发生几分钟或更长时间。在至少一个实施例中,实时可指需要对系统变化作出动态反应的时间量。例如,由于电力故障,让监测和控制系统对一个或多个电气设备作用和关闭一个或多个电气设备,该一个或多个电气设备如设备机架,或IT负载的断路器。此外,一些设备的特征对于制造商提供的规格可能是不准确的,或实际性能对于不同的设备可能会有所不同。设备的性能也可以随着设备的使用和磨损动态地变化。然而,可以理解的是,虽然有利的是具有尽可能多的监测点,但是这可能使安装和保持监测点就绪的总成本过高。因此,在一些实施例中,临时设备可被置于监测点。

增加监测点的数目和精确度提高了用户的更精确测量空闲容量的能力。再次参考图16,所示为具有四个监测级别的电网,其中每个级别增加了系统精确性。第一级包括监测UPS单元的输出。第二级包括监测第一级以及监测主PDU。第三级包括监测所述第一级和第二级以及RPP的每一个电路,其可包括PDU的输入和输出。第四级包括监测上述级别,以及监测每个设备的每个服务器负载,或各个IT负载。在所有情况下,对于在一个级别(UPS,PDU电路,或它加载)上的测量被累加后,得出整个系统的能量使用。

如上述参照图23-26的讨论,STA或资产使用的最大化被计算出,以利用数据中心的真实容量并确保在新设备安装之前或新数据中心建成之前,对数据中心进行完全地使用。STA计算也可被用来识别哪里需要首先花费资本开支,以增加容量。通过计算STA,用户可以对电力组件级别上各资产以及位于上游级别的资产的容量进行最大化。然而,可以理解的是,下游资产,例如分支电路,也可以包括在资产计算内。

资产能够被最大化的例子包括发电机、UPS单元、PDU、RPP、各断路器和/或机架。发电机可被进行评估,以确保它们足以覆盖新的系统容量。在本系统的实施例里不同类型的UPS单元可以被使用。例如待机和在线互动式UPS单元可监测输入,当扰动或故障被检测到时,那么在很短的传输时间(通常小于10毫秒)之后切换到以电池供电的电源。为了确保各个UPS单元得到充分利用,UPS设备在每个UPS单元的输入和输出被监测。在一个实例中,UPS单元可通过确保UPS单元以最大级别将电量馈入PDU单元而被最大化使用,但不超载PDU的设计容量。

图16所示PDU是通过将电力从一个较大的馈送处分配至几个较小的馈送处这样的方式运行的。该PDU是通过确保被连接到下游的每个控制板被最大化而不对PDU主断路器跳闸来进行最大化的。例如,如果该PDU界限为800A,已知PDU主断路器的跳闸曲线的特征,系统可进行运行尽可能靠近的PDU跳闸极限,而不依赖于制造规格。由于制造规格,实际的PDU曲线特征被使用,设施管理者应用于PDU主断路器的跳闸特性配置和每一个特定PDU的实际特征都可能都不相同。

图16所示RPP通过将电量从一个较大的馈送处分配至几个较小的馈送处运行,允许用户在空楼层定位电源面板。每个PDU可以具有与其连接的一些RPP。RPP是通过确保使用全部分配给其的电路而被最大化。

当计算STA时,各种包括在电网内的变压器可能不会被最大化以最小化对设施的成本影响。当变压器上的负载增加时,系统可以有更多的电量来使用。然而,由于包括了添加的负载,环境事件,如温度或谐波,可能会负面地影响变压器的寿命。因此,设施管理者可能需要对变压器进行额外的维护,最终提高了关于设备的成本影响。

各个独立的断路器或机架,也可以通过计算每个配电盘或各断路器的空闲能量,从而确定哪个电路能够处理额外负载以及哪些是接近其跳闸特征,来被最大化。为了最大限度地使用机架,在一个实例中,所有将电馈送到机架的电路,其利用率应接近100%。例如,在图16所示的数据中心,将电馈送到机架的电路包括连接到两个电源馈送的电路:A侧和B侧,包括一个或多个PDU,其由冗余UPS进行馈电。

图27所示为确定STA的一种方法2700。在步骤2702中,用户确定一个需要被添加到数据中心的额外负载。在步骤2704中,进行数据中心的容量检测。在一个例子中,用户或STA组件608比较设计容量与数据中心的安全容量,然后与使用容量进行比较。该检测可以在整个数据中心、一个子组件(例如,一个或多个数据中心资产,或下游的IT负载)由用户手动进行或由STA组件608自动进行。

在步骤2706,如果所请求的使用容量低于安全容量,那么更多的负载可以在步骤2720中加入。然而,如果所请求的使用容量高于安全容量,那么STA组件608在步骤2708中确定如何通过“冻结资产”继续进行。

在步骤2710中,监测和控制系统使用高度精确的测量工具,如上述的智能电子设备(IED),分析与资产相关的冻结容量。如上所讨论的,IED可具有如高精确度和实时测量能力的特点,使系统能够适当地最大化地使用资产。在一些实施例中,可以理解的是,资产的铭牌数据,或制造规格都可以被使用。然而,连接到所述监测和控制系统的IED,允许更准确的测量和对于数据中心和电气负载的分析。连接到IED的监测和控制系统可以测量、记录和制备用于实际容量计算所需的数据。由监测和控制系统所获得的数据用于确定冻结容量,如图24和25所述。

在步骤2712,空闲容量被计算出,作为为冻结容量和安全容量之间的差值。在步骤2714中,用户或STA组件608比较空闲容量与使用需求。在步骤2716,如果所请求的使用容量低于空闲容量,则STA组件608的用户确定其是否可以被添加以及更多的负载可以被添加在哪里(步骤2720)。在步骤2716,如果所请求的使用容量高于空闲容量,STA组件608的用户在添加新的负载之前确定是否需要扩大数据中心(步骤2718)。

根据一些实施例,作为建筑设计的实际监测和编程的跳闸设置可以如上所述在STA分析过程中予以考虑。例如,资产的优化也可以受到断路器配合的影响。一种断路器,或跳闸继电器,可在各种资产之间进行安装,以确保如果局部发生故障而保护系统。如果没有断路器配合,电气资产可能会被损坏或由于误跳闸而造成系统停机。在一个实例中,一些电网的变化,在步骤2712中确定的空闲容量被使用之前,可能需要物理地进行。改善的断路器的配合可以提高监测精确度和空闲容量的准确确定。

图28所示为用于产生空闲容量的一种方法2800。在步骤2802,监测和控制系统收集、测量并记录所需数据,并提供数据作为输入来进行空闲容量的计算。在步骤2804中,STA组件608然后进行空闲容量的计算。

在步骤2806,监测和控制系统从各种资产获得单线图、建筑布局数据和信息。在一些实例中,单线图可存储在电源管理系统406且可以计算为以上参考图17所描述的功率流分析的一部分。为获得建筑布局数据(步骤2808),监测和控制系统可以与数据中心基础设施管理(DCIM)系统或建筑管理系统408接口。建筑布局数据可包括诸如建筑平面图、可视化、IT设备/资产信息、和图纸(即,特定资产在平面图上所处的位置)的信息。该信息可以允许用户将资产与所述物理楼层布局进行视觉上的叠加。

在步骤2810中,监测和控制系统使用不同的监测点收集来自于各资产的所有与能量相关的信息和数据,如电能质量和电力可靠性信息。此外,与能量相关的信息可以从制造规格或从行业数据中获得。

在步骤2812,一旦所有的资产和电气系统的信息被收集,监测和控制系统可针对设计容量来确认信息,设计容量可以是基于电气设备所使用的固定值。监测和控制系统之后可在每个监测点计算出所有负载的设计容量和行业认可的安全容量。这些系统容量数字现在可以由STA组件608使用,以用于执行STA分析,或由优化组件306使用,以利用空闲容量来优化系统。

在步骤2812中,STA组件608从电气系统的最低级别开始计算容量数字,然后为电气系统的下一级别产生数字,直到整个电气系统被分析完。当为每一级别产生能量数字,STA组件608从最低级别开始不断调整能量参数来优化系统。对于图16所示的电网,最低级别是机架或IT负载级别,其次是PDU、UPS级以及顶部最高级别,实体级别。如上所述,STA组件608在每个级别产生系统容量数字(标称容量、设计容量、安全容量和空闲容量)。除了产生数字,在一个实例中,STA组件608还通过发现电气系统在使用中最低级别的空闲容量的最大量对系统进行优化,其当被使用时不会导致上游问题或电气系统上游级别的中断。步骤2812的计算是重复性质的。

在步骤2814,在STA组件608计算了电力系统所有级别的空闲容量之后,监测和控制系统可以进行实时功率流研究,以确保资产运作在指定参数范围内。例如,如果用户确定额外负载需要被添加到数据中心(步骤2816),功率流研究信息则可以被用新的负载需求进行更新。

新的模拟功率流可视化表示被产生(步骤2818),并且可以通过监测和控制系统保留,以便之后作为预估容量基线用于比较的用途(步骤2820)做参考。最后,容量信息可通过监测和控制系统传送到另一个系统或用户,使得系统或用户可以通过比较容量和所需使用需求做出关于空闲容量的决定(步骤2822)。容量信息可通过提供给用户一个或多个报警自动传输,或者通过用户干预手动传输。

如上所述的方法2800,通过在最低级别(即,机架级)产生能量数字,也可以对电网的特定部分来执行,和执行相同的迭代计算。通过分析电网的特定部分,该系统或用户可严密地检查电气系统的一个子部分的空闲容量。通过严密地确定空闲容量,用户可确定单个服务器机架是否可以被添加到网络,并可以进一步确定为机架的最佳位置。

可以理解的是,在步骤2812中的STA分析可以在某个所定义的时间点基于用户请求来进行,例如当用户在负载峰值或系统负载下落时请求添加新设备。在其他例子中,STA分析可以实时执行,或者在一段时间内完成,例如滚动分析。根据某些实施例,在不同的时间点例如在负载高峰期执行STA分析,给予用户能够查看是否能够添加任何新的负载或资产以及哪里可以添加任何新的负载或资产的能力。在非高峰期间产生分析可给予用户查看在哪里(或何时)资产及其负载可以被添加,以使得到整个数据中心或子部分在特定非高峰期间得到最大化地使用。在足够长的统计学显著时间段内产生分析可形成数据计算的置信水平。

根据某些实施例,用户的参与可通过在步骤2812自动执行STA分析得到减少或甚至消除。在一些实施例中,监测和控制系统可以具有足够的监测点和相关联的信息来产生数据中心的实际设计容量。此外,通过监测点和使用IED,空闲容量分析在步骤2804可实时完成。

自动化在系统的实时分析或接近实时的分析中可能变得很重要。这部分因为IED与监测和控制系统的结合给予了在高峰负荷或其他定义的时间内关闭非关键负载或资产的能力。例如,照明负载常常利用所需电力的很大一部分给建筑物,专注于冷却单元是数据中心内的关键负载,IED可被编程以关闭特定照明负载,以在高峰时期给予更多电量给冷却单元,以保持能耗不变或不超过一个预先定义的界限(通常是建筑和企业,如果在高峰期间他们使用超过了某个定义的使用量,则会收到其能源供应商在经济上的惩罚)。可以理解的是,如果IED被编程以打开和关闭资产,空闲容量也将出现波动,因此,对于用户来说,在没有最小局部自动化的帮助时来管理整个系统是非常复杂的。如果空闲容量受到系统中的条件变化的影响,该监测和控制系统将被请求以帮助用户做出决定。在另一个实例中,监测和控制系统的也可用于在高峰时期更改资产,以允许更多的空闲容量,或至少确保所计算的空闲容量仍然可用——这将通过监测和控制系统提高用于冷却机架(更多冷却等同于减少机架上的负载)的HVAC设置点。

在步骤2818为用户产生的可视化表示是由监测和控制系统执行的。在一个实施例中,可视化表示包括容量曲线,如图23-26所示。容量曲线允许用户能够根据时间比较利用率和容量,并且有助于规划何时或者是否需要为新负载添加新的容量。可以产生整个数据中心中、各个子组件及其下游的负载的可视化表示。为整个数据中心的容量进行可视化给用户提供了一个宏观的角度,并帮助用户规划资本开支或新的关键建设需求。为各个子组件及其下游的负载的容量进行可视化给用户提供了确保资产在一个物理区域例如在一个断路器完全最大化的能力。

另一种类型的可视化提供给用户包括对数据中心或关键建筑物的物理楼层空间的负载和资产的可视化表示。这种类型的可视化允许用户不仅可以查看是否可添加更多的电力负载,而且可查看是否有物理空间在可视化的位置来添加任何机械的、电气的或空白资产设备。

图29-31说明其他类型的可视化,包括以IT为基础的视图,基础设施视图,以制冷为基础的视图和整体视图。以IT为基础的视图,如图29所示,可以指示哪里有添加新的负载的容量。以IT为基础的视图显示从IT用户角度来看的电气容量。可视化表示允许IT人员了解在数据中心的何处,下至行和机架号,以安全地添加更多的服务器。可以理解的是,IT工作人员可能不关心电气基础设施,因为他们通常依赖于设施管理人员来操作,并保持其电气IT需求的支持。因此,这种数据中心地板的可视化允许给IT人员适当的背景来确定容量或增加新的负载。

图29所示数据中心的一部分物理楼层布局的表示,包括五排服务器机架,机架编号为1到N。其布局可以在视觉上显示具有可用容量的、没有容量的或接近满负荷的机架。对于接近满负荷的机架的使用可能需要设施管理人员的确认。在一个例子中,颜色可指示不同类型的容量,红(R)指示没有容量,黄色(Y)指示接近满负荷运转,和绿色(G)指示有可用容量可添加新的服务器设备。当IT用户需要添加额外的服务器到现有的数据中心时,这种视图可被访问。在某些情况下,这个决定可以由设施组独立做出。

以设施为基础的视图可包括一个单线图或一线图。图30所示为单线图的一个例子,通常是被设备管理员或建筑物操作者观察的。同样,在该视图中,颜色可表示容量,例如红色(R)指示没有容量以增加更多的设备,黄色(Y)指示该设备已接近满负荷,并且可能需要根据设备的水平在增加负载之前进行检查,最后绿色(G)指示有可用容量可添加新的服务器设备。

以冷却为基础或基于环境的视图可以显示楼层平面图和冷却能力。这种视图考虑所建议的改变和电气系统的实际改变中的环境的影响。图31所示为冷却视图的一个例子。冷却可视化类似于图29中所示的物理层布局,但提供来自于建筑管理系统的指示,其指示哪个机架和行可以安装额外的设备而不会增加冷却需求(以及由此的电力负载),并指示哪个接近极限,且将需要增加冷却给特定的机架、行或甚至地板上。图31所示,颜色可以指示机架或服务器的入口温度是否在目标范围内。例如绿色(G)可以指示增加额外的容量不影响总体区域。黄色(Y)可以指示该设备在可接受的容限边缘,以及红色(R)可指示增加另一个服务器会导致入口温度超过容限。

整体视图可以是电源、冷却和IT/布局视图相结合的组合。通过结合电气负载视图(图29和30所示)的信息和环境视图(图31),监测和控制系统可以提供给用户一个视图表示,平衡建设运营商、设施管理者和IT管理者的需求,在那里为电气系统添加最优化的负载。

确定电力可靠性指标(PRI)

电力可靠性指标(PRI)由PRI组件604提供,为用户(如主机代管系统运营商),提供总结电气系统可靠性的整体风险或性能的实时度量。可靠性评估考虑了与配电系统设计、组件特性和负载类型、以及其他用户指标的因素相关的供应风险和内在风险的担保。PRI是监测和控制系统可以记录的实时度量。如果实时PRI值超过阈值,PRI分析进一步允许用户或系统产生报警,允许用户或系统监测可靠性的长期趋势。此外,PRI度量平衡效率与可靠性风险,以给出整个数据中心的运营的更加细微差别的视图。另外,PRI度量是实时计算的,并可成为建模系统和设备的因素,以及考虑到设备故障被检测到的任何新的故障率,例如,来自于设备供应商或设施管理者的报警。

根据一些实施例,PRI度量是由PRI组件604通过基于电网内多个智能仪表的测量估算瞬时电网的可靠性来计算的。该PRI度量然后作为状态报告或以具有电能质量值(下面将讨论)的数据中心可视化表示的形式显示给用户,其中电能质量值数值通过数据中心的组件来表示,或使用颜色(例如,表示的可视化表示形式,红,黄,绿)相对地指示电能质量和基于电能质量的PRI度量。PRI度量可以是用户通常的日常工作流程评价的一部分和/或维护行为的一部分。

PRI分析可确保系统具有向客户承诺的合适的可靠性。当期望增加容量时,则上述STA分析及RTRD分析,以及下面要描述的PRI分析,协同工作,以识别电气基础设施的变化,可以安全地最大化空间和容量,而不影响冗余或可靠性。由于系统的可靠性由PRI组件604监测,当电气基础设施发生变化时,PRI组件604分析新的电气系统,以确保STA和RTRD的实施保持正常运行,同时保持PRI度量符合目标或预设限制。PRI度量可进一步结合数据中心的PUE度量,如上所述,以确定调整可靠性后的PUE值或可靠性增强的电力使用效率(REPUE)度量。这种度量平衡数据中心的效率与可靠性风险,给予整个数据中心的运营具有更细微差别的视图。在一个例子中,如果PRI度量指示了数据中心很高的可靠性风险,效率可能暂时会受到影响,从而电网中的更改可能减轻可靠性风险,但降低了效率。同样,关闭一个或多个非关键冷却设备可提高PUE,但也可能降低电网的可靠性。PUE和PRI度量可以合并,在高风险下,对于一个良好或优秀的PUE值的预期范围将有所调整,以表明虽然效率转换可能会高于正常但其仍可落入给定的高风险状态的可接受范围内。此外,通过评估运行计划的影响,PRI度量可以提供实时可靠性评估,以确保高PUE和电网的可靠性。

在一个实施例中,PRI错误可以作为一个例外的度量为用户来生成。PRI组件604可提供实时报警,将错误通知用户,例如错误方向的PRI趋势,或者存在PRI峰值。在一个例子中,用户可能只检查发生这样错误的PRI度量。

在一个例子中,PRI度量计算提供了二进制的“通过”、“失败”或关键性能指标(KPI)的PRI值。然而,由于人为干预,最终结果PRI度量参数可能不符合实时情况,并错误地触发“失败”或其他警报。为纠正这些错误,KPI值可用于抵销一个逻辑曲线,其可消除PRI电涌或尖峰而不会影响REPUE度量。电涌或尖峰可根据时间进行检测,度量在减小或增加之前保持在KPI值。

根据一些实施例,PRI度量由PRI组件604通过基于电网内多个智能仪表的测量估算瞬时网络可靠性来计算的。可以理解的是,PRI度量,如本文所确定的,可以是包括多个在电网不同节点和设备的不同功率级确定的电能质量值的向量形式。在一个实施例中,电能质量数字的向量,结合其他的信息,例如电网的冗余和电能质量恶化的严重程度,可为关键性能指标定义一个PRI值。系统管理员和维护人员可以使用这个PRI值作为索引来查找更详细的信息。

下面进一步说明的计算PRI的方法不同于现有的评估方法,现有评估方法是假设故障时间的指数分布和使用理论度量,如平均故障间隔时间(MTBF)。取而代之的是,本文所述的新的PRI方法是数据驱动的,并利用智能仪表,其能够记录选定监测点的各种电能质量(PQ)指标。根据一些实施例,确定电能质量的方法估计瞬时网络可靠性,其基于电网内智能仪表的有限数目的测量来描述当前网络可靠性状态。该方法利用蒙特卡罗期望最大化(MCEM)解决对瞬时网络可靠性的精确评估的技术挑战。

此外,电能质量概念可以进一步用于预测设备故障和有效地规划维护。例如,由于PRI度量记录电能质量数字的向量,当用于KPI的电能质量值中的一个触发警报时,系统管理员和维护人员可以使用电能质量向量的历史记录,以找出应被维护以避免潜在的停电的关键组件。

现有的PRI度量包括一组度量来评估电力系统的可靠性,包括,如,平均故障间隔时间(MTBF)、平均维护时间(MTM)、平均修复时间(MTR)、和固有有效性(Ai)。这些度量可用于做出关于关键负载的总电力故障时数的一般预测。而现有的PRI可以在规划和设计阶段提供关于系统可靠性的重要信息,它可能不提供给设施操作人员和维护人员需要维护高度可靠性的指导。举例来说,已经达到5-9可用性的设施预期每年约有5分钟的平均停机时间的常见声明是危险的,实际上可能并没有帮助的。同样,基于一个简化的数学模型的结果,例如关于故障数的泊松假设,可能具有不切实际的同样的问题。

因此,下面描述的新方法通过从更实际的角度确定新的PRI度量来评估电力可靠性。在一个实施例中,整体网络可靠性的特点是作为电能质量的函数,电能质量是由整个网络中监测点的智能仪表测量的。智能仪表的一个例子是的PowerLogic能源和电能质量测量仪,由施耐德电气提供。由于新的PRI着眼于在所有工作条件下的那些负载的电能质量,它提供了对当前网络可靠性状况的一个更好的视角。此外,在一个例子中,新的PRI根据历史运行记录数据来评估电能质量,从而可以在停电时支持更准确的预测,这对于有效的维护计划是很重要的。在这个例子中,新的PRI可作为一个预测或诊断工具,并可以通过提供对于潜在故障原因的观察补充现有的PRI。

为确定新的PRI,该PRI组件604可能需要基于有限数量的测量点精确地给电能质量传输建模。主要地,由于成本限制,不是每个电气部件都可以被监测。因此,假定对电网进行不完全的监测,可能需要干涉电能质量事件传播。

因此,下面描述的PRI方法提出了一种通用的分析模型,其对于实时进行可靠性评估是有用的。案例研究说明了这种模型在实践中的应用。此外,带有马可夫链蒙特卡罗(MCMC)的期望最大化(EM)模拟被采用,以使用部分电能质量信息来估计和推断整个网络的可靠性。此外,基于累计遭受时间(Cumulative Suffer Time)的性能指示器被建议使用。性能指示器跟踪电子组件经历“差”电能质量的累计时间。结合个别设备的具体特点,这一性能指示器可有利于维护计划。

PRI度量可以进一步成为多个内部以及外部因素,甚至以至建筑物的哪些部分。外部因素的实例可以是与外界因素有关的电能质量事件,诸如中断,电网的尖峰电压,最靠近变压器的闪电,以及其他电能质量事件,这可能是建筑物无法控制的。内部事件的实例可包括由于电路过载的跳闸。在一个实例中,每个电能质量事件可以被标记为一个数据块,如事件发生的地理位置,从而建筑管理者可以执行基于地理/建筑部门的度量。

网络的电能质量行业标准做法侧重于测量措施,如平均故障间隔时间(MTBF)、可靠性、和由IEEEGold Book中定义的可用性。上述这些参数没有一个明确地考虑电能质量,尽管已知电能质量和寿命与组件性能之间存在关系。期望最大化(EM)是一项迭代技术,用于确定具有不完整数据的模型的最大似然参数。这种技术迭代计算数据的预计对数似然率和关于不完整的数据(E步)的当前参数估计,然后更新参数估计以最大化预计对数似然率(M步)。

随机变化已被开发用于不可用于期望计算的一个封闭形式的解决方案的情况。特别是,马可夫链期望最大化(MCEM)执行通过马科夫链蒙特卡罗(MCMC)E步骤。传统EM也可被称为批处理EM,因为统计数字是基于整个数据集被计算。另一种是在线EM,其中参数是在一个实例子集之后被更新的。这种变化可以被用来改善收敛速度,或由于新的证据变得可用而更新模型。在线EM有几种方式,包括增量EM和逐步EM。在步长大小和迷你批次大小中做适当选择,则逐步EM可以在提高收敛速度的同时进行批次EM的性能的匹配。

电网的网络模型

因为新的PRI方法是基于电能质量事件,在一个例子中,时间被分割成持续时间单元,电能质量离散为事件,每个时间片段的特征在于其最极端的事件。我们可以对电力网格网络建模为一个加权的,方向图G=(V,E,W,Q,F),其中:

每个节点ν∈V代表一个电气组件;

每个边缘eij∈E表示电量从组件i流到j,也被称为到节点j的输入边缘和来自节点i的输出边缘;

与每个边缘相关联的是一个加权值,w∈W,其被设置为电量沿该边缘流动的概率,其中Σiw(eij)=1;

在每个时间片段,每个边缘都分配了一个电能质量值q∈Q,其表示该时间片段内发生的最极端的电能质量事件;和

在每个时间片段,节点的每个输入/输出边缘对都与一个电能质量转换函数f∈F相关联,它描述了输出电能质量作为输入电能质量的函数。

需要注意的是边缘加权很可能是所计划的维护和业务活动占主导地位,但也受到意外事件(如电力故障)的影响。还要注意的是,在一些实例中,电能质量值是具有时间依赖性的。在这些例子中,如果在时间片段内电量沿边缘流动,则一个电能质量值可被分配到边缘。电能质量转换函数可以依赖于输入边缘的电能质量、节点(即,电气组件)的运行条件、和输出边缘的负载。此外,该电能质量转换函数可以是有概率性的,是潜在动态的,可随时间推移而发展。在一个实施例中,电能质量转换函数可以受到许多因素的影响,包括维护规划,组件寿命,及电能质量事件的历史。

方向图的一个例子参照图34中所示网络进行描述。节点v包括实体储备、四个断路器、一个变压器和两个UPS。对于边缘来说,加权值w和电能质量q是被计算出的,该边缘由节点之间的电力线来表示。在一个例子中,假设所有断路器都开着,每个值的加权w是1,并且在每个边缘的电能质量要么通过智能仪表进行测量或使用下面讨论的算法进行推断。电能质量转换函数则可以使用数据驱动的方式获得,并且可以由操作数据和统计分析进行实时更新。

基于PRI的智能仪表

在一个例子中,电能质量事件是由智能仪表记录的标称电压扰动。电能质量事件可以包括事件ID、事件类别、以及相关的物理意义(如,最小/最大电压、持续时间等)。有许多系统可对电能质量事件进行分类。一种这样的系统示于表Ⅰ。

表I

由IEEE标准1159(8)定义的电能质量事件分类

如本文所使用到的,事件ID可用于唯一标识一个电能质量事件的类别。不同于现有的PRI度量参数,其包括一组理论上的度量,如平均故障间隔时间(MTBF),新的PRI可以根据智能仪表的历史测量数据。在一些实施例中,新的PRI的目的是实现两个主要目标:1)当前网络的可靠性状态的准确评价;2)未来潜在的网络故障的有效预测。对应于上述目标,提出定量PRI度量,包括:在时间片段内的瞬时网络可靠性;电子组件的累计遭受时间;和电子组件的预期存活时间。

在一个例子中,在时间片段内的瞬时网络可靠性可被定义为一个向量<q1,q2,…,qm>,其中m为网络边缘总数,qi是时间片段内边缘i的电能质量ID。请注意,由于电流的快速传播速度,电能质量变化的影响在整个网络中是瞬时的(时间片段内以粒度计)。在一些例子中,电气组件的累计遭受时间是时间片段的总数,在此期间,电气组件经历不利的电力条件。不利的电力条件的定义可能是与设备相关的。另外,鉴于过去和当前的瞬时网络可靠性,电气组件的预期存活时间可被定义为该电气组件将存活的预期的时间。

瞬时网络可靠性的评估

因为电能质量测量是在一个时间片段内在有限数量的边缘上进行的。那些有限数量的边缘上的电能质量记为q1,q2,…,ql,其中l<m。在一个例子中,一种迭代期望最大化(EM)方法3200由PRI组件604执行,如图32。在步骤3202中,PRI组件604可对于电气组件类别确定初始电能质量转换函数f。如下面进一步描述的,数据驱动的方式可通过使用发布的统计数据和收集的历史电能质量事件用于近似于f。

在步骤3204中,PRI组件604可以通过使用可用测量结果和如下进一步描述的统计推断来产生一组瞬时网络可靠性的评估。在一个例子中,网络的电能质量可能不会在图中的每个边缘计量,因此,给定所测量的边缘子集,目的是获得一组整个网络的评估值。在此步骤结束时,可以得到一组瞬时网络可靠性的可行的评估,以及瞬时网络可靠性的最大似然估计。在一个例子中,步骤3204在每个时间片段被执行。

在步骤3206中,PRI组件604使用3204步骤的结果可以细化电能质量转换函数。步骤3206可以在包括多个时间片段的较大的时间窗口进行。上述步骤可能不能实时进行。例如,取决于可靠性评估的条件,这些步骤可以被执行为按小时或按天用智能仪表记录数据。

在步骤3208中,PRI组件604可更新电能质量传输功能,因为它们可能会随着时间而改变。

步骤3202:用于电能质量传输功能的数据驱动方式

根据一些实例,一个电气设备的制造商可以能够提供输入电能质量和输出电能质量之间相关性的统计结果。不过,这样的测试结果可能并不适用于大多数情况。为获得电气设备的电能质量转换函数f,监测和控制系统可以测量并记录设备的输入链接的电能质量和输出链接的电能质量。基于操作日志数据,统计分析则可以进行,以建立电能质量转换函数f,其表示为一个概率矩阵。

图33所示为利用变压器的数据驱动方式的一个例子。如图33所示,变压器可具有一个输入和两个输出分支。为了获得变压器的电能质量转换函数f,监测和控制系统包括变压器输入端(q输入)的一个测量点和沿变压器输出端(q左andq右)的两个分支中的每个分支点的两个测量点。电能质量事件根据表I进行分类。标称类表示没有事件发生的高质量电能。由于不同类别的电能质量事件往往有不同的持续时间,电气组件可能会引入微小的传播延迟,以及仪表可能不完全同步,我们允许围绕每个事件周围存在一个小的时间窗口(即一个时间片段的持续时间)来确定相关事件。

然后,我们将三个测量点q输入,q左和q右之间的数据关联起来。如果对于每个事件q输入把输入作为参考,所有发生在事件q输入的同一时间片段内的其他事件q左和q右的可以被确定。如果输出在该时间窗内没有任何事件,它应被分配给“标称”类别的一个事件,并与q输入相关。如果输出有一个以上的事件,只有最严重的事件可与q输入相关联。类似的,如果使用其他两个点作为参考,我们可以重复这个相同的过程以找到关联。

通过计数每个给定输入类型的输出事件的数量,概率性的电能质量转换函数f可在表II和III中所示的输入/输出对之间产生。

表II

变压器转换矩阵示例

表III

变压器电能质量转换函数示例

注意,表II的矩阵中的数字表示相应的输入/输出事件发生的次数。表III的矩阵中省略了表II中包括全零的行,并将计数转换成频率值。

步骤3204:马可夫链蒙特卡罗(MCMC)模拟估计瞬时网络可靠性

在步骤3204中,假设如上所述由G=<V,E,W,Q,F>表示电力网格网络,Q中电能质量的未知值的密度函数是确定的。节点、边缘、加权和函数值V,E,W,F是可用的,但电能质量Q仅由q的可用测量值部分地获知。换句话说,Q=<q1,q2,…,qm>,表示完整的一组电能质量值,及Qobs={q1,q2,…,qi},表示由智能仪表测得的电能质量值的子集,其中l<m。Qest={ql+1,…,qm},表示所估计的和当前未知的电能质量值的子集。在步骤3204,PRI组件604确定密度函数qi(i=l+1;l+2,…,m)。

在一个实施例中,PRI组件604采用马可夫链蒙特卡罗(MCMC)模拟提供所估计的电能质量值。该解决方案的一个例子示于算法1:

在一个例子中,优先级组件604可能会随机地初始化潜在的变量,并通过接受具有与其似然率成正比的概率的新状态,来构造马可夫链。产生于最初的“老化”期间的状态被忽略,而从马可夫链进行采样。采样频率可以足够长,以确保样本是独立的。

Metropolis-Hastings算法可以被用来实现重新采样。由马可夫链的当前状态,通过对所有观察q的重新采样,对称转移到一个新状态的描述为:

等式(1)

其中M是电能质量事件的类别数量,N(qi,σ)是平均值qi和标准差σ的高斯值。

步骤3206:了解使用EM的电能质量传输函数

在步骤3206,假设已知转移函数。转移函数可能不知道先验数据,因为这些统计数据可能不会公开,网络很少有足够的测量点来应用步骤3202所示的简单技术。在一个例子中,PRI组件604可能需要基于网络的不完全计量来估计转移函数。

所提出的方式包括,使用期望最大化(EM)来找到电能质量转换函数在时间片段t(记为Ft)的最大似然估计,给定一个已知网络图,每个节点的设备类型d,观察到的边缘的位置,和达到时间片段t的观测历史Qobs。由于严重电能质量事件的稀少性,观察历史应该足够长,以适当地表征网络组件。确定EM的一个例子示于算法2:

步骤3208:使用在线EM更新电能质量传输函数

电能质量转换函数可以随时间改变。因此,PRI组件604需要动态优化电能质量转换函数,以将随时间变化的预期瞬时网络可靠性进行最大化。这可以通过如步骤3206所述以规则的间隔重新运行批处理EM来实现。可替换地,在线EM也可被使用。

基于累积遭受时间的性能指标

在一些实施例中,在给定了过去的和当前的瞬时网络可靠性情况下,一个新的性能指示器可以基于网络中每个组件预期存活时间来确定。在至少一个实施例中,为确定预期存活时间,网络被考虑为在一个较大的时间窗口上。因此,电气设备的累积遭受时间则可以用来预测用于设备维护的预期时间。

现有的可靠性理论通常假定电气组件的故障率是恒定的,而故障间隔时间遵循指数分布。在这个假设的背后,假设电气组件是“无记忆”,这是指数分布的独特属性。换句话说,至下个故障的预测的时间量值不依赖于该组件的历史运行状况。虽然这种假设可能极大地减轻电力系统可靠性的数学分析,这在实践中并不是真实的。直观地,设备运行越长,就越可能被磨损,并且越可能发生故障。在一个实例中,对于给定的设备,随着运行时间的增加,故障间隔时间的预测量就越可能降低。因此,为预测系统故障,采取有效预防措施,新的性能指示器的确定可以包括一个精确的模型来捕捉失败率和设备历史运行之间的相互关系。

为确定预期存活时间,通常可以假定一个设备的故障率,λ,可以不再恒定,而是随时间变化的变量,为λ(t)。例如,在第五年的汽车故障率会比其在运行的第一年的故障率大几倍。这个变量模型是比较实际的,但它隐含地假设一个静态的、稳定的运行环境、或运行条件的影响是可以忽略不计。为克服这一缺陷,运行条件(主要是电能质量)被考虑,以及基于评价框架的性能指示器被制定。

案例研究

图34所示为模拟网络的一个例子,其展示使用已知拓扑结构和电能质量转换函数的新的PRI方式。如图34所示的电网,包括一个供电给两个UPS单元的实体、以及断路器、变压器、总线和多个电力计量仪。由于真正的转换功能不适用于大范围网络组件,包括类别1-5的电能质量类别被创建。

在此例中,电能质量被假设为在所有的分支或输出都是等效的。在一个实施例中,有可能通过引入具有多个独立输出的虚拟节点到图中,以消除这一假设。在给定观测数据和已知的转换函数的情况下,在时间t的每个未被观测的节点处的电能质量的概率密度函数(PDF)被确定。转换函数示于表VI中,并将得到的网络电能质量示于表Ⅴ。

表IV

转换函数

表V

电能质量的概率密度函数.计量设备见粗体字.

由算法(1)返回的样本是所产生的样本的子集。在最初的“老化”期间产生的样本可以被丢弃。在老化周期之后,每隔δ(在一个实例中δ=20)样本可以如图35所示返回。虽然所提出的转换方法很简单,可能不会导致整个状态空间的大的跳跃,但是验收测试可被有效地评估。因此,可以包括许多建议测试。所产生的链是遍历的,因此,给定足够数量的样本,则产生真实概率分布的样本表示。

给定观测数据,则所有的转换函数被计算出。假设有一类设备(例如,所有的开关)的所有实例都具有相同的转换功能,如步骤3204-3208中所述,PRI组件使用马可夫链期望最大化,以确定所估计的电能质量数字,并由于电能质量数字随时间变化进行重新采样。转换函数初始化为均匀分布。如图36所示,系统收敛于一个局部最大值。然而,该系统是不受约束的,局部最大值并不是电能质量的真正值。在此模拟中,系统可通过测量多个节点收敛于电能质量的真正值。在实践中,很可能是所观察的节点的比例要小得多。在这种情况下,转换函数的适当初始估计可以被使用,额外的领域知识可被用于施加额外的约束。

PRI度量可以被用来提供给用户一个可靠性的可视化表示。可靠性可以使用数据中心的物理楼层布局和上述的电能质量测量来提供。物理楼层布局可提供指示给用户关于数据中心内的各个资产的可靠性级别。可视化则指示用户哪些机架和行可以安装额外的设备,而不降低系统可靠性。在一个实施例中,颜色可用于指示资产的不同类型的可靠性,红色(R)指示低可靠性,黄色(Y)指示接近可靠性界限,以及绿色(G)表示高可靠性和可用容量,以添加新的服务器设备。

本文所讨论的本发明的至少一些实施例中,评估和计算的准确性是指监测分辨率的量,其可用于操作优化系统和本发明描述的方法,以及为设施管理者或用户产生效益。

本文所讨论的本发明的至少一些实施例中,实时评估和计算的性能是指仅用了几秒或更短时间完成的过程,而不是几分钟或更长如同发生复杂计算一样。在至少一个实施例中,实时可以是指需要对系统变化动态地作出反应的时间量。例如,由于电力故障,让监测和控制系统反应并关闭一个或多个电气设备,如设备机架,或用于IT负载的断路器。

在本文所描述的至少一些实施例中,对用于管理关键设施内的配电系统的系统和方法进行了讨论。如本文中所讨论的,配电系统可以包括组件,如UPS单元和用于给关键设备上电的断路器,还可以包括用于冷却关键负载和设施的HVAC系统。

至此描述了本发明至少一个实施例的若干方面,但应理解的是,各种改变、修改和改进对于本领域技术人员会是容易想到的。这样的改变、修改和改进被认为是本公开的一部分,且被认为是处于本发明的精神和范围之内。因此,以上描述和附图仅是通过示例的方式。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1