数据中心控制方法和系统与流程

文档序号:17336595发布日期:2019-04-05 22:34阅读:579来源:国知局
数据中心控制方法和系统与流程

本发明总体上涉及数据中心,以及更具体地涉及监视、优化和控制数据中心的操作。

相关申请

本申请是于2013年3月7日提交的且题为“数据中心智能控制和优化(datacenterintelligentcontrolandoptimization)”的美国专利申请13/788,834号的继续申请并要求其优先权。该美国专利申请13/788,834号要求于2009年11月25日提交的且题为“用于电子设备的环境条件管理的设备和方法(apparatusandmethodofenvironmentalconditionmanagementforelectronicequipment)”的美国专利申请12/626,299号的优先权。该美国专利申请12/626,299号要求于2008年12月4日提交的且题为“用于电子设备的热管理机柜(thermalmanagementcabinetforelectronicequipment)”的美国临时专利申请61/119,980号的优先权。美国专利申请12/626,299号和美国临时专利申请61/119,980号以其全文通过引用并入本文。



背景技术:

数据中心通常是用于容纳电子设备的设施。从常规上而言,这些设施由于维护该设施所需的包括冷却设备的各种组件而通常具有较大的占地面积。通常在不考虑该数据中心的多个方面的情况下,手动执行数据中心和/或数据中心基础设施资产的监视、优化和控制。例如,通常在不考虑在数据中心内的服务器的利用率的情况下进行数据中心基础设施的管理(例如,冷却、功率分配等)。类似地,服务器(以及在服务器上运行的应用程序)的管理通常对下层的数据中心基础设施一无所知。



技术实现要素:

本公开的实施例包括通过下述手段来优化数据中心和数据中心操作的系统和方法:收集、监视、分析、仓储和挖掘数据;使用专有算法、预报、模拟和模型进行分析和预测来开发替代性的数据中心配置和流程;通过分析多个优化维度以及开发和评估替代性的优化动作来进行优化;以及产生并执行优化指令。

在各种实施例中,一种数据中心控制系统,包括与处理器通信的存储器,所述处理器当执行适于数据中心控制的计算机程序时执行操作来优化数据中心的操作。该系统访问与数据中心操作相关联的输入数据,其中所述输入数据包括库存数据、操作数据、历史数据和外部数据中的至少一种。该系统确定至少一个数据中心优化维度。优化维度可包括可靠性、弹性、风险、延时、效率、成本和威胁规避中的至少一个。

基于该输入数据的至少一部分,该系统进行预报来产生预测性数据。基于至少一个数据中心优化维度、预测性数据和输入数据,该系统确定优化动作。该系统基于所述优化动作生成优化指令。在各种实施例中,执行优化指令导致与数据中心操作相关联的操作状态的变化。

本公开的各种实施例包括监视、分析和控制数据中心以及相关联的硬件和软件的系统和方法。在一个实施例中,数据中心基础设施控制系统(“dcics”,datacenterinfrastructurecontrolsystem)基于第一表达式确定与数据中心资产相关联的第一操作和数据收集点。数据收集点可包括传感器、指示器、探测器、应用程序编程接口、系统数据等。在各种实施例中,表达式可从数据库、用户界面、另一个系统、硬件设备等获得。在不同实施例中,表达式可由dcics例如基于其它表达式、数据或事件来衍生或产生。

dcics解释和/或分析该表达式并生成机器代码指令,其例如可包括用于从数据收集点获得第一点数据以及基于第一点数据执行操作的指令。在各种实施例中,所述指令可包括用于获得、接收或检索第一点数据的指令。

dcics执行机器代码指令以产生第一操作的第一结果。在各种实施例中,响应于产生第一结果,dcics检查或分析第一结果并确定第一控制指令。执行所述第一控制指令导致至少一个数据中心资产和数据中心的操作状态的变化。在各种实施例中,dcics可以执行控制指令,部分地执行控制指令,和/或将控制指令传送到用于执行的硬件设备或软件程序。

本发明的其它方面和优点将从以下详细描述结合仅仅通过示例的方式示出本发明原理的附图而变得明显。

附图说明

本发明的上述和其它目的、特征和优点,以及本发明本身将从与附图一起阅读时的各种实施例的以下描述而得到更全面的理解,其中:

图1描绘根据各种实施例的由该技术利用的逻辑数据中心操作的数据源;

图2示出根据各种实施例的数据中心;

图3描绘根据各种实施例的数据中心模块的剖视图;

图4描绘根据各种实施例的数据中心模块控制器;

图5描绘根据各种实施例的数据中心管理系统的逻辑视图;

图6描绘根据各种实施例的用于数据中心模块的控制系统;

图7是描绘根据各种实施例的操作数据中心模块的方法的流程图;以及图8描绘根据各种实施例的模块化数据中心。

具体实施方式

本文描述的是监视、优化和控制数据中心的技术,其利用来自数据中心的多个组件、与数据中心相关联的硬件和外部数据源的数据。例如,如本文所述,dcics可与数据中心和/或外部数据源的多个组件进行通信,以便收集关于和/或影响数据中心操作的数据(数据中心操作数据)。dcics可基于所收集到的数据中心操作数据来修改数据中心的操作或操作状态。

虽然本说明书参考了特定的技术、系统架构、操作控制和数据管理技术,但是从业者将认识到本说明书只是描述了各种实施例,并且可在不脱离本发明范围的情况下实施其它设备和/或方法。虽然本文的实施例以使得本领域内的技术人员能够实施本发明的足够细节进行了描述,但是应当理解的是,在不脱离本发明的精神和范围的情况下可以实现其它实施例以及可以进行逻辑和机械上的改变。因此,本文的详细描述仅仅是为了描述的目的而提供而不具有限制性。

为了简洁起见,系统(以及系统各个操作组件的组件)的常规数据联网、应用开发和其它功能方面在本文中不会详细描述。此外,在各附图中所示的连接线意旨表示各个元件之间的功能关系和/或物理耦联。应当指出的是在各种实施例中可以具有许多替代性或附加的功能关系或物理连接。

由本公开和技术所提供的优点例如包括数据中心操作的效率增加、风险降低、成本降低、硬件和功率的利用率增加、可靠性增加、收益增加、安全性提高、弹性增加等。例如,通过利用所收集到的数据中心操作数据,可以改善数据中心监视,数据中心可以在较高的效率下操作,并且可以减少数据中心内故障的量和影响。

本文所描述的技术可以利用dcics来收集数据中心操作数据和/或控制数据中心的操作。例如,该dcics可以和与信息技术(“it”)栈相关联的数据中心的各种组件和系统或“层”通信并收集来自其的数据,所述数据中心的各种组件和系统或“层”包括:数据中心的基础设施(例如,公用设施、环境管理设备、发电和功率分配设备、备用电源设备、数据中心模块、数据中心设施等);在数据中心内的it设备(例如,pc(个人计算机)、服务器、存储设备、联网设备等);在数据中心内或与数据中心相关联的it设备上执行的软件(例如,虚拟化系统/操作系统/用户应用程序等);和/或与任何上述组件或系统通信的用户。在各种实施例中,该技术可从外部数据源收集数据,所述外部数据源诸如用于气象数据、地震数据、政治数据、经济(例如,能源价格的变化)、金融和/或新闻数据的源。dcics可以整合、聚合、分析、处理,和/或提取所收集的信息以便进行分析、存储和/或呈现给数据中心的操作员。

在各种实施例中,dcics可以分析所收集到的数据以便得出其对数据中心的操作和性能上的影响。例如,可以大约实时的方式对所收集到的数据进行分析,以评估当前数据中心的操作和/或预报未来数据中心的操作、操作状态、约束、需求、成本、容量,优选的或最佳的配置等。dcics可以存储和分析所收集到的信息,以确定为何发生与数据中心操作相关联的某些事件,以及各种dcics可执行各种决定并控制引擎来开发和评估替代性的数据中心配置以及实施数据中心的操作配置或操作状态的变化。

图1描绘由该技术利用的逻辑数据中心的数据源。在各种实施例中,dcics105可与it栈的所有层通信,并使得能够在it栈的所有层内提供透明度,it栈的层例如包括用户层、虚拟层、应用程序层、操作系统层、it或硬件层和数据中心基础设施层。在所示的实施例中,dcics105(例如,经由数据连接)双向连接到翻译器107、数据中心基础设施110、it硬件115、虚拟层120、操作系统125、应用程序130,和/或用户135。虽然所示的翻译器107、数据中心基础设施110、it硬件115、虚拟层120、操作系统125、应用程序130,和用户135的每一个由框以逻辑图示出,但是应当理解的是,每个框可表示数据中心基础设施、it硬件、虚拟层、操作系统、应用程序,和/或用户的多个实例。

数据中心基础设施110例如可以包括公用设施、环境管理设备、发电和功率分配设备、备用电源设备、数据中心模块和数据中心设施。dcics105可从模块化数据中心内的数据中心模块收集数据中心操作数据。例如,dcics105可从一个或多个模块化数据中心和/或数据中心模块收集数据,如在2013年1月28日提交的且题为“模块化数据中心(modulardatacenter”)的美国专利申请13/751,568号中所述,该美国专利申请的内容以其全文并入本文。在各种实施例中,dcics105可从常规的数据中心(例如活动底板设施)收集数据中心操作数据。dcics105可将指令(例如,经由数据通信、控制信号等)发送到数据中心基础设施110。例如,dcics105可导致数据中心(或数据中心模块)内的冷却设备增加/降低数据中心(或数据中心模块)内的温度、湿度等。

在各种实施例中,dcics105可经由翻译器107与硬件元件(例如,数据中心基础设施110、硬件115等)通信。翻译器107可作为专用硬件、软件,或软件元件和硬件元件的组合实施。在各种实施例中,翻译器107通过各种媒体类型(诸如以太网和rs-232/485)使得150+供应商协议语言(诸如bacnet,modbus和以太网/ip)能够与dcics105通信。翻译器107被专门配置、定制设计且构建为“说”供应商协议语言的硬件,然后将它们“翻译”成由dcics105“理解”的一种语言(例如,opc)。

翻译器107的翻译能力使得适于各种各样的数据中心基础设施设备(包括建筑管理、功率分配,和it系统)的企业级的收集、存储以及显示功能成为可能。通信管理集中并简化成可由dcics105访问的单一平台。在各种实施例中,翻译器107可容易地通过即插即用设备驱动器、客户机接口,以及硬件单元进行扩展。在翻译器的各种硬件实施例中,在翻译器外壳内存在充足的空间以便添加或删除安装组件,以便允许翻译器107针对几乎任何应用程序进行定制。

it硬件115例如可包括位于一个或多个数据中心内的个人计算机、服务器、存储设备、联网设备,以及其它计算设备。例如,在各种实施例中,dcics105可例如从服务器内的一个或更多个处理器内核收集或获取温度数据和/或利用率数据,从一个或多个网络交换机或路由器收集或获取带宽利用率数据,从一个或多个存储设备收集或获取存储容量信息等。dcics105可将控制指令和/或信号发送到it硬件115;例如,dcics105可导致数据中心内的服务器给循环供以动力,增加/降低内部风扇转速等。

虚拟层120例如可包括用于管理it硬件的使用和供应的虚拟化软件(例如,在it硬件115上运行的软件的实例)。dcics105可收集有关驻留在一个或多个服务器上的虚拟机的状态、硬件分配和硬件利用率的数据。dcics105可例如经由api将指令发送到虚拟层120。例如,dcics105可导致虚拟化软件的实例将虚拟机移动到在不同地理位置处的另一个物理服务器。

操作系统125例如可包括在it硬件115上(原生地或在虚拟机和/或分区上)运行的microsoftwindows、linux、macosx,unix等的实例。例如,dcics105可收集有关操作系统状态的数据,诸如系统负载和哪些应用程序在存储器中运行和/或载入。dcics105可控制数据中心硬件和软件;例如,通过将指令发送到操作系统125。在各种实施例中,dcics105可导致操作系统实例执行和/或终止应用程序。

应用程序130可包括在it硬件115上运行的应用程序(例如web服务器、企业管理、数据库、工资单、供应链等软件)的实例。例如,dcics105可收集有关应用程序的活动水平、执行时间表,和预期的持续时间的数据。dcics105可将指令发送到应用程序130。例如,dcics105可启动应用程序130,导致应用程序执行作业、另一个应用程序、过程、数据通信等。

用户135可包括与位于由dcics105管理的一个或更多的数据中心内的it硬件115进行通信的应用程序和/或设备。例如,dcics105可从用户135收集有关跨it硬件115分配的工作负载的数据。dcics105可将指令发送到用户135。

有利地,通过从数据中心基础设施110、it硬件115、虚拟层120、操作系统125、应用程序130,和用户135收集数据并将指令发送到数据中心基础设施110、it硬件115、虚拟层120、操作系统125、应用程序130,和用户135,dcics105可更有效地且完全地监视、分析、管理、预测、决定、优化和控制数据中心的操作。例如,应用程序130的效率可通过利用来自数据中心基础设施110的数据中心操作数据而提高。

图2示出数据中心200。数据中心200可由多个数据中心组成。如图所示,数据中心200可包括数据中心210、数据中心215和数据中心220。数据中心210和数据中心215可以是模块化数据中心。数据中心210和数据中心215可包括多个数据中心模块225。数据中心模块225可包含it设备(未示出)。数据中心模块225例如可以是在2013年1月28日提交的且题为“模块化数据中心”的美国专利申请13/751,568号中所述的模块。数据中心220可以是常规的活动底板数据中心,如本领域内所公知的那样。数据中心220可包含成行230的it设备。

数据中心200可包括在同一建筑物里的资源。例如,数据中心210、数据中心215和数据中心220可被容纳在同一建筑物内。数据中心200可包括在地理上不同位置内的资源。例如,数据中心210可以在美国,数据中心215可以在巴西以及数据中心220可以在新加坡。

有利地,本文中所述的技术可有助于管理和控制异构数据中心和其它it、数据通信、功率分配和气候控制资源。例如,在各种实施例中,dcics105管理、协调和控制数据中心,包括常规(例如,“活动底板”)数据中心和模块化数据中心的混合,这些数据中心在地理上可以是不同的并且包括数据中心基础设施和it资产的异构和/或非标准配置。

现在参照图3,数据中心模块300描绘数据中心模块实施例的剖视图。一个或多个模块225可如相对于数据中心模块300所述的那样构造和/或操作。数据中心模块300包含底板301,其将数据中心模块300的内部划分成底板上空间和底板下空间。数据中心模块300可包含it设备305。在示出的实施例中,数据中心模块300包含空气处理器单元(ahu,airhandlerunit)310,其通过冷却流体供应管315和流体返回管320供应冷却流体。在各种实施例中,冷却流体供应管315经由调节阀连接到ahu310。在各种实施例中,调节阀打开的量可通过来自dcics105的控制指令来控制。数据中心模块300包含柔性屏障325。

it设备305可与加压气室330流体连通。加压气室330可具有一个或多个压力源,诸如ahu310。ahu310可包括可变速、可变频率驱动风扇。ahu310可与加压气室330连通并且配置成增加加压气室330内的压力。例如,响应于从dcics105接收到指令,ahu310可激活其风扇。it设备305可将底板上空间分为冷通道332和热通道335。在示出的实施例中,冷通道332和热通道335可给技术人员提供访问it设备305的通路。柔性屏障325可促进将冷通道332和热通道335分离(单独地和/或与it设备305相结合)。应当认识的是,使用术语“通道”表明存在一些实施例,并且描述成冷通道332和热通道335的空间或区域可具有任何形状、构造或尺寸。

ahu310可增加加压气室330内的压力,以产生冷通道332和热通道335之间的压力差,使空气340流动跨过和/或通过it设备305。空气340跨过和/或通过it设备305的流动可从it设备305去除热量,产生加热空气345。ahu310例如通过使用热交换器可从加热空气345去除热量。在各种实施例中,ahu310利用蒸气-压缩循环热交换器。ahu310可将热量从冷却流体供应管315传递到冷却流体,并通过流体返回管320排出加热流体。

数据中心模块300可包括温度和/或湿度传感器350和352,其例如可以分别测量冷通道332和热通道335中空气的温度和/或湿度。数据中心模块300可包括ahu输出温度和/或湿度传感器355,其可以测量离开ahu310的空气的温度和/或湿度。数据中心模块300可包括用于测量冷通道332和热通道335之间的压力差的压力传感器360。数据中心模块300可包含功率分配单元(pdu,powerdistributionunit)(在图3中未示出)。pdu可将功率分配到ahu310、it设备305,和数据中心模块300内的其它电器设备。pdu例如可单独地测量ahu310或it设备305的功率消耗并将该数据提供给dcics105。

图4描绘数据中心模块控制器400。数据中心模块控制器400可被容纳在数据中心模块300中。在各种实施例中,控制器400包括专门的硬件和软件。数据中心模块控制器400可收集有关数据中心模块300操作的数据,并将指令发送到数据中心模块300的硬件。例如,数据中心模块控制器400可获取(例如,检索或接收)温度传感器数据(例如,来自温度和/或湿度传感器350和352以及ahu输出温度和/或湿度传感器355)。数据中心模块控制器400可收集湿度传感器数据(例如,来自温度和/或湿度传感器350和352以及ahu输出温度和/或湿度传感器355)。数据中心模块控制器400可收集ahu数据420(例如有关ahu操作的数据,诸如操作状态、风扇转速、故障状态、功耗等)。数据中心模块控制器400可收集功率数据425(例如,由数据中心模块300整体或由数据中心模块300内的各个组件诸如ahu310或it设备305消耗的功率)。数据中心模块控制器400可从ccv430收集冷却流体阀数据(例如,位置数据、错误状态等)。数据中心模块控制器400可收集it设备数据435(例如,与数据中心模块300内的it设备操作相关的数据,诸如cpu利用率、cpu温度、平面温度等)。数据中心模块控制器400可收集应用程序数据440(例如,有关在数据中心模块300内的it设备305上运行的应用程序的操作的数据)。在各种实施例中,数据中心模块控制器400可存储所收集的数据。在各种实施例中,数据中心模块控制器400可将所收集的数据提供给数据中心管理和控制系统,如相对于图5描述的那样。在各种实施例中,控制器400配置有软件模块(例如,目标代码或机器可读指令),该软件模块使得能够从dcics105接收控制指令并执行指令来控制一个或一个以上的it设备305。

在各种实施例中,数据中心模块控制器400将安全性、运动、离散和驱动能力集成到单一控制器内。数据中心控制器模块400可包括紧凑型i/o模块。在各种实施例中,数据中心模块控制器400包括:内置式rs-232串行端口;用于ethernet(以太网)/ip或controlnet(控制网)网络的内置式通信端口;用于i/o控制和远程设备配置的通信接口模块;提供紧凑的din-导轨或面板安装的i/o系统的紧凑型i/o模块。软件模块或编译的机器语言指令可以被开发、编译和安装到数据中心模块400上。在各种实施例中,数据中心模块400启用继电器梯形图、结构化文本、功能框图和顺序功能图编辑器以便开发可被下载到数据中心控制器400的存储器的应用程序。例如,程序可将控制指令发送到模块硬件和软件组件,测量外部空气、湿度、风门位置、风扇空气流量,以及为有线连接到i/o模块的各种设备和设备传感器测量更多。在各种实施例中,数据中心模块控制器400与dcics105实时地交换信息。

图5描绘了dcics105的逻辑视图。crm数据库505可以是客户关系管理数据库。销售提案、报价和/或客户信息可以存储在crm505上。会计数据库507可以是适于财务报告的系统。中央数据库510可以是与由dcics105管理的数据中心操作有关的任何数据的存储库。事件票证数据库512可以是有助于客户票务和事件报告的软件。

商业智能和数据仓库数据库515可以包括与由dcics105管理、跟踪、控制或存储的与数据中心操作有关的任何数据。在各种实施例中,商业智能和数据仓库数据库515可以实施在识别、提取中使用的基于计算机的技术,并允许分析业务数据,诸如产品和/或部门的销售收入,和/或相关费用和收入。商业智能和数据仓库数据库515可以提供商业操作的历史、当前和预测的情况。例如,商业智能和数据仓库数据库515可以执行报告、联机分析处理、分析、数据挖掘、过程挖掘、复杂事件处理、业务绩效管理、基准测试、文本挖掘、预报和预测性分析。

中央数据管理器517可以访问来自中央数据库510的数据,并且将其呈现给用户(例如,经由客户机设备的用户界面、应用程序编程接口(“api”)等呈现给用户135)。数据质量监视器520可以检查数据,以验证交易是否正在发生,并验证该交易是否产生预期的结果。例如,数据质量监视器520可对中央数据库510中的数据库表进行周期性地采样,以确保中央数据库510正在工作。在各种实施例中,数据质量监视器检查违反业务规则的数据中央数据库510,并且数据质量监视器520创建并发送有关数据验证问题的电子邮件报告。

网络监视器522可与it设备545通信,以例如确定it设备545的状态。在各种实施例中,网络监视器522是可扩展的工具,其将测量值从联网设备带入到dcics105内,在dcics105内可存储和查看所述测量值。在各种实施例中,网络监视器522例如可以监视:支持snmp(简单网络监视协议)的设备;虚拟机;存储阵列;利用微软的windowspowershell的其它类型的设备。

通知处理器525可基于事件、数据、预报等生成通知。在各种实施例中,通知可以是系统通知、电子邮件、文本消息、自动电话呼叫、推特消息、操作系统级的消息(例如ios通知)等。

门户网站web服务527可以管理基于web(万维网)的客户互动。在各种实施例中,来自门户网站万维网服务527的数据可被传送到客户和/或数据中心管理人员(例如,以便解决客户问题)。接口服务530可提供基于web的用户界面。

开放过程控制(opc,openprocesscontrol)服务器537是用作api或协议转换器的软件应用程序。在各种实施例中,opc服务器537可连接到设备,该设备诸如程序员逻辑控制器、分布式控制系统、远程终端单元,和/或诸如数据库或用户接口的数据源,并将数据翻译成基于标准的opc格式。

opc客户机532可提供记录器,以处理来自opc服务器537的实时数据。在各种实施例中,opc客户机532可允许并行写入以及写入的优先驱动队列。opc服务器537可从控制器535(例如,位于或可操作地连接到数据中心模块诸如数据中心控制器模块400的控制器)接收数据中心操作数据。尽管所示的实施例使用opc,但是数据可以任意格式进行交换。连接服务器542可便于访问控制器535。opc转换器540在必要时可将来自连接服务器542的数据转换成opc格式。

dcics105可以管理和控制不同类型的数据中心。dcics105可以管理独立的数据中心550。独立的数据中心550可以包括一个或多个数据中心模块。独立的数据中心550可以使用模块数据库552来存储独立数据中心550的所收集的数据中心操作数据。在各种实施例中,在独立的数据中心550和中央数据库510之间的网络中断的情况下,模块数据库552可用于监视和/或控制独立的数据中心550。复制服务器555可以维护模块数据库552和中央数据库510之间的同步。

集中式数据中心560可以类似于独立数据中心550的方式操作。在各种实施例中,诸如在图5中所示,集中式数据中心560将数据存储到中央数据库(例如,中央数据库510)。在各种实施例中,在集中式数据中心560和中央数据库510之间的网络中断的情况下,与集中式数据中心560的操作有关的数据不能以集中的方式提供,但与集中式数据中心560的操作有关的数据可被缓冲并且当连接恢复时提供给中央数据库510。

常规的数据中心570例如可以是活动底板数据中心。在各种实施例中,常规的数据中心570可包括传感器(例如,温度、湿度、压力、运动检测、访问控制、声学、生物特征等)。传感器数据可通过opc服务器537收集。在各种实施例中,opc服务器537可与位于常规数据中心570内的it设备进行通信。在各种实施例中,opc服务器可与翻译器107和/或数据中心模块控制器400交换数据(例如图5中的ctl535)。

在各种实施例中,dcics105可跟踪数据中心的组件(例如,逻辑和物理硬件、软件、系统)。在各种实施例中,dcics105可将数据中心的组件分组到分区内。术语“分区”包括一个或多个数据中心资产(硬件或软件)的任何逻辑或物理分组。例如,分区可被定义为包括一台服务器、多个数据中心模块和包含在其中的一切内容,和/或分区可被定义为包括整个数据中心或数据中心的分组。在各种实施例中,分区可与单个的数据中心资产、单个的传感器等相关联。

任务引擎533监视数据收集点的变化。在各种实施例中,为了监视数据的变化,任务引擎533可轮询数据收集点,轮询数据库(例如中央数据库510),从数据库接收数据(例如,经由数据库触发器),接收由用户所做的更改等。在各种实施例中,任务引擎533检测由用户对与一个或多个数据收集点相关联的阈值或者“设定值”信息的更改。在一个实施例中,任务引擎533包括扩展器,其使得模块化的插件能够添加到任务管理器(例如计算机操作系统的任务管理器),以便dcics105可以执行任务,诸如命令应用程序、系统或计算环境(例如,vmware环境)来正常地关闭或启动虚拟机。在各种实施例中,任务引擎533将数据收集点关联到操作系统的外壳命令实用程序(例如windowspowershell命令),响应于用户对dcics105内的设定值(例如阈值)的数据采集点所做的更改来执行命令。

评估引擎

下面参照图3的数据中心模块300描述用于管理数据中心模块内的环境条件(例如,给it设备提供冷却)的示例性技术。如上所述,一个或多个ahu可用于管理数据中心模块内的环境条件(例如,给it设备提供冷却)。在各种实施例中,可提供冷通道温度设定值(例如,在冷通道332中的所需空气温度)。例如,用户135可使用仪表盘535来用设定值信息更新中央数据库510。在各种实施例中,dcics105可导出或计算冷通道温度设定值,例如可根据it设备305的冷却需求、it设备305操作员的舒适性等进行导出或计算。ahu310可提供冷却空气360来保持冷通道332中的空气340处于大约冷通道温度设定值。在各种实施例中,通过控制从加热空气345所提取能量的量(例如,冷却),ahu310可提供冷却空气360来保持冷通道332中的空气340处于大约冷通道温度设定值。

在各种实施例中,可通过dcics(例如dcics105)监视并控制ahu310操作的各方面。例如,dcics105生成并发送指令以便调节ahu310的风扇速度和阀,所述阀(冷却流体控制阀或ccv)控制冷却流体进入到ahu310内的流率,并且数据中心模块控制器400可将指令发送到相应的硬件设备。调节风扇转速或ccv会影响冷通道332中的空气340的温度。例如,调节ccv以便增加冷却流体进入到ahu310内的流率可降低离开ahu310的空气(例如,冷却空气360)的温度,从而降低冷通道332中的空气340的温度。作为另一个实例,调节ahu310的风扇速度可以增加离开ahu310的空气(例如,冷却空气360)的量,从而降低冷通道332中的空气340的温度。在各种实施例中,调节风扇转速和/或ccv可用于保持冷通道332中的空气340处于大约冷通道温度设定值。

图6描绘了用于数据中心模块300的控制系统600。如图6中所示,在各种实施例中,控制系统600是级联控制环路。比例-积分-微分控制器(pid)605可控制ccv610(例如,适于ahu310的ccv)。例如,pid605可以接收离开ahu310的空气(例如,冷却空气360)的温度设定值。pid605可以接收离开ahu310的空气(例如,冷却空气360)的当前温度,例如,从ahu输出温度和/或湿度传感器355接收上述温度。pid605可以调节ccv610以便将离开ahu310的空气(例如,冷却空气360)的温度近似地保持在离开ahu310的空气温度设定值。pid615可以控制风扇马达620(例如,ahu310中的风扇马达)。

pid625可控制pid605(例如,通过提供离开ahu310的空气(例如,冷却空气360)的设定值进行控制)。pid630可以控制pid615(例如,通过提供离开ahu310的空气(例如,冷却空气360)的温度设定值进行控制)。

控制系统600可接收设定值632(例如,冷通道温度设定值)。控制系统600可接收当前值633(例如,通过温度和/或湿度传感器350接收在冷通道332中的空气340的当前温度)。根据当前值和设定值之间的差值,pid625可以增加或减少提供到pid605的设定值。例如,如果当前值超过设定值(例如,在冷通道332中的空气340的当前温度超过冷通道温度设定值),则pid625可以降低提供到pid605的离开ahu310的空气的温度设定值。基于当前值与设定值632之间的差值,pid630可以增加或降低提供到pid615的设定值。

在各种实施例中,通过增加冷却流体流入到ahu310内的流率来降低冷却空气360的温度可更有效地和/或优选地增加ahu310的风扇速度。偏移部635可用于增加由pid630接收的设定值,从而导致pid630降低在更高的当前温度值下提供给pid615的设定值,更高的当前温度值比pid625在其下可降低提供到pid605的设定值的当前温度值更高。

禁止部640可禁止降低提供给pid605的温度设定值(例如,离开ahu310的空气(例如,冷却空气360)的温度设定值)。在各种实施例中,禁止部640可防止提供给pid605的温度设定值低于露点温度、低于露点温度范围,或者低于露点温度之上的预定阈值。在各种实施例中,禁止部640可防止提供到pid605的温度设定值在ccv完全打开时进一步降低。在各种实施例中,当禁止部640防止提供给pid605的温度设定值降低时,禁止部640防止pid630增加提供给pid615的温度设定值。

在各种实施例中,当前值633可以是冷通道温度。在各种实施例中,当前值633可以是热通道温度(例如,在热通道335中的空气345的温度,如通过温度和/或湿度传感器352测得的那样)。在各种实施例中,当前值633可以是it设备的平面温度或处理器温度。在各种实施例中,开关650可以控制当前值633是否是来自外部源(例如,测量it设备的平面温度或处理器温度的传感器)还是来自内部源(例如,测量冷通道温度的传感器)。

尽管所述的实施例控制ahu310,但是应当理解的是,控制系统600可控制一个或多个数据中心资产(例如,it基础设施硬件)的操作。在各种实施例中,模块(例如,图1的模块225)可以包含多个ahu(例如,4个、6个或8个ahu)。控制模块600可如上所述控制每个ahu的ccv和风扇马达。在各种实施例中,模块可被分为区域(例如,划分成两个区域),每个区域可如上所述操作(例如,在每个区域中的ahu的操作基于适于每个区域的设定值独立于其它区域中的ahu进行控制)。

在各种实施例中,ahu可以“正在服务”或“停止服务”。“正在服务”的ahu具有的风扇速度可设置成大于0%(例如,风扇旋转)以及ccv可设置成大于0%(例如,阀允许冷却流体进入ahu)。“停止服务”的ahu具有的其风扇速度可设置定成0%(例如,风扇不旋转),以及ccv可设置成0%(例如,阀关闭)。在各种实施例中,一个或多个ahu可以“正在服务”,且如上所述操作。在各种实施例中,当禁止部640防止提供给pid605的温度设定值降低,一个或多个“停止服务”的ahu可变成“正在服务”,从而提高可用的冷却容量。

在各种实施例中,控制系统600可被容纳在数据中心模块(例如,在数据中心模块300的加压气室330)内。在各种实施例中,数据中心模块控制器(例如,数据中心模块控制器400)可实施控制系统600。在各种实施例中,控制系统600可以是dcics105的一部分。

图7是描绘操作数据中心模块的方法的流程图700。在步骤705,测量空气压差。例如,参照数据中心模块300,压力传感器360可以测量冷通道332和热通道335之间的压差。在步骤710,确定压差是否在预定范围内。例如,特定的压差可有助于空气从冷通道332流动,通过it设备305。如果压差不在预定范围内,则在步骤715可以调节一个或多个ahu的风扇速度。例如,如果在冷通道332和热通道335之间测得的压差低于预定范围,则ahu310内的风扇速度可以增加,从而增加在冷通道332中的压力。如果在冷通道332和热通道335之间测得的压力差高于预定范围,则ahu310内的风扇速度可以减少,因而降低冷通道332中的压力。

如果压差在预定范围内,则该方法前进到步骤720,在步骤720测量温度。例如,在冷通道332中的空气340的温度可通过温度和/或湿度传感器350来确定。在步骤725,确定温度是否在预定的范围内。例如,可确定在冷通道332中的所需空气温度范围(例如,冷通道温度设定值)。如果测得的温度不在预定范围内,则在步骤730可以调节ccv。例如,如上所述,调节ccv以便增加流入到ahu310内的冷却流体的流率可以降低离开ahu310的空气(例如,冷却空气360)的温度,从而降低在冷通道332中的空气340的温度。如果测得的温度在预定范围内,则该方法返回到步骤705。

本文所述的技术可包括用于监视、分析和控制数据中心的技术。如上所述,dcics105可访问例如与图1中所示的数据中心基础设施110、it硬件115、虚拟层120、操作系统125、应用程序130,和用户135相关联的数据中心操作数据。可对数据中心操作数据进行分析,从而允许实时或几乎实时地监视数据中心的操作。

在各种实施例中,dcics105访问与数据中心基础设施的各种操作系统或子系统相关联的数据。这样的系统包括环境、信息技术、电力传送、能量回收等。数据通过“数据收集点”进行访问,在各种实施例中,“数据收集点”可包括数据源、传感器、探测器、状态指示器、操作控制指示器、机械设置、it硬件特性和状态信息、软件系统属性和设置参数等。例如,这样的数据访问点可包括:控制器、湿度传感器、火灾探测器、烟雾探测器、高灵敏度烟雾探测器、极早期烟雾探测装置、湿气探测器、现场泄漏探测器、压力传感器、入侵探测器、阀指示器(例如,控制返回阀位置指示器、供应阀位置指示器等)、功率输入监视器、功率输出监视器、风扇速度指示器和风扇方向指示器。

在各种实施例中,这样的环境系统包括:火灾探测(例如,报警,高灵敏度烟雾探测器(“hssd”,highsensitivitysmokedetector);灭火:(报警,面板复位);温度(例如,内部、外部/冷通道、热通道等);压力(例如,模块压差);湿度(相对湿度、露点、控制湿度);以及铅检测(现场泄漏探测器)。

在各种实施例中,这样的it系统包括:服务器(例如,服务器cpu、ram、磁盘、风扇速度、温度);网络(例如,吞吐量、路由信息、防火墙、警报、基于snmp);虚拟化(例如,管理和监视两个虚拟工作负载);it硬件特性和状态信息;以及软件系统属性和设置参数。

在各种实施例中,这样的电力传递系统包括:发电机(例如,发电机负载和状态、油位、油压、遥控停止和启动等);ups(例如,输入和输出、ups的总负载、功率因数);pdu(例如,支路监视、输入/输出负载等);以及开关设备(例如,输入/输出总线、要求电流、功率因数等)。

在各种实施例中,这样的能量回收系统包括:冷却器(例如,供应和返回温度,系统压力,控制出口温度,设定值,等);空气处理器(例如,进/出口温度,控制线圈的需求,送风模式,风扇速度,风扇开/关,过滤时间(小时)等);以及阀(例如,除热,压差,流量,阀位置,控制返回阀的位置,供应阀的位置等)。

该技术可包括用于指定如何识别、聚合和分析数据中心操作数据的技术。在各种实施例中,该技术包括脚本语言,其用于指定如何聚合和分析数据中心操作数据,以及按指定对数据进行的聚合和分析。在各种实施例中,用于指定如何聚合和分析数据中心操作数据的语言表达式可具有以下的语法:

[输入集]|>操作

在上面的表达式中,输入集(inputset)是从其收集数据中心操作数据以便聚合和分析的源(例如,在数据中心中的数据收集点的集合),以及操作(operation)是在输入集上执行的操作。输入集例如可通过数据收集点类型、设备类型、分区成员关系、容纳系统等指定,从其收集数据中心操作数据。输入集可包括其它表达式。由此产生示例性的输入集。在实例中,输入集成员使用统一资源名称指定,但在各种实施例中可使用识别输入集成员的其它方式。

[urn:nid:sensortype:temp]–将输入集指定为来自数据中心中的所有温度传感器的数据。

[urn:nid:partition:1918&urn:nid:sensortype:temp]-将输入集指定为来自分区1918中的所有温度传感器的数据。

[urn:nid:device:ba3e38b9-de9d-e011-ba7c-005056876935&(urn:nid:sensortype:136|urn:nid:sensortype:1086)]–将输入集指定为来自pdu中识别为urn:nid:device:ba3e38b9-de9d-e011-ba7c-005056876935的类型为135和1086的所有功率计的数据。

在上面的表达式中,操作是在来自输入集的数据上执行的操作。例如,该操作可以是数学公式、算法或随机方法。在各种实施例中,操作包括sum(求和)(例如,来自输入集中传感器的所有数据的求和),max(最大值)(例如,来自输入集中传感器的所有数据的最大值),min(最小值)(例如,来自输入集中传感器的所有数据的最小值),mean(平均值)(例如,来自输入集中传感器的所有数据的平均值),stdev(例如标准偏差)和count(计数)(例如,来自输入集中传感器的数据项的数量)。对来自输入集中的数据收集点的数据进行的操作的执行可以产生结果(例如,数值)。

在各种实施例中,形式为[输入集]|>操作([inputset]|>operation)的表达式的结果可在算术运算中使用,诸如加法、减法、除法,或乘法。在各种实施例中,来自单个数据收集点(例如,单个传感器)或多个数据收集点的数据可用在与形式为[输入集]|>操作的表达式的结果进行的算术运算中。

dcics105可以包括执行引擎,以便执行由表达式指定的聚合和分析。该技术可以接收指定如何聚合和分析数据中心操作数据的表达式(例如,以上述语法),并按指定对数据进行聚合和分析。在各种实施例中,dcics105可接收表达式(例如,为文本串,以任何非编译形式,等等)。表达式可以指定一个或多个数据中心550、560和/或570内的一组数据收集点和对来自那些传感器的数据执行的操作。在各种实施例中,dcics105可以生成基于该表达式的机器代码指令(例如,通过即时编译),其中所述机器代码指令包括按指定对数据进行聚合和分析的指令。

dcics105可以执行机器码指令,生成所述操作的结果。在各种实施例中,dcics105可以查询包含数据中心操作数据的数据库(例如,中央数据库510)以从在输入集中指定的数据收集点收集数据。在各种实施例中,dcics105可以直接从在输入集中指定的数据收集点(例如,直接从传感器,通过翻译器从传感器,通过opc客户机从传感器等)收集数据。

在各种实施例中,结果可由dcics105解释,在显示器上显示和/或存储到数据库(例如,中央数据库510)。在各种实施例中,dcics105基于所述结果确定控制指令,并执行该控制指令导致数据中心和/或数据中心资产(例如,数据中心系统、it硬件、软件等)的操作状态的变化。

在各种实施例中,当发生下层数据变化时dcics105可以更新操作的结果。例如,如果表达式指定对来自数据中心模块中所有温度传感器的所有温度数据取平均,则无论何时当来自一个或多个温度传感器的数据变化时dcics105都可更新操作结果。在各种实施例中,dcics105确定来自至少一个数据收集点的点数据已经发生变化并且基于所述点数据执行机器代码指令来产生第二操作结果。dcics105可基于所述第二结果进一步确定第二控制指令。

本公开的实施例包括监视、分析和控制数据中心以及相关硬件和软件的系统和方法。在一个实施例中,dcics基于第一表达式确定与数据中心资产相关联的第一操作和数据收集点。数据收集点可包括传感器、指示器、探测器、系统数据等。在各种实施例中,所述表达式可从数据库获得,经由api接收,经由用户输入接收,从另一个系统或硬件装置接收或获得等。在各种实施例中,所述表达式可通过dcics基于例如其它表达式、数据或事件来衍生或产生。

dcics对表达式进行解释和/或分析并生成机器代码指令,其例如可以包括用于从数据收集点获取第一点数据的指令以及基于第一点数据执行操作的指令。在各种实施例中,所述指令可包括用于获得、接收或检索第一点数据的指令。在某些情况下,操作可以是递归的和/或依赖于所述第一点数据。例如,该操作本身可以迭代以及一个或多个的相互作用本身可以依赖于嵌套的计算、更新的数据、模拟数据、前一迭代等。

dcics105执行机器码指令以产生第一操作的第一结果。在各种实施例中,响应于产生第一结果,dcics105检查或分析第一结果,并确定第一控制指令。执行所述第一控制指令导致在至少一个数据中心资产和数据中心的操作状态的变化。

在各种实施例中,确定第一控制指令可以包括产生第一控制指令,分析历史数据,分析外部数据,进行预报、仿真或其它预测性分析,执行优化,接收用户输入等。例如,dcics105可处理与对一组特定的数据中心资产诸如服务器、存储设备和/或联网设备的处理能力(例如,负载、利用率等)相关联的表达式(或多个表达式)。dcics105分析与表达式相关的操作的结果,并可确定那些数据中心资产处于发生故障或性能低于所需性能阈值的风险。dcics105例如可以检查历史数据、数据中心资产配置文件信息、性能数据、容量数据、服务水平协议数据和性能需求预报中的一个或多个。

基于这种分析,dcics105可确定通过将软件应用程序移动到一组不同的数据中心资产而实现的数据中心的新操作状态将有助于减轻操作风险。dcics105可以识别新的或优选的配置,确定用于实现变化的工作流,并生成用于执行这种变化的指令。

在各种实施例中,dcics可以进行下述中的至少一个:执行、部分地执行控制指令,和将控制指令传送到硬件装置(例如,控制器400)和/或软件程序以用于执行。

在各种实施例中,控制指令可包括机器代码指令、api调用、电信号、触发器、目标代码、脚本等。执行控制指令导致数据中心、数据中心资产和/或数据中心系统的操作状态的变化。控制指令可包括下述指令,例如其导致将数据从第一数据存储装置移动到第二数据存储装置,将软件应用程序从第一计算设备移动到第二计算设备,终止软件应用程序,启动软件应用程序,启动病毒防护策略,实施入侵防御策略,创建用户许可,吊销用户许可,关停计算设备,调节操作温度,启动灭火系统,开启空气处理器,关停空气处理器,调节风扇速度,调节阀,锁门,解锁门,锁定通路面板,以及解锁通路面板。

在各种实施例中,将软件应用程序从第一计算设备移动到第二计算设备可包括使得第一计算设备处于独立于第一计算设备的独立物理位置下,所述第一计算设备和/或所述第二计算设备是虚拟机,和/或创建虚拟计算装置。

dcics105可验证操作状态的变化。例如,dcics105从数据收集点获取数据,分析该数据,并确定所需的操作状态是否已经实现。在各种实施例中,dcics105可以产生用于验证所述操作状态已经变化的表达式。产生表达式可包括衍生表达式、计算表达式或接收表达式中的一个或多个。

在各种实施例中,验证操作状态的变化可包括确定控制操作结果和/或分析第二点数据,其中控制操作结果基于执行所述第一控制指令以及从数据收集点获得第二点数据之处。控制操作结果例如可从控制器、数据库和/或数据收集点确定和/或获得。在各种实施例中,dcics105可分析控制操作结果、第二点数据和/或操作状态的变化,并确定第二操作或第二表达式。

在各种实施例中,dcics105例如可以使用业务规则、专有算法、外部输入、接口系统、人工智能、模拟和其它确定性的或随机的预测性分析中的一个或多个来确定数据中心或数据中心资产的操作状态,评估或预测数据中心资产属性(例如,风险状态、功率容量、物理空间、冷却能力、网络能力、冗余能力、地理接近度等)。

dcics105可以开发替代性的策略,用于转换到最优的(或优选的)操作状态和/或最小化数据中心资产的风险,所述数据中心资产诸如一个数据中心、多个数据中心、分区、应用程序、功能能力(例如,应用程序和性能能力的组合)、企业的it基础设施等。这样的数据中心资产在物理上可位于多个数据中心内和/或在地理上的不同位置内。在开发这样的替代性的策略过程中,dcics105可访问配置文件、产品、配置、销售、使用率、性能、约束和来自数据库的数据中心资产属性数据,所述数据库诸如中央数据库510、bi仓库515、crm数据库505、会计数据库507等。在各种实施例中,dcics105包括一组完整的输入数据、设计和维护图形用户界面,使得数据中心资产信息能够被设计、输入、维护和可视化。

例如基于所收集的数据、确定的操作状态和开发的替代性策略,dcics105可将操纵操作条件和配置并转换数据中心资产(例如,硬件和软件)的控制机制引入到新的操作状态。例如,dcics105可将指令发送到数据中心模块控制器400、发送到翻译器107、发送到opc客户机537和/或直接发送到数据中心的硬件或软件组件。

通常而言,dcics105可从一个或多个数据源收集数据,其中所述一个或多个数据源的每一个数据源涉及数据中心的操作。例如,如上所述,所述dcics105可从数据中心基础设施110、it硬件115、虚拟层120、操作系统125、应用程序130,和用户135收集、访问和/或获取数据。基于所收集到的数据,该技术可以识别数据中心的当前操作状态。通常而言,操作状态指的是数据中心资产或组件、数据中心资产的分区或分组、整个数据中心,和/或多个数据中心的过去、现在或未来的状态。

在各种实施例中,dcics105例如基于当前的操作状态、所收集到的数据的一部分,以及一个或多个预先限定的标准来确定适于数据中心的一个或多个替代性的操作状态。dcics105可以识别一个或多个替代性的操作状态的所需操作状态。该技术可利用一个或多个数据中心控制来将该数据中心转换到所需的操作状态。

dcics105采用智能控制来优化数据中心操作。在各种实施例中,dcics105访问库存数据、操作数据、历史数据和外部数据(统称为“输入数据”),确定数据中心优化维度,产生预测性数据,基于数据中心优化维度、所述预测性数据和输入数据来确定优化动作,基于所述优化动作生成优化指令。优化指令的执行导致与数据中心操作相关联的操作状态的变化。在各种实施例中,dcics105配置成收集数据,以验证和/或确认操作状态的变化。

数据中心优化维度例如可包括可靠性、冗余性、弹性、风险、延时、效率、成本和威胁规避。在各种实施例中,2n、n+1、n等的冗余等级可被分配给特定的功率和冷却能力。

在各种实施例中,访问输入数据包括识别和分析输入数据。例如,识别输入数据可包括:接收输入,从数据源获取,计算和预报。数据源例如可包括历史数据库(例如,中央数据库510、bi仓库515)、客户关系管理数据库(例如,crm505)、数据仓库(例如,bi仓库515)、产品目录、会计系统、互联网、政府数据源、供应商数据库、公用设施系统、电力系统、安全系统、网络供应商系统,和与数据中心操作相关联的数据收集点。

分析输入数据可包括基于优化维度分析多个数据中心资产。例如,dcics105可确定应该移动由数据中心启用的一套应用程序以减少延时、平衡负载并释放一些物理空间。dcics105可基于优化维度(例如,可靠性、弹性、风险、延时、效率、成本和威胁规避)并基于数据中心资产属性(例如,风险状态、功率容量、物理空间、冷却能力、网络能力、冗余能力和地理接近度)分析多个数据中心资产。

在各种实施例中,对输入数据的分析包括对输入数据的检索、挖掘、解析、验证、获取和/或分析以便识别客户数据、配置数据、产品数据、销售数据、服务水平协议(sla,servicelevelagreement)数据、处理要求、存储要求、网络带宽要求、成本数据、收入数据,以及产品收入数据中的至少一个。

在各种实施例中,dcics105可以识别多个优化动作。确定优化动作可包括dcics105:执行专有算法;执行模拟;执行人工智能;执行随机方法;接收用户输入;以及执行线性规划模型。基于优化维度,dcics105可确定适于每个所识别的优化动作的优化得分。例如:冗余优化维度分析可确保所考虑的替代性数据中心资产具有足够的冷却和/或功率冗余评级以支持所需的处理、存储和网络容量;延时优化维度分析可确保所考虑的替代性数据中心资产具有足够高的网络带宽能力和低的延时估计以便支持业务目标和/或服务水平协议。

在各种实施例中,dcics105监视并控制数据中心的物理安全性。例如,dcics105可监视分区的物理安全性,分析所收集的数据,进行预报、模拟和风险分析,制定改善操作状态的方案,选择优选的情景,开发出一套动作(如工作流)以实施新的操作状态,并执行或传送控制指令以便实施动作并调节操作状态(例如,以提高物理安全性)。

个体和/或个体的分组可将物理访问权限分配到数据中心和数据中心资产。示例性的权限包括通过数据中心的外门进入、通过数据中心的内门进入、通过数据中心模块的门进入、访问it硬件机柜、访问特定基础设施设备等。

dcics105可获得与分区的物理安全性和当前操作状态相关联的数据中心操作数据。例如,dcics105可以收集关于物理屏障(诸如哪个门被打开/关闭或锁定/解锁),it硬件机柜(诸如哪个机柜或面板被打开/关闭或锁定/解锁),以及分区内个体的存在(例如,通过使用面部识别、生物识别、读卡器等)的数据。dcics105还可以确定所识别的个体的访问权限数据。dcics105可确定尝试访问分区的人已被分配对该分区的访问权限且应当允许物理访问。dcics105可通过解锁门和/或机柜来改变分区的操作状态。在各种实施例中,dcics105可确定尝试访问分区的人还没有分配对该分区的访问权限且不应当允许物理访问。

基于数据中心操作数据,dcics105可导致一种或多种变化,诸如:授予/限制到周边门、进入门、大门、维修通道、维修廊道、房间、笼的访问;锁定门、服务舱、容纳it硬件的机架;锁定各种服务设备,包括功率分配单元、控制器、空气处理单元;给管理员触发警报;和记录访问的设备和分区内的活动。

在各种实施例中,该技术可用于监视自然灾害(水灾、地震、火灾等),并且基于所收集到的数据调节数据中心的操作。在各种实施例中,dcics105可监视可影响数据中心操作的自然灾害。例如,使用连接到烟雾和/或火灾探测传感器的嗅探器,dcics105可以检测火灾并制定相应的响应动作,确定最优的动作,并利用控制功能来实施该动作。在各种实施例中,dcics105可从所监视的分区中的振动探测器来检测地震,从外部信息源(诸如美国地质服务局(usgs)地震数据)检测地震,和/或通过基于所检测到的数据、用户输入、外部信息、预报模块和历史数据来执行风险分析或预报。dcics105可使用分区中的泄漏传感器或从外部信息源(诸如外部天气数据)探测湿度或水灾。

在各种实施例中,如果预测或探测到自然灾害,则dcics105可确定灾害的种类或类别(例如,火灾、水灾、地震等),并确定替代性的数据中心资产(例如,计算、存储、网络等资产),其可用于将服务(存储器、cpu、存储、网络连接)提供到受自然灾害影响的分区中运行的应用程序。

在各种实施例中,dcics105可基于用户、设备、应用程序、it硬件、业务规则(例如,优先级分配)和/或数据中心规则中的一个或多个对替代性的数据中心资产进行分级,上述规则的任何一个可从数据库检索,从系统接收,作为分析的一部分衍生,基于预先确定的分配来确定,经由用户输入接收等。

dcics105可将替代性的数据中心资产提供给受自然灾害影响的分区的操作员以便于将受自然灾害影响的在分区中运行的应用程序动态地转移到一个或多个替代性的数据中心资产。在各种实施例中,dcics105可在不与操作员交互的情况下导致这样的转移(例如,系统化、自动地转移到所识别的一个或多个替代性数据中心资产)。

在各种实施例中,dcics105可基于和/或通过确定下列中的一个或多个来确定潜在的替代性的数据中心资产:风险级别(例如,确定替代性的数据中心资产是否不同样地处于不可接受的风险状态下(火灾、水灾等));替代性的数据中心资产是否有足够的功率来支持所需的处理/存储/网络等;替代性的数据中心资产是否具有足够的存储容量来支持所需的处理/存储/网络;替代性的数据中心资产是否具有足够的冷却来用于支持所需的处理/存储/网络;替代性的数据中心资产是否具有足够的网络来支持所需的处理/存储/网络;替代性的数据中心资产是否具有足够的功率和/或冷却冗余(例如,2n、n+1、n等)来支持所需的处理/存储/网络;和替代性的数据中心资产是否相对于受自然灾害影响的分区处在可接受的地理位置接近度内。在各种实施例中,任何上述可以是二元值(例如,是或否)。在各种实施例中,任何上述可以是范围值。

该技术可以监视逻辑安全性(例如,监视网络入侵)。在各种实施例中,dcics105从入侵检测系统(ids,intrusiondetectionsystem)接收与入侵相关的数据中心操作数据。ids例如可以使用在路由器日志上匹配的模式来检测逻辑性入侵(或逻辑性入侵企图)。dcics105可确定可用(例如,具有当前和/或未来的容量)的替代性数据中心资产(例如,计算、存储、网络等资产)以容纳在受入侵影响的分区中运行的应用程序。

在各种实施例中,dcics105可基于由受逻辑性入侵影响的分区的操作员所确定的优先级分配对替代性的数据中心资产进行分级。在各种实施例中,dcics105可基于用户、设备、应用程序、it硬件、业务规则和/或数据中心规则中的一个或多个对替代性的数据中心资产进行分级。在各种实施例中,dcics105可将替代性的数据中心资产提供给受逻辑性入侵影响的分区的操作员来将在受逻辑性入侵影响的分区中运行的应用程序动态地转移到一个或多个替代性的数据中心资产。在各种实施例中,dcics105可在不与操作员交互的情况下进行转移(例如,通过自动地转移到分级最高的替代性数据中心资产)。

在各种实施例中,dcics105可基于下列中的一个或多个确定潜在的替代性数据中心资产:资产利用率、利用率预报、物理安全性、逻辑安全性、当前延时;公用设施成本;功率容量或可用性、冷却能力、物理空间、网络提供商、网络带宽、网络冗余、功率冗余、入侵的范围或类型(界内、界外、基于应用程序、基于网络等)、用来终止入侵的已知技术、包括可具有较低风险概况的替代性数据中心资产的当前的入侵规避技术。

在各种实施例中,dcics105可减轻入侵风险,例如通过关停网络连接,给受入侵影响的逻辑性分区发出警报;给受逻辑性入侵影响的分区的用户发出警报等。

该技术可监视延时(例如,通过在数据中心中的it设备上运行的应用程序遇到的网络延时)。在各种实施例中,dcics105可从网络监视器接收有关延时的数据中心操作数据。dcics105可确定可用(例如,具有容量)的替代性数据中心资产(例如,计算、存储、网络等资产)以容纳在受长延时影响的分区中运行的应用程序。在各种实施例中,dcics105可基于受长延时影响的分区的操作员所确定的优先级分配对替代性的数据中心资产进行分级。在各种实施例中,dcics105可基于用户、设备、应用程序、it硬件、业务规则和/或数据中心规则中的一个或多个对替代性的数据中心资产进行分级。dcics105可将替代性的数据中心资产提供给受长延时影响的分区的操作员以便于将在受长延时影响的分区中运行的应用程序动态地转移到一个或多个替代性的数据中心资产。在各种实施例中,dcics105可在不与操作员交互的情况下进行转移(例如,自动地转移到分级最高的替代性数据中心资产)。

在各种实施例中,dcics105可基于下列中的一个或多个确定潜在的替代性数据中心资产:资产利用率、利用率预报、物理安全性、逻辑安全性、当前延时;公用设施成本;功率容量或可用性、功率利用率的有效性、冷却能力、物理空间、网络提供商、网络带宽、网络冗余和功率冗余。

在确定替代性的数据中心动作以便优化延时优化维度,dcics105可从it栈的任何层获取信息。it栈例如可以包括用户层、虚拟层、应用程序层、操作系统层、it或硬件层和数据中心基础设施层。

在各种实施例中,该技术可监视冗余性(例如,数据中心模块内的ahu的冗余性)。在各种实施例中,数据中心管理系统可基于数据中心模块内的当前功率利用率选择性地启用ahu来保持数据中心模块内的ahu冗余性水平(例如,n、n+1、2n、2n+1)。例如,如果每个ahu可给35千瓦的it设备负载提供冷却以及数据中心模块保持2n的ahu冗余性,则数据中心模块可以在50千瓦的it设备负载下启用两个ahu以及在80千瓦的it设备负载下启用三个ahu。

该技术可涉及声学监视。在各种实施例中,dcics105可从数据中心内的声学传感器接收声学数据。在各种实施例中,dcics105可将已知的“良好”的声学剖面(acousticprofile)与所接收到声学数据进行比较,并且如果它的声学剖面不同于已知的“良好”的声学剖面,则将数据中心设备识别为可能出现故障或者已出现故障。在各种实施例中,dcics105可将已知的“不良”的声学剖面与所接收到声学数据进行比较,并且如果它的声学剖面与已知的“不良”的声学剖面匹配,则将数据中心设备识别为可能出现故障或者已出现故障。

在各种实施例中,dcics105包括用于识别、提取和分析数据中心操作数据、业务数据和金融数据的制造资源计划(mrp)工具,以规划未来的数据中心操作。因此,dcics105给数据中心的规划者和操作员提供实时工具,所述工具使得他们能够以即时的方式提高容量和/或能力。

dcics105的mrp工具会在这样的规划工作中产生有用的数据。例如:dcics105可设置标志,指示何时在单独的数据中心资产(例如数据模块)水平上增加冷却容量。在各种实施例中,这样的冷却容量标志可例如基于空气处理单元的容量达到在数据中心内的总功率消耗的运行平均值的一定容量来设置。如先前公开的那样,表达式可用于限定数据收集和操作,以支持这样的分析。在各种实施例中,dcics105可跟踪数据中心内的各个点处的可用功率。这样的跟踪可包括粒度数据收集,诸如收集关于从变电站到数据中心功率分配基础设施内的各个电路分支所消耗功率的数据。这样的数据将允许dcics105生成建议,用于提高数据中心基础设施的容量;例如订购更多的数据模块、功率模块、ups,pdu等。

该技术可监视效率(例如,分区的功率使用效率)。在各种实施例中,dcics105可以接收与功耗有关的数据中心操作数据。dcics105可确定可用(例如,具有容量和适当的能力)的替代性的数据中心资产(例如,计算、存储、网络等资产)以接管在分区中运行的任何应用程序并且以较低的功率使用有效性(例如,如下文所计算的那样)执行。

在各种实施例中,可计算功率使用有效性(pue,powerusageeffectiveness)。pue可以是数据中心操作效率的度量。pue可限定为消耗的总功率(例如,由数据中心消耗的总功率)与指定用于生产用途的it设备的总功率(例如,对于用于操作和运行应用程序的服务器可用的总功率)的比率。该技术有助于确定作为整体的数据中心和/或数据中心内的分区的pue。例如,可确定一个或多个数据模块、一个或多个数据模块内的一个或多个机架的服务器,或数据模块内的单个服务器的pue。更一般而言,可确定适于数据中心内任何分区的pue。

如上所述,dcics105可收集数据中心操作数据,包括由其监视的数据中心的各个组件的发电和耗电相关的数据。图8描绘了模块化数据中心800。模块化数据中心800包括冷却器模块810、功率模块820,和数据模块830。数据模块830可包含it设备840。当数据中心800在操作时,冷却器模块810可将冷却流体提供给功率模块820和数据模块830,便于冷却包含于其中的设备(例如,功率模块820和数据模块830内的ahu可利用冷却流体来提供如上所述的冷却)。功率模块820可从功率源(例如,电力公用设施,发电机等)接收功率。功率模块820将功率分配到数据模块830。数据模块830可提供功率到it设备840以便于生产用途。

在各种实施例中,dcics105可监视冷却器模块输入845(例如,由冷却器模块810从电力公用设施接收的千瓦数)以及冷却器模块输出850(例如,由冷却器模块810提供的冷却流体的冷却容量)。dcics105可监视功率模块输入855(例如,由功率模块820从电力公用设施接收的千瓦数)。dcics105可监视功率模块输出860(例如,由数据模块830从功率模块820接收的千瓦数)。dcics105可监视所传送的it功率865(例如,传送到it设备840的用于生产用途的千瓦数)。

dcics105可基于传送到该it设备的所传送的it功率计算接收用于生产用途的功率的任何数据中心资产(例如,it设备840)的pue。在各种实施例中,公式1可被用来计算指定的it设备的pue:

公式1:

其中:

cmb是由下式提供的冷却器模块负担(chillermoduleburden):

冷却器模块输入(kw)/冷却器模块输出(kw)

dmb是由下式提供的数据模块负担(datamoduleburden):

数据模块输入(kw)/数据模块输出(kw)

pmb是由下式提供的功率模块负担(powermoduleburden):

功率模块输入(kw)/功率模块输出(kw)

ditp是所传送的it功率(例如,传送到指定的it设备的功率,所述it设备接收用于生产用途的ditp)。

参照图8中所示的实例,

cmb=冷却器模块输入845/冷却器模块输出850=20千瓦/100千瓦=0.2

pmb=功率模块输入855/功率模块输出860=1.05

dmb=功率模块输出860(例如,数据模块输入)/所传送的功率865(例如,数据模块输出)=1.02

ditp=所传送的功率865=93kw

用上述实例中的值来计算公式1得出1.29的pue计算值(四舍五入到最接近的十分之一)。但是应当理解的是,可基于提供给it设备的所传送的it功率来计算任何it设备(例如,包括一个或多个服务器的分区)的pue。

上述的技术可以实施为数字电子电路,或者计算机硬件、固件、软件,或者它们的组合。该实施可以作为计算机程序产品,即,在信息载体中有形地体现的计算机程序,例如在机器可读的存储装置中,用于由数据处理装置执行或控制数据处理装置的操作,所述数据处理装置例如为可编程的处理器、一台计算机,或多台计算机。计算机程序可以任何形式的编程语言编写,包括编译或解释语言,并且其可以任何形式部署,包括作为独立的程序、应用程序或引擎,或作为模块、组件、子程序,或适合于在计算环境中使用的其它单元。计算机程序可部署成在一台计算机或在多台计算机上在一个站点处执行或者分布跨过多个站点并通过通信网络相互连接。计算机程序配置成启用在线和自动化功能,诸如发送和接收消息、接收查询请求、配置响应、动态地配置用户界面、请求数据、发送控制指令、接收数据、解析数据、显示数据、执行复杂的过程、解释脚本、构建数据库查询、执行数据库查询、执行仿真、计算、预报、数学技术、工作流和/或算法、提示用户、验证用户的响应、启动处理、启动其它计算机程序、触发下游系统和过程,加密和解密。

计算机程序和其它软件元件可以被加载到通用计算机、专用计算机,或其它可编程数据处理设备上以产生机器,使得在计算机或其它可编程数据处理设备上执行的指令用于实施在流程图的一个框或多个框中指定的功能。这些计算机程序指令还可存储在计算机可读存储器中,其可控制计算机或其它可编程数据处理设备以特定方式工作,使得存储在计算机可读存储器中的指令产生制品,包括指令设备,其实施本文或在流程图的一个或多个框中指定的功能。该计算机程序指令还可加载到计算机或其它可编程数据处理设备上以使得在计算机或其它可编程设备上执行一系列的操作步骤,以产生计算机实施的过程,使得在计算机或其它可编程设备上执行的指令提供用于实施在流程图的一个框或多个框中指定的功能的步骤。

框图和流程图图示的功能框支持用于执行指定功能的设备组合,用于执行指定功能的步骤组合,以及用于执行指定功能的程序指令设备。还应当理解的是,框图和流程图图示的每个功能框以及在框图和流程图图示中的功能框的组合可以通过执行指定功能或步骤的基于专用硬件的计算机系统实施,或通过专用的硬件和计算机指令的合适组合来实施。此外,处理流程的图示及其说明可参照用户窗口、网页、网站、网页表单、提示等。从业者将认识到,本文所述的图示步骤可包括在任何数目的配置中,所述配置包括使用窗口、网页、网页表单、弹出窗口、提示和/或类似物。应当进一步理解的是,所图示和所述的多个步骤可被组合到单个网页和/或窗口内,但为了简单起见已被展开。在另一些情况下,图示和描述成单个处理步骤的步骤可被分成多个网页和/或窗口,但为了简单起见已被合并。

方法步骤可由执行计算机程序以通过操作输入数据和生成输出来执行本发明功能的一个或多个可编程处理器来执行。方法步骤还可通过专用的逻辑电路执行,以及设备可实施为专用的逻辑电路,例如,fpga(现场可编程门阵列)或asic(专用集成电路)。模块可以指计算机程序和/或处理器/专用电路的实现该功能的部分。

适于执行计算机程序的处理器通过举例的方式包括通用和专用的微处理器,以及任何类型的数字计算机的任何一个或多个处理器。通常情况下,处理器接收来自只读存储器或随机存取存储器或两者的指令和数据。计算机包括用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常情况下,计算机也包括,或者可操作地耦联到一个或多个用于存储数据的大容量存储设备,例如,磁盘、磁光盘,或光盘,以从所述存储设备接收数据或将数据传送到所述存储设备,或两者。数据传输和指令也可在通信网络上发生。适于承载计算机程序指令和数据的信息载体包括所有形式的非易失性存储器,例如包括半导体存储设备,例如,eprom,eeprom,和闪存装置;磁盘,例如,内部硬盘或可移动盘;磁光盘;和cd-rom和dvd-rom盘。处理器和存储器可由专用逻辑电路补充,或并入到专用逻辑电路内。

为了提供与用户的交互,上述技术可在计算设备上实施,所述计算设备耦联到显示装置或与显示装置通信,所述显示装置例如crt(阴极射线管)或lcd(液晶显示器)监视器,以便将信息显示给用户,所述计算设备耦联到键盘和定点设备或与键盘和定点设备通信,所述定点设备例如鼠标或轨迹球,用户利用它们可将输入提供到计算机(例如,与用户界面元件交互)。其它种类的设备也可以用于提供与用户交互;例如,提供给用户的反馈可以是任何形式的感官反馈,例如视觉反馈、听觉反馈或触觉反馈;以及来自用户的输入可以任何形式接收,包括声音、语音或触觉输入。

上述技术可在分布式计算系统中实施,其包括:后端组件,例如为数据服务器;和/或中间件组件,例如应用程序服务器;和/或前端组件,例如,具有图形用户界面和/或web浏览器的客户机计算机,用户通过图形用户界面和/或web浏览器可与示例性的实施方式交互;或这些后端、中间件,或前端组件的任何组合。该系统的组件可通过任何形式或数字数据通信的介质互连,例如通信网络。通信网络的实例包括局域网(“lan”)和广域网(“wan”),例如,因特网,并包括有线和无线网络。

计算系统可以包括客户机和服务器。客户机和服务器通常都远离彼此,并且通常通过通信网络交互。客户机和服务器的关系依靠在相应计算机上运行并且具有彼此为客户机-服务器关系的计算机程序而出现。

本文所论述的任何通信、输入、存储、数据库或显示可通过具有网页的网站来促进进行。如在本文中使用的术语“网页”并不意味着限制可用来与用户进行交互的文件和应用程序的类型。例如,典型的web站点除了标准的html文件之外可以包括各种形式,java小程序,javascript,活动服务器页面(asp),公共网关接口脚本(cgi),flash文件或者模块,flex,actionscript,可扩展标记语言(xml),动态html,层叠样式表(css),帮助应用程序,插件,和/或类似物。网站、服务器或计算机程序可包括web服务,其包括能够通过通信装置(例如因特网)与其它应用程序交互的应用程序。

本文已经关于特定实施例描述了益处、其它优点和问题的解决方案。然而,这些益处、优点、问题的解决方案,以及可能会导致产生任何益处、优点或解决方案或变得更加明显的任何元素不应被解释为是本发明的任何或所有权利要求的关键性的、必需的,或必要的特征或元素。

提供系统、方法和计算机程序产品。在本文的详细描述中,对“各种实施例”、“一个实施例”、“实施例”、“示例性实施例”、“一些实施例”等的参照是指所述的实施例可以包括特定的特征、结构或特性,但是每个实施例可以不必包括该特定特征、结构或特性。此外,这样的短语不一定是指同一实施例。此外,当特定特征、结构或特性结合实施例进行描述时,应当认为结合其它实施例来实现这些特征、结构或特性是在本领域技术人员的知识范围内的,无论其它实施例是否再次明确描述。在阅读了本说明书之后,对于本领域技术人员而言如何在替代性实施例中实现所公开的内容将是明显的。

应当理解的是,给出说明本发明实施例的详细描述和具体实例仅用于示出而非限制性的目的。在不脱离其精神的情况下可在本发明范围内进行许多变化和修改,并且本发明包括所有这样的修改。相应的结构、材料、操作和所有元件的等同物旨在包括用于与其它元件组合来执行功能的任何结构、材料或操作。对单数元件的参照并不旨在表示“一个且只有一个”,除非明确地如此陈述,而是表示“一个或多个”。此外,当类似于“a、b或c中的一个”,或“a、b和c中的一个”的短语在权利要求书或说明书中使用时,该短语旨在表示以下中的任一个:(1)至少一个a;(2)至少一个b;(3)至少一个c;(4)至少一个a和至少一个b;(5)至少一个b和至少一个c;(6)至少一个a和至少一个c;或(7)至少一个a,至少一个b,和至少一个c。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1