基于环境条件的适宜性来最佳分配计算机服务器负载的方法

文档序号:6593495阅读:135来源:国知局
专利名称:基于环境条件的适宜性来最佳分配计算机服务器负载的方法
技术领域
本发明一般涉及数据处理中心,更具体地涉及数据处理中心的运行管理。
背景技术
数据中心是大量服务器计算机位于其中的建筑物和设施的部分。服务器计算机 的密集堆放导致在局部区域产生大量的热。数据中心必须以可靠的方式冷却以避免关闭 或损坏服务器计算机硬件。由于热超载引发的关闭服务器计算机将引起重大的经济损失。因此,已经开发了在数据中心直接应用的专用的冷却单元。在本领域这些专用 的冷却单元有时称为计算机机房空气调节单元(CRAC)或计算机机房空气处理单元。本 公开中,空气调节单元或CRAC将理解为包括用于在数据中心中实现冷却的任何装置。 由于以下事实即建筑物中普通的HVAC系统不能最好地配置成处理数据中心所产生的集 中的热,已经利用了 CRAC。因此,除了用于人体舒适系统的建筑物的普通冷却单元之 外,CRAC经常与该普通冷却单元一起使用。许多CRAC具有简单的嵌入式控制,其基于例如感测的周围空气温度等因素来 调节单元的输出。在某些情况下,CRAC具有与除了别的之外还控制或包含建筑物HVAC 系统的建筑物自动化系统交互的控制器。尽管CRAC对于在具有多个服务器计算机的数据中心中对于增强的冷却功率的 需要提供了解决方案,不过存在过热的危险,这是由于数据中心中处理任务的不平衡加 载、CRAC单元的故障或效率低下、或影响了冷却特定服务器或服务器组的能力的数据 中心内的本地条件。因此可能期望降低过热或数据中心内一个或多个处理器的其它故障 的风险。

发明内容
本发明通过为特别适于处理附加处理的空间(space)分配处理负载(processing load),解决以上标识的需求及其它。空间可以基于温度和/或其它环境条件或空间内当 前处理负载确定为具有高的适宜性(suitability)。第一实施例是一种方法,其包括基于相应空间的至少一个环境条件测量为多个空间中的每一个生成空间信息值。每个空间包括一个或多个计算装置。空间信息值包括 关于用于接受计算负载的相应空间的相对适宜性的信息。方法也包括基于空间信息值确 定附加计算负载的分配。参考以下详细描述及附图,上述描述的特征和优点及其它将对本领域普通技术 人员来说容易是显而易见的。


图1示出根据在示例性数据中心中实现为协调应用处理的本发明的第一实施例 的示例性装置的示意性框图。图2示出可根据本发明执行的一组示例性操作。图3进一步详细示出图2中的至少一种操作的示例性实施例。
具体实施例方式图1示出根据本发明示意性实施例的装置100。装置100示出为与数据中心102 结合使用,数据中心102包括多个服务器计算机1041; 1042...10418以及多个空气调节单元 1061; 1062,1063和1064。装置100包括除了别的之外还具有存储器110和处理电路112 的计算机服务器管理系统108。在该实施例中,装置100进一步包括BAS元件120,其 可通信地连接于处理电路112。服务器计算机ICM1到10418中的每一个都是计算机组的一部分,计算机组提供应 用处理服务给至少一个(通常是大量的)客户端计算机(未示出)。服务器计算机IiM1 到10418通常布置在机架中,并分散地遍及数据中心102的空间。例如,如图1所示, 服务器计算机104” 1042、1043、1044、1045在数据中心102的第一空间132的第一机架 122上可被分组。类似地,服务器计算机1046、1047、1048、1049在数据中心102的第二 空间134的第二机架124上可被分组,服务器计算机1041(1、104n、10412、10413、10414在 数据中心102的第三空间136的第三机架126上可被分组,服务器计算机10415、10416、 10417、10418在数据中心102的第四空间138的第四机架128上可被分组。应当意识到数据中心可能每机架具有更多服务器,更多的机架位于单个的空间 或更多限定的空间。换句话说,数据中心102的基本结构可扩展(或者甚至减少)为几 乎无限种方式。与示例性实施例一起描述的原理可容易扩展为这样的其它大小的数据中 心。空气调节单元106” 1062、1063、1064中的每一个都是计算机机房空气调节器或 计算机机房空气处理器单元,统称为CRAC。空气调节单元106” 1062、1063、1064也可 以是在数据中心或高热生成器的其它区域内用于专门冷却空间的任意空气调节单元。这 样的装置在本领域内是公知的。在该实施例中,空气调节单元106” 1062、1063、1064 中的每个都在工作时耦合于BAS元件120,使得BAS元件120可以对空气调节单元106n 的操作执行至少一些测量控制。例如,如果空气调节单元106n具有自含式温度感测和控 制,BAS元件120可在工作时连接以优先于(0verride)0n/0ff本地控制,和/或提供设定 点给空气调节单元106n。其它空气调节单元可配置为直接外部控制。无论以何种方式, BAS元件120优选地在工作时连接以提供空气调节单元106” 1062、1063、1064的每一个的整体管理和/或控制。此处所述的实施例中,空气调节单元106” 1062、1063、1064操作以分别对空间 132、134、136、138冷却。在本领域已知的是为了在不同的空间集中不同的空气调节单 元的冷却能力,在数据中心中定位空气调节设备,即使各种空间物理上不用墙隔开。通 过例子,已知布置空气调节单元以形成热通道和冷通道,其中空气调节单元特别关联于 各个冷通道。BAS元件120是配置成与建筑物自动化系统(例如HVAC系统等等)通信并且 在建筑物自动化系统中运行的一个或多个装置。这样的系统是本领域公知的并且可具有 可从Siemens Building Technologies Inc得到的APOGEE 系统的通用架构。BAS元件 120包括至少一个处理电路140和存储器142。BAS元件120可适于采用BAS内的监督 工作站的形式(例如可从 Buffalo Grove, Illinois 的 Siemens Building Technologies Inc 得到 的INSIGHT 工作站)。可选择地,BAS元件120可适于为可配置的现场控制器(field controller),例如也可从 Siemens Building Technologies Inc 得到的 PXC Modular 现场控制 器。一般来讲,处理电路140配置为经由其它电路与其它BAS装置(例如其它控制器) 或者甚至与传感器和执行器,传送BAS数据(例如设定点、传感器值和命令)。BAS元件 120可进一步包括专用数字或模拟I/O装置,其对于与空气调节单元106” 1062、1063、 1064的控制元件通信是必要的。在该实施例中,BAS元件120进一步在工作时连接以与 计算机服务器管理系统108(尤其是处理电路112)传送信息。为此,在BAS元件120(其 配置用于BAS系统)和计算机服务器管理系统108 (其通常不设置用于与BAS系统的通 信)之间提供合适的数据接口。此处所描述的实施例中,BAS系统120配置为在数据中心102中(特别在空间 132、134、136、138中)监视环境条件。为此,BAS元件120在工作时耦合到位于第一 空间132中的一个或多个环境传感器118ρ位于第二空间134中的一个或多个环境传感器 IlS2,位于第三空间136中的一个或多个环境传感器1183、位于第四空间138中的一个或 多个环境传感器1184。一个或多个传感器IlS1到IlS4中的每一个包括至少一个温度传感器,以及可选 地可包括湿度、气流、和/或压力传感器。传感器118jljll84配置成提供关于空间132、 134、136、138中的环境条件到BAS元件120的信息。这样的信息可用于控制空气调节 单元106” 1062、1063、1064的操作,以及用于为此处服务器计算机的附加处理确定空间 132、134、136、138的适宜性,其将在以下论述。计算机服务器管理系统108是通常配置为协调多个服务器计算机ICM1到10418的 使用的计算系统。这样的装置一般是已知的。为了协调服务器的使用,计算机服务器管 理系统108的处理电路112执行虚拟化(virtualization)软件114。本领域公知的虚拟化软 件114是这样的软件,当由另外适当配置的计算机处理器执行时该软件管理(例如在数据 中心中)多个服务器计算机中的应用过程的分配。根据本发明的该实施例,处理电路112进一步配置成利用虚拟化软件114来基于 空间132、134、136、138的适宜性的测量来分配服务器计算机104” 1042等中的应用过 程。为此,存储器110为多个空间132、134、136、138中的每一个存储空间信息值。空 间信息值包括关于用于接受计算负载的相应空间的相对适宜性的信息。空间的相对适宜性可以基于相应空间的至少一个环境条件(以及其它因素)测量确定。结合图2和3在 以下进一步讨论关于空间信息值和/或适宜性评定的开发的其它信息。。再次参考图1,计算机服务器管理系统108配置成部分基于服务器计算机ICM1到 10418所位于的空间的相对适宜性来分配(利用虚拟化软件)一个或多个处理任务给多个 服务器计算机KM1到10418中的一个。特别地,当应用分配到服务器计算机104n时,执行应用促使服务器计算机104n 产生热能。处理电路112分配处理任务使得由服务器计算机104执行处理任务产生的热 分散到其中环境(和其它因素)处于服从接受其它计算负载和热负载的条件下的空间。为此,应当意识到服务器计算机ICM1到1045在空间132中产生热,服务器计算 机1046到1049在空间134中产生热,计算机1041(1到10414在空间136中产生热,计算机 10415到10418在空间138中产生热。如果特定空间内的服务器重度使用,和/或如果一 个或多个空间内的温度特别高,和/或温度很难降低,那么相对于其它空间这样的空间 将不太适合(也就是具有较低的相对适宜性)附加的计算活动。因此,处理电路112通过偏好分配计算负载给具有相对高适宜性指数的空间内 的服务器计算机104,从而分配处理任务。作为例子,考虑100个应用必须分配给服务器计算机ICM1到10418的情况。在现 有技术中,分配应用的一种方式可以是简单地分配基本上等量的应用给每一个处理器, 使得在该例子中服务器计算机KM1到10418中的每个会有100个应用中的5或6个。可选 地,分配可基于试图使服务器计算机IiM1到10418中的每个的忙碌(busy-ness)保持大体 均等。因此,如果特定服务器计算机104n有多个尤其是计算上密集的任务,它可能有较 少的全部应用。也可以考虑服务器计算机IiM1到10418的计算速度和效率。无论如何, 现有技术分配试图均勻分配计算负载。然而,情况可能是根据现有技术的这种分配将在特定空间136产生热应力,可 能导致不期望的关闭或至少报警条件,而另外的空间132正在变冷。在该种情形下,有 利的是给服务器IiM1到1045组中的一些更重地加载附加应用,而对服务器计算机1041(|到 10414更轻地加载。这样的分配将更多热分散到较冷的空间132并且较少的附加热分散到 较热的空间136。因此处理电路112基于空间132、134、136、138中的每一个的空间信息值(和 它的适宜性指数)确定分配至少一些过程。在图1的一般操作中,服务器计算机ICM1到10418提供应用处理给客户端计算机 (未示出)。计算机服务器管理系统108运行以分配来自客户端的应用请求给服务器计算 机^^到^^⑴中的一个或多个。一旦应用请求分配给服务器计算机104n,此后服务器 计算机104n执行应用。当每个服务器计算机104n执行应用时,服务器计算机的微处理器(和其它电路) 产生热,倾向于加热服务器计算机104n周围的空间。因此,在该例子中,服务器计算机 IiM1到1045的计算操作倾向于在空间132产生热,服务器计算机1046到1049的计算操作 倾向于在空间134产生热,服务器计算机1041(|到10414的计算操作倾向于在空间136产生 热,服务器计算机10415到10418的计算操作倾向于在空间138产生热。因为过度的热会损坏电路,在数据中心102中冷却是必要的。在该例子中,空气调节单元106:、1062、1063、1064运行以分别冷却空间132、134、136、138。空气调节 单元106” 1062、1063、1064中的每个可适当运行将其各自的局部空间冷却到预定的设定 点温度。在该实施例中,BAS元件120可提供设定点温度给空气调节单元106” 1062、 1063、1064中的每个,并且可进一步控制空气调节单元106i、1062、1063、1064的运行中 的至少一些方面。传感器IlS1到IlS4运行以提供与各个空间132到138相关的温度测量以及可选 地提供其它环境数据给BAS元件120。在某些情况下,这样的测量信息用于帮助控制空 气调节单元106” 1062、1063、1064。根据本发明的至少一些实施例,这样的测量信息进 一步用于生成空间信息值(例如适宜性指数值)。关于空间信息值,BAS元件120提供从传感器IlS1到IlS4接收的环境传感器数 据给计算机服务器管理系统108的处理电路112。处理电路112利用所接收到的关于空间 132、134、136、138的环境传感器数据及其它信息来生成适宜性指数。处理电路112可 用于生成适宜性指数的其它信息包括每个空间132、134、136、138中服务器计算机的加 载(和预测加载)。无论如何,处理电路112因此生成空间信息值,在该种情况下其包括至少基于 环境信息为空间132、134、136、138中的每一个计算的适宜性指数。处理电路112将空 间132、134、136、138的适宜性指数存储在存储器110中。处理电路112也在存储器110中存储服务器计算机ICM1到10418中的每个所位于 的空间132、134、136、138的标识。在该实施例中,处理电路112至少部分基于服务器计算机ICM1到10418的对应 空间132、134、136、138的适宜性指数分配处理任务(应用)给服务器计算机ICM1到 10418。如果大量的应用必须分配给服务器,处理电路112优选地分配更多的应用给具有 较高适宜性指数的空间,并且分配较少的应用给具有较低适宜性指数的空间。结果,应 用被更重地路由到位于更有助于接受附加热负载(其将由附加计算操作产生)的环境中的 服务器计算机。图2示出可由处理电路112执行以实施上述处理任务的基于空间适宜性的分配的 一组示例性操作。应当注意到这些步骤中的所有或一些可替代地可由BAS元件120(或 一些其它BAS装置)中的处理电路140执行。参考图2,在步骤205中,处理电路112获取或生成每个服务器计算机104 与 定义的空间132、134、136、138之一的关联。如上所述,该实例中的空间132、134、 136、138中的每一个直接对应于单个的相应机架122、124、126、128,以及单个的相应 空气调节单元106” 1062、1063、1064。然而,应当意识到多个机架(每个具有多个计算 机)可位于单个空间。可选地(并且优选地),每个机架可细分为多个“空间”。为此, 随着无线传感器模块的出现,例如在通过引用结合到本文中的、序号为1867-0006的美 国申请中所述及的,多个无线传感器可容易应用到单个服务器机架的不同位置。结果, 可以获得粒状(granular)环境数据,其进一步帮助发现与特定服务器相关联的局部热点或 冷点。类似地,单个空气调节单元不一定与单个空间相关联。当然,在数据中心内的空间的有意义地定义的最显著影响是传感器和/或服务 器计算机的数量和位置。为此,只要通过至少一个服务器计算机定义空间,并且空间具有可得到的特定于空间的环境信息,那么这样的空间的适宜性指数可有利地生成。例 如,至少一些实施例预期在每个服务器机架上放置至少4个温度传感器。在这种情况 下,可为每个机架定义至少4个空间。在传感器之间使用插值(interpolation),也可定义 一个或多个附加空间。不管怎样定义空间,无论如何,处理电路112获得每个服务器计算机与所定义 空间之一的关联。在图1的示例性实施例中,处理电路112将服务器计算机104:、1042、 1043、1044、1045与数据中心102的第一空间132相关联,服务器计算机1046、1047、 1048、1049与第二空间134相关联,服务器计算机1041(1、104n、10412、10413、10414与第 三空间136相关联,服务器计算机10415、10416、10417、10418与第四空间138相关联。处理电路112可经由用户输入(直接地或间接地经由BAS元件120)适宜地获得 服务器到所定义的空间的关联。用户输入标识与数据中心102内一组坐标(coordinates) 相对的服务器计算机104:到10418的布局。处理电路112 (和/或BAS元件120)可进一 步将传感器118!到1184及空气调节单元106:到1064关联于定义的空间132、134、136、 138。此后,在步骤210中,处理电路112为每个空间132、134、136、138生成空间 信息值。空间信息值包括空间的适宜性指数。适宜性指数考虑温度,以及优选地,空 间内服务器计算机的指示加载,空间中是否存在可用服务器计算机的指示,以及空间内 是否出现预冷却。空间信息值的产生在下面参考图3进一步详细论述。下面的表1以表 格形式提供了空间132、134、136、138的示例性空间信息值。表1
空间有用适宜性
132是30
134是90
136否0
138是100
在步骤215中,处理电路112接着基于空间信息值分配应用以选择服务器计算机104:到10418中的多个。作为例子,处理电路112可适当地分配一个或多个应用给具有最
高适宜性指数的空间内的服务器计算机。在上述表1的例子中,处理电路112将分配新 的应用给空间138内的服务器。如果所选择的空间内有多个可用的服务器,如空间138 的情况下,计算机服务器管理系统108的虚拟化软件114可适当地标识(一个或多个)应 用将分配到的所确定的适宜空间内的(一个或多个)特定服务器。如果所定义的空间内 可得到粒状温度测量,处理电路112可尝试分配新的应用给最接近于示出低局部温度的 传感器的服务器。 另一方面,如果必须分配大量的应用,那么处理电路可以以与空间适宜性指数 成比例的方式将应用分配给空间。因此,参考表1的例子,如果要分配100个应用,那 么处理电路112可适当地分配30/220或14个应用给空间132内的服务器计算机104:到 1045,分配90/220或41个应用给空间134内的服务器计算机1046到1049,分配100/220 或45个应用给空间136内的服务器计算机1041(|到10414。类似上面,计算机服务器管理 系统108的虚拟化软件可适当地标识所标识的(一个或多个)应用应分配至的、所确定的空间中的(一个或多个)特定服务器。因此,例如,计算机服务器管理系统108的虚拟 化软件会标识怎样将14个应用划分到服务器计算机101、川42、1043、1044、1045等等之 中。因此,图2的操作示出处理电路112怎样获得数据中心内所定义的空间的适宜 性指数信息,以及使用适宜性指数信息来分配应用任务到位于那些空间中的服务器计算 机。使用该过程,计算负载被有利地引导到具有处理新的热负载的最佳条件的位置内的 服务器。图3示出可用于为数据中心内的每个所定义的空间生成适宜性指数的一组示例 性步骤。图3的步骤应当周期性地执行,例如[[每天?每小时?每分钟? ?]]。在步骤305中,处理电路112从BAS元件120获得给定空间的传感器值。BAS 元件120又经由无线或有线建筑物自动化系统数据网络从传感器118i到1184接收传感器 值。此处所述的实施例中,传感器值通常将至少包括相应空间的温度信息。应当意识到 BAS元件120或其它装置可在提供传感器值给处理电路112之前对传感器值进行改变、过 滤、平均化或用其它方式处理。在步骤310中,处理电路112获得所选择的空间内服务器计算机的实际的和预测 的负载。实际负载数据容易从服务器计算机它们自身得到。预测负载数据可以是可用的 [怎样???例子???]。在步骤315中,处理电路112基于步骤305和310中获得的信息计算空间的适宜 性指数。适宜性指数是该实施例中测量的温度、计算的服务器负载率(load ratio)、预测 的服务器负载、预冷却状态和其它环境条件(压力、湿度、气流)的函数。本领域普通 技术人员可在其它实现中考虑更多或更少的因素。关于测量的温度,适宜性指数关于空间内测量的温度(一个或多个)反向地增 加。例如所有其它事情相等的情况下,希望分配新的应用给最冷空间内的服务器计算 机。关于服务器负载率,适宜性指数也关于空间内服务器计算机的当前加载反向地 上升。所有事情(例如温度)相等时,在服务器计算机全部(或大部分)都忙并且不可 用的时,希望避免试图分配应用。关于预测的服务器负载,适宜性指数关于空间内预测的服务器负载反向地上 升。如果所定义的空间内的服务器预测为具有不能容易转移给其它服务器的高负载,那 么可能有利的是避免会因将其它新的应用分配给那个空间内的服务器从而导致的过热。关于预冷却,适宜性指数关于预冷却状态而上升。预冷却状态是其中特定空间 被预冷却的状态,通常是预期将来临的繁重的处理负载。如果空间经历了预冷却,那么 有利的是将附加计算负载分配至那个空间中的服务器。关于其它环境测量(湿度等等),适宜性指数随那些值趋于最优而增加,且随那 些值趋于不被接受的条件而减少。特别地,任何不可接受的(也就是报警)条件可促使 适宜性指数下降到0,而不管其它因素。一旦已计算了空间的适宜性指数,处理电路112进入步骤320。在步骤320中, 处理电路112确定适宜性指数是否指示报警条件。例如,0适宜性指数被视为报警条件。 如果检测到报警条件,那么步骤325中处理电路112将报警发信号通知给视觉显示器,或通过e-mail、文本消息或寻呼发信号通知给技术员的便携式无线装置。步骤325后,处 理电路112返回到步骤305以开始对另一个空间计算适宜性指数。类似地,如果在步骤 320没有检测到报警条件,处理电路112直接返回到步骤305。
权利要求
1.一种方法,包括a)基于相应空间的至少一个环境条件测量,为多个空间中的每一个生成空间信息 值,每个空间包括一个或多个计算装置,空间信息值包括关于用于接受计算负载的相应 空间的相对适宜性的信息,和b)基于空间信息值确定附加计算负载的分配。
2.根据权利要求1的方法,进一步包括从放置在多个空间中的每一个内的传感器获得至少一个传感器测量,并且其中每个 空间的至少一个环境条件测量是基于空间的至少一个传感器测量。
3.根据权利要求1的方法,其中步骤a)进一步包括至少部分基于关于每个空间内的 计算装置的计算负载信息,生成空间信息值。
4.根据权利要求1的方法,其中步骤b)进一步包括b)基于对关于第一计算装置位于的第一空间的相对适宜性的信息和关于其它空间的 相对适宜性的信息的评估,从多个计算装置中选择用于处理附加计算负载的第一计算装置。
5.根据权利要求1的方法,进一步包括获得识别多个计算机装置中的每一个与多个空间中选择的一个之间的关联的数据; 并且其中步骤b)进一步包括基于多个空间中的第一空间和其它空间的空间信息值,通 过分配附加计算负载给与第一空间相关联的计算装置,确定附加计算负载的分配。
6.根据权利要求5的方法,其中步骤b)进一步包括i)分配更多计算负载给与具有表示较高相对适宜性的空间信息值的一个或多个空间 相关联的计算装置;ii)分配较少计算负载给与具有表示较低相对适宜性的空间信息值的一个或多个空间 相关联的计算装置。
7.根据权利要求1的方法,进一步包括c)基于新的环境信息在随后的时间提供更新的空间信息值;d)基于所述空间信息值确定至少一些计算负载的重新分配。
8.根据权利要求6的方法,其中确定重新分配包括将过程从第一空间中的第一计算装 置移至第二空间中的第二计算装置。
9.根据权利要求1的方法,其中步骤a)进一步包括至少基于相应空间的温度测量值生成多个空间中的每一个的空间信息值。
10.根据权利要求9的方法,其中步骤a)进一步包括基于包含以下的组中的至少一个生成多个空间中的每一个的空间信息值相应空间的湿度测量值、相应空间的气流测量值、相应空间的压力测量值。
11.根据权利要求9的方法,其中步骤a)进一步包括部分基于位于相应空间内的计算装置的当前计算负载值,生成多个空间中的每一个 的空间信息值。
12.根据权利要求11的方法,其中步骤a)进一步包括部分基于位于相应空间内的计算装置的预测计算负载值,生成多个空间中的每一个 的空间信息值。
13.根据权利要求9的方法,其中步骤a)进一步包括 部分基于位于相应空间内的计算装置的预测计算负载值的空间信息值。
14.根据权利要求1的方法,其中步骤a)进一步包括 部分基于位于相应空间内的计算装置的预测计算负载值的空间信息值。生成多个空间中的每一个 生成多个空间中的每一个
全文摘要
一种方法,包括基于相应空间的至少一个环境条件测量,生成多个空间中的每一个的空间信息值。每个空间包括一个或多个计算装置。空间信息值包括关于用于接受计算负载的相应空间的相对适宜性的信息。本方法也包括基于空间信息值确定附加计算负载的分配。
文档编号G06F1/20GK102016754SQ200980116346
公开日2011年4月13日 申请日期2009年5月5日 优先权日2008年5月5日
发明者P·桑卡库尔, W·T·皮恩塔 申请人:西门子工业公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1