计算机系统及优化计算系统的整体性能的方法

文档序号:6611453阅读:254来源:国知局
专利名称:计算机系统及优化计算系统的整体性能的方法
技术领域
本发明一般地涉及用于最大化有关计算机系统的计算性能的方法和系 统,更具体地说,涉及当计算单元与接近系统的环境*有关时测量计算 机系统内的每个计算单元的性能,并在需要时有效地重定位各个计算单元 和/或重新分配计算活动以实现最佳性能的系统和方法。
背景技术
计算机系统通常设计为确保其每个构成组件在预定环境中的规定温度 范围内运行。但是,在实际操作中,计算机运行的环境可能无法总是保持 温度规定。例如,在数据中心内,冷气温度和到每台计算机的流动速率可 能随空间和时间而变化。此外,环境条件的波动将同样影响计算机的运行。一些常规的计算机设备已经具有了功率和热量管理能力。例如,中央处理单元(CPU)通常具有内置的温度传感器。这些内置的传感器监视CPU 的运4亍温度并在CPU的温度达到预定阔值水平时激活和控制限速 (throttling)机构。 一旦激活,限速机构就减少CPU的计算活动并由此 降低其温度。结果,将CPU置于降低其计算性能的计算状态。
诸如上述方案的功率和热量管理方案有助于将计算机組件的温度维持 在给定的规定温度范围内,但是,该温度稳定性需要付出代价。也就是说, 通过限制设备的计算活动,引入了整个计算机系统的整体计算性能的不确 定。因此,需要^1供一种用于根据1)计算机设备运行的运行环境2)每个 计算机设备相对彼此的接近度来评估一组具有多个计算单元的计算机设备 的整体计算性能的方法和相应工具。
此外,由于运行环境中的冷气温度和流动速率可能不同,所以还需要
提供一种指导将计算单元放置于环境中的方法和相应工具。例如,可以这样放置计算单元使最热的单元位于冷气最冷的地方或其他使用冷气最高 效的地方。美国专利6, 959, 265公开了以用户为中心衡量计算机网络中的服务 质量(QoS);每个工作站或信息访问点(IAP)已在其上安装了 QoS模块 以监视IAP的性能。因为QoS指数在时间上;U见范化的,它们可由IT管理 员跨网络聚集或比较。,265专利的公开提供了监视和分析各种工作站上的 应用的性能的诊断工具;具有由所述的应用启动的一系列聚集的线程和聚 集的句柄。此外,在'265专利中公开的系统能够使用事件视图、响应时 间、资源使用率等来显示系统性能的各种快照。美国已公布申请No. 20050027727-Al公开了分布式数据收集和聚集代 理;运行度量(例如,性能度量、过程事件、絲监视状态、服务器状态) 的聚集对于多个成员来说是作为单个项,而对于多个实体来说是作为单个 实体。如所公开的,计算机可以使用到一个或多个其他远程计算机(例如, 远程客户端计算机)的逻辑连接在联网环境中运行。至少一个所述远程计 算机可以是工作站、服务器计算机、路由器、对等i殳备或其他^〉共网络节 点。相关领域的方法和系统没有包括下面提出和要求保护的系统和方法。 例如,任何一个相关领域都没有包括这样的软件工具评估给定冷却环境 中的一组计算机的聚集性能,同时提供每个单独计算机的最佳位置布局, 以4更可以在不改变冷却环境的情况下实现最高的整体性能。此外,相关领 域系统没有包括这样的软件工具其中所述工具还可用于针对给定噪音要 求来评估聚集的性能,或没有包括这样的工具所述工具还可以在单个计 算机之间交换计算任务,以确保它们不受组件温度的限制,并能够以这样 的方式分布工作负荷实现计算单元温度和性能的整体优化平衡.此外, 任何一个相关领域系统和方法都没有包括这样的软件工具其能够显示控 制面板(dashboard),所述面板整体显示了每个单独计算单元以及整体系 统的温度和性能,并主动提供有关具有低级性能和临界的高运行温度的组件的警报。 发明内容根据示例性实施例,本发明提供了 一种优化位于给定环境中的计算系 统的整体性能的方法。根据此实施例的计算系统包括至少一个计算单元,并且根据所述实施例的方法包括向所述至少一个计算单元中的每个计算 单元查询数据,其中所述数据至少包括与每个计算单元的至少一个子单元 对应的温度数据;确定指示所述计算系统的相对性能的整体性能值,其中 所述整体性能值基于所述至少一个计算单元中的每个计算单元的加权性能 指数;以及接收指示所述给定环境内的所述至少一个计算单元中的每个计 算单元的相对位置的位置数据。根据本发明的其他示例性实施例,提供了一种计算机系统,包括至 少一个位于给定环境内的计算单元,每个计算单元包括至少一个子单元; 以及可操作地连接到每个所述计算单元的服务器,其中所述服务器可从每 个所述计算单元接收位置数据、性能数据、温度数据以及其^目关数据, 并且还可根据从每个计算单元接收的所述位置数据、性能数据、温度数据 以及其他相关数据来确定每个所述计算单元的理想位置。根据其他实施例,提供了 一种最大化包括至少一个位于给定位置的计 算单元的计算机系统的计算性能的计算M序产品,所述计算积4呈序产品 包括计算机可读介质;第一程序指令装置,用于向所述至少一个计算单 元中的每个计算单元查询数据,其中所述数据至少包括与每个计算单元的 至少一个子单元对应的温度数据;第二程序指令装置,用于确定指示所述 计算系统的相对性能的整体性能值,其中所述整体性能值基于所述至少一 个计算单元中的每个计算单元的加权性能指数;以及第三程序指令装置,用于接收指示所述给定环境内的所述至少一个计算单元中的每个计算单元 的相对位置的位置lt据。根据其他实施例,计算M序产品用于评估包括位于给定位置和环境 ^H^的至少一个计算单元的计算机系统的蒼沐计算性能。所述计算枳4呈序
产品还监视和报告这些计算单元中的主要组件的健康状态并根据它们相应根据其他实施例,提供了最大化包括至少一个位于给定位置的计算单 元的计算机系统的计算性能的计算机程序产品,并根据一组给定环境* (如位置的冷却能力、声音要求、系统的总体能耗等)来使用所述产品。 给出以下对附图的说明,所述装置对于本领域的技术人员应是显而易 见的。


参考

了本发明,这些附图是图1是根据本发明的计算单元监视和控制系统的方块图;图2是才艮据本发明的CPU监视和控制系统的方块图;图3是根据本发明的存储器设备监视和控制系统的方块图;图4是根据本发明的硬盘驱动器监视和控制系统的方块图;图5是根据本发明的CSPEC CPU子代理的流程图;图6是根据本发明的CSPEC存储器设备子代理的流程图;图7是根据本发明的CSPEC石更盘驱动器子代理的流程图;图8是根据本发明的CSPEC代理的流程图;以及图9是根据本发明的CSPEC月良务器的诚图。
具体实施方式
参考附图,图l是根据本发明的一个示例性实施例的计算单元的监视 和控制系统100的方块图。如图所示,图1包括对应于一个或多个CPU设 备(未示出)的中央处理单元(CPU)监视和控制(M&C)部分10、存储器 i更"^监视和控制(M&C)部分20、对应于一个或多个硬盘驱动器(HDD)的 硬盘驱动器监视和控制(M&C)部分30、对应于一个或多个I/O芯片(例 如,图形芯片)的I/O芯片监视和控制(M&C)部分40、用于任何电源的 电源监视和控制(M&C)部分50,以及用于任何冷却风扇或^RL机的冷却风扇监视和控制(M&C)部分60。基#入输出系统(BIOS) 70是一组软件例程,其例如存储在非易失 性存储器设备(未示出)中并用于在接通电源时或在发生重置情况以后(例 如,在加栽操作系统(OS)之前)将计算单元置于有序状态。BIOS 70还 用作高级软件向/从计算单元中的每个组件传送命令和指令的桥梁。本领域 的技术人员将理解,BIOS 70的各种典型操作,以及因此有关BIOS软件的 常规操作的进一步说明不在此处讨论的范围内。每个根据本实施例的计算单元都包括称为CSPEC代理80的软件组,它在加载了操作系统(OS)之后运行。CSPEC代理8 0与硬件管理控制器(HMC) 90通信,后者又直接或通过BIOS 70与系统100的每个M&C部分通信。例 如,根据本实施例的一个方面,HMC 90直接或通过BI0S 70与CPU M&C部 分10及存储器M&C部分20通信。才艮据其他实施例,为了标识特定计算单元的位置,通过BIOS 70读取 特定的位置标识代码95并将其发送到CSPEC代理80。 一种提供位置特定 代码的方法包括在要将计算单元插入(或以其他方式)其中的位置提供具 有硬连线组合的内置在底板或机架中的连接器。例如,底板连接器中的特 定引脚组合或地址具体标识了给定环境中的特定位置,例如,房间等。当 在此位置将计算单元插入底板时,计算单元上的匹配连接器将紧密配合底 板中的连接器,并且计算单元中的BIOS将读取并注册驻留在底板连接器的 引脚中的内置位置代码(例如,地址)。在此实例中,读取位置代码的协 议可以是任何在行业中普遍使用的串行通信方案,例如,集成电路间U20 总线协议。图2是根据本发明的CPU监视和控制模块10的详细方块图。根据此实 施例,HMC 90从温度读取器101请求和接收温度读数,后者则从CPU温度 传感器102获取温度读数。HMC 90通过BIOS 70从温度读取器101请求读 数。HMC 90还根据来自CSPEC代理80的指令来设置CPU时钟和电压处理 器103上的CPU时钟频率及供电电压。HMC 90可进一步操作以初始化和控 制CPU性能寄存器104。 CPU性能寄存器104 —_§*初始化,它就确定指示特定组合的时钟频率和电压的CPU的性能水平的事件的持续时间。CPU性 能寄存器104通常在接通电源时被初始化,以后在启动事件计数之前由服C 90的请求初始化。将用时钟周期数衡量的事件持续时间存储在寄存器104 中,其将通过HMC 90读取并发送到CSPEC 80以进一步处理。图3是根据本发明的存储器设备监视和控制模块20的方块图。根据此 实施例,HMC 90与存储器控制器201通信,后者则与存储器卡中的存储器 緩冲芯片通信,具体地说,存储器控制器201与存储器緩冲芯片的温度寄 存器部分202通信。存储器緩冲芯片中的内部电路(未示出)读取其在芯 片上的内置温度传感器并将读数置于片上寄存器202中。存储器控制器201 与寄存器202之间的通信通常通过是行业标准通信协议的系统管理总线 (SMB)。为了读取温度寄存器部分22中的内容,CSPEC将经由SMB通过 HMC 90将命令发送到存储器控制器201。存储器控制器201然后从温度寄 存器部分22读取内容。图4是硬盘驱动器监视和控制模块30的方块图。对于本实施例的这一 部分,服C 90通过BIOS 70与硬盘驱动器(HDD)通信。^it驱动器中的 电路读取HDD的内部温度传感器(未示出)并将温度读数置于接口寄存器 301中。图5是示出根据本发明的一个示例性实施例的CSPEC CPU子代理的操 作的示例性流程图。具体地说,CSPEC CPU子代理包括在根据本发明的每 个计算单元中的CSPEC代理下运行的软件例程。在该图中,示出了与监视 和控制的CPU部分相关的软件例程。其他组件(例如,存储器、碌產驱动 器等)的类似软件例程也将在CSPEC代理下运行。如图5所示,在开始时,CSPEC CPU子代理例程向CPU查询其状态、 风扇速度和计算单元的进气口温度(Sl)。所述例程然后判定是否已将CPU 置于限速状态(S2),这通常可以从CPU中的特定寄存器读取。如果计算 单元的CPU不在限速状态,则CSPEC CPU子代理例程继续到测量CPU的性 能情况(S3)。备选地,如果CPU处于P艮速状态,则所迷例程将检查其温 度、风扇速度和进气口温度。通过使用这些数据,所述例程然后搜索CPU 功率数据(S4)并计算一组新的将最可能匹配冷却环境的CPU时钟和电压 以便CPU在不限速的情况下运行。将该组新的CPU时钟和电压的信息发送 到HMC 90以便实施。此例程将一直重复,直至CPU在正常(非P^J逸)状态 下运行。有时,在每次设置时钟和电压之后,可能需要时间延迟以使CPU 温度稳定。为了说明的清晰,M^图中明确示出此时间延迟。备选地,CPU 将生成温度过高事件及警告,指示不可接受的高值并启动电压和时钟频率 降低事件以降低CPU功率并因此降低其温度。例如,可以证实以下CPU状态开始CPU频率、CPU电压、相关CPU功率 4. 0 GHz、 1.4 V、 100 W降低电压1. 4V -> 1. 3V降低频率4. 0 GHz -> 3. 8 GHz 相关CPU功率82 W温度过高警报消失,如果没有,贝'J降低电压1. 3 V -> 1. 2 V降低频率3. 8 GHz -> 3. 6 GHz 相关CPU功率68 W如在所述实例中可以看到的,需要数个步骤来逐步降低CPU功率。作 为最终保障,如果CPU温度仍高于规定温度,则会将信号发送到CSPEC以 将计算活动移到系统中的其他计算单元。还将在控制面板中显示有关此情
况的警告标志。在相反的情况下,如果CPU的实际功耗和进气口温度低于规定,或风 扇速度(由此气流)高于规定,则CPU温度在同一级别的计算活动的情况 下可以低于规定温度,CPU通常可以以一组高于规定的时钟频率和电压运行。可以扩展此例程以包括这种情况。图6是示出了根据本发明的一个示例性实施例的CSPEC存储器子代理 的操作的示例性流程图。具体地说,CSPEC存储器子代理包括在根据本发 明的每个计算单元中的CSPEC代理下运行的软件例程。如图6所示,在开始时,CSPEC存储器例程向存储器设备查询例如每 个存储器卡上的每个存储器緩沖芯片的温度(S10 )。在获取了温度读数之 后,CSPEC存储器例程将每个温度与相应的预定阈值温度进行比较。如果 获取的温度低于相应的阈值温度,例如,确定温度不是太高,则例程执行 读取读/写延迟值的读取过程,然后例程退出(S12)。备选地,如果获取的温度值大于指定的阈值温度,也就是说,緩沖芯片的温度过高,则例程 使用预定的存储器緩冲芯片功率数据来计算修正的读/写请求速率(S13), 所述功率数据中列出了存储器緩冲芯片温度和读/写请求速率的关系的表。 该表从实际测量或从制造商的技术规范(如果有)来获得。 一般地说,相 对快速的读/写请求速率将使存储器芯片及存储器緩冲芯片自身消耗更多 功率,由此产生更高的芯片温度。所述例程使用该表通过内推法来计算下 一个可用的读/写请求速率,以便存储器緩沖芯片以及存储器芯片的温度将 最有可能低于规定值。然后设置修正的计算的读/写请求速率并将其发送到 HMC 90,后者则相应地指示存储器緩冲芯片(S14)。图7是示出根据本发明的一个示例性实施例的CSPEC硬盘驱动器子代 理的操作的示例性流程图。具体地说,CSPEC硬盘驱动器子代理包括在每 个计算单元中的CSPEC代理下运行的软件例程。如图7中所示,在开始时, CSPEC硬盘驱动器子代理例程向HDD查询驱动器的内部温度读数以及其他 温度读数(S21)。例如,如果可用,所述其他温度读数包括HDD外部的一 个或多个温度和驱动器机壳的温度。 一旦获取了驱动器的温度读数等,例
程就判定这些温度是否太高,以及/或者读/写错误率是否太高(S22)。如果温度和/或错误率在可接受的范围内,则不会采取任何操作,代理 继续监视驱动器。如果温度和/或错误率过高,例如,两者之一高于相应的 预定值;则例程总体上针对驱动器的健康执行进一步的诊断检查。如果驱 动器仍健康,则例程将根据驱动器的功率和温度数据来计算一组修正的电 M度和读/写速率(S23)。如果驱动器不健康,例如,电fet度不在预 设范围内,则还将警告信号发送到CSPEC代理(S25 )。然后i殳置该组修正 后的参数并将其发送到HMC 90,以将驱动器置于将使用更低功率及生成更 少热量的新的状态(S24)。 一旦该组修正后的读/写请求速率稳定,则例 程将评估读/写延迟并计算要发送到CSPEC代理的驱动器性能指数(S25 )。 图8是示出根据本发明的一个示例性实施例的CSPEC代理的^Mt的示 例性流程图。具体地说,根据此实施例的CSPEC代理包括在加载操作系统 (0S)之后在每个计算单元中运行的软件例程。如图8所示,CSPEC代理(图1中的80)向每个子代理查询其相应的 数据(S31)。这些子代理包括所有在计算单元中运行的子代理,例如,图 1中示出的子代理,即,CPU、存储器、HDD、 I/O、电源和冷却。CSPEC代 理还从操作系统(0S)收集包括CPU和存储器使用率的正在运行的任务的 列表(S32)。此外,CSPEC代理计算有关计算单元的性能指数值以指示其 性能状态(S33)。通常分配高指数值以指示计算单元正在接近其J^值性能 状态,而为低性能状态分配较低的值。可以从正在运行的任务和子代理的 所有单个指数来得出此性能指数。例如,作为所有正在运行的任务的加权性能指数的和来计算性能指数,所述加权性能指数通过将正在运行的任务 的CPU和存储器使用率与一組存储的基准任务结^目比较来确定。然后通过通信模块将加权性能指数连同计算单元的位置信息一起发送到在单独的 计算单元中运行的CSPEC服务器(S34)。图9是示出CSPEC服务器工具(即配置)的操作的示例性卩i^呈图。具 体地说,根据此实施例的CSPEC服务器工具包括在包含多个计算单元(CU) 的系统中被指定为服务器的单独计算单元中运行的软件例程。
如图9所示,CSPEC服务器从在计算单元(例如,CU #1到CU #n)中 运行的每个CSPEC子代理收集输入(S41)。然后,服务器根据每个计算单 元的加权性能指数来计算整个计算系统的性能值(S42)。此外,服务器检 查计算单元中的所有组件是否都以其峰值性能状态运行(S43)。如果计算 单元中的任一组件没有以峰值性能运行,则服务器逐个地检查从这些计算 单元中的每个计算单元接收的记录,以找出非峰值性能情况的原因。例如, CU #1中的CPU处于P艮速状态(非J^值性能情况),并且该单元中的进气 口温度高于预定值,服务器将相应的组件名称、位置、性能状态以及原因 记录到数据库中。将为报告的未在峰值性能状态运行的所有组件执行类似 的过程。如果确定为不在J^值性能运行的组件在其他方面显得健康,则服务器 根据以下列出的算法进行操作,以确定具有此其他方面健康的组件的计算 单元的新位置(S44)。选择新位置以使计算单元现在以其峰值性能状态运 行。确定CU的新位置的算法如下(1) 在环境中搜索具有较低进气口温度的位置;(2) 从数据库中检索进气口和组件温度之间的例如由计算单元制 造商提供的相关数据;(3) 计算可能位置的组件温度;(4) 如果计算的组件温度允许计算单元以峰值性能状态执行,则 转到(5),否则重复(1)到(3)以找到另一个具有更低进气口温度 的位置;(5 ) 为所有其他计算单元重复(1)到(4 ),直至所有计算单元 都可以以峰值状态运行。如果不能实现此目标,则计算有多少计算单 元不能以峰值状态运行;(6) 复核制造商提供的系统策略以查看是否允许重定位该计算单元;(7) 如果允许并且可以更改系统冷却环境(例如,增加系统风扇
速度),则计算修正的系统风扇速度以允许所有计算单元以峰值状态运行;(8) 向系统规划者提供具有详细布局的建议。 上述示例性算法的目的是根据可能随空间和时间变化的给定系统冷却 环境来实现最高可能的整体系统性能。本领域的技术人员将理解,可以修 改上述算法以实现其他目标。例如,可以修改算法以确定给定噪音要求的 整体系统性能。在此实施例中,需要噪音与进气口温度之间的相互关系且 其应由制造商来提供。jrt^目互关系现在可以结合上述算法一起使用以根据 噪音要求来计算整体系统性能。此外,可以修改算法以便确定一天中特定 时间段的给定总体能耗要求的整体性能值。在此实施例中,将提供能耗与 单个计算单元的性能指数之间的相互关系,并且现在可以将该关系与上述算法结合使用,以便根据总体能耗要求来计算整体系统性能。在重新安排了每个计算单元的物理位置之后,如果确定仍有一些单元 由于温度限制而以峰值以下的性能状态运行,则cspec服务器工具检查这些单元的计算负载。如果这些单元中的负栽也很高,则cspec服务器工具搜索数据库以查找计算负载与单元组件温度之间的相互关系。如果找到了 可以在较低单元组件温度下运行同 一计算负栽的计算单元,则服务器执行 在这两个单元之间运行的计算任务的交换。因此,通过此附加的负载交换, 保证了聚集的系统性能。根据其他实施例,cspec显示有关实时温度和系统性能的控制面板,并提供了对具有低性能和临界温度的组件的监视和视觉警报。系统管理员 对警报采取行动以检索组件的更多详细信息和历史数据。还可以为管理员 提供建议的解决方案和操作能力以执行组件间计算负栽的手动交换,以便 实现更好的性能。所述实施例是示例性的并且并非旨在限制本发明的范围。环境数据包 括但不限于进气口和出气口温度、空气或其他冷却剂流速、位置高度、湿 度等,到所述实施例的数据输入包括但不限于组件温度、性能值、数据读/ 写速率、风扇速度、时钟频率、电压、组件和计算单元的功耗等。本领域
的技术人员将理解,本发明可以采取上述实施例中所特别说明的那些形式 之外的形式。例如,本发明可以采取完全硬件实施例、完全软件实施例或 包含硬件和软件元素两者的实施例的形式。在一个示例性实施例中,本发 明以软件实现,所述软件包括但不限于固件、驻留软件、微码等。此外,本发明可以采取可从计算机可用或计算机可读介质访问的计算 机程序产品的形式,所述计算机可用或计算机可读介质提供了可以被计算 机或任何指令执行系统使用或与计算机或任何指令执行系统结合的程序代 码。出于此说明的目的,计算机可用或计算机可读介质可以是任何能够包 含、存储、传送、传播或传输由指令执行系统、装置或设备使用或与所述 指令执行系统、装置或设备结合的程序的装置。所述^h质可以是电、磁、光、电磁、红外线或半导体系统(或装置或 设备)或传播介质。计算机可读介质的实例包括半导体或固态存储器、磁带、可移动计算机盘、随M取存储器(RAM)、只读存储器(R0M)、硬磁盘 和光盘。光盘的当前实例包括光盘-只读存储器(CD-ROM)、光盘-读/写 (CR-R/W)和DVD。适合于存储和/或执行程序代码的数据处理系统将包括至少 一个直接 或通过系统总线间接连接到存储器元件的处理器。所述存储器元件可以包 括在程序代码的实际执行期间采用的本地存储器、大容量存储装置以及提 供至少某些程序代码的临时存储以减少必须在执行期间从大容量存储装置 检索代码的次数的高速緩沖存储器。输入/输出或1/0设备(包括但不限于Mit、显示器、指点设备等)可 以直接或通过中间1/0控制器与系统相连。网络适配器也可以被连接到系统以使所述数据处理系统能够通过中间调制解调器、电缆调制解调器和以太网卡只是几种当前可用的网络适配器。 将理解,包括上述细节的任何组合的方法将落入根据下i^利要求及 其任何等同物所确定的本发明的范围之内。通过研究附图、公开及所附权利要求可以得到本发明的其他方面、目 标和优点。
权利要求
1.一种优化位于给定环境中的计算系统的整体性能的方法,所述计算系统包括至少一个计算单元,所述方法包括向所述至少一个计算单元中的每个计算单元查询数据,其中所述数据至少包括与每个计算单元的至少一个子单元对应的温度数据;确定指示所述计算系统的相对性能的整体性能值,其中所述整体性能值基于所述至少一个计算单元中的每个计算单元的加权性能指数;以及接收指示所述给定环境内的所述至少一个计算单元中的每个计算单元的相对位置的位置数据。
2. 如权利要求l中所述的方法,还包括 判定所有所述至少一个子单元是否都以^^值性能运行; 为任何没有以峰值性能运行的子单元确定至少一个原因。
3. 如权利要求2中所述的方法,其中所述至少一个原因包括进气口温 度、组件M状态、功^5l计算负载中的至少一个。
4. 如权利要求l中所述的方法,还包括向每个计算单元的每个子单元查询相应的子单元数据,其中所述子单 元数据包括温度数据以及指示由所述子单元执行的相应任务的数据中的至 少一个lt据;计算所述至少一个计算单元中的每个计算单元的相应性能值,其中每 个相应性能值包括加权性能指数,该指数基于由所述每个计算单元的所述 子单元执行的相应任务与基准点的比较。
5. 如权利要求l中所述的方法,其中指示所述给定环境内的所述至少 一个计算单元中的每个计算单元的相对位置的位置数据包括从每个计算单元接收的唯一数据字,并且其中每个唯一数据字唯一地标识了所述给定环 境内的相应位置。
6. 如权利要求4中所述的方法,还包括为至少一个所述计算单元计算 在所述给定环境内的修正后的位置,其中所述修正后的位置基于所述接收的位置数据和所述温度数据。
7. 如权利要求4中所述的方法,还包括从计算单元的硬盘驱动器子单元接收温度数据,其中来自所述硬盘驱 动器子单元的所述温度数据指示所述硬盘驱动器的内部温度、所述硬盘驱 动器子单元的外部温度以及所述硬盘驱动器子单元的机壳温度中的至少一 个温度;判定以下两项中的至少一项任何一个所述硬盘驱动器温度是否超过 预定阈值,以及与所述硬盘驱动器关联的错误率是否超过另一个预定阈值; 以及根据从所述硬盘驱动器接收的所述温度数据来计算与所述硬盘驱动器 关联的修正的电M度和修正的期望错误率中的至少一个。
8. 如权利要求4中所述的方法,还包括从计算单元的存储器设备子单元接收温度数据,其中来自所述存储器设备子单元的所述温度数据指示所述存储器设备子单元的温度;判定从所述存储器设备接收的所述温度数据是否超过预定阈值;以及 如果从所述存储器设备接收的所述温度数据超过预定阈值,则计算更新的读/写请求速率。
9. 如权利要求4中所述的方法,还包括从所述计算单元的处理器子单元接收数据,其中来自所述处理器子单 元的所述数据包括与所述处理器子单元对应的状态数据、风扇速度,以及 与所述处理器子单元对应的进气口温度中的至少一个;判定所述处理器子单元是否处于f!Ui状态。
10. 如权利要求9中所述的方法,还包括测量所述处理器子单元的性 能情况。
11. 如权利要求9中所述的方法,还包括 确定所述处理器子单元获得的功率量;以及 将所述确定的所述处理器子单元获得的功率量与预定阈值相比较。
12. 如权利要求ll中所述的方法,还包括 计算所述处理器子单元的修正后的时钟频率; 计算所述处理器子单元的修正后的供电电压;以及 将所述修正后的时钟频率和修正后的供电电压发送到硬件管理控制
13. 如权利要求4中所述的方法,还包括显示与至少一个所述计算单 元关联的所述性能值和温度数据。
14. 如权利要求4中所述的方法,还包括将由第一计算单元的至少一 个子单元执行的至少一个任务重新分配给第二计算单元的相应子单元,其 中所述重新分配至少部分地基于与所述第一和第二计算单元关联的温度数 据。
15. —种计算机系统,包括至少一个位于给定环境内的计算单元,每个计算单元包括至少一个子 单元;以及可操作地连接到每个所述计算单元的服务器,其中所iO艮务器可从每 个所述计算单元接收位置数据、性能数据和温度数据,并且还可根据从每 个计算单元接收的所述位置数据、性能数据和温度数据来确定每个所述计算单元的理想位置。
16. 如权利要求15中所述的计算机系统,还包括用于向所述至少 一个计算单元中的每个计算单元查询所迷位置lt据、 性能数据和温度数据的装置;用于确定指示所述计算机系统的相对性能的整体性能值的装置,其中 所迷整体性能值基于所述至少一个计算单元中的每个计算单元的加权性能 指数;以及用于接收指示所述给定环境内的所述至少一个计算单元中的每个计算 单元的相对位置的位置数据的装置。
17. 如权利要求15中所述的计算机系统,还包括用于向每个计算单元的每个子单元查询相应的子单元数据的装置,其 中所述子单元数据包括温度数据以及指示由所述子单元执行的相应任务的 数据中的至少一个数据;用于计算所述至少一个计算单元中的每个计算单元的相应性能值的装 置,其中每个相应性能值包括加权性能指数,该指数基于由所述每个计算 单元的所述子单元执行的相应任务与基准点的比较。
全文摘要
一种用于最大化包括至少一个计算单元的计算机系统的性能的方法、系统和计算机可读介质。由服务器单元接收每个计算单元的温度和位置数据,并重新评估和修正给定环境内的每个计算单元的位置,以便最大化所述计算机系统的整体性能。
文档编号G06F11/00GK101131659SQ20071014027
公开日2008年2月27日 申请日期2007年8月8日 优先权日2006年8月21日
发明者L·S·莫克, T·C·基耶乌, V·卡马斯, 陈海洋 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1