用于分布式计算机系统测量的系统及方法

文档序号:6614105阅读:324来源:国知局
专利名称:用于分布式计算机系统测量的系统及方法
技术领域
本公开的技术领域是在计算机系统中的参数测量,特别是,在分布式计 算机系统中的参数测量。
背景技术
分布式计算机系统,如高端对称多处理(SMP)服务器系统,需要测量 遍及计算机系统的操作参数,以监控操作并且荻得用于控制操作的数据。一 个被测量的操作参数的示例是功率,对其的测量在减少功率用量(usage)和 控制遍及计算机系统的功率流方面已经变得越来越重要。对于测量的功率数 据的使用范围从数据到外部程序的简单传递扩展到基于数据的计算机系统功 率性能状态的复杂改变。在低端计算机系统中,在功率分布系统扩展之前, 增加硬件来测量功率用量,其提供总功率的测量但是要求处于附加花费的额 外的硬件。在高端计算机系统中,总功率不是直接地测量,而是被估算,导 致大的误差。误差要求将额外的余量(margin)嵌入控制计算中,并且功率 系统做得更大以解决该误差。这两者都增加了计算机系统的初始成本和操作 期间的费用。
高端SMP服务器系统典型地包括若干提供功率测量的分布式点。这些分 布式点测量由服务器实体,如处理器核心、存储器单元、和/或输入/输出设备 所消耗的功率。SMP服务器系统基于在分布式点的功率测量,决定系统等级。 遗憾的是,目前的SMP服务器系统在不同的时间进行功率测量,使得不可能 精确地确定在特定时间在特定点上的功率,或在特定时间的总功率。
图1A和1B图示在不同时间进行功率测量的问题。图1A是分布式计算 机系统的实际功率相对时间的图。将分布式计算机系统内若干从属点(slave point)处的实际功率(标记为从l、从2、从3)总计以提供实际的系统总功 率(标记为系统)。图1B是分布式计算机系统的指示功率相对时间的图。将 分布式计算机系统内若干从属点处的指示功率(标记为从l、从2、从3)总
计以提供系统指示总功率(标记为系统),其将由主设备看到。在该图示中,
对于各从属指示功率从实际功率偏移,以反映出在主设备和各从属之间从属
单元延迟时间的差别。从3没有偏移,从2向后偏移两个时间单位,并且从 1向后偏移四个时间单位。没有出现在图1A上的、发生在真实时间零点之前 的数据,在图1B上填充了从2的最初两个时间单位和从1的最初四个时间单 位。在图1B中的零到四时间单位之间,相对于图1A的系统实际总功率,初 期的数据减少了图1B的系统指示总功率的大小。
从图1A的系统实际总功率与图1B的系统指示总功率的比较看来,偏移 的影响是明显的。例如,从零到四时间单位,系统实际总功率急剧地增加, 然后平稳。系统指示总功率在零和八时间单位之间显示更加渐进的(gradual) 增加,在八时间单位达到峰值,然后立即下降。由于系统指示总功率没有反 映系统实际总功率,所以任何基于系统指示总功率以控制系统功率的尝试导 致操作误差。
将期望有一种用于分布式计算机系统的测量的系统和方法,其将克服上 述缺点。

发明内容
本发明的用于分布式计算机系统测量的系统和方法提供对系统参数的同 步测量。通过考虑到在主单元和从属单元之间的从属单元延迟时间,将从属 单元中的从属时钟同步。精确测量允许对分布式计算机系统的精确控制,并 且减少了过度保守的操作余量。
本发明的 一个方面提供一种用于分布式计算机系统的参数测量的方法, 其包括选择主单元;选择可操作地连接到在总线上的主单元的从属单元, 该从属单元具有从属时钟;确定在主单元和从属单元之间的从属单元延迟时
间;为从属单元生成从属单元同步信号,该从属单元同步信号为从属单元延 迟时间进行调整;响应于从属单元同步信号,同步从属时钟;并且在同步确 定的时间测量在从属单元的操作参数。
本发明的另 一个方面提供一种在计算机可用介质中的计算机程序产品, 其用于分布式计算机系统的参数测量,该分布式计算机系统具有主单元和可 操作地连接到在总线上的主单元的从属单元,该从属单元具有从属时钟,该 计算机程序产品包括用于确定从属单元在主单元和从属单元之间延迟时间 的计算机程序编码;用于为从属单元生成从属单元同步信号的计算机程序编码,该从属单元同步信号为从属单元延迟时间进行调整;用于响应于从属单 元同步信号,同步化从属时钟的计算机程序编码;以及用于在同步确定的时 间测量在从属单元的操作参数的计算机程序编码。
本发明的另一个方面提供一个信息处理系统,其包括处理器;主单元; 可操作地连接到在总线上的主单元的从属单元;耦合到所述处理器以存储指 令的存储器,该指令可由数字处理装置存储执行,以执行为分布式计算机系 统提供参数测量的操作。该操作包括确定在主单元和从属单元之间的从属 单元延迟时间;为从属单元生成从属单元同步信号,该从属单元同步信号为 从属单元延迟时间进行调整;响应于从属单元同步信号,同步从属时钟;并 且在同步确定的时间测量在从属单元的操作参数。
本发明的另一个方面提供一种用于分布式计算机系统的功率测量的方 法,其包括选择主单元;选择可操作地连接到在总线上的主单元的从属单 元,该从属单元具有从属时钟;确定在主单元和从属单元之间的从属单元延 迟时间;为从属单元确定从属单元同步信号,该从属单元同步信号为从属单 元延迟时间进行调整;响应于从属单元同步信号,同步从属时钟;并且在同 步确定的时间测量在从属单元的功率。
本发明前述的和其它的特征和优点将从连同附图理解的、对如下目前优 选实施例的详细描述中变得更明显。这些详细描述和附图只是用来说明本发 明的,而不是限制由权利要求书及其等价物所限定的本发明的范围。


图1A是分布式计算机系统的实际功率相对时间的图; 图1B是分布式计算机系统的指示功率相对时间的图; 图2是应用根据本发明执行的参数测量的方法的分布式计算机系统的方
框图3是根据本发明执行的、用于分布式计算机系统的参数测量的方法的 流程图4是根据本发明的用于实现分布式计算机系统的参数测量的信息处理 系统的方框图。
具体实施例方式
图2是应用根据本发明执行的参数测量方法的分布式计算机系统的方框
图。在该示例中,分布式计算机系统20包括主单元30,其由总线50可操作 地连接到多个从属单元40。单独的从属单元40也能够通过总线50可操作地 互相连接。因为主单元30在单个的总线50上连接到从属单元40,所以主单 元30每次只能够与多个从属单元40的一个通信。主单元30具有执行指令的 主单元处理器34、存储指令和/或数据的主单元存储器3、以及主时钟38。从 属单元40具有执行指令的从属单元处理器44;存储指令和/或数据的从属单 元存储器46;以及从属时钟48。在一个示例中,分布式计算机系统20包括 要由主单元读取的42个从属单元。
在一个实施例中,分布式计算机系统20是高端SMP服务器系统,并且 主单元30是SMP服务器。从属单元40能够是服务器实体,如处理器核心、 存储器单元、和/或输入/输出设备,其包括能够在单独的从属单元40测量操 作参数的小的微控制器。操作参数的示例包括功率、温度、或任何其它能够 在单独的从属单元40确定的操作参数。在一个实施例中,操作参数用可操作 地连接到单独的从属单元40的传感器(未示出)直接测得。在另一个实施例 中,操作参数通过测量指示如数据流的操作参数的活动,在单独的从属单元 40内间接测得。总线50能够是fC (智能接口控制器)总线,在I2C总线上 的信号符合由飞利浦半导体开发的I2C协议。I2C总线使用串行数据线和串行 时钟线的两种导线,以在连接到导线的设备之间传送信息。为主单元30和从 属单元40提供唯一的地址。主单元30将指令发送到从属单元40,并且从从 属单元40接收数据。本领域的技术人员将理解分布式计算机系统20不局 限于所描述的配置,而能够是具有在总线上通信的分布式单元的任何分布式 计算机系统。例如,总线50能够是适于所要求的通信协议的任何总线,如标 准串行接口 (RS232)、以太网(传输控制协议/因特网协议[TCP/IP])、用户数 据报协议[UDP])、外围组件互连(PCI)等等。
图3是根据本发明执行的、用于分布式计算机系统的参数测量方法的流 程图。方法100包括选择主单元102;选择从属单元104;确定从属单元延 迟时间106;生成从属单元同步信号108;同步从属时钟110;并且在同步确 定的时间测量操作参数112。测量的操作参数能够从从属单元传输到主单元, 用于控制或其它需要的用途。
方法IOO解决从属单元延迟时间,即在从主单元发出信号直到从属单元
接收信号之间的时间延迟。从属单元延迟时间依赖于总线速度和从属单元距 主单元的距离。当各个从属单元距主单元的距离不同时,从属单元延迟时间 对每个从属单元是不同的。方法100解决了允许同步参数测量的从属单元延 迟时间。
选^奪主单元102包括选择主单元作为分布式计算机系统的一部分。如此 处所定义的,分布式计算机系统是其中主单元与一个或更多的从属单元物理 地分离的计算机系统。选择从属单元104包括选择可操作地连接到在总线上 的主单元的从属单元。从属单元具有从属时钟,并且每个从属单元中的从属 时钟能够独立于其它从属单元中的从属时钟而运行。在一个示例中,从属单 元在^C (智能接口控制器)上可操作地连接到主单元。
确定/人属单元延迟时间106包括确定在主单元和从属单元之间的从属单 元延迟时间。为每个从属单元确定从属单元延迟时间,其中对每个从属单元 要测量操作参数。在一个实施例中,从属单元延迟时间通过计算确定,例如, 从属单元的从属单元延迟时间等于从主单元到从属单元的距离乘以在总线中 的信号速度。在另一个实施例中,从属单元延迟时间通过实验确定,例如, 为从主单元传递到从属单元的信号测量时间。
生成从属单元同步信号108包括为从属单元生成从属单元同步信号, 该从属单元同步信号为从属单元延迟时间进行调整。为每个从属单元生成从 属单元同步信号,其中对每个从属单元要测量操作参数。用于特定从属单元 的从属单元同步信号能够是同步时间,所有从属单元被设为该同步时间加上
对于特定从属单元的从属单元延迟时间。同步时间能够匹配主单元中的主时 钟,使得主时钟和从属时钟具有相同的时间。同步从属时钟110包括响应 于从属单元同步信号同步从属时钟。为每个从属单元同步从属时钟,其中对 每个从属单元要测量操作参数。因为从属单元同步信号包括从属单元延迟时 间,该延迟时间说明从属单元同步信号从主单元传递到从属单元的时间,所 以将所有的从属时钟同步成相同的时间。主单元能够通过以由从属单元列表 指定的次序传送从属单元同步信号,依次同步从属单元。
方法100能够在同步确定的时间结束测量操作参数112。因为对从属单 元同步了从属时钟,所以在相同的时间(即同步确定的时间)在所有的从属 单元进行测量。被测量的操作参数能够从从属单元传输到主单元,其中测量 的操作参数能够按照需要使用。使用的一个示例是将测量的操作参数传递到
外部程序。使用的另一个示例是基于测量的操作参数,改变分布式计算机系 统的功率性能状态,如处理器频率。当额外的功率可用时,处理器频率能够 增加,并且当需要减少功率消耗时,处理器频率能够减小。
在同步确定的时间测量操作参数112包括在同步确定时间测量在从属
单元的操作参数。在一个实施例中,操作参数是在从属单元的功率。在另一 个实施例中,操作参数是在从属单元的温度。在另一个实施例中,操作参数 是几个操作参数的混合,既有某些从属单元测量一个参数,如功率,也有其 它从属单元测量一个或更多的操作参数,如温度。测量操作参数能够通过使 用传感器直接测量,或通过测量在从属单元内的指示操作参数的活动而间接 测量。
在同步确定的时间测量操作参数112还能够包括在一系列同步确定的 时间测量操作参数。该系列同步确定的时间能够是特定的时间、或由测量时 间间隔分开的开始时间和随后的时间。在一个实施例中,选择测量时间间隔, 使得在测量时间间隔期间能够进行多次测量,并且各单独的测量取平均值以 提供测量的操作参数。
方法100还能够包括响应于从属单元同步信号,在预定的时间间隔再 次同步从属时钟。在从属单元的从属时钟内的定时晶体(timing crystal)能够 偏移,使得从属时钟的同步性丧失,除非从属时钟被周期性地再次同步。本 领域的专业人员将理解预定的时间间隔的长度依赖于定时晶体的偏移量和 测量的操作参数所要求的精确度。在一个示例中,具有定时晶体偏移为100 jus每秒的分布式计算机系统能够在预定的每10秒的时间间隔被再次同步, 以维持在lms内的同步。在另一个具有两个或更多从属单元的分布式计算机 系统的示例中,每个从属单元具有偏移为100jLlS每秒的定时晶体,系统定时 晶体偏移将会出现的最坏情况是,两个从属单元的定时晶体从主时钟向相反 方向偏移。 一个从属单元的定时晶体能够以lOOps每秒正偏移,而另一个从 属单元的定时晶体能够以100jus每秒负偏移,导致200ms每秒的系统定时 晶体偏移。为在lms内维持同步,时钟能够在预定的每5秒的时间间隔处同 步。
在说明时钟偏移问题的一个示例中,分布式计算机系统包括42个从属 单元具有32个电压调整器模块(VRM,每个核心一个)的16个双核心P6 处理器、以及具有10个VRM的10个存储器DIMM和I/O功率单元的结合
体。来自所有的从属单元的读取需要同步,使得控制算法是有效的。在每个
从属单元的从属时钟内的定时晶体具有百万分之100的精度,具有100jas每 秒的等价偏移。每个从属单元每64ms读取一次,以满足控制回^求,使得 每秒进行大约16次读取。包括对于最坏情况正负偏移的因子二,每次读取的 最坏情况的偏移将是12.8 m s (即,64ms*100ppm*2 )。在每秒16次读取,最 坏情况的每秒偏移将是204.8ms偏移每秒。本领域的技术人员将理解在预 定的时间间隔处的从属时钟再次同步能够用来校正偏移,以确保控制回路功 能性。
图4是根据本发明的、用于为分布式计算机系统实现参数测量的信息处 理系统的方框图。信息处理系统401是能够执行此处描述的操作的计算机系 统的简化示例。信息处理系统401包括处理器400,其耦合到主机总线505。 二级(L2)高速緩冲存储器410也耦合到主机总线505。主机-到-PCI桥415 耦合到主存储器420,包括高速緩冲存储器和主存储器控制功能,并且提供 总线控制以处理在PCI总线425、处理器400、 L2高速緩沖存储器410、主存 储器420、以及主机总线505之间的传输。PCI总线425为多种设备提供接口 , 包括例如LAN卡430和/或视频卡432。视频卡432可操作地连接到显示设备 490,如液晶显示器(LCD)、阴极射线管(CRT)显示器、投影显示器等等。 本领域的技术人员将理解视频卡432能够附于其它类型的总线,如AGP或 PCI极速总线,如特定的应用所需要的。
PCI-到-ISA桥435提供总线控制,以处理在PCI总线425和ISA总线440、 通用串行总线(USB)功能445、 IDE设备功能450、功率管理功能455之间 的传输,并且能够包括其它未示出的功能性元件,如实时时钟(RTC)、 DMA 控制、中断支持、以及系统管理总线支持。外围设备和输入/输出(1/0)设备 能够附于不同的接口 460 (如,并行接口 462、串行接口 464、红外(IR)接 口 466 、键盘接口 468 、鼠标接口 470、以及耦合到ISA总线440的固定盘(HDD ) 472)。可替代地,超I/0控制器(未示出)能够附于ISA总线440,以容纳许 多I/0设备。
BIOS480耦合到ISA总线440,并且合并用于多种低级系统功能和系统 引导功能的必要的处理器可执行编码。能够将BIOS 480存储到任何计算机可 读介质中,包括磁存储介质、光学存储介质、闪存存储器、随机存取存储器、 只读存储器、以及传送编码指令信号(如,来自网络的信号)的通信介质。
为了将信息处理系统401连接到另一个计算机系统,以通过网络复制文件,
将LAN卡430耦合到PCI总线425和PCI-到-ISA桥435。类似地,为将计算 机系统401连接到ISP,以使用电话线连接连接到互联网,将调制解调器475 连接到串行端口 464和PCI-到-ISA桥435。
尽管图4中描述的计算机系统能够执行此处所描述的本发明,但是该计 算机系统只是计算机系统的一个示例。本领域的技术人员将理解许多其它 的计算机系统设计能够执行此处所描述的本发明。
本发明优选实施例之一是应用,即,在代码模块中的一套指令(程序代 码),其可以例如驻留在计算机的随机存取储存器中。直到由计算机请求,该 套指令可以存储到另一个计算机存储器,例如,硬盘驱动器上,或可移动的
存储器如光盘(最终在CD ROM中使用)或软盘(最终在软盘驱动器中使用), 或经由英特网或其它计算机网络下载。因此,本发明可以实现为存储在计算 机可读介质上、并且由执行操作以显示数据的数字处理装置可执行的计算机 程序。另外,虽然所描述的各种方法在由软件选择性地激活或重新配置的通 用计算机中方便地实现,但是本领域的普通技术人员还将认识到这样的方 法可以在硬件、固件、或为执行所需的方法步骤而构建的更加专门的装置中 实现。
尽管此处公开的本发明的实施例目前被认为是优选的,但是可以进行各 种变化和修改而不背离本发明的精神和范围。本发明的范围在权利要求书中 表明,并且在其等价物的含义和范围内出现的所有变化都意图包含在其中。
权利要求
1.一种用于分布式计算机系统的参数测量的方法,该方法包括选择主单元;选择可操作地连接到在总线上的主单元的从属单元,该从属单元具有从属时钟;确定在主单元和从属单元之间的从属单元延迟时间;为从属单元生成从属单元同步信号,该从属单元同步信号为从属单元延迟时间进行调整;响应于从属单元同步信号同步从属时钟;以及在同步确定的时间测量在从属单元的操作参数。
2. 根据权利要求1所述的方法,还包括将测量的操作参数从从属单元传 送到主单元。
3. 根据权利要求2所述的方法,其中测量的操作参数是测量的功率,还 包括响应于测量的功率,在从属单元控制功率。
4. 根据权利要求1所述的方法,还包括响应于从属单元同步信号,在预 定的时间间隔处再次同步从属时钟。
5. 根据权利要求1所述的方法,其中确定在主单元和从属单元之间的从 属单元延迟时间包括通过从由计算和实验组成的组中选择的技术来确定从 属单元延迟时间。
6. 根据权利要求1所述的方法,其中测量操作参数包括 在测量时间间隔期间进行多次操作参数测量;以及将多次操作参数测量取平均值。
7. 根据权利要求1所述的方法,其中主单元是对称多处理SMP服务器, 并且从属单元从组中选择,该组由处理器核心、存储器单元、和输入/输出系 统组成。
8. 根据权利要求1所述的方法,其中总线是fC智能接口控制器总线。
9. 根据权利要求1所述的方法,其中操作参数从由功率和温度组成的组 中选择。
10. —种信息处理系统,其包括 处理器;主单元;可操作地连接到在总线上的主单元的从属单元,该从属单元具有从属时钟;耦合到所述处理器以存储指令的存储器,该指令可由数字处理装置执行, 以执行为分布式计算机系统提供参数测量的操作;该操作包括确定在主单元和从属单元之间的从属单元延迟时间;为从属单元生成从属单元同步信号,该从属单元同步信号为从属单元延 迟时间进行调整;响应于从属单元同步信号,同步从属时钟;以及在同步确定的时间测量在从属单元的操作参数。
11. 根据权利要求IO所述的系统,该操作还包括将测量的操作参数从 从属单元传送到主单元。
12. 根据权利要求11所述的系统,其中测量的操作参数是测量的功率, 并且操作还包括响应于测量的功率,在从属单元控制功率。
13. 根据权利要求IO所述的系统,该操作还包括响应于从属单元同步信 号,在预定的时间间隔处再次同步从属时钟。
14. 根据权利要求IO所述的系统,其中测量操作参数包括 在测量时间间隔期间进行多次梯:作参数测量;以及将多次操作参数测量取平均值。
15. —种用于分布式计算机系统的功率测量的方法,该方法包括 选择主单元;选择可操作地连接到在总线上的主单元的从属单元,该从属单元具有从 属时钟;确定在主单元和从属单元之间的从属单元延迟时间; 为从属单元生成从属单元同步信号,该从属单元同步信号为从属单元延 迟时间进行调整;响应于从属单元同步信号同步从属时钟;以及 在同步确定的时间测量在从属单元的功率。
全文摘要
一种用于分布式计算机系统的参数测量的系统和方法,该方法包括选择主单元;选择可操作地连接到在总线上的主单元的从属单元,该从属单元具有从属时钟;确定在主单元和从属单元之间的从属单元延迟时间;为从属单元生成从属单元同步信号,该从属单元同步信号为从属单元延迟时间进行调整;响应于从属单元同步信号同步从属时钟;以及在同步确定的时间测量在从属单元的操作参数。
文档编号G06F11/34GK101174239SQ20071018116
公开日2008年5月7日 申请日期2007年10月12日 优先权日2006年11月2日
发明者安德烈亚斯·比斯万格, 安德鲁·盖斯勒, 海-扬·麦克里里, 马尔科姆·S·韦尔 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1