用于计算中心中的预测性功率管理的系统和方法_3

文档序号:8926942阅读:来源:国知局
两个繁忙机器。连接状态之间的箭头被标记 为pij,其中i是当前繁忙机器的数目,并且j是潜在未来繁忙机器的数目,使得pij是从i 个繁忙机器转换为j个繁忙机器的概率。例如,p〇〇是从零个繁忙机器(状态430)转换至 零个繁忙机器(状态430)的概率;p01是从零个繁忙机器(状态430)转换至一个繁忙机 器(状态431)的概率;并且pl2是从一个繁忙机器(状态431)转换至两个繁忙机器(状 态432)的概率。这些概率形成马尔科夫链。
[0036] 对于具有n个机器的系统,人们可以通过以规律的时间间隔轮询系统看有多少机 器是繁忙的,来建立数学模型。每个时间间隔的持续时间可以被叫作时间段,其应当比机器 的典型启动时间更长。机器计数的序列bk(在第k个间隔有b个繁忙机器)可以被建模为 具有状态〇, 1,……,n的马尔科夫链,每个状态代表繁忙机器的数目以及表示概率的转换 概率口:!〇_(假定1315=;[,13 15+1=」)。图3示出针对11 = 2的模型。注意,原则上,马尔科夫模 型需要全部(n+1)2个参数的精确估计。然而,实际生产日志的分析揭示了替代例。
[0037] 来自实际生产日志的数据示出转换概率Pij基本上只依赖于从一个时间步到下一 个时间步的繁忙机器的数目差i-j。也就是说,例如,从两个改变到四个繁忙机器的概率大 约与从五个改变至七个的概率相同。代替使用上面描述的马尔科夫模型,人们也可以考虑 差值的序列,称作yk=bk+1-bk,其是-n和n之间的正整数和负整数,包括本数。
[0038] 注意,yk只大约地测量在第k个时间段开始时需要保持闲置的机器的数目,以适应 将会在那个时间段期间到达的新的请求。例如,yk未能考虑在该时间段期间可能变为闲置 的机器(并且因此使所需的新机器的数目产生偏移)。例如,如果我们使一个机器保持闲 置,然后进来需要两个或更多个机器的请求,并且一请求终止,使一机器处于闲置,则yk= 1,但前面两个请求中的一个仍然经历延迟。因此,我们定义在时间段k开始时所需的闲置 机器的数目的相关序列lxk},以无延迟地满足进来的全部请求。注意,Xk彡yk(在之前的示 例中xk= 2),并且在没有机器变为闲置的任意时间段中,xk=yk。序列{xk}具有与上面针 对{yk}描述的相同的自变特性,在我们真实的日志数据中,r2值通常小于0.02,其中r是 在时间段k开始时繁忙机器的序列bk与xk的皮尔逊相关系数。这反映了bk对xk的极小影 响。需要的机器的数目(xk)的自相关结构也相当小--在全部测试实例中的第一次自相关 性小于0. 0002。因此,我们可以将xk视作与随机变量x相同分布的自变样本。
[0039] 给定序列七……xt (在一系列时间段期间需要的机器的数目),在机器的数目xt+1 具有足够的可接受概率的意义上,我们可以识别针对xt+1的置信上限。例如,可以接受的是 具有上至时间段的10%的延迟。然后,我们寻找可以实现的随机变量x的0. 9分位数的界 限(对于给定的置信水平,我们将其取为95% )。为了做到这一点,进行如下:以递增次序 布置\并将它们标记为x⑴;x⑵,……,xw。对于k(0彡k彡t)的每个值,这些值中不超 过k个值小于第90个全域百分位的概率等于二项式分布:
[0040] 求得对于这个和5 0.05的最大k,并且将x(k)用作置信界限。对于较大的样本尺 寸,这个计算可能变得难于处理,在这种情况下,可能合理的是使正态近似诉诸于二项式分 布。所确定的xw将是要保持可用的闲置机器的数目,以便没有延迟地适应进来的请求。
[0041] 为了将每个请求的失败率保持在期望水平,基于所选时间间隔和平均请求到达间 隔的比率对适当的分位数进行插值。例如,插值可以是基于请求遵循泊松过程而到达的假 设的线性化。虽然未必完全真实,但这个假设可以作为充分逼近。因此,如果我们想要不超 过10%请求被延迟,则我们可以选择{xk}的第99个百分位,而不是第90个百分位。适当 地选择第99个百分位反映出对于每一个成功的请求需要十个成功的时间段。
[0042] 图5是示出用于预测所需机器的数目的示例方法500的流程图。示例方法500使 用可调参数T和m,其中T是用于设定轮询间隔的时间段的时间值,并且m是延迟可以被容 忍的请求的百分比。在步骤510,我们求得在第一时间段开始时繁忙机器的数目h,在第二 时间段开始时繁忙机器的数目b2,以此类推,直到到达最近的时间段边界。在步骤520,我 们求得在第一时间段中的任意时间繁忙机器的最大值减去h的差值(x^,并且类似地求 得(x2),以此类推。在步骤530,我们计算实例请求之间的全部到达间隔,并求得请求之间 的平均时间M。在步骤540,我们使用二项式方法或正态近似求得全部可能的\的全域的 (100-(mT/M)百分位上的95%置信上限。在步骤550,在一时间段开始时,我们使用置信界 限的整数上限来确定有多少机器应当为可用(虽然闲置),以适应预期的进来的请求。这些 步骤可以例如由控制器140实施。控制器140可以记录针对新的虚拟机150的每个请求, 记录请求开始时间,托管新虚拟机150的物理机器130以及虚拟机150被终止时的结束时 间。
[0043] 在步骤510,控制器140求得在时间段t开始时繁忙的物理服务器130的数目 (bt)。例如,使用图3的图,在于时间2处开始的时间段,五个主机服务器是繁忙的(虽然 在时间3处只有四个主机服务器是繁忙的)。在一些实施方式中,控制器140以标记每个时 间段开始的规律间隔轮询物理主机150。在一些实施方式中,控制器140记录每个请求并跟 踪在每个时间段开始时哪些物理服务器150是繁忙的。
[0044] 在步骤520,控制器140求得在每个时间段中的任意时间繁忙机器的最大数目减 去在相应时间段开始时繁忙的物理服务器130的数目(b)的差值。也就是说,控制器140识 别每个时间段中的峰值使用水平,并确定在每个时间段开始时初始使用与该时间段的峰值 使用之间的增量。再次参见图3,假设时间段是四个时间单位。第一时间段在时间0处开始 并在时间4处结束,第二时间段开始于时间4,以此类推。在第一时间段开始时(在时间0) 处于使用中的主机的数目是三,但是到时间2,数目上升至五。因此,增量是另外的两个服务 器。注意,到时间段结束时,非闲置主机服务器的数目返回至三。在一些实施方式中,控制 器140在时间段内以规律的间隔轮询物理主机150以确定非闲置物理主机的数目。在一些 实施方式中,控制器140记录每个请求,并确定在每个时间段内繁忙的物理服务器150的最 大数目。在一些实施方式中,控制器140维护针对每个时间段的增量值的排序列表L(也就 是说,针对每个时间段,繁忙服务器的初始数目和繁忙服务器的最大数目之间的增量)。
[0045] 在步骤530,控制器140计算实例请求之间的到达间隔的平均值M。因此,M是请求 之间的平均时间。在一些实施方式中,平均值M从固定初始时间开始被维持。在一些实施 方式中,平均值M基于最近的请求而计算,例如只使用最近1000个请求的到达时间。在一 些实施方式中,平均值M基于最近的时间段内到达的请求而计算,例如只使用在最近二十 个时间段(或者在最后的几个小时中,这可以等效于最后的二十个3分钟时间段)中到达 的请求的到达时间。
[0046] 在步骤540,控制器140使用二项式方法或正态近似求得全部可能的\的全域的
百分位--或者如果T>M,则(100-m)百分位--上的95%置信上限,如 上所述。例如,在第t个时间段结束时,使用二项式分布的概率质量函数:
[0047] (i)如果T〈M,即可能存在没有请求的时间段,则求得最大总数k,以使:
[0048] (ii)如果T>M,即时间段的时间长度比请求之间的平均时间大,则求得最大总数 k,以使:
[0049] 使用在步骤520中维护的针对每个时间段的增量值的排序列表L,L的第k个最小 元素针对不同x的序列的最大
百分位给出95%的置信上限B。
[0050] 在步骤550,在时间段t+1开始时,我们使用如步骤540中求得的去整成最接近的 整数的置信界限,来确定有多少机器应当为可用(虽然闲置),以适应预期的进来的请求。 例如,置信界限B表示要被开启的机器的数目,虽然在新的时间段开始时是闲置的。在一些 实施方式中,要开启的机器的数目减去目前闲置的机器的数目。
[0051] 在一些实施方式中,所描述的预测可以被并入用于预测性功率管理的监控系统 中。
[0052] 图6是示出用于预测性功率管理的方法的流程图。在步骤610,监控系统(例如, 控制器140可以以监控容量行动)在多个周期性间隔期间监控多处理器计算环境中的一个 或多个处理器的使用,其中每个周期性间隔具有多个活动繁忙处理器和多个活动闲置处理 器。在步骤620,监控系统针对每个周期性间隔确定表示在相应的间隔期间活动繁忙处理 器的数目的改变的增量值。在步骤630,监控系统维护处理器使用改变的排序列表。在步 骤640,监控系统确定后续间隔的预测增量值。在步骤650,监控系统促使多个处理器在非 活动状态和活动闲置状态之间转换,其中转换的处理器的数目基于预测增量值。
[0053] 在步骤610,监控系统在多个周期性间隔期间监控多处理器计算环境中的一个或 多个处理器的使用,其中每个周期性间隔具有多个活动繁忙处理器和多个活动闲置处理 器。在一些实施方式中,监控包括至少观察每个周期性间隔的活动繁忙处理器的初始数目, 以及观察在每个周期性间隔期间的任一个时刻活动繁忙处理器的最大数目。如果处理器没 有大量任务并可用于没有延迟地满足请求,则该处理器被认为是活动闲置处理器,该延迟 例如是由从低功率
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1