本发明涉及数据中心系统工程技术领域,特别是涉及一种数据中心成本优化方法。
背景技术:
随着信息化社会和互联网经济的发展,语音、数据、视频等多网融合应用日益增加,电子商务市场蓬勃发展,企业内部信息应用系统外包,加上3g和智能终端引发的新一轮移动互联网投资热潮等,都促进了对数据中心的市场需求。然而数据中心的运营成本很难描述,它很大程度取决于运营标准(在同一时间有多少保安执勤,发电机多长时间检测一次)和数据中心的规模。成本还受物理位置(气候,税收和工资水平等)以及设计和寿命的影响。服务器还有运营成本。除基础设施本身运营成本,还需关注硬件维护和维修,以及电力成本。
近年来,随着数据中心电力需求的剧烈增长以及能源价格的上升,数据中心的成本持续增加,并且增长速度急剧上升。有研究调查指出,全球范围内数据中心的电力成本已经超过了硬件、维护等其他成本。因此,如何降低数据中心电力成本成为了人们关注的焦点。同时,随着智能电网等相关领域的发展,动态电价机制开始逐渐被电网所采用。考虑到传统数据中心的供电模式通常为“市电直供+240v高压直流”的供电架构,因此没有现成的储能装置以做调度,数据中心的运行成本也随着电价的波动而波动。这也意味着配电网电价高则数据中心的运行成本也高,当电价低时,数据中心的运行成本也随之降低。
技术实现要素:
本发明所要解决的技术问题是提供一种数据中心成本优化方法,能够降低数据中心的电力成本。
本发明解决其技术问题所采用的技术方案是:提供一种数据中心成本优化方法,包括以下步骤:
(1)对当地电价及电力成本进行建模,确定优化目标和约束,将可延迟负载调至电价低时运行;
(2)利用李雅普诺夫优化方法,确定储能装置与数据中心之间交换的能量值和负荷的延迟时间,并得出优化后的成本;
(3)针对服务器成本优化问题,利用马尔科夫决策过程动态调整服务器运行与休眠状态,从而降低服务器运行的成本。
所述步骤(1)具体包括以下子步骤:
(11)引进实时电价,将电价设为p(t);
(12)统计过去时间内每天δt时间段负载,然后求其平均值;
(13)用集合nt表示时间点t时到达的任务,用nt表示nt中的任务数量;
(14)将负荷分为可延迟负荷和不可延迟负荷两种,设每个负荷的延迟时间为sit,对于不可延迟负载令其延迟时间sit=0,假设dmax为所有任务的最大延迟时间,即
(15)设h(t)为时间点t时所收集的可再生能源,r(t)为实际存储于电池中的可再生能量,在系统中,采集的可再生能源应大于存储在电池中的可再生能量,设数据中心在时间点t时的负载能量需求为l(t),并假设每个任务i∈nt消耗的能量为一个常量
(16)从外部电网获得能量g(t),电池使用量为b(t),则有供能关系l(t)=g(t)+b(t);当电池从电网充电时,b(t)<0;当电池只向负载放电时,0<b(t)≤l(t);当电池向电网放电时,b(t)>l(t),由以上关系得出储能装置状态的动态方程:b(t+1)=b(t)+r(t)-b(t);
(17)确定每个时间点的
所述步骤(2)包括以下子步骤:
(21)根据步骤(1)得到的模型,得出成本最小化问题:
(22)利用李雅普诺夫优化计算步骤(21)目标函数得到最小成本,并得出优化后的可再生能量r*(t),任务i(i∈nt)的延迟时间
所述步骤(22)包括:
根据数据中心模型构建虚拟队列,各个可延迟负荷的延迟时间给任务队列造成的影响归为一个辅助的虚拟队列q(t);
利用李雅普诺夫最优化理论,基于虚拟队列q(t)和电池队列(b(t)-θ),构建利亚普诺夫函数:
将相邻两个时隙的李雅普诺夫函数相减得到李雅普诺夫飘移,在每个时隙通过控制决策贪婪的最小化漂移-效用函数的值,得到
通过最小化步骤三中式子的右边部分,求解得出在每个时间点t优化的电池存储的可再生能量r*(t),任务i(i∈nt)的延迟时间
所述步骤(3)具体包括以下子步骤:
(31)根据系统的随机性,建立一个用于刻画系统动态行为的模型;
(32)以得到的模型为基础,研究影响系统的参数与服务质量和系统稳定性之间的关系;
(33)根据得到的关系对目标进行优化,给出最佳的系统参数或调度策略。
有益效果
由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明利用了可延迟负荷与动态电价的特性,并提出了最大延迟约束和平均延迟约束的观点。引用李雅普诺夫优化方法来解决电力成本最小化问题,通过调节参数来达到系统稳定性与成本优化的平衡,并将问题转化为减少李雅普诺夫漂移。通过构建马尔科夫决策过程的方法以及服务器工作与休眠状态的特性;动态调整服务器的状态,进而降低服务器成本。
附图说明
图1是三状态、两行动的马尔科夫决策过程示意图;
图2是实验数据的仿真结果图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明的实施方式涉及一种数据中心成本优化方法,包括以下步骤:
(1)对当地电价及电力成本进行建模,确定优化目标和约束,将可延迟负载调至电价低时运行。该步骤具体包括:
(11)引进实时电价,将电价设为p(t);
(12)统计过去时间内每天δt时间段负载,然后求其平均值λ1,λ2,λ3,λ4…;
(13)用集合nt表示时间点t时到达的任务,用nt表示nt中的任务数量;
(14)将负荷分为可延迟负荷和不可延迟负荷两种,设每个负荷的延迟时间为sit,对于不可延迟负载令其延迟时间sit=0,假设dmax为所有任务的最大延迟时间,即
(15)设h(t)为时间点t时所收集的可再生能源,r(t)为实际存储于电池中的可再生能量,在系统中,采集的可再生能源应大于存储在电池中的可再生能量,设数据中心在时间点t时的负载能量需求为l(t),并假设每个任务i∈nt消耗的能量为一个常量
(16)从外部电网获得能量g(t),电池使用量为b(t),则有供能关系l(t)=g(t)+b(t);在本发明中电池既可以从电网充电,为数据中心提供能量,也可以向电网放电。所以b(t)可以总结为以下三种情况:当电池从电网充电时,b(t)<0;当电池只向负载放电时,0<b(t)≤l(t);当电池向电网放电时,b(t)>l(t),由以上关系得出储能装置状态的动态方程:b(t+1)=b(t)+r(t)-b(t);
(17)确定每个时间点的
(2)利用李雅普诺夫优化方法,确定储能装置与数据中心之间交换的能量值和负荷的延迟时间,并得出优化后的成本。具体为:
(21)为了给由延迟时间造成的影响一个衡量标准,将其作为一个凸优化问题解决;
(22)根据步骤(1)得到的模型,得出成本最小化问题:
(23)利用李雅普诺夫优化计算上述目标函数得到最小成本,并得出优化后的可再生能量r*(t),任务i(i∈nt)的延迟时间
根据数据中心模型构建虚拟队列,各个可延迟负荷的延迟时间给任务队列造成的影响归为一个辅助的虚拟队列q(t);
利用李雅普诺夫最优化理论,基于虚拟队列q(t)和电池队列(b(t)-θ),构建利亚普诺夫函数:
将相邻两个时隙的李雅普诺夫函数相减得到李雅普诺夫飘移,在每个时隙通过控制决策贪婪的最小化漂移-效用函数的值,得到
通过最小化步骤三中式子的右边部分,求解得出在每个时间点t优化的电池存储的可再生能量r*(t),任务i(i∈nt)的延迟时间
(3)针对服务器成本优化问题,利用马尔科夫决策过程动态调整服务器运行与休眠状态,从而降低服务器运行的成本。具体地说,根据系统的随机性,建立一个用于刻画系统动态行为的模型;以得到的模型为基础,研究影响系统的参数与服务质量和系统稳定性之间的关系;根据得到的关系对目标进行优化,给出最佳的系统参数或调度策略。
马尔科夫决策过程具体如下:
根据系统模型得出服务器决策问题的状态集
假设数据中心得假设数据中心的服务器群状态x∈x,x={x0,x1,x2,…}。服务器群的状态应有负载和处于工作状态的服务器两者决定,所以定义x为一个二元组:x=<l,m〉,其中l代表队列中的负载,m代表处于运行状态的服务器数量,定义lmax和mmax分别为允许的最大负载和最大运行服务器数量。则应有0≤l≤lmax,0≤m≤mmax。注意以上变量均为正整数。
据系统模型得出服务器决策问题的行为集;
假设数据中心的服务器群的某一行动为a∈a。服务器行动即为改变工作状态的服务器状态,所以定义a为:a=mchange。当a>0时表示有mchange台服务器进入工作状态;a<0时表示有|mchange|台服务器进入休眠状态;a=0时表示服务器群状态不发生改变。且mchange∈{-m,-(m-1),....,0,1.....,(mmax-m)}。显然,mchange的取值与当前服务器群状态s密切相关,即a=a(x)。在采取行动时,每一种行动的发生概率应该是相等的。即:
据系统模型得出服务器决策问题的状态转移概率;
根据状态集和行为集可以得出状态转移条件概率ψ(xt+1|xt,at):
图1是一个三状态、两行动的马尔科夫决策过程示意图。从图中可以知道:行动的选择具有概率性;从图中ψ(xt+1|xt,at)≠1可知,即使选择某一行动,系统从某一状态转移到另一个状态也不是肯定的换句话说,系统的状态变换也具有概率性。
以上两个性质说明了状态转移概率是一个大小为|x|×|x|×|a|的三元矩阵其中,|x|,|a|分别代表状态集与行动集的大小。
据系统模型得出服务器决策问题的优化目标函数;
当采取行动a=mchange时,数据中心的服务器群由状态xt=<lt,mt>向状态xt+1=<lt+1,mt+1>转变所产生的成本为:c(xt+1|xt,at),从而得出某一时刻的成本函数:c(xt,at);和成本的总期望
采用线性规划来解决成本优化问题,得到最终结果。
注意,因为本文中的目标函数是成本,所以应在原来基础上加入一个折扣因子γ(0≤γ≤1),带有折扣因子的马尔科夫决策过程依照时间的推移对未来所得收益进行逐步折扣,可以保证总收益的收敛性,不会使得收益变为无穷大。
据系统模型得出服务器决策问题的约束条件;
对于每一个网络负载,都需要经过请求服务,然后进入队列等待服务,接受服务后离开这一过程。所以,对于一个数据中心,其对负载的响应时间是衡量服务质量好坏的重要标准,将其作为约束条件加入模型中。
利用线性优化理论对步骤一到五描述的问题,求出状态xt下采取行动at的概率为f(at),其取值只能为0或1。
运用上述方法进行了仿真实验,仿真实验中用到的真实数据来自于加利福尼亚终端用户商业调查的报告(californiacommercialend-usesurvey(ceus))。采取了2002年7月16日-2002年7月22日一个星期的数据。在实验仿真中,可延迟负荷的到达都视为泊松过程。其参数λ1为100。单位不可延迟负荷与可延迟负荷的功耗设为5kw。另外,设数据中心内有服务器50台,每台服务器工作时功耗为100w,休眠时功耗为40w。仿真结果见图2。
不难发现,本发明考虑可延迟负荷及可再生能源的任务调度算法和数据中心服务器电力成本优化算法。任务调度算法中,将网络负荷分为可延迟负荷与不可延迟负荷两种,利用可延迟负荷的特性,将高电价时的可延迟负荷调动到电价低时运行。在这个基础上加入储能装置,储能装置能将收集的可再生能源储存。且为了能充分地利用储能装置,储能装置中的能量不仅可以用于负载,还可以卖给电网。服务器优化算法中,通过建立马尔科夫决策过程,动态调整服务器运行状态,以获得进一步的成本降低。相较之于常规方法,本方法将数据中心的运行成本降低了26.1%。