面向智慧城轨的云计算平台资源管理系统及动态分配方法与流程

文档序号:33643652发布日期:2023-03-29 02:50阅读:42来源:国知局
面向智慧城轨的云计算平台资源管理系统及动态分配方法与流程

1.本发明涉及智慧城市轨道交通领域,特别涉及一种面向智慧城轨的云计算平台资源管理系统及动态分配方法。


背景技术:

2.随着城市轨道交通不断增加的运营里程、快速攀升的线网流量,城市轨道交通的乘运安全和运营管理面临着巨大的压力和挑战。作为信息技术创新服务模式的集中体现,云计算能够为智慧城轨建设与应用提供了新的思路和方法。依托资源独占性、安全性、弹性扩容的优势,智慧城轨云平台将拥有全域的资源统一调配和管理能力,能够承载和满足城轨生产运营核心业务的高负载、高级别安全、高业务连续性的运行要求,为运营生产管理的持续迭代优化及新建线路的延续服务提供良好的支撑。另外,由于城轨云资源具有动态性、异构性、大规模性等特点,如何根据云计算的实际特点制定合适的资源分配策略是目前城轨云平台尚需解决的问题。
3.当前云数据中心的资源调度大多沿袭传统方法,较为简单化,难以满足智慧城轨云平台的需求。基本的负载均衡一般都是静态的负载均衡策略,这些算法仅考虑在任务分配之前就确定好方案或者决策,这个预先设定好的方案只考虑了当前节点的负载情况,不会随着负载的变化而使用不用的策略。动态负载均衡算法考虑到了节点的能力和网络带宽等不同属性。多数动态均衡算法都依赖于云节点的先前信息收集和运行作业的节点的运行时属性的收集,这些算法基于收集的节点信息和运行状态来分配和重分配任务,但现有技术仍不能有效地解决系统负载不均衡导致的资源浪费和系统瓶颈等问题。针对上述缺陷,本发明作出了改进。


技术实现要素:

4.为了克服背景技术的不足,本发明提供一种面向智慧城轨的云计算平台资源管理系统,其基于模型预测控制框架能实现城轨云业务资源按需分配、实时动态调整,可更好地满足实际需求。
5.本发明提供一种面向智慧城轨的云计算平台资源管理系统,包括云平台目标系统和模型预测控制器;
6.所述云平台目标系统为相应的城轨业务提供计算、存储和网络资源,云平台目标系统将各个城轨业务划分成众多任务块,并给每个任务块分配虚拟机来执行该任务,云平台目标系统实时采集全局资源状态信息并将其输出到模型预测控制器,所述全局资源状态信息包括云平台中所有承载城轨业务虚拟机的当前资源状态和任务请求响应时间,云平台目标系统还接收并执行所述模型预测控制器输出的下一时刻虚拟机资源分配策略,调整为各个任务块分配的虚拟机数量,虚拟机继续执行被分配到的任务;
7.所述模型预测控制器用于实时接收所述云平台目标系统输出的全局资源状态信息,并实时计算预测云上虚拟机任务的资源需求,得到下一时刻的虚拟机资源分配策略并
将其输出至所述云平台目标系统。
8.优选的,所述全局资源状态信息还包括云平台受到的外界干扰流量信息,所述云平台目标系统实时将当前虚拟机资源状态、任务请求响应时间和外界干扰流量信息输出到所述模型预测控制器。
9.优选的,所述云平台目标系统包括云上管理系统、物理服务器及物理服务器上承载城轨业务的多个虚拟机,所述云上管理系统用于接收所述模型预测控制器输出的下一时刻虚拟机资源分配策略,并执行该策略实现云上资源调度,所述物理服务器为所述虚拟机的载体,物理服务器用于为不同城轨业务所在虚拟机提供计算、存储和网络资源。
10.本发明还提供一种面向智慧城轨的云计算平台资源动态分配方法,包括以下步骤:
11.s1、云平台目标系统接收云服务请求;
12.s2、云平台目标系统依据云服务请求调度分配资源,创建虚拟机资源池,云平台目标系统将云服务请求中的各个城轨业务划分成多个任务块,并给每个任务块分配虚拟机来执行该任务;
13.s3、云平台目标系统实时采集全局资源状态信息并将其输出到模型预测控制器;
14.s4、模型预测控制器实时接收云平台目标系统输出的全局资源状态信息,并实时计算预测云上虚拟机任务的资源需求,得到下一时刻的虚拟机资源分配策略并将其输出至云平台目标系统;
15.s5、云平台目标系统执行所述资源分配策略,调整为各个任务块分配的虚拟机数量,虚拟机继续执行被分配到的任务;
16.s6、循环执行s3-s5,直到各个虚拟机中的任务被执行完毕。
17.优选的,步骤s4具体包括:
18.构建描述云平台目标系统随时间完整变化的状态空间模型,所述状态空间模型包括离散状态方程和输出方程,模型预测控制器实时接收云平台目标系统输出的全局资源状态信息,并通过所述离散状态方程实时计算预测云上虚拟机任务的资源需求;
19.根据状态空间模型的构建过程,模型预测控制器的控制目标可以设置为将最小的资源数量分配给虚拟机,以完成某个特定城轨业务的任务,与此同时,要求任务请求响应时间低于某个阈值,即保证服务水平,依据模型预测控制器的控制目标构建最优控制方程并求解得到下一时刻的虚拟机资源分配策略。
20.优选的,所述全局资源状态信息包括云平台中所有承载城轨业务虚拟机的当前资源状态和任务请求响应时间,将云平台上所有虚拟机的cpu利用率表示为cpu
i(t)
,状态变量cpu
i(t)
反映了云平台中所有承载城轨业务虚拟机的当前资源状态,将各个虚拟机的任务请求响应时间表示为res
i(t)
,状态变量res
i(t)
反映了虚拟机的服务质量指标,其中i表示为第i个虚拟机,t表示为某个瞬时采样时刻。
21.优选的,所述全局资源状态信息还包括云平台受到的外界干扰流量信息,定义状态向量x(t)=[cpu
(t) res
(t)
]
t
来表示cpu
i(t)
和res
i(t)
这两个状态变量的集合,定义w(t)来表示t采样时刻外部其他业务对于虚拟机资源的请求率,w(t)即云平台受到的外界干扰流量信息,定义u(t)来表示当前正在工作的虚拟机数量,u(t)作为输入状态变量,定义输出变量y(t)来表示各个虚拟机完成整个任务的响应时间,用以反映资源分配的效果,则整个系
统的离散状态方程和输出方程分别表示为:
[0022][0023]
y(t)=[c
11 c
22
]x(t)
[0024]
其中,状态矩阵、输入矩阵、外部干扰矩阵和输出矩阵分别表示为a、b、e和c,矩阵中的所有元素a
ij
、b
ij
、e
ij
和c
ij
满足i,j∈{1,2}。
[0025]
优选的,基于所述离散状态方程和输出方程,可得模型预测控制器的最优控制方程为:
[0026][0027]umin
≤ui≤u
max
[0028]ymin
≤cxi≤y
max
[0029]
其中,xi代表第i个采样时刻下系统的预测资源状态,也即云上虚拟机任务的资源需求,当i=0时,x0代表系统的初始资源状态;x
i,ref
是在第i个采样时刻资源状态的参考值;ui是i时刻下的控制输入;u
i,ref
是i时刻下的控制输入的参考值;x
t
是最后一个采样时刻下的系统的资源状态;x
t,ref
是最后一个采样时刻下系统的资源状态的参考值;q
x
、qu和q
t
分别是i时刻下系统状态矩阵、系统输入矩阵和系统最终状态的矩阵;所述模型预测控制器通过求解最优控制方程得出ui序列,ui序列包括未来多个时刻的虚拟机资源分配策略,模型预测控制器仅将下一时刻的虚拟机资源分配策略输出至所述云平台目标系统。
[0030]
优选的,采用long short term memory神经网络来预测得到x
i,ref
、u
i,ref
和x
t,ref
,将虚拟机的cpu利用率cpu
i(t)
和任务请求响应时间res
i(t)
分别输入到long short term memory神经网络即可进行预测。
[0031]
本发明还提供一种电子设备,包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现上文任一项所述的面向智慧城轨的云计算平台资源动态分配方法。
[0032]
综上所述,本发明有益效果为:
[0033]
1.面向智慧城轨的云计算平台资源管理系统由模型预测控制器和云平台目标系统两部分组成,能分别实现云上资源实时预测及分配功能,可有效地解决系统负载不均衡导致的资源浪费和系统瓶颈等问题;
[0034]
2.模型预测控制器通过对复杂的城轨云环境进行建模、对云上业务在线反复优化,以提高资源预测精度;
[0035]
3.系统中的云平台目标系统能够向模型预测控制器输出当前云上全局资源状态信息,并考虑云平台外部轨道交通业务流量的干扰因素,提高了整个系统的鲁棒性和稳定性。
[0036]
下面结合附图对本发明作进一步说明。
附图说明
[0037]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0038]
图1为本发明基于mpc的云计算平台资源管理系统的一种示意图;
[0039]
图2为本发明云计算平台资源管理系统实现资源调度分配及资源控制的一种示意图;
[0040]
图3为本发明云计算平台资源动态分配方法的一种流程示意图。
具体实施方式
[0041]
下面将结合本发明实施例中的图1至图3,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0042]
为使本发明实施的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行更加详细的描述。
[0043]
城轨云平台的负载均衡和最小化数据中心运营成本是智慧城轨云环境下的资源调度面临的性能优化和成本控制的两大关键问题,针对系统负载不均衡导致的资源浪费和系统瓶颈等问题,本发明提出了面向智慧城轨的云计算平台资源管理系统及动态分配方法,下面做进一步说明。
[0044]
如图1至图3所示,本实施例公开的一种面向智慧城轨的云计算平台资源管理系统,由模型预测控制器和云平台目标系统两部分组成,分别实现云上资源实时预测及分配功能,该云计算平台资源管理系统基于模型预测控制(model predictive control,mpc)框架能实现城轨云业务资源按需分配、实时动态调整,可更好地满足实际需求。
[0045]
云平台目标系统为相应的城轨业务提供计算、存储和网络资源,云平台目标系统将各个城轨业务划分成众多任务块,并给每个任务块分配虚拟机来执行该任务,从而使云上业务能够对外提供特定功能。
[0046]
云平台目标系统实时采集全局资源状态信息并将其输出到模型预测控制器,全局资源状态信息包括云平台中所有承载城轨业务虚拟机的当前资源状态和任务请求响应时间,虚拟机的当前资源状态反映了资源使用状况,虚拟机的任务请求响应时间反映了服务质量,优选的,全局资源状态信息还包括云平台受到的外界干扰流量信息。在本实施例中,全局资源状态信息只包括当前虚拟机资源状态和任务请求响应时间就可以进行计算预测,外界干扰流量信息相当于输出的噪声,是假设云平台还会受到非指定用户业务的资源请求干扰,全局资源状态信息还包括外界干扰流量信息是为了能够更接近云上的真实情况,使得资源计算预测效果更加精确。
[0047]
云平台目标系统实时将当前虚拟机资源状态、任务请求响应时间和外界干扰流量信息作为全局资源状态信息输出到模型预测控制器,模型预测控制器用于接收云平台中业务的资源需求和状态作为输入,将下一时刻的资源分配策略作为控制器的输出,具体地,模
型预测控制器实时接收云平台目标系统输出的全局资源状态信息,并实时计算预测云上虚拟机任务的资源需求,得到下一时刻的虚拟机资源分配策略并将其输出至云平台目标系统;云平台目标系统接收并执行模型预测控制器输出的下一时刻虚拟机资源分配策略,调整为各个任务块分配的虚拟机数量,虚拟机继续执行被分配到的任务。
[0048]
作为优选的一种技术方案,云平台目标系统由云上管理系统、物理服务器及服务器上承载城轨业务的众多虚拟机构成,云上管理系统用于接收模型预测控制器输出的下一时刻虚拟机资源分配策略,并执行该策略实现云上资源调度,云平台中物理服务器作为虚拟机的载体,用于为不同城轨业务所在虚拟机提供计算、网络、存储等资源,保证城轨业务能够在保证用户服务质量(quality ofservice,qos)的情况下,对外提供相应的服务。
[0049]
基于同一发明构思,本发明还提供一种面向智慧城轨的云计算平台资源动态分配方法,该方法基于模型预测控制(model predictive control,mpc)框架实现城轨云业务资源按需分配、实时动态调整的能力,该方法包括以下步骤:
[0050]
s1、云平台目标系统接收云服务请求;
[0051]
在该步骤中,用户/系统向云上管理系统(即云管平台)发出云服务请求,这里的用户/系统发出的云服务请求为指定用户业务的资源请求,其区别于外界干扰流量信息,外界干扰流量信息为噪声,是云平台受到的非指定用户业务的资源请求干扰。
[0052]
s2、云平台目标系统依据云服务请求调度分配资源,创建虚拟机资源池,云平台目标系统将云服务请求中的各个城轨业务划分成多个任务块,并给每个任务块分配虚拟机来执行该任务;
[0053]
在该步骤中,云上管理系统依据云服务请求来实现资源调度与分配,使物理服务器创建虚拟机资源池。
[0054]
s3、云平台目标系统实时采集全局资源状态信息并将其输出到模型预测控制器;
[0055]
s4、模型预测控制器实时接收云平台目标系统输出的全局资源状态信息,并实时计算预测云上虚拟机任务的资源需求,得到下一时刻的虚拟机资源分配策略并将其输出至云平台目标系统;
[0056]
s5、云平台目标系统执行资源分配策略,调整为各个任务块分配的虚拟机数量,虚拟机继续执行被分配到的任务;
[0057]
s6、循环执行s3-s5,直到各个虚拟机中的任务被执行完毕。
[0058]
上述云计算平台资源动态分配方法基于前述的云计算平台资源管理系统,该方法为基于模型预测控制应用框架的智慧城市轨道交通云计算资源动态调整方法,使用该方法为城市轨道交通云平台中的业务分配云计算资源,能够更好地解决城轨云中资源分配不合理及负载分布不均的问题,在保证云上业务qos的同时,提高城轨云平台中的资源利用率,同时,使用该方法在满足业务执行延迟时间限制的条件下,能够应对云平台一段时间内出现负载激增及干扰输入的情况,保证城市轨道交通系统正常工作,并进一步提高云上轨道交通系统业务的实时性。
[0059]
作为优选的一种技术方案,步骤s4具体包括:
[0060]
构建描述云平台目标系统随时间完整变化的状态空间模型,状态空间模型包括离散状态方程和输出方程,模型预测控制器实时接收云平台目标系统输出的全局资源状态信息,并通过离散状态方程实时计算预测云上虚拟机任务的资源需求;
[0061]
根据状态空间模型的构建过程,模型预测控制器的控制目标可以设置为将最小的资源数量分配给虚拟机,以完成某个特定城轨业务的任务,与此同时,要求任务请求响应时间低于某个阈值,即保证服务水平,依据模型预测控制器的控制目标构建最优控制方程并求解得到下一时刻的虚拟机资源分配策略。
[0062]
下面对该过程做进一步的具体说明。
[0063]
先根据历史测算收集到的信息构建描述云平台目标系统随时间完整变化的状态空间模型,状态空间模型包括离散状态方程和输出方程。
[0064]
首先,将云平台上所有虚拟机的cpu利用率表示为cpu
i(t)
,该状态变量反映了当前时刻各个虚拟机资源的使用情况,同时,用res
i(t)
表示各个虚拟机的请求响应时间,该状态变量反映了虚拟机的服务质量指标,其中i表示为第i个虚拟机,t表示为某个瞬时采样时刻。每个采样时刻就是一个时间点,这个时间点或者说是时间间隔的粒度是可以人为设定的。
[0065]
之后,用状态向量x(t)=[cpu
(t) res
(t)
]
t
表示这两个状态变量的集合,用w(t)表示t采样时刻外部其他业务对于虚拟机资源的请求率,该指标体现了外部干扰输入对于云平台目标系统的影响,接着定义u(t)用来表示当前正在工作的虚拟机数量,u(t)为输入状态变量并作为输入控制。输出变量y(t)是各个虚拟机完成整个任务的响应时间,用以反映资源分配的效果。因此,对于云平台目标系统来说,整个系统的离散状态方程和输出方程可以表示为:
[0066][0067]
y(t)=[c
11 c
22
]x(t)
[0068]
在上述公式中,状态矩阵、输入矩阵、外部干扰矩阵和输出矩阵分别表示为a、b、e和c,矩阵中的所有元素a
ij
、b
ij
、e
ij
和cij满足i,j∈{1,2}。上述公式里的矩阵参数要依据实际系统进行确定,系统情况不一矩阵参数也会有所区别,对于该类系统一般先假定一个值,然后再依据实际情况进行调整。
[0069]
w(t)表示t采样时刻外部其他业务对于虚拟机资源的请求率,由于云管平台当前时刻资源状态是已知的,且云管平台已知当前业务的情况,例如服务名称、服务id等,因而可知外部业务对云平台目标系统的影响。资源分配的目标是为了让云管平台完成整个任务的响应时间尽量少,不同的资源分配方法会导致对任务的不同处理情况,也就会影响整体任务的处理时间,因此可以采用输出变量y(t)来反映资源分配效果,y(t)可以理解为希望得到的业务性能指标,取决于当前资源分配状态,当前资源状态由res和cpu组成。
[0070]
上述的离散状态方程是以某个时刻来进行虚拟机指标采样的,不同的时刻构成了一个时间序列,是离散的,同时每个时间点的虚拟机指标都受之前时刻虚拟机指标与输入控制的影响,还考虑了外部干扰输入对于云平台目标系统的影响。
[0071]
上述输出方程中的y(t)代表各个虚拟机完成整个任务的响应时间,是一项能够反应资源分配效果的指标,反映了用户虚拟机业务中的qos(用户服务质量)指标。
[0072]
在该系统中,我们假定虚拟机的cpu利用率不高于80%不少于40%为适当水平,超过该范围则视作违反sla。具体地,虚拟机cpu利用率=cpui/cpu
total
,如果选用cpui作为限定条件,则可以表示为:cpui=cpu利用率*cpu
total
,因此本实施例中虚拟机cpu利用率的要
求范围可以表示为:40%*cpu
total
<=cpui<=80%*cpu
total

[0073]
另外,我们假设当w(t)大于某个阈值的时候,即外部对于虚拟机资源的请求速率过大时,会对城轨业务资源分配造成较大影响,可能无法使用指定的最大虚拟机数量来处理城轨业务的请求。
[0074]
根据上述状态空间模型的建模过程,mpc控制器的控制目标可以设置为将最小的资源数量分配给虚拟机,以完成某个特定业务的任务,与此同时,要求任务的响应时间低于某个阈值,即保证服务水平,因此mpc框架的最优控制问题(即最优控制方程)定义如下:
[0075][0076]umin
≤ui≤u
max
[0077]ymin
≤cxi≤y
max
[0078]
在上述公式中,xi代表第i个采样时刻下系统的预测资源状态,也即云上虚拟机任务的资源需求,当i=0时,x0代表系统的初始资源状态,本实施例通过离散状态方程能实时计算预测云上虚拟机任务的资源需求,即将离散状态方程作为资源预测模型来实时计算预测接下来多个时刻的云上虚拟机任务的资源需求,这样就可以得出从0时刻到t时刻的xi并输入最优控制方程;x
i,ref
是在第i个采样时刻资源状态的参考值;ui是i时刻下的控制输入;u
i,ref
是i时刻下的控制输入的参考值;x
t
是最后一个采样时刻下的系统的资源状态;x
t,ref
是最后一个采样时刻下的系统的资源状态的参考值。q
x
、qu和q
t
分别是i时刻下系统状态矩阵、系统输入矩阵和系统最终状态的矩阵。其中,x
i,ref
、u
i,ref
和x
t,ref
均可以通过预测得到。u
i,ref
是i时刻下的控制输入的参考值,也就是假定这一时刻理论上应该分配多少资源能达到最好效果,需要将实际输入(即ui)尽量去能够靠近这个参考值,x
i,ref
和x
t,ref
的理解同上。本实施例设置了x
i,ref
、u
i,ref
和x
t,ref
这三个参考值,这是因为模型预测控制器的mpc算法需要先有一个未来的参考值,再去在未来多个时刻跟踪相应的参考值。最优控制方程中的累加和就是得到未来0~t-1个时间刻度下的xi、ui与预测得到的最优值差的累加和,求和的第一项代表目前系统状态与预测最优状态的差值,第二项代表当前输入变量与预测输入变量的差值;mpc控制器最优控制的控制目标就是使得函数值最小;通过求解该方程得到的结果是得到最终的控制输入序列,该输入序列是使得系统资源状态、控制输入与预测值(理论最优值)的差距最小;通过求解ui序列就得到了未来一段时间内的资源分配策略,这段时间内的每个时刻的分配策略即为序列u中的某个对应值ui。最后一个采样时刻其实是单独列出来的一个状态,因为通过离散状态方程可以看出,系统总是在t控制输入的作用下,状态从t变为t+1,因此只要有控制输入,那么系统的状态就会改变,因此假定最后一个状态是由上一个状态的控制输入作用下得到的,最后一个采样时刻是没有控制输入的,否则它将继续转移到下一个状态,因此在最优控制问题定义中将最后一个状态单独考虑,其是没有控制输入的。
[0079]
同时,我们对输入ui进行约束,即输入的虚拟机数量不能超过上下界阈值。在输出约束中,矩阵c是将状态向量映射到输出y的输出矩阵。由于输出y取决于状态向量中的
cpu
i(t)
和res
i(t)
两个变量,因此输出矩阵设置为[1 1]。
[0080]
在上述技术方案中,依据模型预测控制器的控制目标构建最优控制方程并求解得到下一时刻的虚拟机资源分配策略,具体地,将从0时刻到t时刻的xi输入最优控制方程,再将预测得到的x
i,ref
、u
i,ref
和x
t,ref
输入最优控制方程,这样模型预测控制器通过求解最优控制方程就能得出ui序列,ui序列包括未来多个时刻的虚拟机资源分配策略,模型预测控制器仅将下一时刻的虚拟机资源分配策略输出至云平台目标系统。ui是在最优控制问题中代表某一个时刻下分配的虚拟机数量,通过求解最优控制方程得到的ui序列(即控制输入序列)就作为得到的资源分配策略,控制输入序列代表工作的虚拟机数量,在时间刻度下进行不同虚拟机的分配,移除等操作进行资源分配,也就达到最终计算、存储等资源的分配。资源分配指的就是虚拟机数量,因为虚拟机拥有计算资源和存储资源,通过控制虚拟机的数量也就可以达到资源分配的目的。虚拟机本身就会有计算/存储资源,在给任务块分配任务的时候可以依据任务的大小给予不同数量的虚拟机来进行计算从而完成城轨业务。
[0081]
本实施例基于离散状态方程和输出方程可推导得出模型预测控制器的最优控制方程,离散状态方程是mpc框架最优控制的数学模型,通过数学模型得出最后的mpc最优控制方程,离散状态方程为数学意义上的公式,mpc最优控制方程为实际工程应用中的求解方法。一般来说,mpc最优控制方程(即目标函数)的选取没有标准形式,本实施例将其最后表达式设定为一个二次型函数,推导的方法就是依据现有的问题进行优化问题建模,通过使被控输出接近参考输入来建立最优控制方程模型。
[0082]
作为优选的一种技术方案,采用long short term memory神经网络来预测得到x
i,ref
、u
i,ref
和x
t,ref
,将虚拟机的cpu利用率cpu
i(t)
和任务请求响应时间res
i(t)
分别输入到long short term memory神经网络即可进行预测。上述的x
i,ref
、u
i,ref
和x
t,ref
均为可调参数,这些参数对于控制轨迹的影响程度可以通过它们对应的权值矩阵来决定。本实施例预测得到x
i,ref
、u
i,ref
和x
t,ref
并输入最优控制方程进行求解。
[0083]
基于同一发明构思,本发明还提供一种电子设备,包括处理器和存储器,存储器上存储有计算机程序,计算机程序被处理器执行时,实现如上文所述的面向智慧城轨的云计算平台资源动态分配方法。所述的处理器和存储器均属于现有技术,在此不做具体说明。
[0084]
如图1所示,本实施例公开了一种面向智慧城轨的云计算平台资源管理系统,该系统由云平台目标系统和模型预测控制器(即mpc预测控制器)构成,并形成了反馈控制回路。
[0085]
在图1中,平均请求响应时间一部分取决于固定等待时间,另一部分取决于上一个任务执行时间乘以一个相关系数,意思就是它和上一个时刻的任务有关。对于平均任务执行时间,假如说该时刻分配1ghz的计算资源,然后就知道当前任务的总长度(或者总大小)是多少bit,然后也会知道每个虚拟机的计算密度(执行完1bit数据需要多少cpu周期)是多少,二者相乘就是执行该任务所需的cpu频率总数,用分给该虚拟机的资源总数1ghz除以执行该任务所需的cpu频率总数,就可以得到该任务的平均任务执行时间指标。
[0086]
res
i(t)
=平均请求响应时间+平均任务执行时间,其中的res
i(t)
与前述含义相同,即res
i(t)
表示各个虚拟机的请求响应时间,该状态变量反映了虚拟机的服务质量指标。
[0087]
云平台目标系统实时将云平台中所有承载城轨业务虚拟机的当前cpu利用率和任务请求响应时间这两个分别反映资源使用状况与服务质量的指标输出到mpc预测控制器。mpc资源预测控制器用于实时接收云平台输出的当前虚拟机资源状态和任务请求响应时间
指标,并根据通过历史资源数据建模得到的离散状态方程,实时计算预测接下来多个时刻的云上虚拟机任务的资源需求,再通过求解mpc最优控制方程得到未来多个时刻的虚拟机资源分配策略,并且仅将下一时刻的资源分配策略输出至云管平台,云管平台执行该资源分配策略,调整为各个任务块分配的虚拟机数量,以适应下一时刻不同任务块中任务负载的资源需求,达到资源动态分配的效果。
[0088]
在本发明中,模型预测控制器通过对复杂的城轨云环境进行建模、对云上业务在线反复优化,能提高资源预测精度,云平台目标系统能够向模型预测控制器输出当前云上全局资源状态,并考虑云平台外部轨道交通业务流量的干扰因素,提高了整个系统的鲁棒性和稳定性。
[0089]
下面以一个具体的智慧城市轨道交通云平台为例做进一步说明。
[0090]
城市轨道交通私有云平台中一般会运行多种城轨业务,对于列车运行控制系统来说,城轨企业通常会将基于通信的列车运行控制(communication based train control,cbtc)系统中的ats业务、zc业务、联锁业务等移植上云。对于城轨内部管理域来说,检售票系统、安检系统、城轨企业门户系统等与乘客相关的业务均可移植入云端。与此同时,目前正不断应用在城轨行业的诸如列车障碍物检测、系统态势感知等视频相关业务目前也存在上云的趋势,在我们的云上资源分配模型中也将这种业务考虑在内。
[0091]
对于上述一系列城轨业务来说,各个业务的应用负载在时间和空间上的变化规律不同,因此资源的需求量也是在不断变化的。资源需求在时间上的不平衡通常为高峰时段负载较高,资源需求量大,非高峰时期资源需求少;在空间上的不平衡表现为不同区段和车站相应业务的负载情况不同。同时对于不同种类的城轨业务,在一段时间内云上资源需求量的变化情况也不相同。因此,实现城轨云上资源的动态分配对于城轨企业进一步实现“降本增效”尤为重要。
[0092]
我们以云上ats业务为例,说明该资源分配方法的实现过程。ats系统负责列车运行图编制、列车调度、列车时刻表修改、自动办理列车进路等功能,是典型的资源需求变化较大的城轨业务。在高峰时刻,正线上运行的列车较多,ats任务量较大,资源需求较多。在执行列车运行图编制功能时,由于需要从数据库导入导出数据,ats业务表现为i/o密集型任务;在执行自动办理进路功能时,ats业务变现为计算密集型任务,两种情况下资源需求变化不相同。
[0093]
在云资源调度的过程中,首先ats业务向云管平台(即云上管理系统)发出资源请求,云管平台将业务拆分成多个子任务块并分配虚拟机来执行每个任务块。此时,各个虚拟机的cpu资源利用率以及虚拟机所在物理服务器cpu利用率信息会被收集,作为一个全局的资源状态。每个任务块的请求响应时间将作为一个评价任务执行质量的全局qos状态被收集。同时,云管平台受到的外界干扰流量信息也会被收集,作为外因干扰信息。三个因素将作为全局资源状态信息输入mpc资源控制器中。mpc资源控制器根据历史测算收集到的信息建模得到资源预测模型(即离散状态方程),并接收全局资源状态信息作为输入,预测下一个时刻各个虚拟机的资源需求状况。进而在该采样时刻,模型预测控制器通过求解最优控制方程得出ui序列,即得到未来多个时刻的虚拟机资源分配策略,模型预测控制器仅将下一时刻的虚拟机资源分配策略输出至云平台目标系统中的云管平台,云管平台在该时刻执行该资源分配策略,调整为各个任务块分配的虚拟机数量,虚拟机继续执行被分配到的任
务,并在下一个时刻继续输出全局资源状态信息。该过程被循环执行,资源分配策略会被模型预测控制器不断更新,直到虚拟机中的任务被执行完毕,虚拟机再次处于空闲状态(即虚拟机cpu利用率极低)时,回收该虚拟机的全部资源。
[0094]
本实施例中未涉及部分均与现有技术相同或可采用现有技术加以实现,在此不做进一步说明。
[0095]
各位技术人员须知:虽然本发明已按照上述具体实施方式做了描述,但是本发明的发明思想并不仅限于此发明,任何运用本发明思想的改装,都将纳入本专利权保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1