分布式云中基于聚类的时延带宽极小化虚拟机部署方法

文档序号:9910814阅读:375来源:国知局
分布式云中基于聚类的时延带宽极小化虚拟机部署方法
【技术领域】
[0001] 本发明涉及云计算技术领域,尤其涉及一种分布式云计算中基于聚类的时延带宽 极小化虚拟机部署方法。
【背景技术】
[0002] 当前分布式云计算已经成为了云计算的主流。分布式云计算的显著特点是云计算 基础设施网络由多个DC组成,各DC相互独立,各自对外提供服务,同时各DC又通过长途高速 专用网络或者Internet互联,形成统一整体。分布式云计算中除了传统的物理资源,比如 CPU,内存等,最重要的就是连接各DC的长途链路。据研究,带宽资源贡献了整个数据中心的 近15%的成本。更重要的是,长途链路相对较少,过多的占用长途链路,将会导致链路拥塞, 影响DC间通彳目和服务质量。
[0003] 特别的,如果需要部署一组需要相互通信的虚拟机VM(这组VM是为了完成同一个 任务而启用的),则需要VM之间的最大的通彳目时延尽可能的短,以便减少整体的任务执行时 间,防止个别过长的长途通信对任务完成造成拖延。针对分布式云计算的特点,结合VM的资 源配合和通信流量,寻找合适的VM部署方法,对于保证服务质量,减少成本具有重要意义。
[0004] 1. DC现有选择方法
[0005] (1) DC选择和VM分组同时进行,采用单个VM逐渐尝试的方法。本方法将VM随机的放 到多个DC上,然后从中任意选择一个VM,逐个尝试移动到其它DC,如果能保证DC之间的最长 通信距离不增加,DC之间的通信量不增加,则认为可行,尝试下一个。否则本VM不移动。由于 本方法的实质是穷举各种情况,因此缺点是非常缓慢,而且是一种尽力而为的方法,不知道 最后的结果是否是较好的结果。尤其当DC数目较大,VM较多时不具有可行性。
[0006] (2)Be 11实验室的研究员在2012年首次系统的对此问题进行了研究,给出了一个 DC选择的星型方法。该方法先随机以某个DC为中心,尝试用最少的DC来部署这组VM,然后计 算最长的通信时延。接着针对所有的候选DC应用这种方法,计算所有的最长的通信时延。最 后进行直接比较,通信时延最小的那个就是最后的解决方法。该方法是采用直接比较的方 式进行的,需要计算所有的情况。本质上它只考虑了两两DC之间的距离,而没有考虑DC容量 和组网拓扑信息,因此效率很低。同时,本方法采用图论方法,权重是DC支持的VM的个数,只 适合于VM同构的情况。
[0007] 2、VM分组方法
[0008] (1) -般采用k-均衡划分方法。即将本组VM分组为K份,每份的VM数量是相同的。但 由于实际应用中,VM的异构和DC容量的不同,不能直接应用。
[0009] ( 2 )著名的以色列魏兹曼科学院(We i zmann Ins t i tute of Sc i ence )的 Krauthgamerj研究员和以色列理工大学以及微软研究院的合作者提出的随机性算法,但 由于解的过分松弛,导致在某些情况下解不再可行。对于带宽的随机性和数据中心容纳虚 拟机数量不同的实际情况,目前还没有研究工作考虑。而且算法是基于线性规划的随机规 约,没有具体的求解方法,只在理论上获得较好的结果。

【发明内容】

[0010] 为了解决现有技术中的问题,本发明提出了一种分布式云计算中基于聚类的时延 带宽极小化虚拟机部署方法,实现分布式云计算中低成本,低时延,高可靠的虚拟机部署。
[0011] 本发明通过以下技术方案实现:
[0012] -种分布式云计算中基于聚类的时延带宽极小化虚拟机部署方法,所述方法包 括:
[0013] 目标数据中心选择步骤,选择出目标数据中心DC,保证DC之间的最长通信距离尽 可能的小;
[0014] 虚拟机分组步骤,根据虚拟机VM的通信量,对VM进行分组,保证DC间的通信带宽消 耗尽可能的少;
[0015] 其中,所述目标数据中心选择步骤基于密度聚类的DC直径最小选择CBMinDia算 法,所述CBMinDia算法包括(1)选择任意一个顶点,并将以它为中心的最小可行子图的半径 作为初始半径e ; (2)判断每个顶点是否是关于(e,m)的核心对象并进行标注;(3)所有的 非更优的顶点被剪枝,具有最小直径的顶点被找到;
[0016] 所述VM分组采用半通信模型,所述半通信模型用于从分组的角度来研究一个VM的 流量,所述VM的流量包括一个VM在一个分组内部的流量和分组外部的流量。
[0017] 另一方面,本发明还提供了一种具有多个数据中心(DC)的分布式云计算系统,包 括网关、调度模块、资源管理模块;其中,网关负责接收并反馈用户的需求;调度模块运行本 发明提出的VM部署方法;资源管理模块存储分布式云计算组网和拓扑信息、DC资源容量情 况。
[0018] 本发明的有益效果是:本发明提出的方法考虑到了分布式云计算中DC的容量相对 于集中式云计算较小的特点,同时可以兼顾特定的可靠性要求,比如要求每个DC只能部署 一定数量的VM,在分布式云计算中部署一组VM,进行服务质量和成本优化,其应用前景体现 在:VM可以同构(VM配置的vCPU相同)也可以异构(VM配置的vCPU不同);考虑了 DC之间的距 离,组网拓扑特性,以及DC的容量属性;在保证长途链路尽量少的占用的前提下,达到减少 VM之间的通信时延,最终减少整体任务完成的时间的目的;算法相对于已有技术,解的质量 更好,运行速度更快;对于大规模,高可靠性的分布式云计算中虚拟机部署提供了技术支 持。
【附图说明】
[0019] 图1是本发明的系统架构图;
[0020] 图2是密度聚类对象示意图;
[0021 ]图3是半通信模型示意图。
【具体实施方式】
[0022]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对 本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不 用于限定本发明。
[0023]在具有多个数据中心(DC)的分布式云计算中,需要部署为某个任务服务的,需要 相互通信的一组虚拟机(VM)。首先要进行DC的选择,然后将这组VM进行分组,并映射到各个 DC上去。目的是使得VM之间的最大的通信时延最小,同时使得昂贵的DC件的通信带宽占用 最小。这对于保证服务质量(时延)、增强可靠性(尽量减少长途链路占用)和减少成本(节约 带宽)具有重要意义。
[0024] 本发明对分布式云计算,利用DC的组网拓扑信息,以及本组VM的资源配置需求进 行VM的部署。系统架构如附图1所示,整个系统包括网关、调度模块、资源管理模块。其中,网 关负责接收并反馈用户的需求;调度模块运行本发明提出的VM部署方法,该方法分为DC选 择阶段和VM分组阶段;资源管理模块存储分布式云计算组网和拓扑,DC资源容量情况。 [0025]系统工作流程:
[0026] 1)用户提交需求到网关服务器,包含VM个数以及各个VM的资源配置需求;
[0027] 2)网关服务器将需求转发到调度模块;
[0028] 3)调度模块需要根据资源管理模块目前存储的动态分布式基础架构的信息,运行 本发明提出的方法:先选择出目标DC,保证DC之间的最长通信距离尽可能的小;然后再根据 VM的通信量,对VM进行分组,保证DC间的通信带宽消耗尽可能的少。资源管理模块在功能上 是独立的,实现中可以和调度模块耦合在一起。
[0029] 4)VM部署在各个DC上后,各个DC的资源占用情况将会上报给资源管理模块。
[0030] 在现实中,因为经济因素和环境限制,人口分布本身具有聚类的特点,也就是在某 些地方经济发达人口稠密,而另外些地方相对稀疏,有些地方甚至是人迹罕至。云计算目的 是为人类服务,所以DC也本着就近服务的特点,其分布和人口分布具有类似的聚类性质。
[0031] 除了DC的聚类属性,每个DC能容纳不同数量的VCPU。毕竟每个DC的设计容量有可 能不同,而且运营后的资源消耗也有极大不同,因此导致剩余容量不同。结合剩余容量,如 果能在较密集的DC中找到满足VM请求的集群,则更稀疏的DC就不需要再被检查,可以直接 剪枝。进一步的,就不需要计算非常耗时的直径,避免了逐一直接比较。这样,在不损害结果 质量的情况下,算法速度得到极大提升。
[0032] 1、数据中心选择问题目的是找到一个DC
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1